Hive
Hive ist ein Data Warehouse System für Hadoop, das eine einfache Datenzusammenfassung, Ad-hoc-Abfragen und die Analyse großer Datensätze ermöglicht, die in einem Hadoop-kompatiblen verteilten Dateisystem gespeichert sind. Hive bietet einen Mechanismus, um die Struktur auf diese Daten zu projizieren und die Daten mit einer SQL-ähnlichen Sprache namens HiveQL abzufragen.
Beschreibung: Stack Exchange (CC BY-SA 3.0)
Zeitlicher Verlauf der Relevanz (min-max normalisiert)
Regionale Verteilung (prozentuales Vorkommen in Stellenanzeigen pro Land)
Attribution - zur Zusammenstellung der Informationen wurden folgenden APIs benutzt:
Stack Exchange API, GitLab API, GitHub API, GitHub Explore, Wikimedia Commons und Wikipedia.