Pig
Apache Pig ist eine Plattform zur Analyse großer Datensätze, die aus einer Hochsprache zur Darstellung von Datenanalyseprogrammen und einer Infrastruktur zur Auswertung dieser Programme besteht. Die herausragende Eigenschaft von Pig-Programmen ist, dass ihre Struktur einer erheblichen Parallelisierung zugänglich ist, die es ihnen ermöglicht, mit sehr großen Datensätzen umzugehen.
Beschreibung: Stack Exchange (CC BY-SA 3.0)
Zeitlicher Verlauf der Relevanz (min-max normalisiert)
Regionale Verteilung (prozentuales Vorkommen in Stellenanzeigen pro Land)
Attribution - zur Zusammenstellung der Informationen wurden folgenden APIs benutzt:
Stack Exchange API, GitLab API, GitHub API, GitHub Explore, Wikimedia Commons und Wikipedia.