Anleitung WISSENsAllmende
1. Gesamtüberblick: Was erwartet Sie hier?
Die Urbane Datenplattform WISSENsAllmende Jena beruht auf einer modularen, ausbaufähigen Systemarchitektur. Dabei wird die Lösung PIVEAU von Fraunhofer FOKUS als übergreifendes Verzeichnis (Registry) eingesetzt, über das alle Datensätze aufgefunden werden können. Dabei gibt es sowohl umfassende Suchmöglichkeiten für die Nutzung durch Menschen, als auch Schnittstellen für maschinelles Suchen. Die Datenmangement-Plattform PIVEAU beschreibt alle Datensätze entsprechend des dafür im öffentlichen Bereich zu verwendenden Standard DCAT-AP.de.
Die so beschriebenen Datensätze wurden von uns in vier Bereiche (sogenannte Kataloge) eingeteilt:
- Dokumente und Open Data - Katalog OpenData Jena
- Echtzeit- und Sensordaten - Katalog Events
- Gegenstände im öffentlichen Raum - Katalog Datacubes (Datenwürfel)
- Controlling- und Statistikdaten - Katalog Daten und Modelle
In „Dokumente und Open Data“ können Dateien unmittelbar über PIVEAU heruntergeladen werden. Für die anderen drei Bereiche wurden jeweils Browseranwendungen zur Visualisierung der Daten entwickelt. Weiterhin werden die Daten über API´s zur Verfügung gestellt, so dass andere Verwendungen und Visualisierungen der Daten möglich sind.
Im Folgenden wird die Benutzung der WISSENsAllmende Jena nach der oben gezeigten Gesamtstruktur erklärt.
2. Einstieg: Finden von Datensätzen auf PIVEAU
Unter https://wissensallmende.jena.de finden Sie eine Einstiegsseite (von der aus Sie vermutlich hierher gelangt sind). Von dort können Sie direkt in einen der o.g. Kataloge springen, oder Sie schauen „alles auf einmal an“, d.h. durchsuchen alle Kataloge. In jedem Fall kommen Sie auf nebenstehende Suchseite.
Hier können Sie die Datensätze nach folgenden Merkmalen filtern:
- Format (Daten-/Dateiformat)
- Kategorie (inhaltlich)
- Lizenz (all unsere Daten stehen zur Zeit unter Data licence Germany – Zero – Version 2.0, aber es werden weitere andere hinzu kommen) sowie
- Datenbereitsteller (zur Zeit nur die Stadt Jena, aber auch hier werden weitere andere hinzukommen)
Oberhalb der Auswahlmöglichkeiten können Sie noch angeben, ob diese mit UND bzw. ODER verknüpft werden sollen.
Nun können Sie rechts über der Resultatliste diese nach Aktualität, Relevanz, sowie nach einem Klick auf „Mehr“ auch alphabetisch oder nach Erstellungsdatum sortieren.
Nun hoffen wir, Sie haben den gesuchten Datensatz gefunden, damit wir Ihnen nun den Umgang mit diesem in den folgenden vier Abschnitten erklären können.
3. Dokumente und Open Data (Katalog OpenData Jena)
In diesem Katalog sind die Datensätze enthalten, die Dateien zum Herunterladen bereitstellen. Das ist recht einfach. Klicken Sie den Datensatz an und es öffnet sich ein Fenster, ähnlich wie das nebenstehende:
Oben finden Sie allgemeine Informationen zum Datensatz. Darunter sind die sog. Distributionen, d.h. die Links zu den Dateien. In diesem Fall ist es nur einer.
Klicken Sie auf Download, wie hier sichtbar. Sie können dann über „accessURL“ (immer vorhanden) oder ggf. auch über die anderen Optionen die Datei herunterladen. Von Ihren Browsereinstellungen und dem Dateiformat (pdf, csv usw.) hängt es ab, wie Ihr Browser nun mit der Datei umgeht. Diese kann heruntergeladen und gespeichert oder direkt in einem Programm geöffnet werden.
4. Echtzeit- und Sensordaten (Katalog Events)
Hier finden Sie Daten von Zeitreihen und Sensor-Messwerten. Die in die WISSENsAllmende Jena eingebundenen Sensoren finden Sie im Datensatz „Ereignis-/ Sensordaten“, in dem drei Distributionen hinterlegt sind.
Über die OGC Sensorthings API können Sie die Daten in Anwendungen einbinden. Die URL finden Sie über Download - accessURL. Wenn Sie das im Browser anklicken, können Sie den Text der Datei lesen.
Die anderen beiden Distributionen öffnen unseren Webclient für Sensordaten. Nebenstehend das Bild mit „vorausgewählten Daten“ (Klick auf Download, dann accessURL).
Die Lage der Sensoren wird auf der Karte dargestellt. Hier sind mehrere Messgrößen ausgewählt, die von jedem Sensor übermittelt werden. Diese sehen Sie durch Klicken auf den jeweiligen Sensor; das sieht dann so aus:
Im linken Bereich können Sie Messwerte zu- oder abschalten. Ebenso funktioniert die andere Distribution, nur eben ohne vorausgewählte Messgrößen (so dass die Sensoren auch erst erscheinen, wenn links eine Auswahl getroffen wird).
5. Gegenstände im öffentlichen Raum (Katalog Daten und Modelle)
Hier finden Sie derzeit Daten zu den Bäumen im öffentlichen Raum sowie zu den Verkehrssensoren. Diese Daten können über unterschiedliche Schnittstellen (REST, GraphQL) und Serialisierungsformen (Json, XML, ODS oder PDF) abgerufen werden. Dabei ist zu beachten, dass die Repräsentationsformen (Modelle) der Bäume bzw. Sensoren variieren können.
Hier als Beispiel die Darstellung in der Schnittstelle REST-application/json, Modell CityTree:
6. Controlling- und Statistikdaten (Katalog Datenwürfel)
In diesem Katalog finden Sie Daten, die in Datenwürfeln (Data Cubes, OLAP-Cubes) organisiert sind. Ein solcher Würfel stellt die Daten abhängig von Dimensionen wie Zeit, Stadtgebiet, Alter der Personen etc. dar.
Eine kurze Erklärung der Zusammenhänge findet sich in der Wikipedia: https://de.wikipedia.org/wiki/OLAP-Würfel.
Nun zu dem, was Sie bei uns sehen. Einen ersten Datenwürfel haben wir mit den Einwohnerzahlen (als Daten) der Jahre 2008-2022 (Dimension Zeit), aufgegliedert nach Alter, Geschlecht und Stadtgebieten – sog. Statistischen Bezirken – als weiteren Dimensionen erstellt.
6.1. XMLA-Schnittstelle
Dazu schauen wir als erstes den Datensatz „Datenwürfel allgemein“ an. Hier finden Sie unter der Distribution „Zugriff über XMLA-Schnittstelle“, Download, accessURL die URL https://datacube.nomad-dmz.jena.de/cube/xmla. Damit bekommen Sie (auch per Internet) Zugriff auf die Daten. Und Sie müssen dazu kein neues Programm schreiben, sondern können Excel nutzen.
Mit Excel können Sie sich wie folgt mit einer XMLA-Datenquelle verbinden:
- Sie wählen den Menüpunkt „Daten“, dort „Aus anderen Quellen“ und dort wiederum „Aus Analysis Service“.
- Es öffnet sich der Datenverbindungs-Assistent. Zunächst bei „Servername“ die oben gezeigte accessURL eingeben (https://datacube.nomad-dmz.jena.de/cube/xmla), dann „Weiter“ auswählen.
- Nun können Sie den gewünschten Datenwürfel auswählen, dann klicken Sie „Weiter“.
- Danach können Sie die erstellte Datenverbindung fertig stellen.
- Danach öffnet sich ein Dialog zum Datenimport. Vergleichbar mit den bekannten Pivottabellen innerhalb von Excel ist die Option PivotTable-Bericht. Diese wird hier ausgewählt und mit „OK“ bestätigt.
- Es wird eine Pivottabelle in Excel erstellt, in der man flexibel Auswertungen erstellen kann.
- Wenn man beispielsweise mit der Maus das Feld „Jahr“ in SPALTEN, „Geschlecht“ in ZEILEN und „Einwohnerzahl“ in WERTE zieht, erhält man eine entsprechende Auswertung. Probieren Sie es gerne mit anderen Kombinationen aus.
6.2. Webclient für Datenwürfel
Es wird der im Auftrag der Stadt Jena als Open Source entwickelte Webclient DAANSE – Data Analysis Services – eingesetzt. DAANSE ist ein Abspaltung (Fork) von Pentaho Mondrian. Um diesen Client zu erreichen, nutzen wir hier den Datensatz „Datenwürfel Bevölkerungsdaten“.
Der Einfachheit halber wählen wir zunächst die Distribution „Webclient – Bevölkerungsstatistik (Vorauswahl Alter)“. Über „Download“ klicken wir auf accessURL, und der Webclient öffnet sich.
Die angezeigte Vorauswahl „Jenaer Statistik – Bevölkerung“ bestätigen wir mit OK, und es öffnet sich bereits die erste Datenauswertung.
Dabei wurden hier in der linken Spalte noch bestimmte Items aufgeklappt, um sie besser erklären zu können. Oben ist der Punkt „Measures“ (Messgrößen), er enthält zunächst den Datenkatalog Bevölkerung und darunter die Einwohnerzahl als tatsächliche Datenwerte. Dieses Item kann man mit der Maus zu „DATA“ ziehen (ebenso natürlich weitere Einträge auf dieser Ebene, wenn sie vorhanden sind).
Nach dem momentan unbenutzten Punkt „Sets“ folgen nun die Dimensionen des Datenwürfels. Zur Veranschaulichung ist hier die Dimension Alter aufgeklappt. Sie finden hier die sogenannten Hierarchien: neben der Betrachtung der Einzeljahrgänge des Alters (was natürlich keine „wirkliche“ Hierarchie ist) sowie verschiedene Zusammenfassungen in Altersgruppen. Diese Zusammenfassungen verkörpern die Hierarchien. Sie können die Items anfassen und mit der Maus in Columns (Spalten) oder Rows (Zeilen) ziehen, dann werden die Auswertungen entsprechend gegliedert. Sie können die Items auch in „Filters“ ziehen, dort anklicken und dann in einer separaten Auswahl ein oder mehrere Einträge auswählen. Gleiches können Sie auch durch das Anklicken des kleinen Filtersymbols bei dem Item unter Columns bzw. Rows erreichen.
Beim Aufrufen bzw. Ändern der Columns, Rows oder Data aktualisiert sich die rechte Seite. Dort werden die Ergebnisse standardmäßig in einer Tabelle und einer Balkengrafik dargestellt. Beide sind gekoppelt und übernehmen wechselseitig Änderungen. Daher betrachten wir hier vorrangig die Tabelle.
In der Tabelle werden Dimensionen, in denen man nicht addieren kann, mit den Einzelpositionen auf der obersten Ebene dargestellt. Hier sind das die Jahre als Spaltenüberschriften (die Einwohnerzahlen zweier Jahre zu addieren, hat keinen Sinn).
Bei Dimensionen, in denen addiert werden kann, wird zunächst die Gesamtsumme dargestellt. Man kann diese durch Klicken auf das den Pfeil vor "All Alter.Altersgruppen“ ganz links in der Zeile aufklappen. Im Bild wurde dies für die Altersgruppen und innerhalb dieser nochmals für die Einzeljahrgänge der Altersgruppe 0 bis unter 3 Jahre durchgeführt.
Die Grafik unten passt sich wie gesagt der Tabelle an. Gezeigt wird hier noch eine Grafik, bei der die Jahre in die Zeilen und die Altersgruppen in die Spalten genommen wurden. Probieren Sie selbst noch ein bisschen damit herum!
Nun sollen noch die Einstellungsmöglichkeiten beschrieben werden, die sich oberhalb der Tabelle befinden. Zunächst zu den beiden direkt rechts oberhalb der Tabelle:
Mit einem Klick auf das Standardsymbol „Downloadpfeil“ lösen Sie den Download der aktuell dargestellten Tabelle als csv-Datei aus. Wiederum hängt es von Ihren Browsereinstellungen ab, ob diese nur als Datei auf Ihrem PC abgelegt oder in einem Programm geöffnet wird.
Rechts daneben befindet sich das „Zahnrad“-Standardsymbol für Einstellungen. Hier können Sie Formatierungen beeinflussen (im Moment die rechts-/linksbündige oder zentrierte Anordnung der Zahlen in den Tabellenfeldern).
Weiterhin befinden sich rechts oben in der blauen Kopfleiste diverse Symbole. Wir beginnen ganz rechts. Zunächst finden sich dort zwei Symbole, ein Kartensymbol und ein Diagrammsymbol. Damit kann man zwischen einer noch nicht fertiggestellten Kartenansicht und der standardmäßigen Diagrammansicht im unteren Teil umschalten. Dann gibt es links davon drei weitere Symbole. Hier können Sie auswählen, ob nur die Tabelle (ganz links), Tabelle und Diagramm (Mitte, Standard beim Öffnen) oder schließlich nur das Diagramm dargestellt werden sollen.