Linked (Open) Data - Von der Theorie zur Praxis

Lessons learned (LOD-Applikation)

  Lessons learned (LOD-Applikation)

 

 

Lessons Learned (LOD-Applikation)

In der LOD Applikation haben wir gezeigt, wie man aus der ‚Bibliotheksstatistik der Schweiz‘ Erkenntnisse gewinnen kann, die bislang nur mit sehr grossen Aufwand erhoben werden konnten. Erstmals können Kennzahlen der Bibliotheken mit Sozialdaten in Verbindung gebracht werden. Wir zeigen, dass sich dank dem Linked Data Ansatz, komplexe Zusammenhänge und wichtige Planungsdaten aufdecken lassen.

Voraussetzung dazu ist allerdings, dass die Daten in RDF zur Verfügung stehen. Die neuen RDF-Daten des Bundesamtes für Statistik (BfS) haben uns da einen grossen Dienst erwiesen. Leider stellt das BfS jedoch erst einen kleinen Teil der Daten in einem Pilot zur Verfügung. Auch die Bibliotheksstatistik, die wir in unserer Applikation nutzen wollten, gibt es noch nicht in diesem Format.

Liegen die Daten nicht in RDF vor, erweist sich das Unterfangen, die Bibliotheksstatistikdaten in Zusammenhang zu stellen, auszuwerten und zu interpretieren als wesentlich komplexer. Die Transformation der zugänglichen, aber nicht im Linked Data Format vorliegenden Daten und insbesondere die Strukturierung der Daten, hat sich als grosse Herausforderung herausgestellt. Es ist offensichtlich, dass Livia dies im Rahmen ihrer Maturarbeit nicht geschafft hätte. Noch ist die Erstellung einer LOD Applikation eine Aufgabe für Informatiker.

Im Laufe des Projekts wurde aber auch deutlich, dass die Bereitstellung von Daten als linked data allein noch nicht ausreicht, denn SPARQL-Abfragen zu erstellen ist nur möglich, wenn die Struktur der Daten bekannt ist. Doch oft erweist es sich als schwierig, die Datenstrukturen zu verstehen. Das Beispiel von DataCube hat deutlich gemacht, wie komplex die Strukturen sein können – diese im Nachhinein zu analysieren ist nicht einfach. Notwendig wären Tools, die es Interessierten vereinfachen würden, die Struktur zu analysieren. Ein solches in Entwicklung begriffenes Tool ist LODLive. Es wird sich zeigen, ob dieses schon Hilfestellung genug ist, um die Strukturen zu erfassen, so dass die Abfragen vereinfacht werden können. Erst wenn solche Instrumente vorliegen, werden Nutzerinnen wie Livia in der Lage sein, ihre Abfragen erfolgreich zu erstellen.

Schliesslich zeigte sich aber auch: Trotz der Validierung der Daten zu Beginn unseres Projekts, gilt es die Qualität der Ergebnisse einer Abfrage nochmals sorgfältig zu prüfen. Die maschinelle Verarbeitung der Daten legt allfällige Fehler in den Daten gnadenlos offen oder noch schlimmer: die Auswertung liefert aufgrund der Fehler in den Ursprungsdaten falsche Resultate. Eine intellektuelle Plausibilitätsprüfung und Interpretation der gelieferten Daten ist offensichtlich nach wie vor notwendig.