Kategorie Innovation & Technologie - 18. September 2015
Die Qualität von Daten verbessern
Das englische Wort „adequate“ kann laut dem Onlinewörterbuch dict.cc mit nicht weniger als 18 deutschen Ausdrücken übersetzt werden, von adäquat bis zweckentsprechend. Auch wenn viele mehr oder weniger dasselbe bedeuten, offenbart sich in der Wortwahl der Wille zur Vielfalt. Diesen Willen haben die Akteure von ADEQUATe („dichterische“ Abkürzung für Analytics & Data Enrichment To Improve the Quality of Open Data) mit Sicherheit: Das von der Forschungsförderungsgesellschaft FFG mit 500.000 Euro finanzierte, soeben begonnene Projekt soll Methoden zur Messung, Beobachtung und Verbesserung der Qualität in Open-Data-Portalen entwickeln.
Koordinator ist die Semantic Web Company, als Forschungspartner fungieren die Donau-Uni Krems und die WU Wien. Unterstützt werden sie durch die Betreiber des österreichischen Open Data Portals (die Cooperation Open Government Data mit Vertretern der Städte und Länder sowie das Bundeskanzleramt). Das Konsortium hat eine Kombination aus daten- und Community-getriebener Vorgehensweise entwickelt. Das Rahmenwerk soll laufend die Qualität von offenen Datenportalen erheben, zugleich (halb-)automatisiert Algorithmen zur Verbesserung anwenden und Erfahrungen aus Online-Aktionen wie Crowdsourcing integrieren.
Infos richtig aufbereiten
Um das Potenzial zu heben, müssen laut WU-Professor Axel Polleres zwei Themen vordringlich behandelt werden: Qualitätsprobleme von Daten und Metadaten sowie die fehlende Interoperabilität zwischen Datensätzen. Entscheidend sei, das Qualitätsthema bereits beim Einstellen von Daten zu berücksichtigen. Bisher wurden Qualitätsfragen in der Open-Data-Bewegung nicht als vorrangiges Thema behandelt, doch mit der steigenden Bedeutung und Verwendung offener Daten steigt der Stellenwert der Datenqualität sprunghaft an.
Weiteres Kriterium ist das Steckenpferd von Martin Kaltenböck, Managing Partner der Semantic Web Company: Semantische Systeme helfen, Information für die maschinelle Verarbeitung aufzubereiten, sinngenau zu analysieren und dadurch innovative Anwendungen und effizientere Integration zu ermöglichen. Damit werde „eine höhere Ontologie gebildet, die verwendeten Informationsschemata werden dargestellt und daraus neues Wissen generiert“. Mit der Möglichkeit, ähnliche Daten zu identifizieren, werden diese in Anwendungen und Services verwendbar. Das Framework wird zusätzlich in die Datenportale data.gv.at und opendataportal.at integriert, um die praktische Nutzbarkeit zu testen.
ADEQUATe spielte diese Woche – noch – keine dominierende Rolle, als die internationale Semantic-Web-Gemeinde bei der elften Semantics-Konferenz in Wien versammelt war. Zahlreiche Projekte zeigten vor allem, wie Unternehmen und öffentliche Organisationen semantische Systeme nutzen. (von Peter Martos, Der Standard)