Linked Environment Data

Zusammenbringen was zusammengehört - Linked Environment Data - „LED“

Auf Grundlage des Forschungs- und Entwicklungsprojektes „Linked Environment Data - Informationsmehrwert durch verknüpfte Umweltdaten″ wird im Umweltbundesamt ein Pilotvorhaben zur Vernetzung von öffentlichen, allgemein zugänglichen („offenen″) Umweltdaten nach technischen Mustern des W3C durchgeführt („Linking Open Data″).

Offenheit hat dabei drei Bedeutungen:

  1. Diese Daten sind uneingeschränkt frei verfügbar,
  2. Der Zugang basiert auf offenen Standards - kommerzielle Werkzeuge sind nicht erforderlich,
  3. Die Daten dürfen weltweit mit Daten anderer Organisationen vernetzt werden.

Die Vernetzung erfolgt inhaltlich „punktgenau″ durch direkte Verweise zwischen zwei Datensätzen in verschiedenen Beständen (Datenbanken, etc.). Die Verweise sind Hyperlinks, ihnen kann daher auch im Web-Browser sofort gefolgt werden. Damit entsteht ein hochwertiger Baustein der „globalen Datenbank″ des Semantic Web.

Ein erster Schwerpunkt unseres Projektes liegt in der Vernetzung zwischen Beobachtungsdaten und einem gemeinsamen Wortgut. Beobachtungsdaten sind Messwerte und Analysedaten sowie beschreibende Information zu den Beobachtungs- und Forschungsprogrammen, zum Beispiel:

Das Wortgut (Umweltthesaurus UMTHES) wird über den Semantischen Netz Service (SNS) angeboten. Diese Terminologie für den Umweltschutz umfasst über 50.000 untereinander vernetzte Begriffe (Deskriptoren und gleichbedeutende Benennungen), deren hierarchische Stellung zueinander, englischsprachige Äquivalente/Übersetzungen und Weiteres.

Anwendungen der Umweltinformatik können dessen SNS Dienste über Web Services automatisch nutzen.

Wie schon im derzeitigen Semantischen WEB-Dienst (SNS) auf Topic Maps-Basis werden mit dem kommenden SNS unter RDF-Standard verschiedene Dienste angeboten. Der neue, RDF-basierte Semantische Webdienst soll dafür folgende semantische Bestände einbeziehen:

  • der schon erwähnte themenübergreifende Umwelt-Thesaurus UMTHES (Link zur BETA-Version, in Gestaltung und Inhalt dezeit nicht aktuell)
  • das geografische Namensgut: geografische Namen und Lagebeziehungen zwischen allen Orten
  • die Umweltchronologie für den Zeitbezug, aktuelle und historische Ereignisse, die unsere Umweltsituation wesentlich beinflusst haben
  • der GS-Soil Thesaurus aus dem eContentplus Projekt der Europäischen Kommission „GS Soil″: „Beurteilung und strategische Entwicklung von INSPIRE konformen Geodaten-Diensten für europäische Bodendaten / Geodata Services for European Soil Data″,
  • ein neuer Stoffthesaurus auf Basis des „GSBL″ - Gemeinsamer Stoffdatenpool des Bundes und der Länder
  • eine Spezies-Taxonomie „EUNIS″ - species of interest for biodiversity and nature protection (zunächst extern bei der EEA, nicht in SNS).

Wo immer in den so vernetzten Daten die speziellen Substanzen, Spezies, Orte usw. genannt werden, wird auf den entsprechenden Begriff im gemeinsamen Wortgut verwiesen. Durch Rückverweise funktioniert das Wortgut umgekehrt als übergreifender Index: Wenn sie möchten, lesen Sie nach einem Klick, was genau gemeint ist (Substanz, Spezies, Ort, usw.) und welche anderen Beobachtungsdaten zu diesem Begriff vorliegen.

Diese Aussagen sind sofort abrufbar und können mit weiteren Kriterien gefiltert werden. All diese Daten lassen sich sowohl im Browser recherchieren und und darstellen, aber auch über maschinenlesbare Schnittstellen in anderen Informationssystemen weiter verarbeiten.