Daten und Informationen finden - Semantische Webdienste - SNS

Wortwolke Biokraftstoffzum Vergrößern anklicken
Wortwolke Biokraftstoff
Quelle: XtravaganT / Fotolia.com

Der „Semantische Webdienst – SNS“ ermöglicht Internetanwendungen, die Suche nach Umweltinformationen zu vereinfachen und zu verbessern. Er enthält als fortwährend gepflegten Wissensbestandteil den Umweltthesaurus, das Verzeichnis geographischer Namen von Naturräumen u.Ä. sowie Ortsangaben des Bundesamtes für Kartographie und Geodäsie sowie die Umweltchronologie mit wichtigen Umweltereignissen.

Bausteine des SNS

Der Umweltthesaurus UMTHES enthält rund 14.000 miteinander verknüpfte fachsprachliche und alltagssprachliche Schlagwörter. Die Verknüpfung stellt eine Struktur dar, bei der zwischen den allgemeineren Oberbegriffen und den genaueren Unterbegriffen unterschieden wird (z.B. Baum <> Nadelbaum) aber auch miteinander thematisch verwandte Begriffe verbunden werden (Abfall<>Abfallrecht). Dazu kommen bisher 31.000 bedeutungsgleich gesetzte deutsche Wörter (Synonyme) und 35.000 gleichbedeutende englischen Benennungen.
Gleichbedeutende Suchwörter, auch auf Englisch, können damit zur Sucherweiterung angeboten werden, speziellere zur Präzisierung. 

Dem Begriffsnetz des UMTHES ist zudem eine Umweltklassifikation hinterlegt. Auch die Umweltklassifikation dient der inhaltlichen Kennzeichnung im interdisziplinären Themenbereich „Umwelt“. Sie ermöglicht grob die Zuordnung zu bestimmten Umweltthemen und erleichtert damit ein treffsicheres aber gleichzeitig umfassendes (Wieder ) Auffinden damit gekennzeichneter Informationsangebote. Ihr Wert liegt in der einfachen Unterscheidung von Themen wie beispielsweise Lärm, Luft, Wasser, Chemikalien. Diese Abgrenzung ist mit Suchwörtern nicht immer leicht, da viele Begriffe, z.B. „Emission“, in unterschiedlichen Themenbereichen gleichermaßen von Bedeutung sind. Näheres über den Umweltthesaurus finden Sie im WEB (Beschreibung als UDK-Thesaurus 2000).

Zur geografischen Beschreibung  bietet SNS einen Geo-Thesaurus mit über 25.000 geografischen Namen und den Lagebeziehungen zwischen allen Orten an, der auch zur Darstellung und Auswahl in Karten nutzbar gemacht werden kann. Er beruht auf dem Geografischen Namensgut des Bundesamtes für Geodäsie und Kartografie (BKG), ergänzt um Naturräume wie Naturparke, Gewässer, Berge.

Eine Umweltchronologie reichert die Umweltbegriffe des Thesaurus durch aktuelle und historische Verweise auf über 600 besondere Ereignisse an. Ein  Beispiel für eine Webseiteneinbettung ist im NUMIS – Niedersächsisches Umweltinformationssystem  als „Chronik“ zu sehen.

Technisch erfolgt das Diensteangebot nach internationalen Standards. In der älteren Version nach ISO Standard 13250 Topic Maps. Die aktuelle Version ist RDF-basiert.

Beispiele für SNS-Dienste

Die SNS-Webdienste erlauben es Anwendungen der Umweltinformatik - Umweltportale und andere Anwendungen –  semantische Unterstützung zu leisten, ohne dass diese sie selbst entwickeln oder pflegen müssen. Das ist eine wesentliche Hilfe für das zuverlässige und vollständige Aufspüren von Umweltinformation und auf der anderen Seite für die suchfreundliche Integration eigener Angebote in das WWW.

  • 'getSimilarTerms': Ermittelt „ähnliche“ Begriffe aus dem Umwelt-Thesaurus zu einem Ausgangswort. Die Ähnlichkeit bezieht sich nicht auf die Schreibweise, sondern auf die Bedeutung. So werden für die Suche nach „Biosprit“ bedeutungsähnliche Begriffe angeboten wie „Biodiesel“, „Biogene Kraftstoffe“, „BTL-Kraftstoff“.
  • Diese lassen sich für die  Hilfe bei der Suche einsetzen. Beispielanwendungen sind der „Metadaten Verbund (MetaVer)" von Bundesländern oder „NUMIS (Niedersächsisches Umweltportal)“, die die ähnlichen Begriffe zur Sucherweiterung bzw. zur Alternativsuche anbieten. Die Zusätzliche Berücksichtigung dieser Bedeutungsbeziehungen aus dem SNS ermöglicht so auch weniger fachlich vorgebildeten Informationssuchenden eine spezielle, und andererseits eine sehr umfassende Abfrage (auch vollautomatisiert, wenn das eingesetzte Suchprogramm die entsprechenden Thesaurusinformationen nutzt).
  • 'autoClassify': Dieser Dienst ermittelt mit Hilfe einer automatischen Textanalyse geeignete Schlagwörter aus der Beschreibung oder Textinhalten von Webobjekten zur Erstellung von Metainformationen für die spätere zielgenauen Wiederfindung bei der Suche.

Weitergehende Nutzung

Die Dienste des SNS lassen sich zudem zur Verknüpfung von Umweltdaten nutzen, die verteilt in unterschiedlichen Systemen liegen, aber z.B. deren fachliche Zusammenschau von Interesse ist. Die Effizienz eines solchen Verfahrens wurde im Rahmen des UFOPLAN-Vorhabens“ „Linked Environment Data - Informationsmehrwert durch verknüpfte Umweltdaten“ untersucht.