Im Forschungsvorhaben „LabelledGreenData4All“ ist es uns wichtig, den Zugang zu aktuellen und relevanten Diskursen zum Thema zu eröffnen, den Austausch verschiedener Akteure aus Wissenschaft, Wirtschaft, Politik, Verwaltung und Zivilgesellschaft zu ermöglichen sowie das Community Building zu fördern. Hier finden Sie fortlaufend alle Informationen zu den begleitenden Veranstaltungen des Vorhabens.
Umsetzung skalierbarer Annotationsstrategien anhand von Fallbeispielen
Annotierte Daten sind der Schlüssel für eine gute Modellbildung und dienen als treibende Kraft für die Weiterentwicklung KI-gesteuerter Umweltforschung. Jedoch ist die Verfügbarkeit qualitativ hochwertiger, harmonisierter annotierter Daten stark eingeschränkt.
In einem dreiteiligen Hackathon im Zeitraum vom 30.01.2025 bis 05.02.2025 beleuchteten wir die spezifischen Herausforderungen, vor denen KI-Entwickler*innen stehen, insbesondere, wenn nur wenige gelabelte Daten für das Training von Machine-Learning-Modellen zur Verfügung stehen.
Community Building Event am 04.02.2025
Annotierte Daten im Umweltbereich – Ergebnisse aus dem Forschungsvorhaben LabelledGreenData4All
Welche Anwendungsbereiche und Daten bieten das größte Potenzial für den Einsatz von KI in der Umweltforschung? Wie können annotierte Umweltdaten besser geteilt werden? Wie lassen sich Machine Learning-Modelle im Umweltsektor mit wenigen gelabelten Daten erfolgreich entwickeln? Diese Fragen standen im Mittelpunkt des Forschungsvorhabens LabelledGreenData4All.
Am 4. Februar 2025 präsentierten und diskutierten wir im Rahmen einer Abschlussveranstaltung die Ergebnisse dieses spannenden Projekts.
Teil 1: Annotierte Daten im Umweltsektor: Welche politischen Handlungsempfehlungen ergeben sich aus Bedarf, Potential und Wirkung?
Anwendungsbereiche von Machine Learning (ML) im Umweltsektor
Nach einer Projekteinführung durch Cathleen Mitzschke (Umweltbundesamt) beleuchtete Franziska Hochenegger (wetransform GmbH) sektorübergreifend und beispielhaft die Einsatzmöglichkeiten von ML in den Bereichen Biodiversität, Landwirtschaft und Forstwirtschaft:
Biodiversität: Automatisierte Artenerkennung und das Monitoring von Lebensräumen und bedrohten Arten eröffnen neue Wege für zielgerichtete Schutzmaßnahmen.
Landwirtschaft: Präzisionslandwirtschaft unterstützt die gezielte Ressourcensteuerung und erhöht die Resilienz landwirtschaftlicher Systeme gegenüber dem Klimawandel.
Forstwirtschaft: ML-Anwendungen umfassen Frühwarnsysteme zur Waldüberwachung und ermöglichen eine rechtzeitige Erkennung von Gefahren wie Waldbränden oder Schädlingsbefall.
ML im Umweltsektor entfaltet sein Potenzial auf mehreren Ebenen: Für die wissenschaftliche Politikberatung, -entwicklung und -gestaltung bieten datenbasierte Verfahren eine wichtige Grundlage zur Entwicklung von Handlungsempfehlungen. In den Bereichen Wissenschaft und Technologie erlaubt der Einsatz von ML ein tieferes Verständnis komplexer Umweltsysteme und verbessert die Entwicklung und Anwendung von Vorhersagemodellen für die Umweltbeobachtung und Risikobewertung. Auch ökonomische Effizienzgewinne lassen sich nachweisen: In der Land- und Forstwirtschaft unterstützen ML-Verfahren die präzise Steuerung von Ressourcen, optimieren Betriebsabläufe und ermöglichen vorausschauende Maßnahmen – mit positiven Effekten auf Betriebskosten und Biodiversität. Nicht zuletzt leistet ML auch in sozial-ökologischer Hinsicht einen wichtigen Beitrag zur Umsetzung der Sustainable Development Goals (SDGs), indem es beispielsweise komplexere Datenanalysen und die strategische Planung von Maßnahmen im Bereich des Umweltschutzes und der Nachhaltigkeit fördert. So kann ML unter anderem das Wassermanagement und das Monitoring gefährdeter Arten unterstützen. Gleichzeitig ist es notwenig, Zielkonflikte beim Einsatz von ML – etwa zwischen Ressourcenverbrauch und der Erfüllung von Umweltzielen – systematisch zu adressieren.
Engpässe und sektorale Herausforderungen
Trotz des hohen Potentials annotierter Daten existieren nicht nur fachliche, sondern auch infrastrukturelle, rechtliche und technische Herausforderungen, die den Zugang zu und die sektorübergreifende Nutzung von Umweltdaten sowie Nachnutzung von Annotationen für ML beeinflussen.
In der sektoralen Analyse zeigt sich beispielhaft folgendes Bild:
Landwirtschaft: hohe Diversität an Anwendungsfällen (einschließlich Daten und Methodik)
Forstwirtschaft: fehlende Datenstandards, niedrige Bereitschaft zum Teilen von Daten
Biodiversität: heterogene Daten, hohe Anforderungen an Interoperabilität und Datenintegration
Vor allem in sensiblen Bereichen wie der Forstwirtschaft und der Biodiversität fehlen oft standardisierte, qualitätsgesicherte und leicht zugängliche Daten, welche nach den FAIR-Prinzipien Prinzipien (findable / auffindbar, accessible / zugänglich, interoperable / interoperabe, reusable / wiederverwendbar) bereitgestellt werden. Insbesondere ein Mangel an Metadatenstandards und offenen Formaten erschwert derzeit oftmals die effektive Nutzung von annotierten Umweltdaten.
Handlungsempfehlungen für ein robustes, nachhaltiges Datenökosystem
Die aus der Analyse abgeleiteten Handlungsempfehlungen für den Einsatz und das Management von annotierten Daten im Umweltbereich umfassen mehrere Ansätze zur Verbesserung von Datenkompetenz, Datenzugänglichkeit und -sicherheit:
Datenkompetenz stärken und verbindliche Datenmanagement-Richtlinien einführen
Datenräume und vertrauenswürdige Datentreuhändermodelle aufbauen (insbesondere für den Umgang mit sensiblen Bereichen und Daten)
Standardisierung als Grundlage für das Datenteilen und zur Förderung von Interoperabilität unterstützen
Rechtliche Rahmenbedingungen für risikobasierte Bewertungen beim Datenaustausch schaffen
Verpflichtung zum Teilen öffentlich finanzierter Forschungsdaten vorsehen
Anreizstrukturen zur Datenbereitstellung entwickeln
Teil 2: ML-Anwendungen mit wenigen Daten – ein skalierbares Vorgehensmodell
Kevin Kocon (Fraunhofer IGD) präsentierte das im Forschungsprojekt entwickelte Vorgehensmodell für den Einsatz von ML, wenn nur wenige annotierte Daten zur Verfügung stehen – ein häufiges Problem im Umweltbereich.
Das Modell berücksichtigt:
daten- und modellzentrierte Ansätze zur Annotation
Kriterien wie Automatisierbarkeit, Skalierbarkeit und Ressourceneffizienz
Validierung an zwei Anwendungsfällen und unter Einbeziehung eines Referenzdatensatzes mit prototypischer Umsetzung
Das Herzstück des Modells ist ein Entscheidungsbaum, der Entwickler*innen als praktische Orientierungshilfe gezielt hilft, je nach Datenlage passende Annotationsmethoden auszuwählen.
Das Modell wurde an zwei konkreten Beispielen aus der Fernerkundung, welche Luft- und Satellitenbilder sowie Punktwolkendaten nutzen, getestet. Dabei wurden die beiden nachfolgenden, komplementären Ansätze evaluiert:
Pseudo-Labeling: kann auch mit wenigen Daten qualitativ hochwertige Ergebnisse erzielen, birgt aber ein Risiko systematischer Fehlinterpretationen
Transfer Learning: spart Ressourcen und verkürzt die Trainingszeit
Anhand der Ergebnisauswertung für die beiden Anwendungsfälle zeigte Kevin Kocon, dass eine Kombination aus daten- und modellzentrierten Ansätzen eine effektive Strategie zur Bewältigung der Herausforderungen bei der Arbeit mit wenigen annotierten Daten darstellen kann.
Das Vorgehensmodell legt den Fokus zunächst auf die Verfügbarkeit annotierter Umweltdaten. Ein weiteres wichtiges, derzeit noch nicht berücksichtigtes, Entscheidungskriterium für die Auswahl von Annotationsmethoden ist darüber hinaus die Qualität der Annotationen. In der Fachcommunity existieren bereits verschiedene Ansätze und Initiativen, um eine Grundlage zur Bewertung der Labelqualität zu schaffen. Diese sollten konsequent weiterverfolgt werden. Zudem gilt es, Wirtschaftlichkeits- und Nachhaltigkeitskriterien künftig stärker in die Weiterentwicklung des Entscheidungsbaums zu integrieren. Langfristiges Ziel ist es, ein tragfähiges Vorgehensmodell zu etablieren, das sich auch auf andere Domänen und Datentypen übertragen lässt.
Sektorspezifische Workshops zu Potentialen und Wirkung annotierter Daten
Im Rahmen des Forschungsvorhabens „LabelledGreenData4All“ untersuchen wir, in welchen Anwendungsbereichen und mit welchen Daten die größten Potenziale für den Einsatz von Künstlicher Intelligenz (KI) im Umweltbereich bestehen und wie das Teilen von annotierten Umweltdaten aus der Ressortforschung des Bundes unterstützt werden kann. Aber in welchen Sektoren entfalten annotierte Daten die größte Wirkung? Welche Chancen und Risiken sowie aktuellen Hemmnisse gibt es in Bezug auf die Bereitstellung und Nutzung annotierter Datensets? Diese und weitere Fragen diskutierten wir in drei sektorspezifischen Workshops mit Fokus auf die Bereiche Landwirtschaft, Forstwirtschaft und Biodiversität.
Annotationen als limitierender Faktor in der Landwirtschaft
Unser Auftaktworkshop am 27.09.2024 befasste sich mit dem Potential annotierter Daten in der digitalen Landwirtschaft. Florian Männer vom Fraunhofer IGD in Rostock stellte dazu den Facettenreichtum an möglichen Anwendungen im Bereich Smart Farming vor - angefangen von der Erstellung von Bodenfeuchtekarten aus Satellitendaten, über die Identifikation von ökologischen Vorrangflächen, der KI-basierten Analyse von Drohnenbildern zur Biodiversitätsbestimmung, das Erkennen von Pilzerkrankungen und Insektenbefall an Erdbeerpflanzen im Folientunnel bis hin zu Analysen in den Bereichen Tierhaltung, Tierwohl und Tiergesundheit (zum Beispiel Lahmheitserkennung von Kühen, Schmerzerkennung bei Mäusen).
In der anschließenden Diskussion ging es vor allem um die Wiederverwendbarkeit annotierter Daten und um Strategien für das effektive Arbeiten mit wenigen Trainingsdaten. Vor allem die Nachnutzung annotierter Daten gestaltet sich oft sehr schwierig, da die Anwendungsfälle meist heterogen und spezifisch sind und es nur wenige Überschneidungen in Bezug auf Daten und / oder die Methodik gibt. Eine Ausnahme bildet der Pflanzenbau, in welchem häufig zweidimensionale Bilder verwendet werden und ein vergleichsweise homogenes Bild an Daten besteht. Im Gegensatz dazu sind die Ansätze in den Bereichen Tierwohl und Tiergesundheit sehr individuell.
Das größte Potential in der Landwirtschaft sieht Florian Männer in der Ökologie und Artenerkennung. Er räumt jedoch ein, dass dieses nur dann ausgeschöpft werden kann, wenn die entsprechenden Daten zur Verfügung stehen. In diesem Zusammenhang weist er darauf hin, dass es derzeit nur wenige Drohnendaten für die Artenerkennung gibt. Sein Team setzt daher auf die Generierung synthetischer Daten, um künstlich eine Vielfalt zu erzeugen, die in der Natur so nicht vorkommt. Florian Männer betonte auch, dass die zeitliche Mehrfachdatenerfassung für die Bereitstellung von Trainingsdaten in der Landwirtschaft ebenfalls sehr wertvoll ist.
Im Workshop haben wir gemeinsam festgestellt, dass nicht die Erfassung der Daten die größte Herausforderung darstellt, sondern vielmehr der zeitliche Aufwand und die intensive Arbeit, die für eine qualitativ hochwertige Annotation der Daten erforderlich sind.
Ergebnisse
Intelligente Landwirtschaft profitiert enorm von Big Data und maschinellem Lernen (ML).
ML hat zu erheblichen Fortschritten bei Effizienz, Nachhaltigkeit und Produktivität geführt.
Die Landwirtschaft gehört zu den Vorreitern im Bereich des Einsatzes von KI und ist dabei den meisten anderen Sektoren voraus.
Ökologie und Artenerkennung haben großes Potential, wobei die Wiederverwendbarkeit von annotierten Daten ein zentraler Aspekt ist.
Hohe manuelle Aufwände in der Datenannotation (Annotation durch Expertinnen*Experten).
Mangelnde Standardisierung und Einschränkungen aufgrund von Datenaggregation limitieren die Verfügbarkeit und Nutzbarkeit von Daten, so dass das Potential nicht voll ausgeschöpft werden kann.
„Es gibt keine Kultur des Standardisierens und des Datenteilens in der Forstwirtschaft“
Im zweiten Workshop am 30.09.2024 lag unser Fokus auf dem Potential annotierter Daten für die Digitalisierung der Forstwirtschaft. In seinem Impulsvortrag zeigte Richard Georgi von der OGF GmbH die derzeitigen Grenzen der Standardisierung von Metadaten und Trainingsdaten auf und bekräftigte, dass auch in der Forstwirtschaft die Verfügbarkeit der Daten ein großes Problem darstellt. Er betonte das Potential, das in der Standardisierung und der gemeinsamen Nutzung von Trainingsdaten für die Forstwirtschaft liegt. Dabei wies er darauf hin, wie wichtig es ist, durch die Bündelung der Kräfte und die Etablierung gemeinsamer Standards für Daten und Metadaten ein vernetztes Ökosystem zu schaffen, das es ermöglicht, das volle Potenzial von KI in der Forstwirtschaft auszuschöpfen und nachhaltige Lösungen zu entwickeln.
In der anschließenden Diskussion standen die Themen Standardisierung, Datenverfügbarkeit und Transparenz im Mittelpunkt. Richard Georgi hob hervor, dass ein erhebliches Defizit zwischen den Möglichkeiten und der tatsächlichen Umsetzung in der Praxis besteht - und das vor allem aufgrund der mangelnden Verfügbarkeit von standardisierten und qualitätsgeprüften Daten. So werden Forstinventurdaten und Forschungsdaten in diesem Bereich aktuell nur eingeschränkt geteilt, was das effektive Training von Algorithmen für ML stark einschränkt.
Der Workshop endete mit der klaren Erkenntnis, dass die Einführung eines gemeinsamen Standards für die Datenbereitstellung im Forstsektor unerlässlich ist, um das volle Digitalisierungspotenzial auszuschöpfen. Datenräume bieten hier eine vielversprechende Möglichkeit.
Ergebnisse
Es besteht eine große Diskrepanz zwischen dem, was technisch möglich ist und dem, was tatsächlich in der Praxis umgesetzt wird, so dass das Potenzial nicht ausgeschöpft wird.
Datenschutz als zentraler Aspekt für das Datenteilen.
Transparenz fördert Effizienz.
Derzeit gibt es keinen gemeinsamen Standard für die Aufbereitung von forstlichen Daten.
„KI ist nur so schlau wie die*der Expertin*Experte dahinter“
Der letzte Workshop am 02.10.2024 befasste sich mit dem Thema Biodiversität. Florian Männer vom Fraunhofer IGD stellte in seinem Impulsvortrag aktuelle Technologien und Anwendungen zur Biodiversitätsbestimmung im Grünland, in Mooren und Agrarlandschaften vor. Auf Basis von Luftbilddaten trainiert sein Team Machine Learning-Algorithmen zur Erkennung von Pflanzenarten, Pflanzenbiodiversität und Biotopvielfalt. Dies erfolgt mit annotierten Daten aus eigens dafür erhobenen Datensätzen mittels Drohnen oder Flugzeugbefliegungen, aber auch mit Bilddaten, die bereits annotiert sind oder nachträglich annotiert werden.
Ähnlich wie in der Forstwirtschaft erweist sich die Datenverfügbarkeit auch in der Landwirtschaft als sehr schwierig, da diese Daten direkt von den Landwirtinnen*Landwirten erhoben und bereitgestellt werden. Neben annotierten Daten wurden auch Kontextdaten, wie zum Beispiel Bewirtschaftungsdaten, als wichtige Parameter angesprochen. Bestehende Plattformen wie Flora Incognita sowie Crowdsourcing wurden als mögliche Optionen diskutiert, um zusätzliche Daten in die Analysen einfließen zu lassen.
Aktuell setzt das Fraunhofer IGD auf manuelle Annotationen durch Personen mit botanischem Fachwissen, wie Botaniker*innen oder Ökologinnen*Ökologen. Gleichwohl ist es durch den „Human-in-the-loop“-Ansatz perspektivisch möglich, den manuellen Annotationsaufwand sukzessive zu reduzieren und Algorithmen langfristig effektiver zu trainieren.
Ergebnisse
ML-Methoden haben vielfältige Anwendungsmöglichkeiten in der Biodiversitätsforschung
Crowdsourcing als Möglichkeit, die Datenverfügbarkeit zu verbessern
Expertinnen und Experten sind für das Training von KI unverzichtbar
„Human-in-the-Loop“ als zentraler Ansatz für die kollaborative und optimierte Datenannotation
Die Erkenntnisse aus unserer Workshop-Reihe werden als Grundlage für die weiteren Potential- und Wirkungsanalysen innerhalb von LabelledGreenData4All genutzt. Ziel ist die Entwicklung strategischer und politischer Handlungsempfehlungen, in welchen Anwendungsbereichen und mit welchen Daten die größten Potentiale für den Einsatz von ML-Modellen im Umweltsektor bestehen.
Community Event am 02.09.2024
Herausforderungen für den souveränen Umgang mit Daten im Umweltbereich und das Potential von Geodatenräumen
Ein zentraler Aspekt des Forschungsvorhabens „LabelledGreenData4All“ ist es, die Verfügbarkeit von annotierten Umweltdaten und umweltrelevanten Daten zu verbessern und diese in grünen Datenräumen sektorübergreifend zu teilen. Doch wer profitiert von einem souveränen Zugang zu Umweltdaten? Welche Interessen und Anforderungen sollten berücksichtigt werden? Welchen Mehrwert bieten Datenräume für die verschiedenen Sektoren im Umweltbereich?
All diese Fragen haben wir in unserem Community Building Event am 2. September 2024 diskutiert.
„Alles steht und fällt mit den Trainingsdaten“
Einer kurzen Projektvorstellung durch Thorsten Reitz (wetransform GmbH) folgte ein Impulsvortrag zur Innovationskraft annotierter Daten. Anhand von Beispielen zeigte Kevin Kocon vom Fraunhofer IGD, warum annotierte Daten eine so hohe Innovationskraft haben und wie Künstliche Intelligenz helfen kann, Zeit und Kosten zu sparen. Dabei räumte er ein, dass dieses Potential von den Trainingsdaten abhängt. Anhand eines Beispiels aus der wissenschaftlichen Praxis zeigte er anschaulich, vor welchen Herausforderungen Forschende im Umgang mit Trainingsdaten stehen. Zudem erläuterte er, welche Ansätze es gibt, um mit wenigen Trainingsdaten zu arbeiten. Kevin Kocon schloss seinen Vortrag mit einem Appell an die Community und fasste die wichtigsten Anforderungen an Trainingsdaten in Form der folgenden „Wunschliste“ zusammen:
Das Wissen, wo Trainingsdaten zu finden sind…
…und wie darauf zugegriffen werden kann.
Metadaten / Beschreibungen, die es ermöglichen, möglichst rasch den „Fitness for Use“ für eine bestimmte Trainingsaufgabe zu bestimmen.
Das Wissen, unter welchen Nutzungsbedingungen die Daten für ein Training verwendet werden dürfen…
…und welche Konsequenzen das für die Verwertung des resultierenden Modells hat.
Anschließend stellte Thorsten Reitz das Datenraumkonzept als wichtige Lösungsstrategie zur Verbesserung der Zugänglichkeit sowie der Interoperabilität von Umweltdaten vor. Kritisch sieht Reitz, dass derzeit direkt wiederverwendbare Umweltdaten für Maschinelles Lernen in vielen Bereichen eher die Ausnahme sind. Zudem sind annotierte Daten häufig schwer auffindbar und hinsichtlich ihrer Qualität bewertbar. Hinzu kommt, dass es insbesondere im wissenschaftlichen Bereich keine einheitlichen Standards für das Datenmanagement gibt. Obwohl viele Daten erhoben würden, seien für deren Nachnutzung nur wenige Prozesse etabliert, so Reitz. Darin sieht er die Hauptursachen dafür, dass Daten nicht geteilt werden oder nicht auffindbar sind.
Um dem dysfunktionalen Datenmarkt in Europa entgegenzuwirken, wurde die Europäische Datenstrategie entwickelt. Reitz sieht Datenräume als einen zentralen Baustein im Rahmen der Umsetzung der Strategie. Diese ermöglichen die volle Kontrolle über die geteilten Daten und schließen damit die Lücke zwischen Open Data und Closed Data. Datenräume bieten viele Möglichkeiten, die durch Aktivitäten auf EU-Ebene (z.B. GREAT-Projekt, SAGE-Projekt) realisiert werden können. Auf europäischer Ebene gibt es viele Initiativen zur Schaffung eines funktionierenden Marktes sowie Bestrebungen, die Interoperabilität über Datenräume hinweg zu gewährleisten. Neben den zahlreichen Chancen sind jedoch auch viele Herausforderungen zu bewältigen, auf die Reitz hinweist. Seiner Meinung nach liegt die Hauptherausforderung nicht in der Technologie, sondern vielmehr in der Governance, dem „sich einigen“ aller Beteiligten.
Reitz schließt mit einem optimistischen Blick in die Zukunft ab, da die Dynamik in diesem Bereich in den letzten Jahren enorm zugenommen hat. Nach seiner Auffassung hat diese im Vergleich zu INSPIRE eine ganz andere Dimension erreicht und er geht davon aus, dass es in den nächsten ein bis zwei Jahren zu bedeutenden Entwicklungen kommen wird.
Chancen
Datenräume als perfektes Gegenmodell zu zentralisierenden, allmächtigen Plattformen
In unserem ersten Stakeholder-Workshop im Ressortforschungsprojekt „LabelledGreenData4All“ am 13.06.2024 haben wir das Thema „Machine Learning-Modelle und Datenannotation und deren Datenbedarf im Umweltsektor” diskutiert. Insgesamt haben wir 26 Teilnehmende mit unterschiedlichen Hintergründen und Erfahrungen und aus verschiedensten Organisationen insbesondere aus den Bereichen Wissenschaft, Forschung und öffentlicher Verwaltung begrüßt.
Einer kurzen Projektvorstellung durch Cathleen Mitzschke (Umweltbundesamt, Referat Z 2.3 „Digitale Transformation und Beratungsstelle Green IT“) und Franziska Hochenegger (wetransform) folgte ein Impulsvortrag, welcher „Daten als das neue Gold“ thematisierte. Anhand einer Fallstudie zeigte Kevin Kocon vom IGD Frauenhofer, welchen Herausforderungen Forschende gegenüberstehen, wenn es um die Verfügbarkeit und die Beurteilung von Trainigsdaten sowie annotierten Daten für Machine Learning geht. Dabei stellte er auch Ansätze zum Umgang mit wenigen Trainingsdaten vor, wie beispielsweise Pseudo-Labelling und Transfer Learning.
Anschließend gab Stephan Klingner vom Anwendungslabor für Künstliche Intelligenz und Big Data am UBA einen kurzen Überblick über die aktuellen Anwendungsfälle aus dem Umweltressort, welche von der Detektion und geographischen Verortung von Windenergie- und Freiflächen-Photovoltaik-Anlagen mithilfe von Satellitenbildern bis hin zu KI-gestützten Analysetools zum Erkennen von illegalem Artenhandel auf Onlinehandelsplattformen reichen.
Durch die anschließende Diskussion entlang der Komponenten Datenverfügbarkeit, Datenprozessierung und Dateninfrastruktur führte Thorsten Reitz, CEO der Firma wetransform. Die Teilnehmenden waren sich einig, dass für die Aufbereitung von annotierten Datensätzen nachwievor viel manuelle Arbeiten nötig sind. Entscheidendes Kriterium dabei bildet die Qualität, nicht nur der Datensätze, sondern auch der Metadaten. Dies ist auch der Grund, weshalb sich die Wiederverwendung annotierter Datensätze als äußerst schwierig gestaltet. Auch die Bereitschaft zum Teilen der Daten sowie Unsicherheiten in Bezug auf damit einhergehende Nutzungsbedingungen und Lizenzsysteme haben die Teilnehmenden als limitierende Faktoren benannt.
Die Beiträge und Erkenntnisse aus dem Workshop werden als Grundlage für die weiteren Bedarfs- und Potentialanalysen von Datenannotationen innerhalb von LabelledGreenData4All verwendet. Der Austausch soll in weiteren Stakeholder-Workshops und Interviews mit Expertinnen*Experten im weiteren Verlauf des Forschungsvorhabens fortgesetzt und vertieft werden.
„Für Mensch und Umwelt“ ist der Leitspruch des UBA und bringt auf den Punkt, wofür wir da sind. In diesem Video geben wir Einblick in unsere Arbeit.
Umweltbundesamt
Kontakt
Wörlitzer Platz 1 06844 Dessau-RoßlauBitte richten Sie Ihre Anfragen ausschließlich über das Kontaktformular "UBA fragen" an uns.Infolge der großen Anzahl von Anfragen kann es bei der Beantwortung zu Verzögerungen kommen. Wir bitten um Verständnis.