ateSDG: Automatisierte Extraktion von Sustainable Development Goals aus Textdaten
Politik Projekt

#Berlin #SDGs #Wirtschaft
01/23 bis 12/23

ateSDG: Automatisierte Extraktion von Sustainable Development Goals aus Textdaten

Geförderte Institution: 
Technische Universität Berlin
Kooperationspartner:
Deutsches Forschungszentrum für Künstliche Intelligenz

Allgemeine Infos

Im Projekt werden Algorithmen des maschinellen Lernens angewandt, um automatisch Informationen zu den Sustainable Development Goals (SDGs) aus Textdokumenten zu extrahieren. Dies soll eine Analyse ermöglichen, welche SDGs in Nachhaltigkeitsberichten von Unternehmen und Organisationen in der Region Berlin-Brandenburg adressiert werden.
Die Arbeit der sogenannten RENN-Hubs (Regional Hubs for Sustainability Strategies), die die Umsetzung der SDGs in den jeweiligen Regionen begleiten und voranbringen, kann so beispielsweise unterstützt werden.

Vorgehen

Zunächst wurde eine Datenbank aufgebaut, die Informationen über Nachhaltigkeitsberichte von Unternehmen und Organisationen in der Region Berlin-Brandenburg zusammen mit Ground-Truth-Labels über SDGs enthält. Verschiedene auf künstlichen neuronalen Netzwerken basierende Klassifikatoren wurden auf dem SDG-Klassifizierungsdatensatz trainiert und getestet. Außerdem wurde untersucht, wie die Verständlichkeit und Transparenz der Modellergebnisse verbessert werden kann.

Ergebnisse

Die Klassifikation zeigt gute Ergebnisse. Der Nutzen von Erklärungen im Kontext der SDG-Erkennung wurde durch eine Nutzer*innenstudie untersucht und bestätigt. Darüber hinaus wurden die auf den Daten trainierten Modelle und die bewerteten Erklärungen in den interaktiven Demonstrator integriert.

Outreach

Eine Publikation zum Projekt  „A Transfer Learning Approach for SDGs Classification of Sustainability Reports“ wurde in Human Language Technologies as a Challenge for Computer Science and Linguistics 2023 veröffentlicht. Weitere Publikationen befinden sich im Veröffentlichungsprozess. Der SDG-Demonstrator wird auf der Association for Computational Linguistics 2024 präsentiert und ist anschließend öffentlich verfügbar.

 

Vera Schmitt

Kontakt

Vera Schmitt
Technische Universität Berlin