Allgemeine Infos
Im Projekt werden Algorithmen des maschinellen Lernens angewandt, um automatisch Informationen zu den Sustainable Development Goals (SDGs) aus Textdokumenten zu extrahieren. Dies soll eine Analyse ermöglichen, welche SDGs in Nachhaltigkeitsberichten von Unternehmen und Organisationen in der Region Berlin-Brandenburg adressiert werden.
Die Arbeit der sogenannten RENN-Hubs (Regional Hubs for Sustainability Strategies), die die Umsetzung der SDGs in den jeweiligen Regionen begleiten und voranbringen, kann so beispielsweise unterstützt werden.
Vorgehen
Zunächst wurde eine Datenbank aufgebaut, die Informationen über Nachhaltigkeitsberichte von Unternehmen und Organisationen in der Region Berlin-Brandenburg zusammen mit Ground-Truth-Labels über SDGs enthält. Verschiedene auf künstlichen neuronalen Netzwerken basierende Klassifikatoren wurden auf dem SDG-Klassifizierungsdatensatz trainiert und getestet. Außerdem wurde untersucht, wie die Verständlichkeit und Transparenz der Modellergebnisse verbessert werden kann.
Ergebnisse
Die Klassifikation zeigt gute Ergebnisse. Der Nutzen von Erklärungen im Kontext der SDG-Erkennung wurde durch eine Nutzer*innenstudie untersucht und bestätigt. Darüber hinaus wurden die auf den Daten trainierten Modelle und die bewerteten Erklärungen in den interaktiven Demonstrator integriert.
Outreach
Eine Publikation zum Projekt „A Transfer Learning Approach for SDGs Classification of Sustainability Reports“ wurde in Human Language Technologies as a Challenge for Computer Science and Linguistics 2023 veröffentlicht. Weitere Publikationen befinden sich im Veröffentlichungsprozess. Der SDG-Demonstrator wird auf der Association for Computational Linguistics 2024 präsentiert und ist anschließend öffentlich verfügbar.