Projekte in Forschung und Entwicklung

CheckThat!-Lab 2021: Desinformation oder Fake News stellen ein großes gesellschaftliches Problem dar und treten in vielen verschiedenen Formen auf [1]. Oft wird ein Teil einer wahren Geschichte weggelassen, es werden Aspekte hinzugefügt oder der Kontext verändert, um die Fakten in ein anderes Licht zu rücken. Die schnelle Distribution über das Internet und insbesondere soziale Medien erfordert die Entwicklung von Technologien, die in der Lage sind, den Prozess der manuellen Überprüfung effektiv zu unterstützen und teilweise zu automatisieren, um eine frühzeitige Erkennung von Falschinformation zu ermöglichen. Die Entwicklung entsprechender Systeme und Algorithmen voranzutreiben ist das Ziel des CheckThat!-Labs, in dessen Kontext im Rahmen von CLEF (Conference and Labs of the Evaluation Forum) mehrere Shared Tasks organisiert werden, die verschiedene Aufgaben entlang des manuellen Prozesses zur Prüfung von (Falsch-)information zum Gegenstand haben.

[1] D. Bawden, L. Robinson, The dark side of information: overload, anxiety and other paradoxes and pathologies, J. Inf. Sci. 35 (2009) 180–191. doi:10.1177/0165551508095781.

GermEval 2019: Shared Task on the Identification of Offensive Language: Offensive Sprache wie Beleidigungen, die Verwendung obszöner Ausdrücke und hassgeladene Kommentare nehmen in den sozialen Medien zu. Das manuelle Monitoring wird zunehmend schwieriger und macht eine maschinelle Unterstützung bei der Erkennung verdächtiger Äußerungen notwendig. Im Rahmen der Evaluierungsinitiative werden Twitterdaten hinsichtlich verschiedener Abstufungen offensiver Sprache annotiert und den teilnehmenden Wissenschaftsteams bereitgestellt. In der Shared Task werden Aufgaben mit verschiedenen Schwierigkeitsgraden gestellt und eine Evaluierung durch die Organisatoren durchgeführt.

Machbarkeitsstudie wissenschaftliche Bilder, Graphiken und 3D-Objekte (TIB): Ziel des Projekts ist die Entwicklung von Services und Dienstleistungen zur Ergänzung des Angebotsportfolios der Technische Informationsbibliothek für wissenschaftliche Bilder, Graphiken und 3D-Objekte, die vorrangig im Rahmen von Forschungsprozessen entstehen. Anhand der in Nutzerstudien erhobenen Anforderungen und Bedarfe werden die Lösungen aus Forschungsprojekten für einen Transfer in den Regelbetrieb geprüft und neue Forschungs- und Entwicklungsprojekte angestoßen. Schwerpunkt ist dabei die Erhöhung der Auffindbarkeit und Verbesserung des Zugangs zu multimedialen Forschungsdaten.

Multilinguales aspektbasiertes Opinion Mining (Promotion an der Universität Hildesheim): Im Rahmen der Promotion wird ein ressourcenarmer Ansatz zur Identifikation von Meinungsäußerungen und zugehörigen Meinungszielen in Produktrezensionen entwickelt, der sich mit geringem Aufwand für verschiedene Sprachen adaptieren lässt. Dabei soll die Nutzerperspektive in dieser Arbeit nicht außer acht gelassen werden. Besonders der Fragestellung, welche Eigenschaften eine Meinungsäußerung in den Augen der Nutzer als hilfreich bzw. nützlich im Kaufentscheidungsprozess ausweist, wird in dieser Arbeit vor einem mehrsprachigen Hintergrund nachgegangen.

GErman SenTiment AnaLysis shared Task (GESTALT): Maintask 1 – Source, Subjective Expression and Target Extraction from Political Speeches (IGGSA-STEPS): Für die Durchführung der Shared Task wird ein feingranulares Korpus entwickelt, das neben Annotationen der Meinungsäußerungen auch die zugehörige Meinungsziele und der entsprechenden Urheber enthält. Das Korpus wird zusammen mit dem entwickelten Evaluationswerkzeug der Forschungsgemeinschaft zur Verfügung gestellt.

Trend Mining for Patents (T4P): Im Rahmen des Projekt werden prototypisch Verfahren und Methoden für die (semi-)automatische Identifikation von Trends in Patenten entwickelt. Dabei werden sowohl Verfahren aus dem Bereich des Text Mining als auch des maschinellen Lernens für die „schwierige“ Textsorte Patent unter Einbezug von Nutzer- und Expertenwissen adaptiert und weiterentwickelt.

LogCLEF (Mitglied des Orgianisationsteams): Das Ziel der Evaluierungskampagne im Rahmen des Cross Language Evaluation Forum (CLEF) ist die Förderung der Analyse und Klassifikation von Suchanfragen und Nutzerinteraktionen in mehrsprachigen Kontexten, um ein besseres Verständnis des Suchverhaltens zu erzielen und so Retrievalsysteme langfristig zu verbessern.

GikiCLEF (Mitglied des Organisationsteams): Die Evaluierungsinitiative im Kontext des Cross Language Evaluation Forum (CLEF) zielt auf die Verbesserung von Retrievalsystemen für Suchanfragen mit geographischen Komponenten ab. Die Evaluation erfolgt auf einem Korpus aus Wikipediaartikeln.