Logo des Repositoriums
 

Textvereinfachung & Open IE: Von Sätzen zur Bedeutungsdarstellung

dc.contributor.authorNiklaus, Christina
dc.contributor.editorReischuk, Rüdiger
dc.date.accessioned2023-11-09T13:38:07Z
dc.date.available2023-11-09T13:38:07Z
dc.date.issued2023
dc.description.abstractModerne Systeme, die sich mit Inferenzen in Texten beschäftigen, benötigen automatisierte Methoden zur Extraktion von Bedeutungsrepräsentationen aus großen Textkorpora. Open Information Extraction (IE) ist eine führende Methode, um sämtliche in einem Text vorhandenen Relationen zu extrahieren. Open-IE-Ansätze haben sich im Laufe der Jahre weiterentwickelt, um Beziehungen zu erfassen, die über einfache Subjekt-Prädikat-Objekt-Tripel (SPO) hinausgehen. Dabei ist jedoch ein genauerer Blick auf die Extraktion von Verknüpfungen zwischen Klausen und Phrasen innerhalb eines komplexen Satzes vernachlässigt worden. Um diese Lücke zu schließen, wird ein neuartiges Open-IE-Framework vorgestellt, das komplexe Textdaten in eine leichtgewichtige semantische Repräsentation in Form von normalisierten und kontextwahrenden relationalen Tupeln transformiert. Das Framework nutzt einen diskursorientierten Ansatz, um komplexe Sätze in eine semantische Hierarchie von Minimalaussagen zu überführen. Diese weisen eine kanonische SPO- Struktur auf, wodurch die Extraktion von relationalen Tupeln erleichtert wird, was zu einer verbesserten Genauigkeit (engl. “precision”) (bis zu 32%) und einer höheren Erkennungsrate (engl. “re- call”) (bis zu 30%) der extrahierten Relationen in einem großen Benchmark-Korpus führt. Darüber hinaus wird der semantische Kontext der extrahierten Tupel in Form von rhetorischen Strukturen und hierarchischen Beziehungen erfasst. Auf diese Weise wird die oberflächliche semantische Darstellung aktueller Open-IE-Systeme mit zusätzlichen Metainformationen angereichert und so wichtige Kontextinformationen bewahrt, die zur Extraktion von korrekten, aussagekräftigen und kohärenten relationalen Tupeln erforderlich sind.de
dc.identifier.isbn978-3-88579-981-8
dc.identifier.urihttps://dl.gi.de/handle/20.500.12116/42597
dc.language.isode
dc.publisherGesellschaft für Informatik e.V.
dc.relation.ispartofAusgezeichnete Informatikdissertationen 2022 (Band D23)
dc.titleTextvereinfachung & Open IE: Von Sätzen zur Bedeutungsdarstellungde
dc.typeText/Conference Paper
gi.citation.endPage210
gi.citation.publisherPlaceBonn
gi.citation.startPage201
gi.conference.date14.-17.05.2023
gi.conference.locationSchloss Dagstuhl, Deutschland

Dateien

Originalbündel
1 - 1 von 1
Lade...
Vorschaubild
Name:
Niklaus-Christina.pdf
Größe:
1.03 MB
Format:
Adobe Portable Document Format