Textvereinfachung & Open IE: Von Sätzen zur Bedeutungsdarstellung
dc.contributor.author | Niklaus, Christina | |
dc.contributor.editor | Reischuk, Rüdiger | |
dc.date.accessioned | 2023-11-09T13:38:07Z | |
dc.date.available | 2023-11-09T13:38:07Z | |
dc.date.issued | 2023 | |
dc.description.abstract | Moderne Systeme, die sich mit Inferenzen in Texten beschäftigen, benötigen automatisierte Methoden zur Extraktion von Bedeutungsrepräsentationen aus großen Textkorpora. Open Information Extraction (IE) ist eine führende Methode, um sämtliche in einem Text vorhandenen Relationen zu extrahieren. Open-IE-Ansätze haben sich im Laufe der Jahre weiterentwickelt, um Beziehungen zu erfassen, die über einfache Subjekt-Prädikat-Objekt-Tripel (SPO) hinausgehen. Dabei ist jedoch ein genauerer Blick auf die Extraktion von Verknüpfungen zwischen Klausen und Phrasen innerhalb eines komplexen Satzes vernachlässigt worden. Um diese Lücke zu schließen, wird ein neuartiges Open-IE-Framework vorgestellt, das komplexe Textdaten in eine leichtgewichtige semantische Repräsentation in Form von normalisierten und kontextwahrenden relationalen Tupeln transformiert. Das Framework nutzt einen diskursorientierten Ansatz, um komplexe Sätze in eine semantische Hierarchie von Minimalaussagen zu überführen. Diese weisen eine kanonische SPO- Struktur auf, wodurch die Extraktion von relationalen Tupeln erleichtert wird, was zu einer verbesserten Genauigkeit (engl. “precision”) (bis zu 32%) und einer höheren Erkennungsrate (engl. “re- call”) (bis zu 30%) der extrahierten Relationen in einem großen Benchmark-Korpus führt. Darüber hinaus wird der semantische Kontext der extrahierten Tupel in Form von rhetorischen Strukturen und hierarchischen Beziehungen erfasst. Auf diese Weise wird die oberflächliche semantische Darstellung aktueller Open-IE-Systeme mit zusätzlichen Metainformationen angereichert und so wichtige Kontextinformationen bewahrt, die zur Extraktion von korrekten, aussagekräftigen und kohärenten relationalen Tupeln erforderlich sind. | de |
dc.identifier.isbn | 978-3-88579-981-8 | |
dc.identifier.uri | https://dl.gi.de/handle/20.500.12116/42597 | |
dc.language.iso | de | |
dc.publisher | Gesellschaft für Informatik e.V. | |
dc.relation.ispartof | Ausgezeichnete Informatikdissertationen 2022 (Band D23) | |
dc.title | Textvereinfachung & Open IE: Von Sätzen zur Bedeutungsdarstellung | de |
dc.type | Text/Conference Paper | |
gi.citation.endPage | 210 | |
gi.citation.publisherPlace | Bonn | |
gi.citation.startPage | 201 | |
gi.conference.date | 14.-17.05.2023 | |
gi.conference.location | Schloss Dagstuhl, Deutschland |
Dateien
Originalbündel
1 - 1 von 1