Logo des Repositoriums
 
Konferenzbeitrag

Open Information Extraction gestützte Pipeline für einen deutschsprachigen Wissensgraphen

Lade...
Vorschaubild

Volltext URI

Dokumententyp

Text/Conference Paper

Zusatzinformation

Datum

2019

Zeitschriftentitel

ISSN der Zeitschrift

Bandtitel

Verlag

Gesellschaft für Informatik e.V.

Zusammenfassung

Eine zentrale Herausforderung bei der Erstellung von Wissensgraphen aus natürlichsprachigen Texten besteht darin, geeignete Werkzeuge für unterschiedliche Sprachen zu entwickeln. Besonders abseits des Englischen sind einsatzfähige Architekturen Mangelware. In diesem Paper stellen wir eine mögliche Pipeline vor, die auf Basis von Open Information Extraction (OIE) einen RDF/OWL-Wissensgraphen aus deutschen Texten extrahiert. Dabei verbinden wir verschiedene bestehende Werkzeuge zur Natürlichen Sprachverarbeitung miteinander, die eigens für die deutsche Sprache konstruiert wurden. Während die Relation Extraction zum GroSSteil auf Dependency Parsing basiert, konzentrieren wir uns bei der Entity Extraction mithilfe von Named Entity Recognition auf Eigennamen, vor allem von Personen.

Beschreibung

Lehner, Marco; Sauer, Anna; Schmidt, Christopher; Schwarz, Lukas (2019): Open Information Extraction gestützte Pipeline für einen deutschsprachigen Wissensgraphen. SKILL 2019 - Studierendenkonferenz Informatik. Bonn: Gesellschaft für Informatik e.V.. PISSN: 1614-3213. ISBN: 978-3-88579-449-3. pp. 23-31. Natural Language Processing. Kassel. 25.-26. September 2019

Zitierform

DOI

Tags