Konferenzbeitrag
Open Information Extraction gestützte Pipeline für einen deutschsprachigen Wissensgraphen
Lade...
Volltext URI
Dokumententyp
Text/Conference Paper
Dateien
Zusatzinformation
Datum
2019
Autor:innen
Zeitschriftentitel
ISSN der Zeitschrift
Bandtitel
Verlag
Gesellschaft für Informatik e.V.
Zusammenfassung
Eine zentrale Herausforderung bei der Erstellung von Wissensgraphen aus natürlichsprachigen Texten besteht darin, geeignete Werkzeuge für unterschiedliche Sprachen zu entwickeln. Besonders abseits des Englischen sind einsatzfähige Architekturen Mangelware. In diesem Paper stellen wir eine mögliche Pipeline vor, die auf Basis von Open Information Extraction (OIE) einen RDF/OWL-Wissensgraphen aus deutschen Texten extrahiert. Dabei verbinden wir verschiedene bestehende Werkzeuge zur Natürlichen Sprachverarbeitung miteinander, die eigens für die deutsche Sprache konstruiert wurden. Während die Relation Extraction zum GroSSteil auf Dependency Parsing basiert, konzentrieren wir uns bei der Entity Extraction mithilfe von Named Entity Recognition auf Eigennamen, vor allem von Personen.