Logo des Repositoriums
 

Themenübergreifende Diskursklassifikation auf Basis von Word Embeddings und Sequenzfeatures

dc.contributor.authorSteuer, Tim
dc.contributor.authorRensing, Christoph
dc.contributor.editorPinkwart, Niels
dc.contributor.editorKonert, Johannes
dc.date.accessioned2019-08-14T08:59:16Z
dc.date.available2019-08-14T08:59:16Z
dc.date.issued2019
dc.description.abstractZur Beobachtung von kollaborativen Lernprozessen ist Diskursanalyse ein hilfreiches Werkzeug. Dazu wird der Textkorpus von Annotatoren händisch segmentiert und die Segmente nach ihrer Funktion klassifiziert. Dies ist zeitaufwendig und kostspielig. Automatische Modelle versprechen Zeitersparnis sowie Echtzeitanalysen des Diskurses. Diese könnten direktes Feedback, beispielsweise durch Visualisierungen, an die Lernenden ermöglichen. Automatische Modelle benötigen jedoch manuell annotierte Trainingsdaten. Außerdem sind sie meist vom Diskursvokabular abhängig und generalisieren schlecht über Themengrenzen hinweg. Die dadurch notwendige, häufige Neuerstellung von Trainingskorpora, verringert die Zeitersparnis durch Automatisierung und macht Echtzeit Analyse unmöglich. In dieser Arbeit wird ein Klassifikationsverfahren basierend auf Word Embeddings und Sequenz Features vorgestellt, welches vier Arten von Diskurssegmenten unterscheidet. Das Verfahren erreicht gute Evaluationsergebnisse, mit einer besseren Klassifikationsgüte als Verfahren aus verwandten Arbeiten (Cohens > 0.7). Außerdem generalisiert das Verfahren, auf dem Korpus, ohne weiteres Training von einem Themengebiet auf ein anderes. Dies würde die Notwendigkeit von themenspezifischen Trainingskorpora stark verringern.de
dc.identifier.doi10.18420/delfi2019_234
dc.identifier.isbn978-3-88579-691-6
dc.identifier.pissn1617-5468
dc.identifier.urihttps://dl.gi.de/handle/20.500.12116/24428
dc.language.isode
dc.publisherGesellschaft für Informatik e.V.
dc.relation.ispartofDELFI 2019
dc.relation.ispartofseriesLecture Notes in Informatics (LNI) - Proceedings, Volume P-297
dc.subjectDiskursanalyse
dc.subjectWord Embeddings
dc.subjectMachine Learning
dc.titleThemenübergreifende Diskursklassifikation auf Basis von Word Embeddings und Sequenzfeaturesde
dc.typeText/Conference Paper 
gi.citation.endPage56
gi.citation.publisherPlaceBonn
gi.citation.startPage45
gi.conference.date16.-19. September 2019
gi.conference.locationBerlin, Germany
gi.conference.sessiontitleTextanalyse

Dateien

Originalbündel
1 - 1 von 1
Lade...
Vorschaubild
Name:
DELFI2019_234_Themenuebergreifende_Diskursklassifikation_auf_Basis_von_Word_Embeddings_und_Sequenzfeatures.pdf
Größe:
489.64 KB
Format:
Adobe Portable Document Format