Themenübergreifende Diskursklassifikation auf Basis von Word Embeddings und Sequenzfeatures
dc.contributor.author | Steuer, Tim | |
dc.contributor.author | Rensing, Christoph | |
dc.contributor.editor | Pinkwart, Niels | |
dc.contributor.editor | Konert, Johannes | |
dc.date.accessioned | 2019-08-14T08:59:16Z | |
dc.date.available | 2019-08-14T08:59:16Z | |
dc.date.issued | 2019 | |
dc.description.abstract | Zur Beobachtung von kollaborativen Lernprozessen ist Diskursanalyse ein hilfreiches Werkzeug. Dazu wird der Textkorpus von Annotatoren händisch segmentiert und die Segmente nach ihrer Funktion klassifiziert. Dies ist zeitaufwendig und kostspielig. Automatische Modelle versprechen Zeitersparnis sowie Echtzeitanalysen des Diskurses. Diese könnten direktes Feedback, beispielsweise durch Visualisierungen, an die Lernenden ermöglichen. Automatische Modelle benötigen jedoch manuell annotierte Trainingsdaten. Außerdem sind sie meist vom Diskursvokabular abhängig und generalisieren schlecht über Themengrenzen hinweg. Die dadurch notwendige, häufige Neuerstellung von Trainingskorpora, verringert die Zeitersparnis durch Automatisierung und macht Echtzeit Analyse unmöglich. In dieser Arbeit wird ein Klassifikationsverfahren basierend auf Word Embeddings und Sequenz Features vorgestellt, welches vier Arten von Diskurssegmenten unterscheidet. Das Verfahren erreicht gute Evaluationsergebnisse, mit einer besseren Klassifikationsgüte als Verfahren aus verwandten Arbeiten (Cohens > 0.7). Außerdem generalisiert das Verfahren, auf dem Korpus, ohne weiteres Training von einem Themengebiet auf ein anderes. Dies würde die Notwendigkeit von themenspezifischen Trainingskorpora stark verringern. | de |
dc.identifier.doi | 10.18420/delfi2019_234 | |
dc.identifier.isbn | 978-3-88579-691-6 | |
dc.identifier.pissn | 1617-5468 | |
dc.identifier.uri | https://dl.gi.de/handle/20.500.12116/24428 | |
dc.language.iso | de | |
dc.publisher | Gesellschaft für Informatik e.V. | |
dc.relation.ispartof | DELFI 2019 | |
dc.relation.ispartofseries | Lecture Notes in Informatics (LNI) - Proceedings, Volume P-297 | |
dc.subject | Diskursanalyse | |
dc.subject | Word Embeddings | |
dc.subject | Machine Learning | |
dc.title | Themenübergreifende Diskursklassifikation auf Basis von Word Embeddings und Sequenzfeatures | de |
dc.type | Text/Conference Paper | |
gi.citation.endPage | 56 | |
gi.citation.publisherPlace | Bonn | |
gi.citation.startPage | 45 | |
gi.conference.date | 16.-19. September 2019 | |
gi.conference.location | Berlin, Germany | |
gi.conference.sessiontitle | Textanalyse |
Dateien
Originalbündel
1 - 1 von 1
Lade...
- Name:
- DELFI2019_234_Themenuebergreifende_Diskursklassifikation_auf_Basis_von_Word_Embeddings_und_Sequenzfeatures.pdf
- Größe:
- 489.64 KB
- Format:
- Adobe Portable Document Format