Konferenzbeitrag
Full Review
Wer zwitschert denn da? Autorenschaftsattribution mittels stilistischer Merkmale für kurze Social-Media-Nachrichtentexte
Lade...
Volltext URI
Dokumententyp
Text/Conference Paper
Dateien
Zusatzinformation
Datum
2023
Autor:innen
Zeitschriftentitel
ISSN der Zeitschrift
Bandtitel
Verlag
Gesellschaft für Informatik e.V.
Zusammenfassung
Zur Bekämpfung von Computerkriminalität sowie zur Wahrung der Informationssicherheit ist es vielfach notwendig, die Autorenschaft von Texten zu kennen oder zu ermitteln. Gerade die Zuordnung anonymer Texte zu einer möglichen Autorin oder einem möglichen Autor ist in diesem Kontext ein häufig zu lösendes Problem. Beispielsweise muss im Rahmen der Ermittlungsarbeit zu Hass-Kommentaren die Menge möglicher Autor:innen bestenfalls auf eine Person reduziert werden. In diesem Beitrag wird ein Modell zur Autorenschaftsattribution vorgestellt, das mithilfe von maschinellem Lernen aus einem Datensatz mit den Tweets von 915 Twitter-Accounts gelernt wurde. Das Modell basiert auf Support-Vector-Machines. Der Fokus des Beitrags richtet sich auf das Feature-Engineering, also der Erstellung sowie der Auswahl von Merkmalen, auf denen das Modell basiert. Es werden Feature sowie andere Modellparameter vorgestellt, die eine Klassifikationsgenauigkeit von bis zu 63% erzielen.
Beschreibung
Zitierform
Tags
best student paper