Logo des Repositoriums
 
Konferenzbeitrag
Full Review

Wer zwitschert denn da? Autorenschaftsattribution mittels stilistischer Merkmale für kurze Social-Media-Nachrichtentexte

Lade...
Vorschaubild

Volltext URI

Dokumententyp

Text/Conference Paper

Zusatzinformation

Datum

2023

Zeitschriftentitel

ISSN der Zeitschrift

Bandtitel

Verlag

Gesellschaft für Informatik e.V.

Zusammenfassung

Zur Bekämpfung von Computerkriminalität sowie zur Wahrung der Informationssicherheit ist es vielfach notwendig, die Autorenschaft von Texten zu kennen oder zu ermitteln. Gerade die Zuordnung anonymer Texte zu einer möglichen Autorin oder einem möglichen Autor ist in diesem Kontext ein häufig zu lösendes Problem. Beispielsweise muss im Rahmen der Ermittlungsarbeit zu Hass-Kommentaren die Menge möglicher Autor:innen bestenfalls auf eine Person reduziert werden. In diesem Beitrag wird ein Modell zur Autorenschaftsattribution vorgestellt, das mithilfe von maschinellem Lernen aus einem Datensatz mit den Tweets von 915 Twitter-Accounts gelernt wurde. Das Modell basiert auf Support-Vector-Machines. Der Fokus des Beitrags richtet sich auf das Feature-Engineering, also der Erstellung sowie der Auswahl von Merkmalen, auf denen das Modell basiert. Es werden Feature sowie andere Modellparameter vorgestellt, die eine Klassifikationsgenauigkeit von bis zu 63% erzielen.

Beschreibung

Luger, Katharina; Schmittwilken, Jörg (2023): Wer zwitschert denn da? Autorenschaftsattribution mittels stilistischer Merkmale für kurze Social-Media-Nachrichtentexte. 6. Fachtagung Rechts- und Verwaltungsinformatik (RVI 2023). DOI: 10.18420/rvi2023-025. Bonn: Gesellschaft für Informatik e.V.. PISSN: 1617-5468. ISBN: 978-3-88579-735-7. pp. 96-108. Regular Research Papers. Dresden. 26.-27. October 2023

Zitierform

Tags

best student paper