Wer zwitschert denn da? Autorenschaftsattribution mittels stilistischer Merkmale für kurze Social-Media-Nachrichtentexte

Luger, KatharinaSchmittwilken, JörgGunnar AuthTim Pidun2023-11-132023-11-132023978-3-88579-735-7https://dl.gi.de/handle/20.500.12116/42628Zur Bekämpfung von Computerkriminalität sowie zur Wahrung der Informationssicherheit ist es vielfach notwendig, die Autorenschaft von Texten zu kennen oder zu ermitteln. Gerade die Zuordnung anonymer Texte zu einer möglichen Autorin oder einem möglichen Autor ist in diesem Kontext ein häufig zu lösendes Problem. Beispielsweise muss im Rahmen der Ermittlungsarbeit zu Hass-Kommentaren die Menge möglicher Autor:innen bestenfalls auf eine Person reduziert werden. In diesem Beitrag wird ein Modell zur Autorenschaftsattribution vorgestellt, das mithilfe von maschinellem Lernen aus einem Datensatz mit den Tweets von 915 Twitter-Accounts gelernt wurde. Das Modell basiert auf Support-Vector-Machines. Der Fokus des Beitrags richtet sich auf das Feature-Engineering, also der Erstellung sowie der Auswahl von Merkmalen, auf denen das Modell basiert. Es werden Feature sowie andere Modellparameter vorgestellt, die eine Klassifikationsgenauigkeit von bis zu 63% erzielen.deInformationssicherheitComputerkriminalitätAutorenschaftsattributionMaschinelles LernenSuppport-Vector-Machinestilistische MerkmaleWer zwitschert denn da? Autorenschaftsattribution mittels stilistischer Merkmale für kurze Social-Media-NachrichtentexteText/Conference Paper10.18420/rvi2023-0251617-5468