Logo des Repositoriums
 

SentiStorm: Echtzeit-Stimmungserkennung von Tweets

dc.contributor.authorZangerle, Eva
dc.contributor.authorIllecker, Martin
dc.contributor.authorSpecht, Günther
dc.date.accessioned2018-01-16T10:20:32Z
dc.date.available2018-01-16T10:20:32Z
dc.date.issued2016
dc.description.abstractDas automatisierte Erkennen der Stimmung von Texten hat in den letzten Jahren stark an Bedeutung gewonnen. Insbesondere durch die rapide Zunahme der Geschwindigkeit, mit der in sozialen Medien Informationen verbreitet werden, ist eine Echtzeit-Bestimmung der Stimmung von Texten ein herausforderndes Problem. Der Mikroblogging-Dienst Twitter verzeichnet im Durchschnitt über 8000 versendete Nachrichten pro Sekunde. In dieser Arbeit stellen wir mit dem SentiStorm-Ansatz einen Ansatz zur Stimmungserkennung von Tweets vor. Dabei erzeugen wir in einem ersten Schritt Merkmalsvektoren für die Tweets, die sowohl linguistische Informationen über den Tweet (Wichtigkeit der Wörter, Wortarten), wie auch über Sentiment-Lexika gewonnene Stimmungsinformationen beinhalten. In einem zweiten Schritt führen wir mittels der Merkmalsvektoren eine Stimmungsklassifikation durch, die eine Einteilung in positive, negative oder neutrale Tweets ermöglicht. Die durchgeführten Evaluationen zeigen, dass der präsentierte Ansatz bezüglich der Qualität der erkannten Stimmung sehr gute Erkennungsraten garantiert. Weiter zeigen wir, dass der Ansatz mittels der Apache Storm Plattform problemlos für die Echtzeit-Stimmungserkennung von Tweets skaliert werden kann.AbstractThe automatic detection of the sentiment of texts has become more and more important throughout the last years. Particularly, the rapid increase of the speed at which information is spread in social media makes real-time sentiment detection a challenging task. On the microblogging platform Twitter, more than 8,000 messages are sent every second. In this work, we present the SentiStorm approach, an approach for sentiment detection within tweets. We base the approach on feature vectors which contain linguistic information about the tweet content (weighting of words, word categories), as well as sentiment information which we gather based on sentiment lexica. Subsequently, we facilitate these feature vectors for a sentiment classification task which allows for distinguishing positive, negative and neutral tweets. Our conducted evaluations show that the proposed approach shows high classification accuracy. At the same time, we show that utilizing the Apache Storm platform we are able to easily scale the approach towards a real-time sentiment classification of tweets.
dc.identifier.pissn2198-2775
dc.identifier.urihttps://dl.gi.de/handle/20.500.12116/13891
dc.publisherSpringer
dc.relation.ispartofHMD Praxis der Wirtschaftsinformatik: Vol. 53, No. 4
dc.relation.ispartofseriesHMD Praxis der Wirtschaftsinformatik
dc.subjectclassification
dc.subjectcomputational linguistics
dc.subjectComputerlinguistik
dc.subjectKlassifikation
dc.subjectscalability
dc.subjectsentiment detection
dc.subjectSkalierbarkeit
dc.subjectStimmungserkennung
dc.subjecttext mining
dc.subjectText Mining
dc.subjectTwitter
dc.titleSentiStorm: Echtzeit-Stimmungserkennung von Tweets
dc.typeText/Journal Article
gi.citation.endPage529
gi.citation.startPage514

Dateien