Logo des Repositoriums
 

Hybrider Ansatz zur automatisierten Themen-Klassifizierung von Produktrezensionen

dc.contributor.authorGoetz, Rene
dc.contributor.authorPiazza, Alexander
dc.contributor.authorBodendorf, Freimut
dc.date.accessioned2021-03-25T13:38:18Z
dc.date.available2021-03-25T13:38:18Z
dc.date.issued2019
dc.description.abstractIm Online-Handel werden durch Interaktionen von Kunden mit den Web-Plattformen enorme Datenmengen generiert. So zählt Kundenfeedback in Form von Produktrezensionen zu den unstrukturierten Daten, für deren Verarbeitung Ansätze aus dem Gebiet der Computerlinguistik und des maschinellen Lernens benötigt werden. Als Alternative zu den klassischen Ansätzen des überwachten und unüberwachten Lernens, welche im betrieblichen Kontext und der Anwendungsdomäne der Produktrezensionen oftmals an deren Grenzen stoßen, wird in diesem Artikel ein hybrider Ansatz zur Kategorisierung von Produktrezensionen vorgestellt, der die Vorteile des maschinellen Lernens und der menschlichen Expertise vereint. Ziel dieses Artikels ist es, einen Ansatz zu präsentieren, welcher es ermöglicht, automatisiert und basierend auf den Anforderungen aus der Praxis, strukturiert Themen und darauf bezogene Aspekte aus Produktrezensionen zu extrahieren. Mithilfe von Word2Vec werden semantische Beziehung der in den Rezensionen enthaltenen Wörter trainiert. Dadurch können einzelne Wörter mit vorher definierten Themen auf deren Ähnlichkeit untersucht werden und in den Rezensionen identifiziert und extrahiert werden. Dieser Ansatz wird am Beispiel eines Datensatzes von rund fünf Millionen Produktrezensionen der Online-Plattform Amazon demonstriert und dessen Ergebnisse mit denen eines gängigen Topic Modelling Ansatzes gegenübergestellt. In e‑commerce, enormous amounts of data are generated through the interaction of customers with Web platforms. Customer feedback in the form of product reviews, for instance, is an example for unstructured data, which processing requires approaches from the fields of computer linguistics and machine learning. As an alternative to the classical approaches of supervised and unsupervised learning, which often reach their limits in the business context and the application domain of product reviews, this article presents a hybrid approach for categorizing product reviews that combines the advantages of machine learning and human expertise. The aim of this paper is to present an approach that allows to automatically extract structured topics and related aspects from product reviews based on practical requirements. Word2Vec is used to train semantic relationships between words that occur in product reviews. In this way, individual words of each review can be compared with in advance defined topic words regarding their similarity and can then be extracted from the reviews. This approach is demonstrated using around five million product reviews of the Amazon online platform. The results are getting compared with those from a common topic modelling technique.de
dc.identifier.doi10.1365/s40702-019-00521-w
dc.identifier.pissn2198-2775
dc.identifier.urihttp://dx.doi.org/10.1365/s40702-019-00521-w
dc.identifier.urihttps://dl.gi.de/handle/20.500.12116/36010
dc.publisherSpringer
dc.relation.ispartofHMD Praxis der Wirtschaftsinformatik: Vol. 56, No. 5
dc.relation.ispartofseriesHMD Praxis der Wirtschaftsinformatik
dc.subjectComputerlinguistik
dc.subjectMachine Learning
dc.subjectMaschinelles Lernen
dc.subjectNatural Language Processing
dc.subjectProduct Reviews
dc.subjectProduktrezensionen
dc.subjectText Analyse
dc.subjectText Analytics
dc.subjectText Mining
dc.subjectTopic Modelling
dc.subjectWord2Vec
dc.titleHybrider Ansatz zur automatisierten Themen-Klassifizierung von Produktrezensionende
dc.typeText/Journal Article
gi.citation.endPage946
gi.citation.startPage932

Dateien