Kleine Barrieren für große Analysen – Eine Untersuchung der Eignung aktueller Plattformen für Self-Service Data Mining

Badura, Daniel; Schulz, Michael

Kleine Barrieren für große Analysen – Eine Untersuchung der Eignung aktueller Plattformen für Self-Service Data Mining

dc.contributor.author	Badura, Daniel
dc.contributor.author	Schulz, Michael
dc.date.accessioned	2021-03-25T13:38:16Z
dc.date.available	2021-03-25T13:38:16Z
dc.date.issued	2019
dc.description.abstract	Um das Potential der stetig wachsenden Datenmengen in verschiedenen Geschäfts- und Gesellschaftsbereichen verstärkt zur Erkenntnisgewinnung und Entscheidungsunterstützung nutzen zu können, wäre es hilfreich, Big-Data-Analysemethoden für einen größeren Anwenderkreis zugänglich zu machen. Dies kann entweder durch eine stärkere Vermittlung von Datenkompetenzen aus Anwendersicht oder durch eine Vereinfachung der Methoden, insbesondere durch weitere Automatisierung der Prozesse oder Algorithmen mit geringer Komplexität aus Anwendungssicht geschehen. Zu letzteren gehören unter anderem Entscheidungsbäume, da die verwendeten Algorithmen leicht nachvollziehbar und die Analyseergebnisse zudem grafisch darstellbar sind. Für die in dieser Arbeit vorgestellte Versuchsreihe wurden sie daher als Anhaltspunkt für die Etablierbarkeit von Self-Service Data Mining verwendet. In den Plattformen IBM SPSS Modeler, RapidMiner, KNIME und Weka wurden auf einer einheitlichen Datengrundlage Klassifikationsmodelle erstellt und diese in Bezug auf ihre Genauigkeit und Komplexität miteinander verglichen. Die Ergebnisse deuten darauf hin, dass die Plattformen im Hinblick auf diese beiden Punkte unterschiedliche Stärken und Schwächen im Analyseprozess aufweisen. Gegenwärtig gibt es bereits vielversprechende Ansätze zur Erweiterung des potentiellen Nutzerkreises von Big-Data-Analysen, jedoch sind diese noch nicht flächendeckend etabliert. To further harness the potential of the growing volume of available data in different areas of business and society, it would be helpful if big data analytics could be made available to a larger group of users. This can be achieved either through an increase in general data literacy or a simplification of the process, especially through further automation or more easily comprehensible algorithms. Decision trees are an example of the latter, since analytical results can be represented in visual form. For the trials presented in this article, they were used as a reference point for the feasibility of self-service analytics. Classification models were constructed in the platforms IBM SPSS Modeler, RapidMiner, KNIME and Weka and were compared with regards to their accuracy and comprehensibility. The results indicate that the platforms possess different strengths and weaknesses at different steps of the process. Currently, there are already some promising self-service solutions, but they are not yet widely established.	de
dc.identifier.doi	10.1365/s40702-019-00513-w
dc.identifier.pissn	2198-2775
dc.identifier.uri	http://dx.doi.org/10.1365/s40702-019-00513-w
dc.identifier.uri	https://dl.gi.de/handle/20.500.12116/35999
dc.publisher	Springer
dc.relation.ispartof	HMD Praxis der Wirtschaftsinformatik: Vol. 56, No. 5
dc.relation.ispartofseries	HMD Praxis der Wirtschaftsinformatik
dc.subject	Big data analytics
dc.subject	Big Data Analytics
dc.subject	Classification
dc.subject	Decision trees
dc.subject	Entscheidungsbäume
dc.subject	IBM SPSS Modeler
dc.subject	Klassifikation
dc.subject	KNIME
dc.subject	RapidMiner
dc.subject	Self-service data mining
dc.subject	Self-Service Data Mining
dc.subject	Weka
dc.title	Kleine Barrieren für große Analysen – Eine Untersuchung der Eignung aktueller Plattformen für Self-Service Data Mining	de
dc.type	Text/Journal Article
gi.citation.endPage	1067
gi.citation.startPage	1053

Sammlungen

HMD 56(5) - Oktober 2019 - Big Data Analytics

Kleine Barrieren für große Analysen – Eine Untersuchung der Eignung aktueller Plattformen für Self-Service Data Mining

Dateien

Sammlungen