Autor*innen mit den meisten Dokumenten
Neueste Veröffentlichungen
- ZeitschriftenartikelWeb + Data Mining = Web Mining(HMD Praxis der Wirtschaftsinformatik: Vol. 46, No. 4, 2009) Stoffel, KilianDieser Beitrag gibt eine kurze Beschreibung, was unter dem Begriff Web Mining zu verstehen ist und wie Webdaten mit gängigen Data-Mining-Techniken kombiniert werden können, um das Web besser als Informationsquelle nutzbar zu machen. Des Weiteren wird ein Überblick über die gängigen Hauptachsen gegeben, entlang derer die meisten aktuellen Entwicklungen stattfinden. Diese Ausführungen werden mit einem Ausblick auf mögliche zukünftige Entwicklungen abgeschlossen, die vor allem durch die neusten Trends in der Benutzung des World Wide Web vorgezeichnet sind.
- ZeitschriftenartikelVorschau(HMD Praxis der Wirtschaftsinformatik: Vol. 46, No. 4, 2009) Lassnig, Markus; Reich, Siegfried; Hengartner, Urs; Meier, Andreas; Hildebrand, Knut; Meinhardt, Stefan; Hofmann, Josephine; Gómez, Jorge Marx; Strahringer, Susanne; Teuteberg, Frank; Fröschle, Hans-Peter; Reinheimer, Stefan; Rehrl, Karl
- ZeitschriftenartikelKostensensitive Klassifikation mit Random Forest(HMD Praxis der Wirtschaftsinformatik: Vol. 46, No. 4, 2009) Lessmann, Stefan; Schüller, Sebastian; Voβ, StefanEntscheidungsbaumverfahren repräsentieren einen etablierten Ansatz zur Erstellung von Klassifikationsmodellen, mit deren Hilfe verschiedene Planungs- und Entscheidungsprobleme unterstützt werden können. In der Literaturfinden sich zahlreiche Vorschläge für erweiterte Entscheidungsbaumverfahren, wobei der sogenannte Random-Forest-Algorithmus als besonders leistungsfähig angesehen werden kann. Ein konstituierendes Merkmal betrieblicher Klassifikationsprobleme besteht allerdings darin, dass fehlerhafte Prognosen mit unterschiedlichen Kosten assoziiert sind. Deswegen soll die Eignung von Random Forest zur kostensensitiven Klassifikation in dem vorliegenden Beitrag genauer untersucht werden. In diesem Rahmen wird der Grenznutzen algorithmischer Modifikationen gegenüber dem ursprünglichen Entscheidungsbaumprinzip erhoben, um die Effizienz einer konkreten Erweiterung kritisch zu beleuchten. Der Untersuchungsansatz soll damit auch allgemeine Hinweise geben, wie der zu erwartende Nutzen aus einer Implementierung von erweiterten Entscheidungsbaumverfahren geeignet quantifiziert werden kann.
- ZeitschriftenartikelNotizen(HMD Praxis der Wirtschaftsinformatik: Vol. 46, No. 4, 2009) Meier, Andreas; Knoll, Matthias
- ZeitschriftenartikelData Mining — Daten suchen und finden?(HMD Praxis der Wirtschaftsinformatik: Vol. 46, No. 4, 2009) Berthold, Michael R.
- ZeitschriftenartikelWebarchivierung und Web Archive Mining: Notwendigkeit, Probleme und Lösungsansätze(HMD Praxis der Wirtschaftsinformatik: Vol. 46, No. 4, 2009) Rauber, Andreas; Kaiser, MaxIn den letzten Jahren haben Bibliotheken und Archive zunehmend die Aufgabe übernommen, neben konventionellen Publikationen auch Inhalte aus dem World Wide Web zu sammeln, um so diesen wertvollen Teil unseres kulturellen Erbes zu bewahren und wichtige Informationen langfristig verfügbar zu halten. Diese massiven Datensammlungen bieten faszinierende Möglichkeiten, rasch Zugriff auf wichtige Informationen zu bekommen, die im Live-Web bereits verloren gegangen sind. Sie sind eine unentbehrliche Quelle für Wissenschaftler, die in der Zukunft die gesellschaftliche und technologische Entwicklung unserer Zeit nachvollziehen wollen.Auf der anderen Seite stellt eine derartige Datensammlung aber einen völlig neuen Datenbestand dar, der nicht nur rechtliche, sondern auch zahlreiche ethische Fragen betreffend seine Nutzung aufwirft. Diese werden in dem Ausmaβ zunehmen, in dem die technischen Möglichkeiten zur automatischen Analyse und Interpretation dieser Daten leistungsfähiger werden. Da sich die meisten Webarchivierungsinitiativen dieser Problematik bewusst sind, bleibt die Nutzung der Daten derzeit meist stark eingeschränkt, oder es wird eine Art von »Opt-Out«-Möglichkeit vorgesehen, wodurch Webseiteninhaber die Auf nahme ihrer Seiten in ein Webarchiv ausschlieβen können. Mit beiden Ansätzen können Webarchive ihr volles Nutzungspotenzial nicht ausschöpfen.Dieser Artikel beschreibt einleitend kurz die Technologien, die zur Sammlung von Webinhalten zu Archivierungszwecken verwendet werden. Er hinterfragt Annahmen, die die freie Verfügbarkeit der Daten und unterschiedliche Nutzungsarten betreffen. Darauf aufbauend identifiziert er eine Reihe von offenen Fragen, deren Lösung einen breiteren Zugriff und bessere Nutzung von Webarchiven erlauben könnte.
- ZeitschriftenartikelTechnologieentwicklung: Theoretische und praktische Unterstützung mit Data Mining(HMD Praxis der Wirtschaftsinformatik: Vol. 46, No. 4, 2009) Bügel, Ulrich; Knaf, Hagen; Laufs, UweDurch den zunehmenden globalen Wettbewerb kommt der Entwicklung neuer Technologien und deren Einsatz in innovativen Produkten immer gröβere Bedeutung zu. Zur Unterstützung der Technologieentwicklung wird in der Innovationsforschung häufig der Ansatz verfolgt, Begleitprozesse zu systematisieren und zu optimieren. Aufgrund der damit verbundenen Wissensintensität kann dies jedoch nicht zielführend ohne IT-Unterstützung erfolgen. In einem Präsidialprojekt der Fraunhofer-Gesellschaft wurde hierzu der Ansatz der Nutzung mathematischer Verfahren sowie moderner IT-Technologien verfolgt. Zur Datenbeschaffung und - aufbereitung liegt der Fokus insbesondere auf Verfahren zur Verarbeitung von Texten in natürlicher Sprache, dem Einsatz statistischer Methoden des Data und Text Mining zur automatischen Klassifikation und zum Clustering von Dokumenten sowie der Extraktion formalen Wissens aus unterschiedlichsten Quellen und dessen Repräsentation auf Basis von Ontologien mit Methoden aus dem Bereich des Semantic Web. Diese Verfahren erlauben die praktische Realisierung von Indikatoren für die quantitative Beschreibung der Technologieentwicklung und ermöglichen den Einsatz von Vergleichsmethoden zur Entscheidungsunterstützung. Der integrierte Unterstützungsansatz wird detailliert beschrieben und anhand eines Technologieentwicklungsszenarios veranschaulicht.
- ZeitschriftenartikelCartoon(HMD Praxis der Wirtschaftsinformatik: Vol. 46, No. 4, 2009)
- ZeitschriftenartikelGlossar* zu Web & Data Mining(HMD Praxis der Wirtschaftsinformatik: Vol. 46, No. 4, 2009)
- ZeitschriftenartikelUnscharfe Klassifikation von Webkennzahlen(HMD Praxis der Wirtschaftsinformatik: Vol. 46, No. 4, 2009) Zumstein, Darius; Hugi, PatrikDas Customer Relationship Management braucht Methoden und Kennzahlen, um Website-Besucher und Onlinekunden sowie deren Wert für das eBusiness zu klassifizieren und zu bewerten.In der Praxis weitverbreitete Kundenbewer-tungs- und Segmentierungsmethoden sind Scoring-Modelle. Ein Problem solcher Heuristiken besteht darin, dass Kundenstrategien anhand von trennscharfen Klassen und Scores definiert werden. Aufgrund scharfer Klassen können Klassifikationsfehler auftreten, Kunden falsch bewertet und das Marketingbudget bei der Kundenansprache oder beim Kundenmanagement suboptimal eingesetzt werden.Dieser Beitrag schlägt eine unscharfe Scoring-Methode vor, konkret ein unscharfes eRFM-Modell. Die Werte der Variablen Recency, Frequency und Monetary Value sind einfach zu erfassen und dank der unscharfen Klassifikation genauer zu segmentieren als bei trennscharfer Klassifikation.Dies wird anhand einer Simulation und einer Fallstudie eines Unternehmens im Online-Detailhandel gezeigt.