Konferenzbeitrag
Möglichkeiten und Grenzen von Textanalytics im eCommerce
Lade...
Volltext URI
Dokumententyp
Text/Conference Paper
Dateien
Datum
2017
Autor:innen
Zeitschriftentitel
ISSN der Zeitschrift
Bandtitel
Quelle
Datenbanksysteme für Business, Technologie und Web (BTW 2017)
Industrial Program - Data Lake
Verlag
Gesellschaft für Informatik, Bonn
Zusammenfassung
Die Synchronisation von Produktstammdaten ist eine zentrale Aufgabe im eCommerce, denn schließlich muss sichergestellt werden, dass wirklich die Variante des Artikels ausgeliefert wird, die ein Kunde bestellt hat. Schlüsselsysteme wie EAN/GTIN und UPC leisten dabei einen guten Beitrag, lösen das Problem in der Praxis aber bei weitem nicht vollständig, da viele Handelsgüter erst gar nicht mit herstellerunabhängigen Schlüsseln gekennzeichnet sind oder z.B. Packungsgrößen und Varianten zu häufig verwechselt werden. Die Abbildung von Produktstammdaten anhand der Artikelbezeichnungen ist daher eine Aufgabe für moderne Textanalyseverfahren an der Grenze von strukturierten und natürlichsprachlichen Ansätzen. Als Marktforschungsunternehmen setzt GfK solche Textanalyseverfahren ein, um unterschiedliche Artikelbezeichnungen für eine Produktvariante zu erkennen und für Marktberichte zu normieren.