Logo des Repositoriums
 
Textdokument

Bisecting K-Prototypes: Effizientes hierarchisches Clustering gemischter Datensets

Lade...
Vorschaubild

Volltext URI

Dokumententyp

Zusatzinformation

Datum

2022

Autor:innen

Zeitschriftentitel

ISSN der Zeitschrift

Bandtitel

Verlag

Gesellschaft für Informatik, Bonn

Zusammenfassung

Dieses Paper stellt ein neuartiges effizientes hierarchisches Top-down-Clustering-Verfahren für gemischte Datensets vor: Bisecting K-Prototypes. Der Algorithmus ist speziell für die Verarbeitung komplexer (numerischer und kategorischer) Datensets mit vielen fehlende Werten geeignet. Dabei ist keine exzessive Vorverarbeitung des Datensets nötig. Zusätzlich werden Erweiterungen des Algorithmus vorgestellt, welche für die Verarbeitung von Multi-Select-und Freitext-Feldern (multi-kategorische und String-Attribute) geeignet sind. Der Algorithmus wurde implementiert und gegen ein entsprechend komplexes Datenset getestet und evaluiert.

Beschreibung

Dröse, Hannes (2022): Bisecting K-Prototypes: Effizientes hierarchisches Clustering gemischter Datensets. SKILL 2022. Gesellschaft für Informatik, Bonn. PISSN: 1614-3213. ISBN: 978-3-88579-752-4. pp. 127-138. Theoretische Informatik. Hamburg. 29.-30. September 2022

Zitierform

DOI

Tags