Dröse, HannesGesellschaft für Informatik e.V.2023-02-212023-02-212022978-3-88579-752-4https://dl.gi.de/handle/20.500.12116/40232Dieses Paper stellt ein neuartiges effizientes hierarchisches Top-down-Clustering-Verfahren für gemischte Datensets vor: Bisecting K-Prototypes. Der Algorithmus ist speziell für die Verarbeitung komplexer (numerischer und kategorischer) Datensets mit vielen fehlende Werten geeignet. Dabei ist keine exzessive Vorverarbeitung des Datensets nötig. Zusätzlich werden Erweiterungen des Algorithmus vorgestellt, welche für die Verarbeitung von Multi-Select-und Freitext-Feldern (multi-kategorische und String-Attribute) geeignet sind. Der Algorithmus wurde implementiert und gegen ein entsprechend komplexes Datenset getestet und evaluiert.deClusteranalyseProduct-Information-Managementhierarchisches ClusteringBisecting K-MeansK-Prototypesgemischte Datensetsfehlende WerteBisecting K-Prototypes: Effizientes hierarchisches Clustering gemischter Datensets1614-3213