Konferenzbeitrag
Ein holistischer Ansatz für Pool-basiertes Aktives Lernen
Lade...
Volltext URI
Dokumententyp
Text/Conference Paper
Zusatzinformation
Datum
2022
Autor:innen
Zeitschriftentitel
ISSN der Zeitschrift
Bandtitel
Quelle
Verlag
Köllen Druck + Verlag GmbH
Zusammenfassung
Effizientes Labeling von Daten ist ein wichtiges Forschungsthema im maschinellen Ler- nen, da Klassifikatoren eine repräsentative Menge von gelabelten Daten benötigen um eine hohe Qualität zu erreichen. Während ungelabelte Daten leicht gesammelt werden können, ist das Labeln mühsam, zeitaufwendig oder teuer. Im sogenannten Aktiven Lernen werden Methoden entwickelt um den Aufwand des Annotationsprozesses auf ein Minimum zu reduzieren, indem nur der Teil an Daten ausgewählt wird, der den Lernfortschritt des Klassifikators vorantreibt. Diese Dissertation [Ko21a] stellt Probabilistisches Aktives Lernen vor, einen holistischen, entscheidungstheoretischen Ansatz für Pool-basiertes Lernen, das die Optimierung für jedes Gütemaß und jeden Klassifikator ermöglicht. Die ganzheitliche mathematische Beschreibung ermöglicht es, theoretische Vergleiche zu existierenden Verfahren herzustellen. Die vorgestellte Methode wird auf 22 Datensätzen für sechs verschiedene Gütemaße, sowie mehreren Klassifikatoren und die Batch-Auswahl evaluiert.