Ein holistischer Ansatz für Pool-basiertes Aktives Lernen

Kottke, DanielHölldobler, Steffen2022-12-022022-12-022022978-3-88579-980-1https://dl.gi.de/handle/20.500.12116/39834Effizientes Labeling von Daten ist ein wichtiges Forschungsthema im maschinellen Ler- nen, da Klassifikatoren eine repräsentative Menge von gelabelten Daten benötigen um eine hohe Qualität zu erreichen. Während ungelabelte Daten leicht gesammelt werden können, ist das Labeln mühsam, zeitaufwendig oder teuer. Im sogenannten Aktiven Lernen werden Methoden entwickelt um den Aufwand des Annotationsprozesses auf ein Minimum zu reduzieren, indem nur der Teil an Daten ausgewählt wird, der den Lernfortschritt des Klassifikators vorantreibt. Diese Dissertation [Ko21a] stellt Probabilistisches Aktives Lernen vor, einen holistischen, entscheidungstheoretischen Ansatz für Pool-basiertes Lernen, das die Optimierung für jedes Gütemaß und jeden Klassifikator ermöglicht. Die ganzheitliche mathematische Beschreibung ermöglicht es, theoretische Vergleiche zu existierenden Verfahren herzustellen. Die vorgestellte Methode wird auf 22 Datensätzen für sechs verschiedene Gütemaße, sowie mehreren Klassifikatoren und die Batch-Auswahl evaluiert.deEin holistischer Ansatz für Pool-basiertes Aktives LernenText/Conference Paper