Auflistung nach Schlagwort "Trainingsdaten"
1 - 3 von 3
Treffer pro Seite
Sortieroptionen
- KonferenzbeitragBeobachtungen und Einsichten zu Repositorys von BPMN-Modellen(Modellierung 2024, 2024) Laue, Ralf; Läuter, MartinBei der empirischen Untersuchung der Praxis der Geschäftsprozessmodellierung ist man auf eine umfangreiche, vielfältige und gleichzeitig zur Aufgabenstellung passende Datenbasis angewiesen. Wir untersuchen eine Reihe öffentlich zugänglicher Modellrepositorys mit BPMN-Modellen, die in den vergangenen Jahren entstanden sind. Wir weisen auf Eigenarten der Repositorys hin, die die Verarbeitung der Daten erschweren und die Datenqualität beeinträchtigen. Besonders diskutiert wird das in bisherigen Arbeiten nicht betrachtete Phänomen von de facto inhaltsgleichen Modellen in bei bitweisem Vergleich verschiedenen Dateien. Wir diskutieren die Auswirkung solcher Duplikate und schlagen eine der jeweiligen Aufgabenstellung angepasste Filterung vor. Wir begründen, warum dieses Vorgehen insbesondere bei Ansätzen zum maschinellen Lernen beachtet werden sollte. Wir stellen fest, dass die empfohlenen Maßnahmen zur Sicherung der Datenqualität in aktuellen Veröffentlichungen häufig noch nicht beachtet werden, was die Aussagekraft von deren Ergebnissen in Frage stellen kann.
- KonferenzbeitragErfahrungsbericht: Die Bedeutung von Requirements Engineering für KI-Projekte(Softwaretechnik-Trends Band 42, Heft 1, 2022) Herrmann, AndreaAnforderungen und Requirements Engineering ist für alle technischen Projekte wichtig und genau genommen auch für nichttechnische Projekte. Darum sollte man erwarten, dass sie auch dann wichtig sind, wenn eine Software des Typs Künstliche Intelligenz (KI) entwickelt wird. Aber ist eventuell irgendetwas anders, überflüssig, zusätzlich nötig? Aus vier meiner bisherigen KI-Projekte lässt sich herleiten: Anforderungen an KI-Systeme sollen umfassen: funktionale Anforderungen, v.a. Nutzer und Use Cases, Anforderungen an Qualität wie Präzision, Recall, Zeitbedarf, Speicherplatz und – neu – Anforderungen an die Trainingsdaten.
- ZeitschriftenartikelQUALM: Ganzheitliche Messung und Verbesserung der Datenqualität in der Textanalyse(Datenbank-Spektrum: Vol. 19, No. 2, 2019) Kiefer, Cornelia; Reimann, Peter; Mitschang, BernhardBestehende Ansätze zur Messung und Verbesserung der Qualität von Textdaten in der Textanalyse bringen drei große Nachteile mit sich. Evaluationsmetriken wie zum Beispiel Accuracy messen die Qualität zwar verlässlich, sie (1) sind jedoch auf aufwändig händisch zu erstellende Goldannotationen angewiesen und (2) geben keine Ansatzpunkte für die Verbesserung der Qualität. Erste domänenspezifische Datenqualitätsmethoden für unstrukturierte Textdaten kommen zwar ohne Goldannotationen aus und geben Ansatzpunkte zur Verbesserung der Datenqualität. Diese Methoden wurden jedoch nur für begrenzte Anwendungsgebiete entwickelt und (3) berücksichtigen deshalb nicht die Spezifika vieler Analysetools in Textanalyseprozessen. In dieser Arbeit präsentieren wir hierzu das QUALM-Konzept zum qual itativ hochwertigen M ining von Textdaten (QUALity Mining), das die drei o.g. Nachteile adressiert. Das Ziel von QUALM ist es, die Qualität der Analyseergebnisse, z. B. bzgl. der Accuracy einer Textklassifikation, auf Basis einer Messung und Verbesserung der Datenqualität zu erhöhen. QUALM bietet hierzu eine Menge an QUALM-Datenqualitätsmethoden. QUALM- Indikatoren erfassen die Datenqualität ganzheitlich auf Basis der Passung zwischen den Eingabedaten und den Spezifika der Analysetools, wie den verwendeten Features, Trainingsdaten und semantischen Ressourcen (wie zum Beispiel Wörterbüchern oder Taxonomien). Zu jedem Indikator gehört ein passender Modifikator , mit dem sowohl die Daten als auch die Spezifika der Analysetools verändert werden können, um die Datenqualität zu erhöhen. In einer ersten Evaluation von QUALM zeigen wir für konkrete Analysetools und Datensätze, dass die Anwendung der QUALM-Datenqualitätsmethoden auch mit einer Erhöhung der Qualität der Analyseergebnisse im Sinne der Evaluationsmetrik Accuracy einhergeht. Die Passung zwischen Eingabedaten und Spezifika der Analysetools wird hierzu mit konkreten QUALM-Modifikatoren erhöht, die zum Beispiel Abkürzungen auflösen oder automatisch auf Basis von Textähnlichkeitsmetriken passende Trainingsdaten vorschlagen.