Auflistung nach Autor:in "Siersdorfer, Stefan"
1 - 2 von 2
Treffer pro Seite
Sortieroptionen
- KonferenzbeitragBINGO! Ein thematisch fokussierender Crawler zur Generierung personalisierter Ontologien(Informatik bewegt: Informatik 2002 - 32. Jahrestagung der Gesellschaft für Informatik e.v. (GI), 2002) Theobald, Martin; Siersdorfer, Stefan; Sizov, SergejFokussierendes Crawling ist ein viel versprechender Ansatz zur Verbesserung der Ausbeute einer Expertensuche über einem spezifischen Themenbereich des Webs. Dieses Verfahren beinhaltet die automatische Klassifikation von Dokumenten in eine benutzerspezifische Hierarchie von Themen, die wir auch als Ontologie bezeichnen. Die Qualität der Trainingsdaten des Klassifikators ist der kritischste Punkt für die Effektivität eines fokussierenden Crawlers. Der BINGO!-Ansatz versucht die Grenzen einer Trainingsbasis mit nur wenigen intellektuell kategorisierten Dokumenten zu überwinden und in einer automatisierten Wachstumsphase selbständig eine breite Trainingsbasis durch die Identifikation themenspezifischer "Archetypen" zu generieren. Die anschließende Erntephase vervollständigt dann die Ontologie nach iterativem Neutrainieren des Klassifikators mit einer verbesserten Ausbeute und Präzision.
- KonferenzbeitragKonstruktion von Featureräumen und Metaverfahren zur Klassifikation von Webdokumenten(BTW 2003 – Datenbanksysteme für Business, Technologie und Web, Tagungsband der 10. BTW Konferenz, 2003) Siersdorfer, Stefan; Sizov, SergejDieses Papier befasst sich mit der automatischen Klassifikation von Webdokumenten in eine vorgegebene Taxonomie. Wir betrachten dabei vektorbasierte Verfahren des maschinellen Lernens am Beispiel von SVM (Support Vector Machines). In diesem Papier beschreiben wir Möglichkeiten zur Generierung von Featurevektoren unter Berücksichtigung der Besonderheiten von Webdokumenten für solche Verfahren. Weiterhin untersuchen wir die Berechnung von Metaresultaten aus den partiellen Klassifikationsergebnissen.