Theobald, MartinSiersdorfer, StefanSizov, SergejSchubert, Sigrid E.Reusch, BerndJesse, Norbert2019-11-282019-11-2820023-88579-348-2https://dl.gi.de/handle/20.500.12116/30322Fokussierendes Crawling ist ein viel versprechender Ansatz zur Verbesserung der Ausbeute einer Expertensuche über einem spezifischen Themenbereich des Webs. Dieses Verfahren beinhaltet die automatische Klassifikation von Dokumenten in eine benutzerspezifische Hierarchie von Themen, die wir auch als Ontologie bezeichnen. Die Qualität der Trainingsdaten des Klassifikators ist der kritischste Punkt für die Effektivität eines fokussierenden Crawlers. Der BINGO!-Ansatz versucht die Grenzen einer Trainingsbasis mit nur wenigen intellektuell kategorisierten Dokumenten zu überwinden und in einer automatisierten Wachstumsphase selbständig eine breite Trainingsbasis durch die Identifikation themenspezifischer "Archetypen" zu generieren. Die anschließende Erntephase vervollständigt dann die Ontologie nach iterativem Neutrainieren des Klassifikators mit einer verbesserten Ausbeute und Präzision.deBINGO! Ein thematisch fokussierender Crawler zur Generierung personalisierter OntologienText/Conference Paper1617-5468