Auflistung nach Autor:in "Sizov, Sergej"
1 - 4 von 4
Treffer pro Seite
Sortieroptionen
- KonferenzbeitragBINGO! Ein thematisch fokussierender Crawler zur Generierung personalisierter Ontologien(Informatik bewegt: Informatik 2002 - 32. Jahrestagung der Gesellschaft für Informatik e.v. (GI), 2002) Theobald, Martin; Siersdorfer, Stefan; Sizov, SergejFokussierendes Crawling ist ein viel versprechender Ansatz zur Verbesserung der Ausbeute einer Expertensuche über einem spezifischen Themenbereich des Webs. Dieses Verfahren beinhaltet die automatische Klassifikation von Dokumenten in eine benutzerspezifische Hierarchie von Themen, die wir auch als Ontologie bezeichnen. Die Qualität der Trainingsdaten des Klassifikators ist der kritischste Punkt für die Effektivität eines fokussierenden Crawlers. Der BINGO!-Ansatz versucht die Grenzen einer Trainingsbasis mit nur wenigen intellektuell kategorisierten Dokumenten zu überwinden und in einer automatisierten Wachstumsphase selbständig eine breite Trainingsbasis durch die Identifikation themenspezifischer "Archetypen" zu generieren. Die anschließende Erntephase vervollständigt dann die Ontologie nach iterativem Neutrainieren des Klassifikators mit einer verbesserten Ausbeute und Präzision.
- ZeitschriftenartikelEventFolk – Automatische Erkennung von Ereignissen in Sozialen Medien(Datenbank-Spektrum: Vol. 10, No. 1, 2010) Sizov, Sergej; Ens, AndreasDie kontinuierlich steigende Popularität von Web 2.0 Plattformen hat ihren Ursprung in einfachen Mechanismen der Generierung und Beschreibung von Inhalten. Allerdings stellt das explosive Wachstum der sozialen Medien auch neue Herausforderungen hinsichtlich Navigation und Organisation von Suchergebnissen. Zu den interessantesten Ansätzen der Benutzerführung gehört die aspektorientierte Gliederung von relevanten Daten (Faceted Browsing). Die Erkennung von ‚vielversprechenden‘ Facetten gehört in diesem Zusammenhang zu den wichtigen Aufgaben der Medienanalyse im Web 2.0. Wir beschreiben die Methode zur automatischen Erkennung von ereignisorientierten Facetten in sozialen Medien, d.h. Gruppen von Inhalten und Annotationen, die signifikante gesellschaftliche Ereignisse reflektieren. Das Verfahren basiert auf der multimodalen Analyse von mehreren Aspekten der Inhalte: Annotationen, Zeitstempel, sowie Geodaten. Die resultierenden Bayesischen Modelle ermöglichen eine automatisierte Erkennung von ‚ungewöhnlichen‘ Inhaltsgruppen (z.B. Fotos mit spezifischen Annotationen), die sowohl zeitlich als auch räumlich eingegrenzt sind und insofern als Spuren von Ereignissen interpretiert werden können. Systematische Evaluationen mit realen Daten des Portals Flickr demonstrieren praktische Anwendbarkeit und hohe Genauigkeit unserer Analysemethode.
- KonferenzbeitragHIP: Intelligente Suche nach Fachinformationen für das Handwerk(INFORMATIK 2003 – Innovative Informatikanwendungen, Band 2, Beiträge der 33. Jahrestagung der Gesellschaft für Informatik e.V. (GI), 2003) Sizov, Sergej; Meier, Klaus; Weikum, GerhardAngesichts des exponentiell wachsenden Informationsangebots im World Wide Web hat sich die Suche nach relevanten Ressourcen und Datenquellen mit der Zeit zu einem eigenständigen Problem entwickelt. Allgemeine Web-Suchmaschinen verwenden für die Erstellung der Rangliste der Treffer Autoritätswerte, die durch Linkanalyseverfahren auf repräsentativen Web-Ausschnitten bestimmt werden (ggf. kombiniert mit textbasierter Dokument-Query Ähnlichkeit). Diese Vorgehensweise scheitert jedoch oft bei sehr spezifischen fachlichen Anfragen mit insgesamt kleinem Recall. Darüber hinaus bleiben zahlreiche 'Hidden Web' - Informationsquellen (z.B. die Datenbanken der Informationsportale) für konventionelle Crawler nicht zugänglich. Die Web-Suchmaschine des Projektes HIP (Handwerks-Informations-Portal), eines Kooperationsprojektes der Universität des Saarlandes, der saarländischen Handwerkskammer und der saarbrücker Hochschule für Technik und Wirtschaft) kombiniert die Vorteile eines fokussierten Crawlers mit automatischer Erweiterung der Trainingsbasis, eines Frameworks für automatisch erkannte, klassifizierte und als Web Services gekapselte 'Hidden Web'-Informationsquellen sowie einer Suchmaschine mit erweiterten Ranking-Möglichkeiten für Web-Expertensuche. Dieses Papier beschreibt die Architektur des HIP-Frameworks, einzelne Komponenten des Suchsystems sowie die ersten Ergebnisse der Evaluation des Prototyps.
- KonferenzbeitragKonstruktion von Featureräumen und Metaverfahren zur Klassifikation von Webdokumenten(BTW 2003 – Datenbanksysteme für Business, Technologie und Web, Tagungsband der 10. BTW Konferenz, 2003) Siersdorfer, Stefan; Sizov, SergejDieses Papier befasst sich mit der automatischen Klassifikation von Webdokumenten in eine vorgegebene Taxonomie. Wir betrachten dabei vektorbasierte Verfahren des maschinellen Lernens am Beispiel von SVM (Support Vector Machines). In diesem Papier beschreiben wir Möglichkeiten zur Generierung von Featurevektoren unter Berücksichtigung der Besonderheiten von Webdokumenten für solche Verfahren. Weiterhin untersuchen wir die Berechnung von Metaresultaten aus den partiellen Klassifikationsergebnissen.