Logo des Repositoriums
 

Konzeption und Erprobung eines Webcrawlers zur Erstellung hierarchischer Indizes

dc.contributor.authorHaimerl, Mathias
dc.date.accessioned2019-09-05T01:05:24Z
dc.date.available2019-09-05T01:05:24Z
dc.date.issued2019
dc.description.abstractDas Durchsuchen von Webseiten, wie es u.A. von modernen Topical Crawlers betrieben wird, ist technisch äußerst aufwändig, da der Fokus auf Extraktion und Korrelation sämtlicher Informationen einer Webseite liegt. Für die Markierung und computergestützte Erklärung komplexer Ausdrücke in Texten müssen diese zuvor identifiziert und indiziert werden. Um eine Webseite auf Basis eines bestehenden Grundindex zu durchsuchen und einen für die Einzelseite spezifischen Subindex zu erstellen, muss ein alternatives Konzept des Crawlings verfolgt werden, um dieses Verfahren effizient und zielgerichtet nutzen zu können. Anschließend wird die Implementierung des Crawlers skizziert und Testläufe an verschiedenartigen Webseiten getestet. Abschließend wird das erstellte Programm im Vergleich zu Topical Crawlers und der potentiellen Einsetzbarkeit im angedachten Einsatzzweck betrachtet.de
dc.identifier.doi10.18420/muc2019-ws-550
dc.identifier.urihttps://dl.gi.de/handle/20.500.12116/25196
dc.language.isode
dc.publisherGesellschaft für Informatik e.V.
dc.relation.ispartofMensch und Computer 2019 - Workshopband
dc.relation.ispartofseriesMensch und Computer
dc.subjectWebcrawler
dc.subjectBarrierefreiheit
dc.subjectOrdiphrase
dc.titleKonzeption und Erprobung eines Webcrawlers zur Erstellung hierarchischer Indizesde
dc.typeText/Workshop Paper
gi.citation.publisherPlaceBonn
gi.conference.date8.-11. September 2019
gi.conference.locationHamburg
gi.conference.sessiontitleMCI-WS01: Teilhabe an der allgegenwärtigen Kommunikation
gi.document.qualitydigidoc

Dateien

Originalbündel
1 - 1 von 1
Lade...
Vorschaubild
Name:
550.pdf
Größe:
1.1 MB
Format:
Adobe Portable Document Format