Konzeption und Erprobung eines Webcrawlers zur Erstellung hierarchischer Indizes
dc.contributor.author | Haimerl, Mathias | |
dc.date.accessioned | 2019-09-05T01:05:24Z | |
dc.date.available | 2019-09-05T01:05:24Z | |
dc.date.issued | 2019 | |
dc.description.abstract | Das Durchsuchen von Webseiten, wie es u.A. von modernen Topical Crawlers betrieben wird, ist technisch äußerst aufwändig, da der Fokus auf Extraktion und Korrelation sämtlicher Informationen einer Webseite liegt. Für die Markierung und computergestützte Erklärung komplexer Ausdrücke in Texten müssen diese zuvor identifiziert und indiziert werden. Um eine Webseite auf Basis eines bestehenden Grundindex zu durchsuchen und einen für die Einzelseite spezifischen Subindex zu erstellen, muss ein alternatives Konzept des Crawlings verfolgt werden, um dieses Verfahren effizient und zielgerichtet nutzen zu können. Anschließend wird die Implementierung des Crawlers skizziert und Testläufe an verschiedenartigen Webseiten getestet. Abschließend wird das erstellte Programm im Vergleich zu Topical Crawlers und der potentiellen Einsetzbarkeit im angedachten Einsatzzweck betrachtet. | de |
dc.identifier.doi | 10.18420/muc2019-ws-550 | |
dc.identifier.uri | https://dl.gi.de/handle/20.500.12116/25196 | |
dc.language.iso | de | |
dc.publisher | Gesellschaft für Informatik e.V. | |
dc.relation.ispartof | Mensch und Computer 2019 - Workshopband | |
dc.relation.ispartofseries | Mensch und Computer | |
dc.subject | Webcrawler | |
dc.subject | Barrierefreiheit | |
dc.subject | Ordiphrase | |
dc.title | Konzeption und Erprobung eines Webcrawlers zur Erstellung hierarchischer Indizes | de |
dc.type | Text/Workshop Paper | |
gi.citation.publisherPlace | Bonn | |
gi.conference.date | 8.-11. September 2019 | |
gi.conference.location | Hamburg | |
gi.conference.sessiontitle | MCI-WS01: Teilhabe an der allgegenwärtigen Kommunikation | |
gi.document.quality | digidoc |
Dateien
Originalbündel
1 - 1 von 1