Show simple item record

dc.contributor.authorBryan, Maximilian
dc.contributor.authorHodel, Tobias
dc.contributor.authorPhilipp, Nathanael
dc.contributor.editorBurghardt, Manuel
dc.contributor.editorMüller-Birn, Claudia
dc.date.accessioned2018-09-11T12:29:54Z
dc.date.available2018-09-11T12:29:54Z
dc.date.issued2018
dc.identifier.urihttp://dl.gi.de/handle/20.500.12116/16992
dc.description.abstractZum Trainieren maschineller Lernverfahren zur Erkennung von Handschriften werden Textdaten mit korrespondierenden Bildern benötigt. Die Textdaten liegen häufig im TEI-Format das diverse Möglichkeiten eröffnet, um textuelle und semantische Phänomene auszuzeichnen, weiter können gar eigene Tags oder Auszeichnungsarten eingeführt werden. In diesem Beitrag wird ein im EU-Projekt READ entwickeltes parametrisierbares Tool beschrieben, das mit unterschiedlichen Auszeichnungsstilen in TEI umgehen kann und Textdateien auf Seitenbasis liefert, die zur Zuordnung von Text zu Bilddaten (text-to-image) genutzt werden können und somit zur Aufbereitung von Trainingsdaten für Modelle der Handschriftenerkennung dienen. Die gezeigten Beispiele und Anwendungen stammen alle aus Projekten, die ihre Daten für READ zur Verfügung stellten.de
dc.language.isode
dc.publisherGesellschaft für Informatik e.V.
dc.relation.ispartofINF-DH-2018
dc.subjectHTR
dc.subjectXML
dc.subjectTEI
dc.subjecttext2image
dc.titleGenerierung von Trainingsdaten für die Handschrifterkennung aus TEI annotierten Dokumenten – Ein Erfahrungsbericht aus dem EU-Projekt READde
dc.typeText/Workshop Paper
dc.pubPlaceBonn
mci.conference.sessiontitleGI-Workshop
mci.conference.locationBerlin, Germany
mci.conference.date25. September 2018
dc.identifier.doi10.18420/infdh2018-11


Files in this item

Thumbnail

Show simple item record