Textdetektion und -extraktion mit gewichteter DCT und mehrwertiger Bildzerlegung

Heinich, Stephan

Konferenzbeitrag

Textdetektion und -extraktion mit gewichteter DCT und mehrwertiger Bildzerlegung

Dokumententyp

Text/Conference Paper

Datum

2009

Autor:innen

Heinich, Stephan

Quelle

Workshop Audiovisuelle Medien WAM 2009

Multimedia Analysis and Retrieval

Zusammenfassung

In diesem Artikel beschreibe ich die Arbeit an einer Textdetektion in Videos als Vorbereitung für die folgende Texterkennung. Ich benutze das Archiv der lokalen Fernsehsender als Grundlage. Der Inhalt kann meist als Nachrichtensendung kategorisiert werden. Als erstes werden mit einer einfachen aber schnellen Heuristik Textkandidaten selektiert. Die folgenden Schritte verarbeiten und bereiten den Kandidaten vor, damit er mit einer Standard-OCR-API (optical character recognition) verarbeitet werden kann. Der erste Teil der Textverarbeitung ist die Detektion. Dies geschieht zum einen mit einer gewichteten DCT und zum anderen mit einem Verfahren zur mehrwertigen Bildzerlegung. Anschließend werden die Bilder mit verschiedenen Schwellwertverfahren für eine Texterkennung vorbereitet. Im letzten Schritt verarbeitet eine freie OCR-API die aufbereiteten Frames.

Heinich, Stephan (2009): Textdetektion und -extraktion mit gewichteter DCT und mehrwertiger Bildzerlegung. Workshop Audiovisuelle Medien WAM 2009. PISSN: 0947-5125. ISBN: 9-78300-278587. pp. 151-162. Multimedia Analysis and Retrieval

Schlagwörter

Diskrete Cosinus-Transformation , gewichtete DCT Koeffizienten , Textdetektion , Texterkennung

Sammlungen

WAM 2009

Komplettanzeige

Textdetektion und -extraktion mit gewichteter DCT und mehrwertiger Bildzerlegung

Volltext URI

Dokumententyp

Zusatzinformation

Datum

Autor:innen

Zeitschriftentitel

ISSN der Zeitschrift

Bandtitel

Quelle

Verlag

Zusammenfassung

Beschreibung

Schlagwörter

Zitierform

DOI

Tags

Sammlungen