Logo des Repositoriums
 
Konferenzbeitrag

Detektion stimmhafter Sprachabschnitte zur robusten Spracherkennung

Lade...
Vorschaubild

Volltext URI

Dokumententyp

Text/Conference Paper

Zusatzinformation

Datum

2013

Zeitschriftentitel

ISSN der Zeitschrift

Bandtitel

Verlag

Gesellschaft für Informatik e.V.

Zusammenfassung

Es wird das Konzept eines neuen Ansatzes zur robusten Erkennung gestörter Sprachsignale vorgestellt. Der Ansatz beruht auf der Beobachtung der zwischenmenschlichen Kommunikation in einer gestörten Umgebung, bei der ein Zuhörer häufig nur noch die Abschnitte der Sprache mit einem genügend hohen Pegel wahrnimmt. Aus dieser Beobachtung wird als erster Verarbeitungsschritt des zu konzeptionierenden Verfahrens eine Detektion stimmhafter Abschnitte mit hohem Sprachpegel abgeleitet. Ausgehend von diesen Abschnitten soll dann eine modifizierte Berechnung der Wahrscheinlichkeiten für das Auftreten der beobachteten akustischen Merkmale vorgenommen werden, die in den bisherigen Verfahren in der Regel an den zeitlichen Signalverlauf gekoppelt ist. Abweichend davon soll die Berechnung in diesem Verfahren mit den Merkmalen der stimmhaften Abschnitte beginnen und zeitlich vorwärts und rückwärts gerichtet bis zu den vorausgehenden oder nachfolgenden stimmhaften Abschnitten fortgesetzt werden. In dieser Veröffentlichung werden die ersten Untersuchungen zur Detektion der stimmhaften Abschnitte vorgestellt, wobei insbesondere drei Parameter auf ihre Verwendbarkeit hin untersucht werden. Es werden der zeitliche Verlauf der Kurzzeitenergie, eines Maßes, das die Stimmhaftigkeit charakterisiert, und eines Maßes, das die Wahrscheinlichkeit eines stimmhaften Lautes beschreibt, betrachtet. Erste Detektionsergebnisse für die Sprachsignale der Timit Datensammlung werden präsentiert.

Beschreibung

Hirsch, Hans-Günter; Kitzig, Andreas; Kremer, Frank (2013): Detektion stimmhafter Sprachabschnitte zur robusten Spracherkennung. INFORMATIK 2013 – Informatik angepasst an Mensch, Organisation und Umwelt. Bonn: Gesellschaft für Informatik e.V.. PISSN: 1617-5468. ISBN: 978-3-88579-614-5. pp. 2902-2916. Regular Research Papers. Koblenz. 16.-20. September 2013

Schlagwörter

Zitierform

DOI

Tags