Konferenzbeitrag
Detektion stimmhafter Sprachabschnitte zur robusten Spracherkennung
Lade...
Volltext URI
Dokumententyp
Text/Conference Paper
Dateien
Zusatzinformation
Datum
2013
Autor:innen
Zeitschriftentitel
ISSN der Zeitschrift
Bandtitel
Verlag
Gesellschaft für Informatik e.V.
Zusammenfassung
Es wird das Konzept eines neuen Ansatzes zur robusten Erkennung gestörter Sprachsignale vorgestellt. Der Ansatz beruht auf der Beobachtung der zwischenmenschlichen Kommunikation in einer gestörten Umgebung, bei der ein Zuhörer häufig nur noch die Abschnitte der Sprache mit einem genügend hohen Pegel wahrnimmt. Aus dieser Beobachtung wird als erster Verarbeitungsschritt des zu konzeptionierenden Verfahrens eine Detektion stimmhafter Abschnitte mit hohem Sprachpegel abgeleitet. Ausgehend von diesen Abschnitten soll dann eine modifizierte Berechnung der Wahrscheinlichkeiten für das Auftreten der beobachteten akustischen Merkmale vorgenommen werden, die in den bisherigen Verfahren in der Regel an den zeitlichen Signalverlauf gekoppelt ist. Abweichend davon soll die Berechnung in diesem Verfahren mit den Merkmalen der stimmhaften Abschnitte beginnen und zeitlich vorwärts und rückwärts gerichtet bis zu den vorausgehenden oder nachfolgenden stimmhaften Abschnitten fortgesetzt werden. In dieser Veröffentlichung werden die ersten Untersuchungen zur Detektion der stimmhaften Abschnitte vorgestellt, wobei insbesondere drei Parameter auf ihre Verwendbarkeit hin untersucht werden. Es werden der zeitliche Verlauf der Kurzzeitenergie, eines Maßes, das die Stimmhaftigkeit charakterisiert, und eines Maßes, das die Wahrscheinlichkeit eines stimmhaften Lautes beschreibt, betrachtet. Erste Detektionsergebnisse für die Sprachsignale der Timit Datensammlung werden präsentiert.