Logo des Repositoriums
 

Detektion stimmhafter Sprachabschnitte zur robusten Spracherkennung

dc.contributor.authorHirsch, Hans-Günter
dc.contributor.authorKitzig, Andreas
dc.contributor.authorKremer, Frank
dc.contributor.editorHorbach, Matthias
dc.date.accessioned2019-03-07T09:32:25Z
dc.date.available2019-03-07T09:32:25Z
dc.date.issued2013
dc.description.abstractEs wird das Konzept eines neuen Ansatzes zur robusten Erkennung gestörter Sprachsignale vorgestellt. Der Ansatz beruht auf der Beobachtung der zwischenmenschlichen Kommunikation in einer gestörten Umgebung, bei der ein Zuhörer häufig nur noch die Abschnitte der Sprache mit einem genügend hohen Pegel wahrnimmt. Aus dieser Beobachtung wird als erster Verarbeitungsschritt des zu konzeptionierenden Verfahrens eine Detektion stimmhafter Abschnitte mit hohem Sprachpegel abgeleitet. Ausgehend von diesen Abschnitten soll dann eine modifizierte Berechnung der Wahrscheinlichkeiten für das Auftreten der beobachteten akustischen Merkmale vorgenommen werden, die in den bisherigen Verfahren in der Regel an den zeitlichen Signalverlauf gekoppelt ist. Abweichend davon soll die Berechnung in diesem Verfahren mit den Merkmalen der stimmhaften Abschnitte beginnen und zeitlich vorwärts und rückwärts gerichtet bis zu den vorausgehenden oder nachfolgenden stimmhaften Abschnitten fortgesetzt werden. In dieser Veröffentlichung werden die ersten Untersuchungen zur Detektion der stimmhaften Abschnitte vorgestellt, wobei insbesondere drei Parameter auf ihre Verwendbarkeit hin untersucht werden. Es werden der zeitliche Verlauf der Kurzzeitenergie, eines Maßes, das die Stimmhaftigkeit charakterisiert, und eines Maßes, das die Wahrscheinlichkeit eines stimmhaften Lautes beschreibt, betrachtet. Erste Detektionsergebnisse für die Sprachsignale der Timit Datensammlung werden präsentiert.de
dc.identifier.isbn978-3-88579-614-5
dc.identifier.pissn1617-5468
dc.identifier.urihttps://dl.gi.de/handle/20.500.12116/20706
dc.language.isode
dc.publisherGesellschaft für Informatik e.V.
dc.relation.ispartofINFORMATIK 2013 – Informatik angepasst an Mensch, Organisation und Umwelt
dc.relation.ispartofseriesLecture Notes in Informatics (LNI) - Proceedings, Volume P-220
dc.titleDetektion stimmhafter Sprachabschnitte zur robusten Spracherkennungde
dc.typeText/Conference Paper
gi.citation.endPage2916
gi.citation.publisherPlaceBonn
gi.citation.startPage2902
gi.conference.date16.-20. September 2013
gi.conference.locationKoblenz
gi.conference.sessiontitleRegular Research Papers

Dateien

Originalbündel
1 - 1 von 1
Lade...
Vorschaubild
Name:
2902.pdf
Größe:
311.4 KB
Format:
Adobe Portable Document Format