Sprechererkennungssystem auf Basis der Vektorquantisierung mit Störgeräuschfilterung
dc.contributor.author | Heinich, Stephan | de_DE |
dc.date.accessioned | 2017-11-14T13:52:24Z | |
dc.date.available | 2017-11-14T13:52:24Z | |
dc.date.issued | 2009 | |
dc.description.abstract | In diesem Artikel beschreibe ich die bisherige Arbeit an einen Sprechererkennungssystem. Es wurde Wert auf eine Signalvorverarbeitung gelegt, die überflüssige Anteile aus dem Signal filtert. So werden Hintergrundrauschen und Musik sowie stimmlose Laute gefiltert. Das Sprechererkennungssystem benutzt eine auf dem Mel-Frequenzspektrum basierende Cepstralanalyse als Merkmalsextraktion. Als Erkenner wird die Vektorquantisierung herangezogen. Der SYSDATAAlgorithmus, basierend auf dem k-Means, trainiert den Datensatz. Es ist durch die Filterung möglich stimmhafte Laute von allen anderen zu trennen. Diese Tatsache macht das entstandene Sprechererkennungssystem sehr robust. | de_DE |
dc.identifier.isbn | 9-78300-278587 | de_DE |
dc.identifier.pissn | 0947-5125 | de_DE |
dc.identifier.uri | https://dl.gi.de/handle/20.500.12116/4979 | |
dc.language.iso | de_DE | de_DE |
dc.relation.ispartof | Workshop Audiovisuelle Medien WAM 2009 | de_DE |
dc.subject | Sprechererkennung | de_DE |
dc.subject | SYSDATA | de_DE |
dc.subject | Vektorquantisierung | de_DE |
dc.subject | ASR | de_DE |
dc.subject | Fouriertransformation | de_DE |
dc.title | Sprechererkennungssystem auf Basis der Vektorquantisierung mit Störgeräuschfilterung | de_DE |
dc.type | Text/Conference Paper | de_DE |
gi.citation.endPage | 174 | |
gi.citation.publisherPlace | Chemnitz | de_DE |
gi.citation.startPage | 163 | de_DE |
gi.conference.sessiontitle | Multimedia Analysis and Retrieval | en |
gi.document.quality | digidoc | en |