Konferenzbeitrag
Audiosignalverarbeitung für Videokonferenzsysteme
Lade...
Volltext URI
Dokumententyp
Text/Conference Paper
Dateien
Zusatzinformation
Datum
2013
Zeitschriftentitel
ISSN der Zeitschrift
Bandtitel
Verlag
Gesellschaft für Informatik e.V.
Zusammenfassung
Durch stetig steigende Datenraten sowohl mobiler als auch leitungsgebundener Internetzugänge haben sich die Rahmenbedingungen für Videokonferenzsysteme deutlich verbessert. Auf dieser Grundlage hat es sich das öffentlich geförderte Gemeinschaftsprojekt1 “Connected Visual Reality (CoVR) – Hochqualitative visuelle Kommunikation in heterogenen Netzwerken” zur Aufgabe gemacht, die Medienqualität durch die Integration neuartiger Algorithmen der Videound Audiosignalverarbeitung und -übertragung entscheidend zu verbessern. Zwei Teilaspekte des Systems aus dem Bereich der Audiosignalverarbeitung werden in diesem Beitrag vorgestellt: die künstliche Bandbreitenerweiterung und die Bestimmung der akustischen Sprecheraktivität. Bei der Bandbreitenerweiterung werden Sprecheradaption sowie die Extraktion von aussagekräftigen Signalmerkmalen in gestörter Umgebung behandelt. Die Bestimmung der Sprecheraktivität erfolgt mit einem neuartigen numerisch optimierten Beamforming-Algorithmus, dessen überlegene Leistungsfähigkeit im Vergleich mit dem MVDR-Beamformer durch ein Simulationsbeispiel illustriert wird. Mit diesen Audiosignalverarbeitungsverfahren ergeben sich neue Möglichkeiten für die Anwendung von Videokonferenzsystemen in unterschiedlichen Umgebungen sowie eine deutliche Verbesserung der wahrgenommenen Kommunikationsqualität, die durch ein entsprechendes Echtzeit-Demonstrationssystem erlebbar gemacht wird.