upHear Voice Quality Enhancement für Smart Display
Sberbank, die größte Bank Russlands sowie Mittel- und Osteuropas, hat mit SberPortal ein multifunktionales Smart Display auf den Markt gebracht, das eine Vielzahl von Multimedia-Inhalten sowie Videoanrufe unterstützt. Das Gerät mit virtuellen Assistenten aus der neuartigen „Salute“-Familie lässt sich über Berührung, Gesten und natürlich Sprachbefehle steuern. Damit das SberPortal Nutzerbefehle und Anrufe stets in bester Sprachqualität abwickeln kann, wurde das Gerät mit der Fraunhofer upHear Voice Quality Enhancement (VQE)-Technologie ausgestattet.
Die Entwickler von Sberbank und das upHear-VQE-Team des Fraunhofer IIS entwarfen gemeinsam eine Array-Geometrie mit sechs Mikrofonen, die sie auf die Geräteanforderungen zuschnitten. Anschließend wurden die upHear-VQE-Algorithmen entsprechend angepasst. Durch Optimierung der Mikrofonsignale, die das Array in den Sprachassistenz- sowie VoIP-(Voice over IP-)Modi erfasst, stellt die flexible Technologie klare Sprachsignale für Salute zur Verfügung und ermöglicht Fernfeld-Sprachanrufe in bestmöglicher Sprachqualität.
Im VoIP-Modus gewährleistet die Vollduplex-VoIP-Funktionalität von Fraunhofer upHear VQE eine optimale Audioqualität bei Sprachanrufen. Dazu werden akustische Echos, Hall und Störgeräusche eliminiert und gleichzeitig wird sichergestellt, dass die wahrgenommene Lautstärke immer gleich bleibt – unabhängig von Änderungen in der Entfernung des Nutzers zum Smart Display.
Mit upHear VQE im Sprachassistenz-Modus können die Salute-Assistenten Sprachbefehle aus dem gesamten Raum klar verstehen. Die Fraunhofer-Technologie entfernt störende Geräusche für den Fernfeld-Betrieb und ermöglicht Barge-in. Dafür eliminiert sie akustische Echos, die bei der Klangwiedergabe durch das eigene Lautsprechersignal von SberPortal entstehen. So empfangen der Keyword-Spotter und das Spracherkennungsmodul immer ein klares Audiosignal – unabhängig davon, wo der Nutzer im Raum einen Sprachbefehl gibt oder ob Musik über den smarten Lautsprecher abgespielt wird.
Über Fraunhofer upHear Voice Quality Enhancement
Fraunhofer upHear VQE verarbeitet Mikrofonsignale und ermöglicht damit Fernfeld-Vollduplex-Gespräche in voller Audiobandbreite für Mobiltelefone sowie Fernfeld-Sprachbefehle und Barge-in während der Audiowiedergabe für „smarte“ Geräte – und das immer in hervorragender Audioqualität. Möglich wird dies durch die Kombination von mehrkanaliger akustischer Echokompensation, Quellenlokalisierung, Rauschunterdrückung, Enthallung, automatischer Verstärkungsregelung und Beamforming. Die vollintegrierte Technologie eignet sich für zahlreiche Anwendungen, darunter natürliches Sprachverstehen in Mobil- und Smart-Assistant-Geräten, sowie für Konferenzlösungen. upHear VQE kann flexibel mit einer Vielzahl von Mikrofonarray-Geometrien in Mobil- und Smart-Assistant-Geräten wie smarten Lautsprechern, Soundbars, Kameras und Fernsehern verwendet und zudem für die Anforderungen an die Rechenkapazität konfiguriert werden. upHear VQE ist optimiert für Geräte mit Mono- und Stereo- sowie Surround- und sogar immersiver Audiowiedergabe.
Titelbild © SberDevices