适用于智能显示设备的upHear语音质量增强技术
俄罗斯、中欧及东欧最大的银行Sberbank现推出SberPortal多功能智能显示器,它能够播放各种多媒体内容并支持视频通话。设备搭载的Salute虚拟助手可以识别触屏、手势以及语音指令。为了确保在用户发出指令或拨打电话时设备始终接收到最佳的语音质量,SberPortal集成了Fraunhofer upHear语音质量增强(VQE)技术。
Sberbank的开发团队和Fraunhofer IIS的upHear VQE团队共同设计了带有六个麦克风的几何阵列,根据设备需求定制并调整了upHear VQE算法。该技术可以优化麦克风阵列,并在VoIP和语音助手两种模式下收集的语音信号,将其传递给Salute,并以最佳的语音质量实现远场语音通话。
在VoIP模式下,Fraunhofer upHear VQE的全双工VoIP功能保证了用户以最佳音质进行语音通话。该功能通过消除回声、混响和噪声,同时确保响度始终一致来实现的。无论用户是靠近还是远离显示器,语音通话效果始终保持最佳。
在语音助手模式下,upHear VQE有效消除了干扰声和自身播放时所引起的回声,并可实现语音插入。该技术使Salute助手能够准确听到房间内任何地方发出的语音命令,即使智能扬声器在播放音乐,关键字搜寻器和语音识别器也能收到干净的音频信号。
关于Fraunhofer upHear语音质量增强
Fraunhofer upHear VQE用于处理麦克风信号,使通信设备实现全频带远场全双工对话,还令智能助手设备在音频播放时可进行远场语音命令和语音插入,且始终保持出色的音频质量。这是通过结合先进的多通道声学回声消除、声源定位、降噪、去混响、自动增益控制和波束赋形等方法来实现的。该技术适用于多种应用场景,包括移动、智能助手设备和会议解决方案的语音指令识别。upHear VQE的灵活性使其可以应用于不同设备内置的各种麦克风阵列中,例如智能扬声器、条形音箱、相机和电视等。同时,它还可以满足不同计算资源的要求。upHear VQE针对单声道、立体声、环绕声甚至沉浸声的音频设备进行了优化。
Header image © SberDevices