随着TWS(True wireless stereo)耳机市场的不断成长。用户对于产品体验的需求也从简单的快速链接,升级到更高的标准,譬如,截至今年市面上涌现了大量的以清晰通话为卖点的TWS耳机。
为了能够在非常嘈杂的环境中进行清晰的语音通信,是否能产生方案,将来自内耳和外部麦克风的信号结合起来,实现一种智能的、适应环境的子带混频器技术。事实上,一些国内外的算法公司均致力于此,并且取得一定的成效。
当然,很多方案公司现在有专门强调譬如edge AI(这算是一个)的通话降噪方案,但实际上更多是针对现有通话降噪方案的优化,所以这部分摘除,我们先看一些基础部分的介绍,也就是通话降噪具体能做什么。
总体来看,通话降噪依赖Uplink(上行)与Downlink(下行)同步进行。大致为Microphone Array/AEC/NS/EQ/AGC/DRC,先后的逻辑关系如下:
ADM(Adaptive Directional Microphone Array)自适应全指向型麦克风阵列
这是是一种数字信号处理技术,仅使用两个全向麦克风就可以创建一个方向或噪声消除麦克风。ADM自动改变其方向特性,在充分保持信号质量的同时,在各种环境下提供最佳的噪声衰减。该自适应过程速度快,频率选择性强,可以同时消除多个干扰。
ADM除了具有良好的定向特性外,其受风噪声的影响比传统的声学定向麦克风要ADM技术允许两种类型的麦克风配置:“端射”和“垂射”。
注:关于麦克风阵列的介绍我们之前有在系列文章中简单介绍过: 麦克风阵列波束成形与垂射阵列(一)
在端射配置中,信号源(用户的嘴)位于轴线上(连接两个麦克风的线)。在垂射配置中,它的目标是横轴的直线。
在端射配置中,ADM有两种操作方式;“far-talk”(远传)和“close-talk”(金传)。在远传模式下,ADM作为一个最优的方向麦克风,衰减来自后面和侧面的信号,同时保留前面的信号。在close-talk mode,ADM作为最好的降噪麦克风,有效地消除了远处的声音。相对自由的声学设计使得ADM成为手机的理想选择,它可以在远端扬声器和近端扬声器之间进行“软”切换。但是此类设计在耳机上时,特别是TWS耳机上,比较受到使用者佩戴正确与否的限制,类似与airpods,笔者观察了很多人在地铁里有“千奇百怪”的带法,有些是用户耳朵形状,有些是佩戴习惯,导致算法并不一定能在理想的情况下工作。
Acoustic Echo Canceller (AEC)
当双工(同时双向)通信中的一部分信号返回到源信号时,就称为“回声”。在长距离模拟和几乎所有的数字通信系统中,即使是很小的回波信号也会因为严重的往返延迟而造成干扰。
在语音通信终端中,由于扬声器和麦克风之间的声学耦合而产生声学回声。由于在通信信道中应用的非线性处理,如有损声码器和转码,声回波必须在设备内部进行局部处理(取消)。
Noise Suppressor (NS)
噪声抑制技术降低了单通道语音信号中的平稳和暂态噪声,提高了信噪比,提高了语音清晰度,降低了听力疲劳。
当然此部分就有很多具体的方法了,譬如BF (Beamforming),或者PF(Post filter后置滤波器)等调节方法。总体来说AEC,NS ,BF,PF算是通话降噪的核心部分,诚然每家算法方案商的优劣都不同。
Automatic Gain Control (AGC) and Dynamic Range Compressor (DRC)
在典型的语音通信系统中,由于用户和麦克风之间的距离不同,以及由于通信信道的特性,语音信号的电平可能在很大的范围内变化。
动态范围压缩(DRC)是均衡信号电平的最简单方法。压缩通过降低(压缩)强语音段而充分保留弱语音段来减小信号的动态范围。因此,整个信号可以额外放大,这样弱信号可以更好地听到。
AGC技术在语音信号较弱的情况下通过数字方式增加信号增益(放大),而在语音信号较强的情况下对其进行压缩。在嘈杂的地方,人们倾向于大声说话,这自动设置麦克风通道增益到一个小的值,从而减少周围的噪音,同时保持在最佳水平的兴趣的声音。另外,在一个安静的环境中,人们说话相对小,这样他们的声音就会被算法放大,而不会有太多的噪音。