应对语音交互变革，CEVA“软硬”兼施

语音是人类最自然而直接的交互方式，如今恰是从“自然”向“智能”时代跨越的过渡期。在智能语音时代，用户只需用说话的方式给服务终端发布命令，就能得到相应的服务。作为人工智能产业链上的关键一环，智能语音已在 Siri 等数字语音助手、智能家居、车载、可穿戴设备等域中开始落地。

未来，智能语音必将支持多用户体验。比如，不同家庭成员将拥有不同的操作权限，经认证的汽车拥有者借助语音指令，通过智能手表预启动汽车等。

除了语音识别，CEVA 公司战略营销总监 Moshe Sheier 认为语音的魅力不止于此：“我们认为语音识别还将够胜任更多工作，例如，未来语音识别系统将能够通过声音来辨认人(如果在系统中预先注册)，了解人们的情绪状态，而且无论不受周围环境影响而畅顺工作。这样语音识别系统才更人性化，能基于所处位置、喜好以及过往活动等来进判断操作。这需要对语音识别进行深度扩展——加入‘声音感测’，除了人声信息还可识别其它声音事件，比如家里的门铃声和玻璃破碎的声音，或者道路上紧急车辆的警笛。语音识别和声音感测的可渗透到生活的每个方面，手机和可穿戴产品的语音激活、智能家居控制、智慧城市安保(声音事件感测)，汽车、商业和财务等领域。”

CEVA 公司战略营销总监 Moshe Sheier

“软硬”兼施的 CEVA 语音平台
怎样的平台才能称之为适用于语音应用的平台呢？

回答这个问题，首先需要对应用场景进行分类，是电池驱动还是插座式电源供电、是近场交互操作还是远场识别。应对以上不同场景，便需要两种不同的解决方案：

第一种是具有超低功耗的近距离交互，使用 1 至 3 个麦克风的始终在线语音助手；

第二种是支持 4 至 8 个麦克风的高性能远距离应用，可使用多种前端技术，比如波束成形和多通道回声消除器。

基于此，CEVA 提供 CEVA-TeakLite-4 超低功耗 DSP 平台和 CEVA-X2 高性能 DSP 平台解决方案。除了用于语音识别的专用 DSP 内核，还提供应用软件。Moshe Sheier 表示，以上两款方案均有实际应用案例，并包含多个 CEVA 及合作伙伴的软件包，可实现任何风格的语音助手应用。

如何应对智能语音痛点
尽管技术先行，但智能语音还存在诸多的挑战，最大的挑战便是环境噪声，而往往是多个噪声源错综交织——其他人的交谈、音乐播放、空调器和其它机器噪声、交通噪声等等。因而，获得良好的信噪比尤为关键，通过生成清晰的声音信号来作为语音识别引擎。

应对这些挑战就需要通过降噪、麦克风阵列波束成形、扬声器跟踪、回声消除器、始终聆听唤醒词和嵌入式(非基于云端)语音指令等。

Moshe Sheier 表示：“CEVA 已向全球多个地区的客户交付超过 60 亿个音频 / 语音芯片，可实现麦克风拾音、降噪、回声消除和嵌入式语音指令，并将清晰的语音数据编码发送到云端。我们拥有丰富经验应对语音交互的变革。”

与非网原创内容，未经许可，不得转载！

应对语音交互变革，CEVA“软硬”兼施

相关推荐

电子产业图谱