在所有应用“都值得用AI重做一遍”的今天,耳机迎来了革命性的转变。AI让耳机变得更加智能,也为用户带来了前所未有的体验,包括健康监测、辅助听力、生活助理、商务助手等等。AI耳机的市场潜力正在被逐渐释放,迈向一个全新的智能化时代。
销量同比增长763.3%,预测今年增长488.7%
AI技术正在深刻改变耳机的运作模式,特别是在开拓新的应用场景方面,AI耳机不仅在连接稳定性、延迟等关键技术问题上有所提升,还能够集成健康监测、辅助听力等功能,推动市场向更加细分化和多元化的方向发展。
与传统耳机相比,AI耳机最本质的区别在于功能和使用场景上的扩展,使它不仅仅是音频输出设备,更是转变为能够提升用户生产力的工具。<与非研究院>对AI耳机与传统耳机的区别进行了以下总结:
<与非研究院>,2024年10月
根据洛图科技(RUNTO)数据,2024年8月,中国在线电商平台的AI耳机虽然在耳机/耳麦总销售额中仅占1.4%,但增长速度惊人,与去年同期相比,销量增长763.3%,销售额翻了近14.5倍。预测2024年,中国AI耳机的电商市场销量有望突破20万副,同比增长预计可达488.7%。
对于耳机这个成熟品类来说,导入AI的驱动因素,既有技术进步带来的新功能,如声音合成和降噪处理;还有市场需求的增长,尤其是在音乐、娱乐、健身和远程办公等场景下对个性化和智能化耳机的追求。此外,传统耳机市场品牌竞争加剧,也为新技术导入提供了机会,通过支持多样化的生成式AI模型、软硬件的有效融合,有望提供更丰富的用户体验,促进AI耳机的成长。
蓝牙耳机或将洗牌,AI大模型推动市场向中高端发展
AI运算的重心正在从云端向终端迁移,使得AI能够在本地运行,人机交互将变得更自然、更实时、更加个性化,隐私性也更有保障,而这也是AI的革新意义。
进入2024年以来,多款AI耳机陆续上市,不仅限于智能语音功能,更注重在场景应用方面的深耕和优化,比如在音质、智能交互、翻译等方面的创新应用,为用户的使用体验和工作效率带来质的提升。
2024年上市的六款代表性AI耳机(<与非研究院>整理,2024年10月)
这六款AI耳机中,iKKO ActiveBuds、讯飞会议耳机iFLYBUDS Nano、时空壶W4 Pro同声传译耳机都强调了实时翻译功能;Cleer ARC 3内置AI运动算法,可以提供个性化的运动指导;声智科技的耳夹式耳机接入自研大模型AzeroGPT、字节跳动的Ola Friend耳机则接入豆包大模型,从而能够提供更加丰富的智能助理服务,如实时翻译、个性化推荐等。
大模型变现应该是声智科技和字节跳动推出AI耳机的一大考量因素,目前单纯依靠软件服务不足以实现大模型的研发和运营的盈利目标。通过将大模型植入耳机,一方面可以开拓新的收入来源,探索大模型的更多商业可能性,另一方面也可以在AI耳机这个新赛道探索新的增长点。
此外还有一个重要趋势,就是开放式真无线耳机(Open Wireless Stereo,OWS)的迅速起量。IDC数据显示,2024年1-8月中国蓝牙耳机市场累计出货量达到7338万台,同比增长19.5%。其中,真无线耳机市场出货4602万台,同比增长4.2%;开放式耳机市场出货1636万台,同比增长271.5%;颈戴耳机市场出货670万台,同比下滑27.5%;头戴耳机市场出货429万台,同比增长19.6%。
这其实意味着,中国蓝牙耳机整体市场的双位数增长主要由开放式耳机的快速增长而带动。随着市场逐渐进入洗牌期,需要新的拉力来维持增长:首先要兼顾舒适和降噪,因真无线耳机主动降噪功能突出,开放式耳机佩戴舒适度更高,未来开放式+主动降噪、半入耳式真无线+主动降噪的产品或将推动市场增长。此外,随着语音交互、实时翻译等AI相关功能的加入,AI大模型将推动耳机中高端市场的发展。
耳机进入AI时代,核心芯片面临哪些挑战?
过去几年,耳机在技术上实现了许多突破,这优化了AI应用的可能性。比如耳机可自带麦克风进行噪音拾取,再通过降噪芯片处理、借助喇叭输出噪音便可抵消外界噪音。通过内置耳机的端侧小模型,噪音声纹可以自动生成,以协助耳机实现降噪功能等等。
不过,AI耳机为了实现多种增强功能,相关硬件性能仍需要继续进行提升:首先是连接性,为了确保顺畅的AI交互体验,耳机必须能够持续稳定地传输音频,这对耳机的连接性能提出了更高的要求;其次是计算能力:AI耳机需要依赖AI算法来实现智能降噪和实时翻译等先进功能,需要具备足够的硬件计算能力;第三是信噪比:具备高信噪比的耳机能够在嘈杂环境中清晰捕捉声音,从而扩大其使用范围,提高用户的使用体验。
目前国内部分芯片厂商已推出相关方案,例如恒玄科技推出的新一代6nm智能可穿戴芯片 BES2800,集成了Wi-Fi和蓝牙模块,支持本地传感网络算法处理,能够为TWS耳机、智能手表、智能眼镜、智能助听器等产品提供算力和高品质的无缝连接体验。
Cleer ARC 3 音弧所采用的炬芯科技ATS3085系列智能穿戴芯片,具有高帧率、GPU硬件加速和屏显驱动等特性,通过驱动充电仓的高清显示屏,实现了高帧率、GPU硬件加速和屏显驱动等特性,助力呈现清晰细腻画面和流畅操控。
对于迅速发展的开放式耳机来说,在导入AI降噪技术时,给芯片技术带来了三大挑战:
首先,由于开放式耳机需要在多种复杂环境中都能提供有效的降噪效果,包括室内外、不同噪声类型等,这要求芯片具备优秀的抗干扰能力,并且能够处理和适应各种环境噪声的特征;其次,AI降噪需要实时处理音频信号,要求芯片具有高效的处理能力,这意味着芯片必须能够快速执行复杂AI算法,同时保持低延迟,以确保用户听到的声音是实时且清晰的;此外,芯片在集成度、功耗、成本控制等方面仍面临严苛要求,并且在保证硬件性能的同时,还要实现与软件算法的协同优化,以实现最佳效果。
端侧AI规模化机遇面前,小小耳机能否承接“泼天流量”?
当前,端侧处理的一个关键问题在于:哪些生成式AI模型能够以合适的性能和准确度在终端侧运行?好在性能强大的生成式AI模型正在向轻量化发展,同时端侧的处理能力也在持续提升。
下图是高通在混合AI白皮书中展示的、可以在终端侧运行的生成式 AI 功能,这些功能的模型参数在10亿至100亿之间。如Stable Diffusion 等参数超过10亿的模型已经能够在手机上运行,且性能和精确度达到与云端处理类似的水平,可以期待拥有100亿或更多参数的生成式AI模型将能够在终端上运行。
图:可在终端侧运行的生成式 AI 参数规模,高通白皮书
混合AI架构也为耳机这类智能硬件提供了一个发展思路,未来可根据模型和查询需求的复杂度等因素,选择不同方式在云端和终端侧之间分配处理负载。例如,如果模型大小、提示(prompt)和生成长度小于某个限定值,并且能够提供可接受的精确度,推理即可完全在终端侧进行。如果是更复杂的任务,模型则可以跨云端和终端运行。混合AI还能支持模型在终端侧和云端同时运行,也就是在终端侧运行轻量版模型时,在云端并行处理完整模型的多个标记 (token),并在需要时更正终端侧的处理结果。随着强大的生成式AI模型不断缩 小,以及终端侧处理能力的持续提升,混合AI的潜力将会进一步增强,带动更多智能硬件(包括耳机等设备)的规模化扩展。
目前从用户的使用角度来看,在没有出现足以改变手机竞争格局的颠覆性技术之前,AI耳机与手机进行配合,是较为符合大众使用习惯的产品。
写在最后
AI技术的普及正在深刻改变着我们的生活和工作方式,耳机也将是其中的一个重要领域。从技术趋势来看,耳机和AI的结合将会越来越紧密。
不同于智能音箱时代的产品逻辑,玩家本质上是在押注人机交互变革的机会,是在布局AIoT生态的一个重要入口。而AI耳机除了是智能化的可穿戴设备、重要的人机交互入口,更将带来面向细分场景的生产力的提升,这是AI耳机不同于以往的变革动力,也是AI时代带给它的机会。