无论是打电话,还是观看视频内容,音频效果的好坏直接决定着用户体验的好坏,为了满足越来越高的用户需求,音视频编解码公司都在为手机、电脑、电视、VR 等电子产品开发新的音视频编解码技术,从而为用户提供劲爆的视听体验。最近,音频及媒体技术研究机构 Fraunhofer IIS 带来了一系列最新的移动音频技术,包括:增强型语音编解码器 EVS 技术、xHE-AAC 技术、Cingo 技术和音频后期制作插件 Cingo Composer,以及 MPEG-H 解决方案。在现场,笔者还亲自感受了新技术所带来的更加清晰、沉浸式的听觉体验。
Fraunhofer IIS 中国区业务代表 Toni Fiedler 先生
EVS 技术:让移动通话更清晰
在打电话的时候,你是否遇到过音质不清晰的体验?想必大多数人都遇到过这种问题,那时你不得不让对方再重复一遍,而如今 Fraunhofer IIS 推出了增强型语音服务 (EVS)有望解决这一问题。Toni Fiedler 先生介绍,“EVS 技术是下一代 3GPP VoLTE 编解码器,即 AMR-WB 的升级版。EVS 也是超宽频 VoLTE/VoWiFi 服务中唯一指定的编解码器,它能够为用户带来全高清语音通话质量,并能媲美当今数字媒体服务的通话保真度,配合 EVS 先进的鲁棒性和抗丢包功能,楼宇室内信号覆盖得到了显著提升。”
EVS 技术体验现场
笔者在现场对采用 EVS 技术的移动电话做了通话体验,如上图所示,左侧的 AMR 和 AMR-WB 技术是现在手机上所采用的音频编解码技术,传输码率可以设置为 7.4bit、12.2 bit、12.65 bit、23.85 bit 四档,随着传输码率变大,语音越来越清晰;EVS-SWB 技术可以设置为 9.6 bit、13.2 bit、16.4 bit、24.4 bit,随着传输码率变大,语音传输也越来越清晰。经过对比发现,采用 EVS-SWB 技术的 9.6 bit 码率通话比采用 AMR-WB 技术的 23.85 bit 通话更加清晰。由此可见,新的音频编解码技术将为用户提供更佳的音频传输效果。
笔者也问了这项技术的目前的使用情况,Toni Fiedler 先生解释,“美国 T-Mobile,日本 NTT DoCoMo,德国 Vodafone Germany,德国 Deutsche Telekom 先后为其用户带来具有 EVS 技术的 VoLTE 服务。在中国,中国移动已完成了针对 EVS 技术的一轮实验室和外场试点测试,而中国移动研究院也已完成测试规范企标制定工作,并在其官方微信上发布了测试结果。”可见,中国用户也会很快用上采用 EVS 技术的移动通信设备。“EVS 技术由 12 家企业合作研发,其中就包含了重要的中国企业。我认为这是中国技术走向世界舞台的一个典型案例,而这也为 EVS 走入中国市场奠定了坚实的基础。” Toni Fiedler 补充。
xHE-AAC 技术:2G 用户的福音
在中国,目前大部分移动用户采用的都是 4G 通信,随着 5G 技术的研发,不远的未来我们会切换到 5G,这也意味着手机通话更清晰,上网更快,人们对 5G 的愿景是“信息随心至,万物触手及”,Toni Fiedler 指出,xHE-AAC 技术是为低比特率音视频流媒体应用而开发的,能够轻松满足数字广播和移动音视频流媒体应用的需求,即在极低的比特率下(单声道低至 6 kbit/s,立体声低至 12kbit/s)传输各式各样的高品质音频内容。因此,在网络发生拥堵时,xHE-AAC 流媒体播放器能够按需切换至极低的比特率流,并实现连续不间断的还放效果。当网络环境变好时,xHE-AAC 客户端能够获取一个更高的比特率版本,并能在整个比特率范围内实现无缝切换。通过高效的编码效率而节省出的音频带宽能够使视频质量得到进一步提升。
5G 时代还需要低比特率音视频流媒体吗?笔者感到大惑不解,Toni Fiedler 的解释点醒了笔者,“在印度、印度尼西亚以及非洲国家还有数十亿用户采用 2G 通信技术,xHE-AAC 技术带来了稳定可靠且不间断的音频流媒体服务。凭借该项技术,流媒体服务提供商能够显著降低 CDN 开销并带来更为简易的编码媒资管理方式,而用户也能够在享受高品质流媒体服务的同时节省月度流量。”
笔者在现场体验了采用 xHE-AAC 技术的音频播放效果,无论在那种码率下播放,音频效果始终如一,而且可以实现无缝切换,用户感觉不到切换带来的变化。
MPEG-H & Cingo:让用户感受沉浸式 VR 听觉体验
虽然近来 VR 市场变得比较平静,Toni Fiedler 表示 Fraunhofer IIS 依然为 VR 设备提供基于 MPEG-H 的端到端 VR 音频系统,他解释,“这个系统囊括了沉浸式声音的制作、传输、还放乃至渲染环节。MPEG-H 的先进性能包括:沉浸式声音:MPEG-H 包含的 3D 音频组件能够带来沉浸式声音体验;互动式音频:用户可以根据自身需求调整混音比例;通用传输:MPEG-H 能够在任何环境和设备上呈现最佳还放效果。”
笔者在现场体验了法国情景喜剧《Vaudeville》,带上 VR 头盔,用户可以 360 度旋转身临其境观看,似乎置身于情景剧中,声音来自四面八方,非常逼真。这是 Fraunhofer IIS 与法国超媒体创新机构 b<>com 技术研究所合作的成果,基于 MPEG-H 中 HOA 技术的端到端空间音频制作、传输、还放以及渲染系统。为了让 VR 还放系统端的集成工作变得更加简单,Fraunhofer IIS 为其提供了 VR 音频 SDK,从而使其拥有解码 MPEG-H 3D 音频的能力以及最佳的音频渲染效果,进而打造优质的 VR 体验。而 b<>com 空间音频工具箱则是全球顶尖的 HOA 音频前期和后期制作解决方案。
对于 VR 来说,除了硬件设备,内容制作也非常重要,Fraunhofer IIS 为内容制作者提供了 Cingo Composer 插件,最近更新了 BETA 版本插件,凭借该插件,声音设计师能够轻松的进行混音,声像定位并实现音频对象的监听。该插件能够输出 MPEG-H 格式的音频元素和元数据,并为现有平台提供 FOA 和 5.1 格式音频内容。只需进行一次混音,便能够输出各种拟定发行的音频格式。
与非网原创内容,未经允许,不得转载!
更多相关内容,请参照:与非网 Fraunhofer IIS 专区。