“你只需专注会议,其余一切交给听悟。”11月4日,2022杭州云栖大会,阿里巴巴达摩院研发的智能产品“听悟”进阶版亮相大会现场。仅需一台个人电脑,观众和媒体记者们即可体验全面集成达摩院语音语言智能的最新AI助理,感受会议场景的前沿AI实践。
这款“AI神器”在云栖大会上引起广泛关注,它不仅“听得准”,而且“悟性高”,可为体验者实时转写会议、秒速生成会议纪要、自动区分不同说话人、生成视频字幕,并具备会议实时翻译、问答自动提取等高阶能力,在企业会议、金融尽调、媒体访谈、教育培训等泛会议场景有广泛应用前景。
(“听悟”使用界面展示)
相比去年云栖大会发布的版本,“听悟”今年在技术和产品功能上进行了全方位升级,新增三大核心AI能力:中英文自由说,采用内嵌多语种专家模块的“混合专家系统”,无需手动切换语种即可准确识别中英大篇幅混说的场景;会议实时翻译,边说边翻译,无需等待,让跨国沟通更加高效顺畅;QA问答对抽取,结合说话人特征、多阶段训练技术,自动提取问题,让访谈整理更轻松。
(“听悟”进阶版可实现问答抽取,人物及对话为示例)
同时,针对会议行业伙伴及企业用户的多样化需求,“听悟”发布了PaaS产品形态,以简单易调用的接口方式开放核心能力,并提供多种前沿创新算法,从而满足企业在音视频会议、培训直播、招聘面试、智能客服等多种细分场景的不同需求。
(“听悟”在招聘细分场景中的应用)
阿里巴巴达摩院语音实验室负责人鄢志杰表示,“过去十年‘人-机’交流是语音AI解锁的核心场景,更复杂的‘人-人’交流是下一个高地,未来听悟将在‘人-人’交流场景继续深入探索,提供安全、保真、精准的AI识别、分析与理解能力,并基于内容为企业提供多种智能办公服务,让AI真正为人所用,替人分担,协助处理重复繁琐的工作事务。”