英特尔助力人工智能语言识别

2021/12/10 作者：与非网编辑

162

阅读需 3 分钟

加入交流群

扫码加入
获取工程师必备礼包
参与热点资讯讨论

在近日举行的NeurIPS大会上，发布了两册英特尔提供支持的关于口语数据集的白皮书，其中，《人的语言》主要涉及到“自动语音识别”任务，另一册——《多语种口语语料库》则涵盖“关键词识别”。这两个项目的数据集都贡献了大量丰富的音频数据，且每个数据集在同类中都拥有最大的可用体量。

《多语种口语语料库》由英特尔软件与先进技术事业部（SATG）的机器学习工程师Keith Achorn参与撰写。Keith在英特尔社区网站的博客中讲述了自己参与该项目的经历。
在ML Commons 的支持下，“人的语言”和“多语种口语语料库”于2018年开始启动，该项目旨在识别世界上最常用的 50 种语言并统一到单一的数据集中，从而使这些数据得到有效利用。该项目小组成员来自英特尔、哈佛大学、阿里巴巴、甲骨文、Landing AI、密歇根大学、谷歌、百度等。

在当今多元化、国际化、多语言的工作环境中，准确转录和翻译的能力愈发重要。通过使用以上数据集，计算机可以“听到”口语单词，并自动生成文本或译文。

这两个项目都运用了“多样化语音”，这意味着它们可以更好地展现自然环境音，如背景噪音、非正式语言模式、录音设备混音以及其他声学环境等。这与诸如有声读物之类的高度受控的内容不同，后者产生的声音更加“纯净”。然而，在实际应用中，多样化语音训练有助于提高识别的准确性。

“人的语言”项目内含数万小时的对话音频。如今，它是世界上最大的、可免费下载的、用于学术和商用的英语语音识别数据集之一。

“多语种口语语料库”是一个音频语音数据集，不仅拥有超过30万个关键字的数十种语言，能够通过智能设备访问，还涵盖了50多亿用户的日常对话，有助于推动全球范围内受众语音应用的研发。

这两个数据集都将提供给广泛的用户进行应用，它们包括商用在内的授权许可条款都相对较为宽松。

版权声明：网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播，或不应无偿使用，请及时通过电子邮件或电话通知我们，以迅速采取适当措施，避免给双方造成不必要的经济损失。侵权投诉

人工客服
（售后/吐槽/合作/交友）

英特尔

英特尔在云计算、数据中心、物联网和电脑解决方案方面的创新，为我们所生活的智能互连的数字世界提供支持。

英特尔在云计算、数据中心、物联网和电脑解决方案方面的创新，为我们所生活的智能互连的数字世界提供支持。收起

相关推荐

MT8370(Genio 500)联发科MTK8370 安卓核心板介绍
深圳市智物通讯科技有限公司
2422
09/20 09:27 方案
残差网络(ResNet) -深度学习（Residual Networks (ResNet) ）
Svan.
1869
08/29 12:17 方案
基于计算机视觉（opencv)的运动计数（运动辅助）系统-源码+注释+报告
Svan.
1066
08/22 11:42 方案
LPC55S69移植TinyMaix实验了一把手写数字识别-轻量级深度学习模型应用
流水源
1919
05/20 18:41 方案
基于树莓派和STM32F746的智能多功能农业机器人开发
与非网
1.2万
05/15 10:40 方案
【10/17高层对话直播间】湾区半导体产业生态博览会
与非网
1.4万
10/15 15:16 直播
【10/16开幕式暨高峰论坛|高层对话直播间】湾区半导体产业生态博览会
与非网
1.9万
10/14 09:10 直播

电子产业图谱

与非网编辑

TA的热门作品