Supplyframe Supplyframe XQ Datasheet5 Component Search Engine Findchips bom2buy Siemens Xcelerator

关注我们

扫码关注
获取工程师必备礼包
板卡试用/精品课

设计助手

电子硬件助手

电子硬件助手

元器件查询

元器件查询

具有语音功能的机器，可阅读书籍并回答问题

2020/09/24 作者：jianchiee

392

加入交流群

扫码加入
获取工程师必备礼包
参与热点资讯讨论

techable_machine_trJoUnilFN.jpg

共3个文件

在这个项目中，我构建了启用语音的可教机器，该机器可以扫描书页或任何文本源中的文本并将其转换为上下文，用户可以提出与该上下文有关的问题，并且该机器可以仅使用上下文进行回答。我一直想制造一种易于部署且可以轻松针对给定上下文进行培训而无需任何互联网连接的边缘设备。

硬件部件：

Raspberry Pi 4 B型×1个
英特尔神经计算棒2×1个
Seeed ReSpeaker 2-麦克风Pi HAT×1个
Raspberry Pi摄像头模块V2×1个
喇叭3W x 2×1个

软件应用程序和在线服务：

树莓派Raspbian
英特尔OpenVINO工具包
Tesseract OCR
深度语音

应用程序中使用的机器学习模型

使用了三种机器学习模型：

1. Tesseract OCR（基于LSTM的模型）

Tesseract是一种OCR引擎，支持unicode，并具有开箱即用地识别100多种语言的能力。可以训练它识别其他语言。

2. DeepSpeech（TensorFlow Lite型号）

DeepSpeech是一个开源的语音转文本引擎，使用由机器学习技术训练的模型，该模型由Google的TensorFlow简化实施。

3. BERT

BERT是一种语言表示模型，代表变压器的双向编码器表示。预训练的BERT模型仅需增加一个输出层即可进行微调，以创建适用于各种任务（例如问题解答和语言推论）的最新模型，而无需进行大量针对特定任务的体系结构修改。

前两个模型在Raspberry Pi 4上运行，最后一个模型在使用OpenVINO Toolkit的Intel Neural Compute Stick 2上运行。

techable_machine_trJoUnilFN.jpg

下载

描述：原理图截图
TeachableMachine-master.zip

下载

描述：源码
项目详情.pdf

下载

描述：项目细节

原创声明：本文为jianchiee原创内容，未经书面授权，不得以任何方式加以使用。转载合作

人工客服
（售后/吐槽/合作/交友）

英特尔

英特尔在云计算、数据中心、物联网和电脑解决方案方面的创新，为我们所生活的智能互连的数字世界提供支持。

英特尔在云计算、数据中心、物联网和电脑解决方案方面的创新，为我们所生活的智能互连的数字世界提供支持。收起

点赞

收藏

评论

分享

加入交流群

举报

相关推荐

WTK6900G-B02本地语音识别模块
方案唯创知音
1126
01/18 08:32
WTK6900F-B03语音识别控制模块
方案唯创知音
3263
01/17 09:27
WTK6900F-B04自学习语音识别模块
方案唯创知音
1182
01/17 09:23
WTK6900CS-B01语音识别控制模块
方案唯创知音
944
01/16 10:02
WTK6900HM01离线语音识别模块
方案唯创知音
1654
01/15 10:24
WT2003HM01语音播报模块
方案唯创知音
1125
01/11 08:43
WT2003HB01高音质语音模块
方案唯创知音
1738
01/10 08:44

方案定制

方案开发定制化，2000+方案商即时响应！

相关方案

TA的热门作品

热门内容