加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
    • 01
    • TinyML+ AutoML 的价值何在?
    • 02
    • 什么是 AutoML?
    • 03
    • 应用场景有哪些?
    • 04
    • 初创公司&各类资源
    • ---- 写在最后 ----
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

物联网领域正涌入大批不领工资的“数据科学家”【物女心经】

2020/06/01
122
阅读需 23 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

导  读:TinyML 是指在毫瓦(mW)功率范围以下的设备上,实现机器学习的方法、工具和技术。这里的关键词是“毫瓦功率范围以下的设备”。TinyML 功耗极低,不仅适用于边缘硬件,还可用于物联网终端设备,支持各种不同的电池驱动的设备,和需要始终在线的应用。最近 TinyML 与 AutoML 正在快速融合,构建嵌入式自动化机器学习算法,发挥更大的效力。

    

AIoT 智联网是 AI(人工智能)和 IoT(物联网)技术在实际应用中的落地融合。近年来,智联网 AIoT 一词热度剧增,她正在以极快的速度从襁褓中的婴儿长大成人。

昨天,All inAIoT 还是单个企业的市场宣言;今天,AIoT in All 已经成为各行各业尝试转型以及寻找下一增长点的主力。

根据中国信息通信研究院统计预测数据显示,2020 年全球人工智能市场将达到 6800 亿元人民币。据研究机构 Markets and Markets 在 2019 年发布的报告称,2019 年全球 AIoT 市场规模为 51 亿美元。到 2024 年,这一数字将增长至 162 亿美元,复合年增长率为 26.0%。

AIoT 的成熟,一方面需要企业的重视与投入,另一方面需要技术的支撑与迭代。上周,我们谈到阿里投百亿加速 AIoT 布局的“大手笔”;这周,我们来看看 AIoT 的领域吹起的技术“新风向”。

在文章《一文读懂即将引爆的 TinyML:在边缘侧实现超低功耗机器学习》中,我曾经介绍过一个新趋势:TinyML,并提到将会持续追踪 TinyML 的进展。

TinyML 是指在毫瓦(mW)功率范围以下的设备上,实现机器学习的方法、工具和技术。这里的关键词是“毫瓦功率范围以下的设备”。TinyML 功耗极低,不仅适用于边缘硬件,还可用于物联网终端设备,支持各种不同的电池驱动的设备,和需要始终在线的应用。

这些设备包括智能摄像头远程监控设备、可穿戴设备、音频采集硬件以及各种传感器等…TinyML 是一个新兴领域,是快速增长的机器学习技术和应用,是一片巨大的、未被充分开发的蓝海。

最近 TinyML 与 AutoML 正在快速融合,构建嵌入式自动化机器学习算法,发挥更大的效力。

AutoML 全称是 Automated Machine Learning,自动化机器学习,这是 2014 年以来,机器学习和深度学习领域最炙手可热的领域之一。

我们都知道,机器学习的应用需要大量的人工干预,这些人工干预表现在:特征提取、模型选择、参数调节等各个方面。AutoML 试图将这些与特征、模型、优化、评价有关的重要步骤进行自动化地学习,使得机器学习模型无需人工干预即可被应用。

就在今年 3 月,谷歌证明了 AutoML 可以走得更远。根据谷歌已将代码开源的 AutoML-Zero,如今有可能仅使用基本的数学运算作为构建块,就可以自动“进化”为完整的机器学习算法。

因此本文将介绍 TinyML 与 AutoML 相结合的最新进展,值得你关注的包括:

TinyML 与 AutoML“携手”的最大价值体现在哪里?

嵌入式自动化机器学习算法的具体应用场景有哪些?

这个领域的初创公司和各类资源的情况如何?

01

TinyML+ AutoML 的价值何在?

21 世纪最性感的工作是什么?

你可能已经脑补了五花八门的答案,但《哈佛商业评论》(Harvard Business Review)认为是“数据科学家”。HBR 在文章中写道,“如果‘性感’意味着拥有非常抢手的稀有品质,那么数据科学家就是。”

数据科学家很难招到、工资很高、更难留住,这也许是每个试图尝试 AI 应用的物联网企业都会头疼的问题。

数据显示,在 2018 年,初级数据科学家的平均工资为 11.5 万美元 / 年,能够管理 10 至 15 人团队的数据科学家则可以拿到 35 万美元的年薪。

2019 年,全球对数据科学家的需求量是供应量的 1.5 倍。超过 40%的公司认为招聘不到数据科学家是严重阻碍他们竞争力的原因之一。超过 60%的公司试图通过内部培训,让现有员工变身成为数据科学家。

在物联网领域,数据科学家除了稀有,还面临另一个问题:在物联网终端,很多 AI 绝技无法施展。分布最广的物联网设备往往体积很小、电量有限。它们被作为终端硬件,通过嵌入式传感器采集各种数据;计算能力有限,对功耗极为敏感。物联网领域占比超过 95%以上,都是需要超低功耗、占用极少存储空间、完成实时数据处理的场景。能够在这类设备上实现机器学习的人才,更是精英中的高阶精英。

TinyML 与 AutoML“携手”,就是试图让物联网领域的机器学习,突破人才稀缺和硬件受限的掣肘,让机器学习算法在物联网终端自我进化,让非技术人员可以轻松的使用人工智能进行数据分析,让原本“物以稀为贵”的机器学习以亲民的方式“飞入百姓家”。

02

什么是 AutoML?

为了更好的理解 AutoML,清华校友翟伟所在公司 Qeexo 通过一个有趣的对比进行了解释。

在某种程度上,人工智能与印刷术非常相似,它们的诞生都是人类历史上的巨大转折,而且演进过程也有一定的可比性。

印刷术发明之前,文化的传播主要靠手抄的书籍。手抄费时、费事,又容易抄错、抄漏,既阻碍了文化的发展,又给文化的传播带来不应有的损失。

就像在人工智能诞生之前,工程师们要自己写计算程序完成数据分析,不仅效率低而且有可能存在很多误判。

印章和石刻给印刷术提供了直接的经验性启示,用纸在石碑上墨拓的方法,直接为雕版印刷指明了方向。

雕版印刷的版料,一般选用纹质细密坚实的木材,然后把木材锯成一块块木板,把要印的字写在薄纸上,反贴在木板上,再根据每个字的笔划,用刀一笔一笔雕刻成阳文,使每个字的笔划突出在板上。木板雕好以后,就可以印书了。

就像在人工智能的初始阶段,工程师们为每个用例,从零开始写机器学习的代码,一个用例对应一块“雕版”,在不同用例之间代码很难重复利用,灵活性差、对工程师的技艺要求高。

活字制版避免了雕版的不足,只要事先准备好足够的单个活字,就可随时拼版,大大地加快了制版时间。活字版印完后,可以拆版,活字可重复使用,且活字比雕版占有的空间小,容易存储和保管。这样活字的优越性就表现出来了。

就像随着人工智能的发展,工程师们开始使用解耦的思维,使用现有的机器学习模块与框架活用拼凑 AI。这个阶段开发一个上手的应用或许很简单,但是要开发真正的产品却很难,需要一个团队的专业人士,花费几个星期的时间完成。

而现在,我们每个人都知道如何使用电脑打字,并使用打印机将文稿印出。

AutoML 就是试图将人工智能也带入到同样阶段的做法,让一位非专业人士,花费几分钟的时间,即可完成多个人工智能模型。在这个阶段,合适的 AutoML 工具是关键。

谷歌最近发布了一篇论文名为《AutoML-Zero:从零开始的自动机器学习》,AutoML-Zero:Evolving Machine Learning Algorithms From Scratch。

AutoML-Zero 这个名字难免让人产生联想。当年 AlphaGo 战胜了人类最强棋手,但前提是它先学会了人类棋谱,离不开人类指导。接着谷歌又推出了 AlphaGo Zero,只让 AI 知道围棋规则,从零开始学下棋,结果再次登上棋艺顶峰。

AutoML-Zero 似乎想要证明,既然 AI 能从零学习围棋,也可以从零开始摸索机器学习算法。

谷歌这篇论文的全文可以通过文末的提示下载阅读。

现在谷歌已将 AutoML-Zero 的开源程序提交到 GitHub,普通电脑只需 5 分钟就能体验一下它的实际效果。GitHub 网址:

https://github.com/google-research/google-research/tree/master/automl_zero

03

应用场景有哪些?

目前一些智能可穿戴设备,包括智能耳机和智能手表已经在使用相关技术。通过加速度传感器陀螺仪辅以相应的嵌入式自动化机器学习算法,可以更好的分析用户行为,并且支持自定义手势创建、情境感知、活动分类、步态分析,提供更加贴合用户自身的服务。

智能家居也是应用场景之一。智能水壶和智能灶台可以通过声学传感器和算法,检测水是否烧开、烧开的水是否溢出、壶和锅的温度有没有过高。还可以监测智能微波炉中的玉米花是否爆开,以便及时关闭设备。

当然,你也许会想,这些场景都是“小儿科”,只有在最复杂的工业场景中实现应用,才能验证“TinyML+AutoML”嵌入式自动化机器学习算法真正有效。如你所料,有些企业正在将嵌入式机器学习自动算法用于预测性维护。

对于预测性维护(PDM)的发展阶段进行简单划分,可分为 4 个阶段:

PDM 1.0—反应性维护:当问题出现时再来解决它,例如救火。

PDM 2.0—预防性维护:包括外观检测,以及能够提供更具体、更客观的有关机器或系统状况相关信息的定期资产检测。

PDM 3.0—基于规则的预测性维护:也就是“状态监测”。传感器持续收集来自设备的数据,并根据预先设定的规则,包含在预先设定的临界值出现时发出警报。

PDM 4.0—基于机器学习的预测性维护:依靠大量的历史数据或者测试数据,结合为不同情境定制的机器学习算法,预测错误出现的时间和位置,然后发出警报。

PDM 4.0 是通过先进的分析技术对资产的技术条件、使用、环境、维修历史、其他类似设备以及任何可能与之相关的大数据进行分析,预测未来将会发生的故障,并最终制定出最有效的预防措施。

在这个过程中,听声能力很重要,就像维护维修专家能够通过汽车引擎的声音,来诊断车辆的问题一样,工业设备如果拥有了一双远程的“顺风耳”,结合振动分析,就可以让 PDM 方案更精确。声音同样还能被用于诊断液体泄露、管道腐蚀和液位测量。

PDM4.0 还面临一个规模化应用的窘境,由于每个设备的安装条件、载重性能和外部环境都不相同,单一的 AI 模型可能无法在类似的电机上批量复制。

TinyML+AutoML 使用时间序列传感器,包括模拟和数字麦克风,可以自适应的创建 AI 模型。通过声音传感与分析,有助于识别预测性维护应用的问题。

04

初创公司&各类资源

关于 TinyML+AutoML,有很多现成的工具和软件可以使用,物联网企业不需要招聘昂贵的数据科学家,也不需要扩充团队,就可以初步尝试。

这里介绍比较有代表性的初创公司和资源,包括 QEEXO、MindsDB 和 Cartesiam。

QEEXO

这家公司成立于 2012 年,总部位于加利福尼亚州山景城,机器学习的研发团队位于宾夕法尼亚州匹茨堡,在北京和上海拥有工程师团队。

目前已经有 260 多种硬件平台,超过 3 亿台设备,搭载了 QEEXO 的机器学习引擎。

知名的包括在华为手机中嵌入的指关节操作技术。

指关节操作功能通过使用指关节在屏幕上敲击或勾画,快速调用系统功能,支持利用指关节双击全屏截屏、敲击并画圈局部截屏、敲击并画字母 S 滚动截屏、双指关节双击录屏、直线分屏等 5 种手势操作。今年 5 月,荣耀发布了新机荣耀 X10,指关节操作功能首次下放给了“千元机”。

QEEXO 与瑞萨电子等领先硬件厂商进行合作,完成了多种硬件的适配。QEEXO 可支持 Arm Cortex – M0 到 M4 核的单片机,如瑞萨 RA6M3 组单片机产品。

据悉,QEEXO 的自动机器学习算法将在亚马逊 AWS 上架,以 SaaS 年度订阅的方式提供服务,并将在下周周一,6 月 8 日进行全球商用版 Qeexo AutoML 的正式发布。

MindsDB

MindsDB 公司成立于 2017 年,总部位于加利福尼亚州伯克利,源自美国加州大学伯克利分校的研究项目,其同名服务已在 GitHub 上发布开源版本。GitHub 网址:

https://github.com/mindsdb/mindsdb#mindsdb

最近 MindsDB 完成了一笔 300 万美元的融资,用于扩充团队和验证商业模式。

Cartesiam

Cartesiam 公司创立于 2016 年,总部位于法国土伦,商务运营中心位于巴黎和纽约,主要实现让普通的 ARM 微控制器都能运行的无监督学习 AI。

今年 2 月,Cartesiam 发布了一个名为 NanoEdge AI Studio 的软件系统,该系统能够安全地生成 AI 算法,并且生成的算法只需两分钟就可在 ARM 微处理器上运行,容量大小仅为 4~16KB RAM。

法国的工业电子制造商 Eolane 与 Cartesiam 合作推出了一款名为 Bob Assistant 的温度 / 振动传感器,主要用于预测工业维修。目前,该解决方案已经被许多欧洲客户所采用,成为首个大规模部署的工业 4.0 预测性维护解决方案。

5 月 19 日,Cartesiam 发布了针对 STM32 开发板优化的新版 NanoEdge AI Studio 软件工具。STM32 是意法半导体开发的微控制器。新版提供一个新的硬件平台选项,让开发者可以直接选择意法半导体的 Nucleo-F401RE 或 Nucleo-L432KC 开发板。在选择之后,用户可以解锁设计流程的最后一步,下载可在所选硬件平台上立即运行的自定义机器学习库。

---- 写在最后 ----

看似微小的 TinyML 和自我进化的 AutoML 蕴含大机会,物联网企业需要转变的首先是思维,积极拥抱和勇于尝试,或许就会开辟一番新天地。

【扫码下方二维码,下载论文《AutoML-Zero:从零开始的自动机器学习》。】

最后,衷心感谢清华校友、QEEXO 中国区市场负责人翟伟在写作过程中帮我提供的大量资料以及各种支持。6 月 8 日,QEEXO 嵌入式自动化机器学习服务的商用版本即将正式发布,邀请你与我们共同见证。

本文总结:

TinyML 与 AutoML 正在快速融合,构建嵌入式自动化机器学习算法。

TinyML 与 AutoML“携手”,让原本“物以稀为贵”的机器学习以亲民的方式“飞入百姓家”。

嵌入式自动化机器学习算法具有广泛的应用领域,包括智能家居硬件、智能可穿戴设备、建筑物振动监测和工业预测性维护。

这个领域中比较有代表性的初创公司和资源,包括 QEEXO、MindsDB 和 Cartesiam。

参考资料:

1. 一文读懂即将引爆的 TinyML:在边缘侧实现超低功耗机器学习【物女心经】,来源:物联网智库

2.ThisIs How Algorithms Will Evolve Themselves, by Courtney Linder, popularmechanics.com

3.Googleclaims new AutoML will ‘evolve’ without human intervention, techhq.com

4.ComparingMindsDB with Sklearn and Tensorflow, mindsdb.com

5.WhyTinyML is a giant opportunity, by TX ZHUO and FIKA VENTURES, venturebeat.com

6.QeexoAutoML is Now Live on Amazon Web Services, prweb.com

7.EtaCompute 與 EdgeImpulse 合作,以促進邊緣端機器學習的開發和部署,times.hinet.net

8.BackingMindsDB - Automated Machine Learning for the Software Developer, by SamuelHields, blog.openocean.vc

9.STMicroelectronicsand Cartesiam announce general availability of NanoEdge AI Studio now optimizedfor STMicroelectronics development boards, cartesiam.ai

10.Why, Hello FPGA and AI - HowNice to See You Together, by Max Maxfield, eejournal.com

11.TOP AUTOML PLATFORMS TO LOOKOUT FOR IN 2020, by Smriti Srivastava, analyticsinsight.net

12.Machine Learning at the Pushof a Button, by Jim Turley, eejournal.com

13.Do You Hear What I Hear?Connecting IoT Devices with Sound, engineering.com

相关推荐

电子产业图谱