加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
    • AI变强,成败萧何
    • 语音应用驶入深水区,持续拷问商业化能力
    • 开放环境下,AI推理仍需突破
    • 写在最后
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

2022:看见AI万分之一的“不可为”

2022/12/23
2082
阅读需 14 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

即将告别五味杂陈的2022年,站在AI产业的角度去回顾、总结,今年很想做一篇“不一样”的内容。

我们追寻了很多AI的超能力,AI的赋能作用,AI的智能价值……那么,有哪些事情是AI做不了的?可能是因为技术还需要突破,这是我们未来的创新点;可能是因为应用需求还不成熟,需要时间沉淀和产业界的共同努力;可能是因为成本不够经济,还需要在商业落地环境中进一步打磨;也可能,确实存在一些AI在短期内甚至长期来看都无法替代的领域……

只有找到产业的刚需,找到AI的自驱力,看到AI应用的边界,明白AI的“有所为”和“有所不为”,我们对于AI的理解,以及对于AI落地的动力和方向才会更为清晰。

在这篇年终特写中,<与非网>对话几位AI产业人士,他们之中有工程师、有企业高管、有刚参加工作的新人,也有大厂出身抽离AI的资深人士……从另一个角度,他们解读了AI。

AI变强,成败萧何

汤炜伟从事人工智能芯片及相关产品的开发落地工作,对于“AI的智能价值,以及AI赋能行业的价值”,他的理解是,AI赋能行业——本质上是生产力的提升,俗称“降本增效”,在行业中提升生产效率,或者节省成本、释放人力。

这一轮AI的爆发,如果从2016的AlphaGo算起,也有六七年时间了。这些年里,大量的AI技术爆发并得到了应用,如互联网、安防、消费电子机器人智能制造等。“这是一次新的生产力革命,在不同领域的降本增效都有着不俗表现,也催生了很多商业模式和创业公司的出现”,汤炜伟表示。

他列举了大家都熟悉的例子,如:计算机视觉中的人脸识别、车辆识别技术,这些应用达到了大体量的大型底库下的高识别率——这就相当于用计算机和机器部署了很多双“慧眼”和后台对应的“记忆力”和“智脑”,替代了警察、保安等人为的繁重工作,并且显著提高了安全保障效率。

再比如工业机器视觉,在生产线上以高速摄像头加上AI智能识别,相比于传统上人工判断生产缺陷的方式,带来了多倍的生产效率提升,并且避免了人为的疲劳带来的误判,充分发挥了机器的高准确率,以及在相对单调的任务上不知疲倦的特性等。

此外还有互联网推荐,如抖音、快手等短视频推荐,对于用户的娱乐体验带来了无以伦比的感受。让用户沉浸于此的重要原因,就是推荐的内容和用户的心理、爱好等越来越高的匹配度,这背后是推荐算法越来越优化的表现。

“然而,任何的单一技术都存在局限性和应用的边界”,汤炜伟指出。这一轮AI技术浪潮以深度神经网络为核心,它师承历史的联接学派,以设计不同的神经网络结构来表达智能的能力。

那么,在这样一种发展背景下,AI如何承上启下,实现更强的AI?

汤炜伟表示,“产业界和学术界有一种观点,未来的AI智能技术也许是综合了多种技术的组合,或者是一种全新的技术的颠覆才能带来更强的AI。”

回归到神经网络发展的三要素:数据、算法、算力,它们既成就了深度学习技术,其实也在一定程度上限制了AI的发展。

首先是数据,在神经网络的很多应用领域需要海量的数据(可能是百万级甚至千万级),然而,并不是所有行业都能轻松获得这样量级的数据。数据要么是难以获得(如人脸数据涉及隐私),要么是标注成本极高(如医疗影像数据的标注具有极高的专业度,医生的专业时间则意味着极高成本),要么数据本身就是小数据(如工业元器件的表面缺陷,没有海量的数据)。 这些都给“数据”带来了越来越多的挑战,迫使大家采用数据增强、对抗网络等方法来解决或者缓解数据相关问题。

其次是算法,深度神经网络的参数量越来越大,如GPT-3的1750亿参数,这样海量规模的算法的训练和收敛、数据输入输出,以及算法的部署等,都带来了很大的成本挑战。这其中包括显性的算力、存储、网络等成本,也包括工程师的学习、熟悉、调试等大量的学习和开发成本。

第三是算力,虽然在众多硬件厂商和生态圈的共同努力下,算力的单位成本在不断下降。但是,应对超大模型的算力成本,仍然是极为高昂的,如GPT-3,训练一次的成本可能高达数百万美金。这样高昂的成本,潜在将众多资金不足的创业型公司拦在门槛之外,阻碍了他们应用和发展大模型的能力。

除了三要素,汤炜伟认为还有一点——就是当前的AI系统,对于环境感知的复杂性、对于智能处理分析和推理的综合准确性的提升,还有很大的提升空间。

例如环境感知的复杂性:在逆光、暗光等光线不佳情况下,难以获得目标的清晰图像,自然很难得到神经网络的正常处理。再比如智能处理分析的完备性,如:智能门锁猫眼观察到的外部人员,如何判断他是想进门,还是经过,亦是徘徊或者有破坏等不良意图,这些都有待于多种传感器、更聪明的算法和软件逻辑的组合技术去进一步突破。

此外,AI系统依赖于“数据/经验”,会导致它对没见过的corner case难以处理。“这方面可以举出很多例子,如扫地机对于纤细型电源线的难以识别,自动驾驶系统对于一些交通意外的难以理解和识别等”,汤炜伟表示,“如果要探讨AI的‘不可为’,其实是有时间和空间的限制的,云端AI越来越强大,就像最近很火的chat GPT,但在端侧想实现这种实时性的互动,难度还是很大的。既要看到现在所处的现实,也要从‘不起眼’的突破中找到变强的力量”。

语音应用驶入深水区,持续拷问商业化能力

深聪智能董事长周伟达表示,人工智能确实受到了很大的关注,也取得了一定的成果。对于“AI的不可为”,他从宏观和微观两个角度分享了自己的洞察。

从宏观角度来看,需要明确AI在当前承担的角色,它被人类创造并服务于大众生活、企业增效。在这一进化过程中,它虽然不断进行着升级和完善,但始终无法进行有效的道德判断和情感思考,相对于真实的人类而言,它依旧有些“高冷”。

从微观角度来看,从人工智能行业的落地来看,对“不可为”的这种看法或许来自目前的商业化落地程度,这也是整个行业和产业都在关注的问题。

深聪智能作为思必驰旗下的语音芯片设计公司,正面临着智能语音应用驶入深水区的局面,一方面需要在场景端进行商业化拓展,另一方面仍需在技术领域继续投入,来适应复杂场景的需求。“商业化探索”是智能语音继续向前发展需要解决的一个问题,既需要与传统产业融合,又需要解决新兴市场刚需和产品方案的配套问题。

不管是传统还是新兴应用领域,商业化的探索并不容易,特别是要在多个行业同步推进的情况下,基于技术构建系统解决方案的能力、渠道能力、实现精准卡位的能力、持续盈利的能力……对智能语音的落地都至关重要。

此外,在芯片与算法融合发展的趋势下,如何研发出更高性能、更低功耗的语音芯片;以及在多模态融合发展的态势下,如何进一步挖掘市场需求和底层技术能力,都是智能语音企业构筑竞争壁垒的关键。

目前,深聪智能语音芯片已经在黑白电、小家电、车载硬件、会议办公设备等多个场景得到了应用,不仅为大众生活提供了语音交互体验,也为企事业单位提供了降本增效的服务,应用边界在逐步拓宽。

放眼整个AI领域也是如此,很多企业都在打通各类资源,协同上下游产业,都在为AI技术的落地和应用不断努力。周伟达乐观认为,现在的“不可为”,在未来一段时间会变为“大有可为”,这意味着市场空间将会带来不错的机遇。同时,作为AI领域的从业者,作为技术型企业,通过协同上下游的产品需求、方案优化、实践部署等环节,可以加速AI的商业化落地和应用。

开放环境下,AI推理仍需突破

保险行业正处在数字化转型的关口,尝试用各种科技智能手段降本增效。车险理赔领域,兼具理赔业务本身的流程规范和定核损环节智能化程度有待提升的特点,使得行业人士认为,可以尝试用AI解决一些共性问题,例如通过图像/视频理赔,尽量减少人工,提高效率。

当前的理赔流程是,理赔人员需要人工确认车辆损失、审核必要证件,所以为了提高效率,行业尝试用AI视觉来充当人的眼睛和大脑,一个核心的攻关场景就是智能定损。

刘金龙是中国人保的一名AI算法工程师,在他看来,“对于开放环境的事件处理,AI是缺乏原理理解能力的,因此对于无法穷举的开放场景工作任务,目前还是难以胜任的。”

这背后的逻辑是——人工智能是一定规则下的智能,而开放环境打破了特定的规则,由于开放环境的数据来源不稳定,一旦出现特征不足的数据,就难以智能起来。

以车险理赔场景的一个实际事件为例。当前都是通过图像实现车辆的定损操作,但图像是由车主或修理厂人员拍摄的,难免出现不规范操作,如果图像拍摄得过于局部,AI就无法判断损伤所述部件(如下图)。这时,AI就可能会给出一个很混乱的结果,无法非常准确地完成任务。

究其主要原因,还是因为场景非常开放、图像来源没有约束性,一旦出现AI未学习过(数据特征不足)的情形,AI便“不可为”。 刘金龙表示,“AI完成工作的前提是:预设规则,对于无法穷举所有规则的事件就会表现出不够智能的一面,主要还是因为AI对于开放环境中基于原理的推理能力是不足的。”

除此之外,刘金龙认为在需要投入感情(情感)的工作方面,还只能作为一种辅助工具来运用。

例如教书育人,需要教师用心、用情去认知每一个学生,然后根据不同学生的特点,用不同的方法引导学生打开心中疑问;教师也需要以身作则,帮助学生树立正确的价值观、人生观。同时,教育需要理解事物的原理,剖析其中的真谛,但AI目前是只接受结果不可解释过程的一项技术,是无法把事物的本质展现给学生的。而学生学习的目的却是理解事物的本质,进而举一反三、融会贯通。

其次在老年人的陪护方面,需要一个有情感的人去交流、去陪伴,而不是冷冰冰的机器人的简单对话,或是机械地辅助自理生活。

再比如法律工作,“法律无情,人有情”,在处理法律工作的过程中并不全部是依据法律条文一一定责的过程,而是法律、事实和情感的交互过程,进而交融出一个合理的结果。

“以上都不仅仅是经验主义,也不是程序化工作,也没有办法数字化。因此,这些目前均不适合AI来独立完成”, 刘金龙说道。

写在最后

我们向往AI更智能,帮助我们“躺平”。但正如本文三位产业人士所探讨,从AI本身的原理和特性、AI落地的商业化探索,AI与实际场景交融的短板来看,总还是有那么一些“不可为”。

就像万里星光中,还尚且朦胧的点滴光亮,照亮了AI的真相和方向。

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
DSPIC33EP512MU814-I/PH 1 Microchip Technology Inc 16-BIT, FLASH, 60 MHz, MICROCONTROLLER, PQFP144, 16 X 16 MM, 1 MM HEIGHT, LEAD FREE, PLASTIC, TQFP-144

ECAD模型

下载ECAD模型
$13.09 查看
STM32F103CBT6 1 STMicroelectronics Mainstream Performance line, Arm Cortex-M3 MCU with 128 Kbytes of Flash memory, 72 MHz CPU, motor control, USB and CAN

ECAD模型

下载ECAD模型
$11.49 查看
ATXMEGA256A3U-AU 1 Atmel Corporation RISC Microcontroller, 16-Bit, FLASH, AVR RISC CPU, 32MHz, CMOS, PQFP64, 14 X 14 MM, 1 MM THICKNESS, 0.80 MM PITCH, GREEN, PLASTIC, MS-026AEB, TQFP-64

ECAD模型

下载ECAD模型
$6.75 查看

相关推荐

电子产业图谱

与非网资深行业分析师。主要关注人工智能、智能消费电子等领域。电子科技领域专业媒体十余载,善于纵深洞悉行业趋势。欢迎交流~