加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
    • 400+企业接入文心一言有多少能抵达“最后一公里”?
    • 生成式AI爆发前夕产业呼唤更适合跑AI的云
    • AI走向平民化,百度要打造人人能用的AI开发平台
    • 结语:生成式AI风起云智一体趋势凸显
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

接入百度文心一言,只是AI落地“长征”的第一步?

2023/03/09
728
阅读需 15 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

文心一言上线进入倒计时,对话百度AI中台负责人。

生成式AIAIGC)正引爆全球,各行各业的CEO和开发者们都在寻找机会,搭上这趟数智化“快班车”,从而实现业务转型、业绩增长。

在国内,接入百度对话机器人“文心一言”无疑成为企业进入AIGC赛道“掘金”的一张入场券。根据官方数据,已有超400家企业宣布接入文心一言,覆盖消费、工业、旅游、传媒等各个领域。

无论是让文心一言做搜索引擎的“大脑”,还是基于其开发智能媒体小编、智能家居助手、电商金牌客服等应用……我们看到,AI不仅在口口相传中名气大涨,也在这一过程中变得更加规模化、平民化、普惠化。

百度创始人兼董事长李彦宏在近日的内部信中说:“AI技术已经发展到一个临界点,各行各业都不可避免地被改变,中国AI市场即将迎来爆发性的需求增长。”

在生成式AI爆发的前夕,企业接入文心一言这样的应用,无疑意味着其搭上了通往数智化高地的“快班车”。但这显然只是“长征”的第一步。如何让AI技术真正跨越工程化鸿沟,飞跃AI落地的“最后一公里”?这是各行各业的CEO和开发人员眼下关注的问题,因为过去几年AI工程化确实经历了不少挫折。

近日,通过对话百度AI中台的三位资深专家,智东西对这一问题进行了深入探讨。百度AI中台,简单说是百度智能云旗下的AI开发PaaS(平台即服务)平台,后续将推动文心一言大规模产业落地,面向企业提供一系列AI开发和运维工具。

400+企业接入文心一言有多少能抵达“最后一公里”?

根据官方消息,百度文心一言将在3月16日正式推出。届时,百度多项主流业务将接入文心一言,包括百度搜索,以及基于百度智能云的智能语音助手小度、智能驾驶阿波罗(Apollo)等;同时,目前已有超400家企业宣布加入文心一言生态圈,享用这一服务。

从AI产业落地的流程来看,接入文心一言或许只是一个开始。

要实现技术到产品的“最后一公里”飞跃并不容易,AI开发工程化尤为重要。如果把AI模型比成一个汽车发动机,AI工程化就好比将一台发动机装配成一辆可自如行驶的汽车的过程。

百度AI中台相关负责人告诉智东西,在过去很长时间里,AI工程化面临以下几个显著问题:

1、AI开发流程长且复杂,行业缺乏规范。AI开发流程大致包括:数据采集和标注、模型训练、应用部署、数据回流和模型观察,没有规范意味着混乱无序。

2、市面上众多AI工具使用门槛高。AI模型面对碎片化场景会效果衰减,企业需要做二次开发,但市面上的AI开发工具不是不好用,就是不符合需求。

3、客户基础设施不完善、内部孤岛严重、人才短缺。比如某银行客户各部门建立的17个云系统,同时各部门孤岛严重、需求难以聚合,加之缺乏专业AI人才,众多因素使得花大成本购入的AI技术成为烂尾工程。

为了应对这些AI工程化难题,整套百度AI中台的价值在文心一言的落地中凸显了出来。

来说,百度AI中台是一个助力企业AI模型开发和运维的PaaS平台。其面向金融、能源、互联网、教育等多行业提供人脸识别、OCR、图像、AR、自然语言处理等多种AI能力(文心一言是其中一项AI服务),并帮助其实现简单、快速部署和验证。

百度AI中台相关负责人告诉智东西,一方面,文心一言本身的数据准备、标注、模型训练、应用评估等开发过程,都是基于百度AI中台完成。另一方面用途可能更受企业关注,那就是助力文心一言的应用开发。

具体来说,在文心一言相关模型开发过程中,百度AI中台可提供从数据模型评估、推理优化、数据回流等全生命周期开发工具,以保证模型训练效果。比如:在数据标注环节,百度AI中台提供智能标注方式和标注标准,最高可使成本降低70%;在算力消耗方面,百度AI中台能依照规范提高GPU利用率,能提升资源利用率40%~80%。

总的来说,有了AI中台中一整套工具链,企业将能更好地飞跃产品落地的“最后一公里”,从而实现AI投入变现。

生成式AI爆发前夕产业呼唤更适合跑AI的云

众所周知,算法、算力和数据是AI落地的三大要素。

当下,基于大模型的AIGC正进入爆发前夜,新的海量智能算力需求也随之产生。知名调查机构IDC预测,人工智能产业的软件硬件和服务有望在2023年突破5000亿美元大关。智能算力成为产业最大增量。

百度AI中台相关负责人告诉智东西,在这种背景下,产业需要“更适合跑AI的云”。

何谓“更适合跑AI的云”?该负责人解读道,从传统思路来看,云计算主要支撑企业数字化,AI契合智能化升级,往往分阶段完成;但现在,很多企业会选择将数字化和AI化一起规划、齐头并进,效率会高得多——这就需要更适合跑AI的云。而随着生成式AI爆发,适合跑AI的云无疑需要支持大模型,支持更高速效的训练和推理,需要更好的异构算力支持。

这位负责人称,百度AI大底座正是提供了这样的新型AI基础设施。

简单来说,百度AI大底座是集百度十年AI研发之大成的“全栈自研的AI基础设施”。百度AI大底座将AI生产全要素,包括自研芯片、大模型、深度学习框架、AI应用集于一身,并可面向企业真实业务场景进行端到端的全流程调优。

纵观人工智能产业,我们看到当下市面上实际上已经出现了“AI大装置”等同类产品。但就像“发动机”有很多车企造,每一家的质量水平有所区别一样,百度AI中台负责人告诉智东西,百度AI大底座相比同行竞品的一大特征就是:“全要素”和“端到端”。

▲百度AI大底座架构图

具体来看,百度AI大底座由前文提到的AI中台、底层百舸异构计算平台两部分构成。百度AI中台是用户“界面”,文心大模型是其中可调用的一个关键模型PaaS服务。百舸异构计算平台是底层基础设施服务平台,通过自研芯片、计算、存储、加速等多方面技术提供加速算力IaaS(基础设施即服务)服务。

▲百度AI大底座产品图谱

这位负责人指出,这种端到端的能力十分关键。比如有些企业可能买了最好的AI模型,但由于在开发中缺乏对数据的标注和结果监控,就导致AI应用中间断层,久而久之AI模型就被闲置了。举个具体案例,比如某银行在布局OCR技术中,曾就有旗下七八个部门采购了不同厂商的产品,并不会考虑数据回流等全链条问题,就导致整体效果大打折扣。

可以看到,基于AI大底座,百度一定程度上建立了在生成式AI爆发前夕的技术优势。根据IDC数据,百度智能云已连续四年居AI公有云市场第一。而这种先发优势,很有可能在AI大模型时代保持叠层效果。

AI走向平民化,百度要打造人人能用的AI开发平台

生成式AI的爆发也意味着AI进一步走向“平民化”。

这种核心价值层面的升维,不仅大大提升了AI的知名度,实际上也对AI开发工具提出了更加深刻的要求。

具体来说,大模型本身就帮企业简化了AI工程化流程,企业只需结合业务具体场景进行小样本调优就能获得所需应用。

但与此同时,承载了“平民化”期待的生成式AI,需要在工程化中延续这一“普惠”价值。新的问题就出现了:大模型拥有巨量参数,一次调优涉及的资源消耗依然可观;同时这类技术往往进入企业业务核心,带来更高价值的同时,一旦出问题后果会更严重。

因此要实现真正的AI平民化,一整套高效易用的AI规范与标准、工具平台尤为重要,而这需要产学研多方力量共同努力。

面向AI普惠发展诉求,百度已积极参与行动。2022年底,为了引导产业有序发展,中国信息通信研究院联合百度、阿里、华为、“AI四小龙”等几十家优秀企业编制了MLOps系列标准。MLOps(Machine Learning Operations),简单来说,是指AI开发与运维的全流程。信通院MLOps标准则可以理解为一本汇集AI开发全流程的最佳实践“宝典”,其诞生标志国内AI开发从混乱无序走向标准统一,将大幅提升AI开发质量和效率。

在这一背景下,百度AI中台已首批通过信通院MLOps系列标准,意味着其能够让企业获得最专业的AI开发服务,以业界较低的成本开发出需要的AI应用。换句话说,MLOps标准提供了一套AI软件项目研发和运营的方法论,百度AI中台则为企业提供了对应方法论的“绝佳工具”。

百度AI中台相关负责人说,百度智能云企业AI开发平台的整体能力在需求管理、数据工程和模型开发三个模块均达到了旗舰级水平。

在功能上,百度AI中台具有完善的需求和代码管理流程,AI模型生产过程具备可视化建模、自动化建模、作业建模、工作流等建模方式,对底层计算资源具有完备高效的管理模式,对模型具有全面的管理能力,对数据具有功能丰富的管理平台和质检能力。

在服务过程上,百度AI中台从组织结构到流程管理,再到管理工具方面,均具有较高的服务水平,能够为外部企业客户的需求提供较为快速和较高质量的响应。

百度AI中台相关负责人告诉智东西,在AI基础设施能力获得权威认证背后,AI普惠实际上是百度智能云长期以来的一大核心价值。

这不是一蹴而就的。他回顾道,2016年,百度发布了国内第一个深度学习框架——飞桨,随之百度内部开始“赛马”做多个机器学习平台。2018年,高级开发能力的BML、低门槛开发的EasyDL、以及用户实训比赛社区的AI Studio三大平台脱颖而出。

“分久必合,合久必分”。2020年百度将这三大平台整合,并按照MLOps的过程将业务划分为样本数据中心、开发中心、模型中心和服务运行平台四大阶段板块,基本涵盖了人工智能开发运维的全生命周期。通过2021~2022年的一年三到四次迭代,这一平台最终实现了AI开发低门槛目标。

可以看到,通过八年内部赛马打造百度AI中台,百度正将其“反馈驱动创新”的科学方法论赋能给企业,更将其AI普惠价值传达给行业。

结语:生成式AI风起云智一体趋势凸显

当下,我国人工智能产业在经历了十几年波峰波谷之后,正乘着生成式AI技术的东风迎来新的春天。凭借技术属性和社会人才等各方面条件,AI技术落地的广度深度延展,正走向规模化、平民化、普惠化。

从企业角度来看,他们正通过接入文心一言等产品的方式,实现数字化与智能化转型的齐头并进。尽管正如科技部部长在两会“部长通道”中所说,国产力量与OpenAI等国际公司仍存在差距。但百度文心一言无疑是国内企业吃到AI技术新红利的一条“快车道”入口。

与此同时,企业接入大平台大模型也只是一个开始。下一步,如何基于AI大模型进行二次开发、数据挖掘、优化调优及部署测试,让AI实现“最后一公里”飞跃,成为更关键的问题。

这也使我们越来越意识到,AI落地是一条算法、算力和数据跨越漫长开发链条的握手合作。产业呼唤更适合跑AI的云,云智一体也成为云计算产业发展的重要趋势。

作者 | 李水青

编辑 | 漠影

百度

百度

百度是拥有强大互联网基础的领先AI公司。是全球为数不多的提供AI芯片、软件架构和应用程序等全栈AI技术的公司之一,被国际机构评为全球四大AI公司之一。百度以“用科技让复杂的世界更简单”为使命,坚持技术创新,致力于“成为最懂用户,并能帮助人们成长的全球顶级高科技公司”。

百度是拥有强大互联网基础的领先AI公司。是全球为数不多的提供AI芯片、软件架构和应用程序等全栈AI技术的公司之一,被国际机构评为全球四大AI公司之一。百度以“用科技让复杂的世界更简单”为使命,坚持技术创新,致力于“成为最懂用户,并能帮助人们成长的全球顶级高科技公司”。收起

查看更多

相关推荐

电子产业图谱