加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
    • 中国大模型摆脱“焦虑症”,破局之路在行业
    • 政企行业大模型挑战重重,工程化能力是“胜负手”
    • 先行者迈出坚实步伐,行业大模型未来可期
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

走出AI大模型“焦虑症”,政企行业找到了“最优解”

06/27 09:10
317
阅读需 10 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

自2022年底以来,随着ChatGPT横空出世并迭代升级,全球各国、各行各业面对AI大模型似乎都FOMO了(Fear of Missing Out,错失恐惧症),动作频频生怕错失机遇。然而迄今为止,在轰轰烈烈的“炼大模型”过程中,除了英伟达赚得盆满钵满外,其他玩家都还没找到稳定且持续的商业模式。相反,随着参数规模的日益膨胀,模型训练的算力开支越来越高,大投入却看不到产出的情况下,新的“焦虑症”又蔓延开来。

在大模型“军备竞赛”最激烈的美国,资本市场近乎进入“癫狂”状态。

这两年来,美股市场只要跟AI相关的股票都涨疯了。苹果一个AI进展发布会,隔天市值就上涨2142亿美元;以微软为首的美股“Big 7”的市值,更是达到史无前例的14万亿,占据标普500的32%,纸面市值与实际价值倒挂,“癫狂”程度史无前例。投行分析师们开始焦虑一个比互联网泡沫更大的AI泡沫即将到来。

在中国互联网圈,巨头们焦虑与美国的差距的同时,开始不断压低每Token的价格,提前开启简单粗暴的价格战。其中,字节跳动豆包大模型将通用模型pro-128k版的推理输入价格定在0.005元/千tokens,较行业锐降95.8%;阿里通义千问将主力模型Qwen-Long的API输入价格降至0.0005元/千Tokens,直降97%;百度甚至宣布将文心大模型的两款主力模型ENIRE Speed和ENIRE Lite全面免费。

一方面是AGI的崇高理想,另一边是ROI的残酷现实,面对AI大模型这班开往未来的列车,不“上车”不行,“上车”后找不到好位置、坚持不到终点也不行,到底该何去何从?在中国政企行业,一群富有远见的先行者将通用大模型与特定行业的专业知识相结合,打造属于自己的专属大模型,以加速行业AI应用落地,真正兑现大模型的价值,为业界走出AI大模型“焦虑症”找到了“最优解”!

中国大模型摆脱“焦虑症”,破局之路在行业

从全球“大模型之争”开启之初,“中美在AI领域差距有多大”就一直都是公众关注的热点议题,从1~2年到8~10年不等。必须承认,我国在算力、算法和数据领域其实并不具备优势:高端算力卡被英伟达卡脖子无法供应,短时间内自有制程和设计又无法跟上;算法领域,虽然模型数量众多,但大多数是基于国外开源架构优化,缺乏自主性和领先性;数据领域,我们的开放数据和国外不在一个数量级上,中文语料严重不足。这些差距是短期内难以抹平的,这时候,缩短差距的正确打开方式,自然不是以己之短博人之长。

从另一个角度看,我国有全球唯一的全工业门类、最多的金融消费人群以及最大规模的政务和城市体系,产生了丰富的场景和私有数据,这些都成为发展行业大模型的天然土壤。因此,比拼应用成为中国大模型破局的一条有效路径,通过大模型赋能一个个行业细分场景,最终形成战略突围。

以差异化优势入局,可以预见,今天率先拥抱大模型的行业企业和组织,面对的将是一个划时代的重大战略机遇。

政企行业大模型挑战重重,工程化能力是“胜负手”

当然,站在新时代的起点,政企行业打造大模型,依然是挑战重重,因为大模型的应用本身就是一个复杂的系统工程,除了单点技术的持续突破外,更需要基于场景和需求匹配合适的技术,通过全链路、多技术融合的系统性创新整体推进。

首先,大模型不是孤立的技术,必须重视软硬件基础设施的协同发展。除了大模型本身,我们还需要关注其背后的技术生态系统,包括开发工具、计算架构以及硬件设施如算力、存储和网络。在设计和验证过程中,必须考虑性能、可靠性、可维护性和兼容性,确保系统的高效和稳定运行。

第二,行业大模型需要AI-Native的基础设施。一般企业可以直接选择公有云享受云上的充沛算力,但对于政府、金融、电力等大型政企而言,为了满足安全合规要求,混合云才是更优选,即先借公有云的超大算力和数据训练基础大模型,再在私有云里结合私有数据二次训练得到企业专属大模型,最后在边缘云推理实现场景化应用。

第三,大模型需要建立AI开发工作流,促进模型确定性交付。大模型的开发是一个复杂的系统工程,需要跨团队协作和迭代开发。为了提高开发效率和质量,需要建立一站式的AI开发工作流,实现标准化和自动化,减少开发过程中的不确定性。

第四,大模型需要重视数据工程,打造优质数据集。高质量的数据是大模型成功的关键。目前中文数据集与英文存在差距,需要通过建立数据工程能力,优化数据的供应、流动和使用,为大模型高质量供数。

第五,行业大模型不适合孤军作战,需要着力培育产业生态。生态是发展大模型不可或缺的一环,这需要政府和行业头部企业从技术生态、数据生态、模型生态和应用生态四个层面,去构建AI时代开放、可闭环、有质量的生态体系。

最后,大模型不是一锤子买卖,需要持续运营与优化。大模型运营和建设同样重要,持续的运营和优化对于大模型平台的长期价值至关重要,这要求企业建立适合的流程、组织结构和人才队伍,不断优化现有场景并探索新的应用领域。一言以蔽之,行业大模型考验的不是单项能力,而是全流程融会贯通的工程化能力。

先行者迈出坚实步伐,行业大模型未来可期

综上不难看出,尽管当前大模型在技术和价格上卷得如火如荼,但其兑现价值的“主航道”在行业,真正的赛点在于落地。在行业大模型的大赛道上,不盲目追求堆算力、堆参数量,而是聚焦技术与场景的深度融合,踏踏实实积累工程化能力,帮助行业大模型落地才是关键。从这个层面讲,AI for industries的华为云与政企行业先行者的联合创新实践,可谓走在了正确的道路上。

去年,华为云就率先发布业界首个大模型混合云华为云Stack。在近期的华为开发者大会上,华为云更进一步发布大模型混合云十大创新技术,包括多样性算力调度、算子加速、云边协同等等。既有根技术研发实力,又有业界最全的AI大模型全套工具链和软硬件产品,华为云Stack一套组合拳下来,行业大模型的焦虑也被治好了大半。

比如,从2022年开始,山东能源集团携手华为云基于混合云打造全球首个矿山大模型,已在煤矿领域9个专业40多个场景应用实践。今年1月,鄂尔多斯与华为联合打造内蒙古首个以行业AI大模型为核心的工业互联网平台,在煤矿领域提升、主运、安监、防冲、采煤、掘进、辅运、洗选、焦化等9个专业实现了26个场景智能化,达到可视、可管、可溯规范化作业,提升安全生产能力的同时有效提高了生产效率和效益。

更值得注意的是,先行政企的行业大模型不仅是自建自用,更是在牵头打造示范场景并沉淀经验,对外输出向行业赋能。比如,鄂尔多斯工业互联网平台目前已完成44个AI大模型应用开发,上架270多款商品,为28家AI企业、16家矿鸿企业共44家应用开发者以及当地300多家矿山生产企业提供了开放可靠的交易平台。

展望未来,相信在华为云及产业上下游各方的共同努力下,依托我国场景丰富的优势,大模型必将能够打开更广阔的行业智能化天地,加速迈向智能世界,释放更大的经济和社会效益!

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
MKL02Z32CAF4R 1 Freescale Semiconductor Kinetis L 32-bit MCU, ARM Cortex-M0+ core, 32KB Flash, 48MHz, WL-CSP 20

ECAD模型

下载ECAD模型
$2.7 查看
DS3234SN# 1 Maxim Integrated Products Real Time Clock, Non-Volatile, 1 Timer(s), CMOS, PDSO20, 0.300 INCH, ROHS COMPLIANT, SOP-20
$10.19 查看
ATSAMA5D35A-CN 1 Atmel Corporation RISC Microprocessor, 536MHz, CMOS, PBGA324, 15 X 15 MM, 1.40 MM HEIGHT, 0.80 MM PITCH, GREEN, MO-275KAAE-1, LFBGA-324
$13.79 查看

相关推荐

电子产业图谱

科技使能新商业——极客网创办于2012年,尊崇“科学技术是第一生产力”,汇聚500位科技及垂直行业创作者,以深度评论和精选资讯联接科技商业创新者、观察者和读者,为30万+公号读者呈现科技创新在新商业变革中的角色和能量。