几千年前,人类的脑力和肌力发展相对缓慢,而1800年后的机械化时代,机器开始替代人类的体力,随后脑力也逐渐得到增强。如今,在AIGC的推动下,各行业对AI的应用正在加速,我们已经从弱智能时代迈入了强智能时代,甚至开始展望通用人工智能乃至超级人工智能的未来。
7月6日,在世界人工智能大会(WAIC)期间,在题为“智”由“芯”生——RISC-V和生成式AI的论坛上,芯原股份创始人、董事长兼总裁,中国RISC-V产业联盟理事长戴伟民对AIGC芯片的机遇和挑战进行了深度剖析,他强调,在探讨AIGC芯片的机遇与挑战时,我们需从“第一性原理”这一核心思想出发,重新审视生成式人工智能的发展历程及其对各行各业的深远影响。
戴伟民表示,回顾历史,图灵在1950年曾预测,在60至100年内,即2010年至2050年间,超级智能可能会出现。而库兹韦尔则预测这一事件将在2020年代中发生。去年3月,马斯克和其他千名科技界人签署了一封公开信,呼吁暂停至少六个月的人工智能系统开发。这些历史节点和事件都预示着AI技术的迅猛发展及其带来的挑战。
一位因“泄露信息”被解雇的前OpenAI的安全研究员Aschenbrenner预测,在2025-2026年,人工智能将达到大学生的智力水平,2027年AI模型将能够完成人工智能研究人员/工程师的工作,同时一个领先的人工智能实验室将能在一分钟内训练出一个GPT-4级别的模型。这些预测揭示了AI技术的迅猛发展势头。
然而,随着模型规模的不断增长,训练计算量也呈指数级增长。GPT4的出现标志着这一趋势的显著加速,随后GPT5、Gemini等模型的相继涌现,展示了AI技术的快速迭代。在这个过程中,各大科技巨头如谷歌、OpenAI等都在竞相追赶,不断推出新的多模态交付模型和训练技术。但值得注意的是,并非所有技术都是最优选择,例如对于GPU是否就是最好的选择,市场上仍存在争议。
戴伟民认为,在当前“百模大战”的背景下,实际上并不需要如此多的模型,预计到2028年,中国基础大模型的数量将少于10个。他指出,建立训练中心需要大量训练卡,但这并不是最有效的利用方式。更重要的是垂直领域的微调技术,这是在端上实现的关键。实际上,到2028年,用于端侧微调卡和推理卡的销售额将超过用于云侧的训练卡;到2030年,关键计算领域的半导体收入将达到数万亿美元,其中服务器、电脑和手机的增长尤为显著,这很大程度上得益于AI的推动。
在处理器方面,带有AI功能的处理器与一般处理器在半导体中的价值存在显著差异,到2030年,生成式AI将使服务器领域的半导体收入增至三倍,这是一个巨大的市场机遇。然而,当前的一个问题是数据建好后却缺乏合适的芯片来运行,这导致了英伟达等公司的芯片被倒卖以获取利润。采用生成式AI与不采用之间存在巨大的差异。
各大科技公司如Intel、微软等都在积极应对这一趋势。微软通过OpenAI定义了40TOPs作为AIGC的标准,并认为未来的电脑必须具备这一能力才能具有市场竞争力。同时,联想等公司也在积极布局,尽管它们目前还缺乏自己的芯片。在Phone领域,苹果和高通都在积极将AI技术融入手机中,以提升用户体验。
此外,AR眼镜作为一个新兴的市场机遇也受到了广泛关注。尽管谷歌在这方面已经努力了十年但仍未实现商业化,但国内的一些技术领先者正在迅速崛起。戴伟民认为国内的AR眼镜将比谷歌早一年实现商业化,而谷歌则会比苹果早一年。预计到2026年,全球双目全彩AR眼镜出货量将突破1,000万台。
戴伟民强调,端上有很多机会都与芯片息息相关。需要关注Chiplet 的发展,包括IP芯片化、芯片平台化、平台生态化。苹果已经在使用最先进的工艺来制造最大尺寸的芯片,并通过多芯片并联的方式来实现更大的存储容量,这对于AI应用来说至关重要。同时,业界也看到了芯原高端应用处理器项目完整软件堆栈,以及FuSa IP、VADP自动驾驶软件平台框架在汽车等AI终端领域的广泛应用前景。