近日,上海天数智芯半导体有限公司(以下简称“天数智芯”)正式发布了国内首个通用计算应用开发及评测平台——DeepSpark。
图 | 天数智芯CTO吕坚平
带着什么是DeepSpark,DeepSpark有什么用,DeepSpark的推出对天数智芯和GPU生态有什么好处等问题,笔者采访了天数智芯CTO吕坚平先生,并将内容整理与大家分享。
什么是DeepSpark?
DeepSpark是天数智芯为了帮助大家识别运算业务中的有效算力而推出的百大应用开放平台。
为什么是百大应用,不是十大或是千大应用?天数智芯CTO吕坚平表示:“仅天数智芯当前适配的行业就有二十多个,客户已超过300家,应用的适配场景已达到200个,所以十太小,而万事开头难,百大应用只是个起点,未来会有更大的量级。”
图 | DeepSpark平台的三大组成元素
从组成的角度来看,DeepSpark平台主要由三大部分组成:应用算法、应用框架和一站式评价体系。
关于应用算法,在当前DeepSpark的第一个版本中,天数智芯提供了超过100种模型和算法,涵盖人工智能图像、视觉以及自然语音等日常所用的算法模型、3D重建模型、通用计算模型、高性能计算模型等。以分类算法为例,从早期的VGG安全结构到后续的ViT算法,覆盖了该领域过去十几年所积累的算法演变。而这只是一个开端,新型计算模式代表不同的业务需求和计算、存储、传输的不同耦合方式,以CVPR算法为例,过去它一直代表着行业算法的最新趋势,比如CVPR今年开始支持点云新型的数据类型,这将大大扩展人工智能以及通用计算领域所使用的范围。而DeepSpark平台每年都会根据CVPR最新的流行趋势和上面的排行榜来支持最新的算法模型。
图 | DeepSpark平台提供了超过100种的模型和算法
在语音领域,DeepSpark平台将支持国内的语音分析大模型,如CPM、CRO等。在通用计算领域,在很多场景中都需要预处理才能进行人工智能分析,由此引出了一系列的数字信号分析和要求,因此会有大规模的线性方形组求解需求,这时候就要用到RTM、RNA等通用计算算法,最后融合通用计算算法、超算算法、人工智能算法来覆盖新的应用领域。所以通过历史维度覆盖算法的历史变化过程,并且在应用维度上覆盖各项不同领域的两个角度,DeepSpark将向行业首次提出通用GPU或者通用算力的算法集。
对于框架的支持,DeepSpark平台除了可以较好地支持TensorFlow、PyTorch、WeNet、MDetection、飞桨、昇思等架构以外,还能解决跨平台的迁移难,以及开发应用缺少工具的痛点。
未来,DeepSpark平台将以开源社区的方式进行运维,在这个平台中,天数智芯将首先分享与合作伙伴和社区开发者共建的落地成果,来吸引更多的开发者加入,加快国内GPU生态的建设。同时DeepSpark平台还将针对可见的商业落地行业提出行业参考型的测试环境,方便大家选择合适自己的算力。
国产通用GPU面临“大落地”,DeepSpark将成为选型神器
根据Verified Market Research数据,2020年GPU市场规模为254.1亿美元,图像显示、人工智能深度学习的需求支撑GPU市场持续增长,预计到2027年将达到1853.1亿美元。而在独立GPU行业,英伟达可谓是独霸天下。2021年第四季度,全球独立GPU市场中,英伟达独占81%的市场。
这两组数据表明,GPU的市场容量增势喜人,且存在非常大的国产化空间。于是这几年通用GPU成为资本市场的新宠,根据不完全统计,中国大陆大约有7家相对主流的通用GPU公司,它们分别是天数智芯、壁仞科技、登临科技、摩尔线程、珠海芯动力、沐曦和红山微电子。
从产品侧来看,天数智芯是目前国内唯一一家有量产产品落地的公司。
- 2021年3月,天数智芯发布了国内首款通用GPU训练芯片天垓100,以及天垓100加速卡,天垓100为天数智芯自主研制7纳米GPGPU高端自研云端训练芯片,具有全方位生态兼容、高性能有效算力、指令集编程架构以及软硬件全栈支持等优势。
- 2022年4月,天数智芯宣布其首款通用GPU天垓100及天垓100加速卡自发布以来,累计获得的订单金额已经接近2亿元,成为中国唯一量产的通用GPU产品。
- 2022年5月,天数智芯再次宣布已成功点亮7纳米通用GPU推理芯片智铠100,目前在第一批客户的验证和适配阶段,预计将于今年四季度正式发布,年底实现量产。
此外,吕坚平分析:“近年来,大算力AI芯片的落地总有些差强人意,到底是哪个环节出了问题?可能还是出在通用性上。通常,为了更好地匹配某些应用场景,大家总会在某些少数性能指标上下功夫,而一旦将该芯片面向千行百业,所需要的算法就会各不相同,太强的专用性会限制算法的迭代和演进,这时候硬件的通用性就变得非常重要,这也是为什么这么多年来,AI芯片厂商总做不过GPU头部厂商的原因。而要做到通用性就必须从芯片本身架构和客户的支持这两个方面下功夫。”
图 | DeepSpark平台分析结果示例
那么,对于硬件系统厂商来讲,如何才能验证市场上GPU或是AI芯片的通用性呢?在之前是没有这个工具的,而现在天数智芯推出了DeepSpark这样一个开放性的平台,可供整个行业的下游厂商来根据其应用场景测试出相应芯片的有效算力,在GPU盲盒式选型的当前,DeepSpark平台可谓是选型神器。
值得一提的是,这种对比是没有统一参照原的,硬件系统厂商可以根据自己的需求,搭建硬件平台,实现任意两款芯片产品的多方位性能对比。
那么,DeepSpark的推出对天数智芯和GPU生态有什么好处呢?吕坚平表示:“DeepSpark的服务对象是应用,它可以让天数智芯等企业的下游泛在客户不再盲目地追求性能指标,引导大家往通用性的方向去走,同时还能让大众明白,不是某个性能指标高就是超过英伟达,好用才是王道。”