• 正文
  • 相关推荐
申请入驻 产业图谱

一文看懂DeepSeek如何火爆全球?

02/11 12:30
2701
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

短短两周,中国人工智能初创公司DeepSeek火爆出圈。它拿下了美国和中国区App Store免费榜的双料第一,成为首个超越OpenAI ChatGPT的AI助手类应用。外媒用“震动硅谷”形容DeepSeek带给美国的行业震撼,其主打的低成本开源模型概念更冲击华尔街,英伟达市值一周缩水超5000亿美元。

DeepSeek是什么?

DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,总部位于浙江杭州。它由量化资管巨头幻方量化创立,专注于大语言模型(LLM)及相关AI技术的研发。

DeepSeek为何如此震撼?

DeepSeek能够引发业界震动的主要原因在于其低廉的成本和开源等特点。该公司去年底发布的大型语言模型DeepSeek-V3,训练成本仅为557.6万美元,与美国OpenAI最新版chatGPT的训练成本相比,差距约为20倍。API调用成本更是只有OpenAI的三十分之一。

AI产业是否存在泡沫化?

自从2022年底OpenAI掀起旋风以来,「不动辄重砸数十亿美元没法训练出强大AI系统」始终是主流观点,市场认为唯有像微软、Google、Meta等科技巨头才玩得起先进AI,英伟达这类AI芯片厂更是一片光明的景象。

然而DeepSeek仅花费约560万美元和相对原始的运算能力训练自家系统,这比Meta建构旗下最新AI所花资金便宜约10倍,引来AI产业反思,是否真有必要砸天文数字的资金?AI产业又是否存在泡沫化?

DeepSeek是如何办到使用较少芯片?

美国的顶尖AI工程师们表示,DeepSeek的研究论文提出一些让人印象深刻的巧思来降低芯片使用量,简言之就是种让芯片分析数据时更有效率。

先进AI系统需归纳文字、图片、影音等大量数据来学习技能,DeepSeek则把这些数据分析工作分配给多个不同模型,每个模型负责特定领域,如此一来维持高效数据处理的同时还缩短运算时间。这种方法之前不是没有人用过,只是没法像DeepSeek用更少的运算能力做到。

精通建构高效AI系统的卡内基美隆大学(CMU)计算机科学教授戴特摩斯(Tim Dettmers)说:「现在看显然除OpenAI这类公司外,其他人也能玩。DeepSeek使用的方法人人都能依样画葫芦。」.

何谓开源AI?

与许多公司一样,DeepSeek也把自身最新的AI系统「开源」,即把支撑AI的运算代码公开给其他企业和研究人员,让所有人都能使用这些技术来建构、推广自己的产品。DeepSeek与其他企业能如此迅速拿出具竞争力的AI产品,部分也是受惠于他人开源。

中美科技巨头争相接入DeepSeek

DeepSeek爆火后,海外巨头率先接入DeepSeek模型。

1月31日,英伟达宣布DeepSeek-R1模型登陆NVIDIANIM。同日,亚马逊和微软也接入了DeepSeek-R1模型。英伟达称,DeepSeek-R1是最先进的大语言模型。

2月份,国内几大云平台也宣布上线DeepSeek系列模型。

2月1日,华为云在官微宣布,与硅基流动联合首发并上线基于昇腾云服务的DeepSeek R1/V3推理服务,其性能可与全球高端GPU部署模型相媲美。

2月2日,腾讯云称,将DeepSeek-R1大模型一键部署至其“HAI”平台,开发者仅需3分钟即可接入调用。

2月3日,百度智能云也宣布,其千帆平台正式上架DeepSeek-R1和DeepSeek-V3模型。阿里云也称,其PAI Model Gallery支持云上一键部署DeepSeek-V3和DeepSeek-R1模型,

2月4日,字节跳动旗下火山引擎也宣布,全面支持DeepSeek系列大模型,包括V3和R1等不同尺寸的模型,企业用户可在火山引擎机器学习平台veMLP中部署或通过火山方舟平台直接调用。此外,联通云、天翼云等平台也宣布接入DeepSeek模型。

.......

芯片厂商加速对接完成适配

在芯片领域,国内几大GPU厂商加速跟DeepSeek模型的对接,完成适配,提供算力支持。

2月5日,华为官方表示,DeepSeek系列新模型正式上线昇腾社区;Gitee AI同日表示,DeepSeek-V3满血版在国产沐曦GPU首发体验上线。

中科曙光国家先进计算产业创新中心有限公司发文宣布,海光信息技术团队已完成DeepSeek V3和R1模型与海光DCU的适配并上线;

摩尔线程也宣布,已实现对DeepSeek蒸馏模型推理服务的部署,并即将开放自主设计的夸娥(KUAE)GPU智算集群,支持DeepSeek V3、R1模型及新一代蒸馏模型的分布式部署。天数智芯也称,联合Gitee AI正式上线DeepSeek R1模型服务。

据不完全统计,截至2月7日,已有17家国产芯片企业相继宣布适配或上架DeepSeek模型服务,分别为华为昇腾、沐曦、天数智芯、摩尔线程、海光信息、壁仞科技、太初元碁、云天励飞、燧原科技、昆仑芯、灵汐科技、鲲云科技、希姆计算、算能、清微智能、芯动力、龙芯中科等。

有机构认为,DeepSeek通过模型层面创新,在芯片受限与低算力投入的背景下,达到全球顶尖闭源模型的性能水平,属于生态级突破,有望带动国内AI全产业快速发展,同时其开源与低成本特性也有望赋能AI应用厂商,加速推动端侧AI落地。

附:DeepSeek时间线梳理

注:文章综合相关报道,仅供学习和交流之用,不构成任何建议,不代表本号立场,图片来源网络,版权归原作者所有,如有任何问题,敬请联系我们,谢谢。

点赞
收藏
评论
分享
加入交流群
举报

相关推荐

登录即可解锁
  • 海量技术文章
  • 设计资源下载
  • 产业链客户资源
  • 写文章/发需求
立即登录

猎芯网旗下新媒体公众号——芯三板,新三板,创业板,主板,海外板,越来越多的板爷!需要一个传话筒吧?需要来一点解密吧?需要来一点心跳吧?麻辣新鲜,陈年往事,说出来是故事,看透了就是人生!