一文看懂DeepSeek如何火爆全球？

短短两周，中国人工智能初创公司DeepSeek火爆出圈。它拿下了美国和中国区App Store免费榜的双料第一，成为首个超越OpenAI ChatGPT的AI助手类应用。外媒用“震动硅谷”形容DeepSeek带给美国的行业震撼，其主打的低成本开源模型概念更冲击华尔街，英伟达市值一周缩水超5000亿美元。

DeepSeek是什么？

DeepSeek，全称杭州深度求索人工智能基础技术研究有限公司，成立于2023年7月17日，总部位于浙江杭州。它由量化资管巨头幻方量化创立，专注于大语言模型（LLM）及相关AI技术的研发。

DeepSeek为何如此震撼？

DeepSeek能够引发业界震动的主要原因在于其低廉的成本和开源等特点。该公司去年底发布的大型语言模型DeepSeek-V3，训练成本仅为557.6万美元，与美国OpenAI最新版chatGPT的训练成本相比，差距约为20倍。API调用成本更是只有OpenAI的三十分之一。

AI产业是否存在泡沫化？

自从2022年底OpenAI掀起旋风以来，「不动辄重砸数十亿美元没法训练出强大AI系统」始终是主流观点，市场认为唯有像微软、Google、Meta等科技巨头才玩得起先进AI，英伟达这类AI芯片厂更是一片光明的景象。

然而DeepSeek仅花费约560万美元和相对原始的运算能力训练自家系统，这比Meta建构旗下最新AI所花资金便宜约10倍，引来AI产业反思，是否真有必要砸天文数字的资金？AI产业又是否存在泡沫化？

DeepSeek是如何办到使用较少芯片？

美国的顶尖AI工程师们表示，DeepSeek的研究论文提出一些让人印象深刻的巧思来降低芯片使用量，简言之就是种让芯片分析数据时更有效率。

先进AI系统需归纳文字、图片、影音等大量数据来学习技能，DeepSeek则把这些数据分析工作分配给多个不同模型，每个模型负责特定领域，如此一来维持高效数据处理的同时还缩短运算时间。这种方法之前不是没有人用过，只是没法像DeepSeek用更少的运算能力做到。

精通建构高效AI系统的卡内基美隆大学（CMU）计算机科学教授戴特摩斯（Tim Dettmers）说：「现在看显然除OpenAI这类公司外，其他人也能玩。DeepSeek使用的方法人人都能依样画葫芦。」.

何谓开源AI？

与许多公司一样，DeepSeek也把自身最新的AI系统「开源」，即把支撑AI的运算代码公开给其他企业和研究人员，让所有人都能使用这些技术来建构、推广自己的产品。DeepSeek与其他企业能如此迅速拿出具竞争力的AI产品，部分也是受惠于他人开源。

中美科技巨头争相接入DeepSeek

DeepSeek爆火后，海外巨头率先接入DeepSeek模型。

1月31日，英伟达宣布DeepSeek-R1模型登陆NVIDIANIM。同日，亚马逊和微软也接入了DeepSeek-R1模型。英伟达称，DeepSeek-R1是最先进的大语言模型。

2月份，国内几大云平台也宣布上线DeepSeek系列模型。

2月1日，华为云在官微宣布，与硅基流动联合首发并上线基于昇腾云服务的DeepSeek R1/V3推理服务，其性能可与全球高端GPU部署模型相媲美。

2月2日，腾讯云称，将DeepSeek-R1大模型一键部署至其“HAI”平台，开发者仅需3分钟即可接入调用。

2月3日，百度智能云也宣布，其千帆平台正式上架DeepSeek-R1和DeepSeek-V3模型。阿里云也称，其PAI Model Gallery支持云上一键部署DeepSeek-V3和DeepSeek-R1模型，

2月4日，字节跳动旗下火山引擎也宣布，全面支持DeepSeek系列大模型，包括V3和R1等不同尺寸的模型，企业用户可在火山引擎机器学习平台veMLP中部署或通过火山方舟平台直接调用。此外，联通云、天翼云等平台也宣布接入DeepSeek模型。

.......

芯片厂商加速对接完成适配

在芯片领域，国内几大GPU厂商加速跟DeepSeek模型的对接，完成适配，提供算力支持。

2月5日，华为官方表示，DeepSeek系列新模型正式上线昇腾社区；Gitee AI同日表示，DeepSeek-V3满血版在国产沐曦GPU首发体验上线。

中科曙光国家先进计算产业创新中心有限公司发文宣布，海光信息技术团队已完成DeepSeek V3和R1模型与海光DCU的适配并上线；

摩尔线程也宣布，已实现对DeepSeek蒸馏模型推理服务的部署，并即将开放自主设计的夸娥（KUAE）GPU智算集群，支持DeepSeek V3、R1模型及新一代蒸馏模型的分布式部署。天数智芯也称，联合Gitee AI正式上线DeepSeek R1模型服务。

据不完全统计，截至2月7日，已有17家国产芯片企业相继宣布适配或上架DeepSeek模型服务，分别为华为昇腾、沐曦、天数智芯、摩尔线程、海光信息、壁仞科技、太初元碁、云天励飞、燧原科技、昆仑芯、灵汐科技、鲲云科技、希姆计算、算能、清微智能、芯动力、龙芯中科等。

有机构认为，DeepSeek通过模型层面创新，在芯片受限与低算力投入的背景下，达到全球顶尖闭源模型的性能水平，属于生态级突破，有望带动国内AI全产业快速发展，同时其开源与低成本特性也有望赋能AI应用厂商，加速推动端侧AI落地。

附：DeepSeek时间线梳理

注：文章综合相关报道，仅供学习和交流之用，不构成任何建议，不代表本号立场，图片来源网络，版权归原作者所有，如有任何问题，敬请联系我们，谢谢。

一文看懂DeepSeek如何火爆全球？

相关推荐