又一芯片巨头濒临破产，GPU赛道竞争加剧

作者：鹏程

近年来，许多芯片企业破产。去年高达上万家芯片公司关门大吉，平均每天倒31家。而今年依旧惨不忍睹，中国IP设计新星华夏芯破产清算，砺算科技也因烧光3亿人民币，去年6月爆发欠薪，加上美元基金撤离，险些在流片前夕破产。

砺算科技成立于2021年，实际营运从2022年年初成立砺算上海开始。砺算上海是南京砺算科技的全资子公司，也是公司核心所在。三位创办人分别是宣以方、孔德海及牛一心，都在硅谷GPU公司S3拥有深厚的技术能力及工程经验。

官网信息显示，砺算科技坚持自研架构、自主知识产权，正在打造对标国际主流产品的国产GPU芯片，服务国内2000亿渲染GPU全方位市场，实现端、云、边的图形渲染，满足学习工作娱乐、元宇宙、游戏动漫、数字孪生、影视制作、ARVR、智能工厂、专业设计、智能座舱、智慧医疗等的芯片和算力的需要。

好在，东芯股份于近日发布公告，宣布拟使用自有资金或超募资金对砺算科技（上海）有限公司进行增资，占股比例不超过40%，金额上限为2亿元。砺算科技破产波澜背后折射的是GPU芯片赛道竞争加剧。

01、GPU的起源

GPU的全称是Graphics Processing Unit，图形处理单元。它最初的功能主要用于绘制图像和处理图元数据的特定芯片，后来增加了许多其他功能。

GPU相比CPU更加适合于密集型数据处理。从芯片微架构上看，GPU是在原有CPU结构基础上进行了优化与调整，通过与CPU进行合并，实现RAM共享的同时，采用SIMD架构，构建成百上千个逻辑运算单元，实现同一时间的并行处理。

GPU特别擅长同时处理很多任务，比如把计算机里的数据转换成我们在屏幕上看到的精美图像。在计算任务中，GPU利用其并行计算优势加速处理如深度学习训练、科学计算等大规模数据密集型任务。

1962年，麻省理工大学的博士伊凡·苏泽尔的论文以及他的画板程序奠定了计算机图形学的基础。1962-1984年，这一阶段，没有专门的图形处理硬件，图形处理任务都由CPU完成。

随着计算机的发展，图像处理需求逐步增加。追溯GPU的历史，要从图形显示控制器说起。世界上第一台个人电脑IBM5150于1981年由IBM公司发布，这台PC搭载了黑白显示适配器（monochrome display adapter，MDA）和彩色图形适配器（color graphics adapter，CGA），这便是最早的图形显示控制器。1984年，美国SGI公司推出了面向专业领域的高端图形工作站。1984-1995年，SGI又不断研发出了一系列性能更好的图形工作站。

1995年，3DFX公司发布一款消费级3D显卡Voodoo。此时，图形显示硬件赛道已经开始变得火热，AMD、ATI（2006年被AMD收购）、NVIDIA都开始推出自己的显卡产品。CPU得以摆脱部分图形处理任务，但是顶点变换等任务仍需CPU完成。

成立于1993年的NVIDIA是GPU概念的提出者。1999年NVIDIA发布的GeForce 256图形芯片，首次引入GPU的概念，GPU时代来临。GeForce 256采用了“T&L”硬件，立方环境材质贴图和顶点混合等先进技术。

在这一时期，各硬件单元形成一条图形处理流水线，每个流水级功能固定，不可对硬件进行编程。随着技术的发展，GPU从只能按照固定方式工作变成了可以编程的智能芯片，并且能够创造出更复杂的视觉效果。2003年，NVIDIA和ATI发布的新产品都同时具备了可编程顶点处理和可编程像素处理器，具备了良好的编程性。

进入21世纪，随着游戏和多媒体应用的普及，GPU的性能需求迅速增长。各大芯片厂商纷纷投入巨资研发新一代GPU，不断提高其性能。在这个阶段，GPU的内部组成也发生了显著变化，包括图形显存控制器、压缩单元、BIOS、图形和计算整列、总线接口、电源管理单元、视频管理单元等。

随着人工智能和深度学习技术的兴起，GPU的应用领域得到了进一步拓展。NVIDIA开发出CUDA技术，使得GPU不仅能画图，还能干更多非图形类的工作，例如处理大数据。除了传统的图形渲染外，GPU还被广泛应用于深度学习、机器视觉、大数据分析等领域。这种趋势推动了GPU技术的进一步发展，使其逐渐从专用图形处理器演变为通用计算平台。

国内开始涌现出一批研发GPU的企业：景嘉微电子，芯源微电子，壁仞科技等。

直到2014年4月，景嘉微才成功研发出首款国产高性能、低功耗GPU芯片——JM5400。2018年8月，景嘉微自主研发的新一代高性能、高可靠GPU芯片-JM7200流片成功。2019年，景嘉微在JM7200基础上，推出了商用版本——JM7201，满足桌面系统高性能显示需求，并全面支持国产CPU和国产操作系统。

2020年，芯片行业掀起了创业热潮，这次主要集中在GPU领域。国产GPU在资本的加持下获得了飞速发展，大量公司进入这一领域。此外，中央和地方不断出台政策支持集成电路产业发展，在这样的综合影响下，可以说GPU迎来了最好的时代。这些创业公司主要致力于开发能够同时满足图形处理和AI计算的GPU，也即现在国内所说的GPGPU（通用GPU，General-purposeGPU）。但随着融资资金耗尽，部分企业也陷入破产边缘。

根据IDC数据，2022年全球AI芯片市场将达352亿美元。其中GPU占比最大，Goldman预计到2025年GPU占比将达到57%。在美国限制中国进口最新的英伟达GPU产品的情况下，国产GPU前景广阔。

02、全球GPU呈三足鼎立寡头竞争格局

从全球GPU整体市场情况来看，全球GPU市场现已形成三足鼎立的寡头竞争格局，NVIDIA仍是全球独立GPU绝对领导者。Intel得益于在笔记本电脑及传统PC行业的优势，现已在集成GPU市场独占鳌头，独立GPU市场则主要由NVIDIA和AMD两家公司占据。

NVIDIA现在最大的独立显卡生产销售商，旗下有民用的Geforce系列，还有专业的Quadro系列。其GPU具有cuda通用运算，PureVideo高清视频技术，PhysX物理加速，Optimus智能显卡切换等。今年三月份，英伟达推出新一代AI图形处理器芯片(GPU)架构Blackwell，并重磅发布采用该架构的GPU——B200和GB200产品系列。据了解，Blackwell可以支持多达10万亿参数的模型进行AI训练和实时LLM推理。B200由两个超大型Die（裸片）封装组合而成，内含超过2080亿个晶体管，是前一代800亿个晶体管的两倍以上，整块芯片还封装有192GB高速HBM3e显存。

Intel是全球最大的集成GPU供应商。Intel的GPU主要是集成显卡，用于intel的主板和intel的笔记本。英特尔首代独立显卡于2022年发布，距今大致已有2年。近日，有媒体报道，英特尔向oneAPI DPC++ 编译器的 LLVM 文档添加了 bmg_g21（Battlemage G21、BMG-G21）核心相关代码。这也是首次有 Battlemage 架构独显相关代码现身该文档，暗示 Battlemage G21 GPU 有望成为英特尔下代独显首发型号。

AMD成立于1969年，是目前业内稀缺的可以提供高性能CPU、高性能独立显卡GPU、主板芯片组三大组件的半导体公司。2006年，AMD以54亿美元收购了ATI，成为了第一家可以同时设计高性能CPU和GPU的半导体公司。AMD旗下有民用的Radeon系列，还有专业的FireGL系列等。其GPU具有Stream通用运算，ATI Video Converter视频转码，UVD高清视频技术，Havok、Bullet和Pixelux DMM三种物理引擎等。AMD 的 GPU 分为两个截然不同的产品领域，一个是针对游戏的，另一个是用于超级计算机、大数据分析和机器学习系统的。

2023年，AMD正式发布了新一代AI/HPC加速器Instinct MI300X、Instinct MI300A，一个是传统GPU加速器，一个是独一无二的CPU+GPU融合加速器。MI300A 是面向 HPC 产品定位，因此产品形态是CPU+GPU/APU 合封 Chiplet 的方式(24个Zen4 core及其I/0，128G HBM3，封装了13个Chiplet) ; 并改造了底层IF高速互连和UMA内存架构。首批采购方也是美国国家超算 (EI Capitan Exascale)。对标英伟达的CUDA，AMD则开发了ROCm。

03、国内GPU市场百花齐放

虽然国内GPU起步晚，但得益于近年来资本的加持和人工智能的市场催化，大量公司切入这一赛道。随着国内信息产业图形处理和加速计算需求的不断涌现，国内GPU市场已呈现出“百花齐放”的态势，其中不乏一些表现出色的企业和产品。

景嘉微是国内首家实现自主研发国产化GPU并产业化的企业。为打破ATI公司（现已被 AMD 收购）M9 芯片在军用图形显控领域的长期垄断，公司历经多年技术钻研，于2014 年成功研制国内首款高性能GPU芯片JM5400，实现军用GPU国产化。2018年8月公司成功研发第二代图形处理芯片JM7200，并于2020年陆续完成与国产化设备的适配工作，逐步向通用领域拓展。2021年12月，公司正式发布第三代图片处理芯片JH920。该芯片在产品性能和工艺设计上较前两代产品大幅提升的同时，也为国产化GPU在人工智能、信息系统等领域带来新的突破。

芯动科技是一家专注半导体领域IP定制、设计、流片的公司，从DDR到接口再到GPU均有涉猎。2021年年底，芯动推出的“风华1号”就是一款12nm的高性能显卡，支持4路4K60帧输出，最高支持16个1080P用户同时在线，填补了国产4K级桌面显卡和服务器级显卡两大空白。“风华”系列GPU 自带浮点和智能3D图形处理功能，全定制多级流水计算内核，可实现高性能渲染和智能AI算力，适用于元宇宙、云游戏、云桌面、AI计算等领域。

由前英伟达全球副总裁张建中创办，成立于2020年的摩尔线程，致力于研发全球领先的自主创新GPU知识产权，其GPU产品线覆盖通用图形计算和高性能计算。公司核心成员主要来自NVIDIA、微软、Intel、AMD、ARM等全球知名芯片企业，覆盖GPU研发设计、生产制造、市场销售、服务支持等完整架构。在成立1年后便发布了第一代MUSA系统架构GPU“苏堤”，其中的顶配桌面级显卡MTT S60，拥有2048个MUSA核心，主频达1.5GHz，提供6T FLOPS的单精度浮点计算能力，板载8GB显存，板载DP1.4和HDMI 2.1接口并支持最大8K视频输出。

龙芯中科于2020年成立GPU突击队，加快GPU产品的研发设计。目前，龙芯中科自主研发的GPU集成在7A2000中。龙芯7A2000是面向服务器及个人计算机领域的第二代龙芯3号系列处理器配套桥片，在7A1000基础上实现全面的优化升级。此外片内首次集成了自研GPU，采用统一渲染架构，搭配32位DDR4显存接口，最大支持16GB显存容量。

芯瞳半导体成立于2019年12月，主要业务包括GPU芯片设计、异构计算平台方案、嵌入式显示系统解决方案、GPU应用部署解决方案。公司GPU架构采用了业界主流的统一渲染架构，并具有高度可扩展的互联结构和计算阵列。2023年，芯瞳GB2062正式对外发布，这是芯瞳半导体推出的第二代自主研发高性能图形处理器芯片。该芯片采用12nm CMOS工艺，具有自主设计、更强功能、更低功耗等特点，可广泛适用于三维图形领域（CAD、GIS、动画模型、电脑游戏等）和通用计算（GPGPU）领域。

壁仞科技创立于2019年，致力于研发原创性的通用计算体系，建立高效的软硬件平台，同时在智能计算领域提供一体化的解决方案。BR100是由壁仞科技发布自主研发的首款通用GPU芯片，其16位浮点算力达到1000T以上、8位定点算力达到2000T以上，单芯片峰值算力达到PFlops（1PFlops等于1000万亿次浮点指令/秒）级别。

天数智芯成立于2015年12月，2018年正式启动GPGPU芯片的设计研发工作，是国内首家GPGPU高端芯片及超级算力提供商。2021年1月，其成功自主研制7纳米GPGPU高端自研云端训练芯片，具有全方位生态兼容、高性能有效算力、指令集编程架构以及软硬件全栈支持等优势。

此外，还有许多公司在研发GPU产品。不过近年来受制于美国禁令限制，部分企业无法使用台积电等工艺流片，极大的制约了企业发展。

04、信创叠加美国禁令，带来巨大市场空间

由于历史的原因，我国在信息技术领域长期处于模仿和引进的地位。国际巨头占据了大量的市场份额，也垄断了国内的信息基础设施。它们制定了国内IT底层技术标准，并控制了整个信息产业生态。随着中国国力的不断崛起，某些国家主动挑起贸易和科技领域的摩擦，试图打压中国的和平发展。作为国民经济底层支持的信息技术领域，自然而然地成为他们的重点打击对象。面对日益增加的安全风险，必须实现自主可控，“信创”就此被正式提出。

2022年，美国当局禁止英伟达向中国出口高性能GPU芯片(A100、H100)，到2023年10月，除了原来禁售的A100、H100之外，阉割版的A800、H8009、L40、L40S、甚至普通桌面端显卡RTX4090都在禁售之列。

近年来国内新建设的数据中心、智算中心都已经逐步采用国产芯片设计，为国内企业创造了巨大的市场空间。因此，相关赛道近年来涌入了很多国内参与者，竞争加剧。随着部分企业研发和市场开发不及预期，融资资金逐渐烧完，开始逐步被收购并购，甚至破产。但危与机同在，由信创和美国禁令带动为国内市场创造的巨大的市场空间将在未来行业竞争中，逐渐决出头部企业。

器件型号	数量	器件厂商	器件描述	ECAD模型	参考价格	更多信息
STM32F427VIT6	1	STMicroelectronics	High-performance advanced line, Arm Cortex-M4 core with DSP and FPU, 2 Mbytes of Flash memory, 180 MHz CPU, ART Accelerator, Chrom-ART Accelerator,FSMC	ECAD模型下载ECAD模型	$22.31	查看
MK64FN1M0VLL12R	1	NXP Semiconductors	FLASH, 120MHz, RISC MICROCONTROLLER, PQFP100		暂无数据	查看
ATXMEGA32A4U-AU	1	Microchip Technology Inc	IC MCU 8BIT 32KB FLASH 44TQFP	ECAD模型下载ECAD模型	$3.78	查看

器件型号

数量

器件厂商

器件描述

数据手册

ECAD模型

风险等级

参考价格

更多信息

STM32F427VIT6

STMicroelectronics

High-performance advanced line, Arm Cortex-M4 core with DSP and FPU, 2 Mbytes of Flash memory, 180 MHz CPU, ART Accelerator, Chrom-ART Accelerator,FSMC