加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
    • 国产GPU架构“天狼星”出世
    • “从0到完整架构的实现,都是自主技术”
    • 为何押注图形渲染GPU?
    • 两代GPU架构发展脉络和规划
    • 业界看好国产GPU显卡前景
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

国产独立显卡GPU迎来突破,中天恒星自主架构发布

2023/06/19
4396
阅读需 14 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

随着数字时代的来临,图形渲染需求越来越大,GPU的作用日渐凸显,不管是桌面应用、游戏、电影、数字孪生还是元宇宙,都依赖于图形处理器GPU做重要的技术支撑。GPU的核心竞争力体现在什么方面?主要是两大核心要素:性能先进性、计算生态壁垒,其中,架构创新对于性能的提升具有重要意义。

近年来,在芯片技术“自主可控”的背景下,GPU已经成为热门的创业赛道。不过,自主可控可以从两大维度来看待:一种是购买第三方IP架构自研GPU内核;一种是GPU的IP架构、内核都是自研。显然,只有真正着手于底层的架构和内核自研,才能在知识产权和技术迭代上占有主动权。

国产GPU架构“天狼星”出世

日前,一款国产GPU自主架构在京发布,是由中天恒星科技有限公司(Advanced Technology Stellar,简称中天恒星/ATS)自主研发的“天狼星”架构。“天狼星”主要有三大技术优势:

第一、面向亿级订单市场,以独立显卡GPU芯片主流产品为突破口,瞄准需求广阔、增长强劲的亿级刚需市场,突出性价比优势;

第二、拥有完全自主知识产权,以清华大学超过10年研究基础为依托的自研核心架构,确保产品迭代自主可控。以基础理论研究为基础,从数学公式推导开始,从架构设计、算法模型、原理验证、硬件实现、驱动开发等环节全部正向设计。核心架构完整知识产权,已申请专利和著作权数百项,数十项已获授权;相关研究成果发表于ISCA、Micro、IEEE TPDS、IEEE TCAD等顶级会议和期刊;

第三、完备的交付能力,上下游产业链准备充分,确保产品量产自主可控;芯片设计完成全面验证,确保流片成功;软硬件接口符合国际标准,确保芯片装机即可使用,包括操作系统认证:Windows WHQL;API认证:Open GL Conformance Test;外围接口认证:HDMI DP CTS;专业测试认证:PHY layer和LIINK layer;质量体系认证:显卡3C认证(中国)、 日本VCCI 、欧盟CE、 美国FCC。

“天狼星”GPU架构主要亮点包括:

一是具有3D图形引擎+2D图形加速+视频引擎。
二是自主可控/灵活优化的指令集和VLIW/SIMD机器指令集(ICCD’13);其中,自主可控/灵活优化的指令集,保证GPU芯片迭代的软件兼容。
三是SIMT计算框架,充分利用图形应用的数据并行性( DATE’12.ICCD'13,TVLSI15)。
四是支持物理真实渲染(ACMComputingSurvey’14,SIGGRAPHASIA'14.15)。
五是Shader Core(Graphics ProcessingCluster),包括SIMT独立指令执行单元、以32位浮点ALU为基础的统一图形架构(ICCD13)以及集成寄存器堆、纹理/数据缓存。
六是延迟聚集式全局线程调度技术(ISCA20、TPDS21、TCAD'21)。
七是具有良好性能伸缩性的片上互联架构(MICRO'20、TPDS’21)。

据了解,中天恒星研发团队由卡内基梅隆大学电子与计算机工程博士、清华大学软件学院、微电子学研究所副教授、NVIDIA合作教授邓仰东博士率领,是中天恒星联合创始人兼总架构师。据介绍,他是GPU通用计算最早的研究人员之一,长期从事图形处理器体系结构、并行计算研究和芯片产品开发工作;曾设计出全球第一个基于FPGA的GPU仿真平台;研究成果在ISCA、MICRO、等顶级会议和期刊发表。邓仰东博士撰写了多部教材和专著,其中《数字集成系统的结构化设计与高层次综合》入选清华大学及多所大学研究生教材,《异构处理器OpenCL编程导论》是国内GPU异构计算第一部教材,《3-Dimensional VLSI》是三维集成电路的第一部专著。

“从0到完整架构的实现,都是自主技术”

“天狼星”架构的问世,对打破国外GPU架构的垄断具有重要意义。

当前,Imagination和Vivante两家公司是国内GPU产品主要IP来源。中天恒星认为,这些IP主要是针对移动应用的GPU内核,不适合桌面应用。此外,购买第三方的IP,难以形成成熟的图形显卡级GPU,核心电路专利无法自控和自主迭代。

不过,自研GPU架构存在极高的门槛,关键挑战有哪些?邓仰东指出:“GPU设计有几个地方非常复杂:一个是架构级的设计,这其实是个统筹的艺术。GPU本身的资源,在所谓的uni版的shader,所有的计算资源是一样的,大家都用32比特或者64比特的浮点运算单元,这是一个配合的问题。有很多核共享L2的cash,然后每个核内有自身的计算单元,还有通往片外的各种通道,实际上片上还有一些针对图形的,比如像纹理的缓存;这些虽然很容易知道是什么样的模块,难的是如何配合起来实现整体性能最优。换言之,如何通过统筹协调,能够适应绝大多数图形应用。在大多数情况下,均衡的设计保持性能每秒至少30帧,这是一个极具挑战的地方。二是,架构仿真的时间非常长,需要经验也需要直觉,去找出架构问题到底出在哪里。这方面也是一个很大的挑战,需要有多年的积累才能去做这件事。”

“很多国产的GPU的IP授权主要购买的第三方。中天恒星的路线有所不同,核心的图形引擎完全自主设计的,所以3D图形引擎这块不涉及到别人的知识产权,也没有IP的问题,全部是我们自己拥有,从0到完整架构的实现,都是我们自主的技术。”邓仰东指出。

为何押注图形渲染GPU?

GPU主要有图形渲染和计算处理两大功能,而中天恒星主要聚焦于图形渲染。对此,邓仰东表示,用于渲染的GPU才是市场主流,占到整个GPU市场的80%以上。从二者的市场规模来看也是如此,如2021年全球服务器出货量1300万台,而PC出货量3.5亿台左右。一般来说,算力GPU搭载在服务器中,而每一台PC都会搭载一块显卡,所以从这个意义上来讲,渲染GPU也是主流。

邓仰东强调,还要关注一个更大的可能性——大屏电视目前已经非常普及,与大屏电视的交互非常有前景,典型应用如游戏等,对GPU将产生更多需求。

此外,从GPU渲染标准的发展来看,主要是由三大图形和计算标准界定的,一是OpenGL,由国际标准化组织1997年推出,之后从2007年开始,OpenGL连出三版,基本上界定了整个图形渲染要完成的工作。二是微软的Direct X,是专门针对Windows环境的图形标准。三是OpenCL,最初是针对图形的纯计算能力,后来延伸到通用计算。

“这三大标准都在2007-2017年经历了黄金时代,到2017年基本固化。也就是说今天的图形标准仍然是2007年主要的图形显示内容,2007年之后,基本上图形标准没有很大变化,GPU要做的刚需工作基本没有变化。这里就有一个赶上NVIDIA图形渲染GPU设计的可能性。”邓仰东表示。

两代GPU架构发展脉络和规划

邓仰东在介绍“天狼星”架构的研发过程时提到,前期的研究工作主要在清华大学进行,从2007年开始,包括并行计算、虚拟指令集的设计、GPU的加速仿真、GPU的核心模块设计等等。之后,为了提高仿真速度,他们把传统软件仿真搬到FPGA平台上,2013年,在FPGA平台上仿真出了整个GPU架构,实现了快速迭代。此后,又进行了光线追踪算法/硬件、片上调度、片上通信网络等研究工作。最后,在这些工作基础上,发展出了中天恒星的GPU架构。

据了解,第一代GPU架构取名为“天狼星”有着独特的寓意。中天恒星创始人黄永博士解释说:“我们的架构全部是以恒星来命名的。Stellar是恒星、星宿的意思,引申出来有“超一流”、“卓越”的含义。第一代叫‘天狼星’,是夜空中肉眼可见的最亮的恒星。第二代架构命名为‘大角星’,它是第二亮的恒星。只是因为距离地球更远,所以看起来没有天狼星亮;实际上,大角星比天狼星更亮,其亮度是太阳的110倍。

据悉,中天恒星两代GPU架构的发展规划主要是:第一代“天狼星”架构于2019年完成验证,2021年诞生,2023年,第一代“天狼星”架构GPU实现量产。2024年,继续优化基于“天狼星”架构的GPU。第二代GPU架构“大角星”于2022年定义,2025年,将量产第二代“大角星”架构的GPU。

业界看好国产GPU显卡前景

GPU架构“天狼星”得到行业专家的高度认可和好评。

对于天狼星架构,国际信息显示学会中国总裁、fellow、俄罗斯工程院外籍院士、国际信息显示学会北京分会理事长严群博士指出:“现在所有显示器都可以称为被动式显示技术,观看的人对它的信息传输只有接收,没有互动,一旦显示屏加上很多GPU功能,有了沉浸式三维影像呈现、交互体验,那就不是传统的电视了,现在没有人看电视了,特别是年轻人很少有人看电视,这个体验已经被手机端、PAD端等便携设备全部替代了,没有必要看那么大的电视。但是一旦需要有交互体验的时候,我们就会重新回到大屏,重新回到这些有渲染的、真实的、你可以融入其中的体验,这种体验非常不得了。”

严群博士表示,现在ChatGPT很火,而人工智能还是处于幼儿园、小学阶段,但这已经很“可怕”了。如果有了交互,以后灵魂是在数据里了,这个时候抓取的大数据,不是Chat生成式了,而是交互式GPT。这个时候大数据经过人工智能的学习以后,会远远超过人类的智力和能力,这是真正元宇宙的目标。

上海市集成电路行业协会秘书长郭奕武认为:“现在正好是非常好的关口,即产业革命和新技术革命的兴起,大家也看到包括云计算、数字化、智能汽车、云端到边缘等等,这些产业化以后,都需要大算力,也就是我们所说的GPU。所以我们赶上的时机非常好,未来随着新的技术产业革命的发展,这个方面的空间是非常大的。”

“中天恒星自研架构,有这几个特点:一是3D图形渲染。二是指令集的自主可控,这是非常不容易的。三是它的框架结构,包括在整个储存器当中的DDR4实现高速存储,这个设计也是比较领先的架构,中天恒星都用上了,这决定了未来的产品用途非常广泛。中天恒星的切入点在显示领域,我觉得显示领域非常广阔,我相信在黄总的带领下,中天恒星一定会从架构到产品,最后能够使我们的产品在全球落地。”郭奕武指出。

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
TAS5411QPWPRQ1 1 Texas Instruments Automotive, 8-W, 1-ch, 4.5- to 18-V analog input Class-D audio amplifier w/ I<sup>2</sup>C diag &amp; load dump 16-HTSSOP -40 to 125

ECAD模型

下载ECAD模型
暂无数据 查看
TLV320AIC23BIRHD 1 Texas Instruments Low-Power Stereo CODEC with HP Amplifier 28-VQFN -40 to 85

ECAD模型

下载ECAD模型
$11.41 查看
TAS2505TRGERQ1 1 Texas Instruments Automotive, 2-W, mono, digital input class-D audio amp with audio processing &amp; integ. load diagnosti 24-VQFN -40 to 105
$1.95 查看

相关推荐

电子产业图谱

与非网资深行业分析师。主要关注人工智能、智能消费电子等领域。电子科技领域专业媒体十余载,善于纵深洞悉行业趋势。欢迎交流~