2018 年 4 月 23 日,中国电科 38 所在福州举行的首届数字中国建设峰会上发布了实际运算性能业界同类产品最强的数字信号处理器“魂芯 II-A”。
“魂芯 II-A”芯片由电科 38 所完全自主设计,历经 6 年不断完善和修改,通过“魂芯 I”实际使用过程的不断迭代和磨合,完成了“魂芯”家族的第二代产品“魂芯 II-A”的设计,2017 年一次流片成功,初步形成了“魂芯”品牌技术体系和产品谱系,同时为我国建立自主体系高端 DSP 产品谱系奠定坚实基础。
“魂芯 II-A”在一秒钟内能完成千亿次浮点操作运算,单核性能超过当前国际市场上同类芯片性能 4 倍,可与高速 ADC、DAC 直接互连,具备相关时序接口,可以实现 P 波段射频直采软件无线电处理形态。
中国电科首席科学家、“魂芯 II-A”总设计师洪一表示,芯片采用全自主体系架构,通过单核变多核、扩展运算部件、升级指令系统、扩大存储容量、加大数据并行、丰富调试手段、扩展应用领域等手段,使器件性能千亿次浮点运算同时,具有相对良好的应用环境和调试手段。
“魂芯 II-A”芯片拥有当前业界性能最强的 DSP 核,单核实现 1024 浮点 FFT (快速傅里叶变换)运算仅需 1.6 微秒,运算效能比德州仪器公司 TMS320C6678 高 3 倍,实际性能为其 1.7 倍,器件数据吞吐率达每秒 240Gb。
“魂芯 II-A”芯片支持 Rapid I/O、PCIE、JESD204B 等多种协议,支持片上网络调试、远程调试,为系统维护开发提供便捷和快速实现手段。作为通用 DSP 处理器,“魂芯 II-A”将广泛运用于雷达、电子对抗、通信、图像处理、医疗电子、工业机器人等高密集计算领域。目前,正在多种重大装备以及图像处理领域中推广使用。
“魂芯 II-A”的推出,使得软件无线电从理想走向现实,人们梦想着系统功能主要取决于软件算法成为可能,同时为我国建立自主体系高端 DSP 产品谱系奠定坚实基础。发布会现场,该芯片受到行业内专家和媒体的高度关注。
DSP(即 igital Signal Processor,数字信号处理器)是进行数字信号处理的专用芯片,是伴随着微电子学、数字信号处理技术、计算机技术的发展而产生的新器件。DSP 可以快速的实现对信号的采集、变换、滤波、估值、增强、压缩、识别等处理,以得到符合人们需要的信号形式。DSP 处理器的应用领域很广,包括音视频、通信与信息系统、信号与信息处理、自动控制、雷达、军事、航空航天、医疗、家用电器等许多领域,但实际上没有一个处理器能完全满足所有的或绝大多数应用需要,设计工程师在选择处理器时需要根据性能、成本、集成度、开发的难易程度以及功耗等因素进行综合考虑。DSP 供应商除了 Texas Instruments(TI)、Analog Devies(ADI)外,还有数十家小的公司。
中国国产 DSP 在商业领域目前国内几乎是空白,市场份额基本被美国德州仪器等厂商垄断。在雷达、电子对抗等领域的电子装备中,长期以来一直采用国外的 DSP 芯片。由于政治方面的因素,美国政府禁止出口军品级 DSP 芯片,使中国的武器装备不得不使用低等级芯片代替高等级芯片使用,这样严重影响了装备的性能。如果采取从商业芯片筛选的做法,又会因为商业芯片相对于军用芯片较短的生命周期和稳定性,加大了装备使用期内的维护保障困难。
出于安全考虑,我们必须自主研发。自主研发的芯片不一定安全,但买来的芯片一定不安全。
近年来,国内发布了多颗 DSP 产品。下面我们来看看国内有哪些 DSP 产品。
“魂芯 I”DSP
前面刚刚介绍了“魂芯 II-A”,我们就来说说“魂芯 I” DSP。
2006 年,中国电科 38 所开始进入 DSP 芯片设计领域,在各方支持下,经过 6 年的努力,于 2012 年推出我国第一款从指令集、体系结构到开发环境均自主的实用型高性能浮点通用 DSP“魂芯 I”BWDSP100。
“魂芯 I”是一款 32 位静态超标量处理器,采用 16 发射、SIMD(单指令流,多数据流)架构。根据性能需求不同,处理器可工作于 300MHz~500MHz 主频,在 500MHz 主频下,峰值定点运算能力为 30GOPS,峰值浮点运算能力为 26GFLOPS,峰值通信能力为 8GBPS。指令总线宽度为 512bit,内部数据读总线位宽为 512bit、内部数据写总线位宽为 256bit。
“魂芯 I”芯片性能高于同期市场同类 DSP 性能 4-6 倍,通过成功应用在我国多个国防科技装备型号,一方面大大提升了国防科技装备的性能,另一方面也验证了我们自己设计的处理器的可用性和可靠性。
“魂芯 I”也成为我国第一款广泛应用于国防科技装备的高端自主数字信号处理器,在国防安全、公共安全、物联网、通讯等产业中均具有广泛应用前景,其成功应用将打破国外高端数字信号处理芯片对我国高性能计算领域的垄断。
“华睿”系列 DSP
“华睿 1 号”
中国电科 14 所及子公司北京国睿中数科技股份有限公司、清华大学、龙芯中科联合在 2009 年 8 月完成“华睿 1 号”芯片的系统设计,2009 年 12 月完成芯片的物理设计,2010 年 1 月进行芯片流片,2010 年 6 月完成芯片的封装及成测,于 2010 年 12 月正式发布。在研发过程中,选择了基于龙芯 3 号通用处理器的架构,结合实际应用提取和增加了一些专用指令和运算单元的方式开发华睿 1 号 DSP 芯片。
“华睿 1 号”是国内首款具有国际先进水平的高端 DSP,芯片集成了 4 个高性能 DSP 处理器核,支持 32/64 位浮点运算和 8/16/32/64 位定点运算,具有 4MB 分布式共享二级 Cache,以及 2 个 64 位带 ECC 的 DDR2/3 内存控制器,采用 65nm CMOS 工艺,工作主频为 550MHz,处理能力 32GFMACS,功耗为 10W 采用了先进的 65nm CMO 工艺和多核架构实现,并创新性地融合了 DSP 和 CPU 设计技术,填补了我国多核 DSP 领域的空白。
“华睿 2 号”
“华睿 2 号”于 2016 年 8 月 31 日通过测试,2017 年 10 月亮相第三届军民融合发展高科技装备成果展览会。
“华睿 2 号”是在实现华睿 1 号基本功能的前提下,进一步改进了专用指令和向量运算单元,同时加入了可重构的运算核,更高效地面向专用领域的计算,在通用的基础上更偏向专通结合。“华睿 2 号”DSP 的处理能力达每秒四千亿次运算水平。华睿 2 号 DSP 为八核异构架构,采用了超标量结构、SIMD 向量处理、可重构加速处理等技术;
“华睿 3 号”
全国产化 DSP 生态链
经过七年艰苦卓绝的奋斗,“华睿 DSP”建立了包括支持中国电科 32 所 ReWorks 操作系统、人大金仓嵌入式数据库、编译器、调试器和基于 VSIPL 标准的矢量函数库等全国产化 DSP 生态链,芯片设计、软件开发、平台研制、应用验证等工作顺利完成,目前“华睿 1 号”信号处理平台已成功应用于十多型雷达产品中,为我国雷达装备高端处理芯片国产化写下浓墨重彩的一笔。“华睿 2 号”DSP 芯片目前已完成第三方测评,基于该芯片的国产化信号处理平台的产品验证与推广应用即将拉开帷幕。
不过“魂芯”系列和“华睿”系列都是专用 DSP。接下来看看通用 DSP。提到通用 DSP,首先就要提到“银河飞腾”系列 DSP。
国防科技大学计算机学院“银河飞腾”DSP
国防科技大学计算机学院教授陈书明以扭转我军武器装备核心元器件受制于人的被动局面为己任,带领高性能微处理器创新团队,连续完成我国第一颗正向全兼容 DSP,第一颗军用异构多核 DSP、第一颗抗辐照高性能 DSP 的研制任务,在不断创造第一的奇迹中实现“中华军芯”的跨越式发展。
YHFT-DSP/700
2004 年 12 月 17 日,国防科技大学计算机学院自主研制的“银河飞腾”高性能数字信号处理芯片(YHFT-DSP/700)宣布研制成功并通过国家鉴定,这是国内首个自主研制的 32 位的浮点 DSP。在 0.18 微米工艺下,主频可达 238MHz,浮点运算性能达 1428MFLOPS,定点运算性能达到 1900MIPS.乘加运算能力达每秒 474M 次.功耗仅 1.5W;增强的哈佛结构,RlSC 指令集、32 位指令字,32 个通用寄存器;八路超长指令字结构,包含 2 个乘法部件和 6 个算逻运算部件;指令条件执行,使编译器能够更大程度地开发并行性;具有 110 余种指令类型和丰富的寻址方式;含有 32K 位 L1 级数据 Cache、32K 位 L1 级指令 Cache 和 512K 位 L2 级 Cache;支持 14 级中断:支持丰富的外部接口: 定时器、主机接口、增强的 DMA、外部存储器接口、多通道缓冲串口,可直接连接三大类 60 余种存储器,在多种模式下传输;开发了基于 YHFT-DSP/700 的编译器及其配套软硬件开发环境。
经过严格测试的 YHFT-DSP/700 芯片已在国内 10 家单位使用,并可批量供货。为方便设计 SOC 芯片,同时开发了以 YHFT-DSP/700 为基础的高性能 DSP 软核和硬核,可作为 IP 使用。
YHFT-QDSP
YHFT-QDSP 是一款异构多核 DSP;包含一个 RISC CPU 内核和四个增强的 YHFT-DSP/700+ VLIW DSP 内核,其中 RSIC 核包括 UART, GPIO, 定时器、CAN 总线以及以太网等外设,YHFT-DSP/700+是 8 流出的 VLIW DSP 内核,包括两个 32 位乘法单元和 4 个 ALU 单元以及 2 个数据存取单元,每个核包括 256KB 内存,且低 64KB 可部分或全部配置为 L2 Cache。YHFT-QDSP 利用多种互连方法支持多核通信,其中包括:管理总线(MB)用于片内 RISC 核和 DSP 核之间的通信。RSIC 核可通过该总线控制 DSP 核的启动和停止,并向 DSP 核灌入执行程序。该总线还支持 RISC 核和 DSP 核之间互发中断。
在 0.13 微米工艺下,YHFT-QDSP 的频率达到 350MHz,性能大于 11.2GOPS,功耗约 2.99W,该芯片目前已应用于图像处理领域,另外在无线基站、雷达等领域也有着广泛的应用前景。经过严格测试的 YHFT-DSP/700 芯片已在国内 10 家单位使用,并可批量供货。为方便设计 SOC 芯片,同时开发了以 YHFT-DSP/700 为基础的高性能 DSP 软核和硬核,可作为 IP 使用。
“银河飞腾”的研制成功,不仅打破了中国高端通用数字信号处理器市场长期由国外产品垄断的局面,而且标志着中国 DSP 设计技术达到了世界先进水平,对提高我国的国家安全有着重要意义,有利于完善我国经济信息系统以及国防领域在应用高端 DSP 芯片时产生的安全和保密问题。
中科芯 DSP
中科芯集成电路股份有限公司(中国电科 58 所)是我国最早从事 DSP 研发的单位。
进芯 DSP
2012 年 10 月,中国电科 58 所副总工程师黄嵩人离职创建湖南进芯电子科技有限公司,致力于成为中国市场最优秀的数字信号处理芯片及嵌入式解决方案供应商。
公司主要产品是国产高可靠性和具备自主知识产品的 16 位和 32 位定点与浮点 DSP 芯片,包括 AVP32、ADP32、ADP16。
AVP32 是一款高性能、低功耗的 32 位浮点 DSP,运行速度可达每秒 150MFLOPS,可寻址范围为 16MB,内设一个 DMA、1 个 Cache 和 4 块 RAM 以保证程序高速运行,适合应用于对数字处理要求较高的领域。
ADP32 是高性能低功耗 32 位定点 DSP,主频 150M,片内存储资源丰富并可片外扩展,通用 IO 多达 56 个,集成 2 个 16 位 6 路 PWM 控制器、12 位 16 通道 ADC、3 个外部中断、SPI 接口、2 路 UART 接口、e-CAN 驱动器、MCBSP,支持 JTAG 在线仿真,内置 128 位安全密钥,具备强大的 ESD 防护能力。
ADP16 是高性能 16 位定点 DSP,主频 80M,内嵌 flash,多通道 PWM 控制器,多通道 12bit ADC,SPI,SCI,McBSP 等高性能通讯接口。
公司的产品应该还处于推广期,具体性能还有待考验。
阅读全文