加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

日本得意的CPU+GPU异构式超算,在中国早已不新鲜

2017/04/06
24
阅读需 34 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

 

日前,有媒体发布了《除了圆珠笔头,中国还有哪些核心技术没掌握?答案令人震惊……》一文,并在网络上广泛传播。文章中介绍了很多中国在诸多科技领域的短板,说明了在精密仪器、数控机床等领域中国依然和国际顶尖水平有较大差距。但文章存在一些明显的谬误,比如介绍了几项有关超算的内容,但这几项技术却并非中国还未掌握的核心技术。


日本在 CPU+GPU 异构式超算方面技术成果非常有限
《除了圆珠笔头,中国还有哪些核心技术没掌握?答案令人震惊……》一文中称:

“cpu/gpu 异构式超算系统的提倡者兼此平台程序软件的先驱开发者,超级计算机界最高峰学术赏 sidney fernbach award 的新科得主——东京工业大学全球科学信息计算中心 prof.satoshi matsuoka;随着后续软体资源的快速配套和并行集群计算技术的加速发展,cpu/gpu 异构式超算已经成为整个 hpc 界的事实标准体系,从最早的 tsubame1.2 到连续 green500 测试头名的 tsubame-kfc,目前全球几乎所有高性能超算系统都是此架构的支持者,matsuoka 博士也因此获得了象征超级计算机领域个人最高荣誉的 sidney fernbach award”

抛开文章中非常拗口的表达方式不谈,该文章中的内容很容易误导读者,以为日本在 cpu/gpu 异构式超算方面有很高的成就。那么,实际情况又是怎么样呢?

CPU+GPU 异构式超算系统仅仅是异构式超算系统的一个选项,而日本 matsuoka 博士是 CPU+GPU 异构式超算系统的提倡者,而之后的完善和实现是全球众多工程师、公司合力的结果,比如中国国防科大、美国英伟达公司等都参与其中。

就 CPU+GPU 异构式超算的技术成果来说,中国有天河 1A,美国有泰坦。相比之下,日本在 CPU+GPU 异构式超算方面却没有性能与泰坦相似的 CPU+GPU 异构式超算系统,根本没能建成哪怕一台性能达到神威太湖之光十分之一的 cpu/gpu 异构式超算。即便是日本最新建的超算 Oakforest-PACS,也使用的是 Intel 的众核加速器,而非美国英伟达公司的 GPGPU。


日本新超算 Oakforest-PACS

 


CPU+GPU 异构式超算并非高不可攀


异构计算要使用不同类型的处理器来处理不同类型的计算任务。常见的计算单元包括 CPU、GPGPU、GPDSP、ASIC、FPGA 和其它类型的众核处理器等。采用异构计算架构的超算会使用至少 2 种类型的处理器,其中异构计算架构中通用 CPU 负责逻辑复杂的调度和串行任务,加速器负责并行度高的任务,实现计算加速。

具体来说,采用异构计算架构的超算在运算中既使用处理器,又使用 GPU 或众核芯片等加速器。中国天河 2 号、美国泰坦都采用异构计算架构。

而根据使用的加速器不同,异构超算也有多种类型。

比如美国超算泰坦、中国的天河 1A,就是 CPU+GPGPU。

中国超算天河 2 号就是 CPU+众核处理器。

中国天河 2A 超算则是 CPU+GPDSP。由于美国对中国四家超算中心禁售 Intel 至强 PHI 计算卡,升级之后的天河 2A 采用自主研发的矩阵 2000 来替代 Intel 的计算卡,在更换加速器之后,变成了 CPU+GPDSP,这是全球首创。

此外,也可以直接使用经过有着特殊设计的众核芯片,比如神威太湖之光,这也是全球首创,国外间谍对中国这款众核芯片非常感兴趣。原因就在于这款众核芯片凭借设计理念的先进性,以落后美国 Intel 公司 2 代的制造工艺,实现了与美国 Intel 公司最先进计算卡相似的性能。

从中可以看出,CPU+GPU 异构体系只是异构超算体系的一个选项,而非什么高不可攀的黑科技。而且无论是中国天河 2A 的 CPU+GPDSP,还是神威太湖之光的众核异构体系目前都是全球唯一,而且性能无与伦比。

 


文中“目前全球几乎所有高性能超算系统都是此架构的支持者”不符合客观事实
文章中称:“cpu/gpu 异构式超算已经成为整个 hpc 界的事实标准体系”,“目前全球几乎所有高性能超算系统都是此架构的支持者”。但这与客观事实不相符。


举例来说,如上图所示:2016 年 TOP500 前 10 的超算依次为:

神威太湖之光,中国,性能 93P;

天河 2 号,中国,性能 33P;

泰坦,美国,性能 17P;

红杉,美国,性能 17P;

科里,美国,性能 14P;

Oakforest-PACS,日本,13P;

京,日本,性能 10P;

代恩特峰,瑞士,性能 9P;

米拉,美国,性能 8P;

三一,美国,性能 8P。

在这当中,红杉、米拉、三一、京都是属于同构体系超算,压根就不是异构体系超算,更遑论 cpu/gpu 异构式超算。

而天河 2 号、科里、Oakforest-PACS 采用的是 CPU+众核加速器,虽然属于异构超算体系,但并非 cpu+gpu 异构式超算。

神威太湖之光在技术上独树一帜,将管理核心与加速器合二为一,属于众核异构超算。

在全球性能最强的 10 台超算中,只有泰坦和代恩特峰使用了英伟达的 GPGPU,属于 cpu/gpu 异构式超算。

从中可以看出,“cpu/gpu 异构式超算已经成为整个 hpc 界的事实标准体系”,“目前全球几乎所有高性能超算系统都是此架构的支持者”这种说法是站不住脚的。

过度鼓吹被淘汰技术并不可取
文章中称:“NEC 喧布已开发完成最新型 SX 系列矢量超级计算机——SX-ACE 这台采用 sun 架构的矢量超算虽然其总体运算能力(130TFLOPS)排不进世界前 5,但却具备世界第一的单核性能(64GFLOPS)和世界第一的单核内存带宽(64GB/s),并利用独到的工业设计实现紧凑化与低耗能”。


首先要明确的是,日本比较推崇向量机,SX-ACE 其实是向量机,中国在几十年前也曾经做过,比如已经有不少年月的国内首台银河亿次机就是向量机。因而向量机对于中国来说并非什么没有掌握的技术。

现在中国不做向量机,并非没有掌握该技术而做不了,而是完全是不屑于做。因为这种向量机完全早过时了,完全是被淘汰的设计,性能低就不说了,还有成本高,应用范围窄的缺点,更要命的是可扩展性也不好。

对于日本的 SX-ACE,国内从事高性能计算机的资深工程师表示:这机器现在大概已不存在了吧 ..... 我说大概不存在,主要是目前很少有人再去推崇向量机;第二就是这台机器的性能参数并不突出,不值得耗费时间精力去关注。

最后要补充的是 SX-ACE 很多技术其实源自美国 SUN 公司,比如其 SPARC 处理器,就是 SUN 公司的遗产。

 


中国在超算技术上领先日本
在 2011 年,日本超算京曾经位列 TOP500 第一。但由于日本经济在广场协议之后一直保持在低迷的状态,加上超算本来就属于偏向国家工程的项目,相对较少的建造量和昂贵的价格都很难让私人公司通过超算获取高额利润,在研发成本过于高昂的情况下,使得日本 NEC、日立等大公司先后退出超算研发领域,唯有富士通还在苦苦支撑。

而在超算研发经费的拨付上,日本政府相当吝啬。而且还曾发生过这样一件事——数位日本科学家联名向政府申请超算研发经费,结果遭到日本政客反问:“当老二有什么不好?”

也正是因此,由于长时间缺乏经费,导致日本在超算技术上缺乏大型工程的磨砺。对于此,日本官方也是心知肚明。在 2016 年,日本文部科学省发表了后续基本设计方针:“在发展方针中,日本文部科学省不再追求世界第一的计算速度,而是将目标由加快计算速度转向了加强节能及便捷功能”。但从曾经追求计算性能最强超算,到如今的追求最节能超算,想必日本从事超算建设的工程师们心中除了无奈只有苦笑吧。

在美国盐湖城 SC16 全球超算大会期间召开的第 14 届 HPC Connection Workshop 中外超算高峰论坛(HPCC)上,日本理化所 Mitsuhisa Sato 透露了日本发展 E 级超算的“旗舰 2020 计划”,宣布将在 2017 年 4 月投入运营 Post K 超级计算机,其系统峰值性能约为 25P, 1000P 超算的升级计划被排到了 2020 年。

不过,技术发展有其规律,是一步一个脚印迭代演进的,大跃进式一口吃成一个胖子的做法并不可取。而且日本的超算建设十有八九无法按时完成,举例来说,如今已将近 2017 年 4 月份了,日本理化所计划中投入运营的 25P 超算尚无音讯。何况日本最新的 Oakforest-PACS 也只有 13P,从 13P 迅速跨越到 1000P,这中间的技术扩跨度实在是太大,从处理器到互联网络都有质的飞越,如果不谋求从美国获取技术,这对于日本来说未必不是一个挑战。


目前,中国三家单位同时开展了 1000P 超算的原型机研制,并计划在 2020 年建成 1000P 超算。考虑到中国在过去几年中在超算上技术成果斐然,先后研制出曙光 6000、天河 1 号、天河 2 号、神威太湖之光等性能优异的超算,中国很有可能领先日本完成 1000P 超算的建设。

更多最新行业资讯,欢迎点击与非网《今日大事要闻》

相关推荐

电子产业图谱