“2005年,在一个演讲中,有专业人士预判,设计芯片的验证工作量占比将来会超过70%,当时我很震惊。但事实证明,这一年来,我们所有的合作伙伴、客户在芯片验证领域所花的人力、物力已经超过了70%。这是发展的历史见证,当芯片规模越来越大、设计越来越复杂、制程也越来越复杂,对于芯片的成功设计和生产,验证工作变得弥足珍贵,直接关乎胜败。” 西门子EDA全球副总裁兼中国区总经理凌琳如是说。
的确,在过去20年时间里,验证的方法论,特别是硬件辅助验证,已经成为EDA客户的关注焦点。与此同时,根据业界实践数据显示,采用硬件辅助验证的IC设计项目在首次硅片成功率(First Silicon Success)上有显著提升,减少了大量的返工时间和成本。基于此,市场调研机构预测,2019-2024年间,硬件辅助验证市场的复合年增长率(CAGR)预计超过10%。而未来,随着AI、ML、大规模计算技术的持续发展,对硬件辅助验证市场的需求也会同步提升。
硬件辅助验证平台是什么?
提到硬件辅助验证平台,可以参考AMD提出的三层解决方案空间观点,即硬件仿真加速、企业级原型验证、软件原型验证。
图 | 西门子EDA硬件辅助验证产品管理高级总监Vijay Chobisa介绍三层解决方案空间
首先,我们来看硬件仿真加速,芯片设计团队需要有快速的编译,用于设计的bring up、迭代和调试,并且循环往复地快速去做这项工作。由于在设计仿真的早期就需要用到硬件仿真加速,所以需要全信号可见,来实现快速的调试。
其次,我们来看企业级原型验证,当我们的设计相对稳定下来,不需要再去做频繁的更改时,就可以把验证的工作推进到原型验证阶段,包括早期的固件和嵌入式的软件验证,从而实现在更长的工作链路上看到整个软件的工作量。
对于企业级原型验证而言,高度的一致性非常重要,这个一致指的是硬件仿真加速和企业级原型验证的一致性,也就是可以把整个硬件加速的结果转换到企业级原型验证当中,同时如果在原型验证中有一些具体的调试问题,也可以返回硬件仿真加速。
最后,我们来看软件原型验证,这个主要是给软件工程师使用的,换言之,系统软件工程师可以在芯片还未流片前就能初步测试软件的功能和性能表现。同时,为了保持系统级验证,需要有高速接口和IP验证,以及灵活的配置,比如更改连接线,或人工更改分区等,达到以最低的成本实现最高的性能吞吐率。
根据与非网的观察,当前全球主要的硬件辅助验证市场企业包括西门子、Agnisys、Aldec、新思科技(ANSYS)、Blue Pearl Software、Cadence、EMA Design Automation、Hardent和Innovative Logic等,这些第一、第二梯队的企业占据了大量的市场份额。
行业独家,西门子同步发布三大硬件辅助验证系统平台Veloce CS
作为全球硬件辅助验证市场中重要的平台提供者,近日西门子数字化工业软件推出 Veloce CS 硬件辅助验证和确认系统,该系统融合了硬件仿真、企业原型验证和软件原型验证三大产品板块:
- 用于硬件加速仿真的 Veloce Strato CS 硬件
- 用于企业原型验证的 Veloce Primo CS 硬件
- 用于软件原型验证的 Veloce proFPGA CS 硬件
图 | 西门子同时宣布新一代三大硬件辅助验证产品
随着Veloce CS的推出,西门子也跃升为业界唯一拥有3个硬件系统平台的公司,其他竞争对手最多拥有其中1~2个硬件系统平台。
事实上,如果大家对西门子的硬件辅助验证工具有所了解,可以看到2021年西门子曾推出Veloce硬件辅助验证系统,该系统融合了虚拟平台、硬件仿真和 FPGA 原型验证技术。所以今年推出的Veloce CS一方面是三年前Veloce的升级,另一方面又通过收购整合增加了软件原型验证的平台。
根据西门子EDA硬件辅助验证产品管理高级总监Vijay Chobisa的介绍,Veloce CS相比Veloce的提升不是一丁半点,包括速度提升了5-15倍,能耗减少了2倍,密度又提升了2倍。以硬件加速仿真产品为例,与上一代 Veloce Strato 相比,Veloce Strato CS 的硬件加速仿真性能显著提高,最高可达 5 倍,同时还可保持完全的可观测性,支持能力从 4000 万门电路扩展到超过 400 亿门电路。
图 | Veloce Strato CS + Veloce Primo CS,提供完整统一的硬件/软件开发和验证平台
他还提到,Veloce Strato CS和Veloce Primo CS出自同一个研发团队,外部长相一致,系统架构一致,运行环境一致,并能在不同平台之间无缝移动,所以可以大大提升用户在启动、设置、调试和工作负载执行的速度。如果将其量化,Veloce Strato CS和Veloce Primo CS双机运行大约可提高6~10倍的生产力/收益。
此外,提到软件原型验证平台,它的入门成本是非常低的,用户可以根据自己的体量需求来制定小、中、大型的系统配置,小型的包括单块FPGA和4块FPGA的桌面级原型,中型和大型的则采用刀片式架构,可从6个FPGA扩展至180个FPGA(6个为一个刀片,30个刀片即为180个FPGA),非常灵活。
自研芯片CrystalX+刀片系统,实现从4000万到400亿的可拓展性
前面提到Veloce Strato CS拥有从 4000 万门电路扩展到超过 400 亿门电路的能力,这是如何实现的呢?
有一点很重要,那就是整个Veloce CS平台都采用了模块化刀片配置,可以像搭建乐高积木一样往上累加,不仅提高了系统电路能力的上限,还增加了灵活性,并在规模效应中降低了成本。事实上,模块化刀片配置在高性能计算市场是非常主流的一个趋势,尤其符合现代数据中心的占地要求、能耗要求以及冷却要求。
除此之外,基础硬件的升级也是Veloce CS性能表现突出的重要基础。
据悉,Veloce Strato CS搭载了完全由西门子自主设计的专用加速器芯片——CrystalX,该芯片采用7nm制程工艺,叠加薄膜技术的创新和2.5D IC堆栈技术,可以帮助客户实现更加快速的可预测的编译、设计、启动和迭代。
图 | Veloce CS 系列产品的技术基础
而Veloce Primo CS和Veloce proFPGA CS则均采用了AMD的自适应FPGA产品——VP1902,这也是Veloce Primo CS和Veloce Strato CS在底层技术上的重要区别。
值得一提的是,由于CrystalX芯片里有一个逻辑分析器,所以Veloce Strato CS的调试性能会比Veloce Primo CS更好。
关于下一步西门子是否会考虑自研更多芯片,来替代AMD的FPGA应用时,Vijay Chobisa表示:“AMD既是西门子的供应商,又是西门子的客户,双方合作非常紧密,而西门子暂时也还没有计划自研原型验证用的SoC或FPGA产品,来替代现有的这种高效组合。”
10亿门容量,只要10千瓦能耗,是竞对的1/7~1/6
我们在前面的章节提到了全球主要的硬件辅助验证市场企业,那么如何来评判这些企业的产品在市场中的地位和特色呢?首先用户的体验和反馈是首要的,另外在全球性推动经济结构绿色转型的今天,能耗也是大家关注的焦点。
据悉,Veloce CS平台使用的是风冷系统,不需要额外的液体或水的冷却,所以在10亿门的容量上大概需要10千瓦的能耗,与竞对产品相比,Veloce CS平台的功耗是行业最低,仅从用电和冷却方面就可节省数百万美元。