大数据呈爆炸性增长,现代数据中心日益复杂,然而数据中心没有模板,并不存在典型的数据中心,数据中心的工作负载是动态变化的,不存在单一的或某种类型的应用能够主导数据中心。因此现在的数据中心面临不断变化的要求和应用,必须保持可扩展性和敏捷性,无需进行硬件升级和扩展的前提下,能够不断的运行变化的应用。为了满足这一需求,赛灵思推出了可组合式数据中心。
何谓可组合式数据中心?赛灵思数据中心市场营销总监Ed Wright解释,所谓“可组合式”不仅是计算、网络和存储的分离,也不仅是在基础设施层面,可组合式数据中心是在器件层面实现可扩展和可配置,从而满足各类应用的需求。
SN1000:SmartNIC迎来新成员
在10G以内,市场上一直使用标准的NIC,支持高效的输入输出,从服务器到网络,一直到存储都不需要进行加速。但是从10G到25G节点,CPU的内核开始出现卡顿,于是就产生了卸载NIC,从而减轻CPU的负担,同时推进网络数据包的加速。但是卸载NIC使用的都是ASIC,无法重新编程,而且卸载只能支持10G到25G。随着端口速率从25G向40G、50G甚至100G过渡,CPU内核资源更多用于网络数据包加速处理,于是可编程SmartNIC应运而生。
最早采用SmartNIC技术的是超大规模的数据中心和云服务提供商,包括百度、阿里、腾讯等公司,它们对线速性能的数据包处理性能要求很高。超大规模数据中心的要求各不相同,因此在实施过程中如果使用CPU和ASIC,很难满足客户的差异化要求。AISC方案跟不上超大规模数据中心每过12-18个月就会有很大变化的演进速度;CPU和SoC方案无法满足硬件加速的要求和性能。
超大规模的数据中心和云服务提供商的要求主要体现在三大领域:网络、安全和存储,他们希望SmartNIC可以实现加速网络、安全和存储卸载功能。
赛灵思推出的Alveo SN1000 是业界首款硬件可组合式SmartNIC,既包括网络功能的卸载,还可以进行计算卸载和计算加速,也是可组合式数据中心的核心。赛灵思数据中心事业部网络与存储产品管理总监 Kartik Srinivasa介绍,这是一个2×100GB的SmartNIC,符合数据中心封装尺寸和功耗仅为75瓦的需求,这款产品基于赛灵思16nm UltraScale+架构 FPGA,和 16核 NXP Arm处理器,以线速提供协议级的可编程能力。
如上图所示,红色部分FPGA是数据面,白色部分是控制面,中间灰色部分是内存,内存既支持数据面也支持控制面。赛灵思预先对硬件进行了加速,包括OVS加速、网络虚拟化安全加速和存储加速等,因此SN1000 SmartNIC开箱即用,而且即插即用。客户可以选择对数据面进行配置。例如,客户可以用SmartNIC进行远程存储加速,对NVMe进行加速。同样的客户如果想使用SN1000对于网关流量进行加速,他可以进行相应的配置加速安全和防火墙,同时还能够保持相关性能。在这个案例中还有一些剩余空间,客户还可以对数据面的其他方面进行加速。也就是说,SN1000 支持客户根据不同的要求进行灵活的组合并进行加速。
如上图所示,在此案例中,客户加入了一个定制虚拟交换机,而不是用赛灵思的OVS。同时还可以对虚拟化和安全进行加速,所以客户可以先使用SN1000提升或者增加数据面的功能和加速,或者是根据客户需求去除预装的功能,然后进行定制,满足客户的要求。
客户怎么才能充分利用可组合式的功能呢?主要是通过赛灵思统一软件平台Vitis全新打造的Vitis Networking 软件平台。通过Vitis Networking,用户可以使用像P4这样的高级语言来对数据面进行编程,也可以使用C和C++的语言对于ARM进行控制和流量的管理。
对于成熟的用户来说,他们可以继续使用RTL或者是其它高级综合这样传统的FPGA编程方法,对数据面进行管理。通过该模块,无论是配置还是加速,既可以由赛灵思来实现,也可以由客户来实现,以及客户的客户、独立的软件和IP合作伙伴来实现,这就是可编程带来的强大灵活性。
SmartNIC具有诸多优势,是否意味着其部署会超越传统NIC?Kartik认为,关于可编程的SmartNIC,行业专家预测到2024年市场占有率会达到70%。有了SmartNIC之后,之前需要消耗很多CPU内核被取代了,从而实现更大的外部效应,使得TCO有关的费用降到最低。
时延低于1微妙的加速算法交易
当今的算法交易主要是两大路径,一个是硬件算法交易,另一个是软件算法交易,这两者的性能有很大的差异,如果软件算法交易想要转换成硬件算法交易门槛非常高。如果做硬件算法交易,需要找专门的硬件开发商在IT系统上做一个设计和架构,然后才能提供解决方案,成本高,且交付周期长。
更让用户困惑的是,当今CPU的速度已经到达了天花板,时延无法低于一毫秒。主要是由于受到联网的影响,也就是通过PCIE总线到网络,然后再返回CPU,时延不可避免要超过一毫秒,赛灵思的解决方案就是把交易从CPU迁移边缘,也就是定制的硬件,但是这种方式进入高频交易市场成本很高,这是很多交易商面临的一大挑战。赛灵思加速算法交易可以帮助交易者使用复杂的策略,而且不需要硬件开发,就可以实现低于一微秒的低时延要求。
在Vitis软件平台上,开发者可以通过模块化的方式来构建并且部署基于FPGA的Alveo卡,之所以称之为模块化,是因为他能够支持库的混搭,从而支持广泛的算法交易的应用,在这个层面上再部署算法交易的框架和IP。让交易者可以在赛灵思加速算法交易框架中,使用各种库进行组合,并且支持C和C++语言进行编程,这样就能支持各种软件开发商,还可以把内部和第三方的应用进行集成,同时时延降低到微秒级以下,大幅缩短上市时间。
在赛灵思推出加速算法交易之前,有两种解决方式,一种是使用CPU来驱动算法交易,虽然部署快速、简单,但是缺乏市场竞争力;另一种是使用定制的硬件开发,速度很快,竞争力也很强,但是价格昂贵,开发时间长,所以赛灵思的加速算法交易既能够缩短上市时间,而且还很有竞争力,填补了算法交易中CPU 或者定制硬件开发之间的市场空白。
不同的模块可以涵盖广泛的平台,让不同的机构用户使用,包括经纪人、交易所,市场数据厂商,销售侧的厂商和自营交易商等。赛灵思的加速算法交易部署简单快捷,只需要购买赛灵思的Alveo U50和Alveo U250,然后通过赛灵思渠道的经销商和分销商来获得产品,然后从Xilinx.com免费开源下载,用户无需授权费用就可以使用赛灵思的加速算法。
APP Store:方便用户快速部署加速应用
为了方便用户快速应用赛灵思的加速方案,赛灵思还上线了应用商店,方便客户评估、购买、部署有关的应用。和其它应用商量类似,赛灵思的应用商店也是将应用集中到一起,方便客户浏览下载。
赛灵思数据中心部亚太区数据中心战略营销经理Guruprasad M. Parthasarathy表示,“这本身就是非常成熟的一种做法,但对于赛灵思来说,通过应用商店的方式可以使赛灵思的客户非常迅速、方便地评估,并且部署基于赛灵思硬件的解决方案和应用,因为这本来一直都是我们的弱项。所以应用商店对我们来说,真正实现的突破是能够支持我们的客户,使得客户在认识到FPGA架构的优势,只需要十分钟就可以对有关的解决方案和应用去进行评估和部署。这是一个非常大的突破,尤其是在客户对于我们的解决方案和应用的可获得性和易用性方面。”
总之,无论是Vitis Networking和Vitis解决方案,还是SN1000,以及应用商店,赛灵思都是希望突破企业和FPGA技术的壁垒,使FPGA更加简单易用,使赛灵思的品能够更加的普及化,更好地去广泛服务企业。
--end--