北京2024年8月15日 /美通社/ -- 目前数据中心运维人员部署服务器时,经常会遇到服务器开机噪音极大,开机声浪仿佛"飞机起飞",明明刚开机,服务器内部各个部件还未完全上电,风扇转速为什么要拉满?而且,伴随着风扇的呼啸声,服务器启动"龟速",开机时间要3、5分钟甚至更久,严重影响了服务器运维部署效率。
通过BMC Linux/RTOS异构双系统并行管理技术,浪潮信息首创「开机3秒智能控温技术」,能够在服务器上电后,BMC的Linux系统启动之前,3秒内即时接管风扇转速调控策略,通过实时感知环境温度,实现对温度与散热的动态把控,噪音比优化前最大下降30.4%,提升数据中心运维体验,开机功耗相比传统风扇转速拉满策略也可降低一半以上。同时,通过BMC RTOS系统与Linux系统的同时启动,及BIOS系统优化,可实现上电即开机,开机时间缩短一半以上,减少时间敏感型业务部署上线时间,有效降低因为运维重启服务器对于业务的不良影响。
浪潮信息首创服务器开机3秒智能控温技术
服务器启动时间过长且风扇噪音过高的症结在于,服务器传统控温策略中为了尽可能满足散热安全性要求,上电之后会以覆盖最大配置的方式来进行风扇速度调节,而此时BMC Linux系统尚未启动,热量传感器数据无法采集,导致风扇满载状态会持续较长时间,带来能耗、噪音的攀升和稳定性的降低。而且为了避免开机过程中散热风险一般会设置等待BMC Linux 系统启动完成后再启动 POST 过程,导致服务器从 AC 上电到进入 OS 的时间被拉长。
除了启动过程中服务器风扇满转,噪音过高,在BMC的Linux故障情况下,由于没有合理机制能够保证风扇的可靠接管,也会造成风扇满转噪音瞬间达到峰值,服务器始终在功耗峰值运行,运维环境恶劣,不仅不符合节能降碳趋势,还会影响系统稳定性和风扇寿命。
为了化解服务器启动等过程中的风扇控制难题,浪潮信息首创开机3秒智能控温技术。该技术通过解决BMC异构双系统核间通信的难题,实现BMC内部RTOS 3秒智能控温技术和Linux管理技术的双系统并行,有效利用RTOS实时操作系统采集传感器数据,实现毫秒级的信号采集控制,确保风扇控制的高效、精准,同时也优化了服务器开机管理流程。
创新一:创新RTOS系统 精准控制风扇转速
浪潮信息充分利用BMC芯片算力资源,创新性开发RTOS实时操作系统,通过PECI总线对环境温度以及部分核心部件温度进行采集,开机即可实现毫秒级的信号采集控制,随后通过闭环反馈实现对温度与散热的动态把控,从而精确掌控散热资源,以满足散热需求的最小化资源,降低无效功耗。
在通过RTOS系统实时获取传感器温度数据的基础上,浪潮信息独家提出BMC Linux/RTOS异构双系统并行技术,成功攻克多核多系统之间数据交换难题,构建了开机期间,全新的风扇控制策略:
- BMC Linux系统启动前,RTOS进行系统温度收集及控制;
- 在BMC Linux系统启动阶段,由Linux收集传感器温度信息,之后通过共享内存传递给RTOS,由RTOS进行风扇调控
- 当BMC Linux系统完全启动后,由Linux系统收集传感器温度并亲自实现温度调控。同时在BMC Linux系统故障或重启时RTOS能迅速接管散热系统并精确控制风扇转速。
创新二:阶梯性散热策略 散热需求实时动态响应
开机过程中,一般服务器内部各部件会相继启动,带来的散热需求应该是阶梯式增长的。但此时BMC Linux系统尚未启动,无法控制风扇转速,为保障服务器高可用性,风扇只能按照极端环境下的极限负载高转速运行,造成能耗、噪音的提升和稳定性的降低。
浪潮信息基于深耕多年的服务器行业经验,结合电子设备在上电后热量逐渐累积并向外传递的散热数据,构建服务器散热策略专家库,与业界开机即风扇拉满的策略不同,创造性的提出基于服务器温度感知的阶梯性风量提升控制技术。
借助毫秒级的信号检测和梯度散热模型,浪潮信息了实现对散热需求的动态响应,使风扇转速能够阶梯式上升,不仅更符合硬件散热规律,也使得开机过程中的噪音得到有效控制。实测数据证实,在环境温度为20°时,浪潮信息的解决方案可将风扇转速值控制在25%,开机噪声值降低至44.7dBA,噪音下降30.4%。在BMC重启或挂死情况下,其能够将风扇转速值优化40%,噪声由71.8dBA降低至57.2dBA。
创新三:上电即开机 开机时间缩短一半以上
RTOS作为轻量级实时系统,任务负载量小,可先于BMC Linux启动,同时搭配浪潮信息独有的BMC Linux与服务器BIOS系统同步启动技术,可实现上电即开机,从而大幅度提升开机速度。
测试数据显示,部署RTOS实时操作系统和BIOS快速启动技术的服务器,进入操作系统时间可较业界缩短一半以上,不但可以快速执行时间敏感型任务,还能有效加快常规业务部署上线,并减少因为运维重启服务器对于业务时效的影响。
开机智能控温,大规模数据中心高效绿色发展利器
浪潮信息服务器开机3秒智能控温技术,为数据中心运维人员解决了"服务器部署时启动时间过长,且风扇转速一次性拉升过高"的问题,实现上电即开机,开机速度较业界平均速度最大提升1.2倍,助力业务快速上线,减少因为运维和维护造成的业务搁浅时间。
同时,在阶梯式转速控制模型和闭环反馈控制的精确调节下,实现了根据环境温度和散热需求的动态响应,大幅改善启动过程中的噪音,噪音比优化前最大下降30.4%,能够为运维人员提供更舒适的机房环境,并实现风扇转速的全周期速率可控,延长风扇寿命,降低运维成本。在BMC Linux故障的情况下,RTOS还可以迅速接管设备散热管理,对风扇进行有效管控,防止设备过热损坏,提升系统可靠性。