作者:Christian Cruz,应用开发工程师
Marvin Neil Cabuenas,高级固件工程师
摘要
本文详细介绍了ADI公司用于开放计算项目开放机架第3版(OCP ORV3)备用电池单元(BBU)架的硬件和软件。其主要功能是建立BBU模块之间的通信,并通过为此类应用精心打造的图形用户界面(GUI)向用户呈现可读数据和信息。
引言
备用电池架是OCP ORV3架构和数据中心应用中电源管理系统的重要功能,对于不间断电源(UPS)来说尤为关键。这些架子经过精心设计,专门用于存放和管理备用电池,是确保关键设备在停电和电压波动情况下稳定运行的重要保障。
在当今技术高度发达的时代,可靠备用电源系统的重要性不言而喻。数据中心、电信枢纽和服务器机房的稳定性对公司运营至关重要,因此强大的备用电源系统必不可少。在这种背景下,备用电池架作为这些系统的基础,在各行各业发挥着关键作用。这些架子是高效存放BBU的基础枢纽,有助于提升关键电力储备的可用性,其主要作用是容纳和管理多达六个BBU模块,每个模块都精准对齐以容纳与电源转换器配对的锂离子电池。这些架子的结构经过悉心设计,巧妙地将空间利用效率和可访问性融为一体,令维护工作更加便捷,更换操作也更加简单。
电池备用架的一大优点在于能够集中管理和组织BBU模块库存。一个规范的存放系统有利于对BBU模块进行跟踪、标记和维护,从而减少误放或混淆的风险,这对于关键情况尤其重要。此外,这个集中化的存放系统还为电池健康监测提供了超大便利,更加便于定期进行检查、测试和更换操作。
BBU架有多种尺寸和配置,可满足不同行业和机构的个性化需求。部分架子采用模块化设计,提供了灵活性,可适应未来电力需求的发展。同时,这些架子上装有集成监控系统,可实时提供电池状态信息。此外,电压水平、温度、模块活动和剩余容量等详细信息也一目了然,方便进行预防性维护,并确保电池在关键时刻随时可以提供电力。
BBU架概述
根据OCP对ORV3新架构的定义,开放机架电源架构由集中式可扩展电源架和BBU架组成,BBU架通过公共母线将电力分配给有效载荷设备(IT设备)。此规范对适合放入开放机架的BBU架做出了定义。BBU架将包含六个BBU模块,具有5+1冗余能力,为机架内的所有有效载荷提供直流电源。当交流电源断电时,BBU架可以在指定的备用时限内持续提供备用电源,功率最高可达电源架的最大额定值。BBU架的备用时间使机架可以在不同电源之间切换而不影响IT设备运行,并且应用程序可以在电源断电前安全转移或关闭。
图1.OCP ORV3架构中的BBU架配置1。
架微控制器固件
BBU应用中使用MAX32625作为架微控制器,这是一款超低功耗Arm® Cortex®-M4微控制器,在应用中需负责多个过程。
- 通过Modbus®协议与主机通信
- 通过Modbus协议与模块通信
- 处理模块的定期充电
- 系统控制模式
图2.(a)模块到架的通信示意图,(b)架到PC的通信方框图。
通过Modbus协议与主机通信
在图2中,架微控制器发挥的关键作用是充当专业Modbus服务器,通过稳健的RS-485接口与主机建立无缝通信,主要功能是不遗余力地实时从众多模块收集数据。随后将所采集的数据传送到主机,用于填充动态GUI应用程序,从而提供更直观的图形展示。当从主机接收到通信时,架微控制器充当“门卫”,有条不紊地验证每条消息的有效性和完整性。微控制器确认消息的真实性满足要求后,会利用保持寄存器中存储的信息量快速地拟定答案。这个精心设计的响应包含主机所需的答案,答案以结构化的方式呈现。
然而,当传入的消息受到异常污染时,架微控制器不会发生故障,而是会迅速承担起有效通信者的角色,根据Modbus协议以错误消息进行响应。此错误通知会向主机发出异常警报,以便后者采取适当的纠正措施。
本质上,架微控制器的重要性体现在其所扮演的多方面角色上——它既是数据管道,又是数据完整性守护者,还是响应式信息提供者。所有这些都有助于在Modbus驱动的交互领域构建强大而可靠的通信框架。
通过Modbus协议与模块通信
在图2中,架微控制器的关键作用愈发明晰,它在Modbus客户端和Modbus服务器的角色之间无缝转换,协调复杂而高效的通信生态系统。当与许多BBU模块交互时,架微控制器扮演Modbus客户端的角色,发起并维护与每个唯一模块的对话。这些BBU模块充当Modbus服务器,不断使用最新信息更新其保持寄存器。在同步工作时,架微控制器还以循环方式遍历BBU模块环境,定期捕获来自每个模块的遥测数据。这些包含有用洞察的数据被小心地存储在微控制器的存储器中,以便在主机提出问题时可以随时做出回答。
不过,架微控制器的用途不仅限于BBU系统内的客户端-服务器交互,还可以转换为Modbus服务器,根据请求将收集的数据传送到主机,在主机和众多BBU模块之间架起重要桥梁。与此同时,它继续发挥Modbus客户端的作用,管理与BBU模块的交互,并确保信息是最新且准确的。
本质上,架微控制器具备多功能性和适应性,能够灵活地充当客户端和服务器,促进主机与BBU模块之间的交互。这种相互联系表明它有能力维持稳固的通信结构,从而提高整个系统的效率和可靠性。
处理模块的定期充电
根据OCP要求,BBU模块必须定期充电,因为电池包在待机时会漏电。BBU模块每10天只能充电一次,因此架微控制器必须监控和管理哪些BBU模块需要充电。架微控制器通过Modbus协议命令来确定哪些BBU模块需要定期充电,然后启动相应的定期充电操作。OCP确立的标准决定了系统架构中BBU模块的基本需求。这些模块是系统的关键组成部分,必须定期充电,因为电池包在待机期间会发生电流泄漏。换句话说,定期充电是保持最佳性能和运行可靠性的必要操作。
系统控制模式
最后,OCP建议添加用户控制项来覆盖BBU模块操作。通过Modbus,用户可以调整单个BBU的运行状况,以确定其是否需要充电或放电。
BBU架图形用户界面(GUI)
图3.BBU模块。
BBU模块GUI分为若干部分,负责向用户提供重要信息,下面将详细介绍具体部分和功能。参见图3。
- 模块运行状态指示灯
- 模块内部温度读数
- 模块故障指示表
- 风扇转速指示(单位:rpm)
- 电源转换器指标信息
- 电芯信息(电压和温度)
模块运行状态指示灯
GUI上至少有4个LED指示灯:
- 蓝色LED表示BBU模块处于充电工作模式
- 第一个琥珀色LED表示BBU模块处于放电模式,并为数据中心的背板提供备用电源
- 第二个琥珀色LED表示BBU模块处于寿命末期(EOL),需要更换
- 红色LED指示BBU模块发生故障
模块内部温度读数
除了BBU运行状态外,模块的内部温度也会显示在GUI中。电池堆和电源板内至少放置了九个温度传感器。LTC2991向主MCU提供数字温度读数;而ADBMS6948提供电池堆的模拟温度读数。
模块故障指示表
GUI的故障表描述了模块运行期间触发的不同类型故障。模块故障如下:
电源转换器指标
GUI是一项重要资源,可在模块运行时,为电池堆和背板提供重要运行指标。这些指标范围很广,涵盖了输入、输出电压以及电流等关键数据。模块运行和GUI之间的这种动态交互让用户得以完整实时地了解系统性能和能源动态。
电芯信息
GUI会显示电池堆电芯电压和温度水平。这些数据对于确定电池堆的健康状态(SOH)和充电状态(SOC)至关重要。
图4.BBU模块摘要GUI。
BBU模块GUI中有一个包含简单摘要和用户控制功能的窗口。这个特定选项卡可以监控所有六个BBU模块,同时支持对特定BBU进行单独控制,包括执行运行决策。图4直观的呈现了相关内容。
- 地址选择器
- 架系统控制
- 架系统参数
- 架故障和均流
地址选择器
用户可以通过策略性地准确选择BBU槽地址来顺利访问指定的BBU模块。这种策略分配并不是随机的;这是为了防止Modbus通信冲突而采取的预防措施,通过预定义一组BBU架槽地址来实现。
架系统控制
赋予用户修改BBU操作的权限,让用户可以指令特定BBU模块在运行期间充电或放电。选择强制放电模式会导致升压电压从48 V升高到51 V,从而有利于背板供电,同时让数据中心内的电源单元(PSU)保持运行而不受干扰。这种细微的控制可确保BBU功能与大型基础设施的无缝运行之间保持出色平衡。
架故障和均流
摘要表中会显示在六个BBU模块上检测到的任何故障并通知用户,可以迅速定位BBU架中任何故障。此外,在BBU模块并行或冗余操作期间,均流总线指示器显示当背板负载为最大值时,总线电压为7 V,当峰值负载操作有效时,总线电压为10.5 V。
总结
BBU架是实现可靠电源管理系统的关键组件。这些架子牢牢地相互连接,为备用电池系统创建了一个稳定的环境,是高效管理的核心枢纽。这样就能实现无缝运行,保持关键系统不间断,避免受到断电和电压波动影响。BBU架为数据中心、电信网络和任何需要UPS的环境提供重要保护,其主要使命是确保运营的连续性,提高可靠性,并保持电源基础设施稳健运行。本系列的下一篇文章将介绍如何为BBU辅助电路选择合适的组件,其中的标准和建议将有助于为关键设备选择恰当的供电器件,并减少设计不规范问题。
参考资料
David Sun。“1.1版开放计算项目开放机架V3 BBU架”。开放计算项目,2022年9月。