当您考虑数据中心电源管理的关键用例时,您首先想到的可能是能效。毕竟,您越能控制数据中心的能耗,就能节省越多的钱,就能更好地利用现有资源,也能越严格地遵守有关 IT 设备安全环境或绿色环保的行业指南数据中心举措。这就是为什么数据中心监控与设置阈值和发送陷阱、警报和通知的能力相结合对当今的数据中心经理如此有用。
但是,如果您的智能 PDU 无法发送陷阱怎么办?如果出现网络或停电怎么办?这是数据中心中断的两个主要原因 ,随时可能发生。
如果无法连接到数据中心的设备,则很难了解智能 PDU 的状态。数据中心基础设施管理 (DCIM) 软件等工具可以通过对数据中心内的智能 PDU 和其他设备进行健康监控来帮助您解决此类情况。
有哪些不同类型的数据中心健康监控?
DCIM 软件通过使用 SNMP 或 ICMP 等协议轮询并从中收集数据来监控数据中心智能 PDU 的健康状况和状态。大多数DCIM工具都支持标准的数据轮询,您可以在其中设置轮询间隔(例如五分钟),您的数据中心软件将以所需的间隔轮询智能PDU,然后收集并存储数据。在物理单元中具有内存的智能 PDU 可能能够在单元本身上存储数据,这样您的DCIM 软件就可以轮询 iPDU并减少收集数据的频率,从而减少轮询频率并提高网络流量的效率。如果发生断电或您失去与 iPDU 的连接,此功能也很有用,因为您可以在必要时稍后收集数据。
除了标准数据轮询之外,全面的 DCIM 解决方案还将具有健康轮询。与仅使用标准数据轮询相比,健康轮询可以让您更快地获取有关 PDU 健康状况的信息,方法是更频繁地对 PDU 执行 ping 操作以确保它们可通过网络访问。DCIM 软件可以使用此信息来更新智能 PDU 的健康状况,并在 PDU 的状态发生变化时创建事件。
为什么需要数据中心健康轮询?
当与 DCIM 软件结合使用时,运行状况轮询使您能够检查以下内容:
- 为您的智能 PDU 供电。健康轮询可以帮助您测试您的智能 PDU 是否通电。如果 PDU 没有电,它在轮询时不会响应。
- 网络连接。运行状况轮询可以通过检查 PDU 在网络上是否可达来帮助您确定是否存在中断。
- PDU通信。运行状况轮询可以通过响应 ping 来帮助您确保智能 PDU 上的通信模块正常运行。
例如,假设您的数据中心有 500 个机架,每个机架都设置了两个 iPDU 以实现冗余。如果您丢失了其中一个 PDU,尽管失去了冗余,您可能不会断电并触发警报。通过运行状况轮询,您的 DCIM 软件可以每隔一分钟对数据中心的每个 iPDU 执行一次 ping 操作。然后您会收到 PDU 不可用的警报,并立即采取措施解决这种情况。
使用数据轮询和健康轮询的数据中心监控实践可以有效地关注您环境中的智能 PDU。它通过自动检查电源、网络连接和与您的 iPDU 的通信来简化数据中心电源监控,因此您会在问题成为问题之前迅速收到警报。
下次您在 DCIM 软件中配置轮询间隔时,请考虑这种腰带和吊带方法如何为您的数据中心的健康提供额外的保护层,并最终帮助您确保正常运行时间和可用性。