随着远程工作和对在线服务需求的增加,推动数据中心资源的更高利用率,并且数据中心运营商将现场工作人员保持在最低限度以保持人员健康,但数据中心提供商和具有远程数据中心管理的客户工具状况良好。
远程数据中心管理可提高安全性、效率、协作和生产力,使用数据中心基础设施管理 (DCIM) 软件,一切变得前所未有的简单。DCIM 软件通过单个管理面板提供对所有数据中心资源和容量的全面可见性,数据中心的可视化效果甚至比身临其境还要好。
以下是 DCIM 软件实现远程数据中心管理的六种方式:
- 远程规划空间、电源和连接性。DCIM 提供颜色编码的平面图报告,显示机柜重量、满载百分比、预算和实际功率等实时测量值,以帮助您轻松确定部署资产的理想位置。同样,假设分析可帮助您了解数据中心添加和停用的潜在影响。借助触手可及的这些信息,您可以确定闲置空间和电力容量,并了解是否需要额外的资源来满足需求,或者您是否可以推迟资本支出。具有自动功率预算功能的 DCIM释放宝贵的机架容量,因为每个单独的服务器品牌/型号实例都被分配了一个唯一的功率预算值,该值是根据智能机架 PDU 的实时插座测量读数自动设置的 - 您的设备在您的环境中的计算压力下的确切负载。
- 指导技术人员准确地完成更改。今天有必要减少前往数据中心的实际行程次数和所需的技术人员数量,但远程指导技术人员如果没有合适的工具,去哪里和做什么可能是一个困难的过程。如果您没有关于您的数据中心资产确切位置的真实信息的单一来源,您将无法确信您正在指导技术人员到正确的位置或进行正确的更改。DCIM 具有您的数据中心的 3D 平面图可视化效果,可以比在现场更好地缩放,因为它覆盖了来自您的智能计量基础设施的实时电力和环境读数。机柜立面视图提供资产的准确 U 位置,设备视图和高保真前后图像向技术人员准确显示数据和电源端口的位置,以确保正确连接。DCIM 确保工作活动在第一时间准确完成,人为错误。
- 远程监控多个位置的电源和环境。如果没有合适的工具,使用自己的电源和冷却系统管理多个远程站点可能会很困难。DCIM 提供了一个企业仪表板,可在单个面板中显示所有数据中心的实时电源和环境健康状况以及事件,并能够向下钻取更精细的机柜级指标。热点形成、电源容量限制和冗余丢失等问题的高级警告使您能够采取措施防止停机。具有远程电源控制的 DCIM使您可以打开或关闭设备或重新启动设备,而无需现场技术人员重新启动服务器并将它们恢复到服务状态。
- 远程管理整个数据中心部署中的所有资产和连接。随着数据中心变得越来越复杂和分散,越来越多的数据中心管理人员承担着远程管理多个站点和业务应用程序的任务。在现代数据中心环境中,维护所有站点所有资产的准确清单需要一种工具,该工具可提供所有物理数据中心基础设施的实时视图。DCIM 提供商业智能和指标分析,例如按位置划分的资产数量、每个应用程序的主机数和按位置划分的资产成本,这有助于您了解哪些应用程序需要最多的资源以及您可以在哪些方面提高效率。DCIM 还可以让您轻松了解资产的物理连接方式通过视觉电路轨迹帮助您避免电路过载、减少延迟并快速排除连接故障以减少停机时间。
- 为远程工作人员提供仪表板和报告的通用视图,改善远程工作人员的协作和工作效率。 第二代 DCIM通过商业智能仪表板实现远程工作人员的数据驱动协作,这些仪表板可以根据基于角色的细粒度访问控制进行创建、编辑和安全共享。使用 100 多个开箱即用的预配置小部件以及针对每个数据中心场景的自定义报告,在您的职能团队中管理一致的 KPI。自定义标签和标签组允许您使用组织特定的术语对数据中心的设施项目进行分类,确保每个人都了解您的报告中涵盖的信息和项目。
- 确保数据中心的物理安全。DCIM 具有报告、审计日志和监控源,使您能够监控谁可以访问数据中心的不同区域、访问这些区域的频率以及电子门锁访问尝试是否成功。使用此数据通过跟踪谁有权访问您的数据中心来 减少安全威胁,并在出现安全漏洞时进行取证分析。
使用远程数据中心管理软件确保正常运行时间和可用性
鉴于最近数据中心资源的利用率激增,组织需要确保关键任务系统正在运行,这些系统有可用的电源容量,并且冗余是明确的。现在是数据中心运营商使用 DCIM 软件远程管理和监控其数据中心基础设施的最佳时机。DCIM 通过以下方式提供最长的正常运行时间和可用性:
- 数据中心健康磁贴。通过易于理解的数据中心基础设施颜色编码视图保持正常运行时间,这些视图在单个屏幕中提供整体健康状况和容量的整体情况。绿色/黄色/红色方块显示环境不同区域的电源、温度和警报信息,从顶级数据中心到各个机架。
- 健康楼层地图仪表板。实时交互式数据中心健康地图通过提供热点形成、功率容量限制和冗余丢失等问题的高级警告来增加正常运行时间,帮助您了解设备故障和维护的影响。
- ASHRAE 冷却合规图表。使用湿度冷却图表避免热点和过冷,使机柜保持在推荐的环境范围内。保持正常运行时间,确保符合制造商和行业接受的建议,并通过提高温度设定点来节省项目成本。
- 故障转移报告。通过一目了然的视图和报告来消除中断问题,这些视图和报告可以识别可用容量以及在发生故障时是否有足够的可用容量。了解哪些机柜有超过冗余阈值的危险,以及哪些机柜的可用功率容量最多和最少。
- 断路器状态改变。第一个知道断路器何时跳闸,从而缩短恢复机架 PDU 服务的时间。
- 温度传感器阈值和警报。通过阈值违规警报确保 IT 设备的安全操作环境,该警报会在坏事发生之前通知您。设置适当的机架入口阈值并收到关键和警告事件的警报。
- 开关式机架 PDU 的远程插座控制。通过与供应商无关的电源控制提高运营效率,以实现插座、IT 设备、设备组和机架的远程电源开/关。测试和其他非生产服务器可以在非高峰时段关闭以节省电力。
- 远程电子邮件警报。通过识别适合整合的服务器的电子邮件报告,充分利用当前数据中心的电力、冷却和空间,减少运营和资本支出。为了提高效率,自动创建和安排格式化报告,并通过电子邮件轻松分发。示例包括客户的能源账单报告、幽灵服务器和耗电设备以及每月峰值功率。
- 分享观点以改善 WFH 协作。打破组织孤岛并利用共享仪表板和团队视图,鼓励跨职能团队的信息共享和协作。使用最重要的数据个性化您的仪表板视图,然后与管理层、团队的其他成员以及财务或客户服务等其他部门安全地共享这些视图。
- 为您的经理自动测量温度和功率报告。通过可共享的个性化仪表板让管理人员了解数据中心。