停机时间可能是对数据中心和 IT 基础设施最具挑战性的威胁。数据中心运营商有很多责任来保护网络,但是否有可能预防所有潜在问题?
什么是计划外停机?
计划外数据中心停机是由网络错误、崩溃或设备故障引起的暂时中断。它可能会扰乱业务活动和关键任务运营,从而导致收入损失。事实上, Gartner 的 停机时间平均每分钟损失 5,600 美元是当今行业的保守估计。停机时间是破坏工作场所生产力的事件。当服务器或应用程序暂时不可用时,工作人员和 IT 专业人员需要时间来查找和诊断问题并实施修复。在某些情况下,它需要等待服务重新联机。重要的是要区分从长远来看无法实现零计划外停机。但是每个组织都应该努力尽可能地限制停机时间。
计划外停机的来源
一些最昂贵的服务中断来源包括:
电源故障
UPS 系统故障占计划外停机时间的很大一部分。在极少数情况下,当发电机由于缺乏冗余测试和预防性维护而发生故障时,就会发生停机。
人为错误
一个错字、错误配置的设置或管理员或员工忽略的协议就是出现性能错误的全部原因。所有在 IT 系统上工作的员工都应该接受一致的培训。
网络犯罪
针对网络的恶意行为,如 DDoS 攻击和恶意软件入侵,可能会削弱数字活动,甚至损害品牌在客户中的声誉。在漏洞频发的时代,备份和安全补丁是关键投资。
云服务中断
云供应商和服务提供商可能会遇到上述一些相同的问题,从而使使用软件、应用程序或数据的组织处理临时中断。
定期维护如何防止意外停机?
由于 UPS 系统问题是计划外停机的最常见原因,因此为您的主电源和备用电源制定定期维护计划是关键。应仔细检查电池并监测环境中是否存在导致降解的过多灰尘和热量。自动安全管理可以通过自动实施补丁和先发制人地检测攻击来降低网络犯罪的风险。虽然极端天气事件是不可预测的,但可以通过灾难恢复和应急计划来减少其影响,例如使用维护良好的柴油发电机。