停机时间对业务不利。在当今竞争异常激烈的商业环境中,它具有破坏性、成本高昂且无法接受。无论是定期维护还是意外中断,在工作时间无法访问您的系统都可能导致生产力损失、错失机会、数据丢失、品牌受损以及巨额服务水平协议 (SLA) 支出。不过,您可以根据停机时间是计划内的还是计划外的来减少损失。这篇文章将告诉您如何管理停机时间以及如何适应这个等式。让我们设置舞台。
什么是计划停机时间?
顾名思义,计划停机时间是指 IT 系统或生产设备受到限制或关闭以进行预先安排的维护、维修、测试或升级的预定时间。计划停机时间对于保持关键业务系统的健康和减少对不太重要的设备的过度维护至关重要。虽然计划停机会导致业务中断,但您可以控制时间、金钱、劳动力和生产力损失,因为您已经知道即将发生的停机。
什么是计划外停机?
当您的 IT 系统、设备或流程出现意外关闭或故障时,就会发生计划外停机。除了在生产计划、维护和订单交付方面造成代价高昂的延误外,计划外停机还增加了紧急维修、环境事故和人员伤害的机会。虽然计划外停机最有可能发生在维护期或停机等临时操作期间,但也可能发生在正常操作期间。
停机时间,按数字计算
除了让您高枕无忧之外,不受控制的停机时间也不会使您的企业损失数千美元的现金。多少钱?我们来分析一下统计数据:据 Gartner 称,IT 停机的平均成本为每分钟 5,600 美元。
由于业务模式各不相同,停机时间在低端可能高达每小时 140,000 美元,平均为 300,000 美元,在高端则高达每小时 540,000 美元。
例如,2019 年的 14 小时Facebook 停机,让这家社交媒体巨头损失了惊人的 9000 万美元收入。与此同时,据报道, 12 小时的 iTunes中断使苹果公司损失了高达 2500 万美元的收入。
此外,在过去七年中,停机成本增加了 32%。此外,根据IBM Ponemon Institute 的一项研究,2021 年与停机相关的数据泄露成本为 424 万美元,比 2019 年的 356 万美元增加了 10% 。
计算停机时间
如前所述,停机时间的影响因企业而异。那么,您如何知道停机时间将给您的企业造成多少损失呢?
这是计算停机时间的公式:停机成本(每小时)= 收入损失 + 生产力损失 + 恢复成本
在上面的等式中:
- 生产力损失表示受影响的员工人数乘以小时费率
- 损失的收入代表年收入或一年中的工作小时数
尽管这个等式中的变量可能会不时发生变化,但无论是计划内还是计划外,该公式都会让您对您的价格点有一个很好的了解。
无形成本
当然,并非所有与停机时间相关的成本都可以用硬通货计算。与任何重大技术事件一样,失去系统访问权会产生一些无形成本,即使它们可能没有确切的价格点,也会严重影响您的底线。
这些包括:
- 压力——人与技术
- 品牌声誉受损
- 没有动力的员工
- 安全问题
- 信心不足
- 不满意的客户
如何为计划内停机做准备
在管理计划的停机时间时,请务必事先创建灾难恢复计划(DRP)。以下是基础架构和网络计划停机时间的一些最佳实践。
计划的基础设施停机时间
第一步是确保您的基础设施备份在辅助位置。备份您的基础架构不仅对于成功的数据恢复计划至关重要,而且还可以降低业务关键数据的风险。此外,用户应该通过连接到可用的主机来访问与服务相关的元数据。只要主机或租户环境保持可用,最终用户连接就必须保持在线。
计划的网络停机时间
对于预定的网络停机时间,请确保您可以通过辅助连接访问您的系统。这可能是虚拟专用网络 (VPN) 或备用互联网。您的团队可以轻松访问经过深思熟虑的 DRP 可以提供清晰的恢复路线图,从而最大限度地减少计划停机期间的财务和声誉损失。
如何为计划外停机做准备
计划外中断无法进行初步准备,因此几乎不可能实施灾难恢复计划。尽管如此,您仍可以通过在远程数据中心或托管设施 中复制整个基础架构来利用实时灾难恢复计划,以减轻计划外停机的影响。实时 DRP 允许您在发生计划外停机时自动访问您的基础架构。
以下是您在实施有效的实时灾难恢复计划时应考虑的事项。
确定您可以允许通过的时间
利用恢复点目标 (RPO) 确定发生中断与恢复计划接管之间的持续时间。如果您的环境是超级事务性的,则实时数据恢复计划尤其重要。事实上,如果您的环境过于事务性,最好确保您的 DR 环境位于同一个都市区域内。这样,您就可以满足实时复制延迟要求。
但是,在某些情况下,实时恢复计划可能会失败。例如,当飓风或风暴等自然灾害影响数据中心或托管设施的运营时。为了减轻自然灾害的影响,您可能希望将灾难恢复站点托管在没有灾难历史的远程位置作为主要环境。但是,重要的是要记住,如果您的环境不是过度事务性的并且不一定需要实时复制,那么这种方法效果最好。
确定如何连接到 DR 环境
在为计划外停机实施 DRP 时要考虑的另一个因素是如何连接到您的 DR 站点。如果您使用的是私有广域网 (WAN),则可以考虑在 WAN 之外创建一个辅助节点以连接到您的 DR 环境。或者,您通过 Internet 协议安全 (IPsec) VPN 连接到您的 DR 环境。
或者,您可以使用域名系统 (DNS) 提供商在主环境中发生计划外停机时自动将流量分派到您的数据恢复环境。无论哪个选项适合您,请确保将其编程为在出现计划外停机时自动接管。
准备计划停机时要避免的错误
如果未能更新您的联系人列表,您可能会在为计划的停机时间做准备时犯下严重的错误。虽然您可能有一个积极的客户获取活动,但不要忘记定期更新您的供应商的记录。这样,每个人都可以收到有关计划停机时间的通知,从而让他们做好相应的准备。未能与您的提供商更新记录意味着用户在不知不觉中将面临计划外的停机时间。
准备计划外停机时要避免的错误
在为计划外停机做准备时,您最不想做的就是没有计划。大多数组织忽略了制定数据恢复计划的必要性,因为他们从未经历过中断。此外,一些企业认为复制整个环境的成本超过了计划外中断的风险。正如我们所见,计划外停机的影响可能会损害您的底线,因此您只能误判您的组织对中断的容忍度,风险自负。