恢复时间目标和恢复点目标听起来很相似,但它们在灾难恢复和业务连续性管理中是完全不同的指标。了解如何在需要之前使用适当的资源进行相应的计划。就像拥有保险一样,您可能永远不会使用它——或者它可能会拯救您的公司。在本文中,我们将研究 RPO 和 RTO 之间的关键区别并消除任何混淆!
RTO:恢复时间目标
RTO 决定了您的基础设施在灾难发生后需要多快恢复在线。有时,我们使用 RTO 来定义公司可以处理和维持业务连续性的最长停机时间。这通常是灾难后恢复服务的目标时间。例如,2 小时的恢复时间目标旨在在收到服务中断通知的两小时内备份并运行所有内容。
有时,这样的 RTO 是无法实现的。飓风或洪水会导致企业倒闭,长达数周之久。但是,一些组织对中断的恢复能力更强。例如,一家小型管道公司可以处理一周或更长时间的文书工作订单和发票。依赖订阅的基于 Web 的应用程序的企业可能会在几个小时后瘫痪。
对于外包 IT 服务,RTO 是在 服务水平协议 (SLA) 中定义的。IT 和其他服务提供商通常在其 SLA 中包含以下支持条款:
- 可用性: 您可以致电寻求支持的时间。
- 响应时间: 他们在收到支持请求后与您联系的速度。
- 解决时间: 他们恢复服务的速度。
根据您的业务需求,您可能需要更好的 RTO。有了它,成本也会增加。无论您选择哪种 RTO,它都应该对您的组织具有成本效益。企业可以在内部处理 RTO。如果您有内部 IT 部门,则应该有解决技术问题的目标。实现 RTO 的能力取决于灾难的严重程度。服务器崩溃可以达到一小时的目标。但是,如果该地区发生自然灾害,期望一个小时的解决方案可能并不现实。RTO 不仅包括从灾难中恢复所需的时间。它还应该包括减轻不同灾难或从不同灾难中恢复的步骤。该计划需要包含对措施的适当测试
RPO:恢复点目标
RPO 衡量 服务中断后可接受的数据丢失量。例如,销售损失可能会在 18 小时后成为成本的过度负担。该阈值可能会使公司低于任何销售目标。
数据的备份和镜像副本是 RPO 解决方案的重要组成部分。有必要知道有多少数据是可接受的损失。一些企业通过计算存储成本与恢复成本来解决这个问题。这有助于确定创建备份的频率。其他企业使用云存储来创建其数据的实时克隆。在这种情况下,故障转移会在几秒钟内发生。
与 RTO 和可接受的停机时间类似,一些企业对数据的丢失容忍度更高。为小型管道公司检索 18 小时的记录是可能的,但可能不会损害业务运营。相比之下,在线计费公司可能会在几分钟的数据丢失后发现自己陷入困境。
RPO按时间和技术分类:
- 8-24 小时: 这些目标依赖于生产环境的外部存储数据备份。最后一个可用备份用作还原点。
- 最多 4 小时: 这些目标需要生产环境的持续快照。在灾难中,恢复数据的速度更快,对您的业务造成的干扰更少。
- 接近于零: 这些目标使用企业云备份和存储解决方案来镜像或复制数据。通常,这些服务会在多个地理位置复制数据以实现最大冗余。故障转移和故障恢复是无缝的。
RTO 和 RPO 都涉及测量的时间段。然而,虽然 RTO 专注于使硬件和软件联机,但 RPO 专注于可接受的数据丢失。
风险计算
RTO 和 RPO 都是风险计算。RTO 是对企业可以维持服务中断多长时间的计算。RPO 是对数据在恢复时的最新程度的计算。
计算 RTO
我们基于预测和 风险管理来计算 RTO 。与很少使用的应用程序一样,频繁使用的应用程序可能对业务连续性至关重要。因此,应用程序的重要性不必与使用频率相同。您需要确定哪些服务可以在多长时间内不可用,以及它们是否对您的业务至关重要。
要计算 RTO,请考虑以下因素:
- 每小时停电成本
- 单个系统的重要性和优先级
- 减轻灾难或从灾难中恢复所需的步骤(包括单个组件或流程)
- 回收解决方案的成本/收益方程
计算 RPO
计算 RPO 也是基于风险。在灾难中,一定程度的数据丢失可能迫在眉睫。RPO 成为 数据丢失对业务的影响和缓解成本之间的平衡行为。一些愤怒的客户,因为他们的订单丢失了,可能是可以接受的损失。相比之下,数百笔交易丢失可能对企业造成巨大打击。
在确定您的 RPO 时,请考虑以下因素:
- 您的组织可以承受的最大可容忍数据丢失量。
- 丢失数据和操作的成本
- 实施恢复解决方案的成本
RPO 是备份之间可接受的最大时间。如果每 6 小时执行一次数据备份,并且在备份后 1 小时发生灾难,则您只会丢失一小时的数据。这意味着您比预计的 RPO 少了 5 个小时。
灾难恢复计划
灾难有多种形式。例如自然灾害、飓风、洪水或野火。灾难还可以指资产或基础设施(如电力线、桥梁或服务器)的灾难性故障。灾难包括所有 类型的网络安全攻击 ,这些攻击会破坏您的数据、破坏信用卡信息,甚至禁用整个站点。灾难的定义如此之多,根据它们的共同点来定义它们是有帮助的。对于组织和 IT 部门而言, 灾难是破坏正常业务运营的事件。
应对灾害始于计划和预防。 许多企业在不同的地理区域使用云解决方案来最大程度地降低停机风险。有些安装冗余硬件以保持 IT 基础架构运行。数据恢复的一个关键步骤是制定灾难恢复计划。
考虑不同类型灾难的概率。各种灾害可能需要不同的应对计划。例如,在太平洋西北部,飓风很少发生,但可能会发生地震。在佛罗里达州,情况正好相反。与小型企业相比,网络攻击可能对拥有广泛在线业务的大型企业构成更大的威胁。DDoS 攻击可能需要与数据泄露不同的响应。
与 临时解决方案相比,灾难恢复计划 有助于更快地使系统和流程联机。当每个人都扮演特定的角色时,恢复策略可以迅速进行。灾难恢复计划还有助于在您需要资源之前将资源到位。因此,响应计划改进了恢复时间和恢复点目标。
RTO 和 RPO 之间的区别很关键
虽然密切相关,但必须了解恢复时间目标和恢复点目标之间的区别。RTO 是指使系统重新联机所需的时间。RPO 是可接受的停机数据丢失的业务计算。立即改进这些指标并采用灾难恢复计划。