“诺亚建造方舟时并没有下雨。” 霍华德·拉夫 (Howard Ruff) 在解释准备应对必须作为生活的一部分的灾难或灾难的重要性时,一语中的。为灾难做准备基本上涉及制定战略以及重新检查现有计划,此外还要测试这些计划以消除差距和漏洞。
灾难的商业影响
期待灾难发生前的警告是愚蠢的,除了少数有名称和类别的大风暴之外。自然灾害或人为灾害可能表现为电气火灾、空调机组故障、恐怖袭击、地震等。
灾难对企业的影响通常是灾难性的。这不可以只会造成收入方面的财务损失,但也可能导致生产力下降,或损害组织的声誉并失去客户信心。灾难会阻碍业务连续性,导致长期业务损失并搁置未来的扩展计划。
根据 USSBA 的数据,超过 90% 的企业在遭受灾难袭击后两年内倒闭,而根据商业和家庭安全保险协会的数据,四分之一的公司无法在重大灾难后恢复运营。
因此,必须让您的企业做好准备,以便在任何中断期间或之后以最短的停机时间恢复、恢复和继续日常运营。理想的灾难恢复计划必须增强您的组织面对意外情况的能力。
规划业务灾难恢复解决方案
企业的 DR 规划过程涉及多个步骤。灾难恢复规划过程的主要亮点如下:
- 风险识别
- 风险分类
- 确定灾难期间业务连续性的资源
- 业务恢复正常机制
风险评估和威胁识别
灾害有可能对财产和业务流程造成广泛的破坏。每个组织都必须通过考虑不同类别的流程来评估风险,包括供应链、库存、硬件故障、可访问性、网络连接、通信、安全、公用事业等。
这应该遵循根据影响业务连续性的潜力对这些业务方面进行分类。这将有助于确定优先级,同时专注于在灾难恢复期间恢复这些过程。它还将为您提供有关您的组织容忍极端环境的潜力和处理灾难时所需的最佳 IT 资源水平的估计。
风险评估对每个企业都非常重要,因为高风险业务流程的类别因不同的垂直业务而异。例如,对于医疗保健提供者而言,最重要的风险是恢复供电以确保患者的健康。
恢复期的估计
在业务受到影响之前的关键停机时间对于不同的垂直行业有很大差异。具有连续流程的在线企业或制造业无法承受哪怕一分钟的停机时间。这段时间称为组织的容忍极限。
确定组织的容忍限度非常重要,因为恢复顺序的实施取决于此。通过了解不同应用程序的公差限制,您可以优先考虑公差限制较小的应用程序。
以类似的方式,您需要评估不同应用程序集的 RPO(恢复点目标)和 RTO(恢复时间目标)的可接受水平。理想情况下,基于公有云的灾难恢复解决方案可以有效满足您对恢复时间目标的要求,因为没有单点故障。除此之外,公共云灾难恢复解决方案的恢复速度也更快,成本也更低。
加密和安全备份的意义
对于任何企业而言,其数据都被视为生命线,因此在任何情况下都应受到保护。为了确保您的企业在最艰难的事件中幸存下来,您需要备份您的数据库、电子邮件、文件和操作系统。还建议为从存储库恢复数据制定特殊的恢复程序。
这使我们认识到异地数据备份设施的重要性,这些设施不会受到袭击现场基础设施的灾难的影响。理想的备份解决方案必须提供通过安全连接进行在线数据备份的便利。
出于同样的原因;云数据备份解决方案受到现代企业的高度追捧。这些通常首选作为磁带备份的替代或补充。云数据存储和备份解决方案也更具成本效益。此外,这些数据存储选项提供更短的恢复期和更长的保留期。
制定有效的沟通计划
沟通在紧急情况下发挥着重要作用,因此您应该能够通过有效的沟通策略和具体的角色分配来支持您的 DR 计划。确保汇编关键人员联系电话的更新记录和有效协作套件的可用性,以促进即时消息传递、文档共享和在线会议。尝试建立替代通信方式,因为基本通信平台通常在灾难期间受到影响。
基于云计算的灾难恢复计划被认为是业务环境的理想选择,因为它们可以以最短的停机时间快速恢复业务可用性。这些都是高效、安全和经济的。设计和测试实用且稳健的 DR 计划非常重要。您还可以确保 DR 计划是服务级别协议的一部分。