什么是灾难恢复?灾难恢复是组织在发生自然灾害、网络攻击甚至与 COVID-19 大流行相关的业务中断等事件后重新获得对其 IT 基础架构的访问权限和功能的方法。多种灾难恢复 (DR) 方法可以成为灾难恢复计划的一部分。DR 是业务连续性的一个方面。
灾难恢复如何工作?
灾难恢复依赖于在不受灾难影响的外部位置复制数据和计算机处理。当服务器因自然灾害、设备故障或网络攻击而停机时,企业需要从备份数据的第二个位置恢复丢失的数据。理想情况下,组织也可以将其计算机处理转移到该远程位置,以便继续运营。
有效灾难恢复计划的 5 大要素
- 灾难恢复团队:这个指定的专家组将负责创建、实施和管理灾难恢复计划。该计划应定义每个团队成员的角色和职责。在发生灾难时,恢复团队应该知道如何与彼此、员工、供应商和客户进行沟通。
- 风险评估:评估使您的组织面临风险的潜在危害。根据事件的类型,制定恢复业务所需的措施和资源的战略。例如,如果发生网络攻击,恢复团队将采取哪些数据保护措施来应对?
- 业务关键资产识别:良好的灾难恢复计划包括记录哪些系统、应用程序、数据和其他资源对业务连续性最为关键,以及恢复数据的必要步骤。
- 备份:确定需要备份(或重新定位)的内容、应该执行备份的人员以及如何实施备份。包括说明备份频率的恢复点目标 (RPO) 和定义灾难后允许的最大停机时间的恢复时间目标 (RTO)。这些指标限制了指导选择构成组织灾难恢复计划的 IT 战略、流程和程序。组织可以处理的停机时间以及组织备份其数据的频率将为灾难恢复策略提供信息。
- 测试和优化:恢复团队应不断测试和更新其策略,以应对不断变化的威胁和业务需求。通过不断确保公司准备好面对灾难情况下的最坏情况,它可以成功应对这些挑战。例如,在规划如何应对网络攻击时,组织必须不断测试和优化其安全和数据保护策略,并采取保护措施来检测潜在的安全漏洞,这一点很重要。
如何组建灾备团队?
无论是从头开始制定灾难恢复策略还是改进现有计划,组建合适的专家协作团队都是关键的第一步。首先是利用 IT 专家和其他关键人员在发生灾难时在以下关键领域提供领导:
- 危机管理:该领导角色启动恢复计划,协调整个恢复过程中的工作,并解决出现的问题或延误。
- 业务连续性:监督此工作的专家根据业务影响分析确保恢复计划符合公司的业务需求。
- 影响评估和恢复:负责这一恢复领域的团队在 IT 基础设施(包括服务器、存储、数据库和网络)方面拥有技术专长。
- IT 应用程序:此角色监控应根据恢复计划实施哪些应用程序活动。任务包括应用程序集成、应用程序设置和配置以及数据一致性。
虽然不一定是 IT 部门的一部分,但以下角色也应分配给任何灾难恢复计划:
- 执行管理:执行团队需要批准与灾难恢复计划相关的战略、政策和预算,并在出现障碍时提供意见。
- 关键业务部门:理想情况下,每个业务部门的代表将提供有关灾难恢复计划的反馈,以便解决他们的具体问题。
灾难恢复的类型有哪些?
企业可以从多种灾难恢复方法中进行选择,或者将几种方法结合起来:
- 备份:这是最简单的灾难恢复类型,需要将数据存储在异地或可移动驱动器上。但是,仅备份数据只能提供最小的业务连续性帮助,因为 IT 基础架构本身没有备份。
- 冷站点:在这种类型的灾难恢复中,组织在第二个很少使用的设施中建立基本基础设施,为自然灾害或火灾后的员工提供工作场所。它可以帮助业务连续性,因为业务可以继续运行,但它不提供保护或恢复重要数据的方法,因此必须将冷站点与其他灾难恢复方法相结合。
- 热站点:热站点始终维护最新的数据副本。热站点的设置很耗时,并且比冷站点更昂贵,但它们大大减少了停机时间。
- 灾难恢复即服务(DRaaS):在发生灾难或勒索软件攻击时,DRaaS 提供商会将组织的计算机处理转移到其自己的云基础架构中,从而允许企业从供应商的位置无缝地继续运营,即使组织的服务器下来了。DRaaS 计划可通过订阅或按使用付费模式获得。选择本地 DRaaS 提供商有利也有弊:转移到离组织位置较近的 DRaaS 服务器后延迟会更低,但如果发生广泛的自然灾害,附近的 DRaaS 可能会受到同样的影响灾难。
- 备份即服务:类似于在远程位置备份数据,通过备份即服务,第三方提供商备份组织的数据,但不备份其 IT 基础设施。
- 数据中心灾难恢复:数据中心的物理元素可以保护数据并有助于在某些类型的灾难中更快地进行灾难恢复。例如,灭火工具将帮助数据和计算机设备在火灾中幸存下来。备用电源将帮助企业在停电的情况下航行,而不会停止运营。当然,这些物理灾难恢复工具都不会在发生网络攻击时提供帮助。
- 虚拟化:组织可以在不受物理灾难影响的异地虚拟机上备份某些操作和数据,甚至是组织整个计算环境的工作副本。使用虚拟化作为灾难恢复计划的一部分还可以让企业自动化一些灾难恢复过程,让一切更快地恢复在线。要使虚拟化成为一种有效的灾难恢复工具,数据和工作负载的频繁传输是必不可少的,IT 团队内部就一个组织内有多少虚拟机正在运行的良好沟通也是如此。
- 时间点副本:时间点副本,也称为时间点快照,在给定时间制作整个数据库的副本。可以从此备份恢复数据,但前提是副本存储在异地或不受灾难影响的虚拟机上。
- 即时恢复:即时恢复类似于时间点副本,只是即时恢复不是复制数据库,而是拍摄整个虚拟机的快照。
如何规划 COVID-19 灾难恢复和业务连续性
COVID-19 和由此引发的全球危机促使许多公司支持远程工作的员工,并迫使组织重新考虑其灾难恢复和业务连续性战略。随着大流行的发生,即使只是网络中断也会对业务产生重大影响。
这里有几点需要考虑:
- 将传染病的风险和潜在后果添加到您的灾难恢复计划中。尽管在全球范围内很少见,但为此类紧急情况制定具体计划将有助于确保尽可能顺利地处理它们。
- 为人制定计划,而不仅仅是技术。COVID-19 的结果表明,要让企业保持成功,员工需要支持、沟通和资源。计划您能够提供这些元素的方式,即使员工在家工作并且可能对其正常设备、网络或通信渠道的访问权限可能不同或有限。
- 考虑使用其他云和软件即服务 (SaaS) 解决方案,为远程工作提供更高效、更灵活的选择,并减少对一个中央数据中心或主要总部的依赖。确保您的计划包括 IT 冗余——多个站点中的多个系统,这样如果一个系统受到损害,业务仍然可以正常运行。
灾难恢复软件有什么好处?
任何组织都不能忽视灾难恢复。制定灾难计划(包括有效的灾难恢复软件)的两个最重要的好处是:
- 节省成本:为潜在的破坏性事件做计划可以为企业节省数十万美元,甚至意味着公司在自然灾害中幸存或倒闭之间的差异。
- 更快的恢复:根据灾难恢复策略和使用的灾难恢复工具的类型,企业可以在灾难后更快地启动和运行,甚至可以像什么都没发生一样继续运营。