亚马逊网络服务的一次重大中断已经导致大部分互联网离线,另一次中断导致 Skype、Office 365 和 OneDrive 等微软服务宕机 16 多个小时,还有世界上最大的 DDoS 攻击迫在眉睫的威胁。
在本文中,我们将对网络托管行业进行一反常态的批判性研究。大多数房东不愿意深入了解这些细节,但重要的是我们要对自己作为一个行业保持诚实,这样我们才能推进并提供更好的产品和服务。因此,让我们从一个相当不舒服的指标开始深入研究它:
没有显着改善
您可能不知道这一点,但大多数中断不在服务器级别。他们处于数据中心级别。即使是承诺提高可靠性的云托管仍然会遭受数据中心级别的中断。事实上,云主机通常从单个数据中心提供服务,导致与任何其他服务器类型相同的常见中断。
现在我知道你在想什么:难道没有备份系统可以防止数据中心级别的中断吗?是的,但他们经常自己失败!这是由于一个简单的事实:年龄。美国数据中心的平均年龄为 9 年,但 Gartner 建议任何超过 7 年的数据中心都可能已经过时。这是因为 UPS、开关和发电机可能发生故障,导致整个数据中心停机。
那么,如果数据中心每 5 年进行一次全面翻新,将所有系统升级到最新、最可靠的选项,那会怎样呢?好吧,数据中心仍然不能完全安全地避免数据中心级别的中断。您可能还记得今年早些时候 AWS 发生了一次重大中断,这不是由硬件引起的。是一名员工写错了一个简单的命令。
一个人为错误导致许多互联网上最大的网站宕机。亚马逊也不孤单。由人为错误引起的中断时有发生。可能就像被电源线绊倒一样简单!
我们如何加强并防止这些中断?
答案很简单:多个数据中心。我们最近宣布了一种新产品,地理冗余云托管,我们相信它是网络托管的下一件大事。我们称其为灾难避免,因为它可以防止:
· 路由器故障
· 开关故障
· ISP中断
· 停电
· 服务器硬件故障
· 安全攻击(DDOS)
· 失败的软件或固件升级
· 自然灾害
· 人为错误
· 还有更多
它的工作原理是允许关键任务服务的数据中心(包括应用程序、数据库和网站)到多个远程数据中心之间进行自动故障转移。最终结果?零可检测停机时间。