过去,档案被严格地认为是不经常访问的数据的长期存储库——想想冷存储——因此没有太多考虑智能地管理这些数据。希望您的档案就像您永远不需要使用的保险单。
随着云的出现及其利用率的提高,组织已经开始发现,除了通过利用云经济实现巨大的成本节约之外,存档数据本身还具有内在价值。为了充分利用这一价值,归档数据必须有组织、可访问、可检索和智能保留。简而言之,一个“活动”档案。
非结构化数据,例如办公文档、视频、音频文件、图像、.pdf 以及任何不在数据库中的数据,现在已成为大多数组织的命脉。长期智能地存储这些数据不仅对于合规性和组织历史至关重要,而且对于商业智能、分析、数据挖掘和其他目的也越来越重要。
随着整体数据年复一年地以惊人的速度持续增长,非结构化数据以 60% 或更高的速度增长(预计在短短几年内攀升至所有数据的 90% 或更多),对使用公共云、私有云或混合云的任意组合以及随时移动数据的轻松能力的主动归档的需求一直存在。为了在多云基础架构中最好地管理这些数据,组织需要遵守以下主动归档的基本租户:
应该组织数据
非结构化数据往往是混乱的——一个典型的组织可以拥有数百万个不一定以任何特定方式组织的文件。有些可能存储在私有云上,有些可能存储在公共云上。为了理解这一点,能够根据内部和外部重要的类别对数据进行分类和标记是很有帮助的。将“机密”或“合法”视为在审计或 PII 和类似的合规性事件中检索数据的能力的有用标志。但更重要的是,所有销售数据、所有财务数据等都可以分类,以便快速轻松地检索以备将来使用。
数据应该是可访问的
您需要能够将数据存储在您想要的位置,并轻松获取。这可能意味着在私有云、公共云甚至跨云中进行本地部署。我们开始看到云供应商之间的竞争越来越激烈,能够利用不断变化的云经济是非常有价值的。应该支持本地和真正的多云,能够随意跨云目的地动态迁移数据,并且不需要管理员记住数据的位置。
数据应该是可检索的
与分类和标记相辅相成的是全内容搜索。想象一下,能够使用单词、短语或其元数据快速轻松地搜索 PB 级数据和数百万(或数十亿)个文件,从而在大海捞针中找到您正在寻找的那根针,而不必知道在哪里或保存文件时(想想谷歌搜索)。这将实际上不可用的数据的黑洞打开到可用的存储库中。能够在云存储库中定位存档数据并轻松对其进行重新水化,使其成为活动数据集的一部分,从而充分利用了该信息的价值。
数据应该被智能保留
如果您询问 IT 管理员的听众,他们在数据保留方面的公司政策是什么,他们中的绝大多数人会告诉您,他们会永远保留所有内容。数据治理是一个巨大的话题,我们无法进入这篇文章,但可以说最佳实践并不是永远保留所有内容,而是智能地修剪不再需要的数据,因为法律、空间、成本,等原因。尤其是生活在多云环境中的存档,可以帮助管理员设置策略,以智能修剪不再需要保留的数据,从而释放空间并降低存储成本,避免不必要的和不需要的容量费用。