任何大型企业 IT 环境的运营成功都始于网络运营中心,也始于网络运营中心。尽管如此,NOC 经常充斥着效率低下和混乱的局面。
就其性质而言,NOC 是一个混乱的地方。这是一个由人员、流程和工具组成的相互交织和相互依存的管弦乐队:纯平显示器(有时 15 或更深)、实时闪存可操作通知和严重警报。所有这些数据都通过一系列非集成工具以各种神秘的方式呈现。已经过度劳累的 NOC 人员努力让他们的眼睛集中在这些令人眼花缭乱的内容上,以期在发生中断和异常时发现它们。同时,他们还必须管理大量信息和相关数据流进入他们的收件箱和 SMS 提要。很少有对这种入站数据海啸的任何智能过滤或聚合。行业研究表明,这种洪水的很大一部分是错误的、无关的和不必要的。
在大多数情况下,必须严格遵守事件管理的脚本化协议,因为有问题的问题会被排除在外并被隔离以进行补救。服务水平协议 (SLA) 依赖于这种严格的方法。在上述混乱中,用户、客户和合作伙伴社区依赖于整个环境的高效和安全运行。达到 SLA 要求修复必须尽可能接近即时透明地完成。
尽管有这些看似无法克服的挑战,但成功是可以实现的。在审查 NOC 的效率时,请考虑以下几点:
- 完全集成或整合的工具套件,由单个制造商进行优化设计,或至少通过 API 集成到车轮中的其他“齿轮”。这种集成将最大限度地减少光学接触点,消除产品之间的相互指责,并确保与收集的数据保持一致的界面。
- 评估能够智能过滤、排序和聚合大量数据的技术。目标是分离出您需要引起注意的元素。例如根本原因分析、事件关联和自动异常检测等技术。但是,这些技术必须避免在故障排除过程中需要更多时间来实施的陷阱。这些技术必须是全自动的。
- 寻找能够将企业范围内的可见性汇总为有限视觉呈现的动态产品。您以后可以随时深入杂草(当您选择这样做时,它也应该是智能的)。
- 通过让他们成为新的集成工具集的主题专家来扩展您的 NOC 人员。通过提取他们收到的内容,从根本上提高他们的个人效率统计数据。消除噪音。
- 在可行的情况下,以电子方式在 NOC 结构中嵌入流程信息。当然,硬拷贝备份文档是可以的,但是如果您能够智能地自动嵌入所需的信息,例如工作流、程序和 NOC wiki,以便随时随地访问,危机场景变得更易于管理。
混乱的 NOC 环境不一定是现状。有个更好的方法。根据我们的经验,我们已经看到,通过正确组合工具、流程和人员,它们可以成为运转良好的机器。