自动化是多云基础设施监控的关键
确保基础设施平稳运行对于维护服务和客户满意度至关重要。
Dynatrace 的英国和 I 区域副总裁 Greg Adams 讨论了自动机在多云基础设施监控中可以发挥的关键作用
为了跟上数字化转型的步伐,各行各业的组织越来越多地转向多云架构,以获得保持领先所需的敏捷性和可扩展性。 IDC 预测,随着这一趋势的继续,到 2025 年,全球在云服务上的总支出将超过 1.3 万亿美元。
然而,随着技术环境跨越更多平台,添加的每个云都使管理基础设施的任务更加复杂。反过来,这为过度紧张的 IT 运营 (ITOps) 团队创造了更多的工作,从而阻止他们专注于创新。事实上,我们的研究发现,ITOps 团队将将近一半 (42%) 的时间花在手动的日常工作上,“只是为了让整个基础设施保持正常运转”。
这些团队显然需要一种更可持续的方法来管理他们的基础架构——一种可以提高多云环境中的可观察性并自动执行手动任务的方法,以便他们有更多时间专注于推动创新并为他们的组织创造价值。
多云偏头痛
如果他们不能有效地管理基础设施性能,ITOps 团队将很难提供当今客户和用户所需的无缝数字体验。至关重要的是,他们在多云环境中具有清晰的端到端可观察性。不幸的是,这种洞察力变得更加难以捉摸,随着团队努力跟上他们的基础架构,盲点正在悄悄出现。
多云环境本质上是复杂的,并且难以使用许多现有的基础设施监控方法进行管理。这背后有几个因素。
首先,每个云平台都有自己的原生监控工具,例如 Amazon CloudWatch 或 Azure Monitor。因此,ITOps 团队逐渐发现自己拥有越来越多的工具,他们需要在传统监控解决方案之上进行分层,以跟踪跨基础设施的活动。我们的研究表明,平均而言,组织依靠七种不同的监控解决方案来管理他们的多云环境。这迫使团队花费更多时间手动拼凑来自各种仪表板的见解,以在用户旅程穿越多个云时识别其数字服务中的问题。
Kubernetes 难题
使可观察性更加难以捉摸的另一个因素是多云环境中的变化频率。虽然 Kubernetes 等平台使组织能够快速扩展其多云基础架构以满足需求,但不断的变化使团队难以有效地监控和管理性能。 Kubernetes 环境也会产生大量数据,ITOps 团队无法通过手动筛选来了解多云基础设施对用户体验的影响。
进一步增加复杂性,在他们努力缓解“工具蔓延”的过程中,团队通常采用自己动手 (DIY) 方法进行基础设施监控,使用开源可观察性解决方案将多个工具拼接在一起。这会浪费人工并且难以维护,从而阻碍数字化转型,因为团队没有多少时间专注于更具战略性的工作。
自动化课程提前
为了克服这些挑战,组织需要为 IT 团队提供一种新的基础设施监控方法,利用 AIOps(用于 IT 运营的人工智能)来自动化尽可能多的手动任务。随着环境的变化,这通过不断发现和检测多云基础架构来消除盲点。因此,团队可以保持端到端的可观察性,而无需在手动监控过程中投入时间和精力。
AIOps 还有助于自动分类警报和查询可观察性数据,以显示团队为向用户和客户提供无缝数字体验所需的准确见解。通过这种方法,AIOps 可以让团队了解跨多云基础架构的任何问题的原因,并根据业务影响确定问题的优先级。这意味着团队可以首先解决最关键的问题,然后将精力集中在加速组织数字化转型的任务上。但是,这只有在团队可以将可观察性数据整合到一个地方时才有可能。整合视图创建单一事实来源,提供驱动有效自动化所需的完整上下文。
更多时间进行创新
随着组织继续向多云环境过渡,确保基础设施平稳运行对于创建无缝数字服务和提高客户满意度变得越来越重要。实施以 AI 和自动化为中心的基础设施监控策略可减轻 ITOps 团队的手动任务负担。反过来,团队可以专注于加速转型并为业务带来更好的成果。
自动化控制系统