如何量化和限定云迁移的好处
企业业务的未来取决于云已成定局。考虑到云迁移在过去几年中在企业领域发挥的巨大作用,这一点尤其正确:
自 2009 年以来,云计算支出的增长率是 IT 支出的 4.5 倍,预计到 2020 年将增长 6 倍以上。
福布斯云计算综述
甲骨文的最新数据支持这一点,其对 2019 年的第二个预测是,80% 的企业工作负载——包括那些被视为“关键任务”的工作负载——将在未来 12 个月内迁移到云中。
尽管云在整个企业中几乎无处不在(并且 IT 专家和外行人越来越熟悉云技术),但将工作流迁移到云中并非易事。在管理预期和实际交付改进(无论是与成本还是性能相关)方面,迁移完成时尤其如此。
为确保团队不会做出无法兑现的承诺,他们需要在云迁移的每个阶段都保持可见性。毕竟,“你无法管理你无法衡量的东西, ”古老的口头禅是这样的,因此 IT 团队必须在迁移的每个阶段都具有可见性,以便设定准确的预期并在问题使整个企业脱轨之前保持领先。
定义可接受的绩效目标
首先,团队需要充分了解哪些应用程序、网络基础设施或流程最常发生故障。 IT 可能需要进行跨职能面试,以获取信息并获得整个组织的认可。
当 IT 考虑一般性时,为云迁移提供理由可能很容易。当然,卸载网络硬件的维护工作对于注重预算的决策者来说看起来很有吸引力,但在企业获得这些节省之前需要多少前期投资?
仅凭成本可能也不足以吸引所有决策者。如果云迁移提高了几个被认为是关键业务的应用程序的性能,是否会以其他地方使用的工具为代价?在整个迁移过程中,应用程序性能会受到影响吗?持续多长时间?是否需要对用户进行新的培训?
团队需要在将迁移建议提交给执行团队之前掌握所有这些问题。这将要求 IT 认真反思网络的当前状态,以创建现有性能的基准。这样,团队可以确认或告知决策者关于最需要改进的地方的意见,并将解决方案置于云环境中。
迁移前的基线性能
最终用户体验是这个基线的开始。毕竟,如果员工的最终用户体验在云迁移后没有得到改善——或者实际上明显更糟——那么 IT 就不会成功。即使只关注底线的决策者也会同意,因为糟糕的用户体验会对更大企业的绩效产生多米诺骨牌效应。因此,在任何架构被连根拔起之前,IT 需要将网络的“当前状态”(以及用户满意度)归零。
对于应用程序,这需要综合 Web 测试,让 IT 部门能够了解用户在其工作地点的实际体验,以及对整个交付路径的清晰可见性。有了这些信息,IT 就可以建立他们在和之后需要满足的“验收标准” 云迁移,以确保用户保持满意。一些示例条件可能如下所示:
- 响应时间应在迁移前水平的 5% 以内
- 服务错误率应等于或低于迁移前的水平
- 应用程序可用性应等于或低于迁移前的水平
- 在迁移过程中,基础设施成本应至少降低 X%
因此,团队需要了解当前向用户交付应用的速度、服务器(内部和外部、DNS 等)之间的延迟、错误率、错误类型和浏览器特定的性能问题。只有拥有所有这些数据,IT 部门才能了解网络迁移前的状态。
在整个迁移过程中继续监控
一旦团队制定了基线,重要的是他们在整个迁移过程中继续监控他们的验收标准。团队应该能够创建仪表板和警报,在网络不符合标准时进行标记,理想情况下使用相同的指标,如果不是监控解决方案,他们参考基准性能。
- 正常运行时间 - 对于云应用程序,IT 应该期望在任何给定的一周内将停机时间限制在几分钟内。大多数公共应用都力求达到 99.9% 或更高(每个工作日约 7 分钟)。
- DNS - 对于现在在云中的应用程序,IT 可能会有一个本地 DNS 服务器或公共 DNS 服务提供 IP 地址。这是应该受到积极监控的事情,因为它会阻止给定位置的所有用户连接。
- 延迟、RTT - 现在服务位于数据中心或办公室之外,流量从客户端传输到服务器所需的时间可能会有显着差异。此处的峰值可能与 LAN、ISP 或应用问题有关。
- 容量 - 向 ISP 支付带宽费用是一回事,但用户位置和应用服务器之间网络的端到端容量可能会有不同的瓶颈。此测量允许 IT 识别拥塞何时影响连接速度。
峰值和跳跃是迁移相关错误的有用指标,需要立即解决——甚至在新业务请求之前——以在问题扩散之前阻止问题。通过解决问题,IT 的眼睛直接关注问题,团队更有可能实施最合适的解决方案。
利用监控确定成功
一旦新的网络架构到位,团队在迁移之前进行的基线需要重新进行比较。这里的关键是使用在旧网络上测试过的相同流程(使用情况、模式、时间等)。
对于所有云迁移,都会失去一定程度的控制。无论是在裸机、操作系统还是访问级别,团队使用现代监控解决方案也很重要,这些解决方案可以为新的云支持网络提供相同级别的可见性。如果基础设施不再由 IT 拥有,那么旧监控工具的可见性水平将受到影响。这一点至关重要,因为许多监控解决方案无法提供对云环境甚至 IT 防火墙之外的可见性。
如果没有防火墙之外的洞察力,IT 就很难识别源自 ISP 或第 3 方基础设施的问题并快速解决它们。这既会在迁移过程中延迟迁移,也会让 IT 之外的用户在性能持续受到阻碍的情况下怀念云之前的日子。
云计算