如何(以及为什么)对公有云性能进行基准测试
早在 2011 年,每家公司在云计算上的平均花费仅为 6,300 美元。除了最小的 IT 预算外,这对所有的人来说都是杯水车薪。在此期间,情况发生了变化。在本世纪初,公司才刚刚开始涉足云计算。现在他们完全被淹没了。在员工超过 1,000 人的公司中,26% 的公司表示他们每年在云上的支出超过 600 万美元,71% 的企业计划将支出增加 20% 以上。
鉴于如此多的公司在云服务上花费了如此多的钱,让他们知道自己的钱是否物有所值对他们来说很重要。这给我们带来了一个重要的问题。大多数云服务提供商会在他们的 SLA 中提供一定的质量标准,提供如下条款:
- 保证可用性 - 例如,99.999% 的正常运行时间
- 响应速度保证防止应用程序变慢
- 对解决事件所需的时间有一定的期望
根据您选择的提供商,您可能会为这些保证支付相当多的额外费用——但您怎么知道您的提供商是否支持它们?意识到您的云服务经常宕机是一回事。区分 99.999% 和 99.997% 的正常运行时间是另一回事。因此,对于云客户来说,对他们的公共云进行基准测试以确定他们是否在稳定性和服务方面获得了他们所支付的费用,这一点很重要。方法如下:
云基准测试工具和方法
在对公共云进行基准测试时,需要衡量三个重要方面:计算、存储和网络。当然,网络缺陷会对公共云造成最明显的灾难性影响,但您还应该测量存储的 IOPS 和延迟、计算的磁盘 IO 等。在您的网络中,您应该衡量可用性、吞吐量和延迟。
对正常运行时间等事物进行基准测试比您想象的要简单:
- AWS 和 Azure 都提供可以监控正常运行时间的内置工具。
- 如果您不信任它们,或者使用其他服务,则可以使用许多第三方工具。例如,Gartner 提供了一项名为 CloudHarmony 的服务。
- 在主机和云之间运行 iPerf 等工具,以监控基本带宽和延迟。
- Geekbench 等工具可以监控 CPU 和数据库性能等方面。
让云提供商承担责任很重要。我们并不是说云提供商不值得信赖,但他们提供的一些数字可能会令人困惑。例如,去年 CloudHarmony 的一项行业调查指出,在三大云提供商中,谷歌的可用性最高。然而,微软反驳了这些说法,称其更多的区域意味着区域平均值会显示更好的性能。
换句话说,确保您在云中获得最佳性价比的最佳方法是信任但要验证。
使用 AppNeta 监控云性能指标
当然,几乎没有 SLAS 包含的一项基本衡量指标是云的执行情况。许多传统监控工具也看不到这些指标。当您只能使用一种监控工具时,为什么要安装和运行多达四种不同的监控工具(可能还有更多)? AppNeta 代表了一个详细的监控平台,可以监控公共云实施的各个方面。这包括正常运行时间和停机时间等指标,以及应用程序减速、延迟、抖动等。在与云供应商谈判时,准确、即时的监控能力意义重大。例如,如果您能证明您的 AWS 实施的正常运行时间低于 99.9%,您将有权获得高达 25% 的服务积分——在云部署成本高昂的时代,这是不容小觑的。有关监控云提供商网络的更多信息,请查看我们的云可见性指南。
云计算