华尔街的秘密可以让云计算更高效
- 新的数学模型可评估全球数据中心之间链路的故障概率。
- 它从金融风险理论中汲取灵感。
- 它可以帮助云服务提供商更好地利用其数据中心资源并节省数百万美元。
为了满足对云存储和云计算不断增长的需求,公司花费数百万美元来增加其 WAN 主干网的容量。
主要挑战之一是在网络可用性和利用率之间保持良好的平衡。高利用率的通道可能无法应对突发的流量激增,从而导致节点/链路故障。
为了解决这个问题,麻省理工学院、微软和希伯来大学的一个研究团队从金融风险理论中汲取灵感,开发了一种新的数学模型,帮助股市投资者在市场波动中最大限度地提高收益,同时最大限度地减少财务损失。
新模型称为 TeaVar(Traffic Engineering Applying Value at Risk 的缩写)。它评估全球数据中心之间链路的故障概率。评估过程类似于预测股票的波动性。
然后,该模型以最佳方式分配流量(通过不同的链接),以最大限度地提高整体网络使用率,同时最大限度地减少损失。这与传统的保持链路空闲以应对突发流量激增的方法完全相反,浪费了过多的能源和资源。
研究人员声称他们的模型可以帮助云服务提供商更好地利用他们的数据中心资源并节省数百万美元。
“TeaVar”如何工作?
提供云服务的主要公司使用“流量工程”(TE) 工具来优化分配所有路径的数据带宽。为了保证最大的可用性,这些公司将几个链接保持在低利用率。许多网络链接的利用率并不高:它们发送的流量没有达到它们所能发送的那么多。
因此,在网络利用率和网络可用性之间存在折衷。这是传统 TE 技术失败的地方。
参考:麻省理工学院 | GitHub
在任何网络中,数据带宽块类似于投资于市场的“金钱”,具有不同失败概率的工具类似于“股票”及其不确定的价值。利用这一概念,研究团队开发了一种“风险感知”方法,可确保数据在最坏的故障情况下以最小的流量损失到达目的地。
他们的方法使公司能够实现最适合其目标的利用率-可用性平衡。 TeaVar 解决了与风险最小化的易处理性相关的算法挑战,以及操作挑战。
将 TeaVar 应用于真实世界数据
他们针对通过 ATT、IBM、Google 网络传输的模拟流量,针对传统 TE 工具测试了该模型。他们还根据发生的概率产生了几种故障条件。
阅读:微软已经构建了一个完全自动化的 DNA 数据存储
最后,他们将 TeaVar 应用于现实世界的数据,发现在相同的可用性级别下,它可以支持高达传统 TE 方法两倍的流量。该模型能够使可靠的链路保持几乎满负荷运行,同时引导数据避开风险更高的路径。
工业技术