如何优化云计算的优势以加快可靠性验证
在当今快速发展的工业和消费产品中,集成电路 (IC) 设计公司知道,按时或提前将其设计推向市场对于保持或获得竞争成功至关重要。但是,他们也知道,产品上市后的性能同样至关重要。将产品推向市场,却无法实现广告所承诺的性能或产品寿命,这是公司永远不想拥有的噩梦。
因此,可靠性验证现在是 IC 设计和验证流程的重要组成部分。随着设计转向最先进的工艺节点(图 1),可靠性问题(例如静电放电 (ESD) 和闩锁保护)的范围和复杂性显着增加。作为回应,大多数代工厂现在提供某种形式的可靠性设计规则,这些规则由电子设计自动化 (EDA) 公司以自动化可靠性验证工具和检查的形式启用 [1-3]。
图 1. 检查计数复杂性和 ESD 路径密度在工艺节点上的增长。
当然,与其他所有形式的自动化 IC 设计验证一样,运行可靠性验证流程需要时间和资源……有时比公司所能提供的还要多。并非每家公司都有能力获取和管理足够的现场计算资源以保持可靠性验证流程按计划进行。幸运的是,现在有了另一个答案——云计算。
在使用代工厂规则平台验证完整芯片时,使用第三方云计算资源来满足“高峰需求”时期是一种可扩展且可持续的及时可靠性验证方法。但是,公司需要清楚地了解云计算的要求、限制和成本,以便在采用云技术选项时做出明智的成本/收益决策。
使用云服务器时,公司根据使用的服务器数量、机器类别和总使用时间收费。要使用的最佳云服务器数量及其配置取决于您正在运行的可靠性验证流程的类型、您使用的 EDA 工具、设计的规模、您的流片时间表以及您的公司的资金数额愿意或能够花在云访问上 [4]。
为了展示在云中运行可靠性验证流程的潜在优势,我们使用 Siemens EDA Calibre PERC 可靠性验证流程和主要商业云服务对全芯片系统级芯片 (SoC) 设计进行了一系列实验提供者。我们在不同数量的云服务器上总共运行了 3 次相同的 Calibre PERC 流程(使用相同的 SoC 设计和规则组):
- 1 个具有 16 个物理内核的云服务器,采用 Calibre 多线程 (MT) 技术
- 5 台云服务器,每台具有 16 个物理内核,采用 Calibre flexible MT (MTflex) 技术。在 Calibre MTflex 配置中,这 5 个服务器被组织为 1 个主服务器 + 4 个远程服务器。
- 51 台云服务器,每台都有 16 个物理内核,采用 Calibre MTflex 技术。在 Calibre MTflex 配置中,51 台服务器被组织为 1 个主服务器 + 50 个远程服务器。
我们记录了每个流程的运行时间并比较了结果,如图 2 所示。对于 1 台服务器、5 台服务器和 51 台服务器,Calibre PERC 运行分别在 106 小时、31 小时和 9.5 小时内完成。此外,与单机 MT 运行相比,每次 MTflex 运行的内存减少了 10%。
完整阅读文章:您是否正在优化云计算的优势以加快可靠性验证?
工业技术