MTBF:完整概览
MTBF 是一种用于预测机器故障间隔时间的计算。下面,我们将讨论 MTBF 计算、需要注意的 MTBF 陷阱以及如何提高您的 MTBF。

什么是平均无故障时间?
平均故障间隔时间 (MTBF) 是对一台机器在正常工作时间内发生先天故障之间的时间间隔的预测。换句话说,MTBF 是一种维护指标,以小时为单位,显示设备不间断运行的时间。需要注意的是,MTBF 仅用于可修复的项目,并作为一种工具来帮助规划关键设备维修的必然性。
在计算 MTBF 之前,您需要了解它如何影响可靠性和可用性。具有高可靠性和可用性通常是相辅相成的,但这两个术语不可互换。 可靠性 是资产或组件在预定时间段内在特定条件下执行其所需功能的能力。换句话说,一台机器很可能会做它应该做的事情而不会出现故障。想想一架飞机;它的任务是安全地完成飞行并将乘客送到目的地,而不会出现灾难性故障。
可用性 是资产或组件在需要使用时可操作和可访问的时间。换句话说,这是一台机器在任何给定时间处于执行其预期功能的状态的可能性。可用性取决于系统的可靠性及其发生故障时的恢复时间。可用性通常与可靠性同时考虑,因为一旦发生故障,关键变量就会切换到尽快启动和运行资产。
MTBF 是衡量系统可靠性的基本指标; MTBF 越高,产品的可靠性就越高。这种关系在等式中说明:可靠性 =e-(时间/MTBF) .
您可能会遇到一些不同的 MTBF。它们是系统中止之间的平均时间 (MTBSA)、关键故障之间的平均时间 (MTBCF) 和计划外移除之间的平均时间 (MTBUR)。在区分严重故障和非严重故障时,您很可能会看到这些变化。
MTBF 计算
MTBF 的计算方法是将资产运行的总时间(正常运行时间)除以同一时间段内发生的故障次数。
MTBF =总正常运行时间 / 故障次数
细分下来,MTBF 计算可能如下所示:
- 求总正常运行时间: 想象一下,您有一个装满小部件的仓库,其中 40 个小部件每个都经过了 400 小时的测试。测试花费的总小时数等于 16,000 小时 (40 x 400 =16,000)。
- 找出失败的次数: 确定整个测试小部件的失败次数。在此示例中,假设有 20 个小部件故障。
- 计算平均无故障时间: 现在我们知道测试执行了 16,000 小时,有 20 个小部件故障,我们可以计算 MTBF:16,000 小时 / 20 次故障 =800 小时 .
那么,这告诉我们什么呢?在这个例子中,MTBF 并不是建议每个小部件应该持续 800 小时。这是说,如果您运行一组小部件,则测试组内的平均故障间隔时间为 800 小时。换句话说,MTBF 并不是要预测单个组件的行为;它预测一组组件的行为。
在定义“时间”时,它可能并不总是指时钟时间,理解这一点很重要。它可能是系统实际使用的时间。例如,您可能拥有一台每天运行 8 小时的机器,它的使用寿命可能是完全相同的机器每天 24 小时运行的三倍。两台机器的 MTBF 相同,因为它们都承受了相同的运行小时数。
让我们看一下 MTBF 计算的另一个示例。假设您有一台设计为每天运行 12 小时的装瓶机。装瓶机正常运行10天后出现故障。本例中的 MTBF 为 120 小时。
MTBF =(每天 12 小时 x 10 天)/ 1 次故障 =120 小时
当您有更长的时间且故障发生率增加时,MTBF 计算需要更多步骤。例如,假设每天运行 12 小时的装瓶机在 10 天内出现两次故障。第一次故障发生在距启动时间 20 小时后,花了两个小时才修复。第二次故障发生在距启动时间 60 小时后,花了三个小时才修复。计算 MTBF 方程的总正常运行时间需要将 20(初始正常运行时间段)、18(第一个停机时间段的开始时间减去第一个停机时间段的结束时间)和 57 小时(第二个停机时间段的开始时间减去停机时间段的结束时间)相加。
因此,现在 MTBF 计算如下所示:MTBF =(20 小时 + 38 小时 + 57 小时) / 2 次故障或 57.5 小时 / 2 次故障 =57.5 小时 .
误解 MTBF
关于 MTBF 的最大误解之一是,它与故障前的运行小时数或“使用寿命”是一回事。如果您获得极高的 MTBF 值(并不少见),您可能会认为系统无法运行这么长时间而不会出现故障。 MTBF 值高的原因是,它们主要基于资产仍处于“正常”或“有用”寿命时的故障率,假设它将永远以该速率发生故障。正是因为这个原因,使用寿命和 MTBF 之间应该没有相关性。您可以拥有一台设备的 MTBF 非常高,但预期使用寿命却很低。
Wendy Torell 和 Victor Avelar 在他们的白皮书平均故障间隔时间:使用人类的解释标准中提出了一个很好的例子。假设您在样本人群中有 500,000 名 25 岁的年轻人。在一年的跨度内,收集了该群体的失败(死亡)数据。人口的运行寿命为 500,000 x 1 年 =500,000 人年。在这一年中,有 625 人失败(死亡)。这使故障率达到 625 次故障/500,000 人年 =0.125%/年。所以,我们的 MTBF 是 1 / 0.00125 =800 年。
这向我们表明,即使 25 岁的人类具有很高的 MTBF 值,但他们的预期寿命(服务率)却要短得多,并且没有相关性。
人类和机器一样,不会表现出恒定的故障率。随着人类年龄的增长,会发生更多的故障(我们的身体会磨损)。在这种情况下,计算 MTBF 以使其与使用寿命相关的唯一方法是等待 25 岁的整个人口达到他们的生命终点;然后可以计算平均寿命。这使这个数字大约为 75-80 岁。
那么,25 岁的人的 MTBF 是 80 还是 800? Torell 和 Avelar 解释说,这完全取决于假设。在这种情况下,80 年的 MTBF 更准确地反映了产品(人)的寿命。当涉及到从机器跟踪产品之类的事情时,您有更多的变量,其中最大的是时间。
如何提高 MTBF
机器故障的影响可能很大。这会导致生产损失并增加维护时间。找出故障的根本原因是查找、减轻甚至防止未来发生的最佳方法,同时在此过程中增加您的 MTBF。有几种方法可以提高 MTBF。

- 改进预防性维护流程: 一个经过深思熟虑的预防性维护计划可以大大提高您的 MTBF。任何时候您可以在维护方面采取主动而不是被动的态度,这让您有机会在故障发生之前将其阻止。执行不力的预防性维护计划实际上会对 MTBF 产生相反的影响。培训不力、缺乏或设计不当的手册和检查表都可能导致快速故障。
- 进行根本原因分析: 弄清楚某件事失败的原因是防止该故障在未来发生或至少不再经常发生的关键。与预防性维护一样,根本原因分析可以通过提出长期解决方案来间接提高 MTBF。例如,如果您发现某个部件经常出现故障,您可以查看是否可以用更高质量的部件替换它。
- 建立基于状态的维护: 如果您有能力建立预警系统,在设备问题导致故障之前检测到它们,您就有可能增加 MTBF 并减少停机时间。虽然制定基于状态的维护计划并不总是那么容易,但您可以从实施全面的生产性维护计划开始。
MTBF 的潜在问题
在将其用于可靠性分析时,了解 MTBF 计算可能产生的潜在问题非常重要。 MTBF 可能会有所不同,具体取决于您如何定义“故障”和“操作时间”等特定内容,以及您测量的是单个设备还是整个过程。
- MTBF 假设故障率恒定: MTBF 方程的一部分是关于故障数量。当您无法控制的事情导致故障时就会出现此问题,例如风暴导致停电、洪水导致的短路等。这些有时被称为“上帝的作为”,可能会离开失败的定义有待解释。失败只是故障吗?无论是什么原因,生产停止时是否会出现故障?在计算 MTBF 时是否应该包括所有类型的故障,从而为您提供较低的 MTBF 值?或者您是否应该忽略某些类别的停工,从而导致更高的 MTBF 值?确保您知道在计算 MTBF 时包括哪些故障以及选择这些故障的原因。
- 运行时间的不同定义: 您认为工厂中的一项资产何时投入运营?考虑到零件或组件会因运行期间承受的应力而退化,应力越大,对零件使用寿命的影响就越大。一个很好的例子是汽车在红灯时停下来。当坐在红灯时,汽车的变速箱和传动系统没有被使用,因此发动机在最小的压力下运行并且几乎没有磨损。如果您要计算空转汽车的 MTBF,您会包括它在红灯时停止的空转时间,还是仅包括它加速和高速运行的时间?
按照同样的思路,您是否应该将设备的运行时间视为设备开启的任何时间,还是仅在设备在正常工作负载下运行时?如果您选择使用前者进行 MTBF 计算,您的 MTBF 值会更高,但该值不能代表在正常工作负载下持续运行且几乎从未空转的机器。这就是为什么为您打算使用 MTBF 的所有资产定义运行时间很重要。
- 选择要监控的设备(坏人): 您还应该确定是要测量整个过程还是该过程中的单个设备。这里要注意的一件事是,只要一项关键资产出现故障,整个流程就会受到影响。这些关键资产被称为“不良行为者”,应标记为导致 MTBF 损失。
那些选择为 MTBF 计算测量整个过程的人经常发现,由于“不良行为者”,他们无法实现高 MTBF 值。建议对每台设备进行测试以消除此问题。
如果您提前考虑这些潜在问题,MTBF 仍然可以成为评估资产可靠性的有用工具。
设备保养维修