根本原因分析:定义、方法和经过验证的最佳实践
根本原因分析 (RCA) 是一种系统方法,用于识别和理解导致不良结果的根本问题。该过程的目标是查明给定故障发生的方式和原因,以便您可以消除根本原因并防止相同的问题再次发生。
如果正确执行,根本原因分析可以帮助维护团队转向预防性而非纠正性或紧急维护策略,最终减少计划外停机时间,节省时间并降低成本。
根本原因分析的 5 个基本步骤
当您的组织认识到某个特定问题不断出现(例如同一条皮带反复卡在一台机器上)时,就应该进行根本原因分析。
从根本上讲,根本原因分析可以分为 5 个基本步骤:(1)定义问题; (2) 收集数据; (3) 确定影响因素; (4) 找出根本原因; (5) 实施并监控变更。
1。定义问题
根本原因分析的第一步是以清晰且描述性的方式定义您希望解决的问题。包括支持为什么需要解决问题的相关数据,例如停机时间或相关成本。在此阶段要具体,因为这将帮助您的团队专注于手头的任务,从而在后续所有步骤中节省时间。
2。收集数据
定义问题后,就该收集尽可能多的数据。这些数据可能包括资产年龄、运行时间、维护历史、环境条件、组织影响以及可能与所定义问题相关的任何其他数据。收集、组织并最终审查全面且一致的数据的理想方法是使用基于云的计算机化维护管理系统 (CMMS),例如 eMaint。
3。确定影响因素
一旦收集到足够的数据,就可以组织和分析数据,以确定可能导致所定义问题的所有潜在因素。请特别注意问题发生之前的一系列事件中捕获的任何异常数据。通过利用与数据收集硬件(例如 Fluke Reliability 提供的远程传感器)集成的 CMMS 软件,这可以变得更容易。
4。找出根本原因
在识别并映射导致先前定义的问题的因果因素之后,您应该能够识别问题的真正根本原因。您越具体地确定根本原因,您的解决方案就越容易、越有效。请记住,根本原因必须是可解决的,无论是物理问题(材料故障)、人为问题(错误或疏忽)还是组织问题(有缺陷的流程或政策)。
5。实施和监控变更
确定了根本原因后,现在是采取行动的时候了。这里的目标不仅仅是解决问题以便您可以继续维持现状,而是实施永久解决方案以防止问题在未来再次发生。为了确保问题得到真正解决,在实施解决方案后继续捕获和分析数据也很重要 - 通过使用 eMaint 等 CMMS 与 Fluke Reliability 等远程资产监控传感器相结合,这项任务再次变得更加容易。
由于根本原因分析是一个有条理且可能耗时的过程,因此确保问题足够严重非常重要,以便投入纠正该问题所需的时间和资源从长远来看会得到回报。如果故障修复速度快且成本低,或者故障发生的频率很低,则根本原因分析可能就没有必要了。
尽管这取决于您的组织和行业,但通常最好仅在出现以下问题时进行根本原因分析:
- 导致巨大的成本;
- 影响关键任务资产;
- 定期发生;
- 危及员工健康或安全;
- 或以其他方式阻碍您组织的目标。
您可以使用一系列不同的问题解决技术来帮助您收集数据、识别影响因素以及将问题的根本原因归零。其中包括进行故障树分析、鱼骨图分析、故障模式和影响分析 (FMEA),甚至执行流行的“5 个为什么”技术。
所有这些方法的基本前提是,你从最终不想要的结果开始,然后问“为什么会发生这种情况?”列出可能的原因,然后继续深入研究可能导致每一步失败的原因,直到最终找出问题的真正症结。
无论您如何精确地定制流程,成功执行根本原因分析的关键是确保您拥有充分理解和解决问题所需的所有数据。幸运的是,当使用正确的 CMMS 系统时,有关机器诊断、工单记录、预防性维护 (PM) 计划等的全面数据都触手可及。
设备保养维修