什么是停机时间?实现完美系统可用性的障碍
无论是笔记本电脑、传送带、矿车还是 Netflix 总部的服务器,机器已经成为我们工作和生活不可或缺的一部分。如果他们遇到停机时间,您可以肯定某个地方的某个人对此不满意。
在接下来的几节中,我们将讨论停机时间的来龙去脉——它是什么、导致它的原因以及如何管理它。
什么是停机时间?
简单的说,宕机时间是指系统不可用的时间段。
停机时间可以是计划内的,也可以是计划外的:
- 计划外停机 就是它听起来的样子 - 时间因不可预见的情况而损失。意外的设备故障是计划外停机的最常见原因。
- 计划内停机 更具建设性、有目的性和更有活力。这是我们的系统和设备在进行日常维护时所需要的“休息时间”。
这两种情况的共同点是设备在一段时间内无法用于其预期功能。
停机时间会在财务、社会和运营方面影响许多不同的行业。主要示例来自工业部门和 IT 行业,在这些行业中,停机时间可能会导致重大的利润损失。
生产中的停机时间意味着什么?
制造商(以及其他重资产行业的领导者)一直在与设备停机时间作斗争。难怪。如果机器不可用,那一天就没有工作完成。
除了对创收产生负面影响之外,停机时间还会由于输入和输出流受阻而破坏我们与合作公司的关系和合同。
组织通常使用平均修复时间 (MTTR) 和平均故障间隔时间 (MTBF) 等指标来跟踪停机时间并估计已执行维护工作的有效性。 MTTR 不是一个完美的衡量标准,但在被视为停机时间因素之一时可以提供信息。
设备停机的原因有很多,还有一些预防和管理它们的聪明方法。我们将在本文后面讨论这些内容。
停机时间对 IT 意味着什么?
在信息技术行业,停机时间的定义是 IT 系统离线或无法运行的时间。导致生产力损失、收入损失和高额恢复成本的网络故障和中断是造成大部分网络停机的原因。
网络停机的平均成本估计为每小时 30 万美元。有很多原因可以将这段时间保持在最低限度。
服务器不可用可能是由于维护和软件升级而关闭、设备故障,甚至是由于停电或网络安全攻击等外部因素。
停机时间和可用性之间的关系
可用性 衡量一件设备在需要时可用的概率。换句话说,它显示了一台设备在其预期工作时间内完全运行的可能性有多大。
一件设备在以下情况下是可用的:
- 操作 (不用于维修和保养)
- 以预期的速度工作 (例如,它可以提供预期的输出)
- 在需要时发挥作用 (例如,每当班次开始并且操作员坐在方向盘后面时)
如果不知道系统经历了多少停机时间,就无法计算系统可用性。
可用性的计算方法是将正常运行时间除以正常运行时间和停机时间的总和:
设备停机的最常见原因
为了应对设备故障和计划外停机,首先了解它们发生的原因很重要。您不必为每个设备故障运行根本原因分析。有些原因很明显。
不当操作
操作失误是设备故障最常见的原因之一。
不正确的培训(或缺乏培训)迟早会导致资产的不当使用。在紧急情况或截止日期期间增加的压力也会导致许多操作员对设备管理不善。
同样,设备操作员没有接受过在某台机器上工作的充分培训,但由于人手不足或意外缺勤而需要在该机器上工作,更有可能对他们自己、周围环境以及他们所使用的设备构成危险。使用。约翰迪尔几天前就遇到了这个问题。
缺乏预防性维护
当一切正常时,很容易忽视预防性维护。尤其是在工作量过大、人手不足的情况下。
但设备故障的早期迹象可能非常微妙且容易被忽视。
在不知不觉中,您正在经历停机时间,而您手头没有时间。为了解决这个问题,维护团队需要了解设备故障并采取预防措施。
美国能源部估计,预防性维护措施可能导致:
- 维护成本降低高达 30%
- 故障减少 35%-45%
- 正常运行时间最多增加 75%
虽然进行预防性维护是一件轻而易举的事情,但即使是好事也需要适度。
过度维护
对于某些预防性维护任务,需要关闭和(部分)拆卸设备。如果您这样做的频率超过了实际需要,则意味着您正在招致不必要的计划停机时间。
这还不是全部。每次打开设备进行维护时,都会面临一系列风险——更换时损坏敏感部件、电线未正确连接、螺钉未正确拧紧等。随着时间的推移,这些风险会累积到导致设备故障。
<块引用>最近的 Facebook 中断可以作为一个很好的例子。 “在维护期间,运行了一个命令来评估全球骨干网容量,该命令意外断开了 Facebook 的所有数据中心。 ” 虽然我们不怀疑维护计划是否充分,但这说明所有维护操作都带有一些固有风险。
总之,执行过多维护会:
- 增加维护成本
- 损坏您的设备
- 浪费宝贵的技术人员时间
- 使用过多的库存
好消息是,通过使用现代 CMMS 软件制定智能维护计划,可以轻松避免过度维护。
缺乏可靠性文化
当工人处于时间紧迫的情况下时,他们通常会偷工减料,并对大小问题进行快速修复。通常情况下,他们被迫这样做是因为完全缺乏资源以及确保尽可能减少停机时间的压力。
如果组织继续容忍这些并且不提供资源来缓解问题,那么期望员工的主动性和可靠性就有点虚伪了。
如何减少计划停机时间
虽然预定的停机时间是必要的,但每个公司都应该齐心协力确保这段时间不被浪费。只要有可能,计划停机时间应安排在工作时间和生产计划之间。
通过标准化和培训缩短预定停机时间
当两个人做同样的任务时,他们不会以同样的效率完成这件事,这是人类的本性。制定标准操作程序 (SOP) 是为了减少不同技术人员在执行相同工作时的表现差异。
通过GIPHY
当然,如果他们一开始不知道自己在做什么,这意味着什么。通过为维护人员制定强有力的培训和入职计划来避免这种情况。
打击过度维护
维护计划人员经常发现自己在问,为了保持资产健康和功能,他们可以执行的计划维护的最少数量是多少。
对抗过度维护的最简单方法是使用像 Limble 这样的 CMMS 来安排资产的维护工作并跟踪该工作的有效性。可以根据资产历史记录和维护日志优化未来的计划。
现在,要真正消除不必要的维护工作,组织必须投资状态监测传感器和预测性维护等技术。
使用 CMMS 安排预定的停机时间
在获取维护数据和流程自动化方面,现代基于云的 CMMS 系统非常有用。它们可以帮助您安排预防性工作,同时考虑到技术人员的工作量、备件和工具的可用性以及与生产计划的冲突。
但是等等,还有更多!
如果您有权访问 Limble CMMS,则可以使用我们的自定义任务构建器来创建和存储标准操作程序和维护清单。结合即时访问设备维护日志、故障排除指南、安全检查表和维护手册,技术人员可以使用所有这些资源来显着加快工作速度并确保业务连续性。
他们完成得越快,资产就越快准备好并可用。
如何减少计划外停机时间
一项调查停机成本的 ISA 研究表明,由于计划外停机导致生产力下降,每家工厂都会损失 5% 到 20% 的收入。纠正和缩短计划外停机时间可以为您的业务创造奇迹。
专注于预防性维护
我们是否需要再次解释积极主动的重要性?我们希望不会。如果您遇到大量停机时间的问题,请为有问题的设备制定预防性维护计划。这应该让你走上正轨。
关键操作的备用设备
在制造业中,关键操作的备份设备对于消除过多的停机时间或闲置时间非常有用。对过去停机事件示例的全面分析有助于确定哪些操作更容易出现故障。
在解决问题时只需插入即可更换,这是天赐之物 - 尽管非常昂贵。
购买和使用容错能力更强的机器
有些设备比其他设备更可靠。现代设备的构建应该考虑到容错。默认情况下,使用此类设备可减少停机时间,并使维护团队有更多时间做出反应。
同样,这样的设备是有代价的。然而,任何参与购买机器的人都应该主要关注长期有效性。易于维护且不太可能出现故障的设备通常更具成本效益,即使初始成本让您大吃一惊。
制定应急维护程序
您永远无法完全消除生产车间的设备故障。这还不是世界末日。但是,这确实意味着您需要有一个有能力的团队和程序来处理紧急维护。
让机器操作员参与维修和维护
自主维护是一种方法,机器操作员接受培训,负责基本维护任务,如清洁、安全检查、目视检查和换油。
这种方法的好处有三个:
- 操作员对设备拥有更多所有权,这意味着他们在使用设备时更加负责。
- 您增加了及早发现设备问题的机会。
- 这可以让其他维护人员腾出时间专注于更复杂的维护工作。
在某种程度上,这些点中的每一个都有助于总体减少总停机时间并提高资产利用率。
该上班了
过多的停机时间不会自行停止。它必须被管理。
如果出现计划外停机,您必须找出导致停机的原因并采取预防措施。创可贴解决方案只能让您到此为止。
计划停机时间略有不同。有必要。尽管如此,这并不意味着它可以随时安排。如果可能,请使用 CMMS 和预测分析来计划、组织和执行计划内的停机时间。
作为一个集中式数字维护平台,Limble CMMS 拥有您保持井井有条和管理设备停机时间所需的一切。如果您有兴趣了解如何, 安排演示或开始免费试用。
设备保养维修