亿迅智能制造网
工业4.0先进制造技术信息网站!
首页 | 制造技术 | 制造设备 | 工业物联网 | 工业材料 | 设备保养维修 | 工业编程 |
home  MfgRobots >> 亿迅智能制造网 >  >> Manufacturing Technology >> 工业技术

单点故障 |简单概述

在信息技术领域,系统设计涉及确定系统的架构、接口、模块和数据以满足特定要求的过程。这是提高产品/服务开发效率和实现出色用户体验的关键过程。

假设您有一个每天为数百万用户提供服务的应用程序。在服务器端,你需要有优秀的工程来处理如此大量的请求。即使数据库出现问题或硬件故障,服务器请求也绝不能失败。

但是,如果后端或前端设计不正确,一个简单的错误可能会关闭整个应用程序——从服务器到计算机范围的网络的一切。此类错误的主要来源之一是单点故障 (SPOF)。

在这篇概述文章中,我们解释了为什么单点故障是 IT 专业人员最严重的问题、其常见来源以及如何缓解此类故障。让我们从一个基本问题开始。

什么是单点故障?

定义: 单点故障是系统的任何部分,如果出现故障,会导致整个系统停止运行。简单来说,如果一件事坏了,一切都会失败。

SPOF 的出现是由于错误的设计和糟糕的实现技术。它们在任何系统中都是不受欢迎的,无论是软件应用程序、硬件模块、制造系统还是商业实践。

例如,如果您运行的网站仅托管在特定位置的一台服务器上,那么该服务器将成为单点故障。如果服务器出现故障,访问者将无法访问该网站。这一点可以使与您的网站相关的每项活动都停止。如果您的业务存在此类风险,您需要采取措施降低该风险。

解决方案是什么?

降低 SPOF 潜在风险的最有效方法是添加冗余。这涉及安装冗余硬件组件和软件应用程序。

例如,可以使用独立磁盘冗余阵列 (RAID) 来存储目录服务器数据库,或在不同主机上部署目录服务器的多个重复实例。

可以在不同级别添加冗余。让我们以一个独立的出租车司机为例。在低层次上,他可能有工具和备件来修理车辆,以防它发生故障。在中等水平,他可能会借朋友的出租车来完成这项工作。在最高级别,他可能有另一辆车和足够多的部件,在多次故障的情况下完全更换故障部件。

现在,让我们看看计算中冗余的简单示例。

1.) 在一个简单的设置中,可能有几个可能的单点故障。

图 1

2.) 通过添加重复的硬件组件可以避免一些单点故障。

图2

3)。通过构建一个完全冗余的系统可以实现零 SPOF,尽管这种设置比图 1 所示的简单设置要贵得多。

图3 |零单点错误

在系统层面,可以部署负载均衡器来确保服务器集群的高可用性。在这种情况下,每台服务器可以有多个硬盘、电源和其他模块。可以通过添加额外的服务器来实现更高级别的冗余,如果它们出现故障,这些服务器可以承担活动服务器的负载。

数据中心本身支持许多操作,如业务逻辑。因此,如果其功能无法在其他地方复制,那么它本身就是一个潜在的业务 SPOF。

在站点(最高)级别,可以在不同的设置中复制整个数据中心,并在主服务器无响应时进行访问。这种类型的冗余通常是 IT 灾难恢复或恢复计划的重点。

为了没有 SPOF,大型网络(包括 Internet 和 ARPANET)使用数据包交换,这是一种通过数字网络路由和传输数据为数据包的技术。它利用网络上两台主机之间的多条路径,优化使用信道容量。

阅读:控制互联网的 10 个组织

当两台主机之间的任何一个节点出现故障时,数据通过一个替代节点进行传输。分组交换还最大限度地减少了传输延迟并提高了通信的鲁棒性。

广泛用于防止单点故障的网络协议有以下三种:

  1. 中间系统到中间系统 通过确定数据的最佳路径,在计算机网络内有效地移动信息。
  2. 首先打开最短路径 在属于单个自治系统的路由器之间分发路由信息。它使用最短路径优先算法(Dijkstra 算法)来传输数据。
  3. 最短路径桥接 简化了网络的开发和配置,同时支持多路径路由。

评估单点故障

SPOF 往往出现的三个常见位置是硬件、软件和第三方服务/提供商。在大多数组织中,人也是单点故障,但他们经常被忽视。企业中的人员可能因多种原因成为 SPOF,例如错误、欺诈、不诚实、缺乏知识和经验有限。

一旦检测到 SPOF,下一步就是根据修复它的难易程度对其进行分类。可以分为三类:

除此之外,还可以根据发生概率(低、中、高风险)及其对业务的影响(低、中、高影响)对 SPOF 进行分类。

防止单点故障

由于如此多的关键任务流程依赖于网络连接,因此不能简单地容忍数据中心中断。尽管如此,每年仍有超过 30% 的数据中心经历中断。大约 34% 的企业表示,停机一小时的成本超过 100 万美元。

不管数据中心停机造成的损失如何,现实情况是多达 80% 的停机是可以避免的。虽然网络中的任何工具都可能存在 SPOF 危害,但大多数中断是由恶意软件和其他网络威胁造成的。

阅读:13 种不同类型的计算机病毒

现代威胁防护工具(包括负载平衡器、入侵防御系统、Web 应用防火墙和高级威胁防护解决方案)在电源故障或网络接口控制器故障或过滤互联网流量时始终处于危险之中。

这些工具既容易受到暴力攻击等普通威胁,也容易受到实施 XML 外部实体或跨站点请求伪造等复杂威胁。由于他们不能一直保护网络,所以有必要采取冗余的安全措施。

有多种方法可以实现 Web 应用程序防火墙架构,以最大限度地降低各种攻击的有效性和频率。例如,多层 Web 应用防火墙根据其操作将不同的应用模块分成多个层。

由于每一层都在单独的系统上运行,因此没有 SPOF。同样,正确实施多个负载均衡器可以减少网络内的单点故障。

不要把所有的鸡蛋放在一个篮子里

尽管许多公司提供自己版本的云备份,但不建议仅依靠一种备份来保护您的企业数据。甚至亚马逊、微软和谷歌等科技巨头的云服务每年也会失败多次。

阅读:计算机科学领域的 25 大发明

如果您经营一家公司,则在构建冗余时需要考虑所有可能的情况。不要假设任何人都可以提供 100% 的正常运行时间,并且在出现问题时始终准备好 B 计划。

深入研究

系统的系统中的 SPOF

英国利物浦约翰摩尔斯大学的研究人员强调了在集成单个系统以形成大型复杂异构系统时面临的主要挑战。

许多现代方法倾向于专注于一个小的特定脆弱区域。由于大量协作组件,其中一些是高度理论化的或不可扩展的。该研究描述了单点故障如何严重影响协作系统并导致企业遭受重大财务损失。

消除基于软件的冗余中的单点故障

基于软件的冗余通常被认为是提高可靠性的一种有效且廉价的方式。三重模块冗余 (TMR) 方面的冗余执行非常流行,但它留下了不受保护的 SPOF。

这项研究提出了一种名为“组合冗余”的整体方法,该方法可以针对软性努力强化系统的安全关键组件,同时消除由 SPOF 引起的漏洞。它利用冗余执行和编码处理,可以轻松集成到现有项目中。

阅读:9 种不同类型的渗透测试

最小化树路由中的 SPOF

树路由 (TR) 利用父子链路来传输数据包。当源节点和目的节点属于不同的树分支时,这些链路需要更多的跳数。靠近协调器的节点可能会传输更多的数据包,从而导致更高的能耗和更多的拥塞。这可能会产生 SPOF 问题。

台湾国立高雄应用科技大学的一组研究人员开发了一种缓解 SPOF 树路由算法,以通过最短路径传输数据包并避免拥塞。该算法减少了平均跳数,最小化了端到端延迟,提高了吞吐量,延长了树节点的生命周期。


工业技术

  1. 简单串联共振
  2. 保持简单维护:使用感官
  3. 什么是量子金融系统? [简单概述]
  4. NEMS – 纳米机电系统 |简单概述
  5. 新系统可以在机电设备故障发生之前检测到故障
  6. SYNTEC控制系统的简单连接和操作
  7. 旧自动化系统的简单解决方案
  8. 液压系统故障的最常见原因
  9. 通过这五个简单步骤优化您的维护程序
  10. 单点线程
  11. 液压系统故障的主要原因
  12. 液压系统故障的 4 个常见原因