开发工业机器学习项目:要避免的 3 个常见错误
人工智能技术的使用,更具体地说是机器学习,越来越被视为一种革命性的工具。 但什么是机器学习?
Francois Chollet 提出了一个有趣的描述。在他的书“使用 Python 进行深度学习”中,他将机器学习 (ML) 定义为一种新的计算范式。在传统计算中,我们向计算机提供规则和数据,我们期望得到正确的结果。使用机器学习,这个顺序被改变了。我们将数据和结果提供给计算机,并期望规则作为答案。
这种新的计算范式显着改变了我们解决日常问题的方式,并为所有研究领域带来了广泛的机会。在过去的几年里,机器学习得到了广泛的应用,包括在工业领域。尽管范围如此广泛并且有许多优秀的专业人士在该领域工作,一些常见错误 在工业项目开发中已经观察到(并且应该避免)。虽然还有很多其他错误,但本文旨在讨论其中三个可能的错误。
1。忘记基础
工业 4.0、数字化、人工智能、机器学习和 IIoT 等概念是当今工业界的热门趋势。采用这种方法的项目经常在专业人士的投资组合中受到特别关注,一些专业人士倾向于在项目设计期间选择这种解决方案,以提高他们的项目获得批准的机会。但重点是:这个工具(机器学习或任何其他工具)是否适合解决您的问题? 在选择任何这些“现代”工具之前,您需要问自己一些问题。我在这里列出了一些,虽然还有很多:
- 我是否尝试过更简单的算法来解决这个问题(如 PLC 逻辑)?
- 协调良好的监管控制是否会产生相似或更好的控制结果?
- 我们是否有合适的、训练有素的团队来保持这些新应用程序的正常运行?
- 一组不同的质量工具(例如排列图或因果图)能否提供足够的数据来获得良好的洞察力?
请注意,我并不是说机器学习之类的工具不能提供很好的结果,或者这些工具太复杂了。然而,请务必记住,简单的解决方案通常会产生良好的效果 并且通常应该是工业 4.0 之旅的第一步。
2。不注意数据质量
用于处理数据的机器学习工具现在很普遍。像谷歌这样的大公司和许多开源团体已经开发了很棒的机器学习库。这些图书馆可以在互联网上获得,其中一些是低成本或免费的。然而,纵观全局,任何机器学习项目都涉及四个主要阶段 :
- 了解和准备数据
- 处理这些数据
- 分析结果
- 根据数据分析明智地采取行动
也就是说,当我们审视开发机器学习项目的整个过程时,一些专业人士不注意数据收集和准备就直接进入中间阶段(处理数据和分析结果)的情况并不少见。主页>
任何机器学习项目的基础都是数据。 就像在烹饪中一样,任何好菜的出发点都是使用好的食材,开发一个好的 ML 项目的一个重要因素是获取和使用好的数据。尤其是在工业领域,获取这些数据可能是一项具有挑战性的任务。潜在挑战的非详尽列表如下所示:
- 缺乏检测(缺少数据)
- 由于仪器安装、维护或配置不当导致数据不准确
- 由于分析中的误解导致的错误数据标签 - 监督学习任务
即使面临这些挑战,只要正确准备数据(有时需要工业充分性),还是有可能建立一个足够强大的数据库以获得出色的结果。
所以,花点时间完成这项重要的任务吧!
3。忽视专家的知识
这可能是一个有争议的论点。一些专业人士可能会说,如果您想要专家意见,您应该选择使用模糊逻辑的专家系统,例如。在相反的观点中,当我们调查我们公司拥有的大量知识 ,只是忽略它听起来并不是发展我们的流程的最佳方式。
当我们实施 ML 项目时,最好的方法是让一个多学科团队将 ML 开发人员(了解 ML 技术的人,即深度学习、自然语言处理、集成方法、聚类等)与适当的专家结合起来顾问(了解过程现实和要解决的实际问题的专业人士)。有了这个多学科的团队,就会产生良好的结果。您可能会得到更准确的解决方案,更有可能在现实世界中实施它们。
走得更远
尽管存在巨大的挑战和警示故事,但机器学习正越来越多地表明自己是一种强大的工具。机器学习以及其他数十种旨在使工业世界现代化和发展的工具,是一种趋势,也是一个自然(和必要)的进化过程。然而,尤其是在工业、医疗和其他领域的关键过程中,必须小心谨慎。所以,不要跳过步骤:让您的项目尽可能简单,妥善保管您的数据,不要忘记专家。
正如我们所见,机器学习项目不是短期的,而是漫长的旅程 .和任何旅程一样,这一步是一步到位的,最后一步和第一步一样重要。
工业技术