什么是深度学习?
1990 年阿诺德施瓦辛格的电影Total Recall 描绘了一个2084年的故事,近一个世纪的未来。根据电影,未来将有自动驾驶汽车。这在 1990 年是科幻小说,但今天已成为现实。 Apple、Alphabet、Nissan、Uber 和更多公司都在开发自动驾驶汽车。特斯拉向终端消费者销售功能强大的自动驾驶汽车,这似乎运作良好。
是什么让科幻小说在短短三年内成为现实?答案是深度学习。
从人工智能到深度学习
希腊火与金属加工之神赫菲斯托斯 (Hephaestus) 创造了金色的机器人和机器。早在 1770 年代的机械土耳其人,人类就一直在开发模仿人类智能的装置。尽管机械土耳其人是骗人的,但后来能够击败人类的计算机是在 20 世纪后期开发的。所有这些都在努力创建可以模仿人脑的系统。
图一。 土耳其人的横截面。图片由提供 洪堡大学图书馆
人工智能 (AI) 是任何试图模仿人脑的计算系统的术语。艾伦图灵的图灵机是一个原始的人工智能系统,它使用逻辑来找到解决方案。
机器学习 (ML) 是 AI 的一个子集,它使用模型来执行任务。这些模型是用大量数据训练的。 Deep Blue 是 1997 年击败世界国际象棋冠军 Garry Kasparov 的计算机,就是 ML 的一个例子。
深度学习又是机器学习的一个子集,模型在没有任何人工监督的情况下从数据中学习。因此,深度学习系统能够对非结构化数据进行无监督学习。
深度学习:它是如何工作的?
深度学习的灵感来自于构成传递和处理信息的神经元的人脑结构。深度学习中使用的结构称为人工神经网络 (ANN)。人工神经网络可以在没有人工监督的情况下识别和分类信息,据说能够进行无监督学习。与使用监督学习的传统机器学习相比,这需要大量数据。
人工神经网络由从输入层到输出层的多个层组成,数据通过这些层。除了输入和输出层之外的其余层称为隐藏层。 ANN 的第一层,即输入层,由神经元构成。 ANN 的神经元是数学函数,它们非常接近人类神经元。
图 2. ANN 输入和输出层概念。
不同层次的信息传输是通过连接通道。 ANN 层中的每个节点都通过这些通道连接到下一层中的每个节点。每个通道都有一个附加值,称为权重;因此,这些通道称为加权通道。
隐藏层中的所有神经元都有一个与之相关的唯一编号,称为偏置。信息从一层传递到下一个通道,采用与通道相关的权重。当它到达下一层的神经元时,偏置被添加到输入的加权和中。
这个数学运算的结果被馈送到激活函数。激活函数决定神经元是否应该被激活。这是通过将非线性激活函数应用于通过将偏差添加到来自通道的加权和而获得的结果来完成的。激活函数为神经元的输出增加了非线性。
只有应用激活函数后处于活动状态的神经元才能向下一层发送信息。这一直持续到最后一层,即输出层。神经元通道的权重和隐藏层中的偏差不断调整以接收训练良好的模型。
一些最流行的深度学习框架是:
- Google 提供的 Tensorflow
- Facebook 上的 PyTorch
- 加州大学伯克利分校的 Caffe
- 微软认知工具集
- OpenAI
深度学习数据
数据是深度学习的原材料。理论上,任何数量的数据都可以改进模型。但考虑到数据收集工作、所需的训练时间和训练模型所需的计算能力,深度学习的数据量不可能是无限的。相反,数据太少也不会产生可靠的深度学习模型。
对于训练成功模型所需的数据量,没有一成不变的规则。它主要取决于训练模型的结果。如果模型不够可靠,则需要更多数据。对于训练深度学习模型所需的最少数据,有一些经验法则。
- 至少有 20 个数据点用于回归分析的预测
- 至少 1,000 张图像用于计算机视觉分类
对于这些更常见的深度学习应用程序,这是两种启发式方法。数据工程师为不同的应用程序提倡类似的规则。与所有经验法则一样,这些规则并不完美,需要根据具体应用进行更改。
深度学习的工业应用
深度学习有很多工业应用。让我们来看看其中的一些。
自动驾驶汽车
自动驾驶汽车现在销售给消费者,但它们也有很多工业应用。自动驾驶可以集成到工厂使用的运输设备中;例如,自动导引车 (AGV) 可以完全自主。这消除了在此类任务中手动劳动的需要,同时提高了安全性和效率。
图 3。 用于物流仓库的 AGV。
计算机视觉
计算机从图像中分类和识别对象。有时,计算机视觉是自动驾驶汽车的一部分,但它在工业应用中还有更多用途。计算机视觉可以自动进行对象分类。计算机视觉辅助系统可以执行质量检查。它还可以自动监控厂房和工业过程。
供应链管理
公司的供应链是一个复杂的系统,跨越多个供应商、供应商、地域和法规。手动管理庞大的货物流量是一项不可能完成的任务。通过分析在供应链中借助 IoT(物联网)设备生成的大量数据,可以使用深度学习来维持健康的供应链。
医疗应用
深度学习也有很多医学应用。它可用于从 X 射线、MRI 等医学成像结果中识别异常情况。它还可以通过连接的监测设备全天候监测患者的健康状况。深度学习可以通过提供最可能的分子组合来帮助药物发现。
深度学习在航空航天、太空探索、采矿、导航、国防系统、网络安全等领域有更多的工业应用,不胜枚举。深度学习正被所有垂直行业迅速采用,很快将成为工业 4.0 的一个关键且不可避免的要素。
物联网技术