面向初学者的机器学习及其四种主要类型的重点说明

毫无疑问，大数据是未来科技发展的重要组成部分。然而，机器学习 (ML) 和人工智能 (A.I) 在这一发展中都发挥着重要作用。简述这三者的关系：大数据为材料，机器学习为方法，人工智能为结果。

什么是机器学习？

机器学习 (ML) 是人工智能 (A.I) 的一种类型，其中算法的编写方式使得系统能够通过经验自动学习、适应和改进，而无需明确编程.
机器学习算法根据目标学习的数据类型构建了一个示例模型，这种类型的数据称为“训练数据”。

机器学习的类型？

机器学习算法有很多种，一般可以分为4大类，不同类型的机器学习如下：-

监督学习.
无监督学习.
半监督学习。
强化学习。

监督学习

当机器在“学习”阶段被监督时，这种类型的训练称为监督学习。当我们说一台机器被监督时，我们真正的意思是什么？ ?.以允许机器学习使用其旧数据（过去提供的数据）并使用它来预测围绕输入的数据类型（即旧数据）的未来事件的方式应用算法的真正含义。

分析开始，训练数据集中的所有材料和标记都与机器相关，从而可以预测正确的输出值。这意味着我们向机器提供有关特定案例的大量信息，然后它提供案例结果。结果称为标记数据，而其余信息用作输入特征。然后，系统还可以在充分训练后为新的输入提供目标。该算法可以将其输出与预期输出进行比较，并找到差异以相应地更改模型。

图片来自人工智能.oodles.io/

这种方法多半是人工分类，对电脑来说最容易，对人来说最难。这种方法的一个例子是，告诉机器标准答案，当机器被测试时，机器总是按照标准答案来回答，因此它的可靠性也会更大。

无监督学习

与监督学习相反，当用于训练机器的信息既没有分类也没有标记时，使用无监督学习算法，正如无监督学习中的名称所暗示的那样，用户不会向计算机提供帮助来帮助它会学习。

提供的材料没有标签，机器匹配数据的特性，对材料进行分类。由于缺乏标记的训练集，机器会识别出数据中对人类来说不太明显的模式。

图片来自 data-flair.training/

在这种方法中，没有任何手动分类，这对人类来说是最容易的，但对计算机来说最难，而且会导致更多的错误。该系统通常不会计算出预期的输出，但它会研究提供的数据，并可以从数据集中提取关系以描述未标记数据中的隐藏结构。因此，在无监督学习中识别数据模式非常有用，也有助于我们做出决策。

半监督学习

半监督学习不同于监督学习和无监督学习，其中要么没有标签用于所有数据的观察，要么存在标签。

在半监督中，标记（监督）和未标记（非监督）数据都用于训练。 SSL 混合了两种类型的学习，其中少量数据被标记，大量数据未被标记。机器需要通过标记数据找到特征，然后使用基本模型对其他数据进行相应的分类。 SSL 系统不仅可以显着提高其学习准确性，还可以做出更准确的预测。

这是最常用的方法，因为标记成本很高，因为需要熟练的人类专家。它需要相关资源来训练它并从中学习，而获取未标记的数据通常不需要额外的资源。由于在大多数观察中缺乏标签，但存在少数，半监督算法是构建模型的最佳候选者。

这些方法受益于这样的想法：即使组成员是未知的，因为未标记的数据更普遍，但有关参数的信息仍然携带在标记中并且可以使用它找到。

强化学习

强化学习最接近我们人类的学习方式。 RML 算法是一种学习方法，其中机器通过构建新动作并发现错误或奖励来反复与其环境交互。它使用基于正面或负面奖励的系统。

具有延迟奖励的试错搜索是强化学习最相关的特征。机器使用从与环境交互中收集的观察结果来构建行为，并采取行动来最大化回报或最小化风险。这种方法允许机器自动确定特定上下文中的理想行为以提高其性能。在强化学习中，没有标记材料，而是需要简单的反馈，即哪一步是正确的，哪一步是错误的，这就是强化信号。

机器根据反馈的标准，逐步修正自己的分类，直到最终得到正确的结果。为了在无监督学习中达到一定水平的精度，强化学习的整合是必要的，

RML 可能是在商业环境中最难生产和执行的，但它通常用于自动驾驶汽车。

2021 年学习如何编码初学者通用指南通过使用 SmallSEOTools 保持原意来改写您的内容

工业技术