神经网络:推动机器翻译的下一个前沿
本文由 Rachel Wheeler 撰写和提交。
机器翻译的想法可以追溯到几十年前。首先,它只是一个基于规则的机器翻译系统。然后在 20 世纪 80 年代,研究人员开发了统计机器翻译。 21世纪,机器翻译技术的巨大飞跃将来自于机器学习和神经网络技术。
在过去的几年里,我们看到翻译公司使用这些人工智能技术来提供更好的机器翻译,取得了一些重大进展。一些最令人印象深刻的例子来自谷歌神经机器翻译(GNMT)和微软神经翻译器等系统。
什么是神经机器翻译?
机器翻译已经广泛应用,而且已经存在多年了。您可以在许多流行的应用程序中找到机器翻译系统,并且有提供机器翻译服务的在线服务。然而,现有的服务与正在开发的使用神经网络的系统之间存在显着差异。
您现在发现的大多数系统都是统计机器翻译。他们使用算法和统计模型来对短语的正确翻译做出最佳猜测。它可以很好地处理简短的短语,但当它被要求翻译较长的样本时,例如电子学习翻译的整个数字教科书,它就达到了极限。结果可能是任何东西,从非常准确的解释到完全乱码的翻译。
神经机器翻译代表了一种与使用统计机器翻译的旧系统截然不同的方法。通过 NMT 系统,神经网络经过训练和优化以执行翻译服务。
这些系统使用深度学习来分析人工翻译人员已经完成的大量翻译。通过分析这个大型数据集,它可以解释整个句子,理解上下文和不同的变化,并处理无法编程到基于统计的模型中的语言微妙之处。最终的结果是一个更加流畅和自然的机器翻译系统。
神经网络如何工作?
为机器提供这种学习能力的关键是神经网络。这是一种旨在模仿人脑运作的计算技术。在大脑中,神经通路在我们学习时形成。如果这条途径有用且有益,它就会变得更强。如果它不能提供正确的结果,它就会变得更弱。
神经网络背后的想法是模拟大脑中神经通路的互连性质。通过这种设计,计算机可以像人脑一样学习、识别模式并做出决策。
人工神经网络通过具有数十到数百万个称为单元的人工神经元来模拟这种结构。这些单元分层排列。一方面,您拥有旨在接收信息的输入单元。另一方面,您有输出单元,用于发出对所学信息的响应信号。
在输入单元和输出单元的层之间有隐藏单元。这些层构成了神经网络的大部分,也用于形成大部分连接。
神经网络中的每个连接都被赋予一个权重,以指示两个单元之间的连接强度。对于激励其他单元的连接,权重可以为正,对于抑制其他单元的行为的连接,权重可以为负。权重越高,连接中一个单元对另一个单元的影响力就越大。
神经网络通过将产生的输出与期望的输出进行比较来学习。信息在输入端馈送到系统。然后它会触发隐藏单元中的连接。这导致与输出端的连接。然后将网络实际产生的输出与期望的输出进行比较。然后根据产生的输出和期望输出之间的差异修改权重。
对于机器翻译,神经网络的结构使系统比基于规则和统计的系统更具适应性并且能够处理更复杂的模型。它还可以从中学习经验。如果它没有提供正确的输出,它会从错误中学习并做出调整,以便下次更有效地执行。
这对机器翻译意味着什么?
神经机器翻译仍然是一项新技术。尽管它还处于早期阶段,但它已经提供了优于最好的统计机器翻译系统的结果。也就是说,在神经机器翻译能够与熟练的人类翻译竞争之前,我们还有很长的路要走。
阅读:人工智能、机器学习、深度学习
神经机器翻译的进步不会来自一家公司。这将是不同组织和世界各地的研究人员取得多项进展的结果。随着技术的发展,NMT 将成为人类翻译的重要工具。随着对复杂翻译的需求不断增长,专业人员将使用这些系统在更短的时间内提供准确的翻译,这将有助于他们满足不断增长的需求。
工业技术