AI 可以阅读研究论文并提供简单的英文摘要
- 研究人员基于以前未曾探索过的想法——旋转——开发了一种新的神经网络。
- 它可以替代现有方法来解决现实世界中的问题,例如文本摘要、语言建模和问答。
一篇研究论文通常充满了专门的方法和技术术语,这使得没有科学背景的读者很难理解。
最近,麻省理工学院和卡塔尔计算研究所的科学家提出了一种新的人工智能 (AI) 模型,该模型可以阅读科学期刊并用几句话提供简单的英文摘要。
虽然它产生的结果比以前的技术好得多,但它肯定不能取代科学作家和编辑。但是,这种 AI 可以帮助作者浏览大量期刊并了解它们的内容。
研究团队最初试图开发神经网络来解决某些物理问题,例如光在复杂的工程材料中的表现。
他们很快意识到,可以使用相同的方法以比现有机器学习方法更有效的方式处理其他复杂的计算任务,例如语音识别和自然语言解释。
他们实际上做了什么?
在过去的几年中,循环神经网络 (RNN) 已成为一种标准的人工神经网络,可用于处理从语言建模到文本摘要和开发聊天机器人系统的广泛任务。
已经开发了各种技术来提高从一长串数据中关联信息的能力。最受欢迎的是长短期记忆 (LSTM) 和门控循环单元 (GRU)。但是他们仍然没有表现出令人印象深刻的记忆能力或对合成任务的有效回忆。
这就是为什么研究人员开发了一种称为旋转记忆单元 (RUM) 的替代方法。与传统的基于矩阵乘法的神经网络不同,RUM 是基于在多维空间中旋转的向量。
参考:麻省理工学院出版社期刊 | doi:10.1162/tacl_a_00258 |麻省理工学院
它使用多维空间中的向量(指向特定方向的某条线)来表示文本中的每个单词。每个连续的单词都将向量转向理论空间中的特定方向,该空间可能包含数千个维度。然后将得到的向量(或一组向量)转换回其关联的词串。
总的来说,RUM 做两件事:它记住复杂的顺序动态和准确地回忆信息。它还显示出在字符级语言建模和问答方面的良好性能。
测试
研究人员在大量科学论文(包括他们自己描述这些发现的论文)上测试了该系统,并将结果与基于 LSTM 和 GRU 的传统神经网络进行了比较。
RUM 不仅仅是扫描摘要,而是阅读整篇论文以生成其内容的简单摘要。该系统呈现的摘要包含较少的技术术语和重复词。虽不是文笔优美,但确实抓住了数据的关键点。
阅读:人工智能写出自己的类似于莎士比亚作品的诗歌
您可以在自己的任务中试用该系统:代码和演示可在 GitHub 上找到。
工业技术