AI 和理解语义——NLP 发展的下一个阶段即将到来
人工智能接近于理解语义作为其进化的下一步
AI 是用词不当,或者经常有人建议它。第一个字母——人造的——大约是对的。至于第二个词——嗯,它没有什么聪明之处。以语义学为例,人工技术理解句子、段落和书籍的含义,没有什么远程智能,或者其他,原因很简单,它一直不擅长。
但这会改变吗?最近,我们采访了法律科技公司 InCloudCounsel 的机器学习主管 Hadayat Seddiqi。他认为,人工智能即将达到对语义的理解,这是其进化的下一步。我们问:“我们什么时候可能达到这个里程碑?”
搜索引擎优化:如果你是一个作家,以你的写作为荣,用你的词汇来表达一个想法而不重复,那么你可能讨厌搜索引擎优化。如果你喜欢提出一个复杂的论点,那只能用一句话、一章、一篇文章甚至一本书来表达,那么 SEO,因为它会让你把论点变成两三个或四个词,比如AI和理解语义,是敌人。 (看看我们做了什么,那里?)
如果搜索,使用人工智能来理解语义(我们又来了)可以创建基于更复杂的搜索结果 - 如果你愿意 - 智能 - 理解,消除繁琐重复的需要,那不是很好!
事实上,到 2025 年,自然语言处理市场预计将达到 223 亿美元——这说明了该技术已经走了多远,尤其是在我们如何沟通和开展业务方面。
目前,这些技术在组织内用于各种目的,包括监测品牌声誉以确定情绪分析,通过关键字匹配或语义消歧提供有关广告展示位置的见解,甚至可用于法规遵从性以确保产品不不要成为一种责任。
在这种情况下,人工智能彻底改变行业和确定关键业务洞察力的真正力量在于其阅读文本和理解语义(或单词之间的关系)以帮助组织进一步降低风险和发现责任的能力。这反过来又为自然语言处理创造了巨大的价值。
那么,在人工智能能够理解语义的故事中,它的下一步发展是什么?我们什么时候可能达到这个里程碑?
Seddiqi 说:“在 AI 中实现语义理解将需要几个关键的里程碑。从导致我们在 AI 中理解语义的迭代进展以及每个里程碑的含义的角度来思考是很有帮助的。”
“之前的一个里程碑,”Seddiqi 说的是词向量:“让我们根据大多数人熟悉的常见用例来构建这个里程碑:计算机上的搜索功能。每个人都使用 Ctrl+F/Command+F 在他们的系统上查找内容,通过精确匹配关键字来找到您要查找的内容。此外,使用谷歌等搜索引擎查找信息将包括一个“拼写检查”组件来解决潜在的拼写错误。
“但是那些看起来非常不同但意思相似的词呢?大约在 2013 年,人工智能社区找到了一种有效的方法来对此进行建模,称为“词向量”。你可以做一些有趣的单词代数,比如 King + Woman 会给你 Queen。更实际的是,您现在可以扩展搜索范围以包含语义相关的词。”
人工智能理解语义即将到来的里程碑
“词向量改变了游戏规则,但它们仍然需要你用一个或几个关键词来表达你的想法。但是如果你的想法需要一个完整的句子来表达呢?这是下一个里程碑,得益于去年大力推动的研究,我们正在实现这一目标。
“这个想法是,你可以取一个句子,将其编码成一个句子(或思想)向量,然后找到相似的句子向量。如果编码得当,您的搜索功能可以找到表达相同想法的截然不同的句子。
“根据目前的研究进展,说这项技术将在未来几年内成熟并不是没有道理的。
未来里程碑:超越句子的 AI 理解
“在这项技术的发展过程中,出现了一种清晰的层次结构模式。我们使用单词级别的类似技术并将其扩大到句子级别,从而接近 AI 理解想法。这为 AI 理解需要段落、整个文档甚至整本书的想法开辟了令人兴奋的应用。
“人工智能最近从单词理解句子的飞跃并非微不足道,因为这样做的能力在很大程度上受到数据集大小和计算能力的限制。到目前为止,我们创建模型来处理这些更大问题的能力已被证明取决于这两个资源限制。
“随着这些成本因人工智能硬件的进步而下降,我们将看到自己越来越接近能够理解更多文本集合的模型。 Open AI 的 GPT-2 模型在一定程度上证明了这一点,该模型表明,使用具有大量数据的相同句子编码模型设计,生成的模型已经理解了许多句子的高级概念。例如,GPT-2 的理解力足以以惊人的连贯性写出整篇新闻文章。
自动化控制系统