AI 可以在几秒钟内解决魔方,无需任何特定领域知识
- 名为 DeepCubeA 的全新深度强化学习方法可以在几秒钟内解出魔方。
- 深度学习模型可以应用于其他各个领域,包括机器人和自然科学。
人工智能 (AI) 已经在国际象棋和围棋中被证明是成功的,但像魔方这样更难的谜题还没有通过机器智能解决。这是一个经典的组合难题,为机器学习带来了独特而有趣的挑战。
虽然机器学习技术以前曾被用于解决魔方,但它们未能有效、可靠地解决这个难题。此外,这些技术不得不依赖于特定的领域知识。现在,加州大学欧文分校的研究人员构建了一种名为 DeepCubeA 的深度强化学习方法,无需任何特定领域知识即可解决极其复杂的难题。它可以在几秒钟内解决魔方,无需人类在游戏中进行指导。
随着维度的增加,底层组合难题的复杂性急剧增加。例如,在传统计算机上找到 15 个难题的最佳解决方案只需几分之一秒,而在同一台机器上找到 24 个难题的最佳解决方案可能需要数天时间。
在这项研究中,研究人员试图开发一种机器学习模型,该模型可以学习如何在不依赖特定领域的人类知识的情况下解决各种难题。他们结合了三种最先进的方法来开发 DeepCubeA –
- 深度学习
- 经典强化(近似值迭代)
- 寻路方法(权重 A* 搜索)
它由深度强化学习算法组成,该算法使用策略和价值函数结合蒙特卡洛树搜索来求解魔方。
研究人员使用 TensorFlow 深度学习框架来训练网络——它接受了大约 100 亿次打乱和完成拼图的模拟训练。整个过程进行了大约 1,000,000 次迭代,耗时 36 小时。
参考:自然 | DOI:10.1038/s42256-019-0070-z | UCI |在线演示
经过训练后,DeepCubeA 在每个测试配置中都能达到 100% 的准确率,找到到达最终状态的最短路径的概率为 60.3%。
DeepCubeA 使用启发式函数,它从不高估最短路径的成本。加权 A* 搜索对解长度与最优解的长度相差多少有一定的界限。
组合谜题之外的应用
研究团队还对 DeepCubeA 进行了其他拼图的培训,包括 24 拼图、熄灯和推箱子。它能够在大多数可验证的情况下找到最短路径。
研究的最终目标 [像这样一个] 是开发下一代深度学习模型,这些模型可以应用于组合难题以外的领域,从机器人技术到自然科学。
我们已经每天通过搜索引擎和应用程序(例如 Alexa 和 Siri)与 AI 进行交互。然而,这些系统并不是真正智能:它们很容易被操纵或愚弄。
阅读:新的玩扑克 AI 可以摧毁许多在线公司——因此开发人员不会发布它
我们需要构建更强大、更智能且能够理解、推理和规划的人工智能。这项研究是朝着这个宏伟目标迈出的一小步。
工业技术