亿迅智能制造网
工业4.0先进制造技术信息网站!
首页 | 制造技术 | 制造设备 | 工业物联网 | 工业材料 | 设备保养维修 | 工业编程 |
home  MfgRobots >> 亿迅智能制造网 >  >> Manufacturing Technology >> 工业技术

新的玩扑克的 AI 可以摧毁许多在线公司——因此开发人员不会发布它

近十年来,人工智能(AI)取得了长足的进步。围棋和国际象棋等游戏已成为评估人工智能进展的标准方法。

到目前为止,几乎所有的人工智能模型都征服了清晰可见对手动作的两人游戏。另一方面,最流行的扑克形式涉及多个玩家,并结合了赌博、策略和技巧。

现在,Facebook 和卡内基梅隆大学的研究人员开发了一种 AI 机器人,可以使用策略设置智胜一整桌的扑克专业人士。这是第一个名为 Pluribus 的 AI 机器人,可以在六人游戏(无限注德州扑克)中击败人类专家,这是最流行的扑克形式。

Pluribus 与扑克专家(包括两名世界大赛冠军)进行了 5,000 手比赛,并果断获胜。 AI 能够采用令人印象深刻的策略(例如反押注)并像经验丰富的专业人士一样虚张声势。

事实上,它是如此成功,开发人员决定不发布它的代码,因为担心它会破坏在线扑克行业。算法太强大了,人类专家找不到任何可以利用的东西。

这是人工智能第一次在有两名或更多玩家的基准游戏中击败顶级职业选手。该团队多年来一直致力于这个项目。 2017 年,他们想出了一个能够玩一对一扑克的机器人。 Pluribus 是该机器人的复杂得多的版本。

Pluribus 不仅仅是蛮力计算

Pluribus 游戏计划的核心是通过自我对弈生成的:算法与自身的副本对战,并在确定哪些行动会带来更好的结果时逐渐改进。

参考:ScienceMag | DOI:10.1126/science.aay2400 |脸书人工智能

这种自我对弈的方式,离线生成了整个游戏的蓝图策略。然后在与人类的实际比赛中,人工智能通过搜索它在游戏中发现的类似情况的策略来实时改进策略。

Pluribus 的蓝图策略在 64 核处理器上训练期间逐渐改进

AI 由新的在线搜索算法组成,通过仅搜索有限的一组下一步而不是所有可能的动作来有效地计算其选项。它还为具有隐藏信息的游戏整合了更快的自我对弈算法。

这些算法一起使 Pluribus 能够在资源较少的功能较弱的计算机上进行训练。将这一点放在上下文中,它需要大约 150 美元的云计算资源来训练 Pluribus,而其他最近的人工智能突破模型需要价值数百万美元的计算资源来训练。

阅读:Speedgate |世界上第一个由人工智能发明的运动

用于征服扑克的算法也可以在其他领域实施,例如定价产品、交易和在繁忙的交通中为自动驾驶车辆安排路线。这些算法也可以用于在其他多人游戏中打败人类并开发更有趣的电脑游戏。


工业技术

  1. 我们真的能让流程工业净零吗?
  2. 新 AI 可以检测新闻来源是否准确或有政治偏见
  3. 新的智能手机算法可以准确诊断疾病
  4. 新 AI 可以将静止图像转换为 3D 动画
  5. 新型电子皮肤可以拥有类似人类的触觉
  6. 新型 DNA 计算机可以计算高达 900 的平方根
  7. 新型可弯曲超级电容器可在 10 分钟内为电动汽车充电
  8. 公司要注意:物联网设备是网络攻击的门户
  9. 公司在数字经济中求助于外部员工
  10. 供应链公司如何利用 AI 制定路线图
  11. 消费品公司如何浪费他们的数字支出
  12. 零售商如何减轻新运费附加费的影响