易造欢迎您 咨询电话:021-63900077 关于我们
供应商注册 登录
个人中心 账户设置 退出登录

易造机器人

  • 首页
  • 方案
  • 一站式
  • 商城
  • 品牌
  • 资讯
  • 金融
最近搜索
易造机器人网 > 行业新闻 >人工智能再次战胜人类玩家

人工智能再次战胜人类玩家

时间:2022-12-06 16:51:46 来源: 中国科学报

       下棋、玩游戏,在与人类的博弈中,人工智能(AI)正在不断成长。近日,英国DeepMind公司的AI智能体DeepNash,就在西洋陆军棋(Stratego)中达到了专业级人类玩家的水平。该成果12月1日发表于《科学》。

 

  事实上,在DeepNash攻克Stratego前,就有报道称AI能够玩“强权外交”这款类似的经典桌游。这是一款具有外交深度的游戏,玩家间存在合作与竞争关系,必要时须通过谈判结交盟友。

 

  “近年来,AI掌握本质不同的游戏的速度相当惊人。”美国密歇根大学计算机科学家Michael Wellman表示,Stratego和“强权外交”这两款游戏大不相同,但它们都极具挑战性,与此前AI已经掌握的游戏也截然不同。


微信图片_20220621140925
 

  Stratego是一款需在信息缺失情况下进行战略思考的棋盘游戏,类似于中国的军棋。它要比此前AI掌握的国际象棋、围棋或扑克复杂得多。

 

  在游戏中,双方各有40枚棋子,且彼此看不到棋子的真实“身份”。双方轮流移动棋子,来消灭对手的棋子,最终夺得对方军旗或消灭所有能动的棋子的一方获胜。因此,玩家需要进行战略部署、收集信息,并与对方博弈。

 

  一局Stratego游戏中会有10535种可能的布局。相比之下,围棋的布局有10360种可能。此外,在Stratego中,AI需要推理对手超过1066种部署策略,这使德州扑克中初始的106种可能情况相形见绌。

 

  “Stratego中可能出现的结果数量之多及其复杂性,意味着在信息完全的游戏中表现出色的算法,甚至在扑克游戏中表现良好的算法,在这款游戏中都不起作用。”DeepMind研究员Julien Perolat说。

 

  所以Perolat和同事开发了DeepNash,该命名致敬了提出纳什均衡的美国数学家约翰·纳什。

 

  纳什均衡是博弈论中一种解的概念,指满足以下条件的策略组合:任何一位玩家在此策略组合下单方面改变自己的策略(其他玩家策略不变),都不会提高自身的收益。

 

  DeepNash将强化学习算法与深度神经网络相结合,以找到纳什均衡。强化学习包括为游戏的每个状态找到最佳策略。为了学习最佳策略,DeepNash已经与自己进行了55亿次博弈。

 

  今年4月,DeepNash在网络游戏平台Gravon上与人类Stratego玩家进行了两周的比赛。在50场比赛后,DeepNash目前在所有Gravon Stratego玩家中排名第三。

 

  “我们的研究表明,像Stratego这样复杂的涉及不完善信息的游戏,不需要通过搜索技术来解决。”团队成员、DeepMind研究员Karl Tuyls表示,“这是AI迈出的一大步。”

 

  而曾于2019年报告了玩扑克的AI——Pluribus的meta AI研究员Noam Brown团队,则将目光投向了一个不同的挑战:建立一个可以玩“强权外交”的AI。

 

  “强权外交”是一个最多可由7位玩家参与的游戏,每位玩家代表第一次世界大战前欧洲的主要力量,游戏目标是通过移动部队控制供应中心。重要的是,该游戏需要玩家间进行私人交流和合作,而不是像围棋或Stratego那样进行双人博弈。

 

  “当进行超过两人的零和博弈时,纳什均衡思想对游戏就不再有用了。”Brown说,他们成功训练出了AI——Cicero。在11月22日发表于《科学》的论文中,该团队报告称,在40场游戏中,“Cicero的平均得分是人类玩家的两倍多,在玩过一场以上游戏的参与者中排名前10%”。

 

  Brown认为,可以与人类互动并解释次优甚至非理性人类行为的游戏AI,可以为其在现实世界的应用铺平道路。(徐锐)

 

  相关论文信息:

 

  https://doi.org/10.1126/science.add4679




声明:凡资讯来源注明为其他媒体来源的信息,均为转载自其他媒体,并不代表本网站赞同其观点,也不代表本网站对其真实性负责。您若对该文章内容有任何疑问或质疑,请立即与易造机器人网(www.ez-robot.cn)联系,本网站将迅速给您回应并做处理。

电话:021-63900077


更多推荐内容

  • CES成了机器人大舞台:陪伴、协作与人形共舞,要彻底爆发了?
  • CES成了机器人大舞台:陪伴、协作与人形共舞,要彻底爆发了?
  • 官方:将在人工智能等领域再推一批市场准入特别措施
  • 软件业加速拥抱人工智能
  • 我国在人工智能领域持续发力 政策“组合拳”有力支持人工智能产业发展
  • 打造人工智能科技盛宴!2024首届人工智能先进技术成果供需对接大会成果展举行

标签

  • 人工智能

热门资讯

  • 精业锐志,极致创新!ITES深圳工业展助力制造业开年起步即冲刺!

    在全球制造业新旧动能加速迭代与融合的趋势下,今年1月全球制造业延续了去年

  • 精业锐志,极致创新!ITES深圳工业展助力制造业开年起步即冲刺!
  • 比亚迪/广汽丰田/富士康/大疆确认参观,ITES品牌终端买家名单发布!
  • 迈瑞/开立/格力/美的...确认参观,ITES品牌终端买家名单|第二批
  • 中国首发,新品炸场!来ITES见证一场无声的科技跃迁
  • 2025 ITES深圳工业展 展商名录公布!顶尖工业品牌与你鹏城相见

专家专栏

  • 何宝宏 : 何宝宏:人工智能开始从学习走向创造

    目前人工智能(AI)开始从学习走向创造,数字化转型的终点是数字原生,未来

  • 聂鹏举 : 全国人大代表聂鹏举:建议扶持工业机器人核心零部件产业
  • 孙丕恕 : 全国人大代表孙丕恕:算力、数据、算法是中国“新基建”的基础支撑
  • 谭建荣 : 「人物特写」工程院院士谭建荣:马云不是制造业的杀手,工业机器人也不是救命良药
  • 李开复 : 李开复:机器人应以实用为主,人形机器人难以盛行于世
  • 孙建波 : 银河证券孙建波:工业机器人是企业未来发展布局的重中之重

企业介绍

  • 纬探传感技术(上海)有限公司

    纬探传感是一家致力于工业自动化,提供传感器及元器件产品、技术服务和成套控

  • 丹因碧克机器人科技(上海)有限公司

    丹因碧克是一家专注于机器人力控应用解决方案的公司,由日本WACOH-TE

  • 浩科机器人(苏州)有限公司

    浩科机器人(苏州)有限公司是一家专注于机器人本体研发及应用的高科技企业。

  • 关于我们

    • 首页 商城
    • 品牌 方案
    • 资讯 一站式
    • 金融 我们
  • 服务支持

    • 服务条款
    • 隐私权政策
  • 联系我们

    • info@ez-robot.cn
    • 021-63900077
    • 周一到周五 09:00-18:00
  • 合作伙伴

    • 硬蛋网
    • 科通芯城
    • 科姆特
    • 工业自动化展会
    • 郑州工博会
    • 山东国际会展中心
  • 关注我们

    • 微信号:易造机器人网
公司地址:上海市黄浦区打浦路15号中港汇•黄浦2701-2702室
Copyright©. All Rights Reserved. 粤ICP备19093622号-1