目前 OpenAI Five 还只能在有限条件下打 Dota 2。 OpenAI Five 不随机从115个可用英雄中选择,而是限定了5个英雄,因为每个英雄都有自己的特点。 他们的选择是:Necrophos、Sniper、Viper、Crystal Maiden、Lich。
一些决策过程是硬编码的,比如在商店买哪些物品,以及选择用游戏积累的经验值提高哪些技能。此外,游戏中一些决策棘手的操作也被禁用,比如隐形和召唤。这些技能可以让玩家拥有观察远方的功能,就像有一个远程相机,几乎是高级游戏玩家必备。
尽管如此,OpenAI Five 继承了计算机的优势,反应时间比人类短,不会错过点击,可以即时和精确地获取数据,如物品清单、英雄的健康状况以及地图上物体之间的距离。而人类玩家必须手动检查或者凭本能判断。
OpenAI Five 通过与自己的不同版本对战来学习游戏战略。随着时间推进,程序习得的战略与人类玩家所使用的战略很类似,比如通过 “打钱” 找到获取金钱的方法,以及采用游戏中特定的战略角色,并学习如何分路,Gank 和支援队友等策略。
人工智能专家表示,这一成就意义重大。匹兹堡卡内基梅隆大学的研究员 Noam Brown 说:“ Dota2 是一个极其复杂的游戏,能打败强大的业余玩家就已经很不容易了,而且, 处理 Dota2 这种大型游戏中的隐藏信息是一个很大的挑战。”
Brown 之前研究过一种玩扑克的算法,扑克是另一种非完整信息博弈游戏,玩家需要有高超的技巧。Brown 说,如果 OpenAI 五人组能够一直打败人类,那将是人工智能的一个重大成就。然而,他也指出,只要有足够的时间,人类可能就会找出人工智能团队的游戏风格弱点。
Brown 说,其他游戏也可以进一步推动人工智能。“下一个重大挑战将是涉及到交流的游戏,例如《强权外交》和《卡坦岛》,在这些游戏里,玩家需要平衡合作与竞争才能胜利。”
网友评论