当前位置:新闻 > 滚动 > 正文

AI碾压星际争霸2:AI玩家在连续10局中反复击败人类(3)

2019-01-25 15:44:43  北晚新视觉    参与评论()人

AI的重大进步?

撇开这些不谈,专家们称这场比赛是AI向前迈出的重要一步。长期参与《星际争霸》AI场景的AI研究人员戴夫·丘吉尔(Dave Churchill)表示:“我认为AI取得了重大成就,至少比我在AI研究人员中听到的最乐观猜测提前了一年。”然而,邱吉尔补充说,由于DeepMind尚未发布任何关于这项工作的研究论文,因此很难说它是否显示出任何技术上的飞跃。他指出:“我还没有读过这篇博客文章,也没有接触过相关的论文或技术细节。”

佐治亚理工学院AI副教授马克·里德尔(Mark Riedl)表示,他对结果并不那么惊讶,AI获得胜利只是“时间问题”。里德尔补充说,他不认为这些比赛表明《星际争霸2》已经被AI彻底掌控。他表示:“在上一场直播比赛中,限制AlphaStar的某些能力确实消除了它的许多人为优势。但我们看到的更大的问题是,当人们可以把AI推出舒适区时,它就会崩溃。”

丹麦哥本哈根信息技术大学的塞巴斯蒂安·里斯(Sebastian Risi)表示:“这看起来是向前迈出的一大步。我们不知道这其间有多少创新,但培训AI的方式似乎是关键。”里斯的同事尼尔斯·贾斯特森(Niels Justesen)说:“我没想到会发生这样的事情,尤其是因为之前的端到端学习《星际争霸》的尝试远远没有达到人类的水平。”

残酷的强化学习AI竞技场

最终,这类工作的最终目标不是利用AI在视频游戏中击败人类,而是改进AI的训练方法,尤其是为了创建能够在《星际争霸》等复杂虚拟环境中运行的系统。

为了训练AlphaStar,DeepMind的研究人员使用了被称为强化学习的方法。AI智能体基本上是通过反复尝试才能达到某些目标,比如赢球或者仅仅是生存下去。它们首先通过模仿人类玩家来学习,然后在类似竞技比赛中相互对决。最强的AI会存活下来,最弱的则被淘汰。DeepMind估计,其每个AlphaStar智能体都以这种方式积累了大约200年的游戏时间,游戏速度也在加快。

关键词:

相关报道:

    关闭
     

    相关新闻