阿尔法狗之父揭秘最强“狗”如何炼成：3天走完人类千年棋史

小大

用微信扫描二维码
分享至好友和朋友圈

扫描到手机×

2017-10-19 08:17:54 中国青年网参与评论()人

升级后的神经网络与搜索网络结合成一个更强的新版本AlphaGo Zero，如此往复循环。每过一轮，系统的表现就提高了一点点，自我对弈的质量也提高了一点点。神经网络越来越准确，AlphaGo Zero的版本也越来越强。

这种技术比此前所有版本的AlphaGo都更为强大。这是因为，它不再受到人类知识的限制，而能够从婴儿般的白纸状态，直接向世界上最强大的棋手——AlphaGo本身学起。

AlphaGo Zero相较前代还有几点明显的差别：

首先，AlphaGo Zero仅用棋盘上的黑白子作为输入，而前代则包括了小部分人工设计的特征输入。

其次，AlphaGo Zero仅用了单一的神经网络。在此前的版本中，AlphaGo用到了“策略网络”来选择下一步棋的走法，以及使用“价值网络”来预测每一步棋后的赢家。而在新的版本中，这两个神经网络合二为一，从而让它能得到更高效的训练和评估。

第三，AlphaGo Zero并不使用快速、随机的走子方法。在此前的版本中，AlphaGo用的是快速走子方法，来预测哪个玩家会从当前的局面中赢得比赛。相反，新版本依靠的是其高质量的神经网络来评估下棋的局势。

所有这些差异，都提高了系统的表现，使其更为普适。不过，是算法上的变化使得系统更为强大和高效。

仅仅自我对弈3天后，AlphaGo Zero就以100：0完胜了此前击败世界冠军李世石的AlphaGo版本。自我对弈40天后，AlphaGo Zero变得更为强大，超过了此前击败当今第一人柯洁的“大师”版AlphaGo。

通过数百万次自我对弈，AlphaGo从零开始掌握了围棋，在短短几天内就积累起了人类几千年才有的知识。AlphaGo Zero也发现了新的知识，发展出打破常规的策略和新招，与它在对战李世石和柯洁时创造的那些交相辉映，却又更胜一筹。

这些创造性的时刻给了我们信心：人工智能会成为人类智慧的增强器，帮助我们解决人类正在面临的一些严峻挑战。

尽管才刚刚发展起来，AlphaGo Zero已经走出了通向上述目标的关键一步。如果类似的技术可以应用在其他结构性问题，比如蛋白质折叠、减少能耗和寻找新材料上，就能创造出有益于社会的突破。

关闭

阿尔法狗之父揭秘最强“狗”如何炼成：3天走完人类千年棋史

相关报道:

为您推荐：

南京“最牛挖掘机”爬上5楼作业揭秘其如何“上楼”

小牛奔腾之涨停股揭秘：环保板块强势拉升多股涨停

3天9个孩子因贪玩走丢民警及时帮忙找回

近百对有情人体验摩梭婚俗泸沽湖畔千年文化传承有道

请假陪病狗被扣薪专家：动物是人类的家庭成员

千年古刹厦门南普陀寺培训义工服务社区

“支付王国”炼成记

浙江象山千年海涂变粮仓农业科技破“盐碱地改良”难题

近百名记忆达人合肥比拼脑力挑战人类极限

“新加坡规划之父”刘太格：雄安新区规划最好达50年

专家解读：建设雄安新区为何是千年大计、国家大事？

中华推荐

小编推荐

郑州一医院2天接收10位封控区产妇

地面塌陷该如何自救与逃生突发灾害应对指南

阿信回应五月天的音乐越来越商业化：时代已经改变

故宫的宫和殿有什么区别？国事曰殿，家事曰宫

今日热点

3-1力克日本！国羽重夺尤伯杯冠军

台湾花莲连发2次地震：物品摇晃不止管道破裂崩水

美媒：FBI将搜查美前副总统彭斯住所寻找机密文件

叙利亚拒绝接受禁止化学武器组织涉叙报告

日本通过确保防卫费财政来源的特别措施法案

阿尔法狗之父揭秘最强“狗”如何炼成：3天走完人类千年棋史

相关报道:

为您推荐：

中华推荐

小编推荐

今日热点

3-1力克日本！国羽重夺尤伯杯冠军

台湾花莲连发2次地震：物品摇晃不止 管道破裂崩水

美媒：FBI将搜查美前副总统彭斯住所 寻找机密文件

叙利亚拒绝接受禁止化学武器组织涉叙报告

日本通过确保防卫费财政来源的特别措施法案

台湾花莲连发2次地震：物品摇晃不止管道破裂崩水

美媒：FBI将搜查美前副总统彭斯住所寻找机密文件