阿尔法狗之父揭秘最强“狗”如何炼成：3天走完人类千年棋史

小大

用微信扫描二维码
分享至好友和朋友圈

扫描到手机×

2017-10-19 08:17:54 中国青年网参与评论()人

伦敦当地时间10月18日18：00（北京时间19日01：00），谷歌旗下的DeepMind团队公布了进化后的最强版AlphaGo ，代号AlphaGo Zero。

新版本的AlphaGo究竟有多厉害？打败李世石的AlphaGo用了3000万盘比赛作为训练数据，AlphaGo Zero用了490万盘比赛数据。经过3天的训练，AlphaGo Zero就以100：0的比分完胜对阵李世石的那版AlphaGo。

DeepMind联合创始人兼CEO 、AlphaGo之父戴密斯？哈萨比斯（Demis Hassabis）和AlphaGo团队负责人大卫？席尔瓦（Dave Sliver）等人同时在官方博客上发表文章，详解最强版本阿尔法狗是如何炼成的，与前代有何不同。

哈萨比斯与学习大量人类棋谱起步的前代AlphaGo不同，AlphaGo Zero是从“婴儿般的白纸”开始，通过3天数百万盘自我对弈，走完了人类千年的围棋历史，并探索出了不少横空出世的招法。

哈萨比斯等人专文：《AlphaGo Zero：从零开始》

席尔瓦在乌镇人机峰会上发言从语音识别、图像分类到基因和药物研究，人工智能发展迅速。这些专家系统，很多是借用海量人类经验和数据开发出来的。

然而，在有些特定问题上，人类的知识要么过于昂贵，要么不靠谱，要么无法获得。因此，人工智能研究的一个长期目标就是跳过这一步，创造能在最有挑战性的领域，不用人类输入就达到超人水平的算法。我们发表在《自然》期刊上的最新论文，展示了实现该目标的关键一步。

论文介绍了首个战胜人类围棋冠军的电脑程序AlphaGo的最新进化版本：AlphaGo Zero。AlphaGo Zero更为强大，可以一争史上最强围棋手。

AlphaGo的前几代版本，一开始用上千盘人类业余和专业棋手的棋谱进行训练，学习如何下围棋。AlphaGo Zero则跳过了这个步骤，自我对弈学习下棋，完全从乱下开始。用这种方法，它很快超过了人类水平，对阵此前战胜人类冠军李世石的前代AlphaGo取得了100连胜。

AlphaGo Zero之所以能当自己的老师，是用了一种叫

强化学习的新模式。系统从一个对围棋一无所知的神经网络开始，将该神经网络和一个强力搜索算法结合，自我对弈。在对弈过程中，神经网络不断调整、升级，预测每一步落子和最终的胜利者。

12 全文共 2 页下一页

关闭

阿尔法狗之父揭秘最强“狗”如何炼成：3天走完人类千年棋史

相关报道:

为您推荐：

南京“最牛挖掘机”爬上5楼作业揭秘其如何“上楼”

小牛奔腾之涨停股揭秘：环保板块强势拉升多股涨停

3天9个孩子因贪玩走丢民警及时帮忙找回

近百对有情人体验摩梭婚俗泸沽湖畔千年文化传承有道

请假陪病狗被扣薪专家：动物是人类的家庭成员

千年古刹厦门南普陀寺培训义工服务社区

“支付王国”炼成记

浙江象山千年海涂变粮仓农业科技破“盐碱地改良”难题

近百名记忆达人合肥比拼脑力挑战人类极限

“新加坡规划之父”刘太格：雄安新区规划最好达50年

专家解读：建设雄安新区为何是千年大计、国家大事？

中华推荐

小编推荐

郑州一医院2天接收10位封控区产妇

厦门发布住房公积金政策调整优化套数认定与首付比例

秦牛正威与未婚夫分手：到此为止是最好的ending

今日热点

俄乌“斗气” 协议失效不续美国或将坐收渔利

泽连斯基称乌已找到应对俄导弹的解决方案

德国柏林发生持刀袭击事件致多人受伤

阿尔法狗之父揭秘最强“狗”如何炼成：3天走完人类千年棋史

相关报道:

为您推荐：

中华推荐

小编推荐

今日热点

俄乌“斗气” 协议失效不续 美国或将坐收渔利

泽连斯基称乌已找到应对俄导弹的解决方案

德国柏林发生持刀袭击事件 致多人受伤

俄乌“斗气” 协议失效不续美国或将坐收渔利

德国柏林发生持刀袭击事件致多人受伤