梅宏院士揭秘阿尔法狗的下棋思路

         众所周知,阿尔法狗已经横扫人类所有的围棋顶尖高手,但是,它究竟是怎么做到的?你知道吗?

 

下面让我们来看看中国科学院院士、全国信息技术标准化委员会大数据标准工作组组长、知名战略科学家梅宏,在《中国经济大讲堂》节目中是怎么说的吧:

 

阿尔法狗怎么做的?

 

每一个棋,不管是中国象棋、国际象棋甚至我们的五子棋都有一个规则,而且有一个输赢的标准。所以有这个东西我们实际上是可以建立规则,马走日象走田一样。我们形成了一个搜索空间,我们过去的做法都是用计算机去完成的空间的搜索,找出最可能赢的这么一个套路。

 

这是过去的做法,按照这个套路计算机围棋赢几乎不可能。

 QQ图片20180315181726.jpg

 

换一个思路大家想想,围棋高手下棋,很多时候是棋感,对当时棋势的把握,棋局的把握。很多高手直觉一来,他就知道下一个棋该到那儿,这就是棋感。

 

这件事情捅破以后,计算机怎么做?相当于把围棋盘黑白子变为一个图片,那么这件事情恰恰是计算机最擅长的,做图像的匹配和识别。

 

所以就这么一个纸的捅破,把过去完全是用规则的方式,把它变为一个图像识别。我们做所有的智能,感知智能,我们人脸识别也好,指纹识别也好,再强大的人类高手,你要识别指纹都识别不过计算机。

 

首先,它是用的数据,这个数据就是人类不可能去想象出来。阿尔法狗用到的数据,三万多人类专业棋手对决的棋谱,三千万盘自我对弈的棋局。用人类的棋谱,打谱学习,然后自己又和自己下棋,最新版的阿尔法狗Zero,用了490万盘,自己和自己对弈。大家想想人类的棋手每年下多少?大概一千盘了不起,脑袋能记多少?再牛的人也记不了多少。                                      

QQ图片20180315181532.jpg

微软亚洲研究院郑宇等人总结的Alphago原理图

 

这个图像一存在,这么多幅同样的图像,差不多这个格局一出现的时候,这个图像计算机快速一比对,就知道从概率上,下一棋往哪儿走。

    

      可以预测,在围棋里面你再怎么样,人类已经不可能赢过计算机了。

 

QQ图片20180315173616.jpg

本文编辑:王洵

相关推荐