4子这样的方式击败职业棋手。
并且,如果造出来的智能下不过自己,这件事情属实没什么意思。
“你们目前的想法和策略大概是什么样的。”大概聊了一些情况之后,孟繁岐将话题切入了具体的算法部分。
从理论上来说,围棋问题的输入和孟繁岐非常擅长的图像类其实很像。
彩色图片在计算机中的形式就是多通道矩阵,通常为3通道,代表三原色。
比如,一张分辨率为224x224的图片,就是以三个[224,224]矩阵的形式进行存储。
一般来说,每个位置的取值在0~255之间。
对于围棋这个情况来说,它的输入就像是一个19x19的单通道图片。
19x19表示棋盘上所有的落子地点,而每个地点的取值就只有三种状态,黑,白,无子。
可以用[-1,0,1]三个数字来指代。
而围棋智能的目标,所谓的下棋。
如果不考虑其中原理的话,它的外在反馈其实就是给定这样一个[19,19]的棋盘,希望程序可以在上面仅改变一个无子的数字0到给定的棋子类型(数字-1或者1),同时使得该方获胜的概率尽可能地变大。
“棋盘就是一副黑白的单通道分辨率为19的图像。”这个事情在普通人看来比较不会想到。
不过对于比较熟悉图像技术和深度神经网络的孟繁岐来说,是很自然的事情和概念。
“我们从深度神经网络的突破中获得了灵感,在2012年底的AlexNet之前,疯狂石头这款围棋智能提供的准确率是最高的,达到35%左右。
目前主要是在研究,如何使用深度神经网络使得围棋智能的判断更加精准。
Alex和你引领的深度神经网络在分类问题上有了惊人的突破,这是我们今年启动这个项目的一大原因。
我们目前在尝试收集大量的专业对弈棋谱,目前已经有了十多万场比赛的内容。而从这十万多场比赛当中,又可以抽离出上百万个单次落子。
通过这个数据,我们现阶段在确立合适的网络结构,在这个方面,我想你是专家中的专家。”
“我大概了解了。”孟繁岐听完之后基本明白了DeepMind现阶段的想法和进展情况。
虽然此前黄博士在围棋AI项目上有过很多研究,但阿尔法围棋项目毕竟才刚刚开始,同时也是基于全新的深度