你只知道人类战胜了AI 却不知道两者差距在哪里

2016-11-24 10:37 爱棋道公众号

打印 放大 缩小

来源标题:你只知道人类战胜了AI 却不知道两者差距在哪里

11月23日,曾经的日本超一流棋手赵治勋九段,与新一代的人工智能围棋程序DeepZenGo的第三局决胜局比赛结束。

此局,赵治勋前辈执黑中盘获胜,从而以2:1的比分取得了三番棋的胜利。

纵观这这次的三番棋比赛,我们还是能得到很多有用的信息的。

在过去很多年里,Zen都是世界上最强的人工智能围棋程序。

而DeepZenGo,是在年初Deepmind发布了AlphaGo的相关论文后,Zen团队进行借鉴并引入深度神经网络后的新成果。

在引入了深度神经网络后,Zen和AlphaGo一样,也成为了集深度学习算法和蒙特卡洛算法二合一的第三代人工智能围棋程序。

由此,Zen升级为了DeepZenGo,棋力也大幅提升了4到5个子,从之前的业余5段水平一跃达到了普通职业棋手的水平。

这次比赛所选取的“测试员”——赵治勋九段,曾经是顶尖的超一流棋手,甚至曾在上世纪八九十年代屹立于世界围棋之巅。

但遗憾的是,再强大的王者也敌不过时间。

赵前辈年过花甲,棋力已经不如往昔。

所以这次比赛,原本被大家认为是一场势均力敌的比赛。

由一个刚刚达到普通职业水平的人工智能程序,对阵一位已经退化成普通职业水平的曾经的王者。

可从比赛的过程和结果来看,DeepZenGo的棋力还是明显的弱于赵治勋九段。

DeepZenGo延续了的Zen的特点有:

1. 喜好外势,并且擅长利用厚势在中腹作战,但对虚空的判断过于高估;

2. 长距离的直线计算不够稳定和准确,甚至会导致在关键时刻整块送死;

3. 死活和官子等局部封闭空间的处理能力极差,官子简直是漏洞百出。

DeepZenGo也有一些深度学习带来的、旧版本的Zen所没有的特点:

1. 布局和中盘的大局观极强,在局面不明朗时的大局选点极富“创造性”;

2. 中盘战斗能力很强,找寻局部战斗要点的准确度和稳定性较好;

3. 对对杀、打劫以及大规模攻防等复杂变化的处理能力不够稳定;

4. 对形势判断的能力欠佳,劣势时总是先过于乐观,然后忽然间极度悲观,也即胜率“断崖式跳水”;

5. 一旦出现胜率“断崖式跳水”,立刻开启“疯狗”模式,不断送吃,导致速败。

所有这些特点,其实都来自蒙特卡洛算法和深度学习算法的原理,但我们限于篇幅,不对专业内容进行过多展开。

DeepZenGo和AlphaGo,是用基本一致的框架搭建起来的人工智能围棋程序,但实力上显然还有较大差距。

笔者猜想,可能有如下原因:

1. 训练样本不足,自对弈也不足;

2. 训练使用的硬件条件不够好,比赛时用的硬件也不够好;

3. 在参数调试等细节上,Zen团队不如Deepmind团队处理的好。

之所以这么说,是因为深度学习模型无非由三个基本元素构成:

GPU阵列(硬件) + 深度学习算法 + 训练样本集

那么出现差距的因素,自然就在这三个基本元素之中。

当然,评价DeepZenGo,也不能只是一味的拿其跟AlphaGo相比较,只注意到两者的差距。

我们也应该注意到,在Zen团队的不懈努力下,DeepZenGo的实力较之其前任版本,出现了非常非常大的进步,简直是质的飞跃。

我们应该恭喜Zen团队,也要祝他们在前进道路上取得更大的进步!

责任编辑:刘宇坤(QS0006)

猜你喜欢