夜狼猎奇网(www.goyelang.net)- 给你图文的世界

李世石首战阿尔法狗告败 AlphaGo究竟是什么

来源:夜狼猎奇网 | 2016-09-07 |    

猎奇网:围棋从未像现在这样得到来自棋界内外、横跨体育界科技界的全球瞩目。人机大战才比了第一场,但好多人似乎觉得已成定局。因为李世石开局第一盘就输了,人类输给了机器。...

围棋从未像现在这样得到来自棋界内外、横跨体育界科技界的全球瞩目。人机大战才比了第一场,但好多人似乎觉得已成定局。因为李世石开局第一盘就输了,人类输给了机器。

记得当年输给深蓝,我们喊过人类还有围棋,这次李世石如果失败,是不是就意味着人类在象征大脑发育水平的棋类运动里,从此再无与机器人抗衡的优势了呢?

一、李世石是怎么输的?

让我们先复盘下,李世石是如何失掉这至关重要的首局。

AlphaGo的长处在于学习前人经验和计算,正如李世石判断的一样,布局是相对的短板,这也是李世石选择执黑先行的原因。

下到第7手,李世石九段把起黑子放在了一个棋盘右下侧出乎所有人意料的位置,既不守,又不攻。中国围棋九段选手柯洁把这一招定义为“从没有见过的邪恶招法”,而古力九段也表示这一招从未在职业选手中出现过。你AlphaGo不是经验丰富、阅棋无数吗?下个你没见过的,看你学谁去。

然而这里,AlphaGo似乎并没有接茬,而是继续稳扎稳打,专攻右上角。

而AlphaGo怎么想的呢?

AlphaGo是用两个大脑去决策的,第一个大脑叫落子选择器Move Picker,即“监督学习的策略网络(Policy Network)” ,它会预测每一个合法下一步的最佳概率,给出候选走子。这里的最佳目标不是数学意义上的赢棋,而是怎么下出符合人类高手选择的落子,简单说就是下得像个人样。

第二大脑是局面评估器Position Evaluator,即价值网络(Value Network),学习大量棋谱后,它自我强化学习,通过“左右互搏”来学习判断局势,让从AlphaGo候选中做出决策。

事后,我们能看出这里两者预期的误差,李世石试图以经验去扰乱机器,而AlphaGo的智能之处在于它不是简单的数据库调取方案,而是智能模仿人类行为,反而让李世石的“邪恶招法”显得多余。

到第27子后,刚刚进入中盘,到了这个阶段,李世石还是占有一些优势,但李世石陷入了思考。

有趣的是白棋的第84手,居然下出了从未见过的下法,韩国金成龙九段表示:“成为职业棋手27年来,第一次看到白断这手棋!”李世石看到这步棋,摇了摇头。

那么问题来了,既然 AlphaGo 是跟别人学的棋谱,那么这招是和谁学的?连Google作者表示连他也不知道。作者设置了机制,但并不知道这个机制具体如何运作学习。#AI对人类目前来说,还是一只尚不了解的怪兽#

最后官子阶段AlphaGo开始展现恐怖之处。

“明明之前是我的优势,但在最后的官子阶段,却被他一步一步蚕食,最后输的却是我。”AlphaGo的上一个对手樊麾二段就感受过,“AlphaGo用同样的方式蹂躏了我五盘,只要犯哪怕一个错误,就会被穷追猛打,最后万劫不复。”

可惜的是李世石也犯了错,还是两个。挣扎了一个小时,局势仍然不可逆转。

下午3点33分,李世石投子认输,AlphaGo获胜。

留下李世石一个人坐在棋局前复盘。开赛前,李不止一次的对媒体表示,“除非出现不可理喻的低级失误,我绝不会输,尤其是第一局。”但两三个小时后,李世石只得重新再试图去认识他的对手,虽然了解或许也是徒劳。

(转载请标注出处:夜狼猎奇网 www.goyelang.net)

相关推荐

退避三舍的主人公是谁?晋文公带领晋国成为霸主 退避三舍的主人公是谁?晋文

在春秋战国时期,晋国的重耳成功跑到了楚国。楚王对重耳很好,当做贵宾招待。重耳很感恩就告诉楚国等以后我重掌大权的时候,如果楚晋两...

 

编辑推荐

特别头条