电子工程专辑
UBM China

打赢李世乭的分散式AlphaGo是什么鬼?还有单机版吗?

上网日期: 2016年03月12日 ?? 作者: T客邦 ?? 我来评论 字号:放大 | 缩小 分享到:sina weibo tencent weibo tencent weibo


打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮

1.扫描左侧二维码
2.点击右上角的分享按钮
3.选择分享给朋友

关键字:黄士杰? AlphaGo? 李世乭?

AlphaGo 首战击败韩国棋王李世乭,成为 9 日轰动科技界的大事。有人不免会拿漫画《棋魂》来做比较,一个在背后遥控人类的灵魂,指挥下赢了当代一等一的棋手。如果 AlphaGo 是佐为的话,那么,与李世乭实际对战的那位“阿光”人类棋手又是谁呢?答案揭晓:他是台湾师范大学资工博士,黄士杰

AlphaGo是佐为的话,那么“阿光”是谁?《电子工程专辑》

在第一场比赛,根据职业棋手认为,首战导致李世乭落败的原因并不在于 AlphaGo 的强大,而是他的轻敌。最明显表现是他的思考并不充分,所用的时间远远少于对手。

跟机器对战与跟人类对战的差异点在于,棋手原本会从现场对手的表现、下子的姿态来判断对方的心情、状况。但是与 AlphaGo对决,那个“人”只是一个替代电脑下子的工具。李世乭无法从这个棋手的表现来判断,只能从对方下子的策略来观察。

但是 AlphaGo 首战的水准漂浮不定,在比赛开始前期犯下了一些低级错误,但后来又有一些妙招,让李世乭难以判断对手下棋的方式,并且可能是这个开始的错误导致李世乭的轻敌。

不过,如果他能与这位“阿光”多谈谈,或许就能多了解 AlphaGo 的“个性”。因为这位坐在他对面的人类棋手黄士杰,其实不光只是一个人类傀儡而已,他也是负责打造 AlphaGo 大脑的团队核心人物之一。

▲ 之前 AlphaGo 击败欧洲欧洲围棋冠军樊麾(左)时,也是由黄士杰(右)担任人类棋手。《电子工程专辑》
▲ 之前 AlphaGo 击败欧洲欧洲围棋冠军樊麾(左)时,也是由黄士杰(右)担任人类棋手。

“深蓝”不是已经打败过国际象棋棋王了吗?围棋有什么难的?

有些网友说,早在多年前 IBM 的深蓝不是已经在 1997 年打败过棋王了吗?这次 AlphaGo 打败棋王又有什么大惊小怪?

问题是那次深蓝打败的是国际象棋的冠军,这次打败的是围棋冠军。围棋,被视为是目前难度最高的一项棋类比赛,难就难在围棋的变化高出国际象棋许多。因此击败人类的围棋冠军,一直是科学界发展人工智能的重要目标。

以复杂度来说:

· 国际象棋的复杂度为:10 的 123 次方。

· 中国象棋的复杂度为:10 的 150 次方。

· 日本将棋的复杂度为:10 的 226 次方。

· 围棋的复杂度为:10 的 360 次方。

棋类比赛基本上都是利用搜索树展开演算法,用搜索树来判断对手下子的可能性,然后依照一些资讯来进行优劣判断,再来从多种可能的结果选出最好的一步来下子。

▲ 西洋棋每走一步,有 24 种可能性。而围棋则每一步有 200 种,再算下去将无穷无尽。《电子工程专辑》

▲ 西洋棋每走一步,有 24 种可能性。而围棋则每一步有 200 种,再算下去将无穷无尽。《电子工程专辑》
▲ 西洋棋每走一步,有 24 种可能性。而围棋则每一步有 200 种,再算下去将无穷无尽。

在西洋棋里面,电脑的搜索树可以利用棋子的位置、棋子的数量来判断优劣,因此在树的展开可以依照每个棋局的局面来往下进行深度的搜索。但是围棋的逻辑性没有那么强,比较难得到判断的方式。甚至有时你问顶尖棋手为什么当时要下某一子的时候,他也只能回答你“灵光乍现”,这也是为什么科技人工智能这么想要在围棋上取得成果的原因。

黄士杰,一位热爱围棋的资工人

黄士杰是土生土长的台湾人,业余围棋六段,台湾师范大学资讯工程系硕士、台湾师范大学资讯工程系博士。他在 2002 年的硕士论文为“电脑围棋打劫的策略”,2010 年的博士论文为“应用于电脑围棋之蒙地卡罗树搜索法的新启发式演算法”。

他在这次比赛之后接受采访时表示:“Deepmind 应该是在 2014 年底之前、在 AlphaGo 团队出现之前就创建了。我本人喜欢下围棋,棋力是台湾业余六段,去年在德国的比赛我甚至赢过一位日本职业棋手。但 AlphaGo 肯定是比我强太多了。职业水准的围棋软件,应该最慢在 1-2 年之内就会在市面上普及。”

根据他在论文中表示,虽然电脑围棋的研究开始于 1970 年,但是围棋程序从未被人们认为是强大的。一直到 2006 年,当“蒙地卡罗树搜索”与“树状结构信赖上界法”出现之后,才带来了围棋程序的革命。

蒙地卡罗是一种大数法则的方法,使用随机取样,而不用把所有的可能都估算到。但是当取样的次数越多,其所得出的平均值将趋近于理论值。这个方式应用在围棋时,会随机下子直到盘末,由此依据各点模拟的结果,来对于盘面进行优劣的评估,从中选出最好的下子方式。

这个方法多少带有点运气,但是当取样数量越多的时候,误差会相对变低。2006 年,法国科学家以蒙地卡罗方式发展出的 Crazy Stone 在 第 11 届电脑奥林匹克 9×9 比赛中获得了冠军。

2006 年,法国科学家以蒙地卡罗方式发展出的 Crazy Stone 在 第 11 届电脑奥林匹克 9×9 比赛中获得了冠军。《电子工程专辑》

而“应用于电脑围棋之蒙地卡罗树搜索法的新启发式演算法”这篇博士论文的指导教授之一,正是 Crazy Stone 的那位法国开发者 Rémi Coulom 博士。而拿到了博士学位的黄士杰,之后也曾获 2012 年台湾电脑对局学会博士论文奖与 2010 年19 路电脑围棋金牌。

最后,值得一提的是,在这份 2010 年他才发布的博士论文摘要中,有这样一段话:

“虽然电脑围棋的研究开始于 1970 年,但是围棋程序从未被人们认为是强大的。一直到 2006 年,当“蒙地卡罗树搜索”与“树状结构信赖上界法”出现之后,才带来了围棋程序的革命。人们才开始相信,围棋程序在 10 年或者 20 年之后,将能够击败顶尖的人类棋手。”

现在,这份论文才发布不过 6 年的时间,他就亲手把自己的预言打破。

本文下一页:黄士杰:别攻击李世乭,打赢他的分散式AlphaGo很强!


1???2?下一页?最后一页





我来评论 - 打赢李世乭的分散式AlphaGo是什么鬼?还有单机版吗?
评论:
*? 您还能输入[0]字
分享到: 新浪微博 qq空间
验证码:
????????????????
?

关注电子工程专辑微信
扫描以下二维码或添加微信号“eet-china”

访问电子工程专辑手机网站
随时把握电子产业动态,请扫描以下二维码

?

5G网络在提供1Gbps至10Gbps吞吐量方面具有很好的前途, 并且功耗要求比今天的网络和手机都要低,同时还能为关键应用提供严格的延时性能。本期封面故事将会与您分享5G的关键技术发展,以及在4G网络上有怎样的进步。

?
?
有问题请反馈
推荐到论坛,赢取4积分X