飞扬围棋
标题: 转载弈客今日文章《惊:一度爆表AI的晚清一局棋,“有远神”有多神?》,作者 时年 [打印本页]
作者: stillcen 时间: 2021-1-28 13:44
标题: 转载弈客今日文章《惊:一度爆表AI的晚清一局棋,“有远神”有多神?》,作者 时年
“同时对手子仙最少,知名也最早,余长之不及十年,少时即与剧棋不下百数十局,今都无存者。庚午同客皖上重得交手,盖别已二十年矣,相聚甚欢。辛未各以事归省,比余重来方日盼其至,乃竟以滞下疾,于是秋下世,年未五十,惜哉,独弦哀张,抚局陨涕。”——周小松《餐菊斋棋评》
以上是周小松怀念陈子仙时写下的一段话,作为晚晴时代的两大棋手,两人是对手,也是朋友。言语中充满着两人惺惺相惜的感佩,以及对对手早逝的惋惜。一代强者独立于世,从此开始独孤求败的生涯,周小松的内心,恐怕一直充盈着这份无限的惆怅。
往事随风,一百多年后,陈祖德先生的《中国围棋古谱精解大系》巨著第四辑《最后两高峰》中,让世人重新认识了这两位棋坛俊杰。其中第七局,周小松在《餐菊斋棋评》中对此局自评为“有远神”,自得之意溢于言表。
周小松自评:218有远神,至258复成大劫颇有实力。
“有远神”这三字无不涤荡着自信与快意。印象中,施襄夏在《手评十八局》中对徐星友和程兰如的争霸对局作过此评价,而此局周小松将对前代国手的赞誉载于己身,想来这应是平生得意之作。一代国手,孤灯品茗,对枰追忆往昔,壮怀激烈,半醺之际,提笔写下“有远神”三子,那是怎样得一种孤芳自赏?“有远神”,到底有多神?
21世纪围棋进入AI时代,笔者有幸用AI分析此局,从218到302手之间的战斗过程,管窥其中美景,拆解各种变数,不敢私赏,现分享诸友于兹。
首先大体介绍一下对局过程,在218手之前,陈子仙的白棋本来右下大块打劫,其中牵扯右边一块黑棋对杀。但白棋因形势不利,奋力反击,到217手时把左边黑棋大块圈了进来。
黑只好先治理大龙,从218开始,竟然和右边打劫对杀的一块联系起来,右边黑白双活,但是白棋如果259处的劫失败,双活即变为假双活,白棋全死;相反如果白棋做活,黑大龙也会无眼阵亡。
更为要紧的是,此劫关乎全盘数块棋死活。后面双方劫争,到302黑挖的时候,白棋无法继续,只好消劫,而黑大龙通联,至此白棋败局已定。
笔者先后用Katago20b1.32和Katago40bC384两个权重分别分析218到302手,均为古棋规则。20b权重Katago20b1.32棋力稍弱,计算量每步20k,目的是得到全局的吻合度和复杂度\不确定度,便于和其它棋谱比较。
Katago40bC384是目前普通爱好者能得到的最强权重之一,每步计算量100k,重新分析218-302手对局,目的是验证20b的分析结果,同时得到吻合度、复杂度\不确定度。
结合周小松的自评,陈祖德的棋评,对有分歧的地方和不吻合的地方,采用Katago40bC384分析得到变化图,以最大限度验证结论的正确性。
AI分析首先重视吻合度,而中盘作战更重视第一候选点吻合度。因为对杀之际,差之毫厘谬以千里,必须以第一候选点吻合度为判断依据。其次重视复杂度,复杂度又翻译为不确定度,Katago作者在论文中有详细叙述,这个指标是AI计算的全部变化结果的目差方差。
根据经验,在涉及计算的深度、广度的局面下,在涉及大块死活的情况下,复杂度会\不确定度会相应变化。此问题限于篇幅,不多阐述,有兴趣的棋友可以自行研究。
在此先说下结论:218-302手,Katago20b1.32,分析结果黑第一候选吻合度64.3,白69.8;看起来相当不错;然而令人吃惊的是,Katago40bC384进过100k每步计算量竟然认为黑76.2,白67.4,这就有点异乎寻常!
因为Katago40bC384棋力远高于Katago20b1.32,一般的经验是,一张棋谱用20b的AI分析,得分要高于40b的AI,用少计算量分析,得分要高于计算量大时,而此局的分析结果出现反常现象,这说明什么?这说明此局复杂程度已经部分超出20b的分析能力,简单说就是爆表了!
这种非常少见的情况,从逻辑上来讲,就是我们分析棋局都是假定我们的棋力足够高,但是如果实情并非如此呢?这点从Alphago刚出道时大家的评价就可以看出来。要不是Alphago真刀真枪地击败了人类,光从棋谱上看,也许并不会感受到其恐怖实力。所以评价是否准确,从逻辑上必须有一把足够长的尺子。
一般来说我们充分信任AI,AI也不会轻易辜负我们,偶有盲点都是小概率事件,但是AI也分强弱,40b高于20b是常识。现在的情况是40bAI评价黑棋为76.2,20b仅为64.3,这说明20bAI作为尺子被更长的尺子否定了。那么执黑棋的周小松自评甚高看来是得到40bAI的认可了。
也许有棋友说“且慢!这里劫争多多,打劫的时候评分会有虚高,因为三手棋中会有两手是必然的,所以第一候选吻合度会升高。”好,那么我们看一下218到258之间的数据:218-258,Katago20b1.32,黑75,白85.7;Katago40bC384,黑85,白76.2。
数据显示,打劫得分虚高这个经验不适合本局,如果不算打劫这段双方得分都惊人地高!客观说,这种吻合度可以称得上AI附体了,如果不是知道这是清朝的棋谱,我肯定认为双方在遛狗!
以下笔者把详细分析数据列于下表,包括每手的吻合情况,胜率波动和复杂度\不确定度。手数比较多,表也很长,希望大家耐心看完。
Katago分析详情表
分析表中数据,我们发现Katago20b1.32认为从220手开始到301手,复杂度\不确定度一直居高不下,绵延80余手,其中复杂度最高达到50.9!由定义可知,复杂度\不确定度代表AI提供样本的方差,即所有AI计算过的局面为样本统计目差的方差得来。
从原理可知,如果AI能够算得清变化,这个指标会减小,因为随着AI计算量增加,在确定某一结果为“正解”时,多余的计算量会集中在“正解”,这样继续增加计算量会导致新增样本大量同质化,这样统计结果必然会导致复杂度大大降低。
另外,越是棋力强的AI,这种同质化来得越早,所以一般规律是强的AI复杂度小,计算量高复杂度小。当然也会出现复杂度随着计算量增加基本不变的情况,这说明棋局本身由于随机性而带来的复杂度本身就到了一定程度。
此局Katago40bC384这样的强AI复杂度\不确定度最高也达到38.8。这固然是因为大龙太大,死活区别造成的目差差距太大,同时也说明变化繁多,AI需要探索多条道路导致样本无法集中。在这么高的复杂度\不确定度之下,双方能取得这么高的第一选点吻合度,“有远神”确实很神,很惊世骇俗!
让我们定格,欣赏一下复杂度\不确定度50.9的场面。
下面结合周、陈的解说和表中具体讨论几处变化,此处先说一句, AI分析得到的具体变化图让笔者惊讶得无以复加。
首先,尽管周小松认为218“有远神”,但是Katago40bC384认为218不简明,只是第4候选点。当然周小松既然自评甚高,说明他也许在实战时把218之后至258的变化算清了,但是这只是计算深度方面的算清,其他路径也许他没考虑。
AI认为黑1更好,此处的逻辑是如果上边归黑所有,即使右边全给白棋黑也是赢棋。所以白棋必须力争上面做活,从而先和黑在上面对杀。这样棋局讲更加复杂,因为此图右边未定,而左边和上边又开始新的战斗,人类的心脏恐怕接受不了吧。
故事继续。AI认为上边打劫的结果是双方和平收场,然后黑42可以消劫。但是实际上右边白棋并未净死……
总之AI认为此图黑大幅领先,白胜率仅剩零头。
但是我们也不要气馁,周小松没有走出这个图,只能说明人类的心理承受能力还受到肉身的影响罢了。因为但凡人类到了那个场面,第一反应应该是如何结束这种混乱局面,而不是扩大混乱。
对233,AI持 “不同意见”。
上图是AI的推荐。
这里的进行非常重要,继续分析推演,这是到300k的计算结果。实战为第二选点,比推荐低3、4个点。这里是战斗中需要进行选择的地方,要求大量的计算和判断。
后面变化稍微分析了一下,大概如图所示,局面一下子变成上边死活和黑大龙的关系!黑角上打劫活,此劫关系重大。由于变化复杂,这里就不多探讨了。只是可以肯定的一点是,实战绝非坏棋。
下一个分歧是236。
实战黑236冲断之后产生二路断打的妙手,使黑棋惊险万分地读过难关。但是AI认为黑1扳3夹更好。对黑1给出胜率57.5。
但是继续下去,AI给出了20夹的妙手。这里黑棋如果象实战那样立在一路,里面对杀是局部双活,而此时由于左边定型区别,黑无法一路立,导致局部只能23补,准备打劫双活。20不走似乎也能阻止黑一路立,但是会影响到白上边死活。
这里似乎是AI看走眼了。这可是40bAI呀!但是看一下胜率,黑胜率竟然达到80.3!打劫竟然胜率更高,这是什么情况,笔者也不太明白,希望有志者破解这个问题。总之如果真的是周小松下错了,也是匪夷所思的错误!
对于267,周和陈的解说有出入,笔者分析得到一个变化图,确认周解说正确。
陈解说认为281粘找劫黑如消劫,如图,白2黑必须用涨牯牛做活,如此黑紧一气。这样会导致黑差一气被吃,AI指出黑7可以在另一边打吃继续打劫。此处也许双方和陈祖德一样的思路,陷入思维误区。
对于296,陈解说认为白消劫负1子半,经过分析白如果消劫胜负非常细微,也许是和棋。所以此处白可以消劫。其实AI认为,296找劫本身是可以成立的,只是时机晚了,如果不下278,296是第一候选点。(大家可以对照前面详细列表,278时AI认为296是第一候选)也就是这微小的目数差别,决定了是否吻合。
最后给出第302手定格图。
结束语:此局218至302共85手棋,双方都发挥出了极高的水准。非常罕见的是权重Katago40C384给出的吻合度竟然超过了Katago20b1.32,这说明在其中短暂的时候,双方对局水平已经超出了Katago20b1.32,这个结论通过变化图分析得到初步的验证。而Katago40C384指出的不足之处,有的匪夷所思,有的是人类的盲点。
应该说即使Katago40C384能指摘之处也不过寥寥几手而已,毕竟双方的第一选点吻合度已经达到了骇人的黑76.2,白67.4。双方不吻合之处有好几个是在劫材的应接之中。以笔者低微的棋力,认为有些劫材属于这也可那也可,这时还能保持和AI第一选点高度一致,那只能说对局者的棋力到了一个无法形容的境界,或者AI也有心有灵犀之说,也未可知也。
结合陈祖德九段的解说,发现陈老的解说部分有更进一步探讨的空间。笔者无意贬低陈祖德九段,相反对陈德九段高山仰止,但是棋艺方面最好就事论事。而纵观本局,不愧是周小松生平得意之作,局部棋力甚至已经超过Katago20b1.32。当然,“血肉之躯”难免发挥不稳定,但却足当得起“有远神”的自评。
“有远神”,有多神?答曰:神乎其技。
作者: lwq0130 时间: 2021-1-28 15:17
这力量恐怖啊,这还是最后两高峰,前面两巨头呢
作者: 碧空晴 时间: 2021-1-28 16:11
三巨头变两巨头了?程兰如梁魏今等人也不在周陈之下。
作者: 雨骤流 时间: 2021-1-28 17:36
精彩!
作者: stillcen 时间: 2021-1-28 17:45
《最后两高峰》书价也要看涨啊
作者: 弈魂道 时间: 2021-1-28 21:49
太认真了
作者: 榉木 时间: 2021-1-29 09:26
两巨头前面前面还有一条龙
作者: 榉木 时间: 2021-1-29 11:55
古谱的学习,还是相当有价值,有些中盘的复杂计算很烧脑
作者: SmileFox 时间: 2021-1-29 14:03
我有点奇怪的,katago去年1月份就已经支持中国古棋规则了,为什么还在用现有的规则做分析?
另外说句题外的话,数据呢就是个任人打扮的小姑娘,就看你怎么给她选衣服咯
作者: 肥仔胡 时间: 2021-1-29 16:16
本帖最后由 肥仔胡 于 2021-1-29 16:17 编辑
笑面狐兄太偏激了,撇开数据,吴清源大师都说黄范施有名人级的水平,他也这样形容过自己和李昌镐。(有人问他如果在巅峰时,他和李谁厉害,他说现在的名人和以前的名人怎么比?)这是个很高的评价,不是谁都会被吴老称名人的。你看吴老说过哪个业5名人级?另外狐兄说ai支持中国古棋规则,在我看来是不可思议的,还棋头怎么解决?加藤英树的地震狗就因为六目半和七目半问题神经错乱过,黄博士说,这种设置的差异,不啻于一次推倒重来。
作者: 肥仔胡 时间: 2021-1-29 16:28
本帖最后由 肥仔胡 于 2021-1-29 16:29 编辑
如果卡塔狗解决了规则问题,那太好了,可以把当代高手的棋用还棋头来跑一跑,让大家看看我们之前对古人是多么的不公平。老实说我们对古人太苛求了,当然也不是所有古人都会受到这种对待,比如马克思恩格斯等等。
作者: SmileFox 时间: 2021-1-29 17:43
本帖最后由 SmileFox 于 2021-1-29 19:10 编辑
我先解释一下katago的中国古棋规则的一些事,别的回头有空再写。
DeepMind的在做Alphago的时候,是把规则定死的,所以黄博士说的没错,对于Alphago来说,换一个规则需要重来一次。
日本哪个是AI搞不定贴几目还是因为那是照着AlphaGo的做法做的,把很多东西作死了,然后打补丁来凑合,所以才搞不定。
但katago是在设计上做了很多改进,我的理解是katago把规则和最纯粹的围棋技巧加以分离的,在后续再结合规则评判整个棋局。所以还棋头只是个小事情。
在katago里面有个抽税规则,一块棋抽2个子的税,等效于中国古棋的规则。
可以参考 https://lightvector.github.io/KataGo/rules.html 里面的 TAXRule
具体的关于中国古棋规则的讨论可以看https://github.com/lightvector/KataGo/issues/253
顺便说一下,我对古棋的看法,古人再某些地方不逊于今人我是完全赞同的,比如中盘战力,但要是有人说古人的综合水平比今人高我是不认可的。
所有的智力方面的活动,都是今远胜古,因为大家都在前人基础上不断钻研不断进步,我不相信围棋会例外。
作者: 肥仔胡 时间: 2021-1-29 18:31
我从未说过古人综合实力比今人高,他们玩的是两种游戏。如果我说过这个话,麻烦您引用一下。
作者: 肥仔胡 时间: 2021-1-29 18:43
狐兄只是和我们观点有差异,但层次还是挺高的,所以我才跟您友好地辩论,不是说要谁输谁赢。所以请您不必介意。有些污言秽语,骂古人shit的人,我都懒得和他辩论,跟他辩论那是有失我文明人的体面。碰到这种人,如果我是当事人,把他的语录全部网上下载下来,送给他执教的学生家长,人手一份。
作者: SmileFox 时间: 2021-1-29 19:06
本帖最后由 SmileFox 于 2021-1-29 19:11 编辑
肥仔胡 发表于 2021-1-29 18:31
我从未说过古人综合实力比今人高,他们玩的是两种游戏。如果我说过这个话,麻烦您引用一下。
我没有针对您和任何人的意思,只是随口说说自己的看法。前文中有些容易误会的地方我也改过了。还望包涵一二。
作者: SmileFox 时间: 2021-1-29 19:22
围棋说到底是一个逻辑和推理的游戏,从纯粹的智力能力上,我相信古代先贤是不会逊色今天的天才们的,但也不会碾压现在的高手。
但现在高手们肯定会在前人的基础上走的更远。
作者: SmileFox 时间: 2021-1-29 19:31
这个文章的论述我是不认可的,单纯从ai吻合度来做出判断是有很大的漏洞的。比如说2个人都走出10步ai第一选点,十个第二选点,谁强?如果我来做个分析,可以想让谁强就让谁强。
作者: 肥仔胡 时间: 2021-1-29 20:32
笑面狐兄的问题,吴翰林转发的帖子里早讲到了,只是我没发全。
作者: 肥仔胡 时间: 2021-1-29 20:36
[attach]171734[/attach]
作者: 肥仔胡 时间: 2021-1-29 20:37
见图二。
作者: 肥仔胡 时间: 2021-1-29 20:45
本帖最后由 肥仔胡 于 2021-1-29 20:51 编辑
有个有趣的现象,和ai的重合率,柯洁占据优势,但范施恶手导致的平均目数差低于柯洁。也就是说柯洁犯错虽然少,但是犯错的损失要比范施大。
作者: SmileFox 时间: 2021-1-30 01:52
本帖最后由 SmileFox 于 2021-1-30 01:59 编辑
不太清楚这个目差平均值是怎么算的,不过我是觉得,如果是用现代规则分析古棋,任何结论都是要打个问号的。我猜测在古棋ai眼里范施的开局恐怕不会很差,因为相对座子的关系,古人应该研究的很透彻,而中盘则未必那么好,因为有棋头的关系,很多局面的判断会复杂很多,人恐怕更难掌握。
作者: 烟台 时间: 2021-1-30 10:25
Katago40bC384两个权重分别分析218到302手,均为古棋规则
好象文中已经说了分析规则的事
作者: 烟台 时间: 2021-1-30 10:29
AI分析不认可?那曾经的作弊事件如何定论的?
别说人作弊时认可AI评分,说古今时又不认可就行。
作者: SmileFox 时间: 2021-1-30 10:48
烟台 发表于 2021-1-30 10:25
Katago40bC384两个权重分别分析218到302手,均为古棋规则
好象文中已经说了分析规则的事
我说的是另外一张图里的问题。
作者: lanke2021 时间: 2021-1-30 11:09
提示: 作者被禁止或删除 内容自动屏蔽
作者: 三国大军师 时间: 2021-2-7 20:12
举报:陈子仙周小松遛狗:)
作者: xwang71785 时间: 2021-3-9 18:46
这个绝对是神帖了
作者: 肥仔胡 时间: 2021-3-9 18:58
这盘棋做不得数的,因为崔灿有过结论,他说抛开计算量谈权重是耍流氓。(大意如此)每个爱好者只要打过谱,都会发现周和黄范施有较大差距。我当时站在古人角度和笑狐兄有过友好争论。但实际上我本人是强烈反对将人神格化的,无论古人还是今人。事后发现,该帖纯粹是还棋头派的一出神话剧。
作者: 肥仔胡 时间: 2021-3-9 19:02
科学的态度应当是根据证据,再作出个人的判断。不科学的态度是先下结论,再根据结论找证据,不管真的假的。
作者: SmileFox 时间: 2021-3-10 09:45
我是非常赞同胡先生的很多观点的,只论才能,古人和今人的差距是可以忽略不记的。
今天的世界冠军面对一个局面,可以算30步,古人也是完全没有问题的。
虽然由于秉持的围棋理论的不同,得出的见解不同,但这个就是另外一件事。
欢迎光临 飞扬围棋 (http://bbs.flygo.net/Bbs/) |
Powered by Discuz! X3.2 |