飞扬围棋

标题: 一篇引起职业棋手愤慨,花整月时间连发四文反驳怒怼的中古奇文 [打印本页]

作者: 三国大军师    时间: 2021-5-27 13:56
标题: 一篇引起职业棋手愤慨,花整月时间连发四文反驳怒怼的中古奇文
《惊:一度爆表AI的晚清一局棋,“有远神”有多神?》作者:时年
作者: 三国大军师    时间: 2021-5-27 13:57
ai眼中的陈子仙VS周小松大战之一局
“同时对手子仙最少,知名也最早,余长之不及十年,少时即与剧棋不下百数十局,今都无存者。庚午同客皖上重得交手,盖别已二十年矣,相聚甚欢。辛未各以事归省,比余重来方日盼其至,乃竟以滞下疾,于是秋下世,年未五十,惜哉,独弦哀张,抚局陨涕。”——周小松《餐菊斋棋评》
以上是周小松怀念陈子仙时写下的一段话,作为晚晴时代的两大棋手,两人是对手,也是朋友。言语中充满着两人惺惺相惜的感佩,以及对对手早逝的惋惜。一代强者独立于世,从此开始独孤求败的生涯,周小松的内心,恐怕一直充盈着这份无限的惆怅。
往事随风,一百多年后,陈祖德先生的《中国围棋古谱精解大系》巨著第四辑《最后两高峰》中,让世人重新认识了这两位棋坛俊杰。其中第七局,周小松在《餐菊斋棋评》中对此局自评为“有远神”,自得之意溢于言表。
作者: 三国大军师    时间: 2021-5-27 13:59
周小松自评:218有远神,至258复成大劫颇有实力。
“有远神”这三字无不涤荡着自信与快意。印象中,施襄夏在《手评十八局》中对徐星友和程兰如的争霸对局作过此评价,而此局周小松将对前代国手的赞誉载于己身,想来这应是平生得意之作。一代国手,孤灯品茗,对枰追忆往昔,壮怀激烈,半醺之际,提笔写下“有远神”三子,那是怎样得一种孤芳自赏?“有远神”,到底有多神?
21世纪围棋进入AI时代,笔者有幸用AI分析此局,从218到302手之间的战斗过程,管窥其中美景,拆解各种变数,不敢私赏,现分享诸友于兹。
作者: 三国大军师    时间: 2021-5-27 14:01
首先大体介绍一下对局过程,在218手之前,陈子仙的白棋本来右下大块打劫,其中牵扯右边一块黑棋对杀。但白棋因形势不利,奋力反击,到217手时把左边黑棋大块圈了进来。
黑只好先治理大龙,从218开始,竟然和右边打劫对杀的一块联系起来,右边黑白双活,但是白棋如果259处的劫失败,双活即变为假双活,白棋全死;相反如果白棋做活,黑大龙也会无眼阵亡。
更为要紧的是,此劫关乎全盘数块棋死活。后面双方劫争,到302黑挖的时候,白棋无法继续,只好消劫,而黑大龙通联,至此白棋败局已定。
笔者先后用Katago20b1.32和Katago40bC384两个权重分别分析218到302手,均为古棋规则。20b权重Katago20b1.32棋力稍弱,计算量每步20k,目的是得到全局的吻合度和复杂度\不确定度,便于和其它棋谱比较。
Katago40bC384是目前普通爱好者能得到的最强权重之一,每步计算量100k,重新分析218-302手对局,目的是验证20b的分析结果,同时得到吻合度、复杂度\不确定度。
结合周小松的自评,陈祖德的棋评,对有分歧的地方和不吻合的地方,采用Katago40bC384分析得到变化图,以最大限度验证结论的正确性。
AI分析首先重视吻合度,而中盘作战更重视第一候选点吻合度。因为对杀之际,差之毫厘谬以千里,必须以第一候选点吻合度为判断依据。其次重视复杂度,复杂度又翻译为不确定度,Katago作者在论文中有详细叙述,这个指标是AI计算的全部变化结果的目差方差。
根据经验,在涉及计算的深度、广度的局面下,在涉及大块死活的情况下,复杂度会\不确定度会相应变化。此问题限于篇幅,不多阐述,有兴趣的棋友可以自行研究。
在此先说下结论:218-302手,Katago20b1.32,分析结果黑第一候选吻合度64.3,白69.8;看起来相当不错;然而令人吃惊的是,Katago40bC384进过100k每步计算量竟然认为黑76.2,白67.4,这就有点异乎寻常!
因为Katago40bC384棋力远高于Katago20b1.32,一般的经验是,一张棋谱用20b的AI分析,得分要高于40b的AI,用少计算量分析,得分要高于计算量大时,而此局的分析结果出现反常现象,这说明什么?这说明此局复杂程度已经部分超出20b的分析能力,简单说就是爆表了!
这种非常少见的情况,从逻辑上来讲,就是我们分析棋局都是假定我们的棋力足够高,但是如果实情并非如此呢?这点从Alphago刚出道时大家的评价就可以看出来。要不是Alphago真刀真枪地击败了人类,光从棋谱上看,也许并不会感受到其恐怖实力。所以评价是否准确,从逻辑上必须有一把足够长的尺子。
一般来说我们充分信任AI,AI也不会轻易辜负我们,偶有盲点都是小概率事件,但是AI也分强弱,40b高于20b是常识。现在的情况是40bAI评价黑棋为76.2,20b仅为64.3,这说明20bAI作为尺子被更长的尺子否定了。那么执黑棋的周小松自评甚高看来是得到40bAI的认可了。
也许有棋友说“且慢!这里劫争多多,打劫的时候评分会有虚高,因为三手棋中会有两手是必然的,所以第一候选吻合度会升高。”好,那么我们看一下218到258之间的数据:218-258,Katago20b1.32,黑75,白85.7;Katago40bC384,黑85,白76.2。
数据显示,打劫得分虚高这个经验不适合本局,如果不算打劫这段双方得分都惊人地高!客观说,这种吻合度可以称得上AI附体了,如果不是知道这是清朝的棋谱,我肯定认为双方在遛狗!
以下笔者把详细分析数据列于下表,包括每手的吻合情况,胜率波动和复杂度\不确定度。手数比较多,表也很长,希望大家耐心看完。
作者: 三国大军师    时间: 2021-5-27 14:03
分析表中数据,我们发现Katago20b1.32认为从220手开始到301手,复杂度\不确定度一直居高不下,绵延80余手,其中复杂度最高达到50.9!由定义可知,复杂度\不确定度代表AI提供样本的方差,即所有AI计算过的局面为样本统计目差的方差得来。
从原理可知,如果AI能够算得清变化,这个指标会减小,因为随着AI计算量增加,在确定某一结果为“正解”时,多余的计算量会集中在“正解”,这样继续增加计算量会导致新增样本大量同质化,这样统计结果必然会导致复杂度大大降低。
另外,越是棋力强的AI,这种同质化来得越早,所以一般规律是强的AI复杂度小,计算量高复杂度小。当然也会出现复杂度随着计算量增加基本不变的情况,这说明棋局本身由于随机性而带来的复杂度本身就到了一定程度。
此局Katago40bC384这样的强AI复杂度\不确定度最高也达到38.8。这固然是因为大龙太大,死活区别造成的目差差距太大,同时也说明变化繁多,AI需要探索多条道路导致样本无法集中。在这么高的复杂度\不确定度之下,双方能取得这么高的第一选点吻合度,“有远神”确实很神,很惊世骇俗!
作者: 三国大军师    时间: 2021-5-27 14:04
让我们定格,欣赏一下复杂度\不确定度50.9的场面。
下面结合周、陈的解说和表中具体讨论几处变化,此处先说一句, AI分析得到的具体变化图让笔者惊讶得无以复加。
首先,尽管周小松认为218“有远神”,但是Katago40bC384认为218不简明,只是第4候选点。当然周小松既然自评甚高,说明他也许在实战时把218之后至258的变化算清了,但是这只是计算深度方面的算清,其他路径也许他没考虑。
作者: 三国大军师    时间: 2021-5-27 14:05
AI认为黑1更好,此处的逻辑是如果上边归黑所有,即使右边全给白棋黑也是赢棋。所以白棋必须力争上面做活,从而先和黑在上面对杀。这样棋局讲更加复杂,因为此图右边未定,而左边和上边又开始新的战斗,人类的心脏恐怕接受不了吧。
作者: 三国大军师    时间: 2021-5-27 14:06
故事继续。AI认为上边打劫的结果是双方和平收场,然后黑42可以消劫。但是实际上右边白棋并未净死……
作者: 三国大军师    时间: 2021-5-27 14:07
总之AI认为此图黑大幅领先,白胜率仅剩零头。
但是我们也不要气馁,周小松没有走出这个图,只能说明人类的心理承受能力还受到肉身的影响罢了。因为但凡人类到了那个场面,第一反应应该是如何结束这种混乱局面,而不是扩大混乱。
对233,AI持 “不同意见”。
作者: 三国大军师    时间: 2021-5-27 14:07
上图是AI的推荐。
作者: 三国大军师    时间: 2021-5-27 14:08
这里的进行非常重要,继续分析推演,这是到300k的计算结果。实战为第二选点,比推荐低3、4个点。这里是战斗中需要进行选择的地方,要求大量的计算和判断。
作者: 三国大军师    时间: 2021-5-27 14:09
后面变化稍微分析了一下,大概如图所示,局面一下子变成上边死活和黑大龙的关系!黑角上打劫活,此劫关系重大。由于变化复杂,这里就不多探讨了。只是可以肯定的一点是,实战绝非坏棋。
作者: 三国大军师    时间: 2021-5-27 14:10
下一个分歧是236。
作者: 三国大军师    时间: 2021-5-27 14:10
实战黑236冲断之后产生二路断打的妙手,使黑棋惊险万分地读过难关。但是AI认为黑1扳3夹更好。对黑1给出胜率57.5。
作者: 三国大军师    时间: 2021-5-27 14:11
但是继续下去,AI给出了20夹的妙手。这里黑棋如果象实战那样立在一路,里面对杀是局部双活,而此时由于左边定型区别,黑无法一路立,导致局部只能23补,准备打劫双活。20不走似乎也能阻止黑一路立,但是会影响到白上边死活。
作者: 三国大军师    时间: 2021-5-27 14:12
这里似乎是AI看走眼了。这可是40bAI呀!但是看一下胜率,黑胜率竟然达到80.3!打劫竟然胜率更高,这是什么情况,笔者也不太明白,希望有志者破解这个问题。总之如果真的是周小松下错了,也是匪夷所思的错误!
作者: 三国大军师    时间: 2021-5-27 14:13
对于267,周和陈的解说有出入,笔者分析得到一个变化图,确认周解说正确。
作者: 三国大军师    时间: 2021-5-27 14:14
陈解说认为281粘找劫黑如消劫,如图,白2黑必须用涨牯牛做活,如此黑紧一气。这样会导致黑差一气被吃,AI指出黑7可以在另一边打吃继续打劫。此处也许双方和陈祖德一样的思路,陷入思维误区。
作者: 三国大军师    时间: 2021-5-27 14:14
对于296,陈解说认为白消劫负1子半,经过分析白如果消劫胜负非常细微,也许是和棋。所以此处白可以消劫。其实AI认为,296找劫本身是可以成立的,只是时机晚了,如果不下278,296是第一候选点。(大家可以对照前面详细列表,278时AI认为296是第一候选)也就是这微小的目数差别,决定了是否吻合。
作者: 三国大军师    时间: 2021-5-27 14:15
最后给出第302手定格图。
作者: 三国大军师    时间: 2021-5-27 14:16
结束语:此局218至302共85手棋,双方都发挥出了极高的水准。非常罕见的是权重Katago40C384给出的吻合度竟然超过了Katago20b1.32,这说明在其中短暂的时候,双方对局水平已经超出了Katago20b1.32,这个结论通过变化图分析得到初步的验证。而Katago40C384指出的不足之处,有的匪夷所思,有的是人类的盲点。 应该说即使Katago40C384能指摘之处也不过寥寥几手而已,毕竟双方的第一选点吻合度已经达到了骇人的黑76.2,白67.4。双方不吻合之处有好几个是在劫材的应接之中。以笔者低微的棋力,认为有些劫材属于这也可那也可,这时还能保持和AI第一选点高度一致,那只能说对局者的棋力到了一个无法形容的境界,或者AI也有心有灵犀之说,也未可知也。 结合陈祖德九段的解说,发现陈老的解说部分有更进一步探讨的空间。笔者无意贬低陈祖德九段,相反对陈德九段高山仰止,但是棋艺方面最好就事论事。而纵观本局,不愧是周小松生平得意之作,局部棋力甚至已经超过Katago20b1.32。当然,“血肉之躯”难免发挥不稳定,但却足当得起“有远神”的自评。 “有远神”,有多神?答曰:神乎其神。
作者: chairongyu    时间: 2021-5-27 22:29
感谢分享!
作者: 不可理喻    时间: 2021-5-27 23:05

感谢分享!
作者: 肥仔胡    时间: 2021-5-28 07:17


作者:崔灿CGF55258  2021-02-09

[attach]193388[/attach]

近日,一位名为“时年”的作者,在弈客上发表了一篇《惊:一度爆表AI的晚清一局棋,“有远神”有多神?》,以下简称《有远神》)的文章。该文使用开源围棋AI“KataGo”的古棋规则,分析了两位晚清围棋国手——周小松与陈子仙的一盘棋,并从中截取了与AI分析“吻合度极高”的中后盘片段,将其认定为“期间双方都发挥出了极高的水准”。另外,作者还发现这期间“复杂度一直居高不下,绵延80余手,其中最高达到50.9”,进一步说明了“在这么复杂的局面下,双方能取得这么高的第一选点吻合度,十分惊世骇俗”。并通过两个不同权重的“复杂度”对比,得出了“20B(256)的KataGo已经看不懂了,要40B-large(384,俗称40B胖权)才能看懂,两人的棋已经超越了AI”的结论。

像《有远神》一文这样,利用围棋AI分析数据评价棋手水平高低的尝试,如今时有出现。那么,这些研究的规范性如何?是否遵循统计学的相关标准?另外,还有一些更为根本的问题:围棋AI分析数据能否公正的鉴定棋手水平?棋谱数据与分析指标的选择,如何做到不偏不倚,令人信服?从去年十月开始,笔者已经积累了一些古谱以及当代大赛棋谱AI分析结果。下面结合这些数据,探讨一下围棋AI分析的研究方法。

(一)吻合度

AI吻合度,即棋局着法与AI推荐选择的吻合程度。如今被广泛用于棋局质量的评价,以及判定对局者是否“遛狗”的依据。本文中的“吻合度”数据,全部来自KataGo各种常用权重,版本1.50(KataGo分布式训练前最后一个版本)。为避免“先画靶再射箭”等数据操作的行为,软件及吻合度相关设置全部为默认值。

KataGo是当前最强大,功能最友好的开源围棋AI,支持各种路数的棋盘,以及现有的所有围棋规则。可以随时调节贴目,并在一定程度优势下,不会出现像AlphaGo那样无谓的目数退让行为。去年世界AI围棋大赛中,几乎所有“民间AI”都是KataGo的各种魔改版本。目前KataGo是除了绝艺与星阵之外,棋手训练提高必备的AI软件。

笔者使用分析平台程序Lizzle加载KataGo权重。可能一些棋友对围棋AI软件并不熟悉,下面以2014年第二届“百灵杯”世界围棋公开赛决赛第三局为例,介绍一下软件吻合度的判定方法。
[attach]193389[/attach]

柯洁VS邱峻(棋局片段)


棋谱数据为KataGo v1.50 20B权重,每步棋一百万(1000K)总计算量。本文所有的图谱分析数据,如无特别说明,均为这一标准。

之所以选择1000K的总计算量,是因为计算量不够高时,AI的计算结果以及胜率尚不稳定,可能与最终结果相去甚远。以《有远神》一文列出的周小松与陈子仙这盘棋,黑218时的局面为例:
[attach]193390[/attach]

不同计算量下的胜率与目差

[attach]193391[/attach]

随着计算量的增加,KataGo的胜率与目差不断波动,在1000K之后才逐渐稳定下来。根据表中数据可以看出,在计算量100K至200K这一阶段,KataGo觉得之前的判断过于乐观,胜率不断下调。但计算量到达300K至500K时,AI显然是发现了新的分支变化,胜率节节攀升,然而算到750K时,这一分支的结果又遭到了否定。

另外,上面还是个“下一手几乎必然”的案例。在更加开放的局面中,AI计算初期选点相对分散,《有远神》一文采用的每步棋20K计算量,就像是AI的“第一感”,仅能大致估计着法好坏。在布局与官子阶段尚能用来参考,差别不至于太大;对中盘复杂局面的评价,以及鉴定棋手水平,这点计算量的可靠性显然不足。

可能有人会质疑20B权重的水准,认为这是计算过程中胜率起伏不定的原因。实际上,笔者最初选用的是40B官权,但在分析当湖十局的过程中,发现该权重存在某些BUG,一些日常定式的研究也印证了这一点(下篇中会有详细讨论)。20B权重+1000K计算量,是综合考虑严谨性与效率后的结果。理想情况是每步10000K的计算量,对标AlphaGo教学工具(AlphaGo的每步棋一千万计算量,应该也是出于胜率稳定性的考虑吧),只是那样的话,这篇文章就不知何时才能动笔了。

1000K的计算量可以保证一局棋中,超过95%的时候计算(胜率)到达稳定状态。至于权重,刚才那个局面黑218的时候,就算是40B胖权,也是800K的计算量后才达到了稳定(胜率波动范围前后不超过1%),期间同样经历了与20B权重类似的胜率过山车。我们后面会看到,在吻合度这一指标上,权重不同所带来的差别,并没有那么重要。
[attach]193392[/attach]

柯洁VS邱峻 KataGo全局“鹰眼”数据


回到柯洁的那盘棋。KataGo吻合度的默认标准,是“AI推荐的前三选点,且计算量不低于最高值20%”。对计算量的要求,是为了避免出现偏离“唯一正解”太远却被纳入吻合;前三选点则是考虑到几个选点极度接近,或完全等价的局面,例如上图黑棋在哪里收气。

这种标准当然无法涵盖所有情况,比如黑棋第一步能不能踏入吻合,完全看AI的心情——最高计算量是否在棋盘的右上角。“AI评分”在一定程度上弥补了这一不足。
[attach]193393[/attach]

KataGo“AI评分”计算公式


AI评分公式的思路,是将所有计算过的选点,按照计算量的比例赋予相应的评价。与只看前三的吻合度相比,AI评分进一步降低了偶然性,应该说更为合理。但根据两百多盘已完成分析的古今棋谱数据观察,该指标与吻合度密切相关,两者的数值差在+1至-8之间浮动,平均-2左右。这种差异笔者目测在统计学意义上不显著。固然“AI评分”稍微科学一点,但继续使用知名度更高的“吻合度”也未尝不可。

那么,吻合度究竟能不能作为判定棋手水平的依据呢?

相信部分棋友原本就对刚才那盘棋有些印象。第一次登上世界大赛舞台的柯洁,第三局一上来就在大雪崩外拐定式中刀,局部下完已经可以“起立”了。从胜率曲线与目差来看,黑方后面确实没什么机会。然而这盘棋柯洁全局吻合度达到了67.4%(这个数值在1000K的计算量,并且棋局没有漫长官子阶段的情况下相当高,详见后文),比白棋还要高!这还是围棋进入AI时代之前的棋谱,没有如今的“布局红利”,一场完败的吻合度如此之高,甚至还高于对手,这是怎么回事呢?

在笔者使用AI分析棋谱的过程中,多次出现“棋输了但吻合度高于对手”的现象。不过在这种情况下,负者的平均胜率波动一定高于胜者,也就是说虽然“命中率”更高,但“脱靶”造成的后果更严重。由此可见,平均胜率波动可以成为棋力判定的“否决性”参考指标——低波动不一定下的好,有可能是一场完败,胜率没有什么下跌的空间;但胜率波动过高,则一定是水平有限,在棋局关键阶段的洞察能力不足。常见于业余低水平棋手的“胜率心电图”就是如此。
[attach]193394[/attach]

左:AI分段评分 右:柯洁中刀过程(16=▲)


至于为什么上来就大势已定的一盘棋,最终竟收获了如此之高的吻合度?通过与吻合度近似的“AI评分”不同阶段数据,可以看出一些端倪——尽管开局第一个定式就中刀,AI对黑棋布局的评价一点也不低。让我们重温一下柯洁的中刀过程:

在大雪崩外拐定式的这一型中,黑1本应在7位压(顺便一提,这个人类定式,黑1之前白棋胜率已经80%多了),实战“不识定式”的柯洁遭到了白6以下的组合拳,白棋先弃三子,最终将黑左边五子吃回,形成通天厚势,可以说棋局已然结束。

然而,图中黑方这十步棋除了黑1扳之外,其余九手全部踏入了AI吻合度区间!由于黑方中刀之后的变化“一本道”,反而让黑棋的吻合度大幅提升。另外,虽然AI对人类的大雪崩定式颇有微词,但整个定式过程存在大量必然的下法,同样提升了双方布局阶段吻合度。显然,这种吻合度对判定棋手水平毫无意义。

在“AI评古”相关的研究中,最常见的质疑就是上面这个现象——接触战中的“必然”下法会增加。像古棋那样普遍的全盘战斗风格,大量的必然下法会使吻合度偏高。不过笔者认为,“风格”是不能量化的。我们可以就棋盘上某个具体的局部,主观认定其吻合度并不体现水平,但某种棋风影响吻合度这一假说,无法用统计学的方法找到有效证据。

按照上面的逻辑,古棋支持者同样可以说由于局面复杂,吻合的难度会增加。况且古棋的战斗风格与当代大型定式相比,到底哪一边吻合度更“沾光”也难以定论;平稳风格的局面,中盘也不可能没有棋子接触,“必然性”就一定不高?这种无法用数据来证实的事情,根本不可能探讨出结果。作为一个用数据说话,追求严谨性与可靠性的研究,存而不论是最好的办法。

刚刚从火箭转投篮网的NBA球星哈登,是过去三个赛季常规赛的“得分王”。然而大量球迷对此并不感冒,认为他的场均高分与其“碰瓷”打法(投篮时主动寻找手臂接触,造犯规获得罚球)密不可分,这是在钻篮球规则的空子,不能体现真正的得分能力。很显然,我们不可能客观的判定每一次造犯规是否属于“碰瓷”,从而计算出哈登“真正”的得分能力。“吻合度受到对局风格影响”的说法,与上面这件事情有相似之处。从学术角度探讨问题,“观感”的说服力必然有限。

吻合度的另一个问题,是目前这一代围棋AI在复杂局面或多手数的直线计算中,有时会出现盲点或误算。此时的“吻合”自然失去了作用。
[attach]193395[/attach]

上个月春兰杯八强赛的一盘棋中,就出现了这样的案例。正如胡耀宇文中所说,无论是KataGo各种权重,还是绝艺和星阵的精解分析,都没能发现黑棋一路点的正确时机。倘若实战黑149真的下出了这一妙手,反而会导致“吻合”减1。在前面柯洁中刀的那一图中,AI同样没算出白12退(左边第48手)的好手。尽管这步棋之后,白棋的胜率与目差双双上升,也无法改变“不吻合”的结果。

好在如今围棋AI的综合水平远超人类,这样的局面极其有限。在一盘棋上百手的“大样本”中,一两个错误的AI判断,基本不影响全局的吻合数值。如果统计的棋局总数足够多,这个问题更是可以忽略不计。

对吻合度的怀疑,还有“AI认为的最佳选点,对人类棋手来说不一定是最好的,我们更应该选择自己能够理解、掌控的下法”。这种观点固然有一定道理,但在逻辑上直接否定了“AI分析能够判定棋手水平”这一前提,继续讨论下去也是鸡同鸭讲。至少在今天,绝大多数棋手还是认可“吻合度”与招法好坏的相关性。然而,该指标在如今的应用中,普遍存在标准不一的问题。
[attach]193396[/attach]

当湖十局不同计算量下的吻合度


暂且不论不同围棋AI的吻合度能否直接对比,哪怕是在同一AI且权重相同的情况下,不同计算量下的吻合度也存在明显区别。通过上表可以看出,吻合度与计算量的高低,总体呈反比关系。可能的原因是在高计算量下,不同选点之间的计算差值被放大,在一些局面中,与一选存在“真正差异”的第二、三选点,难以实现“计算量不低于最高值20%”。简而言之就是计算量的增加,减少了一些“不当”选点蒙混过关的机会。低计算量下一盘70%吻合度的棋,在高计算量下可能只有50%多,这两个数字给人的感觉天壤之别!
[attach]193397[/attach]

当湖十局不同权重的吻合度


与计算量相比,权重是否一致反而没有那么重要。几个常用的官方权重在相同的计算量下,虽然每盘棋的吻合度都略有差别,但总体数值一看就没有显著差异。谨慎起见,笔者还是做了个检验,结果也没有丝毫意外。
[attach]193398[/attach]

不同权重数据的方差分析


综上所述,将“吻合度”作为判定棋手水平的指标,尽管有着这样那样的缺点,在样本选择合理的情况下还是可以接受的。前提是每步棋的计算量不能过低,对吻合度进行比较时,应保证权重与计算量的一致性。至于数据是使用哪一个权重得出的,并没有那么重要。哪怕真的“没看懂”个别招法,在大样本中也会被掩盖。作为一项严谨的研究而言,抛开计算量空谈吻合度就是耍流氓。在使用吻合度进行对比与论证观点时更是如此。

(本文共分三篇。中篇将详细解析《有远神》一文中的观点与变化图,下篇会谈谈“复杂度”以及围棋AI分析的样本选择问题)


作者: 肥仔胡    时间: 2021-5-28 07:18
崔灿五段对三国大军师兄的帖子进行了反驳。
作者: 肥仔胡    时间: 2021-5-28 07:38
本帖最后由 肥仔胡 于 2021-5-28 07:39 编辑

现代水平肯定略高于古代和上世纪的水平。我不是说清代三圣,坂田先生,吴先生的才能比柯洁,申真胥差,是因为现代训练手段的多样性,对局的便利性远远超过古代,从棋谱质量和对抗性肯定是现代强。(当然我极端反感将古代大家描述成业5,这些大师如果生在现代一样会出人头地的)。陈周的才华和黄范施差了个等级,甚至知名度和后世评价比周东侯,程兰如,梁魏今都要低点,即便他们有惊世之作,那也是昙花一现,说明不了什么问题,更何况是为了服务于美化包装目的,在技术上刻意引导出的结果。
作者: zjh889    时间: 2021-5-28 22:55
古人的围棋水平,的确还是蛮高滴!
作者: 三国大军师    时间: 2021-5-29 00:13
肥仔胡 发表于 2021-5-28 07:18
崔灿五段对三国大军师兄的帖子进行了反驳。

我当然知道了,崔老师年都没过好,整整一个月绞尽脑汁,费尽心思,洋洋洒洒写了四篇雄文驳斥这篇文章:)
可把崔老师辛苦坏了。
不过本文催生了崔老师的学术论文面世,呵呵…
作者: 三国大军师    时间: 2021-5-29 00:14
我们跟崔灿老师交手多次,对他可谓知己知彼,知根知底。
作者: 三国大军师    时间: 2021-5-29 00:23
崔老师学术论文用卡塔狗强机,1000k每步计算量(这点鄙人相当佩服)工作量之浩大,可谓前无古人!
这就是崔老师的结论:本人看到,实在忍不住哈哈大笑
因为我看到的结果竟然是:范西屏吻合度强于1988-2000年的任何一位世界冠军,包括横扫棋坛的无敌霸主李昌镐的最高数据!
这点崔老师当然不方便明说,只好含糊其词了事,以体现研究学者的严谨…
作者: 三国大军师    时间: 2021-5-29 00:29
这里普及一下卡塔狗1000k每步计算量什么概念,每天24小时不停机,大概跑三局棋谱,就是你步步遛狗,吻合度也就在60%多,绝不可能超过70%,也就是说:前阵子谣传某某作弊事件,那局在崔老师1000k计算量评测之下,吻合度大概不会超过60%,再保守一点,绝对不可能超过65%!
作者: 三国大军师    时间: 2021-5-29 00:35
崔灿老师为了驳斥本文可谓:用心良苦 他得出来一个结论:卡塔狗评测中的一个指标复杂度(即不确定度)是完全错误的,没有任何作用,任何价值。也就是说:崔老师100%的否定了ai复杂度这个指标,为什么呢?因为崔老师清楚的很,现代围棋对局局面的复杂度,远远低于当湖十局!
作者: 三国大军师    时间: 2021-5-29 00:38
所以,崔老师必须打倒ai复杂度(即不确定度)这个评测指标!
作者: 三国大军师    时间: 2021-5-29 00:43
我不禁有些纳闷,卡塔狗作者设置复杂度(不确定度)这个评测指标是毫无意义摆设吗?崔老师比卡塔狗作者还懂卡塔狗?即便如此,但凡对古代围棋规则了解的棋友难到就不知道,在座子规则和日式围棋规则之下,哪个规则下的局面更加复杂难解?就此打住,再说就有些多余了。
作者: 三国大军师    时间: 2021-5-29 00:54
补充一句灵魂拷问:崔灿老师如此旗帜鲜明毫不留情打倒卡塔狗评测指标之一的复杂度(不确定度),得到卡塔狗作者的授权和认可了吗?他对卡塔狗的了解比卡塔狗作者更深吗?卡塔狗会桑心吗?卡塔狗的作者会难过吗?
作者: 肥仔胡    时间: 2021-5-29 05:42
本帖最后由 肥仔胡 于 2021-5-29 05:47 编辑

崔老师没有否认复杂度,他明确说有三个帖子,将在下篇谈复杂度。我只是引用了他的第一个而已。他是用数据说话,是探讨,而不是用职业棋手的身份来压制普通棋友的不同意见,仅这一点就很难得。我个人认为古棋有十几个座子,非常程式化,是象棋化的围棋,极大压缩了棋盘的空间。当然象棋也会有激战,棋盘小也不影响激战的程度。但空间小,变化必然减少。我举个例子,我家里堆满东西,却说自己的房子面积比刚搬进来时大大增加了,这符合逻辑吗?围棋361手以上甚至400手以上的对局基本都产生于现代围棋规则。而且现代围棋规则是优胜劣汰的产物,座子制是以其代表人物被日本二线棋手让两子的惨败退出历史舞台的。我觉得座子制的棋友要恢复旧制也很简单,你推出一个代表人物把柯洁申真胥打败不就完了,最好把他们打到让两子惨败,这比任何数据都有说服力。
作者: 肥仔胡    时间: 2021-5-29 05:46
[attach]174367[/attach]

作者: 肥仔胡    时间: 2021-5-29 05:57
本帖最后由 肥仔胡 于 2021-5-29 06:05 编辑

不过,我个人对三国大军师兄没有恶感,辩论归辩论,不抓辫子,不扣帽子,不打棍子的三不棋友都是好同志。最后我还是要强调一点,范施或者周陈再怎么强,(我也认为范施很强,读棋的能力绝对不逊色于当今一线高手),但这能说明什么,和恢复旧制一点关系也没有,你得强调在现实条件下恢复旧制的必然性。
作者: 三国大军师    时间: 2021-5-29 07:10
晕,崔大神四篇煌煌大作早出完了,您还没看到呢,不妨弈客一看。
作者: 三国大军师    时间: 2021-5-29 07:12
至于他有没有攻击本文作者,他的大作一看便知。我跟崔大师是老朋友了,交情颇深,再说,信口雌黄的事儿鄙人不屑为之。
作者: 三国大军师    时间: 2021-5-29 07:15
这就奇怪了,您说崔五段在用数据说话探讨,难度《有远神》一文不是在研究探讨棋局,以数据说话?
作者: 三国大军师    时间: 2021-5-29 07:18
“而不是用职业棋手的身份来压制普通棋友的不同意见”您还是看了崔五段的大作再下结论不迟。
作者: 三国大军师    时间: 2021-5-29 07:28
中国人下了几千年的围棋,在您眼里,已经是“旧制”与“落后”的代名词,早该扫进历史的垃圾堆了,就从这点呢,我就不跟您解释或辩论下去了,已经没有任何意义。不过友情提醒您一下,有位崔灿的前辈棋手,职业八段王元,他在某个视频访谈中特地说了一点:他通过学习认识到中国座子棋的变化比现代围棋更多,现代空枰围棋的变化不是多了,而是少了。详见围棋频道《铭心棋局》王元,b站,优酷都有完整视频可看,当然,您如果认为王元不懂围棋,脑子有问题,发神经病,胡说八道也是合情合理,就当我没说这事儿。
作者: 三国大军师    时间: 2021-5-29 07:31
王元老师是批评过ai,有点跟不上时代,现在被各种批评,但是那个时候是10几年前,王元老师还是很清醒,很理智的。
作者: 肥仔胡    时间: 2021-5-29 08:00
本帖最后由 肥仔胡 于 2021-5-29 08:02 编辑

拜托,你不能把我没说过的话套在我头上,“扫进历史垃圾堆”我什么时候说过,请您截屏。而且我一直推崇清代三圣,认为他们的算力即便在今天也属顶尖高手之列,但要说他们超过柯申,甚至超过ai,任何有理智的人可能相信吗?现代职业棋手天天接触ai,吻合度还不如用算盘的古人,这种逻辑可靠吗?王元八段把ai贬得一无是处,当然为了弘扬爱国主义,他的炮火主要针对的是阿尔法。但他如此雄辩,如此高见,敢和里拉或卡塔狗来个受二子十番棋吗?看看能不能不被剃光头?座子制作为娱乐有何不可,“法无禁令即可行”,这个话我倒是说过的。棋友按“座子制”的规则自娱自乐,谁会反对谁有权利反对?相反古棋爱好者胃口太大,要逆潮流而动,要把“座子制”取代现行规则,这是违背绝大大多数的从业者和爱好者的意愿的。
作者: 肥仔胡    时间: 2021-5-29 08:12
现行规则是不排斥“座子制”的,秋止符兄说,两个下对角星不就完了,(我补充下不贴目)。为了克服对现代没有还棋头规则的不满,你按照古法十几个座子的程式化八卦布局,能最大限度减少和现代规则的不兼容。就是说现代规则是兼容座子制的。但座子制是排他的,你一下小目,三三,高目,目外,完了,第一步就犯规出局。现代规则这个所谓拖着日本长辫子的落后规则是可以和座子制和平共处的,但座子制是唯我独尊,谁不用座子连下棋的资格都没有,有理智的棋友,到底哪个规则好,相信大家自有判断。
作者: beiye    时间: 2021-5-29 09:45
一个小观点:你再怎么证明清代大国手水平如何之高,从逻辑角度也推导不出座子制必然优越的结论,就像清代大国手必然留着大辫子,我就有结论说,留着大辫子有利于围棋水平的提高,现代国手需要留着大辫子对局,这和前面是不是用数据说话没有如何关系
作者: 飞扬老头    时间: 2021-5-30 13:36
有理有据,不吹不拍
作者: 三国大军师    时间: 2021-5-30 18:55
肥仔胡 发表于 2021-5-28 07:38
现代水平肯定略高于古代和上世纪的水平。我不是说清代三圣,坂田先生,吴先生的才能比柯洁,申真胥差,是因 ...

我倒是非常期待,有研究评测日本古棋圣的名局,来证明其水平与《有远神》周陈或《当湖十局》一样高超,甚至更高一些。
哪怕单局评测研究也行,对不对。
棋友们眼睛雪亮,总是能看出门道的。
作者: 三国大军师    时间: 2021-5-30 18:58
比如崔五段在拿出自己升段对局的高吻合度时,是完全没有显示复杂度(不确定度)这一ai评测指标的。
作者: 三国大军师    时间: 2021-5-30 19:06
本帖最后由 三国大军师 于 2021-6-2 00:15 编辑

本人坚决赞成崔五段的结论:离开计算量,谈吻合度都是耍流氓。
下面这图无论任何计算量,黑棋吻合度都高的惊人。

作者: 肥仔胡    时间: 2021-5-30 19:45
本帖最后由 肥仔胡 于 2021-5-30 19:49 编辑

老兄啊,你真的迂得有趣,拿日本古棋用狗跑就跑呗,就像be iye兄和我之前说的那样,你证明来证明去要说明什么呢?你只有证明座子制的优越性才有说服力,在古人棋上较劲,古人都死了多少年了,ai证明他厉害,那也是间接证据。要证明座子棋的优越性,1,你必须证明座子规则受到全世界大多数棋迷的拥护,至少超过50%吧。同理,职业棋手同意你观点的也要超过50%。2,你要保证愿意承办座子比赛的赞助商成为赞助商的主流,比如他们说不搞座子,他们今后不会为围棋花一分钱。3,你们要推出一个古棋代表,把柯洁或申真胥打败,以证明古棋就是优越,学了古棋就是牛叉。座子这么好的规则怎么没的,就是因为座子制的代表张某某被日本五段让两子还惨败。你们推一个人物把柯申让两子打得满地找牙,座子制自然受到欢迎。可以让柯申配合,让你们的代表无论黑白都要下成对角星,另外你们的代表必须要用星位古定式,什么大飞,倒垂莲,四间夹,古谱上没有的定式,你们不许用,否则就是挂羊头卖狗肉,就是伪座子制。4,每个座子制的爱好者,必须扪心自问时刻反省,你们在别人挂角时有没有小飞,有没有夹攻(我指的是一到三间高夹低夹),另外有没有点别人三三,你们这样做是否对得起自己的良心,是否对得起古人。
作者: 三国大军师    时间: 2021-5-31 11:08
分享一下古棋的实战体会:现在下棋,都在用古棋理论和招法,确实,即使在古棋爱好者里面,用于实战的棋友依然很少。
不过我非常乐意用古招,以前的陌生和排斥感已经没有了,更多的是熟悉和亲切感。
然而这个熟悉亲切感来之不易,直到今年才有。去年我是完全不敢下古招,陌生复杂难以驾驭。
总结:
1对手用现代招法 则感双方简明可下
2对手用古代招法 则感双方复杂难下
因为我的棋友多是老业余5段,我实力明显弱一截,所以我会下的非常认真,正常一天完成一局。
如果棋力到不了老业3(野狐6-7),按我的学习经历,很难真正入古棋门,至于用古代招法,就更不知所云了。
我去年都惧怕实战古棋,大概很大因素是棋力不够,当时的感觉怪异:越学古招,越害怕畏惧。

作者: 天外肥羊    时间: 2021-5-31 11:27
empty your minds,
be formless,shapeless,like water.
now you put water into a cup,it becomes the cup.
you put it into a bottle,it becomes the bottle.
you put it in a teapot,it becomes the teapot.
water can flow,or it can crash.
Be water ,my friend.
作者: yanglei7010    时间: 2021-5-31 14:43
天外肥羊 发表于 2021-5-31 11:27
empty your minds,
be formless,shapeless,like water.
now you put water into a cup,it becomes the cu ...

某些人脑袋中都是面粉,你还要叫他们加水?

作者: SmileFox    时间: 2021-6-1 09:06
数据就是任人打扮的小姑娘,想分析出什么结果都是有办法的。
作者: 三国大军师    时间: 2021-6-1 20:55
本帖最后由 三国大军师 于 2021-6-2 12:04 编辑

不错不错,崔老师霸气的很,复杂度黄施范高,那就直接打倒!吻合度黄施范也跟世界冠军一致,没有办法全部打倒,将就用,姑且下个古今顶尖差不多的结论吧,但是…人家崔老师王霸之气可不是盖的,他的结论最后是:卡塔狗啥数据都不大可靠,最后要问他这样的专家!

作者: 三国大军师    时间: 2021-6-1 21:01
崔大师的说的斩钉截铁:离开计算量(1000k每步),谈吻合度都是耍流氓!棋友们知道这意味着什么吗?意味着一切比赛直播ai讲解,各位主播都是耍流氓,甚至胡耀宇八段老师的棋评都是耍流氓,因为计算量远远不到1000k每步!可是崔老师为什么不反驳这些呢?因为人家崔老师心里清楚着呢:一家人!只有棋友研究评测黄施范数据高的,才是对立方,敌人必须打倒!
作者: zjh889    时间: 2021-6-1 23:44
俺们见识了!
作者: 三国大军师    时间: 2021-6-2 12:06
本帖最后由 三国大军师 于 2021-6-2 19:02 编辑

我们已经习惯了:
1:日本围棋比中国古棋理论先进
2:我们从小下的就是日本围棋,谁愿意改变重学呢?
3:职业棋手说了,古棋最高业6,业5,黄龙士下不过道策等等…
4:中国古棋是“旧制”“落后”,其淘汰是顺应“历史潮流”
5:进化论,一代强于一代
6:古人的一切理论招法,现代棋手都会,现代的招法,古人不懂。

总之,日式围棋是最完美,完善,最先进,自由,最伟大的围棋。
中国座子棋必须打倒,提都不准提,说就是搞对立,必须反驳。
我个人觉得:中国座子棋存在了几千年,它必然有它存在的道理,难道我们的祖先不懂围棋可以空枰开局,非要傻傻的摆4个?来“减少”“束缚”围棋的自由,变化…他们所有人的智慧竟然不如日本一位算砂和尚?
胖胡兄整一个必杀技,直接把我打懵了:你们派代表用座子规则挑战柯申,打赢了就承认你们座子棋有道理!



作者: 三国大军师    时间: 2021-6-2 12:35
本帖最后由 三国大军师 于 2021-6-2 19:00 编辑

日式围棋规则现在通行世界,当然有它存在的道理,中国座子围棋规则一样应该有它存在的空间,两种规则是可以共存的。棋友棋手不是多了一种选择与实践吗?无论什么规则,最强的都是职业棋手。
事实证明:日式围棋培养了大批职业高手,同样也证明了中国座子规则培养的职业高手,比日本古代围棋国手更强一些,甚至与当代顶尖棋手比,也并不逊色。我们何必妄自菲薄,说中国座子规则不如日本规则?
作者: xwang71785    时间: 2021-6-3 13:58
至少,对古棋的研究又有了一条新的路经,值得大家探索。结论可以存疑,可以不断被推翻,但肯定是离真理越来越近的
作者: crx0807    时间: 2021-6-3 17:38
个人觉得围棋首先要好玩,然后再讨论究竟“地心说”正确还是“日心说”正确。最近几百年,日式围棋花样百出,好玩性方面完胜古棋;不过呢,随着AI出现,点33多了也好乏味,所有将来怎样恐难逆料
作者: 小刀向前冲    时间: 2021-6-4 11:38

作者: fumino    时间: 2021-6-12 12:49
人都被时代局限,这种比较意义不大,达芬奇如果在现代复活,他能创造出更多的奇迹吗,也很难说。但一个人只要发光,总能照亮些什么。
作者: 吴翰林    时间: 2021-6-16 19:55
蹭热点,发广告,我就是这么鸡贼。
请关注我的公众号“打狗棒法”,学了打狗棒法,遭遇看不惯的坛友可以直接打,不用浪费口舌。只需长按下图二维码,天下第一大帮——丐帮的镇帮功法,尽在一手掌握。
[attach]174646[/attach]


作者: 榉木    时间: 2021-6-17 16:20
fumino 发表于 2021-6-12 12:49
人都被时代局限,这种比较意义不大,达芬奇如果在现代复活,他能创造出更多的奇迹吗,也很难说。但一个 ...

好久不见又到吃西瓜的季节





欢迎光临 飞扬围棋 (http://bbs.flygo.net/BBS/) Powered by Discuz! X3.2