飞扬围棋
标题: 江湖视野:中日古今围棋名家棋力排行榜,范西屏古今第一! [打印本页]
作者: 三国大军师 时间: 2021-9-22 10:10
标题: 江湖视野:中日古今围棋名家棋力排行榜,范西屏古今第一!
本帖最后由 三国大军师 于 2021-9-22 18:09 编辑
一、前言
围棋,以其独特的魅力,闪耀在华夏文明的历史天空。从“尧造围棋,以教丹朱”算起,至今已有四千多年的历史。神仙隐士、帝王将相、文人雅士和围棋名家,留下不朽的传说和浩如烟海的围棋论著。到了清代康乾盛世,中国古代围棋登上顶峰,名家辈出,以黄龙士、范西屏和施襄夏最为著名。关于清代大国手水平如何,众说纷纭,一直未有信服的结论。
今年八月,第九届(2021) 中国杭州国际棋文化峰会传来重磅消息,职业棋手崔灿五段发表学术论文,第一次应用开源围棋AI——网友Y zy的修改后的Lizzie程序,从统计学上论证
了“黄范施”三人代表的清代围棋中盘水平,与当代职业顶尖棋手及日本江户时代顶尖棋手的差异不具有显著性。清代围棋布局的水平确实与当代棋手存在差距,但与日本古棋的布局水平至少在伯仲之间。
崔灿的结论是建立在大量的AI分析棋谱数据上的,其科学性和严谨性,基本消除人类评价棋谱的诸多短板,结论接近客观。但是,由于概率的影响,崔灿依据吻合度评估古今围棋名家的棋力,只能得出“差异不具有显著性”的结论,无法准确评估棋力。显然,崔灿的研究方法还存在进一步完善的空间。
作者在使用LizzieYzy整合包大量跑谱分析中发现,由于棋谱的复杂性,仅以吻合度评估棋谱存在吻合度虚高的局面,如果辅以复杂度(不确定度),用双重指标评估棋谱,可以更加精确的评估出棋手的水平。本文工作初步完成于今年年初,原打算进一步充实数据后再公之于众,但是由于俗务缠身,忙于奔波,至今进展不大。考虑再三后,先将研究方法公布,期待与广大棋友共同研究。
二、名家棋力排序的重要性
或许有人问了,关公战秦琼,真的可以实现吗?
对曰:人类走过了漫长的“天有不测风云”,今天,准确预报天气可以以小时为单位。您觉得关公战秦琼还遥远吗?
本文认为,名家棋力排序,重要性至少有以下两点:
(一)是民族自信,文化自信的体现
清代大国手的棋力一直褒贬不一,其中不乏没有认真了解而盲目下结论的,科学准确评估清代大国手的棋力,还原历史真相,树立民族自信,文化自信,在中国围棋文化建设中当仁不让。
(二)探索棋艺真理,追求棋艺巅峰
职业棋手的职业精神,不会囿于胜负,而是在棋艺探索的道路上,上下求索。吴清源木谷实的《新布局法》,陈祖德的《超越自我》,聂卫平的《围棋八大课题》,小林光一的“木桶理论”,马晓春的《三十六计与围棋》,无一不是自己探索棋艺真理的结晶。科学准确评估围棋名家的棋力,只为寻找出一条通向人类棋力巅峰的捷径。
或许有人说,AI棋力强过人类太多,人类向AI学习即可。
对曰:人类能够学习AI定式,能够学习AI布局,能够学习AI的中盘吗?
只有人类棋谱的中盘,才能为人类所理解,所共鸣。
三、研究方法
(一)吻合度评价的修正
从棋谱评价棋力是围棋界长期以来喜闻乐见的活动,大概棋力高低是大家关注的核心问题。AI出现以来,爱好者们开始用AI的吻合度来评价。必须承认,要评价棋力,吻合度是绕不开的指标。然而总体吻合度数据直接使用也有不妥,应该剔除一些噪声。在此首先对本文在吻合度使用方面做的一些修正予以说明。
首先,本文认为,布局和与胜负无关的官子属于噪声,应予剔除。
为什么布局需要剔除?举一个例子,我又一次观看儿童比赛,两K级儿童讨论点三三定式,甲对乙说“我这个大十字比你那着退胜率好2%,目差好0.2目”。难道现在K级儿童都这么厉害了吗?一会定式结束,双方每手目差波动20目!试问0.2目的优势有何意义?AI时代之前是套路时代,套路时代之前是定式时代,棋力低的人摆摆定式或者套路与高手并无区别。如果把这些手数也算作棋力的一部分,显然是不合理的。这里有一个关键的概念:知识不等于能力。如果知识等于能力,那么如今任何一个大学生都胜过牛顿。但是牛顿是知识的创造者,普通大学生是知识的学习者,两者根本没有可比性,难道因为你多学了一些知识就提高了创造力了吗?这根本就是两码事。如果说科学领域知识多还算是一种优势,那么对于围棋,千古无同局,每一盘都是在创造知识,所以棋力应该是创造知识的能力,也即下棋的能力,所以会背多少套路与棋力关系不大。这里多说两句,现代围棋布局进步很大,有些棋友就有了一种学习套路之后变得强大的幻觉,包括学习AI之后也会有这种幻觉。这种观点自相矛盾之处在于以方面认为套路都是必然之招,另一方面又把套路的演变当做进步。其实个人认为,套路,包括AI套路不过是时装界的流行时尚而已,与棋力关系不大。在此问棋友们一个简单问题,你能通过学katago的招法赢zen7吗?恐怕该赢不了的,依然赢不了。
那么布局剔除应从哪一手开始?本文认为应该从胜率开始比较大的波动开始,而不是某固定手数。这里重点是胜率开始向某方单向波动,即是开始。至于一开始双方的无序波动,则不计入。从经验看,中国古棋从十几手的时候就开始中盘了,而典型的日本下法布局可能要延续到四、五十手。AI时代之后,由于职业棋手大量学习AI,前50手胜率无波动是常事。这些部分的着法都应剔除。也许有的棋友认为这不公平,但是这个方法很好地解决了AI时代吻合度虚高的问题。
在胜负已经分明的前提下,官子手数也要剔除。这个很好理解,比如即使半目胜负,如果棋盘上只剩后手两目的小官子,逆转也是不可能的,而且这种情况收官次序也可以不唯一,那么吻合的价值就大打折扣。相反,如果差距较大而官子手数较多,这难免有整理心情的因素。(中国古棋子彩规则例外)这部分着法是否严谨很难保证,而且客观说,官子到最后,难度大大下降,不足以体现棋手的水平,尤其对于职业棋手,用一些业三都能下对的局面去评价他们的水平并不合适。
崔灿在他的论文中剔除了180手之后的内容,可能也是出于上面考虑。但是本文并不机械地限制在180手。本文以胜率单向波动结束为标志。
作者: 三国大军师 时间: 2021-9-22 10:11
举例说明:图中是比较典型的例子。布局开始单向波动可以看到是14手之后,所以从14手开始统计。203手以后基本都是小官子,所以统计到203结束。
本文的统计方式比较灵活,对于布局好的棋手,如果能在布局取得优势,那么胜率也会开始单向波动,所以计入统计。这样就不会因为从某固定手数开始统计而错估了布局实力强的棋手。同时官子省略掉所谓的“垃圾时间”,但是如果像李昌镐那样的官子强的棋手,在官子决胜的时候必然还伴随着胜率单向波动,所以也不会忽略。这里胜率单向波动是一个重要概念,与之相对的是胜率的随机涨落。单向波动被认为是有实战意义的,是某方策略得当或者行棋好手的效果。
其次,本文吻合度全部使用一选吻合度。崔灿论文中使用吻合度是katago默认的前三吻合度,本文则使用第一吻合度,即只看首选。只看首选的原因在于在棋局关键处,差之毫厘谬以千里,看前三吻合看似也有道理,在那些不紧迫的局面下二选、三选也是可行的。但是我们的思想是要考虑吻合的价值,考虑吻合的难度。一个棋手在胜负关键处是否吻合其价值和胜负已定的时候是否吻合价值不同!在胜负关键处着着一选,绝对是需要强大的棋力支撑的!基于上面想法,本文使用一选吻合度。
再次,本文不仅仅看平均吻合度,还要兼顾最低吻合度和最高吻合度。这是因为要观察棋手的最强极限和稳定性。最高吻合度越高,说明棋手的绝对水平越高。注意,本文已经剔除了布局套路、定式和与胜负无关的官子的影响,在这种情况下能够取得高吻合度必然是棋力高的表现。考察最低吻合度可以观察稳定性,尤其是最高最低吻合度相差越大,稳定性越低。如果两者相差巨大,那么可以认为该棋手属于通常说的“神经刀”,不可否认现实中有这类型的棋手。
本部分小结:
1、剔除布局和与胜负无关的官子。布局从胜率较大波动开始,而不是某固定手数剔除。在胜负已经分明的前提下,官子手数也要剔除。
2、吻合度全部使用一选吻合度。
3、不仅仅看平均吻合度,还要兼顾最低吻合度和最高吻合度。
(二)不确定度(复杂度)
不确定度作为次要指标,也占有重要的位置。在统计对局数据时发现棋手在达到某一个不确定度之后常常发生不吻合。当然,棋局内容不同,不确定度的含义也不完全一致。但是高不确定度意味着复杂战斗,这点是没有问题的。本文提出掌控复杂度的概念,或者叫复杂度上限,即一个棋手在战斗局面中能够保持较高吻合度的不确定度(复杂度)。这个指标作为棋手棋力的一个方面在本文给出。
作者: 三国大军师 时间: 2021-9-22 10:14
本帖最后由 三国大军师 于 2021-9-22 10:15 编辑
举例:以下图中不确定度在30以上,都不吻合,说明棋手在30以上不确定度吻合度较低,30超过复杂度上限,发挥不稳定。
作者: 三国大军师 时间: 2021-9-22 10:16
不确定度25+,结果吻合,说明掌控复杂度在25左右。
作者: 三国大军师 时间: 2021-9-22 10:18
以上是识别掌控复杂度(复杂度极限)的大致过程。
在现代棋局中,高不确定度对局出现得并不多,这给选局带来一定困难,尽管如此,本文认为这应该是棋手能力的一个重要方面。对于一局纯粹的功夫棋,可以认为无法体现棋手的这方面能力,那么可以认为棋手能够回避复杂战斗吗?我们认为这种回避需要双方的配合。过去某些叱咤风云的绝世高手没准只是对手配合的结果。至于对手配合的原因,应该和认知有关。总之棋艺的进步总是先从改变认知开始。AI的出现已经很好地证明了这点。本文认为如果某棋手所有的功夫棋吻合度都达到了很高的水平,但是却找不到一盘不确定度高的棋来证明其战斗力,那么对其评价都是不完整的、缺失的。
至于不确定度本身的讨论,网络上文章已经很多,不再重复。在此只给出结果。
本部分小结:掌控复杂度,或者叫复杂度上限,即一个棋手在战斗局面中能够保持较高吻合度的不确定度(复杂度),应作为评估棋手棋力的指标。如果某棋手所有的功夫棋吻合度都达到了很高的水平,但是却找不到一盘不确定度(复杂度)高的棋来证明其战斗力,那么对其棋力评估不完整。
(三)AI不同权重的评价结果
本文在评价人类棋手棋力之前,先把上述方法用于AI不同权重。方法是用不同AI权重生成自战谱,然后用katago40b384进行评价。katago40b384大概目前仍然是最强AI权重。即便不是,也强于本文自战的其他AI,因此方法原理上应没有问题。
本文之所以这样做是因为人类棋手的棋力比较富有争议,尤其是那些关公战秦琼之类的比较。一个方法能否成立,首先看能否有效地区分不同AI权重的棋力。只有能够有效地区分权重,才能进一步推广到人类棋手的水平评价,这是基本前提。AI不同权重的棋力是已知的,如果一个方法能够区分AI不同权重,理论上用于评价人类棋手棋力也没有问题。
下图给出katago6b,10b,15b,20b,30b,40b的分析结果。使用的指标有全局吻合度,波动区间吻合度和复杂度。可以看到全局吻合度和区间吻合度都可以有较好的区分度。但是复杂度指标在本文中没有应有的体现。这是因为即便AI自战也不是总是能下出高复杂度,这本身就是可遇而不可求的。所以在本文计算资源有限的情况下,没有生成足够多的高复杂度对局,也就正常了。但是从谷歌给出的Alphago自战和Alphago和master对局看,高水平的AI是可以下出很高的复杂度的。但样本确实太少。
作者: 三国大军师 时间: 2021-9-22 10:19
本帖最后由 三国大军师 于 2021-9-22 10:21 编辑
(一)日本古今棋力鉴定总图
本文给出日本历代高手棋力鉴定总图。每位棋手选择10-15局对局。Katago20b256,10k。
从区间最高吻合度来看,最高的二位是吴清源和道策,其次是秀荣和算砂,随后的一个档次有丈和,秀哉,六超和坂田荣男,而井山裕太还不如六超。从稳定性上看,秀哉秀荣比较突出。而平均吻合度上看,和最高吻合度结论比较接近,不同在于吴清源和秀荣最高,其他几位本因坊和六超差不多
作者: 三国大军师 时间: 2021-9-22 10:22
崔灿的文章中说道策被严重高估,之所以本文结果不同在于选局不同。造就道策高吻合度主要是和选择了安井春知的对局。一盘让二子,被誉为道策一生名局,道策吻合度高达57.4;但是这盘棋打劫之后局面简化太早,导致复杂度极低,从而吻合度虚高。另一盘道策执白,道策取得了最高吻合60.3,但是对手只有34.2,可见对手太弱导致吻合度虚高。这种现象不是孤例,道策的对手水平普遍偏低,也就是业余5或强业5最多弱业6,在目差胜率大幅波动区间安井知哲这类棋手的第一选点吻合度只有25-33。当然,本文并不想故意贬低道策,但是客观说道策发挥确实存在忽高忽低的情况,最高可以达到世冠水平,而最低只有业5-业6水平。一些下得很好的棋不排除集体研究的结果,这时数据很漂亮;但是也有很多发挥失常的情况。排除这些因素,单从棋谱数据看,假设数据好看的地方是真实水平,而数据难看之处属于偶然失常,道策的水平勉强能够达到普通职业九段的棋力,一般也就是职业五、六段的水平;一般布局复杂度16-18;中盘可以达到17-21;复杂度极限是26-26.5。
作者: 三国大军师 时间: 2021-9-22 10:23
本帖最后由 三国大军师 于 2021-9-22 10:24 编辑
此局为道策让子名局,黑框中复杂度度早早降到17-12,120手之后都是极低复杂度之下取得的,因此吻合度虚高。
作者: 三国大军师 时间: 2021-9-22 10:25
吴清源的最低数据则是这局产生的。如果不是本文的选取标准的话,整体数据41.5还算可以。黑棋后面出了勺子,算是意外吧。
从掌控复杂度来看,秀哉,秀荣、丈和、吴清源比较高,但相差不多,一般在26-28的样子。
总体评价日本300年围棋的发展,当得起一个 “稳”字。在小幅波动中缓慢攀升,应该是最好的描述。
作者: 三国大军师 时间: 2021-9-22 10:26
(二)中国古今棋力鉴定总图
下图是中国古今棋力鉴定总图。
作者: 三国大军师 时间: 2021-9-22 10:28
每位棋手选择10-15局对局。Katago20b256,10k。
与日本相比,中国古今棋力的数据图风格完全不同。
总体来说,AI的数据体现了古代黄龙士为一高峰,范施为第二个高峰,周小松为最后高峰,三个高峰在数据上表现得十分精确。AI数据也表现了建国以后围棋水平稳步提高。
从最高吻合度角度,首先映入眼帘的是范西屏最高吻合度第一,施襄夏略低。柯洁、黄龙士和周小松紧随其后,都在60左右。这些棋手的数据稳稳超过日本历代棋手。徐星友,程兰如,梁魏今、陈子仙与日本六超在数据上完全可以一争,甚至晚晴十八国手也只稍逊色而已。从平均吻合度来看,范施仍然最高,但是徐星友,周小松的数据也赶了上来,差距缩小不少。现代棋手中古力、常昊的稳定性是比较高的,但是锐度较柯洁差一些。
从复杂度角度看,范施的当湖稳居第一,复杂度上限为37左右。超过30的还有黄龙士,徐星友,程兰如,梁魏今胡兆麟。周小松和柯洁接近30。
有意思的是胡兆麟,胡兆麟作为最强二手,在二手中留下棋谱最多,共70余局。胡兆麟的数据可谓大开大合。上限可以达到世冠水平,下线却仅仅是业余水准,平均数不到40,属于职业低段水准,复杂度极限则达到世冠水平。当然,达到世冠水平的棋局是授先对施襄夏的三局中体现的,推测是胡兆麟后期的水平。联想到胡兆麟盐商的身份,一子一金的子彩,这位棋手下棋水平虽然不低,但是确实是娱乐为主!如果最高吻合度和极限复杂度能体现他的真实实力,那么胡兆麟实际上是以为具有娱乐精神的超级棋手!说白了,就是被盐商的身份耽误了!
与日本横向对比看,过百龄是数据和雁金准一,濑越宪作这样的棋手很像,但是掌控复杂度要超过。综合看强于日本这二位的可能性很大。从《晚香亭弈谱》看,程兰如的水平在晚年的时候有所衰退,但是依然能保持在和六超相同的水准,至于年轻时显然是超过许多。至于范施,20bAI自战谱用katago20b256权重10k测试区间吻合度在65-73,范施的最高水准已经进入这个区间!20bAI自战棋谱复杂度目前数据看35以内为绝大多数,而范施极限复杂度达到37。换句话说范施的水平发挥到最佳时数据已经可以媲美20bAI!当然血肉之躯不可和机器相比,稳定性要逊色。尽管如此,假设吃饱喝足状态巅峰的范施和20bAI来一场较量,没准真的能赢。这应该是人类目前为止的巅峰了。
也许有的棋友会怀疑,疑惑,甚至彷徨不解,古代棋手真有那么强吗?谷歌留下的40Balphago自战高复杂度区间很长,现代棋谱高复杂度通常要短很多。这是因为现代棋手会选择简化局面,在这方面甚至双方默契。但是施襄夏和程兰如的九龙戏珠谱复杂度在30-36这个区间有接近200手,程和施胜率没什么大的反复,程没有翻盘的机会。数据不会说谎!(当然孤例不说明问题,仅供参考)
单纯看最高吻合度,道策和吴清源也达到60多,似乎也接近20bAI,但是道策的对手太弱,棋局复杂度太低。相比吴清源还是可以的,只不过复杂度也有点低。而范施的对局一般复杂度都比较高,这是区别所在。
作者: 三国大军师 时间: 2021-9-22 10:30
(三)精确对比范施和柯洁
大概一年前,棋友Bionicmed曾在网上发表文章,用katago40b1000k计算量比较范施的当湖十局和柯洁的世冠重要比赛10局,通过吻合度比较得到了棋力近乎严格相等的结论,当时在网络上引起热议。由于Bionicmed与本人相识,本人得到了Bionicmed的数据,用本文方法分析得到结果如下:
Bionicmed用全局选点均值作为比较标准,确实柯洁和范施差不多。
作者: 三国大军师 时间: 2021-9-22 10:32
但是如果用本文方法,区间吻合的最高,最低柯洁都要低于范施。这是因为Bionicmed选取的是柯洁2016年以后的棋谱,布局方面是有加成的,去掉加成则数据低于范施。同时这也说明了,范施作为人类高峰,即使现在的棋手学习了AI,数据上恐怕也难以占到上风。毕竟,现在没有那个棋手敢说达到了20BAI的水平,哪怕一次也没有。至于复杂度极限,毫无悬念是范施更高。其实,范的几局在关系胜负的区间吻合度低但是胜率目差没有反转的棋说明他的与AI选点完全不同的下法也是可行的。而这样的现象在现代对局中极少出现,这暗示着中国古棋有着我们还没认识到的独到之处,AI也不是全能的,它也不可能扫描出所有的可行点。现代职业可以下出AI选点之外的好棋,但是这样的例子并不多,但是范施的棋中这样的现象并不少。
作者: 三国大军师 时间: 2021-9-22 10:32
本帖最后由 三国大军师 于 2021-9-22 10:34 编辑
(四)其他
首先要为刘棣怀老先生正名。
刘棣怀的数据没有那么差。从平均水平看,职业四、五段肯定有。刘棣怀因为输给伊藤有惠老太太而背负骂名,其实如果从棋谱上看,就是最后出了个勺子而已,否则是优势。刘当时就表示年纪大了,不想上。赶鸭子上架非上不可,还是精力不济出错。
作者: 三国大军师 时间: 2021-9-22 10:35
其次,公布人类业余到职业顶尖的AI数据分类图:
作者: 三国大军师 时间: 2021-9-22 10:36
本帖最后由 三国大军师 于 2021-9-22 10:40 编辑
五、写在最后
本文的目的主要在于探讨AI评价棋力的方法,由于本文工作采用的是少量数据,结果仅供参考。本人实在受限于资源,不能大量研究。更多的是希望抛砖引玉,希望广大棋友能够提供更多是数据,更详实的资料,更科学合理的方法、策略和规范,届时能够得到更加客观的结论。科学研究崇尚置疑,哪怕和本文结论有所不同,也是好事。本文的另一个目的是探讨棋艺本质。AI出现以来,反思过去,似乎人类围棋走了一段弯路。厘清棋艺本质,消除认知误区,追求围棋认知更高,行棋步调更快,掌控能力更强,这不仅是职业棋手的追求,也是棋迷朋友的追求。AI数据已经反复证明了中国古棋的强大,这是科学,这是事实。承认中国古棋的强大,才能虚心的向前辈棋手学习,汲取营养,站在巨人的肩膀之上。
国运昌,棋运昌。有康乾盛世大国手的参照,我们,还在等待什么?
作者:黑夜传说 武道低手
作者: 无聊下下棋 时间: 2021-9-22 11:18
前几天不是说道策不如业六吗?吴清源干不过什么晚报杯冠军,什么马天放吗?现在马上就转变得那么快啊?还是有个兄弟讲得对,不要随便用你的爱好,去评论人家靠来吃饭的本领。免得被人笑你无知!
作者: ccnie 时间: 2021-9-22 11:39
文章开头提到了笔者的研究,却对该研究中AI分析应遵守的一些基本原则视而不见。
姑且不论该文的手数剔除缺乏明确准则,棋局总手数与阶段不同带来的对比不公,“一选吻合度”多为“必然招法”的争议,“不确定度”与吻合度结合的逻辑硬伤等等问题,单凭其只字未提棋谱样本详细情况,以及选择的标准这一点,得到的数据与结论就缺乏讨论价值。笔者年初弈客的系列文章中已经强调:如果样本可以随意挑选,想要“证明”什么就能证明什么。
作者: 无聊下下棋 时间: 2021-9-22 11:47
一个专业棋手搞统计学。和一个搞统计学的人,跟专业棋手下棋。结果会是怎样?来搞笑的
作者: ccnie 时间: 2021-9-22 11:54
有问题可以直接说,而不是诉诸于身份
一些棋友对笔者研究结论的解读与引申,得到了原文统计学方法并不能推出的内容。笔者近日将撰文说明,顺便对研究的一些质疑进行回应
作者: 无聊下下棋 时间: 2021-9-22 12:07
ccnie 发表于 2021-9-22 11:54
有问题可以直接说,而不是诉诸于身份
一些棋友对笔者研究结论的解读与引申,得到了原文统计学方法并不 ...
不是说你,你误会了,我意思是说统计后得出道策业六,吴清源干不过晚报杯冠军那样的结论
作者: 三国大军师 时间: 2021-9-22 12:22
崔灿老师用吻合度单一标准吻合度数据测试棋力,只能得出:古今顶尖没有显著差异性这个大方向基本正确但相对模糊的结果
所以我们应该探讨更多标准,更多方法来评价棋力,使之更加准确,接近真相。
为反对而反对有些意气用事了。
但是有一点可以肯定,大家一起努力,正在往正确的道路上探索与前进。
至于选局标准,作者断断续续两年多的工作量也有些大,肯定有的,只是暂时没公布吧。
作者: 三国大军师 时间: 2021-9-22 12:33
文无第一,武无第二,围棋作为智力竞技类游戏,人类顶尖棋手就必然存在棋力的真正而准确客观的高下之别,随着ai越来越强大,我们距离真相将越来越近。
作者: 三国大军师 时间: 2021-9-22 12:37
本帖最后由 三国大军师 于 2021-9-22 13:07 编辑
本文作者之一武道回复崔灿老师:
崔灿你好,当初在群里讨论的时候就有分岐,如今俱已退群,但往事记忆犹新。抛开不愉快的那些,只从学术角度而言,你的论文是独立体系,我简化引用并不为过。我有我的体系,和你既不矛盾,也没必要非跟随你不可。
你自己也在不断修正,你现在的方法与当初不同。我们也一样。分岐和当初一样,只是时间地点变化了罢了。谁能提出一套令人信服的方案,谁才笑到最后。你的方法难道没有问题?文章里说的你还是好好想想吧,光挑毛病很容易。让别人后发先至估计也不是你所愿,所以还是多正视自己的问题为好。
我们受资源限制,问题有,这个承认,所以才广邀爱好者共同研究,文尾说得很明白。
作者: sql1433 时间: 2021-9-22 15:24
用现代围棋的AI跑座子围棋,我是觉得就是个伪命题。之前看过前几十盘Alpha zero的自对弈,有第一步下天元的,有随便下的……经过一段时间的自我提升,成为了现代AI围棋的路数。这个就是一个现代围棋棋理发展的一个缩影。而座子围棋呢?是否确定范施黄等人已经走到了座子棋棋理的终极?走的是最先进(或者说最合理)的布局?刨除了这些,单纯的用AI跑古谱,我觉得就是在耍流氓。如果真的有那个技术水平,做个类似与以座子围棋规则运行的alpha zero,使用自对弈的方式提升棋力,然后再分析棋谱,我相信绝对又是一个新的光景。
作者: 三国大军师 时间: 2021-9-22 16:08
有些棋友不知道卡塔狗能适应各种规则,现代规则,不贴目规则,座子还棋头规则都不是问题。甚至座子还棋头规则可以调整贴目来解决白初始胜率过高等等问题。 总之,对卡塔狗来说,规则不是问题。
作者: sql1433 时间: 2021-9-22 16:23
本帖最后由 sql1433 于 2021-9-22 16:25 编辑
适应规则是适应规则,训练方式依旧是按照现代围棋的规则实现的。所以骨子里对局势的判断依旧是现代围棋的路数。让现在的围棋棋士下座子围棋也可以,但是行棋的理念和方式我相信绝不是贴合座子围棋的最佳方式。而刨除了这一点的古谱分析,我觉得可能与座子围棋本身的棋理背道而驰的。
作者: 碧空晴 时间: 2021-9-22 16:37
这个没办法100%贴合的,比如你让古力来解说聂卫平的棋,或者小林光一解说井山的棋,绝艺讲解星阵,总有误差。。。。。。
作者: jzhang 时间: 2021-9-22 16:52
本帖最后由 jzhang 于 2021-9-22 16:55 编辑
按这个说法,你一不是计算机AI工程师,二不是职业棋手,只是无聊下下棋的,也敢来品头论足?另外,我要提醒你,AI不是用来下棋的,至少也用在国际象棋、将棋、电子竞技游戏,从职业分类上来说,连个职业棋手都不是。
作者: 无聊下下棋 时间: 2021-9-22 17:09
jzhang 发表于 2021-9-22 16:52
按这个说法,你一不是计算机AI工程师,二不是职业棋手,只是无聊下下棋的,也敢来品头论足?另外,我 ...
我不敢也没资格品论道策吴清源的棋力,但我按常理出发考虑,道策吴清源毕竟是围棋某个时代最拔尖最优秀者,竟被他们贬得如此不堪。数以千计的围棋专业人士都未敢那样认为。竟被门外汉那样认为,不合常理。
作者: 三国大军师 时间: 2021-9-22 17:43
本帖最后由 三国大军师 于 2021-9-22 18:29 编辑
卡塔狗有20%对局量中国座子规则,另外道策业6,晚报杯强豪水平,黄施范授二子,是我历来的观点,崔灿五段的研究论文结论是:道策水平历来被严重高估,道策吻合度与黄施范具有显著差异性。
至于黑吴清源大师,那是吃龙万吨团伙干了20年的事。
本文综合数据洽洽证明:日本围棋400年至今,巅峰吴清源大师棋力第一,六超,井山裕太均弱一些。
作者: 肥仔胡 时间: 2021-9-22 17:46
范西屏第一,这个第一的时间范围和地理范围请交待清楚,你这个标题在含糊其辞。
作者: 三国大军师 时间: 2021-9-22 17:50
胡老师毕竟是胡老师,立场坚定,眼里揉不得沙子,内容可以不看,不管三七二十一,先反对了标题再说再说。
作者: 肥仔胡 时间: 2021-9-22 18:02
我反对你什么?你这个“第一”是省里的,县里的,还是街道的,公社的,时间呢?几几年到几几年?这么没文化的标题,别人不看内容就饱了。或者你自己都觉得说满话底气不足,故意含糊其辞?我没空和你们吵谁第一,至少你把标题修改一下,明确定位。
作者: 三国大军师 时间: 2021-9-22 18:14
文章的标题很清楚,中国日本古代到今的围棋名家棋力排行,范西屏第一,不知道胡老师没看懂是怎么回事。
作者: 舞断清风刀 时间: 2021-9-22 18:39
自嗨是权力
作者: jzhang 时间: 2021-9-22 18:42
本帖最后由 jzhang 于 2021-9-22 18:45 编辑
数以千计的职业棋手都认为点三三是错误的,数以千计的棋手沉醉的错误的理论和错误的定式中。为什么还有人拿数以千计来说事。
关于高川是不是相当于黄施范的业五,我好象高估了高川本因坊。从冷酷的数据分析来看,高川跟中国三棋圣比,综合实力上还是有差距的。
作者: 肥仔胡 时间: 2021-9-22 19:45
看懂了,标题改过就可以,早该这么改。至于内容我不发表意见。
作者: 舞断清风刀 时间: 2021-9-22 19:49
现在网络本身是小学的狂欢
作者: davy 时间: 2021-9-22 19:53
研究方法还可以。现在最重要的是怎么搞出一个公认的金标准来评价棋力。楼主文中用不同block的权重来代表不同棋力,我觉得有道理。但后面没有给出数据来验证你的标准是否准确的判断了不同block的棋力。我建议你目前的工作不要去比较真实棋手的棋力。先把基础打好,找出合适的验证标准。不同block的权重棋谱是一个很好的验证集。请楼主参考。另外统计学上有专门的诊断性统计方法,可以找些资料或专业人员参考下。
作者: 三国大军师 时间: 2021-9-22 20:23
仔细看一遍文章发现一个惊人的事实,范施最高水平竟达到了20b狗的程度!这个情况让自古以来的贬中古人士情何以堪!?
作者: 肥仔胡 时间: 2021-9-22 20:35
下棋达到20b都是小菜了。范在抗日战争时看到鬼子一辆坦克,撅巴撅巴就把坦克的炮管掰折了,拧巴拧巴扔垃圾桶,横店出品。
作者: 小刀向前冲 时间: 2021-9-22 21:08
作者: 草原游侠 时间: 2021-9-22 21:57
一天到晚发这些无聊的东西,也不知道你能证明什么?关公战秦琼,没有实际对局,仅仅抱着一台狗就以为掌握了世界。再怎么跑AI,也改变不了中国古棋在清末民初被日本按在地上打的现实。
作者: ILoveBt2 时间: 2021-9-22 22:37
谁能帮忙把这些个范西屏,道策,秀策等等整复活了,和现代职业棋手整个升降十番棋?哪怕只能复活一天,下个一盘棋也好。从6月份以来论坛里一直整这些个帖子,看着有点烦了。或者阿杨老大帮忙开个新的板块,喜欢关公战秦琼的可以移步那个板块好好辩一辩。
作者: 无聊下下棋 时间: 2021-9-22 23:13
jzhang 发表于 2021-9-22 18:42
数以千计的职业棋手都认为点三三是错误的,数以千计的棋手沉醉的错误的理论和错误的定式中。为什么还有人 ...
围棋的输赢根本就不取决于是否点33,很简单的道理,如果点33是有利的,那被点的一方就是吃亏。完全可以下小目那些不被你点。所以就根本不存在以前的职业棋手都认为点33是错误的问题。一阵流行风而已。跟以前的布局套路差不多。
作者: crx0807 时间: 2021-9-22 23:16
这样的研究看着有点意思~且不论误差还有多大,至少是向正确的方向迈了一大步!
作者: crx0807 时间: 2021-9-22 23:26
都说围棋下得好需要天赋,到底需要什么天赋?从来没人能说清楚,想解开这个谜很难的。
文章能多维度多图表说明挺好,有高有低的数据也是有一定说服力
作者: 闲云野鹤123 时间: 2021-9-22 23:49
阿狗自战点33,最初布局架构是黑星小目对白二连星,先掛一个角再点33,现在则是立马开干,是否具有相等价值不得而知?
作者: 三国大军师 时间: 2021-9-23 01:22
本帖最后由 三国大军师 于 2021-9-23 01:37 编辑
极少数棋友开始思考深层次原因所在了
继续引用这位棋友的话
“曹薰铉以36岁"高龄"夺得应氐杯时,与老聂还下得有来有往。然而,这只是老曹夺冠之路的开始,之后的老聂就完全不是对手了。而之前老聂对老曹甚至颇有轻视,导致应氐杯时准备不足。唯一的解释是老曹涨棋了,涨得还不少。为啥能涨?看看老曹国内的对手就知道了。”
“我讲高龄的意思是36岁后还涨棋了,涨得还不少,这点可以确认吧!老曹和武宫年龄差不多,为什么老曹之前成绩远不如武宫,而应氐杯后却远超六超加聂马的总和?除了他涨得多还有别的原因吗?这也不正说明温汤水式棋风对棋力提升没有好处吗?”
作者: 肥仔胡 时间: 2021-9-23 08:24
本帖最后由 肥仔胡 于 2021-9-23 08:33 编辑
我也觉得没意思,棋力讨论其实是避重就轻,实质是掩盖他们要动摇我国现行围棋体制,以达到彻底和国际脱轨,回到有清一代的不可告人的目的。但我们要尊重他们的发言权,如果我们对他们简单粗暴,动辄把人踢走,那人品和他们就没什么两样了,大家不参与就是了。大家想参与就评论几句,不想参与就冷眼旁观。移到别处也不解决问题,他们还是会跑到人多的地方发。
作者: ciqyangs 时间: 2021-9-23 08:49
还范西屏第一?至少在直接交锋中施襄夏稍胜一筹
作者: yanglei7010 时间: 2021-9-23 09:18
本帖最后由 yanglei7010 于 2021-9-23 16:08 编辑
范西屏第一,黄龙士,王积薪,弈秋等大神怎么办?看吻合度,胡铁头也能吊打范西屏?
作者: ILoveBt2 时间: 2021-9-23 09:37
不敢想象还有这种目的。是不是还要戴个带辫子的假发套下棋才行?
作者: 稀松平常 时间: 2021-9-23 10:20
搞得再花里胡哨,也摆脱不了关公战秦琼的尴尬!围棋除了竞技属性,还有很高的艺术属性,其微妙之处是无法用数字来量化的!博尔特的百米成绩也许可以彪炳上百年,那是因为9秒58这个冰冷的数字就刻在那里!而围棋你永远也无法彻底量化一代宗师的技艺!
作者: ccnie 时间: 2021-9-23 10:36
本帖最后由 ccnie 于 2021-9-23 11:37 编辑
诉诸动机将会让讨论失去意义,就事论事即可。
这篇文章的排名是这么算出来的:区间第一吻合度均值+最低&最高吻合度+复杂度(不确定度)
区间设置“掐头去尾”是否合理暂且不论,按照文中号称“统计灵活”的截取方法,到底什么是“单方面下降”以及“胜负分明”,解释权完全在个人。至于总手数不同于截取阶段不同带来的对比不同问题,与前一个问题相比是小巫见大巫。
将最低&最高吻合度作为指标,只要棋谱基数足够大,有一定水平的棋手都能具有“世界冠军水准”。至于下限代表“发挥稳定性”,如果按照这一做法,笔者研究中当代棋手发挥最不稳定的就是李昌镐——当代吻合度指标中的最低值就是大李贡献的。
至于复杂度的逻辑问题,已经懒得再重复了,连katago作者都在其github主页回复中至少说过两次,这个指标可以体现棋手风格,但无法与水平挂钩。记得LZ之前曾发帖对笔者“灵魂拷问”:崔灿老师如此旗帜鲜明毫不留情打倒卡塔狗评测指标之一的复杂度(不确定度),得到卡塔狗作者的授权和认可了吗?他对卡塔狗的了解比卡塔狗作者更深吗?卡塔狗会桑心吗?卡塔狗的作者会难过吗?这里原话奉还。
以上所有问题,与文中所有测试样本用“10-15局巅峰棋谱”一语带过,只字未提棋谱详细情况,以及选择的标准这一点相比,都变得微不足道。当运动员与裁判都可以单方面任意操作,比赛结果自然缺乏讨论的价值。无论目标多么高尚与大义凛然,使用一套这样的方法去“论证”,除了小圈子自嗨以外没有任何意义,反而会降低外界对中国古棋的观感。这才是笔者与某些古棋爱好者的分歧所在,也算是笔者希望通过研究来改变的事情之一。使用单一吻合度的确有“测量力”不足的缺陷,但至少得到的两个结论——”黄范施绝非业余水平“与“此前棋手对清代布局存在偏见”是坚实的。如果方法不具备严谨性,一切都无从谈起。
作者: SmileFox 时间: 2021-9-23 10:59
无法同意更多
很多这类对比完全就是数字游戏而已,统计学的反面典型大全。
静下心来看看棋不好吗?
作者: 三国大军师 时间: 2021-9-23 12:02
此文章若有缺陷也是资源所限,倒是崔灿五段为何不深入研究,百尺杆头更进一步? You can you up
作者: 三国大军师 时间: 2021-9-23 12:08
本帖最后由 三国大军师 于 2021-9-23 12:22 编辑
崔老师:没有显著差异这类模糊结论不过瘾啊,也并非真相!您得努力证明柯洁就是比黄施范棋力强才行,对不对? 否则,那意味着什么,您应该清楚吧。
至于其他几位高喊口号,强烈反对的大佬,就回一句:You can you up, no can no bb
作者: lanke2021 时间: 2021-9-23 12:16
提示: 作者被禁止或删除 内容自动屏蔽
作者: cwdong8309 时间: 2021-9-23 12:34
有意思的分享
作者: lanke2021 时间: 2021-9-23 12:57
提示: 作者被禁止或删除 内容自动屏蔽
作者: SmileFox 时间: 2021-9-23 13:25
方法不对,往往是做的愈多错的愈多
作者: jzhang 时间: 2021-9-23 13:49
本帖最后由 jzhang 于 2021-9-23 22:41 编辑
连概率统计的基本原理、方法都没用,就挑选所谓的巅峰棋谱,这是有失公允的。
比如,让秀和失去名人棋所的与松本锦四郎一局,锦四郎与秀和实力相差先二,但偏偏在御城棋正式比赛中一目胜。那一局,连专家都叹服,从棋谱上看,锦四郎也是一位超一流棋手。
又如,沈果孙一生都是二流棋手,偏偏是第一个分先战胜日本九段的中国棋手,而且赢的是日本当时的霸主坂田荣男。
如果算坂田和吴的六番棋,坂田是压倒胜,然而,之后的十番棋,坂田又惨败。
用这种上下其手的统计方法,难怪胡铁头比当时的超一流棋手都要强了。
如果把锦四郎赢秀和那时算锦四郎的巅峰期,那锦四郎也是七段上手的水平吧。遗憾的是,锦四郎只有四段。
军师可以洗洗脚睡了,这样下去,只会给挺古派带来偏见和笑话。在NBA中也一样,统治力不是看一年的短期数据,在合同最后一年,选手的数据会急速上升,然后一签约,数据又跌到低谷。又有的选手,专刷数据,在垃圾时间还在打,以提供场均得分、篮板。
数据也会骗人的,如果不按正确方法去抽样。另外,数据统中还要调整异常数据。
作者: 碧空晴 时间: 2021-9-23 14:03
但至少得到的两个结论——”黄范施绝非业余水平“与“此前棋手对清代布局存在偏见”是坚实的。如果方法不具备严谨性,一切都无从谈起。
无论目标多么高尚与大义凛然,使用一套这样的方法去“论证”,除了小圈子自嗨以外没有任何意义,反而会降低外界对中国古棋的观感。这才是笔者与某些古棋爱好者的分歧所在,也算是笔者希望通过研究来改变的事情之一。
=============================================
崔老师意思和立场已经表达很清楚。
一、黄施范的下限棋力已经证明,上限棋力未明。
二、 论证方法尽量在严谨的基础之上再谈完善,否则就是自嗨耍流氓。
三、以前说中国座子布局一无是处显然有失公允。座子布局尚在江户前期道策时期布局之上,如果座子布局属于妇人裹脚布,前朝辫子,那么道策时期的布局又是什么?
点赞。
作者: 碧空晴 时间: 2021-9-23 14:09
这才是笔者与某些古棋爱好者的分歧所在。
=================================
崔老师这句表明了与一部分古棋爱好者还是不谋而合的,崔老师应该也属于古棋爱好者之一吧。
作者: 肥仔胡 时间: 2021-9-23 14:51
(一)探讨棋力其实没有意义,规则不同。我们承认在扭杀局面时古人棋谱质量很高就可以了,其他结论都是不充分的。我想问个问题,古代怎么读秒,用沙漏吗?考试三个小时和十三个小时做出的答卷能一样吗?哪怕是六个小时,可能一样吗?如果对局条件不一样,有什么可比的?(二)棋力和规则有没有关系,是不是规则就更容易锻炼出高手?那么目前座子帮里有什么高手,请列举。为什么两种规则第一次交锋,先进的座子规则培养出来的第一国手张乐山,会受两子惨败给铺地板规则训练出来的日本二流棋手高部?可见围棋盛衰更多是取决于国运和棋手本人的天赋,和规则无关。(三)是少数服从多数,还是唯我独尊,不赞成我观点的全部污名化并打倒?我觉得什么事应该抓住主要矛盾,而不是陷入古今之争的沼泽里死缠烂打,根本没有意义。
作者: 肥仔胡 时间: 2021-9-23 15:03
本帖最后由 肥仔胡 于 2021-9-23 15:05 编辑
举个例子,请勿对号入座。以前义和团说铁路是铁蜈蚣,是最坏的东西,铁路就是外国文化侵略,所以要拆毁。现在我国不但是铁路,甚至是高铁第一大国,还帮助外国建高铁。突然来了一群人说,高铁不好,铁路不好,谁赞成火车谁是汉奸,铁路应当全拆,大家坐马车,或者换成更环保的跑步,那才是最先进的,大家作何感想?然后有一群人专门作技术统计,得出的结论是马受惊后比高铁跑得快多了。
作者: lanke2021 时间: 2021-9-23 16:08
提示: 作者被禁止或删除 内容自动屏蔽
作者: 榉木 时间: 2021-9-23 16:12
拆铁道,拔电杆,海中去翻火轮船
作者: yanglei7010 时间: 2021-9-23 16:19
技术发展了,导致有人用计算机算命,奈何?
作者: beiye 时间: 2021-9-23 17:18
古今大战之争延续了很久,已经令人审美疲劳,而且近期论证陷入了人类无解的难题,就是面对胡搅蛮缠的人用不用和他讲道理,面对不遵守规则的人要不要尊守规则,面对绝不宽容的人需要宽容他吗?起先我认为君子合而不同,但边界只限于君子之间,请那几位离开论坛,可以用论坛全体投票的方式,但又授人以柄说是群体暴力,做善良的人底线真多,小小感慨一下
作者: beiye 时间: 2021-9-23 17:18
古今大战之争延续了很久,已经令人审美疲劳,而且近期论证陷入了人类无解的难题,就是面对胡搅蛮缠的人用不用和他讲道理,面对不遵守规则的人要不要尊守规则,面对绝不宽容的人需要宽容他吗?起先我认为君子合而不同,但边界只限于君子之间,请那几位离开论坛,可以用论坛全体投票的方式,但又授人以柄说是群体暴力,做善良的人底线真多,小小感慨一下
作者: yqxc2003 时间: 2021-9-25 12:11
哦,你说得都对
作者: yqxc2003 时间: 2021-9-25 12:12
我觉得吧,研究围棋您真是屈才了,啥时候研究一下义和拳和红灯照,比较适合您。
作者: longdeliliang 时间: 2021-9-26 23:29
哈哈 请你看过崔灿老师的原文在说话好吗 ???张口就来。以为自己很聪明?
作者: longdeliliang 时间: 2021-9-27 13:56
这篇文章的理解重点根本就不在这。关于数据的选取,崔灿已经得出了范施与当代顶尖棋手不具有显著差异。你再纠结数据也不会改变 这一结论。楼主不过只是在崔灿研究的基础上做了一点自己的改良罢了
欢迎光临 飞扬围棋 (http://bbs.flygo.net/Bbs/) |
Powered by Discuz! X3.2 |