飞扬围棋

标题: 从“棋局掌控力”看,清代黄施范与当代业余高手不存在显著差别 [打印本页]

作者: flyingsee    时间: 2022-1-23 15:05
标题: 从“棋局掌控力”看,清代黄施范与当代业余高手不存在显著差别
数据和“棋局掌控力”定义来自   https://zhuanlan.zhihu.com/p/401014051清代围棋顶尖国手“掌控力”分析

作为评价指标,围棋AI吻合度无法对“不吻合”着法的优劣程度进行区别,是其一大缺陷。“AI评分”在一定程度上弥补了这一点,但给出的评价仍然受到围棋AI计算量偏好的影响。上一章提到的反对使用围棋AI评价人类棋手水平,认为“棋手更应该选择自己能够理解、掌控的下法”这种观点,其潜台词是“围棋AI的标准太高,人类棋手熟悉的下法也亏不了多少”。因此,借鉴之前研究中的围棋AI指标提炼方法,在“胜率”方面设立一些不同的标准,以考察清代围棋国手的“棋局掌控力”——在一局棋中保持稳定发挥,尽量减少“恶手”的数量与严重程度

(1)不同胜率损失标准下的“吻合度”

设立一系列的“掉胜率”标准,考察棋手着法与围棋AI推荐的选点相比,能将胜率损失控制在多大的范围内。具体标准设置为胜率损失2%、5%、10%和20%以下,结果见下表。


【原文论文结论:】仅仅将胜率标准放宽两个百分点,各组别棋手的AI评价均大幅提升。“江户后期”组的两位棋手又一次体现了“稳定性”,各标准下的数值均与当代职业高手相似。清代顶尖国手在这方面表现稍有逊色,但也与另外两组数据接近。
【真正的结论:清代顶尖国手在这方面的表现,除第一栏外,与“当代业余高手”(以及“道策”)没有显著差别,与“丈和&秀策”和当代职业高手差距明显。】


(2)“大恶手”的损失程度

统计一局棋中,掉胜率最多的着法“TOP10”,并按照不同标准,计算其“最恶N手”所降胜率的平均值。结果见下表。


【原论文结论:】“江户后期”组的恶手胜率亏损值,甚至低于当代顶尖棋手平均水平,不得不再次感叹秀策的稳定性。当然,胜率类指标参考更受棋手风格影响,考虑到“当湖十局”的激烈程度,清代顶尖国手能有这样的表现也算不错了。
【真正的结论:清代顶尖国手在这方面的表现,除了第一栏外,其他均与“当代业余高手”没有显著差别;与“丈和&秀策”和当代职业高手差距明显,各项指标都比道策还差一些。】



作者: 闲云野鹤123    时间: 2022-1-23 18:51
本帖最后由 闲云野鹤123 于 2022-1-23 23:53 编辑

今棋与古棋规则不同,两者不可一概而论
作者: 肥仔胡    时间: 2022-1-23 20:35
当湖十局激烈,日本的各门派之争更是性命相博,大平修三先生说,日本古棋的计算力要比现代深远,见《名局鉴赏室》。四大门派的争夺,关系到棋界话语权,俸禄,棋手生活,实际上不能以当湖十局的激烈作为古棋不稳定的借口,哪个棋不激烈。日本围棋铺地板的传说,和高部是日本六超一样不靠谱,对于历史的分析,谁占有更多的资料,谁更有发言权。
作者: 闲云野鹤123    时间: 2022-1-23 22:49
肥仔胡 发表于 2022-1-23 20:35
当湖十局激烈,日本的各门派之争更是性命相博,大平修三先生说,日本古棋的计算力要比现代深远,见《名局鉴 ...

仅就才能而言,范原本就是古今第一,毋庸置疑

作者: 肥仔胡    时间: 2022-1-24 04:40
本帖最后由 肥仔胡 于 2022-1-24 04:52 编辑
闲云野鹤123 发表于 2022-1-23 22:49
仅就才能而言,范原本就是古今第一,毋庸置疑

我认为闲云野鹤兄这句话相对靠谱,中国人的围棋天赋肯定比日本人高一点。只是规则压制了天赋,压制了棋的水平。当然范圣的才能是不是古今第一有待商榷,毕竟吴老,柯洁比范圣更加早熟,而且巅峰期更加强悍(即便没有ai,我也这么认为)。在吴老眼中,中古的代表人物是黄月天和施定庵,没有范圣。张大勇老师曾经把吴清源列为古今第一。崇古的陈老在排古今力棋时,显然在坂田先生这多费了不少笔墨。所以……

作者: jianglei    时间: 2022-1-24 08:41
我以前看到一个说法(不当真),范施据说有13局,施前面不如范,后面赶上了,或有超越的趋势(就在这13局中超越了估计胜多负少)
但当时范的粉丝更多,天赋满满,所以裁剪为10局,
无论如何,他们两个包括更早的黄龙士也的确是中国古代围棋技艺的巅峰!其中的艺术性是经过吴陈罗程等前辈职业棋手鉴定出书的。
当然,有些三逼汽油,非要说座子棋牛座子棋正座子棋伟,就不在棋艺的讨论中了


作者: jianglei    时间: 2022-1-24 08:50
对古人先哲,我是尊敬的,但不是盲目崇拜的--鲁迅和吴清源如是说
但就我个人来说,不说全局大局观,如围棋十决,这些高可以上哲学高度,低就纯粹是嘴炮。
就拿死活题而言,玄玄和官子谱虽然难度不如古代日本不断樱和现代韩国的天龙图,但比秀哉的死活妙机不差吧,论其中的艺术性,完全不遑多让天龙图这种硬巴巴的计算吧。

作者: 肥仔胡    时间: 2022-1-30 09:16
顶。
作者: flyingsee    时间: 2022-1-30 14:49
挑出来一些被AI肯定的个别招法有什么普遍性意义?

还是得看统计数据,看其表现出来的一般规律。
作者: flyingsee    时间: 2022-6-6 00:54
重要的结论 顶上来
作者: flyingsee    时间: 2022-6-10 19:09
这个结论至今没有被驳倒

有些无知无畏的妄人视而不见
作者: 肥仔胡    时间: 2022-6-11 19:27
这个帖子是我进入论坛以来,看到的最精华的帖子。
作者: forjoke21cn    时间: 2022-6-12 19:14
不考虑复杂度单纯比较吻合度,如同只比较待在马背上的时间,而不考虑温顺母马和顽劣野马的差别。复杂度到50的时候,katago自己的一选都产生很大的波动
作者: flyingsee    时间: 2022-6-12 23:34
本帖最后由 flyingsee 于 2022-6-12 23:42 编辑
forjoke21cn 发表于 2022-6-12 19:14
不考虑复杂度单纯比较吻合度,如同只比较待在马背上的时间,而不考虑温顺母马和顽劣野马的差别。复杂度到50 ...

(七)“复杂度/不确定度”
在一手棋的“目差”之外,KataGo还统计了计算过程中所有变化[23]的目差,并根据计算量进行加权求和,得到当前局面的“目差标准差(scoreStdDev)”。Yzy在Lizzie中提取了这一指标,起初将其命名为“复杂度”,后因感觉表述不够准确,可能引起误解,遂更改为“不确定度”。

不过,一些棋友认为该指标可以结合“吻合度”,成为评价棋手水平的试金石。理由是倘若一个局面的“目差标准差”数值高,意味着围棋AI计算的变化出现了较大分歧,即“AI算不准”,这说明此时局面十分复杂。在局面复杂时吻合度高,要比局势平稳时的“吻合”更体现水平。

上述说法在“效度”方面的逻辑似乎没问题,但未提及该指标“信度”方面的表现。对这一指标的考察测试,主要得出以下几点结论

1.根据该指标计算原理,在不同的计算量下,其数值会存在明显差异。围棋AI权重不同也会影响该指标数值。因此,“复杂度/不确定度”怎样才算“高”,缺乏明确的标准。

2.该指标会受到局面优势大小的影响,与当前局面“目差”的数值成正相关。

3.该指标数值“高”时,会放大围棋AI“随机性”的影响,导致取样方面的困难。

除了以上缺点之外,以“复杂度/不确定度”结合吻合度判定棋手水平,在逻辑方面存在硬伤——既然围棋AI都算不准了,那么此时的“吻合度”显然失去了优劣评价的意义。综上所述,“目差标准差”可以看作是围棋AI眼中棋盘上的变数,在一定程度上展现了棋局的风格,但“棋风”无法直接与水平挂钩。KataGo的作者David J. Wu在被问及这一指标的意义时,也表达了同样的观点





除此以外,棋局的“不确定度”高,不代表棋手驾驭复杂局面的能力就高。
“不确定度”是AI算出来,不是棋手驾驭出来的。最后牛逼的是AI,不是棋手本身。
把局面搅乱,搞的很复杂,不代表棋手下这个局面的棋力就高、能力就强。
如果连这个简单的逻辑关系都不懂,就最好不要妄谈什么复杂度。


作者: golch    时间: 2023-8-22 15:01
都不是一个规则,怎么比?推倒胡和血战到底一起比赛?

作者: flyingsee    时间: 2023-8-22 16:56
golch 发表于 2023-8-22 15:01
都不是一个规则,怎么比?推倒胡和血战到底一起比赛?

前边的那些评测是按照古棋规则评测的。已经考虑了规则上的细微不同。
所谓规则不同不能比较,纯粹是一种借口。







欢迎光临 飞扬围棋 (http://bbs.flygo.net/BBS/) Powered by Discuz! X3.2