本帖最后由 flyingsee 于 2022-1-21 09:44 编辑
清代围棋顶尖国手“掌控力”分析作为评价指标,围棋AI吻合度无法对“不吻合”着法的优劣程度进行区别,是其一大缺陷。“AI评分”在一定程度上弥补了这一点,但给出的评价仍然受到围棋AI计算量偏好的影响。上一章提到的反对使用围棋AI评价人类棋手水平,认为“棋手更应该选择自己能够理解、掌控的下法”这种观点,其潜台词是“围棋AI的标准太高,人类棋手熟悉的下法也亏不了多少”。因此,借鉴之前研究中的围棋AI指标提炼方法,在“胜率”方面设立一些不同的标准,以考察清代围棋国手的“棋局掌控力”——在一局棋中保持稳定发挥,尽量减少“恶手”的数量与严重程度。
(1)不同胜率损失标准下的“吻合度” 设立一系列的“掉胜率”标准,考察棋手着法与围棋AI推荐的选点相比,能将胜率损失控制在多大的范围内。具体标准设置为胜率损失2%、5%、10%和20%以下,结果见下表。
仅仅将胜率标准放宽两个百分点,各组别棋手的AI评价均大幅提升。“江户后期”组的两位棋手又一次体现了“稳定性”,各标准下的数值均与当代职业高手相似。清代顶尖国手在这方面表现稍有逊色,但也与另外两组数据接近。
(可爱的崔灿老师,您怎么不明说另外两组是啥啊?就是“当代业余高手”和“道策”啊,也就是说,在“掌控力”这个指标上,大清高手们的水平,与当代职业、丈和秀策差距较大,也就是和当代业余高手不相伯仲罢了,在这种关键结论上,为什么要用户含含糊糊呢?)
需要说明的是,表中最右侧一栏的数值,并非意味着各组棋手平均每盘棋都还有10%左右的招法,胜率损失超过了20%。由于该项数据统计通过专门的软件[11]完成,对于围棋AI当前局面未曾考虑的选点,程序会从下一个局面的计算中择其最优变化,反推生成该落子变化的信息(胜率、目差、计算量等),但这种计算并不完全准确,有时会出现遗漏。就像前面提到的那样,人为设置的特定指标公信力有限,仅作参考之用,故不再对各组数据进行显著性检验。
(2)“大恶手”的损失程度
统计一局棋中,掉胜率最多的着法“TOP10”,并按照不同标准,计算其“最恶N手”所降胜率的平均值。结果见下表。
“江户后期”组的恶手胜率亏损值,甚至低于当代顶尖棋手平均水平,不得不再次感叹秀策的稳定性。当然,胜率类指标参考更受棋手风格影响,考虑到“当湖十局”的激烈程度,清代顶尖国手能有这样的表现也算不错了。
(崔灿老师把数据摆在这,只说秀策稳定性好,至于清代顶尖国手的水平,就是不做文字点评。看看上表中的数据,清代顶尖国手下恶手的程度,很明显最接近的就是当代业余高手啊。这还是在当代业余高手下的“晚报杯”对局时间有限、读秒10秒一步的情况下,而清代国手们可没有这种时间限制,那些古棋吹们看看这些数据,看看崔灿老师论文里没有用文字写出来的结论,你们哪来的勇气在那吹个不停呢?)
|