柯洁轻灵一跳超越AI一选，打脸以AI一选衡量妙手论者

flyingsee · 发表于 2022-2-18 10:06

本帖最后由 flyingsee 于 2022-4-13 11:27 编辑

2022年2月16日，天元战32强战，柯洁执黑207手战胜对手伊凌涛。其中，黑第169手轻灵的一跳，是绝妙一手。如下图（转自贴吧）

小九围棋（职业棋手三段）在本局讲解视频中详细讲解了此处变化。
【伊凌涛深入敌营一决胜负大龙对杀柯洁祭出惊人绝杀妙手】（转自b站）
https://www.bilibili.com/video/BV1tb4y147JL
（该视频7分钟左右开始讲解）

在直播过程中，对于第169手黑棋，绝艺和星阵当时一选都是扳那两个子。

katago 40b 461k的计算结果如下图（转自贴吧）

柯洁下出的169，超越了AI一选，是惊人的妙手，再次无可辩驳的证明，以AI一选评价人类妙手是何等可笑。

柯洁的妙手，直接打脸一众以AI一选衡量妙手论者。

除此以外，

在百度围棋贴吧，有些以AI一选衡量妙手的人，也恰恰在相关讨论中，同时被网友打脸。

例如这个帖子：

https://tieba.baidu.com/p/7727996319

发信人: GunL (大尾巴狼), 信区: Weiqi
标题: Re: 感受到了好显卡的能力，附带一个局面测试
发信站: 水木社区 (Mon Apr 15 16:34:24 2019), 转信

例子不错，很有典型意义。
这种局面在星阵的算法设计中被称为AI的盲点盘面。楼主给的例子，是当前盘面的一招妙手
未被发掘出来；更普遍的情况，是一些看似正常的着手也会看不见。比如附图中的M3虎。

盲点盘面的存在是非常普遍的情况。可以说，几乎每天的人类棋谱中，都会出现很多AI的盲
点盘面。

导致盲点盘面的原因有几类。第一类就是大家通常认为的，AI的水平还不够，不能发现某些
隐藏的妙手。通过持续的强化学习，这类着手会被逐渐发掘出来。当然，计算能力的提升，
比如使用更强的硬件，也相当于提升了AI的水平；
另一类是训练数据造成的。随机性不足的、来源单一化的棋谱数据会造成神经网络模型对某
些没见过的盘面、形状缺乏认识，没有敏感度；
还有一类是系统性的，比如使用的神经网络结构参数不够多，描述能力不足；或者网络构型
本身就解决不了某些盘面——比如使用线性模型去拟合目标函数，那一个（线性）偏离其他
样本群很远的样本，是注定拟合不好的。

我们已经确信，有些盲点盘面是最后一个原因造成的。这些盘面下，无论是绝艺、星阵、
Elf OpenGo、LeelaZero，都不能找出正确的、并不算难的应手。而上述这些AI的训练数据
并没有交集，所以它只能是系统性的问题——或者可以直接猜测，这是使用Resnet带来的问
题？
对盲点盘面问题的研究，可以使AI算法工作者更清晰地看到，AlphaGo Zero算法的局限性和
天花板。

【在 daxuebeng (飞翔) 的大作中提到: 】
: 整了一个云上免费的Tesla V100，速度真是快呀，瞬间几万po
: 顺便测试了一下若干年前古力对芈昱廷的百灵杯决赛的一局棋，印象很深，想看看现在
: 的软件能发现这种妙手吗？以前自己的显卡太烂，说服力不足。现在看来确实这种妙手
: ...................

flyingsee · 发表于 2022-2-18 10:15

flyingsee · 发表于 2022-2-18 10:16

高粱米 · 发表于 2022-2-18 11:59

本帖最后由高粱米于 2022-2-18 15:45 编辑

我自己跑了几遍.... Katago 40B
在第168手, 我跑了2000K的计算量, 扳是一选, 胜率大概82%-83%; 柯洁的跳是二选, 胜率大概 72%-73%.
以下按照全局 600K 的计算量,
若走扳黑棋胜率 81.7%
若走柯洁的跳, 我跑了两遍, 两次的胜率差0.1%, 第一次白棋胜率是24.6%, 下一步的黑棋一选是 H8 单粘; 第二次白棋胜率是24.7%, 下一步黑棋的一选是 H12 刺; 但是第一次 H12 的胜率和 H8 比差挺多, 第二次 H8 的胜率比 H12 也差挺多.
就169手而言, 胜率并没有什么问题. 如果真的出现盲点, 胜率会有大的波动. 事实上这一手并没有大波动.
AI的选点和胜率随着计算量的上升, 是会变化的. 我认为AI的问题在于权重和计算量; 权重显示的是AI的训练程度, 也就是说这个AI体质如何; 计算量自不必说, 越大越精确. 要说打脸不打脸的, 摆出权重和计算量比比再说.
有更好的权重和更大的计算量来推翻我这个, 我也认.

flyingsee · 发表于 2022-2-18 13:33

高粱米发表于 2022-2-18 11:59
我自己跑了几遍.... Katago 40B
在第168手, 我跑了2000K的计算量, 扳是一选, 胜率大概82%-83%; 柯洁的跳是 ...

您的结论是什么？

高粱米 · 发表于 2022-2-18 15:44

高粱米发表于 2022-2-18 11:59
我自己跑了几遍.... Katago 40B
在第168手, 我跑了2000K的计算量, 扳是一选, 胜率大概82%-83%; 柯洁的跳是 ...

文中柯洁跳之后的两个胜率24.6%和24.7%是白棋胜率.

高粱米 · 发表于 2022-2-18 15:50

flyingsee 发表于 2022-2-18 13:33
您的结论是什么？

我的结论是, 柯洁的选点实际上在 AI 的选点以内, 从胜率上来说, 并没有优于 AI 的一选, 所以单纯从围棋的技术性角度, 谈不上惊人的妙手.

我以胜率来衡量过妙手; 我以为, 妙手无须是 AI 一选, 但是如果造成了胜率的大幅度下跌(20个点以上)的着法, 从技术性的角度, 无论如何也谈不上是妙手.

肥仔胡 · 发表于 2022-2-18 16:59

其实flying兄和高梁兄不必为棋力争执不休，完全是被一帮投机分子带偏了。我只要他们回答古代规则后走多9目判输棋的合理性，其他什么棋力也没什么可谈的。因为古今棋力之争，加上劈头盖脸的人格攻击和虚构罪名，归根到底要落实到“取代”和“颠覆”现行新中国围棋体制上来，那就请他们解释一下面积大的一方，而且还是后走吃亏的情况下，被规则杀死的原因。我从不像他们捕风捉影，“奴性”“颠覆和取代”是他们自己在表演。

flyingsee · 发表于 2022-2-18 17:25

本帖最后由 flyingsee 于 2022-2-18 17:36 编辑

高粱米发表于 2022-2-18 15:50
我的结论是, 柯洁的选点实际上在 AI 的选点以内, 从胜率上来说, 并没有优于 AI 的一选, 所以单纯从围棋的 ...

这手棋在人类棋手眼里为什么是“妙手”，前面已经有视频讲解了，自己去看。

那我来告诉你为什么网上的棋友们把这一手叫惊人妙手，也就是告诉你为什么我说它“超越AI一选”

第一，这一手棋，在直播过程中，星阵、野狐的AI，以及B站直播的木上野狐开了高算力的katago，都不在上述AI的一选之中。既然不在ai一选，则必然是“降胜率”的一手。

第二，不管这些AI一开始怎么评价这手棋降了多少个胜率，经过深入计算以后，这一手棋的胜率迅速上升，明显超过一开始AI给的胜率。（这也是网友们认为这一手是AI盲点的原因）也就是说，柯洁这手棋是AI的盲点——当时直播的效果就是这样。

第三，在棋盘上的实际效果是，这一手下出以后，因为构思的巧妙，它不仅是AI的“盲点”，也是对手的“盲点”，对手没有考虑到柯洁下这一手。这种给对手也造成的心理冲击很大，这之后，黑棋下的越来越顺手，白棋则最终坚持了不到20手（双方总共不到40手）认输。

上面这个过程，就是包括职业棋手在内的观战者，对这一手从一开始粗略的看到“降胜率”、然后又戏剧性的发现它很巧妙，最终，大家认为它“妙手”“绝妙”“惊人绝杀妙手”的过程。

这就告诉我们，谁说妙手就必须是AI一选？

这个过程本身，就打脸那些单纯以AI胜率一选衡量妙手与否的人们。

所以网友们评论说，柯洁在教AI下棋云云。我看说的没错，人类就是有人类的创造性。

另外，所谓这一点原本就在AI选点范围云云，这种废话没有任何意义。棋盘上走到168手，值得下的范围就那么大，可选点都在AI选点范围不是很正常的事情吗？问题是对于野狐、星阵AI，它们一开始给的胜率给低了，柯洁下出来以后才又升高的。你拿katago40b跑2000k算的结果跟我们说的就不是一回事，也不是一个过程。您要真悠闲您拿60b跑跑。

最后，你说一千道一万，反正有人是在贴吧被打脸了，piapia的。谁疼谁知道。我反正就是正常晒个截图。

高粱米 · 发表于 2022-2-18 18:21

flyingsee 发表于 2022-2-18 17:25
这手棋在人类棋手眼里为什么是“妙手”，前面已经有视频讲解了，自己去看。

用 60B 跑更没问题了, 图片是我跑的结果, 柯洁的跳就是 AI 一选, 这更验证了我的说法: AI 的问题就在于权重和运算量. 权重高运算量大就准确. 野狐直播的 AI 使用 6K 的运算量, 星阵和弈客不清楚.

flyingsee · 发表于 2022-2-18 18:43

本帖最后由 flyingsee 于 2022-2-18 18:50 编辑

高粱米发表于 2022-2-18 18:21
用 60B 跑更没问题了, 图片是我跑的结果, 柯洁的跳就是 AI 一选, 这更验证了我的说法: AI 的问题就在于权 ...

然后呢？

您再次证明了柯洁的下法是“超越AI”——不过不是您这个AI，而是在当时观战时的人们所使用的的类似野狐、星阵和katago40b那种AI

脱离的具体语境，用自己定义的概念来解释别人的概念，这有什么用呢？

是不是没明白我的意思？

换句话说吧，那些拿着低端AI去否定人类所下的妙手的人，用的是您这套权重和计算量吗？

如果不是的话，这事跟您还有什么关系吗？

再者说了，今天您用60b一选否定了40b一选，明天呢？

你能否从真理的角度，来彻底否定不可能将来有个80b否定你这个60b的计算结果？

高粱米 · 发表于 2022-2-18 19:13

flyingsee 发表于 2022-2-18 18:43
然后呢？

您再次证明了柯洁的下法是“超越AI”——不过不是您这个AI，而是在当时观战时的人们所使用的 ...

现在的 AI 的技术路线就决定了, 它只能随着神经网络的训练和算力的堆砌而接近"围棋上帝"(假设我们有一个全知全能的围棋上帝). 您说的是对的, 以后有可能会有 80B 的权重的 AI 再来否定 60B 权重的 AI, 就看相关的 AI 技术玩家是不是有兴趣和资源去训练了.
您说得对, 用低端 AI 去做评判, 是不能言之凿凿的; 但是如果选点跑得全面一点, AI 配置高点, 计算量高点儿, 我还是更倾向于 AI 的判断.

非要追根究底的话, 一手棋到底好不好, 在没有"围棋上帝"来做裁决的情况之下, 只能"实战解决": 谁觉得行谁来, 谁牛谁说了算. AI 也有盲点, 但是不能据此说 AI 的评判就比人的判断不可靠, 不能因为人发现了一个 AI 的盲点就说 AI 不如人. 哪怕就柯洁那盘棋, 下完169手, 把伊凌涛换下来, 让野狐直播的 AI 上, 柯洁八成也是要输的; 当然了, 这也是没法验证的了.

flyingsee · 发表于 2022-2-18 19:17

高粱米发表于 2022-2-18 19:13
现在的 AI 的技术路线就决定了, 它只能随着神经网络的训练和算力的堆砌而接近"围棋上帝"(假设我们有一个 ...

您可一定搞清楚，我们讨论的缘由，不是说用人下的去否定AI

谁也没说要否定AI

现在是有人用AI去否定人

而我们不同意后者，不同意后者不代表就要否定AI

高粱米 · 发表于 2022-2-18 19:30

flyingsee 发表于 2022-2-18 19:17
您可一定搞清楚，我们讨论的缘由，不是说用人下的去否定AI

谁也没说要否定AI

我们讨论的缘由不就是用 AI 去判断妙手是不是合适吗? 我的观点是, 以 AI 一选作为妙手唯一标准是不可取的; 但是AI 判断下的"错着"(我的错着的标准是胜率下降 20个点)应该不能判断为妙手, 哪怕因为人的因素, 使得这手棋取得了意想不到的结果, 那也只能视为"骗招".

当然, 因为技术的原因, 会导致 AI 的判断不是完全准确, 那么我们就应该更全面地来使用这个技术, 尽量减小这个不准确.

我对于用 AI 来判断古人的棋力也不置可否, 一方面不想争, 另一方面我认为古棋规则下的围棋和现在的围棋并不是一个游戏.

一个时代有一个时代的最强者, 但是围棋技术是发展的, 我们是"站在巨人肩膀上", 所以我们现在的职业选手比古人要强得多的. 但是我们没有理由鄙视他们. 打个比方吧, 现在很多大学生, 微积分比牛顿好得多, 但是他们是吸收了几百年以来的数学家的成就, 真要我说这些大学生比牛顿微积分强, 恐怕是没这个脸的.

flyingsee · 发表于 2022-2-18 19:36

本帖最后由 flyingsee 于 2022-2-18 19:39 编辑

说起“错招”，您说的我大部分都赞成。

问题是有些人就是在搞双标。

比如对这个图里的错招的平均值，视而不见

帐号		自动登录	找回密码
密码			注册

柯洁轻灵一跳超越AI一选，打脸以AI一选衡量妙手论者

本帖子中包含更多资源

本帖子中包含更多资源

本帖子中包含更多资源

浏览过的版块