飞扬围棋

 找回密码
 注册
搜索
12
返回列表 发新帖
楼主: lu01
打印 上一主题 下一主题

leelaz的作者gcp的话

[复制链接]
16#
 楼主| 发表于 2018-4-26 07:56 | 只看该作者
hydrogenpi:
Mods可以随意关闭它,因为我知道它并不直接相关。不过,我有这样的预感,Leela Zero已经超越了顶级职业选手(在最好的硬件和专业比赛时间设置上),我很乐意看到它击败顶级职业球员来证明它。随着Golaxy,Deepmind Chess和IBM Deepblue在过去的所有宣传特技,我认为Leela有时间获得了自己的一些公关。也许在gcp,roy和其他项目的官方支持和支持下,他们可以组织一个gofundme,indiegogo,kickstarter和/或任何接受社区捐赠的项目,以便能够将这个想法传达给Leela Zero想要的整个世界在一场严肃的比赛中,以公平的条件发挥顶级职业球员(或者与许多顶级职业球员对抗),并由开发者自己组织,这样就不会有诡计。

对于这样的比赛,应该使用官方代码,官方二进制和官方网络。没有神秘的肉。没有任何背后的幕后废话。所有的日志都将被发布等。

加上没有障碍,没有“第六行以上”的废话,也没有可疑的神秘“上帝之手”干预,也就是说,在LZ志愿者团队发生的最后一场比赛中,对Golaxy的最后一场比赛没有做出正确的人为举动。

顶级职业球员(定义为目前排名前30的球员)通常不会免费参赛。因此,如果LZ项目能够通过众筹获得足够的捐款,然后向顶级职业选手投标,并进行投标并接受最低投标的最强职业球员,那么这将是一个很好的方式,玩最合理的收费金额等。

对于这样的比赛来说,leela零方面在Google coud平台或AWS或Azure上租用8x V100 Tesla GPU是微不足道的。没有什么“对手抱歉,我们今天只有30%的马力”借口像其他一些比赛的借口。

数据很简单,Leela Zero网络127击败刘德华(3150 Elo),给他大致1比1.5的让分,LZ以很多优势击败他。在职业水准上,一块石头差点值得至少200欧元。并且在这个对话的相关范围内,Id说PO的每增加一倍意味着增加120elo的力量。租用8x V100大约是有效采购订单的8倍,而用于在下半场击败安迪的1080Ti相比,这意味着这是另一次360 elo提升。 3150 + 560 = 3710埃洛。所以这一点基本上比任何人类顶级选手都强。在比赛实际进行的时候,我相信LZ网络将会比现在的网络128/4/25/2018更强。

在两项差点比赛中,LZ击败了Golaxy,因为它让它少于一块石头。然而,戈拉西已经击败了顶级职业球员,给他们一个完整的障碍。这也说明LZ达到和/或超过了顶级专业人士的水平。

我认为知道是组织这样的事情的时候。再过三个月,顶级职业选手将不会有机会,甚至不会暂停观看

gcp:==============
gcp评论7小时前•

    时间控制:我会说每个玩家大约1小时。对于专业玩家来说,玩足够的游戏已经足够了,玩家的水平和观看的乐趣之间也很好的平衡。

没有byo-yomi?我认为你必须设定一些,这将影响比赛的持续时间,因为Leela将充分利用它。

    我建议也决定与专业人士而不是事先决定准确的格式。

我想我想要一个非常具体的提案。当然,它可以调整,但如果我们有一些具体的东西我们可以指出,我们估计它是非常合理和有趣的比赛条件,那时我们可以接触到(我需要社区帮助,特别是到达中国人/韩国职业球员),并说如果职业球员愿意在这些条件下踢球,他们应该与我联系并说明他们的费用,在这一点上我可以作出一个判断,以确定我们能否筹集到一个合理的数额。

还有其他许多复杂因素,比如说时区(最好是我或者@ roy7应该可以在游戏中使用!),也可能是语言(其中许多专业人士可能不是最好的英语使用者,也许像@bood这样的人可以在那里帮助)。

如果一切都保持模糊,我的恐惧是什么都不会发生。

出于类似的原因,我会考虑放弃“前30名”,只是要求“9p”或“> = 7p”左右。这将大大扩大对手池,从而使比赛更有可能发生。如果Leela击败了职业球员,这将是一个很好的演示,并增加了我们可以让更强大的对手感兴趣的可能性。如果Leela输了,那么很显然,一个更强大的对手是没有意义的。
回复 支持 反对

使用道具 举报

17#
 楼主| 发表于 2018-4-26 07:58 | 只看该作者
2905/5000
hydrogenpi评论9小时前•

如果这件事情永远都不成问题,我愿意将1000美元投入官方项目协调人。它并没有那么多,但也许有一位顶级职业球员愿意接受折扣率(比如一些律师如何做无偿工作等)。我的意思是,可能没有必要找到最强大的顶级职业选手,只有Go社区认为是一位真正的顶级职业选手的职业选手,并且最好是愿意接受最低费用的职业选手。Go社区不像国际象棋那样人口众多,这是可惜的,但我相信如果它有核心开发者的官方认可/支持(为了提高合法性和建立信任,任何人都可以建立一场比赛,但我们'已经看到它也可以很容易地被弄脏),至少有几千人可以随着时间的推移而升起。让LZ有更强的时间去寻找合适的顶级职业选手。

毫无疑问,LZ早晚会变成“超人”,只是时间问题。 (还有很多东西想要从中挤出更多的果汁,甚至还有20块果冻,更不用说40块了。)虽然我已经谈了很多关于55%的浇注问题,但我们已经有了一个顶级的专业机器人,我已经反映,仅仅两年前,我不认为这会很快成为可能,我意识到它的人性总是需要更多,永远不会满足。我认为在11月以来的6个月内,它已经走过了一段漫长的道路,并且比原来的“1700年”估计速度更快。但是,我希望我们看到它很快就会变得更加大众化,或许不如Master / AGZ那么强大,但是足够强大,即使在商品平均PC上,Ke Jie和其他顶级专业人士也不会有机会了。 (没有任何反对职业球员或顶级职业球员的,只是我觉得它是更有意义和有趣的基准,而不是CGOS等)

我的观点是,随着LZ变得更强大而不是开始让球盘路,将会更好地展现与更强大,更强大的专业人士和顶级专业人士的优势。然后,一旦它可以轻松击败所有顶级职业球员,然后将基准转换为缩小比例......即看看硬件能够如何走低并仍然击败顶级职业选手。在我看来,这比赋予障碍更有趣......甚至与其他AI机器人对战。

美国地区aws租用8X V100仅为24美元/小时。我的猜测是,这比顶级专业人员愿意接受按小时支付的价格要便宜得多。我相信AQ有一些可以聚集的地方,并且可以结合几个强大机器的工作。不知道租用多台8 x v100并且让其他机器计算进一步下降的可行性是多么的可行,即使这样的工作起作用,elo的增长肯定会降低回报,但是当顶级专业人士的成本已经如此很多,没有理由不使硬件功能强大......
回复 支持 反对

使用道具 举报

18#
 楼主| 发表于 2018-4-26 08:02 | 只看该作者
hydrogenpi评论8小时前•

@ Friday9i

如果目标是尽最大努力赢得“顶级职业选手”的同意,那么我认为“最好公开可用”是合适的。目前,这是aws,afaik上的p3.16xlarge。 (https://aws.amazon.com/ec2/instance-types/p3/),价格为24美元/小时。请注意,在硬件方面,这仍然比DeepMind对Fan使用的任何配置都小得多(甚至在任何方式(甚至不是顶级专业版)(Lee和Kie Je在AG比赛中)都是如此,所以如果他们没有任何机会,因为时间设置可能不会超长时间匹配,并且可能在一小时比赛时限制,所以LZ.Esp也不应该这样做,那么拥有最好的公开可用顶级硬件(无论是租用还是其他方式)变得更加重要, 。

是的,我认为决定一个平台也很重要。无论是KGS还是OGS。他们可以帮助吸引更多的观众,同时也可以通过发布前的宣言,为LZ整体带来更多热门话题,但也会为这样的人群努力匹配做出更多贡献/捐赠。 OGS在未来看起来更加老龄化和趋势化,而KGS是老派,但如果KGS能吸引更多的观众,那么谁知道哪个平台最好。我认为就像与Haylee的比赛,顶级职业选手会同意从世界任何一个角落进行现场直播,(尽管不一定需要像Haylee那样做实时评论),因为这会增加很多时间/成本,以进行现场亲自对战。在服务器上和通过互联网进行操作确实要便宜得多。

LZ可能无法赢得顶级职业球员的所有比赛。所以我认为谈论给予障碍可能为时过早。但我很乐意被证明是错误的。我只是不认为LZ可以给顶级职业球员一个障碍,并且仍然可以赢得单一的gtx 1080ti lol(无论如何,目前还没有15个block)

确实有很多机器人(甚至不包括Deepmind / Google)比LZ更强大,但我认为这会让这个区别更大的是这将是第一次开放源代码的开放体重Go AI在比赛中击败顶级职业选手使用公开可用的硬件(谷歌云TPU现在是开放的,但AGZ的权重和代码不是,等等),无论是aws,天蓝色还是其他。在超过3500年的历史中,第一次为世界上的每个人带来超人的力量。
回复 支持 反对

使用道具 举报

19#
发表于 2018-4-26 11:01 | 只看该作者
这翻译水平真蛋疼。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|Archiver|手机版|飞扬围棋网 ( 苏ICP备11029047号-1 )

GMT+8, 2024-12-28 03:23 , Processed in 0.336793 second(s), 17 queries .

since 2003飞扬围棋论坛 Licensed

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表