飞扬围棋

标题: minigo 权重的对战 [打印本页]

作者: lu01 时间: 2019-1-24 05:10
标题: minigo 权重的对战
https://cloudygo.com/v15-19x19/eval-model/1005?sorted=False 不知道与lz比怎么样

作者: lu01 时间: 2019-1-24 05:20
贴吧说的回复 12楼. 听说现在minigo已经吊打ELFv1，和40b的里拉202号官权55开，minigo还只是19b*256f而已

作者: lu01 时间: 2019-1-24 06:11
转lz格式脚本 https://github.com/gcp/leela-zero/blob/next/training/minigo/convert_minigo.py

作者: lu01 时间: 2019-1-24 08:04
https://userscloud.com/wd0tqdqkqvia

D:\>d:\leela-zero-0.16-win64\leelaz.exe -w 939-heron.gz
Using 2 thread(s).
RNG seed: 4878283789657530464
Leela Zero 0.16 Copyright (C) 2017-2018 Gian-Carlo Pascutto and contributors
This program comes with ABSOLUTELY NO WARRANTY.
This is free software, and you are welcome to redistribute it
under certain conditions; see the COPYING file for details.

BLAS Core: Haswell
Detecting residual layers...v2...256 channels...19 blocks.
Initializing OpenCL (autodetecting precision).

Wavefront/Warp size: 32
Max workgroup size: 1024
Max workgroup dimensions: 1024 1024 64
Using OpenCL half precision (at least 5% faster than single).
Setting max tree size to 4077 MiB and cache size to 453 MiB.

Passes: 0 Black (X) Prisoners: 0
Black (X) to move White (O) Prisoners: 0

a b c d e f g h j k l m n o p q r s t
19 . . . . . . . . . . . . . . . . . . . 19
18 . . . . . . . . . . . . . . . . . . . 18

作者: lu01 时间: 2019-1-24 09:52
https://userscloud.com/cat842csy8es
990权重

作者: liangr 时间: 2019-1-24 10:12
楼主，939和990有什么区别？

作者: lu01 时间: 2019-1-24 10:43
1005权重
https://userscloud.com/w598ji58xolm

作者: yunhuo 时间: 2019-1-24 11:09

lu01 发表于 2019-1-24 10:43
1005权重
https://userscloud.com/w598ji58xolm

1005是最新的权重吧，更新的很快呀，990，993到1005.
麻烦问一下可以用leela加载的吧

作者: gfchy 时间: 2019-1-24 11:14
可以加载

作者: gfchy 时间: 2019-1-24 11:15
刚试了一下939的和leela很类似棋力同时间碾压gx98

作者: gfchy 时间: 2019-1-24 12:56
这好难下载不知道是什么鸟站老掉线

作者: 天地一_AD84H 时间: 2019-1-24 17:10
根本打不开，能不能放在网盘上分享权重？谢谢！

作者: 淡泊 时间: 2019-1-24 17:27
不行，打开是什么恶意网站，或者连不上。

作者: jcjcw3 时间: 2019-1-24 18:44
本帖最后由 jcjcw3 于 2019-2-8 21:21 编辑

minigo990网盘:https://pan.baidu.com/s/1gmjeLIPEUVDcUFlfu6bX_w 990评分4478
1005评分4367

作者: lhtj326 时间: 2019-1-24 19:10
下不了

作者: 天地一_AD84H 时间: 2019-1-24 22:13
谢谢，可用

作者: lu01 时间: 2019-1-24 22:18
gcp说Networks don't have perfect play, nothing new here.

作者: ultraungar 时间: 2019-1-24 23:11
https://cloudygo.com/v15-19x19/eval-graphs
Best model 000990-cormorant

作者: gfchy 时间: 2019-1-25 00:41
这三个迷你go的权重三盘均败给lm系列的gx5b 中盘的死活计算有很大问题

作者: lu01 时间: 2019-1-25 07:49
gcp把评价改成
Networks don't have perfect play or score estimation, nothing new and nothing to fix here.
https://github.com/gcp/leela-zer ... uecomment-457196564

作者: lu01 时间: 2019-1-26 08:44
v16也开始了

作者: gfchy 时间: 2019-1-26 10:34
就目前迷你do的水平比lz差很多计算力偏弱

作者: keexisun 时间: 2019-1-26 14:39
minigo低po下算路貌似不稳，高po就相当厉害了，特别是后半盘算路精湛
目前估计在同时间每步的条件下，应该是最强的

作者: gfchy 时间: 2019-1-26 15:04
10秒一手还是不行估计可能要高配？

作者: 天地一_AD84H 时间: 2019-1-27 01:23
990比1005强吗？

作者: gfchy 时间: 2019-1-27 02:08
可能939最强只是 10秒一手还是很弱

作者: yunhuo 时间: 2019-1-27 10:43

gfchy 发表于 2019-1-27 02:08
可能939最强只是 10秒一手还是很弱

慢棋的这些权重的棋力还是不错的，今天我试了一下，慢棋，990以150手屠龙ELF

作者: gfchy 时间: 2019-1-27 10:54
嗯你设置多长时间一手？

作者: yunhuo 时间: 2019-1-27 11:41

gfchy 发表于 2019-1-27 10:54
嗯你设置多长时间一手？

我机器配置不高，设置是2分钟必须下棋或一个选点思考到6000po就自动下，实际上绝大部分都是第二种情况，整盘棋大体上下了不到三个小时

作者: lu01 时间: 2019-1-27 14:55
minigo的历史说明
https://cloudygo.com/RESULTS
Andrew很长一段时间没有更新MiniGo RESULTS.md，所以这里......

跑 |board_size|块|过滤器|上演了|型号数量|游戏数量

v16 19 40 256 X00 TPU
正在运行：将块大小增加到40。
v15 19 20 256 X00 TPU 1008 25.6M
巨大的成功：使用我们的运行大型管道，这是我们最快的开始。改为初始Q到损失使v14变得更强，所以我们开始v15，初始Q丢失。这次运行比我们之前的运行更强大。在比赛结束时，我们用LZ（50-50 vs LZ201）和ELF（40-60％winrate取决于型号）进行了一系列比赛，这真是太棒了。
v14 19 20 256 X00 TPU
开始使用Cloud Bigtable测试我们的新数据管道，周围模型475安德鲁从使用init Q更改为父级到初始化Q到丢失。这似乎对政策和价值敏锐度产生了负面影响，类似于ELF中所见。
v13 19 21 256 X00 TPU 704 23.0M
成功案例：从类似于AlphaGo Master的监督模型开始。
v12 19 20 256 X00 TPU 1000（确切地说）24.6M
成功：v11的再现性：证明RL是稳定的。
v11 19 20 256 X00 TPU 171 6.6M
成功：测试了一个实验。
失败：Init到Q非常不稳定，我们提前停止了运行。
v10 19 20 256 X00 TPU 865 22.3M
成功：跑到TPU（非常快），我们“完成”了跑步。
v9 19 20 128 TPU 737 14.0M
成功：跑到TPU（非常快），我们“完成”了跑步。了解随机旋转的重要性。
v8 19 20 256 TPU 5 100K
成功案例：证明我们的TPU kubernetes集群有效。
v7 19 20 128 GPU 529 7.8M
成功：Golden Chunks用于训练，随机轮换训练
失败：忘记写sgfs开始运行
v5 19 20 128 GPU 581 4.8M
成功案例：GPU集群，强大的Amatuer
v3 9x9 10 32 CPU 496 3.3M
成功：代码全部运行和模型训练
最初是v3，9x9跑。 v2和v1（如果存在的话）会丢失到历史记录中。
在v3之后有v5。注意：我们似乎无法连续开始两次运行，因此基本上缺少了一半的数字

关于v5知之甚少，档案馆建议它是一个10块，128个过滤器架构，5M游戏。
口头历史传递给站点管理员站点管理员告诉操作员在接近结束时测试了几个学习率变化。

我们都喜欢Python它是一种很棒的语言，但有时你会渴望速度。 v7使用C ++二进制文件直接引用“HyperSpeed”。
v7取得了成功：更好的数据编组，图3的介绍，糟糕的辞职率图表，......
它的问题：我们忘了写sgfs，我们提前降低学习率，......

最好不要说v8也不要*颤抖*提到它的名字Gradients

v9是20层模型。它也是第一个使用八种对称性训练的模型（？）。或者是吗？
“我身体感到恶心” - AMJ发现use_random_rotation默认为False三天。

从来没有满足，MiniGo团队用v10直接推过“HyperSpeed”到“PetaFlops Speed”。
这是真正的交易20层，256过滤器全尺寸模型，燃烧640云TPU。
我认为这是重现AlphaZero最重要的尝试：
我们使用公布的学习费率表，批量大小......（TODO ANDREW）。
安德鲁勇敢地监督了不良的辞职率，并将其保持在5％以下。
我们的评估显示，这是一个强大的模型，超越了我们之前的顶级模特，达到了专业实力（v7可能也有？）。

我告诉安德鲁“初到0是愚蠢的”。
Init为0表示将新节点的值（Q）初始化为0（偶数位置）。
我当时说了，我现在就说，这是一个坏主意，它导致一种奇怪的行为：
在顶级策略节点上使用第二个读数之前，MCTS会探索所有361个移动。
这仍然是纸张所说的，我们预计它会很快失败，所以我们测试了它。
TL; DR：v11失败。胜利率不稳定，不可能控制不好的辞职。

对于v12，我们测试了我们模型的可重复性。
我们还原了v11更改并再次运行v10（我们更改了virtual_loss = 2）。
virtual_loss是我们用来通过批处理8个（或现在2个）位置并同时评估它们来加速模型的参数。
TL; DR：v11类似于v10，这是对稳定性和引导条件的测试。
我们没有看到任何可测量的差异，所以我们感觉良好，我们的RL设置是稳定的。

作者: 夏天_Z5rwS 时间: 2019-1-27 20:39
请问这个用什么跑呢？
可以加载到猫老师的 ana软件中吗？怎么弄呢？

作者: lu01 时间: 2019-1-27 21:18
应该可以用leelaz加载转换后的权重

作者: lu01 时间: 2019-1-28 19:31
目前最强的40b
https://cloudygo.com/v16-19x19/eval-model/463?sorted=True

作者: 渐渐领悟 时间: 2019-1-28 20:34

lu01 发表于 2019-1-28 19:31
目前最强的40b
https://cloudygo.com/v16-19x19/eval-model/463?sorted=True

我们没有那么好的翻墙术，打不开啊

作者: 夏天_Z5rwS 时间: 2019-1-28 21:34
楼上这个怎么下载？

作者: yunhuo 时间: 2019-1-28 21:43

夏天_Z5rwS 发表于 2019-1-28 21:34
楼上这个怎么下载？

应该还没提供下载呢

作者: yunhuo 时间: 2019-1-28 21:44

lu01 发表于 2019-1-28 19:31
目前最强的40b
https://cloudygo.com/v16-19x19/eval-model/463?sorted=True

目前有提供下载吗

作者: lu01 时间: 2019-1-29 05:43
仍然是 https://cloudygo.com/v16-19x19/eval-graphs

作者: lu01 时间: 2019-1-29 07:57
509比463厉害了

作者: nako350 时间: 2019-1-29 08:21
用什么引擎跑的？给大家分享下参数引擎啊~~

作者: lu01 时间: 2019-1-29 08:34
这是他的官网，用minigo引擎

作者: gfchy 时间: 2019-1-29 08:35
你们能下载么？

作者: gfchy 时间: 2019-1-29 09:00
网页是打开了点哪下载？

作者: nako350 时间: 2019-1-29 09:04
版主，就像平时我们上上野狐弈城之类的。用什么引擎好啊？单卡双卡什么参数好用啊？

作者: 夏天_Z5rwS 时间: 2019-1-29 10:13
看不懂怎么下载

作者: yunhuo 时间: 2019-1-29 10:37

lu01 发表于 2019-1-29 08:34
这是他的官网，用minigo引擎

有转换成leela引擎的权重吗，而且，就算官网那个怎么下载，能不能简单说说

作者: 关晓辉 时间: 2019-1-29 10:49
谢谢

作者: lu01 时间: 2019-1-29 18:18
转换后权重下载
https://cloudygo.com/converted_model/v16-19x19/models/

作者: lu01 时间: 2019-1-29 18:25
v15 990最强
https://cloudygo.com/converted_model/v15-19x19/models/

作者: yunhuo 时间: 2019-1-29 20:24
本帖最后由 yunhuo 于 2019-1-29 20:30 编辑

lu01 发表于 2019-1-29 18:18
转换后权重下载
https://cloudygo.com/converted_model/v16-19x19/models/

非常感谢，看了各权重得分，990>939>1005，是这个排名吧

作者: keexisun 时间: 2019-1-29 20:49
40b目前的权重只能算半成品，初始胜率偏差太大，执黑初始胜率居然是35%，还有待训练

作者: lu01 时间: 2019-1-29 22:06
这么好的资源，拿来接着训leelaz,多好

作者: lu01 时间: 2019-1-30 06:57
盘数多但提升慢 560 4151 (±83)

作者: 天地一_AD84H 时间: 2019-1-30 08:16
509下不过LZ202

作者: gfchy 时间: 2019-1-30 11:24
这玩意要么强机要么慢棋否则没啥用计算的比lz慢很多

作者: jcjcw3 时间: 2019-1-31 17:11
626权重评分最高呀，楼主放个链接吧，谢谢！

作者: lu01 时间: 2019-1-31 20:47
作者没放出来转换后的,原始的可以按照下面网页
https://github.com/tensorflow/minigo

作者: lu01 时间: 2019-1-31 22:32
现在665最强

作者: yunhuo 时间: 2019-2-1 09:09

lu01 发表于 2019-1-31 22:32
现在665最强

665是40B的吧，这样的大权重在强机上才能充分发挥实力，如果在弱机很多时候还不如小权重

作者: 夏天_Z5rwS 时间: 2019-2-1 09:36
什么配置才算强机呢？不懂。

作者: yunhuo 时间: 2019-2-1 10:06

夏天_Z5rwS 发表于 2019-2-1 09:36
什么配置才算强机呢？不懂。

那什么，前天我看了一款笔记本的评测视频，最新的2080的GPU，i9处理器，32G运存，光电源就有两个，重量13斤往上，价格4万元左右，这样的绝对堪称强机标杆

吓到没，哈，开玩笑的，实际上能跑的动40B的强机最起码要有个1060以上的独立显卡，运存最好也有个8G以上

作者: lu01 时间: 2019-2-2 14:46
手机才说运存

作者: lu01 时间: 2019-2-2 14:46
https://cloudygo.com/v16-19x19/eval-graphs minigo最新排名

作者: lu01 时间: 2019-2-3 05:13
更新了https://cloudygo.com/converted_model/v16-19x19/models/

作者: lu01 时间: 2019-2-3 05:37
下载转换方法 https://github.com/leela-zero/leela-zero/issues/2183#issuecomment-459962389

作者: jcjcw3 时间: 2019-2-3 09:23
本帖最后由 jcjcw3 于 2019-2-3 13:22 编辑

谢谢！

作者: keexisun 时间: 2019-2-3 11:51
目前最强805权重，征子识别有问题，识别要滞后两手
估计要完善，至少还得900号权重以后了

作者: gfchy 时间: 2019-2-3 12:25
各位试用了么

作者: gfchy 时间: 2019-2-3 13:11
在测试这也太慢了。。。比lz慢太多。。等吧，蜗牛的权重它可能很厉害但是等不起。。

作者: landa 时间: 2019-2-3 15:30
感觉比leela的40b权重慢了近一半。难道leela对亲儿子有优化？

作者: lu01 时间: 2019-2-3 18:32
什么叫慢?怎么测试的

作者: nako350 时间: 2019-2-3 20:39
貌似征子有问题

作者: yunhuo 时间: 2019-2-4 08:39

lu01 发表于 2019-2-3 18:32
什么叫慢?怎么测试的

用leela引擎跑leela权重，同时间计算量明显要比跑minigo的快，例如，40B的Leela每秒跑100po，40B的minigo可能只能跑60po，大概就是这个意思。我在跑990的时候就发现有这个问题，但貌似不影响最后的输赢，minigo的权重最后基本都是赢。

作者: lu01 时间: 2019-2-4 08:57

yunhuo 发表于 2019-2-4 08:39
用leela引擎跑leela权重，同时间计算量明显要比跑minigo的快，例如，40B的Leela每秒跑100po，40B的minigo ...

知道了,是否小数精度的问题?

作者: yunhuo 时间: 2019-2-4 11:39

lu01 发表于 2019-2-4 08:57
知道了,是否小数精度的问题?

那就不知道了，minigo是比较新的，有各种小问题到不奇怪，日后改善就好

作者: keexisun 时间: 2019-2-4 12:01
本人用LZ0.16版测试的速度很正常，和跑LZ40b没什么区别

作者: lxjtt09 时间: 2019-2-4 12:05
805主要有征子bug.

作者: lu01 时间: 2019-2-4 12:47
800以上强多了，前15有10个

作者: lu01 时间: 2019-2-4 12:53
排行榜

Ratings from 89536 games rating uncertainty
Best model 000882-glory 4452 ± 40
2 000894-affray 4436 ± 70
3 000805-pallas 4428 ± 26
4 000833-black-prince 4419 ± 29
5 000883-acheron 4380 ± 37
6 000892-alliance 4362 ± 45
7 000797-centaur 4360 ± 24
8 000866-brave 4353 ± 30
9 000856-wanderer 4338 ± 30
10 000884-perseus 4328 ± 36
11 000864-parthian 4303 ± 28
12 000715-trusty 4300 ± 20
13 000827-expedition 4262 ± 29
14 000699-lively 4256 ± 20
15 000863-gibraltar 4256 ± 30

作者: lu01 时间: 2019-2-6 06:32
分没涨，900以上的多了

Ratings from 105523 games rating uncertainty
Best model 000930-goliath 4450 ± 26
2 000894-affray 4400 ± 23
3 000984-prospero 4396 ± 42
4 000805-pallas 4337 ± 20
5 000882-glory 4336 ± 21
6 000942-duchess 4329 ± 23
7 000899-kingfisher 4323 ± 22
8 000959-phoenix 4309 ± 26
9 000833-black-prince 4301 ± 21
10 000905-hydra 4298 ± 23
11 000960-conqueror 4293 ± 28
12 000938-hercules 4291 ± 30
13 000965-coronation 4276 ± 39
14 000883-acheron 4274 ± 23
15 000892-alliance 4272 ± 24

作者: lu01 时间: 2019-2-8 08:44
v13 权重 https://cloudygo.com/converted_model/v13-19x19/models/

作者: yunhuo 时间: 2019-2-8 09:31

lu01 发表于 2019-2-8 08:44
v13 权重 https://cloudygo.com/converted_model/v13-19x19/models/

V13是多少B的权重？棋力如何？有排名什么的吗？

作者: lu01 时间: 2019-2-8 12:37
v13排名 https://cloudygo.com/v13-19x19/eval-graphs
介绍 https://cloudygo.com/RESULTS

作者: keexisun 时间: 2019-2-12 12:18
貌似40b的训练效果不太好，
又重新去训练20b的了，不过貌似用的新方法

作者: lu01 时间: 2019-2-17 21:05

keexisun 发表于 2019-2-12 12:18
貌似40b的训练效果不太好，
又重新去训练20b的了，不过貌似用的新方法

谷歌有钱任性

作者: yunhuo 时间: 2019-2-19 20:03
本帖最后由 yunhuo 于 2019-2-19 20:05 编辑

lu01 发表于 2019-2-17 21:05
谷歌有钱任性

貌似最新的V17的权重也快开始放了

作者: lu01 时间: 2019-2-20 05:35
作者说v17转不了lz格式

作者: nako350 时间: 2019-2-20 08:10
你们觉得好用吗？还只是觉得新鲜而已？反正我觉得一点都不好用

作者: yunhuo 时间: 2019-2-20 13:08

nako350 发表于 2019-2-20 08:10
你们觉得好用吗？还只是觉得新鲜而已？反正我觉得一点都不好用

没什么好用不好用吧，就是一个权重，目前对比最强的990略弱于最新的elfv2

欢迎光临飞扬围棋 (http://bbs.flygo.net/BBS/)