飞扬围棋

标题: windows下各种显卡跑katago可以有个准确的性能总结吗 [打印本页]

作者: 南岭励仁    时间: 2021-8-3 00:19
标题: windows下各种显卡跑katago可以有个准确的性能总结吗
题目是山寨陈总关于《家里各种硬件跑leela zero的性能总结》。毕竟LeelaZero已经退圈了,况且LeelaZero几年前装过不知道怎么能跑起来,懒。在yzy整合包工具栏显示的V/S是浮动很大的存在,在GTP窗口中照搬那个什么netbench 6400显示错误。现在katato对A卡似乎友善了一些,之乎上有30系的大概数值参考,但A卡6000系还没有,有方法可以来个准确的参考数值吗?
作者: ILoveBt2    时间: 2021-8-3 15:38
直接租显卡跑。自己买显卡跑谱不合算,费钱费电,大夏天机器散热也吃不消。
作者: 南岭励仁    时间: 2021-8-3 23:26
不遛狗不跑谱(深度学习那种),偶尔摆一下棋而已,设置了每步棋只跑30秒,有个停顿的时间温度就不会太高。去年在夜壶注册了个遛狗的号,在对手的指导下遛了一盘,实在挺无聊的,浪费电力和精力。
作者: 阿扬    时间: 2021-8-4 12:31
如果用来学棋,其实也没必要那么讲究
作者: hred9D    时间: 2021-8-4 19:49
多次说过,简单的配置,20B权重,都足够业余7段学习了
作者: SmileFox    时间: 2021-8-4 21:32
我有台几年前的i5,用cpu版的katago,40b权重一秒钟可以跑12到15p,如果半分钟一步棋,能赢这样一个弱鸡的人类,大概会不超过20个
作者: zhouyang    时间: 2021-8-4 23:41
kato引擎自带benchmark命令。
示例如下:

katago-opencl.exe benchmark -model ..\weights\katago-40b.bin.gz -config ..\config\katago.cfg
替换权重路径和配置文件路径。

支持多个参数,比如,测试多少v,用多少线程同时测试。示例:

katago-opencl.exe benchmark -model ..\weights\katago-40b.bin.gz -config ..\config\katago.cfg -t 1,4,8,16,24,32

同时测试1,4,8,16,24,32 线程。-t 指定测试的线程数。

默认测试10次平均,都可以修改,示例:

katago-opencl.exe benchmark -model ..\weights\katago-40b.bin.gz -config ..\config\katago.cfg -boardsize 19 -v 3200 -t 16 -n 5

测试19x19的棋盘。 -v 指测试3200v,-n 5,取五次平均。 -t 16 ,只测试16线程。

katago的benchmark 功能非常完整了,可自己看说明参考。

.\katago-opencl.exe benchmark -help

DESCRIPTION:

   Benchmark with gtp config to test speed with different numbers of
   threads.

USAGE:

   benchmark  [-config <FILE>] [-model <FILE>] [-v <VISITS>] [-t <THREADS>]
              [-n <NUM>] [...other flags...]


Where:

   -config <FILE>
     Config file to use (see gtp_example.cfg or configs/gtp_example.cfg).
     Defaults to: (dir containing katago.exe)/default_gtp.cfg

   -model <FILE>
     Neural net model file. Defaults to: (dir containing
     katago.exe)/default_model.bin.gz

   -v <VISITS>,  -visits <VISITS>
     How many visits to use per search (default 800)

   -t <THREADS>,  -threads <THREADS>
     Test these many threads, comma-separated, e.g. '4,8,12,16'

   -n <NUM>,  -numpositions <NUM>
     How many positions to sample from a game (default 10)

   -override-config <KEYVALUEPAIRS>  (accepted multiple times)
     Override config parameters. Format: "key=value, key=value,..."

   -sgf <FILE>
     Optional game to sample positions from (default: uses a built-in-set
     of positions)

   -boardsize <SIZE>
     Size of board to benchmark on (7-19), default 19

   -s,  -tune
     Automatically search for the optimal number of threads (default if not
     specifying specific numbers of threads)

   -i <SECONDS>,  -time <SECONDS>
     Typical amount of time per move spent while playing, in seconds
     (default 5)

   --,  -ignore_rest
     Ignores the rest of the labeled arguments following this flag.

   -version
     Displays version information and exits.

   -h,  -help
     Displays usage information and exits.


作者: 南岭励仁    时间: 2021-8-5 23:17
zhouyang 发表于 2021-8-4 23:41
kato引擎自带benchmark命令。
示例如下:

虽然看不懂,但还是要感谢。

作者: missdeer    时间: 2021-8-6 12:08
阿扬 发表于 2021-8-4 12:31
如果用来学棋,其实也没必要那么讲究

那不是,就像很多人喜欢收藏各种棋具棋书一样,跟学棋一点关系没有


作者: zjh889    时间: 2021-8-7 00:47
是呀,显卡贵呀!
作者: 南岭励仁    时间: 2021-8-8 00:02
中老年人,大半生都耽搁了,所以买显卡学棋变为玩游戏不是问题。大概在七八年前就很少下网棋了,这三四年更是几乎为零,棋力也是稳步退化中。更多是偶然做下题、欣赏下高手惊爆眼球的一手,去年初开始受影响,对显卡是盲目的关切起来,先后用过750ti、RX560、1660ti、2060,前三去年都亏本出了,2060的40B权重大致500V/s左右。今年五月初把2060卖了,白用一年还赚了1500。换了块过渡卡960,40B权重120V/s浮动,大概是2060的1/5-1/4速度。然后618来了,按捺不住入了A卡6700XT,40B权重在800-900Vs左右。
作者: ILoveBt2    时间: 2021-8-8 15:02
我本来也想把我的GTX750Ti的老古董换了,弄块RTX2060玩玩,但价格实在是离谱。后来网上看了些教程,开始使用ikatago配合租显卡,觉得相当不错。现在平时基本上两个账号交替免费用google的colab,40B可以到500-600v/s左右。配额到了的话在恒源云https://gpushare.com/上租块2080Ti,一小时1.8元,40B权重在1000v/s左右。不费电,不用担心散热,很香啊。
作者: captive    时间: 2021-8-21 17:39
ILoveBt2 发表于 2021-8-8 15:02
我本来也想把我的GTX750Ti的老古董换了,弄块RTX2060玩玩,但价格实在是离谱。后来网上看了些教程,开始使 ...

这样也挺划算啊。有教程或者关键字吗?


作者: chaojinaiba    时间: 2021-8-22 00:07
不急的等矿难,根据预算淘块30系,a卡跑狗拉胯不推荐。
作者: ILoveBt2    时间: 2021-8-22 00:57
captive 发表于 2021-8-21 17:39
这样也挺划算啊。有教程或者关键字吗?

本站就有 - http://www.flygo.net/bbs/forum.p ... &extra=page%3D1

作者: lanke2021    时间: 2021-8-25 18:22
提示: 作者被禁止或删除 内容自动屏蔽
作者: 南岭励仁    时间: 2021-8-27 00:48
618考虑再三买6700XT的时候,N卡方面主推3070ti(之后都反映就功耗和温度而言3070更划算),而3060ti还没推出,3060都说是2060S的性能,3070高高在上,7月末降价是入3060ti和3070的最时机,8月又涨回去了。
作者: bash99    时间: 2021-9-7 13:55
40b benchmark结果
yoga 14s(5800H的集成vega 8显卡) 64   v/s
19年的R7000(1060 6G)                  144 v/s

另外就算yoga 14s, 最新kata1的40b强权重(994), 同时间仍然能赢 20b-530的权重, 也就是这一级的中低端跑新的40b还是比20b强.

mx450应该比14s更快一点, mx250比yoga 14s慢.

作者: 南岭励仁    时间: 2022-6-18 00:17
本帖最后由 南岭励仁 于 2022-6-18 00:18 编辑

这个是上段时间使用3月份整合包跑的,竟显示达到30000多搜索量/秒,显卡是6700XT,使用最新的恢复正常700搜索量/秒左右。

作者: 南岭励仁    时间: 2022-6-24 23:05
一台电脑分别使用6700Xt和3060ti,其他配置相同,这是综合性能相近的两张显卡。A卡用opencl引擎大致700v/s左右,偶尔1000以上。N卡用TST引擎基本1100v/s以上,偶尔能1800以上。

作者: jjyy88    时间: 2023-1-19 15:59
1080足够了。
作者: ludwigyo    时间: 2023-8-10 15:51
zen7 就行了
作者: Rinne    时间: 2023-8-16 22:53
不建议自己买卡跑,除非是很深度的用户
作者: amiok    时间: 2023-8-17 10:33
https://lifein19x19.com/viewtopic.php?f=18&t=19185

KataGo 18B

每秒访问数,硬件和软件

6500    RTX 4070 TensorRT
4000    RTX 4070 CUDA
3000    2 * RTX 2080TI [1]
2200    RTX 4070 OpenCL
0580    5700XT [2]
0300    iPad_Pro/M1 [3]
0200    iPhone 13 pro [4]
0170    iPad/A12X [5]
作者: Thaldn    时间: 2023-10-9 19:33
再看一遍
作者: 叶飘    时间: 2023-11-29 10:21
我想买一台RTX4000显卡的移动工作站(笔记本),这个跑起来是不是也不错了?




欢迎光临 飞扬围棋 (http://bbs.flygo.net/bbs/) Powered by Discuz! X3.2