飞扬围棋

标题: 请教关于KATAGO配置的几个问题 [打印本页]

作者: 心有万象    时间: 2022-6-15 12:51
标题: 请教关于KATAGO配置的几个问题
2年前为了用katago,专门买了一台2060super主机,感觉对自己帮助很大。前两天突然心血来潮想优化一下配置文件,结果偶然发现katago在运行时显存使用只有1G,内存使用大概有2G左右,后来发现配置文件里有nnCatchesizepowerofTwo=20,将其改为30后,16G内存直接占满,但搜索速度也没有提升。目前线程数为32,用rt引擎,版本均为最新。权重40b,版本为最新。nnMutexPoolSizePowerOfTwo=16。请教论坛棋友的问题是:1、如何让katago占用显存。2、nnCatchesizepowerofTwo这个值放大之后对整体计算性能又什么帮助?未来如果把内存扩大到128G有没有意义。

作者: SmileFox    时间: 2022-6-15 13:33
1. katago用多少显存好像是katago自己决定的,好像没法设置
2. nnCatchesizepowerofTwo 是用来缓存计算结果的,会如果当前局面在前面已经计算过了,会大大提高速度。 这个单位是2的多少次方个字节,20就是2的20次方, 30就是2的30次方。改30等于大了1024倍也就是1T。当然会不够了。
作者: 心有万象    时间: 2022-6-15 13:37
SmileFox 发表于 2022-6-15 13:33
1. katago用多少显存好像是katago自己决定的,好像没法设置
2. nnCatchesizepowerofTwo 是用来缓存计算结 ...

多谢指教,这么说大家的显卡显存都只是用1g多吗,这似乎有些浪费,显存没有充分利用。缓存设大没感觉有什么变化,仍然是1200v/s


作者: 南岭励仁    时间: 2022-6-15 22:14
2060s这么厉害?用的yzy整合包,用2060只有500v/s,后来用6700Xt也只有700V/s以上,40B,按照说明把那个什么线程数设为32以下(推荐2080ti设为32)。其实我不想让显卡吃满,让它可以偷下懒寿命可以长点。
作者: 心有万象    时间: 2022-6-16 10:04
南岭励仁 发表于 2022-6-15 22:14
2060s这么厉害?用的yzy整合包,用2060只有500v/s,后来用6700Xt也只有700V/s以上,40B,按照说明把那个什 ...

我这个机器就是用来跑katago的,一年最多几百个小时,根本不可能坏的,要跑满才有价值。
作者: SmileFox    时间: 2022-6-16 10:26
心有万象 发表于 2022-6-16 10:04
我这个机器就是用来跑katago的,一年最多几百个小时,根本不可能坏的,要跑满才有价值。

显存应该是跑不满的,就算60b的权重也就几百M。跑katago主要是流处理器在工作。
看跑满没跑满,,听风扇转的声音就好了
转的越响,说明跑的越满。



作者: 心有万象    时间: 2022-6-16 10:37
SmileFox 发表于 2022-6-16 10:26
显存应该是跑不满的,就算60b的权重也就几百M。跑katago主要是流处理器在工作。
看跑满没跑满,,听风扇 ...

是的是的,我现在最大的疑惑就是设置参数后内存跑满了,但是搜索速度和占用30%的时候一样。

作者: hred9D    时间: 2022-6-18 18:59
本帖最后由 hred9D 于 2022-6-18 19:02 编辑

1、参数配置不要单独修改,是否适合你的硬件,需要测试,回答几个问题,运行后自动生成新文件xinwenjian.cfg,
katago.exe genconfig -model kata1-b40.bin.gz -output xinwenjian.cfg
比如:RT引擎测试 40B,16G,13s,推荐96线程
结论机翻:根据一些测试数据,通过更深入的搜索,每一次倍速可能会获得大约250 ELO。
根据一些测试数据,如果使用800次访问,每个线程的成本可能是7 ELO,如果使用5000次访问,每个线程的成本可能是2 ELO(这会使MCTS变得更糟)。
因此,根据这个基准,如果您打算进行13秒的搜索:
数字搜索线程数=5:(基线)。
数字搜索线程数=10:+141 Elo。
数字搜索线程数=12:+190 Elo。
数字搜索线程=16:+247 Elo。
数字搜索线程=20:+308 Elo。
数字搜索线程=24:+343 Elo。
数字搜索线程=32:+336 Elo。
数字搜索线程=40:+595 Elo。
数字搜索线程=64:+546 Elo。
数字搜索线程=80:+644 Elo。
数字搜索线程数=96:+649 elo(推荐)。
数字搜索线程数=128:+646 Elo。
数字搜索线程=160:+631 Elo。

使用96个数字搜索线程!
2021-04-09 10:28:21+800:GPU-1精加工,处理29654排360批次。


2、安装aida64监测CPU,内存,显卡的运行状态,这是必须的重要的常见的操作!有时卡塔狗会没有正确占用硬件资源。

作者: 阿扬    时间: 2022-6-18 22:15
学习啊
作者: 假黄钺    时间: 2022-6-21 18:20
为什么要占用显存呢?运算速度才是关键指标,小显存占用是好事




欢迎光临 飞扬围棋 (http://bbs.flygo.net/bbs/) Powered by Discuz! X3.2