飞扬围棋

 找回密码
 注册
搜索
查看: 119214|回复: 88
打印 上一主题 下一主题

家里各种硬件跑leela zero的性能总结

[复制链接]
跳转到指定楼层
1#
发表于 2019-6-23 23:30 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 陈佳康 于 2020-12-2 00:02 编辑

nvidia gpu:
RTX 3090+3090 (ryzentr-3970x 128G) 2750n/s
RTX 3090 (ryzentr-3970x 128G) 1450n/s
RTX 2080ti+2080ti (ryzentr-3970x 128G) 1950n/s
RTX 2080ti (i9-7900x 128G) 1062n/s

GTX 1070ti (i9-7900x 128G) 460n/s
GTX 1070ti (r5-1400 16G) 416n/s
GTX 1065 (2*e5-2680v2 64G) 253n/s
GTX 980m (i7-6820hk 16G) 195n/s
P106-90 (i5-3470 12G) 123n/s
GTX 860m (i7-4700mq 16G) 82n/s

GTX 750ti (2*xeon-x5675 64G) 82n/s
GTX 750 (xeon-e5450 8G) 75n/s
GT 730D3 (xeon-e5450 8G) 20n/s


amd gpu:
RX 590+588 (r7-2700x 32G) 513n/s
RX 574+574 (r7-2700x 32G) 401n/s
Radeon VII (i9-7900x 128G) 361n/s
RX 590 (r7-2700x 32G) 275n/s
RX 588 (2304sp, r7-2700x 32G) 245n/s
RX 574 (2*xeon-x5675 64G) 211n/s
RX 550 (开核768sp+超频, i5-3470 12G) 83n/s
R7 240D3 (i5-3470 12G) 29n/s


intel gpu:
HD 530 (i7-6820hk 16G) 22n/s
HD 6000 (i7-5650u 8G) 20n/s
HD 5500 (i5-5200u 8G) 12n/s
HD 5000 (i7-4550u 8G) 11n/s
HD 4600 (i7-4700mq 16G) 9n/s
HD 2500 (i5-3470 12G) 跑不了


cpu:
tr-3970x 81n/s
i9-7900x (超频) 38n/s
2*e5-2680v2 35n/s
r7-2700x (超频) 23n/s
r7-2600x 17n/s
2*xeon-x5675 17n/s
2*opteron-6281se 16n/s
i7-6820hk 12n/s
r5-1400 9n/s
i7-4700mq 8n/s
i5-3470 7n/s
xeon-e5450 5n/s
i7-5650u 5n/s
i7-4550u 4n/s
i5-5200u 4n/s
i3-5005u 3n/s
celeron-1037u 1n/s


综上,GT 730/r7 240这类入门级独显,基本和旗舰CPU相当
我手里没有RTX 2060,预计性能在500-600n/s,应该是新卡里性价比最高的
RTX 2080ti跑自战基本能做到0.6-0.7s一手,3分钟左右一局,和google训练alphago用的专用张量处理器0.4s一手差距不大了
Titan RTX、RTX 8000、V100这样的旗舰卡、专业卡,算力比2080ti高约10-30%,但价格翻几番,土豪专用,性价比不高
跑AI不需要依赖SLI或者crossfire,通过leelaz参数可以任意组合显卡,包括可以组合独显+核显,只不过核显聊胜于无而已
RX570和p106(专用计算卡,无显示输出,算力等于GTX 1060),TB上都只卖350-400,二手矿卡。其实买个几块坏了就换性价比也很高
跑自战基本的要求是100n/s以上,否则一局半小时以上,一天也就40局
N卡20系列有tensor core和半精度(简单那来说跑AI性能翻倍),比10系列强很多。
A卡建议利用价格优势组双卡。软件对N卡支持好于A卡,某些A卡会有奇怪的问题。
Intel核显在5代之后是个飞跃,同样的规格下明显强于4代之前,5代后只有核显的机器用核显是明显快于CPU的,另外核显很大程度受cpu、内存性能和散热能力影响,台式比笔记本要强不少。4代及以前,核显不见得快于cpu。3代核显直接没法跑。


200n/s以上都能去网棋随便虐职业顶尖,50n/s基本都可以和职业一战,大部分业余选手连10n/s机器都是下不过的,所以刚开始入门,用比较新的核显开250po(一般5s内就会走子,或者用15b权重开800po),也是被虐的不要不要,不一定非得追求强机。

























评分

1

查看全部评分

回复

使用道具 举报

推荐
发表于 2020-11-16 13:01 | 只看该作者
这是这个论坛至今最有价值的帖子!
回复 支持 1 反对 0

使用道具 举报

2#
 楼主| 发表于 2019-6-23 23:33 | 只看该作者
用最差的1037u跑自战,基本都得1000分钟以上一局
回复 支持 反对

使用道具 举报

3#
发表于 2019-6-24 06:04 来自手机 | 只看该作者
谢谢提供信息
回复 支持 反对

使用道具 举报

4#
发表于 2019-6-24 08:19 | 只看该作者
这个贴贡献不小。
回复 支持 反对

使用道具 举报

5#
发表于 2019-6-24 09:21 | 只看该作者
每秒多少N是什么意思 是大约多少PO吗
回复 支持 反对

使用道具 举报

6#
发表于 2019-6-24 09:23 | 只看该作者
在leelaz gtp命令提示符输入netbench的结果
回复 支持 反对

使用道具 举报

7#
发表于 2019-6-24 09:48 | 只看该作者
2060 只有300,500-600 是2080的势力范围。
回复 支持 反对

使用道具 举报

8#
发表于 2019-6-24 09:50 | 只看该作者
lu01 发表于 2019-6-24 09:23
在leelaz gtp命令提示符输入netbench的结果

哦 谢谢
回复 支持 反对

使用道具 举报

9#
 楼主| 发表于 2019-6-24 14:00 | 只看该作者
landa 发表于 2019-6-24 09:48
2060 只有300,500-600 是2080的势力范围。

2060算力是2080ti的45%左右,加上里拉目前单路是跑不满2080ti的,所以知乎上2060 500-550n/s的数据还是准确的,而且那个帖子大部分数据都偏小

https://www.zhihu.com/question/311287992
回复 支持 反对

使用道具 举报

10#
 楼主| 发表于 2019-6-24 14:04 | 只看该作者
本帖最后由 陈佳康 于 2019-6-24 14:06 编辑

已补充i5 3470和rx 240的数据,i5 3470完全和猜想一样,本身cpu性能就好预测

rx240估计20+,实测29,看起来虽然规格不强但是amd拿他对标GT 635/640还是有底气的
另外确认3代核显跑不了里拉,之前linux上1037u只能用cpu看起来不是bug


回复 支持 反对

使用道具 举报

11#
发表于 2019-6-24 14:27 | 只看该作者
陈佳康 发表于 2019-6-24 14:00
2060算力是2080ti的45%左右,加上里拉目前单路是跑不满2080ti的,所以知乎上2060 500-550n/s的数据还是准 ...

知乎上的数据都是用netbench 6400命令测试的,netbench是纯神经网络速度,无缓存,比实战慢一点。但结果稳定,方便横向比较。
你也可以用netbench 6400命令测测,在gtp窗口输入netbench 6400回车,看分数。
lizzie(mylizzie)按e打开gtp窗口,gogui在输入time_settings命令那里。

还有,2080ti在windows 10里跑不满,但在linux里可以
用netbench 6400命令测试
windows里只有850n/s左右,但linux里超过1100n/s
回复 支持 反对

使用道具 举报

12#
发表于 2019-6-24 14:30 | 只看该作者
4路2080ti,ubuntu,平均30秒一局,一小时120
命令:
autogtp -g 2 -u 0 -u 1 -u 2 -u 3 -k sgf

一定要用-g 2命令,也就是每块显卡同时跑两张棋谱,这样才能充分利用显卡,否则还是跑不满
回复 支持 反对

使用道具 举报

13#
 楼主| 发表于 2019-6-24 14:52 | 只看该作者
更新另一套洋垃圾皓龙6281se双路的性能,gentoo cpu-only

另外我是拿leelaz --benchmark  -w best-network跑的,这个性能确实比netbench要快一点
回复 支持 反对

使用道具 举报

14#
 楼主| 发表于 2019-6-24 14:58 | 只看该作者
虽然主要靠显卡,不过cpu最好用4GHz以上的,否则无法完全发挥显卡能力。买来2080ti后,1070ti被从i9 7900x丢到了r5 1400上,3D就不说了,差20%以上,纯计算性能也差了10%
回复 支持 反对

使用道具 举报

15#
发表于 2019-6-24 15:01 | 只看该作者
本帖最后由 r700k 于 2019-6-24 21:30 编辑

windows 10

RTX 2070 (leelaz -w 229 --benchmark) - 724 n/s
                                 (netbench 1600) - 640 n/s

回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|Archiver|手机版|飞扬围棋网 ( 苏ICP备11029047号-1 )

GMT+8, 2024-11-27 08:14 , Processed in 0.169010 second(s), 21 queries .

since 2003飞扬围棋论坛 Licensed

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表