飞扬围棋

标题: leelaz将要发布NVIDIA版本 [打印本页]

作者: lu01    时间: 2018-11-20 07:55
标题: leelaz将要发布NVIDIA版本
https://github.com/gcp/leela-zero/issues/2032

作者: landa    时间: 2018-11-20 20:14
或许是个错误决定,nvidia靠不公开cuda中ai部分,只卖硬件的模式不会长久。ai不一定要绑在显卡上,华为、阿里的AI加速卡已经测试阶段。
作者: 罗浩宇    时间: 2018-11-20 20:55
亲爱的楼主 这个版本 和原来的版本有什么不一样呢 ,不都是用显卡吗?求科普,谢谢!!

作者: landa    时间: 2018-11-20 21:41
罗浩宇 发表于 2018-11-20 20:55
亲爱的楼主 这个版本 和原来的版本有什么不一样呢 ,不都是用显卡吗?求科普,谢谢!!

现在版本用的是opencl语言编写,支持各种显卡来进行并行计算。n卡对其只支持到1.2版,效率不高。
未来版本是cuda语言编写,只支持n卡,运行效率和编程效率都会提高。
cuda今年加入了cudnn深度学习库,这个库有利于leela的权重训练。
但cuda和cudnn绑死了n卡,很多ai公司不爽,在研发脱离显卡的ai加速卡。
云加速也是个趋势,也许明年,你接入到阿里云或华为云,不用买昂贵的显卡也能享受高速并行计算的服务。

作者: 罗浩宇    时间: 2018-11-20 22:21
landa 发表于 2018-11-20 21:41
现在版本用的是opencl语言编写,支持各种显卡来进行并行计算。n卡对其只支持到1.2版,效率不高。
未来版 ...

谢谢 懂了很多,就是说 N卡以后能很好的用里拉姐姐 ,而A卡就不太好用了 ,是吗?

作者: hred9D    时间: 2018-11-21 12:54
nvidia的老黄唯利是图。。
作者: hred9D    时间: 2018-11-21 21:21
大家去支持一下作者,需要20人以上
作者: amiok    时间: 2018-11-22 22:14
你理解反了,应该是,AMD卡用Leela更好,比N卡好。
现在,用了fp16,在A卡,快了两倍,
但,N卡,即使是2080Ti,也没怎么提升,
因为,N卡,不支持新的OpenCL。
作者: lxjtt09    时间: 2018-11-22 22:25
本帖最后由 lxjtt09 于 2018-11-22 22:32 编辑
amiok 发表于 2018-11-22 22:14
你理解反了,应该是,AMD卡用Leela更好,比N卡好。
现在,用了fp16,在A卡,快了两倍,
但,N卡,即使是2 ...

没有2倍那么夸张吧。


作者: 小曾    时间: 2018-11-22 22:34
千万不要乱说的,免得人家误解
作者: amiok    时间: 2018-11-23 07:17
gcp commented 5 days ago •
edited
anything to optimize on amd gpus (like rx580/590 or vega) ?
We support both of these through fp16 compute support (during inference). The RX cards in theory should only benefit a little because they only save register space in fp16 mode, but empirically my RX560 actually becomes almost twice as fast in fp16/half mode. Vega should benefit a lot as it has fp16 compute, but I remember early reviews saying it is disabled in OpenCL (Edit: Some Googling shows newer drivers do have it enabled).

For training it all depends on how good TensorFlow's support for AMD cards is.
作者: lxjtt09    时间: 2018-11-23 07:52
a卡确实提升明显,n卡要期待这个NVIDIA版了。
作者: amiok    时间: 2018-11-23 07:55
本帖最后由 amiok 于 2018-11-23 09:08 编辑

gcp(leela作者):2018-11-18
在amd gpus上优化了什么?(如rx580 / 590或vega)
支持fp16计算(推断过程)支持这两者。 理论上RX卡只会受益一点点,因为它们只能在fp16模式下节省寄存器空间,但从经验上来说,我的RX560在 fp16/半精模式下实际上几乎快了两倍。 Vega应该受益更多,因为它有fp16计算,但我记得早期的评论说它在OpenCL中被禁用(编辑:一些谷歌搜索显示,新的驱动程序确实启用了)。

对于训练来说,这一切都取决于TensorFlow对AMD卡的支持程度。

https://github.com/gcp/leela-zer ... uecomment-439025096

作者: amiok    时间: 2018-11-23 08:14
我的显卡是 Radeon HD7770,很老的,
用Leela Zero v0.15
  ELF权重,20B*224,自对弈,188手,123分钟,每手39.30秒。

用Leela Zero v0.16
  40B权重,40B*256,自对弈,154手,3322秒,每手21.57秒。

可见,提升确有两倍多。


作者: amiok    时间: 2018-11-23 08:38
李世乭 vs AlphaGo,第四局,神之一手分析,

#157 权重


ELF v1


#189 权重


作者: amiok    时间: 2018-11-23 09:06
amiok 发表于 2018-11-23 07:55
gcp(leela作者):2018-11-18
在amd gpus上优化了什么?(如rx580 / 590或vega)
支持fp16计算(推断过 ...

用的是谷歌翻译,没仔细检查。

作者: amiok    时间: 2018-11-23 09:14
本帖最后由 amiok 于 2018-11-23 09:22 编辑
amiok 发表于 2018-11-23 08:14
我的显卡是 Radeon HD7770,很老的,
用Leela Zero v0.15
  ELF权重,20B*224,自对弈,188手,123分钟, ...

HD 7770,只有15亿晶体管,10个计算单元;RX 580,有57亿晶体管,32个计算单元;

Vega 56,有125亿晶体管,56个计算单元;

正在考虑,升级到Vega 56。这卡是目前性价比最高的,尤其是用来跑Leela。


作者: 夏天_Z5rwS    时间: 2018-11-23 12:36
不懂,不是一直都说是 a卡不好嘛?求高手来解惑

作者: amiok    时间: 2018-11-23 15:56
本帖最后由 amiok 于 2018-11-23 17:58 编辑

刚开始,因为用的显卡是 Radeon HD 7770,比较老旧,
我也人云亦云,买了N卡 1050Ti,升级显卡。
结果,跑里拉,两者速度差不多。
但是,N卡看高清电影,居然不支持,音频源码输出,只能让其下岗了。
所以,深入研究了一下。发现,N卡过誉了。
上一代,A卡未推出高端显卡,所以N卡独占鳌头。
2017年,A卡推出第5代GPU,称为Vega,即织女星系列。
可以与N卡高端,一较高下。
现在,用的技术,两家是差不多的,都是十几纳米,
显卡,最重要的指标,就是芯片的晶体管多少,
从上表可以看到,Vega是125亿,而1070/1080是72亿,1080Ti是120亿,显存都是8GB。
A卡,在晶体管数量上是有优势的。
再有,A卡开放,对OpenCL、DirectX12的支持,比N卡好太多,有利于开源软件的开发。
最后,A卡,比N卡便宜,尤其在比特币崩溃后。  
上面,有网友提到,用Vega 56,Leela 40块,一手只需3.27秒。
这个速度,对一般爱好者,应该是足够了。

此卡,现价,2700元。我刚刚在淘宝已下单,订购一块。
另外,该卡,功耗210W,最高400W,所以,还需升级电源,我还订了一台 海韵650GC 电源。  
N卡,新卡,更胜一筹,但价格也更高。显卡中的苹果。
RTX 2080Ti,12nm,186亿晶体管,功耗260W,$999
RTX 2080,12nm,136亿晶体管,功耗225W,$699

作者: 小曾    时间: 2018-11-23 17:05
我是2080ti华硕的显卡的,感觉慢棋要比脸书厉害的
作者: 小曾    时间: 2018-11-23 17:06
今天下载了最新的里拉软件191权重,其实不如老的190权重,特别是容易被翻盘的,有缺陷
作者: 小曾    时间: 2018-11-23 21:03
小曾 发表于 2018-11-23 17:05
我是2080ti华硕的显卡的,感觉慢棋要比脸书厉害的

10秒和20秒都下过了,最终结果还是190权重赢的

作者: alven_zhang    时间: 2018-11-27 10:09
amiok 发表于 2018-11-23 15:56
刚开始,因为用的显卡是 Radeon HD 7770,比较老旧,
我也人云亦云,买了N卡 1050Ti,升级显卡。
结果, ...

请问vega56到手表现怎么样啊?能给小白讲一下么?我准备下手vega64,跟56比值得买么?还有看到有人说,vega要linux下才能正常运行,这。。。。
作者: amiok    时间: 2018-11-27 19:38
本帖最后由 amiok 于 2018-12-2 09:03 编辑

Vega 56到手,已用上了。
Windows 7 64系统,
驱动,Win7-64Bit-Radeon-Software-Adrenalin-Edition-18.11.2-Nov19
Leela Zero 0.16 AutoGTP v17
运行正常,支持fp16,

Leela Zero,
  OpenCL 2.1
  2990Gflops
  122 move,537s/game,4.40s/move,
  146 move,477s/game,3.56s/move,
自对弈,8~9分钟一局,支持半精fp16加速。爽。

https://www.hardwareluxx.de/inde ... ervolting-test.html降压,升频,节能73W.






作者: 夏天_Z5rwS    时间: 2018-11-28 12:38
amiok 发表于 2018-11-27 19:38
Vega 56到手,已用上了。
Windows 7 64系统,
驱动,Win7-64Bit-Radeon-Software-Adrenalin-Edition-18.1 ...

请问支持win10  64  吗?
作者: leeking    时间: 2018-11-28 18:26
夏天_Z5rwS 发表于 2018-11-28 12:38
请问支持win10  64  吗?

vega56在win10上更好

作者: hred9D    时间: 2018-11-28 20:06
这个时候开源,迟到了




欢迎光临 飞扬围棋 (http://bbs.flygo.net/Bbs/) Powered by Discuz! X3.2