jm8180861 发表于 2023-6-3 19:13
没有使用过!下载来看看!
在引入深度学习之前的mcts方法中,如早期的Zen,一个playout指从当前盘面开始,经过一次快速模拟走子直到终局,获得一个胜负结果的过程。
在引入深度学习方法后的早期阶段,如AlphaGo Fan和AlphaGo Lee架构,一个playout指从当前盘面开始,经过一次对神经网络中的价值网络访问获得一个局面评估值,及从该盘面进行1000次快速模拟走子(称为rollout)获取统计结果,并将上两项加权相加,得出该盘面最终评估的过程。
在后续的深度学习方法,如AlphaGo Zero和Alpha Zero架构,一个playout指从当前盘面,获得一个神经网络的value端(价值网络)评估输出值的过程。
一般可以简单翻译为计算量(次数),或模拟量(次数)。
1v等同于1po,但10v不一定等同于10po.关键是要理解软件计算存在这样一个特点,如果对手下出软件预计之内的棋,软件就会把上一步的计算数据继承到下一步,如果对手下出意料之外的棋,软件就会重新从零开始计算
假设固定10po下棋,当对手下出意料之内的棋的时候,软件下一步就可能不进行计算而秒拍。但如果固定10v下棋,软件就会每一步都思考10v,也就是无论对手的应法是否在意料之内,软件都会匀速的走下一步棋。
play out基本解释
逐渐发生;展开;结束;使精疲力竭
例:
This has yet to play out on the mainland .这出戏正在大陆上演。
–heatmap 代表显示下一步棋可能选点的热图。如果你不希望显示热图,可以去掉该参数。
–playouts 大致可以理解成演算的深度,数字越低则AI的水平也较低,需要配合noponder参数一起使用。
–noponder 代表不占用对手的时间进行思考。
40b这里的b是blocks 神经网络的层数
Best Network Hash
闲云野鹤123 发表于 2023-6-11 20:42
演算量
ai演算机制 贴上來看看
欢迎光临 飞扬围棋 (http://bbs.flygo.net/BBS/) | Powered by Discuz! X3.2 |