飞扬围棋

 找回密码
 注册
搜索
查看: 6976|回复: 0
打印 上一主题 下一主题

阿老师一样下围棋,体验 policy network 的运作【走近 AlphaGo (7.3)】

[复制链接]
跳转到指定楼层
1#
发表于 2017-12-7 10:37 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
https://zhuanlan.zhihu.com/p/28424619
PENG Bo4 个月前

AlphaGo的神秘之处在于策略网络和价值网络,它们可以实现一个惊人的事情:即使你对围棋基本一窍不通(只要你会数气),也没有任何逻辑推理能力,只要你会做加法和乘法,就可以达到相当强的棋力。
不过确实要做相当多的加法和乘法!在此我们简化一下,看一个最简化的策略网络是如何具体运作,虽然它的棋力很低,但也能让读者体验到一点“半人半狗”的感觉。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|Archiver|手机版|飞扬围棋网 ( 苏ICP备11029047号-1 )

GMT+8, 2025-2-27 09:27 , Processed in 0.133660 second(s), 19 queries .

since 2003飞扬围棋论坛 Licensed

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表