全能棋王”AlphaZero的启示直觉如何战胜逻辑

很累小白 · 发表于 2017-12-19 08:42

全能棋王”AlphaZero的启示直觉如何战胜逻辑
国际象棋

　　现代文明和科技已经使得我们的直觉不断退化。绝大多数人都没有意识到直觉的价值甚至没有意识到它的存在。作为复杂计算的基础，直觉是一种很容易被忽视的非常规方法。这种非常规性使得许多研究人员忽视它的潜力。

　　我在人工智能领域所做的工作围绕“先进的认知机器将使用直觉作为其智力基础”这一想法。我们人类的思想为一般化的智力提供了充足的证据。人类本质上是直觉机器，而我们理性（和自觉）的自我只是基于直觉的机器之上的一个模拟。这与笛卡尔的名言“我思故我在”形成鲜明的对比，意味着我们的理性思维就是把我们与其他所有生物区分开的东西。

　　我们因此在认知上有了偏见，要求技术和方法由逻辑机器驱动。这就是 Good Old Fashioned AI （GOFAI）在过去几十年间失败的原因，它从一开始就试图通过逻辑范式来解决智力问题。

　　一个关于直觉的机器的反直觉的预想就是“逻辑思维如何从直觉机器中产生呢？”自 2012 年以来，我们已经见证了深度学习技术令以难以置信的进步。深度学习网络就是直觉机器。深度学习网络通过归纳来进行推理或者作出预测。深度学习系统已经能够执行通常保留给生物大脑的任务了。已知对于传统计算来说难以进行的任务，例如面部和语音识别，可以由这些机器以超越人类的水平执行。

　　然而，深度学习网络无法执行长除法等逻辑任务。人们不应该指望能够教导一个动物（比如你的宠物狗）加减，更不用说乘法。然而，人类的大脑却可以执行各类这样的逻辑问题。我们不得不问，洞穴人能做乘法吗？我们是天生就具备先进的逻辑认知能力，还是说那是我们作为先进文明的结果而学到的能力？

　　要实现更一般化的人工智能需要跨越的巨大鸿沟就是所谓的“语义鸿沟”。我们要如何将深度学习（低阶语义）系统与逻辑（高阶语义）系统的能力融合在一起？

　　人类思维能够发挥逻辑推理的伟大功绩。如果我们的思维机器都是基于直觉的，那么它是如何做到这一点的呢？我要在这里假设我们没有任何天生的逻辑装置。在我们已经存在于这个星球上的短时间内，现代智人不大可能发展出这种认知机制。因此，为了消除语义鸿沟，我们需要使用只基于直觉的机制来弥合。这意味着我们不需要将逻辑组件与直觉组件进行融合。我们所需要一切的就只是直觉组件。

　　因此我们需要充分的证据来证明，复杂的逻辑思想可以通过直觉机器来完成。

　　这才是 AlphaZero 革命性的启示。AlphaZero 是 DeepMinds Go play 程序的最新版本。我之前介绍过 AlphaGoZero 如何可以从零开始掌握围棋的玩法（不需要人类的经验）。西方人从来没有玩过围棋的游戏，根本就不理解它。所以 DeepMind 的 AlphaGoZero 成就的相关性已经被消除了。我们不明白这个成就的重要性。然而，围棋一直被认为是一个直觉游戏。所以一个基于直觉的机器掌握了这项游戏并不令人惊讶。

　　什么？DeepMind 的新化身（AlphaZero）却能做的就是玩国际象棋？这对很多人来说仍没有什么令人惊讶的，自 1996 年 IBM 的 DeepBlue 击败卡斯帕罗夫以来，这个游戏就被“解决”了。对于外行来说，AlphaZero 只花了几个小时就能从头开始掌握国际象棋游戏也没什么值得注意的。甚至 AlphaZero 在 100 场比赛中能够摧毁最好的国际象棋程序 Stockfish 也并不值得注意。

　　真正了不起的是 AlphaZero 在消解更合乎逻辑的对手方面所起的作用。为了让你理解，我会引用一些象棋社区的评价。

　　它接近“类型 B”，按照克劳德·香农和艾伦·图灵的梦想，用类似于人类的方法来下棋，而不是蛮横的力量。

　　—？Gary Kasparov。

　　我总是在想，如果有一个超级先进的物种降落在地球上并向我们展示他们如何下棋，那将是怎样的情况。现在我觉得我知道了。

　　—？Peter Heine Nielsen

　　它的棋路不像人类，但也不像程序。它以第三种方式，可以说是外星人的方式下棋。

　　？—？Demis Hassabis（DeepMind 创始人，国际象棋爱好者）

　　对于那些了解国际象棋的玩家来说，最好的办法就是观看 AlphaZero 和 Stockfish 的实战。你会看到的是一个基于直觉的系统如何拆解基于逻辑的对手。以下是游戏及专家评论：

　　AlphaZero 国际象棋的走法非常不同。为了获得优势超过对手的位置，它愿意牺牲一些棋子。它正在发挥一种国际象棋柔道，利用对手的对短期利益的热切渴望来对抗它。它将对手置于国际象棋中称为“被迫强制”的地位，无论如何走动都只会导致更糟糕的结果。

　　国际象棋的游戏似乎更具整体性，所有棋子都以高度协调的方式移动。AlphaGo zero 所进行的游戏最大限度地发挥了它的创造力，而它的逻辑对手无法超脱短期收益。它不仅在用一种不可想象的方式来玩国际象棋，而且这种方式将被置于令所有人惊叹的位置上。

　　关于 AlphaZero 的论文在最近结束的 NIPS 2017 大会上发表。那是一篇很短的论文，主体部分只有 7 页长。它提供了广泛的关于如何评估棋盘上的落子位置和决定下一步走法的有趣的细节。

　　和 Stockfish 每秒搜索 7 千万位置相比，AlphaZero 每秒只搜索 8 万个位置。

　　直觉机器使用的评估比逻辑对手少 1，000 倍。

　　你在这里与 AlphaZero 共同见证的是对我关于直觉机器和他们执行逻辑推理的能力的原始论证的验证。这是被链接的语义鸿沟。这是一个极其艰巨的通用人工智能的里程碑正在以创纪录的速度被超越。我想 AI 界的任何人都期望这样的进展能够迅速地实现。现在这样的事情已经发生了，人工智能的风景将被永远改变。

帐号		自动登录	找回密码
密码			注册

全能棋王”AlphaZero的启示 直觉如何战胜逻辑

全能棋王”AlphaZero的启示直觉如何战胜逻辑