如何看待“DeepMind发69页长文掀开AlphaZero的黑盒：神经网络学到的知识和人类基本相似！”

请问大家如何看待这个问题？

原文来源： https://zhuanlan.zhihu.com/p/441834192

AlphaZero下棋和人类下棋究竟有什么区别？是否掌握了一些人类未曾了解过的知识？DeepMind最近携手国际象棋世界冠军发69页论文，深度解剖AlphaZero后发现，神经网络学到的知识和人类基本相似！

机器学习系统通常被认为是不透明的、不可预测的，和人类所接受的训练几乎没有任何共通之处。

难道，黑盒模型和可解释性的学习注定是两条路？

但最近有研究表明，至少在某些情况下，神经网络能够学习到一些人类可理解的表征！

例如分类器中的单个神经元可以表示一些语义信息，语言模型中也包含语法信息，在视觉和文本数据的对齐数据中也能发现一些复杂的概念表示，这些神经网络学到的概念都和人类接受的概念训练相关。

但还有一个问题，这些学习到的概念是通用的吗？我们是否也希望其他深度学习的系统具有类似的有意义的表示？

首先，AlphaZero是通过self-play的方式训练的，所以从未接触过人类数据，并且它在国际象棋，围棋和将棋（Shogi）这三项竞技游戏上借助蒙特卡洛树搜索成功战胜人类。

所以AlphaZero就成了研究机器学习模型和人类理解之间关系的一座重要桥梁，如果AlphaZero中能找到人类可理解的概念，那其他模型应该也会有！

说干就干！

DeepMind、Google Brain的研究人员携手国际象棋世界冠军共同打造了一篇长达69页的论文，主要研究了像AlphaZero这样的超越人类的神经网络模型正在学习什么，这是一个既科学又实用的问题。

在论文中研究人员证明了人类获取知识和AlphaZero在国际象棋中获得的知识都是相似的。并通过对大量人类关于国际象棋的概念的探索，还可以观察到其中一些概念在AlphaZero网络是如何表示的。

论文： https://link.zhihu.com/?target=https%3A//arxiv.org/abs/2111.09259

论文中邀请到的国际象棋大师是弗拉基米尔·克拉姆尼克（Vladimir Kramnik），俄罗斯著名国际象棋手，1992年获特级大师头衔。2000年至2007年，是国际象棋世界冠军。他的等级积分为2801分，世界排名第四（活跃选手排名第三）。

研究方法主要分为三个方面：

1、概念的探测（Probe of Concepts）

论文没看，但感觉这个是脑科学的研究结果

Document