请问大家如何看待这个问题?
AlphaZero下棋和人类下棋究竟有什么区别?是否掌握了一些人类未曾了解过的知识?DeepMind最近携手国际象棋世界冠军发69页论文,深度解剖AlphaZero后发现,神经网络学到的知识和人类基本相似!
机器学习系统通常被认为是不透明的、不可预测的,和人类所接受的训练几乎没有任何共通之处。
难道,黑盒模型和可解释性的学习注定是两条路?
但最近有研究表明,至少在某些情况下,神经网络能够学习到一些人类可理解的表征!
例如分类器中的单个神经元可以表示一些语义信息,语言模型中也包含语法信息,在视觉和文本数据的对齐数据中也能发现一些复杂的概念表示,这些神经网络学到的概念都和人类接受的概念训练相关。
但还有一个问题,这些学习到的概念是通用的吗?我们是否也希望其他深度学习的系统具有类似的有意义的表示?
首先,AlphaZero是通过self-play的方式训练的,所以从未接触过人类数据,并且它在国际象棋,围棋和将棋(Shogi)这三项竞技游戏上借助蒙特卡洛树搜索成功战胜人类。
所以AlphaZero就成了研究机器学习模型和人类理解之间关系的一座重要桥梁,如果AlphaZero中能找到人类可理解的概念,那其他模型应该也会有!
说干就干!
DeepMind、Google Brain的研究人员携手国际象棋世界冠军共同打造了一篇长达69页的论文,主要研究了像AlphaZero这样的超越人类的神经网络模型正在学习什么,这是一个既科学又实用的问题。
在论文中研究人员证明了人类获取知识和AlphaZero在国际象棋中获得的知识都是相似的。并通过对大量人类关于国际象棋的概念的探索,还可以观察到其中一些概念在AlphaZero网络是如何表示的。
论文中邀请到的国际象棋大师是弗拉基米尔·克拉姆尼克(Vladimir Kramnik),俄罗斯著名国际象棋手,1992年获特级大师头衔。2000年至2007年,是国际象棋世界冠军。他的等级积分为2801分,世界排名第四(活跃选手排名第三)。
研究方法主要分为三个方面:
1、概念的探测(Probe of Concepts)