雅达利2600是雅达利于1977年推出的一款视频游戏机。该游戏机包括《突破》、《帕克曼女士》和《太空入侵者》等热门游戏。自2013年Mnih等人引入Deep Q-Networks以来,Atari 2600一直是测试新强化学习算法的标准环境。Atari 2600由于其高维视频输入(尺寸210 x 160,频率60 Hz)和游戏之间的任务差异,一直是一个具有挑战性的测试平台。
Atari 2600环境最初是通过街机学习环境(ALE)提供的。OpenAI Gym对环境进行了包装,以创建更标准化的界面。OpenAI提供59款Atari 2600游戏作为环境。
目前技术水平
注:大多数论文使用57个Atari 2600游戏,其中一些游戏不受OpenAI Gym支持。
这些是Atari 2600试验台的最新成果。为了测试代理的鲁棒性,大多数论文使用一种或两种设置:无操作启动和人工启动,这两种设置都设计为提供一个不确定的启动位置。在“无操作开始”设置中,代理在一集开始时最多选择30次“不做任何事”操作。向所述代理提供随机起始位置。这源于Mnih等人(2015)的DQN2015论文。在人类开始设置中,智能体从从人类职业游戏中抽取的100个起点之一开始。人类启动设置源自Nair等人(2015)的GorilaDQN论文。
检查智能体整体性能的一种流行方法是人类标准化得分中值。您可以在Rainbow论文中阅读更多关于此度量的选择。为了更好地比较算法,我们只使用了在大多数可用游戏上测试的结果。


