岗位描述
我们会基于一些内部或外部的游戏平台(如:GoogleFootball、逆水寒3v3、潮人篮球等),考查现有最新方法(如:QMIX、WQMIX、Qatten、QPLEX、MAVEN)在实际游戏场景中的效果以及存在的问题,同时对比centralized learning方法和decentralized learning方法在复杂场景中的效果,找到它们各自合适的应用场景。其次,我们将针对现有算法的不足,提出能够更好地协作配合、学习效率更高,并能在复杂游戏环境具有良好扩展性(scalability)的多智能体强化学习算法。我们还将研究对手建模、多智能体协同探索、多智能体异步决策等前沿问题,并探究这些技术对实习游戏落地的意义。
岗位要求
1.了解深度强化学习,尤其是多智能体强化学习相关知识,掌握值函数分解、多智能体通信、多智能体协作等理论和算法; 2.熟练使用Python,熟悉tensorflow、pytorch等至少 一种深度学习库,并有实际动手实现强化学习算法的经验; 3.熟悉强化学习大规模并行训练框架。 加分项: 1.在人工智能和强化学习相关的顶级会议或期刊 (如:ICML、NeurIPS、ICLR、IJCAI、AAAI、AAMAS、ICRA、IROS、UAI)上发表过论文(一作或二作); 2.强化学习相关竞赛上获得过优胜名次。
工作地点
杭州
面试城市
远程面试