工作内容:
1. 负责基于 OneFlow 搭建强化学习相关模型,并不断完善和优化算法,解决实际问题;
2. 负责完成从模型搭建到产品上线等全流程工作;
3. 跟踪学术界最新的研究进展和业界最新应用。
职位要求 :
1. 计算机、电子信息工程、自动化控制、数学、信息安全等相关专业背景,硕士及以上学历;
2. 熟悉常用的强化学习算法(DQN,DDPG,PPO,A3C 等);
3. 在强化学习(包括但不限于模仿学习,分层强化学习,多智能体)等领域有深入研究;
4. 具备扎实的Python、C++等编程基础,熟练掌握 Tensorflow / Pytorch 等深度学习框架;
5. 具备优秀的分析和解决问题、沟通协作能力;
6. 加分项:有ACM或类似算法竞赛经历。