一、达摩院-强化学习算法专家-自动驾驶-杭州 官网
(1)、 基础信息
- 发布时间: 2021-08-12
- 工作地点: 杭州
- 工作年限: 3年以上
- 所属部门: 阿里集团
- 学历: 硕士
(2)、职位描述:
- 负责基于强化学习的自动驾驶智能决策规划算法设计与实现
- 负责无人驾驶强化学习框架与决策推理系统的搭建,驱动相关产品与服务迭代开发
- 实现强交互场景与博弈环境下主车行为策略,应用在实车与仿真智能agent中,提升无人驾驶系统的智能性
- 完成相关算法研发和效果验证,解决强化学习落地过程中的各种问题
(3)、职位要求
1) Linux系统下C++开发经验;
2) 具有3年以上强化学习研究经验,对多智能体学习、模仿学习、分布式强化学习等有积累者优先;
3) 在业内顶级会议和期刊上发表过论文者优先,例如,NIPS、IJCAI、AAAI、ICML、ICLR、AAMAS等;
4)有机器人/无人驾驶相关开发经验者优先。
5)具备良好的学习能力,沟通能力,富有责任心;
二、菜鸟网络-算法工程师-深度强化学习官网
职位描述
- 使用DRL求解物流领域相关问题,如VRP, Batching Problem等, 并在实际场景落地
- 参与DRL求解运筹优化问题框架的设计和研发
- 跟踪深度强化学习的前沿算法和技术,对算法效果和性能进行持续的优化
职位要求
- 计算机或相关专业硕士以上学历,相关工作经验2~5年
- 熟悉常见强化学习算法,如Value-based Algorithm, Policy Gradients等
- 熟悉Transformer,BERT,GPT等深度学习模型
- 能熟练使用主流深度学习框架,如pytorch, tensorflow等,具备实现常用的深度强化学习算法能力
- 在人工智能会议和期刊发表过优秀论文,有顶级会议期刊发表经历者优先(NIPS, IJCAI, AAAI, ICML, ICLR,AAMAS等)