【简介】我们是京东供应链核心算法团队,负责核心的自营商品供应链和库存管理,涉及智能选品、定价、预测、补货等业务方向,全面覆盖经典运筹决策、机器学习、深度学习、强化学习和前沿大模型的技术方向,成员来自新加坡国立大学、清华大学等国内外top名校,所在团队获得Gartner供应链技术创新奖等世界级奖项,致力于打造世界一流的智能供应链团队。
强化学习方向算法工程师
工作地点:北京
职位描述:
1.参与online、offline等强化学习算法综合对比研发&应用,构建实际RL决策模型
2.洞察数据规律、推动RL在智能补货、智能预测等业务方向的落地应用
3.(optional) 撰写技术文档和论文,记录研究成果、促进知识共享
职位要求:
1.本科及以上学历,计算机/统计/数学等相关专业;
2.熟悉DQN、SAC、PPO、REINFORCE、GRPO等各类RL算法;
3.熟悉强化学习算法且有相关实验经验,有相关实习OR工作经验优先;
3.有相关竞赛经验优先,充满技术热情优先;
4.有ACL、NeurIPS、CVPR、ICML、ICLR、EMNLP、AAAI等顶会/刊论文发表经验者优先;
待遇:
1.正式员工,行业一线大厂AI算法工程师待遇,70-100K·16薪,上不封顶
2.实习,300-800/天,待遇从优(每周至少实习3天)
联系:yuxue31@jd.com,微信yuxue_snowylife,内推码“R2UJR”