【团队介绍】
外卖技术部承担外卖业务的技术开发工作,包括用户洞察、智能交互及交易引导、商家经营、平台运营等方面的系统、数据和策略实现,目标是为平台各参与角色提供高效易用的系统,持续迭代架构,保证稳定、安全、可扩展。在此基础上希望以技术服务并驱动业务发展,早日实现日均亿单的业务目标。广告组负责外卖餐饮和新零售流量等多元流量变现工作,是支持公司业务发展的核心保障之一。
【岗位描述】
负责强化学习和运筹优化前沿算法的创新研究与探索,发表顶会论文和申请专利
研发适用于广告场景的深度强化学习算法,如广告智能出价、门店预算分配等算法
负责深度强化学习算法的模型开发、调试
【研究方向】
- 离线强化学习
- 因果强化学习
- 因果推断
- 层次强化学习
- 运筹优化
【岗位要求】
- 2022年毕业
- 计算机或相关专业硕士以上学历,保持对领域最前沿技术的追踪
- 能熟练使用主流深度学习框架,如tensorflow、pytorch等,具备实现常用的(深度)强化学习算法能力
- 在人工智能会议和期刊发表过优秀论文,有顶级会议期刊发表经历者优先(NIPS, IJCAI, AAAI, ICML, ICLR,AAMAS等)
- 熟悉强化学习基本算法,使用过TRPO,BCQ,REM,CQL等算法者优先
[未知] 工作地:北京