【岗位职责】
1. 参与大型语言模型RLHF的训练与效果优化。
2. 对现有算法、数据进行分析和评估,优化模型生成效果,减少有害、敏感或偏见相关回复。
3. 调研并探索RLHF方向前沿算法、框架,持续提升现有算法的效率与效果。
【岗位要求】
1. 有计算机科学、数学、统计学或相关领域的硕士或博士学位。
2. 熟悉Python、Java等至少一种编程语言与深度学习框架,具有良好的编程能力和扎实的数学理论基础。
3. 具备1年以上NLP经验,熟悉BERT、GPT等模型,参与过NLP中分类、NER、文本生成、文本匹配等子任务的效果优化工作,能够根据实际问题改造和优化算法。
4. 关注行业前沿进展,对技术开发及应用有热情,有自己的想法并乐于挑战自我。
5. 良好的沟通能力,跨团队协作能力,具备出色的规划、执行力,强烈的责任感,以及优秀的学习能力和自我驱动力。
6. 6个月以上,每周到岗4天以上
加分项:
1. 在ACL、EMNLP等会议或期刊上发表过论文者优先。
2. 获得过国际或国内赛事奖项者优先。
3. 有大模型相关实习经历者优先。
【投递方式】