腾讯(tencent)招聘大模型Code/Agent后训练算法研究员-(深圳)or(北京)or

招聘职位：

大模型Code/Agent后训练算法研究员-(深圳)or(北京)or 搜索同类职位

发布日期：: 2026-04-05
工作地点：: 上海
职位类型：: 全职
职位类别：: 技术
来源：: 腾讯官网

岗位职责：
1.负责Code和Agent相关数据构建与治理，构建高质量、多样化的Code/Agent训练数据集，搭建数据迭代闭环，通过数据飞轮持续优化数据质量；
2.负责Agent运行环境与训练环境的构建与优化，构建高可用、可扩展的Agent仿真环境，保障Agent训练、测试及落地的稳定性与高效性；
3.负责Agentic RL在Code/Agent场景的训练，参与Agentic RL Infra建设及优化、Agentic RL 算法优化，持续提升Agentic RL训练的效率和稳定性。
岗位要求：
1.计算机、人工智能等相关专业硕士以上学历；
2.有大规模强化学习、大模型Code/Agent研发相关经验者优先；
3.具有扎实的深度学习算法基础，熟悉深度学习框架和分布式训练推理加速，有实操经验者优先；
4.在多模态/CV/NLP等领域顶级会议（期刊）发表过论文、主导/参与业界知名的开源项目者优先；
5.具备极强的学习能力和技术追求，良好的团队合作和沟通能力。
岗位介绍：
渴望为世界带来新意的人，早已对描绘未来的“热词”不陌生——人工智能、机器学习、数据科学等等。腾讯始终在业界前沿不断探索，积极布局，并为优秀的你提供无限广阔的舞台。我们坚信科技的不断革新，最终能带来美好的、撼动人心的改变。

前往官网投递

免责声明：

此信息由腾讯官网 (查看来源)审核并发布，我们转载该信息，仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台，不构成求职建议，不涉及任何职业中介服务，不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎，自行判断并承担相应风险，求职请认准企业官方渠道！

上一职位：哔哩哔哩(bilibili|b站)商业化-自助投放产品经理Leader

下一职位：小红书新媒体传播专家

腾讯(tencent)招聘大模型Code/Agent后训练算法研究员-(深圳)or(北京)or

招聘职位：

FAQ 腾讯(tencent)招聘常见问答