腾讯(tencent)招聘混元大语言模型后训练算法工程师-模型合版方向（北京/深圳）

招聘职位：

混元大语言模型后训练算法工程师-模型合版方向（北京/深圳） 搜索同类职位

发布日期：: 2026-04-16
工作地点：: 北京
职位类型：: 全职
职位类别：: 技术
来源：: 腾讯官网

岗位职责：
1.深度参与混元大模型后训练（包括 SFT、RL ）及模型合版的研发和相关算法策略研究，提升模型泛化性、能力边界和上限；
2.后训练策略和生产范式的研究，探索更加敏捷、普适和可扩展的训练范式，提升训练和生产效率；
3.相关前沿后训练技术方向探索，包括但不限于 Reasoning/Agentic 能力增强和 Scaling， RL/OPD 等收敛性和可扩展性研究；
4.将研究成果转化为实际的模型能力或生产效率，并撰写高水平技术报告或论文，提升技术影响力。
岗位要求：
1.计算机科学、数学、人工智能等相关专业硕士及以上学历，具备良好的数理基础；
2.具备良好的工程实现能力，熟练使用 PyTroch、Megatraon、vLLM 等常见大模型训练和推理框架；
3.具备良好的技术视野，深入理解大模型相关技术原理，熟悉大模型 SFT、RL 及 reward 建模等训练范式，对 RL/OPD 等有深入的实践和研究经验；
4.具备良好的数据 sense 和问题分析能力，作风严谨细致，善于借助大模型及相关工具解决问题和提升效率；
5.对大模型及相关前沿技术和产品具有极强的热情，具备独立探索前沿技术的能力，有良好的团队协作和沟通能力。
加分项：
1.有主导或参与工业界大规模模型生产和合版经验；
2.以第一作者身份发表过 NeurIPS、ICML、ICLR、ACL 等论文。

前往官网投递

免责声明：

此信息由腾讯官网 (查看来源)审核并发布，我们转载该信息，仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台，不构成求职建议，不涉及任何职业中介服务，不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎，自行判断并承担相应风险，求职请认准企业官方渠道！

上一职位：美团(meituan)小象超市-生鲜成本管理专家

下一职位：小红书(xiaohongshu)AI native应用-iOS开发工程师

腾讯(tencent)招聘混元大语言模型后训练算法工程师-模型合版方向（北京/深圳）

招聘职位：

FAQ 腾讯(tencent)招聘常见问答