查看更多分享

腾讯(tencent)招聘混元大模型后训练算法工程师/专家-长文&复杂指令

招聘职位：

混元大模型后训练算法工程师/专家-长文&复杂指令 搜索同类职位

发布日期：: 2026-07-03
工作地点：: 北京
职位类型：: 全职
职位类别：: 技术
来源：: 腾讯官网

岗位职责：
1.负责大模型后训练（SFT+RL）阶段长文与复杂指令类数据的全链路研发，围绕长篇幅内容生成、多约束/多步骤复杂指令遵循等核心场景，设计并落地覆盖数据生产、自动化质检与定向修复的端到端方案，确保数据在长程连贯性、结构完整性、指令遵循精度等维度的稳定、高标准交付；
2.深度参与Rubrics评分标准体系的设计、生产与质检，针对长文与复杂指令场景，构建原子化、可量化的多维评价体系，搭建从标准生成到评分验证的自动化 pipeline；建立多层质量校验机制，实现“评测发现问题—数据定向补强—配方迭代优化—效果闭环提升”；
3.深度追踪并研究支撑大模型后训练和复杂指令能力提升的前沿数据技术，重点关注长上下文数据构建、复杂指令自动生成、Rubric-based Evaluation、自动化质检、错误归因与数据修复等方向，能够将最新数据方法快速转化为业务价值，持续驱动模型在长文与复杂任务场景下的能力演进。
岗位要求：
1.计算机科学、人工智能或相关专业硕士及以上学历，深入理解Transformer 架构及 LLM 训练原理，能针对 SFT、RLHF/DPO 等后训练场景设计并落地高标准数据方案；
2.深入实践过长文生成、复杂指令遵循、长上下文理解等方向的数据构建与优化，具备 Rubrics 评价体系的设计与质检经验，能推动人工标注、模型打分与规则校验等多种质检手段协同落地；
3.熟练掌握 Python 及 PyTorch 等深度学习框架，善于利用 Cursor、Claude Code 等 AI 辅助工具提升数据生产与自动化分析效率；
4.具备强烈的数据敏感度、技术热情与自驱力，主动思考，能从数据与评测结果中洞察模型能力边界，拥有优秀的跨团队协作与沟通能力。在 CCF-A 顶会（NeurIPS、ICLR、ICML、ACL 等）有高质量论文发表或在开源社区有高影响力贡献者优先。

前往官网投递

免责声明：

此信息由腾讯官网 (查看来源)审核并发布，我们转载该信息，仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台，不构成求职建议，不涉及任何职业中介服务，不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎，自行判断并承担相应风险，求职请认准企业官方渠道！

上一职位：小红书(xiaohongshu)海外账号产品经理

下一职位：小红书(xiaohongshu)AI 全栈工程师-C2C交易（前后端移动端同学均欢迎）