腾讯(tencent)招聘混元大语言模型后训练算法工程师(深圳/北京/上海)
招聘职位:
混元大语言模型后训练算法工程师(深圳/北京/上海) 搜索同类职位
岗位职责:
1.负责大语言模型后训练(Post-Training)阶段的核心技术研发,构建和优化高质量的奖励系统(Reward System),通过Reward Modeling (RM) 和强化学习(RL)算法持续提升模型在复杂指令遵循、逻辑推理及价值观对齐方面的能力;
2.深入研究和优化 RLHF 等后训练算法,提升模型训练的稳定性和最终效果;
3.负责大模型个性化(Personalization)与长期记忆(Memory)机制的算法研发,构建精准的“千人千面”用户建模体系,探索模型如何理解、提取、记忆并动态适应不同用户的长期偏好,持续提升个性化交互体验;
4.负责后训练阶段的数据合成与管理,设计高效的数据飞轮机制,利用SFT、Self-Instruct等技术合成高质量训练数据,并负责建立从用户多维反馈(User Feedback)到模型迭代的闭环信号建模体系;
5.负责后训练模型的全维度评测与分析,制定科学的评价指标,跟进前沿技术动态,将最新研究成果快速转化为业务价值。
岗位要求:
1.计算机科学/软件工程/人工智能等相关专业硕士及以上学历;
2.深入理解 Transformer 架构及大语言模型训练原理,在 LLM Alignment、RLHF、Reward Modeling、**个性化大模型(Personalized LLM)、记忆机制(Memory/RAG)**等后训练领域之一有深入的研究和实践经验;
3.在用户画像建模、推荐系统与大模型结合、或超长上下文/长期记忆模型优化方面有丰富实战经验者优先;
4.具备扎实的算法基础和工程实现能力,熟练掌握 Python,熟悉 PyTorch/TensorFlow 等深度学习框架;
5.拥有分布式训练实战经验,熟悉 Megatron-LM, DeepSpeed, vLLM 等大规模训练及推理框架,有百亿/千亿参数模型训练或调优经验者优先;
6.具备优秀的科研素养,有高质量论文发表(NeurIPS, ICLR, ICML, ACL, EMNLP 等)或在开源社区(如 HuggingFace)有高影响力项目贡献者优先;
7.具备强烈的技术热情和自驱力,善于分析和解决复杂问题,拥有良好的团队协作和沟通能力。
1.负责大语言模型后训练(Post-Training)阶段的核心技术研发,构建和优化高质量的奖励系统(Reward System),通过Reward Modeling (RM) 和强化学习(RL)算法持续提升模型在复杂指令遵循、逻辑推理及价值观对齐方面的能力;
2.深入研究和优化 RLHF 等后训练算法,提升模型训练的稳定性和最终效果;
3.负责大模型个性化(Personalization)与长期记忆(Memory)机制的算法研发,构建精准的“千人千面”用户建模体系,探索模型如何理解、提取、记忆并动态适应不同用户的长期偏好,持续提升个性化交互体验;
4.负责后训练阶段的数据合成与管理,设计高效的数据飞轮机制,利用SFT、Self-Instruct等技术合成高质量训练数据,并负责建立从用户多维反馈(User Feedback)到模型迭代的闭环信号建模体系;
5.负责后训练模型的全维度评测与分析,制定科学的评价指标,跟进前沿技术动态,将最新研究成果快速转化为业务价值。
岗位要求:
1.计算机科学/软件工程/人工智能等相关专业硕士及以上学历;
2.深入理解 Transformer 架构及大语言模型训练原理,在 LLM Alignment、RLHF、Reward Modeling、**个性化大模型(Personalized LLM)、记忆机制(Memory/RAG)**等后训练领域之一有深入的研究和实践经验;
3.在用户画像建模、推荐系统与大模型结合、或超长上下文/长期记忆模型优化方面有丰富实战经验者优先;
4.具备扎实的算法基础和工程实现能力,熟练掌握 Python,熟悉 PyTorch/TensorFlow 等深度学习框架;
5.拥有分布式训练实战经验,熟悉 Megatron-LM, DeepSpeed, vLLM 等大规模训练及推理框架,有百亿/千亿参数模型训练或调优经验者优先;
6.具备优秀的科研素养,有高质量论文发表(NeurIPS, ICLR, ICML, ACL, EMNLP 等)或在开源社区(如 HuggingFace)有高影响力项目贡献者优先;
7.具备强烈的技术热情和自驱力,善于分析和解决复杂问题,拥有良好的团队协作和沟通能力。
免责声明:
此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!