查看更多分享

腾讯(tencent)招聘微信-AI Infra工程师-大模型训练与RL方向

招聘职位：

微信-AI Infra工程师-大模型训练与RL方向 搜索同类职位

发布日期：: 2026-06-18
工作地点：: 北京
职位类型：: 全职
职位类别：: 技术
来源：: 腾讯官网

岗位职责：
1.核心训练框架开发与优化：负责大模型分布式训练框架（基于Megatron-LM / DeepSpeed等）的底层架构设计与核心代码开发。支撑千亿/万亿模型的高效、稳定训练；
2.RL Infra 系统建设与协同优化：负责强化学习（PPO/GRPO/DPO等）训练框架的开发和优化。深度解决 Actor 生成（结合 vLLM/SGlang 等推理引擎）与 Critic/Reward 训练阶段的资源调度、状态流转及通信瓶颈，实现 Training 与 Inference 的极致协同；
3.算法与系统协同设计 (Co-design)：与前沿算法团队紧密合作，追踪并引入业界最新开源生态（如 Verl, Slime, ROLL, AReal 等），快速完成技术原型验证，加速前沿大模型对齐算法在微信海量业务场景的规模化落地。
岗位要求：
1.计算机相关专业，具备较强的动手能力；熟悉 Python ，具备扎实的系统编程功底和优秀的复杂系统 Debug 能力；
2.训练框架经验：深入理解大模型分布式训练原理，具备 Megatron-LM、DeepSpeed 或 PyTorch FSDP 等主流框架的实际源码级开发与定制经验；
3.RL 与 RL Infra 储备：熟悉大模型后训练与对齐技术（PPO、GRPO、DPO等），熟悉 Verl、ROLL，AReal 等强化学习/分布式计算框架，可以理解并解决 RL过程中的工程痛点；
4.综合素质：具备极强的技术好奇心与自驱力，面对业界无先例的技术难题，能独立思考并推动解决。
岗位介绍：
在腾讯，后台开发工程师不仅是“又快又稳”的问题解决专家，更是生态共创者。你将与技术团队一同沉淀优质代码，让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段，你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神，同时欢迎你一起参与团队愿景、文化和产品方向的探讨。

前往官网投递

免责声明：

此信息由腾讯官网 (查看来源)审核并发布，我们转载该信息，仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台，不构成求职建议，不涉及任何职业中介服务，不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎，自行判断并承担相应风险，求职请认准企业官方渠道！

上一职位：小红书(xiaohongshu)主播成长产品经理

下一职位：美团(meituan)Keeta财务职能BP

腾讯(tencent)招聘微信-AI Infra工程师-大模型训练与RL方向

招聘职位：

FAQ 腾讯(tencent)招聘常见问答

投递进展笔记

求职进度

进展结果

发生时间

求职体验

是否匿名

提示