查看更多分享

腾讯(tencent)招聘微信-AI Infra工程师-大模型训练与RL方向

招聘职位:

微信-AI Infra工程师-大模型训练与RL方向 搜索同类职位
发布日期:
2026-06-18
工作地点:
职位类型:
全职
职位类别:
技术
来源:
腾讯官网
岗位职责:
1.核心训练框架开发与优化: 负责大模型分布式训练框架(基于Megatron-LM / DeepSpeed等)的底层架构设计与核心代码开发。支撑千亿/万亿模型的高效、稳定训练;
2.RL Infra 系统建设与协同优化: 负责强化学习(PPO/GRPO/DPO等)训练框架的开发和优化。深度解决 Actor 生成(结合 vLLM/SGlang 等推理引擎)与 Critic/Reward 训练阶段的资源调度、状态流转及通信瓶颈,实现 Training 与 Inference 的极致协同;
3.算法与系统协同设计 (Co-design): 与前沿算法团队紧密合作,追踪并引入业界最新开源生态(如 Verl, Slime, ROLL, AReal 等),快速完成技术原型验证,加速前沿大模型对齐算法在微信海量业务场景的规模化落地。
岗位要求:
1.计算机相关专业,具备较强的动手能力;熟悉 Python ,具备扎实的系统编程功底和优秀的复杂系统 Debug 能力;
2.训练框架经验: 深入理解大模型分布式训练原理,具备 Megatron-LM、DeepSpeed 或 PyTorch FSDP 等主流框架的实际源码级开发与定制经验;
3.RL 与 RL Infra 储备: 熟悉大模型后训练与对齐技术(PPO、GRPO、DPO等),熟悉 Verl、ROLL,AReal 等强化学习/分布式计算框架,可以理解并解决 RL过程中的工程痛点;
4.综合素质: 具备极强的技术好奇心与自驱力,面对业界无先例的技术难题,能独立思考并推动解决。
岗位介绍:
在腾讯,后台开发工程师不仅是“又快又稳”的问题解决专家,更是生态共创者。你将与技术团队一同沉淀优质代码,让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段,你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神,同时欢迎你一起参与团队愿景、文化和产品方向的探讨。
免责声明:

此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!

FAQ 腾讯(tencent)招聘常见问答

腾讯(tencent)招聘工作地点:
北京
腾讯(tencent)招聘经验要求:
不限