小红书招聘大模型训练框架研发工程师/专家

招聘职位：

大模型训练框架研发工程师/专家 搜索同类职位

发布日期：: 2026-06-04
工作地点：: 上海市
北京市
职位类型：: 全职
职位类别：: 引擎
来源：: 小红书官网

岗位职责：
我们是小红书中台大模型 Infra 团队，专注打造领先易用的「AI 大模型全链路基础设施」！团队深耕大模型「数-训-压-推-评」技术闭环，在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势，基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品，持续赋能社区、商业、交易、安全、数平、研效等多个核心业务，实现 AI 技术高效落地！

1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架，优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipeline；
2、研发支持多机多卡 RL 的分布式训练框架，开发TP/PP/ZeRO-3与RL流程的动态协同机制，解决 RL 算法在超长时序下的显存/通信瓶颈；
3、构建端到端后训练工具链，主导框架与 MLOps 平台集成，提供训练可视化、自动超参搜索等生产级能力；
4、与公司各算法部门深度合作，参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代；
5、参与分析各业务 GPU 利用率与饱和度等指标，结合业务场景持续优化训练框架能力，提升框架领先性。
任职要求：
任职资格：
1、精通PyTorch 框架、veRL/OpenRLHF/Llama-Factory等后训练引擎，具有修改框架源码的实战经验；
2、深入理解Megatron/DeepSpeed等框架的并行策略，能自主设计混合并行方案解决显存墙问题；
3、掌握强化学习训练全流程优化，有基于PPO/DPO等算法的大模型训练调优经验；
4、具备模型训练调优分析经验，能够借助Nsight、nvprof等工具分析发现模型训练性能瓶颈，并进行针对性优化；
5、有良好的沟通表达及团队协作能力，有强烈的责任心和使命感。
加分项：
1、熟悉TRL、DeepSpeed-RL等强化学习框架的底层实现机制；
2、掌握LLM训练全链路技术栈，包括分布式数据预处理、序列并行、梯度累积策略；
3、有千卡规模大模型训练实战经验，成功解决过跨机房通信、容错训练等生产问题；
4、发表过SOSP/MLSys等系统顶会论文，或主导过开源训练框架核心模块开发；
5、熟悉NCCL/RDMA/IB/ROCE相关知识，有高性能CUDAKernel相关研发经验。

前往官网投递

免责声明：

此信息由小红书官网 (查看来源)审核并发布，我们转载该信息，仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“小红书官网”负责。我们作为信息转载平台，不构成求职建议，不涉及任何职业中介服务，不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎，自行判断并承担相应风险，求职请认准企业官方渠道！

上一职位：腾讯41299-服务器性能测试工程师(北京)

下一职位：小红书推荐算法工程师-用户增长

小红书招聘大模型训练框架研发工程师/专家

招聘职位：

FAQ 小红书招聘常见问答

牛大妈找到相似职位