小红书招聘大模型训练框架研发工程师/专家

招聘职位:

大模型训练框架研发工程师/专家 搜索同类职位
发布日期:
2026-06-04
工作地点:
职位类型:
全职
职位类别:
引擎
来源:
小红书官网
岗位职责:
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地!

1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipeline;
2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶颈;
3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力;
4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代;
5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。
任职要求:
任职资格:
1、精通PyTorch 框架、veRL/OpenRLHF/Llama-Factory等后训练引擎,具有修改框架源码的实战经验;
2、深入理解Megatron/DeepSpeed等框架的并行策略,能自主设计混合并行方案解决显存墙问题;
3、掌握强化学习训练全流程优化,有基于PPO/DPO等算法的大模型训练调优经验;
4、具备模型训练调优分析经验,能够借助Nsight、nvprof等工具分析发现模型训练性能瓶颈,并进行针对性优化;
5、有良好的沟通表达及团队协作能力,有强烈的责任心和使命感。
加分项:
1、熟悉TRL、DeepSpeed-RL等强化学习框架的底层实现机制;
2、掌握LLM训练全链路技术栈,包括分布式数据预处理、序列并行、梯度累积策略;
3、有千卡规模大模型训练实战经验,成功解决过跨机房通信、容错训练等生产问题;
4、发表过SOSP/MLSys等系统顶会论文,或主导过开源训练框架核心模块开发;
5、熟悉NCCL/RDMA/IB/ROCE相关知识,有高性能CUDAKernel相关研发经验。
免责声明:

此信息由小红书官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“小红书官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!

FAQ 小红书招聘常见问答

小红书招聘工作地点:
上海市,北京市
小红书招聘经验要求:
five_to_ten_year