小红书(xiaohongshu)招聘AI Infra工程师/专家

招聘职位:

AI Infra工程师/专家 搜索同类职位
发布日期:
2026-05-22
工作地点:
职位类型:
全职
职位类别:
引擎
来源:
小红书官网
岗位职责:
【部门介绍】引擎架构部是目前小红书AI Infra核心部门,囊括搜广推、CV、NLP、语音、多模态等主要业务场景。团队主导SOTA AI Infra架构设计与核心模块开发,支撑AI业务在AI前沿场景上规模落地。参与开发下一代超大模型(百亿-万亿级)模型的GPU/NPU/PPU/CPU千卡互联分布式训练和推理框架。

1.参与开发分布式并行/流水线/通信优化/ZeRO/FSDP工作,消除大规模分布式训练通讯/计算/内存瓶颈,极致优化模型训练和推理的性能。
2.参与开发Triton,TileLang计算图编译优化或者使用CUDA/cutlass编写高性能算子,将硬件性能压榨到极致,最大化发挥出GPU/NPU/PPU/CPU等异构硬件协同算力。
3.参与开发/调试用于异构计算全链路的AI编译器,探索基于IR编译优化的片内多部件并行流水线等前沿技术,构建业界影响力。
4.支撑业界领先的多模态模型在国内最大的生活兴趣社区上落地。

任职要求:
1. 有扎实的工程算法基础,精通数据结构和常用算法,熟练掌握各种编译、调试、性能分析工具。
2. 精通C/C++/CUDA/Ascend C/Triton/Tilelang/CuTe DSL,具备扎实的系统底层能力(内存、并发、网络)。
3. 有大规模分布式系统开发和优化经验;有大模型分布式训练经验者优先。
4. 精通MLIR/TVM/Triton/Torch Inductor/TileLang/Verbs/NCCL/NVSHMEM等分布式异构计算框架和相关工具链。
5. 精通Megatron/DeepSpeed/veRL/OpenRLHF/LLaMA-Factory等业界开源训练框架。
6. 熟悉常见深度学习模型结构。

【加分项】
• 在Megatron、DeepSpeed、veRL、TVM、LLVM等社区有持续代码贡献。或有高质量技术博客、GitHub Repo、顶会论文(OSDI、SOSP、MLSys、KDD、RecSys 等)。
免责声明:

此信息由小红书官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“小红书官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!

FAQ 小红书(xiaohongshu)招聘常见问答

小红书(xiaohongshu)招聘工作地点:
北京市,上海市,深圳市
小红书(xiaohongshu)招聘经验要求:
no_limit