小红书招聘大模型压缩算法研发工程师/专家

招聘职位：

大模型压缩算法研发工程师/专家 搜索同类职位

发布日期：: 2026-06-04
工作地点：: 北京市
上海市
职位类型：: 全职
职位类别：: 引擎
来源：: 小红书官网

岗位职责：
我们是小红书中台大模型 Infra 团队，专注打造领先易用的「AI 大模型全链路基础设施」！团队深耕大模型「数-训-压-推-评」技术闭环，在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势，基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品，持续赋能社区、商业、交易、安全、数平、研效等多个核心业务，实现 AI 技术高效落地！

1、探索研发针对大语言模型、多模态大模型、StableDiffusion模型等模型的压缩技术，包括但不限于量化、蒸馏、剪枝、稀疏化等；
2、参与/负责多个业务场景中的模型压缩技术实现，对模型进行轻量化压缩，提高训练/推理效率，支持业务降本增效；
3、参与/负责针对英伟达GPU、华为昇腾NPU等不同的计算硬件，制定不同的模型压缩方案并在业务落地；
任职要求：
1、熟悉蒸馏、剪枝、量化等模型压缩常用方案，参与或主导过大型项目业务落地或有相关论文者优先；
2、熟悉至少一种主流的深度学习训练或推理框架（TensorFlow / PyTorch / Onnx / TensorRT等）的原理和实现；
3、熟练使用Python/C++至少一种语言，并具备良好的代码质量和风格；
4、有强烈的工作责任心，较好的学习能力、沟通能力和技术规划能力；
5、有大模型压缩或小型化模型设计经验者优先；
6、有优秀开源项目经历者优先。

前往官网投递

免责声明：

此信息由小红书官网 (查看来源)审核并发布，我们转载该信息，仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“小红书官网”负责。我们作为信息转载平台，不构成求职建议，不涉及任何职业中介服务，不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎，自行判断并承担相应风险，求职请认准企业官方渠道！

上一职位：腾讯41299-服务器性能测试工程师(北京)

下一职位：小红书直播公会运营

小红书招聘大模型压缩算法研发工程师/专家

招聘职位：

FAQ 小红书招聘常见问答

牛大妈找到相似职位