小红书(xiaohongshu)招聘基础模型算法工程师 - VLM Post-training

招聘职位：

基础模型算法工程师 - VLM Post-training 搜索同类职位

发布日期：: 2026-05-22
工作地点：: 北京市
上海市
职位类型：: 全职
职位类别：: 大模型
来源：: 小红书官网

岗位职责：
岗位定位：
本岗位侧重于构建大模型的“视觉与感知”能力。小红书拥有业界最独特的图文与短视频 UGC 数据生态，你将负责 VLM 的 Post-training，让模型深度理解，支撑小红书所有业务场景，包括且不限于搜索、广告、推荐、电商、客服及智能发布等核心场景。

你的工作内容：
负责 VLM 的 SFT/RL/Post-training 流程，提升图文、视频与文本之间的语义对齐和指令遵循能力；
构建视觉 Reasoning 能力，提升模型在复杂图文理解、视频时序理解、多图推理、空间关系推理等任务上的表现；
研发多模态 Agent 能力，使模型能够进行任务分解、计划生成、工具调用、结果验证和自我修正；
建设 VLM Tool-use 能力，支持搜索、知识库、商品库、OCR、ASR、视频分析、审核规则等内部工具调用；
优化长视频理解和多帧推理能力，提升模型对视频内容、事件、时序关系和深层语义的理解效率；
面向小红书搜索、推荐、广告、电商、审核和内容创作等业务场景，构建数据、训练、评测和上线闭环。
任职要求：
我们希望你具备：
背景：计算机、视觉、机器人等相关专业硕士/博士；熟悉主流 VLM 架构（如 LLaVA, Qwen-VL, InternVL 等）。
专业深耕：在计算机视觉（CV）、多模态学习或视频理解领域有深入研究。
工程能力：精通 PyTorch，熟悉多模态模型的数据预处理流水线及大规模多机多卡训练。
加分项：在 CVPR, ICCV, ECCV, NeurIPS 等顶会发表过视觉或多模态相关高质量论文。

前往官网投递

免责声明：

此信息由小红书官网 (查看来源)审核并发布，我们转载该信息，仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“小红书官网”负责。我们作为信息转载平台，不构成求职建议，不涉及任何职业中介服务，不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎，自行判断并承担相应风险，求职请认准企业官方渠道！

上一职位：小红书(xiaohongshu)科技趋势运营

下一职位：小红书媒体性能优化工程师

小红书(xiaohongshu)招聘基础模型算法工程师 - VLM Post-training

招聘职位：

FAQ 小红书(xiaohongshu)招聘常见问答

牛大妈找到相似职位