小红书(xiaohongshu)招聘基础模型算法工程师 - VLM Post-training

招聘职位:

基础模型算法工程师 - VLM Post-training 搜索同类职位
发布日期:
2026-05-22
工作地点:
职位类型:
全职
职位类别:
大模型
来源:
小红书官网
岗位职责:
岗位定位:
本岗位侧重于构建大模型的“视觉与感知”能力。小红书拥有业界最独特的图文与短视频 UGC 数据生态,你将负责 VLM 的 Post-training,让模型深度理解,支撑小红书所有业务场景,包括且不限于搜索、广告、推荐、电商、客服及智能发布等核心场景。

你的工作内容:
负责 VLM 的 SFT/RL/Post-training 流程,提升图文、视频与文本之间的语义对齐和指令遵循能力;
构建视觉 Reasoning 能力,提升模型在复杂图文理解、视频时序理解、多图推理、空间关系推理等任务上的表现;
研发多模态 Agent 能力,使模型能够进行任务分解、计划生成、工具调用、结果验证和自我修正;
建设 VLM Tool-use 能力,支持搜索、知识库、商品库、OCR、ASR、视频分析、审核规则等内部工具调用;
优化长视频理解和多帧推理能力,提升模型对视频内容、事件、时序关系和深层语义的理解效率;
面向小红书搜索、推荐、广告、电商、审核和内容创作等业务场景,构建数据、训练、评测和上线闭环。
任职要求:
我们希望你具备:
背景: 计算机、视觉、机器人等相关专业硕士/博士;熟悉主流 VLM 架构(如 LLaVA, Qwen-VL, InternVL 等)。
专业深耕: 在 计算机视觉(CV)、多模态学习 或 视频理解 领域有深入研究。
工程能力: 精通 PyTorch,熟悉多模态模型的数据预处理流水线及大规模多机多卡训练。
加分项:在 CVPR, ICCV, ECCV, NeurIPS 等顶会发表过视觉或多模态相关高质量论文。
免责声明:

此信息由小红书官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“小红书官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!

FAQ 小红书(xiaohongshu)招聘常见问答

小红书(xiaohongshu)招聘工作地点:
北京市,上海市
小红书(xiaohongshu)招聘经验要求:
one_to_three_year