小红书(xiaohongshu)招聘流式视频生成算法工程师
招聘职位:
流式视频生成算法工程师 搜索同类职位
岗位职责:
岗位介绍
我们正在探索流式视频生成大模型方向,你将参与构建面向真实世界的实时视频处理系统,覆盖TV2V、TIV2V、TI2V等前沿课题,推动模型能力从离线处理走向实时交互式处理。
1、深度参与流式视频编辑大模型的研究与落地,涵盖超分辨率、指令风格化、参考图风格化、特效生成、交互式图片等核心任务,打造业界领先的视频编辑能力;
2、探索Diffusion、自回归等生成范式在流式视频编辑领域的前沿技术,包括但不限于高效推理、时序一致性建模、多条件可控生成等方向,推动技术创新与工程落地;
3、研究Consistency Model、DMD、GAN蒸馏等加速方法在视频编辑场景的应用,解决工业级实时性与画质的平衡难题,支持大规模线上服务;
4、参与高质量视频编辑数据的挖掘、清洗与合成,结合Post-training、强化学习等方法持续优化模型效果与泛化能力;
5、跟踪视频生成与编辑领域最新进展,将相关研究总结为顶会论文、专利或技术博客,推动团队技术影响力建设。
任职要求:
1、获得硕士及以上学位,计算机科学、人工智能、电子信息、自动化等相关专业;
2、在图像/视频深度学习领域有丰富经验,具备扎实的图像与视频处理算法基础,有良好的数学功底,熟练掌握Python/C++;
3、熟悉Diffusion基础原理,了解SD3.5/FLUX/Qwen-Image等T2I模型及Wan等T2V模型细节,了解self forcing、causal forcing训练细节;
4、熟悉Consistency Model、DMD、GAN蒸馏等加速方法,有Diffusion生成式模型性能调优与落地经验者优先;
5、在相关领域顶会或期刊(CVPR、SIGGRAPH、ICCV、ECCV、NeurIPS、TPAMI等)发表过论文,或有知名开源项目、顶级竞赛获奖经验者优先;
6、强烈的技术热情与好奇心,优秀的分析与解决问题能力,良好的团队协作和沟通能力,乐于探索新技术并推动创新落地。
岗位介绍
我们正在探索流式视频生成大模型方向,你将参与构建面向真实世界的实时视频处理系统,覆盖TV2V、TIV2V、TI2V等前沿课题,推动模型能力从离线处理走向实时交互式处理。
1、深度参与流式视频编辑大模型的研究与落地,涵盖超分辨率、指令风格化、参考图风格化、特效生成、交互式图片等核心任务,打造业界领先的视频编辑能力;
2、探索Diffusion、自回归等生成范式在流式视频编辑领域的前沿技术,包括但不限于高效推理、时序一致性建模、多条件可控生成等方向,推动技术创新与工程落地;
3、研究Consistency Model、DMD、GAN蒸馏等加速方法在视频编辑场景的应用,解决工业级实时性与画质的平衡难题,支持大规模线上服务;
4、参与高质量视频编辑数据的挖掘、清洗与合成,结合Post-training、强化学习等方法持续优化模型效果与泛化能力;
5、跟踪视频生成与编辑领域最新进展,将相关研究总结为顶会论文、专利或技术博客,推动团队技术影响力建设。
任职要求:
1、获得硕士及以上学位,计算机科学、人工智能、电子信息、自动化等相关专业;
2、在图像/视频深度学习领域有丰富经验,具备扎实的图像与视频处理算法基础,有良好的数学功底,熟练掌握Python/C++;
3、熟悉Diffusion基础原理,了解SD3.5/FLUX/Qwen-Image等T2I模型及Wan等T2V模型细节,了解self forcing、causal forcing训练细节;
4、熟悉Consistency Model、DMD、GAN蒸馏等加速方法,有Diffusion生成式模型性能调优与落地经验者优先;
5、在相关领域顶会或期刊(CVPR、SIGGRAPH、ICCV、ECCV、NeurIPS、TPAMI等)发表过论文,或有知名开源项目、顶级竞赛获奖经验者优先;
6、强烈的技术热情与好奇心,优秀的分析与解决问题能力,良好的团队协作和沟通能力,乐于探索新技术并推动创新落地。
免责声明:
此信息由小红书官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“小红书官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!