查看更多分享

腾讯(tencent)招聘魔方工作室-视频生成基础模型训练工程师

招聘职位：

魔方工作室-视频生成基础模型训练工程师 搜索同类职位

发布日期：: 2026-06-26
工作地点：: 深圳
职位类型：: 全职
职位类别：: 技术
来源：: 腾讯官网

岗位职责：
1.基模预训练：主导/参与视频扩散或自回归视频基模（DiT / 时空 Transformer）的大规模预训练，包括架构设计、训练目标、scaling 策略与稳定性调优；
2.可控/条件生成：实现首末帧、轨迹、深度、mask、参考图等多种控制信号的条件注入，保障身份一致性与场景反应合理性；
3.实时化改造：将双向/全序列模型改造为因果自回归、流式逐 chunk 生成；落地 Self-Forcing / Causal Forcing / DMD 等少步数蒸馏，实现实时帧率；
4.推理优化协同：与推理工程团队配合做 FP4/INT8 量化、TensorRT、流式批处理（stream-batch），在延迟 SLA 内最大化单卡吞吐；
5.评测体系：建立画质、时序一致性、身份保持、控制响应、延迟等量化评测，驱动迭代；
6.训练基础设施：在多机多卡（数百~上千 GPU）上做分布式训练（FSDP / DeepSpeed / Megatron风格并行），处理 OOM、通信瓶颈、混合精度稳定性等问题。
岗位要求：
1.计算机 / AI / 数学相关硕博，或同等工程能力；5年以上深度学习研发经验；
2.精通 PyTorch，熟悉大规模分布式训练（FSDP / DeepSpeed / Megatron-LM 至少其一），有实际跑通过百卡级训练的经验；
3.深入理解扩散模型（DDPM/DDIM/Flow Matching/Rectified Flow）与/或自回归生成，理解 DiT / U-ViT 等架构；
4.熟悉视频/图像生成至少一个方向，有从数据到模型落地的完整项目经验；
5.扎实的工程能力：能独立排查训练发散、梯度异常、数据瓶颈、显存/吞吐优化等问题；良好的实验设计与复现习惯，能阅读并复现最新论文。
加分项：
1.有实时 / 流式视频生成经验（Self-Forcing、CausVid、StreamDiffusion、LongLive 等相关工作）；
2.有模型蒸馏 / 少步数采样（DMD、Consistency、Progressive Distillation）落地经验；
3.有可控视频生成（ControlNet 类、轨迹/姿态/深度条件、参考图身份保持）经验；
4.有量化 / 推理加速（FP8/FP4/INT8、TensorRT、CUDA/Triton kernel）经验；
5.有 VAE / tokenizer（时空压缩、latent video）训练经验；
6.在 CVPR / ICCV / NeurIPS / ICLR / SIGGRAPH 等顶会有相关论文，或有高影响力开源项目；
7.有角色动画、游戏或 3D 内容生成相关背景。
岗位介绍：
渴望为世界带来新意的人，早已对描绘未来的“热词”不陌生——人工智能、机器学习、数据科学等等。腾讯始终在业界前沿不断探索，积极布局，并为优秀的你提供无限广阔的舞台。我们坚信科技的不断革新，最终能带来美好的、撼动人心的改变。

前往官网投递

免责声明：

此信息由腾讯官网 (查看来源)审核并发布，我们转载该信息，仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台，不构成求职建议，不涉及任何职业中介服务，不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎，自行判断并承担相应风险，求职请认准企业官方渠道！

上一职位：小红书(xiaohongshu)多端产品经理

下一职位：小红书「蒲公英」- B端产品经理