查看更多分享

腾讯(tencent)招聘魔方工作室-视频生成基础模型训练工程师

招聘职位:

魔方工作室-视频生成基础模型训练工程师 搜索同类职位
发布日期:
2026-06-26
工作地点:
职位类型:
全职
职位类别:
技术
来源:
腾讯官网
岗位职责:
1.基模预训练:主导/参与视频扩散或自回归视频基模(DiT / 时空 Transformer)的大规模预训练,包括架构设计、训练目标、scaling 策略与稳定性调优;
2.可控/条件生成:实现首末帧、轨迹、深度、mask、参考图等多种控制信号的条件注入,保障身份一致性与场景反应合理性;
3.实时化改造:将双向/全序列模型改造为因果自回归、流式逐 chunk 生成;落地 Self-Forcing / Causal Forcing / DMD 等少步数蒸馏,实现实时帧率;
4.推理优化协同:与推理工程团队配合做 FP4/INT8 量化、TensorRT、流式批处理(stream-batch),在延迟 SLA 内最大化单卡吞吐;
5.评测体系:建立画质、时序一致性、身份保持、控制响应、延迟等量化评测,驱动迭代;
6.训练基础设施:在多机多卡(数百~上千 GPU)上做分布式训练(FSDP / DeepSpeed / Megatron风格并行),处理 OOM、通信瓶颈、混合精度稳定性等问题。
岗位要求:
1.计算机 / AI / 数学相关硕博,或同等工程能力;5年以上深度学习研发经验;
2.精通 PyTorch,熟悉大规模分布式训练(FSDP / DeepSpeed / Megatron-LM 至少其一),有实际跑通过百卡级训练的经验;
3.深入理解扩散模型(DDPM/DDIM/Flow Matching/Rectified Flow)与/或自回归生成,理解 DiT / U-ViT 等架构;
4.熟悉视频/图像生成至少一个方向,有从数据到模型落地的完整项目经验;
5.扎实的工程能力:能独立排查训练发散、梯度异常、数据瓶颈、显存/吞吐优化等问题;良好的实验设计与复现习惯,能阅读并复现最新论文。
加分项:
1.有实时 / 流式视频生成经验(Self-Forcing、CausVid、StreamDiffusion、LongLive 等相关工作);
2.有模型蒸馏 / 少步数采样(DMD、Consistency、Progressive Distillation)落地经验;
3.有可控视频生成(ControlNet 类、轨迹/姿态/深度条件、参考图身份保持)经验;
4.有量化 / 推理加速(FP8/FP4/INT8、TensorRT、CUDA/Triton kernel)经验;
5.有 VAE / tokenizer(时空压缩、latent video)训练经验;
6.在 CVPR / ICCV / NeurIPS / ICLR / SIGGRAPH 等顶会有相关论文,或有高影响力开源项目;
7.有角色动画、游戏或 3D 内容生成相关背景。
岗位介绍:
渴望为世界带来新意的人,早已对描绘未来的“热词”不陌生——人工智能、机器学习、数据科学等等。腾讯始终在业界前沿不断探索,积极布局,并为优秀的你提供无限广阔的舞台。我们坚信科技的不断革新,最终能带来美好的、撼动人心的改变。
免责声明:

此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!