查看更多分享

腾讯(tencent)招聘混元多模态大模型算法加速工程师（深圳/北京/上海/杭州）

招聘职位：

混元多模态大模型算法加速工程师（深圳/北京/上海/杭州） 搜索同类职位

发布日期：: 2026-07-08
工作地点：: 深圳
职位类型：: 全职
职位类别：: 技术
来源：: 腾讯官网

岗位职责：
1.主动跟踪学术界与工业界在图像视频生成式模型、多模态理解模型、语音模型、多模态理解生成统一建模等方向的创新算法研究，攻克Diffusion模型加速、多模态理解模型、语音模型（ASR、TTS、Omini等）、多模态理解生成统一建模加速等技术方向，包括但不限于：（Attention量化/稀疏加速、蒸馏加速、量化、投机解码、剪枝、KV Cache 压缩等等）；
2.通过分析模型和任务性能瓶颈，设计创新的算法优化方案，提升多模态大模型的推理效率，显著降低端到端延迟；
3.作为算法与框架团队之间的技术桥梁，聚焦于图像理解、视频生成、音频理解生成、视觉多轮交互、实时对话等任务，提升模型在推理端的性能；
4.高效协同框架开发及业务算法团队，确保技术方案落地。撰写高质量的技术文档与实验报告，并组织内部分享，推动团队整体技术认知提升。
岗位要求：
1.拥有计算机科学、人工智能、电子工程、自动化等相关专业。具备扎实的机器学习/深度学习基础；
2.精通Python编程，熟练掌握PyTorch等深度学习框架。对Transformer、Diffusion等模型架构、计算瓶颈与优化方法论有深刻理解; 具33、图像视频生成、音频理解生成、图像视频编辑/理解、模型压缩（步数蒸馏，轻量化模型，投机解码、KVCache优化、稀疏剪枝等）、生成对齐算法（DPO\RLHF等）。
加分项：
1.在Kaggle等比赛获奖者优先、在ICML/NeurIPS/CVPR/ECCV/ICCV等发表论文优先、有开源框架核心算法贡献者优先（如HuggingFaceDiffusers优化）；
2.熟悉HuggingFace Transformers、vLLM、SGLang等大模型推理框架者优先；
3.熟悉高性能计算、熟悉CUDA/AI芯片编程、并行策略（如模型并行、流水线并行等），了解NVLINK、GPU通信者优先。

前往官网投递

免责声明：

此信息由腾讯官网 (查看来源)审核并发布，我们转载该信息，仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台，不构成求职建议，不涉及任何职业中介服务，不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎，自行判断并承担相应风险，求职请认准企业官方渠道！

上一职位：小红书(xiaohongshu)直播策略产品

下一职位：美团(meituan)企客-华南-大客户经理

腾讯(tencent)招聘混元多模态大模型算法加速工程师（深圳/北京/上海/杭州）

招聘职位：

FAQ 腾讯(tencent)招聘常见问答

投递进展笔记

求职进度

进展结果

发生时间

求职体验

是否匿名

提示