腾讯(tencent)招聘混元多模态大模型算法加速工程师(深圳/北京/上海/杭州)
招聘职位:
混元多模态大模型算法加速工程师(深圳/北京/上海/杭州) 搜索同类职位
岗位职责:
1.主动跟踪学术界与工业界在图像视频生成式模型、多模态理解模型、语音模型、多模态理解生成统一建模等方向的创新算法研究,攻克Diffusion模型加速、多模态理解模型、语音模型(ASR、TTS、Omini等)、多模态理解生成统一建模加速等技术方向,包括但不限于:(Attention量化/稀疏加速、蒸馏加速、量化、投机解码、剪枝、KV Cache 压缩等等);
2.通过分析模型和任务性能瓶颈,设计创新的算法优化方案,提升多模态大模型的推理效率,显著降低端到端延迟;
3.作为算法与框架团队之间的技术桥梁,聚焦于图像理解、视频生成、音频理解生成、视觉多轮交互、实时对话等任务,提升模型在推理端的性能;
4.高效协同框架开发及业务算法团队,确保技术方案落地。撰写高质量的技术文档与实验报告,并组织内部分享,推动团队整体技术认知提升。
岗位要求:
1.拥有计算机科学、人工智能、电子工程、自动化等相关专业。具备扎实的机器学习/深度学习基础;
2.精通Python编程,熟练掌握PyTorch等深度学习框架。对Transformer、Diffusion等模型架构、计算瓶颈与优化方法论有深刻理解; 具33、图像视频生成、音频理解生成、图像视频编辑/理解、模型压缩(步数蒸馏,轻量化模型,投机解码、KVCache优化、稀疏剪枝等)、生成对齐算法(DPO\RLHF等)。
加分项:
1.在Kaggle等比赛获奖者优先、在ICML/NeurIPS/CVPR/ECCV/ICCV等发表论文优先、有开源框架核心算法贡献者优先(如HuggingFaceDiffusers优化);
2.熟悉HuggingFace Transformers、vLLM、SGLang等大模型推理框架者优先;
3.熟悉高性能计算、熟悉CUDA/AI芯片编程、并行策略(如模型并行、流水线并行等),了解NVLINK、GPU通信者优先。
1.主动跟踪学术界与工业界在图像视频生成式模型、多模态理解模型、语音模型、多模态理解生成统一建模等方向的创新算法研究,攻克Diffusion模型加速、多模态理解模型、语音模型(ASR、TTS、Omini等)、多模态理解生成统一建模加速等技术方向,包括但不限于:(Attention量化/稀疏加速、蒸馏加速、量化、投机解码、剪枝、KV Cache 压缩等等);
2.通过分析模型和任务性能瓶颈,设计创新的算法优化方案,提升多模态大模型的推理效率,显著降低端到端延迟;
3.作为算法与框架团队之间的技术桥梁,聚焦于图像理解、视频生成、音频理解生成、视觉多轮交互、实时对话等任务,提升模型在推理端的性能;
4.高效协同框架开发及业务算法团队,确保技术方案落地。撰写高质量的技术文档与实验报告,并组织内部分享,推动团队整体技术认知提升。
岗位要求:
1.拥有计算机科学、人工智能、电子工程、自动化等相关专业。具备扎实的机器学习/深度学习基础;
2.精通Python编程,熟练掌握PyTorch等深度学习框架。对Transformer、Diffusion等模型架构、计算瓶颈与优化方法论有深刻理解; 具33、图像视频生成、音频理解生成、图像视频编辑/理解、模型压缩(步数蒸馏,轻量化模型,投机解码、KVCache优化、稀疏剪枝等)、生成对齐算法(DPO\RLHF等)。
加分项:
1.在Kaggle等比赛获奖者优先、在ICML/NeurIPS/CVPR/ECCV/ICCV等发表论文优先、有开源框架核心算法贡献者优先(如HuggingFaceDiffusers优化);
2.熟悉HuggingFace Transformers、vLLM、SGLang等大模型推理框架者优先;
3.熟悉高性能计算、熟悉CUDA/AI芯片编程、并行策略(如模型并行、流水线并行等),了解NVLINK、GPU通信者优先。
免责声明:
此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!