查看更多分享

腾讯(tencent)招聘腾讯云视频大模型推理加速工程师

招聘职位：

腾讯云视频大模型推理加速工程师 搜索同类职位

发布日期：: 2025-12-15
工作地点：: 深圳
职位类型：: 全职
职位类别：: 技术
来源：: 腾讯官网

岗位职责：
1.核心攻坚多模态模型加速：聚焦图片/视频的编辑、生成类模型加速，主导深度学习云端推理引擎的核心开发与推理效率优化，实现各相关AI算法的高质量落地；
2.蒸馏技术融合应用：结合生成类模型特性，将模型蒸馏技术（如DMD、CM等）融入推理引擎优化方案，在保证质量的前提下，进一步降低推理延迟。
岗位要求：
1.熟练掌握C/C++, python语言，熟悉CPU/GPU异构开发，深入理解CUDA编程模型，能独立完成生成类模型的推理加速或性能调优项目；
2.具备 TensorRT/TensorRT-LLM/FasterTransformer/vllm/sglang 等推理引擎深度实践经验，主导过基于上述引擎的大模型推理系统定制化开发与性能调优；精通推理引擎底层优化技术（算子融合、量化策略、动态批处理、KV 缓存优化)；
3.理解生成类模型的核心架构（如扩散模型UNet/Dit结构），熟悉推理过程中的关键性能卡点；
4.熟悉CPU/GPU异构加速瓶颈分析方法，有服务器端 AI 芯片、GPU加速经验优先。
岗位介绍：
渴望为世界带来新意的人，早已对描绘未来的“热词”不陌生——人工智能、机器学习、数据科学等等。腾讯始终在业界前沿不断探索，积极布局，并为优秀的你提供无限广阔的舞台。我们坚信科技的不断革新，最终能带来美好的、撼动人心的改变。

前往官网投递

免责声明：

此信息由腾讯官网 (查看来源)审核并发布，我们转载该信息，仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台，不构成求职建议，不涉及任何职业中介服务，不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎，自行判断并承担相应风险，求职请认准企业官方渠道！

上一职位：腾讯(tencent)混元大模型交互算法工程师（北京/上海）

下一职位：腾讯(tencent)腾讯云-泛互联网销售-出海方向

腾讯(tencent)招聘腾讯云视频大模型推理加速工程师

招聘职位：

FAQ 腾讯(tencent)招聘常见问答

投递进展笔记

求职进度

进展结果

发生时间

求职体验

是否匿名

提示