腾讯(tencent)招聘混元大模型推理加速工程师（北京/深圳）

招聘职位：

混元大模型推理加速工程师（北京/深圳） 搜索同类职位

发布日期：: 2026-06-01
工作地点：: 深圳
职位类型：: 全职
职位类别：: 技术
来源：: 腾讯官网

岗位职责：
1.配合算法工程师，推动深度学习相关算法的落地，打造高吞吐、低延时的推理系统；
2.优化大模型推理性能，提升吞吐并控制成本；
3.优化大模型推理框架，提升框架易用性和可调试性。
岗位要求：
1.熟练掌握 C/C++、Python语言，有计算机体系结构背景或软件开发背景，熟悉系统性能调优的方式；
2.具备基础的GPU编程能力，包括但不限于Cuda、OpenCL；熟悉至少一种GPU加速库，如cublas、cudnn、cutlass等；
3.有Tensorrt/FasterTransformer/Tensorrt-llm/vllm等深度学习推理框架的实际使用经验；
4.熟悉各类深度学习网络和算子底层实现细节，训练和推理模型调试、调优有实操经验优先；
5.熟悉CPU/GPU异构加速瓶颈分析方法，有服务器端 AI 芯片、GPU加速经验优先；
6.熟悉分布式推理常用加速方法，有超大模型分布式部署经验优先。
岗位介绍：
在腾讯，后台开发工程师不仅是“又快又稳”的问题解决专家，更是生态共创者。你将与技术团队一同沉淀优质代码，让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段，你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神，同时欢迎你一起参与团队愿景、文化和产品方向的探讨。

前往官网投递

免责声明：

此信息由腾讯官网 (查看来源)审核并发布，我们转载该信息，仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台，不构成求职建议，不涉及任何职业中介服务，不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎，自行判断并承担相应风险，求职请认准企业官方渠道！

上一职位：腾讯(tencent)休闲竞技项目-资深2D角色设计-美式卡通

下一职位：腾讯《三角洲行动》-高级UE手游引擎开发工程师

腾讯(tencent)招聘混元大模型推理加速工程师（北京/深圳）

招聘职位：

FAQ 腾讯(tencent)招聘常见问答