腾讯(tencent)招聘大模型推理引擎研发工程师

招聘职位：

大模型推理引擎研发工程师 搜索同类职位

发布日期：: 2026-03-16
工作地点：: 上海
职位类型：: 全职
职位类别：: 技术
来源：: 腾讯官网

岗位职责：
1.研发及优化大模型推理引擎；
2.推广公有云客户，创造技术优势引导客户上云；
3.对接客户业务，分析性能瓶颈，定位、解决问题；
4.协助业务内部集群部署，持续迭代性能，保持业内领先优势。
岗位要求：
1.熟悉主流大模型推理框架，如vllm，lightllm，tensorrt-llm，lmdeploy，faster transformer等；
2.熟悉CUDA，triton（https://openai.com/research/triton）、cutlass至少一种以上，精通者优先；
3.熟悉大模型结构，了解大模型性能瓶颈，熟练分析单机及分布式情况下不同性能热点和优化手段；
4.熟悉大模型量化算法，int8/fp8/混合精度量化，了解模型蒸馏、稀疏化、剪裁技术；
5.熟悉推理服务框架，具备服务部署经验者优先，了解k8s，容器化服务，Triton Inference Server (https://github.com/triton-inference-server/server)实现原理者优先；
6.熟悉分布式模型部署及并行策略，如模型并行、流水线并行等，了解NVLINK、GPU通信者优先；
7.熟练掌握Python及C++；
8.了解GPU体系结构者优先。
岗位介绍：
在腾讯，后台开发工程师不仅是“又快又稳”的问题解决专家，更是生态共创者。你将与技术团队一同沉淀优质代码，让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段，你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神，同时欢迎你一起参与团队愿景、文化和产品方向的探讨。

前往官网投递

免责声明：

此信息由腾讯官网 (查看来源)审核并发布，我们转载该信息，仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台，不构成求职建议，不涉及任何职业中介服务，不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎，自行判断并承担相应风险，求职请认准企业官方渠道！

上一职位：哔哩哔哩(bilibili|b站)商业化-自助投放产品经理Leader

下一职位：小红书(xiaohongshu)AI native应用-iOS开发工程师

腾讯(tencent)招聘 大模型推理引擎研发工程师

招聘职位：

FAQ 腾讯(tencent)招聘常见问答

腾讯(tencent)招聘大模型推理引擎研发工程师