查看更多分享

腾讯(tencent)招聘大模型推理后台开发工程师(深圳/北京/上海/杭州)

招聘职位:

大模型推理后台开发工程师(深圳/北京/上海/杭州) 搜索同类职位
发布日期:
2026-03-13
工作地点:
职位类型:
全职
职位类别:
技术
来源:
腾讯官网
岗位职责:
1.负责设计与演进业界领先的大模型在线推理平台,构建支撑亿级日调用量的高性能、高可用、高扩展的服务体系,为公司AI业务提供坚实的推理能力基座;
2.负责设计高性能推理服务架构,结合推理引擎与底层硬件的核心特性,优化动态调度、资源管理等核心后台策略,实现服务性能与成本效益的最优化;
3.负责研发标准化的推理服务框架与配套工具链,打通从模型研发、性能优化到线上部署的全链路流程,提升推理服务工程化落地效率;
4.负责构建平台的高可用架构与可观测性体系,落地故障容灾、限流熔断等核心能力,为容量规划、应急响应提供数据与技术支撑,保障服务的可靠性。
岗位要求:
1.具备扎实的后端研发功底,熟练掌握 Golang/C++/Python 至少一门语言,对Linux环境下的分布式系统开发与挑战有深刻理解,具备复杂业务系统的设计与落地经验;
2.具备解决大规模推理服务技术挑战的实践经验,尤其在状态感知的负载均衡、分布式推理的服务编排、长上下文管理或推理服务框架治理等方向有系统设计能力;
3.具备出色的系统性思考和问题解决能力,能够从性能、成本、稳定性的全局视角进行技术选型与架构决策;
4.具备以下一项或多项经验者优先:
1).有AI推理平台核心模块的设计与研发经验;
2).具备vLLM等主流推理框架的服务集成与性能调优经验,并深入理解其架构原理;
3).熟悉推理请求调度机制,并具备复杂场景(文本/多模态/流式)的服务设计经验;
4).有大规模GPU推理集群治理、可观测性体系的实践经验。
岗位介绍:
在腾讯,后台开发工程师不仅是“又快又稳”的问题解决专家,更是生态共创者。你将与技术团队一同沉淀优质代码,让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段,你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神,同时欢迎你一起参与团队愿景、文化和产品方向的探讨。
免责声明:

此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!

FAQ 腾讯(tencent)招聘常见问答

腾讯(tencent)招聘工作地点:
深圳
腾讯(tencent)招聘经验要求:
三年以上工作经验