腾讯(tencent)招聘大模型Infra技术研究员-(北京)or

招聘职位:

大模型Infra技术研究员-(北京)or 搜索同类职位
发布日期:
2026-04-05
工作地点:
职位类型:
全职
职位类别:
技术
来源:
腾讯官网
岗位职责:
1.负责大模型推理引擎架构设计、研发与迭代,深度适配主流GPU及异构AI芯片,优化推理性能与算力成本,搭建生产级PD分离推理调度系统,保障推理服务高并发、低延迟、高稳定;
2.搭建并优化多模态大模型训练底层基建,解决训练端显存管理、混合并行调度、跨节点通信同步痛点,完善算力调度与数据流水线,支撑模型高效稳定训练;
3.针对训练与推理场景核心技术难题,落地动态显存分配、KV Cache优化、变长序列批处理、通信优化、异构算力负载均衡等关键技术;
4.基于GPU与异构芯片架构,完成训练、推理全流程性能分析、算子及调度优化,推动优化方案工程化落地;
5.跟踪大模型Infra前沿技术,沉淀优化实践经验;参与vLLM、SGLang等开源项目协作,实现内部技术与开源生态双向赋能。
岗位要求:
1.计算机科学、计算机体系结构、软件工程、人工智能等相关专业的博士及优秀硕士;具有大规模分布式训练系统、高性能计算或 MLSys 方向研究与工程背景者优先;
2.深入理解大规模分布式训练系统,熟悉 DeepSpeed、Megatron-LM、PyTorch FSDP 等主流框架原理;熟悉张量并行、流水线并行、序列并行等并行策略;精通 Python 与 C++,熟悉 CUDA 编程及高性能算子开发;在 MLSys、SC、EuroSys、OSDI、ATC 等系统顶会或 CVPR/NeurIPS/ICML 系统方向有相关成果者优先;
3.对底层系统与 AI 交叉方向有浓厚兴趣,具备从系统视角分解和量化性能瓶颈的能力;工程严谨性强,能在超大规模训练环境中快速定位和解决复杂系统问题;沟通协作能力强,能与算法、硬件、平台等多方团队高效协同推进。
岗位介绍:
渴望为世界带来新意的人,早已对描绘未来的“热词”不陌生——人工智能、机器学习、数据科学等等。腾讯始终在业界前沿不断探索,积极布局,并为优秀的你提供无限广阔的舞台。我们坚信科技的不断革新,最终能带来美好的、撼动人心的改变。
免责声明:

此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!

FAQ 腾讯(tencent)招聘常见问答

腾讯(tencent)招聘工作地点:
上海
腾讯(tencent)招聘经验要求:
三年以上工作经验