腾讯招聘数据中心AI网络方向工程师

招聘职位:

数据中心AI网络方向工程师 搜索同类职位
发布日期:
2025-07-11
工作地点:
职位类型:
全职
职位类别:
技术
来源:
腾讯官网
岗位职责:
1.​GPU集群通信架构设计与优化:负责数据中心AI场景下GPU集群通信架构的设计与开发,优化多卡/多机通信性能,提升分布式训练效率;研究并实现GPU与网络设备(如交换机、RDMA网卡)的协同工作,解决通信延迟、带宽瓶颈等关键问题;
2.通信库与驱动开发:开发高性能GPU通信库(NCCL/DeepEP/NVsharemem 等),适配主流AI框架(TensorFlow/PyTorch),支持大规模集群通信需求;
3.GPU通信性能调优:分析通信性能瓶颈(硬件/软件层面),通过算法优化、代码重构或硬件选型提升整体吞吐量;与硬件团队协作,验证GPU新架构的通信能力,提供技术反馈与改进建议;
4.生态兼容与标准化:参与制定GPU通信协议标准,推动异构计算生态的互联互通。
岗位要求:
1.教育背景:硕士及以上学历,计算机、通信、电子工程、高性能计算等相关专业;
2.核心技能(有以下经验者优先):熟悉CUDA(CUDA graph, kernel, stream, PTX ISA)开发流程;掌握Cuda Core/Tensor Core的混合精度计算原理,熟悉FP16/FP32/TF32等的运算优化方法;熟悉 GPU 基本架构,对SM、L1/L2 Cache、HBM等核心组件有深入理解,对线程/任务调度有丰富经验;
3.项目经验:GPU集群通信相关经验,主导或参与过AI训练/推理平台的通信优化项目;有GPU通信库开发经验者优先;
4.加分项:发表过GPU通信、分布式计算领域的高质量论文或专利;具备GPU虚拟化、FPGA异构加速等跨领域经验。
岗位介绍:
在腾讯,优秀的技术运营工程师始终赋能业务,关注技术运营的质量、成本、效率和安全。他们不仅是经验丰富的问题解决者,更是具有全局视角的架构师,通过自动化工具的建设,强力提升平台效能,助力业务发展。
免责声明:

此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!

FAQ 腾讯招聘常见问答

腾讯招聘工作地点:
深圳
腾讯招聘经验要求:
五年以上工作经验