腾讯(tencent)招聘腾讯云-云原生AI加速领域专家(基础设施方向)(北京/深圳)
招聘职位:
腾讯云-云原生AI加速领域专家(基础设施方向)(北京/深圳) 搜索同类职位
岗位职责:
1.AI工作负载的全局加速体系设计:负责构建覆盖“数据-镜像-进程-GPU”全链路的AI加速体系,核心优化容器镜像、模型权重、数据集等存储、分发与访问性能;
2.计算框架深度优化:深入研究PyTorch、TensorFlow等主流AI框架的进程启动、模型加载、GPU显存管理机制,设计与实现框架级的快速启动、热加载、动态切分/重组方案,显著降低任务调度延迟与资源闲置;
3.前沿技术探索与攻关:负责技术难题攻关与前沿预研,如无损快照与实时恢复、计算任务的无感迁移、异构资源池化等,并将创新成果转化为核心产品竞争力。
岗位要求:
1.计算机科学、软件工程或相关专业硕士及以上学历,7年以上系统底层或高性能计算领域开发经验;
2.深厚的系统级开发能力:精通C/C++/Rust,精通Linux系统编程,具备从用户态到内核态的复杂系统调试与优化能力;
3.跨领域知识深度,需在以下至少三个领域有实际项目经验:;
1)云原生基础设施:深度掌握Kubernetes、容器运行时、镜像加速(如Nydus, Stargz)原理,有相关开源项目贡献者尤佳;
2)存储与I/O栈:深入理解文件系统、块设备、内核I/O路径,有高性能存储系统(Ceph, SPDK等)或内核模块开发经验;
3)高性能网络:精通RDMA、TCP/IP协议栈,有基于DPDK/SPDK、eBPF的网络性能优化经验;
4)AI计算栈:深入理解AI框架架构、CUDA编程、GPU显存管理,有大型模型训练调优或框架开发经验;
4.具备杰出的系统性思维和难题攻关能力,能独立主导跨团队的大型技术项目。
岗位介绍:
在腾讯,后台开发工程师不仅是“又快又稳”的问题解决专家,更是生态共创者。你将与技术团队一同沉淀优质代码,让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段,你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神,同时欢迎你一起参与团队愿景、文化和产品方向的探讨。
1.AI工作负载的全局加速体系设计:负责构建覆盖“数据-镜像-进程-GPU”全链路的AI加速体系,核心优化容器镜像、模型权重、数据集等存储、分发与访问性能;
2.计算框架深度优化:深入研究PyTorch、TensorFlow等主流AI框架的进程启动、模型加载、GPU显存管理机制,设计与实现框架级的快速启动、热加载、动态切分/重组方案,显著降低任务调度延迟与资源闲置;
3.前沿技术探索与攻关:负责技术难题攻关与前沿预研,如无损快照与实时恢复、计算任务的无感迁移、异构资源池化等,并将创新成果转化为核心产品竞争力。
岗位要求:
1.计算机科学、软件工程或相关专业硕士及以上学历,7年以上系统底层或高性能计算领域开发经验;
2.深厚的系统级开发能力:精通C/C++/Rust,精通Linux系统编程,具备从用户态到内核态的复杂系统调试与优化能力;
3.跨领域知识深度,需在以下至少三个领域有实际项目经验:;
1)云原生基础设施:深度掌握Kubernetes、容器运行时、镜像加速(如Nydus, Stargz)原理,有相关开源项目贡献者尤佳;
2)存储与I/O栈:深入理解文件系统、块设备、内核I/O路径,有高性能存储系统(Ceph, SPDK等)或内核模块开发经验;
3)高性能网络:精通RDMA、TCP/IP协议栈,有基于DPDK/SPDK、eBPF的网络性能优化经验;
4)AI计算栈:深入理解AI框架架构、CUDA编程、GPU显存管理,有大型模型训练调优或框架开发经验;
4.具备杰出的系统性思维和难题攻关能力,能独立主导跨团队的大型技术项目。
岗位介绍:
在腾讯,后台开发工程师不仅是“又快又稳”的问题解决专家,更是生态共创者。你将与技术团队一同沉淀优质代码,让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段,你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神,同时欢迎你一起参与团队愿景、文化和产品方向的探讨。
免责声明:
此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!