腾讯(tencent)招聘高性能计算工程师-国产化方向
招聘职位:
高性能计算工程师-国产化方向 搜索同类职位
岗位职责:
1.产硬件适配与优化开发:参与基于昇腾、海光、寒武纪思元、昆仑芯等国产化芯片的算法模型适配,负责底层性能调优,针对不同芯片架构特性制定差异化优化方案;
2.国产框架与引擎优化:针对文生文、生图、生视频等大模型推理场景,扩展 vLLM/SGLang 等主流框架的国产化硬件支持能力,重点提升 FP8 精度模型适配、KV Cache 国产化存储优化等关键场景效率;
3.国产化算子与算法研发:深入剖析国产芯片架构特性,设计实现高性能算子库,重点突破 Matmul、MoE 等核心算子的指令级优化,确保精度与性能平衡;
4.分布式系统协同优化:解决国产芯片集群下模型并行、数据并行的性能瓶颈,优化多卡互联通信机制,提升大模型的分布式运行效率。。
岗位要求:
1.精通华AscendC、CNCC、x86 优化指令集等国产化编程语言,熟悉 CANN、BANG 等国产开发套件的底层优化技巧,掌握 Vector/Cube 混合计算等编程范式;
2.熟悉国产自研框架如昇思 MindSpore,或具备 vLLM/SGLang 适配国产芯片的实战经验,掌握 KV Cache 本地化存储、动态批处理等核心优化手段。;
3.高性能计算基础扎实,深入理解并行计算原理,精通国产芯片的内存优化、通信优化等关键技术;
4.熟练掌握 C/C++、Python,具备算子级代码优化能力,能基于国产硬件特性设计高效算法,有自定义算子开发(如融合算子实现)经验者优先;
5.2年以上国产芯片高性能计算开发经验,至少深度参与过一款昇腾、寒武纪、海光或昆仑芯的 AI 项目优化,有大规模国产集群部署经验者优先。
加分项:
1.通过腾讯云从业资格证或同等资格认证的优先录取。
岗位介绍:
在腾讯,后台开发工程师不仅是“又快又稳”的问题解决专家,更是生态共创者。你将与技术团队一同沉淀优质代码,让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段,你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神,同时欢迎你一起参与团队愿景、文化和产品方向的探讨。
1.产硬件适配与优化开发:参与基于昇腾、海光、寒武纪思元、昆仑芯等国产化芯片的算法模型适配,负责底层性能调优,针对不同芯片架构特性制定差异化优化方案;
2.国产框架与引擎优化:针对文生文、生图、生视频等大模型推理场景,扩展 vLLM/SGLang 等主流框架的国产化硬件支持能力,重点提升 FP8 精度模型适配、KV Cache 国产化存储优化等关键场景效率;
3.国产化算子与算法研发:深入剖析国产芯片架构特性,设计实现高性能算子库,重点突破 Matmul、MoE 等核心算子的指令级优化,确保精度与性能平衡;
4.分布式系统协同优化:解决国产芯片集群下模型并行、数据并行的性能瓶颈,优化多卡互联通信机制,提升大模型的分布式运行效率。。
岗位要求:
1.精通华AscendC、CNCC、x86 优化指令集等国产化编程语言,熟悉 CANN、BANG 等国产开发套件的底层优化技巧,掌握 Vector/Cube 混合计算等编程范式;
2.熟悉国产自研框架如昇思 MindSpore,或具备 vLLM/SGLang 适配国产芯片的实战经验,掌握 KV Cache 本地化存储、动态批处理等核心优化手段。;
3.高性能计算基础扎实,深入理解并行计算原理,精通国产芯片的内存优化、通信优化等关键技术;
4.熟练掌握 C/C++、Python,具备算子级代码优化能力,能基于国产硬件特性设计高效算法,有自定义算子开发(如融合算子实现)经验者优先;
5.2年以上国产芯片高性能计算开发经验,至少深度参与过一款昇腾、寒武纪、海光或昆仑芯的 AI 项目优化,有大规模国产集群部署经验者优先。
加分项:
1.通过腾讯云从业资格证或同等资格认证的优先录取。
岗位介绍:
在腾讯,后台开发工程师不仅是“又快又稳”的问题解决专家,更是生态共创者。你将与技术团队一同沉淀优质代码,让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段,你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神,同时欢迎你一起参与团队愿景、文化和产品方向的探讨。
免责声明:
此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!