腾讯(tencent)招聘AI计算库开发工程师(北京/深圳)
招聘职位:
AI计算库开发工程师(北京/深圳) 搜索同类职位
岗位职责:
1.基于自研 AI 芯片软件栈以及架构特点,研发和优化高性能算子,设计高效的数据流与计算流方案;
2.结合芯片计算单元和存储层次,构建可维护、可扩展的算子实现;
3.参与测试框架和性能分析体系的建设,提升算子研发效率、质量保障能力和生态易用性;
4.与编译器、runtime及业务团队协作,推动模型在自研芯片上的端到端性能优化与落地。
岗位要求:
1.熟悉 Linux 开发环境,扎实掌握 C++/Python,具备良好的代码能力和工程能力;
2.熟悉异构计算或高性能计算基础,理解并行编程、向量化、线程/任务调度、访存优化等基本原理;
3.熟悉 PyTorch、TensorFlow 等主流深度学习框架;
4.具备性能瓶颈定位与调优能力,具备profile和debug工具使用经验。
加分项:
1.有GPU、DSA、DSP上的算子开发和性能优化经验者优先;
2.有 CUDA、ROCm生态开发经验者优先;
3.有 LLM 推理优化、融合算子开发、低精度计算或算子测试框架建设经验者优先;
4.熟悉线性代数、概率统计、数值计算或优化方法者优先。
1.基于自研 AI 芯片软件栈以及架构特点,研发和优化高性能算子,设计高效的数据流与计算流方案;
2.结合芯片计算单元和存储层次,构建可维护、可扩展的算子实现;
3.参与测试框架和性能分析体系的建设,提升算子研发效率、质量保障能力和生态易用性;
4.与编译器、runtime及业务团队协作,推动模型在自研芯片上的端到端性能优化与落地。
岗位要求:
1.熟悉 Linux 开发环境,扎实掌握 C++/Python,具备良好的代码能力和工程能力;
2.熟悉异构计算或高性能计算基础,理解并行编程、向量化、线程/任务调度、访存优化等基本原理;
3.熟悉 PyTorch、TensorFlow 等主流深度学习框架;
4.具备性能瓶颈定位与调优能力,具备profile和debug工具使用经验。
加分项:
1.有GPU、DSA、DSP上的算子开发和性能优化经验者优先;
2.有 CUDA、ROCm生态开发经验者优先;
3.有 LLM 推理优化、融合算子开发、低精度计算或算子测试框架建设经验者优先;
4.熟悉线性代数、概率统计、数值计算或优化方法者优先。
免责声明:
此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!