小红书(xiaohongshu)招聘大模型异构计算优化工程师/专家

招聘职位:

大模型异构计算优化工程师/专家 搜索同类职位
发布日期:
2026-06-04
工作地点:
职位类型:
全职
职位类别:
引擎
来源:
小红书官网
岗位职责:
1、核心引擎开发与优化:负责或深度参与基于国产异构计算芯片(如NPU/PPU等)的大模型训练/推理引擎的架构设计、开发与迭代,构建高性能、高稳定性的上层软件栈;
2、大模型业务落地:将引擎能力应用于公司核心业务,主导或参与多模态、大语言模型等前沿AI模型在国产芯片上的训练、微调与推理部署,解决实际落地中的技术难题;
3、极致性能调优:针对各类业务大模型,进行深度的推理调度策略优化和关键算子(Kernel)的性能剖析与极致优化,持续提升系统的吞吐量、降低延迟;
4、生态合作与协同:作为技术接口人,与国产芯片原厂技术支持团队紧密合作,高效推进芯片驱动、基础软件栈的引入、问题排查与版本迭代,确保技术路线顺畅推进。
任职要求:
1、熟练掌握 C++/Python 编程,具备扎实的计算机体系结构、数据结构和算法基础,具备良好的编程习惯;
2、有至少一款非Nvidia GPU的异构计算芯片适配大模型训练、推理框架的相关经验,包括但不限于AI框架适配、模型移植、性能优化或算子开发;
3、熟悉至少一种主流的机器学习框架(PyTorch/PaddlePaddle/TensorFlow等),对框架内部实现有一定了解;
4、具备大型深度学习模型(尤其是大语言模型LLM或多模态模型)的训练或推理优化实践经验,能独立解决功能研发及性能优化问题。
加分项:
1、深入理解AI芯片(GPU/NPU)的硬件架构(如Tensor Core、内存 hierarchy)及其软件栈(如CUDA/OpenCL, ROCm, CANN);具备使用性能分析工具(如Nsight Systems/Compute, Ascend Profiler)的经验;
2、熟悉常见的并行计算模型(如SIMT、SPMD)和并行编程范式(如MPI、OpenMP),了解其适用场景与优劣。
免责声明:

此信息由小红书官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“小红书官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!

FAQ 小红书(xiaohongshu)招聘常见问答

小红书(xiaohongshu)招聘工作地点:
北京市,上海市
小红书(xiaohongshu)招聘经验要求:
three_to_five_year