小红书招聘AI大模型Infra架构工程师 - 创作发布
招聘职位:
AI大模型Infra架构工程师 - 创作发布 搜索同类职位
岗位职责:
业务介绍
小红书智创技术团队负责用户发布工具、增长&商业化业务等多个公司重要业务场景里的创作能力的支持,技术范围广,技术栈深,利用大模型进行了全面的升级,因而对大模型的训练和推理Infra有较高需求。
工作职责
1. 负责端侧的AI算法的部署和工程化落地,提升端侧的智能化水平,并通过端侧推理架构的优化,提升用户的使用体验。
2. 负责服务端的Diffusion、LLM、VLM、Omini模型等先进算法的部署和极致性能优化,提升推理效率,降低成本。
3. 负责Diffusion、VLM等大模型算法训练的框架优化及效率提升,提高算法迭代训练效率,降低成本。
4. 打造具有业界一流水平的大模型推理技术能力,并通过开源共建等各类形式,形成在业界的广泛技术影响力
任职要求:
1. 对各种AI算法有一定的了解,有丰富的算法工程集成,性能优化和落地经验
2. 熟悉CUDA编程、CUDNN,TensorRT等工具,有丰富的服务端性能优化经验者优先
3. 深入了解NCNN、MNN、TNN、TVM、VLLM框架中的一种或多种,熟悉汇编优化和移动端GPU优化,有多类模型的优化经验者优先
4. 有扎实的编程基础、良好的编程风格和工作习惯,实际动手能力强,具有ACMICPC, NOI/IOI比赛获奖者优先
5. 有良好的沟通表达能力和团队精神,有很好的通过技术解决真实问题创造业务价值的意愿
业务介绍
小红书智创技术团队负责用户发布工具、增长&商业化业务等多个公司重要业务场景里的创作能力的支持,技术范围广,技术栈深,利用大模型进行了全面的升级,因而对大模型的训练和推理Infra有较高需求。
工作职责
1. 负责端侧的AI算法的部署和工程化落地,提升端侧的智能化水平,并通过端侧推理架构的优化,提升用户的使用体验。
2. 负责服务端的Diffusion、LLM、VLM、Omini模型等先进算法的部署和极致性能优化,提升推理效率,降低成本。
3. 负责Diffusion、VLM等大模型算法训练的框架优化及效率提升,提高算法迭代训练效率,降低成本。
4. 打造具有业界一流水平的大模型推理技术能力,并通过开源共建等各类形式,形成在业界的广泛技术影响力
任职要求:
1. 对各种AI算法有一定的了解,有丰富的算法工程集成,性能优化和落地经验
2. 熟悉CUDA编程、CUDNN,TensorRT等工具,有丰富的服务端性能优化经验者优先
3. 深入了解NCNN、MNN、TNN、TVM、VLLM框架中的一种或多种,熟悉汇编优化和移动端GPU优化,有多类模型的优化经验者优先
4. 有扎实的编程基础、良好的编程风格和工作习惯,实际动手能力强,具有ACMICPC, NOI/IOI比赛获奖者优先
5. 有良好的沟通表达能力和团队精神,有很好的通过技术解决真实问题创造业务价值的意愿
免责声明:
此信息由小红书官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“小红书官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!