小红书(xiaohongshu)招聘算法引擎优化工程师-搜广推业务
招聘职位:
算法引擎优化工程师-搜广推业务 搜索同类职位
岗位职责:
1. 负责算法侧各类模型的高效部署调用和性能优化,包括但不限于Diffusion、LLM、VLLM等,提升推理效率,降低大模型应用成本;
2. 负责商业AI算法服务的部署,与投放平台、检索侧的工程化对接,搭建稳定可扩展的算法工程框架,承接所有算法服务;
3. 设计和优化推理架构,确保算法服务的高可用性、稳定性和效率,建立完善的监控告警和故障恢复机制;
4. 打造具有业界一流水平的大模型推理技术能力,并通过开源共建等各类形式,形成在业界的广泛技术影响力。
任职要求:
1. 精通Java/Python,对各种AI算法有一定的了解,有丰富的算法工程集成,并有大模型部署、性能优化和落地经验;
2. 有搜广推相关场景经验,对搜广推任意架构有一定的了解;
3. 深入了解transformers、vllm、sglang、tensorrt框架中的一种或多种,有多类模型的优化经验者优先;
4. 有扎实的编程基础、良好的编程风格和工作习惯,实际动手能力强;
5. 有良好的沟通表达能力和团队精神,有很好的通过技术解决真实问题创造业务价值的意愿。
加分项:
1. 熟悉CUDA编程、CUDNN、TensorRT等工具者优先;
2. 具有ACMICPC、NOI/IOI比赛获奖者优先。
1. 负责算法侧各类模型的高效部署调用和性能优化,包括但不限于Diffusion、LLM、VLLM等,提升推理效率,降低大模型应用成本;
2. 负责商业AI算法服务的部署,与投放平台、检索侧的工程化对接,搭建稳定可扩展的算法工程框架,承接所有算法服务;
3. 设计和优化推理架构,确保算法服务的高可用性、稳定性和效率,建立完善的监控告警和故障恢复机制;
4. 打造具有业界一流水平的大模型推理技术能力,并通过开源共建等各类形式,形成在业界的广泛技术影响力。
任职要求:
1. 精通Java/Python,对各种AI算法有一定的了解,有丰富的算法工程集成,并有大模型部署、性能优化和落地经验;
2. 有搜广推相关场景经验,对搜广推任意架构有一定的了解;
3. 深入了解transformers、vllm、sglang、tensorrt框架中的一种或多种,有多类模型的优化经验者优先;
4. 有扎实的编程基础、良好的编程风格和工作习惯,实际动手能力强;
5. 有良好的沟通表达能力和团队精神,有很好的通过技术解决真实问题创造业务价值的意愿。
加分项:
1. 熟悉CUDA编程、CUDNN、TensorRT等工具者优先;
2. 具有ACMICPC、NOI/IOI比赛获奖者优先。
免责声明:
此信息由小红书官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“小红书官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!