小红书招聘模型轻量化算法工程师
招聘职位:
模型轻量化算法工程师 搜索同类职位
岗位职责:
机器学习系统团队需要将传统或者新型的轻量化算法和工程有机结合起来进行加速,提高大语言模型训练或者推理性能的同时,通过算法手段尽可能降低效果损失。候选人将在以下几个方向进行深入探索和落地:
1、量化方向:负责但不限于大语言模型的低精度训练(FP8)、推理(W8A8KV8等)、低精度优化器(量化梯度、优化器状态、参数等)
2、高性能模型结构:大语言模型Finetune或者其他阶段的LoRA系列(熟悉各种变种),训练阶段的MQA/GQA系列等
3、稀疏化方向:大语言模型剪枝、稀疏、蒸馏、Sparse Attention等
4、新型方向:Medusa、超长文本、Speculative Sampling等
任职要求:
1、拥有上述一个或多个方向的实际落地经验,能独立从头到尾完成上述某个方向
2、熟练使用主流大规模训练或推理引擎开发,例如DeepSpeed/Megatron/Transformer Engine等
3、两年以上工作经验,工程能力较强者优先,拥有实际Cuda算子开发经验者优先
机器学习系统团队需要将传统或者新型的轻量化算法和工程有机结合起来进行加速,提高大语言模型训练或者推理性能的同时,通过算法手段尽可能降低效果损失。候选人将在以下几个方向进行深入探索和落地:
1、量化方向:负责但不限于大语言模型的低精度训练(FP8)、推理(W8A8KV8等)、低精度优化器(量化梯度、优化器状态、参数等)
2、高性能模型结构:大语言模型Finetune或者其他阶段的LoRA系列(熟悉各种变种),训练阶段的MQA/GQA系列等
3、稀疏化方向:大语言模型剪枝、稀疏、蒸馏、Sparse Attention等
4、新型方向:Medusa、超长文本、Speculative Sampling等
任职要求:
1、拥有上述一个或多个方向的实际落地经验,能独立从头到尾完成上述某个方向
2、熟练使用主流大规模训练或推理引擎开发,例如DeepSpeed/Megatron/Transformer Engine等
3、两年以上工作经验,工程能力较强者优先,拥有实际Cuda算子开发经验者优先
免责声明:
此信息由小红书官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“小红书官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!