小红书招聘基础大模型算法工程师- DLLM
招聘职位:
基础大模型算法工程师- DLLM 搜索同类职位
岗位职责:
1、探索新一代大语言模型基座架构,完成扩散模型(diffusion model)在大语言模型的重塑,突破逐个token预测的方式,实现高效的推理模式,探索全新scaling law;
2、实现大模型训练的数据清洗、合成和评估;设计和实现大模型训练的AI Infra框架。
任职要求:
1、本科及以上学历,计算机、人工智能和数学等相关专业,博士研究生优先;
2、熟练掌握扩散模型设计和使用技巧,在知名大模型公司/团队从事图像或视频生成者优先,有多模态/OMNI大模型理解&生成统一框架经验者优先;
3、有丰富的大模型预训练和后训练数据处理经验,熟练掌握数据收集、数据清洗、数据去重和数据合成等流程,能针对数据质量制定出评估指标和方法,在知名大模型公司/团队长期从事数据技术者优先;
4、MoE/Dense模型训练实战经验,包括模型预训练、RL Reasoning、SFT和RLHF等,熟练掌握各种模型训练和推理技巧,在大模型前沿技术领域有深度探索,发表过顶会论文、技术报告者优先;
5、熟悉大模型训练和推理框架,熟练掌握模型并行、数据并行和流水线设计等技巧,在知名大模型公司/团队长期从事AI Infra者优先;
6、熟悉各类评测基准和构造技巧,熟练掌握大模型客观评测和主观评测方法,在知名大模型公司/团队长期从事大模型评测者优先;
7、有良好代码能力,熟练掌握Python、C++和JAVA等编程技能,知名开源项目核心贡献者优先,ACM/ICPC竞赛获奖者优先,国内外知名数据挖掘比赛(例如KDD Cup等)中取得领先名次者优先。
1、探索新一代大语言模型基座架构,完成扩散模型(diffusion model)在大语言模型的重塑,突破逐个token预测的方式,实现高效的推理模式,探索全新scaling law;
2、实现大模型训练的数据清洗、合成和评估;设计和实现大模型训练的AI Infra框架。
任职要求:
1、本科及以上学历,计算机、人工智能和数学等相关专业,博士研究生优先;
2、熟练掌握扩散模型设计和使用技巧,在知名大模型公司/团队从事图像或视频生成者优先,有多模态/OMNI大模型理解&生成统一框架经验者优先;
3、有丰富的大模型预训练和后训练数据处理经验,熟练掌握数据收集、数据清洗、数据去重和数据合成等流程,能针对数据质量制定出评估指标和方法,在知名大模型公司/团队长期从事数据技术者优先;
4、MoE/Dense模型训练实战经验,包括模型预训练、RL Reasoning、SFT和RLHF等,熟练掌握各种模型训练和推理技巧,在大模型前沿技术领域有深度探索,发表过顶会论文、技术报告者优先;
5、熟悉大模型训练和推理框架,熟练掌握模型并行、数据并行和流水线设计等技巧,在知名大模型公司/团队长期从事AI Infra者优先;
6、熟悉各类评测基准和构造技巧,熟练掌握大模型客观评测和主观评测方法,在知名大模型公司/团队长期从事大模型评测者优先;
7、有良好代码能力,熟练掌握Python、C++和JAVA等编程技能,知名开源项目核心贡献者优先,ACM/ICPC竞赛获奖者优先,国内外知名数据挖掘比赛(例如KDD Cup等)中取得领先名次者优先。
免责声明:
此信息由小红书官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“小红书官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!