饿了么(ele)招聘淘宝闪购-大模型算法专家-垂域大模型
招聘职位:
淘宝闪购-大模型算法专家-垂域大模型 搜索同类职位
职位描述:
1.参与系统的需求分析、架构设计与开发工作,确保算法模型的高效落地与业务目标的达成。
2.结合大语言模型(LLM)与强化学习(RL)技术,设计并实现智能化的文本生成模型,助力商家运营效率和服务质量的全面提升。
3.持续关注并研究强化学习领域的前沿技术动态,探索新方法与新思路,推动技术创新在实际业务中的落地应用。
任职要求:
1. 计算机、数学、统计、自动化等相关专业本科及以上学历,2年以上深度学习算法研究与开发经验,具备LLM&RL开发和实际落地经验。
2. 了解并实践Post-Training流程,基于此了解业界各大公司不同的变换训练方式(Kimi K1.5 DeepSeek-R1)。
3. 在RL领域拥有相关从业经验,包括LLM结合的方法,RM、PPO、DPO、ORPO、GRPO等,也可以在其他领域内的方法,MBRL,DDPG,DDQN等。
4. 在LLM&NLP领域拥有相关从业经验,包括但不限于LLM训练(CPT、SFT)、文本分类、信息抽取、搜索算法等。
5. 扎实的机器学习、深度学习与自然语言处理理论基础,熟悉主流的BERT/Transformer/ViT/CLIP等预训练模型。
6. 具备较强的编程与算法实现能力,拥有Python开发经验,精通PyTorch等深度学习框架。
7. 具备优秀的逻辑思维能力、问题分析与解决能力,自驱力强,且具备出色的业务结果导向能力。
1.参与系统的需求分析、架构设计与开发工作,确保算法模型的高效落地与业务目标的达成。
2.结合大语言模型(LLM)与强化学习(RL)技术,设计并实现智能化的文本生成模型,助力商家运营效率和服务质量的全面提升。
3.持续关注并研究强化学习领域的前沿技术动态,探索新方法与新思路,推动技术创新在实际业务中的落地应用。
任职要求:
1. 计算机、数学、统计、自动化等相关专业本科及以上学历,2年以上深度学习算法研究与开发经验,具备LLM&RL开发和实际落地经验。
2. 了解并实践Post-Training流程,基于此了解业界各大公司不同的变换训练方式(Kimi K1.5 DeepSeek-R1)。
3. 在RL领域拥有相关从业经验,包括LLM结合的方法,RM、PPO、DPO、ORPO、GRPO等,也可以在其他领域内的方法,MBRL,DDPG,DDQN等。
4. 在LLM&NLP领域拥有相关从业经验,包括但不限于LLM训练(CPT、SFT)、文本分类、信息抽取、搜索算法等。
5. 扎实的机器学习、深度学习与自然语言处理理论基础,熟悉主流的BERT/Transformer/ViT/CLIP等预训练模型。
6. 具备较强的编程与算法实现能力,拥有Python开发经验,精通PyTorch等深度学习框架。
7. 具备优秀的逻辑思维能力、问题分析与解决能力,自驱力强,且具备出色的业务结果导向能力。
免责声明:
此信息由饿了么(ele) (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“饿了么(ele)”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!