美团(meituan)招聘LongCat - 预训练算法研究员
招聘职位:
LongCat - 预训练算法研究员 搜索同类职位
部门介绍:
基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。
在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。
在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。
真诚地邀请你,和我们一起驱动技术发展,创造行业价值。
岗位职责:
简介:探索下一代大模型训练范式,从模型结构、训练策略、数据策略、算力利用率等角度切入,打造具有更强能力和更高潜力的基座模型。
1、设计更高效的模型结构,提高给定数据量、计算量、硬件资源、序列长度等约束下的模型能力和潜力,如长序列能力、记忆能力、推理能力等。
2、探索更科学的训练策略,对影响training dynamic的关键变量(如学习率、batchsize、初始化等)形成更科学的认知。探索更前沿的训练范式(如diffusion LLM,test-time scaling等具有潜力的技术),发现更高效和稳定的scaling路径。
3、研究模型结构和数据的耦合关系,优化分阶段训练范式。研究模型早期表现和能力上限之间的关系。
4、结合MLsys解决大规模训练和推理中遇到的卡点问题,实现算法和工程联合设计。
任职要求:
1、熟悉NLP、LLM、MLsys、Optimization、OR、Control、RL等相关领域,对其中一个或多个方向有深入的研究经历,且有相关实际项目经验。
2、熟悉主流大模型技术
3、熟悉PyTorch、 Megatron、DeepSpeed 、vLLM、SGLang等主流开源训练和推理框架。
岗位亮点:
团队资源丰富,技术审美优秀,在MoE、原生多模、scaling law、self-play等技术方向都有较为前沿的探索经验。
基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。
在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。
在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。
真诚地邀请你,和我们一起驱动技术发展,创造行业价值。
岗位职责:
简介:探索下一代大模型训练范式,从模型结构、训练策略、数据策略、算力利用率等角度切入,打造具有更强能力和更高潜力的基座模型。
1、设计更高效的模型结构,提高给定数据量、计算量、硬件资源、序列长度等约束下的模型能力和潜力,如长序列能力、记忆能力、推理能力等。
2、探索更科学的训练策略,对影响training dynamic的关键变量(如学习率、batchsize、初始化等)形成更科学的认知。探索更前沿的训练范式(如diffusion LLM,test-time scaling等具有潜力的技术),发现更高效和稳定的scaling路径。
3、研究模型结构和数据的耦合关系,优化分阶段训练范式。研究模型早期表现和能力上限之间的关系。
4、结合MLsys解决大规模训练和推理中遇到的卡点问题,实现算法和工程联合设计。
任职要求:
1、熟悉NLP、LLM、MLsys、Optimization、OR、Control、RL等相关领域,对其中一个或多个方向有深入的研究经历,且有相关实际项目经验。
2、熟悉主流大模型技术
3、熟悉PyTorch、 Megatron、DeepSpeed 、vLLM、SGLang等主流开源训练和推理框架。
岗位亮点:
团队资源丰富,技术审美优秀,在MoE、原生多模、scaling law、self-play等技术方向都有较为前沿的探索经验。
免责声明:
此信息由美团官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“美团官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!