美团(meituan)招聘LongCat - 大模型自进化与自动化研究智能体研究员
招聘职位:
LongCat - 大模型自进化与自动化研究智能体研究员 搜索同类职位
部门介绍:
基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。
在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。
在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。
真诚地邀请你,和我们一起驱动技术发展,创造行业价值。
岗位职责:
研发下一代自动化研究智能体系统,面向模型研发与高价值复杂研究任务,构建从问题发现、假设生成、实验执行到结果验证、经验沉淀、策略迭代的自进化闭环。提升模型在长周期任务中的自主规划和执行能力,减少对人工逐步指导的依赖,并将能力改进应用于模型训练与评测体系,形成持续迭代。
1. 自动化研究智能体能力建设
提升模型在复杂任务分解、长程推理、研究规划、工具使用、代码生成与执行、证据链整合、结果归因和研究报告生成中的闭环能力,面向真实模型研发任务验证效果。
2. 长程上下文、记忆与状态管理
设计 context scaling/compression、memory selection、任务状态追踪等机制,解决长周期任务中的一致性衰减、状态丢失和中断恢复问题。
3. 可验证研究环境与自动实验闭环
构建覆盖 search、browser、retrieval、code execution、training/eval job、sandbox 的交互式研究环境,将任务建模为可交互、可验证、可评分的闭环,支持自动实验编排、结果比对与版本回滚。
4. 训练策略与反馈信号设计
设计数据配方、环境反馈和 reward 信号体系,引导模型在事实正确性、工具调用可靠性和任务完成率上持续提升。
5. 评测体系与错误分析闭环
建设面向真实 research workflow 的 benchmark 与自动评测体系。系统性分析 Agent 的典型失败模式,针对性反哺到训练策略和 harness 优化。
6. 研究经验沉淀与策略自进化
将成功/失败任务轨迹沉淀为 research episode、skill 和 eval case 等可检索、可复用的自动研究策略库,支持 Agent 在后续任务中检索、复用和迭代。
任职要求:
1. 扎实的算法功底,熟悉自然语言处理和机器学习技术,对大模型和AGI有信仰;
2. 熟悉Python/Java等编程语言,动手能力强,ACM/ICPC、NOI/IOI等比赛获奖者优先;
3. 熟悉PyTorch/Megtron/Huggingface/Triton/vLLM/SGLang等框架并有实际项目经验;
4. 在领域内顶级会议或期刊发表过高水平论文,主导或参与过有影响力的开源项目,在权威评测或比赛中取得优秀名次者优先。
岗位亮点:
1. 团队扁平,人才密度高,在ICLR、NeurIPS、ICML、ACL等顶会累计发表论文50余篇,团队成员先后荣获EMNLP outstanding paper、吴文俊人工智能奖科技进步奖、CCF科技成果奖、北京市科技进步奖等荣誉激励;
2. 参与前沿强化学习技术探索,接触多智能体协同进化、模型自进化等创新方向;
3. 充足算力和数据资源保障,长期有耐心,专注核心技术突破。
基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。
在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。
在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。
真诚地邀请你,和我们一起驱动技术发展,创造行业价值。
岗位职责:
研发下一代自动化研究智能体系统,面向模型研发与高价值复杂研究任务,构建从问题发现、假设生成、实验执行到结果验证、经验沉淀、策略迭代的自进化闭环。提升模型在长周期任务中的自主规划和执行能力,减少对人工逐步指导的依赖,并将能力改进应用于模型训练与评测体系,形成持续迭代。
1. 自动化研究智能体能力建设
提升模型在复杂任务分解、长程推理、研究规划、工具使用、代码生成与执行、证据链整合、结果归因和研究报告生成中的闭环能力,面向真实模型研发任务验证效果。
2. 长程上下文、记忆与状态管理
设计 context scaling/compression、memory selection、任务状态追踪等机制,解决长周期任务中的一致性衰减、状态丢失和中断恢复问题。
3. 可验证研究环境与自动实验闭环
构建覆盖 search、browser、retrieval、code execution、training/eval job、sandbox 的交互式研究环境,将任务建模为可交互、可验证、可评分的闭环,支持自动实验编排、结果比对与版本回滚。
4. 训练策略与反馈信号设计
设计数据配方、环境反馈和 reward 信号体系,引导模型在事实正确性、工具调用可靠性和任务完成率上持续提升。
5. 评测体系与错误分析闭环
建设面向真实 research workflow 的 benchmark 与自动评测体系。系统性分析 Agent 的典型失败模式,针对性反哺到训练策略和 harness 优化。
6. 研究经验沉淀与策略自进化
将成功/失败任务轨迹沉淀为 research episode、skill 和 eval case 等可检索、可复用的自动研究策略库,支持 Agent 在后续任务中检索、复用和迭代。
任职要求:
1. 扎实的算法功底,熟悉自然语言处理和机器学习技术,对大模型和AGI有信仰;
2. 熟悉Python/Java等编程语言,动手能力强,ACM/ICPC、NOI/IOI等比赛获奖者优先;
3. 熟悉PyTorch/Megtron/Huggingface/Triton/vLLM/SGLang等框架并有实际项目经验;
4. 在领域内顶级会议或期刊发表过高水平论文,主导或参与过有影响力的开源项目,在权威评测或比赛中取得优秀名次者优先。
岗位亮点:
1. 团队扁平,人才密度高,在ICLR、NeurIPS、ICML、ACL等顶会累计发表论文50余篇,团队成员先后荣获EMNLP outstanding paper、吴文俊人工智能奖科技进步奖、CCF科技成果奖、北京市科技进步奖等荣誉激励;
2. 参与前沿强化学习技术探索,接触多智能体协同进化、模型自进化等创新方向;
3. 充足算力和数据资源保障,长期有耐心,专注核心技术突破。
免责声明:
此信息由美团官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“美团官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!