腾讯(tencent)招聘混元Agent评测Infra工程专家(北京/上海/深圳)
招聘职位:
混元Agent评测Infra工程专家(北京/上海/深圳) 搜索同类职位
岗位职责:
1.主导 Agent Benchmark 的平台化落地:负责 SWE、Terminal、Claw、MCP 等多类 Agent Benchmark 在评测平台上的整体接入与工程化,沉淀标准化、可复用的接入能力;
2.构建评测运行底座:统筹沙盒环境、依赖管理、网络访问、并发调度等关键能力建设,保障大规模评测在生产环境下的稳定、可复现与高效运行;
3.保障评测质量与可观测性:从 Harness 与打分逻辑出发,确保平台化改造后评测结果的准确可信,并建立完善的诊断与问题归因能力;
4.衔接算法与工程:深入理解各 Benchmark 所考察的模型能力维度,作为算法与平台之间的技术桥梁,推动评测需求高质量落地。
岗位要求:
1.计算机相关专业本科及以上学历,3年及以上后端 / 平台 / Infra 研发经验;
2.精通至少一门主流后端语言(Python / Go / Java 等),主导过中大型平台或系统的设计与落地,具备优秀的系统设计与工程实现能力;
3.熟悉容器化与沙盒隔离、分布式系统、任务调度与并发控制,有大规模任务编排或性能优化经验;熟悉网络通信与代理机制,能处理外部接口访问与稳定性问题;
4.了解大模型与 Agent 的基本原理,熟悉主流 Agent Benchmark(如 SWE-bench、Terminal-Bench、MCP 相关评测等)的 Harness 与打分逻辑,并据此进行工程化抽象,能与算法团队就模型能力与评测指标深度对话;
5.具备丰富的跨团队协作经验,能在算法、平台、底层基础设施等多方之间有效拉通与推进;具备较强的技术主导力与 Owner 意识,面对复杂不确定问题有冲劲、能扛事、能落地。
1.主导 Agent Benchmark 的平台化落地:负责 SWE、Terminal、Claw、MCP 等多类 Agent Benchmark 在评测平台上的整体接入与工程化,沉淀标准化、可复用的接入能力;
2.构建评测运行底座:统筹沙盒环境、依赖管理、网络访问、并发调度等关键能力建设,保障大规模评测在生产环境下的稳定、可复现与高效运行;
3.保障评测质量与可观测性:从 Harness 与打分逻辑出发,确保平台化改造后评测结果的准确可信,并建立完善的诊断与问题归因能力;
4.衔接算法与工程:深入理解各 Benchmark 所考察的模型能力维度,作为算法与平台之间的技术桥梁,推动评测需求高质量落地。
岗位要求:
1.计算机相关专业本科及以上学历,3年及以上后端 / 平台 / Infra 研发经验;
2.精通至少一门主流后端语言(Python / Go / Java 等),主导过中大型平台或系统的设计与落地,具备优秀的系统设计与工程实现能力;
3.熟悉容器化与沙盒隔离、分布式系统、任务调度与并发控制,有大规模任务编排或性能优化经验;熟悉网络通信与代理机制,能处理外部接口访问与稳定性问题;
4.了解大模型与 Agent 的基本原理,熟悉主流 Agent Benchmark(如 SWE-bench、Terminal-Bench、MCP 相关评测等)的 Harness 与打分逻辑,并据此进行工程化抽象,能与算法团队就模型能力与评测指标深度对话;
5.具备丰富的跨团队协作经验,能在算法、平台、底层基础设施等多方之间有效拉通与推进;具备较强的技术主导力与 Owner 意识,面对复杂不确定问题有冲劲、能扛事、能落地。
免责声明:
此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!