查看更多分享

腾讯(tencent)招聘混元Agent强化学习框架工程师（深圳/北京/上海）

招聘职位：

混元Agent强化学习框架工程师（深圳/北京/上海） 搜索同类职位

发布日期：: 2026-07-31
工作地点：: 北京
职位类型：: 全职
职位类别：: 技术
来源：: 腾讯官网

岗位职责：
1.参与 Research 场景下 Agent 框架的研发与维护，支持强化学习、数据生成、自动化评估和实验复现等业务需求；
2.统一封装模型调用、工具调用、任务执行、上下文管理、日志 Trace、结果收集和评估逻辑，沉淀稳定可复用的框架组件；
3.支持各类 Agent 策略及评估逻辑接入，维护相关接口、组件和验证机制；
4.优化框架易用性、稳定性和性能表现，解决实际运行中的并发、资源、链路和行为一致性问题，保障实验流程高效执行；
5.结合大模型训练视角，与算法团队共同推进新 Agent 范式、强化学习训练链路和评测方法的工程化落地。
岗位要求：
1.具备扎实的 Python 编程能力，熟悉异步编程（Asyncio）、并发处理和工程化最佳实践；
2.熟悉大模型与 Agent 相关应用技术，理解模型调用、工具调用、上下文管理、任务执行、日志 Trace 和结果评估等核心链路；
3.熟悉 Kubernetes 和容器化技术，具备在集群环境下进行开发、部署、排障或性能优化的经验；
4.了解大模型训练流程和基本原理，包括预训练、SFT、RLHF、强化学习训练或自动化评估中的至少一类；
5.具备良好的软件工程能力，重视模块化设计、测试、日志、性能和稳定性治理；
6.具备良好的问题分析及解决能力、沟通合作能力和 owner 意识，能高频承接算法团队需求并持续迭代。
加分项：
1.熟练使用 AI 编程工具，并理解其工作原理、适用边界和工程落地方式；
2.有 Agent 框架、AI Coding CLI、强化学习环境或评测框架经验；
3.有研发效能平台、Review / Debug / Monitor、实验结果分析、问题追踪或知识库工具建设经验；
4.具备跨语言协作能力，能借助 AI 工具阅读和维护 TypeScript / Rust / Go 代码。

前往官网投递

免责声明：

此信息由腾讯官网 (查看来源)审核并发布，我们转载该信息，仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台，不构成求职建议，不涉及任何职业中介服务，不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎，自行判断并承担相应风险，求职请认准企业官方渠道！

上一职位：小红书(xiaohongshu)商业化-行业PM专家（互联网）

下一职位：小红书存储云平台研发工程师-数据库智能化方向