腾讯(tencent)招聘混元数据算法工程师(Agent 数据质检方向)
招聘职位:
混元数据算法工程师(Agent 数据质检方向) 搜索同类职位
岗位职责:
1.理解并检验"什么是好的 Agent 数据":针对 Agent 场景特有的多轮交互、长链路规划、工具调用与环境反馈特性,把模型能力目标操作化为可执行的数据质量标准与标注规范(rubric、验收准则、轨迹合理性定义),并建设配套的自动化质检体系——识别诸如"在失败策略上反复循环而不切换""工具调用参数凭空构造而非基于环境反馈""规划与实际执行脱节"等深层轨迹缺陷;
2.人机协同的质量流程设计:设计并落地人机协同的数据质量流程——用模型做预标注/预筛、人工聚焦高价值判断与校正、auto-QA 兜底一致性,在保证质量标准的前提下提升轨迹质检与标注的规模化效率;
3.前沿跟踪与能力沉淀,跟踪支撑 Agent 能力提升的前沿方法(轨迹质量评估、Agent 评测方法、可验证 reward 设计等),将其转化为质检与评测能力;并把这套数据质量判断力沉淀、共享给协作的模型团队。
岗位要求:
1.计算机科学、人工智能或相关专业本科及以上学历;
2.对数据有深度好奇与痴迷:着迷于理解数据的结构、质量与选择如何影响 LLM 的表现,能从繁杂的交互轨迹与日志中洞察模型能力的边界,而不只是处理数据;
3.理解大模型,具备数据判断力:理解 Transformer 架构与大语言模型训练原理,具备 Agent / 大模型数据 / 评测的实战经验,对"什么样的数据会真正影响模型能力"有深入判断;
4.深入实践过前沿 Agent 推理框架,能深度剖析 Agent 运行轨迹,对其思维链质量、工具调用鲁棒性、环境反馈准确性有系统性理解;
5.熟练掌握 Python,善于利用 Cursor、Claude Code 等 AI 辅助工具提升质检与分析效率;
6.在前沿会议(NeurIPS、ICLR、ICML、ACL 等)有高质量论文发表,或在开源社区(评测基准、数据集、Agent 框架等)有高影响力贡献者优先;
7.具备强烈的技术热情和自驱力,拥有优秀的跨团队(模型、评测、平台)协作与沟通能力,认同"数据质量判断力本身是一种前沿能力"。
1.理解并检验"什么是好的 Agent 数据":针对 Agent 场景特有的多轮交互、长链路规划、工具调用与环境反馈特性,把模型能力目标操作化为可执行的数据质量标准与标注规范(rubric、验收准则、轨迹合理性定义),并建设配套的自动化质检体系——识别诸如"在失败策略上反复循环而不切换""工具调用参数凭空构造而非基于环境反馈""规划与实际执行脱节"等深层轨迹缺陷;
2.人机协同的质量流程设计:设计并落地人机协同的数据质量流程——用模型做预标注/预筛、人工聚焦高价值判断与校正、auto-QA 兜底一致性,在保证质量标准的前提下提升轨迹质检与标注的规模化效率;
3.前沿跟踪与能力沉淀,跟踪支撑 Agent 能力提升的前沿方法(轨迹质量评估、Agent 评测方法、可验证 reward 设计等),将其转化为质检与评测能力;并把这套数据质量判断力沉淀、共享给协作的模型团队。
岗位要求:
1.计算机科学、人工智能或相关专业本科及以上学历;
2.对数据有深度好奇与痴迷:着迷于理解数据的结构、质量与选择如何影响 LLM 的表现,能从繁杂的交互轨迹与日志中洞察模型能力的边界,而不只是处理数据;
3.理解大模型,具备数据判断力:理解 Transformer 架构与大语言模型训练原理,具备 Agent / 大模型数据 / 评测的实战经验,对"什么样的数据会真正影响模型能力"有深入判断;
4.深入实践过前沿 Agent 推理框架,能深度剖析 Agent 运行轨迹,对其思维链质量、工具调用鲁棒性、环境反馈准确性有系统性理解;
5.熟练掌握 Python,善于利用 Cursor、Claude Code 等 AI 辅助工具提升质检与分析效率;
6.在前沿会议(NeurIPS、ICLR、ICML、ACL 等)有高质量论文发表,或在开源社区(评测基准、数据集、Agent 框架等)有高影响力贡献者优先;
7.具备强烈的技术热情和自驱力,拥有优秀的跨团队(模型、评测、平台)协作与沟通能力,认同"数据质量判断力本身是一种前沿能力"。
免责声明:
此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!