腾讯(tencent)招聘元宝-大模型评测产品经理
招聘职位:
元宝-大模型评测产品经理 搜索同类职位
岗位职责:
1.自动评估体系建设:设计并搭建大模型自动评估体系,覆盖通用能力及专项能力(如推理、写作、语音、VLM 等);构建评测指标体系与自动化评测流程,推动评测体系标准化、模块化、可扩展化;
2.Benchmark 研究与落地:跟踪国内外前沿大模型评测方法与 Benchmark,研究其评测维度与自动化机制;复现与改造高质量评测集,结合业务场景定制评测任务,确保评测的真实性与可复现性;
3.模型效果分析与策略优化:定期对不同版本模型进行系统评测与对比,输出详细分析报告,识别模型优势与薄弱点;针对记忆、写作、语音、多模态(VLM)等专项能力,设计细粒度评测指标与分析策略,支撑模型迭代方向;
4.用户数据分析与体验优化:持续监测与分析真实用户交互数据,挖掘模型表现的 badcase 与典型问题;与算法及产品团队协作,将用户侧问题转化为可量化的评测指标与优化方案;建立用户体验反馈与评测体系联动机制,推动模型效果持续提升与体验闭环优化;
5.跨团队协作与产品规划:与算法、工程、产品团队紧密配合,定义评测需求与指标体系,推动自动评测体系在实际业务与模型研发中的落地,形成评测 → 分析 → 优化的完整闭环。
岗位要求:
1.本科及以上学历,计算机科学、人工智能、数据科学、语言学或相关专业优先;
2.熟悉 Python / LLM API / LangChain 流程,有独立搭建自动评估或数据分析管线经验;
3.有 benchmark 构建或论文发表经验(参与自动评估、评测集复现或指标体系设计)者优先;
4.熟悉 AI 搜索、对话评估、生成质量、语音、VLM 等领域评测或策略者优先;
5.具备 用户行为数据分析能力,能基于交互日志识别模型缺陷、抽象问题类型并制定优化方案;
6.能独立产出评测报告与用户体验分析文档,将技术评估结果转化为产品优化策略;
7.具备良好的英文论文阅读能力和跨团队沟通协调能力。
加分项:
1.参与或主导过自动评测体系 / 评测平台的设计与实现;
2.有用户研究、A/B 测试、模型体验优化项目经验;
3.具备科研背景,发表过 NLP / LLM / Evaluation 相关论文。
岗位介绍:
“用户为本,科技向善”,是写在每位腾讯产品人心中的一句箴言。在互联网浪潮中,大众的生活已被深刻地改变,如何为用户创造价值、创造怎样的价值,需要每位产品人花费更长时间去体会与探索。在这里,你将与同样关注细节、关注本质、关注美好的同事一道,开启你的创造性工作。
1.自动评估体系建设:设计并搭建大模型自动评估体系,覆盖通用能力及专项能力(如推理、写作、语音、VLM 等);构建评测指标体系与自动化评测流程,推动评测体系标准化、模块化、可扩展化;
2.Benchmark 研究与落地:跟踪国内外前沿大模型评测方法与 Benchmark,研究其评测维度与自动化机制;复现与改造高质量评测集,结合业务场景定制评测任务,确保评测的真实性与可复现性;
3.模型效果分析与策略优化:定期对不同版本模型进行系统评测与对比,输出详细分析报告,识别模型优势与薄弱点;针对记忆、写作、语音、多模态(VLM)等专项能力,设计细粒度评测指标与分析策略,支撑模型迭代方向;
4.用户数据分析与体验优化:持续监测与分析真实用户交互数据,挖掘模型表现的 badcase 与典型问题;与算法及产品团队协作,将用户侧问题转化为可量化的评测指标与优化方案;建立用户体验反馈与评测体系联动机制,推动模型效果持续提升与体验闭环优化;
5.跨团队协作与产品规划:与算法、工程、产品团队紧密配合,定义评测需求与指标体系,推动自动评测体系在实际业务与模型研发中的落地,形成评测 → 分析 → 优化的完整闭环。
岗位要求:
1.本科及以上学历,计算机科学、人工智能、数据科学、语言学或相关专业优先;
2.熟悉 Python / LLM API / LangChain 流程,有独立搭建自动评估或数据分析管线经验;
3.有 benchmark 构建或论文发表经验(参与自动评估、评测集复现或指标体系设计)者优先;
4.熟悉 AI 搜索、对话评估、生成质量、语音、VLM 等领域评测或策略者优先;
5.具备 用户行为数据分析能力,能基于交互日志识别模型缺陷、抽象问题类型并制定优化方案;
6.能独立产出评测报告与用户体验分析文档,将技术评估结果转化为产品优化策略;
7.具备良好的英文论文阅读能力和跨团队沟通协调能力。
加分项:
1.参与或主导过自动评测体系 / 评测平台的设计与实现;
2.有用户研究、A/B 测试、模型体验优化项目经验;
3.具备科研背景,发表过 NLP / LLM / Evaluation 相关论文。
岗位介绍:
“用户为本,科技向善”,是写在每位腾讯产品人心中的一句箴言。在互联网浪潮中,大众的生活已被深刻地改变,如何为用户创造价值、创造怎样的价值,需要每位产品人花费更长时间去体会与探索。在这里,你将与同样关注细节、关注本质、关注美好的同事一道,开启你的创造性工作。
免责声明:
此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!