腾讯(tencent)招聘微信基础-大模型评测研发工程师
招聘职位:
微信基础-大模型评测研发工程师 搜索同类职位
岗位职责:
1.评测工具开发:设计并开发 AI Agent 评测工具和自动化评测流水线,支持对话质量、任务完成率、安全性等多维度评测;
2.评测模型开发:基于 LLM 构建自动评测模型(如 Model-as-Judge),实现对 Agent 输出质量的自动化打分与分析;
3.评测平台建设:参与评测平台的架构设计与开发,支持评测任务管理、数据管理、结果可视化等功能;
4.数据处理与分析:构建评测数据集,开发数据清洗、标注管理、统计分析等配套工具;
5.持续优化:跟踪业界前沿评测方法,持续优化评测效率和准确性。
岗位要求:
1.本科及以上学历,计算机科学、人工智能、软件工程等相关专业,3 年以上开发经验;
2.熟悉 Python/Nextjs,熟悉至少一门后端语言(Go/Java/C++),熟悉 Linux 环境及常用中间件(MySQL/Redis/消息队列等);
3.热衷于 AI 技术,具备极强的 AI Coding 能力;
4.具备 AI Agent / LLM 应用的评测或开发经验,熟悉主流 LLM 的 API 调用与 Prompt Engineering;
5.了解常见评测方法论(自动评测、人工评测、A/B Test、Model-as-Judge 等),有评测模型训练经验者优先;
6.具备良好的系统设计能力,有平台类产品或工具链开发经验;
7.有多模态模型或 ASR/TTS 系统评测经验者优先,熟悉 WER、MOS 等指标;
8.熟悉开源评测框架者优先;
9.良好的沟通协作能力,能与产品经理、算法工程师高效配合。
岗位介绍:
在腾讯,技术人解决问题的激情永不熄灭。无论是面对产品、程序的问题,还是生活与人的问题,腾讯技术人都力图交出漂亮的答卷。我们善用科学工具,以强大的思维之力创造世界,为卓越的产品体验保驾护航,也为公司和产品策略提出宝贵的洞见,用技术引领新的变革。这里的每位成员,既传承着长久以来的务实文化,又时刻以创新眼光瞄准大海星辰。我们十分期待你加入这样一个「技术社区」,分享团队能量,尽情发挥所长。
1.评测工具开发:设计并开发 AI Agent 评测工具和自动化评测流水线,支持对话质量、任务完成率、安全性等多维度评测;
2.评测模型开发:基于 LLM 构建自动评测模型(如 Model-as-Judge),实现对 Agent 输出质量的自动化打分与分析;
3.评测平台建设:参与评测平台的架构设计与开发,支持评测任务管理、数据管理、结果可视化等功能;
4.数据处理与分析:构建评测数据集,开发数据清洗、标注管理、统计分析等配套工具;
5.持续优化:跟踪业界前沿评测方法,持续优化评测效率和准确性。
岗位要求:
1.本科及以上学历,计算机科学、人工智能、软件工程等相关专业,3 年以上开发经验;
2.熟悉 Python/Nextjs,熟悉至少一门后端语言(Go/Java/C++),熟悉 Linux 环境及常用中间件(MySQL/Redis/消息队列等);
3.热衷于 AI 技术,具备极强的 AI Coding 能力;
4.具备 AI Agent / LLM 应用的评测或开发经验,熟悉主流 LLM 的 API 调用与 Prompt Engineering;
5.了解常见评测方法论(自动评测、人工评测、A/B Test、Model-as-Judge 等),有评测模型训练经验者优先;
6.具备良好的系统设计能力,有平台类产品或工具链开发经验;
7.有多模态模型或 ASR/TTS 系统评测经验者优先,熟悉 WER、MOS 等指标;
8.熟悉开源评测框架者优先;
9.良好的沟通协作能力,能与产品经理、算法工程师高效配合。
岗位介绍:
在腾讯,技术人解决问题的激情永不熄灭。无论是面对产品、程序的问题,还是生活与人的问题,腾讯技术人都力图交出漂亮的答卷。我们善用科学工具,以强大的思维之力创造世界,为卓越的产品体验保驾护航,也为公司和产品策略提出宝贵的洞见,用技术引领新的变革。这里的每位成员,既传承着长久以来的务实文化,又时刻以创新眼光瞄准大海星辰。我们十分期待你加入这样一个「技术社区」,分享团队能量,尽情发挥所长。
免责声明:
此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!