腾讯(tencent)招聘微信读书/输入法/秒剪-大模型评测算法工程师-Agent方向
招聘职位:
微信读书/输入法/秒剪-大模型评测算法工程师-Agent方向 搜索同类职位
岗位职责:
1.评测体系建设:负责大语言模型(LLM)及多模态模型(语音/视频/图片)的评测体系设计与搭建;
2.评测方案设计与执行: 构建自动化、可扩展的评测工具链,支持模型快速迭代验证。探索前沿评测方法,包括但不限于 LLM-as-a-Judge、动态评测、Arena 对战、复杂推理评估等;
3.模型能力诊断与优化协同:通过量化分析定位模型短板,与算法团队紧密协作,推动模型能力持续提升。
岗位要求:
1.计算机科学、人工智能、数学、统计学等相关专业硕士及以上学历;
2.精通 Python,熟悉 PyTorch/HuggingFace 生态。深入理解 Transformer 架构及大模型训练流程(预训练、SFT、RLHF/DPO);
3.熟悉主流评测框架(如 OpenCompass、lm-evaluation-harness、HF Evaluate 等)及常用指标(BLEU、ROUGE、Pass@k、ELO 等);
4.具备优秀的数据分析能力和系统化思维。良好的跨团队沟通协作能力,能清晰表达复杂评测结论。对 AI 评测方法论有热情,关注行业最新进展。
加分项:
1.有 OpenCompass、HELM、Chatbot Arena 等知名评测项目贡献经验;
2.有 Critic Model / Reward Model 训练经验;
3.有顶会论文(ACL/EMNLP/NeurIPS/ICLR 等)发表。
1.评测体系建设:负责大语言模型(LLM)及多模态模型(语音/视频/图片)的评测体系设计与搭建;
2.评测方案设计与执行: 构建自动化、可扩展的评测工具链,支持模型快速迭代验证。探索前沿评测方法,包括但不限于 LLM-as-a-Judge、动态评测、Arena 对战、复杂推理评估等;
3.模型能力诊断与优化协同:通过量化分析定位模型短板,与算法团队紧密协作,推动模型能力持续提升。
岗位要求:
1.计算机科学、人工智能、数学、统计学等相关专业硕士及以上学历;
2.精通 Python,熟悉 PyTorch/HuggingFace 生态。深入理解 Transformer 架构及大模型训练流程(预训练、SFT、RLHF/DPO);
3.熟悉主流评测框架(如 OpenCompass、lm-evaluation-harness、HF Evaluate 等)及常用指标(BLEU、ROUGE、Pass@k、ELO 等);
4.具备优秀的数据分析能力和系统化思维。良好的跨团队沟通协作能力,能清晰表达复杂评测结论。对 AI 评测方法论有热情,关注行业最新进展。
加分项:
1.有 OpenCompass、HELM、Chatbot Arena 等知名评测项目贡献经验;
2.有 Critic Model / Reward Model 训练经验;
3.有顶会论文(ACL/EMNLP/NeurIPS/ICLR 等)发表。
免责声明:
此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!