腾讯(tencent)招聘微信-基座大模型后训练算法专家
招聘职位:
微信-基座大模型后训练算法专家 搜索同类职位
岗位职责:
1.基座大模型(LLM)推理能力和通用能力的核心技术研发,包括数学推理、代码、逻辑推理、知识推理、创作、多轮对话、问答、翻译等任务的算法研发、优化,突破模型智力上限;
2.提升基座大模型在复杂场景的高阶处理能力,如多轮交互(复杂指令遵循、多轮对话、角色扮演等)、Agent 能力( 融合“思考模式”与“非思考模式”,实现自主、精准的函数与工具调用);
3.跟踪前沿技术,参与前沿算法研究,如研发更高效的强化学习(RL)训练算法、探索自适应思考深度的模型优化算法、探索提升思维链的 “智能密度” 的方法等,推动研究成果在业务场景的落地应用;
4.对于探索前沿技术有很好的热情,具备独立探索前沿技术的能力,有良好的团队协作和沟通能力。
岗位要求:
1.计算机科学、数学、人工智能等相关专业硕士及以上学历;
2.具备良好的数理基础和 NLP 技术基础,能够熟练使用 Megatron,HuggingFace,DeepSpeed,PyTorch 等框架至少一种,深入理解 Transformer、GPT 等模型架构;
3.在 Post-training 方向有一定研究基础,熟悉 SFT/DPO/PPO/GRPO/Reward Model 等;
4.具备良好的分析和解决问题的能力,针对具体的应用场景能合理设计和优化算法并应用;
5.对于探索前沿技术有很好的热情,具备独立探索前沿技术的能力,有良好的团队协作和沟通能力。
加分项:
1.主导过推理任务优化项目(如数学、编程、逻辑问答),在权威推理评测中取得过显著效果提升;
2.以第一作者身份发表过 NeurIPS、ICML、ICLR、ACL、EMNLP、NAACL 等论文;
3.了解 GPU 硬件架构,有 CUDA 编程经验,熟悉各种网络底层算子实现细节。
1.基座大模型(LLM)推理能力和通用能力的核心技术研发,包括数学推理、代码、逻辑推理、知识推理、创作、多轮对话、问答、翻译等任务的算法研发、优化,突破模型智力上限;
2.提升基座大模型在复杂场景的高阶处理能力,如多轮交互(复杂指令遵循、多轮对话、角色扮演等)、Agent 能力( 融合“思考模式”与“非思考模式”,实现自主、精准的函数与工具调用);
3.跟踪前沿技术,参与前沿算法研究,如研发更高效的强化学习(RL)训练算法、探索自适应思考深度的模型优化算法、探索提升思维链的 “智能密度” 的方法等,推动研究成果在业务场景的落地应用;
4.对于探索前沿技术有很好的热情,具备独立探索前沿技术的能力,有良好的团队协作和沟通能力。
岗位要求:
1.计算机科学、数学、人工智能等相关专业硕士及以上学历;
2.具备良好的数理基础和 NLP 技术基础,能够熟练使用 Megatron,HuggingFace,DeepSpeed,PyTorch 等框架至少一种,深入理解 Transformer、GPT 等模型架构;
3.在 Post-training 方向有一定研究基础,熟悉 SFT/DPO/PPO/GRPO/Reward Model 等;
4.具备良好的分析和解决问题的能力,针对具体的应用场景能合理设计和优化算法并应用;
5.对于探索前沿技术有很好的热情,具备独立探索前沿技术的能力,有良好的团队协作和沟通能力。
加分项:
1.主导过推理任务优化项目(如数学、编程、逻辑问答),在权威推理评测中取得过显著效果提升;
2.以第一作者身份发表过 NeurIPS、ICML、ICLR、ACL、EMNLP、NAACL 等论文;
3.了解 GPU 硬件架构,有 CUDA 编程经验,熟悉各种网络底层算子实现细节。
免责声明:
此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!