腾讯招聘混元大语言模型算法工程师-大模型推理能力方向-深圳/北京
招聘职位:
混元大语言模型算法工程师-大模型推理能力方向-深圳/北京 搜索同类职位
岗位职责:
1.负责大语言模型(LLM)规划、推理、反思能力的研究,提升大语言模型的高阶推理能力;
2.跟进推理领域的前沿技术,将其应用于混元大模型基座,持续提升大模型的推理能力。
岗位要求:
1.有过大模型代码/数学/reasoning方向的研发经历;
2.在post-training方向有一定研究基础,熟悉SFT/DPO/PPO/Reward Model等pipeline;
3.较强的工程实现能力,熟练使用Python语言,有实际编程项目经验,熟悉DeepSpeed、Megatron等分布式训练框架,熟练使用pytorch深度学习框架;
4.计算机科学、机器学习、统计学、应用数学等相关专业在校硕士、博士生;
5.在高水平国际会议和学术期刊发表过相关论文,或有高水平竞赛获奖经历优先。
部门介绍:
机器学习平台部负责腾讯“太极”机器学习平台的建设,构建面向搜索、广告、推荐的稀疏大模型、大语言模型及稠密大模型和通用机器学习的平台能力,为腾讯广告,微信搜索、社交、游戏、金融、云等多个业务提供易用、高效的一站式机器学习平台服务。我们的技术包括但不限于预训练大模型框架、高性能参数服务器、CPU/GPU 训练和推理加速、图神经网络、NLP自然语言处理、搜索工程与算法等。
1.负责大语言模型(LLM)规划、推理、反思能力的研究,提升大语言模型的高阶推理能力;
2.跟进推理领域的前沿技术,将其应用于混元大模型基座,持续提升大模型的推理能力。
岗位要求:
1.有过大模型代码/数学/reasoning方向的研发经历;
2.在post-training方向有一定研究基础,熟悉SFT/DPO/PPO/Reward Model等pipeline;
3.较强的工程实现能力,熟练使用Python语言,有实际编程项目经验,熟悉DeepSpeed、Megatron等分布式训练框架,熟练使用pytorch深度学习框架;
4.计算机科学、机器学习、统计学、应用数学等相关专业在校硕士、博士生;
5.在高水平国际会议和学术期刊发表过相关论文,或有高水平竞赛获奖经历优先。
部门介绍:
机器学习平台部负责腾讯“太极”机器学习平台的建设,构建面向搜索、广告、推荐的稀疏大模型、大语言模型及稠密大模型和通用机器学习的平台能力,为腾讯广告,微信搜索、社交、游戏、金融、云等多个业务提供易用、高效的一站式机器学习平台服务。我们的技术包括但不限于预训练大模型框架、高性能参数服务器、CPU/GPU 训练和推理加速、图神经网络、NLP自然语言处理、搜索工程与算法等。
免责声明:
此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!