腾讯(tencent)招聘企业微信-大模型训练工程师-AI Infra
招聘职位:
企业微信-大模型训练工程师-AI Infra 搜索同类职位
岗位职责:
1.post-training 框架研发,聚焦 LLM + RL 方向,设计框架架构与技术路线,提升其扩展性、稳定性与效率;
2.优化框架性能,如训练速度、显存占用等,降低训练成本,为 LLM + RL 训练提供有力技术支撑;
3.协同业务团队,将 LLM 能力在业务场景落地,根据业务需求定制训练方案并评估验证模型;
4.负责模型训练和推理所需的IaaS基础设施的规划、迭代与框架维护,致力于提供一致性、可扩展、高可靠的平台技术底座。
岗位要求:
1.计算机科学、数学、统计学、自动化等相关专业本科及以上学历,3年以上相关领域工作经验;
2.熟悉Post-Training流程,深入了解RL领域,包括但不限于RM、PPO、DPO、GRPO等算法;
3.具备大模型训练框架开发能力,包括pytorch、megatron等;
4.具备强化学习框架开发能力,包括openRLHF、verl等;
5.具备一线的C++/Python工程能力,精通数据结构和常用算法,掌握各种编译、调试、性能分析工具,熟悉并行编;(CUDA/Triton等)优先;
6.该岗位支持base成都、广州、北京。
岗位介绍:
在腾讯,后台开发工程师不仅是“又快又稳”的问题解决专家,更是生态共创者。你将与技术团队一同沉淀优质代码,让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段,你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神,同时欢迎你一起参与团队愿景、文化和产品方向的探讨。
1.post-training 框架研发,聚焦 LLM + RL 方向,设计框架架构与技术路线,提升其扩展性、稳定性与效率;
2.优化框架性能,如训练速度、显存占用等,降低训练成本,为 LLM + RL 训练提供有力技术支撑;
3.协同业务团队,将 LLM 能力在业务场景落地,根据业务需求定制训练方案并评估验证模型;
4.负责模型训练和推理所需的IaaS基础设施的规划、迭代与框架维护,致力于提供一致性、可扩展、高可靠的平台技术底座。
岗位要求:
1.计算机科学、数学、统计学、自动化等相关专业本科及以上学历,3年以上相关领域工作经验;
2.熟悉Post-Training流程,深入了解RL领域,包括但不限于RM、PPO、DPO、GRPO等算法;
3.具备大模型训练框架开发能力,包括pytorch、megatron等;
4.具备强化学习框架开发能力,包括openRLHF、verl等;
5.具备一线的C++/Python工程能力,精通数据结构和常用算法,掌握各种编译、调试、性能分析工具,熟悉并行编;(CUDA/Triton等)优先;
6.该岗位支持base成都、广州、北京。
岗位介绍:
在腾讯,后台开发工程师不仅是“又快又稳”的问题解决专家,更是生态共创者。你将与技术团队一同沉淀优质代码,让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段,你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神,同时欢迎你一起参与团队愿景、文化和产品方向的探讨。
免责声明:
此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!