腾讯(tencent)招聘混元多模态强化学习(RL)算法研究员(北京/上海)
招聘职位:
混元多模态强化学习(RL)算法研究员(北京/上海) 搜索同类职位
岗位职责:
1.针对多模态模型开展强化学习算法研究,包括面向图像、视频生成的扩散模型,面向多模态理解的自回归模型,以及前沿统一多模态框架;
2.设计并开发强化学习训练框架与奖励建模策略,实现高效的大规模训练,提升训练稳定性,并解决奖励作弊等相关问题;
3.探索下一代强化学习范式,使其能更直接、更高效地从环境反馈中学习。
岗位要求:
1.本科及以上学历,计算机科学或相关专业;
2.具备出色的科研能力,在ICML、NeurIPS、ICLR、CVPR、ICCV、ECCV、SIGGRAPH等顶级会议发表过论文;
3.扎实的工程与编程能力,具备深度学习系统实现、模型训练与推理优化、CPU/GPU 加速、分布式训练与推理经验;
4.有扩散模型、自回归模型、文生图 / 文生视频生成相关经验者优先;
5.有 ACM/NOIP(信息学竞赛)参赛经历者优先。
1.针对多模态模型开展强化学习算法研究,包括面向图像、视频生成的扩散模型,面向多模态理解的自回归模型,以及前沿统一多模态框架;
2.设计并开发强化学习训练框架与奖励建模策略,实现高效的大规模训练,提升训练稳定性,并解决奖励作弊等相关问题;
3.探索下一代强化学习范式,使其能更直接、更高效地从环境反馈中学习。
岗位要求:
1.本科及以上学历,计算机科学或相关专业;
2.具备出色的科研能力,在ICML、NeurIPS、ICLR、CVPR、ICCV、ECCV、SIGGRAPH等顶级会议发表过论文;
3.扎实的工程与编程能力,具备深度学习系统实现、模型训练与推理优化、CPU/GPU 加速、分布式训练与推理经验;
4.有扩散模型、自回归模型、文生图 / 文生视频生成相关经验者优先;
5.有 ACM/NOIP(信息学竞赛)参赛经历者优先。
免责声明:
此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!