小红书(xiaohongshu)招聘【Dots】多模posttrain算法研究员-Reasoning
招聘职位:
【Dots】多模posttrain算法研究员-Reasoning 搜索同类职位
岗位职责:
探索 RL Scaling Law,提升模型 general 的真实推理与反思能力(而非仅在特定任务或 Benchmark 上的表现)
在人类智能密度最高的领域(如顶尖数学、竞赛编程、前沿科学等)持续突破,向达到乃至超过人类顶尖水平的方向迈进。
推动推理与工具使用、真实环境的结合,并提升模型思考效率及 adaptive thinking 的能力。
任职要求:
任职资格
1、扎实的机器学习与多模态基础:具备扎实的机器学习与深度学习基础,熟练使用至少一种主流深度学习框架(如 PyTorch、JAX、TensorFlow 等),并在生成模型或多模态模型中有较深入的实践经验。
2、生成模型 / 对齐方向相关经验:对监督学习、强化学习、偏好学习、表示学习等方法有深入理解;在图像生成、图像编辑、多模态理解或相关方向中,有过模型训练、对齐或系统优化的实际经验。
3、优秀的实验设计与问题拆解能力:能够从复杂生成现象中抽象问题、设计实验、分析结果并提出可执行的改进方案;对模型行为有敏锐的直觉,同时具备严谨的工程与研究能力。
加分项
1、在顶级学术会议(ICML、ICLR、NeurIPS、CVPR、ACL、AAAI 等)发表过与生成模型或多模态相关的研究成果
2、在 ACM/ICPC、NOI/IOI、Kaggle 等竞赛中取得优异成绩
3、参与过大规模图像生成 / 编辑模型的训练、对齐或评测项目
4、有 AI Alignment、Post-Training、Multi-Modal RL 或人类反馈建模相关经验
探索 RL Scaling Law,提升模型 general 的真实推理与反思能力(而非仅在特定任务或 Benchmark 上的表现)
在人类智能密度最高的领域(如顶尖数学、竞赛编程、前沿科学等)持续突破,向达到乃至超过人类顶尖水平的方向迈进。
推动推理与工具使用、真实环境的结合,并提升模型思考效率及 adaptive thinking 的能力。
任职要求:
任职资格
1、扎实的机器学习与多模态基础:具备扎实的机器学习与深度学习基础,熟练使用至少一种主流深度学习框架(如 PyTorch、JAX、TensorFlow 等),并在生成模型或多模态模型中有较深入的实践经验。
2、生成模型 / 对齐方向相关经验:对监督学习、强化学习、偏好学习、表示学习等方法有深入理解;在图像生成、图像编辑、多模态理解或相关方向中,有过模型训练、对齐或系统优化的实际经验。
3、优秀的实验设计与问题拆解能力:能够从复杂生成现象中抽象问题、设计实验、分析结果并提出可执行的改进方案;对模型行为有敏锐的直觉,同时具备严谨的工程与研究能力。
加分项
1、在顶级学术会议(ICML、ICLR、NeurIPS、CVPR、ACL、AAAI 等)发表过与生成模型或多模态相关的研究成果
2、在 ACM/ICPC、NOI/IOI、Kaggle 等竞赛中取得优异成绩
3、参与过大规模图像生成 / 编辑模型的训练、对齐或评测项目
4、有 AI Alignment、Post-Training、Multi-Modal RL 或人类反馈建模相关经验
免责声明:
此信息由小红书官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“小红书官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!