小红书(xiaohongshu)招聘【Dots】多模posttrain算法研究员-Reasoning

招聘职位：

【Dots】多模posttrain算法研究员-Reasoning 搜索同类职位

发布日期：: 2026-06-10
工作地点：: 北京市
上海市
杭州市
职位类型：: 全职
职位类别：: 大模型
来源：: 小红书官网

岗位职责：
探索 RL Scaling Law,提升模型 general 的真实推理与反思能力(而非仅在特定任务或 Benchmark 上的表现)
在人类智能密度最高的领域(如顶尖数学、竞赛编程、前沿科学等)持续突破,向达到乃至超过人类顶尖水平的方向迈进。
推动推理与工具使用、真实环境的结合，并提升模型思考效率及 adaptive thinking 的能力。
任职要求：
任职资格
1、扎实的机器学习与多模态基础：具备扎实的机器学习与深度学习基础，熟练使用至少一种主流深度学习框架（如 PyTorch、JAX、TensorFlow 等），并在生成模型或多模态模型中有较深入的实践经验。
2、生成模型 / 对齐方向相关经验：对监督学习、强化学习、偏好学习、表示学习等方法有深入理解；在图像生成、图像编辑、多模态理解或相关方向中，有过模型训练、对齐或系统优化的实际经验。
3、优秀的实验设计与问题拆解能力：能够从复杂生成现象中抽象问题、设计实验、分析结果并提出可执行的改进方案；对模型行为有敏锐的直觉，同时具备严谨的工程与研究能力。

加分项
1、在顶级学术会议（ICML、ICLR、NeurIPS、CVPR、ACL、AAAI 等）发表过与生成模型或多模态相关的研究成果
2、在 ACM/ICPC、NOI/IOI、Kaggle 等竞赛中取得优异成绩
3、参与过大规模图像生成 / 编辑模型的训练、对齐或评测项目
4、有 AI Alignment、Post-Training、Multi-Modal RL 或人类反馈建模相关经验

前往官网投递

免责声明：

此信息由小红书官网 (查看来源)审核并发布，我们转载该信息，仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“小红书官网”负责。我们作为信息转载平台，不构成求职建议，不涉及任何职业中介服务，不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎，自行判断并承担相应风险，求职请认准企业官方渠道！

上一职位：腾讯(tencent)腾讯云大数据基础产品-Data+AI研发工程师

下一职位：美团(meituan)商城运营

小红书(xiaohongshu)招聘【Dots】多模posttrain算法研究员-Reasoning

招聘职位：

FAQ 小红书(xiaohongshu)招聘常见问答

牛大妈找到相似职位