查看更多分享

小红书(xiaohongshu)招聘Dots-Posttrain算法工程师-General Agent

招聘职位：

Dots-Posttrain算法工程师-General Agent 搜索同类职位

发布日期：: 2026-05-18
工作地点：: 北京市
上海市
杭州市
职位类型：: 全职
职位类别：: 大模型
来源：: 小红书官网

岗位职责：
利用强化学习方法对多模态大模型进行对齐：
解决优化现有多模态大模型 RLHF 中的训练效果、稳定性、Reward Hacking 等问题；
探索 RL 阶段 computaiton scaling 对模型能力提升的方法；
研究 Multi-Agent、Long-term Objective、Scalable Oversight 等方向下基于强化学习的对齐方法；
基于前沿方法对幻觉、推理、工具使用、安全等场景问题进行针对性优化，提升大模型的应用价值。

任职要求：
1. 具备扎实的机器学习基础，能熟练使用至少一种深度学习框架（e.g. PyTorch、Jax、TensorFlow、MindSpore、PaddlePaddle）。
2. 对监督学习、强化学习、表示学习等机器学习方法有深入理解并具备相关的实践经验。
3. 在 NLP/CV/RL 等至少一个 AI 领域中有过深入的研究经历，或通过机器学习算法解决过复杂业务场景问题。
4. 具备卓越的实验分析与问题解决能力，有创新思维，能够良好沟通、与团队成员高效协作。

加分项：
1. 对大模型 RL 技术有极大热情
2. 有 ICML、ICLR、NeurIPS、ACL、CVPR、AAAI 等顶级学术会议发表过有影响力研究成果的优先。
3. 主导、参与过 AI 相关的有大影响力的开源/闭源项目的优先。
4. 有 AI Alignment 相关研究或大模型应用项目经历的优先。

前往官网投递

免责声明：

此信息由小红书官网 (查看来源)审核并发布，我们转载该信息，仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“小红书官网”负责。我们作为信息转载平台，不构成求职建议，不涉及任何职业中介服务，不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎，自行判断并承担相应风险，求职请认准企业官方渠道！

上一职位：美团(meituan)小象超市-大客户经理（团购）

下一职位：小红书AIGC 算法工程师（视频智能剪辑）-商业算法