查看更多分享

小红书(xiaohongshu)招聘【hi lab】大模型算法工程师-安全对齐

招聘职位:

【hi lab】大模型算法工程师-安全对齐 搜索同类职位
发布日期:
2026-01-20
工作地点:
职位类型:
全职
职位类别:
大模型
来源:
小红书官网
岗位职责:
1、利用多种 alignment 技术,提升模型的内生安全能力
2、通过 Red Teaming 等机制,评估、发现多模态大模型潜在的安全问题及被恶意误用的风险;
3、通过 SFT、RLHF、对抗训练等方法,提升模型的对齐程度,使其能更好地被用于产品、服务人类;
4、探索 Agent 场景下模型具备执行代码、使用工具时,确保模型能忠实执行人类指令不被恶意使用的算法及系统策略;
5、与跨职能团队协作,以确保我们的产品符合最高安全标准;
任职要求:
1. 具备扎实的机器学习基础,能熟练使用至少一种深度学习框架(e.g. PyTorch、Jax、TensorFlow、MindSpore、PaddlePaddle)。
2. 对监督学习、强化学习、表示学习等机器学习方法有深入理解并具备相关的实践经验。
3. 在 NLP/CV/RL 等至少一个 AI 领域中有过深入的研究经历,或通过机器学习算法解决过复杂业务场景问题。
4. 具备卓越的实验分析与问题解决能力,有创新思维,能够良好沟通、与团队成员高效协作。

加分项:
1、对构建安全、普遍受益的 AGI 的使命感到兴奋,对人工智能安全有热情的优先;
2、具备 AI 安全的相关经验,特别是在 RLHF、对抗性训练、机器学习公平性、内容安全等领域的优先;
3、喜欢协作工作环境的团队合作者的优先;
免责声明:

此信息由小红书官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“小红书官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!

FAQ 小红书(xiaohongshu)招聘常见问答

小红书(xiaohongshu)招聘工作地点:
北京市,上海市
小红书(xiaohongshu)招聘经验要求:
three_to_five_year