查看更多分享

小红书招聘Dots-多模态算法工程师-语音方向

招聘职位:

Dots-多模态算法工程师-语音方向 搜索同类职位
发布日期:
2026-06-19
工作地点:
职位类型:
全职
职位类别:
大模型
来源:
小红书官网
岗位职责:
在算力驱动的 AGI 和人文精神的烟火气交汇之处,我们真诚邀请对大模型 Omni Model 有热情的同学加入,共同打造更具影响力的智能系统。你会成为团队的一员,并和其他同事协作,共同研发 SOTA 的 Omni Model。期待你以务实和客观的科学态度来推进技术的进展,不被过往经验裹挟、不被主观偏好影响。期待你除了算法外仍然是为出色的工程师。期待你对技术有强烈的好奇心和开放心态。
区别于传统 ASR / TTS 级联技术,我们希望打造端到端的 Omni Model 在实时交互中释放大模型的智力水平,彻底改变以 Chatbot 文字为主的人机交互界面
岗位说明:你会负责围绕大模型 Omni Model 构建语音模态的相关研究工作,包括但不限于如下事项
海量的语音数据处理和构建:定性分析、定量评估数据质量,并给出 scalable 的改进方案;探索跨模态(文字/视觉/语音)混合训练的最佳实践;
探索更加高效且合理的模型架构,让模型更加理解音频,同时让模型具备更好的语音合成能力
研究并探索基于 Omni Model 的 Post Train,包含但不限于 SFT 和 RL


任职要求:
良好的 pytorch / python 技术栈,具备熟练的阅读代码和编写代码的能力。
在语音领域(包括但不限于 TTS/ASR)有深入和一线的实践经验,具备有深度的理解和认知;
科学的研发习惯;具备良好的问题定义能力;对细节敏感
免责声明:

此信息由小红书官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“小红书官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!