腾讯(tencent)招聘混元大模型语音算法工程师(北京/上海)
招聘职位:
混元大模型语音算法工程师(北京/上海) 搜索同类职位
岗位职责:
1.负责语音/音频大模型研发,包括语音对话(语音交互/音视频对话)、音频理解(ASR/音频caption)、音频生成(TTS/视频配音)等模型研发;
2.负责语音/音频大模型的预训练、后训练、强化学习(文本和音频强化)相关的数据和算法工作;
3.负责语音对话/音频理解/音频生成的模型开源以及产品落地(比如语音对话产品全链路端到端优化、音频理解在噪音/口音/远场/音效音乐场景的优化、语音合成在播报/闲聊/游戏/社交等场景的优化)。
岗位要求:
1.有语音对话、语音合成、语音识别、音视频多模态、大语言模型(预训练、微调、强化学习)等相关经验者优先;
2.优秀的代码能力、数据结构和算法功底,熟练掌握Python或C/C++,熟悉Pytorch/Megatron/DeepSpeed等模型训练框架,有ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先;
3.在相关顶级会议或期刊(如NeurIPS/ICLR/ICML/ACL/CVPR/ICASSP/INTERSPEECH等)有论文发表者优先;
4.具备扎实的数学和信号处理基础,良好的英语文献阅读能力,强烈的进取心/求知欲/团队合作精神,以及优秀的问题解决能力,热衷于追求技术创新。
1.负责语音/音频大模型研发,包括语音对话(语音交互/音视频对话)、音频理解(ASR/音频caption)、音频生成(TTS/视频配音)等模型研发;
2.负责语音/音频大模型的预训练、后训练、强化学习(文本和音频强化)相关的数据和算法工作;
3.负责语音对话/音频理解/音频生成的模型开源以及产品落地(比如语音对话产品全链路端到端优化、音频理解在噪音/口音/远场/音效音乐场景的优化、语音合成在播报/闲聊/游戏/社交等场景的优化)。
岗位要求:
1.有语音对话、语音合成、语音识别、音视频多模态、大语言模型(预训练、微调、强化学习)等相关经验者优先;
2.优秀的代码能力、数据结构和算法功底,熟练掌握Python或C/C++,熟悉Pytorch/Megatron/DeepSpeed等模型训练框架,有ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先;
3.在相关顶级会议或期刊(如NeurIPS/ICLR/ICML/ACL/CVPR/ICASSP/INTERSPEECH等)有论文发表者优先;
4.具备扎实的数学和信号处理基础,良好的英语文献阅读能力,强烈的进取心/求知欲/团队合作精神,以及优秀的问题解决能力,热衷于追求技术创新。
免责声明:
此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!