腾讯(tencent)招聘企业微信-多模态大模型算法工程师 -音频方向

招聘职位：

企业微信-多模态大模型算法工程师 -音频方向 搜索同类职位

发布日期：: 2026-06-12
工作地点：: 成都
职位类型：: 全职
职位类别：: 技术
来源：: 腾讯官网

岗位职责：
1.负责企业微信音频 AI 相关算法的研究与落地，包括但不限于语音识别（ASR）、语音合成（TTS）、声纹识别、音色转换等方向；
2.负责热词定制、领域自适应、说话人分离等场景化能力的算法设计与优化；
3.探索音频大模型在企业办公场景的创新应用，推动模型训练、微调及端侧部署落地；
4.跟进语音/音频领域前沿技术进展（Whisper、SpeechGPT 等），持续提升核心指标与用户体验；
5.与客户端、后台团队协作，完成算法从原型验证到工程化落地的全链路交付。
岗位要求：
1.计算机科学、人工智能、计算机视觉或相关专业硕士及以上学历；
2.扎实的编程基础，熟练掌握Python和PyTorch/TensorFlow；
3.在计算机视觉（CV）和自然语言处理（NLP）其中一个领域有深厚积累，并有多模态学习项目经验；
4.熟悉主流的多模态模型架构（如Transformer-based VL models），有相关模型的训练、微调或部署经验；
5.对技术创新有强烈兴趣，具备优秀的工程实现能力，能将算法模型应用于大规模实际场景。
加分项：

1.计算机、信号处理、电子工程等相关专业，硕士及以上学历，3年以上语音/音频算法开发经验；
2.熟悉 ASR、TTS、声纹识别、说话人分离等至少一个方向的核心算法原理与工程实现；
3.熟练使用 PyTorch/TensorFlow 等深度学习框架，具备模型训练、微调（SFT）、强化学习（RLHF/DPO）等实践经验；
4.具备音频信号处理基础，熟悉特征提取、降噪、回声消除等前处理技术；
5.对音频/语音领域前沿技术保持高度关注，具备快速复现和改进论文方法的能力；
6.有端侧音频模型部署与推理优化经验者优先；
7.在 ICASSP、Interspeech 等顶会发表过论文或有相关开源项目贡献者优先。

前往官网投递

免责声明：

此信息由腾讯官网 (查看来源)审核并发布，我们转载该信息，仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台，不构成求职建议，不涉及任何职业中介服务，不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎，自行判断并承担相应风险，求职请认准企业官方渠道！

上一职位：美团(meituan)闪购-超市便利KA-商家运营（便利店）

下一职位：腾讯(tencent)企业微信-AI数据算法工程师-数据标注（广州/北京）

腾讯(tencent)招聘企业微信-多模态大模型算法工程师 -音频方向

招聘职位：

FAQ 腾讯(tencent)招聘常见问答