查看更多分享

腾讯(tencent)招聘微信-高级算法工程师-音频理解/ASR/对话模型方向

招聘职位：

微信-高级算法工程师-音频理解/ASR/对话模型方向 搜索同类职位

发布日期：: 2026-07-13
工作地点：: 北京
职位类型：: 全职
职位类别：: 技术
来源：: 腾讯官网

岗位职责：
1.负责音频理解、语音识别、语音对话大模型等方向的模型研发与落地，包括 ASR、S2TT/S2ST、音频问答、语音对话等核心能力建设；
2.参与大规模音频/语音数据建设、清洗、标注、合成与评测体系搭建，持续提升模型在复杂场景下的理解、识别和交互能力；
3.负责大模型训练与微调工作，包括预训练、SFT、偏好优化、多模态对齐、音频 encoder 与 LLM 融合等方向探索；
4.推进 ASR 工程化落地，包括流式识别、实时上屏、上下文增强、热词/专有词优化、长语音识别、端侧/云侧推理等能力建设；
5.跟进语音与多模态大模型前沿技术，结合业务场景完成技术选型、效果优化和线上落地。
岗位要求：
1.具备扎实的机器学习、深度学习和语音信号处理基础，熟悉 ASR、音频理解或语音对话相关技术；
2.有大模型训练经验，熟悉 LLM / 多模态大模型的预训练、SFT、RLHF/DPO/PPO、指令微调或模型评测流程；
3.有 ASR 工程实践经验，熟悉 CTC、AED、Transducer、流式 ASR、动态 chunk、热词增强、ITN、VAD 等相关技术优先；
4.熟悉 PyTorch、Megatron、DeepSpeed、FSDP、vLLM 等训练或推理框架中的一种或多种，具备大规模训练/推理优化经验优先；
5.具备较强的工程实现能力和问题定位能力，能够独立完成从数据、训练、评测到部署的完整闭环；
6.有良好的沟通协作能力，能与工程、产品、数据团队共同推动复杂语音能力落地。
加分项：
1.有音频大模型、语音对话大模型、Omni 模型、SpeechLLM、AudioLLM 相关研发经验；
2.有大规模 ASR 系统、同声传译、全双工语音交互、端到端语音对话系统落地经验；
3.熟悉 Qwen、Whisper、FunASR、Paraformer、SenseVoice、CosyVoice、Qwen-Audio/Qwen-Omni 等模型或开源框架；
4.有多语言、方言、中英混、噪声场景、车载/耳机/端侧语音识别优化经验；
5.有大规模数据处理、自动标注、合成数据构造、评测体系建设经验。
岗位介绍：
渴望为世界带来新意的人，早已对描绘未来的“热词”不陌生——人工智能、机器学习、数据科学等等。腾讯始终在业界前沿不断探索，积极布局，并为优秀的你提供无限广阔的舞台。我们坚信科技的不断革新，最终能带来美好的、撼动人心的改变。

前往官网投递

免责声明：

此信息由腾讯官网 (查看来源)审核并发布，我们转载该信息，仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台，不构成求职建议，不涉及任何职业中介服务，不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎，自行判断并承担相应风险，求职请认准企业官方渠道！

上一职位：美团(meituan)物流运营经理

下一职位：美团(meituan)KA大客户销售（黄金珠宝&服饰）