腾讯(tencent)招聘微信-高级算法工程师-音频理解/ASR/对话模型方向

招聘职位:

微信-高级算法工程师-音频理解/ASR/对话模型方向 搜索同类职位
发布日期:
2026-06-12
工作地点:
职位类型:
全职
职位类别:
技术
来源:
腾讯官网
岗位职责:
1.负责音频理解、语音识别、语音对话大模型等方向的模型研发与落地,包括 ASR、S2TT/S2ST、音频问答、语音对话等核心能力建设;
2.参与大规模音频/语音数据建设、清洗、标注、合成与评测体系搭建,持续提升模型在复杂场景下的理解、识别和交互能力;
3.负责大模型训练与微调工作,包括预训练、SFT、偏好优化、多模态对齐、音频 encoder 与 LLM 融合等方向探索;
4.推进 ASR 工程化落地,包括流式识别、实时上屏、上下文增强、热词/专有词优化、长语音识别、端侧/云侧推理等能力建设;
5.跟进语音与多模态大模型前沿技术,结合业务场景完成技术选型、效果优化和线上落地。
岗位要求:
1.具备扎实的机器学习、深度学习和语音信号处理基础,熟悉 ASR、音频理解或语音对话相关技术;
2.有大模型训练经验,熟悉 LLM / 多模态大模型的预训练、SFT、RLHF/DPO/PPO、指令微调或模型评测流程;
3.有 ASR 工程实践经验,熟悉 CTC、AED、Transducer、流式 ASR、动态 chunk、热词增强、ITN、VAD 等相关技术优先;
4.熟悉 PyTorch、Megatron、DeepSpeed、FSDP、vLLM 等训练或推理框架中的一种或多种,具备大规模训练/推理优化经验优先;
5.具备较强的工程实现能力和问题定位能力,能够独立完成从数据、训练、评测到部署的完整闭环;
6.有良好的沟通协作能力,能与工程、产品、数据团队共同推动复杂语音能力落地。
加分项:
1.有音频大模型、语音对话大模型、Omni 模型、SpeechLLM、AudioLLM 相关研发经验;
2.有大规模 ASR 系统、同声传译、全双工语音交互、端到端语音对话系统落地经验;
3.熟悉 Qwen、Whisper、FunASR、Paraformer、SenseVoice、CosyVoice、Qwen-Audio/Qwen-Omni 等模型或开源框架;
4.有多语言、方言、中英混、噪声场景、车载/耳机/端侧语音识别优化经验;
5.有大规模数据处理、自动标注、合成数据构造、评测体系建设经验。
岗位介绍:
渴望为世界带来新意的人,早已对描绘未来的“热词”不陌生——人工智能、机器学习、数据科学等等。腾讯始终在业界前沿不断探索,积极布局,并为优秀的你提供无限广阔的舞台。我们坚信科技的不断革新,最终能带来美好的、撼动人心的改变。
免责声明:

此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!

FAQ 腾讯(tencent)招聘常见问答

腾讯(tencent)招聘工作地点:
北京
腾讯(tencent)招聘经验要求:
不限