查看更多分享

腾讯(tencent)招聘混元多模态大模型推理加速工程师(深圳/北京/上海/杭州)

招聘职位:

混元多模态大模型推理加速工程师(深圳/北京/上海/杭州) 搜索同类职位
发布日期:
2026-04-22
工作地点:
职位类型:
全职
职位类别:
技术
来源:
腾讯官网
岗位职责:
1.负责通用多模态大模型的推理部署,包括多模态理解、生成、语音大模型等研发支持,推动算法落地;
2.多模态大模型性能优化及推理框架优化,提升整体吞吐、降低部署成本;提升框架易用性;
3.紧跟多模态生成和理解领域的技术前沿,推动技术创新在产品中落地;
4.针对落地业务,优化部署方案及适配定制化需求。
岗位要求:
1.了解AI基础设施、机器学习系统或高性能计算相关领域经验, 具有 vllm/sglang/TensorRT/FasterTransformer 等推理引擎实践经验;
2.精通主流多模态或全模态大模型,主导或核心参与过多模态大模型项目优先;有行业落地案例或相关开源项目经验者优先;
3.熟悉主流深度学习框架的网络结构与算子底层实现细节,具备模型训练 / 推理调优、CPU/GPU 加速、分布式训练与推理部署的实操经验者优先;
4.熟悉分布式推理常用加速方法(算子融合、量化策略、动态批处理、KV 缓存优化等),有超大模型分布式部署经验优先;
5.在视觉问答、图像生成、视频理解/生成,语音识别/合成等领域有项目积累,或发表过相关方向顶级学术论文者优先;
6.具备较强的自主学习能力与技术钻研精神,良好的跨团队沟通协作能力。
免责声明:

此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!

FAQ 腾讯(tencent)招聘常见问答

腾讯(tencent)招聘工作地点:
深圳
腾讯(tencent)招聘经验要求:
两年以上工作经验