查看更多分享

腾讯(tencent)招聘腾讯智能座舱-大模型量化部署工程师

招聘职位:

腾讯智能座舱-大模型量化部署工程师 搜索同类职位
发布日期:
2025-12-23
工作地点:
职位类型:
全职
职位类别:
技术
来源:
腾讯官网
岗位职责:
1.负责座舱端侧大模型量化部署,如高通/MTK/Nvidia等座舱芯片平台;
2.探索不同芯片平台的算子能力与工程新特性,设计不同的量化策略与验证方法,优化量化前后精度损失;
3.负责端侧大模型部署过程中的性能优化,优化token生成速度与减少内存带宽的使用;
4.研究端侧大模型前沿的量化部署方法,提升端侧大模型整体性能与精度。
岗位要求:
1.熟练掌握 C/C++、Python语言,有良好计算机体系结构知识;
2.具备高通/MTK/nvidia等芯片平台的端侧量化部署经验,至少一个平台;
3.熟悉大模型常见的部署框架(如TensorRT-LLM/vLLM/QNN等)和量化算法;
4.熟悉端侧大模型推理机制如计算图的执行、算子融合、KV 缓存优化、投机采样策略等;
5.精通 Transformer 等大模型核心算子(Attention、FFN、LayerNorm)底层实现机制与性能优化方法;
6.具有多模态大模型量化部署与优化经验者优先;
7.具备大模型训练和推理过程中的调试与优化实操经验者优先。
加分项:
1.在同等条件下,通过腾讯云认证或取得同等资格认证的候选人,我们会优先考虑。
免责声明:

此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!

FAQ 腾讯(tencent)招聘常见问答

腾讯(tencent)招聘工作地点:
北京
腾讯(tencent)招聘经验要求:
三年以上工作经验