腾讯(tencent)招聘元宝-LLM大模型推理工程师
招聘职位:
元宝-LLM大模型推理工程师 搜索同类职位
岗位职责:
1.负责开发和优化大模型推理框架;
2.主要通过GPU、CUDA性能优化的手段,结合线上实际情况,优化高性能LLM推理引擎;
3.负责大模型训练和推理前瞻性技术架构的调研和引入,技术方案不限于子图匹配、编译优化、模型量化等。
岗位要求:
1.本科及以上学历,计算机/电子/自动化/软件等相关专业,有AI工程优化经验的优先;
2.熟练GPU的高性能计算优化技术,深入理解计算机体系结构,熟悉并行计算优化、访存优化,低比特计算等;
3.具备丰富的基于CUDA的GPU性能优化经验;
4.了解深度学习算法基本原理,熟悉神经网络基本架构和各算子计算方式,了解至少一种深度学习训练框架及其模型文件的解析,如PyTorch、TensorFlow;
5.熟悉TensorRT-LLM、vLLM等,了解主流LLM模型,有LLM模型加速优化经验者优先。
岗位介绍:
在腾讯客户端开发的字典里,“敏捷高效”与“精益求精”并不互斥,追求技术的深度是我们共同的信仰。希望你也能在足够广阔的平台上尽情的施展拳脚。
1.负责开发和优化大模型推理框架;
2.主要通过GPU、CUDA性能优化的手段,结合线上实际情况,优化高性能LLM推理引擎;
3.负责大模型训练和推理前瞻性技术架构的调研和引入,技术方案不限于子图匹配、编译优化、模型量化等。
岗位要求:
1.本科及以上学历,计算机/电子/自动化/软件等相关专业,有AI工程优化经验的优先;
2.熟练GPU的高性能计算优化技术,深入理解计算机体系结构,熟悉并行计算优化、访存优化,低比特计算等;
3.具备丰富的基于CUDA的GPU性能优化经验;
4.了解深度学习算法基本原理,熟悉神经网络基本架构和各算子计算方式,了解至少一种深度学习训练框架及其模型文件的解析,如PyTorch、TensorFlow;
5.熟悉TensorRT-LLM、vLLM等,了解主流LLM模型,有LLM模型加速优化经验者优先。
岗位介绍:
在腾讯客户端开发的字典里,“敏捷高效”与“精益求精”并不互斥,追求技术的深度是我们共同的信仰。希望你也能在足够广阔的平台上尽情的施展拳脚。
免责声明:
此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!