腾讯(tencent)招聘智能体- LLMOps 平台技术负责人-CodeBuddy/WorkBuddy

招聘职位:

智能体- LLMOps 平台技术负责人-CodeBuddy/WorkBuddy 搜索同类职位
发布日期:
2026-05-15
工作地点:
职位类型:
全职
职位类别:
技术
来源:
腾讯官网
岗位职责:
1.负责以数据为中心的 LLMOps 平台整体架构设计与建设,覆盖大语言模型 Post-train(SFT、RLHF、DPO 等)全阶段的数据管线与训练工程体系;
2.主导大模型训练数据生命周期管理,包括大规模语料采集与清洗、数据质量评估与过滤、数据去重去污染、数据版本管理与血缘追踪,确保各训练阶段数据的高质量与可溯源;
3.带领工程团队构建高效的数据处理流水线与编排调度系统,支撑 PB 级语料的高吞吐处理,持续优化数据准备到训练启动的端到端效率。负责团队的技术方向把控、人才培养与跨团队协作,推动工程文化与最佳实践落地;
4.建设模型训练实验管理与可复现体系,打通数据准备、分布式训练、评估验证(Benchmark / Human Eval)、模型注册到部署上线的全流程自动化,缩短模型迭代周期;
5.构建 Post-train 阶段的数据闭环能力,包括人类偏好数据采集与管理、RLHF/DPO 训练数据管线、合成数据生成(Synthetic Data)与质量评估体系;
6.持续提升平台运行稳定性、安全性与可观测性,建立完善的 SLA 体系、训练容错与断点续训机制,保障大规模训练任务的连续性;
7.优化大规模 GPU/异构计算集群的资源调度策略,提升多任务并行训练效率与集群利用率,降低基础设施成本;
8.紧跟 LLM 领域前沿动态(如 Data-Centric AI、Scaling Laws、MoE、长上下文训练、多模态等方向),推动技术架构持续演进与平台能力升级。
岗位要求:
1.LLMOps 实战经验:深刻理解以数据为中心的大模型训练理念,具备大规模语料处理、数据质量工程、数据配比与课程学习、数据版本管理等方向的实际平台建设经验;熟悉 Pre-train / Mid-train / Post-train 各阶段的数据需求与工程挑战;
2.扎实的工程能力与系统设计功底:具备丰富的大规模分布式系统设计与开发经验,精通高可用架构、大规模存储系统、高性能计算调度、容错与断点续训、网络通信优化等核心技术,能够独立完成复杂训练基础设施的架构设计与技术选型;
3.编程与框架:具备优秀的软件工程素养与代码设计能力。熟悉大模型训练相关基础设施;
4.技术领导力:5 年以上相关领域工程经验,2 年以上团队管理或 Tech Lead 经验。具备出色的技术判断力,能在复杂业务场景下做出合理的技术决策与优先级排序;
5.沟通与协作:具备优秀的跨团队沟通与协调能力,能够有效对接算法研究员、数据团队、SRE 及产品团队,推动多方对齐与高效交付;
6.自驱与学习能力:有强烈的技术热情,持续关注前沿进展,能将新理念快速转化为工程实践。
岗位介绍:
在腾讯,技术人解决问题的激情永不熄灭。无论是面对产品、程序的问题,还是生活与人的问题,腾讯技术人都力图交出漂亮的答卷。我们善用科学工具,以强大的思维之力创造世界,为卓越的产品体验保驾护航,也为公司和产品策略提出宝贵的洞见,用技术引领新的变革。这里的每位成员,既传承着长久以来的务实文化,又时刻以创新眼光瞄准大海星辰。我们十分期待你加入这样一个「技术社区」,分享团队能量,尽情发挥所长。
免责声明:

此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!

FAQ 腾讯(tencent)招聘常见问答

腾讯(tencent)招聘工作地点:
深圳
腾讯(tencent)招聘经验要求:
五年以上工作经验