查看更多分享

腾讯(tencent)招聘混元训练 Infra 工程师-Dataloader/Checkpoint 方向-(北京/深圳/上海/杭州)

招聘职位:

混元训练 Infra 工程师-Dataloader/Checkpoint 方向-(北京/深圳/上海/杭州) 搜索同类职位
发布日期:
2026-06-10
工作地点:
职位类型:
全职
职位类别:
技术
来源:
腾讯官网
岗位职责:
1.分布式 Dataloader:多源数据加载框架研发,优化预处理流水线、IO 瓶颈与数据倾斜,对接对象存储 / 分布式文件系统,支持动态采样与增量更新;​;
2.Checkpoint 管理:设计高吞吐存储 / 加载方案,优化压缩、分片与冷热分层,实现版本管理、备份恢复与分布式训练框架兼容;​;
3.系统优化:监控吞吐 / 延迟 / 显存指标,定位性能瓶颈,保障极端场景下训练连续性;​;
4.跨团队协作:对齐业务需求,沉淀技术最佳实践。​。
岗位要求:
1.本科及以上学历,3 年 + AI Infra / 分布式系统 / HPC 经验;​;
2.精通 Python/C++,深入理解 Linux 内核、IO 模型,熟悉 PyTorch(优先)及分布式训练原理;​;
3.有分布式 Dataloader 研发与 IO 密集型任务优化相关经验;​;
4.有 checkpoint 存储 / 加载 / 压缩优化相关经验;​;
5.熟悉对象存储 / 分布式文件系统与缓存、分片策略;​;
6.具备系统性能瓶颈分析与 GPU/CPU 优化案例。
免责声明:

此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!