腾讯(tencent)招聘混元多模态数据工程师(北京)

招聘职位:

混元多模态数据工程师(北京) 搜索同类职位
发布日期:
2026-06-04
工作地点:
职位类型:
全职
职位类别:
技术
来源:
腾讯官网
岗位职责:
1.多模态数据管线建设:设计并实现面向大模型训练与推理的多模态数据处理与构建管线,覆盖图像、视频、音频、文本、3D 及多模态理解等数据类型,支撑预训练、后训练(SFT / RLHF / Preference)及评测数据构建;
2.大规模数据工程与系统建设:构建高可靠、可扩展的数据处理系统,支持 TB / PB 级数据规模,负责批处理与流式处理任务的工程实现,参与或主导分布式并行计算(CPU / GPU 混合)的工程落地;
3.数据质量与稳定性保障:建立数据校验与质量评估机制,覆盖数据完整性、一致性、分布异常与质量回归等场景,设计并推动数据处理链路的监控与异常治理;
4.数据资产化与标准化建设:推动多模态数据结构的标准化设计,建设数据元信息、版本管理与可追溯机制,提升数据的可复用性与长期资产价值;
5.跨团队协作与需求落地:与算法、模型、平台等团队深度协作,将模型需求与业务目标转化为可落地的数据工程方案,参与复杂数据问题的拆解、方案设计与推进落地。
岗位要求:
1.全日制本科及以上学历,硕士优先,计算机或相关专业,工作经验1年及以上;
2.具备扎实的 Python 工程能力,熟悉模块化设计、异常处理、工程化代码结构,熟悉 Linux 环境,具备基本的 Shell 使用与问题定位能力,具备良好的代码质量意识(可维护性、可读性、可测试性);
3.具备大规模数据处理经验,有 TB / PB 级数据处理实践,理解 ETL、数据管线、DAG 调度等核心数据工程思想,熟悉至少一种分布式计算或批处理框架(如 Spark / Ray / Flink 等);
4.理解 CPU、内存、IO、GPU 等计算资源特性,具备性能优化意识,能从并行化、批处理、流水线等角度优化系统,能主动规避不必要的数据复制与 IO 放大问题;
5.拥有强烈的责任心和主动性,能将抽象需求转化为清晰的工程方案并推动落地,具备良好的跨团队沟通与协作能力。
免责声明:

此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!

FAQ 腾讯(tencent)招聘常见问答

腾讯(tencent)招聘工作地点:
深圳
腾讯(tencent)招聘经验要求:
一年以上工作经验