腾讯招聘混元数据算法工程师(北京)
招聘职位:
混元数据算法工程师(北京) 搜索同类职位
岗位职责:
1.数据特征算法:负责海量文本&多模态数据(图像,视频,音频,3D)的内容理解(如分类标签体系、embedding表征、Caption生成等),质量检测(低质识别检测、优质美学评价等),去重/聚类分析,数据合成等算法;
2.数据pipeline建设:负责数据采集、筛选清洗、标注与质量评估pipeline的建设。与模型业务团队紧密配合,充分分析挖掘数据资源,建立自动化数据处理流程与机制,支持模型持续迭代;
3.数据实验分析:对模型训练数据进行详细分析,建立科学数据实验机制,识别样本不足、质量问题、配比不均衡等潜在问题,驱动数据优化提升数据覆盖、质量、多样性需求,最终带来大模型生成效果的持续提升。
岗位要求:
1.硕士及以上学历,计算机视觉、自然语言处理或多模态方向背景优先;
2.熟练掌握深度学习框架(如PyTorch、TensorFlow),熟悉模型训练及数据处理经验,具备优秀的独立开发与分析调研能力;
3.具备良好的团队协作能力,具备强烈的自我驱动力,能够独立完成系统分析与优化,落地大模型应用;
4.加分项:对多模态生成大模型有深入理解,对数据敏感具备较强的数据洞察与分析能力。
加分项:
1.熟练掌握HiveSQL、Spark、Ray等至少两种数据分析及处理工具;
2.有大模型训练或数据相关工作经验者优先。
1.数据特征算法:负责海量文本&多模态数据(图像,视频,音频,3D)的内容理解(如分类标签体系、embedding表征、Caption生成等),质量检测(低质识别检测、优质美学评价等),去重/聚类分析,数据合成等算法;
2.数据pipeline建设:负责数据采集、筛选清洗、标注与质量评估pipeline的建设。与模型业务团队紧密配合,充分分析挖掘数据资源,建立自动化数据处理流程与机制,支持模型持续迭代;
3.数据实验分析:对模型训练数据进行详细分析,建立科学数据实验机制,识别样本不足、质量问题、配比不均衡等潜在问题,驱动数据优化提升数据覆盖、质量、多样性需求,最终带来大模型生成效果的持续提升。
岗位要求:
1.硕士及以上学历,计算机视觉、自然语言处理或多模态方向背景优先;
2.熟练掌握深度学习框架(如PyTorch、TensorFlow),熟悉模型训练及数据处理经验,具备优秀的独立开发与分析调研能力;
3.具备良好的团队协作能力,具备强烈的自我驱动力,能够独立完成系统分析与优化,落地大模型应用;
4.加分项:对多模态生成大模型有深入理解,对数据敏感具备较强的数据洞察与分析能力。
加分项:
1.熟练掌握HiveSQL、Spark、Ray等至少两种数据分析及处理工具;
2.有大模型训练或数据相关工作经验者优先。
免责声明:
此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!