腾讯(tencent)招聘游戏模型数据专家-研发数据
招聘职位:
游戏模型数据专家-研发数据 搜索同类职位
岗位职责:
1.多模态模型数据处理:负责游戏研发阶段多模态模型的数据处理, 包括不仅限文档OCR、版面理解、表格/公式识别、图表解析、图片视频解析等核心场景,以业务问题为驱动,持续提升模型效果;
2.数据闭环建设:主导数据优化工作,包括问题样本与难例自动化挖掘、多源异构模型交叉投票标注、视觉渲染闭环质量校验、数据分布结构性优化等,构建高质量、可持续迭代的数据飞轮;
3.专项难题攻关:针对复杂表格、公式、图表、图片、视频等复杂场景,设计并落地专项技术方案,解决解析不全、解析错乱等核心问题;
4.前沿技术转化:持续跟踪多模态大模型前沿进展,结合业务场景完成技术选型与落地验证。
岗位要求:
1.计算机视觉、自然语言处理、机器学习或相关方向硕士及以上学历,有算法研发经验者优先;
2.扎实的 Python 编程能力与算法工程基础,熟悉 PyTorch 等主流深度学习框架;
3.熟悉计算机视觉方向多模态理解相关任务,有相关的项目落地经验;
4.了解多模态大模型训练流程(预训练、SFT、RLHF/DPO 等),具备大规模数据处理、模型评测或分布式训练经验;
5.具备良好的学习能力、工程素养与协作沟通能力,能在复杂业务场景下独立思考并推动问题闭环。
加分项:
1.有多模态大模型训练或微调的实战经验;
2.熟悉常用训练/推理框架(LLaMA-Factory、DeepSpeed、vLLM 等),有端到端 pipeline 搭建经验;
3.在 NeurIPS、CVPR、ICCV、ACL、EMNLP 等顶级会议发表过论文,或在知名开源项目、业界竞赛(如 ICDAR、Kaggle)中有显著贡献;
4.有文档结构化方向的实际项目经验。
1.多模态模型数据处理:负责游戏研发阶段多模态模型的数据处理, 包括不仅限文档OCR、版面理解、表格/公式识别、图表解析、图片视频解析等核心场景,以业务问题为驱动,持续提升模型效果;
2.数据闭环建设:主导数据优化工作,包括问题样本与难例自动化挖掘、多源异构模型交叉投票标注、视觉渲染闭环质量校验、数据分布结构性优化等,构建高质量、可持续迭代的数据飞轮;
3.专项难题攻关:针对复杂表格、公式、图表、图片、视频等复杂场景,设计并落地专项技术方案,解决解析不全、解析错乱等核心问题;
4.前沿技术转化:持续跟踪多模态大模型前沿进展,结合业务场景完成技术选型与落地验证。
岗位要求:
1.计算机视觉、自然语言处理、机器学习或相关方向硕士及以上学历,有算法研发经验者优先;
2.扎实的 Python 编程能力与算法工程基础,熟悉 PyTorch 等主流深度学习框架;
3.熟悉计算机视觉方向多模态理解相关任务,有相关的项目落地经验;
4.了解多模态大模型训练流程(预训练、SFT、RLHF/DPO 等),具备大规模数据处理、模型评测或分布式训练经验;
5.具备良好的学习能力、工程素养与协作沟通能力,能在复杂业务场景下独立思考并推动问题闭环。
加分项:
1.有多模态大模型训练或微调的实战经验;
2.熟悉常用训练/推理框架(LLaMA-Factory、DeepSpeed、vLLM 等),有端到端 pipeline 搭建经验;
3.在 NeurIPS、CVPR、ICCV、ACL、EMNLP 等顶级会议发表过论文,或在知名开源项目、业界竞赛(如 ICDAR、Kaggle)中有显著贡献;
4.有文档结构化方向的实际项目经验。
免责声明:
此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!