腾讯(tencent)招聘混元3D大模型数据算法工程师(北京)
招聘职位:
混元3D大模型数据算法工程师(北京) 搜索同类职位
岗位职责:
1.数据战略与体系构建:
-制定3D大模型的数据建设路线图,定义高质量3D数据(Mesh/NeRF/3DGS/Point Cloud)的标准与规范;
-设计并搭建支持TB/PB级3D数据的存储、检索与版本管理体系,确保数据的高吞吐与高可用;
2.数据管线研发(Data Pipeline):
-数据获取与清洗: 负责开源3D数据集(如Objaverse, ShapeNet等)及互联网3D资产的爬取、解析、格式转换与清洗(去重、修复法线、补全缺失面等);
-多模态对齐: 建立3D资产与文本(Text)、图像(Image)、视频(Video)的高质量对齐管线,利用CLIP、BLIP等模型进行自动化打标(Captioning)与语义增强;
3.自动化渲染管线: 搭建基于Blender/Unity/Unreal的高性能批量渲染管线,将3D数据转化为多视角的2D图像/视频数据,用于模型训练;
4.合成数据生成(Synthetic Data):
-利用程序化生成(Procedural Generation)技术或游戏引擎,批量生成多样化的3D场景与物体,解决长尾数据稀缺问题;
-探索Sim-to-Real的数据增强策略,提升模型泛化能力;
5.团队管理与质量控制:
-组建并管理数据团队(包括数据工程师、3D技术美术TA、标注专员);
-建立自动化与人工相结合的数据质量评估体系(QA),制定SOP,确保持续向算法团队输送High-Quality Token。
岗位要求:
1. 专业背景:
计算机、图形学、数学或相关专业本科及以上学历,3年以上相关技术开发经验;
2. 核心技能(必须):
3D数据处理能力: 深刻理解3D数据格式(如 glTF, OBJ, USD, PLY)及表征形式(Mesh, Point Cloud, Voxel, NeRF, Gaussian Splatting);
编程能力: 精通 Python,熟练掌握 Blender Python API (bpy) 或其他3D软件脚本开发,具备自动化处理海量3D模型的能力;
图形学基础: 熟悉渲染管线,了解PBR材质、光照、相机参数对数据的影响;
3. 大模型认知:
熟悉AIGC主流算法原理(如Diffusion Model, Transformer),理解大模型训练对数据分布、多样性和质量的具体需求;
了解当前主流3D生成算法(如DreamFusion, Magic3D, LGM, Point-E等)的数据需求痛点;
4. 综合素质:
具备极强的Pipeline搭建思维,拒绝纯手工劳动,推崇自动化;
优秀的跨部门沟通能力,能与算法研究员和3D美术深度协作。
加分项:
有自动驾驶仿真、游戏引擎开发(UE5/Unity) 或 影视特效(Houdini) 行业数据背景者优先。
有构建大规模3D数据集(如Objaverse-XL规模)实战经验者优先。
熟悉 3D Gaussian Splatting (3DGS) 技术栈者优先。
在CVPR, SIGGRAPH, ICCV等顶会发表过3D/Vision相关论文者优先。
1.数据战略与体系构建:
-制定3D大模型的数据建设路线图,定义高质量3D数据(Mesh/NeRF/3DGS/Point Cloud)的标准与规范;
-设计并搭建支持TB/PB级3D数据的存储、检索与版本管理体系,确保数据的高吞吐与高可用;
2.数据管线研发(Data Pipeline):
-数据获取与清洗: 负责开源3D数据集(如Objaverse, ShapeNet等)及互联网3D资产的爬取、解析、格式转换与清洗(去重、修复法线、补全缺失面等);
-多模态对齐: 建立3D资产与文本(Text)、图像(Image)、视频(Video)的高质量对齐管线,利用CLIP、BLIP等模型进行自动化打标(Captioning)与语义增强;
3.自动化渲染管线: 搭建基于Blender/Unity/Unreal的高性能批量渲染管线,将3D数据转化为多视角的2D图像/视频数据,用于模型训练;
4.合成数据生成(Synthetic Data):
-利用程序化生成(Procedural Generation)技术或游戏引擎,批量生成多样化的3D场景与物体,解决长尾数据稀缺问题;
-探索Sim-to-Real的数据增强策略,提升模型泛化能力;
5.团队管理与质量控制:
-组建并管理数据团队(包括数据工程师、3D技术美术TA、标注专员);
-建立自动化与人工相结合的数据质量评估体系(QA),制定SOP,确保持续向算法团队输送High-Quality Token。
岗位要求:
1. 专业背景:
计算机、图形学、数学或相关专业本科及以上学历,3年以上相关技术开发经验;
2. 核心技能(必须):
3D数据处理能力: 深刻理解3D数据格式(如 glTF, OBJ, USD, PLY)及表征形式(Mesh, Point Cloud, Voxel, NeRF, Gaussian Splatting);
编程能力: 精通 Python,熟练掌握 Blender Python API (bpy) 或其他3D软件脚本开发,具备自动化处理海量3D模型的能力;
图形学基础: 熟悉渲染管线,了解PBR材质、光照、相机参数对数据的影响;
3. 大模型认知:
熟悉AIGC主流算法原理(如Diffusion Model, Transformer),理解大模型训练对数据分布、多样性和质量的具体需求;
了解当前主流3D生成算法(如DreamFusion, Magic3D, LGM, Point-E等)的数据需求痛点;
4. 综合素质:
具备极强的Pipeline搭建思维,拒绝纯手工劳动,推崇自动化;
优秀的跨部门沟通能力,能与算法研究员和3D美术深度协作。
加分项:
有自动驾驶仿真、游戏引擎开发(UE5/Unity) 或 影视特效(Houdini) 行业数据背景者优先。
有构建大规模3D数据集(如Objaverse-XL规模)实战经验者优先。
熟悉 3D Gaussian Splatting (3DGS) 技术栈者优先。
在CVPR, SIGGRAPH, ICCV等顶会发表过3D/Vision相关论文者优先。
免责声明:
此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!