腾讯(tencent)招聘金融科技-多模态大模型算法工程师
招聘职位:
金融科技-多模态大模型算法工程师 搜索同类职位
岗位职责:
1.负责VLM在GUI智能体场景下的全流程优化,包括多模态数据Pipeline构建、GUI-Sandbox仿真环境搭建、模型后训练(Post-training)等;
2.深入GUI交互与多模态理解方向,进行模型调优与技术创新,覆盖视觉定位、界面元素理解、跨模态工具调用等;
3.跟踪多模态大模型与具身智能领域的技术动态,评估其在GUI自动化、智能助手等场景的应用潜力;
4.参与多模态系统架构设计,确保系统的高性能、可扩展性与稳定性。
岗位要求:
1.熟练掌握PyTorch、Swift、VeRL等一种或多种深度学习框架,具备多模态模型(如VLM)开发与调优经验;
2.熟悉多模态大模型训练技术,包括增量预训练(CPT)、有监督微调(SFT)、强化学习(RL)等,具备分布式训练实践经验;
3.熟悉RLVR(可验证奖励强化学习)流程,有多模态任务强化学习项目经验者优先;
4.具备计算机视觉、自然语言处理或多模态学习相关项目经验,熟悉常见VLM架构与评测基准;
5.计算机科学、人工智能、机器学习等相关专业硕士及以上学历,或在CVPR、ECCV、NeurIPS、ICML等多模态/视觉相关顶会发表论文者优先。
1.负责VLM在GUI智能体场景下的全流程优化,包括多模态数据Pipeline构建、GUI-Sandbox仿真环境搭建、模型后训练(Post-training)等;
2.深入GUI交互与多模态理解方向,进行模型调优与技术创新,覆盖视觉定位、界面元素理解、跨模态工具调用等;
3.跟踪多模态大模型与具身智能领域的技术动态,评估其在GUI自动化、智能助手等场景的应用潜力;
4.参与多模态系统架构设计,确保系统的高性能、可扩展性与稳定性。
岗位要求:
1.熟练掌握PyTorch、Swift、VeRL等一种或多种深度学习框架,具备多模态模型(如VLM)开发与调优经验;
2.熟悉多模态大模型训练技术,包括增量预训练(CPT)、有监督微调(SFT)、强化学习(RL)等,具备分布式训练实践经验;
3.熟悉RLVR(可验证奖励强化学习)流程,有多模态任务强化学习项目经验者优先;
4.具备计算机视觉、自然语言处理或多模态学习相关项目经验,熟悉常见VLM架构与评测基准;
5.计算机科学、人工智能、机器学习等相关专业硕士及以上学历,或在CVPR、ECCV、NeurIPS、ICML等多模态/视觉相关顶会发表论文者优先。
免责声明:
此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!