腾讯(tencent)招聘微信-多模态大模型算法工程师-OCR与文档理解方向(北京)

招聘职位:

微信-多模态大模型算法工程师-OCR与文档理解方向(北京) 搜索同类职位
发布日期:
2026-03-25
工作地点:
职位类型:
全职
职位类别:
技术
来源:
腾讯官网
岗位职责:
负责微信在OCR、文档理解等垂类方向的多模态大模型技术研发和业务落地,支持相关模型在微信C端应用,以及视频号、公众号、微信小店等业务的搜索、推荐、审核等领域的应用。
岗位要求:
1.深度参与过业界主流或知名多模态大模型的研发工作,系统理解整体技术架构与设计方案。具备大规模数据构建、清洗、治理及分布式模型训练的实战经验。
2.精通大模型预训练、监督微调(SFT)、对齐与后训练(如 RLHF / DPO 等)等训练范式,深入理解相关算法原理、工程实现细节及训练稳定性与效率优化方法。
3.精通通用 OCR、表格识别、版面分析、关键信息抽取(KIE)等文档智能核心技术,具备完整的业务落地或产品化经验者优先。
4.在计算机视觉、图形学等领域的国际顶级会议或期刊(如 CVPR / ICCV / ECCV / NeurIPS / SIGGRAPH 等)发表过高质量论文者优先。在视觉、算法相关竞赛或业界权威榜单中取得优异成绩,或在 GitHub 具备较高影响力的开源项目中有核心贡献者优先。
5.具备扎实的工程实现能力,熟练使用 Python,具备良好的代码规范与系统设计能力,熟悉或精通 C/C++ 者优先。

部门介绍:
技术架构团队缔造了微信后台的第一行代码,目前已成为集应用开发和基础研究于一身的重要部门。该团队创立了 WXG 内部开发者每日使用的 ABC(AI、BigData、Cloud)平台,其中包括 AI 应用平台、BigData 平台和 Cloud 平台。AI 应用平台承担了各项 AI 技术在具体业务中的落地功能,支持每分钟数千万次的调用。BigData 平台负责大数据分析和挖掘功能,每天支持上百万次的任务运行。Cloud 平台则负责计算和存储资源的调度功能,为庞大的在线服务系统以及 AI 和 BigData 的训练和推理任务提供支持。此外,该团队还负责微信消息系统、音视频通话、朋友圈、视频号和直播等基础功能支撑,为超过 10 亿用户的日常使用提供强有力的支持。

技术架构团队不仅负责应用开发,还致力于基础研究。该团队在 CV、ASR 和 NLP 等领域的 AI 算法预研方面表现突出,并成功将这些技术应用于实际业务。团队的研究成果被广泛运用于微信产品,提升了用户体验和产品竞争力。此外,该团队还积极参与学术交流和开源社区,持续推动着人工智能领域的发展。
免责声明:

此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!

FAQ 腾讯(tencent)招聘常见问答

腾讯(tencent)招聘工作地点:
深圳
腾讯(tencent)招聘经验要求:
一年以上工作经验