查看更多分享

腾讯广告-算法工程师-强化学习方向

招聘职位:

腾讯广告-算法工程师-强化学习方向 搜索同类职位
发布日期:
2026-03-05
工作地点:
职位类型:
全职
职位类别:
技术
来源:
腾讯官网
岗位职责:
1.多目标强化学习算法开发与调优。基于业务场景构建DQN、PPO、SAC等算法的改进框架,针对延迟奖励稀疏性设计分层强化学习架构。搭建离线仿真环境与在线AB测试闭环,设计动态滑动窗口评估机制,量化算法迭代效果;
2.效果瓶颈分析与突破。构建强化学习可解释性分析工具(如SHAP值、注意力热力图),定位状态表征缺失/奖励函数偏差/探索不足等瓶颈。设计课程学习机制,通过渐进式难度提升策略解决稀疏奖励场景下的策略退化问题;
3.状态与奖励机制创新。构建异构特征融合模型,集成用户实时行为序列(LSTM)、跨场景偏好迁移(Meta Learning)等高阶状态表征。设计复合奖励函数,融合稠密奖励(点击行为)与稀疏奖励(购买行为),引入基于KL散度的奖励塑形技术;
4.跟踪深度学习、计算广告、推荐系统,deepseek等最新前沿技术,应用到多目标排序。
岗位要求:
1.计算机/统计学/运筹学硕士及以上学历,1-3年强化学习实战经验;
2.扎实的强化学习理论基础,掌握MDP、贝尔曼方程等核心理论框架,深入理解DQN、PPO、DDPG等算法原理,具备改进算法效率和稳定性能力。同时有传统机器学习和深度学习知识背景,熟悉Transformer/Attention等原理和应用;
3.扎实的编程基础(Python/Java/Scala),熟悉Linux开发环境。丰富的实战经验,精通TensorFlow/pyTorch等强化学习框架使用,熟悉Spark/Flink 大数据计算框架;
4.需保持强烈技术好奇心,主动学习各种前沿技术并实践落地,鼓励创新。有KDD/WWW等顶会发表过RL相关论文者优先。
岗位介绍:
渴望为世界带来新意的人,早已对描绘未来的“热词”不陌生——人工智能、机器学习、数据科学等等。腾讯始终在业界前沿不断探索,积极布局,并为优秀的你提供无限广阔的舞台。我们坚信科技的不断革新,最终能带来美好的、撼动人心的改变。
免责声明:

此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!

FAQ 腾讯招聘常见问答

腾讯招聘工作地点:
深圳
腾讯招聘经验要求:
三年以上工作经验