腾讯(tencent)招聘腾讯云乐享-强化学习算法研究员

招聘职位:

腾讯云乐享-强化学习算法研究员 搜索同类职位
发布日期:
2026-06-03
工作地点:
职位类型:
全职
职位类别:
技术
来源:
腾讯官网
岗位职责:
1.作为研究者,探索有效的 Agentic Workflow 和 Agentic Memory 设计来解决代码领域的问题;
2.主要关注比SFT泛化效果更好的强化学习;能结合实际用户需求、产生的用户数据、agent的实现细节,调整训练语料和训练目标;
3.能和agent开发高效沟通,设计memory存取逻辑,并且通过模型训练让模型适配自己设计的agent;
4.作为工程师,考虑到 LLM inference 对推理算力的高消耗,设计出合理的前后端交互,前端架构,后端架构,在有限的推理算力下,做出完整的 Agentic Workflow 解决方案。最好是探索一套通用可扩展的 Agentic Workflow 解决方案。
岗位要求:
1.自然语言处理/机器学习/模式识别/人工智能/计算机等相关专业硕士以上学历;
2.有工程编码经验,熟练掌握 Python,C/C++,Golang,Java,JavaScript,TypeScript 等至少一种语言;
3.掌握深度学习基础知识,能根据具体问题做针对性优化,熟悉深度学习中不同任务及相应的主流模型和算法;
4.对 Prompt Engineering、Agentic Workflow、GRPO等新的基于GPT结构的NLP强化学习方法 有实践经验;
5.有高质量论文发表者优先(如ACL、EMNLP、NeurIPS、ICML、ICLR等)。
岗位介绍:
渴望为世界带来新意的人,早已对描绘未来的“热词”不陌生——人工智能、机器学习、数据科学等等。腾讯始终在业界前沿不断探索,积极布局,并为优秀的你提供无限广阔的舞台。我们坚信科技的不断革新,最终能带来美好的、撼动人心的改变。
免责声明:

此信息由腾讯官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“腾讯官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!

FAQ 腾讯(tencent)招聘常见问答

腾讯(tencent)招聘工作地点:
深圳
腾讯(tencent)招聘经验要求:
三年以上工作经验