小红书(xiaohongshu)招聘大模型与 Agent 平台全栈工程师/专家
招聘职位:
大模型与 Agent 平台全栈工程师/专家 搜索同类职位
岗位职责:
工作职责:
1、大模型与 Agent 平台架构研发:负责大模型平台、Agent 应用平台的架构设计和核心功能研发,构建云原生架构下高可用、高性能、可扩展的微服务体系,支撑模型能力从训练、部署到业务应用的端到端落地。
2、AI 生产链路与 LLMOps 建设:建设面向大模型全流程的 LLMOps / DevOps 能力,覆盖模型训练、模型管理、推理部署、服务发布、监控告警、任务诊断、效果评估等环节,提升大模型生产效率和稳定性。
3、Agent 应用平台建设:参与建设面向业务研发和算法团队的 Agent 开发平台,支持 Agent Workflow、Tool Calling、Function Calling、MCP、RAG、Memory、多轮对话、调试诊断、应用发布等核心能力,降低大模型应用开发和上线门槛。
4、Pipeline 与任务编排系统建设:负责大模型任务流、Pipeline、Argo Workflows / Kubeflow 等任务编排能力建设,提升训练、部署、评估、Agent 应用构建等复杂任务的自动化、可观测和可恢复能力。
5、平台与框架深度结合:将平台能力与训练、推理、部署、Agent Framework 深度结合,通过任务调度、弹性容灾、失败重试、资源隔离、链路追踪、性能优化等能力,端到端提升 AI 生产效率。
6、平台体验优化及业务协同:持续优化 AI 平台和 Agent 应用平台的易用性、稳定性和开发者体验,与算法、推理、训练、云原生、业务研发等团队协作,将平台能力沉淀为可复用、可规模化的标准化能力。
任职要求:
任职要求:
1、本科及以上学历,计算机、软件工程、人工智能等相关专业优先。
2、具备优秀的代码能力,熟悉 Go / Java / Python 中至少一门语言,具备良好的工程实现能力、代码质量意识和系统抽象能力。
3、具备扎实的计算机基础,理解操作系统、数据结构、算法、数据库、网络、分布式系统等基础知识。
4、熟悉云原生和后端技术栈,包括 Kubernetes、Docker、微服务架构、MySQL、Redis、MQ、SQL 等,有高可用、高并发、可观测系统建设经验优先。
5、了解大模型训练、推理、部署、评估及 Agent 应用开发基本流程,熟悉 Prompt Engineering、Tool Calling、Function Calling、RAG、Workflow 编排、Memory、多轮对话、模型评估等相关概念,有实际开发经验优先。
6、熟悉 AI 编程工具和 AI Native 研发方式,能够高效使用 Claude Code、Codex、Cursor 等工具辅助需求分析、代码开发、测试生成、问题排查和工程重构,具备利用 AI 工具提升复杂系统研发效率的实践意识。
7、责任心强,自驱力强,沟通协作顺畅,能与算法、平台、基础架构和业务团队协同推进复杂项目落地。
加分项:
1、有 AI 大模型平台、MLOps、LLMOps、模型部署平台、训练平台或 Agent 应用平台开发经验。
2、有 Agent Framework、AI Workflow、RAG 平台、MCP Server、工具调用平台、Prompt 管理平台、智能体编排系统等实际建设经验。
3、熟悉 LangChain、LlamaIndex、Dify、Coze、AutoGen、CrewAI、Claude Code、MCP 等 Agent / LLM 应用生态或相关设计思想。
4、熟悉 PyTorch、DeepSpeed、Megatron、vLLM、SGLang、TensorRT-LLM 等大模型训练或推理框架,有实际接入、部署或平台化经验。
5、有分布式系统、大规模在线服务、高并发平台、任务调度系统、多租户平台建设经验。
6、有平台产品意识和 AI 工具使用习惯,能从开发者体验出发优化接入、诊断、链路追踪、监控告警和使用效率。
工作职责:
1、大模型与 Agent 平台架构研发:负责大模型平台、Agent 应用平台的架构设计和核心功能研发,构建云原生架构下高可用、高性能、可扩展的微服务体系,支撑模型能力从训练、部署到业务应用的端到端落地。
2、AI 生产链路与 LLMOps 建设:建设面向大模型全流程的 LLMOps / DevOps 能力,覆盖模型训练、模型管理、推理部署、服务发布、监控告警、任务诊断、效果评估等环节,提升大模型生产效率和稳定性。
3、Agent 应用平台建设:参与建设面向业务研发和算法团队的 Agent 开发平台,支持 Agent Workflow、Tool Calling、Function Calling、MCP、RAG、Memory、多轮对话、调试诊断、应用发布等核心能力,降低大模型应用开发和上线门槛。
4、Pipeline 与任务编排系统建设:负责大模型任务流、Pipeline、Argo Workflows / Kubeflow 等任务编排能力建设,提升训练、部署、评估、Agent 应用构建等复杂任务的自动化、可观测和可恢复能力。
5、平台与框架深度结合:将平台能力与训练、推理、部署、Agent Framework 深度结合,通过任务调度、弹性容灾、失败重试、资源隔离、链路追踪、性能优化等能力,端到端提升 AI 生产效率。
6、平台体验优化及业务协同:持续优化 AI 平台和 Agent 应用平台的易用性、稳定性和开发者体验,与算法、推理、训练、云原生、业务研发等团队协作,将平台能力沉淀为可复用、可规模化的标准化能力。
任职要求:
任职要求:
1、本科及以上学历,计算机、软件工程、人工智能等相关专业优先。
2、具备优秀的代码能力,熟悉 Go / Java / Python 中至少一门语言,具备良好的工程实现能力、代码质量意识和系统抽象能力。
3、具备扎实的计算机基础,理解操作系统、数据结构、算法、数据库、网络、分布式系统等基础知识。
4、熟悉云原生和后端技术栈,包括 Kubernetes、Docker、微服务架构、MySQL、Redis、MQ、SQL 等,有高可用、高并发、可观测系统建设经验优先。
5、了解大模型训练、推理、部署、评估及 Agent 应用开发基本流程,熟悉 Prompt Engineering、Tool Calling、Function Calling、RAG、Workflow 编排、Memory、多轮对话、模型评估等相关概念,有实际开发经验优先。
6、熟悉 AI 编程工具和 AI Native 研发方式,能够高效使用 Claude Code、Codex、Cursor 等工具辅助需求分析、代码开发、测试生成、问题排查和工程重构,具备利用 AI 工具提升复杂系统研发效率的实践意识。
7、责任心强,自驱力强,沟通协作顺畅,能与算法、平台、基础架构和业务团队协同推进复杂项目落地。
加分项:
1、有 AI 大模型平台、MLOps、LLMOps、模型部署平台、训练平台或 Agent 应用平台开发经验。
2、有 Agent Framework、AI Workflow、RAG 平台、MCP Server、工具调用平台、Prompt 管理平台、智能体编排系统等实际建设经验。
3、熟悉 LangChain、LlamaIndex、Dify、Coze、AutoGen、CrewAI、Claude Code、MCP 等 Agent / LLM 应用生态或相关设计思想。
4、熟悉 PyTorch、DeepSpeed、Megatron、vLLM、SGLang、TensorRT-LLM 等大模型训练或推理框架,有实际接入、部署或平台化经验。
5、有分布式系统、大规模在线服务、高并发平台、任务调度系统、多租户平台建设经验。
6、有平台产品意识和 AI 工具使用习惯,能从开发者体验出发优化接入、诊断、链路追踪、监控告警和使用效率。
免责声明:
此信息由小红书官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“小红书官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!