哔哩哔哩(bilibili|b站)招聘资深大数据架构工程师-平台工程方向
招聘职位:
资深大数据架构工程师-平台工程方向 搜索同类职位
岗位介绍:
部门介绍
我们是bilibili基础架构部-大数据架构组,负责支撑全公司离线/实时数据基础设施的建设与演进。技术栈覆盖 Hadoop / Spark / Flink / Iceberg / ClickHouse / Kafka / ES / HDFS / Trino等主流开源生态,承担 EB级数据规模下的存储、计算、查询、治理全链路,峰值处理数据量级达到亿级别每秒。我们既是开源生态的深度使用者,也是社区贡献者——团队鼓励参与上游、推动改进合入主线。随着 AI 工具链的成熟,我们正在系统性地把 AI 能力融入大数据基础设施的开发、发布、运维、答疑全流程。这个岗位的一个核心使命,就是让大数据基础设施团队成为"AI-native"的工程团队。
职位描述
工作职责:
一、离线计算方向(Spark / 向量化执行引擎)
1、跟踪 Spark / MapReduce / 向量化执行引擎(Gluten / Velox / Photon / DuckDB)的社区前沿,结合 bilibili 业务做选型和落地
2、主导 Spark 引擎在 PB 级日处理、千节点集群下的稳定性、性能优化,包括但不限于:
(1)Catalyst 优化器改造
(2)Shuffle 优化(Remote Shuffle Service / Celeborn / Magnet)
(3)AQE / Dynamic Allocation / Spec Execution 深度调优
3、推动 Spark 与向量化引擎(Gluten + Velox)的深度集成,降低 CPU 成本、提升查询性能
4、解决批处理任务的资源效率、SQL 兼容性、调度延迟等真实工程问题
5、与湖仓团队配合,做好 Spark on Iceberg / Paimon 的查询和写入优化
二、AI 赋能基础设施研发
1、熟练使用 Claude Code、Cursor、Copilot 等 AI 编程工具,将 AI 深度嵌入日常工作流
2、主导 AI 流程自动化建设,为团队赋能:
(1)开发阶段:基于 AI 的代码生成、Code Review、单测生成、性能 profiling 自动化
(2)发布阶段:AI 辅助的变更影响分析、灰度策略推荐、回滚决策
(3)运维阶段:AI 驱动的告警归并、根因分析、故障自愈
(4)答疑阶段:基于内部知识库的 RAG 答疑机器人、SQL 助手、调优建议生成
3、沉淀 AI 工具链最佳实践,推广到全组并向外辐射
工作要求:
【硬性条件】
●985 / 211 及以上院校全日制本科及以上学历,计算机相关专业
●5 年以上大数据相关工作经验
●至少深度参与过 1 个大型大数据基础设施项目(EB 级存储 / PB 级日处理 / 千节点以上集群 任一)
●Java / Scala / Go / Rust / C++ 中至少两门掌握扎实
●深度参与过 Spark 生产环境(>= PB / 日)的运维和优化,对 Spark 内核源码有源码级理解
●对至少一个领域有体系化认知:Catalyst 优化器 / Tungsten / Shuffle / Spark on K8s
【加分项】
● 对开源生态高度熟悉
● 具备从 0 到 1 设计大型分布式系统的能力,能独立 owner 某个技术方向
● 良好的工程品味:代码质量、测试覆盖、可观测性、稳定性
● 熟练使用 AI 编程工具完成日常开发,对 LLM 能力边界有清晰认知
● 良好的中英文技术阅读和书面表达能力(社区 issue / PR / 设计文档)
● Apache 顶级项目 Committer / PMC,或活跃的 Contributor(有合入主线的非 trivial PR)
●主导过将 AI 能力工程化落地到基础设施场景的真实案例(不只是用 ChatGPT 写代码,而是构建了系统)
● 在 GitHub 有持续的开源项目贡献或个人作品
●有向量化执行引擎(Velox / Gluten / Photon / DuckDB)的开发或深度调优经验
● 主导过 Spark 大版本升级(2.x → 3.x、3.x → 4.x)的项目
● 主导过 Remote Shuffle Service(Celeborn / Uniffle)在生产环境的落地
● Apache Spark / Gluten / Celeborn Committer 优先
投递简历
部门介绍
我们是bilibili基础架构部-大数据架构组,负责支撑全公司离线/实时数据基础设施的建设与演进。技术栈覆盖 Hadoop / Spark / Flink / Iceberg / ClickHouse / Kafka / ES / HDFS / Trino等主流开源生态,承担 EB级数据规模下的存储、计算、查询、治理全链路,峰值处理数据量级达到亿级别每秒。我们既是开源生态的深度使用者,也是社区贡献者——团队鼓励参与上游、推动改进合入主线。随着 AI 工具链的成熟,我们正在系统性地把 AI 能力融入大数据基础设施的开发、发布、运维、答疑全流程。这个岗位的一个核心使命,就是让大数据基础设施团队成为"AI-native"的工程团队。
职位描述
工作职责:
一、离线计算方向(Spark / 向量化执行引擎)
1、跟踪 Spark / MapReduce / 向量化执行引擎(Gluten / Velox / Photon / DuckDB)的社区前沿,结合 bilibili 业务做选型和落地
2、主导 Spark 引擎在 PB 级日处理、千节点集群下的稳定性、性能优化,包括但不限于:
(1)Catalyst 优化器改造
(2)Shuffle 优化(Remote Shuffle Service / Celeborn / Magnet)
(3)AQE / Dynamic Allocation / Spec Execution 深度调优
3、推动 Spark 与向量化引擎(Gluten + Velox)的深度集成,降低 CPU 成本、提升查询性能
4、解决批处理任务的资源效率、SQL 兼容性、调度延迟等真实工程问题
5、与湖仓团队配合,做好 Spark on Iceberg / Paimon 的查询和写入优化
二、AI 赋能基础设施研发
1、熟练使用 Claude Code、Cursor、Copilot 等 AI 编程工具,将 AI 深度嵌入日常工作流
2、主导 AI 流程自动化建设,为团队赋能:
(1)开发阶段:基于 AI 的代码生成、Code Review、单测生成、性能 profiling 自动化
(2)发布阶段:AI 辅助的变更影响分析、灰度策略推荐、回滚决策
(3)运维阶段:AI 驱动的告警归并、根因分析、故障自愈
(4)答疑阶段:基于内部知识库的 RAG 答疑机器人、SQL 助手、调优建议生成
3、沉淀 AI 工具链最佳实践,推广到全组并向外辐射
工作要求:
【硬性条件】
●985 / 211 及以上院校全日制本科及以上学历,计算机相关专业
●5 年以上大数据相关工作经验
●至少深度参与过 1 个大型大数据基础设施项目(EB 级存储 / PB 级日处理 / 千节点以上集群 任一)
●Java / Scala / Go / Rust / C++ 中至少两门掌握扎实
●深度参与过 Spark 生产环境(>= PB / 日)的运维和优化,对 Spark 内核源码有源码级理解
●对至少一个领域有体系化认知:Catalyst 优化器 / Tungsten / Shuffle / Spark on K8s
【加分项】
● 对开源生态高度熟悉
● 具备从 0 到 1 设计大型分布式系统的能力,能独立 owner 某个技术方向
● 良好的工程品味:代码质量、测试覆盖、可观测性、稳定性
● 熟练使用 AI 编程工具完成日常开发,对 LLM 能力边界有清晰认知
● 良好的中英文技术阅读和书面表达能力(社区 issue / PR / 设计文档)
● Apache 顶级项目 Committer / PMC,或活跃的 Contributor(有合入主线的非 trivial PR)
●主导过将 AI 能力工程化落地到基础设施场景的真实案例(不只是用 ChatGPT 写代码,而是构建了系统)
● 在 GitHub 有持续的开源项目贡献或个人作品
●有向量化执行引擎(Velox / Gluten / Photon / DuckDB)的开发或深度调优经验
● 主导过 Spark 大版本升级(2.x → 3.x、3.x → 4.x)的项目
● 主导过 Remote Shuffle Service(Celeborn / Uniffle)在生产环境的落地
● Apache Spark / Gluten / Celeborn Committer 优先
投递简历
免责声明:
此信息由b站官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“b站官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!