物联网、云计算和移动技术的普及,让数据量呈现井喷式增长,建设兼顾效率和质量的大数据体系成为了业界的共同课题。
为此,dbaplus社群携手哔哩哔哩四位大数据专家,围绕“B站大数据体系建设的技术选型与落地实践”这一主题开展线上直播分享,针对离线平台、流式数据集成、OLAP、数据治理等议题进行深入探讨,给大家提供企业级大数据体系建设管理经验参考。
- 观看方式:线上直播间
- 直播日期:2023年10月13日(周五)
- 直播时间:14:30-17:30
- 报名地址:B站大数据体系建设的技术选型与落地实践
活动议程
分享嘉宾及议题
议题要点及收获:
- 分享B站大数据离线平台的演进路径、平台建设经验和落地效果;
- 分析并解决离线平台高速增长过程中的痛难点;
- 思考并规划B站未来的大数据发展方向。
嘉宾介绍:
B站大数据架构团队负责人,负责计算平台、OLAP平台、存储系统、资源调度、平台工程等系统的建设工作。10年以上大数据架构和平台产品经验,曾在大众点评、阿里云、携程等多家公司负责大数据平台和架构组件的研发工作,对分布式计算、存储、OLAP引擎、大数据平台产品和系统架构等方面有丰富的研发和落地实践经验。
议题要点及收获:
- 万亿数据量场景下,B站如何基于Flink的流式集成架构解决高实时性、高稳定性的需求挑战?
- 总结B站数据集成架构的演进历程及生产实践中的稳定性建设经验;
- 分享B站流式数据集成服务的建设方式及痛难点解决方案。
嘉宾介绍:大数据集成&存储负责人,支撑公司多部门的数据集成业务及大数据离线存储服务。
议题要点及收获:
- 分享B站基于Apache Iceberg支持OLAP分析场景的落地实践,并分析基于Iceberg支撑OLAP业务的可行性;
- 如何通过Iceberg索引、预计算等功能进行查询加速?
- 如何对Iceberg表进行自动化调优?如何针对日志场景进行优化?
嘉宾介绍:
曾就职于Intel、eBay、阿里巴巴等公司,主要从事大数据领域的工作,是Apache Flink Committer以及Apache Hive PMC成员。目前就职于B站基础架构部大数据架构-OLAP平台,负责湖仓一体方向的研发工作。
议题要点及收获:
- 介绍并理解DAMA-数据治理运营框架的理论概念;
- 从组件建设、降本治理规划两方面,分享B站基于数据治理运营框架的落地实践;
- 总结数据治理建设的时间契机、思路及路径;
- 阐述元数据的定义及其收集、管理、使用方法。
嘉宾介绍:从事数据一线工作多年,先后在eBay、携程从事数仓、数据分析、数据产品工作,目前在B站实践DAMA数据治理,负责过数据质量、数据成本两大主题 ,参与了B站的数委会、数据治理平台、元数据数仓建设、数据资产归属等一系列数据管理能力提升的项目活动。
报名方式
- 报名地址:B站大数据体系建设的技术选型与落地实践
- 添加助手dbayuqing获取PPT、加入直播交流群
评论留言