整理了一些大数据的好书分享给你,从大数据入门到实战,深入原理,大数据架构这些全都有,包含hadoop,hive,spark,flink,数据科学等等。
(一)Linux
- 《Linux命令行大全》(第2版)William Shotts 著
- 《linux权威指南(第三版)》Matt Welsh/Matthias Dalheimer/Kaufman 著
- 《Linux命令、编辑器与Shell编程》Mark G. Sobell 著
(二)整体架构
- 《Hadoop权威指南:大数据的存储与分析》(第4版) Tom White 著
- 《大数据之路:阿里巴巴大数据实践》 阿里巴巴数据技术及产品部 著
- 《大数据技术体系详解:原理、架构与实践》 董西成 著
- 《算法与数据中台》詹盈 著
- 《数据中台:让数据用起来》付登坡 江敏 任寅姿 孙少忆 等著
- 《Designing Data-Intensive Applications》 Martin Kleppmann 著
- 《分布式系统:概念与设计》George Coulouris/Jean Dollimore/Tim Kindberg/Gordon Blair6
(三)数据采集
- 《I heart logs》Jay Kreps 著
- 《Kafka The Definitive Guide》Neha Narkhede/Gwen Shapira/Todd Palino 著
(四)计算引擎
- 《Hadoop技术内幕:深入解析MapReduce架构设计与实现原理》董西成 著
- 《Learning Spark》 2nd Edition Tathagata Das/Jules Damji/Brooke Wenig/Denny Lee 著
- 《Stream Processing with Apache Flink: Fundamentals, Implementation, and Operation of Streaming Applications》 Fabian Hueske/Vasiliki Kalavri 著
(五)存储系统
- 《Hadoop技术内幕:深入解析Hadoop Common和HDFS架构设计与实现原理》蔡斌/陈湘萍 著
- 《HBase原理与实践》胡争/范欣欣 著
(六)OLAP引擎
- 《Apache Kylin权威指南》Apache Kylin核心团队 著
- 《ClickHouse原理解析与应用实践》朱凯 著
(七)数据分析
- 《Hive性能调优实战》林志煌 著
- 《Hadoop构建数据仓库实践》王雪迎 著
- 《数据仓库 》W. H. Inmon著
- 《数据仓库工具箱》(第3版)Ralph Kimball/Margy Ross 著
- 《Star Schema完全参考手册》Christopher Adamson 著
- 《大数据分析的道与术》 毕然 著
(八)大数据应用
- 《用户画像 》赵宏田 著
- 《数据化运营》 赵宏田/江丽萍/李宁
- 《数据驱动:从方法到实践》桑文锋 著
(九)监控运维
- 《SRE:Google 运维解密》Betsy Beyer等 著
- 《SRE生存指南:系统中断响应与正常运行时间最大化》 Nat Welch 著
- 《Prometheus技术秘笈》百里燊 著
- 《Zabbix企业级分布式监控系统》(第2版)吴兆松 著
(十)数据治理
- 《DAMA数据管理知识体系指南》(原书第2版)数据管理协会(DAMA国际) 著
- 《主数据驱动的数据治理:原理、技术与实践》 王兆君/王钺/曹朝辉 著
- 《大数据治理与安全从理论到开源实践》刘驰/胡柏青/谢/施盟捷/陈喆毓/林秋霞 著
(十一)机器学习
- 《大数据时代的算法-机器学习、人工智能及其典型实例》 刘凡平 著
- 《Python大战机器学习》华校专/王正林 著
- 《机器学习-深入理解机器学习-从原理到算法》 Shai Shalev Shwartz/Shai Ben David 著
- 《深度学习入门:基于Python的理论与实现》 [ 日] 斋藤康毅 著
- 《推荐系统实践》项亮 著
总结
上面给大家推荐的书籍,有时间可以好好阅读一下,如果你想从事大数据的开发,要不断向底层应用层面进阶,学习大厂最新技术,才能更好地服务于各个行业。
评论留言