
本书讲述Apache Flink大数据框架的原理,以及如果将Apache Flink应用于大数据的实时流处理、批处理、批流一体分析等各个场景。通过原理深学习和实践示例、案例的学习应用,使读者了解并掌握Apache Flink流处理的框架的基本原理和技能,近理论与实践的距离。 全书共分为8章,主要内容包括Flink架构与集群安装、Flink发环境准备(基于IntelliJ IDEA和Maven)、发Flink实时数据处理程序、Flink流数据分析、时间和水印概念、窗口操作、状态和容错、侧输出流、Flink流连器、Flink流处理案例、发Flink批数据处理程序、使用Table API行数据处理、Flink on YARN、基于Flink构建批流一体数仓、基于Flink和Iceberg数据湖构建实时数仓。本书源码全部在Apache Flink 1.13.2上调试成功,所有示例和案例均提供Scala语言和Java语言两套API的实现(第8章除外),供读者参考。 本书系统讲解了Apache Flink大数据框架的原理和流、批处理的发实践,内容全面、实例丰富、可操作性强,做到了理论与实践相结合。本书适合大数据学习爱好者、想要门Apache Flink的读者作为门和提高的技术参考书,也适合用作大中专院校大数据专业相关的学生和老师的教材或教学参考书。<br/>【推荐语】<br/>本书除了提供了丰富的上机实践操作和范例程序详细讲解之外,本书作者还为和使用本书的读者提供了搭建好的Hadoop和Flink大数据发和学习环境。读者既可以参照本书的讲解自行搭建Hadoop和Flink环境,也可直使用作者提供的始和学习环境,快速始大数据和Flink的学习。 本书具有以下几个特: (1) 面向零基础读者,知识深浅适当,代码完整易懂。 (2) 内容全面系统,包括架构原理、发环境及程序部署、流和批计算等,并特别包含了第7章“基于Flink构建批流一体数仓”和第8章“基于Flink和数据湖构建实时数仓”内容。 (3) 所有代码均基于Flink 1.13.2。 (4) 双语实现,大部分示例、案例,均包含Scala和Java两种语言版本的实现。<br/>【作者】<br/>辛立伟,一个在IT领域摸爬滚20多年的老程序员、技术培训师、技术作者。横跨Java、数据库、大数据发与分析、人工智能等多个领域,参与多个IT项目的架构设计与发。长期坚持撰写技术博客,曾在多个大学讲授Java发、数据库和大数据技术课程,曾担任中国石油大学(青岛校区)等多所院校的外聘讲师。 <br/>

評論0