
这是一本理论高度概括的书,讲解流式处理核心、本质的概念、特性、设计和方法。本书分为两部分:第一部分以Beam的编程模型为抓手讨论流处理的种种核心问题,重是相对高层次地讨论批处理模型以及流处理模型;第二部分讨论流与表的二象性,即两者之间的类比与差异,对概念行深探讨,并讨论关于流处理的“流与表”的思考方式。本书还概要浏览大数据处理系统的家族历史,深讨论流式系统发展领域的一些重要贡献。此外,本书配有大量的动画示意图,读者可以在线查看相关动图示例。 本书覆盖流式系统的核心理论和本质概念,适合大数据系统爱好者、相关专业学生、数据工程师、数据科学家和发人员阅读和参考。尽管本书只是流式系统的导论读物,但是仍然需要读者了解大数据处理系统的基本原理并具备相关的使用经验。<br/>【推荐语】<br/>1.本书从宏观层面介绍流计算,并介绍处理实时数据流的内容、地、时间和方式。 2.本书一作泰勒·阿基道是谷歌公司的高级软件工程师、数据处理语言和系统部门的技术负责人,拥有丰富的经验,负责谷歌的Apache Beam、Cloud Dataflow、Flume、MapReduce和MillWheel等内部数据处理工具。他还是Apache Beam PMC的创始成员。 3.本书译者为阿里技术团队,由专门的流式系统技术的推广团队,可以借势推广。<br/>【作者】<br/>泰勒·阿基道(Tyler Akidau)是谷歌的高级软件工程师、数据处理语言与系统团队的技术负责人,也是Apache Beam PMC的创始成员。 斯拉瓦·切尔尼亚克(Slava Chernyak)是谷歌西雅图办公室的高级软件工程师。他花了6年多的时间研究在谷歌内部使用的大规模流数据处理系统。 鲁文·拉克斯(Reuven Lax)是谷歌西雅图办公室的高级软件工程师,过去十多年他一直在帮助制定谷歌的数据处理和分析的战略。他也是Apache Beam PMC的成员。<br/>

評論0