从超大规模的事件流中发现模式可能很困难,但是学习如何发现这些模式却不见得很难。这本实战指南告诉我们如何利用Apache Hadoop,使用简单、有趣、精致的工具,解决大规模数据处理中的模式发现以及很多其他问题。通过处理真实数据、解决现实问题,你将对大数据有一个实用的、可操作的认识。本书非常适合Hadoop新手,也很适合那些想要提升技能的有经验的实践家。其中,*部分解释了Hadoop和MapReduce的工作原理,第二部分讲述了很多数据处理用到的分析模式。通过一些练习,你还将学会如何使用Apache Pig进行数据处理。 ■ 学习使用Hadoop的必要原理,包括数据和计算在集群中的移动行为 ■ 深入理解MapReduce机制,用Python创建你的*个MapReduce作业 ■ 理解如何以Pig脚本的形式运行MapReduce作业链 ■ 全书使用真实数据集,即棒球统计数据集 ■ 提供分析模式的示例,并学
¥54.50定价:¥69.00 (7.9折)