Hadoop数据分析 【图灵程序设计丛书】Hadoop及Spark指导手册 以数据科学的视角介绍Hadoop集群计算和分析 纵览Hadoop生态系统 基于python代码
通过提供分布式数据存储和并行计算框架,Hadoop已经从集群计算的抽象演变成了大数据操作系统。本书从数据科学的视角,介绍Hadoop集群计算和分析,重点关注可构建的具体分析、数据仓储技术和高阶数据流。书中主要内容如下: Hadoop和集群计算背后的核心概念 使用设计模式和并行分析算法创建分布式数据分析作业 在分布式环境下使用Apache Hive和HBase进行数据管理、数据挖掘和数据仓储 使用Sqoop和Apache Flume从关系数据库采集数据 使用Apache Pig和Spark DataFrame编写复杂的Hadoop和Spark应用程序 通过Spark MLlib运用分类、聚类和协同过滤等机器学习技术 我还未见过比本书更好的Hadoop框架讲解。 Marck Vaisman,博思艾伦咨询公司数据科学家、乔治?华盛顿大学兼职教授、数据社区DC联合创始人 每个概念都得以清晰明了的解读,在容易忽略细节的部分又都有补充资源,供读者深入学
¥51.70定价:¥69.00 (7.5折)
学习敏捷 构建高效团队 精讲精益、Scrum、极限编程和看板方法,全面解读敏捷价值观及原则,梳理敏捷运动发展
本书将帮你确定应采用哪些原则来解决你的团队、公司、项目的具体开发问题。你将发现如何使用那些信息指导方法论和实践的选择。 通过本书你将学到: 软件开发团队的价值观; 体现这些价值的方法论; 组成这些方法论的实践; 帮助你将这些价值观、方法论和实践都应用到你的团队和公司的原则。
¥59.20定价:¥79.00 (7.5折) 电子书:¥31.99