Hadoop数据分析 【图灵程序设计丛书】Hadoop及Spark指导手册 以数据科学的视角介绍Hadoop集群计算和分析 纵览Hadoop生态系统 基于python代码
通过提供分布式数据存储和并行计算框架,Hadoop已经从集群计算的抽象演变成了大数据操作系统。本书从数据科学的视角,介绍Hadoop集群计算和分析,重点关注可构建的具体分析、数据仓储技术和高阶数据流。书中主要内容如下: Hadoop和集群计算背后的核心概念 使用设计模式和并行分析算法创建分布式数据分析作业 在分布式环境下使用Apache Hive和HBase进行数据管理、数据挖掘和数据仓储 使用Sqoop和Apache Flume从关系数据库采集数据 使用Apache Pig和Spark DataFrame编写复杂的Hadoop和Spark应用程序 通过Spark MLlib运用分类、聚类和协同过滤等机器学习技术 我还未见过比本书更好的Hadoop框架讲解。 Marck Vaisman,博思艾伦咨询公司数据科学家、乔治?华盛顿大学兼职教授、数据社区DC联合创始人 每个概念都得以清晰明了的解读,在容易忽略细节的部分又都有补充资源,供读者深入学
¥54.50定价:¥69.00 (7.9折)
Java技术手册(第6版) 本书旨在帮助有经验的Java程序员充分使用Java 7和Java 8的功能,但也可供Java开发新手学习。书中提供了大量示例,演示了如何充分利用现代API和开发过程中的极佳实践。这一版进行了全面更新。第1部分快速准确地介绍了Java编程语言和Java平台。第2部分讨论了核心概念和API,展示了如何在Java环境中解决实际的编程任务。 通过学习本书,你将能够: 掌握全新的语言细节,包括Java 8的变化 使用基本的Java句法学习面向对象编程 研究泛型、枚举、注解和lambda表达式 理解面向对象设计中使用的基本技术 学习并发和内存管理,以及二者间错综复杂的关系 使用Java集合,处理常用的数据格式 深入研究Java全新的I/O API,包括异步通道 使用Nashorn在Java虚拟机中执行JavaScript代码 熟悉OpenJDK中的开发工具
¥54.50定价:¥79.00 (6.9折)