随着使用Hadoop存储并处理大量数据的企业不断增多,Hadoop安全性日益凸显,尤其是在金融和医疗等涉及敏感信息的行业。本书两位作者均来自Hadoop安全防范一线,书中详细论述了身份验证、加密、密钥管理等诸多重要主题,并给出了具体处理建议和案例分析,读者可以从中了解搭建和使用Hadoop的架构师是如何安全管理大数据的。- 了解分布式系统,尤其是Hadoop所面临的安全挑战- 学习如何尽可能确保Hadoop集群硬件的安全性- Kerberos网络认证协议概览- 身份验证、授权和审计原则在Hadoop中的应用- 静态数据和动态数据的加密- 客户端访问和数据提取过程的安全防护措施
¥59.20定价:¥79.00 (7.5折) 电子书:¥39.99
Hadoop应用架构 【图灵程序设计丛书】全面解析Hadoop应用构架,囊括MapReduce、Spark、Hive、Giraph、Oozie、Flume、Pig、Impala等新兴工具的应用
使用Hadoop进行数据存储和建模的着眼点和思路 将数据输入、输出系统的*方案 MapReduce、Spark和Hive等数据处理框架介绍 数据去重、窗口分析等常见Hadoop处理模式应用 在Hadoop上采用Giraph、GraphX等图形处理工具 综合使用工作流以及ApacheOozie等调度工具 以Apache Oozie、Apache SparkStreaming和Apache Flume进行近实时流处理 点击流分析、欺诈检验和数据仓库的架构案例 Hadoop之父DougCutting作序推荐。 对Hadoop有所了解 与 能够使用Hadoop形成实际解决方案 之间的一座桥梁!
¥51.70定价:¥69.00 (7.5折) 电子书:¥27.99
Hadoop数据分析 【图灵程序设计丛书】Hadoop及Spark指导手册 以数据科学的视角介绍Hadoop集群计算和分析 纵览Hadoop生态系统 基于python代码
通过提供分布式数据存储和并行计算框架,Hadoop已经从集群计算的抽象演变成了大数据操作系统。本书从数据科学的视角,介绍Hadoop集群计算和分析,重点关注可构建的具体分析、数据仓储技术和高阶数据流。书中主要内容如下: Hadoop和集群计算背后的核心概念 使用设计模式和并行分析算法创建分布式数据分析作业 在分布式环境下使用Apache Hive和HBase进行数据管理、数据挖掘和数据仓储 使用Sqoop和Apache Flume从关系数据库采集数据 使用Apache Pig和Spark DataFrame编写复杂的Hadoop和Spark应用程序 通过Spark MLlib运用分类、聚类和协同过滤等机器学习技术 我还未见过比本书更好的Hadoop框架讲解。 Marck Vaisman,博思艾伦咨询公司数据科学家、乔治?华盛顿大学兼职教授、数据社区DC联合创始人 每个概念都得以清晰明了的解读,在容易忽略细节的部分又都有补充资源,供读者深入学
¥54.50定价:¥69.00 (7.9折)
¥40.70定价:¥59.00 (6.9折)
精通Hadoop 从入门到精通,全面解析下一代Hadoop数据处理平台
Hadoop 是大数据处理的同义词。 Hadoop 的编程模型简单,“一次编码,任意部署”,且生态圈日益完善,已成为一个可供不同技能水平的程序员共同使用的全方位平台。今天,面临着处理和分析大数据的任务, Hadoop 成了理所当然的工具。 Hadoop 2.0 扩展了羽翼,能覆盖各种类型的应用模式,并解决更大范围的问题。
¥33.80定价:¥49.00 (6.9折)