理解Hadoop 2和YARN的工作原理,以及它们对配备MapReduce的Hadoop第1版的改进。 理解基于Hadoop的数据湖和RDBMS数据仓库的比较。 在Linux机器、虚拟的沙箱或集群中安装Hadoop 2和核心服务。 研究Hadoop分布式文件系统(HDFS)。 理解MapReduce和YARN编程的基础。 利用Apache Pig、Hive、Sqoop、Flume、Oozie和HBase简化编程。 观察应用程序运行进度、控制作业并管理工作流程。 利用Apache Ambari高效地管理Hadoop,包括建立从HDFS到NFSv3的网关、制作HDFS快照及配置YARN的攻略。 学习Hadoop 2故障诊断和排除的基础知识,以及学习安装Apache Hue和Apache Spark。
¥54.50定价:¥69.00 (7.9折)
正版现货!自律的交易者-形成赢家态度。 (美)马克·道格拉斯
¥36.90定价:¥37.80 (9.77折)
《智能Web算法(第2版)》深入讲解了如何建立机器学习系统来对采集的用户、Web应用、网站日志等数据进行深入分析和挖掘。经过这一版全面的修订,读者可以看到智能算法是怎样从数据中抽取出真实有价值的信息的,核心的机器学习概念也通过scikit-learn的Python代码示例进行了讲解。《智能Web算法(第2版)》指导读者对来自Web的源源不断的数据流进行采集、存储、建模,并掌握开发推荐引擎、统计分类算法、神经网络和深度学习等技术。
¥51.70定价:¥69.00 (7.5折) 电子书:¥17.25
Effective SQL:编写高质量SQL语句的61条有效方法(英文版)
经典原味:面向所有版本SQL方言的编程指南。 构造合理数据模型,修补现有模型的缺陷。 超强作者阵容,三位微软专家联袂巨献。
¥66.70定价:¥89.00 (7.5折)
Trove项目作为一个DBaaS(数据库即服务),可以方便地为用户提供关系型和非关系型数据库,并在数据库生命周期内提供各种便捷的管理操作。 本书由Tesora团队的CTO Amrith Kumar和研发副总裁Douglas Shelley联合编写,深入介绍并研究了OpenStack中Trove项目的架构及工作原理。 本书适用于对OpenStack生态圈有所了解,并对数据库和开源事业有兴趣的开发者。 欢迎关注OpenStack Trove交流群:538192090(QQ)
¥59.20定价:¥79.00 (7.5折)