Python数据处理 【图灵程序设计丛书】全面掌握用Python进行爬虫抓取以及数据清洗与分析的方法 轻松实现高效数据处理
用传统的电子表格来处理数据不仅效率低下,而且无法处理某些格式的数据,对于混乱或庞大的数据集更是束手无策。本书将教你如何利用语法简单、容易上手的Python轻松处理数据。作者通过循序渐进的练习,详细介绍如何有效地获取、清洗、分析与呈现数据,如何将数据处理过程自动化,如何安排文件编辑与清洗任务,如何处理更大的数据集,以及如何利用获取的数据来创作引人入胜的故事。学完本书,你的数据处理和分析能力将更上一层楼。* 快速了解Python基本语法、数据类型和语言概念* 概述数据的获取与存储方式* 清洗数据并格式化,以消除数据集中的重复值与错误* 学习何时对数据进行标准化,何时对数据清理进行测试并将其脚本化* 使用Scrapy写网络爬虫* 利用新的Python库和技术对数据集进行探索与分析* 使用Python解决方案将整个数据处理过程自动化
¥73.70定价:¥99.00 (7.45折) 电子书:¥16.39
用Python写网络爬虫 第2版 畅销的Python 3网络爬虫 数据抓取采集分析 开发实战图书全新升级版 针对Python 3编写 上一版年度销量近40000册 提供示例完整源码和实例网站搭建源码
畅销的Python网络爬虫开发实战图书全新升级版,上一版年销量近40000册。针对Python 3.6版本编写。提供示例完整源码和实例网站搭建源码,确保用户能在本地成功复现爬取网站环境,并保障网站的稳定性与可靠性以及代码运行结果的可再现性。Internet上包含了许多有用的数据,其中大部分是可以免费公开访问的。但是,这些数据不容易使用,它们内嵌在网站的架构和样式中,在提取时也需要多加小心。网络爬取技术作为一种收集和理解网络上海量信息的方式,正变得越来越有用。本书是使用Python 3.6的新特性来爬取网络数据的入门指南。本书讲解了从静态网站提取数据的方法,以及如何使用数据库和文件缓存技术来节省时间并管理服务器负载,然后介绍了如何使用浏览器、爬虫和并发爬虫开发一个更为复杂的爬虫。借助于PyQt和Selenium,你可以决定何时以及如何从依赖Java
¥32.90定价:¥49.00 (6.72折) 电子书:¥19.60
畅销的Python网络爬虫发实战图书全新升级版,上一版年销量近40000册。针对Python 3.6版本编写。提供示例完整源码和实例网站搭建源码,确保用户能在本地成功复现爬取网站环境,并保障网站的稳定性与可靠性以及代码运行结果的可再现性。Internet上包含了许多有用的数据,其中大部分是可以免费公访问的。但是,这些数据不容易使用,它们内嵌在网站的架构和样式中,在提取时也需要多加小心。网络爬取技术作为一种收集和理解网络上海量信息的方式,正变得越来越有用。本书是使用Python 3.6的新特性来爬取网络数据的门指南。本书讲解了从静态网站提取数据的方法,以及如何使用数据库和文件缓存技术来节省时间并管理服务器负载,然后介绍了如何使用浏览器、爬虫和并发爬虫发一个更为复杂的爬虫。借助于PyQt和Selenium,你可以决定何时以及如何从依赖JavaScript的网