通过本书的学习,读者能够: ·掌握数据挖掘的相关软件包,如dplyr、ggplot2等。 ·学会如何通过数据挖掘标准流程(CRISP-DM)来有效地组织数据挖掘项目。 ·对数据执行数据清理和数据验证操作—为数据挖掘活动准备数据。 ·以数值方式和图形方式分别执行探索性数据分析。 ·发简单线性回归模型、多元线性回归模型以及逻辑回归模型。 ·应用基本的集成学习技术整合不同数据挖掘模型的结果。 ·对非结构化的PDF文件和文本数据执行文本挖掘及分析。 ·编制有效传达数据分析目标、方法和洞察的报告。
RStudio for R Statistical Computing Cookbook