数据处理是指对收集到的数据进行加工整理,形成适合数据分析的样尸它是数据分析前必不可少的阶段。数据处理的基本目的是从大量的、杂乱无章、难以理解的数据中抽取并推导出对解决问题有价值、有意义的数据。
数据处理主要包括数据清洗、数据转化、数据提取、数据计算等处理方法。一般拿到手的数据都需要进行一定的处理才能用于后续的数据分析工作,即使再“干净”的原始数据也需要先进行一定的处理才能使用。
数据分析主要是指通过统计分析或数据挖掘技术对处理过的数据进行分析和研究,从中发现数据的内部关系和规律,为解决问题提供参考。
在确定数据分析目的和内容阶段,数据分析师就应当为所分析的内容确定适合的数据分析方法。到了数据分析阶段,就能够驾驭数据,从容地进行分析和研究了。