1. 6.3 数据分析五步法

获得了基础数据后,我们该怎么研究数据?一般而言,我们可以通过五步分析法进行简单的数据处理。

第一步,定义问题。 明确需要通过数据解决的业务问题,尽量准确地表达问题,以及对数据对象进行定义。

第二步,收集信息。 了解问题的背景,收集和整理关于要解决问题的相关数据。

第三步,选取分析方法。 分析涉及的主要数据维度,为后面提取数据需求做准备。同时,选取必要的分析方法和分析工具(软件)。

第四步,数据提取整理。 根据分析内容和分析方法,提出所需的数据指标需求。在实际分析中,要多数据、部分加工,来更好地支持分析的问题。

第五步,分析结果和结论。 得出明确的分析结果,并且以正确的方式呈现。

下面,我们将通过一个虚拟案例来实践这五步分析过程。

某网站是一个新兴的互联网O2O网站,根据内部数据分析,想要了解该网站未来三个月的日PV。

上面这一段定义了一个明确的问题,因此,工作人员通过后台收集数据,得出以下曲线。

因为这个分析的目的是获得未来的网站发展趋势,因此,可以添加趋势线。图像是最直观地展示数据发展趋势和预测分析的方法,在Excel中就可以添加,常用的趋势线包括:指数,对数,线性,多项式,等等。

不同的曲线对应不同的形态:指数曲线有着增速放大的趋势,对数曲线有着增速放缓的趋势,线性曲线一般在没有明确的趋势时使用。

接下来我们对数据提取整理。我们可以把三种趋势线都在表格中表现出来,然后在选项中选择显示R²,R²是一个用来展示预测效果的系数,介于0~1之间,越接近1越准确。所以我们在选取趋势线的时候,应该选取R²值最大的趋势线。

而在本案例中,进行趋势线选取的时候发现,线性趋势图的R²值达到0.9771,预测效果较好,所以选取线形图进行预测。

那么在分析结果和结论的时候,我们就可以对线性趋势图进行预测,预测未来三个月的日PV值的方法如下图所示。

上面这个案例通过简单的工具(Excel)来分析简单问题(一个稳定发展的网站的未来预测),用来描述数据分析五步法的工作方式。

由于数据分析的复杂程度较高,大型互联网企业都纷纷建立数据分析部门来专业地进行相关工作。对于运营人员来说,更重要的是理解整个分析过程的逻辑,在需求(定义问题环节)到分析的整个过程中,能做到“不掉进坑里”。

而专业的数据分析常见的SAS软件,以及涉及的数据的描述性分析、线性回归分析、典型相关分析等,大家可以通过学习《数据分析方法》等相关课程了解,由于笔者能力范围的原因,无法一并阐述,敬请谅解。

Copyright & copy 7dtime.com 2014-2018 all right reserved,powered by Gitbook该文件修订时间: 2018-06-23 10:12:35

results matching ""

    No results matching ""