但是依然有很多人想知道如何下手对手里的数据进行处理,从什么维度进行分析。今天DataHunter数猎哥就来给大家分享一下,拿到数据以后,我们该用哪些方法来分析数据,获得进一步工作指导。
在说数据分析方法之前,我们先来明确两个概念:数据分析方法与数据分析方法论。
分析方法论是一次数据分析工作遵循的宏观框架;分析方法,是针对不同目标、不同数据源选用的细节工具,一次分析工作中会借助很多种不同的分析工具。
如图所示,定下框架在前,使用细节工具在后。
常见的数据分析方法论有以下几种:营销方面的理论模型有4P、用户使用行为、STP理论、SWOT等,而管理方面的理论模型有PEST、5W2H、时间管理、生命周期、逻辑树、金字塔、SMART原则等,这些都是经典的营销、管理方面的理论。
而数据分析方法则是指具体的分析方法,基本的分析方法有:对比分析、分组分析法、交叉分析法、结构分析法、漏斗图分析法、综合评价分析法、因素分析法、矩阵关联分析法等;高级的分析方法有:相关分析法、回归分析法、聚类分析法、判断分析法、成分分析法、因子分析法、对应分析法、时间序列等。
如图所示,在之前的文章中我们已经为大家分享过:①基于流程:漏斗分析、留存分析;②基于精细化运营:用户分层与分群;③基于实验的分析方法:A/B测试。想了解的朋友可以查看:
如图所示是一些统计学中的概念,当我们拿到数据后,可以将分析目的和这些概念本身的含义分别结合,进行有针对性的数据分析。
1.平均数
运用计算平均数的方法来反映总体在一定时间、地点条件下某一数量特征的一般水平的分析方法叫平均分析法。
平均数的相关指标可用于对比同类现象在不同地区、不同行业、不同单位等之间的差异程度,比用总量指标对比更具说服力;利用平均指标对比某些现象在不同历史时期的变化,更能说明其发现趋势和规律。
平均分析法常用指标有算术平均数、调和平均数、几何平均数、众数和中位数等,其中最为常见的是算术平均数,也就是日常所说的平均数或平均值。
如下图显示,居民可支配收入每个居民都是不一样的,那么如何反应不同年份居民可支配收入的增长情况呢?这个时候就可以使用平均数来综合考量居民可支配收入,通过不同年份人均可支配收入变化来反应当年的居民可支配收入水平。类似的,男女的身高对比、体重对比,岗位的薪资对比等,都可以使用平均数指标。
2.众数
在(1,2,2,2,2,3,3,4,5,5)这组十个数据组成的样本中,2是出现次数最多的数据,有4次。假设这是10家公司的满意度调查结果,2代表“较为满意”,就说明在10家公司中,有较多人对你产品的整体满意度一般。从众数角度讲,你需要进一步找到产品可迭代之处。
众数是指在数据中发生频率最高的数据值,这组样本的众数就是:2,较为满意。
众数也可能不存在,如(1,3,4,5)这组数中,所有数出现的次数均为1次,因此这组数可以认为没有众数。
在统计学中,众数反映了一组数据的集中程度,日常生活中诸如“最佳”,“最受欢迎”,“最满意”等,都与众数有关系,它反映了一种最普遍的倾向。
3.中位数
中位数是另外一种反映数据的中心位置的指标。
顾名思义,其确定方法是将所有数据以由小到大的顺序排列,位于中央的数据值就是中位数。
因为中位数是通过排序得到的,所以它不受最大、最小两个极端数值的影响,而且部分数据的变动对中位数也没有影响。
因其可以很好地避免样本中个别数据的跳脱,用它来描述这个样本的集中趋势就是最好不过的了。
Tips:想描述一个样本的集中趋势,如果各个数据之间的差异程度较小,用平均值;如果数据之间的差异程度较大,或者有个别的极端值,中位数或众数会有较好的代表性。
4.最大(小)数
最值,也就是一组数据中最大(小)的那个数。在日常工作中作为典型代表与异常值进行分析,如销售冠军,爆款商品等。如下图,你可以将销售额最大的几款商品提取出来,作为典型商品进行分析,找到爆款原因,看是否可以复制到其他商品。
5.比率
比率的作用主要是消除样本数量不同带来的可比性差异,例如,如河南大学生数量为103万,北京大学生数量为51万,能够说明河南的受教育程度比北京高吗?
再如,数猎哥写了两篇文章,其中一篇的阅读量为980,点赞数为44,另一篇的阅读量为1024,点赞数为33,哪篇文章的质量更高?(所以,请各位同学看过文章点个“好看”,避免数猎哥怀疑人生)
6.绝对值
绝对值是对于观测对象的度量,通常用于如销售额、应付账款等方面,所做动作就是累加。如图所示,毛利额就是一个绝对值,指标没有进行加工,只是做了一下汇总。
7.计数
计数就比较简单了,可理解为重复加1的行为,通常用于算出对象有多少个,如订单数、访客数。如图所示,订单数就是一个计数的案例,可以理解为一个订单编号就是一个订单,订单编号的数量就是订单的数量,因此求订单数的时候,可以对订单编号进行计数。
对比分析法是指将两个或两个以上的数据进行比较,分析它们的差异,从而揭示这些数据所代表的事物发展变化情况和规律性。它可以非常直观地看出事物某方面的变化或差距,并且可以准确、量化地表示出这种变化或差距是多少?对比分析法可分为静态比较和动态比较两类。
静态比较:在同一时间条件下对不同总体指标的比较,如不同部门、不同地区、不同国家的比较、也叫横向比较,简称横比;
动态比较:在同一总体条件下对不同时期指标数值的比较,也叫纵向比较,简称纵比。这两种方法既可单独使用,也可结合使用。
进行对比分析时,可以单独使用总量指标、相对指标或平均指标,也可将它们结合起来进行对比。比较的结果可用相对数表示,如百分数、倍数等指标。
在使用对比分析法时,需要先注意以下几个方面:①指标的口径范围、计算方法、计量单位必须一致,即要用同一种单位或标准去衡量;②对比的对象要有可比性;③对比的指标类型必须一致。无论绝对数指标、相对数指标、平均数指标,还是其他不同类型的指标,在进行对比时,双方必须统一。
1.时间维度对比
同一指标在不同时间维度下的对比,如同比、环比、定基比等。同比就是与去年的同一个时间段进行对比分析,可以是季、月、周、天;环比就是和上一个时间段来对比(也有和下一个时间段对比的,也叫后比),例如本月和上月,本周和上周对比;定基比是和某个指定的时期进行对比分析,比如2013年每个月都和2013年1月的销售额进行对比取值。
2.空间对比
就是不同空间数据的对比,比如华北区和华南区对比,北京和上海,上海古北店和成都春熙路店进行对比。相似空间的对比对象必须是形态上比较接近,先进空间则是和同一种形态中的优秀空间进行对比,与扩大空间的对比,比如北京和全国的数据对比,北京王府井店和全北京的数据对比,和竞争对手的对比也在此列。
如图为2018年全年各销售小组销售额对比,其对比的时间范围一致、指标一致、指标含义一致、维度为各个销售小组,具有相同性质。
3.计划对比
和计划标准的对比是销售追踪中非常重要的一环,所有的绩效考核都是计划标准,例如销售实际达成金额与销售计划达成金额对比,看销售是否完成当初指定的计划,如果没有完成,原因在哪里。
4.与经验值或理论值对比
其中的经验标准是在大量的实践过程中总结出来的值,而理论标准则是根据理论推断出来的值,平均值则是某一空间或时间的平均值。如,一单一品率:所有销售小票中只有一个商品的小票数量占比。参考值为小于40%,如果数据超过了40%,则需要考虑如何调整策略,帮助客户做关联购买。而参考值小于40%,就是一个理论值。
结构分析法是指被分析总体内的各部分与总体之间进行对比的分析方法,即总体内各部分占总体的比例,属于相对指标。一般某部分的比例越大,说明其重要程度越高,对总体影响越大。
市场占有率是分析企业在行业中竞争状况的重要指标,也是衡量企业运营状况的综合经济指标。市场占有率高,表明企业运营状况好,竞争能力强,在市场上占据有利地位;反之,则表明企业运营状态差,竞争能力弱,在市场上处于不利地位。
1.数据分析方法论是一次数据分析工作遵循的宏观框架;分析方法,是针对不同目标、不同数据源选用的细节工具。
2.统计学中的概念会帮助我们做有针对性的数据分析。
3.数据分析要结合目标,真正落实到优化未来业务上去。
PS:以上图表都是使用Data Analytics制作,Data Analytics是一个轻量级业务数据可视化平台,可一键快速接入企业本地和云端内外部Execl/CSV等数据文件,无需编程仅需简单的拖拽即可制作酷炫的数据可视化看板,用直观的数据帮你做好的决策。