经常有人说,我不是专业的数据分析师,但工作中常常需要分析数据才能推进业务,有没有一种简单粗暴的方式可以让我快速上手数据分析软件呢?
现代管理学之父彼得·德鲁克说过一句很经典的话:如果你不能衡量它,那么你就不能有效增长它。所以,我们做数据分析是为了能以量化的方式来分析业务问题,并得出结论。其中有两个重点词语:量化和业务。
1、量化
量化是为了统一认知,并且确保路径可回溯、可复制。 统一认知后,才能保证不同层级、不同部门的人在平等话语权和同一个方向上进行讨论和协作,才能避免公司内的人以“我感觉”、“我猜测”来判断当前业务的情况。
例如,这个产品功能上线后效果怎么样?A方案和B方案哪个更好些呢?诸如此类的问题,都牵涉到一个“标准”的问题,如果标准是这个功能必须有200人以上使用,那只有100人使用都不叫效果好。只有给出真实、可靠、客观的事实数据,才能对具体的活动作出最真实的评判。
2、业务
只有解决业务问题分析才能创造价值。价值包括个人价值和公司价值。对于公司来讲,解决业务问题可以提高收益或者降低成本;对于个人来讲,知道怎么利用数据分析软件解决业务问题,对个人的能力成长和职业生涯都有非常大的帮助。
数据分析是基于商业目的,收集、整理、加工和分析数据,提炼有价值信息,并指导实践的过程。
在实际应用中,数据分析可帮助人们作出判断,以便采取适当行动。但数据本身其实并没有任何价值,是分析方法的存在使得原本毫无价值的数据大放异彩。数据分析的三大作用,主要是现状分析、原因分析和预测分析。
那什么是指标呢?假设隔壁老王开了一家水果铺子,你问他每天生意怎么样,他可以回答卖的“不错,很好”、“最近不景气”。这些都是很虚的词,因为他认为卖的不错也许是卖了50个,而你认为的卖的不错,是卖了100。老王想要描述生意,他应该使用销量,这就是他的指标。
互联网想要描述产品,也应该使用活跃率、使用率、转化率等指标。
在建立指标体系的过程中,我们知道孤立的指标发挥不出数据的价值,和分析思维的金字塔结构一样,指标也有固有结构,呈现树状。
我们在考虑问题的时候都会遵循一个思路,例如从宏观到微观,从全局到局部,数据分析也不例外。例如产品运营中的数据分析指标体系:
需要注意的是,指标体系没有放之四海而皆准的模板,不同业务形态有不同的指标体系。移动APP和网站不一样,SaaS和电子商务不一样,低频消费和高频消费不一样。好比一款婚庆相关的APP,不需要考虑复购率指标;互联网金融,必须要风控指标;昨日突破了2135亿成交额的天猫双十一,它属于电子商务,所以卖家和买家的指标也各不一样。这些需要不同行业经验和业务知识去学习掌握。
美国硅谷增长黑客专家曲卉提出了产品的“北极星”指标。定义北极星指标有6个标准:
①这个指标可以让你知道你的用户体验到了产品的核心价值吗?
②这个指标能够反映用户的活跃程度吗?
③如果这个指标变好了,是不是说明整个公司是在向好的方向发展?
④这个指标是不是很容易被整个团队理解和交流呢?
⑤这个指标是一个先导指标,还是一个滞后指标?
⑥这个指标是不是一个可操作的指标?
北极星指标和公司发展相关联,是公司在一个阶段内的重点方向。记住是一个阶段,不同时期的北极星指标不一样。不同业务的北极星指标也不一样。
互联网公司在产品1.0期间,我们应把注意力放到打磨产品上,在推广前提高产品质量,这时留存率是一个北极星指标;在发展阶段,北极星指标是用户数和活跃率,用户数代表市场的体量和占有,活跃率代表产品的健康度;而在有一定用户基数的产品后期,商业化比活跃重要,我们会关注钱相关的指标,比如广告点击率、利润率等。
确定了数据分析的核心目标,就可以着手数据分析软件进行分析了。数据分析大体可以分三类:
①利用维度分析数据;
②使用统计学知识如数据分布假设检验;
③使用机器学习。
(今天主要展开讲述第一类。)
利用维度分析数据是一种自上而下的思路,这种思路多是用于产品的数据分析体系或者模型的建立,从而保证数据分析的全面性。具体的思路为:
维度是描述对象的参数,在具体分析中,我们可以把它认为是分析事物的角度。销量是一种角度、活跃率是一种角度,时间也是一种角度,所以它们都能算维度。
当我们有了维度后,就能够通过不同的维度组合,形成数据模型。数据模型不是一个高深的概念,它就是一个数据立方体。
例如,在做产品运营的数据分析时,我们可以按照以下思路来进行:
我们以天猫店铺利润情况进行分析,店铺运营最关注的就是营业额,但最本质的还是盈利情况,按照上面提到的思路进行分析:
①数据分析目标:店铺的利润情况分析
②确定数据目标的关键影响维度拆解:
③找出不同维度之间的关联关系从而建立起数据分析模型:
利润=销售额-成本=流量*转化率*客单价-(店铺固定成本+运营成本+货品成本+人员成本)
④根据数据模型发现问题数据:
要想实现店铺利润(L)额最大化:
L(max)=R(max)-C(min)
如果店铺出现亏损,那么一定是R<C,也就是成本大于收入,我们假设出现以下情况:
根据上述的假设思路,我们可以得出,在成本合理的情况下,店铺出现了亏损,那么可以得出是销售额太低,销售额不高额影响原因是流量转化率低。因此针对这种情况我们要做的就是提高店铺的转化率。
⑤针对问题数据影响维度做相应的优化:提升转化率
我们可以通过以下几个方面来提高转化率:
-
提升产品包装
-
优化详情页图片和介绍文案
-
优化消费者下单支付路径和体验
-
提升客服服务水平和促单技巧
-
做好用户评价管理优化
-
实行相应的促销策略,如满减、满赠、折扣等
-
……
说到维度法,我们知道单一的数据没有分析意义,只有多个数据组合才能发挥出数据的最大价值。在此,我想强调的一个分析的核心思维:对比。
做不同维度的对比大概是新人快速提高分析能力的捷径之一。比如,过去和现在的时间趋势对比、不同地区维度的对比、产品类型的区别对比、不同用户的群体对比等。
因此,做数据分析,要更多地关注多个数据维度之间的相关关系,而不是单个数据产生的因果关系!通过影响关键指标的数据维度间的关联关系,建立数据分析模型。
2、第二类:使用统计学知识如数据分布假设检验。
使用统计学知识如数据分布假设检验是一种自下而上的思路,这种思路多用在针对已有数据报表中的数据问题发现,具体思路:
3、第三类:使用机器学习。
1、控制变量
在做 A/B 测试时没有控制好变量,导致测试结果不能反映实验结果。或者在进行数据对比时,两个指标没有可比性。
2、样本
在做抽样分析时,选取的样本不够随机或不够有代表性。举例来讲,互联网圈的人会发现身边的人几乎不用「今日头条」,为什么这 APP 还能有这么大浏览量?有个类似的概念,叫幸存者偏差。
3、定义
在看某些报告或者公开数据时,经常会有人鱼目混珠。「网站访问量过亿」,是指的访问用户数还是访问页面数?
4、比率
比率型或比例型的指标出现的谬误以至于可以单独拎出来将。一个是每次谈论此类型指标时,都需要明确分子和分母是什么。另一方面,在讨论变化的百分比时,需要注意到基数是多少。有些人即使工资只涨10% ,那也可能是150万…
5、因果相关
会误把相关当因果,忽略中介变量。比如,有人发现雪糕的销量和河溪溺死的儿童数量呈明显相关,就下令削减雪糕销量。其实可能只是因为这两者都是发生在天气炎热的夏天。天气炎热,购买雪糕的人就越多,而去河里游泳的人也显著增多。
6.辛普森悖论
简单来说,就是在两个相差较多的分组数据相加时,在分组比较中都占优势的一方,会在总评中反而是失势的一方。
1.还记得“如果你不能衡量它,那么你就不能有效增长它”这句话吗?我们做数据分析是为了能以量化的方式来分析业务问题。其中有两个重点词语:量化和业务;
2.数据本身并没有任何价值,而一切数据分析的核心是分析方法。数据分析的三大作用,主要是现状分析、原因分析和预测分析;
3.数据分析的第一步就是建立指标体系,但是不是所有的指标都是好的,我们需要找到产品的“北极星”指标。除此之外,不同时期的北极星指标不一样,不同业务的北极星指标也不一样;
4.数据分析大体可以分三类:利用维度分析数据、使用统计学知识如数据分布假设检验、使用机器学习;
5.维度分析数据是一种自上而下的思路,这种思路多是用于产品的数据分析体系或者模型的建立,从而保证数据分析的全面性;使用统计学知识如数据分布假设检验是一种自下而上的思路,这种思路多用在针对已有数据报表中的数据问题发现。