数据是一种连接。它连接4个最基本的象限,时间,地点,任务,事件。我们为什么要说数据会是下一次技术革命浪潮的最重要的指针?大家来看一下,根据美国几家顶级研究机构的报告,(Gartner,IDC等等),在未来的5年,我们会有40亿人通过互联网产生各种数据,将成就一个4万亿美元的市场,将有两千五百万种软件接入,250亿台各种各样的设备接入各种数据系统,五百万亿GB的数据产生。
在美国,已经形成了非常系统的数据分析方法论。 这种方法论在二战期间就开始行驶,应用到军事,科技,民生等各个方面。可以数据分析分解为几个步骤,大家仍然可以看到,这里各个环节从先到后是以价值不断提高为条件的。
第一,也是最重要的一点,正确的数据采集,数据标签方法的实施,对未来的数据分析迅速产生结果有几何倍数的促进作用。这也是若干企业缺失或者非常忽略的部分。
第二:大数据的工程架构,数据仓库,分布式计算层面。现在的分布式计算系统,和以往的数据仓库的整体构架有了很大的分别,这要求我们的IT部门能够跟上节奏,实施部署新的基于开源的分布式数据技术、例如已经比较成熟的Hadoop,这个技术已经在美国应用了将近10年,渐渐在互联网公司变成了主流。
第三:响应性分析,这就是大部分企业也许做的最多的事情,就是不断地用数据回答业务方提出的各种问题,制作简单的报表,商业智能,BI等等。
第四:诊断性分析,比如说多维度的归因,积分卡的实施等等。
第五:战略型分析:竞争趋势,价格弹性,企业财务营收的判断等等。过去企业的高层战略分析一直被BCG,麦肯锡等公司霸占,但是现在为什么没有出现在金字塔的顶端呢,就是因为大数据的出现。
第六:预测性分析即对未来的业务进行基于统计模型,机器学习,以及各种大规模模拟和优化的分析。
第七:全数据自动分析和决策。