数字会说话吗
Deep-Sci:"-sci-"源自拉丁语的"scientia"(知识)
小科
物语
+
真正在说话的依然是人自己。
今天一整天的大数据交流与讨论,借着这个氛围,来继续谈谈这个“大数据时代”的数据应用。
大数据可谓这几年的热门,所有巨头都在布局,许多企业也都争先恐后收集数据,建立各种算法、统计模型,给出很多漂亮的数据结果,每一个传统非传统的企业都在奋力向大数据世界进发。
事实上,有很多大的平台企业早就累计了足够多的数据,然而,所谓大数据,并不仅在其“大”,甚至也不在于统计技术。
真正成为赢家的关键,是诠释问题的角度和观点。
观点决定了数据的角度,让我们能够在海量数据中准确地发现问题核心,进行深度挖掘。
在数据世界,问对问题,才能找对答案。
大数据的意义在于让人们拥有更准确的预测能力,以及更深刻的认知能力,因此其用法才是第一位的。
在如今的世界,搜集数据已经不再困难。
而机器负责处理数据、回答问题,也已经变得普及。
那么,作为人类最重要的作用就是提出问题、发掘问题。
尤其要学会追根溯源,发现问题背后的问题,也就是真正本质而核心的问题。
大数据时代,企业学习问对问题是一个重要的课题。
因为大数据时代,信息会排山倒海而来,超乎你的想象,如果不在源头就问对问题,就找不到正确的信息,反而会走冤枉路,一事无成。
要问对问题,必须克服盲人摸象的局限,从“全视野”的高度来看问题。
一旦看问题的高度不够高、角度不够全面,就会犯短视的毛病,造成资源错置。
大数据时代,问对问题,可以找到症结所在,让答案彰显无遗。
问题的不同也影响到数据的搜集,所以唯有问对问题,才能搜集到正确而且有价值的关键数据。
20/80法则,小而准的数据价值最大。
大数据可分为三类:小而准数据、大而乱数据、开放数据。
小而准数据如销售网点管理系统交易数据,结构化而准确。
大而乱数据就像社交媒体数据、Wi-Fi数据,非结构化而且杂乱。
开放数据则是指像天气、人口普查之类的开放数据。
数据越大,不确定性越高,含金量则越少。
数据越小,结构化而准确,含金量越高,越能轻松挖掘到你要的答案。
所以,数据质量重于数据规模。
数据分析更重要的,应该是数据的质量,而不是数据的大小。
意大利著名统计经济学家维尔弗雷多·帕累托提出的“20/80法则”主张,80%的产出往往源自于20%的投入。
掌握20%的数据就掌握了80%的成果,而且通常这20%都是些显而易见的数据。
根本不需要去找远在天边、遥不可及的数据。
所以,最能反映公司营业收入的数据其实就是公司自己的交易数据。
数据会说话?说话的是人。
我们会觉得,数据很厉害,可以做预测。
其实,在做预测,在说话的还是人类自己。
什么叫“数字会说话”?
要让数据说话,必须先建立假说、观点,有了假说,数据才有意义,而假说是由人来设立的。
所以,真正在说话的依然是人自己。
在大数据的世界里,决胜负的关键,并非数据运算能力,也不是依赖统计技术,真正能够成为数据赢家的其实是运算观点。
观点就是假说,观点形成后,会产生判断,然后才有更进一步的预测。
大数据时代,数据与人的关系有时很奇妙。
数字没办法自己讲话,是我们在替它们说话,我们赋予它们意义。
利用数据的人,可能会用对自己有利的方式来解释数据,让数据脱离客观的现实。
而信息总量在快速增加,其速度之快,让我们对如何处理信息的理解,以及我们分辨有用信息和虚假事实的能力往往都跟不上。
当我们拥有'太多信息’的时候,本能地会采取的简便做法就是选择性处理,挑出我们喜欢的部分,忽略剩下的部分。
所以,在大数据时代如果想要用好数据,人更应该自我要求。
▼ 不要再逃避
✨星星发亮是为了让每一个人有一天都能找到属于自己的星星
▼