每周一本书 |《大数据思维》:从毒大米和死麻雀的罗生门事件讲起
货船散落一地的大米与20只麻雀的死是这起罗生门事件的起因。所以,争议过后,麻雀到底是撑死的,还是毒死的?答案大家可以自行分析,但里面包含的大数据思维就是这本书的精华
本期【每周一本书】给大家重点推荐的书是《大数据思维》,别急,为了更清晰地了解这里面的门道儿,咱先从20只被毒死的麻雀说起(真实事件,最简化版):
很多麻雀抢食大米后死了20只。(公安局、食品药监局连夜赶到“案发现场”)
结论:撑死的。(技术人员连夜化验得出)
官方更微:撑死的。(网友:逗我玩儿呢)
这件事后来变成了罗生门,似乎,毒大米和死麻雀之间的大数据逻辑是这样的:
据说, 20 只麻雀吃了散落的大米,死了。
有人传言说,麻雀是吃了有毒大米,中毒死的。
后来,有人说:专家认为麻雀可能是吃多了,撑死的。
再后来,有人又辟谣说:没有人说过麻雀是撑死的。
再再后来,有人又辟谣说,大米没有毒。
再再再后来,有人又辟谣说,大米还没有卖出去,卖出去的都追回来了。
再再再再后来,有人又辟谣说,还有一部分大米没追回来,但大米确实没检测出有毒。
(所以,谜之死亡,麻雀就一直处于被毒死、饿死、再毒死的状态中……)
我们不再说后来了,因为这个故事还没有结束。而且,即便被人为地确定终结,好事者也不会就此认为事情结束了。
这次的毒大米与死麻雀的事件,看似传言绕来绕去,实际上却是一次典型的大数据分析的实践,从中可以看出,盲目的所谓大数据分析是多么容易误导公众。
仔细想以下几个问题:(考考你的大数据思维能力)
(1)我们找到了所有的麻雀了吗?
(2)这 20 只麻雀就是那吃了大米的麻雀吗?
(3)麻雀之死是因为吃了大米导致的吗?
(4)麻雀之死是因为吃了毒大米导致的吗?
好了,我们跳出那个事件,会发现大数据分析中可能有很多关联,这些看似可贵的发现却多数都可能是无用的,而且,有些可能是毫无意义的。比如:最经典就是的“啤酒与尿布”,这两个风马牛不相及的事物的搭配,看似荒诞至极。其实,对数据深入分析后你会惊奇,这两者居然真的存在很强的逻辑。而这种数据分析的思维正是你需要的,也是本书要传递给大家的!
注意!本书不是一本介绍大数据概念的流行读物,也不是开讲编程工具高深理论的专业教材,而是立足于大数据之上的思维模式的普及。你不需要任何统计学知识,也没必要掌握复杂的公式与算法,在最通俗易懂的案例介绍和娓娓道来中就可以轻松理解大数据分析的基本模式与方法。
所以,无论是数据分析专业的学生、数据分析师,或者是数据爱好者,都能在这本书汇总找到自己的乐趣。
注:此书由 数据猿联合电子工业出版社 共同推荐!
由于是新书,各大网站还没及时更新,感兴趣的朋友先加作者微信(15737954328),备注“书”。