不看后悔!豆瓣史上评分最高的科幻剧你知道吗?教会你什么才是数据挖掘

《黑镜》史上豆瓣评分最高的科幻剧想必大家都有所耳闻吧?(如果你之前真么有看过,那你可以回去补补课了☺☺☺☺)。作为科幻剧当然有太多高科技元素了,今天小编我就带你从《黑镜》里学习一下什么是“数据挖掘”。

以数据挖掘的角度讲《黑镜》第一季的第一集会是什么体验呢?

首先,英国皇家公主被绑架了,绑匪用加密的IP地址将视频发布到youtube,要求首相去做一些“匪夷所思”的事情作为释放公主的条件。

当然,官方想到的办法是先找到绑匪的所在地,在“交换条件”的规定时间之前就把公主解救出来。从传统技术上来讲IP地址加密后是很难找到视频上传的准确地点的,这时候“数据挖掘”就派上用场了。

首先自带光环的技术人员推门而入,告诉首相我们查到视频上传的具体地点了。

“不是说查不到吗?”小白首相这样问,对啊从传统技术上来讲确实是查不到,但是我们可以挖掘现有资源,寻找蛛丝马迹啊。

首先分析一下上传视频的特点,视频上传之前的大小是57.3兆。

再分析一下,还知道这个视频是在凌晨3:16上传的。

接下来就可以在全球范围内针对这种类型的上传视频地点进行挖掘了,技术人员在全球范围内做一个反向追踪,搜索3:16之前57.3兆上传流量。

挖掘之后的结果是,他们将目标锁定在一个10年倒闭的大学校园。

再进一步挖掘一下卫星数据,通过调用卫星捕捉的图像,发现这所学校已经闲置一年的学校在晚上3点的时候确实有灯光,就进一步证实了视频上传的地点。

至此整个“数据挖掘”的过程就算结束了,但是绑匪哪有那么傻啊,人家只是在那上传视频,所以当警察赶到那所废弃的学校时,场景是这样的。

小编我的故事讲完了,但电影的故事还很长,没看过的小伙伴赶紧去看,这部堪称神剧的英国片,绝对触碰了太多人性的弱点,引人深思。

故事讲完了,下面我们认真的分析一下什么是数据挖掘。

数据挖掘是一个在海量数据中利用各种分析工具发现模型与数据间关系的过程,它可以帮助决策者寻找数据间潜在的某种关联,通过发现被隐藏的、被忽略的因素,就能够在数据存储和管理过程中,挖掘出重要的情报信息,作为决策和行动的依据。

数据挖掘的概念很简单,方法却并不简单。首先数据准备是数据挖掘的重要前提,因为它直接影响到数据挖掘的效率和精准度。在数据准备阶段,需要对数据进行清洗,其次,选出需要分析的数据,缩小处理范围。而在数据预处理阶段,包括了消除重复数据、消除噪声、遗漏数据处理、数据类型转换等,目的是把数据处理成适合于数据挖掘的形式,并在数据选择的基础上对挖掘数据作进一步的约简减少内存资源和处理时间,使挖掘更有效。

再举一个反面的例子,在“9·11”事件发生前,情报研判人员其实是掌握了大量数据的,但却忽视了其中有价值的情报。

所谓的数据资源就是“交易空间”。如果恐怖分子要计划、执行一次恐怖活动,他们必定会在信息空间留下某种“数据脚印”。也就是说,他们需要“交易”。这种交易的数据记录,可以是通讯、财务、教育、医疗,也可以是旅行、交通、出入境、房屋等等其他一切数据记录。美军如果能正确利用这些信息,通过数据挖掘,就可以在恐怖分子行动之前,提前预知恐怖分析的行踪及可能意图。从而发现和追踪恐怖分子。

(0)

相关推荐