终于有人把大数据讲明白了

导读

我们将从大数据的概念、核心技术、特点、通用应用这4个方面对大数据进行阐述。

大数据概念

数据发展推动科技进步,海量数据给数据分析带来了新的机遇和挑战。大数据是一种强大到在获取、存储、管理、分析方面远远超出传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和较低的价值密度这四大特征。

于是,我们需要新的处理模式来实现更强的数据处理能力以应对多样化的信息资产。

大数据技术追求的不是精确性的样本数据,而是面向全体的数据,这部分数据可能是不精确的、非结构化的,但大数据技术正是利用这些之前未被利用的数据,创造新的价值。

从海量数据中获得的数据处理结果可能是超乎我们的认知逻辑的,但是我们并不需要理解结果背后的因果关系。简言之,我们需要用相关思维替代因果思维

大数据核心技术

大数据在信息系统的生命周期中,从数据源到最终产生有价值的可视化信息,主要经历6个步骤,分别是数据收集、数据存储、资源管理与服务协调、计算框架确定、数据分析和数据可视化,此过程涵盖了海量分布式系统、数据库、并行计算框架、数据挖掘等方面的技术。

图2-1罗列了大数据技术中各个步骤目前所对应的主流技术体系,大数据的相关技术日新月异、层出不穷,由于篇幅限制,不再一一列举。

▲图2-1 大数据的主流技术体系

大数据特点

大数据具有海量的数据规模、快速的数据流转、多样的数据类型和较低的价值密度这四大特征,下面将分别进行详细阐述。

1. 海量的数据规模(Volume)

大数据所采集、存储和计算的数据规模都非常大。随着互联网的广泛应用,使用互联网的人和企业等增多,数据的创造者变多,数据量呈几何级增长。近年来,随着数据维度变多、数据类型增加、数据的描述能力增强,数据可以传达的信息也越来越多,越来越准确。

2. 快速的数据流转(Velocity)

大数据不仅增长速度快,处理速度也快,有很强的时效性。在信息时代,人成为网络的核心,每个人每天都在制造新的数据,这些数据再被相应的机构如政府、互联网企业、银行、电信运营商等收集,形成了一个个庞大的数据体系。

面对如此庞大的数据体系,处理数据并得到结果的速度越快,数据的时效性就越强,价值就越高——而大数据和传统数据挖掘最大的区别也在于此,大数据更强调数据处理的实时性和时效性。

3. 多样的数据类型(Variety)

大数据的种类和来源多样化,多样的数据为数据处理带来了挑战。在数据结构上,大数据可以分为结构化数据、半结构化数据和非结构化数据;在具体形式上,大数据可以分为视频、音频、图像、博客、社交网络、互联网搜索等。大数据迎接的挑战就是要针对这些结构不一、形式多样的数据,挖掘其中的相关性。而这些前所未有的、来自各个领域的、不同形式的数据,赋予了大数据强大的威力。

4. 较低的价值密度(Value)

大数据的价值密度相对较低。数据的价值密度和数据的规模呈反相关,数据的规模越大,数据的价值密度越低。大数据最大的价值即在于从大量低价值密度数据中挖掘出对分析和预测等有价值的信息。

相较于传统数据挖掘利用结构化的数据类型,大数据把目光也投向了非结构化的、非抽样的、包含全体的数据类型。这为大数据带来了更多的有效信息,但同时也增加了大量无价值的甚至是错误的信息。

大数据的通用应用

大数据已经渗透到了全世界市场中的各个领域,彰显着巨大的价值,其在各个领域的详细应用情况如下。

1. 金融领域

(0)

相关推荐

  • 大数据及大数据技术

    一.大数据的概念 对于互联网行业来说,随着电子商务及互联网的应用越来越多,数据的量呈现指数级的增长,数据的类型也日益多样.海量的数据不仅体量大,而且最为关键的是常规的数据处理技术已经无能为力,大数据处 ...

  • 终于有人把大数据架构讲明白了

    导读:如何存储.如何利用大规模的服务器集群处理计算才是大数据技术的核心. 作者:李智慧 来源:华章科技 大数据技术其实是分布式技术在数据处理领域的创新性应用,其本质和此前讲到的分布式技术思路一脉相承, ...

  • 终于有人把OBV指标讲明白了,90%的散...

    终于有人把OBV指标讲明白了,90%的散户没用过的指标,看懂了,让主力无处遁形. 物以稀为贵,讲的是供求关系,前几年破天荒有个"蒜你狠".有人把大蒜的价格抄到天上去了,为什么呢?因 ...

  • 终于有人把联邦学习讲明白了

    终于有人把联邦学习讲明白了

  • 终于有人把“内盘外盘”讲明白了,散户如果...

    散户如果把它的精髓吃透了,就可以让你读懂主力操作背后的盘口语言,值得每一位炒股人收藏. 很多数股民朋友到现在还不知道内盘和外盘,更有甚者都没有听说过.内盘和外盘代表什么呢,它代表的是买卖双方的一个博弈 ...

  • 终于有人把内卷讲明白了

    导读:内卷不但不会创造价值,而且会危害每一个人. 作者:王见现 来源:大数据DT ID:hzdashuju 01 CSDN企业招聘 小镇的故事 1. 什么是内卷 很久很久以前,地球上有一个小镇.小镇上 ...

  • 终于有人把3D打印讲明白了!

    作者:奥拉夫·迪格尔(Olaf Diegel).阿克塞尔·诺丁(Axel Nordin).达米恩·莫特(Damien Motte) 来源:大数据DT(ID:hzdashuju) 增材制造(俗称3D打印 ...

  • 终于有人把p值讲明白了

    导读:p值(P value)就是当原假设为真时,比所得到的样本观察结果更极端的结果出现的概率,是用来判定假设检验结果的一个参数.p值是根据实际统计量计算出的显著性水平.本文带你了解p值和对p值的常见误 ...

  • 终于有人把“筹码分布”讲明白了,我整整读了10遍,太精辟透彻了

    虽然太多人清楚知行合一的重要性,但性格早已决定了他们难以做到. 而那六个字的关键就在于执行并做到,道理很容易明白,但真正能做到的人,尤其是一生坚持去做的人,几乎是凤毛菱角,屈指可数.只要心中具备那种不 ...

  • 终于有人把区块链讲明白了

    一.什么是区块链 区块链是分布式数据存储.点对点传输.共识机制.加密算法等计算机技术的新型应用模式.所谓共识机制是区块链系统中实现不同节点之间建立信任.获取权益的数学算法 . 二.区块链概念 区块链可 ...