喊了这么多年大数据,企业却还是一无所知 | EGO图书荟

在科技如此兴盛的时代,人类社会实践产生了海量的全样数据、虚拟化、分布式集群、人工智能和深度学习算法等大数据和云计算技术,这些技术的出现意味着能更好地解决传统数据挖掘和机器学习中的大部分难题。借助于国家对大数据产业的助力以及各地方政府的扶持,大数据的落地从传统聚焦于互联网,正逐步向社会的各个领域渗透。

于是,我们看到了各种大数据的应用,智能交通、人脸识别、智能旅游、语音识别、智能驾驶等。同时在基于大数据价值转化的企业应用中,共分为三类可落地的系统:

第一类 大数据落地为平台

所谓平台,包括大数据以不同形式的产品化作为载体,以平台作为可落地应用的支撑。其建设目的是以数据价值和平台服务为导向,集成数据接入、整合、存储、计算和监控的分布式数据系统。这种以分布式平台为核心的建设思路下,也是更符合企业自主实施下个性化、定制化、二次开发性的需求。当然,除了这些更加显现的功能和扩展性以外,对于大数据工作流的所有环节的可控更是企业关注的焦点。

第二类 大数据落地为服务

未来,大数据的基础设施层除了各个企业自建以外,其他绝大多数都会以服务的形式开放出来,例如SAAS(Software-as-a-Service,软件即服务)、DAAS(Data-as-a-Service,软件即服务)、PAAS(Platform-as-a-Service,平台即服务搜索)、IAAS(Infrastructure-as-a-Service,基础设施即服务)。这些开放的服务满足了企业在轻型部署、快速上线、弹性付费、灵活扩展的需求,更加适合创业以及快速发展中的中小型企业。

第三类 大数据落地为应用

对于大多数行业而言,大数据的落地还是要靠应用体现出来。作为平台和服务的输出,都是以跨行业、多租户的概念来设计的,并没有以不同的应用领域做切分,更没有针对性的定义大数据工作流以及平台优化和服务定制,而应用恰好能以场景为出发点来满足价值产出。而对于各个企业而言,无论是平台还是服务目前都是仅供内部应用为主,如果要开放出来成为共有服务,那么必然面临着寡头竞争。从现在科技聚焦的趋势来看,基本上市场上前3名的寡头已经足够可以瓜分市场90%以上的份额,剩下的企业无论怎么努力都只能从10%中分得一杯羹。

但是,不同行业有着完全不同的应用特征,无论哪个企业都无法作为对所有行业和场景的覆盖,因此应用不仅需要技术和平台的支持,更需要业务场景的支持,没有业务场景就没有真正有价值的应用产生,无论其技术和平台的实例有多顶尖皆是如此。所以,广大企业在巨头林立的市场中,依靠细分场景应用一定可以找到有差异化的竞争策略,这些策略中首推的是“人无我有”的领域,其次才是“人有我优”的领域。

另外,大数据不仅是可以依靠大数据制造的周边设施和产业创造价值,大数据本身就是一座金矿。各个企业,尤其是行业巨头都对这座金矿虎视眈眈,未来,谁掌握了大数据本身,谁就有可能控制整个大数据工作的产业链。没有数据的大数据工作都是“无源之水,无本之木”。

无论基于哪种方式产出价值,都要求企业对于整个大数据的工作机制、工作流程、工作协同、应用场景等方面熟稔于心,更重要的是对于大数据的行业理解、区隔定位、预期蓝图上具有一定的前瞻性和高度。

养数据、用数据、数据价值的加工创造、数据开放和共荣才是未来企业在大数据共赢道路上的长效机制。

作者介绍

吕兆星(Ethan Lv),资深大数据技术专家,精通基于大数据的分布式数据挖掘、存储与计算技术,及其生态体系架构;精通垂直搜索技术、机器学习、文本情感倾向性挖掘、网络爬虫、全文索引体系架构。曾任软通动力集团大数据研究院总架构师、HiveCloud创始人,萝卜网CTO,国美在线大数据中心高级架构师等。

本文原创首发于公众号EGONetworks。


2017年6月30日到7月1日,EGO在上海举办全球技术领导力峰会,携手 600 + CTO 共同探讨技术领导者圆外的世界。

(0)

相关推荐