《大数据的2016,我的2016》之技术篇
本篇《大数据系列》文章是数据猿推出的主题为《大数据的2016,我的2016》2016—2017年度大型策划活动的征文部分。为了方便大家更系统的阅读,小编对这36篇文章进行了分类,本文是《大数据的2016,我的2016》之技术篇。
本文长度为2000字,建议阅读4分钟
本篇《大数据系列》文章是数据猿推出的主题为《大数据的2016,我的2016》2016—2017年度大型策划活动的征文部分。在2016年底征稿期,活动就受到了100+大数据领域内知名企业的高度关注,收到了36位业内领袖的投稿,并入驻成为数据猿专栏专家。
为了方便大家更系统的阅读,小编对这36篇文章进行了分类,本文是《大数据的2016,我的2016》之技术篇!
在2月16日的落地活动部分,数据猿联合中欧国际工商学院以及腾讯直播举办了“中欧微论坛 | 数据猿·超声波——以数据思维 拥抱智能时代”活动,点击底部“阅读原文”看直播。
一、易观CTO郭炜:大数据也进入了下半场,业务与算法是重中之重
在喊了一年的资本寒冬后,大数据也进入了下半场,收入和增长成为大数据公司融资下半场的门票,而打赢下半场两个核心围绕业务理解和核心算法逐步展开。
准确业务的理解、抓住痛点可以确保大数据不是空中楼阁,帮助企业解决实际问题从而获得高额收入。
而算法的门槛是继大数据采集、数据并行计算之后新的技术门槛。大数据结合现在被炒的火爆的AI算法,在互联网、零售、金融等很多领域建立起各领域的数据模型,随着数据反复验证,数据模型将会越来越精准,在行业中拥有行业理解、数据和算法迭代能力的公司逐步立于不败之地。
只有技术或者只有业务方案都不能成为一个完整的大数据解决方案,需要对业务本身的深刻理解加上过硬的技术和落地实施能力才可以帮助企业通过数据提效避险。
原文链接:数据猿专访 | 易观CTO郭炜:专注行业分析16年,大数据时代我们依然不会变
二、星环科技创始人兼CTO孙元浩:大数据技术的四大发展趋势
大数据技术发展到今天已经出现了很多的新技术,主要分为5层:存储引擎层、资源框架层、通用计算引擎层、领域级引擎层、分析工具管理层。未来,大数据技术发展主要呈现以下几个发展趋势:
1、分布式计算已经逐渐成为主流计算方式。基于Hadoop的计算引擎能够像传统的数据仓库产品一样完成大量数据的批处理工作,分布式计算已经被证明比传统技术更加高效、更具有性价比的方案。
2、交互式分析技术日益成熟。以前大家希望通过批处理改造成适用于交互式分析,但实际应用中这样的技术思路并不能达到预期效果。如果借助Cube技术,可以显著提升OLAP性能,并且系统性能可以得到50-500倍的提升。Cube技术适用于需要固定报表并提供简单灵活自助分析的应用场景——具备准实时的交互式分析技术。
3、数据分析算法逐渐丰富,工具普及化。数据分析的算法有很多种,但企业花费大量的时间在数据清洗和特征的选择上,缺少自动化选择特征指标工具。
4、融合事件驱动和批处理引擎。随着应用需求的复杂化,对低延时和复杂编程模型的需求在不断增加。通过对引擎的重构,改造成了事件驱动的计算模型,大幅度降低了延时,同时支持SQL语言批处理编程模型,能够对非常复杂的环境下进行实时处理。
原文链接:星环科技创始人兼CTO孙元浩:后Hadoop时代,分布式计算已成为主流计算方式
三、六禾创投合伙人杜挺:缺数据不可怕,技术才是大数据公司真正的壁垒
2016年下半年,整个大数据领域在资本市场上出现了急转直下式的发展,这让本来就很年轻的大数据企业每一步走的都如履薄冰,但从我们自身的投资角度来看,我们更爱投企业服务和数据领域的创业项目了,因为在大的市场转变周期中,唯有技术创新才能达到增量市场。
另外,国内的大数据产业仍处在初级阶段,商用价值仍未完整展现,市场前景一片广阔。从数据流转的角度讲,大数据领域通用技术,主要是包含基于Hadoop等底层基础平台的处理数据技术,包括数据采集、数据处理、数据分析、数据可视化等。其中底层基础平台主要解决了数据存储问题,而通用技术则解决了从数据采集到数据分析的问题。
对于一个想做数据方向的企业来讲,只有技术才是真正的壁垒,数据可以用多种方法去获取。所以优秀的数据公司一定是核心技术为驱动,优秀产品为导向,数据为贯穿整个产品线,将产品、运营、销售等各方面穿在一起。
原文链接:六禾创投合伙人杜挺:大数据进入快速发展期,企业服务类项目最受欢迎
四、GrowingIO创始人兼CEO张溪梦:数据分析厂商如何更好的为客户创造价值
在海外,数据分析市场已经非常成熟,各类工具也很丰富,但是国内的很多公司还停留在只盯着PV、UV、访问时长、跳出率等最基础的数据上。在互联网下半场,人口、流量、资本的红利已经褪去,获取客户和运营产品的成本将大大增加,成本的增加就导致企业必须要对其运营效率进行显著优化,对用户进行更精细化的管理。数据分析厂商可以从三个点入手,为客户创造更高的价值:
1、基于云端的 SaaS 模式。目前来看,云端解决方案”无论在性价比、时效性、可用性方面都会比传统软件模式更有优势。
2、将数据分析力融入产品。数据分析厂商要不断把数据分析师的思路相对统一地做到产品里去,让用产品的人自然而然具备这种数据分析的思路。
3、产品设计要简单、智能化、场景化。构建一个具备场景化和商业结果导向的产品,比打造一个有无数功能堆积的数据工具更有意义。
原文链接:GrowingIO创始人兼CEO张溪梦:互联网下半场,数据如何驱动企业突破增长重围?
本文编辑jean,微信15737954328