解决数据架构难点数据分布的六种策略

from:PYY

数据分布的六种策略

1)       独立Schema(Separate-schema)

2)       集中(Centralized)

3)       分区(Partitioned)

4)       复制(Replicated)

5)       子集(Subset)

6)       重组(Recorganized)

1.1.1.   独立Schema(Separate-schema)

当一个大系统由相关的多个小系统组成,且不同小系统有不相同的数据库Schema定义,这种情况称为“独立Schema”。

1.1.2.   集中(Centralized)

指一个大系统必须支持来自不同地点的访问,或者该系统由相关的多个小系统组成,而持久集中化数据进行集中化的、统一格式的存储。

1.1.3.   分区(Partitioned)

分区方式包括水平分区和垂直分区两种类型,跨“地域”提供“相同的服务”常常采用水平分区,选点“两个相同、两个不同”——相同的应用程序、不同的应用程序部署实例,相同的数据模板,不同的数据值。

在实践中,水平分区的应用非常广泛,而垂直分区应用要小,特点:不同数据节点的Schema会有“部分字段(Field)”的差异,但可以从同一套总的数据Schema中抽取得到。

1.1.4.   复制(Replicated)两上两个

在整个分布式系统中,数据保存多个副本,并且以某种机制(实时或快照)保持多个数据副本之间的数据一致性。

1.1.5.   子集(Subset)

“子集”是“复制”的特殊方式,就是某节点因功能或非功能考虑而保存全体数据的一个相对固定的子集。

总体而言,子集方式和复制方式有关非常类似的优点:

通过数据“本地化”,提升了数据访问性能。

数据的专门副本,利于优化,便于提高可管理性、安全控制。

1.1.6.   重组(Recorganized)

  业务决定功能,功能决定模型。当遇到数据模型不同时,一般都能够从功能差异的角度找到答案。

  重组这种数据分布策略,就是不同数据节点因要运行的功能不同,而以不同的Schema保存数据——但本质上这些数据是同源的。于是,重组策略须要进行数据传递,但不是数据的“原样儿”复制,而是以“重新组织”的格式进行传递或保存。

应用:

  统计性性重组,例如,如果总公司只须要掌握各分公司的财务、生产等概况信息,那么就不须要把下面的数据原样复制到总公司节点,而是通过分公司应用对信息进行统计后上报。这叫“统计性重组”——数据的重新组织较多地借助了抽取、统计等操作,并形成新的数据格式。

  “结构性重组”的例子,最典型的就是BI系统。生产系统的数据被进行整体重组,增加各种利于查询的维度信息,并以新的数据Schema保存供BI应用使用。

1.1.7.   应用的3条原则

1)       把握系统特点,确定分布策略(合适原则)

2)       不同分布策略,可以综合运用(综合原则)

3)       从“对吗”、“好吗”两方面进行评估优化(优化原则)

1.1.8.   示例

1.1.8.1医疗信息化中心

1.1.8.2电信系统

  客户申请服务开通业务流程

  

   数据分布策略

1.1.8.3铃声下载

  

(0)

相关推荐

  • Apache Kudu在网易的实践

    编辑整理:张德通@数数科技 出品:DataFunTalk 本文主要介绍Apache Kudu及在网易实时数据采集.维表数据关联.实时数仓ETL.ABtest等场景的实践应用.主要内容包括: 系统概述: ...

  • 考虑微电网参与的主动配电网分区自动电压控制策略

    点击下面标题,了解通知详情 第九届电工技术前沿问题学术论坛征文通知 摘要 湖南大学电气与信息工程学院.国网湖南省电力有限公司经济技术研究院的研究人员潘舒扬.李勇.贺悝.潘馨.胡斯佳,在2019年第21 ...

  • 数据架构难点

    数据架构是架构设计中很重要的一环,可能对于很多DBA而言,数据管理,数据优化,数据迁移类的工作居多,而对于数据架构方面的工作也会思考少一些,这方面就会薄弱一些. 如果在这个行业里有一定的经验,就会发现 ...

  • 一文全览:企业上云的难点、方向、策略、架构和实践步骤

    [摘要]本文主要介绍了企业(尤其是传统企业)上云的意义.难点,以及上公有云.私有云.行业云还是集团云等方向上选择和采取的策略,给出了云计算的架构以及资源池.云服务.云管理的关系及实现的要点.最后,简要 ...

  • 一文尽览:数据趋势、数据治理、数据架构、数据中台、数据安全数据运维

    作者丨韩锋频道 作为数据库领域重量级的大会,DTCC每年都会引发人们的关注.通过大会,可以了解行业动态,洞悉趋势发展,学习最新技术.今年因个人原因,没有现场参会.所幸近期大会PPT材料已放出,抽空学习 ...

  • 面向数据架构的云演变

    现代数据架构的概念在过去的10多年里发生了巨大的变化,具体可以参见公众号"补天遗石"的<从数据仓库到数据湖--浅谈数据架构演进>一文. 把时钟调回来,回想一下那些有许多 ...

  • 老曹眼中的面向数据架构

    数据是系统的核心,在面向服务的架构之外,也可以考虑一下面向数据的架构方式.面向数据的服务架构需要支持多数据源异构,支持动态数据和静态数据,既支持公有云部署又支持私有云部署,提供多种数据应用和数据产品, ...

  • 终于有人把大数据架构讲明白了

    导读:如何存储.如何利用大规模的服务器集群处理计算才是大数据技术的核心. 作者:李智慧 来源:华章科技 大数据技术其实是分布式技术在数据处理领域的创新性应用,其本质和此前讲到的分布式技术思路一脉相承, ...

  • 中科院女博士为全球程序猿解决数据难题,实现AI语音交互,获投数千万

    大家以为AI专家主要精力是构建算法模型,创造高大上的系统,但事实上绝大多数时间都是在跟数据做挣扎.因此对全球程序猿来说,数据收集和处理方面低效的痛点亟待解决. ▌作者 柴容 ▌编辑 王艳 当年玩YY语 ...

  • Excel VBA 7.34 将TXT按照指定分隔符写入Excel,VBA一次解决数据导入+数据分列

    一起学习,一起进步~~ 昨天我们分享了用vba来实现按照指行数写入同一行数据的方法,在某种程度适应了一些小伙伴的工作需要,不过还是那句话,做数据汇总的,总要面对各种千奇百怪的数据源,今天有小伙伴们给我 ...

  • 牙科管理:采用SOAP方法,优化工作流程,解决看牙难点

    随着口腔行业的发展,牙科管理应该朝着科学化的方向前进,不断优化整体流程,切实帮助客户解决牙齿问题.在此情况下,牙科采用SOAP方法,可以有效提高看牙的效率和效果,预防突发性危机:增强牙医对情况的判断力 ...