企业备份系统建设规划,这几个关键问题如何解决? | 最佳实践
【作者】赵海
1. 如何确定备份对象及备份策略
近些年来,企业的数据逐渐呈现多元化格局,从数据的模型层面可以分为结构化数据、半结构化数据、非结构化数据。从企业 IT 功能层面又可以将常见数据列为如下几类:
关系型数据库中保存的二维表数据。
非关系型数据库中的文档、 JSON 、键值等类型数据。
以文字方式记录的文本、 PDF 、 XML 等文件形式的数据。
以二进制方式记录形成的图片、网页等数据。
以视频流方式记录形成的媒体类数据。
作为企业来讲,确定备份哪些数据对象,需要从数据重要性、数据量、数据特点等若干方面去评估。从企业业务角度评估的话,那么数据库保存的数据一定是最重要的,尤其是关系型数据库里面的二维表数据。其次需要根据行业特点以及具体的业务系统重要性来评估非结构化数据的重要性。比如对于金融行业来讲,记录业务过程的一些影像类数据可能在业务审核过程中经常被调出查阅,这些数据虽然没有结构化数据那么重要但是也是业务环节当中必不可少的元素,其重要性相对业务视频类以及安防类视频数据会高很多。但是如果是媒体行业的话,那么视频类数据的重要性恰恰是支撑其业务的核心数据,其重要程度不言而喻。那么如何来决定哪些数据需要备份,以什么样的策略备份?
首先,我们需要确定数据的重要性程度。本文通过结果导向的思路从以下维度来分析企业数据的重要性,最终决定哪些数据需要备份,哪些数据可以不备份,哪些数据需要根据企业的实际投资战略情况来决定。首先我们假定一个结果,那就是某个应用系统的某类型数据由于硬件故障或者其他原因导致数据丢失掉了。那么就看企业对该结果的容忍程度,假设不能容忍,那么就没什么好商量的了,肯定要做备份。接下来,最重要的事情是我们如何定义数据备份的策略,包括备份的频度、备份的模式、归档的档期等等一系列备份作业元素。这部分内容需要考虑到数据本身的量级、数据的具体类型、极端条件下对数据恢复时间及数据丢失量的容忍程度、数据备份系统以及备份介质本身的性能特性、业务发展的规模及趋势判断等等。本文从以下几个原则来进行评估:
数据库的备份既要有全量备份也要有归档日志的备份,全量备份可以根据数据量及重要程度以天为单位进行频度调整;归档备份可以根据数据库恢复区空间预留、归档增长趋势、数据恢复时间要求、业务系统归档特点等多方面来进行以小时为单位的频度调整和作业发起调用。
文件类型数据可以根据具体数据量来选择是否利用传统的文件复制方式来实现其备份,对于数据量大的情况可以采用存储快照方式进行卷级别的复制代替以文件为单位的扫描复制方式。
系统备份作业的分布以及备份时间需要结合具体的备份窗口来进行合理调整,关键业务系统的备份作业不能影响到正常的业务,需要有强制的约束条件来约束备份作业时间跨度。尤其是全量备份,随着业务不断发展,数据量会与日俱增,如果对备份作业不进行任何调整,那么很有可能原有备份作业会超越备份窗口影响到业务性能。
根据具体的数据类型和业务重要性对所有备份作业进行分级管理。有些数据需要持续备份,有些数据可能只需要在特殊变更日进行备份即可,例如虚拟化的 VMDK 文件数据,完全没有必要进行持续备份,只需要在变更后进行备份即可。
以上是对备份对象的确定以及如何把握具体的备份策略的分析和描述,具体细节及关键方法在接下来的章节会有详细的剖析和介绍。
2. 如何选择备份架构的问题
2.1 备份系统涉及到的关键对象
所谓备份系统中的一些关键对象包括:备份软件、备份介质、备份管理服务器、备份作业服务器、备份路径等。这些关键元素共同组成了一个完成的备份系统。
Ø 备份软件:常用的备份软件包括 IBM TSM 、 EMC Networker 、 SYMANTIC NBU 等。
Ø 备份介质:常用的备份介质包括带库、 EMC DATADomain 、常规存储等。
Ø 备份管理服务器:对备份作业进行配置调度并且保存备份元数据的集中管理节点。
Ø 备份作业服务器:具体执行备份作业的备份服务器。
Ø 备份路径:每一个备份作业从客户端采集数据到备份介质的整个路径。
2.2 基于容灾功能的备份架构
一般的企业可能只需要进行本地备份即可,但是对于某些行业尤其是金融行业,备份要求比较高,需要采用主数据中心和备数据中心联动的高可用备份架构。具体如下图所示:
图 具体容灾功能的高可用备份架构
整体架构从上到下分为三层:备份客户端层、备份控制层以及数据存储层。中间通过网络(以太网络或者是光纤网络)相连接。红色线表示控制信息流向,蓝色线表示备份过程中的数据流向。
备份客户端层,图中最上面的部分既是。备份客户端是我们要备份的数据对象存放的服务器,例如数据库服务器、虚拟化平台的 VCenter 、 NAS 服务器等。一般需要备份软件的客户端 AGENT 安装到备份对象服务器上实现备份目标与备份服务器的通讯。
备份控制层,图中中间的部分既是。主要包括备份主服务器和备份作业服务器,主服务器根据配置好的调度策略以及整体架构中的备份元素发送作业调度指令,并且将存储片的元数据存储到主服务器上的数据库当中。然后作业服务器可以通过与客户端的交互完成具体备份作业。元数据是具体备份片的索引信息、而真正的备份片数据会通过作业服务器送入备份介质当中,当我们对数据进行恢复时,首先需要对备份数据的元数据分析才能知道具体的数据备份位置及组合信息等,然后才能通过元数据的组织和具体备份片的恢复完成一个业务数据的完整恢复。
数据存储层,图中对下面的部分即是。实际上就是备份数据最终要存储的地方,可以通过光纤网络或者以太网络实现其与备份控制层的连接。传统模式一般会是光纤网络和虚拟带库的组合模式,其优点在于备份速度和容量的性价比上。但是近些年来随着以太网技术的发展,利用高速网络实现的备份数据传输同样可以保障其备份速度,同时具备更好的灵活性。所以近些年来利用万兆以太网和 DDBoast 组合的方式也越来越多。
2.3 备份架构高可用性分析
整个备份系统的高可用性是由每一个部分服务的高可用配置来保障的,主要包括备份控制层、备份存储介质层以及跨数据中心级别的高可用架构配置。下面我们分别来做剖析:
主备份服务器是整个备份系统的集中控制节点,其保存的元数据也是备份得以恢复的关键数据,因此为了保障主服务器的不间断工作,需要保障主服务器为主备或者更高级别的高可用架构,元数据为所有本地主服务器共享,如图中所示的 HA 模式。
作业服务器是所有备份作业的执行者,必须将其组成一个备份作业服务器池,由这个备份作业服务器池向客户端提供统一备份作业服务才能保障备份作业的不间断性以及备份作业并发执行的性能,备份作业可以分布在不同的作业服务器节点上进行作业,如图中所示的负载均衡资源池模式。
从备份存储介质层面上来看,为了保障备份作业无中断目标,我们需要将两个或者多个存储介质设备绑定为一个虚拟的存储介质池,当存储介质发生故障时可以自动切换存储介质设备,至少可以手动切换存储介质设备。
容灾角度来看,如图所示:两个备份域之间备份介质可以通过光纤网络层或者是以太网络实现数据的异步复制,这样可以保障真正的备份数据可以跨地域实现数据保护,但是光有这些数据我们无法实施数据恢复,因为数据恢复过程中最主要的是要根据元数据记录的备份片索引及结构目录找到真正的数据备份片实现完整的数据恢复。所以主备份服务器也要实现跨域界别的元数据复制。
3. 如何解决非结构化数据备份的问题
3.1 非结构化数据备份面临的困境
对于存储在传统 NAS 文件系统上的文件类数据,如果用通用的备份方法只能通过文件复制的方式来实现其全量和增量备份。但是随着日积月累的非结构化数据增长,这类数据可能会从 TB 级别发展到 10TB 甚至 PB 级别。这类数据存储组织的方式是文件系统的树目录形式,随着数据的增加,其目录的深度和规模也会呈现剧增趋势。备份软件在扫描文件目录的时候会变得非常非常慢,最终导致备份作业慢到超过备份窗口的程度。
3.2 业务管理层面的解决方案
如果从业务管理层面来解决该问题的话,那么就是要让备份作业在一定时间段内保持在合理的数据量范围之内,也就是说要形成合理的多级数据缓存,根据数据使用频度建立多级转储以及归档体系。保障使用频度高的数据在日常备份作业范围内,合理归档使用频率非常低的历史数据。拿金融行业的票据、信贷类系统来说,我们可以将合理业务周期内的非结构化数据存在在一级缓存当中,保障业务复核阶段的数据读取;将业务周期外的非结构化数据转储到二级 NAS 平台上,保障近期内可能使用到的业务场景;将较长周期之前的数据定义为离线数据,归档到归档存储设备当中。备份仅仅涉及到归档之前的数据。这样既可以保障数据存取的性能,又能保障备份作业的长期稳定性,最终保障备份系统整体的安全稳定。
3.3 技术管理层面的解决方案
通过 3.1 章节对问题的原因分析,我们知道导致备份无法进行的原因在于备份软件对于庞大文件系统目录的扫描时间过长。那么顺着这个思路,如果我们在备份的时候能避免去扫描整个文件系统目录,而是通过别的方式来完成备份,就可以解决这个问题。通过调查研究我们发现目有两种方法可以实现:
1) 传统 NAS 的快照方式。对于传统的 NAS 存储来讲,快照是非常普遍的功能,通过 NAS 本身的快照复制,我们可以不用扫描文件系统目录,仅仅基于某一个时刻点的快照,进行卷级别的复制实现全量备份;通过块儿级别的对比实现增量备份,因为 NAS 设备底层还是基于块儿设备实现的。当然这种技术需要对存储本身的快照功能有非常强的依赖性。
2) 分布式 NAS 存储的日志记录方式。某些基于分布式技术实现的 NAS 存储可以对外提供日志操作的接口,也就是说对文件数据的增加和更新会记录到存储本身的底层日志当中,那么我们仅仅需要调用日志比对的接口就可以快速找到更新的目录和文件,仅仅需要扫描更新的部分做增量的复制来完成备份。
以上的两种技术方案需要我们在做备份规划之前的选型阶段对不同的备份软件及存储介质等进行深度调研和分析,尽可能科学合理组合实现以上解决方案。
原题:企业备份系统运维管理关键问题讨论