访谈 | ​科技创新驱动数据中心蜕变

文 / 本刊记者  李明富

银行数字化转型不仅促进业务的快速增长,同时还带来诸多挑战,而其数字化金融的基础则是依托于稳健可靠、敏捷高效的数据中心建设与运营,才能为银行运营效率和服务水平的提升提供保障。中信银行作为国内最大的股份制银行之一,在过去五年紧紧抓住数字化变革时代的机遇,以科技赋能、创新驱动为核心动力,实现数据中心的全面发展与蜕变。面对“新基建”的提速和即将到来的“十四五”规划,中信银行数据中心将如何创新应变,追求卓越?本刊记者为此与中信银行数据中心总经理迟鲲进行了深入交流和探讨。

中信银行数据中心总经理    迟鲲

数据中心实现全面发展与蜕变

Q

记者:今年是金融业信息技术“十三五”发展规划收官之年。数据中心作为金融业务发展的心脏,过去五年,贵行的数据中心建设思路是怎样的?五年来,数据中心运维建设取得了哪些成就?

迟鲲:中信银行数据中心的建设思路是,将赋能业务发展作为一切工作的初心与使命,以为全行特别是业务一线提供更具温度、更富效率、更趋便捷的科技服务为宗旨,坚持创新为本、转型引路,对标自动化、智能化、数字化发展方向,将云计算、大数据、人工智能等新技术创新引用贯穿数据中心全流程、各环节,努力实现基础架构、管理体系、工具体系、信息安全、合规内控、支持服务体系等工作的全方位转型和运维管理能力、风险控制能力、敏捷交付能力、科技服务能力的跨越式提升。数据中心从保障系统安全稳定运行的“旧貌”转变为全方位赋能业务、助力全行高质量发展的“新颜”。

一是IT基础设施向全云化转型。基础设施从传统架构转变为全云化架构,打造比肩互联网公司的智能、敏捷、弹性、服务化、低成本的云基础设施。

二是运维工作方式向全面自动化、智能化转型。从传统的手工维护为主,转变为巡检、批处理、变更、应急等日常运维工作全面自动化,并进一步向智能化迈进。

三是运维管理模式向全行一体化转型。从分行各管一摊(应用、网络、机房运维)的分散式运维,转变为总行为主、分行为辅的全行一体化运维模式,全行计算资源统一上云,通过自动化、智能化手段实现全行所有系统、网络、机房资源的统一管理。

四是运维管理体系向数字化转型。从对标ISO 20000 IT服务管理体系,转变为ISO 20000+GB/T33136数据中心成熟度模型融合的管理体系;从以管为主转变为向各级人员进行管理赋能的管服结合,从单纯的流程管理转变为可视化、全面量化、敏捷改进的数字化管理。

五是运维风控向事中化、智能化转型。运维风险控制从传统人工控制、事后抽查为主,转变为利用大数据及人工智能技术,实现线上线下、事中事后全覆盖的自动化、智能化机控。

六是信息安全向智能化、立体化、主动防御转型。构筑全面、智能、立体的信息安全技术、运营管理体系,从被动防护转向主动防护,从事后防护转向全过程防护、从边界防御转向全面防御,从防御体系建设转向攻防兼备,能力相长的攻防体系建设。

七是业务支持向服务化、主动化转型。对总、分、支业务人员的技术支持工作,服务方式从过去的被动接单手工交付转变为提供主动、高效、智能、便捷的科技服务;服务内容从传统信息系统运维服务转变为主动调研输出技术能力为业务赋能。

在行领导的正确领导和大力支持下,在数据中心各部门上下同欲、只争朝夕的共同努力下,中信银行数据中心现已成功驶入科技创新驱动发展的快车道。目前利用创新技术、方法、工具解决传统“顽症”、“痼疾”的工作理念已经在部门团队中蔚然成风,各类技术创新、模式创新、方法创新层出不穷,运维管理、风险控制、敏捷交付、科技服务、成本控制等各方面能力相比五年前得到了显著甚至跨越式提升。一言以蔽之,数据中心紧紧抓住了数字化变革时代的机遇,坚持向持续创新要驱动力、向规范管理要战斗力,实现了全面的发展与蜕变。

一是主要运维指标实现质的飞跃。重要信息系统可用率从2016年的99.9968%成功提升至2020年的99.99999%,一般性生产事件数量年均下降40%,人均维护系统和设备数量分别增加63%和228%。

二是建成达到业内领先的分布式系统运维体系,保证了分布式核心系统平稳运行。大量运用大数据、可视化技术及开源技术,建成贴合分布式系统特点的新一代“监、管、控”体系,并顺利完成传统核心系统运维团队转型。2020年5月“零失误”实现分布式核心系统顺利投产,投产后系统运行平稳,顺利度过“双十一”业务考验,可用率达到100%。

三是基础设施全云架构转型基本完成。建成全行统一的云管平台,全面推广标准化资源池,目前已能够为全面为全行及子公司提供标准化云服务;自主创新研发自动化仿真测试机制,全面推动小型机下移X86平台,基础设施整体云化率达到96%,预计2021年初将达到100%。

四是全面实现基础运维工作自动化。通过持续不断的工具建设与积累,目前变更自动化率达到98%,告警、事件、应急处置自动化处置率84%,故障自愈率48%,巡检及批处理自动化率常年保持100%。实现网络控制开通等重要网络变更场景的全流程自动化。

五是全面实现全行运维一体化。依托高效、智能的自动化平台,全面实现以总行远程管理为主、分行本地操作为辅的系统、网络、机房管理等全行基础运维一体化。在总行人员基本没有增加、分行IT运维人员适量减少的情况下,实现全行所有分行自研500多套特色应用系统(迁移至“中信银行云”)、14000多台网络设备、6000余条通讯线路的集约化管理及150余处机房的远程集中监控,同时实现了分行本地IT资源池的标准化。运维一体化有效实现了全行科技资源和分行信息科技操作风险的集中管控,构建了全行运维管理水平和工作效率“双升”、运维风险和成本“双降”的格局。

六是建成全行运维智能风控体系。立足通过工具与流程整合对管理要求进行固化,实现行为级的事中“硬控制”。建设基于大数据的自动化合规检查平台,实现对不合规情况的自动识别。目前已实现自动化检查模型151个,其中实时模型15个,自动纠正模型4个,已申请专利5项。

七是运维管理体系高分达到数据中心成熟度优秀级。建成包括39个能力项的ISO 20000+GB/T33136数据中心成熟度模型的融合式管理体系,并于2019年以3.99高分通过数据中心成熟度优秀级认证。自2020年开始全面推进管理体系数字化转型。

八是科技服务体系更加智能化、敏捷化、人性化。为分支行一线业务人员提供“PC+移动端”的直通式技术支持服务,运用“智能客服+知识库”手段,实现秒级响应、分钟级反馈,得到了一线业务人员高度认可;与总行所有部门签署专属服务协议,配备专属服务经理,并对服务质效进行工单级自动监控。在提供基础技术支持服务的同时,积极向业务部门提供如业务数据可视化监控等增值创新类服务,为业务赋能。

“新基建”时代挑战与机遇共存

Q

记者:金融与科技创新、融合发展是大势所趋,开展数字化转型已成为金融业发展的方向。“新基建”的提速则加速了金融业数字化转型的进程和节奏,数据中心作为重要的IT基础设施,被纳入为新基建,成为加速发展的重点。请问,在“新基建”时代,数据中心建设面临怎样的挑战和机遇?

迟鲲:“新基建”时代,数据中心面临以下挑战:一是来自业务发展与数字化转型的挑战。在金融业数字化转型加速的背景下,银行业务需要面对来自同业及金融科技公司的双重竞争,走洞察自己、洞察客户、敏捷灵活的数字化转型之路迫在眉睫。银行业务数字化转型的关键在科技创新驱动,作为银行科技的底座,数据中心需要与业务数字化转型进行同步适配,向更加智能、更加灵活、更加敏捷,全行一体化、数字化的方向转变,为顶层业务应用提供智能、灵活、敏捷、安全、高效的IT基础资源保障,支持数字化时代下银行业务的发展。

二是来自复杂外部环境的挑战。包括:新冠疫情的长期化对场地、人员带来的影响,需要在连续性方面提前做好周密部署;日益复杂的网络安全环境对信息安全工作,尤其是数据安全保护提出了更高的要求;美国对中国的科技压制造成数据中心相关软硬件供应链风险。

三是来自自身发展变革的挑战。包括:组织文化转型的挑战——数字化转型首先是人的转型,各级人员都需要打破原有思维定式,改变原有工作习惯,突破舒适区,养成数字化思考和工作习惯,拥抱新工具、新方法、新思路,形成数字化工作文化氛围。人才的挑战——作为新基建的重要组成部分,数据中心的加速发展带来对更多、更高人才的需求,同时面对外部互联网公司的人才竞争,人才招聘的难度和现有人员流失的风险都将逐步显现。此外,现有人员也面临知识技能转型的挑战,从对大数据、人工智能等新技术、各类开源软件的掌握,到由单纯运维到开发式运维的转变,对数据中心人才培训培养机制提出了新的要求。平衡创新与风险的挑战——在新技术应用落地的同时控制好风险,避免新技术、新工具引发新问题,对数据中心管理的精细化与规范化提出了更高的要求。

“新基建”聚焦于“信息化、数字化、智能化”,这为商业银行的金融科技深度应用和数字化转型提供了历史性的发展机遇。数据中心纳入新基建后,预计国家在产业政策上的支持和企业在资源方面的投入保障都会显著提升,同时也将会有更多资本和公司参与数据中心相关技术与产品的研究与落地、更多组织参与数据中心相关标准与规范的研究与制定,上述因素都将帮助数据中心整体水平的快速发展,拓展数据中心服务边界,提供更多、更好高水平的科技服务。中信银行数据中心将借助新基建的东风,在科技创新驱动的“核动力”下,实现整体水平的快速提升,达到业内一流水平,为中信银行乃至中国银行业数字化转型做出积极贡献。

以云架构为核心打造敏捷可靠的数据中心

Q

记者:面对新形势、新挑战,提升数据中心IT基础设施稳定性、可靠性和服务敏捷性,是检验数据中心能力建设的重要指标。请问,贵行在达成这一目标过程中采取了哪些措施?请结合具体建设实践案例阐述之。

迟鲲:伴随着中信银行业务的快速发展,手机银行、三方支付、开放银行等互联网业务形态不断扩展,对基础设施提出了高可靠、高性能、高弹性、快速交付的要求。中信银行以云架构为核心,进行基础设施的转型升级,极大地提升了基础设施稳定性、可靠性和服务敏捷性。

一是全面建成、深入推广中信银行云。中信银行自2013年起开始推行生产环境虚拟化,2014年启动大数据平台、分布式数据库的研发,2017年进行容器平台建设、总行核心网络升级,2018年启动了基础设施转型升级工作,推广SDN、分布式等新技术的使用,完成了覆盖总行、卡中心、分行、子公司的IaaS云平台的建设,2019年上线了PaaS云平台、全面推广SDN网络,2020年核心系统、网银系统迁移到分布式数据库,基础设施由以小型机为主的传统架构转型为以分布式、虚拟化为主的云架构,基础设施整体云化率达到96%。

二是加速各领域技术的升级改造。具体包括5个方面:在计算资源上,大力实施小型机下移X86服务器的工作,目前70%的小型机已替换为X86服务器,计划明年上半年小型机将全部替换为X86服务器。在存储资源上,大量使用国产全闪存储,实现高IO与低时延,目前全闪存储容量占比达到70%。网络技术方面,总分行网络均实现跨代升级,实现数据中心同城双活网络,支撑应用的多活部署;大力推进SDN网络的使用,目前SDN网络已在开发测试环境、灾备环境及生产环境全面使用。推广使用容器技术方面,大幅提升应用部署效率和系统弹性伸缩能力。灾备技术升级方面,数据库灾备由基于存储复制为主转变为主要基于数据库复制的灾备模式,极大地缩短了切换时间;引入智能DNS技术,实现应用系统同城双活,有效提升了业务连续性水平。

三是实现IT基础设施的敏捷交付。构建运维PaaS平台,统一管控资源发放与资源变更,实现计算、存储、网络、备份等资源的一键式部署,逐步实现IT基础架构资源发放效率由一周提升到T+1日交付,操作过程实现100%自动化、可视化。

“十四五”实现数据中心卓越运营

Q

记者:今年也是金融业信息技术“十四五”发展规划谋篇布局的关键年,在当前金融业数字化转型的广度和深度加速推进的环境下,未来五年,贵行的数据中心建设重点是什么?

迟鲲:未来五年中信银行数据中心将继续牢固支持业务发展的初心与使命,以合规、转型、创新为发展主基调,以科技创新为核心驱动力,在同业率先全面实现基础技术架构、SRE运维、数字化运维管理三个转型,塑造“敏捷、自驱”的技术团队,构建业内领先的运维管理能力和创新发展能力,打造绿色、智能、敏捷的数据中心,持续为业务发展提供7×24小时安全、可靠、敏捷的科技服务,为中信银行数字化转型提供坚实的技术基础,争创卓越数据中心。

一是全面实现基础设施云架构转型。完成基础架构由现阶段“传统+云”的方式转向“全云”架构,实现基础架构云化比例100%,计算资源全X86化,基础资源分钟级交付,最终具备大规模云原生应用的承载及管控能力和标准化声明式的自动环境发放能力,支持业务应用敏捷开发及上线;构建多云架构,在实现多场景、多服务覆盖的同时,最大限度减低基础设施成本。

二是全面实现运维模式SRE转型。全面对标实行互联网公司SRE运维模式,推动“敏捷、自驱”的数据中心运维管理,不断积累业内领先的核心技术能力。包括:建立SRE人才培养、评估和管理机制,将数据中心运维团队打造成一支熟悉DevOps精益文化同时具备一定研发能力且掌握具体系统知识的SRE工程师团队,确保每人至少熟悉一门开发语言;建立数据中心开发标准化流程和工具体系,在全面规范研发流程,促进AI(算法)、容器、RPA、分布式等新技术深度应用的基础上,要求数据中心系统管理员均具备采用编写程序代码,实现涉及的监控、变更、应急、备份、巡检等主要工作能力;全面推行SRE工作模式,在确保运维标准不变的前提下,实现人均管理设备、系统数量提高一倍以上,主要运维工作效率提高一倍以上。

三是全面实现管理体系数字化转型。聚焦用数字洞察一切、管理一切、控制一切,加快推进管理活动全过程的自动化、智能化、可视化、便捷化改造,实现用数字描述与评价管理过程及效果,及对趋势、效果、风险、问题的洞察和敏捷改进。利用个性化管理看板实现管理体系对各层级人员的管理赋能,真正做到管理用数据说话。

(0)

相关推荐