构建“新基建”国家战略的技术底座

中国网/中国发展门户网讯2018年12月,中央经济工作会议提出“加强人工智能、工业互联网、物联网等新型基础设施建设”,“新型基础设施建设”(以下简称“新基建”)这一概念首次出现在中央层面的会议中。随后“加强新一代信息基础设施建设”被列入2019年政府工作报告。“新基建”迅速成为从中央到地方广泛关注的热点话题。

何为“新基建”,以及“新基建”到底“新”在哪里?也是专家学者探讨的焦点。2020年4月20日,国家发展和改革委员会在4月份新闻发布会中明确指出新型基础设施主要包含3个方面的内容:信息基础设施、融合基础设施、创新基础设施。信息基础设施首当其冲成为新基建的重要基石之一。2021年5月24日,国家发展和改革委员会、中共中央网络安全和信息化委员会办公室、工业和信息化部、国家能源局四部门联合印发的《全国一体化大数据中心协同创新体系算力枢纽实施方案》明确指出,在京津冀、长三角、粤港澳大湾区、成渝,以及贵州、内蒙古、甘肃、宁夏等地布局建设全国一体化算力网络国家枢纽节点,这为信息基础设施中算力基础设施建设做了进一步规划。

新基建是国家在面对国内外政治、经济及科技新形势下,面向第二个百年奋斗目标部署的一项国家级战略,肩负着拉动国内经济大循环、建成世界科技强国的双重任务。新一代信息基础设施建设更是引领了“新基建”的战略规划。无独有偶,20世纪90年代,美国也是通过“信息高速公路”这一信息基础设施建设计划,拉动美国经济迎来一波罕见的超长期繁荣发展,一举奠定了美国在信息领域的绝对引领地位。

“信息高速公路”计划奠定了美国信息技术方向的引领地位

20世纪90年代,时任美国总统克林顿提出一个影响后来20年的国家战略——“信息高速公路”(Information Superhighway)计划。该计划对美国的信息基础设施升级、互联网产业的腾飞、经济的持续性繁荣起到了关键支撑作用。在20世纪80年代末,整个美国网络还不到1万个节点,信息基础设施相当陈旧。1991年美国政府颁布了《高性能计算法案》(High Performance Computing Act of 1991),启动“国家信息基础设施”(National Information Infrastructure)计划。1992年,戈尔就任美国副总统,开始以“信息高速公路”计划的名义推动和实施“国家信息基础设施”计划。1994年1月11日,戈尔在加州大学洛杉矶分校召开了第一次“信息高速公路”计划峰会。此次峰会吸引了1800多名参会者,并向全美国进行直播——第一次将网络制造商、计算机制造商、学术界融合在一起,进而引起全美范围讨论“信息高速公路”。尽管“信息高速公路”计划提出之前的20年里,网络TCP/IP、无线网络、以太网、RISC处理器等技术都已发明,但尚未得到大规模应用。“信息高速公路”计划不仅将这些20世纪70—80年代发明的信息技术有机地结合起来,而且还催生了一批满足互联网新兴应用的新技术。例如,20世纪90年代出现了Cluster集群技术、RAID存储技术等;其中,Cluster集群技术为构建大规模数据中心与计算中心提供了性价比更优的技术方案,而RAID存储技术则为网络视频、网络存储等新兴应用提供技术支持。

“信息高速公路”计划的成功一举奠定了美国在全球信息领域的绝对引领地位,孵化验证了一批影响之后20年全球信息基础设施基本格局的关键支撑技术。在经济方面,美国的国内生产总值(GDP)的增长率也从1991年的负增长(-0.07%)不断攀升至1999年的4.69%。从1994年戈尔第一次发表“信息高速公路”计划到他2000年卸任的7年间,美国GDP年均增长率高达4.04%,远超其他发达国家。

不仅如此,美国国家科学基金会(NSF)自2000年开始对美国高校和科研机构,持续性地资助建设信息基础设施的科研试验平台,建设了多种信息基础设施科研试验平台,支持科研人员自由探索包括网络、分布式系统、云计算等方向的前沿颠覆性技术。例如,2002年建设的PlanetLab项目,支持科研人员自由地进行网络协议、网络服务等方向的学术创新工作,一跃成为美国网络技术、分布式系统等领域早期最重要的实验平台,孕育出了云计算等领域的关键支撑技术。PlanetLab之后,美国NSF、学术界及民间机构持续搭建了多个试验平台(图1),支持包括网络技术、分布式系统、云计算、边缘计算等在内多领域的科学研究与探索。Cloudlab项目是由美国犹他大学等于2014年联合发起的云计算技术试验设施,它为研究者提供了对大量计算、存储和网络资源的裸机访问和控制——仅需几分钟就可配置整个云环境。Chameleon项目是一个大规模开放云计算研究实验平台,以支持计算机科学系统研究。其已支持了3000多个用户参与的500多个项目,项目范围从新操作系统的研究和开发、虚拟化策略研究、性能可变性研究、电源管理研究到软件定义网络、人工智能。EdgeNet是2018年发起的联合项目,是一个跨域分布式边缘云实验平台;该平台允许用户将应用程序部署分散到互联网上的数百个节点上,目前其在美国和欧洲分布有50多个站点。2019年,美国肯塔基大学等联合提出FABRIC项目——可编程式网络测试基础设施,目标是建设一个开放的、分布式、全球性、融合通信、计算、存储、人工智能等领域的综合试验设施,以提供高质量的、协同创新的试验平台。

与美国相比,中国信息领域的科研试验场建设起步较晚。距笔者所知,目前国内信息通信领域知名的重大科技基础设施,只有由江苏省未来网络创新研究院牵头建设的未来网络试验设施(CENI),其建设目标是面向未来网络前沿科学问题,建设一个开放、易使用、可持续发展的大规模通用未来网络试验设施。该设施主要侧重于网络方向前沿研究需求,而中国在异构算力、分布式系统、云计算、边缘计算等领域的前沿开放科研试验平台方面依旧处于相对空白的状态,并且与美国长期在基础设施试验平台方面的投入有不小的差距。笔者认为,这也是国家将信息基础设施建设作为新基建的三大方向之一重点推进的一个重要因素:通过建设一批新一代信息基础设施,孵化出能够引领下一代信息技术浪潮的颠覆性技术,助力我国在新中国成立100周年时跻身世界科技强国之列。

人-机-物三元融合的智能时代使信息基础设施面临诸多新挑战

从信息技术的发展趋势上来看,全球正在从早期的机-机一元互联的信息技术(IT)1.0时代,走过人-机二元互联的IT 2.0时代,并正在逐渐迈入人-机-物三元融合的IT 3.0时代(即智能时代)。万物互联的智能时代下,物端④数量将会迎来爆发式的增长,包括智能无人车、“工业4.0”装备、智能农机、智能硬件等领域在区域内将出现百亿级别的物端设备,全球范围内预计更会出现万亿量级的物端设备。万亿级规模的物端新设备带来了洪流般信息流,对当前的信息基础设施提出了诸多新的挑战。

(1)高通量:信息通量可达到亿级并行,可连接万亿级互联物端。当前“信息高速公路”基础设施,当载荷到了一个拐点,信息发生堵塞会使其出现性能大幅下降的现象。IT 3.0时代,信息基础设施将面临万亿级物端设备连接下所带来的“重载荷”信息流,信息通量需要依旧能保持稳定。

(2)端到端延迟确保:端到端延迟可调、可测、可控,实现毫秒级延迟确保。当前“信息高速公路”基础设施遵守“尽力而为”的基本原则,对于用户端到端的服务质量没有保障。而IT 3.0时代的诸多场景,如无人智能车、工业互联网、智慧医疗等,必须提供端到端毫秒级延迟保障,用户才放心敢用。而且,不仅要在整体低负载时能够做到,还需要在重载荷下依旧提供毫秒级延迟保障。

(3)智能算力无处不在:在云网边端,智能算力无处不在。IT 3.0时代,一方面,智能将作为广泛存在的能力被赋予云网边端各类设备上,为万亿级物端所产生的数据洪流随时随地提供智能算力服务,进而催动智能算法的大爆发;另一方面,信息基础设施所提供的算力本身也应是智能的,可实现“算力-算法-数据”三元智能融合,从而实现信息基础设施中算力资源的高效利用,最大化降低资源浪费。

在万物互联时代,物端设备将是物理世界与信息空间的关键入口,承载着与物理世界完美对应交互的数字世界的大量信息输入;同时,万亿级规模的物端设备携带着洪流般的信息流,也对现有的信息基础设施的架构及关键支撑技术形成巨大挑战。因此,下一代信息基础设施亟待核心技术的根本性突破,以满足高通量、端到端延迟确保和无缝智能等人-机-物三元融合的智能时代的新需求。

“信息高铁”计划

为面向万物互联的IT 3.0时代,中国科学院计算技术研究所(以下简称“计算所”)提出了“信息高铁”科技创新行动计划,致力于打造基于新技术体系的、自主开放的信息基础设施,从而为“新基建”这一国家战略打造技术底座,让IT 3.0时代真正成为由中国主导的信息时代。

“信息高铁”的目标是要打造一套覆盖云网边端的一体化新型信息基础设施。IT 1.0时代,信息基础设施的目标是通过网格中间件实现超算资源互联共享,为特定应用提供算力服务,即网格计算。因此,IT 1.0时代也可以看作算力网1.0(图2)。到人-机互联的IT 2.0时代,随着人类社会的活动与数字世界之间交互不断深度耦合,算力资源逐渐像水、电一样成为日常必需资源,为每个人的日常活动提供服务;信息基础设施支撑了人的日常生活与信息世界交互所产生全部信息传输和计算需求,即当前的算力网2.0。以云计算为代表,通过虚拟化等技术,以集中共享的方式,降低算力成本,实现普惠算力供给。

然而,集中式的算力网2.0,在面临日益爆发式增长的数据与算力需求,也逐渐呈现出捉襟见肘的疲态。通过对我国互联网行业的观察可以发现,每年“春运”“双十一”等大规模集中式人类活动所产生的极限信息洪流,都会对信息基础设施产生严重的冲击和影响。尽管各大公司通过多年的技术积累和锤炼,在近2年已经能够基本应对这一短时的极限压力,但这一技术突破的背后却是多年来不计成本的大量资源和人力投入。即便如此,也仅仅能够应对偶发式、确定性的短时信息洪流。当进入人-机-物三元融合的智能时代,万亿级规模的物端设备接入信息基础设施,信息基础设施中将会随时随地出现此起彼伏的信息洪流冲击。因此,仅靠任何单一服务提供商都无法完全解决数据传输和算力需求,算力网亟待通过全新的顶层设计应对这一严峻挑战。

因此,计算所提出了“信息高铁”,即算力网3.0。按照“一横一纵”的思路,我们重新定义下一代信息基础设施的边界:“一横”是通过联邦制的方式横向联通,最大化组织起所有愿意共享的大/小数据中心的各类异构算力资源,向上突破信息基础设施所能提供的理论算力峰值,并为用户提供统一封装、抽象易用的算力资源;“一纵”是纵向打通云网边端全链路基础设施资源,通过全链路多级多维度测调、控域隔离等方式真正实现海量物端应用的端到端服务质量确保。

通过“一横一纵”的延展,“信息高铁”可成为一台跨域的分布式大电脑。万亿级物端设备与端边云各节点通过网,按照一定的结构和规则组成一台协同工作的计算机,通过一套分布式系统软件使得云网边端资源像一台计算机中的CPU、总线、外设等部件一样协调紧密地配合,从而解决当前技术体系中由于各个环节间缺少有效协同而导致的低效、服务质量保障能力弱等突出问题。“信息高铁”通过提供高通量、高品质和高安全的信息基础设施服务,应对人-机-物三元融合的智能时代中无处不在的信息洪流和智能算力需求,形成“共建、共享、共受益”的算力命运共同体,从而让信息技术创新的各个要素能够更易获取,人人都可以成为平等的创新主体。

“信息高铁”综合试验场建设实践与思考

“信息高铁”综合试验场初步建设情况

目前,计算所已初步在中科南京信息高铁研究院建设了一个微型“信息高铁”;其由端、边、云开放实验室组成,是信息高铁研发团队的内部开发试验平台,用于将关键技术及系统在该试验平台上集成、测试、验证和演示。同时,北京(计算所本部)、南京(中科南京信息高铁研究院)、盐城(中科高通量计算研究院)、郑州(中科大数据研究院)等4地算力站已具备接入“信息高铁”综合试验场内场的条件,已初步形成一个“信息高铁”内场综合试验场。

“信息高铁”综合试验场从逻辑上分为5层:物端层、接入层、网络层、算力层和系统软件层(图3)。其中,物端层作为“信息高铁”的神经末梢,是物理世界与数字世界的数据出入口;接入层为万亿级物端提供无缝的、天地一体化全域覆盖的边缘网络接入服务;网络层能够支撑“信息高铁”广域互联与数据可控传输;算力层是“信息高铁”的处理中枢,为各类应用提供数据洪流下云端算力保障和服务能力;系统软件层(英文名:OneStack;中文名:一栈)是实现云网边端资源管理和一体化协同、面向用户提供高品质高安全服务的核心系统。

“信息高铁”建设的目标

近期目标。为我国科研院所提供服务支撑,为人-机-物三元融合的智能时代的关键颠覆性科研成果提供基础设施级的研究、开发、实验、验证和演示平台。

中期目标。打造面向产业互联网的分布式算力基础设施科技创新平台,服务传统行业应用,助力我国全面实现数字化社会转型。

终极目标。建成覆盖我国乃至“一带一路”沿线国家的高通量、低熵、无缝智能的算力联邦服务平台,实现“共建、共享、共受益”的算力命运共同体。

实践过程中的若干思考

在“信息高铁”综合试验场的建设实践过程中,形成了如下3点思考。

(1)突出应用需求导向。信息技术的发展特点是应用与技术双轮驱动,新一代信息基础设施的发展离不开应用需求的牵引。因此,“信息高铁”综合试验场采用“边建设、边应用,快速迭代、滚动升级”的策略,在建设过程中应充分吸收行业智能化发展需求,并同步开展面向科技创新和行业应用的服务。为此,我们深入调研了气象、巨灾保险、农业、环保、医疗、教育等国家重大行业部门智能化发展对信息基础设施的应用需求,规划了2类行业应用服务:①建“专列”。根据用户需求在“信息高铁”综合试验场上构建“专列”——提供云网边端软硬件资源,为用户提供隔离的、可靠的应用开发、试验和运行环境。②建专网。为用户提供信息基础设施软硬件整体技术方案与核心系统,基于联邦制滚动接入全国各地参建单位资源,逐渐扩大规模。

(2)积极承接国家战略。在顶层设计方面,“信息高铁”的核心技术思想——“云网边端一体化融合”与国家“新基建”、“全国一体化大数据中心”等发展战略规划的技术构想十分契合。在实践基础方面,计算所在“信息高铁”的核心技术与系统研发方面有多年的积累和实践经验,具备承接国家战略的能力。因此,应牢牢抓住战略机遇,积极对接国家有关部门,针对行业需求“痛点”“堵点”,提供基于新技术体系的新一代信息基础设施解决方案;并在政策的支持下,加快推进“信息高铁”综合试验场建设,为国家发展积极贡献力量。目前,“信息高铁”综合试验场已经正式列入江苏省“十四五”规划,这标志着其在参与和承接政府发展规划方面已迈出了重要一步。

(3)着力建设生态体系。“信息高铁”综合试验场未来要依靠多方的力量、以联邦制商业模式推动建设。为此,“信息高铁”技术和产业生态的搭建至关重要,而开放的标准是前提。应加快推动建立“信息高铁”综合试验场技术标准体系,梳理定义、标准、体系框架。在参考、引用现行相关标准规范的基础上,结合“信息高铁”的技术特色进行必要的创新。探索设立“信息高铁”开放课题、产业基金等创新扶持计划,鼓励引导广大科研人员和创新群体在“信息高铁”综合试验场上开展技术创新和应用创新,加速培育技术和产业生态。

展望:“新基建”国家战略下“信息高铁”生逢其时

新中国成立初期,处在内忧外患的国际形势下,中央以举国之力提供算力支撑保障,最终实现了“两弹一星”的伟大突破,使中国人民在世界舞台上成功站了起来;十一届三中全会之后我国全面开启改革开放的新征程,算力服务我国全面建设铁路、公路、电路、网路等基础设施,助力我国经济持续加速腾飞40余载,使中国人民真正富了起来;如今我国正在向人-机-物三元融合的智能时代迈进,人类社会、物理世界将通过万亿级物端入口全面进入数字世界,算力将会像石油资源一般,成为全面支撑数字时代的源动力。恰逢其时,我国领导人极具前瞻性地提出了“新基建”这一国家级战略,新一代信息基础设施建设作为其中的重要一环,肩负着建设数字时代“油田”的重要使命,必将为我国屹立于世界科技强国之列提供源源不断的动力。

在如此背景之下,“信息高铁”计划正当其时,将肩负着构建“新基建”国家战略的技术“底座”这一使命,为新中国在“站起来”“富起来”之后,真正实现“强起来”的历史性飞跃提供强有力的支撑;并且,有望最终覆盖我国并进一步辐射“一带一路”沿线国家,实现“共建、共享、共受益”的算力命运共同体。

(作者:王晓虹,中国科学院计算技术研究所;王卅,中国科学院计算技术研究所;唐宏伟,中国科学院计算技术研究所;彭晓晖,中国科学院计算技术研究所。《中国科学院院刊》供稿)

(0)

相关推荐