AIOps蜕变

2021-09-23 19:19

从热到冷,再到热,AIOps似乎经历了王国维人间词话的“三境界”。

2016年,Gartner开创性地提出“AIOps”概念,中文释义智能运维,即借助大数据、AI等新技术手段,为IT运维提供数字化和智能化支撑。饱受人工运维之苦的业界为之一振,对AIOps的各种诠释满天飞,正所谓“昨夜西风凋碧树,独上高楼,望尽天涯路”。

然而,AIOps的发展进程充满波折,落地速度远不及预期。AI技术成熟度的不足、专业人才储备的匮乏、数据采集与分享机制的缺位、运行平台和解决方案的脱节等问题层出不穷,尽管各路商家“衣带渐宽终不悔”,也只能落个“为伊消得人憔悴”。

从Gartner去年发布的中国ICT技术成熟度曲线可以看出,AIOps正在从过高期望的峰值向下滑落,未来有望进入真正的应用实施阶段。这意味着经过几年的摸索与试错,AIOps有机会突破大规模实践的临界点,可谓“蓦然回首,那人却在灯火阑珊处”。

站在转折点上的AIOps,更需要重磅力量的推动。9月23日,在华为全联接大会上,华为正式发布AIOps服务,聚焦网络智能运维,降低AI开发门槛,构建AI生态,携手合作伙伴助力企业运维智能化转型。

AIOps的机遇与挑战

AIOps潜在的市场空间相当可观。根据艾瑞咨询的预测,2021年中国IT服务有望突破万亿元大关,其中IT运维市场规模将达2941.2亿元。MarketsandMarkets Research的数据显示,全球智能运维市场未来几年的复合增长率预计为30.6%,2027年规模可达400亿美元。

伴随千行百业数字化转型的不断深入,面对上万台服务器、几千个软件模块、PB级海量数据的联袂冲击,传统人工运维方式越来越捉襟见肘,谋求运维模式转型成为当务之急。

AIOps的出现一度缓解了焦虑。AI算法可对海量运维数据进行分析,并能自动、精准地发现和定位问题,进而提高整体运营效率,降低IT运维成本。

不过,AIOps落地在实际业务中仍面临诸多挑战。例如,运营商、数据中心、园区等网络架构复杂、应用繁多,需要业务分析师、开发工程师等人员协同参与。而一项针对用户智能运维现状的调查表明,超过五成公司缺乏具有AI专业知识的员工。即使大咖到位,运维人员也需要人工编码开发不同场景的AI应用,耗时费力,且效果难尽如人意。

另一个阻碍AIOps加速渗透的因素是单打独斗,难成气候。潜力巨大的智能运维领域引来各路商家竞逐,ICT厂商、互联网平台以及新兴资本扶持的“独角兽”们,在这个大舞台上各显其能,但迄今尚未形成多层次的协同与合作,打造良性运行的生态体系任重而道远。

降低门槛与构建生态

新技术与新模式的推广,离不开特定的市场环境。中国信通院在《全球数字经济新图景(2020年)》中发布了一组数据:以美国为代表的发达国家农业、工业、服务业数字经济渗透率分别为 13.3%、33.0%和46.7%,而中国三大产业的相关比例则分别为 8.2%、19.5%和 37.8%。

在数字化渗透率较低的背景下,各行业的运维环境必然存在新老过渡期独有的复杂性。AIOps只有躬身而行,才能普惠众生。华为AIOps服务于今年4月在华为开发者大会发布公测,并在9月的华为全联接大会宣布正式商用,其核心诉求就是帮助用户与合作伙伴降低AI应用开发门槛。

基于30多年的ICT行业经验以及在AI领域的持续积累,华为AIOps推出了降门槛的组合拳:沉淀10+开箱即用的智能APP模板,覆盖MBB/FBB、园区网络、数据中心、IT应用四大领域;预集成20+AI原子能力,涉及故障预测、检测、诊断、识别等环节;支持通用数据源,帮助合作伙伴零编码快速开发AI应用。

跨厂家主流设备无法对接,是制约智能运维前行的绊脚石。华为AIOps支持SFTP、Kafka、Rest等通用采集协议,以及华为30类网元、跨厂家100多种主流设备的自动对接,可满足ICT网络领域端管云的数据采集需求,解决了困扰业界已久的难题。

分钟级预集成App部署,有助于不同场景的合作伙伴更快上手。华为AIOps祭出数十个经专家调优与局点验证的APP,用户只需配置数据源,即可启动APP运行;开发过程缩短到分钟级,AI应用的轻松部署得以实现。

零编码APP开发也是降门槛的大招。华为AIOps基于丰富的原子能力,简单拖拽式设计APP,系统自动完成节点间的数据衔接并推荐下个节点,省去用户从组件库中反复筛选验证的过程,也降低了AI应用开发难度。

可视化大屏按需定制,则是化繁为简的巧思。华为AIOps提供80多个2D/3D可视化组件,能DIY包含趋势、报表、网络关系等元素的可视化大屏,通过自定义SQL灵活检索数据。业务结果快速呈现,有效提升了运维效率。

此外,华为AIOps还具备高质量AI原子能力,覆盖各类网络运维场景,通过100+现网局点验证,异常识别与故障诊断准确率达90%,同时支持合作伙伴开发原子能力。

华为网络人工智能产品部AI模型与训练服务部部长王晶

降低门槛与构建生态相辅相成,不可偏废。华为AIOps秉承一贯的开放态度,支持合作伙伴开发行业APP、发布应用到AI市场。正如华为网络人工智能产品部AI模型与训练服务部部长王晶所言:“华为AIOps旨在降低ICT领域AI开发门槛,加速AI应用落地。我们致力于为合作伙伴提供一站式零编码开发平台,赋能合作伙伴创新,共建智能运维生态。”

落地成果昭示未来

据《IT创事记》了解,华为AIOps迄今已在110+现网局点广泛应用,帮助客户管理10万多个KPI,API调用次数每月达6亿次,每天处理1000万告警。

规模化商用之前,先在自己身上使用,了解真实效果,并敢于挑战难度系数最高的运营商领域,体现出华为AIOps的信心与担当。

华为南方工厂5G智能制造园区有机器视觉质检、自动导航小车调度、AR辅助作业等七大应用场景,对故障处理和运维效率要求颇高,面临的问题主要包括:数据接口复杂,治理难度高;跨域问题需协调各域专家分析,定位效率低,恢复时间长;针对新场景的智能运维应用,开发效率较低。

显而易见,实现园区5G网络设备的智能运维,是解决上述难题的路径。借助华为AIOps提供的数据对接、AI原子、业务编排、可视化大屏定制等能力,园区变被动响应为主动运维,网络关键指标实时监控,故障提前预防,达成运维方式的智能化转型——数据对接效率提升1倍,KPI异常检测查全率增至90%+,跨域问题定位从天缩短到分钟级,面向新场景的应用开发效率提高2倍以上。

运营商核心网对智能运维的要求之高毋庸讳言,其遇到的麻烦也不少:成千上万的海量KPI指标,很多维护工程师只能监控20+核心KPI;传统静态阀值检测存在漏、误报,且无法根据夜间、白天等场景转换进行动态调整;核心网故障对用户体验影响巨大——某运营商2019年因交换机软失效,导致15万用户VoLTE业务中断10小时以上,造成难以弥补的损失。

2020年7月,某供应商将DNS脚本的指向配置错误,对某运营商8个城市2000多5G用户的数据业务造成威胁。华为核心网KPI异常检测APP,提前5小时发现问题,并发送告警短信,避免了可能发生的危机。正是因为屡次经受住类似的考验,华为AIOps的全面商用才更有底气。

面对不同行业参差多元、日益深化的智能运维需求,华为AIOps还有很长的路要走。所幸这条路并不孤单,未来会有更多的合作伙伴与用户共赴前程。

(0)

相关推荐