那个没被云计算杀死的运维,转型了技术运营

如何形容传统运维的职业处境?

如果说的冠冕堂皇些:运维人员保障了企业业务的稳定性与安全性;

如果说的直白些:传统运维更像消防员,哪里起火救哪里。

若是仅仅如此,倒也还好。可如今,随着云计算产业的日益成熟, AIOps 、DevOps 理念的盛行,大量运维工作通过自动化运维和智能化运维实现,传统运维的生存空间愈发狭窄

IDC 预测, IT 运维分析,即 AIOps 市场将从 2018 年的 29 亿美元增长到 2023 年的 45 亿美元,其中大部分增长来自“AIOps 即服务”。

按工作内容分,运维工作包括 IDC 运维、网络运维、桌面运维、系统运维、应用运维、运维开发、数据库运维,大数据运维等。其中工作内容相对简单的,比如 IDC 运维和网络运维、系统运维、数据库运维,最容易被 IAAS 和 AI 取代。

思变持恒。职业前景面临挑战的运维们唯一的出路是寻求转型,搏一搏也许还能挣得转机。考虑到技术趋势、运维的技术积累,基于云平台的技术运营也许是运维们的一个不错的转型方向。TGO 鲲鹏会北京会员熊昌伟有 12 年 SaaS 行业工作经验,这位 36 岁的运维专家、阿里云 MVP 就职于用友旗下成员企业畅捷通,任运维总监。他基于丰富的云平台研发、架构、运营经验,坚定从运维管理转型技术运营,从保障产品,转向通过运营技术提升产品价值

云计算的十年

给互联网带来巨变的云计算可以追溯到 2006 年,当时亚马逊推出 Elastic Compute Cloud (EC2),为用户提供虚拟计算机租赁服务,用户可以在上面运行他们的应用程序,EC2 正是 AWS 的核心。当时没有人想到,这样的虚拟计算机租赁服务会在日后成为亚马逊的重要业务。根据财报,AWS 2019 年营收 350 亿美元,占亚马逊整体营收一成以上。

AWS 快速发展,巨头纷纷布局。2008 年,谷歌发布 Google App Engine,日后发展成为 Google Cloud。2010 年,微软宣布进军云计算,推出 Microsoft Azure。至此,巨头齐聚云计算战场。

云计算让用户实现了按需购买 IT 资源,时间灵活,而且享有随意扩展的资源弹性。此外,云计算成为基础设施,让用户能够站在巨人的肩膀上,拉平了技术代沟。基于这些特点,云计算行业迅速崛起,被广泛采用。

2010 年,畅捷通开始采购混合云,到 2015 年全面转向公有云,同时进行了云原生模式的新一代产品研发。

与历史上所有前沿技术趋势一样,诞生之初的云计算,总会对一些旧有职业产生威胁,传统运维就是其中之一。艾瑞咨询在今年发布的《中国 IT 基础架构运维市场研究报告》中指出,由于与云计算基础设施相关的事件、日志、指标、告警等监控信 息需要云服务商来提供基础数据,云服务商开始介入到 IT 基础架构运维服务中,IT 运维行业市场规模缩小,根据艾瑞咨询,从 2016 年开始,中国 IT 基础架构运维服务市场增速呈逐年降低趋势。

“在这个过程中,我深刻的理解到,原有的运维模式将发生巨大的改变,很多我们大量消耗精力的地方,比如机器、网络稳定性,数据库高可用等,都不再需要过多的关注了 ,这样将释放出大量的‘剩余劳动力’,去思考如何‘驾驭’好云,‘运营’好业务,” 熊昌伟告诉 TGO 鲲鹏会。

他下定决心,从运维模式,转换为技术运营,实现反向技术赋能。

相比面向基础设施、维持稳定,技术运营主要面向业务,注重提升用户体验及业务经营效率,从人员能力建设以及考核指标都全面对标用户的体验与业务经营,比如从原来应用 SLA 的追求,到现在 MTTR、MTBF 与 Apdex 多维考核。

“运维人员主要关注产品稳定性,技术运营主要关注可用性、安全性、成本,只讲能用的产品是没有市场的。”

各大招聘网站对技术运营的岗位描述一般是,负责企业整体业务的技术支撑和服务。技术运营负责运维平台的设计及优化;根据产品整体定位帮助运维产品进行演进迭代,实现产品化和标准化;调研业务的运维、安全、效率、成本、质量,分析问题并诊断,提供解决方案;深入业务,通过技术优化产品提升客户体验。

“技术运营主要是通过整合资源、运营技术,赋能研发,使他们能够自助实现应用全生命周期的管理。我们更多的的发现整个生命周期中系统平台支撑的问题进行改进,实现业务状态的数字化,辅助管理业务运营过程中出现的突发状况。日常,我们对业务进行健康状态监控分析,出现致命问题时及时止损。“

业务数据数字化

熊昌伟所就职的畅捷通为小微企业提供财务及管理服务,包括财务管理方面的好会计、T+Cloud、易代账,进销存管理方面的好生意、T1 plus,人财货客一体化管理方面的 T+ & 工作圈、T6 等,增值数据分析方面的畅捷贷。

据介绍,畅捷通已经有累计 466 万家注册企业用户,畅捷贷已经帮助超过 2 万家小微企业通过软件中的财税数据申请纯信用贷款,2019 年为 1.45 万亿交易额提供管理服务。

熊昌伟面临的课题是,如何保证如此多用户的访问质量、以及先于用户发现问题

他的解决途径是,用模型把业务数据或者感性数据数字化,用数字来规划业务的容量,保障业务的可靠运行。具体来说,对业务数据进行获取、表达、存储、传输、处理、交付,通过数字化提升解决问题、满足需求的效率。这样可以精细衡量业务表现和人效,比如每增加一个人,投入产出的变化能清楚看到。

同时,他在团队组织架构及职能方面,也做了相应调整:将 20 多人的团队分成 MSP 开发、OT 开发、DB、安全、品控几个小组。其中, MSP 指的是 Managed Service Provider,MSP 开发负责为对内和对外的客户提供一站式的云服务管理、运营平台,保障平台的高效、可靠运行,并完成面向客户的管理平台建设。OT 指 Operational, Technology,OT 开发负责用科学的流程与技术提升业务运营的层次,完成面向新一代云原生应用的可靠性管理系统建设,为公司数字化运营提供完整全面的业务数据分析呈现。

目前,熊昌伟一天的工作主要围绕公司所有产品的整体运行情况、发现和解决风险点、提升空间,寻找业务亮点。

他提到一个小故事,曾经有客服反馈一位客户单据丢失,希望找回,同时希望为客服部门做一个功能,以快速处理类似问题。这样的功能,如果按照传统的产品设计、开发、测试上线流程,需要两周才能完成开发。熊昌伟的团队了解后,一方面通过日志系统中的业务数据,快速定位到是客户的另一个操作导致的单据删除,回复客户;另一方面,通过服务化的方式,当天就为客服人员提供了自助查询功能。相比传统的救火式运维,技术运营的价值更丰富。

对个人而言,技术运营也正成为一个更受市场欢迎的岗位。根据科锐国际今年的报告,未来云计算市场规模仍将保持 20% 以上的增速,IT 企业对 “未来懂得最新云计算技术的运营人才需求激增”。

如何做好转型?

转型首先要解决的是,定位与心态。熊昌伟认为定位方面要从保障转向服务,为公司、为业务的发展护航。技术运营要关注以下几点:

  • 如何促进产品成熟?通过量化数字,真实、实时地反应出产品运行的状态——错误、响应时间、用户路径等——帮助研发和产品及时发现问题,调整产品功能和方向。

  • 如何发挥技术的价值?运用好云的能力,避免低质量的重复造轮子,降低产品开发难度,避免基础组件给产品设计、研发带来困扰。达到技术所见即所得。

  • 如何给用户带来感动?深入业务,通过技术手段,给客户带来超预期的使用与服务体验。比如:当出现使用问题时,系统能够识别客户端的使用问题,对于非通用性问题自动通知后台服务人员,对于通用性问题,自动弹出建议方案。

  • 成为企业的另一个核心竞争力。通过自身能力的打磨,实现对内,对外的技术能力与系统平台输出,就像电商出身但现在成为 IaaS 供应商的亚马逊和阿里巴巴。

其次是能力。与所有工作岗位一样,技术运营在各个公司的定位大相径庭。熊昌伟介绍,在畅捷通,对技术运营的要求主要是两个方面

第一,要懂技术,技术运营不创造技术,是技术的搬运工,要知道如何运用好云技术,避免踩坑,避免重复造轮子。另外,要学一些架构方面的知识和技能,运维要求对所负责领域精通,而技术运营要了解方方面面的知识,当然可能不用都特别深入。

第二,要会布道,很多的好技术要推广,要说服,让这些技术发挥出能量,创造出价值,这样才能正循环。

在具体工作中,运维转型技术运营要关注:

  • 运营的数字化。运营数字化聚焦在故障的生命周期,从故障的发现、定位到处置操作,要做到感知的泛在化、认知的智能化和操作的无人化,即 AIOps 的落地。

  • 能力的中台化。能力中台化是指在构建运维的平台,让可感知的网元,可编程的网元能力沉淀,运维能力显性化。

  • 运维的研发化。让运维人员进行研发,人创造机器,再由机器取代人来做维护,这个落地就是 OpsDev,基于显性化的运维能力,各个专业领域都要自治。

  • 组织的敏捷化。畅捷通打造了几大敏捷的组织,包括 GMC(全局监控)、SRE(应急保障)、BOE(业务准确性保障)以及 OPE(运维平台的开发)。这其中,SRE 是最重要的破局点,畅捷通组建了一个较大规模的 SRE 团队去开发和运维。

在实际工作中,技术运营要面临的另一个难题在于工作产出的衡量。运维更像灭火队,在问题出现的时候去解决,那么可以通过解决掉的问题来衡量工作价值,比如故障的发生率、应用的可用率。相比之下,技术运营需要发现隐患,在问题出现和爆发前就解决掉。熊昌伟建议,针对技术运营,可以通过发现的风险点数量、或者对于故障的定位解决速度的提升来考核其表现。

完成转型技术运营的标准是什么?

是否真正完成技术运营转型,主要看工作模式是否改变。不要简单重复三次同样的操作,必须时刻思考如何提炼出标准流程,固化到系统中。技术运营必须坚持“赋能”研发与业务,学习他们的工作模式,发现其中的不便与断层,做好胶水层,让各方业务流程通畅。最终,技术运营的精神思想与能力都能通过系统和平台交付出去。

特别提示

巨人不断倒下、新军加速崛起,一场黑天鹅只是催化剂,商业的本质正动态演进:突变,才是不变的定局。在这场发生于 VUCA 时代典型的商业征程里,大鹏学社应时而生。它由全球科技领袖者高端社区 TGO 鲲鹏会和长江商学院共同研发,专注于培养具备商业思维和未来视野的科技领袖。
16 位中国著名导师和企业家携 312 小时线下课程,帮助科技领袖在动态不确定的世界中探索确定性,引领企业开创属于自己的“新时代”。
(0)

相关推荐

  • 数字化潮起,传统零售如何借“云”升级?

    前言 2020年新冠疫情突袭和不断延伸对整个线下零售行业所产生的影响极为深刻.疫情与经济下行期叠加,在举国隔离的经济环境下,消费者需求和行为不得不从线下转移到线上.大量线下零售企业因流量下滑而入不敷出 ...

  • 招商银行App 9.0上线:当一个十岁的App谈「新基建」与「杀手锏」

    藏在1800个迭代需求点后的,是招行对这个数字化转型时代的回应. " 作者 | 周蕾 你打开银行App查看账单,有一笔钱付给了"北京三快在线科技有限公司",三秒钟之内,你 ...

  • 什么是 AIOps?

    在复杂的现代 IT 环境中,AIOps 利用人工智能简化 IT 运营管理并加速和自动完成问题解决过程. 什么是 AIOps? AIOps(即人工智能 IT 运营)是应用人工智能 (AI) 来改进 IT ...

  • 中软国际用一场自我进化,推动云市场跨入下一幕

    每一次技术革命,都意味着挑战与问题,也隐藏着金矿与机会. 蒸汽机和铁轨的发明推动了现代工业的崛起,上世纪八九十年代的信息化革命,提升了中国的数字化水平.云与智能的趋势下,中国数字产业首次到了全球创新前 ...

  • 2021年,十问云计算

    是时候揭开云计算的神秘面纱了. 刚刚过去的 2020 年是不平凡的一年,这一年,由于新冠疫情肆虐全球,云计算在这一年中展现出了巨大的优越性. 据 MariaDB 的一项调查显示,由于新冠疫情大流行,将 ...

  • 5G邂逅AI,一场发生在运营商体系内的智能化“浪漫”

    "新基建"体系的明确,又一次把5G和AI两种技术紧密摆在了一起. 几年以来,全球对5G的价值讨论不断增多,"5G改变社会"成为了街知巷闻的常识.在众多关于5G的 ...

  • 浅析企业信息化、数字化和智能化的内涵和联系

    写在前面近来,数字化.数字化转型已成为热门词汇,数字化转型也成为企业转型发展的标配,企业似乎都在研究开展或正在开展数字化转型,各类数字化转型方法论.白皮书等也大量涌现,如阿里云研究中心发布<新一 ...

  • 云计算环境系统自动化运维编程Bash Shell课程教程 flv格式支持手机观看

    云计算环境系统自动化运维编程Bash Shell课程教程 flv格式支持手机观看

  • linux云计算运维发展如何?linux运维工程师学习

    随着网络信息化的快速发展,Linux运维行业近年来发展非常迅速.越来越多的企业选择使用Linux系统,市场对Linux运维人才的需求越来越大.很多人看好Linux云计算运维的发展前景,也开始加入Lin ...

  • 云计算的特点包括哪几方面?linux系统运维

    云计算是一种按使用量付费的模式,这种模式提供可用的.便捷的.按需的网络访问,进入可配置的计算资源共享池(资源包括网络,服务器,存储,应用软件,服务),这些资源能够被快速提供,只需投入很少的管理工作,或 ...

  • 云计算和云服务是一样的吗?数据库自动化运维

    随着互联网技术的飞速发展,现在正逐步进入大数据.云计算.虚拟技术和人工智能时代,技术作为王者的现象越来越明显.目前,网站规模越来越大,结构越来越复杂,对Linux运维工程师的需求也越来越迫切,特别是对 ...

  • Linux云计算运维是什么?

    对于互联网公司来说Linux系统是非常常见的操作系统,在我们的生活中起到了非常重要的作用,但是对于没有任何基础或者根本不懂IT行业的人来说,都非常疑惑Linux系统到底是什么?为什么大家推荐我学习Li ...

  • 北京大学:桌面云解决图书馆运维“堵点”问题 | 云计算

    随着信息技术在图书馆的大规模应用,各类计算机及其外接设备如打印机.扫描仪.条码扫描枪等已经渗透到图书馆业务的各个环节当中.这些日益碎片化.场景化和智能化的计算机设备为图书馆的业务发展带来了日新月异的变 ...

  • 腾讯蓝鲸开源项目与云计算运维平台框架标准发布 – 运维派

    一.蓝鲸智云及云计算运维平台参考框架标准 云计算运维平台参考框架标准是基于腾讯的蓝鲸智云的开源项目总结归纳的,这个标准是一个全面的云计算运维平台系统的框架标准,规定了一个面向云计算运维环境的运维平台功 ...

  • Linux运维需要怎样的素质和技能?Linux云计算

    Linux运维需要怎样的素质和技能?Linux系统越来越受欢迎,越来越多的企业和个人开始使用Linux系统.运维工程师是具有良好发展前景的职业,并且越来越多的人开始学习.那么Linux运的必备技能是什 ...

  • Linux运维发展需要学什么?Linux云计算

    Linux运维发展需要学什么?随着时代不断进步和网络的快速发展,Linux运维技术越来越受企业及个人的欢迎.如今对专职网站运维工程师.网站架构师的要求会越来越迫切,尤其是对经验丰富的优秀运维人才. 云 ...