《曹云社》独家对话云智慧:新基建与智能运维的互利共赢
发布时间:2020-04-08 13:22:50 | 来源:北国网 | 作者: | 责任编辑:张青当全球人民转向远程办公、线上生活,IT系统的稳定性、可用性被企业提升至前所未有的高度,运维的重要性也随之凸显。
5G基建、特高压、城际高速铁路、新能源汽车充电桩、大数据中心IDC、人工智能、工业互联网七大领域新基建的提出令我们看到:未来一定是基于数字基础设施产生的数字化、智能化的世界。运维作为整个数字化、智能化的支撑技术,也将成为企业健康发展的最重要保障。
2020年4月2日,由中国软件网总裁、海比研究总裁曹开彬带来的全新直播对话栏目"曹云社"第二期邀请到了云智慧创始人兼CEO殷晋先生,围绕当下运维的挑战、云智慧的发展、运维行业发展等话题,共同探讨新基建给智能运维带来的那些机遇。
疫情下的运维行业
曹开彬:疫情期间大家都在线上进行交流、学习、工作,这导致了很多系统出现了崩溃、宕机,您怎么看这些跟云智慧产品和技术非常相关的一些现象?
殷晋:在我们看来宕机还是蛮常见的现象,不常见的是疫情期间我们看到了原来认为几乎不太可能宕机的服务提供商都发生了宕机,比如钉钉、企业微信、谷歌。
之所以发生这么大范围的事故,其实是疫情期间大家都把业务搬到网上,这对于线上系统,或者整个IT的负载都是非常巨大的,它很容易把特别小的故障放大成大问题,进而造成很大影响。
其实在日常看来这些小故障不会造成太大影响,只有当并发量和系统负载上升到一定程度才会导致大规模故障发生。这个事情就是运维的问题。因此我觉得未来讲新基建也好,数字化发展也好,其实会带来巨大挑战:随着业务越来越往线上迁移,任何运维方面的小问题可能都会变成一次宕机、故障,进而对业务造成影响。
曹开彬:如果从专业运维角度,殷总能不能跟各位总结一点,现在的运维跟过去10年间有什么差别呢?
殷晋:我觉得现在运维的挑战比十年前复杂了很多,除了云计算、容器化等这些方面技术的发展外,系统规模也越来越大,疫情期间的冲击是一个典型反映。以前,IT在很多企业里面就是一个记账的,说白了就是跑业务的,业务跑的结果记录到台账里面,当然台账会以各种各样的形式出现,例如办公系统、财务软件,或者现在的 SaaS等。这些系统在以前没有和业务融合到一起。过去几年我们看到最直接的变化就是IT和业务融合到一起了。
这样的话,做运维不能像10年前那样,只考虑设备、软件、资源等等这些方面的问题,还必须得从业务的视角,系统性的做运维。正是因为这样,过去十年我们看到运维的基础理论也发生了很大的变化。
曹开彬:就像刚才说的,疫情期间这些事情会引发很多产品,甚至思维方式的改进。在疫情期间很多公司推出了一些专门的解决方案、政策或者措施帮助客户度过疫情,云智慧有没有做类似的事情?
殷晋:当然要做,我们本身提供的SaaS服务,能帮助我们的用户,保障它的线上业务的可靠性和连续性。我们SaaS的用户也非常多,包括很多政府还有企业。所以针对疫情相关行业,我们推出了免费的可用性监测服务。
第二个是加强了对于客户服务的支持。我们想办法让技术人员能够实时的帮助客户,提供更加贴心的服务,保证疫情期间不见面但能更快的响应客户需求。
同样的,我们还帮助客户提供了一些类似于故障处置和恢复等方面服务,以保障在疫情期间他们的业务能够更加连续和稳定。
曹开彬:从现在来看,目前疫情期间客户的表现,客户对于我们的反馈是什么样的?
殷晋:客户对于我们还是蛮感谢的,甚至还有一些给我们专门发来表扬信。像我们有些客户属于卫健委系统,他们因防疫需要大量使用二维码,但经常发生扫码之后系统没有反应,影响防疫的情况,我们帮助客户解决了很多类似问题。
十年,从1.0版本到3.5版本
曹开彬:云智慧在运维领域做了10年,能不能总结一下运维市场大致的发展历程,这个某种程度上也是云智慧自身的发展历程。
殷晋:结合运维自身的发展来说,10年前我们最早做的第一个产品是监控宝,主要是通过全球分布式监控网络,保障网站的可访问性和连续性,是从系统的可靠性和连续性的角度去做。
随着互联网本身的发展,我们做到了用户体验的层面,就是我们的透视宝。透视宝的价值是能够帮助企业衡量每一个终端用户的真实体验,比如他用什么样的设备,通过移动端,还是网站访问业务,遇到了什么问题。这些问题也可以做更深入的追踪,比如追踪到系统的代码层、或某一个硬件层面。透视宝解决的是运维里面故障排查和追踪的问题,这个问题解决不好,会大大影响IT系统本身的管理和效能。
现在IT和业务融合在一起。运维也从资源监控、应用体验管理,发展到了业务运维,保证业务可持续性发展。
云智慧的发展过程也是经历了从提供最基础的运维监控工具到应用体验,再到现在和业务融合的智能业务运维管理平台。
曹开彬:现在很多的业务就是跟IT完全融合。您能不能讲讲业务运营人员和IT运维人员的工作界限在哪里?
殷晋:这是现在变化比较大的。以前这两个主体完全是分开的,今天我们看到这两者的边界正在模糊,但这中间还是有一条虚的边界。我们先说分别在哪儿。
例如,一个典型的数字化业务场景是:为拓展新客户,在公司里面有人专门负责广告该怎么投放、用户该怎么获取,怎样吸引他们到企业的各个触点平台。当用户抵达你的平台之后,无论从哪个渠道,他就开始和你的系统之间产生交付。从这刻开始,系统的运维就会变得非常重要。这个时候用户的体验就决定了业务的转化率,甚至决定了业务的收入,客户满意度,是否会持续复购。
在我们看来,跟用户、获客、转化相关的广告怎么投放,这些前端事务更多偏向运营,而当你的用户落地到平台上来以后的工作,就偏向于运维。
曹开彬:这是一个前后台的关系,前端是运营人员去做,后端是运维人员去做。
殷晋:可以这么理解,现在很多企业里面没有分的这么清楚,甚至是有了更多的创新。比如,我们看到有些企业会成立独立的部门,叫做数字化运营部,把这两类职能整合在一起。这个带来的业务连续性效果还是非常好的。
曹开彬:如果再往后走一走,会不会有越来越多的企业采用您刚才说的做法,叫做数字化运营部,将两者融合在一起?
殷晋:从未来来看两者的关系会越来越紧密,很有可能会在一个大的部门,这个部门有些叫做创新部门,有些叫做数字化运维部门,这个部门里面会把两类人放在一起,互相虽然有分工,但协作的程度会更高一些。
曹开彬:我也注意到云智慧前不久拿到了投资,且从成立到现在咱们拿到了多轮投资。您能不能从公司发展角度说一说云智慧公司本身10年来发展的历程?这与运维本身十年来的发展阶段是否相匹配?
殷晋:我是做技术出身,所以习惯用一个产品思路,或者是版本形式描述一个公司的发展。从这个角度讲,云智慧现在是已经过了3.0版本,到了往4.0版本去进发的阶段,当然我们还没有到正式4.0版本。
云智慧1.0阶段是在2010到2013年阶段,2013年拿到第一轮融资。2014到2015年是2.0的阶段。后面2016到2018年是3.0版本的阶段。
通常,我们看到一个软件迭代到3.0,意味着这个软件已经是比较好用了,在市场中间有比较强的竞争力,有很多客户愿意花钱来买,我们公司过去几年也是处在这个阶段。从2019年开始,云智慧应该是进入到3.0向4.0发展的中间阶段,我们不断地在迭代。
4.0的标志是这个公司有很强的竞争力,云智慧到今天还没有到4.0,相当于3.5左右的版本。我们差不多花了10年的时间,我希望再过1、2年,我们能够很自豪的说,云智慧到了4.0版。
曹开彬:这个发展的过程跟殷总自己的预期,或者跟资本的预期能够比较吻合吗?
殷晋:去年6月是云智慧成立第10年,我们可能比大多数公司在第10年的状态要好。我们自己和投资人对这个状态还是比较满意。当然,未来还是有很多挑战。虽然看起来我们到了3.5,但是3.5到4.0还会分无数个细小版本的迭代,需要很多解决的问题。对于我们团队而言,挑战还是蛮大的。
技术创新、服务交付、健康发展是智能运维厂商的核心
曹开彬:这两年运维这个市场变化特别大,也有很多友商在做类似的工作,从整个行业来看,你觉得运维有什么样的特点?
殷晋:首先从市场角度来看,中国的运维市场跟美国比有10年左右的差距。美国数字化在2004到2006年是启蒙时期,从2008年开始到了快速发展的时期。2016到2018年是中国数字化启蒙的时期。
总体来讲,运维在中国还是处于比较早期的阶段。在这个市场里,中国从事运维这个市场的厂商并不少。大家都在不断地迭代和探索,包括友商也好,包括云智慧自己也好,随着这个市场的成长而发展,都会越变越好。这是肯定的。
曹开彬:对于这些厂商能按照背景、出身或者不同特点分一下类吗?
殷晋:云智慧通常讲以客户为中心。我觉得从客户视角看,有三个维度去考察一个运维厂商。第一,你能够有很强的产品技术能力。第二,你有很强的服务交付能力,能够帮助他解决他的问题。第三,你这个公司还能够持续健康发展。现在市场上的很多厂商往往只具备其中一项或两项能力,真正具备这三项能力的公司,我觉得这个市场中不太多。
我觉得云智慧努力的目标是要把三者结合的很好。这样而言公司才能够突破天花板。
曹开彬:我观察到云智慧的产品布局是从基础设施的监控和运维到业务的运维。智能运维我觉得是另外一个维度。您怎么看智能运维?你们内部怎么来布这个局?
殷晋:智能运维很有意思,国内包括云智慧自己都是经过一段时间的探索。在我看来,智能运维更多是战略性的事情,它会落地到业务或者产品的方方面面。在应用层面,"智能"这个事情也是非常复杂。今天我们一个简单应用,把其流程画出来,至少都有三、四十步。每一步,都需要考虑是否和"智能"的结合。
云智慧是这个行业比较早认知到智能运维是企业战略层面能力的厂商。我们组建了独立团队去服务每个产品,每个产品里面AI也是单独的层,不是局部功能,它是我们最底层的核心能力之一。
曹开彬:您刚才说AI在云智慧产品当中是一层。这一层大概有什么东西能简单介绍一下吗?这一层是需要单独部署,还是跟我们其他的产品融合在一起?
殷晋:首先这一层是一个虚拟层,会跟我们每个产品都进行融合,融合到每个产品里面支撑具体的功能。
举个例子,像对设备的故障,或者应用生命周期的预测,这个就是AI的能力,这会落到设备或者基础设施运维的层面。同时,我们也会遇到预测收入这个层面的需求。例如,要预测收入和故障的关系,这个就变成业务层面的预测。
我们有一个数字化运营智能分析平台的中间层,它里面会提供很多数据的智能化处理,包括我们的算法、模型等基础能力,它会被每个产品调用,在具体的每个产品里面形成支撑某一个具体场景的功能。
曹开彬:云智慧做智能运维有什么特别策略吗?
殷晋:云智慧做智能运维有个18字真理——"以数据为基础、以场景为导向、以算法为支撑"。
我觉得所有的智能运维一定来源于非常好的数据基础,这个不具备的话没有办法做智能化。同时,如果没有明确的业务场景,或者需求,或者功能方面的落脚点,你的智能化就是为了AI而AI,是没有意义的。工程化算法是要拟合数据的,根据数据和前面的场景需求选择合适的算法,或者自己去设计算法。
只有具备上述3个条件,才能真正形成一个AI落地的智能运维。
曹开彬:智能运维的出现,导致现在业界经常在讨论运维人员的饭碗还能不能保住。您如何看待这个问题?
殷晋:现在业界两个方向应用"智能",一是NoOps,一是BetterOps。前者目的是消除运维,让一切自动化;后者目的是帮助运维人员更好地运维,但不是完全消除运维。在我们可预见的未来,在这么复杂的运维场景下完全去追求自动化,我认为是很难的,如果是20年之后,这个方向可能是对的。但是短期内消除运维的风险是巨大的。我们的思路是后者,目的是要保住运维人员的饭碗,让智能帮助他们更好地运维。
曹开彬:如果从这个视角,智能运维还有其他理念出现吗?
殷晋:当然还有一些。但我都不知道是什么理念,都是在喊口号。走的路线很奇怪,既不是往纯粹的自动化方向迭代,也不是往让人类的工作变得更好的方向迭代。可能是一些所谓中间路线。
曹开彬:从用户角度,我看到咱们的运维场景有两种类型的用户,一种是IT和互联网公司,例如做SaaS应用或者做云的。第二种是传统行业用户,比如金融行业、零售行业用户。云智慧的目标客户主要是传统行业吗?
殷晋:是的,我们公司的目标是把先进的互联网运维能力带给传统企业。数字化真正巨大的价值就是让传统企业实现一种高效率经营。这是我们追求的一个目标。
曹开彬:现在很多传统公司变成了互联网公司或软件公司,他们把不同业务往数字化方向走,这对于运维会是怎样的机遇?
殷晋:这个肯定是一个巨大的趋势。疫情某种方面是一个催化剂。疫情之后,原来还在犹豫是否上数字化的企业,现在没有什么好犹豫的,只能这么做。这个对于我们云智慧这类的公司来说是一个特别大的机会,当用户的业务和线上的联系越紧密,它就会越来越依赖运维。
曹开彬:传统企业数字化往往借助各种云服务。从运维视角来看,有些要在云端运维,有些要在本地运维,这个边界怎么界定?
殷晋:一般而言,公有云的IaaS厂商通常会提供基础保障,比如说服务器、内存这种资源层面的监控管理。但是企业的APP怎么样,我们的业务转化、应用、用户体验怎么样,这些事是基础运维工具不管的,这个时候就需要专业的厂商,例如云智慧,和公有云厂商合作,才能够帮助客户得到更好的IT支持。
云智慧希望跟我们的合作伙伴能够达到共生共赢的状态,一起为客户提供长期的服务,不断地增强帮助客户解决问题的能力。
新基建下的智能运维更光明
曹开彬:业界流行一个词叫做多云管理、CMP,MSP也是热点。云智慧是否也可以说是这方面的一分子,是否会推出CMP平台呢?
殷晋:多云管理更多从IaaS资源的协调管理、资源的高效利用角度出发的。我们立足帮客户直接解决系统应用过程中出现的问题。对于云智慧而言,我们还是专注,专注数字化运营和数字化运维这件事情。直到我们在全球能够排上号,我们才会考虑做更多的事情。
曹开彬:刚才您提到我们这次融资非常重要的目的是要提升我们的交付能力,同时继续打造生态。从现在来看,智能运维交付的难点主要在什么地方?
殷晋:中国现在面临的环境叫做三化叠加,信息化、数字化、智能化,同时还要加上一个云化。客户的部署环境很复杂,有些客户在公有云上,有些客户是混合云,有些客户完全是私有部署,自建数据中心。系统复杂度是最大的难点,这对我们的交付能力提出了很高的要求。有些客户还有定制化要求。因此,我们不仅希望自己做,更希望能够和合作伙伴一起去做交付。
曹开彬:云智慧的产品、解决方案的交付是怎样一个方式呢?
殷晋:从销售侧来说,我们肯定希望让产品触达到更多的客户。云智慧虽然现在差不多有400人,但是我们70%还是技术研发人员。所以我们希望有很多的销售伙伴来帮我们把这个产品带到客户面前。
第二个,客户侧我们面临的就是各种各样的客户交付需求。我们也是希望有很多服务交付伙伴能够为客户提供更直接的服务支持。
曹开彬:从发展伙伴的角度看,什么样的伙伴、渠道对于云智慧是比较适合的?
殷晋:这个分开看,如果是销售的话相对来讲比较简单,销售更多的是熟悉客户就很好。但如果是从更全面的角度来看,最好的伙伴有软件方面的经验。这样对于产品理解起来会更快一些,也能为客户提供更加专业的支持和服务。
曹开彬:我们每年都会做中国软件生态大会,我们现在叫做中国数字智能生态大会,会有伙伴会来关心一些新的产品,或者新的技术,您能不能说一些我们对于伙伴有没有什么特别的支持吗?
殷晋:让我们的合作伙伴通过跟云智慧的合作能赚到钱这个是我们的出发点,我们所有政策的出发点都是围绕这个来的。当然最核心的是让我们的客户通过双方的合作三方共同获益,而且是长期获益。
曹开彬:能不能结合新基建,谈谈您对未来运维发展趋势的判断呢?
殷晋:新基建我是从三个角度来看。第一个层面,数字化需要很好的能源或者能量的支撑,所以新基建有特高压和新能源充电桩。同样要能够让数字化的要素能够流动的更快,比如像城际高铁和轨道交通,让数字化里面的人或货在这个过程能够流转的更快,5G是让数字化要素信息流转的更快,数据中心是能够让数据流转留存。最上层是数字化的应用,包括人工智能、工业互联网都是为了让数字化的应用很快的构建起来,这些应用的价值能够充分的跟业务结合,充分的发挥。
这三个层面最终融合在一起就形成了企业非常复杂的数字化图景,这个系统一旦建起来就再也离不开运维了。这么复杂的东西融合在一起如果没有特别好的运维是搞不定的。但是,光靠运维的人肯定也搞不定,因为太复杂了。所以只能靠软件本身、靠智能化去运维这么复杂的数字化系统。我相信,在未来的数字中国,做智能运维前途非常光明。