
华为推出了网络智能运维方案,一方面,可以实现各类运维数据的可视化;一方面,实现故障快速发现、定位以及恢复;另一方面,提供健康度全面评估、故
障预测等智能化能力,实现基于异常检测和风险预测的主动性防护,保障业务7x24小时在线。
为什么需要网络智能运维
当前各行各业的数字化转型已成为一种必然趋势。大数据、机器学习等软件技术的发展,加速了行业数字化转型的步伐,越来越多的业务和应用将被部署到云
端,企业使用和访问云的行为变得趋于日常。随着SDN(Software-Defined Networking,软件定义网络)时代、云计算时代的到来,计算和存储资源池化,
让企业的数字化转型变得更简单,但是却让网络变得越来越复杂,网络运维也面临着巨大的挑战:
· 业务难感知
当前网络运维主要还是面临单一的告警事件,但是由于现网的告警事件比较多,所以会针对告警做一些过滤,这样会导致缺乏网络级的完整评估能力。
尤其在SDN等新技术在网络大规模应用后,除了要维护Underlay物理网络外,还需要额外维护一张虚拟的Overlay网络,而面向告警的运维能力是没有办法
覆盖整个层面的内容。传统运维模式,运维人员往往扮演着事后“救火”的角色,需要事故发生后才处理。管理员无法对未来可能发生的故障进行动态预测,
掌握运维的主动权。
· 故障难定位
管理规模大:云计算场景下运维人员的管理对象从物理设备延伸到虚拟机,网元管理规模增加了几十倍;另一方面由于实时性分析的要求,设备指标的收集
粒度从分钟级提升到毫秒级,数据量增加了近千倍;更重要的是对于故障的主动感知和排障,除了收集分析网络设备指标外,还需要结合实际转发业务流进
行分析,数据规模则进一步扩大。
业务路径多:网络为了提供高可靠和高带宽,往往被设计成负载分担方式转发流量,此时会使节点间流量经由哈希算法选择路径,转发路径的可能性随网络
节点数幂级增加,管理员无法确定某业务流量究竟通过网络中什么样的路径转发,传统的定位手段时间长、严重依赖运维人员的个人经验。
· 故障恢复慢
网络的稳定运行关系着国家信息安全和社会稳定。为了防范灾难和风险,保障业务连续性,国内外监管部门颁布了一系列业务连续性及容灾的标准。对于金融
行业而言,若单机构单省中断半小时,那么定位为III级事故并上报银监会。对于大部分企业,业务中断会导致企业经济利益不同程度受损。这就要求遇到故障
首先要在最短时间内恢复业务。在金融业务场景集中式部署转向分布式部署,系统部署复杂,运维人员被动响应加长了故障定位周期,故障定位时间平均76min,
不能保障业务连续性。为了解决以上问题,实现对网络实现精确运维,使网络的管理水平和服务质量得到持续提升,华为推出了网络智能运维解决方案。
· 网络智能运维有哪些好处
健康度全面评估,实现业务、网络实时感知
网络健康度评估方案对整个网络进行系统化的网络级的评估检测,帮助运维人员“看网识网”,提升运维效率和业务体验质量。主要包括三大部分:
网络级的抽象建模:构建多层评估体系,定期收集网络的设备、协议、连接、业务等状态。
全面智能化的健康状态评估:针对每一个层面分别构建网络对象模型,与传统网管的差异是,会关联网络的日志数据、性能数据、网络设备配置数据、以及业
务主机交互的业务流等多个维度的数据。结合智能分析算法,智能化的评估网络每个层面的状态。还能够动态检测工作状态、网络容量等关键指标异常,主动
预测容量、流量风险。
界面化实时可视:通过多维度(包括图表等)的方式实时展示给客户,支持周期性生成网络健康度评估报告。便于用户网络部例行进行网络健康度检查,辅助
用户主动排障。故障根因快速定位,实现智能诊断当前网络规模大、配置复杂、变化量大,很难快速地进行故障定位和排查。并且定位手段时间长,严重依赖
运维人员的个人经验。
· 网络智能运维方案,可以实现故障根因快速定位:
通过随流检测技术iFIT,对质差类业务(业务未中断但主观感知体验差)进行端到端的逐跳检测。智能网络控制器逐跳收集检测信息,并根据收集的检测数据
精准定位故障点。结合用户现网的海量故障案例库和华为运维专家经验,根据不同的故障模式编排出用户可执行的排障任务链,从而缩短故障定位定界时长。
例如针对业务连通性类故障场景,自动编排出相应的排障步骤,支持用户一键式自动排障。通过采集设备的ERSPAN流、Telemetry性能Metrics进行大数据
分析,并结合AI算法,主动感知Fabric内可能存在的故障,智能分析识别是否存在网络或者应用的群体性故障。辅助用户逐步实现故障主动感知、分钟级故障
定位定界的主动智能运维目标。通过AI算法,也可对一些未知故障进行学习和故障推理,帮助运维人员深度探索未知故障的根因。
故障自闭环,业务运行“0”中断网络智能运维系统采用规则引擎、智能化引擎、知识图谱等技术进行大数据挖掘分析,实现对故障的快速发现和定位,并通
过与控制器的联动,可实现对故障的一