C114通信網  |  通信人家園

技術
2019/12/30 17:23

智能運維 化繁為簡,助力聚焦5G業務

C114通信網  周建鋒

網絡功能,經歷了從各設備廠家物理機無統一標準的傳統設備(mips、x86、np)演進到物理設備基本統一x86服務器,上層應用虛擬化,繼續演進到云、云原生。短短十年間,4G演進到5G,5G在2020年走向成熟。

4G走向5G,電信設備從傳統設備演進到虛擬化、云化、時代,軟硬件架構都發生了翻天覆地的變化。電信業引入了很多IT的軟件架構、思維、方法等;開源、APP和基礎設施解耦等給電信應用帶來了很多好處、便利,同時也帶來了新的問題,其中對電信運維方式產生了較大的影響。

在2G/3G/4G傳統設備時,業務一旦出現問題,運維人員不需要太多區分是硬件故障還是軟件故障,設備本身先進行軟硬件一體的主備倒換,先恢復業務,再進行故障定位。

在當前云時代,基礎設施集中化,中心DC物理設備規模龐大(>1000),網絡功能分布式打散分布在不同的物理節點上,一旦出現故障,原有的軟硬件一體化主備倒換方式不再有效,需要更有效性自動化識別能力,識別故障根源是硬件原因、云平臺原因、還是上層VNF的原因,快速區別出故障的根本原因,才能快速對故障進行有效隔離和恢復。

實現自動化和智能化的網絡運維,是5G成熟關鍵技術。智能監控、故障分析等是自動化運維中關鍵技術。

一、智能監控

智能監控的目標是,軟件自動化發現系統運行異常,自動觸發下一步對異常的分析,從而定位出系統異常根源,快速修復故障。

實現智能監控有兩種方式:直接方式和間接方式。

直接方式:對環境、硬件(計算、存儲、網絡)、Cloud OS等關鍵設施進行指標監控,一旦出現異常數據,進行直接的故障告警、定位;

間接方式:對5G業務關鍵KPI進行監控和多維度的對比分析,通過分析發現KPI異常判斷故障是否發生,從而觸發故障進一步關聯分析定位。

多維度的對比分析可以從幾個方面進行。

歷史數據對比方式。歷史總是相似相近,歷史數據對比分析按天、周、月、年、節假日歷史數據綜合進行,通過AI算法預先給出下一階段(小時、天)KPI預測數據,再根據實時采集得到的數據,對比判斷系統是否異常;

同類對比方式。同類型的5G NF的同類KPI變化應該趨于一致,一旦出現較大(超過域值)波動,可以判斷系統異常;單一的NF內部,不同微服務的處理KPI同樣也應該趨同,如果不一致同樣也可以判斷系統異常。

二、故障分析

故障根源分析可以從兩個方面入手,告警、日志。在監控系統發現系統異常后,觸發縱向分層告警、分層日志關聯分析;橫向關聯NF內微服務間,NF-NF間進行關聯分析,定位故障根源。

1,縱向關聯

縱向關聯在垂直架構上,網絡構包括物理層、虛擬層、業務層三個層次,當底層出現故障時,將影響上層業務。如圖1:

圖1, 三層架構示意圖

縱向關聯解決的關鍵問題:底層硬件、虛擬層故障一旦發生時,上層業務KPI等指標會出現異常,垂直關聯把上層業務的異常和底層故障關聯起來,識別出根故障的根源是在哪個層次PIM層、VIM層還是VNF業務本身。

2,橫向關聯

在水平層次上,VNF內部的微服務間存在業務流程關聯,存在相互影響的關系,微服務間橫向關聯用作發現出問題根本原因的微服務,如圖2。

圖2,同一VNF內不同微服務集群示意圖

在VNF-VNF間業務流程在不同節點間流轉時,如果某個節點發生故障,也將影響到與其相關的其他節點,如圖3。比如:AMF、SMF、PCF、UDM等相互之間的關聯影響,是業務流程的不同節點。

圖3. 不同VNF互聯示意圖

綜上可知,橫向關聯能夠解決的關鍵問題在于,把一個網元的故障和另一個業務相關網元的故障關聯起來,把一個微服的故障和真正出問題的微服務關聯,在應用層這同一層次識別出真正出問題的微服務或組件。

3,常用技術

常用技術包括:數據采集、數據分類(清洗)、數據監控、數據關聯、定層定位等。

數據采集:業務告警、業務kpi、業務配置操作日志、網絡設備操作日志、存儲設備操作日志、虛擬設備操作日志、虛擬層平臺操作日志、虛擬層系統運行日志等;

數據分類:數據在清洗分類時主要有幾個標簽,如時間、位置、我影響誰(分類標簽)、誰影響我(分類標簽)。分類標簽有網絡、主機、存儲、配置;

數據監控:一般對上層KPI進行監控,KPI數據是統計數據,可以引入AI算法,對異常KPI進行判斷,一旦出現異常數據,判斷系統出現故障,觸發故障根源分析系統;

數據關聯:主要根據預置的模板進行,模板以標簽的形式進行關聯,其中位置、時間、我影響誰、誰影響我,是數據關聯主要依據;

定層定位:通過數據關聯,從上往下(業務、虛層、物理層)確定最終的關聯節點,水平關聯通過“分類標簽”最終找到故障起因的網元、微服務或組件。

自動化運維的關鍵技術,除了故障監控和故障根源分層關聯分析,故障自愈能力、全局透視、跨域全方位數據采集能力、全網網絡拓撲管理、一鍵自動化測試、一鍵自動化業務部署等,都是智能運維應具備的成熟商用能力。中興通訊智能運維方案,化繁為簡,降低5G云原生及服務化軟件架構帶來的系統維護復雜性,致力于聚焦5G業務本身,為客戶創造更大價值。

給作者點贊
0 VS 0
寫得不太好

免責聲明:本文僅代表作者個人觀點,與C114通信網無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。

熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯系我們 | 網站地圖 | 手機版

      Copyright©1999-2020 c114 All Rights Reserved | 滬ICP備12002291號

      C114 通信網 版權所有 舉報電話:021-54451141

      开心棋牌手机游戏安卓版 韩国股票指数 11选5万能8码4注包中 北京pk拾赚钱技巧 哪一家股票配资平台安全可靠 pk10挂机稳赢技巧 十一选五开奖结果云 湖北11选5一定牛 7乐彩彩票app 个人投资理财入门 机选20选5河北福彩