珠江數(shù)碼集團(tuán)是華南地區(qū)最大規(guī)模的廣播電視網(wǎng)絡(luò)運(yùn)營(yíng)商之一,已建成了覆蓋廣州各區(qū)的有線傳輸與無(wú)線傳輸互為延伸、互為補(bǔ)充的雙向廣電寬帶信息網(wǎng)絡(luò),提供有線數(shù)字電視、寬帶接入、高清互動(dòng)電視、移動(dòng)數(shù)字電視、信息內(nèi)容集成等多樣化、跨平臺(tái)的多媒體信息服務(wù)。
珠江數(shù)碼的IT日常運(yùn)維工作都是遵循傳統(tǒng)而保守的方式,核心業(yè)務(wù)系統(tǒng)(計(jì)費(fèi)系統(tǒng)、增值系統(tǒng)、容災(zāi)系統(tǒng)、排隊(duì)機(jī)系統(tǒng)、Boss系統(tǒng)等等)經(jīng)常出問題,也沒有有效的預(yù)警機(jī)制,無(wú)法快速定位根源,分析處理故障方面一直處于被動(dòng)、用戶投訴時(shí)才去處理的狀態(tài)。整個(gè)網(wǎng)絡(luò)流量一直沒有進(jìn)行監(jiān)控,用戶老是說(shuō)網(wǎng)絡(luò)慢,到底哪里出問題沒有一個(gè)數(shù)據(jù)分析結(jié)果去呈現(xiàn)給用戶方,網(wǎng)絡(luò)的配置一直都是采取人工備份,沒有統(tǒng)一、集中監(jiān)控的平臺(tái)等等……如果需要針對(duì)整個(gè)網(wǎng)絡(luò)規(guī)劃做調(diào)整,沒有有效的分析數(shù)據(jù)作為依據(jù),整個(gè)運(yùn)維過(guò)程是沒有相應(yīng)有效的報(bào)表數(shù)據(jù)記錄,導(dǎo)致無(wú)法很好規(guī)劃和調(diào)配整個(gè)IT運(yùn)維支撐中心的資源。
針對(duì)以上的需求,通過(guò)部署了卓豪綜合IT管理平臺(tái)(OpManager),并配合應(yīng)用性能管理(APM)、流量分析(NetFlow Analyzer)、網(wǎng)絡(luò)設(shè)備配置管理(NCM)以及存儲(chǔ)網(wǎng)絡(luò)管理(OpStor)模塊,幫助珠江數(shù)碼實(shí)現(xiàn)統(tǒng)一IT運(yùn)維管理。
1、針對(duì)網(wǎng)絡(luò)基礎(chǔ)架構(gòu)、業(yè)務(wù)系統(tǒng)的組成實(shí)現(xiàn)集中、統(tǒng)一的監(jiān)控管理(通過(guò)自定義首頁(yè)集中了解網(wǎng)絡(luò)基礎(chǔ)架構(gòu)、業(yè)務(wù)系統(tǒng)運(yùn)行的狀態(tài),告警的相關(guān)信息);
2、通過(guò)OpManager監(jiān)控整個(gè)網(wǎng)絡(luò)基礎(chǔ)架構(gòu),網(wǎng)絡(luò)核心設(shè)備的運(yùn)行狀態(tài),通過(guò)STP端口狀態(tài)的監(jiān)控,更深入的了解到整個(gè)網(wǎng)絡(luò)鏈路路徑選擇是否是最優(yōu)化,更好的掌握到網(wǎng)絡(luò)鏈路的狀態(tài),為日后的網(wǎng)絡(luò)建設(shè)規(guī)劃提供了有效的數(shù)據(jù)依據(jù)。
3、APM監(jiān)控集團(tuán)的業(yè)務(wù)系統(tǒng),能夠提供根源性分析與定位,有效的節(jié)省了運(yùn)營(yíng)支撐中心維護(hù)人員的排查時(shí)間,快速有效的解決故障,有效的預(yù)警機(jī)制,使故障在用戶投訴之前得到控制,提高了運(yùn)營(yíng)支撐部門的工作效率與服務(wù)質(zhì)量。
4、APM的自定義監(jiān)控功能,使業(yè)務(wù)系統(tǒng)的應(yīng)用層面實(shí)現(xiàn)更深層次的監(jiān)控,其自定義監(jiān)控功能有效的支持IBM小型主機(jī)的硬件故障報(bào)警、數(shù)據(jù)庫(kù)自定義需求監(jiān)控(如:RAC、指定會(huì)話數(shù)監(jiān)控、實(shí)例狀態(tài)監(jiān)控、數(shù)據(jù)庫(kù)進(jìn)程返回結(jié)果監(jiān)控等等)、華為語(yǔ)音系統(tǒng)硬件性能等等方面的監(jiān)控;而且,針對(duì)人力資源部門采用了金碟EAS系統(tǒng),擴(kuò)展地監(jiān)控了該系統(tǒng)的日志文件,也采取了主動(dòng)預(yù)警機(jī)制,用戶對(duì)監(jiān)控的顆粒度比較滿意,達(dá)到了他們預(yù)期的效果。
5、針對(duì)業(yè)務(wù)系統(tǒng)所依賴的存儲(chǔ)系統(tǒng)采用了OpStor進(jìn)行硬件性能的監(jiān)控,當(dāng)存儲(chǔ)的雙控制器/磁帶機(jī)的驅(qū)動(dòng)發(fā)生故障/切換,都能實(shí)時(shí)收到相應(yīng)的告警信息,快速有效的進(jìn)行處理。
6、通過(guò)NetFlow Analyzer能夠細(xì)致了解到整個(gè)集團(tuán)核心網(wǎng)絡(luò)防火墻出入口的流量使用情況,運(yùn)營(yíng)支撐中心維護(hù)人員能及時(shí)收到相關(guān)的流量報(bào)表數(shù)據(jù),為日后的網(wǎng)絡(luò)規(guī)劃提供了有力的數(shù)據(jù)依據(jù)。
7、NCM能夠?qū)崟r(shí)監(jiān)測(cè)到網(wǎng)絡(luò)設(shè)備配置的變化,當(dāng)設(shè)備的配置變更發(fā)生變更時(shí)用戶能第一時(shí)間收到配置變更內(nèi)容及修改的人員,新設(shè)備上線時(shí)能夠快速的下發(fā)相關(guān)的設(shè)備配置,提高了運(yùn)營(yíng)支撐中心維護(hù)人員的工作效率。
通過(guò)卓豪統(tǒng)一監(jiān)控管理平臺(tái),珠江數(shù)碼集團(tuán)能夠快速、有效地定位根源故障,讓整個(gè)運(yùn)維支撐中心維護(hù)人員工作效率得到有效的提升,服務(wù)質(zhì)量顯著提高,網(wǎng)絡(luò)資源得到充分有效的利用及優(yōu)化,設(shè)備的配置得到有效、規(guī)范化的管理,業(yè)務(wù)系統(tǒng)(BOSS系統(tǒng)、增值系統(tǒng)、人力資源系統(tǒng)等)持續(xù)可用性得到保障,數(shù)據(jù)庫(kù)的維護(hù)工作亦能提供有效的數(shù)據(jù)依據(jù),業(yè)務(wù)系統(tǒng)所依賴的存儲(chǔ)系統(tǒng)亦得到保障,當(dāng)出現(xiàn)故障時(shí)能夠提前預(yù)警,達(dá)到故障的有效控制及解決。
IT負(fù)責(zé)人表示:“卓豪統(tǒng)一集中監(jiān)控管理平臺(tái)能使我們不用再分散的逐個(gè)去關(guān)注整個(gè)基礎(chǔ)架構(gòu)的運(yùn)行狀態(tài),而是統(tǒng)一在一個(gè)頁(yè)面上看到整個(gè)架構(gòu)的運(yùn)行情況,一切盡在掌握!”。