韶关祷曰电子支付设备有限公司

您當(dāng)前的位置:首頁(yè) > 成功案例 > 大型企業(yè)

為傳統(tǒng)工業(yè)注入生機(jī)活力,智慧運(yùn)維在行動(dòng)

時(shí)間:2019-06-03

摘要:
當(dāng)傳統(tǒng)工業(yè)遇上現(xiàn)代技術(shù),如何平衡兩者之間的關(guān)系,使之和諧共進(jìn),煥發(fā)更強(qiáng)生機(jī)。
 關(guān)鍵字:智慧運(yùn)維,包頭鋼鐵

 包鋼.jpg

項(xiàng)目背景

包頭鋼鐵(集團(tuán))有限責(zé)任公司(以下簡(jiǎn)稱:包鋼)1954年開(kāi)始建設(shè),1959年投產(chǎn)。包鋼擁有“包鋼股份”和“包鋼稀土”兩個(gè)上市公司,是中國(guó)主要的鋼軌及無(wú)縫鋼管生產(chǎn)基地之一、華北地區(qū)主要的板材生產(chǎn)基地、是世界稀土工業(yè)的發(fā)端和稀土科研、生產(chǎn)基地。

隨著包頭鋼鐵(集團(tuán))有限責(zé)任公司信息化建設(shè)的深入,信息化運(yùn)維監(jiān)控管理在企業(yè)發(fā)展過(guò)程中擔(dān)負(fù)起越來(lái)越重要的角色,企業(yè)利潤(rùn)來(lái)源也越來(lái)越依賴于信息化的建設(shè)水平,而企業(yè)信息化的建設(shè)水平取決于兩個(gè)方面:

-      一方面是基礎(chǔ)設(shè)施的搭建,這是硬件基礎(chǔ)

-      另一方面是管理層面,就是如何將已有的硬件基礎(chǔ)設(shè)施的效能更好的發(fā)揮出來(lái),這就和運(yùn)維管理水平的高低息息相關(guān)。

如何及時(shí)了解系統(tǒng)的運(yùn)行狀況,有效地降低系統(tǒng)運(yùn)行的風(fēng)險(xiǎn),主動(dòng)的發(fā)現(xiàn)并及時(shí)解決系統(tǒng)運(yùn)行故障,讓業(yè)務(wù)系統(tǒng)保持7×24小時(shí)的健康、持續(xù)、穩(wěn)定、有效運(yùn)行,這些都給包鋼的信息化運(yùn)維管理水平提出了更高的要求,也是當(dāng)前傳統(tǒng)工業(yè)企業(yè)運(yùn)維管理普遍面臨的巨大挑戰(zhàn)。

運(yùn)維挑戰(zhàn)

管理設(shè)備類型和數(shù)量

  • 交換機(jī)主要為cisco和H3C交換機(jī),共計(jì)需要管理80臺(tái)
  • 操作系統(tǒng)主要有IBM AIX、CentOS、Windows等,共計(jì)需要管理35臺(tái)
  • 數(shù)據(jù)庫(kù)主要為IBM DB2、Oracle等,共計(jì)需要管理 25套
  • 中間件主要為websphere,需要管理10套
  • 應(yīng)用主要為HTTP,需要管理10套
  • 存儲(chǔ)設(shè)備主要為IBM、EMC,需要管理5臺(tái)

 

運(yùn)維管理需求        

網(wǎng)絡(luò)管理

支持cisco、H3C等廠商的各型號(hào)設(shè)備,支持多廠商設(shè)備組成的混合網(wǎng)絡(luò)自動(dòng)發(fā)現(xiàn),并且提供設(shè)備的真實(shí)面板,提供端口關(guān)閉與啟用操作,可以更改VLAN ID

拓?fù)鋱D的生成支持網(wǎng)絡(luò)設(shè)備的SNMP V1、V2、V3這三個(gè)版本的混和生成,并能對(duì)SNMP V3設(shè)備進(jìn)行管理

支持對(duì)全網(wǎng)的網(wǎng)絡(luò)設(shè)備線路按照流量、帶寬占用比、丟包率、錯(cuò)包率、廣播包等指標(biāo)的實(shí)時(shí)負(fù)載進(jìn)行排名

支持網(wǎng)絡(luò)設(shè)備的ARP表、MAC表、路由表等表格數(shù)據(jù)定期存儲(chǔ),差異自動(dòng)比對(duì),提供路由表歷史快照對(duì)比

提供任意IP類型對(duì)象的監(jiān)控,支持ping狀態(tài)、TCP端口狀態(tài)、URL跳轉(zhuǎn)方式實(shí)現(xiàn)該對(duì)象的基礎(chǔ)管理

拓?fù)鋱D上的設(shè)備和線路支持按照性能參數(shù)的不同區(qū)間以紅、黃、綠顏色進(jìn)行顯示,性能負(fù)載可自定義

在拓?fù)鋱D上可直接顯示線路峰值流量、廣播流量、組播流量信息

提供網(wǎng)絡(luò)設(shè)備可用率、線路連通率、網(wǎng)絡(luò)設(shè)備負(fù)載分析報(bào)表、線路負(fù)載分析報(bào)表、網(wǎng)絡(luò)告警統(tǒng)計(jì)報(bào)表等多套基于采集和管理數(shù)據(jù)生成的客觀統(tǒng)計(jì)報(bào)表

操作系統(tǒng)管理

支持對(duì)于Windows、IBM Aix、CentOS等類型操作系統(tǒng)的管理,支持對(duì)于CPU、內(nèi)存、進(jìn)程、日志、網(wǎng)絡(luò)流量、磁盤(pán)性能的監(jiān)控;支持對(duì)于CPU、內(nèi)存、進(jìn)程、日志、網(wǎng)絡(luò)流量、磁盤(pán)性能的監(jiān)控

支持對(duì)主機(jī)進(jìn)程列表的監(jiān)控,支持定期備份進(jìn)程表,支持進(jìn)程表比對(duì),進(jìn)程狀態(tài)告警

支持主機(jī)趨勢(shì)管理視圖,包括CPU、內(nèi)存、文件系統(tǒng),流量指標(biāo)的對(duì)比,磁盤(pán)容量可用時(shí)間的預(yù)測(cè)

支持波浪圖方式顯示所有主機(jī)的全局信息,以圖形化方式顯示主機(jī)的常用管理參數(shù)

支持系統(tǒng)拓?fù)鋱D,一張圖可以展現(xiàn)所有主機(jī)承載的數(shù)據(jù)庫(kù)、中間件和標(biāo)準(zhǔn)應(yīng)用之間的實(shí)時(shí)狀態(tài)監(jiān)控,為主機(jī)監(jiān)控提供全景視圖

提供主機(jī)可用率、主機(jī)性能報(bào)表、系統(tǒng)告警統(tǒng)計(jì)報(bào)表等多套基于采集和管理數(shù)據(jù)生成的客觀統(tǒng)計(jì)報(bào)表

數(shù)據(jù)庫(kù)管理

支持對(duì)Oracle、DB2等數(shù)據(jù)庫(kù)的各項(xiàng)運(yùn)行參數(shù)進(jìn)行監(jiān)控;支持對(duì)于各個(gè)數(shù)據(jù)庫(kù)實(shí)時(shí)運(yùn)行狀態(tài)的實(shí)時(shí)統(tǒng)計(jì),包含數(shù)據(jù)庫(kù)會(huì)話數(shù)、死鎖數(shù)實(shí)時(shí)排行,支持對(duì)表空間大小和會(huì)話數(shù)、緩存信息、鎖信息進(jìn)行重點(diǎn)監(jiān)管

支持在數(shù)據(jù)庫(kù)發(fā)生異常時(shí),進(jìn)行所在主機(jī)、數(shù)據(jù)庫(kù)關(guān)鍵指標(biāo)的數(shù)據(jù)快照,便于事后便捷分析

中間件管理

中間件管理支持對(duì)WebSphere 等中間件實(shí)時(shí)監(jiān)控;支持圖形化方式顯示應(yīng)用的承載主機(jī)狀態(tài)和應(yīng)用的基本性能信息,同時(shí)展示相關(guān)的運(yùn)維負(fù)責(zé)人和聯(lián)系方式

標(biāo)準(zhǔn)應(yīng)用管理

 支持HTTP、HTTPS等應(yīng)用的監(jiān)控;支持圖形化方式顯示應(yīng)用的承載主機(jī)狀態(tài)和應(yīng)用的基本性能信息,展示相關(guān)的運(yùn)維負(fù)責(zé)人和聯(lián)系方式

存儲(chǔ)管理

  • 支持存儲(chǔ)設(shè)備硬件管理,以統(tǒng)一的視圖展現(xiàn)被管的各個(gè)硬件子項(xiàng)的運(yùn)行詳情,清晰展現(xiàn)各個(gè)管理設(shè)備的各類型管理狀態(tài),并以顏色顯著標(biāo)示出現(xiàn)問(wèn)題的硬件類型;涉及到磁盤(pán)陣列的電源、電池、風(fēng)扇、溫度、磁盤(pán)、控制器等各個(gè)關(guān)鍵硬件信息
  • 支持存儲(chǔ)空間使用全局視角,當(dāng)前所有磁盤(pán)陣列設(shè)備已經(jīng)使用空間的統(tǒng)計(jì);當(dāng)前哪個(gè)設(shè)備已配置的數(shù)據(jù)池,有足夠的空間可以分給給業(yè)務(wù)主機(jī)使用,列出Pool已使用的排行;提供各個(gè)業(yè)務(wù)主機(jī)磁盤(pán)使用的增長(zhǎng)規(guī)律和使用預(yù)測(cè),便于事前做好擴(kuò)容規(guī)劃

解決方案

基于自動(dòng)化理念打造的核心平臺(tái)

BTSO以自動(dòng)學(xué)習(xí)、自動(dòng)分析、自動(dòng)運(yùn)維詮釋智能運(yùn)維的運(yùn)維方法。自動(dòng)學(xué)習(xí):實(shí)現(xiàn)用戶環(huán)境數(shù)據(jù)的學(xué)習(xí),結(jié)合內(nèi)置檢測(cè)指標(biāo)體系,建立具有用戶特征的常態(tài)健康標(biāo)準(zhǔn);自動(dòng)分析:實(shí)時(shí)監(jiān)控用戶各項(xiàng)運(yùn)維指標(biāo),結(jié)合指標(biāo)變化特征,通過(guò)諸如單指標(biāo)越界比例、多指標(biāo)組合判斷、歷史趨勢(shì)變化等方法自動(dòng)判斷數(shù)據(jù)異常情況,主動(dòng)提醒;自動(dòng)運(yùn)維:提供處置方案的提醒,用戶處置程序的調(diào)用等多種方案,實(shí)現(xiàn)異常問(wèn)題的及時(shí)處理和運(yùn)維。

系統(tǒng)智能化管理

傳統(tǒng)系統(tǒng)監(jiān)控的訪問(wèn)方式為告警,但是面對(duì)設(shè)備日趨完善,管理對(duì)象超過(guò)閾值的告警越來(lái)越少,如何實(shí)現(xiàn)信息化管理價(jià)值的提升呢?這是擺在信息化管理管理主管面前的重要課題。北塔公司結(jié)合用戶信息化管理實(shí)際情況,發(fā)現(xiàn)信息化管理價(jià)值提升的方式有如下方面:

  • 通過(guò)事前隱患智能分析,主動(dòng)排除,即時(shí)通知,將故障發(fā)生概率降低;
  • 對(duì)于部分故障實(shí)現(xiàn)自動(dòng)化分析和處置,縮短故障處置周期,避免損失擴(kuò)大化;
  • 落實(shí)每個(gè)信息化管理主管的對(duì)于自身企業(yè)的個(gè)性化管理要求;BTSO適時(shí)推出了智能信息化管理管理,為用戶落實(shí)如上3點(diǎn)訴求,提供管理功能。

智能運(yùn)維管理

BTSO核心管理方式就是智能化管理,智能化的理論基礎(chǔ)是北塔十幾年的信息化管理經(jīng)驗(yàn)和幾千家用戶的管理實(shí)踐,為把這些管理方案推送到用戶現(xiàn)場(chǎng),BTSO提供了智能信息化管理模板。

智維模板按照管理等級(jí),預(yù)置了不同管理對(duì)象的管理方案,方案包含如下技術(shù)點(diǎn):

  • 內(nèi)置監(jiān)測(cè)方案,包含采集指標(biāo)的多寡,具體指標(biāo)的采集周期、監(jiān)測(cè)閾值,便于對(duì)系統(tǒng)自行巡檢相關(guān)數(shù)據(jù);
  • 提供了預(yù)置告警規(guī)則給用戶進(jìn)行選擇,用戶可以根據(jù)業(yè)務(wù)管理實(shí)踐的不同啟用相應(yīng)的告警管理規(guī)則;
  • 提供常見(jiàn)管理報(bào)表,并生成高級(jí)別對(duì)象的管理報(bào)表。

通過(guò)上述智維模板,使軟件無(wú)需復(fù)雜配置,安裝就能對(duì)資源進(jìn)行基礎(chǔ)信息化管理。

實(shí)施效果

運(yùn)維智能分析

BTSO自動(dòng)對(duì)管理對(duì)象進(jìn)行數(shù)據(jù)收集,用戶進(jìn)行數(shù)據(jù)對(duì)比分析,系統(tǒng)也提供智維分析的周統(tǒng)計(jì),智能的挖掘系統(tǒng)的問(wèn)題隱患。

提供本周系統(tǒng)運(yùn)行概要信息

  • 目前管理的總數(shù)量
  • 本周運(yùn)維巡檢的次數(shù)
  • 本周執(zhí)行智能診斷的次數(shù)
  • 本周生成的報(bào)表數(shù)量

提供各個(gè)管理類型的運(yùn)維巡檢情況

本周運(yùn)行健康趨勢(shì)如何,如果問(wèn)題增多則需要關(guān)注

提供為什么問(wèn)題增多的具體表現(xiàn)

 - 包含本周巡檢問(wèn)題最多的指標(biāo),以及問(wèn)題最多的設(shè)備;

 - 包含本周巡檢問(wèn)題最多的設(shè)備,以及這個(gè)設(shè)備的問(wèn)題指標(biāo);      

提供各類重要類型的上周高低負(fù)載的數(shù)量;了解整體性能概況

提供在告警處置上的效能評(píng)估,告警數(shù)量的變化以及平均解決時(shí)長(zhǎng)的增長(zhǎng)

提供對(duì)于本周運(yùn)行數(shù)據(jù)的分析判斷,便于用戶定位問(wèn)題

- 提供線路吞吐量的環(huán)比變化,幫助用戶定位業(yè)務(wù)環(huán)比最大的線路

- 提供windows主機(jī)吞吐量的變化,幫助用戶定位業(yè)務(wù)環(huán)比最大的主機(jī)

- 提供主機(jī)磁盤(pán)增長(zhǎng)Top,列出各個(gè)分區(qū)的增長(zhǎng)情況,并預(yù)期可用時(shí)長(zhǎng),幫助用戶進(jìn)行定位需要調(diào)整控件的具體設(shè)備

圖1.jpg

 

智能管理

對(duì)于工程師日常監(jiān)控來(lái)說(shuō),故障管理是突發(fā)情況,而關(guān)鍵業(yè)務(wù)、指標(biāo)的監(jiān)控是常態(tài)管理要求,為了滿足工程師對(duì)于重點(diǎn)應(yīng)用質(zhì)保的監(jiān)控要求,系統(tǒng)提供了自定義首頁(yè)功能,該功能提供基于角色的個(gè)性展示功能,用戶可以自行選擇不同管理重點(diǎn)指標(biāo)以及展現(xiàn)方式,以便完成一圖完成所有重點(diǎn)監(jiān)控;

系統(tǒng)至少提供TOP表格、TOP柱狀圖、性能曲線圖、單值圖等多種展示方式;支持對(duì)于所有數(shù)值型數(shù)據(jù)的統(tǒng)一排序、歷史記錄展示;

結(jié)合日常管理需求?梢詫(shí)現(xiàn)諸如骨干線路監(jiān)控總圖、關(guān)鍵應(yīng)用監(jiān)控視圖的管理要素;

系統(tǒng)為展示要求提供數(shù)據(jù)支撐,能為自定義布局提供技術(shù)支撐,管理展現(xiàn)提供數(shù)據(jù)支撐。除了所以采集范圍內(nèi)的指標(biāo)外,也應(yīng)該支持通過(guò)sql、ssh、snmp等方式擴(kuò)展業(yè)務(wù)指標(biāo)的顯示;

系統(tǒng)應(yīng)該提供基于一個(gè)角色同時(shí)查看和配置多張視圖的能力,每張視圖可以新窗口打開(kāi),為用戶日常監(jiān)控展示提供便利性。

圖2-智能管理.jpg 

 

直觀明了的網(wǎng)絡(luò)管理

自動(dòng)根據(jù)北塔特有的拓?fù)渖伤惴ǎ焖偎阉髡麄(gè)網(wǎng)絡(luò)內(nèi)的網(wǎng)絡(luò)設(shè)備,智能分析網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),自動(dòng)勾畫(huà)出整個(gè)網(wǎng)絡(luò)的真實(shí)物理拓?fù)鋱D,真實(shí)反映整個(gè)網(wǎng)絡(luò)的構(gòu)成狀況。BTSO 除拓?fù)渖芍,還支持拓?fù)涮砑庸δ,在保留原有拓(fù)鋱D的基礎(chǔ)上,搜索新的網(wǎng)絡(luò)設(shè)備,并自動(dòng)添加到網(wǎng)絡(luò)拓?fù)鋱D上。

網(wǎng)絡(luò)拓?fù)鋱D可從全局的角度出發(fā),幫助信息化管理管理人員實(shí)時(shí)了解整個(gè)網(wǎng)絡(luò)當(dāng)前的運(yùn)行狀況,主動(dòng)告訴用戶關(guān)注點(diǎn)應(yīng)在哪里,網(wǎng)絡(luò)架構(gòu)是否合理,有無(wú)網(wǎng)絡(luò)瓶頸,設(shè)備和流量有無(wú)異常等,動(dòng)態(tài)告訴用戶可能的故障隱患,達(dá)到透明化、事前管理目的。

為了同時(shí)滿足不同用戶間的個(gè)性化需求,BTSO 提供了靈活的拓?fù)鋱D復(fù)制功能,可為不同用戶提供單獨(dú)的展現(xiàn)頁(yè)面。用戶可以根據(jù)自己的偏好設(shè)置自己的個(gè)性化拓?fù)鋱D,且不同的用戶之間沒(méi)有任何影響。

  • 可以通過(guò)紅、黃、綠等不同顏色表示網(wǎng)絡(luò)設(shè)備和線路負(fù)載壓力的評(píng)估狀況,并可以調(diào)整設(shè)備和線路的變色閾值;
  • 可以通過(guò)不同顏色的告警圖標(biāo),顯示各個(gè)網(wǎng)絡(luò)設(shè)備的告警觸發(fā)情況;
  • 可以為拓?fù)鋱D上的每臺(tái)設(shè)備、每條線路設(shè)置中文名稱,添加注釋,方便進(jìn)行管理。

提供背景圖的更換設(shè)置功能,可自由選擇精美的圖片作為拓?fù)鋱D的背景;

圖3、智能管理.jpg

 

直觀展現(xiàn)主機(jī)系統(tǒng)關(guān)聯(lián)關(guān)系的系統(tǒng)拓?fù)?/strong>

系統(tǒng)拓?fù)湟灾鳈C(jī)為核心,展現(xiàn)了所有承載的數(shù)據(jù)庫(kù)和中間件、標(biāo)準(zhǔn)應(yīng)用之間的實(shí)時(shí)狀態(tài)監(jiān)控,為主機(jī)監(jiān)控提供全景視圖;系統(tǒng)自動(dòng)生成并智能布局,無(wú)需人工調(diào)整

系統(tǒng)拓?fù)涮峁┣逦恼宫F(xiàn)方式:提供網(wǎng)段不同顏色表示方式,不同主機(jī)按照其操作類型圖標(biāo)顯示,從主機(jī)出發(fā)關(guān)聯(lián)數(shù)據(jù)庫(kù)與主機(jī)的關(guān)系。

  • 系統(tǒng)通過(guò)不同的顏色區(qū)分管理對(duì)象的實(shí)時(shí)性能層級(jí),BTSO 提供了主機(jī)經(jīng)典性能指標(biāo),并以紅、黃、 藍(lán)代表其主機(jī)實(shí)時(shí)性能;提供根據(jù)業(yè)務(wù)需要性能負(fù) 載調(diào)整設(shè)置功能;提供主機(jī)關(guān)鍵性能指標(biāo)的實(shí)時(shí)顯示
  • 系統(tǒng)以閃爍的圖標(biāo)反映,重點(diǎn)提醒用戶該資源發(fā)生了告警;同時(shí)以彈出框顯示告警的具體對(duì)象信息
  • 系統(tǒng)提供自定義拓?fù)浞绞剑赏ㄟ^(guò)對(duì)不同業(yè)務(wù)拓?fù)渲鳈C(jī)的自定義歸類,實(shí)現(xiàn)單獨(dú)業(yè)務(wù)的聚焦關(guān)注
  • 拓?fù)鋱D不僅反映單個(gè)設(shè)備的狀態(tài),同時(shí)提供關(guān)聯(lián)數(shù)據(jù)排行,為問(wèn)題定位增加信息參考
  • 提供以故障作為評(píng)價(jià)方式的綜合評(píng)分,整體了解系統(tǒng)的整體運(yùn)行健康情況
  • 提供主機(jī) CPU 實(shí)時(shí) TOPN 排行,分析主機(jī)性能最高的設(shè)備,便于用戶重點(diǎn)監(jiān)控
  • 提供主機(jī)連續(xù)運(yùn)行時(shí)間 TOPN,分析主機(jī)異常開(kāi)關(guān)系統(tǒng)的變化
  • 提供數(shù)據(jù)庫(kù)會(huì)話數(shù) TOPN,分析數(shù)據(jù)庫(kù)實(shí)時(shí)運(yùn)行狀態(tài)
  • 同時(shí)提供主機(jī)一體化顯示,按照不同的操作系統(tǒng)進(jìn)行數(shù)據(jù)分類,系統(tǒng)提供基礎(chǔ)信息、運(yùn)行信息、進(jìn)程管理、事件與告警、硬件信息等各類管理信息:

- 以關(guān)聯(lián)方式顯示主機(jī)上的承載數(shù)據(jù)庫(kù)、中間件、標(biāo)準(zhǔn)應(yīng)用的實(shí)時(shí)狀態(tài)

- 圖形化列出重點(diǎn)監(jiān)控的硬件、日志、CPU性能、磁盤(pán)信息的實(shí)時(shí)信息

- 對(duì)于CPU性能、網(wǎng)卡等重要參數(shù)的最近3天數(shù)據(jù)分析

- 支持主機(jī)進(jìn)程的實(shí)時(shí)展示分析

圖4.jpg

透明化、智能化、統(tǒng)一化的存儲(chǔ)管理

基于北塔的管理平臺(tái),以空間、硬件、性能 3 個(gè)方面為管理抓手,為用戶提供透明化、智能化、統(tǒng)一化管理,提高存儲(chǔ)運(yùn)維管理效率;系統(tǒng)支持磁盤(pán)陣列、 光纖交換機(jī)的管理,支持 SAN/NAS等各種部署方式。

硬件狀態(tài)管理作為基礎(chǔ)管理部分,以統(tǒng)一的視圖展現(xiàn)被管的各個(gè)硬件子項(xiàng)的運(yùn)行詳情,清晰展現(xiàn)各個(gè)管理設(shè)備的各類型管理狀態(tài),并以顏色顯著標(biāo)示出現(xiàn)問(wèn)題的硬件類型;涉及到磁盤(pán)陣列的電源、電池、風(fēng)扇、溫度、磁盤(pán)、控制器等各個(gè)關(guān)鍵硬件信息。

圖5.jpg

 

相關(guān)文章

產(chǎn)品中心
绥棱县| 东台市| 榆林市| 德惠市| 沧源| 泗阳县| 雷波县| 连平县| 开江县| 武隆县| 苏州市| 永胜县| 太仆寺旗| 甘泉县| 莱阳市| 西乌珠穆沁旗| 盐山县| 通河县| 广安市| 马龙县| 五峰| 德安县| 甘孜县| 通河县| 长乐市| 乾安县| 铁岭市| 乌拉特前旗| 修水县| 凤山市| 渝中区| 广南县| 鞍山市| 景宁| 沾化县| 云和县| 中山市| 南木林县| 长垣县| 贵州省| 平武县|