午夜毛片免费看,老师老少妇黄色网站,久久本道综合久久伊人,伊人黄片子

一種具有彈性體系架構(gòu)的集群管理監(jiān)控系統(tǒng)的構(gòu)建方法

文檔序號(hào):6556333閱讀:217來(lái)源:國(guó)知局
專利名稱:一種具有彈性體系架構(gòu)的集群管理監(jiān)控系統(tǒng)的構(gòu)建方法
技術(shù)領(lǐng)域
本發(fā)明屬于計(jì)算機(jī)領(lǐng)域,涉及集群管理監(jiān)控系統(tǒng),特別涉及一種具有彈性體系架構(gòu)的集群管理監(jiān)控系統(tǒng)的構(gòu)建方法。
背景技術(shù)
集群就是通過(guò)高性能網(wǎng)絡(luò)或局部網(wǎng)將一組計(jì)算機(jī)系統(tǒng)(節(jié)點(diǎn))互聯(lián),形成的具有單一系統(tǒng)映像的高性能、高可用、高可擴(kuò)展性、高性價(jià)比的多計(jì)算機(jī)系統(tǒng)。由于其相對(duì)于傳統(tǒng)的大型機(jī)的高可用性和低價(jià)格的優(yōu)勢(shì),用集群構(gòu)造超級(jí)計(jì)算機(jī)或超級(jí)服務(wù)器成為一種流行的趨勢(shì)。
近年來(lái),隨著技術(shù)的發(fā)展,集群的規(guī)模從過(guò)去的數(shù)個(gè)節(jié)點(diǎn)擴(kuò)充到數(shù)百個(gè)節(jié)點(diǎn)甚至數(shù)千個(gè)節(jié)點(diǎn),對(duì)集群系統(tǒng)的管理監(jiān)控也變得越來(lái)越復(fù)雜,集群管理監(jiān)控越來(lái)越成為一項(xiàng)具有挑戰(zhàn)性的工作。如何保持對(duì)軟件的更新、監(jiān)視硬件和軟件的運(yùn)行狀態(tài)以及對(duì)集群進(jìn)行定期的維護(hù)等都成為集群管理員費(fèi)時(shí)費(fèi)力的工作。集群管理監(jiān)控系統(tǒng)的出現(xiàn)大大解放了集群管理員的日常工作,使他們可以通過(guò)圖形界面方便地實(shí)現(xiàn)對(duì)整個(gè)集群的管理。集群管理監(jiān)控系統(tǒng)是集群系統(tǒng)軟件的一部分,處于系統(tǒng)軟件的最頂層,它對(duì)整個(gè)集群的軟、硬件起到管理的作用,為集群的系統(tǒng)管理員和最終用戶提供服務(wù)。集群系統(tǒng)的一個(gè)基本特點(diǎn)是“整個(gè)系統(tǒng)呈現(xiàn)給用戶的是單一系統(tǒng)的映像”,為實(shí)現(xiàn)這一目標(biāo),應(yīng)提供在單一控制臺(tái)上包括對(duì)集群的規(guī)劃、安裝、配置、監(jiān)控、日常維護(hù)、開機(jī)關(guān)機(jī)等系統(tǒng)管理全過(guò)程的控制支持。集群管理監(jiān)控系統(tǒng)應(yīng)提供一套多功能、易使用、可擴(kuò)展的實(shí)用化管理工具,幫助管理員監(jiān)控整個(gè)集群的工作狀態(tài),保證集群系統(tǒng)高效、穩(wěn)定地運(yùn)行。
基于B/S結(jié)構(gòu)的集群管理監(jiān)控系統(tǒng)已成為集群管理監(jiān)控系統(tǒng)的發(fā)展趨勢(shì),而目前多數(shù)B/S結(jié)構(gòu)的集群管理監(jiān)控系統(tǒng)的體系架構(gòu)分為四層,即WebServer、總管理節(jié)點(diǎn)、子管理節(jié)點(diǎn)和被管節(jié)點(diǎn)。命令從上到下依次轉(zhuǎn)發(fā),這種分層方式的缺點(diǎn)是任務(wù)轉(zhuǎn)發(fā)次數(shù)過(guò)多,任務(wù)下達(dá)到被管節(jié)點(diǎn)需要在網(wǎng)絡(luò)上進(jìn)行三次交互,通信效率不高,尤其是當(dāng)集群規(guī)模較小時(shí),子管理節(jié)點(diǎn)根本沒(méi)有存在的意義。這種體系架構(gòu)無(wú)法根據(jù)集群規(guī)模靈活改變,并且通信次數(shù)過(guò)多,增加了網(wǎng)絡(luò)負(fù)擔(dān),降低了任務(wù)執(zhí)行效率。

發(fā)明內(nèi)容
針對(duì)上述現(xiàn)有技術(shù)存在的缺陷和不足,本發(fā)明的目的在于,提供一種根據(jù)集群規(guī)模靈活改變體系架構(gòu)的集群管理監(jiān)控系統(tǒng)的構(gòu)建方法。
為了實(shí)現(xiàn)上述任務(wù),本發(fā)明采取如下的技術(shù)方案一種具有彈性體系架構(gòu)的集群管理監(jiān)控系統(tǒng)的構(gòu)建方法,其特征在于,體系架構(gòu)的構(gòu)建采用分層設(shè)計(jì),根據(jù)集群規(guī)模和管理節(jié)點(diǎn)、子管理節(jié)點(diǎn)和被管節(jié)點(diǎn)的角色劃分層數(shù),實(shí)現(xiàn)層級(jí)托管,對(duì)于小規(guī)模集群系統(tǒng)采用兩層體系架構(gòu),大規(guī)模集群系統(tǒng)則采用三層體系架構(gòu);體系架構(gòu)的改變通過(guò)一個(gè)配置文件即可快速實(shí)現(xiàn);任務(wù)按業(yè)務(wù)類型分類,劃分為管理、監(jiān)控和報(bào)警三種類型,不同業(yè)務(wù)類型對(duì)應(yīng)不同業(yè)務(wù)流程;任務(wù)的轉(zhuǎn)發(fā)和執(zhí)行采用多線程并發(fā)機(jī)制;采用B/S結(jié)構(gòu),客戶端通過(guò)瀏覽器遠(yuǎn)程管理監(jiān)控集群系統(tǒng)。
在本發(fā)明中,集群中的各節(jié)點(diǎn)(服務(wù)器)采用層級(jí)托管的方式進(jìn)行管理和監(jiān)控。當(dāng)集群規(guī)模較小時(shí),采用兩層體系架構(gòu),即管理層和被管理層,并將Web Server置于管理層,即通過(guò)Web Server直接將命令轉(zhuǎn)發(fā)給被管節(jié)點(diǎn),Web Server和被管節(jié)點(diǎn)之間不再需要一個(gè)單獨(dú)的管理節(jié)點(diǎn),這種架構(gòu)最大程度地減少了任務(wù)轉(zhuǎn)發(fā)次數(shù)(零轉(zhuǎn)發(fā)),降低了通信出錯(cuò)率,提高了通信效率;當(dāng)規(guī)模較大時(shí),采用三層體系架構(gòu),即管理層、子管理層和被管理層,分層托管,有效減少了直接與管理層交互的被管理節(jié)點(diǎn)數(shù)目,解決了管理節(jié)點(diǎn)的單點(diǎn)瓶頸問(wèn)題,提高了集群系統(tǒng)的可擴(kuò)展性。同時(shí),層與層之間的任務(wù)轉(zhuǎn)發(fā)采用多線程并發(fā)機(jī)制,大大提高了批量任務(wù)執(zhí)行時(shí)管理監(jiān)控系統(tǒng)的執(zhí)行效率,提高了系統(tǒng)可靠性。在本發(fā)明中,將所有任務(wù)按業(yè)務(wù)類型劃分(管理、監(jiān)控和報(bào)警),不同業(yè)務(wù)類型對(duì)應(yīng)不同業(yè)務(wù)流程,業(yè)務(wù)流程彼此獨(dú)立,模塊化結(jié)構(gòu)好,提高了管理監(jiān)控系統(tǒng)的可擴(kuò)展性和易維護(hù)性。


圖1為小規(guī)模集群管理監(jiān)控系統(tǒng)體系架構(gòu)及層間的交互流程圖。
圖2為大規(guī)模集群管理監(jiān)控系統(tǒng)體系架構(gòu)及層間的交互流程圖。
以下結(jié)合附圖和發(fā)明人給出的實(shí)施例對(duì)本發(fā)明進(jìn)行進(jìn)一步的詳細(xì)說(shuō)明。
具體實(shí)施例方式
在本發(fā)明的根據(jù)集群規(guī)模靈活改變體系架構(gòu)的集群管理監(jiān)控系統(tǒng)構(gòu)建方法中,集群管理監(jiān)控系統(tǒng)的構(gòu)建采用分層設(shè)計(jì),按集群規(guī)模和節(jié)點(diǎn)角色劃分層數(shù)。當(dāng)集群規(guī)模較小時(shí)采用兩層體系架構(gòu),把Web Server作為管理層,不再需要一個(gè)單獨(dú)的管理節(jié)點(diǎn),而是由Web Server直接向各節(jié)點(diǎn)派發(fā)命令,這種體系架構(gòu)最大程度地減少了任務(wù)轉(zhuǎn)發(fā)次數(shù)(零轉(zhuǎn)發(fā)),降低了通信出錯(cuò)率,提高了通信效率。當(dāng)集群規(guī)模較大時(shí)采用三層架構(gòu),實(shí)現(xiàn)了層級(jí)托管,即Web Server(管理節(jié)點(diǎn))轉(zhuǎn)發(fā)任務(wù)給其下屬的各子管理節(jié)點(diǎn),各子管理節(jié)點(diǎn)再將任務(wù)派發(fā)給其轄域內(nèi)的各被管節(jié)點(diǎn),這種層級(jí)托管機(jī)制,有效減少了直接與管理節(jié)點(diǎn)交互的節(jié)點(diǎn)數(shù)目,解決了管理節(jié)點(diǎn)的單點(diǎn)瓶頸問(wèn)題,提高了通信效率,同時(shí)還大大提高了集群系統(tǒng)規(guī)模的可擴(kuò)展性。
在本發(fā)明中,系統(tǒng)能夠根據(jù)集群規(guī)模靈活改變體系架構(gòu),同時(shí)確保命令在網(wǎng)絡(luò)上的轉(zhuǎn)發(fā)次數(shù)最少,極大地提高了任務(wù)執(zhí)行效率。
本發(fā)明如附圖1所示,其中,帶箭頭的虛線表示管理業(yè)務(wù)流程、帶箭頭的點(diǎn)劃線表示監(jiān)控業(yè)務(wù)流程、帶箭頭的實(shí)線表示報(bào)警業(yè)務(wù)流程、單向箭頭表示層間單向交互,雙向箭頭表示層間雙向交互。小規(guī)模集群管理監(jiān)控系統(tǒng)采用兩層體系架構(gòu),即管理層和被管理層。管理層包括三個(gè)模塊Web Server、MonitorAgent和AlarmAgent,而被管理層僅包括一個(gè)接收和執(zhí)行命令的模塊。兩層之間按業(yè)務(wù)類型的不同采用不同的交互流程。其中,管理流程為(圖中帶箭頭的虛線所示)Web Server直接將管理命令派發(fā)到各被管節(jié)點(diǎn),WebServer和被管節(jié)點(diǎn)之間無(wú)須再通過(guò)一個(gè)管理節(jié)點(diǎn)轉(zhuǎn)發(fā)命令,被管節(jié)點(diǎn)執(zhí)行命令后返回結(jié)果給Web Server,這種設(shè)計(jì)最大程度地減少了管理命令的轉(zhuǎn)發(fā)次數(shù)(零轉(zhuǎn)發(fā)),提高了通信效率;監(jiān)控流程為(圖中帶箭頭的點(diǎn)劃線所示)MonitorAgent模塊按一定時(shí)間間隔(用戶可自由設(shè)定)定期收取各被管節(jié)點(diǎn)的性能和健康(服務(wù)器各部件的溫度、電壓和風(fēng)扇轉(zhuǎn)速等)信息,再將這些信息寫入數(shù)據(jù)庫(kù)(便于對(duì)歷史數(shù)據(jù)進(jìn)行再現(xiàn)和分析),管理節(jié)點(diǎn)的WebServer模塊負(fù)責(zé)從數(shù)據(jù)庫(kù)中按用戶需求提取相應(yīng)的監(jiān)控?cái)?shù)據(jù),并以動(dòng)態(tài)圖形界面的形式呈現(xiàn)給用戶;報(bào)警流程為(圖中帶箭頭的實(shí)線所示)每個(gè)被管節(jié)點(diǎn)定期監(jiān)控自身的性能和健康信息,若發(fā)現(xiàn)性能超標(biāo)或節(jié)點(diǎn)不健康則主動(dòng)向管理節(jié)點(diǎn)匯報(bào),管理節(jié)點(diǎn)的AlarmAgent模塊收到報(bào)警信息后,將立刻啟動(dòng)報(bào)警機(jī)制,在本發(fā)明中,實(shí)現(xiàn)了瀏覽器界面報(bào)警、email報(bào)警和撥號(hào)報(bào)警三種報(bào)警方式。此外,AlarmAgent執(zhí)行完報(bào)警處理事務(wù)后,還要將報(bào)警信息寫入數(shù)據(jù)庫(kù)中,便于用戶查看報(bào)警歷史信息并進(jìn)行數(shù)據(jù)分析。
如附圖2所示,其中,帶箭頭的虛線表示管理業(yè)務(wù)流程、帶箭頭的點(diǎn)劃線表示監(jiān)控業(yè)務(wù)流程、帶箭頭的實(shí)線表示報(bào)警業(yè)務(wù)流程、單向箭頭表示層間單向交互,雙向箭頭表示層間雙向交互。大規(guī)模集群管理監(jiān)控系統(tǒng)采用三層體系架構(gòu),即管理層、子管理層和被管理層。管理層包括兩個(gè)模塊WebServer和Alarm Agent,子管理層包括一個(gè)命令轉(zhuǎn)發(fā)模塊,被管理層包括一個(gè)命令執(zhí)行模塊。需要特別說(shuō)明的是,在本發(fā)明中,子管理節(jié)點(diǎn)本身也是一個(gè)被管節(jié)點(diǎn),它可以被它自己或其它子管理節(jié)點(diǎn)管理,否則,它將游離于整個(gè)集群管理監(jiān)控系統(tǒng)之外。在大規(guī)模集群管理監(jiān)控系統(tǒng)架構(gòu)中,三層間的通信按業(yè)務(wù)類型采用不同的交互流程。其中,管理流程為(圖中帶箭頭的虛線所示)Web Server將命令派發(fā)給子管理節(jié)點(diǎn),子管理節(jié)點(diǎn)再將命令轉(zhuǎn)發(fā)給被管理節(jié)點(diǎn),命令執(zhí)行完成后沿原路返回執(zhí)行結(jié)果;監(jiān)控流程為(圖中帶箭頭的點(diǎn)劃線所示)各子管理節(jié)點(diǎn)負(fù)責(zé)定期收取其所轄范圍內(nèi)的被管節(jié)點(diǎn)的監(jiān)控信息,并將這些信息寫入數(shù)據(jù)庫(kù)(便于日后進(jìn)行歷史數(shù)據(jù)再現(xiàn)和分析),管理節(jié)點(diǎn)的Web Server模塊負(fù)責(zé)從數(shù)據(jù)庫(kù)中按用戶需求提取相應(yīng)的監(jiān)控?cái)?shù)據(jù),并以動(dòng)態(tài)圖形界面的形式呈現(xiàn)給用戶;報(bào)警流程(圖中帶箭頭的實(shí)線所示)為管理節(jié)點(diǎn)的AlarmAgent模塊負(fù)責(zé)所有子管理節(jié)點(diǎn)和被管節(jié)點(diǎn)的報(bào)警業(yè)務(wù),具體的業(yè)務(wù)流程與小規(guī)模集群下的報(bào)警業(yè)務(wù)流程類似,不再贅述。通過(guò)流程分析可以看到,大規(guī)模集群系統(tǒng)下的這種層級(jí)托管機(jī)制,有效減少了直接與管理節(jié)點(diǎn)交互的被管節(jié)點(diǎn)的個(gè)數(shù),解決了管理節(jié)點(diǎn)的單點(diǎn)瓶頸問(wèn)題,提高了通信效率,同時(shí)還大大提高了集群系統(tǒng)規(guī)模的可擴(kuò)展性。
在本發(fā)明中,用戶只需要通過(guò)填寫一個(gè)簡(jiǎn)單的配置文件,即可實(shí)現(xiàn)上述功能。以下為發(fā)明人給出的一種具體實(shí)施例用戶填寫配置文件,配置文件內(nèi)容包括三項(xiàng)節(jié)點(diǎn)名、節(jié)點(diǎn)IP和節(jié)點(diǎn)角色。
啟動(dòng)Web Server和各節(jié)點(diǎn)的Agent。
Web server啟動(dòng)后,管理節(jié)點(diǎn)將自動(dòng)讀取配置文件信息并將此信息寫入數(shù)據(jù)庫(kù)的NodeInfo表(反映節(jié)點(diǎn)信息的表,包括節(jié)點(diǎn)名、節(jié)點(diǎn)IP和節(jié)點(diǎn)ID)和NMInfo表(反映節(jié)點(diǎn)角色及節(jié)點(diǎn)隸屬關(guān)系,包括節(jié)點(diǎn)ID及其子管理節(jié)點(diǎn)ID)。同時(shí),一個(gè)負(fù)責(zé)記錄整個(gè)集群拓?fù)浣Y(jié)構(gòu)的類將讀取這兩個(gè)表中的信息并構(gòu)建系統(tǒng)拓?fù)浣Y(jié)構(gòu)對(duì)象topology,并將此對(duì)象加載到內(nèi)存中。當(dāng)用戶執(zhí)行管理命令時(shí),系統(tǒng)首先根據(jù)topology對(duì)象判斷用戶所選擇的一系列節(jié)點(diǎn)分別隸屬于哪些子管理節(jié)點(diǎn),再將命令同時(shí)派發(fā)給這些子管理節(jié)點(diǎn),通過(guò)子管理節(jié)點(diǎn)轉(zhuǎn)發(fā)管理命令到被管節(jié)點(diǎn)上,被管節(jié)點(diǎn)收到命令后執(zhí)行,執(zhí)行結(jié)果將按原路返回給Web Server。若用戶所選擇的某些節(jié)點(diǎn)沒(méi)有子管理節(jié)點(diǎn),則web server將直接發(fā)送管理命令給這些節(jié)點(diǎn),節(jié)點(diǎn)執(zhí)行完成后將結(jié)果返回給Web Server,此時(shí)管理監(jiān)控系統(tǒng)架構(gòu)在局部范圍內(nèi)演變?yōu)樾∫?guī)模系統(tǒng)的兩層架構(gòu)。
各層在轉(zhuǎn)發(fā)命令時(shí),采用了多線程并發(fā)機(jī)制,具體實(shí)現(xiàn)是構(gòu)建一個(gè)線程池,線程池為每一個(gè)任務(wù)分配一個(gè)獨(dú)立的線程,各線程彼此獨(dú)立,該機(jī)制保障了批量任務(wù)執(zhí)行時(shí)管理監(jiān)控系統(tǒng)的執(zhí)行效率。此外,在本發(fā)明中所構(gòu)建的線程池是一個(gè)自適應(yīng)大小的線程池,它可以根據(jù)任務(wù)量的大小自行創(chuàng)建或殺死池中的線程,實(shí)現(xiàn)按需構(gòu)建,從而確保任務(wù)執(zhí)行效率和資源的最低使用。
管理節(jié)點(diǎn)或子管理節(jié)點(diǎn)Agent啟動(dòng)后,將從數(shù)據(jù)庫(kù)讀取其所管轄節(jié)點(diǎn)的ID列表,并加載所有監(jiān)控方法到內(nèi)存中,此時(shí),系統(tǒng)將創(chuàng)建一個(gè)“任務(wù)規(guī)劃線程池”,該池具有兩個(gè)特點(diǎn)根據(jù)任務(wù)量自適應(yīng)池中線程數(shù)目;周期性執(zhí)行所計(jì)劃的任務(wù)。通過(guò)該池實(shí)現(xiàn)了高效、低資源利用率地執(zhí)行監(jiān)控業(yè)務(wù),即通過(guò)該池按一定周期定期監(jiān)控各節(jié)點(diǎn)性能和健康信息。此外,在本發(fā)明中,為每一個(gè)節(jié)點(diǎn)的每一個(gè)監(jiān)控方法在池中分配一個(gè)獨(dú)立的線程,各線程獨(dú)立運(yùn)行,這種設(shè)計(jì)避免了由于某一個(gè)監(jiān)控信息獲取失敗而導(dǎo)致其它信息無(wú)法獲取的問(wèn)題。各監(jiān)控方法通過(guò)面向?qū)ο蟮耐ㄐ艆f(xié)議RMI遠(yuǎn)程獲取被管節(jié)點(diǎn)的監(jiān)控信息并將信息寫入數(shù)據(jù)庫(kù)。需要特別說(shuō)明的是,在本發(fā)明中,周期性執(zhí)行各監(jiān)控業(yè)務(wù)是指前一次任務(wù)必須執(zhí)行完成(無(wú)論成功或失敗)后間隔一定周期才執(zhí)行下一次任務(wù),而不是基于時(shí)間間隔的周期性執(zhí)行(即無(wú)論前一次的任務(wù)完成與否,按時(shí)間間隔定期執(zhí)行任務(wù)),基于時(shí)間間隔的這種執(zhí)行方式容易導(dǎo)致大量任務(wù)的阻塞。
被管節(jié)點(diǎn)的Agent啟動(dòng)后,將啟動(dòng)報(bào)警守護(hù)進(jìn)程,按一定時(shí)間間隔周期性監(jiān)控本節(jié)點(diǎn)的性能和健康信息,若發(fā)現(xiàn)問(wèn)題將主動(dòng)向管理節(jié)點(diǎn)匯報(bào)。管理節(jié)點(diǎn)收到報(bào)警信息后,將立刻執(zhí)行報(bào)警事務(wù)處理業(yè)務(wù),并將報(bào)警信息寫入數(shù)據(jù)庫(kù)。此外,被管節(jié)點(diǎn)Agent還負(fù)責(zé)接受并執(zhí)行來(lái)自管理節(jié)點(diǎn)或子管理節(jié)點(diǎn)的命令。
通過(guò)上述實(shí)施例可以看出,本發(fā)明的具有彈性體系架構(gòu)的集群管理監(jiān)控系統(tǒng)的構(gòu)建方法,能夠根據(jù)集群規(guī)模靈活改變管理監(jiān)控系統(tǒng)的體系架構(gòu)。當(dāng)集群規(guī)模較小時(shí)采用兩層架構(gòu),最大程度減少了任務(wù)轉(zhuǎn)發(fā)次數(shù)(零轉(zhuǎn)發(fā)),提高了通信效率。當(dāng)規(guī)模較大時(shí)采用三層架構(gòu),有效減少了直接與管理節(jié)點(diǎn)交互的節(jié)點(diǎn)個(gè)數(shù),解決了管理節(jié)點(diǎn)的單點(diǎn)瓶頸問(wèn)題,提高了集群規(guī)模的可擴(kuò)展性。體系架構(gòu)的改變通過(guò)一個(gè)配置文件即可快速實(shí)現(xiàn)。按業(yè)務(wù)類型(管理、監(jiān)控和報(bào)警)劃分任務(wù),不同業(yè)務(wù)類型對(duì)應(yīng)不同的業(yè)務(wù)流程,各流程彼此獨(dú)立,模塊化結(jié)構(gòu)較好,提高了管理監(jiān)控系統(tǒng)的可擴(kuò)展性和易維護(hù)性。引入多線程并發(fā)機(jī)制,大大提高了批量任務(wù)執(zhí)行時(shí)管理監(jiān)控系統(tǒng)的執(zhí)行效率。此外,系統(tǒng)采用B/S結(jié)構(gòu),用戶通過(guò)web瀏覽器即可方便地對(duì)集群系統(tǒng)進(jìn)行遠(yuǎn)程管理監(jiān)控。
權(quán)利要求
1.一種具有彈性體系架構(gòu)的集群管理監(jiān)控系統(tǒng)的構(gòu)建方法,其特征在于,體系架構(gòu)的構(gòu)建采用分層設(shè)計(jì),根據(jù)集群規(guī)模和管理節(jié)點(diǎn)、子管理節(jié)點(diǎn)和被管節(jié)點(diǎn)的角色劃分層數(shù),實(shí)現(xiàn)層級(jí)托管,對(duì)于小規(guī)模集群系統(tǒng)采用兩層體系架構(gòu),大規(guī)模集群系統(tǒng)采用三層體系架構(gòu);體系架構(gòu)的改變通過(guò)一個(gè)配置文件即可快速實(shí)現(xiàn);任務(wù)按業(yè)務(wù)類型分類,劃分為管理、監(jiān)控和報(bào)警三種類型,不同業(yè)務(wù)類型對(duì)應(yīng)不同業(yè)務(wù)流程;任務(wù)的轉(zhuǎn)發(fā)和執(zhí)行采用多線程并發(fā)機(jī)制;采用B/S結(jié)構(gòu),客戶端通過(guò)瀏覽器遠(yuǎn)程管理監(jiān)控集群系統(tǒng)。
2.如權(quán)利要求1所述的方法,其特征在于,所述的小規(guī)模集群系統(tǒng)的兩層體系架構(gòu)劃分為管理層和被管理層兩層;大規(guī)模集群系統(tǒng)的三層體系架構(gòu)劃分為管理層、子管理層和被管理層。
3.如權(quán)利要求2所述的方法,其特征在于,所述的兩層體系架構(gòu)的管理層有Web Server、MonitorAgent和AlarmAgent三個(gè)模塊;被管理層僅有一個(gè)接收和執(zhí)行命令的模塊,兩層之間按業(yè)務(wù)類型的不同采用不同的交互流程;其管理流程為Web Server直接將管理命令派發(fā)到各被管節(jié)點(diǎn),WebServer和被管節(jié)點(diǎn)之間無(wú)須再通過(guò)一個(gè)管理節(jié)點(diǎn)轉(zhuǎn)發(fā)命令,被管節(jié)點(diǎn)執(zhí)行命令后返回結(jié)果給Web Server;監(jiān)控流程為MonitorAgent模塊按用戶自定義的時(shí)間間隔定期收取各被管節(jié)點(diǎn)的性能和健康信息,再將這些信息寫入數(shù)據(jù)庫(kù),用戶通過(guò)WebServer從數(shù)據(jù)庫(kù)中獲取監(jiān)控信息;報(bào)警流程為每個(gè)被管節(jié)點(diǎn)定期監(jiān)控自身的性能和健康信息,若發(fā)現(xiàn)性能超標(biāo)或節(jié)點(diǎn)不健康則主動(dòng)向管理節(jié)點(diǎn)匯報(bào),管理節(jié)點(diǎn)的AlarmAgent模塊收到報(bào)警信息后,將立刻啟動(dòng)報(bào)警機(jī)制,此外,AlarmAgent執(zhí)行完報(bào)警處理事務(wù)后,還要將報(bào)警信息寫入數(shù)據(jù)庫(kù)中,便于用戶查看報(bào)警歷史信息并進(jìn)行數(shù)據(jù)分析。
4.如權(quán)利要求2所述的方法,其特征在于,所述的三層體系架構(gòu)的管理層包括Web Server和Alarm Agent兩個(gè)模塊,子管理層包括一個(gè)命令轉(zhuǎn)發(fā)模塊,被管理層包括一個(gè)命令執(zhí)行模塊;子管理層中的各子管理節(jié)點(diǎn)本身也是被管節(jié)點(diǎn),它可以被它自己或其它子管理節(jié)點(diǎn)管理,否則,它將游離于整個(gè)集群管理監(jiān)控系統(tǒng)之外;三層之間按業(yè)務(wù)類型采用不同的交互流程,其各業(yè)務(wù)流程之間彼此相互獨(dú)立;其管理流程為Web Server將命令派發(fā)給子管理節(jié)點(diǎn),子管理節(jié)點(diǎn)再將命令轉(zhuǎn)發(fā)給被管理節(jié)點(diǎn),命令執(zhí)行完成后沿原路返回執(zhí)行結(jié)果;監(jiān)控流程為各子管理節(jié)點(diǎn)定期收取其所轄范圍內(nèi)的被管節(jié)點(diǎn)的監(jiān)控信息,并將這些信息寫入數(shù)據(jù)庫(kù);報(bào)警流程為管理節(jié)點(diǎn)的AlarmAgent模塊負(fù)責(zé)所有子管理節(jié)點(diǎn)和被管節(jié)點(diǎn)的報(bào)警業(yè)務(wù),每個(gè)被管節(jié)點(diǎn)定期監(jiān)控自身的性能和健康信息,若發(fā)現(xiàn)性能超標(biāo)或節(jié)點(diǎn)不健康則主動(dòng)向管理節(jié)點(diǎn)匯報(bào),管理節(jié)點(diǎn)的AlarmAgent模塊收到報(bào)警信息后,將立刻啟動(dòng)報(bào)警機(jī)制,此外,AlarmAgent執(zhí)行完報(bào)警處理事務(wù)后,還要將報(bào)警信息寫入數(shù)據(jù)庫(kù)中,便于用戶查看報(bào)警歷史信息并進(jìn)行數(shù)據(jù)分析。
5.如權(quán)利要求1所述的方法,其特征在于,所述的配置文件內(nèi)容包括節(jié)點(diǎn)名、節(jié)點(diǎn)IP和節(jié)點(diǎn)ID,Web server啟動(dòng)后,管理節(jié)點(diǎn)將自動(dòng)讀取配置文件信息并將此信息寫入數(shù)據(jù)庫(kù)的反映節(jié)點(diǎn)信息的NodeInfo表和反映節(jié)點(diǎn)角色及節(jié)點(diǎn)隸屬關(guān)系的NMInfo表,一個(gè)負(fù)責(zé)記錄整個(gè)集群拓?fù)浣Y(jié)構(gòu)的類將讀取這兩個(gè)表中的信息并構(gòu)建系統(tǒng)拓?fù)浣Y(jié)構(gòu)對(duì)象topology,并將此對(duì)象加載到內(nèi)存中,系統(tǒng)依據(jù)此對(duì)象所存儲(chǔ)的集群拓?fù)浣Y(jié)構(gòu)信息進(jìn)行任務(wù)的轉(zhuǎn)發(fā)。
6.如權(quán)利要求1所述的方法,其特征在于,所述的多線程并發(fā)機(jī)制是,任務(wù)轉(zhuǎn)發(fā)時(shí),上層節(jié)點(diǎn)為其轄域內(nèi)的每一個(gè)子節(jié)點(diǎn)開辟一個(gè)或一組獨(dú)立的線程進(jìn)行單任務(wù)或多任務(wù)的轉(zhuǎn)發(fā)和結(jié)果信息的獲取。
全文摘要
本發(fā)明公開了一種具有彈性體系架構(gòu)的集群管理監(jiān)控系統(tǒng)的構(gòu)建方法,該方法中,系統(tǒng)體系架構(gòu)的構(gòu)建采用分層設(shè)計(jì),根據(jù)集群規(guī)模和節(jié)點(diǎn)角色劃分層數(shù),實(shí)現(xiàn)層級(jí)托管,對(duì)于小規(guī)模集群系統(tǒng)采用兩層體系架構(gòu),實(shí)現(xiàn)了任務(wù)的零轉(zhuǎn)發(fā),提高了通信效率,大規(guī)模集群系統(tǒng)則采用三層體系架構(gòu),解決了管理節(jié)點(diǎn)的單點(diǎn)瓶頸問(wèn)題,提高了通信效率和集群規(guī)模的可擴(kuò)展性;體系架構(gòu)的改變通過(guò)一個(gè)配置文件即可快速實(shí)現(xiàn);任務(wù)按業(yè)務(wù)類型分類,不同業(yè)務(wù)類型對(duì)應(yīng)不同業(yè)務(wù)流程;任務(wù)的轉(zhuǎn)發(fā)和執(zhí)行采用多線程并發(fā)機(jī)制,大大提高了批量任務(wù)執(zhí)行時(shí)管理監(jiān)控系統(tǒng)的執(zhí)行效率;采用B/S結(jié)構(gòu),客戶端通過(guò)瀏覽器即可方便地對(duì)集群系統(tǒng)進(jìn)行遠(yuǎn)程管理監(jiān)控。
文檔編號(hào)G06F15/16GK1805379SQ20061004160
公開日2006年7月19日 申請(qǐng)日期2006年1月5日 優(yōu)先權(quán)日2006年1月5日
發(fā)明者薛正華, 李景山, 董小社, 伍衛(wèi)國(guó), 胡雷鈞, 李萬(wàn)城, 王守昊 申請(qǐng)人:西安交通大學(xué), 浪潮電子信息產(chǎn)業(yè)股份有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1