一種獲取整機(jī)柜服務(wù)器節(jié)點(diǎn)監(jiān)控信息的方法
【專利摘要】本發(fā)明公開了一種獲取整機(jī)柜服務(wù)器節(jié)點(diǎn)監(jiān)控信息的方法,其具體實(shí)現(xiàn)過程為:設(shè)置硬件部分,在由若干服務(wù)器節(jié)點(diǎn)組成的整機(jī)柜服務(wù)器內(nèi),每個(gè)服務(wù)器節(jié)點(diǎn)內(nèi)置BMC芯片,在整機(jī)柜服務(wù)器中安裝集中監(jiān)控管理單元RMC和節(jié)點(diǎn)中板;在BMC中增加OEM命令模塊;定義節(jié)點(diǎn)的BMC OEM CMD模塊的具體數(shù)據(jù)格式,即OEM命令采用CMD模塊格式,支持多個(gè)CMD模塊同時(shí)獲取和發(fā)送;節(jié)點(diǎn)中板給BMC發(fā)送OEM CMD模塊數(shù)據(jù)獲取節(jié)點(diǎn)信息;RMC從節(jié)點(diǎn)中板間獲取節(jié)點(diǎn)信息,實(shí)時(shí)監(jiān)控和散熱調(diào)控。該一種獲取整機(jī)柜服務(wù)器節(jié)點(diǎn)監(jiān)控信息的方法與現(xiàn)有技術(shù)相比,簡(jiǎn)化了節(jié)點(diǎn)BMC和節(jié)點(diǎn)中板的通信過程,節(jié)點(diǎn)中板可一次從節(jié)點(diǎn)BMC中獲取大量數(shù)據(jù),尤其是實(shí)時(shí)變化信息,對(duì)提高系統(tǒng)響應(yīng)時(shí)間大有裨益,實(shí)用性強(qiáng)。
【專利說明】
一種獲取整機(jī)柜服務(wù)器節(jié)點(diǎn)監(jiān)控信息的方法
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,具體地說是一種實(shí)用性強(qiáng)、獲取整機(jī)柜服務(wù)器節(jié)點(diǎn)監(jiān)控信息的方法。
【背景技術(shù)】
[0002]隨著計(jì)算機(jī)技術(shù)的發(fā)展,整機(jī)柜服務(wù)器在實(shí)際應(yīng)用中尤其是在大型數(shù)據(jù)中心應(yīng)用越來越廣泛,整機(jī)柜信息一般由RMC(Rack Management Controller)來統(tǒng)一管理、集中監(jiān)控。在整機(jī)柜服務(wù)器系統(tǒng)中,每一層(一般是4U)服務(wù)器節(jié)點(diǎn)通過I2C與節(jié)點(diǎn)中板連接,整機(jī)柜中每層節(jié)點(diǎn)中板通過I2C連接到上層集中監(jiān)控管理系統(tǒng)RMC。節(jié)點(diǎn)中板發(fā)送命令給本層每個(gè)節(jié)點(diǎn)BMC獲取節(jié)點(diǎn)信息,RMC發(fā)送命令給每層節(jié)點(diǎn)中板間接獲取節(jié)點(diǎn)監(jiān)控信息。目前節(jié)點(diǎn)中板通常通過標(biāo)準(zhǔn)IPMI命令獲取本層節(jié)點(diǎn)sensor,網(wǎng)絡(luò),F(xiàn)RU等信息。但是標(biāo)準(zhǔn)IPMI命令存在的問題是數(shù)據(jù)格式中包含信息量較少,而節(jié)點(diǎn)中板需要從節(jié)點(diǎn)獲取的信息量較多,這樣節(jié)點(diǎn)中板必定要發(fā)送很多IPMI命令給BMC來獲取節(jié)點(diǎn)信息,造成兩者的交互效率低,對(duì)于CPU溫度、內(nèi)存溫度、進(jìn)風(fēng)口溫度等散熱策略需要用到的的實(shí)時(shí)變化信息,往往因?yàn)樾畔@取速度慢,采集數(shù)據(jù)不及時(shí)造成整機(jī)柜散熱效果較差,風(fēng)扇墻和節(jié)點(diǎn)功耗也不能有效降低。因此,實(shí)現(xiàn)一種能快速高效獲取整機(jī)柜服務(wù)器節(jié)點(diǎn)監(jiān)控信息的方法,成為設(shè)計(jì)和開發(fā)人員亟需解決的問題。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的技術(shù)任務(wù)是針對(duì)以上不足之處,提供一種實(shí)用性強(qiáng)、獲取整機(jī)柜服務(wù)器節(jié)點(diǎn)監(jiān)控信息的方法。
[0004]—種獲取整機(jī)柜服務(wù)器節(jié)點(diǎn)監(jiān)控信息的方法,其具體實(shí)現(xiàn)過程為:
設(shè)置硬件部分,在由若干服務(wù)器節(jié)點(diǎn)組成的整機(jī)柜服務(wù)器內(nèi),每個(gè)服務(wù)器節(jié)點(diǎn)內(nèi)置BMC芯片,在整機(jī)柜服務(wù)器中安裝集中監(jiān)控管理單元RMC和節(jié)點(diǎn)中板;
在BMC中增加OEM命令模塊;
定義節(jié)點(diǎn)的BMC OEM CMD模塊的具體數(shù)據(jù)格式,S卩OEM命令采用CMD模塊格式,支持多個(gè)CMD模塊同時(shí)獲取和發(fā)送;
節(jié)點(diǎn)中板給BMC發(fā)送OEM CMD模塊數(shù)據(jù)獲取節(jié)點(diǎn)信息;
RMC從節(jié)點(diǎn)中板間獲取節(jié)點(diǎn)信息,實(shí)時(shí)監(jiān)控和散熱調(diào)控。
[0005]所述整機(jī)柜服務(wù)器為4U服務(wù)器,每一層的服務(wù)器節(jié)點(diǎn)均通過I2C與節(jié)點(diǎn)中板連接,整機(jī)柜服務(wù)器中每層的節(jié)點(diǎn)中板通過I2C連接到上層集中監(jiān)控管理系統(tǒng)RMC。
[0006]定義節(jié)點(diǎn)BMCOEM CMD模塊具體數(shù)據(jù)格式的詳細(xì)過程為:該CMD模塊包括sensorCMD、網(wǎng)絡(luò)CMD、FRU CMD三部分,在sensor CMD中,定義CPU溫度、節(jié)點(diǎn)進(jìn)出風(fēng)溫度、內(nèi)存溫度、電壓、節(jié)點(diǎn)功耗、節(jié)點(diǎn)開關(guān)機(jī)狀態(tài)、健康狀態(tài)的數(shù)據(jù)格式;在網(wǎng)絡(luò)CMD中,支持BMC share NIC和??诰W(wǎng)絡(luò)信息獲取和設(shè)置;在FRU CMD中,支持Product Name^Product SeriaUChassisExtra字段同時(shí)獲取和設(shè)置。
[0007]所述節(jié)點(diǎn)中板和節(jié)點(diǎn)BMC之間通信使用IPMB通信接口通信連接。
[0008]節(jié)點(diǎn)中板和節(jié)點(diǎn)BMC之間通過CMD模塊進(jìn)行通訊,該CMD模塊支持獲取和設(shè)置命令,用于節(jié)點(diǎn)中板從節(jié)點(diǎn)獲取信息和設(shè)置節(jié)點(diǎn)信息,每條CMD信息包括三部分:
CMD Index,即區(qū)分不同的CMD;
CMD length,即具體數(shù)據(jù)長(zhǎng)度;
CMD data,即具體數(shù)據(jù)格式定義,每一個(gè)CMD模塊的CMD data部分包含若干節(jié)點(diǎn)BMC監(jiān)控管理信息。
[0009]本發(fā)明的一種獲取整機(jī)柜服務(wù)器節(jié)點(diǎn)監(jiān)控信息的方法,具有以下優(yōu)點(diǎn):
本發(fā)明的一種獲取整機(jī)柜服務(wù)器節(jié)點(diǎn)監(jiān)控信息的方法,通過節(jié)點(diǎn)中板基于BMC中OEMCMD模塊方式實(shí)現(xiàn)整機(jī)柜節(jié)點(diǎn)監(jiān)控信息實(shí)時(shí)獲取,簡(jiǎn)化了節(jié)點(diǎn)BMC和節(jié)點(diǎn)中板的通信過程,大大減少了RMC獲取節(jié)點(diǎn)信息的時(shí)間,提高了獲取效率,節(jié)點(diǎn)中板可一次從節(jié)點(diǎn)BMC中獲取大量數(shù)據(jù),尤其是實(shí)時(shí)變化信息,大大提高了系統(tǒng)響應(yīng)時(shí)間;RMC能根據(jù)CPU,內(nèi)存,進(jìn)風(fēng)口溫度等實(shí)時(shí)信息快速調(diào)整控制風(fēng)扇轉(zhuǎn)速,不僅提高了散熱效果,也能進(jìn)一步降低節(jié)點(diǎn)功耗,實(shí)用性強(qiáng),易于推廣。
【附圖說明】
[0010]附圖1為本發(fā)明的實(shí)現(xiàn)流程圖。
【具體實(shí)施方式】
[0011 ]下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步說明。
[0012]如附圖1所示,本發(fā)明提供一種獲取整機(jī)柜服務(wù)器節(jié)點(diǎn)監(jiān)控信息的方法,通過整機(jī)柜服務(wù)器集中監(jiān)控管理單元(RMC,Rack Management Controler)和節(jié)點(diǎn)中板,基于節(jié)點(diǎn)BMC中增加的OEM命令模塊更快速高效地從節(jié)點(diǎn)BMC獲取信息,如服務(wù)器節(jié)點(diǎn)開關(guān)機(jī)狀態(tài)、溫度信息、網(wǎng)絡(luò)信息、FRU信息,資產(chǎn)信息,節(jié)點(diǎn)功耗等。
[0013]其具體實(shí)現(xiàn)過程為:
設(shè)置硬件部分,在由若干服務(wù)器節(jié)點(diǎn)組成的整機(jī)柜服務(wù)器內(nèi),每個(gè)服務(wù)器節(jié)點(diǎn)內(nèi)置BMC芯片,在整機(jī)柜服務(wù)器中安裝集中監(jiān)控管理單元RMC和節(jié)點(diǎn)中板;
在BMC中增加OEM命令模塊;
定義節(jié)點(diǎn)的BMC OEM CMD模塊的具體數(shù)據(jù)格式,S卩OEM命令采用CMD模塊格式,支持多個(gè)CMD模塊同時(shí)獲取和發(fā)送;
節(jié)點(diǎn)中板給BMC發(fā)送OEM CMD模塊數(shù)據(jù)獲取節(jié)點(diǎn)信息;
RMC從節(jié)點(diǎn)中板間獲取節(jié)點(diǎn)信息,實(shí)時(shí)監(jiān)控和散熱調(diào)控。
[0014]所述整機(jī)柜服務(wù)器為4U服務(wù)器,每一層的服務(wù)器節(jié)點(diǎn)均通過I2C與節(jié)點(diǎn)中板連接,整機(jī)柜服務(wù)器中每層的節(jié)點(diǎn)中板通過I2C連接到上層集中監(jiān)控管理系統(tǒng)RMC。
[0015]定義節(jié)點(diǎn)BMCOEM CMD模塊具體數(shù)據(jù)格式的詳細(xì)過程為:該CMD模塊包括sensorCMD、網(wǎng)絡(luò)CMD、FRU CMD三部分,在傳感器模塊sensor CMD中,將CPU溫度、節(jié)點(diǎn)進(jìn)出風(fēng)溫度、內(nèi)存溫度、電壓、節(jié)點(diǎn)功耗、節(jié)點(diǎn)開關(guān)機(jī)狀態(tài)、健康狀態(tài)等數(shù)據(jù)格式定義好,在網(wǎng)絡(luò)CMD模塊中同時(shí)支持BMC share NIC和??诰W(wǎng)絡(luò)信息獲取和設(shè)置,在FRU CMD模塊中,即現(xiàn)場(chǎng)可更換部件field-replaceable unit模塊,支持Product Name、Product SeriaKChassis Extra等字段同時(shí)獲取和設(shè)置。
[0016]所述節(jié)點(diǎn)中板和節(jié)點(diǎn)BMC之間通信使用IPMB通信接口通信連接。
[0017]節(jié)點(diǎn)中板和節(jié)點(diǎn)BMC之間通過CMD模塊進(jìn)行通訊,該CMD模塊支持獲取和設(shè)置命令,用于節(jié)點(diǎn)中板從節(jié)點(diǎn)獲取信息和設(shè)置節(jié)點(diǎn)信息,每條CMD信息包括三部分:
CMD Index,即區(qū)分不同的CMD;
CMD length,即具體數(shù)據(jù)長(zhǎng)度;
CMD data,即具體數(shù)據(jù)格式定義,每一個(gè)CMD模塊的CMD data部分包含若干節(jié)點(diǎn)BMC監(jiān)控管理信息。
[0018]本發(fā)明提出的快速高效獲取整機(jī)柜服務(wù)器節(jié)點(diǎn)監(jiān)控信息的方法,簡(jiǎn)化了節(jié)點(diǎn)BMC和節(jié)點(diǎn)中板的通信過程,節(jié)點(diǎn)中板可一次從節(jié)點(diǎn)BMC中獲取大量數(shù)據(jù),尤其是實(shí)時(shí)變化信息,對(duì)提高系統(tǒng)響應(yīng)時(shí)間大有裨益。對(duì)于整機(jī)柜散熱調(diào)速,由于RMC能通過節(jié)點(diǎn)中板快速一次獲取到CPU、內(nèi)存、進(jìn)風(fēng)口溫度等信息,在節(jié)點(diǎn)負(fù)載變化時(shí)就能很快根據(jù)當(dāng)前散熱狀況調(diào)整風(fēng)扇轉(zhuǎn)速,提高散熱效果,同時(shí)也能大大降低風(fēng)扇墻和節(jié)點(diǎn)功耗。
[0019]上述【具體實(shí)施方式】?jī)H是本發(fā)明的具體個(gè)案,本發(fā)明的專利保護(hù)范圍包括但不限于上述【具體實(shí)施方式】,任何符合本發(fā)明的一種獲取整機(jī)柜服務(wù)器節(jié)點(diǎn)監(jiān)控信息的方法的權(quán)利要求書的且任何所述技術(shù)領(lǐng)域的普通技術(shù)人員對(duì)其所做的適當(dāng)變化或替換,皆應(yīng)落入本發(fā)明的專利保護(hù)范圍。
【主權(quán)項(xiàng)】
1.一種獲取整機(jī)柜服務(wù)器節(jié)點(diǎn)監(jiān)控信息的方法,其特征在于,其具體實(shí)現(xiàn)過程為: 設(shè)置硬件部分,在由若干服務(wù)器節(jié)點(diǎn)組成的整機(jī)柜服務(wù)器內(nèi),每個(gè)服務(wù)器節(jié)點(diǎn)內(nèi)置BMC芯片,在整機(jī)柜服務(wù)器中安裝集中監(jiān)控管理單元RMC和節(jié)點(diǎn)中板; 在BMC中增加OEM命令模塊; 定義節(jié)點(diǎn)的BMC OEM CMD模塊的具體數(shù)據(jù)格式,即OEM命令采用CMD模塊格式,支持多個(gè)CMD模塊同時(shí)獲取和發(fā)送; 節(jié)點(diǎn)中板給BMC發(fā)送OEM CMD模塊數(shù)據(jù)獲取節(jié)點(diǎn)信息; RMC從節(jié)點(diǎn)中板間獲取節(jié)點(diǎn)信息,實(shí)時(shí)監(jiān)控和散熱調(diào)控。2.根據(jù)權(quán)利要求1所述的一種獲取整機(jī)柜服務(wù)器節(jié)點(diǎn)監(jiān)控信息的方法,其特征在于,所述整機(jī)柜服務(wù)器為4U服務(wù)器,每一層的服務(wù)器節(jié)點(diǎn)均通過I2C與節(jié)點(diǎn)中板連接,整機(jī)柜服務(wù)器中每層的節(jié)點(diǎn)中板通過I2C連接到上層集中監(jiān)控管理系統(tǒng)RMC。3.根據(jù)權(quán)利要求1所述的一種獲取整機(jī)柜服務(wù)器節(jié)點(diǎn)監(jiān)控信息的方法,其特征在于,定義節(jié)點(diǎn)BMC OEM CMD模塊具體數(shù)據(jù)格式的詳細(xì)過程為:該CMD模塊包括sensor CMD、網(wǎng)絡(luò)CMD,FRU CMD三部分,在sensor CMD中,定義CPU溫度、節(jié)點(diǎn)進(jìn)出風(fēng)溫度、內(nèi)存溫度、電壓、節(jié)點(diǎn)功耗、節(jié)點(diǎn)開關(guān)機(jī)狀態(tài)、健康狀態(tài)的數(shù)據(jù)格式;在網(wǎng)絡(luò)CMD中,支持BMC share NIC和專口網(wǎng)絡(luò)信息獲取和設(shè)置;在FRU CMD中,支持Product Name、Product SeriaKChassis Extra字段同時(shí)獲取和設(shè)置。4.根據(jù)權(quán)利要求1所述的一種獲取整機(jī)柜服務(wù)器節(jié)點(diǎn)監(jiān)控信息的方法,其特征在于,所述節(jié)點(diǎn)中板和節(jié)點(diǎn)BMC之間通信使用IPMB通信接口通信連接。5.根據(jù)權(quán)利要求4所述的一種獲取整機(jī)柜服務(wù)器節(jié)點(diǎn)監(jiān)控信息的方法,其特征在于,節(jié)點(diǎn)中板和節(jié)點(diǎn)BMC之間通過CMD模塊進(jìn)行通訊,該CMD模塊支持獲取和設(shè)置命令,用于節(jié)點(diǎn)中板從節(jié)點(diǎn)獲取信息和設(shè)置節(jié)點(diǎn)信息,每條CMD信息包括三部分: CMD Index,即區(qū)分不同的CMD; CMD length,即具體數(shù)據(jù)長(zhǎng)度; CMD data,即具體數(shù)據(jù)格式定義,每一個(gè)CMD模塊的CMD data部分包含若干節(jié)點(diǎn)BMC監(jiān)控管理信息。
【文檔編號(hào)】G06F11/34GK105868077SQ201610222967
【公開日】2016年8月17日
【申請(qǐng)日】2016年4月12日
【發(fā)明人】蘇孝
【申請(qǐng)人】浪潮電子信息產(chǎn)業(yè)股份有限公司