一種結(jié)合溫度感知的計(jì)算機(jī)節(jié)能方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種結(jié)合溫度感知的計(jì)算機(jī)節(jié)能方法及系統(tǒng),本發(fā)明涉及互聯(lián)網(wǎng)絡(luò)數(shù)據(jù)中心中,以節(jié)能為目的,設(shè)計(jì)和實(shí)現(xiàn)一種控制CPU工作狀態(tài)的方法。該方法包括獲取時(shí)間T內(nèi)該計(jì)算機(jī)運(yùn)行固定工作負(fù)載的總能耗,該總能耗包括該計(jì)算機(jī)的計(jì)算能耗與根據(jù)該溫度獲取的制冷能耗,其中在該時(shí)間T內(nèi),將該計(jì)算機(jī)的CPU在時(shí)間t內(nèi)置于休眠狀態(tài),及將該CPU在工作狀態(tài)下的頻率置于滿足該固定工作負(fù)載的最低頻率;增加該時(shí)間t并循環(huán)執(zhí)行該步驟1,直到該CPU在該工作狀態(tài)下的頻率達(dá)到100%,選擇該總能耗最低的負(fù)載策略為最優(yōu)負(fù)載策略,用于該計(jì)算機(jī)實(shí)際運(yùn)行時(shí)節(jié)能。本發(fā)明能夠有效降低計(jì)算機(jī)或數(shù)據(jù)中心服務(wù)器的計(jì)算能耗和制冷能耗。
【專利說明】一種結(jié)合溫度感知的計(jì)算機(jī)節(jié)能方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明針對互聯(lián)網(wǎng)絡(luò)數(shù)據(jù)中心中,以節(jié)能為目的,設(shè)計(jì)和實(shí)現(xiàn)一種控制CPU工作狀態(tài)的方法,以兩個(gè)參數(shù)作為衡量,對數(shù)據(jù)中心功耗進(jìn)行優(yōu)化。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)絡(luò)的逐漸興起,數(shù)據(jù)中心的計(jì)算性能越來越強(qiáng),同時(shí)其能源的消耗也越來越受到人們的重視,對于整個(gè)計(jì)算機(jī)網(wǎng)絡(luò),可進(jìn)行節(jié)能改進(jìn)的地方很多,由于計(jì)算機(jī)中CPU的功耗開銷占整個(gè)計(jì)算機(jī)的主要部分,計(jì)算機(jī)功耗的變化主要由CPU功耗的變化引起。所以主要討論CPU節(jié)能的部分。
[0003]在微觀硬件層面:隨著當(dāng)代數(shù)據(jù)中心計(jì)算機(jī)對性能需求的逐漸提升,對于計(jì)算機(jī)內(nèi)部CPU運(yùn)算能力的需求也越來越高。然而由于受到集成電路制造工藝和半導(dǎo)體硅物理特性的影響,以及CPU體系結(jié)構(gòu)等原因的限制,在逐漸趨向于多核、體系結(jié)構(gòu)以及異構(gòu)設(shè)計(jì),由于低參數(shù)工藝帶來的單位面積功耗過高以及封裝上面帶來的困難,近幾年芯片低功耗設(shè)計(jì)的考量在芯片體系結(jié)構(gòu)設(shè)計(jì)時(shí)也越來越受到重視,總體來說硬件層面在節(jié)能方面的改進(jìn)相對固定,可調(diào)節(jié)性不高,一般只能通過對計(jì)算機(jī)或CPU平臺架構(gòu)的更新?lián)Q代來進(jìn)行改進(jìn)。
[0004]在微觀軟件層面:對于單臺服務(wù)器,它所提供的性能要滿足其上運(yùn)行的任務(wù)最大需求,然而數(shù)據(jù)中心并不是一直處在對性能要求最高的狀態(tài),因此在一段時(shí)間之中,服務(wù)器CPU的實(shí)際平均利用率并不高,造成了實(shí)際上性能的大量浪費(fèi),另外,不同類型的任務(wù)對CPU性能需求的差異很大,比如在做矩陣乘法時(shí),任務(wù)對于計(jì)算機(jī)內(nèi)存性能的瓶頸先于CPU的瓶頸到達(dá),所以CPU的使用率并不高,由于這一特性,在數(shù)據(jù)中心中每一臺服務(wù)器上,在不降低在其上運(yùn)行的進(jìn)程對性能要求的前提下,當(dāng)服務(wù)器運(yùn)行時(shí)的性能高于在其上運(yùn)行的任務(wù)所需要的性能時(shí),通過ACPI的硬件接口的控制,通過對CPU降壓/降頻(DVFS技術(shù)),可以在降低多余性能的同時(shí)降低CPU的功耗,若在一段較長的時(shí)間內(nèi)CPU處于空閑idle狀態(tài),則可將CPU置于睡眠模式,直到任務(wù)到來,基于這兩種方式的節(jié)能,均是在不影響性能的前提下通過動(dòng)態(tài)電源的管理實(shí)現(xiàn)功耗的降低,目前行業(yè)主要實(shí)現(xiàn)策略有兩種:1、基于計(jì)算功耗控制參數(shù)制定調(diào)節(jié)策略;2、基于溫度控制參數(shù)制定調(diào)節(jié)策略,總體上來說,數(shù)據(jù)中心功耗的開銷主要為服務(wù)器和空調(diào)的功耗,服務(wù)器功耗的可調(diào)節(jié)部分主要為CPU、內(nèi)存、風(fēng)扇等,其中CPU的可調(diào)節(jié)性最高;同時(shí),考慮到大氣溫度的不可控性,因此空調(diào)的制冷功耗的降低與服務(wù)器整體的溫度狀態(tài)直接相關(guān)。
[0005]在當(dāng)前數(shù)據(jù)中心中對功耗降低的方法通常是將宏觀和微觀相結(jié)合,通過改進(jìn)數(shù)據(jù)中心的互聯(lián)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),合理控制帶寬和分配資源,虛擬機(jī)分配和調(diào)度算法的設(shè)計(jì),將數(shù)據(jù)中心的負(fù)載均衡化,將網(wǎng)絡(luò)中性能功耗比不高的節(jié)點(diǎn)關(guān)閉,將數(shù)據(jù)中心的負(fù)載合理化可以較為顯著地降低數(shù)據(jù)中心的計(jì)算功耗,目前在虛擬機(jī)調(diào)度算法設(shè)計(jì)方面,主要集中在以數(shù)據(jù)中心中服務(wù)器整體的計(jì)算功耗最低作為算法優(yōu)化的衡量標(biāo)準(zhǔn),或者以溫度作為參考,衡量數(shù)據(jù)中心空調(diào)制冷功耗的降低的貢獻(xiàn),使得數(shù)據(jù)中心的計(jì)算功耗降至理論上的最低,然而對于上述的當(dāng)前技術(shù),在相應(yīng)的策略定制時(shí),只是單純考慮到宏觀虛擬機(jī)調(diào)度和微觀調(diào)節(jié)在計(jì)算功耗降低上的貢獻(xiàn),并沒有考慮相應(yīng)策略設(shè)計(jì)時(shí)對機(jī)房溫度的影響,然而維持機(jī)房溫度穩(wěn)定的制冷功耗通常占數(shù)據(jù)中心中總功耗比例的第二位,如圖1所示,大型數(shù)據(jù)中心中在空調(diào)制冷的功耗可達(dá)到數(shù)據(jù)中心整體功耗開銷的40%,所以單純考慮計(jì)算功耗定制的策略,可能會引起數(shù)據(jù)中心的空調(diào)制冷功耗與服務(wù)器計(jì)算功耗之和總體上的變化并未達(dá)到最優(yōu),因此,在數(shù)據(jù)中心節(jié)能算法設(shè)計(jì)中,也需要在計(jì)算機(jī)節(jié)能選擇策略時(shí)將服務(wù)器計(jì)算功耗與制冷功耗結(jié)合起來加以考慮。
[0006]發(fā)明專利“一種基于負(fù)載統(tǒng)計(jì)的計(jì)算機(jī)節(jié)能的方法”公開了一種基于負(fù)載統(tǒng)計(jì)的計(jì)算機(jī)節(jié)能的方法,系統(tǒng)結(jié)構(gòu)包括:負(fù)載分析單元(I),策略生成單元(2),系統(tǒng)定時(shí)任務(wù)
(3),系統(tǒng)降頻接口(4),操作系統(tǒng)通過對一段時(shí)間內(nèi)的系統(tǒng)負(fù)載進(jìn)行統(tǒng)計(jì)分析,通過降低系統(tǒng)低負(fù)載時(shí)計(jì)算機(jī)CPU的頻率及啟動(dòng)操作系統(tǒng)定時(shí)任務(wù)功能,實(shí)現(xiàn)在特定時(shí)間段內(nèi)讓CPU處于低頻率下運(yùn)行,從而達(dá)到延長計(jì)算機(jī)部件壽命,降低計(jì)算機(jī)能耗,但是該發(fā)明也以負(fù)載統(tǒng)計(jì)的方法預(yù)測計(jì)算機(jī)負(fù)載,區(qū)別是其策略生成仍只是單純考慮計(jì)算功耗的影響,未將溫度作考慮。
【發(fā)明內(nèi)容】
[0007]針對現(xiàn)有技術(shù)不足,本發(fā)明設(shè)計(jì)一種微觀上軟件的調(diào)節(jié)方法,在面對不同負(fù)載時(shí),在節(jié)能策略方法上考慮對空調(diào)制冷功耗和計(jì)算機(jī)計(jì)算功耗的共同影響,使得計(jì)算機(jī)在數(shù)據(jù)中心中不同負(fù)載情況下,制冷功耗和計(jì)算功耗之和降到最低,數(shù)據(jù)中心整體的性能功耗比達(dá)到最優(yōu),其中包括線下測量的數(shù)據(jù)收集,制冷功耗模型的建立,最優(yōu)策略集的選取。
[0008]本發(fā)明提出一種結(jié)合溫度感知的計(jì)算機(jī)節(jié)能方法,包括:
[0009]步驟1,獲取時(shí)間T內(nèi)該計(jì)算機(jī)運(yùn)行固定工作負(fù)載的總能耗,該總能耗包括該計(jì)算機(jī)的計(jì)算能耗與根據(jù)該溫度獲取的制冷能耗,其中在該時(shí)間T內(nèi),將該計(jì)算機(jī)的CPU在時(shí)間t內(nèi)置于休眠狀態(tài),及將該CPU在工作狀態(tài)下的頻率置于滿足該固定工作負(fù)載的最低頻率;
[0010]步驟2,增加該時(shí)間t并循環(huán)執(zhí)行該步驟1,直到該CPU在該工作狀態(tài)下的頻率達(dá)到100%,選擇該總能耗最低的負(fù)載策略為最優(yōu)負(fù)載策略,用于該計(jì)算機(jī)實(shí)際運(yùn)行時(shí)節(jié)能。
[0011]所述的結(jié)合溫度感知的計(jì)算機(jī)節(jié)能方法,還包括,獲取該計(jì)算機(jī)的最大性能,將該計(jì)算機(jī)的最大性能平均分為多個(gè)檔位作為工作負(fù)載檔位,遍歷該工作負(fù)載檔位并執(zhí)行該步驟2,生成最優(yōu)負(fù)載策略集。
[0012]所述的結(jié)合溫度感知的計(jì)算機(jī)節(jié)能方法,還包括,該計(jì)算機(jī)在實(shí)際運(yùn)行時(shí),將實(shí)際工作負(fù)載與該工作負(fù)載檔位進(jìn)行匹配,并從該最優(yōu)負(fù)載策略集中選取與該實(shí)際工作負(fù)載相對應(yīng)的該最優(yōu)負(fù)載策略,以完成該計(jì)算機(jī)節(jié)能。
[0013]所述的結(jié)合溫度感知的計(jì)算機(jī)節(jié)能方法,該步驟I中該時(shí)間T為I秒,該時(shí)間t為
0.01 秒。
[0014]所述的結(jié)合溫度感知的計(jì)算機(jī)節(jié)能方法,該步驟2中增加該時(shí)間t的增量為一個(gè)時(shí)間t。
[0015]本發(fā)明還提供一種結(jié)合溫度感知的計(jì)算機(jī)節(jié)能系統(tǒng),包括:
[0016]獲取計(jì)算機(jī)總能耗模塊,用于獲取時(shí)間T內(nèi)該計(jì)算機(jī)運(yùn)行固定工作負(fù)載的總能耗,該總能耗包括該計(jì)算機(jī)的計(jì)算能耗與根據(jù)該溫度獲取的制冷能耗,其中在該時(shí)間T內(nèi),將該計(jì)算機(jī)的CPU在時(shí)間t內(nèi)置于休眠狀態(tài),及將該CPU在工作狀態(tài)下的頻率置于滿足該固定工作負(fù)載的最低頻率;
[0017]選取最優(yōu)負(fù)載策略模塊,用于增加該時(shí)間t并循環(huán)執(zhí)行該獲取計(jì)算機(jī)總能耗模塊,直到該CPU在該工作狀態(tài)下的頻率達(dá)到100%,選擇該總能耗最低的負(fù)載策略為最優(yōu)負(fù)載策略。
[0018]所述的結(jié)合溫度感知的計(jì)算機(jī)節(jié)能系統(tǒng),還包括生成最優(yōu)負(fù)載策略集模塊,用于獲取該計(jì)算機(jī)的最大性能,將該計(jì)算機(jī)的最大性能平均分為多個(gè)檔位作為工作負(fù)載檔位,遍歷該工作負(fù)載檔位并執(zhí)行該選取最優(yōu)負(fù)載策略模塊,生成最優(yōu)負(fù)載策略集。
[0019]所述的結(jié)合溫度感知的計(jì)算機(jī)節(jié)能系統(tǒng),還包括,匹配模塊,用于該計(jì)算機(jī)在實(shí)際運(yùn)行時(shí),將實(shí)際工作負(fù)載與該工作負(fù)載檔位進(jìn)行匹配,并從該最優(yōu)負(fù)載策略集中選取與該實(shí)際工作負(fù)載相對應(yīng)的該最優(yōu)負(fù)載策略,以完成該計(jì)算機(jī)節(jié)能。
[0020]所述的結(jié)合溫度感知的計(jì)算機(jī)節(jié)能系統(tǒng),該時(shí)間T為I秒,該時(shí)間t為0.01秒。
[0021]所述的結(jié)合溫度感知的計(jì)算機(jī)節(jié)能系統(tǒng),該選取最優(yōu)負(fù)載策略模塊中增加該時(shí)間t的增量為一個(gè)時(shí)間t。
[0022]由以上方案可知,本發(fā)明的優(yōu)點(diǎn)在于:考慮到計(jì)算機(jī)外部受溫度影響的制冷功耗的開銷,本發(fā)明將溫度作為考慮的參數(shù)引入到數(shù)據(jù)中心的節(jié)點(diǎn)級服務(wù)器節(jié)能中,使溫度感知節(jié)能在更低的層級節(jié)能上做考慮,在討論單個(gè)服務(wù)器的功耗時(shí),整合了計(jì)算功耗和制冷功耗,尤其在數(shù)據(jù)中心整體功耗節(jié)省問題上,本發(fā)明與基于溫度感知的宏觀調(diào)度在彼此的兩個(gè)層次可構(gòu)成很好的聯(lián)結(jié)與互補(bǔ)。
【專利附圖】
【附圖說明】
[0023]圖1為數(shù)據(jù)中心能源消耗比例圖;
[0024]圖2為運(yùn)用睡眠模式策略圖;
[0025]圖3為功耗策略算法流程圖;
[0026]圖4為功耗管理模塊軟件設(shè)計(jì)架構(gòu)圖;
[0027]圖5為選擇功耗管理示意圖。
[0028]圖6為CPU在不同頻率下100%使用率時(shí)溫度、電壓、功率統(tǒng)計(jì)表。
[0029]其中附圖標(biāo)記為:
[0030]步驟100為本發(fā)明功耗策略算法步驟,包括:
[0031]步驟101/102/103/104/105 ;
[0032]步驟200為功耗策略詳細(xì)步驟,包括:
[0033]步驟201/202/203/204/205/206/207/208/209/210/211/212 ;
[0034]步驟300為選擇負(fù)載策略步驟,包括:
[0035]步驟301/302/303。
【具體實(shí)施方式】
[0036]對于每一種型號的計(jì)算機(jī),最優(yōu)節(jié)能策略選取方法為:在線下對服務(wù)器進(jìn)行不同負(fù)載的測試,記錄測試時(shí)滿足負(fù)載條件時(shí)的調(diào)節(jié)策略,記錄相應(yīng)參數(shù),如電壓、頻率、溫度等,調(diào)節(jié)的方式有DVFS (動(dòng)態(tài)電壓頻率調(diào)節(jié)),以及DCS (動(dòng)態(tài)開關(guān)核),當(dāng)CPU負(fù)載較輕時(shí),可以通過DVFS (動(dòng)態(tài)電壓頻率調(diào)節(jié)),將CPU的電壓調(diào)低,同時(shí)會使CPU工作頻率降低,根據(jù)CPU的功耗與其工作電壓和頻率的關(guān)系,當(dāng)電壓降低時(shí),CPU的功耗會降低,而同時(shí),電壓的降低也會引起溫度的降低,當(dāng)運(yùn)用DVFS (動(dòng)態(tài)電壓頻率調(diào)節(jié))技術(shù)將CPU降頻時(shí),如圖6所示,以Xeon E5-2620低功耗芯片為例,CPU工作在1.2GHz時(shí)的計(jì)算功耗比2.0GHz時(shí)降低了36%,溫度降低5?TC。關(guān)于DCS(動(dòng)態(tài)開關(guān)核)的實(shí)現(xiàn)上,可分為兩種方式,傳統(tǒng)調(diào)節(jié)思路與DVFS (動(dòng)態(tài)電壓頻率調(diào)節(jié))類似,即根據(jù)負(fù)載的變化,動(dòng)態(tài)地調(diào)節(jié)CPU中開啟和關(guān)閉的核心的數(shù)量,以達(dá)到控制CPU功耗的目的。
[0037]本發(fā)明使用的方法為:當(dāng)CPU在一段時(shí)間內(nèi)利用率較低時(shí),將這段時(shí)間分割成均勻的幾小段時(shí)間,如圖2所示,設(shè)動(dòng)態(tài)地將CPU整體在每一小段時(shí)間內(nèi),根據(jù)CPU利用率的信息將其在一個(gè)合理的時(shí)間間隔內(nèi)置入Sleep Mode (睡眠模式)狀態(tài),如圖2所示,其中E為分割的成小段時(shí)間數(shù)量的倒數(shù),將CPU置于Sle印Mode (睡眠模式)的時(shí)刻可以在DVFS (動(dòng)態(tài)電壓頻率調(diào)節(jié))的基礎(chǔ)上,降低計(jì)算機(jī)整體30%以上的計(jì)算功耗,在Sleep Mode (睡眠模式)時(shí),可以將片外溫度視為室內(nèi)溫度,通過DCS (動(dòng)態(tài)開關(guān)核)和DVFS (動(dòng)態(tài)電壓頻率調(diào)節(jié))結(jié)合的聯(lián)合調(diào)節(jié),在制定節(jié)能策略時(shí)同時(shí)考慮不同策略情形下對計(jì)算機(jī)的計(jì)算功耗和由其溫度引起的制冷功耗,使計(jì)算功耗和制冷功耗均達(dá)到最低。
[0038]通過監(jiān)測在一個(gè)調(diào)節(jié)策略下CPU的當(dāng)前電壓和工藝型號,可以計(jì)算出CPU的計(jì)算功耗,通過監(jiān)控當(dāng)前CPU片內(nèi)和片外溫度以及相關(guān)參數(shù),可以推算估計(jì)在此情況下空調(diào)保持一個(gè)恒定溫度時(shí)的運(yùn)行功率,根據(jù)機(jī)房的規(guī)模和空調(diào)的規(guī)模,依據(jù)已有的經(jīng)驗(yàn)數(shù)據(jù)推算單個(gè)服務(wù)器在對應(yīng)不同策略的選取上時(shí),對應(yīng)空調(diào)制冷功耗的貢獻(xiàn)模型,記錄不同策略下單臺服務(wù)器不同策略下的CPU引發(fā)的計(jì)算功功耗和制冷功耗,篩選出最優(yōu)策略集。
[0039]本發(fā)明的總體流程包括:獲取時(shí)間T內(nèi)該計(jì)算機(jī)運(yùn)行固定工作負(fù)載的總能耗,該總能耗包括該計(jì)算機(jī)的計(jì)算能耗與根據(jù)該溫度獲取的制冷能耗,其中在該時(shí)間T內(nèi),將該計(jì)算機(jī)的CPU在時(shí)間t內(nèi)置于休眠狀態(tài),及將該CPU在工作狀態(tài)下的頻率置于滿足該固定工作負(fù)載的最低頻率,該時(shí)間T為I秒,該時(shí)間t為0.01秒;增加該時(shí)間t并循環(huán)執(zhí)行以上步驟,直到該CPU在該工作狀態(tài)下的頻率達(dá)到100%,選擇該總能耗最低的負(fù)載策略為最優(yōu)負(fù)載策略,用于該計(jì)算機(jī)實(shí)際運(yùn)行時(shí)節(jié)能,增加該時(shí)間t的增量為一個(gè)時(shí)間t;獲取該計(jì)算機(jī)的最大性能,將該計(jì)算機(jī)的最大性能平均分為多個(gè)檔位作為工作負(fù)載檔位,遍歷該工作負(fù)載檔位并找出每個(gè)工作負(fù)載檔位的最優(yōu)負(fù)載策略,生成最優(yōu)負(fù)載策略集;該計(jì)算機(jī)在實(shí)際運(yùn)行時(shí),將實(shí)際工作負(fù)載與該工作負(fù)載檔位進(jìn)行匹配,并從該最優(yōu)負(fù)載策略集中選取與該實(shí)際工作負(fù)載相對應(yīng)的該最優(yōu)負(fù)載策略,以完成該計(jì)算機(jī)節(jié)能。
[0040]以下為本發(fā)明【具體實(shí)施方式】:
[0041]對計(jì)算機(jī)進(jìn)行測試,首先測量計(jì)算機(jī)的占用率為100%時(shí)的性能,以MIPS (Mill1n Instruct1ns Per Second每秒處理百萬級的機(jī)器語言指令數(shù))作為衡量指標(biāo),根據(jù)性能的最大值將CPU測試時(shí)的工作負(fù)載均勻分成N個(gè)檔位(該檔位的多少取決于計(jì)算機(jī)或服務(wù)器的性能,可以為100?1000,或更多,也可更少,本發(fā)明不做限定),其中包括CPU占用率為0%和100%時(shí),在每一個(gè)固定的檔位時(shí),監(jiān)測CPU的溫度、電壓、頻率、計(jì)算功耗等參數(shù),同時(shí)在計(jì)算機(jī)外部測量計(jì)算機(jī)的整體功耗變化,通過對機(jī)房溫度和空調(diào)功耗的統(tǒng)計(jì)數(shù)據(jù),推算出在此溫度下的數(shù)據(jù)中心制冷功耗。(例:CPU在一個(gè)固定負(fù)載下時(shí),設(shè)此時(shí)CPU利用率為a,設(shè)定在時(shí)間段I秒內(nèi),通過調(diào)用接口,在(a-b)秒的時(shí)間內(nèi),將CPU運(yùn)行的現(xiàn)場數(shù)據(jù)掛起到內(nèi)存,即置于睡眠模式狀態(tài),其中b為狀態(tài)轉(zhuǎn)換時(shí)引起的額外性能損失的補(bǔ)償因子,通過引入補(bǔ)償因子,可以保證計(jì)算機(jī)在引入Sle印Mode(睡眠模式)之后,對相應(yīng)負(fù)載下的工作性能不受影響,在I秒中的(Ι-a)秒的時(shí)間里,令CPU處于頻率較高的狀態(tài),考慮到在服務(wù)器實(shí)際運(yùn)行的情形,需要開啟DVFS (動(dòng)態(tài)電壓頻率調(diào)節(jié))以適應(yīng)變化較為劇烈的情形以作為緩沖。分別監(jiān)測CPU在活躍和睡眠時(shí)的溫度和計(jì)算功耗,計(jì)算在I秒的時(shí)間內(nèi),平均的計(jì)算功耗和溫度。)
[0042]監(jiān)測并記錄CPU在不同頻率下使用率從O %變化到100%時(shí),CPU的計(jì)算功耗、溫度、電壓和頻率這些數(shù)據(jù),并測量不同頻率、不同CPU占用率下CPU的MIPS(每秒處理百萬級的機(jī)器語言指令數(shù))。
[0043]對于一個(gè)固定負(fù)載的情形,假設(shè)在此負(fù)載下CPU利用率為a,保持CPU處于活躍狀態(tài),首先對CPU進(jìn)行降頻,降低到使其滿足任務(wù)對性能的需求的最低頻率,計(jì)算此狀態(tài)下I秒內(nèi)的計(jì)算功耗和制冷功耗,在這一負(fù)載下,如果CPU在降頻之后仍滿足負(fù)載對性能(MIPS)的需求,設(shè)步長C,單位為秒,c為衡量調(diào)節(jié)睡眠模式時(shí)間精細(xì)程度的度量參數(shù),假設(shè)c = 0.01秒,則在測試性能時(shí),CPU在睡眠狀態(tài)的時(shí)間每次增加0.01秒,按步長c將CPU的狀態(tài)置于睡眠模式,在(Ι-c)秒內(nèi)置于活躍狀態(tài),并在活躍狀態(tài)時(shí),開啟DVFS(動(dòng)態(tài)電壓頻率調(diào)節(jié)),將CPU進(jìn)行降頻,直到滿足任務(wù)需求的最低頻率,記錄在Is內(nèi)的計(jì)算功耗和制冷功耗,判斷在此狀態(tài)下CPU性能是否滿足負(fù)載的需求,若滿足,則Sleep Mode (睡眠模式)時(shí)間增加C,將CPU在(cX2)秒內(nèi)置于Sle印Mode (睡眠模式),在(l_cX2)秒內(nèi)置于活躍狀態(tài),開啟DVFS (動(dòng)態(tài)電壓頻率調(diào)節(jié)),將CPU頻率置于滿足負(fù)載需求的最低頻率下,計(jì)算在Is內(nèi)活躍狀態(tài)和Sleep Mode (睡眠模式)下平均的計(jì)算功耗和制冷功耗,判斷在此狀態(tài)下CPU提供的性能是否滿足負(fù)載的需求,持續(xù)上述的循環(huán)過程,逐漸增加Sle印Mode (睡眠模式)的時(shí)間,同時(shí)記錄并計(jì)算不同狀態(tài)下的CPU的計(jì)算功耗和制冷功耗,直到到達(dá)一個(gè)狀態(tài),這時(shí),再增加Sleep Mode (睡眠模式)時(shí)間時(shí),CPU在活躍狀態(tài)所能提供的性能在CPU處于活躍狀態(tài)的時(shí)間之內(nèi)無法滿足負(fù)載需求為止。此時(shí),返回,將負(fù)載檔位+1。
[0044]通過上述過程得到CPU在固定負(fù)載情況下、不同策略下的一系列計(jì)算功耗和制冷功耗,將在這個(gè)固定負(fù)載下的策略能源消耗狀態(tài)進(jìn)行統(tǒng)計(jì),選擇整體消耗能源最少的策略為最優(yōu)的策略。
[0045]遍歷N個(gè)負(fù)載檔位不同策略下的功耗的關(guān)系,可以得到在不同負(fù)載情形下的負(fù)載與整體功耗的關(guān)系,選擇不同負(fù)載檔位下消耗能源最少的策略集,結(jié)束線下的測試統(tǒng)計(jì),將得到的策略集作為這一型號的服務(wù)器在數(shù)據(jù)中心應(yīng)對不同負(fù)載狀態(tài)時(shí)的能源管理策略。
[0046]在得到能源管理策略集之后,在服務(wù)器實(shí)際工作時(shí),通過監(jiān)控程序?qū)?shù)據(jù)類型采集,通過對前一段時(shí)間內(nèi)采集的歷史數(shù)據(jù)分析,對未來負(fù)載情況進(jìn)行預(yù)測,通過根據(jù)預(yù)測的負(fù)載選擇相應(yīng)的功耗管理策略,對硬件接口的控制,達(dá)到優(yōu)化計(jì)算功耗和制冷功耗的策略。
[0047]以下為本發(fā)明功耗策略算法流程,如圖3所示,執(zhí)行步驟101計(jì)算各狀態(tài)下CPU的計(jì)算功耗和溫度,執(zhí)行步驟102根據(jù)溫度計(jì)算得到空調(diào)制冷功耗,執(zhí)行步驟103記錄同一負(fù)載不同策略下的計(jì)算能耗和制冷能耗的和,執(zhí)行步驟104將記錄的功耗排序,記錄最優(yōu)策略,執(zhí)行步驟105記錄不同負(fù)載情況下的最優(yōu)策略。
[0048]以下為本發(fā)明詳細(xì)流程,如圖4所示,執(zhí)行步驟201清空服務(wù)器負(fù)載,執(zhí)行步驟202負(fù)載檔位加1,執(zhí)行步驟203CPU利用率分析,執(zhí)行步驟204CPU保持工作狀態(tài),開啟動(dòng)態(tài)電壓頻率調(diào)節(jié),睡眠模式的時(shí)間等于零,執(zhí)行步驟205獲取此狀態(tài)下CPU的計(jì)算功耗和溫度,執(zhí)行步驟206CPU是否工作在最高頻,如果否,則執(zhí)行步驟207睡眠模式的時(shí)間加C,在時(shí)間片段內(nèi)的c時(shí)間段將CPU置于睡眠,繼續(xù)執(zhí)行步驟208CPU處于工作狀態(tài)時(shí)將頻率設(shè)為最高,并開啟動(dòng)態(tài)電壓頻率調(diào)節(jié),繼續(xù)執(zhí)行步驟209獲取此狀態(tài)下CPU的計(jì)算功耗和溫度,繼續(xù)執(zhí)行步驟210此時(shí)策略是否滿足負(fù)載需求,如果是,則從執(zhí)行步驟206開始執(zhí)行,如果否,則執(zhí)行步驟211當(dāng)前負(fù)載檔位是否為最高,如果是,則執(zhí)行步驟212結(jié)束,如果否,則執(zhí)行步驟202負(fù)載檔位加1,當(dāng)執(zhí)行步驟206時(shí),如果CPU在高頻,則執(zhí)行步驟211。
[0049]以下為本發(fā)明在計(jì)算機(jī)或服務(wù)器實(shí)際工作的整體流程,如圖5所示,執(zhí)行步驟301進(jìn)行數(shù)據(jù)采集,執(zhí)行步驟302生成最優(yōu)負(fù)載策略集,執(zhí)行步驟303通過接口控制,控制CPU按照選取的最優(yōu)負(fù)載策略運(yùn)行。
[0050]本發(fā)明包括以下模塊:
[0051]獲取計(jì)算機(jī)總能耗模塊,用于獲取時(shí)間T內(nèi)該計(jì)算機(jī)運(yùn)行固定工作負(fù)載的總能耗,該總能耗包括該計(jì)算機(jī)的計(jì)算能耗與根據(jù)該溫度獲取的制冷能耗,其中在該時(shí)間T內(nèi),將該計(jì)算機(jī)的CPU在時(shí)間t內(nèi)置于休眠狀態(tài),及將該CPU在工作狀態(tài)下的頻率置于滿足該固定工作負(fù)載的最低頻率,該時(shí)間T為I秒,該時(shí)間t為0.01秒;
[0052]選取最優(yōu)負(fù)載策略模塊,用于增加該時(shí)間t并循環(huán)執(zhí)行該獲取計(jì)算機(jī)總能耗模塊,直到該CPU在該工作狀態(tài)下的頻率達(dá)到100%,選擇該總能耗最低的負(fù)載策略為最優(yōu)負(fù)載策略,增加該時(shí)間t的增量為一個(gè)時(shí)間t。
[0053]生成最優(yōu)負(fù)載策略集模塊,用于獲取該計(jì)算機(jī)的最大性能,將該計(jì)算機(jī)的最大性能平均分為多個(gè)檔位作為工作負(fù)載檔位,遍歷該工作負(fù)載檔位并執(zhí)行該選取最優(yōu)負(fù)載策略模塊,生成最優(yōu)負(fù)載策略集。
[0054]匹配模塊,用于該計(jì)算機(jī)在實(shí)際運(yùn)行時(shí),將實(shí)際工作負(fù)載與該工作負(fù)載檔位進(jìn)行匹配,并從該最優(yōu)負(fù)載策略集中選取與該實(shí)際工作負(fù)載相對應(yīng)的該最優(yōu)負(fù)載策略,以完成該計(jì)算機(jī)節(jié)能。
【權(quán)利要求】
1.一種結(jié)合溫度感知的計(jì)算機(jī)節(jié)能方法,其特征在于,包括: 步驟1,獲取時(shí)間T內(nèi)該計(jì)算機(jī)運(yùn)行固定工作負(fù)載的總能耗,該總能耗包括該計(jì)算機(jī)的計(jì)算能耗與根據(jù)該溫度獲取的制冷能耗,其中在該時(shí)間T內(nèi),將該計(jì)算機(jī)的CPU在時(shí)間t內(nèi)置于休眠狀態(tài),及將該CPU在工作狀態(tài)下的頻率置于滿足該固定工作負(fù)載的最低頻率; 步驟2,增加該時(shí)間t并循環(huán)執(zhí)行該步驟1,直到該CPU在該工作狀態(tài)下的頻率達(dá)到100%,選擇該總能耗最低的負(fù)載策略為最優(yōu)負(fù)載策略,用于該計(jì)算機(jī)實(shí)際運(yùn)行時(shí)節(jié)能。
2.如權(quán)利要求1所述的結(jié)合溫度感知的計(jì)算機(jī)節(jié)能方法,其特征在于,還包括,獲取該計(jì)算機(jī)的最大性能,將該計(jì)算機(jī)的最大性能平均分為多個(gè)檔位作為工作負(fù)載檔位,遍歷該工作負(fù)載檔位并執(zhí)行該步驟2,生成最優(yōu)負(fù)載策略集。
3.如權(quán)利要求1或2所述的結(jié)合溫度感知的計(jì)算機(jī)節(jié)能方法,其特征在于,還包括,該計(jì)算機(jī)在實(shí)際運(yùn)行時(shí),將實(shí)際工作負(fù)載與該工作負(fù)載檔位進(jìn)行匹配,并從該最優(yōu)負(fù)載策略集中選取與該實(shí)際工作負(fù)載相對應(yīng)的該最優(yōu)負(fù)載策略,以完成該計(jì)算機(jī)節(jié)能。
4.如權(quán)利要求1所述的結(jié)合溫度感知的計(jì)算機(jī)節(jié)能方法,其特征在于,該步驟I中該時(shí)間T為I秒,該時(shí)間t為0.01秒。
5.如權(quán)利要求1所述的結(jié)合溫度感知的計(jì)算機(jī)節(jié)能方法,其特征在于,該步驟2中增加該時(shí)間t的增量為一個(gè)時(shí)間t。
6.一種結(jié)合溫度感知的計(jì)算機(jī)節(jié)能系統(tǒng),其特征在于,包括: 獲取計(jì)算機(jī)總能耗模塊,用于獲取時(shí)間T內(nèi)該計(jì)算機(jī)運(yùn)行固定工作負(fù)載的總能耗,該總能耗包括該計(jì)算機(jī)的計(jì)算能耗與根據(jù)該溫度獲取的制冷能耗,其中在該時(shí)間T內(nèi),將該計(jì)算機(jī)的CPU在時(shí)間t內(nèi)置于休眠狀態(tài),及將該CPU在工作狀態(tài)下的頻率置于滿足該固定工作負(fù)載的最低頻率; 選取最優(yōu)負(fù)載策略模塊,用于增加該時(shí)間t并循環(huán)執(zhí)行該獲取計(jì)算機(jī)總能耗模塊,直到該CPU在該工作狀態(tài)下的頻率達(dá)到100%,選擇該總能耗最低的負(fù)載策略為最優(yōu)負(fù)載策略。
7.如權(quán)利要求6所述的結(jié)合溫度感知的計(jì)算機(jī)節(jié)能系統(tǒng),其特征在于,還包括生成最優(yōu)負(fù)載策略集模塊,用于獲取該計(jì)算機(jī)的最大性能,將該計(jì)算機(jī)的最大性能平均分為多個(gè)檔位作為工作負(fù)載檔位,遍歷該工作負(fù)載檔位并執(zhí)行該選取最優(yōu)負(fù)載策略模塊,生成最優(yōu)負(fù)載策略集。
8.如權(quán)利要求6或7所述的結(jié)合溫度感知的計(jì)算機(jī)節(jié)能系統(tǒng),其特征在于,還包括,匹配模塊,用于該計(jì)算機(jī)在實(shí)際運(yùn)行時(shí),將實(shí)際工作負(fù)載與該工作負(fù)載檔位進(jìn)行匹配,并從該最優(yōu)負(fù)載策略集中選取與該實(shí)際工作負(fù)載相對應(yīng)的該最優(yōu)負(fù)載策略,以完成該計(jì)算機(jī)節(jié)倉泛。
9.如權(quán)利要求6所述的結(jié)合溫度感知的計(jì)算機(jī)節(jié)能系統(tǒng),其特征在于,該時(shí)間T為I秒,該時(shí)間t為0.01秒。
10.如權(quán)利要求6所述的結(jié)合溫度感知的計(jì)算機(jī)節(jié)能系統(tǒng),其特征在于,該選取最優(yōu)負(fù)載策略模塊中增加該時(shí)間t的增量為一個(gè)時(shí)間t。
【文檔編號】G06F1/32GK104049716SQ201410242539
【公開日】2014年9月17日 申請日期:2014年6月3日 優(yōu)先權(quán)日:2014年6月3日
【發(fā)明者】魏天宇, 孫毓忠 申請人:中國科學(xué)院計(jì)算技術(shù)研究所