專(zhuān)利名稱(chēng):在數(shù)據(jù)處理系統(tǒng)的分區(qū)之間交易資源的裝置、系統(tǒng)和方法
在數(shù)據(jù)處理系統(tǒng)的分區(qū)之間交易資源的裝置、系統(tǒng)和方法 技術(shù)領(lǐng)域在此所公開(kāi)并要求保護(hù)的發(fā)明 一般涉及一種用于在數(shù)據(jù)處理系統(tǒng)中的邏輯分區(qū)(LPAR)之間交易或交換資源的方法,其中對(duì)諸如存儲(chǔ)器的資 源的訪(fǎng)問(wèn)相對(duì)于等待時(shí)間或訪(fǎng)問(wèn)次數(shù)可以是非統(tǒng)一的。更具體地,本發(fā)明 涉及以上類(lèi)型的方法,其中資源被交易,以便提高各個(gè)分區(qū)對(duì)可用資源的 使用的效率。更具體地,本發(fā)明涉及以上類(lèi)型的方法,其中資源在各個(gè)分 區(qū)之間的交易和重新分配由下述策略所指導(dǎo),所述策略用于提高各個(gè)分區(qū) 對(duì)資源的使用的整體系統(tǒng)質(zhì)量。
背景技術(shù):
逐漸地,大型對(duì)稱(chēng)多處理器數(shù)據(jù)處理系統(tǒng)不會(huì)被用作單個(gè)大型數(shù)據(jù)處 理系統(tǒng)。相反,這些類(lèi)型的數(shù)據(jù)處理系統(tǒng)被分區(qū)并且被用作更小的系統(tǒng), 這些系統(tǒng)也被稱(chēng)為邏輯分區(qū)(LPAR)數(shù)據(jù)處理系統(tǒng)。數(shù)據(jù)處理系統(tǒng)中的 邏輯分區(qū)功能允許單個(gè)操作系統(tǒng)的多個(gè)拷貝或多個(gè)異構(gòu)操作系統(tǒng)在單個(gè)數(shù) 據(jù)處理系統(tǒng)平臺(tái)上同時(shí)運(yùn)行。其中運(yùn)行有操作系統(tǒng)鏡像的分區(qū)被分派平臺(tái) 資源的一個(gè)非重疊子集。這些資源可以被分配,并且可以包括一個(gè)或多個(gè) 在體系結(jié)構(gòu)上截然不同的處理器及其中斷管理區(qū)域、系統(tǒng)存儲(chǔ)器區(qū)域以及輸入/輸出(1/0)適配器總線(xiàn)槽。分區(qū)的資源通過(guò)平臺(tái)固件被呈現(xiàn)給操作 系統(tǒng)鏡像。在已分區(qū)的數(shù)據(jù)處理系統(tǒng)中的硬件資源可以包括例如輸入/ 輸出(I/O)適配器、CPU、非易失性隨機(jī)存取存儲(chǔ)器(NVRAM)以及硬 盤(pán)驅(qū)動(dòng)器。硬件資源可以在需要改變之時(shí)從一個(gè)分區(qū)移動(dòng)到另一個(gè)分區(qū)。當(dāng)分區(qū)被創(chuàng)建時(shí),若干不同的存儲(chǔ)器區(qū)域可以被要求提供分區(qū)存儲(chǔ)器。 取決于硬件,有可能這些存儲(chǔ)器區(qū)域中的每個(gè)將具有不同的等待時(shí)間或訪(fǎng)問(wèn)次數(shù)。在存儲(chǔ)器區(qū)域在分區(qū)本地時(shí),這些等待時(shí)間中的某些可以相對(duì)較 短。遠(yuǎn)離分區(qū)的其它存儲(chǔ)器區(qū)域?qū)⒕哂蟹浅iL(zhǎng)的等待時(shí)間。對(duì)于某些工作負(fù)荷,這可能是不合乎需要的。例如,如果分區(qū)的中央處理單元(CPU) 被分派了與CPU位于相同卡上的存儲(chǔ)器,則該存儲(chǔ)器在CPU本地,并且 CPU訪(fǎng)問(wèn)存儲(chǔ)器所需的時(shí)間相對(duì)較短。另一方面,如果存儲(chǔ)器位于不同的 卡上,CPU必須通過(guò)緩沖器訪(fǎng)問(wèn)存儲(chǔ)器,從而等待時(shí)間將較長(zhǎng)。如果CPU 從事于諸如密集型計(jì)算的行為,其中CPU與存儲(chǔ)器之間的本地性是重要的,則使用遠(yuǎn)程存儲(chǔ)器的質(zhì)量將低于使用本地存儲(chǔ)器的質(zhì)量。另一方面,如果CPU僅訪(fǎng)問(wèn)1/0設(shè)備,本地性可能不重要。而且,可以存在針對(duì)存儲(chǔ)器區(qū)域的本地性或遠(yuǎn)程性的級(jí)別。這通過(guò)考慮可替換方案來(lái)說(shuō)明,其中,存儲(chǔ)器附接于CPU高速緩存控制器;存儲(chǔ)器未直接附接于控制器,但是與 CPU位于同一節(jié)點(diǎn);或者存儲(chǔ)器與CPU位于同一框架中,但是對(duì)存儲(chǔ)器 的訪(fǎng)問(wèn)必須通過(guò)一個(gè)或多個(gè)緩沖器。已經(jīng)發(fā)現(xiàn),如上所述在存儲(chǔ)器訪(fǎng)問(wèn)時(shí)的非統(tǒng)一性可以顯著地影響分區(qū) 系統(tǒng)的整體吞吐量。運(yùn)行相同工作負(fù)荷的不同邏輯分區(qū)的性能常常出現(xiàn)差 異。例如,在表現(xiàn)為被同樣配置(關(guān)于二者各自的存儲(chǔ)器數(shù)量、CPU和操 作系統(tǒng))的兩個(gè)分區(qū)之間觀察到10%的性能差異。此外,如果一分區(qū)相對(duì) 于存儲(chǔ)器分配不在本地,則將CPU移動(dòng)到該分區(qū)中可能增加遠(yuǎn)程存儲(chǔ)器訪(fǎng) 問(wèn)的數(shù)量。類(lèi)似地,如果采用來(lái)自相對(duì)于某些或所有的被分配的存儲(chǔ)器在 本地的分區(qū)的CPU,則遠(yuǎn)程訪(fǎng)問(wèn)的數(shù)量可能增加。盡管存在諸如上述的不合乎需要的影響,其可能來(lái)源于存儲(chǔ)器資源的 相對(duì)本地性的偏差,但是當(dāng)前實(shí)踐一般要求 一旦存儲(chǔ)器已被分配給分區(qū), 并且該分區(qū)正在運(yùn)行,則期望該分區(qū)對(duì)于它所接收的任意資源進(jìn)行最佳使 用。這通常意味著將存儲(chǔ)器訪(fǎng)問(wèn)分布于各分配,這產(chǎn)生了平均的存儲(chǔ)器等 待時(shí)間值。平均的存儲(chǔ)器等待時(shí)間值取決于訪(fǎng)問(wèn)次數(shù)的混合以及每個(gè)區(qū)域 貢獻(xiàn)了多少存儲(chǔ)器。作為當(dāng)前實(shí)踐的另一示例,在動(dòng)態(tài)重新分派期間,存 儲(chǔ)器可能未被給予最需要的分區(qū)。在此情形中,存儲(chǔ)器的任意范圍被從一 個(gè)分區(qū)中采用并給予另一分區(qū)。在采用或偷取(steal)存儲(chǔ)器的請(qǐng)求是針對(duì)特定分區(qū)的有目標(biāo)操作的意義上,本地性未被考慮。在此情形中存儲(chǔ)器 的本地性未被考慮。可以預(yù)期,如果對(duì)各個(gè)分區(qū)的資源分配考慮到資源本地性的相對(duì)重要 性的話(huà),已分區(qū)系統(tǒng)的整體質(zhì)量可以蜂皮提高,并且資源可以以高得多的效 率被使用。發(fā)明內(nèi)容本發(fā)明實(shí)施例提供了一種已分區(qū)系統(tǒng),其中"資源需要性(desirability)"策略列出了針對(duì)關(guān)聯(lián)于諸如CPU和存儲(chǔ)器的類(lèi)同 (affinity)區(qū)域的每個(gè)資源的所需的本地性級(jí)別。對(duì)于每個(gè)分區(qū),針對(duì)各 個(gè)資源的所需的本地性級(jí)別被包括在從高度需要到不重要的范圍中。如此 處所用的,"資源本地性級(jí)別,,是提供了資源相對(duì)于其分區(qū)有多近或多遠(yuǎn) 的相對(duì)度量的數(shù)值。有用地,本發(fā)明的實(shí)施例可以使用分區(qū)系統(tǒng)的分區(qū)加 載管理器(PLM)來(lái)基于本地性級(jí)別管理資源。PLM提供了一種在硬件 管理控制臺(tái)(HMC)上基于策略的資源重新分配的集中化的J^出設(shè)施。不 過(guò),不同于PLM的實(shí)體(諸如獨(dú)立的后臺(tái)監(jiān)督程序或后臺(tái)過(guò)程)也可被 用于基于本地性級(jí)別管理資源。在一實(shí)施例中,其涉及一種用于被配置為 包括多個(gè)邏輯分區(qū)的數(shù)據(jù)處理系統(tǒng)的方法,其中所述系統(tǒng)的資源在各個(gè)分 區(qū)之間選擇性地進(jìn)行分配。所述方法包括以下步驟評(píng)估在特定時(shí)間資源 到所述分區(qū)中的每個(gè)分區(qū)的分配,以便選擇具有至少一個(gè)資源的分區(qū),所所述方法進(jìn)一步包括標(biāo)識(shí)具有匹配所述低需要性資源的資源的其它分區(qū) 中的每個(gè)分區(qū),以及確定將通過(guò)把所述低需要性資源與所標(biāo)識(shí)的分區(qū)中的 每個(gè)分區(qū)的匹配資源進(jìn)行交易而得到的系統(tǒng)的整體利益。在通過(guò)對(duì)于資源 的重新分配將得到至少某種整體系統(tǒng)利益的情況下,重新分配所述資源, 以把低需要性資源與所標(biāo)識(shí)的分區(qū)的匹配資源進(jìn)行交易,其中所述交易被 確定為系統(tǒng)提供最大的整體利益。
在附帶的權(quán)利要求中闡明了被認(rèn)為是新穎特性的本發(fā)明的特征。然而, 通過(guò)參考以下結(jié)合附圖閱讀的說(shuō)明性實(shí)施例的詳細(xì)描述,將最好地理解本發(fā)明本身以及其優(yōu)選使用模式、另外的目的和優(yōu)點(diǎn),在附圖中圖1是示出了其中可以實(shí)現(xiàn)本發(fā)明實(shí)施例的示例性邏輯分區(qū)平臺(tái)的框圖;圖2是示出了與圖l所示的已分區(qū)平臺(tái)一起使用的示例性分區(qū)加載管理器的示意圖;圖3是示出了根據(jù)本發(fā)明實(shí)施例的方法的步驟的流程圖;以及 圖4是示出了可以如圖l所示被分區(qū)的數(shù)據(jù)處理系統(tǒng)的框圖。
具體實(shí)施方式
現(xiàn)在參考圖1,描述了其中可以實(shí)現(xiàn)本發(fā)明的示例性邏輯已分區(qū)平臺(tái) 100的框圖。邏輯已分區(qū)平臺(tái)100中的硬件可以被實(shí)現(xiàn)為例如下文結(jié)合圖4 描述的數(shù)據(jù)處理系統(tǒng)400。邏輯已分區(qū)平臺(tái)100包括已分區(qū)硬件130、操作 系統(tǒng)102、 104、 106、 108以及管理程序110。操作系統(tǒng)102、 104、 106和 108可以是單個(gè)操作系統(tǒng)的多個(gè)拷貝或可以是在平臺(tái)100上同時(shí)運(yùn)行的多 個(gè)異構(gòu)的操作系統(tǒng)??梢允褂肙S/400來(lái)實(shí)現(xiàn)這些操作系統(tǒng),OS/400被設(shè) 計(jì)成與管理程序相接口 。操作系統(tǒng)102、 104、 106和108分別位于分區(qū)112、 114、 116和118中。此外,這些分區(qū)分別包括固件加載器122、 124、 126 和128。當(dāng)分區(qū)112、 114、 116和118凈皮實(shí)例化時(shí),由管理程序的分區(qū)管 理器將開(kāi)放固件的拷貝加載到每個(gè)分區(qū)中。與分區(qū)關(guān)聯(lián)或分派給分區(qū)的處 理器然后被指派給分區(qū)的存儲(chǔ)器以執(zhí)行分區(qū)固件。已分區(qū)硬件130包括多個(gè)處理器132-138、多個(gè)系統(tǒng)存儲(chǔ)器單元 140-146、多個(gè)輸入/輸出(I/O)適配器148-162、以及存儲(chǔ)單元170。分區(qū) 硬件130還包括服務(wù)處理器l卯,其可以用于提供諸如處理分區(qū)中的錯(cuò)誤 之類(lèi)的各種服務(wù)。處理器132-138、存儲(chǔ)器單元140-146、 NVRAM 198以 及1/0適配器148-162中的每個(gè)可以^皮分派給邏輯已分區(qū)平臺(tái)100內(nèi)的多 個(gè)分區(qū)中的一個(gè)分區(qū),每個(gè)分區(qū)與操作系統(tǒng)102、 104、 106和108中之一相對(duì)應(yīng)。分區(qū)管理固件(管理程序)110執(zhí)行針對(duì)分區(qū)112、 114、 116和118 的多種功能和服務(wù),以創(chuàng)建和強(qiáng)制實(shí)施對(duì)邏輯已分區(qū)平臺(tái)100的分區(qū)。管 理程序IIO是一種與底層硬件相等同的固件實(shí)現(xiàn)的虛擬機(jī)。管理程序軟件 可從國(guó)際商業(yè)機(jī)器公司獲得。固件是存儲(chǔ)在沒(méi)有電力的情況下也可保持其 內(nèi)容的存儲(chǔ)器芯片中的"軟件",所述存儲(chǔ)器芯片例如,只讀存儲(chǔ)器(ROM )、 可編程ROM (PROM)、電可擦寫(xiě)可編程ROM ( EEPROM )以及非易 失性隨機(jī)存取存儲(chǔ)器(NVRAM)。因此,管理程序110允許通過(guò)使邏輯 已分區(qū)平臺(tái)100的所有硬件資源虛擬化來(lái)同時(shí)執(zhí)行獨(dú)立的OS鏡像102、 104、 106和108。不同分區(qū)的操作可以通過(guò)諸如HMC 180的硬件管理控制臺(tái)(硬件管 理顧問(wèn))來(lái)進(jìn)行控制。HMC180是單獨(dú)的分布式計(jì)算系統(tǒng),系統(tǒng)管理員通 過(guò)它可以執(zhí)行各種功能,包括資源到不同分區(qū)的重新分配。在圖l所示類(lèi)型的環(huán)境中, 一個(gè)分區(qū)中的資源或程序影響另一分區(qū)中 的操作是不允許的。而且,為了更有用,對(duì)資源的分派需要精細(xì)化。參考圖2,示出了分區(qū)加載管理器(PLM) 200,其可例如駐留于圖l 中示出的已分區(qū)平臺(tái)的硬件管理控制臺(tái)(HMC)180中。PLM200被提供,200還適于通過(guò)資源在不同分區(qū)之間的選擇性的交易或交換,確定在使 用資源時(shí)的整體質(zhì)量是否可以提高。為了執(zhí)行這些任務(wù),向PLM200提供 CPU 202、存儲(chǔ)器204以及I/O總線(xiàn)206。還向PLM 200提供數(shù)據(jù)庫(kù)208, 其包含資源需要性(desirability)策略210。對(duì)于被分配給特定分區(qū)的每個(gè)資源,其中每個(gè)資源與諸如CPU和存儲(chǔ) 器的類(lèi)同區(qū)域相關(guān)聯(lián),策略210列出針對(duì)資源的所需的本地性級(jí)別。所需 的資源本地性級(jí)別通常由特定分區(qū)的工作負(fù)荷所確定,并且指示出該資源 相對(duì)于該分區(qū)位于本地有多重要。資源本地性級(jí)別在從高度需要到不重要 的范圍中進(jìn)行分級(jí)。例如,如果特定分區(qū)從事于繁重的計(jì)算工作,則使得 CPU和存儲(chǔ)器彼此靠近是非常需要的。另 一方面,如果工作負(fù)荷涉及與I/O 的操作,諸如去往或來(lái)自存儲(chǔ)盤(pán)的數(shù)據(jù)傳輸,則CPU和存儲(chǔ)器之間的等待時(shí)間、以及由此的資源本地性級(jí)別將相對(duì)不重要。向PLM200提供算法,其被配置為執(zhí)行評(píng)估資源分配、以及估計(jì)在分 區(qū)之間變換資源的需要性的上述任務(wù),以便提高整體系統(tǒng)質(zhì)量。該算法被 進(jìn)一步配置為^f吏用如上所述的、所列出的分區(qū)的資源本地性級(jí)別,以確定 針對(duì)分區(qū)的"最小獲利"和"最大損失"的值。"最小獲利"將是一個(gè)數(shù) 值,其指示出通過(guò)分區(qū)的已分配資源的改變所得到的分區(qū)可接受的最小利 益。獲利值將表示分區(qū)的資源本地性級(jí)別的增加,并且還將表示如上所述 的、這種本地性對(duì)于分區(qū)的相對(duì)重要性。類(lèi)似地,"最大損失"值將是分 區(qū)可接受的資源本地性的最大減少,并且同樣將表示通過(guò)資源改變所得到 的資源本地性級(jí)別的減少和本地性對(duì)于該分區(qū)的重要性。盡管本領(lǐng)域技術(shù)人員在配置如上所述的、計(jì)算最小獲利和最大損失的值的算法時(shí)可以遵循 可替換方案,但是所有這樣的工作將被i人為是處于本發(fā)明的范圍中。最小獲利和最大損失的值建立了閾值,以限制資源到分區(qū)之內(nèi)和之外 的變換。如果對(duì)于分區(qū)的利益太小,或者如果對(duì)于分區(qū)的損失太大,將不 允許資源傳輸。因此,所述閾值用于定義下述范圍,在該范圍中,通過(guò)變 換或重新平衡資源而增加質(zhì)量的工作將是值得的。此外,針對(duì)每個(gè)分區(qū)的 獲利和損失的值被所述算法用于計(jì)算針對(duì)該分區(qū)的資源需要性因子。例如, 資源需要性因子可以是針對(duì)一個(gè)分區(qū)的獲利和損失的值的比率,或者可以 通過(guò)表示這兩個(gè)值的不同關(guān)系進(jìn)行計(jì)算。針對(duì)各個(gè)分區(qū)的資源需要性因子 被需要用于判斷當(dāng)前資源分配集合的質(zhì)量。根據(jù)本發(fā)明的方法,在執(zhí)行資源分配的評(píng)估之后,算法選擇具有最小 資源需要性因子的分區(qū)。如果存在共享該位置的多個(gè)分區(qū),則作為距今最 久的資源交易接受者的分區(qū)被選擇。接著,所選擇分區(qū)的最不需要資源被 標(biāo)識(shí)。針對(duì)所有其它分區(qū)評(píng)估匹配于所述不需要資源的資源,以便確定在 將所標(biāo)識(shí)的不需要資源與匹配資源之一進(jìn)行交易時(shí)是否存在整體利益。該 評(píng)估將基于針對(duì)各個(gè)分區(qū)的獲利/損失的值,最佳的整體匹配最終被選定。需要強(qiáng)調(diào),最佳匹配將通過(guò)考慮針對(duì)每個(gè)分區(qū)的獲利和損失的值的組 合來(lái)確定,其中所需目標(biāo)是,增加所選擇的最低等級(jí)分區(qū)的資源需要性。 實(shí)現(xiàn)其的有用計(jì)算是,采取獲利或損失的百分比。在獲利情形中,將采取百分比獲得。在損失情形中,將使用基于總體可允許損失的百分比。例如,如果分區(qū)將接受200點(diǎn)的損失,而損失值為100,則50%將被用于損失值。 接著將從獲利值中減去損失值。需要強(qiáng)調(diào),此過(guò)程既考慮了通過(guò)資源交易 或重新平衡得到的利益,也考慮了由此導(dǎo)致的任何有害影響。參考圖3,示出了提供在執(zhí)行上述過(guò)程時(shí)的進(jìn)一步細(xì)節(jié)的步驟。在本 發(fā)明的有用實(shí)施例中,PLM200定期地評(píng)估系統(tǒng)資源對(duì)各個(gè)分區(qū)的分配。 在每次定期評(píng)估后,執(zhí)行圖3的過(guò)程。在步驟302,通過(guò)評(píng)估找到的、具 有最小資源需要性因子的分區(qū)被選擇,并且其中的最不需要的資源被確定, 如上所述。在步驟304-306,與上述相同,具有匹配于所述不需要資源的資 源的另 一分區(qū)被標(biāo)識(shí),并且與所標(biāo)識(shí)分區(qū)進(jìn)行匹配資源的交易被評(píng)估。除了上述的資源本地性級(jí)別的列表之外,向圖2的策略210有用地提 供一組規(guī)則。所述規(guī)則用于調(diào)整對(duì)于所提出的資源在分區(qū)之間的交易或交 換進(jìn)行評(píng)估的過(guò)程。例如, 一條規(guī)則可以建立時(shí)間約束,從而用于重新平 衡資源在分區(qū)之間的分配的交易僅可以在特定時(shí)間窗期間出現(xiàn)。因此,在 圖3的步驟308,需要確定所提出的交易是否被任何這樣的時(shí)間約束所阻 止。資源交易可以是密集型操作,并且因此,當(dāng)系統(tǒng)利用率很高時(shí)交易資 源是不合乎需要的。從而,進(jìn)一步的規(guī)則可以是,允許每個(gè)分區(qū)將利用率 級(jí)別分派給分區(qū)的獲利和損失的參數(shù)值,以便當(dāng)系統(tǒng)利用率很高時(shí)限制對(duì) 于資源的動(dòng)態(tài)重新平衡。如果利用率超過(guò)截止點(diǎn),則分區(qū)可以保留資源, 并且直到利用率降到截止值之下或者保留過(guò)期之前,在一段時(shí)間內(nèi)不參與 資源交換。這提供了何時(shí)分區(qū)將出于系統(tǒng)利用率的原因而不接受重新平衡 資源的請(qǐng)求的截止點(diǎn)。考慮到該規(guī)則,步驟310被包括在評(píng)估過(guò)程中,以 確定系統(tǒng)利用率是否過(guò)高以致無(wú)法允許與所標(biāo)識(shí)分區(qū)的交易。除了如上所述確定針對(duì)各個(gè)分區(qū)的資源需要性因子之外,計(jì)算針對(duì)每 個(gè)分區(qū)的資源需要性目標(biāo)可以是有益的。接著對(duì)于策略210來(lái)說(shuō),排除在 已到達(dá)其相應(yīng)的資源需要性目標(biāo)的分區(qū)之間的交易可以是有用的。在資源 交易中,距離其作為目標(biāo)的資源需要性目標(biāo)最遙遠(yuǎn)的分區(qū)將被給予優(yōu)先級(jí)。 超過(guò)其資源需要性目標(biāo)的分區(qū)可以虧本地進(jìn)行交易,以便在不會(huì)超出該分區(qū)的最大損失閾值的情況下幫助分區(qū)??紤]到該規(guī)則,提供了步驟312,以便確定所標(biāo)識(shí)的分區(qū)是否因?yàn)槠湟堰_(dá)到其資源需要性目標(biāo)而被阻止交易。在步驟314,確定所標(biāo)識(shí)的分區(qū)的最大和最小閾值是否將阻止所提出 的用于重新平衡資源的交易。如果在步驟314的確定允許針對(duì)所標(biāo)識(shí)的分 區(qū)進(jìn)行所述過(guò)程,則針對(duì)所提出的交易的獲利淑失的組合將在步驟316如 上所述被評(píng)估。進(jìn)一步參考圖3,示出了用于確定在評(píng)估所提出的資源交易時(shí)是否需 要考慮任何其它分區(qū)的步驟320。不過(guò),還示出了在步驟320和步驟308-314 的所有肯定決定之間插入的步驟318。步驟318被提供以明確地禁止與在 步驟302所選擇的、具有最小資源需要性因子的分區(qū)的交易。在步驟320之后,如果不存在被標(biāo)識(shí)為具有匹配資源的其余分區(qū),則 所述過(guò)程進(jìn)行到步驟322。在步驟322,確定是否存在至少一個(gè)允許交易的 已標(biāo)識(shí)分區(qū)。如果否,則所述過(guò)程結(jié)束。否則,所述過(guò)程進(jìn)行到步驟324。 如果在評(píng)估過(guò)程期間找到任意最佳的獲利/損失的組合,則針對(duì)該組合執(zhí)行 所提出的資源交易或重新平衡。作為另外的規(guī)則,策略210可以定義分區(qū)是否愿意參與正發(fā)生的交易, 還是僅當(dāng)資源重新分配出現(xiàn)時(shí)參與。在動(dòng)態(tài)資源分配期間,諸如,當(dāng)由于 手動(dòng)動(dòng)態(tài)分區(qū)操作或自動(dòng)化PLM操作的原因而移除或添加存儲(chǔ)器時(shí),分 區(qū)可以基于需要性而允許資源重新分配。如果分區(qū)能夠參與正發(fā)生的交易, 則基于需要性對(duì)資源的重新平衡將在任何時(shí)間被允許。參考圖4,示出了描述可以如圖1所示被分區(qū)并用于本發(fā)明的實(shí)現(xiàn)的 數(shù)據(jù)處理系統(tǒng)400的框圖。數(shù)據(jù)處理系統(tǒng)400可以是對(duì)稱(chēng)多處理器(SMP ) 系統(tǒng),所述系統(tǒng)包括多個(gè)連接到系統(tǒng)總線(xiàn)406的處理器402和404??商?代地,可以采用單處理器系統(tǒng)。同樣連接到系統(tǒng)總線(xiàn)406的是存儲(chǔ)器控制 器/高速緩存408,它提供與本地存儲(chǔ)器409的接口。 1/O總線(xiàn)橋410與系 統(tǒng)總線(xiàn)406相連并提供與I/O總線(xiàn)412的接口。如圖所示,存儲(chǔ)器控制器/ 高速緩存408與I/O總線(xiàn)橋410可以是集成的。連接到I/O總線(xiàn)412的外圍組件互連(PCI)總線(xiàn)橋414提供與PCI局部總線(xiàn)416的接口。多個(gè)調(diào)制解調(diào)器可以連接于PCI總線(xiàn)416。典型的 PCI總線(xiàn)實(shí)現(xiàn)將支持四個(gè)PCI擴(kuò)展槽或內(nèi)插式連接器??梢酝ㄟ^(guò)調(diào)制解調(diào) 器418和網(wǎng)絡(luò)適配器420提供通信鏈路,所述調(diào)制解調(diào)器418和網(wǎng)絡(luò)適配 器420通過(guò)內(nèi)插板連接于PCI局部總線(xiàn)416。附加的PCI總線(xiàn)橋422和424提供用于附加的PCI總線(xiàn)426和428的 接口,通過(guò)所述接口可以支持附加的調(diào)制解調(diào)器或網(wǎng)絡(luò)適配器。以這種方 式,數(shù)據(jù)處理系統(tǒng)400允許到多個(gè)網(wǎng)絡(luò)計(jì)算機(jī)的連接。如圖所示,存儲(chǔ)器 映射的圖形適配器430和硬盤(pán)432也可以直接或間接地連接于I/O總線(xiàn) 412。所示的示例并非意在暗示對(duì)于本發(fā)明的體系結(jié)構(gòu)的限制。圖4中所示 的數(shù)據(jù)處理系統(tǒng)可以例如是IBM RISC/System 6000系統(tǒng)(紐約Armonk 的國(guó)際商業(yè)機(jī)器公司的產(chǎn)品),其運(yùn)行高級(jí)交互執(zhí)行(AIX)操作系統(tǒng)。 可替換地,操作系統(tǒng)可以是另一種可買(mǎi)到的操作系統(tǒng),諸如用于 Business6或OS/2d的JavaOS,其也可從IBM得到。本發(fā)明可采用完全軟件實(shí)施例或包含硬件和軟件單元二者的實(shí)施例的 形式。在優(yōu)選實(shí)施例中,本發(fā)明用軟件實(shí)現(xiàn),所述軟件包括但不限于固件、 駐留軟件、微代碼等。此外,本發(fā)明可采用可從計(jì)算機(jī)可用或計(jì)算機(jī)可讀媒體訪(fǎng)問(wèn)的計(jì)算機(jī) 程序產(chǎn)品的形式,所述計(jì)算機(jī)可用或計(jì)算機(jī)可讀媒體提供用于由計(jì)算機(jī)或 任何指令執(zhí)行系統(tǒng)所使用或與其相結(jié)合使用的程序代碼。出于此描述的目 的,計(jì)算機(jī)可用或計(jì)算機(jī)可讀媒體可以是任何有形裝置,其可以包含、存 儲(chǔ)、傳送、傳播或傳輸用于由指令執(zhí)行系統(tǒng)、裝置或設(shè)備所使用或與其相 結(jié)合使用的程序。所述i某體可以是電、磁、光、電磁、紅外或半導(dǎo)體系統(tǒng)(或裝置或設(shè) 備)或傳播媒體。計(jì)算機(jī)可讀媒體的示例包括半導(dǎo)體或固態(tài)存儲(chǔ)器、磁帶、 可移除計(jì)算機(jī)盤(pán)、隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、硬 磁盤(pán)以及光盤(pán)。光盤(pán)的當(dāng)前示例包括只讀存儲(chǔ)器致密盤(pán)(CD-ROM)、讀 /寫(xiě)致密盤(pán)(CD-R/W)和DVD。適于存儲(chǔ)和/或執(zhí)行程序代碼的數(shù)據(jù)處理系統(tǒng)將包括通過(guò)系統(tǒng)總線(xiàn)直 接或間接耦合到存儲(chǔ)器單元的至少一個(gè)處理器。存儲(chǔ)器單元可包括在程序代碼實(shí)際執(zhí)行期間使用的本地存儲(chǔ)器、海量存儲(chǔ)裝置和高速緩沖存儲(chǔ)器, 高速緩沖存儲(chǔ)器提供至少某種程序代碼的臨時(shí)存儲(chǔ)以便減少在執(zhí)行期間必 須從海量存儲(chǔ)裝置檢索代碼的次數(shù)。輸入/輸出或1/0設(shè)備(包括但不限于鍵盤(pán)、顯示器、點(diǎn)擊設(shè)備等)可 直接地或通過(guò)中間I/O控制器被耦合于系統(tǒng)。網(wǎng)絡(luò)適配器也可耦合于系統(tǒng),以使得數(shù)據(jù)處理系統(tǒng)能夠通過(guò)中間的專(zhuān) 用或公用網(wǎng)絡(luò)耦合于其它數(shù)據(jù)處理系統(tǒng)或遠(yuǎn)程打印機(jī)或存儲(chǔ)設(shè)備。調(diào)制解 調(diào)器、線(xiàn)纜調(diào)制解調(diào)器和以太網(wǎng)卡僅是當(dāng)前可用類(lèi)型的網(wǎng)絡(luò)適配器的幾種。已經(jīng)出于說(shuō)明和描述的目的呈現(xiàn)了對(duì)本發(fā)明的描述,其并非意在將本 發(fā)明窮舉或限制于所公開(kāi)的形式。對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)說(shuō)許多修改 和變體將很明顯。所選擇和描述的實(shí)施例用來(lái)最好地解釋本發(fā)明的原理、 實(shí)踐應(yīng)用,以及4吏得本領(lǐng)域普通技術(shù)人員能夠理解本發(fā)明的具有適于預(yù)期 的特定使用的多種修改的多種實(shí)施例。
權(quán)利要求
1.一種用于在數(shù)據(jù)處理系統(tǒng)的邏輯分區(qū)之間交易資源的方法,其中所述系統(tǒng)的資源在各個(gè)分區(qū)之間選擇性地進(jìn)行分配,所述方法包括評(píng)估在特定時(shí)間資源到所述分區(qū)中的每個(gè)分區(qū)的分配,以便選擇具有至少一個(gè)資源的分區(qū),所述資源由于其相對(duì)于所述所選擇的分區(qū)的本地性級(jí)別而被認(rèn)為是低需要性的;標(biāo)識(shí)具有匹配于所述低需要性資源的資源的其它分區(qū)中的每個(gè)分區(qū);確定將通過(guò)把所述低需要性資源與所述所標(biāo)識(shí)的分區(qū)中的每個(gè)分區(qū)的匹配資源進(jìn)行交易而得到的所述系統(tǒng)的整體利益;以及在通過(guò)對(duì)于所述資源的重新分配將得到至少某種整體系統(tǒng)利益的情況下,重新分配所述資源,以把所述低需要性資源與所述所標(biāo)識(shí)的分區(qū)的匹配資源進(jìn)行交易,其中所述交易被確定為所述系統(tǒng)提供最大的整體利益。
2. 根據(jù)權(quán)利要求l所述的方法,其中將包括在所述級(jí)別范圍中的資源本地性級(jí)別分派給分區(qū)的每個(gè)資源, 其中所述范圍的一端指示出非常需要的資源本地性級(jí)別,以及所述范圍的 另 一端指示出不重要的資源本地性級(jí)別。
3. 根據(jù)權(quán)利要求l所述的方法,其中針對(duì)每個(gè)分區(qū)計(jì)算資源需要性因子,以表示被分配給所述分區(qū)的資源,分區(qū)。
4. 根據(jù)權(quán)利要求l所述的方法,其中向每個(gè)分區(qū)分派獲利和損失的值,以便建立閾值,以選擇性地限制資 源到所述分區(qū)之內(nèi)和之外的交換。
5. 根據(jù)權(quán)利要求l所述的方法,其中提供用于管理資源相對(duì)于所述分區(qū)的分配的實(shí)體,其中所述實(shí)體包含 與資源的需要性有關(guān)的策略。
6. 根據(jù)權(quán)利要求l所述的方法,其中向所述分配管理實(shí)體提供算法,所述算法用于定期評(píng)估資源到各個(gè)分 區(qū)的分配,以及用于確定所提出的重新分配是否將向所述已分區(qū)的系統(tǒng)提 供整體利益。
7. 根據(jù)權(quán)利要求6所述的方法,其中所述算法通過(guò)考慮所提出的交易的有益和有害影響而確定針對(duì)所提出 的資源在分區(qū)之間的交易對(duì)于所述系統(tǒng)的整體利益。
8. 根據(jù)權(quán)利要求l所述的方法,其中允許所述分區(qū)中的至少一個(gè)分區(qū)在任何時(shí)間參與與其它分區(qū)的資源交 易,以及僅當(dāng)資源分配出現(xiàn)時(shí)才允許所述分區(qū)中的至少另一個(gè)分區(qū)參與與 其它分區(qū)的資源交易。
9. 根據(jù)權(quán)利要求l所述的方法,其中所述分區(qū)中的每個(gè)分區(qū)具有與其所分配資源相關(guān)聯(lián)的資源需要性目 標(biāo),其中已達(dá)到其資源需要性目標(biāo)的分區(qū)不參與與其它分區(qū)的資源交易。
10. 根據(jù)權(quán)利要求l所述的方法,其中當(dāng)系統(tǒng)利用率超過(guò)預(yù)先^L定的利用率級(jí)別時(shí),所述分區(qū)中的至少 一個(gè) 分區(qū)將不參與與其它分區(qū)的資源交易。
11. 一種計(jì)算機(jī)系統(tǒng),包括用于實(shí)現(xiàn)權(quán)利要求1-10所述的任意方法的 裝置。
12. —種用于在數(shù)據(jù)處理系統(tǒng)的邏輯分區(qū)之間交易資源的裝置,其中 所述系統(tǒng)的資源在各個(gè)分區(qū)之間選擇性地進(jìn)行分配,所述裝置包括第一處理部件,用于評(píng)估在特定時(shí)間資源到所述分區(qū)中的每個(gè)分區(qū)的 分配,以便選擇具有至少一個(gè)資源的分區(qū),所述資源由于其相對(duì)于所述所 選擇的分區(qū)的本地性級(jí)別而被認(rèn)為是低需要性的;第二處理部件,用于標(biāo)識(shí)具有匹配于所述低需要性資源的資源的其它 分區(qū)中的每個(gè)分區(qū);第三處理部件,用于確定將通過(guò)把所述低需要性資源與所述所標(biāo)識(shí)的 分區(qū)中的每個(gè)分區(qū)的匹配資源進(jìn)行交易而得到的所迷系統(tǒng)的整體利益;以 及第四處理部件,用于在通過(guò)對(duì)于所述資源的重新分配將得到至少某種 整體系統(tǒng)利益的情況下,重新分配所述資源,以把所述低需要性資源與所 述所標(biāo)識(shí)的分區(qū)的匹配資源進(jìn)行交易,其中所述交易被確定為所述系統(tǒng)提 供最大的整體利益。
13. 根據(jù)權(quán)利要求12所述的裝置,其中提供用于管理資源相對(duì)于所述分區(qū)的分配的實(shí)體,其中向所述實(shí)體提 供算法,所述算法用于定期評(píng)估資源到各個(gè)分區(qū)的分配,以及用于確定所 提出的重新分配是否將向所述已分區(qū)的系統(tǒng)提供整體利益。
14. 根據(jù)權(quán)利要求13所述的裝置,其中所述算法通過(guò)考慮所提出的交易的有益和有害影響而確定針對(duì)所提出 的資源在分區(qū)之間的交易對(duì)于所述系統(tǒng)的整體利益。
15. 根據(jù)權(quán)利要求13所述的裝置,其中
全文摘要
提供了一種用于被配置為包括多個(gè)邏輯分區(qū)的數(shù)據(jù)處理系統(tǒng)的方法,其中所述系統(tǒng)的資源在各個(gè)分區(qū)之間選擇性地進(jìn)行分配。所述方法包括評(píng)估在特定時(shí)間資源到所述分區(qū)中的每個(gè)分區(qū)的分配,以便選擇具有至少一個(gè)資源的分區(qū),所述資源由于其相對(duì)于所選擇的分區(qū)的本地性級(jí)別而被認(rèn)為是低需要性的;標(biāo)識(shí)具有匹配于低需要性資源的資源的其它分區(qū)中的每個(gè)分區(qū);確定將通過(guò)把低需要性資源與所標(biāo)識(shí)的分區(qū)中的每個(gè)分區(qū)的匹配資源進(jìn)行交易而得到的系統(tǒng)的整體利益;以及在通過(guò)對(duì)于資源的重新分配將得到至少某種整體系統(tǒng)利益的情況下,重新分配資源,以把低需要性資源與所標(biāo)識(shí)的分區(qū)的匹配資源進(jìn)行交易,其中所述交易被確定為系統(tǒng)提供最大的整體利益。
文檔編號(hào)G06F9/46GK101221517SQ20081000203
公開(kāi)日2008年7月16日 申請(qǐng)日期2008年1月9日 優(yōu)先權(quán)日2007年1月10日
發(fā)明者A·鄧希, C·M·努內(nèi)茲, D·G·弗雷明, J·M·阿卡帕蒂 申請(qǐng)人:國(guó)際商業(yè)機(jī)器公司