国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種計算存儲融合的集群系統(tǒng)的制作方法

      文檔序號:7989043閱讀:147來源:國知局
      一種計算存儲融合的集群系統(tǒng)的制作方法
      【專利摘要】本發(fā)明實(shí)施例提供一種計算存儲融合的集群系統(tǒng),包括:資源服務(wù)器群,該資源服務(wù)器群包括至少兩個資源服務(wù)器,該資源服務(wù)器群中的每個資源服務(wù)器至少具有計算資源和存儲資源中的一種,并且該資源服務(wù)器群中的至少一個資源服務(wù)器具有計算資源和存儲資源,該存儲資源包括持久化磁盤以及和所述持久化磁盤對應(yīng)的緩存;存儲資源控制模塊,用于將所述資源服務(wù)器群中的存儲資源構(gòu)建成共享的存儲資源池,以提供存儲服務(wù),其中每個所述存儲資源池包括的存儲資源來自于所述資源服務(wù)器群中的至少兩個資源服務(wù)器。
      【專利說明】一種計算存儲融合的集群系統(tǒng)
      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及通信【技術(shù)領(lǐng)域】,尤其涉及一種計算存儲融合的集群系統(tǒng)。
      【背景技術(shù)】
      [0002]企業(yè)要進(jìn)行信息化,購買的信息技術(shù)(Information Technology,簡稱IT)基礎(chǔ)設(shè)施一般包括服務(wù)器設(shè)備、網(wǎng)絡(luò)設(shè)備和存儲設(shè)備三大部分,然后企業(yè)自己需要將這三部分搭建成一個網(wǎng)絡(luò),進(jìn)行各種配置,整個過程復(fù)雜,而且后續(xù)的擴(kuò)容等操作也復(fù)雜。虛擬化技術(shù)的成熟和云概念的出現(xiàn),促進(jìn)了一體機(jī)誕生。為減少組建網(wǎng)絡(luò)和后續(xù)維護(hù)IT設(shè)備的復(fù)雜性,主要IT設(shè)備廠家(例如IBM/DELL/HP/CISCO等)紛紛推出了“一體機(jī)”產(chǎn)品,即,在一個機(jī)架內(nèi)預(yù)集成服務(wù)器、存儲和網(wǎng)絡(luò)??蛻糍徺I了這種一體機(jī)后,無需進(jìn)行復(fù)雜的硬件安裝;更進(jìn)一步,無需進(jìn)行復(fù)雜的軟件安裝和配置,插上電以后,簡單的進(jìn)行配置(例如配置外網(wǎng)IP),就可以使用了(典型的一體機(jī)架構(gòu)示意圖如圖1所示)。
      [0003]從已經(jīng)存在的各種一體機(jī)來看,都有如下兩個共同的目標(biāo):(1)降低成本,保證優(yōu)于個人計算機(jī)(Personal Computer,簡稱PC)的性價比;(2)優(yōu)化架構(gòu),保證不差于PC的性能。為實(shí)現(xiàn)這兩個目標(biāo),高效使用存儲是個關(guān)鍵。
      [0004]—體機(jī)中的存儲設(shè)備,一般使用的是存儲區(qū)域網(wǎng)絡(luò)(Storage AreaNetwork,簡稱SAN)或網(wǎng)絡(luò)附加存儲(Network Attached Storage,簡稱NAS)等專用存儲設(shè)備。雖然,SAN或NAS等專用存儲設(shè)備作為獨(dú)立的設(shè)備已經(jīng)有很長時間了,但隨著云計算、一體機(jī)的出現(xiàn),在一體機(jī)中使用SAN或NAS專用存儲設(shè)備也暴露了其固有的缺點(diǎn):專用SAN或NAS需要進(jìn)行復(fù)雜配置,后續(xù)維護(hù)困難;專用SAN或NAS需要控制機(jī)頭,性價比不高,無法滿足用戶低成本要求;專用SAN或NAS受制于控制機(jī)頭,橫向擴(kuò)展受限,無法線性擴(kuò)展而滿足大量數(shù)據(jù)突發(fā)的查詢性能要求。這些缺點(diǎn)使得SAN或NAS設(shè)備成了一體機(jī)中的薄弱環(huán)節(jié)。

      【發(fā)明內(nèi)容】

      [0005]本發(fā)明實(shí)施例提供一種計算存儲融合的集群系統(tǒng),用以解決現(xiàn)有技術(shù)中因?yàn)槭褂脤S肧AN而導(dǎo)致的操作復(fù)雜、成本較高以及由于無法線性擴(kuò)展而不能滿足大量數(shù)據(jù)突發(fā)的查詢性能要求的問題。
      [0006]第一方面,本發(fā)明實(shí)施例提供一種計算存儲融合的集群系統(tǒng),包括:
      [0007]資源服務(wù)器群,所述資源服務(wù)器群包括至少兩個資源服務(wù)器,所述資源服務(wù)器群中的每個資源服務(wù)器至少具有計算資源和存儲資源中的一種,并且所述資源服務(wù)器群中的至少一個資源服務(wù)器具有計算資源和存儲資源,所述存儲資源包括持久化磁盤以及和所述持久化磁盤對應(yīng)的緩存;
      [0008]存儲資源控制模塊,用于將所述資源服務(wù)器群中的存儲資源構(gòu)建成共享的存儲資源池,以提供存儲服務(wù),其中每個所述存儲資源池包括的存儲資源來自于所述資源服務(wù)器群中的至少兩個資源服務(wù)器。
      [0009]結(jié)合第一方面,在第一方面的第一種可能的實(shí)現(xiàn)方式中,所述存儲資源控制模塊,包括:
      [0010]集群視圖管理子模塊,用于根據(jù)用戶預(yù)設(shè)的配置信息對所述資源服務(wù)器群中的持久化磁盤進(jìn)行邏輯劃分以得到邏輯分區(qū),所述每個邏輯分區(qū)都對應(yīng)所述持久化磁盤上固定數(shù)量的物理存儲資源塊。
      [0011]結(jié)合第一方面的第一種可能的實(shí)現(xiàn)方式,在第二種可能的實(shí)現(xiàn)方式中,所述存儲資源控制模塊,還包括數(shù)據(jù)子模塊,所述資源服務(wù)器群中的每個具有存儲資源的資源服務(wù)器都對應(yīng)一個所述數(shù)據(jù)子模塊;
      [0012]所述集群視圖管理子模塊,還用于為所述數(shù)據(jù)子模塊分配所述邏輯分區(qū)資源,建立所述數(shù)據(jù)子模塊的邏輯分區(qū)拓?fù)浣Y(jié)構(gòu),并根據(jù)所述數(shù)據(jù)子模塊的請求,將分配的邏輯分區(qū)信息分別發(fā)給對應(yīng)的所述數(shù)據(jù)子模塊。
      [0013]結(jié)合第一方面的第一種可能的實(shí)現(xiàn)方式以及第一方面的第二種可能的實(shí)現(xiàn)方式,在第三種可能的實(shí)現(xiàn)方式中,所述存儲資源控制模塊,還包括接口子模塊,所述資源服務(wù)器群中的每個資源服務(wù)器都對應(yīng)一個所述接口子模塊;
      [0014]所述接口子模塊,用于接收用戶發(fā)送的用戶卷創(chuàng)建請求,并根據(jù)所述用戶卷創(chuàng)建請求,在所述共享的存儲資源池中為需要創(chuàng)建的用戶卷分配與所述用戶卷創(chuàng)建請求相應(yīng)的物理存儲資源塊,所述物理存儲資源塊來自于不同的持久化磁盤。
      [0015]結(jié)合第一方面的第三種可能的實(shí)現(xiàn)方式,在第四種可能的實(shí)現(xiàn)方式中,所述接口子模塊,還用于接收用戶發(fā)送的讀/寫數(shù)據(jù)操作請求,根據(jù)所述讀/寫數(shù)據(jù)操作請求中包含的用戶卷標(biāo)識,計算出讀/寫數(shù)據(jù)操作對應(yīng)的物理存儲資源塊以及所述物理存儲資源塊所屬的邏輯分區(qū);根據(jù)計算出的所述物理存儲資源塊所屬的邏輯分區(qū)確定需要執(zhí)行讀/寫數(shù)據(jù)操作的數(shù)據(jù)子模塊;將所述讀/寫數(shù)據(jù)操作請求發(fā)送給所述需要執(zhí)行讀/寫數(shù)據(jù)操作的數(shù)據(jù)子模塊。
      [0016]結(jié)合第一方面的第四種可能的實(shí)現(xiàn)方式,在第五種可能的實(shí)現(xiàn)方式中,所述數(shù)據(jù)子模塊,用于根據(jù)所述接口子模塊發(fā)送的寫數(shù)據(jù)操作請求,通過所述數(shù)據(jù)子模塊對應(yīng)的資源服務(wù)器的緩存寫入數(shù)據(jù);或者,用于根據(jù)所述接口子模塊發(fā)送的讀數(shù)據(jù)操作請求,通過所述數(shù)據(jù)子模塊對應(yīng)的資源服務(wù)器的緩存讀取數(shù)據(jù)。
      [0017]結(jié)合第一方面的第五種可能的實(shí)現(xiàn)方式,在第六種可能的實(shí)現(xiàn)方式中,所述通過所述數(shù)據(jù)子模塊對應(yīng)的資源服務(wù)器的緩存寫入數(shù)據(jù),具體包括:所述數(shù)據(jù)子模塊先將數(shù)據(jù)寫入所述數(shù)據(jù)子模塊對應(yīng)的資源服務(wù)器的緩存中,再由所述緩存將數(shù)據(jù)寫入與所述用戶卷標(biāo)識對應(yīng)的物理存儲資源塊中。
      [0018]結(jié)合第一方面的第五種可能的實(shí)現(xiàn)方式,在第七種可能的實(shí)現(xiàn)方式中,所述通過所述數(shù)據(jù)子模塊對應(yīng)的資源服務(wù)器的緩存讀取數(shù)據(jù),具體包括:所述數(shù)據(jù)子模塊先從所述數(shù)據(jù)子模塊對應(yīng)的資源服務(wù)器的緩存中讀取請求的數(shù)據(jù),如果所述緩存中沒有所述請求的數(shù)據(jù),再從所述用戶卷標(biāo)識對應(yīng)的物理存儲資源塊中讀取所述請求的數(shù)據(jù),并將讀取到的所述請求的數(shù)據(jù)寫入緩存中。
      [0019]結(jié)合第一方面的第二種可能的實(shí)現(xiàn)方式,在第八種可能的實(shí)現(xiàn)方式中,如果所述集群系統(tǒng)增加或者刪除具有存儲資源的資源服務(wù)器,所述集群視圖管理子模塊,還用于根據(jù)預(yù)設(shè)的邏輯分區(qū)分配算法重新生成所述數(shù)據(jù)子模塊的邏輯分區(qū)拓?fù)浣Y(jié)構(gòu),將新的邏輯分區(qū)拓?fù)浣Y(jié)構(gòu)廣播給所述集群系統(tǒng)中所有的接口子模塊和數(shù)據(jù)子模塊,并通知原有的數(shù)據(jù)子模塊基于所述新的邏輯分區(qū)拓?fù)浣Y(jié)構(gòu)發(fā)起數(shù)據(jù)遷移。
      [0020]結(jié)合第一方面的第八種可能的實(shí)現(xiàn)方式,在第九種可能的實(shí)現(xiàn)方式中,如果所述集群系統(tǒng)刪除具有存儲資源的資源服務(wù)器,所述集群視圖管理子模塊,還用于在所述數(shù)據(jù)子模塊完成數(shù)據(jù)遷移后,將所述被刪除的資源服務(wù)器設(shè)置為不可用狀態(tài)。
      [0021]結(jié)合第一方面的第三種可能的實(shí)現(xiàn)方式以及第一方面的第四種可能的實(shí)現(xiàn)方式,在第十種可能的實(shí)現(xiàn)方式中,所述接口子模塊的接口符合小型計算機(jī)系統(tǒng)接口協(xié)議。
      [0022]結(jié)合第一方面,在第十一種可能的實(shí)現(xiàn)方式中,所述存儲資源控制模塊,還用于將所述具有存儲資源的資源服務(wù)器的單個持久化磁盤作為獨(dú)立節(jié)點(diǎn),構(gòu)建所述共享的存儲資源池。
      [0023]結(jié)合第一方面,以及第一方面的任意一種可能的實(shí)現(xiàn)方式,在第十二種可能的實(shí)現(xiàn)方式中,所述存儲資源控制模塊,還用于通過分布式算法構(gòu)建并管理所述共享的存儲資源池。
      [0024]結(jié)合第一方面,以及第一方面的任意一種可能的實(shí)現(xiàn)方式,在第十三種可能的實(shí)現(xiàn)方式中,所述集群系統(tǒng)中的資源服務(wù)器之間通過高速數(shù)據(jù)交換網(wǎng)絡(luò)進(jìn)行通信。
      [0025]結(jié)合第一方面的第十三種可能的實(shí)現(xiàn)方式,在第十四種可能的實(shí)現(xiàn)方式中,所述高速交換網(wǎng)絡(luò)包括高速外設(shè)組件互連標(biāo)準(zhǔn)PC1-E網(wǎng)絡(luò)或光纖網(wǎng)絡(luò)。
      [0026]由上述技術(shù)方案可知,通過本發(fā)明實(shí)施例提供計算存儲融合的集群系統(tǒng),由于不存在專用的SAN,省略了對SAN存儲系統(tǒng)的復(fù)雜管理,在硬件上解決了現(xiàn)有技術(shù)中因?yàn)槭褂脤S肧AN而導(dǎo)致的操作復(fù)雜、成本較高的問題;存儲設(shè)備可以有多個,每個存儲設(shè)備上都可以部署緩存,在硬件上極大的提升了存儲端緩存的擴(kuò)展能力;存儲資源不依賴于計算資源,存儲資源可以獨(dú)立的增加和減少,增強(qiáng)了系統(tǒng)的可擴(kuò)展性;將系統(tǒng)中的持久化磁盤、緩存資源虛擬化為共享資源池并被所有計算共享,數(shù)據(jù)讀寫時所有計算和存儲都可以參與,通過并發(fā)性的提高而提升了系統(tǒng)的存儲性能。另外,由于本發(fā)明實(shí)施例提供計算存儲融合的集群系統(tǒng)采用高速數(shù)據(jù)交換網(wǎng)絡(luò)進(jìn)行通信,進(jìn)一步加快了數(shù)據(jù)的交換速度。
      【專利附圖】

      【附圖說明】
      [0027]為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實(shí)施例。
      [0028]圖1為現(xiàn)有技術(shù)中典型的一體機(jī)架構(gòu)示意圖;
      [0029]圖2為本發(fā)明一實(shí)施例提供的計算存儲融合的集群系統(tǒng)的示意性框圖;
      [0030]圖3為本發(fā)明一實(shí)施例提供的計算存儲融合的集群系統(tǒng)的結(jié)構(gòu)示意圖;
      [0031]圖4為本發(fā)明一實(shí)施例提供的磁盤分區(qū)和用戶卷構(gòu)成示意圖;
      [0032]圖5為本發(fā)明一實(shí)施例提供的計算存儲融合的集群系統(tǒng)中的存儲資源控制模塊的結(jié)構(gòu)不意圖;
      [0033]圖6為本發(fā)明一實(shí)施例提供的MDC模塊為OSD節(jié)點(diǎn)分配分區(qū)資源的拓?fù)涫疽鈭D?!揪唧w實(shí)施方式】
      [0034]為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。
      [0035]另外,本文中術(shù)語“和/或”,僅僅是一種描述關(guān)聯(lián)對象的關(guān)聯(lián)關(guān)系,表示可以存在三種關(guān)系,例如,A和/或B,可以表示:單獨(dú)存在A,同時存在A和B,單獨(dú)存在B這三種情況。另外,本文中字符“/”,一般表示前后關(guān)聯(lián)對象是一種“或”的關(guān)系。
      [0036]本發(fā)明實(shí)施例提供的技術(shù)方案將計算資源與存儲資源垂直整合,將一個集群系統(tǒng)中資源服務(wù)器的存儲資源整合起來,通過存儲資源控制模塊,使用分布式算法,將各個資源服務(wù)器中的存儲資源(持久化存儲資源、緩存資源)虛擬化為資源池,供所有資源服務(wù)器的計算共享使用。資源服務(wù)器之間通過高速數(shù)據(jù)交換網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)通信。
      [0037]圖2示出了根據(jù)本發(fā)明實(shí)施例的計算存儲融合的集群系統(tǒng)100的示意性框圖。如圖1所示,該計算存儲融合的集群系統(tǒng)100包括:
      [0038]資源服務(wù)器群110,該資源服務(wù)器群包括至少兩個資源服務(wù)器,該資源服務(wù)器群中的每個資源服務(wù)器至少具有計算資源和存儲資源中的一種,并且該資源服務(wù)器群中的至少一個資源服務(wù)器具有計算資源和存儲資源,所述存儲資源包括持久化磁盤以及和所述持久化磁盤對應(yīng)的緩存;
      [0039]存儲資源控制模塊120,用于將所述資源服務(wù)器群中的存儲資源構(gòu)建成共享的存儲資源池,以提供存儲服務(wù),其中每個所述存儲資源池包括的存儲資源來自于所述資源服務(wù)器群中的至少兩個資源服務(wù)器。
      [0040]在本發(fā)明實(shí)施例中,計算存儲融合的集群系統(tǒng)中提供計算資源和存儲資源的設(shè)備來自于資源服務(wù)器群,該資源服務(wù)器群由兩個或兩個以上的資源服務(wù)器組成,每個資源服務(wù)器能夠提供計算資源和/或存儲資源,并且至少有一個資源服務(wù)器能夠同時提供計算資源和存儲資源;計算存儲融合的集群系統(tǒng)中的存儲資源控制模塊通過對共享的一個或多個存儲資源池進(jìn)行管理,從而提供虛擬存儲服務(wù),該共享的存儲資源池由該資源服務(wù)器群中的存儲資源構(gòu)建成,并且每個存儲資源池包括的存儲資源來自于該資源服務(wù)器群中的兩個或兩個以上的資源服務(wù)器。
      [0041]在本發(fā)明實(shí)施例中,由于資源服務(wù)器群中的每個資源服務(wù)器具有計算資源和存儲資源中的至少一種資源,并且該資源服務(wù)器群中的至少一個資源服務(wù)器具有計算資源和存儲資源,即系統(tǒng)的存儲資源和計算資源聯(lián)合部署,因此能夠節(jié)省設(shè)備投入成本、設(shè)備占用空間成本以及設(shè)備能源消耗成本;并且由于存儲資源池由資源服務(wù)器群中的至少兩個資源服務(wù)器的存儲資源構(gòu)成,因此能夠均衡各資源服務(wù)器的存儲資源,提高存儲資源的利用效率和可靠性。
      [0042]因此,本發(fā)明實(shí)施例提供的計算存儲融合的集群系統(tǒng),由于不存在專用的SAN,省略了對SAN存儲系統(tǒng)的復(fù)雜管理,在硬件上解決了現(xiàn)有技術(shù)中因?yàn)槭褂脤S肧AN而導(dǎo)致的操作復(fù)雜、成本較高的問題;又由于存儲設(shè)備可以有多個,每個存儲設(shè)備上都包括持久化磁盤和緩存,在硬件上極大的提升了存儲端緩存的擴(kuò)展能力;存儲資源不依賴于計算資源,存儲資源可以獨(dú)立的增加和減少,增強(qiáng)了系統(tǒng)的可擴(kuò)展性;將系統(tǒng)中的持久化磁盤、緩存資源虛擬化為共享資源池并被所有計算共享,數(shù)據(jù)讀寫時所有計算和存儲都可以參與,通過并發(fā)性的提高而顯著提升了系統(tǒng)的存儲性能。
      [0043]在本發(fā)明實(shí)施例中,存儲資源控制模塊可以部署在資源服務(wù)器上,也可以單獨(dú)部署。
      [0044]在本發(fā)明實(shí)施例中,可選地,該存儲資源控制模塊120還用于通過分布式算法創(chuàng)建并管理該存儲資源池。例如,存儲資源控制模塊通過分布式哈希表(Distributed HashTable,簡稱為“DHT”)方法、偽隨機(jī)算法等分布式算法,創(chuàng)建并管理存儲資源池,使得系統(tǒng)能夠提供統(tǒng)一共享的存儲服務(wù)。
      [0045]可選的,所述存儲資源控制模塊120還可以將所述具有存儲資源的資源服務(wù)器的單個持久化磁盤作為獨(dú)立節(jié)點(diǎn),構(gòu)建所述共享的存儲資源池。
      [0046]在本發(fā)明實(shí)施例中,計算資源和存儲資源采用統(tǒng)一的硬件服務(wù)器架構(gòu),合一部署,從而能夠充分地利用物理服務(wù)器的計算能力和存儲能力。即系統(tǒng)包括的每個資源服務(wù)器可同時提供計算資源和/或存儲資源。在部署形態(tài)上,提供存儲資源和/或計算資源的資源服務(wù)器,在物理部署形態(tài)上為同一物理設(shè)備,即存儲資源和計算資源合一部署在一臺服務(wù)器上,而計算資源和存儲資源在邏輯上相互獨(dú)立,可以分別構(gòu)建自己的資源池。
      [0047]進(jìn)一步,為了使計算和存儲深度融合,本發(fā)明實(shí)施例提供的計算存儲融合的集群系統(tǒng)可以采用純高速外設(shè)組件互連標(biāo)準(zhǔn)(Peripheral Component InterconnectionExpress,簡稱PC1-E)交換架構(gòu)?;谠揚(yáng)C1-E交換架構(gòu),包括計算、存儲所有的資源服務(wù)器都可以通過PC1-E接口直接互連進(jìn)行無阻塞交換,使集群系統(tǒng)中的計算和存儲之間的通道更快速。
      [0048]具體地,由于本發(fā)明實(shí)施例提供的計算存儲融合的集群系統(tǒng)的各部分都可以采用純PC1-E交換,不管是計算設(shè)備、存儲設(shè)備,還是直接的磁盤組,所有的單元都可以直接掛接到PC1-E交換網(wǎng)絡(luò)下,無需進(jìn)行不同協(xié)議之間的適配,因而進(jìn)一步加快了數(shù)據(jù)的交換速度。
      [0049]應(yīng)理解,上述PC1-E網(wǎng)絡(luò)只是本發(fā)明實(shí)施例采用的高速數(shù)據(jù)交換網(wǎng)絡(luò)的一種可能實(shí)現(xiàn)方式,本發(fā)明實(shí)施例并不對此進(jìn)行限定。例如,實(shí)際應(yīng)用中,也可以使用光纖網(wǎng)絡(luò)作為該集群系統(tǒng)的高速數(shù)據(jù)交換網(wǎng)絡(luò)。
      [0050]圖3為本發(fā)明一實(shí)施例提供的計算存儲融合的集群系統(tǒng)的結(jié)構(gòu)示意圖。如圖3所示,本實(shí)施例的計算存儲融合的集群系統(tǒng)由高速數(shù)據(jù)交換網(wǎng)絡(luò)、資源服務(wù)器群以及存儲資源控制模塊組成,該資源服務(wù)器群包括三個資源服務(wù)器,即資源服務(wù)器1、資源服務(wù)器2和資源服務(wù)器3。其中,資源服務(wù)器I只具有計算資源,資源服務(wù)器2只具有存儲資源,資源服務(wù)器3既具有計算資源又具有存儲資源。資源服務(wù)器2和資源服務(wù)器3的存儲資源被構(gòu)建成統(tǒng)一的共享存儲資源池,該共享存儲資源池包括共享的緩存資源和共享的持久化磁盤。
      [0051]需要說明的是:圖3僅僅為該計算存儲融合的集群系統(tǒng)部署的一種示例,實(shí)際應(yīng)用中,既可以部署更多的資源服務(wù)器,也可以在每個資源服務(wù)器上同時部署計算資源和存儲資源。持久化磁盤可以為硬盤驅(qū)動器(Hard Disk Driver,簡稱HDD)或者固態(tài)硬盤(SolidState Disk,簡稱 SSD)。
      [0052]通過這種計算存儲融合的集群系統(tǒng),可以帶來以下好處:存儲設(shè)備可以有多個,每個存儲設(shè)備上都可以部署緩存,在硬件上極大的提升了存儲端緩存的擴(kuò)展能力;存儲資源不依賴于計算資源,存儲資源可以獨(dú)立的增加和減少,增強(qiáng)了系統(tǒng)的可擴(kuò)展性。
      [0053]進(jìn)一步,基于圖3所示的計算存儲融合的集群系統(tǒng)架構(gòu),由于去掉了專用SANJf存儲資源分散到了各個資源服務(wù)器上,需要通過存儲資源控制模塊對這些分散的存儲資源進(jìn)行統(tǒng)一的管理。具體包括:
      [0054](I)集群系統(tǒng)初始化時,將系統(tǒng)中的磁盤按照固定大小塊Block (例如1M)進(jìn)行劃分(如圖4中對每個DISK的劃分);
      [0055](2)通過存儲資源控制模塊將一定數(shù)量的Block組成一個分區(qū)(Partition,簡稱為PT,參見圖4中標(biāo)有P的方塊),如圖4所示,每個分區(qū)由4個Block組成,該分區(qū)為邏輯分區(qū),對用戶而言是不可見的;
      [0056](3)當(dāng)用戶創(chuàng)建卷(Volume)時,資源存儲控制模塊負(fù)責(zé)指定所屬該卷的Block,如圖 4 不例:Block2、Block4、Block5、Block7 屬于 Volumel,Block6、Block8、Block9、Blockl2屬于 Volume2,Blockll、Blockl3、Blockl4、Blockl6 屬于 Volume3,卷對用戶而言是可見的;
      [0057](4)用戶對卷進(jìn)行數(shù)據(jù)讀寫時,資源存儲控制模塊根據(jù)自身的算法,計算出所要讀寫操作的Block,并根據(jù)某種算法(如Hash算法)計算出每個Block所對應(yīng)的Partition,通過Partition完成對數(shù)據(jù)的讀寫操作。
      [0058]這樣,對于一個用戶卷來說,其實(shí)際的存儲物理資源是分布在很多磁盤上的。這樣就達(dá)到了將不同的磁盤資源共享給一個用戶卷,供用戶使用,即達(dá)到存儲資源共享使用的目的。當(dāng)用戶對卷進(jìn)行數(shù)據(jù)讀寫時,讀寫請求經(jīng)過存儲資源控制模塊的處理后,將轉(zhuǎn)換為對卷中不同Partition進(jìn)行分布式讀寫。
      [0059]需要說明的是:在集群系統(tǒng)啟動前,用戶會根據(jù)自身的需要制作集群系統(tǒng)的配置文件,該配置文件規(guī)劃了集群系統(tǒng)中存儲資源控制模塊的部署、集群系統(tǒng)的分區(qū)規(guī)格(如Partition個數(shù))以及不同資源服務(wù)器間的互相通信地址等信息。
      [0060]如圖5所示,為了實(shí)現(xiàn)上述功能,所述存儲資源控制模塊包括:
      [0061]集群視圖管理子模塊,用于根據(jù)用戶預(yù)設(shè)的配置信息對所述資源服務(wù)器群中的持久化磁盤進(jìn)行邏輯劃分以得到邏輯分區(qū),所述每個邏輯分區(qū)都對應(yīng)所述持久化磁盤上固定數(shù)量的物理存儲資源塊。
      [0062]進(jìn)一步的,所述存儲資源控制模塊,還包括數(shù)據(jù)子模塊,所述資源服務(wù)器群中的每個具有存儲資源的資源服務(wù)器都對應(yīng)一個所述數(shù)據(jù)子模塊;
      [0063]應(yīng)理解,在實(shí)際應(yīng)用中,可以在每一個具有存儲資源的資源服務(wù)器上部署所述數(shù)據(jù)子模塊。
      [0064]相應(yīng)的,所述集群視圖管理子模塊,還用于為所述數(shù)據(jù)子模塊分配所述邏輯分區(qū)資源,建立所述數(shù)據(jù)子模塊的邏輯分區(qū)拓?fù)浣Y(jié)構(gòu),并根據(jù)所述數(shù)據(jù)子模塊的請求,將分配的邏輯分區(qū)信息分別發(fā)給對應(yīng)的所述數(shù)據(jù)子模塊。
      [0065]進(jìn)一步的,所述存儲資源控制模塊,還包括接口子模塊,所述資源服務(wù)器群中的每個資源服務(wù)器都對應(yīng)一個所述接口子模塊;
      [0066]應(yīng)理解,在實(shí)際應(yīng)用中,可以在每一個資源服務(wù)器上部署所述接口子模塊。其中,所述接口子模塊可以采用符合小型計算機(jī)系統(tǒng)接口協(xié)議的接口。
      [0067]所述接口子模塊,用于接收用戶發(fā)送的用戶卷創(chuàng)建請求,并根據(jù)所述用戶卷創(chuàng)建請求,在所述共享的存儲資源池中為需要創(chuàng)建的用戶卷分配與所述用戶卷創(chuàng)建請求相應(yīng)的物理存儲資源塊,所述物理存儲資源塊來自于不同的持久化磁盤。
      [0068]進(jìn)一步的,所述接口子模塊,還用于接收用戶發(fā)送的讀/寫數(shù)據(jù)操作請求,根據(jù)所述讀/寫數(shù)據(jù)操作請求中包含的用戶卷標(biāo)識,計算出讀/寫數(shù)據(jù)操作對應(yīng)的物理存儲資源塊以及所述物理存儲資源塊所屬的邏輯分區(qū);根據(jù)計算出的所述物理存儲資源塊所屬的邏輯分區(qū)確定需要執(zhí)行讀/寫數(shù)據(jù)操作的數(shù)據(jù)子模塊;將所述讀/寫數(shù)據(jù)操作請求發(fā)送給所述需要執(zhí)行讀/寫數(shù)據(jù)操作的數(shù)據(jù)子模塊。
      [0069]相應(yīng)的,所述數(shù)據(jù)子模塊,用于根據(jù)所述接口子模塊發(fā)送的寫數(shù)據(jù)操作請求,通過所述數(shù)據(jù)子模塊對應(yīng)的資源服務(wù)器的緩存寫入數(shù)據(jù);或者,用于根據(jù)所述接口子模塊發(fā)送的讀數(shù)據(jù)操作請求,通過所述數(shù)據(jù)子模塊對應(yīng)的資源服務(wù)器的緩存讀取數(shù)據(jù)。
      [0070]具體地,所述通過所述數(shù)據(jù)子模塊對應(yīng)的資源服務(wù)器的緩存寫入數(shù)據(jù),包括:
      [0071]所述數(shù)據(jù)子模塊先將數(shù)據(jù)寫入所述數(shù)據(jù)子模塊對應(yīng)的資源服務(wù)器的緩存中,再由所述緩存將數(shù)據(jù)寫入與所述用戶卷標(biāo)識對應(yīng)的物理存儲資源塊中。
      [0072]具體地,所述通過所述數(shù)據(jù)子模塊對應(yīng)的資源服務(wù)器的緩存讀取數(shù)據(jù),包括:
      [0073]所述數(shù)據(jù)子模塊先從所述數(shù)據(jù)子模塊對應(yīng)的資源服務(wù)器的緩存中讀取請求的數(shù)據(jù),如果所述緩存中沒有所述請求的數(shù)據(jù),再從所述用戶卷標(biāo)識對應(yīng)的物理存儲資源塊中讀取所述請求的數(shù)據(jù),并將讀取到的所述請求的數(shù)據(jù)寫入緩存中。
      [0074]可選的,如果所述集群系統(tǒng)增加或者刪除具有存儲資源的資源服務(wù)器,所述集群視圖管理子模塊,還用于根據(jù)預(yù)設(shè)的邏輯分區(qū)分配算法重新生成所述數(shù)據(jù)子模塊的邏輯分區(qū)拓?fù)浣Y(jié)構(gòu),將新的邏輯分區(qū)拓?fù)浣Y(jié)構(gòu)廣播給所述集群系統(tǒng)中所有的接口子模塊和數(shù)據(jù)子模塊,并通知原有的數(shù)據(jù)子模塊基于所述新的邏輯分區(qū)拓?fù)浣Y(jié)構(gòu)發(fā)起數(shù)據(jù)遷移。
      [0075]如果所述集群系統(tǒng)刪除具有存儲資源的資源服務(wù)器,所述集群視圖管理子模塊,還用于在所述數(shù)據(jù)子模塊完成數(shù)據(jù)遷移后,將所述被刪除的資源服務(wù)器設(shè)置為不可用狀態(tài)。
      [0076]基于本發(fā)明實(shí)施例提供計算存儲融合的集群系統(tǒng),由于不存在專用的SAN,省略了對SAN存儲系統(tǒng)的復(fù)雜管理,在硬件上解決了現(xiàn)有技術(shù)中因?yàn)槭褂脤S肧AN而導(dǎo)致的操作復(fù)雜、成本較高的問題;存儲節(jié)點(diǎn)可以有多個,每個存儲節(jié)點(diǎn)上都可以部署Cache,在硬件上極大的提升了存儲端Cache的擴(kuò)展能力;存儲節(jié)點(diǎn)不依賴于計算節(jié)點(diǎn),存儲節(jié)點(diǎn)可以獨(dú)立的增加和減少,增強(qiáng)了系統(tǒng)的可擴(kuò)展性。另外,由于本發(fā)明實(shí)施例提供的一體機(jī)系統(tǒng)的各部分都是采用純PC1-E交換,不管是計算節(jié)點(diǎn)、存儲節(jié)點(diǎn),還是直接的磁盤組,所有的單元都是直接掛接到PC1-E交換下,因而無需進(jìn)行不同協(xié)議之間的適配,進(jìn)一步加快了數(shù)據(jù)的交換速度。
      [0077]作為本發(fā)明實(shí)施例提供的計算存儲融合的集群系統(tǒng)的一種具體應(yīng)用,所述系統(tǒng)中的存儲資源控制模塊的功能可以通過一種分布式存儲控制軟件實(shí)現(xiàn)。
      [0078]為了更清楚地理解本發(fā)明實(shí)施例的技術(shù)方案,下面將以該分布式存儲控制軟件為例對本發(fā)明實(shí)施例的技術(shù)方案做進(jìn)一步的說明。
      [0079]具體地,該分布式存儲控制軟件主要包括三個功能模塊:Meta Data Controller(簡稱MDC)模塊,Virtualization Block Service(簡稱VBS)模塊和Object Storage Device(簡稱OSD)模塊。其中:
      [0080]MDC模塊,主要用于實(shí)現(xiàn)分布式集群系統(tǒng)的狀態(tài)視圖控制,以及當(dāng)資源服務(wù)器加入、退出集群系統(tǒng)時進(jìn)行的輸入/輸出(Input/Output,簡稱1/0)視圖、分區(qū)分配視圖、節(jié)點(diǎn)視圖的更新;同時,還對數(shù)據(jù)分布式規(guī)則和數(shù)據(jù)重建規(guī)則進(jìn)行控制;
      [0081]VBS模塊,主要用于實(shí)現(xiàn)基于小型計算機(jī)系統(tǒng)接口(Small Computer SystemInterface,簡稱SCSI)的塊設(shè)備的訪問接口,同時完成塊存儲元數(shù)據(jù)的保存和訪問邏輯;另外,VBS模塊還接受MDC模塊下發(fā)的I/O視圖,然后根據(jù)視圖規(guī)則,將數(shù)據(jù)轉(zhuǎn)發(fā)到相應(yīng)的OSD節(jié)點(diǎn)(B卩,部署了 OSD模塊的資源服務(wù)器)上,其中,I/O視圖可以由MDC模塊主動下發(fā)給VBS模塊,也可以由VBS模塊主動從MDC模塊上獲??;
      [0082]OSD模塊,主要用于實(shí)現(xiàn)讀寫緩存功能,以及數(shù)據(jù)的一致性備份,組織磁盤數(shù)據(jù)訪問等;另外,OSD模塊主要接受MDC模塊下發(fā)的OSD視圖,然后接受VBS模塊的讀寫命令,完成數(shù)據(jù)的存放與獲取。
      [0083]在實(shí)際應(yīng)用中,上述MDC模塊可以只部署在集群系統(tǒng)的兩個(一主一備)或三個(一主兩備)資源服務(wù)器上,VBS模塊部署在集群系統(tǒng)中的每個資源服務(wù)器上,作為驅(qū)動;0SD模塊部署在集群系統(tǒng)中的每個具有存儲資源的資源服務(wù)器上,用于控制本地存儲資源。具體的部署方式可以依據(jù)用戶提供的配置文件執(zhí)行,該配置文件中包括上述功能模塊的部署、集群系統(tǒng)的分區(qū)規(guī)格(即,把每個硬盤分為多少份)以及不同資源服務(wù)器間的互相通信地址信息(包括MDC模塊、VBS模塊和OSD模塊的地址信息)等。
      [0084]當(dāng)系統(tǒng)啟動后,用戶通過系統(tǒng)的管理端將配置信息導(dǎo)入系統(tǒng),MDC模塊根據(jù)導(dǎo)入的配置信息建立系統(tǒng)的分區(qū)信息,然后根據(jù)系統(tǒng)下發(fā)的添加OSD節(jié)點(diǎn)請求建立邏輯OSD節(jié)點(diǎn)(是真實(shí)OSD節(jié)點(diǎn)在MDC模塊側(cè)的映射),并且為每個OSD節(jié)點(diǎn)分配分區(qū)等資源(即,每個資源服務(wù)器上的OSD模塊對應(yīng)的分區(qū)信息)。如圖6所示,為MDC模塊為OSD節(jié)點(diǎn)分配分區(qū)資源的拓?fù)涫疽鈭D。當(dāng)資源服務(wù)器上的OSD模塊被激活后,所述OSD模塊向MDC模塊請求分區(qū)信息,根據(jù)該請求,MDC模塊將已經(jīng)分配好的分區(qū)資源信息發(fā)送給對應(yīng)的OSD模塊。
      [0085]當(dāng)系統(tǒng)中的VBS模塊也被激活時,系統(tǒng)中的MDC模塊、VBS模塊和OSD模塊就都處于激活狀態(tài)了,并彼此之間建立了連接。同時,MDC模塊也建立了全局的分區(qū)信息,以及完成了對每個OSD節(jié)點(diǎn)的分區(qū)資源分配和同步。
      [0086]當(dāng)系統(tǒng)完成初始化進(jìn)程后,VBS模塊會根據(jù)用戶發(fā)起的創(chuàng)建用戶卷命令創(chuàng)建一個用戶卷,該用戶卷包含卷ID信息、卷大小以及確定了哪些Block構(gòu)成該用戶卷,其中,不同的Block可能屬于同一個分區(qū),也可能屬于不同的分區(qū)。
      [0087]因此,對于一個用戶卷來說,其實(shí)際的存儲物理資源是分布在很多磁盤上的。這樣就達(dá)到了將不同的磁盤資源共享給一個用戶卷,供用戶使用,即達(dá)到存儲資源共享使用的目的。
      [0088]可選的,當(dāng)本發(fā)明實(shí)施例提供的集群系統(tǒng)需要增加資源服務(wù)器時,用戶通過系統(tǒng)的管理端進(jìn)行操作,將添加資源服務(wù)器的消息發(fā)給系統(tǒng)中的MDC模塊(為系統(tǒng)中的主MDC模塊);所述MDC模塊根據(jù)接收到的消息對新增的資源服務(wù)器進(jìn)行參數(shù)校驗(yàn),包括拓?fù)浣Y(jié)果、IP地址等;校驗(yàn)正確后,MDC模塊再進(jìn)行(I)拓?fù)浣Y(jié)構(gòu)計算,將新增的資源服務(wù)器加入到OSD視圖的拓?fù)浣Y(jié)構(gòu)圖中,以及(2)分區(qū)結(jié)構(gòu)計算,根據(jù)分區(qū)分配算法重新生成新的分區(qū)視圖;完成上述計算后,MDC模塊將新的分區(qū)視圖信息廣播給系統(tǒng)中所有的VBS模塊和OSD模塊;隨后,MDC模塊通知系統(tǒng)中的原有OSD模塊發(fā)起數(shù)據(jù)遷移過程(根據(jù)新的分區(qū)拓?fù)浣Y(jié)構(gòu),將原OSD節(jié)點(diǎn)下的數(shù)據(jù)遷移到新加入的節(jié)點(diǎn))。
      [0089]可選的,當(dāng)本發(fā)明實(shí)施例提供的集群系統(tǒng)需要刪除資源服務(wù)器時,類似與上述增加資源服務(wù)器的流程,也是由用戶通過系統(tǒng)的管理端進(jìn)行操作,MDC模塊收到消息后重新進(jìn)行分區(qū)計算,計算后再通知系統(tǒng)中各個OSD模塊和VBS模塊,然后再通知OSD模塊發(fā)起數(shù)據(jù)遷移。
      [0090]與增加資源服務(wù)器不同的是:在刪除資源服務(wù)器的流程中,當(dāng)數(shù)據(jù)遷移完成后,MDC模塊將被刪除的資源服務(wù)器設(shè)置為不可用狀態(tài)。之后,用戶才可以將該被刪除的資源服務(wù)器撤離集群系統(tǒng)。
      [0091]在本發(fā)明實(shí)施例提供的計算存儲融合的集群系統(tǒng)中,在資源服務(wù)器增刪的過程中,MDC模塊根據(jù)節(jié)點(diǎn)的變化情況進(jìn)行分區(qū)的分配計算并將變化情況通知到各個OSD模塊和VBS模塊。
      [0092]下面,我們以客戶端用戶發(fā)起對資源服務(wù)器2中的卷進(jìn)行寫數(shù)據(jù)操作請求為例,來說明在本發(fā)明實(shí)施例提供的計算存儲融合的集群系統(tǒng)中,用戶是如何在寫數(shù)據(jù)過程中,實(shí)現(xiàn)對存儲資源的共享使用的。
      [0093]首先,該寫數(shù)據(jù)操作請求經(jīng)過資源服務(wù)器2中對應(yīng)的應(yīng)用程序處理后,以標(biāo)準(zhǔn)的數(shù)據(jù)訪問接口(可以是文件接口,也可以是塊接口)要求寫數(shù)據(jù),并將該寫數(shù)據(jù)操作請求發(fā)送給資源服務(wù)器2中的VBS模塊;
      [0094]其次,VBS模塊根據(jù)自身的算法(如DHT等分布式算法)分析計算出需要寫數(shù)據(jù)的邏輯OSD節(jié)點(diǎn)(包括計算出需要寫入數(shù)據(jù)的Block,以及所述Block所屬的分區(qū)),VBS模塊通過自身算法,將需要寫入的數(shù)據(jù)進(jìn)行拆分(通過算法盡量均衡拆分),分別向邏輯OSD節(jié)點(diǎn)對應(yīng)的資源服務(wù)器中的OSD模塊發(fā)送寫數(shù)據(jù)操作請求;
      [0095]例如,VBS模塊通過計算分析出需要寫入數(shù)據(jù)的Block分別屬于分區(qū)P6和P7,而P6和P7分別歸屬資源服務(wù)器2中的OSD節(jié)點(diǎn)和資源服務(wù)器3中的OSD節(jié)點(diǎn),VBS模塊通過自身算法,將需要寫入的數(shù)據(jù)進(jìn)行拆分(通過算法盡量均衡拆分),分別向資源服務(wù)器2中的OSD模塊和資源服務(wù)器3中的OSD模塊發(fā)送寫數(shù)據(jù)操作請求。
      [0096]再次,資源服務(wù)器2中的OSD模塊和資源服務(wù)器3中的OSD模塊接收到寫數(shù)據(jù)操作請求后,分別將數(shù)據(jù)寫入本資源服務(wù)器的緩存中,后續(xù)再分別由資源服務(wù)器2的緩存和資源服務(wù)器3的緩存寫入各自持久化磁盤的指定物理空間中;
      [0097]最后,為了保證寫數(shù)據(jù)的可靠性,資源服務(wù)器2的緩存和資源服務(wù)器3的緩存再分別將數(shù)據(jù)寫入到本資源服務(wù)器的持久化磁盤的其他空閑物理空間中,從而完成數(shù)據(jù)寫入流程。
      [0098]需要說明的是:最后一步可以由緩存異步并行執(zhí)行。
      [0099]這樣,一個數(shù)據(jù)寫入請求,經(jīng)過上述步驟處理后,達(dá)到了分布式并行寫入不同資源服務(wù)器的緩存中,再由各資源服務(wù)器的緩存寫入本地的持久化磁盤中,提高了寫數(shù)據(jù)的效率,實(shí)現(xiàn)了磁盤的共享使用。當(dāng)數(shù)據(jù)寫入完成后,OSD模塊中的邏輯分區(qū)與實(shí)際的磁盤物理分區(qū)建立起了對應(yīng)關(guān)系。
      [0100]進(jìn)一步,我們以客戶端用戶發(fā)起對資源服務(wù)器2中的卷進(jìn)行讀數(shù)據(jù)操作請求為例,來說明在本發(fā)明實(shí)施例提供的計算存儲融合的集群系統(tǒng)中,用戶是如何在讀數(shù)據(jù)過程中,實(shí)現(xiàn)對存儲資源的共享使用的。
      [0101]首先,該讀數(shù)據(jù)操作請求經(jīng)過資源服務(wù)器2中對應(yīng)的應(yīng)用程序處理后,以標(biāo)準(zhǔn)的數(shù)據(jù)訪問接口(可以是文件接口,也可以是塊接口)要求讀數(shù)據(jù),并將該讀數(shù)據(jù)操作請求發(fā)送給資源服務(wù)器2中的VBS模塊;
      [0102]其次,VBS模塊根據(jù)自身的算法(如DHT等分布式算法)分析計算出需要讀取數(shù)據(jù)的邏輯OSD節(jié)點(diǎn)(包括計算出需要讀數(shù)據(jù)的Block,以及所述Block所屬的分區(qū)),分別向邏輯OSD節(jié)點(diǎn)對應(yīng)的資源服務(wù)器中的OSD模塊發(fā)送讀數(shù)據(jù)操作請求;
      [0103]例如,VBS模塊通過計算分析出需要讀取數(shù)據(jù)的Block分別屬于分區(qū)P6和P7,而P6和P7分別歸屬資源服務(wù)器2中的OSD節(jié)點(diǎn)和資源服務(wù)器3中的OSD節(jié)點(diǎn),則VBS模塊分別向資源服務(wù)器2中的OSD模塊和資源服務(wù)器3中的OSD模塊發(fā)送讀數(shù)據(jù)操作請求。
      [0104]最后,資源服務(wù)器2中的OSD模塊和資源服務(wù)器3中的OSD模塊接收到讀數(shù)據(jù)操作請求后,先到本資源服務(wù)器中的緩存讀取數(shù)據(jù),如果緩存中沒有所需數(shù)據(jù),再到本地持久化磁盤讀取數(shù)據(jù),從本地持久化磁盤讀出數(shù)據(jù)后,先存入緩存,以便下次從緩存中讀取。
      [0105]因此,一個數(shù)據(jù)讀取請求,經(jīng)過上述步驟處理后,可以分布式并行從不同資源服務(wù)器的緩存中讀取數(shù)據(jù)(當(dāng)緩存中沒有所需數(shù)據(jù)時,再從持久化磁盤讀取),從而提高了讀數(shù)據(jù)的效率,實(shí)現(xiàn)了磁盤的共享使用。
      [0106]在本發(fā)明實(shí)施例提供的計算存儲融合的集群系統(tǒng)中,隨著集群系統(tǒng)中持久化存儲資源的增加,整個集群系統(tǒng)的緩存隨之線性增加,緩存的增加,意味著系統(tǒng)讀寫數(shù)據(jù)時,同一個任務(wù)的分布式并發(fā)處理會越多,效率會更高,系統(tǒng)整體性能隨著系統(tǒng)的擴(kuò)容不斷提高。
      [0107]通過本發(fā)明實(shí)施例提供的計算存儲融合的集群系統(tǒng),由于不存在專用的SAN,省略了對SAN存儲系統(tǒng)的復(fù)雜管理,在硬件上解決了現(xiàn)有技術(shù)中因?yàn)槭褂脤S肧AN而導(dǎo)致的操作復(fù)雜、成本較高的問題;存儲設(shè)備可以有多個,每個存儲設(shè)備上都可以部署緩存,在硬件上極大的提升了存儲端緩存的擴(kuò)展能力;存儲資源不依賴于計算資源,存儲設(shè)備可以獨(dú)立的增加和減少,增強(qiáng)了系統(tǒng)的可擴(kuò)展性。另外,由于本發(fā)明實(shí)施例提供計算存儲融合的集群系統(tǒng)采用高速數(shù)據(jù)交換網(wǎng)絡(luò)進(jìn)行通信,進(jìn)一步加快了數(shù)據(jù)的交換速度。
      [0108]應(yīng)理解,在本發(fā)明實(shí)施例中,“與A相應(yīng)的B”表示B與A相關(guān)聯(lián),根據(jù)A可以確定B。但還應(yīng)理解,根據(jù)A確定B并不意味著僅僅根據(jù)A確定B,還可以根據(jù)A和/或其它信息確定B。
      [0109]本領(lǐng)域普通技術(shù)人員可以意識到,結(jié)合本文中所公開的實(shí)施例描述的各示例的單元及算法步驟,能夠以電子硬件、計算機(jī)軟件或者二者的結(jié)合來實(shí)現(xiàn),為了清楚地說明硬件和軟件的可互換性,在上述說明中已經(jīng)按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計約束條件。專業(yè)技術(shù)人員可以對每個特定的應(yīng)用來使用不同方法來實(shí)現(xiàn)所描述的功能,但是這種實(shí)現(xiàn)不應(yīng)認(rèn)為超出本發(fā)明的范圍。
      [0110]在本申請所提供的實(shí)施例中,應(yīng)該理解到,所揭露的系統(tǒng),可以通過其它的方式實(shí)現(xiàn)。例如,以上所描述的系統(tǒng)實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另外,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口、裝置或單元的間接耦合或通信連接,也可以是電的,機(jī)械的或其它的形式連接。
      [0111]所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本發(fā)明實(shí)施例方案的目的。[0112]另外,在本發(fā)明各個實(shí)施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨(dú)物理存在,也可以是兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。
      [0113]所述集成的單元如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時,可以存儲在一個計算機(jī)可讀取存儲介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分,或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機(jī)軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機(jī)設(shè)備(可以是個人計算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實(shí)施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:U盤、移動硬盤、只讀存儲器(ROM,Read-OnlyMemory)、隨機(jī)存取存儲器(RAM, Random Access Memory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
      [0114]以上所述,僅為本發(fā)明的【具體實(shí)施方式】,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本【技術(shù)領(lǐng)域】的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到各種等效的修改或替換,這些修改或替換都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以權(quán)利要求的保護(hù)范圍為準(zhǔn)。
      【權(quán)利要求】
      1.一種計算存儲融合的集群系統(tǒng),其特征在于,包括: 資源服務(wù)器群,所述資源服務(wù)器群包括至少兩個資源服務(wù)器,所述資源服務(wù)器群中的每個資源服務(wù)器至少具有計算資源和存儲資源中的一種,并且所述資源服務(wù)器群中的至少一個資源服務(wù)器具有計算資源和存儲資源,所述存儲資源包括持久化磁盤以及和所述持久化磁盤對應(yīng)的緩存; 存儲資源控制模塊,用于將所述資源服務(wù)器群中的存儲資源構(gòu)建成共享的存儲資源池,以提供存儲服務(wù),其中每個所述存儲資源池包括的存儲資源來自于所述資源服務(wù)器群中的至少兩個資源服務(wù)器。
      2.根據(jù)權(quán)利要求1所述的計算存儲融合的集群系統(tǒng),其特征在于,所述存儲資源控制模塊,包括: 集群視圖管理子模塊,用于根據(jù)用戶預(yù)設(shè)的配置信息對所述資源服務(wù)器群中的持久化磁盤進(jìn)行邏輯劃分以得到邏輯分區(qū),所述每個邏輯分區(qū)都對應(yīng)所述持久化磁盤上固定數(shù)量的物理存儲資源塊。
      3.根據(jù)權(quán)利要求2所述的計算存儲融合的集群系統(tǒng),其特征在于,所述存儲資源控制模塊,還包括數(shù)據(jù)子模塊,所述資源服務(wù)器群中的每個具有存儲資源的資源服務(wù)器都對應(yīng)一個所述數(shù)據(jù)子模塊; 所述集群視圖管理子模塊,還用于為所述數(shù)據(jù)子模塊分配所述邏輯分區(qū)資源,建立所述數(shù)據(jù)子模塊的邏輯分區(qū)拓?fù)浣Y(jié)構(gòu),并根據(jù)所述數(shù)據(jù)子模塊的請求,將分配的邏輯分區(qū)信息分別發(fā)給對應(yīng)的所述數(shù)據(jù)子模塊。
      4.根據(jù)權(quán)利要求2或3所述的計算存儲融合的集群系統(tǒng),其特征在于,所述存儲資源控制模塊,還包括接口子模塊,所述資源服`務(wù)器群中的每個資源服務(wù)器都對應(yīng)一個所述接口子模塊; 所述接口子模塊,用于接收用戶發(fā)送的用戶卷創(chuàng)建請求,并根據(jù)所述用戶卷創(chuàng)建請求,在所述共享的存儲資源池中為需要創(chuàng)建的用戶卷分配與所述用戶卷創(chuàng)建請求相應(yīng)的物理存儲資源塊,所述物理存儲資源塊來自于不同的持久化磁盤。
      5.根據(jù)權(quán)利要求4所述的計算存儲融合的集群系統(tǒng),其特征在于,所述接口子模塊,還用于接收用戶發(fā)送的讀/寫數(shù)據(jù)操作請求,根據(jù)所述讀/寫數(shù)據(jù)操作請求中包含的用戶卷標(biāo)識,計算出讀/寫數(shù)據(jù)操作對應(yīng)的物理存儲資源塊以及所述物理存儲資源塊所屬的邏輯分區(qū);根據(jù)計算出的所述物理存儲資源塊所屬的邏輯分區(qū)確定需要執(zhí)行讀/寫數(shù)據(jù)操作的數(shù)據(jù)子模塊;將所述讀/寫數(shù)據(jù)操作請求發(fā)送給所述需要執(zhí)行讀/寫數(shù)據(jù)操作的數(shù)據(jù)子模塊。
      6.根據(jù)權(quán)利要求5所述的計算存儲融合的集群系統(tǒng),其特征在于,所述數(shù)據(jù)子模塊,用于根據(jù)所述接口子模塊發(fā)送的寫數(shù)據(jù)操作請求,通過所述數(shù)據(jù)子模塊對應(yīng)的資源服務(wù)器的緩存寫入數(shù)據(jù);或者,用于根據(jù)所述接口子模塊發(fā)送的讀數(shù)據(jù)操作請求,通過所述數(shù)據(jù)子模塊對應(yīng)的資源服務(wù)器的緩存讀取數(shù)據(jù)。
      7.根據(jù)權(quán)利要求6所述的計算存儲融合的集群系統(tǒng),其特征在于,所述通過所述數(shù)據(jù)子模塊對應(yīng)的資源服務(wù)器的緩存寫入數(shù)據(jù),具體包括: 所述數(shù)據(jù)子模塊先將數(shù)據(jù)寫入所述數(shù)據(jù)子模塊對應(yīng)的資源服務(wù)器的緩存中,再由所述緩存將數(shù)據(jù)寫入與所述用戶卷標(biāo)識對應(yīng)的物理存儲資源塊中。
      8.根據(jù)權(quán)利要求6所述的計算存儲融合的集群系統(tǒng),其特征在于,所述通過所述數(shù)據(jù)子模塊對應(yīng)的資源服務(wù)器的緩存讀取數(shù)據(jù),具體包括: 所述數(shù)據(jù)子模塊先從所述數(shù)據(jù)子模塊對應(yīng)的資源服務(wù)器的緩存中讀取請求的數(shù)據(jù),如果所述緩存中沒有所述請求的數(shù)據(jù),再從所述用戶卷標(biāo)識對應(yīng)的物理存儲資源塊中讀取所述請求的數(shù)據(jù),并將讀取到的所述請求的數(shù)據(jù)寫入緩存中。
      9.根據(jù)權(quán)利要求3所述的計算存儲融合的集群系統(tǒng),其特征在于,如果所述集群系統(tǒng)增加或者刪除具有存儲資源的資源服務(wù)器,所述集群視圖管理子模塊,還用于根據(jù)預(yù)設(shè)的邏輯分區(qū)分配算法重新生成所述數(shù)據(jù)子模塊的邏輯分區(qū)拓?fù)浣Y(jié)構(gòu),將新的邏輯分區(qū)拓?fù)浣Y(jié)構(gòu)廣播給所述集群系統(tǒng)中所有的接口子模塊和數(shù)據(jù)子模塊,并通知原有的數(shù)據(jù)子模炔基于所述新的邏輯分區(qū)拓?fù)浣Y(jié)構(gòu)發(fā)起數(shù)據(jù)遷移。
      10.根據(jù)權(quán)利要求9所述的計算存儲融合的集群系統(tǒng),其特征在于,如果所述集群系統(tǒng)刪除具有存儲資源的資源服務(wù)器,所述集群視圖管理子模塊,還用于在所述數(shù)據(jù)子模塊完成數(shù)據(jù)遷移后,將所述被刪除的資源服務(wù)器設(shè)置為不可用狀態(tài)。
      11.根據(jù)權(quán)利要求4或5所述的計算存儲融合的集群系統(tǒng),其特征在于, 所述接口子模塊的接口符合小型計算機(jī)系統(tǒng)接口協(xié)議。
      12.根據(jù)權(quán)利要求1所述的計算存儲融合的集群系統(tǒng),其特征在于,所述存儲資源控制模塊,還用于將所述具有存儲資源的資源服務(wù)器的單個持久化磁盤作為獨(dú)立節(jié)點(diǎn),構(gòu)建所述共享的存儲資源池。
      13.根據(jù)權(quán)利要求1至11中任一項所述的計算存儲融合的集群系統(tǒng),其特征在于,所述存儲資源控制模塊,還用于通過分布式算法構(gòu)建并管理所述共享的存儲資源池。
      14.根據(jù)權(quán)利要求1至13中任一項所述的計算存儲融合的集群系統(tǒng),其特征在于,所述集群系統(tǒng)中的資源服務(wù)器之間通過高速數(shù)據(jù)交換網(wǎng)絡(luò)進(jìn)行通信。
      15.根據(jù)權(quán)利要求14所述的計算存儲融合的集群系統(tǒng),其特征在于,所述高速數(shù)據(jù)交換網(wǎng)絡(luò)包括高速外設(shè)組件互連標(biāo)準(zhǔn)PC1-E網(wǎng)絡(luò)或光纖網(wǎng)絡(luò)。
      【文檔編號】H04L29/08GK103503414SQ201280005761
      【公開日】2014年1月8日 申請日期:2012年12月31日 優(yōu)先權(quán)日:2012年12月31日
      【發(fā)明者】顧炯炯, 王道輝, 閔小勇 申請人:華為技術(shù)有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1