專利名稱:一種基于時(shí)間參數(shù)的副本等級(jí)衰減方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息網(wǎng)絡(luò)技術(shù)領(lǐng)域,特別涉及一種應(yīng)用于分布式系統(tǒng)中的基于時(shí)間參數(shù)的副本等級(jí)衰減方法。
背景技術(shù):
在分布式系統(tǒng)中,數(shù)據(jù)被存儲(chǔ)在系統(tǒng)中的不同節(jié)點(diǎn)上,為了加快用戶訪問(wèn)速度和降低部分應(yīng)用中,數(shù)據(jù)源服務(wù)器的負(fù)載壓力,文件常常存在許多副本,并散布在網(wǎng)絡(luò)中,便于用戶在最近的節(jié)點(diǎn)處獲取對(duì)應(yīng)副本,降低數(shù)據(jù)傳輸延遲,避免網(wǎng)絡(luò)擁塞,提高響應(yīng)速度和服務(wù)質(zhì)量。然而,在分布式系統(tǒng)中,每個(gè)節(jié)點(diǎn)的存儲(chǔ)空間有限,系統(tǒng)無(wú)法滿足數(shù)據(jù)無(wú)限制的生成副本,因此,需要對(duì)副本空間進(jìn)行有效管理,通過(guò)一定規(guī)則來(lái)對(duì)不需要的數(shù)據(jù)進(jìn)行優(yōu)化。
結(jié)構(gòu)化的P2P網(wǎng)絡(luò)是指所有節(jié)點(diǎn)通過(guò)某種規(guī)則的、固定拓?fù)涞姆绞竭M(jìn)行組織。每個(gè)節(jié)點(diǎn)都有固定的節(jié)點(diǎn)度,表示所聯(lián)系鄰居的數(shù)目,每個(gè)鄰居都被精心挑選,可以保證節(jié)點(diǎn)間的可路由和可査找。結(jié)構(gòu)化P2P網(wǎng)絡(luò)的顯著特點(diǎn)是自組織性,在節(jié)點(diǎn)加入、失效等動(dòng)態(tài)性的情況下,可以有效保持拓?fù)浣Y(jié)構(gòu),保證網(wǎng)絡(luò)的路由性能。該組織方式在分布式網(wǎng)絡(luò)系統(tǒng)中得到了廣泛的應(yīng)用。
圖1是結(jié)構(gòu)化P2P網(wǎng)絡(luò)中的副本放置示意圖。如圖1所示,在結(jié)構(gòu)化P2P網(wǎng)絡(luò)中,每個(gè)節(jié)點(diǎn)都通過(guò)某種哈希算法得到一個(gè)唯一ID值,同樣,所有應(yīng)用實(shí)體(如對(duì)象,object),也通過(guò)該哈希算法得到一個(gè)與節(jié)點(diǎn)Id在同一個(gè)數(shù)值空間的objectID值,同樣也有一個(gè)唯一的放置節(jié)點(diǎn),該放置節(jié)點(diǎn)就叫做該object的主節(jié)點(diǎn),叫做homenode。對(duì)object的查找即對(duì)其home node的定位,該過(guò)程是通過(guò)查詢發(fā)起節(jié)點(diǎn)的鄰居節(jié)點(diǎn)作為中介而逐跳進(jìn)行,直至找到目標(biāo)或查找失敗為止。
結(jié)構(gòu)化P2P網(wǎng)絡(luò)又成為分布式哈希表(簡(jiǎn)稱DHT),以上的資源定位過(guò)程是一個(gè)普遍方法。在實(shí)際應(yīng)用中,不同的拓?fù)浣Y(jié)構(gòu)被提出,也對(duì)應(yīng)了不同的DHT算法。常用的有CAN, Chord, Kademlia, Pastry, Tapestry等。在DHT網(wǎng)絡(luò)中,假設(shè)哈希值的ID空間為M個(gè)bit位的數(shù)值,從左到右,所有匹配大于等于/位數(shù)值的ID,稱為在一個(gè)等級(jí),即一個(gè)level。 一個(gè)object如果其level為/,表示路由/跳就可以找到該object。因此,需要在/跳覆蓋之外的所有節(jié)點(diǎn)上進(jìn)行備份。比如,以Pastry為路由協(xié)議,object的level為/則對(duì)應(yīng)了一個(gè)楔形的節(jié)點(diǎn)區(qū)域,表示該區(qū)域的所有節(jié)點(diǎn)需要對(duì)object進(jìn)行備份,若網(wǎng)絡(luò)中節(jié)點(diǎn)總數(shù)為N,基數(shù)為b,則需要N/1^個(gè)節(jié)點(diǎn)進(jìn)行備份。因此,如何計(jì)算每個(gè)object所對(duì)應(yīng)的level值,則是副本放置的關(guān)鍵。而對(duì)/值進(jìn)行合理的變化,則可對(duì)應(yīng)文件副本數(shù)目的變化。
在分布式系統(tǒng)的存儲(chǔ)空間不足時(shí),常將最不常用(at least recently used)和最少用(atleastfrequetlyused)的文件刪除,為其余待分發(fā)文件騰出空間。然而,文件的副本等級(jí)和文件流行度以及所上線時(shí)間有一定的相關(guān)性,如果不考慮這些因素,很有可能將有用的文件副本刪除。
發(fā)明內(nèi)容
為了解決上述問(wèn)題,本發(fā)明的目的在于提供一種應(yīng)用于分布式系統(tǒng)中的基于時(shí)間參數(shù)的副本等級(jí)衰減方法。該方法以文件上線時(shí)間作為參數(shù),綜合文件流行度信息,使文件副本等級(jí)隨時(shí)間變化而衰減。該方法有利于分布式系統(tǒng)中的內(nèi)容更新,避免不常用數(shù)據(jù)長(zhǎng)時(shí)間占據(jù)分布式系統(tǒng)中的存儲(chǔ)空間,使存儲(chǔ)空間得到充分利用,方便更多的文件得到服務(wù),提高對(duì)應(yīng)系統(tǒng)的服務(wù)性能,并改善系統(tǒng)性能。
為了實(shí)現(xiàn)上述目的,本發(fā)明的一種基于時(shí)間參數(shù)的副本等級(jí)衰減方法中,假設(shè)文件/初始的副本等級(jí)為丄,所有與/的ID匹配L位的節(jié)點(diǎn)上都有一份/的副本。每個(gè)文件的主節(jié)點(diǎn),即與其ID最近的節(jié)點(diǎn),都會(huì)存儲(chǔ)一個(gè)關(guān)于該文件的元數(shù)據(jù),包括當(dāng)前層數(shù)、衰減周期、衰減步長(zhǎng)以及開(kāi)始時(shí)間。而每個(gè)副本都帶有一個(gè)表示生存期的數(shù)據(jù)結(jié)構(gòu),定時(shí)自我檢測(cè)并計(jì)算剩余等級(jí)數(shù),從而決定該節(jié)點(diǎn)所保持的副本是否需要?jiǎng)h除。則在網(wǎng)絡(luò)中,從文件加入到退出,整個(gè)衰減過(guò)程包括如下步驟,
1) 通過(guò)等級(jí)計(jì)算得到文件/的初始副本等級(jí);
2) 通過(guò)某個(gè)管理節(jié)點(diǎn)計(jì)算文件/基于流行度的生存期,計(jì)算方法如下
a) 從管理節(jié)點(diǎn)或某個(gè)全局信息表中讀取文件/的流行度信息/wp;
b) 通過(guò)對(duì)網(wǎng)絡(luò)中所有文件流行度的統(tǒng)計(jì),計(jì)算得到所有節(jié)點(diǎn)的平均流行度
C)通過(guò)下式計(jì)算總在線時(shí)間值tC:fc: pop / orve — pop x wf
3) 根據(jù)DHT路由算法找到當(dāng)前文件的主節(jié)點(diǎn);將文件以及對(duì)應(yīng)副本等級(jí)等相關(guān)信息下載到本地;通過(guò)主節(jié)點(diǎn)的路由表找到與主節(jié)點(diǎn)的ID匹配丄位的所有節(jié)點(diǎn),將文件復(fù)制到這些節(jié)點(diǎn)上,同時(shí)每個(gè)副本都帶有一個(gè)表示生存期的數(shù)據(jù)結(jié)構(gòu),定時(shí)自我檢測(cè)并計(jì)算剩余等級(jí)數(shù),從而決定該節(jié)點(diǎn)所保持的副本是否需要?jiǎng)h除;
4) 基于所述步驟2)計(jì)算所得的時(shí)間參數(shù),從文件加入系統(tǒng)開(kāi)始計(jì)算,每個(gè)存儲(chǔ)了副本的節(jié)點(diǎn)周期性的檢測(cè)當(dāng)前文件剩余副本等級(jí),任意時(shí)間t時(shí)的副本等級(jí)為
這里,t表示當(dāng)前數(shù)據(jù)的在線時(shí)間,并以u(píng)t遞增,即每過(guò)ut時(shí)間計(jì)算并更新一
次,
當(dāng)t-0時(shí),R(t)=L,表示剛剛在線時(shí)的等級(jí)數(shù);當(dāng)t^tc時(shí),R(t)=M,表示生存期結(jié)束時(shí)沒(méi)有副本的情況;
5) 如果L'〉L,則每個(gè)保存副本的節(jié)點(diǎn)自我檢查,看節(jié)點(diǎn)ID和文件f的ID是否匹配L位但不足L'位,如果是,則刪除該節(jié)點(diǎn)上的副本和文件對(duì)應(yīng)信息,并發(fā)消息通知文件/的主節(jié)點(diǎn),從而實(shí)現(xiàn)文件副本等級(jí)的衰減。
其中,所述步驟l)的等級(jí)計(jì)算中,所述初始副本等級(jí)可以通過(guò)下述任何一個(gè)方
法得到
1) 在一定延遲或者帶寬占用的條件下,通過(guò)全局最優(yōu)化或者局部?jī)?yōu)化的方法計(jì)
算得到網(wǎng)絡(luò)中所有文件的副本等級(jí);
2) 預(yù)先設(shè)定的副本等級(jí)。
另外,在所述步驟2)的文件生存期的計(jì)算中,平均流行度"vej叩的計(jì)算可以采用下述數(shù)值中的任意一個(gè)
1) 所有文件被訪問(wèn)頻率的平均值;
2) 只選取訪問(wèn)頻率高于預(yù)設(shè)閾值(化reWoW)的值,選出N個(gè)文件并求出這N個(gè)文件被訪問(wèn)頻率的平均值;
3) —段時(shí)間加入系統(tǒng)的所有文件訪問(wèn)頻率的平均值。
本發(fā)明的基于時(shí)間參數(shù)的副本等級(jí)衰減方法的有益效果在于以文件上線時(shí)間作為參數(shù),綜合文件流行度信息,使文件副本等級(jí)隨時(shí)間變化而衰減。該方法有利于分布式系統(tǒng)中的內(nèi)容更新,避免不常用數(shù)據(jù)長(zhǎng)時(shí)間占據(jù)分布式系統(tǒng)中的存儲(chǔ)空間,
6使存儲(chǔ)空間得到充分利用,方便更多的文件得到服務(wù),提高對(duì)應(yīng)系統(tǒng)的服務(wù)性能,并改善系統(tǒng)性能。通過(guò)文件流行度和在線時(shí)間的綜合考慮,使分布式系統(tǒng)中的文件副本等級(jí)隨時(shí)間參數(shù)進(jìn)行合理衰減,優(yōu)化存儲(chǔ)空間,動(dòng)態(tài)的調(diào)整系統(tǒng)對(duì)文件的服務(wù)能力,提升用戶體驗(yàn)。
圖1是結(jié)構(gòu)化P2P網(wǎng)絡(luò)中的副本放置示意圖,其中,填充X的為主節(jié)點(diǎn),填充/為副本放置節(jié)點(diǎn)。
圖2是本發(fā)明的一種基于時(shí)間參數(shù)的副本等級(jí)衰減方法的流程圖。
具體實(shí)施例方式
下面結(jié)合附圖以及具體實(shí)施例,對(duì)本發(fā)明的一種基于時(shí)間參數(shù)的副本等級(jí)衰減方法作進(jìn)一步闡述。
在分布式網(wǎng)絡(luò)中, 一個(gè)文件是否被關(guān)注有兩方面的影響因素 一方面為該文件
的流行度(popularity),即這個(gè)文件是否常被大家所訪問(wèn),可以用文件的訪問(wèn)頻率來(lái)表示;另一方面則是時(shí)間。 一般來(lái)說(shuō),視音頻文件會(huì)隨著時(shí)間的推移而逐漸淡出觀眾視線。因此,文件在網(wǎng)絡(luò)中進(jìn)行備份時(shí),這兩方面需要聯(lián)合考慮。
本發(fā)明的一種應(yīng)用于分布式系統(tǒng)中基于時(shí)間參數(shù)的副本等級(jí)衰減方法,包括如下步驟
1) 通過(guò)等級(jí)計(jì)算得到文件/的初始副本等級(jí);
在分布式網(wǎng)絡(luò)中,文件所需備份數(shù)目的基本目標(biāo)是當(dāng)流行度很大時(shí),希望數(shù)
據(jù)在網(wǎng)絡(luò)中保持的時(shí)間長(zhǎng),份數(shù)多,流行度小時(shí),則反之。假設(shè)通過(guò)己知流行度和最大延遲,全局優(yōu)化計(jì)算的方法,得到所有文件的初始副本等級(jí)。文件/的流行度為
/7印,初始備份副本等級(jí)為丄。
2) 通過(guò)某個(gè)管理節(jié)點(diǎn)計(jì)算文件/基于流行度的生存期,計(jì)算方法如下
a) 從管理節(jié)點(diǎn)或某個(gè)全局信息表中讀取文件/的流行度信息;w化,
b) 通過(guò)對(duì)網(wǎng)絡(luò)中所有文件流行度的統(tǒng)計(jì),計(jì)算得到所有節(jié)點(diǎn)的平均流行度
這里,平均流行度ave_pop可以采用下述數(shù)值中的任意一個(gè)-i)所有文件被訪問(wèn)頻率的平均值;ii) 只選取訪問(wèn)頻率高于預(yù)設(shè)閾值(threshold)的值,選出N個(gè)文件并求出這N個(gè)文件被訪問(wèn)頻率的平均值;
iii) 一段時(shí)間內(nèi)(具體時(shí)間長(zhǎng)短的選擇可根據(jù)實(shí)際情況加以調(diào)整,可以選擇稍長(zhǎng)的時(shí)間,比如1天或者1周等。)加入系統(tǒng)的所有文件訪問(wèn)頻率的平均值。
c)通過(guò)下式計(jì)算總在線時(shí)間值tc:
/c = / op / flve — x wf
其中,W (比如10min, lhour等)為管理員設(shè)置的在線時(shí)間單位,ave為選出文件頻率的平均值,即ww^c^/iV,這里只選取訪問(wèn)頻率高于Amy/wW (預(yù)設(shè)閾值)的值,iV為選出的文件總數(shù)。
3) 根據(jù)DHT路由算法找到當(dāng)前文件的主節(jié)點(diǎn),將文件以及對(duì)應(yīng)副本等級(jí)等相關(guān)信息下載到本地,通過(guò)主節(jié)點(diǎn)的路由表找到與主節(jié)點(diǎn)的ID匹配丄位的所有節(jié)點(diǎn),將文件復(fù)制到這些節(jié)點(diǎn)上,同時(shí)每個(gè)副本都帶有一個(gè)表示生存期的數(shù)據(jù)結(jié)構(gòu),定時(shí)自我檢測(cè)并計(jì)算剩余等級(jí)數(shù),從而決定該節(jié)點(diǎn)所保持的副本是否需要?jiǎng)h除;
4) 基于所述步驟2)計(jì)算所得的時(shí)間參數(shù),從文件加入系統(tǒng)開(kāi)始計(jì)算,每個(gè)存儲(chǔ)了副本的節(jié)點(diǎn)周期性地檢測(cè)當(dāng)前文件的剩余副本等級(jí),
文件的在線時(shí)間與時(shí)間/和流行度PM相關(guān),隨著時(shí)間的推移,文件的重要性逐漸下降,則副本等級(jí)逐漸增加(即副本數(shù)目逐漸減少),同時(shí)pop越大副本越多,任意時(shí)間t時(shí)的副本等級(jí)為
Z! = i (f) =£ + (M —丄)(1一^")
當(dāng)^0是,i (^=Z,表示剛剛在線時(shí)的/eve/數(shù);當(dāng)tfc時(shí),及f(HM,表示生存期結(jié)束時(shí)沒(méi)有副本的情況。
這里,Z表示當(dāng)前數(shù)據(jù)在線時(shí)間,并以W遞增,即每過(guò)W時(shí)間計(jì)算并更新一次。
5) 如果L、L,則每個(gè)保存副本的節(jié)點(diǎn)自我檢查,看節(jié)點(diǎn)ID和文件f的ID是否匹配L位但不足L,位,如果是,則刪除該節(jié)點(diǎn)上的副本和文件對(duì)應(yīng)信息,并發(fā)消息通知文件/的主節(jié)點(diǎn),從而實(shí)現(xiàn)文件副本等級(jí)的衰減。
在實(shí)現(xiàn)時(shí),每個(gè)文件的主節(jié)點(diǎn),即與其ID最近的節(jié)點(diǎn),都會(huì)存儲(chǔ)一個(gè)關(guān)于該文件的元數(shù)據(jù),包括當(dāng)前層數(shù)、衰減周期、衰減步長(zhǎng)以及開(kāi)始時(shí)間等等。而每個(gè)副本都帶有一個(gè)表示生存期的數(shù)據(jù)結(jié)構(gòu),定時(shí)自我檢測(cè)并計(jì)算剩余等級(jí)數(shù),從而決定該節(jié)點(diǎn)所保持的副本是否需要?jiǎng)h除。實(shí)施例
以分布式內(nèi)容分發(fā)網(wǎng)絡(luò)(Content Distribution/Delivery Network,簡(jiǎn)稱CDN)為 例,假設(shè)基于結(jié)構(gòu)化P2P的CDN網(wǎng)絡(luò)中節(jié)點(diǎn)ID為128位,共1000個(gè)文件要需要分 發(fā)其中,其中文件/的初始副本等級(jí)為114,流行度/;印=198。根據(jù)該初始值,將所 有與文件/的ID具有相同114位ID值的節(jié)點(diǎn)生成一個(gè)/的副本。在分發(fā)的同時(shí),每 個(gè)收到副本的節(jié)點(diǎn)也會(huì)保存一個(gè)時(shí)間戳,包含了該文件的時(shí)間衰減函數(shù),并定期檢 測(cè)該文件的副本等級(jí)數(shù)。
假設(shè)在線時(shí)間單位為l天,整個(gè)網(wǎng)絡(luò)中文件的平均熱度"^^叩=32,則文件/ 的副本在線的總時(shí)間為
fc = /w; /aveX 1 X 24 X 60 = 8910 (分鐘)
等級(jí)數(shù)隨時(shí)間的變化情況如下式
=114 + (128_114)(1-
化
假設(shè)每2小時(shí)(120分鐘)檢測(cè)一次,則R(t)變化如下 t = 0; R(t)=114 t=120 XI; R(t)=114 t=120 X6; R(t)=115
t= 120 X20; R(t)=117
t= 120 X 50; R(t)= 123
t= 120 X 75; R(t)=128
每當(dāng)一個(gè)節(jié)點(diǎn)在時(shí)間fw自我檢測(cè)當(dāng)前副本等級(jí)為i fig時(shí),如果當(dāng)前節(jié)點(diǎn)id與
匹配位數(shù)小于Z-^fU -Q,則將該節(jié)點(diǎn)存儲(chǔ)的副本刪除,時(shí)間戳刪除;否則,用#J
的值更新z。
從上面過(guò)程可知,數(shù)據(jù)副本數(shù)隨著時(shí)間衰減(等級(jí)升高),直至達(dá)到生存期結(jié)束 為止。
9
權(quán)利要求
1、一種基于時(shí)間參數(shù)的副本等級(jí)衰減方法,包括如下步驟,1)通過(guò)等級(jí)計(jì)算得到文件f的初始副本等級(jí);2)通過(guò)某個(gè)管理節(jié)點(diǎn)計(jì)算文件f基于流行度的生存期,計(jì)算方法如下a)從管理節(jié)點(diǎn)或某個(gè)全局信息表中讀取文件f的流行度信息pop;b)通過(guò)對(duì)網(wǎng)絡(luò)中所有文件流行度的統(tǒng)計(jì),計(jì)算得到所有節(jié)點(diǎn)的平均流行度ave_pop;c)通過(guò)下式計(jì)算總在線時(shí)間值tctc=pop/ave_pop×ut;3)根據(jù)DHT路由算法找到當(dāng)前文件的主節(jié)點(diǎn),將文件以及對(duì)應(yīng)副本等級(jí)等相關(guān)信息下載到本地,通過(guò)主節(jié)點(diǎn)的路由表找到與主節(jié)點(diǎn)的ID匹配L位的所有節(jié)點(diǎn),將文件復(fù)制到這些節(jié)點(diǎn)上,同時(shí)每個(gè)副本都帶有一個(gè)表示生存期的數(shù)據(jù)結(jié)構(gòu),定時(shí)自我檢測(cè)并計(jì)算剩余等級(jí)數(shù),從而決定該節(jié)點(diǎn)所保持的副本是否需要?jiǎng)h除;4)基于所述步驟2)計(jì)算所得的時(shí)間參數(shù),從文件加入系統(tǒng)開(kāi)始計(jì)算,每個(gè)存儲(chǔ)了副本的節(jié)點(diǎn)周期性的檢測(cè)當(dāng)前文件剩余副本等級(jí),任意時(shí)間t時(shí)的副本等級(jí)為<maths id="math0001" num="0001" ><math><![CDATA[ <mrow><msup> <mi>L</mi> <mo>′</mo></msup><mo>=</mo><mi>R</mi><mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo></mrow><mo>=</mo><mi>L</mi><mo>+</mo><mrow> <mo>(</mo> <mi>M</mi> <mo>-</mo> <mi>L</mi> <mo>)</mo></mrow><mrow> <mo>(</mo> <mn>1</mn> <mo>-</mo> <mfrac><mrow> <mi>tc</mi> <mo>-</mo> <mi>t</mi></mrow><mi>tc</mi> </mfrac> <mo>)</mo></mrow> </mrow>]]></math></maths>這里,t表示當(dāng)前數(shù)據(jù)的在線時(shí)間,并以u(píng)t遞增,即每過(guò)ut時(shí)間計(jì)算并更新一次,當(dāng)t=0時(shí),R(t)=L,表示剛剛在線時(shí)的等級(jí)數(shù),當(dāng)t=tc時(shí),R(t)=M,表示生存期結(jié)束時(shí)沒(méi)有副本的情況;5)如果L’>L,則每個(gè)保存副本的節(jié)點(diǎn)自我檢查,看節(jié)點(diǎn)ID和文件f的ID是否匹配L位但不足L’位,如果是,則刪除該節(jié)點(diǎn)上的副本和文件對(duì)應(yīng)信息,并發(fā)消息通知文件f的主節(jié)點(diǎn),從而實(shí)現(xiàn)文件副本等級(jí)的衰減。
2、 如權(quán)利要求1所述的基于時(shí)間參數(shù)的副本等級(jí)衰減方法,其特征在于,在所 述步驟l)的等級(jí)計(jì)算中,所述初始副本等級(jí)可以通過(guò)下述任何一個(gè)方法得到1) 在一定延遲或者帶寬占用的條件下,通過(guò)全局最優(yōu)化或者局部?jī)?yōu)化的方法計(jì) 算得到網(wǎng)絡(luò)中所有文件的副本等級(jí);2) 預(yù)先設(shè)定的副本等級(jí)。
3、 如權(quán)利要求1所述的基于時(shí)間參數(shù)的副本等級(jí)衰減方法,其特征在于,在所 述步驟2)的文件生存期的計(jì)算中,所述平均流行度"vej印的計(jì)算采用下述數(shù)值中 的任意一個(gè)1) 所有文件被訪問(wèn)頻率的平均值;2) 只選取訪問(wèn)頻率高于預(yù)設(shè)閾值的值,選出N個(gè)文件并求出這N個(gè)文件被訪 問(wèn)頻率的平均值;3) —段時(shí)間內(nèi)加入系統(tǒng)的所有文件訪問(wèn)頻率的平均值。
全文摘要
本發(fā)明提供一種應(yīng)用于分布式系統(tǒng)中的基于時(shí)間參數(shù)的副本等級(jí)衰減方法。該方法中,假設(shè)文件f初始的副本等級(jí)為L(zhǎng),所有與f的ID匹配L位的節(jié)點(diǎn)上都有一份f的副本,每個(gè)文件的主節(jié)點(diǎn)都會(huì)存儲(chǔ)一個(gè)關(guān)于該文件的元數(shù)據(jù)當(dāng)前層數(shù)、衰減周期、衰減步長(zhǎng)以及開(kāi)始時(shí)間,每個(gè)副本都帶有一個(gè)表示生存期的數(shù)據(jù)結(jié)構(gòu),通過(guò)定時(shí)自我檢測(cè)并計(jì)算剩余等級(jí)數(shù),從而決定該節(jié)點(diǎn)所保持的副本是否需要?jiǎng)h除。由此以文件上線時(shí)間作為參數(shù),綜合文件流行度信息,使文件副本等級(jí)隨時(shí)間變化而衰減。該方法有利于分布式系統(tǒng)中的內(nèi)容更新,避免不常用數(shù)據(jù)長(zhǎng)時(shí)間占據(jù)存儲(chǔ)空間,使存儲(chǔ)空間得到充分利用,方便更多的文件得到服務(wù),提高對(duì)應(yīng)系統(tǒng)的服務(wù)性能,并改善系統(tǒng)性能。
文檔編號(hào)H04L29/08GK101645920SQ20091008161
公開(kāi)日2010年2月10日 申請(qǐng)日期2009年4月7日 優(yōu)先權(quán)日2009年4月7日
發(fā)明者尤佳莉, 王勁林, 王玲芳, 鄧浩江 申請(qǐng)人:中國(guó)科學(xué)院聲學(xué)研究所