專利名稱:一種無(wú)結(jié)構(gòu)p2p網(wǎng)絡(luò)的副本復(fù)制方法
技術(shù)領(lǐng)域:
本發(fā)明涉及對(duì)等網(wǎng)絡(luò)(Peer-to-Peer,P2P)技術(shù)領(lǐng)域,尤其涉及一種無(wú)結(jié)構(gòu)P2P網(wǎng) 絡(luò)的副本復(fù)制方法。
背景技術(shù):
P2P技術(shù)已經(jīng)被證實(shí)是能夠?qū)嵤┐笠?guī)模分布式應(yīng)用的一種有效的方式。近十年來(lái), P2P應(yīng)用已經(jīng)引起了眾多研究團(tuán)體的興趣,部署在hternet上的最主要的P2P應(yīng)用—— P2P文件共享系統(tǒng)也已經(jīng)得到了廣泛的應(yīng)用。在P2P文件共享系統(tǒng)中,為了交換文件信息, 節(jié)點(diǎn)之間相互合作形成一個(gè)分布式系統(tǒng),用戶和系統(tǒng)的交互通過(guò)如下方式用戶通過(guò)發(fā)起 查詢來(lái)定位感興趣的文件,一旦文件找到了,用戶對(duì)擁有該文件的節(jié)點(diǎn)發(fā)起一個(gè)下載請(qǐng)求, 因此,文件共享應(yīng)用消耗著大部分的hternet帶寬,研究表明在大規(guī)模的HTTP流量中超過(guò) 75 %的hternet流量來(lái)自于P2P文件共享應(yīng)用。在P2P文件共享系統(tǒng)中,搜索效率對(duì)系統(tǒng)的性能有著重大的影響,決定著系統(tǒng)的 可用性和可擴(kuò)展性等。研究表明,系統(tǒng)中文件的查詢并不是均衡的,符合Zif分布,有的文 件被頻繁的查詢變得流行而有的文件則很少訪問(wèn),這就容易讓網(wǎng)絡(luò)中的某些節(jié)點(diǎn)因?yàn)槌休d 了流行文件而變成“熱點(diǎn)”,導(dǎo)致網(wǎng)絡(luò)擁塞,消耗了大量的網(wǎng)絡(luò)資源,而副本復(fù)制是一個(gè)有效 的方法來(lái)分散節(jié)點(diǎn)的負(fù)載,它能將流行的文件按照一定的復(fù)制策略復(fù)制到選中的其他節(jié)點(diǎn) 上,幫助獲得高的查詢效率,減少響應(yīng)時(shí)間和查詢跳數(shù)。近來(lái)提出了很多副本復(fù)制方法。主要分為三類(lèi)服務(wù)器端的復(fù)制方法、客戶端的復(fù) 制方法和沿路復(fù)制方法。服務(wù)器端的復(fù)制指復(fù)制文件靠近文件擁有者。客戶端的復(fù)制指復(fù) 制文件靠近文件請(qǐng)求者。沿路復(fù)制是指從請(qǐng)求者到文件擁有者沿路進(jìn)行復(fù)制。然而,這三 種方法的效率都比較低并帶來(lái)高的開(kāi)銷(xiāo)??拷?wù)擁有者一端來(lái)復(fù)制文件即服務(wù)端的復(fù)制 能夠提高復(fù)制命中率和查詢效率,然而,它不能顯著減少路徑長(zhǎng)度因?yàn)閺?fù)制是靠近服務(wù)擁 有者的。另一方面,客戶端的復(fù)制將顯著提高查詢效率,但是當(dāng)節(jié)點(diǎn)的興趣發(fā)生變化時(shí)不能 保證。因此,客戶端的復(fù)制也不能保證高命中率和復(fù)制利用率。沿路復(fù)制避免了服務(wù)端的 和客戶端的問(wèn)題。它提供高命中率并且極大的減少了查詢平均長(zhǎng)度。然而,它的有效性超 過(guò)了它復(fù)制和維護(hù)的高開(kāi)銷(xiāo),而且,它產(chǎn)生了很多無(wú)用的副本。既然復(fù)制更多的副本能夠帶來(lái)更高的查詢效率,但也會(huì)產(chǎn)生更多的維護(hù)開(kāi)銷(xiāo),所 以復(fù)制算法的挑戰(zhàn)是如何最小化副本并獲得高的查詢效率,即減少響應(yīng)時(shí)間、減少開(kāi)銷(xiāo) 并提高命中率。EAD (an Efficient and Adaptive Decentralized file replication algorithm)算法就是基于這種目標(biāo)而提出的一種算法,EAD是一個(gè)有效的自適應(yīng)的分散 副本復(fù)制算法,它根據(jù)用戶興趣或文件的流行性、非均勻分布等性質(zhì)自適應(yīng)的調(diào)整文件的 復(fù)制,并基于文件查詢率動(dòng)態(tài)選擇查詢流量集中的節(jié)點(diǎn)作為復(fù)制節(jié)點(diǎn)來(lái)確保高的復(fù)制命中 率,但是EAD沒(méi)有考慮到各流行文件的查詢率的不同對(duì)搜索延遲的影響,而只有盡快降低 搜索頻率較高的流行文件的搜索延遲才能使網(wǎng)絡(luò)整體搜索延遲降低的更快,并且網(wǎng)絡(luò)中節(jié) 點(diǎn)的容量是有限的不能無(wú)差異的進(jìn)行分配,只有優(yōu)化資源配置,根據(jù)文件訪問(wèn)頻率的差異性將文件復(fù)制到那些能夠盡快的命中并使系統(tǒng)整體搜索延遲降低更快的節(jié)點(diǎn)上才能使系 統(tǒng)獲得更短的平均搜索路徑。
發(fā)明內(nèi)容
針對(duì)上述存在的技術(shù)問(wèn)題,本發(fā)明的目的是提供一種無(wú)結(jié)構(gòu)P2P網(wǎng)絡(luò)的副本復(fù)制 方法,首先在搜索過(guò)程中根據(jù)文件的訪問(wèn)頻率來(lái)確定待復(fù)制的流行文件,然后根據(jù)查詢發(fā) 起節(jié)點(diǎn)訪問(wèn)頻率的差異計(jì)算出中間轉(zhuǎn)發(fā)節(jié)點(diǎn)相對(duì)查詢發(fā)起節(jié)點(diǎn)的平均代價(jià),在各節(jié)點(diǎn)存儲(chǔ) 空間有限的條件下,將流行文件復(fù)制到那些代價(jià)最小的節(jié)點(diǎn)上。為達(dá)到上述目的,本發(fā)明采用如下的技術(shù)方案-流行性文件評(píng)估步驟,該步驟包括①針對(duì)每個(gè)節(jié)點(diǎn),統(tǒng)計(jì)每個(gè)節(jié)點(diǎn)自己在周期T內(nèi)發(fā)起的查詢信息,所述查詢信息 包含查詢目標(biāo)文件A和查詢次數(shù) ‘②統(tǒng)計(jì)系統(tǒng)在周期T內(nèi)總共發(fā)起的查詢次數(shù)、各文件的查詢率和系統(tǒng)平均查詢 率;③在周期T內(nèi),引入平滑因子評(píng)估文件的流行度;④根據(jù)評(píng)估的查詢率判斷文件是否是待復(fù)制的流行文件;-文件復(fù)制步驟,該步驟包括假定查詢發(fā)起源節(jié)點(diǎn)為S1, Lst,目標(biāo)節(jié)點(diǎn)為t1; L,tk,中間轉(zhuǎn)發(fā)節(jié)點(diǎn)為Ii1, L,H1①獲得流行文件對(duì)應(yīng)的查詢發(fā)起節(jié)點(diǎn)對(duì)各目標(biāo)文件的查詢頻率;②根據(jù)查詢發(fā)起節(jié)點(diǎn)的查詢頻率計(jì)算出周期T內(nèi)查詢發(fā)起節(jié)點(diǎn)對(duì)流行文件的訪 問(wèn)頻率矩陣;③根據(jù)流行文件在目標(biāo)節(jié)點(diǎn)上的命中記錄,從目標(biāo)節(jié)點(diǎn)的路由表中獲取各中間轉(zhuǎn) 發(fā)節(jié)點(diǎn)對(duì)查詢發(fā)起節(jié)點(diǎn)的距離矩陣;④根據(jù)訪問(wèn)頻率矩陣和距離矩陣,計(jì)算出中間節(jié)點(diǎn)針對(duì)目標(biāo)節(jié)點(diǎn)的搜索代價(jià)矩 陣;⑤根據(jù)代價(jià)矩陣獲得中間節(jié)點(diǎn)在給定搜索頻率下相對(duì)于目標(biāo)節(jié)點(diǎn)的總搜索代價(jià)
向量;⑥根據(jù)節(jié)點(diǎn)的剩余容量,將目標(biāo)文件復(fù)制到代價(jià)最小并有剩余容量的節(jié)點(diǎn)上。流行性文件評(píng)估步驟②中,統(tǒng)計(jì)各文件的查詢次數(shù)& =t"f,,η為網(wǎng)絡(luò)中節(jié)點(diǎn)的數(shù)
/=1
目,則在周期T內(nèi)節(jié)點(diǎn)發(fā)起的查詢總數(shù)乂 ,其中k為系統(tǒng)中不同文件的個(gè)數(shù);
I=I
NMa系統(tǒng)的平均查詢次數(shù)Mfl =4,系統(tǒng)平均查詢率為^ ,文件在周期T內(nèi)的訪問(wèn)
q kΝι
Nf
率 ⑴=式。流行性文件評(píng)估步驟③中,采用指數(shù)平滑的方法,引入平滑指數(shù)β (0 < β < 1), 計(jì)算出文件fi在周期T的流行度為4 (T) = β^ Pa (T-DHI-β)νΑ (T)。流行性文件評(píng)估步驟④中,將文件的流行度4 ( 和νΤ值進(jìn)行比較,如果& ( > ν,, 則文件fi是流行文件,其中i = 1,2,· · ·,k。
5
文件復(fù)制步驟②中,獲得查詢發(fā)起源節(jié)點(diǎn)對(duì)目標(biāo)節(jié)點(diǎn)的訪問(wèn)頻率矩陣
權(quán)利要求
1.一種無(wú)結(jié)構(gòu)P2P網(wǎng)絡(luò)的副本復(fù)制方法,其特征在于,包括以下步驟 -流行性文件評(píng)估步驟,該步驟包括①針對(duì)每個(gè)節(jié)點(diǎn),統(tǒng)計(jì)每個(gè)節(jié)點(diǎn)自己在周期T內(nèi)發(fā)起的查詢信息,所述查詢信息包含 查詢目標(biāo)文件fi和查詢次數(shù);②統(tǒng)計(jì)系統(tǒng)在周期T內(nèi)總共發(fā)起的查詢次數(shù)、各文件的查詢率和系統(tǒng)平均查詢率;③在周期T內(nèi),引入平滑因子評(píng)估文件的流行度;④根據(jù)評(píng)估的查詢率判斷文件是否是待復(fù)制的流行文件; -文件復(fù)制步驟,該步驟包括假定查詢發(fā)起源節(jié)點(diǎn)為S1, Lst,目標(biāo)節(jié)點(diǎn)為
2.根據(jù)權(quán)利要求1所述的無(wú)結(jié)構(gòu)P2P網(wǎng)絡(luò)的副本復(fù)制方法,其特征在于流行性文件評(píng)估步驟②中,統(tǒng)計(jì)各文件的查詢次數(shù)
3.根據(jù)權(quán)利要求1或2所述的無(wú)結(jié)構(gòu)P2P網(wǎng)絡(luò)的副本復(fù)制方法,其特征在于流行性文件評(píng)估步驟③中,采用指數(shù)平滑的方法,引入平滑指數(shù)β (0 < β < 1),計(jì)算 出文件fi在周期T的流行度為
4.根據(jù)權(quán)利要求3中任一項(xiàng)所述的無(wú)結(jié)構(gòu)Ρ2Ρ網(wǎng)絡(luò)的副本復(fù)制方法,其特征在于 流行性文件評(píng)估步驟④中,將文件的流行度4 (『)和ντ值進(jìn)行比較,如果& (O > ν,,則文件fi是流行文件,其中i = 1,2,···,k。
5.根據(jù)權(quán)利要求1所述的無(wú)結(jié)構(gòu)P2P網(wǎng)絡(luò)的副本復(fù)制方法,其特征在于 文件復(fù)制步驟②中,獲得查詢發(fā)起源節(jié)點(diǎn)對(duì)目標(biāo)節(jié)點(diǎn)的訪問(wèn)頻率矩陣
6.根據(jù)權(quán)利要求1所述的無(wú)結(jié)構(gòu)Ρ2Ρ網(wǎng)絡(luò)的副本復(fù)制方法,其特征在于 文件復(fù)制步驟③中,根據(jù)各節(jié)點(diǎn)的路由表計(jì)算出各中間節(jié)點(diǎn)對(duì)查詢發(fā)起節(jié)點(diǎn)的最短路
7.根據(jù)權(quán)利要求5或6所述的無(wú)結(jié)構(gòu)P2P網(wǎng)絡(luò)的副本復(fù)制方法,其特征在于 文件復(fù)制步驟④中,將矩陣D和F相乘得到中間節(jié)點(diǎn)針對(duì)目標(biāo)節(jié)點(diǎn)的搜索代價(jià)矩陣
8.根據(jù)權(quán)利要求7所述的無(wú)結(jié)構(gòu)P2P網(wǎng)絡(luò)的副本復(fù)制方法,其特征在于文件復(fù)制步驟⑤中,根據(jù)代價(jià)矩陣C,將每行的內(nèi)容求和計(jì)算出中間節(jié)點(diǎn)相對(duì)于目標(biāo)節(jié)C點(diǎn)的總搜索代價(jià)向量,即
9.根據(jù)權(quán)利要求1-8中任一項(xiàng)所述的無(wú)結(jié)構(gòu)P2P網(wǎng)絡(luò)的副本復(fù)制方法,其特征在于文件復(fù)制步驟⑥中,進(jìn)一步包括以下步驟假定節(jié)點(diǎn)Ili的剩余容量為流行文件fi的大小為Hli,則步驟1 從中間節(jié)點(diǎn)列表中取出總搜索代價(jià)最小并其值大于閾值W的節(jié)點(diǎn)IIi ;步驟2 從流行文件列表中按照流行性降序取出文件fi ;步驟3 判斷是否已經(jīng)復(fù)制,如果已經(jīng)復(fù)制,轉(zhuǎn)步驟4 ;否則轉(zhuǎn)步驟5 ;步驟4 取下一個(gè)流行文件轉(zhuǎn)步驟3 ;步驟5 判斷文件&的大小是否小于節(jié)點(diǎn)Iii的剩余容量即Hli < ri,如果大于,則轉(zhuǎn) 步驟4,否則轉(zhuǎn)步驟6;步驟6 將文件復(fù)制到節(jié)點(diǎn)Iii ; 步驟7 更新節(jié)點(diǎn)Iii的剩余負(fù)載。
全文摘要
本發(fā)明涉及對(duì)等網(wǎng)絡(luò)P2P技術(shù)領(lǐng)域,尤其涉及一種無(wú)結(jié)構(gòu)P2P網(wǎng)絡(luò)的副本復(fù)制方法。本發(fā)明首先在搜索過(guò)程中根據(jù)文件的訪問(wèn)頻率來(lái)確定待復(fù)制的流行文件,然后根據(jù)查詢發(fā)起節(jié)點(diǎn)訪問(wèn)頻率的差異計(jì)算出中間轉(zhuǎn)發(fā)節(jié)點(diǎn)相對(duì)查詢發(fā)起節(jié)點(diǎn)的平均代價(jià),在各節(jié)點(diǎn)存儲(chǔ)空間有限的條件下,將流行文件復(fù)制到那些代價(jià)最小的節(jié)點(diǎn)上。本發(fā)明解決了P2P系統(tǒng)中流行文件帶來(lái)的過(guò)大訪問(wèn)消耗問(wèn)題,降低流行性文件的搜索延遲減少網(wǎng)絡(luò)開(kāi)銷(xiāo)。
文檔編號(hào)H04L29/08GK102075563SQ201010598188
公開(kāi)日2011年5月25日 申請(qǐng)日期2010年12月21日 優(yōu)先權(quán)日2010年12月21日
發(fā)明者朱永瓊, 楊紅云, 胡瑞敏, 譚小瓊, 陳鐃 申請(qǐng)人:武漢大學(xué)