国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種用于Web服務(wù)推薦的協(xié)同過濾算法的制作方法

      文檔序號(hào):11386616閱讀:364來源:國(guó)知局
      本發(fā)明涉及一種用于web服務(wù)推薦的協(xié)同過濾算法,屬于web服務(wù)推薦的qos預(yù)測(cè)
      技術(shù)領(lǐng)域
      。
      背景技術(shù)
      :web服務(wù)是一種面向服務(wù)架構(gòu)的網(wǎng)絡(luò)交互技術(shù),也稱為www(worldwideweb),由眾多相互鏈接的超文本文檔(html)構(gòu)成。隨著web的發(fā)展,用戶很難在網(wǎng)絡(luò)中快速獲取到自己想要的信息,通常需要在大量重復(fù)無用的網(wǎng)頁之間艱難選擇,這就是信息過載問題。推薦系統(tǒng)可以有效處理信息過載的問題,從上世紀(jì)90年代開始,采用評(píng)分模式的推薦系統(tǒng)成為研究熱點(diǎn)。近十幾年來,推薦系統(tǒng)研究及開發(fā)一直吸引著眾多的學(xué)者與公司進(jìn)行投入,并已取得較大的發(fā)展及應(yīng)用。推薦系統(tǒng)的目的是為用戶推薦合適的服務(wù),所以用戶、推薦算法和服務(wù)構(gòu)成了推薦系統(tǒng)的工作模型。這里,推薦算法是核心要素。推薦算法一般來說分成三類:基于內(nèi)容的推薦算法、使用協(xié)同過濾的推薦算法、聯(lián)合以上兩種方法的推薦算法。協(xié)同過濾推薦算法分為基于歷史數(shù)據(jù)的、基于模型的、聯(lián)合兩者的協(xié)同過濾。傳統(tǒng)的基于用戶的協(xié)同過濾算法有皮爾遜相關(guān)系數(shù)(pcc)和向量夾角余弦算法,協(xié)同過濾(cf)是一種廣泛使用的服務(wù)推薦技術(shù),該類方法假設(shè),如果用戶1和用戶2訪問一部分服務(wù)的質(zhì)量相似,那么對(duì)于用戶2已經(jīng)訪問過的新服務(wù)而言,用戶1在使用該服務(wù)時(shí)會(huì)有相似的服務(wù)質(zhì)量。已有的基于用戶的cf算法使用web服務(wù)的服務(wù)質(zhì)量(qos)計(jì)算用戶之間的相似度,但是用戶的個(gè)性化偏好并不能直接體現(xiàn)在qos數(shù)據(jù)中。直接使用qos數(shù)據(jù)進(jìn)行相似性計(jì)算,會(huì)得到不真實(shí)的相似度結(jié)果。同時(shí),在真實(shí)世界中qos很好的服務(wù)可以為網(wǎng)絡(luò)環(huán)境不同的用戶提供相似的高質(zhì)量服務(wù),而qos很差的服務(wù)對(duì)于所有用戶而言都不能正常的訪問,即如果某一個(gè)服務(wù)對(duì)于不同的用戶而言qos值差異不大,那么該服務(wù)在計(jì)算用戶之間相似度時(shí)作用不大。技術(shù)實(shí)現(xiàn)要素:本發(fā)明所要解決的技術(shù)問題是提供一種用于web服務(wù)推薦的協(xié)同過濾算法,基于用戶偏好和服務(wù)可信度,能夠有效提高qos預(yù)測(cè)準(zhǔn)確率,從而提高web服務(wù)推薦質(zhì)量。本發(fā)明為了解決上述技術(shù)問題采用以下技術(shù)方案:本發(fā)明設(shè)計(jì)了一種用于web服務(wù)推薦的協(xié)同過濾算法,基于用戶偏好和服務(wù)可信度,針對(duì)web服務(wù)進(jìn)行過濾,并向用戶進(jìn)行推薦,包括如下步驟:步驟a.利用qos訓(xùn)練樣本集q構(gòu)造用戶偏好數(shù)據(jù)集sat;步驟b.利用qos訓(xùn)練樣本集q構(gòu)造服務(wù)可信度數(shù)據(jù)集c;步驟c.將服務(wù)可信度數(shù)據(jù)集c作為比重,聯(lián)合用戶偏好數(shù)據(jù)集sat,計(jì)算各用戶之間的偏好相似度;步驟d.分別針對(duì)各個(gè)用戶,根據(jù)各用戶之間相似度,采用top-k算法,獲得各個(gè)用戶分別所對(duì)應(yīng)的優(yōu)先相似鄰居集合n(um);其中,1≤m≤m,m表示所有用戶的總數(shù),um表示所有用戶中的第m位用戶;步驟e.分別針對(duì)各個(gè)用戶,根據(jù)用戶所對(duì)應(yīng)的優(yōu)先相似鄰居集合n(um),結(jié)合該用戶與其優(yōu)先相似鄰居集合n(um)中各用戶的偏好相似度,計(jì)算獲得該用戶相對(duì)各個(gè)服務(wù)的缺失qos預(yù)測(cè)值p(um,sn),進(jìn)而獲得各個(gè)用戶分別相對(duì)各個(gè)服務(wù)的缺失qos預(yù)測(cè)值p(um,sn);其中,1≤n≤n,n表示所有服務(wù)的總數(shù),sn表示所有服務(wù)中的第n個(gè)服務(wù);步驟f.分別針對(duì)各個(gè)用戶,根據(jù)用戶相對(duì)各個(gè)服務(wù)的缺失qos預(yù)測(cè)值p(um,sn),向用戶推薦qos優(yōu)秀的候選未知服務(wù),并采用mae評(píng)價(jià)準(zhǔn)則輸出該用戶所對(duì)應(yīng)的qos預(yù)測(cè)值相較于真實(shí)值的準(zhǔn)確率結(jié)果。作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述步驟a,利用qos訓(xùn)練樣本集q構(gòu)造用戶偏好數(shù)據(jù)集sat,包括如下:給定用戶集合u={u1,…,um,…,um},給定服務(wù)集合s={s1,…,sn,…,sn};定義satm,n表示用戶um對(duì)服務(wù)sn的偏好,并構(gòu)建一個(gè)mxn的用戶偏好矩陣satmxn;同時(shí)構(gòu)建一個(gè)mxn的qos矩陣qmxn,qm,n表示用戶um訪問服務(wù)sn的qos值,然后由qos數(shù)據(jù)中提取用戶偏好,構(gòu)造用戶偏好數(shù)據(jù)集sat。作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述satm,n如下:其中公式(2)和公式(3)中,min(um)表示用戶um訪問的最小的qos值,max(um)表示用戶um訪問的最大的qos值。作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述步驟b,利用qos訓(xùn)練樣本集q,由qos數(shù)據(jù)中提取服務(wù)可信度,并定義c1,n為服務(wù)sn的可信度,并構(gòu)建一個(gè)1xn的服務(wù)可信度矩陣c1xn,構(gòu)造服務(wù)可信度數(shù)據(jù)集c。作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述c1,n如下:公式(4)中,qn表示服務(wù)sn全部已知qos值的集合,表示服務(wù)sn全部已知qos值的平均值,|qn|表示服務(wù)sn全部已知qos值的數(shù)量,δ是預(yù)設(shè)閾值。作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述步驟c中,將服務(wù)可信度數(shù)據(jù)集c作為比重,聯(lián)合用戶偏好數(shù)據(jù)集sat,計(jì)算各用戶之間的偏好相似度,具體如下:定義用戶相似度矩陣simm×m,sim(u,v)表示用戶v對(duì)于用戶u之間的偏好相似度,v∈u,u∈u,v≠u,定義服務(wù)可信度比重ωj,這里ωn=c1,n,sim(u,v)的計(jì)算如公式(5)所示:其中,isat表示用戶u和用戶v共同訪問的web服務(wù)集合,n屬于isat是集合中的一個(gè)服務(wù);satu,n和satv,n分別表示用戶u和用戶v對(duì)服務(wù)n的偏好,和分別表用戶u和用戶v對(duì)各自訪問的web服務(wù)的偏好平均值。作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述步驟e中,分別針對(duì)各個(gè)用戶,根據(jù)用戶所對(duì)應(yīng)的優(yōu)先相似鄰居集合n(um),結(jié)合該用戶與其優(yōu)先相似鄰居集合n(um)中各用戶的偏好相似度,聯(lián)合pcc算法,采用如下公式:計(jì)算獲得該用戶相對(duì)各個(gè)服務(wù)的缺失qos預(yù)測(cè)值p(um,sn),進(jìn)而獲得各個(gè)用戶分別相對(duì)各個(gè)服務(wù)的缺失qos預(yù)測(cè)值p(um,sn);其中,1≤n≤n,n表示所有服務(wù)的總數(shù),sn表示所有服務(wù)中的第n個(gè)服務(wù);sim(um,v')表示用戶um與用戶v'之間的偏好相似度,qv',n用戶v'訪問服務(wù)sn的qos值;表示用戶v'對(duì)于所有已知服務(wù)的訪問平均值;表示用戶um對(duì)于除sn以外所有已知服務(wù)的訪問平均值。本發(fā)明所述一種用于web服務(wù)推薦的協(xié)同過濾算法采用以上技術(shù)方案與現(xiàn)有技術(shù)相比,具有以下技術(shù)效果:本發(fā)明設(shè)計(jì)的用于web服務(wù)推薦的協(xié)同過濾算法,針對(duì)傳統(tǒng)基于用戶協(xié)同過濾算法的不足,首先從原qos數(shù)據(jù)中提取出用戶偏好數(shù)據(jù),將其作為相似鄰居近似度計(jì)算的源數(shù)據(jù);其次從原qos數(shù)據(jù)中提取出服務(wù)可信度數(shù)據(jù),將其作為服務(wù)的個(gè)性化比重融入用戶鄰居相似度計(jì)算的過程中;然后使用top-k算法確定目標(biāo)用戶的相似鄰居集合;最后聯(lián)合用戶鄰居的偏好相似度比重使用調(diào)和的皮爾遜相關(guān)系數(shù)算法(pcc)預(yù)測(cè)目標(biāo)用戶各未知服務(wù)的qos值,并且通過wsdream庫(kù)上197萬條真實(shí)web服務(wù)qos數(shù)據(jù)集進(jìn)行的實(shí)驗(yàn),證明了所提算法相比于目前基于協(xié)同過濾的web服務(wù)推薦算法,能有效提高qos預(yù)測(cè)準(zhǔn)確率從而提高web服務(wù)推薦質(zhì)量。附圖說明圖1是本發(fā)明所設(shè)計(jì)用于web服務(wù)推薦的協(xié)同過濾算法的流程示意圖。具體實(shí)施方式下面結(jié)合說明書附圖對(duì)本發(fā)明的具體實(shí)施方式作進(jìn)一步詳細(xì)的說明。如圖1所示,本發(fā)明設(shè)計(jì)了一種用于web服務(wù)推薦的協(xié)同過濾算法,基于用戶偏好和服務(wù)可信度,針對(duì)web服務(wù)進(jìn)行過濾,并向用戶進(jìn)行推薦,實(shí)際應(yīng)用過程當(dāng)中,具體包括如下步驟:步驟a.利用qos訓(xùn)練樣本集q構(gòu)造用戶偏好數(shù)據(jù)集sat,具體包括如下:給定用戶集合u={u1,…,um,…,um},給定服務(wù)集合s={s1,…,sn,…,sn};定義satm,n表示用戶um對(duì)服務(wù)sn的偏好,并構(gòu)建一個(gè)mxn的用戶偏好矩陣satmxn;同時(shí)構(gòu)建一個(gè)mxn的qos矩陣qmxn,qm,n表示用戶um訪問服務(wù)sn的qos值。用戶偏好從qos數(shù)據(jù)中提取并提供兩種評(píng)價(jià)準(zhǔn)則,準(zhǔn)則1,qos值(可靠性等)越高用戶越滿意;準(zhǔn)則2,qos值(響應(yīng)時(shí)間等)越低用戶越滿意。然后由qos數(shù)據(jù)中提取用戶偏好,構(gòu)造用戶偏好數(shù)據(jù)集sat,其中,satm,n如下:其中,公式(2)和公式(3)中,min(um)表示用戶um訪問的最小的qos值,max(um)表示用戶um訪問的最大的qos值。步驟b.利用qos訓(xùn)練樣本集q,由qos數(shù)據(jù)中提取服務(wù)可信度,并定義c1,n為服務(wù)sn的可信度,并構(gòu)建一個(gè)1xn的服務(wù)可信度矩陣c1xn,構(gòu)造服務(wù)可信度數(shù)據(jù)集c;真實(shí)世界中,qos很好的服務(wù)可以為網(wǎng)絡(luò)環(huán)境不同的用戶提供相似的高質(zhì)量服務(wù),而qos很差的服務(wù)對(duì)于所有用戶而言都不能正常的訪問,即如果某一個(gè)服務(wù)對(duì)于不同的用戶而言qos值差異不大,那么該服務(wù)在計(jì)算用戶之間相似度時(shí)作用不大;所以在計(jì)算用戶之間相似度時(shí),也要考慮服務(wù)本身的可信度,即服務(wù)是否對(duì)不同的用戶有不同的qos表現(xiàn)。其中,c1,n如下:公式(4)中,qn表示服務(wù)sn全部已知qos值的集合,表示服務(wù)sn全部已知qos值的平均值,|qn|表示服務(wù)sn全部已知qos值的數(shù)量,δ是預(yù)設(shè)閾值。步驟c.將服務(wù)可信度數(shù)據(jù)集c作為比重,聯(lián)合用戶偏好數(shù)據(jù)集sat,計(jì)算各用戶之間的偏好相似度,具體如下:定義用戶相似度矩陣simm×m,sim(u,v)表示用戶v對(duì)于用戶u之間的偏好相似度,v∈u,u∈u,v≠u,定義服務(wù)可信度比重ωj,這里ωn=c1,n,sim(u,v)的計(jì)算如公式(5)所示:其中,isat表示用戶u和用戶v共同訪問的web服務(wù)集合,n屬于isat是集合中的一個(gè)服務(wù);satu,n和satv,n分別表示用戶u和用戶v對(duì)服務(wù)n的偏好,和分別表用戶u和用戶v對(duì)各自訪問的web服務(wù)的偏好平均值。步驟d.分別針對(duì)各個(gè)用戶,根據(jù)各用戶之間相似度,采用top-k算法,獲得各個(gè)用戶分別所對(duì)應(yīng)的優(yōu)先相似鄰居集合n(um);其中,1≤m≤m,m表示所有用戶的總數(shù),um表示所有用戶中的第m位用戶。步驟e.分別針對(duì)各個(gè)用戶,根據(jù)用戶所對(duì)應(yīng)的優(yōu)先相似鄰居集合n(um),結(jié)合該用戶與其優(yōu)先相似鄰居集合n(um)中各用戶的偏好相似度,聯(lián)合pcc算法,采用如下公式:計(jì)算獲得該用戶相對(duì)各個(gè)服務(wù)的缺失qos預(yù)測(cè)值p(um,sn),進(jìn)而獲得各個(gè)用戶分別相對(duì)各個(gè)服務(wù)的缺失qos預(yù)測(cè)值p(um,sn);其中,1≤n≤n,n表示所有服務(wù)的總數(shù),sn表示所有服務(wù)中的第n個(gè)服務(wù);sim(um,v')表示用戶um與用戶v'之間的偏好相似度,qv',n用戶v'訪問服務(wù)sn的qos值;表示用戶v'對(duì)于所有已知服務(wù)的訪問平均值;表示用戶um對(duì)于除sn以外所有已知服務(wù)的訪問平均值。步驟f.分別針對(duì)各個(gè)用戶,根據(jù)用戶相對(duì)各個(gè)服務(wù)的缺失qos預(yù)測(cè)值p(um,sn),向用戶推薦qos優(yōu)秀的候選未知服務(wù),并采用mae評(píng)價(jià)準(zhǔn)則輸出該用戶所對(duì)應(yīng)的qos預(yù)測(cè)值相較于真實(shí)值的準(zhǔn)確率結(jié)果。將本發(fā)明所設(shè)計(jì)用于web服務(wù)推薦的協(xié)同過濾算法,應(yīng)用在wsdream數(shù)據(jù)庫(kù)上進(jìn)行實(shí)驗(yàn),并將傳統(tǒng)的協(xié)同過濾推薦算法upcc、ipcc、wsrec和最新的協(xié)同過濾推薦算法ppsr作為對(duì)比算法。實(shí)驗(yàn)中使用的qos屬性為web服務(wù)的響應(yīng)時(shí)間(responsetime)和吞吐量(throughput)。wsdream數(shù)據(jù)集收集了全球30個(gè)國(guó)家的339個(gè)用戶和70多個(gè)國(guó)家的5825個(gè)web服務(wù),包含197萬多條真實(shí)的web服務(wù)qos訪問記錄,分為響應(yīng)時(shí)間和吞吐量?jī)蓚€(gè)部分。響應(yīng)時(shí)間指的是從用戶發(fā)出服務(wù)的調(diào)用指令開始直至接收到目標(biāo)服務(wù)的相關(guān)響應(yīng)結(jié)果為止所花費(fèi)的時(shí)間;吞吐量指的是以比特為信息量單位的在通信信道中每秒成功交付的數(shù)據(jù)包平均大小的值。矩陣的密度定義為訓(xùn)練集的密度(density),我們的算法運(yùn)行在6個(gè)不同的密度上,分別是5%、10%、15%、20%、25%、30%。如果矩陣的密度是10%,那么矩陣中10%的數(shù)據(jù)組成訓(xùn)練集,剩下90%的數(shù)據(jù)組成測(cè)試集。每種算法做10次隨機(jī)實(shí)驗(yàn),取mae的平均值作為實(shí)驗(yàn)結(jié)果。最終的實(shí)驗(yàn)結(jié)果證明了upiccf算法相比于目前基于協(xié)同過濾的web服務(wù)推薦算法,能有效提高qos預(yù)測(cè)準(zhǔn)確率從而提高web服務(wù)推薦質(zhì)量。方法5%10%15%20%25%30%upcc0.6360.5550.5150.4860.4670.454ipcc0.6340.5940.5100.4560.4330.416wsrec0.6250.5820.5010.4500.4270.411ppsr0.6090.5420.4890.4400.4220.409upiccf0.5760.5180.4570.4210.4100.403表2方法5%10%15%20%25%30%upcc27.21822.61220.47119.26118.25817.462ipcc27.01826.19525.55823.97322.57521.565wsrec26.75722.37020.21918.92817.89117.080ppsr21.83617.85315.93314.90814.13213.733upiccf19.03215.61914.27213.58213.10812.774表3如上表2所示rt庫(kù)上upiccf算法與對(duì)比算法的mae比較結(jié)果,以及表3所示tp庫(kù)上upiccf算法與對(duì)比算法的mae比較結(jié)果,可以看出,基于用戶偏好和服務(wù)可信度的協(xié)同過濾算法upiccf在rt庫(kù)上和tp庫(kù)上均實(shí)現(xiàn)了最低的mae值,即擁有最佳的qos預(yù)測(cè)準(zhǔn)確率,我們?cè)谠撗芯糠较蛏系墓ぷ魇怯幸饬x的。上面結(jié)合附圖對(duì)本發(fā)明的實(shí)施方式作了詳細(xì)說明,但是本發(fā)明并不限于上述實(shí)施方式,在本領(lǐng)域普通技術(shù)人員所具備的知識(shí)范圍內(nèi),還可以在不脫離本發(fā)明宗旨的前提下做出各種變化。當(dāng)前第1頁12
      當(dāng)前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1