国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于標(biāo)準(zhǔn)標(biāo)簽和項目評分的推薦方法

      文檔序號:6501155閱讀:232來源:國知局
      一種基于標(biāo)準(zhǔn)標(biāo)簽和項目評分的推薦方法
      【專利摘要】基于標(biāo)準(zhǔn)標(biāo)簽和項目評分的推薦方法具有如下特征:本發(fā)明將標(biāo)簽標(biāo)準(zhǔn)化,即將用戶的自定義標(biāo)簽映射到語義較明確的標(biāo)準(zhǔn)標(biāo)簽上,再利用標(biāo)準(zhǔn)標(biāo)簽建立用戶興趣模型,然后根據(jù)用戶的興趣模型計算用戶之間的相似度,建立近鄰用戶群,再基于目標(biāo)用戶及其近鄰用戶的項目評分和改進的Slope?one算法預(yù)測用戶對未評項目的評分,進而實現(xiàn)個性化推薦,可顯著提高Web2.0互聯(lián)網(wǎng)上廣泛使用的可進行自由定義的標(biāo)簽的可用性,利用基于標(biāo)準(zhǔn)標(biāo)簽的用戶興趣模型計算用戶之間的相似度,并為目標(biāo)用戶建立相似用戶群,能夠縮小目標(biāo)用戶的相關(guān)項目評分搜索范圍,減少算法的計算量,改進了Slope?one算法的項目評分預(yù)測,提高了興趣愛好相近的用戶對預(yù)測評分的貢獻,從而提高互聯(lián)網(wǎng)個性化推薦質(zhì)量。
      【專利說明】一種基于標(biāo)準(zhǔn)標(biāo)簽和項目評分的推薦方法
      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及一種標(biāo)簽標(biāo)準(zhǔn)化和自動快速地向社交網(wǎng)絡(luò)用戶進行個性化推薦的解決方案。主要用于解決如何有效利用用戶自定義標(biāo)簽和用戶對一些項目的評分進行個性化推薦的問題,屬于數(shù)據(jù)挖掘【技術(shù)領(lǐng)域】。
      【背景技術(shù)】
      [0002]隨著網(wǎng)絡(luò)時代的來臨,互聯(lián)網(wǎng)的規(guī)模不斷擴大,復(fù)雜多樣的信息充斥著網(wǎng)絡(luò),同時也帶來了信息“超負(fù)載(information overload)”的問題。用戶無法在過量的信息中迅速獲取對自己有用的資源,降低了信息的利用率,許多有用的信息不能被及時發(fā)現(xiàn)甚至不能被發(fā)現(xiàn),造成了“資源浪費”。個性化推薦系統(tǒng)(personalized recommender system)的出現(xiàn)很好地解決了這個問題。個性化推薦研究利用用戶預(yù)先提供的數(shù)據(jù)或是利用數(shù)據(jù)挖掘等技術(shù)從用戶的歷史記錄中收集用戶的偏好,幫助用戶獲取感興趣的信息,結(jié)合推薦算法,為用戶推薦其可能感興趣的資源。本發(fā)明中,每項資源也稱為項目。如果推薦系統(tǒng)能夠為用戶提供高質(zhì)量的推薦服務(wù),將會在提高用戶忠誠度和防止用戶流失方面發(fā)揮很大的作用。
      [0003]用戶興趣模型和個性化推薦算法是個性化推薦技術(shù)中的兩個重要核心,用戶興趣模型的質(zhì)量關(guān)系著用戶的興趣愛好能否被正確的表示,而高效的推薦方法則是推薦質(zhì)量的良好保證。用戶興趣模型是一種形式化的,可計算的數(shù)據(jù)結(jié)構(gòu),模型的興趣特征是影響用戶興趣模型質(zhì)量的主要因素。近年來,Web2.0環(huán)境下信息組織方式之一標(biāo)簽逐漸進入研究者們的視野,標(biāo)簽因為其自由定義、無約束、可共享等特點被認(rèn)為是一種包含了用戶興趣的“關(guān)鍵詞”,并逐漸應(yīng)用在個性化推薦領(lǐng)域。事實上,只要用戶創(chuàng)建的標(biāo)簽?zāi)軌虮蛔约豪斫?,?biāo)簽自身真正的含義與用戶的意圖是否相符無關(guān)緊要,因此標(biāo)簽存在較嚴(yán)重的語義問題,這種語義問題也直接導(dǎo)致了用戶興趣模型準(zhǔn)確率的降低;個性化推薦算法根據(jù)用戶的興趣愛好為其做出合適的推薦,直接關(guān)系個性化推薦系統(tǒng)的質(zhì)量和性能。Slope one算法具有較好的推薦質(zhì)量和推薦速度,常被用來做實時推薦,但是同時也存在著以下問題影響著算法的運算效率和精度:
      [0004]( I)相關(guān)的項目評分?jǐn)?shù)量可能很大。項目的評分預(yù)測是全局的,用戶對某未評項目j的評分是根據(jù)其他用戶對相關(guān)項目與項目j的平均評分差值以及該用戶已有項目評分來預(yù)測的。隨著相關(guān)的項目評分?jǐn)?shù)據(jù)的增多,計算項目j與其他項目評分差將是一個非常大的開銷,不僅會對推薦的精度造成影響,對算法的運算速度也會產(chǎn)生一定的影響。
      [0005](2)用戶針對性不強。用戶u對項目j的預(yù)測評分是涉及到所有對項目j評價過的用戶,這種計算方式過濾掉了一些不相關(guān)的用戶,但是由于面向的是全局用戶,一些滿足項目評分要求但是興趣完全相反的用戶也會被計算在內(nèi),從而會導(dǎo)致預(yù)測結(jié)果的偏差。例如預(yù)測UserC對項目i的評分,設(shè)UserA與UserC的興趣愛好相同,對項目的評分習(xí)慣也類似,UserB與UserA、UserC的興趣完全不同,對項目的喜愛程度也完全不同,那么可能出現(xiàn)根據(jù)UserA對項目的評價,預(yù)測得到UserC對項目i的評分為5,而根據(jù)UserA和UserB對項目的評價,預(yù)測得到UserC對項目i評分為2,顯然后一個預(yù)測結(jié)果不合情理。[0006]綜上可見,標(biāo)簽不能準(zhǔn)確表達用戶的興趣愛好;傳統(tǒng)的Slope one算法雖然避免計算用戶相似度,減少了計算時間,卻避免不了極大的計算量和物理空間消耗;傳統(tǒng)的Slope one的預(yù)測精度也有一定的提高空間。

      【發(fā)明內(nèi)容】
      [0007]本發(fā)明的目的:提供一種先將自定義標(biāo)簽映射為標(biāo)準(zhǔn)標(biāo)簽,再基于標(biāo)準(zhǔn)標(biāo)簽建立用戶興趣模型,再基于興趣模型計算用戶相似度獲悉近鄰用戶群,進而基于相關(guān)用戶評分信息以及用戶相似度對目標(biāo)用戶進行項目推薦的互聯(lián)網(wǎng)智能推薦方法,以及實現(xiàn)流程,用于解決當(dāng)前標(biāo)簽存在的語義模糊、難以利用的問題,以及當(dāng)前簡單利用標(biāo)簽的個性化推薦方法準(zhǔn)確度不高、計算量大、空間消耗過大等問題。本發(fā)明可顯著提高Web2.0互聯(lián)網(wǎng)上廣泛使用的可進行自由定義的標(biāo)簽的可用性,并提高互聯(lián)網(wǎng)個性化推薦(即區(qū)分用戶進行項目推薦)的推薦質(zhì)量。
      [0008]本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:本發(fā)明將標(biāo)簽標(biāo)準(zhǔn)化,即將用戶的自定義標(biāo)簽映射到語義較明確的標(biāo)準(zhǔn)標(biāo)簽上,再利用標(biāo)準(zhǔn)標(biāo)簽建立用戶興趣模型,然后根據(jù)用戶的興趣模型計算用戶之間的相似度,建立近鄰用戶群,再基于已有的項目評分?jǐn)?shù)據(jù)和改進的Slope one算法預(yù)測用戶對未評項目的評分,進而實現(xiàn)個性化推薦,其目標(biāo)是解決標(biāo)簽的語義模糊問題,降低用戶興趣模型的維度,在不增加時間消耗的情況下,提高推薦算法的準(zhǔn)確度,減少推薦算法的計算量及物理空間消耗。
      [0009]社交網(wǎng)絡(luò)中標(biāo)簽是用戶在無規(guī)律約束的條件下自主創(chuàng)造的,用戶可以使用若干標(biāo)簽來標(biāo)注若干項目,同一項目可以被多個標(biāo)簽標(biāo)注。雖然計算機不能夠像人腦一樣直接理解或糾正標(biāo)簽的語義,但是通過標(biāo)簽與項目之間的關(guān)系,可以從標(biāo)注的項目中反映出標(biāo)簽的含義。本發(fā)明中使用如下概念和計算公式:
      [0010](I)標(biāo)準(zhǔn)標(biāo)簽(Standard Tag):語義公認(rèn)明確的標(biāo)簽,且各標(biāo)簽之間的相關(guān)度很小。初始標(biāo)準(zhǔn)標(biāo)簽集合由人為制定的標(biāo)準(zhǔn)標(biāo)簽組成,并存入標(biāo)準(zhǔn)標(biāo)簽庫。以后根據(jù)用戶自定義標(biāo)簽標(biāo)注的信息按照一定的規(guī)則適當(dāng)擴充標(biāo)準(zhǔn)標(biāo)簽庫。
      [0011](2)標(biāo)簽標(biāo)準(zhǔn)化:將用戶的自定義標(biāo)簽映射到標(biāo)準(zhǔn)標(biāo)簽上的過程。無法映射的用戶自定義標(biāo)簽可暫時作為標(biāo)準(zhǔn)標(biāo)簽,但不并入標(biāo)準(zhǔn)標(biāo)簽庫。
      [0012](3)屬性共現(xiàn)率:在若干屬性中出現(xiàn)同一個詞的概率,也簡稱為共現(xiàn)率。例如,屬性值”ab”在下列屬性序列”ab I Cd”、”a I ab | S”、,,xcd | ab”、” iuy | ab | dfw”(各個屬性值之間用” I”分隔)中的共獻率為I。
      [0013](4)標(biāo)簽\和\的互信息I(ti;tp以及熵Hai)定義為:
      [0014]
      【權(quán)利要求】
      1.一種標(biāo)簽標(biāo)準(zhǔn)化,其特征主要在于自定義標(biāo)簽的標(biāo)準(zhǔn)化步驟, 步驟I)根據(jù)個性化推薦應(yīng)用環(huán)境,選擇網(wǎng)站提供的熱門標(biāo)簽作為標(biāo)準(zhǔn)標(biāo)簽,或根據(jù)應(yīng)用領(lǐng)域人工定義標(biāo)準(zhǔn)標(biāo)簽,建立標(biāo)準(zhǔn)標(biāo)簽庫; 步驟2)對每個用戶自定義標(biāo)簽做如下操作, 步驟21)將其與標(biāo)準(zhǔn)標(biāo)簽做簡單的字符串匹配,若匹配成功則直接將其映射到標(biāo)準(zhǔn)標(biāo)簽上,否則轉(zhuǎn)步驟22); 步驟22)若該用戶自定義標(biāo)簽標(biāo)注的所有項目中含有共現(xiàn)率為I的屬性值,則將所有這樣的屬性值作為標(biāo)準(zhǔn)標(biāo)簽,并將該用戶自定義標(biāo)簽映射到這些標(biāo)準(zhǔn)標(biāo)簽上,并將它們并入標(biāo)準(zhǔn)標(biāo)簽庫;若不存在這樣的屬性,則轉(zhuǎn)步驟3); 步驟3)使用基于互信息的標(biāo)簽聚類方法,將步驟I)和步驟2)標(biāo)準(zhǔn)化失敗的所有用戶的自定義標(biāo)簽映射到標(biāo)準(zhǔn)標(biāo)簽庫中的標(biāo)簽上;設(shè)此時自定義標(biāo)簽集合為TP,含m個標(biāo)簽;標(biāo)準(zhǔn)標(biāo)簽庫中的標(biāo)簽組成集合Ts,含η個標(biāo)簽;將Ts中的標(biāo)簽作為聚類中心;相關(guān)閥值為δ,當(dāng)標(biāo)簽間的相關(guān)度小于δ時,認(rèn)為標(biāo)簽之間不相關(guān);分為以下幾步: 步驟31)按照式(3)計算集合Tp和Ts中所有標(biāo)簽之間的相關(guān)度;式(3)為
      2.一種基于標(biāo)準(zhǔn)標(biāo)簽和項目評分的推薦方法,方法包括權(quán)利要求1所述的自定義標(biāo)簽的標(biāo)準(zhǔn)化,基于標(biāo)準(zhǔn)標(biāo)簽建立用戶興趣模型,計算用戶相似度,以及基于相似用戶的相關(guān)評分和用戶相似度預(yù)測用戶對項目的評分,其特征在于方法所包含的步驟: 步驟I)利用權(quán)利要求1的標(biāo)準(zhǔn)標(biāo)簽生成用戶的興趣模型,使用基于向量空間模型的表示法建立用戶的興趣模型;記當(dāng)前標(biāo)準(zhǔn)標(biāo)簽集合為TS,TS=U1, t2,...,tj,η= I TS I,用戶興趣模型為:Kt1, WU1)),(t2, w(t2)),...,(tn, W (tn))},其中ti(l≤i≤n)表示用戶的興趣項(也即標(biāo)準(zhǔn)標(biāo)簽),w(ti)表示用戶對興趣項\的權(quán)重;用戶Ui的興趣模型中的任一興趣項權(quán)重采用TF-1DF方法按式(5 )計算,公式(5 )為w
      【文檔編號】G06F17/30GK103678431SQ201310101242
      【公開日】2014年3月26日 申請日期:2013年3月26日 優(yōu)先權(quán)日:2013年3月26日
      【發(fā)明者】成衛(wèi)青, 楊晶, 洪龍, 楊庚, 黃衛(wèi)東, 吳旭東, 唐旋 申請人:南京郵電大學(xué)
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1