一種基于多指標(biāo)評(píng)分的推薦算法

文檔序號(hào)：9375863閱讀：482來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種基于多指標(biāo)評(píng)分的推薦算法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及電子商務(wù)推薦系統(tǒng)的技術(shù)領(lǐng)域，尤其是指一種基于多指標(biāo)評(píng)分的推薦算法。
【背景技術(shù)】
[0002] 通過主動(dòng)為用戶推送其可能感興趣的信息或者服務(wù)，推薦系統(tǒng)幫助用戶獲取更多有用信息并且節(jié)省檢索時(shí)間。傳統(tǒng)推薦系統(tǒng)的實(shí)現(xiàn)主要依賴于協(xié)同過濾技術(shù)，雖然在一定范圍內(nèi)取得了成功，但是協(xié)同過濾技術(shù)往往只利用單一的綜合評(píng)分對(duì)用戶的喜好進(jìn)行刻畫，綜合評(píng)分只能刻畫用戶喜歡一個(gè)商品的程度，對(duì)用戶喜歡該商品的原因卻一無所知。為了對(duì)用戶的喜好信息進(jìn)行更加細(xì)致的刻畫并提高推薦結(jié)果的準(zhǔn)確性，新興的推薦系統(tǒng)應(yīng)致力于獲取用戶對(duì)商品不同指標(biāo)的評(píng)分信息并加以利用。在這里，指標(biāo)表示商品共有的屬性，譬如，對(duì)于酒店，其地理位置、房間、服務(wù)等都可以用戶描述該酒店優(yōu)劣的指標(biāo)。
[0003] 隨著Web 2.0技術(shù)的出現(xiàn)與發(fā)展，越來越多的大型網(wǎng)站鼓勵(lì)用戶以多種方式與網(wǎng) 站進(jìn)行互動(dòng)，這使得推薦系統(tǒng)獲取并利用多指標(biāo)評(píng)分信息成為可能。近年來，許多學(xué)者在強(qiáng) 調(diào)多指標(biāo)評(píng)分重要性的同時(shí)，也指出用戶為商品撰寫的評(píng)論具有重要意義，這類商品評(píng)論往往包含了大量用戶對(duì)商品的評(píng)價(jià)信息，換而言之，除了由用戶直接提供之外，多指標(biāo)評(píng)分也可以依賴一定的評(píng)論挖掘技術(shù)由商品評(píng)論中獲取。
[0004] 目前，基于多指標(biāo)評(píng)分的推薦系統(tǒng)與基于商品評(píng)論挖掘的推薦系統(tǒng)均取得了一定的研究成果。但是，這些研究成果很大程度上基于一個(gè)既定假設(shè)：用戶對(duì)所有的商品均采取相同的指標(biāo)偏好，實(shí)際上，這樣的假設(shè)與我們的日常認(rèn)知存在誤差。

【發(fā)明內(nèi)容】

[0005] 本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足，提供一種基于多指標(biāo)評(píng)分的推薦算法，以解決用戶對(duì)于不同的商品可能具有不同的指標(biāo)偏好的個(gè)性化推薦問題。
[0006] 為實(shí)現(xiàn)上述目的，本發(fā)明所提供的技術(shù)方案為：一種基于多指標(biāo)評(píng)分的推薦算法，包括以下步驟：
[0007] 1)指標(biāo)關(guān)鍵詞的識(shí)別
[0008] I. 1)將數(shù)據(jù)集中的每一條評(píng)論分割成句子Ix1, X2，…}，并且構(gòu)造一個(gè)由具有表征性的關(guān)鍵字組成的列表；
[0009] 1. 2)根據(jù)原始的關(guān)鍵字列表，將評(píng)論語(yǔ)料庫(kù)中的每一個(gè)句子標(biāo)識(shí)至與其具有最大詞頻重合度的指標(biāo)；
[0010] 1.3)使用X2統(tǒng)計(jì)指標(biāo)衡量每一個(gè)指標(biāo)與關(guān)鍵字之間的詞頻關(guān)系，并將前t個(gè)具有最尚詞頻依賴關(guān)系的關(guān)鍵字加入該指標(biāo)的關(guān)鍵字列表中；
[0011] 1. 4)重復(fù)上述過程直至算法滿足終止條件，即指標(biāo)的關(guān)鍵字列表保持不變或者算法的循環(huán)次數(shù)到達(dá)閾值；
[0012] 2)意見評(píng)分抽取
[0013] 在識(shí)別商品指標(biāo)及其相關(guān)的特征關(guān)鍵字之后，對(duì)評(píng)論中的語(yǔ)句進(jìn)行語(yǔ)法分析并抽取用戶對(duì)指標(biāo)或者特征關(guān)鍵字的意見；
[0014] 對(duì)于每一條評(píng)論，它關(guān)于第k個(gè)指標(biāo)的意見評(píng)分計(jì)算如下：
[0015]
[0016] 其中，s表示表述意見的形容詞；OPk表示由關(guān)于第k個(gè)指標(biāo)的意見形容詞組成的集合；|〇P k|表示集合元素的個(gè)數(shù)；score (s)表示形容詞s的意見極性，即+1、-1或者〇 ;通過這樣的方式，非結(jié)構(gòu)化的評(píng)論文本可以轉(zhuǎn)化為一個(gè)由意見評(píng)分組成的向量Ouil = [O^1,;抽取出來的意見評(píng)分的取值范圍為[-1，1]，而用戶直接給出的多指標(biāo)評(píng) 分的范圍則為[1，5]，為了使得兩者具有相同的取值范圍，采用等距離轉(zhuǎn)換的方式將意見評(píng) 分轉(zhuǎn)換至區(qū)間[1，5]之內(nèi)，具體轉(zhuǎn)換公式如下：
[0017] Oafter= 〇 before X 2+3
[0018] 其中，0 aftCT分別表示轉(zhuǎn)換前后的意見評(píng)分?jǐn)?shù)據(jù)，通過采用上式，可以確保多指標(biāo)評(píng)分?jǐn)?shù)據(jù)與意見評(píng)分?jǐn)?shù)據(jù)具有相同的取值范圍，由此可以將兩者分別直接用于進(jìn)行推薦的過程并比較它們的作用；
[0019] 3)用戶和商品相似度矩陣構(gòu)建
[0020] 在推薦系統(tǒng)中，使用U = Iu1，…，un}表示用戶的集合，I = U1，…，im}表示商品的集合，其中η和m分別表示用戶和商品的總數(shù)；一個(gè)用戶對(duì)于某一商品的評(píng)價(jià)可以表示為一個(gè)由綜合評(píng)分和多指標(biāo)評(píng)分構(gòu)成的評(píng)分向量r = [r。，IV··，rk]，其中r。表示綜合評(píng)分， A…，4表示關(guān)于k個(gè)指標(biāo)的評(píng)分，該評(píng)分向量也可以由綜合評(píng)分和意見評(píng)分構(gòu)成，即r = [r。，cv··，0k]，其中r。，cv··，〇k表示從用戶撰寫的商品評(píng)論中挖掘得到的意見評(píng)分；在實(shí)驗(yàn) 過程中，可以直接將r = [rQ，ri…，rk]替換為r = [rQ，cv"，0k]并用于聚類與推薦的過程之中；目標(biāo)是同時(shí)對(duì)用戶Iu 1，…，uj和商品U1，…，ij聚類為c個(gè)簇；聚類結(jié)果應(yīng)該被表示為一個(gè)分塊矩陣M e [0, 1](n+m)x'其中每個(gè)元素 Mli j表示相應(yīng)的元素對(duì)象i屬于簇j的概率，因此，當(dāng)元素對(duì)象i屬于簇j的時(shí)候Mli 0,否則MI 0 ;由于M h j的大小直接反應(yīng) 了該元素對(duì)象i屬于簇j的可能性，所以分塊矩陣M的每一行之和要求為1 ;此外，如果限制每一個(gè)元素對(duì)象能夠加入的簇的最大個(gè)數(shù)，譬如1個(gè)簇，即1 < 1 < c，那么最多只可能在 M中的每一行中得到1個(gè)非零值；上述分塊矩陣可以被改寫為：
[0021]
[0022] 兵ψ，F(xiàn) t LU, 1」'…刀關(guān)于用戶的分塊矩陣，Q e [0, 1] mXe為關(guān)于商品的分塊矩陣；
[0023] 對(duì)于用戶，相似性矩陣SU e [-1，l]nXn采用以下方式進(jìn)行構(gòu)建：
[0024]
[0025] 其中，rXii和r yii分別表不用戶ujP Uy對(duì)商品i的評(píng)分向量，☆和.分別表不用戶 UdPuy的平均評(píng)分向量，ci "表示用PuJPuy共同評(píng)論過的商品集合，|ci "I表示屬于 (：1"的商品的個(gè)數(shù)；關(guān)于商品的相似性矩陣SI e [-1，1] 可以采用以下方式進(jìn)行構(gòu)建：
[0026]
[0027] 其中，rUiX和r Uiy分別表不用戶u對(duì)商品i jP i y的評(píng)分向量，&和&分別表不用戶屯和uy的平均評(píng)分向量，cux,y表示曾經(jīng)對(duì)商品i JP iy進(jìn)行過評(píng)分的用戶集合，IcuJ表示屬于CU"的用戶的個(gè)數(shù)；
[0028] 4)使用雙向聚類算法得到聚類矩陣
[0029] 為了能夠?qū)τ脩艉蜕唐愤M(jìn)行雙向聚類，提出通過最小化以下目標(biāo)函數(shù)將緊密相關(guān) 的用戶或者商品關(guān)聯(lián)起來；
[0030]
[0031] 其中，P1是分塊矩陣P的第i行，是關(guān)于用戶的對(duì)角度矩陣，計(jì)算方式為
_ Q1是分塊矩陣Q的第i行，盡Γ和是關(guān)于商品的對(duì) 角度矩陣，計(jì)算方式爻
J-I 一 -?：
[0032] 通過代數(shù)轉(zhuǎn)換，上式可以轉(zhuǎn)化為：
[0033]
[0036] Ine Rnxn表示單位矩陣；求解以下優(yōu)化問題：
[0037]
[0038] 滿足：M e [0, 1] (n+m)Xc，Plc= I n+m，Ipi I = 1，i = 1，···，（n+m);參數(shù) c 是聚類的簇的個(gè)數(shù)以及1是每個(gè)用戶或者商品可以屬于的簇的最大個(gè)數(shù)，即1彡1彡c ;另外，符號(hào)卜表示一個(gè)向量的非零元素的個(gè)數(shù)；
[0039] 提出一個(gè)兩階段的策略對(duì)上式進(jìn)行求解，具體描述如下：
[0040] 4. 1)搜索一個(gè)共享低維空間對(duì)所有的用戶和商品信息進(jìn)行表示，最優(yōu)的保留用戶和商品信息的t維矩陣Z'可以通過對(duì)以下問題求解獲取：
[0041]
[0042] 則~."一 L，丄」，/Z = It;其中，I tG Rtxt表示單位矩陣并且ZtZ =仁;在這里，ZTZ = It主要用于避免矩陣Z任意擴(kuò)展；由于k是一個(gè)半正定矩陣，所以對(duì)于最優(yōu)解可以通過對(duì)特征值問題KZ= λζ進(jìn)行求解獲得，也就是t ζ?ζρ-,ζ」，其中Z1，…，Zt 是根據(jù)矩陣k的特征值保留的最小特征向量；
[0043] 4.2)對(duì)用戶與商品同時(shí)進(jìn)行聚類，即雙向聚類；
[0044] 考慮到用戶與商品均可以同時(shí)出現(xiàn)在一個(gè)或者多個(gè)簇內(nèi)，提出對(duì)在最大程度上保留了用戶與商品信息的矩陣t上執(zhí)行Fuzzy C-Means聚類算法；執(zhí)行Fuzzy C-Means聚類算法的過程，也就是對(duì)以下目標(biāo)函數(shù)進(jìn)行迭代優(yōu)化的過程：
[0045]

[0046] 其中M1,;表示元素 e i屬于簇j的概率，V ;表示簇j的中心；函數(shù)d(.)表示歐幾里得距離函數(shù)，Θ表示用于控制聚類結(jié)果的模糊程度的參數(shù)；在每一次迭代過程中，算法根據(jù)以下式子更新矩陣M和V的元素：
[0047]
[0048]
[0049] 其中卜（辦+ I，j = 1，…，c如果在兩個(gè)連續(xù)的迭代過程中目標(biāo)函數(shù)min J(M，V)的差距不小于閾值

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2 3 4 5

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：陳健;林世杭;
技術(shù)所有人：華南理工大學(xué);
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種基于多指標(biāo)評(píng)分的推薦算法