專(zhuān)利名稱(chēng):一種信息推薦方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及互聯(lián)網(wǎng)領(lǐng)域的信息推薦技木,尤其涉及ー種信息推薦方法和設(shè)備。
背景技術(shù):
互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,極大地改變了人們的工作生活,通過(guò)互聯(lián)網(wǎng)瀏覽網(wǎng)頁(yè)、看新聞、看電影以及聽(tīng)音樂(lè)等已經(jīng)成為許多人工作生活中不可缺少的一部分,而為了讓用戶(hù)更快捷地找到自己感興趣的新聞、電影或音樂(lè),信息推薦技術(shù)正逐漸隨著互聯(lián)網(wǎng)的高速發(fā)展而興起?,F(xiàn)有技術(shù)中,存在ー種將MinHash用于用戶(hù)聚類(lèi)以實(shí)現(xiàn)新聞推薦的信息推薦技術(shù),稱(chēng)為 MinHash 推薦技術(shù)。其中,MinHash(Minwise IndependentPermutation Hashing) 是ー種符合交換獨(dú)立條件的哈希技木,用于估算兩個(gè)集合之間的相似度。MinHash推薦技術(shù)的原理為如果用V表示元素的全集,那么隨機(jī)哈希函數(shù)就可以表示成f:VヰR,R是實(shí)數(shù)集。如果敘和)Cb是全集中任意兩個(gè)不同的元素,那么哈希函數(shù)必須滿(mǎn)足兩個(gè)條件, f(Xa) ^ f(Xb)和P(f (Xa) < f(Xb)) = 0. 5,其中,Ρ(·)表示概率。這兩個(gè)條件的意思是, 任意兩個(gè)不同的元素的哈希值不能相等,并且任意ー個(gè)元素的哈希值小于另ー個(gè)元素的哈希值的概率是0. 5,即不同元素的哈希值的大小關(guān)系必須是隨機(jī)的。在這樣的哈希函數(shù)的基礎(chǔ)上,如果A是全集V上的子集,MinHash中子集A的哈希值被定義為h(f’A)= min ...................................................[1]
XeA那么對(duì)于同樣的哈希函數(shù),集合A和B的哈希值相同的概率是PiKf, A) = Kf, B)) =...........................................[2]式( 右邊表示集合A和集合B的相似度,即集合A和B的哈希值相同的概率等于集合A和B的相似度。若將用戶(hù)表示成ー個(gè)元素集合,MinHash推薦的過(guò)程為首先用MinHash將用戶(hù)聚為若干個(gè)類(lèi),此處設(shè)用戶(hù)U屬于類(lèi)別C,用戶(hù)u與類(lèi)別C的相似度表示為sim(u,c);然后對(duì)于這個(gè)類(lèi)里面的每個(gè)元素Ci,計(jì)算這個(gè)元素在類(lèi)里面出現(xiàn)的次數(shù)COUNT (Ci),井根據(jù)該次數(shù)和相似度來(lái)確定元素ci推薦給用戶(hù)的分?jǐn)?shù)sim(u,c)^COUNT(Ci)。對(duì)于類(lèi)別c的所有元素,都生成這樣ー個(gè)推薦分?jǐn)?shù),然后根據(jù)分?jǐn)?shù)排序,將分值高且用戶(hù)自身不包含的元素推薦給用戶(hù)。在一個(gè)用戶(hù)可以屬于多個(gè)類(lèi)別的情況下,處理也是類(lèi)似的,即首先對(duì)每個(gè)類(lèi)別做如上所述的處理,然后把類(lèi)別里面的所有元素合在一起,并對(duì)相同元素的分?jǐn)?shù)累加,最終得到一個(gè)長(zhǎng)的推薦列表,排序之后推薦給用戶(hù)。通常,衡量ー種信息推薦技術(shù)的推薦效果可以考慮兩個(gè)方面的因素,ー個(gè)是使用該信息推薦技術(shù)向信息推薦時(shí),推薦結(jié)果被用戶(hù)接受的概率,即信息推薦的精確度;另ー個(gè)方面是使用該信息推薦技術(shù)向信息推薦時(shí),能夠得到推薦的用戶(hù)占所有用戶(hù)的比例,即信息推薦的覆蓋率。由MinHash推薦技術(shù)的特點(diǎn)可以得出=MinHash推薦技術(shù)中,聚類(lèi)的精確度與信息推薦的精確度是成正比的,而聚類(lèi)的召回率(對(duì)應(yīng)信息推薦中的覆蓋率)與信息推薦的覆蓋率是成正比的,因此為了提高信息推薦的推薦效果,可以通過(guò)提高聚類(lèi)的精確度或召回率來(lái)實(shí)現(xiàn)。現(xiàn)有技術(shù)中,為了提高M(jìn)inHash推薦技術(shù)中聚類(lèi)的精確度,可以取ρ個(gè)不同的哈希函數(shù),要求同一個(gè)類(lèi)里面的集合的哈希值都要相等。但是這樣做的缺點(diǎn)是導(dǎo)致聚類(lèi)的召回率快速降低。為了提高召回率,可以取q組不同的哈希函數(shù),每組都有ρ個(gè)不同的哈希函數(shù),對(duì)于每個(gè)集合A,根據(jù)每組哈希函數(shù)生成ー個(gè)速寫(xiě)(sketch),該速寫(xiě)由ρ個(gè)哈希值構(gòu)成,具體形式可以多祥,比如哈希值之間可以用逗號(hào)或“」’號(hào)隔開(kāi)。對(duì)于每ー個(gè)集合A,得到q個(gè)速寫(xiě)。給定兩個(gè)集合,只要有ー個(gè)速寫(xiě)是ー樣的,就把這兩個(gè)集合聚在一起。這樣增加了聚在一起的概率,能有效地提高聚類(lèi)的召回率;但也同時(shí)降低了類(lèi)間相似度,也就降低了聚類(lèi)的精確度?,F(xiàn)有信息推薦技術(shù)難以對(duì)聚類(lèi)的精確度和召回率進(jìn)行權(quán)衡,即無(wú)法兼顧聚類(lèi)的精確度和召回率。
發(fā)明內(nèi)容
本發(fā)明提供ー種信息推薦方法和設(shè)備,用以兼顧聚類(lèi)的精確度和召回率,進(jìn)而改善推薦效果,為此,本發(fā)明實(shí)施例采用如下技術(shù)方案ー種信息推薦方法,應(yīng)用于互聯(lián)網(wǎng)應(yīng)用系統(tǒng),所述應(yīng)用系統(tǒng)中設(shè)置有多個(gè)精確度不同的聚類(lèi)模型,該方法包括所述應(yīng)用系統(tǒng)按照聚類(lèi)模型精確度遞減的順序,依次使用相應(yīng)聚類(lèi)模型對(duì)用戶(hù)所對(duì)應(yīng)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理,以確定用戶(hù)元素集合所屬的類(lèi)別,直到聚類(lèi)召回率滿(mǎn)足設(shè)定要求時(shí)停止聚類(lèi)處理;所述應(yīng)用系統(tǒng)根據(jù)聚類(lèi)結(jié)果對(duì)所述用戶(hù)元素集合對(duì)應(yīng)的用戶(hù)進(jìn)行信息推薦。優(yōu)選地,所述根據(jù)聚類(lèi)結(jié)果對(duì)所述用戶(hù)元素集合對(duì)應(yīng)的用戶(hù)進(jìn)行信息推薦,具體為根據(jù)所述用戶(hù)元素集合,對(duì)所述用戶(hù)元素集合所屬類(lèi)別中的元素進(jìn)行推薦排序, 并根據(jù)推薦排序結(jié)果,選擇不屬于該用戶(hù)元素集合的元素推薦給所述用戶(hù)元素集合對(duì)應(yīng)的用戶(hù)。優(yōu)選地,所述按照聚類(lèi)模型精確度遞減的順序,依次使用相應(yīng)聚類(lèi)模型對(duì)用戶(hù)所對(duì)應(yīng)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理,直到聚類(lèi)召回率滿(mǎn)足設(shè)定要求時(shí)停止聚類(lèi)處理,具體為使用精度最高的聚類(lèi)模型對(duì)所有用戶(hù)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理,若有用戶(hù)元素集合未被聚類(lèi),則使用精度次之的聚類(lèi)模型對(duì)未被聚類(lèi)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理, 以此類(lèi)推,直到聚類(lèi)召回率滿(mǎn)足設(shè)定要求時(shí)停止聚類(lèi)處理。優(yōu)選地,所述按照聚類(lèi)模型精確度遞減的順序,依次使用相應(yīng)聚類(lèi)模型對(duì)用戶(hù)所對(duì)應(yīng)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理,直到聚類(lèi)召回率滿(mǎn)足設(shè)定要求時(shí)停止聚類(lèi)處理,具體
6為使用精度最高的聚類(lèi)模型對(duì)所有用戶(hù)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理,若有用戶(hù)元素集合未被聚類(lèi),則使用精度次之的聚類(lèi)模型對(duì)所有用戶(hù)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理, 以此類(lèi)推,直到聚類(lèi)召回率滿(mǎn)足設(shè)定要求時(shí)停止聚類(lèi)處理。優(yōu)選地,所述根據(jù)聚類(lèi)結(jié)果對(duì)所述用戶(hù)元素集合對(duì)應(yīng)的用戶(hù)進(jìn)行信息推薦,具體為根據(jù)所述用戶(hù)元素集合,分別在不同聚類(lèi)模型下的聚類(lèi)結(jié)果中,對(duì)所述用戶(hù)元素集合所屬類(lèi)別中的元素按推薦分?jǐn)?shù)從高到低的順序進(jìn)行推薦排序;根據(jù)聚類(lèi)模型的精確度從高到低的順序,優(yōu)先將精確度高的聚類(lèi)模型下的推薦結(jié)果推薦給所述用戶(hù)元素集合對(duì)應(yīng)的用戶(hù);其中,同一聚類(lèi)模型下的推薦結(jié)果按推薦分?jǐn)?shù)從高到低的順序依次推薦,不同聚類(lèi)模型下的相同推薦結(jié)果以精確度高的聚類(lèi)模型下的推薦排序結(jié)果進(jìn)行推薦,推薦給用戶(hù)的元素中不包括屬于該用戶(hù)元素集合的元素。優(yōu)選地,所述根據(jù)聚類(lèi)結(jié)果對(duì)所述用戶(hù)元素集合對(duì)應(yīng)的用戶(hù)進(jìn)行信息推薦,具體為根據(jù)所述用戶(hù)元素集合,對(duì)各聚類(lèi)模型下所述用戶(hù)元素集合所屬類(lèi)別中的元素的推薦分?jǐn)?shù)進(jìn)行加權(quán),并將加權(quán)后的推薦分?jǐn)?shù)按從高到低的順序進(jìn)行推薦排序,其中,精確度高的聚類(lèi)模型下所述用戶(hù)元素集合所屬類(lèi)別中的元素的推薦分?jǐn)?shù)加權(quán)權(quán)重高于精確度低的聚類(lèi)模型下所述用戶(hù)元素集合所屬類(lèi)別中的元素的推薦分?jǐn)?shù)的加權(quán)權(quán)重;根據(jù)推薦排序結(jié)果,將各聚類(lèi)模型下所述用戶(hù)元素集合所屬類(lèi)別中的元素推薦給所述用戶(hù)元素集合所對(duì)應(yīng)的用戶(hù),其中,推薦給用戶(hù)的元素中不包括屬于該用戶(hù)元素集合的元素。優(yōu)選地,所述多個(gè)精確度不同的聚類(lèi)模型為多個(gè)具有相同哈希函數(shù)組數(shù)量、但每個(gè)哈希函數(shù)組中的哈希函數(shù)數(shù)量不同的MinHash聚類(lèi)模型,所述多個(gè)MinHash聚類(lèi)模型的精度,按照哈希函數(shù)組中的哈希函數(shù)數(shù)量遞減的順序遞減;或者所述多個(gè)精確度不同的聚類(lèi)模型為多個(gè)具有不同哈希函數(shù)組數(shù)量、但每個(gè)哈希函數(shù)組中的哈希函數(shù)數(shù)量相同的MinHash聚類(lèi)模型,所述多個(gè)MinHash聚類(lèi)模型的精度,按照哈希函數(shù)組數(shù)量遞增的順序遞減。本發(fā)明實(shí)施例還提供一種信息推薦設(shè)備,應(yīng)用于互聯(lián)網(wǎng)應(yīng)用系統(tǒng),包括存儲(chǔ)模塊,用于存儲(chǔ)多個(gè)精確度不同的聚類(lèi)模型;聚類(lèi)模塊,用于按照存儲(chǔ)模塊中存儲(chǔ)的聚類(lèi)模型精確度遞減的順序,依次使用相應(yīng)聚類(lèi)模型對(duì)用戶(hù)所對(duì)應(yīng)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理,以確定用戶(hù)元素集合所屬的類(lèi)別,直到聚類(lèi)召回率滿(mǎn)足設(shè)定要求時(shí)停止聚類(lèi)處理;推薦模塊,用于根據(jù)聚類(lèi)結(jié)果對(duì)所述用戶(hù)元素集合對(duì)應(yīng)的用戶(hù)進(jìn)行信息推薦。優(yōu)選地,所述推薦模塊具體用干,根據(jù)所述用戶(hù)元素集合,對(duì)所述用戶(hù)元素集合所屬類(lèi)別中的元素進(jìn)行推薦排序, 并根據(jù)推薦排序結(jié)果,選擇不屬于該用戶(hù)元素集合的元素推薦給所述用戶(hù)元素集合對(duì)應(yīng)的用戶(hù)。優(yōu)選地,所述聚類(lèi)模塊具體用干,使用精度最高的聚類(lèi)模型對(duì)所有用戶(hù)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理,若有用戶(hù)元素集合未被聚類(lèi),則使用精度次之的聚類(lèi)模型對(duì)未被聚類(lèi)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理, 以此類(lèi)推,直到聚類(lèi)召回率滿(mǎn)足設(shè)定要求時(shí)停止聚類(lèi)處理。優(yōu)選地,所述聚類(lèi)模塊具體用干,使用精度最高的聚類(lèi)模型對(duì)所有用戶(hù)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理,若有用戶(hù)元素集合未被聚類(lèi),則使用精度次之的聚類(lèi)模型對(duì)所有用戶(hù)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理, 以此類(lèi)推,直到聚類(lèi)召回率滿(mǎn)足設(shè)定要求時(shí)停止聚類(lèi)處理。優(yōu)選地,所述推薦模塊具體用干,根據(jù)所述用戶(hù)元素集合,分別在不同聚類(lèi)模型下的聚類(lèi)結(jié)果中,對(duì)所述用戶(hù)元素集合所屬類(lèi)別中的元素按推薦分?jǐn)?shù)從高到低的順序進(jìn)行推薦排序;根據(jù)聚類(lèi)模型的精確度從高到低的順序,優(yōu)先將精確度高的聚類(lèi)模型下的推薦結(jié)果推薦給所述用戶(hù)元素集合對(duì)應(yīng)的用戶(hù);其中,同一聚類(lèi)模型下的推薦結(jié)果按推薦分?jǐn)?shù)從高到低的順序依次推薦,不同聚類(lèi)模型下的相同推薦結(jié)果以精確度高的聚類(lèi)模型下的推薦排序結(jié)果進(jìn)行推薦,推薦給用戶(hù)的元素中不包括屬于該用戶(hù)元素集合的元素。優(yōu)選地,所述推薦模塊具體用干,根據(jù)所述用戶(hù)元素集合,對(duì)各聚類(lèi)模型下所述用戶(hù)元素集合所屬類(lèi)別中的元素的推薦分?jǐn)?shù)進(jìn)行加權(quán),并將加權(quán)后的推薦分?jǐn)?shù)按從高到低的順序進(jìn)行推薦排序,其中,精確度高的聚類(lèi)模型下所述用戶(hù)元素集合所屬類(lèi)別中的元素的推薦分?jǐn)?shù)加權(quán)權(quán)重高于精確度低的聚類(lèi)模型下所述用戶(hù)元素集合所屬類(lèi)別中的元素的推薦分?jǐn)?shù)的加權(quán)權(quán)重;根據(jù)推薦排序結(jié)果,將各聚類(lèi)模型下所述用戶(hù)元素集合所屬類(lèi)別中的元素推薦給所述用戶(hù)元素集合所對(duì)應(yīng)的用戶(hù),其中,推薦給用戶(hù)的元素中不包括屬于該用戶(hù)元素集合的元素。優(yōu)選地,所述存儲(chǔ)模塊具體用于,存儲(chǔ)多個(gè)具有相同哈希函數(shù)組數(shù)量、但每個(gè)哈希函數(shù)組中的哈希函數(shù)數(shù)量不同的MinHash聚類(lèi)模型;所述聚類(lèi)模塊具體用干,按照哈希函數(shù)組中的哈希函數(shù)數(shù)量遞減的順序依次使用相應(yīng)聚類(lèi)模型對(duì)用戶(hù)所對(duì)應(yīng)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理,以確定用戶(hù)元素集合所屬的類(lèi)別,直到聚類(lèi)召回率滿(mǎn)足設(shè)定要求時(shí)停止聚類(lèi)處理;或,所述儲(chǔ)存模塊具體用于,存儲(chǔ)多個(gè)具有不同哈希函數(shù)組數(shù)量、但每個(gè)哈希函數(shù)組中的哈希函數(shù)數(shù)量相同的MinHash聚類(lèi)模型;所述聚類(lèi)模塊具體用干,按照哈希函數(shù)組數(shù)量遞增的順序依次使用相應(yīng)聚類(lèi)模型對(duì)用戶(hù)所對(duì)應(yīng)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理,以確定用戶(hù)元素集合所屬的類(lèi)別,直到聚類(lèi)召回率滿(mǎn)足設(shè)定要求時(shí)停止聚類(lèi)處理。與現(xiàn)有技術(shù)相比,本發(fā)明實(shí)施例具有以下優(yōu)點(diǎn)通過(guò)建立不同參數(shù)的聚類(lèi)模型,并根據(jù)所述聚類(lèi)模型精確度從高到低的順序依次使用所述聚類(lèi)模型對(duì)用戶(hù)進(jìn)行聚類(lèi)。一方面,相似度較高的用戶(hù)在精確度高的聚類(lèi)模型下保證了聚類(lèi)精確度;另ー方面,相似度較低的用戶(hù)在精確度較低的聚類(lèi)模型下被聚類(lèi)的可能性増大,即在增大聚類(lèi)召回率的同吋,保證了聚類(lèi)精確度,提高了信息推薦效果。
圖1為本發(fā)明一個(gè)實(shí)施例提供的信息推薦方法的流程示意圖2為本發(fā)明另ー實(shí)施例提供的信息推薦方法的流程示意圖;圖3為本發(fā)明再一實(shí)施例提供的信息推薦方法的流程示意圖;圖4為本發(fā)明實(shí)施例提供的信息推薦設(shè)備的結(jié)構(gòu)示意圖。
具體實(shí)施例方式本發(fā)明實(shí)施例提供的信息推薦方案中,通過(guò)建立多個(gè)參數(shù)不同的聚類(lèi)模型,使用該多個(gè)聚類(lèi)模型對(duì)用戶(hù)進(jìn)行聚類(lèi),在増大聚類(lèi)召回率的同吋,保證了精確度,從而改善了信息推薦的推薦效果。在本發(fā)明實(shí)施例提供的技術(shù)方案中,每個(gè)用戶(hù)對(duì)應(yīng)于ー個(gè)包含有用于描述對(duì)象屬性的元素的用戶(hù)元素集合。例如,在音樂(lè)類(lèi)應(yīng)用系統(tǒng)中,每個(gè)系統(tǒng)用戶(hù)都對(duì)應(yīng)有用戶(hù)元素集合,集合中的元素可包括音樂(lè)名稱(chēng)或類(lèi)型等音樂(lè)對(duì)象的屬性信息,可以是該用戶(hù)在一段時(shí)間內(nèi)訪問(wèn)過(guò)的歌曲的名稱(chēng)。例如,如果要對(duì)某一特定時(shí)間段內(nèi),使用用戶(hù)所訪問(wèn)過(guò)的歌曲名稱(chēng)的集合來(lái)表示該用戶(hù)對(duì)應(yīng)的用戶(hù)元素集合,則在該時(shí)間段內(nèi)甲、乙、丙、丁四個(gè)用戶(hù)的用戶(hù)元素集合分別表示為甲={A,B,C,D},乙={A,B,C,E},丙={A,C,E,F(xiàn)},丁= {G}。如果甲、乙、丙三個(gè)用戶(hù)被聚到ー個(gè)類(lèi)中,則按現(xiàn)有推薦技術(shù)的方法分別對(duì)A至F六首歌按推薦分?jǐn)?shù)從高到低進(jìn)行排序(推薦分?jǐn)?shù)相同的歌隨機(jī)排序),如排序結(jié)果為A、C、B、E、D、F,則在向甲進(jìn)行音樂(lè)推薦時(shí),優(yōu)先級(jí)最高的為E,其次為F(對(duì)于用戶(hù)A訪問(wèn)過(guò)的歌曲則不進(jìn)行推薦),同理,向乙進(jìn)行音樂(lè)推薦吋,優(yōu)先級(jí)最高的為D,其次為F,向丙進(jìn)行音樂(lè)推薦吋,優(yōu)先級(jí)最高的為B,其次為D。丁未被聚到任何ー個(gè)類(lèi)中,即沒(méi)有找到與丁聽(tīng)音樂(lè)相似度高的用戶(hù),丁將無(wú)法得到推薦?!獋€(gè)聚類(lèi)模型的聚類(lèi)精確度越高,使用該聚類(lèi)模型對(duì)用戶(hù)進(jìn)行聚類(lèi)后,一個(gè)類(lèi)中的用戶(hù)之間相似度越高(在本發(fā)明實(shí)施例中可以表示喜歡的音樂(lè)類(lèi)型相似度越高),根據(jù)該聚類(lèi)結(jié)果進(jìn)行音樂(lè)推薦吋,推薦的音樂(lè)被用戶(hù)所接受的概率就越大,因此聚類(lèi)精確度越高,信息推薦的精確度也越高。另ー方面,一個(gè)聚類(lèi)模型的聚類(lèi)召回率越高,使用該聚類(lèi)模型對(duì)用戶(hù)進(jìn)行聚類(lèi)后,能被聚到類(lèi)中的概率就増大,即用戶(hù)中能被聚類(lèi)的用戶(hù)的比例也就増大了,根據(jù)該聚類(lèi)結(jié)果進(jìn)行音樂(lè)推薦吋,能得到推薦的用戶(hù)的比例也就越大,即音樂(lè)推薦的覆蓋率就越大。本發(fā)明實(shí)施例通過(guò)建立多個(gè)精確度不同的聚類(lèi)模型,在進(jìn)行聚類(lèi)時(shí)使用該多個(gè)聚類(lèi)模型對(duì)用戶(hù)進(jìn)行聚類(lèi)處理,從而在増大聚類(lèi)的召回率的同吋,保證聚類(lèi)的精確度,進(jìn)而改善信息推薦的效果。下面將結(jié)合本發(fā)明的實(shí)施例中的附圖,對(duì)本發(fā)明的實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,下面所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明的實(shí)施例保護(hù)的范圍。如圖1所示,為本發(fā)明實(shí)施例提供的ー種信息推薦方法的流程示意圖,該方法應(yīng)用于設(shè)置有多個(gè)精確度不同的聚類(lèi)模型的應(yīng)用系統(tǒng)中,該方法包括以下步驟步驟101、應(yīng)用系統(tǒng)按照聚類(lèi)模型精確度遞減的順序,依次使用相應(yīng)聚類(lèi)模型對(duì)用戶(hù)所對(duì)應(yīng)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理,直到聚類(lèi)召回率滿(mǎn)足設(shè)定要求時(shí)停止聚類(lèi)處理。
步驟102、應(yīng)用系統(tǒng)根據(jù)聚類(lèi)結(jié)果對(duì)用戶(hù)元素集合對(duì)應(yīng)的用戶(hù)進(jìn)行信息推薦。步驟102具體可以是根據(jù)所述用戶(hù)元素集合,對(duì)所述用戶(hù)元素集合所屬類(lèi)別中的元素進(jìn)行推薦排序,并根據(jù)推薦排序結(jié)果,選擇不屬于該用戶(hù)元素集合的元素推薦給所述用戶(hù)元素集合對(duì)應(yīng)的用戶(hù)。本發(fā)明實(shí)施例通過(guò)建立多個(gè)精確度不同的聚類(lèi)模型,在進(jìn)行聚類(lèi)時(shí)使用該多個(gè)聚類(lèi)模型對(duì)用戶(hù)進(jìn)行聚類(lèi)處理,從而在増大聚類(lèi)的召回率的同吋,保證聚類(lèi)的精確度,進(jìn)而改善信息推薦的效果。根據(jù)MinHash聚類(lèi)的特性可知,MinHash聚類(lèi)模型(表示為P_q)的精確度可以通過(guò)參數(shù)P和q的來(lái)調(diào)節(jié),其中P為每個(gè)哈希函數(shù)組中哈希函數(shù)的數(shù)量,q為哈希函數(shù)組的數(shù)量。本發(fā)明實(shí)施例中,在對(duì)用戶(hù)進(jìn)行聚類(lèi)之前,可先通過(guò)選擇不同的P和q值建立多個(gè)精確度不同的MinHash聚類(lèi)模型。具體的,可以采用以下方式建立多個(gè)精確度不同的MinHash 聚類(lèi)模型方式一保持q值不變,通過(guò)改變?chǔ)阎祦?lái)改變聚類(lèi)模型的精確度,以建立精確度不同的聚類(lèi)模型。如固定q= 10,分別建立聚類(lèi)模型1_10、2_10、3_10和4_10。當(dāng)q值不變吋,聚類(lèi)模型的精確度隨著P值的增大而増大,即聚類(lèi)模型1_10、2_10、3_10和4_10的精確度是遞增的;方式ニ 保持ρ值不變,通過(guò)改變q值來(lái)改變聚類(lèi)模型的精確度,以建立精確度不同的聚類(lèi)模型。如固定り=4,分別建立聚類(lèi)模型4_8、4_9、4_10和4_11。當(dāng)ρ值不變吋, 聚類(lèi)模型的精確度隨著q值的增大而減小,即聚類(lèi)模型4_8、4_9、4_10和4_11的精確度是遞減的;方式三同時(shí)調(diào)節(jié)ρ值和q值來(lái)改變聚類(lèi)模型的精確度,以建立精確度不同的聚類(lèi)模型。如分別建立聚類(lèi)模型4_8、3_9、6_10和5_7。這樣建立起來(lái)的多個(gè)MinHash聚類(lèi)模型,其精確度并不能象上述方式一和方式ニ一祥,比較直觀的確定出來(lái),但可以通過(guò)實(shí)驗(yàn)等方式確定出各聚類(lèi)模型的精確度大小關(guān)系。基于上述建立起來(lái)的多個(gè)精確度不同的MinHash聚類(lèi)模型,本發(fā)明的一個(gè)實(shí)施例提供的信息推薦流程可如圖2所示。在互聯(lián)網(wǎng)應(yīng)用中,用戶(hù)聚類(lèi)以及信息推薦的處理通常由相應(yīng)的互聯(lián)網(wǎng)應(yīng)用系統(tǒng)進(jìn)行,當(dāng)需要對(duì)用戶(hù)進(jìn)行聚類(lèi),井根據(jù)聚類(lèi)結(jié)果為用戶(hù)進(jìn)行信息推薦時(shí),該流程可包括步驟201、互聯(lián)網(wǎng)應(yīng)用系統(tǒng)按照MinHash聚類(lèi)模型精確度遞減的順序,依次使用相應(yīng)聚類(lèi)模型對(duì)未被聚類(lèi)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理,直到聚類(lèi)召回率滿(mǎn)足要求時(shí)停止聚類(lèi)處理。具體的,首先使用精確度最高的聚類(lèi)模型對(duì)待聚類(lèi)的所有用戶(hù)元素集合進(jìn)行聚類(lèi)處理,由于精確度較高,因此有可能有部分用戶(hù)元素集合未被聚類(lèi),即這些用戶(hù)元素集合未聚類(lèi)到任何類(lèi)別中,也就是在當(dāng)前聚類(lèi)模型下未被覆蓋到,針對(duì)這些用戶(hù)元素集合,可使用精確度次之的MinHash聚類(lèi)模型進(jìn)行聚類(lèi)處理,以此類(lèi)推,直到聚類(lèi)召回率滿(mǎn)足預(yù)設(shè)的要求時(shí)停止聚類(lèi)處理。使用某種精確度的MinHash聚類(lèi)模型所實(shí)現(xiàn)的聚類(lèi)過(guò)程,可采用現(xiàn)有方式實(shí)現(xiàn),在此不贅述。對(duì)于采用上述方式一所建立的多個(gè)MinHash聚類(lèi)模型,如p_q值分別為1_10、 2_10、3_10和4_10的多個(gè)MinHash聚類(lèi)模型,可首先使用精確度最高的聚類(lèi)模型4_10對(duì)用戶(hù)元素集合進(jìn)行聚類(lèi),并判斷聚類(lèi)召回率是否滿(mǎn)足要求,若滿(mǎn)足,則聚類(lèi)結(jié)束;否則,使用聚類(lèi)模型3_10對(duì)聚類(lèi)模型4_10未被確定出所屬的類(lèi)別的用戶(hù)元素集合(即未和任何ー個(gè)其他用戶(hù)元素集合聚到ー個(gè)類(lèi)中的用戶(hù)元素集合)進(jìn)行聚類(lèi),并再次判斷聚類(lèi)召回率是否滿(mǎn)足條件,以此類(lèi)推,直到聚類(lèi)召回率滿(mǎn)足條件為止。其中,聚類(lèi)召回率滿(mǎn)足的條件可以根據(jù)實(shí)際情況預(yù)先設(shè)定,如可預(yù)先設(shè)定聚類(lèi)召回率達(dá)到70%以上吋,停止聚類(lèi)。同理,對(duì)于采用上述方式ニ或上述方式三所建立的多個(gè)MinHash聚類(lèi)模型,可按照上述方式對(duì)用戶(hù)元素集合進(jìn)行聚類(lèi)處理。步驟202、互聯(lián)網(wǎng)應(yīng)用系統(tǒng)根據(jù)聚類(lèi)結(jié)果對(duì)用戶(hù)進(jìn)行信息推薦處理。具體的,由步驟201中的聚類(lèi)方式的特性可知,同一用戶(hù)元素集合至多在一個(gè)聚類(lèi)模型下被覆蓋。在對(duì)用戶(hù)進(jìn)行信息推薦時(shí),可采用現(xiàn)有信息推薦方式實(shí)現(xiàn)。例如,根據(jù)每ー個(gè)聚類(lèi)模型下的聚類(lèi)結(jié)果,針對(duì)每個(gè)被聚類(lèi)的用戶(hù)元素集合,計(jì)算出其所屬類(lèi)別中的各元素對(duì)于該用戶(hù)元素集合的推薦分?jǐn)?shù),并按照推薦分?jǐn)?shù)遞減的順序?qū)⑺性剡M(jìn)行排序,其中推薦分?jǐn)?shù)越高,則表明用戶(hù)接受相應(yīng)元素的可能性越大。在向該用戶(hù)元素集合所對(duì)應(yīng)的用戶(hù)進(jìn)行推薦時(shí),可將其中該用戶(hù)元素集合中不包含的元素按照排序推薦給該用戶(hù)。當(dāng)然,該步驟中的信息推薦處理方式也可采用其他信息推薦方式實(shí)現(xiàn),本發(fā)明實(shí)施例對(duì)此不做要求。通過(guò)以上描述可以看出,通過(guò)建立多個(gè)不同參數(shù)的聚類(lèi)模型,井根據(jù)聚類(lèi)模型精確度從高到低的順序依次使用相應(yīng)聚類(lèi)模型對(duì)用戶(hù)進(jìn)行聚類(lèi),一方面,相似度較高的用戶(hù)元素集合在精確度高的聚類(lèi)模型下保證了聚類(lèi)精確度;另一方面,相似度較低的用戶(hù)元素集合在精確度較低的聚類(lèi)模型下被聚類(lèi)的可能性増大,即在增大聚類(lèi)召回率的同吋,保證了聚類(lèi)精確度,提高了信息推薦效果。本發(fā)明的另ー實(shí)施例提供的信息推薦流程可如圖3所示。當(dāng)需要對(duì)用戶(hù)進(jìn)行聚類(lèi),井根據(jù)聚類(lèi)結(jié)果為用戶(hù)進(jìn)行信息推薦時(shí),該流程可包括步驟301、互聯(lián)網(wǎng)應(yīng)用系統(tǒng)按照MinHash聚類(lèi)模型精確度遞減的順序,依次使用相應(yīng)聚類(lèi)模型對(duì)所有用戶(hù)元素集合進(jìn)行聚類(lèi)處理,直到聚類(lèi)召回率滿(mǎn)足要求時(shí)停止聚類(lèi)處理。具體的,首先使用精確度最高的MinHash聚類(lèi)模型對(duì)所有待聚類(lèi)的用戶(hù)元素集合進(jìn)行聚類(lèi),并判斷聚類(lèi)召回率是否滿(mǎn)足要求,若滿(mǎn)足,則聚類(lèi)結(jié)束;否則,使用精確度次之的 MinHash聚類(lèi)模型對(duì)所有待聚類(lèi)用戶(hù)元素集合進(jìn)行聚類(lèi),并判斷聚類(lèi)召回率是否滿(mǎn)足條件, 以此類(lèi)推,直到聚類(lèi)召回率滿(mǎn)足條件。對(duì)于采用上述方式一所建立的多個(gè)MinHash聚類(lèi)模型,如p_q值分別為1_10、 2_10、3_10和4_10的多個(gè)MinHash聚類(lèi)模型,可首先使用精確度最高的聚類(lèi)模型4_10對(duì)所有待聚類(lèi)的用戶(hù)元素集合進(jìn)行聚類(lèi),并判斷聚類(lèi)召回率是否滿(mǎn)足要求,若滿(mǎn)足,則聚類(lèi)結(jié)束;否則,使用聚類(lèi)模型3_10對(duì)所有待聚類(lèi)的用戶(hù)元素集合進(jìn)行聚類(lèi),并再次判斷聚類(lèi)召回率是否滿(mǎn)足條件,以此類(lèi)推,直到聚類(lèi)召回率滿(mǎn)足條件為止。其中,聚類(lèi)召回率滿(mǎn)足的條件可以根據(jù)實(shí)際情況預(yù)先設(shè)定,如可預(yù)先設(shè)定聚類(lèi)召回率達(dá)到70%以上吋,停止聚類(lèi)。同理,對(duì)于采用上述方式ニ或上述方式三所建立的多個(gè)MinHash聚類(lèi)模型,可按照上述方式對(duì)用戶(hù)元素集合進(jìn)行聚類(lèi)處理。步驟302、互聯(lián)網(wǎng)應(yīng)用系統(tǒng)根據(jù)聚類(lèi)結(jié)果對(duì)用戶(hù)進(jìn)行信息推薦處理。具體的,由步驟301中聚類(lèi)方式的特性可知,同一用戶(hù)元素集合可能在多個(gè)聚類(lèi)模型下被覆蓋,即在多個(gè)聚類(lèi)模型下都能被聚類(lèi)(即確定出其所屬的類(lèi)別),如在聚類(lèi)模型4_8下,用戶(hù)甲和乙被聚到ー個(gè)類(lèi)中;在聚類(lèi)模型4_9下,用戶(hù)甲、乙、丙和丁被聚到ー個(gè)類(lèi)中。根據(jù)聚類(lèi)結(jié)果對(duì)用戶(hù)進(jìn)行信息推薦時(shí),對(duì)于各個(gè)聚類(lèi)模型下所得到的聚類(lèi)結(jié)果,針對(duì)每個(gè)被聚類(lèi)的用戶(hù)元素集合,可計(jì)算出該用戶(hù)元素集合所屬類(lèi)別中的各元素對(duì)于該用戶(hù)元素集合的推薦分?jǐn)?shù),并按照推薦分?jǐn)?shù)遞減的順序進(jìn)行排序。如果ー個(gè)用戶(hù)元素集合在不同的聚類(lèi)模型下都能被聚類(lèi),則對(duì)應(yīng)該用戶(hù)元素集合會(huì)有多個(gè)聚類(lèi)模型下的推薦結(jié)果,在對(duì)該用戶(hù)元素集合對(duì)應(yīng)的用戶(hù)進(jìn)行推薦時(shí),可優(yōu)先推薦精確度高的聚類(lèi)模型下的推薦結(jié)果, 不同聚類(lèi)模型下的相同推薦結(jié)果以精確度高的聚類(lèi)模型下的推薦排序結(jié)果進(jìn)行推薦;或, 將該用戶(hù)元素集合在不同聚類(lèi)模型下所屬類(lèi)別中的各元素的推薦分?jǐn)?shù)以不同的加權(quán)權(quán)重進(jìn)行加權(quán),并按加權(quán)后的推薦分?jǐn)?shù)進(jìn)行推薦排序,根據(jù)推薦排序結(jié)果對(duì)該用戶(hù)進(jìn)行推薦,其中,精確度高的聚類(lèi)模型下該用戶(hù)元素集合所屬類(lèi)別中的元素的推薦分?jǐn)?shù)加權(quán)權(quán)重高于精確度低的聚類(lèi)模型下該用戶(hù)元素集合所屬類(lèi)別中的元素的推薦分?jǐn)?shù)的加權(quán)權(quán)重,權(quán)重的調(diào)整可以通過(guò)實(shí)驗(yàn)的指導(dǎo)來(lái)調(diào)整,推薦給用戶(hù)的元素中可不包括該用戶(hù)元素集合所包含的元素。例如,甲在聚類(lèi)模型4_8下,推薦結(jié)果為A和B,且A的推薦分?jǐn)?shù)為6,B的推薦分?jǐn)?shù)為2 ;甲在聚類(lèi)模型4_9下推薦結(jié)果為A、B、C和D,且A的推薦分?jǐn)?shù)為7,B的推薦分?jǐn)?shù)為2, C的推薦分?jǐn)?shù)為6,D的推薦分?jǐn)?shù)為4,則在向甲進(jìn)行推薦時(shí),可以采取以下方式進(jìn)行推薦方式一、優(yōu)先推薦精確度高的聚類(lèi)模型下的推薦結(jié)果,同一聚類(lèi)模型下的推薦結(jié)果按推薦分?jǐn)?shù)從高到低的順序依次推薦,不同聚類(lèi)模型下的相同推薦結(jié)果以精確度高的聚類(lèi)模型下的推薦排序結(jié)果進(jìn)行推薦。即在向甲進(jìn)行推薦時(shí),將A、B、C和D依次推薦給甲。方式ニ、將各個(gè)聚類(lèi)模型下的推薦結(jié)果的推薦分?jǐn)?shù)以不同的加權(quán)權(quán)重進(jìn)行加權(quán), 并按加權(quán)后的推薦分?jǐn)?shù)進(jìn)行推薦排序,根據(jù)推薦排序結(jié)果對(duì)該用戶(hù)進(jìn)行推薦。如,甲在聚類(lèi)模型4_8下的推薦結(jié)果的加權(quán)權(quán)重設(shè)為0. 6,在聚類(lèi)模型4_9下的推薦結(jié)果的加權(quán)權(quán)重設(shè)為
0.4,則在向甲進(jìn)行推薦時(shí),A加權(quán)后推薦分?jǐn)?shù)為6.4(6*0.6+7*0.4),B為2,C為2. 4,D為
1.6,將A、C、B和D依次推薦給甲。通過(guò)以上描述可以看出,將精確度不同聚類(lèi)模型下的推薦結(jié)果整合在一起,在保證了聚類(lèi)精確度和召回率的同吋,使信息推薦的選擇更多,進(jìn)ー步提高了信息推薦的效果。基于相同的技術(shù)構(gòu)思,本發(fā)明實(shí)施例還提供了ー種應(yīng)用于上述流程的信息推薦設(shè)備,該設(shè)備可配置在服務(wù)器端,即配置在網(wǎng)絡(luò)側(cè)的互聯(lián)網(wǎng)應(yīng)用系統(tǒng)中。如圖4所示,為本發(fā)明實(shí)施例提供的信息推薦設(shè)備的結(jié)構(gòu)示意圖,該信息推薦設(shè)備用于設(shè)置有多個(gè)精確度不同的聚類(lèi)模型的信息推薦系統(tǒng)中,可包括存儲(chǔ)模塊41,用于存儲(chǔ)多個(gè)精確度不同的聚類(lèi)模型;具體的,存儲(chǔ)模塊41用于,存儲(chǔ)多個(gè)具有相同哈希函數(shù)組數(shù)量、但每個(gè)哈希函數(shù)組中的哈希函數(shù)數(shù)量不同的MinHash聚類(lèi)模型;或,存儲(chǔ)多個(gè)具有不同哈希函數(shù)組數(shù)量、但每個(gè)哈希函數(shù)組中的哈希函數(shù)數(shù)量相同的 MinHash聚類(lèi)模型。聚類(lèi)模塊42,用于按照存儲(chǔ)模塊41中存儲(chǔ)的聚類(lèi)模型精確度遞減的順序,依次使用相應(yīng)的聚類(lèi)模型對(duì)用戶(hù)元素集合進(jìn)行聚類(lèi)處理,以確定用戶(hù)所屬的類(lèi)別,直到聚類(lèi)召回率滿(mǎn)足要求時(shí)停止聚類(lèi)處理;具體的,聚類(lèi)模塊42用干,使用精確度最高的聚類(lèi)模型對(duì)所有待聚類(lèi)用戶(hù)元素集合進(jìn)行聚類(lèi)處理,并在聚類(lèi)召回率未滿(mǎn)足要求吋,使用精確度次之的聚類(lèi)模型對(duì)當(dāng)前聚類(lèi)模型下未被覆蓋到的用戶(hù)元素集合進(jìn)行聚類(lèi)處理,以此類(lèi)推,直到聚類(lèi)召回率滿(mǎn)足要求時(shí)停止聚類(lèi)處理;或,使用精確度最高的聚類(lèi)模型對(duì)所有待聚類(lèi)的用戶(hù)元素集合進(jìn)行次聚類(lèi)處理,并在聚類(lèi)召回率未滿(mǎn)足要求吋,使用精確度次之的聚類(lèi)模型對(duì)所有待聚類(lèi)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理,以此類(lèi)推,直到聚類(lèi)召回率滿(mǎn)足要求時(shí)停止聚類(lèi)處理。推薦模塊43,用于根據(jù)聚類(lèi)結(jié)果對(duì)所述用戶(hù)元素集合對(duì)應(yīng)的用戶(hù)進(jìn)行信息推薦; 即根據(jù)所述用戶(hù)元素集合,對(duì)所述用戶(hù)元素集合所屬類(lèi)別中的元素進(jìn)行推薦排序,并根據(jù)推薦排序結(jié)果,選擇不屬于該用戶(hù)元素集合的元素推薦給所述用戶(hù)元素集合對(duì)應(yīng)的用戶(hù);具體的,推薦模塊43用干,根據(jù)聚類(lèi)模塊42的聚類(lèi)結(jié)果,針對(duì)每個(gè)被聚類(lèi)的用戶(hù)元素集合,計(jì)算出各聚類(lèi)模型下用戶(hù)所屬類(lèi)別中各元素對(duì)于該用戶(hù)元素集合的推薦分?jǐn)?shù), 并按照推薦分?jǐn)?shù)遞減的順序?qū)⑺性剡M(jìn)行排序,并將其中該用戶(hù)元素集合中不包含的元素按照排序依次推薦給該用戶(hù)元素集合對(duì)應(yīng)的用戶(hù);其中,當(dāng)某用戶(hù)元素集合在不同的聚類(lèi)模型下都能被聚類(lèi)時(shí),優(yōu)先推薦精確度高的聚類(lèi)模型下的推薦結(jié)果,不同聚類(lèi)模型下的相同推薦結(jié)果以精確度高的聚類(lèi)模型下的推薦排序結(jié)果進(jìn)行推薦;或,將該用戶(hù)元素集合在不同聚類(lèi)模型下所屬類(lèi)別中的各元素的推薦分?jǐn)?shù)以不同的加權(quán)權(quán)重進(jìn)行加權(quán),并按加權(quán)后的推薦分?jǐn)?shù)進(jìn)行推薦排序,根據(jù)推薦排序結(jié)果對(duì)該用戶(hù)進(jìn)行推薦,其中,精確度高的聚類(lèi)模型下該用戶(hù)元素集合所屬類(lèi)別中的元素的推薦分?jǐn)?shù)加權(quán)權(quán)重高于精確度低的聚類(lèi)模型下該用戶(hù)元素集合所屬類(lèi)別中的元素的推薦分?jǐn)?shù)的加權(quán)權(quán)重。通過(guò)以上描述可以看出,通過(guò)建立多個(gè)不同參數(shù)的聚類(lèi)模型,井根據(jù)聚類(lèi)模型精確度從高到低的順序依次使用相應(yīng)聚類(lèi)模型對(duì)用戶(hù)進(jìn)行聚類(lèi),一方面,相似度較高的用戶(hù)元素集合在精確度高的聚類(lèi)模型下保證了聚類(lèi)精確度;另ー方面,相似度較低的用戶(hù)元素集合在精確度較低的聚類(lèi)模型下被聚類(lèi)的可能性増大,即在增大聚類(lèi)召回率的同吋,保證了聚類(lèi)精確度,提高了信息推薦效果。本發(fā)明實(shí)施例中的信息推薦并不限定于音樂(lè)推薦,新聞、電影推薦等也可以使用本發(fā)明實(shí)施例提供的信息推薦方法,而信息推薦過(guò)程中采用的聚類(lèi)方法也并不限于 MinHash聚類(lèi)方法,其他具有精確度和召回率平衡性的聚類(lèi)方法均可以用于本發(fā)明實(shí)施例提供的信息推薦方案中。通過(guò)以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借助軟件加必需的通用硬件平臺(tái)的方式來(lái)實(shí)現(xiàn),當(dāng)然也可以通過(guò)硬件,但很多情況下前者是更佳的實(shí)施方式?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說(shuō)對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在ー個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述的方法。本領(lǐng)域技術(shù)人員可以理解附圖只是ー個(gè)優(yōu)選實(shí)施例的示意圖,附圖中的模塊或流程并不一定是實(shí)施本發(fā)明所必須的。本領(lǐng)域技術(shù)人員可以理解實(shí)施例中的裝置中的模塊可以按照實(shí)施例描述進(jìn)行分布于實(shí)施例的裝置中,也可以進(jìn)行相應(yīng)變化位于不同于本實(shí)施例的ー個(gè)或多個(gè)裝置中。上述實(shí)施例的模塊可以合并為ー個(gè)模塊,也可以進(jìn)ー步拆分成多個(gè)子模塊。
上述本發(fā)明實(shí)施例序號(hào)僅僅為了描述,不代表實(shí)施例的優(yōu)劣。以上公開(kāi)的僅為本發(fā)明的幾個(gè)具體實(shí)施例,但是,本發(fā)明并非局限于此,任何本領(lǐng)域的技術(shù)人員能思之的變化都應(yīng)落入本發(fā)明的保護(hù)范圍。
權(quán)利要求
1.ー種信息推薦方法,應(yīng)用于互聯(lián)網(wǎng)應(yīng)用系統(tǒng),其特征在干,所述應(yīng)用系統(tǒng)中設(shè)置有多個(gè)精確度不同的聚類(lèi)模型,該方法包括所述應(yīng)用系統(tǒng)按照聚類(lèi)模型精確度遞減的順序,依次使用相應(yīng)聚類(lèi)模型對(duì)用戶(hù)所對(duì)應(yīng)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理,直到聚類(lèi)召回率滿(mǎn)足設(shè)定要求時(shí)停止聚類(lèi)處理;所述應(yīng)用系統(tǒng)根據(jù)聚類(lèi)結(jié)果對(duì)所述用戶(hù)元素集合對(duì)應(yīng)的用戶(hù)進(jìn)行信息推薦。
2.如權(quán)利要求1所述的方法,其特征在干,所述根據(jù)聚類(lèi)結(jié)果對(duì)所述用戶(hù)元素集合對(duì)應(yīng)的用戶(hù)進(jìn)行信息推薦,具體為根據(jù)所述用戶(hù)元素集合,對(duì)所述用戶(hù)元素集合所屬類(lèi)別中的元素進(jìn)行推薦排序,井根據(jù)推薦排序結(jié)果,選擇不屬于該用戶(hù)元素集合的元素推薦給所述用戶(hù)元素集合對(duì)應(yīng)的用戶(hù)。
3.如權(quán)利要求1所述的方法,其特征在干,所述按照聚類(lèi)模型精確度遞減的順序,依次使用相應(yīng)聚類(lèi)模型對(duì)用戶(hù)所對(duì)應(yīng)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理,直到聚類(lèi)召回率滿(mǎn)足設(shè)定要求時(shí)停止聚類(lèi)處理,具體為使用精度最高的聚類(lèi)模型對(duì)所有用戶(hù)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理,若有用戶(hù)元素集合未被聚類(lèi),則使用精度次之的聚類(lèi)模型對(duì)未被聚類(lèi)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理,以此類(lèi)推,直到聚類(lèi)召回率滿(mǎn)足設(shè)定要求時(shí)停止聚類(lèi)處理。
4.如權(quán)利要求1所述的方法,其特征在干,所述按照聚類(lèi)模型精確度遞減的順序,依次使用相應(yīng)聚類(lèi)模型對(duì)用戶(hù)所對(duì)應(yīng)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理,直到聚類(lèi)召回率滿(mǎn)足設(shè)定要求時(shí)停止聚類(lèi)處理,具體為使用精度最高的聚類(lèi)模型對(duì)所有用戶(hù)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理,若有用戶(hù)元素集合未被聚類(lèi),則使用精度次之的聚類(lèi)模型對(duì)所有用戶(hù)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理,以此類(lèi)推,直到聚類(lèi)召回率滿(mǎn)足設(shè)定要求時(shí)停止聚類(lèi)處理。
5.如權(quán)利要求4所述的方法,其特征在干,所述根據(jù)聚類(lèi)結(jié)果對(duì)所述用戶(hù)元素集合對(duì)應(yīng)的用戶(hù)進(jìn)行信息推薦,具體為根據(jù)所述用戶(hù)元素集合,分別在不同聚類(lèi)模型下的聚類(lèi)結(jié)果中,對(duì)所述用戶(hù)元素集合所屬類(lèi)別中的元素按推薦分?jǐn)?shù)從高到低的順序進(jìn)行推薦排序;根據(jù)聚類(lèi)模型的精確度從高到低的順序,優(yōu)先將精確度高的聚類(lèi)模型下的推薦結(jié)果推薦給所述用戶(hù)元素集合對(duì)應(yīng)的用戶(hù);其中,同一聚類(lèi)模型下的推薦結(jié)果按推薦分?jǐn)?shù)從高到低的順序依次推薦,不同聚類(lèi)模型下的相同推薦結(jié)果以精確度高的聚類(lèi)模型下的推薦排序結(jié)果進(jìn)行推薦,推薦給用戶(hù)的元素中不包括屬于該用戶(hù)元素集合的元素。
6.如權(quán)利要求4所述的方法,其特征在干,所述根據(jù)聚類(lèi)結(jié)果對(duì)所述用戶(hù)元素集合對(duì)應(yīng)的用戶(hù)進(jìn)行信息推薦,具體為根據(jù)所述用戶(hù)元素集合,對(duì)各聚類(lèi)模型下所述用戶(hù)元素集合所屬類(lèi)別中的元素的推薦分?jǐn)?shù)進(jìn)行加權(quán),并將加權(quán)后的推薦分?jǐn)?shù)按從高到低的順序進(jìn)行推薦排序,其中,精確度高的聚類(lèi)模型下所述用戶(hù)元素集合所屬類(lèi)別中的元素的推薦分?jǐn)?shù)加權(quán)權(quán)重高于精確度低的聚類(lèi)模型下所述用戶(hù)元素集合所屬類(lèi)別中的元素的推薦分?jǐn)?shù)的加權(quán)權(quán)重;根據(jù)推薦排序結(jié)果,將各聚類(lèi)模型下所述用戶(hù)元素集合所屬類(lèi)別中的元素推薦給所述用戶(hù)元素集合所對(duì)應(yīng)的用戶(hù),其中,推薦給用戶(hù)的元素中不包括屬于該用戶(hù)元素集合的元
7.如權(quán)利要求1至6任一項(xiàng)所述的方法,其特征在干,所述多個(gè)精確度不同的聚類(lèi)模型為多個(gè)具有相同哈希函數(shù)組數(shù)量、但每個(gè)哈希函數(shù)組中的哈希函數(shù)數(shù)量不同的MinHash聚類(lèi)模型,所述多個(gè)MinHash聚類(lèi)模型的精度,按照哈希函數(shù)組中的哈希函數(shù)數(shù)量遞減的順序遞減;或者所述多個(gè)精確度不同的聚類(lèi)模型為多個(gè)具有不同哈希函數(shù)組數(shù)量、但每個(gè)哈希函數(shù)組中的哈希函數(shù)數(shù)量相同的MinHash聚類(lèi)模型,所述多個(gè)MinHash聚類(lèi)模型的精度,按照哈希函數(shù)組數(shù)量遞增的順序遞減。
8.一種信息推薦設(shè)備,應(yīng)用于互聯(lián)網(wǎng)應(yīng)用系統(tǒng),其特征在干,包括存儲(chǔ)模塊,用于存儲(chǔ)多個(gè)精確度不同的聚類(lèi)模型;聚類(lèi)模塊,用于按照存儲(chǔ)模塊中存儲(chǔ)的聚類(lèi)模型精確度遞減的順序,依次使用相應(yīng)聚類(lèi)模型對(duì)用戶(hù)所對(duì)應(yīng)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理,以確定用戶(hù)元素集合所屬的類(lèi)別,直到聚類(lèi)召回率滿(mǎn)足設(shè)定要求時(shí)停止聚類(lèi)處理;推薦模塊,用于根據(jù)聚類(lèi)結(jié)果對(duì)所述用戶(hù)元素集合對(duì)應(yīng)的用戶(hù)進(jìn)行信息推薦。
9.如權(quán)利要求8所述的設(shè)備,其特征在干,所述推薦模塊具體用干,根據(jù)所述用戶(hù)元素集合,對(duì)所述用戶(hù)元素集合所屬類(lèi)別中的元素進(jìn)行推薦排序,并根據(jù)推薦排序結(jié)果,選擇不屬于該用戶(hù)元素集合的元素推薦給所述用戶(hù)元素集合對(duì)應(yīng)的用戶(hù)。
10.如權(quán)利要求8所述的設(shè)備,其特征在干,所述聚類(lèi)模塊具體用干,使用精度最高的聚類(lèi)模型對(duì)所有用戶(hù)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理,若有用戶(hù)元素集合未被聚類(lèi),則使用精度次之的聚類(lèi)模型對(duì)未被聚類(lèi)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理,以此類(lèi)推,直到聚類(lèi)召回率滿(mǎn)足設(shè)定要求時(shí)停止聚類(lèi)處理。
11.如權(quán)利要求8所述的設(shè)備,其特征在干,所述聚類(lèi)模塊具體用干,使用精度最高的聚類(lèi)模型對(duì)所有用戶(hù)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理,若有用戶(hù)元素集合未被聚類(lèi),則使用精度次之的聚類(lèi)模型對(duì)所有用戶(hù)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理,以此類(lèi)推,直到聚類(lèi)召回率滿(mǎn)足設(shè)定要求時(shí)停止聚類(lèi)處理。
12.如權(quán)利要求11所述的設(shè)備,其特征在干,所述推薦模塊具體用干,根據(jù)所述用戶(hù)元素集合,分別在不同聚類(lèi)模型下的聚類(lèi)結(jié)果中,對(duì)所述用戶(hù)元素集合所屬類(lèi)別中的元素按推薦分?jǐn)?shù)從高到低的順序進(jìn)行推薦排序;根據(jù)聚類(lèi)模型的精確度從高到低的順序,優(yōu)先將精確度高的聚類(lèi)模型下的推薦結(jié)果推薦給所述用戶(hù)元素集合對(duì)應(yīng)的用戶(hù);其中,同一聚類(lèi)模型下的推薦結(jié)果按推薦分?jǐn)?shù)從高到低的順序依次推薦,不同聚類(lèi)模型下的相同推薦結(jié)果以精確度高的聚類(lèi)模型下的推薦排序結(jié)果進(jìn)行推薦,推薦給用戶(hù)的元素中不包括屬于該用戶(hù)元素集合的元素。
13.如權(quán)利要求11所述的設(shè)備,其特征在干,所述推薦模塊具體用干,根據(jù)所述用戶(hù)元素集合,對(duì)各聚類(lèi)模型下所述用戶(hù)元素集合所屬類(lèi)別中的元素的推薦分?jǐn)?shù)進(jìn)行加權(quán),并將加權(quán)后的推薦分?jǐn)?shù)按從高到低的順序進(jìn)行推薦排序,其中,精確度高的聚類(lèi)模型下所述用戶(hù)元素集合所屬類(lèi)別中的元素的推薦分?jǐn)?shù)加權(quán)權(quán)重高于精確度低的聚類(lèi)模型下所述用戶(hù)元素集合所屬類(lèi)別中的元素的推薦分?jǐn)?shù)的加權(quán)權(quán)重;根據(jù)推薦排序結(jié)果,將各聚類(lèi)模型下所述用戶(hù)元素集合所屬類(lèi)別中的元素推薦給所述用戶(hù)元素集合所對(duì)應(yīng)的用戶(hù),其中,推薦給用戶(hù)的元素中不包括屬于該用戶(hù)元素集合的元ο
14.如權(quán)利要求8-13任一項(xiàng)所述的設(shè)備,其特征在干,所述存儲(chǔ)模塊具體用于,存儲(chǔ)多個(gè)具有相同哈希函數(shù)組數(shù)量、但每個(gè)哈希函數(shù)組中的哈希函數(shù)數(shù)量不同的MinHash聚類(lèi)模型;所述聚類(lèi)模塊具體用干,按照哈希函數(shù)組中的哈希函數(shù)數(shù)量遞減的順序依次使用相應(yīng)聚類(lèi)模型對(duì)用戶(hù)所對(duì)應(yīng)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理,以確定用戶(hù)元素集合所屬的類(lèi)別, 直到聚類(lèi)召回率滿(mǎn)足設(shè)定要求時(shí)停止聚類(lèi)處理;或,所述儲(chǔ)存模塊具體用于,存儲(chǔ)多個(gè)具有不同哈希函數(shù)組數(shù)量、但每個(gè)哈希函數(shù)組中的哈希函數(shù)數(shù)量相同的MinHash聚類(lèi)模型;所述聚類(lèi)模塊具體用干,按照哈希函數(shù)組數(shù)量遞增的順序依次使用相應(yīng)聚類(lèi)模型對(duì)用戶(hù)所對(duì)應(yīng)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理,以確定用戶(hù)元素集合所屬的類(lèi)別,直到聚類(lèi)召回率滿(mǎn)足設(shè)定要求時(shí)停止聚類(lèi)處理。
全文摘要
本發(fā)明實(shí)施例公開(kāi)了一種信息推薦方法和設(shè)備,應(yīng)用于設(shè)置有多個(gè)精確度不同的聚類(lèi)模型的互聯(lián)網(wǎng)應(yīng)用系統(tǒng),該方法包括所述應(yīng)用系統(tǒng)按照聚類(lèi)模型精確度遞減的順序,依次使用相應(yīng)聚類(lèi)模型對(duì)用戶(hù)所對(duì)應(yīng)的用戶(hù)元素集合進(jìn)行聚類(lèi)處理,以確定用戶(hù)元素集合所屬的類(lèi)別,直到聚類(lèi)召回率滿(mǎn)足設(shè)定要求時(shí)停止聚類(lèi)處理;所述應(yīng)用系統(tǒng)根據(jù)聚類(lèi)結(jié)果對(duì)所述用戶(hù)元素集合對(duì)應(yīng)的用戶(hù)進(jìn)行信息推薦。本發(fā)明實(shí)施例中,在增大聚類(lèi)召回率的同時(shí),保證了聚類(lèi)精確度,提高了信息推薦效果。
文檔編號(hào)G06F17/30GK102591873SQ20111000563
公開(kāi)日2012年7月18日 申請(qǐng)日期2011年1月12日 優(yōu)先權(quán)日2011年1月12日
發(fā)明者崔巖, 肖戰(zhàn)勇 申請(qǐng)人:騰訊科技(深圳)有限公司