基于少量用戶評(píng)價(jià)的物品流行度與喜好度聯(lián)合預(yù)測(cè)系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種計(jì)算機(jī)技術(shù)領(lǐng)域,具體地說(shuō),涉及的是一種利用計(jì)算機(jī)計(jì)算在僅獲取和利用極少量已知信息的情況下對(duì)物品的流行度與用戶喜好度聯(lián)合預(yù)測(cè)系統(tǒng)。
【背景技術(shù)】
[0002]在電子商務(wù)不斷興起的時(shí)代,用戶喜好度預(yù)測(cè)系統(tǒng)已經(jīng)成為了刺激顧客消費(fèi)的重要組成部分。所謂喜好度預(yù)測(cè),是指商家根據(jù)已經(jīng)購(gòu)買了一部分商品的顧客的歷史購(gòu)物清單,來(lái)猜測(cè)他對(duì)于網(wǎng)站中其他未購(gòu)買商品或新商品的喜好程度或口味,并把預(yù)測(cè)評(píng)分較高的商品推薦給顧客,以促銷其購(gòu)買。這種精準(zhǔn)式的個(gè)性化營(yíng)銷已經(jīng)成為許多互聯(lián)網(wǎng)公司、電子商務(wù)網(wǎng)站、廣告提供商的不二法寶,在互聯(lián)網(wǎng)經(jīng)濟(jì)中扮演著十分重要的角色。
[0003]除了用戶個(gè)性化喜好預(yù)測(cè)以外,在商品營(yíng)銷中廣告公司和購(gòu)物網(wǎng)站還需要考評(píng)商品的潛在流行度這個(gè)重要指標(biāo),它反映了大眾整體對(duì)于一個(gè)商品的接受程度。舉一個(gè)簡(jiǎn)單的例子,如果一款商品僅在很小范圍的顧客中有著比較高的喜好程度,那么它就可以看作一款小眾商品,對(duì)其傾斜過(guò)多的廣告促銷資源并不能夠帶來(lái)更大的利益。相比來(lái)說(shuō),如果另外一款商品能夠在較大規(guī)模的顧客中都獲得不錯(cuò)的喜好度,那么針對(duì)他的營(yíng)銷可能會(huì)更加有經(jīng)濟(jì)效益。這里所說(shuō)的潛在流行度,本質(zhì)上并不局限于物品在一套系統(tǒng)或一個(gè)網(wǎng)站內(nèi)的人氣值,它可以用更大范圍內(nèi)的用戶接受程度來(lái)進(jìn)行衡量。
[0004]綜合以上兩點(diǎn)考慮,一款成功的商品預(yù)測(cè)系統(tǒng)不僅需要了解到針對(duì)每一個(gè)單一用戶的用戶習(xí)慣偏好、預(yù)測(cè)用戶評(píng)價(jià),也需要了解物品在整體系統(tǒng)中的流行度情況。需要說(shuō)明的是,該預(yù)測(cè)系統(tǒng)并不局限于互聯(lián)網(wǎng)公司,在任何實(shí)體商業(yè)經(jīng)濟(jì)體中,根據(jù)客戶喜好度而做出精準(zhǔn)化的銷售也是刺激顧客消費(fèi)的重要環(huán)節(jié)。更加重要的是,流行度的預(yù)測(cè)和用戶評(píng)分的預(yù)測(cè)甚至可以是互聯(lián)網(wǎng)經(jīng)濟(jì)和實(shí)體經(jīng)濟(jì)的結(jié)合,比如一部電影在電影院票房中取得了非常不錯(cuò)的成績(jī),那么它就擁有了很高的流行度,而一個(gè)在線電影點(diǎn)播網(wǎng)站就可以利用這些流行度信息,并根據(jù)自己網(wǎng)站用戶的個(gè)性化喜好,綜合選取最優(yōu)的電影進(jìn)行廣告推銷。這種聯(lián)合化的預(yù)測(cè)模式有著非常重要的經(jīng)濟(jì)價(jià)值。
[0005]由于新商品的已有評(píng)價(jià)信息和屬性特征較少,這種稀疏性導(dǎo)致了用戶-物品的相似度趨向零的特征,無(wú)法準(zhǔn)確的獲取商品的模型參數(shù)。因此已有的預(yù)測(cè)系統(tǒng)需要通過(guò)搜集、市場(chǎng)調(diào)研等方法獲取較大范圍的用戶群體對(duì)新商品的評(píng)價(jià),才能夠較好的計(jì)算用戶-物品相似度,從而進(jìn)行后續(xù)的預(yù)測(cè)工作。而這種模式需要非常大的經(jīng)濟(jì)和時(shí)間代價(jià),數(shù)據(jù)處理復(fù)雜,計(jì)算處理效率低。
[0006]由于新商品層出不窮,目前物品流行度的預(yù)測(cè)和用戶喜好度預(yù)測(cè)系統(tǒng)中由于新商品的評(píng)價(jià)過(guò)少導(dǎo)致的無(wú)法準(zhǔn)確預(yù)測(cè)其流行度和在全體用戶群中的喜好度,急切的需要一種新的技術(shù)手段來(lái)應(yīng)對(duì)商品的流行度預(yù)測(cè)和用戶喜好度預(yù)測(cè)的問(wèn)題。
【發(fā)明內(nèi)容】
[0007]本發(fā)明的目的在于針對(duì)現(xiàn)有技術(shù)的不足,提出了一種基于少量用戶評(píng)價(jià)的物品流行度與喜好度聯(lián)合預(yù)測(cè)系統(tǒng),該系統(tǒng)利用計(jì)算機(jī)技術(shù),基于事先選取的少量關(guān)鍵用戶對(duì)新商品的評(píng)價(jià)來(lái)進(jìn)行預(yù)測(cè),降低了數(shù)據(jù)處理復(fù)雜,提高計(jì)算處理效率,能夠節(jié)省大量人力物力,且準(zhǔn)確度高。
[0008]本發(fā)明是通過(guò)以下技術(shù)方案實(shí)現(xiàn)的,所述預(yù)測(cè)系統(tǒng)包括:
[0009]數(shù)據(jù)準(zhǔn)備模塊:將用戶的原始評(píng)價(jià)數(shù)據(jù)預(yù)處理,生成用戶-物品評(píng)分矩陣、物品流行度向量;
[0010]特征建模模塊:根據(jù)數(shù)據(jù)準(zhǔn)備模塊的用戶-物品評(píng)分矩陣、物品流行度向量,采用功能性矩陣分解方法、線性回歸方法生成用戶對(duì)不同物品的喜好特征矩陣、物品屬性特征矩陣、物品屬性矩陣與流行度的回歸系數(shù)向量;
[0011]預(yù)測(cè)模塊:僅使用少量關(guān)鍵用戶對(duì)物品的評(píng)價(jià),估算物品屬性的特征向量,從而預(yù)測(cè)預(yù)測(cè)物品的未來(lái)流行度、預(yù)測(cè)全體用戶對(duì)該物品的喜好程度;所述預(yù)測(cè)模塊把少量關(guān)鍵用戶的喜好特征矩陣、少量關(guān)鍵用戶對(duì)新物品的評(píng)價(jià),映射為該新物品的屬性特征向量,然后使用新物品的屬性特征向量與全體用戶喜好特征矩陣相乘來(lái)預(yù)測(cè)全體用戶喜好程度,使用新物品的屬性特征向量與線性預(yù)測(cè)系數(shù)相乘得到未來(lái)流行度預(yù)測(cè)結(jié)果。
[0012]優(yōu)選地,所述數(shù)據(jù)準(zhǔn)備模塊、特征建模模塊,其中涉及的物品,是指現(xiàn)已存在于該系統(tǒng)中的商品;
[0013]所述預(yù)測(cè)模塊,其中涉及的物品包括現(xiàn)已存在于該系統(tǒng)中的商品、對(duì)不存在于目前系統(tǒng)的、可以被加入至當(dāng)前系統(tǒng)的新物品。
[0014]優(yōu)選地,所述數(shù)據(jù)準(zhǔn)備模塊、特征建模模塊,其中的預(yù)處理和建立數(shù)學(xué)模型時(shí),將用戶對(duì)某物品的評(píng)價(jià)數(shù)值化、歸一化為用戶-物品評(píng)分矩陣中相交的元素(如不存在評(píng)價(jià)則視為空元素);將多維度物品屬性特征通過(guò)線性預(yù)測(cè)系數(shù)映射為一維的流行度向量,還可以對(duì)流行度向量進(jìn)行非線性變換處理使其處于一定的變化范圍之內(nèi)。
[0015]優(yōu)選地,所述預(yù)測(cè)模塊,包括選取少量關(guān)鍵用戶子模塊,該子模塊根據(jù)所述數(shù)據(jù)準(zhǔn)備模塊、特征建模模塊所得到的用戶喜好特征矩陣、物品屬性特征矩陣、回歸系數(shù)向量,從現(xiàn)有系統(tǒng)中全部用戶中選取出少量最優(yōu)(即使得預(yù)測(cè)錯(cuò)誤率最低)的用戶作為關(guān)鍵用戶。隨后僅僅使用這些少量關(guān)鍵用戶對(duì)新物品的評(píng)價(jià),來(lái)預(yù)測(cè)該物品的流行度和在全體用戶中的喜好程度,從而極大的降低了聯(lián)合預(yù)測(cè)時(shí)所需要的時(shí)間成本、人力成本等,并保持預(yù)測(cè)的準(zhǔn)確度。
[0016]優(yōu)選地,所述的選取少量關(guān)鍵用戶子模塊,可以把最優(yōu)化選取少量關(guān)鍵用戶的問(wèn)題轉(zhuǎn)化為構(gòu)建三向決策樹模型中選取最優(yōu)分支節(jié)點(diǎn)的問(wèn)題。該決策樹模型,構(gòu)建方法為:
[0017]I)決策樹中每個(gè)葉子節(jié)點(diǎn)包含一組屬性特征類似的物品。決策樹每層的每個(gè)分支節(jié)點(diǎn)包含一個(gè)用戶。根據(jù)每個(gè)用戶對(duì)子節(jié)點(diǎn)中物品的評(píng)價(jià)(好、壞、不確定),均可以把這些物品分劃為無(wú)交集的三個(gè)子集,作為當(dāng)前決策樹節(jié)點(diǎn)的三個(gè)兒子節(jié)點(diǎn):左節(jié)點(diǎn)L(p)、中節(jié)點(diǎn)U(p)、右節(jié)點(diǎn)D(p)。在全部用戶中,必定有一個(gè)用戶P可以使得分劃后的三個(gè)子集里的物品流行度預(yù)測(cè)誤差與用戶喜好度誤差之和為最小,把該用戶P記為決策樹本分支的節(jié)點(diǎn),并視為一個(gè)關(guān)鍵用戶;
[0018]2)對(duì)決策樹每層的每個(gè)兒子節(jié)點(diǎn)均采用相同的遞歸分割操作,可構(gòu)建最大層級(jí)為P層的決策樹。當(dāng)需要獲取待預(yù)測(cè)物品的屬性特征時(shí),可以根據(jù)P個(gè)關(guān)鍵用戶對(duì)該物品的評(píng)價(jià),選擇最合適的決策路徑,并到達(dá)相應(yīng)的的葉子節(jié)點(diǎn)之中,進(jìn)而得到該物品屬性特征,以便用于預(yù)測(cè)。
[0019]本發(fā)明系統(tǒng)實(shí)現(xiàn)了以下特征:
[0020]I)根據(jù)系統(tǒng)中已知的用戶對(duì)已有商品的評(píng)價(jià)與喜好,生成可以區(qū)分不同用戶對(duì)不同商品喜好度的數(shù)學(xué)模型,以及生成可以區(qū)分商品之間不同屬性特征的數(shù)學(xué)模型;
[0021]2)該系統(tǒng)可事先選取一組少量的關(guān)鍵用戶。針對(duì)待預(yù)測(cè)的新商品,可以僅僅利用該組用戶對(duì)該新商品的評(píng)價(jià),來(lái)估算該商品的屬性特征模型,并依次預(yù)測(cè)該商品的流行度、系統(tǒng)中所有用戶對(duì)該新商品的喜好程度。
[0022]3)該系統(tǒng)結(jié)合功能性矩陣分解和線性預(yù)測(cè)方法,可以最優(yōu)化地選取上述關(guān)鍵用戶群,因此可以保證流行度預(yù)測(cè)準(zhǔn)確性和推薦準(zhǔn)確性。
[0023]相比于現(xiàn)有需要搜集更多用戶評(píng)價(jià)信息才能進(jìn)行預(yù)測(cè)的系統(tǒng),本發(fā)明具有如下的有益效果:本發(fā)明構(gòu)建最優(yōu)化選取少量關(guān)鍵評(píng)測(cè)用戶的決策樹,并利用少量但具有區(qū)分度的用戶對(duì)新商品的評(píng)價(jià),來(lái)預(yù)測(cè)該新商品的流行度和全體用戶喜好程度。本系統(tǒng)包含的技術(shù)方法不僅極大地降低了數(shù)據(jù)量處理,提高了運(yùn)行速度,減少系統(tǒng)代價(jià),更可以同時(shí)對(duì)流行度和用戶喜好同時(shí)進(jìn)行聯(lián)合預(yù)測(cè),且不會(huì)降低預(yù)測(cè)準(zhǔn)確率。
【附圖說(shuō)明】
[0024]通過(guò)閱讀參照以下附圖對(duì)非限制性實(shí)施例所作的詳細(xì)描述,本發(fā)明的其它特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯:
[0025]圖1是本發(fā)明一實(shí)施例中系統(tǒng)框圖;
[0026]圖2為本發(fā)明一實(shí)施例中系統(tǒng)的工作流程圖;
[0027]圖3是本發(fā)明一實(shí)施例中最優(yōu)化關(guān)鍵用戶的選擇方法的流程圖。
【具體實(shí)施方式】
[0028]下面結(jié)合具體實(shí)施例對(duì)本發(fā)明進(jìn)行詳細(xì)說(shuō)明。以下實(shí)施例將有助于本領(lǐng)域的技術(shù)人員進(jìn)一步理解本發(fā)明,但不以任何形式限制本發(fā)明。應(yīng)當(dāng)指出的是,對(duì)本領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進(jìn)。這些都屬于本發(fā)明的保護(hù)范圍。
[0029]如圖1所示,一種基于少量關(guān)鍵用戶評(píng)價(jià)的物品流行度與用戶喜好度聯(lián)合預(yù)測(cè)系統(tǒng),包括:
[0030]數(shù)據(jù)準(zhǔn)備模塊:用于將原始評(píng)價(jià)數(shù)據(jù)預(yù)處理,生成用戶-物品評(píng)分矩陣、物品流行度向量;
[0031]特征建模模塊:根據(jù)數(shù)據(jù)準(zhǔn)備模塊的用戶-物品評(píng)分矩陣、物品流行度向量,采用功能性矩陣分解方法、線性回歸方法生成用戶對(duì)不同物品的喜好特征矩陣、物品屬性特征矩陣、物品屬性矩陣與流行度的回歸系數(shù)向量;
[0032]預(yù)測(cè)模塊:僅使用少量關(guān)鍵用戶對(duì)物品的評(píng)價(jià),估算物品屬性的特征向量,從而預(yù)測(cè)預(yù)測(cè)物品的未來(lái)流行度、預(yù)測(cè)全體用戶對(duì)該物品的喜好程度。
[0033]所述數(shù)據(jù)準(zhǔn)備模塊、特征建模模塊,其中涉及的物品,是指現(xiàn)已存在于該系統(tǒng)中的商品;
[0034]所述預(yù)測(cè)模塊,其中涉及的物品包括現(xiàn)已存在于該系統(tǒng)中的商品、對(duì)不存在于目前系統(tǒng)的、可以被加入至當(dāng)前系統(tǒng)的新物品。
[0035]本發(fā)明所述的物品流行度不局限于商品在單一系統(tǒng)中的銷售量等,可以