一種基于語義分析的在線用戶推薦系統(tǒng)及方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種用戶推薦技術(shù),具體涉及一種基于語義分析的在線用戶推薦技術(shù),屬于海量信息處理、信息安全及智能處理等技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002]互聯(lián)網(wǎng)發(fā)展幾十年來,信息量呈指數(shù)爆炸,如何在海量信息中獲得與自己切身相關(guān)的部分,已經(jīng)成為了用戶最迫切的需求,也是互聯(lián)網(wǎng)服務(wù)提供商重點(diǎn)研究和部署的業(yè)務(wù)。
[0003]美國亞馬遜公司以電商業(yè)務(wù)著稱,據(jù)稱其推薦業(yè)務(wù)幫助其提升了約30%的銷量。有效實(shí)用的推薦系統(tǒng)由四部分:用戶信息記錄模塊、用戶偏好處理模塊、推薦算法模塊和用戶反饋模塊。以國外的亞馬遜、易趣以及國內(nèi)的淘寶、豆瓣等為例,他們的推薦業(yè)務(wù)主要有三種形態(tài):
[0004]I)基于用戶行為(包括駐留時(shí)間、搜索、反饋)作出推薦;
[0005]2)基于標(biāo)的信息(如收藏歷史、購物車信息)作出推薦;
[0006]3)根據(jù)歷史用戶和標(biāo)的信息的關(guān)系(如歷史會(huì)員對(duì)某些商品的喜好程度),利用推薦機(jī)制做會(huì)員營銷。
[0007]可以看到,針對(duì)用戶行為-標(biāo)的信息這組二元關(guān)系,很多服務(wù)提供商進(jìn)行了研究。
[0008]在上述三種形態(tài)下常見的推薦機(jī)制算法包括基于關(guān)聯(lián)規(guī)則的算法(Associat1nRule_based Recommendat1n)、基于內(nèi)容的協(xié)同算法(Content-based Recommendat1n)、協(xié)同過濾推薦算法(Collaborative Filtering Recommendat1n)。
[0009]專利“一種基于協(xié)同過濾的RSS信息推薦算法”(申請(qǐng)?zhí)?200910256457.8)從計(jì)算用戶相似度方陣,來對(duì)新用戶進(jìn)行。即A,B用戶有相似的喜好,如果A添加了新的信息源,則為B也推薦該信息源。這種方法基于聚類,簡(jiǎn)單有效,但是如果新的信息源沒有用戶進(jìn)行過問,就無法被推薦到更多的用戶上去;也就是說這種推薦算法影響了信息推薦的公平性。
[0010]專利“基于潛在社群的信息推薦方法”(申請(qǐng)?zhí)?201210012345.X)、專利“基于SNS的用戶推薦方法及裝置”(申請(qǐng)?zhí)?201310337086.2)通過用戶關(guān)系聚類來實(shí)現(xiàn)信息、用戶推薦。
[0011]上述推薦算法普遍存在一個(gè)毛病一一上述基于相似性、關(guān)聯(lián)性的傳統(tǒng)推薦算法,沒有對(duì)用戶行為或標(biāo)的信息背后蘊(yùn)含的深層語義進(jìn)行分析,僅依賴于用戶動(dòng)作的淺層含義,導(dǎo)致基于相似性的推薦只能停留在形式上。用戶真正需要的是一個(gè)能夠理解自己的,關(guān)于自己個(gè)人的信息提供管道。
[0012]而進(jìn)行語義分析,一來能夠提取用戶行為背后蘊(yùn)含的深層含義,二來能夠簡(jiǎn)約用戶和標(biāo)的信息關(guān)系型數(shù)據(jù)庫的存量,三來能夠公平推薦多個(gè)可能的信息源。
[0013]專利“一種用戶推薦方法及裝置”(申請(qǐng)?zhí)?201510089046.X)量化用戶行為,設(shè)定了一些固定的公式來實(shí)現(xiàn)用戶相互之間的推薦。
[0014]專利“用戶推薦方法及用戶推薦系統(tǒng)”(申請(qǐng)?zhí)?200910038601.0)僅僅利用了用戶的關(guān)系網(wǎng),那些好友推薦。沒有考慮任何其它外部可靠信息。
[0015]上述推薦系統(tǒng)尤其存在另外一個(gè)缺點(diǎn),即沒有實(shí)現(xiàn)推薦策略的在線更新:合理有效的用戶量化評(píng)價(jià),應(yīng)該充分利用用戶的其它公開數(shù)據(jù)、去隨著時(shí)間不斷更推薦策略。
【發(fā)明內(nèi)容】
[0016]本發(fā)明的目的為了解決用戶推薦技術(shù)存在的推薦內(nèi)容淺層、形式化以及缺少在線更新推薦策略的問題,提出了一種基于語義分析的在線用戶推薦系統(tǒng)及方法。
[0017]—種基于語義分析的在線用戶推薦系統(tǒng),其特征在于:包括用戶群組100、媒體信息源300、語義分析及存儲(chǔ)設(shè)備200 ;語義分析及存儲(chǔ)設(shè)備200接收用戶群組100發(fā)出的用戶行為和媒體信息源300提交的信息,分別進(jìn)行語義分析匹配后,為用戶群組100提供精確的推薦信息。
[0018]進(jìn)一步的,所述媒體信息源300包括但不限于商品信息、多媒體信息、個(gè)人服務(wù)信息和好友推薦信息。
[0019]進(jìn)一步的,所述用戶行為包括但不限于網(wǎng)頁瀏覽或拒絕記錄、商品瀏覽或拒絕記錄、好友瀏覽或拒絕記錄、瀏覽時(shí)間。
[0020]一種基于語義分析的在線用戶推薦方法,其特征在于:包括如下步驟:
[0021]I)用戶群組100上傳用戶行為到語義分析及存儲(chǔ)設(shè)備200中,語義分析及存儲(chǔ)設(shè)備200對(duì)用戶行為進(jìn)行語義分析;
[0022]2)媒體信息源300將信息提供給語義分析及存儲(chǔ)設(shè)備200,語義分析及存儲(chǔ)設(shè)備200對(duì)信息進(jìn)行語義分析;
[0023]3)語義分析及存儲(chǔ)設(shè)備200結(jié)合用戶行為和廣泛信息進(jìn)行聯(lián)合語義分析;
[0024]4)綜合上述第I)到第3)步驟的結(jié)果,語義分析及存儲(chǔ)設(shè)備200提煉出精確信息投放給用戶群組100 ;
[0025]5)用戶群組100對(duì)精確信息作出判斷,并且反饋用戶行為,循環(huán)步驟1)-3),再次反饋精確信息,實(shí)現(xiàn)在線用戶推薦。
[0026]進(jìn)一步的,所述步驟I)中語義分析及存儲(chǔ)設(shè)備200對(duì)用戶行為進(jìn)行語義分析的方法包括但不限于隱馬爾科夫模型方法、回歸神經(jīng)網(wǎng)絡(luò)方法、深度學(xué)習(xí)方法、統(tǒng)計(jì)學(xué)習(xí)方法。
[0027]進(jìn)一步的,所述步驟2)中語義分析及存儲(chǔ)設(shè)備200對(duì)信息進(jìn)行語義分析的方法包括但不限于隱馬爾科夫模型方法、回歸神經(jīng)網(wǎng)絡(luò)方法、深度學(xué)習(xí)方法、統(tǒng)計(jì)學(xué)習(xí)方法。
[0028]進(jìn)一步的,所述步驟3)中聯(lián)合語義分析的方法包括但不限于隱馬爾科夫模型方法、回歸神經(jīng)網(wǎng)絡(luò)方法、深度學(xué)習(xí)方法、統(tǒng)計(jì)學(xué)習(xí)方法。
[0029]有益效果
[0030]采用本發(fā)明的一種基于語義分析的在線用戶推薦技術(shù),具有如下有益效果:
[0031]1.同時(shí)對(duì)用戶行為和數(shù)據(jù)庫內(nèi)的信息源進(jìn)行語義分析,分析數(shù)據(jù)和用戶行為背后的深層含義;
[0032]2.不需要用戶行為進(jìn)行輔助就可以對(duì)信息進(jìn)行獨(dú)立的分析,并且獲得信息語義,這種技術(shù)可以在沒有大量用戶行為數(shù)據(jù)的時(shí)候,提供比較準(zhǔn)確的用戶推薦;
[0033]3.可以對(duì)用戶的行為進(jìn)行實(shí)時(shí)的學(xué)習(xí),并且反饋到用戶推薦中去。
【附圖說明】
[0034]圖1是本發(fā)明一種基于語義分析的在線用戶推薦技術(shù)所需的系統(tǒng)結(jié)構(gòu)圖;
[0035]圖2是本發(fā)明一種基于語義分析的在線用戶推薦技術(shù)的實(shí)現(xiàn)流程圖。
【具體實(shí)施方式】
[0036]下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明做進(jìn)一步說明。
[0037]實(shí)施例1
[0038]本實(shí)施例具體描述一種基于語義分析的在線用戶推薦技術(shù)的實(shí)現(xiàn)流程。
[0039]如圖1和圖2所示,流程主要包括:
[0040]I系統(tǒng)開機(jī),附圖1中的用戶群組100、語義分析及存儲(chǔ)設(shè)備200、媒體信息源300
等相