一種實(shí)現(xiàn)信息推薦的方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開一種實(shí)現(xiàn)信息推薦的方法及系統(tǒng),該方法包括:當(dāng)接收到客戶端發(fā)送來的推薦請求時(shí),根據(jù)用戶當(dāng)前正在瀏覽的信息和信息相似度模型生成相關(guān)推薦列表;根據(jù)行為數(shù)據(jù)統(tǒng)計(jì)模型生成非個(gè)性化推薦列表;根據(jù)信息相似度模型、行為數(shù)據(jù)統(tǒng)計(jì)模型及用戶興趣模型生成個(gè)性化推薦列表;根據(jù)生成的相關(guān)推薦列表、個(gè)性化推薦列表及非個(gè)性化推薦列表生成綜合推薦列表;將生成的綜合推薦列表作為推薦結(jié)果返回給客戶端。本發(fā)明的方法及系統(tǒng)可以給用戶推薦符合用戶興趣且滿足其當(dāng)前用戶瀏覽信息場景的結(jié)果,而且還能根據(jù)推薦策略調(diào)整推薦結(jié)果使其更好的滿足用戶需求。
【專利說明】一種實(shí)現(xiàn)信息推薦的方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及信息處理領(lǐng)域,特別涉及一種實(shí)現(xiàn)信息推薦的方法及系統(tǒng)。
【背景技術(shù)】
[0002]隨著信息技術(shù)和互聯(lián)網(wǎng)的發(fā)展,人們逐漸從信息匱乏的時(shí)代走入了信息過載(Information overload)的時(shí)代。眾所周知,為了解決信息過載問題,已經(jīng)有無數(shù)科學(xué)家和工程師提出了很多天才的解決方案,其中代表性的解決方案是分類目錄和搜索引擎。搜索引擎可以讓用戶通過搜索關(guān)鍵詞找到自己需要的信息。但是,搜索引擎需要用戶主動(dòng)提供準(zhǔn)確的關(guān)鍵詞來找信息,因此不能解決用戶的很多其他需求,比如當(dāng)用戶無法找到準(zhǔn)確描述自己需求的關(guān)鍵詞時(shí),搜索引擎就無能為力了。和搜索引擎一樣,推薦系統(tǒng)也是一直幫助用戶快速發(fā)現(xiàn)有用信息的途徑。然而,現(xiàn)在的推薦系統(tǒng)基本上只根據(jù)用戶的歷史行為給用戶推薦可能感興趣的信息,考慮的因素少,推薦的信息比較單一,推薦結(jié)果難以使用戶滿意,不能很好的滿足用戶的需求。
【發(fā)明內(nèi)容】
[0003]為了解決現(xiàn)有技術(shù)中推薦系統(tǒng)存在的考慮因素少、推薦信息單一的問題,本發(fā)明實(shí)施例提供了一種實(shí)現(xiàn)信息推薦的方法及系統(tǒng)。所述技術(shù)方案如下:
[0004]—方面,一種實(shí)現(xiàn)信息推薦的方法,所述方法包括:
[0005]當(dāng)接收到客戶端發(fā)送來的推薦請求時(shí),根據(jù)用戶當(dāng)前正在瀏覽的信息和信息相似度模型生成相關(guān)推薦列表,其中,信息相似度模型是后臺(tái)服務(wù)根據(jù)用戶瀏覽過的信息按預(yù)設(shè)的周期離線計(jì)算出來的信息相似度矩陣;
[0006]根據(jù)行為數(shù)據(jù)統(tǒng)計(jì)模型生成非個(gè)性化推薦列表,其中,行為數(shù)據(jù)統(tǒng)計(jì)模型是后臺(tái)服務(wù)根據(jù)用戶對信息的行為按預(yù)設(shè)的周期離線統(tǒng)計(jì)出來的行為數(shù)據(jù);
[0007]根據(jù)信息相似度模型、行為數(shù)據(jù)統(tǒng)計(jì)模型及用戶興趣模型生成個(gè)性化推薦列表,其中,用戶興趣模型是后臺(tái)服務(wù)根據(jù)用戶對信息的行為數(shù)據(jù)分析提取出來的行為特征向量;
[0008]根據(jù)生成的相關(guān)推薦列表、個(gè)性化推薦列表及非個(gè)性化推薦列表生成綜合推薦列表;
[0009]將生成的綜合推薦列表作為推薦結(jié)果返回給客戶端。
[0010]另一方面,一種實(shí)現(xiàn)信息推薦的系統(tǒng),所述系統(tǒng)包括:
[0011]第一推薦列表生成模塊,用于當(dāng)接收到客戶端發(fā)送來的推薦請求時(shí),根據(jù)用戶當(dāng)前正在瀏覽的信息和信息相似度模型生成相關(guān)推薦列表,其中,信息相似度模型是后臺(tái)服務(wù)根據(jù)用戶瀏覽過的信息按預(yù)設(shè)的周期離線計(jì)算出來的信息相似度矩陣;
[0012]第二推薦列表生成模塊,用于根據(jù)行為數(shù)據(jù)統(tǒng)計(jì)模型生成非個(gè)性化推薦列表,其中,行為數(shù)據(jù)統(tǒng)計(jì)模型是后臺(tái)服務(wù)根據(jù)用戶對信息的行為按預(yù)設(shè)的周期離線統(tǒng)計(jì)出來的行為數(shù)據(jù);[0013]第三推薦列表生成模塊,用于根據(jù)信息相似度模型、行為數(shù)據(jù)統(tǒng)計(jì)模型及用戶興趣模型生成個(gè)性化推薦列表,其中,用戶興趣模型是后臺(tái)服務(wù)根據(jù)用戶對信息的行為數(shù)據(jù)分析提取出來的行為特征向量;
[0014]綜合推薦列表生成模塊,根據(jù)生成的相關(guān)推薦列表、個(gè)性化推薦列表及非個(gè)性化推薦列表生成綜合推薦列表;
[0015]推薦結(jié)果返回模塊,用于將生成的綜合推薦列表作為推薦結(jié)果返回給客戶端。
[0016]本發(fā)明實(shí)施例提供的技術(shù)方案帶來的有益效果是:
[0017]本發(fā)明實(shí)施例提供的一種實(shí)現(xiàn)推薦信息的方法及系統(tǒng),通過根據(jù)用戶當(dāng)前正在瀏覽的信息和離線計(jì)算生成的信息相似度模型、行為數(shù)據(jù)統(tǒng)計(jì)模型以及用戶興趣模型生成的相關(guān)推薦列表、個(gè)性化推薦列表及非個(gè)性化推薦列表得到綜合推薦列表,并對用戶反饋信息進(jìn)行分析,調(diào)整所述相關(guān)推薦列表、個(gè)性化推薦列表及非個(gè)性化推薦列表的組合比例,準(zhǔn)確了解用戶行為,預(yù)測用戶會(huì)對什么樣的推薦結(jié)果比較感興趣,不斷調(diào)整推薦策略使推薦結(jié)果更好的滿足用戶需求。
【專利附圖】
【附圖說明】
[0018]為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對實(shí)施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。其中附圖中的菱形框代表數(shù)據(jù),方框代表操作;
[0019]圖1是本發(fā)明一種實(shí)現(xiàn)信息推薦的方法較佳實(shí)施例提供的流程示意圖;
[0020]圖2是圖1所示步驟SlO之前進(jìn)一步包括的流程示意圖;
[0021]圖3為本發(fā)明一種實(shí)現(xiàn)信息推薦的系統(tǒng)較佳實(shí)施例提供的方框示意圖;
【具體實(shí)施方式】
[0022]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對本發(fā)明實(shí)施方式作進(jìn)一步地詳細(xì)描述。
[0023]實(shí)施例一
[0024]本發(fā)明實(shí)施例一提供一種實(shí)現(xiàn)信息推薦的方法,如圖1所示,該方法包括:
[0025]步驟SlO:當(dāng)接收到客戶端發(fā)送來的推薦請求時(shí),根據(jù)用戶當(dāng)前正在瀏覽的信息和信息相似度模型生成相關(guān)推薦列表。其中,信息相似度模型是后臺(tái)服務(wù)根據(jù)用戶瀏覽過的信息按預(yù)設(shè)的周期離線計(jì)算出來的信息相似度矩陣。
[0026]本實(shí)施例中,客戶端可通過API接口函數(shù)給服務(wù)器發(fā)送推薦請求。當(dāng)前用戶正在瀏覽的信息可以為某一地點(diǎn)的用戶在當(dāng)前時(shí)間瀏覽的視頻、圖片、商品、音樂等。
[0027]本實(shí)施例中,服務(wù)器中的后臺(tái)服務(wù)按照預(yù)設(shè)的周期(例如以一天為周期),對用戶瀏覽過的信息進(jìn)行離線計(jì)算,生成信息相似度模型。由于信息相似度模型的計(jì)算量大,若用戶當(dāng)前有新的信息加入便實(shí)時(shí)計(jì)算,對系統(tǒng)負(fù)荷大,而且用戶有新的信息加入對信息相似度影響不大,所以本實(shí)施例按照預(yù)設(shè)的周期采用離線方法來計(jì)算信息相似度模型。故,在接收到客戶端發(fā)送來的推薦請求之前,即在步驟SlO之前,本實(shí)施例還進(jìn)一步包括,如圖2所示:[0028]步驟S1:讀取用戶行為數(shù)據(jù)庫中用戶對信息的行為數(shù)據(jù)。
[0029]本實(shí)施例中,用戶行為數(shù)據(jù)庫中存儲(chǔ)消息日志系統(tǒng)實(shí)時(shí)記錄的用戶對信息的行為數(shù)據(jù),例如,用戶對信息的瀏覽、收藏等行為。
[0030]步驟S2:對行為數(shù)據(jù)進(jìn)行預(yù)處理,并將每條行為數(shù)據(jù)轉(zhuǎn)換成協(xié)同過濾算法所支持的數(shù)據(jù)格式。
[0031]本實(shí)施例中,讀取用戶對信息的行為數(shù)據(jù)后,需對行為數(shù)據(jù)進(jìn)行預(yù)處理,主要是對行為數(shù)據(jù)進(jìn)行清洗,去掉“臟”數(shù)據(jù)和噪音數(shù)據(jù),行為數(shù)據(jù)預(yù)處理后,需將行為數(shù)據(jù)轉(zhuǎn)換成協(xié)同過濾算法所支持的數(shù)據(jù)格式,例如可以轉(zhuǎn)換成(用戶,用戶位置,信息,時(shí)間)這種數(shù)據(jù)格式。
[0032]步驟S3:根據(jù)轉(zhuǎn)換后的行為數(shù)據(jù)調(diào)用協(xié)同過濾算法進(jìn)行計(jì)算得到第一信息相似度矩陣。
[0033]本實(shí)施例中,把經(jīng)過數(shù)據(jù)格式轉(zhuǎn)換后的行為數(shù)據(jù)輸入到協(xié)同過慮算法中進(jìn)行計(jì)算,以得到第一息相似度矩陣。其中,基于協(xié)同過慮算法以基于物品算法為例,并考慮上時(shí)間因素,算法技術(shù)公式如下:
【權(quán)利要求】
1.一種實(shí)現(xiàn)信息推薦的方法,其特征在于,所述方法包括: 當(dāng)接收到客戶端發(fā)送來的推薦請求時(shí),根據(jù)用戶當(dāng)前正在瀏覽的信息和信息相似度模型生成相關(guān)推薦列表,其中,信息相似度模型是后臺(tái)服務(wù)根據(jù)用戶瀏覽過的信息按預(yù)設(shè)的周期離線計(jì)算出來的信息相似度矩陣; 根據(jù)行為數(shù)據(jù)統(tǒng)計(jì)模型生成非個(gè)性化推薦列表,其中,行為數(shù)據(jù)統(tǒng)計(jì)模型是后臺(tái)服務(wù)根據(jù)用戶對信息的行為按預(yù)設(shè)的周期離線統(tǒng)計(jì)出來的行為數(shù)據(jù); 根據(jù)信息相似度模型、行為數(shù)據(jù)統(tǒng)計(jì)模型及用戶興趣模型生成個(gè)性化推薦列表,其中,用戶興趣模型是后臺(tái)服務(wù)根據(jù)用戶對信息的行為數(shù)據(jù)分析提取出來的行為特征向量; 根據(jù)生成的相關(guān)推薦列表、個(gè)性化推薦列表及非個(gè)性化推薦列表生成綜合推薦列表; 將生成的綜合推薦列表作為推薦結(jié)果返回給客戶端。
2.如權(quán)利要求1所述的方法,其特征在于,在接收到客戶端發(fā)送來的推薦請求之前,還包括: 讀取用戶行為數(shù)據(jù)庫中用戶對信息的行為數(shù)據(jù); 對行為數(shù)據(jù)進(jìn)行預(yù)處理,并將預(yù)處理后的每條行為數(shù)據(jù)轉(zhuǎn)換成協(xié)同過濾算法所支持的數(shù)據(jù)格式; 根據(jù)轉(zhuǎn)換后的行為數(shù)據(jù)調(diào)用協(xié)同過濾算法進(jìn)行計(jì)算得到第一信息相似度矩陣; 讀取信息數(shù)據(jù)庫中的信息數(shù)據(jù); 對信息數(shù)據(jù)進(jìn)行預(yù) 處理,并將預(yù)處理后的每條信息數(shù)據(jù)轉(zhuǎn)換成基于內(nèi)容的相似度計(jì)算算法所支持的數(shù)據(jù)格式; 從轉(zhuǎn)換后的所有信息數(shù)據(jù)中提取每個(gè)信息的信息特征,并根據(jù)信息特征計(jì)算信息特征的權(quán)重,以及根據(jù)信息特征和信息特征的權(quán)重計(jì)算出第二信息相似度矩陣; 將第一信息相似度矩陣和第二信息相似度矩陣進(jìn)行線性組合相加,得到信息相似度模型,并將其保存到信息模型數(shù)據(jù)庫中。
3.如權(quán)利要求1所述的方法,其特征在于,在接收到客戶端發(fā)送來的推薦請求之前,還包括: 讀取用戶行為數(shù)據(jù)庫中用戶對信息的行為數(shù)據(jù); 對行為數(shù)據(jù)進(jìn)行預(yù)處理,統(tǒng)計(jì)預(yù)處理后的行為數(shù)據(jù),并把統(tǒng)計(jì)得到的行為數(shù)據(jù)統(tǒng)計(jì)模型存到行為數(shù)據(jù)統(tǒng)計(jì)模型數(shù)據(jù)庫中。
4.如權(quán)利要求1所述的方法,其特征在于,在接收到客戶端發(fā)送來的推薦請求之前,還包括: 讀取用戶行為數(shù)據(jù)庫中用戶對信息的行為數(shù)據(jù); 對用戶行為數(shù)據(jù)預(yù)處理,并從預(yù)處理后的行為數(shù)據(jù)中分析提取行為特征向量,得到用戶興趣模型。
5.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)生成的相關(guān)推薦列表、個(gè)性化推薦列表及非個(gè)性化推薦列表生成綜合推薦列表的步驟還進(jìn)一步包括: 根據(jù)用戶的反饋信息調(diào)整所述相關(guān)推薦列表、個(gè)性化推薦列表及非個(gè)性化推薦列表的組合比例,以得到最終的綜合推薦列表。
6.一種實(shí)現(xiàn)信息推薦的系統(tǒng),其特征在于,所述系統(tǒng)包括: 第一推薦列表生成模塊,用于當(dāng)接收到客戶端發(fā)送來的推薦請求時(shí),根據(jù)用戶當(dāng)前正在瀏覽的信息和信息相似度模型生成相關(guān)推薦列表,其中,信息相似度模型是后臺(tái)服務(wù)根據(jù)用戶瀏覽過的信息按預(yù)設(shè)的周期離線計(jì)算出來的信息相似度矩陣; 第二推薦列表生成模塊,用于根據(jù)行為數(shù)據(jù)統(tǒng)計(jì)模型生成非個(gè)性化推薦列表,其中,行為數(shù)據(jù)統(tǒng)計(jì)模型是后臺(tái)服務(wù)根據(jù)用戶對信息的行為按預(yù)設(shè)的周期離線統(tǒng)計(jì)出來的行為數(shù)據(jù); 第三推薦列表生成模塊,用于根據(jù)信息相似度模型、行為數(shù)據(jù)統(tǒng)計(jì)模型及用戶興趣模型生成個(gè)性化推薦列表,其中,用戶興趣模型是后臺(tái)服務(wù)根據(jù)用戶對信息的行為數(shù)據(jù)分析提取出來的行為特征向量; 綜合推薦列表生成模塊,根據(jù)生成的相關(guān)推薦列表、個(gè)性化推薦列表及非個(gè)性化推薦列表生成綜合推薦列表; 推薦結(jié)果返回模塊,用于將生成的綜合推薦列表作為推薦結(jié)果返回給客戶端。
7.如權(quán)利要求6所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括: 第一行為數(shù)據(jù)讀取模塊,用于讀取用戶行為數(shù)據(jù)庫中用戶對信息的行為數(shù)據(jù); 行為數(shù)據(jù)預(yù)處理與轉(zhuǎn)換模塊,用于對行為數(shù)據(jù)進(jìn)行預(yù)處理,并將預(yù)處理后的每條行為數(shù)據(jù)轉(zhuǎn)換成協(xié)同過濾算法所支持的數(shù)據(jù)格式; 行為數(shù)據(jù)計(jì)算模塊,用于根據(jù)轉(zhuǎn)換后的行為數(shù)據(jù)調(diào)用協(xié)同過濾算法進(jìn)行計(jì)算得到第一信息相似度矩陣; 信息數(shù)據(jù)讀取模塊,用于讀取信息數(shù)據(jù)庫中信息數(shù)據(jù); 信息數(shù)據(jù)預(yù)處理與轉(zhuǎn)換模塊,用于對信息數(shù)據(jù)進(jìn)行預(yù)處理,并將預(yù)處理后的信息數(shù)據(jù)轉(zhuǎn)換成基于內(nèi)容的相似度計(jì)算算法所支持的數(shù)據(jù)格式;` 信息數(shù)據(jù)計(jì)算模塊,用于從轉(zhuǎn)換后的所有信息數(shù)據(jù)中提取每個(gè)信息的信息特征,并根據(jù)信息特征計(jì)算信息特征的權(quán)重,以及根據(jù)信息特征和信息特征的權(quán)重計(jì)算出第二信息相似度矩陣; 融合保存模塊,用于將第一信息相似度矩陣和第二信息相似度矩陣進(jìn)行線性組合相加,得到信息相似度模型,并將其保存到信息模型數(shù)據(jù)庫中。
8.如權(quán)利要求6所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括: 第二行為數(shù)據(jù)讀取模塊,用于讀取用戶行為數(shù)據(jù)庫中用戶對信息的行為數(shù)據(jù); 行為數(shù)據(jù)預(yù)處理與統(tǒng)計(jì)模塊,用于對行為數(shù)據(jù)進(jìn)行預(yù)處理,統(tǒng)計(jì)預(yù)處理后的行為數(shù)據(jù),并把統(tǒng)計(jì)得到的行為數(shù)據(jù)統(tǒng)計(jì)模型存到行為數(shù)據(jù)統(tǒng)計(jì)模型數(shù)據(jù)庫中。
9.如權(quán)利要求6所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括: 第三行為數(shù)據(jù)讀取模塊,用于讀取用戶行為數(shù)據(jù)庫中用戶對信息的行為數(shù)據(jù); 行為數(shù)據(jù)預(yù)處理與提取模塊,用于對行為數(shù)據(jù)進(jìn)行預(yù)處理,并從預(yù)處理后的行為數(shù)據(jù)中分析提取行為特征向量,得到用戶興趣模型。
10.如權(quán)利要求6所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括: 調(diào)整模塊,用于根據(jù)用戶反饋信息調(diào)整所述相關(guān)推薦列表、個(gè)性化推薦列表及非個(gè)性化推薦列表的組合比例,以得到最終的綜合推薦列表。
【文檔編號(hào)】G06F17/30GK103678647SQ201310714910
【公開日】2014年3月26日 申請日期:2013年12月20日 優(yōu)先權(quán)日:2013年12月20日
【發(fā)明者】鄭巧玲, 史淼泓, 范杰, 楊劼 申請人:Tcl集團(tuán)股份有限公司