專利名稱:下載資源推薦方法及系統(tǒng)的制作方法
下載資源推薦方法及系統(tǒng)
技術領域:
本發(fā)明涉及網(wǎng)絡技術領域,特別涉及一種下載資源推薦方法及系統(tǒng)。
背景技術:
隨著通信事業(yè)的發(fā)展,網(wǎng)絡帶寬得到了較大的提升,從而出現(xiàn)了大量的提供下載資源的網(wǎng)站和客戶端軟件。這些網(wǎng)站和客戶端軟件將下載資源分門別類,然后展示給用戶。用戶可以根據(jù)自己的需要選擇合適的下載資源進行下載。下載資源可包括軟件、視頻、音頻、圖片、文本等。為了使用戶選擇資源更加便利,除了支持用戶主動提交下載請求的功能以外,還提供額外的下載資源推薦的功能,就是將一些優(yōu)質的下載資源,例如熱門電影,熱門游戲,常用軟件等,主動推送到頁面或者客戶端上展現(xiàn)給用戶。傳統(tǒng)技術中的一種下載資源推薦方法,根據(jù)下載資源的下載記錄確定下載資源的熱度(下載量越大熱度越高),然后將下載資源按照熱度排序,并將熱度排名的top N(即資源熱度排名的前N個下載資源,N為自然數(shù),可根據(jù)需求設置)推薦給用戶。但由于下載資源的下載記錄只能反映統(tǒng)計學上用戶整體的興趣點,因此推薦給用戶的下載資源與用戶的相關性不聞。傳統(tǒng)技術中的另一種改進型下載資源推薦方法,先根據(jù)每個用戶對每個下載資源的評分建立一張評分表(評分矩陣),然后根據(jù)用戶對不同下載資源的評分的相似度來挖掘出和目標用戶(待推薦用戶)相似的目標用戶群組,然后根據(jù)該群組的整體喜好程度(如目標用戶群組中的用戶對下載資源的評分)向目標用戶推薦下載資源。然而,這種改進型下載資源推薦方法雖然在前一種下載資源推薦方法的基礎上提高了下載資源與目標用戶的相關性,但是,用戶對下載資源的評分不易獲取(很多用戶下載完成后并不會進行評分),且由于僅僅通過目標用戶群組的整體喜好程度來判定目標用戶對下載資源的興趣度,使得目標用戶與下載資源相關性不足,從而使得向目標用戶推薦下載資源的方法的準確度不高。
發(fā)明內(nèi)容基于此,有必要提供一種提高推薦的準確度的下載資源推薦方法?!N下載資源推薦方法,包括以下步驟:獲取目標用戶的下載記錄,根據(jù)所述下載記錄獲取與目標用戶關聯(lián)的目標用戶群組;獲取所述目標用戶群組的下載記錄和全局用戶群組的下載記錄;對所述目標用戶群組的下載記錄和所述全局用戶群組的下載記錄進行處理,生成目標用戶群組的下載記錄中的下載資源與全局用戶群組之間的差異度;根據(jù)所述差異度對所述下載資源進行排序,將排序靠前的預設數(shù)量的下載資源推薦給所述目標用戶。優(yōu)選的,所述根據(jù) 所述下載記錄獲取與目標用戶對應的目標用戶群組的步驟包括:獲取近期用戶的下載記錄;遍歷所述用戶的下載記錄,對每個所述用戶的下載記錄,執(zhí)行:將所述用戶的下載記錄與所述目標用戶的下載記錄進行對比,獲取下載記錄與所述目標用戶的下載記錄匹配的用戶,將所述獲取的用戶添加到目標用戶群組中。優(yōu)選的,所述將所述用戶的下載記錄與所述目標用戶的下載記錄進行對比,獲取下載記錄與所述目標用戶的下載記錄匹配的用戶的步驟為:獲取所述用戶的下載記錄中的資源哈希值和/或資源文件名;將所述用戶的下載記錄中的資源哈希值和/或資源文件名與所述目標用戶的下載記錄中的資源哈希值和/或資源文件名進行對比,獲取資源哈希值和/或資源文件名與所述目標用戶相匹配的用戶。優(yōu)選的,所述對目標用戶群組的下載記錄和所述全局用戶群組的下載記錄進行處理,生成目標用戶群組中的下載資源與全局用戶群組之間的差異度的步驟包括:統(tǒng)計所述目標用戶群組的下載記錄中下載資源的下載頻次;篩選出所述目標用戶群組的下載記錄中的下載頻次超過第一閾值的下載資源。優(yōu)選的,所述對所述目標用戶群組的下載記錄和所述全局用戶群組的下載記錄進行處理,獲得目標用戶群組的下載記錄中的下載資源與全局用戶群組之間的差異度的步驟包括:獲取所述目標用戶群組的下載記錄中的下載資源的第一下載頻次,以及所述目標用戶群組中的下載記錄中的下載資源在所述全局用戶群組中的下載記錄中的第二下載頻次;獲取目標用戶群組的第一用戶數(shù)以及全體用戶群組的第二用戶數(shù);根據(jù)所述第一下載頻次、第二下載頻次、第一用戶數(shù)和第二用戶數(shù)計算得到所述篩選出的下載資源與所述全局用戶群組的差異度。優(yōu)選的,在所述根據(jù)所述差異度對所述下載資源進行排序的步驟之前還包括:篩選出差異度大于第二閾值的所述目標用戶群組中的下載資源。此外,還有必要提供一種提高推薦的準確度的下載資源推薦系統(tǒng)。一種下載資源推薦系統(tǒng),包括以下模塊:目標用戶群組獲取模塊,用于獲取目標用戶的下載記錄,根據(jù)所述下載記錄獲取與目標用戶關聯(lián)的目標用戶群組;下載記錄獲取模塊,用于獲取所述目標用戶群組的下載記錄和全局用戶群組的下載記錄;差異度生成模塊,用于對所述目標用戶群組的下載記錄和所述全局用戶群組的下載記錄進行處理,生成目標用戶群組的下載記錄中的下載資源與全局用戶群組之間的差異度;推薦模塊,用于根據(jù)所述差異度對所述下載資源進行排序,將排序靠前的預設數(shù)量的下載資源推薦給所述目標用戶。優(yōu)選的,所述目標用戶群組獲取模塊還用于獲取近期用戶的下載記錄,遍歷所述用戶的下載記錄,對每個所述用戶的下載記錄,執(zhí)行:
將所述用戶的下載記錄與所述目標用戶的下載記錄進行對比,獲取下載記錄與所述目標用戶的下載記錄匹配的用戶,將所述獲取的用戶添加到目標用戶群組中。優(yōu)選的,所述目標用戶群組獲取模塊還用于獲取所述用戶的下載記錄中的資源哈希值和/或資源文件名,將所述用戶的下載記錄中的資源哈希值和/或資源文件名與所述目標用戶的下載記錄中的資源哈希值和/或資源文件名進行對比,獲取資源哈希值和/或資源文件名與所述目標用戶相匹配的用戶。優(yōu)選的,還包括資源篩選模塊,用于統(tǒng)計所述目標用戶群組的下載記錄中下載資源的下載頻次,篩選出所述目標用戶群組的下載記錄中的下載頻次超過第一閾值的下載資源。優(yōu)選的,所述差異度生成模塊還用于獲取所述目標用戶群組的下載記錄中的下載資源的第一下載頻次,以及所述目標用戶群組中的下載記錄中的下載資源在所述全局用戶群組中的下載記錄中的第二下載頻次,獲取目標用戶群組的第一用戶數(shù)以及全體用戶群組的第二用戶數(shù),根據(jù)所述第一下載頻次、第二下載頻次、第一用戶數(shù)和第二用戶數(shù)計算得到所述篩選出的下載資源與所述全局用戶群組的差異度。優(yōu)選的,所述資源篩選模塊還用于篩選出差異度大于第二閾值的所述目標用戶群組中的下載資源。上述下載資源推薦方法和系統(tǒng),先通過目標用戶的下載記錄獲取該用戶所屬的目標用戶群組,然后再根據(jù)目標用戶群組在下載頻次上與全局用戶群組的差異度選擇合適的下載資源推薦給目標用戶。由于目標用戶和目標用戶群組中的其他用戶在對下載資源的興趣上相關性較強,可以推出,當目標用戶群組對下載資源的興趣度和全局用戶群組相比差異度較大時,目標用戶對這些下載資源的興趣度相較于全局用戶群組中的其他用戶下載過的下載資源更高,從而提高了向目標用戶推薦下載資源的準確度。
圖1為一個實施例中下載資源推薦方法的流程圖;圖2為一個實施例中下載資源推薦系統(tǒng)的結構示意圖;圖3為另一個實施例中下載資源推薦系統(tǒng)的結構示意圖。
具體實施方式如圖1所示,在一個實施例中,一種下載資源推薦方法,包括以下步驟:步驟S102,獲取目標用戶的下載記錄,根據(jù)下載記錄獲取與目標用戶關聯(lián)的目標用戶群組。目標用戶即為待推薦的用戶。在一個實施例中,可以獲取目標用戶近期的下載記錄,如最近一周或最近一月的下載記錄。下載記錄中可包括該用戶下載了哪些下載資源以及下載資源的下載頻次等。在一個實施例中,在步驟S102中,獲取近期用戶的下載記錄,遍歷用戶的下載記錄,對每個用戶的下載記錄,執(zhí)行:將用戶的下載記錄與目標用戶的下載記錄進行對比,獲取下載記錄與目標用戶的下載記錄匹配的用戶,將獲取的用戶添加到目標用戶群組中。優(yōu)選的,可獲取近 期活躍用戶的下載記錄,活躍用戶是指用戶活躍度超過事先設定的參考值的用戶,用戶活躍度可以為下載次數(shù)、在線時間、每日啟動下載次數(shù)或這三者的加權平均值。具體的,可每隔一段時間統(tǒng)計出活躍用戶,并將活躍用戶存儲在用戶庫中。下載記錄中記錄了每個活躍用戶在近期下載的下載資源的名稱和/或下載資源的哈希值以及下載資源的下載頻次。以活躍用戶為單位遍歷該下載記錄,若目標用戶的下載記錄中的下載資源和該活躍用戶的下載記錄中的下載資源匹配,則將該用戶添加到目標用戶群組中。進一步的,可設置目標用戶群組中的用戶數(shù)的最大值,當目標用戶群組的用戶數(shù)達到該最大值時,則停止遍歷。進一步的,可獲取用戶的下載記錄中的資源哈希值和/或資源文件名,將用戶的下載記錄中的資源哈希值和/或資源文件名與目標用戶的下載記錄中的資源哈希值和/或資源文件名進行對比,獲取資源哈希值和/或資源文件名與目標用戶相匹配的用戶。在對比下載資源的哈希值時,可先獲取目標用戶的下載記錄中記錄的下載資源的哈希值,然后和遍歷的用戶的下載記錄中記錄的下載資源的哈希值進行對比,若相同,則判定兩者匹配,否則,則判定兩者不匹配。在對比下載資源的名稱時,可先獲取目標用戶的下載記錄中記錄的下載資源的名稱以及遍歷的用戶的下載記錄中的下載資源的名稱,然后采用最大公共子串的方法判定兩者的名稱是否相匹配。例如,設最大公共子串為0.5,若目標用戶的下載記錄中記錄的下載資源的名稱為“哈利波特與魔法石”,遍歷的用戶的下載記錄中記錄的下載資源的名稱為“哈利波特與火焰杯”,則最大公共子串為“哈利波特與”,則相似度為5/8,大于0.5,判定兩者匹配。此外,還可設置一閾值,在遍歷用戶的下載記錄的過程中,若所遍歷到的用戶的下載記錄中與目標用戶的資源哈希值和/或資源文件名相匹配的下載資源超過該閾值,則將該遍歷的用戶添加到目標用戶群組。步驟S 104,獲取目標用戶群組的下載記錄和全局用戶群組的下載記錄。全局用戶群組可以包括所有用戶,也可設置全局用戶群組的用戶數(shù),根據(jù)該用戶數(shù)選取的一個較大的用戶樣本空間作為全局用戶群組。例如,可隨機選取10000個用戶加入全局用戶群組。步驟S106,對目標用戶群組的下載記錄和全局用戶群組的下載記錄進行處理,生成目標用戶群組的下載記錄中的下載資源與全局用戶群組之間的差異度。在一個實施例中,獲取目標用戶群組的下載記錄中的下載資源的第一下載頻次,以及目標用戶群組中的下載記錄中的下載資源在全局用戶群組中的下載記錄中的第二下載頻次;獲取目標用戶群組的第一用戶數(shù)以及全體用戶群組的第二用戶數(shù);根據(jù)第一下載頻次、第二下載頻次、第一用戶數(shù)和第二用戶數(shù)計算得到篩選出的下載資源與全局用戶群組的差異度。在一個實施例中,可根據(jù)如下公式計算差異度:
權利要求
1.一種下載資源推薦方法,包括以下步驟: 獲取目標用戶的下載記錄,根據(jù)所述下載記錄獲取與目標用戶關聯(lián)的目標用戶群組; 獲取所述目標用戶群組的下載記錄和全局用戶群組的下載記錄; 對所述目標用戶群組的下載記錄和所述全局用戶群組的下載記錄進行處理,生成目標用戶群組的下載記錄中的下載資源與全局用戶群組之間的差異度; 根據(jù)所述差異度對所述下載資源進行排序,將排序靠前的預設數(shù)量的下載資源推薦給所述目標用戶。
2.根據(jù)權利要求1所述的下載資源推薦方法,其特征在于,所述根據(jù)所述下載記錄獲取與目標用戶對應的目標用戶群組的步驟包括: 獲取近期用戶的下載記錄; 遍歷所述用戶的下載記錄,對每個所述用戶的下載記錄,執(zhí)行: 將所述用戶的下載記錄與所述目標 用戶的下載記錄進行對比,獲取下載記錄與所述目標用戶的下載記錄匹配的用戶,將所述獲取的用戶添加到目標用戶群組中。
3.根據(jù)權利要求2所述的下載資源推薦方法,其特征在于,所述將所述用戶的下載記錄與所述目標用戶的下載記錄進行對比,獲取下載記錄與所述目標用戶的下載記錄匹配的用戶的步驟為: 獲取所述用戶的下載記錄中的資源哈希值和/或資源文件名; 將所述用戶的下載記錄中的資源哈希值和/或資源文件名與所述目標用戶的下載記錄中的資源哈希值和/或資源文件名進行對比,獲取資源哈希值和/或資源文件名與所述目標用戶相匹配的用戶。
4.根據(jù)權利要求1所述的下載資源推薦方法,其特征在于,所述對目標用戶群組的下載記錄和所述全局用戶群組的下載記錄進行處理,生成目標用戶群組中的下載資源與全局用戶群組之間的差異度的步驟包括: 統(tǒng)計所述目標用戶群組的下載記錄中下載資源的下載頻次; 篩選出所述目標用戶群組的下載記錄中的下載頻次超過第一閾值的下載資源。
5.根據(jù)權利要求4所述的下載資源推薦方法,其特征在于,所述對所述目標用戶群組的下載記錄和所述全局用戶群組的下載記錄進行處理,獲得目標用戶群組的下載記錄中的下載資源與全局用戶群組之間的差異度的步驟包括: 獲取所述目標用戶群組的下載記錄中的下載資源的第一下載頻次,以及所述目標用戶群組中的下載記錄中的下載資源在所述全局用戶群組中的下載記錄中的第二下載頻次;獲取目標用戶群組的第一用戶數(shù)以及全體用戶群組的第二用戶數(shù); 根據(jù)所述第一下載頻次、第二下載頻次、第一用戶數(shù)和第二用戶數(shù)計算得到所述篩選出的下載資源與所述全局用戶群組的差異度。
6.根據(jù)權利要求5所述的下載資源推薦方法,其特征在于,在所述根據(jù)所述差異度對所述下載資源進行排序的步驟之前還包括: 篩選出差異度大于第二閾值的所述目標用戶群組中的下載資源。
7.一種下載資源推薦系統(tǒng),其特征在于,包括以下模塊: 目標用戶群組獲取模塊,用于獲取目標用戶的下載記錄,根據(jù)所述下載記錄獲取與目標用戶關聯(lián)的目標用戶群組;下載記錄獲取模塊,用于獲取所述目標用戶群組的下載記錄和全局用戶群組的下載記錄;差異度生成模塊,用于對所述目標用戶群組的下載記錄和所述全局用戶群組的下載記錄進行處理,生成目標用戶群組的下載記錄中的下載資源與全局用戶群組之間的差異度; 推薦模塊,用于根據(jù)所述差異度對所述下載資源進行排序,將排序靠前的預設數(shù)量的下載資源推薦給所述目標用戶。
8.根據(jù)權利要求7所述的下載資源推薦系統(tǒng),其特征在于,所述目標用戶群組獲取模塊還用于獲取近期用戶的下載記錄,遍歷所述用戶的下載記錄,對每個所述用戶的下載記錄,執(zhí)行: 將所述用戶的下載記錄與所述目標用戶的下載記錄進行對比,獲取下載記錄與所述目標用戶的下載記錄匹配的用戶,將所述獲取的用戶添加到目標用戶群組中。
9.根據(jù)權利要求8所述的下載資源推薦系統(tǒng),其特征在于,所述目標用戶群組獲取模塊還用于獲取所述用戶的下載記錄中的資源哈希值和/或資源文件名,將所述用戶的下載記錄中的資源哈希值和/或資源文件名與所述目標用戶的下載記錄中的資源哈希值和/或資源文件名進行對比,獲取資源哈希值和/或資源文件名與所述目標用戶相匹配的用戶。
10.根據(jù)權利要求7所述的下載資源推薦系統(tǒng),其特征在于,還包括資源篩選模塊,用于統(tǒng)計所述目標用戶群組的下載記錄中下載資源的下載頻次,篩選出所述目標用戶群組的下載記錄中的下載頻次超過第一閾值的下載資源。
11.根據(jù)權利要求10所述的下載資源推薦系統(tǒng),其特征在于,所述差異度生成模塊還用于獲取所述目標用戶群組的下載記錄中的下載資源的第一下載頻次,以及所述目標用戶群組中的下載記錄 中的下載資源在所述全局用戶群組中的下載記錄中的第二下載頻次,獲取目標用戶群組的第一用戶數(shù)以及全體用戶群組的第二用戶數(shù),根據(jù)所述第一下載頻次、第二下載頻次、第一用戶數(shù)和第二用戶數(shù)計算得到所述篩選出的下載資源與所述全局用戶群組的差異度。
12.根據(jù)權利要求10所述的下載資源推薦系統(tǒng),其特征在于,所述資源篩選模塊還用于篩選出差異度大于第二閾值的所述目標用戶群組中的下載資源。
全文摘要
一種下載資源推薦方法,包括以下步驟獲取目標用戶的下載記錄,根據(jù)所述下載記錄獲取與目標用戶關聯(lián)的目標用戶群組;獲取所述目標用戶群組的下載記錄和全局用戶群組的下載記錄;對所述目標用戶群組的下載記錄和所述全局用戶群組的下載記錄進行處理,生成目標用戶群組的下載記錄中的下載資源與全局用戶群組之間的差異度;根據(jù)所述差異度對所述下載資源進行排序,將排序靠前的預設數(shù)量的下載資源推薦給所述目標用戶。此外,還提供了一種下載資源推薦系統(tǒng)。上述下載資源推薦方法及系統(tǒng)提高了向目標用戶推薦下載資源的準確度。
文檔編號G06F17/30GK103218366SQ20121001876
公開日2013年7月24日 申請日期2012年1月20日 優(yōu)先權日2012年1月20日
發(fā)明者冀祖峰, 劉剛, 朱臣元 申請人:騰訊科技(深圳)有限公司