国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      用戶相似度確定方法及系統(tǒng)的制作方法

      文檔序號:9432547閱讀:642來源:國知局
      用戶相似度確定方法及系統(tǒng)的制作方法
      【技術(shù)領(lǐng)域】
      [0001] 本發(fā)明涉及信息處理技術(shù)領(lǐng)域,特別涉及一種用戶相似度確定方法、一種用戶相 似度確定系統(tǒng)。
      【背景技術(shù)】
      [0002] 隨著信息技術(shù)的日益發(fā)展,通過確定用戶之間的相似度并進而執(zhí)行相應的應用, 例如信息推薦,已經(jīng)成為信息技術(shù)領(lǐng)域中的一項重要內(nèi)容。W信息推薦為例,在目前進行信 息推薦的方案中,通常是采用推薦系統(tǒng)算法來計算出需要向用戶進行推薦的信息,常用的 推薦系統(tǒng)算法包括基于用戶的協(xié)同過濾算法、基于物品的協(xié)同過濾算法、基于內(nèi)容的推薦 算法、基于模型的推薦算法(如矩陣分解、隨機游走等)等。其中基于用戶的協(xié)同過濾算 法首先計算與被推薦用戶行為最相近的用戶,然后將送些用戶喜歡的物品推薦給被推薦用 戶。由于該算法實現(xiàn)簡單、解釋性強,因此在推薦系統(tǒng)中被廣泛采用。該算法的核必是計算 用戶之間的相似度。然而,由于信息推薦有著很高的實時性要求在,而在真實的推薦系統(tǒng) 中,用戶量大、用戶的特征維度高,從而導致送種計算相似度的方式效率低下,不能滿足實 時進行信息推薦的實際需求。

      【發(fā)明內(nèi)容】

      [0003] 基于此,針對上述現(xiàn)有技術(shù)中存在的問題,本發(fā)明的其中一個目的在于提供一種 用戶相似度確定方法,本發(fā)明的另一目的在于提供一種用戶相似度確定系統(tǒng),其可W提高 用戶相似度確定過程的效率,進而提高信息推薦的實時性。
      [0004] 為達到上述目的,本發(fā)明實施例采用W下技術(shù)方案:
      [0005] -種用戶相似度確定方法,包括步驟:
      [0006] 獲取用戶信息,并將各用戶信息分別設(shè)置為維度為預設(shè)第一數(shù)目的線性空間的一 個向量,并將該向量映射到維度為第二預設(shè)數(shù)目的線性子空間;
      [0007] 計算所述線性子空間的各維度的前第二預設(shè)數(shù)目的特征函數(shù)和特征值;
      [0008] 采用預定闊值對最小的前第二預設(shè)數(shù)目個特征值對應的特征函數(shù)進行二值化處 理,得到各用戶信息對應的二進制編碼;
      [0009] 根據(jù)各用戶信息的二進制編碼確定與該用戶信息相對應的用戶之間的相似度。
      [0010] -種用戶相似度確定系統(tǒng),包括:
      [0011] 向量映射模塊,用于獲取用戶信息,并將各用戶信息分別設(shè)置為維度為預設(shè)第一 數(shù)目的線性空間的一個向量,并將該向量映射到維度為第二預設(shè)數(shù)目的線性子空間;
      [0012] 特征計算模塊,用于計算所述線性子空間的各維度的前第二預設(shè)數(shù)目的特征函數(shù) 和特征值;
      [0013] 二值化模塊,用于采用預定闊值對最小的前第二預設(shè)數(shù)目個特征值對應的特征函 數(shù)進行二值化處理,得到各用戶信息對應的二進制編碼;
      [0014] 相似度確定模塊,用于根據(jù)各用戶信息的二進制編碼確定與該用戶信息相對應的 用戶之間的相似度。
      [0015] 根據(jù)上述本發(fā)明實施例的方案,其是將各用戶信息設(shè)置為維度為預設(shè)第一數(shù)目的 線性空間的一個向量后,將其壓縮為二進制編碼,并直接基于二進制編碼確定相似度,由于 將原來的用戶信息壓縮為二進制編碼后,數(shù)據(jù)量大大減小,而基于二進制編碼確定相似度 的方式相對比較簡單,所耗費的時間很短,因而大大提高了確定相似度的效率,并進而進一 步提高了信息推薦的實時性。
      【附圖說明】
      [0016] 圖1為本發(fā)明的用戶相似度確定方法實施例的流程示意圖;
      [0017] 圖2為本發(fā)明的一個具體示例中基于本發(fā)明方案確定相似度的示意圖;
      [001引圖3是本發(fā)明的用戶相似度確定系統(tǒng)實施例的結(jié)構(gòu)示意圖;
      [0019] 圖4是基于本發(fā)明提供的終端的部分框圖。
      【具體實施方式】
      [0020] 為使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,W下結(jié)合附圖及實施例,對本 發(fā)明進行進一步的詳細說明。應當理解,此處所描述的【具體實施方式】僅僅用W解釋本發(fā)明, 并不限定本發(fā)明的保護范圍。
      [0021] 步驟S101 ;獲取用戶信息,并將各用戶信息分別設(shè)置為維度為第一預設(shè)數(shù)目的線 性空間的一個向量,并將該向量映射到維度為第二預設(shè)數(shù)目的線性子空間;
      [0022] 步驟S102 ;計算所述線性子空間的各維度的前第二預設(shè)數(shù)目的特征函數(shù)和特征 值;
      [0023] 步驟S103;采用預定闊值對最小的前第二預設(shè)數(shù)目個特征值對應的特征函數(shù)進 行二值化處理,得到各用戶信息對應的二進制編碼;
      [0024] 步驟S104;根據(jù)各用戶信息的二進制編碼確定與該用戶信息相對應的用戶之間 的相似度。
      [0025] 根據(jù)上述本發(fā)明實施例的方法,其是將各用戶信息設(shè)置為維度為預設(shè)第一數(shù)目的 線性空間的一個向量后,將其壓縮為二進制編碼,并直接基于二進制編碼確定相似度,由于 將原來的用戶信息壓縮為二進制編碼后,數(shù)據(jù)量大大減小,而基于二進制編碼確定相似度 的方式相對比較簡單,所耗費的時間很短,因而大大提高了確定相似度的效率,并進而進一 步提高了信息推薦的實時性。
      [0026] 基于上述本發(fā)明實施例中的方法,W下結(jié)合其中一個具體示例進行詳細說明。
      [0027] 首先獲取用戶信息,并將每個待推薦的用戶表示為在d(上述第一預設(shè)數(shù)目)維線 性空間Rd的一個向量。
      [0028] 然后將每一個用戶對應的向量由維度為d的線性空間Rd映射到維度為k(上述第 二預設(shè)數(shù)目)的線性子空間Rk,其中,k的值可W根據(jù)實際應用需要進行設(shè)定。具體映射時, 可W采用采用主成分(PrincipleComponentAnalysis)分析方式進行映射,采用主成分分 析方式進行映射的具體過程,可W與目前已有的W及W后可能的改進后的方式相同,在此 不予詳加賞述。
      [0029]然后,對于線性子空間Rk中的每一個維度i= 1,…,k,計算對應于該維度的前k 個特征函數(shù)和特征。在其中一個具體示例中,可w采用公式
      計 算特征函數(shù),采用公5^
      計算特征值。
      [0030] 其中,在送兩個公式中,〇1似表示第i維對應的特征函數(shù),A1表示第i維對應 的特征值,X表示用戶對應向量在子空間Rk中第i維對應的值,k表示所述第二預設(shè)數(shù)目, b表示所有用戶對應向量在該維度的最大值,a表示所有用戶對應向量在該維度的最小值。
      [0031] 通過上述計算,可W得到kXk個特征值。然后對送kXk個特征值進行排序,并選 擇前k個最小的特征值所對應的特征函數(shù),對其進行二值化。在進行二值化時,由于特征 函數(shù)的形式是正弦函數(shù),為奇函數(shù),因此可W選擇0為上述預定闊值對該特征值函數(shù)進行 二值化,具體二值化函數(shù)可W為:
      [0032] Yi(x) =sign(〇i(x))
      [0033] 即當〇i(x)為正時,該位對應的二值化后的值為1,反之則為0。
      [0034] 根據(jù)W上步驟,可W將數(shù)據(jù)從原始空間壓縮為長度為k的二進制編碼。
      [0035] 在計算兩個用戶間的相似度時,基于上述二進制編碼,可W直接計算與該用戶相 對應的二進制編碼之間的海明距離(HammingDistance)即可,即比較兩串二進制編碼中相 同比特位、且該比特位的值也相同的數(shù)目。
      [0036] 圖2中示出了基于本發(fā)明方案的一個具體示例中的示意圖。如圖2所示,假設(shè)每 個用戶包含有H個特征,即包含3中用戶信息,例如圖2中所示的特征1、特征2、特征3。經(jīng) 過上述本發(fā)明方案的處理后,用戶1對應的二值化編碼表示為01010101,用戶2對應的二值 化編碼表示為01100110,對送兩個二值化編碼進行比較,共有四個比特位對應的值相同,因 此他們之間的距離為4。
      [0037] 在得到各用戶之間的相似度之后,即可根據(jù)該相似度進行后續(xù)的各種應用,例如 根據(jù)各用戶之間的相似來確定需要向該用戶進行推薦的信息的待推薦列表,在此不予展開 和詳細敘述。
      [0038] 根據(jù)與上述本發(fā)明的用戶相似度確定方法相同的思想,本發(fā)明實施例還提供一種 用戶相似度確定系統(tǒng)。圖3中示出了本發(fā)明的用戶相似度確定系統(tǒng)實施例的結(jié)構(gòu)示意圖。
      [0039] 如圖3所示,本實施例中的用戶相似度確定系統(tǒng)包括有:
      [0040] 向量映射模塊301,用于獲取用戶信息,并將各用戶信息分別設(shè)置為維度為第一預 設(shè)數(shù)目的線性空間的一個向量,并將該向量映射到維度為第二預設(shè)數(shù)目的線性子空間;
      [0041] 特征計算模塊302,用于計算所述線性子空間的各維度的前第二預設(shè)數(shù)目的特征 函數(shù)和特征值;
      [0042] 二值化模塊303,用于采用預定闊值對最小的前第二預設(shè)數(shù)目個特征值對應的特 征函數(shù)進行二值化處理,得到各用戶信息對應的二進制編碼;
      [0043] 相似度確定模塊304,用于根據(jù)各用戶信息的二進制編碼確定與該用戶信息相對 應的用戶之間的相似度。
      [0044] 根據(jù)上述本發(fā)明實施例的系統(tǒng),其是將各用戶信息設(shè)置為維度為預設(shè)第一數(shù)目的 線性空間的一個向量后,將其壓縮為二進制編碼,并直接基于二進制編碼確定相似度,由于 將原來的用戶信息壓縮為二進制編碼后,數(shù)據(jù)量大大減小,而基于二進制編碼確定相似度 的方式相對比較簡單,所耗費的時間很短,因而大大提高了確定相似度的效率,并進而進一 步提高了信息推薦的實時性。
      [0045]其中,向量映射模塊301在將所述向量映射到維度為第二預設(shè)數(shù)目的線性子空間 時,可W采用主成分分析方式進行映射。采用主成分分析方式進行映射的具體方式可W采 用目前已有的W及W后可能出現(xiàn)的任何方式進行,在此不予詳加賞述。
      [004引此外,特征計算模塊302在計算特征函數(shù)和特征值時,可W采用
      計算特征函數(shù),采用
      計算特征值。
      [0047]其中,〇i(x)表示第i維對應的特征函數(shù),A1表示第i維對應的特征值,X表示用 戶對應向量在子空間Rk中第i維對應的值,k表示所述第二預設(shè)數(shù)目,b表示所有用戶對應 向量在該維度的最大值,a表示所有用戶對應向量在該維度的最小值。
      [0048] 由于該特征函數(shù)的形式是正弦函數(shù),為奇函數(shù),因此上述二值化模塊303可W選 擇
      當前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1