国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于異構信息網(wǎng)絡的移動應用排序和聚類方法

      文檔序號:8457304閱讀:181來源:國知局
      一種基于異構信息網(wǎng)絡的移動應用排序和聚類方法
      【技術領域】
      [0001] 本發(fā)明屬于應用推薦領域,尤其涉及一種基于異構信息網(wǎng)絡的特質(zhì)以及基于排序 的聚類方法,實現(xiàn)了一種對移動應用進行有效聚類和排序的方法。
      【背景技術】
      [0002] 隨著移動互聯(lián)網(wǎng)的迅速發(fā)展,移動市場中涌現(xiàn)出了數(shù)量龐大的應用,這些各式各 樣的移動應用正在逐漸改變著人們的生活。每個移動應用都關聯(lián)著各自相關的信息,而 成千上萬的移動應用就形成了一個龐大的異構信息網(wǎng)絡,這個網(wǎng)絡包含了大量有價值的信 息,因此對移動應用信息網(wǎng)絡的研宄將具有很重要的意義。一方面,深入分析大量移動應用 的使用情況可以幫助我們詳細了解用戶的使用行為,從而為用戶提供更為個性化的服務。 例如個性化的應用推薦通過挖掘用戶之間或者應用之間的潛在結構化關系來為目標用戶 推薦更為準確的移動應用,從而提升用戶的體驗度。另一方面,對移動應用數(shù)據(jù)的分析還能 幫助公司找到更加有效的廣告推廣平臺。通常用戶從應用市場中獲取應用的方法主要分為 三種途徑:一種是使用應用市場的搜索引擎,直接進行搜索,第二種是使用應用市場中的應 用分類標簽以及排名來尋找需要的應用,第三種是在系統(tǒng)推薦的應用列表中獲取應用。其 中,應用搜索主要是采用關鍵字匹配方法,使用到的信息類型是移動應用的名稱,而分類標 簽往往是固定的、人為事先設定的,隨著應用數(shù)量的增長,標簽設定的不合理之處將會逐漸 顯現(xiàn)出來,有鑒于此,采用一種有效的信息提取技術以彌補這些不足之處是十分必要的。聚 類是一種了解數(shù)據(jù),掌握有效信息的重要方法之一,大量雜亂的數(shù)據(jù)通過使用聚類方法被 歸于不同的組,有利于對數(shù)據(jù)的分析和學習,對移動應用數(shù)據(jù)進行聚類分析可以作為預測 建模之前的預處理步驟。目前,大部分的能夠用于應用數(shù)據(jù)聚類分析的方法主要是針對同 構信息網(wǎng)絡的,即基于應用的某一類型信息,使用單一類型的信息源由于忽略了其他相關 信息,在很大程度上限制了聚類的準確度。因此一種通過提取應用的不同類型的信息以構 建一個移動應用異構網(wǎng)絡,然后基于該網(wǎng)絡對應用本身以及其相關信息進行聚類分析的方 法已成為學術界與工業(yè)界的迫切需求。

      【發(fā)明內(nèi)容】

      [0003] 針對上述技術問題,本發(fā)明提出一種基于異構信息網(wǎng)絡的移動應用排序和聚類方 法
      [0004] 為了解決上述技術問題,本發(fā)明的技術方案如下:
      [0005] 一種基于異構信息網(wǎng)絡的移動應用排序和聚類方法,系統(tǒng)包括數(shù)據(jù)預處理模塊、 排序分布計算模塊以及概率生成模塊,具體包括如下步驟:
      [0006] 11)數(shù)據(jù)預處理模塊從移動應用市場中獲得移動應用信息文檔,對該移動應用信 息文檔進行預處理,所述預處理過程包括信息過濾,分詞處理以及關鍵詞提??;
      [0007] 12)構建起一個由四類信息組成的星形異構網(wǎng)絡;對該星形異構網(wǎng)絡進行隨機聚 類,星形異構網(wǎng)絡隨之分為多個子網(wǎng)絡;
      [0008] 13)排序分布計算模塊接收子網(wǎng)絡分別結算每個子網(wǎng)絡中屬性節(jié)點的排序分布, 然后輸出;
      [0009] 13)概率生成模型接收屬性節(jié)點的排序分布用于計算中心節(jié)點在每個子網(wǎng)絡中的 后驗概率,之后通過近鄰關系計算其他屬性節(jié)點的后驗概率,最后檢查聚類結果是否收斂, 如果不收斂就按照新的概率分布重新劃分子網(wǎng)絡輸入到排序分布計算模塊,如果收斂就作 為聚類結果輸出。
      [0010] 進一步的,所述排序分布計算模塊排序流程具體包括如下步驟:
      [0011] 首先輸入為聚類數(shù)K以及K個移動應用的子網(wǎng)絡,然后分別計算三類屬性節(jié)點在 每個子網(wǎng)絡中的排序分布,針對AUTHOR和CATEGORY類型的對象,采用傳遞性排序方法,該 方法是一個迭代的過程,終止條件是排序分布收斂或者迭代次數(shù)大于設定的最大次數(shù);針 對TERM類型的對象采用計數(shù)排序方法來計算其排序分布,整個排序分布計算流程最終將 輸出每個屬性類型的排序分布;所述AUTHOR、CATEGORY和TERM類型的對象均為提取的關鍵 〇
      [0012] 進一步的,首先輸入部分包括聚類數(shù)K,K個移動應用子網(wǎng)絡及其對應的屬性類型 的排序分布,在建立概率生成模型之后將采用EM方法獲得最佳參數(shù)值,利用得到的最優(yōu)參 數(shù)值以及屬性類型的排序分布生成中心類型節(jié)點在每個聚類中的后驗概率,然后利用近鄰 關系計算每個屬性類型節(jié)點的后驗概率,最后根據(jù)概率分布情況重新分配每個節(jié)點到不同 的聚類,然后輸出聚類結果。
      [0013] 進一步的,構建起一個由四類信息組成的星形異構網(wǎng)絡為建立星形網(wǎng)絡:G = (V, E,W),其中 V = {APP,AUTHOR,CATEGORY,TERM},包括應用的四類信息節(jié)點,APP = {aPl, ap2......apj 是中心節(jié)點集合,AUTHOR = {aUp au2......aun},CATEGORY = Ica1, ca2......can}, TERM = Ite1, te2......tem}是三類屬性節(jié)點集合,E是連接中心節(jié)點與屬性節(jié)點的邊集合,W 是邊的權重集合,權值分為三種,第一,如果邊61連接的是APP與{AUTHOR,CATEGORY}的節(jié) 點,那么Wi的值為1,第二,如果邊e 1連接的是APP與TERM的節(jié)點,那么Wi的值可以為任何 正整數(shù),第三,如果兩個節(jié)點之間沒有連接邊,那么W i表示為0。
      [0014] 進一步的,星形網(wǎng)絡經(jīng)過排序分布計算將得到屬性類型信息的排序分布結果, 三種類型信息節(jié)點都有自己的排序分布,它們將作為條件概率輸入到概率生成模型中, 其中AUTHOR的排序分布為R = {r (au),r (au2)......r (aun)},其中r (au)多0,并且 IJL1 I^aui) = 1,其他兩種屬性類型信息的排序分布也以同樣方式表示,排序分布的具體 計算過程分為兩個部分,第一個部分采用的是傳遞性排序方法,針對AUTHOR,CATEGORY兩 種類型的信息,這是一個迭代的計算過程:
      [0015] P (AUTHOR | G)
      [0016] - (WAUTH〇R,ΑΡΡ σ AUTH〇R,APP) (WAPP,CATEG〇RY σ APP,CATEG〇RY) P (CATOGORYIG) (1)
      [0017] P (CATEGORY IG)
      [0018] - (WCATEG〇EYj App 〇 CATEGORY, APp) ^APP, AUTHOR 0 APP, AUTHOr) P (AUTHOR | G) (2)
      [0019]其中 0 AUTHC?, APP,0 APP, CATEGCIKY,0 CATEGCIKY, APP,0 APP, AUTHCIK疋對角矩陣,值分別等于 權矩陣 Wautmr, APP, ^APP, CATEGORY? ^CATEGORY, APP? WAPP,AUTmK的每一列值的總和,第二部分是計數(shù)排序方 法,針
      當前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1