国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于社團(tuán)劃分的社交網(wǎng)絡(luò)用戶興趣關(guān)聯(lián)規(guī)則挖掘方法

      文檔序號:6502586閱讀:191來源:國知局
      一種基于社團(tuán)劃分的社交網(wǎng)絡(luò)用戶興趣關(guān)聯(lián)規(guī)則挖掘方法
      【專利摘要】本發(fā)明提供一種社團(tuán)劃分的社交網(wǎng)絡(luò)用戶興趣關(guān)聯(lián)規(guī)則挖掘方法,首先對數(shù)據(jù)進(jìn)行基于相似度的分類預(yù)處理,使得同一分類中的記錄間具有高相似度;其次對每個分類中的數(shù)據(jù)進(jìn)行相關(guān)聯(lián)挖掘,得到各分類的頻繁項集;最后合并所有分類的頻繁項集,選擇置信度大于置信度閥值的候選關(guān)聯(lián)規(guī)則生成最終的關(guān)聯(lián)規(guī)則集合。本發(fā)明能夠減少產(chǎn)生不必要的關(guān)聯(lián)性小的候選項集,從而提高整體數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘效率,具有更好的擴(kuò)展性。
      【專利說明】—種基于社團(tuán)劃分的社交網(wǎng)絡(luò)用戶興趣關(guān)聯(lián)規(guī)則挖掘方法
      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明的設(shè)計目標(biāo)是能夠挖掘社交網(wǎng)絡(luò)用戶興趣之間的關(guān)聯(lián)規(guī)則。社交網(wǎng)絡(luò)中存在數(shù)量眾多的用戶,而且各個用戶的興趣不同,關(guān)注的事物也不同,目的就是要挖掘不同用戶的興趣之間的關(guān)聯(lián)規(guī)則,本方法是數(shù)據(jù)挖掘的一種簡單但且實用的規(guī)則,關(guān)聯(lián)規(guī)則挖掘?qū)儆跀?shù)據(jù)挖掘的一個重要研究課題。
      【背景技術(shù)】
      [0002]在數(shù)據(jù)挖掘的知識模式中,關(guān)聯(lián)規(guī)則是比較重要的一種。關(guān)聯(lián)規(guī)則是數(shù)據(jù)中一種簡單但很適用的規(guī)則,關(guān)聯(lián)規(guī)則模式屬于描述性模式,發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的算法屬于無監(jiān)督學(xué)習(xí)的方法。傳統(tǒng)的關(guān)聯(lián)規(guī)則挖掘算法一般用來發(fā)現(xiàn)數(shù)據(jù)庫中大多數(shù)數(shù)據(jù)所遵循的規(guī)律,但同時在數(shù)據(jù)庫中還存在另一些規(guī)律,這些規(guī)律由少數(shù)數(shù)據(jù)維持,而這些規(guī)則常被人們忽視又出乎人們的意料,具有相當(dāng)?shù)膬r值;面對海量數(shù)據(jù),使用傳統(tǒng)的關(guān)聯(lián)規(guī)則算法挖掘出來的規(guī)則數(shù)據(jù)量將會很大,這對用戶的理解、解釋以及使用規(guī)則將帶來不便,而且其中大多數(shù)規(guī)則對用戶來講是不感興趣的,所以我們通過社團(tuán)劃分對網(wǎng)絡(luò)用戶經(jīng)行初步劃分,再運用用戶興趣之間的關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘。
      [0003]社團(tuán)結(jié)構(gòu):研究網(wǎng)絡(luò)性質(zhì)的物理意義和數(shù)學(xué)特性發(fā)現(xiàn)許多實際網(wǎng)絡(luò)都具有一個共同性質(zhì),即社團(tuán)結(jié)構(gòu)。整個網(wǎng)絡(luò)是由若干個“群”或“團(tuán)”構(gòu)成,每個群內(nèi)部的節(jié)點之間的連接相對緊密,而各個群之間的連接相對來說比較稀疏。
      [0004]社團(tuán)劃分:社團(tuán)發(fā)現(xiàn)就是指將網(wǎng)絡(luò)劃分為若干個聯(lián)系緊密的群,每個群對應(yīng)于一個網(wǎng)絡(luò)中的社團(tuán)結(jié)構(gòu)。
      [0005]關(guān)聯(lián)規(guī)則:關(guān)聯(lián)規(guī)則可以表示為X —Y,稱X為規(guī)則頭,Y為規(guī)則尾。關(guān)聯(lián)規(guī)則的意義是,如果項集X出現(xiàn)在某個購物籃中,則項集Y也有可能出現(xiàn)在這個購物籃中。
      [0006]支持度:關(guān)聯(lián)規(guī)則X — Y的支持度s (Support)指包含項集X和Y的購物籃占所有
      購物籃的比例,即
      【權(quán)利要求】
      1.一種社團(tuán)劃分的社交網(wǎng)絡(luò)用戶興趣關(guān)聯(lián)規(guī)則挖掘方法,包括以下步驟: 步驟一:對社交網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行預(yù)處理,其中包括:將社交網(wǎng)絡(luò)中的用戶抽象成網(wǎng)絡(luò)中的節(jié)點,獲取包括所有節(jié)點構(gòu)成的集合,兩節(jié)點之間邊構(gòu)成的集合; 步驟二:根據(jù)步驟一預(yù)處理的結(jié)果通過Jaccard相似度的計算方法計算出所述社交網(wǎng)絡(luò)中的每兩個節(jié)點的Jaccard相似度; 所述兩節(jié)點的Jaccard相似度計算方法如下: 2-1具體地,計算社交網(wǎng)絡(luò)數(shù)據(jù)中任意節(jié)點i和節(jié)點j的Jaccard相似度:首先分別獲取與節(jié)點i或節(jié)點j相互連接的各個節(jié)點以及包含節(jié)點i或j本身的節(jié)點的集合,既集合Vi或集合Vj ; 2-2計算節(jié)點i和節(jié)點j的Jaccard相似度:集合Vi和Vj的交集與并集的比值,即SIM (Vi, Vj) = (Vi n Vj)/(Vi U Vj); 步驟三:根據(jù)步驟一所得的所有節(jié)點和步驟二所得每對節(jié)點的相似度,組成一個節(jié)點相似度矩陣; 步驟四:選擇步驟三所述節(jié)點相似度矩陣中相似度最大的進(jìn)行聚合,由此獲得新的社團(tuán); 步驟五:計算所述社交網(wǎng)絡(luò)數(shù)據(jù)中兩個社團(tuán)之間的Jaccard相似度; 所述兩個社團(tuán)之間的Jaccard相似度計算方法如下: 5-1具體地,計算社交網(wǎng)絡(luò)數(shù)據(jù)中任意社團(tuán)k和社團(tuán)I的Jaccard相似度:首先獲取來自社團(tuán)k的任意節(jié)點m和來自社團(tuán)I的任意節(jié)點η ; 5-2如所述步驟二的方法計算節(jié)點m和節(jié)點η的Jaccard相似度; 5-3重復(fù)5.1步驟至5.2步驟計算出分別來自社團(tuán)k和社團(tuán)I組成的所有節(jié)點對的相似度; 5-4根據(jù)步驟5.3得出的社團(tuán)k和社團(tuán)I的每對節(jié)點相似度并根據(jù)結(jié)果求出平均值,既兩個社團(tuán)之間的Jaccard相似度; 步驟六:根據(jù)所述步驟五的方法計算社交網(wǎng)絡(luò)數(shù)據(jù)中所有社團(tuán)間的Jaccard相似度;步驟七:根據(jù)所述社交網(wǎng)絡(luò)數(shù)據(jù)中社團(tuán)和所述步驟六計算的結(jié)果,構(gòu)成網(wǎng)絡(luò)中各個社團(tuán)的社團(tuán)相似度矩陣; 步驟八:根據(jù)步驟七所述社團(tuán)相似度矩陣中相似度最大的社團(tuán)進(jìn)行聚合,構(gòu)成新的社團(tuán); 步驟九:重復(fù)步驟五至步驟八,直到整個網(wǎng)絡(luò)聚合成一個社團(tuán)為止; 步驟十:設(shè)定關(guān)聯(lián)規(guī)則的支持度閥值和置信度閥值,關(guān)聯(lián)規(guī)則X — Y的支持度定義為
      2.根據(jù)權(quán)利要求1所述的一種社團(tuán)劃分的社交網(wǎng)絡(luò)用戶興趣關(guān)聯(lián)規(guī)則挖掘方法,其特征包含:所述步驟三得到所訴節(jié)點相似度矩陣后,將社團(tuán)網(wǎng)絡(luò)數(shù)據(jù)中每一個節(jié)點初始化為一個社團(tuán)。
      3.根據(jù)權(quán)利要求1所述的一種社團(tuán)劃分的社交網(wǎng)絡(luò)用戶興趣關(guān)聯(lián)規(guī)則挖掘方法,其特征包含:兩個社團(tuán)之間的Jaccard相似度,所述步驟五中5_1或5_3需獲取的節(jié)點對必須分別來自所求的兩個社團(tuán)。
      4.根據(jù)權(quán)利要求1所述的一種社團(tuán)劃分的社交網(wǎng)絡(luò)用戶興趣關(guān)聯(lián)規(guī)則挖掘方法,其特征包含:所述對社交網(wǎng)絡(luò)數(shù)據(jù)迸行預(yù)處理,可獲得一個鄰接矩陣,所述鄰接矩陣中的元素只有I和O,I表示行和列代表的節(jié)點相連,O表示行和列代表的節(jié)點不相連。
      【文檔編號】G06F17/30GK103838804SQ201310169347
      【公開日】2014年6月4日 申請日期:2013年5月9日 優(yōu)先權(quán)日:2013年5月9日
      【發(fā)明者】張小松, 牛偉納, 羅強(qiáng), 蒲福連, 張凡, 張蕾, 陳瑞東, 王東, 李宏鳶 申請人:電子科技大學(xué)
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1