国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于向量運(yùn)算的關(guān)聯(lián)規(guī)則挖掘方法_2

      文檔序號(hào):9579672閱讀:來源:國知局
      (A2))。
      [0090] 則生成屬性關(guān)聯(lián)規(guī)則的可信度為:
      [0091 ] C(T⑷一(T(A2)-T⑷))=S(T%UA2))/S(T⑷)或
      [0092] C(T(A2) -(T(A!)-T(A2))) =S(T(A!UA2))/S(T(A2)) 〇
      [0093] 實(shí)施例1:
      [0094] -個(gè)信息系統(tǒng)I= (U,A,f) = ({u!,· · ·,u1Q},{a!,a2,a3,a4,a5},f)實(shí)例如表 1 所 不。
      [0095]
      [0096] 表 1
      [0097] 根據(jù)表1,W的對(duì)象向量表不為
      [0098] Ul= (1,0, 1,0, 1),
      [0099] 即表1中第一行的向量表示,其它Ul的對(duì)象向量表示類似可得。
      [0100] 表1中ai的屬性向量表不為
      [0101]
      [0102] 即表1中第一列的向量表示,其它aj的屬性向量表示類似可得。
      [0103] ^和ai的對(duì)象向量和屬性向量的數(shù)乘向量運(yùn)算為
      [0104] 1Xuj=u!= (1, 0, 1, 0, 1),
      [0105] 0XUi= (1, 1, 1, 1, 1),
      [0106]
      [0107]
      [0108] 其它對(duì)象向量和屬性向量的數(shù)乘向量運(yùn)算類似可得。
      [0109] 基于對(duì)象和屬性向量的數(shù)乘向量運(yùn)算規(guī)則,具體實(shí)例中屬性集上的屬性ai確定的 向量基可如下計(jì)算得到
      [0110]
      [0111] 其支持度為
      [0112] S(B(ai)) =s(ai) = (1+0+0+1+0+1+1+1+1+0)/10 = 0. 6〇
      [0113] 其它屬性確定的向量基類似可得,分別為
      [0114] B(a2) = (0,1,0,0,1),
      [0115] B(a3) = (0, 0, 1,0, 0),
      [0116] B(a4) = (0,0, 1,1,0),
      [0117] B(a5) = (0, 0, 0, 0, 1)。
      [0118] 在一個(gè)實(shí)施例中,具體的,對(duì)向量基按從小到大排序并按此排序從小到大兩兩并 的方式生成屬性集上的向量,即屬性4確定的向量基(p< ci;?,i4,is)對(duì) 應(yīng)自然數(shù)P,uX24+p'l2X23+p'l3X22+p'l4X2+p'l5,因此,B(ai),B(a2),B(a3),B(a4) 和B(a5)按各自對(duì)應(yīng)的自然數(shù)大小從小到大排序。最小的向量基分別和其它向量基分別取 并得到新向量,并按其對(duì)應(yīng)的自然數(shù)大小插入向量基的排序中,然后次小的向量再次執(zhí)行 上述步驟,至無新向量生成終止。上述過程保證每次均只有兩個(gè)向量參與取并運(yùn)算,即令 T(J' ) = (P'u,p'l2,p'l3,p'l4,p' 15)和T(J" ) = (p"u,p"l2,p"l3,p"l4,p" 15) 分別為已生成的向量,則T(J')和T(J")生成的向量為
      [0119] T(Jr )VT(J// ) = (pril)p,i2)p,i3)p,i4)p,i5)V(p;/i2,p"i3,p"i4, P" l5)
      [0120] = (p'uVP" n,P'i2VP" i2,P'i3VP" i3,P'i4VP" i4,P'i5VP" i5) 〇
      [0121] 8(&1)對(duì)應(yīng)自然數(shù)為1\24+0\2 3+0\22+0父2+1 = 17,8(&2)對(duì)應(yīng)自然數(shù)為9,8(&3) 對(duì)應(yīng)自然數(shù)為4,B(a4)對(duì)應(yīng)自然數(shù)為6及B(a5)對(duì)應(yīng)自然數(shù)為1。表2是按各自對(duì)應(yīng)的自 然數(shù)大小從小到大排序5個(gè)基的結(jié)果及其支持度。
      [0122]
      [0123] 表 2
      [0124] 基于表2所示,最小的向量基分別和其它向量基分別取并得到新向量,并按其對(duì) 應(yīng)的自然數(shù)大小插入向量基的排序中,表3給出了B(a5)和其它向量基分別取并得到新向 量。
      [0127] 表 3
      [0128] 表4給出了按上述過程逐次生成的屬性集上的所有向量。
      [0129]
      [
      [0131]表 4
      [0132] 根據(jù)表4,設(shè)定支持度和可信度閾值為0. 5,按生成向量從小到大的順序兩兩逐次 判斷是否滿足閾值并生成屬性關(guān)聯(lián)規(guī)則,如從最小的向量B(a5)開始,首先和B(a3)生成的 向量B(a5)VB(a3)滿足支持度大于等于0.5,因此,B(a5)和B(a3)可生成如下屬性關(guān)聯(lián)規(guī) 則:
      [0133] (0, 0, 0, 0, 1) - (0, 0, 1,0, 0)和(0, 0, 1,0, 0) - (0, 0, 0, 0, 1),即a5-a3和 a3-a5,其可信度分別為5/7和5/8,大于等于0. 5。
      [0134] 其它滿足支持度和可信度閾值條件的屬性關(guān)聯(lián)規(guī)則可類似生成。
      [0135] 表5給出了兩兩向量逐次生成滿足條件的屬性關(guān)聯(lián)規(guī)則。
      [0136]
      [0138]表 5
      [0139] 本發(fā)明的一種基于向量運(yùn)算的關(guān)聯(lián)規(guī)則挖掘方法,借助對(duì)象和屬性的向量表示, 利用約定的向量運(yùn)算生成屬性集上的向量基,用于刻畫屬性之間的最基本相關(guān)關(guān)系,利用 向量基生成屬性集上的向量拓?fù)?,避免了在屬性集的冪集中運(yùn)算,減少了對(duì)象和屬性之間 運(yùn)算次數(shù)。在屬性集上的向量拓?fù)渲袑ふ覞M足條件的頻繁閉項(xiàng)集,同時(shí),包括其極小生成元 在內(nèi)的所有生成元均在向量拓?fù)?,縮減了頻繁閉項(xiàng)集及其極小生成元的搜索范圍。
      [0140] 實(shí)施例2 :
      [0141] 本實(shí)施例使用EXTENDEDBAKERYDataset數(shù)據(jù)集,該數(shù)據(jù)集記錄了購買40種面包 (編號(hào)為1至40)和10中飲料(編號(hào)為41至50)共75000條銷售記錄,所挖掘的屬性關(guān)聯(lián) 規(guī)則體現(xiàn)為購買面包和飲料的關(guān)聯(lián)關(guān)系,使用本發(fā)明方法挖掘?qū)傩躁P(guān)聯(lián)規(guī)則,支持度閾值 設(shè)定為〇. 01,可信度閾值設(shè)定為〇,共生成352條屬性關(guān)聯(lián)規(guī)則,并與經(jīng)典Aprior算法從屬 性關(guān)聯(lián)規(guī)則的數(shù)量、運(yùn)行時(shí)間和占用內(nèi)存方面進(jìn)行比較,其中,屬性關(guān)聯(lián)規(guī)則的數(shù)量及規(guī)則 的前后件內(nèi)容完全一致,運(yùn)行時(shí)間和占用內(nèi)存見表6。
      [0142] L0143J衣6
      [0144] 在比較實(shí)驗(yàn)中,本實(shí)施例將原始數(shù)據(jù)75000條數(shù)據(jù)進(jìn)行復(fù)制翻倍操作7次,以2的 倍數(shù)規(guī)模增長(zhǎng),分別得到8組數(shù)據(jù),所得規(guī)則數(shù)量及其支持度、可信度不變,但運(yùn)行時(shí)間和 占用內(nèi)存有變化,由于對(duì)數(shù)據(jù)進(jìn)行了翻倍處理,突出了數(shù)據(jù)重復(fù)計(jì)算的問題,很明顯的可以 看出,現(xiàn)有技術(shù)的算法在處理屬性關(guān)聯(lián)規(guī)則的重復(fù)生成問題上有較大的缺點(diǎn)。圖2展示了 本發(fā)明所提算法與Aprior算法的運(yùn)行時(shí)間曲線,圖中可清楚的看出本發(fā)明的方法相比現(xiàn) 有的Aprior算法在處理同一數(shù)據(jù)時(shí)的運(yùn)行時(shí)間大幅度降低,在表6中,本發(fā)明的方法較現(xiàn) 有的Aprior算法在內(nèi)存占用上也有較大的優(yōu)勢(shì)。
      [0145] 上面結(jié)合附圖對(duì)本發(fā)明的【具體實(shí)施方式】進(jìn)行了詳細(xì)說明,但本發(fā)明并不限制于上 述實(shí)施方式,在不脫離本申請(qǐng)的權(quán)利要求的精神和范圍情況下,本領(lǐng)域的技術(shù)人員可以作 出各種修改或改型。
      【主權(quán)項(xiàng)】
      1. 一種基于向量運(yùn)算的關(guān)聯(lián)規(guī)則挖掘方法,其特征在于,包括以下步驟: 定義對(duì)象和屬性的向量表示,約定對(duì)象向量和屬性向量的運(yùn)算規(guī)則,用于計(jì)算屬性集 上的向量基; 根據(jù)向量基計(jì)算生成屬性集上的向量; 根據(jù)所述屬性集上的向量計(jì)算屬性集上的任一向量的支持度; 設(shè)定向量基的支持度閾值,篩選出大于支持度閾值條件的向量; 根據(jù)預(yù)先設(shè)定的可信度閾值,在所述大于支持度閾值條件的向量中挖掘滿足條件的屬 性關(guān)聯(lián)規(guī)則。2. 根據(jù)權(quán)利要求1所述的一種基于向量運(yùn)算的關(guān)聯(lián)規(guī)則挖掘方法,其特征在于,所述 定義對(duì)象和屬性的向量表示,約定對(duì)象向量和屬性向量的運(yùn)算規(guī)則包括: 定義信息系統(tǒng)I表示為= (U,A,f),U表示對(duì)象集、A表示屬性集,其中U= {Ul,… ,uj,A = {a?!?,am},示對(duì)象集中第η個(gè)元素、a"^示屬性集中第m個(gè)元素; f稱為I的信息函數(shù),即f:UXA - 1},對(duì)任意(Ui, a」)e UXA,若?? a) = 〇,則稱第i個(gè)對(duì)象化不具有第j個(gè)屬性a _j;若f(u ;,a) = Pi_j= 1,則稱第i個(gè)對(duì)象u ;具有 第j個(gè)屬性4。 定義Ar A 2為一條屬性關(guān)聯(lián)規(guī)貝lj,其中,A 47 g 4且.4..:ΓΛ4ι =0,Ai稱為前件,A 2稱 為后件; 定義Ui= (p η,. . .,pim)1Xm,表示對(duì)象w可表示為由0或1構(gòu)成的m維行向量; 定義^表示屬性h可表示為由0或1構(gòu)成的η維列向量; 約定如下向量運(yùn)算規(guī)則,1 〇屮=u ;、0 〇屮=1 1Xm= (1,…,1) 1Xm、:L 〇 a.j= a .j、其中,(1,···,1) 1Xm表示元素全為1的m維行向量,表示元素全為1的η維列向量; 約定屬性4與(Ui,…,un)之間的向量運(yùn)算規(guī)則如下,約定屬性化與(a i,…,aj之間的向量運(yùn)算規(guī)則如下,其中n,m,i,j均為正整數(shù)。3. 根據(jù)權(quán)利要求1所述的一種基于向量運(yùn)算的關(guān)聯(lián)規(guī)則挖掘方法,其特征在于,所述 計(jì)算屬性集上的向量基為: 定義B(a_j)表示屬性a_j可生成一個(gè)向量基,得到屬性集上的向量基為, B ⑷={B (a.) | a.〗e A}, 其中n,j均為正整數(shù)。4. 根據(jù)權(quán)利要求3所述的一種基于向量運(yùn)算的關(guān)聯(lián)規(guī)則挖掘方法,其特征在于,所述 根據(jù)向量基計(jì)算生成屬性集上的向量為: 由Γ對(duì)應(yīng)的向量基生成的向量Τ0- )表示為 T (J ')= V j e B (a.j), 其中J ^是某一指標(biāo)集,J ^對(duì)應(yīng)的向量基生成的所有向量記為,其中m,j均為正整數(shù)。5. 根據(jù)權(quán)利要求4所述的一種基于向量運(yùn)算的關(guān)聯(lián)規(guī)則挖掘方法,其特征在于,所述 根據(jù)所述屬性集上的向量計(jì)算屬性集上的任一向量的支持度為: 任一向量Τ0- ) e T(A)的支持度為:S(T(J' )) = (p' u+p' 2.j+...+p' n.j)/n,其中 n,j 均為正整數(shù)。6. 根據(jù)權(quán)利要求1-5任一項(xiàng)所述的一種基于向量運(yùn)算的關(guān)聯(lián)規(guī)則挖掘方法,其特征在 于,所述根據(jù)預(yù)先設(shè)定的可信度閾值,在所述大于支持度閾值條件的向量中挖掘滿足條件 的屬性關(guān)聯(lián)規(guī)則包括: 根據(jù)預(yù)先設(shè)定的關(guān)聯(lián)規(guī)則的可信度閾值,在T(A)中挖掘大于可信度閾值的屬性關(guān)聯(lián) 規(guī)則。7. 根據(jù)權(quán)利要求6所述的一種基于向量運(yùn)算的關(guān)聯(lián)規(guī)則挖掘方法,其特征在于,所述 挖掘大于可信度閾值的屬性關(guān)聯(lián)規(guī)則為: 在T(A)中選擇兩個(gè)向量,記為T%)和T(A2),其中,T%)表示由屬性子集六1中所有 元素對(duì)應(yīng)的向量基確定的屬性集上的向量,T(A2)表示由屬性子集六2中所有元素對(duì)應(yīng)的向 量基確定的屬性集上的向量。T(Ai)和T(A2)中任一個(gè)向量為前件,另一個(gè)向量減去前件為 后件,生成一條屬性關(guān)聯(lián)規(guī)則,即: 酬一輯)-酬)或 T(A2) -(酬-1^2))〇 則生成屬性關(guān)聯(lián)規(guī)則的可信度為:
      【專利摘要】本發(fā)明公開了一種基于向量運(yùn)算的關(guān)聯(lián)規(guī)則挖掘方法,包括以下步驟:定義對(duì)象和屬性的向量表示,約定對(duì)象向量和屬性向量的運(yùn)算規(guī)則,用于計(jì)算屬性集上的向量基;根據(jù)向量基計(jì)算生成屬性集上的向量;根據(jù)所述屬性集上的向量計(jì)算屬性集上的任一向量的支持度;設(shè)定向量基的支持度閾值,篩選出大于支持度閾值條件的向量;根據(jù)預(yù)先設(shè)定的可信度閾值,在所述大于支持度閾值條件的向量中挖掘滿足條件的屬性關(guān)聯(lián)規(guī)則。本發(fā)明的基于向量運(yùn)算的屬性關(guān)聯(lián)規(guī)則挖掘方法,利用向量基生成屬性集上的向量拓?fù)?,避免了生成頻繁閉項(xiàng)集的冪集,因而避免了在屬性集的冪集中運(yùn)算,以及屬性關(guān)聯(lián)規(guī)則的重復(fù)生成問題,提高了計(jì)算效率。
      【IPC分類】G06N5/02
      【公開號(hào)】CN105335785
      【申請(qǐng)?zhí)枴緾N201510729332
      【發(fā)明人】周斌, 裴崢, 李波
      【申請(qǐng)人】西華大學(xué)
      【公開日】2016年2月17日
      【申請(qǐng)日】2015年10月30日
      當(dāng)前第2頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1