本發(fā)明涉及一種基于相似變精度粗糙集模型的知識推送規(guī)則提取方法,屬于知識工程領(lǐng)域。
背景技術(shù):
:知識推送技術(shù)是在適當(dāng)?shù)臅r間,將適當(dāng)?shù)闹R推送給適當(dāng)?shù)娜?,旨在降低知識獲取成本,提高知識獲取效率。知識推送的依據(jù)主要是知識產(chǎn)生、應(yīng)用的情境條件,結(jié)合知識的推送規(guī)則,判斷當(dāng)前用戶需要的知識,并將這些知識推送給用戶。知識推送規(guī)則的提取是研究知識推送的一個重點(diǎn)問題。粗糙集作為一種用于處理不確定信息與知識的數(shù)據(jù)分析理論,在機(jī)器學(xué)習(xí)、知識發(fā)現(xiàn)領(lǐng)域得到了廣泛且成功的應(yīng)用。將粗糙集的理論應(yīng)用于知識規(guī)則提取,可以從知識的使用記錄中找出情境信息與知識信息之間的關(guān)聯(lián),歸納出知識推送的規(guī)則。在應(yīng)用時,必須解決的問題是經(jīng)典粗糙集模型的過于嚴(yán)格,缺乏容錯能力的問題。技術(shù)實(shí)現(xiàn)要素:針對知識推送中的知識規(guī)則提取過程中的經(jīng)典粗糙集模型存在的下述問題:經(jīng)典粗糙集模型過于嚴(yán)格、缺乏容錯能力、不適于知識推送規(guī)則提取情境。本發(fā)明公開的一種基于相似變精度粗糙集模型的知識推送規(guī)則提取方法能夠解決粗糙集模型過于嚴(yán)格的問題、提高粗糙集模型的容錯能力、使其適于知識推送規(guī)則提取情境,此外,本發(fā)明能夠獲取高質(zhì)量的知識推送規(guī)則,提高知識推送精度,降低知識獲取成本,提高知識獲取效率。本發(fā)明的目的是通過下述技術(shù)方案實(shí)現(xiàn)的。首先說明必要的定義。定義1知識推送的決策信息系統(tǒng)。知識推送的決策信息系統(tǒng)表示為有序四元組s={u,r,v,f}。其中,u={u1,u2,…,un}表示的是用戶操作記錄集合,其中的每個元素記錄了在特定的用戶情境下用戶查看和使用知識的行為記錄;r=c∪d為屬性集合,其中子集c是條件屬性集合,反映的是用戶情境的特征屬性,d為決策屬性集合,反映的是用戶查看、使用的知識特征屬性;v=∪vr為屬性值的集合,r∈r,vr表示屬性r的取值范圍,考慮到情境和知識特征屬性描述的多樣性和復(fù)雜性,屬性值的一般類型有數(shù)值型、向量型、字符型、模糊型,因此v是多種類型屬性取值范圍的集合;f:u×r→v為一個信息函數(shù),用于確定u中每一個對象u的屬性值,即任一ui∈u,r∈r,則f(ui,r)=vr。定義2引入相似關(guān)系的不可分辨關(guān)系。在信息系統(tǒng)s={u,r,v,f}中,對于ui,uj∈u,在任意屬性子集b上的相似度為sb(ui,uj),其中sb(ui,uj)=∑(wk*sb(ui,uj,rk))其中sb(ui,uj,rk)表示ui,uj在b中第k個屬性rk上的相似度,屬性類型不同則屬性的相似度計算方式不同??紤]到特征屬性重要程度的差異,wk表示第k個屬性的重要程度,可采取專家打分法、調(diào)查統(tǒng)計法、層次分析法確定?;谙嗨贫萻b(ui,uj)對對象u進(jìn)行聚類,聚類之后的每一類為一個等價類,同一類中的元素之間為不可分辨關(guān)系,又稱等價關(guān)系,記在屬性子集b上的等價關(guān)系為ind(b)。根據(jù)條件屬性和決策屬性分別進(jìn)行聚類,即根據(jù)情境屬性相似度sc和知識屬性相似度sd分別進(jìn)行聚類。基于條件集合c的等價類稱為條件類,記為xi,基于決策集合d的等價類稱為決策類,記為yj。定義3變精度粗糙集模型及其正、負(fù)域。為了增強(qiáng)經(jīng)典粗糙集模型的容錯能力,減少外界噪音對模型的影響,將概率理論引入粗糙集模型中,提出變精度粗糙集模型時,引入一對概率閾值(α,β),設(shè)0≤β<α≤1。正域定義為:pos(α,β)(x)={u∈u|pr(x|[u]b)≥α};負(fù)域定義為:neg(α,β)(x)={u∈u|pr(x|[u]b)≤β}。其中[u]b表示等價關(guān)系下包含元素u的等價類,pr(x|[u]b)表示對象在屬于[u]b的條件下屬于集合x的概率,可見,正域劃分的正確率為α,負(fù)域劃分的正確率為1-β。決策屬性集d相對于條件屬性集c的正域:論域u中的所有那些基于條件屬性集合c的等價類,能夠以不低于α的準(zhǔn)確率劃入到基于決策屬性集合d的等價類之中的對象組成的集合記為pos(α,β)(d|c)={u∈u|pr(yj|xi)≥α}。定義4屬性重要度和依賴度。對信息系統(tǒng)s={u,r,v,f},具有條件屬性和決策屬性的知識表達(dá)系統(tǒng)可表示為決策表,記作t=(u,r,c,d)或簡稱cd決策表。決策表中不同的條件屬性對于決策屬性的重要度不同,如果某條件屬性丟失后信息系統(tǒng)分類變化大則說明該屬性重要程度高,反之則說明該屬性重要程度低。決策屬性對條件屬性的依賴度其中,card是返回集合中元素的數(shù)量的函數(shù)。定義5屬性約簡及核。條件屬性可能是彼此依賴的,有些條件屬性刪除后對分類并沒有明顯影響,則這些屬性是可省略的,如果屬性子集b1中的每個屬性都是不可省的,則稱b1是獨(dú)立的,如果且ind(b1)=ind(b),則稱b1是等價關(guān)系族b的一個約簡,記為red(b)。在b中所有不可省略關(guān)系的集合稱為等價關(guān)系族b的核,記為core(b)。即core(b)=∩red(b)。定義6決策規(guī)則。c為條件屬性集,d為決策屬性集。xi和yj分別表示條件類和決策類。des(xi)表示條件類xi的描述,定義為des(xi)={(a,va)|f(u,a)=va,des(yj)表示決策類yj的描述,定義為des(yj)={(a,va)|f(u,a)=va,決策規(guī)則定義為tij:des(xi)→des(yj),規(guī)則tij的確定因子為μ(xi,yj)=card(xi∩yj)/card(xi),顯然,0<μ≤1。規(guī)則tij的支持?jǐn)?shù)為card(xi∩yj)。當(dāng)μ(xi,yj)=1時,tij是確定性規(guī)則;當(dāng)0<μ<1時,tij是不確定的規(guī)則,此時μ(xi,yj)反映xi中的對象可分類到y(tǒng)j中的比例。本發(fā)明公開的一種基于相似變精度粗糙集模型的知識推送規(guī)則提取方法,包括如下步驟:步驟1數(shù)據(jù)預(yù)處理;步驟1.1用戶行為記錄及數(shù)據(jù)抽取;進(jìn)行知識規(guī)則生成的基礎(chǔ)數(shù)據(jù)是用戶瀏覽、使用知識的行為記錄,所述的行為記錄包括用戶的個人特征信息、任務(wù)屬性、瀏覽使用的知識屬性,用戶操作系統(tǒng)對行為記錄進(jìn)行記錄,抽取用于進(jìn)行規(guī)則生成的數(shù)據(jù)。步驟1.2數(shù)據(jù)離散化;利用粗糙集進(jìn)行規(guī)則挖掘,要求數(shù)據(jù)必須是離散的,所以需要對連續(xù)值屬性進(jìn)行離散化處理。根據(jù)實(shí)際情況選擇離散化方式,常見的離散化處理方式有:專家劃分法、等頻率法、等距離法、自然算法(naivescaler)、半自然算法(seminaivescaler)。步驟1.3決策表建立;構(gòu)建決策表,決策表的行表示用戶行為的記錄,列表示屬性集合,包括條件屬性集c和決策屬性集d,簡稱cd決策表。由于知識推送規(guī)則是根據(jù)用戶所處情境的屬性得到用戶需要知識的屬性,所以,條件屬性為情境屬性,決策屬性為知識屬性。構(gòu)建決策表時,對行與行之間的相似性進(jìn)行計算,將等價的行進(jìn)行合并,并統(tǒng)計其數(shù)量。另外為了便于討論,用字母和數(shù)字標(biāo)識屬性名稱以及屬性值。根據(jù)定義2對行與行之間的相似性進(jìn)行計算。步驟1.4決策表的一致性檢驗(yàn);構(gòu)建決策表之后,需要對決策表的一致性進(jìn)行檢驗(yàn),當(dāng)決策屬性d完全依賴于條件屬性c,即γ(c,d)=1時,稱決策表是完全一致的。由于噪聲數(shù)據(jù)的影響及信息的不完備性,很難得到γ(c,d)為1的決策表。故規(guī)定一個閾值e,0<e<1,若γ(c,d)≥e,則認(rèn)為決策表是滿足閾值要求的,認(rèn)為是可接受的,即完成數(shù)據(jù)預(yù)處理;否則不可接受,需要重新對決策表進(jìn)行調(diào)整,返回步驟1.1,重新抽取其他數(shù)據(jù)進(jìn)行迭代處理。步驟2屬性相對約簡,得到約簡后的決策表。步驟2.1基于信息熵的屬性重要度計算。決策表中,條件屬性集合c對決策屬性集合d分類的信息熵為:在上式中,xi表示條件屬性的等價類,yj表示決策屬性的等價類。條件屬性c是條件屬性集合c中的某一具體屬性,條件屬性c的重要度w為增加該屬性后信息熵的減少量:w(c)=h(d|c)-h(d|c-c)。步驟2.2迭代生成約簡后的決策表。首先計算相對核core(c,d)=∩red(c,d)和決策屬性集合對條件屬性集合的依賴度γ(c,d),條件屬性集合c中除去相對核中已有的屬性,其余屬性按從大到小的順序進(jìn)行排列,并順序編號。以核屬性集合作為初始約簡,即red0(c,d)=core(c,d),約簡集合中每次增加一個權(quán)重最大的屬性,直至γ(c,d)-γ(redi(c,d),d)<e,e為可接受的閾值。滿足終止條件時得到最終約簡結(jié)果。至此,得到約簡后的決策表。在步驟2中,基于信息熵的屬性重要度計算能夠避免傳統(tǒng)主觀賦權(quán)方式的主觀性,突出條件屬性相對于決策屬性的信息重要度。在重要度排序的基礎(chǔ)上進(jìn)行迭代約簡可以提高迭代效率,縮短計算時間。步驟3推送規(guī)則生成。利用步驟2中約簡后的決策表,生成規(guī)則tij:des(xi)→μdes(yj)步驟3中,通過設(shè)定確定因子μ的閾值,避免樣本數(shù)據(jù)的噪聲數(shù)據(jù)和其他不相容信息對規(guī)則生成的影響,刪除由于個別噪聲樣本數(shù)據(jù)生成的可信度很低的規(guī)則,為推送規(guī)則的生成提供更好的判別準(zhǔn)則。步驟4推送規(guī)則驗(yàn)證評估。用部分未參與規(guī)則生成的歷史數(shù)據(jù)驗(yàn)證決策規(guī)則,觀測決策結(jié)論和實(shí)際結(jié)論的差別,如果規(guī)則得到的結(jié)果正確性在可接受的范圍之內(nèi),則確認(rèn)規(guī)則,如果正確性較低,一般是由于抽取的數(shù)據(jù)不能反映總體情況所導(dǎo)致,需要返回步驟1.1,重新抽取數(shù)據(jù)進(jìn)行運(yùn)算。步驟5規(guī)則實(shí)施,提高知識推送精度。根據(jù)步驟2中約簡后的決策表的條件屬性集合c和決策屬性集合d,收集數(shù)據(jù),進(jìn)行數(shù)據(jù)預(yù)處理工作,匹配合適的規(guī)則,把相關(guān)的決策結(jié)果推送給用戶,并記錄用戶的反饋結(jié)果,為日后的規(guī)則評價及更新積累數(shù)據(jù),提高知識推送精度。本發(fā)明公開的一種基于相似變精度粗糙集模型的知識推送規(guī)則提取方法適用于需要知識推送的領(lǐng)域,能夠獲取高質(zhì)量的知識推送規(guī)則,提高知識推送精度,降低知識獲取成本,提高知識獲取效率。所述的需要知識推送的領(lǐng)域包括產(chǎn)品設(shè)計開發(fā)、工藝設(shè)計、網(wǎng)絡(luò)學(xué)習(xí)、電子商務(wù)。本發(fā)明公開的一種基于相似變精度粗糙集模型的知識推送規(guī)則提取方法能夠解決粗糙集模型過于嚴(yán)格的問題、提高粗糙集模型的容錯能力、使其適于知識推送規(guī)則提取情境,此外,本發(fā)明能夠獲取高質(zhì)量的知識推送規(guī)則,提高知識推送精度,降低知識獲取成本,提高知識獲取效率。本發(fā)明公開的一種基于相似變精度粗糙集模型的知識推送規(guī)則提取方法,通過對用戶行為數(shù)據(jù)進(jìn)行提取處理,構(gòu)建包括條件屬性及決策屬性決策表,利用信息熵理論得到條件屬性相對于決策屬性的重要度,在此基礎(chǔ)上利用條件屬性相對于決策屬性的重要度對決策表進(jìn)行約簡,得到約簡后的決策表;在約簡后的決策表基礎(chǔ)上提取出含有確定性因子的決策規(guī)則;對推送規(guī)則進(jìn)行驗(yàn)證評估,規(guī)則評估通過后即可利用規(guī)則進(jìn)行知識推送,進(jìn)一步提高知識推送精度。該方法具有規(guī)則客觀性強(qiáng),容錯率高,知識推送精確的特點(diǎn),適用于相關(guān)領(lǐng)域的知識推送過程。所述的相關(guān)領(lǐng)域包括產(chǎn)品設(shè)計開發(fā)、工藝設(shè)計、網(wǎng)絡(luò)學(xué)習(xí)、電子商務(wù)。有益效果:1、本發(fā)明公開的一種基于相似變精度粗糙集模型的知識推送規(guī)則提取方法,將經(jīng)典粗糙集模型中的嚴(yán)格不可分辨關(guān)系擴(kuò)展為引入相似關(guān)系的不可分辨關(guān)系,同時引入了概率閾值來提高模型的容錯率,即實(shí)現(xiàn)將經(jīng)典的粗糙集模型擴(kuò)展為適于提取知識推送規(guī)則的模型。2、本發(fā)明公開的一種基于相似變精度粗糙集模型的知識推送規(guī)則提取方法,在步驟2中,基于信息熵的屬性重要度計算能夠避免傳統(tǒng)主觀賦權(quán)方式的主觀性,突出了條件屬性相對于決策屬性的信息重要度。在重要度排序的基礎(chǔ)上進(jìn)行迭代約簡可以提高迭代效率,縮短計算時間。3、本發(fā)明公開的一種基于相似變精度粗糙集模型的知識推送規(guī)則提取方法,適用于需要知識推送的領(lǐng)域,能夠獲取高質(zhì)量的知識推送規(guī)則,提高知識推送精度,降低知識獲取成本,提高知識獲取效率。附圖說明圖1知識規(guī)則提取過程流程圖;圖2屬性約簡過程示意圖。具體實(shí)施方式為了更好的說明本發(fā)明的目的和優(yōu)點(diǎn),下面結(jié)合附圖和實(shí)例對
發(fā)明內(nèi)容做進(jìn)一步說明。實(shí)施例1:本實(shí)施例公開的一種基于相似變精度粗糙集模型的知識推送規(guī)則提取方法,包括如下步驟:步驟1數(shù)據(jù)預(yù)處理;步驟1.1用戶行為記錄及數(shù)據(jù)抽取;進(jìn)行知識規(guī)則生成的基礎(chǔ)數(shù)據(jù)是用戶瀏覽、使用知識的行為記錄,所述的行為記錄包括用戶的個人特征信息、任務(wù)屬性、瀏覽使用的知識屬性,圍繞某零件的設(shè)計過程,用戶操作系統(tǒng)對行為記錄進(jìn)行記錄,抽取100條行為記錄作為進(jìn)行規(guī)則生成的數(shù)據(jù)。表1展示了行為記錄的部分原始數(shù)據(jù)。表1行為記錄原始數(shù)據(jù)截選步驟1.2數(shù)據(jù)離散化;利用粗糙集進(jìn)行規(guī)則挖掘,要求數(shù)據(jù)必須是離散的,所以需要對連續(xù)值屬性進(jìn)行離散化處理。本實(shí)施例中,屬性“載荷要求”為連續(xù)數(shù)值型,需要對其進(jìn)行離散化處理。根據(jù)實(shí)際情況,選擇專家劃分法,領(lǐng)域?qū)<覅⒖技夹g(shù)標(biāo)準(zhǔn)文件,對該屬性進(jìn)行離散劃分,得到離散化結(jié)果為:載荷要求≤5000時,劃分為“低”,標(biāo)識為1;5000<載荷要求<10000時,劃分為“中”,標(biāo)識為2;載荷要求≥10000時,劃分為“高”標(biāo)識為3。步驟1.3決策表建立;構(gòu)建決策表,決策表的行表示用戶行為的記錄,列表示屬性集合,包括條件屬性集c和決策屬性集d,簡稱cd決策表。由于知識推送規(guī)則是根據(jù)用戶所處情境的屬性得到用戶需要知識的屬性,所以這里,條件屬性集合為{設(shè)計重點(diǎn),載荷要求(n/m),腹板結(jié)構(gòu),端口類型},決策屬性集合為{知識類型,知識領(lǐng)域,知識來源}。在用戶行為記錄數(shù)據(jù)的基礎(chǔ)上,將等價的行進(jìn)行合并,并統(tǒng)計其數(shù)目,需要說明的一點(diǎn)是,根據(jù)定義2引入相似關(guān)系的不可分辨關(guān)系,不可分辨關(guān)系是基于相似度sb分類之后的同類中對象之間的關(guān)系,如表1的第1行數(shù)據(jù)和第2行數(shù)據(jù)雖然屬性“端口類型”分別為“開口”和“豁口”,但由于相似度高,相互之間為不可分辨關(guān)系,所以兩行數(shù)據(jù)可進(jìn)行合并。另外,為了便于之后討論,將屬性名用字母代替,并對各個屬性值用數(shù)字進(jìn)行標(biāo)識。標(biāo)識方式如下:條件屬性:{{設(shè)計重點(diǎn),c1},{載荷要求(n/m),c2},{腹板結(jié)構(gòu),c3},{端口類型,c4}};決策屬性:{{知識類型,d1},{知識領(lǐng)域,d2},{知識來源,d3}};設(shè)計重點(diǎn):{{降低重量,1},{節(jié)省能源,2},{降低成本,3},{防錯設(shè)計,4}};腹板結(jié)構(gòu):{{桁架式,1},{梁式,2}};端口類型:{{開口/豁口,1},{封閉,2}};知識類型:{{有限元分析模型,1},{減輕質(zhì)量規(guī)則,2},{載荷分析模型,3}};知識領(lǐng)域:{{空心結(jié)構(gòu)設(shè)計,1},{局部質(zhì)量設(shè)計,2},{非對稱設(shè)計,3}};知識來源:{{輕量化設(shè)計,1},{綠色設(shè)計,2},{成本分析,3},{防錯設(shè)計,4}}。得到初始決策表如表2所示。表2初始決策表標(biāo)識數(shù)量c1c2c3c4d1d2d3u1121211211u282322332u3103222133u464121114u591212221u6134221114u7103312323u874212134u9131111111u10102222132u1111211114u1213222323步驟1.4決策表的一致性檢驗(yàn);構(gòu)建決策表之后,需要對決策表的一致性進(jìn)行檢驗(yàn),當(dāng)決策屬性d完全依賴于條件屬性c,即γ(c,d)=1時,稱決策表是完全一致的。規(guī)定一個閾值e=0.95,若γ(c,d)≥e,則認(rèn)為決策表是滿足閾值要求的,認(rèn)為是可接受的,即完成數(shù)據(jù)預(yù)處理;否則不可接受,需要重新對決策表進(jìn)行調(diào)整,返回步驟1.1,重新抽取其他數(shù)據(jù)進(jìn)行迭代處理。xi表示條件屬性的等價類,yj表示決策屬性的等價類。對于表2,條件等價類u/c如表3所示,決策等價類如表4所示。表3條件等價類i12345678910xi{u1,u11}{u2}{u3,u12}{u4}{u5}{u6}{u7}{u8}{u9}{u10}表4決策等價類j123456789yj{u1}{u2}{u3}{u4,u6,u11}{u5}{u7,u12}{u8}{u9}{u10}定義3中的概率閾值取α=0.9,β=0.1。計算pos(0.9,0.1)(d|c)={x∈u|pr(y|x)≥α},以x1為例,x1={u1,u11},y1={u1},card(u1)=12,card(u11)=1,pr(y1|x1)=12/13=0.923≥α,即u1,u11滿足pr(y|x)≥α條件,其余等價類同理,得pos(0.9,0.1)(y|x)={u1,u2,u3,u4,u5,u6,u7,u8,u9,u10,u11,u12}故決策表一致性檢驗(yàn)通過。步驟2屬性相對約簡,得到約簡后的決策表。步驟2.1基于信息熵的屬性重要度計算。決策表中,條件屬性集合c對決策屬性集合d分類的信息熵為:在上式中,xi表示條件屬性的等價類,yj表示決策屬性的等價類。本例中,條件類的概率p(xi)如表5所示,決策類相對于條件類的概率p(yj|xi)如表5所示。表5條件類u/c概率表i12345678910p(xi)0.130.080.110.060.090.130.10.070.130.1表6決策類相對于條件類u/c概率表h(d|c)=-((0.92×log20.92+0.08×log20.08)×0.13+(0.91×log20.91+0.09×log20.09)×0.11)=0.099計算決策表去除屬性c1后的信息熵,此時條件等價類從原來的10個變?yōu)?個,條件等價類u/c-c1如表7所示。表7條件類u/c-c1i12345678xi{u1,u11}{u2}{u3,u10,u12}{u4}{u5u8}{u6}{u7}{u9}表8條件類u/c-c1概率表i12345678p(xi)0.130.080.210.060.160.130.10.13表9決策類相對于條件類u/c-c1概率表得,h(d|c-c1)=-((0.92×log20.92+0.08×log20.08)×0.13+(2×0.48×log20.48+0.04×log20.04)×0.21+(0.56×log20.56+0.44×log20.44)×0.16)=0.467條件屬性c是條件屬性集合c中的某一具體屬性,條件屬性c的重要度w為增加該屬性后信息熵的減少量,即c1的重要性為ω(c1)=h(d|c-c1)-h(d|c)=0.467-0.099=0.368。同樣的方法求得c2,c3,c4的重要性:ω(c2)=h(d|c-c2)-h(d|c)=0.538-0.099=0.439;ω(c3)=h(d|c-c3)-h(d|c)=0.099-0.099=0;ω(c4)=h(d|c-c4)-h(d|c)=0.284-0.099=0.185。步驟2.2迭代生成約簡。利用分辨矩陣的方法計算得core(c,d)={c2},令red0(c,d)=core(c,d)={c2},在步驟1.4中,得γ(c,d)=1。取e=0.1。對除了c2以外的屬性根據(jù)屬性值大小進(jìn)行排序,為c1>c4>c3。γ(c,d)-γ(red0(c,d),d)=1>e,不符合要求,則,令red1(c,d)={c2,c1},γ(c,d)-γ(red1(c,d),d)=0.4>e,不符合要求,則,令red2(c,d)={c2,c1,c4},γ(c,d)-γ(red2(c,d),d)=0<e,符合要求,因此,最終約簡的結(jié)果為red2(c,d)={c2,c1,c4},c3是冗余屬性,從決策表中刪除,至此,得到約簡后的決策表如表10所示。表10約簡后決策表標(biāo)識支持?jǐn)?shù)c1c2c4d1d2d3u112121211u28232332u310322133u46411114u59122221u613421114u710332323u87422134u913111111u1010222132u111121114u121322323在步驟2中,基于信息熵的屬性重要度計算能夠避免傳統(tǒng)主觀賦權(quán)方式的主觀性,突出了條件屬性相對于決策屬性的信息重要度。在重要度排序的基礎(chǔ)上進(jìn)行迭代約簡可以提高迭代效率,縮短計算時間。步驟3推送規(guī)則生成。利用步驟2中約簡后的決策表,生成規(guī)則tij:des(xi)→μdes(yj)表11規(guī)則表步驟4推送規(guī)則驗(yàn)證評估。用部分未參與規(guī)則生成的歷史數(shù)據(jù)驗(yàn)證決策規(guī)則,在系統(tǒng)中抽取50條未用于生成規(guī)則的用戶行為記錄,根據(jù)行為記錄中的c1、c2、c4屬性值,根據(jù)生成的規(guī)則,得到相應(yīng)的知識屬性d1、d2、d3的屬性值,將得到的知識屬性值與用戶行為記錄中的屬性值核對,得到推送的正確率。如果規(guī)則得到的結(jié)果正確性在可接受的范圍之內(nèi),則確認(rèn)規(guī)則,否則返回步驟1.1,重新抽取數(shù)據(jù)進(jìn)行計算。步驟5規(guī)則實(shí)施,提高知識推送精度。根據(jù)步驟2中約簡后的決策表的條件屬性集合c{設(shè)計重點(diǎn),載荷要求(n/m),端口類型},收集數(shù)據(jù),進(jìn)行數(shù)據(jù)預(yù)處理工作,匹配合適的規(guī)則,得到?jīng)Q策屬性集合d{知識類型,知識領(lǐng)域,知識來源}的值,把相關(guān)的知識推送給用戶,并記錄用戶的反饋結(jié)果,為日后的規(guī)則評價及更新積累數(shù)據(jù)。以上結(jié)合具體實(shí)施例對本發(fā)明的技術(shù)方案和具體實(shí)施方式作了說明,但這些說明不能被理解為限制了本發(fā)明的范圍,這些僅是舉例說明,可以對這些實(shí)施方式做出多種變更或修改,而不背離本發(fā)明的原理和實(shí)質(zhì)。本發(fā)明的保護(hù)范圍由隨附的權(quán)利要求書限定,任何在本發(fā)明權(quán)利要求基礎(chǔ)上的改動都是本發(fā)明的保護(hù)范圍。當(dāng)前第1頁12