一種基于形式概念分析理論的完全格無損壓縮存儲方法
【專利摘要】本發(fā)明公開了一種基于形式概念分析理論的完全格無損壓縮存儲方法,對完全格中的結(jié)點進(jìn)行區(qū)分,只存儲關(guān)鍵結(jié)點的信息,壓縮存儲規(guī)模,提高存儲效率以及存儲空間的利用率。本發(fā)明方法采用形式概念分析的理論,以提高存儲空間有效利用率、利于完全格的檢索和同構(gòu)判定為目的,提出一種完全格無損壓縮存儲方法。
【專利說明】一種基于形式概念分析理論的完全格無損壓縮存儲方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及的是一種基于形式概念分析理論的完全格無損壓縮存儲方法。
【背景技術(shù)】
[0002]形式概念分析:形式概念分析(Formal Concept Analysis, FCA)是Wille提出的一種從形式背景進(jìn)行數(shù)據(jù)分析和規(guī)則提取的強(qiáng)有力工具,形式概念分析建立在數(shù)學(xué)基礎(chǔ)之上,對組成本體的概念、屬性以及關(guān)系等用形式化的語境表述出來,然后根據(jù)語境,構(gòu)造出概念格(concept lattice),即本體,從而清楚地表達(dá)出本體的結(jié)構(gòu)。這種本體構(gòu)建的過程是半自動化的,在概念的形成階段,需要領(lǐng)域?qū)<业膮⑴c,識別出領(lǐng)域內(nèi)的對象、屬性,構(gòu)建其間的關(guān)系,在概念生成之后,可以構(gòu)造語境,然后利用概念格的生成算法CLCA,自動產(chǎn)生本體。形式概念分析強(qiáng)調(diào)以人的認(rèn)知為中心,提供了一種與傳統(tǒng)的、統(tǒng)計的數(shù)據(jù)分析和知識表示完全不同的方法,成為了人工智能學(xué)科的重要研究對象,在機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、信息檢索等領(lǐng)域得到了廣泛的應(yīng)用。
[0003]完全格:在數(shù)學(xué)中,完全格是在其中所有子集都有上確界(并)和下確界(交)的偏序集。完全格出現(xiàn)于數(shù)學(xué)和計算機(jī)科學(xué)的很多應(yīng)用中。作為格的特殊實例,在次序論和泛代數(shù)中都有所研究。
[0004]數(shù)據(jù)壓縮:數(shù)據(jù)壓縮是指在不丟失信息的前提下,縮減數(shù)據(jù)量以減少存儲空間,提高其傳輸、存儲和處理效率的一種技術(shù)方法?;虬凑找欢ǖ乃惴▽?shù)據(jù)進(jìn)行重新組織,減少數(shù)據(jù)的冗余和存儲的空間。數(shù)據(jù)壓縮包括有損壓縮和無損壓縮。
[0005]完全格理論在GPS中的坐標(biāo)變換、模糊故障檢測、機(jī)器人集群、不確定性數(shù)據(jù)表示等領(lǐng)域都有應(yīng)用。在這些應(yīng)用中,都需要進(jìn)行格的存儲與檢索操作?,F(xiàn)有的方式是采用鄰接矩陣存儲完全格,雖然記錄了完全格的所有信息,但存在以下不足:存儲空間有效利用率低,不利于完全格的檢索和同構(gòu)判定;對完全格中的結(jié)點不加區(qū)分,記錄所有結(jié)點信息,存儲效率低;鄰接矩陣中存在大量O元素,存儲空間的有效利用率低。
【發(fā)明內(nèi)容】
[0006]本發(fā)明所要解決的技術(shù)問題是針對現(xiàn)有技術(shù)的不足提供一種基于形式概念分析理論的完全格無損壓縮存儲方法。
[0007]本發(fā)明的技術(shù)方案如下:
[0008]對完全格中的結(jié)點進(jìn)行區(qū)分,只存儲關(guān)鍵結(jié)點的信息,壓縮存儲規(guī)模,提高存儲效率以及存儲空間的利用率。
[0009]一種基于形式概念分析理論的完全格無損壓縮存儲方法,步驟1:從完全格V最小元開始向上遍歷,若一個格結(jié)點只有一個上近鄰,則從字母表{a,b,c,...}中取一個字母標(biāo)注,標(biāo)注后將這個字母從字母表中刪除;
[0010]步驟2:從完全格V最大元開始向下遍歷,若一個格結(jié)點只有一個下近鄰,則從數(shù)字表{1,2,3,...}中取一個數(shù)字標(biāo)注,標(biāo)注后將這個數(shù)字從數(shù)字表中刪除;[0011]步驟3:若一共使用了 m個數(shù)字和η個字母,則建立m行η列的形式背景K,每一個
數(shù)字對應(yīng)一行,每一個字母對應(yīng)一列;
[0012]步驟4:在完全格V中,對于每個用數(shù)字標(biāo)注的格結(jié)點(假定標(biāo)注的數(shù)字為i),搜索其上近鄰直到最大元,若在這一過程中遇到用字母標(biāo)注的格結(jié)點(假定標(biāo)注的字母為j),則將K中i行j列交叉處的值修改為* ;
[0013]步驟5:返回K,算法結(jié)束。
[0014]本發(fā)明方法采用形式概念分析的理論,以提高存儲空間有效利用率、利于完全格的檢索和同構(gòu)判定為目的,提出一種完全格無損壓縮存儲方法。
【專利附圖】
【附圖說明】
[0015]圖1:完全格V;
[0016]圖2:標(biāo)注不可約元的完全格V ;
[0017]圖3:標(biāo)注數(shù)字序號的完全格V ;
【具體實施方式】
[0018]以下結(jié)合具體實施例,對本發(fā)明進(jìn)行詳細(xì)說明。
[0019]定義1:一個集合M及其上的偏序關(guān)系≤形成的有序二元組(M,≤)稱為半序集。
[0020]定義2:令(M,≤)是一個半序集,A是M的子集,若M中的元素s滿足j都有s ≥ a,則稱s是A的一個下界。對偶地,若M中的元素s滿足Vtfe i都有s≥a,則稱s是A的一個上界。如果A的所有下界組成的集合中有最大元素,則稱這個元素為A的下確界,記infA或Λ A0對偶地,上界集合的最小元素稱為A的上確界,記supA或V A。
[0021]定義3:—個半序集(V,≤),如果V中任意兩個元素X,y的上確界及下確界都存在,則稱V是一個格。如果V的任何子集的上確界及下確界都存在,則稱V是一個完全格。
[0022]定義4:對于完全格 V 的一個元素 V ,定義 V1= V {x e VI χ〈v} ,vu= Λ {x e VI v<x},如果ν古V1即ν不是嚴(yán)格小于它的那些元素的上確界,則稱ν是上確界不可約的,或者稱V是上確界不可約元;如果v Φ vu,即v不是嚴(yán)格大于它的那些元素的下確界,則稱V是下確界不可約的,或者稱ν是下確界不可約元。在不區(qū)分上確界不可約元和下確界不可約元的情況下,它們統(tǒng)稱為不可約元。
[0023]定義5:a稱為b的下近鄰,當(dāng)a〈b且沒有c滿足a〈c〈b,這時也稱b是a的上近鄰,并且記做a < bo
[0024]定義6:—個形式背景K= (G, M, I)是由兩個集合G和M以及G與M之間的關(guān)系I組成。G的元素稱為對象,M的元素稱為屬性。(g, m) e I或glm表示對象g具有屬性m。
[0025]若形式背景中有m個對象n個屬性,那么這個形式背景實際上就是一個m行η列的二維表格。
[0026]完全格中的結(jié)點有以下性質(zhì):若一個格結(jié)點只有一個上近鄰,則這個格結(jié)點是一個下確界不可約元;若一個格結(jié)點只有一個下近鄰,則這個格結(jié)點是一個上確界不可約元。
[0027]獲取完全格的形式背景:
[0028]輸入:完全格V ;輸出:形式背景K
[0029]步驟1:從完全格V最小元開始向上遍歷,若一個格結(jié)點只有一個上近鄰,則從字母表{a,b,c,...}中取一個字母標(biāo)注,標(biāo)注后將這個字母從字母表中刪除;
[0030]步驟2:從完全格V最大元開始向下遍歷,若一個格結(jié)點只有一個下近鄰,則從數(shù)字表{1,2,3,...}中取一個數(shù)字標(biāo)注,標(biāo)注后將這個數(shù)字從數(shù)字表中刪除;
[0031 ] 步驟3:若一共使用了 m個數(shù)字和η個字母,則建立m行η列的形式背景K,每一個數(shù)字對應(yīng)一行,每一個字母對應(yīng)一列;
[0032]步驟4:在完全格V中,對于每個用數(shù)字標(biāo)注的格結(jié)點(假定標(biāo)注的數(shù)字為i),搜索其上近鄰直到最大元,若在這一過程中遇到用字母標(biāo)注的格結(jié)點(假定標(biāo)注的字母為j),則將K中i行j列交叉處的值修改為* ;
[0033]步驟5:返回K,算法結(jié)束。
[0034]利用上述技術(shù),可以將存儲一個完全格轉(zhuǎn)化為存儲一個形式背景。若形式背景有m行η列,那么建立一個mXn的矩陣A={aij}mXn,若形式背景中m行η列交叉處為*,則置au=l,否則置aij=0。由此,得到完全格的壓縮存儲矩陣A。
[0035]例1:對于圖1中的完全格V,使用關(guān)鍵技術(shù)I (標(biāo)注了不可約元的完全格見圖2),
可以得到5行5列的形式背景K(見表1),并建立5X5的存儲矩陣
【權(quán)利要求】
1.一種基于形式概念分析理論的完全格無損壓縮存儲方法,其特征在于,包括以下步驟:步驟1:從完全格V最小元開始向上遍歷,若一個格結(jié)點只有一個上近鄰,則從字母表{a, b, c,…}中取一個字母標(biāo)注,標(biāo)注后將這個字母從字母表中刪除; 步驟2:從完全格V最大元開始向下遍歷,若一個格結(jié)點只有一個下近鄰,則從數(shù)字表{I, 2,3,...}中取一個數(shù)字標(biāo)注,標(biāo)注后將這個數(shù)字從數(shù)字表中刪除; 步驟3:若一共使用了 m個數(shù)字和η個字母,則建立m行η列的形式背景K,每一個數(shù)字對應(yīng)一行,每一個字母對應(yīng)一列; 步驟4:在完全格V中,對于每個用數(shù)字標(biāo)注的格結(jié)點(假定標(biāo)注的數(shù)字為i),搜索其上近鄰直到最大元,若在這一過程中遇到用字母標(biāo)注的格結(jié)點(假定標(biāo)注的字母為j),則將K中i行j列交叉處的值修改為* ; 步驟5:返回K,算法結(jié)束。`
【文檔編號】H03M7/30GK103441767SQ201310377208
【公開日】2013年12月11日 申請日期:2013年8月26日 優(yōu)先權(quán)日:2013年8月26日
【發(fā)明者】智慧來 申請人:河南理工大學(xué)