面向多元數(shù)據(jù)的自動關(guān)聯(lián)方法
【專利摘要】本發(fā)明公開了面向多元數(shù)據(jù)的自動關(guān)聯(lián)方法,選擇多元數(shù)據(jù),提取每個數(shù)據(jù)的時間屬性,對時間屬性不全的根據(jù)上下文自動補(bǔ)全,提取每個數(shù)據(jù)的地理中心位置和覆蓋范圍,并轉(zhuǎn)換到統(tǒng)一的橢球坐標(biāo)系下;對數(shù)據(jù)添加屬性標(biāo)簽;根據(jù)數(shù)據(jù)的來源、類別、等級、分辨率屬性對數(shù)據(jù)自動添加屬性標(biāo)簽,具有相同標(biāo)簽的數(shù)據(jù)存在著隱含的關(guān)聯(lián)關(guān)系;利用多屬性信息挖掘數(shù)據(jù)間的關(guān)聯(lián)關(guān)系;同時考慮數(shù)據(jù)的時間屬性、位置屬性和標(biāo)簽信息,利用改進(jìn)的距離依賴中餐館過程挖掘數(shù)據(jù)間的關(guān)聯(lián)關(guān)系;保存數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,作為已知信息用于后續(xù)自動關(guān)聯(lián)組織。本發(fā)明的有益效果是充分考慮了多種屬性信息進(jìn)行數(shù)據(jù)關(guān)聯(lián),使得大量信息得到有效利用。
【專利說明】面向多元數(shù)據(jù)的自動關(guān)聯(lián)方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于多元數(shù)據(jù)自動關(guān)聯(lián)【技術(shù)領(lǐng)域】,涉及面向多元數(shù)據(jù)的自動關(guān)聯(lián)方法。
【背景技術(shù)】
[0002] 隨著航天技術(shù)和傳感器技術(shù)的發(fā)展,可以獲取的遙感數(shù)據(jù)越來越多,如何自動地 組織和管理這些海量遙感數(shù)據(jù)是有效利用的前提。同時,這些海量數(shù)據(jù)來自不同多樣的傳 感器,各個傳感器的屬性元素也不盡相同,因此得到的數(shù)據(jù)也是多元的。多元數(shù)據(jù)具有不同 的結(jié)構(gòu)信息,如何自動的對這些數(shù)據(jù)進(jìn)行組織和關(guān)聯(lián)是信息有效利用的前提條件。
[0003] 目前,多元數(shù)據(jù)的關(guān)聯(lián)大多根據(jù)特定屬性信息等自動關(guān)聯(lián),這種關(guān)聯(lián)沒有聯(lián)合考 慮多種屬性信息,而且容易導(dǎo)致過多的關(guān)聯(lián)關(guān)系,降低關(guān)聯(lián)的效用。多元數(shù)據(jù)是從不同方 面反映數(shù)據(jù)的特征,具有相互補(bǔ)充相互彌補(bǔ)的特點(diǎn),因此,實(shí)現(xiàn)多元的自動關(guān)聯(lián)具有重要意 義。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的在于提供面向多元數(shù)據(jù)的自動關(guān)聯(lián)方法,解決了現(xiàn)有的關(guān)聯(lián)方法沒 有聯(lián)合考慮多種屬性信息,而且容易導(dǎo)致過多的關(guān)聯(lián)關(guān)系,降低關(guān)聯(lián)的效用、解決海量遙感 數(shù)據(jù)的自動關(guān)聯(lián)問題。
[0005] 本發(fā)明所采用的技術(shù)方案是按照以下步驟進(jìn)行:
[0006] 步驟1、選擇多元數(shù)據(jù),多元數(shù)據(jù)是指不同類型但具有一定共性的數(shù)據(jù);
[0007] 步驟2、提取每個數(shù)據(jù)的時間屬性,對時間屬性不全的根據(jù)上下文補(bǔ)全;
[0008] 步驟3、提取每個數(shù)據(jù)的地理中心位置和覆蓋范圍,并轉(zhuǎn)換到統(tǒng)一的橢球坐標(biāo)系 下;
[0009] 步驟4、對數(shù)據(jù)添加屬性標(biāo)簽;根據(jù)數(shù)據(jù)的來源、類別、等級、分辨率屬性對數(shù)據(jù)自 動添加屬性標(biāo)簽,具有相同標(biāo)簽的數(shù)據(jù)存在著隱含的關(guān)聯(lián)關(guān)系;
[0010] 步驟5 :利用多屬性信息挖掘數(shù)據(jù)間的關(guān)聯(lián)關(guān)系;同時考慮數(shù)據(jù)的時間屬性、位置 屬性和標(biāo)簽信息,利用改進(jìn)的距離依賴中餐館過程挖掘數(shù)據(jù)間的關(guān)聯(lián)關(guān)系;
[0011] 步驟6 :保存數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,作為已知信息用于后續(xù)自動關(guān)聯(lián)組織。
[0012] 進(jìn)一步,所述步驟4中利用圖像解譯算法對數(shù)據(jù)自動添加語義標(biāo)簽,對每一幅圖 像進(jìn)行識別,檢測有沒有艦船,有的話是什么型號的艦船,然后將這個艦船的名字作為語義 標(biāo)簽添加到這個圖像的標(biāo)簽中去;
[0013] 進(jìn)一步,所述步驟5中利用改進(jìn)的距離依賴中餐館過程挖掘數(shù)據(jù)間的關(guān)聯(lián)關(guān)系過 程分為以下幾步:
[0014] 5. 1計(jì)算數(shù)據(jù)之間的時間距離,Cli/表示數(shù)據(jù)時間屬性上的距離,根據(jù)數(shù)據(jù)類型 使用不同的時間粒度,普通數(shù)據(jù)采用天作為基本單位,時效性較高的數(shù)據(jù)采用秒為基本單 位;
[0015] 5. 2計(jì)算數(shù)據(jù)之間的地理位置距離,Clij1表示數(shù)據(jù)位置屬性上的距離,統(tǒng)一使用米 為單位;
[0016] 5. 3對所有數(shù)據(jù)隨機(jī)初始化數(shù)據(jù)分組,每個數(shù)據(jù)都根據(jù)改進(jìn)的距離依賴中餐館的 先驗(yàn)隨機(jī)選取一個數(shù)據(jù)作為自己的鄰居;
[0017] 改進(jìn)的距離依賴中餐館過程挖掘數(shù)據(jù)間的關(guān)聯(lián)關(guān)系是在中餐館過程的基礎(chǔ)上考 慮數(shù)據(jù)之間的依賴關(guān)系采用如下公式:
[0018]
【權(quán)利要求】
1. 面向多元數(shù)據(jù)的自動關(guān)聯(lián)方法,其特征在于按照以下步驟進(jìn)行: 步驟1、選擇多元數(shù)據(jù),多元數(shù)據(jù)是指不同類型但具有一定共性的數(shù)據(jù); 步驟2、提取每個數(shù)據(jù)的時間屬性,對時間屬性不全的根據(jù)上下文補(bǔ)全; 步驟3、提取每個數(shù)據(jù)的地理中心位置和覆蓋范圍,并轉(zhuǎn)換到統(tǒng)一的橢球坐標(biāo)系下; 步驟4、對數(shù)據(jù)添加屬性標(biāo)簽;根據(jù)數(shù)據(jù)的來源、類別、等級、分辨率屬性對數(shù)據(jù)自動添 加屬性標(biāo)簽,具有相同標(biāo)簽的數(shù)據(jù)存在著隱含的關(guān)聯(lián)關(guān)系; 步驟5 :利用多屬性信息挖掘數(shù)據(jù)間的關(guān)聯(lián)關(guān)系;同時考慮數(shù)據(jù)的時間屬性、位置屬性 和標(biāo)簽信息,利用改進(jìn)的距離依賴中餐館過程挖掘數(shù)據(jù)間的關(guān)聯(lián)關(guān)系; 步驟6 :保存數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,作為已知信息用于后續(xù)自動關(guān)聯(lián)組織。
2. 按照權(quán)利要求1所述面向多元數(shù)據(jù)的自動關(guān)聯(lián)方法,其特征在于:所述步驟4中利 用圖像解譯算法對數(shù)據(jù)自動添加語義標(biāo)簽,對每一幅圖像進(jìn)行識別,檢測有沒有艦船,有的 話是什么型號的艦船,然后將這個艦船的名字作為語義標(biāo)簽添加到這個圖像的標(biāo)簽中去。
3. 按照權(quán)利要求1所述面向多元數(shù)據(jù)的自動關(guān)聯(lián)方法,其特征在于:所述步驟5中利 用改進(jìn)的距離依賴中餐館過程挖掘數(shù)據(jù)間的關(guān)聯(lián)關(guān)系過程分為以下幾步: 5. 1計(jì)算數(shù)據(jù)之間的時間距離,Cli/表示數(shù)據(jù)時間屬性上的距離,根據(jù)數(shù)據(jù)類型使用不 同的時間粒度,普通數(shù)據(jù)采用天作為基本單位,時效性較高的數(shù)據(jù)采用秒為基本單位; 5. 2計(jì)算數(shù)據(jù)之間的地理位置距離,Clij1表示數(shù)據(jù)位置屬性上的距離,統(tǒng)一使用米為單 位; 5. 3對所有數(shù)據(jù)隨機(jī)初始化數(shù)據(jù)分組,每個數(shù)據(jù)都根據(jù)改進(jìn)的距離依賴中餐館的先驗(yàn) 隨機(jī)選取一個數(shù)據(jù)作為自己的鄰居; 改進(jìn)的距離依賴中餐館過程挖掘數(shù)據(jù)間的關(guān)聯(lián)關(guān)系是在中餐館過程的基礎(chǔ)上考慮數(shù) 據(jù)之間的依賴關(guān)系采用如下公式:
4,4分別表示時間和位置距離的衰減函數(shù),選取以下函數(shù):f(d) = e^d/a,f(d)= exp (_d+a) / (1+exp (_d+a)),f (d) = I [d < a],保證時間相近位置相鄰的數(shù)據(jù)有更大的概率 聚為一類; 5. 4循環(huán)采樣數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,其中以時間和地理距離作為先驗(yàn),以標(biāo)簽屬性信息 等作為后驗(yàn)來計(jì)算采樣的概率,并根據(jù)這個概率采樣每個數(shù)據(jù)所選擇的鄰居數(shù)據(jù); 5. 5選取收斂后若干輪的均值作為最終的結(jié)果; 5. 6根據(jù)采樣結(jié)果恢復(fù)每個數(shù)據(jù)所選擇的鄰居數(shù)據(jù),據(jù)此把數(shù)據(jù)聚類成不同的分組,自 動建立數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系。
【文檔編號】G06F17/30GK104516975SQ201410838117
【公開日】2015年4月15日 申請日期:2014年12月29日 優(yōu)先權(quán)日:2014年12月29日
【發(fā)明者】付琨, 許光鑾, 孫顯, 黃宇, 王磊, 田璟, 宋俊 申請人:中國科學(xué)院電子學(xué)研究所