待檢測數(shù)據(jù)的樹形結(jié)構(gòu)。
[0097]本單元利用文件分析單元2中已經(jīng)確定的所述字段名稱及其對應(yīng)級別信息,對待檢測數(shù)據(jù)進(jìn)行對應(yīng),根據(jù)參照文件中各字段的名稱及級別,以及與其對應(yīng)的待檢測數(shù)據(jù)中的字段進(jìn)行對應(yīng),確定待檢測字段和級別,也即是確定所述待檢測數(shù)據(jù)需要檢測的字段與參照級別的映射。
[0098]在此基礎(chǔ)上,組織所述待檢測數(shù)據(jù)的樹形結(jié)構(gòu)。
[0099]如圖10所示,其為本發(fā)明數(shù)據(jù)依賴的數(shù)據(jù)質(zhì)量檢測裝置中數(shù)據(jù)依賴規(guī)則定義單元的結(jié)構(gòu)圖;其中,所述數(shù)據(jù)依賴規(guī)則定義單元3包括:
[0100]映射模塊31,接收待檢測數(shù)據(jù),接收所述參照文件的所述字段名稱及其對應(yīng)級別信息,確定所述待檢測數(shù)據(jù)需要檢測的字段與參照級別的映射;
[0101]本模塊中,根據(jù)字段名稱、相似度等確定參照文件的所述字段名稱和待檢測數(shù)據(jù)中需要檢測的字段的對應(yīng)關(guān)系,再根據(jù)對應(yīng)關(guān)系以及參照文件中字段的級別確定待檢測數(shù)據(jù)中需要檢測的字段的級別,這樣就確定了所述待檢測數(shù)據(jù)需要檢測的字段與參照級別的映射。
[0102]樹形結(jié)構(gòu)模塊32,對所述待檢測數(shù)據(jù)檢測字段的數(shù)據(jù)值進(jìn)行分析,輸出每個(gè)字段的不同值及對應(yīng)的所有記錄編號,并按照參照級別將各字段的值同樣組織成待檢測字段的樹形結(jié)構(gòu)。
[0103]每個(gè)記錄編號都與各個(gè)待檢測字段的某一值一一對應(yīng),即每個(gè)記錄編號對應(yīng)待檢測字段一的某一值,同時(shí)對應(yīng)待檢測字段二的某一值,同時(shí)對應(yīng)其余所有待檢測字段的某一值。通過記錄編號,可以在檢測到錯(cuò)誤數(shù)據(jù)后迅速定位錯(cuò)誤數(shù)據(jù)。
[0104]組織成的待檢測字段的樹形結(jié)構(gòu)中每個(gè)節(jié)點(diǎn)均包括但不限于以下屬性之一:
[0105]值,為代表對應(yīng)層級的一個(gè)值;
[0106]記錄編號,該節(jié)點(diǎn)及其所有上層節(jié)點(diǎn)代表的值對應(yīng)的所有記錄編號;
[0107]標(biāo)記,標(biāo)明該值在對應(yīng)級別的對應(yīng)父節(jié)點(diǎn)下是否存在的符號;一般以O(shè)為未標(biāo)記或不存在,以I為存在。
[0108]這樣,標(biāo)記用于對正確或錯(cuò)誤數(shù)據(jù)進(jìn)行標(biāo)注,記錄編號用于迅速定位錯(cuò)誤數(shù)據(jù),以提高整體速度。
[0109]數(shù)據(jù)依賴規(guī)則檢查單元4,遍歷參照文件的樹形結(jié)構(gòu),在待檢測字段的樹形結(jié)構(gòu)對應(yīng)位置上查找值,并做出標(biāo)記。
[0110]遍歷參照文件的樹形結(jié)構(gòu),若參照文件的樹形結(jié)構(gòu)上存在的值,在待檢測字段的樹形結(jié)構(gòu)對應(yīng)級別的對應(yīng)父節(jié)點(diǎn)下不存在,則標(biāo)記為不存在(O);若參照文件的樹形結(jié)構(gòu)上存在的值,在待檢測字段的樹形結(jié)構(gòu)對應(yīng)級別的對應(yīng)父節(jié)點(diǎn)下存在,則標(biāo)記為存在(I);若參照文件的樹形結(jié)構(gòu)上不存在的值,在待檢測字段的樹形結(jié)構(gòu)上存在,則標(biāo)記為不存在
(O)。
[0111]本單元中,優(yōu)選使用寬度優(yōu)先便利法對參照文件的樹形結(jié)構(gòu)進(jìn)行遍歷,以提高遍歷速度和效率。
[0112]若參照文件的樹形結(jié)構(gòu)上存在的值,在待檢測字段的樹形結(jié)構(gòu)對應(yīng)級別的對應(yīng)父節(jié)點(diǎn)下不存在,則將對應(yīng)值及其子節(jié)點(diǎn)均標(biāo)記為不存在;這樣減少了需要對比的待檢測字段的樹形結(jié)構(gòu)需要對照的節(jié)點(diǎn)數(shù),進(jìn)一步提高了速度和效率。
[0113]這樣,通過單元2、3、4,可以在數(shù)據(jù)依賴檢查過程中準(zhǔn)確定位錯(cuò)誤的發(fā)生源;在確定錯(cuò)誤的發(fā)生源的情況下,自然也確定了錯(cuò)誤發(fā)生在依賴的左部還是右部;本發(fā)明利用樹形結(jié)構(gòu)的遍歷,避免了分別進(jìn)行交叉對比,在待檢測字段超過兩個(gè)或待檢測數(shù)據(jù)量較大時(shí)不但能方便的定位錯(cuò)誤位置,還能大大提高檢測速度和效率;本發(fā)明利用樹形結(jié)構(gòu)的遍歷,只對不同值查詢一次參照文件,不同于一般方案上的需要針對每一條記錄重復(fù)查詢參照文件的做法,也提高了數(shù)據(jù)質(zhì)量檢測的效率和速度。
[0114]另外,本發(fā)明尤其適合于多字段的數(shù)據(jù)依賴檢測,無需事先定義查詢字段和檢測字段。
[0115]檢測信息處理單元5,再次遍歷待檢測字段的樹形結(jié)構(gòu),根據(jù)所述標(biāo)記輸出錯(cuò)誤信息。
[0116]本單元為輸出單元,其作為一可添加單元對本裝置進(jìn)行完善,必要時(shí)也可刪除本單元。
[0117]本單元中,優(yōu)選使用寬度優(yōu)先便利法對參照文件的樹形結(jié)構(gòu)進(jìn)行遍歷,以提高遍歷速度和效率。
[0118]實(shí)施例四
[0119]如上述所述的數(shù)據(jù)依賴的數(shù)據(jù)質(zhì)量檢測裝置,本實(shí)施例與其不同之處在于,如圖11本發(fā)明數(shù)據(jù)依賴的數(shù)據(jù)質(zhì)量檢測裝置實(shí)施例四的結(jié)構(gòu)圖所示,所述數(shù)據(jù)質(zhì)量檢測裝置還包括
[0120]格式轉(zhuǎn)換單元I,將待輸入的外部參照文件或待檢測數(shù)據(jù)轉(zhuǎn)換為要求格式。
[0121]這樣,將不同格式的文件進(jìn)行轉(zhuǎn)換,提高了此方法對不同文件格式的適應(yīng)性。
[0122]以上所述僅為本發(fā)明的較佳實(shí)施例,對本發(fā)明而言僅僅是說明性的,而非限制性的。本專業(yè)技術(shù)人員理解,在本發(fā)明權(quán)利要求所限定的精神和范圍內(nèi)可對其進(jìn)行許多改變,修改,甚至等效,但都將落入本發(fā)明的保護(hù)范圍內(nèi)。
【主權(quán)項(xiàng)】
1.一種數(shù)據(jù)依賴的數(shù)據(jù)質(zhì)量檢測方法,其特征在于,包括: 步驟b,分析外部參照文件,根據(jù)所述參照文件各字段具有不同值的個(gè)數(shù)判斷該字段所處級別,并將各字段的值組織成所述參照文件的樹形結(jié)構(gòu); 步驟C,接收待檢測數(shù)據(jù),根據(jù)所述參照文件的所述字段的名稱及其對應(yīng)級別信息,確定所述待檢測數(shù)據(jù)待檢測字段與參照級別的映射,并組織成所述待檢測字段的樹形結(jié)構(gòu);步驟d,遍歷所述參照文件的樹形結(jié)構(gòu),在所述待檢測字段的樹形結(jié)構(gòu)對應(yīng)位置上查找值,并做出標(biāo)記。2.根據(jù)權(quán)利要求1所述的數(shù)據(jù)質(zhì)量檢測方法,其特征在于,還包括: 步驟e,再次遍歷所述待檢測字段的樹形結(jié)構(gòu),根據(jù)所述標(biāo)記輸出錯(cuò)誤信息。3.根據(jù)權(quán)利要求2所述的數(shù)據(jù)質(zhì)量檢測方法,其特征在于,還包括:步驟a,將待輸入的所述參照文件或所述待檢測數(shù)據(jù)轉(zhuǎn)換為要求格式;所述步驟a在所述步驟b之前。4.根據(jù)權(quán)利要求1或2或3所述的數(shù)據(jù)質(zhì)量檢測方法,其特征在于,所述參照文件的樹形結(jié)構(gòu)自頂向下對應(yīng)字段的不同值個(gè)數(shù)遞增。5.根據(jù)權(quán)利要求1或2或3所述的數(shù)據(jù)質(zhì)量檢測方法,其特征在于, 所述步驟c包括: 步驟Cl,接收所述待檢測數(shù)據(jù),接收所述參照文件的所述字段的名稱及其對應(yīng)級別信息,確定所述待檢測數(shù)據(jù)待檢測字段與參照級別的映射; 步驟c2,對所述待檢測字段的數(shù)據(jù)值進(jìn)行分析,輸出每個(gè)字段的不同值及對應(yīng)的所有記錄編號,并按照所述參照級別將各字段的值同樣組織成所述待檢測字段的樹形結(jié)構(gòu)。6.根據(jù)權(quán)利要求2或3所述的數(shù)據(jù)質(zhì)量檢測方法,其特征在于,所述遍歷為寬度優(yōu)先遍歷,以提高遍歷速度。7.—種與權(quán)利要求1-6中任一所述的數(shù)據(jù)質(zhì)量檢測方法對應(yīng)的數(shù)據(jù)依賴的數(shù)據(jù)質(zhì)量檢測裝置,其特征在于,包括: 參照文件分析單元,分析所述參照文件,根據(jù)所述參照文件各字段具有不同值的個(gè)數(shù)判斷該字段所處級別,并將各字段的值組織成所述參照文件的樹形結(jié)構(gòu); 數(shù)據(jù)依賴規(guī)則定義單元,接收所述待檢測數(shù)據(jù),根據(jù)所述參照文件的所述字段的名稱及其對應(yīng)級別信息,確定所述待檢測數(shù)據(jù)待檢測字段與參照級別的映射,并組織成所述待檢測字段的樹形結(jié)構(gòu); 數(shù)據(jù)依賴規(guī)則檢查單元,遍歷所述參照文件的樹形結(jié)構(gòu),在所述待檢測字段的樹形結(jié)構(gòu)對應(yīng)位置上查找值,并做出所述標(biāo)記。8.根據(jù)權(quán)利要求7所述的數(shù)據(jù)質(zhì)量檢測裝置,其特征在于, 檢測信息處理單元,再次遍歷所述待檢測字段的樹形結(jié)構(gòu),根據(jù)所述標(biāo)記輸出錯(cuò)誤信息。9.根據(jù)權(quán)利要求8所述的數(shù)據(jù)質(zhì)量檢測裝置,其特征在于, 格式轉(zhuǎn)換單元,將待輸入的所述參照文件或所述待檢測數(shù)據(jù)轉(zhuǎn)換為要求格式;所述格式轉(zhuǎn)換單元將數(shù)據(jù)輸入所述參照文件分析單元。10.根據(jù)權(quán)利要求7或8或9所述的數(shù)據(jù)質(zhì)量檢測裝置,其特征在于, 所述數(shù)據(jù)依賴規(guī)則定義單元包括: 映射模塊,接收所述待檢測數(shù)據(jù),接收所述參照文件的所述字段的名稱及其對應(yīng)級別信息,確定所述待檢測數(shù)據(jù)待檢測字段與參照級別的映射; 樹形結(jié)構(gòu)模塊,對所述待檢測字段的數(shù)據(jù)值進(jìn)行分析,輸出每個(gè)字段的不同值及對應(yīng)的所有所述記錄編號,并按照所述參照級別將各字段的值同樣組織成所述待檢測字段的樹形結(jié)構(gòu)。
【專利摘要】本發(fā)明為一種數(shù)據(jù)依賴的數(shù)據(jù)質(zhì)量檢測方法及裝置,所述方法包括:步驟b,分析參照文件,根據(jù)所述參照文件各字段具有不同值的個(gè)數(shù)判斷該字段所處級別,并將各字段的值組織成所述參照文件的樹形結(jié)構(gòu);步驟c,接收待檢測數(shù)據(jù),根據(jù)所述參照文件的所述字段的名稱及其對應(yīng)級別信息,確定所述待檢測數(shù)據(jù)待檢測字段與參照級別的映射,并組織成所述待檢測字段的樹形結(jié)構(gòu);步驟d,遍歷所述參照文件的樹形結(jié)構(gòu),在所述待檢測字段的樹形結(jié)構(gòu)對應(yīng)位置上查找值,并做出標(biāo)記;所述裝置包括與各個(gè)步驟相對應(yīng)的參照文件分析單元、數(shù)據(jù)依賴規(guī)則定義單元和數(shù)據(jù)依賴規(guī)則檢查單元。這樣,可以在檢查過程中準(zhǔn)確定位錯(cuò)誤的發(fā)生源,且大大提高了檢測速度和效率。
【IPC分類】G06F17/30
【公開號】CN105701199
【申請?zhí)枴緾N201610016515
【發(fā)明人】彭澤武, 馮歆堯, 江疆, 楊秋勇, 張曉霞
【申請人】廣東電網(wǎng)有限責(zé)任公司信息中心
【公開日】2016年6月22日
【申請日】2016年1月8日