一種數(shù)據(jù)集成的方法和裝置制造方法
【專利摘要】本發(fā)明實(shí)施例公開了一種數(shù)據(jù)集成的方法和裝置,其中方法包括:獲取需要展示的圖形數(shù)據(jù)集的數(shù)據(jù)集成路徑,數(shù)據(jù)集成路徑標(biāo)示了各數(shù)據(jù)之間傳遞的路徑和方向;依據(jù)數(shù)據(jù)之間傳遞的路徑和方向,確定各數(shù)據(jù)的入度;將入度最小的數(shù)據(jù)作為根節(jié)點(diǎn),將所述圖形數(shù)據(jù)集中的數(shù)據(jù)結(jié)構(gòu)構(gòu)建為樹形數(shù)據(jù)結(jié)構(gòu)。以上方案,將圖形數(shù)據(jù)集的復(fù)雜的網(wǎng)狀結(jié)構(gòu)轉(zhuǎn)換為樹形數(shù)據(jù)結(jié)構(gòu),使數(shù)據(jù)集成后的數(shù)據(jù)關(guān)系更簡潔,樹形數(shù)據(jù)結(jié)構(gòu)更具可讀性,屬于更好的數(shù)據(jù)集成方案,為進(jìn)行影響性分析提供了便利。
【專利說明】一種數(shù)據(jù)集成的方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及信息【技術(shù)領(lǐng)域】,特別涉及一種數(shù)據(jù)集成的方法和裝置。
【背景技術(shù)】
[0002]數(shù)據(jù)管理是利用計算機(jī)硬件和軟件技術(shù)對數(shù)據(jù)進(jìn)行有效的收集、存儲、處理和應(yīng)用的過程。其目的在于充分有效地發(fā)揮數(shù)據(jù)的作用。實(shí)現(xiàn)數(shù)據(jù)有效管理的關(guān)鍵是數(shù)據(jù)組織。隨著計算機(jī)技術(shù)的發(fā)展,數(shù)據(jù)管理經(jīng)歷了人工管理、文件系統(tǒng)、數(shù)據(jù)庫系統(tǒng)三個發(fā)展階段。在數(shù)據(jù)庫系統(tǒng)中所建立的數(shù)據(jù)結(jié)構(gòu),更充分地描述了數(shù)據(jù)間的內(nèi)在聯(lián)系,便于數(shù)據(jù)修改、更新與擴(kuò)充,同時保證了數(shù)據(jù)的獨(dú)立性、可靠、安全性與完整性,減少了數(shù)據(jù)冗余,故提高了數(shù)據(jù)共享程度及數(shù)據(jù)管理效率。
[0003]數(shù)據(jù)集成技術(shù)是數(shù)據(jù)庫系統(tǒng)設(shè)計的重要組成基本技術(shù)。隨著信息化應(yīng)用的不斷深入,企業(yè)內(nèi)部、企業(yè)與外部信息交互的需求日益強(qiáng)烈,急切需要對已有的信息進(jìn)行整合,聯(lián)通“信息孤島”,共享信息。企業(yè)實(shí)現(xiàn)數(shù)據(jù)集成共享,可以使更多的人更充分地使用已有數(shù)據(jù)資源,減少資料收集、數(shù)據(jù)采集等重復(fù)勞動和相應(yīng)費(fèi)用。目前,業(yè)界在實(shí)施數(shù)據(jù)集成的過程當(dāng)中,同類型的數(shù)據(jù)經(jīng)常會出現(xiàn)不一致,重復(fù)或來源途徑不明等問題,因此,如何對數(shù)據(jù)進(jìn)行有效的集成管理已成為增強(qiáng)企業(yè)商業(yè)競爭力的必然選擇。
[0004]目前業(yè)界的數(shù)據(jù)集成方式主要有兩種:
[0005]—、基于數(shù)據(jù)庫表傳遞的被動集成方式:
[0006]該集成方式通過集成中間件采用JDBC (Java Data Base Connectivity, java數(shù)據(jù)庫連接)、消息隊(duì)列等技術(shù)實(shí)現(xiàn)不同應(yīng)用系統(tǒng)間數(shù)據(jù)在表與表之間的傳遞。
[0007]二、基于Web Service (網(wǎng)絡(luò)服務(wù))的數(shù)據(jù)主動集成方式:
[0008]該集成方式通過主動調(diào)用Web Service方式,采用SOAP (Simple Object AccessProtocol,簡單對象訪問協(xié)議)等協(xié)議傳遞數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)在不同系統(tǒng)間的數(shù)據(jù)傳遞。
[0009]不同的集成方式可以根據(jù)圖論抽像為統(tǒng)一的圖模型,如圖1所示,圖1中的A、B代表不同的應(yīng)用系統(tǒng)或數(shù)據(jù)庫,Data表示應(yīng)該系統(tǒng)間傳遞的數(shù)據(jù)。通過這樣的圖模型可以用來表達(dá)數(shù)據(jù)傳遞的過程(在數(shù)據(jù)血緣圖中為數(shù)據(jù)血緣)。
[0010]數(shù)據(jù)血緣是信息架構(gòu)研究過程中發(fā)展出來的一種新興的技術(shù)方案。數(shù)據(jù)血緣通常被定義為數(shù)據(jù)在其生命周期內(nèi),從創(chuàng)建到系統(tǒng)間傳遞的過程。
[0011 ] 在大型數(shù)據(jù)庫中,數(shù)據(jù)之間傳遞關(guān)系復(fù)雜,數(shù)據(jù)集成關(guān)系錯綜復(fù)雜,按照數(shù)據(jù)傳遞關(guān)系會形成一個復(fù)雜的網(wǎng)狀結(jié)構(gòu)圖,例如數(shù)據(jù)血緣圖,難以直接通過數(shù)據(jù)血緣圖做影響性分析。因此,需要一種更好的數(shù)據(jù)集成方案,以便進(jìn)行影響性分析。
【發(fā)明內(nèi)容】
[0012]本發(fā)明實(shí)施例提供了一種數(shù)據(jù)集成的方法和裝置,用于提供一種更好的數(shù)據(jù)集成方案,便于進(jìn)行影響性分析。
[0013]本發(fā)明實(shí)施例一方面提供了一種數(shù)據(jù)集成的方法,包括:
[0014]獲取需要展示的圖形數(shù)據(jù)集的數(shù)據(jù)集成路徑,數(shù)據(jù)集成路徑標(biāo)示了各數(shù)據(jù)之間傳遞的路徑和方向;
[0015]依據(jù)數(shù)據(jù)之間傳遞的路徑和方向,確定各數(shù)據(jù)的入度;
[0016]將入度最小的數(shù)據(jù)作為根節(jié)點(diǎn),將所述圖形數(shù)據(jù)集中的數(shù)據(jù)結(jié)構(gòu)構(gòu)建為樹形數(shù)據(jù)結(jié)構(gòu)。
[0017]結(jié)合一方面的實(shí)現(xiàn)方式,在第一種可能的實(shí)現(xiàn)方式中,所述方法還包括:
[0018]依據(jù)數(shù)據(jù)之間傳遞的路徑和方向,確定各數(shù)據(jù)的出度;并確定所述圖形數(shù)據(jù)集的各數(shù)據(jù)是否包含在樹形數(shù)據(jù)結(jié)構(gòu)中;
[0019]所述將入度最小的數(shù)據(jù)作為根節(jié)點(diǎn)包括:
[0020]將入度最小的數(shù)據(jù)作為根節(jié)點(diǎn),若最小入度的數(shù)據(jù)有兩個或兩個以上,則將所述兩個或兩個以上的數(shù)據(jù)中出度最大且未包含在樹形數(shù)據(jù)結(jié)構(gòu)中的數(shù)據(jù)作為根節(jié)點(diǎn)。
[0021]結(jié)合一方面的實(shí)現(xiàn)方式或者第一種可能的實(shí)現(xiàn)方式,在第二種可能的實(shí)現(xiàn)方式中,所述將所述圖形數(shù)據(jù)集中的數(shù)據(jù)構(gòu)建為樹形數(shù)據(jù)結(jié)構(gòu)包括:
[0022]按照廣度優(yōu)先算法遍歷所述圖形數(shù)據(jù)集中的數(shù)據(jù),得到樹形數(shù)據(jù)結(jié)構(gòu)。
[0023]結(jié)合一方面的實(shí)現(xiàn)方式或者第一種可能的實(shí)現(xiàn)方式,在第三種可能的實(shí)現(xiàn)方式中,所述方法還包括以下至少之一:
[0024]若存在兩個或兩個以上的根節(jié)點(diǎn),則標(biāo)識初源異常;
[0025]若所述圖形數(shù)據(jù)集中存在兩個或兩個以上的數(shù)據(jù)為數(shù)據(jù)創(chuàng)建點(diǎn),則將所述數(shù)據(jù)創(chuàng)建點(diǎn)標(biāo)識為異常;
[0026]若數(shù)據(jù)集成路徑不在所述樹形數(shù)據(jù)結(jié)構(gòu)中,則將不在樹形數(shù)據(jù)結(jié)構(gòu)中的數(shù)據(jù)集成路徑標(biāo)識為異常。
[0027]結(jié)合一方面的實(shí)現(xiàn)方式或者第一種可能的實(shí)現(xiàn)方式,在第四種可能的實(shí)現(xiàn)方式中,所述圖形數(shù)據(jù)集包括:數(shù)據(jù)血緣圖的數(shù)據(jù)集合,所述數(shù)據(jù)集成路徑為數(shù)據(jù)血緣圖中的有向邊。
[0028]本發(fā)明實(shí)施例二方面提供了一種數(shù)據(jù)集成的裝置,包括:
[0029]路徑獲取單元,用于獲取需要展示的圖形數(shù)據(jù)集的數(shù)據(jù)集成路徑,數(shù)據(jù)集成路徑標(biāo)示了各數(shù)據(jù)之間傳遞的路徑和方向;
[0030]度獲取單元,用于依據(jù)所述路徑獲取單元獲取的數(shù)據(jù)之間傳遞的路徑和方向,確定各數(shù)據(jù)的入度;
[0031]數(shù)據(jù)集成單元,用于將入度最小的數(shù)據(jù)作為根節(jié)點(diǎn),將所述圖形數(shù)據(jù)集中的數(shù)據(jù)結(jié)構(gòu)構(gòu)建為樹形數(shù)據(jù)結(jié)構(gòu)。
[0032]結(jié)合二方面的實(shí)現(xiàn)方式,在第一種可能的實(shí)現(xiàn)方式中,所述裝置還包括:
[0033]節(jié)點(diǎn)確定單元,用于確定所述圖形數(shù)據(jù)集的各數(shù)據(jù)是否包含在所述數(shù)據(jù)集成單元建立的樹形數(shù)據(jù)結(jié)構(gòu)中;
[0034]所述度獲取單元,還用于依據(jù)數(shù)據(jù)之間傳遞的路徑和方向,確定各數(shù)據(jù)的出度;
[0035]所述數(shù)據(jù)集成單元,具體用于將入度最小的數(shù)據(jù)作為根節(jié)點(diǎn),若最小入度的數(shù)據(jù)有兩個或兩個以上,則將所述兩個或兩個以上的數(shù)據(jù)中出度最大且未包含在樹形數(shù)據(jù)結(jié)構(gòu)中的數(shù)據(jù)作為根節(jié)點(diǎn)。
[0036]結(jié)合二方面的實(shí)現(xiàn)方式或者第一種可能的實(shí)現(xiàn)方式,在第二種可能的實(shí)現(xiàn)方式中,所述數(shù)據(jù)集成單元,具體用于按照廣度優(yōu)先算法遍歷所述圖形數(shù)據(jù)集中的數(shù)據(jù),得到樹形數(shù)據(jù)結(jié)構(gòu)。
[0037]結(jié)合二方面的實(shí)現(xiàn)方式或者第一種可能的實(shí)現(xiàn)方式,在第三種可能的實(shí)現(xiàn)方式中,所述裝置,還包括:
[0038]異常標(biāo)識單元,用于執(zhí)行以下至少之一:若存在兩個或兩個以上的根節(jié)點(diǎn),則標(biāo)識初源異常;若所述圖形數(shù)據(jù)集中存在兩個或兩個以上的數(shù)據(jù)為數(shù)據(jù)創(chuàng)建點(diǎn),則將所述數(shù)據(jù)創(chuàng)建點(diǎn)標(biāo)識為異常;若數(shù)據(jù)集成路徑不在所述樹形數(shù)據(jù)結(jié)構(gòu)中,則將不在樹形數(shù)據(jù)結(jié)構(gòu)中的數(shù)據(jù)集成路徑標(biāo)識為異常。
[0039]結(jié)合二方面的實(shí)現(xiàn)方式或者第一種可能的實(shí)現(xiàn)方式,在第四種可能的實(shí)現(xiàn)方式中,所述路徑獲取單元,具體用于獲取需要展示的數(shù)據(jù)血緣圖的有向邊,所述有向邊標(biāo)示了各數(shù)據(jù)之間傳遞的路徑和方向。
[0040]從以上技術(shù)方案可以看出,本發(fā)明實(shí)施例具有以下優(yōu)點(diǎn):將圖形數(shù)據(jù)集的復(fù)雜的網(wǎng)狀結(jié)構(gòu)轉(zhuǎn)換為樹形數(shù)據(jù)結(jié)構(gòu),使數(shù)據(jù)集成后的數(shù)據(jù)關(guān)系更簡潔,樹形數(shù)據(jù)結(jié)構(gòu)更具可讀性,屬于更好的數(shù)據(jù)集成方案,為進(jìn)行影響性分析提供了便利。
【專利附圖】
【附圖說明】
[0041]為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對實(shí)施例描述中所需要使用的附圖作簡要介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域的普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0042]圖1現(xiàn)有技術(shù)數(shù)據(jù)集成圖模型示意圖;
[0043]圖2為本發(fā)明實(shí)施例方法流程示意圖;
[0044]圖3為本發(fā)明實(shí)施例數(shù)據(jù)血緣圖模型示意圖;
[0045]圖4為本發(fā)明實(shí)施例方法流程示意圖;
[0046]圖5A為本發(fā)明實(shí)施例異常示意圖;
[0047]圖5B為本發(fā)明實(shí)施例異常示意圖;
[0048]圖5C為本發(fā)明實(shí)施例異常示意圖;
[0049]圖6為本發(fā)明實(shí)施例裝置結(jié)構(gòu)示意圖;
[0050]圖7為本發(fā)明實(shí)施例裝置結(jié)構(gòu)示意圖;
[0051]圖8為本發(fā)明實(shí)施例裝置結(jié)構(gòu)示意圖;
[0052]圖9為本發(fā)明實(shí)施例設(shè)備結(jié)構(gòu)示意圖;
[0053]圖10為本發(fā)明實(shí)施例終端設(shè)備結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0054]為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對本發(fā)明作進(jìn)一步地詳細(xì)描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部份實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其它實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0055]本發(fā)明實(shí)施例提供了一種數(shù)據(jù)集成的方法,如圖2所示,包括:
[0056]201:獲取需要展示的圖形數(shù)據(jù)集的數(shù)據(jù)集成路徑,數(shù)據(jù)集成路徑標(biāo)示了各數(shù)據(jù)之間傳遞的路徑和方向;
[0057]圖形數(shù)據(jù)集是指按照數(shù)據(jù)之間傳遞關(guān)系會組成圖形結(jié)構(gòu)的數(shù)據(jù)集,可以是已經(jīng)組成的圖形數(shù)據(jù)結(jié)構(gòu),例如數(shù)據(jù)血緣圖(也稱為數(shù)據(jù)血緣有向圖)、ER (Entity Relat1nship,實(shí)體關(guān)系)圖等,如果上述圖形數(shù)據(jù)集為數(shù)據(jù)血緣圖的數(shù)據(jù)集合,上述數(shù)據(jù)集成路徑為數(shù)據(jù)血緣圖中的有向邊。可以理解的是,由于數(shù)據(jù)集可以是數(shù)據(jù)血緣圖的數(shù)據(jù)集合,也可以是ER圖中的設(shè)備,那么上述數(shù)據(jù)集應(yīng)理解為廣義的數(shù)據(jù),代表數(shù)據(jù)庫中存儲的數(shù)據(jù),或者,與具體的應(yīng)用系統(tǒng)、實(shí)體設(shè)備等具有對應(yīng)關(guān)系的數(shù)據(jù)。
[0058]在數(shù)據(jù)血緣圖中,表示數(shù)據(jù)傳遞過程中,數(shù)據(jù)源對數(shù)據(jù)所進(jìn)行的操作。Create表示數(shù)據(jù)的創(chuàng)建、錄入;Read表示數(shù)據(jù)的讀取;Update表示數(shù)據(jù)的更新;Delete表示數(shù)據(jù)的刪除。
[0059]數(shù)據(jù)血緣圖G (V, E, Data)模型定義如下:
[0060]V為數(shù)據(jù)血緣圖中的頂點(diǎn),定義為數(shù)據(jù)源(Data Source),即創(chuàng)建或保存數(shù)據(jù)(Data)的應(yīng)用系統(tǒng)或數(shù)據(jù)庫。
[0061]E為數(shù)據(jù)血緣圖中的有向邊,定義為數(shù)據(jù)集成路徑,E=edge(u, V), u| V e G(v), u!=v,即數(shù)據(jù)在數(shù)據(jù)源間傳遞的路徑和方向。特殊說明:數(shù)據(jù)血緣圖中,不允許出現(xiàn)數(shù)據(jù)源自包含集成路徑,即源和目的為同一個數(shù)據(jù)源的有向邊,集成定義為不同數(shù)據(jù)源間的數(shù)據(jù)傳遞。
[0062]Data,數(shù)據(jù)血緣有向圖中所傳遞的數(shù)據(jù),一般定義為數(shù)據(jù)實(shí)體,可以對應(yīng)數(shù)據(jù)庫中的表。
[0063]在數(shù)據(jù)血緣圖中,數(shù)據(jù)集成路徑標(biāo)表示數(shù)據(jù)傳遞過程中,數(shù)據(jù)源對數(shù)據(jù)所進(jìn)行的操作。操作主要有如下幾類:Create表示數(shù)據(jù)的創(chuàng)建、錄入;Read表示數(shù)據(jù)的讀??;Update表示數(shù)據(jù)的更新;Delete表示數(shù)據(jù)的刪除。數(shù)據(jù)源是指數(shù)據(jù)所在的應(yīng)用系統(tǒng)或數(shù)據(jù)庫。初始源(Initial Source)是指在數(shù)據(jù)血緣圖中,數(shù)據(jù)最初創(chuàng)建錄入的數(shù)據(jù)源即為初始源。初始源屬于數(shù)據(jù)源。
[0064]202:依據(jù)數(shù)據(jù)之間傳遞的路徑和方向,確定各數(shù)據(jù)的入度;
[0065]“入度”這個詞源于圖論算法,它通常指有向圖中某點(diǎn)作為圖中邊的終點(diǎn)的次數(shù)之和。與之對應(yīng)的則是“出度”,指有向圖中某點(diǎn)作為圖中邊的起點(diǎn)的次數(shù)之和?!叭攵取焙汀俺龆取痹跀?shù)據(jù)集成的各種數(shù)據(jù)結(jié)構(gòu)【技術(shù)領(lǐng)域】也有廣泛應(yīng)用。
[0066]在數(shù)據(jù)血緣圖G (V,E,Data)模型中,入度對應(yīng)以數(shù)據(jù)源G(V)為輸入目的的有向邊個數(shù),正常情況下,一個系統(tǒng)只能有一個確定的數(shù)據(jù)源作為輸入。出度對應(yīng)以數(shù)據(jù)源G(V)為輸入源的有向邊個數(shù),正常情況下,一個數(shù)據(jù)源允許給多個下游應(yīng)用系統(tǒng)(數(shù)據(jù)源)集成。
[0067]203:將入度最小的數(shù)據(jù)作為根節(jié)點(diǎn),將上述圖形數(shù)據(jù)集中的數(shù)據(jù)結(jié)構(gòu)構(gòu)建為樹形數(shù)據(jù)結(jié)構(gòu)。
[0068]樹形數(shù)據(jù)結(jié)構(gòu),簡稱為樹形結(jié)構(gòu),指的是數(shù)據(jù)元素之間存在著“一對多”的樹形關(guān)系的數(shù)據(jù)結(jié)構(gòu)。在樹形結(jié)構(gòu)中,樹根結(jié)點(diǎn)沒有前驅(qū)結(jié)點(diǎn),其余每個結(jié)點(diǎn)有且只有一個前驅(qū)結(jié)點(diǎn)。葉子結(jié)點(diǎn)沒有后續(xù)結(jié)點(diǎn),其余每個結(jié)點(diǎn)的后續(xù)節(jié)點(diǎn)數(shù)可以是一個也可以是多個。另外,數(shù)學(xué)統(tǒng)計中的樹形結(jié)構(gòu)還可表示層次關(guān)系。樹形數(shù)據(jù)結(jié)構(gòu)中,前驅(qū)節(jié)點(diǎn)與后續(xù)節(jié)點(diǎn)之間存在傳遞關(guān)系,這種傳遞關(guān)系可以表示數(shù)據(jù)集成路徑。
[0069]本發(fā)明實(shí)施例,將圖形數(shù)據(jù)集的復(fù)雜的網(wǎng)狀結(jié)構(gòu)轉(zhuǎn)換為樹形數(shù)據(jù)結(jié)構(gòu),使數(shù)據(jù)集成后的數(shù)據(jù)關(guān)系更簡潔,樹形數(shù)據(jù)結(jié)構(gòu)更具可讀性,屬于更好的數(shù)據(jù)集成方案,為進(jìn)行影響性分析提供了便利。
[0070]進(jìn)一步地,由于可能存在多個相同最小入度的數(shù)據(jù),本發(fā)明實(shí)施例還提供了進(jìn)一步的解決方案:上述方法,還包括:依據(jù)數(shù)據(jù)之間傳遞的路徑和方向,確定各數(shù)據(jù)的出度;并確定上述圖形數(shù)據(jù)集的各數(shù)據(jù)是否包含在樹形數(shù)據(jù)結(jié)構(gòu)中;
[0071]上述將入度最小的數(shù)據(jù)作為根節(jié)點(diǎn)包括:將入度最小的數(shù)據(jù)作為根節(jié)點(diǎn),若最小入度的數(shù)據(jù)有兩個或兩個以上,則將上述兩個或兩個以上的數(shù)據(jù)中出度最大且未包含在樹形數(shù)據(jù)結(jié)構(gòu)中的數(shù)據(jù)作為根節(jié)點(diǎn)。
[0072]優(yōu)選地,上述將上述圖形數(shù)據(jù)集中的數(shù)據(jù)構(gòu)建為樹形數(shù)據(jù)結(jié)構(gòu)包括:按照廣度優(yōu)先算法遍歷上述圖形數(shù)據(jù)集中的數(shù)據(jù),得到樹形數(shù)據(jù)結(jié)構(gòu)。需要說明的是,按照深度優(yōu)先算法生成血緣基礎(chǔ)樹也是可以的,以上按廣度優(yōu)先算法生成血緣基礎(chǔ)樹這一優(yōu)選方案,不應(yīng)理解為對本發(fā)明實(shí)施例的唯一限定。
[0073]進(jìn)一步地,本發(fā)明實(shí)施還提供了標(biāo)識異常的方案,如下:上述方法,還包括以下至少之一:
[0074]一個樹形數(shù)據(jù)結(jié)構(gòu)中只能有一個根節(jié)點(diǎn),例如:在數(shù)據(jù)血緣圖中,數(shù)據(jù)源是識別到的另一個初始源,初始源作為數(shù)據(jù)的首次創(chuàng)建錄入點(diǎn),根據(jù)業(yè)務(wù)規(guī)則,存在兩個及以上的初始源,會引入數(shù)據(jù)不一致性問題或數(shù)據(jù)重復(fù)問題?;诖耍景l(fā)明實(shí)施例提供了如下異常識別方案:若存在兩個或兩個以上的根節(jié)點(diǎn),則標(biāo)識初源異常。需要說明的是,標(biāo)識初始源的方案,并不需要以生成樹形數(shù)據(jù)結(jié)構(gòu)為前提。
[0075]由于多個C點(diǎn)(數(shù)據(jù)創(chuàng)建點(diǎn)),意味著系統(tǒng)存在多個數(shù)據(jù)錄入點(diǎn),會引入數(shù)據(jù)不一致,重復(fù)等問題。本發(fā)明實(shí)施例提供了如下異常識別方案:若上述圖形數(shù)據(jù)集中存在兩個或兩個以上的數(shù)據(jù)為數(shù)據(jù)創(chuàng)建點(diǎn),則將上述數(shù)據(jù)創(chuàng)建點(diǎn)標(biāo)識為異常;
[0076]本發(fā)明實(shí)施例還提供了異?;芈返淖R別方案,異?;芈?,例如:D數(shù)據(jù)源傳遞到B數(shù)據(jù)源時,與A傳遞到B數(shù)據(jù)源的數(shù)據(jù)產(chǎn)生沖突,會引入數(shù)據(jù)不一致,重復(fù)問題。本發(fā)明實(shí)施例提供了如下異常識別方案:若數(shù)據(jù)集成路徑不在上述樹形數(shù)據(jù)結(jié)構(gòu)中,則將不在樹形數(shù)據(jù)結(jié)構(gòu)中的數(shù)據(jù)集成路徑標(biāo)識為異常。以上異常識別方案,在后續(xù)以數(shù)據(jù)血緣圖為應(yīng)用背景的實(shí)施例舉例中將給出更詳細(xì)的說明。
[0077]以上異常識別的方案,能大幅提升中大型企業(yè)數(shù)據(jù)治理、以及數(shù)據(jù)影響性分析的效率和準(zhǔn)確性。結(jié)合自動化工具,能快速、動態(tài)生成展現(xiàn)良好的數(shù)據(jù)血緣圖形,并可自動、準(zhǔn)確識別出相關(guān)的數(shù)據(jù)異常。
[0078]本發(fā)明實(shí)施例給出了以數(shù)據(jù)血緣圖為應(yīng)用背景的實(shí)施例舉例,對以上實(shí)施例進(jìn)行更詳細(xì)的說明。
[0079]一、數(shù)據(jù)血緣圖G (V, E, Data)模型定義如下:
[0080]V為圖中頂點(diǎn),定義為數(shù)據(jù)源,即數(shù)據(jù)Data所創(chuàng)建或保存的IT應(yīng)用系統(tǒng)或數(shù)據(jù)庫。如下圖3所示的圓形標(biāo)志的A、B、C、D、E、F即為數(shù)據(jù)源。
[0081]E為圖中有向邊,定義為數(shù)據(jù)集成路徑,E=edge(u, v),u | v e G(v), u!=v,即數(shù)據(jù)在數(shù)據(jù)源間傳遞的路徑和方向。特殊說明:數(shù)據(jù)血緣圖中,不允許出現(xiàn)數(shù)據(jù)源自包含集成路徑,即源和目的為同一個數(shù)據(jù)源的有向邊,集成定義為不同數(shù)據(jù)源間的數(shù)據(jù)傳遞。圖3中的剪頭所示方向。
[0082]在數(shù)據(jù)血緣圖數(shù)據(jù)右上角方形標(biāo)示的C、R、U、D,分別代表數(shù)據(jù)所在數(shù)據(jù)源的執(zhí)行的操作。C表示數(shù)據(jù)的創(chuàng)建、錄入#表示數(shù)據(jù)的讀取#表示數(shù)據(jù)的更新;D表示數(shù)據(jù)的刪除。后續(xù)圖5A?圖5C采用同樣的標(biāo)示方式,不再一一說明。
[0083]二、本發(fā)明實(shí)施例的應(yīng)用場景:
[0084]本發(fā)明實(shí)施例可以應(yīng)用于數(shù)據(jù)集成管理平臺,用于監(jiān)控集成的數(shù)據(jù)集成,并根據(jù)識別到的集成異常信息進(jìn)行報警。按照執(zhí)行順序依次為:數(shù)據(jù)集成元數(shù)據(jù)采集、數(shù)據(jù)血緣圖生成以及數(shù)據(jù)血緣異常識別與報警,三個部分。
[0085]其中,數(shù)據(jù)集成元數(shù)據(jù)采集:通過數(shù)據(jù)集成管理平臺手工或自動收集數(shù)據(jù)集成的元數(shù)據(jù),包括傳遞的數(shù)據(jù)(一般以表為單位,對應(yīng)業(yè)務(wù)數(shù)據(jù)實(shí)體),上游數(shù)據(jù)源和下游數(shù)據(jù)源。
[0086]數(shù)據(jù)血緣圖生成:根據(jù)采集的數(shù)據(jù)集成元數(shù)據(jù),按數(shù)據(jù)血緣圖模型組裝成數(shù)據(jù)血緣圖。
[0087]數(shù)據(jù)血緣異常識別與報警:基于生成的數(shù)據(jù)血緣圖,按數(shù)據(jù)血緣異常識別步驟找出異常并報警提示。
[0088]三、數(shù)據(jù)血緣異常識別,請參閱圖4所示,包括如下步驟:
[0089]401:在所有未納入血緣基礎(chǔ)樹的數(shù)據(jù)源中尋找初始源。
[0090]識別規(guī)則:首先找出數(shù)據(jù)源中入度最小的數(shù)據(jù)源,如入度相等,則選數(shù)據(jù)源中入度最小、出度最大,且沒有納入血緣基礎(chǔ)樹的數(shù)據(jù)源作為初始源。
[0091]在步驟401中,異常識別:如存在多個初始源,剛標(biāo)識初始源異常。正常情況下,只允許存在一個初始源。
[0092]異常樣例,如圖5A所示:C數(shù)據(jù)源是識別到的另一個初始源,初始源作為數(shù)據(jù)的首次創(chuàng)建錄入點(diǎn),根據(jù)業(yè)務(wù)規(guī)則,存在兩個及以上的初始源,會引入數(shù)據(jù)不一致性問題或數(shù)據(jù)重復(fù)問題。因此可以標(biāo)識初始源異常。
[0093]402:確定通過401的尋找,是否存在初始源,如沒有識別到的初始源,進(jìn)入步驟404。否則,進(jìn)入403。
[0094]403:以初始源為根節(jié)點(diǎn),生成血緣基礎(chǔ)樹,并識別異常C (數(shù)據(jù)創(chuàng)建點(diǎn))點(diǎn)。
[0095]生成血緣基礎(chǔ)樹規(guī)則:從初始源開始,根據(jù)數(shù)據(jù)治理規(guī)則,采用數(shù)據(jù)傳遞范圍最廣,傳遞路徑最短為最優(yōu)的方式遍歷,即基于數(shù)據(jù)源下游按廣度優(yōu)先算法生成血緣基礎(chǔ)樹。生成血緣基礎(chǔ)樹也是樹形數(shù)據(jù)結(jié)構(gòu)。
[0096]需要說明的是,按照深度優(yōu)先算法生成血緣基礎(chǔ)樹也是可以的,以上按廣度優(yōu)先算法生成血緣基礎(chǔ)樹這一優(yōu)選方案,不應(yīng)理解為對本發(fā)明實(shí)施例的唯一限定。
[0097]在步驟403中,異常識別:遍歷過程中,統(tǒng)計數(shù)據(jù)源C點(diǎn)個數(shù),如C點(diǎn)個數(shù)大于1,則標(biāo)識異常C點(diǎn)。異常樣例:如圖5B所示,多個C點(diǎn)(數(shù)據(jù)創(chuàng)建點(diǎn)),意味著系統(tǒng)存在多個數(shù)據(jù)錄入點(diǎn),會引入數(shù)據(jù)不一致,重復(fù)等問題。
[0098]404:遍歷血緣基礎(chǔ)樹,標(biāo)識異常回路。
[0099]標(biāo)識異常回路規(guī)則:遍歷血緣圖所有有向邊,如不在血緣基礎(chǔ)樹上,則標(biāo)識為異?;芈?。
[0100]在步驟404中,異常識別:異?;芈反頂?shù)據(jù)傳遞過程中的回流,會引入數(shù)據(jù)不一致性問題。異常樣例,如圖5C所示:數(shù)據(jù)從D數(shù)據(jù)源傳遞到B數(shù)據(jù)源時與A傳遞到B數(shù)據(jù)源的數(shù)據(jù)產(chǎn)生沖突,會引入數(shù)據(jù)不一致,重復(fù)問題。
[0101]以上實(shí)施例,將圖形數(shù)據(jù)集的復(fù)雜的網(wǎng)狀結(jié)構(gòu)轉(zhuǎn)換為樹形數(shù)據(jù)結(jié)構(gòu),使數(shù)據(jù)集成后的數(shù)據(jù)關(guān)系更簡潔,樹形數(shù)據(jù)結(jié)構(gòu)更具可讀性,屬于更好的數(shù)據(jù)集成方案,為進(jìn)行影響性分析提供了便利。以上異常識別的方案,能大幅提升中大型企業(yè)數(shù)據(jù)治理、以及數(shù)據(jù)影響性分析的效率和準(zhǔn)確性。結(jié)合自動化工具,能快速、動態(tài)生成展現(xiàn)良好的數(shù)據(jù)血緣圖形,并可自動、準(zhǔn)確識別出相關(guān)的數(shù)據(jù)異常。
[0102]本發(fā)明實(shí)施例還提供了一種數(shù)據(jù)集成的裝置,如圖6所示,包括:
[0103]路徑獲取單元601,用于獲取需要展示的圖形數(shù)據(jù)集的數(shù)據(jù)集成路徑,數(shù)據(jù)集成路徑標(biāo)示了各數(shù)據(jù)之間傳遞的路徑和方向;
[0104]圖形數(shù)據(jù)集是指按照數(shù)據(jù)之間傳遞關(guān)系會組成圖形結(jié)構(gòu)的數(shù)據(jù)集,可以是已經(jīng)組成的圖形數(shù)據(jù)結(jié)構(gòu),例如數(shù)據(jù)血緣圖(也稱為數(shù)據(jù)血緣有向圖)、ER (Equipment Room,設(shè)備間)圖等,如果上述圖形數(shù)據(jù)集為數(shù)據(jù)血緣圖的數(shù)據(jù)集合,上述數(shù)據(jù)集成路徑為數(shù)據(jù)血緣圖中的有向邊??梢岳斫獾氖?,由于數(shù)據(jù)集可以是數(shù)據(jù)血緣圖的數(shù)據(jù)集合,也可以是ER圖中的設(shè)備,那么上述數(shù)據(jù)集應(yīng)理解為廣義的數(shù)據(jù),代表數(shù)據(jù)庫中存儲的數(shù)據(jù),或者,與具體的應(yīng)用系統(tǒng)、實(shí)體設(shè)備等具有對應(yīng)關(guān)系的數(shù)據(jù)。
[0105]度獲取單元602,用于依據(jù)上述路徑獲取單元601獲取的數(shù)據(jù)之間傳遞的路徑和方向,確定各數(shù)據(jù)的入度;
[0106]數(shù)據(jù)集成單元603,用于將入度最小的數(shù)據(jù)作為根節(jié)點(diǎn),將上述圖形數(shù)據(jù)集中的數(shù)據(jù)結(jié)構(gòu)構(gòu)建為樹形數(shù)據(jù)結(jié)構(gòu)。
[0107]以上實(shí)施例,將圖形數(shù)據(jù)集的復(fù)雜的網(wǎng)狀結(jié)構(gòu)轉(zhuǎn)換為樹形數(shù)據(jù)結(jié)構(gòu),使數(shù)據(jù)集成后的數(shù)據(jù)關(guān)系更簡潔,樹形數(shù)據(jù)結(jié)構(gòu)更具可讀性,屬于更好的數(shù)據(jù)集成方案,為進(jìn)行影響性分析提供了便利。
[0108]進(jìn)一步地,由于可能存在多個相同最小入度的數(shù)據(jù),本發(fā)明實(shí)施例還提供了進(jìn)一步的解決方案:如圖7所示,上述裝置,還包括:
[0109]節(jié)點(diǎn)確定單元701,用于確定上述圖形數(shù)據(jù)集的各數(shù)據(jù)是否包含在上述數(shù)據(jù)集成單元603建立的樹形數(shù)據(jù)結(jié)構(gòu)中;
[0110]上述度獲取單元602,還用于依據(jù)數(shù)據(jù)之間傳遞的路徑和方向,確定各數(shù)據(jù)的出度;
[0111]上述數(shù)據(jù)集成單元603,具體用于將入度最小的數(shù)據(jù)作為根節(jié)點(diǎn),若最小入度的數(shù)據(jù)有兩個或兩個以上,則將上述兩個或兩個以上的數(shù)據(jù)中出度最大且未包含在樹形數(shù)據(jù)結(jié)構(gòu)中的數(shù)據(jù)作為根節(jié)點(diǎn)。
[0112]可選地,上述數(shù)據(jù)集成單元603,具體用于按照廣度優(yōu)先算法遍歷上述圖形數(shù)據(jù)集中的數(shù)據(jù),得到樹形數(shù)據(jù)結(jié)構(gòu)。
[0113]需要說明的是,按照深度優(yōu)先算法生成血緣基礎(chǔ)樹也是可以的,以上按廣度優(yōu)先算法生成血緣基礎(chǔ)樹這一優(yōu)選方案,不應(yīng)理解為對本發(fā)明實(shí)施例的唯一限定。
[0114]進(jìn)一步地,本發(fā)明實(shí)施還提供了標(biāo)識異常的方案,如下:如圖8所示,上述裝置,還包括:
[0115]異常標(biāo)識單元801,用于執(zhí)行以下至少之一:若存在兩個或兩個以上的根節(jié)點(diǎn),則標(biāo)識初源異常;若上述圖形數(shù)據(jù)集中存在兩個或兩個以上的數(shù)據(jù)為數(shù)據(jù)創(chuàng)建點(diǎn),則將上述數(shù)據(jù)創(chuàng)建點(diǎn)標(biāo)識為異常;若數(shù)據(jù)集成路徑不在上述樹形數(shù)據(jù)結(jié)構(gòu)中,則將不在樹形數(shù)據(jù)結(jié)構(gòu)中的數(shù)據(jù)集成路徑標(biāo)識為異常。
[0116]以上異常識別的方案,能大幅提升中大型企業(yè)數(shù)據(jù)治理、以及數(shù)據(jù)影響性分析的效率和準(zhǔn)確性。結(jié)合自動化工具,能快速、動態(tài)生成展現(xiàn)良好的數(shù)據(jù)血緣圖形,并可自動、準(zhǔn)確識別出相關(guān)的數(shù)據(jù)異常。
[0117]可選地,上述路徑獲取單元601,具體用于獲取需要展示的數(shù)據(jù)血緣圖的有向邊,上述有向邊標(biāo)示了各數(shù)據(jù)之間傳遞的路徑和方向。
[0118]本發(fā)明實(shí)施例還提供了一種設(shè)備,如圖9所示,該設(shè)備可以用于數(shù)據(jù)集成的實(shí)現(xiàn),包括:接收設(shè)備901、發(fā)送設(shè)備902、存儲設(shè)備903以及處理器904 ;
[0119]其中,處理器904,用于獲取需要展示的圖形數(shù)據(jù)集的數(shù)據(jù)集成路徑,數(shù)據(jù)集成路徑標(biāo)示了各數(shù)據(jù)之間傳遞的路徑和方向;依據(jù)數(shù)據(jù)之間傳遞的路徑和方向,確定各數(shù)據(jù)的入度;將入度最小的數(shù)據(jù)作為根節(jié)點(diǎn),將上述圖形數(shù)據(jù)集中的數(shù)據(jù)結(jié)構(gòu)構(gòu)建為樹形數(shù)據(jù)結(jié)構(gòu)。
[0120]圖形數(shù)據(jù)集可以是存儲在存儲設(shè)備903,也可以通過接收設(shè)備901接收得到。最終的樹形數(shù)據(jù)結(jié)構(gòu)可以存儲在存儲設(shè)備903,也可以通過發(fā)送設(shè)備902發(fā)送到其它設(shè)備。本發(fā)明實(shí)施例對此不予限定。
[0121]以上實(shí)施例,將圖形數(shù)據(jù)集的復(fù)雜的網(wǎng)狀結(jié)構(gòu)轉(zhuǎn)換為樹形數(shù)據(jù)結(jié)構(gòu),使數(shù)據(jù)集成后的數(shù)據(jù)關(guān)系更簡潔,樹形數(shù)據(jù)結(jié)構(gòu)更具可讀性,屬于更好的數(shù)據(jù)集成方案,為進(jìn)行影響性分析提供了便利。
[0122]進(jìn)一步地,由于可能存在多個相同最小入度的數(shù)據(jù),本發(fā)明實(shí)施例還提供了進(jìn)一步的解決方案:上述處理器904,還用于依據(jù)數(shù)據(jù)之間傳遞的路徑和方向,確定各數(shù)據(jù)的出度;并確定上述圖形數(shù)據(jù)集的各數(shù)據(jù)是否包含在樹形數(shù)據(jù)結(jié)構(gòu)中;
[0123]上述將入度最小的數(shù)據(jù)作為根節(jié)點(diǎn)包括:將入度最小的數(shù)據(jù)作為根節(jié)點(diǎn),若最小入度的數(shù)據(jù)有兩個或兩個以上,則將上述兩個或兩個以上的數(shù)據(jù)中出度最大且未包含在樹形數(shù)據(jù)結(jié)構(gòu)中的數(shù)據(jù)作為根節(jié)點(diǎn)。
[0124]優(yōu)選地,上述處理器904,用于按照廣度優(yōu)先算法遍歷上述圖形數(shù)據(jù)集中的數(shù)據(jù),得到樹形數(shù)據(jù)結(jié)構(gòu)。
[0125]需要說明的是,按照深度優(yōu)先算法生成血緣基礎(chǔ)樹也是可以的,以上按廣度優(yōu)先算法生成血緣基礎(chǔ)樹這一優(yōu)選方案,不應(yīng)理解為對本發(fā)明實(shí)施例的唯一限定。
[0126]進(jìn)一步地,本發(fā)明實(shí)施還提供了標(biāo)識異常的方案,如下:上述處理器904,還用于執(zhí)行以下至少一項(xiàng):若存在兩個或兩個以上的根節(jié)點(diǎn),則標(biāo)識初源異常;若上述圖形數(shù)據(jù)集中存在兩個或兩個以上的數(shù)據(jù)為數(shù)據(jù)創(chuàng)建點(diǎn),則將上述數(shù)據(jù)創(chuàng)建點(diǎn)標(biāo)識為異常;若數(shù)據(jù)集成路徑不在上述樹形數(shù)據(jù)結(jié)構(gòu)中,則將不在樹形數(shù)據(jù)結(jié)構(gòu)中的數(shù)據(jù)集成路徑標(biāo)識為異堂巾O
[0127]以上異常識別的方案,能大幅提升中大型企業(yè)數(shù)據(jù)治理、以及數(shù)據(jù)影響性分析的效率和準(zhǔn)確性。結(jié)合自動化工具,能快速、動態(tài)生成展現(xiàn)良好的數(shù)據(jù)血緣圖形,并可自動、準(zhǔn)確識別出相關(guān)的數(shù)據(jù)異常。
[0128]可選地,上述處理器904,具體用于獲取需要展示的數(shù)據(jù)血緣圖的有向邊,上述有向邊標(biāo)示了各數(shù)據(jù)之間傳遞的路徑和方向。
[0129]本發(fā)明實(shí)施例還提供了另一種數(shù)據(jù)集成裝置,如圖10所示,為了便于說明,僅示出了與本發(fā)明實(shí)施例相關(guān)的部分,具體技術(shù)細(xì)節(jié)未揭示的,請參照本發(fā)明實(shí)施例方法部分。該裝置可以是終端設(shè)備,例如:是手機(jī)、平板電腦、PDA(Personal Digital Assistant,個人數(shù)字助理)、POS (Point of Sales,銷售終端)、車載電腦等任意終端設(shè)備,還可以是服務(wù)器等。以終端設(shè)備為例:
[0130]圖10示出的是與本發(fā)明實(shí)施例提供的終端設(shè)備相關(guān)的部分結(jié)構(gòu)的框圖。參考圖10,終端設(shè)備包括:射頻(Rad1 Frequency, RF)電路1010、存儲器1020、輸入單元1030、顯示單元1040、傳感器1050、音頻電路1060、無線保真(wireless fidelity,WiFi)模塊1070、處理器1080、以及電源1090等部件。本領(lǐng)域技術(shù)人員可以理解,圖10中示出的終端設(shè)備結(jié)構(gòu)并不構(gòu)成對終端設(shè)備的限定,可以包括比圖示更多或更少的部件,或者組合某些部件,或者不同的部件布置。
[0131]下面結(jié)合圖10對終端設(shè)備的各個構(gòu)成部件進(jìn)行具體的介紹:
[0132]RF電路1010可用于收發(fā)信息或通話過程中,信號的接收和發(fā)送,特別地,將基站的下行信息接收后,給處理器1080處理;另外,將設(shè)計上行的數(shù)據(jù)發(fā)送給基站。通常,RF電路包括但不限于天線、至少一個放大器、收發(fā)信機(jī)、耦合器、低噪聲放大器(Low NoiseAmplifier, LNA)、雙工器等。此外,RF電路100還可以通過無線通信與網(wǎng)絡(luò)和其他設(shè)備通信。上述無線通信可以使用任一通信標(biāo)準(zhǔn)或協(xié)議,包括但不限于全球移動通訊系統(tǒng)(Global System of Mobile communicat1n, GSM)、通用分組無線服務(wù)(General PacketRad1 Service, GPRS)、碼分多址(Code Divis1n Multiple Access, CDMA)、寬帶碼分多址(Wideband Code Divis1n Multiple Access, WCDMA)、長期演進(jìn)(Long Term Evolut1n,LTE)、電子郵件、短消息服務(wù)(Short Messaging Service, SMS)等。
[0133]存儲器1020可用于存儲軟件程序以及模塊,處理器1080通過運(yùn)行存儲在存儲器1020的軟件程序以及模塊,從而執(zhí)行終端設(shè)備的各種功能應(yīng)用以及數(shù)據(jù)處理。存儲器1020可主要包括存儲程序區(qū)和存儲數(shù)據(jù)區(qū),其中,存儲程序區(qū)可存儲操作系統(tǒng)、至少一個功能所需的應(yīng)用程序(比如聲音播放功能、圖像播放功能等)等;存儲數(shù)據(jù)區(qū)可存儲根據(jù)終端設(shè)備的使用所創(chuàng)建的數(shù)據(jù)(比如音頻數(shù)據(jù)、電話本等)等。此外,存儲器1020可以包括高速隨機(jī)存取存儲器,還可以包括非易失性存儲器,例如至少一個磁盤存儲器件、閃存器件、或其他易失性固態(tài)存儲器件。
[0134]輸入單元1030可用于接收輸入的數(shù)字或字符信息,以及產(chǎn)生與終端設(shè)備1000的用戶設(shè)置以及功能控制有關(guān)的鍵信號輸入。具體地,輸入單元1030可包括觸控面板1031以及其他輸入設(shè)備1032。觸控面板1031,也稱為觸摸屏,可收集用戶在其上或附近的觸摸操作(比如用戶使用手指、觸筆等任何適合的物體或附件在觸控面板1031上或在觸控面板1031附近的操作),并根據(jù)預(yù)先設(shè)定的程式驅(qū)動相應(yīng)的連接裝置??蛇x的,觸控面板1031可包括觸摸檢測裝置和觸摸控制器兩個部分。其中,觸摸檢測裝置檢測用戶的觸摸方位,并檢測觸摸操作帶來的信號,將信號傳送給觸摸控制器;觸摸控制器從觸摸檢測裝置上接收觸摸信息,并將它轉(zhuǎn)換成觸點(diǎn)坐標(biāo),再送給處理器1080,并能接收處理器1080發(fā)來的命令并加以執(zhí)行。此外,可以采用電阻式、電容式、紅外線以及表面聲波等多種類型實(shí)現(xiàn)觸控面板1031。除了觸控面板1031,輸入單元1030還可以包括其他輸入設(shè)備1032。具體地,其他輸入設(shè)備1032可以包括但不限于物理鍵盤、功能鍵(比如音量控制按鍵、開關(guān)按鍵等)、軌跡球、鼠標(biāo)、操作桿等中的一種或多種。
[0135]顯示單元1040可用于顯示由用戶輸入的信息或提供給用戶的信息以及終端設(shè)備的各種菜單。顯示單元1040可包括顯示面板1041,可選的,可以采用液晶顯示器(LiquidCrystal Display, LCD)、有機(jī)發(fā)光二極管(Organic Light-Emitting D1de, 0LED)等形式來配置顯示面板1041。進(jìn)一步的,觸控面板1031可覆蓋顯示面板1041,當(dāng)觸控面板1031檢測到在其上或附近的觸摸操作后,傳送給處理器1080以確定觸摸事件的類型,隨后處理器1080根據(jù)觸摸事件的類型在顯示面板1041上提供相應(yīng)的視覺輸出。雖然在圖10中,觸控面板1031與顯示面板1041是作為兩個獨(dú)立的部件來實(shí)現(xiàn)終端設(shè)備的輸入和輸入功能,但是在某些實(shí)施例中,可以將觸控面板1031與顯示面板1041集成而實(shí)現(xiàn)終端設(shè)備的輸入和輸出功能。
[0136]終端設(shè)備1000還可包括至少一種傳感器1050,比如光傳感器、運(yùn)動傳感器以及其他傳感器。具體地,光傳感器可包括環(huán)境光傳感器及接近傳感器,其中,環(huán)境光傳感器可根據(jù)環(huán)境光線的明暗來調(diào)節(jié)顯示面板1041的亮度,接近傳感器可在終端設(shè)備移動到耳邊時,關(guān)閉顯示面板1041和/或背光。作為運(yùn)動傳感器的一種,加速計傳感器可檢測各個方向上(一般為三軸)加速度的大小,靜止時可檢測出重力的大小及方向,可用于識別終端設(shè)備姿態(tài)的應(yīng)用(比如橫豎屏切換、相關(guān)游戲、磁力計姿態(tài)校準(zhǔn))、振動識別相關(guān)功能(比如計步器、敲擊)等;至于終端設(shè)備還可配置的陀螺儀、氣壓計、濕度計、溫度計、紅外線傳感器等其他傳感器,在此不再贅述。
[0137]音頻電路1060、揚(yáng)聲器1061,傳聲器1062可提供用戶與終端設(shè)備之間的音頻接口。音頻電路1060可將接收到的音頻數(shù)據(jù)轉(zhuǎn)換后的電信號,傳輸?shù)綋P(yáng)聲器1061,由揚(yáng)聲器1061轉(zhuǎn)換為聲音信號輸出;另一方面,傳聲器1062將收集的聲音信號轉(zhuǎn)換為電信號,由音頻電路1060接收后轉(zhuǎn)換為音頻數(shù)據(jù),再將音頻數(shù)據(jù)輸出處理器1080處理后,經(jīng)RF電路1010以發(fā)送給比如另一終端設(shè)備,或者將音頻數(shù)據(jù)輸出至存儲器1020以便進(jìn)一步處理。
[0138]WiFi屬于短距離無線傳輸技術(shù),終端設(shè)備通過WiFi模塊1070可以幫助用戶收發(fā)電子郵件、瀏覽網(wǎng)頁和訪問流式媒體等,它為用戶提供了無線的寬帶互聯(lián)網(wǎng)訪問。雖然圖10示出了 WiFi模塊1070,但是可以理解的是,其并不屬于終端設(shè)備1000的必須構(gòu)成,完全可以根據(jù)需要在不改變發(fā)明的本質(zhì)的范圍內(nèi)而省略。
[0139]處理器1080是終端設(shè)備的控制中心,利用各種接口和線路連接整個終端設(shè)備的各個部分,通過運(yùn)行或執(zhí)行存儲在存儲器1020內(nèi)的軟件程序和/或模塊,以及調(diào)用存儲在存儲器1020內(nèi)的數(shù)據(jù),執(zhí)行終端設(shè)備的各種功能和處理數(shù)據(jù),從而對終端設(shè)備進(jìn)行整體監(jiān)控??蛇x的,處理器1080可包括一個或多個處理單元;優(yōu)選的,處理器1080可集成應(yīng)用處理器和調(diào)制解調(diào)處理器,其中,應(yīng)用處理器主要處理操作系統(tǒng)、用戶界面和應(yīng)用程序等,調(diào)制解調(diào)處理器主要處理無線通信??梢岳斫獾氖牵鲜稣{(diào)制解調(diào)處理器也可以不集成到處理器1080中。
[0140]終端設(shè)備1000還包括給各個部件供電的電源1090 (比如電池),優(yōu)選的,電源可以通過電源管理系統(tǒng)與處理器1080邏輯相連,從而通過電源管理系統(tǒng)實(shí)現(xiàn)管理充電、放電、以及功耗管理等功能。
[0141]盡管未示出,終端設(shè)備1000還可以包括攝像頭、藍(lán)牙模塊等,在此不再贅述。
[0142]在本發(fā)明實(shí)施例中,該終端所包括的處理器1080還具有以下功能:
[0143]其中,處理器1080,用于獲取需要展示的圖形數(shù)據(jù)集的數(shù)據(jù)集成路徑,數(shù)據(jù)集成路徑標(biāo)示了各數(shù)據(jù)之間傳遞的路徑和方向;依據(jù)數(shù)據(jù)之間傳遞的路徑和方向,確定各數(shù)據(jù)的入度;將入度最小的數(shù)據(jù)作為根節(jié)點(diǎn),將上述圖形數(shù)據(jù)集中的數(shù)據(jù)結(jié)構(gòu)構(gòu)建為樹形數(shù)據(jù)結(jié)構(gòu)。
[0144]以上實(shí)施例,將圖形數(shù)據(jù)集的復(fù)雜的網(wǎng)狀結(jié)構(gòu)轉(zhuǎn)換為樹形數(shù)據(jù)結(jié)構(gòu),使數(shù)據(jù)集成后的數(shù)據(jù)關(guān)系更簡潔,樹形數(shù)據(jù)結(jié)構(gòu)更具可讀性,屬于更好的數(shù)據(jù)集成方案,為進(jìn)行影響性分析提供了便利。
[0145]進(jìn)一步地,由于可能存在多個相同最小入度的數(shù)據(jù),本發(fā)明實(shí)施例還提供了進(jìn)一步的解決方案:上述處理器1080,還用于依據(jù)數(shù)據(jù)之間傳遞的路徑和方向,確定各數(shù)據(jù)的出度;并確定上述圖形數(shù)據(jù)集的各數(shù)據(jù)是否包含在樹形數(shù)據(jù)結(jié)構(gòu)中;
[0146]上述將入度最小的數(shù)據(jù)作為根節(jié)點(diǎn)包括:將入度最小的數(shù)據(jù)作為根節(jié)點(diǎn),若最小入度的數(shù)據(jù)有兩個或兩個以上,則將上述兩個或兩個以上的數(shù)據(jù)中出度最大且未包含在樹形數(shù)據(jù)結(jié)構(gòu)中的數(shù)據(jù)作為根節(jié)點(diǎn)。
[0147]優(yōu)選地,上述處理器1080,用于按照廣度優(yōu)先算法遍歷上述圖形數(shù)據(jù)集中的數(shù)據(jù),得到樹形數(shù)據(jù)結(jié)構(gòu)。
[0148]需要說明的是,按照深度優(yōu)先算法生成血緣基礎(chǔ)樹也是可以的,以上按廣度優(yōu)先算法生成血緣基礎(chǔ)樹這一優(yōu)選方案,不應(yīng)理解為對本發(fā)明實(shí)施例的唯一限定。
[0149]進(jìn)一步地,本發(fā)明實(shí)施還提供了標(biāo)識異常的方案,如下:上述處理器1080,還用于執(zhí)行以下至少一項(xiàng):若存在兩個或兩個以上的根節(jié)點(diǎn),則標(biāo)識初源異常;若上述圖形數(shù)據(jù)集中存在兩個或兩個以上的數(shù)據(jù)為數(shù)據(jù)創(chuàng)建點(diǎn),則將上述數(shù)據(jù)創(chuàng)建點(diǎn)標(biāo)識為異常;若數(shù)據(jù)集成路徑不在上述樹形數(shù)據(jù)結(jié)構(gòu)中,則將不在樹形數(shù)據(jù)結(jié)構(gòu)中的數(shù)據(jù)集成路徑標(biāo)識為異堂巾O
[0150]以上異常識別的方案,能大幅提升中大型企業(yè)數(shù)據(jù)治理、以及數(shù)據(jù)影響性分析的效率和準(zhǔn)確性。結(jié)合自動化工具,能快速、動態(tài)生成展現(xiàn)良好的數(shù)據(jù)血緣圖形,并可自動、準(zhǔn)確識別出相關(guān)的數(shù)據(jù)異常。
[0151]可選地,上述處理器1080,具體用于獲取需要展示的數(shù)據(jù)血緣圖的有向邊,上述有向邊標(biāo)示了各數(shù)據(jù)之間傳遞的路徑和方向。
[0152]值得注意的是,上述裝置和設(shè)備實(shí)施例中,所包括的各個單元只是按照功能邏輯進(jìn)行劃分的,但并不局限于上述的劃分,只要能夠?qū)崿F(xiàn)相應(yīng)的功能即可;另外,各功能單元的具體名稱也只是為了便于相互區(qū)分,并不用于限制本發(fā)明的保護(hù)范圍。
[0153]另外,本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述各方法實(shí)施例中的全部或部分步驟是可以通過程序來指令相關(guān)的硬件完成,相應(yīng)的程序可以存儲于一種計算機(jī)可讀存儲介質(zhì)中,上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。
[0154]以上僅為本發(fā)明較佳的【具體實(shí)施方式】,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本【技術(shù)領(lǐng)域】的技術(shù)人員在本發(fā)明實(shí)施例揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)該以權(quán)利要求的保護(hù)范圍為準(zhǔn)。
【權(quán)利要求】
1.一種數(shù)據(jù)集成的方法,其特征在于,包括: 獲取需要展示的圖形數(shù)據(jù)集的數(shù)據(jù)集成路徑,數(shù)據(jù)集成路徑標(biāo)示了各數(shù)據(jù)之間傳遞的路徑和方向; 依據(jù)數(shù)據(jù)之間傳遞的路徑和方向,確定各數(shù)據(jù)的入度; 將入度最小的數(shù)據(jù)作為根節(jié)點(diǎn),將所述圖形數(shù)據(jù)集中的數(shù)據(jù)結(jié)構(gòu)構(gòu)建為樹形數(shù)據(jù)結(jié)構(gòu)。
2.根據(jù)權(quán)利要求1所述方法,其特征在于,還包括: 依據(jù)數(shù)據(jù)之間傳遞的路徑和方向,確定各數(shù)據(jù)的出度;并確定所述圖形數(shù)據(jù)集的各數(shù)據(jù)是否包含在樹形數(shù)據(jù)結(jié)構(gòu)中; 所述將入度最小的數(shù)據(jù)作為根節(jié)點(diǎn)包括: 將入度最小的數(shù)據(jù)作為根節(jié)點(diǎn),若最小入度的數(shù)據(jù)有兩個或兩個以上,則將所述兩個或兩個以上的數(shù)據(jù)中出度最大且未包含在樹形數(shù)據(jù)結(jié)構(gòu)中的數(shù)據(jù)作為根節(jié)點(diǎn)。
3.根據(jù)權(quán)利要求1或2所述方法,其特征在于,所述將所述圖形數(shù)據(jù)集中的數(shù)據(jù)構(gòu)建為樹形數(shù)據(jù)結(jié)構(gòu)包括: 按照廣度優(yōu)先算法遍歷所述圖形數(shù)據(jù)集中的數(shù)據(jù),得到樹形數(shù)據(jù)結(jié)構(gòu)。
4.根據(jù)權(quán)利要求1或2所述方法,其特征在于,還包括以下至少之一: 若存在兩個或兩個以上的根節(jié)點(diǎn),則標(biāo)識初源異常; 若所述圖形數(shù)據(jù)集中存在兩個或兩個以上的數(shù)據(jù)為數(shù)據(jù)創(chuàng)建點(diǎn),則將所述數(shù)據(jù)創(chuàng)建點(diǎn)標(biāo)識為異常; 若數(shù)據(jù)集成路徑不在所述樹形數(shù)據(jù)結(jié)構(gòu)中,則將不在樹形數(shù)據(jù)結(jié)構(gòu)中的數(shù)據(jù)集成路徑標(biāo)識為異常。
5.根據(jù)權(quán)利要求1或2所述方法,其特征在于,所述圖形數(shù)據(jù)集包括:數(shù)據(jù)血緣圖的數(shù)據(jù)集合,所述數(shù)據(jù)集成路徑為數(shù)據(jù)血緣圖中的有向邊。
6.一種數(shù)據(jù)集成的裝置,其特征在于,包括: 路徑獲取單元,用于獲取需要展示的圖形數(shù)據(jù)集的數(shù)據(jù)集成路徑,數(shù)據(jù)集成路徑標(biāo)示了各數(shù)據(jù)之間傳遞的路徑和方向; 度獲取單元,用于依據(jù)所述路徑獲取單元獲取的數(shù)據(jù)之間傳遞的路徑和方向,確定各數(shù)據(jù)的入度; 數(shù)據(jù)集成單元,用于將入度最小的數(shù)據(jù)作為根節(jié)點(diǎn),將所述圖形數(shù)據(jù)集中的數(shù)據(jù)結(jié)構(gòu)構(gòu)建為樹形數(shù)據(jù)結(jié)構(gòu)。
7.根據(jù)權(quán)利要求6所述裝置,其特征在于,還包括: 節(jié)點(diǎn)確定單元,用于確定所述圖形數(shù)據(jù)集的各數(shù)據(jù)是否包含在所述數(shù)據(jù)集成單元建立的樹形數(shù)據(jù)結(jié)構(gòu)中; 所述度獲取單元,還用于依據(jù)數(shù)據(jù)之間傳遞的路徑和方向,確定各數(shù)據(jù)的出度; 所述數(shù)據(jù)集成單元,具體用于將入度最小的數(shù)據(jù)作為根節(jié)點(diǎn),若最小入度的數(shù)據(jù)有兩個或兩個以上,則將所述兩個或兩個以上的數(shù)據(jù)中出度最大且未包含在樹形數(shù)據(jù)結(jié)構(gòu)中的數(shù)據(jù)作為根節(jié)點(diǎn)。
8.根據(jù)權(quán)利要求6或7所述裝置,其特征在于, 所述數(shù)據(jù)集成單元,具體用于按照廣度優(yōu)先算法遍歷所述圖形數(shù)據(jù)集中的數(shù)據(jù),得到樹形數(shù)據(jù)結(jié)構(gòu)。
9.根據(jù)權(quán)利要求6或7所述裝置,其特征在于,還包括: 異常標(biāo)識單元,用于執(zhí)行以下至少之一:若存在兩個或兩個以上的根節(jié)點(diǎn),則標(biāo)識初源異常;若所述圖形數(shù)據(jù)集中存在兩個或兩個以上的數(shù)據(jù)為數(shù)據(jù)創(chuàng)建點(diǎn),則將所述數(shù)據(jù)創(chuàng)建點(diǎn)標(biāo)識為異常;若數(shù)據(jù)集成路徑不在所述樹形數(shù)據(jù)結(jié)構(gòu)中,則將不在樹形數(shù)據(jù)結(jié)構(gòu)中的數(shù)據(jù)集成路徑標(biāo)識為異常。
10.根據(jù)權(quán)利要求6或7所述裝置,其特征在于, 所述路徑獲取單元,具體用于獲取需要展示的數(shù)據(jù)血緣圖的有向邊,所述有向邊標(biāo)示了各數(shù)據(jù)之間傳遞的路徑和方向。
【文檔編號】G06F17/30GK104346367SQ201310326760
【公開日】2015年2月11日 申請日期:2013年7月30日 優(yōu)先權(quán)日:2013年7月30日
【發(fā)明者】賀日坤, 鐘蔚揚(yáng), 熊偉 申請人:華為技術(shù)有限公司