一種便于一次性獲取信息的非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)方法
【專利摘要】本發(fā)明涉及數(shù)據(jù)存儲(chǔ)【技術(shù)領(lǐng)域】,特別涉及一種便于一次性獲取信息的非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)方法。本發(fā)明利用可描述型的非關(guān)系型數(shù)據(jù)來存儲(chǔ)數(shù)據(jù);數(shù)據(jù)存儲(chǔ)上選取分布式存儲(chǔ)的方式,利用分布式存儲(chǔ)比傳統(tǒng)的數(shù)據(jù)庫(kù)存儲(chǔ)更加安全可靠,并且利用分布式計(jì)算,使得數(shù)據(jù)的存儲(chǔ)和查詢的速度也明顯好于傳統(tǒng)的數(shù)據(jù)庫(kù)存儲(chǔ)方式,其大幅度提高了大量數(shù)據(jù)的查詢速度。
【專利說明】一種便于一次性獲取信息的非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)據(jù)存儲(chǔ)【技術(shù)領(lǐng)域】,特別涉及一種便于一次性獲取信息的非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)方法。
【背景技術(shù)】
[0002]在數(shù)據(jù)信息匯總展示時(shí),往往含有大量的信息,比如人員信息,不僅僅含有描述性的基本信息,而且還有數(shù)據(jù)量非常大的活動(dòng)軌跡信息;因此,在進(jìn)行信息展示時(shí),如果需要多種數(shù)據(jù)展現(xiàn),利用常規(guī)的數(shù)據(jù)庫(kù)中表存儲(chǔ)的方式,分別去不同表中查詢,根本無法滿足展現(xiàn)頁面加載速度的要求,甚至?xí)ㄋ垃F(xiàn)象。
【發(fā)明內(nèi)容】
[0003]為了解決現(xiàn)有技術(shù)的問題,本發(fā)明提供了一種便于一次性獲取信息的非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)方,其能夠?qū)⑿畔⑻崆敖M織好,使用時(shí)直接獲取,大大提高了效率。
[0004]本發(fā)明所采用的技術(shù)方案如下:
一種便于一次性獲取信息的非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)方法,其特征在于建立非關(guān)系型的檔案數(shù)據(jù),即在在獲取數(shù)據(jù)時(shí),對(duì)數(shù)據(jù)進(jìn)行整理和加工,根據(jù)唯一標(biāo)識(shí)查找檔案信息;已有檔案的話獲取該檔案添加新獲取數(shù)據(jù),沒有檔案的根據(jù)獲取的數(shù)據(jù)生成檔案,并保存檔案。
[0005]建立非關(guān)系型的檔案數(shù)據(jù)是指在數(shù)據(jù)獲取過程中,將數(shù)據(jù)按照業(yè)務(wù)關(guān)聯(lián)性進(jìn)行整合,形成適合整體描述的非關(guān)系型的數(shù)據(jù)。
[0006]在數(shù)據(jù)的存儲(chǔ)上,利用云計(jì)算的分布式存儲(chǔ)方式。
[0007]存儲(chǔ)數(shù)據(jù)格式為XML文件;數(shù)據(jù)存儲(chǔ)工具用hbase。
[0008]本發(fā)明的核心是建立非關(guān)系型的檔案數(shù)據(jù)。以人員信息為例,在獲取數(shù)據(jù)時(shí),對(duì)數(shù)據(jù)進(jìn)行整理和加工,根據(jù)身份證(唯一標(biāo)識(shí))查找檔案信息;已有檔案的話獲取該檔案添加新獲取數(shù)據(jù),沒有檔案的根據(jù)獲取的數(shù)據(jù)生成檔案,并保存檔案。完成建檔后,在調(diào)用檔案時(shí)可直接查詢到檔案,無需像關(guān)系型數(shù)據(jù)存儲(chǔ)那樣,分別去多個(gè)表中查詢,大大提高了查詢效率。
[0009]本發(fā)明的存儲(chǔ)數(shù)據(jù)格式為XML文件;XML較為大眾,解析方便、快速。本發(fā)明在數(shù)據(jù)存儲(chǔ)工具上用hbase,采用hbase存儲(chǔ)有以下幾個(gè)優(yōu)勢(shì):
UHbase為分布式計(jì)算,提高了數(shù)據(jù)的查詢速度;
2、Hbase可根據(jù)數(shù)據(jù)量的增大,動(dòng)態(tài)擴(kuò)展節(jié)點(diǎn)來增加存儲(chǔ)量;
3、Hbase可以存儲(chǔ)像XML這樣的非結(jié)構(gòu)化的數(shù)據(jù)。
[0010]本發(fā)明提供的技術(shù)方案帶來的有益效果是:
本發(fā)明利用可描述型的非關(guān)系型數(shù)據(jù)來存儲(chǔ)數(shù)據(jù);數(shù)據(jù)存儲(chǔ)上選取分布式存儲(chǔ)的方式,利用分布式存儲(chǔ)比傳統(tǒng)的數(shù)據(jù)庫(kù)存儲(chǔ)更加安全可靠,并且利用分布式計(jì)算,使得數(shù)據(jù)的存儲(chǔ)和查詢的速度也明顯好于傳統(tǒng)的數(shù)據(jù)庫(kù)存儲(chǔ)方式,其大幅度提高了大量數(shù)據(jù)的查詢速度,以人員信息為例,利用本發(fā)明的方法存儲(chǔ)數(shù)據(jù),在億級(jí)數(shù)量中查詢所需要的數(shù)據(jù)耗時(shí)小于十毫秒。
【具體實(shí)施方式】
[0011]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合實(shí)施方式作進(jìn)一步地詳細(xì)描述。
[0012]實(shí)施例一
本實(shí)施例的一種便于一次性獲取信息的非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)方法,是建立非關(guān)系型的檔案數(shù)據(jù),即在在獲取數(shù)據(jù)時(shí),對(duì)數(shù)據(jù)進(jìn)行整理和加工,根據(jù)唯一標(biāo)識(shí)查找檔案信息;已有檔案的話獲取該檔案添加新獲取數(shù)據(jù),沒有檔案的根據(jù)獲取的數(shù)據(jù)生成檔案,并保存檔案。
[0013]建立非關(guān)系型的檔案數(shù)據(jù)是指在數(shù)據(jù)獲取過程中,將數(shù)據(jù)按照業(yè)務(wù)關(guān)聯(lián)性進(jìn)行整合,形成適合整體描述的非關(guān)系型的數(shù)據(jù)。
[0014]在數(shù)據(jù)的存儲(chǔ)上,利用云計(jì)算的分布式存儲(chǔ)方式。
[0015]存儲(chǔ)數(shù)據(jù)格式為XML文件;數(shù)據(jù)存儲(chǔ)工具用hbase。
[0016]以人員信息為例,在獲取數(shù)據(jù)時(shí)將信息按照身份證號(hào)(唯一標(biāo)示)進(jìn)行數(shù)據(jù)整合形成非關(guān)系型數(shù)據(jù)的人員檔案,在調(diào)用人員信息和展示人員頁面時(shí),無需多表及多數(shù)據(jù)源查詢,只需通過身份證即可調(diào)去相關(guān)人員所有信息,此方法有利于提高獲取信息的查詢速度;在維護(hù)上也方便了信息的統(tǒng)一管理。在數(shù)據(jù)的存儲(chǔ)上,利用云計(jì)算的分布式存儲(chǔ)方式,提高了數(shù)據(jù)的存取速度。
[0017]以上所述僅為本發(fā)明的較佳實(shí)施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種便于一次性獲取信息的非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)方法,其特征在于建立非關(guān)系型的檔案數(shù)據(jù),即在在獲取數(shù)據(jù)時(shí),對(duì)數(shù)據(jù)進(jìn)行整理和加工,根據(jù)唯一標(biāo)識(shí)查找檔案信息;已有檔案的話獲取該檔案添加新獲取數(shù)據(jù),沒有檔案的根據(jù)獲取的數(shù)據(jù)生成檔案,并保存檔案。
2.根據(jù)權(quán)利要求1所述的一種便于一次性獲取信息的非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)方法,其特征在于,所述的建立非關(guān)系型的檔案數(shù)據(jù)是指在數(shù)據(jù)獲取過程中,將數(shù)據(jù)按照業(yè)務(wù)關(guān)聯(lián)性進(jìn)行整合,形成適合整體描述的非關(guān)系型的數(shù)據(jù)。
3.根據(jù)權(quán)利要求1或2所述的一種便于一次性獲取信息的非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)方法,其特征在于,在數(shù)據(jù)的存儲(chǔ)上,利用云計(jì)算的分布式存儲(chǔ)方式。
4.根據(jù)權(quán)利要求1或2所述的一種便于一次性獲取信息的非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)方法,其特征在于,存儲(chǔ)數(shù)據(jù)格式為XML文件;數(shù)據(jù)存儲(chǔ)工具用hbase。
【文檔編號(hào)】G06F17/30GK104391864SQ201410574527
【公開日】2015年3月4日 申請(qǐng)日期:2014年10月24日 優(yōu)先權(quán)日:2014年10月24日
【發(fā)明者】王德強(qiáng), 王偉偉 申請(qǐng)人:浪潮軟件股份有限公司