本發(fā)明涉及醫(yī)療信息化的技術(shù)領(lǐng)域,尤其涉及一種醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲系統(tǒng)及方法。
背景技術(shù):
目前,隨著我國經(jīng)濟持續(xù)穩(wěn)定的發(fā)展和現(xiàn)代科技的日新月異,人們越來越多的關(guān)注自身健康,在滿足日常工作和生活的需求之外,人們也迫切希望通過網(wǎng)絡(luò)或者手機上網(wǎng)就能隨時查看流行病的季節(jié)信息、了解每種疾病下的用藥情況以及針對自身疾病獲得一些個性化的推薦服務(wù)等。對于公共衛(wèi)生機構(gòu),它們希望各個社區(qū)居民的醫(yī)療數(shù)據(jù)能夠自動匯總,并自動對這些數(shù)據(jù)進行統(tǒng)計分析,統(tǒng)計的結(jié)果用來進行流行病的趨勢分析和爆發(fā)預警,從而為制定防治干預計劃提供有力的參考依據(jù)。
隨著國家新醫(yī)改政策的頒布和實施,與健康直接相關(guān)的醫(yī)療行業(yè)開始迅猛發(fā)展,醫(yī)療數(shù)據(jù)越來越趨于高度集中化。在海量醫(yī)療數(shù)據(jù)的訪問上,存在大規(guī)模數(shù)據(jù)統(tǒng)計分析的服務(wù),而且需要盡可能快的查詢響應(yīng)時間。由于醫(yī)療數(shù)據(jù)規(guī)模很大,醫(yī)療數(shù)據(jù)之間具有強關(guān)聯(lián)性,不同類型的用戶對同一數(shù)據(jù)具有不同的觀察視角,從而對醫(yī)療數(shù)據(jù)的存儲模型有很高的要求以應(yīng)付靈活多變的數(shù)據(jù)請求,大規(guī)模數(shù)據(jù)上還存在大量已知的或者未知的數(shù)據(jù)分析需求,查詢的總類多,需要支持各種定制性查詢。由此可見,用戶對查詢醫(yī)療數(shù)據(jù)的要求高,對海量醫(yī)療數(shù)據(jù)的存儲與管理要求就越高,因此現(xiàn)有醫(yī)療數(shù)據(jù)存儲系統(tǒng)簡單地采用傳統(tǒng)數(shù)據(jù)庫、商業(yè)并行數(shù)據(jù)庫或者SQL數(shù)據(jù)庫對海量醫(yī)療數(shù)據(jù)進行存儲已不能滿足實際情況和需求。
技術(shù)實現(xiàn)要素:
本發(fā)明的主要目的在于提供一種醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲系統(tǒng)及方法,旨在解決現(xiàn)有醫(yī)療數(shù)據(jù)存儲系統(tǒng)對海量醫(yī)療數(shù)據(jù)進行分散存儲而影響醫(yī)療數(shù)據(jù)分析處理效率的問題。
為實現(xiàn)上述目的,本發(fā)明提供了一種醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲系統(tǒng),運行于云服務(wù)器中,所述云服務(wù)器通過通信網(wǎng)絡(luò)與多個醫(yī)療數(shù)據(jù)源建立通信連接,并通過數(shù)據(jù)庫連接與大數(shù)據(jù)存儲倉庫連接,該系統(tǒng)包括:
數(shù)據(jù)采集模塊,用于從多個醫(yī)療數(shù)據(jù)源收集每一個患者的原始醫(yī)療數(shù)據(jù);
數(shù)據(jù)清洗模塊,用于對每一個患者的原始醫(yī)療數(shù)據(jù)進行清洗轉(zhuǎn)換處理得到每一個患者的規(guī)范醫(yī)療數(shù)據(jù);
數(shù)據(jù)抽取模塊,用于從每一個患者的規(guī)范醫(yī)療數(shù)據(jù)中抽取每一個患者的身份信息、生命體征數(shù)據(jù)和歷史就診信息,以及根據(jù)每一個患者的身份信息為每一個患者產(chǎn)生一個身份標識號;
數(shù)據(jù)關(guān)聯(lián)模塊,用于將每一個患者的身份標識號與患者各自對應(yīng)的生命體征數(shù)據(jù)進行關(guān)聯(lián)并建立一個患者體征信息表,并將每一個患者的身份標識號與患者各自對應(yīng)的歷史就診信息進行關(guān)聯(lián)并建立一個患者就診信息表;
數(shù)據(jù)存儲模塊,用于將所述患者體征信息表存儲在大數(shù)據(jù)存儲倉庫中的第一分區(qū)數(shù)據(jù)庫中,并將所述患者就診信息表存儲在大數(shù)據(jù)存儲倉庫中的第二分區(qū)數(shù)據(jù)庫中。
優(yōu)選的,所述數(shù)據(jù)采集模塊從多個醫(yī)療數(shù)據(jù)源收集每一個患者的原始醫(yī)療數(shù)據(jù)的方式為:設(shè)定一個定時器腳本的執(zhí)行時間和執(zhí)行周期,以及按照定時器腳本的執(zhí)行時間和執(zhí)行周期從不同的醫(yī)療數(shù)據(jù)源采集每一個患者的原始醫(yī)療數(shù)據(jù)。
優(yōu)選的,所述數(shù)據(jù)清洗模塊對每一個患者的原始醫(yī)療數(shù)據(jù)進行清洗轉(zhuǎn)換處理的方式為:利用ETL數(shù)據(jù)過濾轉(zhuǎn)換組件移除原始醫(yī)療數(shù)據(jù)中無意義的詞,將原始醫(yī)療數(shù)據(jù)中一個詞的不同形式轉(zhuǎn)換為相同形式,以及刪除原始醫(yī)療數(shù)據(jù)中重復的數(shù)據(jù)。
優(yōu)選的,所述患者體征信息表的表頭字段存儲每一個患者的身份標識號,所述患者體征信息表的內(nèi)容字段存儲每一個患者對應(yīng)的生命體征數(shù)據(jù),所述患者就診信息表的表頭字段存儲每一個患者的身份標識號,所述患者體征信息表的內(nèi)容字段存儲每一個患者對應(yīng)的歷史就診信息。
優(yōu)選的,所述生命體征數(shù)據(jù)包括患者的身高數(shù)據(jù)、體重數(shù)據(jù)、血壓數(shù)據(jù)、脈搏數(shù)據(jù)、心率數(shù)據(jù)、血氧數(shù)據(jù)以及血糖數(shù)據(jù),所述歷史就診信息包括患者的歷史就診時間、歷史就診醫(yī)院、歷史就診科室以及歷史電子病歷。
本發(fā)明還提供了一種醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲方法,應(yīng)用于云服務(wù)器中,所述云服務(wù)器通過通信網(wǎng)絡(luò)與多個醫(yī)療數(shù)據(jù)源建立通信連接,并通過數(shù)據(jù)庫連接與大數(shù)據(jù)存儲倉庫連接,所述醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲方法包括步驟:
從多個醫(yī)療數(shù)據(jù)源收集每一個患者的原始醫(yī)療數(shù)據(jù);
對每一個患者的原始醫(yī)療數(shù)據(jù)進行清洗轉(zhuǎn)換處理得到每一個患者的規(guī)范醫(yī)療數(shù)據(jù);
從每一個患者的規(guī)范醫(yī)療數(shù)據(jù)中抽取每一個患者的身份信息、生命體征數(shù)據(jù)和歷史就診信息;
根據(jù)每一個患者的身份信息為每一個患者產(chǎn)生一個身份標識號;
將每一個患者的身份標識號與患者各自對應(yīng)的生命體征數(shù)據(jù)進行關(guān)聯(lián)并建立一個患者體征信息表,并將每一個患者的身份標識號患者各自對應(yīng)的歷史就診信息進行關(guān)聯(lián)并建立一個患者就診信息表;
將所述患者體征信息表存儲在大數(shù)據(jù)存儲倉庫中的第一分區(qū)數(shù)據(jù)庫中,并將所述患者就診信息表存儲在大數(shù)據(jù)存儲倉庫中的第二分區(qū)數(shù)據(jù)庫中。
優(yōu)選的,所述從多個醫(yī)療數(shù)據(jù)源收集每一個患者的原始醫(yī)療數(shù)據(jù)的步驟包括如下步驟:
設(shè)定一個定時器腳本的執(zhí)行時間和執(zhí)行周期;
按照定時器腳本的執(zhí)行時間和執(zhí)行周期從不同的醫(yī)療數(shù)據(jù)源采集每一個患者的原始醫(yī)療數(shù)據(jù)。
優(yōu)選的,所述對每一個患者的原始醫(yī)療數(shù)據(jù)進行清洗轉(zhuǎn)換處理的步驟包括如下步驟:利用ETL數(shù)據(jù)過濾轉(zhuǎn)換組件移除原始醫(yī)療數(shù)據(jù)中無意義的詞;將原始醫(yī)療數(shù)據(jù)中的一個詞的不同形式轉(zhuǎn)換為相同形式;刪除原始醫(yī)療數(shù)據(jù)中重復的數(shù)據(jù)。
優(yōu)選的,所述患者體征信息表的表頭字段存儲每一個患者的身份標識號,所述患者體征信息表的內(nèi)容字段存儲每一個患者對應(yīng)的生命體征數(shù)據(jù),所述患者就診信息表的表頭字段存儲每一個患者的身份標識號,所述患者體征信息表的內(nèi)容字段存儲每一個患者對應(yīng)的歷史就診信息。
優(yōu)選的,所述生命體征數(shù)據(jù)包括患者的身高數(shù)據(jù)、體重數(shù)據(jù)、血壓數(shù)據(jù)、脈搏數(shù)據(jù)、心率數(shù)據(jù)、血氧數(shù)據(jù)以及血糖數(shù)據(jù),所述歷史就診信息包括患者的歷史就診時間、歷史就診醫(yī)院、歷史就診科室以及歷史電子病歷。
相較于現(xiàn)有技術(shù),本發(fā)明所述醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲系統(tǒng)及方法采用上述技術(shù)方案,帶來的技術(shù)效果為:通過采集不同的醫(yī)療數(shù)據(jù)源中的醫(yī)療數(shù)據(jù),并將對醫(yī)療數(shù)據(jù)進行清洗轉(zhuǎn)換處理得到規(guī)范醫(yī)療數(shù)據(jù),從而使得醫(yī)療數(shù)據(jù)采集更加全面、更加準確。此外,將每個患者的身份標識號作為體征信息表與就診信息表之間的關(guān)聯(lián)關(guān)系,并將患者的體征信息表與就診信息表分開存儲在大數(shù)據(jù)存儲倉庫的不同分區(qū)數(shù)據(jù)庫中,減輕了系統(tǒng)負載,提高了數(shù)據(jù)處理效率,避免了訪問醫(yī)療數(shù)據(jù)時產(chǎn)生沖突,加快了對醫(yī)療數(shù)據(jù)的讀取與處理速度,從而能夠提高醫(yī)療服務(wù)水平與患者的滿意度。
附圖說明
圖1是本發(fā)明醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲系統(tǒng)優(yōu)選實施例的架構(gòu)圖;
圖2是本發(fā)明醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲方法優(yōu)選實施例的流程圖。
本發(fā)明目的的實現(xiàn)、功能特點及優(yōu)點將結(jié)合實施例,參照附圖做進一步說明。
具體實施方式
為更進一步闡述本發(fā)明為達成上述目的所采取的技術(shù)手段及功效,以下結(jié)合附圖及優(yōu)選實施例,對本發(fā)明的具體實施方式、結(jié)構(gòu)、特征及其功效進行詳細說明。應(yīng)當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
參考圖1所示,圖1是本發(fā)明醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲系統(tǒng)優(yōu)選實施例的應(yīng)用環(huán)境架構(gòu)示意圖。在本實施例中,所述醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲系統(tǒng)10應(yīng)用并運行于云服務(wù)器1中,所述云服務(wù)器1通過通信網(wǎng)絡(luò)3與多個醫(yī)療數(shù)據(jù)源2(圖1中以兩個為例進行說明)建立通信連接,以及通過數(shù)據(jù)庫連接5與大數(shù)據(jù)存儲倉庫4連接。所述通信網(wǎng)絡(luò)3可以是有線通信網(wǎng)絡(luò)或無線通信網(wǎng)絡(luò)。在本實施例中,所述通信網(wǎng)絡(luò)3優(yōu)選為無線通信網(wǎng)絡(luò),包括但不限于,GSM網(wǎng)絡(luò)、GPRS網(wǎng)絡(luò)、CDMA網(wǎng)絡(luò)、TD-SCDMA網(wǎng)絡(luò)、WiMAX網(wǎng)絡(luò)、TD-LTE網(wǎng)絡(luò)、FDD-LTE網(wǎng)絡(luò)等無線傳輸網(wǎng)絡(luò)。所述數(shù)據(jù)庫連接5可以為一種開放數(shù)據(jù)庫連接(Open Database Connectivity,ODBC)以及Java數(shù)據(jù)庫連接(Java Data Base Connectivity,JDBC)。
所述云服務(wù)器1是一種云平臺或云平臺中的一臺服務(wù)器,通過云服務(wù)器1的數(shù)據(jù)傳輸能力、數(shù)據(jù)存儲能力及數(shù)據(jù)處理能力,可以快速地從不同的醫(yī)療數(shù)據(jù)源2采集到不同的原始醫(yī)療數(shù)據(jù)。所述醫(yī)療數(shù)據(jù)源2存儲有患者的原始醫(yī)療數(shù)據(jù),可以為產(chǎn)生臨床數(shù)據(jù)的醫(yī)院信息系統(tǒng),例如HIS系統(tǒng)、EMR、LIS、PACS系統(tǒng),也可以為體檢中心、私人診所和急救中心等任何適合的臨床業(yè)務(wù)系統(tǒng)。所述大數(shù)據(jù)存儲倉庫4包括第一分區(qū)數(shù)據(jù)庫41以及第二分區(qū)數(shù)據(jù)庫42,第一分區(qū)數(shù)據(jù)庫41用于存儲有患者體征信息表,第二分區(qū)數(shù)據(jù)庫42用于存儲有患者就診信息表。所述患者體征信息表用于存儲從不同醫(yī)療數(shù)據(jù)源2采集的患者的生命體征數(shù)據(jù),所述患者就診信息表用于存儲從不同醫(yī)療數(shù)據(jù)源2采集的患者的歷史就診數(shù)據(jù)。
在本實施例中,所述云服務(wù)器1包括,但不僅限于,醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲系統(tǒng)10、通信單元11、存儲單元12以及處理單元13。所述通信單元11為一種有線通訊接口或者為無線通訊接口,例如,支持GSM、GPRS、WCDMA、CDMA、TD-SCDMA、WiMAX、TD-LTE、FDD-LTE等通訊技術(shù)的通訊接口。所述存儲單元12可以為一種只讀存儲單元ROM,電可擦寫存儲單元EEPROM、快閃存儲單元FLASH或固體硬盤等。所述的處理單元13可以為一種中央處理器(Central Processing Unit,CPU)、微控制器(MCU)、數(shù)據(jù)處理芯片、或者具有數(shù)據(jù)處理功能的信息處理單元。
所述醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲系統(tǒng)10,包括但不僅限于,數(shù)據(jù)采集模塊101、數(shù)據(jù)清洗模塊102、數(shù)據(jù)抽取模塊103、數(shù)據(jù)關(guān)聯(lián)模塊104以及數(shù)據(jù)存儲模塊105。本發(fā)明所稱的模塊是指一種能夠被所述云平臺服務(wù)器1的處理單元13執(zhí)行并且能夠完成固定功能的一系列計算機程序指令段,其存儲在所述云平臺服務(wù)器1的存儲單元12中。
所述數(shù)據(jù)采集模塊101用于從多個不同的醫(yī)療數(shù)據(jù)源2收集每一個患者的原始醫(yī)療數(shù)據(jù)。一般地,患者的原始醫(yī)療數(shù)據(jù)的生成和采集通常來自于醫(yī)院信息系統(tǒng)所產(chǎn)生的臨床數(shù)據(jù),例如HIS系統(tǒng)、EMR、LIS、PACS系統(tǒng),但是隨著物聯(lián)網(wǎng)的發(fā)展,患者的原始醫(yī)療數(shù)據(jù)還可以來自于體檢中心、私人診所和急救中心等任何適合的臨床業(yè)務(wù)系統(tǒng)。具體地,所述數(shù)據(jù)采集模塊101具體用于設(shè)定一個定時器腳本的執(zhí)行時間和執(zhí)行周期,以及按照定時器腳本的執(zhí)行時間和執(zhí)行周期從不同的醫(yī)療數(shù)據(jù)源采集原始醫(yī)療數(shù)據(jù)。
所述數(shù)據(jù)清洗模塊102用于對每一個患者的原始醫(yī)療數(shù)據(jù)進行清洗轉(zhuǎn)換處理得到每一個患者的規(guī)范醫(yī)療數(shù)據(jù)。在本實施例中,由于從不同的醫(yī)療數(shù)據(jù)源2收集上來的原始醫(yī)療數(shù)據(jù)可能有壞數(shù)據(jù)、不合理的數(shù)據(jù)或者是重復的數(shù)據(jù)等,因此數(shù)據(jù)清洗模塊102需要利用ETL(抽取(extract)、轉(zhuǎn)換(transform)、加載(load))數(shù)據(jù)過濾轉(zhuǎn)換組件對所收集的原始醫(yī)療數(shù)據(jù)進行清洗轉(zhuǎn)換處理得到規(guī)范醫(yī)療數(shù)據(jù),從而并保證了醫(yī)療數(shù)據(jù)的準確性,并為醫(yī)療數(shù)據(jù)的存儲節(jié)省了存儲空間。具體地,所述數(shù)據(jù)清洗模塊102對每一個患者的原始醫(yī)療數(shù)據(jù)進行清洗轉(zhuǎn)換處理的方式為:利用ETL數(shù)據(jù)過濾轉(zhuǎn)換組件移除原始醫(yī)療數(shù)據(jù)中無意義的詞,將原始醫(yī)療數(shù)據(jù)中一個詞的不同形式轉(zhuǎn)換為相同形式,以及刪除原始醫(yī)療數(shù)據(jù)中重復的數(shù)據(jù)等處理。
所述數(shù)據(jù)抽取模塊103用于從每一個患者的規(guī)范醫(yī)療數(shù)據(jù)中抽取每一個患者的身份信息、生命體征數(shù)據(jù)和歷史就診信息,以及根據(jù)每一個患者的身份信息為每一個患者產(chǎn)生一個身份標識號(ID)。在本實施例中,所述生命體征數(shù)據(jù)包括患者的身高數(shù)據(jù)、體重數(shù)據(jù)、血壓數(shù)據(jù)、脈搏數(shù)據(jù)、心率數(shù)據(jù)、血氧數(shù)據(jù)、血糖數(shù)據(jù)等數(shù)據(jù)信息。所述歷史就診信息包括患者的歷史就診時間、歷史就診醫(yī)院、歷史就診科室以及歷史電子病歷等數(shù)據(jù)信息。
所述數(shù)據(jù)關(guān)聯(lián)模塊104用于將每一個患者的身份標識號與患者各自對應(yīng)的生命體征數(shù)據(jù)進行關(guān)聯(lián)并建立一個患者體征信息表,并將每一個患者的身份標識號與患者各自對應(yīng)的歷史就診信息進行關(guān)聯(lián)并建立一個患者就診信息表。在本實施例中,所述患者體征信息表的表頭字段存儲每一個患者的身份標識號,所述患者體征信息表的內(nèi)容字段存儲每一個患者對應(yīng)的生命體征數(shù)據(jù),所述患者就診信息表的表頭字段存儲每一個患者的身份標識號,所述患者體征信息表的內(nèi)容字段存儲每一個患者對應(yīng)的歷史就診信息。
所述數(shù)據(jù)存儲模塊105用于將患者體征信息表存儲在大數(shù)據(jù)存儲倉庫4中的第一分區(qū)數(shù)據(jù)庫41中,并將患者就診信息表存儲在大數(shù)據(jù)存儲倉庫4中的第二分區(qū)數(shù)據(jù)庫42中。由于每個患者的身份標識號是唯一,因此將每個患者的身份標識號作為患者體征信息表與患者就診信息表之間的關(guān)聯(lián)關(guān)系,并將患者體征信息表與患者就診信息表分開存儲在大數(shù)據(jù)存儲倉庫4的不同分區(qū)數(shù)據(jù)庫中,避免了訪問醫(yī)療數(shù)據(jù)時產(chǎn)生沖突,加快了對海量醫(yī)療數(shù)據(jù)的讀取與處理速度,從而能夠提高醫(yī)療服務(wù)水平與患者的滿意度。
為實現(xiàn)本發(fā)明目的,本發(fā)明還提供了一種醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲方法。如圖2所示,圖2是本發(fā)明醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲方法優(yōu)選實施例的流程圖。在本實施例中,所述的醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲方法包括如下步驟:
步驟S21,從不同的醫(yī)療數(shù)據(jù)源收集每一個患者的原始醫(yī)療數(shù)據(jù);具體地,數(shù)據(jù)采集模塊101從多個不同的醫(yī)療數(shù)據(jù)源2收集每一個患者的原始醫(yī)療數(shù)據(jù)。一般地,患者的原始醫(yī)療數(shù)據(jù)的生成和采集通常來自于醫(yī)院信息系統(tǒng)所產(chǎn)生的臨床數(shù)據(jù),例如HIS系統(tǒng)、EMR、LIS、PACS系統(tǒng),但是隨著物聯(lián)網(wǎng)的發(fā)展,患者的原始醫(yī)療數(shù)據(jù)還可以來自于體檢中心、私人診所和急救中心等任何適合的臨床業(yè)務(wù)系統(tǒng)。在本實施例中,數(shù)據(jù)采集模塊101對每一個患者的原始醫(yī)療數(shù)據(jù)進行清洗轉(zhuǎn)換處理的步驟包括步驟:設(shè)定一個定時器腳本的執(zhí)行時間和執(zhí)行周期,按照定時器腳本的執(zhí)行時間和執(zhí)行周期從不同的醫(yī)療數(shù)據(jù)源采集原始醫(yī)療數(shù)據(jù)。
步驟S22,對每一個患者的原始醫(yī)療數(shù)據(jù)進行清洗轉(zhuǎn)換處理得到每一個患者的規(guī)范醫(yī)療數(shù)據(jù);具體地,數(shù)據(jù)清洗模塊102對每一個患者的原始醫(yī)療數(shù)據(jù)進行清洗轉(zhuǎn)換處理得到每一個患者的規(guī)范醫(yī)療數(shù)據(jù)。在本實施例中,由于從不同的醫(yī)療數(shù)據(jù)源2收集上來的原始醫(yī)療數(shù)據(jù)可能有壞數(shù)據(jù)、不合理的數(shù)據(jù)或者是重復的數(shù)據(jù)等,因此數(shù)據(jù)清洗模塊102需要利用ETL(抽取(extract)、轉(zhuǎn)換(transform)、加載(load)數(shù)據(jù)過濾轉(zhuǎn)換組件對所收集的原始醫(yī)療數(shù)據(jù)進行清洗轉(zhuǎn)換處理得到規(guī)范醫(yī)療數(shù)據(jù),從而并保證了醫(yī)療數(shù)據(jù)的準確性,并為醫(yī)療數(shù)據(jù)的存儲節(jié)省了存儲空間。具體地,數(shù)據(jù)清洗模塊102對每一個患者的原始醫(yī)療數(shù)據(jù)進行清洗轉(zhuǎn)換處理的步驟包括步驟:利用利用ETL數(shù)據(jù)過濾轉(zhuǎn)換組件移除原始醫(yī)療數(shù)據(jù)中無意義的詞,將原始醫(yī)療數(shù)據(jù)中一個詞的不同形式轉(zhuǎn)換為相同形式,以及刪除原始醫(yī)療數(shù)據(jù)中重復的數(shù)據(jù)等處理。
步驟S23,從每一個患者的規(guī)范醫(yī)療數(shù)據(jù)中抽取每一個患者的身份信息和生命體征數(shù)據(jù);具體地,數(shù)據(jù)抽取模塊103從每一個患者的規(guī)范醫(yī)療數(shù)據(jù)中抽取每一個患者的身份信息、生命體征數(shù)據(jù)和歷史就診信息。在本實施例中,所述患者的生命體征數(shù)據(jù)包括患者的身高數(shù)據(jù)、體重數(shù)據(jù)、血壓數(shù)據(jù)、脈搏數(shù)據(jù)、心率數(shù)據(jù)、血氧數(shù)據(jù)以及血糖數(shù)據(jù)等數(shù)據(jù)信息。所述患者的歷史就診信息包括患者的歷史就診時間、歷史就診醫(yī)院、歷史就診科室以及歷史電子病歷等數(shù)據(jù)信息。
步驟S24,根據(jù)每一個患者的身份信息為每一個患者產(chǎn)生一個身份標識號;具體地,數(shù)據(jù)抽取模塊103根據(jù)每一個患者的身份信息為每一個患者產(chǎn)生一個身份標識號,作為每一個患者唯一的身份標識。
步驟S25,將每一個患者的身份標識號與該患者的生命體征數(shù)據(jù)進行關(guān)聯(lián)并建立一個患者體征信息表,并將每一個患者的身份標識號與該患者的歷史就診信息進行關(guān)聯(lián)并建立一個患者就診信息表;具體地,數(shù)據(jù)關(guān)聯(lián)模塊104將每一個患者的身份標識號與患者各自對應(yīng)的生命體征數(shù)據(jù)進行關(guān)聯(lián)并建立一個患者體征信息表,并將每一個患者的身份標識號與患者各自對應(yīng)的歷史就診信息進行關(guān)聯(lián)并建立一個患者就診信息表。在本實施例中,所述患者體征信息表的表頭字段存儲每一個患者的身份標識號,所述患者體征信息表的內(nèi)容字段存儲每一個患者對應(yīng)的生命體征數(shù)據(jù),所述患者就診信息表的表頭字段存儲每一個患者的身份標識號,所述患者體征信息表的內(nèi)容字段存儲每一個患者對應(yīng)的歷史就診信息。
步驟S26,將患者體征信息表存儲在大數(shù)據(jù)存儲倉庫中的第一分區(qū)數(shù)據(jù)庫中,并將患者就診信息表存儲在大數(shù)據(jù)存儲倉庫中的第二分區(qū)數(shù)據(jù)庫中;具體地,數(shù)據(jù)存儲模塊105將患者體征信息表存儲在大數(shù)據(jù)存儲倉庫4中的第一分區(qū)數(shù)據(jù)庫41中,并將患者就診信息表存儲在大數(shù)據(jù)存儲倉庫4中的第二分區(qū)數(shù)據(jù)庫42中。在本實施例中,由于每個患者的身份標識號是唯一,每個患者的身份標識號作為患者體征信息表與患者就診信息表之間的關(guān)聯(lián)關(guān)系,并將患者體征信息表與患者就診信息表分開存儲在大數(shù)據(jù)存儲倉庫4的不同分區(qū)數(shù)據(jù)庫中,因此增強了數(shù)據(jù)結(jié)構(gòu)化存儲以及避免了訪問醫(yī)療數(shù)據(jù)時產(chǎn)生沖突,加快了云服務(wù)器1對醫(yī)療數(shù)據(jù)的讀取與處理速度,從而能夠提高醫(yī)療服務(wù)水平與患者的滿意度。
本發(fā)明所述醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲系統(tǒng)及方法通過采集不同的醫(yī)療數(shù)據(jù)源2中的醫(yī)療數(shù)據(jù),并將對醫(yī)療數(shù)據(jù)進行清洗轉(zhuǎn)換處理得到規(guī)范醫(yī)療數(shù)據(jù),從而使得醫(yī)療數(shù)據(jù)采集更加全面、更加準確。此外,將每個患者的身份標識號作為體征信息表與就診信息表之間的關(guān)聯(lián)關(guān)系,并將患者的體征信息表與就診信息表分開存儲在大數(shù)據(jù)存儲倉庫的不同分區(qū)數(shù)據(jù)庫中,減輕了系統(tǒng)負載,提高了數(shù)據(jù)處理效率,避免了訪問醫(yī)療數(shù)據(jù)時產(chǎn)生沖突,加快了對醫(yī)療數(shù)據(jù)的讀取與處理速度,從而能夠提高醫(yī)療服務(wù)水平與患者的滿意度。
以上僅為本發(fā)明的優(yōu)選實施例,并非因此限制本發(fā)明的專利范圍,凡是利用本發(fā)明說明書及附圖內(nèi)容所作的等效結(jié)構(gòu)或等效功能變換,或直接或間接運用在其他相關(guān)的技術(shù)領(lǐng)域,均同理包括在本發(fā)明的專利保護范圍內(nèi)。