本發(fā)明涉及數(shù)據(jù)分類分級,具體為一種醫(yī)藥數(shù)據(jù)分類系統(tǒng)及其分類方法。
背景技術:
1、數(shù)據(jù)分類,可理解為從業(yè)務或者行業(yè)角度出發(fā),明確知道哪些數(shù)據(jù)(其實應該是元數(shù)據(jù),更貼切一些應該是字段)屬于哪個業(yè)務范疇,也就是類別。數(shù)據(jù)分級,不同于數(shù)據(jù)分類,對于大多數(shù)企業(yè)來說,更多是從滿足監(jiān)管要求的角度出發(fā)。數(shù)據(jù)分級屬于數(shù)據(jù)安全領域,或許稱呼它為敏感等級更為貼切。企業(yè)中的數(shù)據(jù)有的密級程度高、有的低、有的可公開、有的不可公開,敏感等級不同的數(shù)據(jù)對內(nèi)使用時受到的保護策略不同,對外共享開放的程度也不同。
2、敏感數(shù)據(jù)的識別是數(shù)據(jù)安全管理的最根本問題,敏感數(shù)據(jù)識別的方法很多,但方法都有各自的優(yōu)缺點。
3、然而,現(xiàn)有的數(shù)據(jù)分級分類在安全性和隱私保護方面均存在欠缺;同時,現(xiàn)有的數(shù)據(jù)分級分類方法并不區(qū)分實時數(shù)據(jù)和存量數(shù)據(jù),將導致額外的數(shù)據(jù)識別成本;此外,現(xiàn)有技術都是基于通用模型執(zhí)行數(shù)據(jù)分級或者分類,而無法根據(jù)用戶的主動要求執(zhí)行個性化的分類,不能滿足用戶的特定分類要求,分類不能進一步細化,無法最大程度的挖掘數(shù)據(jù)價值。
技術實現(xiàn)思路
1、(一)解決的技術問題
2、針對現(xiàn)有技術的不足,本發(fā)明提供了一種醫(yī)藥數(shù)據(jù)分類系統(tǒng)及其分類方法。
3、(二)技術方案
4、為實現(xiàn)上述目的,本發(fā)明提供如下技術方案:一種醫(yī)藥數(shù)據(jù)分類系統(tǒng),包括:
5、云服務器,所述云服務器中設置有中央處理器;
6、數(shù)據(jù)導入系統(tǒng),用于導入醫(yī)院患者信息、診斷信息以及用藥信息;
7、藥物管理系統(tǒng),用于藥物基本信息維護,實現(xiàn)對用藥的標號信息、名稱信息、規(guī)格信息、單位信息的分類統(tǒng)計;
8、藥物分類系統(tǒng),用于建立用藥信息與診斷信息的二值矩陣,并且以二值矩陣為基礎對藥物進行分類;
9、分類分級系統(tǒng),還包括:數(shù)據(jù)接收子系統(tǒng)、數(shù)據(jù)識別子系統(tǒng)、數(shù)據(jù)篩選子系統(tǒng)、數(shù)據(jù)分類子系統(tǒng)以及數(shù)據(jù)分級子系統(tǒng);
10、所述數(shù)據(jù)接收子系統(tǒng)提供多個apr接口端,通過所述apr接口端,所述數(shù)據(jù)接收子系統(tǒng)從多個數(shù)據(jù)源接收待處理數(shù)據(jù),所述多個數(shù)據(jù)源包括數(shù)據(jù)庫和數(shù)據(jù)終端;所述數(shù)據(jù)識別子系統(tǒng)連接所述數(shù)據(jù)接收子系統(tǒng),識別所述待處理數(shù)據(jù)的屬性;所述數(shù)據(jù)篩選子系統(tǒng),接收輸入的篩選標準,基于所述篩選標準,從所述待處理數(shù)據(jù)中篩選出待處理數(shù)據(jù);所述數(shù)據(jù)分類子系統(tǒng),用于對所述待處理數(shù)據(jù)進行分類,所述數(shù)據(jù)分級子系統(tǒng)基于所述分類結果,對所述待處理數(shù)據(jù)進行數(shù)據(jù)分級和價值評估;
11、敏感數(shù)據(jù)系統(tǒng),用于對敏感數(shù)據(jù)進行分析并建立相關模型。
12、優(yōu)選的,所述數(shù)據(jù)接收子系統(tǒng)從所述數(shù)據(jù)終端接收第一待處理數(shù)據(jù)后,將第一待處理數(shù)據(jù)發(fā)送至所述數(shù)據(jù)識別子系統(tǒng)。
13、優(yōu)選的,所述藥物分類模塊對藥物進行分類的流程為:
14、s1:獲取診斷信息和用藥信息,并且對診斷信息和用藥信息進行預處理,包括詞形歸一化、用藥名稱命名方式的統(tǒng)一替換;
15、s2:根據(jù)診斷信息和用藥信息之間的對應關系,并且建立用藥信息與診斷信息的二值矩陣;
16、s3:以用藥信息與診斷信息的二值矩陣為基礎,計算藥物之間的相似度距離,并且建立藥物與藥物的距離矩陣;
17、s4:以藥物之間的距離矩陣為基礎,對藥物進行分類。
18、優(yōu)選的,所述敏感數(shù)據(jù)系統(tǒng)包括:
19、構建敏感數(shù)據(jù)分類模型;
20、將所述敏感數(shù)據(jù)特征輸入所述敏感數(shù)據(jù)分類模型,得到敏感數(shù)據(jù)分類結果;
21、構建敏感數(shù)據(jù)分級模型;
22、將所述敏感數(shù)據(jù)分類結果、所述敏感數(shù)據(jù)特征及預設數(shù)據(jù)安全等級輸入所述敏感數(shù)據(jù)分級模型,得到敏感數(shù)據(jù)分級結果;
23、根據(jù)所述敏感數(shù)據(jù)分類結果、所述敏感數(shù)據(jù)特征及所述敏感數(shù)據(jù)分級結果對敏感數(shù)據(jù)進行定級標識。
24、優(yōu)選的,所述構建敏感數(shù)據(jù)分類模型,包括:將所述敏感數(shù)據(jù)進行預處理;將預處理后的敏感數(shù)據(jù)均分為多個分集,循環(huán)選取任一一份分集作為第一測試集,剩余多份分集作為第一訓練集;設置神經(jīng)網(wǎng)絡模型及參數(shù),構建初始的敏感數(shù)據(jù)分類模型;根據(jù)所述第一訓練集及所述第一測試集對敏感數(shù)據(jù)分類模型進行訓練和測試,執(zhí)行增量神經(jīng)網(wǎng)絡學習,不斷調(diào)整敏感數(shù)據(jù)分類模型及參數(shù),直至輸出結果符合預設目標。
25、優(yōu)選的,所述設置神經(jīng)網(wǎng)絡模型及參數(shù),構建初始的敏感數(shù)據(jù)分類模型,包括:設置神經(jīng)網(wǎng)絡輸入層節(jié)點數(shù)、輸出層節(jié)點數(shù)、隱層層數(shù)和各隱層節(jié)點數(shù);設置神經(jīng)網(wǎng)絡輸入層到隱層,以及隱層到輸出層的初始連接權值,構建初始的敏感數(shù)據(jù)分類模型。
26、一種醫(yī)藥數(shù)據(jù)分類方法,包括以下步驟:
27、步驟一:數(shù)據(jù)接收:用于接收待識別數(shù)據(jù),所述待識別數(shù)據(jù)來自于數(shù)據(jù)庫,和/或,數(shù)據(jù)終端,所述數(shù)據(jù)庫為多個分類子數(shù)據(jù)庫中的一個或者多個;所述數(shù)據(jù)終端包括移動終端和桌面終端;
28、步驟二:數(shù)據(jù)識別:用于識別來自中央處理器的待識別數(shù)據(jù)的屬性,并識別出屬性的待識別數(shù)據(jù)存儲至對應的分類子數(shù)據(jù)庫;
29、步驟三:數(shù)據(jù)篩選:用于篩選標準,從所述待識別數(shù)據(jù)中篩選出待處理數(shù)據(jù);
30、步驟四:數(shù)據(jù)分類:用于對所述待處理數(shù)據(jù)進行分類;
31、步驟五:數(shù)據(jù)分級:基于所述數(shù)據(jù)分類的分類結果,對所述待處理數(shù)據(jù)進行數(shù)據(jù)分級和價值評估。
32、優(yōu)選的,在所述數(shù)據(jù)篩選步驟之前,所述方法還包括用戶參數(shù)輸入步驟;當所述用戶參數(shù)輸入步驟激活時,跳過所述數(shù)據(jù)識別步驟。
33、(三)有益效果
34、與現(xiàn)有技術相比,本發(fā)明提供了一種醫(yī)藥數(shù)據(jù)分類系統(tǒng)及其分類方法,具備以下有益效果:
35、1、該一種醫(yī)藥數(shù)據(jù)分類系統(tǒng)及其分類方法,能夠?qū)崿F(xiàn)進行患者信息、診斷信息以及用藥信息管理,并且能夠基于藥物信息與診斷信息實現(xiàn)藥物分類,為藥物的計量計算或者大數(shù)據(jù)分析提供有效的數(shù)據(jù)基礎。
36、2、該一種醫(yī)藥數(shù)據(jù)分類系統(tǒng)及其分類方法,通過構建敏感數(shù)據(jù)分類模型;將敏感數(shù)據(jù)特征輸入敏感數(shù)據(jù)分類模型,得到敏感數(shù)據(jù)分類結果;構建敏感數(shù)據(jù)分級模型;將敏感數(shù)據(jù)分類結果、敏感數(shù)據(jù)特征及預設數(shù)據(jù)安全等級輸入敏感數(shù)據(jù)分級模型,得到敏感數(shù)據(jù)分級結果;根據(jù)敏感數(shù)據(jù)分類結果、敏感數(shù)據(jù)特征及敏感數(shù)據(jù)分級結果對敏感數(shù)據(jù)進行定級標識。
1.一種醫(yī)藥數(shù)據(jù)分類系統(tǒng),其特征在于,包括:
2.根據(jù)權利要求1所述的一種醫(yī)藥數(shù)據(jù)分類系統(tǒng),其特征在于,所述數(shù)據(jù)接收子系統(tǒng)從所述數(shù)據(jù)終端接收第一待處理數(shù)據(jù)后,將第一待處理數(shù)據(jù)發(fā)送至所述數(shù)據(jù)識別子系統(tǒng)。
3.根據(jù)權利要求2所述的一種醫(yī)藥數(shù)據(jù)分類系統(tǒng),其特征在于,所述藥物分類模塊對藥物進行分類的流程為:
4.根據(jù)權利要求1所述的一種醫(yī)藥數(shù)據(jù)分類系統(tǒng),其特征在于,所述敏感數(shù)據(jù)系統(tǒng)包括:
5.根據(jù)權利要求4所述的一種醫(yī)藥數(shù)據(jù)分類系統(tǒng),其特征在于,所述構建敏感數(shù)據(jù)分類模型,包括:將所述敏感數(shù)據(jù)進行預處理;將預處理后的敏感數(shù)據(jù)均分為多個分集,循環(huán)選取任一一份分集作為第一測試集,剩余多份分集作為第一訓練集;設置神經(jīng)網(wǎng)絡模型及參數(shù),構建初始的敏感數(shù)據(jù)分類模型;根據(jù)所述第一訓練集及所述第一測試集對敏感數(shù)據(jù)分類模型進行訓練和測試,執(zhí)行增量神經(jīng)網(wǎng)絡學習,不斷調(diào)整敏感數(shù)據(jù)分類模型及參數(shù),直至輸出結果符合預設目標。
6.根據(jù)權利要求5所述的一種醫(yī)藥數(shù)據(jù)分類系統(tǒng),其特征在于,所述設置神經(jīng)網(wǎng)絡模型及參數(shù),構建初始的敏感數(shù)據(jù)分類模型,包括:設置神經(jīng)網(wǎng)絡輸入層節(jié)點數(shù)、輸出層節(jié)點數(shù)、隱層層數(shù)和各隱層節(jié)點數(shù);設置神經(jīng)網(wǎng)絡輸入層到隱層,以及隱層到輸出層的初始連接權值,構建初始的敏感數(shù)據(jù)分類模型。
7.一種醫(yī)藥數(shù)據(jù)分類方法,其特征在于,包括以下步驟:
8.根據(jù)權利要求7所述的一種醫(yī)藥數(shù)據(jù)分類方法,其特征在于,在所述數(shù)據(jù)篩選步驟之前,所述方法還包括用戶參數(shù)輸入步驟;當所述用戶參數(shù)輸入步驟激活時,跳過所述數(shù)據(jù)識別步驟。