本發(fā)明涉及文本處理領(lǐng)域,具體而言,涉及一種區(qū)域醫(yī)療信息數(shù)據(jù)整合方法、裝置及系統(tǒng)。
背景技術(shù):
1、隨著醫(yī)療技術(shù)的不斷發(fā)展和醫(yī)療數(shù)據(jù)的大量積累,區(qū)域內(nèi)不同醫(yī)療機(jī)構(gòu)之間的信息整合變得愈發(fā)重要。整合區(qū)域醫(yī)療信息有助于實(shí)現(xiàn)醫(yī)療資源的共享、提高醫(yī)療診斷的準(zhǔn)確性、促進(jìn)醫(yī)療研究以及改善醫(yī)療服務(wù)的整體質(zhì)量。然而,在進(jìn)行區(qū)域醫(yī)療信息數(shù)據(jù)整合時面臨著諸多挑戰(zhàn)。醫(yī)療信息來源廣泛且復(fù)雜,不同的醫(yī)療機(jī)構(gòu)可能使用不同的信息系統(tǒng),數(shù)據(jù)格式和標(biāo)準(zhǔn)缺乏統(tǒng)一。
2、為了從大量的醫(yī)療信息文本中提取有用的目標(biāo)醫(yī)療信息,文本處理神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用。神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的學(xué)習(xí)能力,能夠自動從大量的文本數(shù)據(jù)中學(xué)習(xí)到模式和特征,從而對醫(yī)療信息進(jìn)行分類、識別和提取。例如,神經(jīng)網(wǎng)絡(luò)可以從病歷文本中識別疾病名稱、癥狀描述、治療方法等目標(biāo)醫(yī)療信息。
3、目前,在利用文本處理神經(jīng)網(wǎng)絡(luò)進(jìn)行醫(yī)療信息整合時,存在一些亟待解決的問題。在神經(jīng)網(wǎng)絡(luò)的調(diào)校過程中,通常會使用多個訓(xùn)練文本庫。然而,這些訓(xùn)練文本庫之間往往存在目標(biāo)醫(yī)療信息不統(tǒng)一或結(jié)構(gòu)差異的情況。例如,一個訓(xùn)練文本庫中的消極樣本在其他訓(xùn)練文本庫中被識別為積極樣本。這種不一致性會在神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)過程中產(chǎn)生干擾,導(dǎo)致網(wǎng)絡(luò)無法充分利用所有訓(xùn)練樣本的信息。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于提供一種區(qū)域醫(yī)療信息數(shù)據(jù)整合方法、裝置及系統(tǒng)。
2、本發(fā)明是這樣實(shí)現(xiàn)的:
3、第一方面,本發(fā)明提供了一種區(qū)域醫(yī)療信息數(shù)據(jù)整合方法,所述方法包括:獲取目標(biāo)醫(yī)療信息文本;調(diào)取目標(biāo)文本處理神經(jīng)網(wǎng)絡(luò),將所述目標(biāo)醫(yī)療信息文本加載到所述目標(biāo)文本處理神經(jīng)網(wǎng)絡(luò),以基于所述目標(biāo)文本處理神經(jīng)網(wǎng)絡(luò)對所述目標(biāo)醫(yī)療信息文本進(jìn)行識別,獲得目標(biāo)醫(yī)療信息;將識別得到的目標(biāo)醫(yī)療信息整合到預(yù)設(shè)的醫(yī)療信息庫的目標(biāo)空間中;其中,所述目標(biāo)文本處理神經(jīng)網(wǎng)絡(luò)采用如下步驟進(jìn)行獲取得到:獲取醫(yī)療訓(xùn)練文本庫,所述醫(yī)療訓(xùn)練文本庫包括多個醫(yī)療訓(xùn)練文本分庫,各個所述醫(yī)療訓(xùn)練文本分庫分別對應(yīng)的目標(biāo)醫(yī)療信息存在誤差;針對所述多個醫(yī)療訓(xùn)練文本分庫中的選定醫(yī)療訓(xùn)練文本分庫,在初始文本處理神經(jīng)網(wǎng)絡(luò)的各個文本信息識別組件中,確定所述選定醫(yī)療訓(xùn)練文本分庫對應(yīng)的選定文本信息識別組件集;其中,所述選定文本信息識別組件集中的選定文本信息識別組件和所述選定醫(yī)療訓(xùn)練文本分庫對應(yīng)的目標(biāo)醫(yī)療信息相對應(yīng);針對所述選定醫(yī)療訓(xùn)練文本分庫中的選定醫(yī)療訓(xùn)練文本,基于所述各個文本信息識別組件,依據(jù)所述選定醫(yī)療訓(xùn)練文本對應(yīng)的各個第一待定文本片段,確定所述選定醫(yī)療訓(xùn)練文本對應(yīng)的第一文本信息識別誤差;其中,所述第一待定文本片段中推理具有醫(yī)療訓(xùn)練文本對應(yīng)的目標(biāo)醫(yī)療信息;僅基于所述選定文本信息識別組件集中的選定文本信息識別組件,依據(jù)所述選定醫(yī)療訓(xùn)練文本對應(yīng)的各個第二待定文本片段,確定所述選定醫(yī)療訓(xùn)練文本對應(yīng)的第二文本信息識別誤差;其中,所述第二待定文本片段中推理不具有醫(yī)療訓(xùn)練文本對應(yīng)的目標(biāo)醫(yī)療信息;依據(jù)所述醫(yī)療訓(xùn)練文本庫中各個醫(yī)療訓(xùn)練文本分別對應(yīng)的第一文本信息識別誤差和第二文本信息識別誤差,對所述初始文本處理神經(jīng)網(wǎng)絡(luò)進(jìn)行調(diào)校,獲得所述目標(biāo)文本處理神經(jīng)網(wǎng)絡(luò),所述目標(biāo)文本處理神經(jīng)網(wǎng)絡(luò)中的各個文本信息識別組件被配置為識別所述醫(yī)療訓(xùn)練文本庫的目標(biāo)醫(yī)療信息。
4、第二方面,本發(fā)明提供了一種區(qū)域醫(yī)療信息數(shù)據(jù)整合裝置,所述裝置包括:文本獲取模塊,用于獲取目標(biāo)醫(yī)療信息文本;網(wǎng)絡(luò)調(diào)用模塊,用于調(diào)取目標(biāo)文本處理神經(jīng)網(wǎng)絡(luò),將所述目標(biāo)醫(yī)療信息文本加載到所述目標(biāo)文本處理神經(jīng)網(wǎng)絡(luò),以基于所述目標(biāo)文本處理神經(jīng)網(wǎng)絡(luò)對所述目標(biāo)醫(yī)療信息文本進(jìn)行識別,獲得目標(biāo)醫(yī)療信息;信息整合模塊,用于將識別得到的目標(biāo)醫(yī)療信息整合到預(yù)設(shè)的醫(yī)療信息庫的目標(biāo)空間中;網(wǎng)絡(luò)調(diào)校模塊,用于對所述目標(biāo)文本處理神經(jīng)網(wǎng)絡(luò)采用如下過程進(jìn)行調(diào)校:
5、獲取醫(yī)療訓(xùn)練文本庫,所述醫(yī)療訓(xùn)練文本庫包括多個醫(yī)療訓(xùn)練文本分庫,各個所述醫(yī)療訓(xùn)練文本分庫分別對應(yīng)的目標(biāo)醫(yī)療信息存在誤差;
6、針對所述多個醫(yī)療訓(xùn)練文本分庫中的選定醫(yī)療訓(xùn)練文本分庫,在初始文本處理神經(jīng)網(wǎng)絡(luò)的各個文本信息識別組件中,確定所述選定醫(yī)療訓(xùn)練文本分庫對應(yīng)的選定文本信息識別組件集;其中,所述選定文本信息識別組件集中的選定文本信息識別組件和所述選定醫(yī)療訓(xùn)練文本分庫對應(yīng)的目標(biāo)醫(yī)療信息相對應(yīng);
7、針對所述選定醫(yī)療訓(xùn)練文本分庫中的選定醫(yī)療訓(xùn)練文本,基于所述各個文本信息識別組件,依據(jù)所述選定醫(yī)療訓(xùn)練文本對應(yīng)的各個第一待定文本片段,確定所述選定醫(yī)療訓(xùn)練文本對應(yīng)的第一文本信息識別誤差;其中,所述第一待定文本片段中推理具有醫(yī)療訓(xùn)練文本對應(yīng)的目標(biāo)醫(yī)療信息;
8、僅基于所述選定文本信息識別組件集中的選定文本信息識別組件,依據(jù)所述選定醫(yī)療訓(xùn)練文本對應(yīng)的各個第二待定文本片段,確定所述選定醫(yī)療訓(xùn)練文本對應(yīng)的第二文本信息識別誤差;其中,所述第二待定文本片段中推理不具有醫(yī)療訓(xùn)練文本對應(yīng)的目標(biāo)醫(yī)療信息;
9、依據(jù)所述醫(yī)療訓(xùn)練文本庫中各個醫(yī)療訓(xùn)練文本分別對應(yīng)的第一文本信息識別誤差和第二文本信息識別誤差,對所述初始文本處理神經(jīng)網(wǎng)絡(luò)進(jìn)行調(diào)校,獲得所述目標(biāo)文本處理神經(jīng)網(wǎng)絡(luò),所述目標(biāo)文本處理神經(jīng)網(wǎng)絡(luò)中的各個文本信息識別組件被配置為識別所述醫(yī)療訓(xùn)練文本庫的目標(biāo)醫(yī)療信息。
10、第三方面,本發(fā)明提供了一種醫(yī)療信息系統(tǒng),包括:一個或多個處理器;存儲器;一個或多個計算機(jī)程序;其中所述一個或多個計算機(jī)程序被存儲在所述存儲器中并被配置為由所述一個或多個處理器執(zhí)行,所述一個或多個計算機(jī)程序被所述處理器執(zhí)行時,實(shí)現(xiàn)如上所述的方法。
11、本發(fā)明的有益效果為:本發(fā)明提供的方法和系統(tǒng)中,采用在初始文本處理神經(jīng)網(wǎng)絡(luò)對應(yīng)的各個文本信息識別組件中確定選定醫(yī)療訓(xùn)練文本分庫對應(yīng)的選定文本信息識別組件,并基于選定文本信息識別組件,依據(jù)選定醫(yī)療訓(xùn)練文本分庫中的醫(yī)療訓(xùn)練文本對應(yīng)的第二待定文本片段,確定第二待定文本片段在選定文本信息識別組件下的文本信息識別誤差,令選定醫(yī)療訓(xùn)練文本分庫對應(yīng)的第二待定文本片段不涉及選定文本信息識別組件以外的文本信息識別組件的調(diào)校,完成選定醫(yī)療訓(xùn)練文本分庫對應(yīng)的第二待定文本片段只在選定醫(yī)療訓(xùn)練文本分庫中起作用,杜絕因這些醫(yī)療訓(xùn)練文本庫之間具有目標(biāo)醫(yī)療信息不統(tǒng)一或結(jié)構(gòu)差異引起的網(wǎng)絡(luò)學(xué)習(xí)干擾,無法充分利用所有訓(xùn)練樣本的信息,帶來的調(diào)校性能受限的問題,提高了區(qū)域內(nèi)不同數(shù)據(jù)源在數(shù)據(jù)整合時的目標(biāo)醫(yī)療信息提取的準(zhǔn)確度。
12、進(jìn)一步地,因?yàn)檫x定醫(yī)療訓(xùn)練文本分庫中的醫(yī)療訓(xùn)練文本對應(yīng)的第一待定文本片段可以進(jìn)行初始文本處理神經(jīng)網(wǎng)絡(luò)對應(yīng)的全部文本信息識別組件的學(xué)習(xí)調(diào)校,使得選定醫(yī)療訓(xùn)練文本分庫外的醫(yī)療訓(xùn)練文本分庫對應(yīng)的消極特征得到強(qiáng)化,使得初始文本處理神經(jīng)網(wǎng)絡(luò)的信息檢測效果更準(zhǔn)確。
1.一種區(qū)域醫(yī)療信息數(shù)據(jù)整合方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述僅基于所述選定文本信息識別組件集中的選定文本信息識別組件,依據(jù)所述選定醫(yī)療訓(xùn)練文本對應(yīng)的各個第二待定文本片段,確定所述選定醫(yī)療訓(xùn)練文本對應(yīng)的第二文本信息識別誤差,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述在初始文本處理神經(jīng)網(wǎng)絡(luò)的各個文本信息識別組件中,確定所述選定醫(yī)療訓(xùn)練文本分庫對應(yīng)的選定文本信息識別組件集,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述文本信息識別組件激活狀態(tài)指示符包括激活標(biāo)識和非激活標(biāo)識,所述激活標(biāo)識和所述非激活標(biāo)識不同,所述文本信息識別組件激活狀態(tài)指示符對應(yīng)的標(biāo)識與所述初始文本處理神經(jīng)網(wǎng)絡(luò)中的文本信息識別組件彼此對應(yīng);
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于所述各個文本信息識別組件,依據(jù)所述選定醫(yī)療訓(xùn)練文本對應(yīng)的各個第一待定文本片段,確定所述選定醫(yī)療訓(xùn)練文本對應(yīng)的第一文本信息識別誤差,包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述方法還包括:
8.根據(jù)權(quán)利要求1至7任一項(xiàng)所述的方法,其特征在于,所述依據(jù)所述醫(yī)療訓(xùn)練文本庫中各個醫(yī)療訓(xùn)練文本分別對應(yīng)的第一文本信息識別誤差和第二文本信息識別誤差,對所述初始文本處理神經(jīng)網(wǎng)絡(luò)進(jìn)行調(diào)校,獲得所述目標(biāo)文本處理神經(jīng)網(wǎng)絡(luò),包括:
9.一種區(qū)域醫(yī)療信息數(shù)據(jù)整合裝置,其特征在于,所述裝置包括:
10.一種醫(yī)療信息系統(tǒng),其特征在于,包括: