技術(shù)領(lǐng)域:
本發(fā)明涉及到醫(yī)學(xué)信息智能處理領(lǐng)域,具體來說涉及一種用于電子病歷知識約簡效能評估的多種群協(xié)同熵級聯(lián)方法。
背景技術(shù):
:
隨著云計(jì)算和大數(shù)據(jù)時(shí)代的來臨,大規(guī)模電子病歷處理機(jī)制在整個(gè)醫(yī)療健康大數(shù)據(jù)產(chǎn)生和使用過程中異常復(fù)雜,其醫(yī)療數(shù)據(jù)具有容量大、來源分散、格式多樣、存取速度快以及應(yīng)用價(jià)值高等特征,大規(guī)模電子病歷系統(tǒng)中蘊(yùn)含著有價(jià)值的醫(yī)學(xué)規(guī)則與知識成為人們處理電子病歷數(shù)據(jù)的驅(qū)動力,電子病歷知識約簡效能評估是形成臨床決策支持系統(tǒng)的關(guān)鍵,采用一些高效的方法進(jìn)行復(fù)雜電子醫(yī)療病歷知識約簡效能分析,充分挖掘出疾病或體征之間的關(guān)聯(lián)性,對開展大數(shù)據(jù)臨床決策支持分析以及提供個(gè)性化、協(xié)同化與知識化的醫(yī)療健康大數(shù)據(jù)服務(wù)等具有重要意義與價(jià)值。
由于電子病歷系統(tǒng)具有海量性、不完備性、語義異質(zhì)和異構(gòu)以及病歷動態(tài)時(shí)效性等特征,使得在mapreduce框架下處理電子病歷的計(jì)算量和訓(xùn)練數(shù)據(jù)規(guī)模非常龐大,其效能評估與優(yōu)化問題研究具有一定的挑戰(zhàn)性。如何在云計(jì)算環(huán)境下進(jìn)行大規(guī)模電子病歷知識約簡效能評估與優(yōu)化還有較多關(guān)鍵技術(shù)需要我們解決。從目前研究現(xiàn)狀來看:在形式化和具體定量描述知識約簡性能評估指標(biāo)和構(gòu)建評估模型方面開展的研究工作相對較少,尤其是在云計(jì)算環(huán)境下開展知識約簡效能評估的方法研究的報(bào)道文獻(xiàn)還相對較少,這極大地制約了知識約簡算法在實(shí)際大規(guī)模電子病歷臨床智能診斷模式、處方行為以及實(shí)施臨床路徑等方面的應(yīng)用。因此我們必須設(shè)計(jì)一些方法來進(jìn)行大規(guī)模電子病歷知識約簡效用評估計(jì)算范式與自適應(yīng)優(yōu)化,分析協(xié)同進(jìn)化種群與病歷知識協(xié)同約簡復(fù)雜度間的內(nèi)在聯(lián)系,通過對電子病歷知識約簡效能進(jìn)行剖析,實(shí)現(xiàn)云計(jì)算環(huán)境下大規(guī)模電子病歷云端知識協(xié)同約簡模式,從而降低協(xié)同約簡復(fù)雜性成本,更有效地應(yīng)用于面向云計(jì)算的大規(guī)模電子病歷知識約簡應(yīng)用服務(wù)需求,找出最具成本效益的電子病歷臨床治療模式。
技術(shù)實(shí)現(xiàn)要素:
:
本發(fā)明的目的是提供一種、具有較好魯棒性和細(xì)粒度、具有較好自適應(yīng)性、具有較好可擴(kuò)展性的用于電子病歷知識約簡效能評估的多種群協(xié)同熵級聯(lián)方法。
本發(fā)明通過以下的技術(shù)方案實(shí)現(xiàn)的:
一種用于電子病歷知識約簡效能評估的多種群協(xié)同熵級聯(lián)方法,具體步驟如下:
a.利用云計(jì)算中map操作與reduce操作將大規(guī)模電子病歷數(shù)據(jù)集劃分成n個(gè)不同的電子病歷優(yōu)化數(shù)據(jù)子集emr1,emr2,...,emrn;
b.設(shè)計(jì)多進(jìn)化種群協(xié)同熵ch(memplex1,memeplex2,...,memeplexn),構(gòu)建相鄰進(jìn)化種群相似度矩陣psm,設(shè)計(jì)第i個(gè)進(jìn)化種群memeplexi的知識約簡效能評估計(jì)算方法emi,用于第i個(gè)電子病歷優(yōu)化數(shù)據(jù)子集emri的知識約簡效能評估;
c.根據(jù)影響電子病歷優(yōu)化數(shù)據(jù)子集知識約簡效能的進(jìn)化種群分布規(guī)律,構(gòu)造一種級聯(lián)評估指標(biāo)矩陣zi,并進(jìn)行該指標(biāo)矩陣的迭代優(yōu)化,然后進(jìn)一步構(gòu)造級聯(lián)矩陣zi的閉包矩陣zi*,求出級聯(lián)評估指標(biāo)矩陣的最優(yōu)評估矩陣zi′;
d.第i個(gè)進(jìn)化種群memeplexi利用知識約簡效能評估計(jì)算方法emi和級聯(lián)評估指標(biāo)矩陣的最優(yōu)矩陣zi′,求出第i個(gè)電子病歷優(yōu)化數(shù)據(jù)子集emri的知識約簡效能評估精度值epi;
e.比較上述求出的知識約簡效能評估精度epi與預(yù)先設(shè)定的評估精度值λ關(guān)系如下:
如果epi≤λ,則第i個(gè)進(jìn)化種群memeplexi對第i個(gè)電子病歷優(yōu)化數(shù)據(jù)子集emri的知識約簡效能評估過程結(jié)束,接下來,將轉(zhuǎn)向第i+1個(gè)種群memeplexi+1進(jìn)行第i+1個(gè)電子病歷優(yōu)化數(shù)據(jù)子集emri+1的知識約簡效能評估過程;
如果epi>λ,則第i個(gè)進(jìn)化種群memeplexi繼續(xù)進(jìn)行上述第i個(gè)電子病歷優(yōu)化數(shù)據(jù)子集emri的知識約簡效能評估,進(jìn)一步優(yōu)化效能評估精度epi,直至滿足epi=λ;
f.求出上述電子病歷知識約簡效能最優(yōu)評估精度
本發(fā)明的進(jìn)一步改進(jìn)在于:步驟b中所述設(shè)計(jì)多進(jìn)化種群協(xié)同熵ch(memplex1,memeplex2,...,memeplexn),構(gòu)建相鄰進(jìn)化種群相似度矩陣psm,設(shè)計(jì)第i個(gè)進(jìn)化種群memeplexi的知識約簡效能評估計(jì)算方法emi,用于第i個(gè)電子病歷優(yōu)化數(shù)據(jù)子集emri的知識約簡效能評估;具體步驟如下:
a.設(shè)用于電子病歷優(yōu)化數(shù)據(jù)子集知識約簡效能評估的第1個(gè)進(jìn)化種群為memeplex1,第2個(gè)進(jìn)化種群為memeplex2,以此類推,第i個(gè)進(jìn)化種群為memeplexi,第n個(gè)進(jìn)化種群為memeplexn;
b.計(jì)算相鄰的第i個(gè)和第i+1個(gè)進(jìn)化種群間的級聯(lián)系數(shù)為αi,計(jì)算公式為
其中g(shù)i為在第i個(gè)進(jìn)化種群中尋找出最優(yōu)進(jìn)化個(gè)體的迭代次數(shù),gi+1為在第i+1個(gè)進(jìn)化種群中尋找出最優(yōu)進(jìn)化個(gè)體的迭代次數(shù),e為自然常數(shù),取值為2.72;
c.設(shè)計(jì)n個(gè)進(jìn)化種群的協(xié)同熵為ch(memplex1,memeplex2,...,memeplexn),計(jì)算公式為
其中n為參與電子病歷優(yōu)化數(shù)據(jù)子集知識約簡效能評估的進(jìn)化種群數(shù),|memeplexi|第i個(gè)進(jìn)化種群memeplexi內(nèi)進(jìn)化個(gè)體數(shù),αi為相鄰進(jìn)化種群間的級聯(lián)系數(shù);
d.構(gòu)建進(jìn)化種群的相似度矩陣psm,定義為
其中
其中g(shù)i為第i個(gè)進(jìn)化種群尋找出最優(yōu)進(jìn)化個(gè)體的迭代次數(shù),gj為尋找出最差進(jìn)化個(gè)體的迭代次數(shù);
e.設(shè)計(jì)參與電子病歷知識約簡效能評估的進(jìn)化種群重要度增長系數(shù)為
其中exp(·)為以自然常數(shù)e為底的指數(shù)函數(shù),e的取值為2.72;
f.構(gòu)建面向云計(jì)算框架mapreduce的n層電子病歷知識約簡效能評估協(xié)同熵矩陣lcm,其具體定義為
其中每個(gè)元素
g.設(shè)計(jì)第i個(gè)電子病歷優(yōu)化數(shù)據(jù)子集emri的知識約簡效能一致性評估計(jì)算方法emi為
本發(fā)明的進(jìn)一步改進(jìn)在于:步驟c中根據(jù)影響電子病歷優(yōu)化數(shù)據(jù)子集知識約簡效能的進(jìn)化種群分布規(guī)律,構(gòu)造一種級聯(lián)評估指標(biāo)矩陣zi,并進(jìn)行該指標(biāo)矩陣的迭代優(yōu)化,然后進(jìn)一步構(gòu)造級聯(lián)矩陣zi的閉包矩陣zi*,求出級聯(lián)評估指標(biāo)矩陣的最優(yōu)評估矩陣zi′;具體步驟如下:
a.根據(jù)影響電子病歷優(yōu)化數(shù)據(jù)子集知識約簡效能的進(jìn)化種群分布規(guī)律,設(shè)計(jì)級聯(lián)評估指標(biāo)矩陣zi的初始矩陣z1為
其中初始矩陣z1中每個(gè)元素
b.設(shè)計(jì)z2矩陣為將z1最右邊一列移走而在最左邊增加一列
同樣設(shè)計(jì)z3矩陣為將z2最右邊一列移走而在最左邊增加一列
c.對于i≥0,按照上述級聯(lián)優(yōu)化方式,將zi矩陣的計(jì)算方法設(shè)計(jì)為將zi-1最右邊一列移走,而在最左邊增加一列
d.構(gòu)造級聯(lián)矩陣zi的閉包矩陣為zi*,該矩陣具體定義如下:
e.構(gòu)造兩個(gè)常量輔助線性矩陣b和c,具體構(gòu)造如下:
和
f.構(gòu)造聯(lián)聯(lián)評估指標(biāo)矩陣zi的優(yōu)化矩陣zi′為
其中運(yùn)算符
本發(fā)明與現(xiàn)有技術(shù)相比具有如下優(yōu)點(diǎn):
1.該方法能降低電子病歷并行知識約簡復(fù)雜度成本,提高其細(xì)粒度和魯棒性。該評估方法在大數(shù)據(jù)環(huán)境下基于hadoop分布式文件系統(tǒng)和mapreduce編程模型的分布式molap技術(shù),使進(jìn)化種群在云計(jì)算mapreduce技術(shù)下進(jìn)行約簡效能動態(tài)評估,較好地保證在電子病歷優(yōu)化數(shù)據(jù)子集知識約簡過程中協(xié)同種群的多樣性和協(xié)作性,提高了相關(guān)臨床電子病歷知識約簡效能的定量評估與系統(tǒng)優(yōu)化性能。
2.該方法在大規(guī)模電子病歷知識約簡效能評估時(shí)具有較好的自適應(yīng)優(yōu)化。該方法通過分析電子病歷知識約簡效能的影響因素與分布規(guī)律,揭示電子病歷相關(guān)優(yōu)化數(shù)據(jù)子集約簡效率、復(fù)雜度與所涉及知識約簡算法之間本質(zhì)關(guān)系,構(gòu)建相關(guān)電子病歷約簡效能定量評估預(yù)測自適應(yīng)方法,不斷降低了大規(guī)模電子病歷知識約簡成本,從而為實(shí)際應(yīng)用中大規(guī)模復(fù)雜電子病歷知識約簡系統(tǒng)的實(shí)施提供了一種較好的自適應(yīng)優(yōu)化方法。
3.該方法可與基于健康檔案的電子病歷信息系統(tǒng)進(jìn)行病歷共享與交換,具有較好的擴(kuò)展性。該方法可支持電子病歷系統(tǒng)中相關(guān)病癥檔案分析,能對檢測到的病癥數(shù)據(jù)進(jìn)行匯總、分層管理與評估、以及發(fā)病風(fēng)險(xiǎn)預(yù)警分析等,從大量的電子病歷數(shù)據(jù)集中自適應(yīng)獲得各種病癥之間關(guān)系,進(jìn)一步增強(qiáng)該方法的評估性能和可擴(kuò)展性,為提供電子病歷智能管理和個(gè)性化推薦服務(wù)奠定較好的基礎(chǔ)。
附圖說明
圖1為本發(fā)明總體結(jié)構(gòu)圖;
圖2為mapreduce框架下大規(guī)模電子病歷數(shù)據(jù)集劃分示意圖;
圖3為電子病歷級聯(lián)評估指標(biāo)矩陣優(yōu)化過程圖。
具體實(shí)施方式
為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。在本發(fā)明的一種實(shí)施方式中描述的元素和特征可以與一個(gè)或更多個(gè)其它實(shí)施方式中示出的元素和特征相結(jié)合。應(yīng)當(dāng)注意,為了清楚的目的,說明中省略了與本發(fā)明無關(guān)的、本領(lǐng)域普通技術(shù)人員已知的部件和處理的表示和描述。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有付出創(chuàng)造性勞動的前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
一種用于電子病歷知識約簡效能評估的多種群協(xié)同熵級聯(lián)方法,具體步驟如下:
a.利用云計(jì)算中map操作與reduce操作將大規(guī)模電子病歷數(shù)據(jù)集劃分成n個(gè)不同的電子病歷優(yōu)化數(shù)據(jù)子集emr1,emr2,...,emrn;
b.設(shè)計(jì)多進(jìn)化種群協(xié)同熵ch(memplex1,memeplex2,...,memeplexn),構(gòu)建相鄰進(jìn)化種群相似度矩陣psm,設(shè)計(jì)第i個(gè)進(jìn)化種群memeplexi的知識約簡效能評估計(jì)算方法emi,用于第i個(gè)電子病歷優(yōu)化數(shù)據(jù)子集emri的知識約簡效能評估;
c.根據(jù)影響電子病歷優(yōu)化數(shù)據(jù)子集知識約簡效能的進(jìn)化種群分布規(guī)律,構(gòu)造一種級聯(lián)評估指標(biāo)矩陣zi,并進(jìn)行該指標(biāo)矩陣的迭代優(yōu)化,然后進(jìn)一步構(gòu)造級聯(lián)矩陣zi的閉包矩陣zi*,求出級聯(lián)評估指標(biāo)矩陣的最優(yōu)評估矩陣zi′;
d.第i個(gè)進(jìn)化種群memeplexi利用知識約簡效能評估計(jì)算方法emi和級聯(lián)評估指標(biāo)矩陣的最優(yōu)矩陣zi′,求出第i個(gè)電子病歷優(yōu)化數(shù)據(jù)子集emri的知識約簡效能評估精度值epi;
e.比較上述求出的知識約簡效能評估精度epi與預(yù)先設(shè)定的評估精度值λ關(guān)系如下:
如果epi≤λ,則第i個(gè)進(jìn)化種群memeplexi對第i個(gè)電子病歷優(yōu)化數(shù)據(jù)子集emri的知識約簡效能評估過程結(jié)束,接下來,將轉(zhuǎn)向第i+1個(gè)種群memeplexi+1進(jìn)行第i+1個(gè)電子病歷優(yōu)化數(shù)據(jù)子集emri+1的知識約簡效能評估過程;
如果epi>λ,則第i個(gè)進(jìn)化種群memeplexi繼續(xù)進(jìn)行上述第i個(gè)電子病歷優(yōu)化數(shù)據(jù)子集emri的知識約簡效能評估,進(jìn)一步優(yōu)化效能評估精度epi,直至滿足epi=λ;
f.求出上述電子病歷知識約簡效能最優(yōu)評估精度
步驟b中所述設(shè)計(jì)多進(jìn)化種群協(xié)同熵ch(memplex1,memeplex2,...,memeplexn),構(gòu)建相鄰進(jìn)化種群相似度矩陣psm,設(shè)計(jì)第i個(gè)進(jìn)化種群memeplexi的知識約簡效能評估計(jì)算方法emi,用于第i個(gè)電子病歷優(yōu)化數(shù)據(jù)子集emri的知識約簡效能評估;具體步驟如下:
a.設(shè)用于電子病歷優(yōu)化數(shù)據(jù)子集知識約簡效能評估的第1個(gè)進(jìn)化種群為memeplex1,第2個(gè)進(jìn)化種群為memeplex2,以此類推,第i個(gè)進(jìn)化種群為memeplexi,第n個(gè)進(jìn)化種群為memeplexn;
b.計(jì)算相鄰的第i個(gè)和第i+1個(gè)進(jìn)化種群間的級聯(lián)系數(shù)為αi,計(jì)算公式為
其中g(shù)i為在第i個(gè)進(jìn)化種群中尋找出最優(yōu)進(jìn)化個(gè)體的迭代次數(shù),gi+1為在第i+1個(gè)進(jìn)化種群中尋找出最優(yōu)進(jìn)化個(gè)體的迭代次數(shù),e為自然常數(shù),取值為2.72;
c.設(shè)計(jì)n個(gè)進(jìn)化種群的協(xié)同熵為ch(memplex1,memeplex2,...,memeplexn),計(jì)算公式為
其中n為參與電子病歷優(yōu)化數(shù)據(jù)子集知識約簡效能評估的進(jìn)化種群數(shù),|memeplexi|第i個(gè)進(jìn)化種群memeplexi內(nèi)進(jìn)化個(gè)體數(shù),αi為相鄰進(jìn)化種群間的級聯(lián)系數(shù);
d.構(gòu)建進(jìn)化種群的相似度矩陣psm,定義為
其中
其中g(shù)i為第i個(gè)進(jìn)化種群尋找出最優(yōu)進(jìn)化個(gè)體的迭代次數(shù),gj為尋找出最差進(jìn)化個(gè)體的迭代次數(shù);
e.設(shè)計(jì)參與電子病歷知識約簡效能評估的進(jìn)化種群重要度增長系數(shù)為
其中exp(·)為以自然常數(shù)e為底的指數(shù)函數(shù),e的取值為2.72;
f.構(gòu)建面向云計(jì)算框架mapreduce的n層電子病歷知識約簡效能評估協(xié)同熵矩陣lcm,其具體定義為
其中每個(gè)元素
g.設(shè)計(jì)第i個(gè)電子病歷優(yōu)化數(shù)據(jù)子集emri的知識約簡效能一致性評估計(jì)算方法emi為
步驟c中根據(jù)影響電子病歷優(yōu)化數(shù)據(jù)子集知識約簡效能的進(jìn)化種群分布規(guī)律,構(gòu)造一種級聯(lián)評估指標(biāo)矩陣zi,并進(jìn)行該指標(biāo)矩陣的迭代優(yōu)化,然后進(jìn)一步構(gòu)造級聯(lián)矩陣zi的閉包矩陣zi*,求出級聯(lián)評估指標(biāo)矩陣的最優(yōu)評估矩陣zi′;具體步驟如下:
a.根據(jù)影響電子病歷優(yōu)化數(shù)據(jù)子集知識約簡效能的進(jìn)化種群分布規(guī)律,設(shè)計(jì)級聯(lián)評估指標(biāo)矩陣zi的初始矩陣z1為
其中初始矩陣z1中每個(gè)元素
b.設(shè)計(jì)z2矩陣為將z1最右邊一列移走而在最左邊增加一列
同樣設(shè)計(jì)z3矩陣為將z2最右邊一列移走而在最左邊增加一列
c.對于i≥0,按照上述級聯(lián)優(yōu)化方式,將zi矩陣的計(jì)算方法設(shè)計(jì)為將zi-1最右邊一列移走,而在最左邊增加一列
d.構(gòu)造級聯(lián)矩陣zi的閉包矩陣為zi*,該矩陣具體定義如下:
e.構(gòu)造兩個(gè)常量輔助線性矩陣b和c,具體構(gòu)造如下:
和
f.構(gòu)造聯(lián)聯(lián)評估指標(biāo)矩陣zi的優(yōu)化矩陣zi′為
其中運(yùn)算符
本發(fā)明公開了一種用于電子病歷知識約簡效能評估的多種群協(xié)同熵級聯(lián)方法。該方法首先利用云計(jì)算中map操作與reduce操作將大規(guī)模電子病歷數(shù)據(jù)集劃分成不同的電子病歷優(yōu)化數(shù)據(jù)子集;接著構(gòu)建相鄰進(jìn)化種群相似度矩陣,利用進(jìn)化種群協(xié)同熵設(shè)計(jì)知識約簡效能計(jì)算方法;然后分析影響電子病歷知識約簡效能的進(jìn)化種群分布規(guī)律,構(gòu)造一種級聯(lián)評估指標(biāo)矩陣并進(jìn)行矩陣優(yōu)化;最后評估電子病歷知識約簡效能評估精度,輸出電子病歷知識約簡效能最優(yōu)評估精度。該方法對云計(jì)算環(huán)境下大規(guī)模電子病歷知識約簡定性定量化智能分析以及相關(guān)疾病輔助診斷療效評估具有較好的應(yīng)用價(jià)值。
最后應(yīng)說明的是:雖然以上已經(jīng)詳細(xì)說明了本發(fā)明及其優(yōu)點(diǎn),但是應(yīng)當(dāng)理解在不超出由所附的權(quán)利要求所限定的本發(fā)明的精神和范圍的情況下可以進(jìn)行各種改變、替代和變換。而且,本發(fā)明的范圍不僅限于說明書所描述的過程、設(shè)備、手段、方法和步驟的具體實(shí)施例。本領(lǐng)域內(nèi)的普通技術(shù)人員從本發(fā)明的公開內(nèi)容將容易理解,根據(jù)本發(fā)明可以使用執(zhí)行與在此所述的相應(yīng)實(shí)施例基本相同的功能或者獲得與其基本相同的結(jié)果的、現(xiàn)有和將來要被開發(fā)的過程、設(shè)備、手段、方法或者步驟。因此,所附的權(quán)利要求旨在在它們的范圍內(nèi)包括這樣的過程、設(shè)備、手段、方法或者步驟。