用于數(shù)據(jù)致密化的方法和系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及數(shù)據(jù)致密化,具體而言,涉及用于改進的表型的電子醫(yī)學(xué)記錄的致密 化。
【背景技術(shù)】
[0002] 患者電子醫(yī)學(xué)記錄(EMR)是從任何醫(yī)療保健設(shè)置中的一次或多次就診中生成的 縱向患者健康信息的系統(tǒng)集合。縱向EMR表型的有效利用是許多現(xiàn)代醫(yī)學(xué)信息學(xué)研究問題 的關(guān)鍵,例如疾病早期診斷、療效比較研究以及患者危險分層。
[0003] 關(guān)于縱向EMR的一個挑戰(zhàn)是數(shù)據(jù)稀疏性。當(dāng)處理稀疏矩陣時,許多現(xiàn)有方法將稀 疏矩陣的零值看作實際的零,并使用概括統(tǒng)計從稀疏矩陣中構(gòu)建特征向量,然后將這些特 征向量饋送到計算模型中以執(zhí)行特定任務(wù)。然而,該方法不適于醫(yī)學(xué)領(lǐng)域,因為零項不是實 際的零,而是遺漏值(例如,患者沒有來訪,因此沒有對應(yīng)記錄)。因此,以這種方式構(gòu)建的 特征向量可能是不準(zhǔn)確的。因此,計算模型的性能將受到影響。
【發(fā)明內(nèi)容】
[0004] 一種用于數(shù)據(jù)致密化的方法包括將患者數(shù)據(jù)表示為針對每個患者的稀疏患者矩 陣。稀疏患者矩陣被分解成多個矩陣,包括表明患者數(shù)據(jù)的醫(yī)學(xué)概念的概念矩陣和表明醫(yī) 學(xué)概念的時間關(guān)系的演化矩陣。稀疏患者矩陣中的遺漏信息基于多個矩陣使用處理器來推 算,以提供致密的患者矩陣。
[0005] -種用于數(shù)據(jù)致密化的系統(tǒng)包括矩陣形成模塊,其被配置為將患者數(shù)據(jù)表示為針 對每個患者的稀疏患者矩陣。分解模塊被配置為將稀疏患者矩陣分解成多個矩陣,其中多 個矩陣包括表明患者數(shù)據(jù)的醫(yī)學(xué)概念的概念矩陣和表明醫(yī)學(xué)概念的時間關(guān)系的演化矩陣。 推算模塊被配置為基于多個矩陣使用處理器推算稀疏患者矩陣中的遺漏信息,以提供致密 的患者矩陣。
[0006] 根據(jù)以下結(jié)合附圖閱讀的說明性實施例的詳細(xì)描述,這些及其它特征和優(yōu)點將變 得顯而易見。
【附圖說明】
[0007] 本公開內(nèi)容將參考以下附圖在以下優(yōu)選實施例的描述中提供詳情,其中:
[0008] 圖1是示出根據(jù)一個說明性實施例的患者矩陣致密化的應(yīng)用的高級概覽的框圖/ 流程圖;
[0009] 圖2是示出根據(jù)一個說明性實施例的用于縱向電子醫(yī)學(xué)記錄數(shù)據(jù)的致密化的系 統(tǒng)的框圖/流程圖;
[0010] 圖3是根據(jù)一個說明性實施例的示例性縱向患者矩陣;
[0011] 圖4是示出根據(jù)一個說明性實施例的用于縱向電子醫(yī)學(xué)記錄數(shù)據(jù)的致密化的方 法的框圖/流程圖;
【具體實施方式】
[0012] 根據(jù)本原理,提供了用于縱向電子醫(yī)學(xué)記錄(EMR)的致密化的系統(tǒng)和方法。關(guān)于 使用EMR數(shù)據(jù)的一個挑戰(zhàn)方面是數(shù)據(jù)稀疏性。本原理提出了通過探索特征維度和時間維度 兩者的結(jié)構(gòu)來推算那些遺漏項(即,矩陣中的零)的值,從而對稀疏患者矩陣進行致密化的 框架。
[0013] 具體地,在優(yōu)選實施例中,每個患者的患者矩陣被分解或因式分解成醫(yī)學(xué)概念映 射矩陣和概念值演化矩陣。通過基于群的性質(zhì)制定優(yōu)化問題來推算遺漏項。對于醫(yī)學(xué)概念 在患者之間彼此互不相同的異類群,對于每個患者,學(xué)習(xí)個人概念矩陣。對于患者的醫(yī)學(xué)概 念彼此很相似的同類群,在該群患者中共享概念矩陣。然后,對優(yōu)化問題求解,以對每個患 者確定致密醫(yī)學(xué)概念映射矩陣和致密概念值演化矩陣。然后,患者矩陣被還原為醫(yī)學(xué)概念 映射矩陣和概念值演化矩陣的積,以推算患者矩陣中的遺漏值。以這種方式,提供患者EMR 的更致密的表示,并且這些醫(yī)學(xué)概念的值隨著時間平滑地演變。因此,被還原的患者矩陣 更加致密,并可用于導(dǎo)出比從原始EMR矩陣中獲得的特征向量具有更高預(yù)測能力的特征向 量。
[0014] 所屬技術(shù)領(lǐng)域的技術(shù)人員知道,本發(fā)明的各個方面可以實現(xiàn)為系統(tǒng)、方法或計算 機程序產(chǎn)品。因此,本發(fā)明的各個方面可以具體實現(xiàn)為以下形式,即:完全的硬件實施方式、 完全的軟件實施方式(包括固件、駐留軟件、微代碼等),或硬件和軟件方面結(jié)合的實施方 式,這里可以統(tǒng)稱為"電路"、"模塊"或"系統(tǒng)"。此外,在一些實施例中,本發(fā)明的各個方面 還可以實現(xiàn)為在一個或多個計算機可讀介質(zhì)中的計算機程序產(chǎn)品的形式,該計算機可讀介 質(zhì)中包含計算機可讀的程序代碼。
[0015] 可以采用一個或多個計算機可讀介質(zhì)的任意組合。計算機可讀介質(zhì)可以是計算 機可讀信號介質(zhì)或者計算機可讀存儲介質(zhì)。計算機可讀存儲介質(zhì)例如可以是一但不限 于一電、磁、光、電磁、紅外線、或半導(dǎo)體的系統(tǒng)、裝置或器件,或者任意以上的組合。計算 機可讀存儲介質(zhì)的更具體的例子(非窮舉的列表)包括:具有一個或多個導(dǎo)線的電連接、便 攜式計算機盤、硬盤、隨機存取存儲器(RAM)、只讀存儲器(ROM)、可擦式可編程只讀存儲器 (EPROM或閃存)、光纖、便攜式緊湊盤只讀存儲器(CD-ROM)、光存儲器件、磁存儲器件、或者 上述的任意合適的組合。在本文件中,計算機可讀存儲介質(zhì)可以是任何包含或存儲程序的 有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。
[0016] 計算機可讀的信號介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號, 其中承載了計算機可讀的程序代碼。這種傳播的數(shù)據(jù)信號可以采用多種形式,包括一但 不限于一電磁信號、光信號或上述的任意合適的組合。計算機可讀的信號介質(zhì)還可以是 計算機可讀存儲介質(zhì)以外的任何計算機可讀介質(zhì),該計算機可讀介質(zhì)可以發(fā)送、傳播或者 傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。
[0017] 計算機可讀介質(zhì)上包含的程序代碼可以用任何適當(dāng)?shù)慕橘|(zhì)傳輸,包括一但不限 于一無線、有線、光纜、RF等等,或者上述的任意合適的組合。
[0018] 可以以一種或多種程序設(shè)計語言的任意組合來編寫用于執(zhí)行本發(fā)明操作的計算 機程序代碼,所述程序設(shè)計語言包括面向?qū)ο蟮某绦蛟O(shè)計語言一諸如Java、Smalltalk、C++ 等,還包括常規(guī)的過程式程序設(shè)計語言一諸如"C"語言或類似的程序設(shè)計語言。程序代碼可 以完全地在用戶計算機上執(zhí)行、部分地在用戶計算機上執(zhí)行、作為一個獨立的軟件包執(zhí)行、 部分在用戶計算機上部分在遠程計算機上執(zhí)行、或者完全在遠程計算機或服務(wù)器上執(zhí)行。 在涉及遠程計算機的情形中,遠程計算機可以通過任意種類的網(wǎng)絡(luò)一包括局域網(wǎng)(LAN) 或廣域網(wǎng)(WAN)-連接到用戶計算機,或者,可以連接到外部計算機(例如利用因特網(wǎng)服務(wù) 提供商來通過因特網(wǎng)連接)。
[0019] 下面將參照根據(jù)本發(fā)明實施例的方法、裝置(系統(tǒng))和計算機程序產(chǎn)品的流程圖 和/或框圖描述本發(fā)明。應(yīng)當(dāng)理解,流程圖和/或框圖的每個方框以及流程圖和/或框圖 中各方框的組合,都可以由計算機程序指令實現(xiàn)。這些計算機程序指令可以提供給通用計 算機、專用計算機或其它可編程數(shù)據(jù)處理裝置的處理器,從而生產(chǎn)出一種機器,使得這些計 算機程序指令在通過計算機或其它可編程數(shù)據(jù)處理裝置的處理器執(zhí)行時,產(chǎn)生了實現(xiàn)流程 圖和/或框圖中的一個或多個方框中規(guī)定的功能/動作的裝置。
[0020] 也可以把這些計算機程序指令在計算機、其它可編程數(shù)據(jù)處理裝置、或其他設(shè)備 上加載,從而產(chǎn)生,存儲在計算機可讀介質(zhì)中的指令就產(chǎn)生出包括實現(xiàn)流程圖和/或框圖 中的一個或多個方框中規(guī)定的功能/動作的指令的制造品(article of manufacture)。也 可以把計算機程序指令加載到計算機、其它可編程數(shù)據(jù)處理裝置、或其它設(shè)備上,使得在計 算機、其它可編程數(shù)據(jù)處理裝置或其它設(shè)備上執(zhí)行一系列操作步驟,以產(chǎn)生計算機實現(xiàn)的 過程,從而使得在計算機或其它可編程裝置上執(zhí)行的指令提供實