冊(cè)6,虹 &811〇8&)〈1;并且(2)在診斷資料庫(kù)中,至少有一種診斷家族01八6, 其S(DRUG,DIAG)彡1,則發(fā)出一警報(bào)。
[0160] 機(jī)器學(xué)習(xí)推斷引擎:
[0161] 機(jī)器學(xué)習(xí)(machine learning, ML)推斷引擎使用資料驅(qū)動(dòng)的分類(lèi)以及回歸技術(shù), 以識(shí)別出一處方可能為錯(cuò)誤的情況。對(duì)于在本發(fā)明的機(jī)器學(xué)習(xí)引擎中所使用的不同的演算 法,以及對(duì)于可以用于本發(fā)明的后續(xù)實(shí)現(xiàn)中的其他演算法,有一些基本原則是常見(jiàn)的:
[0162] (1)許多患者的健康記錄的歷史資料備用作為演算法的訓(xùn)練組,作為調(diào)整預(yù)測(cè)模 型幷且獲得適當(dāng)模型參數(shù)值的基準(zhǔn)。
[0163] (2)無(wú)監(jiān)督學(xué)習(xí)技術(shù)(Unsupervised Learning Techniques)被用于識(shí)別歷史資料 庫(kù)中的多個(gè)模式,支援未來(lái)多個(gè)處方的識(shí)別,以符合離群的正常模式。
[0164] (3)醫(yī)師、護(hù)士、和本系統(tǒng)使用者對(duì)于向他們發(fā)出的警報(bào)的反饋可形成監(jiān)督學(xué)習(xí)技 術(shù)(Supervised Learning Techniques)的被標(biāo)記范例,以允許本系統(tǒng)以更準(zhǔn)確地調(diào)整其預(yù) 測(cè)演算法,特別是對(duì)于特定使用者調(diào)整其警報(bào)的靈敏度閾值。
[0165] 下面舉例說(shuō)明上述各原則:
[0166] 度量分析的離群檢驗(yàn)(outlier detection):
[0167] 患者健康記錄的數(shù)字代表式可被視為在多維向量空間的點(diǎn)(維度等于代表式中 的特征數(shù)量)。在所述空間里給定一度量(metrics) (「距離函數(shù)」),此度量空間內(nèi)離群檢 驗(yàn)可以指出可能的錯(cuò)誤藥方。當(dāng)接收處方P的一患者,具有代表式向量R,此方法是根據(jù)測(cè) 量代表式接近R的患者之間的處方P的頻率。
[0168] 此一方法可以如下實(shí)現(xiàn):
[0169] (1)固定一些自然數(shù)N(例如50),和一閾值0 (〇〈0〈1)。這些參數(shù)的值可以根據(jù) 在參數(shù)空間(parameter space)局部搜索而被優(yōu)化。接收處方p的患者中,尋找代表式最 接近R的N個(gè)患者,并且計(jì)算R與這些患者的代表式之間的距離d的平均值。并且計(jì)算R 與N個(gè)最鄰近者之間的距離D的平均值。如果d>D* 0,發(fā)出一警告。
[0170](2)固定一些自然數(shù)N(例如1000),以及兩個(gè)閾值0 1與0 2。計(jì)算代表式最接近 R的N個(gè)患者之間的處方p的頻率f。并且計(jì)算從族群中隨機(jī)取樣N個(gè)患者的處方p的頻 率平均值^和標(biāo)準(zhǔn)偏差〇。如果((〇〈9 1)并且(卜1〇〇,9 2)),發(fā)出一警報(bào)。
[0171] 使用離群檢驗(yàn)的叢集化演算法:
[0172] 可以應(yīng)用叢集化演算法,如KNN法(K Nearest Neighbors)或K平均值法(K Means),將所有患者分類(lèi)為相對(duì)較少個(gè)數(shù)的多個(gè)叢集。直觀而言,這些叢集代表具有相似況 的患者的多個(gè)群組。例如,由于相關(guān)于血糖檢驗(yàn)結(jié)果、糖尿病門(mén)診就診、體重指數(shù)(BMI)等 特征數(shù)值的相似性,第2型糖尿病的大多數(shù)患者可能形成一叢集。
[0173] -旦已執(zhí)行叢集化,一患者的叢集ID可被用于引導(dǎo)離群檢驗(yàn)。例如,如果一給定 的藥物很少被開(kāi)處方于一患者所屬的所有叢集,那么給予所述患者的處方更有可能是錯(cuò)誤 的。
[0174] 使用監(jiān)督學(xué)習(xí)技術(shù)的警報(bào)微調(diào):
[0175] 有關(guān)一般處方的歷史資料不包含「標(biāo)示」一特定處方是否適當(dāng)或錯(cuò)誤,因此不適合 應(yīng)用于監(jiān)督學(xué)習(xí)演算法。
[0176] 相對(duì)于警報(bào)已發(fā)送于的一套較小的處方,這情況是不同的。醫(yī)生/護(hù)士對(duì)于警報(bào) 的回應(yīng)確實(shí)可以作為適當(dāng)處方的可靠指標(biāo)。本系統(tǒng)采用監(jiān)督學(xué)習(xí)的一第二演算層,其利用 使用者的反饋意見(jiàn),以微調(diào)警報(bào)及將其個(gè)人化。
[0177] 在下面的例子中,「標(biāo)識(shí)的樣品」是三元體(triplet)〈R,p,1>,其中R是在某個(gè)時(shí) 間點(diǎn)一患者的代表式;P是當(dāng)時(shí)給予患者的處方,所述處方導(dǎo)會(huì)致本系統(tǒng)的警報(bào);1是一個(gè) 二進(jìn)制標(biāo)記:如果警報(bào)被拒絕則為〇,如果被接受則為1。
[0178] 通過(guò)在一組標(biāo)識(shí)樣品上訓(xùn)練一分類(lèi)演算法,可以提高底層警報(bào)的準(zhǔn)確性,識(shí)別被 基于規(guī)則的、統(tǒng)計(jì)的、離群檢驗(yàn)的方法所錯(cuò)誤分類(lèi)的處方,幷且應(yīng)該抑制所述處方。例如, 被標(biāo)識(shí)的資料組可以用來(lái)訓(xùn)練支援向量機(jī)(Support Vector Machine, SVM)區(qū)分真和假 警報(bào)。通過(guò)把被標(biāo)識(shí)的資料分類(lèi)成為訓(xùn)練組和測(cè)試組,所述支援向量機(jī)的性能可以被交 叉驗(yàn)證,幷且其多個(gè)參數(shù)可以調(diào)節(jié),以達(dá)到一適當(dāng)?shù)木_度召回折衷(precision-recall tradeoff)。為了在盡可能識(shí)別越多的錯(cuò)誤的需求與減少錯(cuò)誤警報(bào)率的需求之間取得平衡, 這樣的調(diào)整很重要,以避免使用者中被稱(chēng)為「警報(bào)疲勞」的這種現(xiàn)象,所述使用者接觸到過(guò) 多的錯(cuò)誤警報(bào)。
[0179] 除了提高系統(tǒng)的整體性能,監(jiān)督學(xué)習(xí)階段也可以用于針對(duì)不同使用者的使用模式 將警報(bào)個(gè)人化。「背景變量(context variable)」C可被添加到被標(biāo)識(shí)的樣品:<R,p,C,1> 以識(shí)別開(kāi)立處方的醫(yī)生、開(kāi)立處方的醫(yī)生的專(zhuān)業(yè)、合適的病房或診所類(lèi)型等。通過(guò)將背景列 入分類(lèi)過(guò)程的考量,分類(lèi)演算法可以不僅根據(jù)所述患者條件,還可取決于背景的不同而決 定。
[0180] 例如,考量一腫瘤科醫(yī)生通常開(kāi)立化療的處方。在一些情況下,當(dāng)在患者的醫(yī)療記 錄中仍有少量的惡性指示,如果有的話(huà),可以開(kāi)立化療的處方。對(duì)于其他醫(yī)生,這樣的處方 可能會(huì)導(dǎo)致一警告,但在腫瘤科醫(yī)生的情況下,它不會(huì)被視為特殊情況,除非一些其他因素 給予這種指示(例如,此醫(yī)生從來(lái)沒(méi)有開(kāi)過(guò)此藥物的處方)。同樣地,一背景變量可能待表 特定病房和組織所設(shè)定的不同優(yōu)先事項(xiàng)和準(zhǔn)則。很容易了解其他分類(lèi)演算法,例如,決策樹(shù) 或線性分類(lèi)分析,運(yùn)用在上面所述,而非支持向量機(jī)(SVM)。
[0181] 1/0 介面:
[0182] 本系統(tǒng)可以根據(jù)一網(wǎng)絡(luò)伺服器技術(shù)。在這樣的實(shí)施方案中,與電子醫(yī)療記錄(EMR) 和醫(yī)囑系統(tǒng)(CP0E)的介面是根據(jù)在這三個(gè)系統(tǒng)之間來(lái)回發(fā)送的訊息,發(fā)送和回應(yīng)資料的 查詢(xún)。為了簡(jiǎn)單起見(jiàn),下面的示例幷不會(huì)使醫(yī)囑系統(tǒng)和電子醫(yī)療記錄系統(tǒng)之間有所區(qū)別,幷 認(rèn)為前者作為內(nèi)后者的構(gòu)件。
[0183] 對(duì)于其處方需要分析的患者細(xì)節(jié),本系統(tǒng)的維持更新,是通過(guò)查詢(xún)電子醫(yī)療記錄 系統(tǒng)或是一旦區(qū)域被更新,接收「推動(dòng)(push)」更新。
[0184] 本系統(tǒng)所用的資料例子包括:
[0185] (1)患者人口統(tǒng)計(jì)
[0186] (2)住院記錄
[0187] (3)門(mén)診診療記錄
[0188] (4)診斷(過(guò)去、慢性和急性)
[0189] (5)血液檢驗(yàn)歷史
[0190] (6)慢性藥物
[0191] (7)用藥處方歷史
[0192] (8)生命體征歷史
[0193] 從電子醫(yī)療記錄發(fā)送到本系統(tǒng)的資訊包含用于分析的藥物處方,患者具體資料、 管理資料以及事件指標(biāo),例如,在急診室、醫(yī)院科室或是門(mén)診診所的患者掛號(hào)。
[0194] 從電子醫(yī)療記錄發(fā)送到本系統(tǒng)的事件被用來(lái)通知特定資料將很快被需要,因此本 系統(tǒng)是必需獲得/加載它。此事件的例子有:
[0195] (1)即將來(lái)臨的患者(入院,門(mén)診就診等)_需要加載和更新患者資訊
[0196] (2)即將離開(kāi)的患者(出院,離開(kāi)門(mén)診等)_需要保存和卸載患者資料物件
[0197] (3)使用者進(jìn)入電子醫(yī)療記錄中的處方子系統(tǒng)-需要更新所有患者的具體資料, 以分析傳入的處方。
[0198] (4)請(qǐng)求處方錯(cuò)誤和回應(yīng)報(bào)告-需要建立一報(bào)告,其包含一時(shí)間范圍內(nèi)所有識(shí)別 到的錯(cuò)誤以及使用者對(duì)這些錯(cuò)誤的回應(yīng)(即接受或拒絕)
[0199] (5)傳入的血液檢驗(yàn)或其他實(shí)驗(yàn)室結(jié)果-包含所有相關(guān)的血液檢驗(yàn)結(jié)果,其由電 子醫(yī)療記錄接收幷且傳送到本系統(tǒng)以再次分析有效處方。
[0200] 從本系統(tǒng)發(fā)送至電子醫(yī)療記錄的資訊包含患者/管理資料以及用藥錯(cuò)誤警報(bào)的 請(qǐng)求。從本系統(tǒng)到電子醫(yī)療記錄的資料請(qǐng)求包括對(duì)傳入事件回應(yīng)的請(qǐng)求(例如:在收到 指出一患者已經(jīng)進(jìn)入醫(yī)院的事件后立即請(qǐng)求「獲得患者詳細(xì)資訊」),或依照時(shí)間順序請(qǐng)求 (例如:「獲得生命體征」,在從所有「有效」患者獲得最新生命體征之后,所述系統(tǒng)更新本 身)。
[0201] 資料請(qǐng)求的例子包括:
[0202] (1)獲取患者資訊-在一特定時(shí)間范圍內(nèi)的患者列表
[0203] (2)獲取生命體征-在一特定時(shí)間范圍內(nèi)的患者列表
[0204] (3)獲住院/門(mén)診患者的就診-在一特定時(shí)間范圍內(nèi)的患者列表
[0205] (4)獲得血液檢驗(yàn)-在一特定時(shí)間范圍內(nèi)的患者列表
[0206] (5)獲取診斷-患者列表
[0207] (6)獲取藥物過(guò)敏-患者列表
[0208] (7)獲取慢性/活性藥物-患者列表
[0209] (8)獲取機(jī)構(gòu)藥品列表
[0210] (9)獲取機(jī)構(gòu)部門(mén)/單位/門(mén)診患者列表
[0211] (10)獲取機(jī)構(gòu)用戶(hù)列表(醫(yī)生/護(hù)士和藥劑師)
[0212] 警報(bào)可以在開(kāi)處方的時(shí)候發(fā)出,和/或在之后的階段,當(dāng)新的血液檢驗(yàn)/診斷被標(biāo) 注且用藥仍然有效時(shí)(主要是,藥物-血液檢驗(yàn)的不相容性和藥物-診斷不相容性)。
[0213] 相對(duì)于處方分析和警報(bào),本系統(tǒng)與電子醫(yī)療記錄之間的通信流量可如以下所述:
[0214] (1)從電子醫(yī)療記錄至本系統(tǒng):處方細(xì)節(jié)
[0215] (2)從本系統(tǒng)到電子醫(yī)療記錄:警報(bào)資訊(如果適用)
[0216] (3)從電子醫(yī)療記錄至本系統(tǒng):使用者回應(yīng)警報(bào)(接受或拒絕)
[0217] 本領(lǐng)域普通技術(shù)人員在檢視下面的實(shí)施例后,本發(fā)明的額外的目的、優(yōu)點(diǎn)和新穎 特征將變得明顯,這目的幷不在限制本技術(shù)領(lǐng)域。
[0218] 實(shí)施例:
[0219] 現(xiàn)在參考以下例子幷結(jié)合同上述描述,說(shuō)明本發(fā)明非限制性的方式。
[0220] 使用資料驅(qū)動(dòng)方法識(shí)別藥物處方錯(cuò)誤:
[0221] 使用具有單一藥物家族和二維患者代表式的一簡(jiǎn)單例子來(lái)說(shuō)明用于識(shí)別可能的 處方錯(cuò)誤S中的資料驅(qū)動(dòng)方法。問(wèn)題中的藥物家族是他汀類(lèi)藥物(statins) (ATC代碼 C10AA),并選擇用來(lái)形容患者的兩個(gè)特征是他們的年齡和他們最新的GPT肝酶檢驗(yàn)結(jié)果。
[0222] 圖3說(shuō)明接收他汀類(lèi)藥物(黑點(diǎn))與未接收他汀類(lèi)藥物的患者(灰點(diǎn))的分布, 其沿所選擇的代表式的兩維度。繪制對(duì)應(yīng)來(lái)自于所述兩組的100000個(gè)患者的代表式的點(diǎn)。 十字形點(diǎn)代表被開(kāi)他汀類(lèi)藥物處方的患者,對(duì)他們來(lái)說(shuō)所述處方被識(shí)別為一可能的錯(cuò)誤患 者。
[0223]本發(fā)明的演算法被用來(lái)如下識(shí)別這些可能的錯(cuò)誤:
[0224] a.將所述二維的刻度標(biāo)準(zhǔn),依照樣品沿著維度的標(biāo)準(zhǔn)偏差將各維度分割;
[0225] b.對(duì)于每個(gè)點(diǎn)p代表被開(kāi)立他汀類(lèi)藥物處方的一患者,找到k個(gè)最近點(diǎn)ql、 q2、...、qK,其對(duì)應(yīng)開(kāi)立他汀類(lèi)藥物處方的其他患者,而距離的度量是由L °°標(biāo)準(zhǔn)(norm)所 誘導(dǎo),例如:沿著所有座標(biāo)的最大距離;
[0226] c.計(jì)算p與每個(gè)pi、. . .、pK之間的k個(gè)距離dl,d2、. . .、dk ;