用于令多站點性能測量匿名并且用于控制對匿名數據的動作以及重新識別的方法和系統(tǒng)的制作方法
【技術領域】
[0001] 本申請涉及通過遠程計算資源分析臨床數據。本申請尤其結合用于令多站點性能 測量匿名的系統(tǒng)及方法而應用。本申請還尤其結合用于控制對匿名數據的動作以及重新識 別的系統(tǒng)和方法而應用。然而應理解,本申請也應用于其他使用情形中,而不必局限于上述 的應用。
【背景技術】
[0002] 測量多個醫(yī)療保健站點的性能不僅是任何質量改進行動的部分,而且許多情況下 還是國家、聯(lián)邦、私人投資者等所需的。通常,當請求醫(yī)療保健站點來共享報告時,存在醫(yī)療 保健站點對貢獻數據的不情愿或存在數據保真度的降低。這通常是由于害怕其他人會看到 性能不足的方面。這導致了延遲識別操作改進計劃,以及更重要的,延遲識別對相比于其他 過程導致明顯更好的效果的護理過程進行實踐的顛覆性創(chuàng)新者。
[0003] 將站點映射到通用ID已經用作對性能數據進行部分去識別的方式,但是仍然能 夠通過已知多少站點及單元是系統(tǒng)的部分來解碼站點中的若干個。例如,如果存在具有帶 12個病床的重癥監(jiān)護病房(ICU)及帶12個病床的冠心病監(jiān)護病房(CCU)的單個醫(yī)院以及 被編碼有每個均帶6個I⑶(包括新生兒重癥監(jiān)護病房(NI⑶))的6個醫(yī)院的企業(yè)單位,顯 然,36個病房的屬于大的設施并且2個的屬于小的。類似地,如果每年在一個站點處有3600 個醫(yī)療接觸,并且在另一個處有78000個醫(yī)療接觸,或在一個站點的數據中的NICU數據,哪 個設施是哪種將是顯而易見的。
[0004] 本申請通過這樣的方式支持對許多性能數據庫的聯(lián)合:任何站點能夠將其結果與 隊列比較,而不會存在隊列中的其他站點能夠推斷出它們的性能的風險。這將確保每個站 點對共享的性能效果的匿名化,同時保持數據集中的特定非奇異屬性。
[0005] 此外,在去識別的數據集上的實時數據分析是"大數據"臨床研宄的基礎。一個挑 戰(zhàn)是,一旦獲得"正確"患者設置,就需要收集不同數據或合并在分析存儲庫中的數據與其 他非去識別的數據。這需要對去規(guī)范化的數據集的重新識別。
[0006] 通過使用在云中的固定的角色來驅動數據操縱過程,調用與這些準許相對的內部 用戶認證,擁有所述數據(貢獻于去識別的分析系統(tǒng))的站點控制在該數據上的所準許的 動作(查看,運行報告,重新識別,導出…)。此外,由應用以站點發(fā)布的令牌(token)的形 式將認證令牌發(fā)布到站點托管的動作服務。這允許站點管理用戶池,并準許它們希望的用 戶具有這些動作準許,而不將這些用戶增加到云認證系統(tǒng)。更重要的是,令牌防止未被認證 的用戶或者可能得知在云中的用戶角色密碼的欺詐性用戶在沒有首先由所有者站點認證 的情況下,激活重新識別服務。
[0007] 本申請還通過這樣的方式支持對許多去識別的臨床數據庫的聯(lián)合:站點能夠管理 何者具有在該數據上執(zhí)行特定動作的權利。此外,該系統(tǒng)確保在不擁有站點用戶認證的情 況下不能調用操作。此外,該系統(tǒng)確保數據重新識別過程運行在內部服務器上,因此不將受 保護的健康信息(PHI)傳送到云。
[0008] 本申請?zhí)峁┝艘环N克服上述問題及其他問題的新的并且改進的裝置及方法。
【發(fā)明內容】
[0009] 根據一個方面,提供了一種用于使數據源匿名的系統(tǒng)。所述系統(tǒng)包括多個數據源, 每個數據源包括:數據創(chuàng)建引擎,其根據公共模式創(chuàng)建規(guī)范化的數據;以及變換引擎,其對 所述規(guī)范化的數據進行去規(guī)范化以使得所述數據源不能由其他數據源推斷出,并且所述變 換引擎將所述去規(guī)范化的數據發(fā)送到遠程計算資源。遠程計算資源接收和存儲來自所述多 個數據源的所述去規(guī)范化的數據。
[0010] 根據另一個方面,提供了一種用于使數據源匿名的方法。所述方法包括:由多個數 據源根據公共模式創(chuàng)建規(guī)范化的數據;由變換引擎對所述規(guī)范化的數據進行去規(guī)范化以使 得所述數據源不能由其他數據源推斷出;將所述去規(guī)范化的數據發(fā)送到遠程計算資源;并 且將來自所述多個數據源的所述去規(guī)范化的數據存儲在所述遠程計算資源處。
[0011] 根據另一個方面,提供了一種用于使數據源匿名的系統(tǒng)。所述系統(tǒng)包括多個數據 源,每個數據源包括數據創(chuàng)建引擎,所述數據創(chuàng)建引擎根據公共模式創(chuàng)建規(guī)范化的數據并 且將所述規(guī)范化的數據發(fā)送到遠程計算資源。遠程計算資源接收和存儲來自所述多個數據 源的所述規(guī)范化的數據,并且所述遠程計算資源包括變換引擎,所述變換引擎對所述規(guī)范 化的數據進行去規(guī)范化以使得所述數據源不能由其他數據源推斷出,并且存儲所述去規(guī)范 化的數據。
[0012] 一個優(yōu)點在于醫(yī)療保健臨床數據的匿名化。
[0013] 另一個優(yōu)點在于基于用戶認證來重新識別去規(guī)范化的數據,而不將證書傳送到托 管域外部。
[0014] 另一個優(yōu)點在于基于用戶角色來控制動作,而不必將實際被認證的用戶暴露于云 環(huán)境。
[0015] 另一個優(yōu)點在于聯(lián)合托管,以定義在發(fā)送之前抽取什么傳送數的據以及如何抽 取,因此進一步保護源數據不被攔截。
[0016] 另一個優(yōu)點在于改進對基準數據的訪問,這是由于對站點、單元、用戶或患者信息 的未被認證的重新識別的降低的風險。
[0017] 另一個優(yōu)點在于根據通過本發(fā)明實現的基準得到的、改進臨床護理和效率。
[0018] 本領域的普通技術人員在閱讀并理解了以下【具體實施方式】之后,將意識到本發(fā)明 的其他方面。
【附圖說明】
[0019] 本發(fā)明可以采取各種部件和各部件的布置的形式,并且可以采取各種步驟和各步 驟安排形式。附圖僅是為了圖示優(yōu)選實施例而不應被解釋為對本發(fā)明的限制。
[0020] 圖1是根據本申請的IT基礎設施的方框圖。
[0021] 圖2是根據本申請的用于令多站點性能測量匿名的方法的流程圖。
[0022] 圖3是根據本申請的醫(yī)療保健提供者配置的圖。
[0023] 圖4是根據本申請的醫(yī)療保健提供者訪問情形的圖。
[0024] 圖5是根據本申請的重新識別邏輯的圖。
[0025] 圖6是根據本申請的直接云訪問情形的圖。
[0026] 圖7是根據本申請的用于控制對匿名數據的動作及重新識別的方法的流程圖。
【具體實施方式】
[0027] 參考圖1,方框圖圖示了用于控制對由遠程計算資源分析的臨床數據的訪問的系 統(tǒng)的信息技術(IT)基礎設施10的一個實施例。IT基礎設施10適合地包括經由通信網絡 16相互連接的一個或多個醫(yī)療保健系統(tǒng)和提供者12、遠程計算資源或聯(lián)合數據存儲14等。 預期通信網絡16包括以下中的一個或多個:內聯(lián)網、局域網、廣域網、無線網絡、有線網絡、 蜂窩網絡、數據總線、個人域網等。醫(yī)療保健提供者12收集與由醫(yī)療保健系統(tǒng)或醫(yī)學機構 護理的一個或多個患者有關的臨床數據,所述醫(yī)學數據由遠程計算資源14分析及存儲,所 述遠程計算資源在一個實施例中定位于云基礎設施中。在其它實施例中,系統(tǒng)可以定位于 單個位置處。在又一個實施例中,可以存在于安全的環(huán)境中,但數據傳輸是通過公共媒體或 共享的基礎設施的。
[0028] 如本文使用的,"云"可以指的是由站點外或外部的參與者(例如,第三參與者)提 供并且維護的資源(例如,硬件、數據和/或軟件)的集合,其中,數據和資源的集合能夠由 識別出的用戶經由網絡訪問。資源能夠包括數據存儲服務、數據處理服務(例如,應用)以 及許多其他服務,其與個人計算機、局部或"內部"服務器常規(guī)地關聯(lián)并且在于個人計算機、 局部或"內部"服務器內,所述個人計算機、局部或"內部"服務器具有至少一個處理設備, 例