本發(fā)明涉及醫(yī)療信息管理,特別是涉及臨床試驗電子病例報告表的生成方法及生成系統(tǒng)。
背景技術(shù):
1、臨床試驗是評價新藥或新治療方案的重要手段。在臨床試驗過程中,研究人員需要收集各種病人信息和試驗結(jié)果作為研究數(shù)據(jù)。傳統(tǒng)的紙質(zhì)病例報告表(crf)是記錄這些病人數(shù)據(jù)的主要工具。隨著信息技術(shù)的發(fā)展,電子病例報告表(ecrf)被廣泛應用于臨床試驗之中,并逐步取代了傳統(tǒng)紙質(zhì)crf。ecrf是一種通過電子方式收集和管理病人數(shù)據(jù)的工具。與紙質(zhì)crf相比,ecrf使臨床試驗數(shù)據(jù)的收集和管理變得更加高效、準確和安全。
2、ecrf系統(tǒng)的應用大大提升了臨床試驗數(shù)據(jù)處理的效率與質(zhì)量,其重要性日益凸顯,但是現(xiàn)有ecrf系統(tǒng)也存在以下缺點:現(xiàn)在ecrf系統(tǒng)的錄入大部分也是依靠人工進行手動錄入。然而在面對需要從醫(yī)學圖像,例如放射學報告或病理幻燈片等需要輸入大量數(shù)據(jù)的情況。這些情況通常需要在文本和視覺數(shù)據(jù)之間進行仔細的手動對齊。無疑會降低工作效率,浪費大量時間,且錄入數(shù)據(jù)的準確性也不能得到保證。
技術(shù)實現(xiàn)思路
1、基于此,有必要針對現(xiàn)有ecrf系統(tǒng)在需要錄入大量數(shù)據(jù)時,其耗費時間長且錄入數(shù)據(jù)的準確性也不能保證的問題,提供一種臨床試驗電子病例報告表的生成方法及生成系統(tǒng)。
2、本發(fā)明是通過以下技術(shù)方案來實現(xiàn)的:一種臨床試驗電子病例報告表的生成方法,其利用大語言模型輔助生成報告表,在病例報告模板中填入相應的內(nèi)容,填入相應內(nèi)容的方式包括自動生成和手動錄入,其中所述自動生成的方法包括以下步驟:
3、接收多種格式的媒體文件,并通過ocr引擎對媒體文件進行解析,以識別媒體文件中的圖片區(qū)域和文字區(qū)域;通過ocr引擎提取出所述文字區(qū)域中的文本內(nèi)容;
4、將所述文本內(nèi)容、電子病例數(shù)據(jù)在預處理后輸入大語言模型中進行處理,處理后自動輸入病例報告模板中的對應錄入板塊生成臨床試驗報告表;
5、所述手動錄入的方法包括以下步驟:
6、錄入時的用戶界面配置為左邊媒體文件,右邊為病例報告模板的待錄入板塊;
7、對媒體文件中的所述圖片區(qū)域和文字區(qū)域進行內(nèi)容識別,并根據(jù)上下文內(nèi)容相關(guān)性將文字區(qū)域生成多個文字子區(qū)域;將圖片區(qū)域、多個所述文字子區(qū)域與相應的數(shù)據(jù)字段建立關(guān)聯(lián)信息;
8、根據(jù)用戶指令選擇病例報告模板上其中一個錄入板塊時,識別該錄入板塊中的數(shù)據(jù)字段;根據(jù)數(shù)據(jù)字段的關(guān)聯(lián)信息找到媒體文件中對應的圖片區(qū)域和文字子區(qū)域進行高亮顯示,并將該媒體文件移動至用戶界面左側(cè)的最上層,同時該所述文字子區(qū)域內(nèi)的內(nèi)容被大語言模型處理后錄入至高亮顯示的錄入板塊中。
9、作為優(yōu)選實例,所述媒體文件的格式包括pdf、ppt、csv、jpg、png、tif和bmp。
10、作為優(yōu)選實例,所述電子病例數(shù)據(jù)為預先在醫(yī)院系統(tǒng)中的數(shù)據(jù),其包括患者的基本信息、診斷結(jié)果和治療方案。
11、作為優(yōu)選實例,所述預處理包括數(shù)據(jù)清洗、格式化和去除敏感信息。
12、作為優(yōu)選實例,生成后的臨床試驗報告表能夠進行預覽,并包含有手動調(diào)整和補充信息選項。
13、作為優(yōu)選實例,所述大語言模型的處理過程包括自然語言生成、內(nèi)容組織和格式排版,所述自然語言生成用于將所述文本內(nèi)容、電子病例數(shù)據(jù)進行結(jié)構(gòu)化,并提取出數(shù)據(jù)字段。
14、本發(fā)明還提供了一種臨床試驗電子病例報告表的生成系統(tǒng),其使用如上所述的臨床試驗電子病例報告表的生成方法;所述臨床試驗電子病例報告表的生成系統(tǒng)包括:
15、電子病例報告表設計模塊,其用于提供病例報告模板設計工具,生成xml或json格式的報告表模板;
16、ocr模塊,其用于對媒體文件進行解析,以識別媒體文件中的圖片區(qū)域和文字區(qū)域,并提取出所述文字區(qū)域中的文本內(nèi)容;
17、大語言模型模塊,其用于將所述文本內(nèi)容、電子病例數(shù)據(jù)自動填充進報告表模板中;
18、輔助錄入模塊,其用于根據(jù)用戶指令在報告表模板中匹配輸入媒體文件上相應的內(nèi)容。
19、作為優(yōu)選實例,所述臨床試驗電子病例報告表的生成系統(tǒng)還包括:
20、數(shù)據(jù)收集模塊,其用于提供數(shù)據(jù)錄入界面,使得研究人員可以輸入病例數(shù)據(jù);所述數(shù)據(jù)收集模塊基于web的輸入界面,采用用戶友好性設計、響應式設計、上下文敏感性設計和無障礙設計,并且所述數(shù)據(jù)收集模塊提供自定義視圖、偏好設置、引導式操作、幫助文檔和反饋機制功能;
21、數(shù)據(jù)校驗模塊,其用于對所錄入的數(shù)據(jù)進行邏輯校驗,保證數(shù)據(jù)質(zhì)量;
22、數(shù)據(jù)統(tǒng)計分析模塊,其用于對病例數(shù)據(jù)進行匯總和統(tǒng)計分析,所述統(tǒng)計分析包括描述性統(tǒng)計分析、關(guān)聯(lián)規(guī)則挖掘、聚類分析、時間序列分析、特征工程分析和隱私保護;
23、系統(tǒng)配置和用戶管理模塊,其用于配置系統(tǒng)參數(shù),管理用戶賬戶和訪問權(quán)限并記錄操作日志,以進行追溯;
24、數(shù)據(jù)庫,其用于存儲病例報告模板和病例數(shù)據(jù),所述數(shù)據(jù)庫選用關(guān)系數(shù)據(jù)庫或nosql數(shù)據(jù)庫;以及
25、數(shù)據(jù)安全模塊,其用于保證數(shù)據(jù)安全性;所述數(shù)據(jù)安全模塊具有審計和監(jiān)控功能,其采用基于角色的訪問控制策略和訪問控制列表策略,將所述生成系統(tǒng)的功能和數(shù)據(jù)劃分為不同的權(quán)限級別,同時遵循最小權(quán)限原則,并定期審查用戶的權(quán)限。
26、作為優(yōu)選實例,所述臨床試驗電子病例報告表的生成系統(tǒng)還包括網(wǎng)絡通信模塊,其用于實現(xiàn)不同模塊之間的網(wǎng)絡通信,所述網(wǎng)絡通信采用因特網(wǎng)或局域網(wǎng),采用tcp/ip、udp、grpc或http通信協(xié)議以及采用crc加密、雙層身份驗證機制;
27、作為優(yōu)選實例,所述臨床試驗電子病例報告表的生成系統(tǒng)還包括第三方系統(tǒng)接口模塊,其用于與其他醫(yī)院信息系統(tǒng)集成對接。
28、本發(fā)明的有益效果在于:
29、1、本發(fā)明可以支持批量上傳各種媒體文件,通過將ocr技術(shù)與nlp(自然語言處理)、語音識別、視覺輔助識別等其他ai技術(shù)結(jié)合使用,能夠自動將媒體文件與相應的病例報告模板匹配,并提取媒體文件中的內(nèi)容自動輸入至相應的表單,從而特別是在面對大量數(shù)據(jù)的情況下,可以顯著減少數(shù)據(jù)輸入人員所需的時間和精力,并減少數(shù)據(jù)輸入人員的錯誤率。
30、2、本發(fā)明使用模塊化服務化架構(gòu),以及基于微服務理念的模塊間交互設計,使得生成系統(tǒng)具有更好的可擴展性,可應對大樣本量研究。并且使得電子病例報告表創(chuàng)建效率顯著提高,使用可視化編輯器進行拖拽生成,大大簡化流程;同時數(shù)據(jù)校驗功能更強大完善,建立多維邏輯規(guī)則,實現(xiàn)對病例報告數(shù)據(jù)的精確性、完整性、一致性等多方面校驗,多角度保證了數(shù)據(jù)質(zhì)量。還通過基于角色的訪問控制策略,保障了數(shù)據(jù)和操作的安全。
31、3、本發(fā)明支持第三方系統(tǒng)集成,可與其他醫(yī)院信息系統(tǒng)互聯(lián),整合信息,同時能夠支持移動app進行數(shù)據(jù)收集,與服務器的數(shù)據(jù)交互、同步,大幅提高了使用便利性,并且支持多語言使用,可對應不同國家的需求。
32、4、本發(fā)明通過標準化統(tǒng)計分析,可以自動生成高質(zhì)量的研究報告,研究過程高度自動化,減少了人工操作環(huán)節(jié),同時采用嚴格的訪問控制和加密技術(shù),大幅提升了數(shù)據(jù)安全性,整個系統(tǒng)開發(fā)、部署、使用成本都較低。