本發(fā)明屬于醫(yī)療事件識別,尤其涉及一種基于大語言模型的手術(shù)操作記錄自動(dòng)編碼方法及系統(tǒng)。
背景技術(shù):
1、在醫(yī)療領(lǐng)域,醫(yī)療術(shù)語標(biāo)準(zhǔn)化是醫(yī)療領(lǐng)域一個(gè)重要的需求,包括了疾病名詞標(biāo)準(zhǔn)化、手術(shù)操作名詞標(biāo)準(zhǔn)化、藥物名稱標(biāo)準(zhǔn)化等問題,對醫(yī)學(xué)科研、醫(yī)保支付、公立醫(yī)院績效考核等均有重大意義。然而,由于不同醫(yī)療機(jī)構(gòu)、不同臨床醫(yī)生的用語習(xí)慣差異,導(dǎo)致各類臨床醫(yī)療數(shù)據(jù)中的診療信息普遍存在著用語不規(guī)范、不統(tǒng)一的問題,使得數(shù)據(jù)的歸檔、分類等處理工作變得十分復(fù)雜且困難,既消耗大量人力物力,也難以借助大數(shù)據(jù)、人工智能等最新信息技術(shù)對其進(jìn)行挖掘或分析。
2、為了解決這一問題,自動(dòng)編碼技術(shù)成為醫(yī)療記錄數(shù)字化場景下的新型解決方案。隨著人工智能技術(shù)的發(fā)展,越來越多的人開始嘗試將自然語言處理技術(shù)應(yīng)用到自動(dòng)編碼任務(wù)上。但基于傳統(tǒng)深度學(xué)習(xí)方式進(jìn)行模型訓(xùn)練,需要大量的人工標(biāo)注數(shù)據(jù),訓(xùn)練成本高昂,難以實(shí)現(xiàn)通用性。隨著大語言模型技術(shù)的發(fā)展,人們看到了該項(xiàng)技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用前景,然而,目前市場上還沒有成熟的基于大語言模型將手術(shù)操作記錄轉(zhuǎn)成標(biāo)準(zhǔn)手術(shù)操作編碼的方法和系統(tǒng)。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于提供一種基于大語言模型的手術(shù)操作記錄自動(dòng)編碼方法及系統(tǒng),旨在解決現(xiàn)有技術(shù)中存在的手術(shù)操作記錄自動(dòng)編碼中訓(xùn)練成本高、使用效率低的問題。
2、本發(fā)明是這樣實(shí)現(xiàn)的,一種基于大語言模型的手術(shù)操作記錄自動(dòng)編碼方法,所述方法包括以下步驟:
3、步驟s1:輸入手術(shù)操作記錄;
4、步驟s2:對手術(shù)操作記錄進(jìn)行模態(tài)分類,根據(jù)不同模態(tài)采用不同的預(yù)先處理方式,統(tǒng)一處理為文本模態(tài);
5、步驟s3:根據(jù)輸入的手術(shù)操作記錄對應(yīng)的術(shù)種,構(gòu)建證據(jù)引導(dǎo)的手術(shù)編碼自動(dòng)抽取的提示語句;
6、步驟s4:將處理后的文本送入可關(guān)聯(lián)證據(jù)的手術(shù)記錄自動(dòng)編碼大語言模型,大語言模型提取并輸出文本中蘊(yùn)含的標(biāo)準(zhǔn)手術(shù)操作名稱;
7、步驟s5:根據(jù)制定的映射字典,獲取大語言模型生成的標(biāo)準(zhǔn)手術(shù)操作名詞對應(yīng)的代碼。
8、本發(fā)明的進(jìn)一步技術(shù)方案是:在步驟s2中,如果手術(shù)操作記錄的模態(tài)為圖像模態(tài),則進(jìn)行圖像文字識別;如果手術(shù)操作記錄的模態(tài)為聲音模態(tài),則進(jìn)行語音文字識別。
9、本發(fā)明的進(jìn)一步技術(shù)方案是:在步驟s2中,對文本模態(tài)的手術(shù)操作記錄及其它模態(tài)轉(zhuǎn)換成的文本模態(tài)手術(shù)操作記錄進(jìn)行噪聲清洗。
10、本發(fā)明的進(jìn)一步技術(shù)方案是:在步驟s3中,輸入手術(shù)操作記錄后,通過人工選擇或由大語言模型自動(dòng)識別,得到輸入的手術(shù)操作記錄對應(yīng)的術(shù)種,并根據(jù)術(shù)種構(gòu)建證據(jù)引導(dǎo)的手術(shù)編碼自動(dòng)提示語句。
11、本發(fā)明的進(jìn)一步技術(shù)方案是:所述大語言模型的訓(xùn)練過程包括數(shù)據(jù)標(biāo)注、指令增廣及模型訓(xùn)練;
12、數(shù)據(jù)標(biāo)注:在獲取原始手術(shù)記錄文本后進(jìn)行人工標(biāo)注,標(biāo)注內(nèi)容包括標(biāo)注蘊(yùn)含標(biāo)準(zhǔn)手術(shù)操作名詞的手術(shù)操作記錄原文片段,以及對應(yīng)的標(biāo)準(zhǔn)手術(shù)操作名詞;
13、指令增廣:對于標(biāo)注后的數(shù)據(jù),進(jìn)行多類型的數(shù)據(jù)增廣,以生成可以直接用于大語言模型訓(xùn)練的數(shù)據(jù);
14、模型訓(xùn)練:使用開源或閉源的大語言模型作為基座,使用以上指令對其進(jìn)行微調(diào)訓(xùn)練,使大語言模型獲得在手術(shù)操作記錄自動(dòng)編碼上的能力。
15、本發(fā)明的進(jìn)一步技術(shù)方案是:指令增廣包括以下類型:
16、根據(jù)標(biāo)注數(shù)據(jù),制作名詞常見表述方式表;
17、根據(jù)原始手術(shù)記錄文本,抽取出蘊(yùn)含標(biāo)準(zhǔn)手術(shù)操作名詞的原文片段;
18、根據(jù)抽取出的蘊(yùn)含標(biāo)準(zhǔn)手術(shù)操作名詞的原文片段,生成標(biāo)準(zhǔn)手術(shù)操作名詞;
19、根據(jù)原始手術(shù)記錄文本直接生成標(biāo)準(zhǔn)手術(shù)操作名詞;
20、根據(jù)原始手術(shù)記錄文本及該文本蘊(yùn)含的標(biāo)準(zhǔn)手術(shù)操作名詞,生成原文中的文本片段;
21、根據(jù)原始手術(shù)記錄文本生成標(biāo)準(zhǔn)手術(shù)操作名詞及其對應(yīng)的片段;
22、根據(jù)原始手術(shù)記錄文本生成標(biāo)準(zhǔn)手術(shù)操作名詞及其解釋;
23、根據(jù)原始手術(shù)記錄文本,判斷手術(shù)類型;
24、根據(jù)原始手術(shù)記錄文本及該手術(shù)類型對應(yīng)的備選表,生成標(biāo)準(zhǔn)手術(shù)操作名詞;
25、根據(jù)抽取出的蘊(yùn)含標(biāo)準(zhǔn)手術(shù)操作名詞的原文片段及該手術(shù)類型對應(yīng)的備選表,生成標(biāo)準(zhǔn)手術(shù)操作名詞。
26、本發(fā)明的進(jìn)一步技術(shù)方案是:使用大語言模型的同時(shí),對在使用過程中出現(xiàn)的錯(cuò)誤結(jié)果進(jìn)行存儲(chǔ),利用這些錯(cuò)例,使用檢索增強(qiáng)生成的方式對大語言數(shù)據(jù)進(jìn)行修正。
27、本發(fā)明的進(jìn)一步技術(shù)方案是:在步驟s5中,映射字典是指根據(jù)國家職能部門或?qū)I(yè)協(xié)會(huì)發(fā)布的標(biāo)準(zhǔn)手術(shù)操作名詞及其對應(yīng)代碼。
28、本發(fā)明的另一目的在于提供一種基于大語言模型的手術(shù)操作記錄自動(dòng)編碼系統(tǒng),用于實(shí)現(xiàn)基于大語言模型的手術(shù)操作記錄自動(dòng)編碼方法,包括:
29、標(biāo)注模塊,用于對若干原始手術(shù)記錄文本進(jìn)行人工標(biāo)注,并將標(biāo)注蘊(yùn)含標(biāo)準(zhǔn)手術(shù)操作名詞的手術(shù)操作記錄原文片段,以及對應(yīng)的標(biāo)準(zhǔn)手術(shù)操作名詞妥善保存;
30、指令數(shù)據(jù)增廣模塊,用于根據(jù)標(biāo)注模塊的標(biāo)注數(shù)據(jù),生成指令訓(xùn)練數(shù)據(jù)集,并對指令訓(xùn)練數(shù)據(jù)集進(jìn)行數(shù)據(jù)增廣;
31、訓(xùn)練模塊,用于對大語言模型開展指令訓(xùn)練;
32、部署模塊,用于對大語言模型進(jìn)行部署,使其可以通過api進(jìn)行訪問,對未在訓(xùn)練過程中出現(xiàn)的新情況或生成有誤的情況進(jìn)行記錄,以檢索增強(qiáng)生成的方式,對大語言模型進(jìn)行修正;
33、代碼映射模塊,用于對大語言模型生成的結(jié)果進(jìn)行映射,得到標(biāo)準(zhǔn)代碼;
34、用戶交互模塊,用于在大語言模型完成部署后,為醫(yī)生和編碼員提供編碼服務(wù);
35、數(shù)據(jù)庫模塊,用于對標(biāo)注模塊、指令數(shù)據(jù)增廣模塊、訓(xùn)練模塊、部署模塊、代碼映射模塊及用戶交互模塊提供數(shù)據(jù)支撐。
36、本發(fā)明的進(jìn)一步技術(shù)方案是:所述用戶交互模塊包括輸入模塊及輸出模塊,輸入模塊與所述部署模塊連接,用于醫(yī)生和編碼員輸入手術(shù)操作記錄,輸出模塊與所述代碼映射模塊連接,輸出手術(shù)操作名詞對應(yīng)的代碼。
37、本發(fā)明的有益效果是:本發(fā)明基于自然語言處理技術(shù),對原始臨床手術(shù)操作記錄進(jìn)行醫(yī)療事件識別,構(gòu)建大語言模型指令訓(xùn)練數(shù)據(jù)集,并對大語言模型開展指令訓(xùn)練;在實(shí)用階段,還設(shè)計(jì)了外部知識庫用于處理未在訓(xùn)練過程中出現(xiàn)的新情況。該方法利用了大語言模型語言能力強(qiáng)大的特點(diǎn),大大降低了訓(xùn)練成本和二次訓(xùn)練的成本,僅需少量的訓(xùn)練數(shù)據(jù)便可使模型達(dá)到可實(shí)用水平,顯著增強(qiáng)實(shí)用性,提高了手術(shù)操作記錄編碼工作的效率和準(zhǔn)確性。
1.一種基于大語言模型的手術(shù)操作記錄自動(dòng)編碼方法,其特征在于,所述方法包括以下步驟:
2.根據(jù)權(quán)利要求1所述的基于大語言模型的手術(shù)操作記錄自動(dòng)編碼方法,其特征在于,在步驟s2中,如果手術(shù)操作記錄的模態(tài)為圖像模態(tài),則進(jìn)行圖像文字識別;如果手術(shù)操作記錄的模態(tài)為聲音模態(tài),則進(jìn)行語音文字識別。
3.根據(jù)權(quán)利要求2所述的基于大語言模型的手術(shù)操作記錄自動(dòng)編碼方法,其特征在于,在步驟s2中,對文本模態(tài)的手術(shù)操作記錄及其它模態(tài)轉(zhuǎn)換成的文本模態(tài)手術(shù)操作記錄進(jìn)行噪聲清洗。
4.根據(jù)權(quán)利要求1所述的基于大語言模型的手術(shù)操作記錄自動(dòng)編碼方法,其特征在于,在步驟s3中,輸入手術(shù)操作記錄后,通過人工選擇或由大語言模型自動(dòng)識別,得到輸入的手術(shù)操作記錄對應(yīng)的術(shù)種,并根據(jù)術(shù)種構(gòu)建證據(jù)引導(dǎo)的手術(shù)編碼自動(dòng)提示語句。
5.根據(jù)權(quán)利要求1所述的基于大語言模型的手術(shù)操作記錄自動(dòng)編碼方法,其特征在于,所述大語言模型的訓(xùn)練過程包括數(shù)據(jù)標(biāo)注、指令增廣及模型訓(xùn)練;
6.根據(jù)權(quán)利要求5所述的基于大語言模型的手術(shù)操作記錄自動(dòng)編碼方法,其特征在于,指令增廣包括以下類型:
7.根據(jù)權(quán)利要求1所述的基于大語言模型的手術(shù)操作記錄自動(dòng)編碼方法,其特征在于,使用大語言模型的同時(shí),對在使用過程中出現(xiàn)的錯(cuò)誤結(jié)果進(jìn)行存儲(chǔ),利用這些錯(cuò)例,使用檢索增強(qiáng)生成的方式對大語言數(shù)據(jù)進(jìn)行修正。
8.根據(jù)權(quán)利要求1所述的基于大語言模型的手術(shù)操作記錄自動(dòng)編碼方法,其特征在于,在步驟s5中,映射字典是指根據(jù)國家職能部門或?qū)I(yè)協(xié)會(huì)發(fā)布的標(biāo)準(zhǔn)手術(shù)操作名詞及其對應(yīng)代碼。
9.一種基于大語言模型的手術(shù)操作記錄自動(dòng)編碼系統(tǒng),用于實(shí)現(xiàn)如權(quán)利要求1-8任一項(xiàng)所述的基于大語言模型的手術(shù)操作記錄自動(dòng)編碼方法,其特征在于,包括:
10.根據(jù)權(quán)利要求9所述的基于大語言模型的手術(shù)操作記錄自動(dòng)編碼系統(tǒng),其特征在于,所述用戶交互模塊包括輸入模塊及輸出模塊,輸入模塊與所述部署模塊連接,用于醫(yī)生和編碼員輸入手術(shù)操作記錄,輸出模塊與所述代碼映射模塊連接,輸出手術(shù)操作名詞對應(yīng)的代碼。