本技術涉及人工智能開發(fā)與數(shù)字醫(yī)療領域,尤其涉及基于人工智能的數(shù)據(jù)預測方法、裝置、計算機設備及存儲介質(zhì)。
背景技術:
1、在當前的保險行業(yè)中,隨著保險產(chǎn)品的不斷創(chuàng)新與市場需求的日益多樣化,帶病投保已成為一個不可忽視的趨勢。這一變化為保險公司帶來了前所未有的風險評估與定價挑戰(zhàn)。具體而言,保險公司需要更加精準地預測帶病投保者的風險等級,包括其未來可能產(chǎn)生的醫(yī)療費用,如醫(yī)藥費用、住院費用等,并據(jù)此動態(tài)調(diào)整保險費率,以確保風險與保費之間的合理匹配。
2、與此同時,在醫(yī)療機構(gòu)內(nèi)部,特別是如醫(yī)院等大型醫(yī)療服務提供單位,各科室根據(jù)患者的具體病情安排相應的診療項目,并開具相應的醫(yī)療費用單據(jù)。這一過程涉及大量的醫(yī)療項目費用數(shù)據(jù),其準確性和合理性直接影響到患者的經(jīng)濟負擔及醫(yī)療資源的合理配置。因此,醫(yī)療機構(gòu)內(nèi)部設立了質(zhì)控科,專門負責監(jiān)督各科室收費項目的合理性,防范藥物濫用、不必要的檢查及治療項目等問題,確保醫(yī)療費用的公正與透明。
3、然而,在傳統(tǒng)技術框架下,質(zhì)控科對醫(yī)療項目費用的預測與監(jiān)督往往依賴于人工方式。這要求相關人員頻繁地穿梭于各科室之間,手動收集、整理和分析各項醫(yī)療項目的收費數(shù)據(jù),再基于這些數(shù)據(jù)進行費用預測和合理性評估。這種方式不僅耗時費力,效率低下,而且容易受到人為因素干擾,導致預測結(jié)果不夠準確,進而影響質(zhì)控工作的有效性和及時性。
技術實現(xiàn)思路
1、本技術實施例的目的在于提出一種基于人工智能的數(shù)據(jù)預測方法、裝置、計算機設備及存儲介質(zhì),以解決現(xiàn)有技術中,對醫(yī)療項目費用的預測方式往往依賴于人工方式,存在耗時費力,效率低下,而且容易受到人為因素干擾,導致預測結(jié)果不夠準確的技術問題。
2、為了解決上述技術問題,本技術實施例提供一種基于人工智能的數(shù)據(jù)預測方法,采用了如下所述的技術方案:
3、獲取用戶的初始電子病歷信息;
4、對所述初始電子病歷信息進行預處理,得到對應的電子病歷信息;
5、從所述電子病歷信息中提取所述用戶的個人信息,并從所述個人信息中獲取所述用戶的省份信息;
6、從預設的省份特征數(shù)據(jù)中篩選出與所述省份信息匹配的目標特征數(shù)據(jù);
7、基于所述目標特征數(shù)據(jù)對所述電子病歷信息進行信息擴展處理,得到對應的目標電子病歷信息;
8、調(diào)用預先構(gòu)建的費用預測模型;其中,所述費用預測模型為基于病歷樣本數(shù)據(jù)對預設的梯度提升決策森林模型進行訓練生成的,所述梯度提升決策森林模型為結(jié)合隨機森林的梯度提升決策樹的模型;
9、基于所述費用預測模型對所述目標電子病歷信息進行預測處理,生成與所述目標電子病歷信息對應的醫(yī)療費用預測值。
10、進一步的,所述從預設的省份特征數(shù)據(jù)中篩選出與所述省份信息匹配的目標特征數(shù)據(jù)的步驟,具體包括:
11、獲取預設的公開統(tǒng)計數(shù)據(jù);
12、從所述公開統(tǒng)計數(shù)據(jù)中提取各個省份的地域特征數(shù)據(jù)與醫(yī)療特征數(shù)據(jù),得到所述省份特征數(shù)據(jù);
13、從各個所述省份的地域特征數(shù)據(jù)中篩選出與所述省份信息匹配的指定地域特征數(shù)據(jù);
14、從各個所述省份的醫(yī)療特征數(shù)據(jù)中篩選出與所述省份信息匹配的指定醫(yī)療特征數(shù)據(jù);
15、基于所述指定地域特征數(shù)據(jù)與所述指定醫(yī)療特征數(shù)據(jù)構(gòu)建得到所述目標特征數(shù)據(jù)。
16、進一步的,所述基于所述目標特征數(shù)據(jù)對所述電子病歷信息進行信息擴展處理,得到對應的目標電子病歷信息的步驟,具體包括:
17、調(diào)用預設的數(shù)據(jù)分析工具;
18、在所述數(shù)據(jù)分析工具中使用合并操作對所述電子病歷信息與所述目標特征數(shù)據(jù)進行合并處理,得到對應的合并數(shù)據(jù);
19、將所述合并數(shù)據(jù)作為所述目標特征數(shù)據(jù)。
20、進一步的,所述對所述初始電子病歷信息進行預處理,得到對應的電子病歷信息的步驟,具體包括:
21、對所述初始電子病歷信息進行數(shù)據(jù)清洗處理,得到對應的第一電子病歷信息;
22、獲取預設的分類編碼策略;
23、基于所述分類編碼策略對所述第一電子病歷信息進行編碼處理,得到對應的第二電子病歷信息;
24、將所述第二電子病歷信息作為所述電子病歷信息。
25、進一步的,在所述調(diào)用預先構(gòu)建的費用預測模型的步驟之前,還包括:
26、獲取預先構(gòu)建的病歷樣本數(shù)據(jù);
27、創(chuàng)建隨機森林模型,并使用所述病歷樣本數(shù)據(jù)對所述隨機森林模型進行訓練得到對應的目標隨機森林模型;
28、創(chuàng)建梯度提升決策森林模型,并將所述目標隨機森林模型作為所述梯度提升決策森林模型的初始預測估計器;
29、確定與所述梯度提升決策森林模型對應的目標損失函數(shù)與目標超參數(shù)調(diào)優(yōu)方法;
30、基于所述目標損失函數(shù)與所述目標超參數(shù)調(diào)優(yōu)方法,使用所述病歷樣本數(shù)據(jù)對所述梯度提升決策森林模型進行十折交叉驗證訓練,得到符合預設的模型構(gòu)建條件的指定梯度提升決策森林模型;
31、將所述指定梯度提升決策森林模型作為所述費用預測模型。
32、進一步的,在所述將所述指定梯度提升決策森林模型作為所述費用預測模型的步驟之后,還包括:
33、獲取與所述費用預測模型對應的指定存儲策略;
34、確定與所述費用預測模型對應的指定存儲介質(zhì);
35、基于所述指定存儲策略與所述指定存儲介質(zhì)對所述費用預測模型進行存儲處理。
36、進一步的,在所述基于所述費用預測模型對所述目標電子病歷信息進行預測處理,生成與所述目標電子病歷信息對應的醫(yī)療費用預測值的步驟之后,還包括:
37、基于所述個人信息獲取所述用戶的通訊信息;
38、獲取與所述醫(yī)療費用預測值對應的解釋信息;
39、基于所述醫(yī)療費用預測值與所述解釋信息生成對應的醫(yī)療費用預測報告;
40、基于所述通訊信息,將所述醫(yī)療費用預測報告發(fā)送給所述用戶。
41、為了解決上述技術問題,本技術實施例還提供一種基于人工智能的數(shù)據(jù)預測裝置,采用了如下所述的技術方案:
42、第一獲取模塊,用于獲取用戶的初始電子病歷信息;
43、預處理模塊,用于對所述初始電子病歷信息進行預處理,得到對應的電子病歷信息;
44、提取模塊,用于從所述電子病歷信息中提取所述用戶的個人信息,并從所述個人信息中獲取所述用戶的省份信息;
45、篩選模塊,用于從預設的省份特征數(shù)據(jù)中篩選出與所述省份信息匹配的目標特征數(shù)據(jù);
46、擴展模塊,用于基于所述目標特征數(shù)據(jù)對所述電子病歷信息進行信息擴展處理,得到對應的目標電子病歷信息;
47、調(diào)用模塊,用于調(diào)用預先構(gòu)建的費用預測模型;其中,所述費用預測模型為基于病歷樣本數(shù)據(jù)對預設的梯度提升決策森林模型進行訓練生成的,所述梯度提升決策森林模型為結(jié)合隨機森林的梯度提升決策樹的模型;
48、預測模塊,用于基于所述費用預測模型對所述目標電子病歷信息進行預測處理,生成與所述目標電子病歷信息對應的醫(yī)療費用預測值。
49、為了解決上述技術問題,本技術實施例還提供一種計算機設備,采用了如下所述的技術方案:
50、獲取用戶的初始電子病歷信息;
51、對所述初始電子病歷信息進行預處理,得到對應的電子病歷信息;
52、從所述電子病歷信息中提取所述用戶的個人信息,并從所述個人信息中獲取所述用戶的省份信息;
53、從預設的省份特征數(shù)據(jù)中篩選出與所述省份信息匹配的目標特征數(shù)據(jù);
54、基于所述目標特征數(shù)據(jù)對所述電子病歷信息進行信息擴展處理,得到對應的目標電子病歷信息;
55、調(diào)用預先構(gòu)建的費用預測模型;其中,所述費用預測模型為基于病歷樣本數(shù)據(jù)對預設的梯度提升決策森林模型進行訓練生成的,所述梯度提升決策森林模型為結(jié)合隨機森林的梯度提升決策樹的模型;
56、基于所述費用預測模型對所述目標電子病歷信息進行預測處理,生成與所述目標電子病歷信息對應的醫(yī)療費用預測值。
57、為了解決上述技術問題,本技術實施例還提供一種計算機可讀存儲介質(zhì),采用了如下所述的技術方案:
58、獲取用戶的初始電子病歷信息;
59、對所述初始電子病歷信息進行預處理,得到對應的電子病歷信息;
60、從所述電子病歷信息中提取所述用戶的個人信息,并從所述個人信息中獲取所述用戶的省份信息;
61、從預設的省份特征數(shù)據(jù)中篩選出與所述省份信息匹配的目標特征數(shù)據(jù);
62、基于所述目標特征數(shù)據(jù)對所述電子病歷信息進行信息擴展處理,得到對應的目標電子病歷信息;
63、調(diào)用預先構(gòu)建的費用預測模型;其中,所述費用預測模型為基于病歷樣本數(shù)據(jù)對預設的梯度提升決策森林模型進行訓練生成的,所述梯度提升決策森林模型為結(jié)合隨機森林的梯度提升決策樹的模型;
64、基于所述費用預測模型對所述目標電子病歷信息進行預測處理,生成與所述目標電子病歷信息對應的醫(yī)療費用預測值。
65、與現(xiàn)有技術相比,本技術實施例主要有以下有益效果:
66、本技術首先獲取用戶的初始電子病歷信息;然后對所述初始電子病歷信息進行預處理,得到對應的電子病歷信息;之后從所述電子病歷信息中提取所述用戶的個人信息,并從所述個人信息中獲取所述用戶的省份信息;后續(xù)從預設的省份特征數(shù)據(jù)中篩選出與所述省份信息匹配的目標特征數(shù)據(jù);進一步基于所述目標特征數(shù)據(jù)對所述電子病歷信息進行信息擴展處理,得到對應的目標電子病歷信息;最后調(diào)用預先構(gòu)建的費用預測模型,并基于所述費用預測模型對所述目標電子病歷信息進行預測處理,生成與所述目標電子病歷信息對應的醫(yī)療費用預測值。本技術通過對獲取的初始電子病歷信息進行預處理得到電子病歷信息,然后從所述電子病歷信息中獲取所述用戶的省份信息,并從預設的省份特征數(shù)據(jù)中篩選出與所述省份信息匹配的目標特征數(shù)據(jù),進而基于所述目標特征數(shù)據(jù)對所述電子病歷信息進行信息擴展處理,得到對應的目標電子病歷信息,從而可以為后續(xù)的費用預測模型的應用提供準確、一致、豐富和完整的輸入數(shù)據(jù)集,使得后續(xù)使用費用預測模型對經(jīng)過信息擴展處理的目標電子病歷信息進行預測處理,可以快速準確地生成與所述目標電子病歷信息對應的醫(yī)療費用預測值,有效提高了醫(yī)療費用預測的處理效率與處理準確性,保證了生成的醫(yī)療費用預測值的準確度。