本發(fā)明涉及醫(yī)學(xué)數(shù)據(jù)處理領(lǐng)域,尤其涉及一種基于多模態(tài)數(shù)字孿生技術(shù)的建模方法及系統(tǒng)。
背景技術(shù):
1、腦腫瘤是最具挑戰(zhàn)性的原發(fā)性顱內(nèi)腫瘤之一,具有發(fā)病率高、復(fù)發(fā)率高、死亡率高、治愈率低的特點。腦腫瘤通常位于功能關(guān)鍵的腦區(qū),如運動皮質(zhì)、語言中樞等,手術(shù)風(fēng)險極高,稍有不慎就會影響患者的重要功能,如語言、運動和記憶等。盡管手術(shù)是最常用的治療方式之一,但完全切除腫瘤常常非常困難,尤其是惡性腫瘤如膠質(zhì)瘤,其邊界模糊且容易侵入健康腦組織。此外,某些腦腫瘤(如膠質(zhì)母細胞瘤)對常規(guī)治療(如放療和化療)具有很強的耐藥性,復(fù)發(fā)率高。即便初期治療有效,腫瘤也可能迅速復(fù)發(fā)。每位腦腫瘤患者的腫瘤生物學(xué)特性不同,如基因變異、治療反應(yīng)性和耐藥性存在個體差異,因此難以制定統(tǒng)一的治療方案。同時,血腦屏障作為大腦的天然保護屏障,限制了大部分藥物的有效穿透,許多藥物無法有效到達腫瘤部位,從而削弱了化療和靶向治療的效果。放療、化療以及手術(shù)本身也可能帶來嚴重的副作用,如神經(jīng)損傷、記憶力下降和癲癇發(fā)作,這對患者的生活質(zhì)量構(gòu)成重大威脅。
2、隨著數(shù)字孿生技術(shù)的發(fā)展,腦腫瘤的精準治療變得更加可行。數(shù)字孿生技術(shù)作為一種將物理實體虛擬化仿真的技術(shù),通過精確映射物理實體的狀態(tài)和行為,并實時進行同步和更新其生長和演變,提供預(yù)測性分析、監(jiān)控和優(yōu)化。這種技術(shù)最初應(yīng)用于工業(yè)領(lǐng)域,但隨著人工智能、云計算和大數(shù)據(jù)技術(shù)的進步,數(shù)字孿生技術(shù)逐漸滲透到醫(yī)學(xué)領(lǐng)域,特別是在精準醫(yī)療中,并展現(xiàn)了巨大的應(yīng)用潛力。在腦腫瘤治療中,數(shù)字孿生技術(shù)能夠為每位患者建立個性化的腫瘤數(shù)字孿生模型。通過結(jié)合多模態(tài)孿生數(shù)據(jù),如mri影像、ct掃描、基因組突變數(shù)據(jù)和臨床治療數(shù)據(jù),構(gòu)建出不同患者精準的腫瘤數(shù)字孿生模型。
3、盡管數(shù)字孿生技術(shù)在腦腫瘤治療中展現(xiàn)了巨大的前景,但也面臨一些挑戰(zhàn)。例如,如何高效擬合多模態(tài)孿生數(shù)據(jù)、確保孿生模型的準確性和實時性、如何通過構(gòu)建的數(shù)字孿生模型及系統(tǒng)實現(xiàn)根據(jù)患者不同的疾病特點自動生成精準的治療方案,反演預(yù)測其生長方向和演變速度;如何根據(jù)各種藥品的特性和多模態(tài)孿生數(shù)據(jù)預(yù)測藥品對血腦屏障的穿透效果,從而方便醫(yī)護人員提前了解和預(yù)測放化療和靶向治療的效果。這些問題都有待進一步解決。
技術(shù)實現(xiàn)思路
1、本發(fā)明目的之一在于提供一種基于多模態(tài)數(shù)字孿生技術(shù)的建模方法以及解決現(xiàn)有技術(shù)中因難以預(yù)測和判斷腫瘤生長方向和演變速度等病理過程的缺點,導(dǎo)致無法模擬腫瘤特征及行為的演變與發(fā)展,無法預(yù)測體內(nèi)腫瘤耐藥及提早擇藥,無法精準指導(dǎo)腫瘤放療靶區(qū)制定等臨床治療問題。
2、本發(fā)明通過下述技術(shù)方案實現(xiàn),一種基于多模態(tài)數(shù)字孿生技術(shù)的建模方法,包括,s100、采集患者病理數(shù)據(jù),構(gòu)建多模態(tài)數(shù)字孿生數(shù)據(jù)庫,所述病理數(shù)據(jù)包括,影像數(shù)據(jù)、基因組數(shù)據(jù)、臨床數(shù)據(jù)和患者生理數(shù)據(jù);s200、對所述多模態(tài)數(shù)字孿生數(shù)據(jù)庫中的數(shù)據(jù)進行整合,構(gòu)建數(shù)字孿生模型,對多模態(tài)數(shù)字孿生數(shù)據(jù)庫中的數(shù)據(jù)進行整合,確保所有模態(tài)的數(shù)據(jù)都使用相同的患者id進行標(biāo)識,并以影像數(shù)據(jù)和基因數(shù)據(jù)作為孿生信息基礎(chǔ),使用統(tǒng)一的患者id作為唯一標(biāo)識符,在患者的臨床數(shù)據(jù)和患者生理數(shù)據(jù)映射到孿生信息基礎(chǔ)上,構(gòu)建并得到患者的個性化數(shù)字孿生模型,通過該數(shù)字孿生模型反映患者在不同階段腫瘤的生長方向和演變速度,并根據(jù)患者的病理數(shù)據(jù)、臨床數(shù)據(jù)、生理數(shù)據(jù)和治療情況,實時更新數(shù)字孿生模型,反映最新的腫瘤狀況;s300、根據(jù)步驟s100中的多模態(tài)數(shù)字孿生數(shù)據(jù)庫的數(shù)據(jù),構(gòu)建多模態(tài)反演模型;s400、根據(jù)腦腫瘤治療的類型,整理不同治療類型的藥物療效,形成治療數(shù)據(jù)庫,將治療數(shù)據(jù)庫中的藥物特性和多模態(tài)數(shù)字孿生數(shù)據(jù)庫中的數(shù)據(jù)進行整合,所述治療類型包括,化學(xué)治療、靶向治療、免疫治療以及激素治療;s500、將反演模型生成的治療方案效果輸入數(shù)字孿生模型進行預(yù)測,在數(shù)字孿生模型上記錄預(yù)測結(jié)果并根據(jù)預(yù)測結(jié)果判斷不同藥品對于患者的治療特性,并預(yù)測不同藥物對于血腦屏障的穿透效果及腦腫瘤的演化趨勢。
3、進一步地,影像數(shù)據(jù)包括磁共振成像數(shù)據(jù)、x射線影像數(shù)據(jù)以及ct影像數(shù)據(jù);所述基因組數(shù)據(jù)包括,患者的基因表達數(shù)據(jù)、基因數(shù)據(jù)以及蛋白質(zhì)組學(xué)數(shù)據(jù);所述臨床數(shù)據(jù)包括,病史、治療記錄、體征和癥狀數(shù)據(jù);所述生理數(shù)據(jù)包括,心率、血壓、身高、體重體征數(shù)據(jù),用于動態(tài)監(jiān)控。
4、進一步地,步驟s100還包括數(shù)據(jù)預(yù)處理步驟,在采集患者病理數(shù)據(jù)后,先對采集到的數(shù)據(jù)進行預(yù)處理,再經(jīng)過預(yù)處理后的數(shù)據(jù)構(gòu)建多模態(tài)數(shù)字孿生數(shù)據(jù)庫,具體包括如下步驟,s110、通過數(shù)據(jù)清理去除采集到的影像數(shù)據(jù)、基因組數(shù)據(jù)、臨床數(shù)據(jù)以及患者生理數(shù)據(jù)中的噪聲和無效信息;s120、通過數(shù)據(jù)標(biāo)準化將不同來源的數(shù)據(jù)統(tǒng)一格式化,針對不同的數(shù)據(jù)可以采用不同的標(biāo)準化進行處理,使得同一種數(shù)據(jù)具有相同的尺度,對于影像數(shù)據(jù),可以使用均值和標(biāo)準差的標(biāo)準化,其中,對每個圖像減去均值并除以標(biāo)準差,以確保輸入模型的圖像在同一尺度上,對于基因組數(shù)據(jù)、臨床數(shù)據(jù)和患者生理數(shù)據(jù)則可以通過z-score算法進行標(biāo)準化處理,其中,對于基因組數(shù)據(jù)中呈現(xiàn)指數(shù)增長的值,可以采用對數(shù)變換將其縮放到較小的數(shù)值范圍然后再通過z-score算法進行標(biāo)準化處理;s130、使用特征提取用于從影像、基因、臨床和患者生理數(shù)據(jù)中提取關(guān)鍵特征,用于模型輸入,通過預(yù)訓(xùn)練的cnn模型自動提取影像數(shù)據(jù)中的高階特征,對于基因數(shù)據(jù)可以使用lasso回歸算法篩選出在腫瘤組織與正常組織中顯著差異表達的基因,識別與腫瘤生長方向和速度相關(guān)的基因通路模型,并提取與靶向治療相關(guān)的關(guān)鍵基因以及識別出與腫瘤預(yù)后密切相關(guān)的基因特征,將所述基因特征輸入基因通路模型,從而預(yù)測腫瘤生長方向和速度;對于臨床數(shù)據(jù)和患者生理數(shù)據(jù)可以通過時間序列分析,進行時間序列分析,提取患者的生命體征、血液檢查的趨勢特征和波動特征。
5、進一步地,將患者的臨床數(shù)據(jù)和患者生理數(shù)據(jù)映射到孿生信息基礎(chǔ)包括,首先,將處理過的影像數(shù)據(jù)進行空間配準,采用自動分割技術(shù)將腫瘤區(qū)域從影像中提取出來,確保不同影像數(shù)據(jù)在空間上的一致性;其次,將基因組數(shù)據(jù)中的基因表達、突變信息與已知的基因注釋數(shù)據(jù)庫對接,確?;驍?shù)據(jù)的標(biāo)準化和統(tǒng)一,對與腦腫瘤相關(guān)的基因通路進行識別,然后將其與提取的腫瘤區(qū)域相結(jié)合,形成孿生信息基礎(chǔ);最后,將統(tǒng)一的患者id作為唯一標(biāo)識符,將臨床數(shù)據(jù)和患者生理數(shù)據(jù)映射到孿生信息基礎(chǔ)上。
6、進一步地,構(gòu)建多模態(tài)反演模型包括如下子步驟,s310、根據(jù)構(gòu)建的多模態(tài)數(shù)字孿生數(shù)據(jù)庫中的數(shù)據(jù),確定反演的目標(biāo)數(shù)據(jù)范圍,所述目標(biāo)數(shù)據(jù)范圍通過在影像數(shù)據(jù)和基因數(shù)據(jù)上標(biāo)定病變區(qū)域內(nèi)所有腫瘤細胞位置,同時結(jié)合步驟s200中的孿生信息基礎(chǔ)從而生成驗證條件,然后根據(jù)臨床數(shù)據(jù)和患者生理數(shù)據(jù)確定約束條件,生成病變區(qū)域?qū)?yīng)的腫瘤細胞空間坐標(biāo),所述腫瘤細胞空間坐標(biāo)的集合為目標(biāo)數(shù)據(jù)范圍;s320、通過pca算法提取多模態(tài)數(shù)字孿生數(shù)據(jù)庫中各數(shù)據(jù)的主成分,并將提取出的主成分作為基因表達模式的特征基函數(shù),并根據(jù)提取出的特征基函數(shù)構(gòu)建多模態(tài)數(shù)據(jù)字典;s330、根據(jù)匹配追蹤法原則,將需要反演的數(shù)據(jù)逐點與多模態(tài)數(shù)據(jù)字典中的特征基函數(shù)進行匹配,提取匹配程度最大的數(shù)據(jù)對形成反演的多模態(tài)數(shù)據(jù)體。
7、進一步地,構(gòu)建多模態(tài)數(shù)據(jù)字典包括如下步驟,s321、使用pca算法從影像數(shù)據(jù)、基因組數(shù)據(jù)、臨床數(shù)據(jù)和患者生理數(shù)據(jù)中提取主成分;s322、然后使用k-means算法,將各類數(shù)據(jù)中提取的主成分數(shù)據(jù)分成若干簇,簇中心即為特征基函數(shù);s323、將得到的特征基函數(shù)進行組合,構(gòu)成一個包含了多種類型數(shù)據(jù)的多模態(tài)數(shù)據(jù)字典。
8、進一步地,匹配程度最大的數(shù)據(jù)對的確定包括如下步驟,s331、將所述多模態(tài)數(shù)據(jù)字典中的數(shù)據(jù)采用l2范數(shù)單位化的方法進行單位化,獲得第一多模態(tài)向量;s332、以需要反演的數(shù)據(jù)點為中心,獲取預(yù)定時間長度的數(shù)據(jù)段作為第二多模態(tài)向量,并采用l2范數(shù)單位化的方法對第一向量進行單位化,獲得第三多模態(tài)向量;s333、求取第一多模態(tài)向量與第三多模態(tài)向量的點積,將點積計算結(jié)果最大的數(shù)據(jù)對確定為匹配程度最大的數(shù)據(jù)對,提取匹配程度最大的多模態(tài)數(shù)據(jù)對,從而形成反演的多模態(tài)數(shù)據(jù)體。
9、進一步地,步驟s400中的整合包括,s410、從藥物數(shù)據(jù)庫中提取與藥物療效和副作用相關(guān)的特征,所述特征包括藥物作用機制、代謝途徑以及副作用;s420、從多模態(tài)數(shù)字孿生數(shù)據(jù)庫中提取患者的生理特征、基因特征、病史和治療記錄;s430、然后使用余弦相似度計算藥物特性與患者特征之間的相似性,將該相似性數(shù)據(jù)作為反演參數(shù),輸入到反演模型中,生成治療方案效果預(yù)測結(jié)果。
10、進一步地,化學(xué)治療的藥物可以包括,替莫唑胺、卡莫司汀、洛莫司汀以及長春新堿,靶向治療的藥物可以包括,貝伐單抗、達拉非尼以及曲美替尼,免疫治療的藥物可以包括,派姆單抗、納武利尤單抗以及帕博利珠單抗,激素治療的藥物可以包括,溴隱亭以及卡貝二林。
11、本發(fā)明另一方面提供了一種基于多模態(tài)數(shù)字孿生技術(shù)的建模系統(tǒng),該多模態(tài)數(shù)據(jù)處理系統(tǒng)包括,多模態(tài)數(shù)字孿生數(shù)據(jù)庫構(gòu)建單元、數(shù)字孿生模型構(gòu)建單元以及多模態(tài)反演模型構(gòu)建單元,多模態(tài)數(shù)字孿生數(shù)據(jù)庫構(gòu)建單元被配置為,采集患者病理數(shù)據(jù)并對采集到的數(shù)據(jù)進行預(yù)處理,將經(jīng)過預(yù)處理后的數(shù)據(jù)構(gòu)建多模態(tài)數(shù)字孿生數(shù)據(jù)庫;數(shù)字孿生模型構(gòu)建單元與多模態(tài)數(shù)字孿生數(shù)據(jù)庫構(gòu)建單元相連接,被配置為對多模態(tài)數(shù)字孿生數(shù)據(jù)庫中的數(shù)據(jù)進行整合,構(gòu)建數(shù)字孿生模型,以影像數(shù)據(jù)和基因數(shù)據(jù)作為孿生信息基礎(chǔ),使用統(tǒng)一的患者id作為唯一標(biāo)識符,將患者的臨床數(shù)據(jù)和患者生理數(shù)據(jù)映射到孿生信息基礎(chǔ)上,構(gòu)建得到患者的個性化數(shù)字孿生模型,通過該數(shù)字孿生模型反映患者在不同階段腫瘤的生長和演變,并根據(jù)患者的生理數(shù)據(jù)和治療情況,實時更新模型,反映最新的腫瘤狀況;多模態(tài)反演模型構(gòu)建單元與多模態(tài)數(shù)字孿生數(shù)據(jù)庫構(gòu)建單元和數(shù)字孿生模型構(gòu)建單元相連接,被配置為根據(jù)多模態(tài)數(shù)字孿生數(shù)據(jù)庫中的數(shù)據(jù),構(gòu)建多模態(tài)反演模型;治療數(shù)據(jù)庫構(gòu)建單元與多模態(tài)數(shù)字孿生數(shù)據(jù)庫構(gòu)建單元和多模態(tài)反演模型構(gòu)建單元相連接,被配置為根據(jù)腦腫瘤治療的類型,整理不同治療類型的藥物療效,形成治療數(shù)據(jù)庫,將治療數(shù)據(jù)庫中的藥物特性和多模態(tài)數(shù)字孿生數(shù)據(jù)庫中的數(shù)據(jù)進行整合,得到反演參數(shù),將所述反演參數(shù)輸入到反演模型中,生成治療方案效果預(yù)測結(jié)果。
12、進一步地,多模態(tài)反演模型構(gòu)建單元還包括,多模態(tài)數(shù)據(jù)字典子單元和數(shù)據(jù)對匹配子單元,其中,
13、多模態(tài)數(shù)據(jù)字典子單元被配置為,根據(jù)構(gòu)建的多模態(tài)數(shù)字孿生數(shù)據(jù)庫中的數(shù)據(jù),確定反演的目標(biāo)數(shù)據(jù)范圍,所述目標(biāo)數(shù)據(jù)范圍通過在影像數(shù)據(jù)和基因數(shù)據(jù)上標(biāo)定病變區(qū)域內(nèi)所有腫瘤細胞位置,同時結(jié)合孿生信息基礎(chǔ)從而生成驗證條件,然后根據(jù)臨床數(shù)據(jù)和患者生理數(shù)據(jù)確定約束條件,生成病變區(qū)域?qū)?yīng)的腫瘤細胞空間坐標(biāo),所述腫瘤細胞空間坐標(biāo)的集合即為目標(biāo)數(shù)據(jù)范圍;通過pca算法提取多模態(tài)數(shù)字孿生數(shù)據(jù)庫中各數(shù)據(jù)的主成分,并將提取出的主成分作為基因表達模式的特征基函數(shù),并根據(jù)提取出的特征基函數(shù)構(gòu)建多模態(tài)數(shù)據(jù)字典;根據(jù)匹配追蹤法原則,將需要反演的數(shù)據(jù)逐點與多模態(tài)數(shù)據(jù)字典中的特征基函數(shù)進行匹配,提取匹配程度最大的數(shù)據(jù)對形成反演的多模態(tài)數(shù)據(jù)體。數(shù)據(jù)對匹配子單元被配置為,將多模態(tài)數(shù)據(jù)字典中的數(shù)據(jù)采用l2范數(shù)單位化的方法進行單位化,并求取第一多模態(tài)向量與第三多模態(tài)向量的點積,將點積計算結(jié)果最大的數(shù)據(jù)對確定為匹配程度最大的數(shù)據(jù)對。提取匹配程度最大的多模態(tài)數(shù)據(jù)對,從而形成反演的多模態(tài)數(shù)據(jù)體。
14、本發(fā)明再一方面提供了一種計算機設(shè)備,所述設(shè)備包括:處理器;存儲器,存儲有計算機程序,當(dāng)所述計算機程序被處理器執(zhí)行時,實現(xiàn)如上所述的基于多模態(tài)數(shù)字孿生技術(shù)的建模方法。
15、本發(fā)明與現(xiàn)有技術(shù)相比,具有如下的優(yōu)點和有益效果:
16、1、本發(fā)明通過將腦腫瘤的多模態(tài)數(shù)據(jù)進行整合,將多模態(tài)數(shù)據(jù)構(gòu)成一個完整的多模態(tài)數(shù)字孿生數(shù)據(jù)庫,并通過這個數(shù)據(jù)庫中的數(shù)據(jù)構(gòu)建數(shù)字孿生模型和反演模型,提高了腦腫瘤的治療精準度。
17、2、本發(fā)明通過構(gòu)建的多模態(tài)數(shù)字孿生數(shù)據(jù)庫和數(shù)字孿生模型使得在構(gòu)建反演模型時可以直接使用多模態(tài)數(shù)字孿生數(shù)據(jù)庫中經(jīng)過處理的數(shù)據(jù)建立反演的約束信息,不用考慮反演子波問題和初始模型構(gòu)建的問題,同時在準確標(biāo)定腫瘤細胞空間坐標(biāo)前提下,結(jié)合治療藥物數(shù)據(jù),將藥物數(shù)據(jù)參與反演,提高了反演結(jié)果和治療效果的符合度。
18、3、本發(fā)明通過建立數(shù)字孿生模型對腫瘤治療情況和預(yù)測結(jié)果進行實時監(jiān)控和優(yōu)化,可以及時發(fā)現(xiàn)治療過程中的問題并采取措施進行調(diào)整,從而提高腦腫瘤治療過程中的準確性,同時在結(jié)合反演模型的基礎(chǔ)上實現(xiàn)了根據(jù)各種藥品的特性和多模態(tài)數(shù)據(jù)從而提前預(yù)測和判斷藥品對血腦屏障的穿透效果,方便醫(yī)護人員提前分析不同治療方案的優(yōu)劣性與預(yù)測患者預(yù)后效果。