本發(fā)明屬于光譜分析,尤其涉及一種基于最小裁剪二乘法的壞死小腸特征波段識別方法。
背景技術(shù):
1、壞死性小腸結(jié)腸炎(nec)是一種常見于新生兒中間的胃腸道急癥。患有壞死性小腸結(jié)腸炎(nec)的新生嬰兒死亡率可達(dá)30%,患病的極低出生體重(elbw,extremely?lowbirth-weight)的嬰兒術(shù)后死亡率仍有50%。在壞死性小腸結(jié)腸炎(nec)的急診外科手術(shù)治療中,切除壞疽腸段仍然是主要的治療手段。因此在臨床中,需要合適的技術(shù)手段精確地識別壞死腸段。
2、傳統(tǒng)的壞死腸段識別方法多依賴于醫(yī)生的經(jīng)驗判斷或者切片小腸組織后使用顯微鏡觀察,然而這些方法都具備著高人力成本的缺點。因此方便、快捷、準(zhǔn)確、非破壞性地區(qū)分壞死小腸具有強烈需求。近些年來,如傅里葉變換紅外光譜、高光譜等光譜技術(shù)憑借著其無損、快速、靈敏度高等優(yōu)勢,針對壞死小腸的識別已有廣泛的應(yīng)用,并獲得較高的識別精度,光譜技術(shù)已然成為壞死小腸臨床識別的一種有力、有效的輔助工具之一。作為光譜分析中必不可少的一部分,對光譜數(shù)據(jù)特征的提取和識別是十分必要的。特征的提取與識別可以降低光譜數(shù)據(jù)的維度,突出光譜的有用信息,去除冗余信息,有助于改進(jìn)模型泛化、防止過擬合、減少計算時間與計算資源。
3、現(xiàn)有的研究針對壞死小腸的定性研究已經(jīng)十分豐富,但是針對小腸壞死原因的研究依然有限。壞死小腸與正常小腸對光譜輻射的吸收程度不同,致使壞死小腸與正常小腸的差異會在光譜的某部分光譜通道中表征出來,即區(qū)分壞死小腸的特征波段。通過識別區(qū)分壞死小腸的特征波段,并解析特征波段對應(yīng)的化學(xué)鍵與官能團(tuán),可以為解釋小腸壞死的原因提供理論依據(jù)與技術(shù)支持。
4、現(xiàn)有的壞死小腸特征波段的識別方法依賴人為經(jīng)驗或者參考現(xiàn)有文獻(xiàn)進(jìn)行挑選,文獻(xiàn)1“zhang,et?al.discrimination?between?normal?and?necrotic?small?intestinaltissue?using?hyperspectral?imaging?and?unsupervised?classification.journal?ofbiophotonics,2023”通過觀察比較采集獲取的正常小腸與壞死小腸的平均光譜,挑選出氧合血紅蛋白與脫氧血紅蛋白的反射光譜作為特征波段,文獻(xiàn)2“mehdorn,etal.hyperspectral?imaging(hsi)in?acute?mesenteric?ischemia?to?detectintestinal?perfusion?deficits.journal?of?surgical?research,2020”通過查閱相關(guān)資料,選取血紅蛋白的反射光譜作為特征波段。兩種特征波段的識別方法都不夠可靠,文獻(xiàn)1的方法不可靠是因為正常小腸與壞死小腸的平均光譜十分相似且差異較小,因而通過觀察難以精確識別特征波段。方法二不可靠的原因是查閱資料獲得的特征波段與現(xiàn)實實驗中的特征波段可能不一致,這是因為實驗樣本的不同與實驗環(huán)境的差異會影響真實的特征波段的位置。
5、兩種方法都存在精確度低、人力成本高等缺點,且無法實現(xiàn)對壞死小腸特征波段的自動化識別。
技術(shù)實現(xiàn)思路
1、本發(fā)明解決的技術(shù)問題是提供一種能夠?qū)崿F(xiàn)壞死小腸特征波段的自動化識別,且具有較高的精度和較低人工成本的基于最小裁剪二乘法的壞死小腸特征波段識別方法。
2、本發(fā)明解決上述技術(shù)問題所采用的技術(shù)方案是:一種基于lts算法的壞死小腸特征波段識別方法,通過將正常小腸高光譜數(shù)據(jù)和壞死小腸高光譜數(shù)據(jù)進(jìn)行轉(zhuǎn)換后作為lts算法的解釋變量和響應(yīng)變量,采用lts算法確定解釋變量和響應(yīng)變量共有的異常光譜通道后得到去除異常光譜通道后的正常解釋變量與正常響應(yīng)變量,然后采用最小二乘法基于基于正常解釋變量與正常響應(yīng)變量構(gòu)建回歸模型后,通過回歸模型得到權(quán)重,并基于權(quán)重對響應(yīng)變量進(jìn)行重構(gòu),最后基于響應(yīng)變量與重構(gòu)的響應(yīng)變量在各個光譜通道上的標(biāo)準(zhǔn)化殘差來確定壞死小腸特征波段。
3、一種基于lts算法的壞死小腸特征波段識別方法,包括以下步驟:
4、步驟1、通過高光譜數(shù)據(jù)獲取設(shè)備獲取光譜通道數(shù)量相同的正常小腸高光譜數(shù)據(jù)和壞死小腸高光譜數(shù)據(jù),正常小腸高光譜數(shù)據(jù)為n行p列的數(shù)據(jù)矩陣,壞死小腸高光譜數(shù)據(jù)為m行p列的數(shù)據(jù)矩陣,p表示高光譜數(shù)據(jù)獲取設(shè)備的通道數(shù)量,n表示正常小腸高光譜數(shù)據(jù)中的正常小腸樣本數(shù)量,m表示壞死小腸高光譜數(shù)據(jù)中的壞死小腸樣本數(shù)量,n為大于等于20的整數(shù),m為大于0的整數(shù);正常小腸高光譜數(shù)據(jù)中,每行數(shù)據(jù)分別表示一個正常小腸樣本,每個正常小腸樣本的每一列分別表示該正常小腸樣本的一個光譜通道,即每個正常小腸樣本具有p個光譜通道;將正常小腸高光譜數(shù)據(jù)中第s行數(shù)據(jù)稱為第s個正常小腸樣本,s=1,2,…,n,第s個正常小腸樣本的第t列稱為第s個正常小腸樣本的第t個光譜通道,t=1,2,…,p;壞死小腸高光譜數(shù)據(jù)中,每行數(shù)據(jù)分別表示一個壞死小腸樣本,每個壞死小腸樣本中的每一列表示該壞死小腸樣本的一個光譜通道,即每個壞死小腸樣本具有p個光譜通道;將壞死小腸高光譜數(shù)據(jù)中第h行數(shù)據(jù)稱為第h個壞死小腸樣本,第h個壞死小腸樣本的第t列稱為第h個壞死小腸樣本的第t個光譜通道,h=1,2,…,m;將正常小腸高光譜數(shù)據(jù)記為xorg,將壞死小腸高光譜數(shù)據(jù)記yorg;
5、步驟2、使用窗口平滑、基線校正、標(biāo)準(zhǔn)正態(tài)變換對正常小腸高光譜數(shù)據(jù)xorg進(jìn)行預(yù)處理,得到預(yù)處理后的正常小腸高光譜數(shù)據(jù),將其記為x,x包括n個預(yù)處理正常小腸樣本,x中每行數(shù)據(jù)表示一個預(yù)處理正常小腸樣本,每個預(yù)處理正常小腸樣本中的每一列表示該預(yù)處理正常小腸樣本的一個光譜通道,每個預(yù)處理正常小腸具有p個光譜通道;將x中第s行數(shù)據(jù)稱為第s個預(yù)處理正常小腸樣本,將第s個預(yù)處理正常小腸樣本的第t列稱為其第t個光譜通道,第s個預(yù)處理正常小腸樣本與第s個正常小腸樣本相對應(yīng),第s個預(yù)處理正常小腸樣本的第t個光譜通道與第s個正常小腸樣本的第t個光譜通道相對應(yīng);
6、使用窗口平滑、基線校正、標(biāo)準(zhǔn)正態(tài)變換對壞死小腸高光譜數(shù)據(jù)yorg進(jìn)行預(yù)處理,得到預(yù)處理后的壞死小腸高光譜數(shù)據(jù),將其記為y,y包括m個預(yù)處理壞死小腸樣本,y中每行數(shù)據(jù)表示一個預(yù)處理壞死小腸樣本,每個預(yù)處理壞死小腸樣本中的每一列表示該預(yù)處理壞死小腸樣本的一個光譜通道,每個預(yù)處理壞死小腸具有p個光譜通道;將y中第h行數(shù)據(jù)稱為第h個預(yù)處理壞死小腸樣本,將第h個預(yù)處理壞死小腸樣本的第t列稱為其第t個光譜通道,第h個預(yù)處理壞死小腸樣本與第h個壞死小腸樣本相對應(yīng),第h個預(yù)處理壞死小腸樣本的第t個光譜通道與第h個壞死小腸樣本的第t個光譜通道相對應(yīng);
7、步驟3、對預(yù)處理后的正常小腸高光譜數(shù)據(jù)x進(jìn)行轉(zhuǎn)置,得到轉(zhuǎn)置后的正常小腸高光譜數(shù)據(jù),將其記為x′,x′包括n個轉(zhuǎn)置正常小腸樣本,x′中每列數(shù)據(jù)表示一個轉(zhuǎn)置正常小腸樣本,每個轉(zhuǎn)置正常小腸樣本中的每一行表示該轉(zhuǎn)置正常小腸樣本的一個光譜通道,每個轉(zhuǎn)置正常小腸具有p個光譜通道;將x′中第s列數(shù)據(jù)稱為第s個轉(zhuǎn)置正常小腸樣本,將第s個轉(zhuǎn)置正常小腸樣本的第t行稱為其第t個光譜通道,第s個轉(zhuǎn)置正常小腸樣本與第s個正常小腸樣本相對應(yīng),第s個轉(zhuǎn)置正常小腸樣本的第t個光譜通道與第s個正常小腸樣本的第t個光譜通道相對應(yīng);
8、對預(yù)處理后的壞死小腸高光譜數(shù)據(jù)y進(jìn)行轉(zhuǎn)置,得到轉(zhuǎn)置后的壞死小腸高光譜數(shù)據(jù),將其記為y′,y′包括m個轉(zhuǎn)置壞死小腸樣本,y′中每列數(shù)據(jù)表示一個轉(zhuǎn)置壞死小腸樣本,每個轉(zhuǎn)置壞死小腸樣本中的每一行表示該轉(zhuǎn)置壞死小腸樣本的一個光譜通道,每個轉(zhuǎn)置壞死小腸具有p個光譜通道;將y′中第h列數(shù)據(jù)稱為第h個轉(zhuǎn)置壞死小腸樣本,記為y′h,將第h個轉(zhuǎn)置壞死小腸樣本的第t行稱為其第t個光譜通道,第h個轉(zhuǎn)置壞死小腸樣本與第h個壞死小腸樣本相對應(yīng),第h個轉(zhuǎn)置壞死小腸樣本的第t個光譜通道與第h個壞死小腸樣本的第t個光譜通道相對應(yīng);
9、步驟4、采用duplex算法從轉(zhuǎn)置后的正常小腸高光譜數(shù)據(jù)x′中采樣20個轉(zhuǎn)置正常小腸樣本,構(gòu)成轉(zhuǎn)置正常小腸樣本矩陣,記為d′,轉(zhuǎn)置正常小腸樣本矩陣d′為p行20列的數(shù)據(jù)矩陣,每列數(shù)據(jù)表示通過duplex算法采樣出來的一個轉(zhuǎn)置正常小腸樣本,將d′中第u列數(shù)據(jù)稱為第u個采樣轉(zhuǎn)置正常小腸樣本,u=1,2,…,20;
10、步驟5、設(shè)置變量i,將i初始化為等于1;
11、步驟6、進(jìn)行第i次異常光譜通道的確定,具體過程為:
12、s6.1、將d′作為lts算法的解釋變量,y′i作為lts算法的響應(yīng)變量,先采用lts算法標(biāo)記解釋變量d′與響應(yīng)變量y′i共同的異常光譜通道,將被標(biāo)記為異常光譜通道的數(shù)量記為qi,去除其解釋變量d′與響應(yīng)變量y′i中被標(biāo)記為異常光譜通道的光譜通道;
13、將d′去除異常光譜通道后得到的數(shù)據(jù)矩陣稱為正常解釋變量將y′i去除異常光譜通道后得到的數(shù)據(jù)矩陣稱為正常響應(yīng)變量正常解釋變量為p-qi行20列的數(shù)據(jù)向量,正常響應(yīng)變量為p-qi行1列的數(shù)據(jù)向量;
14、s6.2、采用最小二乘法基于正常解釋變量與正常響應(yīng)變量建立回歸模型;
15、s6.3、通過該回歸模型得到正常解釋變量的權(quán)重wi,權(quán)重wi為20行1列的數(shù)據(jù)向量,第u行數(shù)據(jù)為第u個采樣轉(zhuǎn)置正常小腸樣本的權(quán)重的值;
16、s6.4、計算d′與wi的乘積,該乘積為預(yù)測的響應(yīng)變量,記為z′i,即第i個轉(zhuǎn)置壞死小腸樣本y′i的重構(gòu)數(shù)據(jù);
17、s6.5、計算z′i與y′i在p個光譜通道上的標(biāo)準(zhǔn)化殘差,得到一個由p個標(biāo)準(zhǔn)化殘差組成標(biāo)準(zhǔn)化殘差數(shù)據(jù)r′i,標(biāo)準(zhǔn)化殘差數(shù)據(jù)r′i為p行1列的數(shù)據(jù)向量,每行數(shù)據(jù)為一個標(biāo)準(zhǔn)化殘差,第j行數(shù)據(jù)與第i個轉(zhuǎn)置壞死小腸樣本y′i在第j個光譜通道對應(yīng),第j行數(shù)據(jù)為第i個轉(zhuǎn)置壞死小腸樣本y′i在第j個光譜通道上的標(biāo)準(zhǔn)化殘差,j=1,2,…,p;
18、s6.6、計算r′i的中位數(shù)(median)與中位數(shù)絕對偏差(median?absolutedeviation,mad),選擇中位數(shù)與三倍中位數(shù)絕對偏差的和作為第i個轉(zhuǎn)置壞死小腸樣本y′i劃分異常光譜通道的閾值;
19、s6.7、構(gòu)建一個列向量l′i,判斷第i個轉(zhuǎn)置壞死小腸樣本y′i在第j個光譜通道上的標(biāo)準(zhǔn)化殘差是否小于第i個轉(zhuǎn)置壞死小腸樣本y′i劃分異常光譜通道的閾值,如果小于,則將該列向量l′i中的第j行賦值為0,如果不小于,則賦值為1;l′i為p行1列的數(shù)據(jù)向量,第j行數(shù)據(jù)表示第i個轉(zhuǎn)置壞死小腸樣本y′i的第j個光譜通道是否為異常光譜通道,如果等于0,則為正常光譜通道,如果等于1,則為異常光譜通道;
20、步驟7、判斷i的當(dāng)前值是否等于m,如果不等于,則采用i的當(dāng)前值加1的和更新i的取值后,返回步驟6,如果等于,則進(jìn)入步驟8;
21、步驟8、采用l′1至l′m構(gòu)成矩陣l′,l′h為l′的第h列數(shù)據(jù);
22、步驟9、統(tǒng)計l′的第j行數(shù)據(jù)中數(shù)字“1”出現(xiàn)的頻次,即壞死小腸高光譜數(shù)據(jù)的第j個光譜通道中被標(biāo)記為異常的壞死小腸樣本數(shù)量,將其記為mj,比較壞死小腸高光譜數(shù)據(jù)的第j個光譜通道中被標(biāo)記為異常的壞死小腸樣本數(shù)量mj與壞死小腸高光譜數(shù)據(jù)中的壞死小腸樣本數(shù)量m的大小,如果mj等于m,則壞死小腸高光譜數(shù)據(jù)中每個壞死小腸樣本的第j個光譜通道為壞死小腸特征波段,如果mj小于m且大于0,則壞死小腸高光譜數(shù)據(jù)中每個壞死小腸樣本的第j個光譜通道就是噪音等客觀因素引起的無用信息,如果mj等于0,則壞死小腸高光譜數(shù)據(jù)中每個壞死小腸樣本的第j個光譜通道既不是壞死小腸的特征波段,也不是噪音等客觀因素引起的無用信息,實現(xiàn)對壞死小腸特征波段的高精度識別。
23、與現(xiàn)有技術(shù)相比,本發(fā)明的優(yōu)點在于通過將正常小腸高光譜數(shù)據(jù)和壞死小腸高光譜數(shù)據(jù)轉(zhuǎn)換為lts算法的解釋變量和響應(yīng)變量,采用lts算法確定解釋變量和響應(yīng)變量共有的異常光譜通道后得到去除異常光譜通道后的正常解釋變量與正常響應(yīng)變量,然后采用最小二乘法基于基于正常解釋變量與正常響應(yīng)變量構(gòu)建回歸模型后,通過回歸模型得到權(quán)重,并基于權(quán)重對響應(yīng)變量進(jìn)行重構(gòu),最后基于響應(yīng)變量與重構(gòu)的響應(yīng)變量在各個光譜通道上的標(biāo)準(zhǔn)化殘差,劃分壞死小腸高光譜數(shù)據(jù)的異常光譜通道,最終確定壞死小腸特征波段的高精度識別,由此本發(fā)明能夠?qū)崿F(xiàn)壞死小腸特征波段的自動化識別,且具有較高的精度和較低人工成本。