本發(fā)明涉及中藥的產(chǎn)地溯源方法,具體是涉及一種結(jié)合hsi與nmr技術(shù)的深度學(xué)習(xí)算法的枸杞產(chǎn)地溯源方法。
背景技術(shù):
1、枸杞作為一種富含營(yíng)養(yǎng)成分并具有顯著醫(yī)療保健功效的珍貴補(bǔ)益中藥,在功能性食品及營(yíng)養(yǎng)保健領(lǐng)域受到了廣泛關(guān)注。該植物為多年生落葉灌木,全球已知的枸杞屬物種約有80種,我國(guó)擁有7個(gè)種和2個(gè)變種。枸杞始載于《神農(nóng)本草經(jīng)》,并列其為上品,謂之:“久服堅(jiān)筋骨,輕身不老,耐寒暑”。隨著現(xiàn)代藥理學(xué)對(duì)枸杞成分的深入探究,特別是枸杞中的關(guān)鍵成分-枸杞多糖,因其具有抗氧化、抗炎、調(diào)節(jié)免疫系統(tǒng)及抗癌等作用而成為研究焦點(diǎn)。枸杞在我國(guó)已有超過(guò)兩千年的種植和應(yīng)用歷史,其主產(chǎn)區(qū)包括寧夏、河北、新疆和內(nèi)蒙古。其中,寧夏枸杞(位于中國(guó)黃土高原)作為中國(guó)唯一的藥用枸杞,因其卓越的品質(zhì)而享譽(yù)全球。枸杞的營(yíng)養(yǎng)和藥用價(jià)值以及市場(chǎng)定價(jià)與其產(chǎn)地和品種有著密切的聯(lián)系。精確鑒定枸杞的產(chǎn)地對(duì)于保障產(chǎn)品質(zhì)量、增強(qiáng)消費(fèi)者信任及拓展國(guó)際市場(chǎng)顯得尤為重要。
2、傳統(tǒng)的枸杞產(chǎn)地溯源方法主要依賴于物理化學(xué)和感官分析,但這些方法往往耗時(shí)且依賴于經(jīng)驗(yàn)豐富的專家的主觀判斷。近年來(lái),引入多種新型分析方法,如近紅外光譜、高光譜成像(hyperspectral?imaging,hsi)、電子鼻、核磁共振(nuclear?magneticresonance,nmr)等方法,用于更準(zhǔn)確、更高效地鑒定枸杞的產(chǎn)地。近紅外光譜和高光譜成像技術(shù)能夠提供關(guān)于樣品豐富的光譜和空間信息,主要用于檢測(cè)枸杞的化學(xué)和物理屬性;核磁共振在鑒定和定量樣品成分方面展現(xiàn)出優(yōu)異的性能。通過(guò)融合這些技術(shù),可以更全面地分析枸杞的地理來(lái)源,克服單一方法的局限性。雖然多種技術(shù)結(jié)合可以提供更全面的信息,但高光譜成像和核磁共振技術(shù)獲得的數(shù)據(jù)由于其數(shù)據(jù)量大、維度高等特點(diǎn),對(duì)傳統(tǒng)的機(jī)器學(xué)習(xí)方構(gòu)成挑戰(zhàn)。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于為了解決現(xiàn)有技術(shù)中存在的上述問(wèn)題,實(shí)現(xiàn)對(duì)枸杞產(chǎn)地的精準(zhǔn)、快速、無(wú)損、高通量溯源分析,本發(fā)明提供一種結(jié)合高光譜成像(hyperspectralimaging,hsi)和核磁共振(nuclear?magnetic?resonance,nmr)的深度學(xué)習(xí)算法的枸杞產(chǎn)地溯源方法;應(yīng)對(duì)訓(xùn)練數(shù)據(jù)量大、維度高等困難。不僅減少數(shù)據(jù)采集的量,提高模型計(jì)算效率,還確保所使用深度學(xué)習(xí)模型的可解釋性,能對(duì)枸杞的產(chǎn)地進(jìn)行更為精確的鑒別。
2、本發(fā)明包括以下步驟:
3、1)將待測(cè)的不同產(chǎn)地枸杞樣品進(jìn)行前處理后,進(jìn)行高光譜圖像數(shù)據(jù)和核磁共振氫譜數(shù)據(jù)采集;
4、2)對(duì)采集的高光譜圖像數(shù)據(jù)進(jìn)行預(yù)處理,基于預(yù)處理后的高光譜圖像數(shù)據(jù)結(jié)合深度學(xué)習(xí)算法構(gòu)建枸杞產(chǎn)地溯源模型;
5、3)對(duì)采集的核磁共振氫譜數(shù)據(jù)進(jìn)行預(yù)處理,使用多變量統(tǒng)計(jì)分析分別篩選不同產(chǎn)地枸杞的譜峰波段和差異成分;
6、4)基于shapley?additive?explanations算法篩選高光譜特征波長(zhǎng)以及光譜特征波長(zhǎng)和差異成分之間的關(guān)聯(lián)分析。
7、在步驟1)中,所述高光譜圖像數(shù)據(jù)的采集步驟:
8、(1)將待測(cè)的不同產(chǎn)地枸杞樣品放置于載物臺(tái)上;
9、(2)調(diào)整高光譜系統(tǒng)的采集分辨率、光譜波段數(shù)、曝光時(shí)間、增益、載物臺(tái)高度和電機(jī)速度,然后采集枸杞的可見(jiàn)近紅外高光譜圖像數(shù)據(jù);采集的高光譜圖像數(shù)據(jù)分辨率為882×960,波段為400~1000nm波長(zhǎng)內(nèi)共128個(gè)波段的可見(jiàn)近紅外高光譜圖像;
10、在步驟1)中,所述核磁共振氫譜數(shù)據(jù)的采集步驟:
11、(1)將整顆枸杞使用液氮進(jìn)行快速冷凍,隨后利用研缽研磨成細(xì)粉并過(guò)篩;
12、(2)取枸杞粉末溶解在甲醇、氯仿和水的混合溶劑中;甲醇、氯仿和水的比例為2︰2︰3;
13、(3)經(jīng)過(guò)漩渦混勻后,混合溶液在冰上冷卻15min,然后離心10min;漩渦混勻時(shí)間為60s,離心力為10000g,離心溫度為4℃;
14、(4)將上清液轉(zhuǎn)移到離心管中,使用氮吹儀進(jìn)行30min氮吹,隨后進(jìn)行12h的凍干,以去除甲醇和水;
15、(5)將干燥后的物質(zhì)重新溶解在600μl的重水磷酸緩沖液中,其中含有0.05%的tsp(sodium?3-(trimethylsilyl)propionate-2,2,3,3-d4);重水磷酸緩沖液ph為5.7,tsp為氘代水溶液,在后續(xù)數(shù)據(jù)處理中作為定標(biāo)物;
16、(6)經(jīng)過(guò)漩渦混勻5min后,取550μl上清液轉(zhuǎn)移到5mm核磁管中,準(zhǔn)備進(jìn)行核磁共振氫譜數(shù)據(jù)采集;
17、(7)將制備好的樣品放置在配備超低溫探頭的核磁共振波譜儀上,采集核磁共振氫譜數(shù)據(jù),并結(jié)合多變量統(tǒng)計(jì)分析篩選不同產(chǎn)地的差異成分。數(shù)據(jù)采集是在一臺(tái)850mhz核磁共振波譜儀上使用cptci探頭在850.32mhz下采用zgpr脈沖序列,參數(shù)設(shè)置為:溫度298k,譜寬14khz,采樣點(diǎn)數(shù)為32k,弛豫時(shí)間4.0s,采集時(shí)間1.9s,掃描次數(shù)64次。
18、在步驟2)中,所述對(duì)采集的高光譜圖像數(shù)據(jù)進(jìn)行預(yù)處理,基于預(yù)處理后的高光譜圖像數(shù)據(jù)結(jié)合深度學(xué)習(xí)算法構(gòu)建枸杞產(chǎn)地溯源模型的具體步驟可為:
19、(1)對(duì)所采集的高光譜圖像數(shù)據(jù)使用標(biāo)準(zhǔn)漫反射參考板進(jìn)行黑白板矯正;采用的黑白板矯正公式為:其r為校正后的圖像,iraw為原始圖像,idark為黑色參考圖像,iref為采集標(biāo)準(zhǔn)漫反射參考板(hsia-ct-400x400,dualix,china)的圖像;
20、(2)對(duì)校正后的可見(jiàn)近紅外高光譜圖像進(jìn)行感興趣區(qū)域識(shí)別與裁剪;
21、(3)將裁剪后的感興趣區(qū)域圖像數(shù)據(jù)進(jìn)行格式轉(zhuǎn)換和保存,構(gòu)建基于深度學(xué)習(xí)建立枸杞產(chǎn)地溯源模型;使用的深度學(xué)習(xí)算法是改進(jìn)的resnet-34模型,使用resnet-34模型訓(xùn)練高光譜數(shù)據(jù),利用訓(xùn)練好的模型,通過(guò)shap算法計(jì)算每個(gè)波長(zhǎng)的shap值,篩選對(duì)模型正確預(yù)測(cè)產(chǎn)地貢獻(xiàn)較大的光譜波長(zhǎng);
22、(4)計(jì)算每顆枸杞的平均光譜,構(gòu)建基于傳統(tǒng)機(jī)器學(xué)習(xí)建立枸杞產(chǎn)地溯源模型;使用的傳統(tǒng)機(jī)器學(xué)習(xí)有邏輯回歸(logistic?regression,lr)和supportvector?machine(svm)模型。
23、在步驟3)中,所述所述對(duì)采集的核磁共振氫譜數(shù)據(jù)進(jìn)行預(yù)處理的具體可為:使用mestrenova軟件對(duì)采集的核磁共振氫譜數(shù)據(jù)進(jìn)行定標(biāo),將tsp位置標(biāo)為0ppm,以確保不同樣品之間的化學(xué)位移具有可比性;調(diào)整譜圖的相位,確保譜峰位于正確的位置;調(diào)整基線,以消除基線漂移對(duì)積分精度的影響;然后去除干擾峰,譜圖進(jìn)行積分和總面積歸一化處理。
24、在步驟3)中,所述使用多變量統(tǒng)計(jì)分析分別篩選不同產(chǎn)地枸杞的譜峰波段和差異成分的具體步驟可為:將積分后的核磁共振氫譜數(shù)據(jù)導(dǎo)入simca軟件,在simca軟件中進(jìn)行多變量統(tǒng)計(jì)分析,如pca(主成分分析)和pls-da(偏最小二乘判別分析);設(shè)置四維火山圖的參數(shù),包括差異倍數(shù)(fold?change)、p值、絕對(duì)相關(guān)系數(shù)(│r│)和變量重要性投影(vip);通過(guò)四維火山圖篩選出不同產(chǎn)地枸杞的地理標(biāo)志物。
25、在步驟4)中,所述基于shapley?additive?explanations算法篩選高光譜特征波長(zhǎng)以及光譜特征波長(zhǎng)和差異成分之間的關(guān)聯(lián)分析,探究單一波段圖像數(shù)據(jù)與差異成分之間的相關(guān)性,使用pearson相關(guān)系數(shù)分析兩者之間關(guān)聯(lián)性,最后選擇與每個(gè)產(chǎn)地差異成分相關(guān)性最高的波段的圖像數(shù)據(jù)優(yōu)化枸杞產(chǎn)地溯源模型。
26、與現(xiàn)有技術(shù)相比,本發(fā)明創(chuàng)造的技術(shù)效果體現(xiàn)在:
27、本發(fā)明同時(shí)使用高光譜成像和核磁共振技術(shù)采集不同產(chǎn)地枸杞的數(shù)據(jù)。高光譜成像技術(shù)有著無(wú)損、快速、高通量等優(yōu)點(diǎn),但是其對(duì)特定物質(zhì)的解釋性較弱;而核磁共振技術(shù)能夠?qū)﹁坭降牟煌煞诌M(jìn)行精準(zhǔn)鑒別與含量鑒定,但是核磁共振數(shù)據(jù)采集過(guò)程中技術(shù)要求高、成本高并且無(wú)法實(shí)現(xiàn)高通量。因此,將高光譜圖像數(shù)據(jù)與枸杞成分進(jìn)行關(guān)聯(lián)分析,篩選出特征波長(zhǎng)的圖像數(shù)據(jù)結(jié)合深度學(xué)習(xí)算法構(gòu)建枸杞產(chǎn)地溯源模型有著數(shù)據(jù)處理簡(jiǎn)單、成本低和能夠?qū)崿F(xiàn)高通量的枸杞產(chǎn)地鑒別等優(yōu)點(diǎn)?;诠庾V特征波長(zhǎng)與枸杞產(chǎn)地差異成分關(guān)聯(lián)分析的方法,不僅能夠精簡(jiǎn)數(shù)據(jù)維度,還能有效提升模型的性能。結(jié)合多光譜信息和地理標(biāo)志物的相關(guān)性,為枸杞產(chǎn)地溯源提供新的思路,提高枸杞產(chǎn)地溯源模型的準(zhǔn)確性和可靠性。本發(fā)明僅提高分類準(zhǔn)確率,還顯著減少計(jì)算時(shí)間。本發(fā)明的應(yīng)用不僅限于枸杞,還可以推廣到其他農(nóng)產(chǎn)品的產(chǎn)地溯源和品質(zhì)檢測(cè)中,具有廣泛的應(yīng)用前景。