本發(fā)明涉及到食品品質(zhì)檢測(cè)領(lǐng)域,特別是常見(jiàn)轉(zhuǎn)基因大豆的鑒別方法,具體為一種結(jié)合PLS-DA判別法快速、無(wú)損鑒別轉(zhuǎn)基因大豆方法。
背景技術(shù):
我國(guó)為大豆的原產(chǎn)國(guó)也是大豆的主產(chǎn)國(guó)之一,但是近年來(lái),國(guó)外的轉(zhuǎn)基因大豆大量涌入中國(guó),中國(guó)國(guó)產(chǎn)大豆失去了價(jià)格優(yōu)勢(shì),很多企業(yè)選擇低成本的轉(zhuǎn)基因大豆作為原料。中國(guó)是個(gè)飲食文化上很依賴大豆的國(guó)家,各種大豆制品充斥著我們的餐桌,但是由于轉(zhuǎn)基因大豆可能存在安全性問(wèn)題,很多消費(fèi)者選擇不食用轉(zhuǎn)基因食品,但是有調(diào)查顯示我國(guó)存在很多大豆制品中是使用轉(zhuǎn)基因大豆制作的,但是都沒(méi)有進(jìn)行標(biāo)示,所以在食品安全監(jiān)測(cè)方面,亟待一種有效的檢測(cè)產(chǎn)品中是為轉(zhuǎn)基因的方法。
目前針對(duì)于轉(zhuǎn)基因大豆的定性鑒別方法有許多仍未感官評(píng)定為主,感官評(píng)定的方法的檢測(cè)結(jié)果因主觀因素影響較大,不適合大批量樣本的檢測(cè)。目前針對(duì)于轉(zhuǎn)基因大豆的檢測(cè)的方法主要有,酶聯(lián)免疫吸附檢測(cè)法,試條法,PCR技術(shù),基因芯片等方法,但是存在實(shí)驗(yàn)過(guò)程繁雜,操作復(fù)雜,需要添加化學(xué)試劑等缺點(diǎn)。因此,有必要尋找一種更加簡(jiǎn)單、快速的轉(zhuǎn)基因大豆鑒別方法。近紅外光譜分析技術(shù)是今年來(lái)一種新興的光譜分析技術(shù),無(wú)需樣品預(yù)處理,不用破壞樣品,有望成為一種簡(jiǎn)單快捷的轉(zhuǎn)基因大豆鑒別方法。近紅外光譜儀(Near Infrared Spectrum Instrument,NIRS)是介于可見(jiàn)光(Vis)和中紅外(MIR)之間的電磁輻射波,近紅外光譜區(qū)定義為780-2526nm的區(qū)域,是人們?cè)谖展庾V中發(fā)現(xiàn)的第一個(gè)非可見(jiàn)光區(qū)。
近紅外光譜區(qū)與有機(jī)分子中含氫基團(tuán)(O-H、N-H、C-H)振動(dòng)的合頻和各級(jí)倍頻的吸收區(qū)一致,通過(guò)掃描樣品的近紅外光譜,可以得到樣品中有機(jī)分子含氫基團(tuán)的特征信息,而且利用近紅外光譜技術(shù)分析樣品具有方便、快速、高效、準(zhǔn)確和成本較低,不破壞樣品,不消耗化學(xué)試劑,不污染環(huán)境,儀器便攜等優(yōu)點(diǎn),因此該技術(shù)受到越來(lái)越多人的青睞。
在實(shí)際工作中,只需要知道樣品的類別和質(zhì)量等級(jí),并不需要知道樣品中含有的組分?jǐn)?shù)和其含量的問(wèn)題,這時(shí)候需要模式識(shí)別法。近紅外光譜的定性依據(jù)主要是光譜本身,因?yàn)楣庾V反映了真實(shí)樣品的組成和結(jié)構(gòu)信息,相同或者近似的樣品有著相同或相近的光譜。通過(guò)應(yīng)用含糊的數(shù)學(xué)光譜匹配方式進(jìn)行實(shí)際的定性分析。近紅外光譜常用模式識(shí)別方法主要有聚類分析、主成分分析結(jié)合馬氏距離的判別、主成分分析結(jié)合最小二乘支持向量機(jī)的方式等。而偏最小二乘判別分析是一種常用的化學(xué)模式識(shí)別方法。
技術(shù)實(shí)現(xiàn)要素:
綜上,當(dāng)前亟需一種快速、無(wú)損的轉(zhuǎn)基因大豆的鑒別方法,解決現(xiàn)有技術(shù)中轉(zhuǎn)基因大豆檢測(cè)技術(shù),實(shí)驗(yàn)過(guò)程繁殖,操作復(fù)雜,并且往往需要破壞樣品等問(wèn)題。本發(fā)明擬借助近紅外光譜技術(shù)構(gòu)建一種快速、準(zhǔn)確、無(wú)損的方法用于鑒別轉(zhuǎn)基因大豆。
為上述目的,本發(fā)明采用以下技術(shù)方案實(shí)現(xiàn):一種快速、無(wú)損鑒別轉(zhuǎn)基因大豆方法,其包括以下:步驟S1:收集不同種類的轉(zhuǎn)基因大豆和非轉(zhuǎn)基因的大豆樣品;步驟S2:將樣本進(jìn)行近紅外光譜掃描,采集其近紅外光譜,并剔除異常的樣本數(shù)據(jù);步驟S3:選取1100~2500 nm特征波段下的光譜信息,運(yùn)用多元散射校正預(yù)處理方法進(jìn)行對(duì)步驟S2中的光譜信息進(jìn)行處理;并對(duì)處理后的光譜信息進(jìn)行散射校正;步驟S4:采用留一法交叉驗(yàn)證,求PLS-DA最佳的因子數(shù);具體步驟為:假設(shè)有N個(gè)樣本,將每一個(gè)樣本作為測(cè)試樣本,其它N-1個(gè)樣本作為訓(xùn)練樣本,這樣得到N個(gè)分類器,N個(gè)測(cè)試結(jié)果,用這N個(gè)結(jié)果的平均值來(lái)衡量模型的性能,從而找到求PLS-DA最佳的因子數(shù);N為大于1的自然數(shù);步驟S5:采用步驟S4的最佳的因子數(shù),進(jìn)行PLS-DA建模;步驟S6:對(duì)于未知的樣品,利用掃描器獲取其近紅外光譜,再利用建立好的PLS-DA模型,預(yù)測(cè)其所屬類別。
進(jìn)一步的,所述步驟S3包括以下步驟:首先建立一個(gè)待測(cè)樣品的理想光譜,所述理想光譜的變化與樣品中成分的含量滿足直接的線性關(guān)系,以該光譜為標(biāo)準(zhǔn)要求對(duì)所有其他樣品的近紅外光譜進(jìn)行修正,其中包括基線平移和偏移校正。
本發(fā)明的上述技術(shù)方案相比現(xiàn)有的技術(shù)具有以下的優(yōu)點(diǎn):本發(fā)明所采取的主成分分析法結(jié)合Fisher判別引入到鑒別常見(jiàn)的致病菌,不僅能夠快速鑒別出致病菌的種類,并且具有高精度、操作簡(jiǎn)單等優(yōu)點(diǎn),在后續(xù)的臨床菌種鑒別工作中有重大貢獻(xiàn),具有良好的應(yīng)用前景。
附圖說(shuō)明
圖1實(shí)施所述轉(zhuǎn)基因大豆的近紅外原始吸收光譜圖。
圖2實(shí)施所述非轉(zhuǎn)基因大豆的近紅外原始吸收光譜圖。
圖3經(jīng)過(guò)多元散射校正預(yù)處理后的轉(zhuǎn)基因大豆的近紅外吸收光譜圖。
圖4經(jīng)過(guò)多元散射校正預(yù)處理后的非轉(zhuǎn)基因大豆的近紅外吸收光譜圖。
圖5 利用留一法交叉驗(yàn)證取得最佳主成分因子數(shù)變化圖。
具體實(shí)施方式
下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明做進(jìn)一步解釋說(shuō)明。
為了更好的理解本發(fā)明,下面結(jié)合實(shí)例對(duì)本發(fā)明進(jìn)一步的詳細(xì)說(shuō)明。
本發(fā)明提供一種快速、無(wú)損的轉(zhuǎn)基因大豆的鑒別方法,其包括以下:步驟S1:收集不同種類的轉(zhuǎn)基因大豆和非轉(zhuǎn)基因的大豆樣品;步驟S2:將樣本進(jìn)行近紅外光譜掃描,采集其近紅外光譜,并剔除異常的樣本數(shù)據(jù);步驟S3:選取1100~2500 nm特征波段下的光譜信息,運(yùn)用多元散射校正預(yù)處理方法進(jìn)行對(duì)步驟S2中的光譜信息進(jìn)行處理;并對(duì)處理后的光譜信息進(jìn)行散射校正;步驟S4:采用留一法交叉驗(yàn)證,求PLS-DA最佳的因子數(shù);具體步驟為:假設(shè)有N個(gè)樣本,將每一個(gè)樣本作為測(cè)試樣本,其它N-1個(gè)樣本作為訓(xùn)練樣本,這樣得到N個(gè)分類器,N個(gè)測(cè)試結(jié)果,用這N個(gè)結(jié)果的平均值來(lái)衡量模型的性能,從而找到求PLS-DA最佳的因子數(shù);N為大于1的自然數(shù);步驟S5:采用步驟S4的最佳的因子數(shù),進(jìn)行PLS-DA建模;步驟S6:對(duì)于未知的樣品,利用掃描器獲取其近紅外光譜,再利用建立好的PLS-DA模型,預(yù)測(cè)其所屬類別。
一個(gè)交叉驗(yàn)證將樣本數(shù)據(jù)集分成兩個(gè)互補(bǔ)的子集,一個(gè)子集用于訓(xùn)練(分類器或模型)稱為訓(xùn)練集(training set);另一個(gè)子集用于驗(yàn)證(分類器或模型的)分析的有效性稱為測(cè)試集(testing set)。利用測(cè)試集來(lái)測(cè)試訓(xùn)練得到的分類器或模型,以此作為分類器或模型的性能指標(biāo)。得到高度預(yù)測(cè)精確度和低的預(yù)測(cè)誤差,是研究的期望。為了減少交叉驗(yàn)證結(jié)果的可變性,對(duì)一個(gè)樣本數(shù)據(jù)集進(jìn)行多次不同的劃分,得到不同的互補(bǔ)子集,進(jìn)行多次交叉驗(yàn)證。取多次驗(yàn)證的平均值作為驗(yàn)證結(jié)果。
在給定的建模樣本中,拿出大部分樣本進(jìn)行建模型,留小部分樣本用剛建立的模型進(jìn)行預(yù)報(bào),并求這小部分樣本的預(yù)報(bào)誤差,記錄它們的平方加和。這個(gè)過(guò)程一直進(jìn)行,直到所有的樣本都被預(yù)報(bào)了一次而且僅被預(yù)報(bào)一次。把每個(gè)樣本的預(yù)報(bào)誤差平方加和,稱為PRESS(predicted Error Sum of Squares)。
假設(shè)分類器或模型有一個(gè)或多個(gè)未知的參數(shù),并且設(shè)這個(gè)訓(xùn)練器(模型)與已有樣本數(shù)據(jù)集(訓(xùn)練數(shù)據(jù)集)匹配。訓(xùn)練的過(guò)程是指優(yōu)化模型的參數(shù),以使得分類器或模型能夠盡可能的與訓(xùn)練數(shù)據(jù)集匹配。我們?cè)谕粩?shù)據(jù)集總體中,取一個(gè)獨(dú)立的測(cè)試數(shù)據(jù)集。
進(jìn)一步的,所述步驟S3包括以下步驟:首先建立一個(gè)待測(cè)樣品的理想光譜,所述理想光譜的變化與樣品中成分的含量滿足直接的線性關(guān)系,以該光譜為標(biāo)準(zhǔn)要求對(duì)所有其他樣品的近紅外光譜進(jìn)行修正,其中包括基線平移和偏移校正。
具體實(shí)施例:
(1)收集轉(zhuǎn)基因大豆與非轉(zhuǎn)基因大豆樣本各44個(gè)樣本,在溫度為25℃時(shí),濕度為30 %左右條件下,利用Nicolet 6700傅里葉變換近紅外光儀(賽默飛世爾科技公司,Thermo Fisher)采集其漫反射光譜圖,掃描范圍1100~2500 nm,如圖1和圖2。
(2)對(duì)于異常的樣本進(jìn)行剔除,并運(yùn)用多元散射校正預(yù)處理方法進(jìn)行對(duì)光譜信息進(jìn)行處理。經(jīng)過(guò)散射校正后得到的光譜數(shù)據(jù)可以有效地消除散射影響,增強(qiáng)了與成分含量相關(guān)的光譜吸收信息。該方法的使用首先要求建立一個(gè)待測(cè)樣品的“理想光譜”,即光譜的變化與樣品中成分的含量滿足直接的線性關(guān)系,以該光譜為標(biāo)準(zhǔn)要求對(duì)所有其他樣品的近紅外光譜進(jìn)行修正,其中包括基線平移和偏移校正等,如圖3和圖4。
(3)將共88個(gè)樣本利用K-S算法分別對(duì)轉(zhuǎn)基因大豆與非轉(zhuǎn)基因劃分校正集與預(yù)測(cè)集,校正集66個(gè)樣本,預(yù)測(cè)集22個(gè)樣本。
(4)采用留一法交叉驗(yàn)證求的PLS-DA最佳的因子數(shù),如圖5。
(5)采用最佳的因子數(shù)4,進(jìn)行PLS-DA建模。對(duì)于未知的樣品,掃描器近紅外光譜,就可以利用建立好的PLS-DA模型,預(yù)測(cè)其歸屬,準(zhǔn)確率如表格1,預(yù)測(cè)成功率在校正集與預(yù)測(cè)集均為100%。
表1
以上是本發(fā)明的較佳實(shí)施例,凡依本發(fā)明技術(shù)方案所作的改變,所產(chǎn)生的功能作用未超出本發(fā)明技術(shù)方案的范圍時(shí),均屬于本發(fā)明的保護(hù)范圍。