一種基于遺傳算法的龍井茶品質檢測等級模型中傳感器的選擇方法
【專利摘要】一種基于遺傳算法的龍井茶品質檢測等級模型中傳感器的選擇方法,應用方差分析的原理,把每根傳感器當作一個因素,不同樣品的響應當作水平,進行方差齊性檢驗,保證數據滿足方差分析的條件,應用SPSS數據分析軟件對所有等級樣品的傳感器數據分別進行單因素方差分析計算F值,F值表明同一傳感器對不同類樣品的區(qū)分能力,F值越大,區(qū)分度則越大。
【專利說明】一種基于遺傳算法的龍井茶品質檢測等級模型中傳感器的選擇方法
【技術領域】
[0001]本申請涉及一種基于遺傳算法的龍井茶品質檢測等級模型中傳感器的選擇方法?!颈尘凹夹g】
[0002]長期以來感官品評是評定茶葉品質優(yōu)劣的重要方法,但該方法需要有豐富的茶學知識和審評經驗。除非是專業(yè)茶葉審評員、經銷商或制造商,一般購茶者很難分辨茶葉質量的優(yōu)劣,沒有相當經驗的積累,難以得到可靠的結果。并且培養(yǎng)一名茶葉評審員不僅要精心挑選,投入大量費用,而且訓練周期也比較長。況且即便是專業(yè)品茶師,其感覺器官的靈敏度也易受外界因素的干擾而改變,從而影響評價結果的準確性、客觀性和一致性。如人的嗅覺分辨力易受外界異雜氣味的干擾;人的味覺敏感度易受其它刺激性食物及其溫度的影響;人的視覺涉及到光學、視覺生理、視覺心理等諸多因素,不同人的辨色能力會存在一定的差別。審評人員感覺器官的靈敏度還受其它因素的影響,如地域差異、性別差別、精神狀態(tài)及身體狀況等因素。此外,感官審評需在對照實物標準樣的基礎上進行,而實物標準樣的制作受到各種條件的限制,難以保持幾年連續(xù)一致。并且標準樣采用前一年度或前幾年度的生產性產品作原料,不可能不受天時、氣候、地理條件的影響,所以事實上標準樣品質很難達到絕對的標準。
[0003]本發(fā)明對不同采摘期、不同樹種、不同產區(qū)的龍井茶從理化指標和感官指標出發(fā),結合智能化感官分析、多元統(tǒng)計和現代儀器分析的集成技術,全方位的解析龍井茶特征,分析茶葉各指標的內在關系,建立定性、定量評價龍井茶品質的數學模型,對龍井茶質量進行準確的特征識別、等級評定,為建立統(tǒng)一的綠茶評價體系標準提供強有力的依據。這些研究在理論上將為我國其它茶葉的質量評價提供基礎和支撐,在實踐中對于提高我國茶葉質量的穩(wěn)定性,通過標準化手段強化我國茶葉的分等分級,實現茶葉的優(yōu)質優(yōu)價,打破我國出口茶葉的高質低價傳統(tǒng),消除發(fā)達國家對我國產品優(yōu)質低價的質疑,對于維護國內市場秩序和保障消費者的切身利益,積極捍衛(wèi)我國茶葉產品的國際聲譽,促進國際貿易等具有重要的意義和顯著的社會效益、經濟效益。
[0004]近年來隨著現代儀器分析技術的發(fā)展,茶葉的理化研究也得到了相應的進展。茶葉香氣物質分離和分析技術已逐步從常規(guī)的氣相色譜(GC)或氣相色譜-質譜聯用(GC-MS)過渡到氣相色譜-嗅辨(GC-O)方法。目前已檢測出七百多種的茶葉香氣成分,包括脂肪類衍生物、萜烯類衍生物、芳香族衍生物和含氮氧雜環(huán)類化合物。但即便如此,單純從成分的角度也難以反應茶葉香氣的整體特征信息和香氣品質。對茶葉呈味物質的儀器分析技術主要有液相色譜法、光譜法、質譜法、核磁共振法等。目前,已明確茶葉中含有機化學成分多達六百余種,無機礦物元素亦達四十多種。但由于各種滋味之間存在著相互作用,如味覺的對t匕、變調、協調和相殺等現象,所以測得的化學特性參數并不能真實全面地反映出樣品的味覺特征。
[0005]智能感官分析技術的出現進一步推動了茶葉品質檢測水平,它是基于對人體感官感知過程模仿的技術。傳感器相當于生物系統(tǒng)中的感覺器官,對被測樣品某方面的屬性產生響應信號;信號采集器如同神經系統(tǒng)對響應信號進行傳輸和簡單處理;電腦如同人腦對信號數據進行復雜處理和分析識別,形成綜合、整體的判斷。智能感官分析技術具有檢測時間短、重復性好、不需要復雜的樣品預處理過程、不發(fā)生感官疲勞和檢測結果客觀可靠等特點,更重要的是可以在一定程度上模擬人的感官給出有關茶葉香氣、滋味和外質的評判結果和指紋信息,是目前茶葉品質檢測研究的熱點和發(fā)展趨勢。目前針對茶葉中的色、香、味、形等感官屬性,所采用的智能感官分析技術主要有機器視覺、電子鼻和電子舌技術,其工作流程主要包括傳感器產生響應信號、對響應信號進行預處理、提取樣品特征信息、建立相關模型并進行模式識別。其中模式識別是智能感官系統(tǒng)的重要組成部分。目前應用的主要方法有主成分分析、人工神經網絡和模糊識別等。主成分分析用于信號處理,抑制多維傳感器響應信號噪聲和壓縮信號數據。人工神經網絡對處理后的信號進行學習和訓練,建立網絡模型。模糊識別則以模糊推理對復雜事物進行模糊識別、模糊定量。
[0006]采用智能感官技術模擬人感官審評的功能和特征,結合多算法研究處理智能感官檢測中所蘊含的豐富的產品品質信息,進而抽取出相對應的計算模型和方法。以解決終端問題為目的的算法,在多個智能傳感器對象和多個產品指標互相關聯的情況下分析它們的統(tǒng)計規(guī)律,很適合食品科學研究的特點。采用多算法、智能感官分析技術和現代儀器分析技術等集成技術,能夠克服多指標綜合評價帶來的統(tǒng)計和分析的麻煩,同時也能夠充分利用實驗數據信息得到與茶葉特征品質相關的隱含細節(jié),使得茶葉特征品質的統(tǒng)計分析和模式判別可以同時完成,既迅速又準確。由此,為建立我國茶葉的特征品質數據庫和智能化品質評價系統(tǒng),實現對茶葉品質快速、準確、全面的分析,為我國茶葉特征品質的科學評價、合理界定提供借鑒和指導,為我國茶葉的品質保證、特色保護、真?zhèn)舞b別提供核心的技術支撐。
[0007]電子鼻作為20世紀90年代發(fā)展起來的新型氣味掃描儀,目前已廣泛應用于食品、飲料、化妝品、環(huán)境檢測以及農產品加工過程控制等領域。與普通的化學分析方法相比,電子鼻利用其對多種氣體的交叉敏感性,綜合評價氣體的整體信息,與人的嗅覺相比,測定結果更加客觀、可靠。
[0008]電子舌技術是20世紀80年代中期發(fā)展起來的一種分析、識別液體味道的新型檢測手段,現已被應用于食品、醫(yī)藥、化妝品、化工、環(huán)境監(jiān)測等領域。與普通的化學分析方法相比,電子舌輸出的并不是樣品滋味成分的分析結果,而是一種與樣品有關的信號模式,經過具有模式識別能力的軟件系統(tǒng)分析后,可得出對樣品味覺特征有關的總體評價。
[0009]綜上所述,智能感官分析技術(機器視覺技術、電子鼻技術和電子舌技術)在茶葉品質檢測中已取得了較好結果,并顯示了較好的應用前景。但目前這些技術離實際應用還有一定差距,尚有一些關鍵性問題需要解決。如:
(I)電子鼻、電子舌的關鍵技術研究:機器視覺技術已經在實際中廣泛應用,但電子鼻、電子舌尚處于研發(fā)階段,因此要構建綜合的智能感官系統(tǒng),需要對電子鼻、電子舌進行深入研究,解決其關鍵問題。
[0010](2)特異性傳感器的研制與篩選:由于不同類型的樣品具有其特定的物質體系,導致不同類型的傳感器對不同物質的響應都不同。因此,需進一步深入研究,針對特定的物質體系建立響應快、敏感度高、壽命長、清洗方便、經濟適用的傳感器陣列。
[0011](3)樣品的代表性和采樣的科學性:目前的研究報道中,其結果大都顯示對茶葉分類或分級的判別率較高。但這些研究中,茶葉樣品的代表性不夠強,樣品數也不夠全,在采集樣品信息時,基本都是平行樣,即每個等級的茶葉檢測都重復很多次,使得模型的穩(wěn)定性不佳,使用范圍不廣。只有建立科學的樣品采集方法和樣品代表性的判別原則,才能保證后續(xù)模型的順利建立。
[0012](4)信號的漂移和去噪:由于儀器測量參數、測量方法、測量環(huán)境、樣品來源等因素變化,容易導致傳感器響應曲線的漂移,引起智能感官檢測的誤差,使其不能適應工業(yè)化的長時間連續(xù)作業(yè),因此需要加強有關減小響應信號漂移、信號噪聲分析處理技術的研究。
[0013](5)模型的魯棒性:有些研究在建立判別模型時,未對模型進行詳細討論,也未使用獨立的預測樣本來檢驗模型的魯棒性。此外,品質判別中所建模型的穩(wěn)定性不足,需要加強算法的研究及改進,以提高模式識別的效力。
[0014]電子鼻系統(tǒng)屬于多根傳感器的陣列組合,由于茶葉香氣成分復雜,使得每個傳感器對很多香氣都有響應,而每個香氣成分又在很多傳感器上有響應,使得傳感器指紋圖譜陣列能最大程度的保留香氣信息,但又容易引入大量冗余信息,導致品質建模計算量大、耗費時間長、所建模型復雜不穩(wěn)定。其主要原因為:(1)由于智能感官指紋圖譜中,有些傳感器的樣品響應信息很弱,直接影響模型的預測精度;(2)由于電子鼻儀器噪聲的影響,一些傳感器的樣品信息信噪比(SNR)較低;同時,外界的干擾因素(如溫度、濕度等)對樣品品質在某些傳感器處的指紋響應特性影響較大,從而降低了模型的穩(wěn)健性;(3)茶葉香氣中含有多種組分,每一種組分都會在某一個或幾個傳感器中有較強的響應,而作為茶葉香氣整體信息的檢測,需要優(yōu)化組合對不同香氣有特殊響應的傳感器陣列,才能綜合有效的特征香氣指紋信息。
[0015]通過傳感器的合理選擇與組合,不僅可以剔除不相關或非線性的嗅聞傳感器,去除冗余傳感器數據信息,提取最有效的香氣智能嗅聞指紋圖譜信息,使校正模型具有更好的預測能力,簡化運算。而且可以省去那些對模式識別效果沒有顯著影響甚至有負面影響的傳感器,從而對降低電子鼻的制造成本,提高系統(tǒng)穩(wěn)定性都有一定的積極意義。
[0016]傳感器選擇就是實踐中經常遇到的一種優(yōu)化問題。目前所采用的優(yōu)化組合法雖然在一定程度上使用了組合的理念,但這個組合是在初步剔除的基礎上,對分組后的傳感器陣列進行組合,并未達到全局優(yōu)化組合的效果。而Loading值法雖然避免了冗余傳感器的加入,但并未分析被選傳感器的響應性能,即同一傳感器對同一樣品響應的重復性和對不同樣品響應的區(qū)分性。遺產算法(Genetic Algorithms,縮寫為GA)是以達爾文的適者生存和優(yōu)勝劣汰的生物進化理論為基礎,模擬生物界的遺傳和進化過程而建立的一種優(yōu)化方法,具有非導數、隨機全局優(yōu)化、避免陷入局部極小點和易實現等特點。
【發(fā)明內容】
[0017]一種基于遺傳算法的龍井茶品質檢測等級模型中傳感器的選擇方法,其特征在于:包括如下步驟:
西湖龍井茶的等級模型的校正集預測集的樣本劃分;
不同等級茶葉的電子鼻響應圖譜分析;
全體等級樣品的主成分得分變化趨勢分析;
全體等級樣品的主成分載荷分析; 根據相似分類法建立等級建模的主成分數選擇;
茶葉的相似分類法的等級模型建立與預測。
[0018]其中,所述電子鼻采用法國Alpha MOS公司生產帶有頂空自動系統(tǒng)的Fox 4000型電子鼻,其包括18根傳感器,用于茶葉等級鑒別的樣品共617個,其中隨機選擇三分之二作校正集樣品,剩下的三分之一用作預測集樣品,所述遺傳算法的實現主要包括5個基本要素:參數編碼、變量的選取、群體的初始化、適應度函數設計、遺傳操作設計和收斂判據,其中作為重要環(huán)節(jié)的遺傳操作包括三個算子:選擇、交叉和變異。對等級模型的傳感器響應圖譜經過3輪遺傳算法后,發(fā)現三根傳感器LY2/LG、P40/1、TA/2在每次遺傳過程中被使用的頻率最低,因此剔除這三根傳感器,對留下的LY2/G、LY2/AA、LY2/GH、LY2/gCTL、LY2/gCT、T30/1、P10/1、P10/2、T70/2、PA/2、P30/1、P40/2、P30/2、T40/2、T40/1 這 15 根傳感器進行不同等級模型的建立。
[0019]所述的選擇方法,其特征在于:應用方差分析的原理,把每根傳感器當作一個因素,不同樣品的響應當作水平,進行方差齊性檢驗,保證數據滿足方差分析的條件,應用SPSS數據分析軟件對所有等級樣品的傳感器數據分別進行單因素方差分析計算F值,F值表明同一傳感器對不同類樣品的區(qū)分能力,F值越大,區(qū)分度則越大。
【專利附圖】
【附圖說明】
[0020]圖1異常樣本剔除前的PCA得分圖(a)與馬氏距離值殘差圖(b)。
[0021]圖2不同樣品在電子鼻傳感器特征響應點的信號圖。
[0022]圖3異常樣本LLJ剔除后的PCA得分圖(a)與馬氏距離值殘差圖(b)。
[0023]圖4四個等級龍井茶的電子鼻傳感器響應信號強度圖。
[0024]圖5異常樣品剔除后不同等級茶葉電子鼻傳感器響應平均值圖。
[0025]圖6異常樣品剔除后前四個主成分下的載荷圖。
[0026]圖7等級模型中PRESS值與模型主成分數之間的關系。
[0027]圖8遺傳算法運行流程圖。
[0028]圖9交叉算法。
[0029]圖10變異算法。
[0030]圖11四個等級樣品在主成分一、二下的載荷圖。
[0031]圖12產地模型中茶葉傳感器響應平均值圖。
[0032]圖13產地模型的主成分得分圖(PC1-PC2)。
[0033]圖14產地模型LHT-LMT (a)和LYJ-LWJ (b)在主成分一、二下的載荷圖。
[0034]圖15樹種模型中茶葉傳感器響應平均值圖。
[0035]圖16樹種模型主成分得分圖(PC1-PC2)。
【具體實施方式】
[0036]I茶葉樣品收集與處理
本發(fā)明收集來自杭州西湖龍井產區(qū)當地茶農的2011年西湖龍井茶樣,具體包括4個等級,2個樹種,5個產地。為了便于茶樣間的區(qū)分,對每種茶樣進行了合理編號和區(qū)分,具體信息見表I。為了保證同種茶樣品質的一致性,將茶樣置于一 4°C以下的冷庫內,按照實驗用量每次取小袋進行實驗。
[0037]
【權利要求】
1.一種基于遺傳算法的龍井茶品質檢測等級模型中傳感器的選擇方法,其特征在于:包括如下步驟: A西湖龍井茶的等級模型的校正集預測集的樣本劃分; B不同等級茶葉的電子鼻響應圖譜分析; C全體等級樣品的主成分得分變化趨勢分析; D全體等級樣品的主成分載荷分析; E根據相似分類法建立等級建模的主成分數選擇; F茶葉的相似分類法的等級模型建立與預測; 其中,所述電子鼻采用法國Alpha MOS公司生產帶有頂空自動系統(tǒng)的Fox 4000型電子鼻,其包括18根傳感器,用于茶葉等級鑒別的樣品共617個,其中隨機選擇三分之二作校正集樣品,剩下的三分之一用作預測集樣品,所述遺傳算法的實現主要包括5個基本要素--參數編碼、變量的選取、群體的初始化、適應度函數設計、遺傳操作設計和收斂判據,其中作為重要環(huán)節(jié)的遺傳操作包括三個算子:選擇、交叉和變異;對等級模型的傳感器響應圖譜經過3輪遺傳算法后,發(fā)現三根傳感器LY2/LG、P40/1、TA/2在每次遺傳過程中被使用的頻率最低,因此剔除這三根傳感器,對留下的LY2/G、LY2/AA、LY2/GH、LY2/gCTL、LY2/gCT、T30/1、P10/1、P10/2、T70/2、PA/2、P30/1、P40/2、P30/2、T40/2、T40/1 這 15 根傳感器進行不同等級模型的建立。
2.根據權利要求1所述的選擇方法,其特征在于:應用方差分析的原理,把每根傳感器當作一個因素,不同樣品的響應當作水平,進行方差齊性檢驗,保證數據滿足方差分析的條件,應用SPSS數據分析軟件對所有等級樣品的傳感器數據分別進行單因素方差分析計算F值,F值表明同一傳感器對不同類樣品的區(qū)分能力,F值越大,區(qū)分度則越大。
【文檔編號】G06F19/00GK103499663SQ201310323247
【公開日】2014年1月8日 申請日期:2013年7月30日 優(yōu)先權日:2013年7月30日
【發(fā)明者】史波林, 趙鐳, 汪厚銀, 支瑞聰, 劉寧晶, 裴高璞, 張璐璐, 解楠, 李烜 申請人:中國標準化研究院