国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種模糊協(xié)方差矩陣的可能模糊聚類茶葉品種鑒別方法與流程

      文檔序號(hào):11284034閱讀:594來(lái)源:國(guó)知局
      一種模糊協(xié)方差矩陣的可能模糊聚類茶葉品種鑒別方法與流程

      本發(fā)明涉及一種茶葉品種鑒別的方法,具體涉及一種模糊協(xié)方差矩陣的可能模糊聚類茶葉品種鑒別方法。



      背景技術(shù):

      中紅外光譜檢測(cè)技術(shù)作為一種快速無(wú)損檢測(cè)技術(shù),近年來(lái)應(yīng)用于食品的檢測(cè)分析中。中紅外光譜的波數(shù)范圍在4000cm-1~400cm-1之間,大多數(shù)的無(wú)機(jī)化合物和有機(jī)化合物的化學(xué)鍵振動(dòng)的基頻均在此區(qū)域。不同的分子中官能團(tuán)、化合物的類別和化合物的立體結(jié)構(gòu),其紅外吸收光譜不盡相同。中紅外光譜技術(shù)以其方便、快速、高效、無(wú)損、低成本等特點(diǎn)成為檢測(cè)食品和藥品的有效檢測(cè)技術(shù)。

      聚類的目的是將數(shù)據(jù)集按照某種相似準(zhǔn)則劃分為若干個(gè)子集。通過(guò)聚類方法將大批數(shù)據(jù)分類為許多本質(zhì)聯(lián)系的簇。常見(jiàn)的聚類方法有兩種:硬聚類和軟(模糊)聚類方法。前者往往應(yīng)用于聚類邊界明顯的情況;對(duì)于聚類邊界不是很清晰的系統(tǒng)采用模糊聚類方法則更為合適。

      可能性模糊c-均值聚類(pfcm)必須先運(yùn)行模糊c-均值聚類(fcm)來(lái)計(jì)算參數(shù),增加了聚類運(yùn)算時(shí)間。新可能性模糊c-均值聚類(npfcm)聚類方法(武小紅,周建江,等.可能性模糊c-均值聚類新算法[j].電子學(xué)報(bào),2008.10:1996~2000)解決了pfcm的問(wèn)題,減少了聚類運(yùn)算時(shí)間同時(shí)提高了準(zhǔn)確度。但是npfcm聚類方法在處理不規(guī)則聚類形狀的數(shù)據(jù)時(shí),使用的是歐氏距離進(jìn)行計(jì)算,聚類準(zhǔn)確率會(huì)因數(shù)據(jù)分布的不規(guī)則性而受到很大影響,使得聚類結(jié)果出現(xiàn)一定的誤差。

      在使用中紅外光譜儀檢測(cè)采集茶葉的中紅外光譜數(shù)據(jù)后,對(duì)數(shù)據(jù)集聚類時(shí)易出現(xiàn)聚類后的數(shù)據(jù)集呈現(xiàn)不規(guī)則的邊界,由于npfcm聚類方法采用歐氏距離對(duì)分布形狀不規(guī)則的數(shù)據(jù)集處理的能力并不理想,因而在處理該類型的茶葉中紅外光譜數(shù)據(jù)時(shí)易使準(zhǔn)確率降低。本發(fā)明在npfcm聚類方法的基礎(chǔ)上進(jìn)行了改進(jìn)和優(yōu)化,提出了一種模糊協(xié)方差矩陣的可能模糊聚類方法以實(shí)現(xiàn)茶葉的品種鑒別。一種模糊協(xié)方差矩陣的可能模糊聚類方法在計(jì)算聚類時(shí)采用了局部自適應(yīng)距離測(cè)度代替了歐氏距離,不僅提高了聚類的準(zhǔn)確率而且還減少了聚類運(yùn)算時(shí)間。



      技術(shù)實(shí)現(xiàn)要素:

      本發(fā)明是針對(duì)npfcm聚類方法在聚類分布形狀不規(guī)則的茶葉紅外光譜數(shù)據(jù)時(shí)會(huì)存在一定聚類誤差的缺陷,提出一種模糊協(xié)方差矩陣的可能模糊聚類方法的紅外光譜茶葉品種鑒別方法。相比原有的npfcm聚類方法,本發(fā)明的一種模糊協(xié)方差矩陣的可能模糊聚類方法采用局部自適應(yīng)距離測(cè)度代替歐氏距離,自適應(yīng)距離測(cè)度能通過(guò)估算模糊協(xié)方差矩陣調(diào)整距離測(cè)度,從而實(shí)現(xiàn)準(zhǔn)確聚類不同形狀簇?cái)?shù)據(jù),能快速有效的聚類茶葉的紅外光譜數(shù)據(jù),同時(shí)可以提高對(duì)茶葉品種鑒別的準(zhǔn)確率。具有檢測(cè)速度快,綠色無(wú)污染,所需茶葉樣本少等優(yōu)點(diǎn)。

      本發(fā)明依據(jù)的原理:研究表明茶葉的紅外漫反射光譜包含了茶葉內(nèi)部的組分信息,不同品種茶葉所對(duì)應(yīng)的紅外漫反射光譜不同。運(yùn)用主成分分析(pca)壓縮茶葉的紅外光譜數(shù)據(jù),采用線性判別分析(lda)提取紅外光譜的鑒別信息,最后用一種模糊協(xié)方差矩陣的可能模糊聚類方法鑒別茶葉品種。具體技術(shù)方案描述如下:

      一種模糊協(xié)方差矩陣的可能模糊聚類茶葉品種鑒別方法,包括如下步驟:

      步驟一、茶葉樣本紅外光譜采集:收集若干個(gè)品種的茶葉樣本,用紅外光譜儀獲取茶葉樣本紅外漫反射光譜信息;將茶葉樣本分為訓(xùn)練樣本和測(cè)試樣本;設(shè)置類別數(shù)c,訓(xùn)練樣本數(shù)nr和測(cè)試樣本數(shù)n;

      步驟二、對(duì)茶葉樣本紅外光譜預(yù)處理:用多元散射校正msc對(duì)茶葉樣本紅外光譜進(jìn)行預(yù)處理;

      步驟三、對(duì)茶葉樣本紅外光譜進(jìn)行降維處理:利用主成分分析pca將步驟二中獲得的茶葉樣本紅外光譜數(shù)據(jù)進(jìn)行壓縮;

      步驟四、將上述步驟三中獲得的茶葉樣本紅外光譜壓縮數(shù)據(jù)用線性判別分析lda提取鑒別信息后得到包含鑒別信息的訓(xùn)練樣本和測(cè)試樣本數(shù)據(jù);

      步驟五、對(duì)步驟四中包含鑒別信息的測(cè)試樣本用一種模糊協(xié)方差矩陣的可能模糊聚類方法以鑒別測(cè)試樣本中的茶葉品種。

      進(jìn)一步,所述紅外漫反射光譜信息的光譜波數(shù)范圍為4001.569cm-1~401.1211cm-1,采集茶葉樣本的光譜數(shù)據(jù)為1868維的數(shù)據(jù)。

      進(jìn)一步,步驟一還包括:采集茶葉的紅外漫反射光譜信息過(guò)程中保持室內(nèi)的溫度和濕度基本一致。

      進(jìn)一步,c=3。

      進(jìn)一步,步驟五的具體過(guò)程包括如下:

      (1)初始化:設(shè)置權(quán)重指數(shù)m和p的值,且滿足m0(1,+∞)、p∈(1,+∞);d為測(cè)試樣本的維數(shù);設(shè)置迭代次數(shù)初始值r=0和最大迭代次數(shù)為rmax;設(shè)置迭代最大誤差參數(shù)為ε;對(duì)測(cè)試樣本運(yùn)行模糊c均值聚類fcm,fcm運(yùn)行終止后的模糊隸屬度和類中心分別作為一種模糊協(xié)方差矩陣的可能模糊聚類方法的初始模糊隸屬度和初始聚類中心;

      (2)計(jì)算第r(r=1,2,…,rmax)次迭代時(shí)的模糊協(xié)方差矩陣sfi,r:

      上式中,xk為第k個(gè)茶葉紅外光譜測(cè)試樣本,vi,r-1為第r-1次迭代時(shí)第i類的類中心(i=1,2,3),uik,r-1為第r-1次迭代時(shí)樣本xk屬于第i類的模糊隸屬度,sfi,r是第r次迭代時(shí)第i類的模糊協(xié)方差矩陣;

      (3)計(jì)算第r次迭代時(shí)的模糊隸屬度值uik,r:

      上式中為第r-1次迭代時(shí)樣本xk到類中心vi,r-1的距離,為第r-1次迭代時(shí)樣本xk到類中心vj,r-1的距離范數(shù)(j=1,2,3);

      上式中,ai,r是第r次迭代時(shí)的第i個(gè)聚類中心的范數(shù)矩陣;aj,r第r次迭代時(shí)的第j個(gè)聚類中心的范數(shù)矩陣;d為測(cè)試樣本的維數(shù);vj,r-1為第r-1次迭代時(shí)第j類的類中心(j=1,2,3);

      (4)計(jì)算第r次迭代時(shí)的典型值tik,r:

      tik,r為第r次迭代時(shí)第k個(gè)測(cè)試樣本隸屬于第i類的典型值;

      (5)計(jì)算第r次迭代時(shí)的第i類的類中心νi,r:

      (6)當(dāng)(||νi,r-νi,r-1||<ε)或者(r>rmax)時(shí),則計(jì)算終止,否則從“(2)計(jì)算第r(r=1,2,…,rmax)次迭代時(shí)的模糊協(xié)方差矩陣sfi,r”重新開始計(jì)算;νi,r為第r次迭代時(shí)的第i類的類中心值,νi,r-1為第r-1次迭代時(shí)的第i類的類中心值;迭代終止后,根據(jù)模糊隸屬度值和類中心值確定茶葉品種。

      本發(fā)明的有益效果:

      1、與npfcm聚類算法相比較,本發(fā)明的一種模糊協(xié)方差矩陣的可能模糊聚類算法采用了局部自適應(yīng)距離測(cè)度,解決了npfcm使用歐式距離在處理不規(guī)則分布形狀的數(shù)據(jù)集時(shí)出現(xiàn)錯(cuò)誤聚類問(wèn)題,提高了了對(duì)茶葉數(shù)據(jù)聚類的準(zhǔn)確率。

      2、本發(fā)明檢測(cè)速度快,鑒別準(zhǔn)確率高,綠色無(wú)污染,所需茶葉樣本少,可快速實(shí)現(xiàn)茶葉品種的鑒別

      附圖說(shuō)明

      圖1是本發(fā)明的流程圖;

      圖2是茶葉的紅外光譜圖;

      其中:(a)為正品竹葉青;(b)為劣質(zhì)竹葉青;(c)為峨眉山毛峰;

      圖3是msc處理后的茶葉紅外光譜圖;

      圖4是茶葉的紅外光譜經(jīng)lda提取鑒別信息后得到的測(cè)試樣本數(shù)據(jù)圖;

      圖5是一種模糊協(xié)方差矩陣的可能模糊聚類方法產(chǎn)生的模糊隸屬度。

      具體實(shí)施方式

      下面結(jié)合附圖及實(shí)施例對(duì)本發(fā)明作進(jìn)一步說(shuō)明。

      如圖1所示,本發(fā)明方法包括如下步驟:

      步驟一、茶葉樣本紅外光譜采集:收集多個(gè)品種的茶葉樣本,用紅外光譜儀獲取茶葉樣本紅外漫反射光譜信息,將光譜信息存儲(chǔ)在計(jì)算機(jī)里。實(shí)驗(yàn)過(guò)程中保持室內(nèi)的溫度和濕度基本一致;紅外漫反射光譜信息的光譜波數(shù)范圍為4001.569cm-1~401.1211cm-1,采集到每個(gè)茶葉樣本的光譜是1868維的數(shù)據(jù)。將茶葉樣本分為訓(xùn)練樣本和測(cè)試樣本。設(shè)置類別數(shù)c(c=3),訓(xùn)練樣本數(shù)為nr和測(cè)試樣本數(shù)為n。

      步驟二、對(duì)茶葉樣本紅外光譜預(yù)處理:用多元散射校正(msc)對(duì)茶葉樣本紅外光譜進(jìn)行預(yù)處理。

      步驟三、對(duì)茶葉樣本紅外光譜進(jìn)行降維處理:利用主成分分析(pca)將步驟二中獲得的茶葉樣本紅外光譜數(shù)據(jù)進(jìn)行壓縮。

      步驟四、將上述步驟三中獲得的茶葉樣本紅外光譜壓縮數(shù)據(jù)用線性判別分析(lda)提取鑒別信息后得到包含鑒別信息的訓(xùn)練樣本和測(cè)試樣本數(shù)據(jù)。

      步驟五、對(duì)步驟四中包含鑒別信息的測(cè)試樣本用一種模糊協(xié)方差矩陣的可能模糊聚類方法以鑒別測(cè)試樣本中的茶葉品種。具體過(guò)程如下:

      (1)初始化:設(shè)置權(quán)重指數(shù)m和p的值,且滿足m∈(1,+∞)、p∈(1,+∞);d為測(cè)試樣本的維數(shù);設(shè)置迭代次數(shù)初始值r=0和最大迭代次數(shù)為rmax;設(shè)置迭代最大誤差參數(shù)為ε。對(duì)測(cè)試樣本運(yùn)行模糊c均值聚類(fcm),fcm運(yùn)行終止后的模糊隸屬度和類中心分別作為一種模糊協(xié)方差矩陣的可能模糊聚類方法的初始模糊隸屬度和初始聚類中心;

      (2)計(jì)算第r(r=1,2,…,rmax)次迭代時(shí)的模糊協(xié)方差矩陣sfi,r:

      上式中,xk為第k個(gè)茶葉紅外光譜測(cè)試樣本,vi,r-1為第r-1次迭代時(shí)第i類的類中心(i=1,2,3),uik,r-1為第r-1次迭代時(shí)樣本xk屬于第i類的模糊隸屬度,sfi,r是第r次迭代時(shí)第i類的模糊協(xié)方差矩陣。

      (3)計(jì)算第r次迭代時(shí)的模糊隸屬度值uik,r:

      上式中為第r-1次迭代時(shí)樣本xk到類中心vi,r-1的距離,為第r-1次迭代時(shí)樣本xk到類中心vj,r-1的距離范數(shù)(j=1,2,3)。

      上式中,ai,r是第r次迭代時(shí)的第i個(gè)聚類中心的范數(shù)矩陣;aj,r第r次迭代時(shí)的第j個(gè)聚類中心的范數(shù)矩陣;d為測(cè)試樣本的維數(shù);vj,r-1為第r-1次迭代時(shí)第j類的類中心(j=1,2,3)。

      (4)計(jì)算第r次迭代時(shí)的典型值tik,r:

      tik,r為第r次迭代時(shí)第k個(gè)測(cè)試樣本隸屬于第i類的典型值。

      (5)計(jì)算第r次迭代時(shí)的第i類的類中心νi,r:

      (6)當(dāng)(||νi,r-νi,r-1||<ε)或者(r>rmax)時(shí),則計(jì)算終止,否則從“(2)計(jì)算第r(r=1,2,…,rmax)次迭代時(shí)的模糊協(xié)方差矩陣sfi,r”重新開始計(jì)算。νi,r為第r次迭代時(shí)的第i類的類中心值,νi,r-1為第r-1次迭代時(shí)的第i類的類中心值。迭代終止后,根據(jù)模糊隸屬度值和類中心值確定茶葉品種。

      下面結(jié)合實(shí)例和附圖對(duì)本發(fā)明進(jìn)一步詳細(xì)說(shuō)明。

      本發(fā)明的一種模糊協(xié)方差矩陣的可能模糊聚類的紅外光譜茶葉品種鑒別方法適用于對(duì)茶葉品種的鑒別。例如:毛尖、竹葉青、龍井、鐵觀音等茶葉品種的鑒別。因?yàn)椴煌贩N茶葉,其內(nèi)部組分不同,因此漫射紅外光譜也有所不同,為實(shí)現(xiàn)茶葉品種的鑒別提供了條件。本發(fā)明的實(shí)施流程圖如圖1所示。為方便敘述,選取峨眉山茶葉、樂(lè)山市優(yōu)質(zhì)竹葉青和劣質(zhì)竹葉青為實(shí)驗(yàn)對(duì)象。

      實(shí)施例

      步驟一、茶葉樣本紅外光譜采集:將ftir-7600型傅里葉紅外光譜分析儀開機(jī)預(yù)熱1個(gè)小時(shí)。掃描次數(shù)為32,光譜掃描的波數(shù)4001.569cm-1~401.1211cm-1,掃描間隔為1.928cm-1,分辨率為4cm-1。三種茶葉樣本,峨眉山茶葉、樂(lè)山市優(yōu)質(zhì)竹葉青和劣質(zhì)竹葉青。茶葉經(jīng)研磨粉碎,再用40目篩進(jìn)行過(guò)濾后,各取0.5g分別與溴化鉀1:100均勻混合。每個(gè)樣本取混合物1g進(jìn)行壓膜,然后用光譜儀掃描3次,取3次的平均值作為樣本光譜數(shù)據(jù)。采集環(huán)境溫度為25℃左右,相對(duì)濕度為50%左右,電壓為220v。每種茶葉采集32個(gè)樣本,共獲得96個(gè)樣本。每個(gè)樣本為一個(gè)1868維的數(shù)據(jù)。每各品種的茶葉樣本選取22個(gè)為測(cè)試集,則測(cè)試樣本數(shù)n為66。剩余10個(gè)樣本為訓(xùn)練集,則訓(xùn)練樣本數(shù)nr為30。測(cè)試集為待鑒別的茶葉樣本,訓(xùn)練集為已知品種的茶葉樣本。設(shè)置類別數(shù)c=3。茶葉樣本的紅外光譜如圖2所示。

      步驟二、對(duì)茶葉樣本紅外光譜預(yù)處理:用多元散射校正(msc)對(duì)茶葉樣本紅外光譜進(jìn)行預(yù)處理。預(yù)處理后的茶葉紅外光譜圖如圖3所示。

      步驟三、茶葉樣本紅外光譜的降維處理:利用主成分分析(pca)將在步驟二中獲得的茶葉樣本紅外光譜數(shù)據(jù)壓縮。因?yàn)榍?4個(gè)主成分累計(jì)可信度大于98%,所以采用主成分分析方法(pca)將茶葉樣本紅外光譜進(jìn)行特征分解得到前14個(gè)特征向量和14個(gè)特征值。每個(gè)特征向量都是1868維的數(shù)據(jù),特征值具體如下

      λ1=293.91;λ2=129.02;λ3=19.00;λ4=14.88;λ5=6.43;

      λ6=3.82;λ7=2.00;λ8=1.43;λ9=1.07;λ10=0.63;

      λ11=0.40;λ12=0.32;λ13=0.27;λ14=0.23;

      將茶葉樣本紅外光譜投影到14個(gè)特征向量上得到14維的數(shù)據(jù),即從1868維壓縮到14維。

      步驟四、將上述步驟三中獲得的茶葉樣本紅外光譜壓縮數(shù)據(jù)用線性判別分析(lda)提取鑒別信息后得到包含鑒別信息的訓(xùn)練樣本和測(cè)試樣本數(shù)據(jù)。

      鑒別向量數(shù)為2,采用線性判別分析(lda)提取步驟三中14維數(shù)據(jù)的鑒別信息后得到包含鑒別信息的訓(xùn)練樣本和測(cè)試樣本數(shù)據(jù),其中測(cè)試樣本數(shù)據(jù)如圖4所示。

      步驟五、對(duì)步驟四中包含鑒別信息的測(cè)試樣本采用一種模糊協(xié)方差矩陣的可能模糊聚類方法以鑒別測(cè)試樣本中的茶葉品種。具體如下:

      (1)初始化:設(shè)置權(quán)重指數(shù)m和p的值,且滿足m∈(1,+∞)、p∈(1,+∞);d為測(cè)試樣本的維數(shù);設(shè)置迭代次數(shù)初始值r=0和最大迭代次數(shù)為rmax;設(shè)置迭代最大誤差參數(shù)ε;對(duì)測(cè)試樣本運(yùn)行模糊c均值聚類(fcm),fcm運(yùn)行終止后的模糊隸屬度和類中心分別作為一種模糊協(xié)方差矩陣的可能模糊聚類方法的初始模糊隸屬度和初始聚類中心;

      初始化的數(shù)值設(shè)置:由步驟一可知:類別數(shù)c=3(即三個(gè)類別),測(cè)試樣本數(shù)n=66。設(shè)置權(quán)重指數(shù)m=2,p=2,迭代次數(shù)初始值r=0和最大迭代數(shù)rmax=100,誤差上限值ε=0.00001,測(cè)試樣本的維數(shù)d為2。對(duì)步驟四的兩組一維測(cè)試數(shù)據(jù)進(jìn)行模糊c均值聚類(fcm),fcm運(yùn)行終止后的聚類中心作為一種模糊協(xié)方差矩陣的可能模糊聚類方法初始聚類中心,則一種模糊協(xié)方差矩陣的可能模糊聚類方法的初始聚類中心為:v1,0=(-0.1580,0.0403),v2,0=(-0.0020,0.0049),v3.0=(0.1194,-0.0056);

      (2)計(jì)算第r(r=1,2,…,rmax)次迭代時(shí)的模糊協(xié)方差矩陣sfi,r:

      上式中,xk為第k個(gè)茶葉紅外光譜測(cè)試樣本,vi,r-1為第r-1次迭代時(shí)第i類的類中心(i=1,2,3),uik,r-1為第r-1次迭代時(shí)樣本xk屬于第i類的模糊隸屬度,sfi,r是第r次迭代時(shí)第i類的模糊協(xié)方差矩陣。

      (3)計(jì)算第r次迭代時(shí)的模糊隸屬度值uik,r:

      上式中為第r-1次迭代時(shí)樣本xk到類中心vi,r-1的距離,為第r-1次迭代時(shí)樣本xk到類中心vj,r-1的距離范數(shù)(j=1,2,3),vj,r-1為第r-1次迭代時(shí)第j類的類中心(j=1,2,3)。

      上式中,ai,r是第r次迭代時(shí)的第i個(gè)聚類中心的范數(shù)矩陣;d為測(cè)試樣本的維數(shù)。

      (4)計(jì)算第r次迭代時(shí)的典型值tik,r:

      tik,r為第r次迭代時(shí)第k個(gè)測(cè)試樣本隸屬于第i類的典型值。

      (5)計(jì)算第r次迭代時(shí)的第i類的類中心νi,r:

      (6)當(dāng)(||νi,r-νi,r-1||<ε)或者(r>rmax)時(shí),則計(jì)算終止,否則從“(2)計(jì)算第r(r=1,2,…,rmax)次迭代時(shí)的模糊協(xié)方差矩陣sfi,r”重新開始計(jì)算。νi,r為第r次迭代時(shí)的第i類的類中心值,νi,r-1為第r-1次迭代時(shí)的第i類的類中心值。

      實(shí)驗(yàn)結(jié)果:迭代終止時(shí)r=64,vi,64為:v1,64=(-0.1645,0.0302);v2,64=(0.0031,0.0051);v3,64=(0.1245,0.0032);迭代終止時(shí)模糊隸屬度uik,64如圖5所示。根據(jù)模糊隸屬度可得測(cè)試樣本的鑒別準(zhǔn)確率達(dá)94%。

      上文所列出的一系列的詳細(xì)說(shuō)明僅僅是針對(duì)本發(fā)明的可行性實(shí)施方式的具體說(shuō)明,它們并非用以限制本發(fā)明的保護(hù)范圍,凡未脫離本發(fā)明技藝精神所作的等效實(shí)施方式或變更均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。

      當(dāng)前第1頁(yè)1 2 
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1