本發(fā)明涉及光譜分析
技術(shù)領(lǐng)域:
,更具體地,涉及一種鑒別煤炭種類的方法及裝置。
背景技術(shù):
:在我國,煤炭儲備極為豐富,并且煤炭種類繁多,從低變質(zhì)程度的褐煤到高變質(zhì)程度的無煙煤都有儲存。而不同種類的煤炭在工業(yè)生產(chǎn)和生活中具有不同的用途,因此煤炭生產(chǎn)中需要對煤炭種類進行鑒別,然后根據(jù)需要進行不同的生產(chǎn)處理。目前,存在許多煤炭種類的快速分析方法,但它們均只能完成煤樣的單項檢測。進行煤炭種類的鑒別,需要綜合多項檢測進行綜合分析,鑒別過程復雜且檢驗費用昂貴。近年來,國內(nèi)外專家利用近紅外光譜技術(shù)無損、分析快速的優(yōu)勢,建立分析模型得到高精度的煤質(zhì)分析結(jié)果,且可對煤炭進行種類鑒別。然而上述方法仍需對煤炭樣本尤其是塊煤進行破碎、混合、篩分等一系列繁瑣的制樣過程,鑒別過程繁瑣復雜且費用較高,且譜段范圍局限在近紅外譜段。因此急需一種簡單、快速進行煤炭種類鑒別且費用低廉的方法。技術(shù)實現(xiàn)要素:本發(fā)明提供一種克服上述問題或者至少部分地解決上述問題的鑒別煤炭種類的方法及裝置。根據(jù)本發(fā)明的一個方面,提供一種鑒別煤炭種類的方法,包括:s1,獲取待測煤炭的可見近紅外高光譜數(shù)據(jù);s2,基于所述可見近紅外高光譜數(shù)據(jù),利用煤炭種類分類模型獲取所述待測煤炭的種類信息。進一步,所述s2進一步包括:s2.1,構(gòu)建多層感知器結(jié)構(gòu),基于不同種類的煤炭的可見近紅外高光譜數(shù)據(jù),對所述多層感知器結(jié)構(gòu)進行訓練,獲得煤炭種類分類模型;s2.2,將所述待測煤炭的可見近紅外高光譜數(shù)據(jù)輸入所述煤炭種類分類模型,獲取所述待測煤炭的種類信息。進一步,所述s2.1進一步包括:s2.1.1,構(gòu)建由輸入層、隱藏層和softmax分類器構(gòu)成的多層感知器結(jié)構(gòu);s2.1.2,基于不同種類的煤炭的可見近紅外高光譜數(shù)據(jù),定義不同種類的分類標簽,獲取帶標簽的訓練樣本;s2.1.3,將所述帶標簽的訓練樣本去除標簽信息后輸入所述多層感知器結(jié)構(gòu),利用稀疏自編碼網(wǎng)絡(luò)對所述多層感知器結(jié)構(gòu)進行預訓練,以對所述多層感知器結(jié)構(gòu)進行初始化;s2.1.4,利用所述帶標簽的訓練樣本,對初始化后的多層感知器結(jié)構(gòu)進行參數(shù)微調(diào)與優(yōu)化,獲得煤炭種類分類模型。根據(jù)本發(fā)明的另一個方面,還提供一種鑒別煤炭種類的裝置,包括獲取模塊和鑒別模塊;所述獲取模塊,用于獲取待測煤炭的可見近紅外高光譜數(shù)據(jù);所述鑒別模塊,用于基于所述可見近紅外高光譜數(shù)據(jù),利用煤炭種類分類模型獲取所述待測煤炭的種類信息。本申請?zhí)岢鲆环N鑒別煤炭種類的方法及裝置,通過采集不同種類的煤炭的光譜數(shù)據(jù),并對所述光譜數(shù)據(jù)進行過濾以剔除異常數(shù)據(jù)獲得樣本,對樣本進行光譜處理及噪聲處理;利用處理后的樣本數(shù)據(jù)對多層感知器結(jié)構(gòu)進行訓練與優(yōu)化獲得煤炭種類分類模型,利用所述模型可以快速的根據(jù)采集的煤炭光譜數(shù)據(jù)鑒別煤炭種類。本申請可以直接對塊狀煤炭樣本進行種類鑒別,無需進行破碎、混合和篩分等處理,簡單快速且費用低;采用可見近紅外譜段,增加樣本的光譜信息量;并采用多層感知器分類模型,提高分類精度,真正意義上實現(xiàn)煤炭樣品的無損種類鑒別,填補現(xiàn)有技術(shù)中可見近紅外光譜分析煤炭種類的空白,解決了現(xiàn)有技術(shù)中近紅外光譜分析技術(shù)的復雜的前期制樣過程,以及鑒別譜段范圍限制、信息量少的問題。附圖說明圖1為本發(fā)明一種鑒別煤炭種類的方法流程圖;圖2為本發(fā)明實施例煤炭種類分類模型示意圖;圖3為本發(fā)明實施例不同種類的煤炭的可見近紅外高光譜數(shù)據(jù)進行預處理后的光譜曲線示意圖。具體實施方式下面結(jié)合附圖和實施例,對本發(fā)明的具體實施方式作進一步詳細描述。以下實施例用于說明本發(fā)明,但不用來限制本發(fā)明的范圍。如圖1所示,一種鑒別煤炭種類的方法,包括:s1,獲取待測煤炭的可見近紅外高光譜數(shù)據(jù);s2,基于所述可見近紅外高光譜數(shù)據(jù),利用煤炭種類分類模型獲取所述待測煤炭的種類信息。本發(fā)明為解決現(xiàn)有技術(shù)的不足,提供一種利用煤炭的可見近紅外高光譜數(shù)據(jù),通過煤炭種類分類模型,簡單快速的獲取煤炭種類的方法。相比于現(xiàn)有技術(shù),本發(fā)明只需要簡單的獲取煤炭的可見近紅外高光譜數(shù)據(jù),將所述可見近紅外高光譜數(shù)據(jù)輸入預先建立好的煤炭種類分類模型即可對煤炭種類進行鑒別,無需對待測煤炭進行破碎、混合和篩分等處理,極大的簡化了鑒別處理過程。作為一個可選的實施例,所述s2進一步包括:s2.1,構(gòu)建多層感知器結(jié)構(gòu),基于不同種類的煤炭的可見近紅外高光譜數(shù)據(jù),對所述多層感知器結(jié)構(gòu)進行訓練,獲得煤炭種類分類模型;s2.2,將所述待測煤炭的可見近紅外高光譜數(shù)據(jù)輸入所述煤炭種類分類模型,獲取所述待測煤炭的種類信息。本實施例中,通過構(gòu)建多層感知器結(jié)構(gòu),利用采集的不同種類的煤炭的可見近紅外高光譜數(shù)據(jù)對所述多層感知器結(jié)構(gòu)進行訓練,從而獲得煤炭種類分類模型。所述煤炭種類分類模型可以實現(xiàn)對輸入的待測煤炭的可見近紅外高光譜數(shù)據(jù)快速的鑒別,輸出待測煤炭的種類的相關(guān)信息。作為一個可選的實施例,所述s2.1進一步包括:s2.1.1,構(gòu)建由輸入層、隱藏層和softmax分類器構(gòu)成的多層感知器結(jié)構(gòu);s2.1.2,基于不同種類的煤炭的可見近紅外高光譜數(shù)據(jù),定義不同種類的分類標簽,獲取帶標簽的訓練樣本;s2.1.3,將所述帶標簽的訓練樣本去除標簽信息后輸入所述多層感知器結(jié)構(gòu),利用稀疏自編碼網(wǎng)絡(luò)對所述多層感知器結(jié)構(gòu)進行預訓練,以對所述多層感知器結(jié)構(gòu)進行初始化;s2.1.4,利用所述帶標簽的訓練樣本,對初始化后的多層感知器結(jié)構(gòu)進行參數(shù)微調(diào)與優(yōu)化,獲得煤炭種類分類模型。如圖2所示,本實施例中,多層感知器結(jié)構(gòu)主要包括三個分層,即輸入層、隱藏層和輸出層。其中,輸入層用于接收訓練樣本模型進行訓練。選擇合適的隱藏層的層數(shù)和各個隱藏層神經(jīng)元的個數(shù)用于對煤炭的可見近紅外高光譜數(shù)據(jù)進行訓練建模,獲得具有高精度且高效的煤炭種類分類模型。本實施例中隱藏層為2層結(jié)構(gòu),包括隱層1和隱層2,各隱層的神經(jīng)元即隱藏節(jié)點可根據(jù)具體的應用及精度要求而定。本實施例中輸出層為softmax分類器,用于輸出對煤炭種類的最終鑒別結(jié)果。本實施例中,對多層感知器結(jié)構(gòu)的訓練包括兩部分,即s2.1.3的初始化訓練和s2.1.4的優(yōu)化訓練。這兩種訓練對樣本的要求不同,初始化訓練即預訓練時使用不帶標簽的訓練樣本,那么需要將得到的帶標簽的訓練樣本中的標簽信息去除;而優(yōu)化調(diào)整時直接使用帶標簽的訓練樣本。因而在開始訓練之前需要對不同種類的煤炭的可見近紅外高光譜數(shù)據(jù)進行分類,分類的前提是需要定義不同種類的分類標簽,利用不同種類的分類標簽對所采集的可見近紅外高光譜數(shù)據(jù)分類,成為帶標簽的訓練樣本。本實施例中所述分類標簽,是指用數(shù)字來代表不同的煤炭產(chǎn)地名稱,這樣模型可以方便的對煤炭種類進行分類輸出。每個分類標簽用一個數(shù)字代表煤炭的產(chǎn)地名稱,不同的煤炭產(chǎn)地對應不同的數(shù)字。作為一個可選的實施例,所述s2.1.3進一步包括:s2.1.3.1,在稀疏自編碼網(wǎng)絡(luò)中利用下式進行編碼,即在隱藏層為一層時的編碼過程如下:h(x)=f(w1x+b1),其中,h(x)為隱藏節(jié)點的激活值,f為非線性激活函數(shù),w1為輸入層到隱藏層的權(quán)值矩陣,b1為偏置值。第二隱藏層的編碼過程同第一隱藏層。s2.1.3.2,利用下式對所述隱藏節(jié)點的激活值進行解碼:其中,為輸出向量,f為非線性激活函數(shù),h為隱藏層節(jié)點的激活值,w2為隱藏層鏈接輸出層的權(quán)重矩陣,b2為偏置值;s2.1.3.3,利用下式依次計算隱藏神經(jīng)元j的平均活躍度:其中,j表示第j個隱藏神經(jīng)元,m為輸入的特征維度,表示隱藏神經(jīng)元j的激活度,x(i)為第i個特征。ρ表示激活值稀疏性參數(shù),使ρ接近0,近似的作為隱藏節(jié)點j的激活值稀疏性的限制條件。s2.1.3.4,利用懲罰因子對所述隱藏節(jié)點的激活值稀疏性進行限制,所述懲罰因子為滿足下式:總體代價函數(shù)為:其中,jsparse(w,b)為總體代價函數(shù),j(w,b)為自編碼網(wǎng)絡(luò)的代價函數(shù),w為權(quán)重,b為偏置值,ρ為激活值稀疏性參數(shù),ρj為平均活躍度,β為決定稀疏性懲罰因子的權(quán)重。利用懲罰因子使得不符合期望的情況被懲罰,進而隱藏神經(jīng)元的活躍度處于較合適的范圍。本實施例所述s2.1.3利用不帶標簽的訓練樣本進行多層感知器結(jié)構(gòu)進行初始化,得到初始參數(shù)即權(quán)重w和偏置值b,為下一步的參數(shù)微調(diào)和優(yōu)化做準備。作為一個可選的實施例,所述s2.1.4進一步包括:選擇模型優(yōu)化器和隱藏層激活函數(shù),設(shè)置學習率(lr)、批處理參數(shù)(batch_size)、迭代次數(shù)(epoch_number)、稀疏性參數(shù)和防止過擬合參數(shù)(dropout)等,利用所述帶標簽的訓練樣本對初始化后的多層感知器結(jié)構(gòu)進行優(yōu)化,獲得最優(yōu)分類模型為所述煤炭種類分類模型;所述最優(yōu)分類模型目標函數(shù)為:其中,-∑xp(x)log(q(x))為交叉熵損失,p(x)是真實標簽的概率,q(x)為模型預測的概率值;為正則項,β為正則項權(quán)重,m為隱藏層的層數(shù)。如前所述,ρ表示激活值稀疏性參數(shù);且使其接近0,近似的ρj=ρ作為隱藏節(jié)點j即隱藏神經(jīng)元j的激活值稀疏性的限制條件。為限制隱藏層單元的激活值稀疏性,額外添加一懲罰因子使得不符合期望的情況被懲罰,進而隱藏神經(jīng)元的活躍度處于較合適的范圍。作為一個可選的實施例,所述s2.1.2進一步包括:s2.1.2.1,剔除所述不同種類的煤炭的可見近紅外高光譜數(shù)據(jù)中的異常數(shù)據(jù),獲取高光譜數(shù)據(jù)樣本;s2.1.2.2,對所述高光譜數(shù)據(jù)樣本的噪聲過大譜段進行截斷去除處理;s2.1.2.3,利用小波閾值去噪法對截斷處理后的高光譜數(shù)據(jù)樣本進行光譜噪聲去除處理。本實施例中煤炭的可見近紅外高光譜數(shù)據(jù)并不是分類后直接用來對模型進行訓練,而是需要經(jīng)過預處理,包括剔除異常數(shù)據(jù)、去除樣本數(shù)據(jù)中噪聲過大譜段和去除光譜噪聲處理。具體的,s2.1.2.2中所述噪聲過大譜段包括:所述高光譜數(shù)據(jù)樣本的光譜的首尾部分,譜長分別為350-500nm和2350-2500nm;以及傳感器銜接處譜長為900-1000nm和1800nm-1950nm的光譜。以上所述350-500nm、2350-2500nm、900-1000nm和1800nm-1950nm位置的光譜噪聲較大,為保證模型精度,需要從各個高光譜數(shù)據(jù)樣本進行去除處理,未去除的光譜段保留在所述高光譜數(shù)據(jù)樣本中。具體的,s2.1.2.3中所述光譜噪聲去除處理包括:首先,選取母小波,確定分解層數(shù)為4層,并對所述高光譜數(shù)據(jù)樣本進行小波分解,得到一系列小波系數(shù);其次,利用下式獲取軟閾值,對所述一系列小波系數(shù)進行閾值處理:其中,h'為處理后的小波變換系數(shù),h為處理前的小波變換系數(shù),其中σ為噪聲的標準差,是對噪聲水平的估計值,n為信號長度。最后,對閾值處理后的小波系數(shù)進行小波逆變換,重構(gòu)高光譜數(shù)據(jù)樣本。本實施例中閾值估計方法為啟發(fā)式閾值選擇法;選取合適的閾值,對小波分解得到的小波系數(shù)進行閾值處理;對最后得到的小波系數(shù)進行小波逆變換,重構(gòu)出原信號。作為一個可選的實施例,所述可見近紅外高光譜數(shù)據(jù)通過地物波譜儀對煤炭進行光譜采集而獲得;所述地物波譜儀的光譜覆蓋范圍為350-2500nm,光譜采樣帶寬為1.5nm,光譜分辨率為3.5nm。本發(fā)明還提供一種鑒別煤炭種類的裝置,包括獲取模塊和鑒別模塊;所述獲取模塊,用于獲取待測煤炭的可見近紅外高光譜數(shù)據(jù);所述鑒別模塊,用于基于所述可見近紅外高光譜數(shù)據(jù),利用煤炭種類分類模型獲取所述待測煤炭的種類信息。在一個具體的建立煤炭種類分類模型的實施例中,包括以下幾個步驟:s101、獲取煤炭樣本光譜數(shù)據(jù)。通過psr-3500地物波譜儀對不同種類的煤炭進行光譜采集。利用psr-3500地物波譜儀獲取三種不同種類的煤炭光譜數(shù)據(jù),三種煤炭分別來自于云南鎮(zhèn)雄、貴州六盤水和福建龍巖。圖3為三種煤炭的三條典型光譜曲線,且圖中橫軸表示波長(單位為:nm)、縱軸表示反射率(單位為:%)。s102、進行光譜數(shù)據(jù)的預處理,選取訓練樣本和測試樣本。對采集的光譜數(shù)據(jù)進行異常數(shù)據(jù)的剔除,將剔除異常后的的光譜數(shù)據(jù)樣本進行噪聲過大譜段的截斷處理。其中噪聲過大的譜段為光譜的首尾部分350-500nm,2350-2500nm和傳感器銜接處900-1000nm,1800nm-1950nm部分,剩余波段數(shù)據(jù)量為682。噪聲光譜截斷處理后,進行光譜噪聲的去除處理。采用小波閾值去噪方法對光譜進行噪聲去除。首先選取母小波,確定分解層數(shù)為4層,并對含噪信號進行小波分解,得到一系列小波系數(shù);閾值處理方法選為軟閾值法。閾值估計方法選為啟發(fā)式閾值選擇法。根據(jù)合適的閾值,對小波系數(shù)進行閾值處理;對最后得到的小波系數(shù)進行小波逆變換,重構(gòu)原信號。定義不同種類的分類標簽,按照訓練樣本和測試樣本比例為3:7進行訓練樣本和測試樣本數(shù)目的選取。數(shù)據(jù)集如下表所示:類別福建龍巖貴州六盤水云南鎮(zhèn)雄數(shù)量307227274分類標簽123訓練集測試集總計242566808s103構(gòu)建如圖2所示的多層感知器結(jié)構(gòu),所述多層感知器結(jié)構(gòu)由輸入層、隱藏層(兩層)和softmax分類器構(gòu)成。輸入的樣本光譜數(shù)據(jù)共682維。將樣本數(shù)據(jù)輸入稀疏自編碼網(wǎng)絡(luò)進行預訓練,此過程不需要標簽。其網(wǎng)絡(luò)結(jié)構(gòu)分別為682-64-682和64-32-64。稀疏自編碼網(wǎng)絡(luò)的訓練過程如所述s2.1.3實施例;對所述多層感知器結(jié)構(gòu)初始化后,進行參數(shù)微調(diào)和優(yōu)化。本實施例中模型優(yōu)化器使用“adam”,學習率為lr=0.001,隱藏層使用激活函數(shù)為relu,輸出層使用softmax進行多分類。其他參數(shù):batch_size=64(batchsize),epoch_number=2000(迭代次數(shù)),稀疏參數(shù)=10e-5(0.00005),dropout參數(shù)=0.2(防止過擬合)。基于上述參數(shù),使用測試樣本對模型進行優(yōu)化,即可得到最優(yōu)分類模型,即煤炭種類分類模型。所述煤炭種類分類模型用于本發(fā)明通過對煤炭的可見cvsdew近紅外高光譜數(shù)據(jù)進行鑒別而獲得所述煤炭的種類信息。本發(fā)明提出一種鑒別煤炭種類的方法及裝置,通過采集不同種類的煤炭的光譜數(shù)據(jù),并對所述光譜數(shù)據(jù)進行過濾獲得樣本,對樣本進行光譜處理及噪聲處理;利用處理后的樣本數(shù)據(jù)對多層感知器結(jié)構(gòu)進行訓練與優(yōu)化獲得煤炭種類分類模型,利用所述模型可以快速的根據(jù)采集的煤炭光譜數(shù)據(jù)鑒別煤炭種類。本申請可以直接對塊狀煤炭樣本進行種類鑒別,無需進行破碎、混合和篩分等處理,簡單快速且費用低;采用可見近紅外譜段,增加樣本的光譜信息量;并采用多層感知器分類模型,提高分類精度,真正意義上實現(xiàn)煤炭樣品的無損種類鑒別,解決現(xiàn)有的可見近紅外光譜分析技術(shù)的復雜的前期制樣過程,以及鑒別譜段范圍限制和信息量少的問題。最后,本申請的方法僅為較佳的實施方案,并非用于限定本發(fā)明的保護范圍。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內(nèi)。當前第1頁12