專利名稱:一種烤片煙氣的預測方法
技術(shù)領域:
本發(fā)明涉及一種烤片煙氣的預測方法,特別是基于魯棒回歸建模進行烤片煙氣的預測方法。
背景技術(shù):
烤片的煙氣預測對于卷煙產(chǎn)品的質(zhì)量以及感官有著至關(guān)重要的作用。傳統(tǒng)的烤片煙氣數(shù)據(jù)的獲得方式是檢測烤片燃燒后的煙氣中的化學成分指標。通過這種方式獲得的煙氣數(shù)據(jù),需要將烤片卷制成卷煙燃燒后的煙氣進行化學檢測,檢測過程費時費力且檢測成本極高。因此提出一種通過建立模型由烤片理化數(shù)據(jù)直接獲取煙氣數(shù)據(jù)的方法勢在必行。
發(fā)明內(nèi)容
本發(fā)明提出了一種烤片煙氣的預測系統(tǒng)。預先對已有的烤片理化數(shù)據(jù)和煙氣數(shù)據(jù)建立從理化指標項到煙氣指標項的魯棒回歸模型,對于未知烤片煙氣數(shù)據(jù),可以直接利用魯棒回歸模型對未知烤片煙氣值進行其理化成分數(shù)據(jù)預測。本發(fā)明烤片煙氣的預測方法是預先錄入每個煙氣對應的已有烤片理化數(shù)據(jù)和煙氣數(shù)據(jù),建立從理化指標項到煙氣指標項的魯棒回歸模型,對于未知烤片煙氣數(shù)據(jù),直接采用已建立魯棒回歸模型進行其理化成分數(shù)據(jù)預測,獲得未知烤片煙氣值預測值,指導實際生產(chǎn);預測使用的設備包括數(shù)據(jù)庫服務器(I)和數(shù)據(jù)挖掘客戶端(2),其中數(shù)據(jù)挖掘客戶端(2)包括可視化展示工具(13),可視化展示工具(13)與數(shù)據(jù)展示處理模塊(11)和結(jié)果展示模塊(12)連接;數(shù)據(jù)展示處理模塊(11)與數(shù)據(jù)連接模塊(6)連接,結(jié)果展示模塊(12)與預測處理模塊(10)連接,預測處理模塊(10)分別與模型庫模塊(9)和數(shù)據(jù)連接模塊(6)連接;數(shù)據(jù)連接模塊(6 )則與身份驗證處理模塊(5 )和數(shù)據(jù)庫服務器(I)中的數(shù)據(jù)源(4)連接,同時身份驗證處理模塊(5)與數(shù)據(jù)庫服務器(I)中的權(quán)限數(shù)據(jù)庫(3)連接,身份驗證處理模塊(5)通過用戶名和密碼驗證用戶的合法性;數(shù)據(jù)連接模塊(6)提供各種不同數(shù)據(jù)類型格式數(shù)據(jù)源的連接,建立的魯棒回歸模型可直接使用的數(shù)據(jù)庫,提供數(shù)個數(shù)據(jù)對象訪問的接口。所述可視化展示工具(13)和結(jié)果展示模塊(12)通過點線圖、表格形式直觀展示
處理結(jié)果。預測處理模塊(10)使用模型庫模塊(9)中前期已經(jīng)保存好的模型進行預測煙氣值。所述模型評估模塊(8)利用不同指標項對測試數(shù)據(jù)進行魯棒回歸建模,對模型性能進行評估,根據(jù)評估結(jié)果選擇性能較好的模型保存到模型庫模塊(9)中??酒瑹煔獾念A測方法使用包括以下步驟步驟1:進入系統(tǒng);啟動系統(tǒng),輸入用戶名和密碼,進行用戶身份驗證,用戶名密碼正確,則通過驗證,進入系統(tǒng),用戶名或密碼不正確,則退出系統(tǒng),步驟2 :導入烤片數(shù)據(jù),包含理化數(shù)據(jù)和煙氣數(shù)據(jù);根據(jù)篩選條件從數(shù)據(jù)庫中獲取具體的烤片數(shù)據(jù),要求該烤片數(shù)據(jù)既要包含理化數(shù)據(jù),又要包含煙氣數(shù)據(jù);在步驟3中建立的模型中,理化數(shù)據(jù)作為輸入項,煙氣數(shù)據(jù)作為輸出項,且每一種煙氣對應一個魯棒回歸模型;步驟3 :建立魯棒回歸模型,根據(jù)導入的烤片數(shù)據(jù),由魯棒回歸技術(shù)建立由理化數(shù)據(jù)到煙氣數(shù)據(jù)的模型,其中模型中有且僅有一種煙氣指標,但可包含多種理化指標;模型的最終形式將以數(shù)學表達式的形式給出,其數(shù)學表達式為從各個理化指標項到某一煙氣指標項的線性表達式;同時得到模型評價、訓練結(jié)果、訓練擬合曲線、奇異值信息;模型評價是對模型總體性能的評價,包含訓練集上的相關(guān)系數(shù)、絕對誤差和、平均誤差。相關(guān)系數(shù)為煙氣預測值與樣本訓練集之間的簡單相關(guān)系數(shù);絕對誤差和為煙氣預測值與樣本訓練集的煙氣值之間的絕對誤差的累加和;平均誤差為絕對誤差和除以樣本訓練集的樣本個數(shù);通過模型評價,我們可以對一個模型的性能有更詳盡的把握,有利于我們最終確定每個煙氣對應的魯棒回歸模型;訓練擬合曲線為訓練結(jié)果中煙氣實際值與煙氣預測值的折線圖,通過該曲線,我們可以從圖中較直觀地觀察到模型的預測性能;奇異值為在魯棒建模的過程中樣本權(quán)重為O的樣本數(shù)據(jù),如果采用傳統(tǒng)的線性建模方法,奇異值將會對模型的性能產(chǎn)生較大的負面影響,影響模型效果,這點也正是我們采用魯棒回歸建模的初衷。但是并非在每一次的建模過程中都會存在奇異值;步驟4 :確定每個煙氣對應的模型并保存建立模型后,可查看模型的評估信息,其中包含模型的數(shù)學表達式與導入數(shù)據(jù)的相關(guān)系數(shù)、模型的絕對誤差和、模型的平均誤差。可以從理化指標項的個數(shù)、相關(guān)系數(shù)、絕對誤差和、平均誤差等幾項中,綜合考慮模型的性能,盡量做到理化指標項個數(shù)相對較少、相關(guān)系數(shù)相對較大、絕對誤差和和平均誤差相對較小的模型。同時注意到每個煙氣指標項對應一個魯棒回歸模型,對于常見的焦油、一氧化碳、煙氣煙堿三大煙氣指標項,將有三個對應的模型(一個煙氣指標項可以保存多個魯棒回歸模型,在之后的預測模塊中再進行篩選);保存之后,在步驟6中的預測中再次利用該模型;步驟5 :導入烤片數(shù)據(jù),僅包含理化數(shù)據(jù)從數(shù)據(jù)庫中導入烤片數(shù)據(jù),該數(shù)據(jù)僅僅包含理化數(shù)據(jù),并不包含煙氣數(shù)據(jù)。理化數(shù)據(jù)作為模型數(shù)學表達式的輸入;步驟6 :根據(jù)對應的模型預測每個烤片的煙氣值將導入的理化數(shù)據(jù)作為模型數(shù)學表達式的輸入,經(jīng)過計算得到某一種煙氣指標的具體預測值;當有多種煙氣的魯棒回歸模型時,將會得到多個煙氣的預測值;當導入的理化數(shù)據(jù)中不包含模型數(shù)學表達式的某一指標項時,預測條件未達到,將不會得到該模型對應的煙氣指標預測值。本發(fā)明省去了由傳統(tǒng)化學方式獲取烤片煙氣數(shù)據(jù)的步驟,同時,采用魯棒回歸模型,可以有效地避免因理化數(shù)據(jù)或煙氣數(shù)據(jù)中奇異值樣本導致的弊端,很大程度上保證模型的健壯性,這點正是魯棒回歸建模優(yōu)于普通線性回歸建模的優(yōu)點。實踐證明,本發(fā)明方法/系統(tǒng)能夠有效地預測烤片的煙氣值,能夠?qū)酒恼w質(zhì)量情況起到很好的估計作用。
圖1本發(fā)明的系統(tǒng)結(jié)構(gòu)示意圖;圖2本發(fā)明系統(tǒng)的使用流程圖;其中,1.數(shù)據(jù)庫服務器,2.數(shù)據(jù)挖掘客戶端,3.權(quán)限數(shù)據(jù)庫,4.數(shù)據(jù)源,5.身份驗證處理模塊,6.數(shù)據(jù)連接模塊,7.建模處理模塊,8.模型評估模塊,9.模型庫模塊,10.預測處理模塊,11.數(shù)據(jù)展示處理模塊,12.結(jié)果展示模塊,13.可視化展示工具。
具體實施例方式本發(fā)明基于魯棒回歸建??酒瑹煔獾念A測方法或系統(tǒng)客戶端運行于Windows平臺,服務器采用SQL SERVER數(shù)據(jù)庫系統(tǒng)。本發(fā)明的基于魯棒回歸建模的烤片煙氣預測系統(tǒng)主要包括兩大內(nèi)容內(nèi)容一由已知烤片煙氣的數(shù)據(jù)進行建模;內(nèi)容二 用魯棒回歸模型對未知烤片煙氣值進行預測;首先,本發(fā)明構(gòu)造了一個基于C/S模式的建模系統(tǒng),它主要包括數(shù)據(jù)庫服務器和模型客戶端。客戶端提供一個用戶界面交互窗口,接受用戶的輸入信息、提供建模過程的交互界面和展示模型預測結(jié)果,其特征在于包含以下幾個模塊,其系統(tǒng)結(jié)構(gòu)圖見附圖1 :該系統(tǒng)包括數(shù)據(jù)庫服務器I和數(shù)據(jù)挖掘客戶端2,數(shù)據(jù)服務器I提供模型處理的數(shù)據(jù)源4及用戶的權(quán)限數(shù)據(jù)庫3。數(shù)據(jù)源4為模型的處理及評估提供數(shù)據(jù)支持,權(quán)限數(shù)據(jù)庫3中保存了用戶的角色、用戶名、用戶組名及密碼,在一定程度上保證了數(shù)據(jù)庫的安全性。數(shù)據(jù)挖掘客戶端2提供一個用戶界面交互窗口,接受用戶的輸入信息、提供建模過程的交互界面和展示模型預測結(jié)果,其中數(shù)據(jù)挖掘客戶端2具體包含身份驗證處理模塊5、數(shù)據(jù)連接模塊6、數(shù)據(jù)展示處理模塊11、建模處理模塊7、預測處理模塊10、結(jié)果展示模塊12等功能模塊。身份驗證處理模塊5提供系統(tǒng)中的角色、用戶、用戶組的定義及各自權(quán)限的管理,保證了數(shù)據(jù)庫的安全訪問。角色管理,用于定義系統(tǒng)的角色和相應的角色權(quán)限。用戶管理,用于定義系統(tǒng)的用戶及相應的用戶權(quán)限。用戶組管理,用于定義系統(tǒng)的用戶組及相應的權(quán)限。數(shù)據(jù)連接模塊6 :提供各種不同數(shù)據(jù)類型格式數(shù)據(jù)源的連接,生成建??梢灾苯邮褂玫臄?shù)據(jù)庫,提供數(shù)據(jù)對象訪問的接口。數(shù)據(jù)展示處理模塊11 :運用統(tǒng)計學知識,將要處理數(shù)據(jù)的特性以直觀的形勢展示給用戶,使用戶對該部分數(shù)據(jù)有初步整體的認識和把握。建模處理模塊7 :本系統(tǒng)提供基于魯棒回歸的建模方法,對數(shù)據(jù)源提供的數(shù)據(jù)進行模型的建立。預測處理模塊10 :利用魯棒回歸建立的模型對測試數(shù)據(jù)進行預測。結(jié)果展示模塊12 :提供直觀的、圖形化的展示工具對挖掘的結(jié)果進行展示??酒瑹煔忸A測的應用系統(tǒng)的使用步驟如下,其使用流程圖見附圖2 Stepl :進入系統(tǒng);
Step2 :導入烤片數(shù)據(jù),包含理化數(shù)據(jù)和煙氣數(shù)據(jù)St印3 :建立魯棒回歸模型Step4 :確定每個煙氣對應的模型并保存Step5 :導入烤片數(shù)據(jù),僅包含理化數(shù)據(jù)Step6 :根據(jù)對應的模型預測每個烤片的煙氣值結(jié)合附圖2——系統(tǒng)流程圖,附圖1——系統(tǒng)結(jié)構(gòu)圖和下列應用實例,說明其具體實施操作過程如下Stepl :進入系統(tǒng)啟動系統(tǒng),輸入用戶名和密碼,進行用戶身份驗證。用戶名密碼正確,則通過驗證,進入系統(tǒng)。用戶名或密碼不正確,則退出系統(tǒng)。該步與系統(tǒng)結(jié)構(gòu)圖(附圖1)中的權(quán)限數(shù)據(jù)庫3和身份驗證處理5兩個模塊相對應。Step2 :導入烤片數(shù)據(jù),包含理化數(shù)據(jù)和煙氣數(shù)據(jù)根據(jù)篩選條件從數(shù)據(jù)庫中獲取具體的烤片數(shù)據(jù),要求該烤片數(shù)據(jù)既要包含理化數(shù)據(jù),又要包含煙氣數(shù)據(jù)。在Step3中建立的模型中,理化數(shù)據(jù)作為輸入項,煙氣數(shù)據(jù)作為輸出項,且每一種煙氣對應一個魯棒回歸模型。其中理化指標項包含總煙堿、總糖、還原糖、鉀、氯等;煙氣指標項包含焦油、一氧化碳、煙氣煙堿等指標項。St印3 :建立魯棒回歸模型根據(jù)導入的烤片數(shù)據(jù),由魯棒回歸技術(shù)建立由理化數(shù)據(jù)到煙氣數(shù)據(jù)的模型,其中模型中有且僅有一種煙氣指標,但可以包含多種理化指標。模型的最終形式將以數(shù)學表達式的形式給出。首先將導入的數(shù)據(jù)添加到建模界面,然后在煙氣指標下拉框中選定煙氣指標項,此處我們選擇焦油;在理化指標復選框中選定總糖、總煙堿、還原糖、鉀、氯、蛋白質(zhì)、施木克值7項理化指標。點擊訓練,可以得到如下的魯棒回歸模型,其數(shù)學表達式為焦油=16.895536-5. 808905* 總煙堿-O. 039244* 總糖 +0. 158309* 還原糖+41. 893953* 總氮-O. 874059* 鉀 +0. 644394* 氯-6. 959945* 蛋白質(zhì)-1. 351107* 施木克值魯棒回歸模型是最重要的結(jié)果。其數(shù)學表達式為從各個理化指標項到某一煙氣指標項的線性表達式。從模型中,我們可以看到各理化指標項對煙氣指標的影響大小。僅從數(shù)學表達式數(shù)值上便可看出理化指標項與煙氣指標項的線性關(guān)系。同時我們可以得到,模型評價、訓練結(jié)果、訓練擬合曲線、奇異值等信息。以下將對模型的各種信息進行解釋。模型評價是對模型總體性能的評價,包含訓練集上的相關(guān)系數(shù)、絕對誤差和、平均誤差。相關(guān)系數(shù)為煙氣預測值與樣本訓練集之間的簡單相關(guān)系數(shù);絕對誤差和為煙氣預測值與樣本訓練集的煙氣值之間的絕對誤差的累加和;平均誤差為絕對誤差和除以樣本訓練集的樣本個數(shù)。通過模型評價,我們可以對一個模型的性能有更詳盡的把握,有利于我們最終確定每個煙氣對應的魯棒回歸模型。例如我們得到如下的模型評價信息訓練數(shù)據(jù)集上的相關(guān)系數(shù)為0.943007訓練數(shù)據(jù)集上的絕對誤差和為22.943851訓練數(shù)據(jù)集上的平均誤差為0.573596訓練數(shù)據(jù)集樣本總數(shù)為40
從模型評價中,我們可以看到煙氣預測值與訓練集上的煙氣值之間的擬合程度非常高,簡單相關(guān)系數(shù)高達O. 94,并且誤差空載在較小的范圍內(nèi),焦油的平均誤差不到O. 58,可以基本確定該模型符合我們的要求,可以用于我們未知烤片的煙氣預測。訓練結(jié)果為煙氣的實際值、預測值、誤差值。每一條烤片數(shù)據(jù)對應一條記錄,例如
權(quán)利要求
1.一種烤片煙氣的預測方法,其特征是,預先錄入每個煙氣對應的已有烤片理化數(shù)據(jù)和煙氣數(shù)據(jù),建立從理化指標項到煙氣指標項的魯棒回歸模型,對于未知烤片煙氣數(shù)據(jù),直接采用已建立魯棒回歸模型進行其理化成分數(shù)據(jù)預測,獲得未知烤片煙氣值預測值,指導實際生產(chǎn);預測使用的設備包括數(shù)據(jù)庫服務器(I)和數(shù)據(jù)挖掘客戶端(2),其中數(shù)據(jù)挖掘客戶端(2 )包括可視化展示工具(13 ),可視化展示工具(13 )與數(shù)據(jù)展示處理模塊(11)和結(jié)果展示模塊(12)連接;數(shù)據(jù)展示處理模塊(11)與數(shù)據(jù)連接模塊(6)連接,結(jié)果展示模塊(12)與預測處理模塊(10)連接,預測處理模塊(10)分別與模型庫模塊(9)和數(shù)據(jù)連接模塊(6)連接;數(shù)據(jù)連接模塊(6 )則與身份驗證處理模塊(5 )和數(shù)據(jù)庫服務器(I)中的數(shù)據(jù)源(4)連接,同時身份驗證處理模塊(5 )與數(shù)據(jù)庫服務器(I)中的權(quán)限數(shù)據(jù)庫(3 )連接,身份驗證處理模塊(5)通過用戶名和密碼驗證用戶的合法性;數(shù)據(jù)連接模塊(6)提供各種不同數(shù)據(jù)類型格式數(shù)據(jù)源的連接,建立的魯棒回歸模型可直接使用的數(shù)據(jù)庫,提供數(shù)個數(shù)據(jù)對象訪問的接口。
2.如權(quán)利要求1所述的烤片煙氣的預測方法,其特征是,所述可視化展示工具(13)和結(jié)果展示模塊(12)通過點線圖、表格形式直觀展示處理結(jié)果。
3.如權(quán)利要求1所述的基于魯棒回歸建模的烤片煙氣預測系統(tǒng),其特征是,預測處理模塊(10)使用模型庫模塊(9)中前期已經(jīng)保存好的模型進行預測煙氣值。
4.如權(quán)利要求1所述的烤片煙氣的預測系統(tǒng),其特征是,所述模型評估模塊(8)利用不同指標項對測試數(shù)據(jù)進行魯棒回歸建模,對模型性能進行評估,根據(jù)評估結(jié)果選擇性能較好的模型保存到模型庫模塊(9)中。
5.如權(quán)利要求1所述的烤片煙氣的預測方法,其特征是,使用包括以下步驟步驟1:進入系統(tǒng);啟動系統(tǒng),輸入用戶名和密碼,進行用戶身份驗證,用戶名密碼正確,則通過驗證,進入系統(tǒng),用戶名或密碼不正確,則退出系統(tǒng),步驟2 :導入烤片數(shù)據(jù),包含理化數(shù)據(jù)和煙氣數(shù)據(jù);根據(jù)篩選條件從數(shù)據(jù)庫中獲取具體的烤片數(shù)據(jù),要求該烤片數(shù)據(jù)既要包含理化數(shù)據(jù),又要包含煙氣數(shù)據(jù);在步驟3中建立的模型中,理化數(shù)據(jù)作為輸入項,煙氣數(shù)據(jù)作為輸出項,且每一種煙氣對應一個魯棒回歸模型;步驟3:建立魯棒回歸模型,根據(jù)導入的烤片數(shù)據(jù),由魯棒回歸技術(shù)建立由理化數(shù)據(jù)到煙氣數(shù)據(jù)的模型,其中模型中有且僅有一種煙氣指標,但可包含多種理化指標;模型的最終形式將以數(shù)學表達式的形式給出,其數(shù)學表達式為從各個理化指標項到某一煙氣指標項的線性表達式;同時得到模型評價、訓練結(jié)果、訓練擬合曲線、奇異值信息;模型評價是對模型總體性能的評價,包含訓練集上的相關(guān)系數(shù)、絕對誤差和、平均誤差。相關(guān)系數(shù)為煙氣預測值與樣本訓練集之間的簡單相關(guān)系數(shù);絕對誤差和為煙氣預測值與樣本訓練集的煙氣值之間的絕對誤差的累加和;平均誤差為絕對誤差和除以樣本訓練集的樣本個數(shù);通過模型評價,我們可以對一個模型的性能有更詳盡的把握,有利于我們最終確定每個煙氣對應的魯棒回歸模型;訓練擬合曲線為訓練結(jié)果中煙氣實際值與煙氣預測值的折線圖,通過該曲線,我們可以從圖中較直觀地觀察到模型的預測性能;奇異值為在魯棒建模的過程中樣本權(quán)重為O的樣本數(shù)據(jù),如果采用傳統(tǒng)的線性建模方法,奇異值將會對模型的性能產(chǎn)生較大的負面影響,影響模型效果,這點也正是我們采用魯棒回歸建模的初衷。但是并非在每一次的建模過程中都會存在奇異值;步驟4 :確定每個煙氣對應的模型并保存建立模型后,可查看模型的評估信息,其中包含模型的數(shù)學表達式與導入數(shù)據(jù)的相關(guān)系數(shù)、模型的絕對誤差和、模型的平均誤差??梢詮睦砘笜隧椀膫€數(shù)、相關(guān)系數(shù)、絕對誤差和、平均誤差等幾項中,綜合考慮模型的性能,盡量做到理化指標項個數(shù)相對較少、相關(guān)系數(shù)相對較大、絕對誤差和和平均誤差相對較小的模型。同時注意到每個煙氣指標項對應一個魯棒回歸模型,對于常見的焦油、一氧化碳、煙氣煙堿三大煙氣指標項,將有三個對應的模型(一個煙氣指標項可以保存多個魯棒回歸模型,在之后的預測模塊中再進行篩選);保存之后,在步驟6中的預測中再次利用該模型;步驟5 :導入烤片數(shù)據(jù),僅包含理化數(shù)據(jù) 從數(shù)據(jù)庫中導入烤片數(shù)據(jù),該數(shù)據(jù)僅僅包含理化數(shù)據(jù),并不包含煙氣數(shù)據(jù)。理化數(shù)據(jù)作為模型數(shù)學表達式的輸入;步驟6 :根據(jù)對應的模型預測每個烤片的煙氣值將導入的理化數(shù)據(jù)作為模型數(shù)學表達式的輸入,經(jīng)過計算得到某一種煙氣指標的具體預測值;當有多種煙氣的魯棒回歸模型時,將會得到多個煙氣的預測值;當導入的理化數(shù)據(jù)中不包含模型數(shù)學表達式的某一指標項時,預測條件未達到,將不會得到該模型對應的煙氣指標預測值。
全文摘要
本發(fā)明涉及一種烤片煙氣的預測方法,特別是基于魯棒回歸建模進行烤片煙氣的預測方法。本發(fā)明通過已有的烤片理化數(shù)據(jù)和煙氣數(shù)據(jù)建立從理化指標項到煙氣指標項的模型,對于未知烤片煙氣數(shù)據(jù),可以利用其理化成分數(shù)據(jù)直接預測烤片煙氣值。采用魯棒回歸模型,可以有效地避免因理化數(shù)據(jù)或煙氣數(shù)據(jù)中奇異值樣本導致的弊端,很大程度上保證模型的健壯性,該系統(tǒng)能夠有效地預測烤片的煙氣值,能夠?qū)酒恼w質(zhì)量情況起到很好的估計作用。
文檔編號G06Q10/04GK103020737SQ201210536249
公開日2013年4月3日 申請日期2012年12月12日 優(yōu)先權(quán)日2012年12月12日
發(fā)明者白曉莉, 董偉, 牟定榮, 龔榮崗, 彭國崗 申請人:紅塔煙草(集團)有限責任公司