本發(fā)明涉及光譜建模分析領(lǐng)域,尤其涉及一種光譜預(yù)測(cè)分析模型自主構(gòu)建方法和系統(tǒng)。
背景技術(shù):
1、以物質(zhì)光譜表征為基礎(chǔ)的光譜分析技術(shù)已在石化、醫(yī)藥、農(nóng)林和食品等領(lǐng)域得到了廣泛應(yīng)用,并在原材料屬性檢測(cè)、生產(chǎn)過(guò)程指標(biāo)監(jiān)測(cè)、違禁物品和食品質(zhì)量分析等環(huán)節(jié)發(fā)揮著重要作用。通過(guò)采集分析物質(zhì)的光譜數(shù)據(jù)和性質(zhì)數(shù)據(jù),并結(jié)合化學(xué)計(jì)量學(xué)方法建立定性或定量預(yù)測(cè)模型可實(shí)現(xiàn)對(duì)應(yīng)指標(biāo)的快速、準(zhǔn)確分析。在光譜分析過(guò)程中,隨著高分辨率光譜儀器的廣泛應(yīng)用和實(shí)際生產(chǎn)過(guò)程采樣條件的限制,采集的光譜數(shù)據(jù)通常具有小樣本高維特征,導(dǎo)致現(xiàn)有方法難以建立可靠的光譜預(yù)測(cè)分析模型。此外,普遍存在的模型結(jié)構(gòu)固化問(wèn)題進(jìn)一步降低了模型性能。
技術(shù)實(shí)現(xiàn)思路
1、以下給出一個(gè)或多個(gè)方面的簡(jiǎn)要概述以提供對(duì)這些方面的基本理解。此概述不是所有構(gòu)想到的方面的詳盡綜覽,并且既非旨在指認(rèn)出所有方面的關(guān)鍵性或決定性要素亦非試圖界定任何或所有方面的范圍。其唯一的目的是要以簡(jiǎn)化形式給出一個(gè)或多個(gè)方面的一些概念以為稍后給出的更加詳細(xì)的描述之序。
2、本發(fā)明的目的在于解決上述問(wèn)題,提供了一種光譜預(yù)測(cè)分析模型自主構(gòu)建方法和系統(tǒng),通過(guò)自主選擇建模變量并探索不同模型結(jié)構(gòu)的同時(shí),采用剪枝策略剔除冗余模型分支,有效提高了模型泛化性能。
3、本發(fā)明的技術(shù)方案為:本發(fā)明揭示了一種光譜預(yù)測(cè)分析模型自主構(gòu)建方法,方法包括:
4、步驟s1、構(gòu)建分析數(shù)據(jù)集并隨機(jī)劃分為訓(xùn)練集和測(cè)試集;
5、步驟s2、利用訓(xùn)練集數(shù)據(jù)建立偏最小二乘模型,根據(jù)回歸系數(shù)重要性選擇初始變量,并根據(jù)初始變量個(gè)數(shù)自適應(yīng)調(diào)整最大樹深度;
6、步驟s3、根據(jù)樹狀網(wǎng)絡(luò)的函數(shù)集合和終端集合隨機(jī)生成初始種群;
7、步驟s4、計(jì)算樹狀網(wǎng)絡(luò)子樹誤差降低率并進(jìn)行剪枝,計(jì)算剪枝后樹狀個(gè)體的適應(yīng)度;
8、步驟s5、根據(jù)種群個(gè)體適應(yīng)度和預(yù)設(shè)參數(shù)對(duì)個(gè)體進(jìn)行選擇、交叉和變異操作,重新進(jìn)行個(gè)體適應(yīng)度評(píng)價(jià)并更新最優(yōu)個(gè)體;
9、步驟s6、應(yīng)用步驟s5獲得的最優(yōu)個(gè)體構(gòu)成光譜預(yù)測(cè)分析模型并對(duì)測(cè)試集樣本進(jìn)行預(yù)測(cè)。
10、根據(jù)本發(fā)明的光譜預(yù)測(cè)分析模型自主構(gòu)建方法的一實(shí)施例,步驟s1中,分析數(shù)據(jù)集由樣品的光譜數(shù)據(jù)和物理化學(xué)性質(zhì)屬性數(shù)據(jù)組成,其中樣品光譜數(shù)據(jù)可以來(lái)源于以下任意一種:紫外-可見(jiàn)光譜、近紅外光譜、中紅外光譜、拉曼光譜與熒光光譜。
11、根據(jù)本發(fā)明的光譜預(yù)測(cè)分析模型自主構(gòu)建方法的一實(shí)施例,步驟s2中,利用訓(xùn)練集數(shù)據(jù)建立偏最小二乘模型,根據(jù)回歸系數(shù)重要性選擇初始變量,并根據(jù)初始變量個(gè)數(shù)自適應(yīng)調(diào)整最大樹深度,進(jìn)一步包括以下步驟:
12、步驟s21、以訓(xùn)練集的光譜數(shù)據(jù)為輸入、物理化學(xué)屬性數(shù)據(jù)為輸出構(gòu)建偏最小二乘模型;
13、步驟s22、根據(jù)偏最小二乘模型回歸系數(shù)的絕對(duì)值大小對(duì)光譜波長(zhǎng)排序并選擇指定數(shù)目波長(zhǎng)作為樹狀網(wǎng)絡(luò)的初始變量;
14、步驟s23、根據(jù)初始變量個(gè)數(shù)自適應(yīng)調(diào)整最大樹深度。
15、根據(jù)本發(fā)明的光譜預(yù)測(cè)分析模型自主構(gòu)建方法的一實(shí)施例,步驟s3中,樹狀網(wǎng)絡(luò)的函數(shù)集合為線性參數(shù)多項(xiàng)式模型的線性項(xiàng)和非線性項(xiàng),終端集合為初始變量集合。
16、根據(jù)本發(fā)明的光譜預(yù)測(cè)分析模型自主構(gòu)建方法的一實(shí)施例,步驟s4中,計(jì)算樹狀網(wǎng)絡(luò)子樹的光譜預(yù)測(cè)分析誤差降低率并進(jìn)行剪枝,計(jì)算剪枝后樹狀個(gè)體的適應(yīng)度,進(jìn)一步包括以下步驟:
17、步驟s41、將樹狀網(wǎng)絡(luò)分解為子樹;
18、步驟s42、計(jì)算各子樹的光譜預(yù)測(cè)分析誤差降低率,并根據(jù)預(yù)設(shè)剪枝閾值移除光譜預(yù)測(cè)分析誤差降低率于剪枝閾值的子樹;
19、步驟s43、計(jì)算剪枝后樹狀個(gè)體的適應(yīng)度。
20、根據(jù)本發(fā)明的光譜預(yù)測(cè)分析模型自主構(gòu)建方法的一實(shí)施例,步驟s5中,根據(jù)種群個(gè)體在光譜預(yù)測(cè)分析中的適應(yīng)度和預(yù)設(shè)參數(shù)對(duì)個(gè)體進(jìn)行選擇、交叉和變異操作,基于新個(gè)體組成的光譜預(yù)測(cè)分析模型性能重新進(jìn)行個(gè)體適應(yīng)度評(píng)價(jià)并更新最優(yōu)個(gè)體,進(jìn)一步包括以下步驟:
21、步驟s51、結(jié)合適應(yīng)度和代際間隔從初始種群中選出優(yōu)秀個(gè)體組成精英個(gè)體集合;
22、步驟s52、結(jié)合光譜預(yù)測(cè)分析模型的適應(yīng)度和交叉、變異概率,從初始種群中選出父代個(gè)體組成集合;
23、步驟s53、對(duì)父代個(gè)體集合進(jìn)行交叉、變異操作產(chǎn)生子代種群;
24、步驟s54、對(duì)子代種群進(jìn)行基于光譜預(yù)測(cè)分析模型的適應(yīng)度評(píng)價(jià),并與精英集合合并組成新的初始種群;
25、步驟s55、在最大迭代次數(shù)范圍內(nèi),循環(huán)s51-s54并確定最終光譜預(yù)測(cè)分析模型。
26、根據(jù)本發(fā)明的光譜預(yù)測(cè)分析模型自主構(gòu)建方法的一實(shí)施例,步驟s6中,應(yīng)用步驟s5獲得的最優(yōu)個(gè)體構(gòu)成光譜預(yù)測(cè)分析模型并對(duì)測(cè)試集樣本,進(jìn)行預(yù)測(cè)進(jìn)一步包括以下步驟:
27、步驟s61、根據(jù)步驟s5獲得最佳個(gè)體及樹狀網(wǎng)絡(luò)確定最終光譜預(yù)測(cè)分析模型;
28、步驟s62、利用最終光譜預(yù)測(cè)分析模型對(duì)測(cè)試集樣本進(jìn)行預(yù)測(cè)分析。
29、本發(fā)明還揭示了一種光譜預(yù)測(cè)分析模型自主構(gòu)建系統(tǒng),系統(tǒng)包括:
30、數(shù)據(jù)集劃分模塊,構(gòu)建分析數(shù)據(jù)集并隨機(jī)劃分為訓(xùn)練集和測(cè)試集;
31、模型建立模塊,利用訓(xùn)練集數(shù)據(jù)建立偏最小二乘模型,根據(jù)回歸系數(shù)重要性選擇初始變量,并根據(jù)初始變量個(gè)數(shù)自適應(yīng)調(diào)整最大樹深度;
32、種群生成模塊,根據(jù)樹狀網(wǎng)絡(luò)的函數(shù)集合和終端集合隨機(jī)生成初始種群;
33、剪枝計(jì)算模塊,計(jì)算樹狀網(wǎng)絡(luò)子樹的光譜預(yù)測(cè)分析誤差降低率并進(jìn)行剪枝,計(jì)算剪枝后樹狀個(gè)體的適應(yīng)度;
34、個(gè)體操作模塊,根據(jù)種群個(gè)體在光譜預(yù)測(cè)分析中的適應(yīng)度和預(yù)設(shè)參數(shù)對(duì)個(gè)體進(jìn)行選擇、交叉和變異操作,基于新個(gè)體組成的光譜預(yù)測(cè)分析模型性能重新進(jìn)行個(gè)體適應(yīng)度評(píng)價(jià)并更新最優(yōu)個(gè)體;
35、預(yù)測(cè)模塊,應(yīng)用個(gè)體操作模塊獲得的最優(yōu)個(gè)體構(gòu)成光譜預(yù)測(cè)分析模型并對(duì)測(cè)試集樣本進(jìn)行預(yù)測(cè)。
36、本發(fā)明還揭示了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其存儲(chǔ)有可供處理器執(zhí)行的程序指令,以實(shí)現(xiàn)如上所述的光譜預(yù)測(cè)分析模型自主構(gòu)建方法的步驟。
37、本發(fā)明還揭示了一種計(jì)算機(jī)設(shè)備,其包括存儲(chǔ)器、處理器和存儲(chǔ)在存儲(chǔ)器中可供處理器運(yùn)行的程序指令,其中所述處理器執(zhí)行所述程序指令以實(shí)現(xiàn)如上所述的光譜預(yù)測(cè)分析模型自主構(gòu)建方法的步驟。
38、本發(fā)明對(duì)比現(xiàn)有技術(shù)有如下的有益效果:本發(fā)明基于遺傳編程建立樹狀網(wǎng)絡(luò)模型,在構(gòu)造線性子樹的基礎(chǔ)上引入非線性子樹,從而有效提高了模型結(jié)構(gòu)的多樣性。此外,本發(fā)明通過(guò)自適應(yīng)調(diào)整最大樹深度探索不同模型結(jié)構(gòu),并結(jié)合剪枝策略避免冗余結(jié)構(gòu),有效提高了模型的泛化性能。與現(xiàn)有的固定參數(shù)的光譜預(yù)測(cè)分析模型相比,本發(fā)明通過(guò)變量篩選、遺傳編程和剪枝操作建立更加靈活的模型結(jié)構(gòu),有效提高了光譜分析模型的預(yù)測(cè)精度和模型多樣性。
1.一種光譜預(yù)測(cè)分析模型自主構(gòu)建方法,其特征在于,方法包括:
2.根據(jù)權(quán)利要求1所述的光譜預(yù)測(cè)分析模型自主構(gòu)建方法,其特征在于,步驟s1中,分析數(shù)據(jù)集由樣品的光譜數(shù)據(jù)和物理化學(xué)性質(zhì)屬性數(shù)據(jù)組成,其中樣品光譜數(shù)據(jù)可以來(lái)源于以下任意一種:紫外-可見(jiàn)光譜、近紅外光譜、中紅外光譜、拉曼光譜與熒光光譜。
3.根據(jù)權(quán)利要求1所述的光譜預(yù)測(cè)分析模型自主構(gòu)建方法,其特征在于,步驟s2中,利用訓(xùn)練集數(shù)據(jù)建立偏最小二乘模型,根據(jù)回歸系數(shù)重要性選擇初始變量,并根據(jù)初始變量個(gè)數(shù)自適應(yīng)調(diào)整最大樹深度,進(jìn)一步包括以下步驟:
4.根據(jù)權(quán)利要求1所述的光譜預(yù)測(cè)分析模型自主構(gòu)建方法,其特征在于,步驟s3中,樹狀網(wǎng)絡(luò)的函數(shù)集合為線性參數(shù)多項(xiàng)式模型的線性項(xiàng)和非線性項(xiàng),終端集合為初始變量集合。
5.根據(jù)權(quán)利要求1所述的光譜預(yù)測(cè)分析模型自主構(gòu)建方法,其特征在于,步驟s4中,計(jì)算樹狀網(wǎng)絡(luò)子樹的光譜預(yù)測(cè)分析誤差降低率并進(jìn)行剪枝,計(jì)算剪枝后樹狀個(gè)體的適應(yīng)度,進(jìn)一步包括以下步驟:
6.根據(jù)權(quán)利要求1所述的光譜預(yù)測(cè)分析模型自主構(gòu)建方法,其特征在于,步驟s5中,根據(jù)種群個(gè)體在光譜預(yù)測(cè)分析中的適應(yīng)度和預(yù)設(shè)參數(shù)對(duì)個(gè)體進(jìn)行選擇、交叉和變異操作,基于新個(gè)體組成的光譜預(yù)測(cè)分析模型性能重新進(jìn)行個(gè)體適應(yīng)度評(píng)價(jià)并更新最優(yōu)個(gè)體,進(jìn)一步包括以下步驟:
7.根據(jù)權(quán)利要求1所述的光譜預(yù)測(cè)分析模型自主構(gòu)建方法,其特征在于,步驟s6中,應(yīng)用步驟s5獲得的最優(yōu)個(gè)體構(gòu)成光譜預(yù)測(cè)分析模型并對(duì)測(cè)試集樣本進(jìn)行預(yù)測(cè),進(jìn)一步包括以下步驟:
8.一種光譜預(yù)測(cè)分析模型自主構(gòu)建系統(tǒng),其特征在于,系統(tǒng)包括:
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其存儲(chǔ)有可供處理器執(zhí)行的程序指令,以實(shí)現(xiàn)如權(quán)利要求1至7中任一項(xiàng)所述的光譜預(yù)測(cè)分析模型自主構(gòu)建方法的步驟。
10.一種計(jì)算機(jī)設(shè)備,其包括存儲(chǔ)器、處理器和存儲(chǔ)在存儲(chǔ)器中可供處理器運(yùn)行的程序指令,其中所述處理器執(zhí)行所述程序指令以實(shí)現(xiàn)如權(quán)利要求1至7中任一項(xiàng)所述的光譜預(yù)測(cè)分析模型自主構(gòu)建方法的步驟。