本發(fā)明屬于物質(zhì)檢測(cè)領(lǐng)域,特別是涉及利用光譜檢測(cè)化學(xué)成分的方法,具體是涉及一種利用光譜數(shù)據(jù)和化學(xué)檢測(cè)數(shù)據(jù)建立數(shù)據(jù)模型的方法。
背景技術(shù):
現(xiàn)代近紅外光譜儀器的控制及數(shù)據(jù)處理分析系統(tǒng)是儀器的重要組成部分。一般由儀器控制、采譜和光譜處理分析兩個(gè)軟件系統(tǒng)和相應(yīng)的硬件設(shè)備構(gòu)成。前者主要功能是控制儀器各部分的工作狀態(tài),設(shè)定光譜采集的有關(guān)參數(shù),如光譜測(cè)量方式、掃描次數(shù)、設(shè)定光譜的掃描范圍等,設(shè)定檢測(cè)器的工作狀態(tài)并接受檢測(cè)器的光譜信號(hào)。光譜處理分析軟件主要對(duì)檢測(cè)器所采集的光譜進(jìn)行處理,實(shí)現(xiàn)定性或定量分析。對(duì)特定的樣品體系,近紅外光譜特征峰的差別并不明顯,需要通過(guò)光譜的處理減少以至消除各方面因素對(duì)光譜信息的干擾,再?gòu)牟顒e甚微的光譜信息中提取樣品的定性或定量信息,這一切都要通過(guò)功能強(qiáng)大的光譜數(shù)據(jù)處理分析軟件來(lái)實(shí)現(xiàn)。
近紅外光譜分析技術(shù)分析速度快,是因?yàn)楣庾V測(cè)量速度很快,計(jì)算機(jī)計(jì)算結(jié)果速度也很快的原因。但近紅外光譜分析的效率卻取決于儀器所配備的模型的數(shù)量。比如,測(cè)量一張光譜圖,如果僅有一個(gè)模型,就只能得到一個(gè)數(shù)據(jù),但是,如果建立了10種性質(zhì)參數(shù)模型,那么,僅憑測(cè)量的一張光譜,就可以同時(shí)得到10種分析數(shù)據(jù)。多個(gè)性質(zhì)參數(shù)模型的建立,可以大大提高近紅外光譜分析的工作效率,充分發(fā)揮它的特長(zhǎng)。
CN 101556242 B公開了一種用傅立葉紅外光譜鑒別微生物的方法,包括培養(yǎng)對(duì)照微生物;采集對(duì)照微生物的紅外圖譜;在3000-2300cm-1和1300至700cm-1區(qū)間內(nèi)的一個(gè)或多個(gè)譜段建立微生物鑒別模型;在上述相同的條件下培養(yǎng)待測(cè)微生物,采集待測(cè)微生物的紅外圖譜,將紅外圖譜代入微生物鑒別模型中確定待測(cè)微生物的歸屬。
目前的方法中,因?yàn)槟P偷慕凑請(qǐng)D譜的模式進(jìn)行的,或者是按照局部數(shù)據(jù)進(jìn)行的,或者是在化學(xué)計(jì)量的基礎(chǔ)上進(jìn)行匹配光譜數(shù)據(jù),這些方法都存在建模后調(diào)整難度大,基礎(chǔ)數(shù)據(jù)不齊全,導(dǎo)致數(shù)據(jù)模型的校正和公式的更新和更換難度大。
為解決上述技術(shù)問(wèn)題,本發(fā)明提供了一種利用光譜數(shù)據(jù)和化學(xué)檢測(cè)數(shù)據(jù)建立數(shù)據(jù)模型的方法,該方法利用物質(zhì)的光譜多波長(zhǎng)特征信息和多物質(zhì)信息對(duì)應(yīng)關(guān)系的設(shè)立運(yùn)算公式。主要過(guò)程是建立完光譜數(shù)據(jù)和化學(xué)檢測(cè)數(shù)據(jù)后,輸入數(shù)據(jù)庫(kù),進(jìn)行光譜數(shù)據(jù)和化學(xué)數(shù)據(jù)的映射,根據(jù)映射尋找代表其規(guī)律的波長(zhǎng)組合信息,并將波長(zhǎng)組合信息與物質(zhì)成分和含量信息建立多套數(shù)據(jù)公式,然后將多套數(shù)學(xué)公式嵌入運(yùn)算服務(wù)器,運(yùn)算服務(wù)器與數(shù)據(jù)庫(kù)緊密互動(dòng),進(jìn)行新物質(zhì)檢測(cè)和數(shù)學(xué)公式的優(yōu)化。
具體的,本發(fā)明提供了一種利用光譜數(shù)據(jù)和化學(xué)檢測(cè)數(shù)據(jù)建立數(shù)據(jù)模型的方法,其特征在于物體樣品的多組光譜數(shù)據(jù)和多組化學(xué)檢測(cè)數(shù)據(jù)錄入同一數(shù)據(jù)庫(kù),形成數(shù)據(jù)映射集合,從數(shù)據(jù)映射集合中,選取2-100個(gè)波長(zhǎng)的吸光度數(shù)值與化學(xué)檢測(cè)數(shù)據(jù)進(jìn)行對(duì)應(yīng),確定2-100個(gè)波長(zhǎng)吸光度變化與化學(xué)檢測(cè)數(shù)據(jù)變化具有定性和定量關(guān)系的K個(gè)公式,將K個(gè)公式嵌入運(yùn)算服務(wù)器,物體新樣品的光譜數(shù)據(jù)錄入數(shù)據(jù)庫(kù)的同時(shí),選取上述確定的2-100個(gè)波長(zhǎng)錄入運(yùn)算服務(wù)器,計(jì)算出未進(jìn)行實(shí)際檢測(cè)的物體新樣品化學(xué)數(shù)據(jù),同時(shí)將該化學(xué)數(shù)據(jù)輸出到顯示端和數(shù)據(jù)庫(kù),并在數(shù)據(jù)庫(kù)中與新采集的光譜數(shù)據(jù)形成測(cè)量映射,與已有數(shù)據(jù)映射形成新的映射集合,其中K≥1。
具體,本發(fā)明提供了一種利用光譜數(shù)據(jù)和化學(xué)檢測(cè)數(shù)據(jù)建立數(shù)據(jù)模型的方法,該方法包括如下步驟:
步驟I:用光源照射待檢測(cè)的物體樣品A1,然后收集物體樣品A1反射回來(lái)的光譜,采用光譜分析設(shè)備確定所收集光譜的波長(zhǎng)及吸光度,形成物體樣品A1的光譜數(shù)據(jù);
步驟II:對(duì)物體樣品A1進(jìn)行化學(xué)分析,分析其T種成分及含量,形成物體樣品的化學(xué)檢測(cè)數(shù)據(jù);T表示成分的數(shù)量,也就是做幾種成分的分析,當(dāng)對(duì)物體分析蛋白質(zhì)和淀粉的時(shí)候,則T為2,如果增加可溶性糖,則T為3。T大于等于1,一般情況不對(duì)最大數(shù)值做限定,只要條件允許,可以對(duì)物體的成分做全分析,那樣T可能會(huì)達(dá)到20,甚至30;
步驟III:將物體A1的光譜數(shù)據(jù)和化學(xué)檢測(cè)數(shù)據(jù)錄入同一數(shù)據(jù)庫(kù),形成數(shù)據(jù)映射X1;
步驟IV:重復(fù)上述步驟I、步驟II和步驟III,對(duì)物體樣品A2至An+1進(jìn)行n次重復(fù),形成n組光譜數(shù)據(jù)和對(duì)應(yīng)的n組化學(xué)檢測(cè)數(shù)據(jù),將光譜數(shù)據(jù)和化學(xué)檢測(cè)數(shù)據(jù)錄入同一數(shù)據(jù)庫(kù),形成n組數(shù)據(jù)映射的數(shù)據(jù)映射集合;
步驟V:將上述數(shù)據(jù)庫(kù)中數(shù)據(jù)映射集合中的光譜數(shù)據(jù)選取2-100個(gè)波長(zhǎng)的吸光度數(shù)值與化學(xué)檢測(cè)數(shù)據(jù)進(jìn)行對(duì)應(yīng),確定2-100個(gè)波長(zhǎng)吸光度變化與化學(xué)檢測(cè)數(shù)據(jù)變化具有定性和定量 關(guān)系的K個(gè)公式。K表示公式的數(shù)量,一般情況下K≥1,為了單獨(dú)分析多組分,K值要大于T值,也就是公式的數(shù)量一定大于成分的數(shù)量,有時(shí)為了同時(shí)進(jìn)行多組分分析,需要K值滿足如下關(guān)系式:
其中C表示組合式的含義。
為了考慮對(duì)每個(gè)成分或者是多個(gè)成分組合的檢測(cè)準(zhǔn)確,需要備用公式,也就是針對(duì)異常數(shù)據(jù),公式出現(xiàn)無(wú)法計(jì)算的情況,應(yīng)對(duì)備用公式進(jìn)行運(yùn)算,則此時(shí)考慮備用公式時(shí),K值則需要滿足如下關(guān)系式:
其中C表示組合式的含義。
步驟VI:將上述步驟的K個(gè)公式嵌入運(yùn)算服務(wù)器,采集物體新樣品AX的光譜數(shù)據(jù),將其錄入數(shù)據(jù)庫(kù)的同時(shí),選取步驟V確定的2-100個(gè)波長(zhǎng)錄入運(yùn)算服務(wù)器,計(jì)算出未進(jìn)行實(shí)際檢測(cè)的物體新樣品化學(xué)數(shù)據(jù),同時(shí)將該化學(xué)數(shù)據(jù)輸出到顯示端和數(shù)據(jù)庫(kù),并在數(shù)據(jù)庫(kù)中與物體新樣品AX的光譜數(shù)據(jù)形成測(cè)量數(shù)據(jù)映射,該測(cè)量數(shù)據(jù)映射與已有的數(shù)據(jù)映射形成更新的數(shù)據(jù)映射集合,作為公式的更新和更換的基礎(chǔ)。
步驟VII:根據(jù)步驟I至步驟VI所形成的數(shù)據(jù)庫(kù)和運(yùn)算服務(wù)器上的K個(gè)公式,將數(shù)據(jù)庫(kù)和運(yùn)算服務(wù)器相連,同時(shí)設(shè)置數(shù)據(jù)庫(kù)的數(shù)據(jù)輸入端和數(shù)據(jù)輸出端、設(shè)置運(yùn)算服務(wù)器的數(shù)據(jù)輸入端和數(shù)據(jù)輸出端,形成物體的光譜數(shù)據(jù)模型。
優(yōu)選的,上述方法中,n大于等于30。尤其優(yōu)選的,n大于等于50,更優(yōu)選的,n大于等于100。n表示樣品檢測(cè)數(shù)量,n值越大,則光譜數(shù)據(jù)和化學(xué)檢測(cè)數(shù)據(jù)的數(shù)量越大,會(huì)使得映射數(shù)據(jù)集合中的數(shù)據(jù)更好的支撐公式的建立,此處限定的n值是指建立模型所需的最低樣品檢測(cè)量,最大檢測(cè)量不受限制,只要條件允許,可以將樣品檢測(cè)量增加到1000以上,甚至是10000以上。
優(yōu)選的,上述方法中,光譜的波長(zhǎng)范圍為700-2500nm。優(yōu)選的,光譜的波長(zhǎng)范圍為800-1800nm,或光譜的波長(zhǎng)范圍為1500-2500,或者是700-2500nm內(nèi)任意范圍的波長(zhǎng)范圍。。
優(yōu)選的,上述方法中,物體為化學(xué)組成成分基本相同但成分含量差異值在20%以內(nèi)的同類物體,優(yōu)選的,物體為食物類、農(nóng)產(chǎn)品類、土壤類等,優(yōu)選的為農(nóng)產(chǎn)品類,例如馬鈴 薯塊莖,小麥籽粒,西瓜、葉菜、蘋果等等。例如建立馬鈴薯的數(shù)據(jù)模型,則上述方法中,物體樣品則均為馬鈴薯樣品,而不能選擇紅薯樣品。
優(yōu)選的,上述方法中,光譜數(shù)據(jù)為納米整數(shù)級(jí)波長(zhǎng)的所有波長(zhǎng)及吸光度的數(shù)據(jù)集合。也就是說(shuō),光譜數(shù)據(jù)不僅僅是一個(gè)圖形或者是幾個(gè)波長(zhǎng)數(shù)據(jù),而是所選范圍內(nèi)的所有波長(zhǎng)的吸光度,哪怕某些波長(zhǎng)的吸光度為零,也要記錄入光譜數(shù)據(jù)中。
優(yōu)選的,上述方法中,光譜數(shù)據(jù)為波長(zhǎng)為800-1800nm的1001個(gè)波長(zhǎng)的波長(zhǎng)和吸光度的數(shù)據(jù)集合。
優(yōu)選的,上述方法中,光譜數(shù)據(jù)為波長(zhǎng)為1500-2500的1001個(gè)波長(zhǎng)的波長(zhǎng)和吸光度的數(shù)據(jù)集合。
本發(fā)明的方法所針對(duì)的是建立數(shù)據(jù)模型的方法,數(shù)據(jù)模型的建立中的化學(xué)測(cè)量數(shù)據(jù),也成為化學(xué)計(jì)量數(shù)據(jù),是指通過(guò)某些物質(zhì)的國(guó)家標(biāo)準(zhǔn)進(jìn)行測(cè)量獲得的化學(xué)數(shù)據(jù)。例如馬鈴薯中的淀粉含量,需要按照國(guó)家標(biāo)準(zhǔn)或者是行業(yè)標(biāo)準(zhǔn)進(jìn)行測(cè)量,也可以采用滿足國(guó)標(biāo)測(cè)量精度的儀器進(jìn)行測(cè)量。
有益效果
本發(fā)明建立數(shù)據(jù)模型的方法的有益效果體現(xiàn)在如下三個(gè)方面:
1、將光譜數(shù)據(jù)與化學(xué)檢測(cè)數(shù)據(jù)輸入數(shù)據(jù)庫(kù)中,進(jìn)行映射,避免了目前僅僅將光譜數(shù)據(jù)錄入化學(xué)檢測(cè)數(shù)據(jù)處理器中導(dǎo)致的數(shù)據(jù)不獨(dú)立的缺陷,難以達(dá)到公式更新和更換,阻礙了公式的靈活變化。
2、在數(shù)據(jù)庫(kù)中的數(shù)據(jù)映射集合中,選取2-100個(gè)波長(zhǎng)數(shù)據(jù),因?yàn)閿?shù)據(jù)庫(kù)中的波長(zhǎng)數(shù)據(jù)全面,因此選取2-100個(gè)波長(zhǎng)數(shù)據(jù)與化學(xué)測(cè)量數(shù)據(jù)進(jìn)行對(duì)應(yīng)和建立公式則更加便捷,2-100個(gè)波長(zhǎng)數(shù)據(jù)可以進(jìn)行變換,摒棄了目前技術(shù)中單一波長(zhǎng)段的選擇,形成不確定分析,對(duì)波長(zhǎng)的定位不準(zhǔn)確。
3、K個(gè)公式嵌入服務(wù)器中,實(shí)現(xiàn)了公式的獨(dú)立運(yùn)算,同時(shí)也保證了運(yùn)算結(jié)果可以獨(dú)立的輸回?cái)?shù)據(jù)庫(kù)中,而且選擇波長(zhǎng)數(shù)據(jù)時(shí),沒(méi)有必要將全部波長(zhǎng)數(shù)據(jù)進(jìn)行比對(duì),僅僅在服務(wù)器中比對(duì)2-100個(gè)波長(zhǎng)數(shù)據(jù)即可,比對(duì)效率高,又不影響原始光譜數(shù)據(jù)錄入到數(shù)據(jù)庫(kù)中。
附圖說(shuō)明
圖1描述了單個(gè)物體樣品的數(shù)據(jù)映射形成過(guò)程。
圖2描述了多個(gè)數(shù)據(jù)映射形成公式并嵌入服務(wù)器中的過(guò)程
圖3描述了作為新樣品光譜數(shù)據(jù)在數(shù)據(jù)模型中計(jì)算出樣品化學(xué)數(shù)據(jù)的過(guò)程。
圖4描述了數(shù)據(jù)模型的總體組成結(jié)構(gòu)。
具體實(shí)施方式
實(shí)施例1馬鈴薯塊莖的數(shù)據(jù)模型
材料:馬鈴薯塊莖,從馬鈴薯產(chǎn)品中隨機(jī)抽取50個(gè)馬鈴薯塊莖,橫向切割,光源照射和光譜數(shù)據(jù)收集針對(duì)馬鈴薯橫切面。
設(shè)備:光源照射裝置、光譜收集裝置和光譜分析設(shè)備為整體設(shè)備或分體設(shè)備,市場(chǎng)購(gòu)買得到。
用光源照射馬鈴薯塊莖,然后收集馬鈴薯塊莖反射回來(lái)的近紅外光譜,光譜范圍為800-1800nm,采用近紅外光譜分析設(shè)備分析光譜吸光度,形成馬鈴薯塊莖的800-1800nm的近紅外光譜數(shù)據(jù),該光譜數(shù)據(jù)具有1001個(gè)光波吸光度數(shù)據(jù)。
對(duì)馬鈴薯塊莖進(jìn)行化學(xué)分析,分析馬鈴薯塊莖的淀粉含量、維生素C含量、纖維素含量,形成馬鈴薯塊莖的化學(xué)檢測(cè)數(shù)據(jù);
將馬鈴薯塊莖的光譜數(shù)據(jù)和化學(xué)檢測(cè)數(shù)據(jù)錄入同一數(shù)據(jù)庫(kù),形成第1組數(shù)據(jù)映射;
再抽取馬鈴薯樣品49組,對(duì)隨機(jī)抽取的49組馬鈴薯塊莖按照上述方法獨(dú)立進(jìn)行處理,獲得49組光譜數(shù)據(jù)和對(duì)應(yīng)的49組化學(xué)檢測(cè)數(shù)據(jù),將光譜數(shù)據(jù)和化學(xué)檢測(cè)數(shù)據(jù)錄入同一數(shù)據(jù)庫(kù),形成50組數(shù)據(jù)映射;
在上述數(shù)據(jù)庫(kù)中的50組數(shù)據(jù)映射中,光譜數(shù)據(jù)選取3個(gè)波長(zhǎng)的吸光度數(shù)值,3個(gè)波長(zhǎng)的吸光度數(shù)值統(tǒng)一與化學(xué)檢測(cè)數(shù)據(jù)進(jìn)行對(duì)應(yīng),確定3個(gè)波長(zhǎng)吸光度變化與化學(xué)檢測(cè)數(shù)據(jù)變化具有同步關(guān)系的3個(gè)公式。
將上述步驟的3個(gè)公式嵌入運(yùn)算服務(wù)器,再采集新的馬鈴薯塊莖光譜數(shù)據(jù)錄入數(shù)據(jù)庫(kù),同時(shí)選取上述3個(gè)波長(zhǎng)錄入運(yùn)算服務(wù)器,計(jì)算出新的馬鈴薯塊莖的淀粉含量、維生素C含量、纖維素含量。同時(shí)將馬鈴薯塊莖的淀粉含量、維生素C含量、纖維素含量輸出到顯示端,并同時(shí)輸入數(shù)據(jù)庫(kù),并在數(shù)據(jù)庫(kù)中與新采集的光譜數(shù)據(jù)形成測(cè)試數(shù)據(jù)映射。
根據(jù)上述步驟確定的數(shù)據(jù)庫(kù)和運(yùn)算服務(wù)器上的3個(gè)公式,將數(shù)據(jù)庫(kù)和運(yùn)算服務(wù)器相連,同時(shí)設(shè)置數(shù)據(jù)庫(kù)的數(shù)據(jù)輸入端和數(shù)據(jù)輸出端、設(shè)置運(yùn)算服務(wù)器的數(shù)據(jù)輸入端和數(shù)據(jù)輸出端,形成馬鈴薯塊莖的光譜數(shù)據(jù)模型。
實(shí)施例2小麥的數(shù)據(jù)模型
材料:小麥,從小麥產(chǎn)品中隨機(jī)獲取100份,每份置于直徑10厘米的容器中,高度2cm, 光源照射和光譜數(shù)據(jù)收集針對(duì)容器中小麥堆的上平面。
設(shè)備:光源照射裝置、光譜收集裝置和光譜分析設(shè)備為整體設(shè)備或分體設(shè)備,市場(chǎng)購(gòu)買得到。
用光源照射小麥,然后收集小麥反射回來(lái)的近紅外光譜,光譜范圍為1500-2500nm,采用近紅外光譜分析設(shè)備分析光譜吸光度,形成小麥的1500-2500nm的近紅外光譜數(shù)據(jù),該光譜數(shù)據(jù)具有1001個(gè)光波吸光度數(shù)據(jù)。
對(duì)小麥進(jìn)行化學(xué)分析,分析小麥的淀粉含量、蛋白質(zhì)含量、纖維素含量,形成小麥的化學(xué)檢測(cè)數(shù)據(jù);
將小麥的光譜數(shù)據(jù)和化學(xué)檢測(cè)數(shù)據(jù)錄入同一數(shù)據(jù)庫(kù),形成第1組數(shù)據(jù)映射;
再抽取小麥樣品99組,對(duì)隨機(jī)抽取的09組小麥按照上述方法獨(dú)立進(jìn)行處理,獲得99組光譜數(shù)據(jù)和對(duì)應(yīng)的99組化學(xué)檢測(cè)數(shù)據(jù),將光譜數(shù)據(jù)和化學(xué)檢測(cè)數(shù)據(jù)錄入同一數(shù)據(jù)庫(kù),形成100組數(shù)據(jù)映射;
在上述數(shù)據(jù)庫(kù)中的100組數(shù)據(jù)映射中,光譜數(shù)據(jù)選取8個(gè)波長(zhǎng)的吸光度數(shù)值,8個(gè)波長(zhǎng)的吸光度數(shù)值統(tǒng)一與化學(xué)檢測(cè)數(shù)據(jù)進(jìn)行對(duì)應(yīng),確定8個(gè)波長(zhǎng)吸光度變化與化學(xué)檢測(cè)數(shù)據(jù)變化具有同步關(guān)系的7個(gè)公式。
將上述步驟的7個(gè)公式嵌入運(yùn)算服務(wù)器,再采集新的小麥光譜數(shù)據(jù)錄入數(shù)據(jù)庫(kù),同時(shí)選取上述8個(gè)波長(zhǎng)錄入運(yùn)算服務(wù)器,計(jì)算出新的小麥的淀粉含量、蛋白質(zhì)含量、纖維素含量。同時(shí)將小麥的淀粉含量、蛋白質(zhì)含量、纖維素含量輸出到顯示端,并同時(shí)輸入數(shù)據(jù)庫(kù),并在數(shù)據(jù)庫(kù)中與新采集的光譜數(shù)據(jù)形成測(cè)試數(shù)據(jù)映射。
根據(jù)上述步驟確定的數(shù)據(jù)庫(kù)和運(yùn)算服務(wù)器上的7個(gè)公式,將數(shù)據(jù)庫(kù)和運(yùn)算服務(wù)器相連,同時(shí)設(shè)置數(shù)據(jù)庫(kù)的數(shù)據(jù)輸入端和數(shù)據(jù)輸出端、設(shè)置運(yùn)算服務(wù)器的數(shù)據(jù)輸入端和數(shù)據(jù)輸出端,形成小麥的光譜數(shù)據(jù)模型。