本發(fā)明一般涉及與譜圖式檢測系統(tǒng)(例如帶有質(zhì)譜(ms)檢測的氣相色譜(gc))相關的色譜分離領域,更具體地說,涉及獲取、處理和分析所得分離和譜圖數(shù)據(jù)的方法。
背景技術:
1、ervin?kovats(kováts?e.,helv.chim.acta?41,1915-1932(1958))引入了色譜保留時間指數(shù)的使用,稱為科瓦茨保留指數(shù)(kri或簡稱ri),這是一個無量綱數(shù),有時表示為保留指數(shù)單位或簡稱為“iu”,作為將色譜保留時間(rt)轉換為氣相色譜(gc)中的與系統(tǒng)獨立的常數(shù)的方法。該方法取決于色譜儀的校準,通常使用一系列正構烷,其中正構烷的科瓦茨指數(shù)定義為其碳數(shù)的100倍,例如正己烷(c6h14)的ri值為600iu。然后可以為其它有機化合物指定相對于這些標準的ri值。用于等溫gc運行(對數(shù)函數(shù))和程序升溫運行(線性插值函數(shù))的模型都已經(jīng)被建立。
2、如果可以獲取未知化合物的ri,它可以成為一種強大的工具來幫助鑒定未知的有機化合物。廣泛使用的nist/epa/nih質(zhì)譜庫已更新其化合物數(shù)據(jù)庫到包含近140,000種化合物的測量ri值(https://www.nist.gov/programs-projects/nist20-updates-nist-tandem-and-electron-ionization-spectral-libraries)。此外,nist還開發(fā)了一種人工智能(ai)模型(例如,參見matyushin,dd?et?al,int.j.mol.sci.22(17),9194(2021)或stein,se?et?al,j.chem.inf.model.,47(3),975-980(2007)),可以從化學結構高精度地計算出ri,為離子譜圖庫(ei-ms)中超過300,000個化合物中幾乎所有的化合物提供ri值。
3、雖然ri值本身不一定能唯一地識別未知化合物,但當與ei-ms數(shù)據(jù)庫中的譜圖庫搜索相結合時(例如,stein,se等人,j.amer.soc.mass?spectrom.5,859-866(1994)),可以實現(xiàn)比單獨使用任何一種技術更高水平的未知物識別置信度。例如,譜圖庫檢索通能生成未知物與譜圖庫中化合物的“最佳”可能匹配列表。但是,該列表通常不會提供明確或唯一的定性結果。同樣,ri也不能提供明確的定性,因為許多化合物可能具有相似的ri值。但是,這兩者結合起來可以顯著提高定性的置信度。
4、為了正確計算未知物的ri值,必須在與樣品運行相同條件下,包括流速、溫度程序、入口溫度、色譜柱等,用已知化合物(通常是正構烷階梯)作仔細校準。由于ri值是通過ri標準階梯之間的插值計算而來,因此最好在整個色譜運行過程中將標準階梯均勻分布且彼此靠近。如方法或條件(流速、色譜柱長度等)有任何變化,則需要重新測定校準階梯。此外,隨著時間的推移,色譜條件可能會因環(huán)境溫度、色譜柱降解或gc電子線路和流量控制器的微小漂移而略有改變,這可能需要重新校準。當然,在使用新的色譜方法時,也需要重新運行ri標樣。因此,這種方法的缺點是需要額外的時間和精力定期重新運行校準樣品,從而增加額外的負擔并導致分析的吞吐量和效率降低。使用外部標準(如正構烷)的另一個困難是,一些烷烴可能不會在gc編程完成之前從色譜柱中洗脫出來,從而導致殘留或其他實驗上的復雜化,或者注入的烷烴標準混合物中不含有足夠高的烷烴數(shù)來覆蓋感興趣的整個保留時間范圍。
5、內(nèi)標(將已知化合物加入樣品中)也可用于校準gc。這通常是通過將具有已知ri值的化合物添加到的樣品中來實現(xiàn)的。這種方法的優(yōu)點是1)標樣和分析物之間的時間間隔最短,從而最大限度地減少了由于儀器漂移而導致的誤差,2)內(nèi)標和樣品在相同條件下運行以最大限度地提高準確度,3)它消除了單獨測定標樣的需要,因此節(jié)省了時間和精力。然而,許多樣品本身就非常復雜,向樣品中添加內(nèi)標會由于峰共流出或離子化時抑制效應等而使分析更加復雜,從而難以準確確定內(nèi)標的保留時間(rt)。此外還需要額外的步驟來確保添加到樣品中的ri內(nèi)標量與樣品本身所含分析物的量相當。
6、最后,將等溫(對數(shù)模型)和程序升溫(線性插值模型)的ri模型應用于多步升溫或升溫與等溫段相結合的色譜分離(見圖1中的示例)可能會導致嚴重誤差。不幸的是,多段升溫程序在gc中很常見,因為這能夠最大限度地提高分離能力并最大限度地縮短運行時間。文獻中已經(jīng)提出用先進的ri模型來準確計算此類運行條件下的ri值,但需要準確測量每種化合物的三個熱力學常數(shù)δh、δs和δcp,并仔細確認氣相色譜儀的關鍵參數(shù)(boswell,pg等人,j.chromatogr.a.1263:179-88(2012)和peng?b.等人,j.chromatogr.a.1374:207-215(2014))。不幸的是,與傳統(tǒng)的kri不同,絕大多數(shù)有機化合物都缺乏這些熱力學常數(shù)。為了準確測量這些常數(shù),需要在至少三種截然不同的程序升溫條件下測定含有這些化合物的樣品,并確保所有這些化合物都會能在運行的時間區(qū)段內(nèi)出峰。這是一個很具有挑戰(zhàn)性實驗和一項艱巨的任務,因此不切實際。
7、因此,希望能找到克服現(xiàn)有技術的上述缺陷和缺點的有效方法。
技術實現(xiàn)思路
1、本技術針對以下改進:
2、1.一種進行ri校準的新方法,無需事先使用任何已知標準,無論是添加到測試樣品本身還是通過外部樣品進樣或運行,都可以節(jié)省時間和精力,同時避免實驗、實驗室或人為錯誤。
3、2.這些ri標準是自行生成的,通過分析測試樣品本身來選取自同一樣品的一部分被分析物來作為ri標準。
4、3.一種從測試樣品中通過譜圖分析來挑選分析物的方法,將其用作ri標準來進行ri校準,以確保標準和測試樣品中分析物之間使用完全相同的實驗或溫度編程條件。
5、4.一種通過迭代來改進用于ri校準的ri標準的方法。
6、5.由于ri校準是就當前測試樣品本身內(nèi)部進行的,因此它與分離條件無關。
7、6.對每個檢測到的分離峰,應用校準(擬合)后計算的ri值來進一步幫助識別未知物,既可以作為譜庫搜索之外的附加指標,也可以與譜庫搜索得分結合后用于在計算機屏幕上將化合物列表中的化合物進行顏色編碼,以指示正確識別的可能性,從而大大減輕執(zhí)行分析任務的分析師的負擔。這種額外的識別能力比單用譜圖或ri值識別具有更大的可信度。
8、7.允許用已經(jīng)收集的沒有對應的ri校準數(shù)據(jù)的老數(shù)據(jù),回顧性地計算出ri值,來提高對已經(jīng)分析過的化合物的識別信心。
9、8.這樣獲得的ri值可以添加回現(xiàn)有的譜庫或數(shù)據(jù)庫中,以補充和增強ri信息的收集,從而不斷提高利用譜庫識別的能力。
10、9.現(xiàn)有技術已表明,可以校準四極桿質(zhì)譜系統(tǒng)的精確質(zhì)量和譜圖精確度,從而確定譜庫或數(shù)據(jù)庫中尚未包含的新未知化合物的元素組成。之后,可以進一步將根據(jù)其rt計算出的ri與基于元素組成和對應的可能化學結構用計算機模型預測的ri進行比較,來確定、選擇、排序或篩選可能的化學結構。
11、下面將描述每個方面以及實驗結果以說明它們的實用性。