国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種高分辨質(zhì)譜數(shù)據(jù)的處理方法

      文檔序號(hào):9578312閱讀:4262來源:國知局
      一種高分辨質(zhì)譜數(shù)據(jù)的處理方法
      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及一種高分辨質(zhì)譜數(shù)據(jù)的處理方法,屬于分析化學(xué)領(lǐng)域。具體來說是實(shí)現(xiàn)多個(gè)高分辨質(zhì)譜數(shù)據(jù)間同時(shí)保留時(shí)間和rn/z漂移的校正,并融合質(zhì)譜峰表特征,獲得“一對(duì)一”的峰表,即一個(gè)小分子化合物對(duì)應(yīng)唯一的質(zhì)譜特征,提高數(shù)據(jù)用于分類建模及實(shí)際應(yīng)用的能力,比如生物標(biāo)志物的發(fā)現(xiàn)與結(jié)構(gòu)鑒定。
      【背景技術(shù)】
      [0002]高分辨質(zhì)譜已經(jīng)得到非常廣泛的使用,比如LTQ-Orbitrap和FT-MS等,其主要原因在于其更準(zhǔn)確和更高分辨率的質(zhì)譜量測(cè),從而提供目標(biāo)化合物分子式甚至子結(jié)構(gòu)或全部結(jié)構(gòu)的信息,提高鑒定的準(zhǔn)確性和分析效率。以代謝組學(xué)的研究為例,高分辨質(zhì)譜,特別是液相色譜和高分辨質(zhì)譜(液-質(zhì))的聯(lián)用,已經(jīng)非常廣泛地用于靶向和非靶向代謝組學(xué)的研究中,極大地提高了代謝小分子標(biāo)志物被發(fā)現(xiàn)和鑒定的可能。
      [0003]代謝組學(xué)等領(lǐng)域所涉及的高分辨液-質(zhì)聯(lián)用儀器的應(yīng)用,以及相關(guān)數(shù)據(jù)的分析處理與信息挖掘,大多是建立在多個(gè)樣本的基礎(chǔ)之上,即需要分析的實(shí)際樣本數(shù)通常遠(yuǎn)不止一個(gè),比如非靶向代謝組學(xué)生物標(biāo)志物的發(fā)現(xiàn),需要系統(tǒng)地分析處理具有統(tǒng)計(jì)意義的有病和沒病體系數(shù)據(jù),尋找可以最大限度地區(qū)分這二類樣本,且具有優(yōu)越的未知樣本預(yù)測(cè)能力和生物解釋性的代謝小分子標(biāo)志物。多個(gè)高分辨數(shù)據(jù)樣本的分析,必然需要對(duì)這些數(shù)據(jù)進(jìn)行樣本間的保留時(shí)間和m/z漂移校正,最理想的狀態(tài)是達(dá)致一個(gè)代謝標(biāo)志物對(duì)應(yīng)一個(gè)最終峰表中的質(zhì)譜特征。
      [0004]迄今為止,研究者已經(jīng)提出不少方法來校正和處理多樣本的高分辨質(zhì)譜數(shù)據(jù),t匕如MetAlign,MZmine, XCMS,以及各種商業(yè)儀器中自帶的數(shù)據(jù)處理軟件包,例如安捷倫公司的Mass Profile Pro和布魯克公司的Metabolic Profiler等。整體而言,這些方法各有優(yōu)劣,結(jié)果的好壞往往取決于獲得數(shù)據(jù)時(shí)實(shí)驗(yàn)設(shè)計(jì)的具體情形,共同的缺陷可以歸類為二個(gè)方面:一是方法的復(fù)雜性導(dǎo)致的使用復(fù)雜性,絕大部分方法都設(shè)計(jì)成了非常復(fù)雜、功能完備的程序或軟件系統(tǒng),對(duì)于不具備較強(qiáng)儀器背景和數(shù)據(jù)分析處理背景的人來說,往往困難較大;另一個(gè)方面是方法的缺陷導(dǎo)致的結(jié)果不準(zhǔn)確性和代謝組學(xué)等領(lǐng)域中標(biāo)志物發(fā)現(xiàn)和鑒定的不適應(yīng)性。以至今使用最為普遍的XCMS方法為例:先對(duì)提取離子色譜進(jìn)行峰識(shí)別和峰過濾,再匹配不同樣本間的數(shù)據(jù),實(shí)現(xiàn)保留時(shí)間和m/z漂移的校正,最后對(duì)得到的峰表數(shù)據(jù)進(jìn)行質(zhì)量提高的處理。
      [0005]然而,高分辨質(zhì)譜數(shù)據(jù)由于不同峰形,噪聲和背景的影響,導(dǎo)致色譜方向的準(zhǔn)確峰識(shí)別異常困難,簡(jiǎn)單的峰平滑,加上一階或二階求導(dǎo)的方法并不能完全找到真實(shí)的色譜離子峰,從而導(dǎo)致最終結(jié)果的不準(zhǔn)確性。此外,傳統(tǒng)上峰匹配后的峰表是所有質(zhì)譜特征的大集合,存在大量一個(gè)小分子對(duì)應(yīng)多個(gè)裂解質(zhì)譜特征(m/z)的情形,從而產(chǎn)生一系列的不利后果,包括:1,增加分類建模方法的難度和復(fù)雜度,更多的質(zhì)譜特征導(dǎo)致更小的樣本-特征t匕,減少方法的適應(yīng)度;2,減少找到真正標(biāo)志物或有用特征的可能,因?yàn)榇罅抠|(zhì)譜特征的存在,實(shí)際上稀釋了真實(shí)的特征,并極有可能篩選到來自相同小分子的質(zhì)譜特征;3,特征間極大的共線性風(fēng)險(xiǎn),降低建模方法和結(jié)果的可用性。
      [0006]本發(fā)明的方法將峰識(shí)別分解為更易實(shí)現(xiàn)的二個(gè)步驟,即先基于用戶自定義的參數(shù)實(shí)現(xiàn)對(duì)質(zhì)譜峰的快速獲取,并在全局優(yōu)化的峰匹配后進(jìn)行有效峰融合,既降低對(duì)前期準(zhǔn)確峰識(shí)別的依賴,同時(shí)可獲得優(yōu)越的“一對(duì)一”峰表,具有更廣闊的適應(yīng)范圍和更佳的應(yīng)用效果。

      【發(fā)明內(nèi)容】

      [0007]本發(fā)明的目的在于提供一種新的高分辨質(zhì)譜數(shù)據(jù)處理方法,通過該方法可實(shí)現(xiàn)多個(gè)液-質(zhì)數(shù)據(jù)樣本的同時(shí)保留時(shí)間和m/z方向峰匹配,其最大特征在于減少對(duì)峰準(zhǔn)確識(shí)別的依賴,基于線性規(guī)劃的優(yōu)化方法,可實(shí)現(xiàn)全局的最優(yōu)峰匹配,同時(shí)對(duì)峰匹配后峰表的融合,可得到所謂的“一對(duì)一”峰表結(jié)果,更加有利于后續(xù)的數(shù)據(jù)處理和信息挖掘,比如代謝小分子標(biāo)志物的發(fā)現(xiàn)和鑒定。本方法適應(yīng)范圍廣,對(duì)于具有較大背景,低信噪比的復(fù)雜高分辨液-質(zhì)數(shù)據(jù)處理,同樣能得到較好的結(jié)果,具有良好的應(yīng)用前景。
      [0008]為了解決多樣本間復(fù)雜高分辨質(zhì)譜數(shù)據(jù)的同時(shí)保留時(shí)間和m/z校正問題,本發(fā)明通過用戶自定義的二個(gè)參數(shù),即質(zhì)譜響應(yīng)閾值或總的峰數(shù)目實(shí)現(xiàn)質(zhì)譜特征的初步識(shí)別,同時(shí)基于自動(dòng)背景扣除方法提高結(jié)果的準(zhǔn)確性。在此基礎(chǔ)上,采用線性規(guī)劃逆向思維的模式,校正待分析樣本與參考樣本間的保留時(shí)間和m/z漂移,最后對(duì)匹配后的峰表進(jìn)行峰融合,獲得每個(gè)小分子化合物對(duì)應(yīng)峰表中唯一質(zhì)譜特征的峰表,提高后續(xù)分析的準(zhǔn)確性,并減少對(duì)建模方法的依賴。峰識(shí)別、全局最優(yōu)的峰匹配和峰表融合都是優(yōu)于傳統(tǒng)方法的特點(diǎn),極大限度地保證質(zhì)譜數(shù)據(jù)處理結(jié)果。
      [0009]上述高分辨質(zhì)譜的峰識(shí)別,先完整讀取原始質(zhì)譜數(shù)據(jù)的XML文件,轉(zhuǎn)換XML文件中色譜方向各保留時(shí)間點(diǎn)的質(zhì)譜量測(cè)數(shù)據(jù)為不同m/z下對(duì)應(yīng)的提取離子色譜數(shù)據(jù),以非固定尺寸移動(dòng)窗口的方式,自動(dòng)扣除不同色譜窗口內(nèi)的數(shù)據(jù)背景。根據(jù)用戶自定義的質(zhì)譜響應(yīng)閾值或總的峰數(shù)目,提取符合要求的質(zhì)譜特征,記錄得到被分析樣本中質(zhì)譜特征的保留時(shí)間和m/z信息表。
      [0010]上述被分析樣本與參考樣本間的質(zhì)譜特征峰匹配,基于m/z和保留時(shí)間方向的同時(shí)移動(dòng)窗口劃分和線性規(guī)劃優(yōu)化峰匹配來達(dá)成。先以固定的窗口尺寸大小(比如0.0025)將m/z從大到小的整個(gè)范圍劃分為相同大小等份,找到被分析樣本和參考樣本在該窗口內(nèi)的所有質(zhì)譜特征,然后以固定窗口尺寸大小(比如30 S)將整個(gè)色譜流出內(nèi)的保留時(shí)間劃分為相等大小的窗口,計(jì)算被分析樣本與參考樣本在上述m/z和保留時(shí)間重疊窗口內(nèi)倆倆質(zhì)譜特征間的歐式距離。采用線性規(guī)劃逆向思維的模式,搜尋該距離矩陣起始點(diǎn)到結(jié)束點(diǎn)的最短距離,記錄該最短距離所經(jīng)過的被分析樣本和參考樣本路徑,得到二者間的質(zhì)譜特征匹配關(guān)系。最后抽提當(dāng)前m/z和保留時(shí)間窗口一半的交匯處的質(zhì)譜特征,構(gòu)成匹配后峰表的元素,以減少可能的錯(cuò)誤融合,并移動(dòng)m/z和保留時(shí)間窗口,循環(huán)上述過程直至所有的質(zhì)譜特征均被分析后為止,獲得峰匹配的初步峰表。
      [0011]上述峰表是同時(shí)校正m/z和保留時(shí)間漂移后得到的結(jié)果。為了消除該峰表中多個(gè)質(zhì)譜特征本質(zhì)上對(duì)應(yīng)同一小分子化合物的問題,針對(duì)上面得到的初步峰表,進(jìn)一步采用峰融合的方法,包括同位素離子剔除,加和離子、中性丟失和相關(guān)性分析等規(guī)則融合峰表中的離子特征。加和離子和中性丟失規(guī)則指的是如果某二個(gè)離子之間的高分辨質(zhì)譜m/z之差滿足已知的加和規(guī)則或中性丟失規(guī)則的離子質(zhì)量之差,則視該對(duì)離子應(yīng)由同一小分子化合物裂解產(chǎn)生,其主要原因在于高分辨質(zhì)譜的離子準(zhǔn)確質(zhì)量量測(cè)能力;相關(guān)分析則計(jì)算二個(gè)離子在不同樣本中的相關(guān)性,若達(dá)到用戶自定義的閾值大小,則視為它們來自同一小分子化合物,其原因在于如果二個(gè)離子是同一小分子的裂解產(chǎn)物,則其在不同樣本中出現(xiàn)的強(qiáng)度比值在理論上應(yīng)完全相等。最后將不同規(guī)則得到的離子進(jìn)一步融合在一起,即如果上述規(guī)則得到二個(gè)離子同時(shí)與某一離子融合,則所有這些離子都被融合在一起,以其中響應(yīng)最大的離子強(qiáng)度或者他們總和作為該小分子化合物的特征,并記錄所有這些被融合的離子,作為該化合物定性鑒定的依據(jù)。
      [0012]本發(fā)明與傳統(tǒng)的方法相比,優(yōu)越性明顯。首先本發(fā)明避開了色譜方向準(zhǔn)確峰識(shí)別的難點(diǎn),通過用戶自定義的響應(yīng)閾值或總的峰數(shù)目,以及自動(dòng)背景扣除的方法,實(shí)現(xiàn)了質(zhì)譜特征的快速獲取,減少了峰識(shí)別對(duì)信噪比的依賴;在此基礎(chǔ)上通過m/z和保留時(shí)間方向的同時(shí)窗口劃分,并采用線性規(guī)劃優(yōu)化,達(dá)到準(zhǔn)確的峰匹配;最后將得到的初步峰表進(jìn)行深層次峰融合,得到每個(gè)小分子化合物對(duì)應(yīng)唯一質(zhì)譜特征的最終峰表,融合結(jié)果可進(jìn)一步輔助提高化合物的定性鑒定能力。
      [0013]本發(fā)明的方法極大地降低了傳統(tǒng)方法對(duì)峰識(shí)別的依賴,具有更好的適應(yīng)性和應(yīng)用范圍,同時(shí)可達(dá)致全局最優(yōu)的方法提高峰匹配的準(zhǔn)確性,特別是峰融合方法獲得“一對(duì)一”的化合物與質(zhì)譜特征關(guān)系,使得該方法具有更好的應(yīng)用前景。
      【附圖說明】
      [0014]圖1為一段典型的提取離子色譜圖,即某一精確質(zhì)量數(shù)離子下所對(duì)應(yīng)的色譜,本例的離子質(zhì)荷比是268.2 ;
      圖2為多樣本液-質(zhì)數(shù)據(jù)峰匹配的原理圖和示例圖。(A),示意二個(gè)樣本1和2所對(duì)應(yīng)的LC-MS數(shù)據(jù);(B),圖(A)中樣本1和2中各三個(gè)典型離子a、b和c,以及a’、b’和c’的分布示意,峰匹配的目的在于將圖中屬于不同樣本的離子全局性最優(yōu)地找到各自的對(duì)應(yīng)關(guān)系;(C),圖(B)中各離子理想匹配后的結(jié)果;(D),二個(gè)實(shí)際樣本1和2的保留時(shí)間-m/z圖,準(zhǔn)確峰匹配需要同時(shí)全局性地校正圖中二個(gè)樣本各點(diǎn)的保留時(shí)間和m/z漂移;
      圖3為傳統(tǒng)方法和本發(fā)明方法的工作流程圖。(A),傳統(tǒng)方法從原始數(shù)據(jù)到最終峰表的簡(jiǎn)單流程圖,(B),本發(fā)明方法的簡(jiǎn)單工作流程圖,包括峰識(shí)別的參數(shù)定義與初步識(shí)別,峰匹配與峰表中質(zhì)譜特征的精細(xì)融合等;
      圖4為典型的高分辨質(zhì)譜特征峰與峰融合后的結(jié)果。(A),同一精確質(zhì)量離子下的相同化合物色譜峰在12個(gè)不同的樣本中的流出情形,
      當(dāng)前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1