国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種抗菌蛋白質(zhì)或多肽活性關(guān)系表征的方法

      文檔序號(hào):6367259閱讀:356來(lái)源:國(guó)知局
      專利名稱:一種抗菌蛋白質(zhì)或多肽活性關(guān)系表征的方法
      技術(shù)領(lǐng)域
      本發(fā)明氨基酸結(jié)構(gòu)表征領(lǐng)域。
      背景技術(shù)
      蛋白質(zhì)的諸多生物學(xué)功能與特定肽鏈的氨基酸排列順序亦有著十分密切的關(guān)系,因此研究肽的定量構(gòu)效 關(guān)系對(duì)于研究其在生物體內(nèi)的作用機(jī)理,以及肽類新藥的研究與開發(fā),同時(shí)對(duì)蛋白質(zhì)的結(jié)構(gòu)與功能研究都具有十分重要的意義。多肽具有高活性、高選擇性及副作用小等特點(diǎn),現(xiàn)已成為藥物研究熱點(diǎn)之一。非編碼氨基酸在自然界普遍存在,在藥物設(shè)計(jì)中對(duì)氨基酸結(jié)構(gòu)改造或多肽修飾起到重要作用。近年來(lái)隨著擬肽學(xué)的發(fā)展,已認(rèn)識(shí)到需要對(duì)含有非標(biāo)準(zhǔn)編碼氨基酸在內(nèi)的肽及其衍生物進(jìn)行定量構(gòu)效關(guān)系(QSAR)研究才能滿足相關(guān)學(xué)科領(lǐng)域發(fā)展要求。在QSAR研究中,普遍采用氨基酸殘基的參數(shù)定量描述多肽的化學(xué)結(jié)構(gòu)。目前已有理化性質(zhì)和量化計(jì)算描述子,這些描述子主要表征編碼氨基酸,由于非編碼氨基酸多樣性以及實(shí)驗(yàn)參數(shù)收集困難,使得對(duì)其發(fā)展一組高效的描述子體系變得極為艱難,因此該類研究報(bào)道很少。結(jié)構(gòu)拓?fù)涿枋鲎邮峭耆煌趥鹘y(tǒng)物理化學(xué)參數(shù)的結(jié)構(gòu)表征方法,它基于分子圖中拓?fù)洳蛔兞繉⒒衔镛D(zhuǎn)化為一組具數(shù)學(xué)抽象意義的特征參數(shù),從而在純理論層面上實(shí)現(xiàn)分子結(jié)構(gòu)表征,如Winer指數(shù)、Randic指數(shù)和Balaban指數(shù)等在QSAR研究中得到了廣泛地應(yīng)用。

      發(fā)明內(nèi)容
      本發(fā)明的目的是通過(guò)拓?fù)溆?jì)算得到一種新型氨基酸拓?fù)涿枋鲎邮噶浚軐?duì)任何天然及非天然氨基酸結(jié)構(gòu)進(jìn)行定量表征,進(jìn)而用于表征抗菌肽活性關(guān)系。本發(fā)明的上述目的是通過(guò)如下技術(shù)方案實(shí)現(xiàn)的一種抗菌蛋白質(zhì)或多肽活性關(guān)系表征方法,包括如下步驟
      1)選取氨基酸,使用描述子計(jì)算軟件對(duì)每個(gè)氨基酸生成拓?fù)涿枋鲎訁?shù);
      2)采用主成分分析(PCA)進(jìn)行變量位數(shù)壓縮提取,得到各種氨基酸的拓?fù)涿枋鲎邮?br> 量;
      3)對(duì)待表征活性關(guān)系的蛋白質(zhì)或多肽用拓?fù)涿枋鲎邮噶棵枋鲎舆M(jìn)行結(jié)構(gòu)表征;
      4)將步驟3得到的描述子變量用于GA-PLS或SMR-MLR建模分析。具體而言,步驟I是將166種氨基酸使用描述子計(jì)算軟件對(duì)每個(gè)氨基酸生成至少85個(gè)拓?fù)涿枋鲎訁?shù),其中優(yōu)選為85個(gè)拓?fù)涿枋鲎訁?shù)??刹捎玫挠?jì)算軟件包括Chem3D8. O、Codessa 2. 7 和 Dragon L I 等。在本發(fā)明中,采用的166種氨基酸來(lái)源于從多篇文獻(xiàn)。其中,1-20為20種編碼氨基酸,其余是非編碼氨基酸及人工修飾非蛋白氨基酸,如鳥氨酸、羥脯氨酸、高絲氨酸等。由于拓?fù)涿枋鲎颖碚鞣肿诱w結(jié)構(gòu)特征,不同描述子參數(shù)之間可能存在較大信息重疊,且直接使用85種參數(shù)來(lái)表征序列中單個(gè)氨基酸殘基將會(huì)導(dǎo)致造成實(shí)際應(yīng)用過(guò)于復(fù)雜、干擾因素太多等問(wèn)題。因此,在步驟2中,采用主成分分析(PCA)進(jìn)行變量維數(shù)壓縮提取。首先對(duì)原始變量矩陣I166x85進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化處理(autoscaling),在此基礎(chǔ)上運(yùn)用PCA得到了 6個(gè)顯著主成分,其分別解釋原始變量矩陣66. 35%,8. 23%,6. 63%,4. 84%,4. 601%和
      2.86%的方差,累積解釋方差為93. 52%。對(duì)于每個(gè)氨基酸所對(duì)應(yīng)的6個(gè)顯著主成分得分,它是由氨基酸85個(gè)原始變量值與每個(gè)主成分得分系數(shù)的乘積計(jì)算而來(lái),當(dāng)使用這6個(gè)主成分得分矢量來(lái)替代原始變量矩陣時(shí)僅損失6. 48%的信息。這里稱166種氨基酸6個(gè)顯著成分得分為氨基酸拓?fù)涿枋鲎邮噶縑STPV (principal component score Vector of Structuraland Topological Variables),其值參見(jiàn)表 I。表I 166種氨基酸名稱及拓?fù)涿枋鲎邮噶縑STPV
      權(quán)利要求
      1.一種抗菌蛋白質(zhì)或多肽的活性關(guān)系表征方法,包括如下步驟1)選取氨基酸,使用描述子計(jì)算軟件對(duì)每個(gè)氨基酸生成拓?fù)涿枋鲎訁?shù);2)采用主成分分析(PCA)進(jìn)行變量位數(shù)壓縮提取,得到各種氨基酸的拓?fù)涿枋鲎邮噶?3)對(duì)待表征活性關(guān)系的蛋白質(zhì)或多肽用拓?fù)涿枋鲎邮噶棵枋鲎舆M(jìn)行結(jié)構(gòu)表征;4)將步驟3得到的描述子變量用于GA-PLS或SMR-MLR建模分析。
      2.如權(quán)利要求1所述的方法,其中步驟1是將166種氨基酸使用描述子計(jì)算軟件對(duì)每 個(gè)氨基酸生成至少85個(gè)拓?fù)涿枋鲎訁?shù),優(yōu)選為85個(gè)拓?fù)涿枋鲎訁?shù)。
      3.如權(quán)利要求2所述的方法,其中所述描述子計(jì)算軟件包括Chem3D8. 0、Codessa 2.7 和 Dragon 1. 1 等。
      4.如權(quán)利要求2所述的方法,其中所述氨基酸為20種編碼氨基酸,其余是非編碼氨基 酸及人工修飾非蛋白氨基酸。
      5.如權(quán)利要求1-4任一項(xiàng)所述的方法,其中步驟2是指采用主成分分析(PCA)進(jìn)行變 量維數(shù)壓縮提取首先對(duì)原始變量矩陣石66X85進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化處理(autoscaling),在此 基礎(chǔ)上運(yùn)用PCA得到了 6個(gè)顯著主成分,其分別解釋原始變量矩陣66. 35%,8. 23%,6. 63%、 4. 84%,4. 601%和2. 86%的方差,累積解釋方差為93. 52% ;對(duì)于每個(gè)氨基酸所對(duì)應(yīng)的6個(gè)顯 著主成分得分,它是由氨基酸85個(gè)原始變量值與每個(gè)主成分得分系數(shù)的乘積計(jì)算而來(lái),即 為氨基酸拓?fù)涿枋鲎邮噶俊?br> 6.如權(quán)利要求1-5任一項(xiàng)所述的方法,其中在步驟3中,當(dāng)使用拓?fù)涿枋鲎邮噶繉?duì)蛋 白質(zhì)或多肽類似序列進(jìn)行表征時(shí),所包含全部氨基酸殘基依次由相應(yīng)拓?fù)涿枋鲎邮噶克?表,對(duì)具有《個(gè)氨基酸殘基的序列,共可用6X/7個(gè)拓?fù)涿枋鲎邮噶看?lián)表征。
      7.如權(quán)利要求1-6任一項(xiàng)所述的方法,其中步驟3所述的多肽為陽(yáng)離子抗菌肽或牛乳 鐵蛋白水解妝。
      8.如權(quán)利要求1-7任一項(xiàng)所述的方法,其中步驟4中所述的建模分析是指對(duì)步驟3得 到的拓?fù)涿枋鲎邮噶糠治觯╝.用遺傳算法-偏最小二乘方法或逐步回歸方法挑選與 抗菌活性密切相關(guān)的結(jié)構(gòu)特征;b.用偏最小二乘法或多元回歸法建立抗菌肽定量構(gòu)效關(guān) 系分析模型。
      9.如權(quán)利要求1-8任一項(xiàng)所述的方法在抗菌蛋白質(zhì)或多肽活性關(guān)系表征中的應(yīng)用。
      10.如權(quán)利要求1-8任一項(xiàng)所述的方法在蛋白質(zhì)或多肽活性改性修飾中的應(yīng)用。
      全文摘要
      本發(fā)明公開了一種抗菌蛋白質(zhì)或多肽活性關(guān)系表征的方法,從表征分子的85個(gè)結(jié)構(gòu)參量和拓?fù)渲笖?shù)出發(fā),經(jīng)主成分分析(PCA)得到一種包含166個(gè)氨基酸體系的特征描述子:氨基酸拓?fù)浣Y(jié)構(gòu)信息矢量(VSTPV).將其應(yīng)用于101個(gè)陽(yáng)離子抗菌肽和28個(gè)牛乳鐵蛋白水解肽(BPPs))的定量構(gòu)效關(guān)系(QSAR)研究,均有較好的擬合和預(yù)測(cè)能力,交叉驗(yàn)證相關(guān)系數(shù)和相關(guān)系數(shù)都在0.70以上。研究表明氨基酸殘基拓?fù)浣Y(jié)構(gòu)信息矢量VSTPV能很好的表征編碼與非編碼氨基酸并能建立預(yù)測(cè)能力較強(qiáng)的多肽及其衍生物QSAR模型。
      文檔編號(hào)G06F19/24GK102663271SQ201210139079
      公開日2012年9月12日 申請(qǐng)日期2012年5月8日 優(yōu)先權(quán)日2012年5月8日
      發(fā)明者張?jiān)迫? 林治華, 舒茂, 路亞闊 申請(qǐng)人:重慶理工大學(xué)
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1