国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于分層原子加和模型的分子酸堿解離常數(shù)的預(yù)測方法

      文檔序號:6572893閱讀:307來源:國知局

      專利名稱::基于分層原子加和模型的分子酸堿解離常數(shù)的預(yù)測方法
      技術(shù)領(lǐng)域
      :本發(fā)明涉及一種新型的基于分層的原子加和模型的分子酸堿解離常數(shù)預(yù)測方法,適用于根據(jù)化合物分子結(jié)構(gòu)信息對該化合物進(jìn)行虛擬體外高通量吸收、分布、代謝、排泄等(ADME)性質(zhì)的評價(jià)和篩選。
      背景技術(shù)
      :傳統(tǒng)的藥物設(shè)計(jì)往往首先關(guān)注化合物的活性(一般為體內(nèi)活性),然后才是化合物的藥代動力學(xué)特征(圖1)。但隨著活性化合物發(fā)現(xiàn)能力的不斷增強(qiáng)以及ADME研究的不斷深入,這種傳統(tǒng)的、效率低下的串行藥物開發(fā)流程已經(jīng)不能適應(yīng)現(xiàn)代的藥物開發(fā)需要。取而代之的更具效率的并行化藥物開發(fā)流程(圖1)。在并行化流程中,藥物的多種性質(zhì)同步優(yōu)化,這就可以大大加速藥物開發(fā)的效率。但是這種并行化流程在現(xiàn)在多數(shù)情況下仍是一個(gè)理論上的概念,主要原因是建立高通量藥代動力學(xué)篩選模型的難度較大。細(xì)胞層次的研究經(jīng)過多年的發(fā)展,已經(jīng)建立了一些高通量的體外ADME研究方法,比如測定腸吸收的細(xì)胞單層轉(zhuǎn)運(yùn)試驗(yàn)、基于肝細(xì)胞或提取肝微粒體的新陳代謝和藥物-藥物相互作用試驗(yàn)、基于肝細(xì)胞或其他組織細(xì)胞的生長抑制為指標(biāo)的細(xì)胞毒性試驗(yàn)等。但是到目前為止,高通量篩選還僅僅局限于少數(shù)幾種藥代動力學(xué)性質(zhì)。在試驗(yàn)實(shí)現(xiàn)高通量篩選存在困難的情況下,發(fā)展有效的藥代動力學(xué)特征理論預(yù)測及高通量虛擬篩選模型具有非常重要的意義。藥物分子的酸堿解離常數(shù)(pX)是顯著影響藥物生物利用度的性質(zhì)。任何藥物在起作用之前一般至少會通過被動擴(kuò)散或主動轉(zhuǎn)運(yùn)跨生物膜一次,根據(jù)給藥途徑和作用靶標(biāo)的位置差異,藥物介入的溶液環(huán)境會有明顯不同。對酸性或堿性藥物來說,分布和擴(kuò)散很大程度依賴于環(huán)境pH值下該藥物分子的解離程度。類似的,受解離程度影響的藥物分子的靜電性質(zhì)和氫鍵形成性能,藥物分子與結(jié)合位點(diǎn)或主動轉(zhuǎn)運(yùn)載體之間的親和性(結(jié)合自由能)也與環(huán)境pH值下的分子解離程度有很重要的關(guān)系。另外,辛醇/水分配系數(shù)(P,ZogP)是決定腸吸收和藥物可利用度的重要屬性之一。然而/ogP是指分子中性狀態(tài)下的脂水分配比例,對于酸或堿因?yàn)槠浞峙湟蕾囉谒嗟膒H值,必須考慮其解離狀態(tài)。這種pH依賴的分布系數(shù)(D,是P和pKa的函數(shù)。對于最簡單的一元酸來說<formula>formulaseeoriginaldocumentpage6</formula>在實(shí)際應(yīng)用中,/ogO是比ZogP更重要的評價(jià)指標(biāo),而其依賴于pK的計(jì)算。因此,piG是早期藥物設(shè)計(jì)和篩選,尤其是用于指導(dǎo)化合物定購和合成的一項(xiàng)重要ADME性質(zhì)相關(guān)指標(biāo)。到目前為止已經(jīng)有一些模型和方法可以對pKa提供不同精度的預(yù)測,這些模型基本可以分為以下三種1)量化模型;2)半經(jīng)驗(yàn)?zāi)P停?)基于化學(xué)信息學(xué)的模型。大部分經(jīng)驗(yàn)?zāi)P褪腔诰€性自由能關(guān)系的,即可用著名的Hammett和Taft方矛呈描述如下風(fēng)=風(fēng)°-^>(eq.2)風(fēng)=風(fēng)°-^'2>*(eq3)在給定溫度下,酸堿解離平衡的自由能變化遵循線性關(guān)系,插入一個(gè)取代基將會引起的自由能變化AG和相應(yīng)的p^變化。因此,對于指定分子的pKa可以通過已知分子的pKa。和量化與其相關(guān)的取代基效應(yīng)(如識別特征性碎片)來進(jìn)行預(yù)測?;谒槠姆椒ㄔ诙繕?gòu)效關(guān)系(QuantitativeStructure-ActivityRelationship,QSAR)研究中的重要性正在得到越來越廣泛得認(rèn)識,在許多商業(yè)程序中也使用基于碎片的方法進(jìn)行pK的預(yù)測,如PALLAS/PKALC(CowpwDragC/zem/sf7/Zi丄)和ACD/pKa-DB(AduflMcedC/zem/sfryDeudopmeMfJ打c.)。4旦是嗦口前文才是至U的,基于碎片方法的計(jì)算很大程度上取決于預(yù)先定義的碎片常數(shù)庫的大小,另外通常只能處理有公共結(jié)構(gòu)的同系物,擴(kuò)展性有限。根據(jù)某一基團(tuán)的解離程度取決于相鄰的原子和鍵所定義的子環(huán)境這一假設(shè),Xing等人提出了一種2D樹型分子指紋的方法進(jìn)行pKa預(yù)測。在該模型中,每個(gè)解離中心以一個(gè)由出現(xiàn)頻率和在解離中心周圍每個(gè)原子和基團(tuán)類型的位置所組成的計(jì)數(shù)矢量所表征。這種方法只定義了少數(shù)幾個(gè)簡單的基團(tuán),更類似于原子加和方法同種原子或基團(tuán)類型的貢獻(xiàn)才艮據(jù)其距離解離中心的不同而不同,從而避免了直接使用大量的預(yù)定義碎片值。但是,這種方法事實(shí)上并沒有降低模型復(fù)雜度,最終的取代基效應(yīng)也只考慮了距解離中心五個(gè)連接鍵的原子和碎片貢獻(xiàn),計(jì)算精度較差。Cherkasov等人提出一種非碎片3D方法量化取代基效應(yīng)來進(jìn)行piG預(yù)測。該方法的理論基礎(chǔ)主要來自于Taft方程(eq.3)和誘導(dǎo)效應(yīng)"通過空間傳遞"的假設(shè)。預(yù)定義參數(shù)不完全的問題通過釆用原子分類和"解離中心-其余部分"的思路進(jìn)行解決,提高了模型預(yù)測的可擴(kuò)展性。然而由于計(jì)算需要分子的3D結(jié)構(gòu)信息,而在模建過程中沒有考慮分子柔性和多重構(gòu)象問題,該模型仍有待進(jìn)一步改進(jìn)。新藥研發(fā)過程費(fèi)用昂貴、時(shí)間冗長、淘汰率高。平均一個(gè)新藥的研發(fā)需要花費(fèi)IO億美元以上,耗時(shí)約12年時(shí)間。大約有90%的候選藥物在臨床期間被淘汰,這是研發(fā)過程費(fèi)用昂貴的主要因素。候選藥物淘汰的原因中很大一部分是藥物動力學(xué)方面引起的,例如口服吸收性差,生物利用度低。傳統(tǒng)的新藥研發(fā)流程中,藥物動力學(xué)的研究處于研發(fā)的中后期。然而,如果在藥物研發(fā)的早期對藥物動力學(xué)進(jìn)行研究,以盡早淘汰藥代動力學(xué)參數(shù)不理想的候選藥物,可以大規(guī)模降低藥物研發(fā)成本,提高新藥發(fā)現(xiàn)效率。計(jì)算機(jī)模擬藥物動力學(xué)正在為全球各大制藥公司應(yīng)用,并將會在藥物的研發(fā)過程中起到越來越重要的作用。
      發(fā)明內(nèi)容本發(fā)明的目的主要是提供一種適合高通量篩選,同時(shí)預(yù)測準(zhǔn)確、適用范圍廣泛的有機(jī)分子酸堿解離常數(shù)評價(jià)方法。該目的主要是通過采用一種新型的基于分層原子加和模型和遺傳算法的參數(shù)估計(jì)方法,對現(xiàn)有分子結(jié)構(gòu)和相關(guān)piCa數(shù)據(jù)進(jìn)行訓(xùn)練而達(dá)到的。在本發(fā)明中,我們首先基于Hammett-Taft方程和Cherkasov等人提出的"解離中心-其余部分,,的處理取代基效應(yīng)的思路,建立一種分層的原子加和模型。其中任一原子對給定解離中心的電子效應(yīng)貢獻(xiàn)可以認(rèn)為是該原子的原子類型及其與解離中心的距離決定的。我們定義這種效應(yīng)貢獻(xiàn)為該原子的內(nèi)在電子效應(yīng)常^t(a)和其所處的位置的電子效應(yīng)傳遞性能(T)的函數(shù),風(fēng)=-pj>r)(eq.4)與Hammett-Taft方程相同,是參考化合物的解離常數(shù)值,是解離中心依賴的參數(shù),反映了不同解離中心對取代基效應(yīng)的敏感性差異。為了描述T,我們還需要建立一套分子結(jié)構(gòu)框架來表征原子所處的位置。這里,我們對每個(gè)分子都構(gòu)建了如圖2所示的以酸i咸解離中心為根的分子連接樹。分支的層數(shù)和原子編號分別記做/和/,則位置(z',/)表示處于第z'層的第/個(gè)原子。然后引入描述符K表示每個(gè)原子類型的電子效應(yīng)傳遞能力。根據(jù)電子效應(yīng)"通過鍵傳遞"的假設(shè)(鍵的連續(xù)極化),我們提出下面的電子效應(yīng)傳遞性公式用于T的計(jì)算《j=zri/"'",、*(eq.5)其中fc表示給定位置(/,/)到解離中心(根)的第it條通路,/表示通路上每個(gè)原子的層編號。這里我們認(rèn)為位置(/,/)的電子效應(yīng)貢獻(xiàn)是所有到根最短路徑的累積貢獻(xiàn),所以只考慮內(nèi)部(z'-2)層的原子。使用公式eq.5可以定量計(jì)算每個(gè)原子的電子效應(yīng)貢獻(xiàn)。因此,通過給傳統(tǒng)原子累加方法引入一個(gè)位置項(xiàng)T,我們可以將其用于pKa的計(jì)算。為了簡化模型,我們注意到參數(shù)p可以進(jìn)一步合并到傳遞項(xiàng)中。因?yàn)閭鬟f因子(y)才艮據(jù)原子類型而不同,而原子分類失見則又考慮到了周圍原子的類型,如果我們定義第一層的原子(直接與解離中心相連)具有不同的類型,反應(yīng)參數(shù)可以被隱式的包含在原子分類中。因此,p^的計(jì)算公式可以重寫為<formula>formulaseeoriginaldocumentpage10</formula>進(jìn)一步概括來說,本發(fā)明一種新型的基于分層的原子加和模型的分子酸堿解離常數(shù)預(yù)測方法包括如下步驟a)根據(jù)待測化合物的結(jié)構(gòu)確定分子的解離中心,并根據(jù)其類型確定其基準(zhǔn)解離常數(shù)pJG0,建立以解離中心為根的分子連接樹;b)根據(jù)分子中任一原子的類型和所處位置確定該原子的內(nèi)在電子效應(yīng)常數(shù)a和電子效應(yīng)傳遞性能y;c)根據(jù)下式計(jì)算該化合物的酸堿解離常數(shù)pK。<formula>formulaseeoriginaldocumentpage10</formula>其中,fc表示給定原子位置(f,/)到解離中心的第fc條通路,Z表示第Jt條通路上原子的層編號,給定原子位置(/,/)原子處于第Z'層的第7個(gè)原子,pKa為酸堿解離常數(shù),pK/為參考化合物解離常數(shù)。作為取樣標(biāo)準(zhǔn),選擇25°C,水溶液中測得1300個(gè)化合物的pK實(shí)驗(yàn)值,數(shù)據(jù)樣本來自于Lfl打^'so/C/zem/sfry,其中選取最常見的41種解離中心,其值由其對應(yīng)的最簡單的有機(jī)分子確定,如醇鞋基-OH的pK^取值為甲醇的pKa,并使用SMARTS格式描述該解離中心,由此構(gòu)建得到解離中心參數(shù)表,再根據(jù)待測化合物結(jié)構(gòu)與解離中心表對比即可確定基準(zhǔn)解離常數(shù)piG0。步驟b中內(nèi)在電子效應(yīng)常數(shù)參數(shù)表和電子效應(yīng)傳遞參數(shù)表可通過如下途徑得到對于每種原子類型定義引入兩個(gè)原子類型依賴的變量cj和y,分別表征該原子對解離中心的內(nèi)在電子效應(yīng)貢獻(xiàn)和電子效應(yīng)傳遞性能,然后用SMARTS對原子類型定義分類規(guī)則;使用可編程原子分類PATTY回溯算法完成原子類型指定,得到內(nèi)在電子效應(yīng)常數(shù)參數(shù)表和電子效應(yīng)傳遞參數(shù)表。本發(fā)明所述的分子酸堿解離常數(shù)預(yù)測方法中涉及的計(jì)算模型對應(yīng)作為算法依據(jù),可以使用〔++開發(fā)模塊化的分子酸堿解離常數(shù)預(yù)測程序。該程序可以自動識別常見的小分子文件格式,無需小分子的3D結(jié)構(gòu)信息,具有快速(~500個(gè)化合物/秒,P42.4G)、穩(wěn)定的特點(diǎn)。程序用。++完成,在多個(gè)平臺編譯測試通過,包括VisualC++7.0(windows),MIPSC++(SGI)、GCC(Linux)??梢钥焖?、準(zhǔn)確的預(yù)測有機(jī)分子的酸堿解離常數(shù)。本發(fā)明方法中每個(gè)預(yù)定義參數(shù)值使用基于遺傳算法(GA)的適應(yīng)性參數(shù)優(yōu)化進(jìn)行擬合。該模型不考慮小分子的三維信息,同時(shí)也無需進(jìn)行量化和分子機(jī)制等計(jì)算,可以快速準(zhǔn)確的預(yù)測有機(jī)小分子的pKfl值。既可以保持基團(tuán)加和方法數(shù)據(jù)擬合能力強(qiáng),模型物理意義強(qiáng)的特點(diǎn),同時(shí)可以較好的避免現(xiàn)有方法碎片類型預(yù)定義不足,擴(kuò)展性不強(qiáng)的問題該項(xiàng)技術(shù)適用于藥物研發(fā)早期階段預(yù)測尚未合成的化合物的ADME性質(zhì),輔助研究人員選擇那些ADME性質(zhì)較好的化合物進(jìn)行合成、藥理測試,并能指導(dǎo)臨床試驗(yàn)的設(shè)計(jì),從而大大減少人力、物力的浪費(fèi),降低藥物研發(fā)成本,提高藥物研發(fā)效率。圖1、傳統(tǒng)藥物研發(fā)和現(xiàn)代藥物研發(fā)流程的比較;圖2、以解離中心為根的氯苯胺分子連接樹的構(gòu)建;圖3、訓(xùn)練集分子piCa預(yù)測值與實(shí)驗(yàn)值的相關(guān)性散點(diǎn)圖4、測試集分子pKa預(yù)測值與實(shí)驗(yàn)值的相關(guān)性散點(diǎn)圖5、對包含22個(gè)上市藥物的基準(zhǔn)piG測試集的統(tǒng)計(jì)結(jié)果;具體實(shí)施例方式實(shí)施例1.參數(shù)表構(gòu)建最小二乘法是傳統(tǒng)基團(tuán)/原子加和模型最常用的擬合組成性參數(shù)的方法,但對于非線性模型,并不適合使用最小二乘方法進(jìn)行模建。已經(jīng)證實(shí)自適應(yīng)性優(yōu)化是一種有效的處理對不了解搜索空間(解空間)問題的方法。在本研究中,發(fā)明人使用遺傳算法進(jìn)行自適應(yīng)的參數(shù)估計(jì),具體步驟如下凄t4居沖羊本來自于Larue'sHfl打dboo/co/Gze附isfry。4乍為取才羊才示準(zhǔn),選擇25"C,水溶液中測得的p仏實(shí)驗(yàn)值共1300個(gè)化合物,涵蓋了廣泛的化學(xué)多樣性空間。其中選取最常見的41種解離中心,其pKaM直由其對應(yīng)的最簡單有機(jī)分子來確定,如醇羥基-OH的pKa。取值為甲醇的并使用SMARTS格式描述該解離中心,由此構(gòu)建得到表l。、表l、解離中心參數(shù)表。<table>tableseeoriginaldocumentpage13</column></row><table>#1][OH,Oh]B([OH,Oh])[$(0[#6])〗#l][#7A2+,n+,#7X3+]#1][$(C1C(=Q)CCCC1(-O))]#1][$([#7]1C(=0)N=NC1(=0》]#l][OH,Oh][PX4]([OH0,Oh0])(=O)([O-])#1][AsH2,Ash2,AsH,Ash]C(=0)#l][OH,Oh][$([PX4][#6])](=0)[Q-]#1][N+0][CX3](=O)[OH0]#1][OH,Oh][PX4]([N+0])(=O)[O-]#l][OH,Oh][AsX4](=O)[OH0-,Oh0-]#1][OX2h,6X2H]0[#6A2]=0#l][OH,Oh]C=CC=0#i]c(c(=o))c(=o)5.5硼酸—1(boric—acid—1)5.17硝基芳香烴—1(aromatic—nitro—1)5.26烯已二酮(cyclohexanedione)5.8三唑烷二酮(triazolidine—dione)6.31磷酸—2phosphoric—acid—27.68砷基醋酸—2(arsenoacetic一acid一2)7.74膦酸—2(phosphonic—acid—2)7.88氨基甲酸酯—2(carbamate一2)8.03氨基磷酸—2(phosphoramidic_acid—2)8.18月申酸—2(arsonic—acid一2)8.2peroxic—acid8.24二酮—1(dionej)8.3二酮2(dione2):#l][NH0+,NH+,Nh+,NH2+,Nh2+,NH3+,Nh3+,NH4+,Nh9.2charged—amine4+]#l][OH,Oh][N][CX2]=0#l][nH+0,nh+0]#l][OH,Oh][B][OH,Oh]9.4羥基乙酰胺(hydroxyacetamide)9.972硝基芳香烴_2(aromatic_nitro—2)10硼酸(boronicacid)33[#,+o](oo)c=o10二酰亞胺(imide)34同C[NX3+l](0)10.12硝基甲烷(Nitromethane)35[#l][NH2,Nh2]C#N10.27胺腈(cyanamide)36[#1][OH,Oh]B()[$(0[#6])]10.5硼酸—2(boric—acid一2)37[#l[SX2h,SX2H]10.7硫醇(thiol)38[#1[OX2h,OX2H[$(0[#6j)]11.5過氧化氫物(hydroperoxide)39[#l]ON=C13躬(oxime)40[#1][NH2,雨,NH1,Nh1]C=015,1酰胺(amide)5.54醇(alcohol)然后在這些數(shù)據(jù)中隨機(jī)抽取1029個(gè)作為測試集,剩余271個(gè)用作測試集。另外發(fā)明人還對文獻(xiàn)中常用的piG基準(zhǔn)測試集進(jìn)行了預(yù)測驗(yàn)證。對于這種對解搜索空間不確定的問題,發(fā)明人使用遺傳算法(GA)進(jìn)行自適應(yīng)的參數(shù)估計(jì),具體步驟如下1)、染色體編碼在該問題中一個(gè)染色體組代表待定的一組原子參數(shù)集。為了確保參數(shù)的取值具有物理意義,使用實(shí)數(shù)數(shù)組編碼的等位基因染色體,其中每個(gè)基因?qū)?yīng)一個(gè)原子參數(shù)(有預(yù)先設(shè)定可取值范圍的實(shí)數(shù))。2)、目標(biāo)函數(shù)GA的目標(biāo)函數(shù)決定了種群遺傳進(jìn)化的方向,在該問題中進(jìn)化的目標(biāo)是提高模型的數(shù)據(jù)擬合能力,如最大化回歸系數(shù)R2。實(shí)際應(yīng)用中我們發(fā)現(xiàn)使用下式可以加快收斂<formula>formulaseeoriginaldocumentpage16</formula>其中M代表訓(xùn)練集的樣本數(shù),m代表染色體長度。Y嚴(yán)d是使用公式(eq.7)和可能解對應(yīng)的原子參數(shù)值計(jì)算得到的預(yù)測pKa值。這樣,種群中每個(gè)染色體的適應(yīng)性使用公式eq.7進(jìn)行評價(jià),較高的/值代表了較好的數(shù)據(jù)擬合能力。3)、遺傳操作為了得到最優(yōu)解集,GA使用選擇、交叉和突變等操作完成進(jìn)化。選擇操作我們使用較常見的輪盤賭方法;交叉操作使用混合交叉~~_先根據(jù)父值的距離產(chǎn)生均勻分布,然后按此分布產(chǎn)生子值;產(chǎn)生的子值又經(jīng)過突變操作,這里我們使用高斯突變,即新值是基于當(dāng)前值的高斯分布進(jìn)行取值的。后兩種特殊目的的操作尤其適合實(shí)數(shù)解空間的搜索。經(jīng)基于遺傳算法的自適應(yīng)參數(shù)估計(jì)之后得到的內(nèi)在電子效應(yīng)常數(shù)和電子效應(yīng)傳遞參數(shù)(y)的參數(shù)估計(jì)結(jié)果如表2和表3所示。表2、內(nèi)在電子效應(yīng)常數(shù)((J)參數(shù)表。<table>tableseeoriginaldocumentpage16</column></row><table>5[$([CA3+0][#8,#16,NA3+0])]C3一0-1.963336[#6A2]C2X1.62149([#6A3,#1])([#6A3,#1])=[#6])]C2-1.522798[CAl+0]CI0.583519[c]CarX0.2536210,#1])]Car0.5320311[$([c][#8,#16,NA3+0])]Car—0-1.7688712[$(c,)]Car—N+1.2998313[$([#8A3]([#6A3,#1])[#6A3,#1])]Osp36.3794614[#8A2JOsp2X6.0583415[#7A2]N2X0.1428916[$([#7A2]([#6])([#6A3,#1])[#6A3,#1])]Npl0細(xì)7417[$([#7A2]C=0)]Nam-0,6206318[$([#7](=[#6])([#6A3,#1])[#6A3,#1])]N24.9468219罔Nl6.4507620[n]Nar-0.13272221[$(nlnaaal)]Nar5一Nar51.9339922[#7A2+]N2+3.3625223[$([#7](~[OXl]HOXl])]N026.8185124[$([#16](~[OXl]HOXl〗)]S023.7737925網(wǎng)F4.9742626[#17〗CI6.3894327[Br]Br6.9553828[I]I6.0952表3、電子效應(yīng)傳遞參數(shù)(y)參數(shù)表ID原子類型的SMARTS描述#6]原子類型名r$([CA3+0][F,Cl,Br,I,$(NHOX1〗)~[OX1])])]$([CA3+0][O,#16X2])]$([CA3+0][NA3!H0+])]$([CA3+0][$(C(=O)O),$(S(=O)=O),$(P(=O)=O)〗)]DuC3XC3XC3OC3N4$([CA3+0〗([NA3!H0+])[$(C(=O)O),$(S(=O)=O),$(P(=O)=O)])]Ca$([CA3+0][#7A3+0])]C一NH:#6A2]C2X$C2][#8])]C20$([#6]=網(wǎng))〗CX-O$([#6](=[#7+])[#7+0])〗$(,(=[,)[#7+])]c]CarX$(c(c)(c)[#6A3,#l])]Car$(cn)〗:$(clnaaaal)]Car6—Nar:$(clc[$(c[F,Cl,Br,I,C!A3,N+,$(N〖C,#7,#8,#16]=,#*)]),n〗cccl)]c6一7$(clcc[$(c[F,Cl,Br,I,C!A3,N+,$(N[C,#7,#8,#16]=,#*)]),n]ccl)]c6_8$(c1[$(c[F,Cl,Br,I,C!A3,N+,$(N[C,#7,#8,#16]=,#*)]),n]cccc1)]c6—6$(c(c)(c)[F,Cl,Br,I,#6!A3,N+,$(N[C,#7,#8,#16]=,#*)])]c6一50,08104510.4187540.3824630.4868010.557218C3COO0.5225170.6578921.591730.5033950.3201910.371078C(=N+)N1.95828C(=N+)N+0.5648050.6662770.468649Car5Nar0.7742630.5288460.6953650.5491210.564856200710047343.3說明書第15/18頁22[$(c(C)(c)[#8])]Car—030.40623923[$(c(c)(c)[#16X2])]Car—S30.8215424[$(c[NX4+])]Car5一N40.22338925[$(cl([NX4+])aaaaal)]Car6X一N40.79364926[$(c([n+]l)aaaal)]c6一l0.81398527[$(c([#1,#6A3])([n+]l)aaaal)]c6一20.78099628[$(c([F,CI,Br,I,C!A3,N+,$(N[C,#7,#8,#16]=,#*)])([n+]l)aaa[a〗l)〗c6一30細(xì)3229[$(c([#8,#16,$([#7]([#1,#6A3])[#1,#6A3])])([n+]1)aaa[a]1)]c6一40.60785430眼[n十]l)aaal)]c5一l1.0167131[$(c([n+]l)([F,Cl,Br,I,#6!A3,N+,$(N[C,#7,#8,#16]=,#*)])aaal)]c5一20.92317232[$(c([n+〗l)aa[a!c〗l)]c5—30.50560433[$(cS(~0)(~0)0)]Car一S031.0946334[$(cP(~0)(~0)0)]Car—P030.61799635[#6A1]ClL39卯336[#7]N30.3969837罔N20.68453238[$(N[#6,#7,#8]=,:,#*)〗NplX0.56909439[$([N](〖#6A3,#1])([#6A3,#1])[#6,#7,#8]=,:,#*)〗Npl0.88508740[n]n5—10.82936341[$(nlaaaaal);in6—10.6535542網(wǎng)Osp3X0.095705143[#8A21Osp2X0.10687544[#15]P0.26746145[#16〗S0.46864946[$([#16](~0)~0)]S020.508219對于訓(xùn)練集1029個(gè)化合物進(jìn)行統(tǒng)計(jì)分析,結(jié)果顯示本發(fā)明涉及的模型具有良好的統(tǒng)計(jì)學(xué)指標(biāo)(尺2=0.9534,S£=0.6504,圖3);同時(shí)對外部數(shù)據(jù)集(271個(gè)化合物)可以進(jìn)行準(zhǔn)確的預(yù)測(W-0.9331,S£=0.7416,圖4)。為了進(jìn)一步測試我們的模型對藥物分子pXW直的預(yù)測能力,發(fā)明人對經(jīng)常作為p^模型評價(jià)的一個(gè)基準(zhǔn)測試集進(jìn)行驗(yàn)證(由22個(gè)藥物分子組成,涵蓋多種酸堿類型),統(tǒng)計(jì)結(jié)果及化合物編號見表4,預(yù)測值與實(shí)-驗(yàn)值的相關(guān)性如圖5所示。表4.對22個(gè)藥物組成的測試集預(yù)測結(jié)果統(tǒng)計(jì)ID藥物名稱預(yù)測預(yù)測偏差1阿托品(Atropine)10.08759.90.187492氯霉素(Chloramphenicol)11.652911.030.622853氯漆漆(Chlorothiazide)8.940049.5-0.559964氯丙口秦(Chlorpromazine)9.917789.30.61778西咪替丁(Cimetidine)6.310286.8-0.489726地西泮(Diazepam)4.03933.30.73937地爾硫卓(Diltiazem)9.008688.910.098688苯海拉明(Diphenhydramine)9.4134590.413459丙p比胺(Disopyramide)10.467810.40.0677910氟芬那酸(Flufenamic_Acid)3.915873.90.0158711吹塞米(Furosemide)3.453513.9-0.4464912氟哌咬醇(Hal叩eridol)9.275888.30.97589<table>tableseeoriginaldocumentpage21</column></row><table>上表中藥物1~22在圖5中的數(shù)值點(diǎn)分布依次表示為O1~O22??梢钥闯?,對結(jié)構(gòu)多樣的藥物分子,我們提出的分層原子累加的模型能保持很好的預(yù)測效果(i2=0.9412,S£=0.5052),能夠應(yīng)用于pK。的計(jì)算。本發(fā)明中采用的分層原子累加的方法通過引入位置因子y使得電子效應(yīng)可以使用碎片加和貢獻(xiàn)的方法進(jìn)行計(jì)算,既保持了傳統(tǒng)基團(tuán)加和方法數(shù)據(jù)擬合能力強(qiáng),模型物理意義強(qiáng)的特點(diǎn),同時(shí)可以較好的避免現(xiàn)有方法碎片類型預(yù)定義不足,擴(kuò)展性不強(qiáng)的問題。該方法在藥物分子p^預(yù)測方面取得了良好的應(yīng)用。實(shí)施例2a、首先識別解離中心,使用基于子結(jié)構(gòu)匹配的方法查詢得到NH3+,對應(yīng)于表1中解離中心苯胺(ID:17),pKa。值為5.17。構(gòu)建如圖2所示分子連接樹,解離中心NH3+為第0層(/=0)。b、根據(jù)表2、3中定義的電子效應(yīng)常數(shù)(cr)表和電子效應(yīng)傳遞參數(shù)(y)表,使用基于子結(jié)構(gòu)匹配的方法查詢得到各層原子類型對應(yīng)的cr和)/<直。c、以計(jì)算第5層(/=5)原子對解離中心的電子效應(yīng)貢獻(xiàn),首先確定處于第5層的原子(共l個(gè),原子類型為氯,此處/=5,/=1);查表2得到該原子的電子效應(yīng)常數(shù)c75,產(chǎn)6.39(ID:26);該原子涉及兩條通路(AKl,2),通路上的各個(gè)原子查表3得到其傳遞參數(shù),如通路1U-l,圖2靠左的箭頭標(biāo)注)上的四個(gè)芳香碳(按所在層數(shù)標(biāo)記,〖=1,2,3,4)對應(yīng)的傳遞參數(shù)分別為k5,i,i,產(chǎn)0.22(ID:24),K5,i,i,2-0.55(ID:20),Ks,i,i,3=0.55(ID:20),ks,i,i,4=0.56(ID:21)。通路2上的電子效應(yīng)傳遞性計(jì)算同通路1,則氯原子對解離中心的的電子效應(yīng)貢獻(xiàn)可由下式計(jì)算得到24"5/5,l=^^2]II^,1"="5,1(K,1J,^,1,1,5,1,1,5,1,1,4+/5,l,2,1h,l,2,2;/5,1'2,5,1,2,4)fc=l(=1=6.39x(0.56x0.55x0.55x0.22+0.56x0.55x0.55x0.22)=0.49d、同理,計(jì)算其余各層原子的電子效應(yīng)貢獻(xiàn),利用分層加和模型公式eq.7計(jì)算最后的pKa值為4.14(實(shí)測值3.99)。權(quán)利要求1、一種基于分層的原子加和模型預(yù)測化合物分子酸堿解離常數(shù)的方法,其特征在于,包括如下步驟a)根據(jù)待測化合物的結(jié)構(gòu)確定分子的解離中心,并根據(jù)其類型確定其參考化合物解離常數(shù)pKa0,建立以解離中心為根的分子連接樹;b)根據(jù)分子中任一原子的類型和所處位置確定該原子的內(nèi)在電子效應(yīng)常數(shù)σ和電子效應(yīng)傳遞性能γ;c)根據(jù)下式計(jì)算該化合物的酸堿解離常數(shù)pKa其中,k表示給定原子位置(i,j)到解離中心的第k條通路,l表示第k條通路上原子的層編號,給定原子位置(i,j)表示原子處于第i層的第j個(gè)原子,pKa為酸堿解離常數(shù),pKa0為參考化合物解離常數(shù)。2、根據(jù)權(quán)利要求l所述的分子酸堿解離常數(shù)預(yù)測方法,其特征在于步驟a參考化合物解離常數(shù)p^。通過如下途徑確定作為取樣標(biāo)準(zhǔn),選擇25°C,水溶液中測得1300個(gè)化合物的pK實(shí)驗(yàn)值,數(shù)據(jù)樣本來自于L做ge'sH做^70oA:o/Gzem/sfr]/,其中選取最常見的41種解離中心,其pX/值由其對應(yīng)的最簡單的有機(jī)分子確定,并使用SMARTS格式描述該解離中心,由此構(gòu)建得到解離中心參數(shù)表,再根據(jù)待測化合物結(jié)構(gòu)與解離中心表對比即可確定參考化合物解離常數(shù)p0。3、根據(jù)權(quán)利要求l所述的分子酸堿解離常數(shù)預(yù)測方法,其特征在于上述步驟b中對于每種原子類型定義兩個(gè)變量CT和}/,分別表征該原子對解離中心的內(nèi)在電子效應(yīng)貢獻(xiàn)和電子效應(yīng)傳遞性能,進(jìn)行該原子對解離中心的內(nèi)在電子效應(yīng)貢獻(xiàn)和該原子的電子效應(yīng)傳遞性能計(jì)算,得到內(nèi)在電子效應(yīng)常數(shù)參數(shù)表和電子效應(yīng)傳遞參數(shù)表。4、根據(jù)權(quán)利要求l所述的分子酸堿解離常數(shù)預(yù)測方法,其特征在于上述步驟b中內(nèi)在電子效應(yīng)常數(shù)參數(shù)表和電子效應(yīng)傳遞參數(shù)表可通過如下途徑得到對于每種原子類型定義引入兩個(gè)原子類型依賴的變量(T和y,分別表征該原子對解離中心的內(nèi)在電子效應(yīng)貢獻(xiàn)和電子效應(yīng)傳遞性能,然后用SMARTS對原子類型定義分類規(guī)則;使用可編程原子分類PATTY回溯算法完成原子類型指定,得到內(nèi)在電子效應(yīng)常數(shù)參數(shù)表和電子效應(yīng)傳遞參數(shù)表。5、根據(jù)權(quán)利要求l所述的分子酸堿解離常數(shù)預(yù)測方法,其特征在于步驟c所用公式eq.6由如下方法得到1)首先基于Hammett-Taft方程和Cherkasov等人提出的"解離中心-其余部分"的處理取代基效應(yīng)的思路,建立一種分層的原子加和模型,得到<formula>formulaseeoriginaldocumentpage3</formula>(ep.4);其中/是解離中心依賴的參數(shù);2)為了描述丁,建立一套分子結(jié)構(gòu)框架來表征原子所處的位置;具體為首先對每個(gè)分子都構(gòu)建了以酸堿解離中心為根的分子連接樹,分支的層數(shù)和原子編號分別記做z'和j,則位置/)表示處于第z'層的第/個(gè)原子;然后引入描述符K表示每個(gè)原子類型的電子效應(yīng)傳遞能力;最后根據(jù)電子效應(yīng)"通過鍵傳遞"的假設(shè),得到如下電子效應(yīng)傳遞性公式用于T的計(jì)算<formula>formulaseeoriginaldocumentpage4</formula>其中(i,/')、A:、Z定義如權(quán)利要求l所述;3)由eq.4和eq.5合并得到eq.6/eve/s她附P£^yZ—l全文摘要本發(fā)明涉及一種全新的基于分層原子加和模型的有機(jī)小分子酸堿解離常數(shù)(pK<sub>a</sub>)的預(yù)測方法。基于在給定溫度下酸堿解離平衡的自由能變化的線性關(guān)系規(guī)律,該方法首先以Hammett-Taft方程和Cherkasov等人提出的“解離中心-其余部分”的處理取代基效應(yīng)建立一種分層的原子加和模型,然后通過該模型由化合物具體結(jié)構(gòu)計(jì)算相應(yīng)化合物的酸堿解離常數(shù)pK<sub>a</sub>值。該方法不存在常規(guī)方法涉及大量取代基電子效應(yīng)常數(shù)及校正因子的困難,同時(shí)保證了預(yù)測的快速、準(zhǔn)確,對多個(gè)樣本集表現(xiàn)出良好的數(shù)據(jù)擬合和預(yù)測能力,打破傳統(tǒng)的在新藥研發(fā)的早期對藥物pK<sub>a</sub>進(jìn)行研究,大規(guī)模降低了藥物研發(fā)成本,提高了新藥發(fā)現(xiàn)效率。文檔編號G06F19/00GK101419214SQ20071004734公開日2009年4月29日申請日期2007年10月23日優(yōu)先權(quán)日2007年10月23日發(fā)明者朱維良,羅小民,蔣華良,鄭明月,陳凱先申請人:中國科學(xué)院上海藥物研究所
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1