国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于強(qiáng)化隱擴(kuò)散模型的共價(jià)藥物從頭設(shè)計(jì)方法及相關(guān)裝置

      文檔序號(hào):39608554發(fā)布日期:2024-10-11 13:17閱讀:21來源:國知局
      基于強(qiáng)化隱擴(kuò)散模型的共價(jià)藥物從頭設(shè)計(jì)方法及相關(guān)裝置

      本發(fā)明屬于藥物分子設(shè)計(jì),具體屬于一種基于強(qiáng)化隱擴(kuò)散模型的共價(jià)藥物從頭設(shè)計(jì)方法及相關(guān)裝置。


      背景技術(shù):

      1、傳統(tǒng)的藥物分子大多數(shù)為非共價(jià)藥物,它們與受體之間的作用力,通常為氫鍵、偶極作用等非共價(jià)的作用,與蛋白質(zhì)口袋是非持久性地結(jié)合。近年來所出現(xiàn)的計(jì)算機(jī)藥物設(shè)計(jì)方法多為對(duì)非共價(jià)藥物分子的設(shè)計(jì),它們的目標(biāo)是對(duì)給定的蛋白質(zhì)靶點(diǎn),設(shè)計(jì)出能與之結(jié)合的配體小分子;多種不同的深度生成模型如變分自編碼器、生成對(duì)抗網(wǎng)絡(luò)、流模型等等被用來生成分子smiles字符、分子圖或者分子三維構(gòu)象。這些方法旨在學(xué)習(xí)真實(shí)分子的分布并從該分布中采樣出新穎有效的化學(xué)分子,并可引入蛋白質(zhì)靶點(diǎn)信息作為條件生成與之有非共價(jià)結(jié)合能力的分子。

      2、相對(duì)非共價(jià)藥物,共價(jià)藥物則通過其中的親電基團(tuán),與受體上廣泛存在的親核基團(tuán),諸如巰基、羥基、氨基和咪唑基等發(fā)生親電親核反應(yīng),產(chǎn)生共價(jià)鍵,從而帶來非常高的效價(jià)與配體效率,產(chǎn)生更高效的抑制效果,延長藥效學(xué)作用。由于這種共價(jià)鍵連接持久抑制的特點(diǎn),共價(jià)藥物也常具有相對(duì)更高的毒性。藥物的安全性問題是藥物研發(fā)過程中失敗的重要原因之一。較低毒性的藥物分子在提高安全性的同時(shí)還可提供更為靈活的藥物劑量選擇。

      3、在現(xiàn)有非共價(jià)設(shè)計(jì)方法中有兩種技術(shù)方案,第一種方法pocket2mol通過蛋白質(zhì)口袋環(huán)境與配體分子中原子的空間位置來學(xué)習(xí)它們的分布,從而從該分布逐步采樣生成新的分子;第二種方法diffsbdd提出了一種自回歸的三維分子生成方法,通過在蛋白質(zhì)口袋的三維空間內(nèi)建模出原子的出現(xiàn)概率,自回歸地采樣原子來生成最終分子。兩種方法都是基于蛋白質(zhì)靶點(diǎn)來生成配體分子,而它們方法中算法的設(shè)計(jì)均無法設(shè)計(jì)共價(jià)藥物分子,也沒有充分考慮生成分子包含可合成性、毒性等在內(nèi)的分子性質(zhì)。

      4、綜上,現(xiàn)有的技術(shù)存在的局限性主要如下三點(diǎn):

      5、(1)目前方法大多面向非共價(jià)可逆結(jié)合的藥物分子的設(shè)計(jì),無法從頭設(shè)計(jì)與給定靶點(diǎn)共價(jià)結(jié)合的分子。

      6、(2)目前算法未充分考慮分子的可合成性、類藥性,導(dǎo)致生成出的分子不合理或者難以合成;

      7、(3)目前方法大多未將設(shè)計(jì)出的分子的安全性考慮在內(nèi),無法優(yōu)化設(shè)計(jì)出的分子的安全性。


      技術(shù)實(shí)現(xiàn)思路

      1、為了解決現(xiàn)有技術(shù)中存在的問題,本發(fā)明提供一種基于強(qiáng)化隱擴(kuò)散模型的共價(jià)藥物從頭設(shè)計(jì)方法及相關(guān)裝置,采用了一個(gè)隱擴(kuò)散模型的架構(gòu)來實(shí)現(xiàn)配體分子的設(shè)計(jì),生成能與給定蛋白質(zhì)靶點(diǎn)結(jié)合的具有所需性質(zhì)的共價(jià)藥物配體分子。

      2、為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種基于強(qiáng)化隱擴(kuò)散模型的共價(jià)藥物從頭設(shè)計(jì)方法,具體步驟如下:

      3、s1構(gòu)建共價(jià)藥物從頭設(shè)計(jì)網(wǎng)絡(luò)并進(jìn)行訓(xùn)練得到共價(jià)藥物從頭設(shè)計(jì)網(wǎng)絡(luò)模型;

      4、s2選定一個(gè)蛋白質(zhì)作為靶點(diǎn),從標(biāo)準(zhǔn)正態(tài)分布中采樣一個(gè)隱向量,將蛋白質(zhì)序列和隱向量輸入共價(jià)藥物從頭設(shè)計(jì)網(wǎng)絡(luò)模型得到與選定蛋白質(zhì)可以共價(jià)結(jié)合的藥物分子;

      5、所述共價(jià)藥物從頭設(shè)計(jì)網(wǎng)絡(luò)包括變分自編碼器、蛋白質(zhì)序列編碼器和隱擴(kuò)散模型,變分自編碼器用于將分子smiles編碼為隱向量和把隱向量解碼為藥物分子;蛋白質(zhì)序列編碼器用于將蛋白質(zhì)靶點(diǎn)信息進(jìn)行編碼,得到蛋白質(zhì)靶點(diǎn)序列編碼;

      6、隱擴(kuò)散模型包括向前擴(kuò)散模塊、噪聲預(yù)測網(wǎng)絡(luò)εθ和分類器模型,向前擴(kuò)散模塊用于逐步為隱向量加噪,噪聲預(yù)測網(wǎng)絡(luò)εθ用于將隱向量和蛋白質(zhì)靶點(diǎn)信息融合,并在分類器模型的引導(dǎo)下進(jìn)行反向去噪,預(yù)測得到與蛋白質(zhì)靶點(diǎn)共價(jià)結(jié)合的藥物分子的隱向量;

      7、利用毒性預(yù)測模型對(duì)得到的蛋白質(zhì)靶點(diǎn)共價(jià)結(jié)合的藥物分子進(jìn)行急性毒性的打分,根據(jù)打分結(jié)果更新隱擴(kuò)散模型,得到急性毒性低的與蛋白質(zhì)靶點(diǎn)共價(jià)結(jié)合的藥物分子。

      8、進(jìn)一步地,s1中,變分自編碼器包括將分子smiles編碼為隱向量的編碼器和把隱向量解碼為藥物分子的解碼器,編碼器與解碼器均使用多層門控循環(huán)單元來實(shí)現(xiàn)字符與連續(xù)隱向量之間的映射;編碼器采用gru最終狀態(tài)的輸出作為分子的連續(xù)隱向量表示;

      9、變分自編碼器的訓(xùn)練目標(biāo)為:原始分子與解碼出的分子之間的重構(gòu)誤差與限制隱空間分布的kl散度誤差的組合。

      10、進(jìn)一步地s1中,蛋白質(zhì)序列編碼器采用esm-2模型編碼靶點(diǎn)蛋白質(zhì)序列。

      11、進(jìn)一步地s1中,向前擴(kuò)散模塊在每個(gè)時(shí)間步按照噪聲策略β向隱向量中添加高斯噪聲,得到加噪后的隱向量,具體表示如下:

      12、

      13、其中,q(xt|xt-1)是前向加噪過程中的一步,即向t-1時(shí)刻的數(shù)據(jù)加噪為t時(shí)刻的數(shù)據(jù)。

      14、進(jìn)一步地,s1中,噪聲預(yù)測網(wǎng)絡(luò)具體為多頭自注意力機(jī)制的全連接神經(jīng)網(wǎng)絡(luò),利用多頭自注意力機(jī)制對(duì)加噪后的分子隱向量和蛋白質(zhì)靶點(diǎn)序列編碼進(jìn)行融合,融合后的向量數(shù)據(jù)輸入全連接神經(jīng)網(wǎng)絡(luò),在全連接神經(jīng)網(wǎng)絡(luò)中進(jìn)行噪聲預(yù)測,輸出對(duì)隱向量上所加噪聲的預(yù)測;

      15、訓(xùn)練目標(biāo)為最小化實(shí)際噪聲與預(yù)測噪聲之間的l2范數(shù)。

      16、進(jìn)一步地,s1中,所述分類器模型為二元分類器,用于對(duì)加噪隱向量是否具有相應(yīng)分子結(jié)構(gòu)進(jìn)行預(yù)測,并將預(yù)測結(jié)果作為梯度引導(dǎo)噪聲預(yù)測網(wǎng)絡(luò)生成與選定蛋白質(zhì)可以共價(jià)結(jié)合的藥物分子,訓(xùn)練目標(biāo)是最小化預(yù)測標(biāo)簽與真實(shí)標(biāo)簽y之間的二元交叉熵?fù)p失。

      17、進(jìn)一步地,s1中,采用基于隨機(jī)森林的回歸預(yù)測模型作為毒性預(yù)測模型,毒性預(yù)測模型接受分子smiles表示并給出該分子的急性毒性半數(shù)致死量的預(yù)測;毒性預(yù)測模型的輸入為分子訪問系統(tǒng)指紋,訓(xùn)練目標(biāo)為最小化毒性預(yù)測模型預(yù)測的半數(shù)致死量值與真實(shí)值之間的均方誤差。

      18、進(jìn)一步地,s1中,利用毒性預(yù)測模型對(duì)隱擴(kuò)散模型得到藥物分子進(jìn)行半數(shù)致死量的預(yù)測,并將該預(yù)測作為隱擴(kuò)散模型中噪聲預(yù)測網(wǎng)絡(luò)的一個(gè)采樣過程的t個(gè)時(shí)間步的反向過程中每一步的獎(jiǎng)勵(lì),在每一步中計(jì)算以該獎(jiǎng)勵(lì)為權(quán)重的梯度并累加為總獎(jiǎng)勵(lì)關(guān)于策略參數(shù)的梯度,利用該梯度對(duì)隱擴(kuò)散模型進(jìn)行更新,得到生成較低急性毒性的藥物分子的隱擴(kuò)散模型。

      19、本發(fā)明還提供一種基于強(qiáng)化隱擴(kuò)散模型的共價(jià)藥物從頭設(shè)計(jì)系統(tǒng),包括:

      20、網(wǎng)絡(luò)構(gòu)建模塊,用于構(gòu)建共價(jià)藥物從頭設(shè)計(jì)網(wǎng)絡(luò)并進(jìn)行訓(xùn)練得到共價(jià)藥物從頭設(shè)計(jì)網(wǎng)絡(luò)模型;

      21、共價(jià)藥物設(shè)計(jì)模塊,用于選定一個(gè)蛋白質(zhì)作為靶點(diǎn),從標(biāo)準(zhǔn)正態(tài)分布中采樣一個(gè)隱向量,將蛋白質(zhì)序列和隱向量輸入共價(jià)藥物從頭設(shè)計(jì)網(wǎng)絡(luò)模型得到與選定蛋白質(zhì)可以共價(jià)結(jié)合的藥物分子;

      22、所述共價(jià)藥物從頭設(shè)計(jì)網(wǎng)絡(luò)包括變分自編碼器、蛋白質(zhì)序列編碼器和隱擴(kuò)散模型,變分自編碼器用于將分子smiles編碼為隱向量和把隱向量解碼為藥物分子;蛋白質(zhì)序列編碼器用于將蛋白質(zhì)靶點(diǎn)信息進(jìn)行編碼,得到蛋白質(zhì)靶點(diǎn)序列編碼;

      23、隱擴(kuò)散模型包括向前擴(kuò)散模塊、噪聲預(yù)測網(wǎng)絡(luò)εθ和分類器模型,向前擴(kuò)散模塊用于逐步為隱向量加噪,噪聲預(yù)測網(wǎng)絡(luò)εθ用于將隱向量和蛋白質(zhì)靶點(diǎn)信息融合,并在分類器模型的引導(dǎo)下進(jìn)行反向去噪,預(yù)測得到與蛋白質(zhì)靶點(diǎn)共價(jià)結(jié)合的藥物分子的隱向量;

      24、利用毒性預(yù)測模型對(duì)得到的蛋白質(zhì)靶點(diǎn)共價(jià)結(jié)合的藥物分子進(jìn)行急性毒性的打分,根據(jù)打分結(jié)果更新隱擴(kuò)散模型,得到急性毒性低的與蛋白質(zhì)靶點(diǎn)共價(jià)結(jié)合的藥物分子。

      25、本發(fā)明還提供一種終端設(shè)備,包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器中并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述一種基于強(qiáng)化隱擴(kuò)散模型的共價(jià)藥物從頭設(shè)計(jì)方法的步驟。

      26、與現(xiàn)有技術(shù)相比,本發(fā)明至少具有以下有益效果:

      27、本發(fā)明提供一種基于強(qiáng)化隱擴(kuò)散模型的共價(jià)藥物從頭設(shè)計(jì)方法,通過共價(jià)藥物從頭設(shè)計(jì)網(wǎng)絡(luò)實(shí)現(xiàn)從頭設(shè)計(jì)與給定靶點(diǎn)共價(jià)結(jié)合的分子,其中隱擴(kuò)散模型能夠捕捉分子結(jié)構(gòu)的復(fù)雜性,而分類器則能夠精準(zhǔn)地識(shí)別并強(qiáng)化所需的子結(jié)構(gòu),利用隱擴(kuò)散模型進(jìn)行分子生成,通過分類器進(jìn)行梯度引導(dǎo)確保生成的分子具有所需的共價(jià)結(jié)合子結(jié)構(gòu),從而可以針對(duì)蛋白質(zhì)靶點(diǎn)從頭設(shè)計(jì)出具有與其共價(jià)結(jié)合能力的配體分子。本發(fā)明在噪聲預(yù)測網(wǎng)絡(luò)中引入多頭自注意力機(jī)制,融合分子隱向量和蛋白質(zhì)靶點(diǎn)序列編碼,學(xué)習(xí)蛋白質(zhì)靶點(diǎn)和分子隱向量之間的關(guān)系,有助于生成與給定靶點(diǎn)結(jié)合緊密的隱向量,進(jìn)而產(chǎn)生具有高親和力的配體分子。本發(fā)明結(jié)合強(qiáng)化學(xué)習(xí)中策略梯度,使用毒性預(yù)測模型的反饋?zhàn)鳛楠?jiǎng)勵(lì)來微調(diào)隱擴(kuò)散模型,使得生成的分子具有更低的急性毒性。

      28、本發(fā)明使用策略梯度方法來微調(diào)隱擴(kuò)散模型,通過計(jì)算以毒性預(yù)測得分為權(quán)重的梯度并累加為總獎(jiǎng)勵(lì)關(guān)于策略參數(shù)的梯度,從而更新隱擴(kuò)散模型,這種方法能夠直接針對(duì)目標(biāo)藥物性質(zhì)(如急性毒性)進(jìn)行優(yōu)化,使得模型生成的藥物分子更符合實(shí)際要求。

      29、本發(fā)明的共價(jià)藥物從頭設(shè)計(jì)方法利用隱擴(kuò)散模型能夠快速生成大量的潛在藥物分子,通過分類器和強(qiáng)化學(xué)習(xí)的雙重優(yōu)化,能夠快速篩選出具有優(yōu)良藥物性質(zhì)的分子,大大提高了藥物設(shè)計(jì)的準(zhǔn)確性,并且可以清晰地了解哪些分子結(jié)構(gòu)特征對(duì)于與特定蛋白質(zhì)靶點(diǎn)的結(jié)合以及藥物性質(zhì)是關(guān)鍵的,這有助于提高藥物設(shè)計(jì)的可解釋性和可靠性,綜上,在保證生成分子在與給定蛋白質(zhì)靶點(diǎn)具有優(yōu)良結(jié)合能力的同時(shí)保證其具有優(yōu)良的包括可合成性在內(nèi)的藥物性質(zhì),優(yōu)化生成的分子的急性毒性,提高安全性,拓寬設(shè)計(jì)出的藥物分子的劑量設(shè)計(jì)尺度,提升其被進(jìn)一步開發(fā)成為上市藥物的能力。

      當(dāng)前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1