本技術(shù)涉及機(jī)器學(xué)習(xí)技術(shù)在疫苗設(shè)計(jì)中的使用。
背景技術(shù):
1、機(jī)器學(xué)習(xí)(ml)是對(duì)可以通過經(jīng)驗(yàn)和使用數(shù)據(jù)來自動(dòng)改進(jìn)的計(jì)算機(jī)算法的使用。它被視為人工智能的一部分。機(jī)器學(xué)習(xí)算法基于樣本數(shù)據(jù)(稱為訓(xùn)練數(shù)據(jù))構(gòu)建模型,以便在沒有明確編程的情況下進(jìn)行預(yù)測(cè)或決策。機(jī)器學(xué)習(xí)算法廣泛應(yīng)用于如醫(yī)學(xué)、電子郵件過濾、語音識(shí)別和計(jì)算機(jī)視覺等領(lǐng)域,在這些領(lǐng)域中,開發(fā)傳統(tǒng)算法來執(zhí)行所需的任務(wù)是困難或不可行的。
2、疫苗是一種生物制劑,其為特定傳染病提供獲得性免疫。疫苗典型地含有類似于致病微生物的物質(zhì),并且通常由弱化或殺傷形式的微生物、其毒素或其表面蛋白之一制成。該物質(zhì)刺激身體免疫系統(tǒng)將該物質(zhì)識(shí)別為威脅,破壞該物質(zhì),并且進(jìn)一步識(shí)別并破壞其將來可能遇到的與該物質(zhì)相關(guān)的任何微生物。疫苗可以是預(yù)防性的(以預(yù)防或改善天然或“野生”病原體的未來感染的影響)或治療性的(以對(duì)抗已經(jīng)發(fā)生的疾病,如癌癥)。一些疫苗提供了完全的滅菌免疫力,其中完全預(yù)防了感染。
技術(shù)實(shí)現(xiàn)思路
1、用于季節(jié)性流感疫苗的毒株目前且?guī)缀跗毡榈赜晒残l(wèi)生當(dāng)局選擇?;趯?duì)動(dòng)物模型和人類研究中免疫反應(yīng)的觀察,每年進(jìn)行這些選擇。然而,使用公共衛(wèi)生當(dāng)局推薦的毒株的h3n2疫苗例如在過去5年(2015-2020)中不足以在一般群體中引起廣泛的保護(hù)。此外,在此時(shí)間框架期間,公共數(shù)據(jù)顯示免疫相關(guān)性已分裂成不同的進(jìn)化枝,其中每個(gè)進(jìn)化枝對(duì)自身具有保護(hù)性,而對(duì)其他進(jìn)化枝的保護(hù)可能是有限的。本披露提供了這個(gè)問題的解決方案。本披露中描述的實(shí)施方式提供了一種算法,該算法將突變引入給定起始毒株中并使用可微機(jī)器學(xué)習(xí)方法,使得單獨(dú)的模型預(yù)測(cè)經(jīng)修飾的抗原將針對(duì)同源和異源進(jìn)化枝均具有高度保護(hù)性。在示例實(shí)驗(yàn)中,使用該算法來優(yōu)化h3血凝素的ha1序列(位置16至345),然后移植野生型信號(hào)肽和ha2區(qū)域以產(chǎn)生完整的血凝素序列。從a/新加坡/infimh-16-0019/2016開始的示例性經(jīng)修飾抗原序列提供有以粗體指示的突變殘基:
2、mktiialsyilclvfaqkipgndnstatlclghhavpngtivktitndriev
3、tnatelvqnssigeicdsphqildgenctlidallgdpqcdgfqnkkwdl
4、fverskaysncypydvpdyaslrslvassgtlefnnesfnwtgvtqngt
5、ssacirgssssffsrlnwlthlnytypalnvtmpnkeqfdklyiwgvhhp
6、gtdkdqislyarssgritvstkrsqqavipnigsrprirdipsrisiywtivk
7、pgdillinstgnliaprgyfkirsgkssimrsdapigkcksecitpngsipnd
8、kpfqnvnritygacpryvkhstlklatgmrnvpekqtrgifgaiagfien
9、gwegmvdgwygfrhqnsegrgqaadlkstqaaidqingklnrligktn
10、ekfhqiekefsevegrvqdlekyvedtkidlwsynaellvalenqhtidl
11、tdsemnklfektkkqlrenaedmgngcfkiyhkcdnacigsirnetydh
12、nvyrdealnnrfqikgvelksgykdwilwisfaiscfllcvallgfimwacqkgnircnici(seq?idno:1)
13、一臺(tái)或多臺(tái)計(jì)算機(jī)的系統(tǒng)可以被配置為通過安裝在系統(tǒng)上的軟件、固件、硬件或其組合來執(zhí)行特定操作或動(dòng)作,這些軟件、固件、硬件或其組合在操作時(shí)導(dǎo)致系統(tǒng)執(zhí)行這些動(dòng)作。一個(gè)或多個(gè)計(jì)算機(jī)程序可以被配置為通過包括指令來執(zhí)行特定操作或動(dòng)作,這些指令在由數(shù)據(jù)處理設(shè)備執(zhí)行時(shí)使該設(shè)備執(zhí)行這些動(dòng)作。一個(gè)一般方面包括一種用于通過使用連續(xù)數(shù)據(jù)算法制造疫苗的方法。該方法包括接收可以包括多個(gè)第一離散值的離散數(shù)據(jù)對(duì)象,該離散數(shù)據(jù)對(duì)象可以包括一種或多種氨基酸序列。該方法還包括將離散數(shù)據(jù)對(duì)象轉(zhuǎn)換為連續(xù)數(shù)據(jù)對(duì)象,該連續(xù)數(shù)據(jù)對(duì)象可以包括多個(gè)第一連續(xù)值。該方法還包括向連續(xù)數(shù)據(jù)對(duì)象應(yīng)用連續(xù)數(shù)據(jù)算法以生成可以包括多個(gè)第二連續(xù)值的連續(xù)結(jié)果對(duì)象。該方法還包括將該連續(xù)結(jié)果對(duì)象轉(zhuǎn)換為可以包括多個(gè)第二離散值的離散結(jié)果對(duì)象。該方法還包括制造疫苗,該疫苗可以包括可以包含以下各項(xiàng)的組中的至少一種:i)由離散結(jié)果對(duì)象定義的蛋白質(zhì),ii)能夠產(chǎn)生由離散結(jié)果對(duì)象定義的蛋白質(zhì)的核酸,和iii)能夠產(chǎn)生由離散結(jié)果對(duì)象定義的蛋白質(zhì)的遞送媒介物。此方面的其他實(shí)施例包括記錄在一個(gè)或多個(gè)計(jì)算機(jī)存儲(chǔ)裝置上的相應(yīng)計(jì)算機(jī)系統(tǒng)、設(shè)備和計(jì)算機(jī)程序,各自均被配置為執(zhí)行這些方法的動(dòng)作。
14、實(shí)施方式可以包括以下特征中的一個(gè)或多個(gè)。在該方法中,該一個(gè)或多個(gè)氨基酸序列可以包括:第一氨基酸序列和第二氨基酸序列,該第一氨基酸序列和該第二氨基酸序列中的每個(gè)包括相應(yīng)的單字母或相應(yīng)的字母串。將離散數(shù)據(jù)對(duì)象轉(zhuǎn)換為連續(xù)數(shù)據(jù)對(duì)象可以包括:針對(duì)每個(gè)第一離散值生成權(quán)重值的權(quán)重向量,每個(gè)權(quán)重值表示第一離散值代表特定氨基酸的可能性;針對(duì)每個(gè)權(quán)重向量的每個(gè)權(quán)重值生成屬性值的屬性向量,每個(gè)屬性值表示特定氨基酸的物理化學(xué)屬性;以及將權(quán)重向量和屬性向量組合以創(chuàng)建連續(xù)數(shù)據(jù)對(duì)象的第一連續(xù)值。每個(gè)權(quán)重向量具有二十個(gè)權(quán)重值,每個(gè)權(quán)重值對(duì)應(yīng)于二十個(gè)可能的氨基酸中的一個(gè)。將連續(xù)結(jié)果對(duì)象轉(zhuǎn)換為離散結(jié)果對(duì)象可以包括針對(duì)每個(gè)第二連續(xù)值確定相應(yīng)的單個(gè)氨基酸,其中該確定的單個(gè)氨基酸形成多個(gè)第二離散值。該方法可以進(jìn)一步包括:生成多個(gè)候選離散結(jié)果對(duì)象;以及從多個(gè)候選離散結(jié)果對(duì)象中排除指定未通過可制造性測(cè)試的氨基酸的至少一個(gè)離散結(jié)果對(duì)象。應(yīng)用連續(xù)數(shù)據(jù)算法以生成連續(xù)結(jié)果對(duì)象可以包括以基于多個(gè)損失標(biāo)準(zhǔn)確定損失值的損失函數(shù)應(yīng)用梯度下降,該損失函數(shù)可以包括:基于給定兩個(gè)氨基酸序列的免疫反應(yīng)的第一損失標(biāo)準(zhǔn);第二損失標(biāo)準(zhǔn),其修改在野生型序列的數(shù)據(jù)集中未找到的子序列或未預(yù)測(cè)為正確折疊的子序列的損失值;以及第三損失標(biāo)準(zhǔn),其對(duì)于每個(gè)權(quán)重向量基于第二連續(xù)值中的最大值修改損失值。疫苗針對(duì)的是可以包括以下各項(xiàng)的組中的一種:i)流感,ii)人鼻病毒,iii)hiv和iiiv)冠狀病毒病。描述的技術(shù)的實(shí)施方式可以包括計(jì)算機(jī)可訪問介質(zhì)上的硬件、方法或過程、或計(jì)算機(jī)軟件。
15、一個(gè)一般方面包括一種用于生成氨基酸序列的系統(tǒng),該系統(tǒng)可以包括計(jì)算機(jī)存儲(chǔ)器。該系統(tǒng)還包括一個(gè)或多個(gè)處理器。該系統(tǒng)還包括存儲(chǔ)指令的計(jì)算機(jī)存儲(chǔ)器,這些指令在由處理器執(zhí)行時(shí)使處理器執(zhí)行操作,這些操作可以包括:接收包含多個(gè)第一離散值的離散數(shù)據(jù)對(duì)象,該離散數(shù)據(jù)對(duì)象包含一個(gè)或多個(gè)氨基酸序列;將離散數(shù)據(jù)對(duì)象轉(zhuǎn)換為包含多個(gè)第一連續(xù)值的連續(xù)數(shù)據(jù)對(duì)象;將連續(xù)數(shù)據(jù)算法應(yīng)用于連續(xù)數(shù)據(jù)對(duì)象以生成包含多個(gè)第二連續(xù)值的連續(xù)結(jié)果對(duì)象;將連續(xù)結(jié)果對(duì)象轉(zhuǎn)換為包含多個(gè)第二離散值的離散結(jié)果對(duì)象;以及制造疫苗,該疫苗包含由以下各項(xiàng)組成的組中的至少一種:i)由離散結(jié)果對(duì)象定義的蛋白質(zhì),ii)能夠產(chǎn)生由離散結(jié)果對(duì)象定義的蛋白質(zhì)的核酸,和iii)能夠產(chǎn)生由離散結(jié)果對(duì)象定義的蛋白質(zhì)的遞送媒介物。此方面的其他實(shí)施例包括記錄在一個(gè)或多個(gè)計(jì)算機(jī)存儲(chǔ)裝置上的相應(yīng)計(jì)算機(jī)系統(tǒng)、設(shè)備和計(jì)算機(jī)程序,各自均被配置為執(zhí)行這些方法的動(dòng)作。
16、實(shí)施方式可以包括以下特征中的一個(gè)或多個(gè)。在該系統(tǒng)中,該一個(gè)或多個(gè)氨基酸序列可以包括:第一氨基酸序列和第二氨基酸序列,該第一氨基酸序列和該第二氨基酸序列中的每個(gè)包括相應(yīng)的單字母或相應(yīng)的字母串。將離散數(shù)據(jù)對(duì)象轉(zhuǎn)換為連續(xù)數(shù)據(jù)對(duì)象可以包括:針對(duì)每個(gè)第一離散值生成權(quán)重值的權(quán)重向量,每個(gè)權(quán)重值表示第一離散值代表特定氨基酸的可能性;針對(duì)每個(gè)權(quán)重向量的每個(gè)權(quán)重值生成屬性值的屬性向量,每個(gè)屬性值表示特定氨基酸的物理化學(xué)屬性;以及將權(quán)重向量和屬性向量組合以創(chuàng)建連續(xù)數(shù)據(jù)對(duì)象的第一連續(xù)值。每個(gè)權(quán)重向量具有二十個(gè)權(quán)重值,每個(gè)權(quán)重值對(duì)應(yīng)于二十個(gè)可能的氨基酸中的一個(gè)。將連續(xù)結(jié)果對(duì)象轉(zhuǎn)換為離散結(jié)果對(duì)象可以包括針對(duì)每個(gè)第二連續(xù)值確定相應(yīng)的單個(gè)氨基酸,其中該確定的單個(gè)氨基酸形成多個(gè)第二離散值。這些操作可以進(jìn)一步包括:生成多個(gè)候選離散結(jié)果對(duì)象;以及從多個(gè)候選離散結(jié)果對(duì)象中排除指定未通過可制造性測(cè)試的氨基酸的至少一個(gè)離散結(jié)果對(duì)象。應(yīng)用連續(xù)數(shù)據(jù)算法以生成連續(xù)結(jié)果對(duì)象可以包括以基于多個(gè)損失標(biāo)準(zhǔn)確定損失值的損失函數(shù)應(yīng)用梯度下降,該損失函數(shù)可以包括:基于給定兩個(gè)氨基酸序列的免疫反應(yīng)的第一損失標(biāo)準(zhǔn);第二損失標(biāo)準(zhǔn),其修改在野生型序列的數(shù)據(jù)集中未找到的子序列或未預(yù)測(cè)為正確折疊的子序列的損失值;以及第三損失標(biāo)準(zhǔn),其對(duì)于每個(gè)權(quán)重向量基于第二連續(xù)值中的最大值修改損失值。描述的技術(shù)的實(shí)施方式可以包括計(jì)算機(jī)可訪問介質(zhì)上的硬件、方法或過程、或計(jì)算機(jī)軟件。
17、一個(gè)一般方面包括一種存儲(chǔ)指令的非暫態(tài)計(jì)算機(jī)可讀介質(zhì),這些指令在由一個(gè)或多個(gè)處理器執(zhí)行時(shí)使一個(gè)或多個(gè)處理器執(zhí)行操作,這些操作可以包括:接收包含多個(gè)第一離散值的離散數(shù)據(jù)對(duì)象,該離散數(shù)據(jù)對(duì)象包含一個(gè)或多個(gè)氨基酸序列;將離散數(shù)據(jù)對(duì)象轉(zhuǎn)換為包含多個(gè)第一連續(xù)值的連續(xù)數(shù)據(jù)對(duì)象;將連續(xù)數(shù)據(jù)算法應(yīng)用于連續(xù)數(shù)據(jù)對(duì)象以生成包含多個(gè)第二連續(xù)值的連續(xù)結(jié)果對(duì)象;將連續(xù)結(jié)果對(duì)象轉(zhuǎn)換為包含多個(gè)第二離散值的離散結(jié)果對(duì)象;以及制造疫苗,該疫苗包含由以下各項(xiàng)組成的組中的至少一種:i)由離散結(jié)果對(duì)象定義的蛋白質(zhì),ii)能夠產(chǎn)生由離散結(jié)果對(duì)象定義的蛋白質(zhì)的核酸,和iii)能夠產(chǎn)生由離散結(jié)果對(duì)象定義的蛋白質(zhì)的遞送媒介物。此方面的其他實(shí)施例包括記錄在一個(gè)或多個(gè)計(jì)算機(jī)存儲(chǔ)裝置上的相應(yīng)計(jì)算機(jī)系統(tǒng)、設(shè)備和計(jì)算機(jī)程序,各自均被配置為執(zhí)行這些方法的動(dòng)作。
18、實(shí)施方式可以包括以下特征中的一個(gè)或多個(gè)。在介質(zhì)中,一個(gè)或多個(gè)氨基酸序列可以包括:第一氨基酸序列和第二氨基酸序列,該第一氨基酸序列和該第二氨基酸序列中的每個(gè)包括相應(yīng)的單字母或相應(yīng)的字母串。將離散數(shù)據(jù)對(duì)象轉(zhuǎn)換為連續(xù)數(shù)據(jù)對(duì)象可以包括:針對(duì)每個(gè)第一離散值生成權(quán)重值的權(quán)重向量,每個(gè)權(quán)重值表示第一離散值代表特定氨基酸的可能性;針對(duì)每個(gè)權(quán)重向量的每個(gè)權(quán)重值生成屬性值的屬性向量,每個(gè)屬性值表示特定氨基酸的物理化學(xué)屬性;以及將權(quán)重向量和屬性向量組合以創(chuàng)建連續(xù)數(shù)據(jù)對(duì)象的第一連續(xù)值。每個(gè)權(quán)重向量具有二十個(gè)權(quán)重值,每個(gè)權(quán)重值對(duì)應(yīng)于二十個(gè)可能的氨基酸中的一個(gè)。將連續(xù)結(jié)果對(duì)象轉(zhuǎn)換為離散結(jié)果對(duì)象可以包括針對(duì)每個(gè)第二連續(xù)值確定相應(yīng)的單個(gè)氨基酸,其中該確定的單個(gè)氨基酸形成多個(gè)第二離散值。描述的技術(shù)的實(shí)施方式可以包括計(jì)算機(jī)可訪問介質(zhì)上的硬件、方法或過程、或計(jì)算機(jī)軟件。
19、本文還披露了包含本文所述方法生成的任意多個(gè)氨基酸序列的疫苗組合物。
20、還披露了包含根據(jù)本文所述方法產(chǎn)生的一種或多種肽和/或蛋白質(zhì)的載體、融合蛋白和細(xì)胞。
21、本文還披露了引發(fā)受試者的免疫反應(yīng)的方法,這些方法包括施用本文所述的一種或多種分離的核酸、肽和/或蛋白質(zhì),從而引發(fā)受試者的免疫反應(yīng)。
22、在一個(gè)方面,本文披露了抑制病毒感染的方法,這些方法包括向受試者施用本文所述的一種或多種分離的核酸、肽和/或蛋白質(zhì)中的任一種,或施用包含本文所述的任何分離的核酸、肽和/或蛋白質(zhì)的任何疫苗。
23、本文還披露了使受試者對(duì)流感病毒免疫的方法,該方法包括向受試者施用免疫有效量的如本文所披露的疫苗組合物。本文還披露了用于在使受試者對(duì)病毒(例如,流感病毒)免疫的方法中使用的如本文所披露的疫苗組合物。本文還披露了用于制造用于在使受試者對(duì)病毒(例如,流感病毒)免疫的方法中使用的藥劑的如本文所披露的疫苗組合物。在某些實(shí)施例中,方法使受試者預(yù)防病毒感染(例如,流感病毒感染),并且在某些實(shí)施例中,方法引起受試者的保護(hù)性免疫反應(yīng)(例如,ha抗體反應(yīng)和/或na抗體反應(yīng))。在某些實(shí)施例中,受試者是人,并且在某些實(shí)施例中,將疫苗組合物肌內(nèi)、皮內(nèi)、皮下、靜脈內(nèi)或腹膜內(nèi)施用。
24、本披露的另一方面涉及一種減輕病毒感染(例如,流感病毒感染)的一種或多種癥狀的方法,該方法包括向受試者施用預(yù)防有效量的本文所披露的疫苗組合物。本文還披露了用于在減輕病毒感染(例如,流感病毒感染)的一種或多種癥狀的方法中使用的如本文所披露的疫苗組合物。本文還披露了用于制造用于在減輕感染(例如,流感病毒感染)的一種或多種癥狀的方法中使用的藥劑的如本文所披露的疫苗組合物。
25、在各種實(shí)施例中,本文所披露的方法和組合物治療或預(yù)防由季節(jié)性病毒株或大流行病毒株(例如,季節(jié)性流感毒株或大流行流感毒株)之一或兩者引起的疾病。
26、在本文所披露的方法的某些實(shí)施例中,其中該受試者是人,人的年齡為6個(gè)月或更大、小于18歲、至少6個(gè)月且小于18歲、至少18歲且小于65歲、至少6個(gè)月且小于5歲、至少5歲且小于65歲、至少60歲或至少65歲。例如,受試者的年齡為6個(gè)月、8個(gè)月、10個(gè)月、12個(gè)月、14個(gè)月、16個(gè)月、18個(gè)月、20個(gè)月、22個(gè)月、24個(gè)月、3歲、4歲、5歲、6歲、10歲、12歲、15歲、18歲、20歲、21歲、25歲、30歲、35歲、40歲、50歲、60歲、70歲、75歲、80歲、85歲或90歲。在某些實(shí)施例中,本文所披露的方法包括以2-6周的間隔(例如4周的間隔)向受試者施用兩劑量的疫苗組合物。
27、實(shí)施方式可以包括以下任何、所有特征,或不包括以下特征。
28、本披露中討論的實(shí)施方式可以提供以下優(yōu)點(diǎn)中的一個(gè)或多個(gè)。實(shí)施方式可以用于生成血凝素序列,這些序列有可能在接種疫苗后誘導(dǎo)廣泛的流感感染保護(hù)。值得注意的是,實(shí)施方式可以用于產(chǎn)生抗原,這些抗原對(duì)含有設(shè)計(jì)的血凝素序列的功能性流感病毒具有比預(yù)期更高的治愈率。這些抗原被認(rèn)為具有廣泛的保護(hù)作用,大于動(dòng)物模型中目前的護(hù)理標(biāo)準(zhǔn)抗原。實(shí)施方式可以用于生成廣泛保護(hù)性的血凝素蛋白,以用作流感疫苗抗原,或用于定義核酸序列、或任何其他遞送媒介物(包括病毒或細(xì)菌載體),其中,這種核酸或遞送媒介物產(chǎn)生用作流感疫苗抗原的蛋白質(zhì)。
29、通過將僅離散域數(shù)據(jù)(例如氨基酸序列)轉(zhuǎn)換為連續(xù)數(shù)據(jù)集,可以將為連續(xù)數(shù)據(jù)設(shè)計(jì)的算法用于離散數(shù)據(jù)。例如,現(xiàn)成的求解器、計(jì)算最大化器、分類器等可以應(yīng)用于氨基酸序列,而這些工具通常無法直接對(duì)氨基酸序列進(jìn)行操作。這可以有利地允許使用氨基酸序列和僅連續(xù)算法進(jìn)行疫苗開發(fā)。因此,可以使用機(jī)器學(xué)習(xí)預(yù)測(cè)器預(yù)測(cè)哺乳動(dòng)物對(duì)給定兩個(gè)蛋白質(zhì)序列的免疫反應(yīng)。例如,可以將比如梯度下降等算法用于以提高免疫反應(yīng)為目標(biāo)的蛋白質(zhì)序列,即使這種梯度下降通常不能對(duì)用于表示蛋白質(zhì)序列的這種離散數(shù)據(jù)進(jìn)行操作。梯度下降可以用于優(yōu)化候選蛋白質(zhì)的預(yù)測(cè)的免疫反應(yīng)、免疫原性和生物物理穩(wěn)定性。然后可以分析通過梯度下降生成的候選蛋白質(zhì)以確定其功效,例如作為針對(duì)由多種或快速進(jìn)化的致病株引起的疾病的疫苗的功效。
30、本披露中提供的技術(shù)的另一個(gè)優(yōu)點(diǎn)是,提高了為可以實(shí)際存在和被制造的蛋白質(zhì)生成蛋白質(zhì)序列數(shù)據(jù)的可能性。如將理解的是,可以描述由于幾何形狀、物理力等原因而無法存在的蛋白質(zhì)序列。本文件中描述的過程可以有利地僅限于已知可制造或預(yù)期可制造的過程。
31、其他特征、方面和潛在優(yōu)點(diǎn)將從隨附的描述和附圖中顯而易見。