1.一種系統(tǒng),其包括:
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述蛋白質(zhì)設(shè)計計算模型包括經(jīng)訓(xùn)練以生成所述第二殘基序列的機(jī)器學(xué)習(xí)模型。
3.根據(jù)權(quán)利要求2所述的系統(tǒng),其中所述機(jī)器學(xué)習(xí)模型借由至少對通過訓(xùn)練所學(xué)習(xí)的數(shù)據(jù)分布進(jìn)行采樣來生成所述第二殘基序列。
4.根據(jù)權(quán)利要求3所述的系統(tǒng),其中對所述數(shù)據(jù)分布的所述采樣包括借由修飾所述第一可調(diào)整區(qū)段來生成經(jīng)破壞的序列,
5.根據(jù)權(quán)利要求4所述的系統(tǒng),其中所述經(jīng)破壞的序列是在不修飾包括在所述第一殘基序列中的所述第一固定區(qū)段的情況下生成的。
6.根據(jù)權(quán)利要求4至5中任一項所述的系統(tǒng),其中所述第二殘基序列包括所述第一固定區(qū)段。
7.根據(jù)權(quán)利要求4至6中任一項所述的系統(tǒng),其中至少基于標(biāo)識所述中間序列內(nèi)的所述第一固定區(qū)段的索引圖來生成所述中間序列的所述解碼。
8.根據(jù)權(quán)利要求4至7中任一項所述的系統(tǒng),其中所述中間序列的所述解碼包括針對所述中間序列內(nèi)的每個位置,跨越可能的氨基酸殘基的詞匯表確定概率分布。
9.根據(jù)權(quán)利要求8所述的系統(tǒng),其中借由應(yīng)用自回歸建模、非自回歸建模和條件隨機(jī)場中的一者或多者來確定所述概率分布。
10.根據(jù)權(quán)利要求3至9中任一項所述的系統(tǒng),其中所述操作進(jìn)一步包括:
11.根據(jù)權(quán)利要求10所述的系統(tǒng),其中對所述數(shù)據(jù)分布的所述采樣包括借由修飾所述第一可調(diào)整區(qū)段來生成所述經(jīng)破壞的序列,其中所述經(jīng)破壞的序列包括經(jīng)修飾的第一可調(diào)整區(qū)段、所述第一固定區(qū)段和所述第二固定區(qū)段;
12.根據(jù)權(quán)利要求1至11中任一項所述的系統(tǒng),其中所述第一殘基序列的第一長度與所述第二殘基序列的第二長度之間的差異借由至少改變所述第一可調(diào)整區(qū)段的第一長度和/或改變第二可調(diào)整區(qū)段的第二長度而分布于所述第一可調(diào)整區(qū)段和所述第二可調(diào)整區(qū)段。
13.根據(jù)權(quán)利要求12所述的系統(tǒng),其中所述第一殘基序列的所述第一長度與所述第二殘基序列的所述第二長度之間的所述差異基于所述第一殘基序列與所述第二殘基序列之間的可能長度差異的概率分布來確定。
14.根據(jù)權(quán)利要求12至13中任一項所述的系統(tǒng),其中所述第一殘基序列的所述第一長度與所述第二殘基序列的所述第二長度之間的所述差異與所述第一可調(diào)整區(qū)段的所述第一長度和所述第二可調(diào)整區(qū)段的所述第二長度成比例地分布。
15.根據(jù)權(quán)利要求12至14中任一項所述的系統(tǒng),其中所述第一殘基序列的所述第一長度與所述第二殘基序列的所述第二長度之間的所述差異隨機(jī)分布于所述第一可調(diào)整區(qū)段和所述第二可調(diào)整區(qū)段。
16.根據(jù)權(quán)利要求12至15中任一項所述的系統(tǒng),其中所述第一殘基序列的所述第一長度與所述第二殘基序列的所述第二長度之間的所述差異分布至所述第一可調(diào)整區(qū)段而不是所述第二可調(diào)整區(qū)段,使得第二可調(diào)整第二區(qū)段的第二長度被保留。
17.根據(jù)權(quán)利要求12至16中任一項所述的系統(tǒng),其中所述第一殘基序列的所述第一長度與所述第二殘基序列的所述第二長度之間的所述差異是借由將不大于最大長度變化且/或不小于最小長度變化應(yīng)用于所述第一可調(diào)整區(qū)段的所述第一長度和所述第二可調(diào)整區(qū)段的所述第二長度中的至少一者來分布的。
18.根據(jù)權(quán)利要求1至17中任一項所述的系統(tǒng),其中所述第一殘基序列包含抗體,并且其中第一區(qū)段包含所述抗體的互補(bǔ)決定區(qū)(cdr)或所述抗體的非互補(bǔ)決定區(qū)。
19.根據(jù)權(quán)利要求18所述的系統(tǒng),其中所述蛋白質(zhì)設(shè)計計算模型的輸入包括一個或多個標(biāo)識符,以使得能夠在所述第一序列的對應(yīng)于所述抗體的重鏈的第一部分與所述第一序列的對應(yīng)于所述抗體的輕鏈的第二部分之間進(jìn)行區(qū)分。
20.根據(jù)權(quán)利要求19所述的系統(tǒng),其中所述蛋白質(zhì)設(shè)計計算模型的所述輸入進(jìn)一步包括所述一個或多個標(biāo)識符,以使得能夠在所述第一序列的對應(yīng)于所述抗體的所述重鏈的所述第一部分、所述第一序列的對應(yīng)于所述抗體的所述輕鏈的所述第二部分與所述第一序列的對應(yīng)于對所述抗體具有已知結(jié)合親和力的抗原的第三部分之間進(jìn)行區(qū)分。
21.根據(jù)權(quán)利要求20所述的系統(tǒng),其中所述第一序列的所述第三部分包含固定區(qū)段和/或可調(diào)整區(qū)段。
22.根據(jù)權(quán)利要求19至21中任一項所述的系統(tǒng),其中所述蛋白質(zhì)設(shè)計計算模型基于所述一個或多個標(biāo)識符生成所述第二殘基序列,使得包括在所述第二殘基序列中的所述第一固定區(qū)段存在于與所述第一殘基序列相同的鏈中。
23.根據(jù)權(quán)利要求19至22中任一項所述的系統(tǒng),其中所述一個或多個標(biāo)識符包括在所述第一序列的對應(yīng)于所述抗體的所述重鏈的所述第一部分與所述第一序列的對應(yīng)于所述抗體的所述輕鏈的第二部分之間的標(biāo)記。
24.根據(jù)權(quán)利要求19至23中任一項所述的系統(tǒng),其中所述一個或多個標(biāo)識符包括標(biāo)識所述抗體的所述重鏈中每個殘基的第一標(biāo)簽和標(biāo)識所述抗體的所述輕鏈中每個殘基的第二標(biāo)簽。
25.根據(jù)權(quán)利要求1至24中任一項所述的系統(tǒng),其中所述破壞包括以下中的至少一者:將殘基插入到所述第一可調(diào)整區(qū)段中,使殘基從所述第一可調(diào)整區(qū)段中缺失,以及修飾存在于所述第一可調(diào)整區(qū)段中的殘基。
26.根據(jù)權(quán)利要求1至25中任一項所述的系統(tǒng),其中所述數(shù)據(jù)分布與對應(yīng)于多個已知蛋白質(zhì)序列的數(shù)據(jù)的降維表示相對應(yīng),并且其中所述多個殘基序列的至少一部分與一種或多種已知功能相關(guān)聯(lián)。
27.根據(jù)權(quán)利要求1至26中任一項所述的系統(tǒng),其中所述蛋白質(zhì)設(shè)計計算模型包括自編碼器。
28.根據(jù)權(quán)利要求1至27中任一項所述的系統(tǒng),其中所述蛋白質(zhì)設(shè)計計算模型包括去噪自編碼器(dae)。
29.根據(jù)權(quán)利要求1至28中任一項所述的系統(tǒng),其中至少基于所述第一固定區(qū)段與所述期望的特性相關(guān)聯(lián)來確定所述第一固定區(qū)段。
30.根據(jù)權(quán)利要求1至29中任一項所述的系統(tǒng),其中所述操作進(jìn)一步包括:
31.根據(jù)權(quán)利要求1至30中任一項所述的系統(tǒng),其中所述操作進(jìn)一步包括:
32.根據(jù)權(quán)利要求31所述的系統(tǒng),其中所述第一殘基序列的所述固定長度表示借由至少以下來生成:
33.根據(jù)權(quán)利要求32所述的系統(tǒng),其中輸入序列的所述固定長度表示在每個整數(shù)位置處包括間隙字符,其中所述第一殘基序列未能在所述整數(shù)位置處包括對應(yīng)的殘基。
34.一種計算機(jī)實現(xiàn)方法,其包括:
35.根據(jù)權(quán)利要求34所述的方法,其中所述蛋白質(zhì)設(shè)計計算模型包括經(jīng)訓(xùn)練以生成所述第二殘基序列的機(jī)器學(xué)習(xí)模型。
36.根據(jù)權(quán)利要求35所述的方法,其中所述機(jī)器學(xué)習(xí)模型借由至少對通過訓(xùn)練所學(xué)習(xí)的數(shù)據(jù)分布進(jìn)行采樣來生成所述第二殘基序列。
37.根據(jù)權(quán)利要求36所述的方法,其中對所述數(shù)據(jù)分布的所述采樣包括借由修飾所述第一可調(diào)整區(qū)段來生成經(jīng)破壞的序列,
38.根據(jù)權(quán)利要求37所述的方法,其中所述經(jīng)破壞的序列是在不修飾包括在所述第一殘基序列中的所述第一固定區(qū)段的情況下生成的。
39.根據(jù)權(quán)利要求37至38中任一項所述的方法,其中所述第二殘基序列包括所述第一固定區(qū)段。
40.根據(jù)權(quán)利要求37至39中任一項所述的方法,其中至少基于標(biāo)識所述中間序列內(nèi)的所述第一固定區(qū)段的索引圖來生成所述中間序列的所述解碼。
41.根據(jù)權(quán)利要求37至40中任一項所述的方法,其中所述中間序列的所述解碼包括針對所述中間序列內(nèi)的每個位置,跨越可能的氨基酸殘基的詞匯表確定概率分布。
42.根據(jù)權(quán)利要求41所述的方法,其中借由應(yīng)用自回歸建模、非自回歸建模和條件隨機(jī)場中的一者或多者來確定所述概率分布。
43.根據(jù)權(quán)利要求36至42中任一項所述的方法,其進(jìn)一步包括:
44.根據(jù)權(quán)利要求43所述的方法,其中對所述數(shù)據(jù)分布的所述采樣包括借由修飾所述第一可調(diào)整區(qū)段來生成所述經(jīng)破壞的序列,其中所述經(jīng)破壞的序列包括經(jīng)修飾的第一可調(diào)整區(qū)段、所述第一固定區(qū)段和所述第二固定區(qū)段;
45.根據(jù)權(quán)利要求34至44中任一項所述的方法,其中所述第一殘基序列的第一長度與所述第二殘基序列的第二長度之間的差異借由至少改變所述第一可調(diào)整區(qū)段的第一長度和/或改變第二可調(diào)整區(qū)段的第二長度而分布于所述第一可調(diào)整區(qū)段和所述第二可調(diào)整區(qū)段。
46.根據(jù)權(quán)利要求45所述的方法,其中所述第一殘基序列的第一長度與所述第二殘基序列的第二長度之間的所述差異基于所述第一殘基序列與所述第二殘基序列之間的可能長度差異的概率分布來確定。
47.根據(jù)權(quán)利要求45至46中任一項所述的方法,其中所述第一殘基序列的所述第一長度與所述第二殘基序列的所述第二長度之間的所述差異與所述第一可調(diào)整區(qū)段的所述第一長度和所述第二可調(diào)整區(qū)段的所述第二長度成比例地分布。
48.根據(jù)權(quán)利要求45至47中任一項所述的方法,其中所述第一殘基序列的所述第一長度與所述第二殘基序列的所述第二長度之間的所述差異隨機(jī)分布于所述第一可調(diào)整區(qū)段和所述第二可調(diào)整區(qū)段。
49.根據(jù)權(quán)利要求45至48中任一項所述的方法,其中所述第一殘基序列的所述第一長度與所述第二殘基序列的所述第二長度之間的所述差異分布至所述第一可調(diào)整區(qū)段而不是所述第二可調(diào)整區(qū)段,使得第二可調(diào)整第二區(qū)段的第二長度被保留。
50.根據(jù)權(quán)利要求45至49中任一項所述的方法,其中所述第一殘基序列的所述第一長度與所述第二殘基序列的所述第二長度之間的所述差異是借由將不大于最大長度變化且/或不小于最小長度變化應(yīng)用于所述第一可調(diào)整區(qū)段的所述第一長度和所述第二可調(diào)整區(qū)段的所述第二長度中的至少一者來分布的。
51.根據(jù)權(quán)利要求34至50中任一項所述的方法,其中所述第一殘基序列包含抗體,并且其中第一區(qū)段包含所述抗體的互補(bǔ)決定區(qū)(cdr)或所述抗體的非互補(bǔ)決定區(qū)。
52.根據(jù)權(quán)利要求51所述的方法,其中所述蛋白質(zhì)設(shè)計計算模型的輸入包括一個或多個標(biāo)識符,以使得能夠在所述第一序列的對應(yīng)于所述抗體的重鏈的第一部分與所述第一序列的對應(yīng)于所述抗體的輕鏈的第二部分之間進(jìn)行區(qū)分。
53.根據(jù)權(quán)利要求52所述的方法,其中所述蛋白質(zhì)設(shè)計計算模型的所述輸入進(jìn)一步包括所述一個或多個標(biāo)識符,以使得能夠在所述第一序列的對應(yīng)于所述抗體的所述重鏈的所述第一部分、所述第一序列的對應(yīng)于所述抗體的所述輕鏈的所述第二部分與所述第一序列的對應(yīng)于對所述抗體具有已知結(jié)合親和力的抗原的第三部分之間進(jìn)行區(qū)分。
54.根據(jù)權(quán)利要求53所述的方法,其中所述第一序列的所述第三部分包含固定區(qū)段和/或可調(diào)整區(qū)段。
55.根據(jù)權(quán)利要求52至54中任一項所述的方法,其中所述蛋白質(zhì)設(shè)計計算模型基于所述一個或多個標(biāo)識符生成所述第二殘基序列,使得包括在所述第二殘基序列中的所述第一固定區(qū)段存在于與所述第一殘基序列相同的鏈中。
56.根據(jù)權(quán)利要求52至55中任一項所述的方法,其中所述一個或多個標(biāo)識符包括在所述第一序列的對應(yīng)于所述抗體的所述重鏈的所述第一部分與所述第一序列的對應(yīng)于所述抗體的所述輕鏈的第二部分之間的標(biāo)記。
57.根據(jù)權(quán)利要求52至56中任一項所述的方法,其中所述一個或多個標(biāo)識符包括標(biāo)識所述抗體的所述重鏈中每個殘基的第一標(biāo)簽和標(biāo)識所述抗體的所述輕鏈中每個殘基的第二標(biāo)簽。
58.根據(jù)權(quán)利要求34至57中任一項所述的方法,其中所述破壞包括以下中的至少一者:將殘基插入到所述第一可調(diào)整區(qū)段中,使殘基從所述第一可調(diào)整區(qū)段中缺失,以及修飾存在于所述第一可調(diào)整區(qū)段中的殘基。
59.根據(jù)權(quán)利要求34至58中任一項所述的方法,其中所述數(shù)據(jù)分布與對應(yīng)于多個已知蛋白質(zhì)序列的數(shù)據(jù)的降維表示相對應(yīng),并且其中所述多個殘基序列的至少一部分與一種或多種已知功能相關(guān)聯(lián)。
60.根據(jù)權(quán)利要求34至59中任一項所述的方法,其中所述蛋白質(zhì)設(shè)計計算模型包括自編碼器。
61.根據(jù)權(quán)利要求34至60中任一項所述的方法,其中所述蛋白質(zhì)設(shè)計計算模型包括去噪自編碼器(dae)。
62.根據(jù)權(quán)利要求34至61中任一項所述的方法,其中至少基于所述第一固定區(qū)段與所述期望的特性相關(guān)聯(lián)來確定所述第一固定區(qū)段。
63.根據(jù)權(quán)利要求34至62中任一項所述的方法,其進(jìn)一步包括:
64.根據(jù)權(quán)利要求34至62中任一項所述的方法,其進(jìn)一步包括:
65.根據(jù)權(quán)利要求64所述的方法,其中所述第一殘基序列的所述固定長度表示借由至少以下來生成:
66.根據(jù)權(quán)利要求65所述的方法,其中輸入序列的所述固定長度表示在每個整數(shù)位置處包括間隙字符,其中所述第一殘基序列未能在所述整數(shù)位置處包括對應(yīng)的殘基。
67.一種存儲指令的非暫時性計算機(jī)可讀介質(zhì),所述指令當(dāng)由至少一個數(shù)據(jù)處理器執(zhí)行時引起包括以下的操作:
68.一種系統(tǒng),其包括:
69.根據(jù)權(quán)利要求68所述的系統(tǒng),其中所述操作進(jìn)一步包括:
70.根據(jù)權(quán)利要求68至69中任一項所述的系統(tǒng),其中所述第一期望的特性為對靶分子的結(jié)合親和力,并且其中所述第二期望的特性為表達(dá)、非特異性、穩(wěn)定性、非免疫原性、人性和自締合中的一者或多者。
71.根據(jù)權(quán)利要求68至70中任一項所述的系統(tǒng),其中所述第一抗體為非人抗體。
72.根據(jù)權(quán)利要求68至71中任一項所述的系統(tǒng),其中所述第一固定區(qū)段包括所述第一抗體的互補(bǔ)決定區(qū)(cdr)。
73.根據(jù)權(quán)利要求68至72中任一項所述的系統(tǒng),其中所述第一固定區(qū)段包括所述第一抗體中的一個或多個游標(biāo)區(qū)殘基。
74.根據(jù)權(quán)利要求68至73中任一項所述的系統(tǒng),其中所述第一可調(diào)整區(qū)段包括隨機(jī)生成的氨基酸殘基序列。
75.根據(jù)權(quán)利要求68至74中任一項所述的系統(tǒng),其中所述第一可調(diào)整區(qū)段包括人抗體的框架區(qū)。
76.根據(jù)權(quán)利要求68至75中任一項所述的系統(tǒng),其中所述第一可調(diào)整區(qū)段包括不具有一個或多個游標(biāo)區(qū)殘基的人抗體的框架區(qū)。
77.根據(jù)權(quán)利要求68至76中任一項所述的系統(tǒng),其中所述操作進(jìn)一步包括:
78.根據(jù)權(quán)利要求77所述的系統(tǒng),其中所述操作進(jìn)一步包括:
79.根據(jù)權(quán)利要求78所述的系統(tǒng),其中所述長度變化分布于所述第一可調(diào)整區(qū)段和所述第二可調(diào)整區(qū)段。
80.一種計算機(jī)實現(xiàn)方法,其包括:
81.根據(jù)權(quán)利要求80所述的方法,其進(jìn)一步包括:
82.根據(jù)權(quán)利要求80至81中任一項所述的方法,其中所述第一期望的特性為對靶分子的結(jié)合親和力,并且其中所述第二期望的特性為表達(dá)、非特異性、穩(wěn)定性、非免疫原性、人性和自締合中的一者或多者。
83.根據(jù)權(quán)利要求80至82中任一項所述的方法,其中所述第一抗體為非人抗體。
84.根據(jù)權(quán)利要求80至83中任一項所述的方法,其中所述固定區(qū)段包括所述第一抗體的互補(bǔ)決定區(qū)(cdr)。
85.根據(jù)權(quán)利要求80至84中任一項所述的方法,其中所述固定區(qū)段包括所述第一抗體中的一個或多個游標(biāo)區(qū)殘基。
86.根據(jù)權(quán)利要求80至85中任一項所述的方法,其中所述可調(diào)整區(qū)段包括隨機(jī)生成的氨基酸殘基序列。
87.根據(jù)權(quán)利要求80至86中任一項所述的方法,其中所述可調(diào)整區(qū)段包括人抗體的框架區(qū)。
88.根據(jù)權(quán)利要求80至87中任一項所述的方法,其中所述可調(diào)整區(qū)段包括不具有一個或多個游標(biāo)區(qū)殘基的人抗體的框架區(qū)。
89.根據(jù)權(quán)利要求80至88中任一項所述的方法,其中所述操作進(jìn)一步包括:
90.根據(jù)權(quán)利要求89所述的系統(tǒng),其中所述操作進(jìn)一步包括:
91.一種存儲指令的非暫時性計算機(jī)可讀介質(zhì),所述指令當(dāng)由至少一個數(shù)據(jù)處理器執(zhí)行時引起包括以下的操作:
92.一種系統(tǒng),其包括:
93.根據(jù)權(quán)利要求92所述的系統(tǒng),其中所述可調(diào)整區(qū)段包括與所述一種或多種不期望的特性相關(guān)聯(lián)的氨基酸殘基或氨基酸殘基模式。
94.根據(jù)權(quán)利要求93所述的系統(tǒng),其中所述操作進(jìn)一步包括:
95.根據(jù)權(quán)利要求92至94中任一項所述的系統(tǒng),其中所述一種或多種不期望的特性包括對氧化、化學(xué)修飾和/或化學(xué)異構(gòu)化的傾向。
96.根據(jù)權(quán)利要求92至95中任一項所述的系統(tǒng),其中所述一種或多種不期望的特性包括免疫原性。
97.根據(jù)權(quán)利要求92至96中任一項所述的系統(tǒng),其中至少基于所述固定區(qū)段與一種或多種可期望的特性相關(guān)聯(lián)來標(biāo)識所述固定區(qū)段包含在所述第二殘基序列中。
98.根據(jù)權(quán)利要求97所述的系統(tǒng),其中所述一種或多種可期望的特性包括對靶分子的結(jié)合親和力、表達(dá)、非特異性、穩(wěn)定性、非免疫原性、人性和/或自締合。
99.根據(jù)權(quán)利要求92至98中任一項所述的系統(tǒng),其中所述固定區(qū)段包括互補(bǔ)決定區(qū)(cdr)和/或一個或多個游標(biāo)區(qū)殘基。
100.根據(jù)權(quán)利要求92至99中任一項所述的系統(tǒng),其中所述操作進(jìn)一步包括:
101.一種計算機(jī)實現(xiàn)方法,其包括:
102.根據(jù)權(quán)利要求101所述的方法,其中所述可調(diào)整區(qū)段包括與所述一種或多種不期望的特性相關(guān)聯(lián)的氨基酸殘基或氨基酸殘基模式。
103.根據(jù)權(quán)利要求102所述的方法,其進(jìn)一步包括:
104.根據(jù)權(quán)利要求101至103中任一項所述的方法,其中所述一種或多種不期望的特性包括對氧化、化學(xué)修飾和/或化學(xué)異構(gòu)化的傾向。
105.根據(jù)權(quán)利要求101至104中任一項所述的方法,其中所述一種或多種不期望的特性包括免疫原性。
106.根據(jù)權(quán)利要求101至105中任一項所述的方法,其中至少基于所述固定區(qū)段與一種或多種可期望的特性相關(guān)聯(lián)來標(biāo)識所述固定區(qū)段包含在所述第二殘基序列中。
107.根據(jù)權(quán)利要求106所述的方法,其中所述一種或多種可期望的特性包括對靶分子的結(jié)合親和力、表達(dá)、非特異性、穩(wěn)定性、非免疫原性、人性和/或自締合。
108.根據(jù)權(quán)利要求101至107中任一項所述的方法,其中所述固定區(qū)段包括互補(bǔ)決定區(qū)(cdr)和/或一個或多個游標(biāo)區(qū)殘基。
109.根據(jù)權(quán)利要求101至108中任一項所述的方法,其進(jìn)一步包括:
110.一種存儲指令的非暫時性計算機(jī)可讀介質(zhì),所述指令當(dāng)由至少一個數(shù)據(jù)處理器執(zhí)行時引起包括以下的操作: