本申請是申請日為2012年10月26日、申請?zhí)枮?01280065065.3、發(fā)明名稱為“對nedd8活化酶(nae)抑制劑的反應的生物標記”的發(fā)明專利申請的分案申請。
相關申請案
本申請案要求2011年10月28日提交的美國臨時申請案第61/552,686號的優(yōu)先權。上述申請案的全部內容以引用的方式并入本文中。
本申請涉及對nedd8活化酶(nae)抑制劑的反應的生物標記。
序列表
本申請案包含以電子可讀形式與此一起提交的序列表。所述序列表文件創(chuàng)建于2012年10月26日,命名為“序列表.txt”并且其大小是149kb(153,088個字節(jié))。序列表.txt文件中的序列表的全部內容以這種引用的方式并入本文中。
背景技術:
當細胞的基因型或表型以不受正常組織環(huán)境限制的不受控制生長的方式改變時,這些細胞發(fā)生癌變。一或多個基因突變、擴增、缺失、過度表達或表達不足。染色體部分會丟失或從一個位置移動到另一個。一些癌癥具有特征性圖案,基因型或表型借此改變。
許多基因具有與癌癥相關的突變。一些基因具有可以發(fā)生突變的多個位點。許多癌癥具有一個以上基因的突變和/或錯誤表達?;蛲蛔儠龠M腫瘤進展、腫瘤生長率或腫瘤是否將轉移。一些突變會影響腫瘤細胞是否將對療法起反應。
多種藥劑治療癌癥。血液和骨髓的癌癥通常用類固醇/糖皮質激素、酰亞胺、蛋白酶體抑制劑和烷基化劑治療。其它組織的癌癥通常用烷基化劑、拓撲異構酶抑制劑、激酶抑制劑、微管抑制劑、血管生成抑制劑或其它藥劑治療。一些患者對一種療法的反應優(yōu)于另一種,呈現患者遵從有效療法的多種治療途徑的潛能。繼續(xù)進行最終證實對患者無效的療法會丟失所述患者治療計劃早期的寶貴時間。許多患者承受不起治療方案的試誤選擇的時間。有利并準確的治療決策促成疾病的有效管理。
技術實現要素:
本發(fā)明涉及通過測量本文中所提供的標記的量、存在或變化對腫瘤進行預后和計劃治療。這些標記可預測在用nedd8活化酶(nae)抑制劑,例如1-取代的氨基磺酸甲酯治療之后,是否將存在有利結果(例如良好反應、長進展時間和/或長期存活)。例如體外測定遺傳標記的存在、量或變化(例如至少一個標記基因的突變狀態(tài))的包含腫瘤細胞的測試樣品鑒別特定患者,這些患者預期例如用nae抑制劑,例如1-取代的氨基磺酸甲酯治療具有有利結果并且其疾病可以進行可管理地標準治療或較不具有侵襲性的治療;以及那些患者,這些患者預期具有不利的治療結果并且可能需要組合治療和/或用nae抑制劑更具侵襲性的治療的替代性治療以確保有利結果和/或成功管理疾病。
在一個方面,本發(fā)明提供適用于測定所述標記的特征(例如量、存在或變化)的試劑盒。在另一個方面,本發(fā)明提供確定預后和治療或疾病管理策略的方法。在這些方面,測量包含腫瘤細胞的樣品中的標記的特征,例如大小、序列、組成或量。在一個實施例中,所述腫瘤是液體腫瘤,例如血液腫瘤,例如急性骨髓性白血病、骨髓發(fā)育不良綜合癥或多發(fā)性骨髓瘤。在另一個實施例中,所述腫瘤是實體腫瘤,例如黑素瘤、非小細胞肺癌、食道癌、膀胱癌、成神經細胞瘤癌、間皮瘤、胰臟癌。
在各種實施例中,測量對應于本文所述的具有一或多個突變(例如體細胞突變)的標記基因的特征,例如dna的大小、序列、組成或量;rna的大小、序列、組成或量和/或蛋白質的大小、序列、組成或量。當分析顯示關于標記基因的信息時,例如基因是否突變、突變的一致性和/或突變基因的rna或蛋白質量表明過度表達抑或表達不足,獲得促成預后或治療或疾病管理策略的有用信息。在一個實施例中,確定e1酶抑制,例如nae抑制,例如mln4924療法策略。
適用于確定預后或治療或疾病管理策略的測試的標記基因選自由以下組成的群組:神經纖維瘤蛋白2(nf2)、母親抗dpp同源物4(mothersagainstdecapentaplegichomolog4;smad4)、賴氨酸特異性脫甲基酶6a(kdm6a)、腫瘤蛋白p53(tp53)、周期素依賴性激酶抑制劑2a(cdkn2a)、周期素依賴性激酶抑制劑2ap14變異體(cdkn2a_p14),在一些情況下,f盒和包含7的wd重復結構域(fbxw7)以及在一些情況下,腺瘤性結腸息肉病(apc)。每一標記基因包括突變或改變,所述突變或改變在dna中的存在或例如其對標記rna和/或蛋白質特征(例如量、大小、序列或組成)的影響可以提供關于確定預后或治療或疾病管理的信息。在一些實施例中,例如在包含腫瘤細胞的樣品中適用作標記的基因或突變體或其修飾形式所具有的dna、rna和/或蛋白質特征(例如大小、序列、組成或量)不同于正常的dna、rna和/或蛋白質。本文中描述稱為“標記基因”的這些基因的修飾的實例,所述基因的突變或量可以提供此類信息。
本發(fā)明標記的突變提供關于例如用nae抑制劑,例如1-取代的氨基磺酸甲酯治療之后的結果的信息。通過檢查腫瘤中所鑒別的標記中的一或多者的特征,例如大小、序列、組成或量,有可能確定何種治療劑、藥劑組合、給藥和/或投藥方案預期在治療之后提供有利結果。通過檢查癌癥中所鑒別的標記或標記組中的一或多者的特征,例如大小、序列、組成或量,還有可能確定何種治療劑、藥劑組合、給藥和/或投藥方案在治療之后較不可能提供有利結果。通過檢查所鑒別的標記中的一或多者的特征,例如大小、序列、組成或量,有可能因此消除無效或不當的治療劑或治療方案。重要地,可以基于逐個患者(patient-by-patient)進行這些確定。因此,可以確定特定治療方案是否可能有益于特定患者或患者類型,和/或特定方案是否應該開始抑或避免、繼續(xù)、中斷或改變。
本發(fā)明是針對鑒別和/或選擇癌癥患者的方法,所述癌癥患者預期在投與治療方案,例如包含nae抑制劑的治療方案,例如1-取代的氨基磺酸甲酯治療之后展現有利結果。此外提供鑒別預期在投與此類治療方案之后具有不利結果的患者的方法。這些方法通常包括測量、確定、接收、儲存或傳遞關于患者的腫瘤(例如患者的癌細胞,例如血液癌細胞或實體腫瘤細胞)中的一或多個標記或標記基因的突變的特征,例如大小、序列、組成或量的信息,任選地將所述特征與參考標記的特征,例如大小、序列、組成或量進行比較;并且在又一實施例中,鑒別或建議樣品的結果是否對應于治療方案,例如nae抑制劑,例如1-取代的氨基磺酸甲酯治療方案的有利結果。
此外提供的方法包括治療方法,其進一步包括以下步驟:當在標記基因中突變的存在或患者標記的特征,例如大小、序列、組成或量表明所述患者預期用療法,例如nae抑制劑,例如1-取代的氨基磺酸甲酯治療方案展現有利結果時,相應地開始、繼續(xù)或啟動療法。另外,所述方法包括治療方法,其進一步包括以下步驟:例如如相比于經鑒別具有有利結果的接受相同治療方案的患者,當標記基因中突變的存在或患者標記的特征,例如大小、序列、組成或量表明所述患者預期用治療,例如用nae抑制劑,例如1-取代的氨基磺酸甲酯方案展現不利結果時,相應地停止、中斷、改變或暫停療法。在另一個方面,提供基于標記基因中突變的存在或本文所述的患者標記中的一或多者的特征,例如、大小、序列、組成或量來分析尚未用療法,例如nae抑制劑,例如1-取代的氨基磺酸甲酯療法治療的患者并且鑒別和預測治療結果的方法。這些方法可包括不用所述療法,例如nae抑制劑,例如1-取代的氨基磺酸甲酯療法治療,用療法,例如nae抑制劑治療或用1-取代的氨基磺酸甲酯療法與一或多種附加療法的組合治療;用nae抑制劑,例如1-取代的氨基磺酸甲酯療法的替代性療法治療;或用更具侵襲性的給藥和/或投藥方案療法,例如e1酶抑制劑,例如nae抑制劑治療,例如如相比于經鑒別具有標準nae抑制劑,例如1-取代的氨基磺酸甲酯療法的有利結果的患者的給藥和/或投藥方案。因此,所提供的本發(fā)明方法可以消除療法,例如nae抑制劑,例如1-取代的氨基磺酸甲酯療法方案的無效或不當的使用。
附加方法包括測定藥劑活性、藥劑功效或鑒別新治療劑或組合的方法。這些方法包括基于藥劑影響標記基因中突變的存在或本發(fā)明標記的特征,例如大小、序列、組成或量的能力,鑒別所述藥劑適用作例如nae抑制劑,例如1-取代的氨基磺酸甲酯,用于治療癌癥,例如血液癌癥(例如多發(fā)性骨髓瘤、白血病、淋巴瘤等)或實體腫瘤癌癥(例如黑素瘤、食道癌或膀胱癌)的方法。舉例來說,以表明患癌癥患者的有利結果的方式減少或增加標記基因中突變的存在或所提供的標記的特征,例如大小、序列、組成或量的抑制劑將是癌癥的候選藥劑?;蛘?,能夠降低腫瘤細胞活力的藥劑將是癌癥的候選藥劑,所述腫瘤細胞包含指示不利結果的標記。
本發(fā)明還針對用治療方案,例如nae抑制劑,例如1-取代的氨基磺酸甲酯療法方案(例如單獨或與附加藥劑組合,所述附加藥劑例如化學治療劑,例如糖皮質激素劑、蛋白酶體抑制劑、烷基化劑、激酶抑制劑或拓撲異構酶抑制劑)治療癌癥患者的方法,其包括以下步驟:選擇治療其標記特征,例如大小、序列、組成或量表明所述患者預期具有所述治療方案的有利結果的患者,并用所述療法,例如nae抑制,例如1-取代的氨基磺酸甲酯療法治療所述患者。在一些實施例中,所述方法可包括以下步驟:選擇其標記特征,例如大小、序列、組成或量表明患者預期具有有利結果的患者并且投與除nae抑制劑療法以外表明與nae抑制劑,例如1-取代的氨基磺酸甲酯療法類似的預期存活時間的療法。
治療癌癥患者的附加方法包括選擇在用癌癥療法(例如nae抑制劑,例如1-取代的氨基磺酸甲酯療法)治療之后不太可能經歷有利結果的患者。這些方法可以進一步包括以下一或多者:如相比于經鑒別用標準療法具有有利結果的患者的劑量或給藥時程,投與更高劑量或增加給藥時程的療法,例如nae抑制劑,例如1-取代的氨基磺酸甲酯;投與除nae抑制劑,例如1-取代的氨基磺酸甲酯療法以外的癌癥療法;投與nae抑制劑,例如1-取代的氨基磺酸甲酯藥劑與附加藥劑的組合。進一步提供選擇具有侵襲性疾病的患者的方法,所述患者預期展現更迅速的進展和死亡時間。
附加方法包括以下方法:通過檢查患者的指示癌癥療法(例如nae抑制劑,例如1-取代的氨基磺酸甲酯療法方案)的結果的標記的量,評估是否治療癌癥抑或支付癌癥的治療,所述癌癥例如血液癌癥(例如多發(fā)性骨髓瘤、白血病、淋巴瘤等)或實體腫瘤癌癥(例如黑素瘤、食道癌或膀胱癌);并且作出關于是否應該支付的決策或建議。
本文中所提到的所有公開案、專利申請案、專利和其它參考文獻的全部內容都以引用的方式并入文本中。
本發(fā)明的其它特征和優(yōu)勢將從以下具體實施方式、圖式以及從權利要求書顯而易知。
附圖說明
圖1.1-取代的氨基磺酸甲酯的通式結構。g1是-o-或-ch2-;g2是-h或-oh;g3是-h或-oh;g4是-nh-、-o-或共價鍵;以及g5是被取代的雜芳基。
圖2.用于蛋白質底物的科林-環(huán)(cullin-ring)連接酶(crl)泛素化和用于類泛素化修飾的通用路徑。在crl中,科林次單位必須通過泛素樣蛋白nedd8修飾保守賴氨酸以活化全酶活性。nedd8活化和與科林蛋白的結合是通過酶級聯催化的,所述酶級聯與涉及nedd8的e1(nae)和e2(ubc12)的泛素化是類似的。從科林去除nedd8是通過cop9信號體催化的。去類泛素化修飾有助于crl組分的解離??屏?環(huán)核心通過結合到cand1以非活性狀態(tài)隔離直到得到補充以形成新crl為止。
圖3.第2組細胞系對mln4924的反應。每個點表示一種細胞系。
圖4a-b.比較各組細胞系對mln4924的反應。a.通過ec50對第2組細胞系排序。黑線表示存在于第1組中的細胞系。在兩個組中存在114個具有相同名稱的細胞系。b.比較存在于兩個組中的細胞系的對照百分比(poc)活力。重疊細胞系的結果具有0.72的斯皮爾曼等級相關系數,p值<2.2e-16。
圖5.在tp53突變的情況下抗性的組織相關性。相比于tp53wt細胞系,tp53突變體結腸癌細胞系對mln4924治療更具抗性(更高的對照百分比活力)。
圖6a-d.在用不同劑量的mln4924處理之后在多個時間點tp53loss對癌細胞系活力的影響。通過atplite,在一系列mln4924濃度和時間點下測量tp53基因剔除對成對的hct-116結腸癌細胞系對mln4924的敏感性的影響。數據表示為平均值±sem,n=3。虛線,p53基因剔除;實線,p53野生型。
具體實施方式
癌癥患者療法的持續(xù)問題之一是響應于療法的個體差異。雖然在開發(fā)成功癌癥療法方面有所進展,但是僅一個子集的患者對任一特定療法起反應。在許多可獲得的癌癥療法的窄治療指數和潛在毒性的情況下,這些差別反應可能造成患者經歷不必要的、無效的并且甚至可能有害的療法方案。如果能夠優(yōu)化所設計的療法以治療個別患者,那么可以減少或甚至消除這些情況。此外,目標設計療法可以提供總體而言更集中的成功患者療法。因此,需要鑒別預期當投與特定癌癥療法時具有有利結果的特定癌癥患者以及使用更具侵襲性的和/或替代性癌癥療法(例如替代向所述患者投與的先前癌癥療法)可以具有有利結果的特定癌癥患者。因此提供癌癥患者的診斷、分期、預后和監(jiān)控將是有利的,所述癌癥患者包括例如血液癌癥患者(例如多發(fā)性骨髓瘤、白血病、淋巴瘤等)或實體腫瘤癌癥(例如黑素瘤、食道癌或膀胱癌),所述癌癥患者將受益于特定癌癥抑制療法以及所述癌癥患者將受益于更具侵襲性的和/或替代性癌癥抑制療法,例如替代患者已接受的癌癥療法,從而產生恰當的預防性測量。
本發(fā)明部分地基于以下認知:標記基因的突變可以與包含突變基因的細胞對nae抑制劑、例如1-取代的氨基磺酸甲酯的敏感性相關。在一些實施例中,標記基因參與科林-環(huán)連接酶(crl)路徑,例如所編碼的蛋白質與crl或crl相關蛋白質相互作用的基因,或是crl底物。由標記基因編碼的蛋白質可以具有作為腫瘤抑制基因的野生型功能。標記基因的實例包括nf2、smad4和/或kdm6a。標記基因的其它實例包括tp53、apc、cdkn2a和/或cdkn2a_p14。標記基因可以展現突變,例如體細胞突變,突變的存在會影響所編碼的基因產物的表達或活性。在一些實施例中,在腫瘤細胞或腫瘤中可以在標記基因中存在一種以上突變或可以存在一個以上具有突變的標記基因。在附加實施例中,可以在附加基因中具有突變的細胞中存在標記基因突變,包括可以引起腫瘤發(fā)生的突變,但附加突變基因可以不是如本文中所認為的標記基因。在一些實施例中,所述突變是失活性突變。在其它實施例中,所述突變影響標記基因的表達。在其它實施例中,突變可以改變所編碼的基因產物與細胞結合伴侶的相互相用。鑒別和/或測量標記基因的突變可以用于確定通過例如用nae抑制劑、例如1-取代的氨基磺酸甲酯療法處理腫瘤是否可以預期有利結果;或用例如nae抑制劑、例如1-取代的氨基磺酸甲酯抑制劑的替代性療法和/或更具侵襲性的療法是否可以延長預期存活時間。舉例來說,本文中所提供的組合物和方法可以用于確定是否預期患者對nae抑制劑、例如1-取代的氨基磺酸甲酯治療劑或nae抑制劑、例如1-取代的氨基磺酸甲酯給藥或投藥方案具有有利結果。一般來說,本文所述的腫瘤抑制基因標記基因的突變與對nae抑制劑的敏感性或nae抑制劑處理的有利結果相關。可以在與科林-環(huán)連接酶相關的路徑中充當腫瘤抑制基因并且其突變與對nae抑制的敏感性相關的標記基因的實例包括nf2、smad4、kdm6a、fbxw7、cdkn2a和/或cdkn2a_p14。然而,tp53和apc也是腫瘤抑制基因標記基因。具體來說,tp53路徑基因與nae抑制劑作用相關。如本文所述,在許多腫瘤類型的一些實施例中,tp53和apc(在一些情況下)的突變產生對nae抑制的抗性。因此,來自tp53和apc組成的群組的野生型標記基因會與nae敏感性相關。在一些實施例中,選自由tp53和apc組成的群組的標記基因的突變與對nae抑制劑的抗性相關。
基于這些鑒別,本發(fā)明提供(但不限于):1)用于確定nae抑制劑、例如1-取代的氨基磺酸甲酯療法方案是否可有效獲得有利結果和/或管理癌癥的方法和組合物;2)用于監(jiān)控用于治療腫瘤的nae抑制劑、例如1-取代的氨基磺酸甲酯療法(單獨或與藥劑組合)和給藥與投藥的有效性的方法和組合物;3)用于治療腫瘤的方法和組合物,包含例如nae抑制劑、例如1-取代的氨基磺酸甲酯抑制療法方案;4)用于鑒別可有效治療特定患者的腫瘤的特定治療劑和治療劑組合以及給藥和投藥方案的方法和組合物;以及5)用于鑒別疾病管理策略的方法和組合物。
泛素和其它泛素樣分子(ubl)是通過特異性酶(e1酶)活化的,所述特異性酶催化形成與ubl的c端甘氨酸的?;?腺苷酸中間物?;罨膗bl然后通過形成硫酯鍵中間物轉移到e1酶內的催化性半胱氨酸殘基中。e1-ubl中間物和e2結合,產生硫酯交換,其中ubl轉移到e2的活性位點半胱氨酸。ubl然后直接地或連同e3連接酶一起,通過與目標蛋白中的賴氨酸側鏈的氨基形成異肽鍵而結合到目標蛋白。名為神經前體細胞-表達發(fā)育下調8(nedd8)的ubl是通過雜二聚體nedd8活化酶(nae,也稱為appbp1-uba3、ube1c(泛素活化酶e1c))活化的并且轉移到兩種e2結合酶(泛素載體蛋白12(ubc12)和ubc17)中的一種,最終通過科林-環(huán)亞型泛素連接酶產生nedd8與科林蛋白的連接(參見圖2)。類泛素化修飾的功能是活化基于科林的泛素連接酶,所述連接酶參與許多細胞周期和細胞信號傳導蛋白、包括p27和i-κb的轉換。參見潘(pan)等人,《致癌基因》(oncogene)23:1985-97(2004)。抑制nae可以破壞科林-環(huán)連接酶介導的蛋白質轉換并且可以在細胞(例如腫瘤細胞或病原性生物體(例如寄生蟲)的細胞)中引起細胞凋亡性死亡。參見蘇西(soucy)等人(2010)《基因與癌癥》(genes&cancer)1:708-716。
如本文所用,術語“e1”、“e1酶”或“e1活化酶”是指參與活化或促進泛素或泛素樣(統稱為“ubl”)與目標分子的結合的相關atp依賴性活化酶家族中的任一者。e1活化酶通過腺苷?;饔?硫酯中間物形成起作用以通過轉硫醇反應將恰當的ubl轉移到相應e2結合酶中。所得活化的ubl-e2促進ubl與目標蛋白的最終結合。在細胞信號傳導、細胞周期和蛋白質轉換中起作用的各種細胞蛋白是用于ubl結合的底物,所述結合通過e1活化酶(例如nae、uae、sae)進行調節(jié)。除非上下文另有指示,否則術語“e1酶”打算是指任何e1活化酶蛋白質,包括(但不限于)nedd8活化酶(nae(appbp1/uba3))、泛素活化酶(uae(uba1))、sumo活化酶(sae(aos1/uba2))、uba4、uba5、uba6、atg7或isg15活化酶(ubell)。
術語“e1酶抑制劑”或“e1酶的抑制劑”是用于表示具有如本文中所定義的結構的化合物,其能夠與e1酶相互作用并抑制其酶活性。抑制e1酶活性意指降低e1酶活化泛素(如ubl)與底物肽或蛋白質結合(例如泛素化、類泛素化修飾、蘇素化)的能力。在一些實施例中,e1酶抑制劑可以抑制一種以上e1酶。在其它實施例中,e1酶抑制劑對特定的e1酶具有特異性。在各種實施例中,e1酶活性的此類降低是至少約50%,至少約75%,至少約90%,至少約95%或至少約99%。在各種實施例中,降低e1酶活性所需的e1酶抑制劑的濃度小于約1μm,小于約500nm,小于約100nm,小于約50nm或小于約10nm。
如本文所用,術語“nae抑制劑”是指nae雜二聚體的抑制劑。nae抑制劑的實例包括1-取代的氨基磺酸甲酯(參見圖1),包括mln4924。蘭斯頓(langston)s.等人的美國專利申請案第11/700,614號,其pct申請案公開為wo07/092213、wo06084281和wo2008/019124(上述公開專利申請案中每一個的全部內容在此以引用的方式并入本文中),揭示作為e1活化酶的有效抑制劑的化合物,例如nae。在一些實施例中,nae抑制劑不抑制或極差地抑制其它(非nae)e1酶。所述化合物適用于體外和體內抑制e1活性并且適用于治療細胞增殖病癥,例如癌癥;和與e1活性相關的其它病癥,例如病原性感染和神經退化性病癥。蘭斯頓等人所描述的一類化合物是4-取代的氨基磺酸((1s,2s,4r)-2-羥基-4-{7h-吡咯并[2,3-d]嘧啶-7-基}環(huán)戊基)甲酯。
mln4924(氨基磺酸((1s,2s,4r)-4-{4-[(1s)-2,3-二氫-1h-茚-1-基氨基]-7h-吡咯并[2,3-d]嘧啶-7-基}-2-羥基環(huán)戊基)甲酯)是一種nae特異性e1抑制劑,其通過擾動細胞蛋白質體內平衡破壞科林-環(huán)連接酶介導的蛋白質轉換,引起人類腫瘤細胞的細胞凋亡性死亡(蘇西等人(2009)《自然》(nature)458:732-736)。細胞和腫瘤異種移植研究中的mln4924評估已顯示兩種不同的作用機制。第一種是通過mln4924介導的crl1skp2和crl4ddb1底物cdt-1的調節(jié)異常來誘導dna再復制、dna損傷和細胞死亡(米爾霍林(milhollen)等人(2011)《癌癥研究》(cancerres.)71:3042-3051)。已經顯示,p53狀態(tài)不影響誘導dna再復制但會使細胞更易于經歷細胞凋亡或衰老,這取決于恰當的遺傳背景(米爾霍林等人(2011),同前文獻;林(lin)等人(2010)《自然》464:374-379和林等人(2010)《癌癥研究》70:10310-20)。第二種機制是主要通過crl1βtrcp介導的磷酸化iκbα轉換的調節(jié)異常來抑制nf-κb依賴性彌漫性大b細胞淋巴瘤中的nf-κb路徑活性(米爾霍林等人(2010)《血液》(blood)116:1515-1523)。另外,急性骨髓性白血病(aml)的臨床前模型對在細胞系和原始患者胚細胞兩者中通過與cdt-1調節(jié)異常、nf-κb抑制和誘導活性氧物質相關的機制進行的mln4924抑制是敏感的(索茲(swords)等人(2010)《血液》115:3796-3800)。
例如nf2(由阿羅諾維茨(ahronowitz)等人(2007)《人類突變》(humanmutation)28:1-2綜述)、kdm6a(由凡·哈福坦(vanhaaften)等人(2009)《自然·遺傳學》(nat.genet.)41:521-523綜述)、fbxw7、tp53、cdkn2a和cdkn2a_p14的基因在許多癌癥類型中發(fā)生突變。smad4在多種癌癥中突變,但許多smad4突變發(fā)現于腸癌、胰腺癌(由宮木(miyaki)和黑木(kuroki)(2003)《生物化學與生物物理研究通訊》(biochem.biophys.res.commun.)306:799-804綜述)或甲狀腺癌中。
如本文所用,“nf2”是指與基因庫寄存編號nm_000268,seqidno:1(開放閱讀框架是seqidno:2,seqidno:1的核苷酸444到2231)相關的編碼基因肽寄存編號np_000259(seqidno:3)的基因的較長同功異型物。nf2的其它名稱包括acn、banf、sch和梅林蛋白(merlin)(膜突蛋白-埃茲蛋白-根蛋白樣蛋白(moesin-ezrin-radixin-likeprotein))。nf2充當腫瘤抑制基因并且可見于22號染色體上。nf2與細胞骨架、細胞表面蛋白相互作用并且可以參與細胞骨架動力學和調節(jié)離子轉運。nf2的可以涉及對nae抑制、例如mln4924的敏感性的功能包括其抑制e3泛素連接酶crl4dcaf1的能力(李(li)等人(2010)《細胞》(cell)140:477-490)。nf2突變可以破壞其抑制活性并導致crl4dcaf1的底物不受控制的泛素化和含有突變基因的細胞的增殖。
如本文所用,“smad4”是指與基因庫寄存編號nm_005359,seqidno:4(開放閱讀框架是seqidno:5,seqidno:4的核苷酸539到2197)相關的編碼基因肽寄存編號np_005350,seqidno:6的基因。smad4的其它名稱包括胰腺癌缺失基因座4(dpc4)、jip或母親抗果蠅dpp同源物4(mad4)。smad4是參與轉型生長因子(tgf)-β信號傳導的一種信號轉導蛋白。smad4可以充當腫瘤抑制基因并且可以靶向它以通過skp-科林-f盒蛋白(scf)復合物泛素化進行降解。
如本文所用,“kdm6a”是指與基因庫寄存編號nm_021140,seqidno:7(開放閱讀框架是seqidno:8,seqidno:7的核苷酸376到4581,或seqidno:9)相關的編碼基因肽寄存編號np_066963,seqidno:10或seqidno:11(seqidno:10在位置173處是v而不是l并且在584處是r而不是l,在位置601處是n而不是s和/或在位置629處是k而不是e)的基因。kdm6a的其它名稱包括泛轉錄的三十四肽重復蛋白x連接或x染色體(utx)上的泛轉錄的tpr基因或ba286n14.2。kdm6a是組蛋白脫甲基酶并且可以充當腫瘤抑制基因。
如本文所用,“fbxw7”是指與基因庫寄存編號nm_033632,seqidno:12(開放閱讀框架是seqidno:13,seqidno:12的核苷酸150到2273)相關的編碼基因肽寄存編號np_361014,seqidno:14的基因。fbxw7的其它名稱包括秀麗隱桿線蟲sel-10的同源物(sel10)、群島同源物(ago)、f盒蛋白fbx30(fbxo30)或細胞分裂控制蛋白4(cdc4)。fbxw7可以結合到泛素蛋白連接酶復合物中參與蛋白質的磷酸化依賴性泛素化,包括參與細胞周期和存活的蛋白質。fbxw7可以充當腫瘤抑制基因。使用fbxw7作為標記基因可以是器官特異性的,即,其可以是在一些組織中而不是其它組織中出現腫瘤的敏感性標記。舉例來說,fbxw7可以是子宮、子宮頸或肝臟的腫瘤的敏感性標記,但不是消化道腫瘤的敏感性標記,其中其它基因突變可以占主導以引起來自那些腫瘤的細胞對mln4924的不敏感性或抗性。
如本文所用,“tp53”是指與基因庫寄存編號nm_000546,seqidno:15(開放閱讀框架是seqidno:16,seqidno:15的核苷酸203到1384,或一種變異體,其中在位置417處的核苷酸是鳥嘌呤而不是胞嘧啶)相關的編碼基因肽寄存編號np_000537,seqidno:17或一種變異體(其中在位置72處的氨基酸殘基是精氨酸r而不是脯氨酸p)的基因。tp53的其它名稱包括bcc7、lfs1和p53。tp53結合dna并活化轉錄因子,而且可以充當腫瘤抑制基因。
如本文所用,“cdkn2a”是指與基因庫寄存編號nm_000077,seqidno:18(開放閱讀框架是seqidno:19,seqidno:18的核苷酸307到777)相關的編碼基因肽寄存編號np_000068,seqidno:20的基因。cdkn2a的其它名稱包括交替開放閱讀框架(arf)、p16、p16arf、周期素依賴性激酶4的抑制劑(ink4)和多腫瘤抑制基因-1(mts1)。cdkn2a的變異體在第一外顯子方面有所不同。一種變異體是“cdkn2a_p14”或“cdkn2a.p14”,也稱為p14arf,是與基因庫寄存第號nm_058195,seqidno:21(開放閱讀框架是seqidno:22,seqidno:21的核苷酸38到559);基因肽np_478102,seqidno:23或始于seqidno:23的氨基酸殘基42處的變異體相關。cdkn2a_p14產生于不同于p16arf(p16ink4a,cdkn2a)的閱讀框架的轉譯。cdkn2a和cdkn2a_p14抑制周期素依賴性激酶4,可以穩(wěn)定p53并且可以調節(jié)細胞周期g1進展。cdkn2a和cdkn2a_p14可以充當腫瘤抑制基因。
如本文所用,“apc”是指腺瘤性結腸息肉病,所述基因與基因庫寄存編號nm_000038,seqidno:24(開放閱讀框架seqidno:25,或在核苷酸1458處具有胸腺嘧啶而不是胞嘧啶的變異體)相關,編碼基因肽寄存編號np_000029,seqidno:26。apc的其它名稱包括btsp2和dp2。apc結合微管并抑制wnt信號傳導路徑,而且可以充當腫瘤抑制基因。
對與癌癥相關的突變進行公共編目一直受到關注。包括關于與癌癥相關的突變的信息的公用數據庫的實例是由美國國家生物技術信息中心(馬里蘭州的貝塞斯達(bethesda,md))維護的基因型和表型的數據庫(dbgap)以及由維康信托桑格研究所(wellcometrustsangerinstitute)(英國劍橋(cambridge,uk))維護的癌癥體細胞突變目錄(cosmic)數據庫。
提供測定突變狀態(tài),例如鑒別血液腫瘤(例如多發(fā)性骨髓瘤、白血病、淋巴瘤等)或實體腫瘤(例如黑素瘤、食道癌、肺癌或膀胱癌)中標記基因的突變以預測對治療的反應,進展時間和治療之后的存活的組合物和方法。本文中所提供的組合物和方法也可以鑒別實體腫瘤,例如來自結腸癌、乳癌、頭頸癌或中樞神經系統癌的標記基因的突變。
標記是基于展現對mln4924治療的敏感性的腫瘤細胞的遺傳概況來鑒別的。tp53標記也是基于在tp53基因的缺失方面有所不同的同基因細胞系的行為來鑒別的。所觀察到的敏感性可以在通過一種以上方法測試的腫瘤細胞中取得一致。
除非另外定義,否則本文中所使用的所有技術和科技術語具有本發(fā)明本領域的普通技術人員的通常所理解的含義。一般來講,本文中所述的與分子生物學以及蛋白質和寡核苷酸或聚核苷酸化學和雜交結合使用的命名法以及其細胞與組織培養(yǎng)技術是本領域中已知的那些?;驇旎蚧螂募拇婢幪柡陀杏玫暮怂岷碗男蛄锌梢娪谟神R里蘭州貝塞斯達的美國國家生物技術信息中心維護的網站。貫穿本申請案(包括表格)所引用的所有數據庫寄存記錄(例如來自昂飛hg133注釋文件(affymetrixhg133annotationfiles)、英特茲(entrez)、基因庫、refseq、cosmic)的內容在此以引用的方式并入本文中。使用標準技術進行重組dna、寡核苷酸合成、蛋白質純化、組織培養(yǎng)和轉型以及轉染(例如電穿孔、脂質體轉染等)。酶促反應是根據制造商的說明書或如此項技術中通常所實現或如本文中所述來進行。以上技術和程序一般可根據本領域中已知的方法,例如如貫穿本發(fā)明說明書所引用并論述的各個一般性和較特定的參考文獻中所述來進行。參見例如薩姆布魯克(sambrook)等人(2000)《分子克隆實驗手冊》(molecularcloning:alaboratorymanual)(第3版,冷泉港實驗室出版社(coldspringharborlaboratorypress),冷泉港,紐約)或哈洛(harlow),e.和萊恩(lane),d.(1988)《抗體實驗手冊》(antibodies:alaboratorymanual)(冷泉港實驗室出版社,冷泉港,紐約)。本文中所述的與分析化學、合成有機化學和藥物與醫(yī)藥化學結合使用的命名法以及其實驗室程序和技術是本領域中已知的。標準技術用于化學合成、化學分析、醫(yī)藥制備、調配和傳遞以及治療患者。此外,除非另外為情形所需,否則單數術語應包括復數并且復數術語應包括單數。倘若有沖突,那么將以本說明書(包括定義)為主。
本文中使用冠詞“一(a/an)”和“至少一個”來指所述冠詞的一個或一個以上語法賓語。舉例來說,“一個要素”意指一個或一個以上要素、至少一個要素。倘若有沖突,那么將以本說明書(包括定義)為主。
如本文所用,“有利”結果或預后是指長期存活、長進展時間(ttp)和/或良好反應。反之,“不利”預后是指短期存活、短進展時間(ttp)和/或不良反應。
如本文所用的“標記”包括與標記基因相關的材料,所述標記基因已經被鑒別為具有患者腫瘤細胞的突變并且此外,所述突變是患者用例如nae抑制劑、例如1-取代的氨基磺酸甲酯治療的結果是有利或不利的表征。標記的實例包括材料,例如染色體基因座、基因的dna、基因的rna或基因的蛋白質。舉例來說,標記包括標記基因材料,例如展示指示短期存活患者的特征(例如大小、序列、組成或量)的染色體基因座、dna、rna或蛋白質;或者標記包括標記基因材料,例如展示指示長期存活患者的突變或特征(例如大小、序列、組成或量)的染色體基因座、dna、rna或蛋白質。在另一實例中,標記包括標記基因材料,例如染色體基因座、dna、rna或蛋白質,其突變或特征(例如大小、序列、組成或量)指示患者具有不良的治療反應;或者標記包括標記基因材料,例如染色體基因座、dna、rna或蛋白質,其突變或特征(例如大小、序列、組成或量)指示患者具有良好反應。在另一實例中,標記包括標記基因材料,例如染色體基因座、dna、rna或蛋白質,其突變或特征(例如大小、序列、組成或量)指示患者的疾病在治療之后具有短進展時間(ttp);或者標記包括標記基因材料,例如染色體基因座、dna、rna或蛋白質,其突變或特征(例如大小、序列、組成或量)指示患者的疾病具有長ttp。在又另一實例中,標記包括標記基因材料,例如染色體基因座、dna、rna或蛋白質,其突變或特征(例如大小、序列、組成或量)指示患者的疾病在治療之后具有短期存活;或者標記包括標記基因材料,例如染色體基因座、dna、rna或蛋白質,其突變或特征(例如大小、序列、組成或量)指示患者的疾病具有長期存活。因此,如本文所用,標記是打算包括這些可能性中的每一個,并且可以進一步包括每個單一標記單獨地作為標記;或者當提及“標記”或“標記組”時可共同地包括一或多個或所有特征。
適用于測量以確定預后或治療或疾病管理策略的染色體基因座標記選自由以下組成的群組:染色體22q12.2(nf2),例如從堿基對29999545到30094589;染色體18q21.1-21.2(smad4),例如從堿基對48556583到48611412;染色體xp11.2(kdm6a),例如從堿基對44732423到44971847;染色體4q31.3(fbxw7),例如從堿基對153242410到153456172;染色體17p13.1(tp53),例如從堿基對7571720到7590868;以及9p21(cdkn2a和cdkn2a_p14),例如從堿基對21967751到21994490。染色體基因座編號是基于ncbi基因數據庫中的參考人類基因組build37.3(從2011年10月5日至今)。標記dna、標記rna或標記蛋白質可以對應于染色體基因座標記上的堿基對。舉例來說,標記dna可以包括來自染色體基因座標記的基因組dna,標記rna可以包括從基因座標記轉錄的聚核苷酸,并且標記蛋白質可以包括由樣品,例如包含腫瘤細胞的樣品中的染色體基因座標記處表達產生的多肽。
“標記核酸”是一種由本發(fā)明的標記基因編碼或對應于本發(fā)明的標記基因的核酸(例如基因組dna、mrna、cdna)。這些標記核酸包括dna,例如基因組dna的有義和反義鏈(例如包括本文中出現的任何內含子),包含完整或部分序列,例如基因組dna的外顯子中的一者或多者,最多并包括任何標記基因的開放閱讀框架或此類序列的互補序列。標記核酸也包括包含任何標記的完整或部分序列或此類序列的互補序列的rna,其中所有胸苷殘基被尿苷殘基置換,rna通過基因組dna的轉錄產生(即在剪接之前),rna通過剪接從基因組dna轉錄的rna產生,并且蛋白質通過轉譯所剪接的rna產生(即包括在通常裂解區(qū)域(例如跨膜信號序列)的裂解之前和之后的兩種蛋白質)。如本文所用,“標記核酸”還可以包括通過反轉錄通過轉錄基因組dna產生的rna(包括剪接rna)制得的cdna。標記核酸還包括此類序列,其由于遺傳代碼的簡并而不同于某些核酸的核苷酸序列,所述核酸編碼對應于本發(fā)明的標記(例如突變標記)的蛋白質,并因此編碼相同蛋白質,例如突變蛋白。如本文所用,短語“等位變異體”是指出現在指定基因座或通過核苷酸序列編碼的多肽的核苷酸序列。這些天然產生的等位變異通常會在指定基因的核苷酸序列中引起1-5%變化。交互等位基因可以通過對多個不同個體中,例如不患有癌癥的個體的細胞中,例如生殖系細胞中的相關基因進行測序來鑒別。此測序可以通過使用雜交探針容易地進行,從而鑒別各種個體中的相同遺傳基因座。任何和所有這些核苷酸變異和所得氨基酸多形現象或變異(這是天然產生的等位變異的結果并且不改變野生型標記基因的功能活性)的檢測打算屬于本文所述標記的野生型形式的范圍內?!皹擞浀鞍住笔且环N通過本發(fā)明的標記(例如突變體核酸)編碼或與此對應的蛋白質。術語“蛋白質”和“多肽”可互換地使用。標記的蛋白質可以特定地通過其名稱或氨基酸序列來提及,但本領域的普通技術人員應了解,突變、缺失和/或轉譯后修飾會影響蛋白質結構、外觀、細胞定位和/或行為。除非另外規(guī)定,否則這些差異在本文中不進行區(qū)分,并且本文所述的標記打算包括任何或所有此類變種。
如本文所用,“標記基因”是指可以具有突變以使得其dna、rna和/或蛋白質具有能在治療之后提供關于預后的信息(即“提供信息的”)的特征(例如大小、序列、組成或量)的基因。本文中聯系nae抑制劑、例如1-取代的氨基磺酸甲酯(例如mln4924)治療之后的結果描述的標記基因是上文所述的染色體基因座標記內的基因的實例并且提供在表1中。對應于標記基因的mrna的序列、開放閱讀框架和蛋白質也列舉在表1中。表1中所列舉的標記基因可以具有同功異型物,其或者普遍存在或者表達受限。除了cdkn2a_p14同功異型物的獨立清單之外,表1中的dnaseqidno是指編碼主要或最長同功異型物的mrna并且蛋白質seqidno至少表示此類同功異型物的前體并且不一定是成熟蛋白質。這些序列并不打算限制與所述同功異型物或前體的標記基因一致性。通過檢查在英特茲基因(由馬里蘭州貝塞斯達的美國國家生物技術信息中心維護的數據庫)下所提供,通過表1中列舉的id編號鑒別的信息,本領域的普通技術人員可容易地獲取并理解附加同功異型物和成熟蛋白質。
表1關于nae抑制劑治療的標記基因描述
如本文所用,標記的“提供信息的”特征(例如大小、序列、組成或量)是指其值或差異與預后或結果相關的特征,例如大小、序列、組成或量。標記的提供信息的特征(例如大小、序列、組成或量)可以通過分析對應于所述標記基因的核酸(例如dna或rna)或蛋白質來獲得。如果標記(例如染色體基因座標記或來自患者的樣品中的標記)的特征,例如大小(例如長度或分子量)、序列(例如核酸序列或蛋白質序列)、組成(例如堿基或氨基酸組成或肽消化或基因片段圖案)或量(例如復制數量和/或表達水平)不同于所分析的物質的野生型或等位變異體,那么這些特征可以“提供信息”。在一些實施例中,如果標記的特征表明標記基因是野生型,那么所述特征是提供信息的。在測量標記的量的實施例中,如果量大于或小于參考量的程度大于用于評定表達所用分析的標準誤差,那么所述量是“提供信息的”。標記的提供信息的表達水平可以在所測量的表達水平與結果的統計相關性之后測定,所述結果例如良好反應、不良反應、長進展時間、短進展時間、短期存活或長期存活。統計分析的結果可以建立用于選擇本文所描述方法中使用的標記的臨界值?;蛘?,具有不同特征(例如大小、序列、組成或量)的標記(例如染色體基因座標記或標記基因)將具有可預測結果的量的典型范圍。提供信息的特征(例如大小、序列、組成或量)是屬于針對結果測定的特征(例如大小、序列、組成或量)范圍內的特征,例如大小、序列、組成或量。再者,設定為通過本文中所提供的方法測定,如果一組標記的特征(例如尺寸、序列、組合物或量)的組合或者滿足或者高于或低于標記(例如染色體基因座標記或標記基因)的預定評分,那么這組標記可以一起“提供信息”。除可以改變標記序列或組成的點突變之外,基因易位、轉錄物剪接變異、缺失和截短也是可以改變標記大小、序列或組成的事件的實例。僅測量標記基因(即dna、rna或蛋白質)的一個特征(例如標記)即可提供預后,即表明結果。當兩個特征的提供信息的量彼此一致,即結果的生物學不矛盾時,測量標記基因的一個以上特征(例如標記)可以提供預后。標記基因的多個特征的一致測量結果的實例可以鑒別dna或rna中的無義突變或缺失和低量或低分子量的所編碼的蛋白質,或編碼結合袋的區(qū)域中的突變或蛋白質的活性位點和所編碼蛋白質的低活性。當蛋白質在具有基于其活性水平控制其合成的反饋環(huán)路的路徑中時,可以發(fā)生不同實例。在此實例中,蛋白質的低量或低活性可以與其突變mrna的高量相關,因為組織由于標記基因突變而缺乏蛋白質活性并重復地發(fā)信號產生蛋白質。
如本文所用,“基因缺失”是指dna復制數量的量小于2并且“擴增”是指dna復制數量的量大于2。“二倍體”量是指復制數量等于2。術語“二倍體或擴增”可以解釋為“不缺失”基因復制。在替代性提供信息的量是基因缺失的標記中,一般不會看到擴增。反之,術語“二倍體或缺失”可以解釋為“不擴增”復制數量。在替代性提供信息的量是擴增的標記中,一般不會看到基因缺失。為清楚起見,序列缺失可以由于標記基因突變而發(fā)生在基因內并且可以引起轉錄蛋白質或縮短mrna或蛋白質的缺乏。此類缺失不會影響復制數量。
術語“長期存活”和“短期存活”是指在接受第一劑量治療之后癌癥患者預測存活的時間長度。“長期存活者”是指預期比那些鑒別為短期存活者的患者具有更慢的進展速率或更遲死于腫瘤的患者?!霸黾拥拇婊睢被颉案乃劳鏊俾省笔腔诒疚乃鰳擞浿械囊换蚨嗾叩奶卣?例如大小、序列、組成或量)的評估壽命決定,例如如相比于參考標準以使得70%、80%、90%或90%以上的群體在接受第一劑量治療之后將存活足夠的時間段?!案斓乃劳鏊俾省被颉案痰拇婊顣r間”是指基于本文所述標記中的一或多者的特征(例如大小、序列、組成或量)的評估壽命決定,例如如相比于參考標準以使得50%、40%、30%、20%、10%或10%以下的群體在接受第一劑量治療之后將不存活足夠的時間段。在一些實施例中,足夠的時間段是從接受癌癥療法的第一天測量,至少6、12、18、24或30個月。
如果癌癥的生長速率由于與治療劑接觸而相比于其在不與治療劑接觸情況下的生長有所抑制,那么癌癥對治療劑“起反應”或存在對治療的“良好反應”。癌癥的生長能夠以多種方式測量,例如可以測量適合于那種腫瘤類型的特征,例如腫瘤的大小或腫瘤標記的表達。舉例來說,用于支持鑒別與骨髓瘤相關的標記的反應定義和其對nae抑制劑、例如1-取代的氨基磺酸甲酯療法的反應,可以使用如布雷德(blade)等人(1998)《英國血液學雜志》(brjhaematol.)102:1115-23中所述的西南腫瘤組(southwesternoncologygroup;swog)準則。這些準則定義了在骨髓瘤中測量的反應的類型以及疾病進展時間的特征,所述疾病進展時間是腫瘤對治療劑的敏感性的另一種重要度量方式。關于實體腫瘤,實體腫瘤的反應評估準則(recist)指南(艾森豪爾(eisenhauer)等人(2009)《歐洲癌癥雜志》(e.j.canc.)45:228-247)可以用于支持與實體腫瘤相關的標記和實體腫瘤對nae抑制劑的反應的鑒別。國際技術工作組周期性地召集起來設定、更新并公開各種類型癌癥的反應準則??梢宰裱@些公開的報導以支持本發(fā)明腫瘤的標記和其對nae抑制劑的反應的鑒別。實例是急性骨髓性白血病(aml,謝森(cheson)等人(2003)《臨床腫瘤學雜志》(j.clin.oncol.)21:4642-4649)、淋巴瘤,例如非霍奇金氏(non-hodgkin′s)和霍奇金氏淋巴瘤(謝森等人(2007)《臨床腫瘤學雜志》25:579-596)的準則。準則考慮分析方法,例如正電子發(fā)射斷層攝影法(positronemissiontomography;pet),例如用于鑒別具有可測量的改變的代謝活性的位點(例如在腫瘤位點)或用于體內跟蹤特異性標記到腫瘤中;免疫組織化學,例如用于通過檢測抗體與特異性腫瘤標記的結合來鑒別腫瘤細胞;以及流動式細胞測量術,例如用于除例如組織學等傳統方法之外,通過不同的標記和熒光染色來表征細胞類型,從而鑒別細胞組成(例如血涂片或骨髓生檢中的原始細胞計數、有絲分裂象的存在和數量)或組織結構(例如基膜的無序組織架構或細胞浸潤)。對nae抑制劑、例如1-取代的氨基磺酸甲酯療法的反應的質量可以是可變的,其中在不同條件下,不同癌癥展現對指定治療劑的不同“反應”水平。再者,反應性的測量可以使用除腫瘤生長大小之外的附加準則來評定,包括患者生活質量、轉移程度等。另外,可以在可適用的情況下評定臨床預后標記和變異(例如骨髓瘤中的m蛋白、前列腺癌中的psa水平)。
如果當相比于在不與治療劑接觸情況下癌癥的生長時,作為與治療劑接觸的結果,癌癥的生長速率不被抑制,或抑制程度極低,那么癌癥對治療劑是“非反應性”或具有“不良反應”或存在對治療的不良反應。如以上所述,癌癥的生長能夠以多種方式測量,例如可以測量適合于那種腫瘤類型的腫瘤的大小或腫瘤標記的表達。舉例來說,可以使用用于支持與腫瘤對治療劑的非反應相關的標記的鑒別的反應定義、指南,例如以上所述的那些。對治療劑的非反應的質量可以是高度可變的,其中在不同條件下,不同癌癥展現對指定治療劑的不同的“非反應”水平。再者,非反應性的測量可以使用除腫瘤生長大小之外的附加準則來評定,包括患者生活質量、轉移程度等。另外,可以在可適用的情況下評定臨床預后標記和變異(例如骨髓瘤中的m蛋白、前列腺癌中的psa水平)。
如本文所用,“長進展時間”、“長ttp”和“短進展時間”、“短ttp”是指直到通過治療帶來的穩(wěn)定疾病轉化為活性疾病為止的時間量。有時,治療產生既不是良好也不是不良的反應的穩(wěn)定疾病,例如mr,所述疾病僅僅在一段時間內不再變糟,例如變成進行性疾病。這段時間可以是至少4-8周、至少3-6個月或6個月以上。
“治療”應意指使用療法來預防或抑制進一步腫瘤生長,以及用于促使腫瘤收縮,并且用于提供更長的存活時間。治療也打算包括預防腫瘤轉移。如果癌癥或腫瘤的至少一個癥狀(如通過本領域中已知和本文所述的反應性/非反應性、進展時間或指示劑測定)得到緩解、終止、減緩、最小化或防止,那么腫瘤得到“抑制”或“治療”。依據使用如本文進一步描述的治療方案(例如nae抑制劑,例如1-取代的氨基磺酸甲酯方案)治療,腫瘤的身體方面或其它方面的任何癥狀的任何改進在本發(fā)明的范圍內。
如本文所用,術語“藥劑”概括地定義為可以使癌細胞(包括腫瘤細胞)暴露于治療方案中的任何藥劑。在本發(fā)明的上下文中,這些藥劑包括(但不限于)如本領域中已知并在本文中進一步詳細描述的nae抑制劑,例如1-取代的氨基磺酸甲酯藥劑,以及化學治療劑。
術語“探針”是指能夠選擇性地結合到特定地想要的目標分子(例如本發(fā)明的標記)的任何分子,例如分離的分子。探針或者可以通過本領域普通技術人員合成,或者衍生自恰當的生物制劑。出于檢測目標分子的目的,探針可以特定地設計成被標記,如本文所述??梢杂米魈结樀姆肿拥膶嵗?但不限于)rna、dna、蛋白質、抗體和有機單體。
標記的“正?!碧卣?例如大小、序列、組成或量)可指在“參考樣品”中的特征(例如大小、序列、組成或量)。參考樣品可以是來自從其獲得腫瘤(例如具有體細胞突變的腫瘤)的同一患者的相匹配的正常的(例如生殖系)樣品。參考樣品可以是來自不患有標記相關疾病的健康個體的樣品;或若干健康個體中野生型標記的參考特征,例如平均特征,例如大小、序列、組成或量。參考樣品特征(例如大小、序列、組成或量)可以包含來自參考數據庫的一或多個標記的特征(例如大小、序列、組成或量)。或者,標記的“正?!碧卣?例如大小、序列、組成或表現水平)是類似環(huán)境或反應情況中來自從其獲得腫瘤的同一患者的非腫瘤細胞中的標記(例如標記基因)的特征(例如大小、序列、組成或量)。正常的dna復制數量的量是2或二倍體,但除雄性中的x連接基因之外,其中正常dna復制數量是1。
標記基因的“過度表達”和“表達不足”分別是指例如如通過mrna或蛋白質測量,患者標記基因的表達水平高于或低于(例如超過二分之三倍、至少兩倍、至少三倍的更高或更低的水平等)測試樣品中標記基因的正常表現水平,所述高出或低出的程度大于用于評定表達的分析的標準誤差。“顯著”表達水平可指或者滿足或者高于或低于如通過本文中提供的方法測定的標記基因設定的預定評分的水平。
“互補序列”是指在兩個核酸鏈的區(qū)域之間或在同一核酸鏈的兩個區(qū)域之間互補的序列的廣義概念。已知第一核酸區(qū)的腺嘌呤殘基能夠與反平行于所述第一區(qū)的第二核酸區(qū)的殘基(如果所述殘基是胸腺嘧啶或尿嘧啶)形成特定氫鍵(“堿基配對”)。類似地,已知第一核酸鏈的胞嘧啶殘基能夠與反平行于所述第一鏈的第二核酸鏈的殘基(如果所述殘基是鳥嘌呤)堿基配對。如果在以反平行方式排列核酸的第一區(qū)與同一或不同核酸的第二區(qū)時,所述第一區(qū)的至少一個核苷酸殘基能夠與所述第二區(qū)的殘基堿基配對,那么所述第一區(qū)與所述第二區(qū)互補。在一個實施例中,第一區(qū)包含第一部分并且第二區(qū)包含第二部分,其中,在以反平行方式排列第一和第二部分時,第一部分的核苷酸殘基中至少約50%、至少約75%、至少約90%或至少約95%或所有都能夠與所述第二部分中的核苷酸殘基堿基配對。
如本文所用的“同源”是指同一核酸鏈的兩個區(qū)域之間或兩個不同核酸鏈的區(qū)域之間的核苷酸序列類似性。當兩個區(qū)域中的核苷酸殘基位置均被相同核苷酸殘基占據時,則所述區(qū)域在那個位置是同源的。如果每個區(qū)域的至少一個核苷酸殘基位置被相同殘基占據,那么第一區(qū)與第二區(qū)同源。兩個區(qū)域之間的同源性是關于被相同核苷酸殘基占據的兩個區(qū)域的核苷酸殘基位置的比例(即通過一致性百分比)來表示的。舉例來說,具有核苷酸序列5′-attgcc-3′的區(qū)域和具有核苷酸序列5′-tatggc-3′的區(qū)域共享50%一致性的同源性。在一個實施例中,第一區(qū)包含第一部分并且第二區(qū)包含第二部分,其中,每一部分的核苷酸殘基位置中至少約50%、至少約75%、至少約90%或至少約95%被相同核苷酸殘基占據。在100%一致性的實施例中,每一部分的所有核苷酸殘基位置都被相同核苷酸殘基占據。
除非在此另外說明,否則術語“抗體”廣泛地涵蓋天然產生的抗體形式,例如多克隆抗體(例如igg、iga、igm、ige)和單克隆與重組抗體,例如單鏈抗體、雙鏈和多鏈蛋白質、嵌合抗體、cdr移植抗體、人類抗體和人類化抗體和多特異性抗體,以及所有上述抗體的片段和衍生物,所述片段(例如dab、scfv、fab、f(ab)′2、fab′)和衍生物具有至少一個抗原結合位點。抗體衍生物可以包含結合到抗體的蛋白質或化學部分。術語“抗體”還包括合成的和基因工程化的變異體。
“試劑盒”是包含用于特異性檢測本發(fā)明的標記或標記組的至少一種試劑(例如探針)的任何制品(例如包裝或容器)。所述制品能夠以用于對例如已從患者獲得的樣品例如體外進行本發(fā)明方法的單元形式進行推銷、配銷、出售或提供出售。此類試劑盒中所包括的反應劑可以包含至少一種核酸探針和任選地一或多種適用于檢測標記特征(例如大小、序列、組成或量,例如表達)的引物和/或抗體。另外,本發(fā)明的試劑盒可以含有描述合適的檢測分析的說明書。此類試劑盒可以方便地用于例如臨床或合同測試環(huán)境中,用于產生信息,例如關于一或多個標記的表達水平、特征(例如大小、序列或組成)的信息,記錄、存儲、傳播或接受所述信息以診斷、評估或治療展現癌癥癥狀的患者,尤其是展現可能存在能夠用nae抑制療法治療的癌癥的患者,所述癌癥包括例如血液癌癥,例如骨髓瘤(例如多發(fā)性骨髓瘤)、淋巴瘤(例如非霍奇金氏淋巴瘤)、白血病(例如急性骨髓性白血病);和實體腫瘤(例如皮膚、肺乳房、卵巢等的腫瘤)。
本發(fā)明方法和組合物經設計適用于診斷和治療罹患癌癥的患者。根據本發(fā)明方法來治療或診斷癌癥或腫瘤?!鞍┌Y”或“腫瘤”打算包括患者中的任何贅生性生長,包括初始腫瘤和任何轉移。癌癥可以是血液型或實體腫瘤型。血液腫瘤包括血液來源的腫瘤,包括例如骨髓瘤(例如多發(fā)性骨髓瘤)、白血病(例如瓦爾登斯特倫綜合征(waldenstrom′ssyndrome)、慢性淋巴球性白血病、急性骨髓性白血病、慢性骨髓性白血病、其它白血病)、淋巴瘤(例如b細胞淋巴瘤、非霍奇金氏淋巴瘤)和骨髓發(fā)育不良綜合癥。實體腫瘤可以起源于器官中,并且包括以下癌癥:例如皮膚癌、肺癌、腦癌、乳癌、前列腺癌、卵巢癌、結腸癌、腎癌、胰臟癌、肝癌、食道癌、胃癌、腸癌、膀胱癌、子宮癌、子宮頸癌、頭頸癌、中樞神經系統癌、骨癌、睪丸癌、腎上腺癌等。癌癥可以包含其中標記基因具有突變的細胞。如本文所用,癌細胞(包括腫瘤細胞)是指以異常(增加的)速率分裂或其生長或存活控制不同于癌細胞出現或生長的同一組織中的細胞的細胞。癌細胞包括(但不限于)在以下各者中的細胞:癌瘤,例如鱗狀細胞癌、基底細胞癌、汗腺癌、皮脂腺癌、腺癌、乳頭狀癌、乳頭狀腺癌、囊腺癌、髓性癌、未分化性癌、支氣管癌、黑素瘤、腎細胞癌、肝腫瘤-肝細胞癌、膽管癌、膽管上皮癌、乳頭狀癌、移行細胞癌、絨膜癌、精原細胞瘤、胚胎性癌、乳腺癌、胃腸癌、結腸癌、膀胱癌、前列腺癌和頭頸部區(qū)域的鱗狀細胞癌;肉瘤,例如纖維肉瘤、粘液肉瘤、脂肉瘤、軟骨肉瘤、骨原性肉瘤、軟骨肉瘤、血管肉瘤、內皮肉瘤、淋巴管肉瘤、滑膜肉瘤和間皮肉瘤;血液學癌癥,例如骨髓瘤、白血病(例如急性骨髓性白血病、慢性淋巴球性白血病、粒細胞白血病、單核細胞性白血病、淋巴球性白血病);和淋巴瘤(例如濾泡性淋巴瘤、套細胞淋巴瘤、彌漫性大b細胞淋巴瘤、惡性淋巴瘤、漿細胞瘤、網狀細胞肉瘤或霍奇金氏病);以及神經系統腫瘤,包括神經膠質瘤、腦脊膜瘤、神經管胚細胞瘤、神經鞘瘤或室管膜瘤。
如本文所用,術語“非侵襲性”是指對個體造成極小傷害的程序。在臨床應用的情況下,非侵襲性取樣程序可以迅速進行,例如在步入式環(huán)境(walk-insetting)中,通常在無麻醉的情況下和/或在不實施手術或縫合的情況下。非侵襲性樣品的實例包括血液、血清、唾液、尿液、腮抹試(buccalswab)、咽喉培養(yǎng)物、大便樣品和子宮頸涂片。非侵襲性診斷性分析包括x射線、磁共振成像、正電子發(fā)射斷層攝影法等。
本文描述了通過測量藥物基因組標記的量評定腫瘤治療結果。還描述了通過非侵襲性、便利的或低成本方式,例如從血液樣品評定結果。測定癌癥程度或血液腫瘤(例如淋巴瘤、白血病,例如急性骨髓性白血病、骨髓瘤(例如多發(fā)性骨髓瘤))結果的典型方法可以采用骨髓生檢來收集組織用于基因型或表型,例如組織學分析。本發(fā)明提供用于確定、評定、建議或提供治療患者的腫瘤或管理其疾病的恰當療法方案的方法。使用本文中所揭示的試劑盒和方法監(jiān)控治療可以鑒別不利結果的可能性并且允許其預防,并且因此通過調整治療方案、停止療法或使用替代性療法來節(jié)省發(fā)病、死亡和治療成本。
術語“生物樣品”打算包括患者樣品,例如組織、細胞、生物流體和其自個體分離的分離物,以及存在于個體內的組織、細胞和流體;并且可以從患者或正常個體獲得。在骨髓的血液腫瘤(例如骨髓瘤腫瘤)中,可以對骨髓樣品進行腫瘤的初級分析。然而,一些腫瘤細胞(例如克隆型腫瘤細胞、循環(huán)內皮細胞)是全血中細胞群體的一部分。這些細胞也可以在用粒細胞-群落刺激因子(granulocyte-colonystimulatingfactor;g-csf)治療患者期間移動到血液中以準備骨髓移植、血液腫瘤(例如白血病、淋巴瘤和骨髓瘤)的標準治療。在多發(fā)性骨髓瘤中的循環(huán)腫瘤細胞的實例已經被皮拉斯基(pilarski)等人(2000)《血液》(blood)95:1056-65和里古林(rigolin)等人(2006)《血液》107:2531-5研究。因此,例如用于體外測量標記以測定治療結果的非侵襲性樣品可以包括周邊血液樣品。因此,可以測試周邊血液中的細胞的標記量。關于患有血液腫瘤的患者,對照參考樣品的正常特征(例如大小、序列、組成或量)可以從患者的皮膚或腮抹試獲得。關于實體腫瘤,典型腫瘤樣品是腫瘤的生檢并且因此包含實體腫瘤細胞?;蛘撸瑥哪[瘤位點脫落或刮下的腫瘤細胞的樣品可以非侵襲性地收集于例如血液、唾液、乳頭吸液、尿液、大便、子宮頸涂片等中。關于實體腫瘤,用于正常特征(例如大小、序列、組成或量)的對照參考樣品可以從患者的血液中獲得。
血液收集容器可以包含抗凝血劑,例如肝素或乙二胺四乙酸(edta)、檸檬酸鈉或檸檬酸鹽溶液以及用于保護血液完整性的添加劑,例如右旋糖或白蛋白或緩沖液,例如磷酸鹽。如果標記的量是通過測量樣品中其dna的水平來測量,那么可以向所述樣品中添加dna穩(wěn)定劑,例如抑制dna酶的藥劑。如果標記的量是通過測量樣品中其rna的水平來測量,那么可以向所述樣品中添加rna穩(wěn)定劑,例如抑制rna酶的藥劑。如果標記的量是通過測量樣品中其蛋白質的水平來測量,那么可以向所述樣品中添加蛋白質穩(wěn)定劑,例如抑制蛋白酶的藥劑。血液收集容器實例是適用于在收集血液時穩(wěn)定rna的
或者,可以分析腫瘤細胞系,例如oci-ly3、oci-ly10細胞(阿里扎德(alizadeh)等人(2000)《自然》403:503-511)、rpmi6666細胞、sup-b15細胞、kg-1細胞、ccrf-sb細胞、8es細胞、kasumi-1細胞、kasumi-3細胞、bdcm細胞、hl-60細胞、mo-b細胞、jm1細胞、ga-10細胞或b細胞淋巴瘤(例如bc-3)或細胞系或腫瘤細胞系集合(例如,參見麥克德莫特(mcdermott)等人(2007)國家科學院院刊(pnas)104:19936-19941或oncopaneltm抗癌腫瘤細胞剖析篩選(華盛頓州波塞爾的里切爾卡生物科學公司(ricercabiosciences,bothell,wa)))。本領域的技術人員可以容易地選擇并獲得用于本發(fā)明方法中的恰當的細胞(例如來自弗吉尼亞州馬納薩斯(manassas,va)的美國典型培養(yǎng)物保藏中心
在評定樣品中標記的量之前,樣品(例如腫瘤(例如生檢或骨髓)樣品、血液或修飾血液(例如包含腫瘤細胞)樣品和/或參考(例如匹配對照(例如生殖系))樣品)可以經歷各種眾所周知的收集后制備和儲存技術(例如核酸和/或蛋白質萃取、固定、儲存、冷凍、超濾、濃縮、蒸發(fā)、離心等)。
在一個實施例中,標記基因的突變狀態(tài)(例如標記的突變)可以通過對與標記基因相關的核酸(例如dna、rna、cdna)或蛋白質進行測序來鑒別。本領域中已知若干測定核酸序列的測序方法。核酸引物可以經設計以結合到包含潛在突變位點的區(qū)域或可以經設計以與突變序列而不是野生型序列互補。引物對可以經設計以包圍標記基因中包含潛在突變的區(qū)域。引物或引物對可以用于對應于標記基因的dna的一條或兩條鏈的測序。引物可以與探針(例如核酸探針,例如雜交探針)結合使用以在測序之前擴增相關區(qū)域,從而增加用于檢測標記基因中的突變的序列量??梢詼y序的區(qū)域的實例包括完整基因、基因轉錄物和基因或轉錄物的片段,例如外顯子或非轉譯區(qū)中的一或多者。用于靶向引物選擇和序列或組成分析的突變的實例可見于收集突變信息的公用數據庫中,例如cosmic和dbgap。標記基因(例如nf2、smad、kdm6a或fbxw7)的一些突變列舉在實例中的表8-11中,作為可能與對nae抑制(例如通過氨基磺酸1-甲酯、例如mln4924抑制)的敏感性相關的突變的實例。
測序方法對本領域普通技術人員是已知的。方法的實例包括桑格法(sangermethod)、sequenomtm法和下一代測序(nextgenerationsequencing;ngs)法。桑格法包含使用電泳,例如毛細管電泳來分離引物伸長的標記dna片段,可以自動化用于高通量應用。引物延伸部測序可以在相關區(qū)域的pcr擴增之后進行。軟件可以幫助序列堿基讀出(basecalling)和突變鑒別。sequenomtm
蛋白質和核酸的組成可以通過本領域中已知的許多方式測定,例如通過以分解、降解或消化其之方式對其進行處理并且然后分析組分。質譜、電泳和色譜可以分離并定義組分以便比較。引起缺失或插入的突變可以在這些方法中通過大小或電荷差異來鑒別。在一些突變之后,蛋白質消化或限制酶核酸消化可以顯示不同的片段圖案。在氨基酸的結構的情況下,識別特定突變體氨基酸的抗體可以鑒別并檢測樣品中的這些突變(參見下文)。
在一個實施例中,dna(例如對應于野生型或突變標記的基因組dna)可以使用本領域中已知的方法,在生物樣品中通過原位和通過體外形式兩者來分析。dna可以直接從樣品中分離或在分離另一種細胞組分(例如rna或蛋白質)之后分離。試劑盒可用于dna分離,例如
在另一個實施例中,對應于標記的mrna可以使用本領域中已知的方法,在生物樣品中通過原位和通過體外形式兩者來分析。用于測量表達水平的方法的實例包括在實例中。舉例來說,可以使用核酸探針與標記雜交并且可以測量雜交探針的量。許多表達檢測方法使用分離rna。關于體外方法,可以采用不選擇抵抗mrna分離的任何rna分離技術來從腫瘤細胞純化rna(例如,參見奧斯貝(ausubel)等人編,《分子生物學最新方案》(currentprotocolsinmolecularbiology),約翰·威利父子公司(johnwiley&sons),紐約1987-1999)。此外,大量組織樣品可以使用本領域的普通技術人員眾所周知的技術容易地處理,所述技術例如肖姆斯基(chomczynski)(1989,美國專利第4,843,155號)的單一步驟rna分離過程。rna可以使用標準程序分離(例如,參見肖姆斯基和薩基(sacchi)(1987)《分析生物化學》(anal.biochem.)162:156-159)、溶液(例如曲利唑(trizol),tri
可以采用附加步驟以從rna樣品中移出dna。細胞溶解可以用非離子洗滌劑,接著微量離心以移出細胞核并由此移出細胞dna塊體來實現。接著可以從細胞核中分離dna用于dna分析。在一個實施例中,rna是使用硫氰酸胍溶解,接著cscl離心以從dna分離rna而從各種類型的相關細胞中萃取(徹格溫(chirgwin)等人(1979)《生物化學》(biochemistry)18:5294-99)。通過用寡聚-dt纖維素選擇來選擇聚(a)+rna(參見薩姆布魯克(sambrook)等人(1989)《分子克隆實驗手冊》(第2版),冷泉港實驗室,冷泉港,紐約)。或者,可以通過有機萃取,例如用熱苯酚或苯酚/氯仿/異戊醇萃取實現dna與rna的分離。必要時,可以向溶解緩沖液中添加rna酶抑制劑。類似地,關于某些細胞類型,可能需要向所述方案中添加蛋白質變性/消化步驟。關于許多應用,需要相對于其它細胞rna(例如轉運rna(trna)和核糖體rna(rrna))富集mrna。大部分mrna在其3′末端含有聚(a)尾部。此允許其通過親和色譜法濃縮,例如使用耦合到固體支撐物(例如纖維素或sephadex.rtm介質)的寡聚(dt)或聚(u)(參見奧斯貝等人(1994)《分子生物學最新方案》,第2卷,最新方案出版(currentprotocolspublishing),紐約)。結合之后,使用2mmedta/0.1%sds使聚(a)+mrna從親和性管柱洗提。
例如在從測試個體獲得生物樣品(例如骨髓樣品、腫瘤生檢或參考樣品)之后,生物樣品中本發(fā)明標記的特征可以通過任何各種眾所周知的檢測或測量例如核酸(例如rna、mrna、基因組dna或cdna)和/或轉譯蛋白質的特征的方法評定。這類方法的非限制性實例包括檢測分泌性、細胞表面、細胞質或細胞核蛋白質的免疫方法、蛋白質純化方法、蛋白質功能或活性分析、核酸雜交方法、核酸反轉錄方法和核酸擴增方法。這些方法包括基因陣列/芯片技術、rt-pcr、
用于檢測對應于本發(fā)明標記的多肽的體外技術包括酶聯免疫吸附分析(enzymelinkedimmunosorbentassay;elisa)、西方印跡法、蛋白質陣列、免疫沉淀反應和免疫熒光法。在此些實例中,標記表達使用抗體(例如放射性標記、發(fā)色團標記、熒光團標記或酶標記抗體)、抗體衍生物(例如與底物或與蛋白質-配位體對(例如生物素-抗生蛋白鏈菌素)的蛋白質或配位體結合的抗體)或抗體片段(例如單鏈抗體、分離抗體高變結構域等)來評定,所述抗體、抗體衍生物或抗體片段與標記蛋白或其片段特異性結合,例如包含可以突變的區(qū)域或包含突變序列的部分或在其結構情形中的突變殘基的蛋白質或片段,包括已經經歷全部或一部分其正常轉譯后修飾的標記蛋白??贵w可以檢測氨基酸序列選自由以下組成的群組的蛋白質:seqidno:3、6、10、11、14、17、20和23?;蛘?,抗體可以檢測變異體氨基酸序列選自由以下組成的群組的突變蛋白質:seqidno:3、6、10、11、14、17、20和23的突變體??梢栽诿庖咴越M合物中制備在例如cosmic或dbgap等公用數據庫中列舉為突變的殘基用于產生將特異性識別并結合到所述突變體殘基的抗體。另一種方法可以采用抗體對,其中所述對中的一個將標記蛋白上游,即n端結合到預期突變區(qū)域,例如無義或缺失,并且所述對中的另一個將結合蛋白下游。野生型蛋白將結合所述對的兩個抗體,但具有無義或缺失突變的蛋白質將僅結合所述對的n端抗體。例如夾心elisa分析的分析可以檢測腫瘤樣品中野生型蛋白質的數量例如相比于參考樣品的損失,或標準elisa將比較抗體的結合水平,從而推斷在腫瘤樣品中存在突變。
測定蛋白質標記的量或功能的間接方法也包括測量蛋白質的活性。舉例來說,可以針對標記蛋白活性評定樣品或從樣品中分離或從核酸表達的蛋白質,所述核酸從樣品分離、克隆或擴增。nf2活性可以通過其與結合伴侶結合的能力來測量,例如在無細胞分析中或在基于細胞的分析中。在一個實例中,可以測量nf2與紅血細胞膜或p55/mpp1結合的能力(賽歐(seo)等人(2009)《實驗生物與醫(yī)學》(exp.biol.med.)234:255-262)。在另一實例中,smad4活性可以通過其在信號轉導中的活性來測量,例如在無細胞分析中或在基于細胞的分析中。在一個實例中,可以測量smad4的磷酸化狀態(tài),可以測量smad4與dna在smad-結合元件處的結合,例如在凝膠阻滯分析(gelshiftassay)中或在報告基因分析(reporterassay)中(例如,參見匡(kuang)和陳(chen)(2004)《致癌基因》23:1021-1029),或可以使細胞核與細胞質之間的smad4的易位顯色并在細胞圖像上定量。在另一實例中,kdm6a活性可以通過其使蛋白質,例如組蛋白脫甲基的能力來測量。舉例來說,分析可以測量組蛋白3的賴氨酸27的脫甲基化水平(洪(hong)等人(2007)國家科學院院刊104:18439-18444)。在另一實例中,fbxw7活性可以通過其結合周期素e或結合到skp-科林-f盒泛素連接酶復合物中的能力來測量。在另一實例中,tp53活性可以通過結合dna或形成四聚體的能力來測量。
在一個實施例中,標記的表達通過從患者樣品的細胞制備mrna/cdna(即轉錄聚核苷酸),并且通過使mrna/cdna與參考聚核苷酸雜交來評定,所述參考聚核苷酸例如經分離核酸探針,例如雜交探針,其是標記核酸的互補序列或其片段。cdna可以任選地在與參考聚核苷酸雜交之前使用任何各種聚合酶鏈式反應方法擴增。一或多個標記的表達類似地可以使用定量pcr檢測以評定標記的表達水平。測量mrna水平的用途的實例是標記基因的失活性突變可以引起細胞中mrna水平改變。所述水平可以由于反饋信號傳導蛋白質產生,鑒于非功能性蛋白質或缺乏蛋白質而上調或由于經改變的mrna序列的不穩(wěn)定性下調?;蛘?,可使用檢測本發(fā)明標記的突變或變異體(例如上文所論述的單一核苷酸多形現象、缺失等)的許多已知方法中的任一種來檢測患者標記基因中突變的發(fā)生。
直接測量的實例是定量轉錄物。如本文所用,表達水平或量是指通過標記編碼的mrna的絕對表達量或通過標記編碼的蛋白質的絕對表達量。作為基于選擇標記的絕對表達量做決定的替代方案,可以基于標準化表達量做決定。表達量可以通過在比較標記的表達與不是標記的對照標記(例如起組成性表達的管家作用)的表達之后校正標記的絕對表達水平進行標準化用于標準化的合適的標記也包括管家基因,例如肌動蛋白基因或β-2微球蛋白。用于數據標準化的參考標記包括泛表達的標記和/或其表達不是通過致癌基因調節(jié)的標記。組成性表達基因是本領域中已知的并且可以根據患者的相關組織和/或情況和分析方法進行鑒別和選擇。這類標準化允許比較一個樣品的表達水平與另一個樣品的表達水平,例如來自不同時間或不同個體的樣品之間的表達水平。此外,表達水平可以按相對表達水平形式提供?;蚪Mdna樣品的基線(例如二倍體復制數量)可以通過測量來自未患有腫瘤的個體的細胞或患者的非腫瘤細胞中的量來測定。為了測定標記或標記組的相對量,在測定所討論樣品的表達水平之前,測定至少1或2、3、4、5或5個以上樣品,例如7、10、15、20或50或50個以上樣品的標記或標記組的量以建立基線。為了建立基線測量,測定更大數量樣品中所分析的標記或標記組中每一個的平均量或水平并且將此用作所討論的生物標記或生物標記組的基線表達水平。所測定的測試樣品的標記或標記組的量(例如絕對表達水平)然后除以關于所述標記或標記組獲得的基線值。此提供相對量并且輔助鑒別標記蛋白活性的異常水平。
基于本發(fā)明的核酸分子的序列的探針可以用于檢測對應于一或多個本發(fā)明標記的轉錄物或基因組序列。探針可以包含與其連接的標記基團,例如放射性同位素、熒光化合物、酶或酶輔因子。這類探針可以用作用于鑒別表達蛋白質的細胞或組織的診斷測試試劑盒的一部分,例如通過測量來自個體的細胞樣品中編碼蛋白質的核酸分子的水平,例如檢測mrna水平或測定編碼蛋白質的基因是否已經突變或缺失。
除本文所述的數據庫記錄中所描述的核苷酸序列之外,本領域的普通技術人員還應了解引起氨基酸序列變化的dna序列多形現象可以存在于群體(例如人類群體)中。這類遺傳多形現象可以由于天然產生的等位變異而存在于群體內的個體中。等位基因是可替代地出現在指定遺傳基因座處的一組基因中的一個。另外,應了解影響rna表達水平的dna多形現象也可以存在,其可以影響所述基因的整體表達水平(例如通過影響調節(jié)或降解)。
引物或核酸探針包含與特異性標記或其突變區(qū)域互補的核苷酸序列并且其長度足以選擇性地雜交標記基因或與標記基因相關的核酸,例如其可以結合具有堿基序列特異性的核酸并且在洗滌之后保持結合。引物和探針可以用于輔助標記核酸的分離和測序。在一個實施例中,引物或核酸探針(例如實質上純化的寡核苷酸、經分離核酸)包含一個區(qū)域,所述區(qū)域所具有的核苷酸序列例如在嚴格條件下與標記基因的約6、8、10、12、15、20、25、30、40、50、60、75、100、200、350、500或500個以上連續(xù)核苷酸雜交;或包含標記基因或來自其的轉錄物或互補序列的突變的區(qū)域。在另一個實施例中,引物或核酸探針能夠與包含以下核苷酸序列的標記核酸雜交:seqidno:1、2、4、5、7、8、9、12、13、15、16、18、19、21、22、24、25中的任一者所闡述的任何序列,或從堿基對29999545到30094589的染色體22q、從堿基對48556583到48611412的染色體18q、從堿基對44732423到44971847的染色體xp、從堿基對153242410到153456172的染色體4q、從堿基對7571720到7590868的染色體17p、從堿基對21967751到21994490的染色體9p上的序列,或上述任一者的互補序列。舉例來說,本發(fā)明提供包含核苷酸序列的引物或核酸探針,所述核苷酸序列具有至少約10個連續(xù)核苷酸、至少約15個連續(xù)核苷酸、至少約25個連續(xù)核苷酸、至少約35個連續(xù)核苷酸、至少約50個連續(xù)核苷酸,或具有seqidno:1、2、4、5、7、8、9、12、13、15、16、18、19、21、22、24到25中的任一者所闡述的約15到約20個核苷酸,或在從堿基對29999545到30094589的染色體22q、從堿基對48556583到48611412的染色體18q、從堿基對44732423到44971847的染色體xp、從堿基對153242410到153456172的染色體4q、從堿基對7571720到7590868的染色體17p、從堿基對21967751到21994490的染色體9p上的序列,或上述任一者的互補序列。具有超過約25、40或50個核苷酸的序列的引物或核酸探針也在本發(fā)明的范圍內。在另一個實施例中,引物或核酸探針可以具有與任何以下所闡述的任何序列的核苷酸序列至少70%、至少75%、80%或85%或至少90%、95%或97%相同的序列:seqidno:1、2、4、5、7、8、9、12、13、15、16、18、19、21、22、24、25,或在從堿基對29999545到30094589的染色體22q、從堿基對48556583到48611412的染色體18q、從堿基對44732423到44971847的染色體xp、從堿基對153242410到153456172的染色體4q、從堿基對7571720到7590868的染色體17p、從堿基對21967751到21994490的染色體9p上的序列,或上述任一者的互補序列。核酸類似物可以用作雜交的結合位點。合適的核酸類似物的實例是肽核酸(例如,參見埃格霍爾姆(egholm)等人,《自然》363:566568(1993);美國專利第5,539,083號)。
在一些實施例中,核酸探針可以經設計以結合野生型序列,因此在所述區(qū)域存在突變可以引起所述探針的結合或雜交降低,例如可測量程度地降低。在另一個實施例中,核酸探針可以經設計以結合突變體序列,因此在所述區(qū)域存在突變可以引起所述探針的結合或雜交增加。在其它實施例中,探針和引物組或引物對可以經設計以支托可以具有突變的標記區(qū)域,因此基于所述組或對的擴增可以產生可以測序以鑒別突變的核酸。
引物或核酸探針可以使用考慮了結合能量、堿基組成、序列復雜性、交叉雜交結合能量和二級結構的算法進行選擇(參見2001年1月25日公開的弗蘭德(friend)等人的國際專利公開案wo01/05935;休斯(hughes)等人,《自然·生物技術》19:342-7(2001))。有用的本發(fā)明的引物或核酸探針結合針對每個轉錄物而言獨特的序列,例如目標突變區(qū)域;并且可以用于僅特定核酸,例如轉錄物或突變轉錄物的pcr擴增、檢測并測序。標記基因(例如nf2、smad4、kdm6a和fbxw7)的一些突變的實例可見于實例中的表中(表8-11)。其它突變描述于本文中所引用的參考文章中和本文中所述的公用數據庫中。本領域的技術人員可以使用在本領域中的技術,例如通過操控引物或核酸探針的簡并或gc含量調整引物或核酸探針結合標準序列、突變體或等位變異體的可能性,針對本文中所揭示的標記或具有類似特征(例如在染色體基因座上的標記)或本文所述的相同標記基因的不同區(qū)域的突變的相關標記設計引物和核酸探針。在本領域中眾所周知的計算機程序適用于設計具有所需特異性和最佳擴增特性的引物,例如歐力多(oligo)5.0版(明尼蘇達州普利茅斯的國家生物科學公司(nationalbiosciences,plymouth,mn))。雖然可以使用完全互補的核酸探針和引物來檢測本文所述的標記和其突變體、多形現象或等位基因,但是涵蓋偏離完全互補,只要此類偏離不阻止分子與目標區(qū)域特異性雜交即可。舉例來說,寡核苷酸引物可以在其5′末端具有非互補片段,但引物的剩余部分與目標區(qū)域互補。或者,非互補核苷酸可以插入到核酸探針或引物中,只要所得探針或引物仍能夠與目標區(qū)域特異性雜交即可。
治療結果的指示可以通過研究1個標記、2個標記、3個標記或4個標記或4個標記以上,例如5、6、7、8、9、10、15、20或25個標記,或其突變部分的量來評定,例如參與科林-環(huán)連接酶路徑或與所述路徑相互作用的標記基因,例如腫瘤抑制基因,例如其可以通過癌癥中的體細胞突變滅活。標記可以與另一治療結果的測量結果組合研究,例如生物化學標記(例如骨髓瘤中的m蛋白、腎健康標記,例如蛋白尿,c活性蛋白或細胞角蛋白19的血清水平、nsclc的細胞角蛋白片段21-1(cyfra21-1)、膀胱癌的血纖維蛋白原/血纖維蛋白原降解產物的尿液水平、成神經細胞瘤的兒茶酚胺的尿液或血液水平、碳水化合物抗原19-9(ca19-9)的血清水平或胰臟癌的代謝分析或間皮瘤中可溶性間皮素相關肽(smrp)的血液水平)或組織學評定(例如原始細胞計數、每單位面積有絲分裂象的數量、黑素瘤腫瘤侵襲的深度測量結果、食道腫瘤或膀胱腫瘤)。
統計方法可以幫助在測量標記的量,例如測量dna、rna或蛋白質之后確定治療結果??梢栽诙鄠€時間點,例如在用藥劑,例如nae抑制劑治療之前、在治療期間、在治療之后測量一個標記的量。為了測定例如隨時間推移標記表達距基線的變化的進展,可以通過重復測量線性回歸模型(利特爾(littell)、米利肯(miliken)、斯特魯普(stroup)、沃爾芬格(wolfinger)、斯卡彭貝格爾(schabenberger)(2006)《sas混合模型》(sasformixedmodels),第2版.北卡羅來納州凱里的sas研究所公司(sasinstitute,inc.,cary,nc))分析表達結果:
等式1
yijk-yij0=yij0+處理i+天k+(處理*天)ik+εijk
其中yijk是ith處理的jth動物的第kth天的log2轉換表達式(管家基因標準化),yij0是ith處理的jth動物的定義基線log2轉換表達式(管家基因標準化),天k處理為分類變數,并且εijk是殘留誤差項。可以指定協方差矩陣(例如一階自我回歸、復合對稱性、空間冪次法則)對每個動物隨時間推移的重復量測結果進行建模。此外,可以比較每個處理時間點與媒劑組的相同時間點,從而測試處理值是否顯著不同于媒劑。
可以使用多種其它方法來分析數據。舉例來說,可以分析相對表達值而不是周期數量。可以按倍數變化形式或按距基線的絕對差異形式檢查這些值。此外,如果所有組和時間點的方差都是相同的,那么可以使用重復測量方差分析(repeated-measuresanalysisofvariance;anova)??梢允褂靡韵聛矸治鲈谧詈笠粋€(或其它)時間點觀察到的距基線的變化:配對t檢驗、費雪精確檢驗(fisherexacttest)(p值=∑p(x=x),從x=1到情況數量,例如突變,其測試展示對nae抑制的敏感性)以測試小樣本數據的顯著性,或如果數據不是正態(tài)分布,那么使用威氏符號秩次檢驗(wilcoxonsignedranktest)來比較腫瘤患者是否顯著不同于正常個體。
從一個時間點到下一個時間點或從腫瘤樣品到正常樣品的量的差異可以表明處理結果的預后??梢酝ㄟ^測量在處理之前的1、2、3、4或4個以上時間,例如在處理之前時間零、一天、三天、一周和/或兩周或兩周以上的表達來測定基線水平。或者,可以從多個個體,例如正常個體或具有相同健康狀況或病癥并且不經歷或尚未經歷如上文所討論的治療的患者測定基線水平。或者,可以使用在美國國家生物技術信息中心(ncbi,馬里蘭州貝塞斯達)用基因表達大棚車(geneexpressionomnibus;geo)程序寄存的表達值。舉例來說,在蛋白酶體抑制療法之前取樣的骨髓瘤mrna表達量的數據集包括geo寄存編號gse9782,也在馬利根(mulligan)等人(2006)《血液》109:3177-88和gse6477中有所分析,也被晨(chng)等人(2007)《癌癥研究》67:292-9所分析。為了測試治療對腫瘤的作用,可以在一些治療之后,例如在1天、2天、3天、5天、1周、2周、3周、4周、1個月、2個月、3個月和/或6個月或6個月以上治療之后的任一時間或多個時間測量標記的表達。舉例來說,可以在一些治療之后,或以多個時間間隔,例如在治療期間1周、2周、4周或2個月、3個月或更長的時間間隔測量一次標記的量。在一些實施例中,在治療期間標記的測量結果可以與同一標記在基線的測量結果進行對比。在其它實施例中,在治療期間標記的測量結果可以與同一標記在更早時間點的測量結果進行對比。反之,為了測定在停止投與治療方案之后進行性疾病的發(fā)作,可以在例如最后一次治療之后1天、2天、3天、5天、1周、2周、3周、4周、1個月、2個月、3個月和/或6個月或6個月以上之后的任何時間或多個時間測量標記的量。在治療之后標記的測量結果可以與同一標記在治療結束時的測量結果進行對比。本領域的技術人員將取決于各種因素確定評定標記的量的時間點,所述因素例如治療的藥物動力學、治療持續(xù)時間、治療的藥效動力學、患者年齡、病癥性質或治療的作用機制。沿負方向的趨勢或標記對nae抑制療法的敏感性相對于基線或預定表達標準的量降低,例如表3中所鑒別的敏感性標記減少,可以表明腫瘤對療法的反應降低,例如抗性增加。治療結果的朝向相對于標記的基線或預定表達標準的有利結果的趨勢表明治療方案的有效性或療法的持續(xù)效益。朝向抗性標記增加,例如表3中所鑒別的抗性標記增加的趨勢可以表明不利結果。
可以在本發(fā)明的組合物、試劑盒和方法中使用任何標記,例如標記基因或標記組合,例如本發(fā)明的標記基因或其突變以及任何已知標記與標記(例如本發(fā)明的標記基因)的組合。一般來說,選擇判斷標記基因的突變狀態(tài)的能力盡可能大的標記來預測用nae抑制劑治療的結果。舉例來說,選擇包含腫瘤細胞的樣品中標記的特征(例如大小、序列、組成或量)與對照細胞中相同標記的特征(例如大小、序列、組成或量)之間的差異盡可能大的標記選擇。雖然此差異可以小到評定標記的量的方法的檢測限,但是在另一個實施例中,所述差異可以至少大于評定方法的標準誤差。在rna或蛋白質量的情況下,差異可以是至少1.5、2、3、4、5、6、7、8、9、10、15、20、25、100、500、1000倍或1000倍以上?!暗汀眗na或蛋白質量可以是相對于整個腫瘤樣品(例如血液腫瘤,例如骨髓瘤)的整體平均值而言所述表達量是低的。在dna的量的情況下,例如復制數量,所述量是0、1、2、3、4、5、6或6次以上復制。缺失使得復制數量為0或1;擴增使得復制數量大于2。差異可以通過置信水平,例如p<0.05、p<0.02、p<0.01或更低的p值來限定。
一個以上標記,例如一組2、3、4、5、6、7、8、9、10、12、15、20或25或25個以上標記的測量結果可以提供指示治療結果的表達圖譜或趨勢。在一些實施例中,標記組包含不超過2、3、4、5、6、7、8、9、10、12、15、20或25個標記。在一些實施例中,標記組包括多個染色體基因座、多個標記基因或一或多個標記基因的多個標記(例如本文所述的核酸和蛋白質、基因組dna和mrna或各種標記組合)??梢园殡S統計方法通過評定一個組中標記的量來分析治療結果,所述統計方法例如加權投票分析,其解釋可以影響所述組中標記的量對治療結果的類別或趨勢的作用的變量,例如測量結果的信噪比或每個標記的雜交效率。標記組,例如一組2、3、4、5、6、7、8、9、10、12、15、20或25或25個以上標記可以包含一個引物、探針或多個引物以分析本文所述的至少一個標記dna或rna,例如在從堿基對29999545到30094589的染色體22q、從堿基對48556583到48611412的染色體18q、從堿基對44732423到44971847的染色體xp、從堿基對153242410到153456172的染色體4q、從堿基對7571720到7590868的染色體17p、從堿基對21967751到21994490的染色體9p上的標記、nf2、smad4、kdm6a、fbxw7、tp53、cdkn2a、cdkn2a_p14或上述任一者的互補序列。標記組,例如一組2、3、4、5、6、7、8、9、10、12、15、20或25或25個以上標記可以包含一個引物、探針或多個引物以檢測至少一個或至少兩個或兩個以上標記,或例如nf2、smad4、kdm6a、tp53、cdkn2a、cdkn2a_p14和/或fbxw7的標記上的至少2、3、4、5、6、7、8、9、10、12、15、20或25或25個以上突變。在另一個實施例中,標記組可以包含用于評定nf2、smad4和/或kdm6a的特征的標記。在一個實施例中,用于子宮癌或子宮頸癌的標記組包含至少一個用于評定fbxw7的至少一個特征的標記。在一個實施例中,用于腸癌、乳癌、肺癌、頭頸癌、子宮頸癌或皮膚癌的標記組包含至少一個用于評定tp53的至少一個特征的標記。在一個實施例中,用于腸癌的標記組包含用于評定tp53和apc中的每一者的至少一個特征的標記。在一個實施例中,用于皮膚癌或中樞神經系統癌的標記組包含至少一個用于評定cdkn2a_p14的至少一個特征的標記。在一個實施例中,用于頭頸癌或皮膚癌的標記組包含至少一個用于評定cdkn2a的至少一個特征的標記。在一個實施例中,用于頭頸癌的標記組包含至少一個用于評定smad4的至少一個特征的標記。所選擇的標記組可以使用本文中提供的方法和本領域中已知的類似方法從本文中提供的標記組裝或選自這些標記。使新標記具有適用于本發(fā)明的分析的資格的方式是使包含腫瘤細胞的樣品中的dna復制數量與標記(例如標記基因)的表達(例如距基線的倍數變化)的差異相聯系。判斷聯系的有用方式是計算確定系數r2,在解決了r之后,使用標準統計方法,計算皮爾遜積矩相關系數(pearsonproductmomentcorrelationcoefficient)和/或作出最小二乘法曲線。相關性可以分析dna復制數量對比標記(例如標記基因)的表達水平。如果相關性結果(r2,例如此分析中數據的線性斜率)是至少0.1-0.2,至少0.3-0.5,或至少0.6-0.8或0.8以上,那么可以選擇基因產物作為標記。標記可以隨著與反應的正相關性、ttp或存活變化(即以與復制數量相同的方式改變表達水平,例如當復制數量減少時降低)。隨著與復制數量的負相關性而變化(即以與復制數量水平相反的方式改變表達水平,例如當復制數量減少時增加)的標記提供不一致的結果判定。
使新標記具有適用于所述分析資格的另一種方式將是在用測試藥劑處理之前和之后分析多個個體中大量標記的表達。表達結果允許鑒別在處理之后相對于處理前的樣品展示出沿指定方向的巨大變化的標記??梢詷嫿ㄖ貜蜏y量線性回歸模型來鑒別展示統計學顯著變化或差異的基因。為了然后給這些顯著的基因排序,可以計算例如在距基線的變化對比時間的曲線下方的面積。此可以產生將展示最大統計學顯著變化的基因清單。然后可以通過使用如下方法將若干標記一起合并在一個組中:主組分分析、聚類分析法(例如k均方聚類(k-means)、分級聚類)、多變量方差分析(multivariateanalysisofvariance;manova)或線性回歸技術。為了使用此類基因(或基因組)作為標記,展示與基線的2、2.5、3、3.5、4、4.5、5、7、10倍或10倍以上表達差異的基因將包括在標記組中。表達圖譜,例如與聚集的標記組的基線或參考的表達水平差異的復合將表明在某種趨勢下,例如如果大部分標記展示特定結果,例如與基線或參考的顯著差異,例如60%、70%、80%、90%、95%或95%以上的標記;或更多標記,例如10%以上、20%以上、30%以上、40%以上展示沿一個方向而不是另一個方向的顯著結果。
在本發(fā)明的組合物、試劑盒和方法用于表征患者的治療結果的實施例中,本發(fā)明的標記或標記組經選擇以使得在至少約20%、至少約40%、60%或80%或在實質上所有用測試藥劑治療的患者中獲得顯著結果。本發(fā)明的標記或標記組可以經選擇以使得關于總群體獲得大于約10%的陽性預測值(ppv)并且當ppv與大于80%的分析特異性耦合時可以推斷標記的附加置信度。
治療劑
本發(fā)明的標記和標記組評定患者中療法(例如對治療劑的敏感性)有利結果的可能性,例如癌癥患者,例如患有血液癌癥(例如多發(fā)性骨髓瘤、白血病、淋巴瘤等)或實體腫瘤癌癥(例如皮膚癌(例如黑素瘤)、頭頸癌(例如食道癌)、膀胱癌、肺癌(例如非小細胞肺癌(nsclc))、肺腺癌、中樞神經系統癌(例如腦的肺轉移或成神經細胞瘤)、胰臟癌、乳癌、間皮瘤、子宮頸癌或腸道癌,例如結腸或直腸腺癌)的患者,基于其影響本發(fā)明的標記的特征(例如組成或量)的能力。使用此預測,可以評估癌癥療法來設計最佳適用于任一類別患者的療法方案。
具體來說,可以使用所述方法來預測患者對如在先前部分所述的nae抑制劑的敏感性。本發(fā)明方法中所測試的藥劑可以是單一藥劑或藥劑組合。本發(fā)明方法包括nae抑制療法與蛋白酶體抑制療法和/或其它或附加藥劑(例如選自由化學治療劑組成的群組)的組合。舉例來說,可以使用本發(fā)明方法來確定是否可以使用單一化學治療劑(例如nae抑制劑(例如mln4924))來治療癌癥或是否應該與nae抑制劑(例如mln4924)組合使用一或多種藥劑。有用的組合可以包括具有不同作用機制的藥劑,例如與烷基化劑和nae抑制劑組合使用抗有絲分裂劑。
如本文所用,術語“蛋白酶體抑制劑”是指體外或體內直接抑制20s或26s蛋白酶體的酶活性的任何物質。在一些實施例中,蛋白酶體抑制劑是肽基硼酸。適用于本發(fā)明方法的肽基硼酸蛋白酶體抑制劑的實例揭示于亞當斯(adams)等人的美國專利第5,780,454號(1998)、第6,066,730號(2000)、第6,083,903號(2000)、第6,297,217號(2001)、第6,465,433號(2002)、第6,548,668號(2003)、第6,617,317號(2003)和第6,747,150號(2004)中,所述專利各自在此以全文引用的方式并入本文中,包括本文中所揭示的所有化合物和化學式。在一些實施例中,肽基硼酸蛋白酶體抑制劑選自由以下組成的群組:n(4嗎啉)羰基-β-(1-萘基)-l-丙氨酸-l-白氨酸硼酸;n(8喹啉)磺?;?β-(1-萘基)-l-丙氨酸-l-丙氨酸-l-白氨酸硼酸;n(吡嗪)羰基-l-苯丙氨酸-l-白氨酸硼酸和n(4嗎啉)-羰基-[o-(2-吡啶基甲基)]-l-酪氨酸-l-白氨酸硼酸。在特定實施例中,蛋白酶體抑制劑是n(吡嗪)羰基-l-苯丙氨酸-l-白氨酸硼酸(硼替佐米(bortezomib);
此外,蛋白酶體抑制劑包括肽醛蛋白酶體抑制劑(施泰因(stein)等人的美國專利第5,693,617號(1997);西曼(siman)等人的國際專利公開案wo91/13904;伊克巴爾(iqbal)等人,《醫(yī)藥化學雜志》(j.med.chem.)38:2276-2277(1995);和飯沼(iinuma)等人的國際專利公開案wo05/105826,所述文獻各自在此以全文引用的方式并入本文中)、肽基環(huán)氧基酮蛋白酶體抑制劑(克魯斯(crews)等人的美國專利第6,831,099號;史密斯(smyth)等人的國際專利公開案wo05/111008;班尼特(bennett)等人的國際專利公開案wo06/045066;斯巴滕施泰因(spaltenstein)等人《四面體通訊》(tetrahedronlett.)37:1343(1996);孟(meng),《美國國家科學院院刊》(proc.natl.acad.sci.)96:10403(1999);和孟,《癌癥研究》59:2798(1999))、α-酮酰胺蛋白酶體抑制劑(查特吉(chatterjee)和馬拉莫(mallamo),美國專利第6,310,057號(2001)和第6,096,778號(2000);和王(wang)等人美國專利第6,075,150號(2000)和第6,781,000號(2004))、肽基乙烯基酯蛋白酶體抑制劑(馬拉斯托尼(marastoni)等人,《醫(yī)藥化學雜志》48:5038(2005),和肽基乙烯基砜和2-酮基-1,3,4-噁二唑蛋白酶體抑制劑,例如拉德切夫斯基(rydzewski)等人,《醫(yī)藥化學雜志》49:2953(2006);和博焦(bogyo)等人,《美國國家科學院院刊》94:6629(1997)中所揭示的那些)、氮雜擬肽和(布熱(bouget)等人,《生物有機化學與醫(yī)藥化學》(bioorg.med.chem.)11:4881(2003);博迪·弗洛克(baudy-floc′h)等人的國際專利公開案wo05/030707;和博納曼(bonnemains)等人的國際專利公開案wo03/018557)、肽抑制素寡肽(帕帕塔納休(papathanassiu)的國際專利公開案wo05/115431)、雷克塔西汀(lactacystin)和鹽孢菌素(salinosporamide)和其類似物(芬太尼(fenteany)等人的美國專利第5,756,764號(1998)、第6,147,223號(2000)、第6,335,358號(2002)和第6,645,999號(2003);芬太尼等人,《美國國家科學院院刊》(1994)91:3358;凡尼克(fenical)等人的國際專利公開案wo05/003137;帕拉迪諾(palladino)等人的國際專利公開案wo05/002572;斯塔德勒(stadler)等人的國際專利公開案wo04/071382;肖(xiao)和帕特爾(patel)的美國專利公開案2005/023162;和科里(corey)的國際專利公開案wo05/099687)。
適用于在本發(fā)明方法中與nae抑制劑(例如mln4924)組合的附加治療劑可以包含已知類別的包含糖皮質激素類固醇的治療劑。糖皮質激素療法一般包含至少一種糖皮質激素劑(例如地塞米松(dexamethasone))。在本發(fā)明的某些應用中,本發(fā)明方法中所用的藥劑是糖皮質激素劑。多發(fā)性骨髓瘤患者的治療以及其它癌癥療法中所采用的糖皮質激素的一個實例是地塞米松。實體腫瘤的血液治療和組合療法中所采用的附加糖皮質激素包括氫皮質酮、脫氫皮質醇、潑尼松(prednisone)和曲安西龍(triamcinolone)。
適用于與nae抑制療法組合的其它治療劑包括化學治療劑?!盎瘜W治療劑”打算包括抑制增殖細胞或組織生長的化學試劑,其中這類細胞或組織的生長是不合需要的?;瘜W治療劑,例如抗代謝劑,例如araac、5-fu和甲氨蝶呤;抗有絲分裂劑,例如紫杉烷、長春堿和長春新堿;烷基化劑,例如美法侖(melphanlan)、卡莫司汀(carmustine)(bcnu)和氮芥;拓撲異構酶ii抑制劑,例如vw-26、拓撲替康和博萊霉素;鏈斷裂劑,例如小紅莓和米托蒽醌(dhad);交聯劑,例如順鉑和卡鉑(cbdca);輻射和紫外光在本領域中是眾所周知的(例如,參見希爾曼(gilman)a.g.等人,《治療學的藥理學基礎》(thepharmacologicalbasisoftherapeutics.),第8版,第12部分:1202-1263(1990)),并且通常用于治療贅生性疾病?;瘜W療法治療中通常采用的化學治療劑的實例列舉在下表2中。
表2:化學治療劑
本發(fā)明方法中所測試的藥劑可以是單一藥劑或藥劑組合。舉例來說,可以使用本發(fā)明方法來確定是否可以使用單一化學治療劑(例如甲氨蝶呤)來治療癌癥或是否可以與nae抑制劑(例如mln4924)組合使用兩種或兩種以上藥劑的組合。有用的組合可以包括具有不同作用機制的藥劑,例如與烷基化劑和nae抑制劑組合使用抗有絲分裂劑。
本文中所揭示的藥劑可以通過任何途徑投與,包括皮內、皮下、經口、動脈內或靜脈內。在一個實施例中,投藥將是通過靜脈內途徑。能夠以藥團形式或通過輸注提供非經腸投藥。
藥學上可接受的混合物中本發(fā)明化合物的濃度將取決于若干因素而變化,所述因素包括待投與的化合物的劑量、所用化合物的藥物動力學特征和投藥途徑。藥劑能夠以單一劑量或以重復劑量形式投與。取決于多種因素,可以每日或更頻繁地投與治療,所述因素包括患者的整體健康和所選擇的化合物的配方和投藥途徑。
篩選nae抑制劑
本發(fā)明提供鑒別調節(jié)劑,即候選或測試化合物或藥劑(例如蛋白質、肽、肽模擬物、擬肽、小分子或其它藥物)的方法(在本文中也稱為“篩選分析”),所述調節(jié)劑結合到nae或其它e1酶變異體蛋白質,對例如nae或其它e1酶表達或酶活性具有刺激或抑制作用,或對例如nae或e1酶路徑中(例如在nae路徑中)的其它e1酶底物或蛋白質的表達或活性具有刺激或抑制作用,例如與科林-環(huán)連接酶的活性相關。因此所鑒別的化合物可以用于調整治療方案中的目標基因產物(例如nae或其它e1酶基因)的活性,從而完善目標基因產物的生物功能,或從而鑒別破壞nae或其它e1酶路徑相互作用的化合物。
在一個實施例中,本發(fā)明提供一種鑒別化合物作為nae抑制劑,例如作為調節(jié)細胞的藥物抗性的藥劑的方法,所述方法通過首先使至少一個標記基因中包含至少一種突變的細胞與測試化合物接觸并且然后測量所述細胞的活力或細胞生長的抑制情況。在一些實施例中,所述細胞包含表3中所鑒別的抗性基因。在其它實施例中,所述細胞包含表3中所鑒別的敏感性基因。nae抑制劑的作用可以與未暴露于所述化合物的對照細胞進行對比。在一些實施例中,藥劑對包含敏感性標記基因的細胞的作用可以與藥劑對包含抗性標記基因的細胞的作用進行對比(例如,參見表3)。當細胞活力或細胞生長降低時,所述化合物鑒別為藥物抗性的調節(jié)劑或nae抑制劑。上述方法中所鑒別的經鑒別為nae抑制劑(例如作為調整抗性)的化合物也包括在本發(fā)明內。
檢測方法
預后分析的一般原理涉及在適當條件下制備可以含有標記和探針的樣品或反應混合物,并且持續(xù)足以使所述標記和探針相互作用并結合的時間,因此形成可以在反應混合物中去除和/或檢測的復合物。這些分析能夠以多種方式進行。
舉例來說,執(zhí)行這類分析的一種方法將涉及將標記或探針錨定到固相支撐物(也稱為底物)上,并且在反應結束時檢測錨定在固相上的目標標記/探針復合物。在此類方法的一個實施例中,來自個體的待分析標記的存在和/或濃度的樣品可以錨定到載體或固相支撐物上。在另一個實施例中,相反的情況是可能的,其中可以將探針錨定到固相并且可以允許來自個體的樣品以分析的未錨定組分形式反應。這類實施例的一個實例包括使用包含經錨定用于樣品的表達分析的預測標記或標記組的陣列或芯片。
存在許多將分析組分錨定到固相的已建立的方法。這些方法包括(不限于)通過結合生物素和抗生蛋白鏈菌素固定的標記或探針分子。這類生物素標記分析組分可以使用本領域中已知的技術(例如伊利諾伊州羅克福德的皮爾斯化學品公司(piercechemicals,rockford,il)的生物素化試劑盒)從生物素-nhs(n-羥基-丁二酰亞胺)制備,并且固定在涂有抗生蛋白鏈菌素的96孔板(皮爾斯化學品公司)的各孔中。在某些實施例中,可以事先制備具有固定分析組分的表面并儲存。
用于這類分析的其它合適的載體或固相支撐物包括能夠結合標記或探針所屬于的分子類別的任何材料。眾所周知的支撐物或載體包括(但不限于)玻璃、聚苯乙烯、尼龍、聚丙烯、尼龍、聚乙烯、葡聚糖、淀粉酶、天然和修飾纖維素、聚丙烯酰胺、輝長巖和磁鐵礦。本領域普通技術人員將知曉用于結合抗體或抗原的許多其它合適的載體,并且將能夠調整這類支撐物以用于本發(fā)明。舉例來說,從細胞中分離的蛋白質可以進行聚丙烯酰胺凝膠電泳并且固定到例如硝化纖維的固相支撐物上。所述支撐物然后可以用合適的緩沖液洗滌,接著用可檢測地標記的抗體處理。固相支撐物然后可以用緩沖液洗滌第二次用以去除未結合的抗體。固體支撐物上所結合的標記的量然后可以通過常規(guī)手段檢測。
為了用以上所提到的方法執(zhí)行分析,向上面錨定有第二組分的固相中添加非固定組分。在反應完全之后,可以在所形成的任何復合物將保持固定在固相上的條件下去除(例如通過洗滌)未復合組分。錨定到固相的標記/探針復合物的檢測可以用本文中概述的多種方法實現。
在一個實施例中,當探針是未錨定分析組分時,所述探針可以用本文中所論述的可偵測標記進行標記以便直接或間接地檢測和讀出分析,并且這是本領域普通技術人員眾所周知的。關于探針(例如核酸或抗體)的術語“標記”打算涵蓋通過耦合(物理連接)可檢測物質與探針直接標記探針,以及通過與直接標記的另一試劑反應而間接標記探針。間接標記的實例包括使用熒光標記二級抗體檢測初級抗體。也可能直接檢測標記/探針復合物形成而不進一步操控或標記任一組分(標記或探針),例如通過使用熒光能量轉移技術(fet,參見例如盧科維奇(lakowicz)等人的美國專利第5,631,169號;斯塔夫那普羅(stavrianopoulos)等人的美國專利第4,868,103號)。選擇第一‘供體’分子上的熒光團標記以使得在用恰當波長的入射光激發(fā)之后,其發(fā)射的熒光能量將被第二‘受體’分子上的熒光標記所吸收,所述第二‘受體’分子由于所吸附的能量又能夠發(fā)熒光?;蛘撸w’蛋白質分子可以簡單地利用色氨酸殘基的天然熒光能量。選擇發(fā)射不同波長光的標記,以使得‘受體’分子標記可以與‘供體’的標記區(qū)分。因為標記之間能量轉移的效率與分子相隔的距離有關,所以可以評定分子之間的空間關系。在結合發(fā)生于分子之間的情況下,分析中‘受體’分子標記的熒光發(fā)射應該是最大的。fet結合作用可以通過在本領域中眾所周知的標準熒光檢測手段方便地測量(例如使用熒光計)。
在另一個實施例中,可以在不標記任一分析組分(探針或標記)的情況下,通過使用例如實時生物分子相互相用分析(bia)的技術實現探針識別標記的能力的測定(例如,參見索蘭德(sjolander),s和烏爾巴尼扎(urbaniczky),c.(1991)《分析化學》(anal.chem.)63:2338-2345和紹博(szabo)等人(1995)《現代結構生物學評論》(curr.opin.struct.biol.)5:699-705)。如本文所用,“bia”或“表面等離子體共振”是一種用于在不標記任何相互作用物(例如biacoretm)的情況下,實時研究生物特異性相互作用的技術。結合表面處的質量變化(指示結合作用)引起靠近表面的光的折射率改變(表面等離子體共振(spr)的光學現象),產生可檢測信號,其可以用作生物分子之間實時反應的指示。
或者,在另一個實施例中,可以用標記和探針作為液相中的溶質進行類似診斷性和預后分析。在此類分析中,復合的標記和探針通過多種標準技術中的任一種與未復合的組分分離,所述標準技術包括(但不限于):差速離心、色譜、電泳和免疫沉淀。在差速離心中,標記/探針復合物可以通過一系列離心步驟與未復合的分析組分分離,由于基于其不同大小和密度,復合物的沉降平衡不同(例如,參見里瓦斯(rivas),g.和明頓(minton),a.p.(1993)《生物化學科學趨勢》(trendsbiochemsci.)18:284-7)。也可以采用標準色譜技術用于分離復合分子與未復合的分子。舉例來說,凝膠過濾色譜基于大小并且通過在管柱形式中采用恰當的凝膠過濾樹脂來分離分子,舉例來說,相對較大的復合物可以與相對較小的未復合組分分離。類似地,如相比于未復合組分,標記/探針復合物的相對不同的電荷特性可以用來區(qū)分復合物與未復合組分,例如通過采用離子交換色譜樹脂。這類樹脂和色譜技術對本領域普通技術人員是眾所周知的(例如,參見赫加德(heegaard),n.h.(1998)《分子識別雜志》(j.mol.recognit.)11:141-8;哈格(hage),d.s.和特威德(tweed),s.a.(1997)《色譜法雜志b輯:生物醫(yī)藥科學與應用》(j.chromatogr.b.biomed.sci.appl.)699:499-525)。也可以采用凝膠電泳來分離復合分析組分與未結合組分(例如,參見奧斯貝等人編,《分子生物學最新方案》,約翰·威利父子公司,紐約,1987-1999)。在此項技術中,蛋白質或核酸復合物是基于例如大小或電荷分離的。在一些實施例中,使用非變性凝膠基質材料和不存在還原劑的條件以便在電泳過程期間維持結合相互相用。特定分析和其組分的適當條件將是本領域普通技術人員眾所周知的。
可以在雜交或擴增分析中使用分離的mrna,所述分析包括(但不限于)南方或北方分析、聚合酶鏈式反應和
這類引物或探針可以用作用于鑒別表達蛋白質的細胞或組織的診斷測試試劑盒的一部分,例如通過測量來自個體的細胞樣品中轉錄的核酸分子的量,例如檢測轉錄物、mrna水平或測定編碼蛋白質的基因是否已經突變或缺失。rna或cdna與核酸探針的雜交可以表明所討論的標記被表達。本發(fā)明進一步涵蓋檢測由于遺傳代碼的簡并而不同于編碼標記蛋白(例如具有序列seqidno:3、6、10、11、14、17、20、23或26的蛋白質)的核酸的核苷酸序列,并且因此編碼相同蛋白質的核酸分子。本領域的普通技術人員應了解,引起氨基酸序列變化的dna序列多形現象可以存在于群體(例如人類群體)內。這類遺傳多形現象可以由于天然等位變異而存在于群體內的個體中。等位基因是可替代地出現在指定遺傳基因座處的一組基因中的一個。這些天然等位變異通常會在指定基因的核苷酸序列中引起1-5%變化。替代性等位基因可以通過對多個不同個體中的相關基因,例如來自個體的正常樣品進行測序來鑒別。此測序可以通過使用雜交探針容易地進行,從而鑒別各種個體中的相同遺傳基因座。檢測任何和所有這類核苷酸變異和所得氨基酸多形現象或變異(這是天然等位變異的結果并且不改變功能活性)打算屬于本發(fā)明的范圍內。另外,應了解影響rna表達水平的dna多形現象也可以存在,其可以影響所述基因的整體表達水平(例如通過影響調節(jié)或降解)。
如本文所用,術語“雜交”打算描述雜交和洗滌條件,在所述條件下,彼此顯著相同或同源的核苷酸序列保持彼此雜交。在一些實施例中,所述條件使至少約70%、至少約80%、至少約85%、90%或95%彼此相同的序列保持彼此雜交以便后續(xù)擴增和/或檢測。嚴格條件根據所涉及的核苷酸序列的長度變化但是本領域的普通技術人員已知的并且可見于《分子生物學最新方案》,奧斯貝等人編,約翰·威利父子公司(1995),第2、4和6部分中或基于其教示來測定。附加嚴格條件和用于測定這類條件的規(guī)則可見于《分子克隆實驗手冊》,薩姆布魯克等人,冷泉港出版社,冷泉港,紐約(1989),第7、9和11章。用于雜交長度為至少10個堿基對的嚴格雜交條件的非限制性實例包括在4×氯化鈉/檸檬酸鈉(ssc)中,在約65-70℃下雜交(或在4×ssc加50%甲酰胺中,在約42-50℃下雜交),接著在1×ssc中,在約65-70℃下洗滌一或多次。用于這類雜交的高度嚴格雜交條件的非限制性實例包括在1×ssc中,在約65-70℃下雜交(或在1×ssc加50%甲酰胺中,在約42-50℃下雜交),接著在0.3×ssc中,在約65-70℃下洗滌一或多次。用于這類雜交的嚴格性降低的雜交條件的非限制性實例包括在4×ssc中,在約50-60℃下雜交(或在6×ssc加50%甲酰胺中,在約40-45℃下雜交),接著在2×ssc中,在約50-60℃下洗滌一或多次。以上所述值的范圍中間值,例如在65-70℃下或在42-50℃下也打算由本發(fā)明涵蓋。嚴格雜交條件的另一實例是在6×氯化鈉/檸檬酸鈉(ssc)中,在約45℃下雜交,接著在0.2×ssc、0.1%sds中,在50-65℃下洗滌一或多次。嚴格雜交緩沖液的另一實例是在1mnacl、50mm2-(n-嗎啉基)乙磺酸(mes)緩沖液(ph6.5)、0.5%肌氨酸鈉和30%甲酰胺中雜交。在雜交和洗滌緩沖液中,sspe(1×sspe是0.15mnacl、10mmnah2po4和1.25mmedta,ph7.4)可以被ssc(1×ssc是0.15mnacl和15mm檸檬酸鈉)替代;在雜交完成之后每次洗滌15分鐘。用于預期長度小于50個堿基對的雜交物的雜交溫度應該是小于雜交物熔融溫度(tm)5-10℃,其中tm根據以下等式測定。關于長度小于18個堿基對的雜交物,tm(℃)=2(a+t堿基的數量)+4(g+c堿基的數量)。關于長度介于18與49個堿基對之間的雜交物,tm(℃)=81.5+16.6(log10[na+])+0.41(%g+c)-(600/n),其中n是雜交物中的堿基數量,并且[na+]是雜交緩沖液中鈉離子的濃度(1×ssc的[na+]=0.165m)。熟練的從業(yè)者還將認識到,可以向雜交和/或洗滌緩沖液中添加附加試劑以降低核酸分子與膜(例如硝化纖維或尼龍膜)的非特異性雜交,所述試劑包括(但不限于)阻斷劑(例如bsa或鮭魚或鯡魚精子載體dna)、洗滌劑(例如sds)、螯合劑(例如edta)、聚蔗糖(ficoll)、聚乙烯吡咯烷酮(pvp)等。當使用尼龍膜時,具體來說,嚴格雜交條件的附加非限制性實例是在0.25-0.5mnah2po4、7%sds中,在約65℃下雜交,接著在0.02mnah2po4、1%sds下,在65℃下洗滌一或多次,參見例如丘奇(church)和吉爾伯特(gilbert)(1984)《美國國家科學院院刊》81:1991-1995,(或者0.2×ssc、1%sds)??梢栽跈z測方法中單獨使用引物或核酸探針,或可以在檢測方法中與至少一種其它引物或核酸探針一起使用引物。引物也可以用于擴增核酸的至少一部分。本發(fā)明的核酸探針是指雜交相關區(qū)域并且不進一步延伸的核酸。舉例來說,核酸探針是這樣的核酸,其特異性雜交生物標記的突變體區(qū)域并且通過與患者的dna雜交或不雜交或所形成的雜交類型可以指示生物標記的突變的存在或一致性或標記活性的量。
在一種形式中,將rna固定于固體表面上并且使其與探針接觸,例如通過使分離的rna在瓊脂糖凝膠上流動并且將rna從凝膠轉移到膜(例如硝化纖維)上。在替代性形式中,將核酸探針固定于固體表面上并且使rna與探針接觸,例如在
用于測定樣品中對應于本發(fā)明標記的rna的量的替代性方法涉及核酸擴增過程,例如通過rt-pcr(實驗性實施例闡述于穆利斯(mullis),1987,美國專利第4,683,202號中)、連接酶鏈式反應(巴拉尼(barany),1991,《美國國家科學院院刊》,88:189-193)、自動維持序列復制(瓜特利(guatelli)等人,1990,《美國國家科學院院刊》87:1874-1878)、轉錄擴增系統(庫沃(kwoh)等人,1989,《美國國家科學院院刊》86:1173-1177)、q-β復制酶(李查蒂(lizardi)等人,1988,《生物技術》(bio/technology)6:1197)、滾環(huán)式復制(李查蒂等人的美國專利第5,854,033號)或任何其它核酸擴增方法,接著使用本領域的普通技術人員眾所周知的技術檢測擴增分子。如果核酸分子以極低數量存在,那么這些檢測方案尤其適用于檢測這類分子。如本文所用,擴增引物定義為一對核酸分子,其可退火到基因的5′或3′區(qū)(分別為正鏈與負鏈,或反之亦然)并且含有介于其中的短區(qū)。一般來說,擴增引物長度為約10到約30個核苷酸并且側接長度為約50到約200個核苷酸的區(qū)域。在適當條件下并且使用適當試劑,這類引物使得包含與引物側接的核苷酸序列的核酸分子擴增。
關于原位方法,在檢測之前,rna不需要從細胞分離。在這類方法中,細胞或組織樣品使用已知組織學方法制備/處理。然后將樣品固定于支撐物上,通常是玻璃載片,并且然后與可以雜交編碼所述標記的rna的探針接觸。
在本發(fā)明的另一實施例中,檢測對應于標記的多肽。在一些實施例中,用于檢測本發(fā)明多肽的藥劑是能夠結合對應于本發(fā)明標記的多肽的抗體。在相關實施例中,抗體具有可檢測標記??贵w可以是多克隆或單克隆抗體??梢允褂猛暾贵w或其片段(例如fab或f(ab′)2)。
可以采用各種形式來確定樣品是否包含結合指定抗體的蛋白質。這類形式的實例包括(但不限于)酶免疫分析(eia)、放射免疫分析(ria)、西方印跡分析和酶聯免疫吸附分析(elisa)。本領域的技術人員可以容易地調整已知蛋白質/抗體檢測方法以用于確定b細胞是否表達本發(fā)明標記。
用于測定對應于標記的多肽的水平的另一種方法是質譜法。舉例來說,可以分析來自包含一或多種多肽標記的樣品,例如血液樣品、淋巴樣品或其它樣品的完整蛋白質或肽,例如胰蛋白酶肽。所述方法可以進一步包括處理樣品以降低大量蛋白質(例如血清白蛋白)的量,從而提高所述方法的靈敏度。舉例來說,可以使用液相色譜來分級分離樣品,因此可以分別通過質譜法分析樣品的部分??梢栽诜蛛x系統中或在組合的液相色譜/質譜系統(lc/ms,參見例如廖(liao)等人(2004)《關節(jié)炎與風濕病》(arthritisrheum.)50:3792-3803)中進行各步驟。質譜系統也可以呈串聯(ms/ms)模式。蛋白質或肽混合物的電荷狀態(tài)分布可以經一次或多次掃描獲得并且通過統計方法分析,例如使用lc/ms系統中的滯留時間和質荷比(m/z),從而有差異地鑒別來自對nae抑制療法起反應或不起反應的患者的樣品中以統計學顯著水平表達的蛋白質??梢允褂玫馁|譜儀的實例是離子阱系統(加利福尼亞州圣何塞的熱電菲尼根(thermofinnigan,sanjose,ca))或四極桿飛行時間質譜儀(加利福尼亞州福斯特市的應用生物系統公司)。所述方法可以進一步包括肽質量指紋譜分析步驟,例如在基質輔助激光解吸電離與飛行時間(maldi-tof)質譜法中。所述方法可以進一步包括胰蛋白酶肽中的一或多者的測序步驟。此方法的結果可以用于從初級序列數據庫鑒別蛋白質,所述數據庫例如由馬里蘭州貝塞斯達的美國國家生物技術信息中心或瑞士日內瓦的瑞士生物信息學研究所(theswissinstituteforbioinformatics,geneva,switzerland)維護,并且基于質譜胰蛋白酶肽m/z基峰。
電子設備可讀陣列
還涵蓋了與本發(fā)明方法結合使用的電子設備,其包括包含至少一種本發(fā)明預測標記的可讀陣列。如本文所用,“電子設備可讀媒體”是指用于儲存、保存或容納數據或信息的任何合適的媒體,所述數據或信息可以通過電子設備直接讀取和訪問。如本文所用,術語“電子設備”打算包括被配置或適配用于儲存數據或信息的任何合適的計算或處理設備或其它裝置。適合與本發(fā)明一起使用并監(jiān)控所記錄的信息的電子設備的實例包括獨立計算設備;網絡,包括局域網(lan)、廣域網(wan)、互聯網、內聯網和外聯網;電子器械,例如個人數字助理(pda)、蜂窩式電話、尋呼機等;以及本地與分布式處理系統。如本文所用,“記錄”是指在電子設備可讀媒體上儲存或編碼信息的過程。本領域的普通技術人員可以容易地采用目前已知的任何方法以在已知媒體上記錄信息,從而產生包含本發(fā)明標記的制品。
舉例來說,微陣列系統在本領域中眾所周知并用于例如通過評定基因表達(例如dna檢測、rna檢測、蛋白質檢測)或代謝物產生來評定樣品。根據本發(fā)明使用的微陣列包括本發(fā)明預測標記的一或多個探針,所述標記描繪對如本文所述的治療方案起反應和/或不起反應的特征。在一個實施例中,所述微陣列包含一或多個對應于患者中的一或多個選自由以下組成的群組的標記的探針:在短期存活者中展現表達增加的標記和在長期存活者中展現表達增加的基因。多種不同微陣列配置和其產生方法是本領域的普通技術人員已知的并且揭示在以下文獻中:例如美國專利第5,242,974號、第5,384,261號、第5,405,783號、第5,412,087號、第5,424,186號、第5,429,807號、第5,436,327號、第5,445,934號、第5,556,752號、第5,405,783號、第5,412,087號、第5,424,186號、第5,429,807號、第5,436,327號、第5,472,672號、第5,527,681號、第5,529,756號、第5,545,531號、第5,554,501號、第5,561,071號、第5,571,639號、第5,593,839號、第5,624,711號、第5,700,637號、第5,744,305號、第5,770,456號、第5,770,722號、第5,837,832號、第5,856,101號、第5,874,219號、第5,885,837號、第5,919,523號、第5981185號、第6,022,963號、第6,077,674號、第6,156,501號、第6261776號、第6346413號、第6440677號、第6451536號、第6576424號、第6610482號、第5,143,854號、第5,288,644號、第5,324,633號、第5,432,049號、第5,470,710號、第5,492,806號、第5,503,980號、第5,510,270號、第5,525,464號、第5,547,839號、第5,580,732號、第5,661,028號、第5,848,659號和第5,874,219號;謝娜(shena)等人(1998),《生物技術趨勢》(tibtech)16:301;達根(duggan)等人(1999)《自然·遺傳學》(nat.genet.)21:10;鮑特爾(bowtell)等人(1999)《自然·遺傳學》21:25;利普舒茨(lipshutz)等人(1999)《自然·遺傳學》21:20-24,1999;布蘭查德(blanchard)等人(1996)《生物傳感器與生物電子學》(biosensorsandbioelectronics),11:687-90;馬斯科(maskos)等人,(1993)《核酸研究》(nucleicacidsres.)21:4663-69;休斯(hughes)等人(2001)《自然·生物技術》(nat.biotechol.)19:342,2001;所述文獻各自以引用的方式并入本文中。組織微陣列可以用于蛋白質鑒別(參見漢斯(hans)等人(2004)《血液》103:275-282)。噬菌體-表位微陣列可以用于基于患者中的蛋白質是否誘導自身抗體來鑒別樣品中的一或多種蛋白質(布拉福(bradford)等人(2006)《內分泌腫瘤學》(urol.oncol.)24:237-242)。
因此微陣列包含對應于本文中所鑒別的一或多個標記的一或多個探針,例如那些指示治療結果的標記,例如從而鑒別野生型標記基因、正常等位變異體和標記基因的突變。微陣列可以包含對應于指示治療結果的例如至少2個、至少3個、至少4個、至少5個、至少10個、至少15個、至少20個、至少25個、至少30個、至少35個、至少40個、至少45個、至少50個、至少75個或至少100個生物標記和/或其突變的探針。微陣列可以包含對應于如本文中所闡述的一或多個生物標記的探針。再者,微陣列可以包含如本文中所闡述并且可以根據本文中所闡述的方法選擇和編譯的整個標記組。微陣列可以用于分析所述陣列中一或多個預測標記或預測標記組的表達。在一個實例中,所述陣列可以用于分析樣品中的一個以上預測標記或標記組表達,從而確定陣列中標記的表達圖譜。以此方式,可以同時分析最多約44,000個標記的表達。這允許開發(fā)一種顯示一或多個樣品中的一連串特異性表達的標記的表達圖譜。再者,這允許開發(fā)一種用于評定治療結果的表達圖譜。
所述陣列也適用于確定正常和異常(例如樣品,例如腫瘤)細胞中一或多個標記的不同表達模式。這提供了一連串可以充當便于鑒別患者治療結果的工具的標記。此外,所述陣列適用于確定參考標記關于參考表達水平的表達。在另一實例中,所述陣列可以用于監(jiān)控所述陣列中一或多個標記的表達時程。
除這類定性測定之外,本發(fā)明還允許標記表達的定量。因此,預測標記可以基于標記組或通過樣品中標記的量指示的結果分組。這在例如通過根據本文中所提供的方法對量進行評分確定樣品結果是有用的。
所述陣列也適用于確定標記的表達對相同細胞或不同細胞中其它預測標記的表達的影響。如果預測患者具有不利結果,那么這提供了例如候補分子目標用于治療性干預的選擇。
試劑和試劑盒
本發(fā)明還涵蓋用于檢測生物樣品(例如骨髓樣品、腫瘤生檢或參考樣品)中對應于本發(fā)明標記的多肽或核酸的存在的試劑盒。這類試劑盒可以用于測定至少一種標記基因的突變狀態(tài)以評定治療結果,例如確定個體是否能夠例如在nae抑制劑治療之后具有有利結果。舉例來說,所述試劑盒可以包含標記化合物或藥劑,其能夠檢測生物樣品中對應于本發(fā)明標記或標記基因的突變的基因組dna區(qū)段、多肽或轉錄rna;和用于測定所述樣品中基因組dna區(qū)段、多肽或rna的量的構件。用于與標記蛋白結合的合適的試劑包括抗體、抗體衍生物、抗體片段等。用于與標記核酸(例如基因組dna、mrna、剪接mrna、cdna等)結合的合適的試劑包括互補核酸。所述標記可以直接連接到標記結合劑,例如探針,例如核酸試劑,例如探針或引物或蛋白質試劑,例如特異性結合劑或抗體,或二級試劑可以包含用于間接標記的標記。所述試劑盒還可以含有一種對照或參考樣品或一系列對照或參考樣品,可以對其進行分析并與測試樣品進行對比。舉例來說,所述試劑盒可以具有陽性對照樣品(例如包括本文所述的一或多個標記或突變)或參考標記(例如來自無腫瘤的個體的例如管家標記,以使各樣品或時間點或參考基因組之間的分析標準化),例如從而建立標記的二倍體拷貝數基線或參考表達水平。舉例來說,所述試劑盒可以包含適用于使互補核酸退火或用于使抗體與其特異性結合的蛋白質結合的液體(例如緩沖液)和一或多個樣品室。本發(fā)明的試劑盒可以任選地包含適用于進行本發(fā)明方法的附加組件,例如樣品收集容器,例如管子;和任選地用于優(yōu)化所檢測的標記的量的構件,例如在取樣時間與分析時間之間可能存在時間或不良儲存和處理條件的情況下。舉例來說,所述試劑盒可以含有如上所述用于增加樣品中腫瘤細胞的數量的構件、緩沖劑、防腐劑、穩(wěn)定劑或用于制備適用于所提供方法中的細胞材料或探針的附加試劑;以及單獨或與所提供的探針結合或并入到所述探針中的可檢測標記。在一個例示性實施例中,包含樣品收集容器的試劑盒可以包含例如管子,其包含如上所述或本領域的普通技術人員已知的抗凝血劑和/或穩(wěn)定劑,例如rna穩(wěn)定劑。所述試劑盒可以進一步包含用于檢測可檢測標記(例如酶或底物)所需的組件。關于標記組,所述試劑盒可以包含適用于檢測生物標記的標記組陣列或芯片。試劑盒還可以包含用于解釋使用所述試劑盒獲得的結果的說明書。所述試劑盒可以含有用于檢測本文所述的一或多個生物標記,例如2、3、4、5或5個以上生物標記的試劑。
在一個實施例中,所述試劑盒包含用于檢測至少一個生物標記,例如指示治療結果(例如在nae抑制劑治療之后)的標記的探針。在示例性實施例中,所述試劑盒包含用于檢測選自由以下組成的群組的標記基因的核酸探針:seqidno:1、2、4、5、7、8、9、12、13、15、16、18、19、21、22、24、25;或在從堿基對29999545到30094589的染色體22q、從堿基對48556583到48611412的染色體18q、從堿基對44732423到44971847的染色體xp、從堿基對153242410到153456172的染色體4q、從堿基對7571720到7590868的染色體17p、從堿基對21967751到21994490的染色體9p上的序列;或上述任一項或seqidno:3、6、10、11、14、17、20、23和/或26的互補序列。在一些實施例中,所述試劑盒包含用于檢測選自由以下組成的群組的標記的探針:nf2、smad4、kdm6a、fbxw7、tp53、cdkn2a、cdkn2a_p14和apc。在其它實施例中,所述試劑盒包含用于檢測選自由以下組成的群組的標記基因的突變的探針:nf2、smad4、kdm6a、fbxw7、tp53、cdkn2a、cdkn2a_p14和apc。在一個實施例中,試劑盒包含用于檢測包含兩個或兩個以上來自由以下組成的群組的標記的標記組的探針:nf2、smad4、kdm6a、fbxw7、tp53、cdkn2a、cdkn2a_p14和apc。在另一個實施例中,試劑盒包含用于檢測子宮癌或子宮頸癌中的fbxw7的探針。在一個實施例中,試劑盒包含用于檢測腸癌、乳癌、肺癌、頭頸癌、子宮頸癌或皮膚癌中的tp53的探針。在一個實施例中,試劑盒包含用于檢測腸癌中的tpc和apc的探針。在一個實施例中,試劑盒包含用于檢測皮膚癌或中樞神經系統癌中的cdkn2a_p14的探針。在一個實施例中,試劑盒包含用于檢測頭頸癌或皮膚癌中的cdkn2a的探針。在一個實施例中,試劑盒包含用于檢測頭頸癌中的smad4的探針。在相關實施例中,所述試劑盒包含核酸探針,所述核酸探針包含或來源于(例如其片段、突變體或變異體(例如同源或互補))選自由以下組成的群組的核酸序列:seqidno:1、2、4、5、7、8、9、12、13、15、16、18、19、21、22、24和25。關于包含核酸探針的試劑盒,例如基于寡核苷酸的試劑盒,所述試劑盒可以包含例如:一或多種核酸試劑,例如寡核苷酸(標記或非標記的),其與對應于任選地固定到底物上的本發(fā)明標記的核酸序列雜交;并且可以任選地進一步包含不與底物結合的標記寡核苷酸、引物、一對pcr引物,例如適用于擴增對應于本發(fā)明標記的核酸分子,分子信標探針、包含與對應于本發(fā)明標記的至少兩個核酸序列雜交的寡核苷酸的標記組等。所述試劑盒可以含有rna穩(wěn)定劑。
關于包含蛋白質探針的試劑盒,例如基于配位體或抗體的試劑盒,所述試劑盒可以包含例如:(1)第一抗體(例如連接到固體支撐物),其結合對應于本發(fā)明標記的多肽;和任選地(2)不同的第二抗體,其或者結合所述多肽或者結合所述第一抗體并且結合到可檢測標記。所述試劑盒可以含有蛋白質穩(wěn)定劑。所述試劑盒可以含有用于降低來自樣品的非生物標記材料與探針的非特異性結合的量的試劑。用于降低非特異性結合的試劑的實例包括非離子型洗滌劑、含有非特異性蛋白質的溶液,例如那些含有白蛋白或酪蛋白的溶液,或本領域的普通技術人員已知的其它物質。
對應于本發(fā)明預測標記或其片段或突變體的分離多肽可以用作免疫原,從而使用多克隆和單克隆抗體的標準制備技術產生抗體。舉例來說,免疫原通常用于通過使合適的(即具有免疫能力的)個體免疫來制備抗體,所述個體例如兔、山羊、小鼠或其它哺乳動物或脊椎動物。在又另一方面,本發(fā)明提供單克隆抗體或其抗原結合片段,所述抗體或片段特異性地結合包含選自由以下組成的群組的氨基酸序列的多肽:本發(fā)明氨基酸序列、由本發(fā)明cdna編碼的氨基酸序列、本發(fā)明氨基酸序列的至少8、10、12、15、20或25個連續(xù)氨基酸殘基的片段、與本發(fā)明氨基酸序列至少95%、96%、97%、98%或99%相同的氨基酸序列(其中一致性百分比使用gcg軟件包的align程序測定,所述軟件包具有pam120重量殘留表,空隙長度處罰是12并且空隙處罰是4)和由核酸分子編碼的氨基酸序列,所述核酸分子與由本發(fā)明核酸分子或其互補序列組成的核酸分子雜交,在6×ssc下在45℃的雜交條件下并且在0.2×ssc、0.1%sds中,在65℃下洗滌。單克隆抗體可以為人類抗體、人類化抗體、嵌合抗體和/或非人類抗體。恰當的免疫原性制劑可以含有例如重組表達或化學合成的多肽。所述制劑可以進一步包括佐劑,例如弗氏完全或不完全佐劑(freund′scompleteorincompleteadjuvant),或類似的免疫刺激劑。
制造人類抗體的方法是本領域中已知的。制造人類抗體的一種方法使用轉基因動物,例如轉基因小鼠。這些轉基因動物含有插入到其自身基因組中的大量產生人類抗體的基因組并且所述動物自身的內源性抗體產生過程在產生抗體方面變得有缺陷。制造這類轉基因動物的方法是本領域中已知的。這類轉基因動物可以使用xenomousetm技術或通過使用“微型基因座”方法制得。制造xenomicetm的方法描述在美國專利第6,162,963號、第6,150,584號、第6,114,598號和第6,075,181號中,這些專利以引用的方式并入本文中。使用“微型基因座”方法制造轉基因動物的方法描述在美國專利第5,545,807號、第5,545,806號和第5,625,825號中;還參見國際公開案第wo93/12227號,這些專利各自以引用的方式并入本文中。
抗體包括免疫球蛋白分子和免疫球蛋白分子的免疫活性部分,即含有特異性結合抗原的抗原結合位點的分子,例如本發(fā)明的多肽,例如本發(fā)明多肽的表位。特異性結合指定的本發(fā)明多肽的分子是結合所述多肽,但不實質上結合樣品(例如生物樣品,其自然地包含所述多肽)中的其它分子的分子。舉例來說,來源于上述抗體的抗原結合片段以及全長單體、二聚或三聚多肽本身是有用的。這種類型的有用抗體同源物包括(i)fab片段,一種由vl、vh、cl和ch1結構域組成的單價片段;(ii)f(ab′)2片段,一種包含通過鉸鏈區(qū)的二硫橋鍵連接的兩個fab片段的二價片段;(iii)由vh和ch1結構域組成的fd片段;(iv)由抗體單臂的vl和vh結構域組成的fv片段;(v)dab片段(沃德(ward)等人,《自然》341:544-546(1989)),其由vh結構域組成;(vii)單一結構域功能重鏈抗體,其由vhh結構域(稱為納米抗體)組成,參見例如科特斯·雷塔莫佐(cortez-retamozo)等人,《癌癥研究》64:2853-2857(2004)和本文中所引用的參考文獻;以及(vii)分離的互補決定區(qū)(cdr),例如與足以提供抗原結合片段的骨架一起的一或多個分離的cdr。此外,盡管fv片段的兩個結構域(vl和vh)是通過獨立基因編碼的,然而其可以使用重組方法通過合成連接子接合,所述連接子能夠使其制造成vl和vh區(qū)成對以形成單價分子的單蛋白鏈(稱為單鏈fv(scfv);參見,例如伯德(bird)等人,《科學》(science)242:423-426(1988);和休斯頓(huston)等人,《美國國家科學院院刊》85:5879-5883(1988)。這類單鏈抗體也打算涵蓋在術語抗體的“抗原結合片段”內。這些抗體片段使用本領域的普通技術人員已知的常規(guī)技術獲得,并且以與完整抗體相同的方式來就效用對片段進行篩選。抗體片段例如fv、f(ab′)2和fab可以通過裂解完整蛋白質,例如通過蛋白酶或化學裂解來制備。本發(fā)明提供多克隆和單克隆抗體。本發(fā)明還涵蓋上述任一者的合成的和基因工程化的變異體(參見美國專利第6,331,415號)。多克隆和單克隆抗體可以通過各種技術產生,包括常規(guī)的鼠類單克隆抗體方法,例如科勒(kohler)和米爾斯坦(milstein),《自然》256:495(1975)的標準體細胞雜交技術、人類b細胞雜交瘤技術(參見科茲博(kozbor)等人,1983,《今日免疫學》(immunol.today)4:72)、ebv-雜交瘤技術(參見科爾(cole)等人,第77-96頁,《單克隆抗體和癌癥療法》(monoclonalantibodiesandcancertherapy),艾倫r.利斯公司(alanr.liss,inc.),1985)或三源雜交瘤技術。總體上參見哈洛,e.和萊恩,d.(1988)《抗體實驗手冊》,冷泉港實驗室出版社,冷泉港,紐約;和《免疫學最新方案》(currentprotocolsinimmunology),科利根(coligan)等人編,約翰·威利父子公司,紐約,1994。關于診斷應用,所述抗體可以是單克隆抗體,例如產生于小鼠、大鼠或兔中。此外,為了用于體內應用,本發(fā)明抗體可以是人類抗體或人類化抗體。產生本發(fā)明單克隆抗體的雜交瘤細胞通過例如使用標準elisa分析,針對結合相關多肽的抗體篩選雜交瘤培養(yǎng)上清液來檢測。
必要時,可以采集抗體分子或與個體分離(例如與個體的血液或血清分離)并通過眾所周知的技術(例如蛋白質a色譜)進一步純化以獲得igg洗提份?;蛘?,可以選擇對本發(fā)明蛋白質或多肽具有特異性的抗體或通過例如親和色譜法純化(例如部分地純化)以獲得實質上純化和純化的抗體。在此上下文中,實質上純化的抗體組合物意指所述抗體樣品包含最多僅30%(以干重計)的針對除所要的本發(fā)明蛋白質或多肽的表位以外的表位的污染抗體,并且最多20%、最多10%或最多5%(以干重計)的樣品是污染抗體。純化的抗體組合物意指所述組合物中至少99%的抗體是針對所要的本發(fā)明蛋白質或多肽。
針對對應于本發(fā)明標記的多肽的抗體(例如單克隆抗體)可以用于檢測所述標記(例如在細胞樣品中)以便評估所述標記的表達水平和模式。舉例來說,抗體也可以診斷性地用于監(jiān)控組織或體液(例如在血液樣品或尿液中)中的蛋白質水平作為臨床測試程序的一部分,例如從而測定指定治療方案的功效??梢酝ㄟ^將所述抗體耦合到可檢測物質促進檢測??蓹z測物質的實例包括各種酶、輔基、熒光材料、發(fā)光材料、生物發(fā)光材料和放射性材料。合適的酶的實例包括辣根過氧化酶、堿性磷酸酶、β-半乳糖苷酶或乙酰膽堿酯酶;合適的輔基復合物的實例包括抗生蛋白鏈菌素/生物素和抗生物素蛋白/生物素;合適的熒光材料的實例包括傘酮、熒光素、異硫氰酸熒光素、若丹明(rhodamine)、二氯三嗪基胺熒光素、丹磺酰氯或藻紅素;發(fā)光材料的實例包括魯米諾(luminol);生物發(fā)光材料的實例包括熒光素酶、熒光素和發(fā)光蛋白質;以及合適的放射性材料的實例包括125i、131i、35s或3h。
因此,在一個方面,本發(fā)明提供實質上純化的抗體或其片段和其非人類抗體或片段,所述抗體或片段特異性地結合包含由本文中所鑒別的標記編碼的氨基酸序列的多肽。實質上純化的本發(fā)明抗體或其片段可以是人類抗體、非人類抗體、嵌合抗體和/或人類化抗體。
在另一個方面,本發(fā)明提供非人類抗體或其片段,所述抗體或片段特異性地結合包含由本發(fā)明的預測標記的核酸分子編碼的氨基酸序列的多肽。此些非人類抗體可以是山羊、小鼠、綿羊、馬、雞、兔或大鼠抗體?;蛘?,本發(fā)明的非人類抗體可以是嵌合抗體和/或人類化抗體。另外,本發(fā)明的非人類抗體可以是多克隆抗體或單克隆抗體。
實質上純化的抗體或其片段可以特異性地結合于本發(fā)明多肽的信號肽、分泌序列、胞外結構域、跨膜或細胞質結構域或細胞質環(huán)。本發(fā)明的實質上純化的抗體或其片段、非人類抗體或其片段和/或單克隆抗體或其片段特異性地結合于本發(fā)明氨基酸序列的分泌序列或胞外結構域。
本發(fā)明還提供了一種試劑盒,所述試劑盒含有結合到可檢測物質的本發(fā)明抗體和使用說明書。本發(fā)明的又另一方面是一種診斷組合物,其包含本發(fā)明的探針和藥學上可接受的載劑。在一個實施例中,所述診斷組合物包含本發(fā)明的抗體、可檢測部分和藥學上可接受的載劑。
敏感性分析
從患者獲得癌細胞樣品。測量樣品中對應于至少一種本文所述的標記的標記的表達水平??梢圆捎冒疚乃龅乃b別的標記的標記組,并且使用本文中所描述的方法一起放在標記組中。此些分析用于獲得患者的腫瘤的表達圖譜。然后使用表達圖譜的評估來確定所述患者是否預期具有有利結果并且將受益于治療,例如nae抑制療法(例如用單獨的或與附加藥劑組合的nae抑制劑(例如mln4924)治療),或預期對存活具有類似作用的替代性藥劑。表達圖譜的評估也可以用于確定患者是否預期具有不利結果并且將受益于除nae抑制療法以外的癌癥療法或將受益于改變的nae抑制療法方案。評估可以包括使用一個標記組,所述標記組是使用所提供的方法或本領域中已知的其它類似評分方法(例如加權投票、臨界值特征組合(combinationofthresholdfeatures;ctf)、cox比例風險分析、主成分評分、線性預測評分、k最近鄰算法(k-nearestneighbor)等)的中的任一種制備的,例如使用在美國國家生物技術信息中心(ncbi,馬里蘭州貝塞斯達)用基因表達大棚車(geo)程序寄存的表達值。再者,評估可以包含使用一個以上所制備的標記組。nae抑制療法將鑒別為當評估結果展示有利結果時適用于治療癌癥或將鑒別侵襲性更大的療法方案用于具有預期不利結果的患者。
在一個方面,本發(fā)明的特征在于一種評估患者,例如患有癌癥,例如血液癌癥(例如多發(fā)性骨髓瘤、白血病、淋巴瘤等)或實體腫瘤癌癥(例如黑素瘤、食道癌或膀胱癌)的患者的治療結果的方法。所述方法包括提供患者標記的標記組中標記的表達的評估,其中所述標記組具有以下特性:其包括多個基因,這些基因各自在具有所鑒別的結果的患者與非患病個體之間有差異地表達,并且其所含有差異地表達的標記的數量足以使個體標記組中每一個標記的不同量(例如如相比于非患病參考樣品中的水平)可預測治療結果,其中不超過約15%、約10%、約5%、約2.5%或約1%假陽性(其中假陽性意指預測患者具有反應性或非反應性而所述個體并不具有);并且提供患者的所述組中每一個標記的量與參考值的比較,由此評估所述患者。
在nae抑制療法過程期間檢查從患者獲取的腫瘤樣品中所鑒別的標記或標記組中的一或多者的量,還有可能確定所述治療劑是否繼續(xù)起作用或所述癌癥對所述治療方案是否已經變成非反應性(難治愈)。舉例來說,接受mln4924治療的患者將去除腫瘤細胞并監(jiān)控標記或標記組的表達。如果在所述藥劑,例如nae抑制劑存在下,本文中所鑒別的一或多個標記的量的概況更具有有利結果的特點,那么所述治療將繼續(xù)。然而,如果在所述藥劑存在下,本文中所鑒別的一或多個標記的量的概況更具有不利結果的特點,那么所述癌癥可能已經對療法,例如nae抑制療法產生抗性,并且應該開始另一種治療方案來治療所述患者。舉例來說,所述癌癥可以包含與對nae抑制的抗性相關的標記基因的突變。
重要地,可以基于逐個患者或基于逐一藥劑(或藥劑組合)做出這些判定。由此可以確定特定nae抑制療法是否可能使某一特定患者或一組/類患者受益,或特定治療是否應該繼續(xù)。
信息的用途
在一種方法中,向第三方,例如醫(yī)院、診所、政府實體、賠償方或保險公司(例如人壽保險公司)提供(例如傳達,例如用電子方式傳達)信息,例如關于患者腫瘤的突變狀態(tài)的信息,例如患者的標記特征,例如大小、序列、組成或量(例如本文所述標記或標記組的評估結果),或關于患者是否預期具有有利結果的信息。舉例來說,醫(yī)療程序的選擇、是否支付醫(yī)療程序、由賠償方支付或服務成本或保險可以是所述信息的功能。舉例來說,第三方接收信息,至少部分基于所述信息做出決定,并且任選地傳達所述信息或基于所述信息選擇程序、支付、支付級別、覆蓋范圍等。在所述方法中,測定標記或標記組的提供信息的表達水平,所述標記或標記組選自或來源于表1和/或描述于本文中。
在一個實施例中,保險(例如人壽保險或醫(yī)療保險)的保險費評估為關于一或多個標記的表達水平的信息的功能,例如標記或標記組,例如與治療結果相關的表達水平(例如提供信息的量)。舉例來說,如果本文所述的患者的標記基因或患者的標記組在受保候選人(或尋求保險覆蓋范圍的候選人)與參考值(例如非患者者)或參考樣品(例如匹配的對照)之間具有不同特征,例如大小、序列、組成或量,那么可以增加保險費(例如增加一定百分比)。保險費也可以取決于本文所述標記或標記組的評估結果按比例調整。舉例來說,可以依據標記,例如本文所述標記或標記組的評估結果來評定保險費以分散風險。在另一實例中,依據從具有已知治療結果的患者獲得的保險數據評定保險費。
例如在人壽保險的核保過程中,可以使用關于標記特征,例如大小、序列、組成或量的信息,例如本文所述標記或標記組的評估結果(例如提供信息的量)。所述信息可以并入關于個體的簡介中。簡介中的其它信息可以包括例如出生日期、性別、婚姻狀況、銀行信息、信用信息、子女等??梢砸罁P于標記特征,例如大小、序列、組成或量的信息,例如本文所述標記或標記組的評估結果,以及簡介中一或多個其它信息項目推薦保險單。也可以依據標記或標記組信息評估保險費或風險評估。在一種實施方式中,基于預期治療結果指定要點。
在一個實施例中,通過決定是否授權將資金轉移至支付為個體提供的服務或治療(或做出本文中所提到的另一個決策)的功能來分析關于標記特征,例如大小、序列、組成或量的信息,例如本文所述標記或標記組的評估結果。舉例來說,本文所述標記或標記組的特征,例如大小、序列、組成或量的分析結果可以表明所述個體預期具有有利結果,表明治療過程是需要的,由此引發(fā)以下結果:表明或致使授權支付為個體提供的服務或治療。在一個實例中,測定選自或來源于表1和/或本文所述的標記或標記組的提供信息的特征,例如大小、序列、組成或量,并且如果提供信息的量鑒別有利結果,那么授權支付。舉例來說,支付或賠償醫(yī)療費用的實體,例如醫(yī)院、護理者、政府實體或保險公司或其它實體可以使用本文所述方法的結果來決定當事人,例如除個體患者以外的當事人是否將支付為患者提供的服務(例如特定療法)或治療。舉例來說,第一實體,例如保險公司可以使用本文所述方法的結果來決定是否為患者或代表患者提供財務支付,例如是否賠償第三方,例如貨物或服務的供應商、醫(yī)院、醫(yī)師或其它護理者為患者提供的服務或治療。舉例來說,第一實體,例如保險公司可以使用本文所述方法的結果來決定在保險計劃或程序,例如健康保險或人壽保險計劃或程序中是否繼續(xù)、中斷、招收個體。
在一個方面,本發(fā)明的特征是一種提供數據的方法。所述方法包括提供本文所述的數據,例如通過本文所述方法產生的數據,從而為決定是否將提供支付提供記錄,例如本文所述的記錄。在一些實施例中,通過計算機、光盤、電話、傳真、電子郵件或書信提供數據。在一些實施例中,由甲方向乙方提供數據。在一些實施例中,甲方選自個體、醫(yī)療提供者、主治醫(yī)生、健康維護組織(hmo)、醫(yī)院、政府實體或售賣或供應藥物的實體。在一些實施例中,乙方是第三方支付者、保險公司、雇主、雇主贊助的健康計劃、hmo或政府實體。在一些實施例中,甲方選自個體、醫(yī)療提供者、主治醫(yī)生、hmo、醫(yī)院、保險公司或售賣或供應藥物的實體并且乙方是政府實體。在一些實施例中,甲方選自個體、醫(yī)療提供者、主治醫(yī)生、hmo、醫(yī)院、保險公司或售賣或供應藥物的實體并且乙方是保險公司。
在另一個方面,本發(fā)明的特征是一份記錄(例如計算機可讀記錄),其包括患者的標記或標記組的特征,例如大小、序列、組成或量的清單和值。在一些實施例中,所述記錄包括每個標記的一個以上的值。
現將通過以下實例來說明本發(fā)明,所述實例并不打算以任何方式限制。
實例
實例1.細胞系小組篩選
為了支持臨床開發(fā)和鑒別具有腫瘤敏感性或抗性的可能性生物標記,用mln4924處理兩大組癌細胞系(第1組,n=653(麥克德莫特(mcdermott)等人(2007)國家科學院院刊104:19936-19941);第2組,n=240(歐黛(o′day)等人(2010)關于癌癥治療開發(fā)中分子診斷的第四次aacr國際會議))并且產生細胞活力數據(ic50、ec50和poc-對照百分比)。
第1組(麥克德莫特等人,同前文獻)。使細胞系暴露于三個mln4924濃度(20nm、200nm和2μm),持續(xù)72小時。通過測量細胞滲透性核酸染色的熒光對活力(即細胞數量)進行定量。獲取每個樣品一式三份值的平均值并且與dmso對照對比以計算對照百分比。在結果中,對照或無活性值指定是約1的值,敏感性通過小于1的值指示,其中0作為整個細胞群體的死亡并且抗性通過大于1的值指示。獲得每個濃度活力值的連續(xù)區(qū),因此選擇一些值作為最終測定敏感性或抗性的截止點。舉例來說,小于小組中記錄的所有poc的中間值的中間poc值(<0.34)指示敏感性,0.34到0.75的值指示邊界敏感性,大于小組中所有poc的第3四分位數的值(>0.75)指示不敏感性或抗性。一般來說,敏感性細胞系觀察到劑量反應關系。最終判斷細胞系為敏感性、不敏感性或抗性是通過其在2μm下的活力判定的。
第2組(華盛頓州波塞爾的里切爾卡生物科學公司)。在10個濃度的半對數稀釋液中添加mln4924并且處理72小時。通過包括圖像分析的熒光顯微鏡篩選高含量細胞以產生若干類型的數據。結果包括ec50值(在測量細胞數量之后,從對照百分比(poc)與mln4924濃度的對數的曲線的拐點計算ec50濃度)、ic50值(來自poc-logmln4924曲線,ic50是在50%最大可能反應下的濃度)、細胞凋亡(針對mln4924濃度的對數繪制的半胱天冬酶3的活化測量結果,測定為濃度>5倍誘導)以及有絲分裂活性(通過測量磷酸化-組蛋白3的成倍增加測定)。ec50與ic50的對比(圖3)允許將細胞系分成敏感性、不敏感性或抗性。細胞系是敏感性或抗性的最終鑒別是基于ec50值。敏感性截止值是小于小組中所記錄的所有poc的中間值的中間ec50(<0.36),邊界敏感性與0.36到1.67的中間ec50相關并且不敏感性或抗性細胞系通過大于小組中所有poc的第3四分位數的ec50鑒別(>1.67)。
第1組和第2組之間的重疊細胞系(114個重疊)顯示一致的生長抑制作用(斯皮爾曼相關系數=0.72)。另外,對每個細胞系組的整體(不僅是重疊細胞系)組織學和突變分析在兩個組之間也產生了一致的觀察結果(圖4a和b)。
使用中間對照百分比值的費雪精確檢驗用于評估細胞系中個體突變與mln4924敏感性或抗性的相關性。參見表3,關于所選基因p值的匯總。其突變與費雪精確檢驗中的敏感性相關的基因包括nf2、smad4、kdm6a、cdkn2a和cdkn2a_p14。rb1和tp53與不敏感性相關。
表3.與對mln4924的反應相關的突變標記的置信度
*表示rb1相關的并不是所有細胞類型的結論性表型。一些腫瘤類型相比于其它腫瘤類型與抗性的相關性更大:腦腫瘤、膀胱腫瘤、骨腫瘤和肺腫瘤(nsclc)的p值分別是0.102、0.205、0.226和0.281。rb1不是敏感性標記的結果與吉亞(jia)等人((2011)《瘤形成》(neoplasia)13:561-569)的結果一致,吉亞等人的結果排除了mln4924機制中rb1的參與。
實例2.分析突變相關性
將細胞系中基因突變與對治療劑的敏感性相互關聯的一個困難是許多細胞系具有一個以上突變基因。舉例來說,名為8505c的來自甲狀腺癌的細胞系具有braf、tp53、nf2和cdkn2a突變。具體來說,tp53和cdkn2a突變與細胞系中的其它突變同時出現。為了獲悉細胞系小組中哪種突變體與敏感性或抗性相關,進行了子分析。
apc對比tp53.在第1組細胞系中,23個細胞系具有apc突變。在這些細胞系中,18個細胞系也具有tp53突變。難以確定apc是否是針對mln4924的抗性的驅動因素,或者僅僅是tp53突變體中經常發(fā)現的乘客突變。通過扣除具有雙重突變體(其包括tp53)的細胞系進行細胞系的進一步分析(表4)。
表4.在第1組中tp53突變體細胞系與apc和其它突變體細胞系的對比
如表4a可見,從細胞系小組中扣除tp53突變體使得數量過少以致于無法得出剩余突變與tp53wt細胞系對mln4924治療的抗性相關的結論。在去除所有23個apc突變體之后,tp53似乎仍與抗性相關(表4b)。盡管如此,具有apc和tp53突變兩者的細胞系展示與抗性強烈相關(表4c)。此外,apc+tp53突變體子組中的大部分細胞系是來自腸道癌腫瘤樣品(表5,其還包括來自第2組和六個第1組細胞系的細胞系和數據,其不包括在初始扣除分析中)。
表5.具有apc和tp53突變的細胞系子集
與組織學的相關性.在一些類型的腫瘤中一些tp53突變與抗性的相關性有可能超過其它。通過曼-惠特尼(mann-whitney)(非參數)測試來分析組織類型中的tp53突變體細胞系。如圖5中可見,在結腸癌細胞系中,tp53突變與對mln4924的抗性顯著相關(p值=0.04022)。
其它組織中的類似的相關性分析表明在乳癌和肺癌(nsclc)細胞系中,tp53突變與mln4924抗性相關。
分析附加突變的腫瘤組織學與對mln4924治療的抗性或敏感性的可能相關性。表6提供了第1組的分析結果并且表7提供了第2組的分析結果,其更小的大小證明了關于此類分析的挑戰(zhàn)。選擇p值<0.05的組織相關性截止值。
表6.第1組的突變與組織學的相關性
表7.第2組的突變與組織學的相關性
*cns的p值來源于對照百分比活力。關于皮膚,p值來源于ec50。
相比于tp53與對mln4924的抗性的一般相關性,在頭頸癌中,tp53突變與敏感性相關。在皮膚和中樞神經系統(cns)中發(fā)現了關于cdkn2a突變的類似對比。在皮膚和cns腫瘤細胞系中,cdkn2a或cdkn2a.p14突變與對mln4924治療的抗性相關,盡管cdkn2a突變一般與對mln4924治療的敏感性相關。表6和7也展示了在子宮頸癌和皮膚癌中tp53突變與抗性顯著相關;在頭頸癌中cdkn2a突變與敏感性顯著相關;在頭頸癌中,smad4突變與敏感性顯著相關;在肺癌中rb1突變與抗性顯著相關;以及在骨癌中rb1突變與敏感性顯著相關。
實例3.個別細胞系篩選結果
以下各表包括個別細胞系篩選結果,所述結果得出關于標記的結論,所述標記的突變賦予對mln4924的敏感性。
突變符號和突變語法的解釋可見于cosmic數據庫中。
實例4.tp53缺失與抗性的相關性
確定tp53對mln4924的反應性的作用的另一種方法是缺失tp53基因的研究。在早期研究中,p53對mln4924的復制反應的重要性似乎取決于特異性遺傳操控并且預期密切反映cdt1過度表達(cdt1是兩種替代性crl復合物的底物并且通過許多細胞系中的mln4924穩(wěn)定)。在阻斷基因表現研究中,p53在早期時間點似乎表現得類似于cdt1阻斷基因表現,但在隨后的時間點并非如此,除非使用更高濃度的mln4924。西方印記法表明通過sirnasmartpool的有效p53蛋白質阻斷基因表現,但是rnai一般不引起蛋白質的完全丟失。因此,殘留蛋白質仍會影響對mln4924的反應,尤其是因為mln4924促使p53穩(wěn)定(廖(liao)等人(2011)《分子細胞蛋白質組學》(mol.cellproteomics)10:10.1074/mcp.m111.009183)。評定mln4924對遺傳缺失p53以及其家長控制的hct-116細胞的活力作用。
將用于p53表達的或者野生型(+/+)或者剔除式(-/-)配對的同基因hct-116細胞系(分別是hdpar-018和hd104-001,地平線發(fā)現有限公司(horizondiscoveryltd))接種于單獨的384孔板中并且然后在第二天用mln4924滴定一式三份地處理,并且培育24、36、48或72小時,其中接種密度分別是每孔1600、1200、800和400個細胞。在化合物培育之后,通過atplite分析(珀金埃爾默(perkinelmer)),根據制造商的說明書使用leadseeker成像系統(通用電氣醫(yī)療集團)來評定hct-116細胞的活力。
hct-116tp53+/+細胞(mln4924lc50=21±1nm)表明在72小時mln4924敏感性大于hct-116tp53-/-細胞(mln4924lc50=74±5nm;圖6a-d)。這些結果表明p53缺乏使hct-116對mln4924的敏感性降低,表明p53在72小時的首要作用是促凋亡。更早的時間點加強了此解釋,因為tp53-/-細胞在最高藥物濃度下在24、36和48小時的細胞死亡較少。西方印跡法顯示p21仍通過tp53-/-hct-116細胞中的mln4924上調。在hct-116細胞中,p21的穩(wěn)定可以是抑制crl4-cdt2的直接作用(西谷(nishitani)等人,2008;阿巴斯(abbas)等人,2008;金姆(kim)等人,2008)。
此結果與林(lin)等人(2010)《癌癥研究》70:10310-10320中使用hct116-/-p53基因剔除細胞的結論相反。在所述研究中,得出以下結論:tp53基因剔除細胞更容易受mln4924影響經歷整體細胞死亡或生長抑制。本發(fā)明研究得出不同于林等人的結論的原因是用mln4924處理細胞的時間量。在林等人中,在清除之前處理細胞8小時。在本發(fā)明研究中和在先前實例的細胞系小組中,用mln4924連續(xù)地處理細胞72小時。在清除中,相比于最初受到抑制并引起早期易感性的早期路徑,p53水平允許穩(wěn)定并利用活化替代性路徑。
實例5.分離核酸和核酸測序方法
基因組分離和dna測序.使用
桑格測序方法.使用根據基因-外顯子優(yōu)化的循環(huán)條件進行pcr擴增。使用應用生物系統公司3.1版bigdye進行引物延伸測序。然后在應用生物系統公司的3730xldna分析儀上進行反應。使用kbtm堿基讀出(應用生物系統公司)完成測序堿基讀出。通過突變測量器(mutationsurveyor)(軟遺傳學公司(softgenetics))測定體細胞突變讀出并且通過使用seqman(dnastar)比對測序數據與相應參考序列手動確認。
sequenom測序方法.使用
然后設計pcr引物以支托分析設計步驟中所鑒別的區(qū)域。在pcr反應中使用引物擴增相關區(qū)域。使用納米分配器rs1000將15nl經擴增和延伸的產物點樣在384spectrochipii上。向每個芯片中添加3-點校準物以確保sequenommaldi-tof緊湊型質譜儀的恰當性能。
將spectrochipii放在sequenommaldi-tof緊湊型質譜儀中。將質譜儀點火,在384孔spectrochip上的每個點最多采集9處。遵循制造商推薦的方案使用來自sequenom(10142-2)的typeplexgold試劑盒spectrochipii。使用sequenom分析軟件
下一代測序(ngs)方法.使用伊路米那平臺(加利福尼亞州圣地亞哥的伊路米那公司)的目標ngs用于證實并鑒別標記中的低頻突變。設計引物對來擴增編碼外顯子。使用picogreen分析對pcr產物定量并且每個樣品以相同摩爾比合并。對純化產物進行末端修復并通過連接級聯。級聯產物用于hi-seq2000文庫制備。剪切級聯pcr產物并將其用于制造由每多路復用池12個帶條碼的樣品組成的帶條碼的hi-seq2000文庫。使匯集的hi-seq2000文庫通過在hi-seq2000流動細胞的八個通道上簇生成經歷克隆擴增并且在hi-seq2000上使用1×100單端測序進行測序。將初始測序讀數與人類基因組構建hg18進行匹配,以及使用伊路米那的1.7.1版casava軟件進行snp分析。
通用程序
定量rt-pcr
使用abi基因表達分析、試劑和abi
骨髓瘤樣品的樣品處理
在收集患者骨髓抽吸物之后,通過快速陰性選擇濃縮骨髓瘤細胞。濃縮程序采用與結合紅血細胞rosettesep(干細胞技術公司(stemcelltechnologies))的抗體耦合的細胞型特異性抗體的混合物。抗體混合物含有具有以下特異性的抗體:cd14(單核細胞)、cd2(t和nk細胞)、cd33(骨髓祖細胞和單核細胞)、cd41(血小板和巨核細胞)、cd45ra(未處理的b和t細胞)和cd66b(粒細胞)。抗體使樣品中的非骨髓瘤細胞類型與紅血細胞交叉結合。使用修飾的聚蔗糖密度梯度去除結合細胞類型。然后收集并冷凍骨髓瘤細胞。
使用
自通過rna分離方法中所用的管柱的洗提份的流體分離dna。
分析陣列上的骨髓瘤基因表達
通過標準的基于t7的擴增方案(加利福尼亞州圣克拉拉的
每個樣品的crna一式三份地與u133a/b陣列雜交;期間控制操作者、芯片批次、臨床位點和掃描器(
骨髓瘤純度評分檢查了文獻中已知在骨髓瘤細胞(和其正常血漿前體細胞)中高度表達的基因的表達,已知在紅細胞系細胞、嗜中性白細胞和t細胞中高度表達的基因的表達(參見以下14個標記的清單)。骨髓瘤評分=骨髓瘤標記(以下1-4號)/紅細胞(5-7號)+嗜中性白細胞(8-11號)+t細胞(12-14號)的表達:
1.205692_s_在cd38cd38抗原(p45)骨髓瘤/漿細胞
2.201286_在sdc1多配體蛋白聚糖-1骨髓瘤/漿細胞
3.201891_s_在b2mβ-2微球蛋白骨髓瘤/漿細胞
4.211528_x_在b2mβ-2微球蛋白骨髓瘤/漿細胞
5.37986_在epor促血紅細胞生長素受體紅細胞系細胞
6.209962_在epor促血紅細胞生長素受體紅細胞系細胞
7.205838_在gypa血型糖蛋白a紅細胞系細胞
8.203948_s_在mpo髓過氧物酶嗜中性白細胞
9.203591_s_在csfr3群落刺激因子3受體(粒細胞)嗜中性白細胞
10.204039_在cebpaccaat/強化子結合蛋白(c/ebp),α嗜中性白細胞
11.214523_在cebpeccaat/強化子結合蛋白(c/ebp),ε嗜中性白細胞
12.209603_在gata3gata結合蛋白3t淋巴細胞
13.209604_s_在gata4gata結合蛋白4t淋巴細胞
14.205456_在cd3ecd3e抗原,ε多肽t淋巴細胞
骨髓瘤純度評分小于10的樣品從進一步分析中排除。
等效物
雖然已經使用特定的術語描述本發(fā)明的實施例,但是這類描述僅是出于說明性目的,并且應了解可以在不脫離本發(fā)明的精神或范圍的情況下作出改變和變化。本領域的普通技術人員頂多使用常規(guī)實驗即可識別或能夠確定本文所述的本發(fā)明的特定實施例的許多等效物。這些等效物打算由所附權利要求書涵蓋。
序列表
<110>米倫紐姆醫(yī)藥公司
通用醫(yī)院公司以麻省總醫(yī)院名義經營
<120>對nedd8活化酶(nae)抑制劑的反應的生物標記
<130>mpi11-009p1rnwo2m
<150>us61/552,686
<151>2011-10-28
<160>26
<170>fastseqforwindowsversion4.0
<210>1
<211>6046
<212>dna
<213>智人
<400>1
tgcgcttcccgcgggcgcgcggagtgaggacggtgacagccacgcgcgcgcgtacgcgcc60
cgatgcagcgcggccccgtgaccctagtcggccgctgagaggcgcgcggagtctgggccg120
ctgccgtctaggggtcccgtcccgaggcgtccccggcatctccggcccgaatcccggagt180
gccgggtcgcgcctgcaccgaaggtcccggctcctgtgccctccctgcagccgtcagggc240
ccgtcccccaactcccctttccgctcaggcagggtcctcgcggcccatgctggccgctgg300
ggacccgcgcagcccagaccgttcccgggccgggcagccggccaccatggtggccctgag360
gcctgtgcagcaactccaggggggctaaagggctcagagtgcaggccgtggggcgcgagg420
gtcccgggcctgagccccgcgccatggccggggccatcgcttcccgcatgagcttcagct480
ctctcaagaggaagcaacccaagacgttcaccgtgaggatcgtcaccatggacgccgaga540
tggagttcaattgcgagatgaagtggaaagggaaggacctctttgatttggtgtgccgga600
ctctggggctccgagaaacctggttctttggactgcagtacacaatcaaggacacagtgg660
cctggctcaaaatggacaagaaggtactggatcatgatgtttcaaaggaagaaccagtca720
cctttcacttcttggccaaattttatcctgagaatgctgaagaggagctggttcaggaga780
tcacacaacatttattcttcttacaggtaaagaagcagattttagatgaaaagatctact840
gccctcctgaggcttctgtgctcctggcttcttacgccgtccaggccaagtatggtgact900
acgaccccagtgttcacaagcggggatttttggcccaagaggaattgcttccaaaaaggg960
taataaatctgtatcagatgactccggaaatgtgggaggagagaattactgcttggtacg1020
cagagcaccgaggccgagccagggatgaagctgaaatggaatatctgaagatagctcagg1080
acctggagatgtacggtgtgaactactttgcaatccggaataaaaagggcacagagctgc1140
tgcttggagtggatgccctggggcttcacatttatgaccctgagaacagactgaccccca1200
agatctccttcccgtggaatgaaatccgaaacatctcgtacagtgacaaggagtttacta1260
ttaaaccactggataagaaaattgatgtcttcaagtttaactcctcaaagcttcgtgtta1320
ataagctgattctccagctatgtatcgggaaccatgatctatttatgaggagaaggaaag1380
ccgattctttggaagttcagcagatgaaagcccaggccagggaggagaaggctagaaagc1440
agatggagcggcagcgcctcgctcgagagaagcagatgagggaggaggctgaacgcacga1500
gggatgagttggagaggaggctgctgcagatgaaagaagaagcaacaatggccaacgaag1560
cactgatgcggtctgaggagacagctgacctgttggctgaaaaggcccagatcaccgagg1620
aggaggcaaaacttctggcccagaaggccgcagaggctgagcaggaaatgcagcgcatca1680
aggccacagcgattcgcacggaggaggagaagcgcctgatggagcagaaggtgctggaag1740
ccgaggtgctggcactgaagatggctgaggagtcagagaggagggccaaagaggcagatc1800
agctgaagcaggacctgcaggaagcacgcgaggcggagcgaagagccaagcagaagctcc1860
tggagattgccaccaagcccacgtacccgcccatgaacccaattccagcaccgttgcctc1920
ctgacataccaagcttcaacctcattggtgacagcctgtctttcgacttcaaagatactg1980
acatgaagcggctttccatggagatagagaaagaaaaagtggaatacatggaaaagagca2040
agcatctgcaggagcagctcaatgaactcaagacagaaatcgaggccttgaaactgaaag2100
agagggagacagctctggatattctgcacaatgagaactccgacaggggtggcagcagca2160
agcacaataccattaaaaagctcaccttgcagagcgccaagtcccgagtggccttctttg2220
aagagctctagcaggtgacccagccaccccaggacctgccacttctcctgctaccgggac2280
cgcgggatggaccagatatcaagagagccatccatagggagctggctgggggtttccgtg2340
ggagctccagaactttccccagctgagtgaagagcccagcccctcttatgtgcaattgcc2400
ttgaactacgaccctgtagagatttctctcatggcgttctagttctctgacctgagtctt2460
tgttttaagaagtatttgtcttcctttgtctaatgtgggattcctgactcccttcgtcca2520
aggcaccggtgtgtgtgtgtcttgcactccagagctgacctccaccgcccagcctgggaa2580
gtcattgtagggagtgagacactgaagccctgagaagccagtgccatcatccccaccccg2640
cccagggttccggaacattcattcccccaccggtgaggacctggcatgcagcgaagcagc2700
ccagcccggcggatcccaggccagcacgcctgccggcttctcatcgtcagggagcccgcc2760
cagagctcgtgacgagcaagtgctgggtccccgccaggcaccccgaggcggcgctctggc2820
tggcagctggtggggaataggcagggcagctgtggctggggagagactttaggcagaagc2880
tgtgatgcaggctgactgccagccgaggggctgggtagtgccgtgcgggagctgatggta2940
cagggcactcgctgtccccctccggccaccctagaccagggtccgagaggcaggcaggag3000
ccactcatgtcttccccattgcccgacgcccatagacgctccttcctgtgtggggctggg3060
gtactccctggtcgtactgcagtcagcacccgtaacccggctatgaccagggatctgtaa3120
gccctgtggctccacaggtgctgcttctcactggcccagactctgagctccaccggccca3180
gtctgcacggcccatctgcttcaccttccctcccagccacgtgccagtggccacagccca3240
cttcccaacccactgttgtacccaggcctcactttgctgttgcccttgtccctcttcggg3300
ccctgaattttctgttccctgggggccagccagggccctttgtgcccctcccagcacagg3360
cctgatgcaggtgtccactcacaggtggcgctcacctaggctgtcacaggacccacctcc3420
atgccaggcaacagagggccacagaaccacccccacggctcactccttggtctggggcca3480
ccttcttgccctttctttttttttttttttttttttttccgagatggagtctctctctgt3540
cacccaggtgggagtgtggtggcacaatctcggctcactgcaacctccacctcctgagtt3600
caagcaattctcctgcctcagcctcccaagtagctgggactacaggcatgcaccaccaca3660
cttggccaatgttctgtatttttaatagggacggggttttgccatgttagctaggctggt3720
ctcaaactcacacctgggattacaggcatgagccactgcacccagccccttcttgccctt3780
tcttttctccatggctgatgctgctgtggccagccagggcccttgagatccttccagttt3840
ggctgttatgcaaagcaggtgatttgtcttaatcagataaaagatagaggctatgggggc3900
ctcaagatttttggagagcagaggtggtctctggcaattccatctggttttgagaaactt3960
agcagctcacagagcacagagatcctgccttcttcctactatcaggctgacctaatgggg4020
ttgggctgctcggcaactgcttgggtcaccttgccccaaggaaaccagccctgggtgcca4080
cccagccacttagggtctacagggtgggactccagacctagagcgtaagtatggatgttg4140
tggccctgtgtcttcctagtgtgacccagccaggagcggaagcttcaggcgtttgtaaag4200
tgaggtctggctctgcctcctccgttttttttttttttctgtttctgtttctgttttttt4260
tttgagatggagtctcgctctgtcgcccaggctggagtgcagtgtcacgatctcagctca4320
ctgcaacctccgcctcccaggtacaagagattctcctgcctcagcctcccgagtagctgg4380
gactacaggcgtgtgccaccatgcctggctaatttttgtatttttagtagagatggggtt4440
tcgccatgttagccagactggtctcgaactcctgacctcaggtgatcctcccaccccggc4500
ttcccaaagttctgggattataggcgtgagccaccatgcccggtctcttctcagtcttga4560
agcccatccctggatttccaccaggagttactttcctcctgacctgtaaatttgttcttt4620
aacaatggctgcaggtgggagcatatggtggtttataaaaacgctgtcgggctttgtttc4680
cttctttagctgccgtgtctacttctgaagtctgggaagtgccaagccacgcggcctcaa4740
gggagctggctggtgtttgagctgtggcagaagcacctggggctccagggagcaggctgg4800
gaactgcaggaccttgctcagccaggagcacttccccctccttgaggcaggaatactgag4860
gtgcctccccacagatggagaaggtggagaggaggatgggcctcaggagcatctcaagcc4920
ccagtagcaggagaaagaaagaaagagatgcctggttttcacagactggttcctgtggct4980
gggatgactgcatccttttttttttttttttgagacggagtttttgcctttgtcgcccag5040
gctggagtgcaatggcgtgatctcggctcaccgcaacctccgcctcccggattcaagcaa5100
ttctcctgcctcagcctcccgagtagctgggattacaggcacgcacctccacgtccggct5160
aattttgtatttttagtggagacggggtttctccatgtcggtcaggctggtctcgaactc5220
ccgacctcaggtgatctgcccacctcggcctcccaaagtgctgggattacaggcatgagc5280
caccgcgcttggccagactgcgtcctttttaagcgaacattttagggcctgggagtttgt5340
caagtaaggaagtctcaagcccaaagagcagcgtcctgaccatggtggtttcattacgag5400
cccttctgctggctctcaggcagaagccccacagcaccgggaccattcatgaggtcactg5460
cccagctcatgatgtccgtgaggctgtccttttggccagtagccgtgtgcagctgtgtgg5520
cacagatggcttcgttcatcctgatcaaggccccacctcagccacagcagtccccccaac5580
ctgtgttgtccaccctattattcatgtacctgccaggccctgctagatagcaccccgtgg5640
cattacataacacttcatgagtggctgtgtcttgtaattttggggacaggtttctctctt5700
tccctctcttttttttgtcaaaagcccagagactgacaaccagctgcagtgtctaagtgt5760
tcctcactgacagggtggggcctcaccacccctggagggagcagcgttggcagggagaca5820
gcctggcccagtgaccctgggcccaagccagcccctccagggctttcagggaagcgccat5880
ccattttcaaagatgtcaaacgtcacttcttcctgtagggcccgagtcctgcctcctatc5940
agggccagatcatagaaggctattttctattctggggaacgattataacttaaatgattg6000
ttttaataaaaattctaagctggaaaataaaaaaaaaaaaaaaaaa6046
<210>2
<211>1788
<212>dna
<213>智人
<400>2
atggccggggccatcgcttcccgcatgagcttcagctctctcaagaggaagcaacccaag60
acgttcaccgtgaggatcgtcaccatggacgccgagatggagttcaattgcgagatgaag120
tggaaagggaaggacctctttgatttggtgtgccggactctggggctccgagaaacctgg180
ttctttggactgcagtacacaatcaaggacacagtggcctggctcaaaatggacaagaag240
gtactggatcatgatgtttcaaaggaagaaccagtcacctttcacttcttggccaaattt300
tatcctgagaatgctgaagaggagctggttcaggagatcacacaacatttattcttctta360
caggtaaagaagcagattttagatgaaaagatctactgccctcctgaggcttctgtgctc420
ctggcttcttacgccgtccaggccaagtatggtgactacgaccccagtgttcacaagcgg480
ggatttttggcccaagaggaattgcttccaaaaagggtaataaatctgtatcagatgact540
ccggaaatgtgggaggagagaattactgcttggtacgcagagcaccgaggccgagccagg600
gatgaagctgaaatggaatatctgaagatagctcaggacctggagatgtacggtgtgaac660
tactttgcaatccggaataaaaagggcacagagctgctgcttggagtggatgccctgggg720
cttcacatttatgaccctgagaacagactgacccccaagatctccttcccgtggaatgaa780
atccgaaacatctcgtacagtgacaaggagtttactattaaaccactggataagaaaatt840
gatgtcttcaagtttaactcctcaaagcttcgtgttaataagctgattctccagctatgt900
atcgggaaccatgatctatttatgaggagaaggaaagccgattctttggaagttcagcag960
atgaaagcccaggccagggaggagaaggctagaaagcagatggagcggcagcgcctcgct1020
cgagagaagcagatgagggaggaggctgaacgcacgagggatgagttggagaggaggctg1080
ctgcagatgaaagaagaagcaacaatggccaacgaagcactgatgcggtctgaggagaca1140
gctgacctgttggctgaaaaggcccagatcaccgaggaggaggcaaaacttctggcccag1200
aaggccgcagaggctgagcaggaaatgcagcgcatcaaggccacagcgattcgcacggag1260
gaggagaagcgcctgatggagcagaaggtgctggaagccgaggtgctggcactgaagatg1320
gctgaggagtcagagaggagggccaaagaggcagatcagctgaagcaggacctgcaggaa1380
gcacgcgaggcggagcgaagagccaagcagaagctcctggagattgccaccaagcccacg1440
tacccgcccatgaacccaattccagcaccgttgcctcctgacataccaagcttcaacctc1500
attggtgacagcctgtctttcgacttcaaagatactgacatgaagcggctttccatggag1560
atagagaaagaaaaagtggaatacatggaaaagagcaagcatctgcaggagcagctcaat1620
gaactcaagacagaaatcgaggccttgaaactgaaagagagggagacagctctggatatt1680
ctgcacaatgagaactccgacaggggtggcagcagcaagcacaataccattaaaaagctc1740
accttgcagagcgccaagtcccgagtggccttctttgaagagctctag1788
<210>3
<211>595
<212>prt
<213>智人
<400>3
metalaglyalailealaserargmetserpheserserleulysarg
151015
lysglnprolysthrphethrvalargilevalthrmetaspalaglu
202530
metglupheasncysglumetlystrplysglylysaspleupheasp
354045
leuvalcysargthrleuglyleuarggluthrtrpphepheglyleu
505560
glntyrthrilelysaspthrvalalatrpleulysmetasplyslys
65707580
valleuasphisaspvalserlysglugluprovalthrphehisphe
859095
leualalysphetyrprogluasnalagluglugluleuvalglnglu
100105110
ilethrglnhisleuphepheleuglnvallyslysglnileleuasp
115120125
glulysiletyrcysproproglualaservalleuleualasertyr
130135140
alavalglnalalystyrglyasptyraspproservalhislysarg
145150155160
glypheleualaglnglugluleuleuprolysargvalileasnleu
165170175
tyrglnmetthrproglumettrpglugluargilethralatrptyr
180185190
alagluhisargglyargalaargaspglualaglumetglutyrleu
195200205
lysilealaglnaspleuglumettyrglyvalasntyrphealaile
210215220
argasnlyslysglythrgluleuleuleuglyvalaspalaleugly
225230235240
leuhisiletyraspprogluasnargleuthrprolysileserphe
245250255
protrpasngluileargasnilesertyrserasplysgluphethr
260265270
ilelysproleuasplyslysileaspvalphelyspheasnserser
275280285
lysleuargvalasnlysleuileleuglnleucysileglyasnhis
290295300
aspleuphemetargargarglysalaaspserleugluvalglngln
305310315320
metlysalaglnalaarggluglulysalaarglysglnmetgluarg
325330335
glnargleualaargglulysglnmetarggluglualagluargthr
340345350
argaspgluleugluargargleuleuglnmetlysgluglualathr
355360365
metalaasnglualaleumetargserglugluthralaaspleuleu
370375380
alaglulysalaglnilethrglugluglualalysleuleualagln
385390395400
lysalaalaglualagluglnglumetglnargilelysalathrala
405410415
ileargthrglugluglulysargleumetgluglnlysvalleuglu
420425430
alagluvalleualaleulysmetalagluglusergluargargala
435440445
lysglualaaspglnleulysglnaspleuglnglualaarggluala
450455460
gluargargalalysglnlysleuleugluilealathrlysprothr
465470475480
tyrproprometasnproileproalaproleuproproaspilepro
485490495
serpheasnleuileglyaspserleuserpheaspphelysaspthr
500505510
aspmetlysargleusermetgluileglulysglulysvalglutyr
515520525
metglulysserlyshisleuglngluglnleuasngluleulysthr
530535540
gluileglualaleulysleulysgluarggluthralaleuaspile
545550555560
leuhisasngluasnseraspargglyglyserserlyshisasnthr
565570575
ilelyslysleuthrleuglnseralalysserargvalalaphephe
580585590
glugluleu
595
<210>4
<211>8789
<212>dna
<213>智人
<400>4
atgctcagtggcttctcgacaagttggcagcaacaacacggccctggtcgtcgtcgccgc60
tgcggtaacggagcggtttgggtggcggagcctgcgttcgcgccttcccgctctcctcgg120
gaggcccttcctgctctcccctaggctccgcggccgcccagggggtgggagcgggtgagg180
ggagccaggcgcccagcgagagaggccccccgccgcagggcggcccgggagctcgaggcg240
gtccggcccgcgcgggcagcggcgcggcgctgaggaggggcggcctggccgggacgcctc300
ggggcgggggccgaggagctctccgggccgccggggaaagctacgggcccggtgcgtccg360
cggaccagcagcgcgggagagcggactcccctcgccaccgcccgagcccaggttatcctg420
aatacatgtctaacaattttccttgcaacgttagctgttgtttttcactgtttccaaagg480
atcaaaattgcttcagaaattggagacatatttgatttaaaaggaaaaacttgaacaaat540
ggacaatatgtctattacgaatacaccaacaagtaatgatgcctgtctgagcattgtgca600
tagtttgatgtgccatagacaaggtggagagagtgaaacatttgcaaaaagagcaattga660
aagtttggtaaagaagctgaaggagaaaaaagatgaattggattctttaataacagctat720
aactacaaatggagctcatcctagtaaatgtgttaccatacagagaacattggatgggag780
gcttcaggtggctggtcggaaaggatttcctcatgtgatctatgcccgtctctggaggtg840
gcctgatcttcacaaaaatgaactaaaacatgttaaatattgtcagtatgcgtttgactt900
aaaatgtgatagtgtctgtgtgaatccatatcactacgaacgagttgtatcacctggaat960
tgatctctcaggattaacactgcagagtaatgctccatcaagtatgatggtgaaggatga1020
atatgtgcatgactttgagggacagccatcgttgtccactgaaggacattcaattcaaac1080
catccagcatccaccaagtaatcgtgcatcgacagagacatacagcaccccagctctgtt1140
agccccatctgagtctaatgctaccagcactgccaactttcccaacattcctgtggcttc1200
cacaagtcagcctgccagtatactggggggcagccatagtgaaggactgttgcagatagc1260
atcagggcctcagccaggacagcagcagaatggatttactggtcagccagctacttacca1320
tcataacagcactaccacctggactggaagtaggactgcaccatacacacctaatttgcc1380
tcaccaccaaaacggccatcttcagcaccacccgcctatgccgccccatcccggacatta1440
ctggcctgttcacaatgagcttgcattccagcctcccatttccaatcatcctgctcctga1500
gtattggtgttccattgcttactttgaaatggatgttcaggtaggagagacatttaaggt1560
tccttcaagctgccctattgttactgttgatggatacgtggacccttctggaggagatcg1620
cttttgtttgggtcaactctccaatgtccacaggacagaagccattgagagagcaaggtt1680
gcacataggcaaaggtgtgcagttggaatgtaaaggtgaaggtgatgtttgggtcaggtg1740
ccttagtgaccacgcggtctttgtacagagttactacttagacagagaagctgggcgtgc1800
acctggagatgctgttcataagatctacccaagtgcatatataaaggtctttgatttgcg1860
tcagtgtcatcgacagatgcagcagcaggcggctactgcacaagctgcagcagctgccca1920
ggcagcagccgtggcaggaaacatccctggcccaggatcagtaggtggaatagctccagc1980
tatcagtctgtcagctgctgctggaattggtgttgatgaccttcgtcgcttatgcatact2040
caggatgagttttgtgaaaggctggggaccggattacccaagacagagcatcaaagaaac2100
accttgctggattgaaattcacttacaccgggccctccagctcctagacgaagtacttca2160
taccatgccgattgcagacccacaacctttagactgaggtcttttaccgttggggccctt2220
aaccttatcaggatggtggactacaaaatacaatcctgtttataatctgaagatatattt2280
cacttttgttctgctttatcttttcataaagggttgaaaatgtgtttgctgccttgctcc2340
tagcagacagaaactggattaaaacaattttttttttcctcttcagaacttgtcaggcat2400
ggctcagagcttgaagattaggagaaacacattcttattaattcttcacctgttatgtat2460
gaaggaatcattccagtgctagaaaatttagccctttaaaacgtcttagagccttttatc2520
tgcagaacatcgatatgtatatcattctacagaataatccagtattgctgattttaaagg2580
cagagaagttctcaaagttaattcacctatgttattttgtgtacaagttgttattgttga2640
acatacttcaaaaataatgtgccatgtgggtgagttaattttaccaagagtaactttact2700
ctgtgtttaaaaagtaagttaataatgtattgtaatctttcatccaaaatattttttgca2760
agttatattagtgaagatggtttcaattcagattgtcttgcaacttcagttttatttttg2820
ccaaggcaaaaaactcttaatctgtgtgtatattgagaatcccttaaaattaccagacaa2880
aaaaatttaaaattacgtttgttattcctagtggatgactgttgatgaagtatacttttc2940
ccctgttaaacagtagttgtattcttctgtatttctaggcacaaggttggttgctaagaa3000
gcctataagaggaatttcttttccttcattcatagggaaaggttttgtattttttaaaac3060
actaaaagcagcgtcactctacctaatgtctcactgttctgcaaaggtggcaatgcttaa3120
actaaataatgaataaactgaatattttggaaactgctaaattctatgttaaatactgtg3180
cagaataatggaaacattacagttcataataggtagtttggatatttttgtacttgattt3240
gatgtgactttttttggtataatgtttaaatcatgtatgttatgatattgtttaaaattc3300
agtttttgtatcttggggcaagactgcaaacttttttatatcttttggttattctaagcc3360
ctttgccatcaatgatcatatcaattggcagtgactttgtatagagaatttaagtagaaa3420
agttgcagatgtattgactgtaccacagacacaatatgtatgctttttacctagctggta3480
gcataaataaaactgaatctcaacatacaaagttgaattctaggtttgatttttaagatt3540
ttttttttcttttgcacttttgagtccaatctcagtgatgaggtaccttctactaaatga3600
caggcaacagccagttctattgggcagctttgtttttttccctcacactctaccgggact3660
tccccatggacattgtgtatcatgtgtagagttggttttttttttttttaatttttattt3720
tactatagcagaaatagacctgattatctacaagatgataaatagattgtctacaggata3780
aatagtatgaaataaaatcaaggattatctttcagatgtgtttacttttgcctggagaac3840
ttttagctatagaaacacttgtgtgatgatagtcctccttatatcacctggaatgaacac3900
agcttctactgccttgctcagaaggtcttttaaatagaccatcctagaaaccactgagtt3960
tgcttatttctgtgatttaaacatagatcttgatccaagctacatgacttttgtctttaa4020
ataacttatctaccacctcatttgtactcttgattacttacaaattctttcagtaaacac4080
ctaattttcttctgtaaaagtttggtgatttaagttttattggcagttttataaaaagac4140
atcttctctagaaattgctaactttaggtccattttactgtgaatgaggaataggagtga4200
gttttagaataacagatttttaaaaatccagatgatttgattaaaaccttaatcatacat4260
tgacataattcattgcttcttttttttgagatatggagtcttgctgtgttgcccaggcag4320
gagtgcagtggtatgatctcagctcactgcaacctctgcctcccgggttcaactgattct4380
cctgcctcagcctccctggtagctaggattacaggtgcccgccaccatgcctggctaact4440
tttgtagttttagtagagacggggttttgcctgttggccaggctggtcttgaactcctga4500
cctcaagtgatccatccaccttggcctcccaaagtgctgggattacgggcgtgagccact4560
gtccctggcctcattgttcccttttctactttaaggaaagttttcatgtttaatcatctg4620
gggaaagtatgtgaaaaatatttgttaagaagtatctctttggagccaagccacctgtct4680
tggtttctttctactaagagccataaagtatagaaatacttctagttgttaagtgcttat4740
atttgtacctagatttagtcacacgcttttgagaaaacatctagtatgttatgatcagct4800
attcctgagagcttggttgttaatctatatttctatttcttagtggtagtcatctttgat4860
gaataagactaaagattctcacaggtttaaaattttatgtctactttaagggtaaaatta4920
tgaggttatggttctgggtgggttttctctagctaattcatatctcaaagagtctcaaaa4980
tgttgaatttcagtgcaagctgaatgagagatgagccatgtacacccaccgtaagacctc5040
attccatgtttgtccagtgcctttcagtgcattatcaaagggaatccttcatggtgttgc5100
ctttattttccggggagtagatcgtgggatatagtctatctcatttttaatagtttaccg5160
cccctggtatacaaagataatgacaataaatcactgccatataaccttgctttttccaga5220
aacatggctgttttgtattgctgtaaccactaaataggttgcctataccattcctcctgt5280
gaacagtgcagatttacaggttgcatggtctggcttaaggagagccatacttgagacatg5340
tgagtaaactgaactcatattagctgtgctgcatttcagacttaaaatccatttttgtgg5400
ggcagggtgtggtgtgtaaaggggggtgtttgtaatacaagttgaaggcaaaataaaatg5460
tcctgtctcccagatgatatacatcttattatttttaaagtttattgctaattgtaggaa5520
ggtgagttgcaggtatctttgactatggtcatctggggaaggaaaattttacattttact5580
attaatgctccttaagtgtctatggaggttaaagaataaaatggtaaatgtttctgtgcc5640
tggtttgatggtaactggttaatagttactcaccattttatgcagagtcacattagttca5700
caccctttctgagagccttttgggagaagcagttttattctctgagtggaacagagttct5760
ttttgttgataatttctagtttgctcccttcgttattgccaactttactggcattttatt5820
taatgatagcagattgggaaaatggcaaatttaggttacggaggtaaatgagtatatgaa5880
agcaattacctctaaagccagttaacaattattttgtaggtggggtacactcagcttaaa5940
gtaatgcatttttttttcccgtaaaggcagaatccatcttgttgcagatagctatctaaa6000
taatctcatatcctcttttgcaaagactacagagaataggctatgacaatcttgttcaag6060
cctttccatttttttccctgataactaagtaatttctttgaacataccaagaagtatgta6120
aaaagtccatggccttattcatccacaaagtggcatcctaggcccagccttatccctagc6180
agttgtcccagtgctgctaggttgcttatcttgtttatctggaatcactgtggagtgaaa6240
ttttccacatcatccagaattgccttatttaagaagtaaaacgttttaatttttagcctt6300
tttttggtggagttatttaatatgtatatcagaggatatactagatggtaacatttcttt6360
ctgtgcttggctatctttgtggacttcaggggcttctaaaacagacaggactgtgttgcc6420
tttactaaatggtctgagacagctatggttttgaatttttagttttttttttttaaccca6480
cttcccctcctggtctcttccctctctgataattaccattcatatgtgagtgttagtgtg6540
cctccttttagcattttcttcttctctttctgattcttcatttctgactgcctaggcaag6600
gaaaccagataaccaaacttactagaacgttctttaaaacacaagtacaaactctgggac6660
aggacccaagacactttcctgtgaagtgctgaaaaagacctcattgtattggcatttgat6720
atcagtttgatgtagcttagagtgcttcctgattcttgctgagtttcaggtagttgagat6780
agagagaagtgagtcatattcatattttcccccttagaataatattttgaaaggtttcat6840
tgcttccacttgaatgctgctcttacaaaaactggggttacaagggttactaaattagca6900
tcagtagccagaggcaataccgttgtctggaggacaccagcaaacaacacacaacaaagc6960
aaaacaaaccttgggaaactaaggccatttgttttgttttggtgtcccctttgaagccct7020
gccttctggccttactcctgtacagatatttttgacctataggtgcctttatgagaattg7080
agggtctgacatcctgccccaaggagtagctaaagtaattgctagtgttttcagggattt7140
taacatcagactggaatgaatgaatgaaactttttgtcctttttttttctgttttttttt7200
ttctaatgtagtaaggactaaggaaaacctttggtgaagacaatcatttctctctgttga7260
tgtggatacttttcacaccgtttatttaaatgctttctcaataggtccagagccagtgtt7320
cttgttcaacctgaaagtaatggctctgggttgggccagacagttgcactctctagtttg7380
ccctctgccacaaatttgatgtgtgacctttgggcaagtcatttatcttctctgggcctt7440
agttgcctcatctgtaaaatgagggagttggagtagattaattattccagctctgaaatt7500
ctaagtgaccttggctaccttgcagcagttttggatttcttccttatctttgttctgctg7560
tttgagggggctttttacttatttccatgttattcaaaggagactaggcttgatatttta7620
ttactgttcttttatggacaaaaggttacatagtatgcccttaagacttaattttaacca7680
aaggcctagcaccaccttaggggctgcaataaacacttaacgcgcgtgcgcacgcgcgcg7740
cgcacacacacacacacacacacacacacacacaggtcagagtttaaggctttcgagtca7800
tgacattctagcttttgaattgcgtgcacacacacacgcacgcacacactctggtcagag7860
tttattaaggctttcgagtcatgacattatagcttttgagttggtgtgtgtgacaccacc7920
ctcctaagtggtgtgtgcttgtaattttttttttcagtgaaaatggattgaaaacctgtt7980
gttaatgcttagtgatattatgctcaaaacaaggaaattcccttgaaccgtgtcaattaa8040
actggtttatatgactcaagaaaacaataccagtagatgattattaactttattcttggc8100
tctttttaggtccattttgattaagtgacttttggctggatcattcagagctctcttcta8160
gcctacccttggatgagtacaattaatgaaattcatattttcaaggacctgggagccttc8220
cttggggctgggttgagggtggggggttggggagtcctggtagaggccagctttgtggta8280
gctggagaggaagggatgaaaccagctgctgttgcaaaggctgcttgtcattgatagaag8340
gactcacgggcttggattgattaagactaaacatggagttggcaaactttcttcaagtat8400
tgagttctgttcaatgcattggacatgtgatttaagggaaaagtgtgaatgcttatagat8460
gatgaaaacctggtgggctgcagagcccagtttagaagaagtgagttgggggttggggac8520
agatttggtggtggtatttcccaactgtttcctcccctaaattcagaggaatgcagctat8580
gccagaagccagagaagagccactcgtagcttctgctttggggacaactggtcagttgaa8640
agtcccaggagttcctttgtggctttctgtatacttttgcctggttaaagtctgtggcta8700
aaaaatagtcgaacctttcttgagaactctgtaacaaagtatgtttttgattaaaagaga8760
aagccaactaaaaaaaaaaaaaaaaaaaa8789
<210>5
<211>1659
<212>dna
<213>智人
<400>5
atggacaatatgtctattacgaatacaccaacaagtaatgatgcctgtctgagcattgtg60
catagtttgatgtgccatagacaaggtggagagagtgaaacatttgcaaaaagagcaatt120
gaaagtttggtaaagaagctgaaggagaaaaaagatgaattggattctttaataacagct180
ataactacaaatggagctcatcctagtaaatgtgttaccatacagagaacattggatggg240
aggcttcaggtggctggtcggaaaggatttcctcatgtgatctatgcccgtctctggagg300
tggcctgatcttcacaaaaatgaactaaaacatgttaaatattgtcagtatgcgtttgac360
ttaaaatgtgatagtgtctgtgtgaatccatatcactacgaacgagttgtatcacctgga420
attgatctctcaggattaacactgcagagtaatgctccatcaagtatgatggtgaaggat480
gaatatgtgcatgactttgagggacagccatcgttgtccactgaaggacattcaattcaa540
accatccagcatccaccaagtaatcgtgcatcgacagagacatacagcaccccagctctg600
ttagccccatctgagtctaatgctaccagcactgccaactttcccaacattcctgtggct660
tccacaagtcagcctgccagtatactggggggcagccatagtgaaggactgttgcagata720
gcatcagggcctcagccaggacagcagcagaatggatttactggtcagccagctacttac780
catcataacagcactaccacctggactggaagtaggactgcaccatacacacctaatttg840
cctcaccaccaaaacggccatcttcagcaccacccgcctatgccgccccatcccggacat900
tactggcctgttcacaatgagcttgcattccagcctcccatttccaatcatcctgctcct960
gagtattggtgttccattgcttactttgaaatggatgttcaggtaggagagacatttaag1020
gttccttcaagctgccctattgttactgttgatggatacgtggacccttctggaggagat1080
cgcttttgtttgggtcaactctccaatgtccacaggacagaagccattgagagagcaagg1140
ttgcacataggcaaaggtgtgcagttggaatgtaaaggtgaaggtgatgtttgggtcagg1200
tgccttagtgaccacgcggtctttgtacagagttactacttagacagagaagctgggcgt1260
gcacctggagatgctgttcataagatctacccaagtgcatatataaaggtctttgatttg1320
cgtcagtgtcatcgacagatgcagcagcaggcggctactgcacaagctgcagcagctgcc1380
caggcagcagccgtggcaggaaacatccctggcccaggatcagtaggtggaatagctcca1440
gctatcagtctgtcagctgctgctggaattggtgttgatgaccttcgtcgcttatgcata1500
ctcaggatgagttttgtgaaaggctggggaccggattacccaagacagagcatcaaagaa1560
acaccttgctggattgaaattcacttacaccgggccctccagctcctagacgaagtactt1620
cataccatgccgattgcagacccacaacctttagactga1659
<210>6
<211>552
<212>prt
<213>智人
<400>6
metaspasnmetserilethrasnthrprothrserasnaspalacys
151015
leuserilevalhisserleumetcyshisargglnglyglygluser
202530
gluthrphealalysargalailegluserleuvallyslysleulys
354045
glulyslysaspgluleuaspserleuilethralailethrthrasn
505560
glyalahisproserlyscysvalthrileglnargthrleuaspgly
65707580
argleuglnvalalaglyarglysglypheprohisvaliletyrala
859095
argleutrpargtrpproaspleuhislysasngluleulyshisval
100105110
lystyrcysglntyralapheaspleulyscysaspservalcysval
115120125
asnprotyrhistyrgluargvalvalserproglyileaspleuser
130135140
glyleuthrleuglnserasnalaprosersermetmetvallysasp
145150155160
glutyrvalhisaspphegluglyglnproserleuserthrglugly
165170175
hisserileglnthrileglnhisproproserasnargalaserthr
180185190
gluthrtyrserthrproalaleuleualaprosergluserasnala
195200205
thrserthralaasnpheproasnileprovalalaserthrsergln
210215220
proalaserileleuglyglyserhissergluglyleuleuglnile
225230235240
alaserglyproglnproglyglnglnglnasnglyphethrglygln
245250255
proalathrtyrhishisasnserthrthrthrtrpthrglyserarg
260265270
thralaprotyrthrproasnleuprohishisglnasnglyhisleu
275280285
glnhishisproprometproprohisproglyhistyrtrpproval
290295300
hisasngluleualapheglnproproileserasnhisproalapro
305310315320
glutyrtrpcysserilealatyrpheglumetaspvalglnvalgly
325330335
gluthrphelysvalprosersercysproilevalthrvalaspgly
340345350
tyrvalaspproserglyglyaspargphecysleuglyglnleuser
355360365
asnvalhisargthrglualailegluargalaargleuhisilegly
370375380
lysglyvalglnleuglucyslysglygluglyaspvaltrpvalarg
385390395400
cysleuserasphisalavalphevalglnsertyrtyrleuasparg
405410415
glualaglyargalaproglyaspalavalhislysiletyrproser
420425430
alatyrilelysvalpheaspleuargglncyshisargglnmetgln
435440445
glnglnalaalathralaglnalaalaalaalaalaglnalaalaala
450455460
valalaglyasnileproglyproglyservalglyglyilealapro
465470475480
alaileserleuseralaalaalaglyileglyvalaspaspleuarg
485490495
argleucysileleuargmetserphevallysglytrpglyproasp
500505510
tyrproargglnserilelysgluthrprocystrpilegluilehis
515520525
leuhisargalaleuglnleuleuaspgluvalleuhisthrmetpro
530535540
ilealaaspproglnproleuasp
545550
<210>7
<211>5778
<212>dna
<213>智人
<400>7
gtgacacaattacaacaactttgtgctggtgccggggaagtttgtgtctccaacgaatcc60
cctcagtgctccccagccccgcgcgctccggccgttcccgccgtccccgcctgtggctgc120
cccctgcccaaccccgcgatgtgaccctacagccgaaagccgccgctgccgacccggggg180
ctccgcagcccctgccgccgccgccgccgccttcaccgccgccgcgttgggatttttcgt240
cgccgccgcccgcggcggaggaggaggcggcgataaagttggtgtgctggtcccgcgcgc300
agattgggggcgtcactgcgggccccggtccgagggggggtgtcggcgttggagttgtga360
attcgctgcgtttccatgaaatcctgcggagtgtcgctcgctaccgccgccgctgccgcc420
gccgctttcggtgatgaggaaaagaaaatggcggcgggaaaagcgagcggcgagagcgag480
gaggcgtcccccagcctgacagccgaggagagggaggcgctcggcggactggacagccgc540
ctctttgggttcgtgagatttcatgaagatggcgccaggacgaaggccctactgggcaag600
gctgttcgctgctatgaatctctaatcttaaaagctgaaggaaaagtggagtctgatttc660
ttttgtcaattaggtcacttcaacctcttattggaagattatccaaaagcattatctgca720
taccagaggtactacagtttacagtctgactactggaagaatgctgcctttttatatggt780
cttggtttggtctacttccattataatgcatttcagtgggcaattaaagcatttcaggag840
gtgctttatgttgatcccagcttttgtcgagccaaggaaattcatttacgacttgggctt900
atgttcaaagtgaacacagactatgagtctagtttaaagcattttcagttagctttggtt960
gactgtaatccctgcactttgtccaatgctgaaattcaatttcacattgcccacttatat1020
gaaacccagaggaaatatcattctgcaaaagaagcttatgaacaacttttgcagacagag1080
aatctttctgcacaagtaaaagcaactgtcttacaacagttaggttggatgcatcacact1140
gtagatctcctgggagataaagccaccaaggaaagctatgctattcagtatctccaaaag1200
tccttggaagcagatcctaattctggccagtcctggtatttcctcggaaggtgctattca1260
agtattgggaaagttcaggatgcctttatatcttacaggcagtctattgataaatcagaa1320
gcaagtgcagatacatggtgttcaataggtgtgctatatcagcagcaaaatcagcccatg1380
gatgctttacaggcctatatttgtgctgtacaattggaccatggccatgctgcagcctgg1440
atggacctaggcactctctatgaatcctgcaaccagcctcaggatgccattaaatgctac1500
ttaaatgcaactagaagcaaaagttgtagtaatacctctgcacttgcagcacgaattaag1560
tatttacaggctcagttgtgtaaccttccacaaggtagtctacagaataaaactaaatta1620
cttcctagtattgaggaggcgtggagcctaccaattcccgcagagcttacctccaggcag1680
ggtgccatgaacacagcacagcagaatacttctgacaattggagtggtggacatgctgtg1740
tcacatcctccagtacagcaacaagctcattcatggtgtttgacaccacagaaattacag1800
catttggaacagctccgcgcaaatagaaataatttaaatccagcacagaaactgatgctg1860
gaacagctggaaagtcagtttgtcttaatgcaacaacaccaaatgagaccaacaggagtt1920
gcacaggtacgatctactggaattcctaatgggccaacagctgactcatcactgcctaca1980
aactcagtctctggccagcagccacagcttgctctgaccagagtgcctagcgtctctcag2040
cctggagtccgtcctgcctgccctgggcagcctttggccaatggacccttttctgcaggc2100
catgttccctgtagcacatcaagaacgctgggaagtacagacactattttgataggcaat2160
aatcatataacaggaagtggaagtaatggaaacgtgccttacctgcagcgaaacgcactc2220
actctacctcataaccgcacaaacctgaccagcagcgcagaggagccgtggaaaaaccaa2280
ctatctaactccactcaggggcttcacaaaggtcagagttcacattcggcaggtcctaat2340
ggtgaacgacctctctcttccactgggccttcccagcatctccaggcagctggctctggt2400
attcagaatcagaacggacatcccaccctgcctagcaattcagtaacacagggggctgct2460
ctcaatcacctctcctctcacactgctacctcaggtggacaacaaggcattaccttaacc2520
aaagagagcaagccttcaggaaacatattgacggtgcctgaaacaagcaggcacactgga2580
gagacacctaacagcactgccagtgtcgagggacttcctaatcatgtccatcagatgacg2640
gcagatgctgtttgcagtcctagccatggagattctaagtcaccaggtttactaagttca2700
gacaatcctcagctctctgccttgttgatgggaaaagccaataacaatgtgggtactgga2760
acctgtgacaaagtcaataacatccacccagctgttcatacaaagactgataactctgtt2820
gcctcttcaccatcttcagccatttcaacagcaacaccttctccaaaatccactgagcag2880
acaaccacaaacagtgttaccagccttaacagccctcacagtgggctacacacaattaat2940
ggagaagggatggaagaatctcagagccccatgaaaacagatctgcttctggttaaccac3000
aaacctagtccacagatcataccatcaatgtctgtgtccatataccccagctcagcagaa3060
gttctgaaggcatgcaggaatctaggtaaaaatggcttatctaacagtagcattttgttg3120
gataaatgtccacctccaagaccaccatcttcaccataccctcccttgccaaaggacaag3180
ttgaatccacctacacctagtatttacttggaaaataaacgtgatgctttctttcctcca3240
ttacatcaattttgtacaaatccgaacaaccctgttacagtaatacgtggccttgctgga3300
gctcttaagttagacctgggacttttctctactaaaactttggtggaagctaacaatgaa3360
catatggtagaagtgaggacacagttgttgcagccagcagatgaaaactgggatcccact3420
ggaacaaagaaaatctggcattgtgaaagtaatagatctcatactacaattgctaaatat3480
gcacagtaccaggcctcctcattccaggaatcattgagagaagaaaatgaaaaaagaagt3540
catcataaagaccactcagatagtgaatctacatcgtcagataattctgggaggaggagg3600
aaaggaccctttaaaaccataaagtttgggaccaatattgacctatctgatgacaaaaag3660
tggaagttgcagctacatgagctgactaaacttcctgcttttgtgcgtgtcgtatcagca3720
ggaaatcttctaagccatgttggtcataccatattgggcatgaacacagttcaactatac3780
atgaaagttccagggagcagaacaccaggtcatcaggaaaataacaacttctgttcagtt3840
aacataaatattggcccaggtgactgtgaatggtttgttgttcctgaaggttactggggt3900
gttctgaatgacttctgtgaaaaaaataatttgaatttcctaatgggttcttggtggccc3960
aatcttgaagatctttatgaagcaaatgttccagtgtataggtttattcagcgacctgga4020
gatttggtctggataaatgcaggcactgttcattgggttcaggctattggctggtgcaac4080
aacattgcttggaatgttggtccacttacagcctgccagtataaattggcagtggaacgg4140
tacgaatggaacaaattgcaaagtgtgaagtcaatagtacccatggttcatctttcctgg4200
aatatggcacgaaatatcaaggtctcagatccaaagctttttgaaatgattaagtattgt4260
cttctaagaactctgaagcaatgtcagacattgagggaagctctcattgctgcaggaaaa4320
gagattatatggcatgggcggacaaaagaagaaccagctcattactgtagcatttgtgaa4380
gtggaggtttttgatctgctttttgtcactaatgagagtaattcacgaaagacctacata4440
gtacattgccaagattgtgcacgaaaaacaagcggaaacttggaaaactttgtggtgcta4500
gaacagtacaaaatggaggacctgatgcaagtctatgaccaatttacattagctcctcca4560
ttaccatccgcctcatcttgatattgttccatggacattaaatgagaccttttctgctat4620
tcaggaaataacccagttctgcaccactggtttttgtagctatctcgtaaggctgctggc4680
tgaaaactgtgtctatgcaaccttccaagtgcggagtgtcaaccaactggacgggagaga4740
gtactgctcctactccaggactctcacaaagctgatgagctgtacttcagaaaaaaataa4800
taatttccatgttttgtatatatctgacaaaactggcaacatcttacagactactgactt4860
gaagacaacctcttttatatttctctatttctgggctgatgaatttgttttcatctgtct4920
tttcccccttcagaattttccttggaaaaaaaatactagcctagctggtcatttctttgt4980
aaggtagttagcaattttaagtctttctttggtcaacttttttttaatgtgaaaagttag5040
gtaagacacttttttactgcttttatgtttttctgtcttgttttgagaccatgatggtta5100
cacttttggttcctaaataaaatttaaaaaattaacagccaagtcacaaaggtaatggat5160
tgcacatagactaaggaataaacttcagatttgtgatttttgtttctaatcttgatgtaa5220
atttacactatttataaatacatatttattgcttgaaaatatttgtgaatggaatgctgt5280
tattttttccagatttacctgccattgaaattttaaggagttctgtaatttcaaacacta5340
ctcctattacattttctatgtgtaaataaaactgcttagcattgtacagaaacttttatt5400
aaaattgtttaatgtttaaagagttttctattgtttgagttttaaaaaagactttatgta5460
cagtgcccagtttttgttcatttttgaaatctgattatatatattttatatatacttatg5520
tatgtatatataatatatatagaaatctggatatatatgtataaatctttagaacttaaa5580
tttttctcgttttaagtttcacatctatggtagatttttgaggtgtctactgtaaagtat5640
tgcttacaaaaagtatgattatttttaaagaaatatatatggtatgtatcctcaagacct5700
aaaatgtcagactggtttattgttaagttgcaattactgcaatgacagaccaataaacaa5760
ttgctgccaaaaaaaaaa5778
<210>8
<211>4206
<212>dna
<213>智人
<400>8
atgaaatcctgcggagtgtcgctcgctaccgccgccgctgccgccgccgctttcggtgat60
gaggaaaagaaaatggcggcgggaaaagcgagcggcgagagcgaggaggcgtcccccagc120
ctgacagccgaggagagggaggcgctcggcggactggacagccgcctctttgggttcgtg180
agatttcatgaagatggcgccaggacgaaggccctactgggcaaggctgttcgctgctat240
gaatctctaatcttaaaagctgaaggaaaagtggagtctgatttcttttgtcaattaggt300
cacttcaacctcttattggaagattatccaaaagcattatctgcataccagaggtactac360
agtttacagtctgactactggaagaatgctgcctttttatatggtcttggtttggtctac420
ttccattataatgcatttcagtgggcaattaaagcatttcaggaggtgctttatgttgat480
cccagcttttgtcgagccaaggaaattcatttacgacttgggcttatgttcaaagtgaac540
acagactatgagtctagtttaaagcattttcagttagctttggttgactgtaatccctgc600
actttgtccaatgctgaaattcaatttcacattgcccacttatatgaaacccagaggaaa660
tatcattctgcaaaagaagcttatgaacaacttttgcagacagagaatctttctgcacaa720
gtaaaagcaactgtcttacaacagttaggttggatgcatcacactgtagatctcctggga780
gataaagccaccaaggaaagctatgctattcagtatctccaaaagtccttggaagcagat840
cctaattctggccagtcctggtatttcctcggaaggtgctattcaagtattgggaaagtt900
caggatgcctttatatcttacaggcagtctattgataaatcagaagcaagtgcagataca960
tggtgttcaataggtgtgctatatcagcagcaaaatcagcccatggatgctttacaggcc1020
tatatttgtgctgtacaattggaccatggccatgctgcagcctggatggacctaggcact1080
ctctatgaatcctgcaaccagcctcaggatgccattaaatgctacttaaatgcaactaga1140
agcaaaagttgtagtaatacctctgcacttgcagcacgaattaagtatttacaggctcag1200
ttgtgtaaccttccacaaggtagtctacagaataaaactaaattacttcctagtattgag1260
gaggcgtggagcctaccaattcccgcagagcttacctccaggcagggtgccatgaacaca1320
gcacagcagaatacttctgacaattggagtggtggacatgctgtgtcacatcctccagta1380
cagcaacaagctcattcatggtgtttgacaccacagaaattacagcatttggaacagctc1440
cgcgcaaatagaaataatttaaatccagcacagaaactgatgctggaacagctggaaagt1500
cagtttgtcttaatgcaacaacaccaaatgagaccaacaggagttgcacaggtacgatct1560
actggaattcctaatgggccaacagctgactcatcactgcctacaaactcagtctctggc1620
cagcagccacagcttgctctgaccagagtgcctagcgtctctcagcctggagtccgtcct1680
gcctgccctgggcagcctttggccaatggacccttttctgcaggccatgttccctgtagc1740
acatcaagaacgctgggaagtacagacactattttgataggcaataatcatataacagga1800
agtggaagtaatggaaacgtgccttacctgcagcgaaacgcactcactctacctcataac1860
cgcacaaacctgaccagcagcgcagaggagccgtggaaaaaccaactatctaactccact1920
caggggcttcacaaaggtcagagttcacattcggcaggtcctaatggtgaacgacctctc1980
tcttccactgggccttcccagcatctccaggcagctggctctggtattcagaatcagaac2040
ggacatcccaccctgcctagcaattcagtaacacagggggctgctctcaatcacctctcc2100
tctcacactgctacctcaggtggacaacaaggcattaccttaaccaaagagagcaagcct2160
tcaggaaacatattgacggtgcctgaaacaagcaggcacactggagagacacctaacagc2220
actgccagtgtcgagggacttcctaatcatgtccatcagatgacggcagatgctgtttgc2280
agtcctagccatggagattctaagtcaccaggtttactaagttcagacaatcctcagctc2340
tctgccttgttgatgggaaaagccaataacaatgtgggtactggaacctgtgacaaagtc2400
aataacatccacccagctgttcatacaaagactgataactctgttgcctcttcaccatct2460
tcagccatttcaacagcaacaccttctccaaaatccactgagcagacaaccacaaacagt2520
gttaccagccttaacagccctcacagtgggctacacacaattaatggagaagggatggaa2580
gaatctcagagccccatgaaaacagatctgcttctggttaaccacaaacctagtccacag2640
atcataccatcaatgtctgtgtccatataccccagctcagcagaagttctgaaggcatgc2700
aggaatctaggtaaaaatggcttatctaacagtagcattttgttggataaatgtccacct2760
ccaagaccaccatcttcaccataccctcccttgccaaaggacaagttgaatccacctaca2820
cctagtatttacttggaaaataaacgtgatgctttctttcctccattacatcaattttgt2880
acaaatccgaacaaccctgttacagtaatacgtggccttgctggagctcttaagttagac2940
ctgggacttttctctactaaaactttggtggaagctaacaatgaacatatggtagaagtg3000
aggacacagttgttgcagccagcagatgaaaactgggatcccactggaacaaagaaaatc3060
tggcattgtgaaagtaatagatctcatactacaattgctaaatatgcacagtaccaggcc3120
tcctcattccaggaatcattgagagaagaaaatgaaaaaagaagtcatcataaagaccac3180
tcagatagtgaatctacatcgtcagataattctgggaggaggaggaaaggaccctttaaa3240
accataaagtttgggaccaatattgacctatctgatgacaaaaagtggaagttgcagcta3300
catgagctgactaaacttcctgcttttgtgcgtgtcgtatcagcaggaaatcttctaagc3360
catgttggtcataccatattgggcatgaacacagttcaactatacatgaaagttccaggg3420
agcagaacaccaggtcatcaggaaaataacaacttctgttcagttaacataaatattggc3480
ccaggtgactgtgaatggtttgttgttcctgaaggttactggggtgttctgaatgacttc3540
tgtgaaaaaaataatttgaatttcctaatgggttcttggtggcccaatcttgaagatctt3600
tatgaagcaaatgttccagtgtataggtttattcagcgacctggagatttggtctggata3660
aatgcaggcactgttcattgggttcaggctattggctggtgcaacaacattgcttggaat3720
gttggtccacttacagcctgccagtataaattggcagtggaacggtacgaatggaacaaa3780
ttgcaaagtgtgaagtcaatagtacccatggttcatctttcctggaatatggcacgaaat3840
atcaaggtctcagatccaaagctttttgaaatgattaagtattgtcttctaagaactctg3900
aagcaatgtcagacattgagggaagctctcattgctgcaggaaaagagattatatggcat3960
gggcggacaaaagaagaaccagctcattactgtagcatttgtgaagtggaggtttttgat4020
ctgctttttgtcactaatgagagtaattcacgaaagacctacatagtacattgccaagat4080
tgtgcacgaaaaacaagcggaaacttggaaaactttgtggtgctagaacagtacaaaatg4140
gaggacctgatgcaagtctatgaccaatttacattagctcctccattaccatccgcctca4200
tcttga4206
<210>9
<211>4206
<212>dna
<213>智人
<400>9
atgaaatcctgcggagtgtcgctcgctaccgccgccgctgccgccgccgctttcggtgat60
gaggaaaagaaaatggcggcgggaaaagcgagcggcgagagcgaggaggcgtcccccagc120
ctgacagccgaggagagggaggcgctcggcggactggacagccgcctctttgggttcgtg180
agatttcatgaagatggcgccaggacgaaggccctactgggcaaggctgttcgctgctat240
gaatctctaatcttaaaagctgaaggaaaagtggagtctgatttcttttgtcaattaggt300
cacttcaacctcttattggaagattatccaaaagcattatctgcataccagaggtactac360
agtttacagtctgactactggaagaatgctgcctttttatatggtcttggtttggtctac420
ttccattataatgcatttcagtgggcaattaaagcatttcaggaggtgctttatgttgat480
cccagcttttgtcgagccaaggaaattcatttacgagttgggcttatgttcaaagtgaac540
acagactatgagtctagtttaaagcattttcagttagctttggttgactgtaatccctgc600
actttgtccaatgctgaaattcaatttcacattgcccacttatatgaaacccagaggaaa660
tatcattctgcaaaagaagcttatgaacaacttttgcagacagagaatctttctgcacaa720
gtaaaagcaactgtcttacaacagttaggttggatgcatcacactgtagatctcctggga780
gataaagccaccaaggaaagctatgctattcagtatctccaaaagtccttggaagcagat840
cctaattctggccagtcctggtatttcctcggaaggtgctattcaagtattgggaaagtt900
caggatgcctttatatcttacaggcagtctattgataaatcagaagcaagtgcagataca960
tggtgttcaataggtgtgctatatcagcagcaaaatcagcccatggatgctttacaggcc1020
tatatttgtgctgtacaattggaccatggccatgctgcagcctggatggacctaggcact1080
ctctatgaatcctgcaaccagcctcaggatgccattaaatgctacttaaatgcaactaga1140
agcaaaagttgtagtaatacctctgcacttgcagcacgaattaagtatttacaggctcag1200
ttgtgtaaccttccacaaggtagtctacagaataaaactaaattacttcctagtattgag1260
gaggcgtggagcctaccaattcccgcagagcttacctccaggcagggtgccatgaacaca1320
gcacagcagaatacttctgacaattggagtggtggacatgctgtgtcacatcctccagta1380
cagcaacaagctcattcatggtgtttgacaccacagaaattacagcatttggaacagctc1440
cgcgcaaatagaaataatttaaatccagcacagaaactgatgctggaacagctggaaagt1500
cagtttgtcttaatgcaacaacaccaaatgagaccaacaggagttgcacaggtacgatct1560
actggaattcctaatgggccaacagctgactcatcactgcctacaaactcagtctctggc1620
cagcagccacagcttgctctgaccagagtgcctagcgtctctcagcctggagtccgtcct1680
gcctgccctgggcagcctttggccaatggacccttttctgcaggccatgttccctgtagc1740
acatcaagaacgcggggaagtacagacactattttgataggcaataatcatataacagga1800
aatggaagtaatggaaacgtgccttacctgcagcgaaacgcactcactctacctcataac1860
cgcacaaacctgaccagcagcgcaaaggagccgtggaaaaaccaactatctaactccact1920
caggggcttcacaaaggtcagagttcacattcggcaggtcctaatggtgaacgacctctc1980
tcttccactgggccttcccagcatctccaggcagctggctctggtattcagaatcagaac2040
ggacatcccaccctgcctagcaattcagtaacacagggggctgctctcaatcacctctcc2100
tctcacactgctacctcaggtggacaacaaggcattaccttaaccaaagagagcaagcct2160
tcaggaaacatattgacggtgcctgaaacaagcaggcacactggagagacacctaacagc2220
actgccagtgtcgagggacttcctaatcatgtccatcagatgacggcagatgctgtttgc2280
agtcctagccatggagattctaagtcaccaggtttactaagttcagacaatcctcagctc2340
tctgccttgttgatgggaaaagccaataacaatgtgggtactggaacctgtgacaaagtc2400
aataacatccacccagctgttcatacaaagactgataactctgttgcctcttcaccatct2460
tcagccatttcaacagcaacaccttctccaaaatccactgagcagacaaccacaaacagt2520
gttaccagccttaacagccctcacagtgggctacacacaattaatggagaagggatggaa2580
gaatctcagagccccatgaaaacagatctgcttctggttaaccacaaacctagtccacag2640
atcataccatcaatgtctgtgtccatataccccagctcagcagaagttctgaaggcatgc2700
aggaatctaggtaaaaatggcttatctaacagtagcattttgttggataaatgtccacct2760
ccaagaccaccatcttcaccataccctcccttgccaaaggacaagttgaatccacctaca2820
cctagtatttacttggaaaataaacgtgatgctttctttcctccattacatcaattttgt2880
acaaatccgaacaaccctgttacagtaatacgtggccttgctggagctcttaagttagac2940
ctgggacttttctctactaaaactttggtggaagctaacaatgaacatatggtagaagtg3000
aggacacagttgttgcagccagcagatgaaaactgggatcccactggaacaaagaaaatc3060
tggcattgtgaaagtaatagatctcatactacaattgctaaatatgcacagtaccaggcc3120
tcctcattccaggaatcattgagagaagaaaatgaaaaaagaagtcatcataaagaccac3180
tcagatagtgaatctacatcgtcagataattctgggaggaggaggaaaggaccctttaaa3240
accataaagtttgggaccaatattgacctatctgatgacaaaaagtggaagttgcagcta3300
catgagctgactaaacttcctgcttttgtgcgtgtcgtatcagcaggaaatcttctaagc3360
catgttggtcataccatattgggcatgaacacagttcaactatacatgaaagttccaggg3420
agcagaacaccaggtcatcaggaaaataacaacttctgttcagttaacataaatattggc3480
ccaggtgactgtgaatggtttgttgttcctgaaggttactggggtgttttgaatgacttc3540
tgtgaaaaaaataatttgaatttcctaatgggttcttggtggcccaatcttgaagatctt3600
tatgaagcaaatgttccagtgtataggtttattcagcgacctggagatttggtctggata3660
aatgcaggcactgttcattgggttcaggctattggctggtgcaacaacattgcttggaat3720
gttggtccacttacagcctgccagtataaattggcagtggaacggtacgaatggaacaaa3780
ttgcaaagtgtgaagtcaatagtacccatggttcatctttcctggaatatggcacgaaat3840
atcaaggtctcagatccaaagctttttgaaatgattaagtattgtcttctaagaactctg3900
aagcaatgtcagacattgagggaagctctcattgctgcaggaaaagagattatatggcat3960
gggcggacaaaagaagaaccagctcattactgtagcatttgtgaagtggaggtttttgat4020
ctgctttttgtcactaatgagagtaattcacgaaagacctacatagtacattgccaagat4080
tgtgcacgaaaaacaagcggaaacttggaaaactttgtggtgctagaacagtacaaaatg4140
gaggacctgatgcaagtctatgaccaatttacattagctcctccattaccatccgcctca4200
tcttga4206
<210>10
<211>1401
<212>prt
<213>智人
<400>10
metlyssercysglyvalserleualathralaalaalaalaalaala
151015
alapheglyaspgluglulyslysmetalaalaglylysalasergly
202530
glusergluglualaserproserleuthralaglugluarggluala
354045
leuglyglyleuaspserargleupheglyphevalargphehisglu
505560
aspglyalaargthrlysalaleuleuglylysalavalargcystyr
65707580
gluserleuileleulysalagluglylysvalgluseraspphephe
859095
cysglnleuglyhispheasnleuleuleugluasptyrprolysala
100105110
leuseralatyrglnargtyrtyrserleuglnserasptyrtrplys
115120125
asnalaalapheleutyrglyleuglyleuvaltyrphehistyrasn
130135140
alapheglntrpalailelysalapheglngluvalleutyrvalasp
145150155160
proserphecysargalalysgluilehisleuargleuglyleumet
165170175
phelysvalasnthrasptyrgluserserleulyshispheglnleu
180185190
alaleuvalaspcysasnprocysthrleuserasnalagluilegln
195200205
phehisilealahisleutyrgluthrglnarglystyrhisserala
210215220
lysglualatyrgluglnleuleuglnthrgluasnleuseralagln
225230235240
vallysalathrvalleuglnglnleuglytrpmethishisthrval
245250255
aspleuleuglyasplysalathrlysglusertyralaileglntyr
260265270
leuglnlysserleuglualaaspproasnserglyglnsertrptyr
275280285
pheleuglyargcystyrserserileglylysvalglnaspalaphe
290295300
ilesertyrargglnserileasplysserglualaseralaaspthr
305310315320
trpcysserileglyvalleutyrglnglnglnasnglnprometasp
325330335
alaleuglnalatyrilecysalavalglnleuasphisglyhisala
340345350
alaalatrpmetaspleuglythrleutyrglusercysasnglnpro
355360365
glnaspalailelyscystyrleuasnalathrargserlyssercys
370375380
serasnthrseralaleualaalaargilelystyrleuglnalagln
385390395400
leucysasnleuproglnglyserleuglnasnlysthrlysleuleu
405410415
proserilegluglualatrpserleuproileproalagluleuthr
420425430
serargglnglyalametasnthralaglnglnasnthrseraspasn
435440445
trpserglyglyhisalavalserhisproprovalglnglnglnala
450455460
hissertrpcysleuthrproglnlysleuglnhisleugluglnleu
465470475480
argalaasnargasnasnleuasnproalaglnlysleumetleuglu
485490495
glnleugluserglnphevalleumetglnglnhisglnmetargpro
500505510
thrglyvalalaglnvalargserthrglyileproasnglyprothr
515520525
alaaspserserleuprothrasnservalserglyglnglnprogln
530535540
leualaleuthrargvalproservalserglnproglyvalargpro
545550555560
alacysproglyglnproleualaasnglypropheseralaglyhis
565570575
valprocysserthrserargthrleuglyserthraspthrileleu
580585590
ileglyasnasnhisilethrglyserglyserasnglyasnvalpro
595600605
tyrleuglnargasnalaleuthrleuprohisasnargthrasnleu
610615620
thrserseralaglugluprotrplysasnglnleuserasnserthr
625630635640
glnglyleuhislysglyglnserserhisseralaglyproasngly
645650655
gluargproleuserserthrglyproserglnhisleuglnalaala
660665670
glyserglyileglnasnglnasnglyhisprothrleuproserasn
675680685
servalthrglnglyalaalaleuasnhisleuserserhisthrala
690695700
thrserglyglyglnglnglyilethrleuthrlysgluserlyspro
705710715720
serglyasnileleuthrvalprogluthrserarghisthrglyglu
725730735
thrproasnserthralaservalgluglyleuproasnhisvalhis
740745750
glnmetthralaaspalavalcysserproserhisglyaspserlys
755760765
serproglyleuleuserseraspasnproglnleuseralaleuleu
770775780
metglylysalaasnasnasnvalglythrglythrcysasplysval
785790795800
asnasnilehisproalavalhisthrlysthraspasnservalala
805810815
serserproserseralaileserthralathrproserprolysser
820825830
thrgluglnthrthrthrasnservalthrserleuasnserprohis
835840845
serglyleuhisthrileasnglygluglymetglugluserglnser
850855860
prometlysthraspleuleuleuvalasnhislysproserprogln
865870875880
ileileprosermetservalseriletyrproserseralagluval
885890895
leulysalacysargasnleuglylysasnglyleuserasnserser
900905910
ileleuleuasplyscysproproproargproproserserprotyr
915920925
proproleuprolysasplysleuasnproprothrproseriletyr
930935940
leugluasnlysargaspalaphepheproproleuhisglnphecys
945950955960
thrasnproasnasnprovalthrvalileargglyleualaglyala
965970975
leulysleuaspleuglyleupheserthrlysthrleuvalgluala
980985990
asnasngluhismetvalgluvalargthrglnleuleuglnproala
99510001005
aspgluasntrpaspprothrglythrlyslysiletrphiscysglu
101010151020
serasnargserhisthrthrilealalystyralaglntyrglnala
1025103010351040
serserpheglngluserleuargglugluasnglulysargserhis
104510501055
hislysasphisseraspsergluserthrserseraspasnsergly
106010651070
argargarglysglyprophelysthrilelyspheglythrasnile
107510801085
aspleuseraspasplyslystrplysleuglnleuhisgluleuthr
109010951100
lysleuproalaphevalargvalvalseralaglyasnleuleuser
1105111011151120
hisvalglyhisthrileleuglymetasnthrvalglnleutyrmet
112511301135
lysvalproglyserargthrproglyhisglngluasnasnasnphe
114011451150
cysservalasnileasnileglyproglyaspcysglutrppheval
115511601165
valprogluglytyrtrpglyvalleuasnaspphecysglulysasn
117011751180
asnleuasnpheleumetglysertrptrpproasnleugluaspleu
1185119011951200
tyrglualaasnvalprovaltyrargpheileglnargproglyasp
120512101215
leuvaltrpileasnalaglythrvalhistrpvalglnalailegly
122012251230
trpcysasnasnilealatrpasnvalglyproleuthralacysgln
123512401245
tyrlysleualavalgluargtyrglutrpasnlysleuglnserval
125012551260
lysserilevalprometvalhisleusertrpasnmetalaargasn
1265127012751280
ilelysvalseraspprolysleupheglumetilelystyrcysleu
128512901295
leuargthrleulysglncysglnthrleuargglualaleuileala
130013051310
alaglylysgluileiletrphisglyargthrlysglugluproala
131513201325
histyrcysserilecysgluvalgluvalpheaspleuleupheval
133013351340
thrasngluserasnserarglysthrtyrilevalhiscysglnasp
1345135013551360
cysalaarglysthrserglyasnleugluasnphevalvalleuglu
136513701375
glntyrlysmetgluaspleumetglnvaltyraspglnphethrleu
138013851390
alaproproleuproseralaserser
13951400
<210>11
<211>1401
<212>prt
<213>智人
<400>11
metlyssercysglyvalserleualathralaalaalaalaalaala
151015
alapheglyaspgluglulyslysmetalaalaglylysalasergly
202530
glusergluglualaserproserleuthralaglugluarggluala
354045
leuglyglyleuaspserargleupheglyphevalargphehisglu
505560
aspglyalaargthrlysalaleuleuglylysalavalargcystyr
65707580
gluserleuileleulysalagluglylysvalgluseraspphephe
859095
cysglnleuglyhispheasnleuleuleugluasptyrprolysala
100105110
leuseralatyrglnargtyrtyrserleuglnserasptyrtrplys
115120125
asnalaalapheleutyrglyleuglyleuvaltyrphehistyrasn
130135140
alapheglntrpalailelysalapheglngluvalleutyrvalasp
145150155160
proserphecysargalalysgluilehisleuargvalglyleumet
165170175
phelysvalasnthrasptyrgluserserleulyshispheglnleu
180185190
alaleuvalaspcysasnprocysthrleuserasnalagluilegln
195200205
phehisilealahisleutyrgluthrglnarglystyrhisserala
210215220
lysglualatyrgluglnleuleuglnthrgluasnleuseralagln
225230235240
vallysalathrvalleuglnglnleuglytrpmethishisthrval
245250255
aspleuleuglyasplysalathrlysglusertyralaileglntyr
260265270
leuglnlysserleuglualaaspproasnserglyglnsertrptyr
275280285
pheleuglyargcystyrserserileglylysvalglnaspalaphe
290295300
ilesertyrargglnserileasplysserglualaseralaaspthr
305310315320
trpcysserileglyvalleutyrglnglnglnasnglnprometasp
325330335
alaleuglnalatyrilecysalavalglnleuasphisglyhisala
340345350
alaalatrpmetaspleuglythrleutyrglusercysasnglnpro
355360365
glnaspalailelyscystyrleuasnalathrargserlyssercys
370375380
serasnthrseralaleualaalaargilelystyrleuglnalagln
385390395400
leucysasnleuproglnglyserleuglnasnlysthrlysleuleu
405410415
proserilegluglualatrpserleuproileproalagluleuthr
420425430
serargglnglyalametasnthralaglnglnasnthrseraspasn
435440445
trpserglyglyhisalavalserhisproprovalglnglnglnala
450455460
hissertrpcysleuthrproglnlysleuglnhisleugluglnleu
465470475480
argalaasnargasnasnleuasnproalaglnlysleumetleuglu
485490495
glnleugluserglnphevalleumetglnglnhisglnmetargpro
500505510
thrglyvalalaglnvalargserthrglyileproasnglyprothr
515520525
alaaspserserleuprothrasnservalserglyglnglnprogln
530535540
leualaleuthrargvalproservalserglnproglyvalargpro
545550555560
alacysproglyglnproleualaasnglypropheseralaglyhis
565570575
valprocysserthrserargthrargglyserthraspthrileleu
580585590
ileglyasnasnhisilethrglyasnglyserasnglyasnvalpro
595600605
tyrleuglnargasnalaleuthrleuprohisasnargthrasnleu
610615620
thrserseralalysgluprotrplysasnglnleuserasnserthr
625630635640
glnglyleuhislysglyglnserserhisseralaglyproasngly
645650655
gluargproleuserserthrglyproserglnhisleuglnalaala
660665670
glyserglyileglnasnglnasnglyhisprothrleuproserasn
675680685
servalthrglnglyalaalaleuasnhisleuserserhisthrala
690695700
thrserglyglyglnglnglyilethrleuthrlysgluserlyspro
705710715720
serglyasnileleuthrvalprogluthrserarghisthrglyglu
725730735
thrproasnserthralaservalgluglyleuproasnhisvalhis
740745750
glnmetthralaaspalavalcysserproserhisglyaspserlys
755760765
serproglyleuleuserseraspasnproglnleuseralaleuleu
770775780
metglylysalaasnasnasnvalglythrglythrcysasplysval
785790795800
asnasnilehisproalavalhisthrlysthraspasnservalala
805810815
serserproserseralaileserthralathrproserprolysser
820825830
thrgluglnthrthrthrasnservalthrserleuasnserprohis
835840845
serglyleuhisthrileasnglygluglymetglugluserglnser
850855860
prometlysthraspleuleuleuvalasnhislysproserprogln
865870875880
ileileprosermetservalseriletyrproserseralagluval
885890895
leulysalacysargasnleuglylysasnglyleuserasnserser
900905910
ileleuleuasplyscysproproproargproproserserprotyr
915920925
proproleuprolysasplysleuasnproprothrproseriletyr
930935940
leugluasnlysargaspalaphepheproproleuhisglnphecys
945950955960
thrasnproasnasnprovalthrvalileargglyleualaglyala
965970975
leulysleuaspleuglyleupheserthrlysthrleuvalgluala
980985990
asnasngluhismetvalgluvalargthrglnleuleuglnproala
99510001005
aspgluasntrpaspprothrglythrlyslysiletrphiscysglu
101010151020
serasnargserhisthrthrilealalystyralaglntyrglnala
1025103010351040
serserpheglngluserleuargglugluasnglulysargserhis
104510501055
hislysasphisseraspsergluserthrserseraspasnsergly
106010651070
argargarglysglyprophelysthrilelyspheglythrasnile
107510801085
aspleuseraspasplyslystrplysleuglnleuhisgluleuthr
109010951100
lysleuproalaphevalargvalvalseralaglyasnleuleuser
1105111011151120
hisvalglyhisthrileleuglymetasnthrvalglnleutyrmet
112511301135
lysvalproglyserargthrproglyhisglngluasnasnasnphe
114011451150
cysservalasnileasnileglyproglyaspcysglutrppheval
115511601165
valprogluglytyrtrpglyvalleuasnaspphecysglulysasn
117011751180
asnleuasnpheleumetglysertrptrpproasnleugluaspleu
1185119011951200
tyrglualaasnvalprovaltyrargpheileglnargproglyasp
120512101215
leuvaltrpileasnalaglythrvalhistrpvalglnalailegly
122012251230
trpcysasnasnilealatrpasnvalglyproleuthralacysgln
123512401245
tyrlysleualavalgluargtyrglutrpasnlysleuglnserval
125012551260
lysserilevalprometvalhisleusertrpasnmetalaargasn
1265127012751280
ilelysvalseraspprolysleupheglumetilelystyrcysleu
128512901295
leuargthrleulysglncysglnthrleuargglualaleuileala
130013051310
alaglylysgluileiletrphisglyargthrlysglugluproala
131513201325
histyrcysserilecysgluvalgluvalpheaspleuleupheval
133013351340
thrasngluserasnserarglysthrtyrilevalhiscysglnasp
1345135013551360
cysalaarglysthrserglyasnleugluasnphevalvalleuglu
136513701375
glntyrlysmetgluaspleumetglnvaltyraspglnphethrleu
138013851390
alaproproleuproseralaserser
13951400
<210>12
<211>3896
<212>dna
<213>智人
<400>12
ccttccgcagctgccgcttcagtccgaaggaggaagggaaccaacccactttctcggcgc60
cgcggctcttttctaaaagtaatgtgaaaacctttgcatcttctgatagtctagccaagg120
tccaagaagtagcaagctggcttttggaaatgaatcaggaactgctctctgtgggcagca180
aaagacgacgaactggaggctctctgagaggtaacccttcctcaagccaggtagatgaag240
aacagatgaatcgtgtggtagaggaggaacagcaacagcaactcagacaacaagaggagg300
agcacactgcaaggaatggtgaagttgttggagtagaacctagacctggaggccaaaatg360
attcccagcaaggacagttggaagaaaacaataatagatttatttcggtagatgaggact420
cctcaggaaaccaagaagaacaagaggaagatgaagaacatgctggtgaacaagatgagg480
aggatgaggaggaggaggagatggaccaggagagtgacgattttgatcagtctgatgata540
gtagcagagaagatgaacatacacatactaacagtgtcacgaactccagtagtattgtgg600
acctgcccgttcaccaactctcctccccattctatacaaaaacaacaaaaatgaaaagaa660
agttggaccatggttctgaggtccgctctttttctttgggaaagaaaccatgcaaagtct720
cagaatatacaagtaccactgggcttgtaccatgttcagcaacaccaacaacttttgggg780
acctcagagcagccaatggccaagggcaacaacgacgccgaattacatctgtccagccac840
ctacaggcctccaggaatggctaaaaatgtttcagagctggagtggaccagagaaattgc900
ttgctttagatgaactcattgatagttgtgaaccaacacaagtaaaacatatgatgcaag960
tgatagaaccccagtttcaacgagacttcatttcattgctccctaaagagttggcactct1020
atgtgctttcattcctggaacccaaagacctgctacaagcagctcagacatgtcgctact1080
ggagaattttggctgaagacaaccttctctggagagagaaatgcaaagaagaggggattg1140
atgaaccattgcacatcaagagaagaaaagtaataaaaccaggtttcatacacagtccat1200
ggaaaagtgcatacatcagacagcacagaattgatactaactggaggcgaggagaactca1260
aatctcctaaggtgctgaaaggacatgatgatcatgtgatcacatgcttacagttttgtg1320
gtaaccgaatagttagtggttctgatgacaacactttaaaagtttggtcagcagtcacag1380
gcaaatgtctgagaacattagtgggacatacaggtggagtatggtcatcacaaatgagag1440
acaacatcatcattagtggatctacagatcggacactcaaagtgtggaatgcagagactg1500
gagaatgtatacacaccttatatgggcatacttccactgtgcgttgtatgcatcttcatg1560
aaaaaagagttgttagcggttctcgagatgccactcttagggtttgggatattgagacag1620
gccagtgtttacatgttttgatgggtcatgttgcagcagtccgctgtgttcaatatgatg1680
gcaggagggttgttagtggagcatatgattttatggtaaaggtgtgggatccagagactg1740
aaacctgtctacacacgttgcaggggcatactaatagagtctattcattacagtttgatg1800
gtatccatgtggtgagtggatctcttgatacatcaatccgtgtttgggatgtggagacag1860
ggaattgcattcacacgttaacagggcaccagtcgttaacaagtggaatggaactcaaag1920
acaatattcttgtctctgggaatgcagattctacagttaaaatctgggatatcaaaacag1980
gacagtgtttacaaacattgcaaggtcccaacaagcatcagagtgctgtgacctgtttac2040
agttcaacaagaactttgtaattaccagctcagatgatggaactgtaaaactatgggact2100
tgaaaacgggtgaatttattcgaaacctagtcacattggagagtggggggagtgggggag2160
ttgtgtggcggatcagagcctcaaacacaaagctggtgtgtgcagttgggagtcggaatg2220
ggactgaagaaaccaagctgctggtgctggactttgatgtggacatgaagtgaagagcag2280
aaaagatgaatttgtccaattgtgtagacgatatactccctgcccttccccctgcaaaaa2340
gaaaaaaagaaaagaaaaagaaaaaaatcccttgttctcagtggtgcaggatgttggctt2400
ggggcaacagattgaaaagacctacagactaagaaggaaaagaagaagagatgacaaacc2460
ataactgacaagagaggcgtctgctgtctcatcacataaaaggcttcacttttgactgag2520
ggcagctttgcaaaatgagactttctaaatcaaaccaggtgcaattatttctttattttc2580
ttctccagtggtcattgggcagtgttaatgctgaaacatcattacagattctgctagcct2640
gttcttttaccactgacagctagacacctagaaaggaactgcaataatatcaaaacaagt2700
actggttgactttctaattagagagcatctgcaacaaaaagtcatttttctggagtggaa2760
aagcttaaaaaaattactgtgaattgtttttgtacagttatcatgaaaagcttttttttt2820
tttttttttgccaaccattgccaatgtcaatcaatcacagtattagcctctgttaatcta2880
tttactgttgcttccatatacattcttcaatgcatatgttgctcaaaggtggcaagttgt2940
cctgggttctgtgagtcctgagatggatttaattcttgatgctggtgctagaagtaggtc3000
ttcaaatatgggattgttgtcccaaccctgtactgtactcccagtggccaaacttattta3060
tgctgctaaatgaaagaaagaaaaaagcaaattatttttttttattttttttctgctgtg3120
acgttttagtcccagactgaattccaaatttgctctagtttggttatggaaaaaagactt3180
tttgccactgaaacttgagccatctgtgcctctaagaggctgagaatggaagagtttcag3240
ataataaagagtgaagtttgcctgcaagtaaagaattgagagtgtgtgcaaagcttattt3300
tcttttatctgggcaaaaattaaaacacattccttggaacagagctattacttgcctgtt3360
ctgtggagaaacttttctttttgagggctgtggtgaatggatgaacgtacatcgtaaaac3420
tgacaaaatattttaaaaatatataaaacacaaaattaaaataaagttgctggtcagtct3480
tagtgttttacagtatttgggaaaacaactgttacagttttattgctctgagtaactgac3540
aaagcagaaactattcagtttttgtagtaaaggcgtcacatgcaaacaaacaaaatgaat3600
gaaacagtcaaatggtttgcctcattctccaagagccacaactcaagctgaactgtgaaa3660
gtggtttaacactgtatcctaggcgatcttttttcctccttctgtttatttttttgtttg3720
ttttatttatagtctgatttaaaacaatcagattcaagttggttaattttagttatgtaa3780
caacctgacatgatggaggaaaacaacctttaaagggattgtgtctatggtttgattcac3840
ttagaaattttattttcttataacttaagtgcaataaaatgtgttttttcatgtta3896
<210>13
<211>2124
<212>dna
<213>智人
<400>13
atgaatcaggaactgctctctgtgggcagcaaaagacgacgaactggaggctctctgaga60
ggtaacccttcctcaagccaggtagatgaagaacagatgaatcgtgtggtagaggaggaa120
cagcaacagcaactcagacaacaagaggaggagcacactgcaaggaatggtgaagttgtt180
ggagtagaacctagacctggaggccaaaatgattcccagcaaggacagttggaagaaaac240
aataatagatttatttcggtagatgaggactcctcaggaaaccaagaagaacaagaggaa300
gatgaagaacatgctggtgaacaagatgaggaggatgaggaggaggaggagatggaccag360
gagagtgacgattttgatcagtctgatgatagtagcagagaagatgaacatacacatact420
aacagtgtcacgaactccagtagtattgtggacctgcccgttcaccaactctcctcccca480
ttctatacaaaaacaacaaaaatgaaaagaaagttggaccatggttctgaggtccgctct540
ttttctttgggaaagaaaccatgcaaagtctcagaatatacaagtaccactgggcttgta600
ccatgttcagcaacaccaacaacttttggggacctcagagcagccaatggccaagggcaa660
caacgacgccgaattacatctgtccagccacctacaggcctccaggaatggctaaaaatg720
tttcagagctggagtggaccagagaaattgcttgctttagatgaactcattgatagttgt780
gaaccaacacaagtaaaacatatgatgcaagtgatagaaccccagtttcaacgagacttc840
atttcattgctccctaaagagttggcactctatgtgctttcattcctggaacccaaagac900
ctgctacaagcagctcagacatgtcgctactggagaattttggctgaagacaaccttctc960
tggagagagaaatgcaaagaagaggggattgatgaaccattgcacatcaagagaagaaaa1020
gtaataaaaccaggtttcatacacagtccatggaaaagtgcatacatcagacagcacaga1080
attgatactaactggaggcgaggagaactcaaatctcctaaggtgctgaaaggacatgat1140
gatcatgtgatcacatgcttacagttttgtggtaaccgaatagttagtggttctgatgac1200
aacactttaaaagtttggtcagcagtcacaggcaaatgtctgagaacattagtgggacat1260
acaggtggagtatggtcatcacaaatgagagacaacatcatcattagtggatctacagat1320
cggacactcaaagtgtggaatgcagagactggagaatgtatacacaccttatatgggcat1380
acttccactgtgcgttgtatgcatcttcatgaaaaaagagttgttagcggttctcgagat1440
gccactcttagggtttgggatattgagacaggccagtgtttacatgttttgatgggtcat1500
gttgcagcagtccgctgtgttcaatatgatggcaggagggttgttagtggagcatatgat1560
tttatggtaaaggtgtgggatccagagactgaaacctgtctacacacgttgcaggggcat1620
actaatagagtctattcattacagtttgatggtatccatgtggtgagtggatctcttgat1680
acatcaatccgtgtttgggatgtggagacagggaattgcattcacacgttaacagggcac1740
cagtcgttaacaagtggaatggaactcaaagacaatattcttgtctctgggaatgcagat1800
tctacagttaaaatctgggatatcaaaacaggacagtgtttacaaacattgcaaggtccc1860
aacaagcatcagagtgctgtgacctgtttacagttcaacaagaactttgtaattaccagc1920
tcagatgatggaactgtaaaactatgggacttgaaaacgggtgaatttattcgaaaccta1980
gtcacattggagagtggggggagtgggggagttgtgtggcggatcagagcctcaaacaca2040
aagctggtgtgtgcagttgggagtcggaatgggactgaagaaaccaagctgctggtgctg2100
gactttgatgtggacatgaagtga2124
<210>14
<211>707
<212>prt
<213>智人
<400>14
metasnglngluleuleuservalglyserlysargargargthrgly
151015
glyserleuargglyasnproserserserglnvalaspgluglugln
202530
metasnargvalvalgluglugluglnglnglnglnleuargglngln
354045
gluglugluhisthralaargasnglygluvalvalglyvalglupro
505560
argproglyglyglnasnaspserglnglnglyglnleuglugluasn
65707580
asnasnargpheileservalaspgluaspserserglyasnglnglu
859095
gluglnglugluaspglugluhisalaglygluglnaspglugluasp
100105110
glugluglugluglumetaspglngluseraspasppheaspglnser
115120125
aspaspserserarggluaspgluhisthrhisthrasnservalthr
130135140
asnserserserilevalaspleuprovalhisglnleuserserpro
145150155160
phetyrthrlysthrthrlysmetlysarglysleuasphisglyser
165170175
gluvalargserpheserleuglylyslysprocyslysvalserglu
180185190
tyrthrserthrthrglyleuvalprocysseralathrprothrthr
195200205
pheglyaspleuargalaalaasnglyglnglyglnglnargargarg
210215220
ilethrservalglnproprothrglyleuglnglutrpleulysmet
225230235240
pheglnsertrpserglyproglulysleuleualaleuaspgluleu
245250255
ileaspsercysgluprothrglnvallyshismetmetglnvalile
260265270
gluproglnpheglnargasppheileserleuleuprolysgluleu
275280285
alaleutyrvalleuserpheleugluprolysaspleuleuglnala
290295300
alaglnthrcysargtyrtrpargileleualagluaspasnleuleu
305310315320
trpargglulyscyslysglugluglyileaspgluproleuhisile
325330335
lysargarglysvalilelysproglypheilehisserprotrplys
340345350
seralatyrileargglnhisargileaspthrasntrpargarggly
355360365
gluleulysserprolysvalleulysglyhisaspasphisvalile
370375380
thrcysleuglnphecysglyasnargilevalserglyseraspasp
385390395400
asnthrleulysvaltrpseralavalthrglylyscysleuargthr
405410415
leuvalglyhisthrglyglyvaltrpserserglnmetargaspasn
420425430
ileileileserglyserthraspargthrleulysvaltrpasnala
435440445
gluthrglyglucysilehisthrleutyrglyhisthrserthrval
450455460
argcysmethisleuhisglulysargvalvalserglyserargasp
465470475480
alathrleuargvaltrpaspilegluthrglyglncysleuhisval
485490495
leumetglyhisvalalaalavalargcysvalglntyraspglyarg
500505510
argvalvalserglyalatyraspphemetvallysvaltrpasppro
515520525
gluthrgluthrcysleuhisthrleuglnglyhisthrasnargval
530535540
tyrserleuglnpheaspglyilehisvalvalserglyserleuasp
545550555560
thrserileargvaltrpaspvalgluthrglyasncysilehisthr
565570575
leuthrglyhisglnserleuthrserglymetgluleulysaspasn
580585590
ileleuvalserglyasnalaaspserthrvallysiletrpaspile
595600605
lysthrglyglncysleuglnthrleuglnglyproasnlyshisgln
610615620
seralavalthrcysleuglnpheasnlysasnphevalilethrser
625630635640
seraspaspglythrvallysleutrpaspleulysthrglygluphe
645650655
ileargasnleuvalthrleugluserglyglyserglyglyvalval
660665670
trpargileargalaserasnthrlysleuvalcysalavalglyser
675680685
argasnglythrglugluthrlysleuleuvalleuasppheaspval
690695700
aspmetlys
705
<210>15
<211>2591
<212>dna
<213>智人
<400>15
gatgggattggggttttcccctcccatgtgctcaagactggcgctaaaagttttgagctt60
ctcaaaagtctagagccaccgtccagggagcaggtagctgctgggctccggggacacttt120
gcgttcgggctgggagcgtgctttccacgacggtgacacgcttccctggattggcagcca180
gactgccttccgggtcactgccatggaggagccgcagtcagatcctagcgtcgagccccc240
tctgagtcaggaaacattttcagacctatggaaactacttcctgaaaacaacgttctgtc300
ccccttgccgtcccaagcaatggatgatttgatgctgtccccggacgatattgaacaatg360
gttcactgaagacccaggtccagatgaagctcccagaatgccagaggctgctccccccgt420
ggcccctgcaccagcagctcctacaccggcggcccctgcaccagccccctcctggcccct480
gtcatcttctgtcccttcccagaaaacctaccagggcagctacggtttccgtctgggctt540
cttgcattctgggacagccaagtctgtgacttgcacgtactcccctgccctcaacaagat600
gttttgccaactggccaagacctgccctgtgcagctgtgggttgattccacacccccgcc660
cggcacccgcgtccgcgccatggccatctacaagcagtcacagcacatgacggaggttgt720
gaggcgctgcccccaccatgagcgctgctcagatagcgatggtctggcccctcctcagca780
tcttatccgagtggaaggaaatttgcgtgtggagtatttggatgacagaaacacttttcg840
acatagtgtggtggtgccctatgagccgcctgaggttggctctgactgtaccaccatcca900
ctacaactacatgtgtaacagttcctgcatgggcggcatgaaccggaggcccatcctcac960
catcatcacactggaagactccagtggtaatctactgggacggaacagctttgaggtgcg1020
tgtttgtgcctgtcctgggagagaccggcgcacagaggaagagaatctccgcaagaaagg1080
ggagcctcaccacgagctgcccccagggagcactaagcgagcactgcccaacaacaccag1140
ctcctctccccagccaaagaagaaaccactggatggagaatatttcacccttcagatccg1200
tgggcgtgagcgcttcgagatgttccgagagctgaatgaggccttggaactcaaggatgc1260
ccaggctgggaaggagccaggggggagcagggctcactccagccacctgaagtccaaaaa1320
gggtcagtctacctcccgccataaaaaactcatgttcaagacagaagggcctgactcaga1380
ctgacattctccacttcttgttccccactgacagcctcccacccccatctctccctcccc1440
tgccattttgggttttgggtctttgaacccttgcttgcaataggtgtgcgtcagaagcac1500
ccaggacttccatttgctttgtcccggggctccactgaacaagttggcctgcactggtgt1560
tttgttgtggggaggaggatggggagtaggacataccagcttagattttaaggtttttac1620
tgtgagggatgtttgggagatgtaagaaatgttcttgcagttaagggttagtttacaatc1680
agccacattctaggtaggggcccacttcaccgtactaaccagggaagctgtccctcactg1740
ttgaattttctctaacttcaaggcccatatctgtgaaatgctggcatttgcacctacctc1800
acagagtgcattgtgagggttaatgaaataatgtacatctggccttgaaaccacctttta1860
ttacatggggtctagaacttgacccccttgagggtgcttgttccctctccctgttggtcg1920
gtgggttggtagtttctacagttgggcagctggttaggtagagggagttgtcaagtctct1980
gctggcccagccaaaccctgtctgacaacctcttggtgaaccttagtacctaaaaggaaa2040
tctcaccccatcccacaccctggaggatttcatctcttgtatatgatgatctggatccac2100
caagacttgttttatgctcagggtcaatttcttttttcttttttttttttttttttcttt2160
ttctttgagactgggtctcgctttgttgcccaggctggagtggagtggcgtgatcttggc2220
ttactgcagcctttgcctccccggctcgagcagtcctgcctcagcctccggagtagctgg2280
gaccacaggttcatgccaccatggccagccaacttttgcatgttttgtagagatggggtc2340
tcacagtgttgcccaggctggtctcaaactcctgggctcaggcgatccacctgtctcagc2400
ctcccagagtgctgggattacaattgtgagccaccacgtccagctggaagggtcaacatc2460
ttttacattctgcaagcacatctgcattttcaccccacccttcccctccttctccctttt2520
tatatcccatttttatatcgatctcttattttacaataaaactttgctgccacctgtgtg2580
tctgaggggtg2591
<210>16
<211>1182
<212>dna
<213>智人
<400>16
atggaggagccgcagtcagatcctagcgtcgagccccctctgagtcaggaaacattttca60
gacctatggaaactacttcctgaaaacaacgttctgtcccccttgccgtcccaagcaatg120
gatgatttgatgctgtccccggacgatattgaacaatggttcactgaagacccaggtcca180
gatgaagctcccagaatgccagaggctgctccccgcgtggcccctgcaccagcagctcct240
acaccggcggcccctgcaccagccccctcctggcccctgtcatcttctgtcccttcccag300
aaaacctaccagggcagctacggtttccgtctgggcttcttgcattctgggacagccaag360
tctgtgacttgcacgtactcccctgccctcaacaagatgttttgccaactggccaagacc420
tgccctgtgcagctgtgggttgattccacacccccgcccggcacccgcgtccgcgccatg480
gccatctacaagcagtcacagcacatgacggaggttgtgaggcgctgcccccaccatgag540
cgctgctcagatagcgatggtctggcccctcctcagcatcttatccgagtggaaggaaat600
ttgcgtgtggagtatttggatgacagaaacacttttcgacatagtgtggtggtgccctat660
gagccgcctgaggttggctctgactgtaccaccatccactacaactacatgtgtaacagt720
tcctgcatgggcggcatgaaccggaggcccatcctcaccatcatcacactggaagactcc780
agtggtaatctactgggacggaacagctttgaggtgcgtgtttgtgcctgtcctgggaga840
gaccggcgcacagaggaagagaatctccgcaagaaaggggagcctcaccacgagctgccc900
ccagggagcactaagcgagcactgcccaacaacaccagctcctctccccagccaaagaag960
aaaccactggatggagaatatttcacccttcagatccgtgggcgtgagcgcttcgagatg1020
ttccgagagctgaatgaggccttggaactcaaggatgcccaggctgggaaggagccaggg1080
gggagcagggctcactccagccacctgaagtccaaaaagggtcagtctacctcccgccat1140
aaaaaactcatgttcaagacagaagggcctgactcagactga1182
<210>17
<211>393
<212>prt
<213>智人
<400>17
metglugluproglnseraspproservalgluproproleusergln
151015
gluthrpheseraspleutrplysleuleuprogluasnasnvalleu
202530
serproleuproserglnalametaspaspleumetleuserproasp
354045
aspilegluglntrpphethrgluaspproglyproaspglualapro
505560
argmetproglualaalaproargvalalaproalaproalaalapro
65707580
thrproalaalaproalaproalaprosertrpproleuserserser
859095
valproserglnlysthrtyrglnglysertyrglypheargleugly
100105110
pheleuhisserglythralalysservalthrcysthrtyrserpro
115120125
alaleuasnlysmetphecysglnleualalysthrcysprovalgln
130135140
leutrpvalaspserthrproproproglythrargvalargalamet
145150155160
alailetyrlysglnserglnhismetthrgluvalvalargargcys
165170175
prohishisgluargcysseraspseraspglyleualaproprogln
180185190
hisleuileargvalgluglyasnleuargvalglutyrleuaspasp
195200205
argasnthrphearghisservalvalvalprotyrgluproproglu
210215220
valglyseraspcysthrthrilehistyrasntyrmetcysasnser
225230235240
sercysmetglyglymetasnargargproileleuthrileilethr
245250255
leugluaspserserglyasnleuleuglyargasnserphegluval
260265270
argvalcysalacysproglyargaspargargthrgluglugluasn
275280285
leuarglyslysglygluprohishisgluleuproproglyserthr
290295300
lysargalaleuproasnasnthrserserserproglnprolyslys
305310315320
lysproleuaspglyglutyrphethrleuglnileargglyargglu
325330335
argpheglumetphearggluleuasnglualaleugluleulysasp
340345350
alaglnalaglylysgluproglyglyserargalahisserserhis
355360365
leulysserlyslysglyglnserthrserarghislyslysleumet
370375380
phelysthrgluglyproaspserasp
385390
<210>18
<211>1267
<212>dna
<213>智人
<400>18
cgagggctgcttccggctggtgcccccgggggagacccaacctggggcgacttcaggggt60
gccacattcgctaagtgctcggagttaatagcacctcctccgagcactcgctcacggcgt120
ccccttgcctggaaagataccgcggtccctccagaggatttgagggacagggtcggaggg180
ggctcttccgccagcaccggaggaagaaagaggaggggctggctggtcaccagagggtgg240
ggcggaccgcgtgcgctcggcggctgcggagagggggagagcaggcagcgggcggcgggg300
agcagcatggagccggcggcggggagcagcatggagccttcggctgactggctggccacg360
gccgcggcccggggtcgggtagaggaggtgcgggcgctgctggaggcgggggcgctgccc420
aacgcaccgaatagttacggtcggaggccgatccaggtcatgatgatgggcagcgcccga480
gtggcggagctgctgctgctccacggcgcggagcccaactgcgccgaccccgccactctc540
acccgacccgtgcacgacgctgcccgggagggcttcctggacacgctggtggtgctgcac600
cgggccggggcgcggctggacgtgcgcgatgcctggggccgtctgcccgtggacctggct660
gaggagctgggccatcgcgatgtcgcacggtacctgcgcgcggctgcggggggcaccaga720
ggcagtaaccatgcccgcatagatgccgcggaaggtccctcagacatccccgattgaaag780
aaccagagaggctctgagaaacctcgggaaacttagatcatcagtcaccgaaggtcctac840
agggccacaactgcccccgccacaacccaccccgctttcgtagttttcatttagaaaata900
gagcttttaaaaatgtcctgccttttaacgtagatatatgccttcccccactaccgtaaa960
tgtccatttatatcattttttatatattcttataaaaatgtaaaaaagaaaaacaccgct1020
tctgccttttcactgtgttggagttttctggagtgagcactcacgccctaagcgcacatt1080
catgtgggcatttcttgcgagcctcgcagcctccggaagctgtcgacttcatgacaagca1140
ttttgtgaactagggaagctcaggggggttactggcttctcttgagtcacactgctagca1200
aatggcagaaccaaagctcaaataaaaataaaataattttcattcattcactcaaaaaaa1260
aaaaaaa1267
<210>19
<211>471
<212>dna
<213>智人
<400>19
atggagccggcggcggggagcagcatggagccttcggctgactggctggccacggccgcg60
gcccggggtcgggtagaggaggtgcgggcgctgctggaggcgggggcgctgcccaacgca120
ccgaatagttacggtcggaggccgatccaggtcatgatgatgggcagcgcccgagtggcg180
gagctgctgctgctccacggcgcggagcccaactgcgccgaccccgccactctcacccga240
cccgtgcacgacgctgcccgggagggcttcctggacacgctggtggtgctgcaccgggcc300
ggggcgcggctggacgtgcgcgatgcctggggccgtctgcccgtggacctggctgaggag360
ctgggccatcgcgatgtcgcacggtacctgcgcgcggctgcggggggcaccagaggcagt420
aaccatgcccgcatagatgccgcggaaggtccctcagacatccccgattga471
<210>20
<211>156
<212>prt
<213>智人
<400>20
metgluproalaalaglysersermetgluproseralaasptrpleu
151015
alathralaalaalaargglyargvalglugluvalargalaleuleu
202530
glualaglyalaleuproasnalaproasnsertyrglyargargpro
354045
ileglnvalmetmetmetglyseralaargvalalagluleuleuleu
505560
leuhisglyalagluproasncysalaaspproalathrleuthrarg
65707580
provalhisaspalaalaarggluglypheleuaspthrleuvalval
859095
leuhisargalaglyalaargleuaspvalargaspalatrpglyarg
100105110
leuprovalaspleualaglugluleuglyhisargaspvalalaarg
115120125
tyrleuargalaalaalaglyglythrargglyserasnhisalaarg
130135140
ileaspalaalagluglyproseraspileproasp
145150155
<210>21
<211>1164
<212>dna
<213>智人
<400>21
cgctcagggaaggcgggtgcgcgcctgcggggcggagatgggcagggggcggtgcgtggg60
tcccagtctgcagttaagggggcaggagtggcgctgctcacctctggtgccaaagggcgg120
cgcagcggctgccgagctcggccctggaggcggcgagaacatggtgcgcaggttcttggt180
gaccctccggattcggcgcgcgtgcggcccgccgcgagtgagggttttcgtggttcacat240
cccgcggctcacgggggagtgggcagcgccaggggcgcccgccgctgtggccctcgtgct300
gatgctactgaggagccagcgtctagggcagcagccgcttcctagaagaccaggtcatga360
tgatgggcagcgcccgagtggcggagctgctgctgctccacggcgcggagcccaactgcg420
ccgaccccgccactctcacccgacccgtgcacgacgctgcccgggagggcttcctggaca480
cgctggtggtgctgcaccgggccggggcgcggctggacgtgcgcgatgcctggggccgtc540
tgcccgtggacctggctgaggagctgggccatcgcgatgtcgcacggtacctgcgcgcgg600
ctgcggggggcaccagaggcagtaaccatgcccgcatagatgccgcggaaggtccctcag660
acatccccgattgaaagaaccagagaggctctgagaaacctcgggaaacttagatcatca720
gtcaccgaaggtcctacagggccacaactgcccccgccacaacccaccccgctttcgtag780
ttttcatttagaaaatagagcttttaaaaatgtcctgccttttaacgtagatatatgcct840
tcccccactaccgtaaatgtccatttatatcattttttatatattcttataaaaatgtaa900
aaaagaaaaacaccgcttctgccttttcactgtgttggagttttctggagtgagcactca960
cgccctaagcgcacattcatgtgggcatttcttgcgagcctcgcagcctccggaagctgt1020
cgacttcatgacaagcattttgtgaactagggaagctcaggggggttactggcttctctt1080
gagtcacactgctagcaaatggcagaaccaaagctcaaataaaaataaaataattttcat1140
tcattcactcaaaaaaaaaaaaaa1164
<210>22
<211>522
<212>dna
<213>智人
<400>22
atgggcagggggcggtgcgtgggtcccagtctgcagttaagggggcaggagtggcgctgc60
tcacctctggtgccaaagggcggcgcagcggctgccgagctcggccctggaggcggcgag120
aacatggtgcgcaggttcttggtgaccctccggattcggcgcgcgtgcggcccgccgcga180
gtgagggttttcgtggttcacatcccgcggctcacgggggagtgggcagcgccaggggcg240
cccgccgctgtggccctcgtgctgatgctactgaggagccagcgtctagggcagcagccg300
cttcctagaagaccaggtcatgatgatgggcagcgcccgagtggcggagctgctgctgct360
ccacggcgcggagcccaactgcgccgaccccgccactctcacccgacccgtgcacgacgc420
tgcccgggagggcttcctggacacgctggtggtgctgcaccgggccggggcgcggctgga480
cgtgcgcgatgcctggggccgtctgcccgtggacctggctga522
<210>23
<211>173
<212>prt
<213>智人
<400>23
metglyargglyargcysvalglyproserleuglnleuargglygln
151015
glutrpargcysserproleuvalprolysglyglyalaalaalaala
202530
gluleuglyproglyglyglygluasnmetvalargargpheleuval
354045
thrleuargileargargalacysglyproproargvalargvalphe
505560
valvalhisileproargleuthrglyglutrpalaalaproglyala
65707580
proalaalavalalaleuvalleumetleuleuargserglnargleu
859095
glyglnglnproleuproargargproglyhisaspaspglyglnarg
100105110
proserglyglyalaalaalaalaproargargglyalaglnleuarg
115120125
argproarghisserhisprothrargalaargargcysproglygly
130135140
leuproglyhisalaglyglyalaalaproglyargglyalaalagly
145150155160
argalaargcysleuglyproseralaargglyprogly
165170
<210>24
<211>10740
<212>dna
<213>智人
<400>24
gtattggtgcagcccgccagggtgtcactggagacagaatggaggtgctgccggactcgg60
aaatggggtccaagggtagccaaggatggctgcagcttcatatgatcagttgttaaagca120
agttgaggcactgaagatggagaactcaaatcttcgacaagagctagaagataattccaa180
tcatcttacaaaactggaaactgaggcatctaatatgaaggaagtacttaaacaactaca240
aggaagtattgaagatgaagctatggcttcttctggacagattgatttattagagcgtct300
taaagagcttaacttagatagcagtaatttccctggagtaaaactgcggtcaaaaatgtc360
cctccgttcttatggaagccgggaaggatctgtatcaagccgttctggagagtgcagtcc420
tgttcctatgggttcatttccaagaagagggtttgtaaatggaagcagagaaagtactgg480
atatttagaagaacttgagaaagagaggtcattgcttcttgctgatcttgacaaagaaga540
aaaggaaaaagactggtattacgctcaacttcagaatctcactaaaagaatagatagtct600
tcctttaactgaaaatttttccttacaaacagatatgaccagaaggcaattggaatatga660
agcaaggcaaatcagagttgcgatggaagaacaactaggtacctgccaggatatggaaaa720
acgagcacagcgaagaatagccagaattcagcaaatcgaaaaggacatacttcgtatacg780
acagcttttacagtcccaagcaacagaagcagagaggtcatctcagaacaagcatgaaac840
cggctcacatgatgctgagcggcagaatgaaggtcaaggagtgggagaaatcaacatggc900
aacttctggtaatggtcagggttcaactacacgaatggaccatgaaacagccagtgtttt960
gagttctagtagcacacactctgcacctcgaaggctgacaagtcatctgggaaccaaggt1020
ggaaatggtgtattcattgttgtcaatgcttggtactcatgataaggatgatatgtcgcg1080
aactttgctagctatgtctagctcccaagacagctgtatatccatgcgacagtctggatg1140
tcttcctctcctcatccagcttttacatggcaatgacaaagactctgtattgttgggaaa1200
ttcccggggcagtaaagaggctcgggccagggccagtgcagcactccacaacatcattca1260
ctcacagcctgatgacaagagaggcaggcgtgaaatccgagtccttcatcttttggaaca1320
gatacgcgcttactgtgaaacctgttgggagtggcaggaagctcatgaaccaggcatgga1380
ccaggacaaaaatccaatgccagctcctgttgaacatcagatctgtcctgctgtgtgtgt1440
tctaatgaaactttcatttgatgaagagcatagacatgcaatgaatgaactagggggact1500
acaggccattgcagaattattgcaagtggactgtgaaatgtatgggcttactaatgacca1560
ctacagtattacactaagacgatatgctggaatggctttgacaaacttgacttttggaga1620
tgtagccaacaaggctacgctatgctctatgaaaggctgcatgagagcacttgtggccca1680
actaaaatctgaaagtgaagacttacagcaggttattgcgagtgttttgaggaatttgtc1740
ttggcgagcagatgtaaatagtaaaaagacgttgcgagaagttggaagtgtgaaagcatt1800
gatggaatgtgctttagaagttaaaaaggaatcaaccctcaaaagcgtattgagtgcctt1860
atggaatttgtcagcacattgcactgagaataaagctgatatatgtgctgtagatggtgc1920
acttgcatttttggttggcactcttacttaccggagccagacaaacactttagccattat1980
tgaaagtggaggtgggatattacggaatgtgtccagcttgatagctacaaatgaggacca2040
caggcaaatcctaagagagaacaactgtctacaaactttattacaacacttaaaatctca2100
tagtttgacaatagtcagtaatgcatgtggaactttgtggaatctctcagcaagaaatcc2160
taaagaccaggaagcattatgggacatgggggcagttagcatgctcaagaacctcattca2220
ttcaaagcacaaaatgattgctatgggaagtgctgcagctttaaggaatctcatggcaaa2280
taggcctgcgaagtacaaggatgccaatattatgtctcctggctcaagcttgccatctct2340
tcatgttaggaaacaaaaagccctagaagcagaattagatgctcagcacttatcagaaac2400
ttttgacaatatagacaatttaagtcccaaggcatctcatcgtagtaagcagagacacaa2460
gcaaagtctctatggtgattatgtttttgacaccaatcgacatgatgataataggtcaga2520
caattttaatactggcaacatgactgtcctttcaccatatttgaatactacagtgttacc2580
cagctcctcttcatcaagaggaagcttagatagttctcgttctgaaaaagatagaagttt2640
ggagagagaacgcggaattggtctaggcaactaccatccagcaacagaaaatccaggaac2700
ttcttcaaagcgaggtttgcagatctccaccactgcagcccagattgccaaagtcatgga2760
agaagtgtcagccattcatacctctcaggaagacagaagttctgggtctaccactgaatt2820
acattgtgtgacagatgagagaaatgcacttagaagaagctctgctgcccatacacattc2880
aaacacttacaatttcactaagtcggaaaattcaaataggacatgttctatgccttatgc2940
caaattagaatacaagagatcttcaaatgatagtttaaatagtgtcagtagtagtgatgg3000
ttatggtaaaagaggtcaaatgaaaccctcgattgaatcctattctgaagatgatgaaag3060
taagttttgcagttatggtcaatacccagccgacctagcccataaaatacatagtgcaaa3120
tcatatggatgataatgatggagaactagatacaccaataaattatagtcttaaatattc3180
agatgagcagttgaactctggaaggcaaagtccttcacagaatgaaagatgggcaagacc3240
caaacacataatagaagatgaaataaaacaaagtgagcaaagacaatcaaggaatcaaag3300
tacaacttatcctgtttatactgagagcactgatgataaacacctcaagttccaaccaca3360
ttttggacagcaggaatgtgtttctccatacaggtcacggggagccaatggttcagaaac3420
aaatcgagtgggttctaatcatggaattaatcaaaatgtaagccagtctttgtgtcaaga3480
agatgactatgaagatgataagcctaccaattatagtgaacgttactctgaagaagaaca3540
gcatgaagaagaagagagaccaacaaattatagcataaaatataatgaagagaaacgtca3600
tgtggatcagcctattgattatagtttaaaatatgccacagatattccttcatcacagaa3660
acagtcattttcattctcaaagagttcatctggacaaagcagtaaaaccgaacatatgtc3720
ttcaagcagtgagaatacgtccacaccttcatctaatgccaagaggcagaatcagctcca3780
tccaagttctgcacagagtagaagtggtcagcctcaaaaggctgccacttgcaaagtttc3840
ttctattaaccaagaaacaatacagacttattgtgtagaagatactccaatatgtttttc3900
aagatgtagttcattatcatctttgtcatcagctgaagatgaaataggatgtaatcagac3960
gacacaggaagcagattctgctaataccctgcaaatagcagaaataaaagaaaagattgg4020
aactaggtcagctgaagatcctgtgagcgaagttccagcagtgtcacagcaccctagaac4080
caaatccagcagactgcagggttctagtttatcttcagaatcagccaggcacaaagctgt4140
tgaattttcttcaggagcgaaatctccctccaaaagtggtgctcagacacccaaaagtcc4200
acctgaacactatgttcaggagaccccactcatgtttagcagatgtacttctgtcagttc4260
acttgatagttttgagagtcgttcgattgccagctccgttcagagtgaaccatgcagtgg4320
aatggtaagtggcattataagccccagtgatcttccagatagccctggacaaaccatgcc4380
accaagcagaagtaaaacacctccaccacctcctcaaacagctcaaaccaagcgagaagt4440
acctaaaaataaagcacctactgctgaaaagagagagagtggacctaagcaagctgcagt4500
aaatgctgcagttcagagggtccaggttcttccagatgctgatactttattacattttgc4560
cacggaaagtactccagatggattttcttgttcatccagcctgagtgctctgagcctcga4620
tgagccatttatacagaaagatgtggaattaagaataatgcctccagttcaggaaaatga4680
caatgggaatgaaacagaatcagagcagcctaaagaatcaaatgaaaaccaagagaaaga4740
ggcagaaaaaactattgattctgaaaaggacctattagatgattcagatgatgatgatat4800
tgaaatactagaagaatgtattatttctgccatgccaacaaagtcatcacgtaaagcaaa4860
aaagccagcccagactgcttcaaaattacctccacctgtggcaaggaaaccaagtcagct4920
gcctgtgtacaaacttctaccatcacaaaacaggttgcaaccccaaaagcatgttagttt4980
tacaccgggggatgatatgccacgggtgtattgtgttgaagggacacctataaacttttc5040
cacagctacatctctaagtgatctaacaatcgaatcccctccaaatgagttagctgctgg5100
agaaggagttagaggaggggcacagtcaggtgaatttgaaaaacgagataccattcctac5160
agaaggcagaagtacagatgaggctcaaggaggaaaaacctcatctgtaaccatacctga5220
attggatgacaataaagcagaggaaggtgatattcttgcagaatgcattaattctgctat5280
gcccaaagggaaaagtcacaagcctttccgtgtgaaaaagataatggaccaggtccagca5340
agcatctgcgtcttcttctgcacccaacaaaaatcagttagatggtaagaaaaagaaacc5400
aacttcaccagtaaaacctataccacaaaatactgaatataggacacgtgtaagaaaaaa5460
tgcagactcaaaaaataatttaaatgctgagagagttttctcagacaacaaagattcaaa5520
gaaacagaatttgaaaaataattccaaggtcttcaatgataagctcccaaataatgaaga5580
tagagtcagaggaagttttgcttttgattcacctcatcattacacgcctattgaaggaac5640
tccttactgtttttcacgaaatgattctttgagttctctagattttgatgatgatgatgt5700
tgacctttccagggaaaaggctgaattaagaaaggcaaaagaaaataaggaatcagaggc5760
taaagttaccagccacacagaactaacctccaaccaacaatcagctaataagacacaagc5820
tattgcaaagcagccaataaatcgaggtcagcctaaacccatacttcagaaacaatccac5880
ttttccccagtcatccaaagacataccagacagaggggcagcaactgatgaaaagttaca5940
gaattttgctattgaaaatactccggtttgcttttctcataattcctctctgagttctct6000
cagtgacattgaccaagaaaacaacaataaagaaaatgaacctatcaaagagactgagcc6060
ccctgactcacagggagaaccaagtaaacctcaagcatcaggctatgctcctaaatcatt6120
tcatgttgaagataccccagtttgtttctcaagaaacagttctctcagttctcttagtat6180
tgactctgaagatgacctgttgcaggaatgtataagctccgcaatgccaaaaaagaaaaa6240
gccttcaagactcaagggtgataatgaaaaacatagtcccagaaatatgggtggcatatt6300
aggtgaagatctgacacttgatttgaaagatatacagagaccagattcagaacatggtct6360
atcccctgattcagaaaattttgattggaaagctattcaggaaggtgcaaattccatagt6420
aagtagtttacatcaagctgctgctgctgcatgtttatctagacaagcttcgtctgattc6480
agattccatcctttccctgaaatcaggaatctctctgggatcaccatttcatcttacacc6540
tgatcaagaagaaaaaccctttacaagtaataaaggcccacgaattctaaaaccagggga6600
gaaaagtacattggaaactaaaaagatagaatctgaaagtaaaggaatcaaaggaggaaa6660
aaaagtttataaaagtttgattactggaaaagttcgatctaattcagaaatttcaggcca6720
aatgaaacagccccttcaagcaaacatgccttcaatctctcgaggcaggacaatgattca6780
tattccaggagttcgaaatagctcctcaagtacaagtcctgtttctaaaaaaggcccacc6840
ccttaagactccagcctccaaaagccctagtgaaggtcaaacagccaccacttctcctag6900
aggagccaagccatctgtgaaatcagaattaagccctgttgccaggcagacatcccaaat6960
aggtgggtcaagtaaagcaccttctagatcaggatctagagattcgaccccttcaagacc7020
tgcccagcaaccattaagtagacctatacagtctcctggccgaaactcaatttcccctgg7080
tagaaatggaataagtcctcctaacaaattatctcaacttccaaggacatcatcccctag7140
tactgcttcaactaagtcctcaggttctggaaaaatgtcatatacatctccaggtagaca7200
gatgagccaacagaaccttaccaaacaaacaggtttatccaagaatgccagtagtattcc7260
aagaagtgagtctgcctccaaaggactaaatcagatgaataatggtaatggagccaataa7320
aaaggtagaactttctagaatgtcttcaactaaatcaagtggaagtgaatctgatagatc7380
agaaagacctgtattagtacgccagtcaactttcatcaaagaagctccaagcccaacctt7440
aagaagaaaattggaggaatctgcttcatttgaatctctttctccatcatctagaccagc7500
ttctcccactaggtcccaggcacaaactccagttttaagtccttcccttcctgatatgtc7560
tctatccacacattcgtctgttcaggctggtggatggcgaaaactcccacctaatctcag7620
tcccactatagagtataatgatggaagaccagcaaagcgccatgatattgcacggtctca7680
ttctgaaagtccttctagacttccaatcaataggtcaggaacctggaaacgtgagcacag7740
caaacattcatcatcccttcctcgagtaagcacttggagaagaactggaagttcatcttc7800
aattctttctgcttcatcagaatccagtgaaaaagcaaaaagtgaggatgaaaaacatgt7860
gaactctatttcaggaaccaaacaaagtaaagaaaaccaagtatccgcaaaaggaacatg7920
gagaaaaataaaagaaaatgaattttctcccacaaatagtacttctcagaccgtttcctc7980
aggtgctacaaatggtgctgaatcaaagactctaatttatcaaatggcacctgctgtttc8040
taaaacagaggatgtttgggtgagaattgaggactgtcccattaacaatcctagatctgg8100
aagatctcccacaggtaatactcccccggtgattgacagtgtttcagaaaaggcaaatcc8160
aaacattaaagattcaaaagataatcaggcaaaacaaaatgtgggtaatggcagtgttcc8220
catgcgtaccgtgggtttggaaaatcgcctgaactcctttattcaggtggatgcccctga8280
ccaaaaaggaactgagataaaaccaggacaaaataatcctgtccctgtatcagagactaa8340
tgaaagttctatagtggaacgtaccccattcagttctagcagctcaagcaaacacagttc8400
acctagtgggactgttgctgccagagtgactccttttaattacaacccaagccctaggaa8460
aagcagcgcagatagcacttcagctcggccatctcagatcccaactccagtgaataacaa8520
cacaaagaagcgagattccaaaactgacagcacagaatccagtggaacccaaagtcctaa8580
gcgccattctgggtcttaccttgtgacatctgtttaaaagagaggaagaatgaaactaag8640
aaaattctatgttaattacaactgctatatagacattttgtttcaaatgaaactttaaaa8700
gactgaaaaattttgtaaataggtttgattcttgttagagggtttttgttctggaagcca8760
tatttgatagtatactttgtcttcactggtcttattttgggaggcactcttgatggttag8820
gaaaaaaatagtaaagccaagtatgtttgtacagtatgttttacatgtatttaaagtagc8880
atcccatcccaacttcctttaattattgcttgtcttaaaataatgaacactacagataga8940
aaatatgatatattgctgttatcaatcatttctagattataaactgactaaacttacatc9000
agggaaaaattggtatttatgcaaaaaaaaatgtttttgtccttgtgagtccatctaaca9060
tcataattaatcatgtggctgtgaaattcacagtaatatggttcccgatgaacaagttta9120
cccagcctgctttgctttactgcatgaatgaaactgatggttcaatttcagaagtaatga9180
ttaacagttatgtggtcacatgatgtgcatagagatagctacagtgtaataatttacact9240
attttgtgctccaaacaaaacaaaaatctgtgtaactgtaaaacattgaatgaaactatt9300
ttacctgaactagattttatctgaaagtaggtagaatttttgctatgctgtaatttgttg9360
tatattctggtatttgaggtgagatggctgctcttttattaatgagacatgaattgtgtc9420
tcaacagaaactaaatgaacatttcagaataaattattgctgtatgtaaactgttactga9480
aattggtatttgtttgaagggtcttgtttcacatttgtattaataattgtttaaaatgcc9540
tcttttaaaagcttatataaatttttttcttcagcttctatgcattaagagtaaaattcc9600
tcttactgtaataaaaacaattgaagaagactgttgccacttaaccattccatgcgttgg9660
cacttatctattcctgaaatttcttttatgtgattagctcatcttgatttttaatatttt9720
tccacttaaacttttttttcttactccactggagctcagtaaaagtaaattcatgtaata9780
gcaatgcaagcagcctagcacagactaagcattgagcataataggcccacataatttcct9840
ctttcttaatattatagaattctgtacttgaaattgattcttagacattgcagtctcttc9900
gaggctttacagtgtaaactgtcttgccccttcatcttcttgttgcaactgggtctgaca9960
tgaacactttttatcaccctgtatgttagggcaagatctcagcagtgaagtataatcagc10020
actttgccatgctcagaaaattcaaatcacatggaactttagaggtagatttaatacgat10080
taagatattcagaagtatattttagaatccctgcctgttaaggaaactttatttgtggta10140
ggtacagttctggggtacatgttaagtgtccccttatacagtggagggaagtcttccttc10200
ctgaaggaaaataaactgacacttattaactaagataatttacttaatatatcttccctg10260
atttgttttaaaagatcagagggtgactgatgatacatgcatacatatttgttgaataaa10320
tgaaaatttatttttagtgataagattcatacactctgtatttggggagggaaaaccttt10380
ttaagcatggtggggcactcagataggagtgaatacacctacctggtgccttgaaaatca10440
catcaagtagttaattatctaccccttacctgtgtttataacttccaggtaatgagaatg10500
attttttttaaagctaaaatgccagtaaataaaagtgctatgacttgagctaagatattt10560
gactccaatgcctgtactgtgtctactgcaccactttgtaaacacttcaatttactatct10620
ttgaaatgattgacctttaaatttttgccaaatgttatctgaaattgtctatgaatacca10680
tctacttctgttgttttcccaggcttccataaacaatggagatacatgcaaaaaaaaaaa10740
<210>25
<211>8532
<212>dna
<213>智人
<400>25
atggctgcagcttcatatgatcagttgttaaagcaagttgaggcactgaagatggagaac60
tcaaatcttcgacaagagctagaagataattccaatcatcttacaaaactggaaactgag120
gcatctaatatgaaggaagtacttaaacaactacaaggaagtattgaagatgaagctatg180
gcttcttctggacagattgatttattagagcgtcttaaagagcttaacttagatagcagt240
aatttccctggagtaaaactgcggtcaaaaatgtccctccgttcttatggaagccgggaa300
ggatctgtatcaagccgttctggagagtgcagtcctgttcctatgggttcatttccaaga360
agagggtttgtaaatggaagcagagaaagtactggatatttagaagaacttgagaaagag420
aggtcattgcttcttgctgatcttgacaaagaagaaaaggaaaaagactggtattacgct480
caacttcagaatctcactaaaagaatagatagtcttcctttaactgaaaatttttcctta540
caaacagatatgaccagaaggcaattggaatatgaagcaaggcaaatcagagttgcgatg600
gaagaacaactaggtacctgccaggatatggaaaaacgagcacagcgaagaatagccaga660
attcagcaaatcgaaaaggacatacttcgtatacgacagcttttacagtcccaagcaaca720
gaagcagagaggtcatctcagaacaagcatgaaaccggctcacatgatgctgagcggcag780
aatgaaggtcaaggagtgggagaaatcaacatggcaacttctggtaatggtcagggttca840
actacacgaatggaccatgaaacagccagtgttttgagttctagtagcacacactctgca900
cctcgaaggctgacaagtcatctgggaaccaaggtggaaatggtgtattcattgttgtca960
atgcttggtactcatgataaggatgatatgtcgcgaactttgctagctatgtctagctcc1020
caagacagctgtatatccatgcgacagtctggatgtcttcctctcctcatccagctttta1080
catggcaatgacaaagactctgtattgttgggaaattcccggggcagtaaagaggctcgg1140
gccagggccagtgcagcactccacaacatcattcactcacagcctgatgacaagagaggc1200
aggcgtgaaatccgagtccttcatcttttggaacagatacgcgcttactgtgaaacctgt1260
tgggagtggcaggaagctcatgaaccaggcatggaccaggacaaaaatccaatgccagct1320
cctgttgaacatcagatctgtcctgctgtgtgtgttctaatgaaactttcatttgatgaa1380
gagcatagacatgcaatgaatgaactagggggactacaggccattgcagaattattgcaa1440
gtggactgtgaaatgtacgggcttactaatgaccactacagtattacactaagacgatat1500
gctggaatggctttgacaaacttgacttttggagatgtagccaacaaggctacgctatgc1560
tctatgaaaggctgcatgagagcacttgtggcccaactaaaatctgaaagtgaagactta1620
cagcaggttattgcaagtgttttgaggaatttgtcttggcgagcagatgtaaatagtaaa1680
aagacgttgcgagaagttggaagtgtgaaagcattgatggaatgtgctttagaagttaaa1740
aaggaatcaaccctcaaaagcgtattgagtgccttatggaatttgtcagcacattgcact1800
gagaataaagctgatatatgtgctgtagatggtgcacttgcatttttggttggcactctt1860
acttaccggagccagacaaacactttagccattattgaaagtggaggtgggatattacgg1920
aatgtgtccagcttgatagctacaaatgaggaccacaggcaaatcctaagagagaacaac1980
tgtctacaaactttattacaacacttaaaatctcatagtttgacaatagtcagtaatgca2040
tgtggaactttgtggaatctctcagcaagaaatcctaaagaccaggaagcattatgggac2100
atgggggcagttagcatgctcaagaacctcattcattcaaagcacaaaatgattgctatg2160
ggaagtgctgcagctttaaggaatctcatggcaaataggcctgcgaagtacaaggatgcc2220
aatattatgtctcctggctcaagcttgccatctcttcatgttaggaaacaaaaagcccta2280
gaagcagaattagatgctcagcacttatcagaaacttttgacaatatagacaatttaagt2340
cccaaggcatctcatcgtagtaagcagagacacaagcaaagtctctatggtgattatgtt2400
tttgacaccaatcgacatgatgataataggtcagacaattttaatactggcaacatgact2460
gtcctttcaccatatttgaatactacagtgttacccagctcctcttcatcaagaggaagc2520
ttagatagttctcgttctgaaaaagatagaagtttggagagagaacgcggaattggtcta2580
ggcaactaccatccagcaacagaaaatccaggaacttcttcaaagcgaggtttgcagatc2640
tccaccactgcagcccagattgccaaagtcatggaagaagtgtcagccattcatacctct2700
caggaagacagaagttctgggtctaccactgaattacattgtgtgacagatgagagaaat2760
gcacttagaagaagctctgctgcccatacacattcaaacacttacaatttcactaagtcg2820
gaaaattcaaataggacatgttctatgccttatgccaaattagaatacaagagatcttca2880
aatgatagtttaaatagtgtcagtagtagtgatggttatggtaaaagaggtcaaatgaaa2940
ccctcgattgaatcctattctgaagatgatgaaagtaagttttgcagttatggtcaatac3000
ccagccgacctagcccataaaatacatagtgcaaatcatatggatgataatgatggagaa3060
ctagatacaccaataaattatagtcttaaatattcagatgagcagttgaactctggaagg3120
caaagtccttcacagaatgaaagatgggcaagacccaaacacataatagaagatgaaata3180
aaacaaagtgagcaaagacaatcaaggaatcaaagtacaacttatcctgtttatactgag3240
agcactgatgataaacacctcaagttccaaccacattttggacagcaggaatgtgtttct3300
ccatacaggtcacggggagccaatggttcagaaacaaatcgagtgggttctaatcatgga3360
attaatcaaaatgtaagccagtctttgtgtcaagaagatgactatgaagatgataagcct3420
accaattatagtgaacgttactctgaagaagaacagcatgaagaagaagagagaccaaca3480
aattatagcataaaatataatgaagagaaacgtcatgtggatcagcctattgattatagt3540
ttaaaatatgccacagatattccttcatcacagaaacagtcattttcattctcaaagagt3600
tcatctggacaaagcagtaaaaccgaacatatgtcttcaagcagtgagaatacgtccaca3660
ccttcatctaatgccaagaggcagaatcagctccatccaagttctgcacagagtagaagt3720
ggtcagcctcaaaaggctgccacttgcaaagtttcttctattaaccaagaaacaatacag3780
acttattgtgtagaagatactccaatatgtttttcaagatgtagttcattatcatctttg3840
tcatcagctgaagatgaaataggatgtaatcagacgacacaggaagcagattctgctaat3900
accctgcaaatagcagaaataaaagaaaagattggaactaggtcagctgaagatcctgtg3960
agcgaagttccagcagtgtcacagcaccctagaaccaaatccagcagactgcagggttct4020
agtttatcttcagaatcagccaggcacaaagctgttgaattttcttcaggagcgaaatct4080
ccctccaaaagtggtgctcagacacccaaaagtccacctgaacactatgttcaggagacc4140
ccactcatgtttagcagatgtacttctgtcagttcacttgatagttttgagagtcgttcg4200
attgccagctccgttcagagtgaaccatgcagtggaatggtaagtggcattataagcccc4260
agtgatcttccagatagccctggacaaaccatgccaccaagcagaagtaaaacacctcca4320
ccacctcctcaaacagctcaaaccaagcgagaagtacctaaaaataaagcacctactgct4380
gaaaagagagagagtggacctaagcaagctgcagtaaatgctgcagttcagagggtccag4440
gttcttccagatgctgatactttattacattttgccacggaaagtactccagatggattt4500
tcttgttcatccagcctgagtgctctgagcctcgatgagccatttatacagaaagatgtg4560
gaattaagaataatgcctccagttcaggaaaatgacaatgggaatgaaacagaatcagag4620
cagcctaaagaatcaaatgaaaaccaagagaaagaggcagaaaaaactattgattctgaa4680
aaggacctattagatgattcagatgatgatgatattgaaatactagaagaatgtattatt4740
tctgccatgccaacaaagtcatcacgtaaagcaaaaaagccagcccagactgcttcaaaa4800
ttacctccacctgtggcaaggaaaccaagtcagctgcctgtgtacaaacttctaccatca4860
caaaacaggttgcaaccccaaaagcatgttagttttacaccgggggatgatatgccacgg4920
gtgtattgtgttgaagggacacctataaacttttccacagctacatctctaagtgatcta4980
acaatcgaatcccctccaaatgagttagctgctggagaaggagttagaggaggagcacag5040
tcaggtgaatttgaaaaacgagataccattcctacagaaggcagaagtacagatgaggct5100
caaggaggaaaaacctcatctgtaaccatacctgaattggatgacaataaagcagaggaa5160
ggtgatattcttgcagaatgcattaattctgctatgcccaaagggaaaagtcacaagcct5220
ttccgtgtgaaaaagataatggaccaggtccagcaagcatctgcgtcgtcttctgcaccc5280
aacaaaaatcagttagatggtaagaaaaagaaaccaacttcaccagtaaaacctatacca5340
caaaatactgaatataggacacgtgtaagaaaaaatgcagactcaaaaaataatttaaat5400
gctgagagagttttctcagacaacaaagattcaaagaaacagaatttgaaaaataattcc5460
aaggacttcaatgataagctcccaaataatgaagatagagtcagaggaagttttgctttt5520
gattcacctcatcattacacgcctattgaaggaactccttactgtttttcacgaaatgat5580
tctttgagttctctagattttgatgatgatgatgttgacctttccagggaaaaggctgaa5640
ttaagaaaggcaaaagaaaataaggaatcagaggctaaagttaccagccacacagaacta5700
acctccaaccaacaatcagctaataagacacaagctattgcaaagcagccaataaatcga5760
ggtcagcctaaacccatacttcagaaacaatccacttttccccagtcatccaaagacata5820
ccagacagaggggcagcaactgatgaaaagttacagaattttgctattgaaaatactcca5880
gtttgcttttctcataattcctctctgagttctctcagtgacattgaccaagaaaacaac5940
aataaagaaaatgaacctatcaaagagactgagccccctgactcacagggagaaccaagt6000
aaacctcaagcatcaggctatgctcctaaatcatttcatgttgaagataccccagtttgt6060
ttctcaagaaacagttctctcagttctcttagtattgactctgaagatgacctgttgcag6120
gaatgtataagctccgcaatgccaaaaaagaaaaagccttcaagactcaagggtgataat6180
gaaaaacatagtcccagaaatatgggtggcatattaggtgaagatctgacacttgatttg6240
aaagatatacagagaccagattcagaacatggtctatcccctgattcagaaaattttgat6300
tggaaagctattcaggaaggtgcaaattccatagtaagtagtttacatcaagctgctgct6360
gctgcatgtttatctagacaagcttcgtctgattcagattccatcctttccctgaaatca6420
ggaatctctctgggatcaccatttcatcttacacctgatcaagaagaaaaaccctttaca6480
agtaataaaggcccacgaattctaaaaccaggggagaaaagtacattggaaactaaaaag6540
atagaatctgaaagtaaaggaatcaaaggaggaaaaaaagtttataaaagtttgattact6600
ggaaaagttcgatctaattcagaaatttcaggccaaatgaaacagccccttcaagcaaac6660
atgccttcaatctctcgaggcaggacaatgattcatattccaggagttcgaaatagctcc6720
tcaagtacaagtcctgtttctaaaaaaggcccaccccttaagactccagcctccaaaagc6780
cctagtgaaggtcaaacagccaccacttctcctagaggagccaagccatctgtgaaatca6840
gaattaagccctgttgccaggcagacatcccaaataggtgggtcaagtaaagcaccttct6900
agatcaggatctagagattcgaccccttcaagacctgcccagcaaccattaagtagacct6960
atacagtctcctggccgaaactcaatttcccctggtagaaatggaataagtcctcctaac7020
aaattatctcaacttccaaggacatcatcccctagtactgcttcaactaagtcctcaggt7080
tctggaaaaatgtcatatacatctccaggtagacagatgagccaacagaaccttaccaaa7140
caaacaggtttatccaagaatgccagtagtattccaagaagtgagtctgcctccaaagga7200
ctaaatcagatgaataatggtaatggagccaataaaaaggtagaactttctagaatgtct7260
tcaactaaatcaagtggaagtgaatctgatagatcagaaagacctgtattagtacgccag7320
tcaactttcatcaaagaagctccaagcccaaccttaagaagaaaattggaggaatctgct7380
tcatttgaatctctttctccatcatctagaccagcttctcccactaggtcccaggcacaa7440
actccagttttaagtccttcccttcctgatatgtctctatccacacattcgtctgttcag7500
gctggtggatggcgaaaactcccacctaatctcagtcccactatagagtataatgatgga7560
agaccagcaaagcgccatgatattgcacggtctcattctgaaagtccttctagacttcca7620
atcaataggtcaggaacctggaaacgtgagcacagcaaacattcatcatcccttcctcga7680
gtaagcacttggagaagaactggaagttcatcttcaattctttctgcttcatcagaatcc7740
agtgaaaaagcaaaaagtgaggatgaaaaacatgtgaactctatttcaggaaccaaacaa7800
agtaaagaaaaccaagtatccgcaaaaggaacatggagaaaaataaaagaaaatgaattt7860
tctcccacaaatagtacttctcagaccgtttcctcaggtgctacaaatggtgctgaatca7920
aagactctaatttatcaaatggcacctgctgtttctaaaacagaggatgtttgggtgaga7980
attgaggactgtcccattaacaatcctagatctggaagatctcccacaggtaatactccc8040
ccggtgattgacagtgtttcagaaaaggcaaatccaaacattaaagattcaaaagataat8100
caggcaaaacaaaatgtgggtaatggcagtgttcccatgcgtaccgtgggtttggaaaat8160
cgcctgaactcctttattcaggtggatgcccctgaccaaaaaggaactgagataaaacca8220
ggacaaaataatcctgtccctgtatcagagactaatgaaagttctatagtggaacgtacc8280
ccattcagttctagcagctcaagcaaacacagttcacctagtgggactgttgctgccaga8340
gtgactccttttaattacaacccaagccctaggaaaagcagcgcagatagcacttcagct8400
cggccatctcagatcccaactccagtgaataacaacacaaagaagcgagattccaaaact8460
gacagcacagaatccagtggaacccaaagtcctaagcgccattctgggtcttaccttgtg8520
acatctgtttaa8532
<210>26
<211>2843
<212>prt
<213>智人
<400>26
metalaalaalasertyraspglnleuleulysglnvalglualaleu
151015
lysmetgluasnserasnleuargglngluleugluaspasnserasn
202530
hisleuthrlysleugluthrglualaserasnmetlysgluvalleu
354045
lysglnleuglnglyserilegluaspglualametalasersergly
505560
glnileaspleuleugluargleulysgluleuasnleuaspserser
65707580
asnpheproglyvallysleuargserlysmetserleuargsertyr
859095
glyserarggluglyservalserserargserglyglucysserpro
100105110
valprometglyserpheproargargglyphevalasnglyserarg
115120125
gluserthrglytyrleuglugluleuglulysgluargserleuleu
130135140
leualaaspleuasplysgluglulysglulysasptrptyrtyrala
145150155160
glnleuglnasnleuthrlysargileaspserleuproleuthrglu
165170175
asnpheserleuglnthraspmetthrargargglnleuglutyrglu
180185190
alaargglnileargvalalametglugluglnleuglythrcysgln
195200205
aspmetglulysargalaglnargargilealaargileglnglnile
210215220
glulysaspileleuargileargglnleuleuglnserglnalathr
225230235240
glualagluargserserglnasnlyshisgluthrglyserhisasp
245250255
alagluargglnasngluglyglnglyvalglygluileasnmetala
260265270
thrserglyasnglyglnglyserthrthrargmetasphisgluthr
275280285
alaservalleuserserserserthrhisseralaproargargleu
290295300
thrserhisleuglythrlysvalglumetvaltyrserleuleuser
305310315320
metleuglythrhisasplysaspaspmetserargthrleuleuala
325330335
metserserserglnaspsercysilesermetargglnserglycys
340345350
leuproleuleuileglnleuleuhisglyasnasplysaspserval
355360365
leuleuglyasnserargglyserlysglualaargalaargalaser
370375380
alaalaleuhisasnileilehisserglnproaspasplysarggly
385390395400
argarggluileargvalleuhisleuleugluglnileargalatyr
405410415
cysgluthrcystrpglutrpglnglualahisgluproglymetasp
420425430
glnasplysasnprometproalaprovalgluhisglnilecyspro
435440445
alavalcysvalleumetlysleuserpheaspglugluhisarghis
450455460
alametasngluleuglyglyleuglnalailealagluleuleugln
465470475480
valaspcysglumettyrglyleuthrasnasphistyrserilethr
485490495
leuargargtyralaglymetalaleuthrasnleuthrpheglyasp
500505510
valalaasnlysalathrleucyssermetlysglycysmetargala
515520525
leuvalalaglnleulysserglusergluaspleuglnglnvalile
530535540
alaservalleuargasnleusertrpargalaaspvalasnserlys
545550555560
lysthrleuarggluvalglyservallysalaleumetglucysala
565570575
leugluvallyslysgluserthrleulysservalleuseralaleu
580585590
trpasnleuseralahiscysthrgluasnlysalaaspilecysala
595600605
valaspglyalaleualapheleuvalglythrleuthrtyrargser
610615620
glnthrasnthrleualaileilegluserglyglyglyileleuarg
625630635640
asnvalserserleuilealathrasngluasphisargglnileleu
645650655
arggluasnasncysleuglnthrleuleuglnhisleulysserhis
660665670
serleuthrilevalserasnalacysglythrleutrpasnleuser
675680685
alaargasnprolysaspglnglualaleutrpaspmetglyalaval
690695700
sermetleulysasnleuilehisserlyshislysmetilealamet
705710715720
glyseralaalaalaleuargasnleumetalaasnargproalalys
725730735
tyrlysaspalaasnilemetserproglyserserleuproserleu
740745750
hisvalarglysglnlysalaleuglualagluleuaspalaglnhis
755760765
leusergluthrpheaspasnileaspasnleuserprolysalaser
770775780
hisargserlysglnarghislysglnserleutyrglyasptyrval
785790795800
pheaspthrasnarghisaspaspasnargseraspasnpheasnthr
805810815
glyasnmetthrvalleuserprotyrleuasnthrthrvalleupro
820825830
serserserserserargglyserleuaspserserargserglulys
835840845
aspargserleugluarggluargglyileglyleuglyasntyrhis
850855860
proalathrgluasnproglythrserserlysargglyleuglnile
865870875880
serthrthralaalaglnilealalysvalmetglugluvalserala
885890895
ilehisthrserglngluaspargserserglyserthrthrgluleu
900905910
hiscysvalthraspgluargasnalaleuargargserseralaala
915920925
histhrhisserasnthrtyrasnphethrlyssergluasnserasn
930935940
argthrcyssermetprotyralalysleuglutyrlysargserser
945950955960
asnaspserleuasnservalserserseraspglytyrglylysarg
965970975
glyglnmetlysproserileglusertyrsergluaspaspgluser
980985990
lysphecyssertyrglyglntyrproalaaspleualahislysile
99510001005
hisseralaasnhismetaspaspasnaspglygluleuaspthrpro
101010151020
ileasntyrserleulystyrseraspgluglnleuasnserglyarg
1025103010351040
glnserproserglnasngluargtrpalaargprolyshisileile
104510501055
gluaspgluilelysglnsergluglnargglnserargasnglnser
106010651070
thrthrtyrprovaltyrthrgluserthraspasplyshisleulys
107510801085
pheglnprohispheglyglnglnglucysvalserprotyrargser
109010951100
argglyalaasnglysergluthrasnargvalglyserasnhisgly
1105111011151120
ileasnglnasnvalserglnserleucysglngluaspasptyrglu
112511301135
aspasplysprothrasntyrsergluargtyrserglugluglugln
114011451150
hisglugluglugluargprothrasntyrserilelystyrasnglu
115511601165
glulysarghisvalaspglnproileasptyrserleulystyrala
117011751180
thraspileproserserglnlysglnserpheserpheserlysser
1185119011951200
serserglyglnserserlysthrgluhismetserserserserglu
120512101215
asnthrserthrproserserasnalalysargglnasnglnleuhis
122012251230
proserseralaglnserargserglyglnproglnlysalaalathr
123512401245
cyslysvalserserileasnglngluthrileglnthrtyrcysval
125012551260
gluaspthrproilecyspheserargcysserserleuserserleu
1265127012751280
serseralagluaspgluileglycysasnglnthrthrglngluala
128512901295
aspseralaasnthrleuglnilealagluilelysglulysilegly
130013051310
thrargseralagluaspprovalsergluvalproalavalsergln
131513201325
hisproargthrlysserserargleuglnglyserserleuserser
133013351340
gluseralaarghislysalavalglupheserserglyalalysser
1345135013551360
proserlysserglyalaglnthrprolysserproprogluhistyr
136513701375
valglngluthrproleumetpheserargcysthrservalserser
138013851390
leuaspserphegluserargserilealaserservalglnserglu
139514001405
procysserglymetvalserglyileileserproseraspleupro
141014151420
aspserproglyglnthrmetproproserargserlysthrpropro
1425143014351440
proproproglnthralaglnthrlysarggluvalprolysasnlys
144514501455
alaprothralaglulysarggluserglyprolysglnalaalaval
146014651470
asnalaalavalglnargvalglnvalleuproaspalaaspthrleu
147514801485
leuhisphealathrgluserthrproaspglyphesercysserser
149014951500
serleuseralaleuserleuaspglupropheileglnlysaspval
1505151015151520
gluleuargilemetproprovalglngluasnaspasnglyasnglu
152515301535
thrglusergluglnprolysgluserasngluasnglnglulysglu
154015451550
alaglulysthrileaspserglulysaspleuleuaspaspserasp
155515601565
aspaspaspilegluileleugluglucysileileseralametpro
157015751580
thrlysserserarglysalalyslysproalaglnthralaserlys
1585159015951600
leuproproprovalalaarglysproserglnleuprovaltyrlys
160516101615
leuleuproserglnasnargleuglnproglnlyshisvalserphe
162016251630
thrproglyaspaspmetproargvaltyrcysvalgluglythrpro
163516401645
ileasnpheserthralathrserleuseraspleuthrilegluser
165016551660
proproasngluleualaalaglygluglyvalargglyglyalagln
1665167016751680
serglyglupheglulysargaspthrileprothrgluglyargser
168516901695
thraspglualaglnglyglylysthrserservalthrileproglu
170017051710
leuaspaspasnlysalaglugluglyaspileleualaglucysile
171517201725
asnseralametprolysglylysserhislyspropheargvallys
173017351740
lysilemetaspglnvalglnglnalaseralaserserseralapro
1745175017551760
asnlysasnglnleuaspglylyslyslyslysprothrserproval
176517701775
lysproileproglnasnthrglutyrargthrargvalarglysasn
178017851790
alaaspserlysasnasnleuasnalagluargvalpheseraspasn
179518001805
lysaspserlyslysglnasnleulysasnasnserlysvalpheasn
181018151820
asplysleuproasnasngluaspargvalargglyserphealaphe
1825183018351840
aspserprohishistyrthrproilegluglythrprotyrcysphe
184518501855
serargasnaspserleuserserleuasppheaspaspaspaspval
186018651870
aspleuserargglulysalagluleuarglysalalysgluasnlys
187518801885
gluserglualalysvalthrserhisthrgluleuthrserasngln
189018951900
glnseralaasnlysthrglnalailealalysglnproileasnarg
1905191019151920
glyglnprolysproileleuglnlysglnserthrpheproglnser
192519301935
serlysaspileproaspargglyalaalathraspglulysleugln
194019451950
asnphealailegluasnthrprovalcyspheserhisasnserser
195519601965
leuserserleuseraspileaspglngluasnasnasnlysgluasn
197019751980
gluproilelysgluthrgluproproaspserglnglygluproser
1985199019952000
lysproglnalaserglytyralaprolysserphehisvalgluasp
200520102015
thrprovalcyspheserargasnserserleuserserleuserile
202020252030
aspsergluaspaspleuleuglnglucysileserseralametpro
203520402045
lyslyslyslysproserargleulysglyaspasnglulyshisser
205020552060
proargasnmetglyglyileleuglygluaspleuthrleuaspleu
2065207020752080
lysaspileglnargproaspsergluhisglyleuserproaspser
208520902095
gluasnpheasptrplysalaileglngluglyalaasnserileval
210021052110
serserleuhisglnalaalaalaalaalacysleuserargglnala
211521202125
serseraspseraspserileleuserleulysserglyileserleu
213021352140
glyserprophehisleuthrproaspglngluglulysprophethr
2145215021552160
serasnlysglyproargileleulysproglyglulysserthrleu
216521702175
gluthrlyslysileglusergluserlysglyilelysglyglylys
218021852190
lysvaltyrlysserleuilethrglylysvalargserasnserglu
219522002205
ileserglyglnmetlysglnproleuglnalaasnmetproserile
221022152220
serargglyargthrmetilehisileproglyvalargasnserser
2225223022352240
serserthrserprovalserlyslysglyproproleulysthrpro
224522502255
alaserlysserprosergluglyglnthralathrthrserproarg
226022652270
glyalalysproservallyssergluleuserprovalalaarggln
227522802285
thrserglnileglyglyserserlysalaproserargserglyser
229022952300
argaspserthrproserargproalaglnglnproleuserargpro
2305231023152320
ileglnserproglyargasnserileserproglyargasnglyile
232523302335
serproproasnlysleuserglnleuproargthrserserproser
234023452350
thralaserthrlysserserglyserglylysmetsertyrthrser
235523602365
proglyargglnmetserglnglnasnleuthrlysglnthrglyleu
237023752380
serlysasnalaserserileproargsergluseralaserlysgly
2385239023952400
leuasnglnmetasnasnglyasnglyalaasnlyslysvalgluleu
240524102415
serargmetserserthrlysserserglysergluseraspargser
242024252430
gluargprovalleuvalargglnserthrpheilelysglualapro
243524402445
serprothrleuargarglysleuglugluseralaserphegluser
245024552460
leuserproserserargproalaserprothrargserglnalagln
2465247024752480
thrprovalleuserproserleuproaspmetserleuserthrhis
248524902495
serservalglnalaglyglytrparglysleuproproasnleuser
250025052510
prothrileglutyrasnaspglyargproalalysarghisaspile
251525202525
alaargserhissergluserproserargleuproileasnargser
253025352540
glythrtrplysarggluhisserlyshisserserserleuproarg
2545255025552560
valserthrtrpargargthrglyserserserserileleuserala
256525702575
sersergluserserglulysalalyssergluaspglulyshisval
258025852590
asnserileserglythrlysglnserlysgluasnglnvalserala
259526002605
lysglythrtrparglysilelysgluasnglupheserprothrasn
261026152620
serthrserglnthrvalserserglyalathrasnglyalagluser
2625263026352640
lysthrleuiletyrglnmetalaproalavalserlysthrgluasp
264526502655
valtrpvalargilegluaspcysproileasnasnproargsergly
266026652670
argserprothrglyasnthrproprovalileaspservalserglu
267526802685
lysalaasnproasnilelysaspserlysaspasnglnalalysgln
269026952700
asnvalglyasnglyservalprometargthrvalglyleugluasn
2705271027152720
argleuasnserpheileglnvalaspalaproaspglnlysglythr
272527302735
gluilelysproglyglnasnasnprovalprovalsergluthrasn
274027452750
gluserserilevalgluargthrpropheserserserserserser
275527602765
lyshisserserproserglythrvalalaalaargvalthrprophe
277027752780
asntyrasnproserproarglysserseralaaspserthrserala
2785279027952800
argproserglnileprothrprovalasnasnasnthrlyslysarg
280528102815
aspserlysthraspserthrgluserserglythrglnserprolys
282028252830
arghisserglysertyrleuvalthrserval
28352840