專利名稱:用于結腸直腸癌早期檢測的藥物篩選和分子診斷檢測試劑、方法及其試劑盒的制作方法
優(yōu)先權要求美國臨時專利申請?zhí)?0/614,746,題目為MOLECULARDIAGNOSTIC TEST FOR EARLY DETECTION OF COLORECTALCANCERREAGENTS,METHODS,AND KITS THEREOF,由Nancy M.Lee,等.于2004年9月30日提交(Attorney Docket No.NLEE-01001US0);美國臨時專利申請?zhí)?0/651,344,題目為METHODS OF USE OF ABIOMARKER PANEL FOR DRUG SCREENING,由Nancy M.Lee,等.于2005年2月8日提交(Attorney Docket No.NLEE-01002US0);和美國專利申請?zhí)?/_,_,題目為DRUG SCREENING ANDMOLECULAR DIAGNOSTIC TEST FOR EARLY DETECTION OFCOLORECTAL CANCERREAGENTS,METHODS,AND KITSTHEREOF,由Nancy M.Lee,等.于2005年9月29日提交(Attorney DocketNo.NLEE-01001US1)。
相關申請的交叉參考本申請與由Nancy M.Lee等于2004年7月14日提交的題目為“Biomarker Panel for Colorectal Cancer”的PCT/US2004/022594相關,它要求由Nancy M.Lee等于2003年7月18日提交的題目為″MolecularBiomarker Panel for Determination of Colorectal Cancer″的美國臨時申請?zhí)?0/488,660(Attorney Docket No.CPMC-01000US0)的優(yōu)先權,并且還要求由Nancy M.Lee等于2003年10月22日提交的題目為″Biomarker Panel forColorectal Cancer″的美國專利申請?zhí)?0/690,880(Attorney Docket No.CPMC-01000US1)的優(yōu)先權,每一申請通過參考完全結合于此。
核苷酸和/或氨基酸序列列表以計算機可讀的形式和硬拷貝(hard-copy)包含在本申請中。以計算機可讀形式包含的信息通過參考完全結合于此。計算機可讀形式的信息還包含在磁盤上,并且在磁盤上提交的這樣的信息通過參考完全結合于此。1號壓縮磁盤包含下述文件NLEE1001WO0.ST25.txt(9/30/2005產(chǎn)生,96K)。提交的磁盤總數(shù)為1。
背景本公開內容的技術領域涉及用于結腸直腸癌(“CRC”)早期檢測的試劑、方法和試劑盒,和用于篩選對病理諸如癌癥和神經(jīng)退行性疾病治療有效的藥物的方法,所述癌癥例如CRC、肺癌、前列腺癌和乳腺癌,所述神經(jīng)退行性疾病例如阿爾茨海默病和ALS。這些試劑、方法和試劑盒基于一組生物標記,所述生物標記有效用于CRC和其它這樣的病理的危險評估、早期檢測、建立預后、干涉評估、復發(fā),以及關于治療干涉的藥物發(fā)明。
在醫(yī)學領域,很久以來就開始探求用于CRC危險評估和早期檢測的臨床方法。目前,CRC是西方國家中癌癥-相關的死亡中的第二主要原因。通過十幾年的關于CRC的研究清楚顯現(xiàn)出的一幅圖像就是,早期檢測是增加生存率的關鍵。
因此,對于CRC早期檢測的一種長期探求的途徑已經(jīng)成為對于有效進行CRC早期檢測并且因此有效地用于CRC治療的生物標記的尋求。自從發(fā)現(xiàn)了癌胚抗原(“CEA”),對于有效用于CRC早期檢測的生物標記的尋求已經(jīng)持續(xù)了四十多年。它還對于在與CRC早期診斷檢測聯(lián)合應用的取樣方法成為最低程度侵入性或非侵入性是有利的。非侵入性和最低程度侵入性的取樣方法增加了患者的順應性,并且通常減少了成本。另外,用于分析生物分析典型的復雜的、多變量數(shù)據(jù)的生物信息學方法,其基于這樣的數(shù)據(jù)設定產(chǎn)生可靠的診斷評估,也是理想的。
對于許多類型癌癥諸如CRC、肺癌、前列腺癌和乳腺癌的治療干涉,包括手術、化學治療和放射治療、以及它們的組合。對于CRC,除了尋找早期檢測的非侵入性方法之外,繼續(xù)研究和開發(fā)的當前領域在藥物開發(fā)領域內。
通過十幾年的關于CRC的研究已經(jīng)清楚地顯現(xiàn)出這樣一副畫面,伴隨有效的治療干涉的早期檢測是增加存活率的關鍵。到目前為止,CRC治療中最常用的藥物是5-氟尿嘧啶(“5FU”),其通常與葉酸維生素、亞葉酸組合進行靜脈內施用。當轉移已經(jīng)發(fā)生,并且癌癥已經(jīng)擴散到機體的不同部分時,使用一種叫作初級化學治療的策略。對于CRC,初級化學治療的現(xiàn)有策略是施用口服形式的5FU、卡培他濱,其與下列各項組合鹽酸伊立替康和山梨醇注射劑,一種拓撲異構酶I抑制因子,或奧沙利鉑,一種抑制DNA合成的有機金屬的、含有鉑的藥物。
目前,對于CRC新藥開發(fā)的策略包括兩個研究領域血管生成抑制劑和信號傳導抑制劑。
新的生物藥物包括基于蛋白和核糖酶的治療劑?;谌嗽椿贵w的治療劑包括實例諸如Erbitux和Avastin。Erbitux,一種信號傳導抑制劑,目的是抑制癌細胞表面上的表皮生長因子受體(“EGFR”)。Avastin,一種血管生成抑制劑,目的是抑制已知促進血管生長的血管內皮生長因子(“VEGF”)。另外,血管酶(Angiozyme),一種基于核糖酶治療的實例,是針對VEGF-R1受體表達的血管生成抑制劑?;趥鹘y(tǒng)小分子的新藥包括實例諸如Iressa,其基于喹唑啉模板,并且作用為信號傳導抑制劑,和SU11248,其基于吲哚滿酮模板,作用為抗血管生成抑制劑。
對于這些CRC治療的新生藥物仍然存在許多潛在的缺點和不確定性。對于許多有希望的候選藥物,除了典型的禁忌征候,諸如反胃、嘔吐、頭痛和腹瀉,已經(jīng)觀察到其它更嚴重的副作用,諸如腸胃穿孔、升高或降低的血壓、極度疲勞和內出血。另外,盡管許多基于血管生產(chǎn)抑制或信號傳導抑制的藥物治療看起來是有希望的,但是它們處于臨床試驗的非常早期的階段。
因此,在本領域中存在對于生物標記和生物信息方法的需要,所述生物標記有效地早期檢測CRC,伴隨著最低程度或非侵入性的取樣方法,所述生物信息方法與生物標記一起為CRC的早期檢測產(chǎn)生強有力的診斷檢測。本領域中還存在對于藥物研發(fā)的需要,其可以在診斷患有病狀的患者的癌癥發(fā)展之前提供有效的治療,同時將嚴重的副作用最小化,所述病狀諸如癌癥,例如CRC、肺癌、前列腺癌和乳腺癌,以及神經(jīng)退行性疾病,例如阿爾茨海默病和ALS。
附圖簡述
圖1是列出本公開的發(fā)明的一組生物標記的序列表的實施方案。
圖2是用圖1生物標記組的一方面以及本公開發(fā)明的生物信息學評估的一方面評估的對照受試者相對測試受試者的分布曲線。
圖3顯示基因PPAR-γ、IL-8、SAA 1和COX-2的log(base2)表達值的分布和它們的截斷點。
圖4A和4B顯示不同基因的表達在患有結腸癌家族病史的個體的MNCM的不同位點改變。
圖5顯示用于評估數(shù)據(jù)的生物信息學方法的一方面的流程圖。
圖6是對于結腸黏膜細胞最低程度侵入性取樣的擦拭取樣(swabsampling)和轉運系統(tǒng)的實施方案。
圖7是描述藥物篩選內容一方面的流程圖。
圖8是描述藥物篩選內容另一方面的流程圖。
詳述到目前為止,通過腺瘤性結腸息肉(“APC”)、p53和Ki-ras基因,以及相應的蛋白,及其參與調控的相關途徑的研究,已經(jīng)獲得了對CRC生物學的更多的理解。然而,在對于具體的基因、其表達、蛋白產(chǎn)物和調控的研究,與理解什么基因是關鍵包含在用于CRC分析的組內的之間存在明顯的差異,所述用于CRC分析的組有效用于管理疾病患者的護理。對于CRC所建議的組包括APC、p53和Ki-ras以及微衛(wèi)星不穩(wěn)定標記基因BAT-26的特異性點突變。
對于CRC,很久以來就開始尋求用于危險評估和CRC早期檢測的生物標記。危險評估和早期檢測之間的差異是關于獲得性CRC確定性的程度。用于危險評估的生物標記在一時間間隔內賦予低于100%的CRC確定性,而用于早期檢測的生物標記在特定的時間間隔內賦予疾病發(fā)作的幾乎100%的確定性。危險因子可以用作未診斷患有癌癥的個體的替代終端(surogate endpoint),條件是在所述替代終端和確定的結果之間存在確定的關系。確定的CRC終端的實例是腺瘤性息肉的實例。已經(jīng)確定的是,對于后來發(fā)展CRC的個體,腺瘤性息肉的發(fā)生是必要非充分條件。這由這樣的事實證明,即,所有侵入前癌癥損傷的90%是腺瘤性息肉或先兆,但是不是所有具有腺瘤性息肉的個體后來都繼續(xù)發(fā)展成CRC。
腺瘤性息肉已經(jīng)被確定為CRC的替代終端,并且腺瘤性息肉是通過結腸鏡檢或乙狀結腸鏡肉眼可確認的。在這樣的侵入性方法中,組織活檢樣品可以取自用于組織的組織學評估的息肉或損傷。本文公開的分子診斷方法用于大體上看起來正常的結腸黏膜細胞,其不是來自肉眼可確定的息肉或損傷。然而,正如在本文中進一步公開的那樣,侵入性方法不必用來獲得患者樣品用于組織學評估。非侵入性或最低程度侵入性方法可以用來獲得,例如,血液樣品、糞便樣品、或大體上看起來正常的直腸細胞的擦拭取樣,在這些樣品上可以進行分子診斷檢測以評估CRC的存在或不存在。對于CRC早期檢測的早先描述的方法沒有公開大體上看起來正常的結腸黏膜細胞(直腸細胞的組織活檢或擦拭取樣)、血液樣品和/或糞便樣品的非侵入性或最低程度侵入性的收集,之后進行分子和/或蛋白表達診斷檢測,其可以在表明CRC是顯而易見的任何不利組織學變化之前檢測到組織中的變化。
圖1是給出本公開內容中包含的序列表概述的表格。圖1的表格列出實施本公開發(fā)明所用的一組生物標記。生物標記組的一個實施方案是由SEQ.ID NOs 1-16給出的16個確定的編碼序列,而生物標記組的另一個實施方案是由SEQ.ID NOs 17-32給出的16個確定的蛋白序列。這兩個實施方案代表為CRC早期檢測提供必要的選擇性和靈敏性的分子標記組。應該理解,所述序列表中所述的生物標記的片段和變體也是用于CRC早期檢測的實施方案組中的有效生物標記。片段意指在序列表中的多聚核苷酸或多肽的任何不完整或分離的片段。此外,應該認識到,幾乎每天都要宣布關于基因變體,特別是處于熱點研究中的那些基因,諸如參與疾病如癌癥的基因的新發(fā)現(xiàn)。因此,給出的序列表對于現(xiàn)在報道的基因是示例性的,但是應該認識到,出于分析方法學目的,基因的變體及它們的片段也包含在內。
在圖1中,表格中第1-16項是生物標記組的一方面,其為多聚核苷酸編碼序列,并且包括基因的命名和縮寫。圖1的第17-32項是生物標記組的另一個實施方案,其為與第1-16項的編碼序列相對應的蛋白或多肽、氨基酸序列。由國家衛(wèi)生研究院(National Institutes of Health(“NIH”))定義的生物標記是具體的生物特征的分子指示劑;可以用來測定疾病進展或治療效果的生物化學特征或方面。生物標記組是生物標記的選擇,其綜合在一起可以用來測定疾病進展或治療效果。生物標記可以是各種種類的分子。如先前所提到的,存在對于具有有效用于CRC早期檢測所需的選擇性和靈敏性的CRC生物標記的需求。因此,本文所公開的一個實施方案是選擇一套在提供CRC早期檢測根據(jù)中區(qū)分的有效的生物標記。
在本公開內容的一方面,對于CRC的早期檢測,從通過非侵入性或最低程度侵入性方法取自患者的樣品的細胞而確定由SEQ.ID NOs 1-16顯示的多聚核苷酸的表達水平。考慮的方法包括血液取樣、糞便取樣和直腸細胞擦拭取樣或活組織檢查。在本領域內,多聚核苷酸表達水平的這樣的分析通常叫作基因表達分布作圖。對于基因表達分布作圖,測定樣品中mRNA水平作為生物狀態(tài)的主要指示因子——在這一情形中,作為CRC的指示因子。對于分析基因表達分布作圖的一種最常見的方法是,使用已知為反轉錄的方法從生物樣品(所述樣品通過非-或者最低程度侵入性方法取自上文公開的患者)的mRNA產(chǎn)生多個拷貝。在反轉錄方法中,通過本領域公知的方法,將樣品的mRNA從生物樣品細胞分離。然后,將所述mRNA用于產(chǎn)生mRNA最初從其轉錄的對應的DNA序列拷貝。在反轉錄擴增過程中,產(chǎn)生的DNA拷貝在基因中沒有調控區(qū)(即,內含子)。因此,這些由mRNA制成的多個拷貝叫作“cDNA”,其代表互補的或復制的DNA。第33-64項是成套的引物,其可以用于在第1-16項列出的每種生物標記的反轉錄過程。SEQ.ID NOs 1-64中確定的所有核苷酸和氨基酸生物標記序列可以在附上的打印輸出中找到,并且包括本申請的主旨,并且可以在磁盤上找到,所述磁盤作為本申請的一部分包含于此并且通過參考結合于此。
由于反轉錄方法與樣品中初始mRNA水平成比例地擴增cDNA拷貝,它已經(jīng)成為允許鑒定并且量化生物樣品中存在的即使低水平的mRNA的標準方法。在任何具體的生物狀態(tài),基因可以被增量調控或減量調控,并且因此mRNA水平據(jù)此轉變。
在本公開內容的一方面,基因表達分布作圖的方法包括,在通過非-或最低程度-侵入性方法,諸如血液取樣、糞便取樣、直腸細胞擦拭取樣、和/或直腸細胞組織活檢而從患者采取的生物樣品中,選自SEQ.ID NOs.1-16的生物標記組的至少2種生物標記的cDNA水平的定量測量。采取的組織不必是明顯患病的;實際上,本公開的發(fā)明考慮用于評估即使大體上看起來正常(grossly normal-appearing)的細胞而進行CRC檢測。這樣的基因表達分布作圖方法需要使用引物、酶和用于cDNAs制備、檢測和定量的其它試劑。從樣品mRNA產(chǎn)生cDNA的方法叫作反轉錄酶聚合酶鏈式反應(“RT-PCR”)。SEQ.ID NOs 33-64列出的引物特別適用于基于生物標記組中公開的生物標記應用RT-PCR進行基因表達分布作圖。應用Primer Express Software(Applied Biosystems,F(xiàn)oster City,CA)設計了一系列引物。選擇特殊的候選,然后檢測證實只有cDNA得到擴增而沒有受到基因組DNA的污染。據(jù)此,特別設計、選擇并且檢測了SEQ.ID NOs 33-64列出的引物。
在后來從分離的細胞RNA產(chǎn)生cDNA的步驟中,SEQ.ID NOs 33-64列出的引物是重要的,用于在實時PCR中定量地擴增目的基因表達產(chǎn)物的拷貝。最理想的引物序列和最理想的引物長度是引物設計的主要考慮。最理想的引物序列可以影響引物與模板結合的特異性和靈敏性。認為18-30個堿基的引物長度是最理想的范圍。理論上,18個堿基是代表獨特序列的最短長度,其在大多數(shù)真核基因組中將在唯一一個位置雜交。SEQ.ID NOs 33-64列出的引物在引物長度上在21-27個堿基范圍,并且設計和有效用來擴增選自SEQ.ID NOs 1-16的核苷酸組的cDNA。引物的特異性通過在10%聚丙烯酰胺凝膠電泳(“PAGE”)上的單一產(chǎn)物,和PCR產(chǎn)物的單一解離曲線而證明。
一旦引物已經(jīng)設計,并且驗證了特異性,它們可以大量合成,并且保存以便方便地用于將來應用。由于PCR反應對緩沖液濃度和緩沖液組成敏感,所以引物應該保持在不干擾擴增反應的適宜的稀釋劑中。適宜的稀釋劑的一個實例是10mM Tris緩沖液,有或無1mM EDTA,這取決于對于EDTA的檢測靈敏性。備選地,用于引物的另一適宜的稀釋劑的實例是沒有核酸酶的去離子水。引物可以等分在適當?shù)娜萜髦校T如硅化管中,并且如果需要的話將其凍干。液體或凍干的樣品優(yōu)選地保存在定義為生物樣品長期保存的冷藏溫度,在約-20℃到約-70℃。擴增反應中引物的濃度典型地在0.1-0.5mM。從儲液到最終反應混合物的典型的稀釋因子約10倍,以便等分的引物儲液典型地在約1和5mM之間。
除了SEQ.ID Nos.33-64列出的特別設計的引物外,對于RT-PCR還需要下列試劑,例如含有二核苷酸三磷酸混合物的試劑,其具有全部4種二核苷酸三磷酸(例如,dATP,dGTP,dCTP和dTTP),具有反轉錄酶的試劑,和具有熱穩(wěn)定性DNA聚合酶的試劑。另外,對于RT-PCR過程還需要緩沖液、抑制劑和激活劑。
圖2描述用于CRC早期檢測的生物信息學數(shù)據(jù)減少方法的一方面,其顯示17名對照(左)的Mahalanobis距離分布,其與14名具有CRC家族病史的個體(中)和24名患有息肉的個體(右)相比較。使用選自SEQ.ID NOs.1-16的多聚核苷酸的生物標記組,評估從大體上看起來正常的結腸黏膜組織采取的組織樣品。對于每一對照和檢測受試者,關于由選自SEQ.ID NOs 1-16的多聚核苷酸代表的16種基因的每一種的基因表達水平的平均數(shù)在log base 2域計算。然后,基于多變量的正態(tài)分布,為對照確定16維空間的多變量平均數(shù),以確定正常表達水平的界限。對于每一對照,測定其它16個對照的多變量平均數(shù)的Mahalanobis距離(“M-dist”),而對17個對照的多變量平均數(shù)確定每一名檢測受試者的M-dist。在圖2顯示的每一組中,來自單一個體的所有組織活檢形成垂直的一排。對于患有息肉的個體,星號標記來自患有增生性息肉的個體的組織活檢。水平線表示具有16自由度的-卡方分布的95%ile。在這一線上的所有值(對應約25的M-dist)在p<0.05水平上不同于對照的平均值。所述數(shù)據(jù)清楚地表明,在檢測受試者的大體正常的結腸黏膜組織樣品中存在改變的基因表達模式。因此,所述數(shù)據(jù)證明使用選自SEQ.ID NOs.1-16的多聚核苷酸的生物標記組的診斷檢測的增強的靈敏性和選擇性。
圖3顯示使用選自SEQ.ID Nos.1-16的多聚核苷酸的表達分布作圖用于評估所分析的樣品數(shù)據(jù)的生物信息學方法的一方面的流程圖300。使用選自SEQ.ID Nos.1-16的多聚核苷酸組,用于分析分子診斷檢測的基因表達數(shù)據(jù)的生物信息學分析的目的是使用異常(abnormality)的單一的、易于計算的測定。由于綜合看來多變量分析確定所有表達水平變化的顯著性,所以需要通過多變量分析對選自SEQ.ID NOs 1-16全體的所有基因的表達模式進行分析。存在一些種類的多變量檢測,其可以有效用于生物信息學分析,所述生物信息學分析用于評估使用本文公開的分子診斷檢測而檢測的患者樣品中結腸直腸癌的存在或不存在。用于評估使用選自SEQ.ID NOs 1-16的多聚核苷酸生物標記組而檢測的患者樣品數(shù)據(jù)的多變量分析的實例包括ANOVA和Mahalanobis距離(“M-Dist”)檢測。
ANOVA是解釋表達水平間的相互關系的通用檢測。對于多變量ANOVA檢測有必要基于Wilks′λ標準,并且在使用選自SEQ.ID NOs 1-16的多聚核苷酸組進行分子診斷檢測獲得的數(shù)據(jù)的log(base 2)值上進行,以獲得值的正態(tài)分布。
M-dist分析是多變量分析的另一實例,考慮到每種基因表達的可變性和基因對之間的相關性,其以單一數(shù)字總結了兩種基因表達模式之間的不同。M-dist通常以多元數(shù)據(jù)用作局外人(顯著不同于組中所有其它個體病例的個體病例)的檢測。M-dist可以通過參考具有等于變量(即,基因)數(shù)目的自由度的-卡方分布而轉換成p-值。然而,為了避免對于假定的多變量常態(tài)的依賴性,需要使用秩和檢驗,Mann-Whitney檢驗,比較個體病例(即,患有息肉的那些)和對照的M-dist。通過使用Mann-Whitney分析,關于表達模式的差異的推論不依賴于多變量常態(tài)的假設。因此,這一方法允許綜合起來的所有試驗受試者表達水平的顯著性的確定,以及每個個體表達值的顯著性的確定。
下文提供了上述公開內容的一個工作實例。Hao,C-Y,等.,Alterationof Gene Expression in Macroscopically Normal Colonic Mucosa fromIndividuals with a Family History of Sporadic Colon Cancer,11 Clin.CancerRes.,1400-07(Feb.15,2005)。提供所述實例作為本領域普通技能的實踐者的進一步指導,并且不能以任何方式解釋為本發(fā)明的限制。
采用這一實例研究,在沒有發(fā)展結腸癌但是由于CRC家族病史而處于患有結腸癌的高危險中的個體的形態(tài)正常的結腸黏膜(“MNCM”)中,一些基因的表達是否改變。
人受試者在訪問California Pacific Medical Center(“CPMC”)的個體的常規(guī)結腸鏡檢時,進行直腸和乙狀結腸的MNCM組織活檢,所述個體沒有結腸癌病史或先前的結腸癌,并且在檢查時沒有腺瘤性息肉、結腸癌或其它結腸性損傷。本研究包括了12名在第一級親屬中具有結腸癌家族病史的個體(表3)和16名沒有已知結腸癌家族病史的個體。盡管家族癌癥病史的信息通過患者的自我報告獲得而沒有從醫(yī)院癌癥登記處得到證實,但是,最近的研究已經(jīng)證實了關于結腸癌的自我報告家族病史的準確性。在具有結腸癌家族病史的12名個體中,2名是母女(表3中的病例#6和7),2名是姐弟(病例#11和12),其余的是不相關的。在具有結腸癌家族病史的組中,研究的受試者年齡在18-64歲范圍,對照組在16-83歲(16歲的受試者由于慢性腹痛已經(jīng)進行了結腸鏡檢)。獲得研究的正常組織活檢樣品的研究流程得到CPMC Institutional Review Board的認可。對于所有的研究受試者進行獲得被告知內容的適當?shù)姆椒ā?br>
RNA和cDNA的提取和制備將從盲腸和肝彎曲部之間的結腸片段獲得的組織活檢樣品分類為升結腸樣品;從肝彎曲部和脾彎曲部之間的結腸片段獲得的那些樣品分類為橫結腸樣品;從低于脾彎曲部的結腸片段獲得的那些樣品分類為降結腸;從低于降結腸的結腸蜿蜒部分獲得的那些樣品分類為直腸乙狀結腸樣品(從直腸約5-25cm)。從每個患者獲得的組織活檢樣品數(shù)目不同。除了從家族病史組的一名受試者的橫結腸片段和降結腸片段只獲得1份樣品外,從每個結腸片段獲得2-8份組織活檢樣品。從12名具有結腸癌家族病史的個體中總共獲得39份升結腸樣品、37份橫結腸樣品、45份降結腸樣品和77份直腸乙狀結腸樣品;從16名沒有結腸癌家族病史的個體總共獲得53份升結腸樣品、48份橫結腸樣品、49份降結腸樣品和104份直腸乙狀結腸樣品。將所有的組織活檢樣品在干冰上速凍,并且立即拿到實驗室進行所述RNA制備和反轉錄。
基因表達分析通過定量RT-PCR分析下列各項的表達水平癌基因c-myc,CD44抗原(“CD44”),環(huán)加氧酶1和2(“COX-1”和“COX-2”),cyclin D1,cyclin-依賴型激酶抑制因子(“p21cip/waf1”),白介素8(“IL-8”),白介素8受體(“CXCR2”),骨橋蛋白(“OPN”),黑素瘤生長刺激活性(“Groα/MGSA”),GRO3癌基因(“Groγ”),巨噬細胞集落刺激因子1(“MCSF-1”),過氧化物增殖性激活受體,α,δ和γ(“PPAR-α,δ和γ”)和血清淀粉樣A1(“SAA1”)。進行定量RT-PCR。簡要地,當積累的PCR產(chǎn)品超過任意定的閾值時,記錄循環(huán)數(shù)(“CT值”)。為了使這一值標準化,將ΔCT值確定為檢測的每種基因的CT值和β-肌動蛋白的CT值之間的差別。計算對照組中每種基因的平均ΔCT值。將ΔΔCT值確定為每份個體樣品的ΔCT值和從對照樣品獲得的這一基因的平均ΔCT值之間的差別。然后,按所述那樣,將這些ΔΔCT值用來計算相對基因表達值。(Applied Biosystems,User Bulletin #2,December 11,1997)。當可以得到cDNA樣品時,所有的PCR一式兩份進行。還應用組氨酰-tRNA合成酶作為內部對照而驗證所述結果。應用β-肌動蛋白或his-tRNA合成酶作為參照,相對基因表達值產(chǎn)生相似的結果。這里應用β-肌動蛋白作為標準化對照獲得統(tǒng)計學分析。
統(tǒng)計學分析在具有結腸癌家族病史的個體和沒有結腸癌家族病史的對照組受試者之間比較基因表達模式。不是獨立地檢驗每種基因的表達和通過減少統(tǒng)計指數(shù)(statistical power)的方法調整多重比較,我們通過具有Wilks′λ標準的差異多變量分析(“MANOVA”)而檢驗所有基因的表達模式。這一檢測是用于差異單變量分析的F-檢驗的多變量類似物,其檢驗平均值的等同性。這種類型的分析考慮了基因表達水平間的相互關系,并且通過基于子集中的所有基因提供表達模式是否在組與組之間不同的單一檢驗而控制假陽性率。
通過存在表達模式在組與組之間不同的證據(jù),那么我們應用單一變量t-檢驗來確定哪些基因對綜合差異起作用。由于完成正態(tài)分布需要這一轉化,所以,所有的MANOVA檢驗基于Wilks′λ標準,并且在表達水平的log(base 2)上進行。我們的數(shù)據(jù)由每組(家族病史對沒有家族病史)不同數(shù)目個體的每名受試者的不同數(shù)目的樣品組成。分析包括關于組內個體的和關于個體內樣品的隨機effects terms,以說明取樣方案。如果Yijk表示第i組的第j名患者的第k份樣品的log2基因表達值,那么統(tǒng)計學模型通過下列方程數(shù)學表示Yijk=M+Ai+Bij+eijk,其中Ai是(固定的)組effect,Bij是(隨機的)患者effect,和eijk是患者effect內的(隨機)樣品。
通過用值1定義來自升結腸的樣品的變量,值2定義來自橫結腸的樣品的變量,值3定義來自降結腸的樣品的變量,和值4定義來自結腸的直腸乙狀結腸部分的樣品的變量,我們還檢測了微分式的數(shù)量級(在式上或式下)是否從升結腸部分到直腸沿著結腸增加。將這一變量添加到模型中,以便可以應用單一變量ANOVA檢測到它對某些基因的影響。
截斷點的定義將來自對照組所有組織活檢樣品的表達水平的log(base 2)用來計算每種基因增量調控或減量調控的截斷點。正態(tài)分布的公差限度表用來定義截斷點,以致對于增量調控的基因,不大于P的分布部分將高于截斷點,或者對于減量調控的基因低于截斷點。通過截斷點=平均值+k(SD)定義每個截斷點,其中平均值和SD(標準偏差)基于對照組的值。k值在表中找到,并且取決于P值和正常樣品的數(shù)目。Owen,D.B.,Noncentral t andtolerance limits,in Brimbauim ZW,ed.Handbook of Statistical Tables,Reading,MAAddison-Wesley,1962,108-127。假定每種基因表達水平的高斯分布,人們可以預計少于1%的來自正常群體的活組織切片具有超過99%公差極限(p=0.01)的表達水平。
為了計算在每種情形中高出99%ile觀察到的樣品數(shù)目是由于偶然性的可能性,我們應用二項式分布法,p=0.01和n=每種情形樣品數(shù)目乘以檢測的基因數(shù)目。例如,對于病例#1(表3),我們具有2份樣品;二者都表現(xiàn)出PPAR-γ和SAA1的異常表達,二者之一對于PPAR-δ表達異常,并且沒有一個對于IL-8和COX-2是異常的。因此,對于這一病例,10份檢測的樣品中有5份超過上限0.01。這是偶然發(fā)生的可能性是2.4×10-8。通用公式給出如下Pr{x≥k|p,n}=Σi=k5n(0.01)i(0.99)5n-i,]]>其中k是超過99%ile的數(shù)目和n是樣品數(shù)目(檢測的基因數(shù)目是5)。
結果在具有結腸癌家族病史的個體的直腸乙狀結腸黏膜中的改變的基因表達
12名個體(10名女性和2名男性)組成具有結腸癌家族病史的組;16名個體(9名女性和7名男性)作為對照組。(表1)對于16種基因的表達水平,我們總共分析了92份升結腸樣品,85份橫結腸樣品,94份降結腸組織活檢樣品和181份直腸乙狀結腸組織活檢樣品。已知這些基因的表達水平在人結腸癌晚期改變。我們還證明這些基因中的一些在結腸癌患者的手術切除的MNCM中改變。
繼續(xù)參考表1,結果代表來自沒有家族病史的16名個體的104份組織活檢樣品的分析,和來自具有結腸癌家族病史的第一級親屬的12名個體的77份組織活檢樣品的分析。按照方法中所述分析樣品的基因表達。表中的數(shù)字代表相對于對照組平均MCT的表達水平。如果在個體間沒有變化,對照組的正?;虮磉_水平應該等于1。應用Wilksλ標準的多變量分析在16種基因的log2表達值上進行,以確定兩組之間的差異顯著性。從最小到最大的P值將基因列出。
所有16種基因表達值的多變量分析表明,在來自具有和沒有散發(fā)性結腸癌的那些患者的直腸乙狀結腸區(qū)域的組織活檢樣品的顯著差異(p=0.01)。在這兩組個體之間,在來自降結腸、升結腸和橫結腸的組織活檢樣品的基因表達沒有顯著地不同(分別地,p=0.06,0.22和0.52)。直腸乙狀結腸組織活檢樣品的大部分差異僅由這些基因的5種(表1)提供PPAR-γ,SAA1,IL-8,COX-2和PPAR-δ。與癌癥患者的MNCM中基因表達的改變相似,我們發(fā)現(xiàn),在具有散發(fā)性結腸癌家族病史的個體的MNCM中,SAA1、IL-8和COX-2的表達水平得到增量調控,和PPAR-γ與PPAR-δ的表達水平得到減量調控。
大概是由于在具有結腸癌家族病史的組中需要早期進行結腸鏡檢的增強的意識,家族病史組的平均(±SD)年齡(45±12歲)比對照組的(56±16歲)年輕。另外,在這兩組之間存在性別差異(在具有家族病史組中10名女性和2名男性,相對于在對照組中的9名女性和7名男性)。然而,我們發(fā)現(xiàn)性別沒有影響基因表達水平(p=0.67)。并且,除了PPAR-δ0.01,在年齡和SAA1、IL-8、COX2和PPAR-γ的表達水平(所有的p>0.05)之間沒有相關性。然而,PPAR-δ的異常表達(減量調控)隨著年齡增加。因此,在年輕的家族病史組和年老的對照之間的比較將傾向于在家族病史組中發(fā)現(xiàn)更少的而不是更多的異常表達。換句話說,我們可能低估PPAR-δ在家族病史組中的改變的表達的發(fā)生率。
表1.與對照相比,在來自具有結腸癌家族病史的個體的正常直腸乙狀結腸組織活檢樣品中的基因表達水平
對于“正?!被虮磉_的截斷點比較直腸乙狀結腸樣品中的相對基因表達水平在個體間不同,在從具有結腸癌家族病史的個體獲得的樣品中比來自對照的對應值多得多(表1)。因此,通過計算每種基因的截斷點(p=0.01),我們應用對照組的每種基因的表達水平來定義每種基因的“正常”表達水平。圖3顯示基因PPAR-γ,IL-8,SAA1和COX-2的log(base2)表達值的分布以及它們的截斷點。如預計那樣,少于1%的來自對照組的組織活檢樣品具有高于或低于截斷線的這些基因的表達(p=0.01,圖3)。然而,21%,12%和8%的來自家族病史組的組織活檢樣品分別具有高于截斷點的SAA1、IL-8和COX-2的表達,并且12%的所述樣品具有低于截斷點的PPAR-γ表達(表2)。
表2.在正常個體和具有結腸癌家族病史的個體中,具有高于/低于截斷點的基因表達的組織活檢樣品數(shù)目(N)
具有低于截斷點的基因表達水平*具有高于截斷點的基因表達水平具有改變的患者數(shù)目在表3中列出。
然后,我們分析了家族病史組中的每一個體(表3)。顯示了表現(xiàn)出低于(對于PPAR-γ和δ)或者高于(對于IL-8、SAA1和COX-2)截斷點的表達水平的組織活檢樣品數(shù)目。所有組織活檢樣品都表現(xiàn)出在正常范圍內的表達水平的個體用(-)符號表示。在本研究中患有結腸癌的所有祖父母都是母方。當結腸癌得以診斷時家族成員的年齡表示如下***表示結腸癌在50歲之前得到診斷;**表示在60歲之前;和*表示在60歲后。當結腸癌得以診斷時其余家族成員的年齡不可獲得。除了病例#10的患者父親在20世紀70年代患肺癌之外,家族病史組中的12名患者沒有一名在家族中報道其它類型的癌癥。
如在表3中表示的,對于5種最常改變的基因,具有結腸癌家族病史的12名個體中的9名具有至少一種表達水平低于或者高于截斷點的組織活檢樣品。2名個體(病例#1和2)在顯然正常的直腸乙狀結腸黏膜中具有3種這樣的基因的改變的表達。相反,對照組16名個體中只有1名具有這5種基因中的一種的改變的表達(參見表2)。設定截斷值,以便1%的表達將是假陽性。然而,從每個個體獲得的組織獲獎樣品數(shù)目是不同的。為了調整樣品數(shù)目,對于每一病例,我們還計算了在高于99%ile外觀察到的樣品數(shù)目是由于偶然性引起的可能性。這一計算是基于二項式分布。如表3中所示,在12名家族病史組個體中的7名中觀察到的改變的基因表達不可能是由于偶然性引起(p<0.01)。在這7個病例中,5種基因至少2種的表達被改變。另外,在分析的16種基因中,PPAR-γ和SAA1是在具有結腸癌家族病史的12名個體的5名中發(fā)生的最常改變的基因(表3)。
表3.PPAR-γ,IL-8,SAA1,COX-2和PPAR-δ在具有結腸癌家族病史的個體的直腸乙狀結腸組織活檢樣品中表達的總結
不同基因的表達在具有結腸癌家族病史的個體的MNCM的不同位點而改變。
家族病史組個體病例的分析表明,不同的基因在不同受試者的直腸乙狀結腸組織活檢樣品中改變。例如,在病例#3中SAA1和PPAR-γ被改變,在病例#4中IL-8和SAA1被改變;而在病例#8中COX-2和IL-8而不是SAA1被改變(圖4A)。另外,一些基因在同一患者的所有直腸乙狀結腸組織活檢樣品中被改變(諸如病例#4中的SAA和病例#8中的IL-8),而有些只在一些這樣的組織活檢樣品中改變(即,病例#3中的SAA1和PPAR-γ,病例#4中的IL-8和病例#8中的COX-2)。另外,一些這樣的改變局限于直腸乙狀結腸區(qū)域,諸如病例#4中的IL-8;而一些可以擴展到結腸的其它區(qū)域,諸如病例#4中的SAA1(圖4B)。
我們還觀察到,對于PPAR-γ(p=0.001傾向)和SAA1(p<0.001),而不是對于IL-8(p=0.20)、COX2(p=0.58)、也不是PPAR-δ(p=0.54),兩組個體之間的基因表達的差異隨著結腸的長度而增加。這些結果表明,在兩組個體之間從升結腸到直腸部分沿著結腸存在增加的異常性,盡管在本研究中向升結腸部分的樣品數(shù)目減少了,其仍可以被檢測到。
從前述實例中,可以得出下述結論。大約5-10%的結腸直腸癌發(fā)生在患有2種常染色體顯性遺傳形式的結腸癌(家族性腺瘤性息肉病和遺傳性非息肉結腸直腸癌)的一種的患者中,或者發(fā)生在患有炎性腸病的患者中(Burt R.,Peterson G.M.InYoung G.,Rozen,P.& Levin,B.Saunders,ed.inPrevention and Early Detection of Colorectal Cancer,Philadelphia,171-194(1996))。其余的結腸癌中,大約20%與結腸癌家族病史有關,結腸癌家族病史與發(fā)展結腸癌的2倍增加的危險相關(Smith R.A.,von EschenbachA.C.,Wender R.,等.,American Cancer Society guidelines for the earlydetection of cancerupdate of early detection guidelines for prostate,colorectal,and endometrial cancers,and Update 2001--testing for early lungcancer detection,51 CA Cancer J Clin.38-75;quiz 77-80(2001))。盡管在家族性結腸直腸癌患者子集中已經(jīng)報道了染色體15q13-14和9q22.2-31.2的連鎖(Wiesner G.L.,Daley D.,Lewis S.,等.,A subset of familial colorectalneoplasia kindreds linked to chromosome 9g 22.2-31.2,100 Proc Natl Acad SciUSA,12961-5(2003)),但是大多數(shù)這些病例的遺傳基礎是未知的。在本研究中,我們已經(jīng)證明了PPAR-γ、IL-8和SAA1在具有散發(fā)性結腸癌家族病史的患者的直腸乙狀結腸MNCM中表達的本質改變,即使這些個體并沒有可檢測到的結腸異常。我們早先的研究表明,除了PPAR-γ、IL-8和SAA1之外,當與沒有結腸癌、息肉和家族病史的正常個體相比時,在結腸癌患者的MNCM中,PPAR-δ、p21、OPN、COX-2、CXCR2、MCSF-1和CD44的表達也顯著地改變了。這些觀察表明,MNCM中與癌癥發(fā)展相關的基因的改變的表達可能是一種結果性事件,并且可能比明顯的形態(tài)學異常的出現(xiàn)發(fā)生地更早。例如,PPAR-γ、SAA1和IL-8的改變的表達可能發(fā)生在還沒有發(fā)展結腸癌但是處于發(fā)展結腸癌的高對危險中的個體的MNCM中;而其它基因諸如PPAR-δ、p21、OPN、COX-2、CXCR2、MCSF-1和CD44的改變的表達,可能晚一些時候發(fā)生在已經(jīng)發(fā)展了結腸癌的個體的MNCM中(Chen L-C,Hao C-Y,Chiu Y.S.Y.,等.,Alteration ofGene Expression in Normal Appearing Colon Mucosa of APCmin Mice andHuman Cancer Patients,64 Cancer Research 3694-3700(2004))。
已經(jīng)在一些腫瘤的肉眼可見的正常組織中報道了遺傳和后生的改變(Tycko B.,Genetic and epigenetic mosaicism in cancer precursor tissues,983Ann N Y Acad Sci.,43-54(2003))。例如,等位基因丟失已經(jīng)在鄰近初級乳腺癌的正常乳腺末端導管小葉中得到了證明。(Deng G.,Lu Y.,Zlotnikov G.,Thor A.D.,Smith H.S.,Loss of heterozygosity in normal tissue adjacent tobreast carcinomas,274 Science,2057-9(1996))。這樣的等位基因丟失與局部復發(fā)的增加的危險性相關(Li Z.,Moore D.H.,Meng Z.H.,Ljung B.M.,Gray J.W.,Dairkee S.H.,Increased risk of local recurrence is associated withallelic loss in normal lobules of breast cancer patients,62 Cancer Res.,1000-3(2002))。另外,患有前結腸癌(prior colon cancer)個體的看起來正常的結腸黏膜細胞比沒有患有前結腸癌的個體的黏膜細胞更能抵抗膽酸誘導的細胞程序性死亡(Bernstein C.,Bernstein H.,Garewal H.,等.,A bileacid-induced apoptosis assay for colon cancer risk and associated qualitycontrol studies,59 Cancer Res.,2353-7(1999);和Bedi A.,Pasricha P.J.,Akhtar A.J.,等.,Inhibition of apoptosis during development of colorectalcancer.,55 Cancer Res.,1811-6(1995))。由于在結腸上皮細胞中細胞程序性死亡對于去除具有未修復的DNA損傷的細胞是重要的(Payne C.M.,Bernstein H.,Bernstein C.,Garewal H.,Role of apoptosis in biology andpathologyresistance to apoptosis in colon carcinogenesis,19 UltrastructPathol.,221-48(1995)),程序性細胞死亡的減少可能導致DNA-損傷細胞的滯留,并且增加致癌突變的危險。
在一些癌癥中PPAR-γ受到減量調控。PPAR-γ的配體抑制細胞生長并且誘導細胞分化(Kitamura S.,Miyazaki Y.,Shinomura Y.,Kondo S.,Kanayama S.,Matsuzawa Y.,Peroxisome proliferator-activated receptorgamma induces growth arrest and differentiation markers of human coloncancer cells,90 Jpn J Cancer Res 75-80(1999)),并且在人結腸癌中已經(jīng)報道了PPAR-γ失去功能的突變(Sarraf P.,Mueller E.,Smith W.M.,等.,Loss-of-function mutations in PPAR gamma associated with human coloncancer,3 Mol.Cell,799-804(1999))。因此,我們觀察到的PPAR-γ在MNCM中表達的減量調控可能代表促進結腸上皮細胞生長和抑制細胞分化的早期事件。另外,PPAR-γ還負調控炎性應答(Welch J.S.,Ricote M.,AkiyamaT.E.,Gonzalez F.J.,Glass C.K.,PPAR gamma and PPAR delta negativelyregulate specific subsets of lipopolysaccharide and IFN-gamma target genesin macrophages,100 Proc Natl Acad Sci USA 6712-7(2003))。炎癥通過刺激血管生成和細胞增殖而有利于腫瘤發(fā)生(Nakajima N.,Kuwayama H.,ItoY.,Iwasaki A.,Arakawa Y.,Helicobacter pylori,neutrophils,interleukins,andgastric epithelial proliferation,25 Suppl.1 J Clin Gastroenterol.,98-202(1997))。類似地,IL-8和急性期蛋白SAAl調控炎癥過程(Dhawan P.,Richmond A.,Role of CXCL 1 in tumorigenesis of melanoma,72 J LeukocBiol.,9-18(2002);和Urieli-Shoval S.,Linke R.P.,Matzner Y.,Expressionand function of serum amyloid A,a major acute-phase protein,in normal anddisease states,7 Curr Opin Hematol.,64-9(2000))。在患有炎性腸病個體的結腸黏膜中(Niederau C.,Backmerhoff F.,Schumacher B.,Inflammatorymediators and acute phase proteins in patients with Crohn′s disease andulcerative colitis,44 Hepatogastroenterology,90-107(1997);和KeshavarzianA.,F(xiàn)usunyan R.D.,Jacyno M.,Winship D.,MacDermott R.P.,Sanderson I.R.,Increased interleukin-8(IL-8)in rectal dialysate from patients with ulcerativecolitisevidence for a biological role for IL-8 in inflammation of the colon,94Am J Gastroenterol.,704-12(1999)),在處于發(fā)展結腸癌的高度危險中的個體的結腸黏膜中(Bachwich D.R.,Lichtenstein G.R.,Traber P.G.,Cancer ininflammatory bowel disease,78 Med Clin North Am.,1399-412(1994)),已經(jīng)報道了促炎細胞因子和急性期蛋白的增量調控。流行病學觀察還表明,慢性炎癥預先傾向于結腸直腸癌(Rhodes J.M.,Campbell B.J.,Inflammationand colorectal cancerIBD-associated and sporadic cancer compared,8Trends Mol Med.,10-6(2002);和Farrell R.J.,Peppercorn M.A.,Ulcerativecolitis,359 Lancet 331-40(2002))。因此,在具有散發(fā)性結腸癌家族病史個體和在患有炎性腸病的個體的正常黏膜中觀察到的PPAR-γ的減量調控和IL-8與SAA1的增量調控,可能表明常規(guī)途徑參與引起這2組的結腸腫瘤發(fā)生。
我們在具有結腸癌家族病史的一些個體的正常結腸黏膜中觀察到的與癌癥和炎癥相關基因的改變表達,與最近的報道一致,最近的報道與在發(fā)展結腸癌前升高的血清C-活性蛋白(“CRP”)濃度相關(Erlinger T.P.,PlatzE.A.,Rifai N.,Helzlsouer K.J.,C-reactive protein and the risk of incidentcolorectal cancer.,291 JAMA,585-90(2004))。這些發(fā)現(xiàn)表明,在平均危險性個體(id.)中,炎癥是發(fā)展結腸癌的危險因素。然而,CRP是炎癥的非特異性標記,期可能指示在除結腸之外的組織中的炎癥。在我們的研究中,我們分析了結腸癌發(fā)生的組織,并且將更加特異性地評估發(fā)展結腸癌的危險。
我們不知道哪種細胞型負責觀察到的改變的基因表達。在結腸黏膜中存在許多細胞類型,包括一些類型的黏膜上皮細胞、基質細胞和血源性細胞。我們組和其他組的研究已經(jīng)證明COX-2蛋白在MNCM中的增量調控主要位于滲透性巨噬細胞和次要地位于APCmin小鼠MNCM中異常隱窩病灶中的上皮細胞(Chen L-C,Hao C-Y,Chiu Y.S.Y.,等.,Alteration of GeneExpression in Normal Appearing Colon Mucosa of APCminMice and HumanCancer Patients,64 Cancer Research 3694-3700(2004);和Hull M.A.,BoothJ.K.,Tisbury A.,等.,Cyclooxygenase 2 is up-regulated and localized tomacrophages in the intestine of Min mice,79 Br J Cancer,1399-405(1999))。從我們關于APCmin小鼠MNCM的早期研究中,可能由于分泌蛋白,諸如IL-8和SAA1,在組織切片上很快就消失(Chen L-C,Hao C-Y,Chiu Y.S.Y.,等.,Alteration of Gene Expression in Normal Appearing Colon Mucosa ofAPCminMice and Human Cancer Patients,64 Cancer Research 3694-3700(2004)),我們發(fā)現(xiàn)通過免疫組織化學染色檢測在MNCM中增量-或減量-調控的基因產(chǎn)物是有技術難度的。由于有限數(shù)量的活體組織解剖樣品和技術困難,我們不能進行免疫組織化學染色來證明引起改變的基因表達的細胞類型。如果絕對的RNA量是充分的,那么RNA原位雜交可以是確定改變的細胞位置的更好的方法。備選地,激光顯微解剖之后進行RT-PCR可以能夠確定包括的細胞類型。不管負責改變的基因表達的細胞類型,我們的結果證明,相對于沒有結腸癌家族病史的正常個體,改變的基因表達存在于具有結腸癌家族病史的一些個體的正常結腸黏膜中并且這些個體已知具有形成結腸癌的增加的危險(Burt R.,Peterson G.M.InYoung G.,Rozen,P.& Levin,B.Saunders,ed.in Prevention and Early Detection ofColorectal Cancer,Philadelphia,171-194(1996))。
在直腸乙狀結腸組織活檢樣品中具有改變的基因表達的患者中,一些患者在所有組織活檢樣品中都表現(xiàn)出改變(即,病例#4和12中SAA1的表達),而有些患者只在一些組織活檢樣品中表現(xiàn)出改變的表達(即,病例#2和#3中的PPAR-γ,圖2)。由于大多數(shù)樣品用一式兩份的多個基因進行評估,以確保cDNA的質量,所以,這樣的異質性不可能由技術變化引起。我們推測這種異質性可能反映這些個體中“熱點(hot spots)”的頻率和/或分布??赡艿兀谒兄蹦c乙狀結腸組織活檢樣品中具有改變的基因表達的個體可能在其直腸乙狀結腸黏膜中具有廣泛擴散的分子異常,而在一些組織活檢樣品中具有改變的表達的那些個體具有離散的熱點。因此,在前組中的個體可能具有發(fā)展結腸息肉或結腸癌的綜合趨勢,而后組中的那些個體可能具有局部趨勢。在這2組之間發(fā)展結腸癌或息肉的危險性是否不同還不清楚。另外,在具有家族病史組個體的直腸乙狀結腸組織活檢樣品中觀察到不同基因組合的改變的表達。這一觀察表明,不同的分子途徑可能參與結腸癌發(fā)生的早期階段。在某些分子途徑中改變的基因表達是否于息肉或癌癥的更高的危險性相關還是沒有確定。
與在散發(fā)性結腸癌患者和致癌物質處理的小鼠的遠端結腸中有比在近端結腸中更多的隱窩病灶(前腫瘤結腸損傷)的報道一致(Shpitz B.,Bomstein Y.,Mekori Y.,等.,Aberrant crypt foci in human colonsdistributionand histomorphologic characteristics,29 Hum Pathol.,469-75(1998);和Salim E.I.,Wanibuchi H.,Morimura K.,等.,Induction of tumors in the colonand liver of the immunodeficient(SCID)mouse by2-amino-3-methylimidazo[4,5-f]quinoline(IQ)-modulation by long chain fattyacids,23 Carcinogenesis,1519-29(2002)),我們發(fā)現(xiàn),基因表達中的大多數(shù)改變是在家族病史組的個體的遠端結腸中發(fā)現(xiàn)的。我們推測,當大部分水分在大腸末端被重吸收后,與在其它結腸區(qū)域的黏膜相比,敏感個體的遠端結腸黏膜可能暴露于更高濃度的存在于糞便中的外源物質,并且這樣的暴露可能在這一區(qū)域引起更高概率的改變的基因表達。
我們已經(jīng)證明,結腸癌家族病史,而不是年齡或性別,是為在這2組的直腸乙狀結腸黏膜中觀察到的基因表達差異負責的因素??捎眯畔]有顯示在這2組患者間的飲食或藥物治療中的任何具體的不同。然而,不經(jīng)過進一步研究,我們不能排除飲食或藥物治療影響基因表達的可能性。并不是所有具有結腸癌家族病史的個體都將發(fā)展結腸癌或結腸腺瘤性息肉(Smith,R.A.,von Eschenbach A.C.,Wender,R.,等.,American Cancer Societyguidelines for the early detection of cancerupdate of early detectionguidelines for prostate,colorectal,and endometrial cancers,and Update2001-testing for early lung cancer detection,51 CA Cancer J.Clin.,38-75;quiz 77-80(2001).)。與這一臨床觀察一致,我們的分析還表明,不是所有具有結腸癌家族病史的個體都在MNCM中具有改變的基因表達。由于在本研究中分析的基因參與結腸癌的發(fā)展,我們猜測在MNCM具有改變的基因表達的個體可能比沒有改變的基因表達的那些個體更容易發(fā)展息肉或癌癥。為了驗證這一假說,需要對大量研究受試者的遠景調查。如果這樣的相關性得到證實,可能通過應用直腸乙狀結腸組織活檢樣品的基因表達分析而確定處于發(fā)展結腸癌的增加的危險中的個體。理論上,通過分析隨機的MNCM樣品,與具有局部改變的個體相比,更容易確定在MNCm具有綜合改變的個體。然而,如果為應用多樣品的分析選擇適宜的基因組,那么它可能有充分的預測力來確定這樣的患者。
現(xiàn)在來看圖5,應用常規(guī)通用目的或專用的數(shù)字計算機和/或按照本公開內容的教導編程的處理器,這對于計算機領域的技術人員是顯而易見的,可以實現(xiàn)圖5的各個方面。基于本公開內容的教導,這對于計算機領域的技術人員是顯而易見的,適宜的軟件編碼可以由熟練的程序員容易地制定。本發(fā)明還可以通過制定集成電路和/或通過將適宜的計算機電路網(wǎng)絡相互連接而實現(xiàn),這對于計算機領域的技術人員是非常顯而易見的。
各個方面包括一種計算機程序產(chǎn)物,其是一種具有指示和/或存儲于其上/其中的信息的存儲介質,所述存儲介質可以用于編程通用目的的或專用的計算處理器/裝置,以完成本文描述的任何特征。存儲介質可以包括但不限于,一種或多種的下列各項任何類型的物理介質,包括軟盤、光盤、DVDs、CD-ROMs、微驅動(microdrives)、磁光盤、全息照相存儲裝置、ROMs、RAMs、EPROMs、EEPROMs、DRAMs、PRAMS、VRAMs、閃存裝置、磁或光卡、納米-系統(tǒng)(包括分子記憶ICs);紙或基于紙的介質;以及適用于存儲指示和/或信息的任何類型的介質或裝置。各個方面包括一種可以全部或部分并且越過一個或多個公共的和/或私人網(wǎng)絡而傳輸?shù)挠嬎銠C程序產(chǎn)物,其中所述傳輸包括指示(instruction)和/或信息,其可以由一個或多個處理器用來完成本文所述的任何特征。在各個方面中,傳輸可以包括多種獨立的傳輸。
保存在一種或多種計算機可讀的介質(媒體)上,本公開內容包括控制通用目的/專用計算機和/或處理器的硬件,和使得所述計算機和/或處理器能夠同人使用者或應用本發(fā)明結果的其它機械裝置相互作用的軟件。這樣的軟件可以包括但不限于,裝置驅動器、操作系統(tǒng)、執(zhí)行環(huán)境/容器、用戶界面和應用軟件。
編碼的執(zhí)行可以是直接的或間接的。編碼可以包括匯編、翻譯和其它類型的語言。除非另外由要求的語言所限定,編碼的執(zhí)行和/或傳輸和/或功能編碼片段可以包括對其它軟件或裝置,局域的或遠程的援引或調用,以行使所述功能。所述援引或調用可以包括對圖書館模塊、裝置驅動器和遠程軟件的援引或調用,以行使所述功能。援引或調用可以包括在分布式的和客戶/服務器系統(tǒng)的援引或調用。
圖6描述本公開內容的一個方面,其具有用于結腸黏膜細胞最低程度侵入性取樣的擦拭取樣和傳送系統(tǒng)400。圖6的系統(tǒng)400由藥簽410和容器420組成。容器420,諸如通過圖6所示的這方面內容所描述的一種,被設置以穩(wěn)定、提取并且保存結腸黏膜細胞樣品,直到可以使用公開的生物標記組對樣品進行CRC早期檢測的診斷檢測。
藥簽410具有從桿414末端延伸出來的頭412。頭410可以式許多形狀,諸如橢圓形的、正方形的、矩形的、圓的等,并且沿著桿的末端具有約0.5cm-1.0cm的最大寬度,和約1.0cm-10.0cm的長度。頭412可以由許多材料組成,諸如例如棉花、人造纖維、聚酯、和聚合物泡沫、或者這樣的材料的組合。桿414由具有充分的機械強度和充分的彈性的材料制成,所述機械強度足以擦拭直腸區(qū)域,充分的彈性足以防止傷害。用于直腸藥簽的具有強度和彈性的桿材料的實例包括木材、紙和各種聚合物材料,諸如聚酯、聚苯乙烯、和聚氨酯、以及這樣的聚合物的組合物。
容器420具有主體412和帽424。主體412可以具有各種長度和直徑,以容納上文所述的具有頭412的大小和桿414的長度范圍的藥簽410。容器的主體412可以由許多聚合物材料制成,諸如聚乙烯、聚丙稀、聚碳酸酯、聚碳氟化合物、或玻璃,而帽424典型地由理想的聚合物材料制成,諸如用于主體412給出的實例。容器420在底部具有試劑426,當作為最低程度侵入性取樣技術進行直腸區(qū)域擦拭取樣時,其適于穩(wěn)定并且提取在藥簽410上收集的結腸黏膜細胞。另外,可以使用不需要藥簽410的容器420,其具有適于穩(wěn)定并且從糞便樣品提取結腸黏膜細胞樣品的試劑426。
試劑426含有濃度至少約0.4M的緩沖的硫氰酸胍溶液,和濃度約0.1-10%的其它組織變性劑諸如生物表面活性劑。理想的生物表面活性劑可以是兩性離子的,諸如CHAPS或CHAPSO,非離子的,諸如TWEEN,或任何烷基糖苷(alkylglucoside)表面活性劑,或離子的,諸如SDS??梢允褂酶鞣N緩沖液,例如,通常已知為Good’s緩沖液的那些,諸如Tris。為了將試劑426有效地緩沖到約7.0-8.5的pH,緩沖液的濃度可能不同。
還考慮了使用如圖6中公開內容的一方面的擦拭取樣方式和傳送系統(tǒng)400提取的樣品可以進行處理,并且數(shù)據(jù)在使用上文公開的計算機硬件和軟件的單一儀器中進行分析。即,從圖6公開內容的一方面獲得的樣品可以按照圖5在單一儀器中進行分析。然而,還考慮了患者的血液或糞便樣品可以在單一儀器中進行分析。在一個實施方案中,所述儀器的一個方面是第一元件,其用于對患者樣品進行RT-PCR,以進行基因表達分布作圖,如上文所述那樣?;虮磉_分布作圖允許對SEQ.ID Nos 1-16的cDNA定量,所述cDNA是從患者樣品細胞制備的mRNA反轉錄的。SEQ.ID Nos33-64的成套引物用于RT-PCR反應,以引發(fā)與SEQ.ID Nos 1-16對應的mRNA鏈,并且由此合成與SEQ.ID Nos 1-16對應的cDNA。
從RT-PCR獲得cDNAs后,數(shù)據(jù)由所述儀器的第二元件進行比較,以控制已經(jīng)存儲在所述儀器的存儲介質上的數(shù)據(jù)。應用軟件使用上文公開的多變量分析,以執(zhí)行ANOVA、M-Dist或其它多變量分析方式的指示?;诮y(tǒng)計學分析,合格的診斷專家可以評估CRC的存在或不存在,CRC的進展,和/或CRC的治療效果。
在本公開內容的另一方面,對于CRC的早期檢測,可以使用單一儀器,進行患者樣品的蛋白表達分布作圖。術語“多肽(polypeptide)”或“多肽(polypeptides)”在本文中可以與術語“蛋白(protein)”或“蛋白(proteins)”互換地使用。如先前討論的那樣,已經(jīng)對蛋白研究了很久,研究其作為生物標記的潛力,但是有很少的成功。作為多聚核苷酸生物標記的補充,蛋白生物標記存在有價值。使得信息由兩種類型的生物標記提供的原因包括目前這樣的觀察,即,mRNA表達水平不是蛋白表達水平的良好的預報因子,和mRNA表達水平?jīng)]有提供任何蛋白翻譯后修飾的信息,而蛋白翻譯后修飾對于其生物活性是關鍵的。因此,為了理解蛋白的表達水平,以及它們完整的結構,需要對蛋白進行直接分析。
本文公開的是在SEQ.ID NOs 17-32列出的蛋白,其與SEQ.ID NOs1-16表示的基因相對應。本公開發(fā)明的另一方面是確定SEQ.ID NOs.17-32表示的蛋白的表達水平。通過上文公開的非-或者最低程度侵入性方法提取的患者樣品可以用來制備固定細胞或者樣品細胞的蛋白提取物。用于蛋白表達分布作圖的細胞可以通過圖6的方法獲得,或者備選地例如通過血液樣品或糞便樣品、或其它非侵入性或最低程度侵入性方法(或者當然通過更常規(guī)的侵入性方法,包括例如乙狀結腸鏡檢和其它方法)而獲得。
在所述儀器的第一元件中,細胞或蛋白提取物可以用一組針對所申請的全體生物標記的抗體——單克隆的或多克隆的——進行檢測,以測定目的多肽的水平。所述檢測的目的是檢測并且定量與SEQ.ID NOs 1-16中生物標記的基因序列相對應的蛋白,即SEQ.ID NOs 17-32的表達。
在考慮到所述方法的本公開內容的一方面,基于生物標記組的抗體組的抗體可以結合到固體支持物上。用于蛋白表達分布作圖的方法可以使用第二抗體,其具有針對某些結合的、目的多肽部分的特異性。這樣的第二抗體可以用有效檢測并且量化所結合的多肽的分子進行標記,并且因此在與所述多肽結合時,將其標記用于檢測和定量。另外,考慮了其它試劑用于標記所結合的多肽以便檢測和定量。這樣的試劑可以直接標記結合的多肽,或者與第二抗體類似,可以是對具有標記的結合的多肽具有特異性的部分。這樣的部分的實例包括但不限于小分子,諸如輔因子、底物、配位劑等,或大分子,諸如凝集素、肽、寡核苷酸等。這樣的部分可以是天然存在的或合成的。
關于所公開的方法的檢測方式的實例包括但不限于分光鏡技術,諸如熒光和UV-Vis分光鏡,閃爍計數(shù)和質譜。作為這些檢測方式的補充,這些方法中應用的檢測和量化目的的標記的實例包括但不限于發(fā)色團標記、閃爍標記和大量標記(mass labels)。使用這些方法在儀器的第二元件中測定的多聚核苷酸和多肽的表達水平可以相對于為目標確定目的確定的對照進行標準化。對照數(shù)據(jù)存儲在計算機內,其為所述儀器的第三元件。
第四軟件元件將從一名或多名患者樣品獲得的數(shù)據(jù)與對照數(shù)據(jù)相比較。比較將包括至少一種多變量分析,并且可以包括ANOVA、MANOVA、M-Dist和本領域的普通技術人員已知的其它方法。一旦統(tǒng)計學分析和比較進行并且完成,醫(yī)師或其它合格的人員可以為一名或多名患者的CRC狀況做出診斷。
現(xiàn)在來看本公開內容的藥物篩選方面,應該意識到,本文公開的生物標記組是基因及其表達產(chǎn)物,已知它們參與下述代謝途徑和過程1)氧化壓力/炎癥;2)APC/b-聯(lián)蛋白途徑;3)細胞周期/轉錄因子;和4)參與細胞/細胞通信、生長、修復和對損傷和外傷應答的細胞因子和其它因子的作用。存在越來越多的證據(jù),這些途徑,并且因此本生物標記組的成員還參與除CRC外的許多其它種類的癌癥,諸如肺癌、前列腺癌和乳腺癌,以及神經(jīng)退行性疾病,諸如阿爾茨海默病和肌萎縮性側索硬化癥(“ALS”)。在這樣的病理中,參與這些途徑的基因及其表達產(chǎn)物對于許多不同類型的細胞的生長、維持和壓力應答是基本的。在病理學如癌癥和神經(jīng)退化中,某些改變的基因的改變的表達導致一種或多種病理癥狀,以致這些基因及其表達產(chǎn)物的改變是所述具體病理的特征性生物標記。在這一方面,表面上不相關的病理,諸如各種癌癥和神經(jīng)退行性疾病,是非常復雜的病理的表現(xiàn),所述每一種病理包括所述生物標記的離散的成員,所述生物標記是來源于上述途徑和過程組的基因及其表達產(chǎn)物。作為這一點的實踐證據(jù),現(xiàn)在應該理解,COX-2抑制劑不但對于包括結腸癌和其它癌癥的廣泛種類的疾病,而且還對神經(jīng)退行性疾病有治療價值。
本文公開的是圖1的主題生物標記組在藥物發(fā)明方法中的應用,所述藥物發(fā)現(xiàn)方法關于病理諸如癌癥,例如CRC、肺癌、前列腺癌和乳腺癌,和神經(jīng)退行性疾病,例如阿爾茨海默病和ALS。如上文提及的,改變的基因及其表達產(chǎn)物的離散模式為每種特殊的疾病提供了唯一的識別標記,所以所述組為各種病理提供了必需的選擇性。藥物意指用于病理治療的任何治療性藥劑。這包括常規(guī)合成的分子、天然產(chǎn)物、合成修飾的天然產(chǎn)物、和生物制藥產(chǎn)物、諸如多肽和多聚核苷酸、以及它們的組合、提取物和制劑。
藥物篩選是叫作藥物發(fā)明期的藥物開發(fā)的第一階段。通過藥物篩選過程合格的有希望的藥物典型地叫作leads,也就是說,當通過篩選過程的標準時,它們是先進的,進一步在通常叫作lead最優(yōu)化(lead optimization)的藥物發(fā)明階段進行檢測。如果通過藥物發(fā)明的lead最優(yōu)化階段,所述leads就是合格的候選,并且優(yōu)先越過藥物發(fā)明階段到叫作預臨床試驗的藥物開發(fā)的下一階段,并且被稱為研究性新藥(“IND”)。如果所述IND是先進的,那么它優(yōu)先進行臨床試驗,在這種情形中它在人受試者中進行檢驗。最后,如果所述IND通過臨床試驗階段表現(xiàn)的有希望,那么在FDA正式批準后,它可以被商業(yè)化。已知對于單一候選的整個藥物開發(fā)過程要花費10-15年,和數(shù)百萬美元的開發(fā)費用。由于這一原因,藥物開發(fā)機構目前的策略是集中在藥物發(fā)明階段,有效地找出有希望的藥物,并且只將具有高成功潛力的候選進一步通過余下的藥物開發(fā)周期。
在藥物發(fā)明的篩選階段,評估有希望的藥物的特異性檢測針對合格的生物模型系統(tǒng)進行,為其監(jiān)測特異性的終端。用作關于病理諸如癌癥,例如CRC、肺癌、前列腺癌和乳腺癌,和神經(jīng)退行性疾病例如阿爾茨海默病和ALS的藥物篩選的替代終端的生物標記組,不但是有效用于這樣的病理的早期檢測的組,而且還表現(xiàn)出這樣的調控,即,所述調控通過藥物以與病理發(fā)生或復發(fā)減少相關的方式進行。另外地,有效用于這樣的病理的早期檢測的生物標記組的一個或多個成員,還可以用作對于這樣的病理的藥物篩選的目標。隨后要討論,圖1所述的生物標記可以用作模式生物系統(tǒng)的替代終端,以及藥物篩選的目標。
在篩選階段,可以評估大文庫的有希望的藥物,代表在單一篩選方案中數(shù)萬種化合物的通量。視為低通量篩選(“LTS”)的為約10,000-約50,000種有希望的藥物,而中等通量篩選(“MTS”)代表約50,00-約100,00種有希望的藥物,并且高通量篩選(“HTS”)是100,000-約500,000種有希望的藥物。
篩選方案的意思包括進行篩選的檢測流程和分析方法。那么,篩選方案包括下列因素,諸如將要用于所述檢測的生物模型的類型;進行檢測的條件;要用的有希望的藥物候選或有希望的候選的文庫的類型;要使用的設備的類型;和數(shù)據(jù)收集、處理和存儲的方式。篩選方案——LTS、MTS或HIS——的規(guī)模受到下列因素的影響,諸如檢測流程(例如,檢測類型)、分析方法(例如,小型化、自動化)、以及計算能力和容量。生物模型系統(tǒng)的意思包括全部生物體、全部細胞、細胞裂解物和目標分子。在考慮治療應用時,有希望的藥物候選的意思是任何類型的分子或分子制劑或混懸液。例如,有希望的藥物候選可以是合成的分子、天然產(chǎn)物、合成修飾的天然產(chǎn)物、和生物制藥產(chǎn)物、諸如多肽和多聚核苷酸、以及它們的組合、提取物和制劑。
如上文所討論的那樣,圖1提供用于實踐本公開發(fā)明的生物標記組的序列表。本公開內容的一方面是SEQ.ID NOs 1-16給出的16種確定的編碼序列的生物標記組,而生物標記組的另一方面是SEQ.ID NOs 17-31給出的16種確定的蛋白。本發(fā)明的這兩方面提供了病理早期檢測所需要的選擇性和靈敏性,所述病理諸如癌癥,例如CRC、肺癌、前列腺癌和乳腺癌,和神經(jīng)退行性疾病,例如阿爾茨海默病和ALS。
如先前提及的那樣,CRC是關于新藥開發(fā)的一種典型的病理。對于CRC,還沒有確定對于CRC早期檢測具有可接受的高度選擇性和靈敏性的生物標記或生物標記組。因此,圖1所述的是在為CRC早期檢測提供基礎中分化的生物標記組的方面。臨床定義的生物標記的選擇性是指正確診斷的患者百分數(shù)。臨床內容中的生物標記的靈敏性定義為疾病在可治愈階段被檢測出來的可能性。理想地,生物標記將具有100%的臨床選擇性和100%的臨床靈敏性。到目前為止,還沒有確定這樣的生物標記或生物標記組,其具有有效用于患者護理管理的寬范圍需求所需要的可接受的高度的選擇性和靈敏性。
進行篩選的分析方法可以包括上文公開的用于CRC早期檢測方法,即,從生物樣品的mRNA進行基因表達分布作圖,以確定生物標記的基因表達,和它們的表達水平怎樣受到有希望的藥物候選的影響(包括使用RT-PCR),和/或由于應用有希望的藥物候選引起的圖1多肽生物標記的蛋白表達水平;然后應用多變量統(tǒng)計學分析來確定,使用和不使用所述有希望的藥物候選,組中各種標記的表達水平的統(tǒng)計學顯著性。
參考圖7,藥物篩選公開內容的一方面考慮獲得組織樣品,諸如擦拭樣品(見圖6)、血液樣品或組織活檢,所述樣品可以通過,例如,最低程度侵入性的、侵入性的或非侵入性的方法提取。可以使用適宜的裂解緩沖液來提取并且保存組織樣品中細胞的RNA。然后,可以在提取的RNA上進行RT-PCR,并且轉化成cDNA,如上文公開的那樣,使用,例如至少2條SEQ.ID NOs 33-64列出的對圖1的生物標記組特異的引物,來篩選藥物的作用效果。然后,檢測的結果可以進行多變量分析和M-dist,如上文所述那樣,并且將結果與對照數(shù)據(jù)進行比較。
圖8描述藥物篩選公開內容的另一方面,其中制備針對SEQ.ID NOs17-32列出的至少2種生物標記蛋白的抗體,并且將所述抗體用來從例如上文列出的組織活檢和其它組織樣品中檢測生物系統(tǒng),例如,全細胞、細胞裂解物等。所述抗體用于檢測并且量化SEQ.ID NOs 17-32確定的生物標記肽的表達,以致這些生物標記肽的表達可以作為給所述生物系統(tǒng)定量給予潛力藥物的函數(shù)而進行監(jiān)測。結果可以進行多變量和單一變量分析和M-dist.,如上文公開的那樣,并且與對照數(shù)據(jù)進行比較。
出于舉例說明和描述的目的提供本文公開的內容。不是意欲窮盡或者將公開的內容局限在所述的精確形式上。對于本領域熟練的實踐者,許多改進和變化是顯而易見的。為了更好地解釋所述技術公開的實施方案的原理和實踐應用,因而使得本領域的其它技術人員能夠理解適于考慮的具體應用的各種實施方案和各種改進,選擇并且描述了公開的內容。
上文引用的參考文獻通過參考完全結合于此。
序列表<110>南希.M.李<120>用于結腸直腸癌早期檢測的藥物篩選和分子診斷檢測試劑、方法及其試劑盒<130>NLEE-01001WO0 MCF/MLB<150>60/614,746<151>2004-09-30<150>60/651,344<151>2005-02-08<150>Not Assigned<151>2005-09-29<160>64<170>PatentIn version 3.3<210>1<211>1629<212>DNA<213>人<400>1gcagagcaca caagcttcta ggacaagagc caggaagaaa ccaccggaag gaaccatctc60actgtgtgta aacatgactt ccaagctggc cgtggctctc ttggcagcct tcctgatttc120cgcagctctg tgtgaaggtg cagttttgcc aaggagtgct aaagaactta gatgtcagtg180cataaagaca tactccaaac ctttccaccc caaatttatc aaagaactga gagtgattga240gagtggacca cactgcgcca acacagaaat tatgtaaagc tttctgatgg aagagagctc300cgtctggacc ccaaggaaaa ctgggtgcag agggttgtgg agaagttttt gaagagggct360gagaattcag aattcataaa aaaattcatt ctctgtggta tccaagaatc agtgaagatg420ccagtgaaac ttcaagcaaa tctacttcaa cacttcatgt attgtgtggg tctgttgtag480ttgccaga tgcaatacaa gattcctggt taaatttgaa tttcagtaaa caatgaatag540cttttcattg taccatgaaa tatccagaac atacttatat gtaaagtatt atttatttga600atctacaaaa aacaacaaat aatttttaaa tataaggatt ttcctagata ttgcacggga660gaatatacaa atagcaaaat tgaggccaag ggccaagaga atatccgaac tttaatttca720ggaattgaat gggtttgcta gaatgtgata tttgaagcat cacataaaaa tgatgggaca780ataaattttg ccataaagtc aaatttagct ggaaatcctg gatttttttc tgttaaatct840ggcaacccta gtctgctagc caggatccac aagtccttgt tccactgtgc cttggtttct900cctttatttc taagtggaaa aagtattagc caccatctta cctcacagtg atgttgtgag960
gacatgtgga agcactttaa gttttttcat cataacataa attattttca agtgtaactt 1020attaacctat ttattattta tgtatttatt taagcatcaa atatttgtgc aagaatttgg 1080aaaaatagaa gatgaatcat tgattgaata gttataaaga tgttatagta aatttatttt 1140attttagata ttaaatgatg ttttattaga taaatttcaa tcagggtttt tagattaaac 1200aaacaaacaa ttgggtaccc agttaaattt tcatttcaga taaacaacaa ataatttttt 1260agtataagta cattattgtt tatctgaaat tttaattgaa ctaacaatcc tagtttgata 1320ctcccagtct tgtcattgcc agctgtgttg gtagtgctgt gttgaattac ggaataatga 1380gttagaacta ttaaaacagc caaaactcca cagtcaatat tagtaatttc ttgctggttg 1440aaacttgttt attatgtaca aatagattct tataatatta tttaaatgac tgcattttta 1500aatacaaggc tttatatttt taactttaag atgtttttat gtgctctcca aatttttttt 1560actgtttctg attgtatgga aatataaaag taaatatgaa acatttaaaa tataatttgt 1620tgtcaaagt 1629<210>2<211>3356<212>DNA<213>人<400>2gtccaggaac tcctcagcag cgcctccttc agctccacag ccagacgccc tcagacagca60aagcctaccc ccgcgccgcg ccctgcccgc cgctgcgatg ctcgcccgcg ccctgctgct120gtgcgcggtc ctggcgctca gccatacagc aaatccttgc tgttcccacc catgtcaaaa180ccgaggtgta tgtatgagtg tgggatttga ccagtataag tgcgattgta cccggacagg240attctatgga gaaaactgct caacaccgga atttttgaca agaataaaat tatttctgaa300acccactcca aacacagtgc actacatact tacccacttc aagggatttt ggaacgttgt360gaataacatt cccttccttc gaaatgcaat tatgagttat gtgttgacat ccagatcaca420tttgattgac agtccaccaa cttacaatgc tgactatggc tacaaaagct gggaagcctt480ctctaacctc tcctattata ctagagccct tcctcctgtg cctgatgatt gcccgactcc540cttgggtgtc aaaggtaaaa agcagcttcc tgattcaaat gagattgtgg aaaaattgct600tctaagaaga aagttcatcc ctgatcccca gggctcaaac atgatgtttg cattctttgc660ccagcacttc acgcatcagt ttttcaagac agatcataag cgagggccag ctttcaccaa720cgggctgggc catggggtgg acttaaatca tatttacggt gaaactctgg ctagacagcg780taaactgcgc cttttcaagg atggaaaaat gaaatatcag ataattgatg gagagatgta840tcctcccaca gtcaaagata ctcaggcaga gatgatctac cctcctcaag tccctgagca900tctacggttt gctgtggggc aggaggtctt tggtctggtg cctggtctga tgatgtatgc960
cacaatctgg ctgcgggaac acaacagagt atgcgatgtg cttaaacagg agcatcctga1020atggggtgat gagcagttgt tccagacaag caggctaata ctgataggag agactattaa1080gattgtgatt gaagattatg tgcaacactt gagtggctat cacttcaaac tgaaatttga1140cccagaacta cttttcaaca aacaattcca gtaccaaaat cgtattgctg ctgaatttaa1200caccctctat cactggcatc cccttctgcc tgacaccttt caaattcatg accagaaata1260caactatcaa cagtttatct acaacaactc tatattgctg gaacatggaa ttacccagtt1320tgttgaatca ttcaccaggc aaattgctgg cagggttgct ggtggtagga atgttccacc1380cgcagtacag aaagtatcac aggcttccat tgaccagagc aggcagatga aataccagtc1440ttttaatgag taccgcaaac gctttatgct gaagccctat gaatcatttg aagaacttac1500aggagaaaag gaaatgtctg cagagttgga agcactctat ggtgacatcg atgctgtgga1560gctgtatcct gcccttctgg tagaaaagcc tcggccagat gccatctttg gtgaaaccat1620ggtagaagtt ggagcaccat tctccttgaa aggacttatg ggtaatgtta tatgttctcc1680tgcctactgg aagccaagca cttttggtgg agaagtgggt tttcaaatca tcaacactgc1740ctcaattcag tctctcatct gcaataacgt gaagggctgt ccctttactt cattcagtgt1800tccagatcca gagctcatta aaacagtcac catcaatgca agttcttccc gctccggact1860agatgatatc aatcccacag tactactaaa agaacgttcg actgaactgt agaagtctaa1920tgatcatatt tatttattta tatgaaccat gtctattaat ttaattattt aataatattt1980atattaaact ccttatgtta cttaacatct tctgtaacag aagtcagtac tcctgttgcg2040gagaaaggag tcatacttgt gaagactttt atgtcactac tctaaagatt ttgctgttgc2100tgttaagttt ggaaaacagt ttttattctg ttttataaac cagagagaaa tgagttttga2160cgtcttttta cttgaatttc aacttatatt ataagaacga aagtaaagat gtttgaatac2220ttaaacactg tcacaagatg gcaaaatgct gaaagttttt acactgtcga tgtttccaat2280gcatcttcca tgatgcatta gaagtaacta atgtttgaaa ttttaaagta cttttggtta2340tttttctgtc atcaaacaaa aacaggtatc agtgcattat taaatgaata tttaaattag2400acattaccag taatttcatg tctacttttt aaaatcagca atgaaacaat aatttgaaat2460ttctaaattc atagggtaga atcacctgta aaagcttgtt tgatttctta aagttattaa2520acttgtacat ataccaaaaa gaagctgtct tggatttaaa tctgtaaaat cagtagaaat2580tttactacaa ttgcttgtta aaatatttta taagtgatgt tcctttttca ccaagagtat2640aaaccttttt agtgtgactg ttaaaacttc cttttaaatc aaaatgccaa atttattaag2700gtggtggagc cactgcagtg ttatcttaaa ataagaatat tttgttgaga tattccagaa2760tttgtttata tggctggtaa catgtaaaat ctatatcagc aaaagggtct acctttaaaa2820taagcaataa caaagaagaa aaccaaatta ttgttcaaat ttaggtttaa acttttgaag2880
caaacttttt tttatccttg tgcactgcag gcctggtact cagattttgc tatgaggtta2940atgaagtacc aagctgtgct tgaataatga tatgttttct cagattttct gttgtacagt3000ttaatttagc agtccatatc acattgcaaa agtagcaatg acctcataaa atacctcttc3060aaaatgctta aattcatttc acacattaat tttatctcag tcttgaagcc aattcagtag3120gtgcattgga atcaagcctg gctacctgca tgctgttcct tttcttttct tcttttagcc3180attttgctaa gagacacagt cttctcatca cttcgtttct cctattttgt tttactagtt3240ttaagatcag agttcacttt ctttggactc tgcctatatt ttcttacctg aacttttgca3300agttttcagg taaacctcag ctcaggactg ctatttagct cctcttaaga agatta3356<210>3<211>1750<212>DNA<213>人<400>3cctacaggtg aaaagcccag cgacccagtc aggatttaag tttacctcaa aaatggaaga60ttttaacatg gagagtgaca gctttgaaga tttctggaaa ggtgaagatc ttagtaatta120cagttacagc tctaccctgc ccccttttct actagatgcc gccccatgtg aaccagaatc180cctggaaatc aacaagtatt ttgtggtcat tatctatgcc ctggtattcc tgctgagcct240gctgggaaac tccctcgtga tgctggtcat cttatacagc agggtcggcc gctccgtcac300tgatgtctac ctgctgaacc tagccttggc cgacctactc tttgccctga ccttgcccat360ctgggccgcc tccaaggtga atggctggat ttttggcaca ttcctgtgca aggtggtctc420actcctgaag gaagtcaact tctatagtgg catcctgcta ctggcctgca tcagtgtgga480ccgttacctg gccattgtcc atgccacacg cacactgacc cagaagcgct acttggtcaa540attcatatgt ctcagcatct ggggtctgtc cttgctcctg gccctgcctg tcttactttt600ccgaaggacc gtctactcat ccaatgttag cccagcctgc tatgaggaca tgggcaacaa660tacagcaaac tggcggatgc tgttacggat cctgccccag tcctttggct tcatcgtgcc720actgctgatc atgctgttct gctacggatt caccctgcgt acgctgttta aggcccacat780ggggcagaag caccgggcca tgcgggtcat ctttgctgtc gtcctcatct tcctgctttg840ctggctgccc tacaacctgg tcctgctggc agacaccctc atgaggaccc aggtgatcca900ggagacctgt gagcgccgca atcacatcga ccgggctctg gatgccaccg agattctggg960catccttcac agctgcctca accccctcat ctacgccttc attggccaga agtttcgcca1020tggactcctc aagattctag ctatacatgg cttgatcagc aaggactccc tgcccaaaga1080cagcaggcct tcctttgttg gctcttcttc agggcacact tccactactc tctaagacct1140cctgcctaag tgcagccccg tggggttcct cccttctctt cacagtcaca ttccaagcct1200
catgtccact ggttcttctt ggtctcagtg tcaatgcagc ccccattgtg gtcacaggaa1260gcagaggagg ccacgttctt actagtttcc cttgcatggt ttagaaagct tgccctggtg1320cctcacccct tgccataatt actatgtcat ttgctggagc tctgcccatc ctgcccctga1380gcccatggca ctctatgttc taagaagtga aaatctacac tccagtgaga cagctctgca1440tactcattag gatggctagt atcaaaagaa agaaaatcag gctggccaac gggatgaaac1500cctgtctcta ctaaaaatac aaaaaaaaaa aaaaaaatta gccgggcgtg gtggtgagtg1560cctgtaatca cagctacttg ggaggctgag atgggagaat cacttgaacc cgggaggcag1620aggttgcagt gagccgagat tgtgcccctg cactccagcc tgagcgacag tgagactctg1680tctcagtcca tgaagatgta gaggagaaac tggaactctc gagcgttgct gggggggatt1740gtaaaatggt 1750<210>4<211>3939<212>DNA<213>人<400>4cctgggtcct ctcggcgcca gagccgctct ccgcatccca ggacagcggt gcggccctcg60gccggggcgc ccactccgca gcagccagcg agccagctgc cccgtatgac cgcgccgggc120gccgccgggc gctgccctcc cacgacatgg ctgggctccc tgctgttgtt ggtctgtctc180ctggcgagca ggagtatcac cgaggaggtg tcggagtact gtagccacat gattgggagt240ggacacctgc agtctctgca gcggctgatt gacagtcaga tggagacctc gtgccaaatt300acatttgagt ttgtagacca ggaacagttg aaagatccag tgtgctacct taagaaggca360tttctcctgg tacaagacat aatggaggac accatgcgct tcagagataa caccgccaat420cccatcgcca ttgtgcagct gcaggaactc tctttgaggc tgaagagctg cttcaccaag480gattatgaag agcatgacaa ggcctgcgtc cgaactttct atgagacacc tctccagttg540ctggagaagg tcaagaatgt ctttaatgaa acaaagaatc tccttgacaa ggactggaat600attttcagca agaactgcaa caacagcttt gctgaatgct ccagccaaga tgtggtgacc660aagcctgatt gcaactgcct gtaccccaaa gccatcccta gcagtgaccc ggcctctgtc720tcccctcatc agcccctcgc cccctccatg gcccctgtgg ctggcttgac ctgggaggac780tctgagggaa ctgagggcag ctccctcttg cctggtgagc agcccctgca cacagtggat840ccaggcagtg ccaagcagcg gccacccagg agcacctgcc agagctttga gccgccagag900accccagttg tcaaggacag caccatcggt ggctcaccac agcctcgccc ctctgtcggg960gccttcaacc ccgggatgga ggatattctt gactctgcaa tgggcactaa ttgggtccca1020gaagaagcct ctggagaggc cagtgagatt cccgtacccc aagggacaga gctttccccc1080
tccaggccag gagggggcag catgcagaca gagcccgcca gacccagcaa cttcctctca1140gcatcttctc cactccctgc atcagcaaag ggccaacagc cggcagatgt aactgctaca1200gccttgccca gggtgggccc cgtgatgccc actggccagg actggaatca caccccccag1260aagacagacc atccatctgc cctgctcaga gaccccccgg agccaggctc tcccaggatc1320tcatcactgc gcccccaggc cctcagcaac ccctccaccc tctctgctca gccacagctt1380tccagaagcc actcctcggg cagcgtgctg ccccttgggg agctggaggg caggaggagc1440accagggatc ggacgagccc cgcagagcca gaagcagcac cagcaagtga aggggcagcc1500aggcccctgc cccgttttaa ctccgttcct ttgactgaca caggccatga gaggcagtcc1560gagggatcct ccagcccgca gctccaggag tctgtcttcc acctgctggt gcccagtgtc1620atcctggtct tgctggctgt cggaggcctc ttgttctaca ggtggaggcg gcggagccat1680caagagcctc agagagcgga ttctcccttg gagcaaccag agggcagccc cctgactcag1740gatgacagac aggtggaact gccagtgtag agggaattct aagctggacg cacagaacag1800tctcttcgtg ggaggagaca ttatggggcg tccaccacca cccctccctg gccatcctcc1860tggaatgtgg tctgccctcc accagagctc ctgcctgcca ggactggacc agagcagcca1920ggctggggcc cctctgtctc aacccgcaga cccttgactg aatgagagag gccagaggat1980gctccccatg ctgccactat ttattgtgag ccctggaggc tcccatgtgc ttgaggaagg2040ctggtgagcc cggctcagga ccctcttccc tcaggggctg cagcctcctc tcactccctt2100ccatgccgga acccaggcca gggacccacc ggcctgtggt ttgtgggaaa gcagggtgca2160cgctgaggag tgaaacaacc ctgcacccag agggcctgcc tggtgccaag gtatcccagc2220ctggacaggc atggacctgt ctccagacag aggagcctga agttcgtggg gcgggacagc2280ctcggcctga tttcccgtaa aggtgtgcag cctgagagac gggaagagga ggcctctgca2340cctgctggtc tgcactgaca gcctgaaggg tctacaccct cggctcacct aagtccctgt2400gctggttgcc aggcccagag gggaggccag ccctgccctc aggacctgcc tgacctgcca2460gtgatgccaa gagggggatc aagcactggc ctctgcccct cctccttcca gcacctgcca2520gagcttctcc agcaggccaa gcagaggctc ccctcatgaa ggaagccatt gcactgtgaa2580cactgtacct gcctgctgaa cagcctcccc ccgtccatcc atgagccagc atccgtccgt2640cctccactct ccagcctctc cccagcctcc tgcactgagc tggcctcacc agtcgactga2700gggagcccct cagccctgac cttctcctga cctggccttt gactccccgg agtggagtgg2760ggtgggagaa cctcctgggc cgccagccag agccgctctt taggctgtgt tcttcgccca2820ggtttctgca tcttccactt tgacattccc aagagggaag ggactagtgg gagagagcaa2880gggaggggag ggcacagaca gagagcctac agggcgagct ctgactgaag atgggccttt2940
gaaatatagg tatgcacctg aggttggggg agggtctgca ctcccaaacc ccagcgcagt3000gtcctttccc tgctgccgac aggaacctgg ggctgagcag gttatccctg tcaggagccc3060tggactgggc tgcatctcag ccccacctgc atggtatcca gctcccatcc acttctcacc3120cttctttcct cctgaccttg gtcagcagtg atgacctcca actctcaccc accccctcta3180ccatcacctc taaccaggca agccagggtg ggagagcaat caggagagcc aggcctcagc3240ttccaatgcc tggagggcct ccactttgtg gccagcctgt ggtgctggct ctgaggccta3300ggcaacgagc gacagggctg ccagttgccc ctgggttcct ttgtgctgct gtgtgcctcc3360tctcctgccg ccctttgtcc tccgctaaga gaccctgccc tacctggccg ctgggccccg3420tgactttccc ttcctgccca ggaaagtgag ggtcggctgg ccccaccttc cctgtcctga3480tgccgacagc ttagggaagg gcactgaact tgcatatggg gcttagcctt ctagtcacag3540cctctatatt tgatgctaga aaacacatat ttttaaatgg aagaaaaata aaaaggcatt3600cccccttcat ccccctacct taaacatata atattttaaa ggtcaaaaaa gcaatccaac3660ccactgcaga agctcttttt gagcacttgg tggcatcaga gcaggaggag ccccagagcc3720acctctggtg tcccccaggc tacctgctca ggaacccctt ctgttctctg agaactcaac3780agaggacatt ggctcacgca ctgtgagatt ttgtttttat acttgcaact ggtgaattat3840tttttataaa gtcatttaaa tatctattta aaagatagga agctgcttat atatttaata3900ataaaagaag tgcacaagct gccgttgacg tagctcgag 3939<210>5<211>1024<212>DNA<213>人<400>5atggcccgcg ctgctctctc cgccgccccc agcaatcccc ggctcctgcg agtggcactg60ctgctcctgc tcctggtagc cgctggccgg cgcgcagcag gagcgtccgt ggccactgaa120ctgcgctgcc agtgcttgca gaccctgcag ggaattcacc ccaagaacat ccaaagtgtg180aacgtgaagt cccccggacc ccactgcgcc caaaccgaag tcatagccac actcaagaat240gggcggaaag cttgcctcaa tcctgcatcc cccatagtta agaaaatcat cgaaaagatg300ctgaacagtg acaaatccaa ctgaccagaa gggaggagga agctcactgg tggctgttcc360tgaaggaggc cctgccctta taggaacaga agaggaaaga gagacacagc tgcagaggcc420acctggattg tgcctaatgt gtttgagcat cgcttaggag aagtcttcta tttatttatt480tattcattag ttttgaagat tctatgttaa tattttaggt gtaaaataat taagggtatg540attaactcta cctgcacact gtcctattat attcattctt tttgaaatgt caaccccaag600ttagttcaat ctggattcat atttaatttg aaggtagaat gttttcaaat gttctccagt660
cattatgtta atatttctga ggagcctgca acatgccagc cactgtgata gaggctggcg720gatccaagca aatggccaat gagatcattg tgaaggcagg ggaatgtatg tgcacatctg780ttttgtaact gtttagatga atgtcagttg ttatttattg aaatgatttc acagtgtgtg840gtcaacattt ctcatgttga aactttaaga actaaaatgt tctaaatatc ccttggacat900tttatgtctt tcttgtaagg catactgcct tgtttaatgg tagttttaca gtgtttctgg960cttagaacaa aggggcttaa ttattgatgt tttcatagag aatataaaaa taaagcactt1020atag 1024<210>6<211>1064<212>DNA<213>人<220>
<221>misc_feature<222>(27)..(27)<223>n=a,c,g,t<220>
<221>misc_feature<222>(766)..(766)<223>n=a,c,g,t<400>6cacagccggg tcgcaggcac ctccccngcc agctctcccg cattctgcac agcttcccga60cgcgtctgct gagccccatg gcccacgcca cgctctccgc cgcccccagc aatccccggc120tcctgcgggt ggcgctgctg ctcctgctcc tggtgggcag ccggcgcgca gcaggagcgt180ccgtggtcac tgaactgcgc tgccagtgct tgcagacact gcagggaatt cacctcaaga240acatccaaag tgtgaatgta aggtcccccg gaccccactg cgcccaaacc gaagtcatag300ccacactcaa gaatgggaag aaagcttgtc tcaaccccgc atcccccatg gttcagaaaa360tcatcgaaaa gatactgaac aaggggagca ccaactgaca ggagagaagt aagaagctta420tcagcgtatc attgacactt cctgcagggt ggtccctgcc cttaccagag ctgaaaatga480aaaagagaac agcagctttc tagggacagc tggaaaggga cttaatgtgt ttgactattt540cttacgaggg ttctacttat ttatgtattt atttttgaaa gcttgtattt taatatttta600catgctgtta tttaaagatg tgagtgtgtt tcatcaaaca tagctcagtc ctgattattt660aattggaata tgatgggttt taaatgtgtc attaaactaa tatttagtgg gagaccataa720tgtgtcagcc accttgataa atgacagggt ggggaactgg agggtngggg gattgaaatg780caagcaatta gtggatcact gttagggtaa gggaatgtat gtacacatct attttttata840cttttttttt taaaaaagaa tgtcagttgt tatttattca aattatctca cattatgtgt900tcaacatttt tatgctgaag tttcccttag acattttatg tcttgcttgt agggcataat960
gccttgttta atgtccattc tgcagcgttt ctctttccct tggaaaagag aatttatcat1020tactgttaca tttgtacaaa tgacatgata ataaaagttt tatg 1064<210>7<211>1469<212>DNA<213>人<400>7agcagcagga ggaggcagag cacagcatcg tcgggaccag actcgtctca ggccagttgc60agccttctca gccaaacgcc gaccaaggaa aactcactac catgagaatt gcagtgattt120gcttttgcct cctaggcatc acctgtgcca taccagttaa acaggctgat tctggaagtt180ctgaggaaaa gcagctttac aacaaatacc cagatgctgt ggccacatgg ctaaaccctg240acccatctca gaagcagaat ctcctagccc cacagaccct tccaagtaag tccaacgaaa300gccatgacca catggatgat atggatgatg aagatgatga tgaccatgtg gacagccagg360actccattga ctcgaacgac tctgatgatg tagatgacac tgatgattct caccagtctg420atgagtctca ccattctgat gaatctgatg aactggtcac tgattttccc acggacctgc480cagcaaccga agttttcact ccagttgtcc ccacagtaga cacatatgat ggccgaggtg540atagtgtggt ttatggactg aggtcaaaat ctaagaagtt tcgcagacct gacatccagt600accctgatgc tacagacgag gacatcacct cacacatgga aagcgaggag ttgaatggtg660catacaaggc catccccgtt gcccaggacc tgaacgcgcc ttctgattgg gacagccgtg720ggaaggacag ttatgaaacg agtcagctgg atgaccagag tgctgaaacc cacagccaca780agcagtccag attatataag cggaaagcca atgatgagag caatgagcat tccgatgtga840ttgatagtca ggaactttcc aaagtcagcc gtgaattcca cagccatgaa tttcacagcc900atgaagatat gctggttgta gaccccaaaa gtaaggaaga agataaacac ctgaaatttc960gtatttctca tgaattagat agtgcatctt ctgaggtcaa ttaaaaggag aaaaaataca1020atttctcact ttgcatttag tcaaaagaaa aaatgcttta tagcaaaatg aaagagaaca1080tgaaatgctt ctttctcagt ttattggttg aatgtgtatc tatttgagtc tggaaataac1140taatgtgttt gataattagt ttagtttgtg gcttcatgga aactccctgt aaactaaaag1200cttcagggtt atgtctatgt tcattctata gaagaaatgc aaactatcac tgtattttaa1260tatttgttat tctctcatga atagaaattt atgtagaagc aaacaaaata cttttaccca1320cttaaaaaga gaatataaca ttttatgtca ctataatctt ttgtttttta agttagtgta1380tattttgttg tgattatctt tttgtggtgt gaataaatct tttatcttga atgtaataag1440aaaaaaaaaa aaaaaacaaa aaaaaaaaa 1469
<210>8<211>1256<212>DNA<213>人<400>8gcagtagcag cgagcagcag agtccgcacg ctccggcgag gggcagaaga gcgcgaggga60gcgcggggca gcagaagcga gagccgagcg cggacccagc caggacccac agccctcccc120agctgcccag gaagagcccc agccatggaa caccagctcc tgtgctgcga agtggaaacc180atccgccgcg cgtaccccga tgccaacctc ctcaacgacc gggtgctgcg ggccatgctg240aaggcggagg agacctgcgc gccctcggtg tcctacttca aatgtgtgca gaaggaggtc300ctgccgtcca tgcggaagat cgtcgccacc tggatgctgg aggtctgcga ggaacagaag360tgcgaggagg aggtcttccc gctggccatg aactacctgg accgcttcct gtcgctggag420cccgtgaaaa agagccgcct gcagctgctg ggggccactt gcatgttcgt ggcctctaag480atgaaggaga ccatccccct gacggccgag aagctgtgca tctacaccga cggctccatc540cggcccgagg agctgctgca aatggagctg ctcctggtga acaagctcaa gtggaacctg600gccgcaatga ccccgcacga tttcattgaa cacttcctct ccaaaatgcc agaggcggag660gagaacaaac agatcatccg caaacacgcg cagaccttcg ttgcctcttg tgccacagat720gtgaagttca tttccaatcc gccctccatg gtggcagcgg ggagcgtggt ggccgcagtg780caaggcctga acctgaggag ccccaacaac ttcctgtcct actaccgcct cacacgcttc840ctctccagag tgatcaagtg tgacccagac tgcctccggg cctgccagga gcagatcgaa900gccctgctgg agtcaagcct gcgccaggcc cagcagaaca tggaccccaa ggccgccgag960gaggaggaag aggaggagga ggaggtggac ctggcttgca cacccaccga cgtgcgggac1020gtggacatct gaggggccca ggcaggcggg cgccaccgcc acccgcagcg agggcggagc1080cggccccagg tgctccacat gacagtccct cctctccgga gcattttgat accagaaggg1140aaagcttcat tctccttgtt gttggttgtt ttttcctttg ctctttcccc cttccatctc1200tgacttaagc aaaagaaaaa gattacccaa aaactgtctt taaaagagag agagag1256<210>9<211>2121<212>DNA<213>人<400>9ctgctcgcgg ccgccaccgc cgggccccgg ccgtccctgg ctcccctcct gcctcgagaa60gggcagggct tctcagaggc ttggcgggaa aaaagaacgg agggagggat cgcgctgagt120ataaaagccg gttttcgggg ctttatctaa ctcgctgtag taattccagc gagaggcaga180gggagcgagc gggcggccgg ctagggtgga agagccgggc gagcagagct gcgctgcggg240
cgtcctggga agggagatcc ggagcgaata gggggcttcg cctctggccc agccctcccg300cttgatcccc caggccagcg gtccgcaacc cttgccgcat ccacgaaact ttgcccatag360cagcgggcgg gcactttgca ctggaactta caacacccga gcaaggacgc gactctcccg420acgcggggag gctattctgc ccatttgggg acacttcccc gccgctgcca ggacccgctt480ctctgaaagg ctctccttgc agctgcttag acgctggatt tttttcgggt agtggaaaac540cagcagcctc ccgcgacgat gcccctcaac gttagcttca ccaacaggaa ctatgacctc600gactacgact cggtgcagcc gtatttctac tgcgacgagg aggagaactt ctaccagcag660cagcagcaga gcgagctgca gcccccggcg cccagcgagg atatctggaa gaaattcgag720ctgctgccca ccccgcccct gtcccctagc cgccgctccg ggctctgctc gccctcctac780gttgcggtca cacccttctc ccttcgggga gacaacgacg gcggtggcgg gagcttctcc840acggccgacc agctggagat ggtgaccgag ctgctgggag gagacatggt gaaccagagt900ttcatctgcg acccggacga cgagaccttc atcaaaaaca tcatcatcca ggactgtatg960tggagcggct tctcggccgc cgccaagctc gtctcagaga agctggcctc ctaccaggct1020gcgcgcaaag acagcggcag cccgaacccc gcccgcggcc acagcgtctg ctccacctcc1080agcttgtacc tgcaggatct gagcgccgcc gcctcagagt gcatcgaccc ctcggtggtc1140ttcccctacc ctctcaacga cagcagctcg cccaagtcct gcgcctcgca agactccagc1200gccttctctc cgtcctcgga ttctctgctc tcctcgacgg agtcctcccc gcagggcagc1260cccgagcccc tggtgctcca tgaggagaca ccgcccacca ccagcagcga ctctgaggag1320gaacaagaag atgaggaaga aatcgatgtt gtttctgtgg aaaagaggca ggctcctggc1380aaaaggtcag agtctggatc accttctgct ggaggccaca gcaaacctcc tcacagccca1440ctggtcctca agaggtgcca cgtctccaca catcagcaca actacgcagc gcctccctcc1500actcggaagg actatcctgc tgccaagagg gtcaagttgg acagtgtcag agtcctgaga1560cagatcagca acaaccgaaa atgcaccagc cccaggtcct cggacaccga ggagaatgtc1620aagaggcgaa cacacaacgt cttggagcgc cagaggagga acgagctaaa acggagcttt1680tttgccctgc gtgaccagat cccggagttg gaaaacaatg aaaaggcccc caaggtagtt1740atccttaaaa aagccacagc atacatcctg tccgtccaag cagaggagca aaagctcatt1800tctgaagagg acttgttgcg gaaacgacga gaacagttga aacacaaact tgaacagcta1860cggaactctt gtgcgtaagg aaaagtaagg aaaacgattc cttctaacag aaatgtcctg1920agcaatcacc tatgaacttg tttcaaatgc atgatcaaat gcaacctcac aaccttggct1980gagtcttgag actgaaagat ttagccataa tgtaaactgc ctcaaattgg actttgggca2040taaaagaact tttttatgct taccatcttt tttttttctt taacagattt gtatttaaga2100attgttttta aaaaatttta a 2121
<210>10<211>2098<212>DNA<213>人<400>10cctgccgaag tcagttcctt gtggagccgg agctgggcgc ggattcgccg aggcaccgag60gcactcagag gaggcgccat gtcagaaccg gctggggatg tccgtcagaa cccatgcggc120agcaaggcct gccgccgcct cttcggccca gtggacagcg agcagctgag ccgcgactgt180gatgcgctaa tggcgggctg catccaggag gcccgtgagc gatggaactt cgactttgtc240accgagacac cactggaggg tgacttcgcc tgggagcgtg tgcggggcct tggcctgccc300aagctctacc ttcccacggg gccccggcga ggccgggatg agttgggagg aggcaggcgg360cctggcacct cacctgctct gctgcagggg acagcagagg aagaccatgt ggacctgtca420ctgtcttgta cccttgtgcc tcgctcaggg gagcaggctg aagggtcccc aggtggacct480ggagactctc agggtcgaaa acggcggcag accagcatga cagatttcta ccactccaaa540cgccggctga tcttctccaa gaggaagccc taatccgccc acaggaagcc tgcagtcctg600gaagcgcgag ggcctcaaag gcccgctcta catcttctgc cttagtctca gtttgtgtgt660cttaattatt atttgtgttt taatttaaac acctcctcat gtacataccc tggccgcccc720ctgcccccca gcctctggca ttagaattat ttaaacaaaa actaggcggt tgaatgagag780gttcctaaga gtgctgggca tttttatttt atgaaatact atttaaagcc tcctcatccc840gtgttctcct tttcctctct cccggaggtt gggtgggccg gcttcatgcc agctacttcc900tcctccccac ttgtccgctg ggtggtaccc tctggagggg tgtggctcct tcccatcgct960gtcacaggcg gttatgaaat tcaccccctt tcctggacac tcagacctga attctttttc1020atttgagaag taaacagatg gcactttgaa ggggcctcac cgagtggggg catcatcaaa1080aactttggag tcccctcacc tcctctaagg ttgggcaggg tgaccctgaa gtgagcacag1140cctagggctg agctggggac ctggtaccct cctggctctt gatacccccc tctgtcttgt1200gaaggcaggg ggaaggtggg gtcctggagc agaccacccc gcctgccctc atggcccctc1260tgacctgcac tggggagccc gtctcagtgt tgagcctttt ccctctttgg ctcccctgta1320ccttttgagg agccccagct acccttcttc tccagctggg ctctgcaatt cccctctgct1380gctgtccctc ccccttgtcc tttcccttca gtaccctctc agctccaggt ggctctgagg1440tgcctgtccc acccccaccc ccagctcaat ggactggaag gggaagggac acacaagaag1500aagggcaccc tagttctacc tcaggcagct caagcagcga ccgccccctc ctctagctgt1560gggggtgagg gtcccatgtg gtggcacagg cccccttgag tggggttatc tctgtgttag1620gggtatatga tgggggagta gatctttcta ggagggagac actggcccct caaatcgtcc1680
agcgaccttc ctcatccacc ccatccctcc ccagttcatt gcactttgat tagcagcgga1740acaaggagtc agacatttta agatggtggc agtagaggct atggacaggg catgccacgt1800gggctcatat ggggctggga gtagttgtct ttcctggcac taacgttgag cccctggagg1860cactgaagtg cttagtgtac ttggagtatt ggggtctgac cccaaacacc ttccagctcc1920tgtaacatac tggcctggac tgttttctct cggctcccca tgtgtcctgg ttcccgtttc1980tccacctaga ctgtaaacct ctcgagggca gggaccacac cctgtactgt tctgtgtctt2040tcacagctcc tcccacaatg ctgatataca gcaggtgctc aataaacgat tcttagtg 2098<210>11<211>1850<212>DNA<213>人<400>11ggcccaggct gaagctcagg gccctgtctg ctctgtggac tcaacagttt gtggcaagac60aagctcagaa ctgagaagct gtcaccacag ttctggaggc tgggaagttc aagatcaaag120tgccagcaga ttcagtgtca tgtgaggacg tgcttcctgc ttcatagata agagcttgga180gctcggcgca caaccagcac catctggtcg cgatggtgga cacggaaagc ccactctgcc240ccctctcccc actcgaggcc ggcgatctag agagcccgtt atctgaagag ttcctgcaag300aaatgggaaa catccaagag atttcgcaat ccatcggcga ggatagttct ggaagctttg360gctttacgga ataccagtat ttaggaagct gtcctggctc agatggctcg gtcatcacgg420acacgctttc accagcttcg agcccctcct cggtgactta tcctgtggtc cccggcagcg480tggacgagtc tcccagtgga gcattgaaca tcgaatgtag aatctgcggg gacaaggcct540caggctatca ttacggagtc cacgcgtgtg aaggctgcaa gggcttcttt cggcgaacga600ttcgactcaa gctggtgtat gacaagtgcg accgcagctg caagatccag aaaaagaaca660gaaacaaatg ccagtattgt cgatttcaca agtgcctttc tgtcgggatg tcacacaacg720cgattcgttt tggacgaatg ccaagatctg agaaagcaaa actgaaagca gaaattctta780cctgtgaaca tgacatagaa gattctgaaa ctgcagatct caaatctctg gccaagagaa840tctacgaggc ctacttgaag aacttcaaca tgaacaaggt caaagcccgg gtcatcctct900caggaaaggc cagtaacaat ccaccttttg tcatacatga tatggagaca ctgtgtatgg960ctgagaagac gctggtggcc aagctggtgg ccaatggcat ccagaacaag gaggcggagg1020tccgcatctt tcactgctgc cagtgcacgt cagtggagac cgtcacggag ctcacggaat1080tcgccaaggc catcccaggc ttcgcaaact tggacctgaa cgatcaagtg acattgctaa1140aatacggagt ttatgaggcc atattcgcca tgctgtcttc tgtgatgaac aaagacggga1200tgctggtagc gtatggaaat gggtttataa ctcgtgaatt cctaaaaagc ctaaggaaac1260
cgttctgtga tatcatggaa cccaagtttg attttgccat gaagttcaat gcactggaac 1320tggatgacag tgatatctcc ctttttgtgg ctgctatcat ttgctgtgga gatcgtcctg 1380gccttctaaa cgtaggacac attgaaaaaa tgcaggaggg tattgtacat gtgctcagac 1440tccacctgca gagcaaccac ccggacgata tctttctctt cccaaaactt cttcaaaaaa 1500tggcagacct ccggcagctg gtgacggagc atgcgcagct ggtgcagatc atcaagaaga 1560cggagtcgga tgctgcgctg cacccgctac tgcaggagat ctacagggac atgtactgag 1620ttccttcaga tcagccacac cttttccagg agttctgaag ctgacagcac tacaaaggag 1680acgggggagc agcacgattt tgcacaaata tccaccactt taaccttaga gcttggacag 1740tctgagctgt aggtaaccgg catattattc catatctttg ttttaaccag tacttctaag 1800agcatagaac tcaaatgctg ggggaggtgg ctaatctcag gactgggaag 1850<210>12<211>1609<212>DNA<213>人<400>12ttcaagtctt tttcttttaa cggattgatc ttttgctaga tagagacaaa atatcagtgt60gaattacagc aaacccctat tccatgctgt tatgggtgaa actctgggag attctcctat120tgacccagaa agcgattcct tcactgatac actgtctgca aacatatcacaagaaatgac 180catggttgac acagagatgc cattctggcc caccaacttt gggatcagct ccgtggatct240ctccgtaatg gaagaccact cccactcctt tgatatcaag cccttcacta ctgttgactt300ctccagcatt tctactccac attacgaaga cattccattc acaagaacag atccagtggt360tgcagattac aagtatgacc tgaaacttca agagtaccaa agtgcaatca aagtggagcc420tgcatctcca ccttattatt ctgagaagac tcagctctac aataagcctc atgaagagcc480ttccaactcc ctcatggcaa ttgaatgtcg tgtctgtgga gataaagctt ctggatttca540ctatggagtt catgcttgtg aaggatgcaa gggtttcttc cggagaacaa tcagattgaa600gcttatctat gacagatgtg atcttaactg tcggatccac aaaaaaagta gaaataaatg660tcagtactgt cggtttcaga aatgccttgc agtggggatg tctcataatg ccatcaggtt720tgggcggatg ccacaggccg agaaggagaa gctgttggcg gagatctcca gtgatatcga780ccagctgaat ccagagtccg ctgacctccg ggccctggca aaacatttgt atgactcata840cataaagtcc ttcccgctga ccaaagcaaa ggcgagggcg atcttgacag gaaagacaac900agacaaatca ccattcgtta tctatgacat gaattcctta atgatgggag aagataaaat960caagttcaaa cacatcaccc ccctgcagga gcagagcaaa gaggtggcca tccgcatctt1020tcagggctgc cagtttcgct ccgtggaggc tgtgcaggag atcacagagt atgccaaaag1080
cattcctggt tttgtaaatc ttgacttgaa cgaccaagta actctcctca aatatggagt1140ccacgagatc atttacacaa tgctggcctc cttgatgaat aaagatgggg ttctcatatc1200cgagggccaa ggcttcatga caagggagtt tctaaagagc ctgcgaaagc cttttggtga1260ctttatggag cccaagtttg agtttgctgt gaagttcaat gcactggaat tagatgacag1320cgacttggca atatttattg ctgtcattat tctcagtgga gaccgcccag gtttgctgaa1380tgtgaagccc attgaagaca ttcaagacaa cctgctacaa gccctggagc tccagctgaa1440gctgaaccac cctgagtcct cacagctgtt tgccaagctg ctccagaaaa tgacagacct1500cagacagatt gtcacggaac acgtgcagct actgcaggtg atcaagaaga cggagacaga1560catgagtctt cacccgctcc tgcaggagat ctacaaggac ttgtactag1609<210>13<211>3301<212>DNA<213>人<220>
<221>misc_feature<222>(2966)..(2973)<223>n=a,c,g,t<400>13gaattctgcg gagcctgcgg gacggcggcg ggttggcccg taggcagccg ggacagtgtt60gtacagtgtt ttgggcatgc acgtgatact cacacagtgg cttctgctca ccaacagatg120aagacagatg caccaacgag ggtctggaat ggtctggagt ggtctggaaa gcagggtcag180atacccctgg aaaactgaag cccgtggagc aatgatctct acaggactgc ttcaaggctg240atgggaacca ccctgtagag gtccatctgc gttcagaccc agacgatgcc agagctatga300ctgggcctgc aggtgtggcg ccgaggggag atcagccatg gagcagccac aggaggaagc360ccctgaggtc cgggaagagg aggagaaaga ggaagtggca gaggcagaag gagccccaga420gctcaatggg ggaccacagc atgcacttcc ttccagcagc tacacagacc tctcccggag480ctcctcgcca ccctcactgc tggaccaact gcagatgggc tgtgacgggg cctcatgcgg540cagcctcaac atggagtgcc gggtgtgcgg ggacaaggca tcgggcttcc actacggtgt600tcatgcatgt gaggggtgca agggcttctt ccgtcgtacg atccgcatga agctggagta660cgagaagtgt gagcgcagct gcaagattca gaagaagaac cgcaacaagt gccagtactg720ccgcttccag aagtgcctgg cactgggcat gtcacacaac gctatccgtt ttggtcggat780gccggaggct gagaagagga agctggtggc agggctgact gcaaacgagg ggagccagta840caacccacag gtggccgacc tgaaggcctt ctccaagcac atctacaatg cctacctgaa900aaacttcaac atgaccaaaa agaaggcccg cagcatcctc accggcaaag ccagccacac960
ggcgcccttt gtgatccacg acatcgagac attgtggcag gcagagaagg ggctggtgtg1020gaagcagttg gtgaatggcc tgcctcccta caaggagatc agcgtgcacg tcttctaccg1080ctgccagtgc accacagtgg agaccgtgcg ggagctcact gagttcgcca agagcatccc1140cagcttcagc agcctcttcc tcaacgacca ggttaccctt ctcaagtatg gcgtgcacga1200ggccatcttc gccatgctgg cctctatcgt caacaaggac gggctgctgg tagccaacgg1260cagtggcttt gtcacccgtg agttcctgcg cagcctccgc aaacccttca gtgatatcat1320tgagcctaag tttgaatttg ctgtcaagtt caacgccctg gaacttgatg acagtgacct1380ggccctattc attgcggcca tcattctgtg tggagaccgg ccaggcctca tgaacgttcc1440acgggtggag gctatccagg acaccatcct gcgtgccctc gaattccacc tgcaggccaa1500ccaccctgat gcccagtacc tcttccccaa gctgctgcag aagatggctg acctgcggca1560actggtcacc gagcacgccc agatgatgca gcggatcaag aagaccgaaa ccgagacctc1620gctgcaccct ctgctccagg agatctacaa ggacatgtac taacggcggc acccaggcct1680ccctgcagac tccaatgggg ccagcactgg aggggcccac ccacatgact tttccattga1740ccagctctct tcctgtcttt gttgtctccc tctttctcag ttcctctttc ttttctaatt1800cctgttgctc tgtttcttcc tttctgtagg tttctctctt cccttctccc ttctcccttg1860ccctcccttt ctctctccta tccccacgtc tgtcctcctt tcttattctg tgagatgttt1920tgtattattt caccagcagc atagaacagg acctctgctt ttgcacacct tttccccagg1980agcagaagag agtgggcctg ccctctgccc catcattgca cctgcaggct taggtcctca2040cttctgtctc ctgtcttcag agcaaaagac ttgagccatc caaagaaaca ctaagctctc2100tgggcctggg ttccagggaa ggctaagcat ggcctggact gactgcagcc ccctatagtc2160atggggtccc tgctgcaaag gacagtggca gaccccggca gtagagccga gatgcctccc2220caagactgtc attgcccctc cgatcgtgag gccacccact gacccaatga tcctctccag2280cagcacacct cagccccact gacacccagt gtccttccat cttcacactg gtttgccagg2340ccaatgttgc tgatggcccc tccagcacac acacataagc actgaaatca ctttacctgc2400aggcaccatg cacctccctt ccctccctga ggcaggtgag aacccagaga gaggggcctg2460caggtgagca ggcagggctg ggccaggtct ccggggaggc aggggtcctg caggtcctgg2520tgggtcagcc cagcacctcg cccagtggga gcttcccggg ataaactgag cctgttcatt2580ctgatgtcca tttgtcccaa tagctctact gccctcccct tcccctttac tcagcccagc2640tggccaccta gaagtctccc tgcacagcct ctagtgtccg gggaccttgt gggaccagtc2700ccacaccgct ggtccctgcc ctcccctgct cccaggttga ggtgcgctca cctcagagca2760gggccaaagc acagctgggc atgccatgtc tgagcggcgc agagccctcc aggcctgcag2820
gggcaagggg ctggctggag tctcagagca cagaggtagg agaactgggg ttcaagccca2880ggcttcctgg gtcctgcctg gtcctccctc ccaaggagcc attctatgtg actctgggtg2940gaagtgccca gcccctgcct gacggnnnnn nngatcactc tctgctggca ggattcttcc3000cgctccccac ctacccagct gatgggggtt ggggtgcttc tttcagccaa ggctatgaag3060ggacagctgc tgggacccac ctcccccctt ccccggccac atgccgcgtc cctgccccca3120cccgggtctg gtgctgagga tacagctctt ctcagtgtct gaacaatctc caaaattgaa3180atgtatattt ttgctaggag ccccagcttc ctgtgttttt aatataaata gtgtacacag3240actgacgaaa ctttaaataa atgggaatta aatatttaaa aaaaaaagcg gccgcgaatt3300c3301<210>14<211>3083<212>DNA<213>人<400>14aaaaactgca gccaacttcc gaggcagcct cattgcccag cggaccccag cctctgccag60gttcggtccg ccatcctcgt cccgtcctcc gccggcccct gccccgcgcc cagggatcct120ccagctcctt tcgcccgcgc cctccgttcg ctccggacac catggacaag ttttggtggc180acgcagcctg gggactctgc ctcgtgccgc tgagcctggc gcagatcgat ttgaatataa240cctgccgctt tgcaggtgta ttccacgtgg agaaaaatgg tcgctacagc atctctcgga300cggaggccgc tgacctctgc aaggctttca atagcacctt gcccacaatg gcccagatgg360agaaagctct gagcatcgga tttgagacct gcaggtatgg gttcatagaa gggcacgtgg420tgattccccg gatccacccc aactccatct gtgcagcaaa caacacaggg gtgtacatcc480tcacatccaa cacctcccag tatgacacat attgcttcaa tgcttcagct ccacctgaag540aagattgtac atcagtcaca gacctgccca atgcctttga tggaccaatt accataacta600ttgttaaccg tgatggcacc cgctatgtcc agaaaggaga atacagaacg aatcctgaag660acatctaccc cagcaaccct actgatgatg acgtgagcag cggcttttct actgtacacc720ccatcccaga cgaagacagt ccctggatca cctcctccag tgaaaggagc agcacttcag780gaggttacat cttttacacc gacagcacag acagaatccc tgctaccact ttgatgagca840ctagtgctac agcaactgag acagcaacca agaggcaaga aacctgggat tggttttcat900ggttgtttct accatcagag tcaaagaatc atcttcacac aacaacacaa atggctggta960cgtcttcaaa taccatctca gcaggctggg agccaaatga agaaaatgaa gatgaaagag1020acagacacct cagtttttct ggatcaggca ttgatgatga tgaagatttt atctccagca1080ccatttcaac cacaccacgg gcttttgacc acacaaaaca gaaccaggac tggacccagt1140
ggaacccaag ccattcaaat ccggaagtgc tacttcagac aaccacaagg atgactgatg1200tagacagaaa tggcaccact gcttatgaag gaaactggaa cccagaagca caccctcccc1260tcattcacca tgagcatcat gaggaagaag agaccccaca ttctacaagc acaatccagg1320caactcctag tagtacaacg gaagaaacag ctacccagaa ggaacagtgg tttggcaaca1380gatggcatga gggatatcgc caaacaccca aagaagactc ccatttcaac ccaatctcac1440accccatggg acgaggtcat caagcaggaa gatcgacaac agggacagct gcagcctcag1500ctcataccag ccatccaatg caaggaagga caacaccaag cccagaggac agttcctgga1560ctgatttcag gatggatatg gactccagtc atagtataac gcttcagcct actgcaaatc1620caaacacagg tttggtggaa gatttggaca ggacaggacc tctttcaatg acaacgcagc1680agagtaattc tcagagcttc tctacatcac atgaaggctt ggaagaagat aaagaccatc1740caacaacttc tactctgaca tcaagcaata ggaatgatgt cacaggtgga agaagagacc1800caaatcattc tgaaggctca actactttac tggaaggtta tacctctcat tacccacaca1860cgaaggaaag caggaccttc atcccagtga cctcagctaa gactgtcaat cgttccttat1920caggagacca agacacattc caccccagtg gggggtcctt tggagttact gcagttactg1980ttggagattc caactctaat gggtcccata ccactcatgg atctgaatca gatggacact2040cacatgggag tcaagaaggt ggagcaaaca caacctctgg tcctataagg acaccccaaa2100ttccagaatg gctgatcatc ttggcatccc tcttggcctt ggctttgatt cttgcagttt2160gcattgcagt caacagtcga agaaggtgtg ggcagaagaa aaagctagtg atcaacagtg2220gcaatggagc tgtggaggac agaaagccaa gtggactcaa cggagaggcc agcaagtctc2280aggaaatggt gcatttggtg aacaaggagt cgtcagaaac tccagaccag tttatgacag2340ctgatgagac aaggaacctg cagaatgtgg acatgaagat tggggtgtaa cacctacacc2400attatcttgg aaagaaacaa ccgttggaaa cataaccatt acagggagct gggacactta2460acagatgcaa tgtgctactg attgtttcat tgcgaatctt ttttagcata aaattttcta2520ctctttttgt tttttgtgtt ttgttcttta aagtcaggtc caatttgtaa aaacagcatt2580gctttctgaa attagggccc aattaataat cagcaagaat ttgatcgttc cagttcccac2640ttggaggcct ttcatccctc gggtgtgcta tggatggctt ctaacaaaaa ctacacatat2700gtattcctga tcgccaacct ttcccccacc agctaaggac atttcccagg gttaataggg2760cctggtccct gggaggaaat ttgaatgggt ccattttgcc cttccatagc ctaatccctg2820ggcattgctt tccactgagg ttgggggttg gggtgtacta gttacacatc ttcaacagac2880cccctctaga aatttttcag atgcttctgg gagacaccca aagggtgaag ctatttatct2940gtagtaaact atttatctgt gtttttgaaa tattaaaccc tggatcagtc ctttgatcag3000tataattttt taaagttact ttgtcagagg cacaaaaggg tttaaactga ttcataataa3060
atatctgtac ttcttcgatc ttc3083<210>15<211>2539<212>DNA<213>人<400>15ggagtctctt gctctggttc ttgctgttcc tgctcctgct cccgccgctc cccgtcctgc60tcgcggaccc aggggcgccc acgccagtga atccctgttg ttactatcca tgccagcacc120agggcatctg tgtccgcttc ggccttgacc gctaccagtg tgactgcacc cgcacgggct180attccggccc caactgcacc atccctggcc tgtggacctg gctccggaat tcactgcggc240ccagcccctc tttcacccac ttcctgctca ctcacgggcg ctggttctgg gagtttgtca300atgccacctt catccgagag atgctcatgc gcctggtact cacagtgcgc tccaacctta360tccccagtcc ccccacctac aactcagcac atgactacat cagctgggag tctttctcca420acgtgagcta ttacactcgt attctgccct ctgtgcctaa agattgcccc acacccatgg480gaaccaaagg gaagaagcag ttgccagatg cccagctcct ggcccgccgc ttcctgctca540ggaggaagtt catacctgac ccccaaggca ccaacctcat gtttgccttc tttgcacaac600acttcaccca ccagttcttc aaaacttctg gcaagatggg tcctggcttc accaaggcct660tgggccatgg ggtagacctc ggccacattt atggagacaa tctggagcgt cagtatcaac720tgcggctctt taaggatggg aaactcaagt accaggtgct ggatggagaa atgtacccgc780cctcggtaga agaggcgcct gtgttgatgc actacccccg aggcatcccg ccccagagcc840agatggctgt gggccaggag gtgtttgggc tgcttcctgg gctcatgctg tatgccacgc900tctggctacg tgagcacaac cgtgtgtgtg acctgctgaa ggctgagcac cccacctggg960gcgatgagca gcttttccag acgacccgcc tcatcctcat aggggagacc atcaagattg1020tcatcgagga gtacgtgcag cagctgagtg gctatttcct gcagctgaaa tttgacccag1080agctgctgtt cggtgtccag ttccaatacc gcaaccgcat tgccatggag ttcaaccatc1140tctaccactg gcaccccctc atgcctgact ccttcaaggt gggctcccag gagtacagct1200acgagcagtt cttgttcaac acctccatgt tggtggacta tggggttgag gccctggtgg1260atgccttctc tcgccagatt gctggccgga tcggtggggg caggaacatg gaccaccaca1320tcctgcatgt ggctgtggat gtcatcaggg agtctcggga gatgcggctg cagcccttca1380atgagtaccg caagaggttt ggcatgaaac cctacacctc cttccaggag ctcgtaggag1440agaaggagat ggcagcagag ttggaggaat tgtatggaga cattgatgcg ttggagttct1500accctggact gcttcttgaa aagtgccatc caaactctat ctttggggag agtatgatag1560agattggggc tcccttttcc ctcaagggtc tcctagggaa tcccatctgt tctccggagt1620
actggaagcc gagcacattt ggcggcgagg tgggctttaa cattgtcaag acggccacac1680tgaagaagct ggtctgcctc aacaccaaga cctgtcccta cgtttccttc cgtgtgccgg1740atgccagtca ggatgatggg cctgctgtgg agcgaccatc cacagagctc tgaggggcag1800gaaagcagca ttctggaggg gagagctttg tgcttgtcat tccagagtgc tgaggccagg1860gctgatggtc ttaaatgctc attttctggt ttggcatggt gagtgttggg gttgacattt1920agaactttaa gtctcaccca ttatctggaa tattgtgatt ctgtttattc ttccagaatg1980ctgaactcct tgttagccct tcagattgtt aggagtggtt ctcatttggt ctgccagaat2040actgggttct tagttgacaa cctagaatgt cagatttctg gttgatttgt aacacagtca2100ttctaggatg tggagctact gatgaaatct gctagaaagt tagggggttc ttattttgca2160ttccagaatc ttgactttct gattggtgat tcaaagtgtt gtgttcctgg ctgatgatcc2220agaacagtgg ctcgtatccc aaatctgtca gcatctggct gtctagaatg tggatttgat2280tcattttcct gttcagtgag atatcataga gacggagatc ctaaggtcca acaagaatgc2340attccctgaa tctgtgcctg cactgagagg gcaaggaagt ggggtgttct tcttgggacc2400cccactaaga ccctggtctg aggatgtaga gagaacaggt gggctgtatt cacgccattg2460gttggaagct accagagctc tatccccatc caggtcttga ctcatggcag ctgtttctca2520tgaagctaat aaaattcgc 2539<210>16<211>369<212>DNA<213>人<400>16atgaagcttc tcacgggcct ggttttctgc tccttggtcc tgggtgtcag cagccgaagc60ttcttttcgt tccttggcga ggcttttgat ggggctcggg acatgtggag agcctactct120gacatgagag aagccaatta catcggctca gacaaatact tccatgctcg ggggaactat180gatgctgcca aaaggggacc tgggggtgtc tgggctgcag aagcgatcag cgatgccaga240gagaatatcc agagattctt tggccatggt gcggaggact cgctggctga tcaggctgcc300aatgaatggg gcaggagtgg caaagacccc aatcacttcc gacctgctgg cctgcctgag360aaatactga369<210>17<211>67<212>PRT<213>人<400>17Met Thr Ser Lys Leu Ala Val Ala Leu Leu Ala Ala Phe Leu Ile Ser
1 5 10 15Ala Ala Leu Cys Glu Gly Ala Val Leu Pro Arg Ser Ala Lys Glu Leu20 25 30Arg Cys Gln Cys Ile Lys Thr Tyr Ser Lys Pro Phe His Pro Lys Phe35 40 45Ile Lys Glu Leu Arg Val Ile Glu Ser Gly Pro His Cys Ala Asn Thr50 55 60Glu Ile Met65<210>18<211>604<212>PRT<213>人<400>18Met Leu Ala Arg Ala Leu Leu Leu Cys Ala Val Leu Ala Leu Ser His1 5 10 15Thr Ala Asn Pro Cys Cys Ser His Pro Cys Gln Asn Arg Gly Val Cys20 25 30Met Ser Val Gly Phe Asp Gln Tyr Lys Cys Asp Cys Thr Arg Thr Gly35 40 45Phe Tyr Gly Glu Asn Cys Ser Thr Pro Glu Phe Leu Thr Arg Ile Lys50 55 60Leu Phe Leu Lys Pro Thr Pro Asn Thr Val His Tyr Ile Leu Thr His65 70 75 80Phe Lys Gly Phe Trp Asn Val Val Asn Asn Ile Pro Phe Leu Arg Asn85 90 95Ala Ile Met Ser Tyr Val Leu Thr Ser Arg Ser His Leu Ile Asp Ser100 105 110Pro Pro Thr Tyr Asn Ala Asp Tyr Gly Tyr Lys Ser Trp Glu Ala Phe115 120 125Ser Asn Leu Ser Tyr Tyr Thr Arg Ala Leu Pro Pro Val Pro Asp Asp130 135 140Cys Pro Thr Pro Leu Gly Val Lys Gly Lys Lys Gln Leu Pro Asp Ser
145 150 155 160Asn Glu Ile Val Glu Lys Leu Leu Leu Arg Arg Lys Phe Ile Pro Asp165 170 175Pro Gln Gly Ser Asn Met Met Phe Ala Phe Phe Ala Gln His Phe Thr180 185 190His Gln Phe Phe Lys Thr Asp His Lys Arg Gly Pro Ala Phe Thr Asn195 200 205Gly Leu Gly His Gly Val Asp Leu Asn His Ile Tyr Gly Glu Thr Leu210 215 220Ala Arg Gln Arg Lys Leu Arg Leu Phe Lys Asp Gly Lys Met Lys Tyr225 230 235 240Gln Ile Ile Asp Gly Glu Met Tyr Pro Pro Thr Val Lys Asp Thr Gln245 250 255Ala Glu Met Ile Tyr Pro Pro Gln Val Pro Glu His Leu Arg Phe Ala260 265 270Val Gly Gln Glu Val Phe Gly Leu Val Pro Gly Leu Met Met Tyr Ala275 280 285Thr Ile Trp Leu Arg Glu His Asn Arg Val Cys Asp Val Leu Lys Gln290 295 300Glu His Pro Glu Trp Gly Asp Glu Gln Leu Phe Gln Thr Ser Arg Leu305 310 315 320Ile Leu Ile Gly Glu Thr Ile Lys Ile Val Ile Glu Asp Tyr Val Gln325 330 335His Leu Ser Gly Tyr His Phe Lys Leu Lys Phe Asp Pro Glu Leu Leu340 345 350Phe Asn Lys Gln Phe Gln Tyr Gln Asn Arg Ile Ala Ala Glu Phe Asn355 360 365Thr Leu Tyr His Trp His Pro Leu Leu Pro Asp Thr Phe Gln Ile His370 375 380Asp Gln Lys Tyr Asn Tyr Gln Gln Phe Ile Tyr Asn Asn Ser Ile Leu385 390 395 400
Leu Glu His Gly Ile Thr Gln Phe Val Glu Ser Phe Thr Arg Gln Ile405 410 415Ala Gly Arg Val Ala Gly Gly Arg Asn Val Pro Pro Ala Val Gln Lys420 425 430Val Ser Gln Ala Ser Ile Asp Gln Ser Arg Gln Met Lys Tyr Gln Ser435 440 445Phe Asn Glu Tyr Arg Lys Arg Phe Met Leu Lys Pro Tyr Glu Ser Phe450 455 460Glu Glu Leu Thr Gly Glu Lys Glu Met Ser Ala Glu Leu Glu Ala Leu465 470 475 480Tyr Gly Asp Ile Asp Ala Val Glu Leu Tyr Pro Ala Leu Leu Val Glu485 490 495Lys Pro Arg Pro Asp Ala Ile Phe Gly Glu Thr Met Val Glu Val Gly500 505 510Ala Pro Phe Ser Leu Lys Gly Leu Met Gly Asn Val Ile Cys Ser Pro515 520 525Ala Tyr Trp Lys Pro Ser Thr Phe Gly Gly Glu Val Gly Phe Gln Ile530 535 540Ile Asn Thr Ala Ser Ile Gln Ser Leu Ile Cys Asn Asn Val Lys Gly545 550 555 560Cys Pro Phe Thr Ser Phe Ser Val Pro Asp Pro Glu Leu Ile Lys Thr565 570 575Val Thr Ile Asn Ala Ser Ser Ser Arg Ser Gly Leu Asp Asp Ile Asn580 585 590Pro Thr Val Leu Leu Lys Glu Arg Ser Thr Glu Leu595 600<210>19<211>360<212>PRT<213>人<400>19Met Glu Asp Phe Asn Met Glu Ser Asp Ser Phe Glu Asp Phe Trp Lys1 5 10 15
Gly Glu Asp Leu Ser Asn Tyr Ser Tyr Ser Ser Thr Leu Pro Pro Phe20 25 30Leu Leu Asp Ala Ala Pro Cys Glu Pro Glu Ser Leu Glu Ile Asn Lys35 40 45Tyr Phe Val Val Ile Ile Tyr Ala Leu Val Phe Leu Leu Ser Leu Leu50 55 60Gly Asn Ser Leu Val Met Leu Val Ile Leu Tyr Ser Arg Val Gly Arg65 70 75 80Ser Val Thr Asp Val Tyr Leu Leu Asn Leu Ala Leu Ala Asp Leu Leu85 90 95Phe Ala Leu Thr Leu Pro Ile Trp Ala Ala Ser Lys Val Asn Gly Trp100 105 110Ile Phe Gly Thr Phe Leu Cys Lys Val Val Ser Leu Leu Lys Glu Val115 120 125Asn Phe Tyr Ser Gly Ile Leu Leu Leu Ala Cys Ile Ser Val Asp Arg130 135 140Tyr Leu Ala Ile Val His Ala Thr Arg Thr Leu Thr Gln Lys Arg Tyr145 150 155 160Leu Val Lys Phe Ile Cys Leu Ser Ile Trp Gly Leu Ser Leu Leu Leu165 170 175Ala Leu Pro Val Leu Leu Phe Arg Arg Thr Val Tyr Ser Ser Asn Val180 185 190Ser Pro Ala Cys Tyr Glu Asp Met Gly Asn Asn Thr Ala Asn Trp Arg195 200 205Met Leu Leu Arg Ile Leu Pro Gln Ser Phe Gly Phe Ile Val Pro Leu210 215 220Leu Ile Met Leu Phe Cys Tyr Gly Phe Thr Leu Arg Thr Leu Phe Lys225 230 235 240Ala His Met Gly Gln Lys His Arg Ala Met Arg Val Ile Phe Ala Val245 250 255Val Leu Ile Phe Leu Leu Cys Trp Leu Pro Tyr Asn Leu Val Leu Leu260 265 270
Ala Asp Thr Leu Met Arg Thr Gln Val Ile Gln Glu Thr Cys Glu Arg275 280 285Arg Asn His Ile Asp Arg Ala Leu Asp Ala Thr Glu Ile Leu Gly Ile290 295 300Leu His Ser Cys Leu Asn Pro Leu Ile Tyr Ala Phe Ile Gly Gln Lys305 310 315 320Phe Arg His Gly Leu Leu Lys Ile Leu Ala Ile His Gly Leu Ile Ser325 330 335Lys Asp Ser Leu Pro Lys Asp Ser Arg Pro Ser Phe Val Gly Ser Ser340 345 350Ser Gly His Thr Ser Thr Thr Leu355 360<210>20<211>554<212>PRT<213>人<400>20Met Thr Ala Pro Gly Ala Ala Gly Arg Cys Pro Pro Thr Thr Trp Leu1 5 10 15Gly Ser Leu Leu Leu Leu Val Cys Leu Leu Ala Ser Arg Ser Ile Thr20 25 30Glu Glu Val Ser Glu Tyr Cys Ser His Met Ile Gly Ser Gly His Leu35 40 45Gln Ser Leu Gln Arg Leu Ile Asp Ser Gln Met Glu Thr Ser Cys Gln50 55 60Ile Thr Phe Glu Phe Val Asp Gln Glu Gln Leu Lys Asp Pro Val Cys65 70 75 80Tyr Leu Lys Lys Ala Phe Leu Leu Val Gln Asp Ile Met Glu Asp Thr85 90 95Met Arg Phe Arg Asp Asn Thr Ala Asn Pro Ile Ala Ile Val Gln Leu100 105 110Gln Glu Leu Ser Leu Arg Leu Lys Ser Cys Phe Thr Lys Asp Tyr Glu115 120 125
Glu His Asp Lys Ala Cys Val Arg Thr Phe Tyr Glu Thr Pro Leu Gln130 135 140Leu Leu Glu Lys Val Lys Asn Val Phe Asn Glu Thr Lys Asn Leu Leu145 150 155 160Asp Lys Asp Trp Asn Ile Phe Ser Lys Asn Cys Asn Asn Ser Phe Ala165 170 175Glu Cys Ser Ser Gln Asp Val Val Thr Lys Pro Asp Cys Asn Cys Leu180 185 190Tyr Pro Lys Ala Ile Pro Ser Ser Asp Pro Ala Ser Val Ser Pro His195 200 205Gln Pro Leu Ala Pro Ser Met Ala Pro Val Ala Gly Leu Thr Trp Glu210 215 220Asp Ser Glu Gly Thr Glu Gly Ser Ser Leu Leu Pro Gly Glu Gln Pro225 230 235 240Leu His Thr Val Asp Pro Gly Ser Ala Lys Gln Arg Pro Pro Arg Ser245 250 255Thr Cys Gln Ser Phe Glu Pro Pro Glu Thr Pro Val Val Lys Asp Ser260 265 270Thr Ile Gly Gly Ser Pro Gln Pro Arg Pro Ser Val Gly Ala Phe Asn275 280 285Pro Gly Met Glu Asp Ile Leu Asp Ser Ala Met Gly Thr Asn Trp Val290 295 300Pro Glu Glu Ala Ser Gly Glu Ala Ser Glu Ile Pro Val Pro Gln Gly305 310 315 320Thr Glu Leu Ser Pro Ser Arg Pro Gly Gly Gly Ser Met Gln Thr Glu325 330 335Pro Ala Arg Pro Ser Asn Phe Leu Ser Ala Ser Ser Pro Leu Pro Ala340 345 350Ser Ala Lys Gly Gln Gln Pro Ala Asp Val Thr Ala Thr Ala Leu Pro355 360 365Arg Val Gly Pro Val Met Pro Thr Gly Gln Asp Trp Asn His Thr Pro370 375 380
Gln Lys Thr Asp His Pro Ser Ala Leu Leu Arg Asp Pro Pro Glu Pro385 390 395 400Gly Ser Pro Arg Ile Ser Ser Leu Arg Pro Gln Ala Leu Ser Asn Pro405 410 415Ser Thr Leu Ser Ala Gln Pro Gln Leu Ser Arg Ser His Ser Ser Gly420 425 430Ser Val Leu Pro Leu Gly Glu Leu Glu Gly Arg Arg Ser Thr Arg Asp435 440 445Arg Thr Ser Pro Ala Glu Pro Glu Ala Ala Pro Ala Ser Glu Gly Ala450 455 460Ala Arg Pro Leu Pro Arg Phe Asn Ser Val Pro Leu Thr Asp Thr Gly465 470 475 480His Glu Arg Gln Ser Glu Gly Ser Ser Ser Pro Gln Leu Gln Glu Ser485 490 495Val Phe His Leu Leu Val Pro Ser Val Ile Leu Val Leu Leu Ala Val500 505 510Gly Gly Leu Leu Phe Tyr Arg Trp Arg Arg Arg Ser His Gln Glu Pro515 520 525Gln Arg Ala Asp Ser Pro Leu Glu Gln Pro Glu Gly Ser Pro Leu Thr530 535 540Gln Asp Asp Arg Gln Val Glu Leu Pro Val545 550<210>21<211>107<212>PRT<213>人<400>21Met Ala Arg Ala Ala Leu Ser Ala Ala Pro Ser Asn Pro Arg Leu Leu1 5 10 15Arg Val Ala Leu Leu Leu Leu Leu Leu Val Ala Ala Gly Arg Arg Ala20 25 30Ala Gly Ala Ser Val Ala Thr Glu Leu Arg Cys Gln Cys Leu Gln Thr35 40 45
Leu Gln Gly Ile His Pro Lys Asn Ile Gln Ser Val Asn Val Lys Ser50 55 60Pro Gly Pro His Cys Ala Gln Thr Glu Val Ile Ala Thr Leu Lys Asn65 70 75 80Gly Arg Lys Ala Cys Leu Asn Pro Ala Ser Pro Ile Val Lys Lys Ile85 90 95Ile Glu Lys Met Leu Asn Ser Asp Lys Ser Asn100 105<210>22<211>106<212>PRT<213>人<400>22Met Ala His Ala Thr Leu Ser Ala Ala Pro Ser Asn Pro Arg Leu Leu1 5 10 15Arg Val Ala Leu Leu Leu Leu Leu Leu Val Gly Ser Arg Arg Ala Ala20 25 30Gly Ala Ser Val Val Thr Glu Leu Arg Cys Gln Cys Leu Gln Thr Leu35 40 45Gln Gly Ile His Leu Lys Asn Ile Gln Ser Val Asn Val Arg Ser Pro50 55 60Gly Pro His Cys Ala Gln Thr Glu Val Ile Ala Thr Leu Lys Asn Gly65 70 75 80Lys Lys Ala Cys Leu Asn Pro Ala Ser Pro Met Val Gln Lys Ile Ile85 90 95Glu Lys Ile Leu Asn Lys Gly Ser Thr Asn100 105<210>23<211>300<212>PRT<213>人<400>23Met Arg Ile Ala Val Ile Cys Phe Cys Leu Leu Gly Ile Thr Cys Ala1 5 10 15
Ile Pro Val Lys Gln Ala Asp Ser Gly Ser Ser Glu Glu Lys Gln Leu20 25 30Tyr Asn Lys Tyr Pro Asp Ala Val Ala Thr Trp Leu Asn Pro Asp Pro35 40 45Ser Gln Lys Gln Asn Leu Leu Ala Pro Gln Thr Leu Pro Ser Lys Ser50 55 60Asn Glu Ser His Asp His Met Asp Asp Met Asp Asp Glu Asp Asp Asp65 70 75 80Asp His Val Asp Ser Gln Asp Ser Ile Asp Ser Asn Asp Ser Asp Asp85 90 95Val Asp Asp Thr Asp Asp Ser His Gln Ser Asp Glu Ser His His Ser100 105 110Asp Glu Ser Asp Glu Leu Val Thr Asp Phe Pro Thr Asp Leu Pro Ala115 120 125Thr Glu Val Phe Thr Pro Val Val Pro Thr Val Asp Thr Tyr Asp Gly130 135 140Arg Gly Asp Ser Val Val Tyr Gly Leu Arg Ser Lys Ser Lys Lys Phe145 150 155 160Arg Arg Pro Asp Ile Gln Tyr Pro Asp Ala Thr Asp Glu Asp Ile Thr165 170 175Ser His Met Glu Ser Glu Glu Leu Asn Gly Ala Tyr Lys Ala Ile Pro180 185 190Val Ala Gln Asp Leu Asn Ala Pro Ser Asp Trp Asp Ser Arg Gly Lys195 200 205Asp Ser Tyr Glu Thr Ser Gln Leu Asp Asp Gln Ser Ala Glu Thr His210 215 220Ser His Lys Gln Ser Arg Leu Tyr Lys Arg Lys Ala Asn Asp Glu Ser225 230 235 240Asn Glu His Ser Asp Val Ile Asp Ser Gln Glu Leu Ser Lys Val Ser245 250 255Arg Glu Phe His Ser His Glu Phe His Ser His Glu Asp Met Leu Val260 265 270
Val Asp Pro Lys Ser Lys Glu Glu Asp Lys His Leu Lys Phe Arg Ile275 280 285Ser His Glu Leu Asp Ser Ala Ser Ser Glu Val Asn290 295 300<210>24<211>295<212>PRT<213>人<400>24Met Glu His Gln Leu Leu Cys Cys Glu Val Glu Thr Ile Arg Arg Ala1 5 10 15Tyr Pro Asp Ala Asn Leu Leu Asn Asp Arg Val Leu Arg Ala Met Leu20 25 30Lys Ala Glu Glu Thr Cys Ala Pro Ser Val Ser Tyr Phe Lys Cys Val35 40 45Gln Lys Glu Val Leu Pro Ser Met Arg Lys Ile Val Ala Thr Trp Met50 55 60Leu Glu Val Cys Glu Glu Gln Lys Cys Glu Glu Glu Val Phe Pro Leu65 70 75 80Ala Met Asn Tyr Leu Asp Arg Phe Leu Ser Leu Glu Pro Val Lys Lys85 90 95Ser Arg Leu Gln Leu Leu Gly Ala Thr Cys Met Phe Val Ala Ser Lys100 105 110Met Lys Glu Thr Ile Pro Leu Thr Ala Glu Lys Leu Cys Ile Tyr Thr115 120 125Asp Gly Ser Ile Arg Pro Glu Glu Leu Leu Gln Met Glu Leu Leu Leu130 135 140Val Asn Lys Leu Lys Trp Asn Leu Ala Ala Met Thr Pro His Asp Phe145 150 155 160Ile Glu His Phe Leu Ser Lys Met Pro Glu Ala Glu Glu Asn Lys Gln165 170 175Ile Ile Arg Lys His Ala Gln Thr Phe Val Ala Ser Cys Ala Thr Asp180 185 190
Val Lys Phe Ile Ser Asn Pro Pro Ser Met Val Ala Ala Gly Ser Val195 200 205Val Ala Ala Val Gln Gly Leu Asn Leu Arg Ser Pro Asn Asn Phe Leu210 215 220Ser Tyr Tyr Arg Leu Thr Arg Phe Leu Ser Arg Val Ile Lys Cys Asp225 230 235 240Pro Asp Cys Leu Arg Ala Cys Gln Glu Gln Ile Glu Ala Leu Leu Glu245 250 255Ser Ser Leu Arg Gln Ala Gln Gln Asn Met Asp Pro Lys Ala Ala Glu260 265 270Glu Glu Glu Glu Glu Glu Glu Glu Val Asp Leu Ala Cys Thr Pro Thr275 280 285Asp Val Arg Asp Val Asp Ile290 295<210>25<211>439<212>PRT<213>人<400>25Met Pro Leu Asn Val Ser Phe Thr Asn Arg Asn Tyr Asp Leu Asp Tyr1 5 10 15Asp Ser Val Gln Pro Tyr Phe Tyr Cys Asp Glu Glu Glu Asn Phe Tyr20 25 30Gln Gln Gln Gln Gln Ser Glu Leu Gln Pro Pro Ala Pro Ser Glu Asp35 40 45Ile Trp Lys Lys Phe Glu Leu Leu Pro Thr Pro Pro Leu Ser Pro Ser50 55 60Arg Arg Ser Gly Leu Cys Ser Pro Ser Tyr Val Ala Val Thr Pro Phe65 70 75 80Ser Leu Arg Gly Asp Asn Asp Gly Gly Gly Gly Ser Phe Ser Thr Ala85 90 95Asp Gln Leu Glu Met Val Thr Glu Leu Leu Gly Gly Asp Met Val Asn100 105 110
Gln Ser Phe Ile Cys Asp Pro Asp Asp Glu Thr Phe Ile Lys Asn Ile115 120 125Ile Ile Gln Asp Cys Met Trp Ser Gly Phe Ser Ala Ala Ala Lys Leu130 135 140Val Ser Glu Lys Leu Ala Ser Tyr Gln Ala Ala Arg Lys Asp Ser Gly145 150 155 160Ser Pro Asn Pro Ala Arg Gly His Ser Val Cys Ser Thr Ser Ser Leu165 170 175Tyr Leu Gln Asp Leu Ser Ala Ala Ala Ser Glu Cys Ile Asp Pro Ser180 185 190Val Val Phe Pro Tyr Pro Leu Asn Asp Ser Ser Ser Pro Lys Ser Cys195 200 205Ala Ser Gln Asp Ser Ser Ala Phe Ser Pro Ser Ser Asp Ser Leu Leu210 215 220Ser Ser Thr Glu Ser Ser Pro Gln Gly Ser Pro Glu Pro Leu Val Leu225 230 235 240His Glu Glu Thr Pro Pro Thr Thr Ser Ser Asp Ser Glu Glu Glu Gln245 250 255Glu Asp Glu Glu Glu Ile Asp Val Val Ser Val Glu Lys Arg Gln Ala260 265 270Pro Gly Lys Arg Ser Glu Ser Gly Ser Pro Ser Ala Gly Gly His Ser275 280 285Lys Pro Pro His Ser Pro Leu Val Leu Lys Arg Cys His Val Ser Thr290 295 300His Gln His Asn Tyr Ala Ala Pro Pro Ser Thr Arg Lys Asp Tyr Pro305 310 315 320Ala Ala Lys Arg Val Lys Leu Asp Ser Val Arg Val Leu Arg Gln Ile325 330 335Ser Asn Asn Arg Lys Cys Thr Ser Pro Arg Ser Ser Asp Thr Glu Glu340 345 350Asn Val Lys Arg Arg Thr His Asn Val Leu Glu Arg Gln Arg Arg Asn
355 360 365Glu Leu Lys Arg Ser Phe Phe Ala Leu Arg Asp Gln Ile Pro Glu Leu370 375 380Glu Asn Asn Glu Lys Ala Pro Lys Val Val Ile Leu Lys Lys Ala Thr385 390 395 400Ala Tyr Ile Leu Ser Val Gln Ala Glu Glu Gln Lys Leu Ile Ser Glu405 410 415Glu Asp Leu Leu Arg Lys Arg Arg Glu Gln Leu Lys His Lys Leu Glu420 425 430Gln Leu Arg Asn Ser Cys Ala435<210>26<211>164<212>PRT<213>人<400>26Met Ser Glu Pro Ala Gly Asp Val Arg Gln Asn Pro Cys Gly Ser Lys1 5 10 15Ala Cys Arg Arg Leu Phe Gly Pro Val Asp Ser Glu Gln Leu Ser Arg20 25 30Asp Cys Asp Ala Leu Met Ala Gly Cys Ile Gln Glu Ala Arg Glu Arg35 40 45Trp Asn Phe Asp Phe Val Thr Glu Thr Pro Leu Glu Gly Asp Phe Ala50 55 60Trp Glu Arg Val Arg Gly Leu Gly Leu Pro Lys Leu Tyr Leu Pro Thr65 70 75 80Gly Pro Arg Arg Gly Arg Asp Glu Leu Gly Gly Gly Arg Arg Pro Gly85 90 95Thr Ser Pro Ala Leu Leu Gln Gly Thr Ala Glu Glu Asp His Val Asp100 105 110Leu Ser Leu Ser Cys Thr Leu Val Pro Arg Ser Gly Glu Gln Ala Glu115 120 125Gly Ser Pro Gly Gly Pro Gly Asp Ser Gln Gly Arg Lys Arg Arg Gln
130 135 140Thr Ser Met Thr Asp Phe Tyr His Ser Lys Arg Arg Leu Ile Phe Ser145 150 155 160Lys Arg Lys Pro<210>27<211>468<212>PRT<213>人<400>27Met Val Asp Thr Glu Ser Pro Leu Cys Pro Leu Ser Pro Leu Glu Ala1 5 10 15Gly Asp Leu Glu Ser Pro Leu Ser Glu Glu Phe Leu Gln Glu Met Gly20 25 30Asn Ile Gln Glu Ile Ser Gln Ser Ile Gly Glu Asp Ser Ser Gly Ser35 40 45Phe Gly Phe Thr Glu Tyr Gln Tyr Leu Gly Ser Cys Pro Gly Ser Asp50 55 60Gly Ser Val Ile Thr Asp Thr Leu Ser Pro Ala Ser Ser Pro Ser Ser65 70 75 80Val Thr Tyr Pro Val Val Pro Gly Ser Val Asp Glu Ser Pro Ser Gly85 90 95Ala Leu Asn Ile Glu Cys Arg Ile Cys Gly Asp Lys Ala Ser Gly Tyr100 105 110His Tyr Gly Val His Ala Cys Glu Gly Cys Lys Gly Phe Phe Arg Arg115 120 125Thr Ile Arg Leu Lys Leu Val Tyr Asp Lys Cys Asp Arg Ser Cys Lys130 135 140Ile Gln Lys Lys Asn Arg Asn Lys Cys Gln Tyr Cys Arg Phe His Lys145 150 155 160Cys Leu Ser Val Gly Met Ser His Asn Ala Ile Arg Phe Gly Arg Met165 170 175Pro Arg Ser Glu Lys Ala Lys Leu Lys Ala Glu Ile Leu Thr Cys Glu
180 185 190His Asp Ile Glu Asp Ser Glu Thr Ala Asp Leu Lys Ser Leu Ala Lys195 200 205Arg Ile Tyr Glu Ala Tyr Leu Lys Asn Phe Asn Met Asn Lys Val Lys210 215 220Ala Arg Val Ile Leu Ser Gly Lys Ala Ser Asn Asn Pro Pro Phe Val225 230 235 240Ile His Asp Met Glu Thr Leu Cys Met Ala Glu Lys Thr Leu Val Ala245 250 255Lys Leu Val Ala Asn Gly Ile Gln Asn Lys Glu Ala Glu Val Arg Ile260 265 270Phe His Cys Cys Gln Cys Thr Ser Val Glu Thr Val Thr Glu Leu Thr275 280 285Glu Phe Ala Lys Ala Ile Pro Gly Phe Ala Asn Leu Asp Leu Asn Asp290 295 300Gln Val Thr Leu Leu Lys Tyr Gly Val Tyr Glu Ala Ile Phe Ala Met305 310 315 320Leu Ser Ser Val Met Asn Lys Asp Gly Met Leu Val Ala Tyr Gly Asn325 330 335Gly Phe Ile Thr Arg Glu Phe Leu Lys Ser Leu Arg Lys Pro Phe Cys340 345 350Asp Ile Met Glu Pro Lys Phe Asp Phe Ala Met Lys Phe Asn Ala Leu355 360 365Glu Leu Asp Asp Ser Asp Ile Ser Leu Phe Val Ala Ala Ile Ile Cys370 375 380Cys Gly Asp Arg Pro Gly Leu Leu Asn Val Gly His Ile Glu Lys Met385 390 395 400Gln Glu Gly Ile Val His Val Leu Arg Leu His Leu Gln Ser Asn His405 410 415Pro Asp Asp Ile Phe Leu Phe Pro Lys Leu Leu Gln Lys Met Ala Asp420 425 430
Leu Arg Gln Leu Val Thr Glu His Ala Gln Leu Val Gln Ile Ile Lys435 440 445Lys Thr Glu Ser Asp Ala Ala Leu His Pro Leu Leu Gln Glu Ile Tyr450 455 460Arg Asp Met Tyr465<210>28<211>505<212>PRT<213>人<400>28Met Gly Glu Thr Leu Gly Asp Ser Pro Ile Asp Pro Glu Ser Asp Ser1 5 10 15Phe Thr Asp Thr Leu Ser Ala Asn Ile Ser Gln Glu Met Thr Met Val20 25 30Asp Thr Glu Met Pro Phe Trp Pro Thr Asn Phe Gly Ile Ser Ser Val35 40 45Asp Leu Ser Val Met Glu Asp His Ser His Ser Phe Asp Ile Lys Pro50 55 60Phe Thr Thr Val Asp Phe Ser Ser Ile Ser Thr Pro His Tyr Glu Asp65 70 75 80Ile Pro Phe Thr Arg Thr Asp Pro Val Val Ala Asp Tyr Lys Tyr Asp85 90 95Leu Lys Leu Gln Glu Tyr Gln Ser Ala Ile Lys Val Glu Pro Ala Ser100 105 110Pro Pro Tyr Tyr Ser Glu Lys Thr Gln Leu Tyr Asn Lys Pro His Glu115 120 125Glu Pro Ser Asn Ser Leu Met Ala Ile Glu Cys Arg Val Cys Gly Asp130 135 140Lys Ala Ser Gly Phe His Tyr Gly Val His Ala Cys Glu Gly Cys Lys145 150 155 160Gly Phe Phe Arg Arg Thr Ile Arg Leu Lys Leu Ile Tyr Asp Arg Cys165 170 175
Asp Leu Asn Cys Arg Ile His Lys Lys Ser Arg Asn Lys Cys Gln Tyr180 185 190Cys Arg Phe Gln Lys Cys Leu Ala Val Gly Met Ser His Asn Ala Ile195 200 205Arg Phe Gly Arg Met Pro Gln Ala Glu Lys Glu Lys Leu Leu Ala Glu210 215 220Ile Ser Ser Asp Ile Asp Gln Leu Asn Pro Glu Ser Ala Asp Leu Arg225 230 235 240Ala Leu Ala Lys His Leu Tyr Asp Ser Tyr Ile Lys Ser Phe Pro Leu245 250 255Thr Lys Ala Lys Ala Arg Ala Ile Leu Thr Gly Lys Thr Thr Asp Lys260 265 270Ser Pro Phe Val Ile Tyr Asp Met Asn Ser Leu Met Met Gly Glu Asp275 280 285Lys Ile Lys Phe Lys His Ile Thr Pro Leu Gln Glu Gln Ser Lys Glu290 295 300Val Ala Ile Arg Ile Phe Gln Gly Cys Gln Phe Arg Ser Val Glu Ala305 310 315 320Val Gln Glu Ile Thr Glu Tyr Ala Lys Ser Ile Pro Gly Phe Val Asn325 330 335Leu Asp Leu Asn Asp Gln Val Thr Leu Leu Lys Tyr Gly Val His Glu340 345 350Ile Ile Tyr Thr Met Leu Ala Ser Leu Met Asn Lys Asp Gly Val Leu355 360 365Ile Ser Glu Gly Gln Gly Phe Met Thr Arg Glu Phe Leu Lys Ser Leu370 375 380Arg Lys Pro Phe Gly Asp Phe Met Glu Pro Lys Phe Glu Phe Ala Val385 390 395 400Lys Phe Asn Ala Leu Glu Leu Asp Asp Ser Asp Leu Ala Ile Phe Ile405 410 415Ala Val Ile Ile Leu Ser Gly Asp Arg Pro Gly Leu Leu Asn Val Lys420 425 430
Pro Ile Glu Asp Ile Gln Asp Asn Leu Leu Gln Ala Leu Glu Leu Gln435 440 445Leu Lys Leu Asn His Pro Glu Ser Ser Gln Leu Phe Ala Lys Leu Leu450 455 460Gln Lys Met Thr Asp Leu Arg Gln Ile Val Thr Glu His Val Gln Leu465 470 475 480Leu Gln Val Ile Lys Lys Thr Glu Thr Asp Met Ser Leu His Pro Leu485 490 495Leu Gln Glu Ile Tyr Lys Asp Leu Tyr500 505<210>29<211>441<212>PRT<213>人<400>29Met Glu Gln Pro Gln Glu Glu Ala Pro Glu Val Arg Glu Glu Glu Glu1 5 10 15Lys Glu Glu Val Ala Glu Ala Glu Gly Ala Pro Glu Leu Asn Gly Gly20 25 30Pro Gln His Ala Leu Pro Ser Ser Ser Tyr Thr Asp Leu Ser Arg Ser35 40 45Ser Ser Pro Pro Ser Leu Leu Asp Gln Leu Gln Met Gly Cys Asp Gly50 55 60Ala Ser Cys Gly Ser Leu Asn Met Glu Cys Arg Val Cys Gly Asp Lys65 70 75 80Ala Ser Gly Phe His Tyr Gly Val His Ala Cys Glu Gly Cys Lys Gly85 90 95Phe Phe Arg Arg Thr Ile Arg Met Lys Leu Glu Tyr Glu Lys Cys Glu100 105 110Arg Ser Cys Lys Ile Gln Lys Lys Asn Arg Asn Lys Cys Gln Tyr Cys115 120 125Arg Phe Gln Lys Cys Leu Ala Leu Gly Met Ser His Asn Ala Ile Arg130 135 140
Phe Gly Arg Met Pro Glu Ala Glu Lys Arg Lys Leu Val Ala Gly Leu145 150 155 160Thr Ala Asn Glu Gly Ser Gln Tyr Asn Pro Gln Val Ala Asp Leu Lys165 170 175Ala Phe Ser Lys His Ile Tyr Asn Ala Tyr Leu Lys Asn Phe Asn Met180 185 190Thr Lys Lys Lys Ala Arg Ser Ile Leu Thr Gly Lys Ala Ser His Thr195 200 205Ala Pro Phe Val Ile His Asp Ile Glu Thr Leu Trp Gln Ala Glu Lys210 215 220Gly Leu Val Trp Lys Gln Leu Val Asn Gly Leu Pro Pro Tyr Lys Glu225 230 235 240Ile Ser Val His Val Phe Tyr Arg Cys Gln Cys Thr Thr Val Glu Thr245 250 255Val Arg Glu Leu Thr Glu Phe Ala Lys Ser Ile Pro Ser Phe Ser Ser260 265 270Leu Phe Leu Asn Asp Gln Val Thr Leu Leu Lys Tyr Gly Val His Glu275 280 285Ala Ile Phe Ala Met Leu Ala Ser Ile Val Asn Lys Asp Gly Leu Leu290 295 300Val Ala Asn Gly Ser Gly Phe Val Thr Arg Glu Phe Leu Arg Ser Leu305 310 315 320Arg Lys Pro Phe Ser Asp Ile Ile Glu Pro Lys Phe Glu Phe Ala Val325 330 335Lys Phe Asn Ala Leu Glu Leu Asp Asp Ser Asp Leu Ala Leu Phe Ile340 345 350Ala Ala Ile Ile Leu Cys Gly Asp Arg Pro Gly Leu Met Asn Val Pro355 360 365Arg Val Glu Ala Ile Gln Asp Thr Ile Leu Arg Ala Leu Glu Phe His370 375 380Leu Gln Ala Asn His Pro Asp Ala Gln Tyr Leu Phe Pro Lys Leu Leu385 390 395 400
Gln Lys Met Ala Asp Leu Arg Gln Leu Val Thr Glu His Ala Gln Met405 410 415Met Gln Arg Ile Lys Lys Thr Glu Thr Glu Thr Ser Leu His Pro Leu420 425 430Leu Gln Glu Ile Tyr Lys Asp Met Tyr435 440<210>30<211>742<212>PRT<213>人<400>30Met Asp Lys Phe Trp Trp His Ala Ala Trp Gly Leu Cys Leu Val Pro1 5 10 15Leu Ser Leu Ala Gln Ile Asp Leu Asn Ile Thr Cys Arg Phe Ala Gly20 25 30Val Phe His Val Glu Lys Asn Gly Arg Tyr Ser Ile Ser Arg Thr Glu35 40 45Ala Ala Asp Leu Cys Lys Ala Phe Asn Ser Thr Leu Pro Thr Met Ala50 55 60Gln Met Glu Lys Ala Leu Ser Ile Gly Phe Glu Thr Cys Arg Tyr Gly65 70 75 80Phe Ile Glu Gly His Val Val Ile Pro Arg Ile His Pro Asn Ser Ile85 90 95Cys Ala Ala Asn Asn Thr Gly Val Tyr Ile Leu Thr Ser Asn Thr Ser100 105 110Gln Tyr Asp Thr Tyr Cys Phe Asn Ala Ser Ala Pro Pro Glu Glu Asp115 120 125Cys Thr Ser Val Thr Asp Leu Pro Asn Ala Phe Asp Gly Pro Ile Thr130 135 140Ile Thr Ile Val Asn Arg Asp Gly Thr Arg Tyr Val Gln Lys Gly Glu145 150 155 160Tyr Arg Thr Asn Pro Glu Asp Ile Tyr Pro Ser Asn Pro Thr Asp Asp165 170 175
Asp Val Ser Ser Gly Ser Ser Ser Glu Arg Ser Ser Thr Ser Gly Gly180 185 190Tyr Ile Phe Tyr Thr Phe Ser Thr Val His Pro Ile Pro Asp Glu Asp195 200 205Ser Pro Trp Ile Thr Asp Ser Thr Asp Arg Ile Pro Ala Thr Thr Leu210 215 220Met Ser Thr Ser Ala Thr Ala Thr Glu Thr Ala Thr Lys Arg Gln Glu225 230 235 240Thr Trp Asp Trp Phe Ser Trp Leu Phe Leu Pro Ser Glu Ser Lys Asn245 250 255His Leu His Thr Thr Thr Gln Met Ala Gly Thr Ser Ser Asn Thr Ile260 265 270Ser Ala Gly Trp Glu Pro Asn Glu Glu Asn Glu Asp Glu Arg Asp Arg275 280 285His Leu Ser Phe Ser Gly Ser Gly Ile Asp Asp Asp Glu Asp Phe Ile290 295 300Ser Ser Thr Ile Ser Thr Thr Pro Arg Ala Phe Asp His Thr Lys Gln305 310 315 320Asn Gln Asp Trp Thr Gln Trp Asn Pro Ser His Ser Asn Pro Glu Val325 330 335Leu Leu Gln Thr Thr Thr Arg Met Thr Asp Val Asp Arg Asn Gly Thr340 345 350Thr Ala Tyr Glu Gly Asn Trp Asn Pro Glu Ala His Pro Pro Leu Ile355 360 365His His Glu His His Glu Glu Glu Glu Thr Pro His Ser Thr Ser Thr370 375 380Ile Gln Ala Thr Pro Ser Ser Thr Thr Glu Glu Thr Ala Thr Gln Lys385 390 395 400Glu Gln Trp Phe Gly Asn Arg Trp His Glu Gly Tyr Arg Gln Thr Pro405 410 415Lys Glu Asp Ser His Ser Thr Thr Gly Thr Ala Ala Ala Ser Ala His
420 425 430Thr Ser His Pro Met Gln Gly Arg Thr Thr Pro Ser Pro Glu Asp Ser435 440 445Ser Trp Thr Asp Phe Phe Asn Pro Ile Ser His Pro Met Gly Arg Gly450 455 460His Gln Ala Gly Arg Arg Met Asp Met Asp Ser Ser His Ser Ile Thr465 470 475 480Leu Gln Pro Thr Ala Asn Pro Asn Thr Gly Leu Val Glu Asp Leu Asp485 490 495Arg Thr Gly Pro Leu Ser Met Thr Thr Gln Gln Ser Asn Ser Gln Ser500 505 510Phe Ser Thr Ser His Glu Gly Leu Glu Glu Asp Lys Asp His Pro Thr515 520 525Thr Ser Thr Leu Thr Ser Ser Asn Arg Asn Asp Val Thr Gly Gly Arg530 535 540Arg Asp Pro Asn His Ser Glu Gly Ser Thr Thr Leu Leu Glu Gly Tyr545 550 555 560Thr Ser His Tyr Pro His Thr Lys Glu Ser Arg Thr Phe Ile Pro Val565 570 575Thr Ser Ala Lys Thr Gly Ser Phe Gly Val Thr Ala Val Thr Val Gly580 585 590Asp Ser Asn Ser Asn Val Asn Arg Ser Leu Ser Gly Asp Gln Asp Thr595 600 605Phe His Pro Ser Gly Gly Ser His Thr Thr His Gly Ser Glu Ser Asp610 615 620Gly His Ser His Gly Ser Gln Glu Gly Gly Ala Asn Thr Thr Ser Gly625 630 635 640Pro Ile Arg Thr Pro Gln Ile Pro Glu Trp Leu Ile Ile Leu Ala Ser645 650 655Leu Leu Ala Leu Ala Leu Ile Leu Ala Val Cys Ile Ala Val Asn Ser660 665 670
Arg Arg Arg Cys Gly Gln Lys Lys Lys Leu Val Ile Asn Ser Gly Asn675 680 685Gly Ala Val Glu Asp Arg Lys Pro Ser Gly Leu Asn Gly Glu Ala Ser690 695 700Lys Ser Gln Glu Met Val His Leu Val Asn Lys Glu Ser Ser Glu Thr705 710 715 720Pro Asp Gln Phe Met Thr Ala Asp Glu Thr Arg Asn Leu Gln Asn Val725 730 735Asp Met Lys Ile Gly Val740<210>31<211>489<212>PRT<213>人<400>31Met Leu Met Arg Leu Val Leu Thr Val Arg Ser Asn Leu Ile Pro Ser1 5 10 15Pro Pro Thr Tyr Asn Ser Ala His Asp Tyr Ile Ser Trp Glu Ser Phe20 25 30Ser Asn Val Ser Tyr Tyr Thr Arg Ile Leu Pro Ser Val Pro Lys Asp35 40 45Cys Pro Thr Pro Met Gly Thr Lys Gly Lys Lys Gln Leu Pro Asp Ala50 55 60Gln Leu Leu Ala Arg Arg Phe Leu Leu Arg Arg Lys Phe Ile Pro Asp65 70 75 80Pro Gln Gly Thr Asn Leu Met Phe Ala Phe Phe Ala Gln His Phe Thr85 90 95His Gln Phe Phe Lys Thr Ser Gly Lys Met Gly Pro Gly Phe Thr Lys100 105 110Ala Leu Gly His Gly Val Asp Leu Gly His Ile Tyr Gly Asp Asn Leu115 120 125Glu Arg Gln Tyr Gln Leu Arg Leu Phe Lys Asp Gly Lys Leu Lys Tyr130 135 140
Gln Val Leu Asp Gly Glu Met Tyr Pro Pro Ser Val Glu Glu Ala Pro145 150 155 160Val Leu Met His Tyr Pro Arg Gly Ile Pro Pro Gln Ser Gln Met Ala165 170 175Val Gly Gln Glu Val Phe Gly Leu Leu Pro Gly Leu Met Leu Tyr Ala180 185 190Thr Leu Trp Leu Arg Glu His Asn Arg Val Cys Asp Leu Leu Lys Ala195 200 205Glu His Pro Thr Trp Gly Asp Glu Gln Leu Phe Gln Thr Thr Arg Leu210 215 220Ile Leu Ile Gly Glu Thr Ile Lys Ile Val Ile Glu Glu Tyr Val Gln225 230 235 240Gln Leu Ser Gly Tyr Phe Leu Gln Leu Lys Phe Asp Pro Glu Leu Leu245 250 255Phe Gly Val Gln Phe Gln Tyr Arg Asn Arg Ile Ala Met Glu Phe Asn260 265 270His Leu Tyr His Trp His Pro Leu Met Pro Asp Ser Phe Lys Val Gly275 280 285Ser Gln Glu Tyr Ser Tyr Glu Gln Phe Leu Phe Asn Thr Ser Met Leu290 295 300Val Asp Tyr Gly Val Glu Ala Leu Val Asp Ala Phe Ser Arg Gln Ile305 310 315 320Ala Gly Arg Ile Gly Gly Gly Arg Asn Met Asp His His Ile Leu His325 330 335Val Ala Val Asp Val Ile Arg Glu Ser Arg Glu Met Arg Leu Gln Pro340 345 350Phe Asn Glu Tyr Arg Lys Arg Phe Gly Met Lys Pro Tyr Thr Ser Phe355 360 365Gln Glu Leu Val Gly Glu Lys Glu Met Ala Ala Glu Leu Glu Glu Leu370 375 380Tyr Gly Asp Ile Asp Ala Leu Glu Phe Tyr Pro Gly Leu Leu Leu Glu385 390 395 400
Lys Cys His Pro Asn Ser Ile Phe Gly Glu Ser Met Ile Glu Ile Gly405 410 415Ala Pro Phe Ser Leu Lys Gly Leu Leu Gly Asn Pro Ile Cys Ser Pro420 425 430Glu Tyr Trp Lys Pro Ser Thr Phe Gly Gly Glu Val Gly Phe Asn Ile435 440 445Val Lys Thr Ala Thr Leu Lys Lys Leu Val Cys Leu Asn Thr Lys Thr450 455 460Cys Pro Tyr Val Ser Phe Arg Val Pro Asp Ala Ser Gln Asp Asp Gly465 470 475 480Pro Ala Val Glu Arg Pro Ser Thr Glu485<210>32<211>122<212>PRT<213>人<400>32Met Lys Leu Leu Thr Gly Leu Val Phe Cys Ser Leu Val Leu Gly Val1 5 10 15Ser Ser Arg Ser Phe Phe Ser Phe Leu Gly Glu Ala Phe Asp Gly Ala20 25 30Arg Asp Met Trp Arg Ala Tyr Ser Asp Met Arg Glu Ala Asn Tyr Ile35 40 45Gly Ser Asp Lys Tyr Phe His Ala Arg Gly Asn Tyr Asp Ala Ala Lys50 55 60Arg Gly Pro Gly Gly Val Trp Ala Ala Glu Ala Ile Ser Asp Ala Arg65 70 75 80Glu Asn Ile Gln Arg Phe Phe Gly His Gly Ala Glu Asp Ser Leu Ala85 90 95Asp Gln Ala Ala Asn Glu Trp Gly Arg Ser Gly Lys Asp Pro Asn His100 105 110Phe Arg Pro Ala Gly Leu Pro Glu Lys Tyr115 120
<210>33<211>26<212>DNA<213>人<400>33agatattgca cgggagaata tacaaa 26<210>34<211>27<212>DNA<213>人<400>34tcaattcctg aaattaaagt tcggata 27<210>35<211>23<212>DNA<213>人<400>35tctgcagagt tggaagcact cta 23<210>36<211>21<212>DNA<213>人<400>36gccgaggctt ttctaccaga a21<210>37<211>20<212>DNA<213>人<400>37catggcttga tcagcaagga 20<210>38<211>21<212>DNA<213>人<400>38tggaagtgtg ccctgaagaa g21<210>39<211>21<212>DNA<213>人<400>39aagcagcacc agcaagtgaa g21
<210>40<211>21<212>DNA<213>人<400>40tcatggcctg tgtcagtcaa a21<210>41<211>22<212>DNA<213>人<400>41acatgccagc cactgtgata ga 22<210>42<211>21<212>DNA<213>人<400>42ccctgccttc acaatgatct c21<210>43<211>23<212>DNA<213>人<400>43ggaattcacc tcaagaacat cca 23<210>44<211>23<212>DNA<213>人<400>44agtgtggcta tgacttcggt ttg 23<210>45<211>22<212>DNA<213>人<400>45cagccacaag cagtccagat ta 22<210>46<211>24<212>DNA<213>人<400>46cctgactatc aatcacatcg gaat 24
<210>47<211>21<212>DNA<213>人<400>47ccaggtgctc cacatgacag t21<210>48<211>24<212>DNA<213>人<400>48aaacaaccaa caacaaggag aatg 24<210>49<211>21<212>DNA<213>人<400>49cgtctccaca catcagcaca a21<210>50<211>22<212>DNA<213>人<400>50tcttggcagc aggatagtcc tt 22<210>51<211>22<212>DNA<213>人<400>51gcagaccagc atgacagatt tc 22<210>52<211>20<212>DNA<213>人<400>52gcggattagg gcttcctctt 20<210>53<211>23<212>DNA<213>人<400>53tgaagttcaa tgcactggaa ctg 23
<210>54<211>20<212>DNA<213>人<400>54caggacgatc tccacagcaa 20<210>55<211>23<212>DNA<213>人<400>55tggagtccac gagatcattt aca 23<210>56<211>19<212>DNA<213>人<400>56agccttggcc ctcggatat 19<210>57<211>21<212>DNA<213>人<400>57cactgagttc gccaagagca t 21<210>58<211>23<212>DNA<213>人<400>58cacgccatac ttgagaaggg taa 23<210>59<211>23<212>DNA<213>人<400>59gctagtgatc aacagtggca atg 23<210>60<211>18<212>DNA<213>人<400>60gctggcctct ccgttgag18
<210>61<211>22<212>DNA<213>人<400>61tgttcggtgt ccagttccaa ta 22<210>62<211>22<212>DNA<213>人<400>62tgccagtggt agagatggtt ga 22<210>63<211>22<212>DNA<213>人<400>63gggacatgtg gagagcctac tc 22<210>64<211>21<212>DNA<213>人<400>64catcatagtt cccccgagca t2權利要求
1.一種制備用于早期檢測結腸直腸癌、肺癌、前列腺癌、乳腺癌、阿爾茨海默病和ALS的試劑組合物的方法,所述方法包括合成來自SEQ.ID NOs 33-64的每種多聚核苷酸對的引物對;使用稀釋劑,將每種所述引物的多種獨立的儲液調整到至少一種需要的濃度;將每種所述引物的每份所述儲液等分到多個容器中;和將所述多個容器在長期保存條件下保存。
2.權利要求1的方法,其中所述方法還包括將每種所述引物對的等分儲液凍干。
3.一種用于結腸直腸癌、肺癌、前列腺癌、乳腺癌、阿爾茨海默病和ALS早期檢測的方法,所述方法包括通過非侵入性的或最低程度侵入性的方法從大體上看起來正常的組織獲得組織樣品;從所述樣品分離RNA;使用選自由SEQ.ID NOs 33-64組成的組的多個引物對,從RNA樣品擴增cDNA拷貝,以檢測選自SEQ.ID NOs.1-16的多聚核苷酸組;量化擴增的cDNA拷貝;和使用量化的擴增的cDNA拷貝來評估對于結腸直腸癌、肺癌、前列腺癌、乳腺癌、阿爾茨海默病和ALS的至少一種疾病的疾病進展和治療功效中的至少一種。
4.權利要求3的方法,其中所述獲得步驟還包括取樣直腸黏膜細胞。
5.權利要求3的方法,其中所述獲得步驟還包括采血、糞便取樣和進行直腸組織活檢的一種。
6.權利要求3的方法,其中所述使用步驟還包括通過多變量分析進行分析組織樣品cDNA的量化水平;將組織樣品cDNA量化水平的多變量分析與多種對照數(shù)據(jù)進行比較,其中所述比較確定與對照數(shù)據(jù)的差異顯著性,從而評估結腸直腸癌的存在。
7.權利要求6的方法,其中所述分析步驟還包括使用ANOVA檢測和Mahalanobis距離檢測的一種。
8.一種用于結腸直腸癌早期檢測和用于評估直腸結腸癌治療效果的方法,所述方法包括步驟通過非侵入性的或最低程度侵入性的方法獲得組織樣品,所述組織樣品含有大體看起來無癌的細胞;產(chǎn)生具有針對SEQ.ID NOs 17-32確定的每種多肽的不同特異性的多種抗體;用所述多種抗體檢測SEQ.ID NOs 17-32確定的多肽組中的多肽表達,其中所述檢測步驟允許量化所述抗體與所述多肽的特異性結合;基于所量化的特異性抗體結合,量化多肽組中每種不同多肽的水平;和分析多肽組中每種不同多肽的量化水平,其中所述量化水平用來評估結腸直腸癌的存在、進展和治療中的至少一種。
9.權利要求8的方法,其中所述獲得步驟還包括取樣血液、取樣糞便、擦拭結腸細胞和進行直腸組織活檢的一種。
10.一種用于分析監(jiān)測結腸直腸癌的早期檢測和治療的數(shù)據(jù)的方法,所述方法包括下列步驟從患者樣品獲得選自SEQ.ID Nos.1-16的多聚核苷酸的多種cDNA的量化水平,其中所述樣品通過非侵入性的方法或最低程度侵入性的方法采??;應用多變量統(tǒng)計學分析,將患者樣品的所述數(shù)據(jù)與多種存儲的對照數(shù)據(jù)比較;和基于所述比較,做出關于結腸直腸癌的診斷、結腸直腸癌的進展和對于患者的治療效果的一種的決斷。
11.一種具有存儲于其上的指示的機器可讀介質,當通過一種或多種處理器執(zhí)行時,其使得系統(tǒng)獲得SEQ.ID NOs.1-16列出的多聚核苷酸的量化的cDNA水平的數(shù)據(jù),其中所述量化的cDNA水平來自于患者組織樣品和對照組織樣品;使用至少一種多變量統(tǒng)計學分析,將患者組織樣品的量化的cDNA水平與對照組織樣品的量化的cDNA水平相比較;和提供所述多變量統(tǒng)計學分析用于由受過評估結腸直腸癌訓練的個體進行評估。
12.一種包含在傳送介質中的計算機信號,其包括包括用于獲得選自SEQ.ID NOs.1-16的多聚核苷酸的量化的cDNA水平的指示的編碼部分,其中所述量化的cDNA水平來自于患者組織樣品;包括用于使用多變量統(tǒng)計學分析將來自患者組織樣品的量化的cDNA水平與多種對照數(shù)據(jù)相比較的指示的編碼部分;和包括用于基于所述比較對患者組織樣品做出結腸直腸癌診斷的指示的編碼部分。
13.一種包含在傳送介質中的計算機信號,其包括包括用于獲得選自SEQ.ID NOs.17-33的多肽的量化水平的編碼部分,其中所述多肽的量化水平來自于含有結腸黏膜細胞的患者樣品;包括用于使用多變量統(tǒng)計學分析將來自患者樣品的量化的多肽水平與多種對照數(shù)據(jù)相比較的指示的編碼部分;和包括基于所述比較對于結腸直腸癌診斷、結腸直腸癌進展和結腸直腸癌治療效果中的至少一種的至少一種指示的編碼部分。
14.一種用于結腸直腸癌早期檢測的試劑盒,所述試劑盒包括接收通過非侵入性的方法獲得的含有直腸黏膜細胞的樣品的收集容器,其中所述收集容器被設置以穩(wěn)定并且保存所述樣品;和用于分析多聚核苷酸表達水平的至少一種試劑,其中所述多聚核苷酸選自SEQ.ID Nos.1-16。
15.一種用于檢測結腸直腸癌的試劑盒,所述試劑盒包括擦拭取樣和樣品轉移系統(tǒng),其用于最低程度侵入性地取樣直腸黏膜細胞,所述系統(tǒng)包括被設置以從直腸采集結腸黏膜細胞的藥簽;和當采樣后用于接收所述藥簽的收集容器,其中所述收集容器被設置以穩(wěn)定、提取和保存所述樣品;和用于分析多聚核苷酸表達水平的至少一種試劑,其中所述多聚核苷酸選自SEQ.ID Nos.1-16。
16.一種用于藥物篩選的方法,所述方法包括下述步驟為結腸直腸癌、肺癌、前列腺癌、乳腺癌、阿爾茨海默病和ALS的至少一種選擇模式生物系統(tǒng);應用適當?shù)哪J缴锵到y(tǒng),選擇至少一種有希望的藥物進行篩選;從SEQ.ID 1-32確定的生物標記組選擇至少2種生物標記;將所述至少一種有希望的藥物定量給予所述模式生物系統(tǒng);和作為所述定量給藥步驟的函數(shù),監(jiān)測模式生物系統(tǒng)種至少2種生物標記的應答。
17.權利要求16的方法,其還包括基于所述監(jiān)測步驟,確定所述有希望的藥物的效果。
全文摘要
本發(fā)明公開了一種早期檢測結腸直腸癌(“CRC”)的新方法,其使用分子診斷檢測來評估用于結腸直腸癌早期檢測的大體上看起來正常的結腸組織。所述大體上看起來正常的結腸黏膜細胞可以通過非侵入性的或最低程度侵入性的方法收集。本發(fā)明還公開了新型生物標記組用于藥物篩選的應用。這樣的生物標記組可以完全或部分用作監(jiān)測有前景的藥物在病理干涉中的效用的替代終端,所述病理諸如癌癥,例如CRC、肺癌、前列腺癌和乳腺癌,和神經(jīng)退行性疾病,例如阿爾茨海默病和ALS。
文檔編號C07K1/00GK101065393SQ200580033013
公開日2007年10月31日 申請日期2005年9月30日 優(yōu)先權日2004年9月30日
發(fā)明者南?!·李 申請人:優(yōu)基譜