国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      17q連鎖的乳房癌和卵巢癌易患性基因的體內(nèi)突變和多態(tài)性的制作方法

      文檔序號(hào):3549081閱讀:311來(lái)源:國(guó)知局

      專利名稱::17q連鎖的乳房癌和卵巢癌易患性基因的體內(nèi)突變和多態(tài)性的制作方法
      技術(shù)領(lǐng)域
      :本發(fā)明一般涉及人類遺傳學(xué)領(lǐng)域。具體地,本發(fā)明涉及用于分離和檢測(cè)人乳房癌和卵巢癌傾向性基因(BRCA1)的方法和材料,該基因的某些突變型等位基因造成癌癥尤其是乳房和卵巢癌的易患性。更具體地,本發(fā)明涉及BRCA1基因的種系突變及其在診斷乳房癌和卵巢癌傾向性方面的用途。本發(fā)明還涉及在人乳房癌和卵巢癌中BRCA1基因的體細(xì)胞突變及其在診斷和預(yù)后乳房癌和卵巢癌傾向性方面的用途。此外,本發(fā)明還涉及在其他的人癌腫中的BRCA1基因體細(xì)胞突變及其在人癌腫的診斷和預(yù)后方面的用途。本發(fā)明還涉及BRCA1基因發(fā)生突變的人癌腫的治療,它包括基因治療、蛋白質(zhì)置換治療和蛋白質(zhì)模擬物(mimetics)。本發(fā)明還涉及篩選用于癌腫治療的藥物。最后,本發(fā)明涉及篩選BRCA1基因的突變,而這些突變可用于診斷乳房癌和卵巢癌的傾向性。此處用來(lái)說(shuō)明本發(fā)明的背景、尤其用來(lái)對(duì)實(shí)施提供額外細(xì)節(jié)的出版物和其他材料,在本申請(qǐng)中結(jié)合引用作為參考,并且為了方便起見(jiàn),在下文中按作者和日期進(jìn)行引用而且分別歸類在所附的參考文獻(xiàn)清單中。
      背景技術(shù)
      :癌腫遺傳學(xué)非常復(fù)雜,涉及多個(gè)顯性的、轉(zhuǎn)化狀態(tài)的正調(diào)節(jié)物(癌基因)以及多個(gè)隱性的、負(fù)調(diào)節(jié)物(腫瘤抑制基因)。已經(jīng)確定了超過(guò)100種的癌基因。被鑒定的腫瘤抑制基因還不到12種,但是預(yù)計(jì)該數(shù)目會(huì)增加至超過(guò)50種(Knudson,1993)。牽涉這么多基因強(qiáng)調(diào)了為了維持正常組織的完整性而在細(xì)胞中發(fā)揮作用的生長(zhǎng)調(diào)控機(jī)制的復(fù)雜性。這種復(fù)雜性還通過(guò)另一種方式體現(xiàn)。迄今為止,還沒(méi)有單個(gè)基因參與所有的、或者絕大多數(shù)的人癌腫的進(jìn)程。最常見(jiàn)的癌基因突變是在H-ras基因中,在所有實(shí)體瘤的10-15%中有此種突變發(fā)現(xiàn)(Anderson等人,1992)。突變頻率最高的腫瘤抑制基因是TP53基因(在約50%所有腫瘤中純合缺失)和CDKN2(在46%檢查的腫瘤細(xì)胞系中純合缺失)(Kamb等人,1994)。沒(méi)有一個(gè)共同的針對(duì)所有轉(zhuǎn)化細(xì)胞的靶目標(biāo),就不可能尋找到能夠摧毀或逆轉(zhuǎn)癌細(xì)胞而又不損害正常細(xì)胞的“魔彈”。新一代特異性導(dǎo)向式抗腫瘤藥物的希望便寄托在能夠鑒定出在細(xì)胞分裂調(diào)控中起普遍作用的腫瘤抑制基因或癌基因。已經(jīng)克隆和確定的腫瘤抑制基因影響對(duì)下列癌腫的易患性1)成視網(wǎng)膜細(xì)胞瘤(RB1);2)Wilms瘤(WT1);3)Li-Fraumeni(TP53);4)家族性多發(fā)性腺癌(APC);5)I型神經(jīng)纖維瘤病(NF1);6)II型神經(jīng)纖維瘤(NF2);7)vonHippel-Lindau綜合征(VHL);8)2A型多發(fā)性內(nèi)分泌腺瘤病(MEN2A)和黑素瘤(CDKN2)。已經(jīng)確定遺傳圖譜但還沒(méi)有被分離的腫瘤抑制基因的基因座包括下列基因I型多發(fā)性內(nèi)分泌腺瘤病(MEN1);II型Lynch癌家族性綜合征(LCFS2);神經(jīng)母細(xì)胞瘤(NB);基底細(xì)胞痣綜合征(BCNS);Beckwith-Wiedemann綜合征(BWS);腎細(xì)胞癌(RCC);I型結(jié)節(jié)性硬化(TSC1)和II型結(jié)節(jié)性硬化(TSC2)。目前已經(jīng)定性的腫瘤抑制基因,它們編碼與多種蛋白質(zhì)類型具有相似性的產(chǎn)物,其中包括DNA結(jié)合蛋白(WT1)、輔助性轉(zhuǎn)錄調(diào)節(jié)蛋白(RB1)、GTP酶活化蛋白(又稱為GAP)(NF1)、細(xì)胞骨架組份(NF2)、膜結(jié)合受體激酶(MEN2A)、細(xì)胞周期調(diào)控蛋白(CDKN2),還編碼其他的與已知的蛋白質(zhì)沒(méi)有明顯相似性的產(chǎn)物(APC和VHL)。在大多數(shù)情況下,最初通過(guò)遺傳學(xué)研究而鑒別的腫瘤抑制基因已表明在某些偶發(fā)的腫瘤中是缺失的或突變的。該結(jié)果暗示,染色體異常的區(qū)域可用于表明在癌腫的遺傳傾向和偶發(fā)癌腫中所涉及的重要的腫瘤抑制基因的位置。迄今為止確定的數(shù)種腫瘤抑制基因的特征之一是,它們?cè)谀承┠[瘤類型中高頻率地缺失。缺失常常涉及失去一個(gè)等位基因,即所謂的雜合性丟失(lossofheterozygosity,簡(jiǎn)稱LOH),但是也涉及兩個(gè)等位基因的純合缺失(homozygousdeletion)。對(duì)于LOH,余下的等位基因被認(rèn)為不起作用,其原因或者是因?yàn)橐延械倪z傳突變,或者是因?yàn)榈诙蔚呐及l(fā)突變。乳房癌是影響婦女的最主要疾病中的一種。在目前水平,在95歲之前每8個(gè)美國(guó)婦女中有1個(gè)會(huì)得乳房癌(美國(guó)癌癥協(xié)會(huì),1992)。晚期乳房癌的治療通常是徒勞的而且破壞形體,這使該病的早期檢測(cè)在醫(yī)療中占優(yōu)先地位。卵巢癌盡管比乳房癌的發(fā)病率低,但是通??焖僦旅沂敲绹?guó)婦女中死亡率占第4位的腫瘤種類。由遺傳因子造成的乳房癌發(fā)生比例還不清楚,估計(jì)為所有病例的約5%,但是占40歲前診斷病例的約25%(Claus等人,1991)。根據(jù)年齡特異性發(fā)病曲線在50歲左右的拐折,將乳房癌細(xì)分成兩種類型早發(fā)型和晚發(fā)型。一個(gè)基因即BRCA1的突變被認(rèn)為造成約45%的家族性乳房癌,但是造成至少80%同時(shí)有乳房癌和卵巢癌的家族(Easton等人,1993)。分離BRCA1基因的深入努力,從1990年其被首次定位后便已開(kāi)始(Hall等人,1990;Narod等人,1991)。第2個(gè)基因座BRCA2已經(jīng)被定位在染色體13q(Wooster等人,1994),并且似乎造成比例與BRCA1大致相等的早發(fā)型乳房癌,但是造成的卵巢癌危險(xiǎn)性較低。早發(fā)型乳房癌的其余易患性被分成兩類還未定位的家族性癌腫和更罕見(jiàn)的種系基因突變?nèi)鏣P53的突變(Malkin等人,1990)。還提出,缺陷型Ataxia-Telangectasia基因的雜合子攜帶者是高危乳房癌患者(Swift等人,1976;Swift等人,1991)。晚發(fā)型乳房癌經(jīng)常也是家族性的,盡管在親屬中發(fā)病的風(fēng)險(xiǎn)沒(méi)有早發(fā)型乳房癌中那么高(Cannon-Albright等人,1994;Mettlin等人)。但是,還不清楚由遺傳易患性造成的該病例的百分比。乳房癌長(zhǎng)久以來(lái)被認(rèn)為,部分是家族性疾病(Anderson,1972)。許多研究者已研究了基因遺傳的證據(jù)并得出結(jié)論,數(shù)據(jù)與主易患性基因座的顯性遺傳完全一致(Bishop和Gardner,1980;Go等人,1983;Willams和Anderson,1984;Bishop等人,1988;Newman等人,1988;Claus等人,1991)。最近的結(jié)果顯示,存在至少3個(gè)基因座攜帶乳房癌和其他癌腫的易患性。這些基因座是位于染色體17p上的TP53(Malkin等人,1990)、與17q連鎖的易患性基因座BRCA1(Hall等人,1990)和一個(gè)或多個(gè)負(fù)責(zé)未定位地剩余部分的基因座。Hall等人(1990)指出,在親緣族中早發(fā)型遺傳性乳房癌的易患性與染色體17q21連鎖;盡管該小組隨后使用更合適的遺傳模型進(jìn)行的研究與局限于早發(fā)型乳房癌的結(jié)論有些出入(Margaritte等人,1992)??寺∨c17q連鎖的乳房癌傾向性基因(BRCA1)的許多方案需要精確的基因定位研究。對(duì)于BRCA1功能作用的最簡(jiǎn)單模型認(rèn)為,使人傾向于患癌腫的BRCA1等位基因相對(duì)野生型等位基因是隱性的;即含有至少一個(gè)野生型BRCA1等位基因的細(xì)胞不是癌腫性的。但是含有一個(gè)野生型BRCA1等位基因和一個(gè)傾向性等位基因的細(xì)胞偶爾會(huì)因隨機(jī)突變或細(xì)胞分裂過(guò)程中染色體丟失(未分離)而丟失野生型等位基因。該突變細(xì)胞的所有子代缺乏BRCA1的野生型功能,并可能發(fā)展成腫瘤。根據(jù)這一模型,BRCA1傾向性等位基因是隱性的,因而腫瘤易患性以顯性方式遺傳具有一個(gè)傾向性等位基因(和一個(gè)野生型等位基因)的婦女易患癌腫,因?yàn)樗齻兊娜榉可掀ぜ?xì)胞可自發(fā)地丟失野生型BRCA1等位基因。該模型適用于一組癌腫易患性基因座即腫瘤抑制基因或抗癌基因,這一組基因包括成視網(wǎng)膜細(xì)胞瘤基因和神經(jīng)纖維瘤基因。通過(guò)推理,該模型也可解釋BRCA1功能,正如最近所揭示的那樣(Smith等人,1992)。第二種可能性是BRCA1傾向性等位基因是完全顯性的;即BRCA1野生型等位基因不能阻止傾向性等位基因形成腫瘤的功能。因此,攜帶野生型和突變型等位基因的細(xì)胞在發(fā)展成惡性細(xì)胞之前不必丟失BRCA1的野生型拷貝。易患個(gè)體中的乳房細(xì)胞會(huì)發(fā)生某些其他的隨機(jī)變化,從而導(dǎo)致癌腫。如果BRCA1傾向性等位基因是隱性的,那么BRCA1基因預(yù)計(jì)會(huì)在正常的乳房組織中表達(dá),但是不會(huì)在乳房腫瘤中功能性地表達(dá)。相反,如果BRCA1傾向性等位基因是顯性的,那么野生型BRCA1基因在正常乳房組織中可能表達(dá)或可能不表達(dá)。但是,傾向性等位基因在乳房腫瘤細(xì)胞中應(yīng)是表達(dá)的。BRCA1與17q的連鎖關(guān)系分別在5個(gè)患有乳房癌和卵巢癌兩種癌腫的親緣族中的3個(gè)中得到了證實(shí)(Narod等人,1991)。這些研究聲稱將基因定位在一個(gè)非常大的(15厘摩(centiMorgan,cM)或約15,000,000堿基對(duì))、在連鎖標(biāo)記pCMM86(D17S74)側(cè)翼的區(qū)域中。但是,使用pCMMS6周圍的標(biāo)記進(jìn)一步通過(guò)遺傳學(xué)研究確定區(qū)域的嘗試證明是不成功的。隨后的研究表明,基因是相當(dāng)鄰近的(Easton等人,1993),而且最初的分析是有缺點(diǎn)的(Margaritte等人,1992)。Hall等人(1992)最近將BRCA1基因定位于約8cM(約8百萬(wàn)堿基對(duì))的間距中,兩側(cè)為近端的Mfd15(D17S250)和遠(yuǎn)端的人GIP基因。根據(jù)公開(kāi)的資料,稍為更窄的BRCA1基因座間距,在1992年3月的17號(hào)染色體研討會(huì)(Fain,1992)上達(dá)成共識(shí)。這些區(qū)域的大小和與其相關(guān)的不確定性使人們難于設(shè)計(jì)和完成物理圖譜和/或用于分離BRCA1基因的克隆方案。鑒定乳房癌易患性基因座可以便于早期檢測(cè)易患個(gè)體并大大增加我們了解導(dǎo)致癌腫的最初步驟。因?yàn)橐谆夹曰蜃3T谀[瘤發(fā)展中改變,所以克隆這些基因在開(kāi)發(fā)更佳的診斷和預(yù)后產(chǎn)品以及更好的癌腫療法方面也是重要的。發(fā)明概述本發(fā)明一般涉及人類遺傳學(xué)領(lǐng)域。具體地,本發(fā)明涉及用于分離和檢測(cè)人乳房癌傾向性基因(BRCA1)的方法和材料,該基因的某些等位基因造成癌癥尤其是乳房和卵巢癌的易患性。更具體地,本發(fā)明涉及BRCA1基因的種系突變及其在診斷乳房癌和卵巢癌傾向性方面的用途。本發(fā)明還涉及在人乳房癌中BRCA1基因的體細(xì)胞突變及其在診斷和預(yù)后乳房癌和卵巢癌傾向性方面的用途。此外,本發(fā)明還涉及在其他的人癌腫中的BRCA1基因體細(xì)胞突變及其在人癌腫的診斷和預(yù)后方面的用途。本發(fā)明還涉及治療BRCA1基因發(fā)生突變的人癌腫的方法,它包括基因治療、蛋白質(zhì)置換治療和蛋白質(zhì)模擬物。本發(fā)明還涉及篩選用于癌腫治療的藥物。最后,本發(fā)明涉及篩選BRCA1基因的突變,而這些突變可用于診斷乳房癌和卵巢癌的傾向性。附圖簡(jiǎn)述圖1顯示了17號(hào)染色體研討會(huì)所確定的BRCA1周圍的基因座次序。圖1從Fain(1992)復(fù)制而來(lái)。圖2是界定Mfd15-Mfd188區(qū)域部分的YAC示意圖。圖3是在BRCA1區(qū)域中的STS、P1和BAC的示意圖。圖4是人17號(hào)染色體的示意圖。含有BRCA1的有關(guān)區(qū)域被放大,以顯示以前鑒定的2個(gè)基因CA125和RNU2的相對(duì)位置,BRCA1橫跨標(biāo)記D17S855。圖5顯示了BRCA1鋅指域(zinc-fingerdomain)與在Smith-Waterman排列中得分最高的3個(gè)其他的鋅指域的排列圖。RPT1編碼的蛋白質(zhì)似乎是鼠IL-2受體的負(fù)調(diào)控物。RIN1編碼的DNA結(jié)合蛋白具有一個(gè)與鋅指相關(guān)的RING-指基序(motif)。RFP1編碼推斷的轉(zhuǎn)錄因子,該因子是RET癌基因產(chǎn)物的N末端結(jié)構(gòu)域。底線含有C3HC4共有鋅指序列,顯示了形成鋅離子結(jié)合袋的半胱氨酸和組氨酸的位置。圖6是BRCA1mRNA圖,顯示了內(nèi)含子位置和通過(guò)不同剪接而形成的BRCA1mRNA變異形式。內(nèi)含子位置用黑色三角形表示,外顯子在表示cDNA的直線下方給出編號(hào)。頂部的cDNA是用于產(chǎn)生BRCA1肽序列的復(fù)合物。鑒別為cDNA克隆或雜交體選擇克隆的其他形式顯示在下方。圖7顯示了BRCA1的組織表達(dá)格局。印跡從Clontech獲得并含有來(lái)自所示組織的RNA。雜交條件如制造商所建議,并使用由BRCA1核苷酸3631位-3930位構(gòu)成的探針。注意,乳房和卵巢是異源組織,而且相關(guān)上皮細(xì)胞的百分比是可變的。分子量標(biāo)準(zhǔn)為“千堿基”。圖8是5′不翻譯區(qū)加上BRCA1翻譯區(qū)開(kāi)始部分的示意圖,它顯示了內(nèi)含子的位置和通過(guò)不同剪接而形成的BRCA1mRNA變異形式。內(nèi)含子位置用虛線表示。顯示了6種不同的剪接形式。圖9顯示了親緣族2082中的無(wú)義突變。P表示最初篩選到的人,b和c是單倍型攜帶者,a、d、e、f和g不攜帶BRCA1單倍型。C突變?yōu)門形成一個(gè)終止密碼子并且形成一個(gè)限制酶AvrII位點(diǎn)。PCR擴(kuò)增產(chǎn)物用該酶進(jìn)行切割。攜帶者的位點(diǎn)是雜合的,所以顯示3個(gè)條帶。非攜帶者保持未切割狀態(tài)。圖9B顯示了在BRCA1親緣族中的突變和共分離分析。攜帶者個(gè)體在譜系圖中用實(shí)心圓圈和方塊表示。在親緣族1910中有移碼突變。前3個(gè)泳道是對(duì)照用非攜帶者樣本。標(biāo)為1-3的泳道含有攜帶者個(gè)體的序列。泳道4含有的DNA來(lái)自不攜帶BRCA1突變的親緣族成員。菱形表示妨礙了親緣族的鑒別。由額外的C造成的移碼突變?cè)跇?biāo)為1、2和3的泳道中是明顯的。圖9C顯示了在BRCA1親緣族中的突變和共分離分析。攜帶者個(gè)體在譜系圖中用實(shí)心圓圈和方塊表示。親緣族2035中有推斷的調(diào)控突變。顯示了2種不同多態(tài)性(PM1和PM7)的攜帶者和非攜帶者的ASO分析,檢查了他們種系的雜合性并與淋巴細(xì)胞mRNA的雜合性進(jìn)行比較。圖板中上方的2行含有從基因組DNA中擴(kuò)增而得的PCR產(chǎn)物,下方2行含有從cDNA擴(kuò)增而得的PCR產(chǎn)物。“A”和“G”是被ASO檢測(cè)的2個(gè)等位基因。黑點(diǎn)表示在樣本中存在特定的等位基因。PM7的前3列表示一般人群中的3種基因型。圖10A-10H顯示了BRCA1的基因組序列。小寫(xiě)字母表示內(nèi)含子序列,而大寫(xiě)字母表示外顯子序列。在內(nèi)含子中的不確定間隔部分用vvvvvvvvvvvvv表示。已知的多態(tài)性位點(diǎn)用下劃線和粗體字型表示。發(fā)明詳述本發(fā)明一般涉及人類遺傳學(xué)領(lǐng)域。具體地,本發(fā)明涉及用于分離和檢測(cè)人乳房癌傾向性基因(BRCA1)的方法和材料,該基因的某些等位基因造成癌癥尤其是乳房和卵巢癌的易患性。更具體地,本發(fā)明涉及BRCA1基因的種系突變及其在診斷乳房癌和卵巢癌傾向性方面的用途。本發(fā)明還涉及在人乳房癌中BRCA1基因的體細(xì)胞突變及其在診斷和預(yù)后乳房癌和卵巢癌傾向性方面的用途。此外,本發(fā)明還涉及在其他的人癌腫中的BRCA1基因體細(xì)胞突變及其在人癌腫的診斷和預(yù)后方面的用途。本發(fā)明還涉及治療BRCA1基因發(fā)生突變的人癌腫的方法,它包括基因治療、蛋白質(zhì)置換治療和蛋白質(zhì)模擬物。本發(fā)明還涉及篩選用于癌腫治療的藥物。最后,本發(fā)明涉及篩選BRCA1基因的突變,而這些突變可用于診斷乳房癌和卵巢癌的傾向性。本發(fā)明提供了一種分離的多聚核苷酸,它含有所有或部分的BRCA1基因座或突變的BRCA1基因座,長(zhǎng)度較佳地為至少8個(gè)堿基和不超過(guò)約100kb。這種多聚核苷酸可以是反義多聚核苷酸。本發(fā)明還提供了含有這種分離的多聚核苷酸的重組構(gòu)建物,例如適合在轉(zhuǎn)化的宿主細(xì)胞中表達(dá)的重組構(gòu)建物。本發(fā)明還提供了在分析物中檢測(cè)含有部分BRCA1基因座的多聚核苷酸或其表達(dá)產(chǎn)物的方法。這些方法還可含有擴(kuò)增部分BRCA1基因座的步驟,并且還可含有提供一套多聚核苷酸(作為擴(kuò)增該部分BRCA1基因座的引物)的步驟。該方法可用于診斷癌腫的傾向性,或用于診斷或預(yù)后癌腫。本發(fā)明還提供了分離的抗體,較佳地是單克隆抗體,該抗體特異性地與分離的、含有至少5個(gè)由BRCA1基因座編碼的氨基酸殘基的多肽結(jié)合。本發(fā)明還提供了用于在分析物中檢測(cè)含有部分BRCA1基因座的多聚核苷酸的試劑盒,該試劑盒包括包裝在適當(dāng)容器中的、與部分BRCA1基因座互補(bǔ)的多聚核苷酸以及使用說(shuō)明。本發(fā)明還提供了制備一種多聚核苷酸的方法,它包括步驟聚合核苷酸從而產(chǎn)生含有BRCA1基因座至少8個(gè)連續(xù)核苷酸的序列;還提供了制備多肽的方法,它包括步驟聚合氨基酸從而產(chǎn)生含有至少5個(gè)由BRCA1基因座編碼的氨基酸的序列。本發(fā)明還提供了篩選BRCA1基因以鑒別突變的方法。這些方法還可包括擴(kuò)增部分BRCA1基因座的步驟,并且還可含有提供一套多聚核苷酸(作為擴(kuò)增該部分BRCA1基因座的引物)的步驟。該方法可用于診斷癌腫的傾向性,或用于診斷或預(yù)后癌腫。本發(fā)明還提供了篩選可疑BRCA1突變型等位基因以鑒別BRCA1基因中突變的方法。此外,本發(fā)明提供了篩選用于癌腫治療的藥物的方法,以便鑒別出合適的、能恢復(fù)BRCA1基因產(chǎn)物功能的藥物。最后,本發(fā)明提供了針對(duì)癌腫細(xì)胞的基因治療所需的手段。這些治療試劑可以利用含有全部或部分BRCA1基因座的多聚核苷酸,將其置于合適的載體或用更直接的方法將其送遞入該靶細(xì)胞,從而恢復(fù)BRCA1蛋白質(zhì)的功能。治療試劑也可以利用基于部分或全部BRCA1蛋白質(zhì)序列的多肽。這些多肽可在體內(nèi)在功能上替代BRCA1的活性。本發(fā)明發(fā)現(xiàn),使個(gè)體傾向患乳房癌的BRCA1基因座是編碼BRCA1蛋白的基因,已發(fā)現(xiàn)它與已知的蛋白質(zhì)或DNA序列沒(méi)有顯著的同源性。該基因在此處被稱為BRCA1。本發(fā)明發(fā)現(xiàn),在種系中BRCA1基因座的突變表示存在患乳房癌和卵巢癌的傾向性。最后,本發(fā)明發(fā)現(xiàn),BRCA1基因座的體細(xì)胞突變與乳房癌、卵巢癌和其他癌腫關(guān)聯(lián),因此是這些癌腫或癌腫預(yù)后的標(biāo)記。BRCA1基因座的突變事件涉及編碼序列和非編碼序列中的缺失、插入和點(diǎn)突變。從人基因組的17號(hào)人染色體的長(zhǎng)臂上的某一區(qū)域17q(其大小估計(jì)約為8百萬(wàn)堿基對(duì))開(kāi)始,已鑒別出一個(gè)含有遺傳基因座BRCA1的區(qū)域,它造成包括乳房和卵巢癌在內(nèi)的癌腫易患性。含有BRCA1基因座的區(qū)域用各種遺傳技術(shù)進(jìn)行鑒別。遺傳圖譜定位技術(shù)通過(guò)與各遺傳標(biāo)記的重組關(guān)系最早限定了BRCA1區(qū)域。根據(jù)對(duì)具有多個(gè)乳房癌病例的大的延伸家族(“親緣族”)(在某些親緣族中有卵巢癌病例)的研究,精確定位出一個(gè)染色體區(qū)域,它含有BRCA1基因以及在BRCA1基因座中其他假定的易患性等位基因。在BRCA1基因座的遠(yuǎn)端一側(cè)發(fā)現(xiàn)了2個(gè)減數(shù)分裂斷點(diǎn),它們?cè)谶z傳標(biāo)記和疾病之間以重組體表現(xiàn),而且一個(gè)重組體位于BRCA1基因座的近端一側(cè)。因此,含有BRCA1基因座的區(qū)域被這些標(biāo)記在物理上界定了邊界。使用本發(fā)明提供的遺傳標(biāo)記,可以從人的酵母人工染色體(YAC)或人的細(xì)菌人工染色體(BAC)文庫(kù)中鑒別出覆蓋該區(qū)域的克隆。還可以從該區(qū)域鑒別和制備操作更方便的粘粒、P1和BAC克隆,并且從一亞系列克隆中構(gòu)建毗連群(contig)。這些粘粒、P1、YAC和BAC提供了克隆BRCA1基因座的基礎(chǔ),并提供了開(kāi)發(fā)例如有效地診斷和治療乳房癌和/或卵巢癌的試劑的基礎(chǔ)。已經(jīng)從該區(qū)域中分離出BRCA1基因和其他潛在的易患性基因。采用軟件俘獲(一種從連續(xù)的或非連續(xù)的基因組DNA序列中鑒別出可能含有編碼外顯子序列的計(jì)算機(jī)方法)、雜交體選擇技術(shù)和直接篩選方法,用來(lái)自粘粒、P1和BAC區(qū)域中的整個(gè)或部分cDNA插入片段篩選cDNA從而進(jìn)行分離。這些方法被用于獲得在乳房和其他組織中表達(dá)的基因座序列。分析這些候選基因以鑒別賦予癌腫易患性的序列。我們發(fā)現(xiàn),在親緣族中BRCA1基因座的編碼序列有突變,它們?cè)斐膳c17q連鎖的癌腫易患性(即已知的BRCA1)。不知道該基因在此區(qū)域中。本發(fā)明不僅有助于某些癌腫的早期檢測(cè)(這對(duì)病人的存活極為重要),而且還可在患癌腫之前檢測(cè)易患性個(gè)體。群體來(lái)源大量的、記錄完整的Utah州親緣族對(duì)于提供人類遺傳學(xué)研究的良好資料是極為重要的。每個(gè)大親緣族都獨(dú)立地提供了檢測(cè)該家族中BRCA1易患性等位基因是否分離的能力。對(duì)BRCA1基因座的定位和分離提供信息的重組體只能從大到足以證實(shí)存在易患性等位基因的親緣族中獲得。大的同胞關(guān)系(sibship)對(duì)于研究乳房癌尤其重要,因?yàn)锽RCA1易患性等位基因的外顯率會(huì)因年齡和性別而減弱,使有信息的同胞關(guān)系難以發(fā)現(xiàn)。此外,大的同胞關(guān)系對(duì)于通過(guò)近親的單倍型推斷建立已故個(gè)體的單倍型是至關(guān)重要的。盡管其他群體也可提供有用的信息,但是這種研究一般需要更多努力,而且家族一般越小,提供的信息也越少。經(jīng)年齡調(diào)整后,猶他州的乳房癌發(fā)病率比美國(guó)平均發(fā)病率低20%。猶他州的低發(fā)病率很可能是因?yàn)榈谝淮螒言袝r(shí)的年齡早,這增加了在猶他州親緣族中的病例攜帶遺傳傾向性的可能性。遺傳作圖對(duì)于一組有信息的家族,為了將某一疾病與染色體的某一區(qū)域連鎖,需要有遺傳標(biāo)記。這樣的標(biāo)記包括限制性片段長(zhǎng)度多態(tài)性(RFLP)(Botstein等人,1980)、具有不同數(shù)目的串聯(lián)重復(fù)(variablenumberoftandemrepeats,簡(jiǎn)稱VNTR)的標(biāo)記(Jeffreys等人,1985;Nakamura等人,1987)、和基于短串聯(lián)重復(fù)(shorttandemrepeats,簡(jiǎn)稱STR)尤其是CpA重復(fù)的高豐度的DNA多態(tài)性(Weber和May,1989;Litt等人,1989)。為了構(gòu)建遺傳圖譜,人們選擇潛在的遺傳標(biāo)記并用從被研究的親緣族成員抽提的DNA進(jìn)行測(cè)試。用于搜尋與疾病關(guān)聯(lián)的遺傳基因座的遺傳標(biāo)記可以根據(jù)特定情況而加以選擇,或者通過(guò)密集地覆蓋特定的染色體,或者通過(guò)對(duì)染色體特定區(qū)域的仔細(xì)分析。一種選擇與某一疾病連鎖的遺傳標(biāo)記的較佳方法是,評(píng)估親緣族提供的信息度以確定給定多態(tài)性程度下遺傳標(biāo)記之間的理想距離,然后從已知的遺傳圖(這些遺傳圖的間距適中以便使效率最高)上選擇標(biāo)記。親緣族的信息度根據(jù)各標(biāo)記在不相關(guān)個(gè)體中雜合的可能性而計(jì)算出。使用STR標(biāo)記也是最有效的,這些STR標(biāo)記可用PCR通過(guò)擴(kuò)增靶核酸序列而檢測(cè)出;這種標(biāo)記富含信息,便于分析(Weber和May,1989),而且可用多種方案同時(shí)分析(Skolnick和Wallace,1988),這大大減少了所需的實(shí)驗(yàn)次數(shù)。一旦建立了連鎖關(guān)系,人們就需要找到位于疾病基因座兩側(cè)的標(biāo)記,即一個(gè)或多個(gè)位于該疾病基因座近端的標(biāo)記以及一個(gè)或多個(gè)位于該疾病基因座遠(yuǎn)端的標(biāo)記。如果可能,候選標(biāo)記可從已知的遺傳圖上選擇。如果一個(gè)都不知道,那么可用STR技術(shù)鑒別出新的標(biāo)記,如實(shí)施例中所示。遺傳作圖通常是一個(gè)反復(fù)過(guò)程。在本發(fā)明中,起初是確定BRCA1基因座周圍的側(cè)翼遺傳標(biāo)記,然后用其他逐漸更靠近BRCA1基因座的標(biāo)記置換這些側(cè)翼標(biāo)記。作為最初步驟,通過(guò)大的延伸親緣族而確定的重組事件特別有助于將BRCA1基因座定位于某一特定遺傳標(biāo)記的遠(yuǎn)端或近端(Goldgar等人,1994)。在本發(fā)明公開(kāi)之前,在BRCA1周圍的區(qū)域還沒(méi)有被很好地作圖,而且標(biāo)記很少。因此,分析從YAC上亞克隆而來(lái)的粘粒上的短重復(fù)序列(已作物理圖譜)以開(kāi)發(fā)新的遺傳標(biāo)記。用這種方法,發(fā)現(xiàn)了本發(fā)明的一個(gè)標(biāo)記42D6,它替換pCMM86作為BRCA1區(qū)域的遠(yuǎn)端一側(cè)的標(biāo)記。因?yàn)?2D6距pCMM86約14cM,所以BRCA1區(qū)域被縮小了約14厘摩(Easton等人,1993)。這樣,本發(fā)明便從發(fā)現(xiàn)BRCA1區(qū)域的連鎖更緊密的遠(yuǎn)端一側(cè)標(biāo)記而開(kāi)始。然后發(fā)現(xiàn)BRCA1在遺傳標(biāo)記Mfd15的遠(yuǎn)端。所以,顯示BRCA1應(yīng)在由Mfd15和42D6所界定的6-10百萬(wàn)堿基區(qū)域中。隨后發(fā)現(xiàn),標(biāo)記Mfd191在Mfd15的遠(yuǎn)端并在BRCA1的近端。因此,用Mfd191替代Mfd15作為最近端的遺傳標(biāo)記。類似地,發(fā)現(xiàn)遺傳標(biāo)記Mfd188可替代遺傳標(biāo)記42D6,這將含有BRCA1基因座的區(qū)域縮小到約1.5百萬(wàn)堿基。然后使用本領(lǐng)域中已知的和此處描述的技術(shù),用tdj1474替代標(biāo)記Mfd191作為近端標(biāo)記,并用U5R替代Mfd188作為遠(yuǎn)端標(biāo)記,這進(jìn)一步將BRCA1區(qū)域縮小到足夠小區(qū)域,從而可以分離和定性研究BRCA1基因座(見(jiàn)圖3)。物理作圖采用3種不同方法對(duì)該區(qū)域進(jìn)行物理作圖。第一種方法是使用酵母人工染色體(YAC)克隆由UR5和tdj1474所界定的區(qū)域。第二種方法是構(gòu)建一套覆蓋含有BRCA1基因座的區(qū)域的P1、BAC和粘??寺?。酵母人工染色體(YAC)。一旦鑒別出足夠小的、含有BRCA1基因座的區(qū)域,便可以通過(guò)鑒別一套覆蓋該區(qū)域的重疊YAC而物理性分離該區(qū)域的DNA。有用的YAC可從已知的文庫(kù)中分離,例如St.Louis和CEPHYAC文庫(kù),這些文庫(kù)被廣泛分發(fā)并且每個(gè)文庫(kù)含有約50000個(gè)YAC。分離的YAC來(lái)自這些可公開(kāi)獲得的文庫(kù),并且可從包括MichiganGenomeCenter在內(nèi)的各種地方獲得。很明顯,可獲得這些YAC的其他人,如果沒(méi)有本發(fā)明的公開(kāi)內(nèi)容,是不知道我們選擇的特定YAC的價(jià)值的,因?yàn)樗麄儾恢滥男℡AC在含有BRCA1基因座的最小區(qū)域之內(nèi),哪些在該最小區(qū)域之外。粘粒、P1和BAC克隆。在本發(fā)明中,通過(guò)獲得粘粒、P1和BAC克隆來(lái)覆蓋該區(qū)域是有利的。與YAC插入片段相比,這些尺寸更小的插入片段可以更有用地用作特異的雜交探針。此外,具有克隆于細(xì)菌細(xì)胞中而不是酵母細(xì)胞中的DNA,可以大大增加操作感興趣DNA的方便程度,并改善雜交分析中信號(hào)-噪音比。對(duì)于YAC的粘粒亞克隆,用限制酶Sau3A部分消化DNA,然后克隆入pWE15粘粒載體(Stratagene,目錄#1251201)的BamHI位點(diǎn)。含有人序列的粘粒的篩選如下進(jìn)行與人重復(fù)DNA(如Gibco/BRL,人C0t-1DNA,目錄5279SA)的雜交,然后用各種技術(shù)進(jìn)行指紋分析,如實(shí)施例中詳細(xì)所述。通過(guò)篩選用人全基因組構(gòu)建的、具有特定的來(lái)自YAC、粘粒或P1和BAC的序列標(biāo)記位點(diǎn)(STS),獲得P1和BAC克隆,并如本文所述進(jìn)行分離。這些P1、BAC和粘粒克隆用散布重復(fù)序列(interspersedrepetitivesequence,簡(jiǎn)稱IRS)PCR和/或限制酶消化,隨后進(jìn)行凝膠電泳并比較形成的DNA片段(“指紋”)而加以比較(Maniatis等人,1982)??寺∵€可用STS的存在與否進(jìn)行定性。指紋用于確定一套重疊的毗連克隆,這套克隆覆蓋該區(qū)域但又不過(guò)多,在本文中被稱為“最少磚塊道路”。這種最少磚塊道路構(gòu)成了隨后鑒別起源于BRCA1基因座的cDNA的實(shí)驗(yàn)基礎(chǔ)。P1和BAC克隆對(duì)空隙的覆蓋。為了用基因組克隆覆蓋已鑒別的粘粒之間BRCA1毗連群(contig)中的任何空隙,使用在P1和BAC載體中的克隆(它們含有比P1的粘粒約大2倍的基因組DNA插入片段并且也比BAC的還大)(Sternberg,1990;Sternberg等人,1990;Pierce等人,1992;Shizuya等人,1992)。由GenomeSciences使用我們提供的用于篩選的PCR引物而分離P1克隆。BAC是在MelSimon博士的實(shí)驗(yàn)室中通過(guò)雜交技術(shù)提供的。使用P1克隆的方案也允許用不來(lái)自YAC的一套獨(dú)立克隆來(lái)覆蓋基因組區(qū)域。這保留了在YAC中沒(méi)有被檢測(cè)到的其他缺失的可能性。這些來(lái)自P1克隆的新序列提供了進(jìn)一步篩選候選基因的材料,如下所述。分離基因有許多技術(shù)可用于測(cè)試基因組克隆中是否存在可能是人們想要分離的基因座編碼序列的候選序列,其中包括但并不限于a.動(dòng)物印跡b.鑒別HTF島c.外顯子捕獲d.將cDNA與粘?;験AC雜交e.篩選cDNA文庫(kù)(a)動(dòng)物印跡。第一種技術(shù)是將粘粒與Southern印跡雜交以鑒別那些進(jìn)化上保守,從而會(huì)對(duì)來(lái)自與人親緣關(guān)系不同的物種(如猴、牛、雞、豬、小鼠和大鼠)的DNA給出陽(yáng)性雜交信號(hào)的DNA序列。含有來(lái)自各種物種的這種DNA的Southern印跡是可購(gòu)得的(Clonetech,目錄7753-1)。(b)鑒別HTF島。第二種技術(shù)涉及找到富含核苷酸C和G的區(qū)域,這種區(qū)域常常在編碼序列旁邊或之中。這種序列被稱為HTF(HpaI小片段,HpaItinyfragment,簡(jiǎn)稱HTF)或CpG島,因?yàn)閷?duì)含有CpG二聚體的位點(diǎn)特異的限制酶在該區(qū)域會(huì)頻繁地切割(Lindsay等人,1987)。(c)外顯子捕獲。第三種技術(shù)是外顯子捕獲,該方法鑒別基因組DNA中含有剪接部位從而可能含有基因編碼序列的序列。外顯子擴(kuò)增(Buckler等人,1991)被用于從上述的DNA克隆中選擇和擴(kuò)增外顯子。外顯子的擴(kuò)增基于選擇出位于功能性5′和/或3′剪接位點(diǎn)兩側(cè)的RNA序列。外顯子擴(kuò)增產(chǎn)物被用于篩選乳房cDNA文庫(kù)以鑒別一些可實(shí)際操作的候選基因供進(jìn)一步研究。外顯子捕獲還可用計(jì)算機(jī)程序或軟件捕獲法在測(cè)序過(guò)的DNA小片段上進(jìn)行。(d)將cDNA與粘粒、P1、BAC或YAC雜交。第四種方法是選擇性富集技術(shù)的改進(jìn)技術(shù),它采用cDNA與粘粒、P1、BAC或YAC的雜交,從而允許轉(zhuǎn)錄序列被鑒別出并且從克隆的基因組DNA中回收(Kandpal等人,1990)。出于本目的而改進(jìn)的選擇性富集技術(shù),涉及將來(lái)自YAC中的BRCA1區(qū)域的DNA與柱基質(zhì)結(jié)合,然后從相關(guān)文庫(kù)中選擇出與結(jié)合的DNA發(fā)生雜交的cDNA,隨后通過(guò)擴(kuò)增和純化結(jié)合的DNA,從而大大富集由克隆基因組DNA所代表區(qū)域的cDNA。(e)鑒別cDNA。第五種技術(shù)是鑒別對(duì)應(yīng)于BRCA1基因座的cDNA。使用用上述任何技術(shù)選擇的、含有假定編碼序列的雜交探針,來(lái)篩選各種文庫(kù),包括乳房組織cDNA文庫(kù)、卵巢cDNA文庫(kù)和任何其他必要的文庫(kù)。直接選擇cDNA主題中另一種變化形式也被用于發(fā)現(xiàn)BRCA1的候選基因(Lovett等人,1991;Futreal,1993)。該方法使用粘粒、P1或BAC的DNA作為探針。探針DNA用切成平末端的限制酶如HaeIII消化。再將雙鏈銜接頭(adapter)連于DNA并作為隨后PCR擴(kuò)增反應(yīng)中引物的結(jié)合位置(PCR反應(yīng)中使用生物素化的引物)。靶cDNA的產(chǎn)生是用組織樣品如乳房組織的mRNA,通過(guò)隨機(jī)引發(fā)或寡聚(dT)引發(fā)第一條鏈的合成然后再合成第二條鏈。使cDNA末端成平端,再連于雙鏈銜接頭。這些銜接頭作為PCR的擴(kuò)增位點(diǎn)。使靶序列和探針序列變性,然后與人C0t-1DNA混合以封閉重復(fù)序列。在高C0t-1/2值下進(jìn)行溶液雜交,以保證稀少的靶cDNA分子發(fā)生雜交。退火后的材料再用抗生物素蛋白珠進(jìn)行捕獲,在高嚴(yán)緊條件下洗滌,保留的cDNA被洗滌并用PCR擴(kuò)增。選擇出的cDNA再進(jìn)行進(jìn)一步的富集處理,然后克隆入質(zhì)粒載體以供分析。測(cè)試cDNA的候選性通過(guò)在從患病親緣族成員中抽提出的DNA中發(fā)現(xiàn)一些序列,它們會(huì)形成異常BRCA1基因產(chǎn)物或異常水平的BRCA1基因產(chǎn)物,從而獲得了cDNA是BRCA1基因座的證據(jù)。這種BRCA1易患性等位基因會(huì)在大親緣族中與疾病一起分離。它們?cè)诨既榉堪┖吐殉舶┑姆怯H緣族個(gè)體中的存在頻率遠(yuǎn)高于一般人群中的個(gè)體。最后,因?yàn)槟[瘤經(jīng)常在基因座發(fā)生體細(xì)胞突變(而在其他情況下是種系突變),所以我們預(yù)計(jì),正常的種系BRCA1等位基因突變成與從腫瘤組織中抽提DNA中BRCA1易患性等位基因相同或相似的序列。無(wú)論人們是將來(lái)自腫瘤組織的BRCA1序列與來(lái)自同一個(gè)體的種系BRCA1等位基因相比,還是人們將來(lái)自癌腫病例的種系BRCA1等位基因與那些沒(méi)有患病個(gè)體的等位基因相比,關(guān)鍵是發(fā)現(xiàn)足夠嚴(yán)重從而可導(dǎo)致基因產(chǎn)物正常功能發(fā)生明顯崩潰的突變。這些突變可有多種形式。最嚴(yán)重的形式是移碼突變或大的缺失,這樣造成基因編碼異常蛋白或者顯著改變蛋白質(zhì)表達(dá)的蛋白。稍不嚴(yán)重的破壞性突變包括小的框架內(nèi)缺失和非保守堿基對(duì)置換,這對(duì)產(chǎn)生的蛋白質(zhì)有顯著影響如半胱氨酸殘基的改變、從堿性氨基酸變?yōu)樗嵝园被峄蛳喾吹淖兓?、從疏水性氨基酸變?yōu)橛H水性氨基酸或相反的變化、或其他影響蛋白質(zhì)二級(jí)、三級(jí)或四級(jí)結(jié)構(gòu)的突變。沉默突變或其他造成保守氨基酸置換的突變一般預(yù)計(jì)不會(huì)完全破壞蛋白質(zhì)功能。根據(jù)本發(fā)明的診斷和預(yù)后方法,可檢測(cè)野生型BRCA1基因座的改變。此外,該方法的操作可通過(guò)檢測(cè)野生型BRCA1基因座并證實(shí)在BRCA1基因座不具有癌腫的傾向性?!耙吧突虻母淖儭卑行问降耐蛔儯ㄔ诰幋a區(qū)域和非編碼區(qū)域的缺失、插入和點(diǎn)突變。缺失可以是整個(gè)基因或只是部分基因的缺失。點(diǎn)突變可以造成終止密碼子、移碼突變或氨基酸置換。體細(xì)胞突變是僅發(fā)生在某些組織如腫瘤組織中的突變,不會(huì)在種系中遺傳。種系突變可以在任一身體組織中找到而且是遺傳的。若僅有一個(gè)單一等位基因呈體細(xì)胞突變,那么說(shuō)明是處于早期瘤形成狀態(tài)。然而,若兩個(gè)等位基因都突變,那么說(shuō)明是處于晚期瘤形成狀態(tài)。因此,BRCA1突變的發(fā)現(xiàn)可以提供診斷和預(yù)后信息??梢詫?duì)沒(méi)有缺失的一個(gè)BRCA1等位基因(即在作為攜帶BRCA1缺失染色體的姐妹染色體上的BRCA1等位基因)進(jìn)行篩選,以確定是否有其他的突變?nèi)绮迦?、小缺失和點(diǎn)突變。據(jù)信,在腫瘤組織中發(fā)現(xiàn)的許多突變導(dǎo)致BRCA1基因產(chǎn)物表達(dá)下降。但是,導(dǎo)致無(wú)功能的基因產(chǎn)物的突變也會(huì)產(chǎn)生癌腫。點(diǎn)突變事件可以發(fā)生在調(diào)控區(qū)域如在基因的啟動(dòng)子中,從而導(dǎo)致mRNA表達(dá)的消失或下降。點(diǎn)突變還會(huì)破壞適當(dāng)?shù)腞NA加工,從而導(dǎo)致BRCA1基因產(chǎn)物表達(dá)的消失或者導(dǎo)致mRNA穩(wěn)定性或翻譯效率的下降。有用的診斷技術(shù)包括,但并不限于熒光原位雜交(FISH)、直接DNA測(cè)序、脈沖電場(chǎng)凝膠電泳(PFGE)分析、Southern印跡分析、單鏈構(gòu)象分析(SSCA)、核糖核酸酶(RNase)保護(hù)測(cè)定、等位基因特異的寡核苷酸(ASO)、點(diǎn)雜交分析和聚合酶鏈反應(yīng)-單鏈構(gòu)象多態(tài)性(PCR-SSCP),下文將更詳細(xì)地描述?;及┠[如乳房癌和卵巢癌以及此處指出的其他癌腫的傾向性,可以通過(guò)測(cè)試任何人組織中BRCA1基因的突變而確定。例如,一個(gè)遺傳有種系BRCA1突變的人將易患癌腫。這一點(diǎn)可以通過(guò)測(cè)試來(lái)自該個(gè)體的任何身體組織中的DNA而確定。最簡(jiǎn)單地,可以抽取血液并且從血細(xì)胞中抽提出DNA。此外,通過(guò)檢測(cè)胎兒細(xì)胞、胎盤細(xì)胞或羊水細(xì)胞是否有BRCA1基因的突變可以進(jìn)行產(chǎn)前診斷。野生型BRCA1等位基因的改變(例如由點(diǎn)突變或缺失而造成的)可以用此處所述的任一手段檢測(cè)出。有數(shù)種方法可用于檢測(cè)DNA序列變化。直接DNA測(cè)序,無(wú)論手工測(cè)序還是自動(dòng)熒光測(cè)序都能檢測(cè)序列變化。對(duì)于象BRCA1那么大的基因,手工測(cè)序非常費(fèi)力,但是在最佳條件下在基因編碼序列中的突變很少被漏檢。另一種方法是單鏈構(gòu)象多態(tài)性分析(SSCA)(Orita等人,1989)。該方法不檢測(cè)所有的序列變化,尤其當(dāng)DNA片段大于200bp時(shí),但是可優(yōu)化以檢測(cè)大多數(shù)DNA變化。檢測(cè)靈敏度的下降是不利的,但是SSCA帶來(lái)的更高的處理能力使它成為一種有吸引力的、有用的替代直接測(cè)序的方法,用于基礎(chǔ)研究的檢測(cè)突變。在SSCA凝膠上遷移率(泳動(dòng)率)改變的片段再被測(cè)序以確定DNA序列改變的確切本質(zhì)。其他基于檢測(cè)兩條互補(bǔ)DNA鏈之間的不匹配的方法,包括夾子變性凝膠電泳(clampeddenaturinggelelectrophoresis,簡(jiǎn)稱CDGE)(Sheffield等人,1991)、異源雙鏈分析(HA)(White等人,1992)和化學(xué)錯(cuò)配切割(chemicalmismatchcleavage,簡(jiǎn)稱CMC)(Grompe等人,1989)。上述方法中沒(méi)有一種可檢測(cè)大缺失、重復(fù)或插入,也不能檢測(cè)影響蛋白質(zhì)表達(dá)或轉(zhuǎn)錄的調(diào)控突變。其他可檢測(cè)這些類型突變的方法如蛋白質(zhì)截短分析或不對(duì)稱分析,只能檢測(cè)特殊類型的突變而不能檢測(cè)錯(cuò)義突變。對(duì)于目前已有的檢測(cè)DNA序列變化的方法回顧,可在最近Grompe(1993)的總結(jié)中找到。一旦知道了一個(gè)突變,那么便可用等位基因特異性檢測(cè)方法如等位基因特異性寡核苷酸(ASO)雜交術(shù)來(lái)快速篩選大量的其他樣品是否有同一突變。為了在組織中檢測(cè)野生型BRCA1基因的改變,須將該組織分離出而不含周圍正常組織。富集含腫瘤細(xì)胞的組織制品的方法是本領(lǐng)域中公知的。例如,可以從石蠟或低溫恒溫器的切段中分離組織。還可以用流式細(xì)胞計(jì)量術(shù)將癌腫細(xì)胞與正常細(xì)胞分開(kāi)。這些技術(shù)以及其他將腫瘤細(xì)胞和正常細(xì)胞分開(kāi)的技術(shù)是本領(lǐng)域中公知的。如果腫瘤組織被正常細(xì)胞嚴(yán)重污染,那么突變的檢測(cè)將變得更困難。一種檢測(cè)DNA序列多態(tài)性的快速的初步分析法是觀察一系列用一個(gè)或多個(gè)限制酶、更佳地是用大量限制酶消化的DNA的Southern印跡。每張印跡片含有一系列的正常個(gè)體和一系列的癌腫病例、腫瘤、或兩者。顯示出雜交片段的Southern印跡(當(dāng)用靠近或含有BRCA1基因座的序列作為探針雜交時(shí),在長(zhǎng)度上會(huì)與對(duì)照DNA有差別。)表明可能存在一個(gè)突變。如果使用會(huì)產(chǎn)生非常大的限制性片段的限制酶時(shí),那么可以使用脈沖電場(chǎng)凝膠電泳(PFGE)。點(diǎn)突變的檢測(cè),可以用本領(lǐng)域中公知的技術(shù)進(jìn)行BRCA1等位基因的分子克隆并對(duì)該等位基因測(cè)序而實(shí)現(xiàn)?;蛘?,可以用已有技術(shù)對(duì)來(lái)自腫瘤組織的基因組DNA制品直接擴(kuò)增基因序列。然后再確定擴(kuò)增序列的DNA序列。有6種已知的、比較完整的但仍不是直接的測(cè)試方法可以確定易患性等位基因的存在1)單鏈構(gòu)象分析(SSCA)(Orita等人,1989);2)變性梯度凝膠電泳(DGGE)(Wartell等人,1990;Sheffield等人,1989);3)RNase保護(hù)測(cè)定(Finkelstein等人,1990;Kinszler等人,1991);4)等位基因特異的寡核苷酸(ASO)(Conner等人,1983);5)使用識(shí)別核苷酸錯(cuò)配的蛋白質(zhì)如大腸桿菌mutS蛋白質(zhì)(Modrich,1991)和6)等位基因特異的PCR(Rano&amp;Kidd,1989)。對(duì)于等位基因特異性PCR,使用在其3′端會(huì)與特定的BRCA1突變雜交的引物。如果特定的BRCA1突變不存在,則觀察不到擴(kuò)增產(chǎn)物。還可以使用如在歐洲專利申請(qǐng)No.0332435和Newton等人(1989)的文章中公開(kāi)的擴(kuò)增不應(yīng)突變的體系(AmplificationRefractoryMutationSystem,ARMS)?;虻牟迦牒腿笔н€可以通過(guò)克隆、測(cè)序和擴(kuò)增而檢測(cè)。此外,還可以使用針對(duì)該基因或周圍標(biāo)記基因的限制性片段長(zhǎng)度多態(tài)性(RFLP)探針,以便以多態(tài)性片段形式評(píng)估等位基因的改變或插入。該方法對(duì)于篩選患病個(gè)體的親屬是否具有該個(gè)體中發(fā)現(xiàn)的BRCA1突變特別有用。也可以使用本領(lǐng)域中公知的檢測(cè)插入和缺失的其他方法。在前三種方法(即SSCA、DGGE和RNase保護(hù)測(cè)定)中,出現(xiàn)一條新的電泳條帶。SSCA檢測(cè)遷移有所不同的條帶,因?yàn)樾蛄凶兓斐蓡捂湻肿觾?nèi)堿基配對(duì)的差別。RNase保護(hù)涉及將突變型多聚核苷酸切成兩個(gè)或多個(gè)更小的片段。DGGE是用變性梯度凝膠,檢測(cè)與野生型序列相比時(shí)突變型序列的遷移率。在等位基因特異的寡核苷酸測(cè)定中,設(shè)計(jì)出可以檢測(cè)特異性序列的寡核苷酸,然后通過(guò)檢測(cè)雜交信號(hào)的存在與否而進(jìn)行分析。在mutS測(cè)定中,蛋白質(zhì)只與由突變型和野生型序列形成的、含有核苷酸錯(cuò)配的異源雙鏈序列結(jié)合。根據(jù)本發(fā)明,錯(cuò)配物是雜合的核酸雙鏈,其中雙鏈之間不是100%互補(bǔ)。缺失、插入、倒位或置換可造成整體同源性的減小。錯(cuò)配檢測(cè)可以用于檢測(cè)基因或其mRNA產(chǎn)物中的點(diǎn)突變。雖然這些技術(shù)比測(cè)序的靈敏度低,但是對(duì)于大量的腫瘤樣本而言,其操作更為簡(jiǎn)便。錯(cuò)配切割技術(shù)的一個(gè)例子是RNase保護(hù)法。在本發(fā)明的實(shí)踐中,該方法涉及使用與人野生型BRCA1基因編碼序列互補(bǔ)的標(biāo)記核糖核酸探針。該核糖核酸探針和從腫瘤組織中分離出的mRNA或DNA一起退火(雜交),隨后用能夠檢測(cè)雙鏈RNA結(jié)構(gòu)中某些錯(cuò)配的酶核糖核酸酶A(RNaseA)消化。如果RNaseA檢測(cè)到錯(cuò)配,它就在錯(cuò)配位置將其切割。因此,退火的RNA產(chǎn)物在電泳凝膠基質(zhì)中分離時(shí),如果錯(cuò)配被RNaseA檢測(cè)到并切斷,那么會(huì)觀察到一個(gè)RNA產(chǎn)物,它比全長(zhǎng)的、由核糖核酸探針與mRNA或DNA形成的雙鏈RNA更小。核糖核酸探針不必是全長(zhǎng)的BRCA1mRNA或基因,它可以是它們的一個(gè)片段。如果核糖核酸探針僅含有BRCA1mRNA或基因的片段,那么需要用大量的這些探針來(lái)篩選整個(gè)mRNA序列是否存在錯(cuò)配。按類似的方式,通過(guò)酶法或化學(xué)方法的切割,可以使用DNA探針來(lái)檢測(cè)錯(cuò)配。如參見(jiàn)Cotton等人,1988;Shenk等人,1975;Novack等人,1986?;蛘?,通過(guò)錯(cuò)配雙鏈相對(duì)于正確配對(duì)雙鏈的電泳遷移率(泳動(dòng)率)的改變而檢測(cè)錯(cuò)配。如參見(jiàn)Cariello,1988。用核糖核酸探針或DNA探針時(shí),在雜交之前用PCR(見(jiàn)下文)擴(kuò)增含有突變的細(xì)胞mRNA或DNA。用Southern雜交法也可檢測(cè)BRCA1基因DNA的變化,尤其當(dāng)變化是大的重排如缺失和插入時(shí)。也可以用等位基因特異性探針篩選用PCR擴(kuò)增的BRCA1基因DNA序列。這些探針是核酸寡聚體,每種含有一個(gè)攜帶已知突變的BRCA1基因序列的區(qū)域。例如,一個(gè)寡聚體可以長(zhǎng)約30核苷酸,并且對(duì)應(yīng)于一部分BRCA1基因序列。通過(guò)使用一組這種等位基因特異的探針,便可以篩選PCR擴(kuò)增產(chǎn)物,從而確定在BRCA1基因中是否存在已確定的突變類型。例如可以在尼龍濾膜上用擴(kuò)增的BRCA1序列和等位基因特異性探針進(jìn)行雜交。在嚴(yán)緊雜交條件下與特定的探針發(fā)生雜交表示,在這種腫瘤組織中存在與等位基因特異性探針相同類型的突變。對(duì)于候選基因座突變的最明確的測(cè)試方法是直接比較癌腫病人和對(duì)照人群的基因組BRCA1序列?;蛘撸藗兛梢杂肞CR方法擴(kuò)增后對(duì)信使RNA進(jìn)行測(cè)序,從而不必確定候選基因的外顯子結(jié)構(gòu)。癌腫病人在BRCA1編碼區(qū)域之外的突變可以通過(guò)檢測(cè)BRCA1基因附近或內(nèi)部的非編碼區(qū)域如內(nèi)含子和調(diào)控序列而檢測(cè)出。表明非編碼區(qū)域的突變是至關(guān)重要的早期證明來(lái)自Northern印跡實(shí)驗(yàn),該實(shí)驗(yàn)揭示出與對(duì)照個(gè)體相比,在癌腫病人中有大小異?;蚋哓S度的信使RNA分子。BRCA1mRNA表達(dá)的改變可以用本領(lǐng)域中公知的技術(shù)進(jìn)行檢測(cè)。其中包括Northem印跡分析、PCR擴(kuò)增和RNase保護(hù)法。mRNA表達(dá)的減少表明野生型BRCA1基因發(fā)生了改變。還可以通過(guò)篩選野生型BRCA1蛋白質(zhì)的改變而檢測(cè)野生型BRCA1基因的改變。例如,可以使用具有針對(duì)BRCA1的免疫反應(yīng)性單克隆抗體來(lái)篩選組織。缺乏相應(yīng)的抗原便表示有BRCA1突變。也可以使用對(duì)突變型等位基因產(chǎn)物特異的抗體來(lái)檢測(cè)突變型BRCA1基因產(chǎn)物。這些免疫學(xué)測(cè)定可以以本領(lǐng)域中公知的方便方式進(jìn)行。其中包括Western印跡、免疫組織化學(xué)測(cè)定和酶聯(lián)免疫吸附測(cè)定(ELISA)。任何檢測(cè)BRCA1蛋白質(zhì)改變的方法都可以用于檢測(cè)野生型BRCA1基因的改變。可以使用功能測(cè)定法如蛋白質(zhì)結(jié)合確定法。此外,可以使用檢測(cè)BRCA1的生物化學(xué)功能的分析方法。尋找到突變型BRCA1基因產(chǎn)物就表示存在野生型BRCA1基因的改變。還可以在其他的人體樣品如血清、糞便、尿液和唾液中檢測(cè)突變型BRCA1基因或基因產(chǎn)物??梢詫⑸鲜龅臋z測(cè)組織中突變型BRCA1基因或基因產(chǎn)物的相同技術(shù)應(yīng)用于其他的人體樣品。癌腫細(xì)胞會(huì)從腫瘤上脫落下來(lái)從而出現(xiàn)在這些人體樣品中。此外,BRCA1基因產(chǎn)物本身會(huì)分泌入細(xì)胞外空間,從而甚至在沒(méi)有癌腫細(xì)胞的這些人體樣品中被找到。通過(guò)對(duì)這些人體樣品進(jìn)行篩選,可以對(duì)許多種癌腫進(jìn)行早期診斷。另外,可以更容易地通過(guò)測(cè)試人體樣品中是否存在突變型BRCA1基因或基因產(chǎn)物而監(jiān)測(cè)化療或放療的進(jìn)展。本發(fā)明的診斷方法還適用于任何一種在腫瘤發(fā)生中BRCA1發(fā)揮作用的腫瘤。本發(fā)明的診斷方法對(duì)于醫(yī)療人員很有用,能使他們決定適當(dāng)?shù)闹委煼桨?。本發(fā)明的引物對(duì)可用于通過(guò)PCR確定某一特定BRCA1等位基因的核苷酸序列。單鏈DNA引物對(duì)可以與染色體17q21上的BRCA1基因內(nèi)部或周圍的序列進(jìn)行退火,以便引發(fā)BRCA1基因本身的DNA合成擴(kuò)增。整套的這些引物可以合成所有的BRCA1基因編碼序列(即外顯子)的核苷酸。更佳地,一套引物可以合成內(nèi)含子和外顯子序列。也可以使用等位基因特異的引物。這些引物只與特定的BRCA1突變型等位基因發(fā)生退火,從而只能擴(kuò)增出以突變型等位基因作為模板的產(chǎn)物。為了便于隨后的擴(kuò)增序列克隆,引物可以在其5′端含有限制酶切位點(diǎn)序列。因此除少數(shù)形成限制性酶切位點(diǎn)所需的核苷酸外,所有的引物核苷酸來(lái)自BRCA1序列或靠近BRCA1的序列。這些酶和酶切位點(diǎn)是本領(lǐng)域中公知的。引物本身可以用本領(lǐng)域中公知的技術(shù)合成。一般可以使用市售的寡核苷酸合成儀制備引物。根據(jù)SEQIDNO1所示的BRCA1開(kāi)放閱閱讀框架,設(shè)計(jì)特定的引物是本領(lǐng)域中的技術(shù)人員所能勝任的。本發(fā)明提供的核酸探針能用于許多目的。如上所述,它們可以用于與基因組DNA的Southern雜交和用于RNase保護(hù)法以檢測(cè)點(diǎn)突變。這些探針還可以用于檢測(cè)PCR擴(kuò)增產(chǎn)物。使用其他技術(shù),它們還可以用于檢測(cè)BRCA1基因或mRNA的錯(cuò)配。已經(jīng)發(fā)現(xiàn),具有野生型BRCA1基因的個(gè)體沒(méi)有由BRCA1等位基因?qū)е碌陌┠[。但是,干擾BRCA1蛋白功能的突變與癌腫的形成有關(guān)。因此,改變的(或突變型)BRCA1基因(它產(chǎn)生功能喪失或功能改變的蛋白質(zhì))的存在,與癌腫的高風(fēng)險(xiǎn)之間直接相關(guān)。為了檢測(cè)BRCA1基因突變,制備生物樣品并分析被分析的BRCA1等位基因序列和野生型BRCA1等位基因序列之間的差別。用上述的任何一種技術(shù)可以先鑒別出突變型BRCA1等位基因。然后再對(duì)突變型等位基因進(jìn)行測(cè)序以鑒別特定等位基因的具體突變類型?;蛘撸蛔冃虰RCA1等位基因可先通過(guò)用常規(guī)技術(shù)鑒別出突變型(改變的)BRCA1蛋白而鑒別出。突變型等位基因再測(cè)序以鑒別出各等位基因的具體突變類型。這些突變,尤其是那些導(dǎo)致BRCA1蛋白功能改變的突變,接著被用于本發(fā)明的診斷和預(yù)后方法。定義本發(fā)明使用下列定義“多聚核苷酸的擴(kuò)增”采用諸如聚合酶鏈反應(yīng)(PCR)、連接擴(kuò)增(或稱為連接酶鏈反應(yīng),LCR)和基于使用Q-beta復(fù)制酶的擴(kuò)增方法。這些方法是公知的而且在本領(lǐng)域中被廣泛使用。例如參見(jiàn)美國(guó)專利4,683,195和4,683,202以及Innis等人,1990(PCR)和Wu等人,1989a(LCR)。用于進(jìn)行PCR的試劑和硬件已商品化。用于擴(kuò)增BRCA1區(qū)域序列的引物最好互補(bǔ)于并且特異性地雜交于BRCA1區(qū)域中的序列或者界定靶區(qū)域的區(qū)域序列。用擴(kuò)增方法產(chǎn)生的BRCA1序列可以直接測(cè)序。或者,擴(kuò)增的序列可以在序列分析之前先被克隆,但該方法稍不可取。對(duì)用酶法擴(kuò)增的基因組片段進(jìn)行直接克隆和測(cè)序分析的方法已由Scharf(1986)描述過(guò)。“被分析的多聚核苷酸”和“被分析的鏈”指單鏈或雙鏈多聚核苷酸,它可能包含一段靶序列而且存在于各種不同類型的樣品(包括生物樣品)中?!翱贵w”。本發(fā)明還提供了能夠特異性地與BRCA1多肽或其片段結(jié)合、或者與BRCA1區(qū)域的多聚核苷酸序列(特別是BRCA1基因座或其部分)結(jié)合的多克隆和/或單克隆抗體、及其片段、以及其免疫結(jié)合等價(jià)物。術(shù)語(yǔ)“抗體”指均一的分子統(tǒng)一體或由多種不同的分子統(tǒng)一體組成的混合物如血清產(chǎn)物。多肽可以在肽合成儀上合成并偶聯(lián)于載體分子(如匙孔血藍(lán)蛋白),然后注入兔子數(shù)月。測(cè)試兔血清對(duì)BRCA1多肽或片段的免疫反應(yīng)性。可以通過(guò)將蛋白質(zhì)多肽、融合蛋白質(zhì)或其片段注入小鼠而制備單克隆抗體。用ELISA篩選單克隆抗體,然后測(cè)試其與BRCA1多肽或其片段的特異免疫反應(yīng)性。參見(jiàn)Harlow&amp;Lane,1988。這些抗體可以用于分析和作為藥物。一旦獲得足夠量的所需多肽,就可以將其用于各種用途。典型的用途是用于產(chǎn)生特異性結(jié)合的抗體。這些抗體可以為多克隆或單克隆抗體,而且可以用本領(lǐng)域中公知的技術(shù)在體外或體內(nèi)產(chǎn)生。對(duì)于產(chǎn)生多克隆抗體,可以選擇合適的靶免疫體系,一般是小鼠或兔。由適用于動(dòng)物的方法以及免疫學(xué)家熟知的其他參數(shù)限定方式,然后按此方式將基本純化的抗原供給免疫體系。典型的注射位置是爪墊、肌內(nèi)注射、腹膜內(nèi)注射或皮下注射。當(dāng)然,也可以用其他動(dòng)物替代小鼠或兔。然后用本領(lǐng)域中公知的技術(shù)純化多克隆抗體,再調(diào)節(jié)所需的特異性。免疫應(yīng)答通常用免疫測(cè)定進(jìn)行分析。一般地這些免疫測(cè)定涉及對(duì)一種抗原源進(jìn)行某種程度的純化,這種抗原源由相同的細(xì)胞產(chǎn)生并且處于相同的抗原形式。各種免疫測(cè)定方法是本領(lǐng)域中公知的。如參見(jiàn)Harlow&amp;Lane,1988或Goding,1986。典型地,用標(biāo)準(zhǔn)程序如Harlow&amp;Lane(1988)或Goding(1986)所述的程序,可以制得親和力為10-8M-1或更佳地為10-9至10-10M-1或更高的單克隆抗體。簡(jiǎn)而言之,可以選用合適的動(dòng)物,然后采用所需的免疫方案。經(jīng)過(guò)適當(dāng)?shù)臅r(shí)間,取出動(dòng)物的脾臟,然后在合適的選擇條件下,將個(gè)體脾細(xì)胞與無(wú)限增殖化的骨髓瘤細(xì)胞融合。隨后,通過(guò)克隆分離細(xì)胞,并且測(cè)試各克隆的上清液以確定是否產(chǎn)生適當(dāng)?shù)?、特異性針?duì)所需抗原區(qū)域的抗體。其他合適的技術(shù)涉及在體外將淋巴細(xì)胞暴露于抗原性多肽,或者選擇噬菌體或類似載體中的抗體庫(kù)。參見(jiàn)Huse等人,1989。本發(fā)明的多肽和抗體可加以修飾或不加修飾地使用。多肽和抗體常??梢酝ㄟ^(guò)共價(jià)或非共價(jià)地連接一種提供可檢測(cè)信號(hào)的物質(zhì)而被標(biāo)記。大量不同的標(biāo)記物和連接技術(shù)是公知的,并且在科學(xué)和專利文獻(xiàn)中被廣泛地報(bào)道。合適的標(biāo)記物包括放射性核素、酶、底物、輔助因子、抑制劑、熒光劑、化學(xué)發(fā)光劑、磁性顆粒等。講授使用這些標(biāo)記物的專利包括美國(guó)專利3,817,837;3,850,752;3,939,350;3,996,345;4,277,437;4,275,149和4,366,241。同樣,還可以產(chǎn)生重組免疫球蛋白(參見(jiàn)美國(guó)專利4,816,567)?!敖Y(jié)合配偶體”指能夠高特異性地與配體分子結(jié)合的分子,如抗原和抗原特異性抗體或者酶及其抑制劑。通常地,特異性結(jié)合配偶體必須以足夠的親和力進(jìn)行結(jié)合從而在分離條件下固定被分析物拷貝/互補(bǔ)雙鏈(在進(jìn)行多聚核苷酸雜交時(shí))。特異性的結(jié)合配偶體是本領(lǐng)域中熟知的,例如包括生物素和抗生物素蛋白或鏈球菌抗生物素蛋白(streptavidin)、IgG和蛋白質(zhì)A、無(wú)數(shù)已知的受體-配體偶聯(lián)物和互補(bǔ)的多聚核苷酸鏈。在互補(bǔ)的多聚核苷酸結(jié)合配偶體中,配偶體長(zhǎng)度通常地至少約15堿基,而且長(zhǎng)度至少可以為40堿基。多聚核苷酸可以由DNA、RNA或合成的核酸類似物構(gòu)成。“生物樣品”指來(lái)自某個(gè)體的、可能含有被分析的多聚核苷酸或多肽的組織或體液樣品,它包括但并不限于例如血漿、血清、脊髓液、淋巴液、皮膚外表、呼吸道、腸道和生殖-泌尿道、眼淚、唾液、血細(xì)胞、腫瘤、器官、組織和體外細(xì)胞培養(yǎng)成分的樣品。如此處所用,術(shù)語(yǔ)“診斷”或“預(yù)后”,當(dāng)用于有關(guān)腫瘤形成的上下文時(shí),被用于表示1)對(duì)瘤形成損傷進(jìn)行分類,2)確定瘤形成的嚴(yán)重性或3)在治療之前、之中或之后監(jiān)視疾病的進(jìn)展?!熬幋a”。如果當(dāng)某多聚核苷酸在其天然狀態(tài)或用本領(lǐng)域中技術(shù)人員熟知的方法操作時(shí),可以被轉(zhuǎn)錄和/或被翻譯從而產(chǎn)生mRNA或多肽或其片段,那么則稱該多聚核苷酸“編碼”多肽。反義鏈?zhǔn)窃摵怂岬幕パa(bǔ)物,可以從其推導(dǎo)出編碼序列。“分離的”或“基本純的”。“分離的”或“基本純的”核酸(如RNA、DNA或混合聚合物)是基本上與在自然狀態(tài)下伴隨天然的人序列或蛋白質(zhì)的其他細(xì)胞組份(如核糖體、聚合酶、許多其他的人基因組序列及蛋白質(zhì))相分離的核酸。該術(shù)語(yǔ)包括從其自然存在的環(huán)境中取出的核酸序列或其蛋白質(zhì),并且包括重組的或克隆的DNA分離物以及化學(xué)合成的類似物或者通過(guò)異源體系而生物合成的類似物?!癇RCA1等位基因”指正常的BRCA1基因座的等位基因以及攜帶變異的等位基因,這些變異使得個(gè)體傾向在許多部位患癌腫,其中包括乳房癌、卵巢癌、結(jié)腸直腸癌和前列腺癌。這種傾向性等位基因還被稱為“BRCA1易患性等位基因”?!癇RCA1基因座”、“BRCA1基因”、“BRCA1核酸”或“BRCA1多聚核苷酸”都指位于BRCA1區(qū)域的多聚核苷酸,它們會(huì)在正常的組織中表達(dá),其中某些等位基因會(huì)使個(gè)體傾向患乳房癌、卵巢癌、結(jié)腸直腸癌和前列腺癌。BRCA1基因座的突變涉及到其他腫瘤的引發(fā)和/或進(jìn)展。該基因座部分地由導(dǎo)致個(gè)體傾向患癌腫的突變所表示。這些突變位于本文下述的BRCA1區(qū)域中。BRCA1基因座包括編碼序列、間插序列和控制轉(zhuǎn)錄和/或翻譯的調(diào)控元件。BRCA1基因座包括所有的等位基因的DNA序列變異形式。當(dāng)這些術(shù)語(yǔ)用于核酸時(shí),是指編碼BRCA1多肽、片段、同系物或變異體(例如包括融合蛋白或缺失蛋白)的核酸。本發(fā)明的核酸具有或者衍生自或者類似于天然BRCA1編碼基因的序列,或者具有基本上與天然BRCA1編碼基因或其部分同源的序列。BRCA1多肽的編碼序列顯示于SEQIDNO1,而氨基酸序列顯示于SEQIDNO2。本發(fā)明的多聚核苷酸組合物包括RNA、cDNA、基因組DNA、合成形式和混合聚合物,可以是有義鏈或反義鏈,而且可以是用化學(xué)或生化方法修飾過(guò)的或者含有非天然的或衍生的核苷酸堿基,這些對(duì)本領(lǐng)域中的熟練技術(shù)人員而言是顯而易見(jiàn)的。這些修飾包括例如,標(biāo)記、甲基化、用類似物置換一個(gè)或多個(gè)天然核苷酸、核苷酸之間的修飾如不帶電荷的鍵連接(如膦酸甲酯、磷酸三酯、磷酸酰胺化物、甲氨酸酯等)、帶電荷的鍵連接(如硫代磷酸酯、二硫代磷酸酯等)、側(cè)鏈部分(如多肽)、嵌入劑(intercalator)(如吖啶、補(bǔ)骨脂內(nèi)酯等)、螯合劑、烷基化劑和修飾的鍵連接(如α正位異構(gòu)化(anomeric)核酸等)。還包括合成的分子,該分子能通過(guò)氫鍵和其他化學(xué)相互作用模擬多聚核苷酸與指定序列結(jié)合。這類分子是本領(lǐng)域中熟知的,例如包括那些在分子骨架中用肽鍵替換磷酸鍵的分子。本發(fā)明提供含有全部或部分BRCA1區(qū)域的重組核酸。重組構(gòu)建物能在宿主細(xì)胞中自主復(fù)制?;蛘?,重組構(gòu)建物可整合入宿主細(xì)胞的染色體DNA中。這種重組的多聚核苷酸包括基因組的、cDNA的、半合成的或合成的多聚核苷酸,該多聚核苷酸因其來(lái)源或因操作而呈現(xiàn)1)并不與全部或部分在天然狀態(tài)下與其相連的多聚核苷酸相連;2)連接于在天然狀態(tài)下并不與其相連的多聚核苷酸;或者3)自然界本不存在。因此,本發(fā)明提供的重組核酸含有自然界原本不存在的序列。盡管可以使用野生型序列,但是野生型序列常常被加以改變,如通過(guò)缺失、置換或插入??梢允褂貌煌愋偷腸DNA或基因組文庫(kù)作為本發(fā)明的天然核酸源進(jìn)行篩選,也可以通過(guò)使用PCR等技術(shù)在基因組DNA或其他天然來(lái)源中擴(kuò)增存在的序列而獲得這些核酸。cDNA文庫(kù)的選擇通常對(duì)應(yīng)于富含所需蛋白質(zhì)的mRNA的組織源。一般噬菌體文庫(kù)較佳,但是也可以使用其他文庫(kù)。文庫(kù)的克隆被涂布于平板上,轉(zhuǎn)移至基膜上進(jìn)行篩選,變性并利用探針檢測(cè)是否存在所需的序列。用于本發(fā)明的DNA序列通常含有至少5個(gè)密碼子(15個(gè)核苷酸),更通常地至少7-15個(gè)密碼子,最佳地至少35個(gè)密碼子??梢源嬖谝粋€(gè)或多個(gè)內(nèi)含子。核苷酸的數(shù)目通常是能夠與BRCA1編碼序列特異性地雜交的成功探針?biāo)璧淖钚¢L(zhǎng)度左右。有關(guān)核酸操作的技術(shù)例如在Sambrook等人,1989或Ausubel等人,1992中有廣泛的描述。使用這些技術(shù)的試劑,如限制酶等是本領(lǐng)域中熟知的,而且可以從供應(yīng)商如NewEnglandBioLabs、BoehringerMannheim、Amersham、PromegaBiotec、U.S.Biochemicals、NewEnglandNuclear和大量其他供應(yīng)商處購(gòu)得。用于產(chǎn)生本發(fā)明的融合蛋白的重組核酸序列可以從天然的或人工合成的序列中衍生而得。許多天然的基因序列可以用合適的探針從基因組文庫(kù)中或者從不同的cDNA中獲得。參見(jiàn)GenBank,NationalInstitutesofHealth?!癇RCA1區(qū)域”指由標(biāo)記tdi1474和U5R所界定的人染色體17q21部分。該區(qū)域含有BRCA1基因座,包括BRCA1基因。如本文所用,術(shù)語(yǔ)“BRCA1基因座”、“BRCA1等位基因”和“BRCA1區(qū)域”都指含有該基因座、等位基因或區(qū)域的雙鏈DNA,以及含有該基因座、等位基因或區(qū)域的單鏈DNA。如本文所用,“部分”BRCA1基因座或區(qū)域或等位基因被定義為最小大小至少約8個(gè)核苷酸,或較佳地約15個(gè)核苷酸或更佳地至少約25個(gè)核苷酸,并且最小大小可以是至少約40個(gè)核苷酸。“BRCA1蛋白質(zhì)”或“BRCA1多肽”指由BRCA1基因座編碼的蛋白質(zhì)或多肽、其變異蛋白或其片段。術(shù)語(yǔ)“多肽”指氨基酸的聚合物或其等價(jià)物,并不指具有特定長(zhǎng)度的產(chǎn)物;因此,肽、寡肽和蛋白質(zhì)都被包括在多肽這一定義中。該術(shù)語(yǔ)并不排除多肽的修飾作用如糖基化、乙酰基化、磷?;?。包括在該定義中的有含有一個(gè)或多個(gè)氨基酸類似物(包括非天然氨基酸等)的多肽、具有取代鍵以及本領(lǐng)域中已知的其他天然或非天然修飾的多肽。一般地,這些多肽至少具有約50%、較佳地大于約90%、更佳地至少約95%與天然BRCA1序列的同源性。還包括由在高嚴(yán)緊或低嚴(yán)緊條件下與BRCA1編碼核酸雜交的DNA所編碼的蛋白質(zhì),以及用針對(duì)BRCA1蛋白質(zhì)的抗血清而獲得的密切相關(guān)的多肽或蛋白質(zhì)。用于比較同源性的多肽序列長(zhǎng)度通常至少約16個(gè)氨基酸,常常至少約20個(gè)殘基,更通常地至少約24個(gè)殘基,典型地至少約28個(gè)殘基,而且更佳地大于約35個(gè)殘基?!翱刹僮?地)相連(于)”是指這樣一種并列關(guān)系,其中所述組份所處的關(guān)系使得它們可以按預(yù)期的方式發(fā)揮功能。例如,如果啟動(dòng)子可以引起一段編碼序列轉(zhuǎn)錄或表達(dá)的話,則該啟動(dòng)子是可操作地相連于編碼序列的?!疤结槨?。導(dǎo)致易患某些癌腫或者與大多數(shù)癌腫關(guān)聯(lián)的BRCA1等位基因的相關(guān)多聚核苷酸多態(tài)性,可以通過(guò)與某多聚核苷酸探針的雜交反應(yīng)進(jìn)行檢測(cè),該探針在嚴(yán)緊至中等嚴(yán)緊雜交和洗滌條件下能夠與靶序列形成穩(wěn)定的雜交體。如果預(yù)期探針完全與靶序列互補(bǔ),那么可以使用嚴(yán)緊條件。如果預(yù)期存在某些錯(cuò)配,例如預(yù)期變異體與探針不是完全互補(bǔ)的時(shí)候,那么可以降低雜交的嚴(yán)緊性。選擇的條件應(yīng)消除非特異的/偶然的結(jié)合,即應(yīng)降低背景。因?yàn)檫@種顯示會(huì)確定出中性DNA多態(tài)性和突變,所以,還需要進(jìn)一步分析以表明BRCA1易患性等位基因的檢測(cè)結(jié)果。用于BRCA1等位基因的探針可以從BRCA1區(qū)域或其cDNA序列獲得。探針可以具有任何合適長(zhǎng)度,它可以橫跨BRCA1區(qū)域的全部或部分,而且可以特異性地與BRCA1區(qū)域雜交。如果靶序列含有與探針相同的序列,那么探針可以短一些,如約為8-30堿基對(duì),因?yàn)榧词乖趪?yán)緊條件下雜交體也是相對(duì)穩(wěn)定的。如果預(yù)期與探針之間有某些程度的錯(cuò)配,即如果懷疑探針會(huì)與變異體區(qū)域雜交,那么可以采用較長(zhǎng)的、與靶序列發(fā)生必要特異性雜交的探針。探針包括連于標(biāo)記物或報(bào)道分子的分離多聚核苷酸,而且可以使用標(biāo)準(zhǔn)方法用于分離其他的、具有序列相似性的多聚核苷酸序列。對(duì)于探針的制備和標(biāo)記,請(qǐng)參見(jiàn)Sambrook等人,1989或Ausubel等人,1992。其他類似的多聚核苷酸可以通過(guò)使用同源的多聚核苷酸加以選擇?;蛘?,編碼這些多肽或類似多肽的多聚核苷酸可以通過(guò)利用遺傳密碼子的豐余性加以合成或選擇。可以引入不同的密碼子置換,例如沉默變化(從而產(chǎn)生不同的限制性位點(diǎn))或優(yōu)化某特定體系的表達(dá)??梢砸胪蛔円孕揎椂嚯牡男阅?,也許會(huì)改變配體結(jié)合的親和力、鏈間的親和力、多肽降解或轉(zhuǎn)換率(turnoverrate)。本發(fā)明的探針含有合成寡核苷酸或其他多聚核苷酸,它們可以衍生自天然存在的或重組的單鏈或雙鏈多聚核苷酸,或者通過(guò)化學(xué)方式合成。探針可以通過(guò)缺口平移、Klenow填入法或其他本領(lǐng)域中已知的方法進(jìn)行標(biāo)記。最好選用編碼BRCA1的多聚核苷酸序列作為探針,該探針具有至少約8個(gè)核苷酸,通常地至少約15個(gè)核苷酸而且小于約6千堿基對(duì),通常地小于約1.0千堿基對(duì)的多聚核苷酸序列部分。探針還可以用于確定細(xì)胞或組織中是否存在編碼BRCA1的mRNA。對(duì)于BRCA1多肽或其片段,本發(fā)明還提供了“蛋白質(zhì)修飾形式或片段”,它們一級(jí)結(jié)構(gòu)序列基本同源,但是包括例如,在體內(nèi)或體外的化學(xué)和生化的修飾形式,以及摻入非常見(jiàn)氨基酸的形式。這些修飾包括乙酰基化、羧基化、磷?;⑻腔?、遍在蛋白化(ubiquitination)、如用放射性核素進(jìn)行標(biāo)記以及各種酶的修飾,這些都是本領(lǐng)域中的技術(shù)人員能輕易理解的。大量不同的標(biāo)記多肽的方法以及大量不同的用于該用途的取代物或標(biāo)記物是本領(lǐng)域中熟知的,其中包括放射性同位素如32p、可與標(biāo)記的抗配體(如抗體)結(jié)合的配體、熒光團(tuán)、化學(xué)發(fā)光劑、酶和作為標(biāo)記配體的特異性結(jié)合配對(duì)物的抗配體。標(biāo)記物的選擇取決于所需的靈敏度、與引物偶聯(lián)的簡(jiǎn)便性、所要求的穩(wěn)定性和所能得到的儀器設(shè)備。標(biāo)記多肽的方法是本領(lǐng)域中熟知的。例如參見(jiàn)Sambrook等人,1989或Ausubel等人,1992。除了基本上全長(zhǎng)的多肽之外,本發(fā)明還提供了具有生物學(xué)活性的多肽片段。重要的生物學(xué)活性包括配體結(jié)合活性、免疫學(xué)活性和BRCA1多肽的其他生物學(xué)活性。免疫學(xué)活性包括靶免疫體系中的免疫原功能,以及具有供結(jié)合的免疫表位以作為BRCA1蛋白表位的競(jìng)爭(zhēng)劑或取代抗原。如本文所用,“表位”(又稱為“抗原決定簇”)指多肽的抗原決定簇。一個(gè)表位可以含有三個(gè)該表位獨(dú)有的、處于空間構(gòu)象中的氨基酸。一般地,一個(gè)表位由至少5個(gè)這樣的氨基酸、更常見(jiàn)地由至少8-10個(gè)這樣的氨基酸構(gòu)成。確定這些氨基酸的空間構(gòu)象的方法是本領(lǐng)域中熟知的。對(duì)于免疫學(xué)的用途,可以使用串聯(lián)重復(fù)的多肽片段作為抗原,從而產(chǎn)生高抗原性的蛋白質(zhì)?;蛘?,這種多肽可以作為特異性結(jié)合的極有效的競(jìng)爭(zhēng)劑。下文描述特異地針對(duì)BRCA1多肽或其片段的抗體的產(chǎn)生過(guò)程。本發(fā)明還提供了含有BRCA1多肽及其片段的融合多肽。同源多肽可以是在兩個(gè)或多個(gè)BRCA1多肽序列之間的或者在BRCA1序列和相關(guān)蛋白質(zhì)之間的融合物。同樣可以構(gòu)建異源的融合蛋白,它具有衍生蛋白質(zhì)的復(fù)合性能或活性。例如,可以在不同的新融合多肽或片段之間“交換”配體結(jié)合域或其他的結(jié)構(gòu)域。這種同源或異源的融合多肽可表現(xiàn)出例如不同的結(jié)合強(qiáng)度和特異性。融合配偶體包括免疫球蛋白、細(xì)菌β-半乳糖苷酶、trpE、蛋白質(zhì)A、β-內(nèi)酰胺酶、α-淀粉酶、乙醇脫氫酶和酵母α接合因子。例如參見(jiàn)Godowski等人,1988。典型地,融合蛋白可以用重組核酸法(如下文所示)或者用化學(xué)合成法制得。用于合成多肽的技術(shù)在Merrifield,1963中有描述。“蛋白質(zhì)純化”指從其他生物材料中如從用重組的編碼BRCA1的核酸轉(zhuǎn)化的細(xì)胞中,分離出BRCA1多肽的各種不同方法,這些方法是本領(lǐng)域中熟知的。例如,可以用如本發(fā)明中提供的抗體,使用免疫親和色譜法來(lái)純化多肽。各種不同的蛋白質(zhì)的純化方法是本領(lǐng)域中熟知的,其中包括在Deutscher,1990和Scopes,1982中所述的方法。術(shù)語(yǔ)“分離的”、“基本純的”、和“基本同質(zhì)的”可以互換使用,都可用于描述已經(jīng)與天然狀態(tài)下伴隨它的組份分離開(kāi)的蛋白質(zhì)或多肽。當(dāng)約60-75%的樣品具有單一的多肽序列時(shí),該單體蛋白質(zhì)便是基本純的?;炯兊牡鞍踪|(zhì)典型地含有約60-90%(重量/重量)、更通常地約95%而且更佳地超過(guò)約99%的蛋白質(zhì)樣品。蛋白質(zhì)的純度或同質(zhì)性可以用多種本領(lǐng)域中熟知的方法表示,如先進(jìn)行蛋白質(zhì)樣品的聚丙烯酰胺凝膠電泳,然后在對(duì)凝膠進(jìn)行染色之后觀察蛋白質(zhì)樣品中的單一多肽條帶。對(duì)于某些情況,可以用高效液相色譜(HPLC)或其他本領(lǐng)域中熟知的手段來(lái)提供更高的分辨率,它們可用于純化。當(dāng)BRCA1蛋白質(zhì)已經(jīng)與天然狀態(tài)下伴隨它的天然污染物分離開(kāi)時(shí),則該BRCA1蛋白質(zhì)就基本上不含與其天然相關(guān)的組份了。因此,用化學(xué)方法合成的多肽、或者在與天然產(chǎn)生該多肽的細(xì)胞不同的細(xì)胞體系中合成的多肽是基本上不含與其天然相關(guān)的組份。還可以使用本領(lǐng)域中熟知的蛋白質(zhì)純化技術(shù),通過(guò)分離使蛋白質(zhì)基本上不含與其天然相關(guān)的組份。如本文所用,作為分離的和操作的基因序列的表達(dá)產(chǎn)物而產(chǎn)生的多肽是“分離的多肽”,即使是在同源的細(xì)胞類型中表達(dá)。人工合成形式或用異源細(xì)胞表達(dá)的分子本身就是分離的分子?!爸亟M核酸”是天然不存在的核酸,或者是將兩個(gè)原本分開(kāi)的序列片段通過(guò)人工組合而形成的核酸。該人工組合通常是通過(guò)化學(xué)合成手段,或者通過(guò)對(duì)分離的核酸片段進(jìn)行人工操作(例如通過(guò)遺傳工程技術(shù))而實(shí)現(xiàn)。典型地,當(dāng)需要引入或去除一個(gè)序列識(shí)別位點(diǎn)時(shí),常常這樣做以便用編碼相同的或保守性的氨基酸的豐余密碼子來(lái)置換某一密碼子?;蛘撸梢詫⒕哂兴韫δ艿暮怂崞魏喜⑵饋?lái)產(chǎn)生所需的功能組合。“調(diào)控序列”指那些通常位于某基因座編碼區(qū)域的100kb之內(nèi)(但是也可距編碼區(qū)域更遠(yuǎn))、影響基因表達(dá)(包括基因的轉(zhuǎn)錄和信使RNA的翻譯、剪接、穩(wěn)定性等)的序列?!盎就椿蝾愃啤?。如果與其他核酸(或其互補(bǔ)鏈)最佳地進(jìn)行排列(具有適當(dāng)?shù)暮塑账岵迦牖蛉笔?時(shí),核苷酸序列的相同程度有至少約60%的核苷酸堿基,通常地至少約70%的核苷酸堿基,更通常地至少約80%,較佳地至少約90%,更佳地至少約95-98%的核苷酸堿基時(shí),那么我們稱該核酸或其片段與另一核酸“基本同源”(或“基本類似)?;蛘?,當(dāng)核酸或其片段在選擇性雜交條件下能夠與另一核酸(或其互補(bǔ)鏈)或與某一鏈或其互補(bǔ)鏈雜交,那么就存在基本同源或類似性。當(dāng)發(fā)生比特異性完全缺乏更具選擇性的雜交時(shí),存在著雜交的選擇性。典型地,當(dāng)在一段至少約14個(gè)核苷酸的區(qū)間中有至少約55%的同源性、較佳地至少約65%、更佳地至少約75%、最佳地至少約90%的同源性時(shí),會(huì)發(fā)生選擇性的雜交。參見(jiàn)Kanehisa,1984。如本文所述,比較同源性的長(zhǎng)度可以在更長(zhǎng)的區(qū)段進(jìn)行。在某些實(shí)施例中經(jīng)常是至少約9個(gè)核苷酸長(zhǎng)度,通常地至少約20個(gè)核苷酸,更通常地至少約24個(gè)核苷酸,典型地至少約28個(gè)核苷酸,更典型地至少約32個(gè)核苷酸,并且更佳地至少約36個(gè)核苷酸或更多。除了受到堿基組成、互補(bǔ)鏈長(zhǎng)度和雜交核酸之間核苷酸堿基錯(cuò)配數(shù)目等因素影響之外,核酸雜交還受諸如鹽濃度、溫度或有機(jī)溶劑等因素的影響,這一點(diǎn)是本領(lǐng)域中的熟練技術(shù)人員所知曉的。嚴(yán)緊的溫度條件通常包括超過(guò)30℃的溫度,典型地超過(guò)37℃,更佳地超過(guò)45℃。嚴(yán)緊的鹽濃度一般小于1000mM,典型地小于500mM,更佳地小于200mM。然而,這些參數(shù)的組合比任何單一參數(shù)更為重要。例如參見(jiàn)Wetmur&amp;Davidson,1968。探針序列還可以在特定的條件下與雙鏈DNA特異性地雜交,從而形成三股或其他更高級(jí)的DNA復(fù)合物。這些探針的制備和合適的雜交條件是本領(lǐng)域中所熟知的。當(dāng)用于多肽時(shí),術(shù)語(yǔ)“基本同源”或“基本相同”表示感興趣的多肽或蛋白質(zhì)與完整的天然存在的蛋白質(zhì)或其部分相比,至少約30%相同,通常地至少約70%相同,更佳地至少約95%相同?!盎鞠嗨频墓δ堋敝赶鄬?duì)于野生型BRCA1核酸或野生型BRCA1多肽而言,修飾的核酸或修飾的蛋白質(zhì)的功能。修飾的多肽基本上與野生型BRCA1多肽同源而且基本上具有相同的功能。修飾的多肽可以具有不同的氨基酸序列和/或含有修飾的氨基酸。除了功能相似性之外,修飾多肽還可以有其他有用的性能,比如更長(zhǎng)的半衰期。修飾的多肽的功能(活性)的相似可以與野生型BRCA1多肽的活性相同?;蛘撸揎椀亩嚯牡墓δ?活性)的相似可比野生型BRCA1多肽的活性更高。修飾的多肽可用常規(guī)技術(shù)合成,或者用修飾的核酸編碼并用常規(guī)技術(shù)產(chǎn)生。修飾的核酸可用常規(guī)技術(shù)制備。功能基本上類似于野生型BRCA1基因功能的核酸,可產(chǎn)生上述的修飾蛋白質(zhì)。典型地,多肽的同源性用序列分析軟件確定。例如參見(jiàn)GeneticsComputerGroup(UniversityofWisconsinBiotechnologyCenter,910UniversityAvenue,Madison,Wisconsin53705)的序列分析軟件包(SequenceAnalysisSoftwarePackage)。蛋白質(zhì)分析軟件通過(guò)指定給各種置換、缺失和其他修飾的同源性數(shù)值來(lái)匹配相似的序列。典型地保守性置換包括列于下組中的置換甘氨酸、丙氨酸;纈氨酸、異亮氨酸、亮氨酸;天冬氨酸、谷氨酸;天冬酰胺、谷酰胺;絲氨酸、蘇氨酸;賴氨酸、精氨酸;以及苯丙氨酸、酪氨酸。多肽“片段”、“部分”是指至少約5-7個(gè)連續(xù)氨基酸、通常地至少約7-9個(gè)連續(xù)氨基酸、典型地至少約9-13個(gè)連續(xù)氨基酸、最佳地至少約20-30個(gè)或更多連續(xù)氨基酸的一段氨基酸殘基。本發(fā)明的多肽,如果是可溶的,可以偶聯(lián)于固相載體,例如硝基纖維素、尼龍、柱填塞材料(如瓊脂糖凝膠(Sepharose)珠)、磁性珠、玻璃棉、塑料、金屬、聚合物凝膠、細(xì)胞或其他的基質(zhì)。這些載體可以是珠、槽(well)、浸量尺或膜等形式?!鞍袇^(qū)域”指被擴(kuò)增和/或被檢測(cè)的核酸區(qū)域。術(shù)語(yǔ)“靶序列”所指的序列在所需條件下可與探針或引物形成穩(wěn)定的雜交體。除非另外注明,本發(fā)明的實(shí)施采用化學(xué)、分子生物學(xué)、微生物學(xué)、重組DNA、遺傳學(xué)和免疫學(xué)的常規(guī)技術(shù)。例如參見(jiàn)Maniatis等人,1982;Sambrook等人,1989;Ausubel等人,1992;Glover,1985;Anand,1992;Guthrie&amp;Fink,1991。用于人基因作圖包括人染色體17q作圖的技術(shù)和材料的一般性討論,可參見(jiàn)White&amp;Lalouel(1988)的文章。制備重組的或化學(xué)合成的核酸;載體、轉(zhuǎn)化、宿主細(xì)胞本發(fā)明的大量多聚核苷酸可以通過(guò)在適當(dāng)宿主細(xì)胞中的復(fù)制而產(chǎn)生。編碼所需片段的天然或合成的多聚核苷酸片段可以整合入重組多聚核苷酸構(gòu)建物中,通常為DNA構(gòu)建物。該構(gòu)建物可以引入原核或真核細(xì)胞中并在其中復(fù)制。一般地,多聚核苷酸構(gòu)建物適合在單細(xì)胞宿主如酵母或細(xì)菌中復(fù)制,但是也可以將其引入培養(yǎng)的哺乳動(dòng)物或植物或其他的真核細(xì)胞系中(整合或沒(méi)有整合入基因組中)。對(duì)用本發(fā)明方法產(chǎn)生的核酸進(jìn)行純化的方法,在Sambrook等人,1989或Ausubel等人,1992中有描述。本發(fā)明的多聚核苷酸還可以用化學(xué)合成的方法產(chǎn)生,例如Beaucage&amp;Carruthers,1981所述的亞磷酰胺法或者M(jìn)atteucci和Caruthers,1981所述的三酯法,而且可以在商購(gòu)的自動(dòng)寡核苷酸合成儀上進(jìn)行。從化學(xué)合成的單鏈產(chǎn)物基礎(chǔ)上獲得雙鏈片段,可通過(guò)合成互補(bǔ)鏈然后在合適的條件下使兩條鏈退火,或者通過(guò)使用DNA聚合酶和合適的引物序列添加互補(bǔ)鏈。為了引入原核或真核宿主中而制備的多聚核苷酸構(gòu)建物,可以含有一個(gè)能被宿主識(shí)別的復(fù)制系統(tǒng),該系統(tǒng)包括編碼所需多肽的多聚核苷酸片段,而且最好含有可操作地相連于多肽編碼片段的轉(zhuǎn)錄和翻譯起始調(diào)控序列。表達(dá)載體含有復(fù)制起始點(diǎn)或自主復(fù)制序列(autonomouslyreplicatingsequence,簡(jiǎn)稱ARS)和表達(dá)控制序列、啟動(dòng)子、增強(qiáng)子和必要的加工信息位點(diǎn)如核糖體結(jié)合位點(diǎn)、RNA剪接位點(diǎn)、聚腺苷酸化位點(diǎn)、轉(zhuǎn)錄終止序列和mRNA穩(wěn)定序列。合適的話,可以含有來(lái)自天然BRCA1蛋白質(zhì)或者來(lái)自其他受體或者來(lái)自相同或相關(guān)物種的分泌型多肽的分泌信號(hào),從而使蛋白質(zhì)能夠通過(guò)和/或留在細(xì)胞膜,并因此獲得其功能性拓?fù)浣Y(jié)構(gòu)或者從細(xì)胞中分泌出去。這些載體可以用本領(lǐng)域中熟知的標(biāo)準(zhǔn)重組技術(shù)制備,例如可以參見(jiàn)Sambrook等人,1989或Ausubel等人,1992。應(yīng)選擇合適的啟動(dòng)子和其他必要的載體序列以便其能在宿主中發(fā)揮作用,而且合適的話,可含有與BRCA1基因天然相關(guān)的序列。細(xì)胞系和表達(dá)載體的可操作的組合在Sambrook等人,1989或Ausubel等人,1992中有描述;還可以參見(jiàn)Metzger等人,1988。許多有用的載體是本領(lǐng)域中熟知的,而且可以從供應(yīng)商如Stratagene、NewEnglandBiolabs、PromegaBiotech等處獲得。啟動(dòng)子如trp、lac和噬菌體啟動(dòng)子、tRNA啟動(dòng)子和糖酵解酶啟動(dòng)子可以用于原核宿主。有用的酵母啟動(dòng)子包括金屬硫蛋白(metallothionein)、3-磷酸甘油酸激酶或其他糖酵解酶如烯醇化酶或甘油醛-3-磷酸脫氫酶、擔(dān)負(fù)利用麥芽糖和半乳糖的酶等的啟動(dòng)子區(qū)域。適合用于酵母表達(dá)的載體和啟動(dòng)子還在Hitzeman等人,EP73,675A中有進(jìn)一步描述。合適的非天然哺乳動(dòng)物啟動(dòng)子包括來(lái)自SV40的早期和晚期啟動(dòng)子(Fiers等人,1978)或來(lái)自Moloney鼠白血病病毒、鼠腫瘤病毒、鳥(niǎo)肉瘤病毒、腺病毒II、牛乳頭狀瘤病毒或多瘤的啟動(dòng)子。另外,構(gòu)建物可以連于可擴(kuò)增的基因(如二氫葉酸還原酶(DHFR))從而可以產(chǎn)生多拷貝基因。至于合適的增強(qiáng)子和其他的表達(dá)控制序列,也可以參見(jiàn)“增強(qiáng)子和基因表達(dá)”(EnhancersandEukaryoticGeneExpression),ColdSpringHarborPress,ColdSpringHarbor,NewYork(1983)。盡管這些表達(dá)載體可以自主復(fù)制,但是它們也可以通過(guò)使用本領(lǐng)域中熟知的方法插入到宿主細(xì)胞的基因組中再?gòu)?fù)制。表達(dá)和克隆載體可含有供選擇的標(biāo)記基因,該基因編碼的蛋白質(zhì)是用載體轉(zhuǎn)化的宿主細(xì)胞存活或生長(zhǎng)所必需的。該基因保證只有表達(dá)該插入片段的宿主細(xì)胞才能生長(zhǎng)。典型的選擇基因編碼下列蛋白質(zhì)a)提供對(duì)抗生素或其他毒性物質(zhì)如氨芐青霉素、新霉素、氨甲喋呤等的抗性的蛋白質(zhì);b)互補(bǔ)營(yíng)養(yǎng)缺陷型蛋白質(zhì)或c)提供復(fù)合培養(yǎng)基中沒(méi)有的重要營(yíng)養(yǎng)成分的蛋白質(zhì),例如桿菌D-丙氨酸消旋酶的基因。選擇合適的供選擇的標(biāo)記基因取決于所用的宿主細(xì)胞,而各種不同宿主的合適標(biāo)記基因是本領(lǐng)域中所熟知的。含有感興趣核酸的載體可以在體外轉(zhuǎn)錄,然后用熟知的方法例如通過(guò)注射(參見(jiàn)T.Kubo等人,1988)將得到的RNA引入宿主細(xì)胞,或者也可以用本領(lǐng)域中熟知的方法將載體直接引入宿主細(xì)胞,這取決于宿主細(xì)胞的類型。這些方法包括電穿孔;采用氯化鈣、氯化銣、磷酸鈣、二乙氨乙基(DEAE)-葡聚糖或其他物質(zhì)的轉(zhuǎn)染;微粒轟擊(microprojectilebombardment);脂質(zhì)轉(zhuǎn)染(1ipofection);感染(當(dāng)載體是感染物例如反轉(zhuǎn)錄病毒基因組時(shí))和其他方法。一般地參見(jiàn)Sambrook等人,1989和Ausubel等人,1992。用本領(lǐng)域中任何已知的方法,特別是上述的方法,將多聚核苷酸引入宿主細(xì)胞的過(guò)程在本文中稱為“轉(zhuǎn)化”。已經(jīng)引入上述核酸的細(xì)胞還包括該細(xì)胞的后代。大量的本發(fā)明核酸和多肽,可以在相容的原核或真核宿主細(xì)胞中通過(guò)載體或其他表達(dá)載體表達(dá)而得以制備。最常用的原核宿主是大腸桿菌菌株,盡管其他的原核生物,如枯草桿菌或假單孢菌(屬)也可使用。哺乳動(dòng)物或其他的真核宿主細(xì)胞,如酵母、絲狀真菌、植物、昆蟲(chóng)或兩棲動(dòng)物或鳥(niǎo)類的宿主細(xì)胞,也可以用于產(chǎn)生本發(fā)明的蛋白質(zhì)。哺乳動(dòng)物細(xì)胞的培養(yǎng)增殖是本領(lǐng)域中每個(gè)人都熟知的。參見(jiàn)Jakoby和Pastan,1979。常用的哺乳動(dòng)物宿主細(xì)胞系的例子是VERO和HeLa細(xì)胞、中國(guó)倉(cāng)鼠卵巢(CHO)細(xì)胞和WI38、BHK和COS細(xì)胞系。但是熟練的技術(shù)人員知道,其他的細(xì)胞系也是合適的,可用于提供更高效的表達(dá)、所需的糖基化形式或其他特性。根據(jù)載體構(gòu)建的方式,通過(guò)使用標(biāo)記基因而選擇克隆。標(biāo)記基因位于相同或不同的DNA分子上,較佳地在相同的DNA分子上。在原核宿主中,可以通過(guò)對(duì)諸如氨芐青霉素、四環(huán)素或其他抗生素的抗性而選擇轉(zhuǎn)化體。根據(jù)溫度敏感性而產(chǎn)生的特定產(chǎn)物也可以用作合適的標(biāo)記物。用本發(fā)明的多聚核苷酸轉(zhuǎn)化的原核或真核細(xì)胞不僅可以用于產(chǎn)生本發(fā)明的核酸和多肽,也可以用于研究BRCA1多肽的性質(zhì)。反義多聚核苷酸序列可用于防止或減弱BRCA1基因座的表達(dá),這一點(diǎn)是本領(lǐng)域中的熟練技術(shù)人員所能理解的。例如,可以將含有全部或部分BRCA1基因座序列、或者來(lái)自BRCA1區(qū)域的其他序列(尤其是位于BRCA1基因座兩側(cè)的序列)的多聚核苷酸載體置于反義方向啟動(dòng)子的控制下,并引入細(xì)胞。在細(xì)胞中,這種反義構(gòu)建物的表達(dá)會(huì)干擾BRCA1轉(zhuǎn)錄和/或翻譯和/或復(fù)制。本文所公開(kāi)的BRCA1基因序列的探針和引物,可以用于在其他物種中鑒別同源的BRCA1基因序列和蛋白質(zhì)。對(duì)于分離出這些物質(zhì)的物種,可將這些BRCA1基因序列和蛋白質(zhì)用于本文所述的診斷/預(yù)后、治療和藥物篩選方法。使用方法核酸診斷和診斷試劑盒為了檢測(cè)是否存在使個(gè)體易患癌腫的BRCA1等位基因,可以制備生物樣品如血液,然后分析是否存在易患性BRCA1等位基因。為了檢測(cè)是否存在瘤形成、或者先前損傷向惡性發(fā)展、或者預(yù)后的征兆,可以制備損傷的生物樣品,然后分析是否存在BRCA1等位基因。這些測(cè)試的結(jié)果和解釋信息可以提供給衛(wèi)生保健機(jī)構(gòu),從而告訴受測(cè)試的個(gè)體。這些診斷可以由診斷實(shí)驗(yàn)室進(jìn)行,或者可以制造診斷試劑盒并售給衛(wèi)生保健機(jī)構(gòu)或個(gè)人以供自我診斷。起初,篩選方法涉及通過(guò)擴(kuò)增有關(guān)的BRCA1序列。在另一本發(fā)明的優(yōu)選例子中,篩選方法是一種不基于PCR的方案。該篩選方法包括本領(lǐng)域中熟知的兩步標(biāo)記擴(kuò)增技術(shù)。PCR和不基于PCR的篩選方案都能以很高的靈敏度檢測(cè)靶序列。目前最常用的方法是靶序列的擴(kuò)增。使用聚合酶擴(kuò)增靶核酸序列。一種特別優(yōu)選的、聚合酶驅(qū)動(dòng)的擴(kuò)增反應(yīng)方法是聚合酶鏈反應(yīng)(PCR)。通過(guò)聚合酶驅(qū)動(dòng)的擴(kuò)增循環(huán),聚合酶鏈反應(yīng)和其他聚合酶驅(qū)動(dòng)的擴(kuò)增分析方法可使拷貝數(shù)目增加一百萬(wàn)倍以上。一旦被擴(kuò)增,得到的核酸可以用于測(cè)序或者用作DNA探針的底物。當(dāng)使用探針來(lái)檢測(cè)靶序列的存在時(shí)(例如在篩選癌腫的易患性時(shí)),可以處理待分析的生物樣品(例如血液和血清)以抽提出核酸。樣品核酸可以用不同的方法進(jìn)行制備,以便于靶序列的檢測(cè);例如變性、限制性消化、電泳或點(diǎn)雜交。被分析核酸的靶區(qū)域通常必須至少部分呈單鏈狀態(tài),以便與探針的靶序列形成雜交體。如果序列本身是單鏈,那么不需要變性。但是,如果序列是雙鏈,那么序列可能需要變性??梢杂帽绢I(lǐng)域中熟知的各種技術(shù)進(jìn)行變性。在會(huì)促使探針的靶序列和被分析物中假定的靶序列之間形成穩(wěn)定雜交體的條件下,將被分析核酸和探針進(jìn)行孵育。與被分析物結(jié)合的探針區(qū)域可以被制成與人染色體17q的靶區(qū)域完全互補(bǔ)。因此,為了防止假陽(yáng)性,需要高嚴(yán)緊條件。只有當(dāng)探針與基因組中單一的染色體區(qū)域互補(bǔ)時(shí)方使用高嚴(yán)緊條件。雜交的嚴(yán)緊性由雜交和洗滌過(guò)程中的眾多因素所決定,其中包括溫度、離子強(qiáng)度、堿基組成、探針長(zhǎng)度和甲酰胺濃度。這些因素在Maniatis等人,1982和Sambrook等人,1989中有總結(jié)。在某些情況下,更高級(jí)雜交體如三聚體、四聚體等的形成也可以作為檢測(cè)靶序列的方法。如果存在雜交體,那么形成的雜交體的檢測(cè)通常通過(guò)使用標(biāo)記探針而實(shí)現(xiàn)?;蛘撸结樋梢允俏礃?biāo)記的,但是可以與直接或間接標(biāo)記的配體通過(guò)特異性地結(jié)合而檢測(cè)出。合適的標(biāo)記物以及用于標(biāo)記探針和配體的方法是本領(lǐng)域中熟知的,其中包括可用已知方法(如缺口平移、隨機(jī)引物法和磷酸根轉(zhuǎn)移法(kinasing))摻入的放射性標(biāo)記物、生物素、熒光基團(tuán)、化學(xué)發(fā)光基團(tuán)(如二氧雜環(huán)丁烷(dioxetane),尤其是觸發(fā)態(tài)二氧雜環(huán)丁烷)、酶、抗體等。在這一基本技術(shù)框架下的改動(dòng)是本領(lǐng)域中熟知的,并且包括那些有助于將待檢測(cè)的雜交體從外源材料中分離出來(lái)和/或放大來(lái)自標(biāo)記部分的信號(hào)的改動(dòng)。眾多的改動(dòng)形式總結(jié)于Matthews&amp;Kricka,1988;Landegren等人,1988;Mittlin,1989;美國(guó)專利4,868,105和EPO出版物No.225,807中。如上所述,非PCR篩選分析方法也在本發(fā)明的構(gòu)思之中。在實(shí)施例11中提供了代表性的非PCR程序。在該程序中,將核酸探針(或類似物,例如用膦酸甲酯骨架替換普通的磷酸二酯)與低濃度的DNA靶目標(biāo)雜交。該探針具有與其共價(jià)相連的酶,因而該共價(jià)連接不會(huì)干擾雜交反應(yīng)的特異性。接著該酶-探針-偶聯(lián)物-靶核酸復(fù)合物可以與游離的探針-酶偶聯(lián)物分離,然后加入底物進(jìn)行酶檢測(cè)。可以通過(guò)顯色變化或者靈敏度增高103-106倍的熒光輸出量而觀察酶活性。對(duì)于寡聚脫氧核苷酸-堿性磷酸酶偶聯(lián)物的制備及其作為雜交探針的用途,可以參見(jiàn)Jablonski等人,1986。兩步標(biāo)記放大技術(shù)是本領(lǐng)域中熟知的。這些分析方法基于這樣的原理將小配體(如地高辛配基(digoxigenin)、生物素等)連于能夠特異性地與BRCA1結(jié)合的核酸探針上。代表性的探針列于本申請(qǐng)的表9中,并且還包括對(duì)應(yīng)于SEQIDNO1中3631至3930位核苷酸的核酸探針。等位基因特異性探針也在該例子的構(gòu)思范圍之中,代表性的等位基因特異性探針包括含有總結(jié)于本申請(qǐng)表11和12中的傾向性突變的探針。在一個(gè)例子中,連于核酸探針上的小配體被抗體-酶偶聯(lián)物特異性識(shí)別。在該例子中,將地高辛配基連于核酸探針上。通過(guò)能夠使化學(xué)發(fā)光底物發(fā)生轉(zhuǎn)換的抗體-堿性磷酸酶偶聯(lián)物檢測(cè)雜交。用于標(biāo)記該例子中核酸探針的方法,可以參見(jiàn)Martin等人,1990。在另一例子中,小配基被能夠特異性地與第一配基復(fù)合的第二配基-酶偶聯(lián)物所識(shí)別。這種情況下的一個(gè)眾所周知的例子是生物素-抗生物素的相互作用。標(biāo)記核酸探針的方法以及它們?cè)诨谏锼?抗生物素分析中的用途,參見(jiàn)Rigby,等人,1977和Nguyen,等人(1992)。同樣在本發(fā)明構(gòu)思范圍之中的是,本發(fā)明的核酸探針?lè)治隹梢圆捎媚軌驒z測(cè)出BRCA1基因的核酸探針的混合物。因此,在一個(gè)從細(xì)胞樣品中檢測(cè)BRCA1是否存在的例子中,采用多種與BRCA1互補(bǔ)的探針,尤其是這組不同的探針可以為2、3或5種不同的核酸探針序列。在另一例子中,為了在病人中檢測(cè)是否存在BRCA1基因序列的突變,可以使用一種以上與BRCA1互補(bǔ)的探針,其中該混合物含有能夠與等位基因特異性突變結(jié)合的探針,而這些突變是在帶有BRCA1突變的病人群體中鑒別出的。在該例子中,可以使用任何數(shù)目的探針,而且最好包括對(duì)應(yīng)于使個(gè)體傾向于患乳房癌的主要的基因突變類型的探針。一些本發(fā)明范圍之內(nèi)的候選探針包括含有表11和12中列出的等位基因特異性突變的探針,以及含有對(duì)應(yīng)于SEQIDNO1突變位點(diǎn)5′和3′的BRCA1區(qū)域的探針。使用方法肽診斷和診斷試劑盒損傷的瘤形成狀況可以根據(jù)野生型BRCA1多肽發(fā)生的改變而加以檢測(cè)。這種改變可以用常規(guī)技術(shù)通過(guò)序列分析確定。更佳地,可使用抗體(多克隆或單克隆抗體)來(lái)檢測(cè)BRCA1肽的差異或BRCA1肽的缺乏。抗體可以按上述標(biāo)題為“抗體”中的方法進(jìn)行制備,并且在實(shí)施例12和13中有進(jìn)一步的顯示。用于產(chǎn)生和純化抗體的其他技術(shù)是本領(lǐng)域中公知的,而且任何一種這類技術(shù)都可用于實(shí)現(xiàn)本發(fā)明所述的制劑。在本發(fā)明的優(yōu)選實(shí)施例中,抗體將BRCA1蛋白質(zhì)從溶液中免疫沉淀出,并且在聚丙烯酰胺凝膠的Western印跡或免疫印跡中與BRCA1蛋白質(zhì)反應(yīng)。在另一優(yōu)選實(shí)施例中,通過(guò)使用免疫細(xì)胞化學(xué)技術(shù),抗體可以檢測(cè)石蠟或冰凍組織切片中的BRCA1蛋白質(zhì)。檢測(cè)BRCA1或其突變方法的優(yōu)選例子包括酶聯(lián)免疫吸附測(cè)定(enzymelinkedimmunosorbentassays,ELISA)、放射免疫測(cè)定(RIA)、免疫放射測(cè)定(IRMA)和免疫酶測(cè)定(IEMA),包括使用單克隆和/或多克隆抗體的夾心測(cè)定。代表性的夾心測(cè)定例子在David等人的美國(guó)專利No.4,376,110和4,486,530中有描述(這些文獻(xiàn)在此引用作為參考),并且以實(shí)施例14為例。使用方法藥物篩選本發(fā)明對(duì)于篩選化合物特別有用,即在各種藥物篩選技術(shù)中通過(guò)使用BRCA1多肽或其結(jié)合片段而篩選化合物。在測(cè)試中使用的BRCA1多肽或其片段可以處于溶液中的游離狀態(tài),或者被固定于某固相載體,或者位于細(xì)胞表面。一種藥物篩選方法最好是在競(jìng)爭(zhēng)結(jié)合測(cè)定中,采用已經(jīng)用表達(dá)多肽或其片段的重組多聚核苷酸穩(wěn)定地轉(zhuǎn)化了的原核或真核宿主細(xì)胞。這類細(xì)胞,或者處于游離狀態(tài)或者處于固定形式,都可以用于標(biāo)準(zhǔn)結(jié)合分析中。例如人們可以測(cè)量在BRCA1多肽或其片段和被測(cè)試的試劑之間是否形成復(fù)合物,或者檢測(cè)在BRCA1多肽或其片段和已知配體之間形成的復(fù)合物受所測(cè)試試劑干擾的程度。因此,本發(fā)明提供了篩選藥物的方法,它包括將某種試劑與BRCA1多肽或其片段接觸,然后用本領(lǐng)域中熟知的方法測(cè)定1)是否存在由該試劑和BRCA1多肽或其片段形成的復(fù)合物或2)是否存在由BRCA1多肽或其片段和配基形成的復(fù)合物。在這種競(jìng)爭(zhēng)性結(jié)合測(cè)定中,BRCA1多肽或其片段通常是被標(biāo)記的。將游離的BRCA1多肽或其片段從蛋白質(zhì)蛋白質(zhì)復(fù)合物中分離,游離(即未復(fù)合的)標(biāo)記物的量便分別是被測(cè)試的試劑結(jié)合于BRCA1的測(cè)量值,或者是其干擾BRCA1配體結(jié)合的測(cè)量值。另一種藥物篩選的方法可以為與BRCA1多肽有適當(dāng)結(jié)合親和力的化合物提供高產(chǎn)率的篩選,該方法在Geysen的PCT出版的申請(qǐng)WO84/03564中(1984年9月13日出版)有詳細(xì)的描述。簡(jiǎn)而言之,在固相基質(zhì)如塑料針或其他表面上合成大量不同的小肽測(cè)試化合物,然后將肽測(cè)試化合物與BRCA1多肽反應(yīng)并洗滌。接著用本領(lǐng)域中熟知的方法檢測(cè)結(jié)合的BRCA1多肽。純化的BRCA1可以直接涂在板上以便用于上述的藥物篩選技術(shù)。但是,也可以使用針對(duì)多肽的非中和抗體來(lái)捕獲抗體以便將BRCA1多肽固定于固相載體。本發(fā)明還構(gòu)思了競(jìng)爭(zhēng)性藥物篩選測(cè)定法的用途。其中能夠特異性地結(jié)合BRCA1的中和抗體與測(cè)試化合物發(fā)生競(jìng)爭(zhēng),爭(zhēng)奪與BRCA1多肽或其片段的結(jié)合。在這種方法中,可以使用抗體來(lái)檢測(cè)具有一個(gè)或多個(gè)BRCA1多肽抗原決定簇的任何肽。另一種藥物篩選的技術(shù)涉及使用具有無(wú)功能BRCA1基因的真核宿主細(xì)胞或細(xì)胞系(例如上述的)。這些宿主細(xì)胞系或細(xì)胞在BRCA1多肽水平上存在缺陷。在藥物化合物存在條件下,使這些宿主細(xì)胞系或細(xì)胞生長(zhǎng)。測(cè)量宿主細(xì)胞的生長(zhǎng)速率以確定化合物是否能夠調(diào)節(jié)BRCA1缺陷型細(xì)胞的生長(zhǎng)。使用方法合理的藥物設(shè)計(jì)合理的藥物設(shè)計(jì)的目的是產(chǎn)生出感興趣的、具有生物學(xué)活性的多肽結(jié)構(gòu)類似物,或與其反應(yīng)的小分子結(jié)構(gòu)類似物(例如促效劑、拮抗劑、抑制劑),以便設(shè)計(jì)出的藥物是活性更高的或更穩(wěn)定的多肽,或者該藥物可以增強(qiáng)或干擾多肽在體內(nèi)的功能。例如參見(jiàn)Hodgson,1991。在一種方法中,人們先要通過(guò)X-射線衍射晶體法、通過(guò)計(jì)算機(jī)模型設(shè)計(jì)或者最典型地通過(guò)多種手段的結(jié)合而確定感興趣蛋白質(zhì)(例如BRCA1多肽)或BRCA1受體或配體復(fù)合物的三維結(jié)構(gòu)。通過(guò)基于同源蛋白質(zhì)結(jié)構(gòu)的模型設(shè)計(jì),可以獲得有關(guān)某肽結(jié)構(gòu)的較不常見(jiàn)的有用信息。合理的藥物設(shè)計(jì)的一個(gè)例子是人免疫缺陷病毒(HIV)蛋白酶抑制劑的開(kāi)發(fā)(Erickson等人,1990)。此外,可以用丙氨酸掃描法(Wells,1991)來(lái)分析肽(如BRCA1多肽)。在該技術(shù)中,用Ala置換某氨基酸殘基,然后確定該置換對(duì)肽活性的影響。肽的每一個(gè)氨基酸殘基都用這種方式進(jìn)行分析,以確定肽的重要區(qū)域。通過(guò)功能測(cè)定的選擇,還可以分離靶特異性抗體,然后解開(kāi)其晶體結(jié)構(gòu)。從理論上講,這種方法會(huì)得到一個(gè)藥物核心(pharmacore),而隨后的藥物設(shè)計(jì)都可以以此為基礎(chǔ)。通過(guò)產(chǎn)生針對(duì)有功能的、有藥物學(xué)活性的抗體的抗特異型抗體(anti-id),就有可能繞過(guò)蛋白質(zhì)晶體分析。作為鏡像的鏡像,可以預(yù)計(jì)抗特異型抗體的結(jié)合位點(diǎn)是最初受體的類似物。然后,可用抗特異型抗體從化學(xué)或生物學(xué)方法產(chǎn)生的肽文庫(kù)中鑒別和分離出所需的肽。此時(shí),選出的肽可以作為藥物核心。因此,人們可以設(shè)計(jì)出BRCA1活性更高或更穩(wěn)定的藥物,或者可以設(shè)計(jì)出作為BRCA1活性抑制劑、促效劑、拮抗劑等的藥物。因?yàn)橐呀?jīng)有了克隆的BRCA1序列,所以可以產(chǎn)生出足夠量的BRCA1多肽,以便進(jìn)行X-射線衍射晶體等研究。另外,此處提供的BRCA1蛋白質(zhì)序列的知識(shí)對(duì)那些采用計(jì)算機(jī)模型設(shè)計(jì)取代X-射線衍射晶體的人以及那些同時(shí)使用這兩種方法的人可起指導(dǎo)作用。使用方法基因治療根據(jù)本發(fā)明,提供了向攜帶突變型BRCA1等位基因的細(xì)胞提供野生型BRCA1功能的方法。提供這樣一種功能會(huì)抑制受體細(xì)胞的腫瘤生長(zhǎng)??梢詫⑽挥谳d體中的野生型BRCA1基因或部分基因引入細(xì)胞,從而使引入的基因處于染色體外。在這種情況中,基因在細(xì)胞的染色體外進(jìn)行表達(dá)。如果基因片段被引入并在攜帶突變型BRCA1等位基因的細(xì)胞中表達(dá),則基因片段應(yīng)能夠編碼使細(xì)胞進(jìn)行非瘤形成生長(zhǎng)所需的部分BRCA1蛋白質(zhì)。更優(yōu)選的是這樣一種情況野生型BRCA1基因或其部分被引入突變型細(xì)胞并且和細(xì)胞中存在的內(nèi)源突變型BRCA1基因發(fā)生重組。這種重組需要發(fā)生雙重組事件,從而導(dǎo)致BRCA1基因突變的校正。用于將基因引入從而進(jìn)行重組或維持在染色體外的載體,是本領(lǐng)域中熟知的,而且可以使用任何合適的載體。將DNA引入細(xì)胞的方法,例如電穿孔、磷酸鈣共沉淀和病毒轉(zhuǎn)導(dǎo)都是本領(lǐng)域中熟知的,方法的選擇是一般技術(shù)人員都能做到的。用野生型BRCA1基因轉(zhuǎn)化的細(xì)胞可以用作研究癌腫消退以及研究促進(jìn)這種消退的藥物治療的模型系統(tǒng)。如上所述,可以在基因治療方法中采用BRCA1基因或其片段(適用時(shí)),以便增加癌腫細(xì)胞中該基因表達(dá)產(chǎn)物的數(shù)量。這種基因治療特別適用于癌腫細(xì)胞和前癌腫(pre-cancerous)細(xì)胞,因?yàn)榕c正常細(xì)胞相比,這種細(xì)胞中BRCA1多肽的水平下降或缺乏。這種基因治療還可以用于在另一些腫瘤細(xì)胞中增加給定的BRCA1基因的表達(dá)水平,在這些細(xì)胞中突變型基因按“正常的”水平進(jìn)行表達(dá),但是基因產(chǎn)物卻沒(méi)有全部功能?;蛑委熆梢杂闷毡榻邮艿姆椒ㄟM(jìn)行,例如Friedman,1991中所描述的方法。來(lái)自病人的腫瘤細(xì)胞可以先用上述的診斷方法進(jìn)行分析,以確定腫瘤細(xì)胞中產(chǎn)生BRCA1多肽。然后制備含有連于表達(dá)調(diào)控元件并且能夠在腫瘤細(xì)胞中復(fù)制的BRCA1基因拷貝的病毒或質(zhì)粒載體(細(xì)節(jié)如下)。適用的載體是本領(lǐng)域中熟知的,例如在美國(guó)專利5,252,479和PCT出版的申請(qǐng)WO93/07282中所公開(kāi)的。接著可以將載體注射入病人,或者是局部地在腫瘤位置進(jìn)行,或者是全身性進(jìn)行(為了到達(dá)可能轉(zhuǎn)移至其他部位的腫瘤細(xì)胞)。如果轉(zhuǎn)染的基因沒(méi)有永久性地?fù)饺敫靼心[瘤細(xì)胞的基因組,那么需要定期地重復(fù)進(jìn)行治療。本領(lǐng)域中已知的基因轉(zhuǎn)移系統(tǒng)都可以用于實(shí)施本發(fā)明的基因治療方法。這包括病毒和非病毒轉(zhuǎn)移方法。大量的病毒已用作基因轉(zhuǎn)移載體,其中包括乳多空病毒如SV40(Madzak等人,1992)、腺病毒(Berkner,1992;Berkner等人,1988;Gorziglia和Kapikian,1992;Quantin等人,1992;Rosenfeld等人,1992;Wilkinson等人,1992;Stratford-Perricaudet等人,1990)、牛痘病毒(Moss,1992)、腺伴隨病毒(Muzyczka,1992;Ohi等人,1990)、包括單純皰疹病毒(HSV)和EB病毒(EBV)在內(nèi)的皰疹病毒(Margolskee,1992;Johnson等人,1992;Fink等人,1992;Breakfield和Geller,1987;Freese等人,1990)和來(lái)自鳥(niǎo)類(Brandyopadhyay和Temin,1984;Petropoulos等人,1992)、鼠(Miller,1992;Miller等人,1985;Sorge等人,1984;Mann和Baltimore,1985;Miller等人,1988)和人(Shimada等人,1991;Helseth等人,1990;Page等人1990;Buchschacher和Panganiban,1992)的反轉(zhuǎn)錄病毒。大多數(shù)的人類基因治療方案以無(wú)毒的鼠反轉(zhuǎn)錄病毒為基礎(chǔ)。本領(lǐng)域中已知的非病毒基因轉(zhuǎn)移方法包括化學(xué)方法,例如磷酸鈣共沉淀(Graham和vanderEb,1973;Pellicer等人,1980);機(jī)械方法,例如微注射(Anderson等人,1980;Gordon等人,1980;Brinster等人,1981;Constantini和Lacy,1981);通過(guò)脂質(zhì)體進(jìn)行的膜融合介導(dǎo)轉(zhuǎn)移(Felgner等人,1987;Wang和Huang,1989;Kaneda等人,1989;Stewart等人,1992;Nabel等人,1990;Lim等人,1992)和直接DNA攝入以及受體介導(dǎo)的DNA轉(zhuǎn)移(Wolff等人,1990;Wu等人,1991;Zenke等人,1990;Wu等人,1989b;Wolff等人,1991;Wagner等人,1990;Wagner等人,1991;Cotten等人,1990;Curiel等人,1991a;Curiel等人,1991b)。病毒介導(dǎo)的基因轉(zhuǎn)移可以與使用脂質(zhì)體送遞的直接的體內(nèi)基因轉(zhuǎn)移一起使用,使得人們可指導(dǎo)病毒載體進(jìn)入腫瘤細(xì)胞而不進(jìn)入周圍的不分裂細(xì)胞?;蛘?,可以將產(chǎn)生反轉(zhuǎn)錄病毒載體的細(xì)胞系注射入腫瘤(Culver等人,1992),這種生產(chǎn)細(xì)胞的注入可以連續(xù)地提供載體顆粒來(lái)源。該技術(shù)已經(jīng)被批準(zhǔn)用于患有不可進(jìn)行手術(shù)的腦腫瘤病人。在一種結(jié)合生物學(xué)和物理學(xué)基因轉(zhuǎn)移法的方法中,將任何大小的質(zhì)粒DNA與對(duì)腺病毒六鄰體蛋白特異的聚賴氨酸偶聯(lián)抗體混合,形成的復(fù)合物被連于腺病毒載體。然后用這種三分子復(fù)合物感染細(xì)胞。在雙鏈DNA破壞之前,腺病毒載體能夠有效地結(jié)合、內(nèi)化(internalization)和降解核內(nèi)體(endosome)。已表明,脂質(zhì)體/DNA復(fù)合物能夠介導(dǎo)直接的體內(nèi)基因轉(zhuǎn)移。盡管對(duì)于標(biāo)準(zhǔn)的脂質(zhì)體制劑,基因轉(zhuǎn)移過(guò)程是非特異性的,但是已經(jīng)有報(bào)道,按照直接的原位施用方法(Nabel1992),在腫瘤病灶部位有局部體內(nèi)攝入和表達(dá)。優(yōu)選的是將DNA直接導(dǎo)向乳房和卵巢組織例如乳房或卵巢的上皮細(xì)胞的基因轉(zhuǎn)移技術(shù)。受體介導(dǎo)的基因轉(zhuǎn)移,可例如通過(guò)聚賴氨酸將DNA(通常為共價(jià)閉合的超螺旋質(zhì)粒)與蛋白質(zhì)配體偶聯(lián)起來(lái)而實(shí)現(xiàn)。根據(jù)在靶細(xì)胞/靶組織類型的細(xì)胞表面是否存在相應(yīng)的配體受體,選擇配體。一種合適的受體/配體對(duì)包括雌激素受體及其配體即雌激素(或雌激素類似物)。如果需要,這些配體-DNA偶聯(lián)物可直接注入血液中并導(dǎo)向靶組織,在靶組織處發(fā)生受體結(jié)合和DNA-蛋白質(zhì)復(fù)合物的內(nèi)化。為了克服DNA在細(xì)胞內(nèi)解體的問(wèn)題,可用腺病毒一起共感染以破壞核內(nèi)體。治療涉及兩個(gè)步驟,它們可以單獨(dú)或組合進(jìn)行。在第一步驟中,用基因送遞載體治療攜帶BRCA1易患性等位基因的青春期前的女性,從而使部分或全部乳房管上皮前體細(xì)胞接受至少一個(gè)額外拷貝的功能性正常BRCA1等位基因。在該步驟中,接受治療的個(gè)體減小了患乳房癌的風(fēng)險(xiǎn),因?yàn)橐谆夹缘任换虻淖饔帽淮嬖诘恼5任换蛩窒T陬A(yù)防性治療的第二步驟中,易患性年輕女性尤其是已接受所述基因治療處理的女性,進(jìn)行激素治療以模擬全程懷孕對(duì)乳房的影響。使用方法肽治療可以將具有BRCA1活性的肽提供給攜帶突變型BRCA1等位基因或缺乏BRCA1等位基因的細(xì)胞。本文公開(kāi)了BRCA1蛋白質(zhì)的序列(SEQIDNO2)??墒褂靡阎谋磉_(dá)載體,通過(guò)細(xì)菌中的cDNA序列的表達(dá)而產(chǎn)生蛋白質(zhì)?;蛘撸珺RCA1多肽可以從產(chǎn)生BRCA1的哺乳動(dòng)物細(xì)胞中抽提出。另外,可以使用化學(xué)合成技術(shù)來(lái)合成BRCA1蛋白質(zhì)。其中任何一種技術(shù)都能夠提供本發(fā)明的、含有BRCA1蛋白質(zhì)的制劑。該制劑基本上不含其他種類的人蛋白質(zhì)。通過(guò)在微生物內(nèi)合成或體外合成,可以極方便地實(shí)現(xiàn)該目的??梢酝ㄟ^(guò)微注射或使用脂質(zhì)體將活性BRCA1分子引入細(xì)胞。或者,某些活性分子可以被細(xì)胞主動(dòng)地或通過(guò)擴(kuò)散攝入。在細(xì)胞外施用BRCA1基因產(chǎn)物可足以影響腫瘤的生長(zhǎng)。提供具有BRCA1活性的分子可以部分地逆轉(zhuǎn)瘤形成狀態(tài)。也可以使用其他具有BRCA1活性的分子(例如肽、藥物或有機(jī)化合物)來(lái)實(shí)現(xiàn)這種逆轉(zhuǎn)。還可以使用功能基本類似的修飾多肽進(jìn)行肽治療。使用方法轉(zhuǎn)化的宿主同樣地,攜帶突變型BRCA1等位基因的細(xì)胞和動(dòng)物可以用作模型系統(tǒng),以研究和測(cè)試可能成為治療劑的物質(zhì)。這些細(xì)胞通常是培養(yǎng)的上皮細(xì)胞。這些細(xì)胞可以從具有體細(xì)胞或種系突變的BRCA1突變個(gè)體中分離而得?;蛘呷缟纤?,可以對(duì)細(xì)胞系進(jìn)行工程改造,使之?dāng)y帶BRCA1等位基因的突變。將測(cè)試物質(zhì)施用于細(xì)胞之后,測(cè)定細(xì)胞的瘤形成轉(zhuǎn)化表型。對(duì)瘤形成轉(zhuǎn)化細(xì)胞的任何性狀都可以進(jìn)行評(píng)估,其中包括不依賴于貼壁的生長(zhǎng)(anchorage-independentgrowth)、在裸鼠中的致瘤性、對(duì)細(xì)胞的入侵性和對(duì)生長(zhǎng)因子的依賴性。其中任何一種性狀的測(cè)定是本領(lǐng)域中熟知的。在對(duì)全體動(dòng)物進(jìn)行誘變或?qū)ΨN系細(xì)胞或合子進(jìn)行處理之后,可以選擇用于測(cè)試治療劑的動(dòng)物。這些處理包括插入突變型BRCA1等位基因(通常來(lái)自另一種動(dòng)物)以及插入破壞的同源基因?;蛘?,可以使用常規(guī)技術(shù)(Capecchi,1989;Valancius和Smithies,1991;Hasty等人,1991;Shinkai等人,1992;Mombaerts等人,1992;Philpott等人,1992;Snouwaert等人,1992;Donehower等人,1992),通過(guò)插入或缺失突變或者其他的遺傳改變而破壞動(dòng)物的內(nèi)源BRCA1基因。在將測(cè)試物質(zhì)施用于動(dòng)物之后,必須評(píng)估腫瘤的生長(zhǎng)。如果測(cè)試物質(zhì)防止或抑制腫瘤的生長(zhǎng),那么該測(cè)試物質(zhì)是用于治療本文所述癌腫的候選治療劑。這些動(dòng)物模型提供了潛在治療劑極其重要的測(cè)試工具。本發(fā)明結(jié)合下列實(shí)施例進(jìn)行闡述。這些實(shí)施例僅用于闡述本發(fā)明,并不以任何方式限制本發(fā)明。采用的是本領(lǐng)域中熟知的標(biāo)準(zhǔn)技術(shù)或在下文中特別說(shuō)明的技術(shù)。實(shí)施例1確定與研究可能具有與17q連鎖的乳房癌易患性基因座的親緣族從具有多個(gè)乳房癌病例及具有許多可供研究親屬的一大組延伸親緣族的群體中,確定了具有廣泛性癌癥傾向的親緣族。在這些大的親緣族中發(fā)生的大量減數(shù)分裂提供了檢測(cè)BRCA1基因座是否分離的能力,而且增加了在被研究的這一微小區(qū)域內(nèi)發(fā)生有信息的重組的機(jī)會(huì)。這大大增加了建立與BRCA1區(qū)域連鎖的機(jī)會(huì),從而極大地方便了縮小BRCA1區(qū)域至可操作的大小,這將能夠鑒定出BRCA1基因座。每一親緣族延伸至所有可聯(lián)系的親屬,并至每一先證者(proband)或癌癥病人所有有信息的一級(jí)親屬(嫡堂(表)兄妹)。就這些親緣族而言,還通過(guò)腫瘤記錄連鎖檔案鑒定出此親緣族中的其它乳房癌病例和在其它部位(例如卵巢)有癌腫的個(gè)體。對(duì)親緣族中全部有記錄的但未經(jīng)UtahCancerRegistry確認(rèn)的乳房癌進(jìn)行了研究。收集醫(yī)療記錄或死亡證明以確認(rèn)全部癌腫病例。每一重要相關(guān)個(gè)體和所有可提供信息的個(gè)體均被邀請(qǐng)參與,要其提供血樣供抽提DNA。我們還對(duì)已故病例的配偶和親屬進(jìn)行了取樣,由此可從其親屬的基因型獲得已故病例的基因型。由原先從連鎖數(shù)據(jù)庫(kù)(Skolnick等人,1990)中確定的29個(gè)用于研究乳腺增生疾病及乳房癌的親緣族中,選擇10個(gè)具有3個(gè)或3個(gè)以上具有可推斷的基因型的癌腫病例的親緣族,用于與17q上各標(biāo)記的連鎖研究。選擇這些親緣族的標(biāo)準(zhǔn)是有兩姐妹或一個(gè)母親及其女兒患有乳房癌。此外,還包括自1980起作為我們?nèi)榉堪┻B鎖研究一部分的2個(gè)親緣族(K1001、K9018)、由連鎖數(shù)據(jù)庫(kù)確定的有乳房癌和/或卵巢癌的6個(gè)親緣族(K2019、K2073、K2079、K2080、K2039、K2082)和一個(gè)早發(fā)型乳房癌自薦(self-referred)親緣族(K2035)。以上文所述的方法對(duì)這些親緣族進(jìn)行了臨床調(diào)查和擴(kuò)延。表1顯示了這19個(gè)作為隨后實(shí)施例對(duì)象的親緣族的特征。在表1中,記錄了我們數(shù)據(jù)庫(kù)中每一親緣族的個(gè)體總數(shù),各型別個(gè)體的數(shù)量和診斷為乳房癌/卵巢癌時(shí)的最小、平均及最大年齡。親緣族按在診斷為乳房癌時(shí)的平均年齡的遞增順序歸類。4個(gè)同時(shí)診斷有卵巢癌和乳房癌的婦女在兩類中同時(shí)被計(jì)數(shù)。表1對(duì)19個(gè)親緣族的說(shuō)明乳房癌卵巢癌個(gè)體數(shù)確診年齡確診年齡親緣族總數(shù)樣本數(shù)患者最小平均最大患者最小平均最大191015104273449----10011339813283764----2035422582837451-60-202721114343841-----9018541793040722464850192550274394253----192749295324251----191128217284276----192916114344373----1901351910314476----208218010520274767104552662019421910425379----1900702384555701-78-20802647422+2755924455371207357299355780----19171664435861----192022143626368----20791361814386684452596520398740144468884415175+包括一例男性乳房癌。實(shí)施例2與染色體17q連鎖的親緣族的選擇和BRCA1在Mfd15-Mfd188間隔內(nèi)的定位對(duì)于收集自19個(gè)親緣族中的每一個(gè)樣本,用標(biāo)準(zhǔn)實(shí)驗(yàn)室方法從血液(在兩個(gè)病例中從石蠟包埋組織塊)中抽提DNA。在本研究中基因分型僅限于短串聯(lián)重復(fù)(STR)標(biāo)記,因?yàn)樗鼈兺ǔ>哂懈叨鹊碾s合性,并且PCR使用很少量的DNA就能提供迅速的周轉(zhuǎn)速度。為了有助于此,通過(guò)在染色體特異性粘粒文庫(kù)中篩選針對(duì)CA陽(yáng)性克隆,確定了位于染色體17上的4個(gè)這類STR標(biāo)記。其中3個(gè)標(biāo)記在長(zhǎng)臂上(46E6,Easton等人,1993);(42D6,Easton等人,1993);26C2(D17S514,Oliphant等人,1991),另一個(gè)12G6(D17S513,Oliphant等人,1991)在短臂上并靠近p53腫瘤抑制基因基因座。其中兩個(gè),42D6和46E6被提交給乳房癌連鎖協(xié)會(huì)(BreastCancerLinkageConsortium)供世界各地的研究者進(jìn)行乳房癌分類。從公開(kāi)的報(bào)道,或作為乳房癌連鎖協(xié)會(huì)的成員,或從其它研究者處,可獲得不是由我們的實(shí)驗(yàn)室確定的標(biāo)記的寡聚核苷酸序列。全部基因分型照片根據(jù)用于維持等位基因一致編號(hào)的標(biāo)準(zhǔn)泳道標(biāo)記進(jìn)行盲法評(píng)分。對(duì)此處4個(gè)親緣族中的關(guān)鍵樣本就全部相關(guān)標(biāo)記進(jìn)行重復(fù)分型。對(duì)全部19個(gè)親緣族就兩種多態(tài)性CA重復(fù)標(biāo)記42D6(D17S588)(在我們的實(shí)驗(yàn)室中分離得到的CA重復(fù)標(biāo)記)和Mfd15(D17S250)(由J.Weber(Weber等人,1990)提供的CA重復(fù)標(biāo)記)進(jìn)行了分型。使用了多種來(lái)源的探針以產(chǎn)生位于染色體17上的、尤其是由LosAlamosNationalLaboratories(VanDilla等人,1986)從已分類的染色體產(chǎn)生的染色體17粘粒和λ噬菌體文庫(kù)中的遺傳標(biāo)記。就兩種重組值0.001和0.1,計(jì)算每一親緣族與這兩個(gè)標(biāo)記(42D6、Mfd15)和大致位于這兩個(gè)標(biāo)記的中間位置的第三標(biāo)記Mfd188之間的LOD值。(有關(guān)LOD值的計(jì)算參見(jiàn)Oh,1985)。在Claus等人,(1991年)的模式下計(jì)算可能性,該模式假設(shè)估計(jì)的基因頻率為0.003,基因攜帶者的終身患病風(fēng)險(xiǎn)率約0.80,而且非基因攜帶者的風(fēng)險(xiǎn)率是以群體為基礎(chǔ)的年齡特異性的。根據(jù)本實(shí)驗(yàn)室對(duì)CEPH實(shí)驗(yàn)對(duì)象中不相關(guān)個(gè)體(White和Lalaouel,1988)的分型結(jié)果計(jì)算出用于LOD值計(jì)算的三種標(biāo)記的等位基因頻率。表2顯示每一親緣族與三種標(biāo)記42D6、Mfd188和Mfd15的配對(duì)連鎖分析結(jié)果。表2親緣族的配對(duì)連鎖分析Mfd15(D17S250)Mfd188(D17S579)42D6(D17S588)重組重組重組0.0010.10.0010.10.0010.1親緣族19100.060.300.060.300.060.301001-0.30-0.09NTNT-0.52-0.1920352.341.850.940.902.341.822027-1.22-0.33-1.20-0.42-1.16-0.339018-0.54-0.22-0.17-0.100.110.0719251.080.790.550.38-0.11-0.071927-0.410.01-0.350.07-0.44-0.021911-0.27-0.13-0.43-0.230.490.381929-0.49-0.25NTNT-0.49-0.2519011.501.170.780.570.650.3720824.253.366.075.112.003.562019-0.10-0.01-0.11-0.05-0.18-0.101900-0.14-0.11NTNT-0.12-0.052080-0.16-0.040.760.74-1.25-0.582073-0.41-0.290.630.49-0.23-0.131917-0.02-0.02NTNT-0.010.001920-0.03-0.02NTNT0.000.0020790.020.01-0.01-0.010.010.012039-1.67-0.830.120.59-1.150.02NT沒(méi)有對(duì)Mfd188進(jìn)行分型的親緣族。以在CASH模式(Claus等人,1991)下,至少一個(gè)基因座的LOD值>1.0作為與17q發(fā)生連鎖的標(biāo)準(zhǔn),19個(gè)親緣族中有4個(gè)似乎與17q連鎖(K1901、K1925、K2035、K2082)。其它一些親緣族也表現(xiàn)出某些連鎖跡象,但在此不能確切歸為連鎖類。這些親緣族包括K1911、K2073、K2039和K2080。3個(gè)17q連鎖親緣族具有此區(qū)域內(nèi)可提供信息的重組體,詳細(xì)描述見(jiàn)下文。親緣族2082是迄今報(bào)道的最大的17q連鎖的乳房癌家族。該家族有20例乳房癌,10例卵巢癌。兩例同時(shí)患有卵巢癌和乳房癌。該家族與17q連鎖的證明是十分明顯的,其與所連鎖單倍型的LOD值大于6.0,但3例乳房癌除外,它們似乎是偶發(fā)的,即這些病例不共有Mfd15和42D6之間的連鎖單倍型。這3個(gè)偶發(fā)病例在46,47和54歲時(shí)被診斷為乳房癌。在較小的親緣族中,這種偶發(fā)癌腫大大干擾了連鎖分析和對(duì)關(guān)鍵重組體的正確鑒定。在2082親緣族中的關(guān)鍵重組體是一個(gè)在45歲時(shí)患上卵巢癌的婦女,其母親和阿姨分別在58歲和66歲患上卵巢癌。她遺傳了Mfd188和42D6兩者的單倍型連鎖部分同時(shí)遺傳了位于Mfd15的非連鎖等位基因;該重組事件將BRCA1定位于Mfd15的遠(yuǎn)端。K1901是典型的早發(fā)型乳房癌家族。該家族有10例平均診斷年齡為43.5歲的乳房癌病例;4例是在40歲前診斷的。該親緣族與標(biāo)記42D6的LOD值為1.5,使得17q連鎖的經(jīng)驗(yàn)概率為0.96。對(duì)該親緣族中的單倍型進(jìn)行檢查,在一必然男性攜帶者和其受累的女兒(在45歲時(shí)診斷為乳房癌)中鑒定了一個(gè)重組單倍型。他們的標(biāo)記Mfd15連鎖等位基因不同于在該親緣族中其它病例(有1例除外,該病例不能由其后代完全推測(cè))中找到的。兩種單倍型對(duì)Mfd188和42D6是一致的。所以,從K1901獲得的數(shù)據(jù)也將BRCA1定位于Mfd15的遠(yuǎn)端。親緣族2035在疾病表型方面類似于K1901。該親緣族中8例乳房癌的平均診斷年齡為37歲。其中一例還在60歲時(shí)患上卵巢癌。該家族的乳房癌病例從兩姐妹開(kāi)始下傳,這兩姐妹直至80多歲死亡時(shí)始終沒(méi)有發(fā)生乳房癌。兩分支均包括4例乳房癌,各分支中至少一例是明顯的早發(fā)型。該親緣族與Mfd15的LOD值是2.34。兩分支中患乳房癌的分離單倍型都有相同的位于Mfd15的等位基因,但遠(yuǎn)端基因座Mfd188和NM23(由協(xié)會(huì)成員定出的、剛好位于42D6遠(yuǎn)端的標(biāo)記(Hall等人,1992))不同。雖然這兩個(gè)單倍型對(duì)標(biāo)記42D6來(lái)說(shuō)是一樣的,但很可能等位基因共有相同的狀態(tài)(來(lái)自不同祖先的相同等位基因)而不是相同的起源(來(lái)自同一祖先),因?yàn)楣灿械任换蚴窃谠摶蜃^察到的第二位的最常見(jiàn)等位基因。相比之下,在Mfd15處共有的連鎖等位基因其頻率為0.04。這是我們數(shù)據(jù)組合中的一個(gè)關(guān)鍵重組體,因?yàn)檫@是唯一一個(gè)BRCA1隨單倍型近端部分分離的重組體,由此確定了BRCA1區(qū)域的遠(yuǎn)端邊界。如果這一事件不是成為關(guān)鍵重組體的話,則需要在與該親緣族婚配的一配偶中存在有第二個(gè)突變型BRCA1基因,該配偶也共有親緣族兩分支中隨乳房癌一同分離的稀有Mfd15等位基因。這種情況的可能性低于千分之一。來(lái)自該親緣族的證據(jù)將BRCA1基因座定位于Mfd188的近端。實(shí)施例3利用其它的STR多態(tài)性產(chǎn)生精確的結(jié)構(gòu)圖譜并將BRCA1區(qū)域確定于Mfd191-Mfd188為了更好的定性重組體以及確定更靠近的標(biāo)記,需要有染色體17q上此相對(duì)小區(qū)域的密集圖譜。17號(hào)染色體研討會(huì)已根據(jù)遺傳和物理作圖研究(Fain,1992)得出了該區(qū)域的一致性圖譜(圖1)。該圖譜同時(shí)包含高度多態(tài)性的STR多態(tài)性和一些非多態(tài)性的表達(dá)基因。由于該圖譜沒(méi)有給出證明該次序的有關(guān)細(xì)節(jié),也沒(méi)有給出局部支持相鄰基因座次序倒位的測(cè)定值,所以我們只將其視為獲取用于開(kāi)發(fā)新的標(biāo)記和構(gòu)建我們自己的含BRCA1小區(qū)域的詳細(xì)遺傳和物理圖譜的粗略引導(dǎo)。我們的方法是,同時(shí)根據(jù)利用CEPH參考家族的DNA鑒定出的減數(shù)分裂(遺傳)斷裂點(diǎn)圖和就此區(qū)域構(gòu)建的體細(xì)胞雜交體(物理斷裂點(diǎn))圖,分析由其它研究者提供的已有STR標(biāo)記和各種由我們實(shí)驗(yàn)室新開(kāi)發(fā)出的標(biāo)記。這些標(biāo)記包括由本實(shí)驗(yàn)室開(kāi)發(fā)的位于Mfd15近端的26C2、Mfd191(由JamesWeber提供)、THRA1(Futreal等人,1992)和三個(gè)由DonaldBlack博士提供三個(gè)多態(tài)性標(biāo)記NM23(Hall等人,1992)、SCG40(D17S181)和6C1(D17S293)。標(biāo)記的遺傳定位為了在目標(biāo)區(qū)域內(nèi)將新的標(biāo)記遺傳定位,我們已在CEPH參考家族和我們的大乳房癌親緣族(K2082)中鑒定出了一些該區(qū)域內(nèi)的減數(shù)分裂斷裂點(diǎn)。由于該區(qū)域內(nèi)遺傳距離短,它們似乎只是很小的一組可用于此目的的重組體,而且它們將標(biāo)記分成幾組。每一組中的標(biāo)記次序只能由物理作圖測(cè)定。但是,這最大程度地減少了定位新標(biāo)記所必需的基因分型的次數(shù)。表3和表4顯示出了這些斷裂點(diǎn)。利用此方法,我們能夠確定標(biāo)記THRA1、6C1、SCG40和Mfd191的遺傳次序。從表3和表4中可以看到,THRA1和MFD19,都在Mfd15至Mfd181域內(nèi),我們已在先前鑒定出該區(qū)域內(nèi)含有BRCA1基因座。在表3和表4中,M/P表示一母系或父系重組體。“1”表示等位基因遺傳自祖父輩,“0”表示遺傳自祖母輩,“-”表示該基因座沒(méi)有被分型或沒(méi)有信息。表3CEPH重組體家族IDM/PMfd15THRA1Mfd191Mfd188SCG406C142D6132924M1110000132944M1110000132946M0011---13343M111110013334M1110--013336M0011--113338P1000--013778M0-00001表4親緣族2082重組體家族IDM/PMfd15Mfd191Mfd188SCG406C142D675M0111--63M0011-1125M1110-040M1100-0在我們的重組體家族中對(duì)標(biāo)記Mfd15、Mfd188、Mfd191和THRA1進(jìn)行分析在我們的重組體家族中對(duì)Mfd15、Mfd188、Mfd191和THRA1進(jìn)行了分型,并檢查了其它定位BRCA1基因座的信息。在親緣族1901中,Mfd15重組體也是THRA1重組體,但沒(méi)有信息顯示是Mfd191重組體,因此BRCA1位于THRA1的遠(yuǎn)端。在K2082中,帶Mfd15的重組體也帶Mfd191,所以,BRCA1基因座位于Mfd191的遠(yuǎn)端(Goldgar等人,1994)。在親緣族K2035中對(duì)THRA1和Mfd191的檢查未提供進(jìn)一步的定位信息,兩分支對(duì)兩標(biāo)記的表現(xiàn)相同。但是,SCG40和6C1表現(xiàn)出相同于Mfd188的格局,更使我們確信該家族中Mfd188提供的定位信息。所以,BRCA1基因座,或者至少其部分,位于由其近端Mfd191和遠(yuǎn)端Mfd188界定的區(qū)間內(nèi)。實(shí)施例4該目標(biāo)區(qū)域內(nèi)的遺傳和物理資源的開(kāi)發(fā)為了增加Mfd191至Mfd188區(qū)域內(nèi)高度多態(tài)性基因座的數(shù)量,我們?cè)趯?shí)驗(yàn)室中通過(guò)粘粒和YAC開(kāi)發(fā)了一些STR標(biāo)記,它們被物理定位于該區(qū)域的。這些標(biāo)記能夠使我們進(jìn)一步確定此區(qū)域。從已知位于所需區(qū)域內(nèi)的基因中鑒定出STS以用于鑒定含有這些基因座的YAC,然后將其用于鑒定粘粒P1或BAC中的亞克隆。然后,利用(CA)n寡核苷酸(Pharmacia),就是否存在CA串聯(lián)重復(fù)序列進(jìn)行篩選。優(yōu)先選取具有強(qiáng)信號(hào)的克隆,因?yàn)樗鼈兏赡艽砹薈A重復(fù)序列,即具有大量的重復(fù)序列和/或具有與(CA)n格局近乎最佳的一致性。已知兩者的這些特征都提高了多態(tài)性的可能性(Weber,1990)。從載體上直接測(cè)序這些克隆以確定重復(fù)序列位置。利用一組與CA重復(fù)序列末端互補(bǔ)的可能性引物中的一個(gè),例如(GT)10T,我們獲得了CA重復(fù)序列一側(cè)的一段單一序列。根據(jù)這段單一序列,合成一個(gè)引物,從而從反方向?qū)χ貜?fù)區(qū)進(jìn)行測(cè)序,由此產(chǎn)生了一個(gè)單一序列,再將其用于設(shè)計(jì)第二個(gè)位于CA重復(fù)區(qū)側(cè)翼的引物。然后對(duì)一小組不相關(guān)個(gè)體就多態(tài)性篩選STR,然后對(duì)照雜交體圖進(jìn)行檢查以確認(rèn)它們的物理位置。然后在來(lái)自猶他州和CEPH家族的一組40個(gè)不相關(guān)個(gè)體中對(duì)滿足這些標(biāo)準(zhǔn)的新標(biāo)記進(jìn)行分型以獲取適合研究群體的等位基因頻率。本研究中報(bào)道的其它標(biāo)記在一較小組的CEPH不相關(guān)個(gè)體中進(jìn)行測(cè)試以類似地獲取合適的等位基因頻率。使用上述方法,從這些YAC中共發(fā)現(xiàn)8種多態(tài)性STR。以此方式鑒定的基因座中有4個(gè)既呈多態(tài)性,而且又位于BRCA1區(qū)。有4個(gè)標(biāo)記不在染色體17上,反映了所用的YAC的嵌合特性。位于區(qū)域內(nèi)的4個(gè)標(biāo)記為AA1、ED2、4-7和YM29。AA1和ED2來(lái)自RNU2陽(yáng)性的YAC,4-7來(lái)自EPB3YAC,YM29來(lái)自根據(jù)雜交體圖位于該區(qū)域的粘粒。表5給出了在乳房癌親緣族中分析的有關(guān)這4個(gè)及所有其它STR多態(tài)性的等位基因數(shù)量、雜合性和來(lái)源的說(shuō)明。表5用于BRCA1基因座精確結(jié)構(gòu)作圖的多態(tài)性短串聯(lián)重復(fù)標(biāo)記等位基因*頻率(%)克隆基因Na**雜合性123456Mfd15D17S250100.822622157723THRA1THRA15Mfd191D17S77670.55482011777ED2D17S1327120.5562985511AA1D17S132670.83282825865CA375D17S184100.7526151199204-7D17S118390.5063158644YM29--90.62422412778Mfd188D17S579120.92331888825SCG40D17S181140.902018181083542D6D17S588110.86211711109326C1D17S29370.753030111199Z109D17S75090.70332777719tdj1475D17S1321130.8421161111833CF4D17S132060.6350279743tdj1239D17S1328100.80861097414U5D17S1325130.8319161210934*等位基因編號(hào)1-5按遞減頻率排列;等位基因數(shù)目不對(duì)應(yīng)于片段的大小。等位基因6頻率是全部其它等位基因?qū)γ恳换蜃穆?lián)合頻率。**在用于計(jì)算等位基因頻率的遺傳上獨(dú)立DNA樣本中看到的等位基因數(shù)量。在先前的表3和表4所示減數(shù)分裂斷裂點(diǎn)圖中,對(duì)這4個(gè)物理定位于該區(qū)域的STR多態(tài)性進(jìn)行分析。表6和表7包含了用于定位這4個(gè)標(biāo)記的相關(guān)CEPH數(shù)據(jù)和親緣族2082數(shù)據(jù)。在兩表中,M/P表示一母系或父系的重組體。“1”表示遺傳的等位基因來(lái)自祖父輩,“0”表示來(lái)自祖母輩,“-”表示該基因座沒(méi)有被分型或無(wú)信息。表6用于確定17q的BRCA1區(qū)域內(nèi)實(shí)驗(yàn)室開(kāi)發(fā)的新STR基因座遺傳順序的關(guān)鍵重組體CEPH家族IDM/PMfd15THRA1Mfd191ED2AA1Z1094-7YM29Mfd188SCG4042D6132924M11111000000132944M100-0---0--132946M001-1---1---13334M111-0--00-013336M001-1--11-113333M001---111-1表7親緣族2082重組體IDM/PMfd15Mfd191ED2AA14-7YM29Mfd188SCG4042D663M001-11111125M111-1110040M110-0-00022P001111111從CEPH1333-04我們看到,AA1和YM29一定位于Mfd191的遠(yuǎn)端。從13292可以推斷AA1和ED2都在4-7、YM29和Mfd188的近端。在K2082中發(fā)現(xiàn)的重組體提供了另外一些順序信息。3個(gè)相互獨(dú)立的觀察結(jié)果(個(gè)體號(hào)22、40和63)將AA1、ED2、4-7和YM29以及Mfd188定位于Mfd191的遠(yuǎn)端,ID125則將4-7、YM29和Mfd188定位于SCG40的近端。從遺傳重組體分析中,沒(méi)有獲得有關(guān)兩標(biāo)記簇AA1/ED2和4-7/YM29/Mfd188內(nèi)相對(duì)次序的遺傳信息。雖然根據(jù)已知含有“洞”(間隙人DNA小片段可能在此丟失)的雜交體來(lái)確定基因座的次序是有疑問(wèn)的,但雜交體格局顯示4-7在YM29和Mfd188的上游。實(shí)施例5利用標(biāo)記AA1、4-7、ED2和YM29進(jìn)行乳房癌親緣族遺傳分析除了具有前述關(guān)鍵重組體的3個(gè)親緣族外,親緣族K2039經(jīng)新STR標(biāo)記分析被證明與該區(qū)域連鎖而且具有有用的重組體。表8就各基因座的特異性標(biāo)記及其頻率確定了親緣族的單倍型(以編號(hào)形式表示)。表8中,等位基因按頻率遞減次序排列;各基因座等位基因1-5頻率在表5中給出。單倍型H是BRCA1關(guān)聯(lián)單倍型,P表示部分的H單倍型,R表示可觀察到的重組體單倍型。如表8所示,并非所有的親緣族都對(duì)全部標(biāo)記分型;而且,并非同一親緣族特別是K2082中的全部個(gè)體都對(duì)同一組標(biāo)記分型。除一個(gè)例外之外,只表示了遺傳自發(fā)病或危發(fā)親緣族成員的單倍型;沒(méi)有描述來(lái)自與親緣族婚配的配偶的單倍型。所以在一給定的同胞關(guān)系中,單倍型X和Y的出現(xiàn)表示,發(fā)現(xiàn)了來(lái)自發(fā)病或危發(fā)個(gè)體的兩個(gè)單倍型,但都不是乳房癌關(guān)聯(lián)單倍型。表8在三個(gè)親緣族中發(fā)現(xiàn)的乳房癌連鎖單倍型MfdMfdtdjMfd親緣族HAP15THRA11911475ED2AA1Z109CA3754-7YM29188SCG406C142D61901H1155314NINI113NINI1R2925614NINI113NINI12082H13NI4661NINI2142NI1P13NI4NININININININI42NI1P23NININININININININI4NININIR16NI1561NINI2142NI1R26NI4661NINI2142NI1R33NI4NI61NINI2141NI7R47NI1NI15NINI46I2NI1R53NI4NINININININI21NININIR63NI4312NINI1226NI6R73NI4371NINI1137NI42035HI821NI5114316824H2821NI5112112314R2821NI5112112361在親緣族K1901中,新標(biāo)記沒(méi)有表現(xiàn)出可觀察的、具有乳房癌易患性的重組體,這表明該親緣族中的重組事件最可能發(fā)生在THRA1和ED2之間。所以,根據(jù)在該親緣族中對(duì)這4個(gè)新標(biāo)記的研究未獲得新的BRCA1定位信息。在親緣族2082中,關(guān)鍵重組體個(gè)體遺傳了ED2、4-7、AA1和YM29的等位基因,但就tdj1474發(fā)生了重組,這表明該個(gè)體中的重組事件發(fā)生在tdj1474至ED2/AA1之間。如表8所示,在親緣族K2035中有三個(gè)有意義單倍型,H1,H2和R2。H1存在于4個(gè)病例和個(gè)體17后代的一個(gè)必然男性攜帶者中,H2存在于或據(jù)推斷存在于兩個(gè)病例和個(gè)體10后代的兩個(gè)必然男性攜帶者中。R2就Mfd15和SCG40之間(包括兩端)的基因座而言與H2相同,但在SCG40和42D6之間發(fā)生了重組。由于我們已確定BRCA1在42D6的近端,這一H2/R2差異并不提供進(jìn)一步的定位信息。H1和R2共有位于Mfd15、THRA1、AA1和ED2的相同等位基因,但對(duì)于假設(shè)位于ED2遠(yuǎn)端的基因座卻不同,即4-7、Mfd188,SCG40和6C1。雖然兩單倍型對(duì)標(biāo)記YM29(物理上定位于4-7和Mfd188之間的標(biāo)記)的第5個(gè)等位基因是相同的,但很可能這些等位基因共有相同的狀態(tài)而不是相同的起源,因?yàn)樵摰任换蚴窃摶蜃畛R?jiàn)的等位基因,在CEPH親代中其頻率估計(jì)為0.42。相反,在Mfd15和ED2基因座共有的連鎖等位基因,其頻率分別為0.04和0.09。它們還在Mfd191(頻率=0.52),THRA1和AA1(頻率=0.28)共有相同的等位基因。這是這一組中的關(guān)鍵重組體,因?yàn)樗俏ㄒ灰粋€(gè)乳房癌隨單倍型近端部分一同分離的重組體,由此確定了遠(yuǎn)端的邊界。來(lái)自該親緣族的證據(jù)由此將BRCA1基因座定位于4-7的遠(yuǎn)端。親緣族2082中將BRCA1定位于tdj1474遠(yuǎn)端的重組事件,是所述4種重組事件中唯一一個(gè)可以直接推斷而知的;即,受累母親的基因型可由其配偶和后代來(lái)推斷,重組體單倍型可見(jiàn)于其發(fā)病的女兒。在該家族中,攜帶BRCA1易患性等位基因的發(fā)病個(gè)體的機(jī)率極高;對(duì)此數(shù)據(jù)的唯一解釋是BRCA1位于Mfd191的遠(yuǎn)端,或者,該重組體是在44歲患上卵巢癌的偶發(fā)病例。對(duì)親緣族2035的解釋是根據(jù)對(duì)不同、有時(shí)是關(guān)系較遠(yuǎn)的親緣族旁系中不同的17q單倍型分離的觀察結(jié)果而得出的,而不是依據(jù)可直接觀察或推斷的重組體。觀察結(jié)果是這些單倍型中的部分就某些標(biāo)記具有共同的等位基因而對(duì)另外一些標(biāo)記則不同,該結(jié)果將BRCA1基因座定位于共有區(qū)域內(nèi)。對(duì)這一定位的確定性取決于幾個(gè)因素各單倍型攜帶者之間的關(guān)系,共有等位基因的頻率,顯示單倍型與BRCA1基因座一同分離的確性度,以及用于在該區(qū)域內(nèi)確定該單倍型的標(biāo)記的密度。在親緣族2035中,兩分支緊密相關(guān),各分支都有一些攜帶各自單倍型的早發(fā)型病例。有兩個(gè)共有等位基因是相同的(Mfd191、THRA1),在Mfd15、AA1和ED2處的共有等位基因的估計(jì)頻率分別是0.04、0.28和0.09。所以,很可能,這些等位基因的起源相同(起源于同一祖先)而不是狀態(tài)相同(來(lái)自普通群體的相同等位基因)。實(shí)施例6精細(xì)的物理作圖研究確定BRCA1基因在以tfj1474和U5R為側(cè)翼的區(qū)域內(nèi)自1990年最早在染色體17q上進(jìn)行定位(Hall等人,1990)以來(lái),已進(jìn)行了大量努力將BRCA1基因定位在一個(gè)足夠小的區(qū)域內(nèi),小至允許使用有效的定位克隆法來(lái)分離該基因。BRCA1基因座最早根據(jù)由214個(gè)來(lái)自世界各地的家族構(gòu)成的合作乳房癌連鎖協(xié)會(huì)數(shù)據(jù)集,利用多點(diǎn)連鎖分析(Easton等人,1993),被確定位于Mfd15(D17S250)至42D6(D17S588)之間。隨后的進(jìn)一步精確定位是根據(jù)個(gè)別家族中的個(gè)體重組。Bowcock等人(1993年)將其確定在THRA1至D17S183區(qū)域;Simard等人(1993年)將其確定在THRA1至D17S78區(qū)域。我們還證明BRCA1基因座一定位于標(biāo)記Mfd191(D17S776)(Goldgar等人,1994)的遠(yuǎn)端。已知該標(biāo)記位于THRA1和RARA的遠(yuǎn)端。所以,已公開(kāi)的最小BRCA1基因座區(qū)域是在D17S776和D17S78之間。該區(qū)域仍含有約1.5×106個(gè)DNA堿基,使得在此區(qū)域內(nèi)分離并測(cè)試全部基因十分困難。所以,我們力圖構(gòu)建該區(qū)域的物理圖譜,分離出一組該區(qū)域內(nèi)的多態(tài)性STR標(biāo)記,并在一組可提供信息的家族中對(duì)這些新的標(biāo)記進(jìn)行分析以便將BRCA1基因的位置確定在一可操作的間距內(nèi)。有4個(gè)家族可提供重要遺傳證據(jù),將BRCA1定位于一足夠小的區(qū)域從而可使用定位克隆法。兩個(gè)家族(K2082、K1901)提供與BRCA1近端邊界有關(guān)的數(shù)據(jù),另兩個(gè)(K2035,K1813)確定遠(yuǎn)端邊界。下文將對(duì)這些家族進(jìn)行詳細(xì)論述??捎肞CR測(cè)試的總共15個(gè)短串聯(lián)重復(fù)標(biāo)記,被用于在被研究家族中的精確定位。這些標(biāo)記包括DS17S7654、DS17S975、tdj1474和tdj1239。這些標(biāo)記的引物序列是DS17S754的SEQIDNO3和SEQIDNO4;DS17SS975的SEQIDNO5和SEQIDNO6;tdj1474的SEQIDNO7和SEQIDNO8;tdj1239的SEQIDNO9和SEQIDNO10。親緣族2082親緣族2082是迄今研究過(guò)的最大的BRCA1連鎖乳房癌/卵巢癌家族。其LOD值為8.6,明確表明與17q連鎖。該家族前文已述并顯示有一個(gè)關(guān)鍵重組體將BRCA1定位于MFD191(D17S776)的遠(yuǎn)端。該重組體出現(xiàn)在一個(gè)于45歲時(shí)被診斷為卵巢癌的婦女中,其母親于63歲患上卵巢癌。發(fā)病的母親已死亡;但是,從她的后代可以推斷她具有存在于該家族30個(gè)其它連鎖病例中的、位于Mfd15和Mfd188之間的連鎖單倍型。其發(fā)病的女兒在基因座ED2、4-7和Mfd188得到了連鎖的等位基因,但在Mfd15和Mfd191得到的是非BRCA1染色體上的等位基因。為了進(jìn)一步確定重組斷裂點(diǎn)的位置,我們就以下得自物理圖來(lái)源的標(biāo)記對(duì)該家族中的關(guān)鍵成員進(jìn)行的測(cè)試tdj1474、tdj1239、CF4、D17S855。發(fā)病的女兒沒(méi)有得到tdj1474和CF4標(biāo)記的連鎖等位基因。但是,就STR基因座tdj1239而言,可推斷母親有有關(guān)信息而女兒的確得到了BRCA1關(guān)聯(lián)等位基因。在該家族中,D17S855不提供信息。根據(jù)此分析,次序應(yīng)為17q著絲粒-Mfd191-17HSD-CF4-tdj1474-tdj1239-D17S855-ED2-4-7-17q端粒。所以上述重組體中將BRCA1定位于tdj1474的遠(yuǎn)端,而斷裂點(diǎn)在tdj1474和tdj1239之間。除了BRCA1位于tdj1474遠(yuǎn)端這種解釋之外,對(duì)該家族數(shù)據(jù)的唯一另一種解釋是,重組個(gè)體的卵巢癌是由與BRCA1基因不相關(guān)的原因引起的。由于很少有人在50歲前被診斷為卵巢癌,所以該解釋非常不可能。親緣族1901親緣族1901是一個(gè)早發(fā)型乳房癌家族,有7例50歲前診斷為乳房癌,其中4例在40歲之前。此外,還有3例在50至70歲之間診斷為乳房癌。有一例乳房癌還在61歲時(shí)診斷患卵巢癌。該家族現(xiàn)在與D17S855的LOD值為1.5。因?yàn)樵撨B鎖證據(jù)并且存在有至少一例卵巢癌,該家族因BRCA1而發(fā)病的經(jīng)驗(yàn)概率超過(guò)0.99。該家族中,重組緣自這樣一個(gè)事實(shí),即有一個(gè)體是卵巢癌病例(大部分其它病例遺傳自該卵巢癌病例)的兄弟,他只共有該家族中隨其它病例共分離的單倍型的一部分。但是,他將這一部分的單倍型傳給了他的女兒,后者在44歲時(shí)患上乳房癌。如果該病例是由BRCA1基因造成的,那么只有該兄弟與其姐妹共有的那部分單倍型可能含有BRCA1基因。解釋這種情況的難處在于,雖然可以確定不共有的標(biāo)記是重組體,但相同的標(biāo)記可能是因?yàn)榉侵亟M而共有,也可能是因?yàn)槠溆H代是純合子。沒(méi)有父親的基因型數(shù)據(jù),不可能區(qū)別這多種可能性。對(duì)K1901中的單倍型檢查顯示,他不共有Mfd15(D17S250)、THRA1、CF4(D17S1320)和tdj1474(17DS1321)的連鎖等位基因。他共有Mfd191(D17S776)、ED2(D17S1327)、tdj1239(D17S1328)和Mfd188(D17S579)處的連鎖等位基因。雖然Mfd191處的共有等位基因較少見(jiàn)(0.07),我們將假設(shè)親代是純合子,因?yàn)樗鼈兪强拷鼉蓚?cè)的標(biāo)記的重組體,而該區(qū)域內(nèi)的雙重組事件是極不可能的。所以,該家族的證據(jù)也表明BRCA1基因座位于tdj1474的遠(yuǎn)端。但是,沒(méi)有父親的基因型信息不能確定該斷裂點(diǎn)的下限。有趣的是,該家族中的關(guān)鍵重組體斷裂點(diǎn)證實(shí)了親緣族2082中的結(jié)果。如前所述,該家族中的定位信息只有在乳房癌是由BRCA1基因引起時(shí)才有意義。但是,她相對(duì)早的診斷時(shí)年齡(44歲)使得這一點(diǎn)顯得很有可能,因?yàn)?5前乳房癌的風(fēng)險(xiǎn)在普通群體中是很低的(約1%)。親緣族2035有關(guān)鍵重組體的信息不是直接觀察到的而是由觀察結(jié)果推斷的,該觀察結(jié)果是為隨該家族兩旁系中早發(fā)型乳房癌共分離的兩個(gè)單倍型對(duì)位于17qBRCA1區(qū)域近端的標(biāo)記表現(xiàn)相同但對(duì)較遠(yuǎn)端基因座的表現(xiàn)不同。在這一點(diǎn)上,該家族與K1901類似。兩單倍型都出現(xiàn)在至少4例早發(fā)型或雙側(cè)乳房癌中。該家族與ED2的總LOD值為2.2,考慮到該家族中有一例卵巢癌(表明與BRCA1連鎖的先驗(yàn)概率為80%),得出的該家族與BRCA1連鎖的經(jīng)驗(yàn)概率為0.998。兩單倍型對(duì)標(biāo)記Mfd15、THRA1、Mfd191、ED2、AA1、D17S858和D17S902相同。Mfd15和ED2處的共同等位基因很少見(jiàn),這表明該單倍型在后代中共有相同。但單倍型對(duì)CA375、4-7和Mfd188及幾個(gè)更遠(yuǎn)的標(biāo)記不相同。這表明BRCA1基因座一定位于CA375的上游。該標(biāo)記在D17S78下游約50kb處,所以,它主要起到進(jìn)一步證實(shí)了先前Simard等人(1993)報(bào)道的下游邊界。親緣族1813親緣族1813是一個(gè)小家族,有4例于40歲前診斷為的乳房癌,她們母親在45歲診斷為乳房癌并在61歲診斷為卵巢癌。這一情況因這樣的事實(shí)而有些復(fù)雜即4病例有3個(gè)不同的父親,其中只有一個(gè)確定了基因型。但是,通過(guò)對(duì)BRCA1區(qū)域內(nèi)一些不同標(biāo)記和基因組中其它位置的高度多態(tài)性標(biāo)記的分型,已高可信度地確定了該家族中所有后代的父系。該家族與17q標(biāo)記的最大多點(diǎn)LOD值為0.60,在已知有至少一例卵巢癌的情況下,作為BRCA1連鎖家族的經(jīng)驗(yàn)概率為0.93。該家族個(gè)體18中有一個(gè)可直接觀察到的重組事件(參見(jiàn)圖5,Simard等人,HumanMol.Genet.21193-1199(1993)),該個(gè)體在34歲時(shí)發(fā)生乳房癌。從她的基因型、她的發(fā)病的姐妹的基因型和其它3個(gè)未發(fā)病的同胞的基因型,可推斷其發(fā)病的母親在相關(guān)的17q基因座的基因型。個(gè)體18遺傳了以下基因座的BRCA1連鎖等位基因Mfd15、THRA1、D17S800、D17S855、AA1和D17S931。但是,對(duì)D17931下游的標(biāo)記,即U5R、vrs31、D17S858和D17S579,她遺傳了不帶疾病的染色體上的等位基因。來(lái)自該家族的證據(jù)由此確定BRCA1位于標(biāo)記U5R的近端。因?yàn)樗^早的診斷年齡(34歲),極可能該重組個(gè)體的癌腫是因?yàn)榕c該家族其它乳房癌/卵巢癌病例有關(guān)的基因引起的;該家族中的不定性緣于我們較少的證據(jù),即該家族中的乳房癌是由于BRCA1而不是另一個(gè)、尚為作圖的癌腫易患性基因座。含BRCA1的區(qū)域的大小根據(jù)以上詳細(xì)描述的遺傳數(shù)據(jù),BRCA1基因座一定位于標(biāo)記tdj1474和U5R之間,兩標(biāo)記都在本實(shí)驗(yàn)室中得以分離。根據(jù)圖2和3中的物理圖譜,我們可以試著估計(jì)這兩個(gè)基因座之間的物理距離。大約需要14個(gè)平均插入片段大小約80kb的P1克隆來(lái)跨越該區(qū)域。但是,所有這些P1克隆都有某種未知程度的重疊,所以很可能物理距離比80kb的14倍小得多。根據(jù)覆蓋該區(qū)域的克隆的限制性圖譜,我們估計(jì)含BRCA1區(qū)域的大小約為650kb。實(shí)施例7通討毗連群區(qū)的基因組分析鑒定BRCA1基因座的候選cDNA克隆可能區(qū)域的全面篩選。鑒定候選cDNA的第一種方法是利用已知技術(shù),但是勞動(dòng)強(qiáng)度較大。該方法包括篩選毗連群內(nèi)的粘粒和P1及BAC克隆以鑒定出推斷的編碼序列。然后將含有推斷的編碼序列的克隆用作cDNA文庫(kù)濾膜上的探針,以鑒定出候選cDNA克隆用于以后的分析。用兩種方法中的任何一種,就推斷的編碼序列篩選克隆。動(dòng)物印跡。鑒定推斷的編碼序列的第一種方法是篩選粘粒和P1克隆,尋找在進(jìn)化過(guò)程中種間保守的序列。該技術(shù)被稱為“動(dòng)物印跡分析”,Monaco,1986對(duì)此有所說(shuō)明。具體地說(shuō),來(lái)自牛、雞、豬、小鼠和大鼠的DNA用限制酶EcoRI和HindIII消化(8μgDNA/酶)。消化后的DNA在0.7%的凝膠(14cm的凝膠)上,以20伏分離16小時(shí),以標(biāo)準(zhǔn)的Southern印跡技術(shù)將DNA轉(zhuǎn)移到尼龍膜上。例如,動(dòng)物印跡濾膜在65℃,在0.1×SSC,0.5%SDS和0.2M的Tris(pH8.0)中處理30分鐘,然后在42℃,在5×SSC、10%PEG8000、20mMNaPO4(pH6.8)、100μg/ml鮭精DNA、1×Denhardt’s、50%甲酰胺、0.1%SDS和2μg/mlC0t-1DNA中封閉過(guò)夜。用限制酶消化待分析的粘粒和P1克隆,使人DNA從載體DNA上釋放。DNA在14cm、0.5%瓊脂糖凝膠上,以20伏電壓,過(guò)夜電泳16小時(shí)。從凝膠中切取人DNA帶,在0.5×Tris乙酸鹽緩沖液中,以100伏電壓,由凝膠邊緣電洗脫人DNA至少2小時(shí)(Maniatis等人,1982)。然后用EcoRI限制酶消化洗出的經(jīng)NotI消化的DNA(~15kb至25kb)以產(chǎn)生更小的片段(~0.5kb至5.0kb),后者在下一步放射性核苷酸標(biāo)記DNA中更容易解鏈。利用六聚體(Borhringer-Mannheim,目錄#1004760)隨機(jī)引發(fā)標(biāo)記法標(biāo)記這些DNA片段。標(biāo)記的DNA經(jīng)精胺沉淀(加100μlTE,5μl0.1M精胺,和5μl10mg/ml鮭精DNA)去除未摻入的放射性核苷酸。然后將標(biāo)記過(guò)的DNA在100μlTE、0.5MNaCl中于65℃懸浮5分鐘,再按照制造商的說(shuō)明用人C0t-1DNA(Gibco/BRL,目錄#5279SA)封閉2-4小時(shí)。經(jīng)C0t-1封閉的探針在動(dòng)物印跡濾膜上,在封閉溶液中于42℃孵育過(guò)夜。濾膜在2×SSC、0.1%SDS中,室溫下洗滌30分鐘,再在相同的溶液中于55℃洗滌30分鐘。將濾膜與帶增感屏的KodakXAR-5膠片在-70℃曝光1至3天。這樣,動(dòng)物印跡或者與插入片段的EcoRI片段混合物雜交,或者與單個(gè)片段雜交。HTF島分析。鑒定用作cDNA文庫(kù)探針的粘粒的另一種方法是HTF島分析。由于脈沖場(chǎng)圖譜可揭示HTF島,所以優(yōu)先分析這些定位于HTF島區(qū)域的粘粒。HTF島是含有高頻率非甲基化CpG二核苷酸的DNA片段(Tonolio等人,1990),并可通過(guò)識(shí)別序列包括CpG二核苷酸的酶限制性位點(diǎn)的聚集程度來(lái)揭示。已知用于HTF島分析的酶是AscI、NotI、BssHII、EagI、SacII、NaeI、NarI、SmaI和MluI(Anand,1992)。用酶NotI、NruI、EagI、SacII和SalI產(chǎn)生脈沖場(chǎng)圖,發(fā)現(xiàn)兩個(gè)HTF島。這些島位于區(qū)域的遠(yuǎn)末端,一個(gè)在GP2B基因座的遠(yuǎn)端,另一個(gè)在同一基因座的近端,兩個(gè)都在BRCA1區(qū)域外。分析來(lái)自YAC的、覆蓋這兩個(gè)位置的粘粒,以鑒定含有這些限制性位點(diǎn)的質(zhì)粒,進(jìn)而鑒別出HTF島。cDNA篩選。含有HTF島或與除人之外物種的DNA雜交的克隆可能含有編碼序列。從這些克隆中分離出作為完整插入片段或EcoRI片段的人DNA,并如上所述進(jìn)行標(biāo)記。用標(biāo)記過(guò)的DNA在與動(dòng)物印跡相同的條件下篩選各種cDNA文庫(kù)濾膜,所不同的是cDNA濾膜經(jīng)受了更嚴(yán)緊的洗滌,2次以0.1×SSC和0.1%SDS在65℃洗滌30分鐘。迄今在我們的研究中使用的大多數(shù)cDNA文庫(kù)(cDNA文庫(kù)得自正常乳房組織、一個(gè)懷孕8個(gè)月的婦女和乳房癌惡化的婦女的乳房組織)是Clonetech,Inc.制備的??蓮腃lonetech(目錄#HL1037a)購(gòu)得構(gòu)建于λgt-10載體的懷孕8個(gè)月的婦女的乳房組織的cDNA文庫(kù),它培養(yǎng)在C600Hfl細(xì)菌宿主細(xì)胞內(nèi)。由一37歲的高加索女性分離正常乳房組織和惡性乳房組織的樣本,兩種組織各取1克送至Clonetech進(jìn)行mRNA加工和構(gòu)建cDNA文庫(kù)。利用隨機(jī)引發(fā)和寡聚dT引發(fā)來(lái)產(chǎn)生后兩個(gè)cDNA文庫(kù),并篩選出大小合適的最終產(chǎn)物克隆入λZapII載體,按照制造商的說(shuō)明將其培養(yǎng)在XL1-藍(lán)菌株中。其它組織特異性cDNA文庫(kù)包括人胎腦(Stratagene,目錄936206)、人睪丸(Clonetech目錄HL3024)、人胸腺(Clonetech目錄HL1127n)、人腦(Clonetech目錄HL11810)、人胎盤(Clonetech目錄1075b)和人骨骼肌(Clonetech目錄HL1124b)。將cDNA文庫(kù)及其宿主細(xì)胞鋪于NZCYM板上,按照Maniatis等人(1982)所述,從每一板上重復(fù)進(jìn)行濾膜取印。純化候選基因組克隆的插入(人)DNA,并放射性標(biāo)記至高比活性。然后放射性DNA與cDNA濾膜雜交,以鑒定對(duì)應(yīng)于候選粘??寺≈械幕虻腸DNA。挑選、再鋪平板由此鑒定出的cDNA,并再次用標(biāo)記過(guò)的克隆插入片段或由其衍生的EcoRI片段DNA篩選,以證實(shí)其為陽(yáng)性狀態(tài)。培養(yǎng)在這第二輪篩選后呈陽(yáng)性的克隆,并純化其DNA用于Southern印跡分析和測(cè)序??寺】梢园凑罩圃焐痰姆椒ㄕf(shuō)明,從λ載體上通過(guò)體內(nèi)切取質(zhì)粒而作為質(zhì)粒純化,也可以作為限制性片段從λ載體上分離,然后將其亞克隆入質(zhì)粒載體中。重復(fù)進(jìn)行Southern印跡,其中之一用原初基因組的插入DNA作為探針來(lái)證實(shí)cDNA插入片段子中含有雜交序列。另一次印跡是與最大cDNA克隆的cDNA插入DNA雜交,以鑒定出代表相同基因的克隆。所有與基因組克隆雜交并具有單一性的cDNA被測(cè)序,并分析DNA以確定序列是否代表了已知的或單一的基因。所有表現(xiàn)出單一性的cDNA作為候選BRCA1基因座被進(jìn)一步分析。具體地說(shuō),這些克隆與Northern印跡雜交以查找乳房特異性表達(dá)和正常的對(duì)乳房腫瘤RNA的差異表達(dá)。還在BRCA1區(qū)域內(nèi)的克隆上對(duì)它們進(jìn)行了PCR分析以確定它們的位置。為了對(duì)基因座范圍作圖,分離出全長(zhǎng)cDNA,并將其序列用作YAC和包圍并包含原初鑒定克隆的克隆上的PCR探針。然后通過(guò)序列分析進(jìn)一步確定內(nèi)含子-外顯子邊界。我們已用得自該區(qū)域內(nèi)粘粒BAC和P1克隆的動(dòng)物印跡陽(yáng)性EcoRI片段,篩選了正常乳房、8個(gè)月孕婦的乳房和胎腦的cDNA文庫(kù)。在這3個(gè)文庫(kù)中鑒定出了潛在的BRCA1cDNA克隆。挑選出克隆,再鋪平板,并用原初探針再次篩選以確認(rèn)其為陽(yáng)性。對(duì)雜交體選擇的cDNA的分析。直接選取的cDNA片段用DNA探針通過(guò)Southern印跡雜交檢查以證實(shí)它們來(lái)自毗連群。對(duì)通過(guò)該測(cè)試的片段進(jìn)行完整測(cè)序。然后,由此獲得的這套DNA序列相互雜交檢查以查找重疊的獨(dú)立克隆。例如,克隆694-65、1240-1和1240-33是分別獲得的,但序列上顯示為來(lái)自同一毗連cDNA序列,該序列定名為EST4891。候選克隆的分析。對(duì)上述產(chǎn)生的一個(gè)或多個(gè)候選基因進(jìn)行測(cè)序,并將信息用于鑒定和分型每一種被表達(dá)的基因。通過(guò)核苷酸序列比較并通過(guò)在翻譯所有框架后與已知氨基酸序列比較來(lái)將這些DNA序列與已知基因進(jìn)行比較。這種比較的是對(duì)本地以及遠(yuǎn)程序列數(shù)據(jù)庫(kù)(如GenBank)進(jìn)行比較而完成的,其中使用GeneticDataEnvironment(GDE)2.2版軟件和BasicLocalAlignmentSearchTool(Blast)系列客戶/服務(wù)器軟件包(例如BLASTN1.3.13MP),并在SunSPARC工作站上運(yùn)行。已經(jīng)產(chǎn)生了從用粘粒和P1鑒定的cDNA克隆集合而重構(gòu)的序列。進(jìn)一步分析所有代表新序列的候選基因以測(cè)定它們作為推斷的BRCA1基因座的候選性。突變的篩選。為了篩選發(fā)病譜系中的突變,使用了兩種不同的方法。第一種,將從已知攜帶BRCA1易患性等位基因的家族成員中分離出的DNA用作PCR擴(kuò)增候選基因的模板。如果PCR引物在內(nèi)含子/外含子邊界的旁邊或與其重疊,擴(kuò)增出的片段將比預(yù)計(jì)的cDNA序列大,或者不存在于擴(kuò)增后的混合物中。利用一套設(shè)計(jì)的引物將這種擴(kuò)增實(shí)驗(yàn)與P1、BAC或粘粒克隆測(cè)序相結(jié)合,便可以確定內(nèi)含子/外含子結(jié)構(gòu)并最終獲得該譜系的基因組DNA的DNA序列。第二種方法在候選基因的內(nèi)含子/外顯子較復(fù)雜時(shí)要快得多,它涉及對(duì)由譜系淋巴細(xì)胞cDNA擴(kuò)增得到的片段進(jìn)行測(cè)序。從該譜系的血液中抽提淋巴細(xì)胞mRNA,由此mRNA合成cDNA,將其用作利用設(shè)計(jì)的引物PCR擴(kuò)增的底物。如果候選基因在淋巴細(xì)胞中大量表達(dá),這種實(shí)驗(yàn)通常產(chǎn)生不需要知道內(nèi)含子/外顯子連接而可直接測(cè)序的擴(kuò)增片段。通過(guò)凝膠電泳來(lái)分析這種測(cè)序反應(yīng)的產(chǎn)物,以確定序列中含有突變(例如缺失或插入)或堿基對(duì)置換的物質(zhì)(它們都會(huì)導(dǎo)致氨基酸改變或其它有害結(jié)果)。任何一種在乳房組織中表達(dá)的BRCA1區(qū)域內(nèi)的序列都被認(rèn)為是BRCA1的候選基因。給定候選基因?qū)?yīng)于BRCA1的有力證據(jù)緣于這樣的證明即譜系家族含有該候選基因的缺陷型等位基因。實(shí)施例8BRCA1的鑒定BRCA1的鑒定。使用多種方案,繪制出在D17S1321和D17S1324之間600kb的17q21區(qū)域的詳細(xì)圖譜。候選的被表達(dá)序列定義為以下途徑獲得的DNA序列1)對(duì)乳房、胎腦或淋巴細(xì)胞cDNA文庫(kù)的直接篩選,2)對(duì)乳房、淋巴細(xì)胞或卵巢cDNA的雜交體選擇,或3)對(duì)基因組DNA的隨機(jī)測(cè)序和利用XPOUND(Thoma和Skolnick,1994)預(yù)測(cè)編碼外顯子。很多情況下,這些可表達(dá)序列被組合成由多個(gè)分別鑒定出的序列構(gòu)成的毗連群。候選基因可能包含一個(gè)以上的這些候選可表達(dá)序列。通過(guò)雜交體選擇、直接篩選cDNA文庫(kù)和對(duì)P1亞克隆隨機(jī)測(cè)序鑒定了該區(qū)域內(nèi)的65個(gè)候選可表達(dá)序列。通過(guò)對(duì)分離17q連鎖的乳房癌和卵巢癌易患性親緣族個(gè)體中的轉(zhuǎn)錄產(chǎn)物大小、DNA序列、數(shù)據(jù)庫(kù)比較、表達(dá)方式、基因組結(jié)構(gòu)和最重要的DNA序列分析,對(duì)表達(dá)序列進(jìn)行定性。分離得到3個(gè)獨(dú)立的表達(dá)序列的毗連群11411(649bp)、6945(213bp)和754∶2(1079bp),并被最后證明代表了部分的BRCA1。當(dāng)用這些毗連群的EST作為Northern分析的探針時(shí),在正常的乳房mRNA中只發(fā)現(xiàn)一種約7.8kb的轉(zhuǎn)錄產(chǎn)物,這表明它們編碼同一基因的不同部分。篩選乳房、胎腦、胸腺、睪丸、淋巴細(xì)胞和胎盤的cDNA文庫(kù),并用乳房mRNA進(jìn)行PCR試驗(yàn),將11411、6945和7542的毗連群連接起來(lái)。5’RACE試驗(yàn)使用胸腺、睪丸和乳房mRNA將毗連群延伸至推斷的5’末端,由此獲得復(fù)合的全長(zhǎng)序列。該區(qū)域內(nèi)P1和BAC的PCR和直接測(cè)序被用于鑒定內(nèi)含子的位置和測(cè)定剪接供體和受體的位點(diǎn)。這3個(gè)可表達(dá)序列被合并成一個(gè)轉(zhuǎn)錄單元,該單元在最后的分析中被確認(rèn)為BRCA1。這一轉(zhuǎn)錄單元位于該600kb區(qū)域中部的D17S855附近(圖4)。將得自cDNA克隆、雜交體選擇序列和PCR擴(kuò)增產(chǎn)物的序列合并起來(lái),能夠構(gòu)建出復(fù)合的全長(zhǎng)BRCA1cDNA(SEDIDNO1)。BRCA1cDNA序列(終止子以上)也已在GenBank保藏,登記號(hào)為U-14680。該保藏序列在此被參考引用。在3’方向延伸最遠(yuǎn)的cDNA克隆含有聚腺苷酸化信號(hào)和隨后的聚腺苷酸段。cDNA的概念翻譯揭示了一段208千道爾頓的長(zhǎng)開(kāi)放閱讀框(氨基酸序列SEQIDNO2),其中有一潛在的起始密碼子,該密碼子側(cè)翼為與Kozak一致序列(Kozak,1987)相似的序列。Smith-Waterman(Smith和Waterman,1981)和BLAST(Altschul等,1990)搜索鑒定了一段靠近氨基末端的序列,它與鋅指域具有相當(dāng)?shù)耐葱?圖5)。該序列含有位于C3HC4鋅指基序(motif)中的半胱氨酸和組氨酸,并與數(shù)據(jù)庫(kù)中的鋅指蛋白共有多個(gè)其它殘基。BRCA1基因由23個(gè)編碼外顯子構(gòu)成,它們排列在超過(guò)100Kb的基因組DNA上(圖6)。利用BRCA1cDNA片段為探針的Northern印跡鑒定了單一的約7.8kb的轉(zhuǎn)錄產(chǎn)物,該轉(zhuǎn)錄產(chǎn)物在乳房、胸腺和睪丸中最多,也存在于卵巢中(圖7)。還觀察到4種不同剪接產(chǎn)物的獨(dú)立cDNA克??;其中3個(gè)在乳房中檢測(cè)到,有2個(gè)在卵巢mRNA中(圖6)。組織cDNA的PCR檢測(cè)進(jìn)一步支持了這一觀點(diǎn),即該基因的轉(zhuǎn)錄產(chǎn)物靠近5’端具有相當(dāng)?shù)牟痪恍?;不均一性的分子基礎(chǔ)涉及不同的第一剪接供體位點(diǎn)選擇,而測(cè)得的變化都改變了鑒定出的起始密碼子5’區(qū)域的轉(zhuǎn)錄產(chǎn)物。我們?cè)谠?’非翻譯區(qū)測(cè)得6個(gè)潛在的其它剪接供體,最長(zhǎng)缺失為1,155bp。乳房和卵巢中的主要BRCA1蛋白形式?jīng)]有外顯子4。BRCA1外顯子4的核苷酸序列見(jiàn)SEQIDNO11,其預(yù)期氨基酸序列見(jiàn)SEQIDNO12。另一BRCA1基因組DNA5’序列顯示在SEQIDNO13中。位置1處的G代表在睪丸中的潛在起始位點(diǎn)。位置140處中的A代表體細(xì)胞組織中的潛在起始位點(diǎn)。如圖8所示,該5’序列有6種不同剪接形式。位置356處的G代表標(biāo)準(zhǔn)的第一剪接供體位點(diǎn)。位置444處的G代表兩個(gè)克隆(睪丸1和睪丸2)中的第一剪接供體位點(diǎn)。位置889處的G代表胸腺3中的第一剪接供體位點(diǎn)。第四種剪接供體位點(diǎn)是位置1230處的G。位置1513處的T代表所有上述剪接供體的剪接受體位點(diǎn)。第五種不同剪接形式具有在位置349處的第一剪接供體位點(diǎn),位置591處的第一剪接受體位點(diǎn),以及位置889處的第二剪接供體位點(diǎn)和位置1513處的第二受體位點(diǎn)。第六種不同形式在該5’區(qū)域是非剪接的。位置1532處的A是標(biāo)準(zhǔn)起始位點(diǎn),它出現(xiàn)在SEQIDNO1的位置120處。測(cè)定為BRCA1的部分基因組DNA序列顯示在圖10A-10H和SEQIDNO14至34中。小寫(xiě)字母(圖10A-10H中)表示內(nèi)含子序列,大寫(xiě)字母表示外含子序列。圖10A-10H中以vvvvvvvvvvvvv表示內(nèi)含子內(nèi)不確定的間隔。表9列出內(nèi)含子/外顯子的連接。在在外顯子8和14的5’端有發(fā)現(xiàn)的CAG,位于某些cDNA中但在其它c(diǎn)DNA中則沒(méi)有發(fā)現(xiàn)。圖10A-10H中以黑體顯示已知的多態(tài)性位點(diǎn),并加有下劃線。已知的多態(tài)性列于表18和19。表9外長(zhǎng)內(nèi)顯子邊界顯堿基子位置*度No.5’3’5’3’e11100100GATAAATTAAAACTGCGACTGCGCGGCGTG35*GTAGTAGAGTCCCGGGAAAGGGACAGGGGG36e210119999ATATATATATGTTTTTCTAATGTGTTAAAG37GTAAGTCAGCACAAGAGTGTATTAATTTGG38e320025354TTTCTTTTTCTCCCCCCCCTACCCTGCTAG39GTAAGTTTGAATGTGTTATGTGGCTCCATT40e4******111AGCTACTTTTTTTTTTTTTTTTTGAGACAG41GTAAGTGCACACCACCATATCCAGCTAAAT42e525433178AATTGTTCTTTCTTTCTTTATAATTTATAG43GTATATAATTTGGTAATGATGCTAGGTTGG44e633242089GAGTGTGTTTCTCAAACAATTTAATTTCAG45GTAAGTGTTGAATATCCCAAGAATGACACT46e7421560140AAACATAATGTTTTCCCTTGTATTTTACAG47GTAAAACCATTTGTTTTCTTCTTCTTCTTC48e8561666106TGCTTGACTGTTCTTTACCATACTGTTTAG49GTAAGGGTCTCAGGTTTTTTAAGTATTTAA50e966771246TGATTTATTTTTTGGGGGGAAATTTTTTAG51GTGAGTCAAAGAGAACCTTTGTCTATGAAG52e1071378977TCTTATTAGGACTCTGTCTTTTCCCTATAG53GTAATGGCAAAGTTTGCCAACTTAACAGGC54e1179042153426GAGTACCTTGTTATTTTTGTATATTTTCAG55GTATTGGAACCAGGTTTTTGTGTTTGCCCC56e124216430287ACATCTGAACCTCTGTTTTTGTTATTTAAG57AGGTAAAAAGCGTGTGTGTGTGTGCACATG58e1343034476174CATTTTCTTGGTACCATTTATCGTTTTTGA59GTGTGTATTGTTGGCCAAACACTGATATCT60e1444774603127AGTAGATTTGTTTTCTCATTCCATTTAAAG61GTAAGAAACATCAATGTAAAGATGCTGTGG62e1546044794191ATGGTTTTCTCCTTCCATTTATCTTTCTAG63**GTAATATTTCATCTGCTGTATTGGAACAAA64e1647955105311TGTAAATTAAACTTCTCCCATTCCTTTCAG65GTGAGTGTATCCATATGTATCTCCCTAATG66e175106519388ATGATAATGGAATATTTGATTTAATTTCAG67GTATACCAAGAACCTTTACAGAATACCTTG68e185194527178CTAATCCTTTGAGTGTTTTTCATTCTGCAG69GTAAGTATAATACTATTTCTCCCCTCCTCC70e195272531241TGTAACCTGTCTTTTCTATGATCTCTTTAG71GTAAGTACTTGATGTTACAAACTAACCAGA72e205313539684TCCTGATGGGTTGTGTTTGGTTTCTTTCAG73GTAAAGCTCCCTCCCTCAAGTTGACAAAAA74e215397545155CTGTCCCTCTCTCTTCCTCTCTTCTTCCAG75GTAAGAGCCTGGGAGAACCCCAGAGTTCCA76e225452552574AGTGATTTTACATGTAAATGTCCATTTTAG77GTAAGTATTGGGTGCCCTGTCAGTGTGGGA78e235526558661TTGAATGCTCTTTCCTTCCTGGGGATCCAG79GTAAGGTGCCTCGCATGTACCTGTGCTATT80e2455875914328CTAATCTCTGCTTGTGTTCTCTGTCTCCAG81*SEQIDNO1中的堿基編號(hào)**指SEQIDNO的編號(hào)。***來(lái)自SEQIDNO11的e4。低嚴(yán)緊性印跡,即用缺失了鋅指區(qū)域的BRCA1序列為探針雜交來(lái)自不同系統(tǒng)發(fā)育背景的生物基因組DNA,發(fā)現(xiàn)了人、猴、羊和豬中的強(qiáng)雜交片段,以及鼠中很弱的雜交信號(hào)。該結(jié)果表明,除了鋅指域外,BRCA1在進(jìn)化過(guò)程中只具有中等保守性。17q連鎖的親緣族中的種系BRCA1突變。對(duì)BRCA1候選基因最嚴(yán)格的檢測(cè),是在分離17q連鎖的乳房癌和卵巢癌易患性的親緣族的攜帶者個(gè)體中,尋找潛在的分裂突變。這類個(gè)體一定含有不同于野生型序列的BRCA1等位基因。用于該分析的這組DNA樣本,由代表了8個(gè)不同BRCA1親緣族的個(gè)體的DNA組成。表10親緣族說(shuō)明和關(guān)聯(lián)LOD值親緣族病例數(shù)(n)偶發(fā)病LOD值標(biāo)記例數(shù)1(n)乳房癌50歲前的卵巢癌乳房癌208231202279.49D17S1327209922142*02.36D17S800/D17S855220351081*02.25D17S132719011071*01.50D17S855192543000.55D17S579191054000.36D17S579/D17S250219275401-0.44D17S25019118502-0.20D17S2501.不共有在該親緣族其它病例中分離的BRCA1連鎖的單倍型的、患有乳房癌(診斷于50歲前)或卵巢癌(診斷于任何年齡)的婦女人數(shù)。2.用兩個(gè)標(biāo)記計(jì)算而得的多點(diǎn)LOD值。*同時(shí)具有患乳房癌和卵巢癌的個(gè)體的親緣族;該個(gè)體既算作乳房癌病例又算作卵巢癌病例。17q21中一組標(biāo)記在這些親緣族中的優(yōu)勢(shì)對(duì)數(shù)(logarithmoftheodds,LOD)在9.49至-0.44之間。其中4個(gè)家族具有令人信服的連鎖LOD值,4個(gè)具有低正值或負(fù)值的LOD值。包括后4個(gè)親緣族是因?yàn)樗鼈冏C明了至少3個(gè)發(fā)病成員共有染色體17q21上的單倍型。而且,該組中的所有親緣族都表現(xiàn)出早發(fā)乳房癌,而且有4個(gè)親緣族包括了至少一例卵巢癌,兩者均是BRCA1親緣族的標(biāo)記。親緣族2082具有近乎相等的乳房癌和卵巢癌發(fā)病率,基于群體中較低的卵巢癌發(fā)病率而言,這是一個(gè)特例。除2個(gè)之外的所有親緣族都在猶他州加以確認(rèn)。K2035來(lái)自中西部。K2099來(lái)自美國(guó)南部的非洲-美洲親緣族。在最初對(duì)BRCAl中傾向性突變的篩選中,測(cè)試了各親緣族中一個(gè)攜帶有易患單倍型個(gè)體的DNA。從基因組DNA樣本或從淋巴細(xì)胞mRNA制備的cDNA擴(kuò)增出23個(gè)編碼外顯子和相關(guān)的剪接接頭。在將擴(kuò)增出的DNA序列與野生型序列比較時(shí),8個(gè)親緣族實(shí)例中4個(gè)被發(fā)現(xiàn)有序列變異體(表11)。表11傾向性突變親緣族編號(hào)突變體編碼結(jié)果位置*2082C→TGln→終止40561910多余的C移碼53582099T→GMet→Arg54432035?不轉(zhuǎn)錄1901缺失11bp移碼189*在SEQIDNO1中4種序列變異體都是雜合的,而且每一種都只表現(xiàn)在一個(gè)親緣族中。親緣族2082含有在編碼外顯子10中的一個(gè)無(wú)義突變(圖9A),親緣族1910有一個(gè)在外顯子19中的單核苷酸插入(圖9B),親緣族2099有一個(gè)在編碼外顯子20中的錯(cuò)義突變,造成Met→Arg取代(圖9C)。移碼突變和無(wú)義突變有可能損害BRCAl產(chǎn)物的功能。由親緣族1910中的移碼等位基因編碼的肽含有改變的、從野生型的C末端第107個(gè)殘基起的氨基酸序列。親緣族1901的移碼等位基因編碼的肽含有改變的、從從野生型的N末端第24個(gè)殘基起的氨基酸序列。親緣族2082的突變型等位基因編碼的蛋白質(zhì)缺失從C末端起548個(gè)殘基。親緣族2099中的錯(cuò)義突變具有潛在的危害性,因?yàn)樗鼘?dǎo)致大的帶電殘基Arg取代了小的疏水性氨基酸Met。還觀察到11個(gè)共同的多態(tài)性,8個(gè)在編碼序列中,3個(gè)在內(nèi)含子中。親緣族2035中的被研究個(gè)體顯然具有BRCAl內(nèi)的調(diào)節(jié)型突變。在她的cDNA中,多態(tài)性位點(diǎn)(堿基3667處的A→G)表現(xiàn)為純合的,但她的基因組DNA在此位置表現(xiàn)出雜合性(圖9C)。對(duì)此結(jié)果一種可能的解釋是,她的突變BRCAl等位基因的mRNA的丟失是因?yàn)橥蛔冇绊懫洚a(chǎn)生或穩(wěn)定性。通過(guò)檢查BRCAl編碼區(qū)域內(nèi)的5個(gè)多態(tài)性位點(diǎn)進(jìn)一步檢驗(yàn)這種可能性,在BRCAl的轉(zhuǎn)錄產(chǎn)物中按3.5kb分離這5個(gè)位點(diǎn)。在她的基因組DNA對(duì)某一多態(tài)性表現(xiàn)為雜合的所有情況下,cDNA總是純合的。在其它親緣族個(gè)體和親緣族2035的非單倍型攜帶者中,可以觀察到這些多態(tài)性位點(diǎn)在cDNA中是雜合的,這暗示由cDNA進(jìn)行的擴(kuò)增并不偏向于某個(gè)等位基因。該分析表明親緣族2035的BRCAl突變或者阻礙了轉(zhuǎn)錄,或者造成BRCAl轉(zhuǎn)錄產(chǎn)物的不穩(wěn)定性或不正常剪接。BRCA1突變與BRCA1單倍型的共分離和群體頻率分析。除了潛在的分解蛋白的功能之外,序列變異體還必須滿足兩條標(biāo)準(zhǔn)才夠格成為候選的傾向性突變。變異體必須1)存在于親緣族中攜帶了傾向性BRCA1單倍型的個(gè)體中,但不存在于親緣族的其它個(gè)體中,2)鮮見(jiàn)于普通群體中。檢查了每一種突變與BRCA1的共分離情況。對(duì)于親緣族1910中的移碼突變,對(duì)另兩個(gè)單倍型攜帶者和一個(gè)非攜帶者進(jìn)行了測(cè)序(圖9B)。只有攜帶者表現(xiàn)出了移碼突變。親緣族2082中C變?yōu)門產(chǎn)生了一個(gè)新的AvrII限制性位點(diǎn)。對(duì)該親緣族中的其它攜帶者和非攜帶者就是否存在該限制性位點(diǎn)進(jìn)行了檢查(圖9A)。設(shè)計(jì)了等位基因特異性寡核苷酸(ASO)在親緣族2099中檢查是否存在序列變異體。針對(duì)先前在該親緣族中測(cè)得的突變,利用ASO對(duì)該親緣族中的一些個(gè)體進(jìn)行了篩選,其中有些個(gè)體已知帶有與傾向性等位基因關(guān)聯(lián)的單倍型,另一些則已知不帶關(guān)聯(lián)單倍型。在每個(gè)親緣族中,在攜帶有BRCA1關(guān)聯(lián)單倍型的個(gè)體中都測(cè)得了相應(yīng)的突變型等位基因,而在非攜帶者中則沒(méi)有。對(duì)于發(fā)現(xiàn)調(diào)節(jié)型突變的親緣族2035個(gè)體,將該親緣族中攜帶者的cDNA與基因組DNA就多態(tài)性位點(diǎn)的雜合性進(jìn)行了比較。在各例中,cDNA樣本中缺失的等位基因被證明存在于攜帶有BRCA1傾向性等位基因的染色體上(圖9C)。為了排除突變只是群體中一般多態(tài)性的可能性,使用針對(duì)各種突變的ASO來(lái)篩選一組正常DNA樣本。根據(jù)猶他州群體的隨機(jī)樣本進(jìn)行高加索人中的基因頻率分析。根據(jù)M.Peracek-Vance提供的39份樣本進(jìn)行非洲-美洲人中的基因頻率分析,這些樣本來(lái)自她在連鎖研究中所用的非洲-美洲人和20個(gè)新生的猶他州非洲-美洲人。在適當(dāng)?shù)膶?duì)照群體中沒(méi)有發(fā)現(xiàn)4種潛在的傾向性突變中的任何一種,這表明它們?cè)谄胀ㄈ后w中很少見(jiàn)。所以,這些候選的傾向性突變滿足了成為BRCA1易患性等位基因的兩條重要條件1)突變型等位基因與疾病的共分離,2)突變型等位基因不存在于對(duì)照中,這表明其在普通群體中基因頻率低。BRCA1突變的表型表達(dá)。BRCA1蛋白質(zhì)突變的影響與在BRCA1親緣族觀察到的表型表達(dá)差異有關(guān)。大多數(shù)BRCA1親緣族有發(fā)生卵巢癌風(fēng)險(xiǎn)的中等程度提高,有一較小的家族具有可與乳房癌發(fā)病率相比的卵巢癌高風(fēng)險(xiǎn)率(Easton等,1993)。測(cè)得BRCA1突變的4個(gè)親緣族中有3個(gè)歸入前一類,第四個(gè)(親緣族K2082)歸入卵巢癌高風(fēng)險(xiǎn)率一組。由于在親緣族K2082中發(fā)現(xiàn)的BRCA1無(wú)義突變比其它測(cè)得的突變更靠近氨基端,所以預(yù)計(jì)它可能具有不同的表型。實(shí)際上,親緣族K2082突變具有高的卵巢癌發(fā)病率,以及比其它親緣族遲的平均乳房癌診斷年齡(Goldgar等人,1994)。這一發(fā)病年齡上的差異可能是因?yàn)檩^小的、外顯率更高的家族中的確證偏離,或者,這可能反映BRCA1突變表現(xiàn)的組織特異性差異。分離已知BRCA1突變的其它3個(gè)親緣族中每十個(gè)乳房癌病例中有一例卵巢癌,但在25-30歲至30出頭診斷為乳房癌的比例較高。發(fā)生移碼突變的親緣族1910值得注意,因?yàn)?個(gè)發(fā)病者中有3個(gè)患有雙側(cè)乳房癌,而且其中的第二個(gè)腫瘤都是在第一個(gè)出現(xiàn)后一年內(nèi)診斷的。分離潛在的調(diào)節(jié)型BRCA1突變的親緣族2035估計(jì)也具有出人意料的表型。該親緣族中50歲之前的乳房癌發(fā)病率為80%。這一數(shù)據(jù)和該組中的任一親緣族一樣高,由此指示了一個(gè)具有高度外顯率的BRCA1突變型等位基因(表10)。雖然以上清晰描述的突變是有害的,使得婦女在很年輕時(shí)就發(fā)生乳房癌,但發(fā)生突變的4個(gè)親緣族都有至少一位婦女?dāng)y帶有突變但活到80歲而并不發(fā)生惡性病癥。在以后的研究中最重要的是,鑒定能夠改善BRCA1突變效果的其它遺傳或環(huán)境因素。在8個(gè)推斷的BRCA1連鎖的親緣族中有4個(gè)并未在其中發(fā)現(xiàn)潛在的傾向性突變。這4個(gè)中有3個(gè)與BRCA1連鎖的標(biāo)記的LOD值低于0.55。所以,這些親緣族可能實(shí)際上并不分離BRCA1傾向性等位基因?;蛘?,這4個(gè)親緣族中的突變發(fā)生在影響轉(zhuǎn)錄水平的BRCA1區(qū)域內(nèi),因而被漏檢。BRCA1在癌腫中的作用。迄今已鑒定的大多數(shù)腫瘤抑制基因產(chǎn)生功能喪失、失效或減退的蛋白質(zhì)產(chǎn)物。TP53突變主要是錯(cuò)義;其中有些已被證明產(chǎn)生干擾野生型產(chǎn)物功能的異常p53分子(Shaulian等人,1992;Srivastava等人,1993)。對(duì)于有些產(chǎn)生截短分子的家族性多發(fā)性結(jié)腸息肉癥(APC)等位基因(Su等人,1993)和改變蛋白質(zhì)的DNA結(jié)合位點(diǎn)的Wilms腫瘤基因(WT1)中點(diǎn)突變(Little等人,1993),提出了類似的顯性的負(fù)向作用機(jī)制。在BRCA1編碼序列中觀察到的突變特征與顯性的負(fù)向蛋白或非功能性蛋白的產(chǎn)生相一致。親緣族2035中的推斷的調(diào)節(jié)型突變不可能是顯性負(fù)向的;這種突變更可能導(dǎo)致患者等位基因的BRCA1表達(dá)的降低或完全喪失。BRCA1蛋白包含一個(gè)C3HC4鋅指域,這與在許多DNA結(jié)合蛋白中發(fā)現(xiàn)的并與核酸的鋅依賴性結(jié)合有關(guān)的鋅指域相似。BRCA1前180個(gè)氨基酸中的堿性殘基比酸性殘基多5個(gè)。相反,分子的其余部分酸性很強(qiáng),凈超出70個(gè)酸性殘基。超出的負(fù)電荷尤其集中于C末端。所以,一種可能性是BRCA1編碼一種轉(zhuǎn)錄因子,該因子具有N末端的DNA結(jié)合域和C末端的反式激活“酸點(diǎn)(acidicblob)”域。有趣的是,另一家族的腫瘤抑制基因WT1也具有類似的鋅指基序(Haber等人,1990)。WT1內(nèi)的許多癌腫傾向性突變改變了鋅指域(Little等人,1993;Haber等人,1990;Little等人,1992)。WT1編碼一種轉(zhuǎn)錄因子,對(duì)編碼鋅指域的外顯子的各種剪接改變了WT1的DNA結(jié)合特性(Bickmore等人,1992)。某些WT1mRNA的其他剪接形式產(chǎn)生作為轉(zhuǎn)錄抑制劑的分子(Drummond等人,1994)。某些BRCA1剪接變異體可能改變鋅指基序,這提高了類似于WT1中的調(diào)節(jié)機(jī)制適用于BRCA1的可能性。實(shí)施例9BRCA1突變腫瘤的分析為了將分析集中于最可能包含BRCA1突變的腫瘤,根據(jù)BRCA1區(qū)內(nèi)的LOH對(duì)原發(fā)性乳房癌和卵巢癌進(jìn)行分型。使用三個(gè)高度多態(tài)性、簡(jiǎn)單串聯(lián)重復(fù)標(biāo)記來(lái)評(píng)價(jià)LOHBRCA1基因內(nèi)的D17S1323和D17S855,以及距BRCA1遠(yuǎn)端約100kb的D17S1327。有信息的病例中乳房癌的合并LOH頻率(即,種系為雜合子的)為32/72(44%),卵巢癌的為12/21(57%),這與過(guò)去該區(qū)域的LOH測(cè)定值一致(Futreal等人,1992b;Jacobs等人,1993;Sato等人,1990;Eccles等人,1990;Cropp等人,1994)。這一分析確定了一組病例以檢查是否有BRCA1突變,該組病例由不同種族、不同發(fā)病年齡的32例乳房腫瘤和12例卵巢腫瘤病例構(gòu)成。單獨(dú)通過(guò)直接測(cè)序,或?qū)捂湗?gòu)象分析(SSCA)于直接測(cè)序聯(lián)用,而篩選出基因的完整的5,589bp編碼區(qū)和內(nèi)含子/外顯子邊界序列??偣舶l(fā)現(xiàn)6例突變,一例在卵巢腫瘤中,4例在乳房腫瘤中,1例在一男性不發(fā)病的單倍型攜帶者中(表12)。突變之一,Glu1541Ter,引入了一個(gè)終止子,這將產(chǎn)生羧基端缺失273個(gè)氨基酸的截短的蛋白質(zhì)。此外,鑒定了兩例錯(cuò)義突變。它們是Ala1708Glu和Met1775Arg,并且涉及小的、疏水性殘基被帶電殘基所取代。病人17764和19964來(lái)自同一家族。在病人OV24中,核苷酸2575缺失,病人17764和19964中,核苷酸2993-2996缺失。表12傾向性突變病人密碼子核苷酸變化氨基酸變化發(fā)病年齡家族史BT0981541GAT→TAGGlu→終止39-OV24819缺失1bp移碼44-BT1061708GCG→GAGAla→Glu24+MC441775ATG→AGGMet→Arg42+17764958缺失4bp移碼31+19964958缺失4bp移碼+**不發(fā)病的單倍型攜帶者,男性有幾條證據(jù)表明,所有5種突變代表了BRCA1易患性等位基因(I)全部突變都存在于種系中;(ii)全部突變都不存在于適當(dāng)?shù)膶?duì)照人群中,這表明它們不是一般的多態(tài)性;(iii)每一種突變型等位基因都保留在腫瘤中,正如同來(lái)自分離BRCA1易患性等位基因的親緣族的病人腫瘤中的情況(Smith等人,1992;Kelsell等人,1993)(如果突變代表的是中性多態(tài)性,它們應(yīng)該只保留于50%的病例中);(iv)4例發(fā)生突變的乳房癌病例的發(fā)病年齡在24至42歲之間,與BRCA1易患性個(gè)體的乳房癌早發(fā)年齡相一致;類似的,卵巢癌診斷于44歲,該年齡歸于所有卵巢癌病例中最年輕的13%之中;最后(v)回顧其醫(yī)療記錄,5例中有3例具有陽(yáng)性乳房癌或卵巢癌家族史,盡管腫瘤組并不是據(jù)此選擇的。BT106在24歲被診斷為乳房癌。其母親患有卵巢癌,其父親患有黑素瘤,其祖母也患有乳房癌。病人MC44,非洲-美洲混血兒,在42歲時(shí)診斷為雙側(cè)乳房癌。該病人有一姊妹在34歲死于乳房癌,另一姊妹死于淋巴癌,以及一兄弟死于肺癌。她的突變(Met1775Arg)先前曾在親緣族2099(一個(gè)分離BRCA1易患性等位基因的非洲-美洲混血家族)中測(cè)得過(guò),但不存在于非洲-美洲混血和高加索對(duì)照中。據(jù)我們所知,病人MC44與親緣族2099無(wú)關(guān)。一次在BRCA1親緣族中,一次在明顯不相關(guān)的早發(fā)型乳房癌病例種系中發(fā)現(xiàn)一種稀有的突變型等位基因表明,Met1775Arg改變可能是非洲-美洲混血家族中的常見(jiàn)傾向性突變。總而言之,這些觀察結(jié)果表明腫瘤中的全部4種突變代表了易患性等位基因;在接受分析的樣本中沒(méi)有檢測(cè)到體細(xì)胞突變。根據(jù)17q上的LOH頻率以及通常的易患性基因作為腫瘤抑制基因在癌腫發(fā)展過(guò)程中的作用,沒(méi)有體細(xì)胞BRCA1突變是意料之外的。對(duì)此有3種可能的解釋(i)我們的篩選過(guò)程遺漏了一些編碼序列中的BRCA1突變;(ii)BRCA1體細(xì)胞突變?cè)诰幋a外顯子之外;(iii)17q中的LOH并不反映體細(xì)胞突變。如果在乳房癌和卵巢癌中,體細(xì)胞BRCA1突變確實(shí)少見(jiàn),那么這將是BRCA1生物學(xué)的強(qiáng)烈暗示。體細(xì)胞BRCA1突變的表觀缺失暗示,與普通群體中的腫瘤相比,遺傳傾向性BRCA1攜帶者中腫瘤的發(fā)生可能存在著根本的差異。例如,BRCA1中的突變可能只對(duì)乳房癌和卵巢癌發(fā)育早期某一特定階段的腫瘤形成有作用。這種可能性與更年期前乳房癌中的BRCA1的主要功能相一致。這種BRCA1在乳房癌和卵巢癌中的作用模型預(yù)計(jì)了生殖激素與BRCA1功能之間的一種相互作用。但是,除了發(fā)病年齡之外,還未曾有過(guò)在家族性和偶發(fā)性的乳房癌和卵巢癌之間存在臨床或病理學(xué)差異的描述(Lynch等人,1990)。另一方面,最近的發(fā)現(xiàn),即具有乳房癌家族史的病人其乳腺腫瘤中的TP53突變和微衛(wèi)星(microsatellite)不穩(wěn)定性的增加(Glebov等人,1994),可能反映遺傳傾向性個(gè)體中腫瘤發(fā)生的某些差異。現(xiàn)在可以直接論及BRCA1在這種現(xiàn)象中的關(guān)系?;蛘?,體細(xì)胞BRCA1突變的缺乏可能是因?yàn)榇嬖谥鄠€(gè)基因,它們以與BRCA1相同的腫瘤抑制路徑起作用,但共同代表著偶發(fā)腫瘤中更為優(yōu)先的突變目標(biāo)。因?yàn)檫z傳路徑中單個(gè)元件的突變通常就足以使路徑中斷,所以BRCA1的突變率可能遠(yuǎn)低于其它元件突變頻率的總和。在日本進(jìn)行了獨(dú)立的研究,以分析腫瘤的BRCA1突變。對(duì)一組103個(gè)病人進(jìn)行BRCA1突變的篩選,該組病人代表了早發(fā)型病例(<35歲)(46個(gè)病人)、多發(fā)性家族成員(12個(gè)病人)和/或患雙側(cè)乳房癌的病人(59個(gè)病人)。通過(guò)單鏈構(gòu)象多態(tài)性(SSCP)分析,篩選這些病人的原發(fā)性乳房腫瘤是否在BRCA1編碼外顯子中有突變。對(duì)于3425bp長(zhǎng)的外顯子11,設(shè)計(jì)PCR引物以便分別擴(kuò)增出該外顯子的11個(gè)重疊片段。其他22個(gè)外顯子中每個(gè)外顯子都各自在單個(gè)PCR中擴(kuò)增。這樣,對(duì)每個(gè)病例都進(jìn)行33個(gè)PCR-SSCP分析。在4個(gè)病人中檢測(cè)到突變,這4個(gè)病人都患雙側(cè)乳房癌(表12A)。一個(gè)突變因?yàn)樵诿艽a子797處缺失2bp(缺失AA)而造成移碼突變。這造成一個(gè)截短的蛋白質(zhì),它缺失COOH端的1065個(gè)氨基酸。第二個(gè)突變?cè)诿艽a子1214處,因密碼子第一個(gè)核苷酸的G→T轉(zhuǎn)變而造成無(wú)義突變。這導(dǎo)致在該位點(diǎn)處的谷氨酸被成熟前終止的密碼子所置換,從而造成在COOH端缺失649個(gè)氨基酸的蛋白質(zhì)。含有兩個(gè)錯(cuò)義突變。一個(gè)是在密碼子271處的第一個(gè)核苷酸由G→A,從而導(dǎo)致Val→Met置換。另一個(gè)是在密碼子1150處(密碼子的第一個(gè)核苷酸由C→T),它導(dǎo)致Pro→Ser置換,這種置換是用極性的、不帶電荷的氨基酸替換疏水的、非極性的氨基酸。發(fā)現(xiàn)這些突變都是種系突變。在這4個(gè)病人中,平均發(fā)病年齡是49歲。這些研究還發(fā)現(xiàn)一個(gè)共同的中性多態(tài)性在密碼子771處的第一個(gè)核苷酸是C或T。表12A傾向性突變病人密碼子核苷酸變化氨基酸變化發(fā)病年齡231150CCT→TCTPro→Ser49&amp;64441214GAG→TAGGlu→終止51&amp;5198271GTG→ATGVal→Met45&amp;451007972bp缺失移碼50&amp;715482-4834bp缺失移碼456856TAT→CATTyr→His547271GTG→ATGVal→Met49&amp;4988521bp缺失移碼62盡管病人98和7的突變相同,但是他們相互之間沒(méi)有關(guān)系。實(shí)施例10BRCA1基因的分析按照以下方法測(cè)定BRCA1基因的結(jié)構(gòu)與功能。生物學(xué)研究。構(gòu)建包含了BRCA1cDNA的哺乳動(dòng)物表達(dá)載體,將其轉(zhuǎn)染入該基因損傷的合適的乳房癌細(xì)胞。使用的是野生型的BRCA1cDNA和變異過(guò)的BRCA1cDNA。變異過(guò)的BRCA1cDNA可取自變異的BRCA1等位基因,或者如下產(chǎn)生。檢查培養(yǎng)物中的表型回復(fù)(如細(xì)胞形態(tài)、倍增時(shí)間、不依賴貼壁生長(zhǎng)情況)和動(dòng)物中的表型回復(fù)(如生瘤性)。研究將同時(shí)使用基因的野生型和突變型形式(B部分)。分子遺傳學(xué)研究。進(jìn)行體外誘變以構(gòu)建缺失突變體和錯(cuò)義突變體(通過(guò)個(gè)別密碼子中的單堿基對(duì)取代和帶電簇→丙氨酸掃描誘變)。突變體被用于生物學(xué)、生物化學(xué)和生理學(xué)研究中。機(jī)制研究。檢查BRCA1蛋白與已知和未知DNA序列的結(jié)合能力。利用哺乳動(dòng)物細(xì)胞中的瞬時(shí)報(bào)道基因表達(dá)系統(tǒng)分析其反式激活啟動(dòng)子的能力。常規(guī)方法例如顆粒捕獲和酵母雙雜交體系統(tǒng)(yeasttwo-hybridsystem)被用于發(fā)現(xiàn)和鑒定各種功能性配偶體。對(duì)配偶體的特性和功能進(jìn)行描述。這些配偶體因此而成為藥物開(kāi)發(fā)的目標(biāo)。結(jié)構(gòu)研究。在大腸桿菌(E.coli)、酵母、昆蟲(chóng)和/或哺乳動(dòng)物細(xì)胞中生產(chǎn)重組蛋白,將其用于結(jié)晶學(xué)和NMR研究中。還使用了蛋白質(zhì)的分子模型。這些研究有助于基于結(jié)構(gòu)的藥物研究。實(shí)施例11檢測(cè)樣本中有否BRCA1的兩步試驗(yàn)根據(jù)Antonarakis等人(1985)所述的方法對(duì)病人的樣品進(jìn)行處理,經(jīng)1%瓊脂糖凝膠電泳分離,轉(zhuǎn)移到尼龍膜上進(jìn)行Southern印跡分析。利用GS基因連接儀(Bio-Rad)在150mJ對(duì)膜進(jìn)行UV交聯(lián)。將對(duì)應(yīng)于SEQIDNO1中核苷酸位置3631-3930的BRCA1探針亞克隆在pTZ18U中。將此噬菌粒轉(zhuǎn)化入經(jīng)輔助噬菌體M13KO7(Bio-Rad,Richmond,CA)感染的大腸桿菌(E.coli.)MV1190。根據(jù)標(biāo)準(zhǔn)方法分離出單鏈DNA(參見(jiàn)Sambrook等人,1989)。印跡在0.5MNaPO4中的7%十二烷基硫酸鈉(SDS)中,在65℃預(yù)雜交15至30分鐘。此方法按照Nguyen等人,1992所述進(jìn)行。印跡與25-50ng/ml單鏈探針DNA在65℃,在7%SDS、0.5MNaPO4中雜交過(guò)夜。雜交后洗滌包括兩次用5%SDS、40mMNaPO4在65℃洗滌30分鐘,然后兩次用1%SDS,40mMNaPO4在65℃洗滌30分鐘。接著,印跡用磷酸鹽緩沖液(pH6.8)在室溫下洗滌5分鐘,用0.2%酪蛋白的PBS溶液室溫下孵育30-60分鐘,然后用PBS洗滌5分鐘。然后,印跡與雜交緩沖液(包含6M尿素,0.3MNaCl和5×Denhardt’s溶液(參見(jiàn)Sambrook等人,1989)在振蕩水浴中預(yù)孵育5至10分鐘。去除緩沖液,代之以50-75μl/cm2新鮮的雜交緩沖液和2.5nM共價(jià)交聯(lián)的寡核苷酸-堿性磷酸酶偶聯(lián)體,其中的核苷酸序列與通用引物位點(diǎn)互補(bǔ)(UP-AP,Biod-Rad)。印跡在45℃雜交20-30分鐘,雜交后洗滌為在45℃孵育,即兩次在6M尿素、1×標(biāo)準(zhǔn)檸檬酸鹽溶液(SSC)、0.1%SDS中洗滌10分鐘,一次在1×SSC、0.1%TritonX-100中洗滌10分鐘。室溫下以1×SSC洗滌印跡10分鐘。印跡在含有0.1M二乙醇胺、1mMMgCl2,0.02%疊氮鈉、pH10.0的底物緩沖液中,在室溫下振蕩孵育10分鐘。各個(gè)印跡與底物緩沖液和0.2mMAMPPD(3-(2’-螺金剛烷)-4-甲氧基-(3’-磷酰氧)苯基-1,2-二噁烷二鈉鹽,Biod-Rad)一起置于墊封口袋中。室溫下振蕩孵育20分鐘后,去除過(guò)量的AMPPD溶液。印跡與X光片曝光過(guò)夜。陽(yáng)性條帶表示有BRCA1存在。實(shí)施例12抗BRCA1的多克隆抗體的產(chǎn)生以融合蛋白形式在大腸桿菌中表達(dá)BRCA1編碼序列的片段。凝膠洗脫純化高表達(dá)蛋白,按照類似于Harlow和Lare,1988所述的方法,將其用于免疫兔和小鼠。該方法已被證明能夠產(chǎn)生抗多種其它蛋白質(zhì)的抗體(例如,參見(jiàn)Kraemer等人,1993)。簡(jiǎn)而言之,將一段BRCA1編碼序列作為融合蛋白克隆到質(zhì)粒PET5A(Novagen,Inc.,Madison,WI)中。含有BRCA1的序列包含對(duì)應(yīng)于SEQIDNO2中#1361-1554的氨基酸。用IPTG誘導(dǎo)后,由SDS/PAGE證實(shí)具有期望分子量的融合蛋白的高表達(dá)。利用電洗脫從凝膠上純化融合蛋白。通過(guò)N末端蛋白質(zhì)測(cè)序證明了該蛋白是BRCA1融合產(chǎn)物。接著,將純化蛋白用作兔的免疫原。用100μg溶于完全Freund’s佐劑中的蛋白質(zhì)來(lái)免疫兔,并以3周為間隔加強(qiáng)免疫2次,第一次用溶于完全Freund’s佐劑中的100μg免疫原,后一次用溶于PBS中的100μg免疫原。兩周后收集含有抗體的血清。重復(fù)該方法以產(chǎn)生抗BRCA1基因突變型的抗體。這些抗體與野生型BRCA1的抗體一起可用于檢測(cè)各種組織和生物體液中突變型的存在和相對(duì)水平。實(shí)施例13BRCA1特異性單克隆抗體的產(chǎn)生根據(jù)以下方法生產(chǎn)單克隆抗體。以眾所周知的方法利用戊二醛或EDC將完整BRCA1或BRCA1肽(野生型或突變型)與匙孔血藍(lán)蛋白偶聯(lián),以此作為免疫原免疫小鼠。免疫原是與某種佐劑混合的。每個(gè)小鼠注射4次10至100μg免疫原,在第4次注射后采集小鼠的血樣,測(cè)定血清中有否免疫原的抗體。利用ELISA或RIA測(cè)定血清的效價(jià)。挑選血清中含有針對(duì)免疫原的抗體的小鼠用于產(chǎn)生雜交瘤。從免疫鼠中取出脾臟,制備單細(xì)胞懸液(參見(jiàn)Harlow和Lane,1988)。基本上按照Kohler和Milstein(1975年)所述的方法進(jìn)行細(xì)胞融合。簡(jiǎn)而言之,根據(jù)Harlow和Lane,1988所述,用聚乙二醇將P3.65.3骨髓瘤細(xì)胞(美國(guó)典型培養(yǎng)物保藏中心,Rockville,MD)和免疫脾細(xì)胞融合在一起。按2×105細(xì)胞/孔的密度將細(xì)胞置于96孔的組織培養(yǎng)板上。檢查各孔是否有細(xì)胞的生長(zhǎng),并且對(duì)生長(zhǎng)的孔中的上清液通過(guò)ELISA或RIA,用野生型或突變型BRCA1靶蛋白進(jìn)行測(cè)試以確定BRCA1特異性抗體的存在。對(duì)陽(yáng)性孔中的細(xì)胞繼續(xù)進(jìn)行培養(yǎng)并且亞克隆以獲得并證實(shí)單克隆性。具有所需特異性的克隆在小鼠中作為腹水或者在空心纖維系統(tǒng)中繼續(xù)繁殖和生長(zhǎng),從而產(chǎn)生出足夠的抗體供定性和分析之用。實(shí)施例14BRCA1的夾心分析將單克隆抗體連于固相表面,例如板、試管、珠或顆粒。較佳地,抗體被附著于96孔ELISA板的孔表面。將含有BRCA1肽/蛋白質(zhì)(野生型或突變型)的100微升樣品(例如血清、尿液、組織胞液)加至固相抗體。樣品在室溫下孵育2小時(shí)。接著倒去樣品液體,用緩沖液洗滌固相以去除非結(jié)合的物質(zhì)。將100μl第二種單克隆抗體(針對(duì)BRCA1肽/蛋白質(zhì)的不同的抗原決定簇)加至固相。該抗體是用檢測(cè)分子(例如125I、酶、熒光基團(tuán)、生色基團(tuán))標(biāo)記的。固相和第二種抗體在室溫下孵育2小時(shí)。倒去第二種抗體,用緩沖液洗滌固相以去除非結(jié)合的物質(zhì)。定量地測(cè)定結(jié)合標(biāo)記物的數(shù)量,它與樣品中BRCA1肽/蛋白質(zhì)的數(shù)量成正比。再使用對(duì)野生型BRCA1特異的單克隆抗體以及對(duì)各種BRCA1突變特異的單克隆抗體進(jìn)行分析。實(shí)施例15分析BRCA1突變用于篩選BRCA1突變的DNA樣品,是從參與乳房癌遺傳研究的、患乳房癌或卵巢癌的病人(或通過(guò)單倍型分析確定的已知攜帶者)的血液或腫瘤樣品中抽提出的。所有的對(duì)象都簽了合適的、提供信息的同意書(shū)。表13詳細(xì)列出了各套篩選樣品的樣品數(shù)目、確定標(biāo)準(zhǔn)和篩選方法。表13用于篩選BRCA1突變的各套DNA樣品樣本來(lái)源樣本描述1篩選方法2篩選的樣本目前已發(fā)現(xiàn)數(shù)目突變的數(shù)目UTAH-2乳房癌/卵巢癌家族SEQ102MONTREAL乳房癌/卵巢癌家族SEQ3013MSKCC-1乳房癌和乳房癌/卵巢癌家族SEQ142MSK/UT-1早發(fā)型乳房癌病例SEQ241STRANG乳房癌和乳房癌/卵巢癌家族SEQ124STOCKHOLM乳房癌和乳房癌/卵巢癌家族SEQ154USC-1兩側(cè)乳房癌先證者,高危SEQ73TUMOR-3早發(fā)型乳房腫瘤SEQ141USC-2側(cè)乳房癌<50歲+1°相關(guān)乳ASO595房癌MSK/UT-2早發(fā)型乳房癌病例ASO1093YN兩側(cè);早發(fā)型SSCA1034Texas乳房癌/卵巢癌家族SEQ152Utah乳房癌/卵巢癌家族SEQ101Pisa乳房癌/卵巢癌家族SEQ214TumorlmodSEQ1MSKCC-2早發(fā)型乳房癌病例SEQ2131大多數(shù)樣本組含有樣品的異源混合物。給出了各套的最具代表性的描述。2SEQPCR產(chǎn)物的直接測(cè)序;SSCA單鏈構(gòu)象分析;ASO等位基因特異性寡聚物盡管通過(guò)篩選cDNA而檢測(cè)Miki等人(1994)描述的原始突變,但是對(duì)于大多數(shù)其余樣品使用25對(duì)內(nèi)含子PCR引物擴(kuò)增來(lái)自基因組DNA的完整的編碼序列和剪接部位。最新的引物信息可通過(guò)匿名的fpt從morgan.med.utah.edu的目錄pub/BRCA1下公開(kāi)獲得。可能的話,測(cè)試DNA序列變異在家族中與乳房癌或卵巢癌的共分離情況。通過(guò)證明在一組對(duì)照個(gè)體中缺乏假定的突變,進(jìn)一步提供了序列變異體在癌癥中起因果作用的證據(jù)。用ASO雜交技術(shù)在大量的選定樣品中篩選上述特異性突變。表14描述了許多突變,它們的發(fā)現(xiàn)是通過(guò)篩選整個(gè)BRCA1編碼序列和內(nèi)含子/外顯子邊界以及通過(guò)發(fā)現(xiàn)還原成cDNA中單態(tài)性位點(diǎn)的基因組DNA多態(tài)性位點(diǎn)。發(fā)現(xiàn)了2個(gè)共同的突變,然后用ASO分析檢查它們?cè)谄渌麡悠分械念l率(表15)。表16和17描述了分別按類型和按BRCA1編碼序列中的位置而確定的突變的分布。目前,大多數(shù)鑒定的突變是移碼突變。目前為止在全球范圍,在BRCA1編碼序列中發(fā)現(xiàn)的各種突變中,還沒(méi)有發(fā)現(xiàn)統(tǒng)計(jì)上明顯偏離BRCA1編碼序列范圍內(nèi)的隨機(jī)分布(x2=2.00,2df,p=0.37)。表14通過(guò)完全篩選BRCA1基因而鑒定的突變<p>表14(續(xù))通過(guò)完全篩選BRCA1基因而鑒定的突變</tables>1FS移碼;NS無(wú)義;MS錯(cuò)義;SP剪接位點(diǎn)。2對(duì)于錯(cuò)義和無(wú)義突變,突變描述包括野生型氨基酸、受累者的氨基酸、改變的氨基酸(或終止)。對(duì)于移碼突變,格式為核苷酸、插入或缺失、具體改變的核苷酸(若<3)或者插入或缺失的數(shù)目(若>2),以及因移碼而導(dǎo)致終止信號(hào)的氨基酸(解釋插入或缺失)。核苷酸參照GENBANK索引號(hào)No.U-14680的BRCA1cDNA序列。3該家族中的突變?cè)贛yriad和UniversityofPennsylvaniaLabs兩地都獨(dú)立地被鑒定。4該腫瘤中鑒別出的突變也在該個(gè)體的種系中發(fā)現(xiàn)。表15兩種共同BRCA1突變的頻率發(fā)現(xiàn)的突變數(shù)目組別研究的數(shù)目185缺失AG5382插入CUSC-15941MSK/UT-210930GLASGOW-2100未測(cè)試3GLASGOW-3100未測(cè)試2CRC-OV250未測(cè)試1表16觀察到的不同類型突變的頻率數(shù)目(百分比)突變類型不同的突變1所有突變2移碼42(65)81(72)無(wú)義10(16)13(12)錯(cuò)義9(14)14(12)其他3(5)5(4)1在該列中,相同的突變被計(jì)為一種。2在該列中鑒別出突變的每個(gè)樣本被計(jì)數(shù)。表17鑒別出的突變?cè)贐RCA1編碼序列中的分布氨基酸突變1-621622-12421243-1863不同的182321所有的442839已在基因的許多不同區(qū)域發(fā)現(xiàn)了突變,表型上嚴(yán)重的突變?cè)诨驑O靠5′端和極靠3′端的地方都有發(fā)現(xiàn)。在一個(gè)有7個(gè)早發(fā)型乳房癌病例的家族中發(fā)現(xiàn)了一個(gè)這樣的突變,它產(chǎn)生的蛋白質(zhì)僅缺失末端的10個(gè)氨基酸,這表明BRCA1的這個(gè)區(qū)域在正常的基因功能中起作用。值得注意的是,在BRCA1中占絕大多數(shù)的改變是造成不穩(wěn)定的或截短的蛋白質(zhì)產(chǎn)物的移碼或無(wú)義突變。目前為止,在BRCA1中有兩個(gè)突變似乎較普遍。通過(guò)直接測(cè)序,在密碼子1756處的5382插入C(5382insC)形式的BRCA1突變和在密碼子23處的185缺失AG(185delAG)形式的突變,分別在鑒別突變的最初研究中所研究的68個(gè)先證者中的7個(gè)(10%)和8個(gè)(12%)被鑒別出。除了這些共同的突變,通過(guò)對(duì)cDNA的完全篩選還在一個(gè)以上的家族中發(fā)現(xiàn)其他突變形式。目前用于篩選BRCA1突變的許多先證者,是根據(jù)含有這些突變的高前概率而被選出的。因此,在該組中發(fā)現(xiàn)的突變可能并不代表那些在其他組病人中可能鑒別出的突變。然而,兩個(gè)最常見(jiàn)的BRCA1突變(5382insC和185delAG)已經(jīng)在多組先證者(這些先證者或者是沒(méi)有根據(jù)家族史而選擇,或者用最少家族史而加以確定)的定向篩選中被多次發(fā)現(xiàn)。除了上面所示的突變,在篩選樣本中還檢測(cè)到許多多態(tài)性。這些多態(tài)性列于表18和19。表18在BRCA1基因組DNA的外顯子中的多態(tài)性名稱外顯子#密碼子堿基位置1堿基變化效應(yīng)PM01113561186AGglnargPM021314364427TCserserPM031616134956AGserglyPM06118712731CTproleuPM071111833667AGlvsargPM09116942201CTserserPM10117712430TCleuleuPM121615614801CTthrilePM141110383233AGglugluPM179197710CTcyscysPM18116932196GAaspasnPM19118412640CTargtrpPM201110403238GAserasnPM214612483CTalavalPM22113271100AGthrthrPM231113164067CApheleuPM241110083143GAmetilePM251113164067CGpheleuPM261113224083AGlysgluPM271113474158AGargglyPM28117072240TCglyglyPM29116752144ACalaala1在SEQIDNO1中所示的堿基位置2包含在編碼區(qū)域中的外顯子4的密碼子號(hào)碼3在SEQIDNO11中所示的堿基位置(僅外顯子4單獨(dú))表19在BRCA1基因組DNA內(nèi)含子中的多態(tài)性名稱內(nèi)含子#堿基位置1堿基變化效應(yīng)PM041115284CA未知PM051820334AG未知PM111619231GA未知PM1589106缺失T未知PM162222914TC未知PMA02.111295GA未知PMA03.122141GC未知PMA06.153653AG未知PMA07.17在4391-4392間插入TTC未知PMA08.176538CT未知PMA08.286823AT未知PMA09.299376TC未知PMA13.11316243GA未知PMA15.114在17335-17336間插入CCAAC未知PMA15.21417399AT未知PMA15.31417473CG未知PMA18.11720138CT未知PMA22.12122680AG未知1在圖10A-H中所示的堿基位置工業(yè)實(shí)用性如上所述,本發(fā)明提供了用于檢測(cè)個(gè)體BRCA1等位基因的材料與方法,以及對(duì)等位基因正?;騼A向性特性的解釋。發(fā)病風(fēng)險(xiǎn)高于正常的個(gè)體可適當(dāng)?shù)馗淖兤渖罘绞健T贐RCA1病例中,最主要的非遺傳性風(fēng)險(xiǎn)因子具有早期、全程妊娠的保護(hù)作用。所以,具有發(fā)病危險(xiǎn)的婦女可以考慮提早生育或采取激發(fā)早期全程妊娠激素作用的治療方法。具有高發(fā)病風(fēng)險(xiǎn)的婦女還應(yīng)該力求早期檢查,并更積極地學(xué)習(xí)和實(shí)踐乳房自查。這些婦女還應(yīng)更多地進(jìn)行定期乳房X線照片,開(kāi)始的年齡可能早于普通人群。還應(yīng)該進(jìn)行較高頻率的卵巢癌檢查。以BRCA1基因座的序列分析為基礎(chǔ)的診斷方法也可用于腫瘤的檢測(cè)和分類。序列分析可用于診斷前體損傷。隨著方法的改進(jìn)以及有關(guān)BRCA1和其它致病基因座的信息的累積,區(qū)分良性還是惡性的癌腫將成為可能。如果是傾向性的,因而與不是傾向性的婦女相比更可能發(fā)生其它癌腫的婦女應(yīng)接受各種不同的手術(shù)治療。使用肽或小分子(合理的藥物設(shè)計(jì))可以發(fā)展出其它治療方法。肽可能是缺失基因產(chǎn)物本身或缺失基因產(chǎn)物的一部分?;蛘?,治療劑可以是另一種分子,它模擬缺失基因的功能,是能夠抵抗遺傳基因座有害作用的肽或非肽類分子。治療方法還可以是以基因?yàn)榛A(chǔ)的,即給個(gè)體引入正常的BRCA1等位基因,以產(chǎn)生能夠抵抗有害等位基因作用的蛋白質(zhì)。這些基因治療可以是多種形式的,可以是直接阻止腫瘤的形成,從而在癌腫剛發(fā)生時(shí)將其治愈,或者是阻止癌腫的轉(zhuǎn)移。很明顯,本發(fā)明的方法和內(nèi)容可以用于各種不同的實(shí)施例中,其中只有一小部分公開(kāi)于此。本領(lǐng)域中的熟練技術(shù)人員知曉,還存在其他的實(shí)施方式,這些都是屬于本發(fā)明范圍之內(nèi)。因此,上述的實(shí)施例只用于闡述目的,并不用于限制目的。參考文獻(xiàn)清單Altschul,S.F.等人(1990).“分子生物學(xué)雜志”(J.Mol.Biol.〕215195-197.美國(guó)癌癥協(xié)會(huì)(AmericanCancerSociety),癌癥事實(shí)&amp;數(shù)據(jù)-1992(CancerFacts&amp;Figures-1992)。(美國(guó)癌癥協(xié)會(huì)(AmericanCancerSociety),亞特蘭大,GA)。Anand,R.(1992).分析復(fù)雜基因組的技術(shù)(TechniquesfortheAnalysisofComplexGenomes),(AcademicPress).Anderson,等人(1980).″美國(guó)科學(xué)院院報(bào)″(Proc.Natl.Acad.Sci.USA)775399-5403.Anderson,D.E.(1972).″國(guó)立癌癥研究所雜志″(J.Natl.CancerInst.)481029-1034.Anderson,J.A.,等人(1992).″耳鼻喉科學(xué)雜志″(J.Otolaryngology)21321.Antonarakis,S.E.,等人(1985).“新英國(guó)醫(yī)學(xué)雜志”(NewEng.J.Med.)313842-848.Ausubel,F(xiàn).M.,等人(1992),分子生物學(xué)中目前方案(CurrentProtocolsinMolecularBiology),(J.WileyandSons,N.Y.)Beaucage&amp;Carruthers(1981).″四字符″(Tetra.Letts.)221859-1862.Berkner(1992).“微生物學(xué)免疫學(xué)的當(dāng)前課題”(Curr.Top.Microbiol.Immunol.)15839-61.Berkner,等人(1988).“生物技術(shù)”(BioTechniques)6616-629.Bickmore,W.A.,等人(1992).“科學(xué)”(Science)257235-7.Bishop,D.T.,等人(1988).″遺傳流行病″(Genet.,Epidemiol.)5151-169.Bishop,D.T.和Gardner,E.J.(1980).InBanbury報(bào)道之4在限定人群中的癌癥發(fā)生(BanburyReport4CancerIncidenceinDefinedPopulations)(J.Cairns,J.L.Lyon,M.Skolnick,eds.),ColdSpringHarborLaboratory,ColdSpringHarbor,N.Y.,309-408.Botstein,等人(1980).“美國(guó)人類遺傳學(xué)雜志”(Am.J.Hum.Genet.)32314-331.Bowcock,A.M.,等人(1993).“美國(guó)人類遺傳學(xué)雜志”(Am.J.Hum.Genet.)52718.Brandyopadhyay和Temin(1984).″分子細(xì)胞生物學(xué)″(Mol.Cell.Biol.)4749-754.Breakfield和Geller(1987).″分子神經(jīng)生物學(xué)″(Mol.Neurobiol.)1337-371.Brinster,等人(1981).″細(xì)胞″(Cell)27223-231.Buchschacher和Panganiban(1992).″病毒學(xué)雜志″(J.Virol.)662731-2739.Buckler,等人(1991).″美國(guó)科學(xué)院院報(bào)″(Proc.Natl.Acad.Sci.USA)884005-4009.Cannon-Albright,L.,等人(1994).″癌癥研究″(CancerResearch)542378-2385.Capecchi,M.R.(1989).“科學(xué)”(Science)2441288.Cariello(1988).″人類遺傳學(xué)″(HumanGenetics)42726.Claus,E.,等人(1991).“美國(guó)人類遺傳學(xué)雜志”(Am.J.Hum.Genet.)48232-242.Conner,B.J.,等人(1983).″美國(guó)科學(xué)院院報(bào)″(Proc.Natl.Acad.Sci.USA)80278-282.Constantini和Lacy(1981).″自然″(Nature)29492-94.Cotten,等人(1990).″美國(guó)科學(xué)院院報(bào)″(Proc.Natl.Acad.Sci.USA)874033-4037.Cotton,等人(1988).″美國(guó)科學(xué)院院報(bào)″(Proc.Natl.Acad.Sci.USA)854397.Cropp,C.S.,等人(1994).″癌癥研究″(CancerRes.)542548-2551.Culver,等人(1992).“科學(xué)”(Science)2561550-1552.Curiel,等人(1991a).″美國(guó)科學(xué)院院報(bào)″(Proc.Natl.Acad.Sci.USA)888850-8854.Curiel,等人(1991b).″人基因治療″(Hum.GeneTher.)3147-154.Deutscher,M.(1990).″酶學(xué)方法″(Meth.Enzymology)182(AcademicPress,SanDiego,Cal.).Donehower,L.A.,等人(1992).″自然″(Nature)356215.Drummond,I.A.,等人(1994).″分子細(xì)胞生物學(xué)″(Mol.CellBiol.)143800-9.Easton,D.,等人(1993).“美國(guó)人類遺傳學(xué)雜志”(Am.J.Hum.Genet.)52678-701.Eccles,D.M.,等人(1990).″癌基因″(Oncogene)51599-1601.增強(qiáng)子和真核基因表達(dá)(EnhancersandEurkaryoticGeneExpression),ColdSpringHarborPress,ColdSpringHarbor,NewYork(1983).Erickson,J.等人,(1990).“科學(xué)”(Science)249527-533.Fain,P.R.(1992).″細(xì)胞發(fā)生細(xì)胞遺傳學(xué)″(Cytogen.CellGenet.)60178.Felgner,等人(1987).″美國(guó)科學(xué)院院報(bào)″(Proc.Natl.Acad.Sci.USA)847413-7417.Fiers,等人(1978).″自然″(Nature)273113.Fink,等人(1992).″人基因治療″(Hum.GeneTher.)311-19.Finkelstein,J.,等人(1990).″基因組″(Genomics)7167-172.Freese,等人(1990).″生物化學(xué)藥物學(xué)″(Biochem.Pharmacol.)402189-2199.Friedman,T.(1991).遺傳疾病治療(InTherapyforGeneticDiseases),T.Friedman,ed.,OxfordUniversityPress,pp.105-121.Futreal(1993).博士論文,UniversityofNorthCarolina,ChapelHill.Futreal,A.,等人(1992a).″人類分子遺傳學(xué)″(Hum.Molec.Genet.)1∶66.Futreal,P.A.,等人(1992b).″癌癥研究″(CancerRes.)522624-2627.Glebov,O.K.,等人(1994).″癌癥研究″(CancerRes.)543703-3709.Glover,D.(1985).″DNA克隆″(DNACloning),IandII(OxfordPress).Go,R.C.P.,等人(1983).″國(guó)立癌癥研究所雜志″(J.Natl.CancerInst.)71455-461.Goding(1986).單克隆抗體原理和實(shí)踐(MonoclonalAntibodiesPrinciplesandPractice),2版.(AcademicPress,N.Y.).Godowski,等人(1988).“科學(xué)”(Science)241812-816.Goldgar,D.E.,等人(1994).″國(guó)立癌癥研究院雜志″(J.Natl.Can.Inst.)863200-209.Gordon,等人(1980).″美國(guó)科學(xué)院院報(bào)″(Proc.Natl.Acad.Sci.USA)777380-7384.Gorziglia和Kapikian(1992).″病毒學(xué)雜志″(J.Virol.)664407-4412.Graham和vanderEb(1973).″病毒學(xué)″(Virology)52456-467.Grompe,M.,(1993).″自然遺傳學(xué)″(NatureGenetics)5111-117.Grompe,M.,等人,(1989).″美國(guó)科學(xué)院院報(bào)″(Proc.Natl.Acad.Sci.USA)865855-5892.Guthrie,G.&amp;Fink,G.R.(1991).酵母遺傳學(xué)和分子生物學(xué)導(dǎo)向(GuidetoYeastGeneticsandMolecularBiology)(AcademicPress).Haber,D.A.,等人(1990).″細(xì)胞″(Cell)611257-69.Hall,J.M.,等人(1990).“科學(xué)”(Science)2501684-1689.Hall,J.M.,等人(1992).“美國(guó)人類遺傳學(xué)雜志”(Am.J.Hum.Genet.)501235-1241.Harlow&amp;Lane(1988).抗體實(shí)驗(yàn)室手冊(cè)(AntibodiesALaboratoryManual)(ColdSpringHarborLaboratory,ColdSpringHarbor,N.Y.Hasty,P.,K.,等人(1991).″自然″(Nature)350243.Helseth,等人(1990).″病毒學(xué)雜志″(J.Virol.)642416-2420.Hodgson,J.(1991).″生物技術(shù)″(Bio/Technology)919-21.Huse,等人(1989).“科學(xué)”(Science)2461275-1281.Innis等人(1990).PCR方案方法和應(yīng)用引導(dǎo)(PCRProtocolsAGuidetoMethodsandApplications)(AcademicPress,SanDiego,Cal.).Jablonski,E.,等人(1986).″核酸研究″(Nuc.AcidsRes.)146115-6128.Jacobs,I.J.,等人(1993).″癌癥研究″(CancerRes.)531218-1221.Jakoby,W.B.和Pastan,I.H.(eds.)(1979).細(xì)胞培養(yǎng).酶學(xué)方法(CellCulture.MethodsinEnzymology),欄58(volume58)(AcademicPress,Inc.,HarcourtBraceJovanovich(NewYork)).Jeffreys,等人(1985).″自然″(Nature)31467-73.Johnson,等人(1992).″病毒學(xué)雜志″(J.Virol.)662952-2965.Kamb,A.等人(1994).“科學(xué)”(Science)264436-440.Kandpal,等人(1990).″核酸研究″(Nucl.AcidsRes.)181789-1795.Kaneda,等人(1989).″生物化學(xué)雜志″(J.Biol.Chem.)26412126-12129.Kanehisa(1984).″核酸研究″(Nucl.AcidsRes.)12203-213.Kelsell,D.P.,等人(1993).″人類分子遺傳學(xué)″(HumanMol.Genet.)21823-1828.Kinszler,K.W.,等人(1991).“科學(xué)”(Science)2511366-1370.Knudson,A.G.(1993).″自然遺傳學(xué)″(NatureGenet.)5103.Kohler,G.和Milstein,C.(1975).″自然″(Nature)256495-497.Kozak,M.(1987).″核酸研究″(NucleicAcidsRes.)158125-8148.Kraemer,F(xiàn).B.等人(1993).″脂類研究雜志″(J.LipidRes.)34663-672.Kubo,T.,等人(1988).FEBSLetts.241119.Landegren,等人(1988).“科學(xué)”(Science)242229.Lim,等人(1992).″循環(huán)系統(tǒng)″(Circulation)832007-2011.Lindsay,S.,等人(1987).″自然″(Nature)327336-368.Litt,等人(1989).“美國(guó)人類遺傳學(xué)雜志”(Am.J.Hum.Genet.)44397-401.Little,M.H.,等人(1992).″美國(guó)科學(xué)院院報(bào)″(Proc.Natl.Acad.Sci.USA)894791.Little,M.H.,等人(1993).″人類分子遺傳學(xué)″(Hum.Mol.Genet.)2259.Lovett,等人(1991).″美國(guó)科學(xué)院院報(bào)″(Proc.Natl.Acad.Sci.USA)889628-9632.Lynch,H.T.,等人(1990).″婦科腫瘤學(xué)″(Gynecol.Oncol.)3648-55.Madzak,等人(1992).″遺傳病毒學(xué)雜志″(J.Gen.Virol.)731533-1536.Malkin,D.,等人(1990).“科學(xué)”(Science)2501233-1238.Maniatis.T.,等人(1982).分子克隆實(shí)驗(yàn)室手冊(cè)(MolecularCloningALaboratoryManual)(ColdSpringHarborLaboratory,ColdSpringHarbor,N.Y.).Mann和Baltimore(1985).″病毒學(xué)雜志″(J.Virol.)54401-407.Margaritte,等人(1992).“美國(guó)人類遺傳學(xué)雜志”(Am.J.Hum.Genet.)501231-1234.Margolskee(1992).“微生物學(xué)免疫學(xué)的當(dāng)前課題”(Curr.Top.Microbiol.Immunol.)15867-90.Martin,R.,等人(1990).“生物技術(shù)”(BioTechniques)9762-768.Matteucci,M.D.和Caruthers,M.H.(1981).″美國(guó)化學(xué)協(xié)會(huì)雜志″(J.Am.Chem.Soc.)1033185.Matthews&amp;Kricka(1988).″分析化學(xué)″(Anal.Biochem.)1691.Merrifield(1963).″美國(guó)化學(xué)協(xié)會(huì)雜志″(J.Am.Chem.Soc.)852149-2156.Mettlin,C.,等人(1990).″美國(guó)流行病雜志″(AmericanJournalofEpidemiology)131973-983.Metzger,等人(1988).″自然″(Nature)33431-36.Miki,Y.,等人(1994).″科學(xué)″26666-71.Miller(1992).“微生物學(xué)免疫學(xué)的當(dāng)前課題”(Curr.Top.Microbiol.Immunol.)1581-24.Miller,等人(1985).″分子細(xì)胞生物學(xué)″(Mol.Cell.Biol.)5431-437.Miller,等人(1988).″病毒學(xué)雜志″(J.Virol.)624337-4345.Mittlin(1989).″臨床化學(xué)″(ClinicalChem.)351819.Modrich,P.(1991).″遺傳學(xué)年報(bào)″(Ann.Rev.Genet.)25229-253.Mombaerts,P.,等人(1992).″細(xì)胞″(Cell)68869.Monaco,等人(1986).″自然″(Nature)323646.Moss(1992).“微生物學(xué)免疫學(xué)的當(dāng)前課題”(Curr.Top.Microbiol.Immunol.)15825-38.Muzyczka(1992).“微生物學(xué)免疫學(xué)的當(dāng)前課題”(Curr.Top.Microbiol.Immunol.)15897-123.Nabel(1992).″人基因治療″(Hum.GeneTher.)3399-410.Nabel,等人(1990).“科學(xué)”(Science)2491285-1288.Nakamura,等人(1987).“科學(xué)”(Science)2351616-1622.Narod,S.A.,等人(1991).″柳葉刀″(TheLancet)33882-83.Newman,B.,等人(1988).″美國(guó)科學(xué)院院報(bào)″(Proc.Natl.Acad.Sci.USA)853044-3048.Newton,C.R.,Graham,A.,Heptinstall,L.E.,Powell,S.J.,Summers.C.,Kalsheker,N.,Smith,J.C.,和Markham,A.F.(1989).″核酸研究″(Nucl.AcidsRes.)172503-2516.Nguyen,Q.,等人(1992).“生物技術(shù)”(BioTechniques)13116-123.Novack,等人(1986).″美國(guó)科學(xué)院院報(bào)″(Proc.Natl.Acad.Sci.USA)83586.Oh,J.(1985).人遺傳連鎖分析(AnalysisofHumanGeneticLinkage),JohnsHopkinsUniversityPress,Baltimore,Md,pp.1-216.Ohi,等人(1990).″基因″(Gene)89279-282.Oliphant,A.,等人(1991).″核酸研究″(NucleicAcidRes.)194794.Oliphant,A.,等人(1991).″核酸研究″(NucleicAcidRes.)194795.Orita,等人(1989).″美國(guó)科學(xué)院院報(bào)″(Proc.Natl.Acad.Sci.USA)862776-2770.Page,等人(1990).″病毒學(xué)雜志″(J.Virol.)645370-5276.Pellicer,等人(1980).“科學(xué)”(Science)2091414-1422.Petropoulos,等人(1992).″病毒學(xué)雜志″(J.Virol.)663391-3397.Philpott,K.L.,等人(1992).“科學(xué)”(Science)2561448.Pierce,等人(1992),″美國(guó)科學(xué)院院報(bào)″(Proc.Natl.Acad.Sci.USA)892056-2060.Quantin,等人(1992).″美國(guó)科學(xué)院院報(bào)″(Proc.Natl.Acad.Sci.USA)892581-2584.Rano&amp;Kidd(1989).″核酸研究″(Nucl.AcidsRes.)178392.Rigby,P.W.J.,等人(1977).“分子生物學(xué)雜志”(J.Mol.Biol.〕113237-251.Rosenfeld,等人(1992).″細(xì)胞″(Cell)68143-155Sambrook,J.,等人(1989).分子克隆實(shí)驗(yàn)室手冊(cè)(MolecularCloningALaboratoryManual),2ndEd.(ColdSpringHarborLaboratory,ColdSpringHarbor,N.Y.).Sato,T.,等人(1990).″癌癥研究″(″癌癥研究″(CancerRes.))507184-7189.Scharf(1986).“科學(xué)”(Science)2331076Scopes,R.(1982).蛋白質(zhì)純化原理和實(shí)踐(ProteinPurificationPrinciplesandPractice),(Springer-Verlag,N.Y.).Shaulian,E.,等人(1992).″分子細(xì)胞生物學(xué)″(Mol.CellBiol.)125581-92.Sheffield,V.C.,等人(1989).″美國(guó)科學(xué)院院報(bào)″(Proc.Natl.Acad.Sci.USA)86232-236.Sheffield,V.C.,等人(1991).“美國(guó)人類遺傳學(xué)雜志”(Am.J.Hum.Genet.)49699-706.Shenk,等人(1975).″美國(guó)科學(xué)院院報(bào)″(Proc.Natl.Acad.Sci.USA)72989.Shimada,等人(1991).″臨床調(diào)查雜志″(J.Clin.Invest.)881043-1047.Shinkai,Y.,等人(1992).″細(xì)胞″(Cell)68855.Shizuya,H.,等人(1992).″美國(guó)科學(xué)院院報(bào)″(Proc.Natl.Acad.Sci.USA)898794-8797.Simard,J.,等人(1993).″人類分子遺傳″(HumanMol.Genet.)21193-1199.Skolnick,M.H.和Wallace,B.R.(1988).″基因組″(Genomics)2273-279.Skolnick,M.H.,等人(1990).“科學(xué)”(Science)2501715-1720.Smith,S.A.,等人(1992).″自然遺傳學(xué)″(NatureGenetics)2128-131.Smith,T.F.和Waterman,M.S.(1981).“分子生物學(xué)雜志”(J.Mol.Biol.〕147195-197.Snouwaert,J.N.,等人(1992).“科學(xué)”(Science).2571083.Sorge,等人(1984).″分子細(xì)胞生物學(xué)″(Mol.Cell.Biol.)41730-1737.Srivastava,S.,等人(1993).″癌癥研究″(″癌癥研究″(CancerRes.))534452-5.Sternberg(1990).″美國(guó)科學(xué)院院報(bào)″(Proc.Natl.Acad.Sci.USA)87103-107.Sternberg,等人(1990).″新生物學(xué)家″(TheNewBiologist)2151-162.Stewart,等人(1992).″人基因治療″(″人基因治療″(Hum.GeneTher.))3267-275.Stratford-Perricaudet,等人(1990).″人基因治療″(″人基因治療″(Hum.GeneTher.))1241-256.Swift,M.,等人(1991).″新英國(guó)醫(yī)學(xué)雜志″(N.Engl.J.Med.)3251831-1836.Swift,M.,等人(1976).″癌癥研究″(″癌癥研究″(CancerRes.))36209-215.Su,L.K.,等人(1993).″癌癥研究″(″癌癥研究″(CancerRes.))532728-31.Thomas,A.和Skolnick,M.H.(1994).″在醫(yī)學(xué)和生物學(xué)中應(yīng)用數(shù)學(xué)的IMA雜志″(IMAJournalofMathematicsAppliedinMedicineandBiology)(inpress).Tonolio,D.,等人(1990).ColdSpringHarbor會(huì)議.Valancius,V.&amp;Smithies,O.(1991).″分子細(xì)胞生物學(xué)″(Mol.CellBiol.)111402.vanDilla,等人(1986).″生物技術(shù)″(Biotechnology)4537-552.Wagner,等人(1990).″美國(guó)科學(xué)院院報(bào)″(Proc.Natl.Acad.Sci.USA)873410-3414.Wagner,等人(1991).″美國(guó)科學(xué)院院報(bào)″(Proc.Natl.Acad.Sci.USA)884255-4259.Wang和Huang(1989).″生物化學(xué)″(Biochemistry)289508-9514.Wartell,R.M.,等人(1990).″核酸研究″(Nucl.AcidsRes.)182699-2705.Weber,J.L.(1990).″基因組″(Genomics)7524-530.Weber和May(1989).“美國(guó)人類遺傳學(xué)雜志”(Am.J.Hum.Genet.)44388-396.Weber,J.L.,等人(1990).″核酸研究″(NucleicAcidRes.)184640.Wells,J.A.(1991).″酶學(xué)方法″(MethodsinEnzymol.)202390-411.Wetmur&amp;Davidson(1968).“分子生物學(xué)雜志”(J.Mol.Biol.〕31349-370.White,M.B.,等人,(1992).″基因組″(Genomics)12301-306.White和Lalouel(1988).″遺傳學(xué)年報(bào)″(Ann.Rev.Genet.)22259-279,Wilkinson,等人(1992).″核酸研究″(NucleicAcidsRes.)202233-2239.Willams和Anderson(1984).″遺傳流行病″(Genet.Epidemiol.)17-20.Wolff,等人(1990).“科學(xué)”(Science)2471465-1468.Wolff,等人(1991).“生物技術(shù)”(BioTechniques).11474-485.Wooster,R.,等人(1994).“科學(xué)”(Science)2652088.Wu,等人(1989a).″基因組″(Genomics)4560-569.Wu,等人(1989b).″生物化學(xué)雜志″(J.Biol.Chem.)26416985-16987.Wu,等人(1991).″生物化學(xué)雜志″(J.Biol.Chem.)26614338-14342.Zenke,等人(1990).″美國(guó)科學(xué)院院報(bào)″(Proc.Natl.Acad.Sci.USA)873655-3659.專利和專利申請(qǐng)清單美國(guó)專利No.3,817,837美國(guó)專利No.3,850,752美國(guó)專利No.3,939,350美國(guó)專利No.3,996,345美國(guó)專利No.4,275,149美國(guó)專利No.4,277,437美國(guó)專利No.4,366,241美國(guó)專利No.4,376,110美國(guó)專利No.4,486,530美國(guó)專利No.4,683,195美國(guó)專利No.4,683,202美國(guó)專利No.4,816,567美國(guó)專利No.4,868,105美國(guó)專利No.5,252,479EPO出版物No.225,807歐洲專利申請(qǐng)出版物No.0332435Geysen,H.,PCT出版的申請(qǐng)WO84/03564,于1984年9月13日出版Hitzeman等人,EP73,675APCT出版的申請(qǐng)WO93/07282序列表(1)一般信息(i)申請(qǐng)人Shattuck-Eidens,DonnaM.Simard,JacquesEmi,MitsuruNakamura,YusukeDurcher,F(xiàn)rancine(ii)發(fā)明名稱17q連鎖的乳房癌和卵巢癌易患性基因的體內(nèi)突變和多態(tài)性(iii)序列數(shù)目85(iv)通信地址(A)收信人Venable,Baetjer,Howard&amp;Civiletti,LLP(B)街道1201NewYorkAvenue,N.W.,Suite1000(C)城市華盛頓(D)州DC(E)國(guó)家美國(guó)(F)郵編20005(v)計(jì)算機(jī)可讀形式(A)記錄介質(zhì)類型軟盤(B)計(jì)算機(jī)IBMPC兼容性(C)操作系統(tǒng)PC-DOS/MS-DOS(D)軟件PatentInRelease#1.0,Version#1.30(vi)本申請(qǐng)資料(A)申請(qǐng)?zhí)?B)申請(qǐng)日(C)分類(vii)在先申請(qǐng)資料(A)申請(qǐng)?zhí)朥S(B)申請(qǐng)日07-6月-1995(vii)在先申請(qǐng)資料(A)申請(qǐng)?zhí)朥S08/409,305(B)申請(qǐng)日24-3月-1995(vii)在先申請(qǐng)資料(A)申請(qǐng)?zhí)朥S08/348,824(B)申請(qǐng)日29-11月-1994(vii)在先申請(qǐng)資料(A)申請(qǐng)?zhí)朥S08/308,104(B)申請(qǐng)日16-9月-1994(vii)在先申請(qǐng)資料(A)申請(qǐng)?zhí)朥S08/300,266(B)申請(qǐng)日02-9月-1994(vii)在先申請(qǐng)資料(A)申請(qǐng)?zhí)朥S08/289,221(B)申請(qǐng)日12-8月-1994(viii)律師/代理人信息(A)姓名Ihnen,JeffreyL.(B)登記號(hào)28,957(C)參考/案卷號(hào)24884-109347(ix)通訊信息(A)電話202-962-4810(B)傳真202-962-8300(2)SEQIDNO1信息(i)序列特征(A)長(zhǎng)度5914堿基對(duì)(B)類型核酸(C)股性雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型cDNA(iii)假設(shè)否(iv)反義否(vi)最初來(lái)源(A)有機(jī)體人(ix)特征(A)名稱/檢索符號(hào)CDS(B)位置120..5711(xi)序列描述SEQIDNO1AGCTCGCTGAGACTTCCTGGACCCCGCACCAGGCTGTGGGGTTTCTCAGATAACTGGGCC60CCTGCGCTCAGGAGGCCTTCACCCTCTGCTCTGGGTAAAGTTCATTGGAACAGAAAGAA119ATGGATTTATCTGCTCTTCGCGTTGAAGAAGTACAAAATGTCATTAAT167MetAspLeuSerAlaLeuArgValGluGluValGlnAsnValIleAsn151015GCTATGCAGAAAATCTTAGAGTGTCCCATCTGTCTGGAGTTGATCAAG215AlaMetGlnLysIleLeuGluCysProIleCysLeuGluLeuIleLys202530GAACCTGTCTCCACAAAGTGTGACCACATATTTTGCAAATTTTGCATG263GluProValSerThrLysCysAspHisIlePheCysLysPheCysMet354045CTGAAACTTCTCAACCAGAAGAAAGGGCCTTCACAGTGTCCTTTATGT311LeuLysLeuLeuAsnGlnLysLysGlyProSerGlnCysProLeuCys505560AAGAATGATATAACCAAAAGGAGCCTACAAGAAAGTACGAGATTTAGT359LysAsnAspIleThrLysArgSerLeuGlnGluSerThrArgPheSer65707580CAACTTGTTGAAGAGCTATTGAAAATCATTTGTGCTTTTCAGCTTGAC407GlnLeuValGluGluLeuLeuLysIleIleCysAlaPheGlnLeuAsp859095ACAGGTTTGGAGTATGCAAACAGCTATAATTTTGCAAAAAAGGAAAAT455ThrGlyLeuGluTyrAlaAsnSerTyrAsnPheAlaLysLysGluAsn100105110AACTCTCCTGAACATCTAAAAGATGAAGTTTCTATCATCCAAAGTATG503AsnSerProGluHisLeuLysAspGluValSerIleIleGlnSerMet115120125GGCTACAGAAACCGTGCCAAAAGACTTCTACAGAGTGAACCCGAAAAT551GlyTyrArgAsnArgAlaLysArgLeuLeuGlnSerGluProGluAsn130135140CCTTCCTTGCAGGAAACCAGTCTCAGTGTCCAACTCTCTAACCTTGGA599ProSerLeuGlnGluThrSerLeuSerValGlnLeuSerAsnLeuGly145150155160ACTGTGAGAACTCTGAGGACAAAGCAGCGGATACAACCTCAAAAGACG647ThrValArgThrLeuArgThrLysGlnArgIleGlnProGlnLysThr165170175TCTGTCTACATTGAATTGGGATCTGATTCTTCTGAAGATACCGTTAAT695SerValTyrIleGluLeuGlySerAspSerSerGluAspThrValAsn180185190AAGGCAACTTATTGCAGTGTGGGAGATCAAGAATTGTTACAAATCACC743LysAlaThrTyrCysSerValGlyAspGlnGluLeuLeuGlnIleThr195200205CCTCAAGGAACCAGGGATGAAATCAGTTTGGATTCTGCAAAAAAGGCT791ProGlnGlyThrArgAspGluIleSerLeuAspSerAlaLysLysAla210215220GCTTGTGAATTTTCTGAGACGGATGTAACAAATACTGAACATCATCAA839AlaCysGluPheSerGluThrAspValThrAsnThrGluHisHisGln225230235240CCCAGTAATAATGATTTGAACACCACTGAGAAGCGTGCAGCTGAGAGG887ProSerAsnAsnAspLeuAsnThrThrGluLysArgAlaAlaGluArg245250255CATCCAGAAAAGTATCAGGGTAGTTCTGTTTCAAACTTGCATGTGGAG935HisProGluLysTyrGlnGlySerSerValSerAsnLeuHisValGlu260265270CCATGTGGCACAAATACTCATGCCAGCTCATTACAGCATGAGAACAGC983ProCysGlyThrAsnThrHisAlaSerSerLeuGlnHisGluAsnSer275280285AGTTTATTACTCACTAAAGACAGAATGAATGTAGAAAAGGCTGAATTC1031SerLeuLeuLeuThrLysAspArgMetAsnValGluLysAlaGluPhe290295300TGTAATAAAAGCAAACAGCCTGGCTTAGCAAGGAGCCAACATAACAGA1079CysAsnLysSerLysGlnProGlyLeuAlaArgSerGlnHisAsnArg305310315320TGGGCTGGAAGTAAGGAAACATGTAATGATAGGCGGACTCCCAGCACA1127TrpAlaGlySerLysGluThrCysAsnAspArgArgThrProSerThr325330335GAAAAAAAGGTAGATCTGAATGCTGATCCCCTGTGTGAGAGAAAAGAA1175GluLysLysValAspLeuAsnAlaAspProLeuCysGluArgLysGlu340345350TGGAATAAGCAGAAACTGCCATGCTCAGAGAATCCTAGAGATACTGAA1223TrpAsnLysGlnLysLeuProCysSerGluAsnProArgAspThrGlu355360365GATGTTCCTTGGATAACACTAAATAGCAGCATTCAGAAAGTTAATGAG1271AspValProTrpIleThrLeuAsnSerSerIleGlnLysValAsnGlu370375380TGGTTTTCCAGAAGTGATGAACTGTTAGGTTCTGATGACTCACATGAT1319TrpPheSerArgSerAspGluLeuLeuGlySerAspAspSerHisAsp385390395400GGGGAGTCTGAATCAAATGCCAAAGTAGCTGATGTATTGGACGTTCTA1367GlyGluSerGluSerAsnAlaLysValAlaAspValLeuAspValLeu405410415AATGAGGTAGATGAATATTCTGGTTCTTCAGAGAAAATAGACTTACTG1415AsnGluValAspGluTyrSerGlySerSerGluLysIleAspLeuLeu420425430GCCAGTGATCCTCATGAGGCTTTAATATGTAAAAGTGAAAGAGTTCAC1463AlaSerAspProHisGluAlaLeuIleCysLysSerGluArgValHis435440445TCCAAATCAGTAGAGAGTAATATTGAAGACAAAATATTTGGGAAAACC1511SerLysSerValGluSerAsnIleGluAspLysIlePheGlyLysThr450455460TATCGGAAGAAGGCAAGCCTCCCCAACTTAAGCCATGTAACTGAAAAT1559TyrArgLysLysAlaSerLeuProAsnLeuSerHisValThrGluAsn465470475480CTAATTATAGGAGCATTTGTTACTGAGCCACAGATAATACAAGAGCGT1607LeuIleIleGlyAlaPheValThrGluProGlnIleIleGlnGluArg485490495CCCCTCACAAATAAATTAAAGCGTAAAAGGAGACCTACATCAGGCCTT1655ProLeuThrAsnLysLeuLysArgLysArgArgProThrSerGlyLeu500505510CATCCTGAGGATTTTATCAAGAAAGCAGATTTGGCAGTTCAAAAGACT1703HisProGluAspPheIleLysLysAlaAspLeuAlaValGlnLysThr515520525CCTGAAATGATAAATCAGGGAACTAACCAAACGGAGCAGAATGGTCAA1751ProGluMetIleAsnGlnGlyThrAsnGlnThrGluGlnAsnGlyGln530535540GTGATGAATATTACTAATAGTGGTCATGAGAATAAAACAAAAGGTGAT1799ValMetAsnIleThrAsnSerGlyHisGluAsnLysThrLysGlyAsp545550555560TCTATTCAGAATGAGAAAAATCCTAACCCAATAGAATCACTCGAAAAA1847SerIleGlnAsnGluLysAsnProAsnProIleGluSerLeuGluLys565570575GAATCTGCTTTCAAAACGAAAGCTGAACCTATAAGCAGCAGTATAAGC1895GluSerAlaPheLysThrLysAlaGluProIleSerSerSerIleSer580585590AATATGGAACTCGAATTAAATATCCACAATTCAAAAGCACCTAAAAAG1943AsnMetGluLeuGluLeuAsnIleHisAsnSerLysAlaProLysLys595600605AATAGGCTGAGGAGGAAGTCTTCTACCAGGCATATTCATGCGCTTGAA1991AsnArgLeuArgArgLysSerSerThrArgHisIleHisAlaLeuGlu610615620CTAGTAGTCAGTAGAAATCTAAGCCCACCTAATTGTACTGAATTGCAA2039LeuValValSerArgAsnLeuSerProProAsnCysThrGluLeuGln625630635640ATTGATAGTTGTTCTAGCAGTGAAGAGATAAAGAAAAAAAAGTACAAC2087IleAspSerCysSerSerSerGluGluIleLysLysLysLysTyrAsn645650655CAAATGCCAGTCAGGCACAGCAGAAACCTACAACTCATGGAAGGTAAA2135GlnMetProValArgHisSerArgAsnLeuGlnLeuMetGluGlyLys660665670GAACCTGCAACTGGAGCCAAGAAGAGTAACAAGCCAAATGAACAGACA2183GluProAlaThrGlyAlaLysLysSerAsnLysProAsnGluGlnThr675680685AGTAAAAGACATGACAGCGATACTTTCCCAGAGCTGAAGTTAACAAAT2231SerLysArgHisAspSerAspThrPheProGluLeuLysLeuThrAsn690695700GCACCTGGTTCTTTTACTAAGTGTTCAAATACCAGTGAACTTAAAGAA2279AlaProGlySerPheThrLysCysSerAsnThrSerGluLeuLysGlu705710715720TTTGTCAATCCTAGCCTTCCAAGAGAAGAAAAAGAAGAGAAACTAGAA2327PheValAsnProSerLeuProArgGluGluLysGluGluLysLeuGlu725730735ACAGTTAAAGTGTCTAATAATGCTGAAGACCCCAAAGATCTCATGTTA2375ThrValLysValSerAsnAsnAlaGluAspProLysAspLeuMetLeu740745750AGTGGAGAAAGGGTTTTGCAAACTGAAAGATCTGTAGAGAGTAGCAGT2423SerGlyGluArgValLeuGlnThrGluArgSerValGluSerSerSer755760765ATTTCATTGGTACCTGGTACTGATTATGGCACTCAGGAAAGTATCTCG2471IleSerLeuValProGlyThrAspTyrGlyThrGlnGluSerIleSer770775780TTACTGGAAGTTAGCACTCTAGGGAAGGCAAAAACAGAACCAAATAAA2519LeuLeuGluValSerThrLeuGlyLysAlaLysThrGluProAsnLys785790795800TGTGTGAGTCAGTGTGCAGCATTTGAAAACCCCAAGGGACTAATTCAT2567CysValSerGlnCysAlaAlaPheGluAsnProLysGlyLeuIleHis805810815GGTTGTTCCAAAGATAATAGAAATGACACAGAAGGCTTTAAGTATCCA2615GlyCysSerLysAspAsnArgAsnAspThrGluGlyPheLysTyrPro820825830TTGGGACATGAAGTTAACCACAGTCGGGAAACAAGCATAGAAATGGAA2663LeuGlyHisGluValAsnHisSerArgGluThrSerIleGluMetGlu835840845GAAAGTGAACTTGATGCTCAGTATTTGCAGAATACATTCAAGGTTTCA2711GluSerGluLeuAspAlaGlnTyrLeuGlnAsnThrPheLysValSer850855860AAGCGCCAGTCATTTGCTCCGTTTTCAAATCCAGGAAATGCAGAAGAG2759LysArgGlnSerPheAlaProPheSerAsnProGlyAsnAlaGluGlu865870875880GAATGTGCAACATTCTCTGCCCACTCTGGGTCCTTAAAGAAACAAAGT2807GluCysAlaThrPheSerAlaHisSerGlySerLeuLysLysGlnSer885890895CCAAAAGTCACTTTTGAATGTGAACAAAAGGAAGAAAATCAAGGAAAG2855ProLysValThrPheGluCysGluGlnLysGluGluAsnGlnGlyLys900905910AATGAGTCTAATATCAAGCCTGTACAGACAGTTAATATCACTGCAGGC2903AsnGluSerAsnIleLysProValGlnThrValAsnIleThrAlaGly915920925TTTCCTGTGGTTGGTCAGAAAGATAAGCCAGTTGATAATGCCAAATGT2951PheProValValGlyGlnLysAspLysProValAspAsnAlaLysCys930935940AGTATCAAAGGAGGCTCTAGGTTTTGTCTATCATCTCAGTTCAGAGGC2999SerIleLysGlyGlySerArgPheCysLeuSerSerGlnPheArgGly945950955960AACGAAACTGGACTCATTACTCCAAATAAACATGGACTTTTACAAAAC3047AsnGluThrGlyLeuIleThrProAsnLysHisGlyLeuLeuGlnAsn965970975CCATATCGTATACCACCACTTTTTCCCATCAAGTCATTTGTTAAAACT3095ProTyrArgIleProProLeuPheProIleLysSerPheValLysThr980985990AAATGTAAGAAAAATCTGCTAGAGGAAAACTTTGAGGAACATTCAATG3143LysCysLysLysAsnLeuLeuGluGluAsnPheGluGluHisSerMet99510001005TCACCTGAAAGAGAAATGGGAAATGAGAACATTCCAAGTACAGTGAGC3191SerProGluArgGluMetGlyAsnGluAsnIleProSerThrValSer101010151020ACAATTAGCCGTAATAACATTAGAGAAAATGTTTTTAAAGAAGCCAGC3239ThrIleSerArgAsnAsnIleArgGluAsnValPheLysGluAlaSer1025103010351040TCAAGCAATATTAATGAAGTAGGTTCCAGTACTAATGAAGTGGGCTCC3287SerSerAsnIleAsnGluValGlySerSerThrAsnGluValGlySer104510501055AGTATTAATGAAATAGGTTCCAGTGATGAAAACATTCAAGCAGAACTA3335SerIleAsnGluIleGlySerSerAspGluAsnIleGlnAlaGluLeu106010651070GGTAGAAACAGAGGGCCAAAATTGAATGCTATGCTTAGATTAGGGGTT3383GlyArgAsnArgGlyProLysLeuAsnAlaMetLeuArgLeuGlyVal107510801085TTGCAACCTGAGGTCTATAAACAAAGTCTTCCTGGAAGTAATTGTAAG3431LeuGlnProGluValTyrLysGlnSerLeuProGlySerAsnCysLys109010951100CATCCTGAAATAAAAAAGCAAGAATATGAAGAAGTAGTTCAGACTGTT3479HisProGluIleLysLysGlnGluTyrGluGluValValGlnThrVal1105111011151120AATACAGATTTCTCTCCATATCTGATTTCAGATAACTTAGAACAGCCT3527AsnThrAspPheSerProTyrLeuIleSerAspAsnLeuGluGlnPro112511301135ATGGGAAGTAGTCATGCATCTCAGGTTTGTTCTGAGACACCTGATGAC3575MetGlySerSerHisAlaSerGlnValCysSerGluThrProAspAsp114011451150CTGTTAGATGATGGTGAAATAAAGGAAGATACTAGTTTTGCTGAAAAT3623LeuLeuAspAspGlyGluIleLysGluAspThrSerPheAlaGluAsn115511601165GACATTAAGGAAAGTTCTGCTGTTTTTAGCAAAAGCGTCCAGAAAGGA3671AspIleLysGluSerSerAlaValPheSerLysSerValGlnLysGly117011751180GAGCTTAGCAGGAGTCCTAGCCCTTTCACCCATACACATTTGGCTCAG3719GluLeuSerArgSerProSerProPheThrHisThrHisLeuAlaGln1185119011951200GGTTACCGAAGAGGGGCCAAGAAATTAGAGTCCTCAGAAGAGAACTTA3767GlyTyrArgArgGlyAlaLysLysLeuGluSerSerGluGluAsnLeu120512101215TCTAGTGAGGATGAAGAGCTTCCCTGCTTCCAACACTTGTTATTTGGT3815SerSerGluAspGluGluLeuProCysPheGlnHisLeuLeuPheGly122012251230AAAGTAAACAATATACCTTCTCAGTCTACTAGGCATAGCACCGTTGCT3863LysValAsnAsnIleProSerGlnSerThrArgHisSerThrValAla123512401245ACCGAGTGTCTGTCTAAGAACACAGAGGAGAATTTATTATCATTGAAG3911ThrGluCysLeuSerLysAsnThrGluGluAsnLeuLeuSerLeuLys125012551260AATAGCTTAAATGACTGCAGTAACCAGGTAATATTGGCAAAGGCATCT3959AsnSerLeuAsnAspCysSerAsnGlnValIleLeuAlaLysAlaSer1265127012751280CAGGAACATCACCTTAGTGAGGAAACAAAATGTTCTGCTAGCTTGTTT4007GlnGluHisHisLeuSerGluGluThrLysCysSerAlaSerLeuPhe128512901295TCTTCACAGTGCAGTGAATTGGAAGACTTGACTGCAAATACAAACACC4055SerSerGlnCysSerGluLeuGluAspLeuThrAlaAsnThrAsnThr130013051310CAGGATCCTTTCTTGATTGGTTCTTCCAAACAAATGAGGCATCAGTCT4103GlnAspProPheLeuIleGlySerSerLysGlnMetArgHisGlnSer131513201325GAAAGCCAGGGAGTTGGTCTGAGTGACAAGGAATTGGTTTCAGATGAT4151GluSerGlnGlyValGlyLeuSerAspLysGluLeuValSerAspAsp133013351340GAAGAAAGAGGAACGGGCTTGGAAGAAAATAATCAAGAAGAGCAAAGC4199GluGluArgGlyThrGlyLeuGluGluAsnAsnGlnGluGluGlnSer1345135013551360ATGGATTCAAACTTAGGTGAAGCAGCATCTGGGTGTGAGAGTGAAACA4247MetAspSerAsnLeuGlyGluAlaAlaSerGlyCysGluSerGluThr136513701375AGCGTCTCTGAAGACTGCTCAGGGCTATCCTCTCAGAGTGACATTTTA4295SerValSerGluAspCysSerGlyLeuSerSerGlnSerAspIleLeu138013851390ACCACTCAGCAGAGGGATACCATGCAACATAACCTGATAAAGCTCCAG4343ThrThrGlnGlnArgAspThrMetGlnHisAsnLeuIleLysLeuGln139514001405CAGGAAATGGCTGAACTAGAAGCTGTGTTAGAACAGCATGGGAGCCAG4391GlnGluMetAlaGluLeuGluAlaValLeuGluGlnHisGlySerGln141014151420CCTTCTAACAGCTACCCTTCCATCATAAGTGACTCTTCTGCCCTTGAG4439ProSerAsnSerTyrProSerIleIleSerAspSerSerAlaLeuGlu1425143014351440GACCTGCGAAATCCAGAACAAAGCACATCAGAAAAAGCAGTATTAACT4487AspLeuArgAsnProGluGlnSerThrSerGluLysAlaValLeuThr144514501455TCACAGAAAAGTAGTGAATACCCTATAAGCCAGAATCCAGAAGGCCTT4535SerGlnLysSerSerGluTyrProIleSerGlnAsnProGluGlyLeu146014651470TCTGCTGACAAGTTTGAGGTGTCTGCAGATAGTTCTACCAGTAAAAAT4583SerAlaAspLysPheGluValSerAlaAspSerSerThrSerLysAsn147514801485AAAGAACCAGGAGTGGAAAGGTCATCCCCTTCTAAATGCCCATCATTA4631LysGluProGlyValGluArgSerSerProSerLysCysProSerLeu149014951500GATGATAGGTGGTACATGCACAGTTGCTCTGGGAGTCTTCAGAATAGA4679AspAspArgTrpTyrMetHisSerCysSerGlySerLeuGlnAsnArg1505151015151520AACTACCCATCTCAAGAGGAGCTCATTAAGGTTGTTGATGTGGAGGAG4727AsnTyrProSerGlnGluGluLeuIleLysValValAspValGluGlu152515301535CAACAGCTGGAAGAGTCTGGGCCACACGATTTGACGGAAACATCTTAC4775GlnGlnLeuGluGluSerGlyProHisAspLeuThrGluThrSerTyr154015451550TTGCCAAGGCAAGATCTAGAGGGAACCCCTTACCTGGAATCTGGAATC4823LeuProArgGlnAspLeuGluGlyThrProTyrLeuGluSerGlyIle155515601565AGCCTCTTCTCTGATGACCCTGAATCTGATCCTTCTGAAGACAGAGCC4871SerLeuPheSerAspAspProGluSerAspProSerGluAspArgAla157015751580CCAGAGTCAGCTCGTGTTGGCAACATACCATCTTCAACCTCTGCATTG4919ProGluSerAlaArgValGlyAsnIleProSerSerThrSerAlaLeu1585159015951600AAAGTTCCCCAATTGAAAGTTGCAGAATCTGCCCAGAGTCCAGCTGCT4967LysValProGlnLeuLysValAlaGluSerAlaGlnSerProAlaAla160516101615GCTCATACTACTGATACTGCTGGGTATAATGCAATGGAAGAAAGTGTG5015AlaHisThrThrAspThrAlaGlyTyrAsnAlaMetGluGluSerVal162016251630AGCAGGGAGAAGCCAGAATTGACAGCTTCAACAGAAAGGGICAACAAA5063SerArgGluLysProGluLeuThrAlaSerThrGluArgValAsnLys163516401645AGAATGTCCATGGTGGTGTCTGGCCTGACCCCAGAAGAATTTATGCTC5111ArgMetSerMetValValSerGlyLeuThrProGluGluPheMetLeu165016551660GTGTACAAGTTTGCCAGAAAACACCACATCACTTTAACTAATCTAATT5159ValTyrLysPheAlaArgLysHisHisIleThrLeuThrAsnLeuIle1665167016751680ACTGAAGAGACTACTCATGTTGTTATGAAAACAGATGCTGAGTTTGTG5207ThrGluGluThrThrHisValValMetLysThrAspAlaGluPheVal168516901695TGTGAACGGACACTGAAATATTTTCTAGGAATTGCGGGAGGAAAATGG5255CysGluArgThrLeuLysTyrPheLeuGlyIleAlaGlyGlyLysTrp170017051710GTAGTTAGCTATTTCTGGGTGACCCAGTCTATTAAAGAAAGAAAAATG5303ValValSerTyrPheTrpValThrGlnSerIleLysGluArgLysMet171517201725CTGAATGAGCATGATTTTGAAGTCAGAGGAGATGTGGTCAATGGAAGA5351LeuAsnGluHisAspPheGluValArgGlyAspValValAsnGlyArg173017351740AACCACCAAGGTCCAAAGCGAGCAAGAGAATCCCAGGACAGAAAGATC5399AsnHisGlnGlyProLysArgAlaArgGluSerGlnAspArgLysIle1745175017551760TTCAGGGGGCTAGAAATCTGTTGCTATGGGCCCTTCACCAACATGCCC5447PheArgGlyLeuGluIleCysCysTyrGlyProPheThrAsnMetPro176517701775ACAGATCAACTGGAATGGATGGTACAGCTGTGTGGTGCTTCTGTGGTG5495ThrAspGlnLeuGluTrpMetValGlnLeuCysGlyAlaSerValVal178017851790AAGGAGCTTTCATCATTCACCCTTGGCACAGGTGTCCACCCAATTGTG5543LysGluLeuSerSerPheThrLeuGlyThrGlyValHisProIleVal179518001805GTTGTGCAGCCAGATGCCTGGACAGAGGACAATGGCTTCCATGCAATT5591ValValGlnProAspAlaTrpThrGluAspAsnGlyPheHisAlaIle181018151820GGGCAGATGTGTGAGGCACCTGTGGTGACCCGAGAGTGGGTGTTGGAC5639GlyGlnMetCysGluAlaProValValThrArgGluTrpValLeuAsp1825183018351840AGTGTAGCACTCTACCAGTGCCAGGAGCTGGACACCTACCTGATACCC5687SerValAlaLeuTyrGlnCysGlnGluLeuAspThrTyrLeuIlePro184518501855CAGATCCCCCACAGCCACTACTGACTGCAGCCAGCCACAGGTACAGAGCCACAG5741GlnIleProHisSerHisTyr*1860GACCCCAAGAATGAGCTTACAAAGTGGCCTTTCCAGGCCCTGGGAGCTCCTCTCACTCTT5801CAGTCCTTCTACTGTCCTGGCTACTAAATATTTTATGTACATCAGCCTGAAAAGGACTTC5861TGGCTATGCAAGGGTCCCTTAAAGATTTTCTGCTTGAAGTCTCCCTTGGAAAT5914(2)SEQIDNO2信息(i)序列特征(A)長(zhǎng)度1864氨基酸(B)類型氨基酸(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQIDNO2MetAspLeuSerAlaLeuArgValGluGluValGlnAsnValIleAsn151015AlaMetGlnLysIleLeuGluCysProIleCysLeuGluLeuIleLys202530GluProValSerThrLysCysAspHisIlePheCysLysPheCysMet354045LeuLysLeuLeuAsnGlnLysLysGlyProSerGlnCysProLeuCys505560LysAsnAspIleThrLysArgSerLeuGlnGluSerThrArgPheSer65707580GlnLeuValGluGluLeuLeuLysIleIleCysAlaPheGlnLeuAsp859095ThrGlyLeuGluTyrAlaAsnSerTyrAsnPheAlaLysLysGluAsn100105110AsnSerProGluHisLeuLysAspGluValSerIleIleGlnSerMet115120125GlyTyrArgAsnArgAlaLysArgLeuLeuGlnSerGluProGluAsn130135140ProSerLeuGlnGluThrSerLeuSerValGlnLeuSerAsnLeuGly145150155160ThrValArgThrLeuArgThrLysGlnArgIleGlnProGlnLysThr165170175SerValTyrIleGluLeuGlySerAspSerSerGluAspThrValAsn180185190LysAlaThrTyrCysSerValGlyAspGlnGluLeuLeuGlnIleThr195200205ProGlnGlyThrArgAspGluIleSerLeuAspSerAlaLysLysAla210215220AlaCysGluPheSerGluThrAspValThrAsnThrGluHisHisGln225230235240ProSerAsnAsnAspLeuAsnThrThrGluLysArgAlaAlaGluArg245250255HisProGluLysTyrGlnGlySerSerValSerAsnLeuHisValGlu260265270ProCysGlyThrAsnThrHisAlaSerSerLeuGlnHisGluAsnSer275280285SerLeuLeuLeuThrLysAspArgMetAsnValGluLysAlaGluPhe290295300CysAsnLysSerLysGlnProGlyLeuAlaArgSerGlnHisAsnArg305310315320TrpAlaGlySerLysGluThrCysAsnAspArgArgThrProSerThr325330335GluLysLysValAspLeuAsnAlaAspProLeuCysGluArgLysGlu340345350TrpAsnLysGlnLysLeuProCysSerGluAsnProArgAspThrGlu355360365AspValProTrpIleThrLeuAsnSerSerIleGlnLysValAsnGlu370375380TrpPheSerArgSerAspGluLeuLeuGlySerAspAspSerHisAsp385390395400GlyGluSerGluSerAsnAlaLysValAlaAspValLeuAspValLeu405410415AsnGluValAspGluTyrSerGlySerSerGluLysIleAspLeuLeu420425430AlaSerAspProHisGluAlaLeuIleCysLysSerGluArgValHis435440445SerLysSerValGluSerAsnIleGluAspLysIlePheGlyLysThr450455460TyrArgLysLysAlaSerLeuProAsnLeuSerHisValThrGluAsn465470475480LeuIleIleGlyAlaPheValThrGluProGlnIleIleGlnGluArg485490495ProLeuThrAsnLysLeuLysArgLysArgArgProThrSerGlyLeu500505510HisProGluAspPheIleLysLysAlaAspLeuAlaValGlnLysThr515520525ProGluMetIleAsnGlnGlyThrAsnGlnThrGluGlnAsnGlyGln530535540ValMetAsnIleThrAsnSerGlyHisGluAsnLysThrLysGlyAsp545550555560SerIleGlnAsnGluLysAsnProAsnProIleGluSerLeuGluLys565570575GluSerAlaPheLysThrLysAlaGluProIleSerSerSerIleSer580585590AsnMetGluLeuGluLeuAsnIleHisAsnSerLysAlaProLysLys595600605AsnArgLeuArgArgLysSerSerThrArgHisIleHisAlaLeuGlu610615620LeuValValSerArgAsnLeuSerProProAsnCysThrGluLeuGln625630635640IleAspSerCysSerSerSerGluGluIleLysLysLysLysTyrAsn645650655GlnMetProValArgHisSerArgAsnLeuGlnLeuMetGluGlyLys660665670GluProAlaThrGlyAlaLysLysSerAsnLysProAsnGluGlnThr675680685SerLysArgHisAspSerAspThrPheProGluLeuLysLeuThrAsn690695700AlaProGlySerPheThrLysCysSerAsnThrSerGluLeuLysGlu705710715720PheValAsnProSerLeuProArgGluGluLysGluGluLysLeuGlu725730735ThrValLysValSerAsnAsnAlaGluAspProLysAspLeuMetLeu740745750SerGlyGluArgValLeuGlnThrGluArgSerValGluSerSerSer755760765IleSerLeuValProGlyThrAspTyrGlyThrGlnGluSerIleSer770775780LeuLeuGluValSerThrLeuGlyLysAlaLysThrGluProAsnLys785790795800CysValSerGlnCysAlaAlaPheGluAsnProLysGlyLeuIleHis805810815GlyCysSerLysAspAsnArgAsnAspThrGluGlyPheLysTyrPro820825830LeuGlyHisGluValAsnHisSerArgGluThrSerIleGluMetGlu835840845GluSerGluLeuAspAlaGlnTyrLeuGlnAsnThrPheLysValSer850855860LysArgGlnSerPheAlaProPheSerAsnProGlyAsnAlaGluGlu865870875880GluCysAlaThrPheSerAlaHisSerGlySerLeuLysLysGlnSer885890895ProLysValThrPheGluCysGluGlnLysGluGluAsnGlnGlyLys900905910AsnGluSerAsnIleLysProValGlnThrValAsnIleThrAlaGly915920925PheProValValGlyGlnLysAspLysProValAspAsnAlaLysCys930935940SerIleLysGlyGlySerArgPheCysLeuSerSerGlnPheArgGly945950955960AsnGluThrGlyLeuIleThrProAsnLysHisGlyLeuLeuGlnAsn965970975ProTyrArgIleProProLeuPheProIleLysSerPheValLysThr980985990LysCysLysLysAsnLeuLeuGluGluAsnPheGluGluHisSerMet99510001005SerProGluArgGluMetGlyAsnGluAsnIleProSerThrValSer101010151020ThrIleSerArgAsnAsnIleArgGluAsnValPheLysGluAlaSer1025103010351040SerSerAsnIleAsnGluValGlySerSerThrAsnGluValGlySer104510501055SerIleAsnGluIleGlySerSerAspGluAsnIleGlnAlaGluLeu106010651070GlyArgAsnArgGlyProLysLeuAsnAlaMetLeuArgLeuGlyVal107510801085LeuGlnProGluValTyrLysGlnSerLeuProGlySerAsnCysLys109010951100HisProGluIleLysLysGlnGluTyrGluGluValValGlnThrVal1105111011151120AsnThrAspPheSerProTyrLeuIleSerAspAsnLeuGluGlnPro112511301135MetGlySerSerHisAlaSerGlnValCysSerGluThrProAspAsp114011451150LeuLeuAspAspGlyGluIleLysGluAspThrSerPheAlaGluAsn115511601165AspIleLysGluSerSerAlaValPheSerLysSerValGlnLysGly117011751180GluLeuSerArgSerProSerProPheThrHisThrHisLeuAlaGln1185119011951200GlyTyrArgArgGlyAlaLysLysLeuGluSerSerGluGluAsnLeu120512101215SerSerGluAspGluGluLeuProCysPheGlnHisLeuLeuPheGly122012251230LysValAsnAsnIleProSerGlnSerThrArgHisSerThrValAla123512401245ThrGluCysLeuSerLysAsnThrGluGluAsnLeuLeuSerLeuLys125012551260AsnSerLeuAsnAspCysSerAsnGlnValIleLeuAlaLysAlaSer1265127012751280GlnGluHisHisLeuSerGluGluThrLysCysSerAlaSerLeuPhe128512901295SerSerGlnCysSerGluLeuGluAspLeuThrAlaAsnThrAsnThr130013051310GlnAspProPheLeuIleGlySerSerLysGlnMetArgHisGlnSer131513201325GluSerGlnGlyValGlyLeuSerAspLysGluLeuValSerAspAsp133013351340GluGluArgGlyThrGlyLeuGluGluAsnAsnGlnGluGluGlnSer1345135013551360MetAspSerAsnLeuGlyGluAlaAlaSerGlyCysGluSerGluThr136513701375SerValSerGluAspCysSerGlyLeuSerSerGlnSerAspIleLeu138013851390ThrThrGlnGlnArgAspThrMetGlnHisAsnLeuIleLysLeuGln139514001405GlnGluMetAlaGluLeuGluAlaValLeuGluGlnHisGlySerGln141014151420ProSerAsnSerTyrProSerIleIleSerAspSerSerAlaLeuGlu1425143014351440AspLeuArgAsnProGluGlnSerThrSerGluLysAlaValLeuThr144514501455SerGlnLysSerSerGluTyrProIleSerGlnAsnProGluGlyLeu146014651470SerAlaAspLysPheGluValSerAlaAspSerSerThrSerLysAsn147514801485LysGluProGlyValGluArgSerSerProSerLysCysProSerLeu149014951500AspAspArgTrpTyrMetHisSerCysSerGlySerLeuGlnAsnArg1505151015151520AsnTyrProSerGlnGluGluLeuIleLysValValAspValGluGlu152515301535GlnGlnLeuGluGluSerGlyProHisAspLeuThrGluThrSerTyr154015451550LeuProArgGlnAspLeuGluGlyThrProTyrLeuGluSerGlyIle155515601565SerLeuPheSerAspAspProGluSerAspProSerGluAspArgAla157015751580ProGluSerAlaArgValGlyAsnIleProSerSerThrSerAlaLeu1585159015951600LysValProGlnLeuLysValAlaGluSerAlaGlnSerProAlaAla160516101615AlaHisThrThrAspThrAlaGlyTyrAsnAlaMetGluGluSerVal162016251630SerArgGluLysProGluLeuThrAlaSerThrGluArgValAsnLys163516401645ArgMetSerMetValValSerGlyLeuThrProGluGluPheMetLeu165016551660ValTyrLysPheAlaArgLysHisHisIleThrLeuThrAsnLeuIle1665167016751680ThrGluGluThrThrHisValValMetLysThrAspAlaGluPheVal168516901695CysGluArgThrLeuLysTyrPheLeuGlyIleAlaGlyGlyLysTrp170017051710ValValSerTyrPheTrpValThrGlnSerIleLysGluArgLysMet171517201725LeuAsnGluHisAspPheGluValArgGlyAspValValAsnGlyArg173017351740AsnHisGlnGlyProLysArgAlaArgGluSerGlnAspArgLysIle1745175017551760PheArgGlyLeuGluIleCysCysTyrGlyProPheThrAsnMetPro176517701775ThrAspGlnLeuGluTrpMetValGlnLeuCysGlyAlaSerValVal178017851790LysGluLeuSerSerPheThrLeuGlyThrGlyValHisProIleVal179518001805ValValGlnProAspAlaTrpThrGluAspAsnGlyPheHisAlaIle181018151820GlyGlnMetCysGluAlaProValValThrArgGluTrpValLeuAsp1825183018351840SerValAlaLeuTyrGlnCysGlnGluLeuAspThrTyrLeuIlePro184518501855GlnIleProHisSerHisTyr*1860(2)SEQIDNO3信息(i)序列特征(A)長(zhǎng)度20堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(vii)直接來(lái)源(B)克隆s754A(xi)序列描述SEQIDNO3CTAGCCTGGGCAACAAACGA20(2)SEQIDNO4信息(i)序列特征(A)長(zhǎng)度20堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(vii)直接來(lái)源(B)克隆s754B(xi)序列描述SEQIDNO4GCAGGAAGCAGGAATGGAAC20(2)SEQIDNO5信息(i)序列特征(A)長(zhǎng)度20堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(vii)直接來(lái)源(B)克隆s975A(xi)序列描述SEQIDNO5TAGGAGATGGATTATTGGTG20(2)SEQIDNO6信息(i)序列特征(A)長(zhǎng)度20堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(vii)直接來(lái)源(B)克隆s975B(xi)序列描述SEQIDNO6AGGCAACTTTGCAATGAGTG20(2)SEQIDNO7信息(i)序列特征(A)長(zhǎng)度22堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(vii)直接來(lái)源(B)克隆tdj1474A(xi)序列描述SEQIDNO7CAGAGTGAGACCTTGTCTCAAA22(2)SEQIDNO8信息(i)序列特征(A)長(zhǎng)度23堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(vii)直接來(lái)源(B)克隆tdj1474B(xi)序列描述SEQIDNO8TTCTGCAAACACCTTAAACTCAG23(2)SEQIDNO9信息(i)序列特征(A)長(zhǎng)度20堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(vii)直接來(lái)源(B)克隆tdj1239A(xi)序列描述SEQIDNO9AACCTGGAAGGCAGAGGTTG20(2)SEQIDNO10信息(i)序列特征(A)長(zhǎng)度21堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(vii)直接來(lái)源(B)克隆tdj1239B(xi)序列描述SEQIDNO10TCTGTACCTGCTAAGCAGTGG21(2)SEQIDNO11信息(i)序列特征(A)長(zhǎng)度111堿基對(duì)(B)類型核酸(C)股性雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型cDNA(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(ix)特征(A)名稱/檢索符號(hào)CDS(B)位置2..111(xi)序列描述SEQIDNO11GGKCTTACTCTGTTGTCCCAGCTGGAGTACAGWGTGCGATCATGAG46XaaLeuLeuCysCysProSerTrpSerThrXaaCysAspHisGlu186518701875GCTTACTGTTGCTTGACTCCTAGGCTCAAGCGATCCTATCACCTCAGT94AlaTyrCysCysLeuThrProArgLeuLysArgSerTyrHisLeuSer1880188518901895CTCCAAGTAGCTGGACT111LeuGlnValAlaGly1900(2)SEQIDNO12信息(i)序列特征(A)長(zhǎng)度36氨基酸(B)類型氨基酸(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQIDNO12XaaLeuLeuCysCysProSerTrpSerThrXaaCysAspHisGluAla151015TyrCysCysLeuThrProArgLeuLysArgSerTyrHisLeuSerLeu202530GlnValAlaGly35(2)SEQIDNO13信息(i)序列特征(A)長(zhǎng)度1534堿基對(duì)(B)類型核酸(C)股性雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(iv)反義否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO13GAGGCTAGAGGGCAGGCACTTTATGGCAAACTCAGGTAGAATTCTTCCTCTTCCGTCTCT60TTCCTTTTACGTCATCGGGGAGACTGGGTGGCAATCGCAGCCCGAGAGACGCATGGCTCT120TTCTGCCCTCCATCCTCTGATGTACCTTGATTTCGTATTCTGAGAGGCTGCTGCTTAGCG180GTAGCCCCTTGGTTTCCGTGGCAACGGAAAAGCGCGGGAATTACAGATAAATTAAAACTG240CGACTGCGCGGCGTGAGCTCGCTGAGACTTCCTGGACCCCGCACCAGGCTGTGGGGTTTC300TCAGATAACTGGGCCCCTGCGCTCAGGAGGCCTTCACCCTCTGCTCTGGGTAAAGGTAGT360AGAGTCCCGGGAAAGGGACAGGGGGCCCAAGTGATGCTCTGGGGTACTGGCGTGGGAGAG420TGGATTTCCGAAGCTGACAGATGGGTATTCTTTGACGGGGGGTAGGGGCGGAACCTGAGA480GGCGTAAGGCGTTGTGAACCCTGGGGAGGGGGGCAGTTTGTAGGTCGCGAGGGAAGCGCT540GAGGATCAGGAAGGGGGCACTGAGTGTCCGTGGGGGAATCCTCGTGATAGGAACTGGAAT600ATGCCTTGAGGGGGACACTATGTCTTTAAAAACGTCGGCTGGTCATGAGGTCAGGAGTTC660CAGACCAGCCTGACCAACGTGGTGAAACTCCGTCTCTACTAAAAATACNAAAATTAGCCG720GGCGTGGTGCCGCTCCAGCTACTCAGGAGGCTGAGGCAGGAGAATCGCTAGAACCCGGGA780GGCGGAGGTTGCAGTGAGCCGAGATCGCGCCATTGCACTCCAGCCTGGGCGACAGAGCGA840GACTGTCTCAAAACAAAACAAAACAAAACAAAACAAAAAACACCGGCTGGTATGTATGAG900AGGATGGGACCTTGTGGAAGAAGAGGTGCCAGGAATATGTCTGGGAAGGGGAGGAGACAG960GATTTTGTGGGAGGGAGAACTTAAGAACTGGATCCATTTGCGCCATTGAGAAAGCGCAAG1020AGGGAAGTAGAGGAGCGTCAGTAGTAACAGATGCTGCCGGCAGGGATGTGCTTGAGGAGG1080ATCCAGAGATGAGAGCAGGTCACTGGGAAAGGTTAGGGGCGGGGAGGCCTTGATTGGTGT1140TGGTTTGGTCGTTGTTGATTTTGGTTTTATGCAAGAAAAAGAAAACAACCAGAAACATTG1200GAGAAAGCTAAGGCTACCACCACCTACCCGGTCAGTCACTCCTCTGTAGCTTTCTCTTTC1260TTGGAGAAAGGAAAAGACCCAAGGGGTTGGCAGCGATATGTGAAAAAATTCAGAATTTAT1320GTTGTCTAATTACAAAAAGCAACTTCTAGAATCTTTAAAAATAAAGGACGTTGTCATTAG1380TTCTTCTGGTTTGTATTATTCTAAAACCTTCCAAATCTTCAAATTTACTTTATTTTAAAA1440TGATAAAATGAAGTTGTCATTTTATAAACCTTTTAAAAAGATATATATATATGTTTTTCT1500AATGTGTTAAAGTTCATTGGAACAGAAAGAAATG1534(2)SEQIDNO14信息(i)序列特征(A)長(zhǎng)度1924堿基對(duì)(B)類型核酸(C)股性雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(iv)反義否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO14GAGGCTAGAGGGCAGGCACTTTATGGCAAACTCAGGTAGAATTCTTCCTCTTCCGTCTCT60TTCCTTTTACGTCATCGGGGAGACTGGGTGGCAATCGCAGCCCGAGAGACGCATGGCTCT120TTCTGCCCTCCATCCTCTGATGTACCTTGATTTCGTATTCTGAGAGGCTGCTGCTTAGCG180GTAGCCCCTTGGTTTCCGTGGCAACGGAAAAGCGCGGGAATTACAGATAAATTAAAACTG240CGACTGCGCGGCGTGAGCTCGCTGAGACTTCCTGGACCCCGCACCAGGCTGTGGGGTTTC300TCAGATAACTGGGCCCCTGCGCTCAGGAGGCCTTCACCCTCTGCTCTGGGTAAAGGTAGT360AGAGTCCCGGGAAAGGGACAGGGGGCCCAAGTGATGCTCTGGGGTACTGGCGTGGGAGAG420TGGATTTCCGAAGCTGACAGATGGGTATTCTTTGACGGGGGGTAGGGGCGGAACCTGAGA480GGCGTAAGGCGTTGTGAACCCTGGGGAGGGGGGCAGTTTGTAGGTCGCGAGGGAAGCGCT540GAGGATCAGGAAGGGGGCACTGAGTGTCCGTGGGGGAATCCTCGTGATAGGAACTGGAAT600ATGCCTTGAGGGGGACACTATGTCTTTAAAAACGTCGGCTGGTCATGAGGTCAGGAGTTC660CAGACCAGCCTGACCAACGTGGTGAAACTCCGTCTCTACTAAAAATACNAAAATTAGCCG720GGCGTGGTGCCGCTCCAGCTACTCAGGAGGCTGAGGCAGGAGAATCGCTAGAACCCGGGA780GGCGGAGGTTGCAGTGAGCCGAGATCGCGCCATTGCACTCCAGCCTGGGCGACAGAGCGA840GACTGTCTCAAAACAAAACAAAACAAAACAAAACAAAAAACACCGGCTGGTATGTATGAG900AGGATGGGACCTTGTGGAAGAAGAGGTGCCAGGAATATGTCTGGGAAGGGGAGGAGACAG960GATTTTGTGGGAGGGAGAACTTAAGAACTGGATCCATTTGCGCCATTGAGAAAGCGCAAG1020AGGGAAGTAGAGGAGCGTCAGTAGTAACAGATGCTGCCGGCAGGGATGTGCTTGAGGAGG1080ATCCAGAGATGAGAGCAGGTCACTGGGAAAGGTTAGGGGCGGGGAGGCCTTGATTGGTGT1140TGGTTTGGTCGTTGTTGATTTTGGTTTTATGCAAGAAAAAGAAAACAACCAGAAACATTG1200GAGAAAGCTAAGGCTACCACCACCTACCCGGTCAGTCACTCCTCTGTAGCTTTCTCTTTC1260TTGGAGAAAGGAAAAGACCCAAGGGGTTGGCAGCGATATGTGAAAAAATTCAGAATTTAT1320GTTGTCTAATTACAAAAAGCAACTTCTAGAATCTTTAAAAATAAAGGACGTTGTCATTAG1380TTCTTCTGGTTTGTATTATTCTAAAACCTTCCAAATCTTCAAATTTACTTTATTTTAAAA1440TGATAAAATGAAGTTGTCATTTTATAAACCTTTTAAAAAGATATATATATATGTTTTTCT1500AATGTGTTAAAGTTCATTGGAACAGAAAGAAATGGATTTATCTGCTCTTCGCGTTGAAGA1560AGTACAAAATGTCATTAATGCTATGCAGAAAATCTTAGAGTGTCCCATCTGGTAAGTCAG1620CACAAGAGTGTATTAATTTGGGATTCCTATGATTATCTCCTATGCAAATGAACAGAATTG1680ACCTTACATACTAGGGAAGAAAAGACATGTCTAGTAAGATTAGGCTATTGTAATTGCTGA1740TTTTCTTAACTGAAGAACTTTAAAAATATAGAAAATGATTCCTTGTTCTCCATCCACTCT1800GCCTCTCCCACTCCTCTCCTTTTCAACACAATCCTGTGGTCCGGGAAAGACAGGGCTCTG1860TCTTGATTGGTTCTGCACTGGGCAGGATCTGTTAGATACTGCATTTGCTTTCTCCAGCTC1920TAAA1924(2)SEQIDNO15信息(i)序列特征(A)長(zhǎng)度631堿基對(duì)(B)類型核酸(C)股性雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(iv)反義否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO15AAATGCTGATGATAGTATAGAGTATTGAAGGGATCAATATAATTCTGTTTTGATATCTGA60AAGCTCACTGAAGGTAAGGATCGTATTCTCTGCTGTATTCTCAGTTCCTGACACAGCAGA120CATTTAATAAATATTGAACGAACTTGAGGCCTTATGTTGACTCAGTCATAACAGCTCAAA180GTTGAACTTATTCACTAAGAATAGCTTTATTTTTAAATAAATTATTGAGCCTCATTTATT240TTCTTTTTCTCCCCCCCCTACCCTGCTAGTCTGGAGTTGATCAAGGAACCTGTCTCCACA300AAGTGTGACCACATATTTTGCAAGTAAGTTTGAATGTGTTATGTGGCTCCATTATTAGCT360TTTGTTTTTGTCCTTCATAACCCAGGAAACACCTAACTTTATAGAAGCTTTACTTTCTTC420AATTAAGTGAGAACGAAAATCCAACTCCATTTCATTCTTTCTCAGAGAGTATATAGTTAT480CAAAAGTTGGTTGTAATCATAGTTCCTGGTAAAGTTTTGACATATATTATCTTTTTTTTT540TTTTGAGACAAGTCTCGCTCTGTCGCCCAGGCTGGAGTGCAGTGGCATGAGGCTTGCTCA600CTGCACCTCCGCCCCCGAGTTCAGCGACTCT631(2)SEQIDNO16信息(i)序列特征(A)長(zhǎng)度481堿基對(duì)(B)類型核酸(C)股性雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(iv)反義否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO16TGAGATCTAGACCACATGGTCAAAGAGATAGAATGTGAGCAATAAATGAACCTTAAATTT60TTCAACAGCTACTTTTTTTTTTTTTTTTTGAGACAGGGKCTTACTCTGTTGTCCCAGCTG120GAGTACAGWGTGCGATCATGAGGCTTACTGTTGCTTGACTCCTAGGCTCAAGCGATCCTA180TCACCTCAGTCTCCAAGTAGCTGGACTGTAAGTGCACACCACCATATCCAGCTAAATTTT240GTGTTTTCTGTAGAGACGGGGTTTCGCCATGTTTCCCAGGCTGGTCTTGAACTTTGGGCT300TAACCCGTCTGCCCACCTAGGCATCCCAAAGTGCTAGGATTACAGGTGTGAGTCATCATG360CCTGGCCAGTATTTTAGTTAGCTCTGTCTTTTCAAGTCATATACAAGTTCATTTTCTTTT420AAGTTTAGTTAACAACCTTATATCATGTATTCTTTTCTAGCATAAAGAAAGATTCGAGGC480C481(2)SEQIDNO17信息(i)序列特征(A)長(zhǎng)度522堿基對(duì)(B)類型核酸(C)股性雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(iv)反義否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO17TGTGATCATAACAGTAAGCCATATGCATGTAAGTTCAGTTTTCATAGATCATTGCTTATG60TAGTTTAGGTTTTTGCTTATGCAGCATCCAAAAACAATTAGGAAACTATTGCTTGTAATT120CACCTGCCATTACTTTTTAAATGGCTCTTAAGGGCAGTTGTGAGATTATCTTTTCATGGC180TATTTGCCTTTTGAGTATTCTTTCTACAAAAGGAAGTAAATTAAATTGTTCTTTCTTTCT240TTATAATTTATAGATTTTGCATGCTGAAACTTCTCAACCAGAAGAAAGGGCCTTCACAGT300GTCCTTTATGTAAGAATGATATAACCAAAAGGTATATAATTTGGTAATGATGCTAGGTTG360GAAGCAACCACAGTAGGAAAAAGTAGAAATTATTTAATAACATAGCGTTCCTATAAAACC420ATTCATCAGAAAAATTTATAAAAGAGTTTTTAGCACACAGTAAATTATTTCCAAAGTTAT480TTTCCTGAAAGTTTTATGGGCATCTGCCTTATACAGGTATTG522(2)SEQIDNO18信息(i)序列特征(A)長(zhǎng)度465堿基對(duì)(B)類型核酸(C)股性雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(iv)反義否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO18GGTAGGCTTAAATGAATGACAAAAAGTTACTAAATCACTGCCATCACACGGTTTATACAG60ATGTCAATGATGTATTGATTATAGAGGTTTTCTACTGTTGCTGCATCTTATTTTTATTTG120TTTACATGTCTTTTCTTATTTTAGTGTCCTTAAAAGGTTGATAATCACTTGCTGAGTGTG180TTTCTCAAACAATTTAATTTCAGGAGCCTACAAGAAAGTACGAGATTTAGTCAACTTGTT240GAAGAGCTATTGAAAATCATTTGTGCTTTTCAGCTTGACACAGGTTTGGAGTGTAAGTGT300TGAATATCCCAAGAATGACACTCAAGTGCTGTCCATGAAAACTCAGGAAGTTTGCACAAT360TACTTTCTATGACGTGGTGATAAGACCTTTTAGTCTAGGTTAATTTTAGTTCTGTATCTG420TAATCTATTTTAAAAAATTACTCCCACTGGTCTCACACCTTATTT465(2)SEQIDNO19信息(i)序列特征(A)長(zhǎng)度513堿基對(duì)(B)類型核酸(C)股性雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(iv)反義否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO19AAAAAATCACAGGTAACCTTAATGCATTGTCTTAACACAACAAAGAGCATACATAGGGTT60TCTCTTGGTTTCTTTGATTATAATTCATACATTTTTCTCTAACTGCAAACATAATGTTTT120CCCTTGTATTTTACAGATGCAAACAGCTATAATTTTGCAAAAAAGGAAAATAACTCTCCT180GAACATCTAAAAGATGAAGTTTCTATCATCCAAAGTATGGGCTACAGAAACCGTGCCAAA240AGACTTCTACAGAGTGAACCCGAAAATCCTTCCTTGGTAAAACCATTTGTTTTCTTCTTC300TTCTTCTTCTTCTTTTCTTTTTTTTTTCTTTTTTTTTTTGAGATGGAGTCTTGCTCTGTG360GCCCAGGCTAGAAGCAGTCCTCCTGCCTTAGCCNCCTTAGTAGCTGGGATTACAGGCACG420CGCACCATGCCAGGCTAATTTTTGTATTTTTAGTAGAGACGGGGTTTCATCATGTTGGCC480AGGCTGGTCTCGAACTCCTAACCTCAGGTGATC513(2)SEQIDNO20信息(i)序列特征(A)長(zhǎng)度6769堿基對(duì)(B)類型核酸(C)股性雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(iv)反義否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO20ATGATGGAGATCTTAAAAAGTAATCATTCTGGGGCTGGGCGTAGTAGCTTGCACCTGTAA60TCCCAGCACTTCGGGAGGCTGAGGCAGGCAGATAATTTGAGGTCAGGAGTTTGAGACCAG120CCTGGCCAACATGGTGAAACCCATCTCTACTAAAAATACAAAAATTAGCTGGGTGTGGTG180GCACGTACCTGTAATCCCAGCTACTCGGGAGGCGGAGGCACAAGAATTGCTTGAACCTAG240GACGCGGAGGTTGCAGCGAGCCAAGATCGCGCCACTGCACTCCAGCCTGGGCCGTAGAGT300GAGACTCTGTCTCAAAAAAGAAAAAAAAGTAATTGTTCTAGCTGGGCGCAGTGGCTCTTG360CCTGTAATCCCAGCACTTTGGGAGGCCAAGGCGGGTGGATCTCGAGTCCTAGAGTTCAAG420ACCAGCCTAGGCAATGTGGTGAAACCCCATCGCTACAAAAAATACAAAAATTAGCCAGGC480ATGGTGGCGTGCGCATGTAGTCCCAGCTCCTTGGGAGGCTGAGGTGGGAGGATCACTTGA540ACCCAGGAGACAGAGGTTGCAGTGAACCGAGATCACGCCACCACGCTCCAGCCTGGGCAA600CAGAACAAGACTCTGTCTAAAAAAATACAAATAAAATAAAAGTAGTTCTCACAGTACCAG660CATTCATTTTTCAAAAGATATAGAGCTAAAAAGGAAGGAAAAAAAAAGTAATGTTGGGCT720TTTAAATACTCGTTCCTATACTAAATGTTCTTAGGAGTGCTGGGGTTTTATTGTCATCAT780TTATCCTTTTTAAAAATGTTATTGGCCAGGCACGGTGGCTCATGGCTGTAATCCCAGCAC840TTTGGGAGGCCGAGGCAGGCAGATCACCTGAGGTCAGGAGTGTGAGACCAGCCTGGCCAA900CATGGCGAAACCTGTCTCTACTAAAAATACAAAAATTAACTAGGCGTGGTGGTGTACGCC960TGTAGTCCCAGCTACTCGGGAGGCTGAGGCAGGAGAATCAACTGAACCAGGGAGGTGGAG1020GTTGCAGTGTGCCGAGATCACGCCACTGCACTCTAGCCTGGCAACAGAGCAAGATTCTGT1080CTCAAAAAAAAAAAACATATATACACATATATCCCAAAGTGCTGGGATTACATATATATA1140TATATATATATATTATATATATATATATATATATATGTGATATATATGTGATATATATAT1200AACATATATATATGTAATATATATGTGATATATATATAATATATATATGTAATATATATG1260TGATATATATATATACACACACACACACATATATATGTATGTGTGTGTACACACACACAC1320ACAAATTAGCCAGGCATAGTTGCACACGCTTGGTAGACCCAGCTACTCAGGAGGCTGAGG1380GAGGAGAATCTCTTGAACTTAGGAGGCGGAGGTTGCAGTGAGCTGAGATTGCGCCACTGC1440ACTCCAGCCTGGGTGACAGAGCAGGACTCTGTACACCCCCCAAAACAAAAAAAAAAGTTA1500TCAGATGTGATTGGAATGTATATCAAGTATCAGCTTCAAAATATGCTATATTAATACTTC1560AAAAATTACACAAATAATACATAATCAGGTTTGAAAAATTTAAGACAACMSAARAAAAAA1620WYCMAATCACAMATATCCCACACATTTTATTATTMCTMCTMCWATTATTTTGWAGAGMCT1680GGGTCTCACYCYKTTGCTWATGCTGGTCTTTGAACYCCYKGCCYCAARCARTCCTSCTCC1740ABCCTCCCAARGTGCTGGGGATWATAGGCATGARCTAACCGCACCCAGCCCCAGACATTT1800TAGTGTGTAAATTCCTGGGCATTTTTTCAAGGCATCATACATGTTAGCTGACTGATGATG1860GTCAATTTATTTTGTCCATGGTGTCAAGTTTCTCTTCAGGAGGAAAAGCACAGAACTGGC1920CAACAATTGCTTGACTGTTCTTTACCATACTGTTTAGCAGGAAACCAGTCTCAGTGTCCA1980ACTCTCTAACCTTGGAACTGTGAGAACTCTGAGGACAAAGCAGCGGATACAACCTCAAAA2040GACGTCTGTCTACATTGAATTGGGTAAGGGTCTCAGGTTTTTTAAGTATTTAATAATAAT2100TGCTGGATTCCTTATCTTATAGTTTTGCCAAAAATCTTGGTCATAATTTGTATTTGTGGT2160AGGCAGCTTTGGGAAGTGAATTTTATGAGCCCTATGGTGAGTTATAAAAAATGTAAAAGA2220CGCAGTTCCCACCTTGAAGAATCTTACTTTAAAAAGGGAGCAAAAGAGGCCAGGCATGGT2280GGCTCACACCTGTAATCCCAGCACTTTGGGAGGCCAAAGTGGGTGGATCACCTGAGGTCG2340GGAGTTCGAGACCAGCCTAGCCAACATGGAGAAACTCTGTCTGTACCAAAAAATAAAAAA2400TTAGCCAGGTGTGGTGGCACATAACTGTAATCCCAGCTACTCGGGAGGCTGAGGCAGGAG2460AATCACTTGAACCCGGGAGGTGGAGGTTGCGGTGAACCGAGATCGCACCATTGCACTCCA2520GCCTGGGCAAAAATAGCGAAACTCCATCTAAAAAAAAAAAAGAGAGCAAAAGAAAGAMTM2580TCTGGTTTTAAMTMTGTGTAAATATGTTTTTGGAAAGATGGAGAGTAGCAATAAGAAAAA2640ACATGATGGATTGCTACAGTATTTAGTTCCAAGATAAATTGTACTAGATGAGGAAGCCTT2700TTAAGAAGAGCTGAATTGCCAGGCGCAGTGGCTCACGCCTGTAATCCCAGCACTTTGGGA2760GGCCGAGGTGGGCGGATCACCTGAGGTCGGGAGTTCAAGACCAGCCTGACCAACATGGAG2820AAACCCCATCTCTACTAAAAAAAAAAAAAAAAAAATTAGCCGGGGTGGTGGCTTATGCCT2880GTAATCCCAGCTACTCAGGAGGCTGAGGCAGGAGAATCGCTTGAACCCAGGAAGCAGAGG2940TTGCAGTGAGCCAAGATCGCACCATTGCACTCCAGCCTAGGCAACAAGAGTGAAACTCCA3000TCTCAAAAAAAAAAAAAAAGAGCTGAATCTTGGCTGGGCAGGATGGCTCGTGCCTGTAAT3060CCTAACGCTTTGGAAGACCGAGGCAGAAGGATTGGTTGAGTCCACGAGTTTAAGACCAGC3120CTGGCCAACATAGGGGAACCCTGTCTCTATTTTTAAAATAATAATACATTTTTGGCCGGT3180GCGGTGGCTCATGCCTGTAATCCCAATACTTTGGGAGGCTGAGGCAGGTAGATCACCTGA3240GGTCAGAGTTCGAGACCAGCCTGGATAACCTGGTGAAACCCCTCTTTACTAAAAATACAA3300AAAAAAAAAAAAATTAGCTGGGTGTGGTAGCACATGCTTGTAATCCCAGCTACTTGGGAG3360GCTGAGGCAGGAGAATCGCTTGAACCAGGGAGGCGGAGGTTACAATGAGCCAACACTACA3420CCACTGCACTCCAGCCTGGGCAATAGAGTGAGACTGCATCTCAAAAAAATAATAATTTTT3480AAAAATAATAAATTTTTTTAAGCTTATAAAAAGAAAAGTTGAGGCCAGCATAGTAGCTCA3540CATCTGTAATCTCAGCAGTGGCAGAGGATTGCTTGAAGCCAGGAGTTTGAGACCAGCCTG3600GGCAACATAGCAAGACCTCATCTCTACAAAAAAATTTCTTTTTTAAATTAGCTGGGTGTG3660GTGGTGTGCATCTGTAGTCCCAGCTACTCAGGAGGCAGAGGTGAGTGGATACATTGAACC3720CAGGAGTTTGAGGCTGTAGTGAGCTATGATCATGCCACTGCACTCCAACCTGGGTGACAG3780AGCAAGACCTCCAAAAAAAAAAAAAAAAGAGCTGCTGAGCTCAGAATTCAAACTGGGCTC3840TCAAATTGGATTTTCTTTTAGAATATATTTATAATTAAAAAGGATAGCCATCTTTTGAGC3900TCCCAGGCACCACCATCTATTTATCATAACACTTACTGTTTTCCCCCCTTATGATCATAA3960ATTCCTAGACAACAGGCATTGTAAAAATAGTTATAGTAGTTGATATTTAGGAGCACTTAA4020CTATATTCCAGGCACTATTGTGCTTTTCTTGTATAACTCATTAGATGCTTGTCAGACCTC4080TGAGATTGTTCCTATTATACTTATTTTACAGATGAGAAAATTAAGGCACAGAGAAGTTAT4140GAAATTTTTCCAAGGTATTAAACCTAGTAAGTGGCTGAGCCATGATTCAAACCTAGGAAG4200TTAGATGTCAGAGCCTGTGCTTTTTTTTTGTTTTTGTTTTTGTTTTCAGTAGAAACGGGG4260GTCTCACTTTGTTGGCCAGGCTGGTCTTGAACTCCTAACCTCAAATAATCCACCCATCTC4320GGCCTCCTCAAGTGCTGGGATTACAGGTGAGAGCCACTGTGCCTGGCGAAGCCCATGCCT4380TTAACCACTTCTCTGTATTACATACTAGCTTAACTAGCATTGTACCTGCCACAGTAGATG4440CTCAGTAAATATTTCTAGTTGAATATCTGTTTTTCAACAAGTACATTTTTTTAACCCTTT4500TAATTAAGAAAACTTTTATTGATTTATTTTTTGGGGGGAAATTTTTTAGGATCTGATTCT4560TCTGAAGATACCGTTAATAAGGCAACTTATTGCAGGTGAGTCAAAGAGAACCTTTGTCTA4620TGAAGCTGGTATTTTCCTATTTAGTTAATATTAAGGATTGATGTTTCTCTCTTTTTAAAA4680ATATTTTAACTTTTATTTTAGGTTCAGGGATGTATGTGCAGTTTGTTATATAGGTAAACA4740CACGACTTGGGATTTGGTGTATAGATTTTTTTCATCATCCGGGTACTAAGCATACCCCAC4800AGTTTTTTGTTTGCTTTCTTTCTGAATTTCTCCCTCTTCCCACCTTCCTCCCTCAAGTAG4860GCTGGTGTTTCTCCAGACTAGAATCATGGTATTGGAAGAAACCTTAGAGATCATCTAGTT4920TAGTTCTCTCATTTTATAGTGGAGGAAATACCCTTTTTGTTTGTTGGATTTAGTTATTAG4980CACTGTCCAAAGGAATTTAGGATAACAGTAGAACTCTGCACATGCTTGCTTCTAGCAGAT5040TGTTCTCTAAGTTCCTCATATACAGTAATATTGACACAGCAGTAATTGTGACTGATGAAA5100ATGTTCAAGGACTTCATTTTCAACTCTTTCTTTCCTCTGTTCCTTATTTCCACATATCTC5160TCAAGCTTTGTCTGTATGTTATATAATAAACTACAAGCAACCCCAACTATGTTACCTACC5220TTCCTTAGGAATTATTGCTTGACCCAGGTTTTTTTTTTTTTTTTTTTGGAGACGGGGTCT5280TGCCCTGTTGCCAGGATGGAGTGTAGTGGCGCCATCTCGGCTCACTGCAATCTCCAACTC5340CCTGGTTCAAGCGATTCTCCTGTCTCAATCTCACGAGTAGCTGGGACTACAGGTATACAC5400CACCACGCCCGGTTAATTGACCATTCCATTTCTTTCTTTCTCTCTTTTTTTTTTTTTTTT5460TTGAGACAGAGTCTTGCTCTGTTGCCCAGGCTGGAGTACAGAGGTGTGATCTCACCTCTC5520CGCAACGTCTGCCTCCCAGGTTGAAGCCATACTCCTGCCTCAGCCTCTCTAGTAGCTGGG5580ACTACAGGCGCGCGCCACCACACCCGGCTAATTTTTGTATTTTTAGTAGAGATGGGGTTT5640CACCATGTTGGCCAGGCTGGTCTTGAACTCATGACCTCAAGTGGTCCACCCGCCTCAGCC5700TCCCAAAGTGCTGGAATTACAGGCTTGAGCCACCGTGCCCAGCAACCATTTCATTTCAAC5760TAGAAGTTTCTAAAGGAGAGAGCAGCTTTCACTAACTAAATAAGATTGGTCAGCTTTCTG5820TAATCGAAAGAGCTAAAATGTTTGATCTTGGTCATTTGACAGTTCTGCATACATGTAACT5880AGTGTTTCTTATTAGGACTCTGTCTTTTCCCTATAGTGTGGGAGATCAAGAATTGTTACA5940AATCACCCCTCAAGGAACCAGGGATGAAATCAGTTTGGATTCTGCAAAAAAGGGTAATGG6000CAAAGTTTGCCAACTTAACAGGCACTGAAAAGAGAGTGGGTAGATACAGTACTGTAATTA6060GATTATTCTGAAGACCATTTGGGACCTTTACAACCCACAAAATCTCTTGGCAGAGTTAGA6120GTATCATTCTCTGTCAAATGTCGTGGTATGGTCTGATAGATTTAAATGGTACTAGACTAA6180TGTACCTATAATAAGACCTTCTTGTAACTGATTGTTGCCCTTTCGCTTTTTTTTTTGTTT6240GTTTGTTTGTTTTTTTTTGAGATGGGGTCTCACTCTGTTGCCCAGGCTGGAGTGCAGTGA6300TGCAATCTTGGCTCACTGCAACCTCCACCTCCAAAGGCTCAAGCTATCCTCCCACTTCAG6360CCTCCTGAGTAGCTGGGACTACAGGCGCATGCCACCACACCCGGTTAATTTTTTGTGGTT6420TTATAGAGATGGGGTTTCACCATGTTACCGAGGCTGGTCTCAAACTCCTGGACTCAAGCA6480GTCTGCCCACTTCAGCCTCCCAAAGTGCTGCAGTTACAGGCTTGAGCCACTGTGCCTGGC6540CTGCCCTTTACTTTTAATTGGTGTATTTGTGTTTCATCTTTTACCTACTGGTTTTTAAAT6600ATAGGGAGTGGTAAGTCTGTAGATAGAACAGAGTATTAAGTAGACTTAATGGCCAGTAAT6660CTTTAGAGTACATCAGAACCAGTTTTCTGATGGCCAATCTGCTTTTAATTCACTCTTAGA6720CGTTAGAGAAATAGGTGTGGTTTCTGCATAGGGAAAATTCTGAAATTAA6769(2)SEQIDNO21信息(i)序列特征(A)長(zhǎng)度4249堿基對(duì)(B)類型核酸(C)股性雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(iv)反義否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO21GATCCTAAGTGGAAATAATCTAGGTAAATAGGAATTAAATGAAAGAGTATGAGCTACATC60TTCAGTATACTTGGTAGTTTATGAGGTTAGTTTCTCTAATATAGCCAGTTGGTTGATTTC120CACCTCCAAGGTGTATGAAGTATGTATTTTTTTAATGACAATTCAGTTTTTGAGTACCTT180GTTATTTTTGTATATTTTCAGCTGCTTGTGAATTTTCTGAGACGGATGTAACAAATACTG240AACATCATCAACCCAGTAATAATGATTTGAACACCACTGAGAAGCGTGCAGCTGAGAGGC300ATCCAGAAAAGTATCAGGGTAGTTCTGTTTCAAACTTGCATGTGGAGCCATGTGGCACAA360ATACTCATGCCAGCTCATTACAGCATGAGAACAGCAGTTTATTACTCACTAAAGACAGAA420TGAATGTAGAAAAGGCTGAATTCTGTAATAAAAGCAAACAGCCTGGCTTAGCAAGGAGCC480AACATAACAGATGGGCTGGAAGTAAGGAAACATGTAATGATAGGCGGACTCCCAGCACAG540AAAAAAAGGTAGATCTGAATGCTGATCCCCTGTGTGAGAGAAAAGAATGGAATAAGCAGA600AACTGCCATGCTCAGAGAATCCTAGAGATACTGAAGATGTTCCTTGGATAACACTAAATA660GCAGCATTCAGAAAGTTAATGAGTGGTTTTCCAGAAGTGATGAACTGTTAGGTTCTGATG720ACTCACATGATGGGGAGTCTGAATCAAATGCCAAAGTAGCTGATGTATTGGACGTTCTAA780ATGAGGTAGATGAATATTCTGGTTCTTCAGAGAAAATAGACTTACTGGCCAGTGATCCTC840ATGAGGCTTTAATATGTAAAAGTGAAAGAGTTCACTCCAAATCAGTAGAGAGTAATATTG900AAGGCCAAATATTTGGGAAAACCTATCGGAAGAAGGCAAGCCTCCCCAACTTAAGCCATG960TAACTGAAAATCTAATTATAGGAGCATTTGTTACTGAGCCACAGATAATACAAGAGCGTC1020CCCTCACAAATAAATTAAAGCGTAAAAGGAGACCTACATCAGGCCTTCATCCTGAGGATT1080TTATCAAGAAAGCAGATTTGGCAGTTCAAAAGACTCCTGAAATGATAAATCAGGGAACTA1140ACCAAACGGAGCAGAATGGTCAAGTGATGAATATTACTAATAGTGGTCATGAGAATAAAA1200CAAAAGGTGATTCTATTCAGAATGAGAAAAATCCTAACCCAATAGAATCACTCGAAAAAG1260AATCTGCTTTCAAAACGAAAGCTGAACCTATAAGCAGCAGTATAAGCAATATGGAACTCG1320AATTAAATATCCACAATTCAAAAGCACCTAAAAAGAATAGGCTGAGGAGGAAGTCTTCTA1380CCAGGCATATTCATGCGCTTGAACTAGTAGTCAGTAGAAATCTAAGCCCACCTAATTGTA1440CTGAATTGCAAATTGATAGTTGTTCTAGCAGTGAAGAGATAAAGAAAAAAAAGTACAACC1500AAATGCCAGTCAGGCACAGCAGAAACCTACAACTCATGGAAGGTAAAGAACCTGCAACTG1560GAGCCAAGAAGAGTAACAAGCCAAATGAACAGACAAGTAAAAGACATGACAGCGATACTT1620TCCCAGAGCTGAAGTTAACAAATGCACCTGGTTCTTTTACTAAGTGTTCAAATACCAGTG1680AACTTAAAGAATTTGTCAATCCTAGCCTTCCAAGAGAAGAAAAAGAAGAGAACTAGAAAC1740AGTTAAAGTGTCTAATAATGCTGAAGACCCCAAAGATCTCATGTTAAGTGGAGAAAGGGT1800TTTGCAAACTGAAAGATCTGTAGAGAGTAGCAGTATTTCATTGGTACCTGGTACTGATTA1860TGGCACTCAGGAAAGTATCTCGTTACTGGAAGTTAGCACTCTAGGGAAGGCAAAAACAGA1920ACCAAATAAATGTGTGAGTCAGTGTGCAGCATTTGAAAACCCCAAGGGACTAATTCATGG1980TTGTTCCAAAGATAATAGAAATGACACAGAAGGCTTTAAGTATCCATTGGGACATGAAGT2040TAACCACAGTCGGGAAACAAGCATAGAAATGGAAGAAAGTGAACTTGATGCTCAGTATTT2100GCAGAATACATTCAAGGTTTCAAAGCGCCAGTCATTTGCTCCGTTTTCAAATCCAGGAAA2160TGCAGAAGAGGAATGTGCAACATTCTCTGCCCACTCTGGGTCCTTAAAGAAACAAAGTCC2220AAAAGTCACTTTTGAATGTGAACAAAAGGAAGAAAATCAAGGAAAGAATGAGTCTAATAT2280CAAGCCTGTACAGACAGTTAATATCACTGCAGGCTTTCCTGTGGTTGGTCAGAAAGATAA2340GCCAGTTGATAATGCCAAATGTAGTATCAAAGGAGGCTCTAGGTTTTGTCTATCATCTCA2400GTTCAGAGGCAACGAAACTGGACTCATTACTCCAAATAAACATGGACTTTTACAAAACCC2460ATATCGTATACCACCACTTTTTCCCATCAAGTCATTTGTTAAAACTAAATGTAAGAAAAA2520TCTGCTAGAGGAAAACTTTGAGGAACATTCAATGTCACCTGAAAGAGAAATGGGAAATGA2580GAACATTCCAAGTACAGTGAGCACAATTAGCCGTAATAACATTAGAGAAAATGTTTTTAA2640AGAAGCCAGCTCAAGCAATATTAATGAAGTAGGTTCCAGTACTAATGAAGTGGGCTCCAG2700TATTAATGAAATAGGTTCCAGTGATGAAAACATTCAAGCAGAACTAGGTAGAAACAGAGG2760GCCAAAATTGAATGCTATGCTTAGATTAGGGGTTTTGCAACCTGAGGTCTATAAACAAAG2820TCTTCCTGGAAGTAATTGTAAGCATCCTGAAATAAAAAAGCAAGAATATGAAGAAGTAGT2880TCAGACTGTTAATACAGATTTCTCTCCATATCTGATTTCAGATAACTTAGAACAGCCTAT2940GGGAAGTAGTCATGCATCTCAGGTTTGTTCTGAGACACCTGATGACCTGTTAGATGATGG3000TGAAATAAAGGAAGATACTAGTTTTGCTGAAAATGACATTAAGGAAAGTTCTGCTGTTTT3060TAGCAAAAGCGTCCAGAAAGGAGAGCTTAGCAGGAGTCCTAGCCCTTTCACCCATACACA3120TTTGGCTCAGGGTTACCGAAGAGGGGCCAAGAAATTAGAGTCCTCAGAAGAGAACTTATC3180TAGTGAGGATGAAGAGCTTCCCTGCTTCCAACACTTGTTATTTGGTAAAGTAAACAATAT3240ACCTTCTCAGTCTACTAGGCATAGCACCGTTGCTACCGAGTGTCTGTCTAAGAACACAGA3300GGAGAATTTATTATCATTGAAGAATAGCTTAAATGACTGCAGTAACCAGGTAATATTGGC3360AAAGGCATCTCAGGAACATCACCTTAGTGAGGAAACAAAATGTTCTGCTAGCTTGTTTTC3420TTCACAGTGCAGTGAATTGGAAGACTTGACTGCAAATACAAACACCCAGGATCCTTTCTT3480GATTGGTTCTTCCAAACAAATGAGGCATCAGTCTGAAAGCCAGGGAGTTGGTCTGAGTGA3540CAAGGAATTGGTTTCAGATGATGAAGAAAGAGGAACGGGCTTGGAAGAAAATAATCAAGA3600AGAGCAAAGCATGGATTCAAACTTAGGTATTGGAACCAGGTTTTTGTGTTTGCCCCAGTC3660TATTTATAGAAGTGAGCTAAATGTTTATGCTTTTGGGGAGCACATTTTACAAATTTCCAA3720GTATAGTTAAAGGAACTGCTTCTTAAACTTGAAACATGTTCCTCCTAAGGTGCTTTTCAT3780AGAAAAAAGTCCTTCACACAGCTAGGACGTCATCTTTGACTGAATGAGCTTTAACATCCT3840AATTACTGGTGGACTTACTTCTGGTTTCATTTTATAAAGCAAATCCCGGTGTCCCAAAGC3900AAGGAATTTAATCATTTTGTGTGACATGAAAGTAAATCCAGTCCTGCCAATGAGAAGAAA3960AAGACACAGCAAGTTGCAGCGTTTATAGTCTGCTTTTACATCTGAACCTCTGTTTTTGTT4020ATTTAAGGTGAAGCAGCATCTGGGTGTGAGAGTGAAACAAGCGTCTCTGAAGACTGCTCA4080GGGCTATCCTCTCAGAGTGACATTTTAACCACTCAGGTAAAAAGCGTGTGTGTGTGTGCA4140CATGCGTGTGTGTGGTGTCCTTTGCATTCAGTAGTATGTATCCCACATTCTTAGGTTTGC4200TGACATCATCTCTTTGAATTAATGGCACAATTGTTTGTGGTTCATTGTC4249(2)SEQIDNO22信息(i)序列特征(A)長(zhǎng)度710堿基對(duì)(B)類型核酸(C)股性雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(iv)反義否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO22NGNGAATGTAATCCTAATATTTCNCNCCNACTTAAAAGAATACCACTCCAANGGCATCNC60AATACATCAATCAATTGGGGAATTGGGATTTTCCCTCNCTAACATCANTGGAATAATTTC120ATGGCATTAATTGCATGAATGTGGTTAGATTAAAAGGTGTTCATGCTAGAACTTGTAGTT180CCATACTAGGTGATTTCAATTCCTGTGCTAAAATTAATTTGTATGATATATTNTCATTTA240ATGGAAAGCTTCTCAAAGTATTTCATTTTCTTGGTACCATTTATCGTTTTTGAAGCAGAG300GGATACCATGCAACATAACCTGATAAAGCTCCAGCAGGAAATGGCTGAACTAGAAGCTGT360GTTAGAACAGCATGGGAGCCAGCCTTCTAACAGCTACCCTTCCATCATAAGTGACTCTTC420TGCCCTTGAGGACCTGCGAAATCCAGAACAAAGCACATCAGAAAAAGGTGTGTATTGTTG480GCCAAACACTGATATCTTAAGCAAAATTCTTTCCTTCCCCTTTATCTCCTTCTGAAGAGT540AAGGACCTAGCTCCAACATTTTATGATCCTTGCTCAGCACATGGGTAATTATGGAGCCTT600GGTTCTTGTCCCTGCTCACAACTAATATACCAGTCAGAGGGACCCAAGGCAGTCATTCAT660GTTGTCATCTGAGATACCTACAACAAGTAGATGCTATGGGGAGCCCATGG710(2)SEQIDNO23信息(i)序列特征(A)長(zhǎng)度473堿基對(duì)(B)類型核酸(C)股性雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(iv)反義否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO23CCATTGGTGCTAGCATCTGTCTGTTGCATTGCTTGTGTTTATAAAATTCTGCCTGATATA60CTTGTTAAAAACCAATTTGTGTATCATAGATTGATGCTTTTGAAAAAAATCAGTATTCTA120ACCTGAATTATCACTATCAGAACAAAGCAGTAAAGTAGATTTGTTTTCTCATTCCATTTA180AAGCAGTATTAACTTCACAGAAAAGTAGTGAATACCCTATAAGCCAGAATCCAGAAGGCC240TTTCTGCTGACAAGTTTGAGGTGTCTGCAGATAGTTCTACCAGTAAAAATAAAGAACCAG300GAGTGGAAAGGTAAGAAACATCAATGTAAAGATGCTGTGGTATCTGACATCTTTATTTAT360ATTGAACTCTGATTGTTAATTTTTTTCACCATACTTTCTCCAGTTTTTTTGCATACAGGC420ATTTATACACTTTTATTGCTCTAGGATACTTCTTTTGTTTAATCCTATATAGG473(2)SEQIDNO24信息(i)序列特征(A)長(zhǎng)度421堿基對(duì)(B)類型核酸(C)股性雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(iv)反義否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO24GGATAAGNTCAAGAGATATTTTGATAGGTGATGCAGTGATNAATTGNGAAAATTTNCTGC60CTGCTTTTAATCTTCCCCCGTTCTTTCTTCCTNCCTCCCTCCCTTCCTNCCTCCCGTCCT120TNCCTTTCCTTTCCCTCCCTTCCNCCTTCTTTCCNTCTNTCTTTCCTTTCTTTCCTGTCT180ACCTTTCTTTCCTTCCTCCCTTCCTTTTCTTTTCTTTCTTTCCTTTCCTTTTCTTTCCTT240TCTTTCCTTTCCTTTCTTTCTTGACAGAGTCTTGCTCTGTCACTCAGGCTGGAGTGCAGT300GGCGTGATCTCGNCTCACTGCAACCTCTGTCTCCCAGGTTCAAGCAATTTTCCTGCCTCA360GCCTCCCGAGTAGCTGAGATTACAGGCGCCAGCCACCACACCCAGCTACTGACCTGCTTT420T421(2)SEQIDNO25信息(i)序列特征(A)長(zhǎng)度997堿基對(duì)(B)類型核酸(C)股性雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(iv)反義否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO25AAACAGCTGGGAGATATGGTGCCTCAGACCAACCCCATGTTATATGTCAACCCTGACATA60TTGGCAGGCAACATGAATCCAGACTTCTAGGCTGTCATGCGGGCTCTTTTTTGCCAGTCA120TTTCTGATCTCTCTGACATGAGCTGTTTCATTTATGCTTTGGCTGCCCAGCAAGTATGAT180TTGTCCTTTCACAATTGGTGGCGATGGTTTTCTCCTTCCATTTATCTTTCTAGGTCATCC240CCTTCTAAATGCCCATCATTAGATGATAGGTGGTACATGCACAGTTGCTCTGGGAGTCTT300CAGAATAGAAACTACCCATCTCAAGAGGAGCTCATTAAGGTTGTTGATGTGGAGGAGCAA360CAGCTGGAAGAGTCTGGGCCACACGATTTGACGGAAACATCTTACTTGCCAAGGCAAGAT420CTAGGTAATATTTCATCTGCTGTATTGGAACAAACACTYTGATTTTACTCTGAATCCTAC480ATAAAGATATTCTGGTTAACCAACTTTTAGATGTACTAGTCTATCATGGACACTTTTGTT540ATACTTAATTAAGCCCACTTTAGAAAAATAGCTCAAGTGTTAATCAAGGTTTACTTGAAA600ATTATTGAAACTGTTAATCCATCTATATTTTAATTAATGGTTTAACTAATGATTTTGAGG660ATGWGGGAGTCKTGGTGTACTCTAMATGTATTATTTCAGGCCAGGCATAGTGGCTCACGC720CTGGTAATCCCAGTAYYCMRGAGCCCGAGGCAGGTGGAGCCAGCTGAGGTCAGGAGTTCA780AGACCTGTCTTGGCCAACATGGGNGAAACCCTGTCTTCTTCTTAAAAAANACAAAAAAAA840TTAACTGGGTTGTGCTTAGGTGNATGCCCCGNATCCTAGTTNTTCTTGNGGGTTGAGGGA900GGAGATCACNTTGGACCCCGGAGGGGNGGGTGGGGGNGAGCAGGNCAAAACACNGACCCA960GCTGGGGTGGAAGGGAAGCCCACTCNAAAAAANNTTN997(2)SEQIDNO26信息(i)序列特征(A)長(zhǎng)度639堿基對(duì)(B)類型核酸(C)股性雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(iv)反義否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO26TTTTTAGGAAACAAGCTACTTTGGATTTCCACCAACACCTGTATTCATGTACCCATTTTT60CTCTTAACCTAACTTTATTGGTCTTTTTAATTCTTAACAGAGACCAGAACTTTGTAATTC120AACATTCATCGTTGTGTAAATTAAACTTCTCCCATTCCTTTCAGAGGGAACCCCTTACCT180GGAATCTGGAATCAGCCTCTTCTCTGATGACCCTGAATCTGATCCTTCTGAAGACAGAGC240CCCAGAGTCAGCTCGTGTTGGCAACATACCATCTTCAACCTCTGCATTGAAAGTTCCCCA300ATTGAAAGTTGCAGAATCTGCCCAGAGTCCAGCTGCTGCTCATACTACTGATACTGCTGG360GTATAATGCAATGGAAGAAAGTGTGAGCAGGGAGAAGCCAGAATTGACAGCTTCAACAGA420AAGGGTCAACAAAAGAATGTCCATGGTGGTGTCTGGCCTGACCCCAGAAGAATTTGTGAG480TGTATCCATATGTATCTCCCTAATGACTAAGACTTAACAACATTCTGGAAAGAGTTTTAT540GTAGGTATTGTCAATTAATAACCTAGAGGAAGAAATCTAGAAAACAATCACAGTTCTGTG600TAATTTAATTTCGATTACTAATTTCTGAAAATTTAGAAY639(2)SEQIDNO27信息(i)序列特征(A)長(zhǎng)度922堿基對(duì)(B)類型核酸(C)股性雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(iv)反義否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO27NCCCNNCCCCCNAATCTGAAATGGGGGTAACCCCCCCCCAACCGANACNTGGGTNGCNTA60GAGANTTTAATGGCCCNTTCTGAGGNACANAAGCTTAAGCCAGGNGACGTGGANCNATGN120GTTGTTTNTTGTTTGGTTACCTCCAGCCTGGGTGACAGAGCAAGACTCTGTCTAAAAAAA180AAAAAAAAAAAAATCGACTTTAAATAGTTCCAGGACACGTGTAGAACGTGCAGGATTGCT240ACGTAGGTAAACATATGCCATGGTGGGATAACTAGTATTCTGAGCTGTGTGCTAGAGGTA300ACTCATGATAATGGAATATTTGATTTAATTTCAGATGCTCGTGTACAAGTTTGCCAGAAA360ACACCACATCACTTTAACTAATCTAATTACTGAAGAGACTACTCATGTTGTTATGAAAAC420AGGTATACCAAGAACCTTTACAGAATACCTTGCATCTGCTGCATAAAACCACATGAGGCG480AGGCACGGTGGCGCATGCCTGTAATCGCAGCACTTTGGGAGGCCGAGGCGGGCAGATCAC540GAGATTAGGAGATCGAGACCATCCTGGCCAGCATGGTGAAACCCCGTCTCTACTANNAAA600TGGNAAAATTANCTGGGTGTGGTCGCGTGCNCCTGTAGTCCCAGCTACTCGTGAGGCTGA660GGCAGGAGAATCACTTGAACCGGGGAAATGGAGGTTTCAGTGAGCAGAGATCATNCCCCT720NCATTCCAGCCTGGCGACAGAGCAAGGCTCCGTCNCCNAAAAAATAAAAAAAAACGTGAA780CAAATAAGAATATTTGTTGAGCATAGCATGGATGATAGTCTTCTAATAGTCAATCAATTA840CTTTATGAAAGACAAATAATAGTTTTGCTGCTTCCTTACCTCCTTTTGTTTTGGGTTAAG900ATTTGGAGTGTGGGCCAGGCAC922(2)SEQIDNO28信息(i)序列特征(A)長(zhǎng)度867堿基對(duì)(B)類型核酸(C)股性雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(iv)反義否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO28GATCTATAGCTAGCCTTGGCGTCTAGAAGATGGGTGTTGAGAAGAGGGAGTGGAAAGATA60TTTCCTCTGGTCTTAACTTCATATCAGCCTCCCCTAGACTTCCAAATATCCATACCTGCT120GGTTATAATTAGTGGTGTTTTCAGCCTCTGATTCTGTCACCAGGGGTTTTAGAATCATAA180ATCCAGATTGATCTTGGGAGTGTAAAAAACTGAGGCTCTTTAGCTTCTTAGGACAGCACT240TCCTGATTTTGTTTTCAACTTCTAATCCTTTGAGTGTTTTTCATTCTGCAGATGCTGAGT300TTGTGTGTGAACGGACACTGAAATATTTTCTAGGAATTGCGGGAGGAAAATGGGTAGTTA360GCTATTTCTGTAAGTATAATACTATTTCTCCCCTCCTCCCTTTAACACCTCAGAATTGCA420TTTTTACACCTAACATTTAACACCTAAGGTTTTTGCTGATGCTGAGTCTGAGTTACCAAA480AGGTCTTTAAATTGTAATACTAAACTACTTTTATCTTTAATATCACTTTGTTCAAGATAA540GCTGGTGATGCTGGGAAAATGGGTCTCTTTTATAACTAATAGGACCTAATCTGCTCCTAG600CAATGTTAGCATATGAGCTAGGGATTTATTTAATAGTCGGCAGGAATCCATGTGCARCAG660NCAAACTTATAATGTTTAAATTAAACATCAACTCTGTCTCCAGAAGGAAACTGCTGCTAC720AAGCCTTATTAAAGGGCTGTGGCTTTAGAGGGAAGGACCTCTCCTCTGTCATTCTTCCTG780TGCTCTTTTGTGAATCGCTGACCTCTCTATCTCCGTGAAAAGAGCACGTTCTTCTGCTGT840ATGTAACCTGTCTTTTCTATGATCTCT867(2)SEQIDNO29信息(i)序列特征(A)長(zhǎng)度561堿基對(duì)(B)類型核酸(C)股性雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(iv)反義否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO29NAAAAACGGGGNNGGGANTGGGCCTTAAANCCAAAGGGCNAACTCCCCAACCATTNAAAA60ANTGACNGGGGATTATTAAAANCGGCGGGAAACATTTCACNGCCCAACTAATATTGTTAA120ATTAAAACCACCACCNCTGCNCCAAGGAGGGAAACTGCTGCTACAAGCCTTATTAAAGGG180CTGTGGCTTTAGAGGGAAGGACCTCTCCTCTGTCATTCTTCCTGTGCTCTTTTGTGAATC240GCTGACCTCTCTATGTCCGTGAAAAGAGCACGTTCTTCGTCTGTATGTAACCTGTCTTTT300CTATGATCTCTTTAGGGGTGACCCAGTCTATTAAAGAAAGAAAAATGCTGAATGAGGTAA360GTACTTGATGTTACAAACTAACCAGAGATATTCATTCAGTCATATAGTTAAAAATGTATT420TGCTTCCTTCCATCAATGCACCACTTTCCTTAACAATGCACAAATTTTCCATGATAATGA480GGATCATCAAGAATTATGCAGGCCTGCACTGTGGCTCATACCTATAATCCCAGCGCTTTG540GGAGGCTGAGGCGCTTGGATC561(2)SEQIDNO30信息(i)序列特征(A)長(zhǎng)度567堿基對(duì)(B)類型核酸(C)股性雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(iv)反義否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO30AATTTTTTGTATTTTTAGTAGAGATGAGGTTCACCATGTTGGTCTAGATCTGGTGTCGAA60CGTCCTGACCTCAAGTGATCTGCCAGCCTCAGTCTCCCAAAGTGCTAGGATTACAGGGGT120GAGCCACTGCGCCTGGCCTGAATGCCTAAAATATGACGTGTCTGCTCCACTTCCATTGAA180GGAAGCTTCTCTTTCTCTTATCCTGATGGGTTGTGTTTGGTTTCTTTCAGCATGATTTTG240AAGTCAGAGGAGATGTGGTCAATGGAAGAAACCACCAAGGTCCAAAGCGAGCAAGAGAAT300CCCAGGACAGAAAGGTAAAGCTCCCTCCCTCAAGTTGACAAAAATCTCACCCCACCACTC360TGTATTCCACTCCCCTTTGCAGAGATGGGCCGCTTCATTTTGTAAGACTTATTACATACA420TACACAGTGCTAGATACTTTCACACAGGTTCTTTTTTCACTCTTCCATCCCAACCACATA480AATAAGTATTGTCTCTACTTTATGAATGATAAAACTAAGAGATTTAGAGAGGCTGTGTAA540TTTGGATTCCCGTCTCGGGTTCAGATC567(2)SEQIDNO31信息(i)序列特征(A)長(zhǎng)度633堿基對(duì)(B)類型核酸(C)股性雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(iv)反義否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO31TTGGCCTGATTGGTGACAAAAGTGAGATGCTCAGTCCTTGAATGACAAAGAATGCCTGTA60GAGTTGCAGGTCCAACTACATATGCACTTCAAGAAGATCTTCTGAAATCTAGTAGTGTTC120TGGACATTGGACTGCTTGTCCCTGGGAAGTAGCAGCAGAAATGATCGGTGGTGAACAGAA180GAAAAAGAAAAGCTCTTCCTTTTTGAAAGTCTGTTTTTTGAATAAAAGCCAATATTCTTT240TATAACTAGATTTTCCTTCTCTCCATTCCCCTGTCCCTCTCTCTTCCTCTCTTCTTCCAG300ATCTTCAGGGGGCTAGAAATCTGTTGCTATGGGCCCTTCACCAACATGCCCACAGGTAAG360AGCCTGGGAGAACCCCAGAGTTCCAGCACCAGCCTTTGTCTTACATAGTGGAGTATTATA420AGCAAGGTCCCACGATGGGGGTTCCTCAGATTGCTGAAATGTTCTAGAGGCTATTCTATT480TCTCTACCACTCTCCAAACAAAACAGCACCTAAATGTTATCCTATGGCAAAAAAAAACTA540TACCTTGTCCCCCTTCTCAAGAGCATGAAGGTGGTTAATAGTTAGGATTCAGTATGTTAT600GTGTTCAGATGGCGTTGAGCTGCTGTTAGTGCC633(2)SEQIDNO32信息(i)序列特征(A)長(zhǎng)度470堿基對(duì)(B)類型核酸(C)股性雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(iv)反義否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO32TTTGAGAGACTATCAAACCTTATACCAAGTGGCCTTATGGAGACTGATAACCAGAGTACA60TGGCATATCAGTGGCAAATTGACTTAAAATCCATACCCCTACTATTTTAAGACCATTGTC120CTTTGGAGCAGAGAGACAGACTCTCCCATTGAGAGGTCTTGCTATAAGCCTTCATCCGGA180GAGTGTAGGGTAGAGGGCCTGGGTTAAGTATGCAGATTACTGCAGTGATTTTACATGTAA240ATGTCCATTTTAGATCAACTGGAATGGATGGTACAGCTGTGTGGTGCTTCTGTGGTGAAG300GAGCTTTCATCATTCACCCTTGGCACAGTAAGTATTGGGTGCCCTGTCAGTGTGGGAGGA360CACAATATTCTCTCCTGTGAGCAAGACTGGCACCTGTCAGTCCCTATGGATGCCCCTACT420GTAGCCTCAGAAGTCTTCTCTGCCCACATACCTGTGCCAAAAGACTCCAT470(2)SEQIDNO33信息(i)序列特征(A)長(zhǎng)度517堿基對(duì)(B)類型核酸(C)股性雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(iv)反義否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO33GGTGGTACGTGTCTGTAGTTCCAGCTACTTGGGAGGCTGAGATGGAAGGATTGCTTGAGC60CCAGGAGGCAGAGGTGGNANNTTACGCTGAGATCACACCACTGCACTCCAGCCTGGGTGA120CAGAGCAAGACCCTGTCTCAAAAACAAACAAAAAAAATGATGAAGTGACAGTTCCAGTAG180TCCTACTTTGACACTTTGAATGCTCTTTCCTTCCTGGGGATCCAGGGTGTCCACCCAATT240GTGGTTGTGCAGCCAGATGCCTGGACAGAGGACAATGGCTTCCATGGTAAGGTGCCTCGC300ATGTACCTGTGCTATTAGTGGGGTCCTTGTGCATGGGTTTGGTTTATCACTCATTACCTG360GTGCTTGAGTAGCACAGTTCTTGGCACATTTTTAAATATTTGTTGAATGAATGGCTAAAA420TGTCTTTTTGATGTTTTTATTGTTATTTGTTTTATATTGTAAAAGTAATACATGAACTGT480TTCCATGGGGTGGGAGTAAGATATGAATGTTCATCAC517(2)SEQIDNO34信息(i)序列特征(A)長(zhǎng)度434堿基對(duì)(B)類型核酸(C)股性雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(iv)反義否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO34CAGTAATCCTNAGAACTCATACGACCGGGCCCCTGGAGTCGNTGNTTNGAGCCTAGTCCN60GGAGAATGAATTGACACTAATCTCTGCTTGTGTTCTCTGTCTCCAGCAATTGGGCAGATG120TGTGAGGCACCTGTGGTGACCCGAGAGTGGGTGTTGGACAGTGTAGCACTCTACCAGTGC180CAGGAGCTGGACACCTACCTGATACCCCAGATCCCCCACAGCCACTACTGACTGCAGCCA240GCCACAGGTACAGAGCCACAGGACCCCAAGAATGAGCTTACAAAGTGGCCTTTCCAGGCC300CTGGGAGCTCCTCTCACTCTTCAGTCCTTCTACTGTCCTGGCTACTAAATATTTTATGTA360CATCAGCCTGAAAAGGACTTCTGGCTATGCAAGGGTCCCTTAAAGATTTTCTGCTTGAAG420TCTCCCTTGGAAAT434(2)SEQIDNO35信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO35GATAAATTAAAACTGCGACTGCGCGGCGTG30(2)SEQIDNO36信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO36GTAGTAGAGTCCCGGGAAAGGGACAGGGGG30(2)SEQIDNO37信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO37ATATATATATGTTTTTCTAATGTGTTAAAG30(2)SEQIDNO38信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO38GTAAGTCAGCACAAGAGTGTATTAATTTGG30(2)SEQIDNO39信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO39TTTCTTTTTCTCCCCCCCCTACCCTGCTAG30(2)SEQIDNO40信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO40GTAAGTTTGAATGTGTTATGTGGCTCCATT30(2)SEQIDNO41信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO41AGCTACTTTTTTTTTTTTTTTTTGAGACAG30(2)SEQIDNO42信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO42GTAAGTGCACACCACCATATCCAGCTAAAT30(2)SEQIDNO43信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO43AATTGTTCTTTCTTTCTTTATAATTTATAG30(2)SEQIDNO44信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO44GTATATAATTTGGTAATGATGCTAGGTTGG30(2)SEQIDNO45信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO45GAGTGTGTTTCTCAAACAATTTAATTTCAG30(2)SEQIDNO46信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO46GTAAGTGTTGAATATCCCAAGAATGACACT30(2)SEQIDNO47信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO47AAACATAATGTTTTCCCTTGTATTTTACAG30(2)SEQIDNO48信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO48GTAAAACCATTTGTTTTCTTCTTCTTCTTC30(2)SEQIDNO49信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO49TGCTTGACTGTTCTTTACCATACTGTTTAG30(2)SEQIDNO50信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO50GTAAGGGTCTCAGGTTTTTTAAGTATTTAA30(2)SEQIDNO51信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO51TGATTTATTTTTTGGGGGGAAATTTTTTAG30(2)SEQIDNO52信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO52GTGAGTCAAAGAGAACCTTTGTCTATGAAG30(2)SEQIDNO53信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO53TCTTATTAGGACTCTGTCTTTTCCCTATAG30(2)SEQIDNO54信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO54GTAATGGCAAAGTTTGCCAACTTAACAGGC30(2)SEQIDNO55信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO55GAGTACCTTGTTATTTTTGTATATTTTCAG30(2)SEQIDNO56信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO56GTATTGGAACCAGGTTTTTGTGTTTGCCCC30(2)SEQIDNO57信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO57ACATCTGAACCTCTGTTTTTGTTATTTAAG30(2)SEQIDNO58信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO58AGGTAAAAAGCGTGTGTGTGTGTGCACATG30(2)SEQIDNO59信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO59CATTTTCTTGGTACCATTTATCGTTTTTGA30(2)SEQIDNO60信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO60GTGTGTATTGTTGGCCAAACACTGATATCT30(2)SEQIDNO61信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO61AGTAGATTTGTTTTCTCATTCCATTTAAAG30(2)SEQIDNO62信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO62GTAAGAAACATCAATGTAAAGATGCTGTGG30(2)SEQIDNO63信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO63ATGGTTTTCTCCTTCCATTTATCTTTCTAG30(2)SEQIDNO64信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO64GTAATATTTCATCTGCTGTATTGGAACAAA30(2)SEQIDNO65信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO65TGTAAATTAAACTTCTCCCATTCCTTTCAG30(2)SEQIDNO66信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO66GTGAGTGTATCCATATGTATCTCCCTAATG30(2)SEQIDNO67信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO67ATGATAATGGAATATTTGATTTAATTTCAG30(2)SEQIDNO68信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO68GTATACCAAGAACCTTTACAGAATACCTTG30(2)SEQIDNO69信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO69CTAATCCTTTGAGTGTTTTTCATTCTGCAG30(2)SEQIDNO70信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO70GTAAGTATAATACTATTTCTCCCCTCCTCC30(2)SEQIDNO71信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO71TGTAACCTGTCTTTTCTATGATCTCTTTAG30(2)SEQIDNO72信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO72GTAAGTACTTGATGTTACAAACTAACCAGA30(2)SEQIDNO73信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO73TCCTGATGGGTTGTGTTTGGTTTCTTTCAG30(2)SEQIDNO74信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO74GTAAAGCTCCCTCCCTCAAGTTGACAAAAA30(2)SEQIDNO75信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO75CTGTCCCTCTCTCTTCCTCTCTTCTTCCAG30(2)SEQIDNO76信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO76GTAAGAGCCTGGGAGAACCCCAGAGTTCCA30(2)SEQIDNO77信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO77AGTGATTTTACATGTAAATGTCCATTTTAG30(2)SEQIDNO78信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO78GTAAGTATTGGGTGCCCTGTCAGTGTGGGA30(2)SEQIDNO79信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO79TTGAATGCTCTTTCCTTCCTGGGGATCCAG30(2)SEQIDNO80信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO80GTAAGGTGCCTCGCATGTACCTGTGCTATT30(2)SEQIDNO81信息(i)序列特征(A)長(zhǎng)度30堿基對(duì)(B)類型核酸(C)股性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO81CTAATCTCTGCTTGTGTTCTCTGTCTCCAG30(2)SEQIDNO82信息(i)序列特征(A)長(zhǎng)度42氨基酸(B)類型氨基酸(C)股性(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型肽(iii)假設(shè)否(vi)最初來(lái)源(A)有機(jī)體人(xi)序列描述SEQIDNO82CysProIleCysLeuGluLeuIleLysGluProValSerThrLysCys151015AspHisIlePheCysLysPheCysMetLeuLysLeuLeuAsnGlnLys202530LysGlyProSerGlnCysProLeuCysLys3540(2)SEQIDNO83信息(i)序列特征(A)長(zhǎng)度45氨基酸(B)類型氨基酸(C)股性(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型肽(iii)假設(shè)否(xi)序列描述SEQIDNO83CysProIleCysLeuGluLeuLeuLysGluProValSerAlaAspCys151015AsnHisSerPheCysArgAlaCysIleThrLeuAsnTyrGluSerAsn202530ArgAsnThrAspGlyLysGlyAsnCysProValCysArg354045(2)SEQIDNO84信息(i)序列特征(A)長(zhǎng)度41氨基酸(B)類型氨基酸(C)股性(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型肽(iii)假設(shè)否(xi)序列描述SEQIDNO84CysProIleCysLeuAspMetLeuLysAsnThrMetThrThrLysGlu151015CysLeuHisArgPheCysSerAspCysIleValThrAlaLeuArgSer202530GlyAsnLysGluCysProThrCysArg3540(2)SEQIDNO85信息(i)序列特征(A)長(zhǎng)度42氨基酸(B)類型氨基酸(C)股性(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型肽(iii)假設(shè)否(xi)序列描述SEQIDNO85CysProValCysLeuGlnTyrPheAlaGluProMetMetLeuAspCys151015GlyHisAsnIleCysCysAlaCysLeuAlaArgCysTrpGlyThrAla202530CysThrAsnValSerCysProGlnCysArg3540權(quán)利要求1.一種分離的、編碼突變型或多態(tài)性BRCA1多肽的核酸,其特征在于,與SEQIDNO1中所示的BRCA1多肽編碼序列相比,該核酸含有一個(gè)或多個(gè)選自表12、12A和14所示突變和表18和19所示多態(tài)性的突變或多態(tài)性。2.如權(quán)利要求1所示的分離的核酸,其特征在于,它是編碼突變型BRCA1多肽的DNA,與SEQIDNO1中所示的BRCA1多肽編碼序列相比,該DNA含有一個(gè)或多個(gè)選自表12、12A和14所示突變的突變。3.如權(quán)利要求1所示的分離的核酸,其特征在于,它是編碼多態(tài)性BRCA1多肽的DNA,與SEQIDNO1中所示的BRCA1多肽編碼序列相比,該DNA含有一個(gè)或多個(gè)選自表18和19所示多態(tài)性的多態(tài)性。4.一種核酸探針,其特征在于,其核酸序列是如權(quán)利要求1-3中任一權(quán)利要求所述的核酸的一部分,與SEQIDNO1中所示的核苷酸序列相比,該核酸含有一個(gè)或多個(gè)選自表12、12A和14所示突變和表18和19所示多態(tài)性的突變型或多態(tài)性。5.一種復(fù)制克隆載體,其特征在于,它含有如權(quán)利要求1-4中任一權(quán)利要求所述的分離DNA和可在該載體的宿主細(xì)胞中操作的復(fù)制子。6.一種表達(dá)載體,其特征在于,它含有如權(quán)利要求1-4中任一權(quán)利要求所述的分離DNA,其中編碼該突變型或多態(tài)性BRCA1多肽的編碼序列可操作地連于啟動(dòng)子序列,該啟動(dòng)子序列能夠指導(dǎo)該編碼序列在該載體的宿主細(xì)胞中表達(dá)。7.用如權(quán)利要求5或6所述的載體轉(zhuǎn)化的宿主細(xì)胞。8.一種產(chǎn)生與具有SEQIDNO2中所示氨基酸序列的BRCA1多肽相比的突變型或多態(tài)性BRCA1多肽的方法,其特征在于,它包括(i)在適合產(chǎn)生該多肽的條件下,培養(yǎng)權(quán)利要求7所述的、含有編碼該多肽的表達(dá)載體的宿主細(xì)胞;和(ii)回收該多肽。9.如權(quán)利要求8所述的方法,其特征在于,還包括標(biāo)記回收的多肽。10.一種基本上不含其他蛋白的多肽制劑,其特征在于,該多肽是與具有SEQIDNO2中所示氨基酸序列的BRCA1多肽相比的突變型或多態(tài)性BRCA1多肽,它可通過(guò)表達(dá)某核苷酸編碼序列而獲得,該核苷酸編碼序列衍生自SEQIDNO1所示核苷酸序列并摻有一個(gè)或多個(gè)選自表12、12A和14所示突變和表18和19所示多態(tài)性的突變或多態(tài)性。11.如權(quán)利要求10所述的多肽制劑,其特征在于,它是可通過(guò)表達(dá)某核苷酸編碼序列而獲得的突變型BRCA1多肽,該核苷酸編碼序列衍生自SEQIDNO1所示核苷酸序列并摻有一個(gè)或多個(gè)選自表12、12A和14所示突變的突變。12.一種基本上不含其他蛋白的多肽制劑,其特征在于,該多肽是權(quán)利要求10或11中任一權(quán)利要求所述多肽的抗原片段,與具有SEQIDNO2所示氨基酸序列的BRCA1多肽相比,該多肽有突變型或多態(tài)性。13.如權(quán)利要求10-12中任一權(quán)利要求所述的制劑,其特征在于,該多肽是被標(biāo)記的。14.如權(quán)利要求10-12中任一權(quán)利要求所述的制劑,其特征在于,它處于融合蛋白形式。15.權(quán)利要求10-12和14中任一權(quán)利要求所述多肽的用途,其特征在于,用作產(chǎn)生抗體的免疫原。16.如權(quán)利要求15所述的用途,其特征在于,一種或多種產(chǎn)生的抗體隨后被標(biāo)記或結(jié)合于固相載體。17.一種診斷人體對(duì)象中乳房癌和卵巢癌傾向性的方法,其特征在于,它包括與SEQIDNO1所示核苷酸序列或其野生型等位基因變異體相比,確定在該對(duì)象的組織樣品的BRCA1基因序列中是否有種系改變,表明對(duì)該癌癥有傾向性的改變選自表12、12A和14所示突變。18.一種診斷人體對(duì)象的乳房或卵巢損傷是否有與BRCA1基因座關(guān)聯(lián)的瘤形成的方法,其特征在于,它包括與SEQIDNO1所示核苷酸序列或其野生型等位基因變異體相比,確定在來(lái)自該損傷的樣品中BRCA1基因序列是否有突變,該突變選自表12、12A和14所示突變。19.如權(quán)利要求17或18所述的方法,其特征在于,它包括分析該樣品的mRNA或蛋白質(zhì),以確定是否存在表示權(quán)利要求1所述的突變型BRCA1等位基因表達(dá)的表達(dá)產(chǎn)物。20.如權(quán)利要求19所述的方法,其特征在于,調(diào)查在該樣品中由BRCA1基因所編碼的mRNA。21.如權(quán)利要求20所述的方法,其特征在于,在探針會(huì)與對(duì)應(yīng)于BRCA1基因的RNA發(fā)生雜交的條件下,來(lái)自該樣品的mRNA與BRCA1基因探針接觸,然后檢測(cè)該探針的雜交情況。22.如權(quán)利要求17或18所述的方法,其特征在于,在探針會(huì)與基因發(fā)生雜交的條件下,將BRCA1基因探針與從該樣品中分離出的基因組DNA接觸,然后檢測(cè)該探針的雜交情況。23.如權(quán)利要求21或22所述的方法,其特征在于,該探針是針對(duì)權(quán)利要求1所述的突變型BRCA1等位基因的、等位基因特異性探針。24.如權(quán)利要求17或18所述的方法,其特征在于,它包括通過(guò)觀察來(lái)自該樣品的單鏈DNA在非變性的聚丙烯酰胺凝膠上電泳泳動(dòng)率的變化,確定在該樣品中的BRCA1基因是否有突變。25.如權(quán)利要求17或18所述的方法,其特征在于,擴(kuò)增該樣品中的全部或部分BRCA1基因,然后確定該擴(kuò)增序列的序列。26.如權(quán)利要求17或18所述的方法,其特征在于,采用對(duì)權(quán)利要求1所述的突變型BRCA1等位基因特異的寡核苷酸引物,通過(guò)核酸擴(kuò)增確定在該樣品中是否存在該等位基因。27.如權(quán)利要求17或18所述的方法,其特征在于,克隆該樣品中的全部或部分BRCA1基因以產(chǎn)生克隆的序列,然后確定該克隆序列的序列。28.如權(quán)利要求17-20任一權(quán)利要求所述的方法,其特征在于,它包括當(dāng)分子(1)從該樣品中分離出的BRCA1基因的基因組DNA或BRCA1mRNA和(2)與人野生型BRCA1基因DNA互補(bǔ)的核酸探針相互發(fā)生雜交形成雙鏈時(shí),確定分子(1)和(2)之間是否有錯(cuò)配。29.如權(quán)利要求17-20任一權(quán)利要求所述的方法,其特征在于,擴(kuò)增該樣品中的BRCA1基因序列,然后確定擴(kuò)增出的序列與一個(gè)或多個(gè)核酸探針的雜交情況,這些探針含有野生型BRCA1基因序列或權(quán)利要求1所述的突變型BRCA1基因序列。30.如權(quán)利要求17或18所述的方法,其特征在于,確定該樣品中的BRCA1基因與一個(gè)或多個(gè)核酸探針的原位雜交情況,這些探針含有野生型BRCA1基因序列或權(quán)利要求1所述的突變型BRCA1基因序列。全文摘要本發(fā)明一般涉及人類遺傳學(xué)領(lǐng)域。具體地,本發(fā)明涉及用于分離和檢測(cè)人乳房癌和卵巢癌傾向性基因(BRCA1)的方法和材料,該基因的某些突變型等位基因造成癌癥尤其是乳房和卵巢癌的易患性。更具體地,本發(fā)明涉及BRCA1基因的種系突變及其在診斷乳房癌和卵巢癌傾向性方面的用途。本發(fā)明還涉及在人乳房癌和卵巢癌中BRCA1基因的體細(xì)胞突變及其在診斷和預(yù)后乳房癌和卵巢癌方面的用途。此外,本發(fā)明還涉及在其他的人癌腫中的BRCA1基因體細(xì)胞突變及其在人癌腫的診斷和預(yù)后方面的用途。本發(fā)明還涉及BRCA1基因發(fā)生突變的人癌腫的治療,它包括基因治療、蛋白質(zhì)置換治療和蛋白質(zhì)模擬物。本發(fā)明還涉及篩選用于癌腫治療的藥物。最后,本發(fā)明涉及篩選BRCA1基因的突變,而這些突變可用于診斷乳房癌和卵巢癌的傾向性。文檔編號(hào)C07K14/47GK1172502SQ9519541公開(kāi)日1998年2月4日申請(qǐng)日期1995年8月11日優(yōu)先權(quán)日1994年8月12日發(fā)明者D·M·沙特克-艾登斯,J·西馬爾,江見(jiàn)充,中村祐輔,F·迪羅切申請(qǐng)人:億萬(wàn)遺傳股份有限公司,舒勒研究中心,腫瘤研究所
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1