專利名稱:hTFIIIA基因的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及編碼人轉(zhuǎn)錄因子IIIA(下文稱作hTFIIIA)。
自從1980年首次從非洲蟾蜍屬(xenopus)卵母細胞中以轉(zhuǎn)錄因子的形式純化出TFIIA后[Segall et al.,J.Biol.Chem.,255.11986-11991(1980)],在Xenopus中進行了許多體內(nèi)和體外研究以解釋用所說的TFIIIA進行轉(zhuǎn)錄控制的機理[例如Del etal.,Nucleic Acids Res.,19 6197-6203(1991);Smith etal.,Nucleic Acids Res.,19,6871-6876(1991);Liaoetal.,J.Mol.Biol.,223,857-871(1992);Del et al.,J.Mol.Biol.,233,567-579(1993)]。
上述Xenopus TFIIIA對5S RNA基因轉(zhuǎn)錄的啟動是必須的[Sakonji et al.,Cell,19,13-25(1980)]而且與5S基因的一個內(nèi)部控制區(qū)域結(jié)合[Bogenhagen et al.,Cell,19,27-35(1980)]。
Xenopus TFIIIA cDNA的核苷酸序列和相應(yīng)的氨基酸序列已被報道[Ginsberg et al.,Cell,39,479-489(1984)]。所說的基因編碼9個鋅指紋區(qū)(Cys2His2(C2H2)區(qū)域的重復(fù)),該結(jié)構(gòu)被當作一組DNA結(jié)合蛋白質(zhì)所必須的區(qū)域[Miller et al.,EMBO J,4,1607-1614(1985)]。
已構(gòu)建了一個酵母基因,它編碼與xenopus TFIIIA同源的一種蛋白質(zhì),也有相同的C2H2區(qū)域[Archambault et al.,J.Biol.Chem.,267.3283-3288(1992)]。
進一步了解到,在人類,DNA結(jié)合轉(zhuǎn)錄因子,如人Wilms腫瘤基因WT1[Gessler et al.,Nature,343,774-778(1990)],人轉(zhuǎn)錄阻遏物YY1[Shi et al.,Cell,67,377-388(1991)],人MYC-相聯(lián)性鋅指紋蛋白maz[Bossone et al.,Proc.Natl.Acad.Sci.,USA,89,7452-7456(1992)]和SP1[kuwaharaet al.,Biolchem.,29,8627-8631(1990)]具有上述C2H2型指紋區(qū)。
與Xenopus TFIIIA相反,關(guān)于hTFIIIA所知甚少。1989,從Hela細胞中純化出一種hTFIIIA樣蛋白質(zhì)(35K Da蛋白質(zhì))并顯示出與人5S RNA基因相互作用[Seifart et al.,J.Biol.Chem.,264,1702-1709(1989)]。但還沒有報道hTFIIIA編碼基團。
因此,分離和提供一種hTFIIIA基因是本發(fā)明的目的。
本發(fā)明的另一目的在于揭示hTFIIIA基因的核苷酸序列及相應(yīng)的氨基酸序列以便解釋人轉(zhuǎn)錄機制并提供其用途。
由于他們深入研究的結(jié)果,本發(fā)明成功地分離出一種編碼hTFIIIA的cDNA,測定了全部cDNA序列和相應(yīng)的氨基酸序列,在各種組織中誘導(dǎo)了其表達并揭示了其在染色體上的位置。因此根據(jù)所得的發(fā)現(xiàn),現(xiàn)已完成了本發(fā)明。
因此,本發(fā)明提供了編碼一種氨基酸序列(由SEQ ID NO1限定)的hTFIIIA。
在本說明書的下文中,用于氨基酸,肽,堿基序列,核酸等的縮寫使用按IUPAC和IUB以及在“含堿基序列和/或氨基酸序列的
書指標”(日本專利局編)中所推薦的或在相關(guān)領(lǐng)域通用的縮寫形式。
本發(fā)明的hTFIIIA基因具有一個可譯框架,其中包含1269個核苷酸(核酸),它編碼423個氨基酸殘基,如下面SEQ ID NO1所示,其特征為編碼9個C2H2型鋅指紋區(qū)。當與XenoDus TF IIIA基因比較時,它顯示出在核酸方面有63%的同源性,在氨基酸方面有58%的同源性。
由本發(fā)明基因編碼的hTFIIIA認為可發(fā)揮DNA結(jié)合蛋白質(zhì)的生物學作用,所說的基因用途是作為一種轉(zhuǎn)錄調(diào)節(jié)因子。具體地說,本發(fā)明的基因一般在各種組織中表達,因此,在涉及維持生命和控制功能的5S核糖體RNA基因轉(zhuǎn)錄和維持其他基因的穩(wěn)定轉(zhuǎn)錄中可能發(fā)揮著重要作用。
尤其最近逐漸了解到大量疾病伴隨著轉(zhuǎn)錄控制的紊亂。例如,許多癌基因產(chǎn)物充當轉(zhuǎn)錄調(diào)節(jié)因子,其中的紊亂導(dǎo)致細胞的癌變。早幼粒細胞白血病,染色體轉(zhuǎn)位導(dǎo)致轉(zhuǎn)錄控制的紊亂,隨后引起癌變。調(diào)節(jié)因子Hox2.4的高水平表達誘導(dǎo)小鼠白血病。因此,現(xiàn)在已知在許多遺傳疾病中有關(guān)蛋白質(zhì)顯示無異常,但其病理學機理涉及一種基因的異常,該基因涉及所說蛋白質(zhì)之基因表達所需的轉(zhuǎn)錄控制。經(jīng)研究這些基因的異常(DNA診斷等)。可以鑒定遺傳疾病,其發(fā)病機理的分析還沒有足夠的進展。本發(fā)明的基因在該領(lǐng)域中是有用的。本發(fā)明的基因在使用一種反意DNA通過轉(zhuǎn)錄控制來進行的疾病治療中或在分析其作用機理中也是有用的。
另外,TFIIIA涉及5S RNA的轉(zhuǎn)錄控制,因此,該轉(zhuǎn)錄控制的紊亂直接導(dǎo)致有關(guān)蛋白質(zhì)合成的紊亂。許多表現(xiàn)為一種蛋白質(zhì)數(shù)量異常的遺傳疾病可能是由該蛋白質(zhì)合成的紊亂所引起的。因此,本發(fā)明的基因預(yù)期在解釋該疾病中也是有用的。
本發(fā)明的基因以單鏈DNA序列的形式來代表,如SEQ ID N02所示,因此在其范圍內(nèi),本發(fā)明包括與該單鏈DNA序列互補的DNA序列以及兩種都包含的成份。
下面SEQ ID NO2所示的DNA序列和代表本發(fā)明的基因是分別編碼根據(jù)下面SEQ ID NO1所示的氨基酸序列的氨基酸殘基之密碼的結(jié)合的一個例子。當然,本發(fā)明的基因不限于此,還可以具有任一DNA堿基序列,該序列包含一些氨基酸殘基各自密碼子的其他任意結(jié)合而不改變上述氨基酸順序??砂闯R?guī)方式進行密碼子的選擇,例如考慮密碼子在所用宿主中的使用頻率[Nucl.AcidsRes.,9,43-74(1981)]。
本發(fā)明的基因還包含編碼上述氨基酸序列的等效物的DNA序列,該等效物是經(jīng)缺失和/或取代至少一個氨基酸或其部分氨基酸序列,或經(jīng)增加至少一個氨基酸或氨基酸序列進行修飾得到的,并且有與hTFIIIA相似的生物學活性。這些等效物可以自發(fā)產(chǎn)生或經(jīng)轉(zhuǎn)錄后修飾產(chǎn)生或還可以經(jīng)使用定點突變技術(shù)[Kramer,W,etal.,Nucl.Acids Res.,12,9441(11984);Kramer,W,andFrits,H.J.,Methods in Enzymology.154,350(1987);zoller,M.J.and Smith,M.,Methods in Enzymology,100,468(1983);Hirose,Susumu,Seikagaku Jikken Koza(Experimentsin Biochemistry),2nd series,Vol.1,“Idenshi Kenkyu-ho(Methods in Genetic Studies)II”105]修飾天然基因(本發(fā)明的基因),經(jīng)使用化學合成技術(shù)如磷酸三酯法[Letsinger,R.L.and Ogilvie,K.K.,J.Am.Chem.Soc.,91,3350(1969);Merrifield,R.B.,Science,150,.178(1968)]和磷酰胺方法[Beaucage,S.L.and Caruthers,M.H.,Tetrahedron Lett.,22,1859(1981);McBride,L.J.andCaruthers.M.H.,Tetrahedron Lett.,24,245(1983)],或以這些方法的組合來生產(chǎn)。
經(jīng)使用本發(fā)明的基因,即例如將它插入一種微生物載體中并培養(yǎng)因此轉(zhuǎn)化的微生物,這可以很容易引起hTFIIIA的大量表達并隨后分離和提供所述的蛋白質(zhì)。
根據(jù)本文所公開的本發(fā)明基因的序列資料。使用一般的遺傳工程技術(shù)[例如,Sambrook,J.,F(xiàn)ritsch,E.F.,Maniatis,T.,Molecular Cloning,2nd edition,Cold Spring HarborLaboratory Press(1989);Seikagaku Jikken Koza,2ndSeries,“Idenshi kenkyu-hoI,II,III”,edited byNippon Seikagaku-kai;Guide to Molecular CloninqTechniques,Berger,S.L.Kimmel,A.R.,Methods inEnzymology,Vol.152],其他人可以很容易地生產(chǎn)本發(fā)明的基因。
例如,可以使用合適的探針或本發(fā)明基因的特異性抗體從人cDNA文庫(從含編碼hTFIIIA的基因合適的原始細胞中按常規(guī)方法制備)中挑選所需克隆來生產(chǎn)所說的基因[cf.e.g.Sugga,S.V.,et al.,Proc.Natl.Acad.Sci.,USA,78,6613(1981);Young.R.A.,et al.,Science,222,778(1983)]。
用于上述程序的原始細胞的例子可以是所提到的各種細胞和組織,和其培養(yǎng)細胞,它們允許hTFIIIA基因的表達。從其中分離總RNA,按常規(guī)方法進行mRNA的分離和純化,其轉(zhuǎn)變成(合成)cDNA,cDNA的克隆以及其他步驟。另外,在本發(fā)明的實施中,cDNA文庫可作為一種商品購買到。例如,該cDNA文庫可以使用從Clontech買到的各種cDNA文庫。
可按上面提到的常規(guī)方法從該cDNA文庫中完成對本發(fā)明基因的篩選。作為篩選方法,可以被提及的有例如,包含使用一種抗-hTFIIIA特異性抗體來抗cDNA產(chǎn)生的蛋白質(zhì),以Western印跡方式挑選出相應(yīng)的cDNA克隆的方法;包含使用一種與目標DNA序列選擇性結(jié)合的探鐘的Southern印跡方法;Northern印跡方法,及其組合。一般來說,例如根據(jù)本發(fā)明基因的DNA序列資料化學合成的DNA序列在這里用作探針。當然,還可以使用已經(jīng)獲得的本發(fā)明基因或其片段作為探針。
在獲得本發(fā)明基因的過程中,包含PCR技術(shù)[saiki,R.K.,et al.,Science,230,1350-1354(1985)]的DNA/RNA放大方法也能被成功地適用。特別在那些全長cDNA不能從文庫中獲得的例子中,可適合運用RAGE技術(shù)[cDNA末端的迅速放大;JikkenIgakn,12(6),35-38(1994)]。在運用該PCR技術(shù)中所用的引物可根據(jù)本發(fā)明基因序列的資料來進行適當?shù)脑O(shè)計,也可用共知的常規(guī)方法來合成。
放大的DNA/RNA片段可按上面提到的常規(guī)方式如經(jīng)凝膠電泳進行分離和純化。
按常規(guī)方式,例如以雙脫氧法[Sanger.F.,et al,Proc.Natl.Acad.Sci.,USA,74,5463-5467(1977)]或Maxam-Gilbert法[Maxam.A.M.et a1.Methods in Enzymology,65,499(1980)]可測定本發(fā)明基因或其各種DNA片段中任意一種的堿基序列。該堿基序列的測定也可用以商品的形式可購買到的測序試劑盒或相似物很容易地測出。
因此獲得了cDNA的全部DNA堿基序列,將它命名為克隆OTK7并作為本發(fā)明基因的一個例子,如下面SEQ ID NO3所示。由所說cDNA編碼的hTFIIIA氨基酸序列如下面SEQ ID NO1所示。
根據(jù)本發(fā)明,提供了一種篩選hTFIIIA基因的方法,包括使用本發(fā)明基因的一部分作為探針。例如可使用一種任意引物DNA標記試劑盒(從Takara Shuzo,Amersham,等可買到),利用任意引物DNA標記技術(shù)[Feinberg,A.P.,et al.,Anal.Biochem.,137266-267(1984)]標記此處的探針。例如可用噬菌斑雜交技術(shù)[Benton.W.,et al.,Science.196,383-394(1977)]篩選目標基因。
另外,按照一般基因重組技術(shù)[cf.e.g.Science,224,1431(1984);Biochem.Biophys.Res.Comm.,130,692(1985);Proc.Natl.Acad.Sci.,USA,80,5990(1983)],以本發(fā)明的基因開始可獲得重組的hTFIIIA種類。更具體地說,經(jīng)構(gòu)建重組DNA,允許本發(fā)明的基因在宿主細胞中表達,經(jīng)轉(zhuǎn)化將該DNA引入宿主細胞中并培養(yǎng)所得的轉(zhuǎn)化細胞來生產(chǎn)所說的hTFIIIA種類。
所用的宿主細胞可以是真核細胞,也可以是原核細胞。至于脊椎動物細胞的表達載體,可使用的載體含有一個一般位于所表達的基因上游的啟動子,一個RNA剪切位點,一個多聚腺苷化位點和一個轉(zhuǎn)錄終止序列,如果必要的話,可能還含有一個復(fù)制起點。至于真核微生物,一般常用的是酵母,其中,使用Saccharomyces屬的酵母具有優(yōu)勢。對于真核微生物(如酵母)的表達載體,可使用例如具有一個酸性磷酸酶基因啟動子的pAM82[A.Miyanoharaet al.,Proc.Natl.Acad.Sci.,USA,80,1-5(1983)]。至于原核宿主,一般常用的是Escherichia coli和Bacillussubtilis。在本發(fā)明的實施中,當使用該宿主時,需要使用一個表達質(zhì)粒,以將本發(fā)明的基因插入一個質(zhì)粒載體中來構(gòu)建,該載體能以某種方式在所說的宿主中復(fù)制,對于提供的所說的表達質(zhì)粒,在本發(fā)明基因的上游有一個啟動子和SD(ShineandDalgarno)堿基序列,還有一個為蛋白質(zhì)合成的啟動所必需的起始密碼子(例如ATG),以使所說的基因得以表達。例如,Escherichia coli K12常用作上面提到的“Escherichia coli”宿主,pBR322常用作載體。然而,這并不限于使用各種共知的菌株和載體。例如有用的啟動子有色氨酸(trp)啟動子,lpp啟動子,lac啟動子,PL啟動子,諸如此類。
使用本領(lǐng)域常用的各種方法將因此獲得的所需重組DNA導(dǎo)入宿主細胞以進行其轉(zhuǎn)化。所得的轉(zhuǎn)化細胞以常規(guī)方法培養(yǎng)。培養(yǎng)導(dǎo)致以本發(fā)明基因編碼的目的hTTIIIA的生產(chǎn)和積累。用于所說培養(yǎng)的培養(yǎng)基可根據(jù)所用的宿主細胞適當?shù)剡x自各種常用培養(yǎng)基。在適于宿主細胞生長的條件下進行培養(yǎng)。
按上述方式,目的重組hTFIIIA蛋白質(zhì)產(chǎn)生和積累或分泌到轉(zhuǎn)化細胞的細胞內(nèi)或細胞外。
利用其物理和/或化學和/或其他特征以各種分離程序分離和純化重組hTFIIIA[cf.“Seikagaku(Biochemistry)DataBook”,pages 1175-1259,1st edition,1st printing.publishedJune 23,1980 by Tokyo Kagaku Dozin;Biochemistry.Vol,25,No.25,8274-8277(1986);Eur.J.Biochem.,163,313-321(1987)]。具體地說,所說的過程包括各種常用方法如重建處理,以一種蛋白質(zhì)沉淀劑處理(鹽析),離心,滲壓休克過程,超聲處理,超濾作用、分子篩層析(凝膠過濾),吸收色譜,離子交換色譜,親合色譜,高效液相色譜(HPLC),其他色譜技術(shù),透析,及其組合。以上述方式,所需的重組hTFIIIA可按商品規(guī)模以較高產(chǎn)量容易地生產(chǎn)出來。
根據(jù)本發(fā)明,提供了一種hTFIIIA基因,使用所說基因可容易地大量生產(chǎn)hTFIIIA。本發(fā)明的基因和hTFIIIA作為轉(zhuǎn)錄調(diào)控因子是有用的,而且在其他方面,如癌癥和由轉(zhuǎn)錄控制的紊亂所引起的其他遺傳疾病的診斷和鑒定,經(jīng)轉(zhuǎn)錄控制對該疾病的治療,以及該控制作用機理的分析,也是十分有用的。
圖1是顯示了本發(fā)明的基因在各種組織中的表達的Northern印跡觀察到的結(jié)果。
實施例下面實施例是對本發(fā)明的進一步解釋。實施例1(1)克隆和測序從人胎兒腦cDNA文庫中任意選出的克隆之序列分析的結(jié)果表明發(fā)現(xiàn)一個1.3kb的克隆與Xenopus TFIIIA具有高水平的同源性,命名為OTK7-1。序列分析揭示了本克隆缺少基因的5′部分。(2)5′RACE使用商品試劑盒(5′-Ampli FINDERTMRACE試劑盒,Clontech)以5′RACE分離含基因5′部分的cDNA克隆。
在本例中,合成了3個與OTK7-1相應(yīng)的引物,即H11-R(堿基序列如SEQ ID NO4所示),H11-E(序列如SEQ ID N05所示)和H11-H(序列如SEQ ID NO6所示)以及一個與錨著引物(SEQ ID NO8所示)互補的引物(AP-2;SEQ ID NO7所示)。
用引物H-11R對300ng人腦poly A+RNA(Clontech)進行反轉(zhuǎn)錄以合成單鏈cDNA。
因此,9μl poly A+RNA(300ng 19μl)和1μl引物H11-R(10微微摩爾1μl)在65℃下預(yù)保溫5分鐘,加入反應(yīng)混合物[9.2μl)DEPC處理過的水/9μl 4X反轉(zhuǎn)錄酶緩沖液/1.6μl RNase抑制物(40單位/μl)/3.7μl dNTP混合物(每種核苷酸10mM)/0.5μlAMV反轉(zhuǎn)錄酶(25單位/μl)],52℃下保溫30分鐘。加入10μl 0.5MEDTA終止反應(yīng),加入10μl 6N NaOH水解模板poly A+RNA,使用GENO-BINDTM系統(tǒng)去掉過剩的引物H11-R。接著用乙醇沉淀,cDNA沉淀重懸于6μl H2O中。
使用T4DNA連接酶將單鏈錨著寡聚核苷酸(錨著引物)與上述cDNA 3′端連接,按下面程序進行。
由2.5μl上述cDNA,2μl錨著引物(4微微摩爾)5μl 2×連接緩沖液,0.5μl T4DNA連接酶(20單位/μl)組成的混合物室溫下溫育18小時。
連接混合物稀釋10倍用作PCR模板。
使用引物AP-2和H11-E對1.0μl錨著連接的cDNA稀釋液進行PCR擴增,按下面程序進行。
所說的稀釋物82℃維持1分鐘,然后加入引物,進行35個PCR循環(huán)(每循環(huán)包含92℃維持0.5分鐘。56℃ 0.5分鐘和72℃ 1.0分鐘),接著72℃溫育15分鐘。PC產(chǎn)物克隆到p Bluescript SK(-)載體的EcoRV位點上。使用32P-ATP末端標記的寡聚H11-I經(jīng)集落雜交篩選所需轉(zhuǎn)化細胞。以二脫氧終止法[Sanger et al.,Proc.Natl.Acad.Sci.,USA,74,5463-5467(1977)]對陽性菌落進行序列測定。
所得的cDNA是本發(fā)明的基因,下文稱作“OTK 7”。(3)Northern雜交使用人多種組織Northern印跡系統(tǒng)(Clontech)檢測本發(fā)明的基因OTK7在各種組織中的表達。
印跡進行如下在含50%甲酰胺,10×Denhardt′s溶液,5×SSPE,2%SDS和100μg/ml變性魚精DNA的溶液中以[32P]-標記的cDNA作為探針50℃預(yù)雜交4小時,接著雜交18小時。室溫下洗滌印跡,用2×SSC/0.05%SDS經(jīng)過10分鐘洗滌3次,然后用0.1×SSC/0.1%SDS洗兩次經(jīng)過15分鐘,在-80℃下放射自顯影16小時。(4)染色體定位以直接在R-熒光帶上原位雜交的方式進行染色體定位[FISH;Takahashi et al.,Hum.Genet.,86,14-16(1990)和出處同上,88,119-121(1991)]。(5)結(jié)果a)OTK7基因的DNA序列和相應(yīng)的氨基酸序列OTK7 cDNA的核苷酸序列和相應(yīng)的氨基酸序列如下SEQ IDNO3所示。
關(guān)于SEQ ID NO3.由第1289位到1291位堿基組成的序列是終止密碼子(TAA),含第317位到1096位堿基的序列與鋅指紋區(qū)相對應(yīng),從第20位到22位堿基(ATG)是起始甲硫氨酸密碼子,第1363位到1368位堿基(ATTAAA)構(gòu)成多聚腺苷化信號。
OTK7 cDNA共含1399個堿基,包括一個編碼423個氨基酸殘基的1269堿基可譯框架。
直到其編碼序列3/4部分的5′端序列被研究,所說的cDNA與Xenopus TF IIIA相比,顯示出63%的核苷酸同源性和58%的氨基酸同源性。
該hTFIIIA具有9個鋅指紋區(qū),其氨基酸序列與XenopusTFIIIA的C2H2指紋區(qū)高度一致。除了第6個指紋區(qū)在兩半胱氨酸殘基間只有3個氨基酸殘基而不像Xenopus TFIIIA中有5個氨基酸殘基。
在C端區(qū)域,兩者的同源性不高。它們在N端區(qū)域的大小上也有區(qū)別。在Xenopus TFIIIA中其第一個指紋區(qū)上游有14個氨基酸殘基,而hTFIIIA有99個氨基酸殘基。hTFIIIA N端區(qū)域與現(xiàn)在已知的任一基因產(chǎn)物無同源性。
hTFIIIA與其他已知的DNA接合蛋白質(zhì)的同源性局限在相當小的區(qū)域內(nèi),如下所述Xenopus 5S RNA結(jié)合蛋白質(zhì)P43[Joho et al.,Cell,61,293-300(1990)]。在289個氨基酸殘基中有37%相同;人類Wilms腫瘤基因產(chǎn)物WT1[Gessler et al.,Nature,343,774-778(1990)]···在126個氨基酸殘基中有35%相同;
人轉(zhuǎn)錄阻遏物YYA[Shi et al.,Cell 67,377-388(1991)]···在95個氨基酸殘基中,40%相同;人GT盒結(jié)合蛋白質(zhì)[Kingsley et al.,MOl.Cell.Biol.,12,4251-4261(1992)]···在91個氨基酸殘基中,44%相同;人myc-相關(guān)性鋅指紋區(qū)蛋白質(zhì)[Bossone et al.,Proc.,Natl.Acad.Sci.,USA,89,7452-7456(1992)〕···在152個氨基酸殘基中,37%相同。b)Northern印跡分析hTFIIIA在各種組織中的表達水平如圖1所示。
在圖1中,用1.1kbp cDNA作探針的上述試驗(hTFIIIA表達)的結(jié)果在上排顯示,用β-肌動蛋白探針以相同方式進行β-肌動蛋白m-RNA檢測的相同印跡結(jié)果(對照)在下排顯示。相應(yīng)的泳道如下泳道1心臟泳道2大腦泳道3胎盤泳道4肺泳道5肝臟泳道6骨胳肌泳道7腎臟泳道8胰腺泳道9脾臟泳道10胸腺泳道11前列脈泳道12精巢泳道13卵巢泳道14小腸泳道15結(jié)腸泳道16外周血白細胞以Northern分析hTFIIIA轉(zhuǎn)錄物的大小估計大約為1400bp。這一大小與OTK7 cDNA幾乎一致,因此,所說的cDNA可能覆蓋hTTFIIIA mRNA的幾乎全部序列。
該基因在所試驗的所有人類組織中普遍表達,表達的水平在某些組織如胰腺,脾臟和外周血白細胞中比其他組織似乎要高。c)定位hTFIIIA基因發(fā)現(xiàn)存在于染色體13q 12.3-13.1上序列描述(2)SEQ ID NO1資料(i)序列特征(A)長度423個氨基酸(B)類型氨基酸(D)拓撲學線型(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO1Met Arg Ser Ser Gly Ala Asp Ala Gly Arg Cys Leu Val Thr Ala Arg1 5 10 15Ala Pro Gly Ser Val Pro Ala Ser Arg Glu Gly Ser Ala Gly Ser Arg20 25 30Gly Pro Gly Ala Arg Phe Pro Ala Arg Val Ser Ala Arg Gly Ser Ala35 40 45Pro Gly Pro Gly Leu Gly Gly Ala Gly Ala Leu Asp Pro Pro Ala Val50 55 60Val Ala Glu Ser Val Ser Ser Leu Thr Ile Ala Asp Ala Phe Ile Ala65 70 75 80Ala Gly Glu Ser Ser Ala Pro Thr Pro Pro Arg Pro Ala Leu Pro Arg85 90 95Arg Phe Ile Cys Ser Phe Pro Asp Cys Ser Ala ASh Tyr Ser Lys Ala100 105 110Trp Lys Leu Asp Ala His Leu Cys Lys His Thr Gly Glu Arg Pro Phe115 120 125Val Cys Asp Tyr Glu Gly Cys Gly Lys Ala Phe Ile Arg Asp Tyr His
130 135 140Leu Ser Arg His Ile Leu Thr His Thr Gly Glu Lys Pro Phe Val Cys145 150 155 160Ala Ala Asn Gly Cys Asp Gln Lys Phe Asn Thr Lys Ser Asn Leu Lys165 170 175Lys His Phe Glu Arg Lys His Glu Asn Gln Gln Lys Gln Tyr Ile Cys180 185 190Ser Phe Glu Asp Cys Lys Lys Thr Phe Lys Lys His Gln Gln Met Lys195 200 205Ile His Gln Cys Gln Asn Thr Asn Glu Pro Leu Phe Lys Cys Thr Gln210 215 220Glu Gly Cys Gly Lys His Phe Ala Ser Pro Ser Lys Leu Lys Arg His225 230 235 240Ala Lys Ala His Glu Gly Tyr Val Cys Gln Lys Gly Cys Ser Phe Val245 250 255Ala Lys Thr Trp Thr Glu Leu Leu Lys His Val Arg Glu Thr His Lys260 265 270Glu Glu Ile Leu Cys Glu Val Cys Arg Lys Thr Phe Lys Arg Lys Asp275 280 285Tyr Leu Lys Gln His Met Lys Thr His Ala Pro Glu Arg Asp Val Cys290 295 300Arg Cys Pro Arg Glu Gly Cys Gly Arg Thr Tyr Thr Thr Val Phe Asn305 310 315 320Leu Gln Ser His Ile Leu Ser Phe His Glu Glu Ser Arg Pro Phe Val325 330 335Cys Glu His Ala Gly Cys Gly Lys Thr Phe Ala Met Lys Gln Ser Leu340 345 350Thr Arg His Ala Val Val His Asp Pro Asp Lys Lys Lys Met Lys Leu355 360 365Lys Val Lys Lys Ser Arg Glu Lys Arg Glu Phe Gly Leu Ser Ser Gln370 375 380Trp Ile Tyr Pro Pro Lys Arg Lys Gln Gly Gln Gly Leu Ser Leu Cys385 390 395 400Gln Asn Gly Glu Ser Pro Asn Cys Val Glu Asp Lys Met Leu Ser Thr405 410 415Val Ala Val Leu Thr Leu Gly420(2)SEQ ID NO2資料(i)序列特征(A)長度1269個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲學線型(ii)分子類型cDNA(xi)序列描述SEQ ID NO2ATGCGCAGCA GCGGCGCCGA CGCGGGGCGG TGCCTGGTGA CCGCGCGCGC TCCCGGAAGT 60GTGCCGGCGT CGCGCGAAGG TTCAGCAGGG AGCCGTGGGC CGGGCGCGCG GTTCCCGGCA 120CGTGTCTCGG CACGTGGCAG CGCGCCTGGC CCTGGGCTTG GAGGCGCCGG CGCCCTGGAT 180CCGCCGGCCG TGGTCGCCGA GTCGGTGTCG TCCTTGACCA TCGCCGACGC GTTCATTGCA 240GCCGGCGAGA GCTCAGCTCC GACCCCGCCG CGCCCCGCGC TTCCCAGGAG GTTCATCTGC 300TCCTTCCCTG ACTGCAGCGC CAATTACAGC AAAGCCTGGA AGCTTGACGC GCACCTGTGC 360AAGCACACGG GGGAGAGACC ATTTGTTTGT GACTATGAAG GGTGTGGCAA GGCCTTCATC 420AGGGACTACC ATCTGAGCCG CCACATTCTG ACTCACACAG GAGAAAAGCC GTTTGTTTGT 480GCAGCCAATG GCTGTGATCA AAAATICAAC ACAAAATCAA ACTTGAAGAA ACATTTTGAA 540CGCAAACATG AAAATCAACA AAAACAATAT ATATGCAGTT TTGAAGACTG TAAGAAGACC 600TTTAAGAAAC ATCAGCAGAT GAAAATCCAT CAGTGCCAGA ATACCAATGA ACCTCTATTC 660AAGTGTACCC AGGAAGGATG TGGGAAACAC TTTGCATCAC CCAGCAAGCT GAAACGACAT 720GCCAAGGCCC ACGAGGGCTA TGTATGTCAA AAAGGATGTT CCTTTGTGGK AAAAACATGG 780ACGGAACTTC TGAAACATGT GAGAGAAACC CATAAAGAGG AAATACTATG TGAAGTATGC 840CGGAAAACAT TTAAACGCAA AGATTACCTT AAGCAACACA TGAAAACTCA TGCCCCAGAA 900AGGGATGTAT GTCGCTGTCC AAGAGAAGGC TGTGGAAGAA CCTATACAAC TGTGTTTAAT 960CTCCAAAGCC ATATCCTCTC CTTCCATGAG GAAAGCCGCC CTTTTGTGTG TGAACATGCT 1020GGCTGTGGCA AAACATTTGC AATGAAACAA AGTCTCACTA GGCATGCTGT TGTACATGAT 1080CCTGACAAGA AGAAAATGAA GCTCAAAGTC AAAAAATCTC GTGAAAAACG GGAGTTTGGC 1140CTCTCATCTC AGTGGATATA TCCTCCCAAA AGGAAACAAG GGCAAGGCTT ATCTTTGTGT 1200CAAAACGGAG AGTCACCCAA CTGTGTGGAA GACAAGATGC TCTCGACAGT TGCAGTACTT 1260ACCCTTGGC 1269(2)SEQ ID NO3資料(i)序列特征(A)長度1399個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲學線型(ii)分子類型cDNA(vii)直接來源(A)文庫人胚胎大腦cDNA(B)克隆OTK 7(ix)特征(A)名稱/鍵CDS(B)位置20..1288(C)鑒定方法S(xi)序列描述SEQ ID NO3ATGCGCGATC TCCCGGAGC ATG CGC AGC AGC GGC GCC GAC GCG GGG CGG TGC52Met Arg Ser Ser Gly Ala Asp Ala Gly Arg Cys1 5 10CTG GTG ACC GCG CGC GCT CCC GGA AGT GTG CCG GCG TCG CGC GAA GGT100Leu Val Thr Ala Arg Ala Pro Gly Ser Val Pro Ala Ser Arg Glu Gly15 20 25TCA GCA GGG AGC CGT GGG CCG GGC GCG CGG TTC CCG GCA CGT GTC TCG 148Ser Ala Gly Ser Arg Gly Pro Gly Ala Arg Phe Pro Ala Arg Val Ser30 35 40GCA CGT GGC AGC GCG CCT GGC CCT GGG CTT GGA GGC GCC GGC GCC CTG 196Ala Arg Gly Ser Ala Pro Gly Pro Gly Leu Gly Gly Ala Gly Ala Leu45 50 55GAT CCG CCG GCC GTG GTC GCC GAG TCG GTG TCG TCC TTG ACC ATC GCC 244Asp Pro Pro Ala Val Val Ala Glu Ser Val Ser Ser Leu Thr Ile Ala60 65 70 75GAC GCG TTC ATT GCA GCC GGC GAG AGC TCA GCT CCG ACC CCG CCG CGC 292Asp Ala Phe Ile Ala Ala Gly Glu Ser Ser Ala Pro Thr Pro Pro Arg80 85 90CCC GCG CTT CCC AGG AGG TTC ATC TGC TCC TTC CCT GAC TGC AGC GCC340Pro Ala Leu Pro Arg Arg Phe Ile Cys Ser Phe Pro Asp Cys Ser Ala95 100 105AAT TAC AGC AAA GCC TGG AAG CTT GAC GCG CAC CTG TGC AAG CAC ACG388Asn Tyr Ser Lys Ala Trp Lys Leu Asp Ala His Leu Cys Lys His Thr110 115 120GGG GAG AGA CCA TTT GTT TGT GAC TAT GAA GGG TGT GGC AAG GCC TTC436Gly Glu Arg Pro Phe Val Cys Asp Tyr Glu Gly Cys Gly Lys Ala Phe125 130 135ATC AGG GAC TAC CAT CTG AGC CGC CAC ATT CTG ACT CAC ACA GGA GAA484Ile Arg Asp Tyr His Leu Ser Arg His Ile Leu Thr His Thr Gly Glu140 145 150 155AAG CCG TTT GTT TGT GCA GCC AAT GGC TGT GAT CAA AAA TTC AAC ACA532Lys Pro Phe Val Cys Ala Ala Asn Gly Cys Asp Gln Lys Phe Asn Thr160 165 170AAA TCA AAC TTG AAG AAA CAT TTT GAA CGC AAA CAT GAA AAT CAA CAA580Lys Ser Asn Leu Lys Lys His Phe Glu Arg Lys His Glu Asn Gln Gln175 180 185AAA CAA TAT ATA TGC AGT TTT GAA GAC TGT AAG AAG ACC TTT AAG AAA628Lys Gln Tyr Ile Cys Ser Phe Glu Asp Cys Lys Lys Thr Phe Lys Lys190 195 200CAT CAG CAG ATG AAA ATC CAT CAG TGC CAG AAT ACC AAT GAA CCT CTA676His Gln Gln Met Lys Ile His Gln Cys Gln Asn Thr Ash Glu Pro Leu
205 210 215TTC AAG TGT ACC CAG GAA GGA TGT GGG AAA CAC TTT GCA TCA CCC AGC724Phe Lys Cys Thr Gln Glu Gly Cys Gly Lys His Phe Ala Ser Pro Ser220 225 230 235AAG CTG AAA CGA CAT GCC AAG GCC CAC GAG GGC TAT GTA TGT CAA AAA772Lys Leu Lys Arg His Ala Lys Ala His Glu Gly Tyr Val Cys Gln Lys240 245 250GGA TGT TCC TTT GTG GCA AAA ACA TGG ACG GAA CTT CTG AAA CAT GTG820Gly Cys Ser Phe Val Ala Lys Thr Trp Thr Glu Leu Leu Lys His Val255 260 265AGA GAA ACC CAT AAA GAG GAA ATA CTA TGT GAA GTA TGC CGG AAA ACA868Arg Glu Thr His Lys Glu Glu Ile Leu Cys Glu Val Cys Arg Lys Thr270 275 280TTT AAA CGC AAA GAT TAC CTT AAG CAA CAC ATG AAA ACT CAT GCC CCA916Phe Lys Arg Lys Asp Tyr Leu Lys Gln His Met Lys Thr His Ala Pro285 290 295GAA AGG GAT GTA TGT CGC TGT CCA AGA GAA GGC TGT GGA AGA ACC TAT964Glu Arg Asp Val Cys Arg Cys Pro Arg Glu Gly Cys Gly Arg Thr Tyr300 305 310 315ACA ACT GTG TTT AAT CTC CAA AGC CAT ATC CTC TCC TTC CAT GAG GAA1012Thr Thr Val Phe Asn Leu Gln Ser His Ile Leu Ser Phe His Glu Glu320 325 330AGC CGC CCT TTT GTG TGT GAA CAT GCT GGC TGT GGC AAA ACA TTT GCA1060Ser Arg Pro Phe Val Cys Glu His Ala Gly Cys Gly Lys Thr Phe Ala335 340 345ATG AAA CAA AGT CTC ACT AGG CAT GCT GTT GTA CAT GAT CCT GAC AAG 1108Met Lys Gln Ser Leu Thr Arg His Ala Val Val His Asp Pro Asp Lys350 355 360AAG AAA ATG AAG CTC AAA GTC AAA AAA TCT CGT GAA AAA CGG GAG TTT1156Lys Lys Met Lys Leu Lys Val Lys Lys Ser Arg Glu Lys ArG Glu Phe365 370 375GGC CTC TCA TCT CAG TGG ATA TAT CCT CCC AAA AGG AAA CAA GGG CAA1204Gly Leu Ser Ser Gln Trp Ile Tyr Pro Pro Lys Arg Lys Gln Gly Gln380 385 390 395GGC TTA TCT TTG TGT CAA AAC GGA GAG TCA CCC AAC TGT GTG GAA GAC1252Gly Leu Ser Leu Cys Gln Asn Gly Glu Ser Pro Asn Cys Val Glu Asp400 405 410AAG ATG CTC TCG ACA GTT GCA GTA CTT ACC CTT GGC TAAGAACTGC 1298Lys Met Leu Ser Thr Val Ala Val Leu Thr Leu Gly415 420ACTGCTTTGT TTAAAGGACT GCAGACCAAG GAGTCGAGCT TTCTCTCAGA GCATGCTTTT 1358CTTTATTAAA ATTACTGATG CAGAAAAAAA AAAAAAAAAA A 1399(2)SEQ ID NO4資料(i)序列特征(A)長度16個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲學線型(ii)分子類型cDNA
(xi)序列描述SEQ ID NO4ATGGTCAAGG ACGACA 16(2)SEQ ID NO5資料(i)序列特征(A)長度27個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲學線型(ii)分子類型cDNA(xi)序列描述SEQ ID NO5AATGAATTCA TAAGGACGAC ACCGACT27(2)SEQ ID NO6資料(i)序列特征(A)長度18個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲學線型(ii)分子類型cDNA(xi)序列描述SEQ ID NO6CCTCCAAGCC CAGGGCA 18(2)SEQ ID NO7資料(i)序列特征
(A)長度22個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲學線型(ii)分子類型cDNA(xi)序列描述SEQ ID NO7CAGAATCGAT AGTGAATTCG TG 22(2)SEQ ID NO8資料(i)序列特征(A)長度35個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲學線型(ii)分子類型cDNA(xi)序列描述SEQ ID NO8CACGAATTCA CTATCGATTC TGGAACCTTC AGACC 3權(quán)利要求
1.一種人轉(zhuǎn)錄因子IIIA基因,它編碼SEQ ID NO1所示的氨基酸序列。
全文摘要
本發(fā)明提供了一種含有編碼SEQ ID NO1所示氨基酸序列的堿基序列的hTFIIIA基因,特別是含有SEQ ID NO2所示的堿基序列的hTFIIIA基因。該基因能表達相應(yīng)的hTFIIIA蛋白質(zhì),該基因和蛋白質(zhì)用作轉(zhuǎn)錄調(diào)控因子,在遺傳疾病如癌癥或由轉(zhuǎn)錄控制的反常引起的其他疾病的診斷或鑒定中,以及其作用機理的分析中有用。
文檔編號A61P35/00GK1134460SQ9511713
公開日1996年10月30日 申請日期1995年9月5日 優(yōu)先權(quán)日1994年9月5日
發(fā)明者藤原力, 武田圣, 田良和, 尾崎浩一, 申貞均 申請人:大塚制藥株式會社