專利名稱:人激素原轉(zhuǎn)化酶4的制作方法
背景技術(shù):
許多以前體形式合成的蛋白質(zhì)和激素均經(jīng)過高度特異性的、屬于激素原轉(zhuǎn)化酶家族的蛋白酶加工而成為成熟形式。這一哺乳動(dòng)物內(nèi)切蛋白酶家族在它們的底物多肽中二堿性氨基酸位點(diǎn)的羧基側(cè)進(jìn)行胞內(nèi)切割。此激素原轉(zhuǎn)化酶(PC)家族的成員均為與酵母二堿性氨基酸特異性內(nèi)切蛋白酶Kex2相關(guān)的Ca++依賴性絲氨酸蛋白酶(Smeekins,S.P.,Bio/Technology 11182-186,1993)。而且其催化區(qū)的構(gòu)成與細(xì)菌性的枯草桿菌蛋白酶相似。至少已發(fā)現(xiàn)6種哺乳動(dòng)物激素原轉(zhuǎn)化酶PC2,PC3/PC1,PC4,PC5/6,弗林蛋白酶/成對(duì)堿性氨基酸切割酶(furin/PACE)和PACE4(Smeekins,S.P.,同出處,Seidah,N.G.等,Biochimie(France)76197-209,1994)。
哺乳動(dòng)物激素原轉(zhuǎn)化酶作用于多種有生物學(xué)活性排列的前體分子。胰島素原是第一個(gè)得到鑒定的底物前體。隨后,從酵母到哺乳動(dòng)物已發(fā)現(xiàn)超過150種底物;包括神經(jīng)肽、肽激素、生長因子及其受體、血漿和凝固蛋白、逆轉(zhuǎn)錄病毒包膜蛋白和細(xì)胞毒素如碳疽。切割位點(diǎn)處包括堿性氨基酸,切割發(fā)生在成對(duì)的堿性殘基處,通常在Lys-Arg或Arg-Arg之后,較少見在Arg-Lys或Lys-Lys之后(Smeekins,S.P.,同出處)。
激素原轉(zhuǎn)化酶家族有組織特異性表達(dá)和細(xì)胞區(qū)室化性質(zhì),這可能與生物學(xué)功能有關(guān)。例如,PC1/3和PC2只在神經(jīng)內(nèi)分泌組織中表達(dá)。這些蛋白質(zhì)的生物學(xué)活性局限在神經(jīng)內(nèi)分泌細(xì)胞中、特別是分泌顆粒中受調(diào)節(jié)的分泌途徑上;且這兩種蛋白質(zhì)均在顆粒中前體如胰高血糖素原,阿黑皮素原(POMC)和胰島素原的加工過程中有重要作用。故,其胞內(nèi)定位和組織特異性看來反映了這些內(nèi)切蛋白酶顯示其生物學(xué)活性的所在部位。
PC4的基因表達(dá)有高特異性的組織選擇性。PC4已從小鼠和大鼠中分離得到,且只表達(dá)于睪丸中。在小鼠體內(nèi),PC4基因表達(dá)發(fā)生在與精子發(fā)生第一階段相應(yīng)的妊娠第20天左右。在生殖細(xì)胞中發(fā)現(xiàn)有高水平的PC4m RNA表達(dá),但在間質(zhì)細(xì)胞(Leydig’s Cell),足細(xì)胞(Sertoli’s Cell)或生精小管周圍細(xì)胞(peritubular cell)中未有發(fā)現(xiàn)。原位雜交證實(shí)在粗線期精母細(xì)胞和圓精子細(xì)胞中有mRNA表達(dá),但在延長的精子細(xì)胞中不表達(dá)(N.G.Seidah等,分子內(nèi)分泌學(xué),61559-1570,1992)。而且,在大鼠和小鼠中均發(fā)現(xiàn)三種PC4 mRNA;這些RNA可能是由于不同的剪接和/或外顯子跳躍事件產(chǎn)生的。衍生自主要剪接形式或其它剪接形式的小鼠和大鼠PC4蛋白質(zhì)的生物學(xué)功能尚不清楚。
精子發(fā)生是發(fā)生在生精小管(生殖細(xì)胞或稱精細(xì)胞在此最終成熟為精子)中的連續(xù)過程。睪丸中產(chǎn)生的肽均為介導(dǎo)睪丸細(xì)胞相互作用的潛在旁分泌因子和自分泌因子。大部分已知的這些潛在肽底物均產(chǎn)生于間質(zhì)細(xì)胞和足細(xì)胞這些非生殖細(xì)胞中。位于生精小管中的足細(xì)胞與生殖細(xì)胞接觸,并可能直接產(chǎn)生影響生殖細(xì)胞成熟的睪丸特異性因子。影響生殖細(xì)胞的其它因子可能是旁分泌因子或內(nèi)分泌因子;產(chǎn)生于生精小管外的這些分子中大多數(shù)由足細(xì)胞表達(dá)的轉(zhuǎn)運(yùn)和結(jié)合蛋白運(yùn)送進(jìn)生殖細(xì)胞微環(huán)境中。此外,能穿過細(xì)胞屏障并進(jìn)入精子細(xì)胞微環(huán)境的旁分泌因子包括間質(zhì)細(xì)胞分泌的分子。間質(zhì)細(xì)胞位于生精小管之間存在的胞間隙內(nèi),產(chǎn)生好幾種可能在成熟過程中很重要的因子,如睪酮,間質(zhì)因子(Leydig factor),IGF-1,抑制素和prohibin。這些因子及其它因子可能在精子發(fā)生周期中的某一確定階段內(nèi)特異作用。而且,與足細(xì)胞十分接近的生殖細(xì)胞中表達(dá)的某些肽激素是潛在的介導(dǎo)睪丸細(xì)胞相互作用的旁分泌因子和自分泌因子。例如阿片樣肽,POMC和腦啡肽原均在生殖細(xì)胞中表達(dá)并可能會(huì)被加工。有趣的是,鼠腦啡肽原的mRNA表達(dá)與精子發(fā)生期間鼠PC4的mRNA表達(dá)形式相似(S.Torii,等,F(xiàn)EBS Let.31612-16,1993)。鼠PC4的階段特異性表達(dá)暗示它在加工睪丸的激素原因子的過程中有生物學(xué)作用。雖然推測(cè)PC4在精子發(fā)生中有作用,但PC4的功能實(shí)際上并不清楚。
因此要尋找人類同系物。本發(fā)明便利地提供了鼠PC4的人類同系物的分離。
發(fā)明概要本發(fā)明提供了編碼人激素原轉(zhuǎn)化酶4多肽的分離多核苷酸,該多肽所含的一段氨基酸序列至少90%等同于選自下組的氨基酸序列(a)SEQ ID No2所示114位氨基酸(Ser)至443位氨基酸(Ala)的氨基酸序列;(b)SEQ ID No2所示114位氨基酸(Ser)至755位氨基酸(Thr)的氨基酸序列;(c)SEQ ID No2所示20位氨基酸(Arg)至755位氨基酸(Thr)的氨基酸序列;及(d)SEQ ID No2所示1位氨基酸(Met)至755位氨基酸(Thr)的氨基酸序列。在另一個(gè)實(shí)施方案中,上文公開的分離的人激素原轉(zhuǎn)化酶4多核苷酸選自下組(a)SEQ ID No1所示400位至1389位核苷酸的多核苷酸序列;(b)SEQ ID No1所示400-2325位核苷酸的多核苷酸序列;(c)SEQ ID No1所示118-2325位核苷酸的多核苷酸序列;及(d)SEQ ID No1所示61-2325位核苷酸的多核苷酸序列。在另一個(gè)實(shí)施方案中,上文公開的分離的人激素原轉(zhuǎn)化酶4多核苷酸包含SEQ ID No3所示1-2265位核苷酸。在另一個(gè)實(shí)施方案中,上述分離的人激素原轉(zhuǎn)化酶4多核苷酸編碼的人激素原轉(zhuǎn)化酶4多肽基本上由至少90%等同于SEQ ID No2所示20位(Arg)-755位(Thr)氨基酸序列的氨基酸殘基序列組成。在另一個(gè)實(shí)施方案中,上述分離的多核苷酸編碼的人激素原轉(zhuǎn)化酶4多肽基本上由SEQ IDNo2所示20位(Arg)-755位(Thr)氨基酸殘基的序列組成。
第二方面,本發(fā)明提供含有以下可操作連接在一起的元件的表達(dá)載體轉(zhuǎn)錄啟動(dòng)子;編碼至少90%等同于SEQ ID No2中20位(Arg)-755位(Thr)所示氨基酸序列的激素原轉(zhuǎn)化酶多肽的DNA區(qū)段;轉(zhuǎn)錄終止子。在另一實(shí)施方案中,上述表達(dá)載體進(jìn)一步包含與該DNA區(qū)段可操作連接的分泌信號(hào)序列。
第三方面,本發(fā)明提供已導(dǎo)入上述表達(dá)載體的培養(yǎng)細(xì)胞,其中所述細(xì)胞表達(dá)該DNA區(qū)段編碼的多肽。
另一方面,本發(fā)明提供編碼融合蛋白的DNA構(gòu)建體,該DNA構(gòu)建體包含至少90%等同于選自下組之氨基酸殘基序列的多肽的第一DNA編碼區(qū)段(a)SEQ ID No2中1位(Met)-21位(Pro)殘基的氨基酸序列;(b)SEQ ID No2中20位(Arg)至113位(Arg)殘基的氨基酸序列;(c)SEQ ID No2中114位(Ser)-443位(Ala)殘基的氨基酸序列;(d)SEQ ID No2中444位(Arg)-561位(Tyr)殘基的氨基酸序列;(e)SEQ ID No2中562位(Tyr)-755位(Thr)殘基的氨基酸序列;(f)SEQ ID No2中114位(Ser)-755位(Thr)殘基的氨基酸序列;(g)SEQ ID No2中20位(Arg)-755位(Thr)殘基的氨基酸序列;以及另含編碼額外多肽的至少一個(gè)其它DNA區(qū)段,其中該第一DNA區(qū)段和該其它DNA區(qū)段讀框一致地連接,并編碼融合蛋白。另一實(shí)施方案中,本發(fā)明提供由以下方法產(chǎn)生的融合蛋白培養(yǎng)已導(dǎo)入了含有以下可操作連接在一起的元件的載體的宿主細(xì)胞(a)轉(zhuǎn)錄啟動(dòng)子;(b)編碼上述融合蛋白的DNA構(gòu)建體;及(c)轉(zhuǎn)錄終止子;然后回收由該DNA區(qū)段編碼的蛋白質(zhì)。
另一方面,本發(fā)明提供分離的多肽,其所含的一段氨基酸序列至少90%等同于選自下組的氨基酸序列(a)SEQ ID No2中114位(Ser)-443位(Ala)氨基酸的氨基酸序列;(b)SEQ ID No2中114位(Ser)-755位(Thr)的氨基酸序列;(c)SEQ ID No2中20位(Arg)-755位(Thr)的氨基酸序列;及(d)SEQ ID No2中1位(Met)至755位(Thr)的氨基酸序列。另一個(gè)實(shí)施方案中,上述分離的多肽基本上由至少90%等同于SEQ ID No2中20位(Arg)-755位(Thr)之氨基酸序列的序列組成。另一實(shí)施方案中,上述分離的多肽就是SEQ ID No2中20位(Arg)-755位(Thr)所示的氨基酸序列。
另一方面,本發(fā)明提供產(chǎn)生人激素原轉(zhuǎn)化酶4多肽的方法,包括培養(yǎng)上述細(xì)胞;分離由上述細(xì)胞產(chǎn)生的人激素原轉(zhuǎn)化酶多肽。
另一方面,本發(fā)明提供測(cè)定人激素原轉(zhuǎn)化酶4多肽的多肽激素原底物的方法,包括培養(yǎng)已導(dǎo)入有上述表達(dá)載體的細(xì)胞,其中該細(xì)胞表達(dá)由該DNA區(qū)段編碼的人激素原轉(zhuǎn)化酶多肽,并同時(shí)表達(dá)檢驗(yàn)底物激素原多肽;檢測(cè)人激素原轉(zhuǎn)化酶4切割該檢驗(yàn)底物而產(chǎn)生的切割產(chǎn)物。另一實(shí)施方案中,測(cè)定人激素原轉(zhuǎn)化酶4多肽的多肽激素原底物的方法包括體外將權(quán)利要求11的激素原轉(zhuǎn)化酶4多肽與檢驗(yàn)底物多肽混合;檢測(cè)因人激素原轉(zhuǎn)化酶4多肽切割檢驗(yàn)底物而產(chǎn)生的切割產(chǎn)物。
另一方面,本發(fā)明提供檢測(cè)待檢樣品中有無人激素原轉(zhuǎn)化酶多肽活性的調(diào)節(jié)子的方法,包括在有或無待檢樣品的情況下培養(yǎng)已導(dǎo)入上述表達(dá)載體的細(xì)胞,其中該細(xì)胞表達(dá)由上述DNA區(qū)段編碼的人激素原轉(zhuǎn)化酶多肽,并同時(shí)表達(dá)已知的指示性激素原多肽底物;用生物學(xué)或生物化學(xué)方法比較有或沒有待檢樣品時(shí),因人激素原轉(zhuǎn)化酶多肽切割底物而產(chǎn)生的切割產(chǎn)物水平;并通過比較確定檢驗(yàn)樣品中是否存在人激素原轉(zhuǎn)化酶活性的調(diào)節(jié)子。
另一方面,本發(fā)明提供生產(chǎn)人激素原轉(zhuǎn)化酶4多肽的抗體的方法,包括用選自下組的多肽接種動(dòng)物(a)含9-755個(gè)氨基酸的多肽,其中該多肽至少90%等同于SEQ ID NO2所示20位(Arg)-755位(Ser)序列中的一段連續(xù)序列;(b)上述多肽;(c)其序列至少90%等同于SEQ ID No2中444位(Arg)至561位(Tyr)氨基酸的多肽;及(d)其氨基酸序列至少90%等同于SEQ ID No2中562位(Tyr)氨基酸至755位(Thr)的多肽,其中該多肽在動(dòng)物體內(nèi)能激發(fā)免疫應(yīng)答;然后從動(dòng)物內(nèi)分離抗體。另一實(shí)施方案中,上述方法產(chǎn)生的抗體可與人激素原轉(zhuǎn)化酶4多肽結(jié)合。另一實(shí)施方案中,上述抗體為單克隆抗體。
另一方面,本發(fā)明提供可與上述多肽特異性結(jié)合的抗體。
本發(fā)明的這些及其它方面在參考了以下詳細(xì)說明和附圖
之后將變得明顯。
圖的簡(jiǎn)述此圖是人PC1、人PC2、大鼠PC4、小鼠PC4、本發(fā)明的新型人PC4、小鼠弗林蛋白酶及人弗林蛋白酶的多重對(duì)比。
發(fā)明詳述詳述本發(fā)明之前,確定以下術(shù)語可能將有助于理解本發(fā)明術(shù)語“親和標(biāo)記”表示一段多肽區(qū)段,它能附著于第二多肽,以便純化或檢測(cè)第二多肽,或使第二多肽可通過它提供的位點(diǎn)附著于底物上。原則上,有抗體或其它特異性結(jié)合因子可供使用的任何肽或蛋白質(zhì)均可用作親和標(biāo)記。親和標(biāo)記包括多聚組氨酸段,蛋白A(Nilsson等,EMBO J.41075,1985;Nilsson等,酶學(xué)方法,1983,1991),谷胱苷肽S-轉(zhuǎn)移酶(Smith和Johnson,基因6731,1988),Glu-Glu親和標(biāo)記(Grussenmeyer等,美國國家科學(xué)院院報(bào)827952-4,1985),物質(zhì)P,F(xiàn)lagTM肽(Hopp等,生物技術(shù)學(xué)61204-1210,1988;可由Eastman Kodak公司,New Haven,CT提供),鏈霉抗生物素蛋白結(jié)合肽,或其它抗原性表位或結(jié)合區(qū)??傄奆ord等,蛋白質(zhì)表達(dá)和純化295-107,1991。編碼親和標(biāo)記的DNA可由生產(chǎn)商(如PharmaciaBiotech,Piscataway,NJ)提供。
術(shù)語“等位變體”表示一個(gè)基因占據(jù)相同染色體位點(diǎn)的兩種或多種可互換形式的任一種。等位變體通過突變自然產(chǎn)生,并可能導(dǎo)致種群內(nèi)表型多樣化?;蛲蛔兛梢允浅聊?編碼的多肽沒有改變),或可以編碼有改變的氨基酸序列的多肽。術(shù)語等位變體此處也用于表示由基因的等位變體編碼的蛋白質(zhì)。
“氨基末端”和“羧基末端”用來表示多肽中的位置。在內(nèi)容允許之處,這些術(shù)語用于表示參照某一多肽特定序列或部分的接近度或相對(duì)位置。例如,位于多肽中參照序列羧基端的某序列即是在參照序列羧基末端附近,但不必在完整多肽的羧基末端。
術(shù)語“切割產(chǎn)物”表示由激素原轉(zhuǎn)化酶切割未加工的激素原多肽而產(chǎn)生的激素原多肽片段。
“互補(bǔ)物/反互補(bǔ)物對(duì)”表示在適當(dāng)條件下形成非共價(jià)結(jié)合的穩(wěn)定對(duì)的非相同部分。如,生物素和抗生物素蛋白(或鏈霉抗生物素蛋白)就是互補(bǔ)物/反互補(bǔ)物對(duì)的典型。其它互補(bǔ)物/反互補(bǔ)物對(duì)的例子有受體/配體對(duì),抗體/抗原(或半抗原或表位)對(duì),有義/反義多核苷酸對(duì)等等。在互補(bǔ)物/反互補(bǔ)物對(duì)需要隨后解離之處,互補(bǔ)物/反互補(bǔ)物對(duì)優(yōu)選結(jié)合親和力小于109M-1。
“多核苷酸分子的互補(bǔ)物”是與參照序列相比有互補(bǔ)堿基序列并方向相反的多核苷酸分子。例如序列5’ATGCACGGG3’與5’CCCGTGCAT3’互補(bǔ)。
“簡(jiǎn)變核苷酸序列”表示含一個(gè)或多個(gè)簡(jiǎn)變密碼子(與編碼多肽的參照多核苷酸分子相比)的核苷酸序列。簡(jiǎn)變密碼子包含不同的核苷酸三聯(lián)體,但通常編碼相同的氨基酸殘基(即,GAU和GAC三聯(lián)密碼均編碼Asp)。
“DNA構(gòu)建體”為單或雙鏈的線性或環(huán)狀DNA分子,包含以自然界沒有的方式結(jié)合和并列的DNA區(qū)段。DNA構(gòu)建體是人為操作的結(jié)果,包括被操作分子的克隆及其它拷貝。
“DNA區(qū)段”是大DNA分子的有特定意義的部分。如編碼特定多肽的DNA區(qū)段是更長DNA分子(如質(zhì)?;蛸|(zhì)粒片段)的一部分,當(dāng)從5’至3’方向閱讀時(shí)可編碼特定多肽的氨基酸序列。
“表達(dá)載體”表示線性或環(huán)狀DNA分子,其中有編碼目的多肽的區(qū)段與提供其轉(zhuǎn)錄的其它區(qū)段可操作連接。這類其它區(qū)段包括啟動(dòng)子和終止子序列,還可能包括一個(gè)或多個(gè)復(fù)制起點(diǎn),一個(gè)或多個(gè)選擇標(biāo)記,增強(qiáng)子,多聚腺苷酸化信號(hào)等。表達(dá)載體一般來源于質(zhì)?;虿《綝NA,或可能有兩者的元件。
“分離的”,當(dāng)用于多核苷酸時(shí),表示該多核苷酸已脫離其天然遺傳環(huán)境,并因此不含其它無關(guān)或不需要的編碼序列,并且是適于在基因工程性蛋白質(zhì)生產(chǎn)系統(tǒng)中應(yīng)用的形式。這類分離分子是那些與其天然環(huán)境分開的分子,包括cDNA和基因組克隆。本發(fā)明的分離DNA分子不含正常與之相關(guān)的其它基因,但可能包含天然存在的5’和3’非翻譯區(qū),如啟動(dòng)子和終止子等。相關(guān)區(qū)域的鑒定對(duì)本領(lǐng)域內(nèi)的技術(shù)人員是顯而易見的(見如,Dynan和Tijan,自然316774-78,1985)。
“分離的”多肽或蛋白質(zhì)是在不同于其天然環(huán)境的條件(如與血液和動(dòng)物組織分開)下存在的多肽或蛋白質(zhì)。優(yōu)選地,分離多肽基本上不含其它多肽,尤其不含其他動(dòng)物源性多肽。優(yōu)選提供高度純化形式的多肽,即大于95%純,更優(yōu)選地大于99%純。應(yīng)用于本文中時(shí),術(shù)語“分離的”不排除相同多肽以其它物理形式存在,如二聚體或者糖基化的或衍生的形式。
“可操作地連接的”,當(dāng)用于DNA區(qū)段時(shí),表示各區(qū)段經(jīng)安排能發(fā)揮預(yù)期功能,如在啟動(dòng)子內(nèi)起始轉(zhuǎn)錄并延伸通過編碼區(qū)段直至終止子。
“正同系物(ortholog)”表示得自一個(gè)物種的多肽或蛋白質(zhì)為另一物種的多肽或蛋白質(zhì)的功能相對(duì)物。正同系物之間的序列差異是物種形成的結(jié)果。
“副同系物(paralog)”是由一種生物體產(chǎn)生的相互區(qū)別但又結(jié)構(gòu)相關(guān)的蛋白質(zhì)。副同系物被認(rèn)為是通過基因重復(fù)產(chǎn)生的。例如α-珠蛋白,β-珠蛋白和肌紅蛋白互為副同系物。
“多核苷酸”為從5’末端讀至3’末端的脫氧核糖核苷酸或核糖核苷酸堿基的單鏈或雙鏈多聚體。多核苷酸包括RNA和DNA,可分離自天然來源,可體外合成,或結(jié)合天然分子與合成分子而制成。多核苷酸的大小表示為堿基對(duì)(縮寫“bp”),核苷酸(“nt”),或千堿基(“kb”)。只要內(nèi)容允許,后兩個(gè)術(shù)語可描述單鏈或雙鏈的多核苷酸。當(dāng)用于指雙鏈分子時(shí),表示的是全長,應(yīng)理解為等同于術(shù)語“堿基對(duì)”。本領(lǐng)域內(nèi)技術(shù)人員將認(rèn)識(shí)到雙鏈多核苷酸的兩條鏈長度可能稍有不同,其末端可能因酶切而成交錯(cuò)切口狀;因而雙鏈多核苷酸分子中的所有核苷酸不一定配對(duì)。這些未配對(duì)的末端長度一般不超過20nt。
“多肽”是天然產(chǎn)生的或合成的以肽鍵連接的氨基酸殘基多聚體。不足約10個(gè)氨基酸殘基的多肽通常稱為“肽”。
“啟動(dòng)子”在此用其本領(lǐng)域公認(rèn)的含義表示含有可結(jié)合RNA聚合酶并起始轉(zhuǎn)錄的DNA序列的基因部分。啟動(dòng)子序列常發(fā)現(xiàn)位于基因的5’非編碼區(qū),但并不總是這樣。
“蛋白質(zhì)”是包含一條或多條多肽鏈的大分子。蛋白質(zhì)也可含非肽成分,如糖基。糖和其它非肽取代基可由產(chǎn)生該蛋白質(zhì)的細(xì)胞加在蛋白質(zhì)上,且在不同細(xì)胞類型中各不相同。蛋白質(zhì)在本文以其氨基酸骨架結(jié)構(gòu)限定;取代基如糖基通常不特別指明,但可存在。
“分泌信號(hào)序列”表示編碼一種多肽(“分泌肽”)的DNA序列,該多肽作為較大多肽的一個(gè)成分,可指導(dǎo)該較大多肽穿過合成它的細(xì)胞的分泌途徑。該較大多肽常在經(jīng)分泌途徑的轉(zhuǎn)運(yùn)期間被切除掉分泌肽。分泌信號(hào)序列將多肽導(dǎo)入細(xì)胞的分泌途徑,但可能引導(dǎo)或不引導(dǎo)含該序列的多肽從細(xì)胞中真正分泌出來。
“剪接變體”表示由基因轉(zhuǎn)錄出來的的RNA的諸可互換形式。剪接變體一般通過利用轉(zhuǎn)錄RNA分子內(nèi)(或較少情況下是分別轉(zhuǎn)錄的RNA分子之間)的可互換剪接位點(diǎn)而天然產(chǎn)生,并可由同一基因轉(zhuǎn)錄好幾種mRNA。剪接變體可編碼含不同氨基酸序列的多肽。術(shù)語剪接變體用在本文中還表示由基因轉(zhuǎn)錄出來的mRNA的剪接變體編碼的蛋白質(zhì)。
由不精確分析法(如凝膠電泳)測(cè)定的聚合體分子量和長度應(yīng)理解為近似值。當(dāng)這樣一個(gè)值表示為“約”X或“近似”X時(shí),X值應(yīng)被理解為精確至±10%。
本文引用的所有文獻(xiàn)均全文引入作為參考文獻(xiàn)。
本發(fā)明部分基于一個(gè)新DNA序列的發(fā)現(xiàn),該DNA序列編碼同源于激素原轉(zhuǎn)化酶家族(如小鼠和大鼠PC4,PC2,PC1,弗林蛋白酶)的蛋白質(zhì)。該DNA序列命名為人激素原轉(zhuǎn)化酶4,本文縮寫為“人PC4”。分析對(duì)應(yīng)于這種新cDNA的mRNA的組織分布發(fā)現(xiàn),mRNA僅限于睪丸中表達(dá)。這種組織特異性表達(dá)說明它能夠作為激素原轉(zhuǎn)化酶起作用,完全或部分地加工生長或分化因子的激素原多肽,使之成為睪丸特異性和非睪丸細(xì)胞類型的成熟或活化形式。
哺乳動(dòng)物激素原轉(zhuǎn)化酶有共同的結(jié)構(gòu)特征??傄奡meekins.S.P.,文獻(xiàn)同上,和Seidah,N.,酶學(xué)方法(Methods in Enz.),244175-188,1995。所有這類分子均包含一個(gè)N-末端分泌肽,可指導(dǎo)該蛋白質(zhì)進(jìn)入分泌途徑。該區(qū)后隨有Homo-A區(qū)(似乎與蛋白酶折疊有關(guān))。經(jīng)自我催化去除Homo-A區(qū)是蛋白酶解活化必需的。Homo-A區(qū)之后是催化區(qū)(為活性所必需)。催化區(qū)的氨基酸序列與枯草桿菌蛋白酶催化區(qū)極其相似。緊鄰催化區(qū)是Homo-B區(qū)(亦為酶活性所必需)。此區(qū)之外,在C末端,激素原轉(zhuǎn)化酶出現(xiàn)結(jié)構(gòu)多樣化。C末端區(qū)的功能未知,但似乎與哺乳動(dòng)物激素原轉(zhuǎn)化酶的細(xì)胞和細(xì)胞器特異性定向有關(guān)。
本發(fā)明提供新型人激素原轉(zhuǎn)化酶。對(duì)編碼激素原轉(zhuǎn)化酶的人cDNA(SEQ ID No1)的分析揭示,其中有編碼755個(gè)氨基酸(SEQ ID No2)的一個(gè)開放讀框,包含一段假定的分泌肽(見SEQ ID No2的1位(Met)至19位(Val)殘基)和一段成熟肽(見SEQ ID No2的20位(Arg)至755位(Thr)殘基)。如圖所示,該成熟多肽與Kex2內(nèi)切蛋白酶家族中包括大鼠和小鼠PC4,人弗林蛋白酶,人PC1和人PC2在內(nèi)的其它成員有同源性。如上所述,該蛋白質(zhì)家族的特征是有保守的枯草桿菌蛋白酶樣催化區(qū)(見SEQ ID No2的114位(Ser)至443位(Ala)殘基),該區(qū)氨基末端和羧基末端側(cè)翼分別為不那么保守的Homo-A區(qū)(見,SEQ IDNo2的20位(Arg)至113位(Arg)殘基)和Homo-B區(qū)(見,SEQ ID No2的444位(Arg)至561位(Tyr)殘基)(Nakayama等,生物化學(xué)雜志(東京),109803-806,1991)。大鼠和小鼠PC4中的活性位點(diǎn)Asp,His和Ser殘基以及對(duì)催化比較重要的殘基Asn在人PC4中是保守的(見,SEQ ID No2,殘基Asp-158,His-198,Ser-372和Asn-300)。信號(hào)肽酶切割位點(diǎn)預(yù)計(jì)在人激素原轉(zhuǎn)化酶比對(duì)中的19號(hào)殘基(Val)之后。發(fā)現(xiàn)于所有已知哺乳動(dòng)物激素原轉(zhuǎn)化酶內(nèi)的保守的Arg-Gly-Asp序列(見SEQ ID No2的503-505號(hào)殘基)存在于人PC4中(Nakayama,文獻(xiàn)同上,及其中的參考文獻(xiàn))。預(yù)計(jì)人PC4合成為前體酶(酶原),需在C末端側(cè)自我催化切除Arg-Arg-Val-Lys-Arg(SEQID No4;亦見SEQ ID No2的109位(Arg)至113位(Arg)殘基)序列才產(chǎn)生活性酶。Kex2和大鼠PC4中已發(fā)現(xiàn)有相似的酶原活化序列(Nakayama等,生物化學(xué)雜志(東京),109803-806,1991)。人PC4唯一的C末端區(qū)(見,SEQ ID No2的562位(Tyr)至755位(Thr)殘基)與弗林蛋白酶的序列高度相同。此區(qū)的功能可能涉及細(xì)胞和細(xì)胞器特異性定向。
位于如人PC4的枯草桿菌蛋白酶樣催化區(qū)中高度保守的氨基酸可用作鑒定新家族成員的工具。例如,可用逆轉(zhuǎn)錄-聚合酶鏈?zhǔn)椒磻?yīng)(RT-PCR),從各種組織來源或細(xì)胞系的RNA擴(kuò)增編碼保守的枯草桿菌蛋白酶樣催化區(qū)的序列。尤其,根據(jù)人PC4序列設(shè)計(jì)的高度簡(jiǎn)并引物可用于此目的。
本發(fā)明還提供編碼本文所公開的人PC4多肽的多核苷酸分子(包括DNA和RNA分子)。本領(lǐng)域內(nèi)技術(shù)人員易于認(rèn)識(shí)到,由于遺傳密碼的簡(jiǎn)并性,這些多核苷酸分子之中可能有相當(dāng)量的序列變異。SEQ ID No3是包括所有編碼SEQ ID No2的人PC4多肽的DNA的簡(jiǎn)并DNA序列。本領(lǐng)域內(nèi)技術(shù)人員將認(rèn)識(shí)到,SEQ ID No3的簡(jiǎn)并序列通過以T代替U也可提供所有編碼SEQ ID No2的RNA序列。因此,包含SEQ ID No31-2265位核苷酸的編碼人PC4多肽的多核苷酸及其RNA對(duì)應(yīng)體均包括在本發(fā)明中。表1公開了SEQ ID No3中用于表示簡(jiǎn)并核苷酸位置的單字母密碼?!敖馕觥睘槊艽a字母所表示的核苷酸。“互補(bǔ)物”表示互補(bǔ)核苷酸的密碼。例如,密碼Y表示C或T,它的互補(bǔ)物R表示A或G,A為T的互補(bǔ),G為C的互補(bǔ)。
表1核苷酸解析核苷酸互補(bǔ)物A A T TC C G GG G C CT T A AR A|G Y C|TY C|T R A|GM A|C K G|TK G|T M A|CS C|G S C|GW A|T W A|TH A|C|T D A|G|TB C|G|T V A|C|GV A|C|G B C|G|TD A|G|T H A|C|TN A|C|G|T N A|C|G|T表2給出了SEQ ID NO3中所用的簡(jiǎn)并密碼子,包括一個(gè)給定氨基酸的所有可能密碼子。表2氨基酸單字母 密碼子 簡(jiǎn)并密碼子密碼子Cys C TGC TGTTGYSer S AGC AGT TCA TCC TCG TCTWSNThr T ACA ACC ACG ACTACNPro P CCA CCC CCG CCTCCNAla A GCA GCC GCG GCTGCNGly G GGA GGC GGG GGTGGNAsn N AAC AATAAYAsp D GAC GATGAYGlu E GAA GAGGARGln Q CAA CAGCARHis H CAC CATCAYArg R AGA AGG CGA CGC CGG CGTMGNLys K AAA AAGAARMet M ATGATGIle I ATA ATC ATTATHLeu L CTA CTC CTG CTT TTA TTGYTNVal V GTA GTC GTG GTTGTNPhe F TTC TTTTTYTyr Y TAC TATTAYTrp W TGGTGGTer . TAA TAG TGATRRAsn|Asp B RAYGlu|Gln Z SARAny X NNN
本領(lǐng)域內(nèi)技術(shù)人員將贊賞在確定編碼每種氨基酸的所有可能密碼子的簡(jiǎn)并密碼子時(shí)導(dǎo)入某些模糊用法。例如,絲氨酸的簡(jiǎn)并密碼子(WSN)有時(shí)可編碼精氨酸(AGR),精氨酸的簡(jiǎn)并密碼子(MGN)有時(shí)編碼絲氨酸(AGY)。相似的關(guān)系存在于編碼苯丙氨酸和亮氨酸的密碼子之間。故,簡(jiǎn)并序列包括的某些多核苷酸可編碼氨基酸序列變體,而本領(lǐng)域內(nèi)技術(shù)人員能輕易地參照SEQ ID No2的氨基酸序列鑒別出這種變異序列。本文所述變體序列可易于檢驗(yàn)其功能。
本領(lǐng)域內(nèi)技術(shù)人員還能夠理解不同物種可存在“偏愛密碼子用法”。其可參見,Grantham,等,核酸研究,81893-912,1980;Haas,等,Curr.Biol.6315-24,1996;Wain-Hobson,等,基因13355-64,1981;Grosjean和Fiers,基因18199-209,1982;Holm,核酸研究143075-87,1986;Ikemura,分子生物學(xué)雜志158573-97,1982。本文所用術(shù)語“偏愛密碼子用法”或“偏愛密碼子”指在某一物種的細(xì)胞中使用最頻繁的蛋白質(zhì)翻譯密碼子,故優(yōu)選編碼每種氨基酸的可能密碼子中的一個(gè)或幾個(gè)代表(見表2)。例如,蘇氨酸(Thr)可由ACA,ACC,ACG或ACT編碼,但在哺乳動(dòng)物細(xì)胞中ACC最為常用;在其它物種,如昆蟲細(xì)胞,酵母,病毒或細(xì)菌中可能優(yōu)選其它Thr密碼子。某一特定物種的偏愛密碼子可通過本領(lǐng)域內(nèi)已知的各種方法導(dǎo)入本發(fā)明的多核苷酸。將偏愛密碼子序列導(dǎo)入重組DNA能,例如,通過使蛋白質(zhì)在特定細(xì)胞類型或物種中更有效地翻譯而增加該蛋白質(zhì)的產(chǎn)量。因此,SEQ ID No3中公開的簡(jiǎn)并密碼子序列可作為模板用于優(yōu)化多核苷酸在本領(lǐng)域常用的和本文公開的各種細(xì)胞類型和物種中的表達(dá)??蓹z驗(yàn)并優(yōu)化含偏愛密碼子的序列在不同物種中的表達(dá),并如本文所述檢驗(yàn)功能。
在本發(fā)明的優(yōu)選實(shí)施方案中,所分離的多核苷酸能在嚴(yán)緊條件下與SEQ ID No1中的大小相似區(qū),或與其互補(bǔ)序列雜交。通常所選嚴(yán)緊條件為在確定的離子強(qiáng)度和pH下比特定序列的解鏈溫度(Tm)低約5℃。Tm為有50%靶序列與完全匹配的探針雜交上的溫度(在確定的離子強(qiáng)度和pH下)。典型的嚴(yán)緊條件是其中NaCl濃度在pH7時(shí)高達(dá)約0.03M,溫度至少約60℃。
如前文已述,本發(fā)明的分離的多核苷酸包括DNA和RNA。制備DNA和RNA的方法為本領(lǐng)域內(nèi)熟知。通常,RNA分離自可生產(chǎn)大量人PC4 RNA的組織或細(xì)胞。這樣的組織和細(xì)胞由Northern印跡鑒定(Thomas,美國國家科學(xué)院院報(bào)775201,1980),包括睪丸組織及睪丸衍生的細(xì)胞系??俁NA的制備可以是用鹽酸胍抽提再經(jīng)CsCl梯度離心分離(Chirgwin等,生物化學(xué)1852-94,1979)。poly(A)+RNA可用Aviv和Leder的方法從總RNA中制備(美國國家科學(xué)院院報(bào)691408-12,1972)?;パa(bǔ)DNA(cDNA)可用已知方法從Poly(A)+RNA制備?;蛘?,可分離基因組DNA。再經(jīng)如雜交或PCR鑒定并分離編碼人PC4多肽的多核苷酸。
編碼人PC4的全長克隆可經(jīng)經(jīng)典克隆程序獲得。優(yōu)選互補(bǔ)DNA(cDNA)克隆,但有些應(yīng)用中(如轉(zhuǎn)基因動(dòng)物中的表達(dá))優(yōu)選應(yīng)用基因組克隆,或修飾cDNA克隆使其包含至少一個(gè)基因組內(nèi)含子。制備cDNA和基因組克隆的方法為本領(lǐng)域內(nèi)熟知并在本領(lǐng)域普通技術(shù)人員的水平范圍之內(nèi),包括應(yīng)用本文所公開的序列,或其部分去探測(cè)或引發(fā)一個(gè)文庫。表達(dá)文庫可用人PC4的抗體,受體片段,或其它特異性結(jié)合對(duì)應(yīng)物探測(cè)。本發(fā)明還提供編碼人激素原轉(zhuǎn)化酶4的人基因組序列的分離。從SEQ ID No1衍生的探針可用于篩選人源基因組文庫以克隆人PC4的人基因組序列,方法按本領(lǐng)域已知的標(biāo)準(zhǔn)程序,及本文所公開的進(jìn)行。
本領(lǐng)域內(nèi)技術(shù)人員能意識(shí)到SEQ ID No1公開的序列代表人PC4的一個(gè)等位基因,而預(yù)期還會(huì)有等位變異和其它剪接形式。該序列的等位變體可通過用標(biāo)準(zhǔn)程序?qū)Σ煌瑐€(gè)體的cDNA或基因組文庫進(jìn)行探測(cè)而克隆。SEQ ID No1所示DNA序列的等位變體,包括那些含沉默突變的、及那些突變導(dǎo)致了氨基酸序列變化的等位變體,均包含在本發(fā)明的范圍內(nèi),同時(shí)包含的還有SEQ ID No2的等位變體蛋白質(zhì)。本發(fā)明還提供所述分離多核苷酸的mRNA剪接變體形式,它們可能是人激素原轉(zhuǎn)化酶4的基因表達(dá)天然產(chǎn)生的結(jié)果。mRNA經(jīng)另一種剪接產(chǎn)生的、保留了人PC4多肽特點(diǎn)的cDNA也包括在本發(fā)明的范圍內(nèi),還包括由這些cDNA和mRNA編碼的多肽。該序列的剪接變體可按標(biāo)準(zhǔn)程序?qū)θ薱DNA文庫,如人睪丸cDNA文庫探查而克隆。
本發(fā)明還提供基本同源于SEQ ID No2多肽的分離的人激素原轉(zhuǎn)化酶4多肽及其正同系物。在一優(yōu)選形式中,分離的多肽基本上不含其它多肽,特別是其它動(dòng)物源多肽。優(yōu)選提供高度純化的多肽,即純度超過95%,優(yōu)選純度超過99%?!盎就础痹诒疚闹感蛄杏兄辽?5%相同于SEQ ID No2的序列或SEQ ID No2的剪接變體序列的多肽。這樣的多肽將更優(yōu)選至少90%、或最優(yōu)選95%或更多相同于SEQ IDNo2或SEQ ID No2的剪接變體。序列相同性百分比用經(jīng)典方法測(cè)定。見,如,Altschul等,Bull.Math.Bio.48603-616,1986和Henikoff和Henikoff,美國國家科學(xué)院院報(bào)8910915-10919,1992。簡(jiǎn)單說,將兩個(gè)氨基酸序列一一對(duì)比,間隙開口罰10分,間隙延伸罰1分,以及示于表3的Henikff和Henikoff(文獻(xiàn)同上)“blosum62”得分矩陣使一一對(duì)比的得分最佳化(表3中氨基酸均以標(biāo)準(zhǔn)的單字母代碼表示)。表3A R N DC Q E G H I L K M F P S T W Y VA 4R -1 5N -2 0 6D -2 -2 1 6C 0 -3 -3 -39Q -1 1 0 0 -3 5E -1 0 0 2 -4 2 5G 0 -2 0 -1 -3 -2 -2 6H -2 0 1 -1 -3 0 0 -2 8I -1 -3 -3 -3 -1 -3 -3 -4 -3 4L -1 -2 -3 -4 -1 -2 -3 -4 -3 2 4K -1 2 0 -1 -3 1 1 -2 -1 -3 -2 5M -1 -1 -2 -3 -1 0 -2 -3 -2 1 2 -1 5F -2 -3 -3 -3 -2 -3 -3 -3 -1 0 0 -3 0 6P -1 -2 -2 -1 -3 -1 -1 -2 -2 -3 -3 -1 -2 -4 7S 1 -1 1 0 -1 0 0 0 -1 -2 -2 0 -1 -2 -1 4T 0 -1 0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1 1 5W -3 -3 -4 -4 -2 -2 -3 -2 -2 -3 -2 -3 -1 1 -4 -3 -2 11Y -2 -2 -2 -3 -2 -1 -2 -3 2 -1 -1 -2 -1 3 -3 -2 -2 2 7V 0 -3 -3 -3 -1 -2 -2 -3 -3 3 1 -2 1 -1 -2 -2 0 -3 -1 4
最佳對(duì)比的相同性百分比計(jì)算如下
多核苷酸分子間的序列相同性用相似的方法測(cè)定,用如上文所公開的比率表示。
人PC4多肽的變體或基本同源物均有一或多個(gè)氨基酸替代,缺失或增加。這些變化優(yōu)選為微小特征的變化,即為保守型氨基酸替代(見表4)和其它不明顯影響多肽的折疊或活性的替代;小缺失,通常為1至約30個(gè)氨基酸的缺失;氨基-或羧基-末端的小延伸,如氨基末端增加一個(gè)甲硫氨酸殘基,或多達(dá)約20-25個(gè)殘基的連接小肽,或一個(gè)親和標(biāo)記,如一個(gè)便于純化的小延伸(如一個(gè)多組氨酸串,一個(gè)抗原性表位或一個(gè)結(jié)合區(qū))。總見,F(xiàn)ord等,蛋白質(zhì)表達(dá)和純化295-107,1991。含親和標(biāo)記的多肽可進(jìn)一步在人PC4多肽和該親和標(biāo)記之間包含一個(gè)蛋白酶切割位點(diǎn)。這樣的切割位點(diǎn)包括,如,凝血酶切割位點(diǎn)和Xa因子切割位點(diǎn)。
表4保守的氨基酸替換堿性氨基酸 精氨酸賴氨酸組氨酸酸性氨基酸 谷氨酸天冬氨酸極性氨基酸 谷氨酰胺天冬酰胺疏水氨基酸 亮氨酸異亮氨酸纈氨酸芳香族氨基酸 苯丙氨酸色氨酸酪氨酸小氨基酸 甘氨酸丙氨酸絲氨酸蘇氨酸甲硫氨酸本發(fā)明的蛋白質(zhì)還包括非天然存在的氨基酸殘基。它們有,但不限于,反式-3-甲基脯氨酸、2,4-甲醇基脯氨酸、順式-4-羥脯氨酸、反式-4-羥脯氨酸、N-甲基甘氨酸、異-蘇氨酸(allo-threonine)、甲基蘇氨酸、羥乙基半胱氨酸、羥乙基高半胱氨酸、硝基谷氨酰胺、高谷氨酰胺、六氫吡啶羧酸、噻唑烷羧酸、脫氫脯氨酸、3-和4-甲基脯氨酸、3,3-二甲基脯氨酸、叔-亮氨酸、正纈氨酸、2-氮雜苯丙氨酸(2-azaphenylalanine)、3-氮雜苯丙氨酸、4-氮雜苯丙氨酸、和4-氟苯丙氨酸。本領(lǐng)域已知有很多方法可將非天然存在的氨基酸殘基導(dǎo)入蛋白質(zhì)。如可利用一個(gè)體外系統(tǒng),其中無義突變均用化學(xué)氨?;种谱觮RNA進(jìn)行抑制。合成氨基酸和氨酰tRNA的方法為本領(lǐng)域內(nèi)已知。含無義突變的質(zhì)粒的轉(zhuǎn)錄和翻譯在包含大腸桿菌S30提取物,商業(yè)化酶及其它試劑的無細(xì)胞體系中進(jìn)行。蛋白質(zhì)經(jīng)層析純化。見,如,Robertson等,美國化學(xué)協(xié)會(huì)雜志1132722,1991;Ellman等,酶學(xué)方法.202301,1991;Chung等,科學(xué)259806-9,1993;及Chung等,美國國家科學(xué)院院報(bào)9010145-9,1993)。在第二種方法中,翻譯在非洲爪蟾卵母細(xì)胞中進(jìn)行,方法是將突變的mRNA和化學(xué)氨酰化抑制子tRNA顯微注射進(jìn)該卵母細(xì)胞(Turcatti等,生物化學(xué)雜志,27119991-8,1996)。第三個(gè)方法中,將大腸桿菌細(xì)胞在缺乏將被取代的天然氨基酸(如苯丙氨酸)而有所需非天然氨基酸(如2-氮雜苯丙氨酸,3-氮雜苯丙氨酸,4-氮雜苯丙氨酸,或4-氟苯丙氨酸)的情況下培養(yǎng)。這樣,非天然氨基酸將代替其天然對(duì)應(yīng)物而摻入蛋白質(zhì)中。見,Koide等,生物化學(xué)337470-6,1994。天然氨基酸殘基可用體外化學(xué)修飾法轉(zhuǎn)換成非天然類型?;瘜W(xué)修飾可結(jié)合定點(diǎn)誘變進(jìn)行,以進(jìn)一步擴(kuò)大取代的范圍(Wynn和Richards,蛋白質(zhì)科學(xué)2395-403,1993)。
可用有限量的非保守氨基酸、不由遺傳密碼編碼的氨基酸、非天然氨基酸、和不正常氨基酸取代人PC4的氨基酸殘基。
本發(fā)明多肽中的必需氨基酸可按本領(lǐng)域內(nèi)已知的方法,如定點(diǎn)誘變或丙氨酸掃描誘變進(jìn)行鑒定(Cunningham和Wells,科學(xué)244,1081-1085,1989;Bass等,美國國家科學(xué)院院報(bào)884498-502,1991)。在后一技術(shù)中,在分子中的每個(gè)殘基處導(dǎo)入單個(gè)丙氨酸突變,如下文述檢驗(yàn)所得突變分子的生物學(xué)活性,以鑒定對(duì)分子活性比較關(guān)鍵的氨基酸殘基。亦見,Hilton等,生物化學(xué)雜志,2714699-708,1996。人PC4催化區(qū)中與其底物作用的關(guān)鍵位點(diǎn)也可通過對(duì)用核酸磁共振技術(shù),晶體學(xué)技術(shù),電子衍射技術(shù)或光親和標(biāo)記技術(shù)確定的結(jié)構(gòu)進(jìn)行物理分析,結(jié)合假定接觸位點(diǎn)氨基酸的突變而測(cè)定。見,如,De Vos等,科學(xué)255306-12,1992;Smith等,分子生物學(xué)雜志224899-904,1992;Wlodaver等,F(xiàn)EBS Lett.30959-64,1992。必需氨基酸的同一性也可由本領(lǐng)域內(nèi)技術(shù)人員經(jīng)分析與相關(guān)激素原轉(zhuǎn)化酶的同源性而推論。
可以由已知的誘變和篩選方法制備并檢驗(yàn)多重氨基酸取代,如Reidhaar-Olson和Sauer所公開的方法(科學(xué)24153-57,1988)或如Bowie和Sauer所公開的方法(美國國家科學(xué)院院報(bào)862152-2156,1989)。簡(jiǎn)單說,這些作者公開的方法是同時(shí)使多肽中的兩個(gè)或多個(gè)位置隨機(jī)化,選擇功能性多肽,再測(cè)序經(jīng)誘變的多肽,以確定每個(gè)位置的容許替代范圍。其它可用的方法包括噬菌體展示(如Lowman等,生物化學(xué)3010832-10837,1991;Ladner等,美國專利號(hào)5,223,409;Huse,WIPO公開WO 92/06204)和區(qū)域定向誘變(Derbyshire等,基因46145,1986;Ner等,DNA7127,1988)。
所公開的人PC4 DNA和多肽序列的變體可通過Stemmer,自然370389-91,1994;Stemmer.美國國家科學(xué)院院報(bào)9110747-51,1994;有WIPO公開WO97/20078所公開的DNA改組而產(chǎn)生。簡(jiǎn)單說,體外經(jīng)親代DNA隨機(jī)片段化后用PCR重新組裝而同源重組,產(chǎn)生隨機(jī)導(dǎo)入的點(diǎn)突變,就產(chǎn)生了變體DNA。該技術(shù)可改用親代DNA的一個(gè)家族,如等位變體或來自不同物種的DNA進(jìn)行,以便在加工中導(dǎo)入另外的變異。對(duì)所需活性進(jìn)行選擇或篩選,再重復(fù)誘變過程并分析,可通過選出所需突變而同時(shí)選擇去除不利變化而使序列進(jìn)行快速“進(jìn)化”。
本文所公開的誘變方法可結(jié)合高容量、自動(dòng)化篩選方法,以檢測(cè)宿主細(xì)胞中克隆的誘變多肽的活性。編碼活性多肽(如切割已知多肽底物指示劑)的誘變DNA分子可從宿主細(xì)胞中回收,并用現(xiàn)代儀器快速測(cè)序。這些方法能夠快速確定單個(gè)氨基酸殘基在目的多肽中的重要性,并可用于未知結(jié)構(gòu)的多肽。而且,這些誘變方法可用于加工蛋白質(zhì),如人激素原轉(zhuǎn)化酶4,改變其反應(yīng)動(dòng)力學(xué),縮小或擴(kuò)大其底物特異性,改變多肽的組織和細(xì)胞定位。
本領(lǐng)域內(nèi)技術(shù)人員可用上述方法制備基本同源于SEQ ID No2的1-755位殘基或其等位變體或其剪接變體并保留野生型蛋白質(zhì)活性的各種多肽。
而且,用本領(lǐng)域內(nèi)描述的方法,可將本發(fā)明人激素原轉(zhuǎn)化酶4的各區(qū)域或結(jié)構(gòu)域與其它已知或未知激素原轉(zhuǎn)化酶蛋白質(zhì)(如PC2和PC1)的各區(qū)結(jié)合,或與異源蛋白質(zhì)結(jié)合,而構(gòu)建出多肽融合體,或雜合的激素原轉(zhuǎn)化酶蛋白質(zhì)(Sambrook等,文獻(xiàn)同上,Altschul等,文獻(xiàn)同上,Picard,D.,Cur.Opin.Biology 5511-515,1994,及其中的參考文獻(xiàn))。利用這些方法能夠確定目的多肽中較大區(qū)的生物學(xué)重要性。這些雜合體改變了反應(yīng)動(dòng)力學(xué),縮小或擴(kuò)大了底物特異性,或改變了多肽的組織和細(xì)胞定位,并能應(yīng)用于未知結(jié)構(gòu)的多肽。
融合蛋白可用本領(lǐng)域內(nèi)技術(shù)人員熟知的方法制備。按正確讀框編碼融合蛋白中每一成分的多核苷酸分子可用已知技術(shù)產(chǎn)生,并按本文所述方法表達(dá)。例如,本發(fā)明人PC4的生物學(xué)功能區(qū)的部分或全部可與另一種激素原轉(zhuǎn)化酶(如PC2或PC1)的相應(yīng)區(qū)互換。這樣的區(qū)包含但不限于本文所述分子的分泌信號(hào)序列,Homo-A區(qū),催化區(qū),Homo-B區(qū)和C末端部分??赏ㄟ^連接多核苷酸區(qū)段成為正確讀框,產(chǎn)生編碼融合蛋白好幾個(gè)區(qū)的一個(gè)DNA多區(qū)段,而以此形式交換一個(gè)或幾個(gè)區(qū)(如上述那些區(qū))。產(chǎn)生這樣的融合蛋白的方法為本領(lǐng)域內(nèi)熟知(Sambrook等,同出處,Altschul等,同出處,Picard,D.,同出處)。這樣的融合蛋白包含至少一個(gè)人PC4區(qū),并預(yù)期有相同或類似于本發(fā)明的多肽或其他已知或未知激素原轉(zhuǎn)化酶(如PC2和PC1)的生物學(xué)功能性質(zhì),這依賴于所構(gòu)建的融合體。而且這樣的融合蛋白可具有其它如上所述的特點(diǎn)。
對(duì)于任何人PC4多肽,包括變體和融合蛋白,本領(lǐng)域內(nèi)技術(shù)人員均可用本文所公開的并示于上文表1和表2的資料輕易地產(chǎn)生編碼該變體的一個(gè)完全簡(jiǎn)并性多核苷酸序列。
本發(fā)明的多肽,包括全長多肽、生物學(xué)活性片段及融合多肽,可按常規(guī)技術(shù)在經(jīng)基因工程改造過的宿主細(xì)胞中產(chǎn)生。適當(dāng)?shù)乃拗骷?xì)胞是能用外源DNA轉(zhuǎn)化或轉(zhuǎn)染并生長于培養(yǎng)基中的那些細(xì)胞類型,包括細(xì)菌、真菌細(xì)胞及培養(yǎng)的較高等真核細(xì)胞。真核細(xì)胞,尤其是多細(xì)胞生物體的培養(yǎng)細(xì)胞較為優(yōu)選。操作克隆化DNA分子并將外源DNA導(dǎo)入各類宿主細(xì)胞的技術(shù)均公開在Sambrook等,分子克隆實(shí)驗(yàn)室手冊(cè),第二版,冷泉港實(shí)驗(yàn)室出版,冷泉港,NY,1989及Ausubel等編輯,分子生物學(xué)最新實(shí)驗(yàn)程序(Current Protocols in MolecularBiology),John Wiley and Sons,公司,NY,1987)中。
通常,在表達(dá)載體內(nèi),編碼人激素原轉(zhuǎn)化酶4多肽的DNA序列與表達(dá)所需其它遺傳元件可操作連接(一般包括轉(zhuǎn)錄啟動(dòng)子和終止子)。載體還常包含一或多個(gè)選擇標(biāo)記及一或多個(gè)復(fù)制起點(diǎn),盡管本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到,某些系統(tǒng)中,選擇標(biāo)記可提供在另外的載體上,復(fù)制外源DNA可通過向宿主細(xì)胞基因組整合而完成。選擇啟動(dòng)子,終止子,選擇標(biāo)記,載體和其它元件是本領(lǐng)域內(nèi)普通技術(shù)人員的常規(guī)設(shè)計(jì)程序。很多這樣的元件在文獻(xiàn)中有述,并可由生產(chǎn)商提供。
為將人激素原轉(zhuǎn)化酶4多肽導(dǎo)入宿主細(xì)胞的分泌途徑,可在表達(dá)載體中提供分泌信號(hào)序列(也稱前導(dǎo)序列,前原序列或前序列)。分泌信號(hào)序列可以是人激素原轉(zhuǎn)化酶4多肽的序列,也可衍生自定向于分泌途徑的另一蛋白質(zhì)(如t-PA),也可從頭合成。分泌信號(hào)序列以正確閱讀框架加入人激素原轉(zhuǎn)化酶4 DNA序列中,其所處位置可引導(dǎo)新合成的多肽進(jìn)入宿主細(xì)胞的分泌途徑。分泌信號(hào)序列通常位于目的多肽編碼DNA序列的5’端,不過某些分泌信號(hào)序列可位于目的DNA序列中的其它位置(見,如,Welch等,美國專利號(hào)5,037,743;Holland等,美國專利號(hào)5,143,830)。
或者,包含在本發(fā)明多肽中的分泌信號(hào)序列可用于引導(dǎo)其它多肽進(jìn)入分泌途徑。本發(fā)明提供這類融合多肽。信號(hào)融合多肽可制成其中編碼SEQ ID No2的1位(Met)至19位(Val)氨基酸殘基的分泌信號(hào)序列可操作連接于編碼另一多肽的DNA區(qū)段上,所用方法為本領(lǐng)域已知并為本文所公開。由此產(chǎn)生的本發(fā)明融合多肽中所包含的分泌肽優(yōu)選在其氨基末端融合另一肽,以引導(dǎo)這另一肽進(jìn)入分泌途徑。這類構(gòu)建體具有本領(lǐng)域內(nèi)已知的多種用途。例如,這些新型分泌信號(hào)序列融合構(gòu)建體可引導(dǎo)如通常不能徹底分泌的蛋白質(zhì)的活性成分(如細(xì)胞表面受體)或其它非分泌蛋白質(zhì)的分泌。這類融合體可體內(nèi)或體外用于引導(dǎo)肽通過分泌途徑。
培養(yǎng)的哺乳動(dòng)物細(xì)胞為本發(fā)明的適宜宿主。將外源DNA導(dǎo)入哺乳動(dòng)物宿主細(xì)胞的方法包括磷酸鈣介導(dǎo)的轉(zhuǎn)染(Wigler等,細(xì)胞14725,1978;Corsaro和Pearson,體細(xì)胞遺傳學(xué)7603,1981;Graham和Van der Eb,病毒學(xué)52456,1973),電穿孔(Neumann等,EMBO J1841-845,1982),DEAE-葡聚糖介導(dǎo)的轉(zhuǎn)染(Ausubel等,同出處),及脂質(zhì)體介導(dǎo)的轉(zhuǎn)染(Hawley-Nelson等,F(xiàn)ocus 1573,1993;Ciccarone等,F(xiàn)ocus 1580,1993),和病毒載體(Miller和Rosman,生物技術(shù)7980-90,1989;Wang和Finer,醫(yī)學(xué)自然(Nature Med.)2714-6,1996)。培養(yǎng)的哺乳動(dòng)物細(xì)胞中重組多肽的生產(chǎn)公開于,如,Levinson等的美國專利第4,713,339號(hào);Hagen等的美國專利第4,784,950號(hào);Palmiter等的美國專利第4,579,821號(hào);及Ringold的美國專利第4,656,134號(hào)。適合的培養(yǎng)哺乳動(dòng)物細(xì)胞包括COS-1(ATCC No.CRL 1650),COS-7(ATCC No.CRL 1651),BHK(ATCC No.CRL 1632),BHK 570(ATCC No.CRL 10314),293(ATCC No.CRL 1573;Graham等,普通病毒學(xué)雜志(J.Gen.Virol.)3659-72,1977)及中國倉鼠卵巢(如CHO-K1;ATCC No CCL 61)細(xì)胞系。其它優(yōu)選細(xì)胞系為培養(yǎng)的睪丸細(xì)胞,包括海豚DB1.Tes細(xì)胞(CRL-6258);小鼠GC-1spg細(xì)胞(CRL-2053);TM3細(xì)胞(CRL-1714);TM4細(xì)胞(CRL-1715);及豬ST細(xì)胞(CRL-1746),可由美國典型培養(yǎng)物保藏中心,Rockyille,MD.提供。其它適合的細(xì)胞系為本領(lǐng)域內(nèi)已知,可由公共保藏機(jī)構(gòu)如美國典型培養(yǎng)物保藏中心,Rockyille,馬里蘭提供。通常優(yōu)選強(qiáng)轉(zhuǎn)錄啟動(dòng)子,如SV-40或巨細(xì)胞病毒的啟動(dòng)子。見,如,美國專利號(hào)4,956,288。其它適合的啟動(dòng)子包括來自金屬硫蛋白基因的啟動(dòng)子(美國專利號(hào)4,579,821和4,601,978)和腺病毒主要晚期啟動(dòng)子。
藥物選擇通常用于挑選其中已插入外源DNA的培養(yǎng)哺乳動(dòng)物細(xì)胞。這類細(xì)胞通常稱為“轉(zhuǎn)染子”。在選擇劑存在時(shí)培養(yǎng)的、并能將目的基因傳給子代的細(xì)胞稱為“穩(wěn)定轉(zhuǎn)染子”。優(yōu)選的選擇標(biāo)記為新霉素抗性編碼基因。選擇在有新霉素型藥物(如G-418等)存在時(shí)進(jìn)行。選擇系統(tǒng)還可用于增加目的基因的表達(dá)水平,該過程稱為“擴(kuò)增”。擴(kuò)增的執(zhí)行是通過在有低水平選擇劑時(shí)培養(yǎng)轉(zhuǎn)染子,然后增加選擇劑的量,以選出產(chǎn)生導(dǎo)入基因的高水平產(chǎn)物的細(xì)胞。優(yōu)選的可擴(kuò)增選擇標(biāo)記為二氫葉酸還原酶基因,它能賦予對(duì)氨甲蝶呤的抗性。其它抗藥基因(如潮霉素抗性,多藥物抗性,嘌呤霉素乙酰轉(zhuǎn)移酶)也可應(yīng)用。會(huì)導(dǎo)入改變表型的其它標(biāo)記,如綠熒光蛋白,或細(xì)胞表面蛋白(如CD4,CD8,MHCI類分子),胎盤堿性磷酸酶均可通過FACS分選術(shù)或磁珠分離技術(shù)而用于從未轉(zhuǎn)染細(xì)胞中選出轉(zhuǎn)染細(xì)胞。
其它較高等真核細(xì)胞也可用作宿主,包括植物細(xì)胞,昆蟲細(xì)胞和禽細(xì)胞。用發(fā)根農(nóng)桿菌作載體在植物細(xì)胞中表達(dá)基因已由Sinkar等人綜述(生物科學(xué)雜志(Bangalore)1147-58,1987)。昆蟲細(xì)胞的轉(zhuǎn)化及其中外源多肽的生產(chǎn)已公開于Guarino等的美國專利號(hào)5,162,222和WIPO公開WO94/06463中。昆蟲細(xì)胞可用桿狀病毒重組體(通常衍生自苜蓿銀紋夜蛾多核型多角體病毒(AcNPV)感染。見King,L.A.和Possee,R.D.,桿狀病毒表達(dá)系統(tǒng)實(shí)驗(yàn)室指南,倫敦,Chapman & Hall;O’Reilly,D.R.等,桿狀病毒表達(dá)載體實(shí)驗(yàn)室手冊(cè),紐約,牛津大學(xué)出版社,1994;以及,Richardson,C.D.,編輯,桿狀病毒表達(dá)方案,分子生物學(xué)方法,Totowa,NJ,Humana出版社,1995。第二種制備重組人PC4桿狀病毒的方法應(yīng)用了基于轉(zhuǎn)座子的系統(tǒng),該系統(tǒng)述于Luckow,V.A,等,病毒學(xué)雜志674566-79,1993中。這一應(yīng)用了轉(zhuǎn)移載體的系統(tǒng)在Bac-to-BacTM試劑盒(Life Technologies,Rockville,MD)中有售。見Hill-Perkins,M.S.和Possee,R.D.,普通病毒學(xué)雜志71971-6,1990;Bonning,B.C.等,普通病毒學(xué)雜志751551-6,1994;和,Chazenbalk,G.D.,和Rapoport,B.,生物化學(xué)雜志2701543-9,1995。此外,轉(zhuǎn)移載體可包含在人PC4多肽C-末端或N-末端融合一個(gè)表位標(biāo)記(如Glu-Glu表位標(biāo)記)的編碼DNA的框內(nèi)融合體(Grussenmeyer,T.等,美國國家科學(xué)院院報(bào),827952-4,1985)。用本領(lǐng)域內(nèi)已知技術(shù),可將含人PC4的轉(zhuǎn)移載體轉(zhuǎn)化進(jìn)大腸桿菌,并篩選出含有指示重組桿狀病毒的間斷Lac Z基因的桿粒。含重組桿狀病毒基因組的桿粒DNA用常規(guī)技術(shù)分離,并用于轉(zhuǎn)染草地夜蛾細(xì)胞(如Sf9細(xì)胞)。表達(dá)人PC4的重組病毒隨后產(chǎn)生。經(jīng)本領(lǐng)域內(nèi)常用方法可制備重組病毒體貯存物。
重組病毒可用于感染宿主細(xì)胞,通常是衍生自秋粘蟲(草地夜蛾)的細(xì)胞系。總見,Glick和Pasternak,分子生物技術(shù)重組DNA的原理和應(yīng)用,ASM出版社,華盛頓特區(qū),1994。另一種適合的細(xì)胞系是High Five OTM細(xì)胞系(Invitrogen),它衍生自粉紋夜蛾(美國專利號(hào)5,300,435)。生產(chǎn)商提供的無血清培養(yǎng)基可用于培養(yǎng)和維持細(xì)胞。適合的培養(yǎng)基對(duì)sf9細(xì)胞為sf900IITM(Life Technologies)或ESF921TM(表達(dá)系統(tǒng));對(duì)粉紋夜蛾細(xì)胞為Ex-Cell O405TM(JRHBiosciences,Lenexa,KS)或Express FiveOTM(LifeTechnologies),。細(xì)胞的接種密度約2-5×105個(gè)細(xì)胞,生長至細(xì)胞密度為1-2×106個(gè)細(xì)胞時(shí),以0.1至10(更通常為近3)的感染復(fù)數(shù)(MOI)加入重組病毒貯存物。所用程序常描述于實(shí)驗(yàn)室手冊(cè)中(King,L.A.和Possee,R.D.,同出處;O’Reilly,D.R.等,同出處;Richardson,C.D.,同出處)。隨后可用本文所述方法從上清純化出人PC4多肽。
真菌細(xì)胞,包括酵母細(xì)胞,也可用于本發(fā)明。在這方面特別有用的酵母種包括釀酒酵母,巴斯德畢赤酵母,Pichia methanolica。用外源DNA轉(zhuǎn)化釀酒酵母并從中生產(chǎn)重組多肽的方法公開在如Kawasaki的美國專利第4,599,311號(hào);Kawasaki等的美國專利第4,931,373號(hào);Brake的美國專利第4,870,008號(hào);Welch等的美國專利第5,037,743號(hào);Murray等的美國專利第4,845,075號(hào)。轉(zhuǎn)化的細(xì)胞通過由選擇標(biāo)記(通常為耐藥性或在缺乏某特殊營養(yǎng)物(如亮氨酸)時(shí)生長的能力)決定的表型進(jìn)行挑選??稍卺劸平湍钢惺褂玫妮^優(yōu)選載體系統(tǒng)為POT1載體系統(tǒng),由Kawasaki等公開(美國專利號(hào)4,931,373),它能使轉(zhuǎn)化的細(xì)胞通過在含葡萄糖的培養(yǎng)基上生長而被選出。適用于酵母的啟動(dòng)子和終止子包括來自糖酵解酶基因的(見如Kawasaki的美國專利第4,599,311號(hào);Kingsman等的美國專利第4,615,974號(hào);及Bitter的美國專利第4,977,092號(hào))和來自醇脫氫酶基因的那些。亦見美國專利第4,990,446;5,063,154;5,139,936和4,661,454號(hào)。適于其它酵母的轉(zhuǎn)化系統(tǒng)為本領(lǐng)域已知,所述其它酵母包括多形漢遜酵母、粟酒裂殖酵母、乳酸克魯維酵母、脆壁克魯維酵母、玉蜀黍黑粉菌、巴斯德畢赤酵母、Pichia methanolica,季也蒙畢赤酵母和Candida maltosa。見如Gleeson等,普通微生物學(xué)雜志1323459-3465,1986和Cregg,美國專利號(hào)4,882,279。曲霉細(xì)胞也可根據(jù)Mcknight等的美國專利第4,935,349號(hào)的方法應(yīng)用。轉(zhuǎn)化產(chǎn)黃枝頂孢(Acremonium chrysogenum)的方法述于Sumino等的美國專利第5,162,228號(hào)中。轉(zhuǎn)化脈孢菌的方法述于Lambowitz的美國專利第4,486,533號(hào)中。
用Pichia methanolica作為宿主生產(chǎn)重組蛋白述于WIPO公開WO97/17450,WO 97/17451,WO98/02536,和WO 98/02565中。用于轉(zhuǎn)化P.methanolica的DNA分子通常制成雙鏈環(huán)狀質(zhì)粒,在轉(zhuǎn)化之前優(yōu)選先線性化。為了在P.methanolica中生產(chǎn)多肽,優(yōu)選質(zhì)粒中的啟動(dòng)子和終止子為P.methanolica基因的那些,如P.methanolica醇利用基因(AUG1或AUG2)。其它有用的啟動(dòng)子包括二羥基丙酮合成酶(DHAS)基因,甲酸脫氫酶(FMD)基因和過氧化氫酶(CAT)基因的啟動(dòng)子。為便于DNA向宿主染色體整合,優(yōu)選質(zhì)粒的完整表達(dá)片段兩側(cè)均為宿主DNA序列。優(yōu)選用于P.methanolica的選擇標(biāo)記為P.methanolica ADE2基因,它編碼磷酸核糖-5-氨基咪唑羧化酶(AIRC;EC 4.1.1.21),此酶允許ade2宿主細(xì)胞在缺腺嘌呤時(shí)可以生長。為進(jìn)行希望少用甲醇的大批量工業(yè)化生產(chǎn),優(yōu)選用其中兩個(gè)甲醇利用基因(AUG1和AUGF2)均缺失的宿主細(xì)胞。為生產(chǎn)分泌型蛋白質(zhì),優(yōu)選液泡蛋白酶基因(PEP4和PRB1)中有缺陷的宿主細(xì)胞。電穿孔用于促進(jìn)含目的多肽編碼DNA的質(zhì)粒導(dǎo)入P.methanolica細(xì)胞。轉(zhuǎn)化P.methanolica細(xì)胞優(yōu)選用電穿孔方法,所用電場(chǎng)為指數(shù)級(jí)衰減的脈沖電場(chǎng),電場(chǎng)強(qiáng)度從2.5-4.5kV/cm,優(yōu)選約3.7SkV/cm,時(shí)間常數(shù)為1-40毫秒,最優(yōu)選約20毫秒。將P.methanolica細(xì)胞培養(yǎng)于含適當(dāng)碳源、氮源和微量營養(yǎng)物的培養(yǎng)基上,溫度約25-35℃。液體培養(yǎng)物中用常規(guī)方法充分通氣,方法如振蕩小燒瓶或向發(fā)酵罐噴氣。優(yōu)選的P.methanolica培養(yǎng)基為YEPD(2%D-葡萄糖、2%BactoTM蛋白胨(Difco實(shí)驗(yàn)室,底特律,MI),1%BactoTM酵母浸膏(Difco實(shí)驗(yàn)室),0.004%腺嘌呤和0.006%L-亮氨酸)。
原核宿主細(xì)胞,包括大腸桿菌,芽孢桿菌屬及其它屬的菌株也可用作本發(fā)明的宿主細(xì)胞。轉(zhuǎn)化這些宿主并表達(dá)克隆其中的外源DNA的技術(shù)為本領(lǐng)域內(nèi)已知(見,如,Sambrook等,同出處)。當(dāng)在細(xì)菌如大腸桿菌中表達(dá)人PC4多肽時(shí),該多肽可保留在細(xì)胞質(zhì)中(通常為不溶顆粒),或可由細(xì)菌分泌序列引導(dǎo)至壁膜間隙中。在前一種情況中,將細(xì)胞裂解,回收顆粒并用如異硫氰酸胍或尿素變性。變性多肽再通過稀釋變性劑而重新折疊和二聚體化,稀釋方法如對(duì)尿素溶液透析和結(jié)合使用還原型和氧化型谷胱甘肽,然后對(duì)緩沖鹽溶液透析。在后一種情況中,多肽可從壁膜間隙中以可溶性有功能形式回收,方法是破碎細(xì)胞(如超聲處理或滲透休克)以釋放壁膜間隙的內(nèi)含物并回收蛋白質(zhì),這樣一來可不必變性并再折疊。
轉(zhuǎn)化的或轉(zhuǎn)染的細(xì)胞根據(jù)常規(guī)程序培養(yǎng)于含有所選宿主細(xì)胞生長必需的營養(yǎng)物和其它成分的培養(yǎng)基中。多種適宜的培養(yǎng)基(包括已知成分培養(yǎng)基和復(fù)合培養(yǎng)基)均為本領(lǐng)域內(nèi)已知,并通常包含碳源、氮源、必需氨基酸、維生素和礦物質(zhì)。如有必要,培養(yǎng)基中還可包含生長因子或血清之類成分。生長培養(yǎng)基選擇含外源加入的DNA的細(xì)胞通常通過,如,藥物選擇或由攜于表達(dá)載體上或共轉(zhuǎn)染入宿主細(xì)胞中的選擇標(biāo)記彌補(bǔ)必需營養(yǎng)物的缺陷進(jìn)行。
優(yōu)選將本發(fā)明多肽純化至超過80%的純度,更優(yōu)選超過90%的純度,甚至更優(yōu)選超過95%的純度,尤其優(yōu)選藥學(xué)上的純度,即相對(duì)于雜質(zhì)大分子,特別是其它蛋白質(zhì)和核酸,純度超過99.9%,且不含傳染因子和致熱因子。優(yōu)選地,純化多肽基本不含其它多肽,特別是其它動(dòng)物源多肽。
根據(jù)本發(fā)明制備的人激素原轉(zhuǎn)化酶4多肽用本領(lǐng)域內(nèi)眾所周知的方法純化,這些方法如基于蛋白質(zhì)的大小、電荷、溶解性和其它特征的親和層析和分離。當(dāng)?shù)鞍踪|(zhì)產(chǎn)生于培養(yǎng)的哺乳動(dòng)物細(xì)胞中時(shí),優(yōu)選將細(xì)胞培養(yǎng)于不含血清的培養(yǎng)基中,以便減少雜質(zhì)蛋白質(zhì)的量。細(xì)胞經(jīng)收獲,裂解和分級(jí)分離。分級(jí)分離的優(yōu)選方法包括親和層析,Q-FastFlow Sepharose、Mono Q樹脂、FPLC、苯基Sepharose、羥基磷灰石、MonoS和/或S-Sepharose。蛋白質(zhì)也可用固相化親和標(biāo)記(如多組氨酸,基質(zhì)P或有抗體或其它特異性結(jié)合因子可供應(yīng)用的其它多肽或蛋白質(zhì))純化。可在目的蛋白與親和標(biāo)記之間提供一個(gè)特異性切割位點(diǎn)。優(yōu)選的親和標(biāo)記包括如多組氨酸串,利用它可在固相化鎳上純化融合蛋白(Houchuli等,Bio/Technol.61321-1325,1988)。也可構(gòu)建多肽的截短形式(如缺跨膜區(qū)或分泌信號(hào)區(qū))并用于更簡(jiǎn)便地純化有催化活性的激素原轉(zhuǎn)化酶(Nakayama,K.,酶學(xué)方法,244167-175,1995)。原核表達(dá)系統(tǒng)中,麥芽糖結(jié)合蛋白(MBP)融合體可能是有利的親和標(biāo)記。若欲自宿主細(xì)胞的胞質(zhì)或壁膜間隙回收蛋白質(zhì),則首先將細(xì)胞破碎,回收包含蛋白質(zhì)在內(nèi)的粗提物并進(jìn)行進(jìn)一步純化。而且,人激素原多肽底物和它們的被本發(fā)明切割出的產(chǎn)物均可用本領(lǐng)域內(nèi)眾所周知的上述方法(稍作改動(dòng))純化。例如,分泌的蛋白質(zhì)(如切割產(chǎn)物)從細(xì)胞條件培養(yǎng)基中回收,優(yōu)選在濃縮條件培養(yǎng)基之后回收。特殊的分級(jí)分離步驟的選擇及其順序安排部分基于所選宿主細(xì)胞類型及表達(dá)系統(tǒng)。本領(lǐng)域內(nèi)的一般技術(shù)人員均可作出這些決定。特殊方法的選擇是常規(guī)設(shè)計(jì)的問題,部分取決于所選支持物的特點(diǎn)。見,如,親和層析原理及方法,Pharmacia LKB Biotechnology,Uppsala,瑞典,1988。
本發(fā)明的多肽可利用它們的結(jié)構(gòu)特點(diǎn)和生化特點(diǎn)進(jìn)行分離。例如,可用固相化金屬離子吸附(IMAC)層析來純化富含組氨酸的蛋白質(zhì),包括那些帶多組氨酸標(biāo)記的蛋白質(zhì)。簡(jiǎn)單說,凝膠先充以二價(jià)金屬離子,形成螯合物(Sulkowski,生化動(dòng)態(tài)31-7,1985)。富含組氨酸的蛋白質(zhì)將以不同親和力吸附于該基質(zhì)上(取決于所用金屬離子),然后通過競(jìng)爭(zhēng)性洗脫作用,降低pH,或用強(qiáng)螯合劑而洗脫。其它純化方法包括用凝集素親和層析和離子交換層析純化糖基化的蛋白質(zhì)(酶學(xué)方法,182卷,“蛋白質(zhì)純化指南”,M.Deutscher,(編),Acad出版社,San Diego,1990,529-39頁)。本發(fā)明另外的實(shí)施方案中,構(gòu)建目的多肽與親和標(biāo)記(如麥芽糖結(jié)合蛋白,免疫球蛋白區(qū))的融合體以有助于純化。
人PC4多肽還可用于制備可特異性結(jié)合人PC4表位、肽或多肽的抗體。將人PC4多肽或其片段作為抗原(免疫原)接種至動(dòng)物中,引起免疫應(yīng)答。合適的抗原包括本文所公開的SEQ ID NO2中的各種人PC4多肽區(qū),或?yàn)镾EQ ID No2內(nèi)9-755位的連續(xù)氨基酸片段。由該免疫應(yīng)答產(chǎn)生的多克隆和單克隆抗體經(jīng)分離并用本領(lǐng)域內(nèi)已知方法純化。見,如,免疫學(xué)最新實(shí)驗(yàn)程序(Current Protocols inImmunology),Cooligan等(編),National Institutes of Health,John Wiley & Sons公司,1995;Sambrook等,分子克隆實(shí)驗(yàn)室手冊(cè),第二版,冷泉港,NY,1989;及Hurrell,J.G.R.,編,單克隆雜交瘤抗體技術(shù)和應(yīng)用,CRC出版公司,Boca Raton,F(xiàn)L,1982。
對(duì)本領(lǐng)域內(nèi)技術(shù)人員而言,很顯然的是,多克隆抗體可通過將人PC4多肽或其片段接種于各種不同的溫血?jiǎng)游锶珩R、牛、山羊、綿羊、狗、雞、兔、小鼠和大鼠而制備。人PC4多肽的免疫原性可通過佐劑,如鋁(氫氧化鋁)或弗氏完全或不完全佐劑的應(yīng)用而增強(qiáng)。可用于免疫的多肽還包括融合多肽,如人PC4或其部分與免疫球蛋白多肽或與麥芽糖結(jié)合蛋白的融合體。多肽免疫原可以是全長分子或其部分。若多肽部分為“半抗原樣”,則該部分可加入或連接至大分子載體(如匙孔血藍(lán)蛋白(KLH),牛血清白蛋白(BSA)或破傷風(fēng)類毒素)中以備免疫。
如本文所用,術(shù)語“抗體”包括多克隆抗體,親和純化的多克隆抗體,單克隆抗體及抗原結(jié)合片段,如F(ab’)2和Fab’蛋白酶解片段。還包括基因改造的完整抗體或片段,如嵌合抗體,F(xiàn)v片段,單鏈抗體等,及合成性抗原結(jié)合肽和多肽。非人抗體可通過將非人CDR移植在人抗體的框架區(qū)和恒定區(qū)上、或摻入完整的非人可變區(qū)(可選地通過取代暴露的殘基而覆蓋以人樣表面,結(jié)果產(chǎn)生“鑲蓋”抗體)而人源化。在某些例子中,人源化抗體可在人可變區(qū)的框架區(qū)之內(nèi)保留非人殘基以增強(qiáng)正確的結(jié)合特性。通過抗體的人源化,可增加其生物學(xué)半衰期,并減少施用于人時(shí)產(chǎn)生不利免疫反應(yīng)的潛能。
產(chǎn)生或選擇本文可用抗體的其它技術(shù)包括使淋巴細(xì)胞體外暴露于人激素原轉(zhuǎn)化酶4多肽或其衍生肽,選擇噬菌體或類似載體中的抗體展示文庫(如,通過用固相化的或標(biāo)記的人PC4蛋白或肽)。帶有潛在的人PC4多肽結(jié)合區(qū)的多肽編碼基因可通過對(duì)展示于噬菌體(噬菌體展示)或展示于細(xì)菌(如大腸桿菌)上的隨機(jī)肽文庫進(jìn)行篩選而獲得。編碼多肽的核苷酸序列可經(jīng)多種方法獲得,如通過隨機(jī)誘變和隨機(jī)多核苷酸合成。這些隨機(jī)肽展示文庫可用于篩選能與已知靶相互作用的肽,其中的靶可以是蛋白質(zhì)或多肽,如配體或受體,生物學(xué)的或合成的大分子,或有機(jī)物或無機(jī)物。產(chǎn)生和篩選這類隨機(jī)肽展示文庫的技術(shù)為本領(lǐng)域內(nèi)已知(Ladner等,美國專利號(hào)5,223,409;Ladner等,美國專利號(hào)4,946,778;Ladner等,美國專利號(hào)5,403,484和Ladner等,美國專利號(hào)5,571,698),而隨機(jī)肽展示文庫及篩選這些庫的試劑盒可從生產(chǎn)商處獲得,如Clontech(Palo Alto,CA),InvitrogenInc.(San Diego,CA),New England Biolabs,Inc.(Beverly,MA)和Pharmacia LKB Biotechnology Inc.(Piscataway,NJ)。隨機(jī)肽展示文庫可用本文公開的人PC4序列篩選,以鑒定能結(jié)合人PC4的蛋白質(zhì)。這些能與人PC4多肽相互作用的“結(jié)合蛋白”可用于標(biāo)記細(xì)胞;用于經(jīng)親和純化分離多肽同系物;它們可直接或間接偶聯(lián)于藥物、毒素、放射性核素等上。這些結(jié)合蛋白也可用于分析法如篩選表達(dá)文庫和中和活性的分析法中。結(jié)合蛋白還可用于組織中多肽水平測(cè)定的診斷分析;用于作為潛在病理或疾病標(biāo)志的多肽的檢測(cè)或定量。這些結(jié)合蛋白還可發(fā)揮人PC4“拮抗物”的作用,在體外和體內(nèi)封閉人PC4的切割活性。
抗體在以下情況下可確定為特異性結(jié)合1)它們的結(jié)合活性有一個(gè)臨界值;并且2)它們與相關(guān)多肽分子無明顯交叉反應(yīng)。首要的是,本文的抗體如果發(fā)生結(jié)合,只有當(dāng)它們與人激素原轉(zhuǎn)化酶4多肽、肽或表位結(jié)合的親和力比與對(duì)照多肽(非人PC4)的結(jié)合親和力大至少10倍時(shí)方為特異性結(jié)合。優(yōu)選抗體的結(jié)合親和力(Ka)達(dá)106M-1或更大,優(yōu)選107M-1或更大,更優(yōu)選108M-1或更大,最優(yōu)選109M-1或更大??贵w的結(jié)合親和力可輕易地由本領(lǐng)域內(nèi)技術(shù)人員通過如Scatchard分析法測(cè)定(Scatchard,G.,紐約科學(xué)院年鑒(Ann.NY Acad.Sci)51660-672,1949)。
其次,如果抗體不與相關(guān)多肽發(fā)生明顯交叉反應(yīng),即可確定抗體為特異性結(jié)合??贵w不與相關(guān)的多肽分子發(fā)生明顯交叉反應(yīng),例如,用它們通過標(biāo)準(zhǔn)的Western印跡分析(Ausubel等,同出處)可檢測(cè)人PC4,但不能檢測(cè)相關(guān)的多肽。已知相關(guān)多肽的實(shí)例有正同系物(如鼠PC4),副同系物,如其它已知的人激素原轉(zhuǎn)化酶(如PCl和PC2),或突變的人PC4多肽,及非哺乳動(dòng)物的激素原轉(zhuǎn)化酶(如枯草桿菌蛋白酶或Kex2)。而且,抗體可用已知的相關(guān)多肽進(jìn)行“篩選”,以分離能與本發(fā)明多肽特異性結(jié)合的類群。如人PC4的抗體可吸附在粘附于不溶性基質(zhì)的相關(guān)多肽上;用正確的緩沖條件可使人PC4的特異性抗體流過基質(zhì)。這樣的篩選可分離對(duì)密切相關(guān)的多肽沒有交叉反應(yīng)性的多克隆和單克隆抗體(抗體實(shí)驗(yàn)室手冊(cè),Harlow和Lane(編),冷泉港實(shí)驗(yàn)室出版社,1988;免疫學(xué)最新實(shí)驗(yàn)程序,Cooligan等(編),National Institutes of Heath,John Wiley and Sons公司,1995)。特異性抗體的篩選和分離為本領(lǐng)域內(nèi)所知。見,基礎(chǔ)免疫學(xué)(Fundamental Immunology),Paul(編),Raven出版社,1993;Getzoff等,免疫學(xué)進(jìn)展431-98,1988;單克隆抗體原理與實(shí)踐,Goding,J.W.(編),Academic Press Ltd.,1996;Benjamin等,免疫學(xué)年鑒267-101,1984。
本領(lǐng)域內(nèi)技術(shù)人員已知的多項(xiàng)試驗(yàn)可用于檢測(cè)和純化能與人PC4蛋白或肽特異性結(jié)合的抗體。典型的分析方法詳述于《抗體實(shí)驗(yàn)室手冊(cè)》,Harlow和Lane(編),冷泉港實(shí)驗(yàn)室出版社,1988。這類分析方法的代表性實(shí)例包括平行免疫電泳、放射免疫分析、放射免疫沉淀、酶聯(lián)免疫吸附試驗(yàn)(ELISA),點(diǎn)印跡或Western印跡試驗(yàn)、抑制或競(jìng)爭(zhēng)試驗(yàn),及夾心試驗(yàn)。
此外,可篩選出分別能結(jié)合野生型及突變型人PC4蛋白或多肽的抗體。人PC4的抗體可用于標(biāo)記表達(dá)人PC4的細(xì)胞;用于經(jīng)親和純化分離人PC4;用于體外或體內(nèi)測(cè)定細(xì)胞和組織裂解物中人激素原轉(zhuǎn)化酶4多肽水平的診斷分析;用于原位免疫定位以確定體內(nèi)組織分布;用于檢測(cè)或定量測(cè)定作為潛在病理學(xué)或疾病標(biāo)志的人激素原轉(zhuǎn)化酶4蛋白,用于應(yīng)用流式細(xì)胞儀或FACS的分析方法中;用于篩選表達(dá)文庫;用于產(chǎn)生抗獨(dú)特型抗體;及作為中和抗體;或作為體外和體內(nèi)封閉人PC4催化活性的拮抗劑。以這種方式應(yīng)用抗體的方法為本領(lǐng)域內(nèi)已知。適當(dāng)?shù)闹苯訕?biāo)記物包括放射性核素、酶、底物、輔因子、抑制物、熒光標(biāo)記、化學(xué)發(fā)光標(biāo)記、磁粒等;間接標(biāo)記可能以應(yīng)用生物素-抗生物素蛋白或其它互補(bǔ)物/反互補(bǔ)物對(duì)作中間體為特色。此處抗體也可直接或間接與藥物、毒素、放射性核素等偶聯(lián),而這些偶聯(lián)物可用于體內(nèi)診斷或治療。而且,可在體外利用人PC4或其片段的抗體,以在一些試驗(yàn)(如Western印跡或其它本領(lǐng)域內(nèi)已知試驗(yàn))中檢測(cè)變性人PC4或其片段。
睪丸特異性加工酶(如人激素原轉(zhuǎn)化酶4)參與對(duì)睪丸細(xì)胞表達(dá)的激素或結(jié)合蛋白的加工。故,如下所述,人激素原轉(zhuǎn)化酶4可用于鑒別和測(cè)定睪丸激素原的生物學(xué)功能并鑒定新型激素原。人PC4可能在生育,和/或與精子發(fā)生相關(guān)的睪丸功能中發(fā)揮作用,最近有篇描述純合型雄性PC4突變小鼠其生育力嚴(yán)重受損的論文(Mbikay,M.等,美國國家科學(xué)院院報(bào)946842-6846,1997)支持了這一假設(shè)。而且,作者在這些突變小鼠中未觀察到明顯的精子發(fā)生異常,而由這些精子發(fā)育成的受精卵不能生長至胚泡期,暗示人PC4不僅在受精中起作用,而且在早期胚胎發(fā)育中也起作用。
本發(fā)明的蛋白質(zhì)可用于加工或部分加工已知或未知的激素原多肽,使之成為成熟或有生物學(xué)活性的形式,從而可以例如刺激睪丸細(xì)胞的增殖或分化。而且,本發(fā)明的蛋白質(zhì),其拮抗劑和興奮劑可在雄性生育力中起作用。為檢驗(yàn)人PC4是否作用于底物,可在表達(dá)人PC4的相同細(xì)胞中共表達(dá)潛在的激素原多肽底物,或體外與人PC4混合。構(gòu)建這樣一個(gè)細(xì)胞或體外混合蛋白的方法為本領(lǐng)域內(nèi)已知并示于此。若人PC4對(duì)潛在激素原底物有作用,則會(huì)產(chǎn)生切割產(chǎn)物。本發(fā)明蛋白質(zhì)的活性可通過分析與被激素原轉(zhuǎn)化酶4切割的激素原前體多肽切割產(chǎn)物相關(guān)的生物學(xué)活性而測(cè)量。此外,若切割產(chǎn)物的生物學(xué)活性無法測(cè)量,則可利用其它方法,如Western印跡來測(cè)定人PC4是否切割了底物激素原。
本發(fā)明的多肽可用于測(cè)定人激素原轉(zhuǎn)化酶4的多肽激素原底物。應(yīng)用本領(lǐng)域內(nèi)已知的方法,可培養(yǎng)已導(dǎo)入表達(dá)人激素原轉(zhuǎn)化酶4成熟形式并且還表達(dá)檢驗(yàn)底物激素原多肽的表達(dá)載體的細(xì)胞。人激素原轉(zhuǎn)化酶4切割檢驗(yàn)底物產(chǎn)生的切割產(chǎn)物可用本文所述生物學(xué)或生物化學(xué)試驗(yàn)測(cè)定。而且,這種檢測(cè)人激素原轉(zhuǎn)化酶4多肽的多肽激素原底物的方法可在體外應(yīng)用。分離或純化的人PC4多肽或表達(dá)人PC4的細(xì)胞的裂解物可在體外與諸如檢驗(yàn)底物激素原多肽或包含一個(gè)二堿性切割位點(diǎn)的合成多肽這樣的檢驗(yàn)底物多肽混合。人PC4多肽切割檢驗(yàn)底物激素原多肽產(chǎn)生的切割產(chǎn)物可用本文所述生物學(xué)或生物化學(xué)試驗(yàn)檢測(cè)。
多種試驗(yàn)可用于測(cè)定切割產(chǎn)物的生物學(xué)活性。例如,可用培養(yǎng)的睪丸細(xì)胞或?qū)m當(dāng)?shù)膭?dòng)物模型體內(nèi)施用由本發(fā)明多肽切割或加工的激素原分子而測(cè)定增殖和分化。培養(yǎng)的睪丸細(xì)胞包括海豚DB1.Tes細(xì)胞(CRL-6258);小鼠GC-1 spg細(xì)胞(CRL-2053);TM3細(xì)胞(CRL-1714);TM4細(xì)胞(CRL-1715);及豬ST細(xì)胞(CRL-1746),均可由美國典型培養(yǎng)物保藏中心,Rockville,MD提供。測(cè)量細(xì)胞增殖或分化的方法為本領(lǐng)域內(nèi)熟知。如,測(cè)量增殖的方法包括對(duì)中性紅染料的化學(xué)敏感性(chemosensitivity)試驗(yàn)(Cavanaugh等,InvestigationalNew Drugs 8347-354,1990),放射標(biāo)記核苷酸摻入法(Cook等,分析生物化學(xué)(Analytical Biochem.)1791-7,1989),增殖細(xì)胞DNA中5-溴-2’-脫氧尿苷(BrdU)摻入法(Porstmann等,免疫學(xué)方法雜志82169-179,1985),及四唑鎓鹽的應(yīng)用(Mosmann,免疫學(xué)方法雜志6555-63,1983;Alley等,癌癥研究48589-601,1988;Marshall等,生長調(diào)控(Growth Reg),569-84,1995;及Scudiero等,癌癥研究484827-4833,1988)。測(cè)定分化的方法包括,如測(cè)定與組織的階段特異性表達(dá)、酶活性、功能活性或形態(tài)學(xué)改變相關(guān)的細(xì)胞表面標(biāo)記(Watt,F(xiàn)ASEB,5281-284,1991;Francis,分化5763-75,1994;Raes,Adv.Anim.Cell Biol.Technol.Bioprocesses,161-171,ESACT,第九次會(huì)議,1989)。
評(píng)估人PC4對(duì)睪丸多肽因子的作用的體內(nèi)試驗(yàn)為本領(lǐng)域內(nèi)熟知。如,切割產(chǎn)物可在特定時(shí)間段行腹膜內(nèi)注射。處理階段過后,殺死動(dòng)物,取出睪丸稱重。勻漿睪丸并進(jìn)行精子頭計(jì)數(shù)(Meistrich等,實(shí)驗(yàn)細(xì)胞研究(Exp.Cell Res.)9972-78,1976)。
可能與本發(fā)明蛋白質(zhì)加工的多肽切割產(chǎn)物相關(guān)的其它活性,如趨化活性也可進(jìn)行分析。如精子發(fā)生的晚期因子可能參與精子-受精卵相互作用及精子游動(dòng)。評(píng)估這類活性的試驗(yàn)為已知(Fuchs,ZentralblGynakol 11117-120,1993;Neurwinger等,Andrologia 22335-339,1990;Harris等,Human Reprod.(人類生殖)3856-860,1988;及Jockenhovel,Andrologica 22171-178,1990)。
此外,標(biāo)準(zhǔn)生化分析技術(shù)(如Western印跡)可用于檢測(cè)人PC4加工未知活性的底物激素原而產(chǎn)生的切割產(chǎn)物(Sambrook等,同出處,及Ausubel,等,同出處)。應(yīng)用這樣的方法,表達(dá)人PC4和檢驗(yàn)激素原底物的細(xì)胞分泌的切割產(chǎn)物可通過分析從細(xì)胞收集到的培養(yǎng)物而測(cè)定。
本發(fā)明的蛋白質(zhì)還可用于在細(xì)胞上進(jìn)行的對(duì)人PC4調(diào)節(jié)子的篩選中。調(diào)節(jié)子(如拮抗劑和興奮劑)可以好幾種方式影響激素原轉(zhuǎn)化酶,如影響催化活性、基因表達(dá)、或與底物多肽的相互作用。這類拮抗劑和興奮劑可分別通過減弱或增強(qiáng)人PC4的切割活性而影響本發(fā)明之激素原轉(zhuǎn)化酶。該增強(qiáng)或減弱可通過評(píng)估人PC4所作用的激素原的切割產(chǎn)物而測(cè)定。在該應(yīng)用中,在表達(dá)人PC4的同一細(xì)胞中表達(dá)已知可被本發(fā)明之多肽切割的指示性激素原底物。構(gòu)建這種細(xì)胞的方法為本領(lǐng)域內(nèi)已知并公開于此。優(yōu)選的指示性激素原多肽被激素原轉(zhuǎn)化酶切割后從細(xì)胞中分泌出來,并具有與切割產(chǎn)物相關(guān)的易于測(cè)定的生物學(xué)活性。這樣的活性試驗(yàn)實(shí)例已公開于上文中。通過與各種下文討論的試劑接觸后篩選細(xì)胞所分泌的切割產(chǎn)物而鑒定拮抗劑和興奮劑。對(duì)指示性底物加工中的變化反映了相對(duì)于未接受試劑的對(duì)照細(xì)胞,試劑對(duì)本發(fā)明之人PC4蛋白的增強(qiáng)或抑制激素原轉(zhuǎn)化酶的活性。如相對(duì)于對(duì)照,增強(qiáng)人PC4活性的興奮劑將導(dǎo)致切割增加,因而由指示劑底物產(chǎn)生更多有生物學(xué)活性的切割產(chǎn)物。相反,相對(duì)于對(duì)照,減弱人PC4活性的拮抗劑將導(dǎo)致切割減少,從而由指示性底物產(chǎn)生較少的或可能不產(chǎn)生有生物學(xué)活性的切割產(chǎn)物??烧{(diào)節(jié)人PC4,并可在檢驗(yàn)樣品中評(píng)估或利用的試劑的來源包括,但不限于任何天然來源或化學(xué)來源,包括但不限于植物、微生物和真菌提取物、化學(xué)文庫,及組合化學(xué)文庫。建立并應(yīng)用這類基于細(xì)胞的篩選試驗(yàn)的方法為本領(lǐng)域內(nèi)已知。
這類基于細(xì)胞的篩選可用于檢測(cè)檢驗(yàn)樣品中有無人激素原轉(zhuǎn)化酶多肽活性調(diào)節(jié)子。表達(dá)成熟人PC4蛋白并表達(dá)已知的指示性激素原多肽底物的細(xì)胞可在有或無檢驗(yàn)樣品時(shí)培養(yǎng)。構(gòu)建這樣一個(gè)細(xì)胞可通過本領(lǐng)域已知并述于此的方法進(jìn)行。例如,可將指導(dǎo)成熟人PC4蛋白表達(dá)的表達(dá)載體和指導(dǎo)已知指示性激素原多肽底物表達(dá)的表達(dá)載體導(dǎo)入相同細(xì)胞中。無檢驗(yàn)樣品的細(xì)胞可作對(duì)照,與有檢驗(yàn)樣品時(shí)的分子活性進(jìn)行對(duì)比。用生物學(xué)或生物化學(xué)試驗(yàn)可比較有和無檢驗(yàn)樣品時(shí)由人PC4切割底物產(chǎn)生的切割產(chǎn)物的水平。通過這種比較,可如上述說明檢驗(yàn)樣品中有無人激素原轉(zhuǎn)化酶活性的調(diào)節(jié)子。
本發(fā)明的多肽還可用于檢測(cè)人19號(hào)染色體上與疾病或其它人類特征相關(guān)的異常。本發(fā)明之多核苷酸位于人19號(hào)染色體的19p13.3區(qū)。激素原轉(zhuǎn)化酶基因位點(diǎn)處可檢測(cè)的染色體畸變包括但不限于非整倍性、基因拷貝數(shù)改變、插入、缺失、限制性位點(diǎn)改變和重排。這些畸變可用本發(fā)明之多核苷酸應(yīng)用分子遺傳學(xué)技術(shù)(如限制性片段長度多態(tài)性(RFLP)分析、應(yīng)用PCR的短串聯(lián)重復(fù)序列(STR)分析,及本領(lǐng)域內(nèi)已知的其它遺傳學(xué)連鎖分析技術(shù))進(jìn)行檢測(cè)(Sambrook等,同出處;Ausubel等,同出處;Marian,A.J.,Chest 108255-265,1995)。
本發(fā)明還包括診斷用試劑。如人PC4基因,含人PC4 DNA或RNA或其亞序列(Subsequence)的探針,可用于測(cè)定人PC4基因是否存在于19號(hào)染色體上或是否有突變發(fā)生。人PC4基因位點(diǎn)處的可檢測(cè)性染色體畸變包括,但不限于非整倍體、基因拷貝數(shù)改變、插入、缺失、限制位點(diǎn)改變和重排。這些畸變可發(fā)生在編碼序列內(nèi),內(nèi)含子內(nèi),或側(cè)翼序列內(nèi)(包括上游啟動(dòng)子和調(diào)節(jié)區(qū)),并可證實(shí)為編碼序列中的物理學(xué)改變或基因表達(dá)水平的改變。分析性探針通常至少20個(gè)核苷酸長,有時(shí)可用較短的探針(14-17個(gè)核苷酸)。PCR引物至少5個(gè)核苷酸長,優(yōu)選15或更多個(gè)核苷酸,更優(yōu)選20-30個(gè)核苷酸。當(dāng)將分析基因的較小區(qū)時(shí),可用短的多核苷酸。粗略分析基因時(shí),多核苷酸探針可包含一個(gè)完整外顯子或更多。探針通常包含與信號(hào)產(chǎn)生部分如放射標(biāo)記的核苷酸連接的多核苷酸。這些診斷方法一般包含以下步驟(a)獲得一個(gè)病人的遺傳學(xué)樣品;(b)在多核苷酸能與互補(bǔ)的多核苷酸序列雜交產(chǎn)生第一反應(yīng)產(chǎn)物的條件下,將遺傳學(xué)樣品與上述多核苷酸探針或引物一起溫育;及(c)將第一反應(yīng)產(chǎn)物與對(duì)照反應(yīng)產(chǎn)物比較。第一反應(yīng)產(chǎn)物與對(duì)照反應(yīng)產(chǎn)物的差異可指示病人的遺傳學(xué)異常。本發(fā)明中可應(yīng)用的遺傳學(xué)樣品包括基因組DNA,cDNA和RNA。多核苷酸探針或引物可以是RNA或DNA,并包含SEQ ID No1的一部分,SEQ ID No1的互補(bǔ)物,或其RNA等價(jià)物。關(guān)于這一點(diǎn)的合適分析方法包括本領(lǐng)域內(nèi)已知的分子遺傳學(xué)技術(shù),如限制性片段長度多態(tài)性(RFLP)分析、應(yīng)用PCR技術(shù)的短串聯(lián)重復(fù)序列(STR)分析、連接鏈反應(yīng)(Barany,PCR方法及應(yīng)用,15-16,1991),核糖核酸酶保護(hù)試驗(yàn),及本領(lǐng)域內(nèi)已知的其它遺傳學(xué)連鎖分析技術(shù)(Sambrook等,同出處;Ausubel等,同出處;A.J.Marian,同出處,1995)。核糖核酸酶保護(hù)試驗(yàn)(見,如,Ausubel等,同出處,第4章)包含RNA探針與病人RNA樣品的雜交,然后使反應(yīng)產(chǎn)物(RNA-RNA雜交體)暴露于RNase。RNA的已雜交區(qū)受到保護(hù)而不被消化。PCR試驗(yàn)中,將病人的遺傳學(xué)樣品與一對(duì)多核苷酸引物共同溫育,擴(kuò)增引物之間的區(qū)域并回收?;厥债a(chǎn)物的大小或量的變化可指示病人的突變。另一個(gè)可應(yīng)用的基于PCR的技術(shù)是單鏈構(gòu)象多態(tài)性(SSCP)分析(Hayashi,PCR方法及應(yīng)用134-38,1991)。
實(shí)施例實(shí)施例1人激素原轉(zhuǎn)化酶4的克隆A.摘要用鼠PC4 cDNA探針篩選人睪丸cDNA文庫,揭示一段分離的cDNA(克隆pSLHPC4-5)與鼠PC4 cDNA同源。該cDNA編碼人激素原轉(zhuǎn)化酶4(人PC4)。B.人睪丸cDNA文庫的制備通過篩選λZAPII(Stratagene,La Jolla,CA)人睪丸cDNA文庫獲得全長人PC4 cDNA。睪丸cDNA文庫的構(gòu)建如下第一鏈cDNA反應(yīng)包含15μl濃度為1.0μg/μl的人睪丸雙polyd(T)選擇的poly(A)+mRNA(Clontech Laboratories)和3μl20pmole/μl包含一個(gè)XhoI限制性位點(diǎn)的第一鏈引物ZC6091(SEQ IDNo5)。該混合物加熱至70℃4分鐘,在冰上冷卻。向RNA-引物混合物中加入12μl第一鏈緩沖液(5X SUPERSCRIPTTM緩沖液;LifeTechnologies,Gaithersburg,MD),6μl 100mM的二硫蘇糖醇,及3μl含dTTP,dATP,dGTP和5-甲基-dCTP各10mM的脫氧核苷三磷酸溶液(Pharmacia LKB Biotechnology,Piscataway,NJ)而啟動(dòng)第一鏈cDNA合成。反應(yīng)混和物37℃溫育2分鐘,然后加入15μl 200U/μl RNase H-逆轉(zhuǎn)錄酶(SUPERSCRIPT II;Life Technologies)。第一鏈合成效率在平行反應(yīng)中通過向取自反應(yīng)混合物之一以用于標(biāo)記反應(yīng)進(jìn)行分析的5μl等份中加入5μCi32P-αdCTP進(jìn)行分析。反應(yīng)于37℃溫育10分鐘,45℃1小時(shí),然后50℃10分鐘。標(biāo)記反應(yīng)中未摻入的32P-αdCTP在400孔大小的凝膠過濾柱(Clontech Laboratories)上經(jīng)層析去除。未標(biāo)記的第一鏈反應(yīng)物中未摻入的核苷酸和引物在400孔大小的凝膠過濾柱(Clontech Laboratories)上經(jīng)層析去除。標(biāo)記的第一鏈cDNA長度經(jīng)瓊脂糖凝膠電泳測(cè)定。
第二鏈反應(yīng)包含120μl未標(biāo)記的第一鏈cDNA,36μl 5X聚合酶I緩沖液(125mM Tris-HCl,pH7.5,500mM KCl,25mM MgCl2,50mM(NH4)2SO4),2.4μl 100mM二硫蘇糖醇,3.6μl含每種脫氧核苷三磷酸各10mM的溶液,6μl 5mMβ-NAD,3.6μl 3μ/μl大腸桿菌DNA連接酶(New England Biolabs;Beverly,MA),9μl 10U/μl大腸桿菌DNA聚合酶I(New England Biolabs),及1.8μl 2U/μlRNase H(Life Technologies)。其中一份10μl的第二鏈合成反應(yīng)經(jīng)加入10μCi32P-αdCTP而標(biāo)記,以監(jiān)控第二鏈合成效率。反應(yīng)于16℃溫育2小時(shí),然后加15μl T4 DNA聚合酶(10U/μl,BoerhingerMannheim,Indianapolis,IN)并再于16℃溫育5分鐘。在瓊脂糖凝膠電泳分析之前,經(jīng)400孔大小的凝膠過濾柱(Clontech Laboratories)層析去除標(biāo)記反應(yīng)中未摻入的32P-αdCTP。加入20μl 0.5EDTA,并用苯酚/氯仿和氯仿抽提,然后在有2.5M醋酸銨和4μg糖原載體時(shí)用乙醇沉淀而使反應(yīng)終止。由15μg起始mRNA模板產(chǎn)生的cDNA約接近3μg。
將EcoRI銜接子連接在上述cDNA的5’末端,以便能克隆進(jìn)入表達(dá)載體。10μl等份的cDNA(約1.5μg)和5μl 65pmole/μl EcoRI銜接于(Pharmacia LKB Biotechnology公司)與2μl 10X連接酶緩沖液(660mM Tris-HCl pH7.5,100mM MgCl2),2μl 10mM ATP和1μl 15U/μl T4 DNA連接酶(Promega公司,Madison,WI)混合。反應(yīng)于5℃溫育2小時(shí),7.5℃2小時(shí),10℃2小時(shí),12.5℃10小時(shí)。經(jīng)70℃溫育20分鐘終止反應(yīng)。
為便于cDNA定向克隆進(jìn)入1ZapII載體(stratagene),cDNA用XhoI消化,產(chǎn)生具有5’EcoRI粘性末端和3’XhoI粘性末端的一段cDNA。該cDNA 3’末端的XhoI限制性位點(diǎn)已事先用ZC6091引物(SEQ IDNo5)導(dǎo)入。在含上述cDNA 20μl,10μl 10X H緩沖液(BoehringerMannbeim),69μl H2O,及1.0μl 40U/μl XhoI(Boehringer Mannheim)的反應(yīng)混合物中進(jìn)行限制酶消化。消化在37℃進(jìn)行40分鐘。反應(yīng)的終止通過在70℃溫育10分鐘并經(jīng)400孔大小的凝膠過濾柱(ClontechLaboratories)層析而完成。
cDNA經(jīng)乙醇沉淀,用70%乙醇洗滌,風(fēng)干,再重新懸浮于14μlH2O,2μl連接酶緩沖液(Promega公司,Madison WI),2μl T4多核苷酸激酶(10U/μl,Life Technologies)中。37℃溫育30分鐘后,將cDNA加熱至65℃5分鐘,冰上冷卻,在0.8%低熔點(diǎn)瓊脂糖凝膠上電泳。從凝膠中切除污染的銜接子及長度小于0.6Kb的cDNA。電極對(duì)調(diào),cDNA電泳直至濃縮于泳道出發(fā)點(diǎn)附近。含濃縮cDNA的凝膠區(qū)被切下并置于微量管中,確定凝膠片的近似體積。向管中加入近三倍于凝膠片體積(300μl)的水及35μl 10X β-瓊脂糖酶I緩沖液(NewEngland Biolabs),將瓊脂糖于65℃加熱5分鐘熔化。將樣品平衡于45℃后,加入3μl 1U/μlβ-瓊脂糖酶I(New England Biolabs),混合物于45℃溫育60分鐘以消化瓊脂糖。溫育后,向樣品中加入40μl 3M醋酸鈉,混合物置于冰上15分鐘。將樣品于室溫下14,000Xg離心15分鐘以去除未消化的瓊脂糖。cDNA經(jīng)乙醇沉淀,70%乙醇洗滌,風(fēng)干并再懸于10μl水中。
將所得cDNA克隆進(jìn)入已事先用EcoRI和XhoI消化并去磷酸化的Lamda噬菌體載體λZapII(strotegene)中。cDNA與λZapII載體的連接在含1.0μl預(yù)制載體,1.0μl人睪丸cDNA,1.0μl 10X連接酶緩沖液(Promega公司),1.0μl 10mM ATP,5μlH2O,及1.0μl 15U/μl的T4 DNA連接酶(Promega公司)的反應(yīng)混合物中完成。連接混合物在5℃-15℃溫度梯度中溫育過夜。溫育后,連接混合物用體外包裝提取物(GigapackIII Gold包裝提取物,Stratagene)包裝成噬菌體,所得文庫按廠家說明測(cè)定滴度。C.多核苷酸的分離用人睪丸λZapII文庫感染大腸桿菌宿主細(xì)胞(XL1-BlueTMMRF’菌株;Stratagene),將1.5×106pfu鋪到150mm NZY板上,使密度為約40,000pfu/板。接種板37℃溫育過夜。用尼龍膜(HybondTM-N;Amersham公司,Arlington Heights,IL)按廠家建議的程序制成濾膜噬斑浸提物。濾膜在含1.5M NaCl和0.5M NaOH的溶液中室溫變性7分鐘。將濾膜用濾紙稍微吸一下,以去除剩余變性溶液,然后在1MTris-HCl,pH7.5及1.5M NaCl中中和5分鐘。噬菌體DNA在UVCrosslinker(Stratalinker;Stratagene)中用1,200微焦耳的紫外線(UV)能量固定于濾膜上。然后濾膜在雜交溶液(5XSSC,5XDenhardt’s溶液,0.2%SDS和1mM EDTA)中預(yù)雜交。加入熱變性的剪切鮭精DNA至終濃度為100μg/ml。濾膜于65℃預(yù)雜交過夜。
用寡核苷酸經(jīng)PCR擴(kuò)增相應(yīng)于SEQ ID No6的45位至1033位核苷酸的大鼠激素原轉(zhuǎn)化酶編碼區(qū),制得探針。起始的第一輪PCR反應(yīng)混合物包含2μl ZC11,808(SEQ ID No7)和2μl ZC11,809(SEQ IDNo8),1μl 400 fg/μl大鼠睪丸cDNA,1μl 10mM dNTP,10μl 10×Klentaq緩沖液(Clontech),83μl水,及2μl Klentag DNA聚合酶(Clontech)。第一輪PCR反應(yīng)運(yùn)行如下先95℃30秒;再95℃30秒,57℃30秒,68℃2分鐘共30個(gè)循環(huán);然后68℃10分鐘。第一輪PCR產(chǎn)物用水稀釋至1∶2000。對(duì)1μl稀釋的第一輪PCR產(chǎn)物進(jìn)行第二輪PCR,所用巢式引物為ZC11,870(SEQ ID No9)和ZC11,871(SEQ IDNo10),它們?cè)O(shè)計(jì)為可擴(kuò)增第一輪PCR產(chǎn)物內(nèi)部的DNA。第二輪PCR反應(yīng)運(yùn)行如下先95℃30秒;再95℃30秒,58℃30秒,68℃2分鐘,共30個(gè)循環(huán);然后68℃10分鐘。第二輪PCR產(chǎn)物在1.5%低熔點(diǎn)瓊脂糖凝膠上凝膠純化,以用作探針去篩選人睪丸cDNA文庫,獲得人PC4。
25ng PCR產(chǎn)物用MEGAPRIMETMDNA標(biāo)記系統(tǒng)(Amersham)按廠家建議通過隨機(jī)引發(fā)法而標(biāo)記上放射性α-32P-dCTP。預(yù)雜交溶液用新鮮的含6.5×105cpm/ml標(biāo)記探針的雜交溶液取代,60℃雜交過夜。然后去除雜交溶液,濾膜在含1xSSC,0.25%SDS和1mM EDTA的洗滌液中45℃下漂洗。將濾膜置于放射自顯影膠片上,用增感屏在-70℃曝光96小時(shí)。
對(duì)放射自顯影的檢查揭示有多個(gè)可與標(biāo)記探針雜交的區(qū)。從39個(gè)區(qū)挑取瓊脂塞進(jìn)行純化。將每個(gè)瓊脂塞在含1%(v/v)氯仿的0.5mlSM中浸泡過夜(Sambrook等,分子克隆實(shí)驗(yàn)室手冊(cè),第二版,冷泉港實(shí)驗(yàn)室出版社,冷泉港,NY,1989)。溫育后,將每個(gè)瓊脂塞的噬菌體在SM中稀釋至1∶1000。取50μl等分液鋪板于大腸桿菌XL-1 BlueTMMRF’細(xì)胞上。平板37℃溫育過夜,如上述制備濾膜浸提物、預(yù)雜交、雜交、洗滌并放射自顯影。對(duì)所得放射自顯影圖的檢查揭示10個(gè)濾膜浸提物上有陽性信號(hào)。從這些區(qū)挑取瓊脂塞進(jìn)行另一輪噬斑純化。
質(zhì)粒用ExASSIST/SOLRTM系統(tǒng)(Stratagene)按廠商建議切割。這些質(zhì)粒經(jīng)PCR擴(kuò)增以測(cè)定插入子的大小并對(duì)其測(cè)序。命名為pSLHPC4-5的克隆顯示包含SEQ ID No1中所示序列。
實(shí)施例2組織分布從pSLHPC4-5的全長編碼序列制備探針,用于探測(cè)人多組織Northern印跡(Human Multiple Tissue Northern Blot)(Clontech)。Northern分析揭示了一條只存在于睪丸中的約2.8Kb的帶。
實(shí)施例3基于PCR的人PC4基因染色體作圖用商品化“GeneBridge 4 Radiation Hybrid Panel”(ResearchGenetics公司,Huntsville,AL)將人PC4定位于19號(hào)染色體。GeneBridge 4 Radiation Hybrid Panel包含93個(gè)放射雜交克隆每一個(gè)的DNA,外加2個(gè)對(duì)照DNA(HFL供體和A23受體)。公開可應(yīng)用的WWW服務(wù)器 (http//www-genome,wi.mit.edu/cgibin/contig/rhmapper.pl)可用來相對(duì)于用GeneBridge 4 RadiationHybrid Panel所構(gòu)建的Whitehead研究所/MIT中心人類基因組圖譜(“WICGR”人類基因組圖譜)作圖。B.
為了用“GeneBridge 4 RH Panel”對(duì)人PC4作圖,在96孔微滴板(Stratagene)中設(shè)立20μl PCR反應(yīng),并用于“RoboCycler Gradient96”熱循環(huán)儀(Stratagene)中。95份PCR反應(yīng)物的每份組成為2μl10XKenTaq PCR反應(yīng)緩沖液(Clontech Laboratories公司,Palo Alto,CA),1.6μl dNTP混合物(每種2.5mM,Perkin-Elmer,F(xiàn)oster City,CA),1μl有義引物ZC13,557(SEQ ID NO11),1μl反義引物ZC13,558(SEQ ID No12),2μl“RediLoad”(Research Genetics公司,Huntsville,AL),0.4μl 50X Advantage Klentaq聚合酶混合物(Clontech Laboratories公司),25ng來自單個(gè)雜交克隆或?qū)φ盏腄NA,及ddH2O至總體積20μl。反應(yīng)物用等量礦物油覆蓋并密封。PCR循環(huán)儀條件如下先95℃變性5分鐘進(jìn)行一個(gè)初始循環(huán),再95℃變性1分鐘,68℃退火1分鐘,72℃延伸1.5分鐘共35個(gè)循環(huán),然后72℃延伸7分鐘。在3%NuSieve GTG瓊脂糖凝膠(FMC Bioproducts,Rockland,ME)上經(jīng)電泳分離反應(yīng)物。
結(jié)果顯示人PC4作圖于WICGR放射雜交圖上距離19號(hào)染色體框架標(biāo)記IB1264 10.54cR-3000處。它指示人PC4位于完整LDB 19號(hào)染色體圖譜中19p13.3區(qū)。(The Genetic Location Database,Southhampton 大學(xué),WWW 網(wǎng)址http//cedar.genetics.soton.al.Uk/publ ic-html/)。
實(shí)施例4人PC4哺乳動(dòng)物表達(dá)載體PPC4-5/pHZ1的構(gòu)建制備表達(dá)載體,用于在哺乳動(dòng)物細(xì)胞中表達(dá)人PC4多肽。哺乳動(dòng)物表達(dá)載體pHZ1有受控于SV40早期啟動(dòng)子的新霉素基因,SV40多聚腺苷化位點(diǎn),一個(gè)可插入受控于金屬硫蛋白(MT-1)啟動(dòng)子的目的基因的多克隆位點(diǎn)(多接頭),及人生長激素(hGH)多聚腺苷化位點(diǎn)。該表達(dá)載體保存于美國典型培養(yǎng)物保藏中心,12301 Parklawn Drive,Rockville,MD.
將人PC4亞克隆進(jìn)pHZ1多接頭中的EcoRI/XbaI位點(diǎn)。用EcoRI和XbaI(Boehringer-Mannbeim)切割pHZ1,再經(jīng)QiaquickTM柱(Qiagen)分離片段,制備載體片段。用限制酶EcoRI和AatII從實(shí)施例1的人PC4克隆切出一個(gè)1644bp片段(5’片段),產(chǎn)生人PC4序列含5’UTR的5’末端(如SEQ ID No1所示)。用跨越人PC4 AatII位點(diǎn)的引物ZC13,359(SEQ ID No13)及含XbaI位點(diǎn)的引物ZC13,358(SEQID No14),從實(shí)施例1的人PC4克隆中PCR擴(kuò)增出一段約681bp的PCR片段,產(chǎn)生人PC4序列含3’UTR的3’末端(如SEQ ID No1所示)。PCR反應(yīng)條件為94℃1分鐘一個(gè)循環(huán);再94℃30秒,50℃20秒,72℃30秒共35個(gè)循環(huán);然后72℃10分鐘。PCR產(chǎn)物用AatII和XbaI切割,片段按上述純化,產(chǎn)生681bp的PCR片段(3’片段)。
將切出的5’片段和3’片段DNA亞克隆進(jìn)入pHZ1載體片段中。約20ng EcoRI/AatII消化的人PC45’片段,約20ng AatII/XbaI消化的人PC43’片段,及約40ng相應(yīng)載體片段于室溫下,在標(biāo)準(zhǔn)連接緩沖液中連接5小時(shí)。取1μl這樣的連接反應(yīng)物,按廠商建議電穿孔進(jìn)入25μl DH10B感受態(tài)細(xì)胞(GIBCO BRL,Gaithersburg,MD)中,鋪于含100mg/ml氨芐青霉素的LB平板上,37℃溫育過夜。
用引物ZC12,634(SEQ ID No15)和ZC12,945(SEQ ID No16)在下列PCR條件下篩選菌落94℃1分鐘;再94℃20秒,50℃30秒,72℃1分鐘共25個(gè)循環(huán);然后72℃10分鐘。陽性克隆的插入序列經(jīng)序列分析檢驗(yàn)。大批量質(zhì)粒用QIAGEN大量制備試劑盒(Qiagen)按廠家建議制備。
盡管本文為了舉例說明的目的而描述了本發(fā)明的特殊實(shí)施例,但應(yīng)理解,在不偏離本發(fā)明的精神及范圍的前提下可作各種修改。相應(yīng)地,本發(fā)明除了權(quán)利要求書所限內(nèi)容之外,其它方面不受限制。
序列表(1)基本信息(i)申請(qǐng)人ZymoGenetics,Inc.
1201 Eastlake Avenue EastSeattle,WAUSA98102(ii)發(fā)明名稱人激素原轉(zhuǎn)化酶4(iii)序列數(shù)目11(iv)聯(lián)系地址(A)收件人ZymoGenetics,Inc.
(B)街道1201 Eastlake Avenue East(C)城市Seattle(D)州名WA(E)國家USA(F)郵政編碼98102(v)計(jì)算機(jī)可讀形式(A)介質(zhì)類型軟盤(B)計(jì)算機(jī)IBM兼容機(jī)(C)操作系統(tǒng)DOS(D)軟件FastSEQ,Windows版本2.0(vi)目前申請(qǐng)資料(A)申請(qǐng)?zhí)?B)遞交日(C)分類(vii)在先申請(qǐng)資料(A)申請(qǐng)?zhí)?br>
(B)遞交日(viii)代理人/代理信息(A)姓名Parker,Gary E.
(B)登記號(hào)31,648(C)參考/文檔號(hào)97-05PC(ix)電信信息(A)電話206-442-6673(B)傳真206-442-6678(C)電傳(2)關(guān)于SEQ ID NO1的信息(i)序列特征(A)長度2744個(gè)堿基對(duì)(B)類型核酸(C)鏈型雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型cDNA(ix)特征(A)名稱/關(guān)鍵詞編碼序列(B)位置61…2325(D)其它信息(xi)序列描述SEQ ID NO1GAATTCGGCA CGAGGCGGGA GGGAGGGGAT TTGCGCAGGC CCCGCTCCCG CCCCGCCTCC60ATG CGG CCC GCC CCG ATT GCG CTG TGG CTG CGC CTG GTC TTG GCC CTG 108Met Arg Pro Ala Pro Ile Ala Leu Trp Leu Arg Leu Val Leu Ala Leu1 5 10 15GCC CTT GTC CGC CCC CGG GCT GTG GGG TGG GCC CCG GTC CGA GCC CCC 156Ala Leu Val Arg Pro Arg Ala Val Gly Trp Ala Pro Val Arg Ala Pro20 25 30ATC TAT GTC AGC AGC TGG GCC GTC CAG GTG TCC CAG GGT AAC CGG GAG 204Ile Tyr Val Ser Ser Trp Ala Val Gln Val Ser Gln Gly Asn Arg Glu35 40 45GTC GAG CGC CTG GCA CGC AAA TTC GGC TTC GTC AAC CTG GGG CCG ATC 252Val Glu Arg Leu Ala Arg Lys Phe Gly Phe Val Asn Leu Gly Pro Ile50 55 60TTC CCT GAC GGG CAG TAC TTT CAC CTG CGG CAC CGG GGC GTG GTC CAG 300Phe Pro Asp Gly Gln Tyr Phe His Leu Arg His Arg Gly Val Val Gln65 70 75 80CAG TCC CTG ACC CCG CAC TGG GGC CAC CGC CTG CAC CTG AAG AAA AAC 348Gln Ser Leu Thr Pro His Trp Gly His Arg Leu His Leu Lys Lys Asn85 90 95CCC AAG GTG CAG TGG TTC CAG CAG CAG ACG CTG CAG CGG CGG GTG AAA 396Pro Lys Val Gln Trp Phe Gln Gln Gln Thr Leu Gln Arg Arg Val Lys100 105 110CGC TCT GTC GTG GTG CCC ACG GAC CCC TGG TTC TCC AAG CAG TGG TAC 444Arg Ser Val Val Val Pro Thr Asp Pro Trp Phe Ser Lys Gln Trp Tyr115 120 125ATG AAC AGC GAG GCC CAA CCA GAC CTG AGC ATC CTG CAG GCC TGG AGT 492Met Asn Ser Glu Ala Gln Pro Asp Leu Ser Ile Leu Gln Ala Trp Ser130 135 140CAG GGG CTG TCA GGC CAG GGC ATC GTG GTC TCT GTG CTG GAC GAT GGC 540Gln Gly Leu Ser Gly Gln Gly Ile Val Val Ser Val Leu Asp Asp Gly145 150 155 160ATC GAG AAG GAC CAC CCG GAC CTC TGG GCC AAC TAC GAC CCC CTG GCC 588Ile Glu Lys Asp His Pro Asp Leu Trp Ala Asn Tyr Asp Pro Leu Ala165 170 175AGC TAT GAC TTC AAT GAC TAC GAC CCG GAC CCC CAG CCC CGC TAC ACC 636Ser Tyr Asp Phe Asn Asp Tyr Asp Pro Asp Pro Gln Pro Arg Tyr Thr180 185 190CCC AGC AAA GAG AAC CGG CAC GGG ACC CGC TGT GCT GGG GAG GTG GCC 684Pro Ser Lys Glu Asn Arg His Gly Thr Arg Cys Ala Gly Glu Val Ala195 200 205GCG ATG GCC AAC AAT GGC TTC TGT GGT GTG GGG GTC GCT TTC AAC GCC 732Ala Met Ala Asn Asn Gly Phe Cys Gly Val Gly Val Ala Phe Asn Ala210 215 220CGA ATC GGA GGC GTA CGG ATG CTG GAC GGT ACC ATC ACC GAT GTC ATC 780Arg Ile Gly Gly Val Arg Met Leu Asp Gly Thr Ile Thr Asp Val Ile225 230 235 240GAG GCC CAG TCG CTG AGC CTG CAG CCG CAG CAC ATC CAC ATT TAC AGC 828Glu Ala Gln Ser Leu Ser Leu Gln Pro Gln His Ile His Ile Tyr Ser245 250 255GCC AGC TGG GGT CCC GAG GAC GAC GGC CGC ACG GTG GAC GGC CCC GGC 876Ala Ser Trp Gly Pro Glu Asp Asp Gly Arg Thr Val Asp Gly Pro Gly260 265 270ATC CTC ACC CGC GAG GCC TTC CGG CGT GGT GTG ACC AAG GGC CGC GGC 924Ile Leu Thr Arg Glu Ala Phe Arg Arg Gly Val Thr Lys Gly Arg Gly275 280 285GGG CTG GGC ACG CTC TTC ATC TGG GCC TCG GGC AAC GGC GGC CTG CAC 972Gly Leu Gly Thr Leu Phe Ile Trp Ala Ser Gly Asn Gly Gly Leu His290 295 300TAC GAC AAC TGC AAC TGC GAC GGC TAC ACC AAC AGC ATC CAC ACG CTT 1020Tyr Asp Asn Cys Asn Cys Asp Gly Tyr Thr Asn Ser Ile His Thr Leu305 310 315 320TCC GTG GGC AGC ACC ACC CAG CAG GGC CGC GTG CCC TGG TAC AGC GAA 1068Ser Val Gly Ser Thr Thr Gln Gln Gly Arg Val Pro Trp Tyr Ser Glu325 330 335GCC TGC GCC TCC ACC CTC ACC ACC ACC TAC AGC AGC GGC GTG GCC ACC 1116Ala Cys Ala Ser Thr Leu Thr Thr Thr Tyr Ser Ser Gly Val Ala Thr340 345 350GAC CCC CAG ATC GTC ACC ACG GAC CTG CAT CAC GGG TGC ACA GAC CAG 1164Asp Pro Gln Ile Val Thr Thr Asp Leu His His Gly Cys Thr Asp Gln355 360 365CAC ACG GGC ACC TCG GCC TCA GCC CCA CTG GCG GCC GGC ATG ATC GCC 1212His Thr Gly Thr Ser Ala Ser Ala Pro Leu Ala Ala Gly Met Ile Ala370 375 380CTA GCG CTG GAG GCC AAC CCG TTC CTG ACG TGG AGA GAC ATG CAG CAC 1260Leu Ala Leu Glu Ala Asn Pro Phe Leu Thr Trp Arg Asp Met Gln His385 390 395 400CTG GTG GTC CGC GCG TCC AAG CCG GCG CAC CTG CAG GCC GAG GAC TGG 1308Leu Val Val Arg Ala Ser Lys Pro Ala His Leu Gln Ala Glu Asp Trp405 410 415AGG ACC AAC GGC GTG GGG CGC CAA GTG AGC CAT CAC TAC GGA TAC GGG 1356Arg Thr Asn Gly Val Gly Arg Gln Val Ser His His Tyr Gly Tyr Gly420 425 430CTG CTG GAC GCC GGG CTG CTG GTG GAC ACC GCC CGC ACC TGG CTG CCC 1404Leu Leu Asp Ala Gly Leu Leu Val Asp Thr Ala Arg Thr Trp Leu Pro435 440 445ACC CAG CCG CAG AGG AAG TGC GCC GTC CGG GTC CAG AGC CGC CCC ACC 1452Thr Gln Pro Gln Arg Lys Cys Ala Val Arg Val Gln Ser Arg Pro Thr450 455 460CCC ATC CTG CCG CTG ATC TAC ATC AGG GAA AAC GTA TCG GCC TGC GCC 1500Pro Ile Leu Pro Leu Ile Tyr Ile Arg Glu Asn Val Ser Ala Cys Ala465 470 475 480GGC CTC CAC AAC TCC ATC CGC TCG CTG GAG CAC GTG CAG GCG CAG CTG 1548Gly Leu His Asn Ser Ile Arg Ser Leu Glu His Val Gln Ala Gln Leu485 490 495ACG CTG TCC TAC AGC CGG CGC GGA GAC CTG GAG ATC TCG CTC ACC AGC 1596Thr Leu Ser Tyr Ser Arg Arg Gly Asp Leu Glu Ile Ser Leu Thr Ser500 505 510CCC ATG GGC ACG CGC TCC ACA CTC GTG GCC ATA CGA CCC TTG GAC GTC 1644Pro Met Gly Thr Arg Ser Thr Leu Val Ala Ile Arg Pro Leu Asp Val515 520 525AGC ACT GAA GGC TAC AAC AAC TGG GTC TTC ATG TCC ACC CAC TTC TGG 1692Ser Thr Glu Gly Tyr Asn Asn Trp Val Phe Met Ser Thr His Phe Trp530 535 540GAT GAG AAC CCA CAG GGC GTG TGG ACC CTG GGC CTA GAG AAC AAG GGC 1740Asp Glu Asn Pro Gln Gly Val Trp Thr Leu Gly Leu Glu Asn Lys Gly545 550 555 560TAC TAT TTC AAC ACG GGG ACG TTG TAC CGC TAC ACG CTG CTG CTC TAT 1788Tyr Tyr Phe Asn Thr Gly Thr Leu Tyr Arg Tyr Thr Leu Leu Leu Tyr565 570 575GGG ACG GCC GAG GAC ATG ACA GCG CGG CCT ACA GGC CCC CAG GTG ACC 1836Gly Thr Ala Glu Asp Met Thr Ala Arg Pro Thr Gly Pro Gln Val Thr580 585 590AGC AGC GCG TGT GTG CAG CGG GAC ACA GAG GGG CTG TGC CAG GCG TGT 1884Ser Ser Ala Cys Val Gln Arg Asp Thr Glu Gly Leu Cys Gln Ala Cys595 600 605GAC GGC CCC GCC TAC ATC CTG GGA CAG CTC TGC CTG GCC TAC TGC CCC 1932Asp Gly Pro Ala Tyr Ile Leu Gly Gln Leu Cys Leu Ala Tyr Cys Pro610 615 620CCG CGG TTC TTC AAC CAC ACA AGG CTG GTG ACC GCT GGG CCT GGG CAC 1980Pro Arg Phe Phe Asn His Thr Arg Leu Val Thr Ala Gly Pro Gly His625 630 635 640ACG GCG GCG CCC GCG CTG AGG GTC TGC TCC AGC TGC CAT GCC TCC TGC 2028Thr Ala Ala Pro Ala Leu Arg Val Cys Ser Ser Cys His Ala Ser Cys645 650 655TAC ACC TGC CGC GGC GGC TCC CCG AGG GAC TGC ACC TCC TGT CCC CCA 2076Tyr Thr Cys Arg Gly Gly Ser Pro Arg Asp Cys Thr Ser Cys Pro Pro660 665 670TCC TCC ACG CTG GAC CAG CAG CAG GGC TCC TGC ATG GGA CCC ACC ACC 2124Ser Ser Thr Leu Asp Gln Gln Gln Gly Ser Cys Met Gly Pro Thr Thr675 680 685CCC GAC AGC CGC CCC CGG CTT AGA GCT GCC GCC TGT CCC CAC CAC CGC 2172Pro Asp Ser Arg Pro Arg Leu Arg Ala Ala Ala Cys Pro His His Arg690 695 700TGC CCA GCC TCG GCC ATG GTG CTG AGC CTC CTG GCC GTG ACC CTC GGA 2220Cys Pro Ala Ser Ala Met Val Leu Ser Leu Leu Ala Val Thr Leu Gly705 710 715 720GGC CCC GTC CTC TGC GGC ATG TCC ATG GAC CTC CCA CTA TAC GCC TGG 2268Gly Pro Val Leu Cys Gly Met Ser Met Asp Leu Pro Leu Tyr Ala Trp725 730 735CTC TCC CGT GCC AGG GCC ACC CCC ACC AAA CCC CAG GTC TGG CTG CCA 2316Leu Ser Arg Ala Arg Ala Thr Pro Thr Lys Pro Gln Val Trp Leu Pro740 745 750GCT GGA ACC TGAAGTTGTC AGCTCAGAAA GCGACCTTGC CCCCGCCTGG GTCCCTGAC2374Ala Gly Thr755AGGCACTGCT GCCATGCTGC CTCCCCAGGC TGGCCCCAGA GGAGCGAGCA CCAGCACCCG2434ACGCCTGGCC TGCCAGGGAT GGGCCCCGTG GAACCCCGAA GCCTGGCGGG AGAGAGAGAG2494AGAGAAGTCT CCTCTGCATT TTGGGTTTGG GCGGGAGTGG GCTGGGGGGA GAGGCTGGAG2554CACCCCAAAA GCCAGGGGAA AGTGGAGGGA GAGAAACGTG ACACTGTCCG CCTCGGGCAC2614CGCATCCAAC CTCAGAGTTT GCAAATAAAG GTTGCTTAGA AGGTGAAAAA AAAAAAAAAA2674AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA2734AAGCGGCCGC 2744(2)關(guān)于SEQ ID NO2的信息(i)序列特征(A)長度755個(gè)氨基酸(B)類型氨基酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(v)片段類型內(nèi)部的(xi)序列描述SEQ ID NO2Met Arg Pro Ala Pro Ile Ala Leu Trp Leu Arg Leu Val Leu Ala Leu1 5 10 15Ala Leu Val Arg Pro Arg Ala Val Gly Trp Ala Pro Val Arg Ala Pro20 25 30Ile Tyr Val Ser Ser Trp Ala Val Gln Val Ser Gln Gly Asn Arg Glu35 40 45Val Glu Arg Leu Ala Arg Lys Phe Gly Phe Val Asn Leu Gly Pro Ile50 55 60Phe Pro Asp Gly Gln Tyr Phe His Leu Arg His Arg Gly Val Val Gln65 70 75 80Gln Ser Leu Thr Pro His Trp Gly His Arg Leu His Leu Lys Lys Asn85 90 95Pro Lys Val Gln Trp Phe Gln Gln Gln Thr Leu Gln Arg Arg Val Lys100 105 110Arg Ser Val Val Val Pro Thr Asp Pro Trp Phe Ser Lys Gln Trp Tyr115 120 125Met Asn Ser Glu Ala Gln Pro Asp Leu Ser Ile Leu Gln Ala Trp Ser130 135 140Gln Gly Leu Ser Gly Gln Gly Ile Val Val Ser Val Leu Asp Asp Gly145 150 155 160Ile Glu Lys Asp His Pro Asp Leu Trp Ala Asn Tyr Asp Pro Leu Ala165 170 175Ser Tyr Asp Phe Asn Asp Tyr Asp Pro Asp Pro Gln Pro Arg Tyr Thr180 185 190Pro Ser Lys Glu Asn Arg His Gly Thr Arg Cys Ala Gly Glu Val Ala195 200 205Ala Met Ala Asn Asn Gly Phe Cys Gly Val Gly Val Ala Phe Asn Ala210 215 220Arg Ile Gly Gly Val Arg Met Leu Asp Gly Thr Ile Thr Asp Val Ile225 230 235 240Glu Ala Gln Ser Leu Ser Leu Gln Pro Gln His Ile His Ile Tyr Ser245 250 255Ala Ser Trp Gly Pro Glu Asp Asp Gly Arg Thr Val Asp Gly Pro Gly260 265 270Ile Leu Thr Arg Glu Ala Phe Arg Arg Gly Val Thr Lys Gly Arg Gly275 280 285Gly Leu Gly Thr Leu Phe Ile Trp Ala Ser Gly Asn Gly Gly Leu His290 295 300Tyr Asp Asn Cys Asn Cys Asp Gly Tyr Thr Asn Ser Ile His Thr Leu305 310 315 320Ser Val Gly Ser Thr Thr Gln Gln Gly Arg Val Pro Trp Tyr Ser Glu325 330 335Ala Cys Ala Ser Thr Leu Thr Thr Thr Tyr Ser Ser Gly Val Ala Thr340 345 350Asp Pro Gln Ile Val Thr Thr Asp Leu His His Gly Cys Thr Asp Gln355 360 365His Thr Gly Thr Ser Ala Ser Ala Pro Leu Ala Ala Gly Met Ile Ala370 375 380Leu Ala Leu Glu Ala Asn Pro Phe Leu Thr Trp Arg Asp Met Gln His385 390 395 400Leu Vai Val Arg Ala Ser Lys Pro Ala His Leu Gln Ala Glu Asp Trp405 410 415Arg Thr Asn Gly Val Gly Arg Gln Val Ser His His Tyr Gly Tyr Gly420 425 430Leu Leu Asp Ala Gly Leu Leu Val Asp Thr Ala Arg Thr Trp Leu Pro435 440 445Thr Gln Pro Gln Arg Lys Cys Ala Val Arg Val Gln Ser Arg Pro Thr450 455 460Pro Ile Leu Pro Leu Ile Tyr Ile Arg Glu Asn Val Ser Ala Cys Ala465 470 475 480Gly Leu His Asn Ser Ile Arg Ser Leu Glu His Val Gln Ala Gln Leu485 490 495Thr Leu Ser Tyr Ser Arg Arg Gly Asp Leu Glu Ile Ser Leu Thr Ser500 505 510Pro Met Gly Thr Arg Ser Thr Leu Val Ala Ile Arg Pro Leu Asp Val515 520 525Ser Thr Glu Gly Tyr Asn Asn Trp Val Phe Met Ser Thr His Phe Trp530 535 540Asp Glu Asn Pro Gln Gly Val Trp Thr Leu Gly Leu Glu Asn Lys Gly545 550 555 560Tyr Tyr Phe Asn Thr Gly Thr Leu Tyr Arg Tyr Thr Leu Leu Leu Tyr565 570 575Gly Thr Ala Glu Asp Met Thr Ala Arg Pro Thr Gly Pro Gln Val Thr580 585 590Ser Ser Ala Cys Val Gln Arg Asp Thr Glu Gly Leu Cys Gln Ala Cys595 600 605Asp Gly Pro Ala Tyr Ile Leu Gly Gln Leu Cys Leu Ala Tyr Cys Pro610 615 620Pro Arg Phe Phe Asn His Thr Arg Leu Val Thr Ala Gly Pro Gly His625 630 635 640Thr Ala Ala Pro Ala Leu Arg Val Cys Ser Ser Cys His Ala Ser Cys645 650 655Tyr Thr Cys Arg Gly Gly Ser Pro Arg Asp Cys Thr Ser Cys Pro Pro660 665 670Ser Ser Thr Leu Asp Gln Gln Gln Gly Ser Cys Met Gly Pro Thr Thr675 680 685Pro Asp Ser Arg Pro Arg Leu Arg Ala Ala Ala Cys Pro His His Arg690 695 700Cys Pro Ala Ser Ala Met Val Leu Ser Leu Leu Ala Val Thr Leu Gly705 710 715 720Gly Pro Val Leu Cys Gly Met Ser Met Asp Leu Pro Leu Tyr Ala Trp725 730 735Leu Ser Arg Ala Arg Ala Thr Pro Thr Lys Pro Gln Val Trp Leu Pro740 745 750Ala Gly Thr755(2)關(guān)于SEQ ID NO3的信息(i)序列特征(A)長度5個(gè)氨基酸(B)類型氨基酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型肽(xi)序列描述SEQ ID NO3
Arg Arg Val Lys Arg15(2)關(guān)于SEQ ID NO4的信息(i)序列特征(A)長度49個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(vii)直接來源(B)克隆ZC6091(xi)序列描述SEQ ID NO4GAGCACAGAA TTCACTACTC GAGGCGGCCG CTTTTTTT TTTTTTTTTTT 49(2)關(guān)于SEQ ID NO5的信息(i)序列特征(A)長度2458個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型其它(xi)序列描述SEQ ID NO5ATGCGGCCCT CCCAGACAGC GCTGTGGCTG GGTCTGGTTT TGTCTTTGGC CCTCCTGGCT60GTGGGGTGGG CCTCAGCCCG ACCACCCATC TATGTCAGCA GCTGGGCAGT GCGGGTGACC120AAAGGTTACC AGGAGGCTGA GCGCCTGGCA CGTAAATTTG GCTTCGTCAA CCTGGGACAG180ATCTTTCCTG ATGACCAGTA TTTCCATCTG AGGCACCGGG GTGTGGCCCA GCAGTCCCTG240ACTCCGCACT GGGGCCACCG TCTGCGCCTG AAGAAAGAGC CCAAGGTGCG GTGGTTTGAG300CAGCAGACTT TGAGGCGGCG GGTGAAGCGC TCCCTGGTGG TACCCACAGA CCCCTGGTTT360TCCAAGCAGT GGTACATGAA CAAGGAGATA GAACAAGATC TCAACATCCT AAAGGTTTGG420AACCAGGGAC TGACTGGCCG GGGAGTGGTG GTCTCCATCT TGGATGATGG CATTGAGAAG480GACCATCCGG ACCTCTGGGC TAATTATGAC CCCCTGGCCA GCTATGACTT CAATGATTAC540GACCCAGATC CCCAGCCTCG ATACACACCC AACGATGAGA ACCGGCATGG AACACGCTGC600GCTGGGGAGG TGTCTGCCAC AGCAAACAAC GGTTTCTGTG GTGCCGGTGT GGCCTTCAAT660GCCAGAATTG GAGGCGTGCG CATGTTGGAT GGAGCCATCA CTGACATCGT GGAGGCTCAG720TCCCTCAGCC TGCAGCCGCA ACACATACAC ATCTATAGCG CCAGTTGGGG CCCCGAGGAT780GATGGGCGCA CAGTGGACGG ACCCGGCCTC CTCACGCAGG AGGCCTTCAG GCGTGGTGTA840ACCAAGGGCC GCCAAGGGCT GGGCACGCTG TTCATCTGGG CCTCGGGAAA CGGTGGCCTC900CACTACGACA ACTGCAATTG TGACGGCTAC ACCAACAGCA TCCACACGCT GTCAGTGGGC960AGTACCACGC GGCAGGGCCG AGTGCCCTGG TACAGCGAGG CCTGCGCCTC CACGTTCACC1020ACCACCTTCA GCAGCGGTGT GGTCACCGAC CCACAGATCG TCACCACGGA CCTACACCAT1080CAATGCACCG ACAAGCACAC GGGCACCTCG GCCTCCGCCC CGCTGGCCGC TGGCATGATC1140GCCCTGGCGC TGGAGGCCAA CCCGCTGCTG ACCTGGAGGG ACCTGCAGCA CCTGGTGGTC1200CGCGCGTCCA GGCCGGCGCA GCTGCAGGCG GAGGACTGGA GGATCAACGG CGTGGGGCGC1260CAAGTGAGCC ACCACTATGG CTATGGGCTG CTGGACGCGG GGCTGCTGGT AGACCTGGCT1320CGCGTGTGGC TCCCTACTAA GCCTCAGAAG AAATGCACCA TTCGGGTGGT GCACACCCCA1380ACCCCCATCC TGCCTCGGAT GCTGGTGCCA AAGAACGTGA CTGTATGCTG CGATGGCTCG1440CGCCGCCGCC TCATCCGCTC GCTAGAGCAT GTTCAGGTCC AGCTGTCGCT CTCCTACAGC1500CGCCGCGGGG ACCTGGAGAT CTTCCTCACC AGCCCCATGG GCACGCGCTC CACGCTTGTG1560GCCATCAGAC CCTTGGATAT CAGCGGCCAA GGCTACAACA ACTGGATCTT CATGTCTACT1620CACTACTGGG ATGAGGACCC GCAGGGCCTG TGGACCCTGG GGCTGGAGAA TAAGGGCTAC1680TATTATAACA CAGGAACTCT GTACTACTGC ACGCTGCTGC TGTATGGGAC GGCAGAGGAC1740ATGACAGCGC GGCCCCAGAC CCCCCAGGTG ACCAGCTGCG CGCACGCATG TGCAGAGGGA1800CACAGAGGGG CTGTGCCAGG AAAGTCATTG TCCCCTCTCC ATTGTGGCAG AACTCTGCCT1860CATCTCCAGC AAGCAGTGGT GGTGGCTCTA CAGCCACACA CAGCAGCCAG TGACCAAGGG1920ACAGGACAGC TGTCACCCTC CTACCACACC TGCTCGGCAG CTTGACCAGC GACTACACTG1980CCTGTTCCCT GCCCCTCATG CTGGGAGTGC TTCAGAGCCC CTCCAAGGCT TGTCACCTCT2040GGCAGCCATC CTGGCTATCA GTCTTGGGCC ATGGTGCTGT CCCTGCTAAC CAGGGCCTTT2100GGAAGGCCCC TCATCTTGAG GAAGGCCCAC CTCTCCCCAG GCTGGATACC CCTGGGGAGC2160CAGAGATGCC CCACTCTCAG GACAGAAGGC CGGTACCCCA AGGCCCTGCT CCCAGGCCGG2220GATAGGAATA TGCCCCAGAA GGCCACGGCA GAGAGCTGCA TGGGTCACGT GACAGCCCGC2280AGCTCAGCCT CAGCTGCTCC CAGTGGAAGA GACGTTTCCT CATTCTTTTT GGAGCAGGTA2340TGGCAGACAA GAGGTCAGAC CACAGCCACC AACCACCTGC CCCTTCCCTG TCTCCAAACC2400ATCCCCATGT CTAACCTCAT AGTTGGCAAA TAAAGTTAAA CAGAAAAAAA AAAAAAAA 2458(2)關(guān)于SEQ ID NO6的信息(i)序列特征(A)長度25個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(vii)直接來源(B)克隆ZC11808(xi)序列描述SEQ ID NO6TGGCTGGGTC TGGTTTTGTC TTTGG 25(2)關(guān)于SEQ ID NO7的信息(i)序列特征(A)長度24個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(vii)直接來源(B)克隆ZC11809(xi)序列描述SEQ ID NO7GCATTGATGG TGTAGGTCCG TGGT24(2)關(guān)于SEQ ID NO8的信息(i)序列特征(A)長度24個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(vii)直接來源(B)克隆ZC11870(xi)序列描述SEQ ID NO8TTTGGCCCTC CTGGCTGTGG GGTG24(2)關(guān)于SEQ ID NO9的信息(i)序列特征(A)長度24個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(vii)直接來源
(B)克隆ZC11871(xi)序列描述SEQ ID NO9TGCTGAAGGT GGTGGTGAAC GTGG24(2)關(guān)于SEQ ID NO10的信息(i)序列特征(A)長度26個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(vii)直接來源(B)克隆ZC13557(xi)序列描述SEQ ID NO10CAGCCGCAGC ACATCCACAT TTACAG 26(2)關(guān)于SEQ ID NO11信息(i)序列特征(A)長度21個(gè)堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(vii)直接來源(B)克隆ZC13558(xi)序列描述SEQ ID NO11GGGTGAGGAT GCCGGGGCCG T 2權(quán)利要求
1.編碼包含與選自下組之氨基酸序列至少90%相同的一段氨基酸殘基序列的人激素原轉(zhuǎn)化酶4多肽的分離多核苷酸(a)SEQ ID No2所示114位(Ser)至443位(Ala)氨基酸的氨基酸序列;(b)SEQ ID No2所示114位(Ser)至755位(Thr)氨基酸的氨基酸序列;(c)SEQ ID No2所示20位(Arg)至755位(Thr)氨基酸的氨基酸序列;和(d)SEQ ID No2所示1位(Met)至755位(Thr)氨基酸的氨基酸序列。
2.權(quán)利要求1的分離多核苷酸,其中所述多核苷酸選自下組(a)SEQ ID No1所示400位-1389位核苷酸的多核苷酸序列;(b)SEQ ID No1所示400位-2325位核苷酸的多核苷酸序列;(c)SEQ ID No1所示118位-2325位核苷酸的多核苷酸序列;和(d)SEQ ID No1所示61位-2325位核苷酸的多核苷酸序列。
3.權(quán)利要求1的分離多核苷酸序列,其中該多核苷酸包含SEQ IDNo3的1位至2265位核苷酸。
4.權(quán)利要求1的分離多核苷酸,其中人激素原轉(zhuǎn)化酶4多肽基本上由與SEQ ID No2所示20位(Arg)至755位(Thr)氨基酸的序列至少90%相同的氨基酸殘基序列組成。
5.權(quán)利要求4的分離多核苷酸,其中所述激素原轉(zhuǎn)化酶4多肽基本上由SEQ ID No2所示20位(Arg)至755位(Thr)氨基酸的氨基酸殘基序列組成。
6.含以下可操作連接在一起的元件的表達(dá)載體轉(zhuǎn)錄啟動(dòng)子;編碼與SEQ ID No2所示20位(Arg)至755位(Thr)氨基酸序列至少90%相同的激素原轉(zhuǎn)化酶多肽的DNA片段;及轉(zhuǎn)錄終止子。
7.權(quán)利要求6的表達(dá)載體,其中進(jìn)一步包含可操作連接于所述DNA片段的一段分泌信號(hào)序列。
8.導(dǎo)入了權(quán)利要求6的表達(dá)載體的培養(yǎng)細(xì)胞,其中該細(xì)胞表達(dá)由所述DNA片段編碼的多肽。
9.編碼融合蛋白的DNA構(gòu)建體,其包含編碼與選自下組之氨基酸殘基序列至少90%相同的多肽的第一DNA區(qū)段(a)SEQ ID No2的1位(Met)至21位(Pro)氨基酸的序列;(b)SEQ ID No2的20位(Arg)至113位(Arg)氨基酸的序列;(c)SEQ ID No2的114位(Ser)至443位(Ala)氨基酸的序列;(d)SEQ ID No2的444(Arg)至561位(Tyr)氨基酸的序列;(e)SEQ ID No2的562位(Tyr)至755位(Thr)氨基酸的序列;(f)SEQ ID No2的114位(Ser)至755位(Thr)氨基酸的序列;(g)SEQ ID No2的20位(Arg)至755位(Thr)氨基酸的序列;及編碼其它多肽的至少一個(gè)其它DNA區(qū)段,其中所述第一和其它DNA區(qū)段在框架內(nèi)連接;并編碼融合蛋白。
10.由包含下述步驟的方法產(chǎn)生的融合蛋白培養(yǎng)已導(dǎo)入含以下可操作連接在一起的元件的載體的宿主細(xì)胞(a)轉(zhuǎn)錄啟動(dòng)子;(b)權(quán)利要求9的編碼融合蛋白的DNA構(gòu)建體;及(c)轉(zhuǎn)錄終止子;及回收該DNA區(qū)段編碼的蛋白質(zhì)。
11.含有與選自下組之氨基酸序列至少90%相同的氨基酸殘基序列的分離多肽(a)SEQ ID No2所示114位(Ser)至443位(Ala)的氨基酸序列;(b)SEQ ID No2所示114位(Ser)至755位(Thr)的氨基酸序列;(c)SEQ ID No2所示20位(Arg)至755位(Thr)的氨基酸序列;(d)SEQ ID No2所示1位(Met)至755位(Thr)的氨基酸序列。
12.權(quán)利要求11的分離多肽,其中該多肽基本上由與SEQ ID No2所示20位(Arg)至755位(Thr)氨基酸序列至少90%相同的氨基酸殘基序列組成。
13.權(quán)利要求12的分離多肽,其中該氨基酸殘基序列為SEQ IDNo2所示20位(Arg)至755位(Thr)氨基酸序列。
14.產(chǎn)生人激素原轉(zhuǎn)化酶4多肽的方法,包括培養(yǎng)權(quán)利要求8的細(xì)胞;并分離該細(xì)胞所產(chǎn)生的人激素原轉(zhuǎn)化酶多肽。
15.測(cè)定人激素原轉(zhuǎn)化酶4多肽的多肽激素原底物的方法,包括培養(yǎng)已導(dǎo)入權(quán)利要求6的表達(dá)載體的細(xì)胞,其中該細(xì)胞表達(dá)該DNA區(qū)段編碼的人激素原轉(zhuǎn)化酶多肽,還表達(dá)檢驗(yàn)底物激素原多肽;及檢測(cè)因人激素原轉(zhuǎn)化酶4多肽切割所述檢驗(yàn)底物產(chǎn)生的切割產(chǎn)物。
16.測(cè)定人激素原轉(zhuǎn)化酶4多肽的多肽激素原底物的方法,包括體外將權(quán)利要求11的激素原轉(zhuǎn)化酶4多肽與檢驗(yàn)底物多肽混合;并檢測(cè)因人激素原轉(zhuǎn)化酶4多肽切割檢驗(yàn)底物產(chǎn)生的切割產(chǎn)物。
17.檢測(cè)檢驗(yàn)樣品中是否有人激素原轉(zhuǎn)化酶多肽活性調(diào)節(jié)子的方法,包括在有或無檢驗(yàn)樣品時(shí)培養(yǎng)已導(dǎo)入權(quán)利要求6的表達(dá)載體的細(xì)胞,其中該細(xì)胞表達(dá)該DNA區(qū)段編碼的人激素原轉(zhuǎn)化酶多肽,還表達(dá)已知的指示性激素原多肽底物;及經(jīng)生物學(xué)或生物化學(xué)分析,比較在有和無檢驗(yàn)樣品時(shí)由人激素原轉(zhuǎn)化酶多肽切割該底物產(chǎn)生的切割產(chǎn)物的水平;并通過該項(xiàng)比較,確定檢驗(yàn)樣品中有無人激素原轉(zhuǎn)化酶活性的調(diào)節(jié)子。
18.產(chǎn)生人激素原轉(zhuǎn)化酶4多肽的抗體的方法,包括用選自下組的多肽接種動(dòng)物(a)由9至755個(gè)氨基酸組成的多肽,其中該多肽與SEQ ID No2中20位(Arg)至755位(Thr)氨基酸內(nèi)的一段連續(xù)序列至少90%相同;(b)權(quán)利要求11的多肽;(c)其具有的一段氨基酸序列與SEQ ID No2中444位(Arg)至561位(Tyr)殘基至少90%序列相同的多肽;及(d)其具有的一段氨基酸序列與SEQ ID No2中562位(Tyr)至755位(Thr)殘基至少90%序列相同的多肽,其中該多肽在動(dòng)物體內(nèi)可引起免疫應(yīng)答;及從動(dòng)物體內(nèi)分離該抗體。
19.由權(quán)利要求18的方法產(chǎn)生的抗體,其可結(jié)合人激素原轉(zhuǎn)化酶4多肽。
20.權(quán)利要求19的抗體,其中該抗體為單克隆抗體。
21.可與權(quán)利要求11的多肽特異性結(jié)合的抗體。
全文摘要
本發(fā)明提供新型人激素原轉(zhuǎn)化酶4的多核苷酸和多肽。編碼人激素原轉(zhuǎn)化酶4的多核苷酸位于19號(hào)染色體上,并可用于如鑒定與人類疾病狀況相關(guān)的基因組區(qū)。本發(fā)明還包括生產(chǎn)這種蛋白質(zhì)及其相應(yīng)抗體的方法。
文檔編號(hào)C07K19/00GK1257543SQ98805475
公開日2000年6月21日 申請(qǐng)日期1998年5月1日 優(yōu)先權(quán)日1997年5月6日
發(fā)明者S·羅克, S·R·加斯比斯 申請(qǐng)人:津莫吉尼蒂克斯公司