專利名稱:一種新的多肽——人類dna cgg重復結合蛋白10.23和編碼這種多肽的多核苷酸的制作方法
技術領域:
本發(fā)明屬于生物技術領域,具體地說,本發(fā)明描述了一種新的多肽——人類DNA CGG重復結合蛋白10.23,以及編碼此多肽的多核苷酸序列。本發(fā)明還涉及此多核苷酸和多肽的制備方法和應用。
重復DNA是人類基因組的主要組成部分。已經發(fā)現非穩(wěn)定三線重復序列與幾種主要的神經退行性變疾病有關[Warren,S.T.,andNelson,D.L.1993.Curr.Opin.Neurobiol.3,752-759][Warren,S.T.1996.Science271,1374-1375][Ashley,C.T.,Jr.,andWarren,S.T.1995.Annu.Rev.Genet.29,703-728]。這些重復序列的擴增能終止相鄰基因的表達或當重復序列是編碼序列的一部分時,直接影響它們的氨基酸順序[Pieretti,M.,Zhang,F.P.,Fu,Y.H.,Warren,S.T.,Oostra,B.A.etal.1991.Ce1166,817-822][Chung,M.Y.,Ranum,L.P.,Duvick,L.A.etal.1993.Nat.Genet.5,254-258]。脆性X染色體綜合癥(FraX)通常導致男性智力遲鈍。正常人位于Xq27.3上的5’-(CGG)n-3’重復子通常的n值為6-50,而在非癥狀前突變攜帶者的相應染色體上該值可以達到50-200,并且通過母性遺傳同時又加上這些擴增重復子甲基化的話,則直接導致脆性X染色體綜合癥的發(fā)生[Chiurazzi,P.,Pouponi,M.G.,Willemsen,R.,Oostra,B.A.,etal.1998.Hum.Mol.Genet.7,109-113]。
5’-(CGG)n-3’重復子位于脆性X染色體綜合癥1基因(FMR1)的5’非翻譯區(qū)(UTR)。如果n值大于200同時該基因甲基化失活,則該基因產物會廣泛表達于人類的許多組織,首先就是人的神經系統(tǒng)[Devys,D.,Lutz,Y.,Rouyer,etal.1993.Nat.Genet.4,335-340]。
最近,生物學家從人類HeLa細胞核中發(fā)現了一個20kDa的5’-(CGG)n-3’-結合蛋白,命名為CGGBP1或p20蛋白。p20蛋白是一個核蛋白,豐富表達于哺乳動物中[Deissler,H.,Wilm,M.,Genc,et al.1997.J.Biol.Chem.272,16761-16768],并且在人類基因組中特異結合于5’-(CGG)n-3’重復子。p20蛋白位于核內并且在80和84之間攜帶核定位信號(NLS),位于69和71之間以及95和167之間的氨基酸殘基負責與5’-(CGG)n-3’的結合。
由于p20蛋白能夠結合人類FMR1蛋白的啟動子,所以p20蛋白(至少在人類細胞中過表達時)能夠降低該啟動子的活性,并且抑制的程度可能取決于5’(CGG)n-3’重復子的長度,尤其當重復子擴增時。p20蛋白可能在與5’(CGG)n-3’結合時以低聚體的形式存在。
P20蛋白能特異性結合在人類染色體13,14,15,21和22的短臂上與28s核糖體RNA基因相關的富含5’(CGG)n-3’區(qū)域。在接下來的5’(CGG)n-3’重復子擴增反應中,p20蛋白能使FMR1基因失活。
通過基因芯片的分析發(fā)現,在胎腦、原液培養(yǎng)的L02細胞株、0.5%FBS培養(yǎng)液37.C饑餓的L02細胞株、胎腎、直腸癌,胎肝、成人肝、肝癌、胎肺、胎脾、胎心、成人心、成人睪丸、胎胃、成人胃中,本發(fā)明的多肽的表達譜與人類DNA CGG重復結合蛋白的表達譜非常近似,因此二者功能也可能類似。本發(fā)明被命名為人類DNA CGG重復結合蛋白10.23。
由于如上所述人類DNA CGG重復結合蛋白10.23蛋白在調節(jié)細胞分裂和胚胎發(fā)育等機體重要功能中起重要作用,而且相信這些調節(jié)過程中涉及大量的蛋白,因而本領域中一直需要鑒定更多參與這些過程的人類DNA CGG重復結合蛋白10.23蛋白,特別是鑒定這種蛋白的氨基酸序列。新人類DNA CGG重復結合蛋白10.23蛋白編碼基因的分離也為研究確定該蛋白在健康和疾病狀態(tài)下的作用提供了基礎。這種蛋白可能構成開發(fā)疾1病診斷和/或治療藥的基礎,因此分離其編碼DNA是非常重要的。
本發(fā)明的一個目的是提供分離的新的多肽——人類DNA CGG重復結合蛋白10.23以及其片段、類似物和衍生物。
本發(fā)明的另一個目的是提供編碼該多肽的多核苷酸。
本發(fā)明的另一個目的是提供含有編碼人類DNA CGG重復結合蛋白10.23的多核苷酸的重組載體。
本發(fā)明的另一個目的是提供含有編碼人類DNA CGG重復結合蛋白10.23的多核苷酸的基因工程化宿主細胞。
本發(fā)明的另一個目的是提供生產人類DNA CGG重復結合蛋白10.23的方法。
本發(fā)明的另一個目的是提供針對本發(fā)明的多肽——人類DNA CGG重復結合蛋白10.23的抗體。
本發(fā)明的另一個目的是提供了針對本發(fā)明多肽——人類DNA CGG重復結合蛋白10.23的模擬化合物、拮抗劑、激動劑、抑制劑。
本發(fā)明的另一個目的是提供診斷治療與人類DNA CGG重復結合蛋白10.23異常相關的疾病的方法。
本發(fā)明涉及一種分離的多肽,該多肽是人源的,它包含具有SEQ ID No.2氨基酸序列的多肽、或其保守性變體、生物活性片段或衍生物。較佳地,該多肽是具有SEQ ID NO2氨基酸序列的多肽。
本發(fā)明還涉及一種分離的多核苷酸,它包含選自下組的一種核苷酸序列或其變體(a)編碼具有SEQ ID No.2氨基酸序列的多肽的多核苷酸;(b)與多核苷酸(a)互補的多核苷酸;(c)與(a)或(b)的多核苷酸序列具有至少70%相同性的多核苷酸。
更佳地,該多核苷酸的序列是選自下組的一種(a)具有SEQ ID NO1中790-1071位的序列;和(b)具有SEQ ID NO1中1-1572位的序列。
本發(fā)明另外涉及一種含有本發(fā)明多核苷酸的載體,特別是表達載體;一種用該載體遺傳工程化的宿主細胞,包括轉化、轉導或轉染的宿主細胞;一種包括培養(yǎng)所述宿主細胞和回收表達產物的制備本發(fā)明多肽的方法。
本發(fā)明還涉及一種能與本發(fā)明多肽特異性結合的抗體。
本發(fā)明還涉及一種篩選的模擬、激活、拮抗或抑制人類DNA CGG重復結合蛋白10.23蛋白活性的化合物的方法,其包括利用本發(fā)明的多肽。本發(fā)明還涉及用該方法獲得的化合物。
本發(fā)明還涉及一種體外檢測與人類DNA CGG重復結合蛋白10.23蛋白異常表達相關的疾病或疾病易感性的方法,包括檢測生物樣品中所述多肽或其編碼多核苷酸序列中的突變,或者檢測生物樣品中本發(fā)明多肽的量或生物活性。
本發(fā)明也涉及一種藥物組合物,它含有本發(fā)明多肽或其模擬物、激活劑、拮抗劑或抑制劑以及藥學上可接受的載體。
本發(fā)明還涉及本發(fā)明的多肽和/或多核苷酸在制備用于治療癌癥、發(fā)育性疾病或免疫性疾病或其它由于人類DNA CGG重復結合蛋白10.23表達異常所引起疾病的藥物的用途。
本發(fā)明的其它方面由于本文的技術的公開,對本領域的技術人員而言是顯而易見的。
本說明書和權利要求書中使用的下列術語除非特別說明具有如下的含義“核酸序列”是指寡核苷酸、核苷酸或多核苷酸及其片段或部分,也可以指基因組或合成的DNA或RNA,它們可以是單鏈或雙鏈的,代表有義鏈或反義鏈。類似地,術語“氨基酸序列”是指寡肽、肽、多肽或蛋白質序列及其片段或部分。當本發(fā)明中的“氨基酸序列”涉及一種天然存在的蛋白質分子的氨基酸序列時,這種“多肽”或“蛋白質”不意味著將氨基酸序列限制為與所述蛋白質分子相關的完整的天然氨基酸。
蛋白質或多核苷酸“變體”是指一種具有一個或多個氨基酸或核苷酸改變的氨基酸序列或編碼它的多核苷酸序列。所述改變可包括氨基酸序列或核苷酸序列中氨基酸或核苷酸的缺失、插入或替換。變體可具有“保守性”改變,其中替換的氨基酸具有與原氨基酸相類似的結構或化學性質,如用亮氨酸替換異亮氨酸。變體也可具有非保守性改變,如用色氨酸替換甘氨酸。
“缺失”是指在氨基酸序列或核苷酸序列中一個或多個氨基酸或核苷酸的缺失。
“插入”或“添加”是指在氨基酸序列或核苷酸序列中的改變導致與天然存在的分子相比,一個或多個氨基酸或核苷酸的增加?!疤鎿Q”是指由不同的氨基酸或核苷酸替換一個或多個氨基酸或核苷酸。
“生物活性”是指具有天然分子的結構、調控或生物化學功能的蛋白質。類似地,術語“免疫學活性”是指天然的、重組的或合成蛋白質及其片段在合適的動物或細胞中誘導特定免疫反應以及與特異性抗體結合的能力。
“激動劑”是指當與人類DNA CGG重復結合蛋白10.23結合時,一種可引起該蛋白質改變從而調節(jié)該蛋白質活性的分子。激動劑可以包括蛋白質、核酸、碳水化合物或任何其它可結合人類DNA CGG重復結合蛋白10.23的分子。
“拮抗劑”或“抑制物”是指當與人類DNA CGG重復結合蛋白10.23結合時,一種可封閉或調節(jié)人類DNA CGG重復結合蛋白10.23的生物學活性或免疫學活性的分子。拮抗劑和抑制物可以包括蛋白質、核酸、碳水化合物或任何其它可結合人類DNA CGG重復結合蛋白10.23的分子。
“調節(jié)”是指人類DNA CGG重復結合蛋白10.23的功能發(fā)生改變,包括蛋白質活性的升高或降低、結合特性的改變及人類DNA CGG重復結合蛋白10.23的任何其它生物學性質、功能或免疫性質的改變。
"基本上純"是指基本上不含天然與其相關的其它蛋白、脂類、糖類或其它物質。本領域的技術人員能用標準的蛋白質純化技術純化人類DNA CGG重復結合蛋白10.23。基本上純的人類DNA CGG重復結合蛋白10.23在非還原性聚丙烯酰胺凝膠上能產生單一的主帶。人類DNA CGG重復結合蛋白10.23多肽的純度可用氨基酸序列分析。
“互補的”或“互補”是指在允許的鹽濃度和溫度條件下通過堿基配對的多核苷酸天然結合。例如,序列“C-T-G-A”可與互補的序列“G-A-C-T”結合。兩個單鏈分子之間的互補可以是部分的或全部的。核酸鏈之間的互補程度對于核酸鏈之間雜交的效率及強度有明顯影響。
“同源性”是指互補的程度,可以是部分同源或完全同源?!安糠滞础笔侵敢环N部分互補的序列,其至少可部分抑制完全互補的序列與靶核酸的雜交。這種雜交的抑制可通過在嚴格性程度降低的條件下進行雜交(Southern印跡或Northern印跡等)來檢測?;旧贤吹男蛄谢螂s交探針可競爭和抑制完全同源的序列與靶序列在的嚴格性程度降低的條件下的結合。這并不意味嚴格性程度降低的條件允許非特異性結合,因為嚴格性程度降低的條件要求兩條序列相互的結合為特異性或選擇性相互作用。
“相同性百分率”是指在兩種或多種氨基酸或核酸序列比較中序列相同或相似的百分率。可用電子方法測定相同性百分率,如通過MEGALIGN程序(Lasergenesoftware package,DNASTAR,Inc.,Madison Wis.)。MEGALIGN程序可根據不同的方法如Cluster法比較兩種或多種序列(Higgins,D.G.和P.M.Sharp(1988)Gene 73237-244)。Cluster法通過檢查所有配對之間的距離將各組序列排列成簇。然后將各簇以成對或成組分配。兩個氨基酸序列如序列A和序列B之間的相同性百分率通過下式計算序列A與序列B之間匹配的殘基個數 100序列A的殘基數—序列A中間隔殘基數—序列B中間隔殘基數也可以通過Cluster法或用本領域周知的方法如Jotun Hein測定核酸序列之間的相同性百分率(Hein J.,(1990)Methods in emzumology 183625-645)。
“相似性”是指氨基酸序列之間排列對比時相應位置氨基酸殘基的相同或保守性取代的程度。用于保守性取代的氨基酸例如,帶負電荷的氨基酸可包括天冬氨酸和谷氨酸;帶正電荷的氨基酸可包括賴氨酸和精氨酸;具有不帶電荷的頭部基團有相似親水性的氨基酸可包括亮氨酸、異亮氨酸和纈氨酸;甘氨酸和丙氨酸;天冬酰胺和谷氨酰胺;絲氨酸和蘇氨酸;苯丙氨酸和酪氨酸。
“反義”是指與特定的DNA或RNA序列互補的核苷酸序列?!胺戳x鏈”是指與“有義鏈”互補的核酸鏈。
“衍生物”是指HFP或編碼其的核酸的化學修飾物。這種化學修飾物可以是用烷基、?;虬被鎿Q氫原子。核酸衍生物可編碼保留天然分子的主要生物學特性的多肽。
“抗體”是指完整的抗體分子及其片段,如Fa、F(ab’)2及Fv,其能特異性結合人類DNA CGG重復結合蛋白10.23的抗原決定簇。
“人源化抗體”是指非抗原結合區(qū)域的氨基酸序列被替換變得與人抗體更為相似,但仍保留原始結合活性的抗體。
“分離的”一詞指將物質從它原來的環(huán)境(例如,若是自然產生的就指其天然環(huán)境)之中移出。比如說,一個自然產生的多核苷酸或多肽存在于活動物中就是沒有被分離出來,但同樣的多核苷酸或多肽同一些或全部在自然系統(tǒng)中與之共存的物質分開就是分離的。這樣的多核苷酸可能是某一載體的一部分,也可能這樣的多核苷酸或多肽是某一組合物的一部分。既然載體或組合物不是它天然環(huán)境的成分,它們仍然是分離的。
如本發(fā)明所用,“分離的”是指物質從其原始環(huán)境中分離出來(如果是天然的物質,原始環(huán)境即是天然環(huán)境)。如活體細胞內的天然狀態(tài)下的多聚核苷酸和多肽是沒有分離純化的,但同樣的多聚核苷酸或多肽如從天然狀態(tài)中同存在的其他物質中分開,則為分離純化的。
如本文所用,“分離的人類DNA CGG重復結合蛋白10.23”是指人類DNA CGG重復結合蛋白10.23基本上不含天然與其相關的其它蛋白、脂類、糖類或其它物質。本領域的技術人員能用標準的蛋白質純化技術純化人類DNA CGG重復結合蛋白10.23。基本上純的多肽在非還原聚丙烯酰胺凝膠上能產生單一的主帶。人類DNA CGG重復結合蛋白10.23多肽的純度能用氨基酸序列分析。
本發(fā)明提供了一種新的多肽——人類DNA CGG重復結合蛋白10.23,其基本上是由SEQ ID NO2所示的氨基酸序列組成的。本發(fā)明的多肽可以是重組多肽、天然多肽、合成多肽,優(yōu)選重組多肽。本發(fā)明的多肽可以是天然純化的產物,或是化學合成的產物,或使用重組技術從原核或真核宿主(例如,細菌、酵母、高等植物、昆蟲和哺乳動物細胞)中產生。根據重組生產方案所用的宿主,本發(fā)明的多肽可以是糖基化的,或可以是非糖基化的。本發(fā)明的多肽還可包括或不包括起始的甲硫氨酸殘基。
本發(fā)明還包括人類DNA CGG重復結合蛋白10.23的片段、衍生物和類似物。如本發(fā)明所用,術語“片段”、“衍生物”和“類似物”是指基本上保持本發(fā)明的人類DNA CGG重復結合蛋白10.23相同的生物學功能或活性的多肽。本發(fā)明多肽的片段、衍生物或類似物可以是(I)這樣一種,其中一個或多個氨基酸殘基被保守或非保守氨基酸殘基(優(yōu)選的是保守氨基酸殘基)取代,并且取代的氨基酸可以是也可以不是由遺傳密碼子編碼的;或者(II)這樣一種,其中一個或多個氨基酸殘基上的某個基團被其它基團取代包含取代基;或者(III)這樣一種,其中成熟多肽與另一種化合物(比如延長多肽半衰期的化合物,例如聚乙二醇)融合;或者(IV)這樣一種,其中附加的氨基酸序列融合進成熟多肽而形成的多肽序列(如前導序列或分泌序列或用來純化此多肽的序列或蛋白原序列)通過本文的闡述,這樣的片段、00衍生物和類似物被認為在本領域技術人員的知識范圍之內。
本發(fā)明提供了分離的核酸(多核苷酸),基本由編碼具有SEQ ID NO2氨基酸序列的多肽的多核苷酸組成。本發(fā)明的多核苷酸序列包括SEQ ID NO1的核苷酸序列。本發(fā)明的多核苷酸是從人胎腦組織的cDNA文庫中發(fā)現的。它包含的多核苷酸序列全長為1572個堿基,其開放讀框790-1071編碼了93個氨基酸。根據基因芯片表達譜比較發(fā)現,此多肽與人類DNA CGG重復結合蛋白有相似的表達譜,可推斷出該人類DNA CGG重復結合蛋白10.23具有人類DNA CGG重復結合蛋白相似的功能。
本發(fā)明的多核苷酸可以是DNA形式或是RNA形式。DNA形式包括cDNA、基因組DNA或人工合成的DNA。DNA可以是單鏈的或是雙鏈的。DNA可以是編碼鏈或非編碼鏈。編碼成熟多肽的編碼區(qū)序列可以與SEQ ID NO1所示的編碼區(qū)序列相同或者是簡并的變異體。如本發(fā)明所用,“簡并的變異體”在本發(fā)明中是指編碼具有SEQ ID NO2的蛋白質或多肽,但與SEQ ID NO1所示的編碼區(qū)序列有差別的核酸序列。
編碼SEQ ID NO2的成熟多肽的多核苷酸包括只有成熟多肽的編碼序列;成熟多肽的編碼序列和各種附加編碼序列;成熟多肽的編碼序列(和任選的附加編碼序列)以及非編碼序列。
術語“編碼多肽的多核苷酸”是指包括編碼此多肽的多核苷酸和包括附加編碼和/或非編碼序列的多核苷酸。
本發(fā)明還涉及上述描述多核苷酸的變異體,其編碼與本發(fā)明有相同的氨基酸序列的多肽或多肽的片斷、類似物和衍生物。此多核苷酸的變異體可以是天然發(fā)生的等位變異體或非天然發(fā)生的變異體。這些核苷酸變異體包括取代變異體、缺失變異體和插入變異體。如本領域所知的,等位變異體是一個多核苷酸的替換形式,它可能是一個或多個核苷酸的取代、缺失或插入,但不會從實質上改變其編碼的多肽的功能。
本發(fā)明還涉及與以上所描述的序列雜交的多核苷酸(兩個序列之間具有至少50%,優(yōu)選具有70%的相同性)。本發(fā)明特別涉及在嚴格條件下與本發(fā)明所述多核苷酸可雜交的多核苷酸。在本發(fā)明中,“嚴格條件”是指(1)在較低離子強度和較高溫度下的雜交和洗脫,如0.2×SSC,0.1%SDS,60℃;或(2)雜交時加用變性劑,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)僅在兩條序列之間的相同性至少在95%以上,更好是97%以上時才發(fā)生雜交。并且,可雜交的多核苷酸編碼的多肽與SEQ ID NO2所示的成熟多肽有相同的生物學功能和活性。
本發(fā)明還涉及與以上所描述的序列雜交的核酸片段。如本發(fā)明所用,”核酸片段”的長度至少含10個核苷酸,較好是至少20-30個核苷酸,更好是至少50-60個核苷酸,最好是至少100個核苷酸以上。核酸片段也可用于核酸的擴增技術(如PCR)以確定和/或分離編碼人類DNA CGG重復結合蛋白10.23的多核苷酸。
本發(fā)明中的多肽和多核苷酸優(yōu)選以分離的形式提供,更佳地被純化至均質。
本發(fā)明的編碼人類DNA CGG重復結合蛋白10.23的特異的多核苷酸序列能用多種方法獲得。例如,用本領域熟知的雜交技術分離多核苷酸。這些技術包括但不局限于1)用探針與基因組或cDNA文庫雜交以檢出同源的多核苷酸序列,和2)表達文庫的抗體篩選以檢出具有共同結構特征的克隆的多核苷酸片段。
本發(fā)明的DNA片段序列也能用下列方法獲得1)從基因組DNA分離雙鏈DNA序列;2)化學合成DNA序列以獲得所述多肽的雙鏈DNA。
上述提到的方法中,分離基因組DNA最不常用。DNA序列的直接化學合成是經常選用的方法。更經常選用的方法是cDNA序列的分離。分離感興趣的cDNA的標準方法是從高表達該基因的供體細胞分離mRNA并進行逆轉錄,形成質粒或噬菌體cDNA文庫。提取mRNA的方法已有多種成熟的技術,試劑盒也可從商業(yè)途徑獲得(Qiagene)。而構建cDNA文庫也是通常的方法(Sambrook,et al.,MolecularCloning,A Laboratory Manual,Cold Spring Harbor Laboratory.New York,1989)。還可得到商業(yè)供應的cDNA文庫,如Clontech公司的不同cDNA文庫。當結合使用聚合酶反應技術時,即使極少的表達產物也能克隆。
可用常規(guī)方法從這些cDNA文庫中篩選本發(fā)明的基因。這些方法包括(但不限于)(1)DNA-DNA或DNA-RNA雜交;(2)標志基因功能的出現或喪失;(3)測定人類DNA CGG重復結合蛋白10.23的轉錄本的水平;(4)通過免疫學技術或測定生物學活性,來檢測基因表達的蛋白產物。上述方法可單用,也可多種方法聯合應用。
在第(1)種方法中,雜交所用的探針是與本發(fā)明的多核苷酸的任何一部分同源,其長度至少10個核苷酸,較好是至少30個核苷酸,更好是至少50個核苷酸,最好是至少100個核苷酸。此外,探針的長度通常在2000個核苷酸之內,較佳的為1000個核苷酸之內。此處所用的探針通常是在本發(fā)明的基因序列信息的基礎上化學合成的DNA序列。本發(fā)明的基因本身或者片段當然可以用作探針。DNA探針的標記可用放射性同位素,熒光素或酶(如堿性磷酸酶)等。
在第(4)種方法中,檢測人類DNA CGG重復結合蛋白10.23基因表達的蛋白產物可用免疫學技術如Western印跡法,放射免疫沉淀法,酶聯免疫吸附法(ELISA)等。
應用PCR技術擴增DNA/RNA的方法(Saiki,et al.Science1985;2301350-1354)被優(yōu)選用于獲得本發(fā)明的基因。特別是很難從文庫中得到全長的cDNA時,可優(yōu)選使用RACE法(RACE-cDNA末端快速擴增法),用于PCR的引物可根據本文所公開的本發(fā)明的多核苷酸序列信息適當地選擇,并可用常規(guī)方法合成??捎贸R?guī)方法如通過凝膠電泳分離和純化擴增的DNA/RNA片段。
如上所述得到的本發(fā)明的基因,或者各種DNA片段等的多核苷酸序列可用常規(guī)方法如雙脫氧鏈終止法(Sanger et al.PNAS,1977,745463-5467)測定。這類多核苷酸序列測定也可用商業(yè)測序試劑盒等。為了獲得全長的cDNA序列,測序需反復進行。有時需要測定多個克隆的cDNA序列,才能拼接成全長的cDNA序列。
本發(fā)明也涉及包含本發(fā)明的多核苷酸的載體,以及用本發(fā)明的載體或直接用人類DNA CGG重復結合蛋白10.23編碼序列經基因工程產生的宿主細胞,以及經重組技術產生本發(fā)明所述多肽的方法。
本發(fā)明中,編碼人類DNA CGG重復結合蛋白10.23的多核苷酸序列可插入到載體中,以構成含有本發(fā)明所述多核苷酸的重組載體。術語“載體”指本領域熟知的細菌質粒、噬菌體、酵母質粒、植物細胞病毒、哺乳動物細胞病毒如腺病毒、逆轉錄病毒或其它載體。在本發(fā)明中適用的載體包括但不限于在細菌中表達的基于T7啟動子的表達載體(Rosenberg,et al.Gene,1987,56125);在哺乳動物細胞中表達的pMSXND表達載體(Lee and Nathans,J Bio Chem.2633521,1988)和在昆蟲細胞中表達的來源于桿狀病毒的載體??傊灰茉谒拗黧w內復制和穩(wěn)定,任何質粒和載體都可以用于構建重組表達載體。表達載體的一個重要特征是通常含有復制起始點、啟動子、標記基因和翻譯調控元件。
本領域的技術人員熟知的方法能用于構建含編碼人類DNA CGG重復結合蛋白10.23的DNA序列和合適的轉錄/翻譯調控元件的表達載體。這些方法包括體外重組DNA技術、DNA合成技術、體內重組技術等(Sambroook,et al.MolecularCloning,a Laboratory Manual,cold Spring Harbor Laboratory.New York,1989)。所述的DNA序列可有效連接到表達載體中的適當啟動子上,以指導mRNA合成。這些啟動子的代表性例子有大腸桿菌的lac或trp啟動子;λ噬菌體的PL啟動子;真核啟動子包括CMV立即早期啟動子、HSV胸苷激酶啟動子、早期和晚期SV40啟動子、反轉錄病毒的LTRs和其它一些已知的可控制基因在原核細胞或真核細胞或其病毒中表達的啟動子。表達載體還包括翻譯起始用的核糖體結合位點和轉錄終止子等。在載體中插入增強子序列將會使其在高等真核細胞中的轉錄得到增強。增強子是DNA表達的順式作用因子,通常大約有10到300個堿基對,作用于啟動子以增強基因的轉錄??膳e的例子包括在復制起始點晚期一側的100到270個堿基對的SV40增強子、在復制起始點晚期一側的多瘤增強子以及腺病毒增強子等。
此外,表達載體優(yōu)選地包含一個或多個選擇性標記基因,以提供用于選擇轉化的宿主細胞的表型性狀,如真核細胞培養(yǎng)用的二氫葉酸還原酶、新霉素抗性以及綠色熒光蛋白(GFP),或用于大腸桿菌的四環(huán)素或氨芐青霉素抗性等。
本領域一般技術人員都清楚如何選擇適當的載體/轉錄調控元件(如啟動子、增強子等)和選擇性標記基因。
本發(fā)明中,編碼人類DNA CGG重復結合蛋白10.23的多核苷酸或含有該多核苷酸的重組載體可轉化或轉導入宿主細胞,以構成含有該多核苷酸或重組載體的基因工程化宿主細胞。術語“宿主細胞”指原核細胞,如細菌細胞;或是低等真核細胞,如酵母細胞;或是高等真核細胞,如哺乳動物細胞。代表性例子有大腸桿菌,鏈霉菌屬;細菌細胞如鼠傷寒沙門氏菌;真菌細胞如酵母;植物細胞;昆蟲細胞如果蠅S2或Sf9;動物細胞如CHO、COS或Bowes黑素瘤細胞等。
用本發(fā)明所述的DNA序列或含有所述DNA序列的重組載體轉化宿主細胞可用本領域技術人員熟知的常規(guī)技術進行。當宿主為原核生物如大腸桿菌時,能吸收DNA的感受態(tài)細胞可在指數生長期后收獲,用CaCl2法處理,所用的步驟在本領域眾所周知??晒┻x擇的是用MgCl2。如果需要,轉化也可用電穿孔的方法進行。當宿主是真核生物,可選用如下的DNA轉染方法磷酸鈣共沉淀法,或者常規(guī)機械方法如顯微注射、電穿孔、脂質體包裝等。
通過常規(guī)的重組DNA技術,利用本發(fā)明的多核苷酸序列可用來表達或生產重組的人類DNA CGG重復結合蛋白10.23(Science,1984;2241431)。一般來說有以下步驟(1).用本發(fā)明的編碼人人類DNA CGG重復結合蛋白10.23的多核苷酸(或變異體),或用含有該多核苷酸的重組表達載體轉化或轉導合適的宿主細胞;(2).在合適的培養(yǎng)基中培養(yǎng)宿主細胞;(3).從培養(yǎng)基或細胞中分離、純化蛋白質。
在步驟(2)中,根據所用的宿主細胞,培養(yǎng)中所用的培養(yǎng)基可選自各種常規(guī)培養(yǎng)基。在適于宿主細胞生長的條件下進行培養(yǎng)。當宿主細胞生長到適當的細胞密度后,用合適的方法(如溫度轉換或化學誘導)誘導選擇的啟動子,將細胞再培養(yǎng)一段時間。
在步驟(3)中,重組多肽可包被于細胞內、或在細胞膜上表達、或分泌到細胞外。如果需要,可利用其物理的、化學的和其它特性通過各種分離方法分離和純化重組的蛋白。這些方法是本領域技術人員所熟知的。這些方法包括但并不限于常規(guī)的復性處理、蛋白沉淀劑處理(鹽析方法)、離心、滲透破菌、超聲波處理、超離心、分子篩層析(凝膠過濾)、吸附層析、離子交換層析、高效液相層析(HPLC)和其它各種液相層析技術及這些方法的結合。
本發(fā)明的多肽以及該多肽的拮抗劑、激動劑和抑制劑可直接用于疾病治療,例如,可治療惡性腫瘤、腎上腺缺乏癥、皮膚病、各類炎癥、HIV感染和免疫性疾病等。
重復DNA序列是人類基因組的主要組成部分。這些重復序列的擴增能終止相鄰基因的表達或當重復序列是編碼序列的一部分時,直接影響它們的氨基酸順序。人DNA CGG重復結合蛋白在人類基因組中特異結合于5’(CGG)n-3’重復子。其在體內直接影響著與之結合的重復DNA序列的功能的發(fā)揮,其表達異??梢鹣嚓P基因的表達紊亂,進而導致相關疾病的發(fā)生。
本發(fā)明的多肽的表達譜與人DNA CGG重復結合蛋白的表達譜相一致,兩者具有相似的生物學功能。本發(fā)明的多肽在體內特異結合于5’-(CGG)n-3’重復子,其表達異??梢鹣嚓P基因的表達紊亂,進而導致胚胎發(fā)育畸形、腫瘤及蛋白質代謝紊亂性疾病的發(fā)生,這些疾病包括但不限于常見胚胎發(fā)育畸形一.顏面、頸和四肢的常見畸形1.唇裂(最常見,可伴有牙槽突裂和腭裂),腭裂,面斜裂,頸囊,頸瘺等;
2.四肢的常見畸形1)肢體缺如橫向缺如(先天性短肢)無臂,無前臂,無手,無指,無腿,無趾等;縱向缺如上肢橈/尺側缺如,下肢脛/腓側缺如等;海豹樣手/足畸形等;2)肢體分化障礙某塊肌肉或肌群缺如,關節(jié)發(fā)育不良,骨畸形,骨融合,多指(趾),并指(趾)畸形,馬碲內翻足等;二.消化系統(tǒng)的常見畸形甲狀舌管囊腫,消化管閉鎖或狹窄,回腸憩室,臍瘺,先天性臍疝,先天性無神經節(jié)性巨結腸,不通肛,腸絆轉位異常,膽管閉鎖,環(huán)狀胰等;三.呼吸系統(tǒng)的常見畸形喉氣管狹窄/閉鎖,氣管食管瘺,透明膜病,單側肺不發(fā)生,異位肺葉,先天性肺囊腫,肺膨脹不全等;四.泌尿系統(tǒng)的常見畸形多囊腎,異位腎,馬碲腎,雙輸尿管,臍尿瘺,膀胱外翻等;五.生殖系統(tǒng)的常見畸形隱睪,先天性腹股溝疝,雙子宮,陰道閉鎖,尿道下裂,真/假兩性畸形,睪丸女性化綜合征等;六.心血管系統(tǒng)的常見畸形房間隔缺損,室間隔缺損,動脈干分隔異常(主動脈和肺動脈錯位、主動脈或肺動脈狹窄),動脈導管未閉等;七.神經系統(tǒng)的常見畸形神經管缺陷(無腦畸形、脊髓裂、脊髓脊膜膨出、積水性腦膜腦膨出),腦內/外腦積水等;八.眼、耳的常見畸形虹膜缺損,瞳孔膜存留,先天性白內障,先天性青光眼,獨/無/小眼畸形,先天性耳聾,耳廓畸形等;各種組織常見腫瘤一.上皮組織乳頭狀瘤,鱗狀細胞癌皮膚、鼻咽、喉、宮頸,腺瘤(癌)乳腺、甲狀腺,粘/漿液性囊腺瘤(癌)卵巢,基底細胞癌頭面部皮膚,(惡性)多型性腺瘤延腺,乳頭狀瘤、移行上皮癌膀胱、腎盂等;二.間葉組織纖維(肉)瘤四肢,(惡性)纖維組織細胞瘤四肢,脂肪(肉)瘤皮下組織、下肢、腹膜后,平滑肌(肉)瘤子宮和胃腸,橫紋肌(肉)瘤頭頸、生殖泌尿道、四肢,血管(肉)瘤、淋巴管(肉)瘤皮膚、皮下組織、舌、唇,骨(肉)瘤顱骨、長骨,(惡)性巨細胞瘤股/脛/肱骨上端,軟骨(肉)瘤手足短骨、盆/肋/股/肱/肩胛骨,滑膜(肉)瘤膝/踝/腕/肩/肘關節(jié)附近,(惡)性間皮瘤胸/腹膜等;三.淋巴造血組織惡性淋巴瘤頸部、縱隔、腸系膜和腹膜后淋巴結,各種白血病淋巴造血組織,多發(fā)性骨髓瘤椎/胸/肋/顱骨和長骨等;四.神經組織神經纖維(肉)瘤全身皮神經/深部神經及內臟,(惡性)神經鞘瘤頭、頸、四肢等處神經,(惡性)膠質細胞瘤大腦,髓母細胞瘤小腦,(惡性)腦膜瘤腦膜,節(jié)神經細胞瘤/神經母細胞瘤縱隔和腹膜后/腎上腺髓質等;五.其他腫瘤黑痣,惡性黑色素瘤皮膚、粘膜,(惡性)葡萄胎,絨毛膜上皮癌子宮,(惡性)支持細胞、間質細胞瘤,(惡性)顆粒細胞瘤卵巢、睪丸,精原細胞瘤睪丸,無性細胞瘤卵巢,胚胎性癌睪丸、卵巢,(惡性)畸胎瘤卵巢、睪丸、縱隔和骶尾部等;蛋白質代謝紊亂相關疾病蛋白質代謝紊亂可影響蛋白質下列主要生理功能,進而導致相關疾病的發(fā)生一.提供機體能量,維持組織生長、更新和修補肌肉萎縮,四肢軟弱,身體消瘦,嚴重者可呈“惡液質”表現;二.產生一些生理活性物質,如激素、抗體、胺類等1.蛋白質肽類激素功能紊亂可導致如下疾病發(fā)生1)胰島素和胰高血糖素糖尿病,低血糖癥等;2)下丘腦和垂體激素巨人癥,侏儒癥,肢端肥大癥,皮質醇增多癥(柯興綜合癥),原發(fā)性性醛固酮增多癥,繼發(fā)慢性腎上腺皮質功能減退,甲狀腺機能亢進癥,甲狀腺機能減退癥(呆小病,幼年型甲減,成年型甲減),男/女不育癥,月經失調(功能性子宮出血、閉經、多囊卵巢綜合癥、經前期緊張綜合癥、更年期綜合癥),性發(fā)育障礙,尿崩癥、抗利尿激素分泌不當綜合癥,泌乳異常等;3)甲狀旁腺素甲狀旁腺機能亢進癥,甲狀旁腺機能減退癥等;4)胃腸道激素消化性潰瘍,慢性消化不良,慢性胃炎等;2.胺類物質代謝紊亂可導致如下疾病發(fā)生
心律失常,休克,精神錯亂,癲癇,舞蹈病,肝性腦病(去甲腎上腺素、γ-氨基丁酸、5-羥色胺、谷氨酰胺),暈動病,I-型變態(tài)反應性疾病(蕁麻疹、枯草熱、過敏性鼻炎、皮膚過敏),消化性潰瘍(組胺),高膽固醇血癥(?;撬?,腫瘤(多胺)等;3.抗體缺陷易發(fā)生各種感染敗血癥,化膿性腦膜炎,肺炎,氣管炎,中耳炎,膿皮病等;三.某些蛋白質的特殊生理作用各種血紅蛋白病(貧血、黃疸、組織缺氧致有機酸血癥),各種凝血因子缺乏癥(出血),肌痙攣,肌強制、肌麻痹(肌動蛋白)、高脂蛋白血癥等;綜合上述,本發(fā)明的多肽以及該多肽的拮抗劑,激動劑和抑制劑可直接用于多種疾病的治療,例如胚胎發(fā)育畸形、腫瘤及蛋白質代謝紊亂性疾病等。
本發(fā)明也提供了篩選化合物以鑒定提高(激動劑)或阻遏(拮抗劑)人類DNACGG重復結合蛋白10.23的藥劑的方法。激動劑提高人類DNA CGG重復結合蛋白10.23刺激細胞增殖等生物功能,而拮抗劑阻止和治療與細胞過度增殖有關的紊亂如各種癌癥。例如,能在藥物的存在下,將哺乳動物細胞或表達人類DNA CGG重復結合蛋白10.23的膜制劑與標記的人類DNA CGG重復結合蛋白10.23一起培養(yǎng)。然后測定藥物提高或阻遏此相互作用的能力。
人類DNA CGG重復結合蛋白10.23的拮抗劑包括篩選出的抗體、化合物、受體缺失物和類似物等。人類DNA CGG重復結合蛋白10.23的拮抗劑可以與人類DNACGG重復結合蛋白10.23結合并消除其功能,或是抑制該多肽的產生,或是與該多肽的活性位點結合使該多肽不能發(fā)揮生物學功能。
在篩選作為拮抗劑的化合物時,可以將人類DNA CGG重復結合蛋白10.23加入生物分析測定中,通過測定化合物對人類DNA CGG重復結合蛋白10.23和其受體之間相互作用的影響來確定化合物是否是拮抗劑。用上述篩選化合物的同樣方法,可以篩選出起拮抗劑作用的受體缺失物和類似物。能與人類DNA CGG重復結合蛋白10.23結合的多肽分子可通過篩選由各種可能組合的氨基酸結合于固相物組成的隨機多肽庫而獲得。篩選時,一般應對人類DNA CGG重復結合蛋白10.23分子進行標記。
本發(fā)明提供了用多肽,及其片段、衍生物、類似物或它們的細胞作為抗原以生產抗體的方法。這些抗體可以是多克隆抗體或單克隆抗體。本發(fā)明還提供了針對人類DNA CGG重復結合蛋白10.23抗原決定簇的抗體。這些抗體包括(但不限于)多克隆抗體、單克隆抗體、嵌合抗體、單鏈抗體、Fab片段和Fab表達文庫產生的片段。
多克隆抗體的生產可用人類DNA CGG重復結合蛋白10.23直接注射免疫動物(如家兔,小鼠,大鼠等)的方法得到,多種佐劑可用于增強免疫反應,包括但不限于弗氏佐劑等。制備人類DNA CGG重復結合蛋白10.23的單克隆抗體的技術包括但不限于雜交瘤技術(Kohler and Milstein.Nature,1975,256495-497),三瘤技術,人B-細胞雜交瘤技術,EBV-雜交瘤技術等。將人恒定區(qū)和非人源的可變區(qū)結合的嵌合抗體可用已有的技術生產(Morrison et al,PNAS,1985,816851)。而已有的生產單鏈抗體的技術(U.S.Pat No.4946778)也可用于生產抗人類DNACGG重復結合蛋白10.23的單鏈抗體。
抗人類DNA CGG重復結合蛋白10.23的抗體可用于免疫組織化學技術中,檢測活檢標本中的人類DNA CGG重復結合蛋白10.23。
與人類DNA CGG重復結合蛋白10.23結合的單克隆抗體也可用放射性同位素標記,注入體內可跟蹤其位置和分布。這種放射性標記的抗體可作為一種非創(chuàng)傷性診斷方法用于腫瘤細胞的定位和判斷是否有轉移。
抗體還可用于設計針對體內某一特殊部位的免疫毒素。如人類DNA CGG重復結合蛋白10.23高親和性的單克隆抗體可與細菌或植物毒素(如白喉毒素,蓖麻蛋白,紅豆堿等)共價結合。一種通常的方法是用巰基交聯劑如SPDP,攻擊抗體的氨基,通過二硫鍵的交換,將毒素結合于抗體上,這種雜交抗體可用于殺滅人類DNACGG重復結合蛋白10.23陽性的細胞。
本發(fā)明中的抗體可用于治療或預防與人類DNA CGG重復結合蛋白10.23相關的疾病。給予適當劑量的抗體可以刺激或阻斷人類DNA CGG重復結合蛋白10.23的產生或活性。
本發(fā)明還涉及定量和定位檢測人類DNA CGG重復結合蛋白10.23水平的診斷試驗方法。這些試驗是本領域所熟知的,且包括FISH測定和放射免疫測定。試驗中所檢測的人類DNA CGG重復結合蛋白10.23水平,可以用作解釋人類DNA CGG重復結合蛋白10.23在各種疾病中的重要性和用于診斷人類DNA CGG重復結合蛋白10.23起作用的疾病。
本發(fā)明的多肽還可用作肽譜分析,例如,多肽可用物理的、化學或酶進行特異性切割,并進行一維或二維或三維的凝膠電泳分析,更好的是進行質譜分析。
編碼人類DNA CGG重復結合蛋白10.23的多核苷酸也可用于多種治療目的。基因治療技術可用于治療由于人類DNA CGG重復結合蛋白10.23的無表達或異常/無活性表達所致的細胞增殖、發(fā)育或代謝異常。重組的基因治療載體(如病毒載體)可設計用于表達變異的人類DNA CGG重復結合蛋白10.23,以抑制內源性的人類DNA CGG重復結合蛋白10.23活性。例如,一種變異的人類DNA CGG重復結合蛋白10.23可以是縮短的、缺失了信號傳導功能域的人類DNA CGG重復結合蛋白10.23,雖可與下游的底物結合,但缺乏信號傳導活性。因此重組的基因治療載體可用于治療人類DNA CGG重復結合蛋白10.23表達或活性異常所致的疾病。來源于病毒的表達載體如逆轉錄病毒、腺病毒、腺病毒相關病毒、單純皰疹病毒、細小病毒等可用于將編碼人類DNA CGG重復結合蛋白10.23的多核苷酸轉移至細胞內。構建攜帶編碼人類DNA CGG重復結合蛋白10.23的多核苷酸的重組病毒載體的方法可見于已有文獻(Sambrook,et al.)。另外重組編碼人類DNA CGG重復結合蛋白10.23的多核苷酸可包裝到脂質體中轉移至細胞內。
多核苷酸導入組織或細胞內的方法包括將多核苷酸直接注入到體內組織中;或在體外通過載體(如病毒、噬菌體或質粒等)先將多核苷酸導入細胞中,再將細胞移植到體內等。
抑制人類DNA CGG重復結合蛋白10.23mRNA的寡核苷酸(包括反義RNA和DNA)以及核酶也在本發(fā)明的范圍之內。核酶是一種能特異性分解特定RNA的酶樣RNA分子,其作用機制是核酶分子與互補的靶RNA特異性雜交后進行核酸內切作用。反義的RNA和DNA及核酶可用已有的任何RNA或DNA合成技術獲得,如固相磷酸酰胺化學合成法合成寡核苷酸的技術已廣泛應用。反義RNA分子可通過編碼該RNA的DNA序列在體外或體內轉錄獲得。這種DNA序列已整合到載體的RNA聚合酶啟動子的下游。為了增加核酸分子的穩(wěn)定性,可用多種方法對其進行修飾,如增加兩側的序列長度,核糖核苷之間的連接應用磷酸硫酯鍵或肽鍵而非磷酸二酯鍵。
編碼人類DNA CGG重復結合蛋白10.23的多核苷酸可用于與人類DNA CGG重復結合蛋白10.23的相關疾病的診斷。編碼人類DNA CGG重復結合蛋白10.23的多核苷酸可用于檢測人類DNA CGG重復結合蛋白10.23的表達與否或在疾病狀態(tài)下人類DNA CGG重復結合蛋白10.23的異常表達。如編碼人類DNA CGG重復結合蛋白10.23的DNA序列可用于對活檢標本進行雜交以判斷人類DNA CGG重復結合蛋白10.23的表達狀況。雜交技術包括Southern印跡法,Northern印跡法、原位雜交等。這些技術方法都是公開的成熟技術,相關的試劑盒都可從商業(yè)途徑得到。本發(fā)明的多核苷酸的一部分或全部可作為探針固定在微陣列(Microarray)或DNA芯片(又稱為“基因芯片”)上,用于分析組織中基因的差異表達分析和基因診斷。用人類DNA CGG重復結合蛋白10.23特異的引物進行RNA-聚合酶鏈反應(RT-PCR)體外擴增也可檢測人類DNA CGG重復結合蛋白10.23的轉錄產物。
檢測人類DNA CGG重復結合蛋白10.23基因的突變也可用于診斷人類DNA CGG重復結合蛋白10.23相關的疾病。人類DNA CGG重復結合蛋白10.23突變的形式包括與正常野生型人類DNA CGG重復結合蛋白10.23DNA序列相比的點突變、易位、缺失、重組和其它任何異常等??捎靡延械募夹g如Southern印跡法、DNA序列分析、PCR和原位雜交檢測突變。另外,突變有可能影響蛋白的表達,因此用Northern印跡法、Western印跡法可間接判斷基因有無突變。
本發(fā)明的序列對染色體鑒定也是有價值的。該序列會特異性地針對某條人染色體具體位置且并可以與其雜交。目前,需要鑒定染色體上的各基因的具體位點?,F在,只有很少的基于實際序列數據(重復多態(tài)性)的染色體標記物可用于標記染色體位置。根據本發(fā)明,為了將這些序列與疾病相關基因相關聯,其重要的第一步就是將這些DNA序列定位于染色體上。
簡而言之,根據cDNA制備PCR引物(優(yōu)選15-35bp),可以將序列定位于染色體上。然后,將這些引物用于PCR篩選含各條人染色體的體細胞雜合細胞。只有那些含有相應于引物的人基因的雜合細胞會產生擴增的片段。
體細胞雜合細胞的PCR定位法,是將DNA定位到具體染色體的快捷方法。使用本發(fā)明的寡核苷酸引物,通過類似方法,可利用一組來自特定染色體的片段或大量基因組克隆而實現亞定位??捎糜谌旧w定位的其它類似策略包括原位雜交、用標記的流式分選的染色體預篩選和雜交預選,從而構建染色體特異的cDNA庫。
將cDNA克隆與中期染色體進行熒光原位雜交(FISH),可以在一個步驟中精確地進行染色體定位。此技術的綜述,參見Verma等,Human Chromosomesa Manualof Basic Techniques,Pergamon Press,New York(1988)。
一旦序列被定位到準確的染色體位置,此序列在染色體上的物理位置就可以與基因圖數據相關聯。這些數據可見于例如,V.Mckusick,Mendelian Inheritancein Man(可通過與Johns Hopkins University Welch Medical Library聯機獲得)。然后可通過連鎖分析,確定基因與業(yè)已定位到染色體區(qū)域上的疾病之間的關系。
接著,需要測定患病和未患病個體間的cDNA或基因組序列差異。如果在一些或所有的患病個體中觀察到某突變,而該突變在任何正常個體中未觀察到,則該突變可能是疾病的病因。比較患病和未患病個體,通常涉及首先尋找染色體中結構的變化,如從染色體水平可見的或用基于cDNA序列的PCR可檢測的缺失或易位。根據目前的物理作圖和基因定位技術的分辨能力,被精確定位至與疾病有關的染色體區(qū)域的cDNA,可以是50至500個潛在致病基因間之一種(假定1兆堿基作圖分辨能力和每20kb對應于一個基因)。
可以將本發(fā)明的多肽、多核苷酸及其模擬物、激動劑、拮抗劑和抑制劑與合適的藥物載體組合后使用。這些載體可以是水、葡萄糖、乙醇、鹽類、緩沖液、甘油以及它們的組合。組合物包含安全有效量的多肽或拮抗劑以及不影響藥物效果的載體和賦形劑。這些組合物可以作為藥物用于疾病治療。
本發(fā)明還提供含有一種或多種容器的藥盒或試劑盒,容器中裝有一種或多種本發(fā)明的藥用組合物成分。與這些容器一起,可以有由制造、使用或銷售藥品或生物制品的政府管理機構所給出的指示性提示,該提示反映出生產、使用或銷售的政府管理機構許可其在人體上施用。此外,本發(fā)明的多肽可以與其它的治療化合物結合使用。
藥物組合物可以以方便的方式給藥,如通過局部、靜脈內、腹膜內、肌內、皮下、鼻內或皮內的給藥途徑。人類DNA CGG重復結合蛋白10.23以有效地治療和/或預防具體的適應癥的量來給藥。施用于患者的人類DNA CGG重復結合蛋白10.23的量和劑量范圍將取決于許多因素,如給藥方式、待治療者的健康條件和診斷醫(yī)生的判斷。
下列附圖用于說明本發(fā)明的具體實施方案,而不用于限定由權利要求書所界定的本發(fā)明范圍。
圖1是本發(fā)明人類DNA CGG重復結合蛋白10.23和人類DNA CGG重復結合蛋白的基因芯片表達譜比較圖。上圖是人類DNA CGG重復結合蛋白10.23的表達譜折方圖,下方序列是人類DNA CGG重復結合蛋白的表達譜折方圖。其中,1-膀胱粘膜、2-PMA+的Ecv304細胞株、3-LPS+的Ecv304細胞株胸腺、4-正常成纖維細胞1024NC、5-Fibroblast,生長因子刺激,1024NT、6-疤痕成fc生長因子刺激,1013HT、7-疤痕成fc未用生長因子刺激,1013HC、8-膀胱癌建株細胞EJ、9-膀胱癌旁、10-膀胱癌、11-肝癌、12-肝癌細胞株、13-胎皮、14-脾臟、15-前列腺癌、16-空腸腺癌、17賁門癌。
圖2為分離的人類DNA CGG重復結合蛋白10.23的聚丙烯酰胺凝膠電泳圖(SDS-PAGE)。10.23kDa為蛋白質的分子量。箭頭所指為分離出的蛋白條帶。
下面結合具體實施例,進一步闡述本發(fā)明。應理解,這些實施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。下列實施例中未注明具體條件的實驗方法,通常按照常規(guī)條件如Sambrook等人,分子克隆實驗室手冊(New YorkCold SpringHarbor Laboratory Press,1989)中所述的條件,或按照制造廠商所建議的條件。實施例1人類DNA CGG重復結合蛋白10.23的克隆用異硫氰酸胍/酚/氯仿一步法提取人胎腦總RNA。用Quik mRNA Isolation Kit(Qiegene公司產品)從總RNA中分離poly(A)mRNA。2ug poly(A)mRNA經逆轉錄形成cDNA。用Smart cDNA克隆試劑盒(購自Clontech)將cDNA片段定向插入到pBSK(+)載體(Clontech公司產品)的多克隆位點上,轉化DH5α,細菌形成cDNA文庫。用Dyeterminate cycle reaction sequencing kit(Perkin-Elmer公司產品)和ABI377自動測序儀(Perkin-Elmer公司)測定所有克隆的5′和3′末端的序列。將測定的cDNA序列與已有的公共DNA序列數據庫(Genebank)進行比較,結果發(fā)現其中一個克隆1228e12的cDNA序列為新的DNA。通過合成一系列引物對該克隆所含的插入cDNA片段進行雙向測定。結果表明,1228e12克隆所含的全長cDNA為1572bp(如Seq ID NO1所示),從第790bp至1071bp有一個282bp的開放閱讀框架(ORF),編碼一個新的蛋白質(如SeqID NO2所示)。我們將此克隆命名為pBS-1228e12,編碼的蛋白質命名為人類DNA CGG重復結合蛋白10.23。實施例2用RT-PCR方法克隆編碼人類DNA CGG重復結合蛋白10.23的基因用胎腦細胞總RNA為模板,以oligo-dT為引物進行逆轉錄反應合成cDNA,用Qiagene的試劑盒純化后,用下列引物進行PCR擴增Primer15’-CTGGCCATCAGGCCTTGGGAAGCA-3’(SEQ ID NO3)Primer25’-TTAAAATGCAAGTTTATTGAATAA-3’(SEQ ID NO4)Primer1為位于SEQ ID NO1的5’端的第1bp開始的正向序列;Primer2為SEQ ID NO1的中的3’端反向序列。
擴增反應的條件在50μl的反應體積中含有50mmol/L KCl,10mmol/LTris-Cl,(pH8.5),1.5mmol/L MgCl2,200μmol/L dNTP,10pmol引物,1U的Taq DNA聚合酶(Clontech公司產品)。在PE9600型DNA熱循環(huán)儀(Perkin-Elmer公司)上按下列條件反應25個周期94℃ 30sec;55℃ 30sec;72℃ 2min。在RT-PCR時同時設β-actin為陽性對照和模板空白為陰性對照。擴增產物用QIAGEN公司的試劑盒純化,用TA克隆試劑盒連接到pCR載體上(Invitrogen公司產品)。DNA序列分析結果表明PCR產物的DNA序列與SEQ ID NO1所示的1-1572bp完全相同。實施例3 Northern印跡法分析人類DNA CGG重復結合蛋白10.23基因的表達用一步法提取總RNA[Anal.Biochem 1987,162,156-159]。該法包括酸性硫氰酸胍苯酚-氯仿抽提。即用4M異硫氰酸胍-25mM檸檬酸鈉,0.2M乙酸鈉(pH4.0)對組織進行勻漿,加入1倍體積的苯酚和1/5體積的氯仿-異戊醇(49∶1),混合后離心。吸出水相層,加入異丙醇(0.8體積)并將混合物離心得到RNA沉淀。將得到的RNA沉淀用70%乙醇洗滌,干燥并溶于水中。用20μg RNA,在含20mM 3-(N-嗎啉代)丙磺酸(pH7.0)-5mM乙酸鈉-1mM EDTA-2.2M甲醛的1.2%瓊脂糖凝膠上進行電泳。然后轉移至硝酸纖維素膜上。用α-32P dATP通過隨機引物法制備32P-標記的DNA探針。所用的DNA探針為圖1所示的PCR擴增的人類DNA CGG重復結合蛋白10.23編碼區(qū)序列(790bp至1071bp)。將32P-標記的探針(約2×106cpm/ml)與轉移了RNA的硝酸纖維素膜在一溶液中于42℃雜交過夜,該溶液包含50%甲酰胺-25mM KH2PO4(pH7.4)-5×SSC-5×Denhardt’s溶液和200μg/ml鮭精DNA。雜交之后,將濾膜在1×SSC-0.1%SDS中于55℃洗30min。然后,用Phosphor Imager進行分析和定量。實施例4重組人類DNA CGG重復結合蛋白10.23的體外表達、分離和純化根據SEQ ID NO1和圖1所示的編碼區(qū)序列,設計出一對特異性擴增引物,序列如下Primer35'-CCCCATATGATGCTTCTTAGGAAAGTGCACTTT-3’(Seq ID No5)Primer45’-CATGGATCCTTAGAGATCTGGGGTCTCTGGCAG-3’(Seq ID No6)此兩段引物的5’端分別含有NdeI和BamHI酶切位點,其后分別為目的基因5’端和3’端的編碼序列,NdeI和BamHI酶切位點相應于表達載體質粒pET-28b(+)(Novagen公司產品,Cat.No.69865.3)上的選擇性內切酶位點。以含有全長目的基因的pBS-1228e12質粒為模板,進行PCR反應。PCR反應條件為總體積50μl中含pBS-1228e12質粒10pg、引物Primer-3和Primer-4分別為10pmol、Advantage polymerase Mix(Clontech公司產品)1μl。循環(huán)參數94℃ 20s,60℃ 30s,68℃ 2min,共25個循環(huán)。用NdeI和BamHI分別對擴增產物和質粒pET-28(+)進行雙酶切,分別回收大片段,并用T4連接酶連接。連接產物轉化用氯化鈣法大腸桿細菌DH5α,在含卡那霉素(終濃度30μg/ml)的LB平板培養(yǎng)過夜后,用菌落PCR方法篩選陽性克隆,并進行測序。挑選序列正確的陽性克隆(pET-1228e12)用氯化鈣法將重組質粒轉化大腸桿菌BL21(DE3)plySs(Novagen公司產品)。在含卡那霉素(終濃度30μg/ml)的LB液體培養(yǎng)基中,宿主菌BL21(pET-1228e12)在37℃培養(yǎng)至對數生長期,加入IPTG至終濃度1mmol/L,繼續(xù)培養(yǎng)5小時。離心收集菌體,經超聲波破菌,離心收集上清,用能與6個組氨酸(6His-Tag)結合的親和層析柱His.Bind Quick Cartridge(Novagen公司產品)進行層析,得到了純化的目的蛋白人類DNA CGG重復結合蛋白10.23。經SDS-PAGE電泳,在10.23kDa處得到一單一的條帶(圖2)。將該條帶轉移至PVDF膜上用Edams水解法進行N-端氨基酸序列分析,結果N-端15個氨基酸與SEQ ID NO2所示的N-端15個氨基酸殘基完全相同。實施例5抗人類DNA CGG重復結合蛋白10.23抗體的產生用多肽合成儀(PE公司產品)合成下述人類DNA CGG重復結合蛋白10.23特異性的多肽NH2-Met-Leu-Leu-Arg-Lys-Val-His-Phe-Leu-His-Gln-Cys-Tyr-Thr-Val-COOH(SEQ ID NO7)。將該多肽分別與血藍蛋白和牛血清白蛋白耦合形成復合,方法參見Avrameas,et al.Immunochemistry,1969;643。用4mg上述血藍蛋白多肽復合物加上完全弗氏佐劑免疫家兔,15天后再用血藍蛋白多肽復合物加不完全弗氏佐劑加強免疫一次。采用經15μg/ml牛血清白蛋白多肽復合物包被的滴定板做ELISA測定兔血清中抗體的滴度。用蛋白A-Sepharose從抗體陽性的家兔血清中分離總IgG。將多肽結合于溴化氰活化的Sepharose4B柱上,用親和層析法從總IgG中分離抗多肽抗體。免疫沉淀法證明純化的抗體可特異性地與人類DNA CGG重復結合蛋白10.23結合。實施例6本發(fā)明的多核苷酸片段用作雜交探針的應用從本發(fā)明的多核苷酸中挑選出合適的寡核苷酸片段用作雜交探針有多方面的用途,如用該探針可與不同來源的正常組織或病理組織的基因組或cDNA文庫雜交以鑒定其是否含有本發(fā)明的多核苷酸序列和檢出同源的多核苷酸序列,進一步還可用該探針檢測本發(fā)明的多核苷酸序列或其同源的多核苷酸序列在正常組織或病理組織細胞中的表達是否異常。
本實施例的目的是從本發(fā)明的多核苷酸SEQ ID NO1中挑選出合適的寡核苷酸片段用作雜交探針,并用濾膜雜交方法鑒定一些組織中是否含有本發(fā)明的多核苷酸序列或其同源的多核苷酸序列。濾膜雜交方法包括斑點印跡法、Southern印跡法、Northern印跡法和復印方法等,它們都是將待測的多核苷酸樣品固定在濾膜上后使用基本相同的步驟雜交。這些相同的步驟是固定了樣品的濾膜首先用不含探針的雜交緩沖液進行預雜交,以使濾膜上樣品的非特異性的結合部位被載體和合成的多聚物所飽和。然后預雜交液被含有標記探針的雜交緩沖液替換,并保溫使探針與靶核酸雜交。雜交步驟之后,未雜交上的探針被一系列洗膜步驟除掉。本實施例利用較高強度的洗膜條件(如較低鹽濃度和較高的溫度),以使雜交背景降低且只保留特異性強的信號。本實施例選用的探針包括兩類第一類探針是完全與本發(fā)明的多核苷酸SEQ ID NO1相同或互補的寡核苷酸片段;第二類探針是部分與本發(fā)明的多核苷酸SEQ ID NO1相同或互補的寡核苷酸片段。本實施例選用斑點印跡法將樣品固定在濾膜上,在較高強度的的洗膜條件下,第一類探針與樣品的雜交特異性最強而得以保留。一、探針的選用從本發(fā)明的多核苷酸SEQ ID NO1中選擇寡核苷酸片段用作雜交探針,應遵循以下原則和需要考慮的幾個方面1,探針大小優(yōu)選范圍為18-50個核苷酸;2,GC含量為30%-70%,超過則非特異性雜交增加;3,探針內部應無互補區(qū)域;4,符合以上條件的可作為初選探針,然后進一步作計算機序列分析,包括將該初選探針分別與其來源序列區(qū)域(即SEQ ID NO1)和其它已知的基因組序列及其互補區(qū)進行同源性比較,若與非靶分子區(qū)域的同源性大于85%或者有超過15個連續(xù)堿基完全相同,則該初選探針一般就不應該使用;5,初選探針是否最終選定為有實際應用價值的探針還應進一步由實驗確定。
完成以上各方面的分析后挑選并合成以下二個探針探針1(probe1),屬于第一類探針,與SEQ ID NO1的基因片段完全同源或互補(41Nt)5’-TGCTTCTTAGGAAAGTGCACTTTTTACACCAATGCTACACA-3’(SEQ ID NO8)探針2(probe2),屬于第二類探針,相當于SEQ ID NO1的基因片段或其互補片段的替換突變序列(41Nt)5’-TGCTTCTTAGGAAAGTGCACCTTTTACACCAATGCTACACA-3’(SEQ ID NO9)與以下具體實驗步驟有關的其它未列出的常用試劑及其配制方法請參考文獻DNA PROBES G.H.Keller;M.M.Manak;Stockton Press,1989(USA)以及更常用的分子克隆實驗手冊書籍如《分子克隆實驗指南》(1998年第二版)[美]薩姆布魯克等著,科學出版社。
樣品制備1,從新鮮或冰凍組織中提取DNA步驟1)將新鮮或新鮮解凍的正常肝組織放入浸在冰上并盛有磷酸鹽緩沖液(PBS)的平皿中。用剪刀或手術刀將組織切成小塊。操作中應保持組織濕潤。2)以1000g離心切碎組織10分鐘。3)用冷勻漿緩沖液(0.25mol/L蔗糖;25mmol/LTris-HCl,pH7.5;25mmol/LnaCl;25mmol/L MgCl2)懸浮沉淀(大約10ml/g)。4)在4C用電動勻漿器以全速勻漿組織懸液,直至組織被完全破碎。5)1000g離心10分鐘。6)用重懸細胞沉淀(每0.1g最初組織樣品加1-5ml),再以1000g離心10分鐘。7)用裂解緩沖液重懸沉淀(每0.1g最初組織樣品加1ml),然后接以下的苯酚抽提法。2,DNA的苯酚抽提法步驟1)用1-10ml冷PBS洗細胞,1000g離心10分鐘。2)用冷細胞裂解液重懸浮沉淀的細胞(1×108細胞/ml)最少應用100ul裂解緩沖液。3)加SDS至終濃度為1%,如果在重懸細胞之前將SDS直接加入到細胞沉淀中,細胞可能會形成大的團塊而難以破碎,并降低的總產率。這一點在抽提>107細胞時特別嚴重。4)加蛋白酶K至終濃度200ug/ml。5)50℃保溫反應1小時或在37℃輕輕振搖過夜。6)用等體積苯酚∶氯仿∶異戊醇(25∶24∶1)抽提,在小離心機管中離心10分鐘。兩相應清楚分離,否則重新進行離心。7)將水相轉移至新管。8)用等體積氯仿∶異戊醇(24∶1)抽提,離心10分鐘。9)將含DNA的水相轉移至新管。然后進行DNA的純化和乙醇沉淀。3,DNA的純化和乙醇沉淀步驟1)將1/10體積2mol/L醋酸鈉和2倍體積冷100%乙醇加到DNA溶液中,混勻。在-20℃放置1小時或至過夜。2)離心10分鐘。3)小心吸出或倒出乙醇。4)用70%冷乙醇500ul洗滌沉淀,離心5分鐘。5)小心吸出或倒出乙醇。用500ul冷乙醇洗滌沉淀,離心5分鐘。6)小心吸出或倒出乙醇,然后在吸水紙上倒置使殘余乙醇流盡??諝飧稍?0-15分鐘,以使表面乙醇揮發(fā)。注意不要使沉淀完全干燥,否則較難重新溶解。7)以小體積TE或水重懸DNA沉淀。低速渦旋振蕩或用滴管吹吸,同時逐漸增加TE,混合至DNA充分溶解,每1-5×106細胞所提取的大約加1ul。
以下第8-13步驟僅用于必須除去污染時,否則可直接進行第14步驟。8)將RNA酶A加到DNA溶液中,終濃度為100ug/ml,37℃保溫30分鐘。9)加入SDS和蛋白酶K,終濃度分別為0.5%和100ug/ml。37℃保溫30分鐘。10)用等體積的苯酚∶氯仿∶異戊醇(25∶24∶1)抽提反應液,離心10分鐘。11)小心移出水相,用等體積的氯仿∶異戊醇(24∶1)重新抽提,離心10分鐘。12)小心移出水相,加1/10體積2mol/L醋酸鈉和2.5體積冷乙醇,混勻置-20℃ 1小時。13)用70%乙醇及100%乙醇洗滌沉淀,空氣干燥,重懸核酸,過程同第3-6步驟。14)測定A260和A280以檢測DNA的純度及產率。15)分裝后存放于-20℃。樣膜的制備1)取4×2張適當大小的硝酸纖維素膜(NC膜),用鉛筆在其上輕輕標出點樣位置及樣號,每一探針需兩張NC膜,以便在后面的實驗步驟中分別用高強度條件和強度條件洗膜。
2)吸取及對照各15微升,點于樣膜上,在室溫中晾干。
3)置于浸潤有0.1mol/LNaOH,1.5mol/LNaCl的濾紙上5分鐘(兩次),晾干置于浸潤有0.5mol/L Tris-HCl(pH7.0),3mol/LNaCl的濾紙上5分鐘(兩次),晾干。
4)夾于干凈濾紙中,以鋁箔包好,60-80℃真空干燥2小時。
探針的標記1)3μlProbe(0.1OD/10μl),加入2μlKinase緩沖液,8-10uCiγ-32P-dATP+2UKinase,以補加至終體積20μl。
2)37℃保溫2小時。
3)加1/5體積的溴酚藍指示劑(BPB)。
4)過Sephadex G-50柱。
5)至有32P-Probe洗出前開始收集第一峰(可用Monitor監(jiān)測)。
6)5滴/管,收集10-15管。
7)用液體閃爍儀監(jiān)測同位素量8)合并第一峰的收集液后即為所需制備的32P-Probe(第二峰為游離γ-32P-dATP)。
預雜交將樣膜置于塑料袋中,加入3-10mg預雜交液(10×Denhardt’s;6×SSC,0.1mg/mlCT DNA(小牛胸腺DNA)。),封好袋口后,68℃水浴搖2小時。
雜交將塑料袋剪去一角,加入制備好的探針,封好袋口后,42℃水浴搖過夜。
洗膜高強度洗膜1)取出已雜交好的樣膜。
2)2×SSC,0.1%SDS中,40℃洗15分鐘(2次)。
3)0.1×SSC,0.1%SDS中,40℃洗15分鐘(2次)。
4)0.1×SSC,0.1%SDS中,55℃洗30分鐘(2次),室溫晾干。低強度洗膜1)取出已雜交好的樣膜。
2)2×SSC,0.1%SDS中,37℃洗15分鐘(2次)。
3)0.1×SSC,0.1%SDS中,37℃洗15分鐘(2次)。
4)0.1×SSC,0.1%SDS中,40℃洗15分鐘(2次),室溫晾干。
X-光自顯影-70℃,X-光自顯影(壓片時間根據雜交斑放射性強弱而定)。
實驗結果采用低強度洗膜條件所進行的雜交實驗,以上兩個探針雜交斑放射性強弱沒有明顯區(qū)別;而采用高強度洗膜條件所進行的雜交實驗,探針1的雜交斑放射性強度明顯強于另一個探針雜交斑的放射性強度。因而可用探針1定性和定量地分析本發(fā)明的多核苷酸在不同組織中的存在和差異表達。實施例7 DNA Microarray基因芯片或基因微矩陣(DNA Microarray)是目前許多國家實驗室和大制藥公司都在著手研制和開發(fā)的新技術,它是指將大量的靶基因片段有序地、高密度地排列在玻璃、硅等載體上,然后用熒光檢測和計算機軟件進行數據的比較和分析,以達到快速、高效、高通量地分析生物信息的目的。本發(fā)明的多核苷酸可作為靶DNA用于基因芯片技術用于高通量研究新基因功能;尋找和篩選組織特異性新基因特別是腫瘤等疾病相關新基因;疾病的診斷,如遺傳性疾病。其具體方法步驟在文獻中已有多種報道,如可參閱文獻DeRisi,J.L,Lyer,V.&Brown,P.O.(1997)Science278,680-686.及文獻Helle,R.A.,Schema,M.,Chai,A.,Shalom,D.,(1997)PNAS 942150-2155.(一)點樣各種不同的全長cDNA共計4000條多核苷酸序列作為靶DNA,其中包括本發(fā)明的多核苷酸。將它們分別通過PCR進行擴增,純化所得擴增產物后將其濃度調到500ng/ul左右,用Cartesian 7500點樣儀(購自美國Cartesian公司)點于玻璃介質上,點與點之間的距離為280μm。將點樣后的玻片進行水合、干燥、置于紫外交聯儀中交聯,洗脫后干燥使DNA固定在玻璃片上制備成芯片。其具體方法步驟在文獻中已有多種報道,本實施例的點樣后處理步驟是1.潮濕環(huán)境中水合4小時;2. 0.2%SDS洗滌1分鐘;3. ddH2O洗滌兩次,每次1分鐘;4. NaBH4封閉5分鐘;
5. 95℃水中2分鐘;6. 0.2%SDS洗滌1分鐘;7. ddH2O沖洗兩次;8.涼干,25℃儲存于暗處備用。(二)探針標記用一步法分別從人體混合組織與機體特定組織(或經過刺激的細胞株)中抽提總mRNA,并用Oligotex mRNA MidiKit(購自QiaGen公司)純化mRNA,通過反轉錄分別將熒光試劑Cy3dUTP(5-Amino-propargy1-2’-deoxyuridine 5’-triphate coupledto Cy3 fluorescent dye,購自Amersham Phamacia Biotech公司)標記人體混合組織的mRNA,用熒光試劑Cy5dUTP(5-Amino-propargy1-2’-deoxyuridine 5’-triphatecoupled to Cy5 fluorescent dye,購自Amersham Phamacia Biotech公司)標記機體特定組織(或經過刺激的細胞株)mRNA,經純化后制備出探針。具體步驟參照及方法見Schena,M.,Shalon,D.,Heller,R.(1996)Proc.Natl.Acad.Sci.USA.Vol.9310614-10619.Schena,M.,Shalon,Dari.,Davis,R.W.(1995)Science.270.(20)467-480.(三)雜交分別將來自以上兩種組織的探針與芯片一起在UniHybTMHybridizationSolution(購自TeleChem公司)雜交液中進行雜交16小時,室溫用洗滌液(1×SSC,0.2%SDS)洗滌后用ScanArray 3000掃描儀(購自美國General Scanning公司)進行掃描,掃描的圖象用Imagene軟件(美國Biodiscovery公司)進行數據分析處理,算出每個點的Cy3/Cy5比值。
以上機體特定組織(或經過刺激的細胞株)分別為胎腦、原液培養(yǎng)的L02細胞株、0.5%FBS培養(yǎng)液37.C饑餓的L02細胞株、胎腎、直腸癌,胎肝、成人肝、肝癌、胎肺、胎脾、胎心、成人心、成人睪丸、胎胃、成人胃。根據這15個Cy3/Cy5比值繪出折方圖。(圖1)。由圖可見本發(fā)明所述的人類DNA CGG重復結合蛋白10.23和人類DNA CGG重復結合蛋白表達譜很相似。
序列表(1)一般信息(ii)發(fā)明名稱人類DNA CGG重復結合蛋白10.23及其編碼序列(i)序列數目9(2)SEQ ID NO1的信息(i)序列特征(A)長度1572bp(B)類型核酸(C)鏈性雙鏈(D)拓撲結構線性(ii)分子類型cDNA(xi)序列描述SEQ ID NO11 CTGGCCATCAGGCCTTGGGAAGCAGCACCCCACAGCCTTGGCACAGCTACAGAGACCTCC61 TTGCCTCAGGATGGAGTCAAACCTGGACCCCCTGCCATTCTCATCTGCAGGAAACACTGG121 CCTCCTTCATCCTCAGGCTGTGTTGCTGGAAGTCACCCATCTCCGAGGCCCCTTGGGATC181 GACTGAGTGACCAGCAGTGAAGTTCATCCACCTTCTGAATGGATGCCATCATCTGAAGTG241 ATGGAGCTCAGTGGGATGTTGTTGCGGTCTTCCCTCCCTTAGCCAGGATGTCCCTGATAA301 AGGATGACACCCAAGCCTCAGCACAACTGGCCAAACTTGAGGTGGTCATCTCAGCACTGA361 TGCTGGGCCAACAATTAGCCCCATTTGTACATTTTTACAAATTTTTGGCAATTGCCAAGA421 ATTATCCACCTTCCCTCCCCATTGAATTAAAGAAACTTCTTGCCTCATGGATACTCAGAA481 TACAATCAAGGTAACAGATGCCTTTTTTTTAACGAAGGACACAGTACAGATCTCACAGGG541 ACACTCCTTATCCCCTGCAGAGTTCCTGACACTACTGATGGTGACCAAGGCAACATTTCA601 TCAGAAAACACAGTGCTAGGCTTGTGAAAGTGTCTAGTAGGGCTTCCACTGCCCCTATAG661 GCTGCAGGCAGCTGCTTTAGTTGAGAGATAGACTGAGCTCCTCAAAGAATTCCTATTTAA721 GTTACAAAGCAGCGACTGGATGCCCTGCTGGGTTTCACTGTTGTCACAGGCTTTGATTAC781 TCTAAGTTCATGCTTCTTAGGAAAGTGCACTTTTTACACCAATGCTACACAGTTCCCTCA841 GTTGCCTTTACTGGACATCAAGGAGTTCACATTTTTGACAACCATTCAGTCCTGGACTGT901 CCAAGGGGTGGAGCTAGCTCAGTACAGGAAGCTGCCTGCTGCGTGTGGATCAGTAATATC961 AGACTTGCCCAACAACTCACTGGAGACATGAAAACCAATGCATGGGGGATGCATGACGTC1021 ACCCAAATAATTATGAACACTCTTGTGCTGCCAGAGACCCCAGATCTCTAAACCAACGCA1081 TGAGGAATGCATGACATCACCCAAATATTTACAAACACGCTTATTCTGCCAGAGACCCCA1141 GATCACTTTTCCTGCCTCCTGCTAAATAAATGGGGGCAGTAGCTTTGCATCGGCTTCCAC1201 ATTACATTACTCATAACTGTGGCCTTCCTAATCTCTCATGTCCCTAAGCTTCGTCTTCTC1261 GCAGCCGCTGCGAGAAGACGAAGCTTAGGGAGGAGGAATTGGAACTAGAATGTGTGACTC1321 TGTGGGGACTGCATAGGTTTGTTAATTGACCTATAGCTAAACCTTAATGTGTTTGTGTGT1381 CTATACATTGCTTTCCGCATTCCAAGACATCCAGACGCTATTACCAACATTTTCCTGTGC1441 ATTAACCTCTGCATGTGAAAACTTTTAACAGTTACTGAACTATGTAAATATGTGAATTTT1501 TTTATTTAGGTGGATGCATTTTTTGTCTGTTTACTGCTCTTCTCAGCTTTATTCAATAAA1561 CTTGCATTTTAA(3)SEQ ID NO2的信息(i)序列特征(A)長度93個氨基酸(B)類型氨基酸(D)拓撲結構線性(ii)分子類型多肽(xi)序列描述SEQ ID NO21 Met Leu Leu Arg Lys Val His Phe Leu His Gln Cys Tyr Thr Val16 Pro Ser Val Ala Phe Thr Gly His Gln Gly Val His Ile Phe Asp31 Asn His Ser Val Leu Asp Cys Pro Arg Gly Gly Ala Ser Ser Val46 Gln Glu Ala Ala Cys Cys Val Trp Ile Ser Asn Ile Arg Leu Ala61 Gln Gln Leu Thr Gly Asp Met Lys Thr Asn Ala Trp Gly Met His76 Asp Val Thr Gln Ile Ile Met Asn Thr Leu Val Leu Pro Glu Thr91 Pro Asp Leu(4)SEQ ID NO3的信息(i)序列特征(A)長度24堿基(B)類型核酸
(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO3CTGGCCATCAGGCCTTGGGAAGCA 24(5)SEQ ID NO4的信息(i)序列特征(A)長度24堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO4TTAAAATGCAAGTTTATTGAATAA24(6)SEQ ID NO5的信息(i)序列特征(A)長度33堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO5CCCCATATGATGCTTCTTAGGAAAGTGCACTTT 33(7)SEQ ID NO6的信息(i)序列特征(A)長度33堿基(B)類型核酸(C)鏈性單鏈
(D)拓撲結構線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO6CATGGATCCTTAGAGATCTGGGGTCTCTGGCAG 33(8)SEQ ID NO7的信息(i)序列特征(A)長度15個氨基酸(B)類型氨基酸(D)拓撲結構線性(ii)分子類型多肽(xi)序列描述SEQ ID NO7Met-Leu-Leu-Arg-Lys-Val-His-Phe-Leu-His-Gln-Cys-Tyr-Thr-Val15(9)SEQ ID NO8的信息(i)序列特征(A)長度41堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO8TGCTTCTTAGGAAAGTGCACTTTTTACACCAATGCTACACA 41(10)SEQ ID NO9的信息(i)序列特征(A)長度41堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO9TGCTTCTTAGGAAAGTGCACCTTTTACACCAATGCTACACA4權利要求
1.一種分離的多肽-人類DNA CGG重復結合蛋白10.23,其特征在于它包含有SEQ ID NO2所示的氨基酸序列的多肽、或其多肽的活性片段、類似物或衍生物。
2.如權利要求1所述的多肽,其特征在于所述多肽、類似物或衍生物的氨基酸序列具有與SEQ ID NO2所示的氨基酸序列至少95%的相同性。
3.如權利要求2所述的多肽,其特征在于它包含具有SEQ ID NO2所示的氨基酸序列的多肽。
4.一種分離的多核苷酸,其特征在于所述多核苷酸包含選自下組中的一種(a)編碼具有SEQ ID NO2所示氨基酸序列的多肽或其片段、類似物、衍生物的多核苷酸;(b)與多核苷酸(a)互補的多核苷酸;或(c)與(a)或(b)有至少70%相同性的多核苷酸。
5.如權利要求4所述的多核苷酸,其特征在于所述多核苷酸包含編碼具有SEQID NO2所示氨基酸序列的多核苷酸。
6.如權利要求4所述的多核苷酸,其特征在于所述多核苷酸的序列包含有SEQ IDNO1中790-1071位的序列或SEQ ID NO1中1-1572位的序列。
7.一種含有外源多核苷酸的重組載體,其特征在于它是由權利要求4-6中的任一權利要求所述多核苷酸與質粒、病毒或運載體表達載體構建而成的重組載體。
8.一種含有外源多核苷酸的遺傳工程化宿主細胞,其特征在于它是選自于下列一種宿主細胞(a)用權利要求7所述的重組載體轉化或轉導的宿主細胞;或(b)用權利要求4-6中的任一權利要求所述多核苷酸轉化或轉導的宿主細胞。
9.一種具有人類DNA CGG重復結合蛋白10.23活性的多肽的制備方法,其特征在于所述方法包括(a)在表達人類DNA CGG重復結合蛋白10.23條件下,培養(yǎng)權利要求8所述的工程化宿主細胞;(b)從培養(yǎng)物中分離出具有人類DNA CGG重復結合蛋白10.23活性的多肽。
10.一種能與多肽結合的抗體,其特征在于所述抗體是能與人類DNA CGG重復結合蛋白10.23特異性結合的抗體。
11.一類模擬或調節(jié)多肽活性或表達的化合物,其特征在于它們是模擬、促進、拮抗或抑制人類DNA CGG重復結合蛋白10.23的活性的化合物。
12.如權利要求11所述的化合物,其特征在于它是SEQ ID NO1所示的多核苷酸序列或其片段的反義序列。
13.一種權利要求11所述化合物的應用,其特征在于所述化合物用于調節(jié)人類DNA CGG重復結合蛋白10.23在體內、體外活性的方法。
14.一種檢測與權利要求1-3中的任一權利要求所述多肽相關的疾病或疾病易感性的方法,其特征在于其包括檢測所述多肽的表達量,或者檢測所述多肽的活性,或者檢測多核苷酸中引起所述多肽表達量或活性異常的核苷酸變異。
15.如權利要求1-3中的任一權利要求所述多肽的應用,其特征在于它應用于篩選人類DNA CGG重復結合蛋白10.23的模擬物、激動劑,拮抗劑或抑制劑;或者用于肽指紋圖譜鑒定。
16.如權利要求4-6中的任一權利要求所述的核酸分子的應用,其特征在于它作為引物用于核酸擴增反應,或者作為探針用于雜交反應,或者用于制造基因芯片或微陣列。
17.如權利要求1-6及11中的任一權利要求所述的多肽、多核苷酸或化合物的應用,其特征在于用所述多肽、多核苷酸或其模擬物、激動劑、拮抗劑或抑制劑以安全有效劑量與藥學上可接受的載體組成作為診斷或治療與人類DNA CGG重復結合蛋白10.23異常相關的疾病的藥物組合物。
18.權利要求1-6及11中的任一權利要求所述的多肽、多核苷酸或化合物的應用,其特征在于用所述多肽、多核苷酸或化合物制備用于治療如胚胎發(fā)育畸形、腫瘤及蛋白質代謝紊亂性疾病的藥物。
全文摘要
本發(fā)明公開了一種新的多肽——人類DNA CGG重復結合蛋白10.23,編碼此多肽的多核苷酸和經DNA重組技術產生這種多肽的方法。本發(fā)明還公開了此多肽用于治療多種疾病的方法,如胚胎發(fā)育畸形、腫瘤及蛋白質代謝紊亂性疾病等。本發(fā)明還公開了抗此多肽的拮抗劑及其治療作用。本發(fā)明還公開了編碼這種新的人類DNA CGG重復結合蛋白10.23的多核苷酸的用途。
文檔編號C07K14/00GK1343717SQ0012525
公開日2002年4月10日 申請日期2000年9月19日 優(yōu)先權日2000年9月19日
發(fā)明者毛裕民, 謝毅 申請人:上海博德基因開發(fā)有限公司