具有抑癌功能的新的人蛋白及其編碼序列的制作方法

文檔序號：3503326閱讀：324來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>有機(jī)化學(xué)裝置的制造及其處理,應(yīng)用技術(shù)

專利名稱：具有抑癌功能的新的人蛋白及其編碼序列的制作方法
技術(shù)領(lǐng)域：
本發(fā)明屬于生物技術(shù)領(lǐng)域，具體地說，本發(fā)明涉及新的編碼具有抑癌功能的人蛋白的多核苷酸和此多核苷酸編碼的多肽。本發(fā)明還涉及此多核苷酸和多肽的用途和制備。
背景技術(shù)：
人基因組學(xué)研究目前是國際上的熱點(diǎn)，除人染色體DNA大規(guī)模測序，表達(dá)序列測序(EST)的方法外，還缺少從功能開始的篩選具有功能基因的高通量的方法。
癌癥是危害人類健康的主要疾病之一。為了有效地治療和預(yù)防腫瘤，目前人們已越來越關(guān)注腫瘤的基因治療。因此，本領(lǐng)域迫切需要開發(fā)研究具有抑癌功能的人蛋白及其激動劑/抑制劑。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一類新的具有抑癌功能的人蛋白多肽以及其片段、類似物和衍生物。
本發(fā)明的另一目的是提供編碼這些多肽的多核苷酸。
本發(fā)明的另一目的是提供生產(chǎn)這些多肽的方法以及該多肽和編碼序列的用途。
在本發(fā)明的第一方面，提供新穎的分離出的具有抑癌功能的蛋白多肽，它包含具有選自下組的氨基酸序列的多肽SEQ ID NO3、6、9；或其保守性變異多肽、或其活性片段、或其活性衍生物。
較佳地，該多肽是具有選自下組的氨基酸序列的多肽SEQ ID NO3、6、9。
在本發(fā)明的第二方面，提供了一種分離的多核苷酸，它包含一核苷酸序列，該核苷酸序列與選自下組的一種核苷酸序列有至少85％相同性(a)編碼上述的具有抑癌功能的蛋白多肽的多核苷酸；(b)與多核苷酸(a)互補(bǔ)的多核苷酸。較佳地，該多核苷酸編碼的多肽具有選自下組的氨基酸序列SEQ ID NO3、6、9。更佳地，該多核苷酸的序列選自下組SEQ ID NO2、5、8的編碼區(qū)序列或全長序列。
在本發(fā)明的第三方面，提供了含有上述多核苷酸的載體，以及被該載體轉(zhuǎn)化或轉(zhuǎn)導(dǎo)的宿主細(xì)胞或者被上述多核苷酸直接轉(zhuǎn)化或轉(zhuǎn)導(dǎo)的宿主細(xì)胞。
在本發(fā)明的第四方面，提供了制備具有抑癌功能的蛋白活性的多肽的制備方法，該方法包含(a)在適合表達(dá)具有抑癌功能的蛋白的條件下，培養(yǎng)上述被轉(zhuǎn)化或轉(zhuǎn)導(dǎo)的宿主細(xì)胞；(b)從培養(yǎng)物中分離出具有抑癌功能的蛋白活性的多肽。
在本發(fā)明的第五方面，提供了與上述的具有抑癌功能的蛋白多肽特異性結(jié)合的抗體。還提供了可用于檢測的核酸分子，它含有上述的多核苷酸中連續(xù)10個核苷酸至全長核苷酸，較佳地它含有連續(xù)的約15-1000個核苷酸。
在本發(fā)明的第六方面，提供了一種藥物組合物，它含有安全有效量的本發(fā)明的具有抑癌功能的蛋白多肽以及藥學(xué)上可接受的載體。這些藥物組合物可治療癌癥以及細(xì)胞異常增殖等病癥。
本發(fā)明的其它方面由于本文的公開內(nèi)容，對本領(lǐng)域的技術(shù)人員而言是顯而易見的。
具體實(shí)施例方式
3T3細(xì)胞是一種小鼠成纖維細(xì)胞(J.Cell.Biol.，17299，1963)(也稱為NIH/3T3細(xì)胞)。在癌癥研究領(lǐng)域中，常將外源基因(尤其是人基因)引入3T3細(xì)胞，觀察其對3T3細(xì)胞生長的影響情況?，F(xiàn)普遍認(rèn)為，對3T3細(xì)胞生長有影響的基因是癌癥相關(guān)基因，其中對3T3細(xì)胞生長有抑制作用的基因大多是抑癌基因，而對3T3細(xì)胞生長有促進(jìn)作用的基因大多是(原)癌基因。
本發(fā)明采用大規(guī)模cDNA克隆轉(zhuǎn)染小鼠胚胎成纖維細(xì)胞，在獲得具有抑癌作用的基礎(chǔ)上，經(jīng)測序證明為新的基因，進(jìn)一步得到全長cDNA克隆。DNA轉(zhuǎn)染試驗(yàn)證明，本發(fā)明的具有抑癌功能的蛋白對3T3細(xì)胞具有抑制克隆形成的作用，其抑制率≥50％。
如本文所用，“分離的”是指物質(zhì)從其原始環(huán)境中分離出來(如果是天然的物質(zhì)，原始環(huán)境即是天然環(huán)境)。如活體細(xì)胞內(nèi)的天然狀態(tài)下的多聚核苷酸和多肽是沒有分離純化的，但同樣的多聚核苷酸或多肽如從天然狀態(tài)中同存在的其他物質(zhì)中分開，則為分離純化的。
如本文所用，“分離的具有抑癌功能的蛋白或多肽”是指具有抑癌功能的蛋白多肽基本上不含天然與其相關(guān)的其它蛋白、脂類、糖類或其它物質(zhì)。本領(lǐng)域的技術(shù)人員能用標(biāo)準(zhǔn)的蛋白質(zhì)純化技術(shù)純化具有抑癌功能的蛋白。基本上純的多肽在非還原聚丙烯酰胺凝膠上能產(chǎn)生單一的主帶。
本發(fā)明的多肽可以是重組多肽、天然多肽、合成多肽，優(yōu)選重組多肽。本發(fā)明的多肽可以是天然純化的產(chǎn)物，或是化學(xué)合成的產(chǎn)物，或使用重組技術(shù)從原核或真核宿主(例如，細(xì)菌、酵母、高等植物、昆蟲和哺乳動物細(xì)胞)中產(chǎn)生。根據(jù)重組生產(chǎn)方案所用的宿主，本發(fā)明的多肽可以是糖基化的，或可以是非糖基化的。本發(fā)明的多肽還可包括或不包括起始的甲硫氨酸殘基。
本發(fā)明還包括具有抑癌功能的人蛋白的片段、衍生物和類似物。如本文所用，術(shù)語“片段”、“衍生物”和“類似物”是指基本上保持本發(fā)明的天然具有抑癌功能的人蛋白相同的生物學(xué)功能或活性的多肽。本發(fā)明的多肽片段、衍生物或類似物可以是(i)有一個或多個保守或非保守性氨基酸殘基(優(yōu)選保守性氨基酸殘基)被取代的多肽，而這樣的取代的氨基酸殘基可以是也可以不是由遺傳密碼編碼的，或(ii)在一個或多個氨基酸殘基中具有取代基團(tuán)的多肽，或(iii)成熟多肽與另一個化合物(比如延長多肽半衰期的化合物，例如聚乙二醇)融合所形成的多肽，或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前導(dǎo)序列或分泌序列或用來純化此多肽的序列或蛋白原序列)。根據(jù)本文的教導(dǎo)，這些片段、衍生物和類似物屬于本領(lǐng)域熟練技術(shù)人員公知的范圍。
本發(fā)明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因組DNA或人工合成的DNA。DNA可以是單鏈的或是雙鏈的。DNA可以是編碼鏈或非編碼鏈。以FP3361蛋白(在本申請中，蛋白質(zhì)的命名采用其克隆編號)為例，編碼成熟多肽的編碼區(qū)序列可以與SEQ ID NO2所示的編碼區(qū)序列相同或者是簡并的變異體。如本文所用，“簡并的變異體”對于FP3361而言是指編碼具有SEQ ID NO3的蛋白質(zhì)，但與SEQ ID NO2所示的編碼區(qū)序列有差別的核酸序列。再以FP7072蛋白為例，編碼成熟多肽的編碼區(qū)序列可以與SEQ ID NO5所示的編碼區(qū)序列相同或者是簡并的變異體；“簡并的變異體”對于FP7072而言是指編碼具有SEQ ID NO6的蛋白質(zhì)，但與SEQ ID NO5所示的編碼區(qū)序列有差別的核酸序列。對于本發(fā)明的其他具有抑癌功能的蛋白，可依此類推。
編碼成熟多肽的多核苷酸包括只編碼成熟多肽的編碼序列；成熟多肽的編碼序列和各種附加編碼序列；成熟多肽的編碼序列(和任選的附加編碼序列)以及非編碼序列。
術(shù)語“編碼多肽的多核苷酸”可以是包括編碼此多肽的多核苷酸，也可以是還包括附加編碼和/或非編碼序列的多核苷酸。
本發(fā)明還涉及上述多核苷酸的變異體，其編碼與本發(fā)明有相同的氨基酸序列的多肽或多肽的片段、類似物和衍生物。此多核苷酸的變異體可以是天然發(fā)生的等位變異體或非天然發(fā)生的變異體。這些核苷酸變異體包括取代變異體、缺失變異體和插入變異體。如本領(lǐng)域所知的，等位變異體是一個多核苷酸的替換形式，它可能是一個或多個核苷酸的取代、缺失或插入，但不會從實(shí)質(zhì)上改變其編碼的多肽的功能。
本發(fā)明還涉及與上述的序列雜交且兩個序列之間具有至少50％，較佳地至少70％，更佳地至少80％相同性的多核苷酸。本發(fā)明特別涉及在嚴(yán)格條件下與本發(fā)明所述多核苷酸可雜交的多核苷酸。在本發(fā)明中，“嚴(yán)格條件”是指(1)在較低離子強(qiáng)度和較高溫度下的雜交和洗脫，如0.2×SSC，0.1％SDS，60℃；或(2)雜交時加有變性劑，如50％(v/v)甲酰胺，0.1％小牛血清/0.1％Ficoll，42℃等；或(3)僅在兩條序列之間的相同性至少在95％以上，更好是97％以上時才發(fā)生雜交。并且，可雜交的多核苷酸編碼的多肽與SEQ IDNO3所示的成熟多肽具有相同的生物學(xué)功能(以FP3361蛋白為例)和活性。
本發(fā)明還涉及與上述的序列雜交的核酸片段。如本文所用，“核酸片段”的長度至少含15個核苷酸，較好是至少30個核苷酸，更好是至少50個核苷酸，最好是至少100個核苷酸以上。核酸片段可用于核酸的擴(kuò)增技術(shù)(如PCR)以確定和/或分離編碼具有抑癌功能的蛋白的多聚核苷酸。
本發(fā)明中的多肽和多核苷酸優(yōu)選以分離的形式提供，更佳地被純化至均質(zhì)。
本發(fā)明的DNA序列能用幾種方法獲得。例如，用本領(lǐng)域熟知的雜交技術(shù)分離DNA。這些技術(shù)包括但不局限于1)用探針與基因組或cDNA文庫雜交以檢出同源性核苷酸序列，和2)表達(dá)文庫的抗體篩選以檢出具有共同結(jié)構(gòu)特征的克隆的DNA片段。
編碼具有抑癌功能的蛋白的特異DNA片段序列產(chǎn)生也能用下列方法獲得1)從基因組DNA分離雙鏈DNA序列；2)化學(xué)合成DNA序列以獲得所需多肽的雙鏈DNA。
當(dāng)需要的多肽產(chǎn)物的整個氨基酸序列已知時，DNA序列的直接化學(xué)合成是經(jīng)常選用的方法。如果所需的氨基酸的整個序列不清楚時，DNA序列的直接化學(xué)合成是不可能的，選用的方法是cDNA序列的分離。分離感興趣的cDNA的標(biāo)準(zhǔn)方法是從高表達(dá)該基因的供體細(xì)胞分離mRNA并進(jìn)行逆轉(zhuǎn)錄，形成質(zhì)?；蚴删wcDNA文庫。提取mRNA的方法已有多種成熟的技術(shù)，試劑盒也可從商業(yè)途徑獲得(Qiagene)。而構(gòu)建cDNA文庫也是通常的方法(Sambrook，et al.，Molecular Cloning，A Laboratory Manual，Cold SpringHarbor Laboratory.New York，1989)。還可得到商業(yè)供應(yīng)的cDNA文庫，如Clontech公司的不同cDNA文庫。當(dāng)結(jié)合使用聚合酶反應(yīng)技術(shù)時，即使極少的表達(dá)產(chǎn)物也能克隆。
可用常規(guī)方法從這些cDNA文庫中篩選本發(fā)明的基因。這些方法包括(但不限于)(1)DNA-DNA或DNA-RNA雜交；(2)標(biāo)志基因的功能出現(xiàn)或喪失；(3)測定具有抑癌功能的蛋白的轉(zhuǎn)錄本的水平；(4)通過免疫學(xué)技術(shù)或測定生物學(xué)活性，來檢測基因表達(dá)的蛋白產(chǎn)物。上述方法可單用，也可多種方法聯(lián)合應(yīng)用。
在第(1)種方法中，雜交所用的探針是與本發(fā)明的多核苷酸的任何一部分同源，其長度至少15個核苷酸，較好是至少30個核苷酸，更好是至少50個核苷酸，最好是至少100個核苷酸。此外，探針的長度通常在2kb之內(nèi)，較佳地為1kb之內(nèi)。此處所用的探針通常是在本發(fā)明的基因DNA序列信息的基礎(chǔ)上化學(xué)合成的DNA序列。本發(fā)明的基因本身或者片段當(dāng)然可以用作探針。DNA探針的標(biāo)記可用放射性同位素，熒光素或酶(如堿性磷酸酶)等。
在第(4)種方法中，檢測具有抑癌功能的蛋白基因表達(dá)的蛋白產(chǎn)物可用免疫學(xué)技術(shù)如Western印跡法，放射免疫沉淀法，酶聯(lián)免疫吸附法(ELISA)等。
應(yīng)用PCR技術(shù)擴(kuò)增DNA/RNA的方法(Saiki，et al.Science 1985；2301350-1354)被優(yōu)選用于獲得本發(fā)明的基因。特別是很難從文庫中得到全長的cDNA時，可優(yōu)選使用RACE法(RACE-cDNA末端快速擴(kuò)增法)，用于PCR的引物可根據(jù)本文所公開的本發(fā)明的序列信息適當(dāng)?shù)剡x擇，并可用常規(guī)方法合成?？捎贸Ｒ?guī)方法如通過凝膠電泳分離和純化擴(kuò)增的DNA/RNA片段。
如上所述得到的本發(fā)明的基因，或者各種DNA片段等的核苷酸序列的測定可用常規(guī)方法如雙脫氧鏈終止法(Sanger et al.PNAS，1977，745463-5467)。這類核苷酸序列測定也可用商業(yè)測序試劑盒等。為了獲得全長的cDNA序列，測序需反復(fù)進(jìn)行。有時需要測定多個克隆的cDNA序列，才能拼接成全長的cDNA序列。
本發(fā)明也涉及包含本發(fā)明多核苷酸的載體，以及用本發(fā)明載體或具有抑癌功能的蛋白編碼序列經(jīng)基因工程產(chǎn)生的宿主細(xì)胞，以及經(jīng)重組技術(shù)產(chǎn)生本發(fā)明所述多肽的方法。
通過常規(guī)的重組DNA技術(shù)，可利用本發(fā)明的多聚核苷酸序列可用來表達(dá)或生產(chǎn)重組的具有抑癌功能的蛋白多肽。一般來說有以下步驟
(1).用本發(fā)明的編碼具有抑癌功能的人蛋白的多核苷酸(或變異體)，或用含有該多核苷酸的重組表達(dá)載體轉(zhuǎn)化或轉(zhuǎn)導(dǎo)合適的宿主細(xì)胞；(2).在合適的培養(yǎng)基中培養(yǎng)的宿主細(xì)胞；(3).從培養(yǎng)基或細(xì)胞中分離、純化蛋白質(zhì)。
本發(fā)明中，具有抑癌功能的人蛋白多核苷酸序列可插入到重組表達(dá)載體中。術(shù)語“重組表達(dá)載體”指本領(lǐng)域熟知的細(xì)菌質(zhì)粒、噬菌體、酵母質(zhì)粒、植物細(xì)胞病毒、哺乳動物細(xì)胞病毒如腺病毒、逆轉(zhuǎn)錄病毒或其他載體。在本發(fā)明中適用的載體包括但不限于在細(xì)菌中表達(dá)的基于T7的表達(dá)載體；在哺乳動物細(xì)胞中表達(dá)的pMSXND表達(dá)載體和在昆蟲細(xì)胞中表達(dá)的來源于桿狀病毒的載體?？傊?，只要能在宿主體內(nèi)復(fù)制和穩(wěn)定，任何質(zhì)粒和載體都可以用。表達(dá)載體的一個重要特征是通常含有復(fù)制起點(diǎn)、啟動子、標(biāo)記基因和翻譯控制元件。
本領(lǐng)域的技術(shù)人員熟知的方法能用于構(gòu)建含具有抑癌功能的人蛋白編碼DNA序列和合適的轉(zhuǎn)錄/翻譯控制信號的表達(dá)載體。這些方法包括體外重組DNA技術(shù)、DNA合成技術(shù)、體內(nèi)重組技術(shù)等。所述的DNA序列可有效連接到表達(dá)載體中的適當(dāng)啟動子上，以指導(dǎo)mRNA合成。這些啟動子的代表性例子有大腸桿菌的lac或trp啟動子；λ噬菌體PL啟動子；真核啟動子包括CMV立即早期啟動子、早期和晚期SV40啟動子、反轉(zhuǎn)錄病毒的LTRs和其他一些已知的可控制基因在原核或真核細(xì)胞或其病毒中表達(dá)的啟動子。表達(dá)載體還包括翻譯起始用的核糖體結(jié)合位點(diǎn)和轉(zhuǎn)錄終止子。
此外，表達(dá)載體優(yōu)選地包含一個或多個選擇性標(biāo)記基因，以提供用于選擇轉(zhuǎn)化的宿主細(xì)胞的表型性狀，如真核細(xì)胞培養(yǎng)用的二氫葉酸還原酶、新霉素抗性以及綠色熒光蛋白(GFP)，或用于大腸桿菌的四環(huán)素或氨芐青霉素抗性。
包含上述的適當(dāng)DNA序列以及適當(dāng)啟動子或者控制序列的載體，可以用于轉(zhuǎn)化適當(dāng)?shù)乃拗骷?xì)胞，以使其能夠表達(dá)蛋白質(zhì)。
宿主細(xì)胞可以是原核細(xì)胞，如細(xì)菌細(xì)胞；或是低等真核細(xì)胞，如酵母細(xì)胞；或是高等真核細(xì)胞，如哺乳動物細(xì)胞。代表性例子有大腸桿菌，鏈霉菌屬；鼠傷寒沙門氏菌的細(xì)菌細(xì)胞；真菌細(xì)胞如酵母；植物細(xì)胞；果蠅S2或Sf9的昆蟲細(xì)胞；CHO、COS或Bowes黑素瘤細(xì)胞的動物細(xì)胞等。
本發(fā)明的多核苷酸在高等真核細(xì)胞中表達(dá)時，如果在載體中插入增強(qiáng)子序列時將會使轉(zhuǎn)錄得到增強(qiáng)。增強(qiáng)子是DNA的順式作用因子，通常大約有10到300個堿基對，作用于啟動子以增強(qiáng)基因的轉(zhuǎn)錄。可舉的例子包括在復(fù)制起始點(diǎn)晚期一側(cè)的100到270個堿基對的SV40增強(qiáng)子、在復(fù)制起始點(diǎn)晚期一側(cè)的多瘤增強(qiáng)子以及腺病毒增強(qiáng)子等。
本領(lǐng)域一般技術(shù)人員都清楚如何選擇適當(dāng)?shù)妮d體、啟動子、增強(qiáng)子和宿主細(xì)胞。
用重組DNA轉(zhuǎn)化宿主細(xì)胞可用本領(lǐng)域技術(shù)人員熟知的常規(guī)技術(shù)進(jìn)行。當(dāng)宿主為原核生物如大腸桿菌時，能吸收DNA的感受態(tài)細(xì)胞可在指數(shù)生長期后收獲，用CaCl2法處理，所用的步驟在本領(lǐng)域眾所周知?？晒┻x擇的是用MgCl2。如果需要，轉(zhuǎn)化也可用電穿孔的方法進(jìn)行。當(dāng)宿主是真核生物，可選用如下的DNA轉(zhuǎn)染方法磷酸鈣共沉淀法，常規(guī)機(jī)械方法如顯微注射、電穿孔、脂質(zhì)體包裝等。
獲得的轉(zhuǎn)化子可以用常規(guī)方法培養(yǎng)，表達(dá)本發(fā)明的基因所編碼的多肽。根據(jù)所用的宿主細(xì)胞，培養(yǎng)中所用的培養(yǎng)基可選自各種常規(guī)培養(yǎng)基。在適于宿主細(xì)胞生長的條件下進(jìn)行培養(yǎng)。當(dāng)宿主細(xì)胞生長到適當(dāng)?shù)募?xì)胞密度后，用合適的方法(如溫度轉(zhuǎn)換或化學(xué)誘導(dǎo))誘導(dǎo)選擇的啟動子，將細(xì)胞再培養(yǎng)一段時間。
在上面的方法中的重組多肽可包被于細(xì)胞內(nèi)、細(xì)胞外或在細(xì)胞膜上表達(dá)或分泌到細(xì)胞外。如果需要，可利用其物理的、化學(xué)的和其它特性通過各種分離方法分離和純化重組的蛋白。這些方法是本領(lǐng)域技術(shù)人員所熟知的。這些方法的例子包括但并不限于常規(guī)的復(fù)性處理、用蛋白沉淀劑處理(鹽析方法)、離心、滲透破菌、超處理、超離心、分子篩層析(凝膠過濾)、吸附層析、離子交換層析、高效液相層析(HPLC)和其它各種液相層析技術(shù)及這些方法的結(jié)合。
重組的具有抑癌功能的人蛋白或多肽有多方面的用途。這些用途包括(但不限于)直接做為藥物治療具有抑癌功能的蛋白功能低下或喪失所致的疾病，和用于篩選促進(jìn)或?qū)咕哂幸职┕δ艿牡鞍坠δ艿目贵w、多肽或其它配體。例如，抗體可用于激活或抑制具有抑癌功能的人蛋白的功能。用表達(dá)的重組具有抑癌功能的人蛋白篩選多肽庫可用于尋找有治療價值的能抑制或刺激具有抑癌功能的人蛋白功能的多肽分子。
本發(fā)明也提供了篩選藥物以鑒定提高(激動劑)或阻遏(拮抗劑)具有抑癌功能的人蛋白的藥劑的方法。激動劑提高具有抑癌功能的人蛋白刺激細(xì)胞增殖等生物功能，而拮抗劑阻止和治療與細(xì)胞過度增殖有關(guān)的紊亂如各種癌癥。例如，能在藥物的存在下，將哺乳動物細(xì)胞或表達(dá)具有抑癌功能的人蛋白的膜制劑與標(biāo)記的具有抑癌功能的人蛋白一起培養(yǎng)。然后測定藥物提高或阻遏此相互作用的能力。
具有抑癌功能的人蛋白的拮抗劑包括篩選出的抗體、化合物、受體缺失物和類似物等。具有抑癌功能的人蛋白的拮抗劑可以與具有抑癌功能的人蛋白結(jié)合并消除其功能，或是抑制具有抑癌功能的人蛋白的產(chǎn)生，或是與多肽的活性位點(diǎn)結(jié)合使多肽不能發(fā)揮生物學(xué)功能。具有抑癌功能的人蛋白的拮抗劑可用于治療用途。
在篩選作為拮抗劑的化合物時，可以將本發(fā)明蛋白加入生物分析測定中，通過測定化合物影響具有抑癌功能的蛋白和其受體之間的相互作用來確定化合物是否是拮抗劑。用上述篩選化合物的同樣方法，可以篩選出起拮抗劑作用的受體缺失物和類似物。
本發(fā)明的多肽可直接用于疾病治療，例如，各種惡性腫瘤、和細(xì)胞異常增殖等。
本發(fā)明的多肽，及其片段、衍生物、類似物或它們的細(xì)胞可以用來作為抗原以生產(chǎn)抗體。這些抗體可以是多克隆或單克隆抗體。多克隆抗體可以通過將此多肽直接注射動物的方法得到。制備單克隆抗體的技術(shù)包括雜交瘤技術(shù)，三瘤技術(shù)，人B-細(xì)胞雜交瘤技術(shù)，EBV-雜交瘤技術(shù)等。
可以將本發(fā)明的多肽和拮抗劑與合適的藥物載體組合后使用。這些載體可以是水、葡萄糖、乙醇、鹽類、緩沖液、甘油以及它們的組合。組合物包含安全有效量的多肽或拮抗劑以及不影響藥物效果的載體和賦形劑。這些組合物可以作為藥物用于疾病治療。
本發(fā)明還提供含有一種或多種容器的藥盒或試劑盒，容器中裝有一種或多種本發(fā)明的藥用組合物成分。與這些容器一起，可以有由制造、使用或銷售藥品或生物制品的政府管理機(jī)構(gòu)所給出的指示性提示，該提示反映出生產(chǎn)、使用或銷售的政府管理機(jī)構(gòu)許可其在人體上施用。此外，本發(fā)明的多肽可以與其它的治療化合物結(jié)合使用。
藥物組合物可以以方便的方式給藥，如通過局部、靜脈內(nèi)、腹膜內(nèi)、肌內(nèi)、皮下、鼻內(nèi)或皮內(nèi)的給藥途徑。具有抑癌功能的蛋白以有效地治療和/或預(yù)防具體的適應(yīng)癥的量來給藥。施用于患者的具有抑癌功能的蛋白的量和劑量范圍將取決于許多因素，如給藥方式、待治療者的健康條件和診斷醫(yī)生的判斷。
具有抑癌功能的人蛋白的多聚核苷酸也可用于多種治療目的?；蛑委熂夹g(shù)可用于治療由于具有抑癌功能的蛋白的無表達(dá)或異常/無活性的具有抑癌功能的蛋白的表達(dá)所致的細(xì)胞增殖、發(fā)育或代謝異常。重組的基因治療載體可用于治療具有抑癌功能的蛋白表達(dá)或活性異常所致的疾病。來源于病毒的表達(dá)載體如逆轉(zhuǎn)錄病毒、腺病毒、腺病毒相關(guān)病毒、單純皰疹病毒、細(xì)小病毒等可用于將具有抑癌功能的蛋白基因轉(zhuǎn)移至細(xì)胞內(nèi)。構(gòu)建攜帶具有抑癌功能的蛋白基因的重組病毒載體的方法可見于已有文獻(xiàn)(Sambrook，etal.)。另外重組具有抑癌功能的人蛋白基因可包裝到脂質(zhì)體中轉(zhuǎn)移至細(xì)胞內(nèi)。
抑制具有抑癌功能的人蛋白mRNA的寡聚核苷酸(包括反義RNA和DNA)以及核酶也在本發(fā)明的范圍之內(nèi)。核酶是一種能特異性分解特定RNA的酶樣RNA分子，其作用機(jī)制是核酶分子與互補(bǔ)的靶RNA特異性雜交后進(jìn)行核酸內(nèi)切作用。反義的RNA和DNA及核酶可用已有的任何RNA或DNA合成技術(shù)獲得，如固相磷酸酰胺化學(xué)合成法合成寡核苷酸的技術(shù)已廣泛應(yīng)用。反義RNA分子可通過編碼該RNA的DNA序列在體外或體內(nèi)轉(zhuǎn)錄獲得。這種DNA序列已整合到載體的RNA聚合酶啟動子的下游。為了增加核酸分子的穩(wěn)定性，可用多種方法對其進(jìn)行修飾，如增加兩側(cè)的序列長度，核糖核苷之間的連接應(yīng)用磷酸硫酯鍵或肽鍵而非磷酸二酯鍵。
多聚核苷酸導(dǎo)入組織或細(xì)胞內(nèi)的方法包括將多聚核苷酸直接注入到體內(nèi)組織中；或在體外通過載體(如病毒、噬菌體或質(zhì)粒等)先將多聚核苷酸導(dǎo)入細(xì)胞中，再將細(xì)胞移植到體內(nèi)等。
本發(fā)明的多肽還可用作肽譜分析，例如，多肽可用物理的、化學(xué)或酶進(jìn)行特異性切割，并進(jìn)行一維或二維或三維的凝膠電泳分析。
本發(fā)明還提供了針對具有抑癌功能的人蛋白抗原決定簇的抗體。這些抗體包括(但不限于)多克隆抗體、單克隆抗體、嵌合抗體、單鏈抗體、Fab片段和Fab表達(dá)文庫產(chǎn)生的片段。這些抗體可用常規(guī)方法制備。抗具有抑癌功能的人蛋白的抗體可用于免疫組織化學(xué)技術(shù)中，檢測活檢標(biāo)本中的具有抑癌功能的人蛋白。
與具有抑癌功能的人蛋白結(jié)合的單克隆抗體也可用放射性同位素標(biāo)記，注入體內(nèi)可跟蹤其位置和分布。本發(fā)明中的抗體可用于治療或預(yù)防與具有抑癌功能的人蛋白相關(guān)的疾病。給予適當(dāng)劑量的抗體可以刺激或阻斷具有抑癌功能的人蛋白的產(chǎn)生或活性。
抗體也可用于設(shè)計針對體內(nèi)某一特殊部位的免疫毒素。如具有抑癌功能的人蛋白高親和性的單克隆抗體可與細(xì)菌或植物毒素(如白喉毒素，蓖麻蛋白，紅豆堿等)共價結(jié)合。
多克隆抗體的生產(chǎn)可用具有抑癌功能的人蛋白或多肽免疫動物，如家兔，小鼠，大鼠等。多種佐劑可用于增強(qiáng)免疫反應(yīng)，包括但不限于弗氏佐劑等。
具有抑癌功能的人蛋白單克隆抗體可用雜交瘤技術(shù)生產(chǎn)(Kohler and Milstein.Nature，1975，256495-497)。將人恒定區(qū)和非人源的可變區(qū)結(jié)合的嵌合抗體可用已有的技術(shù)生產(chǎn)(Morrison et al，PNAS，1985，816851)。而已有的生產(chǎn)單鏈抗體的技術(shù)(U.S.PatNo.4946778)也可用于生產(chǎn)抗具有抑癌功能的人蛋白的單鏈抗體。
能與本發(fā)明蛋白結(jié)合的多肽分子可通過篩選由各種可能組合的氨基酸結(jié)合于固相物組成的隨機(jī)多肽庫而獲得。篩選時，必須對具有抑癌功能的人蛋白分子進(jìn)行標(biāo)記。
本發(fā)明還涉及定量和定位檢測具有抑癌功能的人蛋白水平的診斷試驗(yàn)方法。這些試驗(yàn)是本領(lǐng)域所熟知的，且包括FISH測定和放射免疫測定。試驗(yàn)中所檢測的具有抑癌功能的人蛋白水平，可以用作解釋具有抑癌功能的人蛋白在各種疾病中的重要性和用于診斷具有抑癌功能的蛋白起作用的疾病。
具有抑癌功能的蛋白的多聚核苷酸可用于具有抑癌功能的蛋白相關(guān)疾病的診斷和治療。在診斷方面，具有抑癌功能的蛋白的多聚核苷酸可用于檢測具有抑癌功能的蛋白的表達(dá)與否或在疾病狀態(tài)下具有抑癌功能的蛋白的異常表達(dá)。如具有抑癌功能的蛋白DNA序列可用于對活檢標(biāo)本的雜交以判斷具有抑癌功能的蛋白的表達(dá)異常。雜交技術(shù)包括Southern印跡法，Northern印跡法、原位雜交等。這些技術(shù)方法都是公開的成熟技術(shù)，相關(guān)的試劑盒都可從商業(yè)途徑得到。本發(fā)明的多核苷酸的一部分或全部可作為探針固定在微陣列(Microarray)或DNA芯片(又稱為“基因芯片”)上，用于分析組織中基因的差異表達(dá)分析和基因診斷。用具有抑癌功能的蛋白特異的引物進(jìn)行RNA-聚合酶鏈反應(yīng)(RT-PCR)體外擴(kuò)增也可檢測具有抑癌功能的蛋白的轉(zhuǎn)錄產(chǎn)物。
檢測具有抑癌功能的蛋白基因的突變也可用于診斷具有抑癌功能的蛋白相關(guān)的疾病。具有抑癌功能的蛋白突變的形式包括與正常野生型具有抑癌功能的蛋白DNA序列相比的點(diǎn)突變、易位、缺失、重組和其它任何異常等?？捎靡延械募夹g(shù)如Southern印跡法、DNA序列分析、PCR和原位雜交檢測突變。另外，突變有可能影響蛋白的表達(dá)，因此用Northern印跡法、Western印跡法可間接判斷基因有無突變。
本發(fā)明的序列對染色體鑒定也是有價值的。這些序列會特異性地針對某條人染色體具體位置且并可以與其雜交。目前，需要鑒定染色體上的各基因的具體位點(diǎn)。然而現(xiàn)在只有很少的基于實(shí)際序列數(shù)據(jù)(重復(fù)多態(tài)性)的染色體標(biāo)記物可用于標(biāo)記染色體位置。為了將這些序列與疾病相關(guān)基因相關(guān)聯(lián)。第一步就是將本發(fā)明DNA序列定位于染色體上。
簡而言之，根據(jù)cDNA制備PCR引物(優(yōu)選15-35bp)，可以將序列定位于染色體上。然后，將這些引物用于PCR篩選含各條人染色體的體細(xì)胞雜合細(xì)胞。只有那些含有相應(yīng)于引物的人基因的雜合細(xì)胞會產(chǎn)生擴(kuò)增的片段。
體細(xì)胞雜合細(xì)胞的PCR定位法，是將DNA定位到具體染色體的快捷方法。使用本發(fā)明的的寡核苷酸引物，通過類似方法，可利用一組來自特定染色體的片段或大量基因組克隆而實(shí)現(xiàn)亞定位?？捎糜谌旧w定位的其它類似策略包括原位雜交、用標(biāo)記的流式分選的染色體預(yù)篩選和雜交預(yù)選，從而構(gòu)建染色體特異的cDNA庫。
將cDNA克隆與中期染色體進(jìn)行熒光原位雜交(FISH)，可以在一個步驟中精確地進(jìn)行染色體定位。此技術(shù)的綜述，參見Verma等，Human Chromosomesa Manual of BasicTechniques，Pergamon Press，New York(1988)。
一旦序列被定位到準(zhǔn)確的染色體位置，此序列在染色體上的物理位置就可以與基因圖數(shù)據(jù)相關(guān)聯(lián)。這些數(shù)據(jù)可見于例如，V.Mckusick，Mendelian Inheritance in Man(可通過與Johns Hopkins University Welch Medical Library聯(lián)機(jī)獲得)。然后可通過連鎖分析，確定基因與業(yè)已定位到染色體區(qū)域上的疾病之間的關(guān)系。
接著，需要測定患病和未患病個體間的cDNA或基因組序列差異。如果在一些或所有的患病個體中觀察到某突變，而該突變在任何正常個體中未觀察到，則該突變可能是疾病的病因。比較患病和未患病個體，通常涉及首先尋找染色體中結(jié)構(gòu)的變化，如從染色體水平可見的或用基于cDNA序列的PCR可檢測的缺失或易位。
本發(fā)明的具有抑癌功能的蛋白核苷酸全長序列或其片段通?？梢杂肞CR擴(kuò)增法、重組法或人工合成的方法獲得。對于PCR擴(kuò)增法，可根據(jù)本發(fā)明所公開的有關(guān)核苷酸序列，尤其是開放閱讀框序列來設(shè)計引物，并用市售的cDNA庫或按本領(lǐng)域技術(shù)人員已知的常規(guī)方法所制備的cDNA庫作為模板，擴(kuò)增而得有關(guān)序列。當(dāng)序列較長時，常常需要進(jìn)行兩次或多次PCR擴(kuò)增，然后再將各次擴(kuò)增出的片段按正確次序拼接在一起。
一旦獲得了有關(guān)的序列，就可以用重組法來大批量地獲得有關(guān)序列。這通常是將其克隆入載體，再轉(zhuǎn)入細(xì)胞，然后通過常規(guī)方法從增殖后的宿主細(xì)胞中分離得到有關(guān)序列。
此外，還可用人工合成的方法來合成有關(guān)序列，尤其是片段長度較短時。通常，通過先合成多個小片段，然后再進(jìn)行連接可獲得序列很長的片段。
目前，已經(jīng)可以完全通過化學(xué)合成來編碼本發(fā)明蛋白(或其片段，或其衍生物)的DNA序列。然后可將該DNA序列引入本領(lǐng)域中的各種DNA分子(如載體)和細(xì)胞中。此外，還可通過化學(xué)合成將突變引入本發(fā)明蛋白序列中。
此外，由于本發(fā)明的具有抑癌功能的蛋白具有源自人的天然氨基酸序列，因此，與來源于其他物種的同族蛋白相比，預(yù)計在施用于人時將具有更高的活性和/或更低的副作用(例如在人體內(nèi)的免疫原性更低或沒有)。
下面結(jié)合具體實(shí)施例，進(jìn)一步闡述本發(fā)明。應(yīng)理解，這些實(shí)施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。下列實(shí)施例中未注明具體條件的實(shí)驗(yàn)方法，通常按照常規(guī)條件如Sambrook等人，分子克隆實(shí)驗(yàn)室手冊(New YorkCold Spring Harbor LaboratoryPress，1989)中所述的條件，或按照制造廠商所建議的條件。
實(shí)施例1cDNA基因的獲得及對小鼠NIH/3T3細(xì)胞克隆形成的抑制作用FP3361、FP7072和FP8080來自于用常規(guī)方法構(gòu)建的人胎兒cDNA文庫。取3、6、9月齡的胎兒組織，用Trizol試劑(GIBCO BRL公司)按廠方說明書提取總RNA，用mRNA提純試劑盒(Pharmacia公司)提取mRNA。用pCMV-script TMXR cDNA文庫構(gòu)建試劑盒(Stratagene公司)構(gòu)建上述mRNA的cDNA文庫。其中反轉(zhuǎn)錄酶改用MMLV-RT-Superscript II(GIBCO BRL)，反轉(zhuǎn)錄反應(yīng)在42℃進(jìn)行。轉(zhuǎn)化XL 10-Gold感受細(xì)胞，獲得了1×106cfu/μg滴度的cDNA文庫。第一輪隨機(jī)挑取cDNA克隆，其后以高豐度cDNA克隆和已證明有抑制癌細(xì)胞生長功能的cDNA克隆為探針，雜交篩選cDNA文庫，挑取弱陽性及陰性克隆。用Qiagen 96孔板質(zhì)粒抽提試劑盒，按廠家說明書進(jìn)行質(zhì)粒DNA的提取。質(zhì)粒DNA和空載體同時轉(zhuǎn)染小鼠NIH/3T3細(xì)胞。100ng DNA酒精沉淀干燥后，加6μlH2O溶解，待轉(zhuǎn)染。每份DNA樣品中加0.74μl脂質(zhì)體及9.3μl無血清培液，混勻后，室溫放置10分鐘。每管中加150μl無血清培液，均分加入3孔生長于96孔板的小鼠NIH/3T3細(xì)胞中，37℃放置2小時，每孔再加50μl無血清培液，37℃24小時。每孔換100μl全培液，37℃24小時，換含G418的全培液100μl，37℃24-48小時，邊觀察，邊換G418濃度不等的培液。約2-3次后，直到鏡檢細(xì)胞有克隆形成，計數(shù)。發(fā)現(xiàn)上述克隆有抑制細(xì)胞克隆形成作用，結(jié)果如下表所示。
cDNA克隆轉(zhuǎn)染細(xì)胞(3T3)克隆形成情況

對cDNA克隆采用雙脫氧終止法，在ABI377 DNA自動測序儀上測定其一端近500bp的核苷酸序列。分析后，確定為新基因克隆，進(jìn)行另一端測序，如仍未獲得全長cDNA序列，則設(shè)計引物，再次進(jìn)行測序，直到獲得全長序列(SEQ ID NO1、4、7)。
實(shí)施例2從胎盤或胎兒cDNA中PCR獲得全長基因取3、6、9月齡的胎兒組織(FP克隆)，用Trizol試劑(GIBCO BRL公司)按廠方說明書提取總RNA，用mRNA提純試劑盒(Pharmacia公司)提取mRNA。用MMLV-RT-Superscript II(GIBCO BRL)，反轉(zhuǎn)錄酶在42℃進(jìn)行反轉(zhuǎn)錄反應(yīng)，獲得胎盤或胎兒cDNA。利用各個基因的特異引物(如下表所示)，按97℃3′，1個循環(huán)。94℃30″，60℃30″，72℃1′，共35個循環(huán)；72℃10′，1個循環(huán)進(jìn)行PCR擴(kuò)增，獲得含有完整開放閱讀框序列的各蛋白基因的擴(kuò)增產(chǎn)物。擴(kuò)增產(chǎn)物經(jīng)測序驗(yàn)證，與實(shí)施例1測得的序列相符，隨后用常規(guī)技術(shù)將擴(kuò)增產(chǎn)物轉(zhuǎn)入宿主細(xì)胞，獲得重組蛋白(SEQ ID NO3、6、9)。
基因特異引物

注括號內(nèi)為引物在各基因DNA序列中的對應(yīng)位置。
實(shí)施例3cDNA克隆序列分析1.FP3361蛋白A核苷酸序列(SEQ ID NO1)長度3046個堿基1 GGTTTCACCA TGATGGTCAG GCTGGTCAAG ATCTCCTGAC CTCAAGTGAT CTGCCCGCCT61 CGGCCTCCCA AAGTGCTGGG ATTACAGACA TGAACCACAA CACCTGCCAA GCCCAGGTGT121 TTTGAATCCA GCACGGGCAA TGGCAAGACC CTGTCCCAAC AAACAAAAAA ACACTGGTGC181 CTGAGGCCCA CCCCGAGAGA TTCTGATTGA GTTGATTTGG ATTTGAATTA TCTTTAAAAT241 TTTGGATGTG AATTTTTTTT TTTTTTCTTG GAATGGAGTT TCACTCTTGT TCCCCAGGCT301 GGAGTGCAAC GGGACGATCT TGGCTCACCG CAACCTCCGC CTACTGGGTT CAAGCCATTC361 TCCTGCCTCA GCTTCCCAAG TAGCTGGGAT TACAGGCATG TGCTACCATG CCCAGCTAAT421 TTTGTATTTT TAGTAGAGAC AGGGTTTCTC CATGTTGCTC AGGCTGGTCT TGAACTCCTG481 ACCTCAGGTG ATCCGCCCGC CTCGGACTCC CAAAGTGCTG GGATTACAGG CATGAGCCAC541 CATGCCTGGC CGGATGTGAA TTATCTTAAA AATTTTCAGG TAATTCTAAT GGGCCAAGGT601 TGAGAACCCC TGCTCTGGGC CCATCCGAGC ACCAGGCTGT CACAAACGCA TGCATGCACT661 CACGCCCGTG GGCTTGGGGG GCTTCGGAAA TGTGCTTCTG CTTTTTTGAG ATGGGGTCTT721 TCTGTTGCCC ATCCCGGAGC ACAGTGGCAC GATCACAGCT CACTGCAGCC TCGACCTCCT781 GGGCTCAGGT GATCCTCCCG CCTCAGCCTC CTGAGTGTCT GCTTCTGGTT TTCATGATGA841 CCTGGGGCCC AGGCATACTA CACTTGTGCT GTTCAGGGGC CAGTCCTGCA CCAGGAGCCC901 ATCAGCCACA GCTCCGCCGA GAAGCACTGA TATGCAGAGC TAAGCAGCTT TGTTTCCACG961 TGGATCCTGC GTAGGTTTTC TTGGTCCATC CGTAGACACC GCACTCCTGC AGAGGATCTT1021 CTCGGGATGC CCCACTGTCT CTGTTTTCCC TCTTCACTGA ACACTCAGTC GGGGCTCGCC1081 ATGATGCCTC TGTGTCTGCT GGCTTCTCCC CCATTGGAAC AGCCTTCTTG GCACGCCACA1141 CTGCTAGCTG CTGGGCACTG TGCTTTCTGC CTTTACCGTT CTGCCGTGAT GTTGCCAAAA1201 TAGCAGCAAC AACAACAACA ACAAAGGCTG GGCACCTGGC TCATGCCTGT ATTCCCAGCA1261 GTTCGAGATC AGCCTGGGCA ACATGGTGAG ACCCTATCTC TACAAAAATA AAAAATGAAA1321 TGAGCTGGGT GGGGTGGCGC ATGCATGCCT GTGGTCCCAG CTACTTGGGA GGCTGAGGTC1381 GGAAGCTCGC TGGTCGGAAG ATCGCTGGAG CTTAGCCTTG AGGTCAAGGT TGCAGTGAGC1441 CGAGATTACA TCACTGCACT CCAGCGTGGG AGACAGAGAC CCTGTATTAA CAAACAAAAA1501 CACAAACCAC AAAGGGCAGG TCTGAAACTG CCATTTAAAA AAAAATTTGA TAAACTTAAA1561 AAAATATATA TCCACAGATG CAGGTGAAGA ACCTGTTGTC TTCCTCAAGC CTCTTTTTCA1621 CCCATGGGTG GAAATGGTGC CCTGGACACC CAGGCCCACG AGGTCTTTGC GTGGGGTCCC1681 TACACAGGGC TTTAGCTTAC ACTGTGCTGC CCTCCTGTCC CCCGAGTTCC CAGTCTGTCA1741 AAATCCAACC TGGTCTCCCA GGCCCAGGGC AAATGCCACC TCCTCCATGA AGCCTGCCAC1801 ATCCTTTGCA CACCCTTGGG CGCTGACCTT GTTCTCCCAG CGCACAGGCA CGGGTAGTTT1861 GCCCCTGTAG TAGTAACTCA GGCACAAAAC GAACTCTTGC TGAGGCTCGG CCGCGCAGAG1921 CTGAGGGTTG CCGCTTCCAG GTTCAAGTGC ATTTTGAGTT TCATTCCCAG CTTCCTTCTT1981 TTTCTGGTCT TTAATTTCTT CTCCGGATTA GGTCCCACTC AATGCTTTCC TTCTCAATTT2041 CCAAAAGAGT ATGGTCAGAG CCAGCAGCAC ACCACCTTCC CCATGGGTGG GGGGGGGGCC2101 AGCCTGTGGC GGGGGTGCGG GTCCCATCTT TTCGAAGGAA TTGACCCACA GTGGGCGGGT2161 CCACCTTTGA CCTTGCCCCA GGGAGCGCAG ACAGAAAAAA GATCCTTGCT TAGTTTGAGG2221 GGCCGCTGGG GTGCTCGGTT TGTCTTCAGA GGCCTGTCTG TAACACCAAT GCCAACCCGG2281 TGGCACTGAC TGGTCACCCT GAAGGCCACG GCCAGTGTCC TAGGAAGGGA CTCAATTTCT2341 AGCTGTGCCA CCTGAGATTC TGGGGTTAGG CTGGTTGTGC TTCTGAAGTT CCACTGTGCT2401 CAAAGTGCTT GGTGAAAGTT AGCGAAGGTG ATTTTACAAA AATAGATGCA TAAAATGTCT2461 AGGAAACACA AAAAATCCTC ATTACTCTTC TCTCCAAATA TTTTTTAAGC CCCAACTGGA2521 CCCTAGGCAA AAGTGAGTGG CACTCCTCTG CCAGGACTCC AGGCAAGCCC CGGCATCTTC2581 TTGCTGCCGT CCCAGACAAC AGAAGTTACC AGATGAACAG ACTTGGATGG GCCACGGGGG2641 TGGAGAGCTG GAAAGCTTGG CTGTGCCTCT CGATGATGAT TAAGATTTCA ATATTTACAG2701 CAAAACCACA AAGCAAATGA TAGAATAAAG CAAAACAATG GAAAATGTGA GTTCACTCGT2761 GAGAGAGGTA CGTATGTGAG CTCTGAGGAA ATTACAGAGG GAACGCATGC AGCGGGACAG2821 CTCTCCCAAT CGCAGCGTGC AAAGTAGACA TCCATAGTGT CTTTTGAAAA ATGAAAAACA2881 CATTACTTTG AACAGCCAAG AAAAAAATTG CAATTTATTA AGATTCAATA AAGCGTTGTA2941 CTTTCGAAAG CCAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA3001 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAB氨基酸序列(SEQ ID NO3)長度106個氨基酸1 MHSRPWAWGA SEMCFCFFEM GSFCCPSRST VARSQLTAAS TSWAQVILPP QPPECLLLVF61MMTWGPGILH LCCSGASPAP GAHQPQLRRE ALICRAKQLC FHVDPAC.核苷酸及氨基酸組合序列(SEQ ID NO2)克隆號和蛋白名稱FP3361起始編碼子654 ATG終止編碼子972 TAG蛋白質(zhì)分子量11650.08Da1 GG TTT CAC CAT GAT GGT CAG GCT GGT CAA GAT CTC CTG ACC TCA AGT GAT CTG CCC GCC 5960 TCG GCC TCC CAA AGT GCT GGG ATT ACA GAC ATG AAC CAC AAC ACC TGC CAA GCC CAG GTG 119120 TTT TGA ATC CAG CAC GGG CAA TGG CAA GAC CCT GTC CCA ACA AAC AAA AAA ACA CTG GTG 179180 CCT GAG GCC CAC CCC GAG AGA TTC TGA TTG AGT TGA TTT GGA TTT GAA TTA TCT TTA AAA 239240 TTT TGG ATG TGA ATT TTT TTT TTT TTT CTT GGA ATG GAG TTT CAC TCT TGT TCC CCA GGC 299300 TGG AGT GCA ACG GGA CGA TCT TGG CTC ACC GCA ACC TCC GCC TAC TGG GTT CAA GCC ATT 359360 CTC CTG CCT CAG CTT CCC AAG TAG CTG GGA TTA CAG GCA TGT GCT ACC ATG CCC AGC TAA 419420 TTT TGT ATT TTT AGT AGA GAC AGG GTT TCT CCA TGT TGC TCA GGC TGG TCT TGA ACT CCT 479480 GAC CTC AGG TGA TCC GCC CGC CTC GGA CTC CCA AAG TGC TGG GAT TAC AGG CAT GAG CCA 539540 CCA TGG CTG GCC GGA TGT GAA TTA TCT TAA AAA TTT TCA GGT AAT TCT AAT GGG CCA AGG 599600 TTG AGA ACC CCT GCT CTG GGC CCA TCC GAG CAC CAG GCT GTC ACA AAC GCA TGC ATG CAC 6591 Met His 2660 TCA CGC CCG TGG GCT TGG GGG GCT TCG GAA ATG TGC TTC TGC TTT TTT GAG ATG GGG TCT 7193 Ser Arg Pro Trp Ala Trp Gly Ala Ser Glu Met Cys Phe Cys Phe Phe Glu Met Gly Ser 22720 TTC TGT TGC CCA TCC CGG AGC ACA GTG GCA CGA TCA CAG CTC ACT GCA GCC TCG ACC TCC 77923 Phe Cys Cys Pro Ser Arg Ser Thr Val Ala Arg Ser Gln Leu Thr Ala Ala Ser Thr Ser 42780 TGG GCT CAG GTG ATC CTC CCG CCT CAG CCT CCT GAG TGT CTG CTT CTG GTT TTC ATG ATG 83943 Trp Ala Gln Val Ile Leu Pro Pro Gln Pro Pro Glu Cys Leu Leu Leu Val Phe Met Met 62840 ACC TGG GGC CCA GGC ATA CTA CAC TTG TGC TGT TCA GGG GCC AGT CCT GCA CCA GGA GCC 89963 Thr Trp Gly Pro Gly Ile Leu His Leu Cys Cys Ser Gly Ala Ser Pro Ala Pro Gly Ala 82900 CAT CAG CCA CAG CTC CGC CGA GAA GCA CTG ATA TGC AGA GCT AAG CAG CTT TGT TTC CAC 95983 His Gln Pro Gln Leu Arg Arg Glu Ala Leu Ile Cys Arg Ala Lys Gln Leu Cys Phe His 102960 GTG GAT CCT GCG TAG GTT TTC TTG GTC CAT CCG TAG ACA CCG CAC TCC TGC AGA GGA TCT1019103 Val Asp Pro Ala *** 1071020 TCT CGG GAT GCC CCA CTG TCT CTG TTT TCC CTC TTC ACT GAA CAC TCA GTC GGG GCT CGC10791080 CAT GAT GCC TCT GTG TCT GCT GGC TTC TCC CCC ATT GGA ACA GCC TTC TTG GCA CGG CAC11391140 ACT GCT AGC TGC TGG GCA CTG TGC TTT CTG CCT TTA CCG TTC TGC CGT GAT GTT GCC AAA11991200 ATA GCA GCA ACA ACA ACA ACA ACA AAG GCT GGG CAC CTG GCT CAT GCC TGT ATT CCC AGC12591260 AGT TCG AGA TCA GCC TGG GCA ACA TGG TGA GAC CCT ATC TCT ACA AAA ATA AAA AAT GAA13191320 ATG AGC TGG GTG GGG TGG CGC ATG CAT GCC TGT GGT CCC AGC TAC TTG GGA GGC TGA GGT13791380 CGG AAG CTC GCT GGT CGG AAG ATC GCT GGA GCT TAG CCT TGA GGT CAA GGT TGC AGT GAG14391440 CCG AGA TTA CAT CAC TGC ACT CCA GCG TGG GAG ACA GAG ACC CTG TAT TAA CAA ACA AAA14991500 ACA CAA ACC ACA AAG GGC AGG TCT GAA ACT GCC ATT TAA AAA AAA ATT TGA TAA ACT TAA15591560 AAA AAT ATA TAT CCA CAG ATG CAG GTG AAG AAC CTG TTG TCT TCC TCA AGC CTC TTT TTC16191620 ACC CAT GGG TGG AAA TGG TGC CCT GGA CAC CCA GGC CCA CGA GGT CTT TGC GTG GGG TCC16791680 CTA CAC AGG GCT TTA GCT TAC ACT GTG CTG CCC TCC TGT CCC CCG AGT TCC CAG TCT GTC17391740 AAA ATC CAA CCT GGT CTC CCA GGC CCA GGG CAA ATG CCA CCT CCT CCA TGA AGC CTG CCA17991800 CAT CCT TTG CAC ACC CTT GGG CGC TGA CCT TGT TCT CCC AGC GCA CAG GCA CGG GTA GTT18591860 TGC CCC TGT AGT AGT AAC TCA GGC ACA AAA CGA ACT CTT GCT GAG GCT CGG CCG CGC AGA19191920 GCT GAG GGT TGC CGC TTC CAG GTT CAA GTG CAT TTT GAG TTT CAT TCC CAG CTT CCT TCT19791980 TTT TCT GGT CTT TAA TTT CTT CTC CGG ATT AGG TCC CAC TCA ATG CTT TCC TTC TCA ATT20392040 TCC AAA AGA GTA TGG TCA GAG CCA GCA GCA CAC CAC CTT CCC CAT GGG TGG GGG GGG GGC20992100 CAG CCT GTG GCG GGG GTG CGG GTC CCA TCT TTT CGA AGG AAT TGA CCC ACA GTG GGC GGG21592160 TCC ACC TTT GAC CTT GCC CCA GGG AGC GCA GAC AGA AAA AAG ATC CTT GCT TAG TTT GAG22192220 GGG CCG CTG GGG TGC TCG GTT TGT CTT CAG AGG CCT GTC TGT AAC ACC AAT GCC AAC CCG22792280 GTG GCA CTG ACT GGT CAC CCT GAA GGC CAC GGC CAG TGT CCT AGG AAG GGA CTC AAT TTC23392340 TAG CTG TGC CAC CTG AGA TTC TGG GGT TAG GCT GGT TGT GCT TCT GAA GTT CCA CTG TGC23992400 TCA AAG TGC TTG GTG AAA GTT AGC GAA GGT GAT TTT ACA AAA ATA GAT GCA TAA AAT GTC24592460 TAG GAA ACA CAA AAA ATC CTC ATT ACT CTT CTC TCC AAA TAT TTT TTA AGC CCC AAC TGG25192520 ACC CTA GGC AAA AGT GAG TGG CAC TCC TCT GCC AGG ACT CCA GGC AAG CCC CGG CAT CTT25792580 CTT GCT GCC GTC CCA GAC AAC AGA AGT TAC CAG ATG AAC AGA CTT GGA TGG GCC ACG GGG26392640 GTG GAG AGC TGG AAA GCT TGG CTG TGC CTC TCG ATG ATG ATT AAG ATT TCA ATA TTT ACA26992700 GCA AAA CCA CAA AGC AAA TGA TAG AAT AAA GCA AAA CAA TGG AAA ATG TGA GTT CAC TCG27592760 TGA GAG AGG TAC GTA TGT GAG CTC TGA GGA AAT TAC AGA GGG AAC GCA TGC AGC GGG ACA28192820 GCT CTC CCA ATC GCA GCG TGC AAA GTA GAC ATC CAT AGT GTC TTT TGA AAA ATG AAA AAC28792880 ACA TTA CTT TGA ACA GCC AAG AAA AAA ATT GCA ATT TAT TAA GAT TCA ATA AAG CGT TGT29392940 ACT TTC GAA AGC CAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA29993000 AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AA 30462.FP7072A核苷酸序列(SEQ ID NO4)長度2224個堿基1 GGGACCTGGG GGCTGTGGCC GGGGGCGGCC GTTGACCTGG TGACCGCGGC GCCGCCCCAG61 ACCGGGGGCG CAGTCCCACT CGCTCCGAGC CCCGGTCCCC CAAGCCTCCC TCCCGGGTAC121 CTGGGGCCGC GCCCGCCCTG CGCCCAGCTC CGCCCTCCGT CGGCCCAGGC CTGACAGAGC181 CCGGCAGCCA TGAGTGCCAA CCCCCGGTGG GACATCAGCA GGGCGCTGGG GGTGGCCAAG241 CTCTTCCACC TGGTGTGCGG GGTGCGGGAA GCCTGCGTGA CCCCGTTCCT GACCCTTTAC301 CTGAGGCACC TGGGCTTGGC CGCGCCCTGG GTGGGCACCC TAATGGGAAC CAAGCACCTA361 ATCGCTGCCT TCTGGGCTCC CGTCTGTGCC TTCCTGGCCA AAAGCTACCG GAAAAGGAGA421 GCGCTTCTGA TCGGCTCCCT GCTCGGCTCG GTGGGGGCCA GCCTGCTGAT GGTCCTGGTC481 CCACCGGTAG ACAAAAATCG GGTGCACTTC CCTTGTAATG GAAGCAGCGG CCTGACCAGC541 ACAGACGCAC TCCCGGGGGT CACGCTACCT GTGAACATCA CCTCGGCCCA AGAGTCTGCC601 TCCAGCCACC CAGCCAAGAG GACTGCAGAG GTGGAAATGC CTGGCTTCAG AAACCCACCT661 GGTGAAAGTG ACCGAGAAAC TTTCCGTGAT CTGCACGTCT ACTTAGCGCC CTCCGTTGAA721 GGAGCTAGGA CCACATCCCA AGCTCTCCTC CATCCTGTCA CTTCGGGGCT GAAAGATCAT781 CCCTGGGAAG TTACTTTTGA GGTGGTCAAG ACAGCCCTCC CCTTGCTTCC TGGGGGGAAA841 GGGCCCGGGA ATCCAGCCAA TTTGTCAGGG ACCAAGGGGA AAGCCTGGGC TTTTGACCTG901 TCCTTGGAGG CGTTGCGGCG GACTTTTATC CTCTCCTTGG GGTCCGTGGC GTTCTGGGAG961 CTGCTGACAG CGCCTCTGGA GCAGGTGGCA GATGACAGCC TTTATGAGTT CCTGGATTTT1021 GTGGATGCCA CTGACCGATA CAGAAGCCTG TGGGTCTGGA GGTTGCTGGG CATGTCGGCA1081 GGCGTGTGTG GCATCACAGC CTTGGTGGGG CAGCTGGACT GCTTCCTGAT GACCAGTGGC1141 CCCCGAGGTG TGGTCCACTT CTATGGGTAC TCGGTGGTCA GCACCCTGGC CTTACTGGTG1201 AGCATTGCCT TTCCCATTCC CATCTGTCAG CAGTGGGAGC CCAGCTACAA AAGGGTCAAA1261 GCACTGTCCA TTGTGGGGGG GGTGACCCCC ACCTCATTCT CCTCGCCTCC ACCACTGTTT1321 TGGTAGGAGC CATCGTCAGT ACTGTCCAGA ACTTTCTGTT CTGGCACATG AAGGACCATG1381 GGAGCGGCGA GCTGGTCATG GGTTTCTCGG TCGCCCTCAG CTTGCTGGGG GAAATTCTGC1441 TTCATCCGTT CAAAGCTACA TTGCTTAGGA AACTGTCCAG GACGGGCCTG GTGGGGCTGG1501 GGCTGAGCTG CCTCGCTGGG CAGCTGCTGT ACTACTCTTT CCTCTGGAGC TGGTGGTCCG1561 TCCTCCCCAT TCAGATCTTG AGTGCCATTA GCAACAGAGC TTTGTGGTGG GCTGTGGGGG1621 CCTCAGTAGA GGACCTGGCC ACTCCCCGCA TGGAGAGGGC TCTGAGTGCC TTGTTCCGAG1681 GCCACTTTTA CGGGAGTGGC TGTAGCCTGG GCAGCTTTGT CGGGGGCTTC GTGGTGATGC1741 GCTTCAGCCT GGCTGTGCTC TACCAGGCCT GCTGTGTGGC CCTGTTGCTC TGGTTGGCCT1801 TGCTCCTGTC CATACAGCGG AGGCTGCCCC GAGAGCGGAA AATCAAGTAC TCGAAGCTGC1861 TGTCCATGGA GGTGAGTGAC ACCAGTGACT CTGAGCAGGG GACAGAACAG GACTGGCTTG1921 TGAAGGCCAT GAGGGAGGAA CACTCAGACT GAAAGGGCTG AGAAATCCAG AGTGTGCTGA1981 TCCAGCAAGG AACGAATGGA CTGAACAAAA CTCAGCCTGC TGAGGACAGA AACCTGCCCT2041 GGACTGCTGG GAGCCGGGGA AGAGAGGATG GGTCTGTGCT GAAGGCCCAA CAGGATCATC2101 TCATTGCATG ATTTTCTTTA CTTTTGAAGT AAAAGGAGAT TTAACTTTTT GCCAATCTTT2161 TTTAGATAAT GGAGGAAGAA TACATTTGCT TTTTAAAAAG TTAAAAAAAA AAAAAAAAAA2221 AAAAB氨基酸序列(SEQ ID NO6)長度378個氨基酸1 MSANPRWDIS RALGVAKLFH LVCGVREACV TPFLTLYLRQ LGLAAPWVGT LMGTKHLIAA61 FWAPVCAFLA KSYRKRRALL IGSLLGSVGA SLLMVLVPPV DKNRVHFPCN GSSGLTSTDA121 LPGVTLPVNI TSAQESASSH PAKRTAEVEM PGFRNPPGES DRETFRDLHV YLAPSVEGAR181 TTSQALLHPV TSGLKDHPWE VTFEVVKTAL PLLPGGKGPG NPANLSGTKG KAWAFDLSLE241 ALRRTFILSL GSVAFWELLT APLEQVADDS LYEFLDFVDA TDRYRSLWVW RLLGMSAGVC301 GITALVGQLD CFLMTSGPRG VVHFYGYSVV STLALLVSIA FPIPICQQWE PSYKRVKALS361 IVGGVTPTSF SSPPPLFWC.核苷酸及氨基酸組合序列(SEQ ID NO5)克隆號和蛋白名稱FP7072起始編碼子190 ATG終止編碼子1324 TAG蛋白質(zhì)分子量40874.15Da1 GGG ACC TGG GGG CTG TGG CCG GGG GCG GCC GTT GAC CTG GTG ACC GCG GCG CCG CCC CAG 6061 ACC GGG GGC GCA GTC CCA CTC GCT CCG AGC CCC GGT CCC CCA AGC CTC CCT CCC GGG TAC 120121 CTG GGG CCG CGC CCG CCC TGC GCC CAG CTC CGC CCT CCG TCG GCC CAG GCC TGA CAG AGC 180181 CCG GCA GCC ATG AGT GCC AAC CCC CGG TGG GAC ATC AGC AGG GCG CTG GGG GTG GCC AAG 2401 Met Ser Ala Asn Pro Arg Trp Asp Ile Ser Arg Ala Leu Gly Val Ala Lys 17241 CTC TTC CAC CTG GTG TGC GGG GTG CGG GAA GCC TGC GTG ACC CCG TTC CTG ACC CTT TAC 30018 Leu Phe His Leu Val Cys Gly Val Arg Glu Ala Cys Val Thr Pro Phe Leu Thr Leu Tyr 37301 CTG AGG CAG CTG GGC TTG GCC GCG CCC TGG GTG GGC ACC CTA ATG GGA ACC AAG CAC CTA 36038 Leu Arg Gln Leu Gly Leu Ala Ala Pro Trp Val Gly Thr Leu Met Gly Thr Lys His Leu 57361 ATC GCT GCC TTC TGG GCT CCC GTC TGT GCC TTC CTG GCC AAA AGC TAC CGG AAA AGG AGA 42058 Ile Ala Ala Phe Trp Ala Pro Val Cys Ala Phe Leu Ala Lys Ser Tyr Arg Lys Arg Arg 77421 GCG CTT CTG ATC GGC TCC CTG CTC GGC TCG GTG GGG GCC AGC CTG CTG ATG GTC CTG GTC 48078 Ala Leu Leu Ile Gly Ser Leu Leu Gly Ser Val Gly Ala Ser Leu Leu Met Val Leu Val 97481 CCA CGG GTA GAC AAA AAT GGG GTG CAC TTC CCT TGT AAT GGA AGC AGC GGC CTG ACC AGC 54098 Pro Pro Val Asp Lys Asn Arg Val His Phe Pro Cys Asn Gly Ser Ser Gly Leu Thr Ser 117541 ACA GAC GCA CTC CCG GGG GTC ACG CTA CCT GTG AAC ATC ACC TCG GCC CAA GAG TCT GCC 600118 Thr Asp Ala Leu Pro Gly Val Thr Leu Pro Val Asn Ile Thr Ser Ala Gln Glu Ser Ala 137601 TCC AGC CAC CCA GCC AAG AGG ACT GCA GAG GTG GAA ATG CCT GGC TTC AGA AAC CCA CCT 660138 Ser Ser His Pro Ala Lys Arg Thr Ala Glu Val Glu Met Pro Gly Phe Arg Asn Pro Pro 157661 GGT GAA AGT GAC CGA GAA ACT TTC CGT GAT CTG CAC GTC TAC TTA GCG CCC TCC GTT GAA 720158 Gly Glu Ser Asp Arg Glu Thr Phe Arg Asp Leu His Val Tyr Leu Ala Pro Ser Val Glu 177721 GGA GCT AGG ACC ACA TCC CAA GCT CTC CTC CAT CCT GTC ACT TGG GGG CTG AAA GAT CAT 780178 Gly Ala Arg Thr Thr Ser Gln Ala Leu Leu His Pro Val Thr Ser Gly Leu Lys Asp His 197781 CCC TGG GAA GTT ACT TTT GAG GTG GTC AAG ACA GCC CTC CCC TTG CTT CCT GGG GGG AAA 840198 Pro Trp Glu Val Thr Phe Glu Val Val Lys Thr Ala Leu Pro Leu Leu Pro Gly Gly Lys 217841 GGG CCC GGG AAT CCA GCC AAT TTG TCA GGG ACC AAG GGG AAA GCC TGG GCT TTT GAC CTG 900218 Gly Pro Gly Asn Pro Ala Asn Leu Ser Gly Thr Lys Gly Lys Ala Trp Ala Phe Asp Leu 237901 TCC TTG GAG GCG TTG CGG CGG ACT TTT ATC CTC TCC TTG GGG TCC GTG GCG TTC TGG GAG 960238 Ser Leu Glu Ala Leu Arg Arg Thr Phe Ile Leu Ser Leu Gly Ser Val Ala Phe Trp Glu 257961 CTG CTG ACA GCG CCT CTG GAG CAG GTG GCA GAT GAC AGC CTT TAT GAG TTC CTG GAT TTT1020258 Leu Leu Thr Ala Pro Leu Glu Gln Val Ala Asp Asp Ser Leu Tyr Glu Phe Leu Asp Phe 2771021 GTG GAT GCC ACT GAC CGA TAC AGA AGC CTG TGG GTC TGG AGG TTG CTG GGC ATG TCG GCA1080278 Val Asp Ala Thr Asp Arg Tyr Arg Ser Leu Trp Val Trp Arg Leu Leu Gly Met Ser Ala 2971081 GGC GTG TGT GGC ATC ACA GCC TTG GTG GGG CAG CTG GAC TGC TTC CTG ATG ACC AGT GGC1140298 Gly Val Cys Gly Ile Thr Ala Leu Val Gly Gln Leu Asp Cys Phe Leu Met Thr Ser Gly 3171141 CCC CGA GGT GTG GTC CAC TTC TAT GGG TAC TCG GTG GTC AGC ACC CTG GCC TTA CTG GTG1200318 Pro Arg Gly Val Val His Phe Tyr Gly Tyr Ser Val Val Ser Thr Leu Ala Leu Leu Val 3371201 AGC ATT GCC TTT CCC ATT CCC ATC TGT CAG CAG TGG GAG CCC AGC TAC AAA AGG GTC AAA1260338 Ser Ile Ala Phe Pro Ile Pro Ile Cys Gln Gln Trp Glu Pro Ser Tyr Lys Arg Val Lys 3571261 GCA CTG TCC ATT GTG GGG GGG GTG ACC CCC ACC TCA TTC TCC TCG CCT CCA CCA CTG TTT1320358 Ala Leu Ser Ile Val Gly Gly Val Thr Pro Thr Ser Phe Ser Ser Pro Pro Pro Leu Phe 3771321 TGG TAG GAG CCA TCG TCA GTA CTG TCC AGA ACT TTC TGT TCT GGC ACA TGA AGG ACC ATG1380378 Trp *** 3791381 GGA GCG GCG AGC TGG TCA TGG GTT TCT CGG TCG CCC TCA GCT TGC TGG GGG AAA TTC TGC14401441 TTC ATC CGT TCA AAG CTA CAT TGC TTA GGA AAC TGT CCA GGA CGG GCC TGG TGG GGC TGG15001501 GGC TGA GCT GCC TGG CTG GGC AGC TGC TGT ACT ACT CTT TCC TCT GGA GCT GGT GGT CCG15601561 TCC TCC CCA TTC AGA TCT TGA GTG CCA TTA GCA ACA GAG CTT TGT GGT GGG CTG TGG GGG16201621 CCT CAG TAG AGG ACC TGG CCA CTC CCC GCA TGG AGA GGG CTC TGA GTG CCT TGT TCC GAG16801681 GCC ACT TTT ACG GGA GTG GCT GTA GCC TGG GCA GCT TTG TCG GGG GCT TCG TGG TGA TGC17401741 GCT TCA GCC TGG CTG TGC TCT ACC AGG CCT GCT GTG TGG CCC TGT TGC TCT GGT TGG CCT18001801 TGC TCC TGT CCA TAC AGC GGA GGC TGC CCC GAG AGC GGA AAA TCA AGT ACT CGA AGC TGC18601861 TGT CCA TGG AGG TGA GTG ACA CCA GTG ACT CTG AGC AGG GGA CAG AAC AGG ACT GGC TTG19201921 TGA AGG CCA TGA GGG AGG AAC ACT CAG ACT GAA AGG GCT GAG AAA TCC AGA GTG TGC TGA19801981 TCC AGC AAG GAA CGA ATG GAC TGA ACA AAA CTC AGC CTG CTG AGG ACA GAA ACC TGC CCT20402041 GGA CTG CTG GGA GCC GGG GAA GAG AGG ATG GGT CTG TGC TGA AGG CCC AAC AGG ATC ATC21002101 TCA TTG CAT GAT TTT CTT TAC TTT TGA AGT AAA AGG AGA TTT AAC TTT TTG CCA ATC TTT21602161 TTT AGA TAA TGG AGG AAG AAT ACA TTT GCT TTT TAA AAA GTT AAA AAA AAA AAA AAA AAA22202221 AAA A 22243.FP8080蛋白A核苷酸序列(SEQ ID NO7)長度2916個堿基1 GAAAAGACGT TTAATAAAAC AGCTTTACCT TTTAAAAATA AAATTTCAAT CCCAGTCTGC61 CTCAGGTACG GGTGGGGGTG TGCAGCGTGA CTCCTGGCTG TGTTCCTGTA CCGTTTGTGG121 CCTCCGGGGT CTTGCGCGTC CAGGGCCCAG ATACCGAGTA ACTGCCATGT GGTGTCGTGG181 TGGCGTCCAT AGGCCTCCGT GGTGGGGCGG GGGCGGGGCT GTGGGTGTGC AGGGCAGCTG241 CATTTTCCAA GAGTGGAGAT GGAGGATGGA GATTTGCTTC GTAAAGGCCT GGGAGCTACA301 TGGGAGGTAG GGAGGGGCCA GCCACACCCA GGGCTGGGGG GCCGGTGGAC TCTGCCCAGT361 GAAGCCAGGG GAGTGTCAGC AATGAGGGGC CTGGACAGCG ACGCGGGACC CGCACCTGGG421 AGCGGCAGAG ATGGAGCCCA GCTCGCTAAA CGTACCCTAA GGGTGCACGC TGACCGTCTT481 TGATCCCTGG ACAGTGTCCA TAGAGTTGTC TCCCCTTCGG TCACATTGTC CCTGGCCTTG541 GAGTTTCTGC CTCAGGGAAA GACCCACTAA AACCACCCGG GCTCTGGCGG CCTCCTCTTC601 TCCAGAGCAT GGTGGCGCTG CCTCCTGAGC AGAGTCACTG AGAGTGGGTC CAAGGAAGGG661 ACCCACTTAG CAAAGGTTGT TGTGTGGTGC TGTGCAGGCA CGGCGCCTGG AGTTGGCCCC721 GCCAGCATCG GGGTGGCTTG GGGCTCTGGT TCCTAAGCTT CTGCTTCTGA GTTGGTCAGC781 ACGTTGGCTC TGCGCCCTGC AGTGCCTGTC TTGATGGTGG TCCCTGGATG TGCTGAAGGG841 CTCCAGGAGC AAGGGGCCAG ACCACACTTT GGCTGAGTCC TTGGGTAGTT TCAGAGGGTC901 ACCTGCACAG TCTGCATTGA GCACCCTGGG GCTGAGGCCG TGGGTCAAGT TCTGCCTGAC961 AGTGCTTTGA TTATATGGTG ATGTGATTCT GCAAACATAA CCCCCCAACT GAGTGCCAGC1021 TGCTGGGTGT CCCCACCTCA AGAGCCAAGG GGAGGCCACC CTGGAACTGG TGCTTTGCCC1081 TTGGTGTCAT GGAGGTGTCT GGGTCCACAC GTGGTGGGTG GGCTGGGCCT GCAGTCACCC1141 AGCATGGCCG GCGGGATTGG ACCCAGCTGC AACCTGGCAG GTTCCATGGG GCTTCCTGTG1201 CCTGGGCCTG CCTGTGTCTC ATGCCTGTCA ATAAAGGAGA AAGCAACCTG GGAAAAACAT1261 TCCTCTCTGT ACCCAGGGGA CTGCCAAGTG TGCTTTATAG AAGGCTGGAA GACCGACTGA1321 AGTAGGAAGC TGTCACATGT TTGAGCCAAC TGAGCAAAGC AGCTGTTGCC TGCCAGACAG1381 CCACCCCAAG ACCAAGGGAG CCAGCCTGTC GTTTGTCCTT CTAGCCTGGA AGACCAGTTC1441 TTGGCTCTTG GGCACTCACA TTGGCCACTG GCCGCAACTG CTGAATGGCT TCACTAATGT1501 CCCTGGGGTC TGTATCTGCC CTCTCTTCTA TTCCCTAGAA ACTCTGGCCG GGCATGGCGG1561 CTCACGCCTG TCATCCCAGC ACTTAGGGAG GCCGAGGCAG GTGGATCACA AGGTCAAGAG1621 ATCGACACCA TCCTGGCCAA CATGGTGAAA CCCCATCTCT ACTAAAAATA CAAAAATTAG1681 CTGGACATGG TGGTGGGCGC CTGTAGTCCC AGCTACTTGG GAGGCTGAGG CAGGAGAATT1741 GCTTGAACTC GGGAGGCGTA GGTTGCAGTG AGCCAAGATC GCACCACTGC ACTCCAGCCT1801 GGCAACAGAG CAAGACTCCT CAAAAAACAA ACAAACAAAC AAACAAACTC TGATCATTCA1861 CCCGGTGGGA TCCCCGGCAG CTCCTTCTCC TTCCCGAGCT GTGGCTCATG GGCCATTGGA1921 TTCAGAGACC TTGAGCTGGG TGCTGGCTGC CCTAAAGGAG CACGACCCCT CCAGCCTGGT1981 GACCGGGAGG CAGAGAAGTA CAGCTGTCCT TGACAAAGGC CCAGCCTCTG CTGCCTCAGG2041 CCAGCCTGGC CACACCCCGA TGCCACAGTC ATCTGCCCCG CCCAGGCATA AGCCTGACTC2101 AGGTGATACA GGCGAGGCTT CTCCCATGGG TCCTCCCCTT GTGAGAAAGG GTCTGTGCTG2161 TGTACCTTCT CTCTGCACAG CCATTGTCAG TGTGGTTTGG AGTGAGTGAG CCTCCCGCAC2221 TGCTCAGGGG AGAGCTGGTG AGCATGACTC CATGGCCTCC TGCTGGTTGG GGTCTTCTTC2281 TGATTCTCAC CCGCAGGAGC ACCCAGACCC CCCCTTTTCA GAAATGATTA CATTTTCCCT2341 TCAAGAGTCA TCTGTGACCT GGTGGTGTGG AGGGACTGTC CCCTCCTACA GCCTGGCCGA2401 CCCCCTTCCT CCAGGGCTGT GTGGAATCAC CTCTCAGAAG CTCACTCTGA AAAGCCACTC2461 ACAGGGATTT CACCAGGATG TTGCTGTTCC TGCCGACACC TGGGCTTTGT GACAAATGCT2521 GTTTGCTTCA AGCTGTTCAC AAGCAACTTC ACCAGAATCC CAAGCTGGTT CGTACTTAAT2581 TTGTATACAT ACATATGCAT AATATACATG ACCATGTATG AGATACAGAC ACCATGGCTT2641 CTGTCCATTG GCTCATTCGC CTGGTCGCAT GTTCACTCCA TGAGGTTAGG ACACTGCGGG2701 TGGCTTTGGG ATGGGTGGTT TCAGGGACAA GGTGTCGCTG TGATCTCTGT ATTTGCTAAC2761 TAGTCTTGTT TTGATTTCTA ACGGTCTAGT GGAGTACAGT TAATGTTGTG TTTATTTCTG2821 TAACTGTAGG GGTGGAGTAT AAACCTAACT TTTGGAAACA TGAAGAAATA AACAATAGCG2881 CCAGCCGTTA AAAAAAAAAA AAAAAAAAAA AAAAAAB氨基酸序列(SEQ ID NO9)長度103個氨基酸1 MFEPTEQSSC CLPDSHPKTK GASLSFVLLA WKTSSWLLGT HIGHWPQLLN GFTNVPGVCI61 CPLFYSLETL AGHGGSRLSS QHLGRPRQVD HKVKRSTPSW PTWC.核苷酸及氨基酸組合序列(SEQ ID NO8)克隆號和蛋白名稱FP8080起始編碼子1337 ATG終止編碼子1646 TGA蛋白質(zhì)分子量11425.50Da1G AAA AGA CGT TTA ATA AAA CAG CTT TAC CTT TTA AAA ATA AAA TTT CAA TCC CAG TCT 5859 GCC TCA GGT ACG GGT GGG GGT GTG CAG CGT GAC TCC TGG CTG TGT TCC TGT ACC GTT TGT 118119 GGC CTC CGG GGT CTT GCG CGT CCA GGG CCC AGA TAC CGA GTA ACT GCC ATG TGG TGT CGT 178179 GGT GGC GTC CAT AGG CCT CCG TGG TGG GGC GGG GGC GGG GCT GTG GGT GTG CAG GGC AGC 238239 TGC ATT TTC CAA GAG TGG AGA TGG AGG ATG GAG ATT TGC TTC GTA AAG GCC TGG GAG CTA 298299 CAT GGG AGG TAG GGA GGG GCC AGC CAC ACC CAG GGC TGG GGG GCC GGT GGA CTC TGC CCA 358359 GTG AAG CCA GGG GAG TGT CAG CAA TGA GGG GCC TGG ACA GCG ACG CGG GAC CCG CAC CTG 418419 GGA GCG GCA GAG ATG GAG CCC AGC TCG CTA AAC GTA CCC TAA GGG TGC ACG CTG ACC GTC 478479 TTT GAT CCC TGG ACA GTG TCC ATA GAG TTG TCT CCC CTT CGG TCA CAT TGT CCC TGG CCT 538539 TGG AGT TTC TGC CTC AGG GAA AGA CCC ACT AAA ACC ACC CGG GCT CTG GCG GCC TCC TCT 598599 TCT CCA GAG CAT GGT GGC GCT GCC TCC TGA GCA GAG TCA CTG AGA GTG GGT CCA AGG AAG 658659 GGA CCC ACT TAG CAA AGG TTG TTG TGT GGT GCT GTG CAG GCA CGG CGC CTG GAG TTG GCC 718719 CCG CCA GCA TCG GGG TGG CTT GGG GCT CTG GTT CCT AAG CTT CTG CTT CTG AGT TGG TCA 778779 GCA CGT TGG CTC TGC GCC CTG CAG TGC CTG TCT TGA TGG TGG TCC CTG GAT GTG CTG AAG 838839 GGC TCC AGG AGC AAG GGG CCA GAC CAC ACT TTG GCT GAG TCC TTG GGT AGT TTC AGA GGG 898899 TCA CCT GCA CAG TCT GCA TTG AGC ACC CTG GGG CTG AGG CCG TGG GTC AAG TTC TGC CTG 958959 ACA GTG CTT TGA TTA TAT GGT GAT GTG ATT CTG CAA ACA TAA CCC CCC AAC TGA GTG CCA10181019 GCT GCT GGG TGT CCC CAC CTC AAG AGC CAA GGG GAG GCC ACC CTG GAA CTG GTG CTT TGC10781079 CCT TGG TGT CAT GGA GGT GTC TGG GTC CAC ACG TGG TGG GTG GGC TGG GCC TGC AGT CAC11381139 CCA GCA TGG CCG GCG GGA TTG GAC CCA GCT GCA ACC TGG CAG GTT CCA TGG GGC TTC CTG11981199 TGC CTG GGC CTG CCT GTG TCT CAT GCC TGT CAA TAA AGG AGA AAG CAA CCT GGG AAA AAC12581259 ATT CCT CTC TGT ACC CAG GGG ACT GCC AAG TGT GCT TTA TAG AAG GCT GGA AGA CCG ACT13181319 GAA GTA GGA AGC TGT CAC ATG TTT GAG CCA ACT GAG CAA AGC AGC TGT TGC CTG CCA GAC13781 Met Phe Glu Pro Thr Glu Gln Ser Ser Cys Cys Leu Pro Asp 141379 AGC CAC CCC AAG ACC AAG GGA GCC AGC CTG TCG TTT GTC CTT CTA GCC TGG AAG ACC AGT143815 Ser His Pro Lys Thr Lys Gly Ala Ser Leu Ser Phe Val Leu Leu Ala Trp Lys Thr Ser 341439 TCT TGG CTC TTG GGC ACT CAC ATT GGC CAC TGG CCG CAA CTG CTG AAT GGC TTC ACT AAT149835 Ser Trp Leu Leu Gly Thr His Ile Gly His Trp Pro Gln Leu Leu Asn Gly Phe Thr Asn 541499 GTC CCT GGG GTC TGT ATC TGC CCT CTC TTC TAT TCC CTA GAA ACT CTG GCC GGG CAT GGC155855 Val Pro Gly Val Cys Ile Cys Pro Leu Phe Tyr Ser Leu Glu Thr Leu Ala Gly His Gly 741559 GGC TCA CGC CTG TCA TCC CAG CAC TTA GGG AGG CCG AGG CAG GTG GAT CAC AAG GTC AAG161875 Gly Ser Arg Leu Ser Ser Gln His Leu Gly Arg Pro Arg Gln Val Asp His Lys Val Lys 941619 AGA TCG ACA CCA TCC TGG CCA ACA TGG TGA AAC CCC ATC TCT ACT AAA AAT ACA AAA ATT167895 Arg Ser Thr Pro Ser Trp Pro Thr Trp *** 1041679 AGC TGG ACA TGG TG G TGG GCG CCT GTA GTC CCA GCT ACT TGG GAG GCTGAG GCA GGA GAA17381739 TTG CTT GAA CTC GGG AGG CGT AGG TTG CAG TGA GCC AAG ATC GCA CCA CTG CAC TCC AGC17981799 CTG GCA ACA GAG CAA GAC TCC TCA AAA AAC AAA CAA ACA AAC AAA CAA ACT CTG ATC ATT18581859 CAC CCG GTG GGA TCC CCG GCA GCT CCT TCT CCT TCC CGA GCT GTG GCT CAT GGG CCA TTG19181919 GAT TCA GAG ACC TTG AGC TGG GTG CTG GCT GCC CTA AAG GAG CAC GAC CCC TCC AGC CTG19781979 GTG ACC GGG AGG CAG AGA AGT ACA GCT GTC CTT GAC AAA GGC CCA GCC TCT GCT GCC TCA20382039 GGC CAG CCT GGC CAC ACC CCG ATG CCA CAG TCA TCT GCC CCG CCC AGG CAT AAG CCT GAC20982099 TCA GGT GAT ACA GGC GAG GCT TCT CCC ATG GGT CCT CCC CTT GTG AGA AAG GGT CTG TGC21582159 TGT GTA CCT TCT CTC TGC ACA GCC ATT GTC AGT GTG GTT TGG AGT GAG TGA GCC TCC CGC22182219 ACT GCT CAG GGG AGA GCT GGT GAG CAT GAC TCC ATG GCC TCC TGC TGG TTG GGG TCT TCT22782279 TCT GAT TCT CAC CCG CAG GAG CAC CCA GAC CCC CCC TTT TCA GAA ATG ATT ACA TTT TCC23382339 CTT CAA GAG TCA TCT GTG ACC TGG TGG TGT GGA GGG ACT GTC CCC TCC TAC AGC CTG GCC23982399 GAC CCC CTT CCT CCA GGG CTG TGT GGA ATC ACC TCT CAG AAG CTC ACT CTG AAA AGC CAC24582459 TCA CAG GGA TTT CAC CAG GAT GTT GCT GTT CCT GCC GAC ACC TGG GCT TTG TGA CAA ATG25182519 CTG TTT GCT TCA AGC TGT TCA CAA GCA ACT TCA CCA GAA TCC CAA GCT GGT TCG TAC TTA25782579 ATT TGT ATA CAT ACA TAT GCA TAA TAT ACA TGA CCA TGT ATG AGA TAC AGA CAC CAT GGC26382639 TTC TGT CCA TTG GCT CAT TCG CCT GGT CGC ATG TTC ACT CCA TGA GGT TAG GAC ACT GCG26982699 GGT GGC TTT GGG ATG GGT GGT TTC AGG GAC AAG GTG TCG CTG TGA TCT CTG TAT TTG CTA27582759 ACT AGT CTT GTT TTG ATT TCT AAC GGT CTA GTG GAG TAC AGT TAA TGT TGT GTT TAT TTC28182819 TGT AAC TGT AGG GGT GGA GTA TAA ACC TAA CTT TTG GAA ACA TGA AGA AAT AAA CAA TAG28782879 CGC CAG CCG TTA AAA AAA AAA AAA AAA AAA AAA AAAAA 2916在本發(fā)明提及的所有文獻(xiàn)都在本申請中引用作為參考，就如同每一篇文獻(xiàn)被單獨(dú)引用作為參考那樣。此外應(yīng)理解，在閱讀了本發(fā)明的上述講授內(nèi)容之后，本領(lǐng)域技術(shù)人員可以對本發(fā)明作各種改動或修改，這些等價形式同樣落于本申請所附權(quán)利要求書所限定的范圍。
序列表<110>上海新世界基因技術(shù)開發(fā)有限公司<120>具有抑癌功能的新的人蛋白及其編碼序列<130>022535<160>15<170>PatentIn version 3.0<210>1<211>3046<212>DNA<213>智人(Homo sapiens)<400>1ggtttcacca tgatggtcag gctggtcaag atctcctgac ctcaagtgat ctgcccgcct 60cggcctccca aagtgctggg attacagaca tgaaccacaa cacctgccaa gcccaggtgt120tttgaatcca gcacgggcaa tggcaagacc ctgtcccaac aaacaaaaaa acactggtgc180ctgaggccca ccccgagaga ttctgattga gttgatttgg atttgaatta tctttaaaat240tttggatgtg aatttttttt ttttttcttg gaatggagtt tcactcttgt tccccaggct300ggagtgcaac gggacgatct tggctcaccg caacctccgc ctactgggtt caagccattc360tcctgcctca gcttcccaag tagctgggat tacaggcatg tgctaccatg cccagctaat420tttgtatttt tagtagagac agggtttctc catgttgctc aggctggtct tgaactcctg480acctcaggtg atccgcccgc ctcggactcc caaagtgctg ggattacagg catgagccac540catgcctggc cggatgtgaa ttatcttaaa aattttcagg taattctaat gggccaaggt600tgagaacccc tgctctgggc ccatccgagc accaggctgt cacaaacgca tgcatgcact660cacgcccgtg ggcttggggg gcttcggaaa tgtgcttctg cttttttgag atggggtctt720tctgttgccc atcccggagc acagtggcac gatcacagct cactgcagcc tcgacctcct780gggctcaggt gatcctcccg cctcagcctc ctgagtgtct gcttctggtt ttcatgatga840cctggggccc aggcatacta cacttgtgct gttcaggggc cagtcctgca ccaggagccc900atcagccaca gctccgccga gaagcactga tatgcagagc taagcagctt tgtttccacg960tggatcctgc gtaggttttc ttggtccatc cgtagacacc gcactcctgc agaggatctt 1020ctcgggatgc cccactgtct ctgttttccc tcttcactga acactcagtc ggggctcgcc 1080atgatgcctc tgtgtctgct ggcttctccc ccattggaac agccttcttg gcacgccaca 1140ctgctagctg ctgggcactg tgctttctgc ctttaccgtt ctgccgtgat gttgccaaaa 1200tagcagcaac aacaacaaca acaaaggctg ggcacctggc tcatgcctgt attcccagca 1260gttcgagatc agcctgggca acatggtgag accctatctc tacaaaaata aaaaatgaaa 1320tgagctgggt ggggtggcgc atgcatgcct gtggtcccag ctacttggga ggctgaggtc 1380ggaagctcgc tggtcggaag atcgctggag cttagccttg aggtcaaggt tgcagtgagc 1440cgagattaca tcactgcact ccagcgtggg agacagagac cctgtattaa caaacaaaaa 1500cacaaaccac aaagggcagg tctgaaactg ccatttaaaa aaaaatttga taaacttaaa 1560aaaatatata tccacagatg caggtgaaga acctgttgtc ttcctcaagc ctctttttca 1620cccatgggtg gaaatggtgc cctggacacc caggcccacg aggtctttgc gtggggtccc 1680tacacagggc tttagcttac actgtgctgc cctcctgtcc cccgagttcc cagtctgtca 1740aaatccaacc tggtctccca ggcccagggc aaatgccacc tcctccatga agcctgccac 1800atcctttgca cacccttggg cgctgacctt gttctcccag cgcacaggca cgggtagttt 1860gcccctgtag tagtaactca ggcacaaaac gaactcttgc tgaggctcgg ccgcgcagag 1920ctgagggttg ccgcttccag gttcaagtgc attttgagtt tcattcccag cttccttctt 1980tttctggtct ttaatttctt ctccggatta ggtcccactc aatgctttcc ttctcaattt 2040ccaaaagagt atggtcagag ccagcagcac accaccttcc ccatgggtgg ggggggggcc 2100agcctgtggc gggggtgcgg gtcccatctt ttcgaaggaa ttgacccaca gtgggcgggt 2160ccacctttga ccttgcccca gggagcgcag acagaaaaaa gatccttgct tagtttgagg 2220ggccgctggg gtgctcggtt tgtcttcaga ggcctgtctg taacaccaat gccaacccgg 2280tggcactgac tggtcaccct gaaggccacg gccagtgtcc taggaaggga ctcaatttct 2340agctgtgcca cctgagattc tggggttagg ctggttgtgc ttctgaagtt ccactgtgct 2400caaagtgctt ggtgaaagtt agcgaaggtg attttacaaa aatagatgca taaaatgtct 2460aggaaacaca aaaaatcctc attactcttc tctccaaata ttttttaagc cccaactgga 2520ccctaggcaa aagtgagtgg cactcctctg ccaggactcc aggcaagccc cggcatcttc 2580ttgctgccgt cccagacaac agaagttacc agatgaacag acttggatgg gccacggggg 2640tggagagctg gaaagcttgg ctgtgcctct cgatgatgat taagatttca atatttacag 2700caaaaccaca aagcaaatga tagaataaag caaaacaatg gaaaatgtga gttcactcgt 2760gagagaggta cgtatgtgag ctctgaggaa attacagagg gaacgcatgc agcgggacag 2820ctctcccaat cgcagcgtgc aaagtagaca tccatagtgt cttttgaaaa atgaaaaaca 2880cattactttg aacagccaag aaaaaaattg caatttatta agattcaata aagcgttgta 2940ctttcgaaag ccaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3000aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa 3046<210>2<211>3046<212>DNA<213>智人(Homo sapiens)<220><221>CDS<222>(654)..(971)<400>2ggtttcacca tgatggtcag gctggtcaag atctcctgac ctcaagtgat ctgcccgcct 60cggcctccca aagtgctggg attacagaca tgaaccacaa cacctgccaa gcccaggtgt120tttgaatcca gcacgggcaa tggcaagacc ctgtcccaac aaacaaaaaa acactggtgc180ctgaggccca ccccgagaga ttctgattga gttgatttgg atttgaatta tctttaaaat240tttggatgtg aatttttttt ttttttcttg gaatggagtt tcactcttgt tccccaggct300ggagtgcaac gggacgatct tggctcaccg caacctccgc ctactgggtt caagccattc360tcctgcctca gcttcccaag tagctgggat tacaggcatg tgctaccatg cccagctaat420tttgtatttt tagtagagac agggtttctc catgttgctc aggctggtct tgaactcctg480acctcaggtg atccgcccgc ctcggactcc caaagtgctg ggattacagg catgagccac540catgcctggc cggatgtgaa ttatcttaaa aattttcagg taattctaat gggccaaggt600tgagaacccc tgctctgggc ccatccgagc accaggctgt cacaaacgca tgc atg 656Met1cac tca cgc ccg tgg gct tgg ggg gct tcg gaa atg tgc ttc tgc ttt 704His Ser Arg Pro Trp Ala Trp Gly Ala Ser Glu Met Cys Phe Cys Phe5 10 15ttt gag atg ggg tct ttc tgt tgc cca tcc cgg agc aca gtg gca cga 752Phe Glu Met Gly Ser Phe Cys Cys Pro Ser Arg Ser Thr Val Ala Arg20 25 30tca cag ctc act gca gcc tcg acc tcc tgg gct cag gtg atc ctc ccg 800Ser Gln Leu Thr Ala Ala Ser Thr Ser Trp Ala Gln Val Ile Leu Pro35 40 45cct cag cct cct gag tgt ctg ctt ctg gtt ttc atg atg acc tgg ggc 848Pro Gln Pro Pro Glu Cys Leu Leu Leu Val Phe Met Met Thr Trp Gly50 55 60 65cca ggc ata cta cac ttg tgc tgt tca ggg gcc agt cct gca cca gga 896Pro Gly Ile Leu His Leu Cys Cys Ser Gly Ala Ser Pro Ala Pro Gly
70 75 80gcc cat cag cca cag ctc cgc cga gaa gca ctg ata tgc aga gct aag 944Ala His Gln Pro Gln Leu Arg Arg Glu Ala Leu Ile Cys Arg Ala Lys85 90 95cag ctt tgt ttc cac gtg gat cct gcg taggttttct tggtccatcc991Gln Leu Cys Phe His Val Asp Pro Ala100 105gtagacaccg cactcctgca gaggatcttc tcgggatgcc ccactgtctc tgttttccct 1051cttcactgaa cactcagtcg gggctcgcca tgatgcctct gtgtctgctg gcttctcccc 1111cattggaaca gccttcttgg cacgccacac tgctagctgc tgggcactgt gctttctgcc 1171tttaccgttc tgccgtgatg ttgccaaaat agcagcaaca acaacaacaa caaaggctgg 1231gcacctggct catgcctgta ttcccagcag ttcgagatca gcctgggcaa catggtgaga 1291ccctatctct acaaaaataa aaaatgaaat gagctgggtg gggtggcgca tgcatgcctg 1351tggtcccagc tacttgggag gctgaggtcg gaagctcgct ggtcggaaga tcgctggagc 1411ttagccttga ggtcaaggtt gcagtgagcc gagattacat cactgcactc cagcgtggga 1471gacagagacc ctgtattaac aaacaaaaac acaaaccaca aagggcaggt ctgaaactgc 1531catttaaaaa aaaatttgat aaacttaaaa aaatatatat ccacagatgc aggtgaagaa 1591cctgttgtct tcctcaagcc tctttttcac ccatgggtgg aaatggtgcc ctggacaccc 1651aggcccacga ggtctttgcg tggggtccct acacagggct ttagcttaca ctgtgctgcc 1711ctcctgtccc ccgagttccc agtctgtcaa aatccaacct ggtctcccag gcccagggca 1771aatgccacct cctccatgaa gcctgccaca tcctttgcac acccttgggc gctgaccttg 1831ttctcccagc gcacaggcac gggtagtttg cccctgtagt agtaactcag gcacaaaacg 1891aactcttgct gaggctcggc cgcgcagagc tgagggttgc cgcttccagg ttcaagtgca 1951ttttgagttt cattcccagc ttccttcttt ttctggtctt taatttcttc tccggattag 2011gtcccactca atgctttcct tctcaatttc caaaagagta tggtcagagc cagcagcaca 2071ccaccttccc catgggtggg gggggggcca gcctgtggcg ggggtgcggg tcccatcttt 2131tcgaaggaat tgacccacag tgggcgggtc cacctttgac cttgccccag ggagcgcaga 2191cagaaaaaag atccttgctt agtttgaggg gccgctgggg tgctcggttt gtcttcagag 2251gcctgtctgt aacaccaatg ccaacccggt ggcactgact ggtcaccctg aaggccacgg 2311ccagtgtcct aggaagggac tcaatttcta gctgtgccac ctgagattct ggggttaggc 2371tggttgtgct tctgaagttc cactgtgctc aaagtgcttg gtgaaagtta gcgaaggtga 2431ttttacaaaa atagatgcat aaaatgtcta ggaaacacaa aaaatcctca ttactcttct 2491ctccaaatat tttttaagcc ccaactggac cctaggcaaa agtgagtggc actcctctgc 2551caggactcca ggcaagcccc ggcatcttct tgctgccgtc ccagacaaca gaagttacca 2611gatgaacaga cttggatggg ccacgggggt ggagagctgg aaagcttggc tgtgcctctc 2671gatgatgatt aagatttcaa tatttacagc aaaaccacaa agcaaatgat agaataaagc 2731aaaacaatgg aaaatgtgag ttcactcgtg agagaggtac gtatgtgagc tctgaggaaa 2791ttacagaggg aacgcatgca gcgggacagc tctcccaatc gcagcgtgca aagtagacat 2851ccatagtgtc ttttgaaaaa tgaaaaacac attactttga acagccaaga aaaaaattgc 2911aatttattaa gattcaataa agcgttgtac tttcgaaagc caaaaaaaaa aaaaaaaaaa 2971aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3031aaaaaaaaaa aaaaa3046<210>3<211>106<212>PRT<213>智人(Homo sapiens)<400>3Met His Ser Arg Pro Trp Ala Trp Gly Ala Ser Glu Met Cys Phe Cys1 5 10 15Phe Phe Glu Met Gly Ser Phe Cys Cys Pro Ser Arg Ser Thr Val Ala20 25 30Arg Ser Gln Leu Thr Ala Ala Ser Thr Ser Trp Ala Gln Val Ile Leu35 40 45Pro Pro Gln Pro Pro Glu Cys Leu Leu Leu Val Phe Met Met Thr Trp50 55 60Gly Pro Gly Ile Leu His Leu Cys Cys Ser Gly Ala Ser Pro Ala Pro65 70 75 80Gly Ala His Gln Pro Gln Leu Arg Arg Glu Ala Leu Ile Cys Arg Ala85 90 95Lys Gln Leu Cys Phe His Val Asp Pro Ala100 105<210>4<211>2224<212>DNA<213>智人(Homo sapiens)<400>4gggacctggg ggctgtggcc gggggcggcc gttgacctgg tgaccgcggc gccgccccag 60accgggggcg cagtcccact cgctccgagc cccggtcccc caagcctccc tcccgggtac120ctggggccgc gcccgccctg cgcccagctc cgccctccgt cggcccaggc ctgacagagc180ccggcagcca tgagtgccaa cccccggtgg gacatcagca gggcgctggg ggtggccaag240ctcttccacc tggtgtgcgg ggtgcgggaa gcctgcgtga ccccgttcct gaccctttac300ctgaggcagc tgggcttggc cgcgccctgg gtgggcaccc taatgggaac caagcaccta360atcgctgcct tctgggctcc cgtctgtgcc ttcctggcca aaagctaccg gaaaaggaga420gcgcttctga tcggctccct gctcggctcg gtgggggcca gcctgctgat ggtcctggtc480ccaccggtag acaaaaatcg ggtgcacttc ccttgtaatg gaagcagcgg cctgaccagc540acagacgcac tcccgggggt cacgctacct gtgaacatca cctcggccca agagtctgcc600tccagccacc cagccaagag gactgcagag gtggaaatgc ctggcttcag aaacccacct660ggtgaaagtg accgagaaac tttccgtgat ctgcacgtct acttagcgcc ctccgttgaa720ggagctagga ccacatccca agctctcctc catcctgtca cttcggggct gaaagatcat780ccctgggaag ttacttttga ggtggtcaag acagccctcc ccttgcttcc tggggggaaa840gggcccggga atccagccaa tttgtcaggg accaagggga aagcctgggc ttttgacctg900tccttggagg cgttgcggcg gacttttatc ctctccttgg ggtccgtggc gttctgggag960ctgctgacag cgcctctgga gcaggtggca gatgacagcc tttatgagtt cctggatttt 1020gtggatgcca ctgaccgata cagaagcctg tgggtctgga ggttgctggg catgtcggca 1080ggcgtgtgtg gcatcacagc cttggtgggg cagctggact gcttcctgat gaccagtggc 1140ccccgaggtg tggtccactt ctatgggtac tcggtggtca gcaccctggc cttactggtg 1200agcattgcct ttcccattcc catctgtcag cagtgggagc ccagctacaa aagggtcaaa 1260gcactgtcca ttgtgggggg ggtgaccccc acctcattct cctcgcctcc accactgttt 1320tggtaggagc catcgtcagt actgtccaga actttctgtt ctggcacatg aaggaccatg 1380ggagcggcga gctggtcatg ggtttctcgg tcgccctcag cttgctgggg gaaattctgc 1440ttcatccgtt caaagctaca ttgcttagga aactgtccag gacgggcctg gtggggctgg 1500ggctgagctg cctcgctggg cagctgctgt actactcttt cctctggagc tggtggtccg 1560tcctccccat tcagatcttg agtgccatta gcaacagagc tttgtggtgg gctgtggggg 1620cctcagtaga ggacctggcc actccccgca tggagagggc tctgagtgcc ttgttccgag 1680gccactttta cgggagtggc tgtagcctgg gcagctttgt cgggggcttc gtggtgatgc 1740gcttcagcct ggctgtgctc taccaggcct gctgtgtggc cctgttgctc tggttggcct 1800tgctcctgtc catacagcgg aggctgcccc gagagcggaa aatcaagtac tcgaagctgc 1860tgtccatgga ggtgagtgac accagtgact ctgagcaggg gacagaacag gactggcttg 1920tgaaggccat gagggaggaa cactcagact gaaagggctg agaaatccag agtgtgctga 1980tccagcaagg aacgaatgga ctgaacaaaa ctcagcctgc tgaggacaga aacctgccct 2040ggactgctgg gagccgggga agagaggatg ggtctgtgct gaaggcccaa caggatcatc 2100tcattgcatg attttcttta cttttgaagt aaaaggagat ttaacttttt gccaatcttt 2160tttagataat ggaggaagaa tacatttgct ttttaaaaag ttaaaaaaaa aaaaaaaaaa 2220aaaa2224<210>5<211>2224<212>DNA<213>智人(Homo sapiens)<220><221>CDS<222>(190)..(1323)<400>5gggacctggg ggctgtggcc gggggcggcc gttgacctgg tgaccgcggc gccgccccag 60accgggggcg cagtcccact cgctccgagc cccggtcccc caagcctccc tcccgggtac120ctggggccgc gcccgccctg cgcccagctc cgccctccgt cggcccaggc ctgacagagc180ccggcagcc atg agt gcc aac ccc cgg tgg gac atc agc agg gcg ctg ggg231Met Ser Ala Asn Pro Arg Trp Asp Ile Ser Arg Ala Leu Gly1 5 10gtg gcc aag ctc ttc cac ctg gtg tgc ggg gtg cgg gaa gcc tgc gtg 279Val Ala Lys Leu Phe His Leu Val Cys Gly Val Arg Glu Ala Cys Val15 20 25 30acc ccg ttc ctg acc ctt tac ctg agg cag ctg ggc ttg gcc gcg ccc 327Thr Pro Phe Leu Thr Leu Tyr Leu Arg Gln Leu Gly Leu Ala Ala Pro35 40 45tgg gtg ggc acc cta atg gga acc aag cac cta atc gct gcc ttc tgg 375Trp Val Gly Thr Leu Met Gly Thr Lys His Leu Ile Ala Ala Phe Trp50 55 60gct ccc gtc tgt gcc ttc ctg gcc aaa agc tac cgg aaa agg aga gcg 423Ala Pro Val Cys Ala Phe Leu Ala Lys Ser Tyr Arg Lys Arg Arg Ala65 70 75ctt ctg atc ggc tcc ctg ctc ggc tcg gtg ggg gcc agc ctg ctg atg 471Leu Leu Ile Gly Ser Leu Leu Gly Ser Val Gly Ala Ser Leu Leu Met80 85 90gtc ctg gtc cca ccg gta gac aaa aat cgg gtg cac ttc cct tgt aat 519Val Leu Val Pro Pro Val Asp Lys Asn Arg Val His Phe Pro Cys Asn95 100 105 110gga agc agc ggc ctg acc agc aca gac gca ctc ccg ggg gtc acg cta 567Gly Ser Ser Gly Leu Thr Ser Thr Asp Ala Leu Pro Gly Val Thr Leu115 120 125cct gtg aac atc acc tcg gcc caa gag tct gcc tcc agc cac cca gcc 615Pro Val Asn Ile Thr Ser Ala Gln Glu Ser Ala Ser Ser His Pro Ala130 135 140aag agg act gca gag gtg gaa atg cct ggc ttc aga aac cca cct ggt 663Lys Arg Thr Ala Glu Val Glu Met Pro Gly Phe Arg Asn Pro Pro Gly
145 150 155gaa agt gac cga gaa act ttc cgt gat ctg cac gtc tac tta gcg ccc 711Glu Ser Asp Arg Glu Thr Phe Arg Asp Leu His Val Tyr Leu Ala Pro160 165 170tcc gtt gaa gga gct agg acc aca tcc caa gct ctc ctc cat cct gtc 759Ser Val Glu Gly Ala Arg Thr Thr Ser Gln Ala Leu Leu His Pro Val175 180 185 190act tcg ggg ctg aaa gat cat ccc tgg gaa gtt act ttt gag gtg gtc 807Thr Ser Gly Leu Lys Asp His Pro Trp Glu Val Thr Phe Glu Val Val195 200 205aag aca gcc ctc ccc ttg ctt cct ggg ggg aaa ggg ccc ggg aat cca 855Lys Thr Ala Leu Pro Leu Leu Pro Gly Gly Lys Gly Pro Gly Asn Pro210 215 220gcc aat ttg tca ggg acc aag ggg aaa gcc tgg gct ttt gac ctg tcc 903Ala Asn Leu Ser Gly Thr Lys Gly Lys Ala Trp Ala Phe Asp Leu Ser225 230 235ttg gag gcg ttg cgg cgg act ttt atc ctc tcc ttg ggg tcc gtg gcg 951Leu Glu Ala Leu Arg Arg Thr Phe Ile Leu Ser Leu Gly Ser Val Ala240 245 250ttc tgg gag ctg ctg aca gcg cct ctg gag cag gtg gca gat gac agc 999Phe Trp Glu Leu Leu Thr Ala Pro Leu Glu Gln Val Ala Asp Asp Ser255 260 265 270ctt tat gag ttc ctg gat ttt gtg gat gcc act gac cga tac aga agc 1047Leu Tyr Glu Phe Leu Asp Phe Val Asp Ala Thr Asp Arg Tyr Arg Ser275 280 285ctg tgg gtc tgg agg ttg ctg ggc atg tcg gca ggc gtg tgt ggc atc 1095Leu Trp Val Trp Arg Leu Leu Gly Met Ser Ala Gly Val Cys Gly Ile290 295 300aca gcc ttg gtg ggg cag ctg gac tgc ttc ctg atg acc agt ggc ccc 1143Thr Ala Leu Val Gly Gln Leu Asp Cys Phe Leu Met Thr Ser Gly Pro305 310 315cga ggt gtg gtc cac ttc tat ggg tac tcg gtg gtc agc acc ctg gcc 1191Arg Gly Val Val His Phe Tyr Gly Tyr Ser Val Val Ser Thr Leu Ala320 325 330tta ctg gtg agc att gcc ttt ccc att ccc atc tgt cag cag tgg gag 1239Leu Leu Val Ser Ile Ala Phe Pro Ile Pro Ile Cys Gln Gln Trp Glu335 340 345 350ccc agc tac aaa agg gtc aaa gca ctg tcc att gtg ggg ggg gtg acc 1287Pro Ser Tyr Lys Arg Val Lys Ala Leu Ser Ile Val Gly Gly Val Thr355 360 365ccc acc tca ttc tcc tcg cct cca cca ctg ttt tgg taggagccat 1333Pro Thr Ser Phe Ser Ser Pro Pro Pro Leu Phe Trp370 375cgtcagtact gtccagaact ttctgttctg gcacatgaag gaccatggga gcggcgagct 1393ggtcatgggt ttctcggtcg ccctcagctt gctgggggaa attctgcttc atccgttcaa 1453agctacattg cttaggaaac tgtccaggac gggcctggtg gggctggggc tgagctgcct 1513cgctgggcag ctgctgtact actctttcct ctggagctgg tggtccgtcc tccccattca 1573gatcttgagt gccattagca acagagcttt gtggtgggct gtgggggcct cagtagagga 1633cctggccact ccccgcatgg agagggctct gagtgccttg ttccgaggcc acttttacgg 1693gagtggctgt agcctgggca gctttgtcgg gggcttcgtg gtgatgcgct tcagcctggc 1753tgtgctctac caggcctgct gtgtggccct gttgctctgg ttggccttgc tcctgtccat 1813acagcggagg ctgccccgag agcggaaaat caagtactcg aagctgctgt ccatggaggt 1873gagtgacacc agtgactctg agcaggggac agaacaggac tggcttgtga aggccatgag 1933ggaggaacac tcagactgaa agggctgaga aatccagagt gtgctgatcc agcaaggaac 1993gaatggactg aacaaaactc agcctgctga ggacagaaac ctgccctgga ctgctgggag 2053ccggggaaga gaggatgggt ctgtgctgaa ggcccaacag gatcatctca ttgcatgatt 2113ttctttactt ttgaagtaaa aggagattta actttttgcc aatctttttt agataatgga 2173ggaagaatac atttgctttt taaaaagtta aaaaaaaaaa aaaaaaaaaa a2224<210>6<211>378<212>PRT<213>智人(Homo sapiens)<400>6Met Ser Ala Asn Pro Arg Trp Asp Ile Ser Arg Ala Leu Gly Val Ala1 5 10 15Lys Leu Phe His Leu Val Cys Gly Val Arg Glu Ala Cys Val Thr Pro20 25 30Phe Leu Thr Leu Tyr Leu Arg Gln Leu Gly Leu Ala Ala Pro Trp Val35 40 45Gly Thr Leu Met Gly Thr Lys His Leu Ile Ala Ala Phe Trp Ala Pro50 55 60Val Cys Ala Phe Leu Ala Lys Ser Tyr Arg Lys Arg Arg Ala Leu Leu65 70 75 80Ile Gly Ser Leu Leu Gly Ser Val Gly Ala Ser Leu Leu Met Val Leu85 90 95Val Pro Pro Val Asp Lys Asn Arg Val His Phe Pro Cys Asn Gly Ser100 105 110Ser Gly Leu Thr Ser Thr Asp Ala Leu Pro Gly Val Thr Leu Pro Val115 120 125Asn Ile Thr Ser Ala Gln Glu Ser Ala Ser Ser His Pro Ala Lys Arg130 135 140Thr Ala Glu Val Glu Met Pro Gly Phe Arg Asn Pro Pro Gly Glu Ser145 150 155 160Asp Arg Glu Thr Phe Arg Asp Leu His Val Tyr Leu Ala Pro Ser Val165 170 175Glu Gly Ala Arg Thr Thr Ser Gln Ala Leu Leu His Pro Val Thr Ser180 185 190Gly Leu Lys Asp His Pro Trp Glu Val Thr Phe Glu Val Val Lys Thr195 200 205Ala Leu Pro Leu Leu Pro Gly Gly Lys Gly Pro Gly Asn Pro Ala Asn210 215 220Leu Ser Gly Thr Lys Gly Lys Ala Trp Ala Phe Asp Leu Ser Leu Glu225 230 235 240Ala Leu Arg Arg Thr Phe Ile Leu Ser Leu Gly Ser Val Ala Phe Trp245 250 255Glu Leu Leu Thr Ala Pro Leu Glu Gln Val Ala Asp Asp Ser Leu Tyr260 265 270Glu Phe Leu Asp Phe Val Asp Ala Thr Asp Arg Tyr Arg Ser Leu Trp275 280 285Val Trp Arg Leu Leu Gly Met Ser Ala Gly Val Cys Gly Ile Thr Ala290 295 300Leu Val Gly Gln Leu Asp Cys Phe Leu Met Thr Ser Gly Pro Arg Gly305 310 315 320Val Val His Phe Tyr Gly Tyr Ser Val Val Ser Thr Leu Ala Leu Leu325 330 335Val Ser Ile Ala Phe Pro Ile Pro Ile Cys Gln Gln Trp Glu Pro Ser340 345 350Tyr Lys Arg Val Lys Ala Leu Ser Ile Val Gly Gly Val Thr Pro Thr355 360 365Ser Phe Ser Ser Pro Pro Pro Leu Phe Trp370 375<210>7<211>2916<212>DNA<213>智人(Homo sapiens)<400>7gaaaagacgt ttaataaaac agctttacct tttaaaaata aaatttcaat cccagtctgc 60ctcaggtacg ggtgggggtg tGcagcgtga ctcctggctg tgttcctgta ccgtttgtgg120cctccggggt cttgcgcgtc cagggcccag ataccgagta actgccatgt ggtgtcgtgg180tggcgtccat aggcctccgt ggtggggcgg gggcggggct gtgggtgtgc agggcagctg240cattttccaa gagtggagat ggaggatgga gatttgcttc gtaaaggcct gggagctaca300tgggaggtag ggaggggcca gccacaccca gggctggggg gccggtggac tctgcccagt360gaagccaggg gagtgtcagc aatgaggggc ctggacagcg acgcgggacc cgcacctggg420agcggcagag atggagccca gctcgctaaa cgtaccctaa gggtgcacgc tgaccgtctt480tgatccctgg acagtgtcca tagagttgtc tccccttcgg tcacattgtc cctggccttg540gagtttctgc ctcagggaaa gacccactaa aaccacccgg gctctggcgg cctcctcttc600tccagagcat ggtggcgctg cctcctgagc agagtcactg agagtgggtc caaggaaggg660acccacttag caaaggttgt tgtgtggtgc tgtgcaggca cggcgcctgg agttggcccc720gccagcatcg gggtggcttg gggctctggt tcctaagctt ctgcttctga gttggtcagc780acgttggctc tgcgccctgc agtgcctgtc ttgatggtgg tccctggatg tgctgaaggg840ctccaggagc aaggggccag accacacttt ggctgagtcc ttgggtagtt tcagagggtc900acctgcacag tctgcattga gcaccctggg gctgaggccg tgggtcaagt tctgcctgac960agtgctttga ttatatggtg atgtgattct gcaaacataa ccccccaact gagtgccagc 1020tgctgggtgt ccccacctca agagccaagg ggaggccacc ctggaactgg tgctttgccc 1080ttggtgtcat ggaggtgtct gggtccacac gtggtgggtg ggctgggcct gcagtcaccc 1140agcatggccg gcgggattgg acccagctgc aacctggcag gttccatggg gcttcctgtg 1200cctgggcctg cctgtgtctc atgcctgtca ataaaggaga aagcaacctg ggaaaaacat 1260tcctctctgt acccagggga ctgccaagtg tgctttatag aaggctggaa gaccgactga 1320agtaggaagc tgtcacatgt ttgagccaac tgagcaaagc agctgttgcc tgccagacag 1380ccaccccaag accaagggag ccagcctgtc gtttgtcctt ctagcctgga agaccagttc 1440ttggctcttg ggcactcaca ttggccactg gccgcaactg ctgaatggct tcactaatgt 1500ccctggggtc tgtatctgcc ctctcttcta ttccctagaa actctggccg ggcatggcgg 1560ctcacgcctg tcatcccagc acttagggag gccgaggcag gtggatcaca aggtcaagag 1620atcgacacca tcctggccaa catggtgaaa ccccatctct actaaaaata caaaaattag 1680ctggacatgg tggtgggcgc ctgtagtccc agctacttgg gaggctgagg caggagaatt 1740gcttgaactc gggaggcgta ggttgcagtg agccaagatc gcaccactgc actccagcct 1800ggcaacagag caagactcct caaaaaacaa acaaacaaac aaacaaactc tgatcattca 1860cccggtggga tccccggcag ctccttctcc ttcccgagct gtggctcatg ggccattgga 1920ttcagagacc ttgagctggg tgctggctgc cctaaaggag cacgacccct ccagcctggt 1980gaccgggagg cagagaagta cagctgtcct tgacaaaggc ccagcctctg ctgcctcagg 2040ccagcctggc cacaccccga tgccacagtc atctgccccg cccaggcata agcctgactc 2100aggtgataca ggcgaggctt ctcccatggg tcctcccctt gtgagaaagg gtctgtgctg 2160tgtaccttct ctctgcacag ccattgtcag tgtggtttgg agtgagtgag cctcccgcac 2220tgctcagggg agagctggtg agcatgactc catggcctcc tgctggttgg ggtcttcttc 2280tgattctcac ccgcaggagc acccagaccc ccccttttca gaaatgatta cattttccct 2340tcaagagtca tctgtgacct ggtggtgtgg agggactgtc ccctcctaca gcctggccga 2400cccccttcct ccagggctgt gtggaatcac ctctcagaag ctcactctga aaagccactc 2460acagggattt caccaggatg ttgctgttcc tgccgacacc tgggctttgt gacaaatgct 2520gtttgcttca agctgttcac aagcaacttc accagaatcc caagctggtt cgtacttaat 2580ttgtatacat acatatgcat aatatacatg accatgtatg agatacagac accatggctt 2640ctgtccattg gctcattcgc ctggtcgcat gttcactcca tgaggttagg acactgcggg 2700tggctttggg atgggtggtt tcagggacaa ggtgtcgctg tgatctctgt atttgctaac 2760tagtcttgtt ttgatttcta acggtctagt ggagtacagt taatgttgtg tttatttctg 2820taactgtagg ggtggagtat aaacctaact tttggaaaca tgaagaaata aacaatagcg 2880ccagccgtta aaaaaaaaaa aaaaaaaaaa aaaaaa 2916<210>8<211>2916<212>DNA<213>智人(Homo sapiens)<220><221>CDS<222>(1337)..(1645)<400>8gaaaagacgt ttaataaaac agctttacct tttaaaaata aaatttcaat cccagtctgc 60ctcaggtacg ggtgggggtg tgcagcgtga ctcctggctg tgttcctgta ccgtttgtgg120cctccggggt cttgcgcgtc cagggcccag ataccgagta actgccatgt ggtgtcgtgg180tggcgtccat aggcctccgt ggtggggcgg gggcggggct gtgggtgtgc agggcagctg240cattttccaa 8agtggagat ggaggatgga gatttgcttc gtaaaggcct gggagctaca300tgggaggtag ggaggggcca gccacaccca gggctggggg gccggtggac tctgcccagt360gaagccaggg gagtgtcagc aatgaggggc ctggacagcg acgcgggacc cgcacctggg420agcggcagag atggagccca gctcgctaaa cgtaccctaa gggtgcacgc tgaccgtctt480tgatccctgg acagtgtcca tagagttgtc tccccttcgg tcacattgtc cctggccttg540gagtttctgc ctcagggaaa gacccactaa aaccacccgg gctctggcgg cctcctcttc600tccagagcat ggtggcgctg cctcctgagc agagtcactg agagtgggtc caaggaaggg660acccacttag caaaggttgt tgtgtggtgc tgtgcaggca cggcgcctgg agttggcccc720gccagcatcg gggtggcttg gggctctggt tcctaagctt ctgcttctga gttggtcagc780acgttggctc tgcgccctgc agtgcctgtc ttgatggtgg tccctggatg tgctgaaggg840ctccaggagc aaggggccag accacacttt ggctgagtcc ttgggtagtt tcagagggtc900acctgcacag tctgcattga gcaccctggg gctgaggccg tgggtcaagt tctgcctgac960agtgctttga ttatatggtg atgtgattct gcaaacataa ccccccaact gagtgccagc 1020tgctgggtgt ccccacctca agagccaagg ggaggccacc ctggaactgg tgctttgccc 1080ttggtgtcat ggaggtgtct gggtccacac gtggtgggtg ggctgggcct gcagtcaccc 1140agcatggccg gcgggattgg acccagctgc aacctggcag gttccatggg gcttcctgtg 1200cctgggcctg cctgtgtctc atgcctgtca ataaaggaga aagcaacctg ggaaaaacat 1260tcctctctgt acccagggga ctgccaagtg tgctttatag aaggctggaa gaccgactga1320agtaggaagc tgtcac atg ttt gag cca act gag caa agc agc tgt tgc ctg1372Met Phe Glu Pro Thr Glu Gln Ser Ser Cys Cys Leu1 5 10cca gac agc cac ccc aag acc aag gga gcc agc ctg tcg ttt gtc ctt 1420Pro Asp Ser His Pro Lys Thr Lys Gly Ala Ser Leu Ser Phe Val Leu15 20 25cta gcc tgg aag acc agt tct tgg ctc ttg ggc act cac att ggc cac 1468Leu Ala Trp Lys Thr Ser Ser Trp Leu Leu Gly Thr His Ile Gly His30 35 40tgg ccg caa ctg ctg aat ggc ttc act aat gtc cct ggg gtc tgt atc 1516Trp Pro Gln Leu Leu Asn Gly Phe Thr Asn Val Pro Gly Val Cys Ile45 50 55 60tgc cct ctc ttc tat tcc cta gaa act ctg gcc ggg cat ggc ggc tca 1564Cys Pro Leu Phe Tyr Ser Leu Glu Thr Leu Ala Gly His Gly Gly Ser65 70 75cgc ctg tca tcc cag cac tta ggg agg ccg agg cag gtg gat cac aag 1612Arg Leu Ser Ser Gln His Leu Gly Arg Pro Arg Gln Val Asp His Lys80 85 90gtc aag aga tcg aca cca tcc tgg cca aca tgg tgaaacccca tctctactaa1665Val Lys Arg Ser Thr Pro Ser Trp Pro Thr Trp95 100aaatacaaaa attagctgga catggtggtg ggcgcctgta gtcccagcta cttgggaggc1725tgaggcagga gaattgcttg aactcgggag gcgtaggttg cagtgagcca agatcgcacc1785actgcactcc agcctggcaa cagagcaaga ctcctcaaaa aacaaacaaa caaacaaaca1845aactctgatc attcacccgg tgggatcccc ggcagctcct tctccttccc gagctgtggc1905tcatgggcca ttggattcag agaccttgag ctgggtgctg gctgccctaa aggagcacga1965cccctccagc ctggtgaccg ggaggcagag aagtacagct gtccttgaca aaggcccagc2025ctctgctgcc tcaggccagc ctggccacac cccgatgcca cagtcatctg ccccgcccag2085gcataagcct gactcaggtg atacaggcga ggcttctccc atgggtcctc cccttgtgag2145aaagggtctg tgctgtgtac cttctctctg cacagccatt gtcagtgtgg tttggagtga2205gtgagcctcc cgcactgctc aggggagagc tggtgagcat gactccatgg cctcctgctg2265gttggggtct tcttctgatt ctcacccgca ggagcaccca gaccccccct tttcagaaat2325gattacattt tcccttcaag agtcatctgt gacctggtgg tgtggaggga ctgtcccctc2385ctacagcctg gccgaccccc ttcctccagg gctgtgtgga atcacctctc agaagctcac2445tctgaaaagc cactcacagg gatttcacca ggatgttgct gttcctgccg acacctgggc2505tttgtgacaa atgctgtttg cttcaagctg ttcacaagca acttcaccag aatcccaagc2565tggttcgtac ttaatttgta tacatacata tgcataatat acatgaccat gtatgagata2625cagacaccat ggcttctgtc cattggctca ttcgcctggt cgcatgttca ctccatgagg2685ttaggacact gcgggtggct ttgggatggg tggtttcagg gacaaggtgt cgctgtgatc2745tctgtatttg ctaactagtc ttgttttgat ttctaacggt ctagtggagt acagttaatg2805ttgtgtttat ttctgtaact gtaggggtgg agtataaacc taacttttgg aaacatgaag2865aaataaacaa tagcgccagc cgttaaaaaa aaaaaaaaaa aaaaaaaaaa a 2916<210>9<211>103<212>PRT<213>智人(Homo sapiens)<400>9Met Phe Glu Pro Thr Glu Gln Ser Ser Cys Cys Leu Pro Asp Ser His1 5 10 15Pro Lys Thr Lys Gly Ala Ser Leu Ser Phe Val Leu Leu Ala Trp Lys20 25 30Thr Ser Ser Trp Leu Leu Gly Thr His Ile Gly His Trp Pro Gln Leu35 40 45Leu Asn Gly Phe Thr Asn Val Pro Gly Val Cys Ile Cys Pro Leu Phe50 55 60Tyr Ser Leu Glu Thr Leu Ala Gly His Gly Gly Ser Arg Leu Ser Ser65 70 75 80Gln His Leu Gly Arg Pro Arg Gln Val Asp His Lys Val Lys Arg Ser85 90 95Thr Pro Ser Trp Pro Thr Trp100<210>10<211>20<212>DNA<213>人工序列<220><221>misc_feature<223>引物<400>10atgatggtca ggctggtcaa 20<210>11<211>24<212>DNA<213>人工序列<220><221>misc_feature<223>引物<400>11tcgaaagtac aacgctttat tgaa 24<210>12<211>18<212>DNA<213>人工序列<220><221>misc_feature<223>引物<400>12ggccgttgac ctggtgac 18<210>13<211>23<212>DNA<213>人工序列<220><221>misc_feature<223>引物<400>13aaagcaaatg tattcttcct cca 23<210>14<211>20<212>DNA<213>人工序列<220><221>misc_feature<223>引物<400>14tttcaatccc agtctgcctc 20<210>15<211>20<212>DNA<213>人工序列<220><221>misc_feature<223>引物<400>15ggctggcgct attgtttatt 20
權(quán)利要求
1.一種分離的具有抑癌功能的人蛋白，其特征在于，它包含具有選自下組的氨基酸序列的多肽SEQ ID NO3、6、9；或其保守性變異多肽、或其活性片段、或其活性衍生物。
2.如權(quán)利要求1所述的多肽，其特征在于，該多肽是具有選自下組的氨基酸序列的多肽SEQ ID NO3、6、9。
3.一種分離的多核苷酸，其特征在于，它包含一核苷酸序列，該核苷酸序列與選自下組的一種核苷酸序列有至少85％相同性(a)編碼如權(quán)利要求1和2所述多肽的多核苷酸；(b)與多核苷酸(a)互補(bǔ)的多核苷酸。
4.如權(quán)利要求3所述的多核苷酸，其特征在于，該多核苷酸編碼的多肽具有選自下組的氨基酸序列SEQ ID NO3、6、9。
5.如權(quán)利要求3所述的多核苷酸，其特征在于，該多核苷酸的序列選自下組SEQ ID NO2、5、8的編碼區(qū)序列或全長序列。
6.一種載體，其特征在于，它含有權(quán)利要求3所述的多核苷酸。
7.一種遺傳工程化的宿主細(xì)胞，其特征在于，它是選自下組的一種宿主細(xì)胞(a)用權(quán)利要求6所述的載體轉(zhuǎn)化或轉(zhuǎn)導(dǎo)的宿主細(xì)胞；(b)用權(quán)利要求3所述的多核苷酸轉(zhuǎn)化或轉(zhuǎn)導(dǎo)的宿主細(xì)胞。
8.一種具有抑癌功能的人蛋白活性的多肽的制備方法，其特征在于，該方法包含(a)在適合表達(dá)具有抑癌功能的人蛋白的條件下，培養(yǎng)權(quán)利要求7所述的宿主細(xì)胞；(b)從培養(yǎng)物中分離出具有抑癌功能的人蛋白活性的多肽。
9.一種能與權(quán)利要求1所述的具有抑癌功能的人蛋白特異性結(jié)合的抗體。
10.一種藥物組合物，其特征在于，它含有安全有效量的權(quán)利要求1所述的多肽以及藥學(xué)上可接受的載體。
全文摘要
本發(fā)明公開了一類新的具有抑癌功能的人蛋白，編碼此多肽的多核苷酸和經(jīng)重組技術(shù)產(chǎn)生該多肽的方法。本發(fā)明還公開了此多肽用于治療多種疾病如癌癥等的方法。本發(fā)明還公開了抗此多肽的拮抗劑及其治療作用。本發(fā)明還公開了編碼這類新的具有抑癌功能的人蛋白的多核苷酸的用途。
文檔編號C07K14/47GK1458170SQ0211164
公開日2003年11月26日申請日期2002年5月13日優(yōu)先權(quán)日2002年5月13日
發(fā)明者顧健人, 楊勝利申請人:上海新世界基因技術(shù)開發(fā)有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：顧健人;楊勝利
技術(shù)所有人：上海新世界基因技術(shù)開發(fā)有限公司
我是此專利的發(fā)明人

上一篇：抗腫瘤藥物比卡魯胺合成工藝的制作方法
上一篇：多取代的β－單氟代吡咯類化合物及其制備方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、張老師：1.探索新型氧化還原酶結(jié)構(gòu)-功能關(guān)系，電催化反應(yīng)機(jī)制 2.酶電催化導(dǎo)向的酶分子改造 3.納米材料、生物功能多肽對酶-電極體系的影響4. 生物電化學(xué)傳感和生物電合成體系的設(shè)計與應(yīng)用。
2、鄔老師：1.高分子材料的共混與復(fù)合 2.涉及材料功能化及結(jié)構(gòu)與性能的研究；高分子熱穩(wěn)定劑的研發(fā)
3、趙老師：1.電化學(xué)離子儲存和分離技術(shù) 2.工業(yè)結(jié)晶
4、廖老師：1. 晶面可控氧化鋁、碳基載體及催化劑等高性能、新結(jié)構(gòu)催化材料研究 2. 乙烯環(huán)氧化催化劑的研究與開發(fā) 3. 低碳不飽和烯烴的選擇性氧化催化劑及工業(yè)技術(shù)開發(fā)
5、李老師：1. 加氫精制 2. 選擇加氫 3. 加氫脫氧 4. 介孔及介微孔分子篩合成及催化應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

抑癌蛋白相關(guān)技術(shù)

蛋白酶抑制劑相關(guān)技術(shù)

胰蛋白酶抑制劑相關(guān)技術(shù)

cocktail蛋白酶抑制劑相關(guān)技術(shù)

絲氨酸蛋白酶抑制劑相關(guān)技術(shù)

蛋白酶體抑制劑相關(guān)技術(shù)

半胱氨酸蛋白酶抑制劑相關(guān)技術(shù)

蛋白激酶抑制劑相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

具有抑癌功能的新的人蛋白及其編碼序列的制作方法