專利名稱:克隆、表達及測序一體化載體及其用途的制作方法
技術領域:
本發(fā)明涉及重組DNA技術,更具體地涉及一種新的克隆、表達及測序一體化的表達載體。本發(fā)明還涉及該新型表達載體的構建方法和用途。
目前,利用原核表達系統(tǒng)表達真核基因仍然是大量獲得真核基因產物的主要方法。作為最早和最廣泛使用的表達系統(tǒng)之一,原核表達系統(tǒng)中的大腸桿菌表達系統(tǒng)到目前為止仍然是表達蛋白質的基本系統(tǒng)。盡管經(jīng)過了近四十年的研究,并在分子生物學基礎研究和基因工程生產等方面都取得了令人矚目的成就,但是目前尚無一個完善的系統(tǒng)能保證所有外源基因的高表達。另一方面,由于表達載體的特殊要求,因此不具備克隆載體的通用性,目前也無一載體能利用商品化的序列測定系統(tǒng)進行測序。這些都是目前所用表達系統(tǒng)的主要缺陷。
為了在原核表達系統(tǒng)中表達外源基因,一般必然涉及克隆、測序和表達等步驟。其中克隆外源基因已廣泛采用PCR技術,因而較為方便。但是克隆和表達一個已知外源基因仍很麻煩,至少需要兩次克隆(1)要用克隆載體來克隆PCR擴增出的基因片段,并在克隆載體中鑒定基因序列;(2)再將基因片段克隆至表達載體中,以便進行表達。這一過程不僅導致基因在多次克隆中出現(xiàn)錯誤的幾率上升,而且在AUG前必須有一個酶切位點以便于插入表達基因,并且使得Shine-Dalgarno(SD)序列與AUG之間的序列被固定,從而不利于各種基因的表達。
因此,本領域中一直需要一種能在同一載體上進行克隆、測序和表達的載體。
本發(fā)明的目的之一就是提供一種克隆、表達、測序一體化的載體,從而減少克隆次數(shù)并簡化克隆操作過程。
本發(fā)明的另一目的是提供一種新的克隆、測序和表達外源基因的方法,從而減少克隆次數(shù)并簡化克隆操作過程。
本發(fā)明的還涉及一體化載體的用途,它被用于克隆、測序和表達外源基因,從而可減少克隆次數(shù)并簡化克隆操作過程。
本發(fā)明的一體化載體依次含有以下元件(1)控制外源基因轉錄啟動子,(2)反向測序引物序列,(3)核糖體結合位點序列(RBS序列)和SD序列,(4)緊跟于SD序列下游的多克隆位點,(5)正向測序引物序列,其中元件(3)和(5)的位置可互換,(6)控制外源基因終止的終止子,其中,多克隆位點含有平末端類型的限制性內切酶的酶切位點,而且SD-AUG間隔為5-8個核苷酸。
使用本發(fā)明的克隆、表達、測序一體化的載體,可使外源基因表達的全過程在一個載體上即能完成。在一個較佳例子中,本發(fā)明的一體化表達載體還可靈活改變從SD到AUG間的序列,從而實現(xiàn)對翻譯起始序列的自由設計。
為了實現(xiàn)本發(fā)明的目的,本發(fā)明一體化載體應含有啟動子,尤其是強啟動子如pL啟動子、lac啟動子、trp啟動子、tac啟動子等。為了便于分離產物,較佳地可以選用熱敏型的啟動子。這類熱敏型啟動子是本領域技術人員熟知的,它們通常在常溫(30℃左右,如32℃)時是不起作用的,但是當溫度升高(如約40℃)時就發(fā)揮啟動子的作用。在本發(fā)明的一個優(yōu)選例中選用了熱敏型的強啟動子pL啟動子(參見Sambrook等人,《分子克隆實驗室手冊》(New YorkCold SpringHarbor Laboratory Press,1989))。為了配合該pL啟動子的使用,同時使用了其抑制基因CI857-2H(參見《分子克隆》;以及陳南春,高輝,陳蘇民等?!癱I857基因的體外定位同義突變”,生物化學雜志,1994,10509-512)。
當然,也可以使用化學誘導型的啟動子。當培養(yǎng)基中加入有關的誘導物時,這類啟動子就發(fā)揮其誘導作用,如lac啟動子、trp啟動子等。
為了具有測序的功能,本發(fā)明的一體化載體還含有測序引物序列。許多測序載體中的測序引物序列都可選擇用于本發(fā)明。在一體化載體中,測序引物序列的位置是在多克隆位點的上游或下游附近,而且較佳地可在載體中同時含有正向和反向的測序引物序列。
一些已知的通用測序引物序列也可以用于本發(fā)明,其中包括例如pUC/M13引物序列、SP6/T7T3引物序列、pBR322引物序列。在本發(fā)明的一個優(yōu)選例中,使用的是M13mp18的通用測序引物序列。更佳地,在多克隆位點上游具有M13mp18的反向測序引物序列(#1201),在多克隆位點下游具有M13mp18的通用正向測序引物序列(#1211)。
此外,正向測序引物序列和反向測序引物序列的位置也可互換。較佳地,反向測序引物序列宜在多克隆位點的上游。
在本發(fā)明中,在多克隆位點上游和測序引物序列之間有核糖體結合位點(RBS)序列,一般核糖體結合位點序列含有SD序列(AAGGAG)。許多已知的核糖體結合位點都可用于本發(fā)明,較佳地該核糖體結合位點衍生自噬菌體。
在本發(fā)明的一個優(yōu)選例中,選用的是T7噬菌體基因10的RBS序列。研究表明,T7噬菌體基因10的RBS序列具有翻譯增強活性(Olins PO,Devine CS,Rangwala SH,etal.The T7 phage gene 10 leader RNA,a ribosome-binding site thatdramatically enhances the expression of foreign genes in Escherichia coli.Gene 1988;73227-235;Olins PO和Rangwala SH.A novel sequence element derived frombacteriophage T7 mRNA acts as an enhancer of translation of the lacZ gene inEscherichia coli.J Biol Chem 1989;26416973-16976;Olins PO和Rangwala SH.Vector for enhanced translation of foreign genes in Escherichia coli.Methods Enzymol1990;185115-119),人們稱之原核翻譯增強子Epsilon(enhancer of proteinsynthesis initiation),該RBS序列包含了AAGGAG(SD序列)。使用該RBS序列時,可進一步提高翻譯表達量。
緊跟著RBS序列下游的是多克隆位點。換言之,在SD序列下游是多克隆位點。雖然已有技術中已有許多種類的多克隆位點,但是為了構建出一體化的載體,需要對多克隆位點的結構和位置進行優(yōu)化。即該多克隆位點宜含有平末端類型的限制性內切酶的酶切位點,而且SD-AUG間隔為5-8個核苷酸。
如上所述,常規(guī)的利用PCR技術克隆和表達外源基因的過程存在兩個主要問題第一是要進行再次克隆,從而無法保證第二次克隆完全正確;第二是在AUG前必須有一個酶切位點以便于插入表達基因,這導致問題是AUG前的序列很難控制,而使得SD與ATG之間的序列被固定,因而不利于基因的表達。
研究表明,SD-AUG間隔以及AUG上下游序列對基因表達的水平有極大的影響,其差別可達2000倍(Gold L."Postranscriptional regulatory mechanisms inEscherichia coli."Ann Rev Bilchem.198857199-233)。當SD序列固定時,SD-AUG間隔一般為5-13bp,Ringquist等人(Ringquist S,Shinedling S和Barrick D.等人."Translation initiation in Escherichia colisequences within the ribosome-binding site".Mol Microbiol 1992;61219-1229)和Min KT等人(Min KT,Kim MH和Lee DS.“Search for the optimal sequence of the ribosome binding site by randomoligonucleotide-directed mutagenesis”.Nucleic Acids Res 1988;165075-5088)的實驗表明,SD-AUG間隔以5bp為最佳。關于SD-AUG間隔區(qū)組成的一些研究結果還可有de Boer HA和Hui AS."Sequences within ribosome binding site affectingmessenger RNA translatability and method to direct ribosomes to single messengerRNA species",Methods Enzymol 1990;185103-114。
其次,AUG前的三個核苷酸以UAU、CUU組合為最佳,一定要避免AGG、UUC、UCA(Min KT,Kim MH和Lee DS.“Search for the optimalsequence of the ribosome binding site by random oligonucleotide-directedmutagenesis”.Nucleic Acids Res 1988;165075-5088)??紤]最佳組合序列時發(fā)現(xiàn),AUG前根本就沒有一個限制性內切酶的識別序列能滿足要求。常用的EcoRI位點正是應當避免的序列,因為它在AUG前的三個核苷酸正好是UUC。
為了提高表達效率,在多克隆位點中宜含有平末端類型的限制性內切酶的酶切位點,如SspI、Bst1107I、HpaI、DraI和EcoRV位點。在本發(fā)明的一個較佳例子中,在SD序列后緊跟著的是EcoRV位點。這使人們可以方便地利用該酶的平末端特性,從而在設計表達外源基因時AUG前的序列具有極大的靈活性。
在另一優(yōu)選例子中,采用5-8個核苷酸的SD-AUG間隔,并且AUG前的三個核苷酸均由A和U組成,從而進一步提高表達效率。
本發(fā)明的一體化載體還含有終止序列。在本領域中已知眾多終止序列元件幾乎都可用于本發(fā)明。較佳地是原核生物的終止序列。在本發(fā)明的一個例子中選用了rrnBT1T2片段,該片段是強終止序列,而且還有穩(wěn)定作用。
至于復制起點ori和抗性基因等元件,沒有任何特別限制。比如,抗性篩選基因可選用四環(huán)素抗性基因、新霉素抗性基因、或氨芐青霉素抗性基因。
圖1是載體pJL6的結構示意圖。
圖2是本發(fā)明的一種一體化載體pLCM182的構建示意圖。
圖3是本發(fā)明一種一體化載體pLCM182中克隆-表達-測序元件的局部序列圖。
圖4是用本發(fā)明的一體化載體pLCM182表達表達hIL-4、hIL-17和hIL-1RA的電泳圖。其中從左至右依次為泳道1,蛋白質分子量標準;泳道2,hIL-1RA;泳道3,hIL-4;泳道4,hIL-17;泳道5,pLCM182空白載體對照。
圖5是pJT6的序列表圖。
下面結合附圖和實施例,進一步詳細地闡述本發(fā)明。應理解,這些具體實施例用于說明目的而并非用于限制本發(fā)明范圍。下列實施例中未注明具體條件的實驗方法,基本上都按照本領域常規(guī)技術操作的條件進行,如Sambrook等人,分子克隆實驗室手冊(New YorkCold Spring Harbor Laboratory Press,1989)中所述的條件,或者按照制造廠商所建議的條件進行。
實施例1克隆、表達、測序一體化載體的構建A.材料主要菌株與載體大腸桿菌DH5α購自Gibco;去除了兩個HindIII位點的cI857基因(cI857-2H)(陳南春,高輝,陳蘇民等?!癱I857基因的體外定位同義突變”,生物化學雜志,1994,10509-512)和pJL6(結構示意圖見圖1,詳細序列可參見圖5)從第四軍醫(yī)大學生化教研室獲得;pKK233-2和pUC18購自Pharmacia公司。
主要實驗試劑及材料各種工具酶購自Promega公司。T7 DNA測序試劑盒購自Pharmacia公司。全自動熒光測序試劑盒Big Dye購自PE公司。
人工合成DNA片段由Cybersyn公司合成,包括如下片段T7噬菌體基因10的核糖體結合位點(ribosome binding site,RBS)序列(OlinsPO,Devine CS,Rangwala SH,等人,“The T7 phage gene 10 leader RNA,aribosome-binding site that dramatically enhances the expression of foreign genes inEscherichia coli.”Gene 1988;73227-235)上鏈5’-AATTTTGTTTAACTTTAAGAAGGAGATATCG-3′;下鏈5’-GATCCGATATCTCCTTCTTAAAGTTAAACAA-3′;兩片段經(jīng)退火后形成雙鏈,5’為EcoRI粘端,3’為BamHI粘端,中間含EcoRV位點。
載體構建及序列測定請參見圖2的構建步驟流程?;静襟E如下首先將合成的DNA片段退火后插入pUC18載體的EcoRI、BamHI位點之間,然后以M13mp18的正反測序引物(來自T7 DNA測序試劑盒,Pharmacia)擴增出該段序列以備后用。同時,將pKK233-2的強轉錄終止序列rrnBT1T2(SspI-HindIII)插入pUC18的SspI-HindIII之間,取代LacZ序列;其次,將pJL6的pL啟動子序列(EcoRI-BamHI)插入前一載體的EcoRI-BamHI之間;再將cI857-2H(BglII-KpnI)插入前一載體的EcoRI-PvuII之間;最后,將正反測序引物擴增出的片段(含T7噬菌體基因10的核糖體結合序列[RBS]、多克隆位點及兩端的測序引物)插入前一載體的BstXI-HindIII之間。構建全過程步驟均經(jīng)酶切鑒定以確定無誤。將構建的載體命名為pLCM182。利用ABI 377全自動測序儀測定pLCM182的序列,以M13mp18的正反向測序引物雙向測序。
所構建的載體pLCM182如圖2所示,序列測定與預期結果一致。其中克隆、表達、測序元件的局部序列如圖3所示。
10 20 3040 50 60 70AGGAAACAGC TATGACCATG ATTACGAATT TGTTTAACTT TAAGAAGGAG ATATCGGATC CTCTAGAGTC80 90 100110GACCTGCAGG CATGCAAGCT TGGCACTGGC CGTCGTTTTA CAGCTT在這種一體化載體的克隆、表達、測序元件局部序列中,第5-20堿基為M13mp18的反向測序引物(#1201);第27-50堿基為T7噬菌體基因10的RBS序列,其中AAGGAG是SD序列;第50-91堿基為多克隆位點,其中包含EcoRV(該位點緊接SD序列)、BamHI、XbaI、SalI、PstI、SphI、HindIII;第95-111堿基為M13mp18的通用測序引物(#1211)。
構建出的載體pLCM182中,以強啟動子pL及終止子rrnBT1T2控制外源基因轉錄及終止。在SD序列上游含M13mp18的反向測序引物(#1201)序列;SD序列下游緊跟多克隆位點及M13mp18的通用測序引物(#1211)序列。外源基因插入該載體后,可直接誘導表達,有表達還可直接利用通用測序引物測序,所測定的序列直接反應了表達載體上的實際序列,避免了從克隆載體到表達載體的克隆過程中所產生的錯誤,從而極大限度地保證了表達基因的正確性。此外,對多克隆位點進行的改造,可以適應多種形式的表達需要。
實施例2用一體化載體進行基因的克隆、測序和表達由Cybersyn公司合成以下人工DNA片段,作為引物人IL-4 PCR引物序列為上游5’-ATAATGCACAAGTGCGATATCACCTTA-3′;下游5’-TTGGATCCTCAGCTCGAACACTTTGAATA-3′;人IL-17 PCR引物序列為上游5’-AATATGATAGTGAAGGCAGGAATCAC-3′;下游5’-AAGGATCCTTAGGCCACATGGTGGACAA-3′;人IL-1RA PCR引物序列為上游5’-TATATGCGACCCTCTGGGAGAAAATC-3′;下游5’-AAGGATCCTTACTCGTCCTCCTGGAAGT-3′。
將用PHA刺激的人外周血單個核細胞mRNA的反轉錄產物,作為人白細胞介素-4(hIL-4)和人白細胞介素-1受體拮抗劑(hIL-1RA)基因的來源。將原代培養(yǎng)的人成纖維細胞mRNA反轉錄產物,作為人白細胞介素-17基因(hIL-17)的來源。
利用PCR技術從相應模板中擴增出hIL-4、hIL-17和hIL-1RA基因,將上述三種基因分別插入pLCM182的EcoRV-BamHI位點之間。此外,在克隆后的載體中,SD-AUG之間的間距分別為5、6、8個核苷酸。鑒定所得的陽性克隆直接作熱誘導表達。
其中熱誘導表達方法如下將振搖過夜的大腸桿菌以1%接種至培養(yǎng)基中,在32℃振搖,約2-3小時后,待其恰巧進入生長平臺期時,立即轉入42℃繼續(xù)培養(yǎng),在4-5小時后收獲細菌,測定其中的表達產物。
表達結果如圖4所示,從左至右分別為1,蛋白質分子量標準;2,hIL-1RA;3,hIL-4;4,hIL-17;5,pLCM182空白載體對照。其中hIL-4、hIL-17以及IL-1RA的表達量經(jīng)條帶灰度掃描分析均高于25%。
高表達的基因表達克隆可利用測序引物直接進行測序。上述基因直接在表達載體上利用通用測序引物測序,序列結果與文獻報道一致。
如上所述,本發(fā)明一體化載體的優(yōu)點是,所有被克隆的基因均由PCR得到,并在同一載體上進行序列測定,結果均正確;而且各基因克隆的表達量均高于報道水平。因此該載體的構建在實際工作中極大地方便了基因的克隆、測序及表達。
盡管本發(fā)明是根據(jù)最佳實施例進行描述的,但是應理解本領域一般技術人員在閱讀了本發(fā)明的講授內容后,可以進行各種變動和修飾,這些都落于本發(fā)明權利要求所限定的范圍內。
權利要求
1.一種載體,其特征在于,它包括以下元件(1)控制外源基因轉錄的啟動子,(2)反向測序引物序列,(3)RBS序列和SD序列,(4)緊跟于SD序列下游的多克隆位點,(5)正向測序引物序列,其中元件(3)和(5)的位置可互換,(6)控制外源基因終止的終止子,其中,多克隆位點含有平末端類型的限制性內切酶的酶切位點,而且SD-AUG間隔為5-8個核苷酸。
2.如權利要求1所述的載體,其特征在于,其中啟動子是pL啟動子,而且該載體還含有CI857-2H基因。
3.如權利要求1所述的載體,其特征在于,反向測序引物序列是M13mp18的反向測序引物序列#1201,而正向測序引物是M13mp18的正向測序引物序列#1211。
4.如權利要求1所述的載體,其特征在于,RBS序列是T7噬菌體基因10的RBS序列;而且,該終止子是rrnBT1T2片段、
5.如權利要求1所述的載體,其特征在于,該多克隆位點含有EcoRV位點,SD-AUG間隔為5個核苷酸,并且AUG前的三個核苷酸均由A和U組成。
6.如權利要求1所述的載體,其特征在于,啟動子是pL啟動子,而且該載體還含有CI857-2H基因;反向測序引物序列是M13mp18的反向測序引物序列#1201,而正向測序引物是M13mp18的正向測序引物序列#1211;RBS序列是T7噬菌體基因10的RBS序列;終止子是rrnBT1T2片段;該多克隆位點含有EcoRV位點,SD-AUG間隔為5個核苷酸,并且AUG前的三個核苷酸均由A和U組成。
7.如權利要求1所述的載體,其特征在于,該載體是pLCM182。
8.一種克隆、測序和表達外源基因的方法,其特征在于,它使用權利要求1所述的載體。
9.如權利要求1所述載體的用途,其特征在于,它被用于克隆、測序和/或表達外源基因。
10.如權利要求9所述的用途,其特征在于,該載體是pLCM182。
全文摘要
本發(fā)明公開了一種一體化載體,它含有元件:(1)控制外源基因轉錄啟動子,(2)反向測序引物序列,(3)RBS序列和SD序列,(4)緊跟于SD序列下游的多克隆位點,(5)正向測序引物序列,(6)控制外源基因終止的終止子,其中,多克隆位點含有平末端類型的限制性內切酶的酶切位點,而且SD-AUG間隔為5—8個核苷酸??稍谕惠d體上進行外源基因的克隆、測序和表達,從而大大方便了基因克隆、測序及表達工作。本發(fā)明還涉及該新載體的用途。
文檔編號C12N15/63GK1242427SQ9811633
公開日2000年1月26日 申請日期1998年7月17日 優(yōu)先權日1998年7月17日
發(fā)明者曹雪濤, 趙忠良, 黃欣 申請人:上海華晨生物技術研究所