專利名稱:2μm家族質粒及其用途的制作方法
技術領域:
本申請涉及改良的質粒及其用途。
背景技術:
已經證明,某些密切相關的芽殖酵母(budding yeast)物種含有天然存在的環(huán)狀雙鏈DNA質粒。這些質粒統(tǒng)稱為2μm家族質粒,包括來自魯氏接合糖酵母(Zygosaccharomyces rouxii,以前歸入雙孢接合糖酵母Zygosaccharomyces bisporus)的pSR1、pSB3或pSB4,來自拜列氏接合糖酵母(Zygosaccharomyces bailii)的pSB1或pSB2,來自發(fā)酵接合糖酵母(Zygosaccharomyces fermentati)的pSM1,來自果蠅克魯維氏酵母(Kluyveromyces drosophilarum)的pKD1,來自膜醭畢赤氏酵母(Pichiamembranaefaciens)的未命名質粒(下文稱為“pPM1”),及來自啤酒糖酵母(Saccharomyces cerevisiae)(Volkert等人,1989,Microbiological Reviews,53,299;Painting等人,1984,J.Applied Bacteriology,56,331)和其它糖酵母物種諸如卡爾斯伯糖酵母(S.carlsbergensis)的2μm質粒和變體(諸如Scp1、Scp2和Scp3)。作為一個質粒家族,這些分子共享一系列共有特征,即它們通常在質粒的對邊(opposite sides)具有兩個反向重復片段,具有6kb左右(范圍為4757至6615bp)的相似大小,至少三個開放讀碼框,其中一個編碼位點特異性重組酶(諸如2μm中的FLP),以及自主復制序列(ARS),也稱為復制起點(ori),位于反向重復片段之一的末端附近(Futcher,1988,Yeast,4,27;Murray等人,1988,J.Mol.Biol.,200,601;及Toh-e等人,1986,Basic Life Sci.,40,425)。盡管它們缺乏可辨認的DNA序列同源性,然而它們共享的開放讀碼框的分子構造和功能保守性證明了家族成員之間的共有聯(lián)系。
2μm質粒(
圖1)是6318bp雙鏈DNA質粒,在大多數啤酒糖酵母菌株中是內源的,每個單倍體基因組有60-100個拷貝。2μm質粒包含由兩個599bp反向重復序列分開的小獨特(US)區(qū)和大獨特(UL)區(qū)。反向重復序列的位點特異重組導致A型和B型質粒之間的體內互變(Volkert和Broach,1986,Cell,46,541)。兩種形式的2μm質粒只有它們獨特區(qū)的相對取向不同。
盡管來自啤酒糖酵母的克隆2μm質粒(也稱為Scp1)的DNA測序給出了6318bp的大小(Hartley和Donelson,1980,Nature,286,860),然而已知存在其它略微較小的2μm變體Scp2和Scp3,分別是稱為STB的區(qū)域中125bp和220bp小段刪除的結果(Cameron等人,1977,Nucl.Acids Res.,4,1429;Kikuchi,1983,Cell,35,487;及Livingston和Hahne,1979,Proc.Natl.Acad.Sci.USA,76,3727)。在一項研究中,來自世界各地的天然糖酵母菌株中約80%含有與2μm同源的DNA(根據Southern印跡分析)(Hollenberg,1982,Current Topics in Microbiology and Immunobiology,96,119)。此外,在啤酒糖酵母和卡爾斯伯糖酵母中發(fā)現(xiàn)的天然2μm質粒群內存在變異(遺傳多態(tài)性),NCBI序列(編號NC 001398)是一個實例。
2μm質粒具有核定位,而且展示高水平的有絲分裂穩(wěn)定性(Mead等人,1986,Molecular & General Genetics,205,417)。2μm質粒的固有穩(wěn)定性源自質粒編碼的拷貝數擴增和分配機制,它在嵌合載體的開發(fā)過程中易于受到損害(Futcher和Cox,1984,J.Bacteriol.,157,283;Bachmair和Ruis,1984,Monatshefte für Chemie,115,1229)。將含有2μm質粒的酵母菌株稱為[cir+],而將不含2μm質粒的酵母菌株稱為[cir0]。
2μm質粒的US區(qū)含有REP2和FLP基因,而UL區(qū)含有REP1和D(也稱為RAF)基因、STB基因座和復制起點(Broach和Hicks,1980,Cell,21,501;Sutton和Broach,1985,Mol.Cell.Biol.,5,2770)。Flp重組酶結合反向重復片段內的FRT位點(Flp識別靶)以介導位點特異重組,這對于體內天然質粒擴增和質粒拷貝數控制是至關重要的(Senecoff等人,1985,Proc.Natl.Acad.Sci.USA,82,7270;Jayaram,1985,Proc.Natl.Acad.Sci.USA,82,5875)。Flp重組酶活性的變化能夠顯著影響2μm家族質粒的拷貝數(Sleep等人,2001,Yeast,18,403;Rose和Broach,1990,MethodsEnzymol.,185,234)。Rep1和Rep2蛋白質介導質粒分離,盡管它們的作用模式尚不清楚(Sengupta等人,2001,J.Bacteriol.,183,2306)。它們還抑制FLP基因的轉錄(Reynolds等人,1987,Mol.Cell.Biol.,7,3566)。
2μm質粒的FLP和REP2基因由不同的啟動子轉錄,且它們之間顯然沒有已定義的居間序列。FLP和REP2轉錄本都在反向重復序列內的相同序列基序處終止,分別在它們翻譯終止密碼子后面的24bp和178bp處(Sutton和Broach,1985,Mol.Cell.Biol.,5,2770)。
在FLP的情況中,C端編碼序列也位于反向重復序列內。此外,兩個反向重復序列在599bp上高度保守,認為這種特征有利于體內的高效質粒復制和擴增,盡管只有FRT位點(少于65bp)是體內位點特異重組所必需的(Senecoff等人,1985,Proc.Natl.Acad.Sci.USA,82,7270;Jayaram,1985,Proc.Natl.Acad.Sci.USA,82,5875;Meyer-Leon等人,1984,Cold SpringHarbor Symposia On Quantitative Biology,49,797)。Flp的關鍵催化殘基是精氨酸308和酪氨酸343(其是必需的),而組氨酸309和組氨酸345促進鏈切割(Prasad等人,1987,Proc.Natl.Acad.Sci.USA,84,2189;Chen等人,1992,Cell,69,647;Grainge等人,2001,J.Mol.Biol.,314,717)。
在Rep2中描述了兩個功能性結構域。殘基15-58形成Rep1結合結構域,而殘基59-296含有自我締合和STB結合區(qū)(Sengupta等人,2001,J.Bacteriol.,183,2306)。
缺乏2μm質粒的許多必需功能區(qū)但保留功能性順式元件ARS和STB的2μm質粒的嵌合或大段刪除的突變衍生物不能在細胞分裂時在母細胞和子細胞之間有效分配。如果通過例如在宿主內提供功能性2μm質粒而反式提供這些功能即所謂的[cir+]宿主,那么這些質粒就能這樣做。
先前已經將目的基因插入2μm質粒的UL區(qū)。例如,參閱EP 0 286 424中的質粒pSAC3U1。然而,對于能夠有效插入2μm質粒的UL區(qū)且在US和UL區(qū)之間不產生過度不對稱性的DNA數量很可能存在限制。因此,2μm質粒的US區(qū)對于插入額外DNA序列特別有吸引力,因為這趨向于使反向重復片段兩側的DNA片段的長度相等。
其中質粒早就因導入酵母選擇標記和相鄰DNA序列而塞滿的表達載體,諸如圖2所示,尤其如此。例如,圖2所示質粒包含β-內酰胺酶基因(用于氨芐青霉素抗性)、LEU2選擇標記和寡核苷酸接頭,其中后兩種插入2μm家族非整合載體pSAC3UL區(qū)內唯一SnaBI位點(參閱EP 0 286 424)。圖2所示質粒在轉化到酵母中后遺失XbaI位點之間含有氨芐青霉素抗性基因的大腸桿菌DNA。這在Chinery和Hinchliffe,1989,Curr.Genet.,16,21和EP 0 286 424中有所描述,其中這些類型的載體稱為“非整合載體”。在圖2所示塞滿狀態(tài)中,不太容易看出哪里可以進行進一步的多核苷酸插入。接頭內的NotI位點已經用于插入額外的多核苷酸,但是這促成了UL和US區(qū)之間的進一步不對稱性(Sleep等人,1991,Biotechnology(NY),9,183)。
我們先前試圖將額外DNA插入2μm質粒的US區(qū)并維持其高度固有質粒穩(wěn)定性。在2μm家族非整合質粒pSAC300中,含有URA3基因的1.1kb DNA片段以這樣一種方式插入US區(qū)中REP2和FLP之間的EagI位點,使得URA3基因的轉錄與REP2轉錄方向相同(參閱EP 0 286 424)。在通過pSAC300將S150-2B[cir0]轉化成尿嘧啶原養(yǎng)型后,它顯示出顯著不如URA3插入2μmUL區(qū)的可比較載體(在30代內損失0-10%質粒)來得穩(wěn)定(在30代內損失50%質粒)(Chinery和Hinchliffe,1989,Curr.Genet.,16,21;EP 0 286424)。由此,EagI位點處的插入可能干擾FLP表達,并得出結論,即插入位置可能對由此產生的質粒的穩(wěn)定性具有深遠影響,這個結論得到了Bijvoet等人,1991,Yeast,7,347的證實。
希望將其它多核苷酸序列插入2μm家族質粒。例如,可能希望插入編碼宿主衍生蛋白質、重組蛋白、或是非編碼的反義或RNA干擾(RNAi)轉錄本的多核苷酸序列。此外,希望將多種其它多核苷酸序列導入2μm家族質粒,從而提供這樣的質粒,它們編碼例如多種分開編碼的多亞基蛋白質、相同代謝途徑的不同成員、額外選擇標記或重組蛋白(單個或多個亞基)及幫助重組蛋白表達的蛋白伴侶。
然而,6318bp的2μm質粒和其它2μm家族質粒塞滿了功能性異源元件(Sutton和Broach,1985,Mol.Cell.Biol.,5,2770;Broach導入,1979,Cell,16,827),沒有明顯的位置可用于插入額外的DNA序列而不伴隨著質粒穩(wěn)定性的損失。事實上,除了復制起點和D基因座之間的區(qū)域,整個2μm質粒基因組轉錄成至少一種且常常更多poly(A)+種類(Sutton和Broach,1985,Mol.Cell.Biol.,5,2770)。因此,預計大多數插入可能對體內質粒功能具有有害影響。
事實上,本領域技術人員已經放棄將異源多核苷酸序列插入2μm家族質粒。
Robinson等人,1994,Bio/Technology,12,381-384報告了啤酒糖酵母中重組的額外PDI基因拷貝可用于將人血小板衍生生長因子(PDGF)B同型二聚體的重組表達提高10倍,將粟酒裂殖酵母酸性磷酸酶提高4倍。Robinson使用額外的整合在染色體中的PDI基因拷貝在PDGF和粟酒裂殖酵母酸性磷酸酶的表達中獲得了觀察到的增加。Robinson報告了使用多拷貝2μm表達載體來提高PDI蛋白質水平的嘗試對異源蛋白分泌具有有害作用。
Shusta等人,1998,Nature Biotechnology,16,773-777描述了啤酒糖酵母中單鏈抗體片段(scFv)的重組表達。Shusta報告了在酵母系統(tǒng)中將轉基因整合到宿主染色體中或使用附加型表達載體之間的選擇能夠大大影響分泌,而且參照Parekh和Wittrup,1997,Biotechnol.Prog.,13,117-122,使用δ整合載體將scFv基因穩(wěn)定整合到宿主染色體中優(yōu)于使用基于2μm的表達質粒。Parekh和Wittrup,前述引用先前講授了使用δ整合載體比基于2μm的表達載體將牛胰腺胰蛋白酶抑制物(BPTI)的表達提高了一個數量級?;?μm的表達載體據說對異源分泌性蛋白質生產產生反面作用。
Bao等人,2000,Yeast,16,329-341報告了已經將KlPDI1基因在多拷貝質粒pKan707上導入乳克魯維氏酵母,而且質粒的存在致使菌株的生長情況很差。根據Bao等人,2000中的早期發(fā)現(xiàn),Bao和Fukuhara,2001,Gene,272,103-110選擇在宿主染色體上導入KlPDI1的單個副本。
因此,現(xiàn)有技術教授技術人員將轉基因整合到酵母染色體中,而非導入多拷貝載體中。因此,對轉化酵母的候選方法存在需求。
發(fā)明描述本發(fā)明涉及2μm家族質粒的重組改良形式。
2μm家族質粒是環(huán)狀雙鏈DNA質粒。它通常較小,諸如在排除重組插入序列時的3,000至10,000bp之間,優(yōu)選4,500至7,000bp之間。優(yōu)選用于本發(fā)明的2μm家族質粒包含衍生自如下一種或多種質粒的序列自由魯氏接合糖酵母獲得的pSR1、pSB3或pSB4,由拜列氏接合糖酵母獲得的pSB1或pSB2,由發(fā)酵接合糖酵母獲得的pSM1,由果蠅克魯維氏酵母獲得的pKD1,由膜醭畢赤氏酵母獲得的pPM1,及由啤酒糖酵母獲得的2μm質粒和變體(諸如Scp1、Scp2和Scp3)例如Volkert等人,1989,MicrobiologicalReviews,53(3),299-317;Murray等人,1988,Mol.Biol.,200,601-607;及Painting等人,1984,J.Applied Bacteriology,56,331中所述的。
2μm家族質粒能夠在酵母群中實現(xiàn)穩(wěn)定的多拷貝維持,盡管不必所有的2μm家族質粒都能夠在所有類型的酵母群中實現(xiàn)穩(wěn)定的多拷貝維持。例如,2μm質粒格外能夠在啤酒糖酵母和卡爾斯伯糖酵母中實現(xiàn)穩(wěn)定的多拷貝維持。
“多拷貝維持”指質粒在每個酵母細胞中以多個拷貝存在。將包含2μm家族質粒的酵母細胞稱為[cir+],而將不含2μm家族質粒的酵母細胞稱為[cir0]。[cir+]酵母細胞通常每個單倍體基因組包含10-100個拷貝的[ci+],諸如每個單倍體基因組包含20-90個、更通常的是30-80個、優(yōu)選的是40-70個、更優(yōu)選的是50-60個拷貝。此外,宿主的遺傳背景能夠影響質粒的拷貝數,它能夠將2μm樣質粒的拷貝數提高至每個單倍體基因組100個以上(Gerbaud和Guerineau,1980,Curr.Genetics,1,219;Holm,1982,Cell,29,585;Sleep等人,2001,Yeast,18,403;及WO99/00504)。多拷貝穩(wěn)定性的定義見下文。
2μm家族質粒通常包含至少三個開放讀碼框(“ORF”),它們各自編碼在2μm家族質粒作為多拷貝質粒而穩(wěn)定維持中發(fā)揮功能的蛋白質。可以將由這三個ORF編碼的蛋白質稱為FLP、REP1和REP2。當2μm家族質粒沒有包含編碼FLP、REP1和REP2的所有三個ORF時,應當反式提供編碼缺失蛋白質的ORF,或是在另一種質粒上或是通過染色體整合。
“FLP”蛋白質是能夠在受到FLP識別的反向重復序列之間催化位點特異重組的蛋白質。該反向重復序列稱為FLP重組靶(FRT)位點,而且各自通常作為更大反向重復片段的一部分存在(見下文)。優(yōu)選的FLP蛋白質包含由pSR1、pSB1、pSB2、pSB3、pSB4、pSM1、pKD1、pPM1和2μm質粒其中一種質粒編碼的FLP蛋白質的序列,例如Volkert等人,前述引用;Murray等人,前述引用;及Painting等人,前述引用中所述。本發(fā)明還包括這些FLP蛋白質的變體和片段?!捌巍焙汀白凅w”指保留天然蛋白質在相同F(xiàn)RT序列之間催化位點特異重組能力的那些。這些變體和片段常常與由pSR1、pSB1、pSB2、pSB3、pSB4、pSM1、pKD1、pPM1和2μm質粒其中一種質粒編碼的FLP蛋白質具有至少50%、60%、70%、80%、90%、95%、98%、99%或更高同源性。不同的FLP蛋白質可以具有不同的FRT序列特異性。典型的FRT位點可以包含側翼為反向重復序列的核心核苷酸序列。在2μm質粒中,F(xiàn)RT核心序列的長度是8個核苷酸,而側翼反向重復序列的長度是13個核苷酸(Volkert等人,前述引用)。然而,由任何指定FLP蛋白質識別的FRT位點可以與2μm質粒的FRT位點不同。
REP1和REP2是參與在細胞分裂過程中分配質粒拷貝的蛋白質,而且可能還在FLP表達的調控中發(fā)揮作用。在來自不同2μm家族質粒的REP1蛋白質間觀察到可觀的序列趨異,而目前不可能在來自不同2μm家族質粒的REP2蛋白質間進行序列對比。優(yōu)選的REP1和REP2蛋白質包含由pSR1、pSB1、pSB2、pSB3、pSB4、pSM1、pKD1、pPM1和2μm質粒其中一種質粒編碼的REP1和REP2蛋白質的序列,例如Volkert等人,前述引用;Murray等人,前述引用;及Painting等人,前述引用中所述。本發(fā)明還包括這些REP1和REP2蛋白質的變體和片段。REP1和REP2的“片段”和“變體”指在由該質粒代替天然ORF編碼時在合適酵母群內不破壞質粒的穩(wěn)定多拷貝維持的那些。這些REP1和REP2變體和片段常常分別與由pSR1、pSB1、pSB2、pSB3、pSB4、pSM1、pKD1、pPM1和2μm質粒其中一種質粒編碼的REP1和REP2蛋白質具有至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%、99%或更高同源性。
由質粒上的ORF編碼的REP1和REP2蛋白質必須是相容的。如果REP1和REP2在聯(lián)合質粒的其它功能元件時有助于編碼它們的質粒的穩(wěn)定多拷貝維持,那么它們是相容的??梢酝ㄟ^制備其中REP1和REP2ORF各自特異破壞的突變型質粒來測定REP1和REP2 ORF是否有助于編碼它們的質粒的穩(wěn)定多拷貝維持。如果ORF的破壞削弱質粒的穩(wěn)定多拷貝維持,那么可以得出結論,該ORF在非突變形式有助于質粒的穩(wěn)定多拷貝維持。優(yōu)選的是,REP1和REP2蛋白質具有由相同天然存在2μm家族質粒諸如pSR1、pSB1、pSB2、pSB3、pSB4、pSM1、pKD1、pPM1和2μm質粒編碼的REP1和REP2蛋白質或其變體或片段的序列。
2μm家族質粒包含兩個反向重復序列。反向重復片段可以是任何大小,只要它們各自含有FRT位點(見上文)。反向重復片段通常是高度同源的。它們可以共享超過50%、60%、70%、80%、90%、95%、96%、97%、98%、99%、99.5%或更高序列同一性。在一個優(yōu)選的實施方案中,它們是相同的。通常,反向重復片段的長度各自是200至1000bp。優(yōu)選的反向重復序列可以各自具有200至300bp、300至400bp、400至500bp、500至600bp、600至700bp、700至800bp、800至900bp、或900至1000bp的長度。特別優(yōu)選的反向重復片段是質粒pSR1(959bp)、pSB1(675bp)、pSB2(477bp)、pSB3(391bp)、pSM1(352bp)、pKD1(346bp)、2μm質粒(599bp)、pSB4和pPM1的那些。
反向重復片段的序列可以有所變化。然而,每個反向重復片段中FRT位點的序列應當與由質粒編碼的FLP蛋白質的特異性相容,從而使得所編碼FLP蛋白質能夠發(fā)揮作用,即在質粒的反向重復序列之間催化位點特異重組??梢酝ㄟ^本領域知道的方法來測定反向重復序列之間的重組(及由此FLP蛋白質識別質粒內FRT位點的能力)。例如,可以在促進FLP表達的條件下對酵母細胞中的質粒測定質粒限制圖譜的變化,而這是由質粒中一個區(qū)域相對于質粒中另一個區(qū)域的取向變化引起的。若檢測出限制圖譜有變化,則指示FLP蛋白質能夠識別質粒中的FRT位點,而且因此每個反向重復片段中的FRT位點與由質粒編碼的FLP蛋白質的特異性相容。
在一個特別優(yōu)選的實施方案中,包括FRT位點在內的反向重復片段的序列衍生自與編碼FLP蛋白質的ORF相同的2μm家族質粒,諸如pSR1、pSB1、pSB2、pSB3、pSB4、pSM1、pKD1、pPM1或2μm質粒。
反向重復片段通常位于2μm家族質粒內,使得在排除外源導入的序列諸如轉基因時,反向重復片段之間定義的兩個區(qū)域(如諸如在2μm質粒中定義為UL和US)具有大致相似的大小。例如,兩個區(qū)域其中之一所具有的長度可以相當于另一個區(qū)域的長度的至少40%、50%、60%、70%、80%、90%、95%或更多、可多達100%。
2μm家族質粒包含編碼FLP的ORF以及以這樣一種方式并置的一個反向重復片段(任意的稱為“IR1”,使之與下一段中提及的另一個反向重復片段有所區(qū)別),使得IR1存在于FLP ORF的遠端且沒有任何居間編碼序列,例如在2μm質粒中所看到的?!斑h端”在此語境中指FLP ORF中與啟動子起始其轉錄的末端相反的末端。在一個優(yōu)選的實施方案中,F(xiàn)LP ORF的遠端與IR1交疊。
2μm家族質粒包含編碼REP2的ORF以及以這樣一種方式并置的另一個反向重復片段(任意的稱為“IR2”,使之與上一段中提及的IR1有所區(qū)別),使得IR2存在于REP2 ORF的遠端且沒有任何居間編碼序列,例如在2μm質粒中所看到的?!斑h端”在此語境中指REP2 ORF中與啟動子起始其轉錄的末端相反的末端。
在一個實施方案中,編碼REP2和FLP的ORF可以存在于2μm家族質粒的反向重復片段之間所定義的兩個區(qū)域中的相同區(qū)域上,該區(qū)域可以是兩個區(qū)域中的較大者或較小者(如果兩個區(qū)域的大小之間存在任何不平等的話)。
在一個實施方案中,編碼REP2和FLP的ORF可以由不同的啟動子轉錄。
通常,2μm家族質粒的反向重復片段之間定義的區(qū)域(如諸如在2μm質粒中定義為UL和US)可以包含不超過兩種內源基因,它們所編碼的蛋白質在2μm家族質粒作為多拷貝質粒的穩(wěn)定維持中發(fā)揮功能。由此,在一個優(yōu)選的實施方案中,質粒中反向重復片段之間定義的一個區(qū)域可以包含不超過編碼FLP和REP2;FLP和REP1;或REP1和REP2的ORF作為內源編碼序列。
2μm家族質粒包含復制起點(也稱為自主復制序列-“ARS”),它通常是雙向的??梢源嬖谌魏魏线m的ARS序列。共有序列,通常是酵母染色體復制起點,可能是合適的(Broach等人,1982,Cold Spring Harbor Symp.Quant.Biol.,47,1165-1174;Williamson,1985,Yeast,1,1-14)。優(yōu)選的ARS包括由pSR1、pSB1、pSB2、pSB3、pSB4、pSM1、pKD1、pPM1和2μm質粒分離的那些。
由此,2μm家族質粒通常包含至少編碼FLP和REP2的ORF、兩個反向重復序列(每個反向重復片段包含與FLP蛋白質相容的FRT位點)、和ARS序列。優(yōu)選的是,質粒還包含編碼REP1的ORF,盡管它可以反式提供,正如上文所討論的。優(yōu)選的是,F(xiàn)RT位點衍生自與編碼FLP蛋白質的序列相同的2μm家族質粒。優(yōu)選的是,所編碼REP1和REP2蛋白質的序列衍生自彼此相同的2μm家族質粒。更加優(yōu)選的是,F(xiàn)RT位點衍生自與所編碼FLP、REP1和REP2蛋白質的序列相同的2μm家族質粒。甚至更加優(yōu)選的是,編碼FLP、REP1和REP2的ORF的序列和反向重復片段(包括FRT位點)的序列衍生自相同的2μm家族質粒。仍然更加優(yōu)選的是,ARS位點是由與FLP、REP1和REP2的ORF和反向重復片段(包括FRT位點)的序列其中一種或多種相同的2μm家族質粒獲得的。優(yōu)選的質粒包括由魯氏接合糖酵母獲得的pSR1、pSB3或pSB4,由拜列氏接合糖酵母獲得的pSB1或pSB2,由發(fā)酵接合糖酵母獲得的pSM1,由果蠅克魯維氏酵母獲得的pKD1,由膜醭畢赤氏酵母獲得的pPM1,及由啤酒糖酵母獲得的2μm質粒,例如Volkert等人,1989,前述引用;Murray等人,前述引用;及Painting等人,前述引用。
任選的是,2μm家族質??梢园喈斢?μm質粒中STB區(qū)域(也稱為REP3)的區(qū)域,正如Volkert等人,前述引用中所定義的。本發(fā)明2μm家族質粒中的STB區(qū)域可以包含兩個或多個串聯(lián)重復序列,諸如3個、4個、5個或更多。或者,可以不存在串聯(lián)重復序列。串聯(lián)重復片段可以是任何大小,諸如長度為10、20、30、40、50、60、70、80、90、100bp或更長。2μm質粒STB區(qū)域中的串聯(lián)重復片段的長度是62bp。串聯(lián)重復片段的序列是否相同并不重要??梢猿惺茌p微的序列變異。由與REP1和REP2 ORF其中任一或二者兼之相同的質粒選擇STB區(qū)域可能是優(yōu)選的。認為STB區(qū)域是順式作用元件且優(yōu)選是不轉錄的。
任選的是,2μm家族質粒可以包含額外ORF,它所編碼的蛋白質在2μm家族質粒作為多拷貝質粒的穩(wěn)定維持中發(fā)揮功能。額外的蛋白質可以命名為RAF或D。在例如2μm質粒和pSM1上可以看到編碼RAF或D基因的ORF。由此,RAF或D的ORF可以包含適于編碼由2μm質?;騪SM1編碼的RAF或D基因ORF的蛋白質產物或其變體和片段的序列。由此,本發(fā)明還包括2μm質?;騪SM1的RAF或D基因的蛋白質產物的變體和片段。2μm質?;騪SM1的RAF或D基因的蛋白質產物的“片段”和“變體”指在由2μm質?;騪SM1代替天然ORF編碼時不破壞質粒在合適酵母群中的穩(wěn)定多拷貝維持的那些。這些變體和片段通常與由2μm質粒或pSM1編碼的RAF或D基因ORF的蛋白質產物具有至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%、99%或更高同源性。
本發(fā)明提供了在REP2基因或FLP基因至少其一的最后一個功能性密碼子后面的第一個堿基和與所述基因相鄰的反向重復片段中FRT位點前面的最后一個堿基之間包含多核苷酸序列插入、刪除和/或替代的2μm家族質粒。
多核苷酸序列插入指在質粒中插入任何額外多核苷酸序列。下文描述了優(yōu)選的多核苷酸序列插入。刪除指一個或多個堿基對的清除,諸如可多達2個、3個、4個、5個、6個、7個、8個、9個、10個、20個、30個、40個、50個、60個、70個、80個、90個、100個、200個、300個、400個、500個、600個、700個、800個、900個、1000個或更多堿基對的清除,它可以是單個連續(xù)序列或是來自DNA序列內間隔分開的區(qū)域。替代指一個或多個堿基對的替換,諸如可多達2個、3個、4個、5個、6個、7個、8個、9個、10個、20個、30個、40個、50個、60個、70個、80個、90個、100個、200個、300個、400個、500個、600個、700個、800個、900個、1000個或更多堿基對的替換,它可以是單個連續(xù)序列或是來自DNA序列內間隔分開的區(qū)域。一個區(qū)域受到插入、刪除或替代其中任何兩種或所有三種的修飾也是可能的。
REP2基因或FLP基因其中任一的最后一個功能性密碼子指基因開放讀碼框中基因啟動子下游距離最遠的密碼子,且根據諸如Chinery和Hinchliffe,1989,Curr.Genet.,16,21-25中定義的測試方法其終止密碼子替代將導致不可接受的質粒多拷貝穩(wěn)定性損失。修改Chinery和Hinchcliffe定義的測試方法可能是合適的,例如向接種體或亞培養(yǎng)物方案中引入修改,從而將指數對數生長維持在超過期望的代數。這可能有助于說明所分析宿主菌株與Chinery和Hinchcliffe所用啤酒糖酵母S150-2B之間的差異,和/或為可以通過插入位點在2μm樣質粒小US區(qū)中的同一性和/或2μm樣質粒中的其它差異諸如2μm樣質粒中插入序列的大小和本質和/或2μm樣質粒中其它部位的插入測定的所測定質粒的個別特征優(yōu)化測試方法。對于在Chinery和Hinchliffe,1989,Curr.Genet.,16,21-25中定義的非選擇性培養(yǎng)基(YPD,也稱為YEPD)中不生長的酵母,可以使用其它合適的非選擇性培養(yǎng)基。合適的候選非選擇性培養(yǎng)基通常容許指數對數生長達到期望的代數。例如,蔗糖或葡萄糖可以用作候選碳源。質粒穩(wěn)定性可以定義為在限定代數后對選擇標記保持原養(yǎng)型的細胞百分比。代數優(yōu)選足以顯示對照質粒諸如pSAC35或pSAC310之間的差異,或是顯示與這樣一種對照質??杀鹊姆€(wěn)定性。代數可以是1代、2代、3代、4代、5代、6代、7代、8代、9代、10代、11代、12代、13代、14代、15代、16代、17代、18代、19代、20代、25代、30代、35代、40代、45代、50代、60代、70代、80代、90代、100代或更多。優(yōu)選較高數目。可接受的質粒穩(wěn)定性可以是1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.9%或基本上100%。優(yōu)選較高百分比。技術人員將認識到,即使質粒在非選擇性培養(yǎng)基上生長時可能具有低于100%的穩(wěn)定性,質粒仍然能夠在選擇性培養(yǎng)基中培養(yǎng)時使用。例如,實施例中描述的質粒pDB2711在依照實施例1測定穩(wěn)定性時只有10%是穩(wěn)定的,但是在選擇性生長條件下在搖瓶培養(yǎng)中在重組運鐵蛋白生產力中提供15倍增量。
由此,通過插入多核苷酸序列插入、刪除或替代,在REP2或FLP基因最后一個功能性密碼子下游的任何點破壞任一基因不會導致不可接受的質粒多拷貝穩(wěn)定性損失。我們出乎意料的發(fā)現(xiàn),可以在密碼子59后面破壞2μm質粒的REP2基因,而且可以在密碼子344后面破壞2μm質粒的FLP基因,各自不會導致不可接受的質粒多拷貝穩(wěn)定性損失??梢酝ㄟ^如上所述修飾相關基因并測定穩(wěn)定性,常規(guī)確定其它2μm家族質粒中等價基因的最后一個功能性密碼子。因此,就對其進行的修飾不會導致不可接受的質粒多拷貝穩(wěn)定性損失而言,本發(fā)明的改良質粒通常是穩(wěn)定的。
本發(fā)明2μm質粒的REP2和FLP基因各自具有與之相鄰的反向重復片段。反向重復片段可以是相同的(在倒轉時),因為它與相同質粒內的另一個反向重復片段的序列匹配。“相鄰”指FLP或REP2基因及其反向重復片段以這樣一種方式并置,使得反向重復片段存在于基因的遠端且沒有任何居間編碼序列,例如在2μm質粒中所看到的?!斑h端”在此語境中指基因中與啟動子起始其轉錄的末端相反的末端。在一個優(yōu)選的實施方案中,基因的遠端與反向重復片段交疊。
在本發(fā)明的第一個優(yōu)選方面,多核苷酸序列插入、刪除和/或替代存在于REP2基因最后一個功能性密碼子后面的第一個堿基和與所述基因相鄰的反向重復片段中FRT位點前面的最后一個堿基之間,優(yōu)選反向重復片段的第一個堿基和FRT位點前面的最后一個堿基之間,甚至更加優(yōu)選REP2基因翻譯終止密碼子后面且FRT位點前面最后一個堿基前面的位置。
術語“之間”在此語境中包括該定義的外限,因此例如“REP2基因最后一個功能性密碼子后面的第一個堿基和FRT位點前面的最后一個堿基之間”的插入、刪除和/或替代包括REP2基因最后一個功能性密碼子后面的第一個堿基處的插入、刪除和/或替代和FRT位點前面的最后一個堿基處的插入、刪除和/或替代。
在本發(fā)明的第二個優(yōu)選方面,多核苷酸序列插入、刪除和/或替代存在于FLP基因最后一個功能性密碼子后面的第一個堿基和與所述基因相鄰的反向重復片段中FRT位點前面的最后一個堿基之間,優(yōu)選反向重復片段的第一個堿基和FRT位點前面的最后一個堿基之間,更加優(yōu)選FLP編碼序列末端后面的第一個堿基和FRT位點前面的最后一個堿基之間,諸如FLP編碼序列末端后面的第一個堿基處。多核苷酸序列插入、刪除和/或替代可以存在于FLP末端后面的第一個堿基和反向重復片段中的FspI位點之間,但任選不在FspI位點內。
在一個實施方案中,除了多核苷酸序列插入、刪除和/或替代,F(xiàn)LP基因和/或REP2基因分別具有衍生自天然存在2μm家族質粒的FLP基因和/或REP2基因序列。
術語“衍生自”包括與衍生它的序列具有相同序列的序列。然而,還包括上文定義的它們的變體和片段。例如,具有衍生自2μm質粒FLP基因之序列的FLP基因可以具有與天然存在基因相比經過修飾的啟動子或其它調控序列?;蛘?,具有衍生自2μm質粒FLP基因之序列的FLP基因可以在開放讀碼框中具有經過修飾的核苷酸序列,它可以編碼與天然存在基因相同的蛋白質,或者可以編碼經過修飾的FLP蛋白質。相同考慮應用于具有衍生自特定來源之序列的REP2基因。
天然存在2μm家族質粒指具有上述特征的任何質粒,所述特征是發(fā)現(xiàn)在酵母中天然存在的,即尚未經過重組修飾以包含異源序列的2μm家族質粒的本質特征。優(yōu)選的是,天然存在2μm家族質粒選自由魯氏接合糖酵母獲得的pSR1(編號X02398)、pSB3(編號X02608)或pSB4,由拜列氏接合糖酵母獲得的pSB1或pSB2(編號NC_002055或M18274),由發(fā)酵接合糖酵母獲得的pSM1(編號NC_002054),由果蠅克魯維氏酵母獲得的pKD1(編號X03961),由膜醭畢赤氏酵母獲得的pPM1,或最優(yōu)選的是由啤酒糖酵母獲得的2μm質粒(編號NC_001398或J01347)。編號指NCBI的保藏物。
優(yōu)選的是,除了多核苷酸序列插入、刪除和/或替代,與所述FLP和/或REP2基因相鄰的反向重復片段的序列衍生自與衍生該基因的序列相同的天然存在2μm家族質粒中相應反向重復片段的序列。由此,例如,如果FLP基因衍生自由啤酒糖酵母獲得的2μm質粒,那么優(yōu)選的是與FLP基因相鄰的反向重復片段具有衍生自由啤酒糖酵母獲得的2μm質粒中與FLP基因相鄰的反向重復片段的序列。如果REP2基因衍生自由啤酒糖酵母獲得的2μm質粒,那么優(yōu)選的是與REP2基因相鄰的反向重復片段具有衍生自由啤酒糖酵母獲得的2μm質粒中與REP2基因相鄰的反向重復片段的序列。
如果在本發(fā)明的第一個優(yōu)選方面中,除了多核苷酸序列插入、刪除和/或替代,REP2基因和相鄰反向重復序列具有衍生自由啤酒糖酵母獲得的2μm質粒中相應區(qū)域的序列的話,那么優(yōu)選的是該多核苷酸序列插入、刪除和/或替代存在于REP2基因密碼子59的第一個堿基和相鄰反向重復片段中FRT位點前面的最后一個堿基之間的位置,更加優(yōu)選反向重復片段的第一個堿基和FRT位點前面的最后一個堿基之間的位置,甚至更加優(yōu)選REP2基因翻譯終止密碼子后面且FRT位點前面最后一個堿基前面的位置,諸如REP2編碼序列末端后面的第一個堿基處。
如果除了多核苷酸序列插入、刪除和/或替代,REP2基因和相鄰反向重復序列具有衍生自由啤酒糖酵母獲得的2μm質粒中相應區(qū)域的序列的話,那么在一個實施方案中,除了多核苷酸序列插入、刪除和/或替代,REP2基因和相鄰反向重復片段的序列由SEQ ID NO1或其變體定義。在SEQ IDNO1中,REP2基因密碼子59的第一個堿基表述為堿基數目175,而FRT位點前面的最后一個堿基表述為堿基數目1216。這里給出的FRT序列是來自Sadowski等人,1986,第7-10頁,Mechanisms of Yeast Recombination,《Current Communications in Molecular Biology》,CSHL,Klar,A.、Strathern,J.N.的55bp的序列。在SEQ ID NO1中反向重復片段的第一個堿基表述為堿基數目887,而REP2基因翻譯終止密碼子后面的第一個堿基表述為堿基數目892。
在本發(fā)明第一個方面的一個甚至更加優(yōu)選的實施方案中,除了多核苷酸序列插入、刪除和/或替代,REP2基因和相鄰反向重復序列具有衍生自由啤酒糖酵母獲得的2μm質粒相應區(qū)域的序列,且在不存在多核苷酸序列插入、刪除和/或替代的破壞時在反向重復片段內包含XcmI位點或FspI位點且該多核苷酸序列插入、刪除和/或替代存在于XcmI位點或FspI位點處。在SEQ IDNO1中,XcmI位點表述為堿基數目935-949,而FspI位點表述為堿基數目1172-1177。
如果在本發(fā)明的第二個優(yōu)選方面中,除了多核苷酸序列插入、刪除和/或替代,F(xiàn)LP基因和相鄰反向重復序列具有衍生自由啤酒糖酵母獲得的2μm質粒中相應區(qū)域的序列的話,那么優(yōu)選的是該多核苷酸序列插入、刪除和/或替代存在于FLP基因密碼子344的第一個堿基與FRT位點前面的最后一個堿基之間的位置,更加優(yōu)選反向重復片段的第一個堿基和FRT位點前面的最后一個堿基之間的位置,仍然更加優(yōu)選FLP編碼序列末端后面的第一個堿基和FRT位點前面的最后一個堿基之間的位置,諸如FLP編碼序列末端后面的第一個堿基處。可以避開FLP基因和FRT位點之間的FspI位點作為插入位點。
如果除了多核苷酸序列插入、刪除和/或替代,F(xiàn)LP基因和相鄰反向重復序列具有衍生自由啤酒糖酵母獲得的2μm質粒中相應區(qū)域的序列的話,那么在一個實施方案中,除了多核苷酸序列插入、刪除和/或替代,F(xiàn)LP基因和跟隨FLP基因的反向重復片段的序列由SEQ ID NO2或其變體定義。在SEQ ID NO2中,F(xiàn)LP基因密碼子344的第一個堿基表述為堿基數目1030,而FRT位點前面的最后一個堿基表述為堿基數目1419,反向重復片段的第一個堿基表述為堿基數目1090,而FLP編碼序列末端后面的第一個堿基表述為堿基數目1273。
在本發(fā)明第二個方面的一個甚至更加優(yōu)選的實施方案中,除了多核苷酸序列插入、刪除和/或替代,F(xiàn)LP基因和相鄰反向重復序列具有衍生自由啤酒糖酵母獲得的2μm質粒相應區(qū)域的序列,且在不存在多核苷酸序列插入、刪除和/或替代時在反向重復片段內包含HgaI位點或FspI位點且該多核苷酸序列插入、刪除和/或替代存在于通過HgaI作用于HgaI位點而形成的切口處(HgaI切割它所識別的5bp序列的外側)或FspI位點處。在SEQ ID NO2中,HgaI位點表述為堿基數目1262-1266,而FspI位點表述為堿基數目1375-1380。
技術人員將認識到,由本發(fā)明第一個和第二個優(yōu)選方面定義的質粒的特征并不互相排斥。由此,依照本發(fā)明第三個優(yōu)選方面的質??梢栽赗EP2基因和FLP基因二者最后一個功能性密碼子后面的第一個堿基和與所述每一種基因相鄰的反向重復片段中FRT位點前面的最后一個堿基之間包含多核苷酸序列插入、刪除和/或替代,所述多核苷酸序列插入、刪除和/或替代可以是相同的或不同的。例如,除了多核苷酸序列插入、刪除和/或替代,依照本發(fā)明第三個方面的質粒可以包含SEQ ID NO1或其變體的序列和SEQ IDNO2或其變體的序列,各自分別在上文關于本發(fā)明第一個和第二個優(yōu)選方面所定義的位置包含多核苷酸序列插入、刪除和/或替代。
技術人員將認識到,由本發(fā)明第一個、第二個和第三個優(yōu)選方面定義的質粒的特征并不排除質粒還具有其它序列修飾的可能性。由此,例如,本發(fā)明第一個、第二個和第三個優(yōu)選方面的2μm家族質??梢栽谏衔亩x以外的位置額外包含多核苷酸序列插入、刪除和/或替代。因此,質??梢栽诒景l(fā)明插入位點以外的位點額外攜帶轉基因。
本領域知道2μm質粒中的候選插入位點,但是它們不提供使用本發(fā)明定義的插入位點所具有的優(yōu)勢。無論如何,通過在本領域第一個、第二個和第三個優(yōu)選方面定義的一個或多個位點處進行一處或多處進一步修飾,可以進一步修飾在本領域知道的位點處早就包含多核苷酸序列插入、刪除和/或替代的質粒。技術人員將認識到,正如本申請導言中所討論的,在2μm家族質粒中本發(fā)明第一個和第二個方面所定義以外的位點處插入轉基因存在可觀的技術限制。
本領域知道的典型的改良2μm質粒包括Rose和Broach,1990,MethodsEnzymol.,185,234-279中描述的那些,諸如利用FLP中EcoRI處插入的質粒pCV19、pCV20、CVneo,利用D中EcoRI作為插入位點的質粒pCV21、pGT41和pYE,利用D中PstI作為插入位點的質粒pHKB52,利用D中PstI和D中EcoRI處插入的質粒pJDB248,利用D中PstI和FLP中EcoRI作為插入位點的質粒pJDB219,利用FLP中ClaI處插入的質粒G18、質粒pAB18,利用D中PstI作為插入位點的質粒pGT39和pA3、質粒pYT11、pYT14和pYT11-LEU,及利用FLP中EcoRI作為插入位點的質粒pTY39。其它2μm質粒包括EP 0 286 424及Chinery和Hinchliffe,1989,Curr.Genet.,16,21-25中描述的pSAC3、pSAC3U1、pSAC3U2、pSAC300、pSAC310、pSAC3C1、pSAC3PL1、pSAC3SL4和pSAC3SC1,它們還將PstI、EagI或SnaBI描述為適當的2μm插入位點。其它2μm質粒包括pAYE255、pAYE316、pAYE443、pAYE522(Kerry-Williams等人,1998,Yeast,14,161-1690)、pDB2244(WO00/44772)和pAYE329(Sleep等人,2001,Yeast,18,403-421)。
在一個優(yōu)選的實施方案中,本發(fā)明第一個、第二個和第三個優(yōu)選方面定義的2μm樣質粒額外包含多核苷酸序列插入、刪除和/或替代,它存在于ARS序列周圍的非轉錄區(qū)內。例如,在由啤酒糖酵母獲得的2μm質粒中,ARS序列周圍的非轉錄區(qū)由D基因的末端延伸至ARS序列的開端。Chinery和Hinchliffe,1989,Curr.Genet.,16,21-25中描述了SnaBI處(復制起點序列ARS附近)的插入。技術人員將認識到,額外的多核苷酸序列插入、刪除和/或替代也可以位于非轉錄區(qū)內,位于由Chinery和Hinchliffe描述的SnaBI位點的附近位置。
依照任何本發(fā)明第一個、第二個或第三個方面的質??梢允悄軌蛟诮湍钢凶灾鲝椭频馁|粒,諸如糖酵母屬、克魯維氏酵母屬、接合糖酵母屬或畢赤氏酵母屬的成員,諸如啤酒糖酵母、卡爾斯伯糖酵母、乳克魯維氏酵母(Kluyveromyces lactis)、巴斯德畢赤氏酵母(Pichia pastoris)、膜醭畢赤氏酵母、魯氏接合糖酵母、拜列氏糖酵母、發(fā)酵結合糖酵母或果蠅克魯維氏酵母。認為啤酒糖酵母和卡爾斯伯糖酵母為所有已知的2μm質粒提供了合適的宿主細胞。
在一個優(yōu)選的實施方案中,本發(fā)明2μm家族質粒中包含的多核苷酸序列插入、刪除和/或替代是或至少其一是多核苷酸序列插入??梢允褂萌魏味嗪塑账嵝蛄胁迦?,只要它對質粒的穩(wěn)定性沒有不可接受的損害,也就是說與未經修飾的質粒(賦值100%穩(wěn)定性)相比,該質粒在非選擇性培養(yǎng)基諸如YEPD培養(yǎng)基上至少1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.9%或基本上100%是穩(wěn)定的。優(yōu)選的是,上文所述穩(wěn)定性水平是在培養(yǎng)基中分開培養(yǎng)包含已修飾和未修飾質粒的酵母細胞達到1代、2代、3代、4代、5代、6代、7代、8代、9代、10代、11代、12代、13代、14代、15代、16代、17代、18代、19代、20代、25代、30代、35代、40代、45代、50代、60代、70代、80代、90代、100代或更多代數后看到的。
如果質粒包含選擇標記,那么在選擇性條件(如在極限培養(yǎng)基中)下培養(yǎng)轉化子時可以獲得較高水平的穩(wěn)定性,因為培養(yǎng)基可以對宿主施加選擇壓力以保持質粒。
可以使用上文所述方法測定在非選擇性和選擇性(如極限)培養(yǎng)基中的穩(wěn)定性。可以通過質粒轉化酵母以獲得原養(yǎng)型的觀察結果來證明在選擇性培養(yǎng)基中的穩(wěn)定性。
通常,多核苷酸序列插入的長度是至少4個、6個、8個、10個、20個、30個、40個、50個、60個、70個、80個、90個、100個、150個、200個、250個、300個、350個、400個、450個、500個或更多堿基對。通常,多核苷酸序列插入的長度可長達1kb、2kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb、10kb或更長。技術人員將認識到,本發(fā)明的2μm質??梢栽谫|粒內的不同位點包含多個多核苷酸序列插入。通常,多核苷酸序列插入的總長度不超過5kb、10kb、15kb、20kb、25kb或30kb,盡管更大總長度的插入也是可能的。
多核苷酸序列可以是或者不是用于引入新限制位點的接頭序列。例如,可以在FLP基因后面的FspI位點處引入或不引入合成接頭,諸如引入其它限制位點(如BamHI)。
多核苷酸序列插入可以包含轉錄區(qū),或者可以包含非轉錄區(qū)。轉錄區(qū)可以編碼開放讀碼框,或者可以是非編碼的。多核苷酸序列插入可以包含轉錄和非轉錄兩種區(qū)域。
轉錄區(qū)指可以由RNA聚合酶,通常指酵母RNA聚合酶,轉錄的DNA區(qū)域。轉錄區(qū)可以編碼功能性RNA分子,諸如核糖體或轉運RNA,或是能夠作為有義或RNA干擾(“RNAi”)分子發(fā)揮功能的RNA分子?;蛘?,轉錄區(qū)可以編碼信使RNA分子(mRNA),該mRNA可以包含能夠在體內翻譯而生成蛋白質的開放讀碼框(ORF)。術語“蛋白質”在用于本文時包括所有天然的和非天然的蛋白質、多肽和肽。優(yōu)選的是,ORF編碼異源蛋白。“異源蛋白”指不是天然由2μm家族質粒編碼的蛋白質(即“非2μm家族質粒蛋白質”)。為了方便,術語“異源蛋白”和“非2μm家族質粒蛋白質”在整篇本說明書中同義使用。因此,優(yōu)選的是,異源蛋白不是由如下任一質粒編碼的FLP、REP1、REP2、或RAF/D蛋白質自魯氏接合糖酵母獲得的pSR1、pSR3或pSR4,自拜列氏接合糖酵母獲得的pSB1或pSB2,自發(fā)酵接合糖酵母獲得的pSM1,自果蠅克魯維氏酵母獲得的pKD1,自膜醭畢赤氏酵母獲得的pPM1,及自啤酒糖酵母獲得的2μm質粒。
如果多核苷酸序列插入編碼開放讀碼框的話,那么它可以額外包含一些不編碼開放讀碼框的多核苷酸序列(稱為“非編碼區(qū)”)。
多核苷酸序列插入中的非編碼區(qū)可以包含一種或多種與開放讀碼框可操作連接的調控序列,它們容許開放讀碼框的轉錄和/或由此得到的轉錄本的翻譯。
術語“調控序列”指調控(即促進或降低)與之可操作連接的開放讀碼框的表達(即轉錄和/或翻譯)的序列。調控序列通常包括啟動子、終止子、核糖體結合位點等等。技術人員將認識到,調控區(qū)的選擇將取決于預定的表達系統(tǒng)。例如,啟動子可以是組成性的或誘導型的,而且可以是細胞或組織類型特異的或非特異的。
如果表達系統(tǒng)是酵母諸如啤酒糖酵母的話,那么適合于啤酒糖酵母的啟動子包括與PGK1基因、GAL1或GAL10基因、TEF1、TEF2、PYK1、PMA1、CYC1、PHO5、TRP1、ADH1、ADH2、甘油醛-3-磷酸脫氫酶、己糖激酶、丙酮酸脫羧酶、果糖磷酸激酶、丙糖磷酸異構酶、葡萄糖磷酸異構酶、葡糖激酶的基因、α-交配因子信息素、a-交配因子信息素有關的啟動子、PRB1啟動子、PRA1啟動子、GPD1啟動子、和涉及部分5’調控區(qū)與部分其它啟動子5’調控區(qū)或與上游激活位點(如EP-A-258 067的啟動子)的雜合體的雜合啟動子。
本領域眾所周知合適的轉錄終止信號。如果宿主細胞是真核的話,那么轉錄終止信號優(yōu)選衍生自真核基因的3’側翼序列,它包含轉錄終止和多聚腺苷酸化的正確信號。合適的3’側翼序列可以是例如與所用表達控制序列天然相連的那些,即可以與啟動子相對應?;蛘?,它們可以是不同的。在那種情況中,而且如果宿主是酵母優(yōu)選啤酒糖酵母的話,那么優(yōu)選啤酒糖酵母ADH1、ADH2、CYC1、或PGK1基因的終止信號。
可能有利的是,異源基因的啟動子和開放讀碼框諸如蛋白伴侶PDI1的那些的側翼是轉錄終止序列,使得轉錄終止序列位于啟動子和開放讀碼框的上游和下游兩處,從而防止轉錄通讀進入相鄰基因,諸如2μm基因,反之亦然。
在一個實施方案中,在酵母諸如啤酒糖酵母中偏愛的調控序列包括酵母啟動子(如啤酒糖酵母PRB1啟動子),正如EP 431 880中所講授的;以及轉錄終止子,優(yōu)選來自糖酵母ADH1的終止子,正如EP 60 057中所講授的。
可能有利的是,在非編碼區(qū)中摻入超過一個編碼翻譯終止密碼子的DNA序列,諸如UAA、UAG或UGA,從而將翻譯通讀降至最低,并由此避免延長的、非天然融合蛋白的生成。優(yōu)選翻譯終止密碼子UAA。優(yōu)選的是,摻入至少兩個翻譯終止密碼子。
術語“可操作連接”在其含義中包括調控序列位于任何非編碼區(qū)內,使之與開放讀碼框形成如下關系,即容許調控區(qū)以其預定方式對開放讀碼框發(fā)揮作用。由此,與開放讀碼框“可操作連接”的調控區(qū)以這樣一種方式安置,使得調控區(qū)能夠在與調控序列相容的條件下以預定方式影響開放讀碼框的轉錄和/或翻譯。
如果本發(fā)明第一個、第二個或第三個方面定義的多核苷酸序列插入包含編碼蛋白質的開放讀碼框的話,那么可能有利的是所編碼的蛋白質是分泌性的。在那種情況中,開放讀碼框中可以包含編碼分泌前導序列的序列。
關于在真核物種諸如酵母啤酒糖酵母、接合糖酵母物種、乳克魯維氏酵母和巴斯德畢赤氏酵母中生成蛋白質,已知的前導序列包括來自啤酒糖酵母酸性磷酸酶蛋白質(Pho5p)(見EP 366 400)、轉化酶蛋白質(Suc2p)(見Smith等人,1985,Science,229,1219-1224)和熱休克蛋白-150(Hsp150p)(見WO 95/33833)的那些。另外,已經使用了來自啤酒糖酵母交配因子α-1蛋白質(MFα-1)以及來自人溶菌酶和人血清清蛋白(HSA)蛋白質的前導序列,后者尤其已經用于分泌人清蛋白,盡管不是排他的。WO 90/01063公開了MFα-1與HSA前導序列的融合體,相對于MFα-1前導序列的使用,它有利的降低了人清蛋白雜質片段的生成。另外,可以使用天然運鐵蛋白前導序列來指導運鐵蛋白和其它異源蛋白的分泌。
或者,所編碼蛋白質可以是胞內的。
在一個優(yōu)選的實施方案中,至少一個本發(fā)明第一個、第二個或第三個方面定義的多核苷酸序列插入包含如下開放讀碼框,它包含編碼酵母蛋白質的序列。在另一個優(yōu)選的實施方案中,至少一個本發(fā)明第一個、第二個或第三個方面定義的多核苷酸序列插入包含如下開放讀碼框,它包含編碼酵母蛋白質的序列,該酵母蛋白質來自與衍生2μm樣質粒的宿主相同的宿主。
在另一個優(yōu)選的實施方案中,至少一個本發(fā)明第一個、第二個或第三個方面定義的多核苷酸序列插入包含如下開放讀碼框,它包含編碼參與蛋白質折疊或是具有蛋白伴侶活性或參與未折疊蛋白質應答的蛋白質的序列(斯坦?;蚪M數據庫即Stanford Genome Database(SGD),http//yeastgenome.org)。優(yōu)選的蛋白質可以選自由AHA1、CCT2、CCT3、CCT4、CCT5、CCT6、CCT7、CCT8、CNS1、CPR3、CPR6、EPS1、ERO1、EUG1、FMO1、HCH1、HSP10、HSP12、HSP104、HSP26、HSP30、HSP42、HSP60、HSP78、HSP82、JEM1、MDJ1、MDJ2、MPD1、MPD2、PDI1、PFD1、ABC1、APJ1、ATP11、ATP12、BTT1、CDC37、CPR7、HSC82、KAR2、LHS1、MGE1、MRS11、NOB1、ECM10、SSA1、SSA2、SSA3、SSA4、SSC1、SSE2、SIL1、SLS1、UBI4、ORM1、ORM2、PER1、PTC2、PSE1和HAC1或截短的無內含子HAC1編碼的蛋白質(Valkonen等人,2003,Applied Environ.Micro.,69,2065)。
優(yōu)選的參與蛋白質折疊的蛋白質或是具有蛋白伴侶活性的蛋白質或參與未折疊蛋白質應答的蛋白質可以是●熱休克蛋白,諸如作為hsp70蛋白質家族成員的蛋白質(包括Kar2p、SSA和SSB蛋白質,例如由SSA1、SSA2、SSA3、SSA4、SSB1和SSB2編碼的蛋白質)、作為HSP90家族成員的蛋白質、或作為HSP40家族成員的蛋白質或參與其調控的蛋白質(如Sillp),包括DNA-J和DNA-J樣蛋白質(如Jem1p、Mdj2p);●作為核周蛋白/輸入蛋白蛋白質家族成員的蛋白質,諸如α或β核周蛋白/輸入蛋白蛋白質家族,例如由PSE1編碼的核周蛋白β蛋白質;●作為Hjelmqvist等人,2002,Genome Biology,3(6),research0027.1-0027.16描述的ORMDL家族成員的蛋白質,諸如Orm2p;●天然位于內質網中或分泌途徑中其它部位諸如高爾基體中的蛋白質,例如天然在內質網(ER)內腔中特別是在分泌細胞中發(fā)揮作用的蛋白質,諸如PDI;●作為錨定在ER中的跨膜蛋白質的蛋白質,諸如Hjelmqvist等人,2002,前述引用描述的ORMDL家族的成員(例如Orm2p);●在細胞溶膠中發(fā)揮作用的蛋白質,諸如hsp70蛋白質,包括SSA和SSB蛋白質,例如由SSA1、SSA2、SSA3、SSA4、SSB1和SSB2編碼的蛋白質;●在細胞核、核被膜和/或細胞質中發(fā)揮作用的蛋白質,諸如Pse1p;●細胞存活所必需的蛋白質,諸如PDI或必需的核周蛋白蛋白質,諸如Pse1p;●參與巰基氧化或二硫鍵形成、斷裂或異構化的蛋白質、或是催化蛋白質中硫醇二硫化物互換反應的蛋白質,特別是在分泌和細胞表面蛋白的生物合成過程中,諸如蛋白質二硫鍵異構酶(如Pdi1p、Mpd1p)、同源物(如Eug1p)和/或相關蛋白質(如Mpd2p、Fmo1p、Erolp);●參與蛋白質合成、裝配或折疊的蛋白質,諸如PDI和Ssa1p;●優(yōu)先或專門結合未折疊而非成熟蛋白質的蛋白質,諸如hsp70蛋白質,包括SSA和SSB蛋白質,例如由SSA1、SSA2、SSA3、SSA4、SSB1和SSB2編碼的蛋白質;●防止蛋白質前體在細胞溶膠中聚集的蛋白質,諸如hsp70蛋白質,包括SSA和SSB蛋白質,例如由SSA1、SSA2、SSA3、SSA4、SSB1和SSB2編碼的蛋白質;
●結合并穩(wěn)定受損蛋白質的蛋白質,例如Ssa1p;●參與未折疊蛋白質應答或對誘導未折疊蛋白質應答的試劑(諸如衣霉素和二硫蘇糖醇)提供升高的抗性的蛋白質,諸如Hjelmqvist等人,2002,前述引用描述的ORMDL家族的成員(例如Orm2p)或參與壓力應答的蛋白質(如Ubi4p);●作為輔伴侶蛋白的蛋白質和/或間接參與蛋白質折疊和/或未折疊蛋白質應答的蛋白質(如hsp104p、Mdj1p);●參與高分子核質轉運的蛋白質,諸如Pse1p;●通過識別核定位序列和核輸出序列并與核孔復合體相互作用來介導高分子穿過核膜轉運的蛋白質,諸如Pse1p;●EP 0 746 611及Hillson等人,1984,Methods Enzymol.,107,281-292中描述的能夠重新激活被擾亂核糖核酸酶針對RNA的核糖核酸酶活性的蛋白質,諸如PDI;●具有酸性pI(例如4.0-4.5)的蛋白質,諸如PDI;●作為Hsp70家族成員且優(yōu)選具有N端ATP結合結構域和C端肽結合結構域的蛋白質,諸如Ssa1p;●作為肽基脯氨酸順反異構酶的蛋白質(如Cpr3p、Cpr6p);●與已知蛋白伴侶同源的蛋白質(如Hsp10p);●作為線粒體蛋白伴侶的蛋白質(如Cpr3p);●作為細胞質或細胞核蛋白伴侶的蛋白質(如Cns1p);●作為膜結合蛋白伴侶的蛋白質(如Orm2p、Fmo1p);●具有蛋白伴侶激活物活性或蛋白伴侶調控活性的蛋白質(如Aha1p、Hac1p、Hch1p);●瞬時結合未成熟形式的多肽以引起正確折疊、轉運和/或分泌的蛋白質,包括高效易位進入內質網(如Lhs1p)或它們在細胞內的作用位點(如Pse1p)所需要的蛋白質;●參與蛋白質復合體裝配和/或核糖體裝配的蛋白質(例如Atp11p、Pse1p、Nob1p);●陪伴蛋白T復合體的蛋白質(例如Cct2p);或●prefoldin復合體的蛋白質(例如Pfd1p)。
一種優(yōu)選的蛋白伴侶是蛋白質二硫鍵異構酶(PDI)或其在內質網(ER)內腔中具有催化二硫鍵形成的等價能力的片段或變體?!癙DI”包括EP 0 746611及Hillson等人,1984,Methods Enzymol.,107,281-292中描述的具有重新激活被擾亂核糖核酸酶針對RNA的核糖核酸酶活性的能力的任何蛋白質。
蛋白質二硫鍵異構酶指通常催化硫醇二硫化物互換反應的酶,它是分泌細胞中內質網內腔中的主要駐留蛋白質成分。大量證據表明它在分泌性蛋白質的生物合成中發(fā)揮作用(Freedman,1984,Trends Biochem.Sci.,9,438-41),而且這得到了原位直接交聯(lián)研究的支持(Roth和Pierce,1987,Biochemistry,26,4179-82)。PDI缺陷的微粒體膜在共翻譯蛋白質二硫鍵形成中顯示特異缺陷的發(fā)現(xiàn)(Bulleid和Freedman,1988,Nature,335,649-51)暗示,該酶在分泌和細胞表面蛋白的生物合成過程中發(fā)揮天然二硫鍵形成催化物的功能。這種作用與已知的該酶在體外的催化特性是一致的;它催化硫醇二硫化物互換反應,導致凈余蛋白質二硫鍵形成、斷裂或異構化,而且通常能夠在極其多種還原的、未折疊的蛋白質底物中催化蛋白質折疊和天然二硫鍵形成(Freedman等人,1989,Biochem.Soc.Symp.,55,167-192)。PDI還作為蛋白伴侶發(fā)揮作用,因為缺乏異構酶活性的突變型PDI加速蛋白質折疊(Hayano等人,1995,F(xiàn)EBS Letters,377,505-511)。最近,有報道說巰基氧化而非二硫鍵異構化是蛋白質二硫鍵異構酶在啤酒糖酵母中的主要功能(Solovyov等人,2004,J.Biol.Chem.,279(33),34095-34100)。已經知道數個物種的該酶的DNA和氨基酸序列(Scherens等人,1991,Yeast,7,185-193;Farquhar等人,1991,Gene,108,81-89;EP 074 661;EP 0 293 793;EP 0 509 841),而且關于由哺乳動物肝臟純化至同質的酶的作用機制的信息日益增加(Creighton等人,1980,J.Mol.Biol.,142,43-62;Freedman等人,1988,Biochem.Soc.Trans.,16,96-9;Gilbert,1989,Biochemistry,28,7298-7305;Lundstrom和Holmgren,1990,J.Biol.Chem.,265,9114-9120;Hawkins和Freedman,1990,Biochem.J.,275,335-339)。在目前涉及在細胞中作為蛋白質折疊、裝配和易位的介導物的許多蛋白質因子中(Rothman,1989,Cell,59,591-601),PDI具有充分鑒定的催化活性。
宿主中內源PDI基因的刪除或滅活導致不能生存的宿主的生成。換言之,內源PDI基因是“必需”基因。
PDI易于由哺乳動物組織分離,而且同質的酶是具有特征性酸性pI(4.0-4.5)的二聚體(2×57kD)(Hillson等人,1984,Methods Enzymol.,107,281-292)。還已經由小麥和藻類萊茵衣藻(Chlamydomonas reinhardii)(Kaska等人,1990,Biochem.J.,268,63-68)、大鼠(Edman等人,1985,Nature,317,267-270)、牛(Yamauchi等人,1987,Biochem.Biophys.Res.Comm.,146,1485-1492)、人(Pihlajaniemi等人,1987,EMBO J.,6,643-9)、酵母(Scherens等人,前述引用;Farquhar等人,前述引用)和雞(Parkkonen等人,1988,Biochem.J.,256,1005-1011)純化得到該酶。來自這些脊椎動物物種的蛋白質整個顯示高度的序列保守性,而且都顯示數項最初在大鼠PDI序列中注意到的總體特征(Edman等人,1985,前述引用)。
酵母蛋白質二硫鍵異構酶前體PDI1可以以基因庫編號CAA42373或BAA00723找到。它具有522個氨基酸的如下序列1 mkfsagavls wsslllassv faqqeavape dsavvklatd sfneyiqshd lvlaeffapw61 cghcknmape yvkaaetlve knitlaqidc tenqdlcmeh nipgfpslki fknsdvnnsi121 dyegprtaea ivqfmikqsq pavavvadlp aylanetfvt pvivqsgkid adfnatfysm181 ankhfndydf vsaenadddf klsiylpsam depvvyngkk adiadadvfe kwlqvealpy241 fgeidgsvfa qyvesglplg ylfyndeeel eeykplftel akknrglmnf vsidarkfgr301 hagnlnmkeq fplfaihdmt edlkyglpql seeafdelsd kivleskaie slvkdflkgd361 aspivksqei fenqdssvfq lvgknhdeiv ndpkkdvlvl yyapwcghck rlaptyqela421 dtyanatsdv liakldhten dvrgvviegy ptivlypggk ksesvvyqgs rsldslfdfi481 kenghfdvdg kalyeeaqek aaeeadadae ladeedaihd el候選PDI序列可以以基因庫編號CAA38402找到。它具有530個氨基酸的如下序列1 mkfsagavls wsslllassv faqqeavape dsavvklatd sfneyiqshd lvlaeffapw61 cghcknmape yvkaaetlve knitlaqidc tenqdlcmeh nipgfpslki fknrdvnnsi121 dyegprtaea ivqfmikqsq pavavvadlp aylanetfvt pvivqsgkid adfnatfysm181 ankhfndydf vsaenadddf klsiylpsam depvvyngkk adiadadvfe kwlqvealpy241 fgeidgsvfa qyvesglplg ylfyndeeel eeykplftel akknrglmnf vsidarkfgr301 hagnlnmkeq fplfaihdmt edlkyglpql seeafdelsd kivleskaie slvkdflkgd361 aspivksqei fenqdssvfq lvgknhdeiv ndpkkdvlvl yyapwcghck rlaptyqela421 dtyanatsdv liakldhten dvrgvviegy ptivlypggk ksesvvyqgs rsldslfdfi481 kenghfdvdg kalyeeaqek aaeeaeadae aeadadaela deedaihdel本發(fā)明還包括上述PDI序列的變體和片段,以及其它天然存在PDI序列的變體?!白凅w”在PDI的語境中指其中一個或多個位置存在或保守的或非保守的氨基酸插入、刪除或替代的蛋白質,只要這些變化產生其基本特性例如酶促活性(類型和比活)、熱穩(wěn)定性、在某些pH范圍中的活性(pH穩(wěn)定性)沒有顯著變化的蛋白質?!帮@著”在此語境中指本領域技術人員將認為變體的特性仍然與最初的蛋白質有所不同,但不是不明顯的。
“保守替代”指預定組合,諸如Val、Ile、Leu、Ala、Met;Asp、Glu;Asn、Gln;Ser、Thr、Gly、Ala;Lys、Arg、His;及Phe、Tyr、Trp。優(yōu)選的保守替代包括Gly、Ala;Val、Ile、Leu;Asp、Glu;Asn、Gln;Ser、Thr;Lys、Arg;及Phe、Tyr。
“變體”通常與衍生它的多肽具有至少25%、至少50%、至少60%或至少70%、優(yōu)選至少80%、更加優(yōu)選至少90%、甚至更加優(yōu)選至少95%、仍然更加優(yōu)選至少99%、最優(yōu)選至少99.5%的序列同一性。
可以使用合適的計算機程序來測定兩種多肽之間的序列同一性百分比,正如下文所討論的。這些變體可以是天然的,或是使用本領域眾所周知的蛋白質工程和定點誘變的方法人造的。
“片段”在PDI的語境中指一個或多個位置存在刪除的蛋白質。由此,片段可以包含完整成熟PDI蛋白質的完整序列的至多5%、10%、20%、30%、40%或50%、通常可高達60%、更典型的是可高達70%、優(yōu)選可高達80%、更加優(yōu)選可高達90%、甚至更加優(yōu)選可高達95%、仍然更加優(yōu)選可高達99%。特別優(yōu)選的PDI蛋白質的片段包含期望蛋白質的一個或多個完整結構域。
PDI的片段或變體可以是在宿主細胞諸如啤酒糖酵母中重組表達時能夠補足宿主細胞中內源編碼PDI基因的刪除的蛋白質,而且可以是例如PDI的天然存在同系物,諸如由另一種生物體諸如另一種酵母或其它真菌、或另一種真核生物諸如人或其它脊椎動物、或動物或由植物編碼的同系物。
另一種優(yōu)選的蛋白伴侶是SSA1或其具有等價蛋白伴侶樣活性的片段或變體。SSA1,也稱為YG100,位于啤酒糖酵母的染色體I上,且大小為1.93kb。
SSA1的一種已發(fā)表蛋白質序列如下
MSKAVGIDLGTTYSCVAHFANDRVDIIANDQGNRTTPSFVAFTDTERLIGDAAKNQAAMNPSNTVFDAKRLIGRNFNDPEVQADMKHFPFKLIDVDGKPQIQVEFKGETKNFTPEQISSMVLGKMKETAESYLGAKVNDAVVTVPAYFNDSQRQATKDAGTIAGLNVLRTINEPTAAAIAYGLDKKGKEEHVLIFDLGGGTFDVSLLFIEDGIFEVKATAGDTHLGGEDFDNRLVNHFIQEFKRKNKKDLSTNQRALRRLRTACERAKRTLSSSAQTSVEIDSLFEGIDFYTSITRARFEELCADLFRSTLDPVEKVLRDAKLDKSQVDEIVLVGGSTRIPKVQKLVTDYFNGKEPNRSINPDEAVAYGAAVQAAILTGDESSKTQDLLLLDVAPLSLGIETAGGVMTKLIPRNSTISTKKFEIFSTYADNQPGVLIQVFEGERAKTKDNNLLGKFELSGIPPAPRGVPQIEVTFDVDSNGILNVSAVEKGTGKSNKITITNDKGRLSKEDIEKMVAEAEKFKEEDEKESQRIASKNQLESIAYSLKNTISEAGDKLEQADKDTVTKKAEETISWLDSNTTASKEEFDDKLKELQDIANPIMSKLYQAGGAPGGAAGGAPGGFPGGAPPAPEAEGPTVEEVDSSA1的一種已發(fā)表編碼序列如下,但是應當認識到,可以通過簡并替代來修飾序列以獲得編碼相同蛋白質產物的候選核苷酸序列
ATGTCAAAAGCTGTCGGTATTGATTTAGGTACAACATACTCGTGTGTTGCTCACTTTGCTAATGATCGTGTGGACATTATTGCCAACGATCAAGGTAACAGAACCACTCCATCTTTTGTCGCTTTCACTGACACTGAAAGATTGATTGGTGATGCTGCTAAGAATCAAGCTGCTATGAATCCTTCGAATACCGTTTTCGACGCTAAGCGTTTGATCGGTAGAAACTTCAACGACCCAGAAGTGCAGGCTGACATGAAGCACTTCCCATTCAAGTTGATCGATGTTGACGGTAAGCCTCAAATTCAAGTTGAATTTAAGGGTGAAACCAAGAACTTTACCCCAGAACAAATCTCCTCCATGGTCTTGGGTAAGATGAAGGAAACTGCCGAATCTTACTTGGGAGCCAAGGTCAATGACGCTGTCGTCACTGTCCCAGCTTACTTCAACGATTCTCAAAGACAAGCTACCAAGGATGCTGGTACCATTGCTGGTTTGAATGTCTTGCGTATTATTAACGAACCTACCGCCGCTGCCATTGCTTACGGTTTGGACAAGAAGGGTAAGGAAGAACACGTCTTGATTTTCGACTTGGGTGGTGGTACTTTCGATGTCTCTTTGTTGTTCATTGAAGACGGTATCTTTGAAGTTAAGGCCACCGCTGGTGACACCCATTTGGGTGGTGAAGATTTTGACAACAGATTGGTCAACCACTTCATCCAAGAATTCAAGAGAAAGAACAAGAAGGACTTGTCTACCAACCAAAGAGCTTTGAGAAGATTAAGAACCGCTTGTGAAAGAGCCAAGAGAACTTTGTCTTCCTCCGCTCAAACTTCCGTTGAAATTGACTCTTTGTTCGAAGGTATCGATTTCTACACTTCCATCACCAGAGCCAGATTCGAAGAATTGTGTGCTGACTTGTTCAGATCTACTTTGGACCCAGTTGAAAAGGTCTTGAGAGATGCTAAATTGGACAAATCTCAAGTCGATGAAATTGTCTTGGTCGGTGGTTCTACCAGAATTCCAAAGGTCCAAAAATTGGTCACTGACTACTTCAACGGTAAGGAACCAAACAGATCTATCAACCCAGATGAAGCTGTTGCTTACGGTGCTGCTGTTCAAGCTGCTATTTTGACTGGTGACGAATCTTCCAAGACTCAAGATCTATTGTTGTTGGATGTCGCTCCATTATCCTTGGGTATTGAAACTGCTGGTGGTGTCATGACCAAGTTGATTCCAAGAAACTCTACCATTTCAACAAAGAAGTTCGAGATCTTTTCCACTTATGCTGATAACCAACCAGGTGTCTTGATTCAAGTCTTTGAAGGTGAAAGAGCCAAGACTAAGGACAACAACTTGTTGGGTAAGTTCGAATTGAGTGGTATTCCACCAGCTCCAAGAGGTGTCCCACAAATTGAAGTCACTTTCGATGTCGACTCTAACGGTATTTTGAATGTTTCCGCCGTCGAAAAGGGTACTGGTAAGTCTAACAAGATCACTATTACCAACGACAAGGGTAGATTGTCCAAGGAAGATATCGAAAAGATGGTTGCTGAAGCCGAAAAATTCAAGGAAGAAGATGAAAAGGAATCTCAAAGAATTGCTTCCAAGAACCAATTGGAATCCATTGCTTACTCTTTGAAGAACACCATTTCTGAAGCTGGTGACAAATTGGAACAAGCTGACAAGGACACCGTCACCAAGAAGGCTGAAGAGACTATTTCTTGGTTAGACAGCAACACCACTGCCAGCAAGGAAGAATTCGATGACAAGTTGAAGGAGTTGCAAGACATTGCCAACCCAATCATGTCTAAGTTGTACCAAGCTGGTGGTGCTCCAGGTGGCGCTGCAGGTGGTGCTCCAGGCGGTTTCCCAGGTGGTGCTCCTCCAGCTCCAGAGGCTGAAGGTCCAACCGTTGAAGAAGTTGATTAA蛋白質Ssa1p屬于Hsp70蛋白質家族,而且駐留在細胞溶膠中。Hsp70具有執(zhí)行許多蛋白伴侶活性的能力;幫助蛋白質合成、裝配和折疊;介導多肽易位至多種胞內位置和分解蛋白質聚集體(Backer和Craig,1994,Eur.J.Biochem.,219,11-23)。Hsp70基因高度保守,具有N端ATP結合結構域和C端肽結合結構域。Hsp70蛋白質與蛋白質(主要是未折疊的)的肽主鏈相互作用。hsp70蛋白質對肽的結合和釋放是依賴ATP的過程,而且伴隨著hsp70的構象變化(Becher和Craig,1994,前述引用)。
細胞溶膠hsp70蛋白質特別參與蛋白質的合成、折疊和分泌(Becher和Craig,1994,前述引用)。在啤酒糖酵母中,已經將細胞溶膠hsp70蛋白質分成兩組,SSA(SSA 1-4)和SSB(SSB 1和2)蛋白質,它們在功能上彼此截然不同。SSA家族是必需的,即為了維持細胞的存活至少一種來自該組的蛋白質必須是有活性的(Becher和Craig,1994,前述引用)。細胞溶膠hsp70蛋白質優(yōu)先結合未折疊的和不成熟的蛋白質。這說明它們通過將蛋白質前體在細胞溶膠中在裝配成多分子復合體前維持未折疊狀態(tài)和/或推動它們易位至多種細胞器來防止其聚集(Becher和Craig,1994,前述引用)。SSA蛋白質特別參與前體易位進入內質網和線粒體的翻譯后生物發(fā)生和維持(Kim等人,1998,Proc.Natl.Acad.Sci.USA,95,12860-12865;Ngosuwan等人,2003,J.Biol.Chem.,278(9),7034-7042)。已經證明Ssa1p結合受損蛋白質,使之穩(wěn)定于部分未折疊形式并容許發(fā)生重新折疊或降解(Becher和Craig,1994,前述引用;Glover和Lindquist,1998,Cell,94,73-82)。
本發(fā)明還包括SSA1的變體和片段?!白凅w”在SSA1的語境中指具有天然SSA1的序列,只是一個或多個位置存在或保守的或非保守的氨基酸插入、刪除或替代的蛋白質,只要這些變化產生其基本特性例如酶促活性(類型和比活)、熱穩(wěn)定性、在某些pH范圍中的活性(pH穩(wěn)定性)沒有顯著變化的蛋白質?!帮@著”在此語境中指本領域技術人員將認為變體的特性仍然與最初的蛋白質有所不同,但不是不明顯的。
“保守替代”指預定組合,諸如Val、Ile、Leu、Ala、Met;Asp、Glu;Asn、Gln;Ser、Thr、Gly、Ala;Lys、Arg、His;及Phe、Tyr、Trp。優(yōu)選的保守替代包括Gly、Ala;Val、Ile、Leu;Asp、Glu;Asn、Gln;Ser、Thr;Lys、Arg;及Phe、Tyr。
SSA1的“變體”通常與天然SSA1的序列具有至少25%、至少50%、至少60%或至少70%、優(yōu)選至少80%、更加優(yōu)選至少90%、甚至更加優(yōu)選至少95%、仍然更加優(yōu)選至少99%、最優(yōu)選至少99.5%的序列同一性。
可以使用合適的計算機程序來測定兩種多肽之間的序列同一性百分比,正如下文所討論的。這些變體可以是天然的,或是使用本領域眾所周知的蛋白質工程和定點誘變的方法人造的。
“片段”在SSA1的語境中指具有天然SSA1的序列,只是一個或多個位置存在刪除的蛋白質。由此,片段可以包含完整成熟SSA1蛋白質的完整序列的至多5%、10%、20%、30%、40%或50%、通常可高達60%、更典型的是可高達70%、優(yōu)選可高達80%、更加優(yōu)選可高達90%、甚至更加優(yōu)選可高達95%、仍然更加優(yōu)選可高達99%。特別優(yōu)選的SSA1蛋白質的片段包含期望蛋白質的一個或多個完整結構域。
SSA1的片段或變體可以是在宿主細胞諸如啤酒糖酵母中重組表達時能夠補足宿主細胞中內源編碼SSA1基因的刪除的蛋白質,而且可以是例如SSA1的天然存在同系物,諸如由另一種生物體諸如另一種酵母或其它真菌、或另一種真核生物諸如人或其它脊椎動物、或動物或由植物編碼的同系物。
另一種優(yōu)選的蛋白伴侶是PSE1或其具有等價蛋白伴侶樣活性的片段或變體。
PSE1,也稱為KAP121,是一種必需基因,位于染色體XIII上。
蛋白質Pse1p的一種已發(fā)表蛋白質序列如下
MSALPEEVNRTLLQIVQAFASPDNQIRSVAEKALSEEWITENNIEYLLTFLAEQAAFSQDTTVAALSAVLFRKLALKAPPSSKLMIMSKNITHIRKEVIAQIRSSLLKGFLSERADSIRHKLSDAIAECVQDDLPAWPELLQALIESLKSGNPNFRESSFRILTTVPYLITAVDINSILPIFQSGFTDASDNVKIAAVTAFVGYFKQLPKSEWSKLGILLPSLLNSLPRFLDDGKDDALASVFESLIELVELAPKLFKDMFDQIIQFTDMVIKNKDLEPPARTTALELLTVFSENAPQMCKSNQNYGQTLVMVTLIMMTEVSIDDDDAAEWIESDDTDDEEEVTYDHARQALDRVALKLGGEYLAAPLFQYLQQMITSTEWRERFAAMMALSSAAEGCADVLIGEIPKILDMVIPLINDPHPRVQYGCCNVLGQISTDFSPFIQRTAHDRILPALISKLTSECTSRVQTHAAAALVNFSEFASKDILEPYLDSLLTNLLVLLQSNKLYVQEQALTTIAFIAEAAKNKFIKYYDTLMPLLLNVLKVNNKDNSVLKGKCMECATLIGFAVGKEKFHEHSQELISILVALQNSDIDEDDALRSYLEQSWSRICRILGDDFVPLLPIVIPPLLITAKATQDVGLIEEEEAANFQQYPDWDVVQVQGKHIAIHTSVLDDKVSAMELLQSYATLLRGQFAVYVKEVMEEIALPSLDFYLHDGVRAAGATLIPILLSCLLAATGTQNEELVLLWHKASSKLIGGLMSEPMPEITQVYHNSLVNGIKVMGDNCLSEDQLAAFTKGVSANLTDTYERMQDRHGDGDEYNENIDEEEDFTDEDLLDEINKSIAAVLKTTNGHYLKNLENIWPMINTFLLDNEPILVIFALVVIGDLIQYGGEQTASMKNAFIPKVTECLISPDARIRQAASYIIGVCAQYAPSTYADVCIPTLDTLVQIVDFPGSKLEENRSSTENASAAIAKILYAYNSNIPNVDTYTANWFKTLPTITDKEAASFNYQFLSQLIENNSPIVCAQSNISAVVDSVIQALNERSLTEREGQTVISSVKKLLGFLPSSDAMAIFNRYPADIMEKVHKWFA*PSE1的一種已發(fā)表核苷酸編碼序列如下,但是應當認識到,可以通過簡并替代來修飾序列以獲得編碼相同蛋白質產物的候選核苷酸序列
ATGTCTGCTTTACCGGAAGAAGTTAATAGAACATTACTTCAGATTGTCCAGGCGTTTGCTTCCCCTGACAATCAAATACGTTCTGTAGCTGAGAAGGCTCTTAGTGAAGAATGGATTACCGAAAACAATATTGAGTATCTTTTAACTTTTTTGGCTGAACAAGCCGCTTTCTCCCAAGATACAACAGTTGCAGCATTATCTGCTGTTCTGTTTAGAAAATTAGCATTAAAAGCTCCCCCTTCTTCGAAGCTTATGATTATGTCCAAAAATATCACACATATTAGGAAAGAAGTTCTTGCACAAATTCGTTCTTCATTGTTAAAAGGGTTTTTGTCGGAAAGAGCTGATTCAATTAGGCACAAACTATCTGATGCTATTGCTGAGTGTGTTCAAGACGACTTACCAGCATGGCCAGAATTACTACAAGCTTTAATAGAGTCTTTAAAAAGCGGTAACCCAAATTTTAGAGAATCCAGTTTTAGAATTTTGACGACTGTACCTTATTTAATTACCGCTGTTGACATCAACAGTATCTTACCAATTTTTCAATCAGGCTTTACTGATGCAAGTGATAATGTCAAAATTGCTGCAGTTACGGCTTTCGTGGGTTATTTTAAGCAACTACCAAAATCTGAGTGGTCCAAGTTAGGTATTTTATTACCAAGTCTTTTGAATAGTTTACCAAGATTTTTAGATGATGGTAAGGACGATGCCCTTGCATCAGTTTTTGAATCGTTAATTGAGTTGGTGGAATTGGCACCAAAACTATTCAAGGATATGTTTGACCAAATAATACAATTCACTGATATGGTTATAAAAAATAAGGATTTAGAACCTCCAGCAAGAACCACAGCACTCGAACTGCTAACCGTTTTCAGCGAGAACGCTCCCCAAATGTGTAAATCGAACCAGAATTACGGGCAAACTTTAGTGATGGTTACTTTAATCATGATGACGGAGGTATCCATAGATGATGATGATGCAGCAGAATGGATAGAATCTGACGATACCGATGATGAAGAGGAAGTTACATATGACCACGCTCGTCAAGCTCTTGATCGTGTTGCTTTAAAGCTGGGTGGTGAATATTTGGCTGCACCATTGTTCCAATATTTACAGCAAATGATCACATCAACCGAATGGAGAGAAAGATTCGCGGCCATGATGGCACTTTCCTCTGCAGCTGAGGGTTGTGCTGATGTTCTGATCGGCGAGATCCCAAAAATCCTGGATATGGTAATTCCCCTCATCAACGATCCTCATCCAAGAGTACAGTATGGATGTTGTAATGTTTTGGGTCAAATATCTACTGATTTTTCA
CCATTCATTCAAAGAACTGCACACGATAGAATTTTGCCGGCTTTAATATCTAAACTAACGTCAGAATGCACCTCAAGAGTTCAAACGCACGCCGCAGCGGCTCTGGTTAACTTTTCTGAATTCGCTTCGAAGGATATTCTTGAGCCTTACTTGGATAGTCTATTGACAAATTTATTAGTTTTATTACAAAGCAACAAACTTTACGTACAGGAACAGGCCCTAACAACCATTGCATTTATTGCTGAAGCTGCAAAGAATAAATTTATCAAGTATTACGATACTCTAATGCCATTATTATTAAATGTTTTGAAGGTTAACAATAAAGATAATAGTGTTTTGAAAGGTAAATGTATGGAATGTGCAACTCTGATTGGTTTTGCCGTTGGTAAGGAAAAATTTCATGAGCACTCTCAAGAGCTGATTTCTATATTGGTCGCTTTACAAAACTCAGATATCGATGAAGATGATGCGCTCAGATCATACTTAGAACAAAGTTGGAGCAGGATTTGCCGAATTCTGGGTGATGATTTTGTTCCGTTGTTACCGATTGTTATACCACCCCTGCTAATTACTGCCAAAGCAACGCAAGACGTCGGTTTAATTGAAGAAGAAGAAGCAGCAAATTTCCAACAATATCCAGATTGGGATGTTGTTCAAGTTCAGGGAAAACACATTGCTATTCACACATCCGTCCTTGACGATAAAGTATCAGCAATGGAGCTATTACAAAGCTATGCGACACTTTTAAGAGGCCAATTTGCTGTATATGTTAAAGAAGTAATGGAAGAAATAGCTCTACCATCGCTTGACTTTTACCTACATGACGGTGTTCGTGCTGCAGGAGCAACTTTAATTCCTATTCTATTATCTTGTTTACTTGCAGCCACCGGTACTCAAAACGAGGAATTGGTATTGTTGTGGCATAAAGCTTCGTCTAAACTAATCGGAGGCTTAATGTCAGAACCAATGCCAGAAATCACGCAAGTTTATCACAACTCGTTAGTGAATGGTATTAAAGTCATGGGTGACAATTGCTTAAGCGAAGACCAATTAGCGGCATTTACTAAGGGTGTCTCCGCCAACTTAACTGACACTTACGAAAGGATGCAGGATCGCCATGGTGATGGTGATGAATATAATGAAAATATTGATGAAGAGGAAGACTTTACTGACGAAGATCTTCTCGATGAAATCAACAAGTCTATCGCGGCCGTTTTGAAAACCACAAATGGTCATTATCTAAAGAATTTGGAGAATATATGGCCTATGATAAACACATTCCTTTTAGATAATGAACCAATTTTAGTCATTTTTGCATTAGTAGTGATTGGTGACTTGATTCAATATGGTGGCGAACAAACTGCTAGCATGAAGAACGCATTTATTCCAAAGGTTACCGAGTGCTTGATTTCTCCTGACGCTCGTATTCGCCAAGCTGCTTCTTATATAATCGGTGTTTGTGCCCAATACGCTCCATCTACATATGCTGACGTTTGCATACCGACTTTAGATACACTTGTTCAGATTGTCGATTTTCCAGGCTCCAAACTGGAAGAAAATCGTTCTTCAACAGAGAATGCCAGTGCAGCCATCGCCAAAATTCTTTATGCATACAATTCCAACATTCCTAACGTAGACGTACACACGGCTAATTGGTTCAAAACGTTACCAACAATAACTGACAAAGAAGCTGCCTCATTCAACTATCAATTTTTGAGTCAATTGATTGAAAATAATTCGCCAATTGTGTGTGCTCAATCTAATATCTCCGCTGTAGTTGATTCAGTCATACAAGCCTTGAATGAGAGAAGTTTGACCGAAAGGGAAGGCCAAACGGTGATAAGTTCAGTTAAAAAGTTGTTGGGATTTTTGCCTTCTAGTGATGCTATGGCAATTTTCAATAGATATCCAGCTGATATTATGGAGAAAGTACATAAATGGTTTGCATAA
PSE1基因的大小是3.25kb。Pse1p參與高分子的核質轉運(Seedorf和Silver,1997,Proc.Natl.Acad.Sci.USA,94,8590-8595)。該過程經由包埋在核被膜中且由核孔蛋白構成的核孔復合體(NPC)發(fā)生(Ryan和Wente,2000,Curr.Opin.Cell Biol.,12,361-371)。蛋白質具有包含核輸入(核定位序列(NLS))和輸出(核輸出序列(NES))所需要的信息的特異序列(Pemberton等人,1998,Curr.Opin.Cell Biol.,10,392-399)。Pse1p是核周蛋白/輸入蛋白,分成α和β家族的一組蛋白質。核周蛋白是通過識別NLS和NES并與NPC相互作用來介導高分子轉運穿過核膜的可溶性轉運因子(Seedorf和Silver,1997,前述引用;Pemberton等人,1998,前述引用;Ryan和Wente,2000,前述引用)。穿過核孔的易位是由GTP水解驅動的,后者是由小GTP結合蛋白質Ran催化的(Seedorf和Silver,1997,前述引用)。已經將Pse1p鑒定為核周蛋白β。已經在啤酒糖酵母中鑒定了14種核周蛋白B蛋白質,其中只有4種是必需的。這可能是因為多種核周蛋白可以介導一種高分子的轉運(Isoyama等人,2001,J.Biol.Chem.,276(24),21863-21869)。Pse1p定位于細胞核,位于核被膜,而且在某種程度上延伸至細胞質。這說明該蛋白質移動出入細胞核作為其轉運功能的一部分(Seedorf和Silver,1997,前述引用)。Pse1p參與轉錄因子(Isoyama等人,2001,前述引用;Ueta等人,2003,J.Biol.Chem.,278(50),50120-50127)、組蛋白(Mosammaparast等人,2002,J.Biol.Chem.,277(1),862-868)和核糖體蛋白質(在它們裝配成核糖體前)(Pemberton等人,1998,前述引用)的核輸入。它還介導mRNA由細胞核的輸出。核周蛋白識別并結合在RNA結合蛋白上找到的NES,該RNA結合蛋白在RNA由細胞核輸出前將其包被(Seedorf和Silver,1997,前述引用;Pemberton等人,1998,前述引用)。
由于高分子的核質轉運對于正確進行細胞周期是至關重要的,因此核轉運因子,諸如Pse1p,成為生長控制的新型候選靶(Seedorf和Silver,1997,前述引用)。
已經證明啤酒糖酵母中多拷貝質粒上Pse1p(蛋白質分泌增強子)的過度表達提高一系列生物學活性蛋白質的蛋白質分泌水平(Chow等人,1992,J.Cell.Sci.,101(3),709-719)。
本發(fā)明還包括PSE1的變體和片段?!白凅w”在PSE1的語境中指具有天然PSE1的序列,只是其中一個或多個位置存在或保守的或非保守的氨基酸插入、刪除或替代的蛋白質,只要這些變化產生其基本特性例如酶促活性(類型和比活)、熱穩(wěn)定性、在某些pH范圍中的活性(pH穩(wěn)定性)沒有顯著變化的蛋白質。“顯著”在此語境中指本領域技術人員將認為變體的特性仍然與最初的蛋白質有所不同,但不是不明顯的。
“保守替代”指預定組合,諸如Val、Ile、Leu、Ala、Met;Asp、Glu;Asn、Gln;Ser、Thr、Gly、Ala;Lys、Arg、His;及Phe、Tyr、Trp。優(yōu)選的保守替代包括Gly、Ala;Val、Ile、Leu;Asp、Glu;Asn、Gln;Ser、Thr;Lys、Arg;及Phe、Tyr。
PSE1的“變體”通常與天然PSE1的序列具有至少25%、至少50%、至少60%或至少70%、優(yōu)選至少80%、更加優(yōu)選至少90%、甚至更加優(yōu)選至少95%、仍然更加優(yōu)選至少99%、最優(yōu)選至少99.5%的序列同一性。
可以使用合適的計算機程序來測定兩種多肽之間的序列同一性百分比,正如下文所討論的。這些變體可以是天然的,或是使用本領域眾所周知的蛋白質工程和定點誘變的方法人造的。
“片段”在PSE1的語境中指具有天然PSE1的序列,只是一個或多個位置存在刪除的蛋白質。由此,片段可以包含完整成熟PSE1蛋白質的完整序列的至多5%、10%、20%、30%、40%或50%、通??筛哌_60%、更典型的是可高達70%、優(yōu)選可高達80%、更加優(yōu)選可高達90%、甚至更加優(yōu)選可高達95%、仍然更加優(yōu)選可高達99%。特別優(yōu)選的PSE1蛋白質的片段包含期望蛋白質的一個或多個完整結構域。
PSE1的片段或變體可以是在宿主細胞諸如啤酒糖酵母中重組表達時能夠補足宿主細胞中內源PSE1基因的刪除的蛋白質,而且可以是例如PSE1的天然存在同系物,諸如由另一種生物體諸如另一種酵母或其它真菌、或另一種真核生物諸如人或其它脊椎動物、或動物或由植物編碼的同系物。
另一種優(yōu)選的蛋白伴侶是ORM2或其具有等價蛋白伴侶樣活性的片段或變體。
ORM2,也稱為YLR350W,位于啤酒糖酵母基因組的染色體XII上(位置828729至829379),且編碼與酵母蛋白質Orm1p具有相似性的進化保守的蛋白質。Hjelmqvist等人,2002,Genome Biology,3(6),research0027.1-0027.16報告了ORM2屬于包括三種人類基因(ORMDL1、ORMDL2和ORMDL3)以及微孢子蟲、植物、果蠅、尾索動物和脊椎動物中的同系物的基因家族。有報道說ORMDL基因編碼錨定在內質網(ER)中的跨膜蛋白質。
蛋白質Orm2p是針對誘導未折疊蛋白質應答的試劑的抗性所需要的。Hjelmqvist等人,2002,前述引用,報告了兩種啤酒糖酵母ORMDL同系物(ORM1和ORM2)的雙重敲除導致生長速率降低以及針對衣霉素(tunicamycin)和二硫蘇糖醇的敏感性增加。
Orm2p的一種已發(fā)表序列如下MIDRTKNESPAFEESPLTPNVSNLKPFPSQSNKISTPVTDHRRRRSSSVISHVEQETFEDENDQQMLPNMNATWVDQRGAWLIHIVVIVLLRLFYSLFGSTPKWTWTLTNMTYIIGFYIMFHLVKGTPFDFNGGAYDNLTMWEQINDETLYTPTRKFLLIVPIVLFLISNQYYRNDMTLFLSNLAVTVLIGVVPKLGITHRLRISIPGITGRAQIS*上述蛋白質在啤酒糖酵母中是由如下編碼核苷酸序列編碼的,但是應當認識到,可以通過簡并替代來修飾序列以獲得編碼相同蛋白質產物的候選核苷酸序列ATGATTGACCGCACTAAAAACGAATCTCCAGCTTTTGAAGAGTCTCCGCTTACCCCCAATGTGTCTAACCTGAAACCATTCCCTTCTCAAAGCAACAAAATATCCACTCCAGTGACCGACCATAGGAGAAGACGGTCATCCAGCGTAATATCACATGTGGAACAGGAAACCTTCGAAGACGAAAATGACCAGCAGATGCTTCCCAACATGAACGCTACGTGGGTCGACCAGCGAGGCGCGTGGTTGATTCATATCGTCGTAATAGTACTCTTGAGGCTCTTCTACTCCTTGTTCGGGTCGACGCCCAAATGGACGTGGACTTTAACAAACATGACCTACATCATCGGATTCTATATCATGTTCCACCTTGTCAAAGGTACGCCCTTCGACTTTAACGGTGGTGCGTACGACAACCTGACCATGTGGGAGCAGATTAACGATGAGACTTTGTACACACCCACTAGAAAATTTCTGCTGATTGTACCCATTGTGTTGTTCCTGATTAGCAACCAGTACTACCGCAACGACATGACACTATTCCTCTCCAACCTCGCCGTGACGGTGCTTATTGGTGTCGTTCCTAAGCTGGGAATTACGCATAGACTAAGAATATCCATCCCTGGTATTACGGGCCGTGCTCAAATTAGTTAG本發(fā)明還包括ORM2的變體和片段?!白凅w”在ORM2的語境中指具有天然ORM2的序列,只是其中一個或多個位置存在或保守的或非保守的氨基酸插入、刪除或替代的蛋白質,只要這些變化產生其基本特性例如酶促活性(類型和比活)、熱穩(wěn)定性、在某些pH范圍中的活性(pH穩(wěn)定性)沒有顯著變化的蛋白質。“顯著”在此語境中指本領域技術人員將認為變體的特性仍然與最初的蛋白質有所不同,但不是不明顯的。
“保守替代”指預定組合,諸如Val、Ile、Leu、Ala、Met;Asp、Glu;Asn、Gln;Ser、Thr、Gly、Ala;Lys、Arg、His;及Phe、Tyr、Trp。優(yōu)選的保守替代包括Gly、Ala;Val、Ile、Leu;Asp、Glu;Asn、Gln;Ser、Thr;Lys、Arg;及Phe、Tyr。
ORM2的“變體”通常與天然ORM2的序列具有至少25%、至少50%、至少60%或至少70%、優(yōu)選至少80%、更加優(yōu)選至少90%、甚至更加優(yōu)選至少95%、仍然更加優(yōu)選至少99%、最優(yōu)選至少99.5%的序列同一性。
可以使用合適的計算機程序來測定兩種多肽之間的序列同一性百分比,正如下文所討論的。這些變體可以是天然的,或是使用本領域眾所周知的蛋白質工程和定點誘變的方法人造的。
“片段”在ORM2的語境中指具有天然ORM2的序列,只是一個或多個位置存在刪除的蛋白質。由此,片段可以包含完整成熟ORM2蛋白質的完整序列的至多5%、10%、20%、30%、40%或50%、通??筛哌_60%、更典型的是可高達70%、優(yōu)選可高達80%、更加優(yōu)選可高達90%、甚至更加優(yōu)選可高達95%、仍然更加優(yōu)選可高達99%。特別優(yōu)選的ORM2蛋白質的片段包含期望蛋白質的一個或多個完整結構域。
ORM2的片段或變體可以是在宿主細胞諸如啤酒糖酵母中重組表達時能夠補足宿主細胞中內源ORM2基因的刪除的蛋白質,而且可以是例如ORM2的天然存在同系物,諸如由另一種生物體諸如另一種酵母或其它真菌、或另一種真核生物諸如人或其它脊椎動物、或動物或由植物編碼的同系物。
特別優(yōu)選的是,依照本發(fā)明第一個、第二個或第三個方面的質?;蛟诙嗪塑账嵝蛄胁迦胫谢蛟谫|粒的其它部位包含編碼如下蛋白質的開放讀碼框,該蛋白質包含清蛋白或其片段或變體的序列。或者,該質粒轉化其中的宿主細胞可以在其基因組內包含編碼如下蛋白質的多核苷酸序列作為或內源的或異源的序列,該蛋白質包含清蛋白或其片段或變體的序列。
“清蛋白”包括具有由任何來源獲得的清蛋白蛋白質之序列的蛋白質。通常,來源指哺乳動物。在一個優(yōu)選的實施方案中,血清清蛋白指人血清清蛋白(“HSA”)。術語“人血清清蛋白”包括具有在人類中天然存在的氨基酸序列的血清清蛋白及其變體的含義。優(yōu)選的是,清蛋白具有WO 90/13653中公開的氨基酸序列或其變體??梢酝ㄟ^用于分離與人類基因對應的cDNA的已知方法獲得HSA編碼序列,正如例如EP 73 646和EP 286 424中所公開的。
在另一個優(yōu)選的實施方案中,“清蛋白”具有牛血清清蛋白的序列。術語“牛血清清蛋白”包括具有在牛中天然存在的氨基酸序列的血清清蛋白(例如來自Swissprot編號P02769)及其變體的含義,正如下文所定義的。術語“牛血清清蛋白”還包括全長牛血清清蛋白或其變體的片段的含義,正如下文所定義的。
在另一個優(yōu)選的實施方案中,清蛋白指由來自犬(如參閱Swissprot編號P49822)、豬(如參閱Swissprot編號P08835)、山羊(如可由Sigma以產品編號A2514或A4164獲得)、火雞(如參閱Swissprot編號O73860)、狒狒(如可由Sigma以產品編號A1516獲得)、貓(如參閱Swissprot編號P49064)、雞(如參閱Swissprot編號P19121)、卵清蛋白(如雞卵清蛋白)(如參閱Swissprot編號P01012)、驢(如參閱Swissprot編號P39090)、豚鼠(如可由Sigma以產品編號A3060、A2639、O5483或A6539獲得)、倉鼠(如可由Sigma以產品編號A5409獲得)、馬(如參閱Swissprot編號P35747)、獼猴(如參閱Swissprot編號Q28522)、小鼠(如參閱Swissprot編號O89020)、鴿子(如Khan等人,2002,Int.J.Biol.Macromol.,30(3-4),171-8所定義的)、兔(如參閱Swissprot編號P49065)、大鼠(如參閱Swissprot編號P36953)和綿羊(如參閱Swissprot編號P14639)的血清清蛋白其中之一衍生(具有其序列)的清蛋白,且包括其變體和片段,正如下文所定義的。
已知清蛋白的許多天然存在的突變形式。Peters,1996,《All AboutAlbuminBiochemistry,Genetics and Medical Applications》,Academic PressInc.,San Diego,California,第170-181頁描述了許多。如上定義的變體可以是這些天然存在變體之一。
“變體清蛋白”指其中一個或多個位置存在或保守的或非保守的氨基酸插入、刪除或替代的清蛋白蛋白質,只要這些變化產生其至少一項基本特性例如結合活性(類型和比活,如與膽紅素結合)、滲透性(滲透壓、膠體滲透壓)、在某些pH范圍中的表現(xiàn)(pH穩(wěn)定性)沒有顯著變化的清蛋白蛋白質?!帮@著”在此語境中指本領域技術人員將認為變體的特性仍然與最初的蛋白質有所不同,但不是不明顯的。
“保守替代”指預定組合,諸如Gly、Ala;Val、Ile、Leu;Asp、Glu;Asn、Gln;Ser、Thr;Lys、Arg;及Phe、Tyr??梢酝ㄟ^本領域眾所周知的技術來制備這些變體,正如通過1981年11月24日發(fā)布給Stevens的美國專利號4,302,386中公開的定點誘變,收入本文作為參考。
通常,清蛋白變體與天然存在的清蛋白具有超過40%、通常至少50%、更加典型的是至少60%、優(yōu)選至少70%、更加優(yōu)選至少80%、仍然更加優(yōu)選至少90%、甚至更加優(yōu)選至少95%、最優(yōu)選至少98%或更高序列同一性。
可以使用合適的計算機程序來測定兩種多肽之間的序列同一性百分比,例如威斯康星大學(University of Wisconsin)遺傳計算小組(GeneticComputing Group)的GAP程序,而且應當認識到,同一性百分比是關于其序列得到最佳對比的多肽計算得出的?;蛘呖梢允褂肅lustal W程序(Thompson等人,1994)來進行對比??梢允褂萌缦聟悼焖俪蓪Ρ葏礙-tuple(詞)大?。?,窗口大小;5,缺口罰分;3,最高對角線數目;5。評分方法x百分比。M多重對比參數缺口打開罰分;10,缺口延伸罰分;0.05。評分矩陣BLOSUM。
術語“片段”如上所用包括全長清蛋白或其變體的任何片段,只要至少一項基本特性例如結合活性(類型和比活,如與膽紅素結合)、滲透性(滲透壓、膠體滲透壓)、在某些pH范圍中的表現(xiàn)(pH穩(wěn)定性)沒有顯著變化?!帮@著”在此語境中指本領域技術人員將認為變體的特性仍然與最初的蛋白質有所不同,但不是不明顯的。片段的長度通常是至少50個氨基酸。片段可以包含清蛋白的至少一個完整亞結構域。已經作為重組蛋白表達HSA的結構域(Dockal,M.等人,1999,J.Biol.Chem.,274,29303-29310),其中結構域I定義為由氨基酸1-197組成,結構域II定義為由氨基酸189-385組成,而結構域III定義為由氨基酸381-585組成。存在結構域的部分交疊是因為結構域I和II之間、結構域II和III之間存在延伸的α-螺旋結構(Peters,1996,前述引用,表2-4)。HSA還包含六個亞結構域(亞結構域IA、IB、IIA、IIB、IIIA和IIIB)。亞結構域IA包含氨基酸6-105,亞結構域IB包含氨基酸120-177,亞結構域IIA包含氨基酸200-291,亞結構域IIB包含氨基酸316-369,亞結構域IIIA包含氨基酸392-491,而亞結構域IIIB包含氨基酸512-583。片段可以包含如上定義的一個或多個結構域或亞結構域的整個或部分,或是那些結構域和/或亞結構域的任意組合。
由此,多核苷酸插入可以包含編碼清蛋白或其變體或片段的開放讀碼框。
或者,優(yōu)選的是,依照本發(fā)明第一個、第二個或第三個方面的質粒在多核苷酸序列插入內或在質粒的其它部位包含編碼如下蛋白質的開放讀碼框,該蛋白質包含運鐵蛋白或其變體或片段的序列?;蛘撸撡|粒轉化其中的宿主細胞可以在其基因組內包含編碼如下蛋白質的多核苷酸序列作為或內源的或異源的序列,該蛋白質包含運鐵蛋白或其變體或片段的序列。
術語“運鐵蛋白”在用于本文時包括運鐵蛋白家族的所有成員(Testa,《Proteins ofiron metabolism》,CRC Press,2002;Harris和Aisen,《Iron carriersand iron proteins》,第5卷,Physical Bioinorganic Chemistry,VCH,1991)及其衍生物,諸如運鐵蛋白、運鐵蛋白突變體(Mason等人,1993,Biochemistry,32,5472;Mason等人,1998,Biochem.J.,330(1),35)、截短的運鐵蛋白、運鐵蛋白葉(Mason等人,1996,Protein Expr.Purif.,8,119;Mason等人,1991,Protein Expr.Purif.,2,214)、乳鐵蛋白、乳鐵蛋白突變體、截短的乳鐵蛋白、乳鐵蛋白葉(lobe)、或任何上述與其它肽、多肽或蛋白質的融合體(Shin等人,1995,Proc.Natl.Acad.Sci.USA,92,2820;Ali等人,1999,J.Biol.Chem.,274,24066;Mason等人,2002,Biochemistry,41,9448)。
運鐵蛋白可以是人運鐵蛋白。術語“人運鐵蛋白”在用于本文時指與衍生自人的運鐵蛋白不能區(qū)別或是其變體或片段的物質。“變體”包括或保守的或非保守的插入、刪除和替代,其中這些變化不顯著改變運鐵蛋白的有用的配體結合或免疫原性特性。
本發(fā)明包括運鐵蛋白的突變體。這些突變體可以具有改變的免疫原性。例如,運鐵蛋白突變體可以展示經過修飾的(如降低的)糖基化??梢酝ㄟ^添加/消除氨基酸糖基化共有序列來修飾運鐵蛋白分子的N連接糖基化模式,諸如N-X-S/T,在N、X、或S/T的任何或所有位置。對運鐵蛋白突變體可以改變其與金屬離子和/或其它蛋白質諸如運鐵蛋白受體的天然結合。下文例示了以這種方式修飾的運鐵蛋白突變體的一個實例。
本發(fā)明還包括人運鐵蛋白或人運鐵蛋白類似物的天然存在多態(tài)變體。通常,人運鐵蛋白的變體或片段具有人運鐵蛋白的配體結合活性(例如鐵結合)的至少50%(優(yōu)選至少80%、90%或95%),重量對重量??梢酝ㄟ^分光光度法測定運鐵蛋白或測試樣品的鐵結合活性,對蛋白質測量它們沒有鐵和滿載鐵狀態(tài)的470nm∶280nm吸光度比值。試劑應當不含鐵,除非另有說明??梢酝ㄟ^在0.1M檸檬酸鹽、0.1M醋酸鹽、10mM EDTA pH4.5中進行透析而由運鐵蛋白或測試樣品中清除鐵。蛋白質應當以約20mg/ml溶于100mMHEPES、10mM NaHCO3pH8.0。測量在水中稀釋的脫鐵運鐵蛋白(Calbiochem,CN Biosciences,Nottingham,UK)的470nm∶280nm吸光度比值,從而能夠通過分光光度法精確測定280nm吸光度(0%鐵結合)。將191mg次氮基三乙酸溶于2ml 1M NaOH,然后添加2ml 0.5M氯化鐵,由此制備20mM次氮基三乙酸鐵(FeNTA)溶液。用去離子水稀釋至50ml。添加充分過量的新鮮制備的20mM FeNTA使脫鐵運鐵蛋白滿載鐵(100%鐵結合),然后在100mM HEPES、10mM NaHCO3pH8.0中徹底透析全運鐵蛋白,從而在測量470nm∶280nm吸光度比值前清除剩余FeNTA。用測試樣品重復此流程,它應當是最初不含鐵,并將最終比值與對照進行比較。
另外,可以使用包含任何上述的單一或多重異源融合體;或是與清蛋白、運鐵蛋白或免疫球蛋白或其變體或片段的一種或多種異源融合體。這些融合體包括清蛋白N端融合體、清蛋白C端融合體和WO 01/79271例示的清蛋白N端和C端共融合體、及運鐵蛋白N端融合體、運鐵蛋白C端融合體和運鐵蛋白N端和C端共融合體。
技術人員還將領會,任何其它基因的開放讀碼框或變體或部分或其中任一在形成用于本發(fā)明的多核苷酸序列插入時可用于形成整個或部分開放讀碼框。例如,開放讀碼框可以編碼包含任何序列的蛋白質,它可以是天然蛋白質(包括酶原)、或天然蛋白質的變體、或片段(它可以是例如結構域);或是完全人工合成的蛋白質;或是不同蛋白質(天然的或合成的)的單一或多重融合體。不排他的,這些蛋白質可以來自WO 01/79258、WO 01/79271、WO 01/79442、WO 01/79443、WO 01/79444和WO 01/79480中提供的列表或其變體或片段;將其公開書收入本文作為參考。盡管這些專利申請?zhí)峁┝岁P于清蛋白融合配偶體的內容的列表,本發(fā)明不受此限制,而且出于本發(fā)明的目的,可以單獨提供其中所列的任何蛋白質或者以清蛋白、免疫球蛋白Fc區(qū)、運鐵蛋白、乳鐵蛋白或任何其它蛋白質或任何上述的片段或變體的融合配偶體,包括包含任何上述的融合蛋白的形式,作為期望多肽。美國專利申請US2003/0221201和US2003/0226155給出了運鐵蛋白融合體的其它實例。
通過本發(fā)明表達的期望蛋白質的其它優(yōu)選實例包括包含單克隆抗體、鬼臼亞乙苷(etoposide)、血清蛋白質(諸如血液凝結因子)、antistasin、蜱抗凝肽(tick anticoagulant peptide)、運鐵蛋白、乳鐵蛋白、內皮抑制素(endostatin)、抑管張素(angiostatin)、膠原蛋白、免疫球蛋白或基于免疫球蛋白的分子或二者片段(如Small Modular ImmunoPharmaceuticalTM(小模塊免疫藥物,“SMIP”)或dAb、Fab′片段、F(ab′)2、scAb、scFv或scFv片段)、Kunitz結構域蛋白質(諸如WO 03/066824中所描述的,含或不含清蛋白融合體)、干擾素、白介素、IL10、IL11、IL2、干擾素α的各個種類和亞類、干擾素β各個種類和亞類、干擾素γ的各個種類和亞類、瘦蛋白(leptin)、CNTF、CNTFAX15、IL1受體拮抗物、紅細胞生成素(EPO)和EPO模擬物、血小板生成素(TPO)和TPO模擬物、prosaptide、藍藻抗病毒蛋白N(cyanovirin-N)、5-螺旋、T20肽、T1249肽、HIV gp41、HIV gp120、尿激酶、尿激酶原、tPA(組織型纖溶酶原激活物)、水蛭素、血小板衍生生長因子、甲狀旁腺激素、胰島素原、胰島素、胰高血糖素、胰高血糖素樣肽、胰島素樣生長因子、降鈣素、生長激素、轉化生長因子β、腫瘤壞死因子、G-CSF、GM-CSF、M-CSF、FGF、前體和活性形式的凝血因子包括但不限于纖溶酶原、纖維蛋白原、凝血酶、前凝血酶、凝血酶原、von Willebrand氏因子、α1-抗胰蛋白酶、纖溶酶原激活物、因子VII、因子VIII、因子IX、因子X和因子XIII、神經生長因子、LACI(脂蛋白相關促凝抑制物,也稱為組織因子途經抑制物或外部途經抑制物)、血小板衍生內皮細胞生長因子(PD-ECGF)、葡萄糖氧化酶、血清膽堿酯酶、抑酶肽(aprotinin)、淀粉狀蛋白前體蛋白(amyloid precursor)、inter-α胰蛋白酶抑制物(inter-alpha typsin)、抗凝血酶III、脫脂載脂蛋白各種類、蛋白C、蛋白S或任何上述的變體或片段或融合蛋白之序列的序列。上述蛋白可以是也可以不是hirudin。
“變體”在上文所列蛋白質的語境中指其中一個或多個位置存在或保守的或非保守的氨基酸插入、刪除或替代的蛋白質,只要這些變化產生其基本特性例如酶促活性或受體結合(類型和比活)、熱穩(wěn)定性、在某些pH范圍中的活性(pH穩(wěn)定性)沒有顯著變化的蛋白質?!帮@著”在此語境中指本領域技術人員將認為變體的特性仍然與最初的蛋白質有所不同,但不是不明顯的。
“保守替代”指預定組合,諸如Val、Ile、Leu、Ala、Met;Asp、Glu;Asn、Gln;Ser、Thr、Gly、Ala;Lys、Arg、His;及Phe、Tyr、Trp。優(yōu)選的保守替代包括Gly、Ala;Val、Ile、Leu;Asp、Glu;Asn、Gln;Ser、Thr;Lys、Arg;及Phe、Tyr。
“變體”通常與衍生它的多肽具有至少25%、至少50%、至少60%或至少70%、優(yōu)選至少80%、更加優(yōu)選至少90%、甚至更加優(yōu)選至少95%、仍然更加優(yōu)選至少99%、最優(yōu)選至少99.5%的序列同一性。
可以使用合適的計算機程序來測定兩種多肽之間的序列同一性百分比,例如威斯康星大學(University of Wisconsin)遺傳計算小組Genetic ComputingGroup的GAP程序,而且應當認識到,同一性百分比是關于其序列得到最佳對比的多肽計算得出的。
或者,可以使用Clustal W程序(Thompson等人,1994,Nucleic Acids Res.,22(22),4673-80)來進行對比??梢允褂萌缦聟怠窨焖俪蓪Ρ葏礙-tuple(詞)大小;1,窗口大??;5,缺口罰分;3,最高對角線數目;5。評分方法x百分比。
●多重對比參數缺口打開罰分;10,缺口延伸罰分;0.05。
●評分矩陣BLOSUM。
這些變體可以是天然的,或是使用本領域眾所周知的蛋白質工程和定點誘變的方法人造的。
“片段”在上文所列蛋白質的語境中指一個或多個位置存在刪除的蛋白質。由此,片段可以包含完整成熟多肽的完整序列的至多5%、10%、20%、30%、40%或50%。通常,片段包含完整期望多肽的完整序列的可高達60%、更典型的是可高達70%、優(yōu)選可高達80%、更加優(yōu)選可高達90%、甚至更加優(yōu)選可高達95%、仍然更加優(yōu)選可高達99%。特別優(yōu)選的期望蛋白質的片段包含期望蛋白質的一個或多個完整結構域。
特別優(yōu)選的是,依照本發(fā)明第一個、第二個或第三個方面的質?;蛟诙嗪塑账嵝蛄胁迦胫谢蛟谫|粒的其它部位包含編碼如下蛋白質的開放讀碼框,該蛋白質包含清蛋白或其片段或變體或是來自上文實例的任何其它蛋白質(與融合配偶體融合的或未融合的)的序列和至少一種其它異源序列,其中至少一種其它異源序列可以包含轉錄區(qū),諸如開放讀碼框。在一個實施方案中,開放讀碼框可以編碼包含酵母蛋白質之序列的蛋白質。在另一個實施方案中,開放讀碼框可以編碼包含參與蛋白質折疊或是具有蛋白伴侶活性或參與未折疊蛋白質應答的蛋白質之序列的蛋白質,優(yōu)選蛋白質二硫鍵異構酶。
由此生成的質粒在US和UL區(qū)之間可以具有或沒有對稱性。例如,在US與UL之間或在UL與US區(qū)之間可以達到1∶1、5∶4、5∶3、5∶2、5∶1或5∶<1的大小比例。本發(fā)明的好處不依賴所維持的對稱性。
本發(fā)明還提供了制備本發(fā)明質粒的方法,該方法包括(a)提供包含REP2基因或FLP基因和與所述基因相鄰的反向重復片段的2μm家族質粒;(b)提供多核苷酸序列并在依照本發(fā)明第一個、第二個或第三個優(yōu)選方面的位置將多核苷酸序列插入質粒;和/或(c)作為步驟(b)的附加/候選,在依照本發(fā)明第一個、第二個或第三個優(yōu)選方面的位置刪除一些或所有核苷酸堿基;和/或(d)作為步驟(b)和(c)的附加/候選,在依照本發(fā)明第一個、第二個或第三個優(yōu)選方面的位置用候選核苷酸堿基替代一些或所有核苷酸堿基。
可以使用本領域眾所周知的技術來完成步驟(b)、(c)和(d),包括克隆技術、定點誘變等,諸如Sambrook等人,《Molecular CloningA LaboratoryManual》,2001,第3版(將其內容收入本文作為參考)中所描述的。例如,這樣一種方法涉及經由粘端的連接??梢酝ㄟ^合適限制酶的作用在用于插入的DNA片段和質粒上生成相容粘端。這些末端將經由互補堿基配對而快速退火,而且可以通過DNA連接酶的作用來關閉剩余的切口。
另一種方法使用合成的雙鏈寡核苷酸接頭和銜接頭。通過消除突出的3’末端并補平凹入的3’末端的噬菌體T4DNA聚合酶或大腸桿菌DNA聚合酶I生成具有平端的DNA片段。可以通過T4DNA連接酶將含有指定限制酶的識別序列的合成接頭和平端雙鏈DNA碎片與末端補平的DNA片段連接。然后用合適的限制酶消化它們以生成粘端,并與具有相容末端的表達載體連接。銜接頭也是化學合成的DNA片段,它含有一個用于連接的平端,但也具有一個預先形成的粘端?;蛘?,可以在存在或不含一種或多種合成雙鏈寡核苷酸(任選含有粘端的)時通過DNA連接酶的作用將DNA片段連接到一起。
可以通過商業(yè)途經由許多來源獲得含有多種限制性內切核酸酶位點的合成接頭,包括Sigma-Genosys Ltd,London Road,Pampisford,Cambridge,United Kingdom。
因此,本發(fā)明還提供了可通過上述方法獲得的質粒。
本發(fā)明還提供了包含上文定義的質粒的宿主細胞。宿主細胞可以是任何類型的細胞。優(yōu)選細菌和酵母宿主細胞。細菌宿主細胞可用于克隆目的。酵母宿主細胞可用于表達質粒中存在的基因。
在一個實施方案中,宿主細胞是質粒在其中作為多拷貝質粒穩(wěn)定的細胞。由一種酵母類型獲得的質??梢栽谄渌湍割愋椭械玫骄S持(Irie等人,1991,Gene,108(1),139-144;Irie等人,1991,Mol.Gen.Genet.,225(2),257-265)。例如,來自魯氏接合糖酵母的pSR1可以在啤酒糖酵母中維持。如果質粒是基于pSR1、pSB3或pSB4的,那么宿主細胞可以是魯氏接合糖酵母;如果質粒是基于pSB1或pSB2的,那么宿主細胞可以是拜列氏接合糖酵母;如果質粒是基于pPM1的,那么宿主細胞可以是膜醭畢赤氏酵母;如果質粒是基于pSM1的,那么宿主細胞可以是發(fā)酵接合糖酵母;如果質粒是基于pKD1的,那么宿主細胞可以是果蠅克魯維氏酵母;而如果質粒是基于2μm質粒的,那么宿主細胞可以是啤酒糖酵母或卡爾斯伯糖酵母。如果本發(fā)明的2μm家族質粒包含具有衍生自該天然存在質粒之序列的基因FLP、REP1和REP2中的一種、兩種或優(yōu)選三種,那么可以將它說成是“基于”該天然存在質粒的。
可以經由標準技術將如上定義的質粒導入宿主。關于原核宿主細胞的轉化,參閱例如Cohen等人,1972,Proc.Natl.Acad.Sci.USA,69,2110及Sambrook等人,2001,《Molecular Cloning,A Laboratory Manual》,第3版,Cold Spring Harbor Laboratory,Cold Spring Harbor,NY。酵母細胞的轉化參閱Sherman等人,1986,《Methods In Yeast Genetics,A Laboratory Manual》,Cold Spring Harbor,NY。也可以使用Beggs,1978,Nature,275,104-109的方法。EP 251744、EP 258067和WO 90/01063中概括講授了用于轉化啤酒糖酵母的方法,將它們都收入本文作為參考。關于脊椎動物細胞,可用于轉染這些細胞的試劑例如磷酸鈣和DEAE-右旋糖苷或脂質體配劑可以由Stratagene Cloning System或Life Technologies Inc.,Gaithersburg,MD 20877,USA獲得。
電穿孔也可用于轉化細胞,而且在本領域眾所周知用于轉化酵母細胞、細菌細胞和脊椎動物細胞。Becker和Guarente,1990,Methods Enzymol.,194,182中公開了通過電穿孔轉化酵母的方法。
一般而言,質粒不會轉化所有的宿主,因此必須選擇得到轉化的宿主細胞。由此,依照本發(fā)明第一個、第二個或第三個方面其中任一的質??梢曰蛟诙嗪塑账嵝蛄胁迦胫谢蛟谫|粒的其它部位包含選擇標記,包括但不限于細菌選擇標記和/或酵母選擇標記。典型的細菌選擇標記是β-內酰胺酶基因,盡管本領域還知道許多其它的。合適的酵母選擇標記包括LEU2(或編碼具有β-內酰胺酶或蘋果酸脫氫酶活性的蛋白質的等價基因)、TRP1、HIS3、HIS4、URA3、URA5、SFA1、ADE2、MET15、LYS5、LYS2、ILV2、FBA1、PSE1、PDI1和PGK1。根據可以獲得的不同選項,可以選擇最合適的選擇標記。如果希望這么做,可以消除URA3和/或LEU2。本領域技術人員將領會,其染色體刪除或滅活將導致宿主不可存活的任何基因,即所謂的必需基因,都可用作選擇標記,如果在質粒上提供功能性基因的話,正如PGK1在pgk1酵母菌株中所演示的(Piper和Curran,1990,Curr.Genet.,17,119)。合適的必需基因可以在斯坦福基因組數據庫(Stanford Genome Database,SGD)中找到,http//db.yeastgenome.org。
另外,依照本發(fā)明第一個、第二個或第三個方面其中任一的質??梢曰蛟诙嗪塑账嵝蛄胁迦胫谢蛟谫|粒的其它部位包含超過一種選擇標記。
一種選擇技術涉及將編碼轉化細胞中的可選擇性狀的DNA序列標記與任何必需的控制元件一起摻入表達載體。這些標記包括用于真核細胞培養(yǎng)的二氫葉酸還原酶、G418或新霉素抗性,及用于培養(yǎng)大腸桿菌和其它細菌的四環(huán)素、卡那霉素或氨芐青霉素(即β-內酰胺酶)抗性基因?;蛘?,這些可選擇性狀的基因可以在用于共轉化期望宿主細胞的另一種載體上。
鑒定受到成功轉化的細胞的另一種方法涉及培養(yǎng)通過導入本發(fā)明質粒而生成的細胞,任選容許表達重組多肽(即由質粒上的多核苷酸序列編碼且對于宿主細胞是異源的多肽,就該宿主不天然生成該多肽而言)??梢允斋@并裂解細胞,并使用諸如Southern,1975,J.Mol.Biol.,98,503或Berent等人,1985,Biotech.,3,208描述的方法或者本領域常用的DNA和RNA分析的其它方法,對它們的DNA或RNA內容檢查重組序列的存在?;蛘?,可以使用抗體來檢查轉化細胞培養(yǎng)物上清液中多肽的存在。
當重組DNA能夠指導蛋白質的表達時,除了直接檢驗重組DNA的存在以外,可以通過眾所周知的免疫學方法來確認成功的轉化。例如,用表達載體成功轉化的細胞生成展示適當抗原性的蛋白質。收獲懷疑得到轉化的細胞的樣品并使用合適的抗體檢驗蛋白質。
由此,除了得到轉化的宿主細胞自身以外,本發(fā)明還涵蓋那些細胞在營養(yǎng)培養(yǎng)基中的培養(yǎng)物,優(yōu)選單克隆(克隆同質的)培養(yǎng)物,或是由單克隆培養(yǎng)物衍生的培養(yǎng)物?;蛘撸D化細胞自身可以代表工業(yè)/商業(yè)或制藥學有用的產品,而且可以由培養(yǎng)物的培養(yǎng)基純化,并任選以適合于它們的預定工業(yè)/商業(yè)或制藥學用途的方式與載體或稀釋劑一起配制,且任選以適合于該用途的方式包裝和展示。例如,可以將全細胞固定化;或用于將細胞培養(yǎng)物直接噴灑到突起的部分(process)、農作物或其它期望目標上/中。類似的,全細胞,諸如酵母細胞,可以膠囊的形式用于極其多種應用,諸如香料、香精和藥物。
然后,可以在本領域技術人員知道的且考慮到本文公開的技術的適當條件下將經轉化宿主細胞培養(yǎng)足夠時間,從而容許質粒內一個或多個多核苷酸序列插入中任何ORF的表達。
本發(fā)明由此還提供了用于生產蛋白質的方法,包括下列步驟(a)提供如上定義的依照本發(fā)明第一個、第二個或第三個方面的質粒;(b)提供合適的宿主細胞;(c)用所述質粒轉化所述宿主細胞;并(d)在培養(yǎng)基中培養(yǎng)經轉化宿主細胞,由此生成蛋白質。
已知許多表達系統(tǒng),包括細菌(例如大腸桿菌和枯草芽孢桿菌)、酵母、絲狀真菌(例如曲霉)、植物細胞、完整植株、動物細胞和昆蟲細胞。
在一個實施方案中,優(yōu)選的宿主細胞是質粒能夠在其中作為穩(wěn)定多拷貝質粒維持的酵母。這些酵母包括啤酒糖酵母、乳克魯維氏酵母、巴斯德畢赤氏酵母、魯氏接合糖酵母、拜列氏接合糖酵母、發(fā)酵接合糖酵母和果蠅克魯維氏酵母。
如果質粒含有或經過修飾后含有選擇標記(如LEU2)且通過標記遺失測量的穩(wěn)定性在1代、2代、3代、4代、5代、6代、7代、8代、9代、10代、11代、12代、13代、14代、15代、16代、17代、18代、19代、20代、25代、30代、35代、40代、45代、50代、60代、70代、80代、90代、100代或更多代后是至少1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.9%或基本上100%,那么它能夠在宿主中作為穩(wěn)定多拷貝質粒維持??梢匀缟纤鰠⒖糃hinery和Hinchliffe,1989,Curr.Genet.,16,21-25來評估標記的遺失。
特別有利的是利用參與蛋白質O-糖基化的一種或多種蛋白質甘露糖基轉移酶缺陷的酵母,例如通過破壞基因編碼序列。
重組表達的蛋白質可能由生產宿主細胞進行不想要的翻譯后修飾。例如,清蛋白蛋白質序列不含N-連接糖基化的任何位點,且沒有報道說在自然條件下受到O-連接糖基化的修飾。然而,發(fā)現(xiàn)在許多酵母物種中生成的重組人清蛋白(“rHA”)可以受到O-連接糖基化的修飾,通常涉及甘露糖。甘露糖化清蛋白能夠結合凝集素伴刀豆球蛋白A。由酵母生成的甘露糖化清蛋白的數量可以通過使用一種或多種PMT基因缺陷的酵母菌株而降低(WO94/04687)。實現(xiàn)這一目的的最方便方式是創(chuàng)建其基因組具有缺陷使得一種或多種Pmt蛋白質的水平降低的酵母。例如,編碼序列或調控區(qū)(或調節(jié)PMT基因之一表達的另一種基因)中可以存在缺失、插入或轉座,使得生成少許Pmt蛋白質或不生成?;蛘?,可以轉化酵母以生成抗Pmt試劑,諸如抗Pmt抗體。
如果使用啤酒糖酵母以外的酵母,那么破壞啤酒糖酵母PMT基因的一種或多種等價基因也是有利的,例如在巴斯德畢赤氏酵母或乳克魯維氏酵母中。由啤酒糖酵母分離的PMT1(或任何其它PMT基因)的序列可用于鑒定或破壞在其它真菌物種中編碼相似酶促活性的基因。WO 94/04687中描述了乳克魯維氏酵母PMT1同系物的克隆。
有利的是,酵母具有HSP150和/或YAP3基因的缺失,正如WO 95/33833和WO 95/23857中分別講授的。
本發(fā)明還提供了生產蛋白質的方法,包括下列步驟提供如上定義的宿主細胞,該宿主細胞包含本發(fā)明的質粒,并在培養(yǎng)基中培養(yǎng)所述宿主細胞,由此生成蛋白質。培養(yǎng)基可以是非選擇性的,或是對質粒的穩(wěn)定多拷貝維持施加選擇壓力。
生產由本發(fā)明質粒表達的蛋白質的方法優(yōu)選還包括以下步驟由培養(yǎng)的宿主細胞或培養(yǎng)基分離由此生成的蛋白質。
由此生成的蛋白質可以是存在于胞內,或者如果分泌的話,存在于培養(yǎng)基和/或宿主細胞周質空間中??梢酝ㄟ^本領域知道的許多方法由細胞和/或培養(yǎng)物的培養(yǎng)基分離蛋白質。例如,WO 92/04367“基質衍生染料的清除”、EP 464 590“酵母衍生著色劑的清除”、EP 319 067“清蛋白向親脂相的堿沉淀和后續(xù)應用”及描述完整純化過程的WO 96/37515、US 5 728 553和WO00/44772中公開了用于回收重組表達清蛋白的純化技術(都收入本文作為參考)??梢酝ㄟ^已經發(fā)現(xiàn)可用于純化這些蛋白質的任何技術由培養(yǎng)物的培養(yǎng)基純化清蛋白以外的蛋白質。
這些眾所周知的方法包括硫酸銨或乙醇沉淀、酸或溶劑萃取、陰離子或陽離子交換層析、磷酸纖維素層析、疏水相互作用層析、親和層析、羥磷灰石層析、凝集素層析、濃縮、稀釋、pH調節(jié)、滲濾、超濾、高效液相層析(“HPLC”)、反相HPLC、電導率調節(jié)等。
在一個實施方案中,可以使用任何一種或多種上述技術進一步純化由此分離的蛋白質,達到商業(yè)可接受的純度水平。商業(yè)可接受的純度水平包括提供濃度為至少0.01g.L-1、0.02g.L-1、0.03g.L-1、0.04g.L-1、0.05g.L-1、0.06g.L-1、0.07g.L-1、0.08g.L-1、0.09g.L-1、0.1g.L-1、0.2g.L-1、0.3g.L-1、0.4g.L-1、0.5g.L-1、0.6g.L-1、0.7g.L-1、0.8g.L-1、0.9g.L-1、1g.L-1、2g.L-1、3g.L-1、4g.L-1、5g.L-1、6g.L-1、7g.L-1、8g.L-1、9g.L-1、10g.L-1、15g.L-1、20g.L-1、25g.L-1、30g.L-1、40g.L-1、50g.L-1、60g.L-1、70g.L-1、80g.L-1、90g.L-1、100g.L-1、150g.L-1、200g.L-1、250g.L-1、300g.L-1、350g.L-1、400g.L-1、500g.L-1、600g.L-1、700g.L-1、800g.L-1、900g.L-1、1000g.L-1或更高的蛋白質。
可以將由此純化的蛋白質凍干?;蛘?,可以將它與載體或稀釋劑一起配制,且任選以單位劑量形式提供。
優(yōu)選的是,分離蛋白質,達到制藥學可接受的純度水平。如果蛋白質基本上不含熱原且能夠以制藥學有效數量施用而不引起與該蛋白質的活性無關的醫(yī)學效應,那么它具有制藥學可接受的純度水平。
由此生成的蛋白質可利用任何它的已知功效,在清蛋白的情況中,包括靜脈內施用于患者以治療重度燒傷、休克和失血、補充培養(yǎng)基及在其它蛋白質的配劑中作為賦形劑。
雖然有可能單獨施用通過本發(fā)明方法獲得的在治療上有用的期望蛋白質,但是優(yōu)選作為與一種或多種可接受載體或稀釋劑一起的藥物配劑的形式提供。就與期望蛋白質相容且對其接受者無害而言,載體或稀釋劑必須是“可接受的”。通常,載體或稀釋劑是無菌且不含熱原的水或鹽水。
任選的是,以單位劑量形式提供由此生成的配劑,諸如藥片、膠囊、注射液等形式。
我們已經證明,由質粒攜帶的編碼包含“必需”蛋白質之序列的蛋白質的基因可用于在如下宿主細胞中穩(wěn)定維持質粒,該宿主細胞在缺乏該質粒時不生成該必需蛋白質。一種優(yōu)選的必需蛋白質是必需的蛋白伴侶,它可以提供如下更多優(yōu)勢,在擔當選擇標記以提高質粒穩(wěn)定性的同時,其表達同時提高宿主細胞內由重組基因編碼的異源蛋白的表達。該系統(tǒng)是有利的,因為它容許用戶將需要質粒攜帶的重組基因的數目降至最低。例如,典型的現(xiàn)有技術的質粒攜帶使得質粒能夠在宿主細胞培養(yǎng)過程中穩(wěn)定維持的標記基因(諸如上文所描述的)。除了實現(xiàn)期望效果所需要的任何其它基因以外,還需要在質粒上維持這些標記基因。然而,質粒中摻入外源DNA序列的能力是有限的,因此將實現(xiàn)期望效果所需要的序列插入的數目降至最低是有利的。此外,有些標記基因(諸如營養(yǎng)缺陷型標記基因)需要在特定條件下進行培養(yǎng)過程以獲得標記基因的效果。這些特定條件對于細胞生長或蛋白質生產可能不是最佳的,或是可能需要使用低效/無效的或過度昂貴的培養(yǎng)系統(tǒng)。
由此,有可能使用重組編碼如下蛋白質的基因作為質粒攜帶的基因來提高質粒穩(wěn)定性,該蛋白質包含“必需蛋白質”的序列,其中該質粒存在于在缺乏該質粒時不能生成該“必需蛋白質”的細胞中。
優(yōu)選的是,“必需蛋白質”指其編碼基因在宿主細胞中遭到刪除或滅活時不會導致宿主細胞形成營養(yǎng)缺陷(生物合成)需求的蛋白質。“營養(yǎng)缺陷(生物合成)需求”包括可以通過添加或修改生長培養(yǎng)基而補足的缺陷。因此,編碼“必需蛋白質”的“必需標記基因”在本發(fā)明的內容中指在宿主細胞中遭到刪除或滅活時導致不能通過添加或修改生長培養(yǎng)基而補足的缺陷的基因。該系統(tǒng)的優(yōu)勢在于“必需標記基因”可用作如下宿主細胞中質粒上的選擇標記以實現(xiàn)質粒穩(wěn)定性提高且沒有要求在特定選擇性(如選擇性營養(yǎng)物)條件下培養(yǎng)細胞的缺點,該宿主細胞在缺乏該質粒時不能生成該基因產物。因此,可以在不必為任何具體標記基因改動的條件下培養(yǎng)宿主細胞而質粒穩(wěn)定性沒有損失。例如,可以在非選擇性培養(yǎng)基諸如復合或豐富培養(yǎng)基中培養(yǎng)使用該系統(tǒng)生成的宿主細胞,它可能比常用于給予營養(yǎng)缺陷標記基因其效果的極限培養(yǎng)基更加經濟。
例如,細胞的內源基因可以是刪除的或是以其它方式滅活的。
特別優(yōu)選的是“必需蛋白質”是“必需”蛋白伴侶,因為這能夠提供雙重優(yōu)勢,既在宿主細胞中在不需要選擇性培養(yǎng)條件下提高質粒穩(wěn)定性,又提高蛋白質產量,諸如內源編碼的或異源的蛋白質。該系統(tǒng)還具有如下優(yōu)勢,即如果選擇使用必需蛋白伴侶的過表達來提高宿主細胞的蛋白質產量,那么它將需要質粒攜帶的重組基因的數目降至最低。
用于本發(fā)明這個方面的優(yōu)選“必需蛋白質”包括“必需”蛋白伴侶PDI1和PSE1,及其它“必需”基因產物諸如PGK1或FBA1,它們在宿主細胞中編碼這些蛋白質的內源基因遭到刪除或滅活時不會導致宿主細胞形成營養(yǎng)缺陷(生物合成)需求。
因此,在第四個方面,本發(fā)明還提供了包含如下質粒(諸如依照本發(fā)明第一個、第二個或第三個方面其中任一的質粒)的宿主細胞,該質粒包含編碼必需蛋白伴侶的基因,其中在缺乏該質粒時,宿主細胞不能生成該蛋白伴侶。優(yōu)選的是,在缺乏該質粒時,宿主細胞不能存活。宿主細胞還可以包含編碼異源(或同源,就重組基因編碼其序列與由宿主細胞編碼的蛋白質的序列相同的蛋白質而言)蛋白的重組基因,諸如上文關于本發(fā)明較早方面所描述的。
在第五個方面,本發(fā)明還提供了包含編碼必需蛋白伴侶的基因作為唯一選擇標記的質粒。該質粒還可以包含編碼異源蛋白的基因。質??梢允?μm家族質粒,且優(yōu)選是依照本發(fā)明第一個、第二個或第三個方面其中任一的質粒。
在第六個方面,本發(fā)明還提供了用于生產異源蛋白的方法,包括下列步驟提供包含如下質粒的宿主細胞,該質粒包含編碼必需蛋白伴侶的基因,其中在缺乏該質粒時宿主細胞不能生成該蛋白伴侶且其中宿主細胞還包含編碼異源蛋白的重組基因;在容許必需蛋白伴侶和異源蛋白表達的條件下在培養(yǎng)基中培養(yǎng)所述宿主細胞;并任選由培養(yǎng)的宿主細胞或培養(yǎng)基純化由此表達的異源蛋白;還任選將由此純化的蛋白質凍干。
該方法還可以包括如下步驟將純化的異源蛋白與載體或稀釋劑一起配制并任選人上文討論的方式以單位劑量形式提供由此配制的蛋白質。在一個優(yōu)選的實施方案中,該方法涉及在非選擇性培養(yǎng)基中培養(yǎng)宿主細胞,諸如豐富培養(yǎng)基。
附圖簡述圖1顯示了2μm質粒的質粒圖譜。
圖2顯示了pSAC35的質粒圖譜。
圖3顯示了一些例示性FLP插入位點。
圖4至8、10、11、13至32、36至42、44至46、48至54、和57至76顯示了各種質粒的圖譜。
圖9顯示了含有PDI1基因的pDB2429的DNA片段。
圖12顯示了一些例示性REP2插入位點。
圖33顯示了實施例中提到的表3。
圖34顯示了SEQ ID NO1。
圖35顯示了SEQ ID NO2。
圖43顯示了PCR引物DS248和DS250的序列。
圖47顯示了含有各種pSAC35衍生質粒的啤酒糖酵母在非選擇性液體培養(yǎng)中培養(yǎng)時代數漸增的質粒穩(wěn)定性。
圖55顯示了RIE結果。將10ml YEPD搖瓶接種經自pDB3078分離的1.41kb NotI/PstI pdi1::TRP1中斷DNA片段轉化成為色氨酸原養(yǎng)型的DXY1trp1Δ[pDB2976]、DXY1 trp1Δ[pDB2977]、DXY1 trp1Δ[pDB2978]、DXY1trp1Δ[pDB2979]、DXY1 trp1Δ[pDB2980]或DXY1 trp1Δ[pDB2981]。將轉化子于30℃以200rpm培養(yǎng)4天?;鸺庖唠娪灸z(Weeke,B.,1976,Rocketimmunoelectrophoresis,在N.H.Azelsen、J.Kroll和B.Weeke編的《A Manualof quantitative immunoelectrophoresis.Methods and applications》,Universitetsforlaget,Oslo,Norway)的每個孔加載4μl培養(yǎng)物上清液。rHA標準物濃度以μg/ml計。700μl山羊抗HA(Sigma產品A-1151,重懸于5ml水)/50ml瓊脂糖。沉淀素(precipitin)用考馬斯藍染色。(*)指示選擇用于進一步分析的分離物。
圖56顯示了RIE結果。將10ml YEPD搖瓶接種DXY1[pDB2244]、DXY1[pDB2976]、DXY1 trp1Δpdi1::TRP1[pDB2976]、DXY1[pDB2978]、DXY1trp1Δ pdi1::TRP1[pDB2978]、DXY1[pDB2980]、DXY1 trp1Δpdi1::TRP1[pDB2980]、DXY1[pDB2977]、DXY1 trp1Δpdi1::TRP1[pDB2977]、DXY1[pDB2979]、DXY1 trp1Δpdi1::TRP1[pDB2979]、DXY1[pDB2981]、和DXY1trp1Δpdi1::TRP1[pDB2981],并于30℃以200rpm培養(yǎng)4天?;鸺庖唠娪灸z的每個孔加載4μl培養(yǎng)物上清液。rHA標準物濃度以μg/ml計。800μl山羊抗HA(Sigma產品A-1151,重懸于5ml水)/50ml瓊脂糖。沉淀素用考馬斯藍染色。(*)指示選擇用于進一步分析的分離物。
實施例這些實施例描述了將額外DNA序列插入在圖2所示類型且通常稱為pSAC35的2μm家族質粒US區(qū)內由限制性內切核酸酶位點定義的許多位置,所述質粒包含β-內酰胺酶基因(用于氨芐青霉素抗性,在轉化到酵母中后由質粒遺失)、LEU2選擇標記和寡核苷酸接頭,其中后兩種插入2μm家族非整合載體pSAC3的UL區(qū)內唯一SnaBI位點(參閱EP 0 286 424)。選擇的位點指向REP2和FLP編碼區(qū)的3’端,或在反向重復序列的下游。將短合成DNA接頭插入每個位點,并在非選擇性培養(yǎng)基上進行的培養(yǎng)過程中比較經過修飾的質粒的相對穩(wěn)定性。鑒定得出DNA插入的優(yōu)選位點。通過將包含PDI1基因的DNA片段插入REP2后面的XcmI位點,演示了含有“目的基因”的較大DNA片段的插入。
實施例1將合成DNA接頭插入pSAC35小獨特區(qū)的XcmI位點中最初評估的用于將額外DNA插入pSAC35US區(qū)中的位點是599bp反向重復片段中的XcmI位點。一個XcmI位點在REP2翻譯終止密碼子后面51bp處切割,而由于與反向重復片段的交疊,另一個XcmI位點在FLP編碼序列末端前面127bp處切割(見圖3)。
插入的序列是通過將寡核苷酸CF86和CF87的0.5mM溶液退火而得到的52bp接頭。此DNA接頭含有核心區(qū)“SnaBI-PacI-PseI/SfiI-SmaI-SnaBI”,它編碼pSAC35缺乏的限制位點。
XcmI接頭(CF86+CF87)SfiI--------------PacI SnaBI----------------SnaBI FseI SmaI------- --------------CF86 GGAGTGGTA CGTATTAATT AAGGCCGGCC AGGCCCGGGT ACGTACCAAT TGACF87 TCCTCACCAT GCATAATTAA TTCCGGCCGG TCCGGGCCCA TGCATGGTTA AC將質粒pSAC35用XcmI部分消化,由0.7%(w/v)瓊脂糖凝膠分離線性11kb片段,與CF86/CF87XcmI接頭(未摻水的、10-1和10-2稀釋度)連接,并轉化到大腸桿菌DH5a中。選擇氨芐青霉素抗性轉化子,并篩選能夠通過SmaI消化而線性化的質粒的存在。限制酶分析鑒定出pDB2688(圖4)在REP2后面的XcmI位點中克隆了接頭。使用寡核苷酸引物CF88、CF98和CF99(表1)進行的DNA測序確認了插入含有正確的接頭序列。
表1寡核苷酸測序引物
限制酶分析還鑒定出pDB2689(圖5)在FLP中的XcmI位點中克隆了接頭。然后,通過使用引物CF90和CF91進行的DNA測序證明,pDB2689中的接頭在FseI/SfiI位點內缺少G:C堿基對(上文在CF86+CF97接頭中以粗體標記)。這生成了其翻譯終止密碼子前的39個C端氨基酸殘基以56個不同氨基酸代替的突變型Flp蛋白的編碼序列。
矯正pDB2689接頭序列中缺少的堿基對,生成pDB2786(圖6)。為此,由寡核苷酸CF104和CF105制備31bp 5’-磷酸化SnaBI接頭。將它連接到事先用小牛小腸堿性磷酸酶處理過的pDB2689的SnaBI位點中。使用寡核苷酸引物CF90、CF91、CF100和CF101進行的DNA測序確認了pDB2786中的正確DNA接頭序列。這生成了其翻譯終止密碼子前的39個C端殘基以14個不同殘基代替的突變型Flp蛋白的編碼序列。
SnaBI接頭(CF104+CF105)SfiI--------------FseI--------PacI SmaI---------------CF104 Pi-GTATTAATTA AGGCCGGCCA GGCCCGGGTA CCF105CATAATTAAT TCCGGCCGGT CCGGGCCCAT G-Pi還通過將SnaBI接頭以與pDB2786以相反的方向連接而生成了另一種質粒pDB2798(圖7)。通過DNA測序確認了pDB2798中的接頭序列。質粒pDB2798含有其翻譯終止密碼子前的39個C端殘基以8個不同殘基代替的突變型Flp蛋白的編碼序列。
還將一種接頭克隆到FLP基因中的XcmI位點中,從而在插入位點處截短Flp蛋白。所用接頭是由寡核苷酸CF120和CF121制備的45bp 5’-磷酸化XcmI接頭。
XcmI接頭(CF120+CF121)SfiI--------------PacI SnaBI--------- -------SnaBI FseI SmaI---------------------CF120 Pi-GTAATAATA CGTATTAATT AAGGCCGGCC AGGCCCGGGT ACGTAACF121 TCATTATTAT GCATAATTAA TTCCGGCCGG TCCGGGCCCA TGCAT-Pi將該CF120/CF121XcmI接頭與通過XcmI部分消化及后續(xù)小牛小腸堿性磷酸酶處理生成的11kb pSAC35片段連接。氨芐青霉素抗性大腸桿菌DH5α轉化子的分析鑒定出含有pDB2823(圖8)的克隆。使用引物CF90、CF91、CF100和CF101進行的DNA測序確認了pDB2823中的接頭序列。插入的接頭內的翻譯終止將導致Flp(1-382)的生成,它缺乏41個C端殘基。
對pDB2688和pDB2689評估了在pSAC35US區(qū)內XcmI位點中插入接頭序列對質粒穩(wěn)定性的影響。通過YEPS上非選擇性培養(yǎng)過程中LEU2標記的遺失,在啤酒糖酵母菌株中測定了質粒穩(wěn)定性。使用經pSAC35轉化的相同酵母菌株作為對照,pSAC35在結構上與pSAC3相似,但是在SnaBI位點處包含插入的額外DNA,它包含LEU2選擇標記(Chinery和Hinchliffe,1989,Curr.Genet.,16,21)。
使用改良的醋酸鋰法(Sigma酵母轉化試劑盒,YEAST-1,方案2;Ito等人,1983,J.Bacterol.,153,163;Elble,1992,Biotechniques,13,18),將酵母菌株轉化成亮氨酸原養(yǎng)型。在BMMD瓊脂板上選擇轉化子,然后點接到BMMD瓊脂板上。由10ml BMMD搖瓶培養(yǎng)物(24小時,30℃,200rpm)制備冷凍海藻糖原種。
Sleep等人,2002,Yeast,18,403描述了YEPD和BMMD的組成。YEPS和BMMS的組成與YEPD和BMMD相似,只是以2%(w/v)蔗糖替代2%(w/v)葡萄糖作為唯一的初始碳源。
為了測定質粒穩(wěn)定性,將1ml冷凍原種解凍,接種250ml錐形瓶中的100ml YEPS(初始OD600≈0.04-0.09),并在定軌搖床(200rpm,Innova 4300搖床,New Brunswick Scientific)中于30℃培養(yǎng)約72小時(70-74小時)。
由每個燒瓶中取出樣品,在YEPS培養(yǎng)基中稀釋(10-2至10-5稀釋度),并以雙份將100μl小樣涂布到YEPS瓊脂板上。將細胞于30℃培養(yǎng)3-4天以容許單菌落形成。對于分析的每種酵母原種,以復制方式將100個隨機菌落點接到BMMS瓊脂板上,然后是YEPS瓊脂板。于30℃培養(yǎng)3-4天后,測定在BMMS瓊脂板和YEPS瓊脂板上都生長的菌落的百分比作為質粒穩(wěn)定性的度量。
在用于測量轉化子遺失LEU2標記的上述分析中,pSAC35和pDB2688表現(xiàn)出100%穩(wěn)定,而pDB2689是72%穩(wěn)定。由此,將接頭插入REP2后面的XcmI位點中對質粒穩(wěn)定性沒有明顯影響,盡管改變了轉錄序列并破壞了599bp反向重復片段之間的同源性。在FLP中的XcmI位點處插入接頭也導致令人驚訝的穩(wěn)定的質粒,盡管既破壞了反向重復片段又突變了Flp蛋白。
實施例2將PDI1基因插入pDB2688的XcmI接頭中通過將啤酒糖酵母PDI1基因克隆到pDB2688的XcmI接頭中,演示了將大DNA片段插入2μm樣載體的US區(qū)。PDI1基因(圖9)是在來自含有PDI1基因的較大啤酒糖酵母SKQ2n基因組DNA片段(在US 6,291,205中描述的質粒pMA3aC7中提供,在Crouzet和Tuite,1987,Mol.Gen.Genet.,210,581-583及Farquhar等人,1991,見上文中也描述成克隆C7)的1.9kbSacI-SpeI片段上克隆的,它已經克隆到YIplac211(Gietz和Sugino,1988,Gene,74,527-534)中,而且具有含SacI限制位點的合成DNA接頭,該接頭插入PDI1基因3′非翻譯區(qū)中唯一Bsu36I位點處。用T4DNA聚合酶處理1.9kb SacI-SpeI片段,填充SpeI的5′突出并切除SacI的3′突出。此PDI1片段包含翻譯起始密碼子上游的212bp PDI1啟動子和翻譯終止密碼子下游的148bp。將它與經SmaI線性化/小牛小腸堿性磷酸酶處理的pDB2688連接,生成質粒pDB2690(圖10),其中PDI1基因以與REP2相同的方向轉錄。用pDB2690將啤酒糖酵母菌株轉化成亮氨酸原養(yǎng)型。
然后將人運鐵蛋白突變體(N413Q、N611Q)的表達盒克隆到pDB2690的NotI位點中,生成pDB2711(圖11)。pDB2711中的表達盒含有啤酒糖酵母PRB1啟動子、HSA/MFα融合前導序列(EP 387319;Sleep等人,1990,Biotechnology(N.Y.),8,42),后面是人運鐵蛋白突變體(N413Q、N611Q)的編碼序列和啤酒糖酵母ADH1終止子。通過將相同表達盒插入pSAC35的NotI位點,類似構建質粒pDB2536(圖36)。
經pDB2711轉化的酵母在發(fā)酵過程中與經pDB2536轉化的相同酵母相比將重組運鐵蛋白(N413Q、N611Q)分泌提高約7倍,這演示了將“目的基因”插入2μm載體US區(qū)的優(yōu)點。在搖瓶培養(yǎng)中觀察到重組運鐵蛋白(N413Q、N611Q)分泌提高約15倍(數據未顯示)。
使用上文描述的方法,在YEPS培養(yǎng)基中培養(yǎng)的相同酵母菌株中測定了質粒pDB2688、pDB2690、pDB2711、pDB2536和pSAC35的相對穩(wěn)定性(表2)。
在此項分析中,pDB2690是32%穩(wěn)定的,比較而言不含PDI1插入片段的pDB2688是100%穩(wěn)定的。質粒穩(wěn)定性的這種降低小于對pDB2536觀察到的質粒穩(wěn)定性降低,它是由將rTF(N413Q、N611Q)表達盒插入pSAC35大獨特區(qū)內的NotI位點引起的(表2)。
此外,在高細胞密度發(fā)酵過程中在極限培養(yǎng)基中進行的選擇性培養(yǎng)能夠壓倒在YEPS培養(yǎng)基中觀察到的由PDI1插入引起的質粒穩(wěn)定性提高,因為來自經pDB2711轉化的相同酵母的rTF(N413Q、N611Q)產量與經pDB2536轉化的相同酵母所達到的相比沒有降低。
表2關于將PDI1插入pSAC35小獨特區(qū)的質粒穩(wěn)定性數據的總結。數據來自在涂布到YEPS瓊脂上之前非選擇性搖瓶培養(yǎng)的3天培養(yǎng)物。
實施例3將DNA接頭插入pSAC35的REP2基因和反向重復片段中的下游序列為了定義將額外DNA插入REP2基因及其下游反向重復片段中的序列的有用限制,將其它接頭插入pSAC35。圖12指示了用于這些插入的限制性位點以及在這些位點處翻譯終止對Rep2蛋白的影響。
插入REP2中XmnI位點處的接頭是由寡核苷酸CF108和CF109制備的44bp序列。
XmnI接頭(CF108+CF109)SfiI--------------PacI SnaBI--------- -------SnaBIFseI SmaI------- --------------CF108 ATAATAATAC GTATTAATTA AGGCCGGCCA GGCCCGGGTA CGTACF109 TATTATTATG CATAATTAAT TCCGGCCGGT CCGGGCCCAT GCAT為了避免插入pSAC35中的其它XmnI位點,首先將含有REP2和FLP基因的來自pSAC35的3076bp XbaI片段亞克隆到大腸桿菌克隆載體pDB2685(圖13)中,生成pDB2783(圖14)。
質粒pDB2685是衍生自pCF17的pUC18樣克隆載體,含有來自肺炎克雷伯氏菌(Klebsiella pneumoniae)的阿泊拉霉素抗性基因aac(3)IV(Rao等人,1983,Antimicrob.Agents Chemother.,24,689)和來自pMCS5的多克隆位點(Hoheisel,1994,Biotechniques,17,456)。pCF17是如下由pIJ8600(Sun等人,1999,Microbiology,145(9),2221-7)制備的,用EcoRI、NheI和DNA聚合酶的Klenow片段消化,并自我連接,然后通過感受態(tài)大腸桿菌DH5α轉化和硫酸阿泊拉霉素選擇由反應產物進行分離。質粒pDB2685是通過將來自pMCS5的439bp SspI-SwaI片段克隆到經MscI切割并用小牛小腸堿性磷酸酶處理的pCF17中而構建的。藍/白選擇不依賴IPTG誘導。
將pDB2783用XmnI線性化,并與CF108/CF109XmnI接頭連接,生成pDB2799(圖15)和pDB2780(未顯示)。質粒pDB2799以在插入位點處翻譯終止而生成Rep2(1-244)的正確取向含有CF108/CF109XmnI接頭,而pDB2780含有以相反方向克隆的接頭。使用引物CF98和CF99進行的DNA測序確認了正確的接頭序列。
然后將來自pDB2799的3120bp XbaI片段與通過部分XbaI消化和小牛小腸堿性磷酸酶處理生成的7961bp pSAC35片段連接,生成質粒pDB2817(B型)和pDB2818(A型)非整合載體(分別是圖16和17)。
在pSAC35中ApaI位點處插入接頭是經過和未經T4DNA聚合酶的3’-5’外切核酸酶消化進行的。這生成了翻譯終止前Rep2(1-271)或Rep2(1-269)的編碼序列。在下圖中,以斜線標記的序列GGCC由ApaI消化后生成的3’-突出刪除,導致甘氨酸-170(GGC)和脯氨酸-171密碼子的核苷酸的消除。
未經外切核酸酶消化在ApaI位點處插入的接頭是由寡核苷酸CF116和CF117制備的50bp 5’-磷酸化接頭。
4paI接頭(CF116+CF 117)SfiI--------------PacI SnaBI--------- ------SnaBIFseI SmaI------ --------- -------CF116 Pi-CTTAAT AATACGTATT AATTAAGGCC GGCCAGGCCC GGGTACGTAG GGCCCF117 CCGGGAATTA TTATGCATAA TTAATTCCGG CCGGTCCGGG CCCATGCATC-Pi將它與用ApaI線性化并用小牛小腸堿性磷酸酶處理的pSAC35連接,生成pDB2788(圖18)和pDB2789(未顯示)。在pDB2788內,接頭處于脯氨酸-271后翻譯終止的正確取向,而在pDB2789內,接頭處于相反取向。
經過T4DNA聚合酶的外切核酸酶消化在ApaI位點處插入的接頭是由寡核苷酸CF106和CF107制備的43bp 5’-磷酸化接頭,稱為核心終止接頭。核心終止接頭(CF106+CF107)SfiI--------------PacI SnaBI-------- --------SnaBIFseI SmaI------- --------------CF106 Pi-TAATAATACG TATTAATTAA GGCCGGCCAG GCCCGGGTAC GTACF107ATTATTATGC ATAATTAATT CCGGCCGGTC CGGGCCCATG CAT-Pi35將核心終止接頭與用ApaI線性化、用T4 DNA聚合酶消化并用小牛小腸堿性磷酸酶處理的pSAC35連接。此連接生成其中接頭以在谷氨酸-269后翻譯終止的正確取向克隆的pDB2787(圖19)。
使用寡核苷酸引物CF98和CF99確認了含有ApaI接頭的所有克隆中的正確DNA序列。
核心終止接頭(CF106+CF107)還用于插入pDB2783(圖14)中的FspI位點。將核心終止接頭(CF106+CF107)連接到通過部分FspI消化而線性化并用小牛小腸堿性磷酸酶處理的pDB2783中。通過FspI消化篩選由阿泊拉霉素抗性大腸桿菌DH5α轉化子分離的質粒,并用M13正向和反向引物對選擇的克隆測序。
鑒定出質粒pDB2801(未顯示)含有以正確取向(PacI位點距REP2基因最近)克隆的兩個拷貝的接頭。然后通過首先由多克隆位點區(qū)刪除含F(xiàn)seI位點的116bp NruI-HpaI片段,隨后用FseI消化并自我連接而生成pDB2802(圖20),由此消除接頭的額外拷貝。使用寡核苷酸CF126進行的DNA測序確認了正確的接頭序列。
然后將3119bp pDB2802XbaI片段與通過部分XbaI消化和小牛小腸堿性磷酸酶處理生成的7961bp pSAC35片段連接,生成pDB2805(B型)和pDB2806(A型)非整合載體(分別是圖21和22)。
實施例4將DNA接頭插入pSAC35的FLP基因和反向重復片段中的下游序列為了定義將額外DNA插入FLP基因及下游反向重復片段中的序列的有用限制,將DNA接頭插入pSAC35。圖3指示了用于這些插入的限制性位點以及在這些位點處翻譯終止對Flp蛋白的影響。
插入BclI位點處的接頭是由寡核苷酸CF118和CF119制備的49bp 5’-磷酸化接頭。
BclI接頭(CF118+CF119)SfiI-------------PacISnaBI-------- ------SnaBI FseI SmaI----- -------------CF118 Pi-GATCACTAATAATACGTATTAATTAAGGCCGGCCAGGCCCGGGTACGTACF119TGATTATTATGCATAATTAATTCCGGCCGGTCCGGGCCCATGCATCTAG-Pi由于pSAC35中BclI位點的Dam甲基化,將BclI接頭克隆到由大腸桿菌菌株ET12567pUZ8002(MacNeil等人,1992,Gene,111,61;Kieser等人,2000,Practical Streptomyces Genetics,The John Innes Foundation,Norwich)分離的非甲基化pSAC35DNA中。將質粒pSAC35用BclI線性化,用小牛小腸堿性磷酸酶處理,并與BclI接頭連接,生成pDB2816(圖23)。使用寡核苷酸引物CF91和CF100進行的DNA測序顯示,pDB2816中存在3個拷貝的BclI接頭,都處于在組氨酸-353后Flp翻譯終止的正確取向。
將pDB2816用PacI消化,然后自我連接,生成分別含有一個和兩個拷貝BclI接頭的pDB2814和pDB2815(分別是圖24和25)。使用引物CF91和CF100確認了接頭的DNA序列。在啤酒糖酵母中,經pDB2814、pDB2815或pDB2816轉化的酵母將生成截短型Flp(1-353)。
還通過將單個拷貝的BclI接頭以與pDB2814相反的方向連接而生成了另一種質粒pDB2846(數據未顯示)。它具有來自Flp的前352個殘基然后是翻譯終止前的14個不同殘基的編碼序列。
在HgaI位點處插入的接頭是由寡核苷酸CF114和CF115制備的47bp 5’-磷酸化接頭。
HgaI接頭(CF114+CF115)SfiI-------------PacISnaBI-------- -----SnaBI FseI SmaI-------------- ------CF114 Pi-AGTACTATAATACGTATTAATTAAGGCCGGCCAGGCCCGGGTACGTACF115 ATATTATGCATAATTAATTCCGGCCGGTCCGGGCCCATGCATTCATG-Pi將hgaI接頭與通過部分HgaI消化而線性化并用小牛小腸堿性磷酸酶處理的pDB2783連接,生成pDB2811(圖26)。使用寡核苷酸CF90、CF91和CF100進行的DNA測序確認了正確的接頭插入。
然后將來自pDB2811的3123bp XbaI片段與通過部分XbaI消化和小牛小腸堿性磷酸酶處理生成的7961bp pSAC35片段連接,生成在HgaI位點處含有插入的DNA的pDB2812(B形式)和pDB2813(A形式)非整合載體(分別是圖27和28)。
通過用于構建pDB2801的相同方法,分離在FLP后面的FspI處具有插入的核心終止接頭(CF106+CF107)的質粒pDB2803和pDB2804(分別是圖29和30)。通過DNA測序確認了正確的接頭插入。質粒pDB2804含有以正確取向(PacI位點距FLP基因最近)插入的接頭,而pDB2803含有處于相反取向的接頭。
將pDB28043119bpXbaI片段與通過部分XbaI消化和小牛小腸堿性磷酸酶處理生成的7961bp pSAC片段連接,生成在FLP后面的FspI位點處含有插入的DNA的pDB2807(B型)和pDB2808(A型)非整合載體(分別是圖31和32)。
實施例5經含有插入小獨特區(qū)和反向重復片段的DNA接頭的pSAC35樣質粒轉化的酵母中LEU2標記的相對穩(wěn)定性用在US區(qū)和反向重復片段中含有插入的DNA接頭的pSAC35樣質粒轉化啤酒糖酵母菌株。制備冷凍的海藻糖原種用于測試質粒穩(wěn)定性(表3)。如上文關于在pSAC35中XcmI位點處插入的接頭所述分析質粒穩(wěn)定性。對分析的每一種插入位點建立雙份燒瓶。另外,為了分析由在搖瓶中培養(yǎng)3天后的細胞衍生的菌落,由進一步4天搖瓶培養(yǎng)的細胞培養(yǎng)并分析菌落。為此,由每個3天舊燒瓶取出100μl樣品,并在100ml YEPS培養(yǎng)基中進行傳代培養(yǎng),即在定軌搖床中于30.0℃再培養(yǎng)約96小時(94-98小時),然后獲取單菌落并分析LEU2標記的遺失。在這種情況中,分析限制于來自選定菌株的單個燒瓶,由它挑取50個菌落。表4總結了總體結果。
表4關于將DNA插入pSAC35的質粒穩(wěn)定性數據的總結。
第1組代表來自在非選擇性搖瓶培養(yǎng)中培養(yǎng)3天的數據。
第2組代表來自在非選擇性搖瓶培養(yǎng)中培養(yǎng)7天的數據。
A)REP2插入位點
B)FLP插入位點
所有經過修飾的pSAC35質粒都能夠將酵母轉化成亮氨酸原養(yǎng)型,指示盡管額外DNA插入2μm DNA功能性聚集區(qū)內,但是它們都能在啤酒糖酵母中復制和分配。這適用于在2μm US區(qū)中所有位點具有插入的43-52bp接頭以及含有PDI1基因的較大DNA插入的質粒。
關于接頭插入位點,數據在試驗和副本之間是可再現(xiàn)的。REP2或FLP開放讀碼框以外但反向重復片段以內的所有位點在所用測試條件下表現(xiàn)為100%穩(wěn)定。對插入REP2或FLP開放讀碼框內位點的接頭觀察到質粒不穩(wěn)定性(即質粒遺失)。對REP2插入觀察到的質粒不穩(wěn)定性大于FLP插入。對于REP2插入,LEU2標記的遺失隨非選擇性培養(yǎng)基中的生長期延長而繼續(xù),而對于FLP插入只有少許差異。
REP2基因中的插入生成在已知在自締合和結合2μm STB基因座中發(fā)揮功能的區(qū)域內截短的Rep2多肽(Sengupta等人,2001,J.Bacteriol.,183,2306)。
FLP基因中的插入導致截短的Flp蛋白。所有插入位點都在C端結構域中酪氨酸-343后面,它是Flp蛋白正確發(fā)揮功能所必需的(Prasad等人,1987,Proc.Natl.Acad.Sci.USA,84,2189;Chen等人,1992,Cell,69,647;Grainge等人,2001,J.Mol.Biol.,314,717)。
反向重復區(qū)中的插入都不導致檢出的質粒不穩(wěn)定性,除了FLP XcmI位點中的插入,它也截短Flp蛋白產物。反向重復區(qū)中FspI位點處的插入最接近對質粒復制重要的FRT(Flp識別靶)區(qū)。
構建了將43-52bp DNA接頭插入REP2開放讀碼框、或FLP開放讀碼框或反向重復序列中的pSAC35樣質粒。另外,將含有PDI1基因的1.9kbDNA片段插入REP2后面XcmI位點處的DNA接頭。
具有插入的額外DNA的所有pSAC35樣載體都能夠將酵母轉化成亮氨酸原養(yǎng)型。因此,盡管將DNA插入2μm質粒DNA的功能性聚集區(qū),但是質粒復制和分配機制未受破壞。
通過在非選擇性培養(yǎng)基中進行的培養(yǎng)過程中測量LEU2選擇標記的遺失而測定質粒穩(wěn)定性指示,將DNA接頭插入反向重復片段沒有使質粒不穩(wěn)定,而REP2和FLP開放讀碼框中的插入降低了質粒穩(wěn)定性。然而,盡管在REP2和FLP開放讀碼框中在由本發(fā)明第一個和第二個方面定義的一些位置進行插入時在非選擇性培養(yǎng)基的培養(yǎng)條件下質粒穩(wěn)定性降低了,由此生成的質粒仍然具有足夠高的穩(wěn)定性,用于在選擇性培養(yǎng)基上培養(yǎng)的酵母。
實施例6在pSAC35小獨特區(qū)中緊挨著REP2基因后面插入DNA序列為了進一步定義將額外DNA插入REP2基因及其下游反向重復片段中的序列的有用限制,緊挨著REP2翻譯終止密碼子(TGA)后面將合成DNA接頭插入pSAC35。因為2μm(或pSAC35)中緊挨著REP2編碼序列后面沒有天然存在的方便的限制性內切核酸酶位點,通過寡核苷酸指導的誘變將SnaBI位點引入該位置。將緊挨著REP2下游具有唯一SnaBI位點的pSAC35衍生物命名為pDB2938(圖37)。在pDB2938中,反向重復片段的末端通過插入SnaBI位點而由反向重復片段的其余部分替換。然后將由寡核苷酸CF104和CF105(見上文)制備的與SnaBI接頭相同的31bp序列插入pDB2938的唯一SnaBI位點而構建pDB2954(圖38),使得緊挨著REP2的TGA翻譯終止密碼子后面的限制性內切核酸酶位點的順序是SnaBI-PacI-FseI/SfiI-SmaI-SnaBI。
為了構建pDB2938,首先將來自pDB2783(圖14)的1085bp NcoI-BamHI片段亞克隆到經過NcoI、BamHI和小牛小腸堿性磷酸酶消化的pMCS5(Hoheisel,1994,Biotechniques,17,456)中。這生成了pDB2809(圖39),然后使用寡核苷酸CF127和CF128誘變,生成pDB2920(圖40)。51bp誘變寡核苷酸CF127和CF128SnaBI識別序列標有下劃線。
CF1275′-CGTAATACTTCTAGGGTATGATACGTATCCAATATCAAAGGAAATGATAGC-3′CF1285′-GCTATCATTTCCTTTGATATTGGATACGTATCATACCCTAGAAGTATTACG-3′依照Statagene的QuickChangeTM定點誘變試劑盒的操作說明書進行寡核苷酸指導的誘變。通過質粒DNA的SnaBI和HindIII限制性消化來鑒定含有pDB2920的氨芐青霉素抗性大腸桿菌轉化子。通過使用寡核苷酸引物CF98、CF99、CF129、CF130、CF131及M13正向和反向引物(表1)進行的DNA測序驗證了pDB2920中插入的SnaBI限制性位點的6bp序列和整個1091bp NcoI-BamHI片段的正確DNA序列。
通過瓊脂糖凝膠電泳分離來自pDB2920的1091bp NcoI-BamHI片段,純化,并與來自pDB2783的約4.7kb NcoI-BamHI片段連接,生成pDB2936(圖41)。pDB27834.7kb NcoI-BamHI片段是通過首先經NcoI部分消化而線性化的pDB2783DNA的完全BamHI消化而分離的,并通過瓊脂糖凝膠電泳純化。用連接產物將大腸桿菌DH5α細胞轉化成阿泊拉霉素抗性。通過由阿泊拉霉素抗性克隆分離的質粒DNA的SnaBI消化鑒定了pDB2936。
然后將來自pDB2936的3082bp XbaI片段與通過部分XbaI消化和小牛小腸堿性磷酸酶處理生成的7961bp pSAC35片段連接,生成非整合載體pDB2938(2μm B型,圖37)。
將pDB2938用SnaBI和小牛小腸堿性磷酸酶消化,并與來自pDB2939(圖42)的約2kb SnaBI片段連接。pDB2939是如下生成的,使用寡核苷酸引物DS248和DS250(圖43)由啤酒糖酵母S288c基因組DNA PCR擴增PDI1基因,然后用EcoRI和BamHI消化PCR產物,并將約1.98kb片段克隆到經EcoRI和BamHI切割的YIplac211(Gietz和Sugino,1988,Gene,74,527-534)中。pDB2939的DNA測序鑒定出來自DS248序列內的一個“G”缺失,在圖43中以粗體標記。然后將來自pDB2939的約2kb SnaBI片段克隆到pDB2938的唯一SnaBI位點中,生成質粒pDB2950(圖44)。pDB2950中的PDI1基因以與REP2基因相同的方向轉錄。
然后用SmaI消化pDB2950,并將約11.1kb DNA片段環(huán)化以刪除S288cPDI1序列。這生成了緊挨著REP2的TGA翻譯終止密碼子后面具有SnaBI-PacI-FseI/SfiI-SmaI-SnaBI接頭的質粒pDB2954(圖38)。
除了將啤酒糖酵母S288c PDI1基因克隆到pDB2938的唯一SnaBI位點中,類似的將啤酒糖酵母SKQ2n PDI1基因插入該位點。由含有來自pMA3aC7(US 6,291,205)也稱為克隆C7(Crouzet和Tuite,1987,見上文;Farquhar等人,1991,見上文)的PDI1基因的質粒DNA PCR擴增啤酒糖酵母SKQ2n PDI1基因序列。使用寡核苷酸引物DS248和DS250(圖43)擴增SKQ2n PDI1基因。將約2kb PCR產物用EcoRI和BamHI消化,并連接到經EcoRI和BamHI切割的YIplac211(Gietz和Sugino,1988,Gene,74,527-534)中,生成質粒pDB2943(圖45)。SKQ2n PDI1序列的5’端與補平的SpeI位點相似,延伸以包含EcoRI、SacI、SnaBI、PacI、FseI、SfiI和SmaI位點,3’端延伸至與補平的Bsu36I位點相似的位點,延伸以包含SmaI、SnaBI和BamHI位點。PDI1啟動子長度是約210bp。測定了PDI1片段的整個DNA序列,并證明它編碼啤酒糖酵母菌株SKQ2n的PDI蛋白質序列(NCBI編號CAA38402),但是在位置114具有絲氨酸殘基(而非精氨酸殘基)。與pDB2939中的啤酒糖酵母S288c序列相似,pDB2943也在來自DS248序列內具有一個“G”缺失,在圖43中以粗體標記。然后將來自pDB2943的約1989bp SnaBI片段克隆到pDB2938中唯一SnaBI位點中。這生成了質粒pDB2952(圖46),其中SKQ2n PDI1基因以與REP2相同的方向轉錄。
實施例7用緊挨著REP2基因后面含有插入的DNA的pSAC35樣質粒轉化的酵母中LEU2標記的相時穩(wěn)定性對pDB2954評估在pSAC35中REP2基因后面引入的SnaBI位點處插入接頭序列對質粒穩(wěn)定性的影響。這是在與較早實施例中所用相同的啤酒糖酵母菌株中通過在YEPS上進行的非選擇性培養(yǎng)過程中LEU2標記的遺失而測定的。通過實施例1中描述的方法將pDB2954的穩(wěn)定性與pSAC35(對照質粒)、pDB2688(XcmI接頭)和pDB2817(XmnI接頭)的穩(wěn)定性進行比較。
使用改良的醋酸鋰法(Sigma酵母轉化試劑盒,YEAST-1,方案2;Ito等人,1983,J.Bacteriol.,153,163;Elble,1992,Biotechniques,13,18),將酵母菌株轉化成亮氨酸原養(yǎng)型。在BMMD瓊脂板上選擇轉化子,然后點接到BMMD瓊脂板上。通過與等體積的無菌40%(w/v)海藻糖混合并以小份凍存于-80℃(即零下80℃),由10ml BMMD搖瓶培養(yǎng)物(24小時,30℃,200rpm)制備冷凍海藻糖原種。
為了測定質粒穩(wěn)定性,將1ml冷凍原種解凍,接種250ml錐形瓶中的100ml YEPS(初始OD600≈0.04-0.09),并在定軌搖床(200rpm,Innova 4300搖床,New Brunswick Scientific)中于30℃培養(yǎng)約72小時(70-74小時)。每種菌株分析雙份。
由每個燒瓶中取出樣品,在YEPS培養(yǎng)基中稀釋(10-2至10-5稀釋度),并以雙份將100μl小樣涂布到YEPS瓊脂板上。將細胞于30℃培養(yǎng)3-4天以容許單菌落形成。對于分析的每種酵母原種,以復制方式將100個隨機菌落點接到BMMS瓊脂板上,然后是YEPS瓊脂板。于30℃培養(yǎng)3-4天后,測定在BMMS瓊脂板和YEPS瓊脂板上都生長的菌落的百分比作為質粒穩(wěn)定性的度量。
下文表5A給出了上述分析的結果。這些結果指示,pDB2954本質上與pSAC35對照和pDB2688一樣穩(wěn)定。在這種類型的分析中,偶爾能夠檢出低水平的不穩(wěn)定性,甚至是pSAC35對照(見表4)。由此,緊挨著REP2翻譯終止密碼子后面人為引入反向重復序列的SnaBI位點表現(xiàn)出與反向重復片段中的XcmI位點等價用于插入合成接頭序列。然而,XcmI位點表現(xiàn)出比SnaBI位點優(yōu)選用于插入含PDI1基因的約2kb DNA片段。
表5A含有各種DNA插入的基于pSAC35的載體的相對穩(wěn)定性
此項試驗關于質粒pDB2952和pDB2950的“零百分比穩(wěn)定性”結果是在指示相對質粒穩(wěn)定性的非選擇性培養(yǎng)基中得到的。此項試驗經過優(yōu)化用于比較不同接頭插入片段的相對穩(wěn)定性。在選擇性培養(yǎng)基中,在SnaBI位點處具有PDI1的質粒(甚至在NotI位點處包含額外運鐵蛋白基因時,已知它使質粒(諸如下文描述的pDB2959和pDB2960)進一步不穩(wěn)定)在含有抗運鐵蛋白抗體的非選擇性YEPD瓊脂和選擇性BMMD瓊脂板上都生成所分泌運鐵蛋白的“沉淀素暈圈(precipitin halos)”。對于在SnaBI位點沒有插入PDI1基因的pDB2961,沒有觀察到所分泌運鐵蛋白的沉淀素暈圈。這些結果證明SnaBI位點可用于插入能夠提高異源蛋白分泌的大型基因諸如PDI1。這些結果都是在對照菌株中產生的。對于含有pDB2959和pDB2960的菌株A也看到了提高,但是在這種情況中對pDB2961也觀察到低水平的分泌(由于菌株A基因組中的額外PDI1基因)。下文表5B總結了來自對照菌株的結果。所用抗體板每25ml BMMD瓊脂或YEPD瓊脂含有100μl山羊多克隆抗運鐵蛋白抗血清(Calbiochem)。將菌株點接到抗體板上,并于30℃培養(yǎng)48-72小時,然后在分泌高水平重組運鐵蛋白的菌落周圍的瓊脂內觀察到沉淀素“暈圈”。在這種試驗中沒有觀察到低水平的運鐵蛋白分泌。
通過將在pDB2711(圖11)中找到的rTf(N413Q、N611Q)的相同3.27kbNotI盒以與pDB2711相同的取向插入唯一NotI位點,分別由pDB2950(圖44)、pDB2952(圖46)和pDB2954(圖38)構建質粒pDB2959、pDB2960和pDB2961。
表5B來自經在緊挨著REP2后面的位點處含有各種PDI1基因插入的基于pSAC35的載體轉化的對照菌株的提高的運鐵蛋白分泌
實施例8在非選擇性條件下培養(yǎng)30代后測定的經pSAC35樣質粒轉化的酵母中LEU2標記的穩(wěn)定性使用與Chinery和Hinchcliffe,1989,Curr.Genet.,16,21-25所定義的類似的方法測定US區(qū)中插入了DNA的pSAC35樣質粒穩(wěn)定性。這是在與較早實施例中所用相同的啤酒糖酵母菌株中通過在非選擇性YEPS培養(yǎng)基上限定代數后對數生長過程中LEU2標記的遺失而測定的。30代適于顯示對照質粒pSAC35之間的差異,或是顯示與對照質粒的可比穩(wěn)定性。選擇用于通過這種試驗分析的質粒是pSAC35(對照)、pDB2688(XcmI接頭)、pDB2812(HgaI接頭)、pDB2817(XmmI接頭)、pDB2960(PDI1基因插入REP2后面的XcmI位點)和pDB2711(PDI1基因插入REP2后面的XcmI位點且運鐵蛋白表達盒插入UL區(qū)中的NotI位點)。
將菌株在選擇性(BMMS)培養(yǎng)基中于30℃培養(yǎng)至對數期,并用于接種250ml錐形瓶中預先溫熱至30℃的100ml非選擇性(YEPS)培養(yǎng)基,以得到1.25×105至5×105個細胞/ml。使用血球計對培養(yǎng)物樣品中的細胞數目計數,從而精確測定每個燒瓶中接種的細胞數目。將小樣涂布到非選擇性(YEPS)瓊脂上,并于30℃培養(yǎng)3-4天,然后對于分析的每種原種,以復制方式將100個隨機菌落點接到選擇性(BMMS)和非選擇性(YEPS)瓊脂上以評估保留質粒的細胞的比例。于30℃培養(yǎng)3-4天后,測定在BMMS瓊脂和YEPS瓊脂上都生長的菌落百分率作為質粒穩(wěn)定性的度量。
將非選擇性液體培養(yǎng)物于30℃以200rpm搖動培養(yǎng)24小時以達到1×107個細胞/ml,通過血球計計數測定。然后將培養(yǎng)物再接種預先溫熱的新鮮非選擇性培養(yǎng)基以得到1.25×105至5×105個細胞/ml。再次將小樣涂布到非選擇性瓊脂上,然后以復制方式點接到選擇性瓊脂和非選擇性瓊脂上以評估質粒的保持。由此,有可能計算細胞在非選擇性液體培養(yǎng)基中傳代的次數。將指數對數生長在液體培養(yǎng)中維持30代,這足以顯示與對照質粒諸如pSAC35的可比穩(wěn)定性。質粒穩(wěn)定性定義為保留LEU2選擇標記的細胞百分率。
表6和圖47顯示了用于測量質粒編碼表型經過非選擇性培養(yǎng)基中培養(yǎng)后的保持情況的上述分析的結果。
表6選定pSAC35樣質粒在非選擇性培養(yǎng)基中培養(yǎng)30代的啤酒糖酵母菌株中的相對穩(wěn)定性
圖47顯示了所分析每種菌株在非選擇性液體培養(yǎng)基中隨著代數增加的LEU2標記的遺失。
對照質粒pSAC35在此項試驗的整個30代后保持100%穩(wěn)定。質粒pBD2688和pDB2812都表現(xiàn)出與pSAC35一樣穩(wěn)定。因此,分別將接頭插入REP2后面的XcmI位點或FLP后面的HgaI位點對質粒穩(wěn)定性沒有明顯影響。相反,將XmnI接頭插入REP2基因內表現(xiàn)出降低質粒穩(wěn)定性。
在REP2后面的XcmI接頭中含有啤酒糖酵母PDI1基因的質粒pDB2690在培養(yǎng)30代后約33%穩(wěn)定,指示將此DNA大片段插入基于2μm的載體的US區(qū)引起質粒穩(wěn)定性降低。然而,穩(wěn)定性的這種降低小于對pDB2711觀察到的,其中將重組運鐵蛋白(N413Q、N611Q)表達盒插入pSAC35的大獨特區(qū)內的NotI位點產生進一步使質粒不穩(wěn)定的作用。這些觀察結果與實施例2的結果(見表2)一致。
通過上述方法在啤酒糖酵母候選菌株中評估了質粒pDB2711的穩(wěn)定性,并得到了相似結果(數據未顯示)。這指示質粒的穩(wěn)定性不依賴菌株。
實施例9PDI1基因破壞,連同基于2μm的質粒上的PDI1基因,提高質粒穩(wěn)定性表7中所列單鏈寡核苷酸DNA引物設計用于擴增酵母PDI1編碼區(qū)上游的一個區(qū)域和酵母PDI1編碼區(qū)下游的另一個區(qū)域。
表7寡核苷酸引物
使用衍生自S288c的基因組DNA作為模板,引物DS299和DS300通過PCR擴增PDI1的5’區(qū),而引物DS301和DS302擴增PDI1的3’區(qū)。PCR條件如下1μl S288c模板DNA(0.01ng/μl、0.1ng/μl、1ng/μl、10ng/μl和100ng/μl)、5μl 10X緩沖液(Fast Start Taq+Mg,Roche)、1μl 10mM dNTP混合物、5μl每種引物(2μM)、0.4μl Fast Start Taq,用H2O補至50μl。使用Perkin-Elmer熱循環(huán)儀9700進行PCR。條件是于95℃變性4分鐘[保持HOLD],然后[循環(huán)CYCLE]于95℃變性30秒、于45℃退火30秒、于72℃延伸45秒,20個循環(huán),然后[保持HOLD]于72℃10分鐘,再然后[保持HOLD]4℃。用NotI和HindIII切割0.22kb PDI1 5′PCR產物,而用HindIII和PstI切割0.34kb PDI1 3′PCR產物。
將質粒pMCS5(Hoheisel,1994,Biotechniques,17,456-460)(圖48)用HindIII完全消化,用T4DNA聚合酶加dNTP混合物補平末端,并重新連接,生成pDB2964(圖49)。
將質粒pDB2964用HindIII消化,用小牛小腸磷酸酶處理,并與經NotI和HindIII消化的0.22kbp PDI1 5′PCR產物和經HindIII和PstI消化的0.34kbPDI1 3′PCR產物連接,生成pDB3069(圖50),并用正向和反向通用引物以及DNA測序引物DS303、DS304、DS305和DS306(表7)進行測序。
引物DS234和DS235(表8)用于由YIplac204(Gietz和Sugino,1988,Gene,74,527-534)擴增經修飾的TRP1標記基因,在PCR產物的兩個末端摻入HindIII限制性位點。PCR條件如下1μl模板YIplac204(0.01ng/μl、0.1ng/μl、1ng/μl、10ng/μl和100ng/μl)、5μl 10X緩沖液(Fast Start Taq+Mg,Roche)、1μl 10mM dNTP混合物、5μl每種引物(2μM)、0.4μl Fast Start Taq,用H2O補至50μl。使用Perkin-Elmer熱循環(huán)儀9600進行PCR。條件是于95℃變性4分鐘[保持HOLD],然后[循環(huán)CYCLE]于95℃變性30秒、于45℃退火45秒、于72℃延伸90秒,20個循環(huán),然后[保持HOLD]于72℃10分鐘,再然后[保持HOLD]4℃。將0.86kb PCR產物用HindIII消化,并克隆到pMCS5的HindIII位點中,生成pDB2778(圖51)。限制酶分析和使用通用正向和反向引物以及DS236、DS237、DS238和DS239(表8)進行的測序證實了經修飾TRP1基因的序列是正確的。
表8寡核苷酸引物
通過HindIII消化由pDB2778分離0.86kb TRP1基因,并克隆到pDB3069的HindIII位點中,生成pDB3078(圖52)和pDB3079(圖53)。通過NotI/PstI消化由pDB3078或pDB3079分離1.41kb pdi1::TRP1破壞的DNA片段。
以這樣一種方式構建摻入TRP1刪除(trp1Δ)的酵母菌株,即一旦構建trp1Δ,基因組中不應當剩下與TRP1標記基因(pDB2778)的同源性,從而防止未來含TRP1構建物和TRP1基因座之間的同源重組。為了實現(xiàn)由選定宿主菌株的基因組完全清除天然TRP1序列,設計寡核苷酸,用于擴增整合載體YIplac204(Gietz和Sugino,1988,Gene,74,527-534)上存在的TRP1標記基因外側的TRP1基因5′UTR和3′UTR區(qū)域。YIplac204 TRP1標記基因與天然/染色體TRP1基因有所不同,即通過定點誘變清除了內部HindIII、PstI和XbaI位點(Gietz和Sugino,1988,Gene,74,527-534)。YIplac204經修飾TRP1標記基因是由1.453kb補平基因組片段EcoRI片段構建的,它含有TRP1基因且只有TRP1啟動子的102bp(Gietz和Sugino,1988,Gene,74,527-534)。盡管這是較短的啟動子序列,然而顯然它足以補足trp1營養(yǎng)缺陷型突變(Gietz和Sugino,1988,Gene,74,527-534)。只由位于TRP1ORF起點5’102bp處的EcoRI位點上游的DNA序列用于創(chuàng)建5′TRP1 UTR。3′UTR的選擇較不苛刻,只要它在功能性經修飾TRP1標記3’端的外側,選擇的是翻譯終止密碼子下游85bp。
設計并構建單鏈寡核苷酸DNA引物,以擴增TRP1基因的5′UTR和3′UTR區(qū),使得在PCR擴增過程中,限制酶位點將添加到后期克隆步驟中將要用到的PCR產物的末端。使用S288c基因組DNA作為模板,引物DS230和DS231(表8)通過PCR擴增TRP1的5′區(qū)域,而引物DS232和DS233(表8)擴增TRP1的3′區(qū)域。PCR條件如下1μl模板S288c基因組DNA(0.01ng/μl、0.1ng/μl、1ng/μl、10ng/μl和100ng/μl)、5μl 10X緩沖液(Fast StartTaq+Mg,Roche)、1μl 10mM dNTP混合物、5μl每種引物(2μM)、0.4μl FastStart Taq,用H2O補至50μl。使用Perkin-Elmer熱循環(huán)儀9600進行PCR。條件是于95℃變性4分鐘[保持HOLD],然后[循環(huán)CYCLE]于95℃變性30秒、于45℃退火45秒、于72℃延伸90秒,20個循環(huán),然后[保持HOLD]于72℃10分鐘,再然后[保持HOLD]4℃。
將0.19kb TRP1 5′UTR PCR產物用EcoRI和HindIII切割,而將0.2kbTRP13′UTR PCR產物用BamHI和HindIII切割,并連接到用BamHI/EcoRI線性化的pAYE505中,生成質粒pDB2777(圖54)。WO 95/33833中描述了pAYE505的構建。使用設計成由質粒主鏈引發(fā)并對所克隆插入片段測序的正向和反向引物進行的DNA測序證實了在這兩種情況中所克隆的TPP1基因5′和3′UTR序列具有預期DNA序列。質粒pDB2777含有TRP1破壞的片段,它包含衍生自TRP1 5′和3′UTR的序列的融合體。通過EcoRI完全消化由pDB2777切下此0.383kb TRP1破壞片段。
使用改良的醋酸鋰法(Sigma酵母轉化試劑盒,YEAST-1,方案2;Ito等人,1983,J.Bacteriol.,153,163;Elble,1992,Biotechniques,13,18),將酵母菌株DXY1(Kerry-Williams等人,1998,Yeast,14,161-169)用清蛋白表達質粒pDB2244轉化成亮氨酸原養(yǎng)型,生成酵母菌株DXY1[pDB2244]。WO 00/44772中描述了清蛋白表達質粒pDB2244的構建。在BMMD瓊脂板上選擇轉化子,然后點接到BMMD瓊脂板上。由10mlBMMD搖瓶培養(yǎng)物(24小時,30℃,200rpm)制備冷凍海藻糖原種。
如Toyn等人,2000,Yeast,16,553-560所述,使用摻入了對立選擇性色氨酸類似物5-氟氨茴酸(5-FAA)的營養(yǎng)瓊脂,將DXY1[pDB2244]用來自pDB2777的0.383kb EcoRI TRP1破壞DNA片段轉化成色氨酸自養(yǎng)型。挑取對5-FAA的毒性作用有抗性的菌落,并在第二輪5-FAA板上劃線,以確認它們確實耐受5-FAA并由任何背景生長中選擇出來。然后將生長的那些菌落再次點接到BMMD和BMMD加色氨酸上,以鑒定哪些是色氨酸營養(yǎng)缺陷型。
然后選擇證明是色氨酸營養(yǎng)缺陷型的菌落,用于通過YCplac22(Gietz和Sugino,1988,Gene,74,527-534)轉化進行進一步分析,以查明哪些分離物是trp1。
使用橫跨TRP1基因座的PCR擴增來確認trp-表型是由于該區(qū)域中的缺失。由鑒定為耐受5-FAA且不能在未添加色氨酸的極限培養(yǎng)基上生長的分離物制備基因組DNA。如下完成用引物CED005和CED006(表8)對基因組TRP1基因座的PCR擴增1μl模板基因組DNA、5μl 10X緩沖液(Fast StartTaq+Mg,Roche)、1μl 10mM dNTP混合物、5μl每種引物(2μM)、0.4μl FastStart Taq,用H2O補至50μl。使用Perkin-Elmer熱循環(huán)儀9600進行PCR。條件是于94℃變性10分鐘[保持HOLD],然后[循環(huán)CYCLE]于94℃變性30秒、于55℃退火30秒、于72℃延伸120秒,40個循環(huán),然后[保持HOLD]于72℃10分鐘,再然后[保持HOLD]4℃。對野生型TRP1基因座的PCR擴增導致大小為1.34kb的PCR產物,而跨越已刪除TRP1區(qū)的擴增導致小0.84kb即位于0.50kb處的PCR產物。PCR分析鑒定得出DXY1衍生的trp-菌株(DXY1 trp1Δ[pDB2244])具有預期的刪除事件。
如Sleep等人,1991,Bio/Technology,9,183-187所述,消除酵母菌株DXY1 trp1Δ[pDB2244]的表達質粒pDB2244。使用改良的醋酸鋰法(Sigma酵母轉化試劑盒,YEAST-1,方案2;Ito等人,1983,J.Bacteriol.,153,163;Elble,1992,Biotechniques,13,18),將DXY1 trp1Δcir0用pDB2244、pDB2976、pDB2977、pDB2978、pDB2979、pDB2980或pDB2981再次轉化成亮氨酸原養(yǎng)型pDB2244、pDB2976、pDB2977、pDB2978、pDB2979、pDB2980或pDB2981在實施例10中進一步討論。在補充了色氨酸的BMMD瓊脂板上選擇轉化子,然后點接到補充了色氨酸的BMMD瓊脂板上。由10ml補充了色氨酸的BMMD搖瓶培養(yǎng)物(24小時,30℃,200rpm)制備冷凍海藻糖原種。
使用改良的醋酸鋰法(Sigma酵母轉化試劑盒,YEAST-1,方案2;Ito等人,1983,J.Bacteriol.,153,163;Elble,1992,Biotechniques,13,18),用通過NotI/PstI消化由pDB3078分離的1.41kb pdi1::TRP1破壞DNA片段,將酵母菌株DXY1 trp1Δ[pDB2976]、DXY1 trp1Δ[pDB2977]、DXY1 trp1Δ[pDB3078]、DXY1 trp1Δ[pDB3079]、DXY1 trp1Δ[pDB2980]或DXY1 trp1Δ[pDB2981]轉化成色氨酸原養(yǎng)型。在BMMD瓊脂板上選擇轉化子,然后點接到BMMD瓊脂板上。
將每種菌株的6個轉化子接種50ml搖瓶中的10ml YEPD,并在定軌搖床中于30℃以200rpm培養(yǎng)4天。收獲培養(yǎng)物上清液和細胞生物量。由色氨酸原養(yǎng)型和DXY1[pDB2244]制備基因組DNA(Lee,1992,Biotechniques,12,677)。如下完成用引物DS236和DS303(表7和8)對基因組PDI1基因座的PCR擴增1μl模板基因組DNA、5μl 10X緩沖液(Fast Start Taq+Mg,Roche)、1μl 10mM dNTP混合物、5μl每種引物(2μM)、0.4μl Fast Start Taq,用H2O補至50μl。使用Perkin-Elmer熱循環(huán)儀9700進行PCR。條件是于94℃變性4分鐘[保持HOLD],然后[循環(huán)CYCLE]于94℃變性30秒、于50℃退火30秒、于72℃延伸60秒,30個循環(huán),然后[HOLD]于72℃10分鐘,再然后[HOLD]4℃。對野生型PDI1基因座的PCR擴增導致沒有PCR產物,而跨越已刪除PDI1區(qū)的擴增導致PCR產物0.65kbp。PCR分析鑒定得出測試的所有36個潛在pdi1::TRP1菌株都具有預期的pdi1::TRP1刪除。
通過火箭免疫電泳比較了重組清蛋白滴度(圖55)。在每個組內,DXY1trp1Δ[pDB2976]、DXY1 trp1Δ[pDB2978]、DXY1 trp1Δ[pDB2980]、DXY1trp1Δ[pDB2977]和DXY1 trp1Δ[pDB2979]的所有6個pdi1::TRP1破壞子(disruptant)都具有非常相似的rHA生產力。只有DXY1 trp1Δ[pDB2981]的6個pdi1::TRP1破壞子顯示rHA表達滴度的變化。將圖55中所示6個pdi1::TRP1破壞子涂布到YEPD瓊脂上以分離單菌落,并再次點接到BMMD瓊脂上。
將DXY1 trp1Δpdi1::TRP1[pDB2976]、DXY1 trp1Δpdi1::TRP1[pDB2978]、DXY1 trp1Δ pdi1::TRP1[pDB2980]、DXY1 trp1Δpdi1::TRP1[pDB2977]、DXY1 trp1Δ pdi1::TRP1[pDB2979]和DXY1 trp1Δ pdi1::TRP1[pDB2981]以及DXY1[pDB2244]、DXY1[pDB2976]、DXY1[pDB2978]、DXY1[pDB2980]、DXY1[pDB2977]、DXY1[pDB2979]和DXY1[pDB2981]的3個單細胞分離物接種50ml搖瓶中的10ml YEPD,并在定軌搖床中于30℃以200rpm培養(yǎng)4天。收獲培養(yǎng)物上清液,并通過火箭免疫電泳比較重組清蛋白滴度(圖56)。將圖56中所示13個野生型PDI1和pdi1::TRP1破壞子涂布到YEPD瓊脂上以分離單菌落。然后將來自每種菌株的100個單細胞化菌落再次點接到含有山羊抗HSA抗體的BMMD瓊脂或YEPD瓊脂上以檢測重組清蛋白的表達(Sleep等人,1991,Bio/Technology,9,183-187),并對每個菌落的Leu+/rHA+、Leu+/rHA-、Leu-/rHA+或Leu-/rHA-表型評分(表9)。
表9
這些數據指示,當PDI1基因在沒有染色體編碼PDI的宿主菌株中用作質粒上的選擇標記時,甚至在非選擇性培養(yǎng)基諸如此豐富培養(yǎng)基中,質粒保持得到提高。這些證明了在遭到刪除或滅活時不會導致營養(yǎng)缺陷(生物合成)需求的“必需”蛋白伴侶(如PDI1或PSE1)或是任何其它的任何“必需”基因產物(如PGK1或FBA1)可以在如下宿主細胞中用作質粒上的選擇標記,即該宿主細胞在缺乏該質粒時不能生成該基因產物,從而實現(xiàn)質粒穩(wěn)定性提高且沒有要求在特定選擇性條件下培養(yǎng)細胞的缺點?!盃I養(yǎng)缺陷(生物合成)需求”包括可以通過添加或修改生長培養(yǎng)基而補足的缺陷。因此,“必需標記基因”在本發(fā)明的內容中指在宿主細胞中遭到刪除或滅活時導致不能通過添加或修改生長培養(yǎng)基而補足的缺陷的基因。
實施例10在相同2μm樣質粒上含有各種PDI1基因和各種異源蛋白表達盒的表達載體的構建PDI1基因的PCR擴增和克隆進入YIplac211通過PCR擴增來自啤酒糖酵母S288c和啤酒糖酵母SKQ2n的PDI1基因,以生成具有含啟動子序列的不同長度5’-非翻譯區(qū)的DNA片段。PCR引物設計成容許將PCR產物克隆到YIplac211(Gietz和Sugino,1988,Gene,74,527-534)的EcoRI和BamHI位點中。PCR引物中還摻入了額外限制性內切核酸酶位點以便于后續(xù)克隆。表10描述了所構建的質粒,而表11給出了用于擴增PDI1基因的PCR引物序列。表10描述了這些基于YIplac211的質粒內PDI1啟動子長度的差異。
pDB2939(圖57)是如下生成的用寡核苷酸引物DS248和DS250(表11)由啤酒糖酵母S288c基因組DNA PCR擴增PDI1基因,然后用EcoRI和BamHI消化PCR產物,并將約1.98kb片段克隆到經EcoRI和BamHI切割的YIplac211(Gietz和Sugino,1988,Gene,74,527-534)中。pDB2939的DNA測序鑒定出來自DS248內的“G”缺失,在表5中以粗體標記。表6列出了用于對PDI1基因測序的寡核苷酸引物,它們是根據已發(fā)表的S288cPDI1基因序列設計的(染色體III上的PDI1/YCL043C,由坐標50221至48653,加1000堿基對的上游序列和1000堿基對的下游序列。http//www.yeastgenome.org,基因庫編號NC001135)。
表10含有PDI1基因的基于YIplac211的質粒
表11用于啤酒糖酵母PDI1基因的PCR擴增的寡核苷酸引物
表12用于啤酒糖酵母PDI1基因的DNA測序的寡核苷酸引物
質粒pDB2941(圖58)和pDB2942(圖59)是使用表10和11中描述的PCR引物并通過分別將約1.90kb和1.85kb EcoRI-BamHI片段克隆到YIplac211中而類似構建的。驗證了pDB2941和pDB2942中PDI1基因的正確DNA序列。
由含有來自pMA3aC7(US 6,291,205)也稱為克隆C7(Crouzet和Tuite,1987,見上文;Farquhar等人,1991,見上文)的PDI1基因的質粒DNAPCR擴增啤酒糖酵母SKQ2n PDI1基因序列。使用寡核苷酸引物DS248和DS250(表10和11)擴增SKQ2n PDI1基因。用EcoRI和BamHI消化約2.01kb PCR產物,并連接到經EcoRI和BamHI切割的YIplac211(Gietz和Sugino,1988,Gene,74,527-534)中以生成質粒pDB2943(圖60)。SKQ2n PDI1序列的5’端與補平的SpeI位點相似,延伸以包含EcoRI、SacI、SnaBI、PacI、FseI、SfiI和SmaI位點,3’端延伸至與補平的Bsu36I位點相似的位點,延伸以包含SmaI、SnaBI和BamHI位點。PDI1啟動子長度是約210bp。使用表12給出的寡核苷酸引物測定了PDI1片段的整個DNA序列。這證實了啤酒糖酵母菌株SKQ2n的PDI蛋白質的編碼序列(NCBI編號CAA38402)的存在,但是在位置114具有絲氨酸殘基(而非先前發(fā)表的精氨酸殘基)。類似的,與pDB2939中的啤酒糖酵母S288c序列的方式相似,pDB2943也在來自DS248序列內具有“G”缺失,在表5中以粗體標記。
質粒pDB2963(圖61)和pDB2945(圖62)是使用表10和11中描述的PCR引物并通過分別將約1.94kb和1.87kb EcoRI-BamHI片段克隆到YIplac211中而類似構建的。驗證了pDB2963和pDB2945中PDI1基因的預期DNA序列,其中氨基酸114位置處具有絲氨酸密碼子。
在REP2后面的XcmI位點處具有插入的不同PDI1基因的基于pSAC35的rHA表達質粒的構建為了與不同PDI1基因共表達rHA,構建基于pSAC35的質粒(表13)。
表13用于共表達rHA的具有不同PDI1基因的基于pSAC35的質粒
首先在2992bp NotI片段上分離來自pDB2243(圖63,如WO 00/44772中所述)的rHA表達盒,然后克隆到pDB2688(圖4)的NotI位點中,生成pDB2693(圖64)。將pDB2693用SnaBI消化,用小牛小腸堿性磷酸酶處理,并與來自pDB2943、pDB2963、pDB2945、pDB2939、pDB2941和pDB2942的含有PDI1基因的SnaBI片段連接。這生成了質粒pDB2976至pDB2987(圖65至76)。將PDI1的轉錄方向與REP2相同的稱為“取向A”,而將PDI1的轉錄方向與REP2相反的稱為“取向B”(表13)。
權利要求
1.在REP2基因或FLP基因中至少其一的最后一個功能性密碼子后面的第一個堿基和與所述基因相鄰的反向重復片段中FRT位點前面的最后一個堿基之間包含多核苷酸序列插入、刪除和/或替代的2μm家族質粒。
2.權利要求1的2μm家族質粒,其中除了所述多核苷酸序列插入、刪除和/或替代,所述FLP基因和/或REP2基因分別具有衍生自天然存在2μm家族質粒的FLP基因和/或REP2基因的序列。
3.權利要求1的2μm家族質粒,其中所述天然存在2μm家族質粒選自由魯氏接合糖酵母(Zygosaccharomyces rouxii)獲得的pSR1、pSB3或pSB4,由拜列氏接合糖酵母(Zygosaccharomyces bailii)獲得的pSB1或pSB2,由發(fā)酵接合糖酵母(Zygosaccharomyces fermentati)獲得的pSM1,由果蠅克魯維氏酵母(Kluyveromyces drosophilarum)獲得的pKD1,由膜醭畢赤氏酵母(Pichia membranaefaciens)獲得的pPM1,及由啤酒糖酵母(Saccharomycescerevisiae)獲得的2μm質粒。
4.權利要求2或3的2μm家族質粒,其中與所述FLP和/或REP2基因相鄰的反向重復片段的序列衍生自與衍生所述基因的序列相同的天然存在2μm家族質粒中的相應反向重復片段的序列。
5.權利要求2至4任一項的2μm家族質粒,其中所述天然存在2μm家族質粒是由啤酒糖酵母獲得的2μm質粒。
6.權利要求5的2μm家族質粒,其中所述多核苷酸序列插入、刪除和/或替代存在于REP2基因密碼子59的第一個堿基與相鄰反向重復片段中FRT位點前面的最后一個堿基之間的位置。
7.權利要求5或6的2μm家族質粒,其中除了所述多核苷酸序列插入、刪除和/或替代,所述REP2基因和相鄰反向重復片段的序列由SEQ IDNO1或其變體定義。
8.權利要求1至7任一項的2μm家族質粒,其中所述多核苷酸序列插入、刪除和/或替代存在于反向重復片段的第一個堿基與FRT位點前面的最后一個堿基之間的位置。
9.權利要求1至7任一項的2μm家族質粒,其中所述多核苷酸序列插入、刪除和/或替代存在于REP2編碼序列末端后面的第一個堿基與FRT位點前面的最后一個堿基之間,諸如位于REP2編碼序列末端后面的第一個堿基處。
10.權利要求1至7任一項的2μm家族質粒,其中除了所述多核苷酸序列插入、刪除和/或替代,跟隨REP2編碼序列的反向重復片段具有衍生自由啤酒糖酵母獲得的2μm質粒的相應區(qū)域的序列,且優(yōu)選的是所述多核苷酸序列插入、刪除和/或替代存在于反向重復片段內的XcmI位點或FspI位點處。
11.權利要求5的2μm家族質粒,其中所述多核苷酸序列插入、刪除和/或替代存在于FLP基因密碼子344的第一個堿基與相鄰反向重復片段中FRT位點前面的最后一個堿基之間的位置。
12.權利要求5或11的2μm家族質粒,其中除了所述多核苷酸序列插入、刪除和/或替代,所述FLP編碼序列和相鄰反向重復片段的序列由SEQ IDNO2或其變體定義。
13.權利要求11或12的2μm家族質粒,其中所述多核苷酸序列插入、刪除和/或替代存在于反向重復片段的第一個堿基與FRT位點前面的最后一個堿基之間的位置。
14.權利要求13的2μm家族質粒,其中所述多核苷酸序列插入、刪除和/或替代存在于FLP編碼序列末端后面的第一個堿基與FRT位點前面的最后一個堿基之間的位置。
15.權利要求14的2μm家族質粒,其中所述多核苷酸序列插入、刪除和/或替代存在于FLP編碼序列末端后面的第一個堿基處。
16.權利要求11至15任一項的2μm家族質粒,其中除了所述多核苷酸序列插入、刪除和/或替代,跟隨FLP基因的反向重復片段具有衍生自由啤酒糖酵母獲得的2μm質粒的相應區(qū)域的序列,且優(yōu)選的是多核苷酸序列插入、刪除和/或替代存在于反向重復片段內的HgaI位點或FspI位點處。
17.前述權利要求任一項的2μm家族質粒,它在REP2基因和FLP基因二者的最后的功能性密碼子后面的第一個堿基和與每一種所述基因相鄰的反向重復片段中FRT位點前面的最后一個堿基之間包含多核苷酸序列插入、刪除和/或替代,所述多核苷酸序列插入、刪除和/或替代可以是相同的或不同的。
18.任何前述權利要求的2μm家族質粒,它在前述權利要求任一項定義以外的位置額外包含多核苷酸序列插入、刪除和/或替代。
19.權利要求18的2μm家族質粒,其中所述多核苷酸序列插入、刪除和/或替代存在于ARS序列周圍的非轉錄區(qū)內。
20.前述權利要求任一項的2μm家族質粒,其中所述多核苷酸序列插入、刪除和/或替代或至少其一是多核苷酸序列插入。
21.權利要求20的2μm家族質粒,其中所述多核苷酸序列插入編碼開放讀碼框。
22.權利要求21的2μm家族質粒,其中所述開放讀碼框編碼非2μm家族質粒蛋白質。
23.權利要求22的2μm家族質粒,其中所述非2μm家族質粒蛋白質包含參與蛋白質折疊或是具有蛋白伴侶活性或參與未折疊蛋白質應答的蛋白質、清蛋白、單克隆抗體、鬼臼亞乙苷、血清蛋白質(諸如血液凝結因子)、antistasin、蜱抗凝肽、運鐵蛋白、乳鐵蛋白、內皮抑制素、抑管張素、膠原蛋白、免疫球蛋白或基于免疫球蛋白的分子或二者任一的片段(如dAb、Fab′片段、F(ab′)2、scAb、scFv或scFv片段)、Kunitz結構域蛋白質、干擾素、白介素、IL10、IL11、IL2、干擾素α的各個類和亞類、干擾素β的各個類和亞類、干擾素γ的各個類和亞類、瘦蛋白、CNTF、CNTFAX15、IL1受體拮抗物、紅細胞生成素(EPO)和EPO模擬物、血小板生成素(TPO)和TPO模擬物、prosaptide、藍藻抗病毒蛋白N(cyanovirin-N)、5-螺旋、T20肽、T1249肽、HIV gp41、HIV gp120、尿激酶、尿激酶原、tPA、水蛭素、血小板衍生的生長因子、甲狀旁腺激素、胰島素原、胰島素、胰高血糖素、胰高血糖素樣肽、胰島素樣生長因子、降鈣素、生長激素、轉化生長因子β、腫瘤壞死因子、G-CSF、GM-CSF、M-CSF、FGF、前體和活性形式的凝血因子包括但不限于纖溶酶原、纖維蛋白原、凝血酶、前凝血酶、凝血酶原、von Willebrand氏因子、α1-抗胰蛋白酶、纖溶酶原激活物、因子VII、因子VIII、因子IX、因子X和因子XIII、神經生長因子、LACI、血小板衍生的內皮細胞生長因子(PD-ECGF)、葡萄糖氧化酶、血清膽堿酯酶、抑酶肽、淀粉狀蛋白前體蛋白、inter-α胰蛋白酶抑制物、抗凝血酶III、脫脂載脂蛋白各個種類、蛋白C、蛋白S或任何上述的變體或片段的序列。
24.權利要求23的2μm家族質粒,其中所述非2μm家族質粒蛋白質包含清蛋白或其變體或片段的序列,或是包含任何這些之序列的融合蛋白的序列。
25.權利要求23的2μm家族質粒,其中所述非2μm家族質粒蛋白質包含運鐵蛋白或其變體或片段的序列,或是包含任何這些之序列的融合蛋白的序列。
26.權利要求23的2μm家族質粒,其中所述非2μm家族質粒蛋白質包含乳鐵蛋白或其變體或片段的序列,或是包含任何這些之序列的融合蛋白的序列。
27.權利要求23的2μm家族質粒,其中所述非2μm家族質粒蛋白質包含F(xiàn)c或其變體或片段的序列,或是包含任何這些之序列的融合蛋白的序列。
28.權利要求23的2μm家族質粒,其中所述非2μm家族質粒蛋白質包含如下任何之一編碼的參與蛋白質折疊或是具有蛋白伴侶活性或參與未折疊蛋白質應答的蛋白質的序列AHA1、CCT2、CCT3、CCT4、CCT5、CCT6、CCT7、CCT8、CNS1、CPR3、CPR6、EPS1、ERO1、EUG1、FMO1、HCH1、HSP10、HSP12、HSP104、HSP26、HSP30、HSP42、HSP60、HSP78、HSP82、JEM1、MDJ1、MDJ2、MPD1、MPD2、PDI1、PFD1、ABC1、APJ1、ATP11、ATP12、BTT1、CDC37、CPR7、HSC82、KAR2、LHS1、MGE1、MRS11、NOB1、ECM10、SSA1、SSA2、SSA3、SSA4、SSC1、SSE2、SIL1、SLS1、UBI4、ORM1、ORM2、PER1、PTC2、PSE1和HAC1或截短的無內含子的HAC1。
29.權利要求23或28的2μm家族質粒,其中所述蛋白伴侶是蛋白質二硫鍵異構酶(PDI),或是由ORM2、SSA1或PSE1編碼的蛋白質。
30.權利要求22至29任一項的2μm家族質粒,其中所述非2μm家族質粒蛋白質包含分泌前導序列。
31.權利要求22的2μm家族質粒,其中所述非2μm家族質粒包含細菌選擇標記和/或酵母選擇標記的序列。
32.權利要求31的2μm家族質粒,其中所述細菌選擇標記是β-內酰胺酶基因和/或所述酵母選擇標記是LEU2選擇標記。
33.依照前述權利要求任一項的2μm家族質粒,該質粒包含(i)編碼非2μm家族質粒蛋白質的異源序列;(ii)編碼包含參與蛋白質折疊的蛋白質、蛋白伴侶或參與未折疊蛋白質應答的蛋白質優(yōu)選蛋白質二硫鍵異構酶之序列的蛋白質的異源序列;和(iii)編碼包含選擇標記之序列的蛋白質的異源序列;其中至少一種異源序列存在于由權利要求1至16任一項定義的位置。
34.制備由前述權利要求任一項定義的質粒的方法,包括(a)提供包含REP2基因和跟隨REP2基因的反向重復片段,或者包含F(xiàn)LP基因和跟隨FLP基因的反向重復片段的序列的質粒,在每種情況中反向重復片段包含F(xiàn)RT位點;(b)提供多核苷酸序列并在權利要求1至16任一項定義的位置將多核苷酸序列插入質粒;和/或(c)在權利要求1至16任一項定義的位置刪除一些或所有核苷酸堿基;和/或(d)在權利要求1至16任一項定義的位置用候選核苷酸堿基替代一些或所有核苷酸堿基。
35.通過權利要求34的方法獲得的質粒。
36.包含由權利要求1至33和35任一項定義的質粒的宿主細胞。
37.依照權利要求36的宿主細胞,它是酵母細胞。
38.依照權利要求36或37的宿主細胞,其中所述質粒作為多拷貝質粒是穩(wěn)定的。
39.依照權利要求38的宿主細胞,其中所述質?;趐SR1、pSB3或pSB4且所述酵母細胞是魯氏接合糖酵母;所述質?;趐SB1或pSB2且所述酵母細胞是拜列氏接合糖酵母;所述質粒基于pSM1且所述酵母細胞是發(fā)酵接合糖酵母;所述質?;趐KD1且所述酵母細胞是果蠅克魯維氏酵母;所述質?;趐PM1且所述酵母細胞是膜醭畢赤氏酵母;或所述質?;?μm質粒且所述酵母細胞是啤酒糖酵母或卡爾斯伯糖酵母(Saccharomycescarlsbergensis)。
40.依照權利要求38或39的宿主細胞,其中如果所述質粒含有或經過修飾后含有選擇標記,那么通過標記遺失測量的穩(wěn)定性在5代后是至少1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.9%或基本上100%。
41.生產蛋白質的方法,包括下列步驟(a)提供權利要求1至33或35任一項定義的質粒;(b)提供合適的宿主細胞;(c)用所述質粒轉化所述宿主細胞;(d)在培養(yǎng)基中培養(yǎng)經轉化的宿主細胞;由此生成蛋白質。
42.生產蛋白質的方法,包括下列步驟提供權利要求36至40任一項定義的宿主細胞,該宿主細胞包含權利要求1至33或35任一項定義的質粒;并在培養(yǎng)基中培養(yǎng)所述宿主細胞,由此生成蛋白質。
43.依照權利要求41或42的方法,還包括以下步驟由培養(yǎng)的宿主細胞或培養(yǎng)基分離由此生成的蛋白質。
44.依照權利要求43的方法,還包括以下步驟將由此分離的蛋白質純化至商業(yè)可接受的純度水平。
45.依照權利要求44的方法,還包括以下步驟將由此純化的蛋白質與載體或稀釋劑一起配制,并任選以單位劑量形式提供由此配制的蛋白質。
46.依照權利要求43的方法,還包括以下步驟將由此分離的蛋白質純化至制藥學可接受的純度水平。
47.依照權利要求44的方法,還包括以下步驟將由此純化的蛋白質與制藥學可接受載體或稀釋劑一起配制,并任選以單位劑量形式提供由此配制的蛋白質。
48.包含編碼宿主酵母細胞存活所必需的蛋白質的基因作為唯一酵母選擇標記的質粒,其意義在于如果宿主酵母細胞中編碼該必需蛋白質的基因遭到刪除或滅活,那么該宿主細胞在培養(yǎng)中不能存活且該缺陷不能通過添加或更改培養(yǎng)基而補足。
49.權利要求48的質粒,其中編碼必需蛋白質的基因是由所述質粒編碼的唯一選擇標記。
50.權利要求48或49的質粒,其中所述必需蛋白質是蛋白伴侶。
51.權利要求51的質粒,其中所述蛋白伴侶是蛋白質二硫鍵異構酶或Pse1p。
52.權利要求48至51任一項的質粒,它還包含編碼非2μm家族質粒蛋白質諸如由權利要求23至27任一項定義的蛋白質的基因。
53.權利要求48至52任一項的質粒,它是2μm家族質粒。
54.權利要求53的質粒,它是權利要求1至33任一項定義的質粒。
55.包含如下質粒的宿主細胞,該質粒包含編碼宿主細胞存活所必需的蛋白質的基因,且其中在缺乏該質粒時,該宿主細胞不能生成該必需蛋白質且不能通過添加或更改培養(yǎng)基而變得可存活。
56.依照權利要求55的宿主細胞,其中所述質粒是依照權利要求1至33或48至54任一項的質粒。
57.依照權利要求55或56的宿主細胞,其中在缺乏所述質粒時,所述宿主細胞不能存活。
58.權利要求55至57任一項的宿主細胞,其中所述宿主細胞還包含編碼期望蛋白質諸如權利要求23至27任一項定義的蛋白質的重組基因。
59.權利要求58的宿主細胞,其中所述期望蛋白質是權利要求23至27任一項定義的非2μm家族質粒蛋白質。
60.權利要求59的宿主細胞,其中所述必需蛋白質是蛋白伴侶,諸如蛋白質二硫鍵異構酶或PSE1。
61.權利要求59或60的宿主細胞,其中所述重組基因位于與編碼必需蛋白質的基因相同的質粒上。
62.生產期望重組蛋白的方法,包括下列步驟提供權利要求59至61任一項定義的宿主細胞;在容許所述必需蛋白質和期望蛋白質表達的條件下在培養(yǎng)基中培養(yǎng)所述宿主細胞;并任選由培養(yǎng)的宿主細胞或培養(yǎng)基分離由此表達的期望蛋白質;并任選將由此分離的期望蛋白質純化至商業(yè)可接受的純度水平;還任選將由此純化的蛋白質凍干或將純化的期望蛋白質與載體或稀釋劑(諸如制藥學可接受的載體或稀釋劑)一起配制;并任選以單位劑量形式提供由此配制的期望蛋白質。
63.權利要求62的方法,其中所述培養(yǎng)宿主細胞的步驟涉及在非選擇性培養(yǎng)基諸如復合或豐富培養(yǎng)基中培養(yǎng)所述宿主細胞。
全文摘要
本發(fā)明提供了在REP2基因或FLP基因中至少其一的最后一個功能性密碼子后面的第一個堿基和與所述基因相鄰的反向重復片段中FRT位點前面的最后一個堿基之間包含多核苷酸序列插入、刪除和/或替代的2μm家族質粒。
文檔編號C12N1/19GK1922326SQ200480042022
公開日2007年2月28日 申請日期2004年12月23日 優(yōu)先權日2003年12月23日
發(fā)明者達雷爾·斯利普, 克里斯托弗·J·A·芬尼斯 申請人:達爾塔生物技術有限公司