專利名稱::選擇高水平表達(dá)蛋白質(zhì)的宿主細(xì)胞的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及分子生物學(xué)和生物
技術(shù)領(lǐng)域:
。更具體的,本發(fā)明涉及用于對(duì)選擇高水平表達(dá)蛋白質(zhì)的宿主細(xì)胞進(jìn)行改進(jìn)的手段(means)和方法??梢栽诙喾N宿主細(xì)胞中生產(chǎn)蛋白質(zhì)用于廣泛的生物學(xué)和生物技術(shù)應(yīng)用,例如作為生物藥物。對(duì)于該目的,例如在這些蛋白質(zhì)具有某些翻譯后修飾例如糖基化時(shí),優(yōu)選真核宿主細(xì)胞特別是哺乳動(dòng)物宿主細(xì)胞用于表達(dá)許多蛋白質(zhì)。已經(jīng)充分建立了這類生產(chǎn)的方法,通常包括在宿主細(xì)胞中表達(dá)編碼感興趣蛋白質(zhì)的核酸(也被稱作"轉(zhuǎn)基因")。通常將轉(zhuǎn)基因連同可選擇標(biāo)記基因引入到前體細(xì)胞中,對(duì)細(xì)胞進(jìn)行可選擇標(biāo)記基因表達(dá)的選擇,對(duì)一個(gè)或者多個(gè)高水平表達(dá)感興趣蛋白質(zhì)的克隆進(jìn)行鑒定并用于表達(dá)所感興趣的蛋白質(zhì)。選擇表達(dá)相對(duì)高水平期望蛋白質(zhì)的重組宿主細(xì)胞的方法是已知的(參見例如在WO2006/048459和US2006/0141577中的介紹)。國(guó)際申請(qǐng)PCT/EP2005/055794(公開為WO2006/048459)中公開了一種選擇表達(dá)高水平感興趣的多肽的宿主細(xì)胞的新理念,其中該國(guó)際申請(qǐng)是在本申請(qǐng)的優(yōu)先權(quán)日之前提交,但在本申請(qǐng)的優(yōu)先權(quán)日之后公開的。美國(guó)專利申請(qǐng)No.11/359,953(公開為US2006/0141577)和國(guó)際申請(qǐng)PCT/EP2007/051696公開了替換的方法,其中這兩份申請(qǐng)也是在本申請(qǐng)的優(yōu)先權(quán)日之前提交,但在本申請(qǐng)的優(yōu)先權(quán)日之后公開的。簡(jiǎn)言之,這些申請(qǐng)教導(dǎo)使用具有非ATG起始密碼子如GTG或TTG的編碼可選擇標(biāo)記多肽的序列。這達(dá)到了可以以高嚴(yán)格性選擇克隆,并用于獲得表達(dá)水平非常高的宿主細(xì)胞的克隆。本發(fā)明旨在提供進(jìn)一步改進(jìn)的途徑和方法用于選擇表達(dá)高水平感興趣蛋白質(zhì)的宿主細(xì)胞。發(fā)明概述在本文中通過參照將申請(qǐng)PCT/EP2005/055794(WO2006/048459),US11/359,953(US2006/0141577)和PCT/EP2007/051696的公開內(nèi)容整體并入。簡(jiǎn)言之,這些申請(qǐng)教導(dǎo)使用具有非ATG起始密碼子如GTG或TTG的編碼可選擇標(biāo)記多肽的序列。這達(dá)到了可以以高嚴(yán)格性選擇克隆,并用于獲得表達(dá)水平非常高的宿主細(xì)胞的克隆。本發(fā)明公開了具有GTG或TTG起始密碼子的改進(jìn)的可選擇標(biāo)記基因。例如,這些改進(jìn)的可選擇標(biāo)記基因可以用于在WO2006/048459和US2006/0141577中所公開的轉(zhuǎn)錄單位及其所使用的方法中。這獲得了進(jìn)一步改進(jìn)的高表達(dá)水平宿主細(xì)胞(的選擇)。在一個(gè)方面中,本發(fā)明提供了一種DNA分子,其包含編碼可選擇標(biāo)記多肽的開放閱讀框序列,其中所述編碼鏈中的所述DNA分子包含選自由a)GTG起始密碼子,和b)TTG起始密碼子所組成組的可選擇標(biāo)記多肽的翻譯起始序列;其中與編碼可選擇標(biāo)記蛋白質(zhì)的原始開放閱讀框序列相比,編碼所述可選擇標(biāo)記蛋白質(zhì)的開放閱讀框序列已經(jīng)被突變以替換其至少一半的CpG二核苷酸。在優(yōu)選的實(shí)施方式中,可選擇標(biāo)記蛋白質(zhì)提供了針對(duì)選擇劑例如抗生素致死和/或生長(zhǎng)抑制效果的抗性。在某些實(shí)施方式中,可選擇標(biāo)記多肽提供了針對(duì)Zeocin或針對(duì)新霉素的抗性。本發(fā)明還提供了一種根據(jù)本發(fā)明的DNA分子,其中編碼所述可選擇標(biāo)記多肽的開放閱讀框是多順反子轉(zhuǎn)錄單位的一部分,其中所述多順反子轉(zhuǎn)錄單位還包含編碼感興趣的多肽的開放閱讀框序列。本發(fā)明還提供了一種包含這類DNA分子的表達(dá)盒,所述表達(dá)盒包含在所述多順反子轉(zhuǎn)錄單位上游的啟動(dòng)子,以及優(yōu)選在所述多順反子轉(zhuǎn)錄單位的下游具有轉(zhuǎn)錄終止序列。本發(fā)明還提供了包含根據(jù)本發(fā)明的DNA分子或表達(dá)盒的宿主細(xì)胞。本發(fā)明還提供了一種表達(dá)感興趣的多肽的方法,其包括培養(yǎng)包含本發(fā)明表達(dá)盒的宿主細(xì)胞,以及從所述表達(dá)盒表達(dá)所感興趣的多肽。圖1.在CHO-K1細(xì)胞中利用CpG含量減少的Zeocin抗性標(biāo)記物的結(jié)果。點(diǎn)表示單獨(dú)的數(shù)據(jù)點(diǎn),線表示平均表達(dá)水平;垂直軸表示d2EGFP信號(hào)。詳細(xì)內(nèi)容參見實(shí)施例1。圖2.除在CHO-DG44細(xì)胞中外,與圖1相同。詳細(xì)內(nèi)容參見實(shí)施例1。圖3.使用具有不同突變的"貧CpG"的新霉素抗性標(biāo)記的結(jié)果。點(diǎn)表示單獨(dú)的數(shù)據(jù)點(diǎn),線表示平均表達(dá)水平;垂直軸表示d2EGFP信號(hào)。詳細(xì)內(nèi)容參見實(shí)施例2。發(fā)明詳述術(shù)語(yǔ)"單順反子基因"被定義為能夠提供編碼一種多肽的RNA的基因。"多順反子轉(zhuǎn)錄單位"也被稱作多順反子基因,被定義為能提供編碼至少兩種多肽的RNA分子的基因。術(shù)語(yǔ)"雙順反子基因"被定義為能夠提供編碼兩種多肽的RNA分子的基因。因此,雙順反子基因包含在多順反子基因的定義內(nèi)。本文中所使用的"多肽"包含通過肽鍵連接的至少五個(gè)氨基酸,例如可以是蛋白質(zhì)或其一部分例如亞基。多肽可以包含翻譯后修飾例如糖基化。通常,術(shù)語(yǔ)多肽和蛋白質(zhì)在本文中是可以互換使用的。在本發(fā)明中所使用的"基因"或"轉(zhuǎn)錄單位"可以包括染色體DNA、cDNA、人工DNA及其組合等。"可操作地連接"是指允許所描述組分以期望的方式發(fā)揮功能的位置關(guān)系。因此,例如"可操作地連接"到順反子的啟動(dòng)子是以一種在與啟動(dòng)子兼容的條件下達(dá)到表達(dá)順反子的模式進(jìn)行連接。類似的,可操作地連接于順反子的IRES核苷酸序列,是以在與IRES兼容的條件下達(dá)到翻譯順反子的模式進(jìn)行連接。本發(fā)明的DNA分子可以以雙鏈DNA的形式存在,關(guān)于可選擇標(biāo)記多肽和感興趣的多肽,其具有編碼鏈和非編碼鏈,其中除了存在T替換U以外,所述編碼鏈具有與被翻譯的RNA相同的序列。因此,AUG起始密碼子是由編碼鏈中的ATG序列所編碼的,包含對(duì)應(yīng)RNA中AUG起始密碼子的該ATG序列的鏈被稱作DNA的編碼鏈。對(duì)于本領(lǐng)域技術(shù)人員明顯的是,實(shí)際上起始密碼子或翻譯起始序列存在于RNA分子中,但是這些可以被等價(jià)地認(rèn)為包含在編碼這類RNA分子的DNA分子中;因此,除非以其他方式明確說明,無(wú)論在本發(fā)明中何處提到起始密碼子或翻譯起始序列,是為了包括除了在所述DNA分子的編碼鏈中存在T替換U外具有與RNA序列相同序列的相應(yīng)DNA分子,反之亦然。換句話說例如起始密碼子是RNA中的AUG序列,但在本發(fā)明中DNA編碼鏈中相應(yīng)的ATG序列也被稱作起始密碼子。同樣的還用于引用"符合閱讀框的"編碼序列,其意思是被翻譯成氨基酸的RNA分子中的三聯(lián)體(三個(gè)堿基),但也被解釋成DNA分子的編碼鏈中相應(yīng)的三核苷酸序列。在本領(lǐng)域中翻譯起始序列通常被稱作"Kozak序列",最佳的Kozak序列是RCCATGG,下劃線的是起始密碼子,R是嘌呤即A或G(參見KozakM,1986,1987,1989,1990,1997,2002)。因此,除了起始密碼子本身外,其背景特別是-31和+4位核苷酸是有關(guān)的,最佳的翻譯起始序列包括在最佳背景(即ATG之前即是RCC,之后即跟著G)中的最佳啟動(dòng)密碼子(即ATG)()。在存在Kozak序列時(shí),核糖體翻譯最有效(參見KozakM,1986,1987,1989,19卯,1997,2002)。然而,在小比例事件中,核糖體識(shí)別并使用非最佳翻譯起始序列來(lái)起始翻譯。本發(fā)明利用該原理,能夠減少翻譯進(jìn)而表達(dá)可選擇標(biāo)記多肽的量,因此這被用于提高選擇系統(tǒng)的嚴(yán)格性。術(shù)語(yǔ)"選擇標(biāo)記"或"可選擇標(biāo)記"通常用于指可以直接或間接檢測(cè)其在細(xì)胞中存在的基因和/或蛋白質(zhì),例如使選擇劑失活并保護(hù)宿主細(xì)胞免于藥物致死或生長(zhǎng)抑制作用的多肽(例如抗生素抗性基因和/或蛋白質(zhì))??蛇x擇標(biāo)記多肽是本領(lǐng)域中公知的,并且在要獲得真核宿主細(xì)胞時(shí)被常規(guī)使用,WO2006/048459中提供了許多適當(dāng)?shù)目蛇x擇標(biāo)記蛋白質(zhì)的某些例子。編碼這類可選擇標(biāo)記多肽的DNA序列是己知的,WO2006/048459提供了編碼可選擇標(biāo)記蛋白質(zhì)的DNA野生型序列的某些例子(例如其中的圖15~21,通過參照并入本文中)。明顯的是也可以適當(dāng)使用可選擇標(biāo)記的突變體或衍生物,因此只要所述可選擇標(biāo)記蛋白質(zhì)仍然發(fā)揮功能,就包括在術(shù)語(yǔ)"可選擇標(biāo)記多肽"的范圍內(nèi)。例如還包括由于遺傳密碼冗余性而不改變所編碼蛋白質(zhì)的任何沉默突變。還包括其他導(dǎo)致保守氨基酸突變或其他突變的突變,只要所編碼的蛋白質(zhì)仍具有活性,該活性可以比指定序列所編碼野生型蛋白質(zhì)的活性低,或者可以不低于所指定序列所編碼野生型蛋白質(zhì)的活性。特別的,優(yōu)選所編碼的蛋白質(zhì)與由分別指定序列所編碼蛋白質(zhì)具有至少70%,優(yōu)選至少80%,更優(yōu)選至少卯%,更加優(yōu)選至少95%的同一性??梢酝ㄟ^常規(guī)的方法完成對(duì)可選擇標(biāo)記蛋白質(zhì)活性的測(cè)試。根據(jù)本發(fā)明的可選擇標(biāo)記多肽是由核酸編碼的蛋白質(zhì),其中所述多肽功能上被用于選擇,例如由于其提供了對(duì)選擇劑例如抗生素的抗性。因此,如果使用抗生素作為選擇劑,則DNA編碼提供對(duì)所述選擇劑抗性的多肽,該多肽是可選擇標(biāo)記多肽。可選擇標(biāo)記多肽是由本發(fā)明的DNA所編碼的。根據(jù)本發(fā)明的可選擇標(biāo)記多肽必須在真核宿主細(xì)胞中有功能,因此能夠被選擇用于真核宿主細(xì)胞中。對(duì)于本發(fā)明適當(dāng)?shù)目蛇x擇標(biāo)記基因的例子是Zoecin和新霉素。其他適當(dāng)?shù)暮蜻x物包括例如殺稻瘟菌素、嘌呤霉素、博來(lái)霉素、潮霉素、DHFR、GS等(同樣參見WO2006/048459)。其他可以使用的可選擇標(biāo)記基因以及它們的選擇劑被列舉在例如美國(guó)專利5,561,053的表1中;還可以參見Kaufinan,MethodsinEnzymology,185:537-566(1990),或者這些的綜述。術(shù)語(yǔ)"選擇"通常被定義為使用選擇標(biāo)記/可選擇標(biāo)記以及選擇劑以鑒定具有具體遺傳特征的宿主細(xì)胞(例如宿主細(xì)胞包含整合到其基因組上的轉(zhuǎn)基因)的過程。為了方便并且通常本領(lǐng)域技術(shù)人員能夠接受,在許多出版物以及本文中,經(jīng)常講編碼對(duì)選擇劑抗性的基因和蛋白質(zhì)分別稱作"可選擇劑(抗性)基因"或"選擇劑(抗性)蛋白質(zhì)",盡管正式名稱可能不同,例如編碼提供對(duì)新霉素(以及對(duì)G418和卡那霉素)抗性的蛋白質(zhì)的基因經(jīng)常被稱作新霉素(抗性)(或nec/)基因,而其正式名稱為氨基葡糖苷3,-磷酸轉(zhuǎn)移酶基因。WO2006/048459和US2006/0141577在優(yōu)選的實(shí)施方式中編碼可選擇標(biāo)記蛋白質(zhì)的序列具有GTG起始密碼子,或者更優(yōu)選TTG起始密碼子。這達(dá)到了非常嚴(yán)格的選擇以及在所獲得的克隆中蛋白質(zhì)非常高水平的表達(dá)。在本發(fā)明中,通過降低其中CpG的含量對(duì)可選擇標(biāo)記蛋白質(zhì)的編碼序列進(jìn)行進(jìn)一步改進(jìn),這達(dá)到了更高的嚴(yán)格性以及進(jìn)一步提高的表達(dá)水平。優(yōu)選,可選擇標(biāo)記多肽編碼鏈中的翻譯起始序列包含TTG起始密碼子。優(yōu)選GTG或TTG起始密碼子的側(cè)面是提供對(duì)非ATG序列相對(duì)好地識(shí)別為起始密碼子的序列,以便至少某些核糖體從這些起始密碼子開始翻譯,即翻譯起始序列優(yōu)選包含序列ACC[GTG或TTG起始密碼子]G或者GCC[GTG或TTG起始密碼子]G。在一個(gè)方面中,本發(fā)明提供了一種DNA分子,其包含編碼可選擇標(biāo)記多肽的開放閱讀框序列,其中編碼鏈中的DNA分子包含選自由a)GTG起始密碼子和b)TTG起始密碼子所組成組的可選擇標(biāo)記多肽的翻譯起始序列;其中與編碼可選擇標(biāo)記蛋白質(zhì)的原始開放閱讀框序列相比,編碼所述可選擇標(biāo)記蛋白質(zhì)的開放閱讀框序列已經(jīng)被突變以替換至少10%的CpG二核苷酸(該序列中的所有"CG")。根據(jù)本發(fā)明,通過選擇可選擇標(biāo)記多肽的表達(dá),這類DNA分子可以用于獲得表達(dá)高水平感興趣的多肽的真核宿主細(xì)胞。接著,或者同時(shí),可以鑒定一種或者多種表達(dá)感興趣的多肽的宿主細(xì)胞,并進(jìn)一步用于表達(dá)高水平的感興趣的多肽。本文中顯示本發(fā)明可選擇標(biāo)記基因(即具有TTG或GTG起始密碼子)中CpG含量的降低能夠引起感興趣的多肽提高的表達(dá),其中所述感興趣的多肽是從同樣翻譯出可選擇標(biāo)記多肽的多順反子轉(zhuǎn)錄單位中翻譯的。不希望受到理論的限制,相信,CpG含量的降低可以降低轉(zhuǎn)錄沉默的可能性,因?yàn)樵谡婧思?xì)胞中CpG二核苷酸能夠被甲基化并沉默。具有相對(duì)高CpG含量的基因所編碼的可選擇標(biāo)記多肽通常來(lái)自細(xì)菌序列,例如Zeocin和新霉素可以最大受益于CpG含量的降低,盡管已經(jīng)發(fā)現(xiàn)具有相對(duì)低CpG含量的選擇基因的某些益處。在某些實(shí)施方式中,從編碼可選擇標(biāo)記多肽的序列中除去CpG二核苷酸而不改變所編碼的氨基酸序列。可以通過利用遺傳密碼子的冗余性完成這一點(diǎn),并且對(duì)于分子生物學(xué)領(lǐng)域普通技術(shù)人員而言是公知并且常規(guī)的。期望在可選擇標(biāo)記基因的編碼序列中至少10%的CpG二核苷酸已經(jīng)被替換時(shí),除去CpG二核苷酸的積極效果是明顯的。期望除去更多的CpG二核苷酸會(huì)提高效果,因此在某些實(shí)施方式中,與編碼可選擇標(biāo)記蛋白質(zhì)的原始幵放閱讀框序列相比,至少20%、至少30%、至少40%、至少50%、至少60%、至少70%或至少80%的CpG二核苷酸被突變。在某些有利的實(shí)施方式中,與編碼可選擇標(biāo)記多肽的原始開放閱讀框序列相比,編碼可選擇標(biāo)記多肽的開放閱讀框序列中至少一半CpG二核苷酸被替換。SEQ.ID.NO.l(包含內(nèi)部ATG)給出了編碼提供對(duì)Zeocin抗性的可選擇標(biāo)記多肽的原始開放閱讀框序列(),在該序列中第280位的A突變成T提供了缺少內(nèi)部ATG的序列,其中在第94位內(nèi)部編碼的甲硫氨酸被替換成為亮氨酸。對(duì)于本發(fā)明的DNA序列,起始密碼子(DNA序列的開始三個(gè)核苷酸)被突變成GTG起始密碼子或突變成TTG起始密碼子。在某些有利的實(shí)施方式中,可選擇標(biāo)記多肽提供了針對(duì)Zeodn的抗性。在其某些實(shí)施方式中,DNA分子包含SEQ,ID.NO.1,其中至少一半CpG二核苷酸已經(jīng)被替換而沒有突變所編碼的氨基酸序列,前提是起始密碼子(DNA序列的開始三個(gè)核苷酸)被替換為選自GTG或TTG的起始密碼子。在替換的實(shí)施方式中,DNA分子包含SEQ.ID.NO.1,其中第280位的核苷酸A被替換為T,以便第94位氨基酸(甲硫氨酸)被替換為亮氨酸,其中至少一半CpG二核苷酸已經(jīng)被替換而沒有突變所編碼的氨基酸序列,前提是起始密碼子(DNA序列的開始三個(gè)核苷酸)被替換為選自GTG或TTG的起始密碼子。該實(shí)施方式在Zeodn抗性基因的編碼序列中缺少ATG序列,因此其適合本發(fā)明的多順反子轉(zhuǎn)錄單位,其中可選擇標(biāo)記多肽的編碼序列在感興趣的多肽編碼序列的上游。在本發(fā)明的一個(gè)優(yōu)選實(shí)施方式中,DNA分子包含SEQ.ID.NO.3。SEQ.ID.NO.5(包含內(nèi)部ATG)和SEQ.ID.NO.7(缺少內(nèi)部ATG)中給出了編碼提供對(duì)新霉素抗性的可選擇標(biāo)記多肽的原始開放閱讀框。在有利的實(shí)施方式中,這些序列可以包含一個(gè)或者更多個(gè)其他的突變,以便所編碼的多肽在第201位纈氨酸突變成甘氨酸(201V〉G),第185位的谷氨酸突變成天冬氨酸(185E〉D),或者都突變(185E〉D,201V>G)。在其他有利的實(shí)施方式中,可選擇標(biāo)記多肽提供了針對(duì)新霉素的抗性。在本發(fā)明的某些實(shí)施方式中,DNA分子包含選自由a)SEQ.ID.N0.5,前提是至少一半CpG二核苷酸已經(jīng)被替換而沒有突變所編碼的氨基酸序列,進(jìn)一步的前提是起始密碼子(開始的ATG序列)被替換為GTG或TTG;b)SEQ.ID.NO.7,前提是至少一半CpG二核苷酸已經(jīng)被替換而沒有突變所編碼的氨基酸序列,進(jìn)一步的前提是起始密碼子(開始的ATG序列)被替換為GTG或TTG;和c)SEQ.ID.NO.5或SEQ.ID.NO.7中任意一種所組成的組,與所指定序列編碼的序列相比,其包含突變以編碼新霉素抗性蛋白質(zhì)變體,所述變體在所編碼蛋白質(zhì)的第201位具有甘氨酸(201G變體),或者在第185位具有天冬氨酸(185D變體)或者同時(shí)在第201位具有甘氨酸在第185位具有天冬氨酸(185D,201G變體),前提是給定DNA序列中至少一半CpG二核苷酸已經(jīng)被替換而沒有進(jìn)一步突變所編碼的氨基酸序列,進(jìn)一步的前提是起始密碼子(開始的ATG序列)被替換為GTG或TTG。例如185D變體是通過將所提供核酸序列中第553555位的密碼子替換為GAC而獲得的,例如201G變體是通過將給定核酸序列中第601~603位的密碼子替換為GGT而獲得的。在一個(gè)優(yōu)選的實(shí)施方式中,DNA分子包含SEQ.ID.NO.9,前提是第555位的核苷酸A被替換為C(以編碼185E>D變體),第602位的核苷酸T替換為G并且第603位的核苷酸G被替換為T(以編碼201V>G變體),進(jìn)一步的前體是啟動(dòng)密碼子(第1~3位的ATG)被替換為GTG或TTG。對(duì)于本領(lǐng)域技術(shù)人員明顯的是本領(lǐng)域技術(shù)人員可以制備其他的變體而不離開本發(fā)明的教導(dǎo),因此只要啟動(dòng)密碼子不是ATG并且所編碼的蛋白質(zhì)提供針對(duì)新霉素(或G418)的抗性則這些其他的變體也包含在本發(fā)明中。185D和201G變體進(jìn)一步提高了本發(fā)明的選擇嚴(yán)格性。在某些實(shí)施方式中,可選擇標(biāo)記多肽還包含與野生型對(duì)應(yīng)物相比降低可選擇標(biāo)記多肽活性的突變。這可以用于進(jìn)一步提高選擇的嚴(yán)格性。作為非限制性實(shí)施例,可以對(duì)Zeocin抗性多肽中第9位的脯氨酸進(jìn)行突變,例如突變成Thr或Phe,對(duì)于新霉素抗性多肽,則第182位或第261位的氨基酸或者兩個(gè)氨基酸都可以被進(jìn)一步突變(參見例如WO01/32901)。原則上,本發(fā)明編碼可選擇標(biāo)記多肽的DNA分子可以用于任何表達(dá)載體中,例如作為單順反子基因。他們提供了嚴(yán)格的選擇標(biāo)準(zhǔn)。然而在優(yōu)選的實(shí)施方式中,編碼可選擇標(biāo)記多肽的ORF是還包含編碼感興趣的多肽的ORF的多順反子轉(zhuǎn)錄單位的一部分。本發(fā)明的多順反子轉(zhuǎn)錄單位可以是例如包含編碼5'到3'為可選擇標(biāo)記多肽和感興趣的多肽的序列的多順反子轉(zhuǎn)錄單位,或者例如包含編碼5'到3,為感興趣多肽和可選擇標(biāo)記多肽的序列的多順反子轉(zhuǎn)錄單位。在前一種情況中,優(yōu)選可選擇標(biāo)記多肽的編碼序列在編碼鏈中不含ATG序列(參見WO2006/048459)。在后一種情況中,從可選擇標(biāo)記多肽編碼序列的上游編碼感興趣的多肽,并且內(nèi)部核糖體進(jìn)入位點(diǎn)(IRES)可操作地連接于編碼可選擇標(biāo)記多肽的序列,因此可選擇標(biāo)記多肽依賴IRES進(jìn)行其翻譯(參見US2006/0141577)。因此,在一個(gè)實(shí)施方式中,本發(fā)明的多順反子轉(zhuǎn)錄單位按照下列順序包含a)啟動(dòng)子;b)編碼可選擇標(biāo)記蛋白質(zhì)的序列;以及C)編碼感興趣蛋白質(zhì)的序列。在另一個(gè)實(shí)施方式中,本發(fā)明的多順反子轉(zhuǎn)錄單位按照下列順序包含a)啟動(dòng)子;b)編碼感興趣蛋白質(zhì)的序列;以及C)內(nèi)部核糖體進(jìn)入位點(diǎn)(IRES),其可操作地連接于d)編碼可選擇標(biāo)記蛋白質(zhì)的序列。在某些實(shí)施方式中,多順反子轉(zhuǎn)錄單位在第二順反子的下游包含第三順反子,所述第三順反子優(yōu)選可操作地連接于IRES,例如第三順反子是編碼第二可選擇標(biāo)記多肽。在某些實(shí)施方式中這種第二可選擇標(biāo)記多肽是DHFR,優(yōu)選具有GTG或TTG起始密碼子以能夠在dhfr缺陷型細(xì)胞中進(jìn)行連續(xù)選擇(參見例如PCT/EP2007/0516%,在本文中通過參照并入)。在某些實(shí)施方式中,本發(fā)明提供了包含本發(fā)明DNA分子的表達(dá)盒,其中所述表達(dá)盒在本發(fā)明多順反子轉(zhuǎn)錄單位的上游包含啟動(dòng)子,以及在本發(fā)明多順反子轉(zhuǎn)錄單位的下游包含轉(zhuǎn)錄終止序列。在真核宿主細(xì)胞中,所述表達(dá)盒是有功能的,用于驅(qū)動(dòng)多順反子轉(zhuǎn)錄單位的轉(zhuǎn)錄。在本文中所使用的"表達(dá)盒"是至少包含功能上連接于期望表達(dá)序列的啟動(dòng)子的核酸序列。優(yōu)選,表達(dá)盒還包含轉(zhuǎn)錄終止和聚腺苷酸化序列。適當(dāng)?shù)膯?dòng)子和轉(zhuǎn)錄終止/聚腺苷酸化序列的例子是公知的,并易于被本領(lǐng)域技術(shù)人員獲得,例如在WO2006/048459,第28~29頁(yè)中所討論的,在本文中通過參照并入。還可以包含其他調(diào)控序列例如增強(qiáng)子。啟動(dòng)子必須能夠在真核宿主細(xì)胞中發(fā)揮作用,即其必須能夠驅(qū)動(dòng)轉(zhuǎn)錄單位的轉(zhuǎn)錄。因此,啟動(dòng)子可操作地連接于轉(zhuǎn)錄單位。表達(dá)盒可以可選擇地還包含本領(lǐng)域中己知的其他元件例如剪切位點(diǎn)以包含內(nèi)含子等。在可選擇標(biāo)記多肽是在感興趣的多肽的下游被編碼的實(shí)施方式中,IRES被可操作地連接于包含編碼可選擇標(biāo)記多肽序列的順反子。在可選擇標(biāo)記多肽是在感興趣的多肽的上游被編碼的實(shí)施方式中,編碼可選擇標(biāo)記多肽的序列在編碼鏈中不包含ATG序列。本文中所使用的"內(nèi)部核糖體進(jìn)入位點(diǎn)"或"IRES"是指促進(jìn)內(nèi)部核糖體直接進(jìn)入起始密碼子的元件,例如通常為順反子(編碼蛋白質(zhì)的區(qū)域)的ATG,但在本發(fā)明中優(yōu)選為GTG或TTG,使得基因不依賴于帽進(jìn)行翻譯。IRES序列和其應(yīng)用對(duì)于本領(lǐng)域技術(shù)人員是公知的,如在US2006/0141577和PCT/EP2007/051696中所教導(dǎo)的,在本文中通過參照并入U(xiǎn)S2006/0141577和PCT/EP2007/051696。還參見例如JacksonRJ,HowellMT,KaminskiA(1990)TrendsBiochemSci15(12):477-83),JacksonRJandKaminski,A.(1995)RNA1(10):985-1000,Martinez-Salas,1999,Venkatesan&Dasgupta,2001,Rees等人,1996和Mizuguchi等人,2000。在US2006/0141577(其中的SEQIDNO.127)的實(shí)施例19中提供了適當(dāng)?shù)腎RES序列的例子,在本文中通過參照并入??梢酝ㄟ^本領(lǐng)域技術(shù)人員能夠利用的標(biāo)準(zhǔn)分子生物學(xué)方法產(chǎn)生本發(fā)明的DNA分子。例如,可以通過常規(guī)的方法對(duì)原始序列例如來(lái)自商業(yè)上可以獲得的質(zhì)粒進(jìn)行突變。此外,目前還可以任意合成(如果需要,使用亞克隆步驟)具有可選擇標(biāo)記多肽ORF的充分長(zhǎng)度的DNA序列,目前這類合成的DNA序列可以從各種公司商業(yè)訂購(gòu)。因此,根據(jù)本發(fā)明的教導(dǎo),本領(lǐng)域技術(shù)人員可以設(shè)計(jì)本發(fā)明編碼可選擇標(biāo)記多肽的適當(dāng)序列(具有GTG或TTG起始密碼子,CpG含量降低,在某些實(shí)施方式中不包含內(nèi)部ATG),合成該序列,并且通過將該DNA分子引入到真核宿主細(xì)胞中對(duì)DNA分子測(cè)試所編碼可選擇標(biāo)記的功能,以及測(cè)試發(fā)揮功能的可選擇標(biāo)記多肽的表達(dá)。這些序列的商業(yè)可獲得性使得便于提供缺少內(nèi)部的ATG編碼選擇標(biāo)記的序列而沒有過分的壓力,其中選擇標(biāo)記多肽的野生型序列包含某些這類的內(nèi)部ATG(參見WO2006/048459)。在某些實(shí)施方式中,本發(fā)明的DNA分子是載體如質(zhì)粒的一部分。通過本領(lǐng)域技術(shù)人員公知的方法,容易對(duì)這些載體進(jìn)行處理,例如可以被設(shè)計(jì)成能夠在原核細(xì)胞和/或真核細(xì)胞中復(fù)制。另外,許多載體可以直接或者以從其分離的期望片段的形式用于轉(zhuǎn)化真核細(xì)胞,并能夠全部或部分整合到這些細(xì)胞的基因組中,得到在它們的基因組中包含期望核酸的穩(wěn)定宿主細(xì)胞。所使用的載體可以是任何適合克隆DNA的載體,并能夠用于感興趣核酸的轉(zhuǎn)錄。在使用宿主細(xì)胞吋,優(yōu)選所述載體是整合型載體??商鎿Q的,所述載體可以是游離復(fù)制型載體。廣泛接受的是染色質(zhì)結(jié)構(gòu)和其它外遺傳調(diào)控機(jī)制可以影響轉(zhuǎn)基因在真核細(xì)胞中的表達(dá)(例如Whitelaw等人,2001)。本發(fā)明的多順反子表達(dá)單位形成了選擇體系的一部分,其具有相當(dāng)嚴(yán)格的選擇方案。通常,這需要在所選擇宿主細(xì)胞中的高轉(zhuǎn)錄水平。為了提高發(fā)現(xiàn)在嚴(yán)格選擇方案中存活的宿主細(xì)胞克隆的機(jī)會(huì),并可能提高在所獲得克隆中表達(dá)的穩(wěn)定性,通常優(yōu)選提高轉(zhuǎn)錄的可預(yù)測(cè)性。因此,在優(yōu)選的實(shí)施方式中,本發(fā)明的表達(dá)盒還包含至少一個(gè)染色質(zhì)調(diào)控元件。本文中所使用的"染色質(zhì)調(diào)控元件"是能夠以某種方式影響染色質(zhì)結(jié)構(gòu),進(jìn)而在真核細(xì)胞中影響鄰近轉(zhuǎn)基因的表達(dá)水平和/或穩(wěn)定性(它們順式發(fā)揮作用,因此優(yōu)選置于距離轉(zhuǎn)基因5kb以內(nèi),更優(yōu)選在2kb以內(nèi),更加優(yōu)選在lkb以內(nèi))的DNA序列的總稱。優(yōu)選這類染色質(zhì)調(diào)控元件選自由絕緣子序列、遍在染色質(zhì)開放元件(UCOE)、基質(zhì)或支架附著區(qū)(MAR/SAR)和抗阻抑物(STAR)序列所組成的組。在WO2006/048459第32~37頁(yè)提供了染色質(zhì)調(diào)控元件的例子以及獲得和使用它們以及功能上進(jìn)行測(cè)試的方法,通過參照并入本文中。在某些實(shí)施方式中,所述至少一個(gè)染色質(zhì)調(diào)控元件是抗阻抑物元件,其選自由WO2006/048459中SEQ.ID.NO.1~SEQ.ID.NO.66的任何一種及其片段所組成的組。在其某些實(shí)施方式中,所述表達(dá)盒包含WO2006/048459的SEQ.ID.NO.66或其片段,其位于驅(qū)動(dòng)多順反子轉(zhuǎn)錄單位轉(zhuǎn)錄的啟動(dòng)子的上游。在其它一些實(shí)施方式中,多順反子轉(zhuǎn)錄單位的兩側(cè)連接至少一個(gè)抗阻抑物序列,所述抗阻抑物序列選自由WO2006/048459中SEQ.ID.NO.1~SEQ.ID.NO.65的任何一種或其片段所組成的組。優(yōu)選,所述染色質(zhì)調(diào)控元件選自由STAR67、STAR7、STAR9、STAR17、STAR27、STAR29、STAR43、STAR44、STAR45、STAR47、STAR61或所述STAR序列的功能片段或衍生物所組成的組(參見例如WO2006/048459獲得這些STAR元件的序列和優(yōu)選應(yīng)用,通過參照并入本文中)。本發(fā)明的感興趣的多肽可以是任何蛋白質(zhì),并且可以是單體蛋白質(zhì)或者多聚體蛋白質(zhì)(的一部分)。多聚體蛋白質(zhì)包含至少兩條多肽鏈。本發(fā)明感興趣蛋白質(zhì)的非限制性例子是酶、激素、免疫球蛋白鏈、諸如抗癌蛋白質(zhì)的治療性蛋白質(zhì)、諸如VIII因子的血液凝集蛋白質(zhì)、諸如紅細(xì)胞生成素的多功能蛋白質(zhì)、診斷性蛋白質(zhì),或者可以用于免疫目的的蛋白質(zhì)或其片段,所有都是本領(lǐng)域技術(shù)人員已知的。感興趣的多肽可以來(lái)自任何來(lái)源,在某些實(shí)施方式中是哺乳動(dòng)物蛋白質(zhì)、人工蛋白質(zhì)(例如融合蛋白或突變的蛋白質(zhì)),并優(yōu)選是人蛋白質(zhì)。包含本發(fā)明的多順反子轉(zhuǎn)錄單位和/或表達(dá)盒的DNA分子可以用于提高核酸的表達(dá),優(yōu)選在宿主細(xì)胞中。術(shù)語(yǔ)"細(xì)胞"/"宿主細(xì)胞"和"細(xì)胞系"/"宿主細(xì)胞系"通常分別被定義為通過本領(lǐng)域中已知的方法可以維持在細(xì)胞培養(yǎng)中并且具有表達(dá)異源或同源蛋白質(zhì)能力的細(xì)胞和其均一的群體。本發(fā)明還提供了包含本發(fā)明DNA分子或表達(dá)盒的宿主細(xì)胞。原核宿主細(xì)胞可以用于繁殖和/或使用本發(fā)明的DNA分子進(jìn)行遺傳工程。本發(fā)明的DNA分子,特別是出現(xiàn)在質(zhì)粒上時(shí)能夠在原核宿主細(xì)胞例如細(xì)菌中復(fù)制。根據(jù)本發(fā)明的宿主細(xì)胞優(yōu)選是真核細(xì)胞,更優(yōu)選哺乳動(dòng)物細(xì)胞,例如嚙齒類動(dòng)物(例如小鼠、倉(cāng)鼠)細(xì)胞或人細(xì)胞或者不同細(xì)胞的融合。在某些非限制性實(shí)施方式中,所述細(xì)胞是U-20S骨肉瘤、HEK293、HuNS-l骨髓瘤、WERI-Rb陽(yáng)l眼癌、BHK、COS、Vero、非分泌性小鼠骨髓瘤Sp2/0-Ag14、非分泌性小鼠骨髓瘤NSO、NCI-H295R腎上腺癌或PEILC6②細(xì)胞。對(duì)于本發(fā)明的目的,PER.C6細(xì)胞的意思是在ECACCno.96022940保藏的細(xì)胞(參見例如美國(guó)專利5,994,128)傳代的上游或下游,或者其上游或下游的派生物即具有這些細(xì)胞特征。之前已經(jīng)顯示這些細(xì)胞能夠以高水平表達(dá)蛋白質(zhì)(例如WO00/63403和Jones等人,2003)。在某些優(yōu)選的實(shí)施方式中,宿主細(xì)胞是CHO(中國(guó)倉(cāng)鼠卵巢)細(xì)胞,例如CHO-K1、CHO-S、CHO-DG44、CHO-DUKXB11等。在某些實(shí)施方式中,所述CHO細(xì)胞具有dhfr—表型。這些真核宿主細(xì)胞能夠表達(dá)期望的多肽,并且通常用于該目的。能夠通過將本發(fā)明的DNA分子優(yōu)選以表達(dá)盒的形式引入到細(xì)胞中,獲得這些真核宿主細(xì)胞。優(yōu)選,表達(dá)盒被整合到宿主細(xì)胞的基因組中,在各種宿主細(xì)胞中可以整合在基因組的不同位置中,選擇將提供轉(zhuǎn)基因被整合到適當(dāng)位置的克隆,這得到了在表達(dá)水平、穩(wěn)定性、生長(zhǎng)特征等方面具有期望性能的宿主細(xì)胞克隆??商鎿Q的,可以靶向或隨即選擇轉(zhuǎn)錄單位用于整合到轉(zhuǎn)錄活躍的染色體區(qū)域例如在基因組中所存在啟動(dòng)子的后面。優(yōu)選,宿主細(xì)胞來(lái)自根據(jù)本領(lǐng)域技術(shù)人員己知的標(biāo)準(zhǔn)程序可以選擇并增殖的穩(wěn)定克隆。如果細(xì)胞包含編碼感興趣的多肽的轉(zhuǎn)錄單位,則這類克隆的培養(yǎng)物能夠產(chǎn)生感興趣的多肽。本發(fā)明還提供了一種產(chǎn)生能夠表達(dá)感興趣多肽的宿主細(xì)胞的方法,所述方法包括步驟a)將本發(fā)明的DNA分子或表達(dá)盒引入到多個(gè)前體細(xì)胞中,b)在適合表達(dá)可選擇標(biāo)記多肽的條件下培養(yǎng)這些前體細(xì)胞,以及c)選擇至少一個(gè)表達(dá)所述可選擇標(biāo)記多肽的宿主細(xì)胞。完成對(duì)可選擇標(biāo)記多肽表達(dá)的選擇,例如通過施加選擇壓力(例如在存在選擇劑時(shí)培養(yǎng)),并將保證在本發(fā)明的多順反子轉(zhuǎn)錄單位和表達(dá)盒中感興趣的多肽的表達(dá)。在所獲得克隆與期望多肽高表達(dá)的克隆的比例方面,該新型方法提供了非常好的結(jié)果使用相同濃度的選擇劑獲得了比使用已知的選擇系統(tǒng)少得多的集落,以及相對(duì)高比例的所獲得克隆以高水平產(chǎn)生感興趣的多肽。本發(fā)明還提供了一種生產(chǎn)感興趣的多肽的方法,其包括培養(yǎng)包含本發(fā)明表達(dá)盒的宿主細(xì)胞,以在所述細(xì)胞中表達(dá)編碼感興趣蛋白質(zhì)的核酸。在優(yōu)選的實(shí)施方式中,從所述細(xì)胞或這從培養(yǎng)基中或者同時(shí)從兩者中收獲感興趣的蛋白質(zhì)。在優(yōu)選的實(shí)施方式中,所述細(xì)胞是哺乳動(dòng)物細(xì)胞,例如CHO細(xì)胞??梢酝ㄟ^多種方法之一完成在細(xì)胞中引入待表達(dá)的核酸,同樣這也是本領(lǐng)域技術(shù)人員所已知的,也依賴于所要引入核酸的模式。所述方法包括但不限于轉(zhuǎn)染、感染、注射、轉(zhuǎn)化等。在某些實(shí)施方式中至少在培養(yǎng)過程中的部分時(shí)間內(nèi),在培養(yǎng)基中存在選擇劑,其濃度足以選擇表達(dá)可選擇標(biāo)記多肽的細(xì)胞,或者以較低的濃度。在其他實(shí)施方式中,如果表達(dá)多肽,則在生產(chǎn)階段,在培養(yǎng)基中不再出現(xiàn)選擇劑。進(jìn)行培養(yǎng)細(xì)胞,以使其能夠代謝和/或生長(zhǎng)和/或分裂和/或生產(chǎn)感興趣的重組蛋白。這可以通過本領(lǐng)域技術(shù)人員熟知的方法完成,其包括但不限于為細(xì)胞提供營(yíng)養(yǎng)物。這些方法包括附著到表面的生長(zhǎng),在懸浮液中的生長(zhǎng),或其組合。例如可以在盤、滾瓶或者在生物反應(yīng)器中使用分批系統(tǒng)、補(bǔ)料分批系統(tǒng)、連續(xù)系統(tǒng)例如灌注系統(tǒng)等進(jìn)行培養(yǎng)。為了達(dá)到通過細(xì)胞培養(yǎng)大規(guī)模(連續(xù))生產(chǎn)重組蛋白質(zhì),本領(lǐng)域中優(yōu)選使用能夠在懸浮液中生長(zhǎng)的細(xì)胞,并且優(yōu)選使用在無(wú)血清甚至無(wú)蛋白質(zhì)的培養(yǎng)基中能夠生長(zhǎng)的細(xì)胞。細(xì)胞生長(zhǎng)和繁殖的條件(參見例如TissueCulture,AcademicPress,Kruse和Paterson,編輯(1973))以及表達(dá)重組蛋白的條件是本領(lǐng)域技術(shù)人員已知的。通常,可以在哺乳動(dòng)物細(xì)胞生物技術(shù)實(shí)用方法(MammalianCellBiotechnology:aPracticalApproach)(M.Butler,ed.,IRLPress,1991)中發(fā)現(xiàn)用于使哺乳動(dòng)物培養(yǎng)物產(chǎn)量最大化的原理、方案和實(shí)用技術(shù)。在優(yōu)選的實(shí)施方式中,從細(xì)胞或者從培養(yǎng)基或者從二者收集(分離)表達(dá)的蛋白質(zhì)。接著可以使用己知的方法進(jìn)行進(jìn)一步純化,例如通過本領(lǐng)域技術(shù)人員公知的方法進(jìn)行過濾、柱層析等。顯然,在最終目的不是生產(chǎn)感興趣的多肽,而是RNA本身時(shí),也可以使用該結(jié)構(gòu)的表達(dá)盒,例如用于從表達(dá)盒來(lái)生產(chǎn)量提高的RNA,其可以用于調(diào)節(jié)其他基因的目的(例如RNAi,反義RNA)、基因治療、體外蛋白質(zhì)生產(chǎn)等。除非以其他方式明確說明,本發(fā)明的實(shí)踐將采用在本領(lǐng)域技術(shù)范圍內(nèi)的免疫學(xué)、分子生物學(xué)、微生物學(xué)、細(xì)胞生物學(xué)和重組DNA的傳統(tǒng)技術(shù)。參見,例如Sambrook,F(xiàn)ritsch和Maniatis,分子克隆實(shí)驗(yàn)室手冊(cè)第2版(MolecularCloning:ALaboratoryManual,2ndedition),1989;分子生物學(xué)當(dāng)前方案(CmrentProtocolsinMolecularBiology),AusubelFM,etal,eds,1987;酶學(xué)系列手冊(cè)(theseriesMethodsinEnzymology)(AcademicPress,Inc.);PCR2:實(shí)用方法(PCR2:APracticalApproach),MacPhersonMJ,HamsBD,TaylorGR,編輯,1995;抗體實(shí)驗(yàn)室手冊(cè)(Antibodies:ALaboratoryManual),Harlow和Lane,編輯,1988。在下面的實(shí)施例中對(duì)本發(fā)明進(jìn)行進(jìn)一步解釋。這些實(shí)施例不以任何方式限制本發(fā)明。它們僅僅是為了闡明本發(fā)明。實(shí)施例實(shí)施例1:從編碼可選擇標(biāo)記的序列除去CpG二核苷酸提高了使用本發(fā)明選擇方法的表達(dá)使用可選擇標(biāo)記的不同翻譯起始密碼子如GTG或TTG的選擇方法可以達(dá)到非常嚴(yán)格的選擇,并且感興趣的多肽非常高水平地產(chǎn)生感興趣的多肽(參見WO2006/048459和US2006/0141577,例如后者中的實(shí)施例119)。在該實(shí)施例中,通過除去CpG二核苷酸對(duì)可選擇標(biāo)記多肽基因本身的編碼區(qū)進(jìn)行修飾?;驹硎荂pG核苷酸中的C核苷酸可以傾向于甲基化,這可能導(dǎo)致可選擇標(biāo)記的基因沉默,因此除去CpG二核苷酸可能改進(jìn)結(jié)果。采用具有TTG起始密碼子的Zeocin抗性基因作為標(biāo)記,盡可能除去CpG二核苷酸,而不改變Zeocin抗性蛋白質(zhì)的氨基酸序列,進(jìn)一步不在編碼鏈中引入ATG序列以防止在Zeocin抗性蛋白質(zhì)的編碼區(qū)中不期望的翻譯起始(例如在WO2006/048459中所解釋的)。因此,某些CG未被除去。原始序列的CpG含量(此處:包含TTG起始密碼子,突變以除去內(nèi)部ATG序列)為13.3%,而在CpG突變之后,CpG含量降低到1.8%[稱作"TTGZeo(貧CpG)"]。在d2EGFP編碼區(qū)的上游克隆CpG含量降低的Zeocin抗性基因以得到多順反子表達(dá)構(gòu)建體。檢測(cè)d2EGFP的表達(dá)水平。制備構(gòu)建體,其在CMV啟動(dòng)子的上游包含STAR7和67,接著是TTGZeo(貧CpG)選擇標(biāo)記(GeneArtGmbH,Regensburg,Germany合成,參見SEQ.ID.NO3;參見SEQ.ID.NO.l,具有天然CpG含量的Zeocin抗性編碼序列),d2EGFP基因和STAR7(圖1)。將這些構(gòu)建體轉(zhuǎn)染到CHO-K1細(xì)胞。使用Lipofectamine2000(Invitrogen)轉(zhuǎn)染DNA,在補(bǔ)加10%FBS(Invitrogen)的HAM-F12培養(yǎng)基(Invitrogen)中存在150pg/mlZeocin時(shí)培養(yǎng)細(xì)胞。在以對(duì)照"富CpG"TTGZeo構(gòu)建體轉(zhuǎn)染后出現(xiàn)了8個(gè)集落(圖1中的A),而在轉(zhuǎn)染包含"貧CpG"TTGZeo的構(gòu)建體后則沒有出現(xiàn)集落(圖1中的C)。相反,如果構(gòu)建體中包含STAR7/67-7,則使用"富CpG"TTGZeo(圖1中的B)選擇標(biāo)記和使用"貧CpG"TTGZeo(圖1中的D)選擇標(biāo)記都會(huì)出現(xiàn)超過24個(gè)集落。使用"富CpG"TTGZeo選擇標(biāo)記(圖1中的A),禾U用STAR-少的對(duì)照構(gòu)建體,d2EGFP的平均表達(dá)為140,而利用包含STAR的構(gòu)建體,d2EGFP的平均表達(dá)為1332(圖1中的B)。這是由于存在STAR元件的提高。使用包含STAR的構(gòu)建體以及"貧CpG"TTGZeo,d2EGFP的平均表達(dá)為2453(圖1中的D),與使用"富CpG"TTGZeo(圖1中的B)相比,幾乎提高了兩倍。此外,使用"富CpG"TTGZeo(B)達(dá)到的最高d2EGFP值是2481,使用"貧CpG"TTGZeo(D)達(dá)到的最高值是4308。我們得出結(jié)論降低Zeocin標(biāo)記基因的CpG含量提高了選擇系統(tǒng)的嚴(yán)格性。這達(dá)到了如果構(gòu)建體中包含STAR元件則d2EGFP表達(dá)值較高,而使用對(duì)照構(gòu)建體則沒有集落。還將相同的構(gòu)建體轉(zhuǎn)染CHO-DG44細(xì)胞。這是使用Lipofectamine2000(Invitrogen)進(jìn)行的,并使用在培養(yǎng)基中的150pg/mlZeocin進(jìn)行選擇。該培養(yǎng)基由HAMF12:DMEM-1:1,加上10°/。胎牛血清構(gòu)成。利用"富CpG"TTGZeocin選擇標(biāo)記,通過STAR-少的對(duì)照構(gòu)建體,d2EGFP的平均表達(dá)為43(圖2中的A),通過包含STAR的構(gòu)建體,d2EGFP的平均表達(dá)為586(圖2中的B)。這是由于存在STAR元件的提高。利用STAR構(gòu)建體和"貧CpG"Zeo,平均d2EGFP表達(dá)為1152(圖2中的D),與"富CpG"TTGZeo(圖2中的D)相比,提高了幾乎兩倍。此外,使用"富CpG"TTGZeo構(gòu)建體達(dá)到的最高d2EGFP值是1296(圖2中的B),使用"貧CpG"TTGZeo構(gòu)建體則到達(dá)的最高值時(shí)2416(圖2中的D)。與使用"貧CpG"TTGZeo構(gòu)建體沒有出現(xiàn)對(duì)照集落(圖1中的C)的CHO-K1相反,使用CHO-DG44出現(xiàn)了對(duì)照集落,但平均d2EGFP值是52,集落中最高值是15(圖2中的C)。我們得出結(jié)論,同樣在CHO-DG44中,向構(gòu)建體加入"貧CpG"TTGZeo選擇標(biāo)記達(dá)到了在采用STAR元件時(shí)的高蛋白質(zhì)表達(dá)。實(shí)施例2:在本發(fā)明的選擇系統(tǒng)中新霉素抗性編碼序列的修飾在該實(shí)施例中,除了起始密碼子外,還修飾了新霉素抗性基因的編碼區(qū),其通過盡可能多地除去新霉素抗性基因的CpG二核苷酸(ATG-少,因此已經(jīng)排除了編碼鏈中的ATG序列),而沒有改變新霉素抗性蛋白質(zhì)的氨基酸序列(與野生型序列相比,除了Me^Leu突變夕卜,在該突變處內(nèi)部ATG序列符合閱讀框并且被替換為CTG:顯然這是由于從編碼鏈中除去ATG序列并且獨(dú)立于降低CpG含量的努力,參見WO2006/04845的實(shí)施例17),在編碼鏈中沒有引入新的ATG序列,這與在實(shí)施例1種對(duì)Zeocin抗性基因所進(jìn)行的一樣。野生型新霉素選擇標(biāo)記基因的CpG含量為10.4%(SEQ.ID.NO.5),而改變后,CpG含量降低到2.3。/。(SEQ.ID.N0.9)。在該實(shí)施例中包含新霉素抗性基因的構(gòu)建體是從GeneArtGmbH,Regensburg,德國(guó)訂購(gòu)的。作為起始密碼子,在該實(shí)施例中使用TTG。因此,所使用的序列由SEQ.ID.NO.9構(gòu)成,前提是起始密碼子(開始三個(gè)核苷酸,ATG)被替換為TTG起始密碼子,進(jìn)一步在某些情況中包含下面所提到突變之一。在"貧CpG"新霉素抗性基因中,進(jìn)行某些突變以改變新霉素抗性蛋白質(zhì)中的氨基酸,以測(cè)試在本發(fā)明的多順反子轉(zhuǎn)錄單位中使用時(shí),是否這些突變對(duì)所感興趣多肽的表達(dá)水平有影響。這些突變(Sautter等人,2005;注意與(Sautter等人,2005)所使用的序列相比,在本發(fā)明中所使用的neo序列編碼在緊接著起始密碼子后的三個(gè)額外氨基酸,因此本申請(qǐng)中的氨基酸編號(hào)比在(Sautter等人,2005)中的編號(hào)高三個(gè)數(shù))由下列構(gòu)成第201位氨基酸纈氨酸(Sautter等人,2005中的第198位)改變成第201位甘氨酸(TTGNeo201V>G),第185位谷氨酸(Sautter等人,2005中的第182位)改變成第185位天冬氨酸(TTGNeo185E>D),以及第201位纈氨酸和第185位谷氨酸分別改變成第201位甘氨酸和第185位天冬氨酸的雙突變(TTGNeo185E>D/201V〉G)(圖3)。將這些修飾與對(duì)照新霉素(貧CpG的TTGNeo185E/201V)進(jìn)行比較。在所有情況中,制備具有或沒有STAR元件的構(gòu)建體(圖3)。將修飾的TTGNeo選擇標(biāo)記并入到構(gòu)建體中,所述構(gòu)建體在CMV啟動(dòng)子的上游包含STAR7和67,接著是所述TTGNeo選擇標(biāo)記、d2EGFP基因和STAR7(圖3)。將構(gòu)建體轉(zhuǎn)染到CHO-Kl細(xì)胞。使用Lipofectamine2000(Invitrogen)轉(zhuǎn)染DNA,在補(bǔ)加10%FBS(Invitrogen)的HAM-F12培養(yǎng)基(Invitrogen)中存在500ng/mlG418遺傳霉素時(shí)培養(yǎng)細(xì)胞。使用對(duì)照Neo構(gòu)建體(185E/201V),僅觀察到STAR元件非常有限的影響。這可能至少部分是由于在500pg/mlG418遺傳霉素下所產(chǎn)生的許多集落,這說明TTG新霉素修飾的嚴(yán)格性低。然而,具有本發(fā)明修飾的新霉素是可以運(yùn)行的在TTGNeol85E201V構(gòu)建體中,從新霉素抗性基因的編碼鏈中除去所有ATG,盡管d2EGFP值低,但明顯ATG的除去仍能夠在遺傳霉素選擇壓力下進(jìn)行正常的選擇。在進(jìn)一步修飾新霉素抗性基因時(shí),觀察到了加入STAR元件的顯著影響。21個(gè)TTGNeo201V>G對(duì)照集落的平均值是65(圖3中的A2),而24個(gè)具有STAR元件的TTGNeo201V>G集落的平均d2EGFP信號(hào)是150(圖3中的B2)。使用TTGNeo185E>D突變,進(jìn)一步提高了選擇嚴(yán)格性,因?yàn)闆]有STAR元件的話,沒有對(duì)照集落存活(圖3中的A3),而17個(gè)存活的TTGNeo185E>DSTAR集落的平均d2EGFP信號(hào)是204(圖3中的B3)。這意味著GFP熒光比TTGNeo201V>G集落的熒光高(圖3中的B2)。與TTGNeo201V>G集落中最高值433相比,TTGNeo185E〉D201V〉G集落中d2EGFP的最高值是715,(比較圖3中的B3禾HB2)。沒有對(duì)照集落存活(圖3中的A4)而7個(gè)存活的STARTTGNeo185E>D201V>G集落的平均d2EGFP值是513,最高d2EGFP值是923(圖3中的B4)。結(jié)論是引入特定的突變提高了根據(jù)本發(fā)明在使用新霉素抗性基因時(shí)的選擇嚴(yán)格性。這些修飾中的某些將該選擇嚴(yán)格性轉(zhuǎn)移到了新霉素抗性基因,其僅在并入STAR元件之后才能由于高表達(dá)值而存活。這伴隨著達(dá)到了更高的d2EGFP表達(dá)值。顯然,本文所描述的新霉素抗性基因的有利實(shí)施方式進(jìn)一步提高了該基因用于根據(jù)本發(fā)明應(yīng)用的適當(dāng)性。明顯的是在將新霉素抗性蛋白質(zhì)置于IRES調(diào)控下時(shí)(參見,例如US2006/0141577的實(shí)施例19),CpG含量降低并具有GTG或TTG起始密碼子并具有指定突變(185E〉D和/或201V〉G)的新霉素抗性基因的構(gòu)造也能夠被置于所感興趣的多肽(這里使用d2EGFP作為模型)編碼序列的下游。對(duì)于Zeocin抗性基因也一樣(實(shí)施例1)。在這種情況中,不需要關(guān)注CpG而據(jù)核苷酸的突變會(huì)引入ATG序列。在這些實(shí)施方式中,也期望能夠得到良好的結(jié)果,即CpG含量的降低以及在可選擇標(biāo)記蛋白質(zhì)編碼序列中指定位點(diǎn)的突變會(huì)提高表達(dá)水平。參考文獻(xiàn)JonesD,KroosN,AnemaR,VanMontfortB,VooysA,VanDerKraatsS,VanDerHelmE,SmitsS,SchoutenJ,BrouwerK,LagerwerfF,VanBerkelP,OpsteltenD-J,LogtenbergT,BoutA(2003)High-levelexpressionofrecombinantIgGinthehumancelllinePER.C6.萬(wàn)/o/ec/zwo/.19:163-168.KozakM.(1986)PointmutationsdefineasequenceflankingtheAUGinitiatorcodonthatmodulatestranslationbyeukaryoticribosomes.Ce〃44:283-292.KozakM.(1987)Ananalysisof5'-noncodingsequencesfrom699vertebratemessengerRNAs.TVwc/e/d^Was.15:8125-8148.KozakM.(1989)Contexteffectsandinefficientinitiationatnon-AUGcodonsineucaryoticcell-freetranslationsystems.M/Ce//傷o/.9:5073-5080.KozakM.(1990)Downstreamsecondarystructurefacilitatesrecognitionofinitiatorcodonsbyeukaryoticribosomes,尸racTV""/87:8301-8305.KozakM.(1997)RecognitionofAUGandalternativeinitiatorcodonsisaugmentedbyGinposition+4butisnotgenerallyaffectedbythenucleotidesinpositions+5and+6.£細(xì)0J.16:2482-2492.KozakM.(2002)加大掃描機(jī)制的限制用于起始翻譯(Pushingthelimitsofthescanningmechanismforinitiationoftranslation),Gewe299:1-34.Martinez-Salas,E.(1999)InternalribosomeentrysitebiologyanditsuseinexpressionvectorsCm/tO//"萬(wàn)/0/ec/7w0//0,458-64.Mizuguchi,H,Xu,Z,Ishii-Watabe,A,Uchida,E,andHayakawa,T.(2000)IRES-dependentsecondgeneexpressionissignificantlylowerthancap-dependentfirstgeneexpressioninabicistronicvectorMo/7Tzer/,376-82.Rees,S,Coote,J,Stables,J,Goodson,S,Harris,S,andLee,MG.(1996)Bicistronicvectorforthecreationofstablemammaliancelllinesthatpredisposesallantibiotic-resistantcellstoexpressrecombinantprotein所她c—i/es20,102-104,106,108-110.Sautter,K,Enenkel,B.2005.Selectionofhigh-producingCHOcellsusingNPTselectionmarkerwithreducedenzymeactivity.歷ofec/z"o/89,530-538.Venkatesan,A,andDasgupta,A.(2001)Novelfluorescence-basedscreentoidentifysmallsyntheticinternalribosomeentrysiteelementsM/Ce//說o/2/,2826-37.Whitelaw,E,Sutherland,H,Kearns,M,Morgan,H,Weaving,L,andGarrick,D.(2001)EpigeneticeffectsontransgeneexpressionAfeAo^feAfo/5/o〃5S,351-68.權(quán)利要求1、一種DNA分子,其包含編碼可選擇標(biāo)記多肽的開放閱讀框序列,其特征在于所述DNA分子在所述可選擇標(biāo)記多肽的編碼鏈中具有GTG起始密碼子或TTG起始密碼子,并且,與編碼所述可選擇標(biāo)記蛋白質(zhì)的原始開放閱讀框序列相比,編碼所述可選擇標(biāo)記蛋白質(zhì)的開放閱讀框序列已經(jīng)被突變,以替換其至少一半的CpG二核苷酸。2、根據(jù)權(quán)利要求1所述的DNA分子,其中所述起始密碼子是TTG。3、根據(jù)權(quán)利要求1或2所述的DNA分子,其中所述可選擇標(biāo)記多肽提供針對(duì)Zeodn或針對(duì)新霉素的抗性。4、根據(jù)權(quán)利要求3所述的DNA分子,其包含編碼提供針對(duì)Zeocin抗性的多肽的開放閱讀框序列,其中所述DNA分子包含以下序列中的一種a)SEQ.ID.NO.1,前提是至少一半的CpG二核苷酸已經(jīng)被替換,而沒有突變其所編碼的氨基酸序列,進(jìn)一步的前提是所述起始密碼子是GTG或TTG;禾口b)SEQ.ID.NO.1,其中第280位的核苷酸A被替換為T,前提是至少一半的CpG二核苷酸已經(jīng)被替換,而沒有突變其所編碼的氨基酸序列,進(jìn)一步的前提是所述起始密碼子是GTG或TTG。5、根據(jù)權(quán)利要求4所述的DNA分子,其包含SEQ.ID.N0.3。6、根據(jù)權(quán)利要求3所述的DNA分子,其包含編碼提供針對(duì)新霉素抗性的多肽的開放閱讀框序列,其中所述DNA分子包含選自以下一組中的序列a)SEQ.ID.NO.5,前提是至少一半的CpG二核苷酸已經(jīng)被替換,而沒有突變其所編碼的氨基酸序列,進(jìn)一步的前提是所述起始密碼子是GTG或TTG;和b)SEQ.ID.NO.7,前提是編碼鏈至少一半的CpG二核苷酸已經(jīng)被替換,而沒有突變其所編碼的氨基酸序列,進(jìn)一步的前提是所述起始密碼子是GTG或TTG;和c)SEQ.ID.NO.5或SEQ.ID.NO.7,前提是與原始序列所編碼的多肽相比,其包含突變以編碼下列多肽變體中的任何一種(i)第201位的纈氨酸置換成甘氨酸(201V〉G),或(ii)第185位的谷氨酸置換成天冬氨酸(185E〉D),或(iii)突變(i)和(ii)的組合(185E〉D和201V>G),進(jìn)一步的前提是,編碼鏈至少一半的CpG二核苷酸己經(jīng)被替換,而除了(i)(iii)中所指定的突變外,沒有進(jìn)一步突變所編碼的氨基酸序列,進(jìn)一步的前提是所述起始密碼子是GTG或TTG。7、根據(jù)權(quán)利要求6所述的DNA分子,其包含SEQ.ID.N0.9,前提是第555位的核苷酸A被替換為C,第602位的核苷酸T被替換為G,第603位的核苷酸G被替換為T,進(jìn)一步的前提是所述始密碼子是GTG或TTG。8、根據(jù)權(quán)利要求1~7中任一項(xiàng)所述的DNA分子,其中所述編碼可選擇標(biāo)記多肽的開放閱讀框序列是還包含編碼感興趣的多肽的開放閱讀框序列的多順反子轉(zhuǎn)錄單位的一部分。9、根據(jù)權(quán)利要求8所述的DNA分子,其中所述編碼可選擇標(biāo)記多肽的開放閱讀框在編碼感興趣的多肽的開放閱讀框的上游,并且其中編碼可選擇標(biāo)記多肽的開放閱讀框在編碼鏈中沒有ATG序列。10、根據(jù)權(quán)利要求8所述的DNA分子,其中所述編碼感興趣的多肽的開放閱讀框在編碼可選擇標(biāo)記多肽的開放閱讀框的上游,并且其中所述編碼可選擇標(biāo)記多肽的開放閱讀框可操作地連接于內(nèi)部核糖體進(jìn)入位點(diǎn)(IRES)。11、一種表達(dá)盒,其包含根據(jù)權(quán)利要求810中任一項(xiàng)所述的DNA分子,所述表達(dá)盒在所述多順反子表達(dá)單位的上游包含啟動(dòng)子,在所述多順反子表達(dá)單位的下游包含轉(zhuǎn)錄終止序列。12、根據(jù)要求ll所述的表達(dá)盒,其還包含至少一個(gè)染色質(zhì)調(diào)控元件。13、一種宿主細(xì)胞,其包含權(quán)利要求110中任一項(xiàng)所述的DNA分子,或者權(quán)利要求11或12所述的表達(dá)盒。14、一種產(chǎn)生能夠表達(dá)感興趣的多肽的宿主細(xì)胞的方法,所述方法包括下列步驟a)將權(quán)利要求810中任一項(xiàng)所述的DNA分子或權(quán)利要求11或12所述的表達(dá)盒引入到多個(gè)前體細(xì)胞中,b)在適合所述可選擇標(biāo)記多肽表達(dá)的條件下培養(yǎng)所述多個(gè)前體細(xì)胞,以及c)選擇至少一個(gè)表達(dá)感興趣的多肽的宿主細(xì)胞。15、一種表達(dá)感興趣的多肽的方法,其包括培養(yǎng)包含權(quán)利要求11或12所述表達(dá)盒的宿主細(xì)胞,以及從所述表達(dá)盒表達(dá)所述感興趣的多肽。16、根據(jù)權(quán)利要求16的方法,其還包括收獲所述感興趣的多肽。全文摘要本發(fā)明提供了一種DNA分子,其包含編碼可選擇標(biāo)記多肽的開放閱讀框序列,其中編碼鏈中的所述DNA分子包含具有GTG起始密碼子或TTG起始密碼子的可選擇標(biāo)記多肽的翻譯起始序列,其中,與編碼所述可選擇標(biāo)記蛋白質(zhì)的原始開放閱讀框序列相比,編碼所述可選擇標(biāo)記蛋白質(zhì)的開放閱讀框序列被替換其至少一半的CpG二核苷酸。文檔編號(hào)C12N15/67GK101437946SQ200780015813公開日2009年5月20日申請(qǐng)日期2007年4月24日優(yōu)先權(quán)日2006年5月2日發(fā)明者A·P·奧特,H·J·M·范布洛克蘭,R·G·A·B·賽沃爾特,T·H·J·克瓦克斯申請(qǐng)人:科羅邁吉尼科斯公司