国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      定制供人類使用的抗體、可變結(jié)構(gòu)域和鏈的制作方法

      文檔序號:11626185閱讀:1178來源:國知局
      定制供人類使用的抗體、可變結(jié)構(gòu)域和鏈的制造方法與工藝

      本申請是2012年9月18日提交的題為“定制供人類使用的抗體、可變結(jié)構(gòu)域和鏈”的中國專利申請201280056727.0的分案申請。

      本發(fā)明涉及提供專門定制供人類使用的抗體治療劑和預防劑。

      本發(fā)明提供了文庫、脊椎動物和細胞,例如轉(zhuǎn)基因小鼠或大鼠或者轉(zhuǎn)基因小鼠或大鼠細胞。此外,本發(fā)明涉及使用脊椎動物分離抗體或編碼抗體的核苷酸序列的方法。本發(fā)明還提供了抗體、重鏈、多肽、核苷酸序列、藥物組合物和用途。



      背景技術(shù):

      本領(lǐng)域技術(shù)水平提供包含轉(zhuǎn)基因免疫球蛋白基因座的非人脊椎動物(例如小鼠和大鼠)和細胞,此類基因座包含人可變(v)、多樣性(d)和/或連接(j)區(qū)段,和任選存在的人恒定區(qū)??商娲?,在轉(zhuǎn)基因基因座中提供宿主脊椎動物的內(nèi)源恒定區(qū)(例如小鼠或大鼠恒定區(qū))。構(gòu)建此類轉(zhuǎn)基因脊椎動物的方法及其在抗原免疫后生成抗體及其核酸的用途為本領(lǐng)域所知,例如參見us7501552(medarex)、us5939598(abgenix)、us6130364(abgenix)、w002/066630(regeneron)、w02011004192(genomeresearchlimited)、w02009076464、w02009143472和w02010039900(ablexis),所述專利的公開內(nèi)容明確引入本文。本領(lǐng)域的此類轉(zhuǎn)基因基因座包括不同量的人v(d)j庫集(repertoire)?,F(xiàn)有轉(zhuǎn)基因免疫球蛋白基因座基于單個人dna來源。在具有此類轉(zhuǎn)基因基因座的非人脊椎動物中人抗體可變區(qū)的潛在多樣性因此受限。

      本發(fā)明人考慮將希望定制這些轉(zhuǎn)基因非人脊椎動物的基因組(以及因此這些的抗體和抗體鏈產(chǎn)物)以解決人的天然抗體基因使用中的可變性和共同性。本發(fā)明人希望實現(xiàn)這點,以便更好地解決基于抗體的治療和預防藥物的人類使用。

      還將希望在轉(zhuǎn)基因免疫球蛋白基因座和容納這些的非人脊椎動物中以及在此類動物的免疫后產(chǎn)生的抗體中提供人可變區(qū)的新型和潛在擴展的庫集和多樣性。



      技術(shù)實現(xiàn)要素:

      本發(fā)明已由跨越眾多不同人類群體和跨越來自人類個體的超過兩千份樣品的天然抗體基因區(qū)段分布的廣泛生物信息學分析開發(fā)。本發(fā)明人已承擔這一艱巨任務,以更徹底了解且設(shè)計非人脊椎動物系統(tǒng)和所得的抗體,以更好地解決就整體而言的人類醫(yī)學治療劑,以及使得能夠合理設(shè)計以針對特定種族的人類群體。使用此類合理設(shè)計,本發(fā)明人已以這樣的方式構(gòu)建了轉(zhuǎn)基因非人脊椎動物以及分離的抗體、抗體鏈和表達這些的細胞,所述方式獲得利用基因區(qū)段的產(chǎn)物,所述基因區(qū)段已在人生物信息學分析的基礎(chǔ)上有意包括。例子舉例說明其中本發(fā)明人為此分離許多細胞和抗體的工作實驗。

      本發(fā)明還涉及合成擴展和人種多樣的超人(superhuman)免疫球蛋白基因庫集。本發(fā)明因此提供了新型和潛在擴展的合成免疫球蛋白多樣性,因此提供可以從其中選擇人抗體治療劑前導物的多樣性庫。當尋求發(fā)現(xiàn)具有希望特征的抗體時,該擴展庫是有用的,所述希望特征例如針對靶抗原的相對高親和力,而無需進一步的親和力成熟(例如使用費力的體外技術(shù)例如噬菌體或核糖體展示),或改善的生物物理學特征,或針對先前難以用抗體針對的由現(xiàn)有抗體結(jié)合位點未達到的靶和新表位。

      本發(fā)明還提供了潛在偏向特定人類群體的成員共同的可變基因使用的多樣性,其可用于生成抗體用于治療和/或預防此類群體內(nèi)的疾病或狀況。這個使抗體庫集偏向的能力允許定制抗體治療劑,目的在于更有效治療和/或預防特定人類群體中的疾病或醫(yī)學狀況。

      本發(fā)明人認識到在轉(zhuǎn)基因基因座中提供來自不同來源的免疫球蛋白基因區(qū)段的可能性,以便提供由其可以生成抗體治療劑(和抗體工具試劑)的新型和潛在擴展的抗體多樣性。這開放了轉(zhuǎn)基因人-小鼠/大鼠技術(shù)詢問與迄今為止能夠的不同和可能更大的抗體序列空間的可能性的潛力。

      在合理設(shè)計轉(zhuǎn)基因抗體基因座以及抗體和抗體鏈中,本發(fā)明人還認識到相對長的hcdr3長度(至少20個氨基酸)通常是針對表位所希望的。例如,已從由感染性疾病病原體感染的人中分離天然存在的抗體,此類抗體具有長hcdr3長度。在這方面已發(fā)現(xiàn)中和抗體。長hcdr3長度將希望針對其他抗原(例如受體裂縫或酶活性位點),而不僅僅限于感染性疾病病原體,并且因此本發(fā)明人認識到工程化轉(zhuǎn)基因基因座以能夠產(chǎn)生長hcdr3抗體和重鏈的可能性的一般需要性。通過經(jīng)由1000genomes計劃對超過2000份人dna樣品費力執(zhí)行生物信息學連同合理序列選擇,本發(fā)明人鑒定特定人基因區(qū)段變體jh6*02的包括對于產(chǎn)生長hcdr3抗體和鏈是希望的。

      另外的合理設(shè)計和生物信息學已導致本發(fā)明人認識到特定人恒定區(qū)變體跨越許多不同人類群體是保守的。本發(fā)明人認識到這開放通過在產(chǎn)物中使用此類特定恒定區(qū),而不是任意選擇人恒定區(qū)(或合成形式的人恒定區(qū)),對人抗體、鏈和可變結(jié)構(gòu)域作出選擇的可能性。本發(fā)明的這個方面還使得能夠?qū)μ囟ㄈ祟惙N族群體定制基于抗體的藥物,從而比迄今為止已進行的更緊密地匹配藥物與患者(和因此的疾病設(shè)置)。用人恒定區(qū)(推測衍生自一個(通常未知的)種族群體或非天然存在的)的任意選擇人源化的抗體無法同樣在不同人類種族群體的患者中起作用,這在本領(lǐng)域技術(shù)水平中可以是問題。這是重要的,因為恒定區(qū)具有提供抗體效應子功能的主要作用,例如用于抗體再循環(huán)、細胞和補體召募以及用于細胞殺死。

      為此,在本發(fā)明的第一種配置中,提供了

      第一配置

      非人脊椎動物或脊椎動物細胞(任選es細胞或抗體生產(chǎn)細胞),其包含具有超人免疫球蛋白重鏈人vh和/或d和/或j基因庫集的基因組。

      非人脊椎動物或脊椎動物細胞(任選es細胞或抗體生產(chǎn)細胞),其包含具有超人免疫球蛋白輕鏈人vl基因庫集的基因組;任選地其中脊椎動物或細胞根據(jù)第一配置。

      非人脊椎動物或脊椎動物細胞(任選es細胞或抗體生產(chǎn)細胞),其基因組包含轉(zhuǎn)基因免疫球蛋白基因座(例如重鏈基因座或輕鏈基因座),所述基因座包含如下所述可操作地連接免疫球蛋白恒定區(qū)的上游,根據(jù)第一和第二人免疫球蛋白基因區(qū)段(任選v區(qū)段)的免疫球蛋白基因區(qū)段;任選地其中基因組對于所述轉(zhuǎn)基因免疫球蛋白基因座是純合的;

      任選地其中免疫球蛋白基因座所包含的超過功能性v基因區(qū)段的天然人互補體;和/或

      任選地其中免疫球蛋白基因座所包含的超過功能性d基因區(qū)段的天然人互補體;和/或

      任選地其中免疫球蛋白基因座所包含的超過功能性j基因區(qū)段的天然人互補體。

      轉(zhuǎn)基因非人脊椎動物(例如小鼠或大鼠)或脊椎動物細胞(任選es細胞或抗體生產(chǎn)細胞),其基因組包含轉(zhuǎn)基因免疫球蛋白基因座,所述基因座包含可操作地連接非人脊椎動物恒定區(qū)的上游的多個人免疫球蛋白基因區(qū)段,用于產(chǎn)生具有非人脊椎動物恒定區(qū)和人可變區(qū)的嵌合抗體、或嵌合輕或重鏈的庫集;其中轉(zhuǎn)基因基因座包含一個或多個人免疫球蛋白v基因區(qū)段、一個或多個人j基因區(qū)段和任選存在的一個或多個人d基因區(qū)段,所述基因區(qū)段中的第一個(任選v區(qū)段)和所述基因區(qū)段中的第二個(任選v區(qū)段)是不同的,并且分別衍生自第一和第二人類個體的基因組,其中所述個體是不同的;和任選是無關(guān)的;

      任選地其中免疫球蛋白基因座所包含的超過功能性v基因區(qū)段的天然人互補體;和/或

      任選地其中免疫球蛋白基因座所包含的超過功能性d基因區(qū)段的天然人互補體;和/或

      任選地其中免疫球蛋白基因座所包含的超過功能性j基因區(qū)段的天然人互補體。

      轉(zhuǎn)基因非人脊椎動物(例如小鼠或大鼠)或脊椎動物細胞(任選es細胞或抗體生產(chǎn)細胞),其基因組包含第一和第二轉(zhuǎn)基因免疫球蛋白基因座,每個基因座包含可操作地連接非人脊椎動物恒定區(qū)的上游的多個人免疫球蛋白基因區(qū)段,用于產(chǎn)生具有非人脊椎動物恒定區(qū)和人可變區(qū)的嵌合抗體、或嵌合輕或重鏈的庫集;

      其中(i)第一轉(zhuǎn)基因基因座包含一個或多個人免疫球蛋白v基因區(qū)段、一個或多個人j基因區(qū)段和任選存在的一個或多個人d基因區(qū)段,(ii)第二轉(zhuǎn)基因基因座包含一個或多個人免疫球蛋白v基因區(qū)段、一個或多個人j基因區(qū)段和任選存在的一個或多個人d基因區(qū)段;和(iii)其中所述第一基因座的第一(任選v)基因區(qū)段和所述第二基因座的第二(任選v)基因區(qū)段是不同的,并且分別衍生自第一和第二人類個體的基因組,其中所述個體是不同的;和任選是無關(guān)的;

      任選地其中所述第一和第二基因座在所述基因組中的不同染色體上(任選地具有相同染色體編號的染色體);

      任選地其中每個免疫球蛋白基因座所包含的超過功能性v基因區(qū)段的天然人互補體;和/或

      任選地其中每個免疫球蛋白基因座所包含的超過功能性d基因區(qū)段的天然人互補體;和/或

      任選地其中每個免疫球蛋白基因座所包含的超過功能性j基因區(qū)段的天然人互補體。

      構(gòu)建根據(jù)本發(fā)明的細胞(例如es細胞)的方法,所述方法包括:

      (a)鑒定(或所述)第一人類個體的基因組序列的功能性v和j(和任選d)基因區(qū)段;

      (b)鑒定(或所述)第二人類個體的基因組序列的一個或多個功能性v和/或d和/或j基因區(qū)段;其中這些另外的基因區(qū)段未在第一個體的基因組序列中發(fā)現(xiàn);

      (c)和在細胞中構(gòu)建轉(zhuǎn)基因免疫球蛋白基因座,其中(a)和(b)的基因區(qū)段在可操作地連接恒定區(qū)上游的基因座中提供。

      在一個實施方案中,步驟(b)中的一個或多個基因區(qū)段由選自1000genomes、ensembl、genbank和imgt數(shù)據(jù)庫的免疫球蛋白基因數(shù)據(jù)庫鑒定。

      本文中,genbank是genbank發(fā)行版本號185.0或191.0的提及;1000genomes數(shù)據(jù)庫是2012年3月16日的第1期,發(fā)行版本v3;ensembl數(shù)據(jù)庫是匯編grch37.p8(10/04/2012);imgt數(shù)據(jù)庫在www.imgt.org處可獲得。

      在一個實施方案中,第一和第二人類個體分別是第一和第二種族群體的成員,其中所述群體是不同的,任選地其中衍生自第二個體的基因組序列的人免疫球蛋白基因區(qū)段在第二種族群體中是低頻率的(任選罕見的)。

      本發(fā)明的這一配置還提供制備轉(zhuǎn)基因非人脊椎動物(例如小鼠或大鼠)的方法,所述方法包括:

      (a)通過執(zhí)行上述方法構(gòu)建es細胞(例如小鼠c57bl/6n、c57bl/6j、129s5或129sv品系es細胞);

      (b)將es細胞注入供體非人脊椎動物胚泡(例如小鼠c57bl/6n、c57bl/6j、129s5或129sv品系胚泡)內(nèi);

      (c)將胚泡植入非人脊椎動物代孕母體(例如c57bl/6n、c57bl/6j、129s5或129sv品系小鼠)內(nèi);和

      (d)從所述母體獲得幼崽,其中所述幼崽的基因組包含轉(zhuǎn)基因免疫球蛋白基因座。

      在一個實施方案中,本發(fā)明提供了分離結(jié)合預定抗原(例如細菌或病毒病原體抗原)的抗體的方法,所述方法包括免疫本發(fā)明的非人脊椎動物。

      第二配置

      抗體產(chǎn)生轉(zhuǎn)基因細胞的文庫,所述細胞的基因組共同編碼抗體庫集,其中

      (a)第一轉(zhuǎn)基因細胞表達具有由第一免疫球蛋白基因編碼的鏈的第一抗體,該基因包含在第一人未重排免疫球蛋白基因區(qū)段重組后產(chǎn)生的第一可變結(jié)構(gòu)域核苷酸序列;

      (b)第二轉(zhuǎn)基因細胞表達具有由第二免疫球蛋白基因編碼的鏈的第二抗體,該第二基因包含在第二人未重排免疫球蛋白基因區(qū)段重組后產(chǎn)生的第二可變結(jié)構(gòu)域核苷酸序列,該第一和第二抗體是不相同的;

      (c)第一和第二基因區(qū)段是不同的且分別衍生自第一和第二人類個體的基因組序列,其中所述個體是不同的;和任選是無關(guān)的;

      (d)其中所述細胞是非人脊椎動物(例如小鼠或大鼠)細胞。

      在一個實施方案中,第一和第二人類個體分別是第一和第二種族群體的成員,其中所述群體是不同的;任選地其中所述種族群體選自1000genomes數(shù)據(jù)庫中鑒定的那些。

      在另一個實施方案中,第二人免疫球蛋白基因區(qū)段是第一人免疫球蛋白基因區(qū)段的多態(tài)性變體;任選地其中第二基因區(qū)段選自下表1–7和9–14(例如選自表13或表14)中任一個中的基因區(qū)段,例如第二基因區(qū)段是vh1-69的多態(tài)性變體。

      第三配置

      分離的抗體,其具有

      (a)由核苷酸序列編碼的重鏈,所述核苷酸序列通過在轉(zhuǎn)基因非人脊椎動物動物中未重排的人免疫球蛋白v基因區(qū)段與人d和人j區(qū)段重組后產(chǎn)生,任選伴隨在所述細胞中的親和力成熟,其中所述基因區(qū)段之一衍生自來自第一人類種族群體的個體的基因組,并且其他兩個基因區(qū)段衍生自來自第二不同人類種族群體的個體的基因組,并且其中抗體包含所述非人脊椎動物的重鏈恒定區(qū)(例如嚙齒類動物、小鼠或大鼠重鏈恒定區(qū));和/或

      (b)由核苷酸序列編碼的輕鏈,所述核苷酸序列通過在轉(zhuǎn)基因非人脊椎動物動物中未重排的人免疫球蛋白v基因區(qū)段與人j區(qū)段重組后產(chǎn)生,任選伴隨在所述細胞中的親和力成熟,其中所述基因區(qū)段之一衍生自來自第一人類種族群體(任選與(a)中的第一群體相同)的個體的基因組,并且其他基因區(qū)段衍生自來自第二不同人類種族群體(任選與(a)中的第二群體相同)的個體的基因組,并且其中抗體包含所述非人脊椎動物的輕鏈恒定區(qū)(例如嚙齒類動物、小鼠或大鼠輕鏈恒定區(qū));

      (c)任選地,其中抗體的每個可變結(jié)構(gòu)域是人可變結(jié)構(gòu)域。

      (d)任選地,其中重鏈恒定區(qū)是γ型恒定區(qū)。

      本發(fā)明還提供了編碼抗體的分離的核苷酸序列,任選地其中序列在抗體表達載體中、任選在宿主細胞中提供。

      本發(fā)明還提供了產(chǎn)生人抗體的方法,所述方法包括用人抗體恒定區(qū)置換第三配置的抗體的非人脊椎動物恒定區(qū)。

      本發(fā)明還提供了藥物組合物,其包含根據(jù)第三配置的抗體、或根據(jù)上述方法產(chǎn)生的抗體和稀釋劑、賦形劑或載體;任選地,其中組合物在與iv針或注射器連接的容器或者iv袋中提供。

      本發(fā)明還提供了抗體生產(chǎn)細胞,其表達在任意配置中所述的第二抗體。

      在可替代配置中,本發(fā)明考慮第一和第二免疫球蛋白基因區(qū)段(例如特定人類種系vh或vl基因區(qū)段的兩種或更多種多態(tài)性變體)的核苷酸序列的組合,以提供合成基因區(qū)段。在一個實施方案中,此類合成基因區(qū)段用于構(gòu)建轉(zhuǎn)基因免疫球蛋白基因座,其中合成基因區(qū)段與可操作地連接恒定區(qū)上游的一個或多個人可變和j區(qū)(和任選存在的一個或多個人d區(qū))組合提供。當在非人脊椎動物或細胞(例如小鼠或大鼠細胞,例如es細胞)的基因組中提供時,本發(fā)明提供了超人基因區(qū)段多樣性。待組合的序列可以選自這樣的基因區(qū)段,其已觀察到在針對特定抗原(例如流感抗原,例如血凝素)產(chǎn)生的人抗體中是常用的。通過組合所述序列,合成基因區(qū)段可以在體內(nèi)重組,以產(chǎn)生非常適合于治療和/或預防由所述抗原介導的疾病或狀況(例如流感)的抗體。

      第四配置

      非人脊椎動物(任選小鼠或大鼠)或脊椎動物細胞,其基因組包含位于恒定區(qū)上游的免疫球蛋白重鏈基因座,其包含人基因區(qū)段jh6*02、一個或多個vh基因區(qū)段和一個或多個d基因區(qū)段;其中重鏈基因座中的基因區(qū)段可操作地連接其恒定區(qū),從而使得小鼠能夠產(chǎn)生由人jh6*02與d區(qū)段和vh區(qū)段重組產(chǎn)生的抗體重鏈。

      非人脊椎動物細胞(任選小鼠細胞或大鼠細胞),其基因組包含免疫球蛋白重鏈基因座,其包含位于恒定區(qū)上游的人基因區(qū)段jh6*02、一個或多個vh基因區(qū)段和一個或多個d基因區(qū)段;其中重鏈基因座中的基因區(qū)段可操作地連接其恒定區(qū),用于產(chǎn)生(例如在后續(xù)后代細胞中)由人jh6*02與d區(qū)段和vh區(qū)段重組產(chǎn)生的抗體重鏈。

      從本發(fā)明的脊椎動物中分離的重鏈(例如由抗體包含的),其中所述重鏈包含具有至少20個氨基酸的hcdr3。

      用于產(chǎn)生對靶抗原特異性的重鏈、vh結(jié)構(gòu)域或抗體的方法,所述方法包括用抗原免疫本發(fā)明的非人脊椎動物,且分離對靶抗原特異性的重鏈、vh結(jié)構(gòu)域或抗體或者產(chǎn)生所述重鏈、vh結(jié)構(gòu)域或抗體的細胞,其中所述重鏈、vh結(jié)構(gòu)域或抗體包含衍生自人jh6*02與vh基因區(qū)段和d基因區(qū)段重組的hcdr3。

      由該方法產(chǎn)生的重鏈、vh結(jié)構(gòu)域或抗體。

      表達重鏈vh結(jié)構(gòu)域的b細胞或雜交瘤,所述重鏈vh結(jié)構(gòu)域與重鏈的vh結(jié)構(gòu)域相同。

      核酸,其編碼權(quán)利要求22、23或28的重鏈的vh結(jié)構(gòu)域或編碼所述重鏈。

      載體(例如cho細胞或hek293細胞載體),其包含所述核酸;任選地其中所述載體在宿主細胞(例如cho細胞或hek293細胞)中。

      藥物組合物,其包含所述抗體、重鏈或vh結(jié)構(gòu)域(例如由抗體包含的),連同藥學可接受的賦形劑、稀釋劑或藥物(例如進一步的抗原特異性可變結(jié)構(gòu)域、重鏈或抗體)。

      上文抗體、重鏈或vh結(jié)構(gòu)域(例如由抗體包含的)用于醫(yī)學。

      上文抗體、重鏈或vh結(jié)構(gòu)域(例如由抗體包含的)在制造用于治療和/或預防人中醫(yī)學狀況的藥物中的用途。

      第五配置

      產(chǎn)生抗體重鏈的方法,所述方法包括:

      (a)提供抗原特異性重鏈可變結(jié)構(gòu)域;和

      (b)組合所述可變結(jié)構(gòu)域與人重鏈恒定區(qū)以產(chǎn)生包含(在n至c末端方向)可變結(jié)構(gòu)域和恒定區(qū)的抗體重鏈;

      其中

      人重鏈恒定區(qū)是ighg1ref、ighg2ref、ighg2a、ighg3ref、ighg3a、ighg3b、ighg4ref或ighg4a恒定區(qū)。

      包含人重鏈的抗體,該重鏈包含對于抗原特異性的可變結(jié)構(gòu)域和恒定區(qū),所述恒定區(qū)是ighg1ref、ighg2ref、ighg2a、ighg3ref、ighg3a、ighg3b、ighg4ref或ighg4a恒定區(qū)。任選地,所述可變結(jié)構(gòu)域包含小鼠aid模式體細胞突變。

      多肽,其包含(在n至c末端方向)前導序列、對于抗原特異性的人可變結(jié)構(gòu)域和人恒定區(qū),所述人恒定區(qū)為ighg1ref、ighg2ref、ighg2a、ighg3ref、ighg3a、ighg3b、ighg4ref或ighg4a恒定區(qū),其中(i)所述前導序列不是天然人可變結(jié)構(gòu)域前導序列;和/或(ii)所述可變結(jié)構(gòu)域包含小鼠aid模式體細胞突變和/或小鼠末端脫氧核苷酸轉(zhuǎn)移酶(tdt)模式連接突變。

      核苷酸序列,其編碼(在5'到3'方向)前導序列和人抗體重鏈,該重鏈包含對于抗原特異性的可變結(jié)構(gòu)域和恒定區(qū),所述恒定區(qū)是ighg1ref、ighg2ref、ighg2a、ighg3ref、ighg3a、ighg3b、ighg4ref或ighg4a恒定區(qū);并且所述前導序列對于所述重鏈表達是可操作的,并且其中所述前導序列不是天然人可變結(jié)構(gòu)域前導序列。

      核苷酸序列,其編碼(在5'到3'方向)啟動子和人抗體重鏈,該重鏈包含對于抗原特異性的可變結(jié)構(gòu)域和恒定區(qū),所述恒定區(qū)是ighg1ref、ighg2ref、ighg2a、ighg3ref、ighg3a、ighg3b、ighg4ref或ighg4a恒定區(qū);并且啟動子對于所述重鏈表達是可操作的,并且其中所述啟動子不是天然人啟動子。

      載體(例如cho細胞或hek293細胞載體),其包含ighg1ref、ighg2ref、ighg2a、ighg3ref、ighg3a、ighg3b、ighg4ref或ighg4a恒定區(qū)核苷酸序列,其為用于插入人抗體重鏈可變結(jié)構(gòu)域核苷酸序列的克隆位點的3',從而使得在此類可變結(jié)構(gòu)域序列插入后,所述載體包含(在5'到3'方向)啟動子、前導序列、可變結(jié)構(gòu)域序列和恒定區(qū)序列,從而使得當存在于宿主細胞中時,所述載體能夠表達人抗體重鏈。

      第六配置

      具有基因組的非人脊椎動物(例如小鼠或大鼠)或非人脊椎動物細胞(例如es細胞或b細胞),所述基因組包含相同類型的至少3個人可變區(qū)基因區(qū)段(例如至少3個人vh6-1基因區(qū)段、至少3個人jh6基因區(qū)段、至少3個人vκ1-39基因區(qū)段、至少3個人d2-2基因區(qū)段或至少3個人jκ1基因區(qū)段),其中所述人基因區(qū)段中的至少兩個是彼此不相同的變體。

      具有基因組的非人脊椎動物(例如小鼠或大鼠)或非人脊椎動物細胞(例如es細胞或b細胞),所述基因組包含在相同ig基因座處順式的相同類型的至少2個不同的非內(nèi)源可變區(qū)基因區(qū)段(例如至少2個人vh6-1基因區(qū)段、至少3個人jh6基因區(qū)段、至少2個人vκ1-39基因區(qū)段、至少2個人d2-2基因區(qū)段或至少2個人jκ1基因區(qū)段)。

      具有基因組的非人脊椎動物(例如小鼠或大鼠)或非人脊椎動物細胞(例如es細胞或b細胞),所述基因組包含在相同ig基因座處反式的相同類型的至少2個不同的人可變區(qū)基因區(qū)段(例如至少2個人vh6-1基因區(qū)段、至少2個人jh6基因區(qū)段、至少2個人vκ1-39基因區(qū)段、至少2個人d2-2基因區(qū)段或至少2個人jκ1基因區(qū)段);和任選存在的相同類型的第三人基因區(qū)段,其中所述第三基因區(qū)段與所述2個不同基因區(qū)段之一是順式的。

      包含人可變區(qū)基因區(qū)段的庫集的非人脊椎動物(例如小鼠或大鼠)群體,其中所述多個包含相同類型的至少2個人可變區(qū)基因區(qū)段(例如至少2個人vh6-1基因區(qū)段、至少2個人jh6基因區(qū)段、至少2個人vκ1-39基因區(qū)段、至少2個人d2-2基因區(qū)段或至少2個人jκ1基因區(qū)段),所述不同基因區(qū)段中的第一個在群體的第一脊椎動物的基因組中提供,并且所述不同基因區(qū)段中的第二個在群體的第二脊椎動物的基因組中提供,其中所述第一脊椎動物的基因組不包含所述第二基因區(qū)段。

      具有基因組的非人脊椎動物(例如小鼠或大鼠)或非人脊椎動物細胞(例如es細胞或b細胞),所述基因組包含相同類型的至少2個不同的非內(nèi)源可變區(qū)基因區(qū)段(例如至少2個人vh6-1基因區(qū)段、至少2個人jh6基因區(qū)段、至少2個人vκ1-39基因區(qū)段、至少2個人d2-2基因區(qū)段或至少2個人jκ1基因區(qū)段),其中所述基因區(qū)段衍生自不同人類個體的基因組序列,所述人類個體在至少3代以上是遺傳學不相關(guān)的。

      增強非人脊椎動物(例如小鼠或大鼠)的人免疫球蛋白基因多樣性的方法,所述方法包括給脊椎動物提供基因組,所述基因組包含相同類型的至少3個人可變區(qū)基因區(qū)段(例如至少3個人vh6-1基因區(qū)段、至少3個人jh6基因區(qū)段、至少3個人vκ1-39基因區(qū)段、至少3個人d2-2基因區(qū)段或至少3個人jκ1基因區(qū)段),其中所述人基因區(qū)段中的至少兩個是彼此不相同的變體。

      增強非人脊椎動物(例如小鼠或大鼠)的免疫球蛋白基因多樣性的方法,所述方法包括給脊椎動物提供基因組,所述基因組包含在相同ig基因座處順式的相同類型的至少2個不同的非內(nèi)源可變區(qū)基因區(qū)段(例如至少2個人vh6-1基因區(qū)段、至少2個人jh6基因區(qū)段、至少2個人vκ1-39基因區(qū)段、至少2個人d2-2基因區(qū)段或至少2個人jκ1基因區(qū)段)。

      增強非人脊椎動物(例如小鼠或大鼠)的免疫球蛋白基因多樣性的方法,所述方法包括給脊椎動物提供基因組,所述基因組包含在相同ig基因座處反式的相同類型的至少2個不同的人可變區(qū)基因區(qū)段(例如至少2個人vh6-1基因區(qū)段、至少2個人jh6基因區(qū)段、至少2個人vκ1-39基因區(qū)段、至少2個人d2-2基因區(qū)段或至少2個人jκ1基因區(qū)段);和任選存在的相同類型的第三人基因區(qū)段,其中所述第三基因區(qū)段與所述2個不同基因區(qū)段之一是順式的。

      提供增強的人免疫球蛋白可變區(qū)基因區(qū)段庫集的方法,所述方法包括提供包含人可變區(qū)基因區(qū)段的庫集的非人脊椎動物(例如小鼠或大鼠)群體,其中所述方法包括提供相同類型的至少2個不同的人可變區(qū)基因區(qū)段(例如至少2個人vh6-1基因區(qū)段、至少2個人jh6基因區(qū)段、至少2個人vκ1-39基因區(qū)段、至少2個人d2-2基因區(qū)段或至少2個人jκ1基因區(qū)段),其中所述不同基因區(qū)段中的第一個在群體的第一脊椎動物的基因組中提供,并且所述不同基因區(qū)段中的第二個在群體的第二脊椎動物的基因組中提供,其中所述第一脊椎動物的基因組不包含所述第二基因區(qū)段。

      增強非人脊椎動物(例如小鼠或大鼠)的人免疫球蛋白基因多樣性的方法,所述方法包括給脊椎動物提供基因組,所述基因組包含相同類型的至少2個不同的非內(nèi)源可變區(qū)基因區(qū)段(例如至少2個人vh6-1基因區(qū)段、至少2個人jh6基因區(qū)段、至少2個人vκ1-39基因區(qū)段、至少2個人d2-2基因區(qū)段或至少2個人jκ1基因區(qū)段),其中所述基因區(qū)段衍生自不同人類個體的基因組序列,所述人類個體在至少3代以上是遺傳學不相關(guān)的。

      增強非人脊椎動物(例如小鼠或大鼠)的人免疫球蛋白基因多樣性的方法,所述方法包括給脊椎動物提供基因組,所述基因組包含相同類型的至少2個人可變區(qū)基因區(qū)段(例如至少2個人vh6-1基因區(qū)段、至少2個人jh6基因區(qū)段、至少2個人vκ1-39基因區(qū)段、至少2個人d2-2基因區(qū)段或至少2個人jκ1基因區(qū)段),其中所述基因區(qū)段衍生自不同人類個體的基因組序列,所述人類個體在至少3代以上是遺傳學不相關(guān)的;任選地其中所述不同基因區(qū)段中的至少2或3個在所述基因組中的相同ig基因座處提供。

      具有基因組的非人脊椎動物(例如小鼠或大鼠)或非人脊椎動物細胞(例如es細胞或b細胞),所述基因組包含相同類型的第一和第二人ig基因座基因區(qū)段(例如第一和第二人jh6基因區(qū)段;或第一和第二人igg2基因區(qū)段;或第一和第二人jλ7基因區(qū)段),其中所述第一基因區(qū)段是選自表1和9–14(例如選自表13或表14)中任何一個的基因區(qū)段(例如ighj6-a),并且所述第二基因區(qū)段是相應參考序列。

      非人脊椎動物(例如小鼠或大鼠)群體,其包含相同類型的第一和第二人ig基因座基因區(qū)段(例如第一和第二人jh6基因區(qū)段;或第一和第二人igg2基因區(qū)段;或第一和第二人jλ7基因區(qū)段),其中所述第一基因區(qū)段是選自表1和9–14(例如選自表13或表14)中任何一個的基因區(qū)段(例如ighj6-a),并且所述第二基因區(qū)段是相應參考序列,其中所述第一基因區(qū)段在群體的第一脊椎動物的基因組中提供,并且所述第二基因區(qū)段在群體的第二脊椎動物的基因組中提供。

      增強非人脊椎動物(例如小鼠或大鼠)的人免疫球蛋白基因多樣性的方法,所述方法包括給脊椎動物提供基因組,所述基因組包含相同類型的第一和第二人ig基因座基因區(qū)段(例如第一和第二人jh6基因區(qū)段;或第一和第二igg2基因區(qū)段;或第一和第二人jλ7基因區(qū)段),其中所述第一基因區(qū)段是選自表1和9–14(例如選自表13或表14)中任何一個的基因區(qū)段(例如ighj6-a),并且所述第二基因區(qū)段是相應參考序列。

      在這一配置的一個方面,本發(fā)明涉及如下文進一步描述的人d基因區(qū)段變體。

      在這一配置的一個方面,本發(fā)明涉及如下文進一步描述的人v基因區(qū)段變體。

      在這一配置的一個方面,本發(fā)明涉及如下文進一步描述的人j基因區(qū)段變體。

      附圖說明

      圖1–3:示意性舉例說明用于產(chǎn)生重組工程(recombineered)bac載體的方案,以將v基因區(qū)段加入小鼠基因組內(nèi);

      圖4:示意性舉例說明使用順序重組酶介導的盒式交換(srmce)用于將v基因區(qū)段加入小鼠基因組內(nèi)的方案;和

      圖5(以4個部分):僅顯示可變(v)編碼區(qū)的13種ighv1-69變體的比對。不同于vh1-69變體*01的核苷酸在適當位置處指出,而相同核苷酸用破折號標記。當核苷酸變化導致氨基酸差異時,編碼的氨基酸顯示在相應三聯(lián)體上方。如指出的,加框區(qū)域?qū)赾dr1、cdr2和cdr3。

      圖6示意性舉例說明基因區(qū)段多樣性和根據(jù)本發(fā)明順式包括變體的作用:

      (a)在正常個人中的情況:在相同染色體上的重組限制變體的組合,例如抗體基因v4-4可以僅在變體1內(nèi)重組以形成例如v4-4-d-j6或v4-4-d-j2a。類似地,變體v4-4a不能與來自變體1的j6或j2a重組并且僅能夠與來自變體2的j基因連接以形成v4-4a-d-j6a和v4-4a-d-j2。v4-4-j2/j6復雜性=4。

      (b)在轉(zhuǎn)基因小鼠中的情況:僅提供一種變體,因此基因組是有限的。v4-4-j6/j2復雜性=2。

      (c)本發(fā)明的超級小鼠:變體順式加入并且因此可以以每一個組合重組,擴展庫集。例如,v4-4可以與j6a、j6、j2a或j2重組并且類似地,v4-4a可以與這些相同j基因重組。v4-4-j6/j2復雜性=8,其在這一簡單例子中是個人復雜性的兩倍,并且是具有單個變體的小鼠復雜性的4x。

      圖7:人jh6*02變體的比對。不同于jh6*01的核苷酸在適當位置處指出,而相同氨基酸用破折號標記。當核苷酸變化導致氨基酸差異時,編碼的氨基酸顯示在上方。登記號(例如j00256)顯示于imgt變體名稱左側(cè)。

      圖8:來自多個物種的jh序列的比對。

      圖9:密碼子表

      圖10:bac數(shù)據(jù)庫提取物

      附表說明

      表1:人ighv多態(tài)性變體

      表2:人ighd多態(tài)性變體

      表3:人ighj多態(tài)性變體

      表4:人igvk多態(tài)性變體

      表5:人igvλ多態(tài)性變體

      表6:人ighjk多態(tài)性變體

      表7:人ighjλ多態(tài)性變體

      表8:1000基因組計劃人類群體

      表9:在針對感染性疾病病原體的人抗體應答中的免疫球蛋白基因使用

      表10a:人ighjh5變體出現(xiàn)

      表10b:非同義人ighjh5變體

      表11a:人ighjh6變體出現(xiàn)

      表11b:非同義人ighjh6變體

      表12a:人ighjh2變體出現(xiàn)

      表12b:非同義人ighjh2變體

      表13:變體頻率分析和人類群體分布

      表14:頻繁的人變體分布

      表15:人基因區(qū)段使用:來自首次用于實驗的非人脊椎動物的重鏈庫集

      表16:人基因區(qū)段使用:來自免疫的非人脊椎動物的重鏈庫集

      表17:人基因區(qū)段使用:來自抗原特異性雜交瘤的重鏈庫集

      表18:序列關(guān)聯(lián)表

      表19:與人γ恒定區(qū)亞型關(guān)聯(lián)的功能概括

      表20:在少數(shù)人類群體中流行的基因區(qū)段

      表21:基因組和序列信息

      具體實施方式

      用于本發(fā)明的jh6*02及其他人dna序列的合適來源對于技術(shù)人員將是顯而易見的。例如,能夠從同意的人供體(例如按照本文實施例的頰拭子樣品)中收集dna樣品,由其可以獲得合適的dna序列用于構(gòu)建本發(fā)明的基因座。如技術(shù)人員已知的,人dna的其他來源是商購可得的。可替代地,技術(shù)人員能夠通過參考本文公開的人ig基因區(qū)段序列的一個或多個數(shù)據(jù)庫來構(gòu)建基因區(qū)段序列。

      關(guān)于根據(jù)本發(fā)明的人v、d和j基因區(qū)段的示例來源是得自roswellparkcancerinstitute(rpci)/invitrogen的細菌人工染色體(rpci-11bac)。參見http://bacpac.chori.org/hmale11.htm,其如下描述了bac:

      "rpci-11人男性bac文庫

      rpci-11人男性bac文庫(osoegawa等人,2001)使用由kazutoyoosoegawa開發(fā)的改善的克隆技術(shù)(osoegawa等人,1998)進行構(gòu)建。該文庫由kazutoyoosoegawa生成。構(gòu)建通過來自nationalhumangenomeresearchinstitute(nhgri,nih)(#1r01rg01165-03)的基金資助。該文庫根據(jù)新的nhgri/doe"guidanceonhumansubjectsinlarge-scalednasequencing...來生成

      “男性血液經(jīng)由雙盲法選擇方案來獲得。男性血液dna從一個隨機選擇的供體(在10個男性供體中)中分離”。

      ·osoegawak,mammoserag,wuc,frengene,zengc,catanesejj,dejongpj;genomeres.2001mar;11(3):483-96;"abacterialartificialchromosomelibraryforsequencingthecompletehumangenome";

      ·osoegawa,k.,woon,p.y.,zhao,b.,frengen,e.,tateno,m.,catanese,j.j和dejong,p.j.(1998);"animprovedapproachforconstructionofbacterialartificialchromosomelibraries";genomics52,1-8.

      超人免疫球蛋白基因庫集

      本發(fā)明涉及合成擴展和種族多樣的超人免疫球蛋白基因庫集。人免疫球蛋白庫集超出在自然界中發(fā)現(xiàn)的那些(即“超人的”),例如,它們比天然人庫集更多樣或它們包含以并非自然的方式來自不同來源的人免疫球蛋白基因區(qū)段的組合。因此,本發(fā)明的庫集是“超人”免疫球蛋白庫集,并且本發(fā)明涉及這些在轉(zhuǎn)基因細胞和非人脊椎動物中的應用,用于產(chǎn)生嵌合抗體(具有使用重組dna技術(shù)將這些轉(zhuǎn)換成全人分離抗體的可能性)。本發(fā)明因此提供了新型和潛在擴展的合成免疫球蛋白多樣性,其提供可以從其中選擇人抗體治療劑前導物(抗體治療劑和抗體工具試劑)的多樣性庫。這開放了轉(zhuǎn)基因人-小鼠/大鼠技術(shù)詢問與迄今為止能夠的不同和可能更大的抗體序列空間的可能性的潛力。為此,在一個實施方案中,本發(fā)明提供了superhumanmousetm(也稱為supra-mousetm)和superhumanrattm(也稱為supra-rattm)。

      在開發(fā)這一想法中,本發(fā)明人已認識到由于諸如hapmapproject、1000genomesproject和各種各樣其他免疫球蛋白基因數(shù)據(jù)庫(關(guān)于更多細節(jié)參見下文)的努力,采掘技術(shù)人員現(xiàn)在可獲得的巨大遺傳資源的可能性。因此,在一些實施方案中,本發(fā)明人認識到這些基因組測序發(fā)展在本發(fā)明中的應用,以生成合成產(chǎn)生和種族多樣的人工免疫球蛋白基因庫集。在一個方面,本發(fā)明人認識到此類庫集可用于產(chǎn)生具有改善的親和力和/或生物物理學特征的抗體,和/或其中借助于此類庫集產(chǎn)生的表位特異性范圍是新型的,提供了針對迄今為止由現(xiàn)有轉(zhuǎn)基因免疫球蛋白基因座難解決或難以針對的表位的抗體。

      本發(fā)明提供了文庫、脊椎動物和細胞,例如轉(zhuǎn)基因小鼠或大鼠或者轉(zhuǎn)基因小鼠或大鼠細胞。此外,本發(fā)明涉及使用脊椎動物分離抗體或編碼抗體的核苷酸序列的方法。本發(fā)明還提供了抗體、核苷酸序列、藥物組合物和用途。

      變異分析

      本發(fā)明人已認識到利用遺傳變異分析的能力的方法和抗體基因座設(shè)計。參考人基因組提供了用于人樣品的實驗工作和遺傳分析的基礎(chǔ)。參考人是來自少數(shù)個體的基因組的匯集,并且對于基因組的任何一個區(qū)段,關(guān)于兩個染色體之一的高質(zhì)量單個參考基因組是可獲得的。因為參考基因組由一系列非常大型的插入克隆裝配,所以這些克隆的身份是已知的。相應地,使用人基因組dna的實驗工作通常對參考序列由其衍生的克隆進行。

      個別人在其序列中不同,并且近期幾個個體已測序其基因組,例如jameswatson和craigventer。這些個體的基因組序列的比較已揭示在基因組的編碼和非編碼部分中其序列和參考基因組之間的差異,大約1000個堿基中的1個是不同的。一些變體將是有意義的并且促成個體間差異。在極端情況下,這些將導致遺傳疾病。變異可以牽涉對施用于人類患者的藥物的不同應答,例如獲得針對治療的患者應答的不希望有的降低。

      1000-genomesproject具有鑒定人基因組中最頻繁變異的目的。這一公共領(lǐng)域計劃涉及測序來自不同種族群的超過1000個個體的基因組,比較這些序列與參考,并且裝配變體目錄。這已使編碼區(qū)中的變體注釋成為可能,但因為該序列未衍生自dna的大克隆,所以來自二倍體個體的序列分析不能區(qū)分母系和父系遺傳的染色體之間的變異分布。當在蛋白質(zhì)編碼基因中鑒定超過一種變體時,不能闡明蛋白質(zhì)的每種形式中的變體分布模式。例如,如果在個體中的相同蛋白質(zhì)的不同位置中檢測到兩種變體,則這可以導致具有兩種變體的一個拷貝和另一個中無變體,或每個拷貝可以僅具有一種變體。為了闡明真實蛋白質(zhì)的序列,1000-genomeproject已測序母代-父代體-子代三體組。這允許使序列變體“分階段”,換言之鑒定由一個或另一個親本遺傳的序列塊且使變體解卷積。

      為了進一步理解在1000-基因組集合內(nèi)的變異,已開發(fā)了工具,其可以鑒定來自1000基因組數(shù)據(jù)集中的分階段數(shù)據(jù)的dna區(qū)域的顯著變體(定義為非同義氨基酸變化)。該工具已可在線獲得http://www.1000genomes.org/variation-pattern-finder。該工具允許研究者下載在特定坐標之間分隔的非同義變異。下載文件配置為個體基因型,但數(shù)據(jù)是分階段的,因此可以提取不同群體中的單倍型信息和特定單倍型的頻率。

      本發(fā)明人的1000-基因組數(shù)據(jù)關(guān)于來自重和輕鏈的c、vd和j基因的個別人編碼區(qū)段分析揭示在這些區(qū)段中存在顯著變異。個體通常具有兩個不同的重鏈等位基因,以及在κ和λ基因座處的不同輕鏈等位基因??梢杂擅總€等位基因生成的抗體庫集將是不同的。該變異將促成對某些抗原更好或不同的免疫應答。

      迄今為止已用免疫球蛋白重和輕鏈基因座生成的人源化小鼠含有僅一個類型的免疫球蛋白基因座。即使這些小鼠含有全人重鏈基因座,變異也將小于通常人中含有的,因為僅可獲得一組c、v、d和j基因,而通常人將含有兩組。

      本發(fā)明人已設(shè)計改善當構(gòu)建轉(zhuǎn)基因非人脊椎動物和細胞用于體內(nèi)人抗體和可變區(qū)生產(chǎn)時的這種局限性的方法。

      可以生成具有兩個不同基因座的小鼠,每個基因座工程化為具有v、d和j區(qū)段的不同庫集。這可以在單個小鼠或者兩個或更多個分開小鼠品系中,并且將類似于或超出在正常人中發(fā)現(xiàn)的庫集。此類小鼠的工程化將超越在迄今為止的僅具有一組等位基因的人源化小鼠中所述的庫集。

      然而,本發(fā)明人也認識到這也具有局限性,因為不同基因座通常將不相互作用以改組基因座之間的v、d和j變體。該相同局限性在人中也是固有的,因此該系統(tǒng)不利用所有組合的重組變體的優(yōu)點。

      為了超越人中的正常庫集并且利用c、v、d和j變體的組合的優(yōu)點,在一個實施方案中,本發(fā)明人決定提供以順式在相同染色體上的這些變體。參見圖6。這些基因座特征在于具有超過正常數(shù)目的j、d或v基因。例如,對于j基因,n=6,但包括一個j6變體和一個j2變體將使這增加至n=8。例如,這可以與關(guān)于d和v基因的另外變體組合。通過1000-genomes數(shù)據(jù)庫的詳細分析,本發(fā)明人已設(shè)計候選多態(tài)人變體基因區(qū)段例如jh基因區(qū)段(例如參見實施例)的集合,其可以構(gòu)建到小鼠中的轉(zhuǎn)基因重和輕鏈基因座的設(shè)計內(nèi),用于表達越來越多樣和新的合成人可變區(qū)庫集。此外,通過利用天然存在的人變體基因區(qū)段,按照本發(fā)明的實施方案,這解決與人類患者的相容性,因為本發(fā)明人的分析已抽出這樣的候選變體,其是天然保守的并且有時在人類種族群體中是非常流行的。另外,這使得能夠定制本發(fā)明的配置以提供更好地針對特定人類種族群體的基于抗體的藥物。

      在根據(jù)本發(fā)明的任何配置的例子中,提供了基因座(以及包含這些的細胞和脊椎動物),在其中使用來自不同人類群體的基因區(qū)段。這是增加抗體基因多樣性所希望的,以更好地針對更多樣的人類患者。在一個例子中,所述基因區(qū)段分別來自第一和第二不同人類群體,并且因此第二基因區(qū)段在第二人類群體中發(fā)現(xiàn),但在第一人類群體中則沒有(或罕見)。罕見意指例如基因區(qū)段在1000genomes數(shù)據(jù)庫中的第一群體中的5、4、3、2或1或零個個體中發(fā)現(xiàn)。例如,所述第一基因區(qū)段可以通過參考本文的表13或14顯示為存在于第一群體中,第二基因區(qū)段可以通過參考表13顯示為存在于第二群體中而不存在于第一群體中。任選地,所述第一基因區(qū)段還可以通過參考表13或14顯示為存在于第二群體中。

      在本發(fā)明的任何配置或方面,當使用v基因區(qū)段時,這可以任選與天然前導序列一起使用。例如,基因組dna(例如來自如實施例中的bac)的使用將意指天然前導區(qū)將用于摻入本發(fā)明的基因座和基因組內(nèi)的每個v基因區(qū)段。在替代方案中,技術(shù)人員將希望插入非天然前導序列連同v基因區(qū)段中的一個或多個。類似地,在本發(fā)明的任何配置或方面,當使用v基因區(qū)段時,這可以任選與天然5'utr序列一起使用。例如,基因組dna(例如來自如實施例中的bac)的使用將意指天然5'utr序列將用于摻入本發(fā)明的基因座和基因組內(nèi)的每個v基因區(qū)段。在替代方案中,技術(shù)人員可能希望排除天然5'utr序列。

      在第一配置中,本發(fā)明提供了

      (a)超人重鏈基因庫集

      非人脊椎動物或脊椎動物細胞(任選es細胞或抗體生產(chǎn)細胞),其包含具有超人免疫球蛋白重鏈人vh和/或d和/或j基因庫集的基因組。

      在一個方面,本發(fā)明的細胞是胚胎干細胞。例如,es細胞衍生自小鼠c57bl/6n、c57bl/6j、129s5或129sv品系。在一個方面,非人脊椎動物是嚙齒類動物,適當?shù)匦∈?,并且本發(fā)明的細胞是嚙齒類動物細胞或es細胞,適當?shù)匦∈骵s細胞。本發(fā)明的es細胞可以使用本領(lǐng)域眾所周知的技術(shù)用于生成動物,所述技術(shù)包括將es細胞注射到胚泡內(nèi),隨后將嵌合胚泡植入雌性內(nèi)以產(chǎn)生后代,所述后代可以進行育種且選擇具有所需插入的純合重組體。在一個方面,本發(fā)明涉及包含es細胞衍生的組織和宿主胚胎衍生的組織的轉(zhuǎn)基因動物。在一個方面,本發(fā)明涉及遺傳改變的后代動物,其包括對于vdj和/或vj區(qū)具有純合重組體的動物。

      天然人免疫球蛋白基因區(qū)段庫集由下述組成(參見例如www.imgt.org):

      vh:總共125;有功能的41

      dh:總共27;有功能的23

      jh:總共8;有功能的6

      vk:總共77;有功能的38

      jk:總共5;有功能的5

      vλ:總共75;有功能的31

      jλ:總共7;有功能的5

      在一個實施方案中,脊椎動物或細胞基因組包含轉(zhuǎn)基因免疫球蛋白重鏈基因座,其包含多個人免疫球蛋白vh基因區(qū)段、一個或多個人d基因區(qū)段和一個或多個人j基因區(qū)段,其中所述多個vh基因區(qū)段的組成超過功能性vh基因區(qū)段的天然人庫集;任選地其中所述基因組對于所述轉(zhuǎn)基因重鏈基因座是純合的。

      在脊椎動物或細胞的一個實施方案中,vh基因庫集由下述組成:衍生自第一人類個體的基因組序列的多個vh基因區(qū)段,補充有衍生自第二不同人類個體的基因組序列的一個或多個不同vh基因區(qū)段。任選地,d和j區(qū)段衍生自第一人類個體的基因組序列。任選地,來自第二個體的基因組序列的vh基因區(qū)段選自在表1、13或14中列出的vh基因區(qū)段。以這種方式,基因座提供d基因區(qū)段的超人庫集。

      任選地,個體是無關(guān)的。例如,如果個體之一不在相同代或者回溯一、二、三或四代的其他個體的家譜中出現(xiàn),則個體在本發(fā)明的任何配置或方面的上下文中是“無關(guān)的”。可替代地,例如,如果它們在目前這一代或者回溯一、二、三或四代中不共享共同祖先,則它們是無關(guān)的。

      在脊椎動物或細胞的一個實施方案中,轉(zhuǎn)基因基因座包含超過41個功能性人vh基因區(qū)段種類,并且因此包含超過天然的人功能庫集。任選地,所述基因座包含至少42、43、44、45、46、47、48、49或50個功能性人vh基因區(qū)段種類(例如,其中所述基因座包含所述第一個體的全部功能性vh庫集,補充有衍生自第二人類個體的基因組序列的一個或多個vh基因區(qū)段且任選補充有衍生自第三人類個體的基因組序列的一個或多個vh基因區(qū)段)。以這種方式,所述基因座提供vh基因區(qū)段的超人庫集,其可用于生成新型基因和抗體多樣性用于治療和工具抗體選擇。

      在脊椎動物或細胞的一個實施方案中,所述轉(zhuǎn)基因基因座包含衍生自第一個體的基因組序列的第一vh基因區(qū)段和衍生自第二個體的基因組序列的第二vh基因區(qū)段,其中所述第二vh基因區(qū)段是第一vh基因區(qū)段的多態(tài)性變體。例如,vh基因區(qū)段是如下文實施例中舉例說明的vh1-69的多態(tài)性變體。任選地,所述基因座包含第一vh基因區(qū)段的進一步多態(tài)性變體(例如衍生自第三人類個體的基因組序列的變體)。以這種方式,所述基因座提供vh基因區(qū)段的超人庫集。

      在脊椎動物或細胞的一個實施方案中,基因組(對于超人vh多樣性可替代或另外地)包含轉(zhuǎn)基因免疫球蛋白重鏈基因座,其包含多個人免疫球蛋白vh基因區(qū)段、多個人d基因區(qū)段和一個或多個人j基因區(qū)段,其中所述多個d基因區(qū)段的組成超過功能性d基因區(qū)段的天然人庫集。任選地,所述基因組對于所述轉(zhuǎn)基因重鏈基因座是純合的。

      在脊椎動物或細胞的一個實施方案中,d基因庫集由下述組成:衍生自(或所述)第一人類個體的基因組序列的多個d基因區(qū)段,補充有衍生自(或所述)第二不同人類個體的基因組序列的一個或多個不同d基因區(qū)段。任選地,所述個體是無關(guān)的。任選地,j區(qū)段衍生自第一人類個體的基因組序列。任選地,來自第二個體的基因組序列的d基因區(qū)段選自在表2、13或14中列出的d基因區(qū)段。以這種方式,所述基因座提供d基因區(qū)段的超人庫集。

      在脊椎動物或細胞的一個實施方案中,轉(zhuǎn)基因基因座包含超過23個功能性人d基因區(qū)段種類;任選地,其中所述基因座包含至少24、25、26、27、28、29、30或31個功能性人d基因區(qū)段種類(例如,其中所述基因座包含所述第一個體的全部功能性d庫集,補充有衍生自第二人類個體的基因組序列的一個或多個d基因區(qū)段且任選補充有衍生自第三人類個體的基因組序列的一個或多個d基因區(qū)段)。以這種方式,所述基因座提供d基因區(qū)段的超人庫集。

      在脊椎動物或細胞的一個實施方案中,轉(zhuǎn)基因基因座包含衍生自第一個體的基因組序列的第一d基因區(qū)段和衍生自第二個體的基因組序列的第二d基因區(qū)段,其中所述第二d基因區(qū)段是第一d基因區(qū)段的多態(tài)性變體。任選地,所述基因座包含第一d基因區(qū)段的進一步多態(tài)性變體(例如衍生自第三人類個體的基因組序列的變體)。以這種方式,所述基因座提供d基因區(qū)段的超人庫集。

      在脊椎動物或細胞(對于超人vh和/或jh多樣性可替代或另外地)的一個實施方案中,基因組包含(或所述)轉(zhuǎn)基因免疫球蛋白重鏈基因座,其包含多個人免疫球蛋白vh基因區(qū)段、一個或多個人d基因區(qū)段和多個人jh基因區(qū)段,其中所述多個j基因區(qū)段的組成超過功能性j基因區(qū)段的天然人庫集;任選地,其中所述基因組對于所述轉(zhuǎn)基因重鏈基因座是純合的。

      在脊椎動物或細胞的一個實施方案中,jh基因庫集由下述組成:衍生自(或所述)第一人類個體的基因組序列的多個j基因區(qū)段,補充有衍生自(或所述)第二不同人類個體的基因組序列的一個或多個不同j基因區(qū)段。任選地,所述個體是無關(guān)的。任選地,d區(qū)段衍生自第一人類個體的基因組序列。任選地,來自第二個體的基因組序列的j基因區(qū)段選自在表3、13或14中列出的j基因區(qū)段。以這種方式,所述基因座提供jh基因區(qū)段的超人庫集。

      在脊椎動物或細胞的一個實施方案中,轉(zhuǎn)基因基因座包含超過6個功能性人jh基因區(qū)段。任選地,所述基因座包含至少7、8、9、10、11、12、13、14、15或16個功能性人jh基因區(qū)段(例如,其中所述基因座包含所述第一個體的全部功能性jh庫集,補充有衍生自第二人類個體的基因組序列的一個或多個jh基因區(qū)段且任選補充有衍生自第三人類個體的基因組序列的一個或多個jh基因區(qū)段)。以這種方式,所述基因座提供jh基因區(qū)段的超人庫集。

      在脊椎動物或細胞的一個實施方案中,轉(zhuǎn)基因基因座包含衍生自第一個體的基因組序列的第一jh基因區(qū)段和衍生自第二個體的基因組序列的第二jh基因區(qū)段,其中所述第二jh基因區(qū)段是第一jh基因區(qū)段的多態(tài)性變體。任選地,所述基因座包含第一jh基因區(qū)段的進一步多態(tài)性變體(例如衍生自第三人類個體的基因組序列的變體)。以這種方式,所述基因座提供jh基因區(qū)段的超人庫集。

      (b)超人輕鏈基因庫集

      本發(fā)明的第一配置還提供了:

      非人脊椎動物或脊椎動物細胞(任選es細胞或抗體生產(chǎn)細胞),其包含具有超人免疫球蛋白輕鏈人vl基因庫集的基因組。任選地,該脊椎動物或細胞包含根據(jù)第一配置的方面(a)的重鏈轉(zhuǎn)基因。因此,超人多樣性在細胞和脊椎動物中的重和輕鏈免疫球蛋白基因區(qū)段兩者中提供。例如,細胞或脊椎動物的基因組對于重和輕鏈轉(zhuǎn)基因是純合的并且內(nèi)源抗體表達失活。此類脊椎動物可用于用預定抗原免疫以產(chǎn)生一種或多種所選抗體,其結(jié)合所述抗原且具有得自超人基因區(qū)段庫集內(nèi)的重組的人可變區(qū)。這潛在提供了從其中選擇治療、預防和工具抗體的新型抗體和基因序列空間。

      在第一配置的方面(b)的一個實施方案中,脊椎動物或細胞基因組包含

      (i)轉(zhuǎn)基因免疫球蛋白κ輕鏈基因座,其包含多個人免疫球蛋白vκ基因區(qū)段和一個或多個人j基因區(qū)段,其中所述多個vκ基因區(qū)段的組成超過功能性vκ基因區(qū)段的天然人庫集;任選地,其中所述基因組對于所述轉(zhuǎn)基因κ輕鏈基因座是純合的;和/或

      (ii)轉(zhuǎn)基因免疫球蛋白λ輕鏈基因座,其包含多個人免疫球蛋白vλ基因區(qū)段和一個或多個人j基因區(qū)段,其中所述多個vλ基因區(qū)段的組成超過功能性vλ基因區(qū)段的天然人庫集;任選地,其中所述基因組對于所述轉(zhuǎn)基因λ輕鏈基因座是純合的。

      以這種方式,所述基因座提供vl基因區(qū)段的超人庫集。

      在脊椎動物或細胞的一個實施方案中,

      (i)vκ基因庫集由下述組成:衍生自第一人類個體的基因組序列的多個vκ基因區(qū)段,補充有衍生自第二不同人類個體的基因組序列的一個或多個vκ基因區(qū)段;任選地,其中所述個體是無關(guān)的;任選地,其中j區(qū)段衍生自第一人類個體的基因組序列;和任選地,其中來自第二個體的基因組序列的vκ基因區(qū)段選自在表4、13或14中列出的vκ基因區(qū)段;和

      (i)vλ基因庫集由下述組成:衍生自第一人類個體的基因組序列的多個vλ基因區(qū)段,補充有衍生自第二不同人類個體的基因組序列的一個或多個vλ基因區(qū)段;任選地,其中所述個體是無關(guān)的;任選地,其中j區(qū)段衍生自第一人類個體的基因組序列;和任選地,其中來自第二個體的基因組序列的vλ基因區(qū)段選自在表5、13或14中列出的vλ基因區(qū)段。

      以這種方式,所述基因座提供vl基因區(qū)段的超人庫集。

      在脊椎動物或細胞的一個實施方案中,

      -κ輕鏈轉(zhuǎn)基因基因座包含超過38個功能性人vκ基因區(qū)段種類;任選地,其中所述基因座包含至少39、40、41、42、43、44、45、46、47或48個功能性人vκ基因區(qū)段種類(例如,其中所述基因座包含所述第一個體的全部功能性vκ庫集,補充有衍生自第二人類個體的基因組序列的一個或多個vκ基因區(qū)段且任選補充有衍生自第三人類個體的基因組序列的一個或多個vκ基因區(qū)段);和

      -λ輕鏈轉(zhuǎn)基因基因座包含超過31個功能性人vλ基因區(qū)段種類;任選地,其中所述基因座包含至少32、33、34、35、36、37、38、39、40或41個功能性人vλ基因區(qū)段種類(例如,其中所述基因座包含所述第一個體的全部功能性vλ庫集,補充有衍生自第二人類個體的基因組序列的一個或多個vλ基因區(qū)段且任選補充有衍生自第三人類個體的基因組序列的一個或多個vλ基因區(qū)段)。

      以這種方式,所述基因座提供vl基因區(qū)段的超人庫集。

      在脊椎動物或細胞的一個實施方案中,

      -κ輕鏈轉(zhuǎn)基因基因座包含衍生自第一個體的基因組序列的第一vκ基因區(qū)段和衍生自第二個體的基因組序列的第二vκ基因區(qū)段,其中所述第二vκ基因區(qū)段是第一vκ基因區(qū)段的多態(tài)性變體;任選地,其中所述基因座包含第一vκ基因區(qū)段的進一步多態(tài)性變體(例如衍生自第三人類個體的基因組序列的變體);和

      -λ輕鏈轉(zhuǎn)基因基因座包含衍生自第一個體的基因組序列的第一vλ基因區(qū)段和衍生自第二個體的基因組序列的第二vλ基因區(qū)段,其中所述第二vλ基因區(qū)段是第一vλ基因區(qū)段的多態(tài)性變體;任選地,其中所述基因座包含第一vλ基因區(qū)段的進一步多態(tài)性變體(例如衍生自第三人類個體的基因組序列的變體)。

      以這種方式,所述基因座提供vl基因區(qū)段的超人庫集。

      在脊椎動物或細胞的一個實施方案中,基因組包含(或所述)轉(zhuǎn)基因免疫球蛋白輕鏈基因座,其包含多個人免疫球蛋白vl基因區(qū)段和多個人jl基因區(qū)段,其中所述多個j基因區(qū)段的組成超過功能性j基因區(qū)段的天然人庫集;任選地,其中所述基因組對于所述轉(zhuǎn)基因重鏈基因座是純合的。

      在脊椎動物或細胞的一個實施方案中,

      (i)jκ基因庫集由下述組成:衍生自(或所述)第一人類個體的基因組序列的多個jκ基因區(qū)段,補充有衍生自(或所述)第二不同人類個體的基因組序列的一個或多個jκ基因區(qū)段;任選地,其中所述個體是無關(guān)的;任選地,其中vκ區(qū)段衍生自第一人類個體的基因組序列;任選地,其中來自第二個體的基因組序列的jκ基因區(qū)段選自在表6、13或14中列出的jκ基因區(qū)段;和

      (ii)jκ基因庫集由下述組成:衍生自(或所述)第一人類個體的基因組序列的多個jλ基因區(qū)段,補充有衍生自(或所述)第二不同人類個體的基因組序列的一個或多個jλ基因區(qū)段;任選地,其中所述個體是無關(guān)的;任選地,其中vλ區(qū)段衍生自第一人類個體的基因組序列;任選地,其中來自第二個體的基因組序列的jλ基因區(qū)段選自在表7、13或14中列出的jλ基因區(qū)段。

      以這種方式,所述基因座提供jl基因區(qū)段的超人庫集。

      在脊椎動物或細胞的一個實施方案中,

      (i)轉(zhuǎn)基因輕鏈基因座包含超過5個功能性人jκ基因區(qū)段種類;任選地,其中所述基因座包含至少6、7、8、9、10、11、12、13、14或15個功能性人jκ基因區(qū)段種類(例如,其中所述基因座包含所述第一個體的全部功能性jκ庫集,補充有衍生自第二人類個體的基因組序列的一個或多個jκ基因區(qū)段且任選補充有衍生自第三人類個體的基因組序列的一個或多個jκ基因區(qū)段);和/或

      (i)轉(zhuǎn)基因輕鏈基因座包含超過5個功能性人jλ基因區(qū)段種類;任選地,其中所述基因座包含至少6、7、8、9、10、11、12、13、14或15個功能性人jλ基因區(qū)段種類(例如,其中所述基因座包含所述第一個體的全部功能性jλ庫集,補充有衍生自第二人類個體的基因組序列的一個或多個jλ基因區(qū)段且任選補充有衍生自第三人類個體的基因組序列的一個或多個jλ基因區(qū)段)。

      以這種方式,所述基因座提供jl基因區(qū)段的超人庫集。

      在脊椎動物或細胞的一個實施方案中,

      (i)κ輕鏈轉(zhuǎn)基因基因座包含衍生自第一個體的基因組序列的第一jκ基因區(qū)段和衍生自第二個體的基因組序列的第二jκ基因區(qū)段,其中所述第二jκ基因區(qū)段是第一jκ基因區(qū)段的多態(tài)性變體;任選地,其中所述基因座包含第一jκ基因區(qū)段的進一步多態(tài)性變體(例如衍生自第三人類個體的基因組序列的變體);和

      (ii)λ輕鏈轉(zhuǎn)基因基因座包含衍生自第一個體的基因組序列的第一jλ基因區(qū)段和衍生自第二個體的基因組序列的第二jλ基因區(qū)段,其中所述第二jκ基因區(qū)段是第一jλ基因區(qū)段的多態(tài)性變體;任選地,其中所述基因座包含第一jλ基因區(qū)段的進一步多態(tài)性變體(例如衍生自第三人類個體的基因組序列的變體)。

      以這種方式,所述基因座提供jl基因區(qū)段的超人庫集。

      第一配置的進一步方面在下文描述。

      在第二配置中,本發(fā)明提供了

      其基因組共同編碼抗體庫集的抗體產(chǎn)生轉(zhuǎn)基因細胞的文庫,其中

      (a)第一轉(zhuǎn)基因細胞表達具有由第一免疫球蛋白基因編碼的鏈(例如重鏈)的第一抗體,該基因包含在第一人未重排免疫球蛋白基因區(qū)段(例如vh)重組后產(chǎn)生的第一可變結(jié)構(gòu)域核苷酸序列中;

      (b)第二轉(zhuǎn)基因細胞表達具有由第二免疫球蛋白基因編碼的鏈(例如重鏈)的第二抗體,該第二基因包含在第二人未重排免疫球蛋白基因區(qū)段(例如vh)重組后產(chǎn)生的第二可變結(jié)構(gòu)域核苷酸序列中,該第一和第二抗體是不相同的;

      (c)第一和第二基因區(qū)段是不同的且分別衍生自第一和第二人類個體的基因組序列,其中所述個體是不同的;和任選是無關(guān)的;

      (d)其中所述細胞是非人脊椎動物(例如小鼠或大鼠)細胞(例如b細胞或雜交瘤)。

      在一個實施方案中,文庫在體外提供。在另一個實施方案中,文庫通過一種或多種轉(zhuǎn)基因非人脊椎動物在體內(nèi)提供。例如,該脊椎動物或每個脊椎動物根據(jù)本發(fā)明的第一配置的任何方面。

      在一個實施方案中,文庫編碼具有10-109種抗體的抗體庫集,例如10、20、30、40、50、100或1000-108;或10、20、30、40、50、100或1000-107;或10、20、30、40、50、100或1000-106;或10、20、30、40、50、100或1000-105;或10、20、30、40、50、100或1000-104種抗體。在一個例子中,文庫編碼具有至少103、104、105、106、107、108、109或1010種抗體的抗體庫集。

      第一可變結(jié)構(gòu)域核苷酸序列在第一人未重排免疫球蛋白基因區(qū)段與一個或多個其他免疫球蛋白基因區(qū)段(例如人免疫球蛋白基因區(qū)段)重組后產(chǎn)生。例如,當?shù)谝换騾^(qū)段是vh時,第一可變結(jié)構(gòu)域核苷酸序列(vh結(jié)構(gòu)域)在vh與人d和jh區(qū)段在第一轉(zhuǎn)基因細胞或其祖先中體內(nèi)重組后產(chǎn)生,任選伴隨體細胞超變。例如,當?shù)谝换騾^(qū)段是vl時,第一可變結(jié)構(gòu)域核苷酸序列(vl結(jié)構(gòu)域)在vl與人jl區(qū)段在第一轉(zhuǎn)基因細胞或其祖先中體內(nèi)重組后產(chǎn)生,任選伴隨體細胞超變。

      第二可變結(jié)構(gòu)域核苷酸序列在第二人未重排免疫球蛋白基因區(qū)段與一個或多個其他免疫球蛋白基因區(qū)段(例如人免疫球蛋白基因區(qū)段)重組后產(chǎn)生。例如,當?shù)诙騾^(qū)段是vh時,第二可變結(jié)構(gòu)域核苷酸序列(vh結(jié)構(gòu)域)在vh與人d和jh區(qū)段在第二轉(zhuǎn)基因細胞或其祖先中體內(nèi)重組后產(chǎn)生,任選伴隨體細胞超變。例如,當?shù)诙騾^(qū)段是vl時,第二可變結(jié)構(gòu)域核苷酸序列(vl結(jié)構(gòu)域)在vl與人jl區(qū)段在第二轉(zhuǎn)基因細胞或其祖先中體內(nèi)重組后產(chǎn)生,任選伴隨體細胞超變。

      所述第一和第二基因區(qū)段分別衍生自第一和第二人類個體的基因組序列。在一個例子中,此類基因區(qū)段從樣品細胞中分離或克隆,所述樣品細胞使用如技術(shù)人員已知的標準分子生物學技術(shù)取自所述個體?;騾^(qū)段的序列可以在本發(fā)明中使用前進行突變(例如通過引入高達5、6、7、8、9、10、11、12、13、14或15個核苷酸變化)。在另一個例子中,基因區(qū)段通過在數(shù)據(jù)庫中鑒定候選人免疫球蛋白基因區(qū)段而衍生(參見下文指導)并且編碼用于本發(fā)明的基因區(qū)段的核苷酸序列通過參考(例如與參考序列相同或具有高達5、6、7、8、9、10、11、12、13、14或15個核苷酸變化的突變體)數(shù)據(jù)庫序列進行制備。技術(shù)人員將知道通過參考數(shù)據(jù)庫或通過得自細胞樣品來獲得核苷酸序列的方法。

      在本發(fā)明的任何配置的脊椎動物、細胞或文庫的一個實施方案中,所述第一和第二人類個體分別是第一和第二種族群體的成員,其中所述群體是不同的。因此,這提供了在按照本發(fā)明的轉(zhuǎn)基因基因座、細胞和脊椎動物中的超人基因多樣性。

      人類群體

      任選地,種族群體選自1000genomesproject數(shù)據(jù)庫中鑒定的那些。在這方面,參見表8,其提供1000genomes基因組數(shù)據(jù)庫基于其的種族群體的細節(jié)。

      narosenberg等人(science20december2002:第298卷no.56022342-2343)研究不同地理祖先的人類群體的遺傳結(jié)構(gòu)??傊?,取樣52個群體,這些是具有下述的群體:

      非洲祖先

      (姆巴提俾格米人、biaka俾格米人、和說尼日爾-科爾多凡語言的人(班圖人、約魯巴人或mandenka群體),

      歐亞祖先

      (歐洲祖先(奧克尼人、阿地蓋人、巴斯克人、法國人、俄羅斯人、意大利人、撒丁島人、托斯卡尼人)、中東祖先(莫札比特人、貝多因人、德魯茲人、巴勒斯坦人),

      中/南亞祖先(俾路支人、brahul、莫克蘭人、信德人、帕坦人、布魯肖人、哈扎拉人、維吾爾人、卡拉什人)),

      東亞祖先

      (漢人、傣人(dal)、達斡爾人、赫哲人、拉祜人、苗人、鄂倫春人、畬人、土家人、土人、錫伯人、彝人、蒙古人、納西人、柬埔寨人、日本人、雅庫特人)、大洋洲祖先(美拉尼西亞人、巴布亞人);或

      美洲祖先

      (卡利吉亞納人、蘇瑞人、哥倫比亞人、瑪雅人、比馬人)。

      internationalhapmapproject,nature,2003dec18;426(6968):789-96公開了hapmapproject的目標:通過測定來自具有來自非洲、亞洲和歐洲部分的祖先的群體的dna樣品中的一百萬或更多種序列變體的基因型、其頻率和它們之間的相關(guān)程度來測定人基因組中的dna序列變異的常見模式。不同地理祖先的有關(guān)人類群體包括約魯巴人、日本人、中國人、北歐和西歐群體。更具體而言:

      具有北歐或西歐祖先的猶他州群體(樣品在1980年由centred'etudedupolymorphismehumain(ceph)收集);

      具有來自尼日利亞伊巴丹的約魯巴人祖先的群體;

      具有日本人祖先的群體;和

      具有來自中國的中國漢人祖先的群體。

      該作者引用較早出版物提出祖先地理是用于取樣人類群體的合理基礎(chǔ)。

      從中選擇在本發(fā)明中使用的群體的人類群體的合適樣品如下:

      (a)歐洲祖先

      (b)北歐祖先;西歐祖先;托斯卡尼祖先;英國人祖先、芬蘭祖先或伊比利亞祖先。

      (c)更具體而言,具有北歐和/或西歐祖先的猶他州居民群體;意大利的托斯卡尼群體;英格蘭和/或蘇格蘭的英國人群體;芬蘭的芬蘭群體;或西班牙的伊比利亞群體。

      (a)東亞祖先

      (b)日本人祖先;中國人祖先或越南人祖先。

      (c)更具體而言,日本東京的日本人群體;中國北京的中國漢人群體;西雙版納的中國傣人群體;越南胡志明市的京人群體;或美國科羅拉多州丹佛市的中國人群體。

      (a)西非祖先

      (b)約魯巴人祖先;盧西亞人祖先;岡比亞人祖先;或馬拉維人祖先。

      (c)更具體而言,尼日利亞伊巴丹的約魯巴人群體;肯尼亞webuye的盧西亞人群體;岡比亞西區(qū)分區(qū)的岡比亞人群體;或馬拉維布蘭太爾的馬拉維人群體。

      (a)美洲群體

      (b)美洲原住民祖先;加勒比黑人祖先;墨西哥人祖先;波多黎各祖先;哥倫比亞祖先;或秘魯祖先。

      (c)更具體而言,美國西南部的非洲祖先群體;密西西比州杰克遜的非裔美國人群體;巴巴多斯的非洲加勒比人群體;加利福尼亞州洛杉磯的墨西哥人祖先群體;波多黎各的波多黎各人群體;哥倫比亞麥德林的哥倫比亞人群體;或秘魯利馬的秘魯人群體。

      (a)南亞祖先

      (b)阿洪姆人祖先;卡亞斯塔人(kayadtha)祖先;reddy祖先;馬拉地人;或旁遮普人祖先。

      (c)更具體而言,印度阿薩姆邦的阿洪姆人群體;印度加爾各答的卡亞斯塔人群體;印度海德拉巴的reddy群體;印度孟買的馬拉地人群體;或巴基斯坦拉合爾的旁遮普人群體。

      在本發(fā)明的任何配置中,在一個實施方案中,每個人類群體選自上文標記“(a)”的群體。

      在本發(fā)明的任何配置中,在另一個實施方案中,每個人類群體選自上文標記“(b)”的群體。

      在本發(fā)明的任何配置中,在另一個實施方案中,每個人類群體選自上文標記“(c)”的群體。

      在本發(fā)明的脊椎動物文庫、細胞或文庫的一個實施方案中,所述第一和第二種族群體選自具有歐洲祖先的種族群體、具有東亞祖先的種族群體、具有西非祖先的種族群體、具有美洲祖先的種族群體和具有南亞祖先的種族群體。

      在本發(fā)明的脊椎動物文庫、細胞或文庫的一個實施方案中,所述第一和第二種族群體選自具有北歐祖先的種族群體;或具有西歐祖先的種族群體;或具有托斯卡尼祖先的種族群體;或具有英國人祖先的種族群體;或具有冰島祖先的種族群體;或具有芬蘭祖先的種族群體;或具有伊比利亞祖先的種族群體;或具有日本人祖先的種族群體;或具有中國人祖先的種族群體;或越南人祖先的種族群體;或具有約魯巴人祖先的種族群體;或具有盧西亞人祖先的種族群體;或具有岡比亞人祖先的種族群體;或具有馬拉維人祖先的種族群體;或具有美洲原住民祖先的種族群體;或具有加勒比黑人祖先的種族群體;或具有墨西哥人祖先的種族群體;或具有波多黎各人祖先的種族群體;或具有哥倫比亞人祖先的種族群體;或具有秘魯人祖先的種族群體;或具有阿洪姆人祖先的種族群體;或具有卡亞斯塔人祖先的種族群體;或具有reddy祖先的種族群體;或具有馬拉地人的種族群體;或具有旁遮普人祖先的種族群體。

      在本發(fā)明的脊椎動物、細胞或文庫的任何配置的一個實施方案中,衍生自第二個體的基因組序列的人免疫球蛋白基因區(qū)段在第二種族群體中是低頻率的(任選罕見的)。任選地,人免疫球蛋白基因區(qū)段在第二人類群體中,例如如在1000genomes數(shù)據(jù)庫中,具有0.5%-5%、任選小于0.5%的次要等位基因頻率(minorallelefrequency,maf)(累積頻率)。

      在本發(fā)明的脊椎動物、細胞或文庫的任何配置的一個實施方案中,第一可變區(qū)核苷酸序列通過第一人免疫球蛋白基因區(qū)段與第一j基因區(qū)段和任選存在的第一d基因區(qū)段的重組產(chǎn)生,其中所述第一人免疫球蛋白基因區(qū)段是v基因區(qū)段并且v、d和j區(qū)段衍生自第一人類群體,任選來自第一人類群體的一個個體的基因組。

      在本發(fā)明的脊椎動物文庫、細胞或文庫的一個實施方案中,第二可變區(qū)核苷酸序列通過第二人免疫球蛋白基因區(qū)段與第二j基因區(qū)段和任選存在的第二d基因區(qū)段的重組產(chǎn)生,其中第二人免疫球蛋白基因區(qū)段是衍生自第二群體的v基因區(qū)段并且d和/或j區(qū)段衍生自第一人類群體,任選地d和j基因區(qū)段來自第一人類群體的一個個體的基因組。

      在本發(fā)明的脊椎動物文庫、細胞或文庫的一個實施方案中,已與所述第一和第二v基因區(qū)段重組的所有d和j區(qū)段均為衍生自第一人類群體的d和j區(qū)段,任選地d和j基因區(qū)段來自第一人類群體的一個個體的基因組。

      在文庫的一個實施方案中,所述第二人免疫球蛋白基因區(qū)段是第一人免疫球蛋白基因區(qū)段的多態(tài)性變體;任選地,其中所述第二基因區(qū)段選自表1–7和9–14(例如選自表13或表14)中任一個中的基因區(qū)段。

      在文庫的一個實施方案中,所述第一和第二人免疫球蛋白基因區(qū)段是兩個(i)vh基因區(qū)段;(ii)d區(qū)段;(iii)j區(qū)段(任選地兩個jh區(qū)段、兩個jκ區(qū)段或兩個jλ區(qū)段);(iv)恒定區(qū)(任選兩個γ恒定區(qū),任選兩個cγ-1恒定區(qū));(v)ch1區(qū);(vi)ch2區(qū);或(vii)ch3區(qū)。

      所述文庫是例如首次用于實驗的并且任選具有10或102-109種細胞的文庫大小。例如,10、20、30、40、50、100或1000-108;或10、20、30、40、50、100或1000-107;或10、20、30、40、50、100或1000-106;或10、20、30、40、50、100或1000-105;或10、20、30、40、50、100或1000-104種細胞。

      所述文庫例如已針對預定抗原進行選擇并且任選具有10或102-109種細胞的文庫大小。例如,10、20、30、40、50、100或1000-108;或10、20、30、40、50、100或1000-107;或10、20、30、40、50、100或1000-106;或10、20、30、40、50、100或1000-105;或10、20、30、40、50、100或1000-104種細胞。

      在本發(fā)明的文庫的一個實施方案中,所述第一和第二細胞分別是第一和第二祖先非人脊椎動物細胞的后代,其中所述第一祖先細胞包括包含所述第一人免疫球蛋白基因區(qū)段的基因組;并且所述第二祖先細胞包括包含所述第二人免疫球蛋白基因區(qū)段的基因組。

      本發(fā)明進一步提供了抗體產(chǎn)生轉(zhuǎn)基因細胞的文庫,其基因組共同編碼抗體庫集,其中所述文庫包含上文描述的第一和第二祖先細胞。

      本發(fā)明進一步提供了雜交瘤細胞文庫,其通過本發(fā)明的文庫(例如b細胞文庫)與融合配偶體細胞融合產(chǎn)生并且任選具有10或102-109種細胞的文庫大小。例如,10、20、30、40、50、100或1000-108;或10、20、30、40、50、100或1000-107;或10、20、30、40、50、100或1000-106;或10、20、30、40、50、100或1000-105;或10、20、30、40、50、100或1000-104種細胞。雜交瘤的產(chǎn)生是技術(shù)人員眾所周知的。融合配偶體的例子是sp2/0-g14(得自ecacc)、p3xs3-ag8.s53(得自lgcstandards;crl-1580)、ns1和ns0細胞。如常規(guī)的,可以執(zhí)行peg融合或電融合。

      在第三配置中,本發(fā)明提供了:

      分離的抗體,其具有

      (a)由核苷酸序列編碼的重鏈,所述核苷酸序列在轉(zhuǎn)基因非人脊椎動物動物中未重排的人免疫球蛋白v基因區(qū)段與人d和人j區(qū)段重組后產(chǎn)生,任選伴隨所述細胞中的親和力成熟,其中所述基因區(qū)段之一(例如vh)衍生自來自第一人類種族群體的個體的基因組,并且其他兩個基因區(qū)段(例如d和jh)衍生自來自第二(例如分別為第二和第三)不同人類種族群體的個體的基因組,并且其中所述抗體包含所述非人脊椎動物的重鏈恒定區(qū)(例如嚙齒類動物、小鼠或大鼠重鏈恒定區(qū))(例如cγ);和/或

      (b)由核苷酸序列編碼的輕鏈,所述核苷酸序列在轉(zhuǎn)基因非人脊椎動物動物中未重排的人免疫球蛋白v基因區(qū)段與人j區(qū)段重組后產(chǎn)生,任選伴隨所述細胞中的親和力成熟,其中所述基因區(qū)段之一(例如vl)衍生自來自第一人類種族群體(任選與(a)中的第一群體相同)的個體的基因組,并且其他基因區(qū)段(例如jl)衍生自來自第二不同人類種族群體(任選與(a)中的第二群體相同)的個體的基因組,并且其中所述抗體包含所述非人脊椎動物的輕鏈恒定區(qū)(例如嚙齒類動物、小鼠或大鼠重鏈恒定區(qū));

      (c)任選地,其中抗體的每個可變結(jié)構(gòu)域是人可變結(jié)構(gòu)域。

      (d)任選地,其中所述重鏈恒定區(qū)是μ或γ型恒定區(qū)。

      本發(fā)明還提供了編碼第三配置的抗體的分離的核苷酸序列,任選地其中所述序列在抗體表達載體中、任選在宿主細胞中提供。合適的載體是哺乳動物表達載體(例如cho細胞載體或hek293細胞載體)、酵母載體(例如用于在巴斯德畢赤酵母(picchiapastoris)中表達的載體,或細菌表達載體,例如用于大腸桿菌(e.coli)表達的載體。

      本發(fā)明還提供了產(chǎn)生人抗體的方法,所述方法包括用人抗體恒定區(qū)(例如公開于表13或18中的c變體)置換第三配置的抗體的非人脊椎動物恒定區(qū)。技術(shù)人員將知道實現(xiàn)這點的標準分子生物學技術(shù)。例如,關(guān)于標準免疫,參見harlow,e.&lane,d.1998,第5版,antibodies:alaboratorymanual,coldspringharborlab.press,plainview,ny;以及pasqualini和arap,proceedingsofthenationalacademyofsciences(2004)101:257-259??贵w的可變區(qū)與人恒定區(qū)的連接可以通過本領(lǐng)域容易獲得的技術(shù)實現(xiàn),例如使用對于技術(shù)人員顯而易見的常規(guī)重組dna和rna技術(shù)。參見例如sambrook,j和russell,d.(2001,第3版)molecularcloning:alaboratorymanual(coldspringharborlab.press,plainview,ny)。

      在一個實施方案中,該方法包括進一步制備所述抗體的突變體或衍生物。

      本發(fā)明還提供了藥物組合物,其包含根據(jù)第三配置的抗體、或本發(fā)明的人抗體和稀釋劑、賦形劑或載體;任選地,其中所述組合物在與iv針或注射器連接的容器或者iv袋中提供。

      本發(fā)明還提供了抗體生產(chǎn)細胞(例如哺乳動物細胞,例如cho或hek293;酵母細胞例如巴斯德畢赤酵母;細菌細胞例如大腸桿菌;b細胞或雜交瘤),其表達第三配置的第二抗體或本發(fā)明的分離的抗體。

      本發(fā)明的第一配置還提供了:

      非人脊椎動物或脊椎動物細胞(任選es細胞或抗體生產(chǎn)細胞),其基因組包含轉(zhuǎn)基因免疫球蛋白基因座(例如重鏈基因座或輕鏈基因座),所述基因座包含上文與第三配置結(jié)合描述的根據(jù)第一和第二人免疫球蛋白基因區(qū)段(任選v區(qū)段)的免疫球蛋白基因區(qū)段。所述基因區(qū)段可操作地連接免疫球蛋白恒定區(qū)的上游;任選地,其中基因組對于所述轉(zhuǎn)基因免疫球蛋白基因座是純合的。

      任選地,所述免疫球蛋白基因座所包含的超過功能性v基因區(qū)段的天然人互補體;和/或

      任選地,其中所述免疫球蛋白基因座所包含的超過功能性d基因區(qū)段的天然人互補體;和/或

      任選地,其中所述免疫球蛋白基因座所包含的超過功能性j基因區(qū)段的天然人互補體。

      以這種方式,在根據(jù)本發(fā)明的轉(zhuǎn)基因非人脊椎動物或脊椎動物細胞中提供超人免疫球蛋白基因庫集。

      第一配置還提供了:

      轉(zhuǎn)基因非人脊椎動物(例如小鼠或大鼠)或脊椎動物細胞(任選es細胞或抗體生產(chǎn)細胞),其基因組包含轉(zhuǎn)基因免疫球蛋白基因座,所述基因座包含可操作地連接非人脊椎動物恒定區(qū)的上游的多個免疫球蛋白基因區(qū)段,用于產(chǎn)生具有非人脊椎動物恒定區(qū)和人可變區(qū)的嵌合抗體、或嵌合輕或重鏈的庫集;其中所述轉(zhuǎn)基因基因座包含一個或多個人免疫球蛋白v基因區(qū)段、一個或多個人j基因區(qū)段和任選存在的一個或多個人d基因區(qū)段,所述基因區(qū)段中的第一個(任選v區(qū)段)和所述基因區(qū)段中的第二個(任選v區(qū)段)是不同的并且分別衍生自第一和第二人類個體的基因組,其中所述個體是不同的;和任選是無關(guān)的;

      任選地,其中所述免疫球蛋白基因座所包含的超過功能性v基因區(qū)段的天然人互補體;和/或

      任選地,其中所述免疫球蛋白基因座所包含的超過功能性d基因區(qū)段的天然人互補體;和/或

      任選地,其中所述免疫球蛋白基因座所包含的超過功能性j基因區(qū)段的天然人互補體。

      以這種方式,在根據(jù)本發(fā)明的轉(zhuǎn)基因非人脊椎動物或脊椎動物細胞中提供超人免疫球蛋白基因庫集。

      第一配置還提供了:

      轉(zhuǎn)基因非人脊椎動物(例如小鼠或大鼠)或脊椎動物細胞(任選es細胞或抗體生產(chǎn)細胞),其基因組包含第一和第二轉(zhuǎn)基因免疫球蛋白基因座,每個基因座包含可操作地連接非人脊椎動物恒定區(qū)的上游的多個人免疫球蛋白基因區(qū)段,用于產(chǎn)生具有非人脊椎動物恒定區(qū)和人可變區(qū)的嵌合抗體、或嵌合輕或重鏈的庫集;

      其中(i)所述第一轉(zhuǎn)基因基因座包含一個或多個人免疫球蛋白v基因區(qū)段、一個或多個人j基因區(qū)段和任選存在的一個或多個人d基因區(qū)段,(ii)所述第二轉(zhuǎn)基因基因座包含一個或多個人免疫球蛋白v基因區(qū)段、一個或多個人j基因區(qū)段和任選存在的一個或多個人d基因區(qū)段;和(iii)其中所述第一基因座的第一(任選v)基因區(qū)段和所述第二基因座的第二(任選v)基因區(qū)段是不同的并且分別衍生自第一和第二人類個體的基因組,其中所述個體是不同的;和任選是無關(guān)的;

      任選地,其中所述第一和第二基因座在所述基因組中的不同染色體上(任選地具有相同染色體編號的染色體);

      任選地,其中每個免疫球蛋白基因座所包含的超過功能性v基因區(qū)段的天然人互補體;和/或

      任選地,其中每個免疫球蛋白基因座所包含的超過功能性d基因區(qū)段的天然人互補體;和/或

      任選地,其中每個免疫球蛋白基因座所包含的超過功能性j基因區(qū)段的天然人互補體。

      以這種方式,在根據(jù)本發(fā)明的轉(zhuǎn)基因非人脊椎動物或脊椎動物細胞中提供超人免疫球蛋白基因庫集。

      在第一配置的這些實施方案中,所述免疫球蛋白基因區(qū)段任選如對于第三配置描述的。

      在第一配置的這些實施方案中,基因組任選包含第三免疫球蛋白基因區(qū)段(任選v區(qū)段),所述第三基因區(qū)段衍生自人類個體,所述人類個體不同于第一(以及任選第二)基因區(qū)段衍生自其的個體;任選其中所述第一、第二和第三基因區(qū)段是人免疫球蛋白基因區(qū)段的多態(tài)性變體(例如vh1-69–關(guān)于進一步描述參見實施例)。

      在第一配置的這些實施方案中,脊椎動物或細胞的基因組任選對于第一、第二和任選的第三基因區(qū)段是純合的,其中所述第一、第二和任選的第三基因區(qū)段的拷貝在可操作地連接共同非人脊椎動物恒定區(qū)上游的相同染色體上一起提供。

      例如,每個第一、第二和任選的第三基因區(qū)段是v基因區(qū)段。

      在一個例子中,本發(fā)明的文庫通過非人脊椎動物的集合(任選嚙齒類動物、小鼠或大鼠的集合)提供;任選地,其中所述集合的第一成員產(chǎn)生所述第一抗體而不是所述第二抗體,并且集合的第二成員產(chǎn)生所述第二抗體(但任選不是所述第一抗體)。因此考慮制備非人脊椎動物,其中不同人基因組已用作在脊椎動物中構(gòu)建轉(zhuǎn)基因基因座的來源。例如,第一脊椎動物包含轉(zhuǎn)基因重鏈基因座,其具有僅來自第一(和任選第二)人類群體或個體的基因區(qū)段;第二脊椎動物包含轉(zhuǎn)基因重鏈基因座,其具有僅來自第三(和任選第四)人類群體或個體的基因區(qū)段;并且任選地,基于獨特或重疊的人類群體基因組,可以類似地構(gòu)建第三和更多脊椎動物。然而,當作為轉(zhuǎn)基因脊椎動物的混合群體提供時,混合群體提供大于在天然人庫集中發(fā)現(xiàn)的人免疫球蛋白基因的集合庫。這可用于擴展抗體和基因序列空間超出用具有人免疫球蛋白基因座的現(xiàn)有轉(zhuǎn)基因小鼠和大鼠能夠的那些。如上文解釋的,這些已基于單個人基因組。

      在一個實施方案中,非人脊椎動物的集合具有局限于人類群體的人免疫球蛋白基因,所述人類群體在上文提及的相同群體屬類“(a)”下集合在一起。這提供了偏向產(chǎn)生在群體屬類(a)中流行的人抗體可變區(qū)的基因庫集并且因此可用于生成關(guān)于所述群體成員的抗體治療劑/預防劑??商娲兀攣碜圆煌祟惾后w的基因區(qū)段在根據(jù)本發(fā)明的單個轉(zhuǎn)基因中(不一定在脊椎動物的集合中)提供時,不同人類群體例如在上文提及的相同群體屬類“(a)”下集合在一起。

      本發(fā)明還提供了由根據(jù)本發(fā)明的細胞文庫表達的抗體庫集。

      在本發(fā)明的任何配置的非人脊椎動物或細胞中,在一個例子中,轉(zhuǎn)基因基因座的恒定區(qū)是所述脊椎動物的內(nèi)源恒定區(qū)(例如內(nèi)源小鼠或大鼠恒定區(qū),例如來自與非人脊椎動物自身相同的小鼠或大鼠品系)。

      本發(fā)明還提供了構(gòu)建根據(jù)本發(fā)明的細胞(例如es細胞)的方法,所述方法包括:

      (a)鑒定(或所述)第一人類個體的基因組序列的功能性v和j(和任選存在的d)基因區(qū)段;

      (b)鑒定(或所述)第二人類個體的基因組序列的一個或多個功能性v和/或d和/或j基因區(qū)段;其中這些另外的基因區(qū)段未在第一個體的基因組序列中發(fā)現(xiàn);

      (c)和在細胞中構(gòu)建轉(zhuǎn)基因免疫球蛋白基因座,其中(a)和(b)的基因區(qū)段在可操作地連接恒定區(qū)上游的基因座中提供。

      任選地,細胞包含根據(jù)步驟(a)至(c)構(gòu)建的重鏈基因座和/或根據(jù)步驟(a)至(c)構(gòu)建的輕鏈基因座(κ和/或λ基因座)。

      任選地,細胞對于該轉(zhuǎn)基因基因座或每個轉(zhuǎn)基因基因座是純合的;任選地,其中來自對于所述細胞內(nèi)源的基因座的抗體表達已失活。這可用于使功能性抗體基因庫集和因此的抗體生產(chǎn)局限于具有人可變區(qū)的抗體。

      任選地,步驟(b)中的一個或多個基因區(qū)段從選自1000genomes、ensembl、genbank和imgt數(shù)據(jù)庫的免疫球蛋白基因數(shù)據(jù)庫鑒定。

      任選地,所述第一和第二人類個體分別是第一和第二種族群體的成員,其中所述群體是不同的,任選其中衍生自第二個體的基因組序列的人免疫球蛋白基因區(qū)段在第二種族群體中是低頻率的(任選罕見的)。

      本發(fā)明還提供制備轉(zhuǎn)基因非人脊椎動物(例如小鼠或大鼠)的方法,所述方法包括:

      (a)通過執(zhí)行上述方法構(gòu)建es細胞(例如小鼠c57bl/6n、c57bl/6j、129s5或129sv品系es細胞);

      (b)將es細胞注入供體非人脊椎動物胚泡(例如小鼠c57bl/6n、c57bl/6j、129s5或129sv品系胚泡)內(nèi);

      (c)將胚泡植入非人脊椎動物代孕母體(例如c57bl/6n、c57bl/6j、129s5或129sv品系小鼠)內(nèi);和

      (d)從所述母體獲得幼崽,其中所述幼崽的基因組包含轉(zhuǎn)基因免疫球蛋白基因座。

      本發(fā)明提供了由該方法制備的轉(zhuǎn)基因非人脊椎動物(例如小鼠或大鼠)或其后代。本發(fā)明還提供了此類非人脊椎動物的群體。

      es細胞顯微注射到胚泡內(nèi)和其后生成轉(zhuǎn)基因小鼠是本領(lǐng)域中的常規(guī)實踐,并且技術(shù)人員知道可用于實現(xiàn)這點的技術(shù)。c57bl/6n、c57bl/6j、129s5或129sv小鼠品系和es細胞是可容易公開獲得的。

      本發(fā)明還提供了分離結(jié)合預定抗原(例如細菌或病毒病原體抗原)的抗體的方法,所述方法包括:

      (a)提供根據(jù)本發(fā)明的脊椎動物(任選小鼠或大鼠);

      (b)用所述抗原(任選其中抗原是感染性疾病病原體的抗原)免疫(例如使用標準初免-加強法)所述脊椎動物;

      (c)從脊椎動物中取出b淋巴細胞且選擇表達結(jié)合所述抗原的抗體的一或多個b淋巴細胞;

      (d)任選使所述選擇的b淋巴細胞或其后代永生化,任選通過由其產(chǎn)生雜交瘤進行;和

      (e)分離由所述b淋巴細胞表達的抗體(例如,以及igg型抗體);和

      (f)任選產(chǎn)生所述抗體的衍生物或變體。

      該方法任選在步驟(e)后進一步包括下述步驟:從所述b淋巴細胞中分離編碼結(jié)合所述抗原的所述抗體的核酸;任選用編碼人或人源化重鏈恒定區(qū)的核苷酸序列交換所述抗體的重鏈恒定區(qū)核苷酸序列且任選親和力成熟所述抗體的可變區(qū);和任選將所述核酸插入表達載體和任選宿主內(nèi)。

      免疫球蛋白基因區(qū)段的生物信息學和選擇

      還參見關(guān)于上文變異分析的討論。

      技術(shù)人員將了解人抗體基因序列的來源,例如imgt(www.imgt.org)、genbank(www.ncbi.nlm.nih.gov/genbank)。用于數(shù)據(jù)庫操作的生物信息學工具也是技術(shù)人員可容易獲得和已知的,例如如由1000genomesproject/ebi(www.1000genomes.org)可公開獲得的。

      作為抗體基因區(qū)段序列的來源,技術(shù)人員還將知道下述可用數(shù)據(jù)庫和資源(包括其更新):

      1.1.kabatdatabase(g.johnson和t.t.wu,2002;http://www.kabatdatabase.com)。由e.a.kabat和t.t.wu于1966年創(chuàng)建,kabat數(shù)據(jù)庫公開抗體、t細胞受體、主要組織相容性復合物(mhc)i和ii類分子及其他免疫學感興趣蛋白質(zhì)的比對序列。可搜索界面由seqhuntii工具提供,并且一系列效用可用于序列比對、序列亞組分類和變異性作圖的生成。還參見kabat,e.a.,wu,t.t.,perry,h.,gottesman,k.和foeller,c.(1991)sequencesofproteinsofimmunologicalinterest,第5版,nih公開號91-3242,bethesda,md,其引入本文作為參考,特別是關(guān)于在本發(fā)明中使用的人基因區(qū)段。

      1.2.kabatman(a.c.r.martin,2002;http://www.bioinf.org.uk/abs/simkab.html)。這是對kabat序列數(shù)據(jù)庫作出簡單查詢的網(wǎng)頁界面。

      1.3.imgt,internationalimmunogeneticsinformationm.-p.lefranc,2002;http://imgt.cines.fr)。imgt是整合的信息系統(tǒng),其專注于所有脊椎動物物種的抗體、t細胞受體和mhc分子。它提供標準化數(shù)據(jù)的共同門戶,所述標準化數(shù)據(jù)包括核苷酸和蛋白質(zhì)序列、寡核苷酸引物、基因圖、遺傳多態(tài)性、特異性以及二維(2d)和三維(3d)結(jié)構(gòu)。imgt包括三個序列數(shù)據(jù)庫(imgt/ligm-db、imgt/mhc-db、imgt/primerdb)、一個基因組數(shù)據(jù)庫(imgt/gene-db)、一個3d結(jié)構(gòu)數(shù)據(jù)庫(imgt/3dstructure-db)和一系列網(wǎng)絡(luò)資源("imgtmarie-paulepage")和互動工具。

      1.4.v-base(i.m.tomlinson,2002;http://www.mrc-cpe.cam.ac.uk/vbase)。v-base是由超過一千種公開序列匯集的所有人抗體種系可變區(qū)序列的綜合目錄。它包括比對軟件dnaplot(由hans-helmaralthaus和wernermuller開發(fā))的版本,其允許重排的抗體v基因與其最緊密種系基因區(qū)段的比對。

      1.5.antibodies—structureandsequence(a.c.r.martin,2002;http://www.bioinf.org.uk/abs)。該頁面概括關(guān)于抗體結(jié)構(gòu)和序列的有用信息。它提供了對于kabat抗體序列數(shù)據(jù)的查詢界面、關(guān)于抗體的一般信息、晶體結(jié)構(gòu)和與其他抗體相關(guān)信息的鏈接。它還分配保藏于蛋白質(zhì)數(shù)據(jù)庫(pdb)中的所有抗體結(jié)構(gòu)的自動化概括。特別有利的是關(guān)于抗體可變區(qū)的多種編號方案的充分描述和比較。

      1.6.aaaaa—aho'samazingatlasofantibodyanatomy(a.honegger,2001;http://www.unizh.ch/~antibody)。該資源包括用于結(jié)構(gòu)分析、建模和工程化的工具。它采用用于抗體和t細胞受體序列的綜合結(jié)構(gòu)比對的統(tǒng)一方案,并且包括用于抗體分析的excel宏和圖解表示法。

      1.7.wam—webantibodymodeling(n.whitelegg和a.r.rees,2001;http://antibody.bath.ac.uk)。由在英國的universityofbath的centreforproteinanalysisanddesign托管。使用建立的理論方法的組合,基于abm包(以前由oxfordmolecular銷售)構(gòu)建抗體fv序列的3d模型,該網(wǎng)站還包括最新的抗體結(jié)構(gòu)信息。

      1.8.mike'simmunoglobulinstructure/functionpage(m.r.clark,2001;http://www.path.cam.ac.uk/~mrc7/mikeimages.html)。這些頁面提供關(guān)于免疫球蛋白結(jié)構(gòu)和功能的教育材料,并且由許多彩色圖像、模型和動畫舉例說明。另外的信息在抗體人源化和mikeclark'stherapeuticantibodyhumanhomologyproject上可獲得,其旨在使臨床功效和抗免疫球蛋白應答與治療抗體的可變區(qū)序列關(guān)聯(lián)。

      1.9.theantibodyresourcepage(theantibodyresourcepage,2000;http://www.antibodyresource.com)。該網(wǎng)站將自身描述為“抗體研究和供應商的完整指南”。提供了與氨基酸測序工具、核苷酸抗體測序工具和雜交瘤/細胞培養(yǎng)數(shù)據(jù)庫的鏈接。

      1.9.humanizationbydesign(j.saldanha,2000;http://people.cryst.bbk.ac.uk/~ubcg07s)。該資源提供了關(guān)于抗體人源化技術(shù)的概述。最有用的特點是超過40種公開的人源化抗體的可搜索數(shù)據(jù)庫(通過序列和文本),包括關(guān)于設(shè)計問題、構(gòu)架選擇、構(gòu)架回復突變和人源化構(gòu)建體的結(jié)合親和力的信息。

      還參見antibodyengineeringmethodsandprotocols,ed.bennykclo,methodsinmolecularbiologytm,humanpress。另外,在http://www.blogsua.com/pdf/antibody-engineering-methods-and-protocolsantibody-engineering-methods-and-protocols.pdf處。

      作為基因組序列變異數(shù)據(jù)的來源,技術(shù)人員還將知道下述可用數(shù)據(jù)庫和資源(包括其更新):

      1.hapmap(theinternationalhapmapconsortium.2003;http://hapmap.ncbi.nlm.nih.gov/index.html.en)。hapmapproject是國際計劃,其旨在比較不同個體的遺傳序列以鑒定含有共享的遺傳變體的染色體區(qū)域。hapmapwww網(wǎng)站提供了鑒定染色體區(qū)域和其中的變體的工具,其選項深入到群體水平頻率數(shù)據(jù)。

      2.1000genomes(the1000genomesprojectconsortium2010;http://www.1000genomes.org/)。該資源提供關(guān)于來自25個不同群體組之一的2500個未鑒定個體的完全基因組序列,目的在于鑒定>1%的基因組變體。網(wǎng)站提供利用在線工具(例如'variationpatternfinder')查詢數(shù)據(jù)且下載關(guān)于個別群體組的變體數(shù)據(jù)的能力。

      3.japanesesnpdatabase(h.haga等人2002;http://snp.ims.u-tokyo.ac.jp/index.html)?;阼b定190,562種人遺傳變體的研究,該網(wǎng)站為具有有用特點的基因組變體編目錄,用于搜索和概括數(shù)據(jù)。

      能夠鑒定在免疫球蛋白基因中分類為低頻率的變體或與特定人類種族群體分離的罕見變體。為了該分析的目的,低頻率免疫球蛋白基因區(qū)段分類為在特定人類群體中具有0.5%-5%的‘次要等位基因頻率’(maf)(累積頻率)的基因區(qū)段,罕見變體是分類為在特定人類群體中具有小于0.5%的maf的基因區(qū)段。

      設(shè)想下述生物信息學方案以鑒定用于本發(fā)明的人免疫球蛋白基因區(qū)段:

      (a)鑒定含有目的基因區(qū)段的一個或多個基因組區(qū)域(‘靶基因組區(qū)域’)并且使用匹配由1000genomes計劃或internationalhapmap計劃(或另一種選擇的所選人基因數(shù)據(jù)庫)使用的序列裝配構(gòu)建的坐標,計算基因組坐標。

      (b)鑒定對先前在(a)中鑒定的基因組區(qū)域作圖的基因組變體。在每個超級群體和優(yōu)選亞群中檢索關(guān)于變體的變體頻率,在所述群體中此類數(shù)據(jù)是可獲得的。在hapmapwww網(wǎng)站上可容易獲得的工具和用于1000genomesproject的vwc工具可用于這個步驟。

      (c)過濾來自靶基因組區(qū)域的基因組變體的列表,以僅含有分類為‘非同義’單核苷酸多態(tài)性(snp)或基因組‘插入或缺失’(插入缺失)的變體。進一步過濾以包括僅存在于外顯子序列中的那些。

      (d)關(guān)聯(lián)每個超級群體(例如'歐洲祖先'、'東亞祖先、'西非祖先'、'美洲'和'南亞祖先')中每個鑒定變體的群體頻率數(shù)據(jù)以鑒定與少于兩個超級群體分離的那些變體。使所有鑒定的變體與每個亞群(例如'歐洲祖先'超級群體可以細分為群如‘'ceu–具有北歐或西歐祖先的猶他州居民’,‘意大利的tsi托斯卡尼’和‘來自英格蘭和蘇格蘭的英國人’)進一步關(guān)聯(lián)并產(chǎn)生關(guān)于超級群體內(nèi)的變體罕見性的第二評分。

      (e)收集顯示與特定亞群的分離的一個或多個基因區(qū)段用于構(gòu)建根據(jù)本發(fā)明的合成基因座。

      在本文的一個實施方案中,“種系”指規(guī)范種系基因區(qū)段序列。

      通過1000genomes數(shù)據(jù)庫的詳細分析,本發(fā)明人已設(shè)計候選多態(tài)抗體基因區(qū)段變體例如人變體jh基因區(qū)段(例如參見實施例4)的集合,其可以構(gòu)建到小鼠中的轉(zhuǎn)基因重鏈基因座的設(shè)計內(nèi)用于表達越來越多樣和新的合成人可變區(qū)庫集。為此,本發(fā)明提供了下述實施方案。

      在第四配置中,本發(fā)明提供了

      人jh6*02變體的選擇

      基于人jh6*02的轉(zhuǎn)基因igh基因座、非人脊椎動物、細胞和抗體

      如上文解釋的,在設(shè)計轉(zhuǎn)基因ig重鏈基因座中,本發(fā)明人已考慮可得自1000genomes計劃(參見www.1000genomes.org)的巨大的數(shù)據(jù)量,其分析在許多人類群體中的基因分布,且特別是關(guān)于ig基因區(qū)段的數(shù)據(jù)。本發(fā)明人還知道公開于imgt數(shù)據(jù)庫(參見www.imgt.org)和ensembl(參見www.ensembl.org)中的人基因區(qū)段。本發(fā)明人需要作出關(guān)于下述的選擇:哪些人基因區(qū)段包括在這些數(shù)據(jù)庫和本領(lǐng)域已知的人ig基因區(qū)段信息的其他來源包括本文公開的這些其他數(shù)據(jù)庫中存在的大量人基因區(qū)段中。當選擇人jh基因區(qū)段時,本發(fā)明人知道人jh6編碼相對長的氨基酸序列,并且因此本發(fā)明人認為希望包括這用于增加產(chǎn)生具有相對長的hcdr3區(qū)的igh鏈的機會。具有長hcdr3(根據(jù)imgt命名法至少20個氨基酸)的抗體已顯示有效中和多種病原體,包括hiv、流感病毒、瘧疾和非洲錐蟲。還參考天然存在的駱駝科動物(例如美洲駝或駱駝)的僅重鏈抗體,其具有長hcdr3用于到達相對無法接近的表位(參見例如ep0937140)。長hcdr3可以形成具有擴展環(huán)結(jié)構(gòu)的獨特穩(wěn)定亞結(jié)構(gòu)域,其高出抗體表面以賦予精細特異性。在一些情況下,長hcdr3自身對于表位結(jié)合和中和是足夠的(liu,l等人;journalofvirology.2011.85:8467-8476,引入本文作為參考)。長hcdr3的獨特結(jié)構(gòu)允許它與病原體表面上的無法接近結(jié)構(gòu)或廣泛糖基化內(nèi)的關(guān)聯(lián)(cognate)表位結(jié)合。在人外周血中,存在含有具有超過24個氨基酸長度的hcdr3的約3.5%天然b抗體或1.9%記憶bigg抗體(plosone.2012;7(5):e36750.epub2012may9;"humanperipheralbloodantibodieswithlonghcdr3sareestablishedprimarilyatoriginalrecombinationusingalimitedsubsetofgermlinegenes";brineybs等人,引入本文作為參考)(圖1)。使用分析指出這些抗體優(yōu)先使用具有人d2-2、d3-3或d2-15的人jh6(brinley,bs等人,圖2-5)。還參見plosone.2011mar30;6(3):e16857;comparisonofantibodyrepertoiresproducedbyhiv-1infection,otherchronicandacuteinfections,andsystemicautoimmunedisease";bredenf等人,引入本文作為參考??贵w的所有hcdr3的約20%使用jh6。然而,在這些具有超過24個氨基酸的hcdr3的抗體中,70%使用jh6(brinley,bs等人,圖2)。

      本領(lǐng)域存在關(guān)于下述的需要:可以制備具有長人hcdr3的抗體和重鏈的遺傳修飾的非人脊椎動物和細胞以及可以選自此類脊椎動物和細胞的抗體、鏈和vh結(jié)構(gòu)域,其中這些可以針對由長hcdr3更好接近的靶表位。

      因此,本發(fā)明人在本發(fā)明的這一配置中選擇包括人jh6基因區(qū)段作為其igh基因座設(shè)計中的強制性人基因區(qū)段。幾種不同的天然存在的人jh6變體是已知的(例如jh6*01至*04以及其他;imgt命名法)。在決定哪種人jh6變體應包括在轉(zhuǎn)基因igh基因座設(shè)計中時,本發(fā)明人考慮這點。一些人jh6變體的比對示于圖7中(來自www.imgt.org;破折號指出相同核苷酸;相對于*01變體的核苷酸變化由加下劃線的核苷酸顯示,并且相應氨基酸變化由加下劃線的氨基酸顯示;genbank登記號(發(fā)行版本185.0)由前綴j、x、m或a顯示)。本發(fā)明人使用人基因組dna樣品的測序,公共ighdna數(shù)據(jù)庫的檢查以及基于變體序列的知情選擇作為得出使用哪種jh6變體的合理選擇的手段。

      1000genomes數(shù)據(jù)庫使用人jh6*03作為參考序列,其將是技術(shù)人員希望構(gòu)建轉(zhuǎn)基因igh基因座的可能選擇。本發(fā)明人注意到(例如本文圖7)在jh6*03中的第6位是由tac密碼子編碼的酪氨酸(y),而一些其他天然存在的人變體具有由ggt密碼子編碼的甘氨酸(g)(甘氨酸作為yyg基序存在,形成更大的yygxdx基序的部分)。為了理解這點的潛在意義,本發(fā)明人執(zhí)行來自其他脊椎動物物種的jh序列的分析。本發(fā)明人驚訝地注意到y(tǒng)yg和yygxdx基序跨越許多脊椎動物物種是保守的(參見圖7和8)。因此,這提示本發(fā)明人該基序的保存可能是希望的,其可以指導用于本發(fā)明的jh6變體的選擇。

      當本發(fā)明人考慮分別編碼y或g的tac密碼子相對于ggt密碼子時,出現(xiàn)另一個指標。本發(fā)明人考慮這些核苷酸序列對活化誘導的胞苷脫氨酶(aid)的作用的影響。本發(fā)明人了解活化誘導的胞苷脫氨酶(aid)被認為起始在多步機制中的ig體細胞超變(shm),并且當合理設(shè)計基因座時,它們針對該活性。aid催化dna中c至u的脫氨基,生成在c堿基處的突變。位于熱點基序內(nèi)的胞苷優(yōu)先脫氨基。某些基序是關(guān)于aid活性的熱點(dgyw、wrcwrcy、wrch、rgyw、agy、tac、wgcw,其中w=a或t,y=c或t,d=a,g或t,h=a或c或t,和r=a或g)。在jh6*03中第6位處編碼y的tac密碼子的存在產(chǎn)生aid突變熱點(胞苷是aid的底物),這些熱點是先前句子中加下劃線的基序。本發(fā)明人考慮這點的影響,并且在實現(xiàn)這點時,他們考慮在胞苷處由aid活性產(chǎn)生的可能突變體。參考圖9。本發(fā)明人注意到在tac密碼子的第三個堿基處的突變將獲得3種可能結(jié)果:y、終止或終止。因此,在遺傳密碼中可能的三個終止密碼子中(其他由tga編碼–參見圖9),其中兩個將由編碼jh6*03中第6位的tac密碼子中的胞苷突變提供。因此,本發(fā)明人考慮這可能增加在基于jh6*03的轉(zhuǎn)基因基因座中的非生產(chǎn)性igh可變區(qū)生產(chǎn)的機會。此外,本發(fā)明人注意到相反ggt密碼子的提供(按照其他人jh6變體)似乎優(yōu)選,因為第三個堿基的突變從不產(chǎn)生終止密碼子(參見圖9),并且此外,將保留在第6位處的甘氨酸編碼和因此保留保守性,本發(fā)明人還注意到這在跨越物種保守的yyg和yygxdx基序中。

      已決定不使用jh6*03,本發(fā)明人需要作出來自其他可能人變體的選擇。mdv基序在基于人jh6的hcdr3的c末端,鄰近構(gòu)架4(fw4)以wgq基序開始(參考由jh6*01編碼的所示序列;圖7)。在作出其關(guān)于基因座設(shè)計的選擇中,本發(fā)明人希望使在產(chǎn)物igh鏈和包括這些的抗體中該hcdr3/fw4連接的保守達到最大。本發(fā)明人認為這是重鏈可變結(jié)構(gòu)域功能性和構(gòu)象希望的。本發(fā)明人認為這在一些情況下可能是使免疫原性降到最低(適合于人藥學用途)希望的。與這些考慮一致,本發(fā)明人希望作出由于體內(nèi)shm,使在hcdr3/fw4連接周圍的突變降到最低的選擇,以保存連接配置。參見rogozin&diaz;"cuttingedge:dgyw/wrchisabetterpredictorofmutabilityatg:cbasesinighypermutationthanthewidelyacceptedrgyw/wrcymotifandprobablyreflectsatwo-stepactivation-inducedcytidinedeaminase-triggeredprocess";journalofimmunology;2004年3月15日,第172卷no.63382-3384。dgyw基序的例子是ggca。當分析變體序列時,本發(fā)明人已記住這點。

      記住這些考慮,本發(fā)明人特別決定使用人jh6*02作為用于其igh基因座設(shè)計的強制性人jh6。jh6*01拒絕作為強制性jh6基因區(qū)段,因為核苷酸序列g(shù)ggcaa(編碼g和q)含有g(shù)gca基序,其為aid識別熱點。本發(fā)明人認識到由于編碼g和k(分別為第11和12位)的序列g(shù)gcaaa的存在,jh6*04也含有此類基序。本發(fā)明人還認識到*02變體具有c代替*01變體中的g,c希望是同義變化(即,不改變在cdr3/fw4連接周圍的編碼的氨基酸序列),并且另外,這不提供ggcaaid熱點基序。因此,本發(fā)明人決定強制性jh6應具有該c堿基,并且這也將其指向使用人jh6*02變體。

      在本文本發(fā)明的任何配置的一個例子中,包括在基因座或基因組中的唯一jh6種類是人jh6*02。

      本發(fā)明人從9個同意的人類成人的頰拭子獲得9份匿名dna樣品。對igh基因組dna進行測序以證實天然jh6變體使用。發(fā)現(xiàn)所有9個人的基因組均含有jh6*02變體基因區(qū)段。在9個人中的7個中,基因組對于jh6*02是純合的(即,每個染色體14具有jh6*02作為其在igh基因座中的jh6基因區(qū)段)。本發(fā)明人還檢查來自眾所周知的科學家craigventer和jimwatson的基因組的可公開獲得的序列信息。這兩個基因組也均含有jh6*02。這提示本發(fā)明人該變體在人中是共同的。

      因此,本發(fā)明人基于下述作出人jh6*02的選擇

      (i)含有跨越幾個脊椎動物物種是保守的yyg和yygxdx基序;

      (ii)少一個tac密碼子(危害終止密碼子的aid熱點)的提供和代替保存yyg和yygxdx基序的密碼子的選擇;

      (iii)在hcdr3/fw4連接的區(qū)域中的ggcaaid熱點的避免;和

      (iv)在jh6*02變體的人中的共同出現(xiàn)(和因此保守和可接受性)。

      這一原理通過本發(fā)明人在實驗室例子中進行測試,以便查看人jh6*02是否能夠希望地參與外源(非人脊椎動物)設(shè)置中的抗體基因區(qū)段重組和重鏈生產(chǎn),并且此外,評價基于人jh6*02的長hcdr3是否能夠在此類非人系統(tǒng)中在體內(nèi)(在首次用于實驗和免疫的設(shè)置中)產(chǎn)生。在一些非人設(shè)置例如小鼠中注意到,yyg和yygxdx基序不是保守的,并且因此本發(fā)明人決定必須測試jh6*02(具有yyg和yygxdx基序)是否能夠在此類外源設(shè)置中適當起作用以參與vdj重組和針對抗原的選擇。

      因此,如實施例中進一步解釋的,本發(fā)明人構(gòu)建了在es細胞中含有轉(zhuǎn)基因jh6*02的igh基因座,由es細胞生成轉(zhuǎn)基因非人脊椎動物(首次用于實驗的和用一系列不同靶抗原類型免疫的),分離基于jh6*02的抗體和重鏈序列以及表達這些的b細胞,并且制備表達基于所選jh6*02變體的抗原特異性抗體的雜交瘤。本發(fā)明人發(fā)現(xiàn)jh6*02變體是廣泛使用的并且可以促成在許多不同重鏈(包括抗原特異性重鏈)中具有至少20個氨基酸的hcdr3的產(chǎn)生。所選變體在所有設(shè)置(首次用于實驗的、免疫的和抗原特異性的)中優(yōu)選超過其他jh基因區(qū)段使用以生產(chǎn)具有至少20個氨基酸的hcdr3。

      因此,本發(fā)明提供了包括人jh6*02(imgt命名法)作為強制性jh基因區(qū)段的igh基因座。在一個實施方案中,所述基因座包含人jh6*02下游(即3')的非人脊椎動物(例如小鼠或大鼠)恒定區(qū)基因區(qū)段;以及人jh6*02上游(即5')的一個或多個vh基因區(qū)段(例如多個人vh基因區(qū)段)和一個或多個d基因區(qū)段(例如多個人d基因區(qū)段)。例如,所述基因座由載體(例如dna載體,例如酵母人工染色體(yac)、bac或pac)包含。此類載體(例如yac)可以使用標準技術(shù)(例如原核注射)引入非人脊椎動物(例如小鼠或大鼠)細胞內(nèi),從而使得基因座整合到細胞基因組內(nèi)用于表達包含至少一條鏈的igh鏈,所述鏈的可變結(jié)構(gòu)域是人jh6*02與vh和d基因區(qū)段重組的產(chǎn)物。

      在另一個例子中,所述基因座(例如具有全人、大鼠或小鼠恒定區(qū)、或人/小鼠嵌合恒定區(qū))可以在非人脊椎動物(例如小鼠或大鼠)細胞的基因組中提供。例如。細胞是es細胞或抗體生產(chǎn)細胞(例如分離的b細胞、ips細胞或雜交瘤)。

      在另一個例子中,本發(fā)明提供了包含本發(fā)明的igh基因座的非人脊椎動物(例如小鼠或大鼠),所述igh基因座包含人jh6*02基因區(qū)段,其中所述基因座可以表達igh鏈,其可變結(jié)構(gòu)域是人jh6*02與vh和d基因區(qū)段重組的產(chǎn)物。如例子中所示,本發(fā)明人已成功產(chǎn)生此類小鼠,其產(chǎn)生此類具有基于人jh6*02的vh結(jié)構(gòu)域的igh鏈。在暴露于一系列靶抗原之前(首次用于實驗的)和之后(免疫的),本發(fā)明人分離且測序來自小鼠的igh鏈,并且通過與imgtigh基因區(qū)段序列比較證實分離的鏈(和含有這些的抗體)基于jh6*02產(chǎn)生。此類鏈在首次用于實驗的小鼠以及來自免疫的小鼠的抗原特異性抗體中發(fā)現(xiàn)。b細胞從免疫的小鼠中分離,其中b細胞表達基于jh6*02的抗體,并且由b細胞生成雜交瘤,該雜交瘤表達基于jh6*02的抗原特異性抗體。因此,本發(fā)明提供了基于人jh6*02使用的本發(fā)明的基因座、脊椎動物、細胞和雜交瘤,并且顯示可以在脊椎動物免疫后成功產(chǎn)生且分離基于jh6*02的抗體和表達這些的b細胞,相應的雜交瘤是其vh結(jié)構(gòu)域基于jh6*02的抗體的良好來源,例如用于施用于患者,例如用于人類醫(yī)學。此外,發(fā)現(xiàn)能夠產(chǎn)生且分離抗原特異性抗體,其vh結(jié)構(gòu)域基于jh6*02并且其具有相對長的hcdr3(例如20個氨基酸)。

      因此,本發(fā)明提供了如下述條款中的實施方案:

      1.非人脊椎動物(任選小鼠或大鼠)或脊椎動物細胞,其基因組包含免疫球蛋白重鏈基因座,其包含位于恒定區(qū)上游的人基因區(qū)段jh6*02、一個或多個vh基因區(qū)段和一個或多個d基因區(qū)段;其中重鏈基因座中的基因區(qū)段可操作地連接其恒定區(qū),從而使得小鼠能夠產(chǎn)生由人jh6*02與d區(qū)段和vh區(qū)段重組產(chǎn)生的抗體重鏈。

      在另一個例子中,本發(fā)明提供了

      非人脊椎動物(例如小鼠或大鼠)或脊椎動物細胞,其基因組包含免疫球蛋白重鏈基因座,其包含選自下述的人ighv基因區(qū)段中的一個、多個或全部:v3-21、v3-13、v3-7、v6-1、v1-8、v1-2、v7-4-1、v1-3、v1-18、v4-4、v3-9、v3-23、v3-11和v3-20(例如v3-21*03、v3-13*01、v3-7*01、v6-1*01、v1-8*01、v1-2*02、v7-4-1*01、v1-3*01、v1-18*01、v4-4*01、v3-9*01和v3-23*04中的一個、多個或全部)。這些區(qū)段在首次用于實驗的庫集中發(fā)現(xiàn)是生產(chǎn)性的,以產(chǎn)生長度至少20個氨基酸的hcdr3。在一個實施方案中,所述基因座包含人jh6,例如jh6*02。

      本發(fā)明還提供了具有至少20個氨基酸的hcdr3大小的hcdr3、vh結(jié)構(gòu)域、抗體重鏈或抗體。任選地,hcdr3或vh結(jié)構(gòu)域(或者重鏈或抗體的vh結(jié)構(gòu)域)包含小鼠aid模式體細胞超變和/或小鼠dtd模式突變。例如,當vh結(jié)構(gòu)域在包含小鼠aid和/或小鼠tdt(例如內(nèi)源aid或tdt)的小鼠中產(chǎn)生時,可以提供這點。還參見annu.rev.biochem.2007.76:1-22;javierm.dinoia和michaels.neuberger,"molecularmechanismsofantibodysomatichypermutation"(特別是圖1和關(guān)于小鼠中aid熱點的相關(guān)討論);和curropinimmunol.1995apr;7(2):248-54,"somatichypermutation",neubergerms和milsteinc(特別是關(guān)于小鼠中熱點的討論),所述參考文獻的內(nèi)容引入本文作為參考。

      這些區(qū)段在首次用于實驗的庫集中發(fā)現(xiàn)與人jh6*02組合是生產(chǎn)性的,以產(chǎn)生長度至少20個氨基酸的hcdr3。

      在一個例子中,脊椎動物是首次用于實驗的。在另一個實施方案中,脊椎動物相反用靶抗原進行免疫。

      在一個例子中,下文提及的脊椎動物或細胞在用靶抗原免疫后能夠如此產(chǎn)生抗體重鏈。在一個例子中,脊椎動物是免疫的脊椎動物,其產(chǎn)生對于靶抗原特異性的抗體重鏈并且其中重鏈的可變結(jié)構(gòu)域是vh、d和jh6*02之間重組的產(chǎn)物。例如,d選自人d3-3、d2-15、d3-9;d4-17;d3-10;d2-2;d5-24;d6-19;d3-22;d6-13;d5-12;d1-26;d1-20;d5-18;d3-16;d2-21;d1-14;d7-27;d1-1;d6-25;d2-14和d4-23(例如選自d3-9*01;d4-17*01;d3-10*01;d2-2*02;d5-24*01;d6-19*01;d3-22*01;d6-13*01;d5-12*01;d1-26*01;d1-20*01;d5-18*01;d3-16*02;d2-21*02;d1-14*01;d7-27*02;d1-1*01;d6-25*01;d2-15*01;和d4-23*01)。例如,d是人d3-9或d3-10。在一個例子中,hcdr3長度是至少20個氨基酸(例如20、21、23或24)。

      在脊椎動物或細胞的一個例子中,基因組包含另外的人jh基因區(qū)段(例如jh2、3、4和5基因區(qū)段)。

      在脊椎動物或細胞的一個例子中,基因組包含免疫球蛋白輕鏈基因座,其包含恒定區(qū)(例如人或小鼠λ或κ恒定區(qū))上游的一個或多個人v基因區(qū)段和一個或多個人j基因區(qū)段。

      如技術(shù)人員已知的,對于重鏈的重排和表達,基因座包含控制元件,例如一個或多個j基因區(qū)段和恒定區(qū)之間的eμ和sμ。在一個例子中,小鼠eμ和sμ包括在jh6*02和恒定區(qū)之間的重鏈基因座中(即,按5'至3'次序,基因座包含jh6*02、eμ和sμ以及恒定區(qū))。在一個例子中,eμ和sμ是小鼠129衍生的基因組(例如129sv衍生的基因組,例如129sv/ev(例如129s7sv/ev(例如來自可得自baylorcollegeofmedicine,texas,usa的ab2.1或ab2.2細胞)或129s6sv/ev))))的eμ和sμ;在另一個例子中,eμ和sμ是小鼠c57bl/6衍生的基因組的eμ和sμ。在這方面,基因座可以在選自ab2.1、ab2.2、vgf1、cj7和fh14的細胞的基因組的igh基因座中構(gòu)建。在引入本文作為參考的auerbachw,dunmorejh,fairchild-huntressv等人;establishmentandchimeraanalysisof129/svev-andc57bl/6-derivedmouseembryonicstemcelllines.biotechniques2000;29:1024-8,30,32中構(gòu)建且描述了vgf1細胞。

      另外或可替代地,恒定區(qū)(或至少cμ;或cμ及其γ恒定區(qū))是緊接的上文段落中所述的基因組的恒定區(qū)(或cμ;或cμ及其γ恒定區(qū))。

      jh6*02及其他人dna序列的合適來源對于技術(shù)人員將是顯而易見的。例如,能夠從同意的人供體(例如按照本文實施例的頰拭子樣品)中收集dna樣品,由其可以獲得合適的dna序列用于構(gòu)建本發(fā)明的基因座。如技術(shù)人員已知的,人dna的其他來源是商購可得的??商娲兀夹g(shù)人員能夠通過參考本文公開的人ig基因區(qū)段序列的一個或多個數(shù)據(jù)庫來構(gòu)建基因區(qū)段序列。

      2.條款1的脊椎動物,其中所述脊椎動物已用靶抗原免疫并且其中所述重鏈的可變結(jié)構(gòu)域是vh、d和jh6*02之間重組的產(chǎn)物并且其中所述hcdr3長度是至少20個氨基酸(例如20、21、23或24)。

      任選地,免疫的脊椎動物產(chǎn)生對于靶抗原特異性的抗體重鏈并且其中重鏈的可變結(jié)構(gòu)域是vh、d和jh6*02之間重組的產(chǎn)物并且其中hcdr3長度是至少20個氨基酸(例如20、21、23或24)。

      3.非人脊椎動物細胞(例如小鼠細胞或大鼠細胞),其基因組包含免疫球蛋白重鏈基因座,其包含恒定區(qū)上游的人基因區(qū)段jh6*02、一個或多個vh基因區(qū)段和一個或多個d基因區(qū)段;其中所述重鏈基因座中的基因區(qū)段可操作地連接其恒定區(qū),用于產(chǎn)生(例如在后續(xù)后代細胞中)由人jh6*02與d區(qū)段和vh區(qū)段重組產(chǎn)生的抗體重鏈。

      4.條款3的細胞,其為能夠分化成表達所述重鏈的后代抗體生產(chǎn)細胞的es細胞。

      5.任何前述條款的脊椎動物或細胞,其中所述重鏈基因座包含與jh6*02基因區(qū)段5'可操作地連接的人jh6*02重組信號序列(rss)。

      例如,天然rss-jh6*02序列可以用于有利地維持rss及其jh基因區(qū)段之間的天然配對。在這方面,使用下述序列:

      ggtttttgtggggtgaggatggacattctgccattgtgattactactactactacggtatggacgtctggggccaagggaccacggtcaccgtctcctcag(seqidno:238)

      rss具有共同體系結(jié)構(gòu):9聚體(例如上文加下劃線的第一序列),隨后為22bp間隔物,和隨后的7聚體(例如上文加下劃線的第二序列)。間隔物通常為23bp+/-1,而9和7聚體是更保守的。

      6.條款5的脊椎動物或細胞,其中所述rss為seqidno:238或與seqidno:238的22聚體序列至少70%相同且側(cè)翼具有相同的9聚體和7聚體序列的序列。

      7.條款6的脊椎動物或細胞,其中所述rss和jh6*02作為seqidno:237提供。

      8.任何前述條款的脊椎動物或細胞,其中所述jh6*02是基因組中的唯一jh6型基因區(qū)段。

      9.任何前述條款的脊椎動物或細胞,其中所述jh6*02是基因座中與恒定區(qū)最緊密的jh基因區(qū)段。

      10.任何前述條款的脊椎動物或細胞,其中所述基因座包含下述人d基因區(qū)段中的一個、多個或全部:d3-9;d4-17;d3-10;d2-2;d5-24;d6-19;d3-22;d6-13;d5-12;d1-26;d1-20;d5-18;d3-16;d2-21;d1-14;d7-27;d1-1;d6-25;d2-14;和d4-23。

      例如,基因座包含下述人d基因區(qū)段中的一個、多個或全部:d3-9*01;d4-17*01;d3-10*01;d2-2*02;d5-24*01;d6-19*01;d3-22*01;d6-13*01;d5-12*01;d1-26*01;d1-20*01;d5-18*01;d3-16*02;d2-21*02;d1-14*01;d7-27*02;d1-1*01;d6-25*01;d2-15*01;和d4-23*01。

      11.條款10的脊椎動物或細胞,其中所述基因座包含下述人d基因區(qū)段中的一個、多個或全部:d3-9、d3-10、d6-19、d4-17、d6-13、d3-22、d2-2、d2-25和d3-3。

      這些d基因區(qū)段發(fā)現(xiàn)與人jh6*02組合是生產(chǎn)性的,以產(chǎn)生長度至少20個氨基酸的hcdr3。

      在一個例子中,基因座包含下述人d基因區(qū)段中的一個、多個或全部:d3-9、d3-10、d6-19、d4-17、d6-13和d3-22(例如d3-9*01、d3-10*01、d6-19*01、d4-17*01、d6-13*01和d3-22*01中的一個、多個或全部)。這些d區(qū)段在首次用于實驗的庫集中發(fā)現(xiàn)與人jh6*02組合是生產(chǎn)性的,以產(chǎn)生長度至少20個氨基酸的hcdr3。

      在一個例子中,基因座包含下述人d基因區(qū)段中的一個、多個或全部:d3-10、d6-19和d1-26(例如d3-10*01、d6-19*01和d1-26*01中的一個、多個或全部)。這些d區(qū)段在免疫的庫集中發(fā)現(xiàn)與人jh6*02組合是生產(chǎn)性的,以產(chǎn)生長度至少20個氨基酸的hcdr3。

      在一個例子中,基因座包含下述人d基因區(qū)段中的一個、多個或全部:d3-9和d3-10(例如d3-9*01和d3-10*01中的一個、多個或全部)。這些d區(qū)段在抗原特異性庫集中發(fā)現(xiàn)與人jh6*02組合是生產(chǎn)性的,以產(chǎn)生長度至少20個氨基酸的hcdr3。

      12.任何前述條款的脊椎動物或細胞,其中所述基因座包含多個人d基因區(qū)段,并且所述jh6*02處于關(guān)于最3'的人d基因區(qū)段(或由基因座包含的人d區(qū)段的全部)的人類種系配置中。

      在一個例子中,最3'的d基因區(qū)段是d7-27。在一個例子中,基因座包含來自如種系人igh基因座中存在的d1-1至d7-27的人d基因區(qū)段的全部(例如,如imgt基因庫中所示)。

      可替代或另外地,jh6*02處于關(guān)于eμ、sμ和恒定區(qū)(例如cμ)中的一個、多個或全部的人類種系配置中。

      13.任何前述條款的脊椎動物或細胞,其中所述基因座包含選自下述人ighv基因區(qū)段中的一個、多個或全部:v3-21、v3-13、v3-7、v6-1、v1-8、v1-2、v7-4-1、v1-3、v1-18、v4-4、v3-9、v3-23、v3-11和v3-20。

      在一個例子中,基因座包含選自下述人ighv基因區(qū)段中的一個、多個或全部:v3-21、v3-13、v3-7、v6-1、v1-8、v1-2、v7-4-1、v1-3、v1-18、v4-4、v3-9、v3-23(例如v3-21*03、v3-13*01、v3-7*01、v6-1*01、v1-8*01、v1-2*02、v7-4-1*01、v1-3*01、v1-18*01、v4-4*01、v3-9*01和v3-23*04中的一個、多個或全部)。這些區(qū)段在首次用于實驗的庫集中發(fā)現(xiàn)與人jh6*02組合是生產(chǎn)性的,以產(chǎn)生長度至少20個氨基酸的hcdr3。

      在一個例子中,基因座包含選自下述人ighv基因區(qū)段中的一個、多個或全部:v3-7、v3-11和v4-4(例如v3-7*01、v3-11*01和v4-4*02中的一個、多個或全部)。這些區(qū)段在免疫的庫集中發(fā)現(xiàn)與人jh6*02組合是生產(chǎn)性的,以產(chǎn)生長度至少20個氨基酸的hcdr3。

      在一個例子中,基因座包含選自下述人ighv基因區(qū)段中的一個、多個或全部:v4-4、v1-8、v3-9、v3-11和v3-20(例如v4-4*02、v1-8*01、v3-9*01、v3-11*01和v3-20中的一個、多個或全部(例如*d01)。這些區(qū)段在抗原特異性庫集中發(fā)現(xiàn)與人jh6*02組合是生產(chǎn)性的,以產(chǎn)生長度至少20個氨基酸的hcdr3。

      14.任何前述條款的脊椎動物或細胞,其中所述基因座包含人d3-9*01、d3-10*01、d6-19*01、d6-13*01、d1-26*01、ighv1-8*01、ighv4-61*01、ighv6-1*01、ighv4-4*02、ighv1-3*01、ighv3-66*03、ighv3-7*01和ighv3-9*01中的一個、多個或全部。

      這些是與jh6*02非常頻繁地組合以產(chǎn)生生產(chǎn)性重鏈和抗體的基因區(qū)段。

      例如,基因座包含人ighv1-8*01、d3-9*01和d3-10*01中的一個、多個或全部。這些基因區(qū)段與jh6*02一起是生產(chǎn)性的,以在超過10種抗體中產(chǎn)生具有至少20個氨基酸的hcdr3。

      15.抗體生產(chǎn)細胞(例如b細胞),其為條款3–14中任一項的細胞的后代,其中所述抗體生產(chǎn)細胞包含重鏈基因座,其包含由人jh6*02與d區(qū)段和vh區(qū)段(例如jh6*02與人vh3-11(例如vh3-11*01)和d3-9;vh3-20(例如vh3-20*01)和d3-10;vh4-4(例如vh4-4*02)和d3-10;vh3-9(例如vh3-9*01)和d3-10;或vh1-8(例如vh1-8*01)和d310)重組產(chǎn)生的重排可變區(qū)。

      此類可變區(qū)將是在本發(fā)明的非人脊椎動物或細胞中的體內(nèi)體細胞超變的產(chǎn)物。

      16.條款15的細胞,其為表達包含重鏈的靶抗原特異性抗體的b細胞或雜交瘤,所述重鏈包含由人jh6*02與d區(qū)段和vh區(qū)段(例如jh6*02與人vh3-11(例如vh3-11*01)和d3-9;vh3-20(例如vh3-20*01)和d3-10;vh4-4(例如vh4-4*02)和d3-10;vh3-9(例如vh3-9*01)和d3-10;或vh1-8(例如vh1-8*01)和d310)重組產(chǎn)生的重排可變區(qū)。

      此類可變區(qū)將是在本發(fā)明的非人脊椎動物或細胞中的體內(nèi)體細胞超變的產(chǎn)物。

      17.任何前述條款的脊椎動物或細胞,其中所述抗體重鏈特異性結(jié)合靶抗原。

      18.任何前述條款的脊椎動物或細胞,其中所述抗體重鏈具有至少20個氨基酸的hcdr3長度。

      任選地,hcdr3長度為至少21、22、23、24、25、26、27、28、29或30個氨基酸。另外,在一個例子中,長度不超過35、34、33、32或31個氨基酸。例如,hcdr3長度為20、21、22、23或24個氨基酸。

      19.任何前述條款的脊椎動物或細胞,其中所述抗體重鏈是jh6*02與條款13或14中所述的人vh基因區(qū)段和/或條款10、11或14中所述的d基因區(qū)段重組的產(chǎn)物。

      20.任何前述條款的脊椎動物或細胞,其中所有內(nèi)源非人脊椎動物重鏈可變區(qū)基因區(qū)段已在基因組中失活(例如通過基因區(qū)段缺失或倒位)。

      21.任何前述條款的脊椎動物或細胞,其中所述基因組對于所述重鏈基因座是純合的。

      22.從條款1、2、5-14和17-21中任一項的脊椎動物中分離的重鏈(例如由抗體包含),其中所述重鏈包含具有至少20個氨基酸的hcdr3。

      23.條款22的重鏈,其中所述hcdr3是人jh6*02與條款13或14中所述的人vh基因區(qū)段和/或條款10、11或14中所述的d基因區(qū)段重組的產(chǎn)物。

      在一個例子中,重鏈是嵌合的,其中c區(qū)是非人的。在一個例子中,重鏈是人的,其中c區(qū)是人的。

      24.重鏈(例如由抗體包含),其vh可變結(jié)構(gòu)域與條款22或23的重鏈的vh可變結(jié)構(gòu)域相同,并且包含人恒定區(qū)或人-小鼠嵌合恒定區(qū)(例如ch1是人的,其他恒定結(jié)構(gòu)域是小鼠的)。

      25.條款22、23或24的重鏈,其vh可變結(jié)構(gòu)域?qū)τ诎锌乖翘禺愋缘摹?/p>

      26.用于產(chǎn)生對靶抗原特異性的重鏈、vh結(jié)構(gòu)域或抗體的方法,所述方法包括用抗原免疫根據(jù)條款1、2、5-14和17–21中任一項的非人脊椎動物,且分離對靶抗原特異性的重鏈、vh結(jié)構(gòu)域或抗體,或者產(chǎn)生所述重鏈、vh結(jié)構(gòu)域或抗體的細胞,其中所述重鏈、vh結(jié)構(gòu)域或抗體包含衍生自人jh6*02與vh基因區(qū)段和d基因區(qū)段重組的hcdr3。

      27.用于產(chǎn)生人重鏈或抗體的方法,其包括執(zhí)行條款26的方法,其中所述基因座的恒定區(qū)是非人脊椎動物(例如小鼠或大鼠)恒定區(qū),并且隨后用人抗體恒定區(qū)置換所述分離的重鏈或抗體的非人恒定區(qū)(例如通過工程化編碼所述抗體的核酸)。

      28.重鏈、vh結(jié)構(gòu)域或抗體,其由條款26或27的方法產(chǎn)生。

      任選地,hcdr3長度如本文描述的為至少20個氨基酸。

      29.表達重鏈vh結(jié)構(gòu)域的b細胞或雜交瘤,所述重鏈vh結(jié)構(gòu)域與條款22、23或28的重鏈的vh結(jié)構(gòu)域相同。

      30.核酸,其編碼條款22、23或28的重鏈的vh結(jié)構(gòu)域,或編碼條款22、23、24、25或28的重鏈。

      31.載體(例如cho細胞或hek293細胞載體),其包含條款30的核酸;任選其中所述載體在宿主細胞(例如cho細胞或hek293細胞)中。

      32.藥物組合物,其包含條款22-25和28中任一項的抗體、重鏈或vh結(jié)構(gòu)域(例如由抗體包含的),連同藥學可接受的賦形劑、稀釋劑或藥物(例如進一步的抗原特異性可變結(jié)構(gòu)域、重鏈或抗體)。

      33.用于醫(yī)學(例如人類醫(yī)學)的條款22-25和28中任一項的抗體、重鏈或vh結(jié)構(gòu)域(例如由抗體包含的)。

      例如,基因座包含下述人vh基因區(qū)段

      ighv6-1

      ighv3-7

      ighv1-8

      ighv3-9

      ighv3-11

      ighv3-13

      ighv1-18

      ighv3-30

      ighv4-31

      ighv4-39

      ighv4-59

      以及任選存在的(i)和/或(ii)

      (i)

      ighv1-2

      ighv2-5和

      ighv3-21

      (ii)

      ighv1-2

      ighv2-5

      ighv3-21

      ighv1-24

      例如,基因座包含下述人vh基因區(qū)段變體

      ighv6-1*01

      ighv3-7*01

      ighv1-8*01

      ighv3-9*01

      ighv3-11*01

      ighv3-13*01

      ighv1-18*01

      ighv3-30*18

      ighv4-31*03

      ighv4-39*01和

      ighv4-59*01;

      以及任選存在的(iii)或(iv)

      (ii)

      ighv1-2*04

      ighv2-5*10和

      ighv3-21*03

      (iv)

      ighv1-2*02

      ighv2-5*01

      ighv3-21*01和

      ighv1-24*01

      例如,基因座包含下述人jh基因區(qū)段變體

      ighj2*01

      ighj3*02

      ighj4*02

      ighj5*02和

      ighj6*02

      例如,基因座包含下述人d基因區(qū)段

      ighd1-1

      ighd2-2

      ighd3-9

      ighd3-10

      ighd5-12

      ighd6-13

      ighd1-14

      ighd2-15

      ighd3-16

      ighd4-17

      ighd6-19

      ighd2-21

      ighd5-24

      ighd1-26和

      ighd7-27

      和以及任選存在的(v)或(vi)

      (v)

      ighd3-3

      (vi)

      ighd3-3

      ighd4-4

      ighd5-5

      ighd6-6

      ighd1-7

      ighd2-8和

      ighd2-8

      在第五配置中,本發(fā)明提供了

      對人類使用和抗體人源化定制的恒定區(qū)

      另外的合理設(shè)計和生物信息學已導致本發(fā)明人認識到特定人恒定區(qū)變體跨越許多不同人類群體是保守的。本發(fā)明人認識到這開放通過在產(chǎn)物中使用此類特定恒定區(qū),而不是任意選擇人恒定區(qū)(或合成形式的人恒定區(qū)),對人抗體、鏈和可變結(jié)構(gòu)域作出選擇的可能性。本發(fā)明的這個方面還使得能夠?qū)μ囟ㄈ祟惙N族群體定制基于抗體的藥物,從而比迄今為止已進行的更緊密地匹配藥物與患者(和因此的疾病設(shè)置)。用人恒定區(qū)(推測衍生自一個(通常未知的)種族群體或非天然存在的)的任意選擇人源化的抗體無法同樣在不同人類種族群體的患者中起作用,這在本領(lǐng)域技術(shù)水平中可以是問題。這是重要的,因為恒定區(qū)具有提供抗體效應子功能的主要作用,例如用于抗體再循環(huán)、細胞和補體召募以及用于細胞殺死。

      如wo2011066501中進一步討論的,人igg亞型igg1、igg2、gg3和igg4顯示出召募免疫功能的不同能力,所述免疫功能例如抗體依賴性細胞的細胞毒性(adcc,例如igg1和igg3)、抗體依賴性細胞的吞噬作用(adcp,例如igg1、igg2、igg3和igg4)和補體依賴性細胞毒性(cdc,例如igg1、igg3)。此類免疫功能的亞型特異性銜接基于fc受體對不同免疫細胞的選擇性和結(jié)合c1q且活化膜攻擊復合物(mac)裝配的能力。在多個類型中,關(guān)于fcy受體(例如fcyri、fcyriia/b/c、fcyriiia/b)的相對親和力對于igg1和igg3很高,然而,存在對于igg2的最低限度親和力(限制于fcyriia131h多態(tài)性),并且igg4僅對于fcyri具有可測量的親和力。使用比較序列分析和共晶體結(jié)構(gòu),關(guān)于受體結(jié)合的關(guān)鍵接觸殘基已對跨越下鉸鏈和ch2區(qū)的氨基酸殘基作圖。使用標準蛋白質(zhì)工程技術(shù),已在增強或減少抗體制劑對于fc受體和補體的c1q組分的親和力中獲得一些成功。

      在同種型中,igg2最不能結(jié)合fc受體的家族。使用igg2作為起點,已作出發(fā)現(xiàn)突變體的努力,所述突變體具有減少的效應子功能,但保留fcrn結(jié)合、延長的穩(wěn)定性和低免疫原性。具有這種性質(zhì)的改善突變體可以提供具有保留安全性的改善的抗體治療劑。與細胞表面靶結(jié)合的人igg1治療抗體能夠銜接效應細胞,其可以通過抗體依賴性細胞的細胞毒性(adcc)或補體依賴性細胞毒性(cdc)介導靶細胞的細胞裂解。這些機制通過抗體fc結(jié)構(gòu)域的ch2區(qū)與免疫效應細胞上的fcyr受體或c1q(補體級聯(lián)的第一種組分)的相互作用而發(fā)生。表19顯示不同人γ亞型的活性。取決于目的人類中的疾病設(shè)置,技術(shù)人員可以相應地選擇促進或抑制活性。例如,當希望分離在人類患者中通過經(jīng)典途徑和fcyr1識別具有相對高的補體活化活性的全人重鏈和抗體時,人γ-1恒定區(qū)的使用是希望的。還參見molimmunol.2003dec;40(9):585-93;"differentialbindingtohumanfcgammariiaandfcgammariibreceptorsbyhumaniggwildtypeandmutantantibodies";armourkl等人,其引入本文作為參考。

      igg2恒定區(qū)非常適合于產(chǎn)生根據(jù)本發(fā)明的抗體和重鏈,用于與人中的細胞因子或可溶靶結(jié)合,因為igg2基本上是fcyri,iii-沉默、fcyriia-活性的并且?guī)缀鯖]有補體活性。

      igg1恒定區(qū)具有用于人治療劑的廣泛效用,因為igg1抗體和重鏈是fcyri,ii,iii-活性的并且具有補體活性。這可以通過使用已如本領(lǐng)域已知的通過工程化活化的人γ-1恒定區(qū)得到增強。

      本發(fā)明人的工作因此已鑒定不同同種型的人恒定區(qū)集合,當人源化嵌合抗體鏈(或使v結(jié)構(gòu)域例如dab或駱駝科動物vhh與恒定區(qū)綴合)時,可以從其中作出知情選擇。集合基于1000genomes數(shù)據(jù)庫的生物信息學分析進行鑒定,本發(fā)明人選擇跨越幾個人類種族群體頻繁出現(xiàn)的恒定區(qū)變體,以及在個別群體內(nèi)以相對高的頻率出現(xiàn)的那些(如由其基因組包含變體的個體數(shù)目評價)。通過在這個基礎(chǔ)上經(jīng)由眾多可能序列分選,本發(fā)明人已提供了人恒定區(qū)變體的集合,所述人恒定區(qū)變體是天然存在的并且在合適設(shè)計抗體、重鏈及其他基于抗體的形式(其具有人恒定區(qū))時可以使用。特別地,當人源化嵌合重鏈以產(chǎn)生其中可變和恒定區(qū)兩者均為人的全人鏈時,這是有用的。這對與接受基于抗體的藥物的人類患者的相容性是有用的。

      為此,本發(fā)明提供了下述方面:

      1.產(chǎn)生抗體重鏈的方法,所述方法包括:

      (a)提供抗原特異性重鏈可變結(jié)構(gòu)域(例如vh(例如人vh或dab)或vhh或人源化重鏈可變結(jié)構(gòu)域);和

      (b)組合可變結(jié)構(gòu)域與人重鏈恒定區(qū)以產(chǎn)生包含(在n至c末端方向)可變結(jié)構(gòu)域和恒定區(qū)的抗體重鏈;

      其中

      人重鏈恒定區(qū)是igharef、igha1a、igha2a、igha2b、ighg1ref、ighg2ref、ighg2a、ighg3ref、ighg3a、ighg3b、ighg4ref、ighg4a、ighdref、igheref、ighmref、ighma或ighmb恒定區(qū)。

      步驟(b)可以例如使用重組dna技術(shù)使用相應核苷酸序列執(zhí)行。

      對于根據(jù)這一配置的任何方面的恒定區(qū),基因組dna或等價物(即,具有內(nèi)含子和外顯子以及任選存在的5'utr序列,例如具有天然或非天然前導序列)可以用于恒定區(qū)。例如,此處開始作為seqidno:365公開的"genomic"序列中的任一??商娲?,可以使用無內(nèi)含子序列,例如此處開始作為seqidno:365公開的"cds"序列中的任一(例如具有天然或非天然前導序列)。

      任選對于本發(fā)明的這一配置的任何方面,人重鏈恒定區(qū)是igharef恒定區(qū)。

      任選對于本發(fā)明的這一配置的任何方面,人重鏈恒定區(qū)是igha1a恒定區(qū)。

      任選對于本發(fā)明的這一配置的任何方面,人重鏈恒定區(qū)是igha2a恒定區(qū)。

      任選對于本發(fā)明的這一配置的任何方面,人重鏈恒定區(qū)是igha2b恒定區(qū)。

      任選對于本發(fā)明的這一配置的任何方面,人重鏈恒定區(qū)是ighg1ref恒定區(qū)。

      任選對于本發(fā)明的這一配置的任何方面,人重鏈恒定區(qū)是ighg2ref恒定區(qū)。

      任選對于本發(fā)明的這一配置的任何方面,人重鏈恒定區(qū)是ighg2a恒定區(qū)。

      任選對于本發(fā)明的這一配置的任何方面,人重鏈恒定區(qū)是ighg3ref恒定區(qū)。

      任選對于本發(fā)明的這一配置的任何方面,人重鏈恒定區(qū)是ighg3a恒定區(qū)。

      任選對于本發(fā)明的這一配置的任何方面,人重鏈恒定區(qū)是ighg3b恒定區(qū)。

      任選對于本發(fā)明的這一配置的任何方面,人重鏈恒定區(qū)是ighg4ref恒定區(qū)。

      任選對于本發(fā)明的這一配置的任何方面,人重鏈恒定區(qū)是ighg4a恒定區(qū)。

      任選對于本發(fā)明的這一配置的任何方面,人重鏈恒定區(qū)是ighdref恒定區(qū)。

      任選對于本發(fā)明的這一配置的任何方面,人重鏈恒定區(qū)是igheref恒定區(qū)。

      任選對于本發(fā)明的這一配置的任何方面,人重鏈恒定區(qū)是ighmref恒定區(qū)。

      任選對于本發(fā)明的這一配置的任何方面,人重鏈恒定區(qū)是ighma恒定區(qū)。

      任選對于本發(fā)明的這一配置的任何方面,人重鏈恒定區(qū)是ighmb恒定區(qū)。

      任選地,產(chǎn)生重鏈或包含所述重鏈的抗體的衍生物(例如突變體或綴合物)。例如,可以綴合毒性有效負荷(例如用于腫瘤學應用)。例如,如本領(lǐng)域已知的,可以引入一種或多種突變以失活或增強fc效應子功能。

      2.方面1的方法,其中所述可變結(jié)構(gòu)域是人可變結(jié)構(gòu)域。

      人可變結(jié)構(gòu)域是例如在轉(zhuǎn)基因非人脊椎動物中的人vh、d和jh基因區(qū)段重組的產(chǎn)物。可替代地,可變結(jié)構(gòu)域使用體外展示技術(shù)從人vh文庫中鑒定,例如使用如本領(lǐng)域已知的噬菌體展示、核糖體展示或酵母展示。

      在另一個實施方案中,可變結(jié)構(gòu)域是人源化可變結(jié)構(gòu)域,例如包含具有非人(例如小鼠或大鼠)cdr)的人構(gòu)架。人源化技術(shù)是本領(lǐng)域常規(guī)的,并且將是技術(shù)人員容易知道的。

      3.任何前述方面的方法,其中所述可變結(jié)構(gòu)域先前已選自用抗原免疫的非人脊椎動物。

      例如,脊椎動物(例如小鼠或大鼠)基因組包含嵌合重鏈基因座,其包含可操作地連接非人脊椎動物恒定區(qū)上游的人可變區(qū)(人v、d和jh基因區(qū)段),從而使得基因座能夠重排用于表達包含人可變結(jié)構(gòu)域和非人脊椎動物恒定區(qū)的重鏈。

      在可替代實施方案中,使用體外技術(shù)例如噬菌體展示、核糖體展示或酵母展示選擇可變結(jié)構(gòu)域。在這種情況下,可變結(jié)構(gòu)域可以連同或不連同恒定區(qū)一起展示,條件是按照本發(fā)明它以后與人恒定區(qū)組合。

      4.任何前述方面的方法,其包括提供包含編碼恒定區(qū)的核苷酸序列的表達載體(例如哺乳動物表達載體,例如cho或hek293載體);將編碼可變結(jié)構(gòu)域的核苷酸序列插入載體恒定區(qū)序列的5';將載體插入宿主細胞內(nèi)且由宿主細胞表達重鏈;所述方法進一步包括分離包含可變結(jié)構(gòu)域和人恒定區(qū)的重鏈(例如作為抗體的部分)。

      當載體由宿主細胞例如cho或hek293細胞容納時,載體包含足以實現(xiàn)重鏈表達的調(diào)節(jié)元件。

      5.任何前述方面的方法,其進一步包括獲得編碼重鏈的核苷酸序列。

      6.包含人重鏈的抗體,該重鏈包含對于抗原特異性的可變結(jié)構(gòu)域和恒定區(qū),所述恒定區(qū)是igharef、igha1a、igha2a、igha2b、ighg1ref、ighg2ref、ighg2a、ighg3ref、ighg3a、ighg3b、ighg4ref、ighg4a、ighdref、igheref、ighmref、ighma或ighmb恒定區(qū)。

      7.多肽,其包含(在n至c末端方向)前導序列、對于抗原特異性的人可變結(jié)構(gòu)域和人恒定區(qū),所述人恒定區(qū)為igharef、igha1a、igha2a、igha2b、ighg1ref、ighg2ref、ighg2a、ighg3ref、ighg3a、ighg3b、ighg4ref、ighg4a、ighdref、igheref、ighmref、ighma或ighmb恒定區(qū),其中(i)前導序列不是天然人可變結(jié)構(gòu)域前導序列(例如前導序列是另一種人前導序列或非人前導序列);和/或(ii)可變結(jié)構(gòu)域包含小鼠aid模式體細胞突變或小鼠末端脫氧核苷酸轉(zhuǎn)移酶(tdt)模式連接突變。

      8.核苷酸序列,其編碼(在5'到3'方向)前導序列和人抗體重鏈,該重鏈包含對于抗原特異性的可變結(jié)構(gòu)域和恒定區(qū),所述恒定區(qū)是igharef、igha1a、igha2a、igha2b、ighg1ref、ighg2ref、ighg2a、ighg3ref、ighg3a、ighg3b、ighg4ref、ighg4a、ighdref、igheref、ighmref、ighma或ighmb恒定區(qū);并且前導序列對于重鏈表達是可操作的(例如在哺乳動物cho或hek293細胞中)并且其中前導序列不是天然人可變結(jié)構(gòu)域前導序列(例如前導序列是另一種人前導序列或非人前導序列)。

      在一個例子中,前導序列是

      atgggctggtcctgcatcatcctgtttctggtggccaccgccaccggcgtgcacagc

      其翻譯為

      mgwsciilflvatatgvhs

      9.核苷酸序列,其編碼(在5'到3'方向)啟動子和人抗體重鏈,該重鏈包含對于抗原特異性的可變結(jié)構(gòu)域和恒定區(qū),所述恒定區(qū)是igharef、igha1a、igha2a、igha2b、ighg1ref、ighg2ref、ighg2a、ighg3ref、ighg3a、ighg3b、ighg4ref、ighg4a、ighdref、igheref、ighmref、ighma或ighmb恒定區(qū);并且啟動子對于重鏈表達是可操作的(例如在哺乳動物cho或hek293細胞中)并且其中啟動子不是天然人啟動子。

      在一個實施方案中,啟動子序列是人igk3-15啟動子。

      10.方面6–9中任一項的抗體、多肽或核苷酸序列,其中所述可變結(jié)構(gòu)域包含小鼠aid模式體細胞突變和/或小鼠末端脫氧核苷酸轉(zhuǎn)移酶(tdt)模式連接突變。

      例如,在本發(fā)明的這一配置的任何方面,為了提供小鼠aid模式體細胞突變和/或小鼠末端脫氧核苷酸轉(zhuǎn)移酶(tdt)模式連接突變,一種方法是從非人脊椎動物或細胞中選擇可變結(jié)構(gòu)域。例如,如本文公開的脊椎動物或細胞。

      11.載體(例如cho細胞或hek293細胞載體),其包含方面8、9或10的核酸;任選其中所述載體在宿主細胞(例如cho細胞或hek293細胞)中。

      12.藥物組合物,其包含方面6、7和10中任一項的抗體或多肽,連同藥學可接受的賦形劑、稀釋劑或藥物(例如進一步的抗原特異性可變結(jié)構(gòu)域、抗體鏈或抗體)。

      13.方面6、7和10中任一項的抗體或多肽,其用于治療和/或預防人類患者中的醫(yī)學狀況。

      14.方面6、7和10中任一項的抗體或多肽制造用于治療和/或預防人類患者中的醫(yī)學狀況的藥物的用途。

      15.方面13或14的抗體、多肽或用途,其中所述人類是選自群體編號1-14的人類群體的成員,其中所述群體如下編號(群體標記根據(jù)1000genomesproject命名法)

      1=asw;

      2=ceu;

      3=chb;

      4=chs;

      5=clm;

      6=fin;

      7=gbr;

      8=ibs;

      9=j(luò)pt;

      10=lwk;

      11=mxl;

      12=pur;

      13=tsi;

      14=y(tǒng)ri。

      16.方面15的抗體、多肽或用途,其中所述恒定區(qū)是

      (i)igha1a恒定區(qū),并且所述人類群體選自任何群體編號1-14;

      (ii)igha2a恒定區(qū),并且所述人類群體選自任何群體編號1-14;

      (iii)igha2b恒定區(qū),并且所述人類群體選自任何群體編號1-14;

      (iv)ighg2a恒定區(qū),并且所述人類群體選自任何群體編號1-9和11-13;

      (v)ighg3a恒定區(qū),并且所述人類群體選自任何群體編號1-14;

      (vi)ighg3b恒定區(qū),并且所述人類群體選自任何群體編號1-8和11-13;

      (vii)ighg4a恒定區(qū),并且所述人類群體選自任何群體編號1-9和11-13;

      (viii)ighma恒定區(qū),并且所述人類群體選自任何群體編號1-14;或

      (ix)ighmb恒定區(qū),并且所述人類群體選自任何群體編號1-14;

      其中所述群體如下編號(群體標記根據(jù)1000genomesproject命名法)

      1=asw;

      2=ceu;

      3=chb;

      4=chs;

      5=clm;

      6=fin;

      7=gbr;

      8=ibs;

      9=j(luò)pt;

      10=lwk;

      11=mxl;

      12=pur;

      13=tsi;

      14=y(tǒng)ri。

      17.載體(例如cho細胞或hek293細胞載體),其包含ighg1ref、ighg2ref、ighg2a、ighg3ref、ighg3a、ighg3b、ighg4ref或ighg4a恒定區(qū)核苷酸序列,其為用于插入人抗體重鏈可變結(jié)構(gòu)域核苷酸序列的克隆位點的3',從而使得在此類可變結(jié)構(gòu)域序列插入后,載體包含(在5'到3'方向)啟動子、前導序列、可變結(jié)構(gòu)域序列和恒定區(qū)序列,從而使得當存在于宿主細胞中時,載體能夠表達人抗體重鏈。

      在第六配置中,本發(fā)明提供了

      在相同基因組中順式或反式的多重變體

      本發(fā)明人的分析已揭示如表13和表14中闡述的天然存在的人抗體基因區(qū)段變體的分組。這揭示在非人脊椎動物和細胞中產(chǎn)生轉(zhuǎn)基因基因組的可能性,其中基因組所含有的超過特定人基因區(qū)段的天然人互補體。在一個例子中,這可以通過在各自ig基因座中的一個或兩個上(例如在小鼠基因組或小鼠細胞基因組中容納igh的一條或兩條染色體上)提供特定基因區(qū)段類型的超過天然人互補體來實現(xiàn)。

      為此,本發(fā)明的這一配置提供了下述(如編號段落中闡述的):

      1.具有基因組的非人脊椎動物(例如小鼠或大鼠)或非人脊椎動物細胞(例如es細胞或b細胞),所述基因組包含相同類型的至少3個人可變區(qū)基因區(qū)段(例如至少3個人vh6-1基因區(qū)段、至少3個人jh6基因區(qū)段、至少3個人vκ1-39基因區(qū)段、至少3個人d2-2基因區(qū)段或至少3個人jκ1基因區(qū)段),其中所述人基因區(qū)段中的至少兩個是彼此不相同的變體。

      例如,基因組包含可變區(qū),其包含恒定區(qū)上游的v、d和j基因區(qū)段(用于重鏈基因座的可變區(qū))或v和j基因區(qū)段(用于輕鏈基因座的可變區(qū)),分別用于表達重或輕鏈。

      在替代方案中,通過提供人基因區(qū)段的一個變體類型的幾個拷貝,技術(shù)人員可以選擇提供特定基因區(qū)段類型的超過野生型人互補體。因此,提供了

      具有基因組的非人脊椎動物(例如小鼠或大鼠)或非人脊椎動物細胞(例如es細胞或b細胞),所述基因組包含相同類型的至少3個人可變區(qū)基因區(qū)段(例如至少3個人vh6-1基因區(qū)段、至少3個人jh6基因區(qū)段、至少3個人vκ1-39基因區(qū)段、至少3個人d2-2基因區(qū)段或至少3個人jκ1基因區(qū)段),其中人基因區(qū)段是相同變體。

      例如,基因組包含可變區(qū),其包含恒定區(qū)上游的v、d和j基因區(qū)段(用于重鏈基因座的可變區(qū))或v和j基因區(qū)段(用于輕鏈基因座的可變區(qū)),分別用于表達重或輕鏈。

      2.具有基因組的非人脊椎動物(例如小鼠或大鼠)或非人脊椎動物細胞(例如es細胞或b細胞),所述基因組包含在相同ig基因座處順式的相同類型的至少2個不同的非內(nèi)源可變區(qū)基因區(qū)段(例如至少2個人vh6-1基因區(qū)段、至少3個人jh6基因區(qū)段、至少2個人vκ1-39基因區(qū)段、至少2個人d2-2基因區(qū)段或至少2個人jκ1基因區(qū)段)。

      在替代方案中,通過提供人基因區(qū)段的一個變體類型的幾個拷貝,技術(shù)人員可以選擇提供特定基因區(qū)段類型的超過野生型人互補體。因此,提供了

      具有基因組的非人脊椎動物(例如小鼠或大鼠)或非人脊椎動物細胞(例如es細胞或b細胞),所述基因組包含在相同ig基因座處順式的相同變體類型的至少2個非內(nèi)源可變區(qū)基因區(qū)段(例如至少2個人jh6*02基因區(qū)段)。

      3.具有基因組的非人脊椎動物(例如小鼠或大鼠)或非人脊椎動物細胞(例如es細胞或b細胞),所述基因組包含在相同ig基因座處反式的相同類型的至少2個不同的人可變區(qū)基因區(qū)段(例如至少2個人vh6-1基因區(qū)段、至少2個人jh6基因區(qū)段、至少2個人vκ1-39基因區(qū)段、至少2個人d2-2基因區(qū)段或至少2個人jκ1基因區(qū)段);和任選存在的相同類型的第三人基因區(qū)段,其中所述第三基因區(qū)段與所述2個不同基因區(qū)段之一是順式的。

      在替代方案中,通過提供人基因區(qū)段的一個變體類型的幾個拷貝,技術(shù)人員可以選擇提供特定基因區(qū)段類型的超過野生型人互補體。因此,提供了

      具有基因組的非人脊椎動物(例如小鼠或大鼠)或非人脊椎動物細胞(例如es細胞或b細胞),所述基因組包含在相同ig基因座處反式的相同變體類型的至少2個不同的人可變區(qū)基因區(qū)段(例如至少2個人jh6*02基因區(qū)段);和任選存在的相同變體類型的第三人基因區(qū)段,其中所述第三基因區(qū)段與所述2個不同基因區(qū)段之一是順式的。

      4.包含人可變區(qū)基因區(qū)段的庫集的非人脊椎動物(例如小鼠或大鼠)群體,其中所述多個包含相同類型的至少2個人可變區(qū)基因區(qū)段(例如至少2個人vh6-1基因區(qū)段、至少2個人jh6基因區(qū)段、至少2個人vκ1-39基因區(qū)段、至少2個人d2-2基因區(qū)段或至少2個人jκ1基因區(qū)段),所述不同基因區(qū)段中的第一個在群體的第一脊椎動物的基因組中提供,并且所述不同基因區(qū)段中的第二個在群體的第二脊椎動物的基因組中提供,其中所述第一脊椎動物的基因組不包含所述第二基因區(qū)段。

      5.具有基因組的非人脊椎動物(例如小鼠或大鼠)或非人脊椎動物細胞(例如es細胞或b細胞),所述基因組包含相同類型的至少2個不同的非內(nèi)源可變區(qū)基因區(qū)段(例如至少2個人vh6-1基因區(qū)段、至少2個人jh6基因區(qū)段、至少2個人vκ1-39基因區(qū)段、至少2個人d2-2基因區(qū)段或至少2個人jκ1基因區(qū)段),其中所述基因區(qū)段衍生自不同人類個體的基因組序列,所述人類個體在至少3代以上是遺傳學不相關(guān)的。

      6.增強非人脊椎動物(例如小鼠或大鼠)的人免疫球蛋白基因多樣性的方法,所述方法包括給脊椎動物提供基因組,所述基因組包含相同類型的至少3個人可變區(qū)基因區(qū)段(例如至少3個人vh6-1基因區(qū)段、至少3個人jh6基因區(qū)段、至少3個人vκ1-39基因區(qū)段、至少3個人d2-2基因區(qū)段或至少3個人jκ1基因區(qū)段),其中所述人基因區(qū)段中的至少兩個是彼此不相同的變體。

      7.增強非人脊椎動物(例如小鼠或大鼠)的免疫球蛋白基因多樣性的方法,所述方法包括給脊椎動物提供基因組,所述基因組包含在相同ig基因座處順式的相同類型的至少2個不同的非內(nèi)源可變區(qū)基因區(qū)段(例如至少2個人vh6-1基因區(qū)段、至少2個人jh6基因區(qū)段、至少2個人vκ1-39基因區(qū)段、至少2個人d2-2基因區(qū)段或至少2個人jκ1基因區(qū)段)。

      8.增強非人脊椎動物(例如小鼠或大鼠)的免疫球蛋白基因多樣性的方法,所述方法包括給脊椎動物提供基因組,所述基因組包含在相同ig基因座處反式的相同類型的至少2個不同的人可變區(qū)基因區(qū)段(例如至少2個人vh6-1基因區(qū)段、至少2個人jh6基因區(qū)段、至少2個人vκ1-39基因區(qū)段、至少2個人d2-2基因區(qū)段或至少2個人jκ1基因區(qū)段);和任選存在的相同類型的第三人基因區(qū)段,其中所述第三基因區(qū)段與所述2個不同基因區(qū)段之一是順式的。

      9.提供增強的人免疫球蛋白可變區(qū)基因區(qū)段庫集的方法,所述方法包括提供包含人可變區(qū)基因區(qū)段的庫集的非人脊椎動物(例如小鼠或大鼠)群體,其中所述方法包括提供相同類型的至少2個不同的人可變區(qū)基因區(qū)段(例如至少2個人vh6-1基因區(qū)段、至少2個人jh6基因區(qū)段、至少2個人vκ1-39基因區(qū)段、至少2個人d2-2基因區(qū)段或至少2個人jκ1基因區(qū)段),其中所述不同基因區(qū)段中的第一個在群體的第一脊椎動物的基因組中提供,并且所述不同基因區(qū)段中的第二個在群體的第二脊椎動物的基因組中提供,其中所述第一脊椎動物的基因組不包含所述第二基因區(qū)段。

      10.增強非人脊椎動物(例如小鼠或大鼠)的人免疫球蛋白基因多樣性的方法,所述方法包括給脊椎動物提供基因組,所述基因組包含相同類型的至少2個不同的非內(nèi)源可變區(qū)基因區(qū)段(例如至少2個人vh6-1基因區(qū)段、至少2個人jh6基因區(qū)段、至少2個人vκ1-39基因區(qū)段、至少2個人d2-2基因區(qū)段或至少2個人jκ1基因區(qū)段),其中所述基因區(qū)段衍生自不同人類個體的基因組序列,所述人類個體在至少3代以上是遺傳學不相關(guān)的。

      11.任何前述段落的脊椎動物、細胞或方法,其中所述不同基因區(qū)段中的至少2或3個在所述基因組中的相同ig基因座處以順式提供。

      12.任何前述段落的脊椎動物、細胞或方法,其中所述基因區(qū)段衍生自不同人類個體的基因組序列,所述人類個體在至少3代以上是遺傳學不相關(guān)的。

      13.任何前述段落的脊椎動物、細胞或方法,其中所述基因區(qū)段衍生自兩個或更多個不同人類個體的基因組序列;任選其中所述不同人類個體來自不同人類群體。

      14.段落13的脊椎動物、細胞或方法,其中所述個體是遺傳學不相關(guān)的。

      15.增強非人脊椎動物(例如小鼠或大鼠)的人免疫球蛋白基因多樣性的方法,所述方法包括給脊椎動物提供基因組,所述基因組包含相同類型的至少2個人可變區(qū)基因區(qū)段(例如至少2個人vh6-1基因區(qū)段、至少2個人jh6基因區(qū)段、至少2個人vκ1-39基因區(qū)段、至少2個人d2-2基因區(qū)段或至少2個人jκ1基因區(qū)段),其中所述基因區(qū)段衍生自不同人類個體的基因組序列,所述人類個體在至少3代以上是遺傳學不相關(guān)的;任選其中所述不同基因區(qū)段中的至少2或3個在所述基因組中的相同ig基因座處提供。

      16.段落15的方法,其中所述不同人類個體來自不同人類群體。

      17.段落15的方法,其中所述個體是遺傳學不相關(guān)的。

      18.前述段落的脊椎動物、細胞或方法,其中所述不同區(qū)段的至少一個是人類種系基因區(qū)段的合成突變體。

      19.任何前述段落的脊椎動物、細胞或方法,其中每個所述基因區(qū)段在10個或更多個不同人類群體中出現(xiàn)。

      20.前述段落的脊椎動物、細胞或方法,其中每個所述基因區(qū)段具有5%或更大(例如10、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90或95%或更大)的人頻率。

      在這方面,技術(shù)人員可以由表14中提供的信息指導。

      頻率可以例如是在1000genomes數(shù)據(jù)庫中的累積頻率。

      21.段落20的脊椎動物、細胞或方法,其中每個所述基因區(qū)段在10個或更多個不同人類群體中出現(xiàn)。

      22.任何前述段落的脊椎動物、細胞或方法,其中每個所述基因區(qū)段在1000genomes數(shù)據(jù)庫中的超過50個個體中出現(xiàn)。

      23.前述段落的脊椎動物、細胞或方法,其中每個所述基因區(qū)段(i)具有5%或更大(例如10、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90或95%或更大)的人頻率;和(ii)在10個或更多個不同人類群體中出現(xiàn)。

      在這方面,技術(shù)人員可以由表14中提供的信息指導。

      頻率可以例如是在1000genomes數(shù)據(jù)庫中的累積頻率。

      24.具有基因組的非人脊椎動物(例如小鼠或大鼠)或非人脊椎動物細胞(例如es細胞或b細胞),所述基因組包含相同類型的第一和第二人ig基因座基因區(qū)段(例如第一和第二人jh6基因區(qū)段;或第一和第二igg2基因區(qū)段;或第一和第二人jλ7基因區(qū)段),其中所述第一基因區(qū)段是選自表14的基因區(qū)段(例如ighj6-a)并且所述第二基因區(qū)段是相應參考序列(例如ighj6ref;seqidno:244)。

      表14列出通常出現(xiàn)的天然人變體。可見這些跨越許多人類群體出現(xiàn),并且因此有用地具有用于基于抗體的人類藥物的廣泛適用性。

      例如,基因區(qū)段作為插入內(nèi)源非人脊椎動物ig基因座內(nèi)的靶向插入片段提供??商娲?,可以進行如本領(lǐng)域已知的隨機整合(例如使用yac)。

      例如,基因組包含可變區(qū),其包含恒定區(qū)上游的v、d和j基因區(qū)段(用于重鏈基因座的可變區(qū))或v和j基因區(qū)段(用于輕鏈基因座的可變區(qū)),分別用于表達重或輕鏈。

      在另一個實施方案中,本發(fā)明使技術(shù)人員能夠選擇兩個或更多個不同的天然存在的人基因區(qū)段變體,用于組合到非人脊椎動物或細胞的基因組內(nèi)。無需包括參考序列??赡芟M褂靡粋€或多個罕見基因區(qū)段以增加庫集的多樣性。另外或可替代地,可能希望包括相同類型的頻繁和罕見變體的混合物以提供庫集多樣性。變體可以另外或可替代地選擇以定制對一個或多個特定人類群體的基因區(qū)段包括,如由表13或表14中提供的信息指出的。

      因此,本發(fā)明提供了

      具有基因組的非人脊椎動物(例如小鼠或大鼠)或非人脊椎動物細胞(例如es細胞或b細胞),所述基因組包含相同類型的第一和第二人ig基因座基因區(qū)段(例如第一和第二人jh6基因區(qū)段;或第一和第二igg2基因區(qū)段;或第一和第二人jλ7基因區(qū)段),其中所述基因區(qū)段是選自表13或表14的基因區(qū)段;和任選其中所述基因區(qū)段中的一個或多個在表14中出現(xiàn)(例如ighj6-a)或是參考序列(例如ighj6ref;seqidno:244)。

      25.段落24的脊椎動物或細胞,其中所述基因組包含所述類型的第三人基因區(qū)段,所述第三基因區(qū)段不同于所述第一和第二基因區(qū)段。

      26.段落24或25的脊椎動物或細胞,其中所述第一和第二基因區(qū)段在相同染色體上是順式的;和任選所述第三基因區(qū)段在所述染色體上也是順式的。

      27.段落26的脊椎動物或細胞,其中所述基因區(qū)段是插入內(nèi)源非人ig基因座內(nèi)的靶向插入片段。

      例如,基因區(qū)段是重鏈基因區(qū)段并且非人基因座是igh基因座。例如,基因區(qū)段是輕鏈(κ或λ)基因區(qū)段并且非人基因座是igl基因座。

      28.段落24或25的脊椎動物或細胞,其中所述第一和第二基因區(qū)段在不同染色體上是反式的。

      因此,染色體是相同類型(例如兩個小鼠染色體6或大鼠染色體4)。

      29.段落24–28中任一項的脊椎動物或細胞,其中所述第一基因區(qū)段是選自表1-7和9–14(例如選自表13或表14)中任何一個的基因區(qū)段并且所述第二基因區(qū)段是相應參考序列。

      30.非人脊椎動物(例如小鼠或大鼠)群體,其包含相同類型的第一和第二人ig基因座基因區(qū)段(例如第一和第二人jh6基因區(qū)段;或第一和第二igg2基因區(qū)段;或第一和第二人jλ7基因區(qū)段),其中所述第一基因區(qū)段是選自表1-7和9–14(例如表13或表14)中任何一個的基因區(qū)段(例如ighj6-a)并且所述第二基因區(qū)段是相應參考序列(例如seqidno:7),其中所述第一基因區(qū)段在群體的第一脊椎動物的基因組中提供,并且所述第二基因區(qū)段在群體的第二脊椎動物的基因組中提供。

      31.段落30的群體,其中所述第一脊椎動物的基因組不包含所述第二基因區(qū)段。

      32.段落30或31的群體,其中所述群體包含所述類型的第三人基因區(qū)段,所述第三基因區(qū)段不同于所述第一和第二基因區(qū)段,并且任選其中所述第一和第三基因區(qū)段存在于第一脊椎動物的基因組中。

      33.段落30、31或32的群體,其中所述基因區(qū)段是插入各自基因組中的內(nèi)源非人ig基因座內(nèi)的靶向插入片段。

      例如,基因區(qū)段是重鏈基因區(qū)段并且非人基因座是igh基因座。例如,基因區(qū)段是輕鏈(κ或λ)基因區(qū)段并且非人基因座是igl基因座。

      34.段落30–33中任一項的段落,其中所述第一基因區(qū)段是選自表1-7和9–14(例如表13或表14)中任何一個的基因區(qū)段并且所述第二基因區(qū)段是相應參考序列。

      35.增強非人脊椎動物(例如小鼠或大鼠)的人免疫球蛋白基因多樣性的方法,所述方法包括給脊椎動物提供基因組,所述基因組包含相同類型的第一和第二人ig基因座基因區(qū)段(例如第一和第二人jh6基因區(qū)段;或第一和第二igg2基因區(qū)段;或第一和第二人jλ7基因區(qū)段),其中所述第一基因區(qū)段是選自表1-7和9–14(例如表13或表14)中任何一個的基因區(qū)段(例如ighj6-a)并且所述第二基因區(qū)段是相應參考序列(例如seqidno:7)。

      36.提供增強的人免疫球蛋白基因區(qū)段庫集的方法,所述方法包括根據(jù)段落30–33中任一項的群體。

      少數(shù)群體中流行的變體

      在另一個方面,值得注意的是某些人基因區(qū)段變體可以在群體的一個或少數(shù)中相對頻繁地出現(xiàn),但跨越許多不同人類群體未流行地發(fā)現(xiàn)。存在這樣的想法:由于反復暴露于群體通常暴露于其的抗原(例如疾病病原體抗原),特定種系基因區(qū)段庫集已在個別人類種族群體中進化。反復暴露和突變可能已導致可以在群體中提供針對所述抗原(病原體)的有效應答的基因區(qū)段變體進化,并且這可以解釋這些群體中的基因區(qū)段的保守(與可能未頻繁遇到該抗原的其他人類種族群體相反)??紤]到這點,本發(fā)明人從其分析中鑒定這樣的基因區(qū)段變體,其在少數(shù)人類群體中相對流行,但跨越許多群體則不是。本發(fā)明人認識到在本發(fā)明的配置中包括此類基因區(qū)段中的一個或多個(例如在轉(zhuǎn)基因ig基因座、脊椎動物和細胞中)將可用于產(chǎn)生抗體、ig鏈和可變結(jié)構(gòu)域,其可以針對少數(shù)人類群體可能變得暴露于其的抗原(例如引起疾病的抗原或病原體)。此類產(chǎn)物將可用于治療和/或預防此類群體成員中的疾病或醫(yī)學狀況。這個方面還可以用于解決感染性疾病病原體,其可能在少數(shù)群體中是常見的,但在未來或在進化中相對近期已變成在其他人類群體中更流行的引起疾病的病原體(即針對所討論的一種或多種基因區(qū)段變體在表13中未列出的那些)。為此,從1000genomes數(shù)據(jù)庫中,本發(fā)明人已鑒定表20中列出的基因區(qū)段變體。

      因此,根據(jù)本文描述的任何配置或方面,在本發(fā)明中使用的基因區(qū)段中的一個、多個或全部可以是表20a、20b、20c或20d中列出的基因區(qū)段。

      多重jh基因區(qū)段變體

      這一配置的具體應用是如下的多重人jh基因區(qū)段的提供。

      具有基因組的非人脊椎動物(例如小鼠或大鼠)或非人脊椎動物細胞(例如es細胞或b細胞),所述基因組包含相同類型的至少3個人jh基因區(qū)段(jh1、jh2、jh3、jh4、jh5或jh6),其中所述人jh基因區(qū)段中的至少兩個是彼此不相同的變體。

      在一個例子中,本發(fā)明的任何細胞均為分離的細胞?!胺蛛x的”細胞是已由其生產(chǎn)環(huán)境(例如天然或重組)的組分鑒定、分離和/或回收的細胞。優(yōu)選地,分離的細胞不與來自其生產(chǎn)環(huán)境的所有其他組分結(jié)合,例如從而使得細胞可以產(chǎn)生關(guān)于fda可批準或批準標準的抗體。它的生產(chǎn)環(huán)境的污染物組分例如得自重組轉(zhuǎn)染的細胞的那種,是通常干擾所得抗體的研究、診斷或治療用途的材料,并且可以包括酶、激素及其他蛋白質(zhì)或非蛋白質(zhì)溶質(zhì)。在優(yōu)選實施方案中,多肽將純化:(1)至如通過例如lowry法測定的,按抗體的重量計大于95%,并且在一些實施方案中,至按重量計大于99%;(2)至足以通過使用轉(zhuǎn)杯式序列分析儀獲得n末端或內(nèi)部氨基酸序列的至少15個殘基的程度,或(3)至使用考馬斯藍或優(yōu)選的銀染色,通過sds-page在非還原或還原條件下的同質(zhì)性。然而,通常分離的細胞將通過至少一個純化步驟進行制備。

      具有基因組的非人脊椎動物(例如小鼠或大鼠)或非人脊椎動物細胞(例如es細胞或b細胞),所述基因組包含在相同ig(例如igh,例如內(nèi)源igh,例如小鼠或大鼠igh)基因座處順式的相同類型(jh1、jh2、jh3、jh4、jh5或jh6)的至少2個不同的非內(nèi)源jh基因區(qū)段(例如人基因區(qū)段)。在一個例子中,該基因組包括包含所述不同jh基因區(qū)段的人vh、d和jh庫集。任選地,非內(nèi)源jh基因區(qū)段是非小鼠或非大鼠的,例如人jh基因區(qū)段。在一個例子中,非內(nèi)源基因區(qū)段中的一個或多個或全部是合成的。

      具有基因組的非人脊椎動物(例如小鼠或大鼠)或非人脊椎動物細胞(例如es細胞或b細胞),所述基因組包含在相同ig(例如igh,例如內(nèi)源igh,例如小鼠或大鼠igh)基因座處反式的相同類型(jh1、jh2、jh3、jh4、jh5或jh6)的至少2個不同的人jh基因區(qū)段;和任選存在的相同類型的第三人jh基因區(qū)段,其中所述第三jh與所述2個不同的人jh基因區(qū)段之一是順式的。

      包含人jh基因區(qū)段的庫集的非人脊椎動物(例如小鼠或大鼠)群體,其中所述多個包含相同類型(jh1、jh2、jh3、jh4、jh5或jh6)的至少2個不同的人jh基因區(qū)段,所述不同的jh基因區(qū)段中的第一個在群體的第一脊椎動物的基因組中提供,并且所述不同的jh基因區(qū)段中的第二個在群體的第二脊椎動物的基因組中提供,其中所述第一脊椎動物的基因組不包含所述第二jh基因區(qū)段。

      具有基因組的非人脊椎動物(例如小鼠或大鼠)或非人脊椎動物細胞(例如es細胞或b細胞),所述基因組包含相同類型(jh1、jh2、jh3、jh4、jh5或jh6)的至少2個不同的非內(nèi)源(例如人)jh基因區(qū)段,其中所述jh基因區(qū)段衍生自不同人類個體的基因組序列,所述人類個體在至少3代(例如3、4、5或6代)以上是遺傳學不相關(guān)的。任選地,非內(nèi)源jh基因區(qū)段是人jh基因區(qū)段。在一個例子中,非內(nèi)源基因區(qū)段中的一個或多個或全部是合成的。

      增強非人脊椎動物(例如小鼠或大鼠)的人免疫球蛋白基因多樣性的方法,所述方法包括給脊椎動物提供基因組,所述基因組包含相同類型(jh1、jh2、jh3、jh4、jh5或jh6)的至少3個人jh基因區(qū)段,其中所述人jh基因區(qū)段中的至少兩個是彼此不相同的變體。

      增強非人脊椎動物(例如小鼠或大鼠)的免疫球蛋白基因多樣性的方法,所述方法包括給脊椎動物提供基因組,所述基因組包含在相同ig(例如igh,例如內(nèi)源igh,例如小鼠或大鼠igh)基因座)處順式的相同類型(jh1、jh2、jh3、jh4、jh5或jh6)的至少2個不同的非內(nèi)源(例如人)jh基因區(qū)段。任選地,非內(nèi)源jh基因區(qū)段是非小鼠或非大鼠的,例如人jh基因區(qū)段。在一個例子中,非內(nèi)源基因區(qū)段中的一個或多個或全部是合成的。

      增強非人脊椎動物(例如小鼠或大鼠)的免疫球蛋白基因多樣性的方法,所述方法包括給脊椎動物提供基因組,所述基因組包含在相同ig(例如igh,例如內(nèi)源igh,例如小鼠或大鼠igh)基因座處反式的相同類型(jh1、jh2、jh3、jh4、jh5或jh6)的至少2個不同的人jh基因區(qū)段;和任選存在的相同類型的第三人jh基因區(qū)段,其中所述第三jh與所述2個不同jh基因區(qū)段之一是順式的。

      提供增強的人免疫球蛋白jh基因區(qū)段庫集的方法,所述方法包括提供包含人jh基因區(qū)段的庫集的非人脊椎動物(例如小鼠或大鼠)群體,其中所述方法包括提供相同類型(jh1、jh2、jh3、jh4、jh5或jh6)的至少2個不同的人jh基因區(qū)段,其中所述不同的jh基因區(qū)段中的第一個在群體的第一脊椎動物的基因組中提供,并且所述不同的jh基因區(qū)段中的第二個在群體的第二脊椎動物的基因組中提供,其中所述第一脊椎動物的基因組不包含所述第二jh基因區(qū)段。

      增強非人脊椎動物(例如小鼠或大鼠)的人免疫球蛋白基因多樣性的方法,所述方法包括給脊椎動物提供基因組,所述基因組包含相同類型(jh1、jh2、jh3、jh4、jh5或jh6)的至少2個不同的非內(nèi)源(例如人)jh基因區(qū)段,其中所述jh基因區(qū)段衍生自不同人類個體的基因組序列,所述人類個體在至少3代(例如3、4、5或6代)以上是遺傳學不相關(guān)的。任選地,非內(nèi)源jh基因區(qū)段是人jh基因區(qū)段。在一個例子中,非內(nèi)源基因區(qū)段中的一個或多個或全部是合成的。

      在本發(fā)明的脊椎動物或細胞或方法的一個例子中,所述不同基因區(qū)段中的至少2或3個在所述基因組中的相同ig基因座處以順式提供。

      在本發(fā)明的脊椎動物或細胞或方法的一個例子中,jh基因區(qū)段衍生自不同人類個體的基因組序列,所述人類個體在至少3代(例如3、4、5或6代)以上是遺傳學不相關(guān)的。

      在本發(fā)明的脊椎動物或細胞或方法的一個例子中,jh基因區(qū)段衍生自兩個或更多個不同人類個體的基因組序列;任選其中所述不同人類個體來自不同人類群體。

      在本發(fā)明的脊椎動物或細胞或方法的一個例子中,所述個體是遺傳學不相關(guān)的(例如回溯3、4、5或6代)。

      在本發(fā)明的脊椎動物或細胞或方法的一個例子中,不同jh基因區(qū)段中的至少一個是人類種系jh基因區(qū)段的合成突變體。

      本發(fā)明還提供了增強非人脊椎動物(例如小鼠或大鼠)的人免疫球蛋白基因多樣性的方法,所述方法包括給脊椎動物提供基因組,所述基因組包含相同類型(jh1、jh2、jh3、jh4、jh5或jh6)的至少2個人jh基因區(qū)段,其中所述jh基因區(qū)段衍生自不同人類個體的基因組序列,所述人類個體在至少3代(例如3、4、5或6代)以上是遺傳學不相關(guān)的;任選其中所述不同基因區(qū)段中的至少2或3個在所述基因組中的相同igh基因座處提供。

      在本發(fā)明的這一實施方案的脊椎動物或細胞或方法的一個例子中,基因組包含補充有一個、兩個或更多個人jh基因區(qū)段的人jh基因區(qū)段類型的基本上全部功能性庫集,其中所述基本上全部功能性庫集和補充性jh基因區(qū)段在人類個體的種系基因組中未發(fā)現(xiàn)在一起。

      在本發(fā)明的群體的一個例子中,該群體包含補充有一個、兩個或更多個人jh基因區(qū)段的人jh基因區(qū)段類型的基本上全部功能性庫集,其中所述基本上全部功能性庫集和補充性jh基因區(qū)段在人類個體的種系基因組中未發(fā)現(xiàn)在一起。

      具有基因組的非人脊椎動物(例如小鼠或大鼠)或非人脊椎動物細胞(例如es細胞或b細胞),所述基因組包含補充有一個、兩個或更多個人jh基因區(qū)段的人jh基因區(qū)段類型的基本上全部功能性庫集,其中所述基本上全部功能性庫集和補充性jh基因區(qū)段在人類個體的種系基因組中未發(fā)現(xiàn)在一起。

      非人脊椎動物(例如小鼠或大鼠)群體,其包含補充有一個、兩個或更多個人jh基因區(qū)段的人jh基因區(qū)段類型的基本上全部功能性庫集,其中所述基本上全部功能性庫集和補充性jh基因區(qū)段在人類個體的種系基因組中未發(fā)現(xiàn)在一起。

      在脊椎動物或群體的一個例子中,所述jh基因區(qū)段中的至少一個是seqidno:1、2、3或4。例如,所述jh基因區(qū)段中的至少一個是seqidno:1,并且所述補充性jh基因區(qū)段中的至少一個、兩個或更多個是根據(jù)上文任何例子的變體。例如,所述jh基因區(qū)段中的至少一個是seqidno:2,并且所述補充性jh基因區(qū)段中的至少一個、兩個或更多個是根據(jù)上文例子中任何一個的變體。例如,所述jh基因區(qū)段中的至少一個是seqidno:2,并且所述補充性jh基因區(qū)段中的至少一個、兩個或更多個是根據(jù)上文例子中任何一個的變體。

      在一個實施方案中,本發(fā)明的非人脊椎動物或脊椎動物細胞包含基因組,其包括包含人基因區(qū)段的vh、d和jh基因庫集,所述jh基因庫集(例如人jh基因區(qū)段庫集)包含:

      在所述基因組中的相同ig基因座處順式的由至少2個不同的jh1基因區(qū)段提供的多個jh1基因區(qū)段;

      在所述基因組中的相同ig基因座處順式的由至少2個不同的jh2基因區(qū)段提供的多個jh2基因區(qū)段;

      在所述基因組中的相同ig基因座處順式的由至少2個不同的jh3基因區(qū)段提供的多個jh3基因區(qū)段;

      在所述基因組中的相同ig基因座處順式的由至少2個不同的jh4基因區(qū)段提供的多個jh4基因區(qū)段;

      在所述基因組中的相同ig基因座處順式的由至少2個不同的jh5基因區(qū)段提供的多個jh5基因區(qū)段;和/或

      在所述基因組中的相同ig基因座處順式的由至少2個不同的jh6基因區(qū)段提供的多個jh6基因區(qū)段;

      任選其中所述jh基因區(qū)段衍生自兩個或更多個不同人類個體的基因組序列。

      任選所述至少2個不同的jh基因區(qū)段是人基因區(qū)段或衍生自人基因區(qū)段的合成基因區(qū)段。

      任選地,ig基因座是igh基因座,例如內(nèi)源基因座,例如小鼠或大鼠igh基因座。

      在一個實施方案中,本發(fā)明的非人脊椎動物或脊椎動物細胞包含基因組,其包括包含人基因區(qū)段的vh、d和jh基因庫集,所述jh基因庫集(例如人jh基因區(qū)段庫集)包含:

      由至少3個不同的jh1基因區(qū)段提供的多個jh1基因區(qū)段;

      由至少3個不同的jh2基因區(qū)段提供的多個jh2基因區(qū)段;

      由至少3個不同的jh3基因區(qū)段提供的多個jh3基因區(qū)段;

      由至少3個不同的jh4基因區(qū)段提供的多個jh4基因區(qū)段;

      由至少3個不同的jh5基因區(qū)段提供的多個jh5基因區(qū)段;和/或

      由至少3個不同的jh6基因區(qū)段提供的多個jh6基因區(qū)段;

      任選其中所述jh基因區(qū)段衍生自兩個或三個不同人類個體的基因組序列;

      任選其中所述不同基因區(qū)段中的至少2或3個在所述基因組中的相同ig基因座處以順式提供。

      任選所述至少3個不同的jh基因區(qū)段是人基因區(qū)段或衍生自人基因區(qū)段的合成基因區(qū)段。

      任選地,ig基因座是igh基因座,例如內(nèi)源基因座,例如小鼠或大鼠igh基因座。

      任選地,在脊椎動物或細胞中,不同人類個體來自不同人類群體。

      任選地,在脊椎動物或細胞中,所述個體是遺傳學不相關(guān)的(例如回溯3、4、5或6代)。

      任選地,在脊椎動物或細胞中,不同jh基因區(qū)段中的至少一個是人類種系jh基因區(qū)段的合成突變體。

      在根據(jù)本發(fā)明的非人脊椎動物或脊椎動物細胞(任選es細胞或b細胞)的一個實施方案中,該脊椎動物或細胞基因組包含人vh、d和jh基因庫集,所述jh基因庫集(例如人jh基因庫集)包含:

      由至少2個不同的人jh1基因區(qū)段提供的多個jh1基因區(qū)段,任選在所述基因組中的相同ig基因座處以順式提供;

      由至少2個不同的人jh2基因區(qū)段提供的多個jh2基因區(qū)段,任選在所述基因組中的相同ig基因座處以順式提供;

      由至少2個不同的人jh3基因區(qū)段提供的多個jh3基因區(qū)段,任選在所述基因組中的相同ig基因座處以順式提供;

      由至少2個不同的人jh4基因區(qū)段提供的多個jh4基因區(qū)段,任選在所述基因組中的相同ig基因座處以順式提供;

      由至少2個不同的人jh5基因區(qū)段提供的多個jh5基因區(qū)段,任選在所述基因組中的相同ig基因座處以順式提供;和/或

      由至少2個不同的人jh6基因區(qū)段提供的多個jh6基因區(qū)段,任選在所述基因組中的相同ig基因座處以順式提供;

      其中所述jh基因區(qū)段衍生自不同人類個體的基因組序列,所述人類個體在至少3代(例如3、4、5或6代)以上是遺傳學不相關(guān)的。

      任選所述至少2個不同的jh基因區(qū)段是人基因區(qū)段或衍生自人基因區(qū)段的合成基因區(qū)段。

      任選地,ig基因座是igh基因座,例如內(nèi)源基因座,例如小鼠或大鼠igh基因座。

      任選地,在脊椎動物或細胞中,所述人類個體來自不同人類群體。

      jh5

      一個實施方案提供了本發(fā)明的脊椎動物、細胞或群體,其基因組包含多個jh5基因區(qū)段,其中所述多個包含seqidno:1的人jh5基因變體,其中所述變體包含在對應于人染色體14上的下述位置的一個或多個位置處的核苷酸突變:

      106,330,024

      106,330,027

      106,330,032

      106,330,041

      106.330.44

      106.330.45

      106.330.62

      106.330.63

      106.330.65

      106.330.66

      106.330.67

      106.330.68和

      106,330,071。

      在脊椎動物、細胞或群體中,任選地,所述多個包含seqidno:1的人jh5基因變體,其中所述變體在對應于人染色體14上第106,330,067位的位置處包含鳥嘌呤;且任選與seqidno:1序列相比不含進一步突變。

      任選地,該變體另外包含在對應于下述的位置處的突變:(i)在人染色體14上的第106,330,071位(任選另外突變是鳥嘌呤);(ii)在人染色體14上的第106,330,066位(任選的另外突變是鳥嘌呤);和/或(iii)在人染色體14上的第106,330,068位(任選另外突變是胸腺嘧啶)。

      任選地,所述多個包含seqidno:1的人jh5基因變體,其中所述變體在對應于人染色體14上第106,330,071位的位置處包含鳥嘌呤;且任選與seqidno:1序列相比不含進一步突變。

      任選地,該變體另外包含在對應于下述的位置處的突變:(i)在人染色體14上的第106,330,063位(任選另外突變是腺嘌呤);和/或(ii)在人染色體14上的第106,330,067位(任選另外突變是鳥嘌呤)。

      任選地,所述多個包含seqidno:1的人jh5基因變體,其中所述變體在對應于人染色體14上第106,330,045位的位置處包含胞嘧啶;且任選與seqidno:1序列相比不含進一步突變。

      任選地,所述多個包含seqidno:1的人jh5基因變體,其中所述變體在對應于人染色體14上第106,330,044位的位置處包含腺嘌呤;且任選與seqidno:1序列相比不含進一步突變。

      任選地,該變體另外包含在對應于下述的位置處的突變:(i)在人染色體14上的第106,330,66位(任選另外突變是鳥嘌呤);和/或(ii)在人染色體14上的第106,330,068位(任選另外突變是胸腺嘧啶)。

      任選地,所述多個包含seqidno:1的人jh5基因變體,其中所述變體在對應于人染色體14上第106,330,066位的位置處包含鳥嘌呤;且任選與seqidno:1序列相比不含進一步突變。

      任選地,該變體另外包含在對應于下述的位置處的突變:(i)在人染色體14上的第106,330,67位(任選另外突變是鳥嘌呤);和/或(ii)在人染色體14上的第106,330,068位(任選另外突變是胸腺嘧啶)。

      任選地,所述多個包含seqidno:1的人jh5基因變體,其中所述變體在對應于人染色體14上第106,330,068位的位置處包含胸腺嘧啶;且任選與seqidno:1序列相比不含進一步突變。

      任選地,該變體另外包含在對應于下述的位置處的突變:(i)在人染色體14上的第106,330,067位(任選另外突變是鳥嘌呤);和/或(ii)在人染色體14上的第106,330,066位(任選另外突變是鳥嘌呤)。

      任選地,所述多個包含seqidno:1的人jh5基因變體,其中所述變體在對應于人染色體14上第106,330,027位的位置處包含胞嘧啶;且任選與seqidno:1序列相比不含進一步突變。

      任選地,所述多個包含seqidno:1的人jh5基因變體,其中所述變體在對應于人染色體14上第106,330,024位的位置處包含腺嘌呤;且任選與seqidno:1序列相比不含進一步突變。

      任選地,所述多個包含seqidno:1的人jh5基因變體,其中所述變體在對應于人染色體14上第106,330,032位的位置處包含胸腺嘧啶;且任選與seqidno:1序列相比不含進一步突變。

      任選地,所述多個包含seqidno:1的人jh5基因變體,其中所述變體在對應于人染色體14上第106,330,041位的位置處包含胸腺嘧啶;且任選與seqidno:1序列相比不含進一步突變。

      任選地,所述多個包含seqidno:1的人jh5基因變體,其中所述變體在對應于人染色體14上第106,330,063位的位置處包含腺嘌呤或胸腺嘧啶;且任選與seqidno:1序列相比不含進一步突變。

      任選地,該變體另外包含在對應于人染色體14上第106,330,071位的位置處的突變(任選另外突變是鳥嘌呤)。

      任選地,所述多個包含seqidno:1的人jh5基因變體,其中所述變體在對應于人染色體14上第106,330,062位的位置處包含胞嘧啶;且任選與seqidno:1序列相比不含進一步突變。

      任選地,基因組包含seqidno:1;任選與變體中的一個、兩個或更多個在相同ig基因座處為順式。

      jh6

      一個實施方案提供了本發(fā)明的脊椎動物、細胞或群體,其基因組包含多個jh6基因區(qū)段,其中所述多個包含seqidno:2的人jh6基因變體,其中所述變體包含在對應于人染色體14上的下述位置的一個或多個位置處的核苷酸突變:

      106,329,411

      106.329.413

      106.329.414

      106,329,417

      106,329,419

      106,329,426

      106,329,434

      106,329,435和

      106,329,468。

      任選地,脊椎動物、細胞或群體的基因組包含多個jh6基因區(qū)段,其中所述多個包含seqidno:2的人jh6基因變體,其中所述變體在對應于人染色體14上第106,329,435位的位置處包含鳥嘌呤;且任選與seqidno:2序列相比不含進一步突變。

      任選地,該變體另外包含在對應于下述的位置處的突變:(i)在人染色體14上的第106,329,468位(任選另外突變是鳥嘌呤);(ii)在人染色體14上的第106,329,419位(任選另外突變是腺嘌呤);(iii)在人染色體14上的第106,329,434位(任選另外突變是胞嘧啶),和/或在人染色體14上的第106,329,414位(任選另外突變是鳥嘌呤);(iv)在人染色體14上的第106,329,426位(任選另外突變是腺嘌呤);(v)在人染色體14上的第106,329,413位(任選另外突變是腺嘌呤);(vi)在人染色體14上的第106,329,417位(任選另外突變是胸腺嘧啶);(vii)在人染色體14上的第106,329,411位(任選另外突變是胸腺嘧啶);(viii)在人染色體14上的第106,329,451位(任選另外突變是腺嘌呤);(ix)在人染色體14上的第106,329,452位(任選另外突變是胞嘧啶);和/或(x)在人染色體14上的第106,329,453位(任選另外突變是胞嘧啶)。

      任選地,該變體另外包含在對應于下述的位置處的突變:在人染色體14上的第106,329,451位,該另外突變是腺嘌呤;在人染色體14上的第106,329,452位,該另外突變是胞嘧啶;和在人染色體14上的第106,329,453位,該另外突變是胞嘧啶。

      脊椎動物、細胞或群體任選包含多個jh6基因區(qū)段,其中所述多個包含seqidno:2的人jh6基因變體,其中所述變體在對應于人染色體14上第106,329,468位的位置處包含鳥嘌呤;且任選與seqidno:2序列相比不含進一步突變。

      任選地,該變體另外包含在對應于人染色體14上第106,329,435位的位置處的突變(任選另外突變是鳥嘌呤)。

      任選地,脊椎動物、細胞或群體包含多個jh6基因區(qū)段,其中所述多個包含seqidno:2的人jh6基因變體,其中所述變體在對應于人染色體14上第106,329,417位的位置處包含胸腺嘧啶;且任選與seqidno:2序列相比不含進一步突變。

      任選地,該變體另外包含在對應于人染色體14上第106,329,435位的位置處的突變(任選另外突變是鳥嘌呤)。

      任選地,脊椎動物、細胞或群體包含多個jh6基因區(qū)段,其中所述多個包含seqidno:2的人jh6基因變體,其中所述變體在對應于人染色體14上第106,329,434位的位置處包含胞嘧啶;且任選與seqidno:2序列相比不含進一步突變。

      任選地,該變體另外包含在對應于下述的位置處的突變:(i)在人染色體14上的第106,329,414位(任選另外突變是鳥嘌呤);和/或(ii)在人染色體14上的第106,329,435位(任選另外突變是鳥嘌呤)。

      任選地,脊椎動物、細胞或群體包含多個jh6基因區(qū)段,其中所述多個包含seqidno:2的人jh6基因變體,其中所述變體在對應于人染色體14上第106,329,411位的位置處包含胸腺嘧啶;且任選與seqidno:2序列相比不含進一步突變。

      任選地,該變體另外包含在對應于人染色體14上第106,329,435位的位置處的突變(任選另外突變是鳥嘌呤)。

      任選地,脊椎動物、細胞或群體包含多個jh6基因區(qū)段,其中所述多個包含其為上述變體的反義序列的人jh6基因變體。

      任選地,基因組包含seqidno:2;任選與jh6變體中的一個、兩個或更多個在相同ig基因座處為順式。

      jh2

      一個實施方案提供了本發(fā)明的脊椎動物、細胞或群體,其基因組包含多個jh2基因區(qū)段,其中所述多個包含seqidno:3的人jh2基因變體,其中所述變體包含在對應于人染色體14上的下述位置的一個或多個位置處的核苷酸突變:

      106,331,455

      106,331,453和

      106,331,409。

      任選地,脊椎動物、細胞或群體包含所述多個jh2基因區(qū)段,其中所述多個包含seqidno:3的人jh2基因變體,其中所述變體在對應于人染色體14上第106,331,455位的位置處包含鳥嘌呤;且任選與seqidno:3序列相比不含進一步突變。

      任選地,該變體另外包含在對應于下述的位置處的突變:(i)在人染色體14上的第106,331,453位(任選另外突變是腺嘌呤);和/或(ii)在人染色體14上的第106,331,409位(任選另外突變是腺嘌呤);(iii)在人染色體14上的第106,329,434位(任選另外突變是腺嘌呤)。

      任選地,脊椎動物、細胞或群體包含多個jh2基因區(qū)段,其中所述多個包含seqidno:3的人jh2基因變體,其中所述變體在對應于人染色體14上第106,331,453位的位置處包含腺嘌呤;且任選與seqidno:3序列相比不含進一步突變。

      任選地,該變體另外包含在對應于人染色體14上第106,331,409位的位置處的突變(任選另外突變是腺嘌呤)。

      任選地,脊椎動物、細胞或群體包含多個jh2基因區(qū)段,其中所述多個包含seqidno:3的人jh2基因變體,其中所述變體在對應于人染色體14上第106,331,409位的位置處包含腺嘌呤;且任選與seqidno:3序列相比不含進一步突變。

      任選地,脊椎動物、細胞或群體包含多個jh2基因區(qū)段,其中所述多個包含其為上述變體的反義序列的人jh2基因變體。

      任選地,基因組包含seqidno:3;任選與jh2變體中的一個、兩個或更多個在相同ig基因座處為順式。

      任選地,脊椎動物、細胞或群體基因組包含選自seqidno:1–3的兩個或更多個不同的jh基因區(qū)段和上述變體;任選地其中所述jh基因區(qū)段在相同免疫球蛋白ig基因座處是順式的。

      多重人d基因區(qū)段變體

      這一配置的具體應用是提供如下的多重人d基因區(qū)段(如以條款編號154開始的編號條款中闡述的)。

      154.具有基因組的非人脊椎動物(例如小鼠或大鼠)或非人脊椎動物細胞(例如es細胞或b細胞),所述基因組包含相同類型的至少3個人d基因區(qū)段(例如d2-2基因區(qū)段),其中所述人d基因區(qū)段中的至少兩個是彼此不相同的變體(例如d2-2ref和d2-2a)。

      在本發(fā)明的第六配置的任何方面的一個例子中(v、d、j或c),變體中的一個或多個或全部是天然存在的人基因區(qū)段。

      在本發(fā)明的第六配置的任何方面的一個例子中(v、d、j或c),變體中的一個或多個可以是人基因區(qū)段的合成變體。

      155.具有基因組的非人脊椎動物(例如小鼠或大鼠)或非人脊椎動物細胞(例如es細胞或b細胞),所述基因組包含在相同ig基因座處順式的相同類型的至少2個不同的非內(nèi)源d基因區(qū)段(例如d2-2ref和d2-2a)。

      156.具有基因組的非人脊椎動物(例如小鼠或大鼠)或非人脊椎動物細胞(例如es細胞或b細胞),所述基因組包含在相同ig基因座處反式的相同類型的至少2個不同的人d基因區(qū)段(例如d2-2ref和d2-2a);和任選存在的相同類型的第三人d基因區(qū)段(例如(例如d2-2ref、d2-2a或d2-2b),其中所述第三d與所述2個不同的d基因區(qū)段之一是順式的。

      157.包含人d基因區(qū)段的庫集的非人脊椎動物(例如小鼠或大鼠)群體,其中所述多個包含相同類型的至少2個不同的人d基因區(qū)段(例如d2-2基因區(qū)段),所述不同的d基因區(qū)段中的第一個(例如d2-2ref)在群體的第一脊椎動物的基因組中提供,并且所述不同的d基因區(qū)段中的第二個(例如d2-2a)在群體的第二脊椎動物的基因組中提供,其中所述第一脊椎動物的基因組不包含所述第二d基因區(qū)段。

      158.具有基因組的非人脊椎動物(例如小鼠或大鼠)或非人脊椎動物細胞(例如es細胞或b細胞),所述基因組包含相同類型的至少2個不同的非內(nèi)源d基因區(qū)段(例如人d2-2基因區(qū)段),其中所述d基因區(qū)段衍生自不同人類個體的基因組序列,所述人類個體在至少3代以上是遺傳學不相關(guān)的。

      159.增強非人脊椎動物(例如小鼠或大鼠)的人免疫球蛋白基因多樣性的方法,所述方法包括給脊椎動物提供基因組,所述基因組包含相同類型的至少3個人d基因區(qū)段(例如d2-2基因區(qū)段),其中所述人d基因區(qū)段中的至少兩個是彼此不相同的變體(例如d2-2ref和d2-2a)。

      160.增強非人脊椎動物(例如小鼠或大鼠)的免疫球蛋白基因多樣性的方法,所述方法包括給脊椎動物提供基因組,所述基因組包含在相同ig基因座處順式的相同類型的至少2個不同的非內(nèi)源d基因區(qū)段(例如人d2-2基因區(qū)段)。

      161.增強非人脊椎動物(例如小鼠或大鼠)的免疫球蛋白基因多樣性的方法,所述方法包括給脊椎動物提供基因組,所述基因組包含在相同ig基因座處反式的相同類型的至少2個不同的人d基因區(qū)段(例如d2-2ref和d2-2a);和任選存在的相同類型的第三人d基因區(qū)段(例如d2-2ref、d2-2a或d2-2b),其中所述第三d與所述2個不同的d基因區(qū)段之一是順式的。

      162.提供增強的人免疫球蛋白d基因區(qū)段庫集的方法,所述方法包括提供包含人d基因區(qū)段的庫集的非人脊椎動物(例如小鼠或大鼠)群體,其中所述方法包括提供相同類型的至少2個不同的人d基因區(qū)段(例如d2-2ref和d2-2a),其中所述不同的d基因區(qū)段中的第一個在群體的第一脊椎動物的基因組中提供,并且所述不同的d基因區(qū)段中的第二個在群體的第二脊椎動物的基因組中提供,其中所述第一脊椎動物的基因組不包含所述第二d基因區(qū)段。

      163.增強非人脊椎動物(例如小鼠或大鼠)的人免疫球蛋白基因多樣性的方法,所述方法包括給脊椎動物提供基因組,所述基因組包含相同類型的至少2個不同的非內(nèi)源d基因區(qū)段(例如d2-2ref和d2-2a),其中所述d基因區(qū)段衍生自不同人類個體的基因組序列,所述人類個體在至少3代以上是遺傳學不相關(guān)的。

      164.條款154、156或158的脊椎動物或細胞,或條款159、161或163的方法,其中所述不同基因區(qū)段中的至少2或3個在所述基因組中的相同ig基因座處以順式提供。

      165.條款154、155或156的脊椎動物或細胞,或條款159–162和164中任一項的方法,其中所述d基因區(qū)段衍生自不同人類個體的基因組序列,所述人類個體在至少3代以上是遺傳學不相關(guān)的。

      166.條款154–157中任一項的脊椎動物或細胞,或條款159–162和165中任一項的方法,其中所述d基因區(qū)段衍生自兩個或更多個不同人類個體的基因組序列;任選其中所述不同人類個體來自不同人類群體。

      167.條款165的脊椎動物、細胞或方法,其中所述個體是遺傳學不相關(guān)的。

      168.條款154–167中任一項的脊椎動物、細胞或方法,其中所述不同d區(qū)段的至少一個是人類種系d基因區(qū)段的合成突變體。

      169.增強非人脊椎動物(例如小鼠或大鼠)的人免疫球蛋白基因多樣性的方法,所述方法包括給脊椎動物提供基因組,所述基因組包含相同類型的至少2個人d基因區(qū)段(例如d2-2ref和d2-2a),其中所述d基因區(qū)段衍生自不同人類個體的基因組序列,所述人類個體在至少3代以上是遺傳學不相關(guān)的;任選其中所述不同基因區(qū)段中的至少2或3個在所述基因組中的相同igh基因座處提供。

      170.條款154–158和164-168中任一項的脊椎動物或細胞,其中所述基因組包含補充有一個、兩個或更多個變體人d基因區(qū)段的人d基因區(qū)段類型的基本上全部功能性庫集,其中所述基本上全部功能性庫集和補充性d基因區(qū)段在人類個體的種系基因組中未發(fā)現(xiàn)在一起。

      171.條款157的群體,其中所述群體包含補充有一個、兩個或更多個變體人d基因區(qū)段的人d基因區(qū)段類型的基本上全部功能性庫集,其中所述基本上全部功能性庫集和補充性d基因區(qū)段在人類個體的種系基因組中未發(fā)現(xiàn)在一起。

      172.具有基因組的非人脊椎動物(例如小鼠或大鼠)或非人脊椎動物細胞(例如es細胞或b細胞),所述基因組包含補充有一個、兩個或更多個變體人d基因區(qū)段的人d基因區(qū)段類型的基本上全部功能性庫集,其中所述基本上全部功能性庫集和補充性d基因區(qū)段在人類個體的種系基因組中未發(fā)現(xiàn)在一起。

      173.非人脊椎動物(例如小鼠或大鼠)群體,其包含補充有一個、兩個或更多個變體人d基因區(qū)段的人jh基因區(qū)段類型的基本上全部功能性庫集,其中所述基本上全部功能性庫集和補充性d基因區(qū)段在人類個體的種系基因組中未發(fā)現(xiàn)在一起。

      174.條款172的脊椎動物或細胞或者條款173的群體,其包含選自下述的第一和第二d基因區(qū)段:

      d2-2ref和d2-2a;或

      d2-21ref和d2-21a;或

      d3-10ref和d3-10a;或

      d3-16ref和d3-16a;或

      d2-8ref和d2-8a;或

      d3-3ref和d3-3a;或

      d4-23ref和d4-23a;或

      d6-13ref和d6-13a;或

      d3-9ref和d3-9a;或

      d4-4ref和d4-4a;或

      d7-27ref和d7-27a;

      任選其中所述第一和/或第二d基因區(qū)段以兩個或更多個拷貝存在。

      例如,提供了第一基因區(qū)段的兩個或三個拷貝,任選連同第二基因區(qū)段的一個、兩個或三個拷貝??截惪梢砸皂樖交蚍词脚帕?。

      175.條款174的脊椎動物、細胞或群體,其包含人基因區(qū)段d2-2ref和d2-2a;以及d3-3ref和d3-3a;以及任選存在的d2-15。

      在一個例子中,脊椎動物、細胞或群體包含選自下述的一個或多個d區(qū)段:人d3-3、d2-15、d3-9;d4-17;d3-10;d2-2;d5-24;d6-19;d3-22;d6-13;d5-12;d1-26;d1-20;d5-18;d3-16;d2-21;d1-14;d7-27;d1-1;d6-25;d2-14和d4-23(例如選自d3-9*01;d4-17*01;d3-10*01;d2-2*02;d5-24*01;d6-19*01;d3-22*01;d6-13*01;d5-12*01;d1-26*01;d1-20*01;d5-18*01;d3-16*02;d2-21*02;d1-14*01;d7-27*02;d1-1*01;d6-25*01;d2-15*01;和d4-23*01),連同所述一個或多個所選區(qū)段的一種或多種參考序列。這些在具有至少20個氨基酸的hcdr3長度的可變結(jié)構(gòu)域中發(fā)現(xiàn)(參見本文實施例)。

      176.根據(jù)條款155的非人脊椎動物或脊椎動物細胞,其包含基因組,所述基因組包括包含人基因區(qū)段的vh、d和jh基因庫集,所述d基因庫集包含下述中的一種或多種:

      在所述基因組中的相同ig基因座處順式的由至少2個不同的d2-2基因區(qū)段提供的多個d2-2基因區(qū)段;

      在所述基因組中的相同ig基因座處順式的由至少2個不同的d2-21基因區(qū)段提供的多個d2-21基因區(qū)段;

      在所述基因組中的相同ig基因座處順式的由至少2個不同的d3-10基因區(qū)段提供的多個d3-10基因區(qū)段;

      在所述基因組中的相同ig基因座處順式的由至少2個不同的d3-16基因區(qū)段提供的多個d3-16基因區(qū)段;

      在所述基因組中的相同ig基因座處順式的由至少2個不同的d2-8基因區(qū)段提供的多個d2-8基因區(qū)段;

      在所述基因組中的相同ig基因座處順式的由至少2個不同的d3-3基因區(qū)段提供的多個d3-3基因區(qū)段;

      在所述基因組中的相同ig基因座處順式的由至少2個不同的d4-23基因區(qū)段提供的多個d4-23基因區(qū)段;

      在所述基因組中的相同ig基因座處順式的由至少2個不同的d6-13基因區(qū)段提供的多個d6-13基因區(qū)段;

      在所述基因組中的相同ig基因座處順式的由至少2個不同的d3-9基因區(qū)段提供的多個d3-9基因區(qū)段;

      在所述基因組中的相同ig基因座處順式的由至少2個不同的d4-4基因區(qū)段提供的多個d4-4基因區(qū)段;和

      在所述基因組中的相同ig基因座處順式的由至少2個不同的d7-27基因區(qū)段提供的多個d7-27基因區(qū)段;

      任選其中所述d基因區(qū)段衍生自兩個或更多個不同人類個體的基因組序列。

      177.根據(jù)條款155的非人脊椎動物或脊椎動物細胞,其包含基因組,所述基因組包括包含人基因區(qū)段的vh、d和jh基因庫集,所述d基因庫集包含下述中的一種或多種:

      在所述基因組中反式的由至少2個不同的d2-2基因區(qū)段提供的多個d2-2基因區(qū)段;

      在所述基因組中反式的由至少2個不同的d2-21基因區(qū)段提供的多個d2-21基因區(qū)段;

      在所述基因組中反式的由至少2個不同的d3-10基因區(qū)段提供的多個d3-10基因區(qū)段;

      在所述基因組中反式的由至少2個不同的d3-16基因區(qū)段提供的多個d3-16基因區(qū)段;

      在所述基因組中反式的由至少2個不同的d2-8基因區(qū)段提供的多個d2-8基因區(qū)段;

      在所述基因組中反式的由至少2個不同的d3-3基因區(qū)段提供的多個d3-3基因區(qū)段;

      在所述基因組中反式的由至少2個不同的d4-23基因區(qū)段提供的多個d4-23基因區(qū)段;

      在所述基因組中反式的由至少2個不同的d6-13基因區(qū)段提供的多個d6-13基因區(qū)段;

      在所述基因組中反式的由至少2個不同的d3-9基因區(qū)段提供的多個d3-9基因區(qū)段;

      在所述基因組中反式的由至少2個不同的d4-4基因區(qū)段提供的多個d4-4基因區(qū)段;和

      在所述基因組中反式的由至少2個不同的d7-27基因區(qū)段提供的多個d7-27基因區(qū)段;

      任選其中所述d基因區(qū)段衍生自兩個或更多個不同人類個體的基因組序列。

      178.根據(jù)條款154的非人脊椎動物或脊椎動物細胞(任選es細胞或b細胞),其包含基因組,所述基因組包括包含人基因區(qū)段的vh、d和jh基因庫集,所述d基因庫集包含下述中的一種或多種:

      由至少3個不同的d2-2基因區(qū)段提供的多個d2-2基因區(qū)段;

      由至少3個不同的d2-21基因區(qū)段提供的多個d2-21基因區(qū)段;

      由至少3個不同的d3-10基因區(qū)段提供的多個d3-10基因區(qū)段;

      由至少3個不同的d3-16基因區(qū)段提供的多個d3-16基因區(qū)段;

      由至少3個不同的d2-8基因區(qū)段提供的多個d2-8基因區(qū)段;

      由至少3個不同的d3-3基因區(qū)段提供的多個d3-3基因區(qū)段;

      由至少3個不同的d4-23基因區(qū)段提供的多個d4-23基因區(qū)段;

      由至少3個不同的d6-13基因區(qū)段提供的多個d6-13基因區(qū)段;

      由至少3個不同的d3-9基因區(qū)段提供的多個d3-9基因區(qū)段;

      由至少3個不同的d4-4基因區(qū)段提供的多個d4-4基因區(qū)段;和

      由至少3個不同的d7-27基因區(qū)段提供的多個d7-27基因區(qū)段;

      任選其中所述d基因區(qū)段衍生自兩個或三個不同人類個體的基因組序列。

      任選其中所述不同基因區(qū)段中的至少2或3個在所述基因組中的相同ig基因座處以順式提供。

      179.條款176、177或178的脊椎動物或細胞,其中所述不同人類個體來自不同人類群體。

      180.條款176–179中任一項的脊椎動物或細胞,其中所述個體是遺傳學不相關(guān)的。

      181.條款176–180中任一項的脊椎動物或細胞,其中所述不同d基因區(qū)段中的至少一個是人類種系d基因區(qū)段的合成突變體。

      182.根據(jù)條款158的非人脊椎動物或脊椎動物細胞(任選es細胞或b細胞),其包括包含人vh、d和jh基因庫集的基因組,所述d基因庫集包含下述中的一種或多種:

      由至少2種不同的d2-2基因提供的多個d2-2基因區(qū)段;任選在所述基因組中以順式提供;

      由至少2種不同的d2-21基因提供的多個d2-21基因區(qū)段;任選在所述基因組中以順式提供;

      由至少2種不同的d3-10基因提供的多個d3-10基因區(qū)段;任選在所述基因組中以順式提供;

      由至少2種不同的d3-16基因提供的多個d3-16基因區(qū)段;任選在所述基因組中以順式提供;

      由至少2種不同的d2-8基因提供的多個d2-8基因區(qū)段;任選在所述基因組中以順式提供;

      由至少2種不同的d3-3基因提供的多個d3-3基因區(qū)段;任選在所述基因組中以順式提供;

      由至少2種不同的d4-23基因提供的多個d4-23基因區(qū)段;任選在所述基因組中以順式提供;

      由至少2種不同的d6-13基因提供的多個d6-13基因區(qū)段;任選在所述基因組中以順式提供;

      由至少2種不同的d3-9基因提供的多個d3-9基因區(qū)段;任選在所述基因組中以順式提供;

      由至少2種不同的d4-4基因提供的多個d4-4基因區(qū)段;任選在所述基因組中以順式提供;和

      由至少2種不同的d7-27基因提供的多個d7-27基因區(qū)段;任選在所述基因組中以順式提供;

      其中所述d基因區(qū)段衍生自不同人類個體的基因組序列,所述人類個體在至少3代以上是遺傳學不相關(guān)的。

      183.條款182的脊椎動物或細胞,其中所述人類個體來自不同人類群體。

      184.條款154–183中任一項的脊椎動物、細胞或群體,其中所述d基因區(qū)段中的一個或多個是人類種系d基因區(qū)段的變體,其中所述變體基因區(qū)段編碼這樣的氨基酸序列,其與由人類種系d基因區(qū)段編碼的相應氨基酸序列有1、2或3個氨基酸不同,條件是當所述相應氨基酸序列不包括終止密碼子時,由所述變體編碼的所述氨基酸序列不包括終止密碼子。

      任選地,該變體和種系d基因區(qū)段編碼在讀碼框2(imgt編號)中的各自氨基酸序列。參見briney等人2012。

      185.條款184的脊椎動物、細胞或群體,其中由人類種系d基因區(qū)段編碼的所述相應氨基酸序列是親水或疏水序列(根據(jù)jmolbiol.1997jul25;270(4):587-97;corbettsj等人;表2)。

      186.條款184或185的脊椎動物、細胞或群體,其包含所述變體和所述種系人d基因區(qū)段;任選其中所述變體和種系人d基因區(qū)段在相同染色體上是順式的。

      187.條款184–186中任一項的脊椎動物、細胞或群體,其中種系人d基因區(qū)段是d2、d3、d5或d6家族基因區(qū)段;任選d2-2、d2-15、d3-3、d3-9、d3-10、d3-22、d5-5、d5-18、d6-6、d6-13、d6-19基因區(qū)段。

      這些d區(qū)段在所有三個讀碼框中均為可用的。

      任選地,使用這些人類種系d基因區(qū)段中的1、2、3、4、5、6、7、8、9、10個或全部的變體。

      188.條款154–187中任一項的脊椎動物、細胞或群體,其包含多個d2-2基因區(qū)段,其中所述多個包含在對應于人染色體14上的下述位置的一個或多個核苷酸位置處彼此不同的d2-2基因區(qū)段:

      106,382,687和

      106,382,711。

      189.條款188的脊椎動物、細胞或群體,其中所述多個包含人d2-2基因區(qū)段((任選兩個拷貝和/或處于純合狀態(tài)),其在對應于人染色體14上第106,382,687位的位置處包含胸腺嘧啶;且任選與d2-2ref序列相比不含進一步突變。

      190.條款188或189的脊椎動物、細胞或群體,其中所述多個包含人d2-2基因區(qū)段,其在對應于人染色體14上第106,382,687位的位置處包含胞嘧啶;且任選與d2-2a序列相比不含進一步突變。

      191.條款188–190中任一項的脊椎動物、細胞或群體,其中所述多個包含人d2-2基因區(qū)段,其在對應于人染色體14上第106,382,711位的位置處包含腺嘌呤;且任選與d2-2b序列相比不含進一步突變。

      192.條款188–191中任一項的脊椎動物、細胞或群體,其中所述多個包含人d2-2基因區(qū)段,其在對應于人染色體14上第106,382,711位的位置處包含胸腺嘧啶;且任選與d2-2ref序列相比不含進一步突變。

      193.條款154–192中任一項的脊椎動物、細胞或群體,其包含多個d7-27基因區(qū)段,其中所述多個包含在對應于人染色體14上第106,331,767位的核苷酸位置處彼此不同的d7-27基因區(qū)段。

      194.條款193的脊椎動物、細胞或群體,其中所述多個包含人d7-27基因區(qū)段(任選兩個拷貝和/或處于純合狀態(tài)),其在對應于人染色體14上第106,331,767位的位置處包含胞嘧啶;且任選與d7-27ref序列相比不含進一步突變。

      195.條款193或194的脊椎動物、細胞或群體,其中所述多個包含人d7-27基因區(qū)段,其在對應于人染色體14上第106,331,767位的位置處包含鳥嘌呤;且任選與d7-27a序列相比不含進一步突變。

      196.條款154–195中任一項的脊椎動物、細胞或群體,其包含多個d4-23基因區(qū)段,其中所述多個包含在對應于人染色體14上第106,350,740位的核苷酸位置處彼此不同的d4-23基因區(qū)段。

      197.條款196的脊椎動物、細胞或群體,其中所述多個包含人d4-23基因區(qū)段(任選兩個拷貝和/或處于純合狀態(tài)),其在對應于人染色體14上第106,350,740位的位置處包含腺嘌呤;且任選與d4-23ref序列相比不含進一步突變。

      198.條款196或197的脊椎動物、細胞或群體,其中所述多個包含人d4-23基因區(qū)段(任選兩個拷貝和/或處于純合狀態(tài)),其在對應于人染色體14上第106,350,740位的位置處包含鳥嘌呤;且任選與d4-23a序列相比不含進一步突變。

      199.條款154–197中任一項的脊椎動物、細胞或群體,其包含多個d2-21基因區(qū)段,其中所述多個包含在對應于人染色體14上第106,354,418位的核苷酸位置處彼此不同的d2-21基因區(qū)段。

      200.條款199的脊椎動物、細胞或群體,其中所述多個包含人d2-21基因區(qū)段(任選兩個拷貝和/或處于純合狀態(tài)),其在對應于人染色體14上第106,354,418位的位置處包含腺嘌呤;且任選與d2-21ref序列相比不含進一步突變。

      201.條款199或200的脊椎動物、細胞或群體,其中所述多個包含人d2-21基因區(qū)段(任選兩個拷貝和/或處于純合狀態(tài)),其在對應于人染色體14上第106,354,418位的位置處包含鳥嘌呤;且任選與d2-21a序列相比不含進一步突變。

      202.條款154–201中任一項的脊椎動物、細胞或群體,其包含多個d3-16基因區(qū)段,其中所述多個包含在對應于人染色體14上第106,354,418位的核苷酸位置處彼此不同的d3-16基因區(qū)段。

      203.條款202的脊椎動物、細胞或群體,其中所述多個包含人d3-16基因區(qū)段(任選兩個拷貝和/或處于純合狀態(tài)),其在對應于人染色體14上第106,361,515位的位置處包含胸腺嘧啶;且任選與d3-16ref序列相比不含進一步突變。

      204.條款202或203的脊椎動物、細胞或群體,其中所述多個包含人d3-16基因區(qū)段(任選兩個拷貝和/或處于純合狀態(tài)),其在對應于人染色體14上第106,361,515位的位置處包含胞嘧啶;且任選與d3-16a序列相比不含進一步突變。

      205.條款154–204中任一項的脊椎動物、細胞或群體,其包含多個d6-13基因區(qū)段,其中所述多個包含在對應于人染色體14上第106,367,013位的核苷酸位置處彼此不同的d6-13基因區(qū)段。

      206.條款205的脊椎動物、細胞或群體,其中所述多個包含人d6-13基因區(qū)段(任選兩個拷貝和/或處于純合狀態(tài)),其在對應于人染色體14上第106,367,013位的位置處包含胸腺嘧啶;且任選與d6-13ref序列相比不含進一步突變。

      207.條款205或206的脊椎動物、細胞或群體,其中所述多個包含人d6-13基因區(qū)段(任選兩個拷貝和/或處于純合狀態(tài)),其在對應于人染色體14上第106,367,013位的位置處包含胞嘧啶;且任選與d6-13a序列相比不含進一步突變。

      208.條款154–207中任一項的脊椎動物、細胞或群體,其包含多個d3-10基因區(qū)段,其中所述多個包含在對應于人染色體14上的下述位置的一個或多個核苷酸位置處彼此不同的d3-10基因區(qū)段:

      106,370,370和

      106,370,371。

      209.條款208的脊椎動物、細胞或群體,其中所述多個包含人d3-10基因區(qū)段(任選兩個拷貝和/或處于純合狀態(tài)),其在對應于人染色體14上第106,370,370位的位置處包含胸腺嘧啶;且任選與d3-10ref序列相比不含進一步突變。

      210.條款208或209的脊椎動物、細胞或群體,其中所述多個包含人d3-10基因區(qū)段(任選兩個拷貝和/或處于純合狀態(tài)),其在對應于人染色體14上第106,370,370位的位置處包含胞嘧啶;且任選與d3-10a序列相比不含進一步突變。

      211.條款208、209或210的脊椎動物、細胞或群體,其中所述多個包含人d3-10基因區(qū)段(任選兩個拷貝和/或處于純合狀態(tài)),其在對應于人染色體14上第106,370,371位的位置處包含腺嘌呤;且任選與d3-10ref序列相比不含進一步突變。

      212.條款208–211中任一項的脊椎動物、細胞或群體,其中所述多個包含人d3-10基因區(qū)段(任選兩個拷貝和/或處于純合狀態(tài)),其在對應于人染色體14上第106,370,371位的位置處包含鳥嘌呤;且任選與d3-10b序列相比不含進一步突變。

      213.條款154–212中任一項的脊椎動物、細胞或群體,其包含多個d3-9基因區(qū)段,其中所述多個包含在對應于人染色體14上第106,370,567位的核苷酸位置處彼此不同的d3-9基因區(qū)段。

      214.條款213的脊椎動物、細胞或群體,其中所述多個包含人d3-9基因區(qū)段(任選兩個拷貝和/或處于純合狀態(tài)),其在對應于人染色體14上第106,370,567位的位置處包含腺嘌呤;且任選與d3-9ref序列相比不含進一步突變。

      215.條款213或214的脊椎動物、細胞或群體,其中所述多個包含人d3-9基因區(qū)段(任選兩個拷貝和/或處于純合狀態(tài)),其在對應于人染色體14上第106,370,567位的位置處包含胸腺嘧啶;且任選與d3-9a序列相比不含進一步突變。

      216.條款154–215中任一項的脊椎動物、細胞或群體,其包含多個d2-8基因區(qū)段,其中所述多個包含在對應于人染色體14上的下述位置的一個或多個核苷酸位置處彼此不同的d2-8基因區(qū)段:

      106,373,085;

      106,373,086和

      106,373,089。

      217.條款216的脊椎動物、細胞或群體,其中所述多個包含人d2-8基因區(qū)段(任選兩個拷貝和/或處于純合狀態(tài)),其在對應于人染色體14上第106,373,085位的位置處包含胞嘧啶。

      218.條款216或217的脊椎動物、細胞或群體,其中所述多個包含人d2-8基因區(qū)段(任選兩個拷貝和/或處于純合狀態(tài)),其在對應于人染色體14上第106,373,085位的位置處包含胸腺嘧啶;且任選與d2-8b序列相比不含進一步突變。

      219.條款216、217或218的脊椎動物、細胞或群體,其中所述多個包含人d2-8基因區(qū)段(任選兩個拷貝和/或處于純合狀態(tài)),其在對應于人染色體14上第106,373,086位的位置處包含胞嘧啶;且任選與d2-8ref序列相比不含進一步突變。

      220.條款216–219中任一項的脊椎動物、細胞或群體,其中所述多個包含人d2-8基因區(qū)段,其在對應于人染色體14上第106,373,086位的位置處包含胸腺嘧啶;且任選與d2-8ref序列相比不含進一步突變。

      221.條款154–220中任一項的脊椎動物、細胞或群體,其包含多個d4-4基因區(qū)段,其中所述多個包含在對應于人染色體14上的下述位置的一個或多個核苷酸位置處彼此不同的d4-4基因區(qū)段:

      106,379,086;和

      106,379,089。

      222.條款221的脊椎動物、細胞或群體,其中所述多個包含d4-4基因區(qū)段(任選兩個拷貝和/或處于純合狀態(tài)),其在對應于人染色體14上第106,379,086位的位置處包含胞嘧啶;且任選與d4-4ref序列相比不含進一步突變。

      223.條款221或222的脊椎動物、細胞或群體,其中所述多個包含人d4-4基因區(qū)段(任選兩個拷貝和/或處于純合狀態(tài)),其在對應于人染色體14上第106,379,086位的位置處包含胸腺嘧啶;且任選與d4-4a序列相比不含進一步突變。

      224.條款221、222或223的脊椎動物、細胞或群體,其中所述多個包含人d4-4基因區(qū)段(任選兩個拷貝和/或處于純合狀態(tài)),其在對應于人染色體14上第106,379,089位的位置處包含胞嘧啶;且任選與d4-4ref序列相比不含進一步突變或在對應于人染色體14上第106,379,086位的位置處不含胞嘧啶。

      225.條款221–224中任一項的脊椎動物、細胞或群體,其中所述多個包含人d4-4基因區(qū)段(任選兩個拷貝和/或處于純合狀態(tài)),其在對應于人染色體14上第106,373,089位的位置處包含胸腺嘧啶;且任選與d4-4a序列相比不含進一步突變。

      226.條款154–225中任一項的脊椎動物、細胞或群體,其包含多個d3-3基因區(qū)段,其中所述多個包含在對應于人染色體14上的下述位置的一個或多個核苷酸位置處彼此不同的d3-3基因區(qū)段:

      106,380,241;和

      106,380,246。

      227.條款226的脊椎動物、細胞或群體,其中所述多個包含d3-3基因區(qū)段(任選兩個拷貝和/或處于純合狀態(tài)),其在對應于人染色體14上第106,380,241位的位置處包含胸腺嘧啶;且任選與d3-3ref序列相比不含進一步突變。

      228.條款226或227的脊椎動物、細胞或群體,其中所述多個包含人d3-3基因區(qū)段(任選兩個拷貝和/或處于純合狀態(tài)),其在對應于人染色體14上第106,380,241位的位置處包含胞嘧啶;且任選與d3-3a序列相比不含進一步突變。

      229.條款226、227或228的脊椎動物、細胞或群體,其中所述多個包含人d3-3基因區(qū)段(任選兩個拷貝和/或處于純合狀態(tài)),其在對應于人染色體14上第106,380,246位的位置處包含腺嘌呤;且任選與d3-3ref序列相比不含進一步突變。

      230.條款226–229中任一項的脊椎動物、細胞或群體,其中所述多個包含人d3-3基因區(qū)段(任選兩個拷貝和/或處于純合狀態(tài)),其在對應于人染色體14上第106,380,246位的位置處包含胸腺嘧啶;且任選與d3-3a序列相比不含進一步突變。

      多重人jl基因區(qū)段變體

      這一配置的具體應用是提供如下的多重人jl基因區(qū)段(jκ和/或jλ)(如以段落編號80開始的編號段落中闡述的)。

      80.具有基因組的非人脊椎動物(例如小鼠或大鼠)或非人脊椎動物細胞(例如es細胞或b細胞),所述基因組包含相同類型的至少3個人jl基因區(qū)段(例如jκ1),其中所述人jl基因區(qū)段中的至少兩個是彼此不相同的變體。

      81.具有基因組的非人脊椎動物(例如小鼠或大鼠)或非人脊椎動物細胞(例如es細胞或b細胞),所述基因組包含在相同ig基因座處順式的相同類型的至少2個不同的非內(nèi)源jl基因區(qū)段(例如jκ1)。

      82.具有基因組的非人脊椎動物(例如小鼠或大鼠)或非人脊椎動物細胞(例如es細胞或b細胞),所述基因組包含在相同ig基因座處反式的相同類型的至少2個不同的人jl基因區(qū)段(例如jκ1);和任選存在的相同類型的第三人jl基因區(qū)段,其中所述第三jl與所述2個不同的jl基因區(qū)段之一是順式的。

      83.包含人jl基因區(qū)段的庫集的非人脊椎動物(例如小鼠或大鼠)群體,其中所述多個包含相同類型的至少2個不同的人jl基因區(qū)段(例如jκ1),所述不同的jl基因區(qū)段中的第一個在群體的第一脊椎動物的基因組中提供,并且所述不同的jl基因區(qū)段中的第二個在群體的第二脊椎動物的基因組中提供,其中所述第一脊椎動物的基因組不包含所述第二jl基因區(qū)段。

      84.具有基因組的非人脊椎動物(例如小鼠或大鼠)或非人脊椎動物細胞(例如es細胞或b細胞),所述基因組包含相同類型的至少2個不同的非內(nèi)源jl基因區(qū)段(例如jκ1),其中所述jl基因區(qū)段衍生自不同人類個體的基因組序列,所述人類個體在至少3代以上是遺傳學不相關(guān)的。

      85.增強非人脊椎動物(例如小鼠或大鼠)的人免疫球蛋白基因多樣性的方法,所述方法包括給脊椎動物提供基因組,所述基因組包含相同類型的至少3個人jl基因區(qū)段(例如jκ1),其中所述人jl基因區(qū)段中的至少兩個是彼此不相同的變體。

      86.增強非人脊椎動物(例如小鼠或大鼠)的免疫球蛋白基因多樣性的方法,所述方法包括給脊椎動物提供基因組,所述基因組包含在相同ig基因座處順式的相同類型的至少2個不同的非內(nèi)源jl基因區(qū)段(例如jκ1)。

      87.增強非人脊椎動物(例如小鼠或大鼠)的免疫球蛋白基因多樣性的方法,所述方法包括給脊椎動物提供基因組,所述基因組包含在相同ig基因座處反式的相同類型的至少2個不同的人jl基因區(qū)段(例如jκ1);和任選存在的相同類型的第三人jl基因區(qū)段,其中所述第三jl與所述2個不同的jl基因區(qū)段之一是順式的。

      88.提供增強的人免疫球蛋白jl基因區(qū)段庫集的方法,所述方法包括提供包含人jl基因區(qū)段的庫集的非人脊椎動物(例如小鼠或大鼠)群體,其中所述方法包括提供相同類型的至少2個不同的人jl基因區(qū)段(例如jκ1),其中所述不同的jl基因區(qū)段中的第一個在群體的第一脊椎動物的基因組中提供,并且所述不同的jl基因區(qū)段中的第二個在群體的第二脊椎動物的基因組中提供,其中所述第一脊椎動物的基因組不包含所述第二jl基因區(qū)段。

      89.增強非人脊椎動物(例如小鼠或大鼠)的人免疫球蛋白基因多樣性的方法,所述方法包括提供具有基因組的脊椎動物,所述基因組包含相同類型的至少2個不同的非內(nèi)源jl基因區(qū)段(例如jκ1),其中所述jl基因區(qū)段衍生自不同人類個體的基因組序列,所述人類個體在至少3代以上是遺傳學不相關(guān)的。

      90.段落80、82或84的脊椎動物或細胞,或段落85、82或89的方法,其中所述不同基因區(qū)段中的至少2或3個在所述基因組中的相同ig基因座處以順式提供。

      91.段落80、81或82的脊椎動物或細胞,或段落85、86或87的方法,其中所述jl基因區(qū)段衍生自不同人類個體的基因組序列,所述人類個體在至少3代以上是遺傳學不相關(guān)的。

      92.段落80、81或82的脊椎動物或細胞,或段落85、86或87的方法,其中所述jl基因區(qū)段衍生自兩個或更多個不同人類個體的基因組序列;任選其中所述不同人類個體來自不同人類群體。

      93.段落92的脊椎動物、細胞或方法,其中所述個體是遺傳學不相關(guān)的。

      94.段落80–93中任一項的脊椎動物、細胞或方法,其中所述不同jl區(qū)段的至少一個是人類種系jl基因區(qū)段的合成突變體。

      95.增強非人脊椎動物(例如小鼠或大鼠)的人免疫球蛋白基因多樣性的方法,所述方法包括給脊椎動物提供基因組,所述基因組包含相同類型的至少2個人jl基因區(qū)段(例如jκ1),其中所述jl基因區(qū)段衍生自不同人類個體的基因組序列,所述人類個體在至少3代以上是遺傳學不相關(guān)的;任選其中所述不同基因區(qū)段中的至少2或3個在所述基因組中的相同igl基因座處提供。

      96.段落80-82和84中任一項的脊椎動物或細胞,其中所述基因組包含分別補充有一個、兩個或更多個人jκ和/或jλ基因區(qū)段的人jκ和/或jλ基因區(qū)段類型的基本上全部功能性庫集,其中所述基本上全部功能性庫集和補充性基因區(qū)段在人類個體的種系基因組中未發(fā)現(xiàn)在一起。

      97.段落83的群體,其中所述群體包含分別補充有一個、兩個或更多個人jκ和/或jλ基因區(qū)段的人jl基因區(qū)段類型的基本上全部功能性庫集,其中所述基本上全部功能性庫集和補充性基因區(qū)段在人類個體的種系基因組中未發(fā)現(xiàn)在一起。

      98.具有基因組的非人脊椎動物(例如小鼠或大鼠)或非人脊椎動物細胞(例如es細胞或b細胞),所述基因組包含分別補充有一個、兩個或更多個人jκ和/或jλ基因區(qū)段的人jκ和/或jλ基因區(qū)段類型的基本上全部功能性庫集,其中所述基本上全部功能性庫集和補充性基因區(qū)段在人類個體的種系基因組中未發(fā)現(xiàn)在一起。

      99.非人脊椎動物(例如小鼠或大鼠)群體,其包含分別補充有一個、兩個或更多個人jκ和/或jλ基因區(qū)段的人jκ和/或jλ基因區(qū)段類型的基本上全部功能性庫集,其中所述基本上全部功能性庫集和補充性基因區(qū)段在人類個體的種系基因組中未發(fā)現(xiàn)在一起。

      100.根據(jù)段落81的非人脊椎動物或脊椎動物細胞,其包含基因組,所述基因組包括包含人基因區(qū)段的vl和jl基因庫集,所述jl基因庫集包含:

      在所述基因組中的相同ig基因座處以順式的由至少2個不同的人jκ1基因區(qū)段提供的多個人jκ1基因區(qū)段;

      在所述基因組中的相同ig基因座處以順式的由至少2個不同的人jκ1基因區(qū)段提供的多個人jκ2基因區(qū)段;

      在所述基因組中的相同ig基因座處以順式的由至少2個不同的人jκ1基因區(qū)段提供的多個人jκ3基因區(qū)段;

      在所述基因組中的相同ig基因座處以順式的由至少2個不同的人jκ1基因區(qū)段提供的多個人jκ4基因區(qū)段;

      在所述基因組中的相同ig基因座處以順式的由至少2個不同的人jκ1基因區(qū)段提供的多個人jκ5基因區(qū)段;

      在所述基因組中的相同ig基因座處以順式的由至少2個不同的人jλ1基因區(qū)段提供的多個人jλ1基因區(qū)段;

      在所述基因組中的相同ig基因座處以順式的由至少2個不同的人jλ2基因區(qū)段提供的多個人jλ2基因區(qū)段;

      在所述基因組中的相同ig基因座處以順式的由至少2個不同的人jλ3基因區(qū)段提供的多個人jλ3基因區(qū)段;

      在所述基因組中的相同ig基因座處以順式的由至少2個不同的人jλ4基因區(qū)段提供的多個人jλ4基因區(qū)段;

      在所述基因組中的相同ig基因座處以順式的由至少2個不同的人jλ5基因區(qū)段提供的多個人jλ5基因區(qū)段;

      在所述基因組中的相同ig基因座處以順式的由至少2個不同的人jλ6基因區(qū)段提供的多個人jλ6基因區(qū)段;或

      在所述基因組中的相同ig基因座處以順式的由至少2個不同的人jλ7基因區(qū)段提供的多個人jλ7基因區(qū)段;

      任選其中所述jl基因區(qū)段衍生自兩個或更多個不同人類個體的基因組序列。

      101.根據(jù)段落80的非人脊椎動物或脊椎動物細胞(任選es細胞或b細胞),其包含基因組,所述基因組包括包含人基因區(qū)段的vl和jl基因庫集,所述jl基因庫集包含:

      由至少3(例如3、4、5、6或7)個不同的人jκ1基因區(qū)段提供的多個人jκ1基因區(qū)段;

      由至少3(例如3、4、5、6或7)個不同的人jκ1基因區(qū)段提供的多個人jκ2基因區(qū)段;

      由至少3(例如3、4、5、6或7)個不同的人jκ1基因區(qū)段提供的多個人jκ3基因區(qū)段;

      由至少3(例如3、4、5、6或7)個不同的人jκ1基因區(qū)段提供的多個人jκ4基因區(qū)段;

      由至少3(例如3、4、5、6或7)個不同的人jκ1基因區(qū)段提供的多個人jκ5基因區(qū)段;

      由至少3(例如3、4、5、6或7)個不同的人jλ1基因區(qū)段提供的多個人jλ1基因區(qū)段;

      由至少3(例如3、4、5、6或7)個不同的人jλ2基因區(qū)段提供的多個人jλ2基因區(qū)段;

      由至少3(例如3、4、5、6或7)個不同的人jλ3基因區(qū)段提供的多個人jλ3基因區(qū)段;

      由至少3(例如3、4、5、6或7)個不同的人jλ4基因區(qū)段提供的多個人jλ4基因區(qū)段;

      由至少3(例如3、4、5、6或7)個不同的人jλ5基因區(qū)段提供的多個人jλ5基因區(qū)段;

      由至少3(例如3、4、5、6或7)個不同的人jλ6基因區(qū)段提供的多個人jλ6基因區(qū)段;或

      由至少3(例如3、4、5、6或7)個不同的人jλ7基因區(qū)段提供的多個人jλ7基因區(qū)段;

      任選其中所述jl基因區(qū)段衍生自兩個或三個不同人類個體的基因組序列。

      任選其中所述不同基因區(qū)段中的至少2或3個在所述基因組中的相同ig基因座處以順式提供。

      102.段落104或105的脊椎動物或細胞,其中所述不同人類個體來自不同人類群體。

      103.段落104-106中任一項的脊椎動物或細胞,其中所述個體是遺傳學不相關(guān)的。

      104.段落104-107中任一項的脊椎動物或細胞,其中所述不同jl基因區(qū)段中的至少一個是人類種系jl基因區(qū)段的合成突變體。

      105.根據(jù)段落84的非人脊椎動物或脊椎動物細胞(任選es細胞或b細胞),其包括包含人vl和jl基因庫集的基因組,所述jl基因庫集包含:

      由至少2個不同的人jκ1基因區(qū)段提供的多個人jκ1基因區(qū)段,任選在所述基因組中的相同ig基因座處以順式提供;

      由至少2個不同的人jκ1基因區(qū)段提供的多個人jκ2基因區(qū)段,任選在所述基因組中的相同ig基因座處以順式提供;

      由至少2個不同的人jκ1基因區(qū)段提供的多個人jκ3基因區(qū)段,任選在所述基因組中的相同ig基因座處以順式提供;

      由至少2個不同的人jκ1基因區(qū)段提供的多個人jκ4基因區(qū)段,任選在所述基因組中的相同ig基因座處以順式提供;

      由至少2個不同的人jκ1基因區(qū)段提供的多個人jκ5基因區(qū)段,任選在所述基因組中的相同ig基因座處以順式提供;

      由至少2個不同的人jλ1基因區(qū)段提供的多個人jλ1基因區(qū)段,任選在所述基因組中的相同ig基因座處以順式提供;

      由至少2個不同的人jλ2基因區(qū)段提供的多個人jλ2基因區(qū)段,任選在所述基因組中的相同ig基因座處以順式提供;

      由至少2個不同的人jλ3基因區(qū)段提供的多個人jλ3基因區(qū)段,任選在所述基因組中的相同ig基因座處以順式提供;

      由至少2個不同的人jλ4基因區(qū)段提供的多個人jλ4基因區(qū)段,任選在所述基因組中的相同ig基因座處以順式提供;

      由至少2個不同的人jλ5基因區(qū)段提供的多個人jλ5基因區(qū)段,任選在所述基因組中的相同ig基因座處以順式提供;

      由至少2個不同的人jλ6基因區(qū)段提供的多個人jλ6基因區(qū)段,任選在所述基因組中的相同ig基因座處以順式提供;或

      由至少2個不同的人jλ7基因區(qū)段提供的多個人jλ7基因區(qū)段,任選在所述基因組中的相同ig基因座處以順式提供;

      其中所述jl基因區(qū)段衍生自不同人類個體的基因組序列,所述人類個體在至少3代以上是遺傳學不相關(guān)的。

      106.段落109的脊椎動物或細胞,其中所述人類個體來自不同人類群體。

      技術(shù)人員將認識到標準分子生物學技術(shù)可以用于提供用于本發(fā)明的包含免疫球蛋白基因區(qū)段(例如v、d和/或j)的合成組合的載體,從而使得該載體可以用于構(gòu)建轉(zhuǎn)基因免疫球蛋白基因座(例如使用如本領(lǐng)域已知的同源重組和/或重組酶介導的盒式交換,例如參見us7501552(medarex)、us5939598(abgenix)、us6130364(abgenix)、w002/066630(regeneron)、w02011004192(genomeresearchlimited)、w02009076464、w02009143472和w02010039900(ablexis),所述專利的公開內(nèi)容明確引入本文。例如,基因區(qū)段的此類合成組合可以使用標準重組工程技術(shù)在大腸桿菌中進行,以在使用同源重組或rmce(例如使用cre/lox位點特異性重組)插入胚胎干細胞中之前構(gòu)建容納所述合成組合的bac載體。重組工程的細節(jié)可以在www.genebridges.com處以及ep1034260和ep1204740中發(fā)現(xiàn),所述專利的公開內(nèi)容明確引入本文。

      在一個實施方案中,使脊椎動物的免疫應答(和因此所得的前導抗體)偏向預定基因區(qū)段是有用的,所述基因區(qū)段例如已知在針對抗原例如感染性疾病病原體的抗原的天然人免疫應答中常用的基因區(qū)段。例如,vh1-69通常用于在人中產(chǎn)生針對流感病毒的抗體;因此,能夠在本發(fā)明的基因座中包括vh區(qū)段vh1-69的兩或更多個多態(tài)dna形式。下文例子舉例說明可以如何構(gòu)建此類轉(zhuǎn)基因基因座,其中多樣性通過擴展基于天然存在的vh1-69多態(tài)性變體的vh1-69基因區(qū)段庫集得到擴展。

      在本發(fā)明的任何配置中的一個實施方案中,基因組已進行修飾以防止或減少完全內(nèi)源抗體的表達。用于實現(xiàn)這點的合適技術(shù)的例子可以在pct/gb2010/051122、us7501552、us6673986、us6130364、w02009/076464、ep1399559和us6586251中找到,所述專利的公開內(nèi)容引入本文作為參考。在一個實施方案中,內(nèi)源重鏈免疫球蛋白基因座的非人脊椎動物vdj區(qū)、和任選存在的內(nèi)源輕鏈免疫球蛋白基因座(λ和/或κ基因座)的vj區(qū)已被失活。例如,非人脊椎動物vdj區(qū)的全部或部分通過哺乳動物的內(nèi)源重鏈免疫球蛋白基因座中的倒位被失活,任選伴隨倒位區(qū)域在內(nèi)源ig基因座的上游或下游移動(參見例如w02011004192,所述專利的公開內(nèi)容引入本文作為參考)。例如,非人脊椎動物vj區(qū)的全部或部分通過哺乳動物的內(nèi)源κ鏈免疫球蛋白基因座中的倒位被失活,任選伴隨倒位區(qū)域在內(nèi)源ig基因座的上游或下游移動。例如,非人脊椎動物vj區(qū)的全部或部分通過哺乳動物的內(nèi)源λ鏈免疫球蛋白基因座中的倒位被失活,任選伴隨倒位區(qū)域在內(nèi)源ig基因座的上游或下游移動。在一個實施方案中,內(nèi)源重鏈基因座以這種方法被失活,如內(nèi)源κ和λ基因座中的一個或二者一樣。

      另外或可替代地,脊椎動物已在遺傳背景中生成,所述遺傳背景防止成熟宿主b和t淋巴細胞的產(chǎn)生,任選rag-1缺陷和/或rag-2缺陷背景。關(guān)于生成rag-1缺陷動物的技術(shù)參見us5859301。

      因此,在本發(fā)明的任何配置或方面的一個實施方案中,內(nèi)源重和輕鏈表達已被失活。

      在一個實施方案中,每個所述基因座恒定區(qū)是重鏈內(nèi)源非人脊椎動物(任選宿主小鼠或大鼠)恒定區(qū)。

      在一個實施方案中,每個所述基因座恒定區(qū)是輕鏈內(nèi)源非人脊椎動物(任選宿主小鼠或大鼠)恒定區(qū)。

      本發(fā)明提供了通過根據(jù)本發(fā)明免疫至少一種脊椎動物(例如小鼠或大鼠)制備的單克隆或多克隆抗體組合物,任選其中所述抗原是感染性疾病病原體的抗原(例如細菌或病毒病原體抗原),任選其中相同抗原用于免疫所有脊椎動物;任選其中一種或多種抗體是igg型(例如igg1)。

      本發(fā)明還提供了由本發(fā)明的方法產(chǎn)生的單克隆或多克隆抗體混合物或其衍生抗體或混合物,例如其中一個或多個恒定區(qū)已被改變(例如置換為不同的恒定區(qū)例如人恒定區(qū);或者突變以增強或消除fc效應子功能)。在本發(fā)明的一個方面,提供了單克隆或多克隆抗體混合物用于治療和/或預防人中的疾病或狀況,例如用于治療和/或預防感染性疾病,其中任選其中每種抗體結(jié)合感染性疾病病原體的抗原,優(yōu)選相同抗原。

      在本發(fā)明的一個方面,提供了根據(jù)本發(fā)明的分離的單克隆或多克隆抗體、或其突變型或衍生抗體在制造用于治療和/或預防人中的疾病或狀況例如感染性疾病的藥物中的用途,任選其中所述感染性疾病是由細菌或病毒病原體引起的疾病。

      突變型抗體的例子是相對于通過本發(fā)明的方法可獲得或獲得的分離的抗體(例如igg型,例如igg1型抗體),在其可變區(qū)中具有直至15或10個氨基酸突變的抗體。衍生物的例子是這樣的,其已進行修飾以用不同恒定區(qū)例如人恒定區(qū)置換恒定區(qū),或者突變以增強或消除fc效應子功能。

      感染性疾病的例子是由細菌或病毒病原體引起或介導的疾病。例如,感染性疾病選自由選自下述的病原體引起的疾病:流感嗜血桿菌(haemophilusinfluenza)、大腸桿菌、腦膜炎奈瑟氏菌(neisseriameningitidis)、皰疹病毒科病毒、巨細胞病毒(cmv)、hiv和流感病毒。

      定制v(d)j摻入免疫球蛋白基因座用于生成針對感染性疾病的抗體

      本發(fā)明人認識到將希望基于針對抗原例如感染性疾病病原體的抗原的天然人免疫應答,提供脊椎動物、細胞、方法等用于生產(chǎn)治療和/或預防抗體。在這方面,文獻觀察到頻繁使用的免疫球蛋白基因區(qū)段,以在人中產(chǎn)生抗感染應答(表9)。

      在上文的多個配置、方面、實施方案和例子中,本發(fā)明為技術(shù)人員提供了選擇免疫球蛋白基因區(qū)段的可能性,其方式使庫集定制或偏向用于生成抗體以治療和/或預防感染性疾病。本發(fā)明人已根據(jù)所得的抗體的所需應用分類下述基因區(qū)段組用于本發(fā)明。

      列表a:

      用于結(jié)合由病原體表達的抗原的抗體的免疫球蛋白基因區(qū)段

      (a)選自下述的vl基因區(qū)段:vλii基因家族成員、vλvii4a、vλii2.1、vλvii4a、vλ1基因家族成員、vλ3基因家族成員、iglv1s2、vλ3-cml70、ialh2、lalvl、ia3h3、kv325、vκi基因家族成員、κi-15a(kl012)、vκii家族成員、vκiii家族成員、vκi基因家族成員、κi-15a(kl012)、vκiia2(任選a2a變體)、vκa27(humkv325)和與其至少80%相同的基因區(qū)段。

      (b)選自下述的vλ基因區(qū)段:vλii基因家族成員、vλvii4a、vλii2.1、vλvii4a、vλ1基因家族成員、vλ3基因家族成員、iglv1s2、vλ3-cml70、ialh2、lalvl、ia3h3和與其至少80%相同的基因區(qū)段。

      (c)選自下述的vκ基因區(qū)段:kv325、vκi基因家族成員、κi-15a(kl012)、vκii家族成員、vκiii家族成員、vκi基因家族成員、κi-15a(kl012)、vκiia2(任選a2a變體)、vκa27(humkv325)和與其至少80%相同的基因區(qū)段。

      (d)vh基因區(qū)段:vhiii基因家族成員(任選vhiiia或vhiiib家族成員)、vhiv基因家族成員、vhiii9.1(vh3-15)、vhiiivh26(vh3-23)、vh3-21、lsg6.1、lsg12.1、dp77(v3-21)、vhh11、vh1grr、ha3h2、vhi-ha1c1、vhiii-vh2-1、vh4.18、ha4h3、hv1051、71-2、hv1f10、vh4.11、71-4、vh251、vh1-69和與其至少80%相同的基因區(qū)段。

      (e)選自下述的jλ基因區(qū)段:jλ2、jλ3和與其至少80%相同的基因區(qū)段。

      (f)選自下述的d基因區(qū)段:dk1、dxp'1、dn4r、d2r和與其至少80%相同的基因區(qū)段。

      列表a1:

      用于結(jié)合由細菌病原體表達的抗原的抗體的免疫球蛋白基因區(qū)段

      (a)選自下述的vλ基因區(qū)段:vλii基因家族成員、vλvii4a、vλii2.1、vλvii4a和與其至少80%相同的基因區(qū)段。

      (b)選自下述的vκ基因區(qū)段:vκi基因家族成員、κi-15a(kl012)、vκii家族成員、vκiii家族成員、vκi基因家族成員、κi-15a(kl012)、vκiia2(任選a2a變體)、vκa27(humkv325)和與其至少80%相同的基因區(qū)段。

      (c)vh基因區(qū)段:vh3基因家族成員(任選vhiiia或vhiiib家族成員)、vhiii9.1(vh3-15)、vhiiivh26(vh3-23)、vh3-21、lsg6.1、lsg12.1、dp77(v3-21)、vhh11和與其至少80%相同的基因區(qū)段。

      (d)選自下述的jλ基因區(qū)段:jλ2、jλ3和與其至少80%相同的基因區(qū)段。

      (e)選自下述的jh基因區(qū)段:jh2、jh3、jh4和與其至少80%相同的基因區(qū)段。

      列表a1.1:

      用于結(jié)合由流感嗜血桿菌表達的抗原的抗體的免疫球蛋白基因區(qū)段

      (a)選自下述的vλ基因區(qū)段:vλii基因家族成員、vλvii4a、vλii2.1、vλvii4a和與其至少80%相同的基因區(qū)段。

      (b)選自下述的vκ基因區(qū)段:vκii家族成員、vκiii家族成員、vκi基因家族成員、κi-15a(kl012)、vκiia2(任選a2a變體)、vκa27(humkv325)和與其至少80%相同的基因區(qū)段。

      (c)vh基因區(qū)段:vh3基因家族成員(任選vhiiib家族成員)、vhiii9.1(vh3-15)、vhiiivh26(vh3-23)、vh3-21、lsg6.1、lsg12.1、dp77(v3-21)和與其至少80%相同的基因區(qū)段。

      (d)選自下述的jλ基因區(qū)段:jλ2、jλ3和與其至少80%相同的基因區(qū)段。

      列表a1.2:

      用于結(jié)合由大腸桿菌或腦膜炎奈瑟氏菌表達的抗原的抗體的免疫球蛋白基因區(qū)

      (a)vh基因區(qū)段:vh3基因家族成員(任選vhiiia或vhiiib家族成員)、vhiii9.1(vh3-15)、vhh11、vhiiivh26(vh3-23)、與其至少80%相同的基因區(qū)段,例如vhiii9.1+jh3;或vhh11+jh4;或vhiiivh26+jh2。

      (b)選自下述的vκ基因區(qū)段:vκi基因家族成員、κi-15a(kl012)和與其至少80%相同的基因區(qū)段。

      (c)選自下述的vλ基因區(qū)段:vλii基因家族成員、vλii2.1和與其至少80%相同的基因區(qū)段。

      (d)選自下述的jh基因區(qū)段:jh2、jh3、jh4和與其至少80%相同的基因區(qū)段。

      a2:

      用于結(jié)合由病毒病原體表達的抗原的抗體的免疫球蛋白基因區(qū)段

      (a)選自下述的vh基因區(qū)段:vhiii基因家族成員、vhiv基因家族成員、vhiii-vh26(vh3-23)、vh1grr、ha3h2、vhi-ha1c1、vhiii-vh2-1、vh4.18、ha4h3、hv1051、71-2、hv1f10、vh4.11、71-4、vh251、vh1-69和與其至少80%相同的基因區(qū)段。

      (b)選自下述的vλ基因區(qū)段:vλ1基因家族成員、vλ3基因家族成員、iglv1s2、vλ3-cml70、ialh2、lalvl、ia3h3和與其至少80%相同的基因區(qū)段。

      (c)選自下述的vk基因區(qū)段:kv325和與其至少80%相同的基因區(qū)段。

      (d)選自下述的jh基因區(qū)段:jh3、jh5、jh6和與其至少80%相同的基因區(qū)段。

      (e)選自下述的d基因區(qū)段:dk1、dxp'1、dn4r、d2r和與其至少80%相同的基因區(qū)段。

      (f)選自下述的jλ基因區(qū)段:jλ2、jλ3和與其至少80%相同的基因區(qū)段。

      a2.1:

      用于結(jié)合由皰疹病毒科(例如vzv或hsv)表達的抗原的抗體的免疫球蛋白基因區(qū)

      (a)選自下述的vh基因區(qū)段:vhiii基因家族成員、vhiv基因家族成員、vhiii-vh26(vh3-23)、vh1grr、ha3h2、vhi-ha1c1、vhiii-vh2-1、vh4.18、ha4h3和與其至少80%相同的基因區(qū)段。

      (b)選自下述的vλ基因區(qū)段:vλ1基因家族成員、vλ3基因家族成員、iglv1s2、vλ3-cml70、ialh2、lalvl、ia3h3和與其至少80%相同的基因區(qū)段。

      (c)選自下述的jh基因區(qū)段:jh3、jh5、jh6和與其至少80%相同的基因區(qū)段。

      (d)選自下述的d基因區(qū)段:dk1、dxp'1、dn4r、d2r和與其至少80%相同的基因區(qū)段。

      (e)選自下述的jλ基因區(qū)段:jλ2、jλ3和與其至少80%相同的基因區(qū)段。

      a2.2:

      用于結(jié)合由cmv表達的抗原的抗體的免疫球蛋白基因區(qū)段

      (a)選自下述的vh基因區(qū)段:hv1051和與其至少80%相同的基因區(qū)段。

      (b)選自下述的vk基因區(qū)段:kv325和與其至少80%相同的基因區(qū)段。

      a2.3:

      用于結(jié)合由hiv表達的抗原的抗體的免疫球蛋白基因區(qū)段

      (a)選自下述的vh基因區(qū)段:71-2、hv1f10、vh4.11、71-4、vh251、vh1-69和與其至少80%相同的基因區(qū)段。

      a2.4:

      用于結(jié)合由流感病毒表達的抗原的抗體的免疫球蛋白基因區(qū)段

      (a)選自下述的vh基因區(qū)段:vh1-69和與其至少80%相同的基因區(qū)段。

      因此,

      當希望生成抗體或抗體混合物以治療和/或預防感染性疾病時,在本發(fā)明的任何配置、方面、方法、例子或?qū)嵤┓桨钢惺褂玫囊粋€或多個v、d和/或全部j基因區(qū)段可以選自列表a1。因此,例如,在本發(fā)明的第一配置的(a)中,所述重鏈v基因區(qū)段選自列表a中的vh基因區(qū)段,任選伴隨該列表中的d。

      當希望生成抗體或抗體混合物以治療和/或預防由細菌病原體引起或介導的感染性疾病時,在本發(fā)明的任何配置、方面、方法、例子或?qū)嵤┓桨钢惺褂玫囊粋€或多個或全部v、d和/或j基因區(qū)段可以選自列表a1。

      當希望生成抗體或抗體混合物以治療和/或預防由病毒病原體引起或介導的感染性疾病時,在本發(fā)明的任何配置、方面、方法、例子或?qū)嵤┓桨钢惺褂玫囊粋€或多個或全部v、d和/或j基因區(qū)段可以選自列表a2。

      當希望生成抗體或抗體混合物以治療和/或預防由流感嗜血桿菌引起或介導的感染性疾病時,在本發(fā)明的任何配置、方面、方法、例子或?qū)嵤┓桨钢惺褂玫囊粋€或多個或全部v、d和/或j基因區(qū)段可以選自列表a1.1。

      當希望生成抗體或抗體混合物以治療和/或預防由大腸桿菌或腦膜炎奈瑟氏菌引起或介導的感染性疾病時,在本發(fā)明的任何配置、方面、方法、例子或?qū)嵤┓桨钢惺褂玫囊粋€或多個或全部v、d和/或j基因區(qū)段可以選自列表a1.2。

      當希望生成抗體或抗體混合物以治療和/或預防由皰疹病毒科(例如vzv或hsv)引起或介導的感染性疾病時,在本發(fā)明的任何配置、方面、方法、例子或?qū)嵤┓桨钢惺褂玫囊粋€或多個或全部v、d和/或j基因區(qū)段可以選自列表a2.1。

      當希望生成抗體或抗體混合物以治療和/或預防由cmv引起或介導的感染性疾病時,在本發(fā)明的任何配置、方面、方法、例子或?qū)嵤┓桨钢惺褂玫囊粋€或多個或全部v、d和/或j基因區(qū)段可以選自列表a2.2。

      當希望生成抗體或抗體混合物以治療和/或預防由hiv引起或介導的感染性疾病時,在本發(fā)明的任何配置、方面、方法、例子或?qū)嵤┓桨钢惺褂玫囊粋€或多個或全部v、d和/或j基因區(qū)段可以選自列表a2.3。

      當希望生成抗體或抗體混合物以治療和/或預防由流感病毒引起或介導的感染性疾病時,在本發(fā)明的任何配置、方面、方法、例子或?qū)嵤┓桨钢惺褂玫囊粋€或多個或全部v、d和/或j基因區(qū)段可以選自列表a2.4。

      任選地,本發(fā)明的基因座中的每個vh區(qū)段選自列表a1、a2、a1.1、a1.2、a2.1、a2.2、a2.3或a2.4。

      任選地,本發(fā)明的基因座中的每個vl區(qū)段選自列表a1、a2、a1.1、a1.2、a2.1、a2.2、a2.3或a2.4。

      任選地,本發(fā)明的基因座中的每個d區(qū)段選自列表a1、a2、a1.1、a1.2、a2.1、a2.2、a2.3或a2.4。

      任選地,本發(fā)明的基因座中的每個jl區(qū)段選自列表a1、a2、a1.1、a1.2、a2.1、a2.2、a2.3或a2.4。

      用于治療和預防具有特定祖先的患者的抗體

      已采取本文描述的廣泛生物信息學分析練習,本發(fā)明人認識到該分析的輸出已使得能夠鑒定可用于產(chǎn)生基于抗體和vh結(jié)構(gòu)域的藥物的特定基因區(qū)段,所述基于抗體和vh結(jié)構(gòu)域的藥物對于患者的祖先(即基因型)專門定制。即,抗體可以在下述基礎(chǔ)上進行選擇:它們在轉(zhuǎn)基因非人脊椎動物(例如具有轉(zhuǎn)基因igh基因座的小鼠或大鼠)中在體內(nèi)制備并且特別衍生自在患者群體的成員中相對流行的基因區(qū)段,即衍生自相同人類祖先的個體。因為變體分布跨越不同群體而不同(參見表13),所以這推測反映在這些群體中的有用變體基因類型的進化、適應和保守的作用。因此,通過根據(jù)本發(fā)明定制基于抗體的藥物,能夠匹配藥物與群體基因偏向,因此目的在于制備用于該特定人類群體的更佳藥物。更佳可以例如意指更有效、更好中和、更高靶抗原親和力、更少免疫原性、更少的對藥物的患者反應等。如藥物研究與開發(fā)過程中標準的,這可以憑經(jīng)驗測定。

      因此,本發(fā)明提供了下述實施方案(從條款345開始編號):

      345.用于施用于中國人患者的分離的抗體,所述抗體包含人重鏈,所述重鏈包含對于抗原特異性的可變結(jié)構(gòu)域和恒定區(qū),其中所述恒定區(qū)是這樣的人恒定區(qū),其選自在中國人群體中發(fā)現(xiàn)的表13中的恒定區(qū)(例如ighg恒定區(qū))并具有至少1或5%的累積頻率;并且其中

      (i)所述可變結(jié)構(gòu)域衍生自所述人基因區(qū)段在非人脊椎動物中(例如小鼠或大鼠中)的重組;和/或(ii)所述可變結(jié)構(gòu)域包含非人脊椎動物(例如小鼠或大鼠)aid模式突變和非人脊椎動物(例如小鼠或大鼠)末端脫氧核苷酸轉(zhuǎn)移酶(tdt)模式突變。

      在另一個實施方案中,本發(fā)明提供了

      用于施用于中國人患者的分離的抗體,所述抗體包含人重鏈,所述重鏈包含對于抗原特異性的可變結(jié)構(gòu)域和恒定區(qū),其中所述恒定區(qū)是這樣的人恒定區(qū),其選自在中國人群體中存在的恒定區(qū)(例如ighg恒定區(qū)),具有至少5%的累積頻率;并且其中

      (i)所述可變結(jié)構(gòu)域衍生自所述人基因區(qū)段在非人脊椎動物中(例如小鼠或大鼠中)的重組;和/或(ii)所述可變結(jié)構(gòu)域包含非人脊椎動物(例如小鼠或大鼠)aid模式突變和非人脊椎動物(例如小鼠或大鼠)末端脫氧核苷酸轉(zhuǎn)移酶(tdt)模式突變。

      在一個例子中,恒定區(qū)在1000genomes數(shù)據(jù)庫中發(fā)現(xiàn)。在一個例子中,恒定區(qū)在表13中發(fā)現(xiàn)。

      346.條款345的抗體,其中所述恒定區(qū)是ighg1a、ighg2a、ighg3a、ighg3b或ighg4a恒定區(qū)。

      347.條款345或346的抗體,其中所述可變結(jié)構(gòu)域衍生自人vh基因區(qū)段與人d基因區(qū)段和人jh基因區(qū)段的重組,所述vh基因區(qū)段選自在中國人群體中發(fā)現(xiàn)的表13中的vh并具有至少5%的累積頻率。

      在另一個實施方案中,本發(fā)明提供了

      條款345或346的抗體,其中所述可變結(jié)構(gòu)域衍生自人vh基因區(qū)段與人d基因區(qū)段和人jh基因區(qū)段的重組,所述vh基因區(qū)段選自在中國人群體中存在的vh,具有至少5%的累積頻率。

      在一個例子中,基因區(qū)段在1000genomes數(shù)據(jù)庫中發(fā)現(xiàn)。在一個例子中,基因區(qū)段在表13中發(fā)現(xiàn)。

      348.條款345、346或347的抗體,其中所述可變結(jié)構(gòu)域衍生自人vh基因區(qū)段與人d基因區(qū)段和人jh基因區(qū)段的重組,所述d基因區(qū)段選自在中國人群體中發(fā)現(xiàn)的表13中的d并具有至少5%的累積頻率。

      在另一個實施方案中,本發(fā)明提供了

      條款345、346或347的抗體,其中所述可變結(jié)構(gòu)域衍生自人vh基因區(qū)段與人d基因區(qū)段和人jh基因區(qū)段的重組,所述d基因區(qū)段選自在中國人群體中存在的d,具有至少5%的累積頻率。

      在一個例子中,基因區(qū)段在1000genomes數(shù)據(jù)庫中發(fā)現(xiàn)。在一個例子中,基因區(qū)段在表13中發(fā)現(xiàn)。

      349.條款345、346、347或348的抗體,其中所述可變結(jié)構(gòu)域衍生自人vh基因區(qū)段與人d基因區(qū)段和人jh基因區(qū)段的重組,所述jh基因區(qū)段選自在中國人群體中發(fā)現(xiàn)的表13中的jh并具有至少5%的累積頻率。

      在另一個實施方案中,本發(fā)明提供了

      條款345、346、347或348的抗體,其中所述可變結(jié)構(gòu)域衍生自人vh基因區(qū)段與人d基因區(qū)段和人jh基因區(qū)段的重組,所述jh基因區(qū)段選自在中國人群體中存在的jh,具有至少5%的累積頻率。

      在一個例子中,基因區(qū)段在1000genomes數(shù)據(jù)庫中發(fā)現(xiàn)。在一個例子中,基因區(qū)段在表13中發(fā)現(xiàn)。

      350.分離的vh結(jié)構(gòu)域,其與條款347-349中任一項中所述的可變結(jié)構(gòu)域相同,任選在其c末端與多肽(例如抗體fc)融合。

      在一個實施方案中,提供了與條款347-349中任一項中所述的可變結(jié)構(gòu)域相同的分離的vh結(jié)構(gòu)域,其為綴合物的部分,與標記(例如用于在患者中成像)或毒素(例如放射性毒性有效負荷,例如用于患者中的癌癥治療)或半衰期延長部分(例如人血清白蛋白的peg)綴合。

      351.藥物組合物,其包含條款345-350中任一項的抗體或可變結(jié)構(gòu)域連同藥學可接受的賦形劑、稀釋劑或藥物(例如進一步的抗原特異性可變結(jié)構(gòu)域、抗體鏈或抗體)。

      352.用于施用于中國人患者的分離的抗體,所述抗體包含人重鏈,所述重鏈包含對于抗原特異性的可變結(jié)構(gòu)域和恒定區(qū),其中所述可變結(jié)構(gòu)域衍生自人vh基因區(qū)段與人d基因區(qū)段和人jh基因區(qū)段的重組,所述vh基因區(qū)段選自在中國人群體中發(fā)現(xiàn)的表13中的vh并具有至少5%的累積頻率;并且其中

      (i)所述可變結(jié)構(gòu)域衍生自所述人基因區(qū)段在非人脊椎動物中(例如小鼠或大鼠中)的重組;和/或(ii)所述可變結(jié)構(gòu)域包含非人脊椎動物(例如小鼠或大鼠)aid模式突變和非人脊椎動物(例如小鼠或大鼠)末端脫氧核苷酸轉(zhuǎn)移酶(tdt)模式突變。

      在另一個實施方案中,本發(fā)明提供了

      用于施用于中國人患者的分離的抗體,所述抗體包含人重鏈,所述重鏈包含對于抗原特異性的可變結(jié)構(gòu)域和恒定區(qū),其中所述可變結(jié)構(gòu)域衍生自人vh基因區(qū)段與人d基因區(qū)段和人jh基因區(qū)段的重組,所述vh基因區(qū)段選自在中國人群體中存在的vh,具有至少5%的累積頻率;并且其中

      (i)所述可變結(jié)構(gòu)域衍生自所述人基因區(qū)段在非人脊椎動物中(例如小鼠或大鼠中)的重組;和/或(ii)所述可變結(jié)構(gòu)域包含非人脊椎動物(例如小鼠或大鼠)aid模式突變和非人脊椎動物(例如小鼠或大鼠)末端脫氧核苷酸轉(zhuǎn)移酶(tdt)模式突變。

      353.條款352的抗體,其中所述可變結(jié)構(gòu)域衍生自人vh基因區(qū)段與人d基因區(qū)段和人jh基因區(qū)段的重組,所述d基因區(qū)段選自在中國人群體中發(fā)現(xiàn)的表13中的d并具有至少5%的累積頻率。

      在另一個實施方案中,本發(fā)明提供了

      條款352的抗體,其中所述可變結(jié)構(gòu)域衍生自人vh基因區(qū)段與人d基因區(qū)段和人jh基因區(qū)段的重組,所述d基因區(qū)段選自在中國人群體中存在的d,具有至少5%的累積頻率。

      在一個例子中,基因區(qū)段在1000genomes數(shù)據(jù)庫中發(fā)現(xiàn)。在一個例子中,基因區(qū)段在表13中發(fā)現(xiàn)。

      354.條款352或353的抗體,其中所述可變結(jié)構(gòu)域衍生自人vh基因區(qū)段與人d基因區(qū)段和人jh基因區(qū)段的重組,所述jh基因區(qū)段選自在中國人群體中發(fā)現(xiàn)的表13中的jh并具有至少5%的累積頻率。

      在另一個實施方案中,本發(fā)明提供了

      條款352或353的抗體,其中所述可變結(jié)構(gòu)域衍生自人vh基因區(qū)段與人d基因區(qū)段和人jh基因區(qū)段的重組,所述jh基因區(qū)段選自在中國人群體中存在的jh,具有至少5%的累積頻率。

      在一個例子中,基因區(qū)段在1000genomes數(shù)據(jù)庫中發(fā)現(xiàn)。在一個例子中,基因區(qū)段在表13中發(fā)現(xiàn)。

      355.分離的vh結(jié)構(gòu)域,其與條款352-354中任一項中所述的可變結(jié)構(gòu)域相同,任選在其c末端與多肽(例如抗體fc)融合。

      在一個實施方案中,提供了與條款352-354中任一項中所述的可變結(jié)構(gòu)域相同的vh結(jié)構(gòu)域,其為綴合物的一部分,與標記(例如用于在患者中成像)或毒素(例如放射性毒性有效負荷,例如用于患者中的癌癥治療)或半衰期延長部分(例如人血清白蛋白的peg)綴合。

      356.藥物組合物,其包含條款352-355中任一項的抗體或可變結(jié)構(gòu)域連同藥學可接受的賦形劑、稀釋劑或藥物(例如進一步的抗原特異性可變結(jié)構(gòu)域、抗體鏈或抗體)。

      357.用于治療和/或預防中國人患者中的疾病或醫(yī)學狀況的抗體重鏈或vh結(jié)構(gòu)域(例如作為抗體的部分提供),其中所述重鏈是通過下述步驟產(chǎn)生的重鏈(或是此類重鏈的拷貝):

      (a)從非人脊椎動物(例如小鼠或大鼠)中選擇抗原特異性抗體重鏈或vh結(jié)構(gòu)域,其中所述重鏈或vh結(jié)構(gòu)域衍生自人vh基因區(qū)段與人d基因區(qū)段和人jh基因區(qū)段的重組,所述vh基因區(qū)段選自在中國人群體中發(fā)現(xiàn)的表13中的vh并具有至少5%的累積頻率;

      (b)通過組合所述重鏈的可變結(jié)構(gòu)域與人恒定區(qū)的任選重鏈人源化;或通過與人恒定區(qū)組合任選人源化所選vh結(jié)構(gòu)域。

      在另一個實施方案中,本發(fā)明提供了

      用于治療和/或預防中國人患者中的疾病或醫(yī)學狀況的抗體重鏈或vh結(jié)構(gòu)域(例如作為抗體的部分提供),其中所述重鏈是通過下述步驟產(chǎn)生的重鏈(或是此類重鏈的拷貝):

      (a)從非人脊椎動物(例如小鼠或大鼠)中選擇抗原特異性抗體重鏈或vh結(jié)構(gòu)域,其中所述重鏈或vh結(jié)構(gòu)域衍生自人vh基因區(qū)段與人d基因區(qū)段和人jh基因區(qū)段的重組,所述vh基因區(qū)段選自在中國人群體中存在的vh,具有至少5%的累積頻率;

      (b)通過組合所述重鏈的可變結(jié)構(gòu)域與人恒定區(qū)的任選重鏈人源化;或通過與人恒定區(qū)組合任選人源化所選vh結(jié)構(gòu)域。

      在一個例子中,vh基因區(qū)段在1000genomes數(shù)據(jù)庫中發(fā)現(xiàn)。在一個例子中,基因區(qū)段在表13中發(fā)現(xiàn)。

      358.條款357的抗體重鏈或vh結(jié)構(gòu)域,其中所述人恒定區(qū)如條款345或346中所述。

      359.如條款357或358中所述的抗體重鏈或vh結(jié)構(gòu)域,其用于治療和/或預防中國人患者中的疾病或醫(yī)學狀況的藥物中。

      360.治療和/或預防中國人患者中的疾病或醫(yī)學狀況的方法,所述方法包括給所述患者施用治療或預防有效量的如條款357或358中所述的抗體重鏈或vh結(jié)構(gòu)域。

      361.用于施用于具有歐洲、東亞、西非、南亞或美洲祖先的患者的分離的抗體,所述抗體包含人重鏈,所述重鏈包含對于抗原特異性的可變結(jié)構(gòu)域和恒定區(qū),其中所述恒定區(qū)是這樣的人恒定區(qū),其選自分別在具有歐洲、東亞、西非、南亞或美洲祖先的群體中發(fā)現(xiàn)的表13中的恒定區(qū)(例如ighg恒定區(qū))并具有至少1或5%的累積頻率;并且其中

      (i)所述可變結(jié)構(gòu)域衍生自所述人基因區(qū)段在非人脊椎動物中(例如小鼠或大鼠中)的重組;或(ii)所述可變結(jié)構(gòu)域包含非人脊椎動物(例如小鼠或大鼠)aid模式突變和非人脊椎動物(例如小鼠或大鼠)末端脫氧核苷酸轉(zhuǎn)移酶(tdt)模式突變。

      在另一個實施方案中,本發(fā)明提供了

      用于施用于具有歐洲、東亞、西非、南亞或美洲祖先的患者的分離的抗體,所述抗體包含人重鏈,所述重鏈包含對于抗原特異性的可變結(jié)構(gòu)域和恒定區(qū),其中所述恒定區(qū)是這樣的人恒定區(qū),其選自分別在具有歐洲、東亞、西非、南亞或美洲祖先的群體中存在的恒定區(qū)(例如ighg恒定區(qū)),具有至少1或5%的累積頻率;并且其中

      (i)所述可變結(jié)構(gòu)域衍生自所述人基因區(qū)段在非人脊椎動物中(例如小鼠或大鼠中)的重組;或(ii)所述可變結(jié)構(gòu)域包含非人脊椎動物(例如小鼠或大鼠)aid模式突變和非人脊椎動物(例如小鼠或大鼠)末端脫氧核苷酸轉(zhuǎn)移酶(tdt)模式突變。

      在一個例子中,恒定區(qū)在1000genomes數(shù)據(jù)庫中發(fā)現(xiàn)。在一個例子中,恒定區(qū)在表13中發(fā)現(xiàn)。

      362.條款361的抗體,其中所述恒定區(qū)是ighg1a、ighg2a、ighg3a、ighg3b或ighg4a恒定區(qū)并且所述患者具有歐洲祖先。

      363.條款361或362的抗體,其中所述可變結(jié)構(gòu)域衍生自人vh基因區(qū)段與人d基因區(qū)段和人jh基因區(qū)段的重組,所述vh基因區(qū)段選自在所述群體中發(fā)現(xiàn)的表13中的vh并具有至少1或5%的累積頻率。

      在另一個實施方案中,本發(fā)明提供了

      條款361或362的抗體,其中所述可變結(jié)構(gòu)域衍生自人vh基因區(qū)段與人d基因區(qū)段和人jh基因區(qū)段的重組,所述vh基因區(qū)段選自在中國人群體中存在的vh,具有至少5%的累積頻率。

      在一個例子中,基因區(qū)段在1000genomes數(shù)據(jù)庫中發(fā)現(xiàn)。在一個例子中,基因區(qū)段在表13中發(fā)現(xiàn)。

      364.條款361、362或363的抗體,其中所述可變結(jié)構(gòu)域衍生自人vh基因區(qū)段與人d基因區(qū)段和人jh基因區(qū)段的重組,所述d基因區(qū)段選自在所述群體中發(fā)現(xiàn)的表13中的d并具有至少1或5%的累積頻率。

      在另一個實施方案中,本發(fā)明提供了

      條款361、362或363的抗體,其中所述可變結(jié)構(gòu)域衍生自人vh基因區(qū)段與人d基因區(qū)段和人jh基因區(qū)段的重組,所述d基因區(qū)段選自在中國人群體中存在的d,具有至少5%的累積頻率。

      在一個例子中,基因區(qū)段在1000genomes數(shù)據(jù)庫中發(fā)現(xiàn)。在一個例子中,基因區(qū)段在表13中發(fā)現(xiàn)。

      365.條款361、362、363或364的抗體,其中所述可變結(jié)構(gòu)域衍生自人vh基因區(qū)段與人d基因區(qū)段和人jh基因區(qū)段的重組,所述jh基因區(qū)段選自在所述群體中發(fā)現(xiàn)的表13中的jh并具有至少1或5%的累積頻率。

      在另一個實施方案中,本發(fā)明提供了

      條款361、362、363或364的抗體,其中所述可變結(jié)構(gòu)域衍生自人vh基因區(qū)段與人d基因區(qū)段和人jh基因區(qū)段的重組,所述jh基因區(qū)段選自在中國人群體中存在的jh,具有至少5%的累積頻率。

      在一個例子中,基因區(qū)段在1000genomes數(shù)據(jù)庫中發(fā)現(xiàn)。在一個例子中,基因區(qū)段在表13中發(fā)現(xiàn)。

      366.分離的vh結(jié)構(gòu)域,其與條款363-365中任一項中所述的可變結(jié)構(gòu)域相同,任選在其c末端與多肽(例如抗體fc)融合。

      367.藥物組合物,其包含條款361-366中任一項的抗體或可變結(jié)構(gòu)域連同藥學可接受的賦形劑、稀釋劑或藥物(例如進一步的抗原特異性可變結(jié)構(gòu)域、抗體鏈或抗體)。

      368.用于施用于具有歐洲、東亞、西非或美洲祖先的患者的分離的抗體,所述抗體包含人重鏈,所述重鏈包含對于抗原特異性的可變結(jié)構(gòu)域和恒定區(qū),其中所述可變結(jié)構(gòu)域衍生自人vh基因區(qū)段與人d基因區(qū)段和人jh基因區(qū)段的重組,所述vh基因區(qū)段選自分別在具有歐洲、東亞、西非、南亞或美洲祖先的群體中發(fā)現(xiàn)的表13中的vh并具有至少1或5%的累積頻率;并且其中

      (i)所述可變結(jié)構(gòu)域衍生自所述人基因區(qū)段在非人脊椎動物中(例如小鼠或大鼠中)的重組;或(ii)所述可變結(jié)構(gòu)域包含非人脊椎動物(例如小鼠或大鼠)aid模式突變和非人脊椎動物(例如小鼠或大鼠)末端脫氧核苷酸轉(zhuǎn)移酶(tdt)模式突變。

      在另一個實施方案中,本發(fā)明提供了

      用于施用于具有歐洲、東亞、西非或美洲祖先的患者的分離的抗體,所述抗體包含人重鏈,所述重鏈包含對于抗原特異性的可變結(jié)構(gòu)域和恒定區(qū),其中所述可變結(jié)構(gòu)域衍生自人vh基因區(qū)段與人d基因區(qū)段和人jh基因區(qū)段的重組,所述vh基因區(qū)段選自分別在具有歐洲、東亞、西非、南亞或美洲祖先的群體中存在的vh并具有至少1或5%的累積頻率;并且其中

      (i)所述可變結(jié)構(gòu)域衍生自所述人基因區(qū)段在非人脊椎動物中(例如小鼠或大鼠中)的重組;或(ii)所述可變結(jié)構(gòu)域包含非人脊椎動物(例如小鼠或大鼠)aid模式突變和非人脊椎動物(例如小鼠或大鼠)末端脫氧核苷酸轉(zhuǎn)移酶(tdt)模式突變。

      在一個例子中,vh基因區(qū)段在1000genomes數(shù)據(jù)庫中發(fā)現(xiàn)。在一個例子中,基因區(qū)段在表13中發(fā)現(xiàn)。

      369.條款368的抗體,其中所述可變結(jié)構(gòu)域衍生自人vh基因區(qū)段與人d基因區(qū)段和人jh基因區(qū)段的重組,所述d基因區(qū)段選自在所述群體中發(fā)現(xiàn)的表13中的d并具有至少1或5%的累積頻率。

      在另一個例子中,本發(fā)明提供了

      條款368的抗體,其中所述可變結(jié)構(gòu)域衍生自人vh基因區(qū)段與人d基因區(qū)段和人jh基因區(qū)段的重組,所述d基因區(qū)段選自在所述群體中存在的d,具有至少1或5%的累積頻率。

      在一個例子中,d基因區(qū)段在1000genomes數(shù)據(jù)庫中發(fā)現(xiàn)。在一個例子中,基因區(qū)段在表13中發(fā)現(xiàn)。

      370.條款368或369的抗體,其中所述可變結(jié)構(gòu)域衍生自人vh基因區(qū)段與人d基因區(qū)段和人jh基因區(qū)段的重組,所述jh基因區(qū)段選自在所述群體中發(fā)現(xiàn)的表13中的jh并具有至少1或5%的累積頻率。

      在另一個例子中,本發(fā)明提供了

      條款368或369的抗體,其中所述可變結(jié)構(gòu)域衍生自人vh基因區(qū)段與人d基因區(qū)段和人jh基因區(qū)段的重組,所述jh基因區(qū)段選自在所述群體中存在的jh并具有至少1或5%的累積頻率。

      在一個例子中,jh基因區(qū)段在1000genomes數(shù)據(jù)庫中發(fā)現(xiàn)。在一個例子中,基因區(qū)段在表13中發(fā)現(xiàn)。

      371.分離的vh結(jié)構(gòu)域,其與條款368-370中任一項中所述的可變結(jié)構(gòu)域相同,任選在其c末端與多肽(例如抗體fc)融合。

      372.藥物組合物,其包含條款368-371中任一項的抗體或可變結(jié)構(gòu)域連同藥學可接受的賦形劑、稀釋劑或藥物(例如進一步的抗原特異性可變結(jié)構(gòu)域、抗體鏈或抗體)。

      373.用于治療和/或預防具有歐洲、東亞、西非、南亞或美洲祖先的患者中的疾病或醫(yī)學狀況的抗體重鏈或vh結(jié)構(gòu)域(例如作為抗體的部分提供),其中所述重鏈是通過下述步驟產(chǎn)生的重鏈(或是此類重鏈的拷貝):

      (a)從非人脊椎動物(例如小鼠或大鼠)中選擇抗原特異性抗體重鏈或vh結(jié)構(gòu)域,其中所述重鏈或vh結(jié)構(gòu)域衍生自人vh基因區(qū)段與人d基因區(qū)段和人jh基因區(qū)段的重組,所述vh基因區(qū)段選自在所述群體中發(fā)現(xiàn)的表13中的vh并具有至少1或5%的累積頻率;

      (b)通過組合所述重鏈的可變結(jié)構(gòu)域與人恒定區(qū)任選人源化所述重鏈;或通過與人恒定區(qū)組合任選人源化所選vh結(jié)構(gòu)域。

      在另一個實施方案中,本發(fā)明提供了

      用于治療和/或預防具有歐洲、東亞、西非、南亞或美洲祖先的患者中的疾病或醫(yī)學狀況的抗體重鏈或vh結(jié)構(gòu)域(例如作為抗體的部分提供),其中所述重鏈是通過下述步驟產(chǎn)生的重鏈(或是此類重鏈的拷貝):

      (a)從非人脊椎動物(例如小鼠或大鼠)中選擇抗原特異性抗體重鏈或vh結(jié)構(gòu)域,其中所述重鏈或vh結(jié)構(gòu)域衍生自人vh基因區(qū)段與人d基因區(qū)段和人jh基因區(qū)段的重組,所述vh基因區(qū)段選自在所述群體中存在的vh,具有至少1或5%的累積頻率;

      (b)通過組合所述重鏈的可變結(jié)構(gòu)域與人恒定區(qū)任選人源化所述重鏈;或通過與人恒定區(qū)組合任選人源化所選vh結(jié)構(gòu)域。

      在一個例子中,vh基因區(qū)段在1000genomes數(shù)據(jù)庫中發(fā)現(xiàn)。在一個例子中,基因區(qū)段在表13中發(fā)現(xiàn)。

      374.條款373的抗體重鏈或vh結(jié)構(gòu)域,其中所述人恒定區(qū)如條款361或362中所述。

      375.如條款373或374中所述的抗體重鏈或vh結(jié)構(gòu)域,其用于治療和/或預防具有所述祖先的患者中的疾病或醫(yī)學狀況的藥物中。

      376.治療和/或預防具有歐洲、東亞、西非、南亞或美洲祖先的患者中的疾病或醫(yī)學狀況的方法,所述方法包括給所述患者施用治療或預防有效量的如條款373或374中所述的抗體重鏈或vh結(jié)構(gòu)域。

      在本文實施方案中,中國人患者可以是中國漢人患者。

      在本文實施方案中,具有歐洲祖先的患者可以是具有北歐或西歐祖先、意大利祖先、英國或蘇格蘭祖先、芬蘭祖先或伊比利亞祖先的患者。

      在本文實施方案中,具有東亞祖先的患者可以是具有中國漢人祖先、日本人祖先、中國人傣人祖先、越南人祖先或京人祖先的患者。

      在本文實施方案中,具有西非祖先的患者可以是具有約魯巴人祖先、盧西亞人祖先、岡比亞人祖先或馬拉維人祖先的患者。

      在本文實施方案中,具有美洲祖先的患者可以是具有非裔美國人祖先、非洲加勒比人祖先、墨西哥人祖先、波多黎各人祖先、哥倫比亞人祖先或秘魯人祖先的患者。

      在本文實施方案中,具有南亞祖先的患者可以是具有阿洪姆人祖先、卡亞斯塔人祖先、reddy祖先、馬拉地人祖先或旁遮普人祖先的患者。

      在任何方面的例子中,所述累積頻率為至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90或95%。

      應當理解本文描述的特定實施方案顯示作為舉例說明而不是限制本發(fā)明。本發(fā)明的主要特征在不偏離本發(fā)明的范圍的情況下可以用于多個實施方案中。本領(lǐng)域技術(shù)人員將認識到,或能夠使用不超過常規(guī)研究確定本文描述的特定程序的眾多等價物。此類等價物視為在本發(fā)明的范圍內(nèi)且由權(quán)利要求涵蓋。說明書中提及的所有出版物和專利申請指示本發(fā)明所屬領(lǐng)域技術(shù)人員的技能水平。所有出版物和專利申請均引入本文作為參考,其程度與每個個別出版物或?qū)@暾執(zhí)貏e且個別指出引入本文作為參考相同。當在權(quán)利要求和/或說明書中與術(shù)語“包含”結(jié)合使用時,單詞“一個”或“一種”的使用可以意指“一個/一種”,但它還可以與“一個或多個/一種或多種”、“至少一個/種”和“一個或超過一個/一種或超過一種”的含義一致。在權(quán)利要求中術(shù)語“或”的使用用于意指“和/或”,除非明確指出僅指替代方案或替代方案是相互排斥的,盡管公開內(nèi)容支持僅指替代方案和“和/或”的定義。本申請自始至終,術(shù)語“約”用于指示值包括裝置的固有誤差變化,該方法用于測定值,或在研究對象中存在的變化。

      如本說明書和一個或多個權(quán)利要求中使用的,單詞“包含”(和任何形式的包含)、具有(和任何形式的具有)、包括(和任何形式的包括)、或含有(和任何形式的含有)是包括在內(nèi)的或開放式的并且不排除另外未敘述的元件或方法步驟。

      如本文使用的術(shù)語“或其組合”指在該術(shù)語前所列出的項目的所有排列和組合。例如,“a、b、c或其組合意欲包括下述中的至少一個:a、b、c、ab、ac、bc或abc,并且如果次序在特定背景下是重要的,還包括ba、ca、cb、cba、bca、acb、bac或cab。繼續(xù)這一例子,明確包括的是含有一個或多個項目或術(shù)語的重復,例如bb、aaa、mb、bbc、aaabcccc、cbbaaa、cababb等等。技術(shù)人員將理解通常不存在關(guān)于以任何組合的項目或術(shù)語數(shù)目的限制,除非上下文明顯并非如此。

      本公開內(nèi)容的任何部分可以與公開內(nèi)容的任何其他部分組合閱讀,除非上下文明顯并非如此。

      本文公開和請求保護的組合物和/或方法的全部可以按照本公開內(nèi)容進行制備且執(zhí)行,無需過度實驗。雖然本發(fā)明的組合物和方法已就優(yōu)選實施方案而言進行描述,但對于本領(lǐng)域技術(shù)人員顯而易見的是:可以對組合物和/或方法和在本文描述的方法的步驟和步驟順序中施加變化,而不偏離本發(fā)明的概念、精神和范圍。對本領(lǐng)域技術(shù)人員顯而易見的所有此類相似替代和修飾視為在如由所附權(quán)利要求定義的本發(fā)明的精神、范圍和概念內(nèi)。

      本發(fā)明在下述非限制性假想實施例中更詳細地描述。

      實施例

      實施例1

      “將多態(tài)v區(qū)加入小鼠基因組的重組工程bac載體”

      圖1到3描述可以用于將多態(tài)v基因區(qū)引入基因組dna內(nèi)的重組工程方法(參見上文參考文獻)。在一個實施方案中,通過標準技術(shù)將來自人重鏈區(qū)的基因組片段插入細菌人工染色體(bac)載體。優(yōu)選地,可以通過標準技術(shù)包括商購可得文庫的序列搜索或通過與含有bac的細菌菌落雜交以鑒定具有目的bac的那些,從bac文庫中分離大小范圍可為20-kb至200-kb或更多的此類bac。

      選擇具有幾個vh基因區(qū)段的bac;在圖1中,這些一般鑒定為例如vh[a]到vh[z]。本領(lǐng)域技術(shù)人員將容易鑒定適當?shù)幕蚪M片段,例如來自人vh5-78到vh1-68的大約120-kb片段,其包括5個內(nèi)源活性vh基因區(qū)段和7個vh假基因。使用重組工程技術(shù),內(nèi)源vh基因區(qū)段可以置換為多態(tài)vh或vl基因區(qū)段。在這一例子中,需要兩個步驟。第一個步驟將內(nèi)源vh基因區(qū)段的v區(qū)編碼外顯子置換為正-負選擇操縱子,在這一例子中,是編碼氨芐青霉素抗性基因(amp)和鏈霉素致敏核糖體蛋白(rpsl)的操縱子。某些細菌菌株可以通過對鏈霉素的抗性就rpsl基因的不存在進行選擇。與在內(nèi)源vh基因外顯子側(cè)翼的序列同源的短dna段放置在rpsl-amp操縱子的5'和3'。在適當?shù)闹亟M因子/標準重組工程技術(shù)(參見上文參考文獻)的存在下,在操縱子片段和bac之間的重組將導致內(nèi)源vh基因外顯子置換為操縱子(圖1a),其通過對氨芐青霉素的抗性加以選擇。第二步驟使用相同同源序列以便將插入的操縱子置換為所需多態(tài)vh基因區(qū)段。在這一例子中,插入人vh1-69基因(圖1b和1c)。特別地,使用vh1-69的*02變體[refimgt和圖5]。由于操縱子特別是rpsl部分的喪失,在變得對鏈霉素抗性的細菌中選擇多態(tài)vh基因區(qū)段的成功整合。

      在這一例子中,可以對于每個內(nèi)源vh基因區(qū)段或?qū)τ谂c希望置換為多態(tài)v基因區(qū)段一樣多的內(nèi)源基因區(qū)段重復所述兩步過程(圖1d)。

      顯而易見,任何多態(tài)v基因區(qū)段可以以這種方式插入并且任何內(nèi)源v基因區(qū)段包括假基因均可以充當靶。重鏈和兩個輕鏈基因座的每個中的v基因區(qū)段可以使用這種技術(shù)置換為可用作bac插入物的適當基因組片段。

      圖2描述了用于產(chǎn)生編碼多態(tài)v基因區(qū)段的基因組片段的另一種方法。在這一例子中,將多態(tài)v基因區(qū)段插入缺乏其他基因、控制元件或其他功能的基因組dna區(qū)域內(nèi)。此類‘沙漠(desert)’區(qū)可以基于序列分析和克隆到bac內(nèi)或在現(xiàn)有bac文庫中鑒定的相應的dna片段加以選擇。以此類基因組片段開始,重組工程技術(shù)可以用于以例如10-kb的間隔插入多態(tài)v基因區(qū)段。在這一例子中,150-kb基因組片段可以容納高達15個多態(tài)v基因區(qū)段的插入。區(qū)段的插入是兩步過程。第一重組工程步驟在特定位點處插入rpsl-amp操縱子。與特定位點同源的序列用于置于操縱子側(cè)翼。這些通過重組工程系統(tǒng)使用以將元件特異性插入bac基因組片段內(nèi)并且通過對氨芐青霉素的抗性選擇陽性事件(圖2a)。第二步驟通過相似的重組工程步驟,使用相同序列同源性,將基因組片段中的操縱子置換為多態(tài)v基因區(qū)段(圖2b)。在這一例子中,插入多態(tài)vh基因區(qū)段的外顯子和啟動子元件兩者,導致rpsl-amp操縱子的置換和因此對鏈霉素的抗性(圖2c)。

      用于將多態(tài)v基因區(qū)段插入基因組片段上的特定位點的兩步技術(shù)可以重復多次,產(chǎn)生具有幾個多態(tài)基因區(qū)段包括其啟動子元件的bac基因組片段。顯而易見的是可以組合圖1和2中所示的例子,其中用于插入的技術(shù)可以用于將額外多態(tài)v基因區(qū)段加入bac基因組片段,如圖1中所示。可能選擇將這些額外區(qū)段加入ig基因組片段,因為一旦插入非人哺乳動物的基因組內(nèi),此類片段就將更順應適當?shù)膇g基因表達。已知基因組片段可以具有元件如增強子或促成某些染色質(zhì)構(gòu)象的元件,兩者在野生型基因表達中都是重要的。

      圖3描述了產(chǎn)生具有多態(tài)v基因區(qū)段的基因組片段的另外方法。該方法依賴使用重組工程短(約50-150個堿基,優(yōu)選100個堿基)單鏈dna片段與同源序列重組的效率(natrevgenet.2001oct;2(10):769-79;recombineering:apowerfulnewtoolformousefunctionalgenomics;copelandng,jenkinsna,courtdl)。在重組工程中使用的重組酶優(yōu)先結(jié)合且使用此類短單鏈dna片段作為用于起始同源重組的底物。效率可以高達10-2,即陽性事件可以在得自重組工程的大約100個隨機挑選(未選擇)的克隆中發(fā)現(xiàn)。在這一例子中,當一種或多種單核苷酸變化引入單鏈片段內(nèi)時發(fā)生的陽性事件轉(zhuǎn)移至含有v基因區(qū)段和周圍基因組dna的bac插入物,所述一種或多種核苷酸變化在bac上的同源序列處發(fā)生。

      例如,多態(tài)v基因區(qū)段可以與內(nèi)源v基因區(qū)段相差僅1或2,或高達10或15個核苷酸變化。此類核苷酸多態(tài)性的例子在圖5中描述。包含多態(tài)核苷酸變化的短單鏈區(qū)可以使用標準技術(shù)化學合成。將所得到的單鏈dna片段引入細菌內(nèi)并且經(jīng)由重組工程技術(shù),大約100個bac片段中的1個將已經(jīng)通過所述單鏈片段的同源摻入而摻入多態(tài)核苷酸(圖3a)。具有所需核苷酸變化的bac可以通過經(jīng)由聚合酶鏈反應(pcr)擴增和測序(兩者均通過標準技術(shù))來篩選例如幾百個個別克隆進行鑒定。在例子中,兩個核苷酸變化將vh1-69*01基因區(qū)段轉(zhuǎn)換成vh1-69*02基因區(qū)段(圖3b)。

      明確的是可以對于在單個bac基因組片段上含有的多個內(nèi)源v基因區(qū)段重復該過程。另外,圖2中所述的技術(shù)可以通過插入現(xiàn)有v基因區(qū)段之間的區(qū)域內(nèi)用于加入另外的多態(tài)v基因區(qū)段。如對于本領(lǐng)域技術(shù)人員顯而易見的,這些技術(shù)的組合可以用于產(chǎn)生多態(tài)和內(nèi)源人v基因區(qū)段的眾多變化。另外顯而易見的是可以組合具有工程化的多態(tài)v基因區(qū)段和內(nèi)源人v基因區(qū)段的幾個不同的基因組片段以產(chǎn)生甚至更多變化。

      實施例2

      “使用經(jīng)修飾的bac的srmce將多態(tài)v區(qū)加入基因組”

      使用實施例1中所述的方法產(chǎn)生的具有多態(tài)v基因區(qū)段的經(jīng)修飾的bac可以用于改變非人哺乳動物的基因組。這些改變可以導致完整的ig基因座,其中正常免疫球蛋白區(qū)域重組導致包括人v基因區(qū)段的vdj或vj組合。此類動物可以如何制備的例子是使用圖4中概述的策略通過改變例如小鼠胚胎干(es)細胞的基因組。

      將具有多態(tài)v基因區(qū)段的經(jīng)修飾的bac整合到基因組內(nèi)的一種技術(shù)是順序重組酶介導的盒交換(srmce)。該技術(shù)在wo2011004192(genomeresearchlimited)中描述,其整體引入本文作為參考。

      srmce提供了用在特定位置處插入的‘著陸墊(landingpad)’修飾的基因座。該插入可以經(jīng)由同源重組從新形成或是由于先前bac插入的結(jié)果。在這一例子中,著陸墊插入小鼠igh基因座中最3'的j基因區(qū)段和cμ基因區(qū)段之間,并且經(jīng)由srmce技術(shù)的先前bac插入已導致5個人v基因區(qū)段和2個v區(qū)假基因的加入。著陸墊具有如圖4中所示的元件,其允許選擇第二靶向bac片段的正確插入。該插入的特異性由允許的lox位點之間cre重組酶介導的交換提供。lox位點僅允許與相容lox位點的重組。在這一例子中,loxp位點將僅與loxp重組,并且lox2272將僅與lox2272重組。這提供如圖4b和4c中所述的bac片段插入的方向性。

      具有正確插入的es細胞克隆通過對嘌呤霉素的抗性選自不含插入或具有非生產(chǎn)性插入的克隆庫。對嘌呤霉素的抗性起因于活性啟動子元件pgk與purotk編碼區(qū)的并列。正確插入通過標準技術(shù)包括連接處的pcr、內(nèi)部元件的pcr、southern印跡、比較基因組雜交(cgh)、測序等加以驗證。在例子中,正確的lox2272-lox2272和loxp-loxp重組還導致在插入前不存在的完整兩組piggybac元件。完整的piggybac元件包含一組反向重復,其在圖中由"pb5'"和"pb3'"描述。適當定向的piggybac元件組是piggybac轉(zhuǎn)座酶的底物,其可以催化元件之間的重組,導致間插序列以及兩個元件的缺失。在piggybac轉(zhuǎn)座后剩余的dna保持完整并且缺乏piggybac元件的任何殘留部分。在例子中,具有成功piggybac轉(zhuǎn)座的es細胞克隆通過活性purotk元件的喪失選擇,所述活性purotk元件致使細胞對藥物fiau具有抗性(圖4c和4d)。

      這一例子中的srmce法的最終產(chǎn)物是在5'側(cè)上的小鼠基因組的序列和在3'側(cè)上的小鼠igh恒定區(qū)基因區(qū)段之間,具有連同一組內(nèi)源未修飾vh基因區(qū)段一起插入的幾個多態(tài)v基因區(qū)段的igh基因座。多態(tài)v基因區(qū)段這樣定位,從而使得它們可以參與和b細胞成熟相關(guān)的重組事件,獲得vdj基因區(qū)段。這些基因區(qū)段隨后可以轉(zhuǎn)錄且剪接至小鼠恒定區(qū)。這些轉(zhuǎn)錄物的翻譯將導致由多態(tài)v基因區(qū)段編碼的抗體重鏈、人dh基因區(qū)段、人jh基因區(qū)段和小鼠恒定重鏈基因區(qū)段的產(chǎn)生。

      如技術(shù)人員眾所周知的,經(jīng)由所述細胞注射入小鼠胚泡胚胎內(nèi),將注射的胚胎轉(zhuǎn)移到合適的接受者并且培養(yǎng)產(chǎn)生的嵌合后代,es細胞克隆可以用于產(chǎn)生遺傳修飾的小鼠系。經(jīng)修飾的基因座可以通過育種擴散,并且取決于遺傳雜交制備為雜合或純合的。

      由這一例子中提供的igh基因座的結(jié)構(gòu)和涉及b細胞受體(bcr)的機制和抗體基因重排的知識顯而易見的是,將產(chǎn)生多態(tài)v基因區(qū)段與多種dh和jh基因區(qū)段的大量不同組合,并且這些可以促成在遺傳修飾動物中的b細胞群體中的功能性抗體基因的大的庫集。在這一例子中,摻入幾種不同的人vh1-69多態(tài)性以提供超人vh多樣性。這個特定vh基因區(qū)段已知在抗體中流行,其結(jié)合感染性疾病病原體(例如流感病毒)和因此具有該例子的遺傳修飾的小鼠的抗體庫集將預期產(chǎn)生這樣的抗體,其具有有利于結(jié)合感染性疾病病原體的那些的偏向。換言之,所述庫集將具有更大的抗體子集,對于病原體抗原具有優(yōu)良親和力。此類病原體的例子包括流感病毒、丙型肝炎病毒(hcv)和人免疫缺陷病毒-1(hiv-1)(還參見上表)。

      實施例3

      "13個vh1-69等位基因的比對"

      通過摻入另外的v基因區(qū)段多態(tài)性構(gòu)建更多樣的抗體庫集需要v基因區(qū)段的多態(tài)性變體的可用性。此類變體的一個資源包括序列數(shù)據(jù)庫。在這一例子中,提供了vh1-69基因區(qū)段的13種不同變體。

      這些變體序列和比較由"immunogenetics"imgtinformationsystem(www.imgt.com)數(shù)據(jù)庫抽提。圖5是變體*02到*13與*01變體的比對簡圖。vh1-69*01核苷酸和氨基酸序列在圖的上部提供。當剩余變體與*01變體序列相同時,在序列下插入破折號。核苷酸差異沿適當變體注明,并且如果序列變化導致蛋白質(zhì)編碼變化,則氨基酸變化在三聯(lián)體上指出。

      圖5描述與*01變體相比較,關(guān)于每種變體的1–4個氨基酸變化。所有氨基酸變化均在編碼互補決定區(qū)(cdr)的重鏈蛋白質(zhì)的部分中發(fā)生。這些區(qū)域負責抗原特異性和抗體對于抗原的親和力。顯而易見的是在抗體庫集中提供另外的多態(tài)cdr將增加存在對于多種抗原具有優(yōu)良結(jié)合特征的可能性。在幾個報告中,已觀察到vh1-69編碼的重鏈可變區(qū)通常在結(jié)合流感病毒、hcv和hiv-1抗原的抗體中發(fā)現(xiàn)(參見上表)。因此,使用實施例1和2的方法將這一實施例的多態(tài)v基因區(qū)段摻入轉(zhuǎn)基因動物模型內(nèi)將可能導致具有更多抗體的所述轉(zhuǎn)基因動物中的抗體庫集,所述抗體結(jié)合與這些及其他病原體相關(guān)的抗原。另外如本領(lǐng)域已知的,更大的庫集增加使用例如雜交瘤技術(shù)發(fā)現(xiàn)單克隆抗體的概率,所述單克隆抗體以高親和力和特異性與所需抗原結(jié)合。

      本公開內(nèi)容因此在這些實施例中描述了轉(zhuǎn)基因小鼠模型,其可以用病原體或其他抗原免疫。來自此類免疫的小鼠的血漿b細胞可以用于制備雜交瘤文庫,其可以篩選結(jié)合病原體抗原的抗體產(chǎn)生??紤]到多態(tài)vh1-69基因區(qū)段加入所述轉(zhuǎn)基因小鼠中的igh基因座,該文庫將優(yōu)于來自用于發(fā)現(xiàn)此類抗體的常規(guī)轉(zhuǎn)基因小鼠的文庫。

      這些實施例并不限于可以選擇的人多態(tài)v基因區(qū)段或用于將其引入動物模型內(nèi)的方法。該方法可以用于構(gòu)建具有免疫球蛋白d和/或j區(qū)段的轉(zhuǎn)基因基因座。v、d、j區(qū)段可以來自多個人來源(任選超過一個人類種族群體)。

      實施例4

      選自1000genomes數(shù)據(jù)庫的人ighjh基因變體

      呈現(xiàn)關(guān)于人jh2、5和6變體的數(shù)據(jù)。在表10a、11a和12a中,列出了來自多個群體的人類的樣品,其中本發(fā)明人的序列分析已揭示在一個或兩個ighjh等位基因中多態(tài)性的存在。群體代碼在上表8中說明。多態(tài)性是來自jh2、5和6參考序列(分別為seqidno:1、2和3;參見下文)的核苷酸變體。所有參考文獻是得自ensembl數(shù)據(jù)庫(www.ensembl.org)的序列。jh5參考是公開于該數(shù)據(jù)庫中的人ighj5-001。jh6參考是公開于該數(shù)據(jù)庫中的人ighj6-001。jh2參考是公開于該數(shù)據(jù)庫中的人ighj2-001。

      參考核苷酸和編碼的氨基酸序列在下一頁上顯示。還提供了與編碼氨基酸序列的比對,包括在人染色體14上的相應位置編號。

      變體頻率顯示于表10a、11a和12a并且這些與1000genomes數(shù)據(jù)庫(于2011年10月的目前發(fā)行版本)中的變體頻率相關(guān)。

      表10b、11b和12b顯示在人jh變體中的非同義核苷酸多態(tài)性,如通過本發(fā)明人從1000genomes數(shù)據(jù)庫分選的。對于變體位置顯示對應于人染色體14上的核苷酸位置的位置編號(染色體14是人中具有igh基因座的染色體)。因此,例如,表11b中的第一個條目是"14:106330027:a/c",其指變體jh5序列中的位置,其中該位置對應于人染色體14上第106,330,027位,此類位置是參考序列中的a(腺嘌呤)?!癱”指出本發(fā)明人觀察到在1000genomes數(shù)據(jù)庫中發(fā)現(xiàn)的變體中該位置處至胞嘧啶的突變。該變化導致在編碼序列的氨基酸水平上的變化(即“非同義”變化),在這種情況下,在變體中從絲氨酸(在參考中發(fā)現(xiàn))到丙氨酸的變化。

      實施例5:

      人抗體基因區(qū)段變體鑒定和群體分析

      使用來自grch.p8humangenome匯編(www.ncbi.nlm.nih.gov/projects/genome/assembly/grc)的坐標從ensemblwww網(wǎng)站(www.ensembl.org)鑒定用于變體分析的關(guān)于每種靶基因的基因組編碼區(qū)坐標。使用收集的基因位置坐標,使用perl'variantpatternfinder'(vpf-www.1000genomes.org/variation-pattern-finder-api-documentation)從1000genomesproject的公開ftp網(wǎng)站處提取變體數(shù)據(jù)。

      由vpf提取的數(shù)據(jù)使用軟件進行后加工以提取具有其相關(guān)基因型調(diào)用的所有非同義(nss)變體。匯集基因型調(diào)用以形成獨特單元型,代表與1000genome群體組相關(guān)的nss變體組和在這些群體內(nèi)的出現(xiàn)頻率。

      分析結(jié)果的輸出導致表例如表13。該表的主體描述每種單元型,依次給出關(guān)于該基因的獨特id(在范圍a-z,aa-zz中),個體和獨特群體組中的群體頻率和出現(xiàn);一個或多個后續(xù)列描述在每個位置處的dna堿基調(diào)用,其形成給出來自參考序列的堿基或變體堿基調(diào)用的單元型。

      表13以這種方式構(gòu)建。表可以如下閱讀:

      前四列(左至右)由下述組成:(1)單元型id字母('ref'指出參考–在來自grch37humanreferenceassembly的每個基因組位置處的dna堿基調(diào)用),(2)在不同群體中觀察到的單元型累積頻率,(3)在其中觀察到特異性單元型的個體數(shù),(4)鑒定的個體屬于的獨特群體組編號(實際群體組標識符展示為關(guān)于每個單元型的最右側(cè)列中的id串。例如,單元型'a'具有'3,4,9,13'的群體id串)。

      群體如下編號(群體標記根據(jù)1000genomesproject命名法)

      1=asw;

      2=ceu;

      3=chb;

      4=chs;

      5=clm;

      6=fin;

      7=gbr;

      8=ibs;

      9=j(luò)pt;

      10=lwk;

      11=mxl;

      12=pur;

      13=tsi;

      14=y(tǒng)ri。

      后續(xù)列詳述單個點變體且具有下述格式(上到下):(1)變體的人基因組位置(格式[染色體編號]:[位置]例如'14:106204113');(2)如dbsnp(www.ncbi.nlm.nih.gov/projects/snp/)中定義的關(guān)于點變體的標識符;(3)一行或另外行顯示由于特定轉(zhuǎn)錄物的變體導致的氨基酸變化(對于每行在最右側(cè)列中的ensembl轉(zhuǎn)錄物id指示),格式是參考序列中的氨基酸,隨后為'->',和在參考序列中由變體取代引起的氨基酸(例如'gly->arg'意指翻譯的參考序列將導致在該位置處的甘氨酸,而鑒定變體的取代將導致含有精氨酸的翻譯蛋白質(zhì)),使用iupac三字母氨基酸代碼(http://pac.iupac.org/publications/pac/pdf/1972/pdf/3104x0639.pdf)。后續(xù)行(一個/單元型)顯示在每個位置處的dna堿基,匹配參考序列的堿基以白色背景上的黑色顯示,與參考不同的堿基顯示為在黑色背景上的白色文字。

      最右側(cè)的列含有關(guān)于每個基因轉(zhuǎn)錄物的ensembl轉(zhuǎn)錄物id(例如'enst00000390542'),并且涉及對這列左側(cè)的氨基酸變化。因為轉(zhuǎn)錄物是不同長度,每個變體位置可以具有或不具有在該位置處的相關(guān)氨基酸變化。

      實施例6:

      基于人jh6*02的轉(zhuǎn)基因小鼠、b細胞、雜交瘤、抗體和重鏈

      功能性人基因區(qū)段庫集(從vh2-26到j(luò)h6,關(guān)于人igh基因座的結(jié)構(gòu)參見imgt數(shù)據(jù)庫;http://www.imgt.org/imgtrepertoire/index.php?section=locusgenes&repertoire=locus&species=human&group=igk)由本發(fā)明人分區(qū)(sectored)以產(chǎn)生兩種不同的轉(zhuǎn)基因重鏈等位基因(指示s2f和s3f)和相應小鼠。轉(zhuǎn)基因等位基因在小鼠中表達并且在rna轉(zhuǎn)錄物水平上評價重鏈庫集。使用生物信息學方法執(zhí)行深入序列分析以評價v、d和jh基因使用,在可變結(jié)構(gòu)域序列中包括具有至少20個氨基酸的hcdr3長度。通過倒位失活內(nèi)源小鼠可變區(qū)基因區(qū)段(按照wo2011004192中所述的方法,本公開內(nèi)容引入本文作為參考)。

      人供體dna樣品的測序:保守jh6*02變體的鑒定

      通過獲得頰拭子獲得來自9個匿名知情人供體的dna樣品。

      將樣品加工并且根據(jù)qiaampdnaminikit(目錄號51304,qiagen)的方案提取dna樣品。

      設(shè)置pcr反應以擴增jh6區(qū),并且測序pcr產(chǎn)物(pcr寡核苷酸序列:正向5'-aggccagcagagggttccatg-3'(seqidno:444),反向5'-ggctcccagatcctcaaggcac-3'(seqidno:445))。

      通過與來自imgt注釋數(shù)據(jù)庫(http://www.imgt.org/)的jh6參考序列比較執(zhí)行序列分析,并且這鑒定所有9個供體基因組均含有人jh6*02變體,其中該變體在9個供體中的7個中處于純合狀態(tài)。本發(fā)明人還咨詢在ensembl人基因組數(shù)據(jù)庫[http://www.ensembl.org/]處對于jimwatson和craigventer可公開獲得的基因組序列。這些也含有人jh6*02變體。本發(fā)明人證實人jh6*02是人中的共同的保守變體,并且因此是按照本發(fā)明用于構(gòu)建轉(zhuǎn)基因igh基因座的良好候選物。

      合適的人dna序列bac的鑒定

      基于基因名稱(igh)或位置(染色體14:106026574-107346185)從ensemble(http://www.ensembl.org/index.html)或ucsc(http://genome.ucsc.edu/)人數(shù)據(jù)庫搜索鑒定一系列人細菌人工染色體(bac)克隆。選擇七個人rp11bac克隆(參見圖10中的ucsc數(shù)據(jù)庫的提取,鑒定的bac是環(huán)狀的),rp11-1065n8bac攜帶人jh6*02。總之,下述bac鑒定為人igh基因座dna的來源:rp11-1065n8、rp11-659b19、rp11-141i7、rp-112h5、rp11-101g24、rp11-12f16和rp11-47p23。

      使用相似方法,可以選擇不同bac克隆(例如不同rp11克隆id或來自rp11的不同來源)或遺傳工程化的bac用于插入小鼠igh基因座內(nèi)以提供轉(zhuǎn)基因小鼠中的人庫集的不同組。

      轉(zhuǎn)基因igh基因座的構(gòu)建

      來自第1ighbac(rp11-1065n8)的人重基因區(qū)段插入小鼠ab2.1es細胞(baylorcollegeofmedicine)的igh基因座內(nèi)以產(chǎn)生示為s1等位基因的重鏈等位基因。插入的人序列對應于人染色體14從第106494908位到第106328951位的序列并且包含功能性重鏈基因區(qū)段vh2-5、vh7-4-1、vh4-4、vh1-3、vh1-2、vh6-1、d1-1、d2-2、d3-9、d3-10、d4-11、d5-12、d6-13、d1-14、d2-15、d3-16、d4-17、d5-18、d6-19、d1-20、d2-21、d3-22、d4-23、d5-24、d6-25、d1-26、d7-27、jh1、jh2、jh3、jh4、jh5和jh6(按5'至3'次序),其中jh6選擇為人jh6*02變體。插入在小鼠染色體12上第114666435和114666436位之間,其為小鼠cμ區(qū)的上游。小鼠vh、d和jh基因區(qū)段保留在基因座中,插入的人重鏈dna的緊鄰上游(5')。

      構(gòu)建第二等位基因s2,其中通過來自第二bac(bac2)的人dna的順序插入,更多的人功能性vh基因區(qū)段插入s1等位基因中插入的最5'vh的上游(5')。來自bac2的插入的人序列對應于人染色體14從第106601551位到第106494909位的序列并且包含功能性重鏈基因區(qū)段vh3-13、vh3-11、vh3-9、vh1-8、vh3-7。小鼠vh、d和jh基因區(qū)段保留在基因座中,插入的人重鏈dna的緊鄰上游(5')。在后續(xù)步驟中,將這些倒位以使其失活,從而產(chǎn)生其中僅人重鏈可變區(qū)基因區(qū)段是活性的s2f小鼠。

      構(gòu)建第三等位基因s3,其中通過來自第三bac(bac3)的人dna的順序插入,更多的人功能性vh基因區(qū)段插入s2等位基因中插入的最5'vh的上游(5')。插入的序列對應于人染色體14從第106759988位到第106609301位的序列并且包含功能性重鏈基因區(qū)段vh2-26、vh1-24、vh3-23、vh3-21、vh3-20、vh1-18和vh3-15。小鼠vh、d和jh基因區(qū)段保留在基因座中,插入的人重鏈dna的緊鄰上游(5')。在后續(xù)步驟中,將這些倒位以使其失活,從而產(chǎn)生其中僅人重鏈可變區(qū)基因區(qū)段是活性的s3f小鼠。

      使用標準程序由es細胞生成具有插入內(nèi)源重鏈基因座的s2f或s3f的小鼠。在小鼠內(nèi)通過包含neor的失活序列插入小鼠jh-cμ內(nèi)含子(以產(chǎn)生"ha"等位基因)內(nèi)失活其他內(nèi)源重鏈基因座。

      免疫程序

      s2f或s3f基因型的轉(zhuǎn)基因小鼠用商業(yè)獲得或內(nèi)部產(chǎn)生的20-40ug重組蛋白質(zhì)初免,經(jīng)由ip途徑使用在完全弗氏佐劑(sigmaf5881)和10ug/動物cpg(cpg寡核苷酸;invivogen,sandiego,california,usa)中的抗原1(ovλ(sigmaa7641);抗原2(人感染性疾病病原體抗原)和抗原3(人抗原)并且隨后用在不完全弗氏佐劑(sigmaf5506)和10ug/動物的cpg中的約一半抗原量以約兩周間隔加強兩次。末次加強在兩周后無需任何佐劑iv施用,并且含有在pbs中的5-10ug蛋白質(zhì)。

      雜交瘤融合程序

      在末次加強后3天獲得脾,用cpg(25μm終濃度)處理脾細胞且靜置直至第二天。使用btxecm2001電融合儀器,隨后使細胞與sp0/2ag14骨髓瘤細胞(hpacultures目錄號85072401)融合。使融合細胞靜置以恢復20分鐘,隨后種植在t75燒瓶中直至第二天早晨。隨后將細胞離心且通過稀釋系列在96孔培養(yǎng)板上鋪平板并且在篩選前靜置約10天。培養(yǎng)基在該時期中改變1-3次。

      篩選

      使用均相時間分辨熒光測定法(htrf)使用銪穴狀化合物(europiumcryptate)標記的抗小鼠igg(cisbio抗小鼠ig銪穴狀化合物)和生物素標簽的靶抗原與商購可得的鏈霉抗生物素蛋白綴合的供體(cisbio;鏈霉抗生物素蛋白綴合的d2)或通過igg特異性384孔elisa篩選上文雜交瘤孔的培養(yǎng)上清液。通過htrf鑒定的陽性孔放大到24孔板或立即使用igg特異性檢測elisa法反篩選(counterscreened)。通過初級elisa篩選鑒定的陽性立即擴大至24孔板。一旦培養(yǎng)物擴大至24孔階段且達到匯合,就使用htrf或igg特異性elisa再測試上清液以證實與靶抗原的結(jié)合。隨后還通過表面等離子體共振使用bioradproteonxpr36儀器分析此類證實的培養(yǎng)物的上清液。對于這點,在雜交瘤培養(yǎng)物中表達的抗體捕獲在具有抗小鼠igg(gehealthcarebr-1008-38))共價偶聯(lián)的生物傳感器芯片表面的生物傳感器glm芯片(biorad176-512)上??乖S后用作分析物且經(jīng)過捕獲的雜交瘤抗體表面。對于抗原2和抗原3,通常使用256nm、64nm、16nm、4nm和1nm的濃度,對于抗原1,通常使用1028nm、256nm、64nm、16nm和4nm的濃度,使用0nm注射(即單獨的緩沖液)雙重參考結(jié)合曲線。使用bioradproteonxpr36分析軟件固有的1:1模型測定動力學和總體親和力。

      具有證實的結(jié)合活性的任何克隆用于制備總rna并且隨后通過pcr以回收重鏈可變區(qū)序列。執(zhí)行標準5'-race以分析來自s2f和s3f小鼠中的轉(zhuǎn)基因重鏈基因座的rna轉(zhuǎn)錄物。另外,執(zhí)行由小鼠產(chǎn)生的大約2000種序列的深入序列分析。

      生物信息學分析

      用于分析的序列得自兩種不同方法:

      ·第一種來自由脾提取的rna:使用基于小鼠igh基因座的cμ區(qū)的寡核苷酸作為pcr模板合成第一條cdna鏈。使用該寡核苷酸與寡核苷酸dt-錨定引物進行pcr。隨后將pcr產(chǎn)物克隆到pdrive載體(qiagen)并且隨后測序。

      ·第二種來自通過電融合生成的雜交瘤:使用標準trizol方法從目的雜交瘤系提取總rna并且在-80℃下冷凍用于長期貯存。使用標準superscriptiii逆轉(zhuǎn)錄酶以及與用于重鏈的所有小鼠igg同種型結(jié)合的基因特異性反向引物和用于輕鏈擴增的小鼠κ恒定區(qū)引物,由100ng總rna生成cdna。2-3ulcdna隨后用作pcr反應中的模板,使用pfudna聚合酶和一組對人免疫球蛋白可變結(jié)構(gòu)域的前導序列退火的簡并正向引物以及一種小鼠泛igg反向引物。pcr產(chǎn)物在1%瓊脂糖凝膠上運行并且提取純化大約350-450堿基對的條帶。隨后測序dna。

      來自第一種方法的序列可以來自首次用于實驗的小鼠的igm或來自免疫小鼠的igg。來自第二種方法的樣品均來自免疫小鼠的igg,并且對免疫抗原特異性。分析大約2000種序列。

      序列作為一對正向和反向讀數(shù)獲得。首先將這些修剪以去除來自讀數(shù)末端的低質(zhì)量堿基調(diào)用(從兩個末端修剪直至19核苷酸窗具有25或更多的平均質(zhì)量評分)。通過獲得反向讀數(shù)的反向互補體,并且使其針對正向讀數(shù)比對,將讀數(shù)組合在一起。比對評分對于匹配為5,對于錯配為-4,缺口開放罰分10和間隙延伸罰分1。通過步進經(jīng)過比對且比較堿基產(chǎn)生共有序列。當存在不一致時,使用來自測序的具有最高質(zhì)量值的堿基。

      blast+(basiclocalalignmentsearchtool)(camachoc.,coulourisg.,avagyanv.,man.,papadopoulosj.,bealerk.,&maddent.l.(2008)"blast+:architectureandapplications."bmcbioinformatics10:421http://www.ncbi.nlm.nih.gov/pubmed/20003500)程序'blastn'隨后用于發(fā)現(xiàn)在每種序列中使用的種系j和v區(qū)段。字長30用于v匹配,15用于j匹配。針對搜索的數(shù)據(jù)庫由bac的ngs測序構(gòu)建,其用于生成kymouse。

      如果序列匹配v和j區(qū)段,則兩者之間的序列隨后與小鼠中的種系d區(qū)段的數(shù)據(jù)庫比較,使用'blastn'與字長4以及選項'blastn-short'和'ungapped'。如果可能,這用于分配d區(qū)段。通過在v區(qū)段中搜索保守的"tattactgt"序列和在j區(qū)段中的"ctgggg"鑒定cdr3。如果未發(fā)現(xiàn)這些基序,則隨后允許高達4個錯配。使用imgt的cdr3定義,因此cdr3長度從v中的"tgt"后到j(luò)中的"tgg"前計算。排除具有異讀框連接(不具有可除以3的cdr3核苷酸長度的那些)或含有終止密碼子("taa"、"tag"或"tga")的序列。

      匹配v、j和d區(qū)段的鑒定以及來自該分配的cdr長度隨后保存作為用于下游分析的表。使用的ighj6*02比例從首次用于實驗到免疫小鼠增加,以及富含具有長hcdr3(定義為由20個或更多個氨基酸組成)的序列亞群:

      這顯示通過免疫選擇jh6*02基因區(qū)段,因為jh6*02使用的比例在免疫后增加。jh6*02也用于具有長hcdr3長度的大多數(shù)抗體中,所述長hcdr3長度對于由長hcdr3長度抗體特異性結(jié)合的靶是希望的。

      參考文獻

      1.natbiotechnol.2005sep;23(9):1117-25;humanantibodiesfromtransgenicanimals;lonbergn.

      2.jclininvest.1992mar;89(3):729-38;immunoglobulinlightchainvariableregiongenesequencesforhumanantibodiestohaemophilusinfluenzaetypebcapsularpolysaccharidearedominatedbyalimitednumberofvkappaandvlambdasegmentsandvjcombinations;addersonee,shackelfordpg,inselra,quinna,wilsonpm,carrollwl.

      3.jimmunol.1993oct15;151(8):4352-61;clonalcharacterizationofthehumaniggantibodyrepertoiretohaemophilusinfluenzaetypebpolysaccharide.v.invivoexpressionofindividualantibodyclonesisdependentonigchhaplotypesandthecategoriesofantigen;chunggh,scottmg,kimkh,kearneyj,sibergr,ambrosinodm,nahmmh.

      4.jimmunol.1998dec1;161(11):6068-73;decreasedfrequencyofrearrangementduetothesynergisticeffectofnucleotidechangesintheheptamerandnonameroftherecombinationsignalsequenceofthevkappagenea2b,whichisassociatedwithincreasedsusceptibilityofnavajostohaemophilusinfluenzaetypebdisease;nadelb,tanga,lugog,lovev,escurog,feeneyaj.

      5.jclininvest.1996may15;97(10):2277-82;adefectivevkappaa2alleleinnavajoswhichmayplayaroleinincreasedsusceptibilitytohaemophilusinfluenzaetypebdisease;feeneyaj,atkinsonmj,cowanmj,escurog,lugog.

      6.infectimmun.1994sep;62(9):3873-80;variableregionsequencesofaprotectivehumanmonoclonalantibodyspecificforthehaemophilusinfluenzaetypebcapsularpolysaccharide;lucasah,larrickjw,reasondc.

      7.jclininvest.1993jun;91(6):2734-43;restrictedimmunoglobulinvhusageandvdjcombinationsinthehumanresponsetohaemophilusinfluenzaetypebcapsularpolysaccharide.nucleotidesequencesofmonospecificanti-haemophilusantibodiesandpolyspecificantibodiescross-reactingwithselfantigens;addersonee,shackelfordpg,quinna,wilsonpm,cunninghammw,inselra,carrollwl.

      8.jclininvest.1993mar;91(3):788-96;variableregionexpressionintheantibodyresponsesofinfantsvaccinatedwithhaemophilusinfluenzaetypebpolysaccharide-proteinconjugates.descriptionofanewlambdalightchain-associatedidiotypeandtherelationbetweenidiotypeexpression,avidity,andvaccineformulation.thecollaborativevaccinestudygroup;granoffdm,shackelfordpg,holmessj,lucasah.

      9.infectimmun.1994may;62(5):1776-86;variableregionsequencesandidiotypicexpressionofaprotectivehumanimmunoglobulinmantibodytocapsularpolysaccharidesofneisseriameningitidisgroupbandescherichiacolik1;azmifh,lucasah,raffhv,granoffdm.

      10.jclininvest.1992dec;90(6):2197-208;sequenceanalysesofthreeimmunoglobulinganti-virusantibodiesrevealtheirutilizationofautoantibody-relatedimmunoglobulinvhgenes,butnotvlambdagenes;huangdf,oleet,masuhoy,matsumotoy,carsonda,chenpp.

      11.science.2011aug12;333(6044):834-5,biochemistry.catchingamovingtarget,wangtt,palesep

      12.science.2009apr10;324(5924):246-51.epub2009feb26;antibodyrecognitionofahighlyconservedinfluenzavirusepitope;ekiertdc,bhabhag,elsligerma,friesenrh,jongeneelenm,throsbym,goudsmitj,wilsonia.

      13.plosone.2008;3(12):e3942.epub2008dec16;heterosubtypicneutralizingmonoclonalantibodiescross-protectiveagainsth5n1andh1n1recoveredfromhumanmemorybcells;throsbym,vandenbrinke,jongeneelenm,poonll,alardp,cornelissenl,bakkera,coxf,vandeventere,guany,cinatlj,termeulenj,lastersi,carsettir,peirism,dekruifj,goudsmitj.

      14.natstructmolbiol.2009mar;16(3):265-73.epub2009feb22,structuralandfunctionalbasesforbroad-spectrumneutralizationofavianandhumaninfluenzaaviruses,suij,hwangwc,perezs,weig,airdd,chenlm,santellie,stecb,cadwellg,alim,wanh,murakamia,yammanurua,hant,coxnj,bankstonla,donisro,liddingtonrc,marascowa.

      15.science.2011aug12;333(6044):843-50.epub2011jul7,ahighlyconservedneutralizingepitopeongroup2influenzaaviruses,ekiertdc,friesenrh,bhabhag,kwakst,jongeneelenm,yuw,ophorstc,coxf,korsehj,brandenburgb,vogelsr,brakenhoffjp,kompierr,koldijkmh,cornelissenla,poonll,peirism,koudstaalw,wilsonia,goudsmitj.

      ***

      當前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1