国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      方法與流程

      文檔序號(hào):11446231閱讀:552來(lái)源:國(guó)知局
      方法與流程
      本發(fā)明涉及一種修飾模板雙鏈多核苷酸的方法,特別是使用納米孔測(cè)序進(jìn)行表征的方法。該方法從模板產(chǎn)生多個(gè)經(jīng)修飾的雙鏈多核苷酸。然后可以表征這些經(jīng)修飾的多核苷酸。
      背景技術(shù)
      :存在許多需要制備核酸庫(kù)的商業(yè)情況。這通常使用轉(zhuǎn)座酶來(lái)實(shí)現(xiàn)。根據(jù)用于制備所述庫(kù)的轉(zhuǎn)座酶,在能夠使用所述庫(kù)之前,例如在測(cè)序中,可能需要在體外修復(fù)轉(zhuǎn)座事件。目前需要在廣泛的應(yīng)用中快速且便宜的多核苷酸(例如dna或rna)測(cè)序和鑒定技術(shù)?,F(xiàn)有技術(shù)是緩慢且昂貴的,主要是因?yàn)樗鼈円蕾囉跀U(kuò)增技術(shù)來(lái)生產(chǎn)大量的多核苷酸,并且需要大量專門的熒光化學(xué)品用于信號(hào)檢測(cè)??缒た?納米孔)具有作為聚合物和各種小分子的直接電生物傳感器的巨大潛力。特別是,最近已經(jīng)重點(diǎn)將納米孔作為潛在的dna測(cè)序技術(shù)。當(dāng)跨納米孔施加電位時(shí),當(dāng)諸如核苷酸等的分析物瞬間駐留在桶中達(dá)一段時(shí)間時(shí),存在電流的變化。核苷酸的納米孔檢測(cè)給出了已知識(shí)別標(biāo)識(shí)(signature)和持續(xù)時(shí)間的當(dāng)前的變化。在鏈測(cè)序方法中,單個(gè)多核苷酸鏈通過(guò)孔,得到核苷酸的身份。鏈測(cè)序可涉及使用多核苷酸結(jié)合蛋白質(zhì)來(lái)控制多核苷酸通過(guò)孔的運(yùn)動(dòng)。技術(shù)實(shí)現(xiàn)要素:發(fā)明人驚奇地證明可以修飾模板雙鏈多核苷酸以產(chǎn)生多個(gè)更短的經(jīng)修飾的雙鏈多核苷酸。經(jīng)修飾的雙鏈多核苷酸可以包括例如發(fā)夾環(huán)或單鏈前導(dǎo)序列。這些修飾可以被設(shè)計(jì)成使得經(jīng)修飾的雙鏈多核苷酸各自比原始模板多核苷酸更容易表征,例如通過(guò)鏈測(cè)序。經(jīng)修飾的多核苷酸的隨后的表征允許更容易確定模板多核苷酸的特征。本發(fā)明的修飾方法使用mua轉(zhuǎn)座酶、mua底物群和聚合酶,并總結(jié)在圖1中。mua底物包含相對(duì)鏈上的突出端和發(fā)夾環(huán)。mua轉(zhuǎn)座酶能夠使模板多核苷酸片段化,并在兩端產(chǎn)生具有突出端的片段。mua轉(zhuǎn)座酶還能夠?qū)⒌孜镌陔p鏈片段的一端或兩端連接到突出端。沒(méi)有突出端的底物的鏈通常用突出端連接到片段的鏈上。這在所得雙鏈構(gòu)建體中留下單鏈間隙。雙鏈構(gòu)建體還具有在與間隙相對(duì)的鏈上的發(fā)夾環(huán)。該聚合酶能夠使用包含發(fā)夾環(huán)的鏈作為模板并且移位含有單鏈間隙的鏈。所得的雙鏈構(gòu)建體含有包含模板多核苷酸的片段的兩條互補(bǔ)鏈。該構(gòu)建體中的兩條鏈可以分離,并優(yōu)選同時(shí)用作模板,以產(chǎn)生包含模板多核苷酸的片段的兩個(gè)雙鏈構(gòu)建體,其中兩條鏈通過(guò)發(fā)夾環(huán)連接。因此,本發(fā)明提供了一種修飾模板雙鏈多核苷酸的方法,其包括:(a)使模板多核苷酸與mua轉(zhuǎn)座酶和雙鏈mua底物群接觸,雙鏈mua底物群中的每個(gè)包括(i)至少一個(gè)突出端和(ii)與包括至少一個(gè)突出端的鏈相對(duì)的鏈中的至少一個(gè)發(fā)夾環(huán),使得轉(zhuǎn)座酶將所述模板多核苷酸片段化并將底物連接到雙鏈片段的一端或兩端,并且從而產(chǎn)生多個(gè)片段/底物構(gòu)建體;(b)使所述片段/底物構(gòu)建體與聚合酶接觸,使得所述聚合酶置換包括突出端的鏈,并用與包括發(fā)夾環(huán)的鏈互補(bǔ)的鏈替換它們,從而產(chǎn)生多個(gè)雙鏈構(gòu)建體,每個(gè)所述雙鏈構(gòu)建體包括模板多核苷酸的雙鏈片段;和(c)分離雙鏈構(gòu)建體的兩條鏈,并使用所述鏈作為模板以形成多個(gè)經(jīng)修飾的雙鏈多核苷酸,每個(gè)所述經(jīng)修飾的雙鏈多核苷酸包括由至少一個(gè)發(fā)夾環(huán)連接的兩條互補(bǔ)鏈。本發(fā)明還提供:-使用本發(fā)明的方法制備的多個(gè)經(jīng)修飾的雙鏈多核苷酸;-一種用于修飾模板多核苷酸的雙鏈多核苷酸mua底物群,其中所述底物如以上定義;-一種表征使用本發(fā)明的方法修飾的至少一種多核苷酸的方法,其包括:a)使經(jīng)修飾的多核苷酸與跨膜孔接觸,使得多核苷酸的至少一條鏈移動(dòng)通過(guò)孔;和b)當(dāng)至少一條鏈相對(duì)于孔移動(dòng)時(shí)獲取一個(gè)或多個(gè)測(cè)量值,其中所述測(cè)量值指示所述至少一條鏈的一個(gè)或多個(gè)特征,并從而表征所述經(jīng)修飾的多核苷酸;-一種表征模板多核苷酸的方法,包括:a)使用本發(fā)明的方法修飾模板多核苷酸,以產(chǎn)生多個(gè)經(jīng)修飾的多核苷酸;b)使每個(gè)經(jīng)修飾的多核苷酸與跨膜孔接觸,使得每個(gè)多核苷酸的至少一條鏈移動(dòng)通過(guò)孔;和c)當(dāng)每個(gè)多核苷酸相對(duì)于孔移動(dòng)時(shí)獲取一個(gè)或多個(gè)測(cè)量值,其中所述測(cè)量值指示每個(gè)多核苷酸的一個(gè)或多個(gè)特征,從而表征模板多核苷酸;以及-一種用于修飾模板雙鏈多核苷酸的試劑盒,其包括(a)如以上定義的mua底物群,(b)mua轉(zhuǎn)座酶和(c)聚合酶。附圖說(shuō)明圖1示出了修飾模板雙鏈多核苷酸(標(biāo)記為a)的方法的卡通表示。步驟1涉及使模板雙鏈多核苷酸與mua轉(zhuǎn)座酶(標(biāo)記為b)以及雙鏈mua底物群(標(biāo)記為c,雙鏈mua底物均含有5′發(fā)夾環(huán))接觸,使得mua轉(zhuǎn)座酶將模板雙鏈多核苷酸片段化,并將mua底物在分裂點(diǎn)的每一側(cè)插入。步驟2涉及用聚合酶(標(biāo)記為e)和dntp處理模板鏈,dntp替換標(biāo)記為d的dna片段并產(chǎn)生與dna5′發(fā)夾環(huán)互補(bǔ)的鏈。步驟3涉及對(duì)標(biāo)記為f的雙鏈dna構(gòu)建體的熱處理,使得所述鏈變性成單鏈dna(標(biāo)記為g)。最后,步驟4涉及形成互補(bǔ)鏈的dna聚合酶。圖2示出了修飾實(shí)施例1中概述的模板雙鏈多核苷酸(標(biāo)記為a)的方法的卡通表示。步驟1涉及使模板雙鏈多核苷酸與mua轉(zhuǎn)座酶(標(biāo)記為b)以及雙鏈mua底物群(標(biāo)記為c,雙鏈mua底物均含有5′發(fā)夾環(huán))接觸,使得mua轉(zhuǎn)座酶將模板雙鏈多核苷酸片段化,并將mua底物在分裂點(diǎn)的每一側(cè)插入。步驟2涉及用聚合酶(標(biāo)記為e)和dntp處理模板鏈,dntp替換標(biāo)記為d的dna片段并產(chǎn)生對(duì)于dna5′發(fā)夾環(huán)的互補(bǔ)鏈。步驟3涉及標(biāo)記為f的雙鏈dna構(gòu)建體的熱處理,使得所述鏈變性成單鏈dna(標(biāo)記為g)。步驟4涉及用形成互補(bǔ)鏈的dna聚合酶進(jìn)行的第二次處理。最后,步驟5涉及步驟4中產(chǎn)生的雙鏈dna構(gòu)建體的da-拖尾(da-tailing)、具有酶(標(biāo)記為h)預(yù)先結(jié)合的適配器的連接,以及含有膽固醇系鏈(標(biāo)記為j)的dna鏈(標(biāo)記為i)的雜交。這產(chǎn)生了在實(shí)施例1中描述的納米孔系統(tǒng)中被測(cè)試的最終dna構(gòu)建體。圖3示出了當(dāng)解旋酶(t4dda-e94c/c109a/c136a/a360c(seqidno:24具有突變e94c/c109a/c136a/a360c))控制dna樣品6通過(guò)mspa納米孔易位時(shí)的示例性電流跡線(y軸坐標(biāo)=電流(pa),x軸坐標(biāo)=時(shí)間(s))。圖4示出了agilent12,000dna芯片跡線。標(biāo)記為1的線是未處理的mua片段化dna輸入材料,標(biāo)記為2的線是具有68℃培育步驟(在實(shí)施例1的1.2中)的分析物,并且隨后經(jīng)歷了實(shí)施例1的步驟1.3的全部,標(biāo)記為3的線在實(shí)施例1的步驟1.2中沒(méi)有68℃培育但是經(jīng)歷了實(shí)施例1的步驟1.3的全部。區(qū)域x對(duì)應(yīng)于雙鏈dna庫(kù),區(qū)域y對(duì)應(yīng)于agilent12,000的上標(biāo)記并且區(qū)域z對(duì)應(yīng)于agilent12,000芯片的下標(biāo)記。圖5示出了修飾模板雙鏈多核苷酸(標(biāo)記為a)的優(yōu)選方法的卡通表示。除了每個(gè)底物包含通過(guò)間隔基(spacer)(xxx;標(biāo)記為h)與發(fā)夾環(huán)分離的前導(dǎo)序列(標(biāo)記為i)之外,圖5與圖1相同。引導(dǎo)序列不用作模板,因?yàn)榫酆厦?標(biāo)記為e)不能移動(dòng)通過(guò)間隔基。圖6示出了當(dāng)解旋酶(t4dda-e94c/c109a/c136a/a360c)控制dna樣品7通過(guò)mspa納米孔易位時(shí)的示例性電流跡線(y軸坐標(biāo)=電流(pa),x軸坐標(biāo)=時(shí)間(s))。圖7示出了修飾模板雙鏈多核苷酸(標(biāo)記為a)的方法的卡通表示。步驟1涉及使模板雙鏈多核苷酸與mua轉(zhuǎn)座酶(標(biāo)記為b)以及雙鏈mua底物群(標(biāo)記為c,其中雙鏈mua底物均含有5′發(fā)夾環(huán),其在替換g/c’s的發(fā)夾(標(biāo)記為h并且顯示為黑色圓圈)中含有i/z′s)接觸,使得mua轉(zhuǎn)座酶將模板雙鏈多核苷酸片段化,并將mua底物在分裂點(diǎn)的每一側(cè)插入。步驟2涉及用聚合酶(標(biāo)記為e)和dntp處理模板鏈,dntp替換標(biāo)記為d的dna片段并產(chǎn)生對(duì)于dna5′發(fā)夾環(huán)的互補(bǔ)鏈(產(chǎn)生的dsdna標(biāo)記為f)。由聚合酶形成的雙鏈區(qū)域(標(biāo)記為1x)由均能夠形成發(fā)夾環(huán)的兩條鏈組成。由鏈f2形成的發(fā)夾環(huán)具有比雙鏈區(qū)域1x的tm更高的tm,這是因?yàn)殒渇2的發(fā)夾環(huán)由c/t/a/g組成,并且雙鏈區(qū)域1x是鏈f2雜交至鏈f1,其中鏈f1由z/t/a/i組成(并且z和i僅形成兩個(gè)氫鍵,而c/g形成3個(gè)氫鍵)。因此,f2形成發(fā)夾環(huán)(標(biāo)記為f2h),并且f1形成發(fā)夾環(huán)(標(biāo)記為f1h),由鏈f1形成的發(fā)夾環(huán)具有比由鏈f2形成的發(fā)夾環(huán)更高的tm。然后dna聚合酶能夠產(chǎn)生以虛線/點(diǎn)線顯示的互補(bǔ)鏈(標(biāo)記為i1和i2的整個(gè)dsdna構(gòu)建體)。因此,聚合酶能夠形成互補(bǔ)鏈(如虛線/點(diǎn)線所示),而不需要加熱在步驟2中產(chǎn)生的dsdna(并且標(biāo)記為f1,其與f2雜交)。圖8示出了本發(fā)明的優(yōu)選方法的卡通表示。步驟1至4與圖1中相同。步驟5涉及向圖1中形成的構(gòu)建體添加發(fā)夾環(huán)。步驟6涉及修飾的雙鏈多核苷酸的熱處理,使得所述鏈變性成單鏈構(gòu)建體。最后,步驟7涉及形成互補(bǔ)鏈的dna聚合酶。序列表說(shuō)明seqidno:1示出了對(duì)ms-b1突變體mspa單體進(jìn)行編碼的密碼子優(yōu)化的多核苷酸序列。該突變體缺乏信號(hào)序列并且包括以下突變:d90n,d91n,d93n,d118r,d134r和e139k。seqidno:2示出了mspa單體的ms-b1突變體的成熟形式的氨基酸序列。該突變體缺乏信號(hào)序列并且包括以下突變:d90n,d91n,d93n,d118r,d134r和e139k。seqidno:3示出了對(duì)α-溶血素-e111n/k147n(α-hl-nn;stoddart等人,pnas,2009;106(19):7702-7707)的1種單體進(jìn)行編碼的多核苷酸序列。seqidno:4示出了α-hl-nn的1種單體的氨基酸序列。seqidno:5至7示出了mspb,c和d的氨基酸序列。seqidno:8示出了對(duì)phi29dna聚合酶進(jìn)行編碼的多核苷酸序列。seqidno:9示出了phi29dna聚合酶的氨基酸序列。seqidno:10示出了由來(lái)自大腸桿菌的sbcb基因得到的密碼子優(yōu)化的多核苷酸序列。它編碼來(lái)自大腸桿菌的核酸外切酶i酶(ecoexoi)。seqidno:11示出了來(lái)自大腸桿菌的核酸外切酶i酶(ecoexoi)的氨基酸序列。seqidno:12示出了由來(lái)自大腸桿菌的xtha基因得到的密碼子優(yōu)化的多核苷酸序列。它編碼來(lái)自大腸桿菌的核酸外切酶iii酶。seqidno:13示出了來(lái)自大腸桿菌的核酸外切酶iii酶的氨基酸序列。該酶在3′-5′方向上從雙鏈dna(dsdna)的一條鏈進(jìn)行5′單磷酸核苷的分布消化。鏈上的酶引發(fā)需要約4個(gè)核苷酸的5′突出端。seqidno:14示出了由來(lái)自嗜熱棲熱菌(t.thermophilus)的recj基因衍生的密碼子優(yōu)化的多核苷酸序列。它編碼來(lái)自嗜熱棲熱菌的recj酶(tthrecj-cd)。seqidno:15示出了來(lái)自嗜熱棲熱菌的recj酶(tthreej-cd)的氨基酸序列。該酶在5′-3′方向上從ssdna進(jìn)行5′單磷酸核苷的進(jìn)行性消化(processivedigestion)。鏈上的酶引發(fā)需要至少4個(gè)核苷酸。seqidno:16示出了由噬菌體λexo(redx)基因衍生的密碼子優(yōu)化的多核苷酸序列。它編碼細(xì)菌噬菌體λ核酸外切酶。seqidno:17示出了細(xì)菌噬菌體λ核酸外切酶的氨基酸序列。所述序列是組裝成三聚體的三個(gè)相同的亞基之一。該酶在5′-3′方向從dsdna的一條鏈進(jìn)行核苷酸的高度進(jìn)行性消化(http://www.neb.com/nebecomm/products/productm0262.asp)。鏈上的酶引發(fā)優(yōu)選需要約4個(gè)具有5′磷酸的核苷酸的5′突出端。seqidno:18示出了hel308mbu的氨基酸序列。seqidno:19示出了he1308csy的氨基酸序列。seqidno:20示出了he1308tga的氨基酸序列。seqidno:21示出了he1308mhu的氨基酸序列。seqidno:22示出了traieco的氨基酸序列。seqidno:23示出了xpdmbu的氨基酸序列。seqidno:24示出了dda1993的氨基酸序列。seqidno:25示出了trwccba的氨基酸序列。seqidno:26至28示出了本發(fā)明優(yōu)選的mua底物的序列。seqidno:29示出了實(shí)施例1中使用的多核苷酸序列。seqidno:30示出了實(shí)施例1中使用的多核苷酸序列。該序列在其5′末端連接有下列多核苷酸序列——gatcu。seqidno:31示出了實(shí)施例1中使用的腸桿菌噬菌體λ的多核苷酸序列。該序列包含連接在模板鏈5′末端的另外的12堿基突出端。此處示出的序列僅為模板鏈的序列(模板互補(bǔ)體未示出)。seqidno:32示出了實(shí)施例1中使用的多核苷酸序列。seqidno:33示出了實(shí)施例1中使用的多核苷酸序列。seqidno:34示出了實(shí)施例1中使用的多核苷酸序列。seqidno:35示出了實(shí)施例1中使用的多核苷酸序列。seqidno:36示出了實(shí)施例2中使用的多核苷酸序列。seqidno:37示出了實(shí)施例2中使用的多核苷酸序列。具體實(shí)施方式應(yīng)當(dāng)理解,所公開的產(chǎn)品和方法的不同應(yīng)用可以根據(jù)本領(lǐng)域的具體需要進(jìn)行調(diào)整。還應(yīng)當(dāng)理解,本文使用的術(shù)語(yǔ)僅用于描述本發(fā)明的具體實(shí)施方案的目的,而不是限制性的。此外,除非另有明確規(guī)定,在本說(shuō)明書和所附權(quán)利要求書中使用的單數(shù)形式“一個(gè)”,“一種”和“該”包括復(fù)數(shù)指示物。因此,例如,提及“一個(gè)多核苷酸”時(shí)包括“多個(gè)多核苷酸”,提及“一個(gè)底物”時(shí)包括兩個(gè)或更多個(gè)這樣的底物,提及“一個(gè)跨膜蛋白孔”時(shí)包括兩個(gè)或更多個(gè)這樣的孔,等。本文引用的所有出版物、專利和專利申請(qǐng),無(wú)論是上文還是下文中,均通過(guò)整體引用并入本文。本發(fā)明的修飾方法本發(fā)明提供了修飾模板多核苷酸的方法??梢詾槿魏文康男揎椖0?。該方法優(yōu)選用于修飾用于表征例如用于鏈測(cè)序的模板多核苷酸。模板多核苷酸通常是根據(jù)本發(fā)明最終將被表征或測(cè)序的多核苷酸。這將在下面更詳細(xì)地討論。該方法涉及形成多個(gè)修飾的雙鏈多核苷酸。這些修飾的雙鏈多核苷酸通常比模板多核苷酸更容易表征,特別是使用鏈測(cè)序進(jìn)行表征。所述多個(gè)修飾的雙鏈多核苷酸自身可以被表征,以便于表征模板多核苷酸。例如,可以通過(guò)測(cè)序每個(gè)修飾的雙鏈多核苷酸來(lái)確定模板多核苷酸的序列。修飾的雙鏈多核苷酸通常比模板多核苷酸短,因此使用鏈測(cè)序來(lái)表征它們是更容易的。修飾的雙鏈多核苷酸還包括如下所述的信息量的兩倍。可以通過(guò)將標(biāo)記包含在mua底物中來(lái)選擇性地標(biāo)記修飾的雙鏈多核苷酸。合適的標(biāo)記包括但不限于校準(zhǔn)序列,偶聯(lián)部分和適配器結(jié)合的酶。在一些實(shí)施方案中,該方法引入雙鏈多核苷酸修飾中,這有助于使用鏈測(cè)序?qū)ζ溥M(jìn)行表征。眾所周知,將多核苷酸偶聯(lián)到含有納米孔的膜中使得多核苷酸的量——允許其表征或測(cè)序所需的量——降低了幾個(gè)數(shù)量級(jí)。這在申請(qǐng)?zhí)枮閜ct/gb2012/051191(公開為wo2012/164270)的國(guó)際申請(qǐng)中進(jìn)行了討論。本發(fā)明的方法允許生產(chǎn)多個(gè)雙鏈多核苷酸,每個(gè)雙鏈多核苷酸包括將多核苷酸偶聯(lián)到膜上的裝置。這將在下面更詳細(xì)地討論。使用納米孔表征雙鏈多核苷酸通常需要存在設(shè)計(jì)成優(yōu)先螺旋進(jìn)入納米孔的前導(dǎo)序列。本發(fā)明的方法允許生產(chǎn)多個(gè)雙鏈多核苷酸,每個(gè)雙鏈多核苷酸包括單鏈前導(dǎo)序列。這將在下面更詳細(xì)地討論。還已經(jīng)確定的是,通過(guò)諸如發(fā)夾環(huán)的橋接部分連接雙鏈多核苷酸的兩條鏈?zhǔn)沟盟龆嗪塑账岬膬蓷l鏈通過(guò)納米孔進(jìn)行表征或測(cè)序。這是有利的,因?yàn)樗沟脧膯蝹€(gè)雙鏈多核苷酸獲得的信息量加倍。此外,由于模板互補(bǔ)鏈中的序列必然與模板鏈的序列正交,所以來(lái)自兩條鏈的信息可以進(jìn)行信息組合。因此,該機(jī)制提供了正交校驗(yàn)?zāi)芰?,提供更高置信度觀察結(jié)果。這在申請(qǐng)?zhí)枮閜ct/gb2012/051786(公開為wo2013/014451)的國(guó)際申請(qǐng)中進(jìn)行了討論。本發(fā)明的方法允許產(chǎn)生多個(gè)修飾的雙鏈多核苷酸,其中每個(gè)多核苷酸的兩條鏈?zhǔn)褂冒l(fā)夾環(huán)連接。模板多核苷酸本發(fā)明的方法修飾模板雙鏈多核苷酸,優(yōu)選用于表征。模板多核苷酸通常是根據(jù)本發(fā)明最終將被表征或測(cè)序的多核苷酸。它也可以稱為目標(biāo)雙鏈多核苷酸或感興趣的雙鏈多核苷酸。多核苷酸,例如核酸,是包含兩個(gè)或多個(gè)核苷酸的大分子。多核苷酸或核酸可以包含任何核苷酸的任何組合。核苷酸可以是天然存在的或人造的。多核苷酸中的一個(gè)或多個(gè)核苷酸可被氧化或甲基化。多核苷酸中的一個(gè)或多個(gè)核苷酸可被損壞。例如,多核苷酸可以包含嘧啶二聚體。這種二聚體通常與紫外線的損傷相關(guān),并且是皮膚黑色素瘤的主要原因。可以修飾多核苷酸中的一個(gè)或多個(gè)核苷酸,例如用標(biāo)記或標(biāo)簽進(jìn)行修飾。合適的標(biāo)記如下所述。多核苷酸可以包含一個(gè)或多個(gè)間隔基。核苷酸通常含有核堿基、糖和至少一個(gè)磷酸基團(tuán)。核堿基和糖形成核苷。核堿基通常是雜環(huán)的。核堿基包括但不限于嘌呤和嘧啶,并且更具體地包括腺嘌呤(a)、鳥嘌呤(g)、胸腺嘧啶(t)、尿嘧啶(u)和胞嘧啶(c)。糖通常是戊糖。核苷酸糖包括但不限于核糖和脫氧核糖。糖優(yōu)選為脫氧核糖。多核苷酸優(yōu)選包含以下核苷:脫氧腺苷(da)、脫氧尿苷(du)和/或胸苷(dt),脫氧鳥苷(dg)和脫氧胞苷(dc)。核苷酸通常是核糖核苷酸或脫氧核糖核苷酸。核苷酸通常含有一磷酸鹽、二磷酸鹽或三磷酸鹽。核苷酸可以包含多于三個(gè)的磷酸鹽,例如4或5個(gè)磷酸鹽。磷酸鹽可以連接在核苷酸的5′或3′側(cè)上。核苷酸包括但不限于腺苷單磷酸(amp)、鳥苷單磷酸(gmp)、胸苷單磷酸(tmp)、尿苷單磷酸(ump)、5-甲基胞苷單磷酸,5-羥甲基胞苷單磷酸、胞苷單磷酸(cmp)、環(huán)狀腺苷單磷酸(camp)、環(huán)狀鳥苷單磷酸(cgmp)、脫氧腺苷單磷酸(damp)、脫氧鳥苷單磷酸(dgmp)、脫氧胸苷單磷酸(dtmp)、脫氧尿苷單磷酸(dump)、脫氧胞苷單磷酸(dcmp)和脫氧甲基胞苷單磷酸。核苷酸優(yōu)選地選自amp,tmp,gmp,cmp,ump,damp,dtmp,dgmp,dcmp和dump。核苷酸可以是脫堿基的(即缺少核堿基)。核苷酸也可以缺少核堿基和糖(即c3間隔基)。多核苷酸中的核苷酸可以以任何方式彼此連接。核苷酸通常通過(guò)其糖和磷酸酯基團(tuán)連接,如核酸中一樣。核苷酸可以通過(guò)其核堿基連接,如嘧啶二聚體中一樣。多核苷酸是雙鏈的。多核苷酸的至少一部分優(yōu)選是雙鏈的。多核苷酸可以是核酸,例如脫氧核糖核酸(dna)或核糖核酸(rna)。多核苷酸可以包含與dna的一條鏈雜交的一條rna鏈。多核苷酸可以是本領(lǐng)域已知的任何合成核酸,例如肽核酸(pna)、甘油核酸(gna)、蘇糖核酸(tna)、鎖定核酸(lna)或具有核苷酸側(cè)鏈的其他合成聚合物。pna骨架由通過(guò)肽鍵連接的重復(fù)的n-(2-氨基乙基)-甘氨酸單元組成。gna骨架由通過(guò)磷酸二酯鍵連接的重復(fù)的二醇單元組成。tna骨架由通過(guò)磷酸二酯鍵連接在一起的重復(fù)的蘇糖組成。lna由如上所述的核糖核苷酸形成,所述核糖核苷酸具有連接核糖部分中的2′氧和4′碳的額外的橋。多核苷酸最優(yōu)選為核糖核酸(rna)或脫氧核糖核酸(dna)。多核苷酸可以是任何長(zhǎng)度。例如,多核苷酸的長(zhǎng)度可以是至少10個(gè)、至少50個(gè)、至少100個(gè)、至少150個(gè)、至少200個(gè)、至少250個(gè)、至少300個(gè)、至少400個(gè)或至少500個(gè)核苷酸或核苷酸對(duì)。多核苷酸的長(zhǎng)度可以是1000個(gè)或更多個(gè)核苷酸或核苷酸對(duì)、5000個(gè)或更多個(gè)核苷酸或核苷酸對(duì)或者100000個(gè)或更多個(gè)核苷酸或核苷酸對(duì)??梢允褂帽景l(fā)明研究任何數(shù)目的多核苷酸。例如,本發(fā)明可能涉及表征2,3,4,5,6,7,8,9,10,20,30,51,100或更多個(gè)多核苷酸。如果兩個(gè)或更多個(gè)多核苷酸被表征,它們可以是不同的多核苷酸或同一種多核苷酸的兩個(gè)實(shí)例。多核苷酸可以是天然存在的或人造的。例如,該方法可以用于驗(yàn)證制造的寡核苷酸的序列。該方法通常在體外進(jìn)行。模板多核苷酸通常存在于任何合適的樣品中。本發(fā)明通常針對(duì)已知含有或懷疑含有模板多核苷酸的樣品進(jìn)行。或者,本發(fā)明可以針對(duì)樣品進(jìn)行,以確認(rèn)一種或多種已知或預(yù)期在樣品中存在的模板多核苷酸的身份。樣品可以是生物樣品。本發(fā)明可以針對(duì)從任何生物體或微生物獲得或提取的樣品在體外進(jìn)行。生物體或微生物通常是古菌、原核或真核的,并且通常屬于五界之一:植物界,動(dòng)物界,真菌界,原核生物界和原生生物界。本發(fā)明可以對(duì)從任何病毒獲得或從提取的樣品在體外進(jìn)行。樣品優(yōu)選為流體樣品。樣品通常包括患者的體液。樣品可以是尿液、淋巴、唾液、粘液或羊水,但優(yōu)選為血液、血漿或血清。通常,樣品是來(lái)源于人的,但是也可以來(lái)自另一種哺乳動(dòng)物,例如來(lái)自商業(yè)養(yǎng)殖的動(dòng)物如馬、牛、綿羊或豬,或者還可以是寵物如貓或狗?;蛘撸参飦?lái)源的樣品通常從商業(yè)作物獲得,例如谷物、豆類、水果或蔬菜,如小麥、大麥、燕麥、油菜、玉米、大豆、稻、香蕉、蘋果、西紅柿、土豆、葡萄、煙草、菜豆、扁豆、甘蔗、可可、棉花。樣品可以是非生物樣品。非生物樣品優(yōu)選為流體樣品。非生物樣品的實(shí)例包括手術(shù)液,水如飲用水、海水或河水,以及實(shí)驗(yàn)室試驗(yàn)用試劑。樣品通常在用于本發(fā)明之前進(jìn)行處理,例如通過(guò)離心,或通過(guò)穿過(guò)膜過(guò)濾掉不需要的分子或細(xì)胞例如紅細(xì)胞。取樣后可以立即測(cè)量樣品。樣品通常也可以在測(cè)定之前儲(chǔ)存,優(yōu)選低于-70℃。mua和條件模板多核苷酸與mua轉(zhuǎn)座酶接觸。這種接觸在允許轉(zhuǎn)座酶起作用的條件下進(jìn)行,所述起作用即,將模板多核苷酸片段化并將mua底物連接到片段的一端或兩端。mua轉(zhuǎn)座酶可從例如thermoscientific(目錄號(hào)f-750c,20μl(1.1μg/μl))購(gòu)得。mua轉(zhuǎn)座酶將起作用的條件是本領(lǐng)域已知的。合適的條件在實(shí)施例中描述。底物群使模板多核苷酸與雙鏈mua底物群接觸。雙鏈底物是多核苷酸底物,并且可以由上述任何核苷酸或核酸形成。底物通常由與模板多核苷酸相同的核苷酸形成。底物群通常是同源的(即通常含有多個(gè)相同的底物)。底物群可能是異源的(即可能包含多個(gè)不同的底物)。用于mua轉(zhuǎn)座酶的合適底物是本領(lǐng)域已知的(saariaho和savilahti,nucleicacidsresearch,2006;34(10):3139-3149和lee和harshey,j.mol.biol.,2001;314:433-444)。每個(gè)底物通常包含提供其作為mua轉(zhuǎn)座酶底物的活性的雙鏈部分。雙鏈部分在每個(gè)底物中通常是相同的。底物群可以包括不同的雙鏈部分。每個(gè)底物中的雙鏈部分通常長(zhǎng)度為至少50個(gè)核苷酸對(duì),例如至少55個(gè),至少60個(gè)或至少65個(gè)核苷酸對(duì)。每個(gè)底物中的雙鏈部分優(yōu)選包含在每條鏈的3′端含有脫氧胞苷(dc)和脫氧腺苷(da)的二核苷酸。dc和da通常在雙鏈部分的兩條鏈中具有不同的取向,即在從5′到3′進(jìn)行讀取時(shí),在3′端,一條鏈具有dc/da,而另一條鏈具有da/dc。雙鏈部分的一條鏈優(yōu)選包含seqidno:26中所示的序列,雙鏈部分的另一條鏈優(yōu)選包含seqidno:27中所示的序列。5′-gttttcgcatttatcgtgaaacgctttcgcgtttttcgtgcgccgcttca-3′(seq26)3′-caaaagcgtaaatagcactttgcgaaagcgcaaaaagcacgcggcgaagt-5′(seq27)每個(gè)底物包括至少一個(gè)突出端。突出端通常是核苷酸突出端。在每個(gè)底物的一端或兩端可能有突出端。如果每個(gè)底物中的雙鏈部分包含與seqidno:27所示的序列雜交的seqidno:26所示的序列,則至少一個(gè)突出端優(yōu)選在seqidno:27所示的序列的5′端。每個(gè)底物可以包括兩個(gè)突出端,即每個(gè)底物兩端各一個(gè)。如果在底物的兩端都存在突出端,則每個(gè)突出端通常在雙鏈多核苷酸部分的不同鏈上。優(yōu)選地,突出端位于雙鏈部分的一條鏈的5′端。每個(gè)底物優(yōu)選包括僅一個(gè)突出端。該僅一個(gè)突出優(yōu)選在雙鏈部分的一條鏈的5′端。突出端長(zhǎng)度可以是至少3個(gè)、至少4個(gè)、至少5個(gè)、至少6個(gè)或至少7個(gè)核苷酸。突出端長(zhǎng)度優(yōu)選為5個(gè)核苷酸。在優(yōu)選的實(shí)施例中,底物的一條鏈包含seqidno:26中所示的序列,底物的另一條鏈包含seqidno:28中所示的序列(見下文)。5′-gttttcgcatttatcgtgaaacgctttcgcgtttttcgtgcgccgcttca-3′(seq26)3′-caaaagcgtaaatagcactttgcgaaagcgcaaaaagcacgcggcgaagtctag-5′(seq28)所述底物群中的底物可以具有申請(qǐng)?zhí)枮閜ct/gb2014/052505的國(guó)際申請(qǐng)中公開的任何結(jié)構(gòu)。每個(gè)底物在與包含至少一個(gè)突出端的鏈相對(duì)的鏈中包含至少一個(gè)發(fā)夾環(huán)。發(fā)夾環(huán)通常不連接底物的兩條鏈。發(fā)夾環(huán)可以是內(nèi)部發(fā)夾環(huán),即不在與包含至少一個(gè)突出端的鏈相對(duì)的鏈的末端。內(nèi)部發(fā)夾環(huán)優(yōu)選與間隔基相鄰,在本發(fā)明的方法中使用的任何聚合酶不能移動(dòng)經(jīng)過(guò)該間隔基。間隔基可以位于發(fā)夾環(huán)的任一側(cè)??梢允褂靡韵掠懻摰娜魏伍g隔基,例如一個(gè)或多個(gè)ispc3基團(tuán)(即缺少糖和堿基的核苷酸)、一個(gè)或多個(gè)間隔基9(isp9)基團(tuán)或一個(gè)或多個(gè)間隔基18(isp18)基團(tuán)。內(nèi)部發(fā)夾環(huán)優(yōu)選與諸如硝基吲哚等的非天然核苷酸相鄰,本發(fā)明方法中使用的任何聚合酶不能移動(dòng)經(jīng)過(guò)該核苷酸??梢允褂靡韵掠懻摰娜魏尾煌暮塑账岱N類。發(fā)夾環(huán)優(yōu)選位于與包含至少一個(gè)突出端的鏈的相對(duì)的鏈的端部處或該端部附近。如果距離與包含至少一個(gè)突出端的鏈相對(duì)的鏈的末端20個(gè)核苷酸或更少、15個(gè)核苷酸或更少、10個(gè)核苷酸或更少或5個(gè)核苷酸或更少,則發(fā)夾環(huán)在與含至少一個(gè)突出端的鏈相對(duì)的鏈的端部附近。如果在形成鏈末端的干部分(雜交部分)的最后核苷酸之間存在20個(gè)或更少的核苷酸,則發(fā)夾環(huán)距離該鏈末端20個(gè)核苷酸或更少。發(fā)夾環(huán)優(yōu)選在與包含至少一個(gè)突出端的鏈相對(duì)的鏈的末端。在每個(gè)底物的一端或兩端可能存在發(fā)夾環(huán)。發(fā)夾環(huán)優(yōu)選位于與至少一個(gè)突出端相對(duì)的底物末端。發(fā)夾環(huán)通常是核苷酸發(fā)夾環(huán)。如果每個(gè)底物中的雙鏈部分包含與seqidno:27中所示的序列雜交的seqidno:26中所示的序列,則至少一個(gè)發(fā)夾環(huán)優(yōu)選在seqidno:26中所示序列的5′端。每個(gè)底物可以包含兩個(gè)發(fā)夾環(huán),即每個(gè)底物的兩條鏈中各一個(gè)或在每個(gè)底物兩端各一個(gè)。如果在底物的兩端存在發(fā)夾環(huán),則每個(gè)發(fā)夾環(huán)通常位于雙鏈多核苷酸部分的不同鏈上。發(fā)夾環(huán)優(yōu)選位于雙鏈部分的鏈的5′端。每個(gè)底物優(yōu)選包含僅一個(gè)發(fā)夾環(huán)。該僅一個(gè)發(fā)夾環(huán)優(yōu)選在與包含至少一個(gè)突出端的鏈相對(duì)的鏈中。該僅一個(gè)發(fā)夾環(huán)優(yōu)選位于與至少一個(gè)突出端相對(duì)的底物末端,并且在與包含至少一個(gè)突出端的鏈相對(duì)的鏈中。該僅一個(gè)發(fā)夾環(huán)優(yōu)選在雙鏈部分的一條鏈的5′端并且在與包含至少一個(gè)突出端的鏈相對(duì)的鏈中。在一個(gè)優(yōu)選的實(shí)施例中,每個(gè)底物包含在雙鏈部分的一條鏈的5′端處的一個(gè)突出端和在雙鏈部分的另一條鏈的5′端處的發(fā)夾環(huán)。在最優(yōu)選的實(shí)施例中,底物的一條鏈包含seqidno:26中所示的序列,底物的另一條鏈包含seqidno:28中所示的序列(見上文),并且發(fā)夾環(huán)位于seqidno:26中所示序列的5′端??梢允褂帽绢I(lǐng)域已知的方法設(shè)計(jì)合適的發(fā)夾環(huán)。發(fā)夾環(huán)可以是任何長(zhǎng)度。發(fā)夾環(huán)的長(zhǎng)度通常為110個(gè)或更少的核苷酸,例如100個(gè)或更少的核苷酸、90個(gè)或更少的核苷酸、80個(gè)或更少的核苷酸、70個(gè)或更少的核苷酸、60個(gè)或更少的核苷酸、50個(gè)或更少的核苷酸、40個(gè)或更少的核苷酸、30個(gè)或更少的核苷酸核苷酸、20個(gè)或更少的核苷酸或10個(gè)或更少的核苷酸。發(fā)夾環(huán)的長(zhǎng)度優(yōu)選為約1至110,2至100,5至80或6至50個(gè)核苷酸。發(fā)夾環(huán)可以由任何上述的核苷酸形成。發(fā)夾環(huán)可以由與雙鏈部分相同的核苷酸形成。發(fā)夾環(huán)優(yōu)選由導(dǎo)致發(fā)夾環(huán)具有比雙鏈部分更低的熔化溫度(tm)的核苷酸形成??梢允褂贸R?guī)技術(shù)測(cè)量熔化溫度。如果雙鏈部分包含rna,則發(fā)夾優(yōu)選由含有腺苷(a)、尿苷(u)、肌苷(i)和zebularine(z)的核苷酸形成。如果雙鏈部分包含dna,則發(fā)夾優(yōu)選由含有脫氧腺苷(da)、胸苷(dt)、脫氧肌苷(di)和脫氧zebularine(dz)的核苷酸形成。用肌苷(i)/脫氧肌苷(di)代替鳥苷(g)/脫氧鳥苷(dg)以及用zebularine(z)/脫氧zebularine(dz)取代胞苷(c)/脫氧胞苷(dc))相比于雙鏈部分降低了發(fā)夾的tm。i/di和z/dz僅形成兩個(gè)氫鍵,而g/dg和c/dc形成三個(gè)氫鍵。在本發(fā)明的方法中,聚合物用與包含發(fā)夾環(huán)的鏈互補(bǔ)的新鏈取代突出鏈。具有較低tm的發(fā)夾環(huán)可用于形成具有較高tm的互補(bǔ)的發(fā)夾,即由具有較高tm的核苷酸形成的發(fā)夾。聚合酶可以用與包含發(fā)夾環(huán)的鏈互補(bǔ)的新鏈取代突出鏈,其中新鏈包含具有比模板鏈中發(fā)夾環(huán)更高的tm的發(fā)夾環(huán)。例如,由含有腺苷(a)/脫氧腺苷(da)、尿苷(u)/胸苷(dt)、肌苷(i)/脫氧肌苷(di)和zebularine(z)/脫氧zebularine(dz)的核苷酸形成的發(fā)夾環(huán)可以用于形成互補(bǔ)的rna或dna發(fā)夾環(huán)。兩個(gè)發(fā)夾之間的tm差異意味著它們作為個(gè)體發(fā)夾比雜交在一起時(shí)更穩(wěn)定。這意味著兩個(gè)發(fā)夾環(huán)形成它們各自的環(huán),而不是雜交在一起。這有助于所述方法的最后一步,其中雙鏈構(gòu)建體的兩條鏈分離并用作模板以形成多個(gè)修飾的雙鏈多核苷酸,每個(gè)修飾的雙鏈多核苷酸包含由至少一個(gè)發(fā)夾環(huán)連接的兩條互補(bǔ)鏈。例如,分離可以在室溫下進(jìn)行。每個(gè)底物可以包含可選擇的結(jié)合部分。如果存在,可選擇的結(jié)合部分優(yōu)選在發(fā)夾環(huán)中。可選擇的結(jié)合部分是可以基于其結(jié)合性質(zhì)而選擇的部分。因此,可選擇的結(jié)合部分優(yōu)選是特異性結(jié)合至表面的部分。如果可選擇的結(jié)合部分以比在本發(fā)明中使用的任何其它部分以大得多的程度結(jié)合到表面,則可選擇的結(jié)合部分特異性地結(jié)合到表面。在優(yōu)選的實(shí)施方案中,該部分結(jié)合到?jīng)]有其它本發(fā)明中使用的部分結(jié)合的表面。合適的選擇性結(jié)合部分是本領(lǐng)域已知的。優(yōu)選的選擇性結(jié)合部分包括但不限于生物素、核酸序列、抗體、抗體片段,例如fab和scsv、抗原、核酸結(jié)合蛋白、多組氨酸尾部和gst標(biāo)簽。最優(yōu)選的選擇性結(jié)合部分是生物素和可選擇的核酸序列。生物素特異性結(jié)合到包被有抗生物素蛋白的表面??蛇x擇的核酸序列特異性結(jié)合(即雜交)到包被有同源序列的表面?;蛘撸蛇x擇的核酸序列特異性結(jié)合包被有核酸結(jié)合蛋白的表面。每個(gè)底物可以包含前導(dǎo)序列。前導(dǎo)序列通常與至少一個(gè)發(fā)夾環(huán)在同一條鏈上。前導(dǎo)序列通常位于與發(fā)夾環(huán)相同的底物末端。前導(dǎo)序列通常位于包含至少一個(gè)發(fā)夾環(huán)的鏈末端(即,發(fā)夾環(huán)位于末端前導(dǎo)序列和底物的其余部分之間)。前導(dǎo)序列通常通過(guò)間隔基與發(fā)夾環(huán)分離,在本發(fā)明的方法中使用的任何聚合酶不能移動(dòng)通過(guò)該間隔基??梢允褂靡韵氯魏伍g隔基,例如一個(gè)或多個(gè)ispc3基團(tuán)(即缺少糖和堿基的核苷酸)、一個(gè)或多個(gè)間隔基9(isp9)基團(tuán)或一個(gè)或多個(gè)間隔基18(isp18)基團(tuán)。間隔基意味著前導(dǎo)序列在步驟(b)和(c)中不用作模板,因此在方法結(jié)束時(shí)保持單鏈。這允許前導(dǎo)序列執(zhí)行其功能。這樣的一個(gè)例子在圖5中示出。前導(dǎo)序列優(yōu)先旋入孔中。前導(dǎo)序列有助于本發(fā)明的表征方法。前導(dǎo)序列被設(shè)計(jì)成優(yōu)先旋入孔中,從而有助于多核苷酸通過(guò)孔的運(yùn)動(dòng)。前導(dǎo)序列也可以用于將多核苷酸連接到一個(gè)或多個(gè)錨,如下所述。前導(dǎo)序列通常包含聚合物。聚合物優(yōu)選是帶負(fù)電荷的。聚合物優(yōu)選為多核苷酸,例如dna或rna,經(jīng)修飾的多核苷酸(例如脫堿基dna),pna,lna,聚乙二醇(peg)或多肽。前導(dǎo)序列優(yōu)選包含多核苷酸,更優(yōu)選包含單鏈多核苷酸。前導(dǎo)序列可以包含任何上述的多核苷酸。單鏈前導(dǎo)序列最優(yōu)選包含單鏈dna,例如聚dt區(qū)段。前導(dǎo)序列優(yōu)選包含一個(gè)或多個(gè)間隔基。前導(dǎo)序列可以是任何長(zhǎng)度,但是長(zhǎng)度通常為10至150個(gè)核苷酸,例如長(zhǎng)度為20至150個(gè)核苷酸。前導(dǎo)序列的長(zhǎng)度通常取決于方法中使用的跨膜孔。片段化轉(zhuǎn)座酶將模板雙鏈多核苷酸片段化,形成多個(gè)雙鏈片段。轉(zhuǎn)座酶還將底物連接到雙鏈片段的一端或兩端,從而產(chǎn)生多個(gè)片段/底物構(gòu)建體。轉(zhuǎn)座酶優(yōu)選將底物連接到雙鏈片段的兩端,從而產(chǎn)生多個(gè)片段/底物構(gòu)建體,其各自在兩端具有發(fā)夾環(huán)。這樣的一個(gè)例子可以在圖1中看到。聚合酶由轉(zhuǎn)座酶產(chǎn)生的片段/底物構(gòu)建體與聚合酶接觸??梢允褂靡韵掠懻摰娜魏尉酆厦?。聚合酶優(yōu)選為klenow或9°north。聚合酶更優(yōu)選為taqdna聚合酶(可以從newenglandinc.購(gòu)得),high-fidelitydna聚合酶(可以從newenglandbiolabsinc.購(gòu)得)或kapahifi(可以從kapabiosystems購(gòu)得)。在聚合酶可以置換突出的鏈并形成互補(bǔ)的多核苷酸的條件下,使構(gòu)建體與聚合酶接觸。這些條件是本領(lǐng)域已知的。例如,通常將這些構(gòu)建體與可購(gòu)得的聚合酶緩沖液(例如來(lái)自newenglandbiolabs或kapabiosystems的緩沖液)中的聚合酶接觸。對(duì)于klenow,溫度優(yōu)選為20至37℃,對(duì)于9°north,taqdna聚合酶,high-fidelitydna聚合酶或kapahifi,溫度優(yōu)選為60至75℃。聚合酶置換包含來(lái)自片段/底物構(gòu)建體的突出端的鏈。聚合酶用與包含發(fā)夾環(huán)的鏈互補(bǔ)的新鏈取代突出鏈。這產(chǎn)生多個(gè)雙鏈構(gòu)建體,每個(gè)雙鏈構(gòu)建體包含模板多核苷酸的雙鏈片段。由聚合酶形成的部分新鏈通常與發(fā)夾環(huán)互補(bǔ)。這意味著發(fā)夾環(huán)通常在構(gòu)建體中形成雙鏈多核苷酸的一部分。這樣的一個(gè)例子可以在圖1中看到。聚合酶可以形成包含上文和下文所討論的任何核苷酸的新鏈。聚合酶具有與包含發(fā)夾環(huán)的鏈中的核苷酸互補(bǔ)的游離核苷酸群。聚合酶可以使用游離核苷酸形成新的鏈。分離/復(fù)制分離雙鏈構(gòu)建體的兩條鏈,并且將該鏈用作模板以形成多個(gè)修飾的雙鏈多核苷酸,每個(gè)雙鏈多核苷酸包含由至少一個(gè)發(fā)夾環(huán)連接的兩條互補(bǔ)鏈。一個(gè)例子如圖1所示。在將兩條鏈用作模板之前,可以將所述兩條鏈完全分離。兩條鏈可以分離并在同一時(shí)間被用作模板(即同時(shí))。換句話說(shuō),兩條鏈不需要完全分離,或者兩條鏈在用作模板之前可被部分分離。兩條鏈可以以任何方式分離。該方法優(yōu)選包括通過(guò)增加ph、溫度和離子強(qiáng)度中的一種或多種來(lái)分離雙鏈構(gòu)建體的兩條鏈。優(yōu)選升高的溫度。該方法優(yōu)選包括將溫度升高至95℃。該方法優(yōu)選包括將溫度升高至95℃,然后將溫度降至55℃。該方法優(yōu)選包括將溫度升高至95℃,將溫度降低至55℃,然后將溫度升高至68℃。該方法最優(yōu)選包括在95℃下培育雙鏈構(gòu)建體2分鐘,在55℃下培育30秒,然后在68℃下培育30分鐘??梢允褂眉柞0坊驓溲趸c(naoh)來(lái)實(shí)現(xiàn)ph的增加。酶,例如解旋酶或消化模板鏈的酶(例如,如果該鏈具有du而不是dt,則為user)也可用于分離鏈。下面討論的任何解旋酶都可以使用。如下面更詳細(xì)討論的,可以使用聚合酶分離兩條鏈。聚合酶可以是上面或下面討論的那些??梢允褂萌魏畏椒▉?lái)形成使用分離的鏈作為模板的新的多核苷酸。該方法優(yōu)選包括使鏈與聚合酶接觸,使得聚合酶使用鏈作為模板形成多個(gè)修飾的雙鏈多核苷酸??梢允褂蒙鲜龌蛳旅嬗懻摰娜魏尉酆厦浮;蛘撸摲椒梢园?i)使多個(gè)鏈與一群核苷酸寡聚體接觸,核苷酸寡聚體包括在寡聚體能夠雜交到鏈的條件下與鏈中所有核苷酸互補(bǔ)的核苷酸的每一種可能組合,和(ii)將那些與鏈雜交的寡聚體連接在一起以形成多個(gè)經(jīng)修飾的雙鏈多核苷酸。允許雜交的條件是本領(lǐng)域已知的(例如,sambrook等人,2001,molecularcloning:alaboratorymanual,第3版,coldspringharborlaboratorypress;和currentprotocolsinmolecularbiology,第2章,ausubeletal.,eds.,greenepublishingandwiley-interscience,newyork(1995))。雜交可以在低嚴(yán)格條件下進(jìn)行,例如在37℃下在30-35%甲酰胺、1mnacl和1%sds(十二烷基硫酸鈉)的緩沖溶液存在下進(jìn)行,然后在50℃下在從1x(0.1650mna+)到2x(0.33mna+)的ssc(標(biāo)準(zhǔn)檸檬酸鈉)中洗滌。雜交可以在中度嚴(yán)格條件下進(jìn)行,例如在37℃下在40至45%甲酰胺、1mnacl和1%sds的緩沖溶液的存在下進(jìn)行,然后在55℃下在從0.5x(0.0825mna+)到1x(0.1650mna+)的ssc中洗滌。雜交可以在高嚴(yán)格條件下進(jìn)行,例如在37℃下在50%甲酰胺、1mnacl、1%sds的緩沖溶液存在下進(jìn)行,然后在60℃下在0.1x(0.0165mna+)的ssc中洗滌。優(yōu)選的條件優(yōu)選為10mmtris-hcl,50mmnacl,ph7中的10um寡聚體,并加熱至98℃,然后以2℃/分鐘冷卻至18℃。群中的寡聚體通常具有2至16個(gè)核苷酸。群中的所有寡聚體可具有2,3,4,5,6,7,8,9,10,11,12,13,14,15或16個(gè)核苷酸。群中的寡聚體可以具有不同的長(zhǎng)度。群中的所有寡聚體優(yōu)選具有相同的長(zhǎng)度。寡聚體可以包含任何上述核苷酸。核苷酸與和寡聚體雜交的鏈中的核苷酸互補(bǔ)。對(duì)于本領(lǐng)域技術(shù)人員來(lái)說(shuō),識(shí)別與那些核苷酸互補(bǔ)的核苷酸是較容易的。如果核苷酸通過(guò)堿基配對(duì)(優(yōu)選watson和crick堿基配對(duì))與另一個(gè)核苷酸雜交,則所述核苷酸與所述另一個(gè)核苷酸互補(bǔ)?;パa(bǔ)的核苷酸可以與不與其互補(bǔ)的其他核苷酸雜交,但是比其雜交到與其互補(bǔ)的核苷酸的程度小。n優(yōu)選包含核堿基腺嘌呤(a)、尿嘧啶(u)、鳥嘌呤(g)或胞嘧啶(c)?;蛘?,n優(yōu)選包含核堿基a、胸腺嘧啶(t)、g或c。a與t或u互補(bǔ),反之亦然。g與c互補(bǔ),反之亦然。所述群包括與鏈中所有核苷酸互補(bǔ)的核苷酸的每種可能組合。這意味著寡聚體將與絕大多數(shù)(如果不是全部)的鏈雜交,無(wú)論其序列如何。例如,如果n包含核堿基腺嘌呤(a)、尿嘧啶(u)、鳥嘌呤(g)或胞嘧啶(c),則所述群包括a、u、g和c的每一種可能的組合。類似地,如果n包含核堿基a、胸腺嘧啶(t)、g或c,則所述群包含a、t、g和c的每一種可能的組合。設(shè)計(jì)和獲得具有所需組合的寡聚體群是較為簡(jiǎn)單的。例如,如果群中所有的寡聚體都包含或由nn組成,并且n是a、t、g或c,則所述群包含at,ag,ac,ta,tg,tc,ga,gt,gc,ca,ct和cg。類似地,如果群中所有寡聚體包含或由nnn組成,并且n是a、t、g或c,則所述群包含atg,atc,agt,agc,act,acg,tag,tac,tga,tgc,tca,tcg,gat,gac,gta,gtc,gca,gct,cat,cag,cta,ctg,cga和cgt。一旦設(shè)計(jì)了通用公式,例如nn或nnn,則包含n的所有可能組合的群可購(gòu)得,例如購(gòu)自intergrateddnatechnologies(idt),sigma和invitrogen。寡聚體能夠根據(jù)本發(fā)明連接在一起。群中的所有寡聚體優(yōu)選在5′端具有磷酸基團(tuán)或腺苷酸基團(tuán)。雜交的寡聚體可以使用本領(lǐng)域已知的任何方法連接在一起。寡聚體優(yōu)選使用連接酶連接,例如t4dna連接酶,大腸桿菌dna連接酶,taqdna連接酶,tmadna連接酶和9°ndna連接酶。如果反應(yīng)性基團(tuán)存在于寡聚體的末端,則寡聚體也可以化學(xué)連接。在這樣的實(shí)施方案中,需要采取步驟以防止寡聚體在溶液中彼此結(jié)合。通常使用鏈上的發(fā)夾作為引物來(lái)引發(fā)連接反應(yīng)。在優(yōu)選的實(shí)施方案中,該方法優(yōu)選包括使多個(gè)雙鏈構(gòu)建體與聚合酶接觸,使得聚合酶同時(shí)分離雙鏈構(gòu)建體的兩條鏈,并將該鏈用作模板以形成多個(gè)修飾的雙鏈多核苷酸??梢允褂蒙厦婊蛳旅嬗懻摰娜魏尉酆厦?。聚合酶可以形成包含上面或下面討論的任何核苷酸的新鏈。聚合酶具有與模板鏈中的核苷酸互補(bǔ)的游離核苷酸群。聚合酶可以使用游離核苷酸形成新的鏈。經(jīng)修飾的多核苷酸如果聚合酶使用鏈作為模板以形成多個(gè)修飾的雙鏈多核苷酸,則該方法可以包括在聚合酶使用鏈作為模板以形成多個(gè)修飾的雙鏈多核苷酸的條件下使鏈與聚合酶以及游離核苷酸群接觸,其中當(dāng)形成修飾的雙鏈多核苷酸時(shí),所述聚合酶用不同的核苷酸種類代替鏈中的一個(gè)或多個(gè)核苷酸種類。如上所述,聚合酶可以用于同時(shí)分離各鏈。在申請(qǐng)?zhí)枮?403096.9的英國(guó)申請(qǐng)中描述了這種類型的修飾??梢允褂蒙厦婊蛳旅嬗懻摰娜魏尉酆厦浮>酆厦竷?yōu)選為klenow或9°north。以上討論了合適的條件。使用跨膜孔進(jìn)行的多核苷酸的表征例如測(cè)序通常涉及分析由k個(gè)核苷酸組成的聚合物單元,其中k是正整數(shù)(即′k聚體′)。這在申請(qǐng)?zhí)枮閜ct/gb2012/052343(公開為wo2013/041878)的國(guó)際申請(qǐng)中進(jìn)行了討論。盡管希望在不同k聚體的電流測(cè)量值之間有明確的分離,但是這些測(cè)量值中的一些通常是重疊的。特別是在k聚體中具有高數(shù)量的聚合物單元,即高的k值時(shí),可能變得難以分辨由不同的k聚體產(chǎn)生的測(cè)量值,從而不利于得到關(guān)于多核苷酸的信息,例如對(duì)多核苷酸的潛在序列的估計(jì)。通過(guò)用修飾的雙鏈多核苷酸的新鏈(即使用聚合酶產(chǎn)生的鏈)中的不同核苷酸種類替換鏈中的一個(gè)或多個(gè)核苷酸種類,新鏈含有不同于那些在模板鏈中的k聚體。新鏈中的不同的k聚體能夠從模板鏈中的k聚體產(chǎn)生不同的電流測(cè)量值,因此新的鏈提供與模板鏈不同的信息。來(lái)自新鏈的額外信息可以使得更容易表征修飾的雙鏈多核苷酸以及模板多核苷酸。在一些情況下,修飾的雙鏈多核苷酸本身可能更易于表征。例如,修飾的雙鏈多核苷酸可以被設(shè)計(jì)成包括具有在其電流測(cè)量值之間的增加的分離或清晰的分離的k聚體或具有降低的噪聲的k聚體。當(dāng)形成修飾的雙鏈多核苷酸時(shí),聚合酶優(yōu)選用不同核苷酸種類取代模板鏈中的兩個(gè)或更多個(gè)核苷酸種類。聚合酶可以用不同的核苷酸種類代替模板鏈中的兩個(gè)或更多個(gè)核苷酸種類中的每一個(gè)。聚合酶可以用相同的核苷酸種類代替模板鏈中的兩個(gè)或更多個(gè)核苷酸種類中的每一個(gè)。如果模板鏈?zhǔn)莇na,則不同的核苷酸種類通常包含不同于腺嘌呤,鳥嘌呤,胸腺嘧啶,胞嘧啶或甲基胞嘧啶的核堿基和/或包含與脫氧腺苷,脫氧鳥苷,胸苷,脫氧胞苷或脫氧甲基胞苷不同的核苷。如果模板鏈?zhǔn)莚na,則經(jīng)修飾的多核苷酸中的不同核苷酸種類通常包含不同于腺嘌呤,鳥嘌呤,尿嘧啶,胞嘧啶或甲基胞嘧啶的核堿基和/或包含不同于腺苷,鳥苷,尿苷,胞苷或甲基胞苷的核苷。不同的核苷酸種類可以是通用核苷酸。通用核苷酸是在某種程度上與模板鏈中的所有核苷酸雜交或結(jié)合的核苷酸。通用核苷酸優(yōu)選是一定程度上與包含核苷腺苷(a),胸腺嘧啶(t),尿嘧啶(u),鳥嘌呤(g)和胞嘧啶(c)的核苷酸雜交或結(jié)合的核苷酸。通用核苷酸可以比其他核苷酸更強(qiáng)地雜交或結(jié)合某些核苷酸。例如,包含核苷,2′-脫氧肌苷的通用核苷酸(i)將顯示i-c>i-a>i-g約=i-t的配對(duì)的優(yōu)先順序。如果通用核苷酸替代了群中的核苷酸種類,則聚合酶將用通用核苷酸替代核苷酸種類。例如,如果與一群游離damp,dtmp,dcmp和通用核苷酸接觸,聚合酶將以通用核苷酸取代dgmp。通用核苷酸優(yōu)選包含以下核堿基之一:次黃嘌呤,4-硝基吲哚,5-硝基吲哚,6-硝基吲哚,甲酰基吲哚,3-硝基吡咯,硝基咪唑,4-硝基吡唑,4-硝基苯并咪唑,5-硝基吲唑,4-氨基苯并咪唑或苯基(c6-芳環(huán))。通用核苷酸更優(yōu)選包含以下核苷之一:2′-脫氧肌苷,肌苷,7-脫氮-2′-脫氧肌苷,7-脫氮肌苷,2-氮雜-脫氧肌苷,2-氮雜-肌苷,2-o′-甲基肌苷,4-硝基吲哚2′-脫氧核糖核苷,4-硝基吲哚核糖核苷,5-硝基吲哚2′-脫氧核糖核苷,5-硝基吲哚核糖核苷,6-硝基吲哚2′-脫氧核糖核苷,6-硝基吲哚核糖核苷,3-硝基吡咯2′-脫氧核糖核苷,3-硝基吡咯核糖核苷,次黃嘌呤的無(wú)環(huán)糖類似物,硝基咪唑2′-脫氧核糖核苷,硝基咪唑核糖核苷,4-硝基吡唑2′-脫氧核糖核苷,4-硝基吡唑核糖核苷,4-硝基苯并咪唑2′-脫氧核糖核苷,4-硝基苯并咪唑核糖核苷,5-硝基吲唑2′-脫氧核糖核苷,5-硝基吲唑核糖核苷,4-氨基苯并咪唑2′-脫氧核糖核苷,4-氨基苯并咪唑核糖核苷,苯基c-核糖核苷,苯基c-2′-脫氧核糖基核苷,2′-脫氧水粉蕈素,2′-脫氧異鳥苷,k-2′-脫氧核糖,p-2′-脫氧核糖和吡咯烷。通用核苷酸更優(yōu)選包含2′-脫氧肌苷。通用核苷酸更優(yōu)選為imp或dimp。通用核苷酸最優(yōu)選為dpmp(2′-脫氧-p-核苷單磷酸)或dkmp(n6-甲氧基-2,6-二氨基嘌呤單磷酸酯)。不同的核苷酸種類優(yōu)選包含其所取代的核苷酸種類中不存在的化學(xué)原子或基團(tuán)。化學(xué)基團(tuán)優(yōu)選為丙炔基,硫基,氧代基,甲基,羥甲基,甲?;?,羧基,羰基,芐基,炔丙基或炔丙胺基?;瘜W(xué)基團(tuán)或原子可以是或可以包含熒光分子,生物素,地高辛,dnp(二硝基苯酚),光不穩(wěn)定基團(tuán),炔烴,dbco,疊氮化物,游離氨基,氧化還原染料,汞原子或硒原子。包含不存在于天然存在的核苷中的化學(xué)基團(tuán)的市售核苷包括但不限于6-硫代-2′-脫氧鳥苷,7-脫氮-2′-脫氧腺苷,7-脫氮-2′-脫氧鳥苷,7-脫氮-2′-脫氧腺苷,7-脫氮-8-氮雜-2′-脫氧腺苷,8-5′(5′s)-環(huán)-2′-脫氧腺苷,8-氨基-2′-脫氧腺苷,8-氨基-2′脫氧鳥苷,8-氘代-2′-脫氧鳥苷,8-氧-2′-脫氧腺苷,8-氧-2′-脫氧鳥苷,亞乙烯基-2′-脫氧腺苷,n6-甲基-2′-脫氧腺苷,o6-甲基-2′-脫氧鳥苷,o6-苯基-2′脫氧肌苷,2′-脫氧假尿苷,2-硫代胸苷,4-硫代-2′-脫氧尿苷,4-硫代胸苷,5′氨基胸苷,5-(1-芘基乙炔基)-2′-脫氧尿苷,5-(c2-edta)-2′-脫氧尿苷,5-(羧基)乙烯基-2′-脫氧尿苷,5,6-二氫-2′-脫氧尿苷,5.6-二氫胸苷,5-溴-2′-脫氧胞苷,5-溴-2′-脫氧尿苷,5-羧基-2′-脫氧胞苷,5-氟-2′-脫氧尿苷,5-甲?;?2′-脫氧胞苷,5-羥基-2′-脫氧胞苷,5-羥基-2′-脫氧尿苷,5-羥甲基-2′-脫氧胞苷,5-羥甲基-2′-脫氧尿苷,5-碘-2′-脫氧胞苷,5-碘-2′-脫氧尿苷,5-甲基-2′-脫氧胞苷,5-甲基-2′-脫氧異胞苷,5-丙炔基-2′-脫氧胞苷,5-丙炔基-2′-脫氧尿苷,6-o-(tmp)-5-f-2′-脫氧尿苷,c4-(1,2,4-三唑-1-基)-2′-脫氧尿苷,c8-炔-胸苷,dt-二茂鐵,n4-乙基-2′-脫氧胞苷,o4-甲基胸苷,吡咯-2′-脫氧胞苷,胸苷乙二醇,4-硫尿苷,5-甲基胞苷,5-甲基尿苷,吡咯基胞苷,3-脫氮-5-氮雜-2′-o-甲基胞苷,5-氟-2′-o-甲基尿苷,5-氟-4-o-tmp-2′-o-甲基尿苷,5-甲基-2′-o-甲基胞苷,5-甲基-2′-o-甲基胸苷,2′,3′-脫氧腺苷,2′,3′-二脫氧胞苷2′,3′-二脫氧鳥苷,2′,3′-二脫氧胸苷,3′-脫氧腺苷,3′-脫氧胞苷,3′-脫氧鳥苷,3′-脫氧胸苷和5′-o-甲基胸苷。不同的核苷酸種類可以包含任何這些核苷?;蛘?,不同的核苷酸種類優(yōu)選缺乏其所替代的核苷酸種類中存在的化學(xué)基團(tuán)或原子。與被替換的一個(gè)或多個(gè)核苷酸相比,所述不同的核苷酸種類優(yōu)選具有改變的電負(fù)性。具有改變的電負(fù)性的不同核苷酸種類優(yōu)選包含鹵素原子。鹵素原子可以連接到不同核苷酸種類上的任何位置,例如核堿基和/或糖。鹵素原子優(yōu)選為氟(f),氯(cl),溴(br)或碘(i)。鹵素原子最優(yōu)選為f或i。包含鹵素的市售核苷包括但不限于8-溴-2′-脫氧腺苷,8-溴-2′-脫氧鳥苷,5-溴尿苷,5-碘尿苷,5′-碘胸苷和5-溴-2′-o-甲基尿苷。不同的核苷酸種類可以包含任何這些核苷。該方法優(yōu)選還包括選擇性地從修飾的雙鏈多核苷酸中的一個(gè)或多個(gè)不同核苷酸種類中去除核堿基。這導(dǎo)致修飾的雙鏈多核苷酸中的脫堿基核苷酸。脫堿基核苷酸是缺乏核堿基的核苷酸。脫堿基核苷酸通常含有糖和至少一個(gè)磷酸基。糖通常是戊糖,如核糖和脫氧核糖。脫堿基核苷酸通常是脫堿基核糖核苷酸或脫堿基脫氧核糖核苷酸。脫堿基核苷酸通常含有一磷酸鹽,二磷酸鹽或三磷酸鹽。磷酸鹽可以連接在無(wú)堿基核苷酸的5′或3′側(cè)。可以使用本領(lǐng)域已知的任何方法選擇性地除去核堿基。例如,某些dna修復(fù)蛋白(例如人烷基腺嘌呤dna糖基化酶(haag))能夠從核苷酸中選擇性地除去3-甲基腺嘌呤,7-甲基鳥嘌呤,1,n6-乙烯基腺嘌呤和次黃嘌呤。此外,可以使用尿嘧啶dna糖基化酶選擇性除去dump。附咖聚合酶步驟在另一個(gè)優(yōu)選的實(shí)施方案中,將修飾的雙鏈多核苷酸中的信息量加倍以利于模板多核苷酸的表征。該方法的一個(gè)示例在圖8中示出。該方法優(yōu)選包含(d)將修飾的雙鏈多核苷酸的兩條鏈分離并使用該鏈作為模板以形成多個(gè)適應(yīng)的雙鏈多核苷酸,每個(gè)雙鏈多核苷酸包含由至少一個(gè)發(fā)夾環(huán)連接的兩個(gè)互補(bǔ)鏈,其中每個(gè)互補(bǔ)鏈包含兩個(gè)互補(bǔ)序列。每個(gè)互補(bǔ)鏈中的兩個(gè)互補(bǔ)序列之一衍生自模板雙鏈多核苷酸。步驟(d)通常包括,在分離之前將發(fā)夾環(huán)在修飾的雙鏈多核苷酸的遠(yuǎn)離連接互補(bǔ)鏈的所述至少一個(gè)發(fā)夾環(huán)的另一端連接到修飾的雙鏈多核苷酸。該發(fā)夾環(huán)優(yōu)選不連接經(jīng)修飾的雙鏈多核苷酸的鏈。發(fā)夾可以形成聚合酶的成核點(diǎn)。當(dāng)修飾的雙鏈多核苷酸的分離的鏈用作模板時(shí),連接的發(fā)夾環(huán)也用作模板并連接適應(yīng)的雙鏈多核苷酸的兩個(gè)互補(bǔ)鏈,即,連接來(lái)自修飾的雙鏈多核苷酸的模板鏈與由模板形成的新鏈。步驟(d)可以以上述任何方式進(jìn)行。例如,步驟(d)可以包括通過(guò)增加ph,溫度和離子強(qiáng)度中的一個(gè)或多個(gè)來(lái)分離修飾的雙鏈多核苷酸的兩條鏈。步驟(d)可以包括使分離的鏈與聚合酶接觸,使得聚合酶使用鏈作為模板來(lái)形成多個(gè)適應(yīng)的雙鏈多核苷酸。步驟(d)可以包括(i)使多個(gè)分離的鏈與一群核苷酸寡聚體接觸,所述一群核苷酸寡聚體包括在寡聚體能夠雜交到鏈的條件下與鏈中所有核苷酸互補(bǔ)的核苷酸的每種可能組合,和(ii)將那些與所述鏈雜交的寡聚體連接在一起以形成多個(gè)適應(yīng)的雙鏈多核苷酸。步驟(d)可以包括使多個(gè)修飾的雙鏈多核苷酸與聚合酶接觸,使得聚合酶同時(shí)分離修飾的雙鏈多核苷酸的兩條鏈,并將該鏈用作多個(gè)適應(yīng)的雙鏈多核苷酸的模板。上述任何實(shí)施例可以應(yīng)用于步驟(d)。例如,步驟(d)可以包括用新鏈中的不同核苷酸種類替換模板鏈中的一個(gè)或多個(gè)核苷酸種類。y適配器如果每個(gè)底物不包含前導(dǎo)序列,則該方法優(yōu)選還包括在發(fā)夾環(huán)的相對(duì)端將y適配器連接到多個(gè)修飾的雙鏈多核苷酸。y適配器通常是多核苷酸適配器。它們可以由任何上述的多核苷酸形成。y適配器通常包含(a)雙鏈區(qū)域和(b)單鏈區(qū)域或在另一端不互補(bǔ)的區(qū)域。如果y適配器包括單鏈區(qū)域,則y適配器可以被描述為具有突出端。y適配器中非互補(bǔ)區(qū)域的存在使其具有y形狀,因?yàn)榕c雙鏈部分不同,這兩條鏈通常不彼此雜交。y適配器可以包括一個(gè)或多個(gè)錨,如下面更詳細(xì)地討論的。y適配器可以連接到修飾的雙鏈多核苷酸。可以使用本領(lǐng)域已知的任何方法進(jìn)行連接。例如,可以使用連接酶例如t4dna連接酶,大腸桿菌dna連接酶,taqdna連接酶,tmadna連接酶和9°ndna連接酶連接y適配器。本發(fā)明的產(chǎn)品本發(fā)明還提供了用于修飾模板多核苷酸的雙鏈mua底物群,其中每個(gè)底物包含通用核苷酸的至少一個(gè)突出端。本發(fā)明還提供了用于修飾模板多核苷酸的雙鏈mua底物群,其中每個(gè)底物包含(i)至少一個(gè)突出端和(ii)在與包含所述至少一個(gè)突出端的鏈相對(duì)的鏈中的至少一個(gè)發(fā)夾環(huán)。底物可以是上述那些中的任一種。底物優(yōu)選包含如上所定義的雙鏈部分。雙鏈部分優(yōu)選包含如上所述的seqidno:26和27。雙鏈部分更優(yōu)選包含如上所述的seqidno:26和28。本發(fā)明的優(yōu)選的群是其中每個(gè)底物包含在一端的突出端和在另一端的發(fā)夾環(huán)的那些群。本發(fā)明還提供了使用本發(fā)明的方法修飾的多個(gè)多核苷酸。所述多個(gè)多核苷酸可以是上述任何形式。修飾的雙鏈多核苷酸包含兩個(gè)互補(bǔ)鏈,其包含通過(guò)發(fā)夾環(huán)連接的模板多核苷酸的雙鏈片段。群或多個(gè)多核苷酸可以是分離的,基本上分離的,純化的或基本上純化的。如果群或多個(gè)多核苷酸完全不含任何其它組分,例如模板多核苷酸,脂質(zhì)或孔,則群或多個(gè)多核苷酸是分離的或純化的。如果與不妨礙其預(yù)期用途的載體或稀釋劑混合,則群或多個(gè)多核苷酸基本上是分離的。例如,如果群或多個(gè)多核苷酸以包含小于10%,小于5%,小于2%或小于1%的其它成分(例如脂質(zhì)或孔)的形式存在,則群或多個(gè)多核苷酸基本上是分離的或基本上是純化的。表征方法本發(fā)明還提供了表征使用本發(fā)明的方法修飾的至少一種多核苷酸的方法。經(jīng)修飾的多核苷酸與跨膜孔接觸,使得多核苷酸的至少一條鏈移動(dòng)通過(guò)所述孔。隨著至少一條鏈相對(duì)于孔移動(dòng),獲取一個(gè)或多個(gè)測(cè)量值。所述測(cè)量值指示所述至少一條鏈的一個(gè)或多個(gè)特征,并且這允許表征經(jīng)修飾的多核苷酸。本發(fā)明還提供了表征模板多核苷酸的方法。使用本發(fā)明修飾模板多核苷酸以產(chǎn)生多個(gè)經(jīng)修飾的多核苷酸。每個(gè)經(jīng)修飾的多核苷酸與跨膜孔接觸,使得每個(gè)多核苷酸的至少一條鏈移動(dòng)通過(guò)孔。隨著每個(gè)多核苷酸相對(duì)于孔移動(dòng),獲取一個(gè)或多個(gè)測(cè)量值。所述測(cè)量值指示每個(gè)多核苷酸的一個(gè)或多個(gè)特征,這允許對(duì)模板多核苷酸進(jìn)行表征。在優(yōu)選的實(shí)施方案中,經(jīng)修飾的多核苷酸的兩條鏈/每個(gè)經(jīng)修飾的多核苷酸移動(dòng)通過(guò)孔。如果兩條鏈都移動(dòng)穿過(guò)孔,則兩條鏈通常是分離的。可以使用本領(lǐng)域已知的任何方法分離兩條鏈。例如,它們可以被多核苷酸結(jié)合蛋白分離,或者使用有利于脫雜交的條件(有利于脫雜交的條件的實(shí)例包括但不限于高溫、高ph和添加可以破壞氫鍵或堿基配對(duì)的試劑,如甲酰胺和脲)而分離??缒た卓缒た资窃谝欢ǔ潭壬洗┻^(guò)膜的結(jié)構(gòu)。它允許由施加電勢(shì)驅(qū)動(dòng)的水合離子流過(guò)膜或在膜內(nèi)流動(dòng)。跨膜孔通常穿過(guò)整個(gè)膜,使得水合離子可以從膜的一側(cè)流到膜的另一側(cè)。然而,跨膜孔不必跨過(guò)膜。它可能在一端被封閉。例如,孔可以是水合離子可以沿其流動(dòng)或流入其中的膜內(nèi)的阱、間隙、通道、溝槽或狹縫。一個(gè)或多個(gè)選擇性擴(kuò)增探針或一個(gè)或多個(gè)擴(kuò)增產(chǎn)物優(yōu)選通過(guò)下述進(jìn)行表征:(i)使探針或擴(kuò)增產(chǎn)物與跨膜孔接觸,使得探針或擴(kuò)增產(chǎn)物移動(dòng)通過(guò)孔,并且(ii)隨著探針或擴(kuò)增產(chǎn)物相對(duì)于孔移動(dòng)獲取一個(gè)或多個(gè)測(cè)量值,其中所述測(cè)量值指示探針或擴(kuò)增產(chǎn)物的一個(gè)或多個(gè)特征,從而表征探針或擴(kuò)增產(chǎn)物。任何跨膜孔可用于本發(fā)明??卓梢允巧锏幕蛉嗽斓摹:线m的孔包括但不限于蛋白質(zhì)孔,多核苷酸孔和固態(tài)孔。孔可以是dna折紙孔(langecker等人,science,2012;338:932-936)??缒た變?yōu)選為跨膜蛋白孔。根據(jù)本發(fā)明使用的跨膜蛋白孔可以衍生自β-桶狀孔或α-螺旋束孔。β-桶狀孔包括由β-鏈形成的桶狀體或通道。合適的β-桶狀孔包括但不限于,形成毒素的β孔,例如α-溶血素,炭疽毒素和殺白細(xì)胞素,和細(xì)菌的外膜蛋白/孔蛋白,例如恥垢分枝桿菌(mycobacteriumsmegmatis)孔蛋白(msp),如mspa,mspb,mspc或mspd,外膜孔蛋白f(ompf),外膜孔蛋白g(ompg),外膜磷脂酶a和奈瑟氏菌(neisseria)自體轉(zhuǎn)運(yùn)脂蛋白(nalp)以及其他孔,如lysenin。α-螺旋束孔包括由α-螺旋形成的桶狀體或通道。合適的α-螺旋束孔包括但不限于內(nèi)膜蛋白和α外膜蛋白,例如wza和clya毒素。跨膜孔可以衍生自lysenin。衍生自lysenin的合適的孔在申請(qǐng)?zhí)枮閜ct/gb2013/050667(公開為wo2013/153359)的國(guó)際申請(qǐng)中公開??缒た卓梢匝苌詍sp,如mspa,或衍生自α-溶血素(α-hl)。野生型α-hl孔由七個(gè)相同的單體或亞基形成(即其為七聚體)。α-溶血素-nn的一個(gè)單體或亞基的序列在seqidno:4中示出??缒さ鞍卓變?yōu)選衍生自msp,優(yōu)選來(lái)自mspa。這樣的孔將是低聚的,并且通常包含衍生自msp的7,8,9或10個(gè)單體??卓梢允茄苌园嗤瑔误w的msp的同源寡聚孔?;蛘撸卓梢允茄苌园辽僖环N與其它單體不同的單體的msp的異源寡聚孔。優(yōu)選地,孔衍生自mspa或其同源物或旁系同源物。衍生自msp的單體通常包含seqidno:2或其變體中所示的序列。seqidno:2是mspa單體的ms-(b1)8突變體。它包括以下突變:d90n,d91n,d93n,d118r,d134r和e139k。seqidno:2的變體是具有下述氨基酸序列的多肽:從seqidno:2的氨基酸序列變化而來(lái)并保留其形成孔的能力。合適的變體在申請(qǐng)?zhí)枮閜ct/gb2012/050301(公開為wo2012/107778)的國(guó)際申請(qǐng)和申請(qǐng)?zhí)枮?407809.1(ontip057)的英國(guó)申請(qǐng)中公開。seqidno:2的優(yōu)選變體包含n93d??梢允褂帽绢I(lǐng)域已知的任何方法測(cè)定變體形成孔的能力。例如,可以將變體與其他合適的亞基一起插入兩親層,并且可以確定其低聚以形成孔的能力。本領(lǐng)域已知用于將亞基插入諸如兩親層的膜中的方法。例如,亞基可以在含有三嵌段共聚物膜的溶液中以純化的形式懸浮,使得其擴(kuò)散到膜并通過(guò)結(jié)合到膜上并組裝成功能狀態(tài)而插入。或者,亞基可以使用m.a.holden,h.bayley.j.am.chem.soc.2005,127,6502-6503和申請(qǐng)?zhí)枮閜ct/gb2006/001057(公開為wo2006/100484)的國(guó)際申請(qǐng)中所述的“摘取和放置(pickandplace)”方法直接插入膜中。在seqidno:2的氨基酸序列的整個(gè)長(zhǎng)度上,基于氨基酸同一性,變體將優(yōu)選與該序列至少50%同源。更優(yōu)選地,基于氨基酸同一性,變體可以與seqidno:2的氨基酸序列在整個(gè)長(zhǎng)度上至少55%,至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,和更優(yōu)選地至少95%,97%或99%同源。在100個(gè)或更多個(gè),例如125,150,175或200個(gè)或更多個(gè)連續(xù)氨基酸的片段上可以具有至少80%,例如至少85%,90%或95%的氨基酸同一性(“嚴(yán)格同源性(hardhomology)”)。本文所述的任何蛋白質(zhì),例如跨膜蛋白孔,可以通過(guò)合成而制備或通過(guò)重組方法制備。例如,孔可以通過(guò)體外翻譯和轉(zhuǎn)錄(ivtt)合成??椎陌被嵝蛄锌梢员恍揎棡榘ǚ翘烊淮嬖诘陌被峄蛟黾拥鞍踪|(zhì)的穩(wěn)定性。當(dāng)通過(guò)合成方法產(chǎn)生蛋白質(zhì)時(shí),可以在生產(chǎn)過(guò)程中引入這些氨基酸。在合成或重組生產(chǎn)之后,孔也可以改變。表征該方法可以涉及測(cè)量經(jīng)修飾多核苷酸或模板多核苷酸的兩個(gè),三個(gè),四個(gè)或五個(gè)或更多個(gè)特征。一個(gè)或多個(gè)特征優(yōu)選選自(i)多核苷酸的長(zhǎng)度,(ii)多核苷酸的同一性,(iii)多核苷酸的序列,(iv)多核苷酸的二級(jí)結(jié)構(gòu),以及(v)多核苷酸是否被修飾。(i)至(v)的任何組合可以根據(jù)本發(fā)明進(jìn)行測(cè)量,例如{i},{ii},{iii},{iv},{v},{i,ii},{i,iii},{i,iv},{i,v},{ii,iii},{ii,iv},{ii,v},{iii,iv},{iii,v},{iv,v},{i,ii,iii},{i,ii,iv},{i,ii,v},{i,iii,iv},{i,iii,v},{i,iv,v}ii,iii,iv},{ii,iii,v},{ii,iv,v},{iii,iv,v},{i,ii,iii,iv},{i,ii,iii,v},{i,ii,iv,v},{i,iii,iv,v},{ii,iii,iv,v}或{i,ii,iii,iv,v}。相比于第二多核苷酸,可以對(duì)第一多核苷酸測(cè)量(i)至(v)的不同組合,包括上述任何一種組合。對(duì)于(i),可以例如通過(guò)確定多核苷酸和孔之間的相互作用的次數(shù)或多核苷酸和孔之間的相互作用持續(xù)時(shí)間來(lái)測(cè)量多核苷酸的長(zhǎng)度。對(duì)于(ii),可以以多種方式測(cè)量多核苷酸的同一性。多核苷酸的同一性可以結(jié)合多核苷酸序列的測(cè)量或不結(jié)合多核苷酸的序列的測(cè)量來(lái)測(cè)量。前者較簡(jiǎn)單;對(duì)多核苷酸進(jìn)行測(cè)序并鑒定。后者可以通過(guò)幾種方式完成。例如,可以測(cè)量多核苷酸中特定基序的存在(不測(cè)量多核苷酸的剩余序列)?;蛘撸摲椒ㄖ刑囟姾?或光信號(hào)的測(cè)量可以鑒定出來(lái)自特定來(lái)源的多核苷酸。對(duì)于(iii),可以如先前所述測(cè)定多核苷酸的序列。在stoddartd等人,procnatlacadsci,12;106(19):7702-7,liebermankr等人,jamchemsoc.2010;132(50):17961-72和申請(qǐng)?zhí)枮閣o2000/28312的國(guó)際申請(qǐng)中描述了合適的測(cè)序方法,特別是使用電測(cè)量的測(cè)序方法。對(duì)于(iv),二級(jí)結(jié)構(gòu)可以以多種方式測(cè)量。例如,如果該方法涉及電測(cè)量,則可以使用駐留時(shí)間的變化或流過(guò)孔的電流的變化來(lái)測(cè)量二級(jí)結(jié)構(gòu)。這允許區(qū)分單鏈和雙鏈多核苷酸的區(qū)域。對(duì)于(v),可以測(cè)量是否存在任何修飾。該方法優(yōu)選包括,確定多核苷酸是否通過(guò)甲基化,氧化,損傷、用一種或多種蛋白質(zhì)或用一種或多種標(biāo)記、標(biāo)簽或間隔基,進(jìn)行了修飾。特定的修飾將導(dǎo)致與孔的特異性相互作用,其可以使用下述方法測(cè)量。例如,可基于在與每個(gè)核苷酸相互作用期間流過(guò)孔的電流,將甲基胞嘧啶與胞嘧啶進(jìn)行區(qū)分。多核苷酸與跨膜孔接觸??淄ǔ4嬖谟谀ぶ?。下面討論合適的膜。該方法可以使用任何適合于研究膜中存在孔的膜/孔系統(tǒng)的設(shè)備進(jìn)行。該方法可以使用適用于跨膜孔感測(cè)的任何設(shè)備來(lái)進(jìn)行。例如,該設(shè)備包括一個(gè)包含水性溶液的腔室和一個(gè)將腔室分成兩個(gè)部分的屏障。屏障通常具有形成包含孔的膜的孔洞?;蛘撸琳闲纬善渲写嬖诳椎哪?。該方法可以使用申請(qǐng)?zhí)枮閜ct/gb08/000562(wo2008/102120)的國(guó)際申請(qǐng)中描述的設(shè)備進(jìn)行??梢赃M(jìn)行多種不同類型的測(cè)量。這包括但不限于:電測(cè)量和光測(cè)量??赡艿碾姕y(cè)量包括:電流測(cè)量,阻抗測(cè)量,隧道測(cè)量(tunnellingmeasurement)(ivanovap等人,nanolett.2011jan12;11(1):279-85)和fet測(cè)量(申請(qǐng)?zhí)枮閣o2005/124888的國(guó)際申請(qǐng))。光測(cè)量可以與電測(cè)量結(jié)合(sonigv等人,revsciinstrum.2010jan;81(1):014301)。測(cè)量可以是跨膜電流測(cè)量,例如流過(guò)孔的離子電流的測(cè)量??梢允褂胹toddartd等人,procnatlacadsci,12;106(19):7702-7,liebermankr等人,jamchemsoc.2010;132(50):17961-72,和申請(qǐng)?zhí)枮閣o2000/28312的國(guó)際申請(qǐng)中描述的標(biāo)準(zhǔn)單通道記錄裝置進(jìn)行電測(cè)量?;蛘撸梢允褂萌鐕?guó)際申請(qǐng)wo2009/077734和國(guó)際申請(qǐng)wo201i/067559中所述的多通道系統(tǒng)進(jìn)行電測(cè)量。該方法優(yōu)選以跨膜施加的電勢(shì)進(jìn)行。所施加的電勢(shì)可以是電壓電勢(shì)?;蛘?,施加的電勢(shì)可以是化學(xué)電勢(shì)。其一個(gè)例子是使用跨膜的鹽梯度,所述膜例如兩親層。在holden等人,jamchemsoc.2007jul11;129(27):8650-5中公開了鹽梯度。在一些情況下,隨著多核苷酸相對(duì)于孔的移動(dòng),使用通過(guò)孔的電流來(lái)估計(jì)或確定多核苷酸的序列。這就是鏈測(cè)序。該方法可以涉及測(cè)量隨著多核苷酸相對(duì)于孔的移動(dòng)通過(guò)孔的電流。因此,該方法中使用的設(shè)備還可以包括能夠在膜和孔上施加電勢(shì)并測(cè)量電信號(hào)的電路。該方法可以使用膜片鉗或電壓鉗進(jìn)行。所述方法優(yōu)選地涉及使用電壓鉗。本發(fā)明的方法可以涉及測(cè)量隨著多核苷酸相對(duì)于孔的移動(dòng)通過(guò)孔的電流。測(cè)量通過(guò)跨膜蛋白孔的離子電流的合適條件是本領(lǐng)域已知的并且在實(shí)施例中公開。該方法通常通過(guò)施加在膜和孔上的電壓進(jìn)行。所使用的電壓通常為+5v至-5v,例如從+4v至-4v,+3v至-3v或+2v至-2v。所使用的電壓通常為-600mv至+600mv或-400mv至+400mv。所使用的電壓優(yōu)選在具有選自-400mv,-300mv,-200mv,-150mv,-100mv,-50mv,-20mv和0mv的下限和獨(dú)立地選自+10mv,+20mv,+50mv,+100mv,+150mv,+200mv,+300mv和+400mv的上限的范圍內(nèi)。所使用的電壓更優(yōu)選在100mv至240mv的范圍內(nèi),最優(yōu)選在120mv至220mv的范圍內(nèi)。通過(guò)使用增加的施加電勢(shì),可以由孔增加不同核苷酸之間的區(qū)別。該方法通常在任何電荷載體存在下進(jìn)行,例如金屬鹽,例如堿金屬鹽,鹵化物鹽,例如氯化物鹽,如堿金屬氯化物鹽。電荷載體可以包括離子液體或有機(jī)鹽,例如四甲基氯化銨,三甲基苯基氯化銨,苯基三甲基氯化銨或1-乙基-3-甲基咪唑鎓氯化物。在上述示例性設(shè)備中,鹽存在于腔室中的水性溶液中。通常使用氯化鉀(kcl),氯化鈉(nacl),氯化銫(cscl)或亞鐵氰化鉀和鐵氰化鉀的混合物。kcl,nacl和亞鐵氰化鉀和鐵氰化鉀的混合物是優(yōu)選的。電荷載體在膜上可能是不對(duì)稱的。例如,電荷載體的類型和/或濃度在膜的每一側(cè)可以是不同的。鹽濃度可以是飽和的。鹽濃度可以是3m或更低,通常為0.1至2.5m,0.3至1.9m,0.5至1.8m,0.7至1.7m,0.9至1.6m或1m至1.4m。鹽濃度優(yōu)選為150mm至1m。該方法優(yōu)選使用至少為0.3m,例如至少0.4m,至少0.5m,至少0.6m,至少0.8m,在至少1.0m,至少1.5m,至少2.0m,至少2.5m或至少3.0m的鹽濃度進(jìn)行。高鹽濃度提供高信噪比,并允許電流指示正常電流波動(dòng)背景下待鑒定的核苷酸的存在。該方法通常在存在緩沖液的情況下進(jìn)行。在上述示例性設(shè)備中,緩沖液存在于腔室中的水性溶液中。任何緩沖液可用于本發(fā)明的方法。通常,緩沖液是磷酸鹽緩沖液。其他合適的緩沖液是hepes和三羥甲基氨基甲烷鹽酸鹽(tris-hcl)緩沖液。該方法通常在4.0至12.0,4.5至10.0,5.0至9.0,5.5至8.8,6.0至8.7或7.0至8.8或7.5至8.5的ph下進(jìn)行。所用的ph優(yōu)選為約7.5。該方法可以在0℃至100℃,15℃至95℃,16℃至90℃,17℃至85℃,18℃至80℃,19℃至70℃或在20℃至60℃進(jìn)行。所述方法通常在室溫下進(jìn)行。所述方法任選地在支持酶功能的溫度下進(jìn)行,例如約37℃。多核苷酸結(jié)合蛋白該方法優(yōu)選包括使所述/每個(gè)多核苷酸與多核苷酸結(jié)合蛋白接觸,使得所述蛋白控制所述/每個(gè)多核苷酸的至少一條鏈通過(guò)孔的運(yùn)動(dòng)。更優(yōu)選地,該方法包括(a)使所述/每個(gè)多核苷酸與孔以及多核苷酸結(jié)合蛋白接觸,使得所述蛋白控制所述/每個(gè)多核苷酸的至少一條鏈通過(guò)孔的運(yùn)動(dòng),和(b)隨著所述/每個(gè)多核苷酸相對(duì)于孔移動(dòng),獲取一個(gè)或多個(gè)測(cè)量值,其中測(cè)量值指示所述/每個(gè)多核苷酸的一個(gè)或多個(gè)特征,從而表征修飾的多核苷酸或模板多核苷酸。多核苷酸結(jié)合蛋白可以是能夠結(jié)合到多核苷酸并控制其通過(guò)孔的運(yùn)動(dòng)的任何蛋白質(zhì)。確定蛋白質(zhì)是否與多核苷酸結(jié)合在本領(lǐng)域是較簡(jiǎn)單的。蛋白質(zhì)通常與多核苷酸相互作用并修飾多核苷酸的至少一種特性。蛋白質(zhì)可以通過(guò)將多核苷酸裂解以形成單個(gè)核苷酸或核苷酸短鏈,例如二核苷酸或三核苷酸,來(lái)修飾多核苷酸。蛋白質(zhì)可以通過(guò)使其定向到特定位置或?qū)⑵湟苿?dòng)到特定位置,即控制其運(yùn)動(dòng),來(lái)修飾多核苷酸。多核苷酸結(jié)合蛋白優(yōu)選衍生自多核苷酸處理酶。多核苷酸處理酶是能夠與多核苷酸相互作用并修飾多核苷酸的至少一種性質(zhì)的多肽。酶可以通過(guò)將多核苷酸裂解以形成單個(gè)核苷酸或核苷酸短鏈,例如二核苷酸或三核苷酸,來(lái)修飾多核苷酸。酶可以通過(guò)使其定向到特定位置或?qū)⑵湟苿?dòng)到特定位置來(lái)修飾多核苷酸。多核苷酸處理酶不需要顯示酶活性,只要其能夠結(jié)合多核苷酸并控制其通過(guò)孔的移動(dòng)即可。例如,酶可以被修飾以去除其酶活性,或者可以在防止其用作酶的條件下使用。以下更詳細(xì)地討論這些條件。多核苷酸處理酶優(yōu)選衍生自溶核酶(nucleolyticenzyme)。酶的構(gòu)建體中使用的多核苷酸處理酶更優(yōu)選衍生自酶分類(ec)組3.1.11,3.1.13,3.1.14,3.1.15,3.1.16,3.1.21,3.1.22,3.1.25,3.1.26,3.1.27,3.1.30和3.1.31中任一成員。酶可以是申請(qǐng)?zhí)枮閜ct/gb10/000133(公開為wo2010/086603)的國(guó)際申請(qǐng)中公開的那些酶中的任一種。優(yōu)選的酶是聚合酶、核酸外切酶、解旋酶和拓?fù)洚悩?gòu)酶,如促旋酶。合適的酶包括但不限于來(lái)自大腸桿菌的核酸外切酶i(seqidno:11),來(lái)自大腸桿菌的核酸外切酶iii(seqidno:13),來(lái)自嗜熱棲熱菌的recj(seqidno:15),以及細(xì)菌噬菌體λ核酸外切酶(seqidno:17),tatd核酸外切酶及其變體。包含seqidno:15或其變體中所示序列的三個(gè)亞基相互作用以形成三聚體核酸外切酶。聚合酶可以是3173dna聚合酶(可從corporation購(gòu)得),sd聚合酶(可從購(gòu)得)或其變體。酶優(yōu)選為phi29dna聚合酶(seqidno:9)或其變體。拓?fù)洚悩?gòu)酶優(yōu)選為酶分類(ec)組5.99.1.2和5.99.1.3中的任何成員。該酶最優(yōu)選衍生自解旋酶,例如he1308mbu(seqidno:18),he1308csy(seqidno:19),he1308tga(seqidno:20),he1308mhu(seqidno:21),traieco(seqidno:22),xpdmbu(seqidno:23)或其變體。在本發(fā)明中可以使用任何解旋酶。解旋酶可以是或來(lái)自he1308解旋酶,recd解旋酶,例如trai解旋酶或trwc解旋酶,xpd解旋酶或dda解旋酶。解旋酶可以是申請(qǐng)?zhí)枮閜ct/gb2012/052579(公開為wo2013/057495),pct/gb2012/053274(公開為wo2013/098562),pct/gb2012/053273(公開為wo2013098561),pct/gb2013/051925(公開為wo2014/013260),pct/gb2013/051924(公開為wo2014/013259),pct/gb2013/051928(公開為wo2014/013262)和pct/gb2014/052736的國(guó)際申請(qǐng)中公開的任何解旋酶,修飾的解旋酶或解旋酶構(gòu)建體。解旋酶優(yōu)選包含seqidno:25(trwccba)或其變體中所示的序列,seqidno:18(he1308mbu)或其變體中所示的序列,或者seqidno:24(dda)或其變體中所示的序列。變體可不同于以下以任何方式討論的跨膜孔的天然序列。seqidno:24的優(yōu)選變體包括(a)e94c和a360c或(b)e94c,a360c,c109a和c136a,然后可選地(δm1)g1g2(即m1缺失,然后添加g1和g2)。在鏈測(cè)序中,多核苷酸順著或逆著施加的電勢(shì)被移位穿過(guò)孔。在雙鏈多核苷酸上逐漸或進(jìn)行性地起作用的核酸外切酶可以用在孔的順式側(cè)以使剩余的單鏈在施加電勢(shì)下通過(guò)或在反式測(cè)在反向電勢(shì)下使其通過(guò)。同樣地,解開雙鏈dna的解旋酶也可以以類似的方式使用。也可以使用聚合酶。對(duì)于測(cè)序應(yīng)用還有可能需要逆著施加的電勢(shì)的鏈移位,但dna必須首先在反向電勢(shì)或無(wú)電勢(shì)的條件下被酶“捕獲”。然后隨著電勢(shì)在結(jié)合后切換回來(lái),鏈將沿順式到反式通過(guò)所述孔并通過(guò)電流保持為擴(kuò)展的構(gòu)象。單鏈dna核酸外切酶或單鏈dna依賴性聚合酶可以作為分子馬達(dá),以將最近移位的的單鏈逆著施加的電勢(shì)按反式到順式以受控的逐步方式穿過(guò)細(xì)孔拉回。任何解旋酶可用于該方法中。解旋酶可以相對(duì)于孔以兩種模式工作。首先,該方法優(yōu)選使用解旋酶進(jìn)行,使得其利用由施加的電壓產(chǎn)生的場(chǎng)使多核苷酸移動(dòng)通過(guò)孔。在該模式下,首先將多核苷酸的5′端捕獲在孔中,然后解旋酶將多核苷酸移動(dòng)到孔中,使得其利用場(chǎng)通過(guò)孔,直到其最終移位到膜的反式側(cè)?;蛘?,優(yōu)選進(jìn)行該方法,使得解旋酶逆著由施加的電壓產(chǎn)生的場(chǎng)將多核苷酸移動(dòng)通過(guò)孔。在該模式中,首先將多核苷酸的3′端捕獲在孔中,然后解旋酶將多核苷酸移動(dòng)通過(guò)孔,使得其逆著施加的場(chǎng)被從孔中拉出,直到最終被驅(qū)逐回膜的順式側(cè)。(一種或多種)解旋酶和(一種或多種)分子制動(dòng)器在優(yōu)選的實(shí)施例中,該方法包括:(i)向所述/每個(gè)多核苷酸提供一個(gè)或多個(gè)解旋酶和連接到所述/每個(gè)多核苷酸的一個(gè)或多個(gè)分子制動(dòng)器;(b)使所述/每個(gè)多核苷酸與跨膜孔接觸并且跨孔施加電勢(shì),使得一個(gè)或多個(gè)解旋酶和一個(gè)或多個(gè)分子制動(dòng)器被聚集在一起,并且兩者都控制所述/每個(gè)多核苷酸的至少一條鏈通過(guò)孔的運(yùn)動(dòng);(c)隨著所述/每個(gè)多核苷酸相對(duì)于孔移動(dòng),獲取一個(gè)或多個(gè)測(cè)量值,其中所述測(cè)量值指示多核苷酸的一個(gè)或多個(gè)特征,從而表征經(jīng)修飾的多核苷酸或模板多核苷酸。這種類型的方法在國(guó)際申請(qǐng)pct/gb2014/052737中有詳細(xì)討論。間隔基如申請(qǐng)?zhí)枮閜ct/gb2014/050175(公開為wo2014/135838)的國(guó)際申請(qǐng)中所述,一個(gè)或多個(gè)解旋酶可以停滯在一個(gè)或多個(gè)間隔基處。在本發(fā)明中可以使用該國(guó)際申請(qǐng)中公開的一個(gè)或多個(gè)解旋酶和一個(gè)或多個(gè)間隔基的任何構(gòu)象。當(dāng)多核苷酸的一部分進(jìn)入孔并沿著由施加的電勢(shì)產(chǎn)生的場(chǎng)移動(dòng)通過(guò)孔時(shí),隨著多核苷酸移動(dòng)通過(guò)孔,一個(gè)或多個(gè)解旋酶通過(guò)孔被移動(dòng)通過(guò)間隔基。這是因?yàn)槎嗪塑账?包括一個(gè)或多個(gè)間隔基)移動(dòng)通過(guò)孔并且一個(gè)或多個(gè)解旋酶保留在孔的頂部。一個(gè)或多個(gè)間隔基優(yōu)選是多核苷酸的一部分,例如它們中斷所述多核苷酸的序列。一個(gè)或多個(gè)間隔基優(yōu)選不是與多核苷酸雜交的一個(gè)或多個(gè)阻斷分子(例如減速帶(speedbump))的一部分。多核苷酸中可以存在任何數(shù)目的間隔基,例如1,2,3,4,5,6,7,8,9,10或更多個(gè)間隔基。多核苷酸中優(yōu)選有兩個(gè),四個(gè)或六個(gè)間隔基。一個(gè)或多個(gè)間隔基優(yōu)選地在y適配器或前導(dǎo)序列中。多核苷酸的不同區(qū)域中可以有一個(gè)或多個(gè)間隔基,例如y適配器和/或發(fā)夾環(huán)適配器中的一個(gè)或多個(gè)間隔基。一個(gè)或多個(gè)間隔基各自提供一個(gè)或多個(gè)解旋器即使在活動(dòng)模式下也不能克服的能量屏障。一個(gè)或多個(gè)間隔基可以通過(guò)減少解旋酶的牽引力(例如通過(guò)從多核苷酸中的核苷酸中去除堿基)或物理阻斷一個(gè)或多個(gè)解旋酶的運(yùn)動(dòng)(例如使用龐大的化學(xué)基團(tuán))來(lái)使一個(gè)或多個(gè)解旋酶停滯。一個(gè)或多個(gè)間隔基可以包含使一個(gè)或多個(gè)解旋酶停滯的任何分子或分子的組合。一個(gè)或多個(gè)間隔基可以包含阻止一個(gè)或多個(gè)解旋酶沿多核苷酸移動(dòng)的任何分子或分子的組合。在不存在跨膜孔和施加的電勢(shì)的情況下,確定一個(gè)或多個(gè)解旋酶是否停滯在一個(gè)或多個(gè)間隔基處是較為容易的。例如,通過(guò)page可以測(cè)量解旋酶移動(dòng)通過(guò)間隔基并置換dna的互補(bǔ)鏈的能力。一個(gè)或多個(gè)間隔基通常包含直鏈分子,例如聚合物。一個(gè)或多個(gè)間隔基通常具有與多核苷酸不同的結(jié)構(gòu)。例如,如果多核苷酸是dna,則一個(gè)或多個(gè)間隔基通常不是dna。特別地,如果多核苷酸是脫氧核糖核酸(dna)或核糖核酸(rna),則一個(gè)或多個(gè)間隔基優(yōu)選包含肽核酸(pna),甘油核酸(gna),蘇糖核酸(tna),鎖定核酸(lna)或具有核苷酸側(cè)鏈的合成聚合物。一個(gè)或多個(gè)間隔基可以包含與多核苷酸方向相反的一個(gè)或多個(gè)核苷酸。例如,當(dāng)多核苷酸處于5′至3′方向時(shí),一個(gè)或多個(gè)間隔基可以包含3′至5′方向的一個(gè)或多個(gè)核苷酸。核苷酸可以是上面討論的任何核苷酸。一個(gè)或多個(gè)解旋酶可被每個(gè)線性分子間隔基停滯(即停滯在間隔基前面)或被停滯在每個(gè)線性分子間隔基上。如果使用直鏈分子間隔基,則多核苷酸優(yōu)選具有與每個(gè)間隔基的末端相鄰的多核苷酸的雙鏈區(qū)域,其中一個(gè)或多個(gè)解旋酶將被移動(dòng)通過(guò)每個(gè)間隔基。如果使用線性分子間隔基,則多核苷酸優(yōu)選在每個(gè)間隔基的與一個(gè)或多個(gè)解旋酶將被移動(dòng)通過(guò)的末端相對(duì)末端設(shè)置有阻斷分子。這可以幫助確保一個(gè)或多個(gè)解旋酶保持停滯在每個(gè)間隔基上。在它/它們?cè)谌芤褐袛U(kuò)散開的情況下,還可以幫助將一個(gè)或多個(gè)解旋酶保持在多核苷酸上。阻斷分子可以是物理上導(dǎo)致一個(gè)或多個(gè)解旋酶停滯的下述任何化學(xué)基團(tuán)。阻斷分子可以是多核苷酸的雙鏈區(qū)域。阻斷分子可以是bna。該方法可能涉及將兩個(gè)或更多個(gè)解旋酶移動(dòng)通過(guò)間隔基。在這種情況下,間隔基的長(zhǎng)度通常被增加,以防止尾部解旋酶在沒(méi)有孔和施加電勢(shì)的情況下推動(dòng)先導(dǎo)解旋酶經(jīng)過(guò)間隔基。如果該方法涉及移動(dòng)兩個(gè)或更多個(gè)解旋酶經(jīng)過(guò)一個(gè)或多個(gè)間隔基,則上述間隔基長(zhǎng)度可以增加至少1.5倍,例如2倍,2.5倍或3倍。例如,如果該方法涉及移動(dòng)兩個(gè)或多個(gè)解旋酶經(jīng)過(guò)一個(gè)或多個(gè)間隔基,則間隔基長(zhǎng)度可以增加1.5倍,2倍,2.5倍或3倍。膜本發(fā)明中使用的孔可以存在于膜中。在本發(fā)明的方法中,多核苷酸通常與膜中的孔接觸。根據(jù)本發(fā)明,可以使用任何膜。合適的膜是本領(lǐng)域公知的。膜優(yōu)選為兩親層。兩親層是由具有親水性和親油性的兩親分子形成的層,例如磷脂。兩親分子可以是合成的或天然存在的。非天然存在的兩親物和形成單層的兩親物是本領(lǐng)域已知的,并且包含例如嵌段共聚物(gonzalez-perez等人,langmuir,2009,25,10447-10450)。嵌段共聚物是兩個(gè)或更多個(gè)單體子單元聚合在一起形成單個(gè)聚合物鏈的聚合材料。嵌段共聚物通常具有由每個(gè)單體子單元貢獻(xiàn)的性質(zhì)。然而,嵌段共聚物可以具有從各個(gè)子單元形成的聚合物不具有的獨(dú)特性質(zhì)。嵌段共聚物可以被改造成使得單體子單元之一是疏水的(即親油的),而其他(一個(gè)或多個(gè))子單元在水性介質(zhì)中是親水的。在這種情況下,嵌段共聚物可以具有兩親性質(zhì)并且可以形成能模擬生物膜的結(jié)構(gòu)。嵌段共聚物可以是二嵌段(由兩個(gè)單體子單元組成),但也可以由多于兩個(gè)的單體子單元構(gòu)成,以形成表現(xiàn)為兩親體的更為復(fù)雜的布置。共聚物可以是三嵌段,四嵌段或五嵌段共聚物。膜優(yōu)選為三嵌段共聚物膜。膜最優(yōu)選是國(guó)際申請(qǐng)pct/gb2013/052766或pct/gb2013/052767中公開的膜之一。兩親性分子可以被化學(xué)修飾或功能化以促進(jìn)多核苷酸的偶聯(lián)。偶聯(lián)所述/每個(gè)經(jīng)修飾的多核苷酸優(yōu)選與包含孔的膜偶聯(lián)。該方法可以包括將所述/每個(gè)多核苷酸偶聯(lián)到包含孔的膜。優(yōu)選使用一個(gè)或多個(gè)錨將多核苷酸與膜偶聯(lián)。多核苷酸可以使用任何已知的方法與膜偶聯(lián)。每個(gè)錨包含與多核苷酸偶聯(lián)(或結(jié)合)的基團(tuán)和與膜偶聯(lián)(或結(jié)合)的基團(tuán)。每個(gè)錨可以與多核苷酸和/或膜共價(jià)偶聯(lián)(或結(jié)合)。優(yōu)選使用y適配器或前導(dǎo)序列和/或發(fā)夾環(huán)將多核苷酸偶聯(lián)到膜上。多核苷酸可以使用任何數(shù)量的錨,例如2,3,4或更多個(gè)錨偶聯(lián)到膜上。例如,多核苷酸可以使用兩個(gè)錨偶聯(lián)到膜上,兩個(gè)錨中的每個(gè)單獨(dú)地既與多核苷酸偶聯(lián)(或結(jié)合)也與膜偶聯(lián)(或結(jié)合)。一個(gè)或多個(gè)錨可以包含一個(gè)或多個(gè)解旋酶和/或一個(gè)或多個(gè)分子制動(dòng)器。如果膜是兩親層,例如共聚物膜或脂雙層,則一個(gè)或多個(gè)錨優(yōu)選包含存在于膜中的多肽錨和/或存在于膜中的疏水性錨。疏水性錨優(yōu)選為脂質(zhì),脂肪酸,固醇,碳納米管,多肽,蛋白質(zhì)或氨基酸,例如膽固醇,棕櫚酸酯或生育酚。在優(yōu)選實(shí)施例中,一個(gè)或多個(gè)錨不是孔。膜的組分,例如兩親分子、共聚物或脂質(zhì),可以被化學(xué)修飾或功能化以形成一個(gè)或多個(gè)錨。以下將更詳細(xì)地討論合適的化學(xué)修飾和將膜的組分功能化的合適方式的示例。任何比例的膜組分可以被功能化,例如至少0.01%,至少0.1%,至少1%,至少10%,至少25%,至少50%或100%。多核苷酸可以被直接偶聯(lián)到膜。用于將多核苷酸偶聯(lián)到膜上的一個(gè)或多個(gè)錨優(yōu)選包含連接體。一個(gè)或多個(gè)錨可以包括一個(gè)或多個(gè),例如2,3,4或更多個(gè)連接體。一個(gè)連接體可用于將多于一個(gè),例如2,3,4或更多個(gè)多核苷酸偶聯(lián)到膜上。優(yōu)選的連接體包括但不限于聚合物,例如多核苷酸,聚乙二醇(peg),多糖和多肽。這些連接體可以是直鏈,支鏈或環(huán)狀的。例如,連接體可以是環(huán)狀多核苷酸。多核苷酸可以與環(huán)狀多核苷酸連接體上的互補(bǔ)序列雜交。在以下討論的測(cè)序?qū)嵤├袃?yōu)選使用連接體。如果多核苷酸直接永久地偶聯(lián)到膜上,在這種意義上,當(dāng)與孔相互作用時(shí)不進(jìn)行解偶聯(lián)(即在步驟(b)或(e))中不進(jìn)行解偶聯(lián)),則某些序列數(shù)據(jù)將丟失,因?yàn)橛捎谀づc孔之間的距離測(cè)序不能繼續(xù)到多核苷酸的末端。如果使用連接體,則多多核苷酸可以進(jìn)行到完成為止。偶聯(lián)可以是永久的或穩(wěn)定的。換句話說(shuō),偶聯(lián)可以是這樣的:當(dāng)多核苷酸與孔相互作用時(shí),多核苷酸保持與膜偶聯(lián)。偶聯(lián)可能是瞬態(tài)的。換句話說(shuō),偶聯(lián)是這樣的:當(dāng)多核苷酸與孔相互作用時(shí),多核苷酸可以與膜解偶聯(lián)。在申請(qǐng)?zhí)枮閜ct/gb12/051191(公開為wo2012/164270)的國(guó)際申請(qǐng)和申請(qǐng)?zhí)枮?406155.0的英國(guó)申請(qǐng)中公開了合適的偶聯(lián)方法。解偶聯(lián)本發(fā)明的方法可以包括表征多個(gè)修飾的雙鏈多核苷酸和解偶聯(lián)至少第一修飾的雙鏈多核苷酸。在優(yōu)選的實(shí)施方案中,本發(fā)明涉及表征兩個(gè)或更多個(gè)修飾的雙鏈多核苷酸。該方法包括:(a)在第一樣品中提供第一經(jīng)修飾的雙鏈多核苷酸;(b)在第二樣品中提供第二經(jīng)修飾的雙鏈多核苷酸;(c)使用一個(gè)或更多錨將第一樣品中的第一多核苷酸與膜偶聯(lián);(d)使第一多核苷酸與跨膜孔接觸,使得第一多核苷酸的至少一條鏈移動(dòng)穿過(guò)孔;(e)隨著第一多核苷酸相對(duì)于孔移動(dòng)獲取一個(gè)或多個(gè)測(cè)量值,其中所述測(cè)量值指示第一多核苷酸的一個(gè)或多個(gè)特征,從而表征第一個(gè)多核苷酸;(f)將第一個(gè)多核苷酸從膜上解偶聯(lián);(g)使用一個(gè)或多個(gè)錨將第二樣品中的第二多核苷酸偶聯(lián)到膜上;(h)使第二多核苷酸與孔接觸,使得第二多核苷酸的至少一條鏈移動(dòng)穿過(guò)孔;和(i)隨著第二多核苷酸相對(duì)于孔移動(dòng)而獲取一個(gè)或多個(gè)測(cè)量值,其中所述測(cè)量值指示第二多核苷酸的一個(gè)或多個(gè)特征,從而表征第二多核苷酸。這種類型的方法在申請(qǐng)?zhí)枮?406155.0的英國(guó)申請(qǐng)中有詳細(xì)討論。其他表征方法在另一個(gè)實(shí)施例中,所述/每個(gè)經(jīng)修飾的雙鏈多核苷酸通過(guò)下述進(jìn)行表征:檢測(cè)當(dāng)聚合酶將核苷酸并入多核苷酸中時(shí)釋放的標(biāo)記物種。聚合酶使用多核苷酸作為模板。每個(gè)標(biāo)記物種對(duì)于每個(gè)核苷酸是特異性的。所述/每個(gè)多核苷酸與跨膜孔、聚合酶和標(biāo)記的核苷酸接觸,使得當(dāng)通過(guò)聚合酶將核苷酸加入到多核苷酸時(shí),磷酸鹽標(biāo)記的物種依次釋放,其中磷酸鹽物種含有對(duì)每個(gè)核苷酸特異的標(biāo)記。聚合酶可以是上面討論的任何聚合酶。使用孔檢測(cè)磷酸鹽標(biāo)記的物種,從而表征多核苷酸。這種方法在申請(qǐng)?zhí)枮?3187149.3(公布為ep2682460)的歐洲申請(qǐng)中公開。以上討論的任何實(shí)施例同樣適用于該方法。試劑盒本發(fā)明還提供了用于修飾模板多核苷酸的試劑盒。試劑盒包含(a)本發(fā)明的mua底物群和(b)mua轉(zhuǎn)座酶以及(c)聚合酶。上文參照本發(fā)明的方法和產(chǎn)品討論的任何實(shí)施方案同樣適用于試劑盒。試劑盒還可以包含膜的組分,例如兩親層或脂質(zhì)雙層的組分。試劑盒還可以包含跨膜孔或跨膜孔的組分。試劑盒還可以包含多核苷酸結(jié)合蛋白。上面討論了合適的膜、孔和多核苷酸結(jié)合蛋白。本發(fā)明的試劑盒可以另外包含一種或多種使上述任何實(shí)施例能夠進(jìn)行的其它試劑或儀器。這樣的試劑或儀器包括以下一種或多種:合適的緩沖液(一種或多種)(水性溶液),從受試者獲得樣品的設(shè)備(例如容器或包含針的儀器),用于擴(kuò)增和/或表達(dá)多核苷酸的設(shè)備,如上所定義的膜,或者電壓或膜片鉗裝置。試劑可能以干燥狀態(tài)存在于試劑盒中,使得流體樣品使該試劑重懸。試劑盒還可以任選地包括使試劑盒能夠用于本發(fā)明方法或關(guān)于該方法可用于哪些患者的細(xì)節(jié)的說(shuō)明。試劑盒可以任選地包含核苷酸。以下實(shí)施例說(shuō)明了本發(fā)明。實(shí)施例1該實(shí)施例描述了用于修飾模板雙鏈多核苷酸的方法,特別是使用納米孔測(cè)序進(jìn)行表征的方法。該實(shí)施例示出了mua轉(zhuǎn)座酶能夠含有發(fā)夾環(huán)的mua底物插入。然后使用聚合酶填充構(gòu)建體中的間隙,然后加熱雙鏈構(gòu)建體以熔化雙鏈dna。這得到具有發(fā)夾的單鏈dna,聚合酶從該發(fā)夾產(chǎn)生互補(bǔ)體。然后將該構(gòu)建體連接到具有預(yù)結(jié)合的酶的適配器,并最終與系鏈雜交。然后,該dna構(gòu)建體顯示出,解旋酶控制dna運(yùn)動(dòng)通過(guò)納米孔。材料和方法1.1-使用mua轉(zhuǎn)座酶將dna模板片段化在該實(shí)施例中使用的mua適配器x具有5′21bp發(fā)夾(在圖2中適配器標(biāo)記為c,上鏈=seqidno:29,下鏈=seqidno:30,下鏈的5′端連接到序列g(shù)atcu的3′端)。適配器的上鏈和下鏈在10um下,從95℃,以2℃min-1,在10mmtrisph7.5,50mmnacl中退火。mua片段化反應(yīng)(10μl)如下表1中所述進(jìn)行設(shè)置,并在30℃溫育1小時(shí)。然后通過(guò)在75℃加熱15分鐘將mua酶進(jìn)行熱滅活。最后將得到的dna進(jìn)行1.5×spri純化并在無(wú)核酸酶的水(42ul,樣品1)中洗脫。表11.2-用dna聚合酶培育dna模板在mua片段化過(guò)程之后,然后將純化的dna用dna聚合酶培育以復(fù)制上鏈發(fā)夾。dna聚合酶反應(yīng)(50ul)如下表2所述設(shè)置,并在68℃下培育10分鐘。最后,將所得的dna進(jìn)行1.5×spri純化并在無(wú)核酸酶的水(42ul,樣品2)中洗脫。表21.3-熱變性和聚合酶填充在發(fā)夾復(fù)制階段后,將樣品2處理,以進(jìn)行單一變性步驟和聚合酶填充。對(duì)于聚合酶填充反應(yīng),對(duì)聚合酶提供有dctp/dgtp/datp,但用不同的核苷酸種類5-丙炔基-du代替標(biāo)準(zhǔn)dttp。反應(yīng)(50μ)如下表3所述進(jìn)行設(shè)置,并在95℃培育2分鐘,55℃培育30秒,68℃培育30分鐘。最后,將所得dna進(jìn)行1.5×spri純化并在無(wú)核酸酶的水(45μl,樣品3)中洗脫。表31.4-da拖尾反應(yīng)然后將樣品3如下表4所述進(jìn)行da拖尾,并在37℃下培育30分鐘。將所得dna進(jìn)行1.5×spri純化并在無(wú)核酸酶的水(20ul,樣品4)中洗脫。試劑組分樣品342μl10xnebda-拖尾緩沖液5μlklenowexo-3μl表41.5-用預(yù)加載的酶連接適配器然后將樣品4用預(yù)加載的酶(t4dda-e94c/a360c/c109a/c136a(具有突變e94c/a360c/c114a/c171a/c421d以及(δm1)g1g2)的seqidno:24)連接到y(tǒng)適配器1(上鏈=在3′端連接到seqidno:32的20個(gè)ispc3間隔基,seqidno:32的3′端連接到4個(gè)isp18間隔基,isp18間隔基3′端連接到seqidno:33,底部鏈=連接有5’磷酸鹽的seqidno:34),如下表5所述,并在室溫下培育20分鐘。將所得的dna進(jìn)行0.4×spri純化,并用緩沖液(200μl的750mmnacl,10%peg8000,50mmtris.hclph8)洗滌,并在緩沖液(20ul的40mmcapsph10,40mmkc1樣品5)中洗脫。試劑組分樣品420uly-適配器15μlnebblunttamm(2x)25μl表51.6-系鏈的退火然后將存在于樣品5中的dna分析物退火至系鏈。將樣品5用dna系鏈(aacaacct序列其5′端連接到三個(gè)isp18間隔基,兩個(gè)胸腺嘧啶和5′膽固醇teg,并且序列aacaacct其3′端連接到三個(gè)3′端連接到seqidno:35的isp18間隔基),500nm,5μl)在室溫下培育10分鐘。所得樣品稱為樣品6。1.7-電生理檢測(cè)在設(shè)置實(shí)驗(yàn)之前,將dna樣品6(樣品6的總體積的四分之一)加入到緩沖液(25mm磷酸鉀緩沖液(ph7.5),500mmkc1),mgcl2(1mm)和atp(2mm),所得總體積為150μl。在緩沖液(25mmk磷酸鹽緩沖液,150mm亞鐵氰化鉀(ii))和150mm鐵氰化鉀(iii),ph8.0)中從插入嵌段共聚物中的單個(gè)mspa納米孔獲得電測(cè)量值。在實(shí)現(xiàn)單孔插入嵌段共聚物中之后,將緩沖液(2ml,25mmk磷酸鹽緩沖液,150mm亞鐵氰化鉀(ii),150mm鐵氰化鉀(iii),ph8.0)流過(guò)系統(tǒng)以去除任何過(guò)量mspa納米孔。然后將酶(t4dda-e94c/c109a/c136a/a360c,10nm最終濃度),dna樣品6和燃料(mgcl22m最終濃度,atp2mm最終濃度)預(yù)混合物(總共150μl)流入單納米孔實(shí)驗(yàn)系統(tǒng)中。實(shí)驗(yàn)在120mv下進(jìn)行,并且監(jiān)測(cè)解旋酶控制的dna運(yùn)動(dòng)6小時(shí)。結(jié)果觀察到,樣品制備過(guò)程(樣品6)結(jié)束時(shí)產(chǎn)生的dna的解旋酶控制的dna運(yùn)動(dòng)。圖3顯示了解旋酶控制dna運(yùn)動(dòng)的示例。還使用agilent12,000dna芯片跡線分析樣品制備過(guò)程。如果沒(méi)有在68℃下的預(yù)培育,則在步驟1.2(其中5′發(fā)夾被轉(zhuǎn)錄)之前,隨后在鏈離解(熱變性步驟1.3)之后,沒(méi)有制得合成的互補(bǔ)體(在圖2的步驟4之后以虛線/點(diǎn)線示出),因?yàn)殒溔鄙倬酆厦敢l(fā)所必需的3′發(fā)夾。這在圖4所示的agilent12,000dna芯片跡線中被觀察到,其中標(biāo)記為1的線是未處理的mua片段化的dna輸入材料,標(biāo)記為2的線是具有68℃培育步驟(在以上的1.2中)且隨后經(jīng)歷了所有1.3步驟的分析物,并且標(biāo)記為3的線在步驟1.2中沒(méi)有68℃培育,但經(jīng)歷了所有1.3步驟。因此,對(duì)于線3,沒(méi)有制得dsdna,因此在agilent跡線上觀察到平坦的線(區(qū)域標(biāo)記為x),因?yàn)樵?5℃下鏈離解之前沒(méi)有被復(fù)制的發(fā)夾。然而,對(duì)于線2,發(fā)夾被轉(zhuǎn)錄并且因此在鏈離解時(shí),聚合酶從新的3′發(fā)夾引發(fā)填充。這意味著線2示出了在區(qū)域x中的峰,其對(duì)應(yīng)于由復(fù)制的發(fā)夾制成的dsdna產(chǎn)物。然而,如上所述,在步驟1.3中重復(fù)上述過(guò)程,向聚合酶提供標(biāo)準(zhǔn)dnadntp′s-dctp/datp/dgtp/dttp,而不是產(chǎn)生dna樣品7的5-丙炔基-du。圖6示出了dna樣品7(其在步驟1.3中使用標(biāo)準(zhǔn)dnadntp′s制備)的示例性的解旋酶控制的dna移動(dòng)。該樣品制備過(guò)程是成功的,并且觀察到該樣品的解旋酶控制的dna運(yùn)動(dòng)。實(shí)施例2該實(shí)施例描述了用于修飾模板雙鏈多核苷酸的方法,特別是使用納米孔測(cè)序進(jìn)行表征的方法。圖7示出了下面步驟2.1和2.2中描述的樣品制備步驟的卡通表示。該實(shí)施例示出了mua轉(zhuǎn)座酶能夠?qū)⒑邪l(fā)夾環(huán)(該發(fā)夾環(huán)含有dg和dc的類似物)的mua底物插入mua適配器的發(fā)夾環(huán)(dg被脫氧肌苷取代并且dc被脫氧zebularine取代)。然后使用聚合酶填充構(gòu)建體中的間隙,所述聚合酶用與包含發(fā)夾環(huán)的鏈互補(bǔ)的新鏈取代突出鏈。與包含發(fā)夾環(huán)的鏈互補(bǔ)的新鏈也能夠形成發(fā)夾環(huán)。新鏈的發(fā)夾環(huán)具有比雙鏈區(qū)更高的tm,該雙鏈區(qū)在互補(bǔ)鏈和由a/t/z/i(在圖7中標(biāo)記為1x)制成的發(fā)夾環(huán)之間形成。因此,形成了新鏈中的發(fā)夾(圖7中標(biāo)記為f2h)并且也形成了由a/t/z/i制成的發(fā)夾環(huán)(在圖7中標(biāo)記為f1h)。然后聚合酶將發(fā)夾環(huán)用作引物以制備互補(bǔ)鏈。因此,不需要額外的加熱步驟來(lái)分離在圖7的步驟2之后產(chǎn)生的dsdna構(gòu)建體。2.1-使用mua轉(zhuǎn)座酶片段化dna模板在該實(shí)施例中使用的mua適配器具有5′7bp發(fā)夾,dg被替換為dinosine,dc被替換為dzebularine。適配器p的上鏈(經(jīng)修飾的多核苷酸序列izitaz(其中i是脫氧肌苷,z是脫氧zebularrine)被連接到未經(jīng)修飾的多核苷酸序列ttttta的5′端,ttttta的3′端與連接到seqidno:39的5′端的經(jīng)修飾的多核苷酸序列itaziz(其中i是脫氧肌苷,z是脫氧zebularine)連接)和下鏈(seqidno:38)在10um,95℃,以2℃min-1,在10mmtrisph7.5,50mmnacl中退火。如上表1所述,mua片段化反應(yīng)(10μl)使用適配器p而不是適配器x設(shè)置,并在30℃下培育1小時(shí)。然后通過(guò)在75℃加熱15分鐘將mua酶進(jìn)行熱滅活。最后,將所得的dna進(jìn)行1.5×spri純化并在無(wú)核酸酶的水(42μl)中洗脫。2.2-用dna聚合酶培育dna模板在mua片段化過(guò)程之后,將純化的dna用dna聚合酶培育以復(fù)制上鏈發(fā)夾(其g/c用i/z替換)。在此步驟期間,與包含發(fā)夾環(huán)的鏈互補(bǔ)的新鏈形成發(fā)夾環(huán)。這是由于由新鏈形成的發(fā)夾環(huán)比在互補(bǔ)鏈和含有dz和di的類似物的發(fā)夾環(huán)之間形成的雙鏈區(qū)具有更高的tm。因此,不需要加熱雙鏈dna,來(lái)將其分離成ssdna,因?yàn)榫哂休^高tm的發(fā)夾環(huán)優(yōu)先形成,然后聚合酶使用該發(fā)夾環(huán)作為引物來(lái)制得互補(bǔ)鏈。dna聚合酶反應(yīng)(50ul)如下表所述設(shè)置,并在37℃培育30分鐘。最后,將所得的dna進(jìn)行1.5×spri純化并在無(wú)核酸酶的水(42ul)中洗脫。表6該鏈可以通過(guò)da拖尾進(jìn)一步修飾,將適配器與預(yù)加載的酶連接并與系鏈雜交(如實(shí)施例1.4-1.6中所述),從而產(chǎn)生可以使用納米孔系統(tǒng)表征的鏈(如實(shí)施例1.7中所述)。序列表<110>牛津納米孔技術(shù)公司<120>方法<130>n404112wo<140>gb1418159.8<141>2014-10-14<160>37<170>patentinversion3.5<210>1<211>558<212>dna<213>人工序列<220><223>恥垢分枝桿菌(mycobacteriumsmegmatis)孔蛋白a突變體(d90n/d91n/d93n/d118r/d134r/e193k)<400>1atgggtctggataatgaactgagcctggtggacggtcaagatcgtaccctgacggtgcaa60caatgggatacctttctgaatggcgtttttccgctggatcgtaatcgcctgacccgtgaa120tggtttcattccggtcgcgcaaaatatatcgtcgcaggcccgggtgctgacgaattcgaa180ggcacgctggaactgggttatcagattggctttccgtggtcactgggcgttggtatcaac240ttctcgtacaccacgccgaatattctgatcaacaatggtaacattaccgcaccgccgttt300ggcctgaacagcgtgattacgccgaacctgtttccgggtgttagcatctctgcccgtctg360ggcaatggtccgggcattcaagaagtggcaacctttagtgtgcgcgtttccggcgctaaa420ggcggtgtcgcggtgtctaacgcccacggtaccgttacgggcgcggccggcggtgtcctg480ctgcgtccgttcgcgcgcctgattgcctctaccggcgacagcgttacgacctatggcgaa540ccgtggaatatgaactaa558<210>2<211>184<212>prt<213>人工序列<220><223>恥垢分枝桿菌孔蛋白a突變體(d90n/d91n/d93n/d118r/d134r/e139k)<400>2glyleuaspasngluleuserleuvalaspglyglnaspargthrleu151015thrvalglnglntrpaspthrpheleuasnglyvalpheproleuasp202530argasnargleuthrargglutrpphehisserglyargalalystyr354045ilevalalaglyproglyalaaspgluphegluglythrleugluleu505560glytyrglnileglypheprotrpserleuglyvalglyileasnphe65707580sertyrthrthrproasnileleuileasnasnglyasnilethrala859095propropheglyleuasnservalilethrproasnleupheprogly100105110valserileseralaargleuglyasnglyproglyileglngluval115120125alathrpheservalargvalserglyalalysglyglyvalalaval130135140serasnalahisglythrvalthrglyalaalaglyglyvalleuleu145150155160argprophealaargleuilealaserthrglyaspservalthrthr165170175tyrglygluprotrpasnmetasn180<210>3<211>885<212>dna<213>人工序列<220><223>α-溶血素突變體(e111n/k147n)<400>3atggcagattctgatattaatattaaaaccggtactacagatattggaagcaatactaca60gtaaaaacaggtgatttagtcacttatgataaagaaaatggcatgcacaaaaaagtattt120tatagttttatcgatgataaaaatcacaataaaaaactgctagttattagaacaaaaggt180accattgctggtcaatatagagtttatagcgaagaaggtgctaacaaaagtggtttagcc240tggccttcagcctttaaggtacagttgcaactacctgataatgaagtagctcaaatatct300gattactatccaagaaattcgattgatacaaaaaactatatgagtactttaacttatgga360ttcaacggtaatgttactggtgatgatacaggaaaaattggcggccttattggtgcaaat420gtttcgattggtcatacactgaactatgttcaacctgatttcaaaacaattttagagagc480ccaactgataaaaaagtaggctggaaagtgatatttaacaatatggtgaatcaaaattgg540ggaccatacgatcgagattcttggaacccggtatatggcaatcaacttttcatgaaaact600agaaatggttctatgaaagcagcagataacttccttgatcctaacaaagcaagttctcta660ttatcttcagggttttcaccagacttcgctacagttattactatggatagaaaagcatcc720aaacaacaaacaaatatagatgtaatatacgaacgagttcgtgatgattaccaattgcat780tggacttcaacaaattggaaaggtaccaatactaaagataaatggacagatcgttcttca840gaaagatataaaatcgattgggaaaaagaagaaatgacaaattaa885<210>4<211>293<212>prt<213>人工序列<220><223>α-溶血素突變體(e111n/k147n)<400>4alaaspseraspileasnilelysthrglythrthraspileglyser151015asnthrthrvallysthrglyaspleuvalthrtyrasplysgluasn202530glymethislyslysvalphetyrserpheileaspasplysasnhis354045asnlyslysleuleuvalileargthrlysglythrilealaglygln505560tyrargvaltyrserglugluglyalaasnlysserglyleualatrp65707580proseralaphelysvalglnleuglnleuproaspasngluvalala859095glnileserasptyrtyrproargasnserileaspthrlysasntyr100105110metserthrleuthrtyrglypheasnglyasnvalthrglyaspasp115120125thrglylysileglyglyleuileglyalaasnvalserileglyhis130135140thrleuasntyrvalglnproaspphelysthrileleugluserpro145150155160thrasplyslysvalglytrplysvalilepheasnasnmetvalasn165170175glnasntrpglyprotyraspargaspsertrpasnprovaltyrgly180185190asnglnleuphemetlysthrargasnglysermetlysalaalaasp195200205asnpheleuaspproasnlysalaserserleuleuserserglyphe210215220serproaspphealathrvalilethrmetasparglysalaserlys225230235240glnglnthrasnileaspvaliletyrgluargvalargaspasptyr245250255glnleuhistrpthrserthrasntrplysglythrasnthrlysasp260265270lystrpthraspargsersergluargtyrlysileasptrpglulys275280285gluglumetthrasn290<210>5<211>184<212>prt<213>恥垢分枝桿菌<400>5glyleuaspasngluleuserleuvalaspglyglnaspargthrleu151015thrvalglnglntrpaspthrpheleuasnglyvalpheproleuasp202530argasnargleuthrargglutrpphehisserglyargalalystyr354045ilevalalaglyproglyalaaspgluphegluglythrleugluleu505560glytyrglnileglypheprotrpserleuglyvalglyileasnphe65707580sertyrthrthrproasnileleuileaspaspglyaspilethrala859095propropheglyleuasnservalilethrproasnleupheprogly100105110valserileseralaaspleuglyasnglyproglyileglngluval115120125alathrpheservalaspvalserglyproalaglyglyvalalaval130135140serasnalahisglythrvalthrglyalaalaglyglyvalleuleu145150155160argprophealaargleuilealaserthrglyaspservalthrthr165170175tyrglygluprotrpasnmetasn180<210>6<211>184<212>prt<213>恥垢分枝桿菌<400>6glyleuaspasngluleuserleuvalaspglyglnaspargthrleu151015thrvalglnglntrpaspthrpheleuasnglyvalpheproleuasp202530argasnargleuthrargglutrpphehisserglyargalalystyr354045ilevalalaglyproglyalaaspgluphegluglythrleugluleu505560glytyrglnileglypheprotrpserleuglyvalglyileasnphe65707580sertyrthrthrproasnileleuileaspaspglyaspilethrgly859095propropheglyleugluservalilethrproasnleupheprogly100105110valserileseralaaspleuglyasnglyproglyileglngluval115120125alathrpheservalaspvalserglyproalaglyglyvalalaval130135140serasnalahisglythrvalthrglyalaalaglyglyvalleuleu145150155160argprophealaargleuilealaserthrglyaspservalthrthr165170175tyrglygluprotrpasnmetasn180<210>7<211>183<212>prt<213>恥垢分枝桿菌<400>7valaspasnglnleuservalvalaspglyglnglyargthrleuthr151015valglnglnalagluthrpheleuasnglyvalpheproleuasparg202530asnargleuthrargglutrpphehisserglyargalathrtyrhis354045valalaglyproglyalaaspgluphegluglythrleugluleugly505560tyrglnvalglypheprotrpserleuglyvalglyileasnpheser65707580tyrthrthrproasnileleuileaspglyglyaspilethrglnpro859095propheglyleuaspthrileilethrproasnleupheproglyval100105110serileseralaaspleuglyasnglyproglyileglngluvalala115120125thrpheservalaspvallysglyalalysglyalavalalavalser130135140asnalahisglythrvalthrglyalaalaglyglyvalleuleuarg145150155160prophealaargleuilealaserthrglyaspservalthrthrtyr165170175glygluprotrpasnmetasn180<210>8<211>1830<212>dna<213>枯草芽孢桿菌噬菌體(bacillussubtilisphage)phi29<400>8atgaaacacatgccgcgtaaaatgtatagctgcgcgtttgaaaccacgaccaaagtggaa60gattgtcgcgtttgggcctatggctacatgaacatcgaagatcattctgaatacaaaatc120ggtaacagtctggatgaatttatggcatgggtgctgaaagttcaggcggatctgtacttc180cacaacctgaaatttgatggcgcattcattatcaactggctggaacgtaatggctttaaa240tggagcgcggatggtctgccgaacacgtataataccattatctctcgtatgggccagtgg300tatatgattgatatctgcctgggctacaaaggtaaacgcaaaattcataccgtgatctat360gatagcctgaaaaaactgccgtttccggtgaagaaaattgcgaaagatttcaaactgacg420gttctgaaaggcgatattgattatcacaaagaacgtccggttggttacaaaatcaccccg480gaagaatacgcatacatcaaaaacgatatccagatcatcgcagaagcgctgctgattcag540tttaaacagggcctggatcgcatgaccgcgggcagtgatagcctgaaaggtttcaaagat600atcatcacgaccaaaaaattcaaaaaagtgttcccgacgctgagcctgggtctggataaa660gaagttcgttatgcctaccgcggcggttttacctggctgaacgatcgtttcaaagaaaaa720gaaattggcgagggtatggtgtttgatgttaatagtctgtatccggcacagatgtacagc780cgcctgctgccgtatggcgaaccgatcgtgttcgagggtaaatatgtttgggatgaagat840tacccgctgcatattcagcacatccgttgtgaatttgaactgaaagaaggctatattccg900accattcagatcaaacgtagtcgcttctataagggtaacgaatacctgaaaagctctggc960ggtgaaatcgcggatctgtggctgagtaacgtggatctggaactgatgaaagaacactac1020gatctgtacaacgttgaatacatcagcggcctgaaatttaaagccacgaccggtctgttc1080aaagatttcatcgataaatggacctacatcaaaacgacctctgaaggcgcgattaaacag1140ctggccaaactgatgctgaacagcctgtatggcaaattcgcctctaatccggatgtgacc1200ggtaaagttccgtacctgaaagaaaatggcgcactgggttttcgcctgggcgaagaagaa1260acgaaagatccggtgtataccccgatgggtgttttcattacggcctgggcacgttacacg1320accatcaccgcggcccaggcatgctatgatcgcattatctactgtgataccgattctatt1380catctgacgggcaccgaaatcccggatgtgattaaagatatcgttgatccgaaaaaactg1440ggttattgggcccacgaaagtacgtttaaacgtgcaaaatacctgcgccagaaaacctac1500atccaggatatctacatgaaagaagtggatggcaaactggttgaaggttctccggatgat1560tacaccgatatcaaattcagtgtgaaatgcgccggcatgacggataaaatcaaaaaagaa1620gtgaccttcgaaaacttcaaagttggtttcagccgcaaaatgaaaccgaaaccggtgcag1680gttccgggcggtgtggttctggtggatgatacgtttaccattaaatctggcggtagtgcg1740tggagccatccgcagttcgaaaaaggcggtggctctggtggcggttctggcggtagtgcc1800tggagccacccgcagtttgaaaaataataa1830<210>9<211>608<212>prt<213>枯草芽孢桿菌噬菌體phi29<400>9metlyshismetproarglysmettyrsercysalaphegluthrthr151015thrlysvalgluaspcysargvaltrpalatyrglytyrmetasnile202530gluasphisserglutyrlysileglyasnserleuaspgluphemet354045alatrpvalleulysvalglnalaaspleutyrphehisasnleulys505560pheaspglyalapheileileasntrpleugluargasnglyphelys65707580trpseralaaspglyleuproasnthrtyrasnthrileileserarg859095metglyglntrptyrmetileaspilecysleuglytyrlysglylys100105110arglysilehisthrvaliletyraspserleulyslysleuprophe115120125provallyslysilealalysaspphelysleuthrvalleulysgly130135140aspileasptyrhislysgluargprovalglytyrlysilethrpro145150155160gluglutyralatyrilelysasnaspileglnileilealagluala165170175leuleuileglnphelysglnglyleuaspargmetthralaglyser180185190aspserleulysglyphelysaspileilethrthrlyslysphelys195200205lysvalpheprothrleuserleuglyleuasplysgluvalargtyr210215220alatyrargglyglyphethrtrpleuasnaspargphelysglulys225230235240gluileglygluglymetvalpheaspvalasnserleutyrproala245250255glnmettyrserargleuleuprotyrglygluproilevalpheglu260265270glylystyrvaltrpaspgluasptyrproleuhisileglnhisile275280285argcysgluphegluleulysgluglytyrileprothrileglnile290295300lysargserargphetyrlysglyasnglutyrleulyssersergly305310315320glygluilealaaspleutrpleuserasnvalaspleugluleumet325330335lysgluhistyraspleutyrasnvalglutyrileserglyleulys340345350phelysalathrthrglyleuphelysasppheileasplystrpthr355360365tyrilelysthrthrsergluglyalailelysglnleualalysleu370375380metleuasnserleutyrglylysphealaserasnproaspvalthr385390395400glylysvalprotyrleulysgluasnglyalaleuglypheargleu405410415glygluglugluthrlysaspprovaltyrthrprometglyvalphe420425430ilethralatrpalaargtyrthrthrilethralaalaglnalacys435440445tyraspargileiletyrcysaspthraspserilehisleuthrgly450455460thrgluileproaspvalilelysaspilevalaspprolyslysleu465470475480glytyrtrpalahisgluserthrphelysargalalystyrleuarg485490495glnlysthrtyrileglnaspiletyrmetlysgluvalaspglylys500505510leuvalgluglyserproaspasptyrthraspilelyspheserval515520525lyscysalaglymetthrasplysilelyslysgluvalthrpheglu530535540asnphelysvalglypheserarglysmetlysprolysprovalgln545550555560valproglyglyvalvalleuvalaspaspthrphethrilelysser565570575glyglyseralatrpserhisproglnpheglulysglyglyglyser580585590glyglyglyserglyglyseralatrpserhisproglnpheglulys595600605<210>10<211>1390<212>dna<213>大腸桿菌(escherichiacoli)<400>10atgatgaacgatggcaaacagcagagcaccttcctgtttcatgattatgaaaccttcggt60acccatccggccctggatcgtccggcgcagtttgcggccattcgcaccgatagcgaattc120aatgtgattggcgaaccggaagtgttttattgcaaaccggccgatgattatctgccgcag180ccgggtgcggtgctgattaccggtattaccccgcaggaagcgcgcgcgaaaggtgaaaac240gaagcggcgtttgccgcgcgcattcatagcctgtttaccgtgccgaaaacctgcattctg300ggctataacaatgtgcgcttcgatgatgaagttacccgtaatatcttttatcgtaacttt360tatgatccgtatgcgtggagctggcagcatgataacagccgttgggatctgctggatgtg420atgcgcgcgtgctatgcgctgcgcccggaaggcattaattggccggaaaacgatgatggc480ctgccgagctttcgtctggaacatctgaccaaagccaacggcattgaacatagcaatgcc540catgatgcgatggccgatgtttatgcgaccattgcgatggcgaaactggttaaaacccgt600cagccgcgcctgtttgattatctgtttacccaccgtaacaaacacaaactgatggcgctg660attgatgttccgcagatgaaaccgctggtgcatgtgagcggcatgtttggcgcctggcgc720ggcaacaccagctgggtggccccgctggcctggcacccggaaaatcgtaacgccgtgatt780atggttgatctggccggtgatattagcccgctgctggaactggatagcgataccctgcgt840gaacgcctgtataccgccaaaaccgatctgggcgataatgccgccgtgccggtgaaactg900gttcacattaacaaatgcccggtgctggcccaggcgaacaccctgcgcccggaagatgcg960gatcgtctgggtattaatcgccagcattgtctggataatctgaaaatcctgcgtgaaaac1020ccgcaggtgcgtgaaaaagtggtggcgatcttcgcggaagcggaaccgttcaccccgagc1080gataacgtggatgcgcagctgtataacggcttctttagcgatgccgatcgcgcggcgatg1140aaaatcgttctggaaaccgaaccgcgcaatctgccggcgctggatattacctttgttgat1200aaacgtattgaaaaactgctgtttaattatcgtgcgcgcaattttccgggtaccctggat1260tatgccgaacagcagcgttggctggaacatcgtcgtcaggttttcaccccggaatttctg1320cagggttatgcggatgaactgcagatgctggttcagcagtatgccgatgataaagaaaaa1380gtggcgctgc1390<210>11<211>485<212>prt<213>大腸桿菌<400>11metmetasnaspglylysglnglnserthrpheleuphehisasptyr151015gluthrpheglythrhisproalaleuaspargproalaglnpheala202530alaileargthraspserglupheasnvalileglygluprogluval354045phetyrcyslysproalaaspasptyrleuproglnproglyalaval505560leuilethrglyilethrproglnglualaargalalysglygluasn65707580glualaalaphealaalaargilehisserleuphethrvalprolys859095thrcysileleuglytyrasnasnvalargpheaspaspgluvalthr100105110argasnilephetyrargasnphetyraspprotyralatrpsertrp115120125glnhisaspasnserargtrpaspleuleuaspvalmetargalacys130135140tyralaleuargprogluglyileasntrpprogluasnaspaspgly145150155160leuproserpheargleugluhisleuthrlysalaasnglyileglu165170175hisserasnalahisaspalametalaaspvaltyralathrileala180185190metalalysleuvallysthrargglnproargleupheasptyrleu195200205phethrhisargasnlyshislysleumetalaleuileaspvalpro210215220glnmetlysproleuvalhisvalserglymetpheglyalatrparg225230235240glyasnthrsertrpvalalaproleualatrphisprogluasnarg245250255asnalavalilemetvalaspleualaglyaspileserproleuleu260265270gluleuaspseraspthrleuarggluargleutyrthralalysthr275280285aspleuglyaspasnalaalavalprovallysleuvalhisileasn290295300lyscysprovalleualaglnalaasnthrleuargprogluaspala305310315320aspargleuglyileasnargglnhiscysleuaspasnleulysile325330335leuarggluasnproglnvalargglulysvalvalalailepheala340345350glualagluprophethrproseraspasnvalaspalaglnleutyr355360365asnglyphepheseraspalaaspargalaalametlysilevalleu370375380gluthrgluproargasnleuproalaleuaspilethrphevalasp385390395400lysargileglulysleuleupheasntyrargalaargasnphepro405410415glythrleuasptyralagluglnglnargtrpleugluhisargarg420425430glnvalphethrproglupheleuglnglytyralaaspgluleugln435440445metleuvalglnglntyralaaspasplysglulysvalalaleuleu450455460lysalaleutrpglntyralaglugluilevalserglyserglyhis465470475480hishishishishis485<210>12<211>804<212>dna<213>大腸桿菌<400>12atgaaatttgtctcttttaatatcaacggcctgcgcgccagacctcaccagcttgaagcc60atcgtcgaaaagcaccaaccggatgtgattggcctgcaggagacaaaagttcatgacgat120atgtttccgctcgaagaggtggcgaagctcggctacaacgtgttttatcacgggcagaaa180ggccattatggcgtggcgctgctgaccaaagagacgccgattgccgtgcgtcgcggcttt240cccggtgacgacgaagaggcgcagcggcggattattatggcggaaatcccctcactgctg300ggtaatgtcaccgtgatcaacggttacttcccgcagggtgaaagccgcgaccatccgata360aaattcccggcaaaagcgcagttttatcagaatctgcaaaactacctggaaaccgaactc420aaacgtgataatccggtactgattatgggcgatatgaatatcagccctacagatctggat480atcggcattggcgaagaaaaccgtaagcgctggctgcgtaccggtaaatgctctttcctg540ccggaagagcgcgaatggatggacaggctgatgagctgggggttggtcgataccttccgc600catgcgaatccgcaaacagcagatcgtttctcatggtttgattaccgctcaaaaggtttt660gacgataaccgtggtctgcgcatcgacctgctgctcgccagccaaccgctggcagaatgt720tgcgtagaaaccggcatcgactatgaaatccgcagcatggaaaaaccgtccgatcacgcc780cccgtctgggcgaccttccgccgc804<210>13<211>268<212>prt<213>大腸桿菌<400>13metlysphevalserpheasnileasnglyleuargalaargprohis151015glnleuglualailevalglulyshisglnproaspvalileglyleu202530glngluthrlysvalhisaspaspmetpheproleuglugluvalala354045lysleuglytyrasnvalphetyrhisglyglnlysglyhistyrgly505560valalaleuleuthrlysgluthrproilealavalargargglyphe65707580proglyaspaspgluglualaglnargargileilemetalagluile859095proserleuleuglyasnvalthrvalileasnglytyrpheprogln100105110glygluserargasphisproilelyspheproalalysalaglnphe115120125tyrglnasnleuglnasntyrleugluthrgluleulysargaspasn130135140provalleuilemetglyaspmetasnileserprothraspleuasp145150155160ileglyileglyglugluasnarglysargtrpleuargthrglylys165170175cysserpheleuproglugluargglutrpmetaspargleumetser180185190trpglyleuvalaspthrphearghisalaasnproglnthralaasp195200205argphesertrppheasptyrargserlysglypheaspaspasnarg210215220glyleuargileaspleuleuleualaserglnproleualaglucys225230235240cysvalgluthrglyileasptyrgluileargsermetglulyspro245250255serasphisalaprovaltrpalathrpheargarg260265<210>14<211>1275<212>dna<213>嗜熱棲熱菌(thermusthermophilus)<400>14atgtttcgtcgtaaagaagatctggatccgccgctggcactgctgccgctgaaaggcctg60cgcgaagccgccgcactgctggaagaagcgctgcgtcaaggtaaacgcattcgtgttcac120ggcgactatgatgcggatggcctgaccggcaccgcgatcctggttcgtggtctggccgcc180ctgggtgcggatgttcatccgtttatcccgcaccgcctggaagaaggctatggtgtcctg240atggaacgcgtcccggaacatctggaagcctcggacctgtttctgaccgttgactgcggc300attaccaaccatgcggaactgcgcgaactgctggaaaatggcgtggaagtcattgttacc360gatcatcatacgccgggcaaaacgccgccgccgggtctggtcgtgcatccggcgctgacg420ccggatctgaaagaaaaaccgaccggcgcaggcgtggcgtttctgctgctgtgggcactg480catgaacgcctgggcctgccgccgccgctggaatacgcggacctggcagccgttggcacc540attgccgacgttgccccgctgtggggttggaatcgtgcactggtgaaagaaggtctggca600cgcatcccggcttcatcttgggtgggcctgcgtctgctggctgaagccgtgggctatacc660ggcaaagcggtcgaagtcgctttccgcatcgcgccgcgcatcaatgcggcttcccgcctg720ggcgaagcggaaaaagccctgcgcctgctgctgacggatgatgcggcagaagctcaggcg780ctggtcggcgaactgcaccgtctgaacgcccgtcgtcagaccctggaagaagcgatgctg840cgcaaactgctgccgcaggccgacccggaagcgaaagccatcgttctgctggacccggaa900ggccatccgggtgttatgggtattgtggcctctcgcatcctggaagcgaccctgcgcccg960gtctttctggtggcccagggcaaaggcaccgtgcgttcgctggctccgatttccgccgtc1020gaagcactgcgcagcgcggaagatctgctgctgcgttatggtggtcataaagaagcggcg1080ggtttcgcaatggatgaagcgctgtttccggcgttcaaagcacgcgttgaagcgtatgcc1140gcacgtttcccggatccggttcgtgaagtggcactgctggatctgctgccggaaccgggc1200ctgctgccgcaggtgttccgtgaactggcactgctggaaccgtatggtgaaggtaacccg1260gaaccgctgttcctg1275<210>15<211>425<212>prt<213>嗜熱棲熱菌<400>15metpheargarglysgluaspleuaspproproleualaleuleupro151015leulysglyleuargglualaalaalaleuleugluglualaleuarg202530glnglylysargileargvalhisglyasptyraspalaaspglyleu354045thrglythralaileleuvalargglyleualaalaleuglyalaasp505560valhispropheileprohisargleuglugluglytyrglyvalleu65707580metgluargvalprogluhisleuglualaseraspleupheleuthr859095valaspcysglyilethrasnhisalagluleuarggluleuleuglu100105110asnglyvalgluvalilevalthrasphishisthrproglylysthr115120125proproproglyleuvalvalhisproalaleuthrproaspleulys130135140glulysprothrglyalaglyvalalapheleuleuleutrpalaleu145150155160hisgluargleuglyleuproproproleuglutyralaaspleuala165170175alavalglythrilealaaspvalalaproleutrpglytrpasnarg180185190alaleuvallysgluglyleualaargileproalasersertrpval195200205glyleuargleuleualaglualavalglytyrthrglylysalaval210215220gluvalalapheargilealaproargileasnalaalaserargleu225230235240glyglualaglulysalaleuargleuleuleuthraspaspalaala245250255glualaglnalaleuvalglygluleuhisargleuasnalaargarg260265270glnthrleugluglualametleuarglysleuleuproglnalaasp275280285proglualalysalailevalleuleuaspprogluglyhisprogly290295300valmetglyilevalalaserargileleuglualathrleuargpro305310315320valpheleuvalalaglnglylysglythrvalargserleualapro325330335ileseralavalglualaleuargseralagluaspleuleuleuarg340345350tyrglyglyhislysglualaalaglyphealametaspglualaleu355360365pheproalaphelysalaargvalglualatyralaalaargphepro370375380aspprovalarggluvalalaleuleuaspleuleuprogluprogly385390395400leuleuproglnvalphearggluleualaleuleugluprotyrgly405410415gluglyasnprogluproleupheleu420425<210>16<211>738<212>dna<213>細(xì)菌噬菌體λ(bacteriophagelambda)<400>16tccggaagcggctctggtagtggttctggcatgacaccggacattatcctgcagcgtacc60gggatcgatgtgagagctgtcgaacagggggatgatgcgtggcacaaattacggctcggc120gtcatcaccgcttcagaagttcacaacgtgatagcaaaaccccgctccggaaagaagtgg180cctgacatgaaaatgtcctacttccacaccctgcttgctgaggtttgcaccggtgtggct240ccggaagttaacgctaaagcactggcctggggaaaacagtacgagaacgacgccagaacc300ctgtttgaattcacttccggcgtgaatgttactgaatccccgatcatctatcgcgacgaa360agtatgcgtaccgcctgctctcccgatggtttatgcagtgacggcaacggccttgaactg420aaatgcccgtttacctcccgggatttcatgaagttccggctcggtggtttcgaggccata480aagtcagcttacatggcccaggtgcagtacagcatgtgggtgacgcgaaaaaatgcctgg540tactttgccaactatgacccgcgtatgaagcgtgaaggcctgcattatgtcgtgattgag600cgggatgaaaagtacatggcgagttttgacgagatcgtgccggagttcatcgaaaaaatg660gacgaggcactggctgaaattggttttgtatttggggagcaatggcgatctggctctggt720tccggcagcggttccgga738<210>17<211>226<212>prt<213>細(xì)菌噬菌體λ<400>17metthrproaspileileleuglnargthrglyileaspvalargala151015valgluglnglyaspaspalatrphislysleuargleuglyvalile202530thralasergluvalhisasnvalilealalysproargserglylys354045lystrpproaspmetlysmetsertyrphehisthrleuleualaglu505560valcysthrglyvalalaprogluvalasnalalysalaleualatrp65707580glylysglntyrgluasnaspalaargthrleuphegluphethrser859095glyvalasnvalthrgluserproileiletyrargaspglusermet100105110argthralacysserproaspglyleucysseraspglyasnglyleu115120125gluleulyscysprophethrserargaspphemetlyspheargleu130135140glyglypheglualailelysseralatyrmetalaglnvalglntyr145150155160sermettrpvalthrarglysasnalatrptyrphealaasntyrasp165170175proargmetlysarggluglyleuhistyrvalvalilegluargasp180185190glulystyrmetalaserpheaspgluilevalproglupheileglu195200205lysmetaspglualaleualagluileglyphevalpheglyglugln210215220trparg225<210>18<211>760<212>prt<213>伯頓擬甲烷球菌(methanococcoidesburtonii)<400>18metmetilearggluleuaspileproargaspileileglyphetyr151015gluaspserglyilelysgluleutyrproproglnalaglualaile202530glumetglyleuleuglulyslysasnleuleualaalaileprothr354045alaserglylysthrleuleualagluleualametilelysalaile505560arggluglyglylysalaleutyrilevalproleuargalaleuala65707580serglulysphegluargphelysgluleualapropheglyilelys859095valglyileserthrglyaspleuaspserargalaasptrpleugly100105110valasnaspileilevalalathrserglulysthraspserleuleu115120125argasnglythrsertrpmetaspgluilethrthrvalvalvalasp130135140gluilehisleuleuaspserlysasnargglyprothrleugluval145150155160thrilethrlysleumetargleuasnproaspvalglnvalvalala165170175leuseralathrvalglyasnalaargglumetalaasptrpleugly180185190alaalaleuvalleuserglutrpargprothraspleuhisglugly195200205valleupheglyaspalaileasnpheproglyserglnlyslysile210215220aspargleuglulysaspaspalavalasnleuvalleuaspthrile225230235240lysalagluglyglncysleuvalphegluserserargargasncys245250255alaglyphealalysthralaserserlysvalalalysileleuasp260265270asnaspilemetilelysleualaglyilealaglugluvalgluser275280285thrglygluthraspthralailevalleualaasncysilearglys290295300glyvalalaphehishisalaglyleuasnserasnhisarglysleu305310315320valgluasnglypheargglnasnleuilelysvalileserserthr325330335prothrleualaalaglyleuasnleuproalaargargvalileile340345350argsertyrargargpheaspserasnpheglymetglnproilepro355360365valleuglutyrlysglnmetalaglyargalaglyargprohisleu370375380aspprotyrglygluservalleuleualalysthrtyraspgluphe385390395400alaglnleumetgluasntyrvalglualaaspalagluaspiletrp405410415serlysleuglythrgluasnalaleuargthrhisvalleuserthr420425430ilevalasnglyphealaserthrargglngluleupheaspphephe435440445glyalathrphephealatyrglnglnasplystrpmetleugluglu450455460valileasnaspcysleuglupheleuileasplysalametvalser465470475480gluthrgluaspilegluaspalaserlysleupheleuargglythr485490495argleuglyserleuvalsermetleutyrileaspproleusergly500505510serlysilevalaspglyphelysaspileglylysserthrglygly515520525asnmetglyserleugluaspasplysglyaspaspilethrvalthr530535540aspmetthrleuleuhisleuvalcysserthrproaspmetarggln545550555560leutyrleuargasnthrasptyrthrilevalasnglutyrileval565570575alahisseraspgluphehisgluileproasplysleulysgluthr580585590asptyrglutrpphemetglygluvallysthralametleuleuglu595600605glutrpvalthrgluvalseralagluaspilethrarghispheasn610615620valglygluglyaspilehisalaleualaaspthrserglutrpleu625630635640methisalaalaalalysleualagluleuleuglyvalglutyrser645650655serhisalatyrserleuglulysargileargtyrglyserglyleu660665670aspleumetgluleuvalglyileargglyvalglyargvalargala675680685arglysleutyrasnalaglyphevalservalalalysleulysgly690695700alaaspileservalleuserlysleuvalglyprolysvalalatyr705710715720asnileleuserglyileglyvalargvalasnasplyshispheasn725730735seralaproileserserasnthrleuaspthrleuleuasplysasn740745750glnlysthrpheasnaspphegln755760<210>19<211>707<212>prt<213>共生餐古菌(cenarchaeumsymbiosum)<400>19metargilesergluleuaspileproargproalaileglupheleu151015gluglygluglytyrlyslysleutyrproproglnalaalaalaala202530lysalaglyleuthraspglylysservalleuvalseralaprothr354045alaserglylysthrleuilealaalailealametileserhisleu505560serargasnargglylysalavaltyrleuserproleuargalaleu65707580alaalaglulysphealaglupheglylysileglyglyileproleu859095glyargprovalargvalglyvalserthrglyasppheglulysala100105110glyargserleuglyasnasnaspileleuvalleuthrasngluarg115120125metaspserleuileargargargproasptrpmetaspgluvalgly130135140leuvalilealaaspgluilehisleuileglyaspargserarggly145150155160prothrleuglumetvalleuthrlysleuargglyleuargserser165170175proglnvalvalalaleuseralathrileserasnalaaspgluile180185190alaglytrpleuaspcysthrleuvalhisserthrtrpargproval195200205proleusergluglyvaltyrglnaspglygluvalalametglyasp210215220glyserarghisgluvalalaalathrglyglyglyproalavalasp225230235240leualaalagluservalalagluglyglyglnserleuilepheala245250255aspthrargalaargseralaserleualaalalysalaseralaval260265270ileproglualalysglyalaaspalaalalysleualaalaalaala275280285lyslysileileserserglyglygluthrlysleualalysthrleu290295300alagluleuvalglulysglyalaalaphehishisalaglyleuasn305310315320glnaspcysargservalvalglugluglupheargserglyargile325330335argleuleualaserthrprothrleualaalaglyvalasnleupro340345350alaargargvalvalileserservalmetargtyrasnserserser355360365glymetsergluproileserileleuglutyrlysglnleucysgly370375380argalaglyargproglntyrasplysserglyglualailevalval385390395400glyglyvalasnalaaspgluilepheaspargtyrileglyglyglu405410415progluproileargseralametvalaspaspargalaleuargile420425430hisvalleuserleuvalthrthrserproglyilelysgluaspasp435440445valthrgluphepheleuglythrleuglyglyglnglnserglyglu450455460serthrvallyspheservalalavalalaleuargpheleuglnglu465470475480gluglymetleuglyargargglyglyargleualaalathrlysmet485490495glyargleuvalserargleutyrmetaspprometthralavalthr500505510leuargaspalavalglyglualaserproglyargmethisthrleu515520525glypheleuhisleuvalserglucyssergluphemetproargphe530535540alaleuargglnlysasphisgluvalalaglumetmetleugluala545550555560glyargglygluleuleuargprovaltyrsertyrglucysglyarg565570575glyleuleualaleuhisargtrpileglygluserproglualalys580585590leualagluaspleulysphegluserglyaspvalhisargmetval595600605gluserserglytrpleuleuargcysiletrpgluileserlyshis610615620glngluargproaspleuleuglygluleuaspvalleuargserarg625630635640valalatyrglyilelysalagluleuvalproleuvalserilelys645650655glyileglyargvalargserargargleupheargglyglyilelys660665670glyproglyaspleualaalavalprovalgluargleuserargval675680685gluglyileglyalathrleualaasnasnilelysserglnleuarg690695700lysglygly705<210>20<211>720<212>prt<213>抗輻射熱球菌(thermococcusgammatolerans)<400>20metlysvalaspgluleuprovalaspgluargleulysalavalleu151015lysgluargglyileglugluleutyrproproglnalaglualaleu202530lysserglyalaleugluglyargasnleuvalleualaileprothr354045alaserglylysthrleuvalsergluilevalmetvalasnlysleu505560ileglngluglyglylysalavaltyrleuvalproleulysalaleu65707580alagluglulystyrarggluphelysglutrpglulysleuglyleu859095lysvalalaalathrthrglyasptyraspserthraspasptrpleu100105110glyargtyraspileilevalalathralaglulyspheaspserleu115120125leuarghisglyalaargtrpileasnaspvallysleuvalvalala130135140aspgluvalhisleuileglysertyraspargglyalathrleuglu145150155160metileleuthrhismetleuglyargalaglnileleualaleuser165170175alathrvalglyasnalaglugluleualaglutrpleuaspalaser180185190leuvalvalserasptrpargprovalglnleuargargglyvalphe195200205hisleuglythrleuiletrpgluaspglylysvalglusertyrpro210215220gluasntrptyrserleuvalvalaspalavallysargglylysgly225230235240alaleuvalphevalasnthrargargseralaglulysglualaleu245250255alaleuserlysleuvalserserhisleuthrlysproglulysarg260265270alaleugluserleualaserglnleugluaspasnprothrserglu275280285lysleulysargalaleuargglyglyvalalaphehishisalagly290295300leuserargvalgluargthrleuilegluaspalapheargglugly305310315320leuilelysvalilethralathrprothrleuseralaglyvalasn325330335leuproserpheargvalileileargaspthrlysargtyralagly340345350pheglytrpthraspileprovalleugluileglnglnmetmetgly355360365argalaglyargproargtyrasplystyrglyglualaileileval370375380alaargthraspgluproglylysleumetgluargtyrilearggly385390395400lysproglulysleuphesermetleualaasngluglnalaphearg405410415serglnvalleualaleuilethrasnpheglyileargserphepro420425430gluleuvalargpheleugluargthrphetyralahisglnarglys435440445aspleuserserleuglutyrlysalalysgluvalvaltyrpheleu450455460ilegluasnglupheileaspleuaspleugluaspargpheilepro465470475480leupropheglylysargthrserglnleutyrileaspproleuthr485490495alalyslysphelysaspalapheproalailegluargasnproasn500505510propheglyilepheglnleuilealaserthrproaspmetalathr515520525leuthralaargargargglumetgluasptyrleuaspleualatyr530535540gluleugluasplysleutyralaserileprotyrtyrgluaspser545550555560argpheglnglypheleuglyglnvallysthralalysvalleuleu565570575asptrpileasngluvalproglualaargiletyrgluthrtyrser580585590ileaspproglyaspleutyrargleuleugluleualaasptrpleu595600605mettyrserleuilegluleutyrlysleuphegluprolysgluglu610615620ileleuasntyrleuargaspleuhisleuargleuarghisglyval625630635640argglugluleuleugluleuvalargleuproasnileglyarglys645650655argalaargalaleutyrasnalaglypheargservalglualaile660665670alaasnalalysproalagluleuleualavalgluglyileglyala675680685lysileleuaspglyiletyrarghisleuglyileglulysargval690695700thrgluglulysprolysarglysglythrleugluasppheleuarg705710715720<210>21<211>799<212>prt<213>亨氏甲烷螺旋菌(methanospirillumhungatei)<400>21metgluilealaserleuproleuproaspserpheileargalacys151015hisalalysglyileargserleutyrproproglnalaglucysile202530glulysglyleuleugluglylysasnleuleuileserileprothr354045alaserglylysthrleuleualaglumetalamettrpserargile505560alaalaglyglylyscysleutyrilevalproleuargalaleuala65707580serglulystyraspglupheserlyslysglyvalileargvalgly859095ilealathrglyaspleuaspargthraspalatyrleuglygluasn100105110aspileilevalalathrserglulysthraspserleuleuargasn115120125argthrprotrpleuserglnilethrcysilevalleuaspgluval130135140hisleuileglysergluasnargglyalathrleuglumetvalile145150155160thrlysleuargtyrthrasnprovalmetglnileileglyleuser165170175alathrileglyasnproalaglnleualaglutrpleuaspalathr180185190leuilethrserthrtrpargprovalaspleuargglnglyvaltyr195200205tyrasnglylysileargpheseraspsergluargproileglngly210215220lysthrlyshisaspaspleuasnleucysleuaspthrilegluglu225230235240glyglyglncysleuvalphevalserserargargasnalaglugly245250255phealalyslysalaalaglyalaleulysalaglyserproaspser260265270lysalaleualaglngluleuargargleuargaspargaspglugly275280285asnvalleualaaspcysvalgluargglyalaalaphehishisala290295300glyleuileargglngluargthrileileglugluglypheargasn305310315320glytyrilegluvalilealaalathrprothrleualaalaglyleu325330335asnleuproalaargargvalileileargasptyrasnargpheala340345350serglyleuglymetvalproileprovalglyglutyrhisglnmet355360365alaglyargalaglyargprohisleuaspprotyrglyglualaval370375380leuleualalysaspalaproservalgluargleuphegluthrphe385390395400ileaspalaglualagluargvalaspserglncysvalaspaspala405410415serleucysalahisileleuserleuilealathrglyphealahis420425430aspglnglualaleuserserphemetgluargthrphetyrphephe435440445glnhisprolysthrargserleuproargleuvalalaaspalaile450455460argpheleuthrthralaglymetvalglugluarggluasnthrleu465470475480seralathrargleuglyserleuvalserargleutyrleuasnpro485490495cysthralaargleuileleuaspserleulyssercyslysthrpro500505510thrleuileglyleuleuhisvalilecysvalserproaspmetgln515520525argleutyrleulysalaalaaspthrglnleuleuargthrpheleu530535540phelyshislysaspaspleuileleuproleuprophegluglnglu545550555560gluglugluleutrpleuserglyleulysthralaleuvalleuthr565570575asptrpalaaspgluphesergluglymetileglugluargtyrgly580585590ileglyalaglyaspleutyrasnilevalaspserglylystrpleu595600605leuhisglythrgluargleuvalservalglumetproglumetser610615620glnvalvallysthrleuservalargvalhishisglyvallysser625630635640gluleuleuproleuvalalaleuargasnileglyargvalargala645650655argthrleutyrasnalaglytyrproaspproglualavalalaarg660665670alaglyleuserthrilealaargileileglygluglyilealaarg675680685glnvalileaspgluilethrglyvallysargserglyilehisser690695700seraspaspasptyrglnglnlysthrprogluleuleuthraspile705710715720proglyileglylyslysmetalaglulysleuglnasnalaglyile725730735ilethrvalseraspleuleuthralaaspgluvalleuleuserasp740745750valleuglyalaalaargalaarglysvalleualapheleuserasn755760765serglulysgluasnserserserasplysthrglugluileproasp770775780thrglnlysileargglyglnsersertrpgluasppheglycys785790795<210>22<211>1756<212>prt<213>大腸桿菌<400>22metmetserilealaglnvalargseralaglyseralaglyasntyr151015tyrthrasplysaspasntyrtyrvalleuglysermetglygluarg202530trpalaglylysglyalagluglnleuglyleuglnglyservalasp354045lysaspvalphethrargleuleugluglyargleuproaspglyala505560aspleuserargmetglnaspglyserasnlyshisargproglytyr65707580aspleuthrpheseralaprolysservalsermetmetalametleu859095glyglyasplysargleuileaspalahisasnglnalavalaspphe100105110alavalargglnvalglualaleualaserthrargvalmetthrasp115120125glyglnsergluthrvalleuthrglyasnleuvalmetalaleuphe130135140asnhisaspthrserargaspglngluproglnleuhisthrhisala145150155160valvalalaasnvalthrglnhisasnglyglutrplysthrleuser165170175serasplysvalglylysthrglypheilegluasnvaltyralaasn180185190glnilealapheglyargleutyrargglulysleulysgluglnval195200205glualaleuglytyrgluthrgluvalvalglylyshisglymettrp210215220glumetproglyvalprovalglualapheserglyargserglnala225230235240ileargglualavalglygluaspalaserleulysserargaspval245250255alaalaleuaspthrarglysserlysglnhisvalaspprogluile260265270argmetalaglutrpmetglnthrleulysgluthrglypheaspile275280285argalatyrargaspalaalaaspglnargthrgluileargthrgln290295300alaproglyproalaserglnaspglyproaspvalglnglnalaval305310315320thrglnalailealaglyleusergluarglysvalglnphethrtyr325330335thraspvalleualaargthrvalglyileleuproprogluasngly340345350valilegluargalaargalaglyileaspglualaileserargglu355360365glnleuileproleuaspargglulysglyleuphethrserglyile370375380hisvalleuaspgluleuservalargalaleuserargaspilemet385390395400lysglnasnargvalthrvalhisproglulysservalproargthr405410415alaglytyrseraspalavalservalleualaglnaspargproser420425430leualailevalserglyglnglyglyalaalaglyglnarggluarg435440445valalagluleuvalmetmetalaarggluglnglyarggluvalgln450455460ileilealaalaaspargargserglnmetasnleulysglnaspglu465470475480argleuserglygluleuilethrglyargargglnleuleuglugly485490495metalaphethrproglyserthrvalilevalaspglnglyglulys500505510leuserleulysgluthrleuthrleuleuaspglyalaalaarghis515520525asnvalglnvalleuilethraspserglyglnargthrglythrgly530535540seralaleumetalametlysaspalaglyvalasnthrtyrargtrp545550555560glnglyglygluglnargproalathrileilesergluproasparg565570575asnvalargtyralaargleualaglyaspphealaalaservallys580585590alaglyglugluservalalaglnvalserglyvalarggluglnala595600605ileleuthrglnalaileargsergluleulysthrglnglyvalleu610615620glyhisprogluvalthrmetthralaleuserprovaltrpleuasp625630635640serargserargtyrleuargaspmettyrargproglymetvalmet645650655gluglntrpasnprogluthrargserhisaspargtyrvalileasp660665670argvalthralaglnserhisserleuthrleuargaspalaglngly675680685gluthrglnvalvalargileserserleuaspsersertrpserleu690695700pheargproglulysmetprovalalaaspglygluargleuargval705710715720thrglylysileproglyleuargvalserglyglyaspargleugln725730735valalaservalsergluaspalametthrvalvalvalproglyarg740745750alagluproalaserleuprovalseraspserprophethralaleu755760765lysleugluasnglytrpvalgluthrproglyhisservalserasp770775780seralathrvalphealaservalthrglnmetalametaspasnala785790795800thrleuasnglyleualaargserglyargaspvalargleutyrser805810815serleuaspgluthrargthralaglulysleualaarghisproser820825830phethrvalvalsergluglnilelysalaargalaglygluthrleu835840845leugluthralaileserleuglnlysalaglyleuhisthrproala850855860glnglnalailehisleualaleuprovalleugluserlysasnleu865870875880alaphesermetvalaspleuleuthrglualalysserphealaala885890895gluglythrglyphethrgluleuglyglygluileasnalaglnile900905910lysargglyaspleuleutyrvalaspvalalalysglytyrglythr915920925glyleuleuvalserargalasertyrglualaglulysserileleu930935940arghisileleugluglylysglualavalthrproleumetgluarg945950955960valproglygluleumetgluthrleuthrserglyglnargalaala965970975thrargmetileleugluthrseraspargphethrvalvalglngly980985990tyralaglyvalglylysthrthrglnpheargalavalmetserala99510001005valasnmetleuproalasergluargproargvalvalglyleu101010151020glyprothrhisargalavalglyglumetargseralaglyval102510301035aspalaglnthrleualaserpheleuhisaspthrglnleugln104010451050glnargserglygluthrproasppheserasnthrleupheleu105510601065leuaspglusersermetvalglyasnthrglumetalaargala107010751080tyralaleuilealaalaglyglyglyargalavalalasergly108510901095aspthraspglnleuglnalailealaproglyglnserphearg110011051110leuglnglnthrargseralaalaaspvalvalilemetlysglu111511201125ilevalargglnthrprogluleuargglualavaltyrserleu113011351140ileasnargaspvalgluargalaleuserglyleugluserval114511501155lysproserglnvalproargleugluglyalatrpalaproglu116011651170hisservalthrglupheserhisserglnglualalysleuala117511801185glualaglnglnlysalametleulysglyglualapheproasp119011951200ileprometthrleutyrglualailevalargasptyrthrgly120512101215argthrproglualaarggluglnthrleuilevalthrhisleu122012251230asngluaspargargvalleuasnsermetilehisaspalaarg123512401245glulysalaglygluleuglylysgluglnvalmetvalproval125012551260leuasnthralaasnileargaspglygluleuargargleuser126512701275thrtrpglulysasnproaspalaleualaleuvalaspasnval128012851290tyrhisargilealaglyileserlysaspaspglyleuilethr129513001305leuglnaspalagluglyasnthrargleuileserproargglu131013151320alavalalagluglyvalthrleutyrthrproasplysilearg132513301335valglythrglyaspargmetargphethrlysseraspargglu134013451350argglytyrvalalaasnservaltrpthrvalthralavalser135513601365glyaspservalthrleuseraspglyglnglnthrargvalile137013751380argproglyglngluargalagluglnhisileaspleualatyr138513901395alailethralahisglyalaglnglyalasergluthrpheala140014051410ilealaleugluglythrgluglyasnarglysleumetalagly141514201425phegluseralatyrvalalaleuserargmetlysglnhisval143014351440glnvaltyrthraspasnargglnglytrpthraspalaileasn144514501455asnalavalglnlysglythralahisaspvalleugluprolys146014651470proasparggluvalmetasnalaglnargleupheserthrala147514801485arggluleuargaspvalalaalaglyargalavalleuarggln149014951500alaglyleualaglyglyaspserproalaargpheilealapro150515101515glyarglystyrproglnprotyrvalalaleuproalapheasp152015251530argasnglylysseralaglyiletrpleuasnproleuthrthr153515401545aspaspglyasnglyleuargglypheserglygluglyargval155015551560lysglyserglyaspalaglnphevalalaleuglnglyserarg156515701575asnglygluserleuleualaaspasnmetglnaspglyvalarg158015851590ilealaargaspasnproaspserglyvalvalvalargileala159516001605glygluglyargprotrpasnproglyalailethrglyglyarg161016151620valtrpglyaspileproaspasnservalglnproglyalagly162516301635asnglygluprovalthralagluvalleualaglnargglnala164016451650gluglualaileargarggluthrgluargargalaaspgluile165516601665valarglysmetalagluasnlysproaspleuproaspglylys167016751680thrgluleualavalargaspilealaglyglngluargasparg168516901695seralailesergluarggluthralaleuprogluservalleu170017051710arggluserglnarggluargglualavalarggluvalalaarg171517201725gluasnleuleuglngluargleuglnglnmetgluargaspmet173017351740valargaspleuglnlysglulysthrleuglyglyasp174517501755<210>23<211>726<212>prt<213>伯頓擬甲烷球菌<400>23metserasplysproalaphemetlystyrphethrglnsersercys151015tyrproasnglnglnglualametaspargilehisseralaleumet202530glnglnglnleuvalleuphegluglyalacysglythrglylysthr354045leuseralaleuvalproalaleuhisvalglylysmetleuglylys505560thrvalileilealathrasnvalhisglnglnmetvalglnpheile65707580asnglualaargaspilelyslysvalglnaspvallysvalalaval859095ilelysglylysthralametcysproglnglualaasptyrgluglu100105110cysservallysarggluasnthrphegluleumetgluthrgluarg115120125gluiletyrleulysargglngluleuasnseralaargaspsertyr130135140lyslysserhisaspproalaphevalthrleuargaspgluleuser145150155160lysgluileaspalavalgluglulysalaargglyleuargasparg165170175alacysasnaspleutyrgluvalleuargseraspserglulysphe180185190argglutrpleutyrlysgluvalargserproglugluileasnasp195200205hisalailelysaspglymetcysglytyrgluleuvallysargglu210215220leulyshisalaaspleuleuilecysasntyrhishisvalleuasn225230235240proaspilepheserthrvalleuglytrpileglulysgluprogln245250255gluthrilevalilepheaspglualahisasnleugluseralaala260265270argserhisserserleuserleuthrgluhisserileglulysala275280285ilethrgluleuglualaasnleuaspleuleualaaspaspasnile290295300hisasnleupheasnilepheleugluvalileseraspthrtyrasn305310315320serargphelyspheglygluarggluargvalarglysasntrptyr325330335aspileargileseraspprotyrgluargasnaspilevalarggly340345350lyspheleuargglnalalysglyasppheglyglulysaspaspile355360365glnileleuleuserglualasergluleuglyalalysleuaspglu370375380thrtyrargaspglntyrlyslysglyleuserservalmetlysarg385390395400serhisileargtyrvalalaaspphemetseralatyrilegluleu405410415serhisasnleuasntyrtyrproileleuasnvalargargaspmet420425430asnaspgluiletyrglyargvalgluleuphethrcysileprolys435440445asnvalthrgluproleupheasnserleupheservalileleumet450455460seralathrleuhispropheglumetvallyslysthrleuglyile465470475480thrargaspthrcysglumetsertyrglythrserpheprogluglu485490495lysargleuserilealavalserileproproleuphealalysasn500505510argaspasparghisvalthrgluleuleugluglnvalleuleuasp515520525serilegluasnserlysglyasnvalileleuphepheglnserala530535540pheglualalysargtyrtyrserlysilegluproleuvalasnval545550555560provalpheleuaspgluvalglyileserserglnaspvalargglu565570575gluphepheserileglyglugluasnglylysalavalleuleuser580585590tyrleutrpglythrleusergluglyileasptyrargaspglyarg595600605glyargthrvalileileileglyvalglytyrproalaleuasnasp610615620argmetasnalavalgluseralatyrasphisvalpheglytyrgly625630635640alaglytrpgluphealaileglnvalprothrilearglysilearg645650655glnalametglyargvalvalargserprothrasptyrglyalaarg660665670ileleuleuaspglyargpheleuthraspserlyslysargphegly675680685lyspheservalphegluvalpheproproalagluargsergluphe690695700valaspvalaspproglulysvallystyrserleumetasnphephe705710715720metaspasnaspglugln725<210>24<211>439<212>prt<213>腸桿菌噬菌體(enterobacteriaphage)t4<400>24metthrpheaspaspleuthrgluglyglnlysasnalapheasnile151015valmetlysalailelysglulyslyshishisvalthrileasngly202530proalaglythrglylysthrthrleuthrlyspheileilegluala354045leuileserthrglygluthrglyileileleualaalaprothrhis505560alaalalyslysileleuserlysleuserglylysglualaserthr65707580ilehisserileleulysileasnprovalthrtyrglugluasnval859095leuphegluglnlysgluvalproaspleualalyscysargvalleu100105110ilecysaspgluvalsermettyrasparglysleuphelysileleu115120125leuserthrileproprotrpcysthrileileglyileglyaspasn130135140lysglnileargprovalaspproglygluasnthralatyrileser145150155160prophephethrhislysaspphetyrglncysgluleuthrgluval165170175lysargserasnalaproileileaspvalalathraspvalargasn180185190glylystrpiletyrasplysvalvalaspglyhisglyvalarggly195200205phethrglyaspthralaleuargaspphemetvalasntyrpheser210215220ilevallysserleuaspaspleuphegluasnargvalmetalaphe225230235240thrasnlysservalasplysleuasnserileilearglyslysile245250255phegluthrasplysasppheilevalglygluileilevalmetgln260265270gluproleuphelysthrtyrlysileaspglylysprovalserglu275280285ileilepheasnasnglyglnleuvalargileileglualaglutyr290295300thrserthrphevallysalaargglyvalproglyglutyrleuile305310315320arghistrpaspleuthrvalgluthrtyrglyaspaspglutyrtyr325330335argglulysilelysileileserseraspglugluleutyrlysphe340345350asnleupheleuglylysthralagluthrtyrlysasntrpasnlys355360365glyglylysalaprotrpseraspphetrpaspalalysserglnphe370375380serlysvallysalaleuproalaserthrphehislysalaglngly385390395400metservalaspargalapheiletyrthrprocysilehistyrala405410415aspvalgluleualaglnglnleuleutyrvalglyvalthrarggly420425430argtyraspvalphetyrval435<210>25<211>970<212>prt<213>肉毒桿菌(clostridiumbotulinum)<400>25metleuservalalaasnvalargserproseralaalaalasertyr151015phealaseraspasntyrtyralaseralaaspalaaspargsergly202530glntrpileglyaspglyalalysargleuglyleugluglylysval354045glualaargalapheaspalaleuleuargglygluleuproaspgly505560serservalglyasnproglyglnalahisargproglythraspleu65707580thrpheservalprolyssertrpserleuleualaleuvalglylys859095aspgluargileilealaalatyrargglualavalvalglualaleu100105110histrpalaglulysasnalaalagluthrargvalvalglulysgly115120125metvalvalthrglnalathrglyasnleualaileglyleuphegln130135140hisaspthrasnargasnglngluproasnleuhisphehisalaval145150155160ilealaasnvalthrglnglylysaspglylystrpargthrleulys165170175asnaspargleutrpglnleuasnthrthrleuasnserilealamet180185190alaargpheargvalalavalglulysleuglytyrgluproglypro195200205valleulyshisglyasnpheglualaargglyileserargglugln210215220valmetalapheserthrargarglysgluvalleuglualaargarg225230235240glyproglyleuaspalaglyargilealaalaleuaspthrargala245250255serlysgluglyilegluaspargalathrleuserlysglntrpser260265270glualaalaglnserileglyleuaspleulysproleuvalasparg275280285alaargthrlysalaleuglyglnglymetglualathrargilegly290295300serleuvalgluargglyargalatrpleuserargphealaalahis305310315320valargglyaspproalaaspproleuvalproproservalleulys325330335glnaspargglnthrilealaalaalaglnalavalalaseralaval340345350arghisleuserglnargglualaalaphegluargthralaleutyr355360365lysalaalaleuasppheglyleuprothrthrilealaaspvalglu370375380lysargthrargalaleuvalargserglyaspleuilealaglylys385390395400glygluhislysglytrpleualaserargaspalavalvalthrglu405410415glnargileleusergluvalalaalaglylysglyaspserserpro420425430alailethrproglnlysalaalaalaservalglnalaalaalaleu435440445thrglyglnglypheargleuasngluglyglnleualaalaalaarg450455460leuileleuileserlysaspargthrilealavalglnglyileala465470475480glyalaglylysserservalleulysprovalalagluvalleuarg485490495aspgluglyhisprovalileglyleualaileglnasnthrleuval500505510glnmetleugluargaspthrglyileglyserglnthrleualaarg515520525pheleuglyglytrpasnlysleuleuaspaspproglyasnvalala530535540leuargalaglualaglnalaserleulysasphisvalleuvalleu545550555560aspglualasermetvalserasngluasplysglulysleuvalarg565570575leualaasnleualaglyvalhisargleuvalleuileglyasparg580585590lysglnleuglyalavalaspalaglylysprophealaleuleugln595600605argalaglyilealaargalaglumetalathrasnleuargalaarg610615620aspprovalvalargglualaglnalaalaalaglnalaglyaspval625630635640arglysalaleuarghisleulysserhisthrvalglualaarggly645650655aspglyalaglnvalalaalagluthrtrpleualaleuasplysglu660665670thrargalaargthrseriletyralaserglyargalaileargser675680685alavalasnalaalavalglnglnglyleuleualaserarggluile690695700glyproalalysmetlysleugluvalleuaspargvalasnthrthr705710715720argglugluleuarghisleuproalatyrargalaglyargvalleu725730735gluvalserarglysglnglnalaleuglyleupheileglyglutyr740745750argvalileglyglnasparglysglylysleuvalgluvalgluasp755760765lysargglylysargpheargpheaspproalaargileargalagly770775780lysglyaspaspasnleuthrleuleugluproarglysleugluile785790795800hisgluglyaspargileargtrpthrargasnasphisargarggly805810815leupheasnalaaspglnalaargvalvalgluilealaasnglylys820825830valthrphegluthrserlysglyaspleuvalgluleulyslysasp835840845aspprometleulysargileaspleualatyralaleuasnvalhis850855860metalaglnglyleuthrseraspargglyilealavalmetaspser865870875880arggluargasnleuserasnglnlysthrpheleuvalthrvalthr885890895argleuargasphisleuthrleuvalvalaspseralaasplysleu900905910glyalaalavalalaargasnlysglyglulysalaseralaileglu915920925valthrglyservallysprothralathrlysglyserglyvalasp930935940glnprolysservalglualaasnlysalaglulysgluleuthrarg945950955960serlysserlysthrleuasppheglyile965970<210>26<211>50<212>dna<213>人工序列<220><223>本發(fā)明的實(shí)施例mua底物。<400>26gttttcgcatttatcgtgaaacgctttcgcgtttttcgtgcgccgcttca50<210>27<211>50<212>dna<213>人工序列<220><223>本發(fā)明的實(shí)施例mua底物。<400>27caaaagcgtaaatagcactttgcgaaagcgcaaaaagcacgcggcgaagt50<210>28<211>54<212>dna<213>人工序列<220><223>本發(fā)明的實(shí)施例mua底物。<400>28caaaagcgtaaatagcactttgcgaaagcgcaaaaagcacgcggcgaagtctag54<210>29<211>100<212>dna<213>人工序列<220><223>實(shí)施例1中使用的序列。<400>29gcgttctgtttcggatgtatgttttcatacatccgaaacagaacgcttttgttttcgcat60ttatcgtgaaacgctttcgcgtttttcgtgcgccgcttca100<210>30<211>48<212>dna<213>人工序列<220><223>實(shí)施例1中使用的序列。<400>30gaagcggcgcacgaaaaacgcgaaagcgtttcacgataatgcgaaaac48<210>31<211>48502<212>dna<213>人工序列<220><223>實(shí)施例1中使用的序列。<400>31gggcggcgacctcgcgggttttcgctatttatgaaaattttccggtttaaggcgtttccg60ttcttcttcgtcataacttaatgtttttatttaaaataccctctgaaaagaaaggaaacg120acaggtgctgaaagcgaggctttttggcctctgtcgtttcctttctctgtttttgtccgt180ggaatgaacaatggaagtcaacaaaaagcagctggctgacattttcggtgcgagtatccg240taccattcagaactggcaggaacagggaatgcccgttctgcgaggcggtggcaagggtaa300tgaggtgctttatgactctgccgccgtcataaaatggtatgccgaaagggatgctgaaat360tgagaacgaaaagctgcgccgggaggttgaagaactgcggcaggccagcgaggcagatct420ccagccaggaactattgagtacgaacgccatcgacttacgcgtgcgcaggccgacgcaca480ggaactgaagaatgccagagactccgctgaagtggtggaaaccgcattctgtactttcgt540gctgtcgcggatcgcaggtgaaattgccagtattctcgacgggctccccctgtcggtgca600gcggcgttttccggaactggaaaaccgacatgttgatttcctgaaacgggatatcatcaa660agccatgaacaaagcagccgcgctggatgaactgataccggggttgctgagtgaatatat720cgaacagtcaggttaacaggctgcggcattttgtccgcgccgggcttcgctcactgttca780ggccggagccacagaccgccgttgaatgggcggatgctaattactatctcccgaaagaat840ccgcataccaggaagggcgctgggaaacactgccctttcagcgggccatcatgaatgcga900tgggcagcgactacatccgtgaggtgaatgtggtgaagtctgcccgtgtcggttattcca960aaatgctgctgggtgtttatgcctactttatagagcataagcagcgcaacacccttatct1020ggttgccgacggatggtgatgccgagaactttatgaaaacccacgttgagccgactattc1080gtgatattccgtcgctgctggcgctggccccgtggtatggcaaaaagcaccgggataaca1140cgctcaccatgaagcgtttcactaatgggcgtggcttctggtgcctgggcggtaaagcgg1200caaaaaactaccgtgaaaagtcggtggatgtggcgggttatgatgaacttgctgcttttg1260atgatgatattgaacaggaaggctctccgacgttcctgggtgacaagcgtattgaaggct1320cggtctggccaaagtccatccgtggctccacgccaaaagtgagaggcacctgtcagattg1380agcgtgcagccagtgaatccccgcattttatgcgttttcatgttgcctgcccgcattgcg1440gggaggagcagtatcttaaatttggcgacaaagagacgccgtttggcctcaaatggacgc1500cggatgacccctccagcgtgttttatctctgcgagcataatgcctgcgtcatccgccagc1560aggagctggactttactgatgcccgttatatctgcgaaaagaccgggatctggacccgtg1620atggcattctctggttttcgtcatccggtgaagagattgagccacctgacagtgtgacct1680ttcacatctggacagcgtacagcccgttcaccacctgggtgcagattgtcaaagactgga1740tgaaaacgaaaggggatacgggaaaacgtaaaaccttcgtaaacaccacgctcggtgaga1800cgtgggaggcgaaaattggcgaacgtccggatgctgaagtgatggcagagcggaaagagc1860attattcagcgcccgttcctgaccgtgtggcttacctgaccgccggtatcgactcccagc1920tggaccgctacgaaatgcgcgtatggggatgggggccgggtgaggaaagctggctgattg1980accggcagattattatgggccgccacgacgatgaacagacgctgctgcgtgtggatgagg2040ccatcaataaaacctatacccgccggaatggtgcagaaatgtcgatatcccgtatctgct2100gggatactggcgggattgacccgaccattgtgtatgaacgctcgaaaaaacatgggctgt2160tccgggtgatccccattaaaggggcatccgtctacggaaagccggtggccagcatgccac2220gtaagcgaaacaaaaacggggtttaccttaccgaaatcggtacggataccgcgaaagagc2280agatttataaccgcttcacactgacgccggaaggggatgaaccgcttcccggtgccgttc2340acttcccgaataacccggatatttttgatctgaccgaagcgcagcagctgactgctgaag2400agcaggtcgaaaaatgggtggatggcaggaaaaaaatactgtgggacagcaaaaagcgac2460gcaatgaggcactcgactgcttcgtttatgcgctggcggcgctgcgcatcagtatttccc2520gctggcagctggatctcagtgcgctgctggcgagcctgcaggaagaggatggtgcagcaa2580ccaacaagaaaacactggcagattacgcccgtgccttatccggagaggatgaatgacgcg2640acaggaagaacttgccgctgcccgtgcggcactgcatgacctgatgacaggtaaacgggt2700ggcaacagtacagaaagacggacgaagggtggagtttacggccacttccgtgtctgacct2760gaaaaaatatattgcagagctggaagtgcagaccggcatgacacagcgacgcaggggacc2820tgcaggattttatgtatgaaaacgcccaccattcccacccttctggggccggacggcatg2880acatcgctgcgcgaatatgccggttatcacggcggtggcagcggatttggagggcagttg2940cggtcgtggaacccaccgagtgaaagtgtggatgcagccctgttgcccaactttacccgt3000ggcaatgcccgcgcagacgatctggtacgcaataacggctatgccgccaacgccatccag3060ctgcatcaggatcatatcgtcgggtcttttttccggctcagtcatcgcccaagctggcgc3120tatctgggcatcggggaggaagaagcccgtgccttttcccgcgaggttgaagcggcatgg3180aaagagtttgccgaggatgactgctgctgcattgacgttgagcgaaaacgcacgtttacc3240atgatgattcgggaaggtgtggccatgcacgcctttaacggtgaactgttcgttcaggcc3300acctgggataccagttcgtcgcggcttttccggacacagttccggatggtcagcccgaag3360cgcatcagcaacccgaacaataccggcgacagccggaactgccgtgccggtgtgcagatt3420aatgacagcggtgcggcgctgggatattacgtcagcgaggacgggtatcctggctggatg3480ccgcagaaatggacatggataccccgtgagttacccggcgggcgcgcctcgttcattcac3540gtttttgaacccgtggaggacgggcagactcgcggtgcaaatgtgttttacagcgtgatg3600gagcagatgaagatgctcgacacgctgcagaacacgcagctgcagagcgccattgtgaag3660gcgatgtatgccgccaccattgagagtgagctggatacgcagtcagcgatggattttatt3720ctgggcgcgaacagtcaggagcagcgggaaaggctgaccggctggattggtgaaattgcc3780gcgtattacgccgcagcgccggtccggctgggaggcgcaaaagtaccgcacctgatgccg3840ggtgactcactgaacctgcagacggctcaggatacggataacggctactccgtgtttgag3900cagtcactgctgcggtatatcgctgccgggctgggtgtctcgtatgagcagctttcccgg3960aattacgcccagatgagctactccacggcacgggccagtgcgaacgagtcgtgggcgtac4020tttatggggcggcgaaaattcgtcgcatcccgtcaggcgagccagatgtttctgtgctgg4080ctggaagaggccatcgttcgccgcgtggtgacgttaccttcaaaagcgcgcttcagtttt4140caggaagcccgcagtgcctgggggaactgcgactggataggctccggtcgtatggccatc4200gatggtctgaaagaagttcaggaagcggtgatgctgatagaagccggactgagtacctac4260gagaaagagtgcgcaaaacgcggtgacgactatcaggaaatttttgcccagcaggtccgt4320gaaacgatggagcgccgtgcagccggtcttaaaccgcccgcctgggcggctgcagcattt4380gaatccgggctgcgacaatcaacagaggaggagaagagtgacagcagagctgcgtaatct4440cccgcatattgccagcatggcctttaatgagccgctgatgcttgaacccgcctatgcgcg4500ggttttcttttgtgcgcttgcaggccagcttgggatcagcagcctgacggatgcggtgtc4560cggcgacagcctgactgcccaggaggcactcgcgacgctggcattatccggtgatgatga4620cggaccacgacaggcccgcagttatcaggtcatgaacggcatcgccgtgctgccggtgtc4680cggcacgctggtcagccggacgcgggcgctgcagccgtactcggggatgaccggttacaa4740cggcattatcgcccgtctgcaacaggctgccagcgatccgatggtggacggcattctgct4800cgatatggacacgcccggcgggatggtggcgggggcatttgactgcgctgacatcatcgc4860ccgtgtgcgtgacataaaaccggtatgggcgcttgccaacgacatgaactgcagtgcagg4920tcagttgcttgccagtgccgcctcccggcgtctggtcacgcagaccgcccggacaggctc4980catcggcgtcatgatggctcacagtaattacggtgctgcgctggagaaacagggtgtgga5040aatcacgctgatttacagcggcagccataaggtggatggcaacccctacagccatcttcc5100ggatgacgtccgggagacactgcagtcccggatggacgcaacccgccagatgtttgcgca5160gaaggtgtcggcatataccggcctgtccgtgcaggttgtgctggataccgaggctgcagt5220gtacagcggtcaggaggccattgatgccggactggctgatgaacttgttaacagcaccga5280tgcgatcaccgtcatgcgtgatgcactggatgcacgtaaatcccgtctctcaggagggcg5340aatgaccaaagagactcaatcaacaactgtttcagccactgcttcgcaggctgacgttac5400tgacgtggtgccagcgacggagggcgagaacgccagcgcggcgcagccggacgtgaacgc5460gcagatcaccgcagcggttgcggcagaaaacagccgcattatggggatcctcaactgtga5520ggaggctcacggacgcgaagaacaggcacgcgtgctggcagaaacccccggtatgaccgt5580gaaaacggcccgccgcattctggccgcagcaccacagagtgcacaggcgcgcagtgacac5640tgcgctggatcgtctgatgcagggggcaccggcaccgctggctgcaggtaacccggcatc5700tgatgccgttaacgatttgctgaacacaccagtgtaagggatgtttatgacgagcaaaga5760aacctttacccattaccagccgcagggcaacagtgacccggctcataccgcaaccgcgcc5820cggcggattgagtgcgaaagcgcctgcaatgaccccgctgatgctggacacctccagccg5880taagctggttgcgtgggatggcaccaccgacggtgctgccgttggcattcttgcggttgc5940tgctgaccagaccagcaccacgctgacgttctacaagtccggcacgttccgttatgagga6000tgtgctctggccggaggctgccagcgacgagacgaaaaaacggaccgcgtttgccggaac6060ggcaatcagcatcgtttaactttacccttcatcactaaaggccgcctgtgcggctttttt6120tacgggatttttttatgtcgatgtacacaaccgcccaactgctggcggcaaatgagcaga6180aatttaagtttgatccgctgtttctgcgtctctttttccgtgagagctatcccttcacca6240cggagaaagtctatctctcacaaattccgggactggtaaacatggcgctgtacgtttcgc6300cgattgtttccggtgaggttatccgttcccgtggcggctccacctctgaatttacgccgg6360gatatgtcaagccgaagcatgaagtgaatccgcagatgaccctgcgtcgcctgccggatg6420aagatccgcagaatctggcggacccggcttaccgccgccgtcgcatcatcatgcagaaca6480tgcgtgacgaagagctggccattgctcaggtcgaagagatgcaggcagtttctgccgtgc6540ttaagggcaaatacaccatgaccggtgaagccttcgatccggttgaggtggatatgggcc6600gcagtgaggagaataacatcacgcagtccggcggcacggagtggagcaagcgtgacaagt6660ccacgtatgacccgaccgacgatatcgaagcctacgcgctgaacgccagcggtgtggtga6720atatcatcgtgttcgatccgaaaggctgggcgctgttccgttccttcaaagccgtcaagg6780agaagctggatacccgtcgtggctctaattccgagctggagacagcggtgaaagacctgg6840gcaaagcggtgtcctataaggggatgtatggcgatgtggccatcgtcgtgtattccggac6900agtacgtggaaaacggcgtcaaaaagaacttcctgccggacaacacgatggtgctgggga6960acactcaggcacgcggtctgcgcacctatggctgcattcaggatgcggacgcacagcgcg7020aaggcattaacgcctctgcccgttacccgaaaaactgggtgaccaccggcgatccggcgc7080gtgagttcaccatgattcagtcagcaccgctgatgctgctggctgaccctgatgagttcg7140tgtccgtacaactggcgtaatcatggcccttcggggccattgtttctctgtggaggagtc7200catgacgaaagatgaactgattgcccgtctccgctcgctgggtgaacaactgaaccgtga7260tgtcagcctgacggggacgaaagaagaactggcgctccgtgtggcagagctgaaagagga7320gcttgatgacacggatgaaactgccggtcaggacacccctctcagccgggaaaatgtgct7380gaccggacatgaaaatgaggtgggatcagcgcagccggataccgtgattctggatacgtc7440tgaactggtcacggtcgtggcactggtgaagctgcatactgatgcacttcacgccacgcg7500ggatgaacctgtggcatttgtgctgccgggaacggcgtttcgtgtctctgccggtgtggc7560agccgaaatgacagagcgcggcctggccagaatgcaataacgggaggcgctgtggctgat7620ttcgataacctgttcgatgctgccattgcccgcgccgatgaaacgatacgcgggtacatg7680ggaacgtcagccaccattacatccggtgagcagtcaggtgcggtgatacgtggtgttttt7740gatgaccctgaaaatatcagctatgccggacagggcgtgcgcgttgaaggctccagcccg7800tccctgtttgtccggactgatgaggtgcggcagctgcggcgtggagacacgctgaccatc7860ggtgaggaaaatttctgggtagatcgggtttcgccggatgatggcggaagttgtcatctc7920tggcttggacggggcgtaccgcctgccgttaaccgtcgccgctgaaagggggatgtatgg7980ccataaaaggtcttgagcaggccgttgaaaacctcagccgtatcagcaaaacggcggtgc8040ctggtgccgccgcaatggccattaaccgcgttgcttcatccgcgatatcgcagtcggcgt8100cacaggttgcccgtgagacaaaggtacgccggaaactggtaaaggaaagggccaggctga8160aaagggccacggtcaaaaatccgcaggccagaatcaaagttaaccggggggatttgcccg8220taatcaagctgggtaatgcgcgggttgtcctttcgcgccgcaggcgtcgtaaaaaggggc8280agcgttcatccctgaaaggtggcggcagcgtgcttgtggtgggtaaccgtcgtattcccg8340gcgcgtttattcagcaactgaaaaatggccggtggcatgtcatgcagcgtgtggctggga8400aaaaccgttaccccattgatgtggtgaaaatcccgatggcggtgccgctgaccacggcgt8460ttaaacaaaatattgagcggatacggcgtgaacgtcttccgaaagagctgggctatgcgc8520tgcagcatcaactgaggatggtaataaagcgatgaaacatactgaactccgtgcagccgt8580actggatgcactggagaagcatgacaccggggcgacgttttttgatggtcgccccgctgt8640ttttgatgaggcggattttccggcagttgccgtttatctcaccggcgctgaatacacggg8700cgaagagctggacagcgatacctggcaggcggagctgcatatcgaagttttcctgcctgc8760tcaggtgccggattcagagctggatgcgtggatggagtcccggatttatccggtgatgag8820cgatatcccggcactgtcagatttgatcaccagtatggtggccagcggctatgactaccg8880gcgcgacgatgatgcgggcttgtggagttcagccgatctgacttatgtcattacctatga8940aatgtgaggacgctatgcctgtaccaaatcctacaatgccggtgaaaggtgccgggacca9000ccctgtgggtttataaggggagcggtgacccttacgcgaatccgctttcagacgttgact9060ggtcgcgtctggcaaaagttaaagacctgacgcccggcgaactgaccgctgagtcctatg9120acgacagctatctcgatgatgaagatgcagactggactgcgaccgggcaggggcagaaat9180ctgccggagataccagcttcacgctggcgtggatgcccggagagcaggggcagcaggcgc9240tgctggcgtggtttaatgaaggcgatacccgtgcctataaaatccgcttcccgaacggca9300cggtcgatgtgttccgtggctgggtcagcagtatcggtaaggcggtgacggcgaaggaag9360tgatcacccgcacggtgaaagtcaccaatgtgggacgtccgtcgatggcagaagatcgca9420gcacggtaacagcggcaaccggcatgaccgtgacgcctgccagcacctcggtggtgaaag9480ggcagagcaccacgctgaccgtggccttccagccggagggcgtaaccgacaagagctttc9540gtgcggtgtctgcggataaaacaaaagccaccgtgtcggtcagtggtatgaccatcaccg9600tgaacggcgttgctgcaggcaaggtcaacattccggttgtatccggtaatggtgagtttg9660ctgcggttgcagaaattaccgtcaccgccagttaatccggagagtcagcgatgttcctga9720aaaccgaatcatttgaacataacggtgtgaccgtcacgctttctgaactgtcagccctgc9780agcgcattgagcatctcgccctgatgaaacggcaggcagaacaggcggagtcagacagca9840accggaagtttactgtggaagacgccatcagaaccggcgcgtttctggtggcgatgtccc9900tgtggcataaccatccgcagaagacgcagatgccgtccatgaatgaagccgttaaacaga9960ttgagcaggaagtgcttaccacctggcccacggaggcaatttctcatgctgaaaacgtgg10020tgtaccggctgtctggtatgtatgagtttgtggtgaataatgcccctgaacagacagagg10080acgccgggcccgcagagcctgtttctgcgggaaagtgttcgacggtgagctgagttttgc10140cctgaaactggcgcgtgagatggggcgacccgactggcgtgccatgcttgccgggatgtc10200atccacggagtatgccgactggcaccgcttttacagtacccattattttcatgatgttct10260gctggatatgcacttttccgggctgacgtacaccgtgctcagcctgtttttcagcgatcc10320ggatatgcatccgctggatttcagtctgctgaaccggcgcgaggctgacgaagagcctga10380agatgatgtgctgatgcagaaagcggcagggcttgccggaggtgtccgctttggcccgga10440cgggaatgaagttatccccgcttccccggatgtggcggacatgacggaggatgacgtaat10500gctgatgacagtatcagaagggatcgcaggaggagtccggtatggctgaaccggtaggcg10560atctggtcgttgatttgagtctggatgcggccagatttgacgagcagatggccagagtca10620ggcgtcatttttctggtacggaaagtgatgcgaaaaaaacagcggcagtcgttgaacagt10680cgctgagccgacaggcgctggctgcacagaaagcggggatttccgtcgggcagtataaag10740ccgccatgcgtatgctgcctgcacagttcaccgacgtggccacgcagcttgcaggcgggc10800aaagtccgtggctgatcctgctgcaacagggggggcaggtgaaggactccttcggcggga10860tgatccccatgttcagggggcttgccggtgcgatcaccctgccgatggtgggggccacct10920cgctggcggtggcgaccggtgcgctggcgtatgcctggtatcagggcaactcaaccctgt10980ccgatttcaacaaaacgctggtcctttccggcaatcaggcgggactgacggcagatcgta11040tgctggtcctgtccagagccgggcaggcggcagggctgacgtttaaccagaccagcgagt11100cactcagcgcactggttaaggcgggggtaagcggtgaggctcagattgcgtccatcagcc11160agagtgtggcgcgtttctcctctgcatccggcgtggaggtggacaaggtcgctgaagcct11220tcgggaagctgaccacagacccgacgtcggggctgacggcgatggctcgccagttccata11280acgtgtcggcggagcagattgcgtatgttgctcagttgcagcgttccggcgatgaagccg11340gggcattgcaggcggcgaacgaggccgcaacgaaagggtttgatgaccagacccgccgcc11400tgaaagagaacatgggcacgctggagacctgggcagacaggactgcgcgggcattcaaat11460ccatgtgggatgcggtgctggatattggtcgtcctgataccgcgcaggagatgctgatta11520aggcagaggctgcgtataagaaagcagacgacatctggaatctgcgcaaggatgattatt11580ttgttaacgatgaagcgcgggcgcgttactgggatgatcgtgaaaaggcccgtcttgcgc11640ttgaagccgcccgaaagaaggctgagcagcagactcaacaggacaaaaatgcgcagcagc11700agagcgataccgaagcgtcacggctgaaatataccgaagaggcgcagaaggcttacgaac11760ggctgcagacgccgctggagaaatataccgcccgtcaggaagaactgaacaaggcactga11820aagacgggaaaatcctgcaggcggattacaacacgctgatggcggcggcgaaaaaggatt11880atgaagcgacgctgaaaaagccgaaacagtccagcgtgaaggtgtctgcgggcgatcgtc11940aggaagacagtgctcatgctgccctgctgacgcttcaggcagaactccggacgctggaga12000agcatgccggagcaaatgagaaaatcagccagcagcgccgggatttgtggaaggcggaga12060gtcagttcgcggtactggaggaggcggcgcaacgtcgccagctgtctgcacaggagaaat12120ccctgctggcgcataaagatgagacgctggagtacaaacgccagctggctgcacttggcg12180acaaggttacgtatcaggagcgcctgaacgcgctggcgcagcaggcggataaattcgcac12240agcagcaacgggcaaaacgggccgccattgatgcgaaaagccgggggctgactgaccggc12300aggcagaacgggaagccacggaacagcgcctgaaggaacagtatggcgataatccgctgg12360cgctgaataacgtcatgtcagagcagaaaaagacctgggcggctgaagaccagcttcgcg12420ggaactggatggcaggcctgaagtccggctggagtgagtgggaagagagcgccacggaca12480gtatgtcgcaggtaaaaagtgcagccacgcagacctttgatggtattgcacagaatatgg12540cggcgatgctgaccggcagtgagcagaactggcgcagcttcacccgttccgtgctgtcca12600tgatgacagaaattctgcttaagcaggcaatggtggggattgtcgggagtatcggcagcg12660ccattggcggggctgttggtggcggcgcatccgcgtcaggcggtacagccattcaggccg12720ctgcggcgaaattccattttgcaaccggaggatttacgggaaccggcggcaaatatgagc12780cagcggggattgttcaccgtggtgagtttgtcttcacgaaggaggcaaccagccggattg12840gcgtggggaatctttaccggctgatgcgcggctatgccaccggcggttatgtcggtacac12900cgggcagcatggcagacagccggtcgcaggcgtccgggacgtttgagcagaataaccatg12960tggtgattaacaacgacggcacgaacgggcagataggtccggctgctctgaaggcggtgt13020atgacatggcccgcaagggtgcccgtgatgaaattcagacacagatgcgtgatggtggcc13080tgttctccggaggtggacgatgaagaccttccgctggaaagtgaaacccggtatggatgt13140ggcttcggtcccttctgtaagaaaggtgcgctttggtgatggctattctcagcgagcgcc13200tgccgggctgaatgccaacctgaaaacgtacagcgtgacgctttctgtcccccgtgagga13260ggccacggtactggagtcgtttctggaagagcacgggggctggaaatcctttctgtggac13320gccgccttatgagtggcggcagataaaggtgacctgcgcaaaatggtcgtcgcgggtcag13380tatgctgcgtgttgagttcagcgcagagtttgaacaggtggtgaactgatgcaggatatc13440cggcaggaaacactgaatgaatgcacccgtgcggagcagtcggccagcgtggtgctctgg13500gaaatcgacctgacagaggtcggtggagaacgttattttttctgtaatgagcagaacgaa13560aaaggtgagccggtcacctggcaggggcgacagtatcagccgtatcccattcaggggagc13620ggttttgaactgaatggcaaaggcaccagtacgcgccccacgctgacggtttctaacctg13680tacggtatggtcaccgggatggcggaagatatgcagagtctggtcggcggaacggtggtc13740cggcgtaaggtttacgcccgttttctggatgcggtgaacttcgtcaacggaaacagttac13800gccgatccggagcaggaggtgatcagccgctggcgcattgagcagtgcagcgaactgagc13860gcggtgagtgcctcctttgtactgtccacgccgacggaaacggatggcgctgtttttccg13920ggacgtatcatgctggccaacacctgcacctggacctatcgcggtgacgagtgcggttat13980agcggtccggctgtcgcggatgaatatgaccagccaacgtccgatatcacgaaggataaa14040tgcagcaaatgcctgagcggttgtaagttccgcaataacgtcggcaactttggcggcttc14100ctttccattaacaaactttcgcagtaaatcccatgacacagacagaatcagcgattctgg14160cgcacgcccggcgatgtgcgccagcggagtcgtgcggcttcgtggtaagcacgccggagg14220gggaaagatatttcccctgcgtgaatatctccggtgagccggaggctatttccgtatgtc14280gccggaagactggctgcaggcagaaatgcagggtgagattgtggcgctggtccacagcca14340ccccggtggtctgccctggctgagtgaggccgaccggcggctgcaggtgcagagtgattt14400gccgtggtggctggtctgccgggggacgattcataagttccgctgtgtgccgcatctcac14460cgggcggcgctttgagcacggtgtgacggactgttacacactgttccgggatgcttatca14520tctggcggggattgagatgccggactttcatcgtgaggatgactggtggcgtaacggcca14580gaatctctatctggataatctggaggcgacggggctgtatcaggtgccgttgtcagcggc14640acagccgggcgatgtgctgctgtgctgttttggttcatcagtgccgaatcacgccgcaat14700ttactgcggcgacggcgagctgctgcaccatattcctgaacaactgagcaaacgagagag14760gtacaccgacaaatggcagcgacgcacacactccctctggcgtcaccgggcatggcgcgc14820atctgcctttacggggatttacaacgatttggtcgccgcatcgaccttcgtgtgaaaacg14880ggggctgaagccatccgggcactggccacacagctcccggcgtttcgtcagaaactgagc14940gacggctggtatcaggtacggattgccgggcgggacgtcagcacgtccgggttaacggcg15000cagttacatgagactctgcctgatggcgctgtaattcatattgttcccagagtcgccggg15060gccaagtcaggtggcgtattccagattgtcctgggggctgccgccattgccggatcattc15120tttaccgccggagccacccttgcagcatggggggcagccattggggccggtggtatgacc15180ggcatcctgttttctctcggtgccagtatggtgctcggtggtgtggcgcagatgctggca15240ccgaaagccagaactccccgtatacagacaacggataacggtaagcagaacacctatttc15300tcctcactggataacatggttgcccagggcaatgttctgcctgttctgtacggggaaatg15360cgcgtggggtcacgcgtggtttctcaggagatcagcacggcagacgaaggggacggtggt15420caggttgtggtgattggtcgctgatgcaaaatgttttatgtgaaaccgcctgcgggcggt15480tttgtcatttatggagcgtgaggaatgggtaaaggaagcagtaaggggcataccccgcgc15540gaagcgaaggacaacctgaagtccacgcagttgctgagtgtgatcgatgccatcagcgaa15600gggccgattgaaggtccggtggatggcttaaaaagcgtgctgctgaacagtacgccggtg15660ctggacactgaggggaataccaacatatccggtgtcacggtggtgttccgggctggtgag15720caggagcagactccgccggagggatttgaatcctccggctccgagacggtgctgggtacg15780gaagtgaaatatgacacgccgatcacccgcaccattacgtctgcaaacatcgaccgtctg15840cgctttaccttcggtgtacaggcactggtggaaaccacctcaaagggtgacaggaatccg15900tcggaagtccgcctgctggttcagatacaacgtaacggtggctgggtgacggaaaaagac15960atcaccattaagggcaaaaccacctcgcagtatctggcctcggtggtgatgggtaacctg16020ccgccgcgcccgtttaatatccggatgcgcaggatgacgccggacagcaccacagaccag16080ctgcagaacaaaacgctctggtcgtcatacactgaaatcatcgatgtgaaacagtgctac16140ccgaacacggcactggtcggcgtgcaggtggactcggagcagttcggcagccagcaggtg16200agccgtaattatcatctgcgcgggcgtattctgcaggtgccgtcgaactataacccgcag16260acgcggcaatacagcggtatctgggacggaacgtttaaaccggcatacagcaacaacatg16320gcctggtgtctgtgggatatgctgacccatccgcgctacggcatggggaaacgtcttggt16380gcggcggatgtggataaatgggcgctgtatgtcatcggccagtactgcgaccagtcagtg16440ccggacggctttggcggcacggagccgcgcatcacctgtaatgcgtacctgaccacacag16500cgtaaggcgtgggatgtgctcagcgatttctgctcggcgatgcgctgtatgccggtatgg16560aacgggcagacgctgacgttcgtgcaggaccgaccgtcggataagacgtggacctataac16620cgcagtaatgtggtgatgccggatgatggcgcgccgttccgctacagcttcagcgccctg16680aaggaccgccataatgccgttgaggtgaactggattgacccgaacaacggctgggagacg16740gcgacagagcttgttgaagatacgcaggccattgcccgttacggtcgtaatgttacgaag16800atggatgcctttggctgtaccagccgggggcaggcacaccgcgccgggctgtggctgatt16860aaaacagaactgctggaaacgcagaccgtggatttcagcgtcggcgcagaagggcttcgc16920catgtaccgggcgatgttattgaaatctgcgatgatgactatgccggtatcagcaccggt16980ggtcgtgtgctggcggtgaacagccagacccggacgctgacgctcgaccgtgaaatcacg17040ctgccatcctccggtaccgcgctgataagcctggttgacggaagtggcaatccggtcagc17100gtggaggttcagtccgtcaccgacggcgtgaaggtaaaagtgagccgtgttcctgacggt17160gttgctgaatacagcgtatgggagctgaagctgccgacgctgcgccagcgactgttccgc17220tgcgtgagtatccgtgagaacgacgacggcacgtatgccatcaccgccgtgcagcatgtg17280ccggaaaaagaggccatcgtggataacggggcgcactttgacggcgaacagagtggcacg17340gtgaatggtgtcacgccgccagcggtgcagcacctgaccgcagaagtcactgcagacagc17400ggggaatatcaggtgctggcgcgatgggacacaccgaaggtggtgaagggcgtgagtttc17460ctgctccgtctgaccgtaacagcggacgacggcagtgagcggctggtcagcacggcccgg17520acgacggaaaccacataccgcttcacgcaactggcgctggggaactacaggctgacagtc17580cgggcggtaaatgcgtgggggcagcagggcgatccggcgtcggtatcgttccggattgcc17640gcaccggcagcaccgtcgaggattgagctgacgccgggctattttcagataaccgccacg17700ccgcatcttgccgtttatgacccgacggtacagtttgagttctggttctcggaaaagcag17760attgcggatatcagacaggttgaaaccagcacgcgttatcttggtacggcgctgtactgg17820atagccgccagtatcaatatcaaaccgggccatgattattacttttatatccgcagtgtg17880aacaccgttggcaaatcggcattcgtggaggccgtcggtcgggcgagcgatgatgcggaa17940ggttacctggattttttcaaaggcaagataaccgaatcccatctcggcaaggagctgctg18000gaaaaagtcgagctgacggaggataacgccagcagactggaggagttttcgaaagagtgg18060aaggatgccagtgataagtggaatgccatgtgggctgtcaaaattgagcagaccaaagac18120ggcaaacattatgtcgcgggtattggcctcagcatggaggacacggaggaaggcaaactg18180agccagtttctggttgccgccaatcgtatcgcatttattgacccggcaaacgggaatgaa18240acgccgatgtttgtggcgcagggcaaccagatattcatgaacgacgtgttcctgaagcgc18300ctgacggcccccaccattaccagcggcggcaatcctccggccttttccctgacaccggac18360ggaaagctgaccgctaaaaatgcggatatcagtggcagtgtgaatgcgaactccgggacg18420ctcagtaatgtgacgatagctgaaaactgtacgataaacggtacgctgagggcggaaaaa18480atcgtcggggacattgtaaaggcggcgagcgcggcttttccgcgccagcgtgaaagcagt18540gtggactggccgtcaggtacccgtactgtcaccgtgaccgatgaccatccttttgatcgc18600cagatagtggtgcttccgctgacgtttcgcggaagtaagcgtactgtcagcggcaggaca18660acgtattcgatgtgttatctgaaagtactgatgaacggtgcggtgatttatgatggcgcg18720gcgaacgaggcggtacaggtgttctcccgtattgttgacatgccagcgggtcggggaaac18780gtgatcctgacgttcacgcttacgtccacacggcattcggcagatattccgccgtatacg18840tttgccagcgatgtgcaggttatggtgattaagaaacaggcgctgggcatcagcgtggtc18900tgagtgtgttacagaggttcgtccgggaacgggcgttttattataaaacagtgagaggtg18960aacgatgcgtaatgtgtgtattgccgttgctgtctttgccgcacttgcggtgacagtcac19020tccggcccgtgcggaaggtggacatggtacgtttacggtgggctattttcaagtgaaacc19080gggtacattgccgtcgttgtcgggcggggataccggtgtgagtcatctgaaagggattaa19140cgtgaagtaccgttatgagctgacggacagtgtgggggtgatggcttccctggggttcgc19200cgcgtcgaaaaagagcagcacagtgatgaccggggaggatacgtttcactatgagagcct19260gcgtggacgttatgtgagcgtgatggccggaccggttttacaaatcagtaagcaggtcag19320tgcgtacgccatggccggagtggctcacagtcggtggtccggcagtacaatggattaccg19380taagacggaaatcactcccgggtatatgaaagagacgaccactgccagggacgaaagtgc19440aatgcggcatacctcagtggcgtggagtgcaggtatacagattaatccggcagcgtccgt19500cgttgttgatattgcttatgaaggctccggcagtggcgactggcgtactgacggattcat19560cgttggggtcggttataaattctgattagccaggtaacacagtgttatgacagcccgccg19620gaaccggtgggcttttttgtggggtgaatatggcagtaaagatttcaggagtcctgaaag19680acggcacaggaaaaccggtacagaactgcaccattcagctgaaagccagacgtaacagca19740ccacggtggtggtgaacacggtgggctcagagaatccggatgaagccgggcgttacagca19800tggatgtggagtacggtcagtacagtgtcatcctgcaggttgacggttttccaccatcgc19860acgccgggaccatcaccgtgtatgaagattcacaaccggggacgctgaatgattttctct19920gtgccatgacggaggatgatgcccggccggaggtgctgcgtcgtcttgaactgatggtgg19980aagaggtggcgcgtaacgcgtccgtggtggcacagagtacggcagacgcgaagaaatcag20040ccggcgatgccagtgcatcagctgctcaggtcgcggcccttgtgactgatgcaactgact20100cagcacgcgccgccagcacgtccgccggacaggctgcatcgtcagctcaggaagcgtcct20160ccggcgcagaagcggcatcagcaaaggccactgaagcggaaaaaagtgccgcagccgcag20220agtcctcaaaaaacgcggcggccaccagtgccggtgcggcgaaaacgtcagaaacgaatg20280ctgcagcgtcacaacaatcagccgccacgtctgcctccaccgcggccacgaaagcgtcag20340aggccgccacttcagcacgagatgcggtggcctcaaaagaggcagcaaaatcatcagaaa20400cgaacgcatcatcaagtgccggtcgtgcagcttcctcggcaacggcggcagaaaattctg20460ccagggcggcaaaaacgtccgagacgaatgccaggtcatctgaaacagcagcggaacgga20520gcgcctctgccgcggcagacgcaaaaacagcggcggcggggagtgcgtcaacggcatcca20580cgaaggcgacagaggctgcgggaagtgcggtatcagcatcgcagagcaaaagtgcggcag20640aagcggcggcaatacgtgcaaaaaattcggcaaaacgtgcagaagatatagcttcagctg20700tcgcgcttgaggatgcggacacaacgagaaaggggatagtgcagctcagcagtgcaacca20760acagcacgtctgaaacgcttgctgcaacgccaaaggcggttaaggtggtaatggatgaaa20820cgaacagaaaagcccactggacagtccggcactgaccggaacgccaacagcaccaaccgc20880gctcaggggaacaaacaatacccagattgcgaacaccgcttttgtactggccgcgattgc20940agatgttatcgacgcgtcacctgacgcactgaatacgctgaatgaactggccgcagcgct21000cgggaatgatccagattttgctaccaccatgactaacgcgcttgcgggtaaacaaccgaa21060gaatgcgacactgacggcgctggcagggctttccacggcgaaaaataaattaccgtattt21120tgcggaaaatgatgccgccagcctgactgaactgactcaggttggcagggatattctggc21180aaaaaattccgttgcagatgttcttgaataccttggggccggtgagaattcggcctttcc21240ggcaggtgcgccgatcccgtggccatcagatatcgttccgtctggctacgtcctgatgca21300ggggcaggcgtttgacaaatcagcctacccaaaacttgctgtcgcgtatccatcgggtgt21360gcttcctgatatgcgaggctggacaatcaaggggaaacccgccagcggtcgtgctgtatt21420gtctcaggaacaggatggaattaagtcgcacacccacagtgccagtgcatccggtacgga21480tttggggacgaaaaccacatcgtcgtttgattacgggacgaaaacaacaggcagtttcga21540ttacggcaccaaatcgacgaataacacgggggctcatgctcacagtctgagcggttcaac21600aggggccgcgggtgctcatgcccacacaagtggtttaaggatgaacagttctggctggag21660tcagtatggaacagcaaccattacaggaagtttatccacagttaaaggaaccagcacaca21720gggtattgcttatttatcgaaaacggacagtcagggcagccacagtcactcattgtccgg21780tacagccgtgagtgccggtgcacatgcgcatacagttggtattggtgcgcaccagcatcc21840ggttgttatcggtgctcatgcccattctttcagtattggttcacacggacacaccatcac21900cgttaacgctgcgggtaacgcggaaaacaccgtcaaaaacattgcatttaactatattgt21960gaggcttgcataatggcattcagaatgagtgaacaaccacggaccataaaaatttataat22020ctgctggccggaactaatgaatttattggtgaaggtgacgcatatattccgcctcatacc22080ggtctgcctgcaaacagtaccgatattgcaccgccagatattccggctggctttgtggct22140gttttcaacagtgatgaggcatcgtggcatctcgttgaagaccatcggggtaaaaccgtc22200tatgacgtggcttccggcgacgcgttatttatttctgaactcggtccgttaccggaaaat22260tttacctggttatcgccgggaggggaatatcagaagtggaacggcacagcctgggtgaag22320gatacggaagcagaaaaactgttccggatccgggaggcggaagaaacaaaaaaaagcctg22380atgcaggtagccagtgagcatattgcgccgcttcaggatgctgcagatctggaaattgca22440acgaaggaagaaacctcgttgctggaagcctggaagaagtatcgggtgttgctgaaccgt22500gttgatacatcaactgcacctgatattgagtggcctgctgtccctgttatggagtaatcg22560ttttgtgatatgccgcagaaacgttgtatgaaataacgttctgcggttagttagtatatt22620gtaaagctgagtattggtttatttggcgattattatcttcaggagaataatggaagttct22680atgactcaattgttcatagtgtttacatcaccgccaattgcttttaagactgaacgcatg22740aaatatggtttttcgtcatgttttgagtctgctgttgatatttctaaagtcggttttttt22800tcttcgttttctctaactattttccatgaaatacatttttgattattatttgaatcaatt22860ccaattacctgaagtctttcatctataattggcattgtatgtattggtttattggagtag22920atgcttgcttttctgagccatagctctgatatccaaatgaagccataggcatttgttatt22980ttggctctgtcagctgcataacgccaaaaaatatatttatctgcttgatcttcaaatgtt23040gtattgattaaatcaattggatggaattgtttatcataaaaaattaatgtttgaatgtga23100taaccgtcctttaaaaaagtcgtttctgcaagcttggctgtatagtcaactaactcttct23160gtcgaagtgatatttttaggcttatctaccagttttagacgctctttaatatcttcagga23220attattttattgtcatattgtatcatgctaaatgacaatttgcttatggagtaatctttt23280aattttaaataagttattctcctggcttcatcaaataaagagtcgaatgatgttggcgaa23340atcacatcgtcacccattggattgtttatttgtatgccaagagagttacagcagttatac23400attctgccatagattatagctaaggcatgtaataattcgtaatcttttagcgtattagcg23460acccatcgtctttctgatttaataatagatgattcagttaaatatgaaggtaatttcttt23520tgtgcaagtctgactaacttttttataccaatgtttaacatactttcatttgtaataaac23580tcaatgtcattttcttcaatgtaagatgaaataagagtagcctttgcctcgctatacatt23640tctaaatcgccttgtttttctatcgtattgcgagaatttttagcccaagccattaatgga23700tcatttttccatttttcaataacattattgttataccaaatgtcatatcctataatctgg23760tttttgtttttttgaataataaatgttactgttcttgcggtttggaggaattgattcaaa23820ttcaagcgaaataattcagggtcaaaatatgtatcaatgcagcatttgagcaagtgcgat23880aaatctttaagtcttctttcccatggttttttagtcataaaactctccattttgataggt23940tgcatgctagatgctgatatattttagaggtgataaaattaactgcttaactgtcaatgt24000aatacaagttgtttgatctttgcaatgattcttatcagaaaccatatagtaaattagtta24060cacaggaaatttttaatattattattatcattcattatgtattaaaattagagttgtggc24120ttggctctgctaacacgttgctcataggagatatggtagagccgcagacacgtcgtatgc24180aggaacgtgctgcggctggctggtgaacttccgatagtgcgggtgttgaatgatttccag24240ttgctaccgattttacatattttttgcatgagagaatttgtaccacctcccaccgaccat24300ctatgactgtacgccactgtccctaggactgctatgtgccggagcggacattacaaacgt24360ccttctcggtgcatgccactgttgccaatgacctgcctaggaattggttagcaagttact24420accggattttgtaaaaacagccctcctcatataaaaagtattcgttcacttccgataagc24480gtcgtaattttctatctttcatcatattctagatccctctgaaaaaatcttccgagtttg24540ctaggcactgatacataactcttttccaataattggggaagtcattcaaatctataatag24600gtttcagatttgcttcaataaattctgactgtagctgctgaaacgttgcggttgaactat24660atttccttataacttttacgaaagagtttctttgagtaatcacttcactcaagtgcttcc24720ctgcctccaaacgatacctgttagcaatatttaatagcttgaaatgatgaagagctctgt24780gtttgtcttcctgcctccagttcgccgggcattcaacataaaaactgatagcacccggag24840ttccggaaacgaaatttgcatatacccattgctcacgaaaaaaaatgtccttgtcgatat24900agggatgaatcgcttggtgtacctcatctactgcgaaaacttgacctttctctcccatat24960tgcagtcgcggcacgatggaactaaattaataggcatcaccgaaaattcaggataatgtg25020caataggaagaaaatgatctatattttttgtctgtcctatatcaccacaaaatggacatt25080tttcacctgatgaaacaagcatgtcatcgtaatatgttctagcgggtttgtttttatctc25140ggagattattttcataaagcttttctaatttaacctttgtcaggttaccaactactaagg25200ttgtaggctcaagagggtgtgtcctgtcgtaggtaaataactgacctgtcgagcttaata25260ttctatattgttgttctttctgcaaaaaagtggggaagtgagtaatgaaattatttctaa25320catttatctgcatcataccttccgagcatttattaagcatttcgctataagttctcgctg25380gaagaggtagttttttcattgtactttaccttcatctctgttcattatcatcgcttttaa25440aacggttcgaccttctaatcctatctgaccattataattttttagaatggtttcataaga25500aagctctgaatcaacggactgcgataataagtggtggtatccagaatttgtcacttcaag25560taaaaacacctcacgagttaaaacacctaagttctcaccgaatgtctcaatatccggacg25620gataatatttattgcttctcttgaccgtaggactttccacatgcaggattttggaacctc25680ttgcagtactactggggaatgagttgcaattattgctacaccattgcgtgcatcgagtaa25740gtcgcttaatgttcgtaaaaaagcagagagcaaaggtggatgcagatgaacctctggttc25800atcgaataaaactaatgacttttcgccaacgacatctactaatcttgtgatagtaaataa25860aacaattgcatgtccagagctcattcgaagcagatatttctggatattgtcataaaacaa25920tttagtgaatttatcatcgtccacttgaatctgtggttcattacgtcttaactcttcata25980tttagaaatgaggctgatgagttccatatttgaaaagttttcatcactacttagtttttt26040gatagcttcaagccagagttgtctttttctatctactctcatacaaccaataaatgctga26100aatgaattctaagcggagatcgcctagtgattttaaactattgctggcagcattcttgag26160tccaatataaaagtattgtgtaccttttgctgggtcaggttgttctttaggaggagtaaa26220aggatcaaatgcactaaacgaaactgaaacaagcgatcgaaaatatccctttgggattct26280tgactcgataagtctattattttcagagaaaaaatattcattgttttctgggttggtgat26340tgcaccaatcattccattcaaaattgttgttttaccacacccattccgcccgataaaagc26400atgaatgttcgtgctgggcatagaattaaccgtcacctcaaaaggtatagttaaatcact26460gaatccgggagcactttttctattaaatgaaaagtggaaatctgacaattctggcaaacc26520atttaacacacgtgcgaactgtccatgaatttctgaaagagttacccctctaagtaatga26580ggtgttaaggacgctttcattttcaatgtcggctaatcgatttggccatactactaaatc26640ctgaatagctttaagaaggttatgtttaaaaccatcgcttaatttgctgagattaacata26700gtagtcaatgctttcacctaaggaaaaaaacatttcagggagttgactgaattttttatc26760tattaatgaataagtgcttacttcttctttttgacctacaaaaccaattttaacatttcc26820gatatcgcatttttcaccatgctcatcaaagacagtaagataaaacattgtaacaaagga26880atagtcattccaaccatctgctcgtaggaatgccttatttttttctactgcaggaatata26940cccgcctctttcaataacactaaactccaacatatagtaacccttaattttattaaaata27000accgcaatttatttggcggcaacacaggatctctcttttaagttactctctattacatac27060gttttccatctaaaaattagtagtattgaacttaacggggcatcgtattgtagttttcca27120tatttagctttctgcttccttttggataacccactgttattcatgttgcatggtgcactg27180tttataccaacgatatagtctattaatgcatatatagtatcgccgaacgattagctcttc27240aggcttctgaagaagcgtttcaagtactaataagccgatagatagccacggacttcgtag27300ccatttttcataagtgttaacttccgctcctcgctcataacagacattcactacagttat27360ggcggaaaggtatgcatgctgggtgtggggaagtcgtgaaagaaaagaagtcagctgcgt27420cgtttgacatcactgctatcttcttactggttatgcaggtcgtagtgggtggcacacaaa27480gctttgcactggattgcgaggctttgtgcttctctggagtgcgacaggtttgatgacaaa27540aaattagcgcaagaagacaaaaatcaccttgcgctaatgctctgttacaggtcactaata27600ccatctaagtagttgattcatagtgactgcatatgttgtgttttacagtattatgtagtc27660tgttttttatgcaaaatctaatttaatatattgatatttatatcattttacgtttctcgt27720tcagcttttttatactaagttggcattataaaaaagcattgcttatcaatttgttgcaac27780gaacaggtcactatcagtcaaaataaaatcattatttgatttcaattttgtcccactccc27840tgcctctgtcatcacgatactgtgatgccatggtgtccgacttatgcccgagaagatgtt27900gagcaaacttatcgcttatctgcttctcatagagtcttgcagacaaactgcgcaactcgt27960gaaaggtaggcggatccccttcgaaggaaagacctgatgcttttcgtgcgcgcataaaat28020accttgatactgtgccggatgaaagcggttcgcgacgagtagatgcaattatggtttctc28080cgccaagaatctctttgcatttatcaagtgtttccttcattgatattccgagagcatcaa28140tatgcaatgctgttgggatggcaatttttacgcctgttttgctttgctcgacataaagat28200atccatctacgatatcagaccacttcatttcgcataaatcaccaactcgttgcccggtaa28260caacagccagttccattgcaagtctgagccaacatggtgatgattctgctgcttgataaa28320ttttcaggtattcgtcagccgtaagtcttgatctccttacctctgattttgctgcgcgag28380tggcagcgacatggtttgttgttatatggccttcagctattgcctctcggaatgcatcgc28440tcagtgttgatctgattaacttggctgacgccgccttgccctcgtctatgtatccattga28500gcattgccgcaatttcttttgtggtgatgtcttcaagtggagcatcaggcagacccctcc28560ttattgctttaattttgctcatgtaatttatgagtgtcttctgcttgattcctctgctgg28620ccaggattttttcgtagcgatcaagccatgaatgtaacgtaacggaattatcactgttga28680ttctcgctgtcagaggcttgtgtttgtgtcctgaaaataactcaatgttggcctgtatag28740cttcagtgattgcgattcgcctgtctctgcctaatccaaactctttacccgtccttgggt28800ccctgtagcagtaatatccattgtttcttatataaaggttagggggtaaatcccggcgct28860catgacttcgccttcttcccatttctgatcctcttcaaaaggccacctgttactggtcga28920tttaagtcaacctttaccgctgattcgtggaacagatactctcttccatccttaaccgga28980ggtgggaatatcctgcattcccgaacccatcgacgaactgtttcaaggcttcttggacgt29040cgctggcgtgcgttccactcctgaagtgtcaagtacatcgcaaagtctccgcaattacac29100gcaagaaaaaaccgccatcaggcggcttggtgttctttcagttcttcaattcgaatattg29160gttacgtctgcatgtgctatctgcgcccatatcatccagtggtcgtagcagtcgttgatg29220ttctccgcttcgataactctgttgaatggctctccattccattctcctgtgactcggaag29280tgcatttatcatctccataaaacaaaacccgccgtagcgagttcagataaaataaatccc29340cgcgagtgcgaggattgttatgtaatattgggtttaatcatctatatgttttgtacagag29400agggcaagtatcgtttccaccgtactcgtgataataattttgcacggtatcagtcatttc29460tcgcacattgcagaatggggatttgtcttcattagacttataaaccttcatggaatattt29520gtatgccgactctatatctataccttcatctacataaacaccttcgtgatgtctgcatgg29580agacaagacaccggatctgcacaacattgataacgcccaatctttttgctcagactctaa29640ctcattgatactcatttataaactccttgcaatgtatgtcgtttcagctaaacggtatca29700gcaatgtttatgtaaagaaacagtaagataatactcaacccgatgtttgagtacggtcat29760catctgacactacagactctggcatcgctgtgaagacgacgcgaaattcagcattttcac29820aagcgttatcttttacaaaaccgatctcactctcctttgatgcgaatgccagcgtcagac29880atcatatgcagatactcacctgcatcctgaacccattgacctccaaccccgtaatagcga29940tgcgtaatgatgtcgatagttactaacgggtcttgttcgattaactgccgcagaaactct30000tccaggtcaccagtgcagtgcttgataacaggagtcttcccaggatggcgaacaacaaga30060aactggtttccgtcttcacggacttcgttgctttccagtttagcaatacgcttactccca30120tccgagataacaccttcgtaatactcacgctgctcgttgagttttgattttgctgtttca30180agctcaacacgcagtttccctactgttagcgcaatatcctcgttctcctggtcgcggcgt30240ttgatgtattgctggtttctttcccgttcatccagcagttccagcacaatcgatggtgtt30300accaattcatggaaaaggtctgcgtcaaatccccagtcgtcatgcattgcctgctctgcc30360gcttcacgcagtgcctgagagttaatttcgctcacttcgaacctctctgtttactgataa30420gttccagatcctcctggcaacttgcacaagtccgacaaccctgaacgaccaggcgtcttc30480gttcatctatcggatcgccacactcacaacaatgagtggcagatatagcctggtggttca30540ggcggcgcatttttattgctgtgttgcgctgtaattcttctatttctgatgctgaatcaa30600tgatgtctgccatctttcattaatccctgaactgttggttaatacgcttgagggtgaatg30660cgaataataaaaaaggagcctgtagctccctgatgattttgcttttcatgttcatcgttc30720cttaaagacgccgtttaacatgccgattgccaggcttaaatgagtcggtgtgaatcccat30780cagcgttaccgtttcgcggtgcttcttcagtacgctacggcaaatgtcatcgacgttttt30840atccggaaactgctgtctggctttttttgatttcagaattagcctgacgggcaatgctgc30900gaagggcgttttcctgctgaggtgtcattgaacaagtcccatgtcggcaagcataagcac30960acagaatatgaagcccgctgccagaaaaatgcattccgtggttgtcatacctggtttctc31020tcatctgcttctgctttcgccaccatcatttccagcttttgtgaaagggatgcggctaac31080gtatgaaattcttcgtctgtttctactggtattggcacaaacctgattccaatttgagca31140aggctatgtgccatctcgatactcgttcttaactcaacagaagatgctttgtgcatacag31200cccctcgtttattatttatctcctcagccagccgctgtgctttcagtggatttcggataa31260cagaaaggccgggaaatacccagcctcgctttgtaacggagtagacgaaagtgattgcgc31320ctacccggatattatcgtgaggatgcgtcatcgccattgctccccaaatacaaaaccaat31380ttcagccagtgcctcgtccattttttcgatgaactccggcacgatctcgtcaaaactcgc31440catgtacttttcatcccgctcaatcacgacataatgcaggccttcacgcttcatacgcgg31500gtcatagttggcaaagtaccaggcattttttcgcgtcacccacatgctgtactgcacctg31560ggccatgtaagctgactttatggcctcgaaaccaccgagccggaacttcatgaaatcccg31620ggaggtaaacgggcatttcagttcaaggccgttgccgtcactgcataaaccatcgggaga31680gcaggcggtacgcatactttcgtcgcgatagatgatcggggattcagtaacattcacgcc31740ggaagtgaattcaaacagggttctggcgtcgttctcgtactgttttccccaggccagtgc31800tttagcgttaacttccggagccacaccggtgcaaacctcagcaagcagggtgtggaagta31860ggacattttcatgtcaggccacttctttccggagcggggttttgctatcacgttgtgaac31920ttctgaagcggtgatgacgccgagccgtaatttgtgccacgcatcatccccctgttcgac31980agctctcacatcgatcccggtacgctgcaggataatgtccggtgtcatgctgccaccttc32040tgctctgcggctttctgtttcaggaatccaagagcttttactgcttcggcctgtgtcagt32100tctgacgatgcacgaatgtcgcggcgaaatatctgggaacagagcggcaataagtcgtca32160tcccatgttttatccagggcgatcagcagagtgttaatctcctgcatggtttcatcgtta32220accggagtgatgtcgcgttccggctgacgttctgcagtgtatgcagtattttcgacaatg32280cgctcggcttcatccttgtcatagataccagcaaatccgaaggccagacgggcacactga32340atcatggctttatgacgtaacatccgtttgggatgcgactgccacggccccgtgatttct32400ctgccttcgcgagttttgaatggttcgcggcggcattcatccatccattcggtaacgcag32460atcggatgattacggtccttgcggtaaatccggcatgtacaggattcattgtcctgctca32520aagtccatgccatcaaactgctggttttcattgatgatgcgggaccagccatcaacgccc32580accaccggaacgatgccattctgcttatcaggaaaggcgtaaatttctttcgtccacgga32640ttaaggccgtactggttggcaacgatcagtaatgcgatgaactgcgcatcgctggcatca32700cctttaaatgccgtctggcgaagagtggtgatcagttcctgtgggtcgacagaatccatg32760ccgacacgttcagccagcttcccagccagcgttgcgagtgcagtactcattcgttttata32820cctctgaatcaatatcaacctggtggtgagcaatggtttcaaccatgtaccggatgtgtt32880ctgccatgcgctcctgaaactcaacatcgtcatcaaacgcacgggtaatggattttttgc32940tggccccgtggcgttgcaaatgatcgatgcatagcgattcaaacaggtgctggggcaggc33000ctttttccatgtcgtctgccagttctgcctctttctcttcacgggcgagctgctggtagt33060gacgcgcccagctctgagcctcaagacgatcctgaatgtaataagcgttcatggctgaac33120tcctgaaatagctgtgaaaatatcgcccgcgaaatgccgggctgattaggaaaacaggaa33180agggggttagtgaatgcttttgcttgatctcagtttcagtattaatatccattttttata33240agcgtcgacggcttcacgaaacatcttttcatcgccaataaaagtggcgatagtgaattt33300agtctggatagccataagtgtttgatccattctttgggactcctggctgattaagtatgt33360cgataaggcgtttccatccgtcacgtaatttacgggtgattcgttcaagtaaagattcgg33420aagggcagccagcaacaggccaccctgcaatggcatattgcatggtgtgctccttattta33480tacataacgaaaaacgcctcgagtgaagcgttattggtatgcggtaaaaccgcactcagg33540cggccttgatagtcatatcatctgaatcaaatattcctgatgtatcgatatcggtaattc33600ttattccttcgctaccatccattggaggccatccttcctgaccatttccatcattccagt33660cgaactcacacacaacaccatatgcatttaagtcgcttgaaattgctataagcagagcat33720gttgcgccagcatgattaatacagcatttaatacagagccgtgtttattgagtcggtatt33780cagagtctgaccagaaattattaatctggtgaagtttttcctctgtcattacgtcatggt33840cgatttcaatttctattgatgctttccagtcgtaatcaatgatgtattttttgatgtttg33900acatctgttcatatcctcacagataaaaaatcgccctcacactggagggcaaagaagatt33960tccaataatcagaacaagtcggctcctgtttagttacgagcgacattgctccgtgtattc34020actcgttggaatgaatacacagtgcagtgtttattctgttatttatgccaaaaataaagg34080ccactatcaggcagctttgttgttctgtttaccaagttctctggcaatcattgccgtcgt34140tcgtattgcccatttatcgacatatttcccatcttccattacaggaaacatttcttcagg34200cttaaccatgcattccgattgcagcttgcatccattgcatcgcttgaattgtccacacca34260ttgatttttatcaatagtcgtagtcatacggatagtcctggtattgttccatcacatcct34320gaggatgctcttcgaactcttcaaattcttcttccatatatcaccttaaatagtggattg34380cggtagtaaagattgtgcctgtcttttaaccacatcaggctcggtggttctcgtgtaccc34440ctacagcgagaaatcggataaactattacaacccctacagtttgatgagtatagaaatgg34500atccactcgttattctcggacgagtgttcagtaatgaacctctggagagaaccatgtata34560tgatcgttatctgggttggacttctgcttttaagcccagataactggcctgaatatgtta34620atgagagaatcggtattcctcatgtgtggcatgttttcgtctttgctcttgcattttcgc34680tagcaattaatgtgcatcgattatcagctattgccagcgccagatataagcgatttaagc34740taagaaaacgcattaagatgcaaaacgataaagtgcgatcagtaattcaaaaccttacag34800aagagcaatctatggttttgtgcgcagcccttaatgaaggcaggaagtatgtggttacat34860caaaacaattcccatacattagtgagttgattgagcttggtgtgttgaacaaaacttttt34920cccgatggaatggaaagcatatattattccctattgaggatatttactggactgaattag34980ttgccagctatgatccatataatattgagataaagccaaggccaatatctaagtaactag35040ataagaggaatcgattttcccttaattttctggcgtccactgcatgttatgccgcgttcg35100ccaggcttgctgtaccatgtgcgctgattcttgcgctcaatacgttgcaggttgctttca35160atctgtttgtggtattcagccagcactgtaaggtctatcggatttagtgcgctttctact35220cgtgatttcggtttgcgattcagcgagagaatagggcggttaactggttttgcgcttacc35280ccaaccaacaggggatttgctgctttccattgagcctgtttctctgcgcgacgttcgcgg35340cggcgtgtttgtgcatccatctggattctcctgtcagttagctttggtggtgtgtggcag35400ttgtagtcctgaacgaaaaccccccgcgattggcacattggcagctaatccggaatcgca35460cttacggccaatgcttcgtttcgtatcacacaccccaaagccttctgctttgaatgctgc35520ccttcttcagggcttaatttttaagagcgtcaccttcatggtggtcagtgcgtcctgctg35580atgtgctcagtatcaccgccagtggtatttatgtcaacaccgccagagataatttatcac35640cgcagatggttatctgtatgttttttatatgaatttattttttgcaggggggcattgttt35700ggtaggtgagagatctgaattgctatgtttagtgagttgtatctatttatttttcaataa35760atacaattggttatgtgttttgggggcgatcgtgaggcaaagaaaacccggcgctgaggc35820cgggttattcttgttctctggtcaaattatatagttggaaaacaaggatgcatatatgaa35880tgaacgatgcagaggcaatgccgatggcgatagtgggtatcatgtagccgcttatgctgg35940aaagaagcaataacccgcagaaaaacaaagctccaagctcaacaaaactaagggcataga36000caataactaccgatgtcatatacccatactctctaatcttggccagtcggcgcgttctgc36060ttccgattagaaacgtcaaggcagcaatcaggattgcaatcatggttcctgcatatgatg36120acaatgtcgccccaagaccatctctatgagctgaaaaagaaacaccaggaatgtagtggc36180ggaaaaggagatagcaaatgcttacgataacgtaaggaattattactatgtaaacaccag36240gcatgattctgttccgcataattactcctgataattaatccttaactttgcccacctgcc36300ttttaaaacattccagtatatcacttttcattcttgcgtagcaatatgccatctcttcag36360ctatctcagcattggtgaccttgttcagaggcgctgagagatggcctttttctgatagat36420aatgttctgttaaaatatctccggcctcatcttttgcccgcaggctaatgtctgaaaatt36480gaggtgacgggttaaaaataatatccttggcaaccttttttatatcccttttaaattttg36540gcttaatgactatatccaatgagtcaaaaagctccccttcaatatctgttgcccctaaga36600cctttaatatatcgccaaatacaggtagcttggcttctaccttcaccgttgttcggccga36660tgaaatgcatatgcataacatcgtctttggtggttcccctcatcagtggctctatctgaa36720cgcgctctccactgcttaatgacattcctttcccgattaaaaaatctgtcagatcggatg36780tggtcggcccgaaaacagttctggcaaaaccaatggtgtcgccttcaacaaacaaaaaag36840atgggaatcccaatgattcgtcatctgcgaggctgttcttaatatcttcaactgaagctt36900tagagcgatttatcttctgaaccagactcttgtcatttgttttggtaaagagaaaagttt36960ttccatcgattttatgaatatacaaataattggagccaacctgcaggtgatgattatcag37020ccagcagagaattaaggaaaacagacaggtttattgagcgcttatctttccctttatttt37080tgctgcggtaagtcgcataaaaaccattcttcataattcaatccatttactatgttatgt37140tctgaggggagtgaaaattcccctaattcgatgaagattcttgctcaattgttatcagct37200atgcgccgaccagaacaccttgccgatcagccaaacgtctcttcaggccactgactagcg37260ataactttccccacaacggaacaactctcattgcatgggatcattgggtactgtgggttt37320agtggttgtaaaaacacctgaccgctatccctgatcagtttcttgaaggtaaactcatca37380cccccaagtctggctatgcagaaatcacctggctcaacagcctgctcagggtcaacgaga37440attaacattccgtcaggaaagcttggcttggagcctgttggtgcggtcatggaattacct37500tcaacctcaagccagaatgcagaatcactggcttttttggttgtgcttacccatctctcc37560gcatcacctttggtaaaggttctaagcttaggtgagaacatccctgcctgaacatgagaa37620aaaacagggtactcatactcacttctaagtgacggctgcatactaaccgcttcatacatc37680tcgtagatttctctggcgattgaagggctaaattcttcaacgctaactttgagaattttt37740gtaagcaatgcggcgttataagcatttaatgcattgatgccattaaataaagcaccaacg37800cctgactgccccatccccatcttgtctgcgacagattcctgggataagccaagttcattt37860ttctttttttcataaattgctttaaggcgacgtgcgtcctcaagctgctcttgtgttaat37920ggtttcttttttgtgctcatacgttaaatctatcaccgcaagggataaatatctaacacc37980gtgcgtgttgactattttacctctggcggtgataatggttgcatgtactaaggaggttgt38040atggaacaacgcataaccctgaaagattatgcaatgcgctttgggcaaaccaagacagct38100aaagatctcggcgtatatcaaagcgcgatcaacaaggccattcatgcaggccgaaagatt38160tttttaactataaacgctgatggaagcgtttatgcggaagaggtaaagcccttcccgagt38220aacaaaaaaacaacagcataaataaccccgctcttacacattccagccctgaaaaagggc38280atcaaattaaaccacacctatggtgtatgcatttatttgcatacattcaatcaattgtta38340tctaaggaaatacttacatatggttcgtgcaaacaaacgcaacgaggctctacgaatcga38400gagtgcgttgcttaacaaaatcgcaatgcttggaactgagaagacagcggaagctgtggg38460cgttgataagtcgcagatcagcaggtggaagagggactggattccaaagttctcaatgct38520gcttgctgttcttgaatggggggtcgttgacgacgacatggctcgattggcgcgacaagt38580tgctgcgattctcaccaataaaaaacgcccggcggcaaccgagcgttctgaacaaatcca38640gatggagttctgaggtcattactggatctatcaacaggagtcattatgacaaatacagca38700aaaatactcaacttcggcagaggtaactttgccggacaggagcgtaatgtggcagatctc38760gatgatggttacgccagactatcaaatatgctgcttgaggcttattcgggcgcagatctg38820accaagcgacagtttaaagtgctgcttgccattctgcgtaaaacctatgggtggaataaa38880ccaatggacagaatcaccgattctcaacttagcgagattacaaagttacctgtcaaacgg38940tgcaatgaagccaagttagaactcgtcagaatgaatattatcaagcagcaaggcggcatg39000tttggaccaaataaaaacatctcagaatggtgcatccctcaaaacgagggaaaatcccct39060aaaacgagggataaaacatccctcaaattgggggattgctatccctcaaaacagggggac39120acaaaagacactattacaaaagaaaaaagaaaagattattcgtcagagaattctggcgaa39180tcctctgaccagccagaaaacgacctttctgtggtgaaaccggatgctgcaattcagagc39240ggcagcaagtgggggacagcagaagacctgaccgccgcagagtggatgtttgacatggtg39300aagactatcgcaccatcagccagaaaaccgaattttgctgggtgggctaacgatatccgc39360ctgatgcgtgaacgtgacggacgtaaccaccgcgacatgtgtgtgctgttccgctgggca39420tgccaggacaacttctggtccggtaacgtgctgagcccggccaaactccgcgataagtgg39480acccaactcgaaatcaaccgtaacaagcaacaggcaggcgtgacagccagcaaaccaaaa39540ctcgacctgacaaacacagactggatttacggggtggatctatgaaaaacatcgccgcac39600agatggttaactttgaccgtgagcagatgcgtcggatcgccaacaacatgccggaacagt39660acgacgaaaagccgcaggtacagcaggtagcgcagatcatcaacggtgtgttcagccagt39720tactggcaactttcccggcgagcctggctaaccgtgaccagaacgaagtgaacgaaatcc39780gtcgccagtgggttctggcttttcgggaaaacgggatcaccacgatggaacaggttaacg39840caggaatgcgcgtagcccgtcggcagaatcgaccatttctgccatcacccgggcagtttg39900ttgcatggtgccgggaagaagcatccgttaccgccggactgccaaacgtcagcgagctgg39960ttgatatggtttacgagtattgccggaagcgaggcctgtatccggatgcggagtcttatc40020cgtggaaatcaaacgcgcactactggctggttaccaacctgtatcagaacatgcgggcca40080atgcgcttactgatgcggaattacgccgtaaggccgcagatgagcttgtccatatgactg40140cgagaattaaccgtggtgaggcgatccctgaaccagtaaaacaacttcctgtcatgggcg40200gtagacctctaaatcgtgcacaggctctggcgaagatcgcagaaatcaaagctaagttcg40260gactgaaaggagcaagtgtatgacgggcaaagaggcaattattcattacctggggacgca40320taatagcttctgtgcgccggacgttgccgcgctaacaggcgcaacagtaaccagcataaa40380tcaggccgcggctaaaatggcacgggcaggtcttctggttatcgaaggtaaggtctggcg40440aacggtgtattaccggtttgctaccagggaagaacgggaaggaaagatgagcacgaacct40500ggtttttaaggagtgtcgccagagtgccgcgatgaaacgggtattggcggtatatggagt40560taaaagatgaccatctacattactgagctaataacaggcctgctggtaatcgcaggcctt40620tttatttgggggagagggaagtcatgaaaaaactaacctttgaaattcgatctccagcac40680atcagcaaaacgctattcacgcagtacagcaaatccttccagacccaaccaaaccaatcg40740tagtaaccattcaggaacgcaaccgcagcttagaccaaaacaggaagctatgggcctgct40800taggtgacgtctctcgtcaggttgaatggcatggtcgctggctggatgcagaaagctgga40860agtgtgtgtttaccgcagcattaaagcagcaggatgttgttcctaaccttgccgggaatg40920gctttgtggtaataggccagtcaaccagcaggatgcgtgtaggcgaatttgcggagctat40980tagagcttatacaggcattcggtacagagcgtggcgttaagtggtcagacgaagcgagac41040tggctctggagtggaaagcgagatggggagacagggctgcatgataaatgtcgttagttt41100ctccggtggcaggacgtcagcatatttgctctggctaatggagcaaaagcgacgggcagg41160taaagacgtgcattacgttttcatggatacaggttgtgaacatccaatgacatatcggtt41220tgtcagggaagttgtgaagttctgggatataccgctcaccgtattgcaggttgatatcaa41280cccggagcttggacagccaaatggttatacggtatgggaaccaaaggatattcagacgcg41340aatgcctgttctgaagccatttatcgatatggtaaagaaatatggcactccatacgtcgg41400cggcgcgttctgcactgacagattaaaactcgttcccttcaccaaatactgtgatgacca41460tttcgggcgagggaattacaccacgtggattggcatcagagctgatgaaccgaagcggct41520aaagccaaagcctggaatcagatatcttgctgaactgtcagactttgagaaggaagatat41580cctcgcatggtggaagcaacaaccattcgatttgcaaataccggaacatctcggtaactg41640catattctgcattaaaaaatcaacgcaaaaaatcggacttgcctgcaaagatgaggaggg41700attgcagcgtgtttttaatgaggtcatcacgggatcccatgtgcgtgacggacatcggga41760aacgccaaaggagattatgtaccgaggaagaatgtcgctggacggtatcgcgaaaatgta41820ttcagaaaatgattatcaagccctgtatcaggacatggtacgagctaaaagattcgatac41880cggctcttgttctgagtcatgcgaaatatttggagggcagcttgatttcgacttcgggag41940ggaagctgcatgatgcgatgttatcggtgcggtgaatgcaaagaagataaccgcttccga42000ccaaatcaaccttactggaatcgatggtgtctccggtgtgaaagaacaccaacaggggtg42060ttaccactaccgcaggaaaaggaggacgtgtggcgagacagcgacgaagtatcaccgaca42120taatctgcgaaaactgcaaataccttccaacgaaacgcaccagaaataaacccaagccaa42180tcccaaaagaatctgacgtaaaaaccttcaactacacggctcacctgtgggatatccggt42240ggctaagacgtcgtgcgaggaaaacaaggtgattgaccaaaatcgaagttacgaacaaga42300aagcgtcgagcgagctttaacgtgcgctaactgcggtcagaagctgcatgtgctggaagt42360tcacgtgtgtgagcactgctgcgcagaactgatgagcgatccgaatagctcgatgcacga42420ggaagaagatgatggctaaaccagcgcgaagacgatgtaaaaacgatgaatgccgggaat42480ggtttcaccctgcattcgctaatcagtggtggtgctctccagagtgtggaaccaagatag42540cactcgaacgacgaagtaaagaacgcgaaaaagcggaaaaagcagcagagaagaaacgac42600gacgagaggagcagaaacagaaagataaacttaagattcgaaaactcgccttaaagcccc42660gcagttactggattaaacaagcccaacaagccgtaaacgccttcatcagagaaagagacc42720gcgacttaccatgtatctcgtgcggaacgctcacgtctgctcagtgggatgccggacatt42780accggacaactgctgcggcacctcaactccgatttaatgaacgcaatattcacaagcaat42840gcgtggtgtgcaaccagcacaaaagcggaaatctcgttccgtatcgcgtcgaactgatta42900gccgcatcgggcaggaagcagtagacgaaatcgaatcaaaccataaccgccatcgctgga42960ctatcgaagagtgcaaggcgatcaaggcagagtaccaacagaaactcaaagacctgcgaa43020atagcagaagtgaggccgcatgacgttctcagtaaaaaccattccagacatgctcgttga43080aacatacggaaatcagacagaagtagcacgcagactgaaatgtagtcgcggtacggtcag43140aaaatacgttgatgataaagacgggaaaatgcacgccatcgtcaacgacgttctcatggt43200tcatcgcggatggagtgaaagagatgcgctattacgaaaaaattgatggcagcaaatacc43260gaaatatttgggtagttggcgatctgcacggatgctacacgaacctgatgaacaaactgg43320atacgattggattcgacaacaaaaaagacctgcttatctcggtgggcgatttggttgatc43380gtggtgcagagaacgttgaatgcctggaattaatcacattcccctggttcagagctgtac43440gtggaaaccatgagcaaatgatgattgatggcttatcagagcgtggaaacgttaatcact43500ggctgcttaatggcggtggctggttctttaatctcgattacgacaaagaaattctggcta43560aagctcttgcccataaagcagatgaacttccgttaatcatcgaactggtgagcaaagata43620aaaaatatgttatctgccacgccgattatccctttgacgaatacgagtttggaaagccag43680ttgatcatcagcaggtaatctggaaccgcgaacgaatcagcaactcacaaaacgggatcg43740tgaaagaaatcaaaggcgcggacacgttcatctttggtcatacgccagcagtgaaaccac43800tcaagtttgccaaccaaatgtatatcgataccggcgcagtgttctgcggaaacctaacat43860tgattcaggtacagggagaaggcgcatgagactcgaaagcgtagctaaatttcattcgcc43920aaaaagcccgatgatgagcgactcaccacgggccacggcttctgactctctttccggtac43980tgatgtgatggctgctatggggatggcgcaatcacaagccggattcggtatggctgcatt44040ctgcggtaagcacgaactcagccagaacgacaaacaaaaggctatcaactatctgatgca44100atttgcacacaaggtatcggggaaataccgtggtgtggcaaagcttgaaggaaatactaa44160ggcaaaggtactgcaagtgctcgcaacattcgcttatgcggattattgccgtagtgccgc44220gacgccgggggcaagatgcagagattgccatggtacaggccgtgcggttgatattgccaa44280aacagagctgtgggggagagttgtcgagaaagagtgcggaagatgcaaaggcgtcggcta44340ttcaaggatgccagcaagcgcagcatatcgcgctgtgacgatgctaatcccaaaccttac44400ccaacccacctggtcacgcactgttaagccgctgtatgacgctctggtggtgcaatgcca44460caaagaagagtcaatcgcagacaacattttgaatgcggtcacacgttagcagcatgattg44520ccacggatggcaacatattaacggcatgatattgacttattgaataaaattgggtaaatt44580tgactcaacgatgggttaattcgctcgttgtggtagtgagatgaaaagaggcggcgctta44640ctaccgattccgcctagttggtcacttcgacgtatcgtctggaactccaaccatcgcagg44700cagagaggtctgcaaaatgcaatcccgaaacagttcgcaggtaatagttagagcctgcat44760aacggtttcgggattttttatatctgcacaacaggtaagagcattgagtcgataatcgtg44820aagagtcggcgagcctggttagccagtgctctttccgttgtgctgaattaagcgaatacc44880ggaagcagaaccggatcaccaaatgcgtacaggcgtcatcgccgcccagcaacagcacaa44940cccaaactgagccgtagccactgtctgtcctgaattcattagtaatagttacgctgcggc45000cttttacacatgaccttcgtgaaagcgggtggcaggaggtcgcgctaacaacctcctgcc45060gttttgcccgtgcatatcggtcacgaacaaatctgattactaaacacagtagcctggatt45120tgttctatcagtaatcgaccttattcctaattaaatagagcaaatccccttattgggggt45180aagacatgaagatgccagaaaaacatgacctgttggccgccattctcgcggcaaaggaac45240aaggcatcggggcaatccttgcgtttgcaatggcgtaccttcgcggcagatataatggcg45300gtgcgtttacaaaaacagtaatcgacgcaacgatgtgcgccattatcgcctagttcattc45360gtgaccttctcgacttcgccggactaagtagcaatctcgcttatataacgagcgtgttta45420tcggctacatcggtactgactcgattggttcgcttatcaaacgcttcgctgctaaaaaag45480ccggagtagaagatggtagaaatcaataatcaacgtaaggcgttcctcgatatgctggcg45540tggtcggagggaactgataacggacgtcagaaaaccagaaatcatggttatgacgtcatt45600gtaggcggagagctatttactgattactccgatcaccctcgcaaacttgtcacgctaaac45660ccaaaactcaaatcaacaggcgccggacgctaccagcttctttcccgttggtgggatgcc45720taccgcaagcagcttggcctgaaagacttctctccgaaaagtcaggacgctgtggcattg45780cagcagattaaggagcgtggcgctttacctatgattgatcgtggtgatatccgtcaggca45840atcgaccgttgcagcaatatctgggcttcactgccgggcgctggttatggtcagttcgag45900cataaggctgacagcctgattgcaaaattcaaagaagcgggcggaacggtcagagagatt45960gatgtatgagcagagtcaccgcgattatctccgctctggttatctgcatcatcgtctgcc46020tgtcatgggctgttaatcattaccgtgataacgccattacctacaaagcccagcgcgaca46080aaaatgccagagaactgaagctggcgaacgcggcaattactgacatgcagatgcgtcagc46140gtgatgttgctgcgctcgatgcaaaatacacgaaggagttagctgatgctaaagctgaaa46200atgatgctctgcgtgatgatgttgccgctggtcgtcgtcggttgcacatcaaagcagtct46260gtcagtcagtgcgtgaagccaccaccgcctccggcgtggataatgcagcctccccccgac46320tggcagacaccgctgaacgggattatttcaccctcagagagaggctgatcactatgcaaa46380aacaactggaaggaacccagaagtatattaatgagcagtgcagatagagttgcccatatc46440gatgggcaactcatgcaattattgtgagcaatacacacgcgcttccagcggagtataaat46500gcctaaagtaataaaaccgagcaatccatttacgaatgtttgctgggtttctgttttaac46560aacattttctgcgccgccacaaattttggctgcatcgacagttttcttctgcccaattcc46620agaaacgaagaaatgatgggtgatggtttcctttggtgctactgctgccggtttgttttg46680aacagtaaacgtctgttgagcacatcctgtaataagcagggccagcgcagtagcgagtag46740catttttttcatggtgttattcccgatgctttttgaagttcgcagaatcgtatgtgtaga46800aaattaaacaaaccctaaacaatgagttgaaatttcatattgttaatatttattaatgta46860tgtcaggtgcgatgaatcgtcattgtattcccggattaactatgtccacagccctgacgg46920ggaacttctctgcgggagtgtccgggaataattaaaacgatgcacacagggtttagcgcg46980tacacgtattgcattatgccaacgccccggtgctgacacggaagaaaccggacgttatga47040tttagcgtggaaagatttgtgtagtgttctgaatgctctcagtaaatagtaatgaattat47100caaaggtatagtaatatcttttatgttcatggatatttgtaacccatcggaaaactcctg47160ctttagcaagattttccctgtattgctgaaatgtgatttctcttgatttcaacctatcat47220aggacgtttctataagatgcgtgtttcttgagaatttaacatttacaacctttttaagtc47280cttttattaacacggtgttatcgttttctaacacgatgtgaatattatctgtggctagat47340agtaaatataatgtgagacgttgtgacgttttagttcagaataaaacaattcacagtcta47400aatcttttcgcacttgatcgaatatttctttaaaaatggcaacctgagccattggtaaaa47460ccttccatgtgatacgagggcgcgtagtttgcattatcgtttttatcgtttcaatctggt47520ctgacctccttgtgttttgttgatgatttatgtcaaatattaggaatgttttcacttaat47580agtattggttgcgtaacaaagtgcggtcctgctggcattctggagggaaatacaaccgac47640agatgtatgtaaggccaacgtgctcaaatcttcatacagaaagatttgaagtaatatttt47700aaccgctagatgaagagcaagcgcatggagcgacaaaatgaataaagaacaatctgctga47760tgatccctccgtggatctgattcgtgtaaaaaatatgcttaatagcaccatttctatgag47820ttaccctgatgttgtaattgcatgtatagaacataaggtgtctctggaagcattcagagc47880aattgaggcagcgttggtgaagcacgataataatatgaaggattattccctggtggttga47940ctgatcaccataactgctaatcattcaaactatttagtctgtgacagagccaacacgcag48000tctgtcactgtcaggaaagtggtaaaactgcaactcaattactgcaatgccctcgtaatt48060aagtgaatttacaatatcgtcctgttcggagggaagaacgcgggatgttcattcttcatc48120acttttaattgatgtatatgctctcttttctgacgttagtctccgacggcaggcttcaat48180gacccaggctgagaaattcccggaccctttttgctcaagagcgatgttaatttgttcaat48240catttggttaggaaagcggatgttgcgggttgttgttctgcgggttctgttcttcgttga48300catgaggttgccccgtattcagtgtcgctgatttgtattgtctgaagttgtttttacgtt48360aagttgatgcagatcaattaatacgatacctgcgtcataattgattatttgacgtggttt48420gatggcctccacgcacgttgtgatatgtagatgataatcattatcactttacgggtcctt48480tccggtgatccgacaggttacg48502<210>32<211>12<212>dna<213>人工序列<220><223>實(shí)施例1中使用的序列。<400>32tttttttttttt12<210>33<211>51<212>dna<213>人工序列<220><223>實(shí)施例1中使用的序列。<400>33ggttgtttctgttggtgctgatattgcggcgtctgcttgggtgtttaacct51<210>34<211>68<212>dna<213>人工序列<220><223>實(shí)施例1中使用的序列。<400>34ggttaaacacccaagcagacgccgcaatatcagcaccaacagaaacaacctttgaggcga60gcggtcaa68<210>35<211>15<212>dna<213>人工序列<220><223>實(shí)施例1中使用的序列。<400>35ttgaccgctcgcctc15<210>36<211>53<212>dna<213>人工序列<220><223>實(shí)施例2中使用的序列。<400>36gatctgaagcggcgcacgaaaaacgcgaaagcgtttcacgataatgcgaaaac53<210>37<211>54<212>dna<213>人工序列<220><223>實(shí)施例2中使用的序列。<400>37ttttgttttcgcatttatcgtgaaacgctttcgcgtttttcgtgcgccgcttca54當(dāng)前第1頁(yè)12
      當(dāng)前第1頁(yè)1 2 
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1