專利名稱:一種基于核小體脫氧核糖核酸模版的核小體預(yù)測(cè)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種預(yù)測(cè)真核基因組核小體(nucleosome)的方法,該預(yù)測(cè)方法通過(guò)匹配核小體DNA的彎曲度模版實(shí)現(xiàn)預(yù)測(cè)。
背景技術(shù):
真核生物DNA以染色質(zhì)形式存在,其基本單元為核小體;核小體系由 147bp的DNA纏繞在組蛋白八聯(lián)體(2倍的組蛋白H2A、H2B、H3和H4)上形成的結(jié)構(gòu),核小體之間以連接DNA相連。核小體定位是指DNA雙螺旋相對(duì)于組蛋白核的位置,核小體DNA的蛋白結(jié)合位點(diǎn)被封閉,因此無(wú)法結(jié)合蛋白(轉(zhuǎn)錄因子)。核小體定位通過(guò)遮蔽或者暴露蛋白結(jié)合位點(diǎn)調(diào)節(jié)真核基因的復(fù)制、轉(zhuǎn)錄等基礎(chǔ)生物學(xué)過(guò)程。因此,預(yù)測(cè)核小體對(duì)于分析基因的轉(zhuǎn)錄調(diào)節(jié)等至關(guān)重要,預(yù)測(cè)核小體就是預(yù)測(cè)基因組DNA哪些區(qū)域是纏繞在組蛋白核上的核小體DNA(nucleosome DNA),哪些是處于連接區(qū)域的連接DNA(linker DNA)。利用濕實(shí)驗(yàn)手段直接檢測(cè)核小體仍然需要一定的成本。近年來(lái),研究發(fā)現(xiàn)核小體的位置部分地與DNA序列有關(guān),即可以通過(guò)基因組DNA序列實(shí)現(xiàn)核小體的預(yù)測(cè)。目前,國(guó)際上有一種通過(guò)概率模型預(yù)測(cè)核小體的方法,這種方法首先需要計(jì)算四種核苷酸在核小體DNA序列的每個(gè)位置出現(xiàn)的頻率,形成位點(diǎn)頻率矩陣,然后計(jì)算待預(yù)測(cè)序列在該位點(diǎn)頻率矩陣上的得分,實(shí)現(xiàn)核小體預(yù)測(cè)。這種方法的缺點(diǎn)在于1,建立位點(diǎn)頻率矩陣,首先需要知道一定數(shù)目的核小體DNA序列;2,對(duì)不同物種基因組核小體預(yù)測(cè),需要建立不同的位點(diǎn)頻率矩陣;3,計(jì)算方法較復(fù)雜,對(duì)于大規(guī)模的基因組預(yù)測(cè),速度顯得較慢。這些缺陷限制了這種方法的進(jìn)一步應(yīng)用。
發(fā)明內(nèi)容
本發(fā)明提供一種能夠?qū)崿F(xiàn)快速準(zhǔn)確預(yù)測(cè)的基于核小體脫氧核糖核酸模版的核小體預(yù)測(cè)方法。本發(fā)明采用如下技術(shù)方案一種基于核小體脫氧核糖核酸模版的核小體預(yù)測(cè)方法,包括以下步驟步驟I獲取待預(yù)測(cè)的DNA序列,核苷酸的長(zhǎng)度為T,并利用
權(quán)利要求
1.一種基于核小體脫氧核糖核酸模版的核小體預(yù)測(cè)方法,其特征在于,包括以下步驟 步驟I獲取待預(yù)測(cè)的DNA序列,長(zhǎng)度為T,并利用
全文摘要
一種基于核小體脫氧核糖核酸模版的核小體預(yù)測(cè)方法,其特征在于,包括以下步驟步驟1獲取待預(yù)測(cè)DNA序列,長(zhǎng)度為T,計(jì)算待預(yù)測(cè)DNA序列彎曲度信號(hào)Signal。步驟2建立核小體DNA模版信號(hào)P,P的長(zhǎng)度為147bp,兩端區(qū)域?qū)挒?0bp,高為0.07,中間區(qū)域?qū)挒?7bp,高為0.05,卷積P和Signal得到信號(hào)S_covn,從S_covn中部取出長(zhǎng)為T-10的信號(hào)S_covn_keep。步驟3計(jì)算S_covn_keep的連續(xù)小波變換W(a,b),母函數(shù)為墨西哥帽函數(shù);尺度范圍為[2,8]。計(jì)算|W(a,b)|的最大值M_W(b)。M_W(b)中的峰即為核小體的二分點(diǎn)位置。
文檔編號(hào)G06F19/10GK102968575SQ20121042766
公開日2013年3月13日 申請(qǐng)日期2012年10月31日 優(yōu)先權(quán)日2012年10月31日
發(fā)明者劉宏德, 謝建明, 孫嘯 申請(qǐng)人:東南大學(xué)