80、 990、1000、1010、1020、1030、1040、1050、1060、1070、1080、1090、1100、1200、1300、1400、 1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、 3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、4100、4200、4300、4400、 4500、4600、4700、4800、4900、5000、5100、5200、5300、5400、5500、5600、5700、5800、5900、 6000、6100、6200、6300、6400、6500、6600、6700、6800、6900、7000、7100、7200、7300、7400、 7500、7600、7700、7800、7900、8000、8100、8200、8300、8400、8500、8600、8700、8800、8900、 9000、9100、9200、9300、9400、9500、9600、9700、9800、9900、10000、10100、10200、10300、 10400、10500、10600、10700、10800、10900、11000、11100、11200、11300、11400、11500、 11600、11700、11800、11900、12000或更長的(或其中可得到的任何范圍)核巧酸、核巧或序 列的堿基對。
[0091] 因此,預(yù)期具有或者具有至少或至多70%、71%、72%、73%、74%、75%、76%、 77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、 92%、93%、94%、95%、96%、97%、98%或99%和其中可得到的任何范圍的核酸作為本發(fā) 明的部分,所述核酸與所識別生物標(biāo)志物的W下長度連續(xù)堿基(或其中可得到的任何范 圍)的核酸序列一致或互補:5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、 24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、 49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、 74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、 99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、 118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、 137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、 156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、 175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、 194、195、196、197、198、199、200、210、220、230、240、250、260、270、280、290、300、310、320、 330、340、350、360、370、380、390、400、410、420、430、440、441、450、460、470、480、490、500、 510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、 700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、 890、900、910、920、930、940、950、960、970、980、990、1000、1010、1020、1030、1040、1050、 1060、1070、1080、1090、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、 2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、 3700、3800、3900、4000、4100、4200、4300、4400、4500、4600、4700、4800、4900 或 5000。
[0092]"與其他編碼序列基本分離"是指所關(guān)注基因形成核酸片段編碼區(qū)的部分,片段不 含有大部分的天然存在的編碼核酸,如大的染色體片段或其他功能基因或CDNA編碼區(qū)。當(dāng) 然,運指的是最初分離的核酸片段,而不排除通過人工操縱后來添加到片段的基因或編碼 區(qū)。
[009引C.樣品
[0094] 尿是用于診斷測試的相當(dāng)理想的生物流體,運是因為尿易于收集并在臨床實驗室 廣泛使用。然而,在尿中的生物標(biāo)志物發(fā)現(xiàn)策略已經(jīng)受阻于與蛋白質(zhì)組學(xué)方案的重復(fù)性和 不足的標(biāo)準(zhǔn)化有關(guān)的問題。盡管有運些顧慮,已經(jīng)利用尿蛋白質(zhì)組學(xué)分析來識別廣泛人類 疾病的大量候選生物標(biāo)志物,疾病包括但不限于腎疾病、糖尿病、動脈粥樣硬化、阿爾茨海 默氏病和癌癥(Soggiu,2012 !Zimmerli, 2008 ;Riaz,2010 ;Zengi,2012 ;Huttenhain,2012 ; Zoidakis,2012 ;Zurbig,2012 ;Siwy,2011)。在一些實施方案中,樣品可W是尿、唾液、眼淚 或血清/血漿的樣品。
[009引化實施例
[0096] 包括W下實施例W說明本發(fā)明的優(yōu)選實施方案。本領(lǐng)域技術(shù)人員應(yīng)理解W下實施 例中所公開的技術(shù)能代表本發(fā)明人發(fā)現(xiàn)的在本發(fā)明的實踐中發(fā)揮良好作用的技術(shù),因此能 夠認為其構(gòu)成用于其實踐的優(yōu)選實施方式。然而,根據(jù)本公開,本領(lǐng)域技術(shù)人員應(yīng)理解,在 不脫離本發(fā)明的精神和范圍的情況下,在所公開的具體實方案中可W做許多改變,并仍獲 得相同或相似的結(jié)果。
[0097] 連施倆I1
[0098]材料巧方法
[0099] 患者信息一用于OSA評估的臨床所指的兒童(2至12歲大)在芝加哥大學(xué)小兒睡 眠實驗室經(jīng)歷整夜多導(dǎo)睡眠圖評估。健康兒童從學(xué)校或幼兒保健診所招募。所有對象的排 除標(biāo)準(zhǔn)包括存在明顯的遺傳或煩面綜合征、糖尿病、囊胞性纖維癥、癌癥或在用口服皮質(zhì)類 固醇、抗生素或抗炎藥物進行治療。所有父母完成詳細的攝入臨床調(diào)查問卷。記錄每個兒童 的身高、體重和生命體征,并更具CDC2000生長標(biāo)準(zhǔn)(WWW.cdc.gov/growthcharts)并使用 在線軟件(WWW.cdc.gov/巧iinfo)計算身體質(zhì)量指數(shù)(BMI)Z分數(shù)。認為超過1. 65 (第.95 個百分位)的BMIZ分數(shù)達到肥胖的標(biāo)準(zhǔn)。該研究得到芝加哥大學(xué)的機構(gòu)審查委員會的批 準(zhǔn)(IRB10-708A);獲得知情同意和適當(dāng)時的未成年人同意書。
[0100] 整夜多導(dǎo)睡眠記錄一所有對象經(jīng)歷使用標(biāo)準(zhǔn)方法的整夜多導(dǎo)睡眠記錄。根據(jù)用于 對睡眠和相關(guān)事件進行打分的2007年美國睡眠醫(yī)學(xué)協(xié)會指南對PSG研究進行打分。阻塞 性呼吸暫停-低通氣指數(shù)(AHI)被定義為總睡眠時間中每小時阻塞性呼吸暫停和低通氣的 次數(shù)。
[0101] 尿收集一在晚上正要睡前收集中段尿和在晨間醒來后收集首次排尿。將樣品 (20血)收集到含有苯甲基橫酷氣(PMSFJmM最終濃度)的管中,并立即在-80°C儲存直至 分析。
[010引制備可溶性尿蛋白用于質(zhì)譜分析(M巧一在37°C快速解凍尿(IOmL),滿旋90秒, 然后離屯、巧OOXg,4°C)5分鐘。將上清液在12000Xg,4°C下離屯、20分鐘W去除尿沉淀, 與ImL蛋白G磁珠(Millipore)在20°C下解育30分鐘。根據(jù)制造商的方案進行IgG的移 除。使用如前所述的TCA/D0C(Thongboonkerd,2006巧ecker,2010)沉淀經(jīng)IgG移除的尿樣 品。簡言之,在尿中補充入0.02%脫氧膽酸鋼和20%=氯乙酸,在4°C在振動下解育過夜。 通過離屯、(在4°C下ISOOOXg 60分鐘)獲得蛋白質(zhì)。用冰冷卻的丙酬清洗蛋白質(zhì)小球兩 次,在0.I%RapiGest(Waters公司)、250mM碳酸氨錠、P冊.8中重構(gòu)。通過化a壯ord分 析利用白蛋白作為標(biāo)準(zhǔn)物確定蛋白質(zhì)濃度。將樣品(90yg)與a-人類白蛋白禪合的磁珠 (90yLMillipore)解育,并根據(jù)制造商的方案進行移除。將樣品還原、烷基化并利用測序 級膜蛋白酶在37°C消化過夜(1:50,重量/重量,膜蛋白酶/蛋白質(zhì);Promega)。根據(jù)制造 商的方案,將膜蛋白酶消化物與乙酸混合(1:1,體積/體積),并根據(jù)制造商的方案在C18 柱(HLB,ImL,Waters公司)上對其進行固相提取。在真空下干燥含膚的部分,并將其重懸 在0.3%甲酸、5%乙臘0).4111邑/血)中^用于1(:-15/^5分析。
[0103] 液相色譜-電噴霧電離-串聯(lián)質(zhì)譜分析化C-ESI-MS/M巧-將膜蛋白酶消化物 (LSiig)直接裝載至U(室內(nèi)包裝的)2cmC18捕捉柱上,用IOiil溶齊IJA巧%乙臘,0. 1%甲 酸)沖洗,在15cm長、75 yM反相毛細管柱(ProteoP巧?II C18,300A,Sym大小,New Objective,WoburnMA)上進行洗脫。在ProxeonEasyn-LCII(ThermoScientific,San Jose,CA)上W300nL/分鐘經(jīng)過180分鐘的從5 %至35 %緩沖液B(95 %乙臘,0.I%甲酸) 的線性梯度分離膚。使用電噴霧電離和線性離子阱質(zhì)譜儀化TQ化bitrapVelosi貨,Thermo Scientific,SanJose,CA)W陽離子模式獲得質(zhì)譜。W數(shù)據(jù)相關(guān)模式操作質(zhì)譜儀,對于每個 MSl前體離子掃描,通過CID(碰撞誘導(dǎo)解離)從碎片選擇十個最大強度的離子。用于質(zhì)譜 分析的其他參數(shù)包括:MS1的分辨率設(shè)為60000,標(biāo)準(zhǔn)化碰撞能量35%,激活時間10ms,分離 寬度1.5,淘汰+1和+4及更的高電荷狀態(tài)。
[0104]膚和蛋白質(zhì)識別一使用Sorcerer?-化quest啦(versionV.3. 5,)針 對國際蛋白質(zhì)索引人類(v3.87,91464個條目)主序列數(shù)據(jù)庫化ersey,2004)對MS/MS譜進行檢索(Sage-NResearch,Milpitas,CA)。檢索參數(shù)包括W最高2個漏切用 膜蛋白酶(在Arg或Lys后)的半酶切。在固定的切S烷基化和可變的Met氧化下, 在50ppm的母離子公差和Iamu的碎片離子質(zhì)量公差下,進行化QUEST飯檢索。利 用PeptideProphet(Keller, 2002)和ProteinProphet(化svizhskii, 2003),使用對于膚 > 0. 90和對于蛋白質(zhì)> 0. 96的調(diào)整概率,進一步驗證SEQUEST結(jié)果。在統(tǒng)計分析之前用 計算機蛋白質(zhì)組學(xué)分析系統(tǒng)(CPA巧(Rauch, 2006)進一步處理檢索結(jié)果(見下文)??紤]用 于分析的蛋白質(zhì)必須在至少一個患者組(例如,健康女孩或患OSA的男孩)中在至少70% 的個體中被識別的。當(dāng)MS/MS譜不能區(qū)別蛋白質(zhì)亞型時,全部都被包含在分析中。
[010引蛋白質(zhì)定量和統(tǒng)計分析一通過譜計數(shù)(檢測的蛋白質(zhì)的MS/MS譜的總數(shù);(Liu, 2007))對由LC-MS/MS檢測的蛋白質(zhì)進行定量。利用t檢驗和G檢驗對相對蛋白質(zhì)豐度 的差異進行評估度ecker,2010 ;Becker,2012 ;01山2005)。使用置換分析來經(jīng)驗地估計 抑R度enjamini,1995)。使用化pC(Heinecke,2010)即一種使對于給定抑R識別的差異表 達的蛋白質(zhì)的數(shù)量最大化的軟件包來確定G檢驗和t檢驗的顯著性界值。
[0106] ELISA-在37°C迅速解凍尿樣品并通過在500Xg離屯、10分鐘使其澄清。使用 可商購的用于DPP4 (Abnova ;KA0141)、AZGPl (Abnova ;KA1689)、CP (Assaypro ;EC4101-1)、 HPX(Innovative Research,Inc. ;I服TA肥562)、和肌?。ˋbeam;油65:M0)的化ISA根據(jù)制 造商的方案來定量所得上清液中的蛋白質(zhì)水平。將所有蛋白質(zhì)水平標(biāo)準(zhǔn)化為尿肌酢水平 (Gar壯e,2004)并通過雙尾學(xué)生t檢驗來評估組之間的統(tǒng)計顯著性。
[0107] 功能注釋一使用切toscape(V2. 8. 2)中的Bingo 2.0插件來識別尿蛋白組或差 異表達的假定的尿生物標(biāo)志物(相對于整個人類基因組)中基因本體注釋的功能性富集 (Maere,2005)。使用利用Benjamini-Hochberg校正的超幾何檢驗(P< 0. 05)評估統(tǒng)計顯 著性并考慮具有> 5種蛋白質(zhì)的功能分類。
[0…引連施倆I2 ?!?用于尿牛物梳虎物發(fā)現(xiàn)的帝白質(zhì)紀(jì)學(xué)工作流括
[0110] 本發(fā)明人開發(fā)了 4步驟過程,其包括:i)離屯、W去除顆粒物質(zhì)和尿沉淀,ii)移除 IgG和白蛋白(ALB)W有利于更深層的基因組覆蓋,iii)沉淀蛋白質(zhì)W濃縮尿蛋白質(zhì)并去 除干擾物質(zhì),和iv)通過LC-MS/MS進行質(zhì)譜分析(圖la)
[0111] ALB和IgG是高豐度尿蛋白(總尿蛋白的40%至60% ),其干擾低豐度物質(zhì)的檢 測并且使無標(biāo)記蛋白質(zhì)組學(xué)方法中的定量復(fù)雜化(Kushnirjoog)。仔細滴定磁珠W使ALB 和IgG的移除最大化(圖化,C),并使不相關(guān)蛋白質(zhì)的非特異性損失最小化,如通過血清鐵 傳遞蛋白(TR巧水平的損失所評估的(圖1C)。由于在經(jīng)濃縮的溶液中更有效地沉淀蛋白 質(zhì)(因為分子聚集),本發(fā)明人在蛋白質(zhì)沉淀后移除ALB。然而,存在用來使蛋白質(zhì)小球溶 解的緩沖液(0.1%RapiGest)的情況下IgG移除是不完全的,并因此再沉淀之前進行IgG 移除。
[0112] 本發(fā)明人引入了包括S氯乙酸和脫氧膽酸鹽燈CA/D0C;miongboonkerd,2006 ; Becker;2010))的方法,因為其很適合于使蛋白質(zhì)從稀溶液中沉淀出。通過沉淀從10個對 象的每一個收集的相同尿樣品的6小份來檢查樣品內(nèi)和樣品間該方法的重復(fù)性。該方法在 寬范圍的尿蛋白濃度下得到高度可重復(fù)的結(jié)果化%CV,樣品間)(圖Id)。
[0113] 為了檢測蛋白質(zhì)組學(xué)工作流程的重復(fù)性,處理來自28個兒童的尿樣品并對其 進行LC-MS/MS分析?;诿糠N蛋白質(zhì)最少2種獨特膚的識別,該方法每個樣品可靠地 識別505 + 10種蛋白質(zhì)。此外,樣品深度的變化,每輪高質(zhì)量膚識別的數(shù)量是最小的 (10053 + 237膚),運表明方法是穩(wěn)定且可重復(fù)的。
[0114] 連施倆I3 。。引 忡別巧替梅的影響引入到健康化章的尿帝白質(zhì)紀(jì)中的差擇忡
[0116] 本發(fā)明人收集來自健康男孩(N= 7)和女孩(N= 6)的晨間和睡前的樣品。通過 預(yù)先排除患有遺傳或煩面綜合征、糖尿病、囊胞性纖維癥或癌癥的參與者來選擇健康兒童 (2歲至12歲大)。另外的排除標(biāo)準(zhǔn)包括藥物、類固醇或免疫治療藥物的長期使用。
[0117] 通過蛋白質(zhì)組學(xué)工作流程(參見圖1)處理樣品,并對其進行LC-MS/MS分析。通 過譜計數(shù)定量蛋白質(zhì)化;[11,2004),并使用1:檢驗和6檢驗的組合度6。461',2010;86。461', 2012 ;01山2005)來識別蛋白質(zhì)水平的統(tǒng)計顯著性變化,t檢驗和G檢驗使用使假發(fā)現(xiàn)率最 小化的界值度enjamini,1995 ;Heinecke,2010)。圖2a中提供代表性分析,其演示在應(yīng)用 嚴(yán)格統(tǒng)計標(biāo)準(zhǔn)(G檢驗:G> 1. 5或G《-1. 5 ;t檢驗:a= 0. 05 ;抑R<0. 05)后在晨間尿樣 品中性別調(diào)節(jié)的蛋白質(zhì)的檢測。
[0118] 使用該方法,本發(fā)明人在健康男孩和女孩的尿蛋白質(zhì)組中、在晨間樣品(約7% ; 750種蛋白質(zhì)中的50種)和睡前樣品(8% ;750種蛋白質(zhì)中的41種)中均檢測到明顯差 異(圖2a和化,表2A和2B)。表2A和2B指示說明性別和晝夜對健康兒童