專利名稱:用于裝配成小組的癌細(xì)胞系以用于測(cè)試一種或多種藥物組合物的功效的方法
用于裝配成小組的癌細(xì)胞系以用于測(cè)試一種或多種藥物組
合物的功效的方法相關(guān)申請(qǐng)信息本申請(qǐng)要求對(duì)2008年10月31日提交的美國(guó)申請(qǐng)No. 61/110,的優(yōu)先權(quán),所述申請(qǐng)的內(nèi)容在此引入作為參考。序列表本申請(qǐng)包括已通過EFS-Web提交并且因此整體引入作為參考的序列表。所述 ASCII拷貝命名為9674W001. txt,且大小為1. 8千字節(jié)。領(lǐng)域本發(fā)明涉及用于限定腫瘤和癌細(xì)胞系的基因組亞組的生物信息學(xué)算法或方法。本發(fā)明還涉及按照基因組亞組裝配(assembling)成小組(panels)的腫瘤和癌細(xì)胞系以用于測(cè)試一種或多種藥物化合物在患有至少一種癌癥的受試者的治療中的功效的方法。盤癌癥是特征在于臨床過程、結(jié)果和對(duì)治療的應(yīng)答的相當(dāng)大變異性的基因組的疾病。該變異性背后的主要因素是人癌癥的遺傳異質(zhì)性。已證明相同組織病理學(xué)亞型的個(gè)別腫瘤在其細(xì)胞DNA中具有不同的畸變。公認(rèn)的是靶向的癌癥療法靶向特定的遺傳畸變而非組織學(xué)疾病亞類。靶向分子異常的藥物的一些實(shí)例是甲磺酸伊馬替尼(imatinib mesylate)(其用于治療慢性髓細(xì)胞性白血病)和司徒曼步(其用于治療HER2陽性乳腺癌)O目前,基于其可用性(availability)、對(duì)小鼠中腫瘤形成的適應(yīng)性、培養(yǎng)中的生長(zhǎng)以及其他參數(shù)選擇用于腫瘤學(xué)藥物測(cè)試(oncology drug testing)的臨床前模型。對(duì)于該方法的問題是其未考慮親本腫瘤的遺傳異質(zhì)性。這導(dǎo)致臨床前試驗(yàn)過程中腫瘤的分子亞類的差的代表。因此,經(jīng)常在臨床前試驗(yàn)中看到的高反應(yīng)率可能只代表臨床前試驗(yàn)實(shí)驗(yàn)室中代表的分子亞類的反應(yīng)。如果該亞類只代表患者群體的一部分,并且如果藥物只針對(duì)該具體亞類有效,那么臨床中的反應(yīng)將是顯著較低的。因此,本領(lǐng)域內(nèi)需要更好地代表所有親本腫瘤類型的改進(jìn)的臨床前試驗(yàn)?zāi)P汀_@樣的改進(jìn)的臨床前試驗(yàn)將增加新型藥物的臨床前試驗(yàn)的可預(yù)測(cè)性。發(fā)明概述在一個(gè)方面,本發(fā)明涉及用于聚類腫瘤和細(xì)胞系以限定基因組亞組的算法。所述算法包括步驟(a)獲得多個(gè),m個(gè),包含至少一個(gè)腫瘤或癌細(xì)胞系的樣品;(b)獲得包括步驟(a)中獲得的每一個(gè)樣品的每一條染色體的至少一個(gè)基因座的拷貝數(shù)改變信息的數(shù)據(jù)集;(c)鑒定數(shù)據(jù)集中獲自被正常細(xì)胞污染的樣品的拷貝數(shù)改變信息并且從數(shù)據(jù)集消除所述被污染的樣品,其中鑒定和消除包括(1)對(duì)數(shù)據(jù)應(yīng)用與代表腫瘤和正常樣品之間的差異的參數(shù)一致的機(jī)器學(xué)習(xí)算法 (machine learning algorithm);
(2)賦予每一個(gè)樣品如通過機(jī)器學(xué)習(xí)算法測(cè)定的正常細(xì)胞污染的概率分?jǐn)?shù);(3)從數(shù)據(jù)集中消除每一個(gè)得分50%或更大的含正常細(xì)胞的概率的樣品的數(shù)據(jù);(d)通過對(duì)數(shù)據(jù)集應(yīng)用利用Pearson線性相異性算法的無監(jiān)督聚類算法 (unsupervised clustering algorithm)估計(jì)數(shù)據(jù)集中亞組的數(shù)巨 r ;(e)利用改進(jìn)的基因組非負(fù)矩陣因子分解(modified genomic non-negative matrix factorization) (gNMF)算法將數(shù)據(jù)集中的每一個(gè)樣品分配至至少一個(gè)簇,其中所述改進(jìn)的gNMF算法包括(1)利用公式(1)計(jì)算每100步乘性更新(multiplicative updating)后算法的散度
權(quán)利要求
1.用于聚類腫瘤和細(xì)胞系以限定基因組亞組的算法,所述方法包括步驟(a)獲得多個(gè),m個(gè),包含至少一個(gè)腫瘤或癌細(xì)胞系的樣品;(b)獲得包括步驟(a)中獲得的每一個(gè)樣品的每一條染色體的至少一個(gè)基因座的拷貝數(shù)改變信息的數(shù)據(jù)集;(c)鑒定數(shù)據(jù)集中獲自被正常細(xì)胞污染的樣品的拷貝數(shù)改變信息并且從數(shù)據(jù)集消除所述被污染的樣品,其中鑒定和消除包括(1)對(duì)數(shù)據(jù)應(yīng)用與代表腫瘤和正常樣品之間的差異的參數(shù)一致的機(jī)器學(xué)習(xí)算法;(2)賦予每一個(gè)樣品如通過機(jī)器學(xué)習(xí)算法測(cè)定的正常細(xì)胞污染的概率分?jǐn)?shù);(3)從數(shù)據(jù)集中消除每一個(gè)得分50%或更大的含正常細(xì)胞的概率的樣品的數(shù)據(jù);(d)通過對(duì)數(shù)據(jù)集應(yīng)用利用Pearson線性相異性算法的無監(jiān)督聚類算法估計(jì)數(shù)據(jù)集中亞組的數(shù)目r;(e)利用改進(jìn)的基因組非負(fù)矩陣因子分解(gNMF)算法將數(shù)據(jù)集中的每一個(gè)樣品分配至至少一個(gè)簇,其中所述改進(jìn)的gNMF算法包括(1)利用公式(1)計(jì)算每100步乘性更新后算法的散度
2.權(quán)利要求1的算法,其中所述無監(jiān)督聚類算法是等級(jí)聚類。
3.權(quán)利要求1的算法,其中同表象相關(guān)用于提供來自數(shù)據(jù)集的簇的終數(shù)目。
4.權(quán)利要求1的算法,其中貝葉斯信息準(zhǔn)則用于提供來自數(shù)據(jù)集的簇的終數(shù)目。
5.權(quán)利要求1的算法,其中將同表象相關(guān)和貝葉斯信息準(zhǔn)則用于提供來自數(shù)據(jù)集的簇的終數(shù)目。
6.按照基因組亞組裝配成小組的腫瘤和癌細(xì)胞系的方法,所述方法包括步驟(a)獲得多個(gè),m個(gè),包含至少一個(gè)腫瘤或癌細(xì)胞系的樣品;(b)獲得包括步驟(a)中獲得的每一個(gè)樣品的每一條染色體的至少一個(gè)基因座的拷貝數(shù)改變信息的數(shù)據(jù)集;(c)鑒定數(shù)據(jù)集中獲自被正常細(xì)胞污染的樣品的拷貝數(shù)改變信息并且從數(shù)據(jù)集消除所述被污染的樣品,其中鑒定和消除包括(1)對(duì)數(shù)據(jù)應(yīng)用與代表腫瘤和正常樣品之間的差異的參數(shù)一致的機(jī)器學(xué)習(xí)算法;(2)賦予每一個(gè)樣品如通過機(jī)器學(xué)習(xí)算法測(cè)定的正常細(xì)胞污染的概率分?jǐn)?shù);(3)從數(shù)據(jù)集中消除每一個(gè)得分50%或更大的含正常細(xì)胞的概率的樣品的數(shù)據(jù);(d)通過對(duì)數(shù)據(jù)集應(yīng)用使用Pearson線性相異性算法的無監(jiān)督聚類估計(jì)數(shù)據(jù)集中亞組的數(shù)目r;(e)利用改進(jìn)的基因組非負(fù)矩陣因子分解(gNMF)算法將數(shù)據(jù)集中的每一個(gè)樣品分配至至少一個(gè)簇,其中所述改進(jìn)的gNMF算法包括(1)利用公式(1)計(jì)算每100步乘性更新后算法的散度
7.權(quán)利要求6的方法,其中所述癌癥選自小細(xì)胞肺癌、非小細(xì)胞肺癌、結(jié)腸直腸癌和黑色素瘤。
8.權(quán)利要求6的方法,其中所述拷貝數(shù)改變是拷貝數(shù)的獲得或喪失。
全文摘要
本發(fā)明涉及用于限定腫瘤和癌細(xì)胞系的基因組亞組的算法。本發(fā)明還涉及用于根據(jù)基因組亞組裝配成小組的腫瘤和癌細(xì)胞系以用于測(cè)試一種或多種藥物化合物在患有至少一種癌癥的受試者的治療中的功效的方法。
文檔編號(hào)G06F19/24GK102203788SQ200980143442
公開日2011年9月28日 申請(qǐng)日期2009年10月28日 優(yōu)先權(quán)日2008年10月31日
發(fā)明者D·塞米扎洛夫, K·張, R·R·列斯尼夫斯基, 盧欣 申請(qǐng)人:雅培制藥有限公司