本發(fā)明涉及圖像處理,特別涉及一種wsi圖像的預處理方法及系統(tǒng)。
背景技術:
1、在病理學中,全視野數(shù)字切片(wsi)圖像作為數(shù)字病理學的重要基礎,廣泛應用于腫瘤檢測、組織分析和臨床診斷等領域。wsi圖像憑借其超高分辨率和大尺寸,能夠捕捉到組織的微小細節(jié),為精準診斷提供了豐富的圖像信息。然而,正是由于這些特點,wsi圖像在處理和分析過程中也面臨著許多挑戰(zhàn)。
2、由于wsi圖像通常由數(shù)十億個像素組成,數(shù)據(jù)量巨大,這對存儲和處理提出了極高的計算和內存需求。此外,人工檢查wsi圖像不僅費力且耗時,還容易引入主觀誤差,難以保證標注的準確性。盡管計算機視覺技術已被引入以替代人工檢查,但它通常需要大量高質量的標注數(shù)據(jù)才能獲得理想的性能。然而,傳統(tǒng)的標注方法往往精度不足,包含非目標區(qū)域或背景信息,這進一步影響了模型訓練的有效性。因此,現(xiàn)有的計算機視覺模型在病理圖像分析中的性能和準確性難以滿足臨床需求。
3、在wsi圖像的制作過程中,不同實驗室使用的染色劑和染色方法各異,導致圖像間存在顯著差異。這種染色不一致性不僅增加了數(shù)據(jù)標準化的難度,還可能導致組織結構與紋理的失真,從而影響后續(xù)分析的準確性?,F(xiàn)有的染色標準化方法在應對這些差異時,常常無法保持組織的真實特征和一致性,從而降低了病理圖像分析模型的泛化能力。
4、由于病理圖像的多樣性和染色不一致性,現(xiàn)有模型的訓練過程需要大量的高質量標注數(shù)據(jù),這不僅增加了注釋成本,還對病理學家的經驗和技能提出了更高的要求。當前技術難以有效解決這些問題,限制了病理圖像分析模型在實際臨床應用中的普及和推廣。
技術實現(xiàn)思路
1、本發(fā)明的目的在于提供一種wsi圖像的預處理方法及系統(tǒng),以至少解決如何通過預處理提高wsi圖像質量和一致性的問題。
2、為解決上述技術問題,本發(fā)明提供一種wsi圖像的預處理方法,包括:
3、獲取原始wsi圖像;
4、對原始wsi圖像進行數(shù)據(jù)處理和切割,以得到若干個wsi圖像塊;
5、基于patchgan算法,對wsi圖像塊進行染色標準化;
6、對染色標準化后的wsi圖像塊進行數(shù)據(jù)增強,以得到預處理后的wsi圖像。
7、可選的,在所述的wsi圖像的預處理方法中,所述對原始wsi圖像進行數(shù)據(jù)處理和切割,以得到若干個wsi圖像塊的方法包括:
8、采用逐像素多邊形標注法,對原始wsi圖像進行數(shù)據(jù)標注;
9、將數(shù)據(jù)標注后的wsi圖像的數(shù)據(jù)格式統(tǒng)一為tiff和/或xml;
10、分割格式統(tǒng)一后的wsi圖像,以去除背景和模糊區(qū)域,得到有效區(qū)域;
11、基于有效區(qū)域切割wsi圖像,以得到若干個wsi圖像塊。
12、可選的,在所述的wsi圖像的預處理方法中,所述將數(shù)據(jù)標注后的wsi圖像的數(shù)據(jù)格式統(tǒng)一為tiff和/或xml的方法包括:
13、將病理數(shù)據(jù)統(tǒng)一為tiff格式,病例數(shù)據(jù)的命名不出現(xiàn)空格和漢字,且不以純數(shù)字命名;病例數(shù)據(jù)的命名唯一,且與患者的id相關聯(lián);
14、將標注數(shù)據(jù)統(tǒng)一用xml格式的標注文件保存,標注文件的名稱與標注數(shù)據(jù)同名。
15、可選的,在所述的wsi圖像的預處理方法中,所述分割格式統(tǒng)一后的wsi圖像,以去除背景和模糊區(qū)域,得到有效區(qū)域的方法包括:
16、將wsi圖像從rgb顏色空間轉換為hsv顏色空間;
17、對飽和度通道應用中值模糊,以平滑邊緣;
18、基于飽和度通道進行閾值分割,生成二進制掩碼;
19、利用形態(tài)學閉合操作填補空隙和孔洞,以優(yōu)化二進制掩碼;
20、基于面積閾值,對優(yōu)化后的二進制掩碼進行過濾檢測,以得到組織區(qū)域輪廓;
21、提取組織區(qū)域輪廓內的圖像,以得到有效區(qū)域。
22、可選的,在所述的wsi圖像的預處理方法中,所述基于有效區(qū)域切割wsi圖像,以得到若干個wsi圖像塊的方法包括:
23、將wsi圖像在預設放大倍數(shù)下裁剪為若干個wsi圖像塊;
24、若wsi圖像塊中不包含有效區(qū)域,則舍棄該wsi圖像塊。
25、可選的,在所述的wsi圖像的預處理方法中,所述基于patchgan算法,對wsi圖像塊進行染色標準化的方法包括:
26、構建基于patchgan模型的染色標準化網絡架構;
27、利用染色標準化網絡架構對wsi圖像塊進行染色標準化。
28、可選的,在所述的wsi圖像的預處理方法中,所述構建基于patchgan模型的染色標準化網絡架構的方法包括:
29、基于unet網絡構建圖像生成器,unet網絡中編碼器層和解碼器層通過跳過連接進行直接連接;
30、使用patchgan模型作為染色標準化網絡架構的判別器;
31、設置染色標準化網絡架構的損失函數(shù)。
32、可選的,在所述的wsi圖像的預處理方法中,所述染色標準化網絡架構的損失函數(shù)表示為:
33、
34、其中,g表示生成器,d表示判別器;表示使cgan學習從輸入圖像到輸出圖像的映射以及訓練該映射的損失函數(shù);表示損失鼓勵生成器生成類似于條件變量x的樣本,是訓練圖像x和生成圖像g(z.y)之間每個像素的差異絕對值的平均值;λ表示控制生成器的權重的超參數(shù)。
35、可選的,在所述的wsi圖像的預處理方法中,在利用染色標準化網絡架構對wsi圖像塊進行染色標準化之前,所述基于patchgan算法,對wsi圖像塊進行染色標準化的方法包括:
36、利用數(shù)據(jù)集對染色標準化網絡架構進行訓練。
37、可選的,在所述的wsi圖像的預處理方法中,所述利用數(shù)據(jù)集對染色標準化網絡架構進行訓練的方法包括:
38、獲取病理數(shù)據(jù)集;
39、將病理數(shù)據(jù)集按分層抽樣分為訓練隊列和驗證隊列;
40、用訓練隊列訓練染色標準化網絡架構,得到的生成器表示為:
41、
42、用驗證隊列驗證評估訓練后的染色標準化網絡架構。
43、可選的,在所述的wsi圖像的預處理方法中,所述對染色標準化后的wsi圖像塊進行數(shù)據(jù)增強,以得到預處理后的wsi圖像的方法包括:
44、對wsi圖像塊數(shù)量較多的wsi圖像進行隨機欠采樣,對wsi圖像塊數(shù)量較少的wsi圖像進行隨機數(shù)據(jù)增強,以使得到的wsi圖像塊的數(shù)量達到預設數(shù)量。
45、為解決上述技術問題,本發(fā)明還提供一種wsi圖像的預處理系統(tǒng),用于實現(xiàn)如上任一項所述的wsi圖像的預處理方法,所述wsi圖像的預處理系統(tǒng)包括:
46、圖像獲取模塊,用于獲取原始wsi圖像;
47、圖像處理與切割模塊,用于對原始wsi圖像進行數(shù)據(jù)處理和切割,以得到若干個wsi圖像塊;
48、染色標準化模塊,用于基于patchgan算法,對wsi圖像塊進行染色標準化;
49、數(shù)據(jù)增強模塊,用于對染色標準化后的wsi圖像塊進行數(shù)據(jù)增強,以得到預處理后的wsi圖像。
50、本發(fā)明提供的wsi圖像的預處理方法及系統(tǒng),包括:獲取原始wsi圖像;對原始wsi圖像進行數(shù)據(jù)處理和切割,以得到若干個wsi圖像塊;基于patchgan算法,對wsi圖像塊進行染色標準化;對染色標準化后的wsi圖像塊進行數(shù)據(jù)增強,以得到預處理后的wsi圖像。通過數(shù)據(jù)處理和切割能夠有效降低了手工操作的工作量,減少了主觀誤差,并顯著降低了計算復雜度和內存消耗。通過patchgan算法進行染色標準化能夠確保圖像特征和顏色分布的一致性,實現(xiàn)高度統(tǒng)一的染色效果。這種標準化處理能夠顯著減少不同實驗室間的染色差異對模型性能的影響,并提升模型的泛化能力。通過對標準化后的wsi圖像塊進行數(shù)據(jù)增強,增加數(shù)據(jù)量并增強模型的魯棒性,使其在實際應用中更好地應對圖像變形和噪聲。通過該預處理系統(tǒng),提高了wsi圖像的質量和一致性,為后續(xù)的分析和處理提供了可靠的數(shù)據(jù)支持,最終提升整個病理圖像分析系統(tǒng)的準確性和效果。