圖像處理方法、多模態(tài)圖像生成模型的訓(xùn)練方法及裝置與流程

文檔序號：39346527發(fā)布日期：2024-09-10 12:10閱讀：27來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及圖像處理，尤其是涉及一種圖像處理方法、多模態(tài)圖像生成模型的訓(xùn)練方法及裝置。

背景技術(shù)：

1、工業(yè)缺陷檢測中，通常會將待檢測缺陷圖像輸入至預(yù)先訓(xùn)練好的目標(biāo)檢測模型，以檢測該待檢測缺陷圖像的相關(guān)缺陷數(shù)據(jù)，為保證檢測結(jié)果的準(zhǔn)確性，在對目標(biāo)檢測模型進行訓(xùn)練時，需要提供足夠的缺陷圖像樣本，相關(guān)技術(shù)中，可以使用基于生成對抗網(wǎng)絡(luò)的圖像生成模型生成缺陷圖像，但該方式難以準(zhǔn)確捕捉到復(fù)雜的工業(yè)缺陷特征，導(dǎo)致生成的缺陷圖像與實際情況相差較大；還可以采用傳統(tǒng)的數(shù)據(jù)增強算法進行數(shù)據(jù)增強，但該方式通?；诤唵蔚膸缀巫儞Q和圖像處理操作，難以準(zhǔn)確地模擬工業(yè)缺陷的真實特征，無法提供足夠的數(shù)據(jù)多樣性，因此，基于相關(guān)技術(shù)無法解決工業(yè)缺陷檢測所需要的缺陷圖像數(shù)量不足的問題。

技術(shù)實現(xiàn)思路

1、本發(fā)明的目的在于提供一種圖像處理方法、多模態(tài)圖像生成模型的訓(xùn)練方法及裝置，以解決工業(yè)缺陷檢測所需要的缺陷圖像數(shù)量不足的問題。

2、本發(fā)明提供的一種圖像處理方法，方法包括：獲取待處理文本；其中，待處理文本中包括缺陷特征信息；將待處理文本輸入至預(yù)先訓(xùn)練好的多模態(tài)圖像生成模型中，以通過多模態(tài)圖像生成模型，輸出待處理文本對應(yīng)的目標(biāo)缺陷圖像；其中，多模態(tài)圖像生成模型為穩(wěn)定擴散模型和目標(biāo)lora模型相結(jié)合的模型；目標(biāo)lora模型用于微調(diào)穩(wěn)定擴散模型的權(quán)重參數(shù)；目標(biāo)lora模型為與缺陷特征信息所屬缺陷類別相匹配的模型。

3、本發(fā)明提供的一種多模態(tài)圖像生成模型的訓(xùn)練方法，方法包括：獲取多種缺陷類別的子缺陷圖像樣本集；針對每種缺陷類別，基于該缺陷類別的子缺陷圖像樣本集確定樣本圖像；其中，樣本圖像具有對應(yīng)的目標(biāo)命名標(biāo)簽；將目標(biāo)命名標(biāo)簽輸入至初始圖像生成模型中，以通過初始圖像生成模型，輸出該目標(biāo)命名標(biāo)簽對應(yīng)的預(yù)測圖像；其中，初始圖像生成模型包括穩(wěn)定擴散模型和初始lora模型；初始lora模型嵌入在穩(wěn)定擴散模型中，用于微調(diào)穩(wěn)定擴散模型的權(quán)重參數(shù)；基于樣本圖像和預(yù)測圖像，更新初始lora模型的參數(shù)，繼續(xù)執(zhí)行基于該缺陷類別的子缺陷圖像樣本集確定樣本圖像的步驟，直至初始lora模型收斂，得到目標(biāo)lora模型；基于目標(biāo)lora模型和穩(wěn)定擴散模型得到訓(xùn)練好的多模態(tài)圖像生成模型。

4、進一步的，獲取多種缺陷類別的子缺陷圖像樣本集的步驟包括：獲取目標(biāo)缺陷圖像樣本集；按預(yù)設(shè)分類方式，對目標(biāo)缺陷圖像樣本集進行分類，得到多種缺陷類別的子缺陷圖像樣本集；其中，預(yù)設(shè)分類方式包括以下至少一種：按缺陷形態(tài)分類、按缺陷尺寸分類、按缺陷顏色分類。

5、進一步的，獲取目標(biāo)缺陷圖像樣本集的步驟包括：獲取第一缺陷圖像樣本；其中，第一缺陷圖像樣本中包含第一缺陷特征；對第一缺陷圖像樣本進行裁剪處理，以從第一缺陷圖像樣本中裁剪出第一缺陷特征對應(yīng)的第一缺陷區(qū)域圖像；按預(yù)設(shè)相似度比對算法，將第一缺陷區(qū)域圖像與預(yù)設(shè)的缺陷圖像集合中的每張圖像進行相似度比對，得到比對結(jié)果；根據(jù)比對結(jié)果確定目標(biāo)缺陷圖像樣本集。

6、進一步的，根據(jù)比對結(jié)果確定目標(biāo)缺陷圖像樣本集的步驟包括：將比對結(jié)果大于預(yù)設(shè)相似度閾值的圖像，確定為增強缺陷圖像樣本；對增強缺陷圖像樣本進行裁剪處理，以從增強缺陷圖像樣本中裁剪出第一缺陷特征對應(yīng)的第二缺陷區(qū)域圖像；對第一缺陷區(qū)域圖像和第二缺陷區(qū)域圖像進行篩選處理，得到目標(biāo)缺陷圖像樣本集。

7、進一步的，目標(biāo)命名標(biāo)簽通過下述方式確定：針對每種缺陷類別，按預(yù)設(shè)標(biāo)簽命名規(guī)則，對該缺陷類別的子缺陷圖像樣本集中的每張樣本圖像設(shè)置初始命名標(biāo)簽；針對每張樣本圖像，將該樣本圖像的初始命名標(biāo)簽發(fā)送至穩(wěn)定擴散模型的基礎(chǔ)模型中，以通過基礎(chǔ)模型輸出第一結(jié)果；如果第一結(jié)果與初始命名標(biāo)簽不匹配，將初始命名標(biāo)簽確定為該樣本圖像的目標(biāo)命名標(biāo)簽；如果第一結(jié)果與命名標(biāo)簽相匹配，更新該樣本圖像的初始命名標(biāo)簽，重復(fù)執(zhí)行將該樣本圖像的命名標(biāo)簽發(fā)送至穩(wěn)定擴散模型中的基礎(chǔ)模型中的步驟，直至確定該樣本圖像的目標(biāo)命名標(biāo)簽。

8、進一步的，標(biāo)簽命名規(guī)則包括：初始命名標(biāo)簽中包括項目信息和該缺陷類別對應(yīng)的缺陷描述信息。

9、本發(fā)明提供的一種圖像處理裝置，裝置包括：第一獲取模塊，用于獲取待處理文本；其中，待處理文本中包括缺陷特征信息；第一輸出模塊，用于將待處理文本輸入至預(yù)先訓(xùn)練好的多模態(tài)圖像生成模型中，以通過多模態(tài)圖像生成模型，輸出待處理文本對應(yīng)的目標(biāo)缺陷圖像；其中，多模態(tài)圖像生成模型為穩(wěn)定擴散模型和目標(biāo)lora模型相結(jié)合的模型；目標(biāo)lora模型用于微調(diào)穩(wěn)定擴散模型的權(quán)重參數(shù)；目標(biāo)lora模型為與缺陷特征信息所屬缺陷類別相匹配的模型。

10、本發(fā)明提供的一種多模態(tài)圖像生成模型的訓(xùn)練裝置，裝置包括：第二獲取模塊，用于獲取多種缺陷類別的子缺陷圖像樣本集；確定模塊，用于針對每種缺陷類別，基于該缺陷類別的子缺陷圖像樣本集確定樣本圖像；其中，樣本圖像具有對應(yīng)的目標(biāo)命名標(biāo)簽；第二輸出模塊，用于將目標(biāo)命名標(biāo)簽輸入至初始圖像生成模型中，以通過初始圖像生成模型，輸出該目標(biāo)命名標(biāo)簽對應(yīng)的預(yù)測圖像；其中，初始圖像生成模型包括穩(wěn)定擴散模型和初始lora模型；初始lora模型嵌入在穩(wěn)定擴散模型中，用于微調(diào)穩(wěn)定擴散模型的權(quán)重參數(shù)；更新模塊，用于基于樣本圖像和預(yù)測圖像，更新初始lora模型的參數(shù)，繼續(xù)執(zhí)行基于該缺陷類別的子缺陷圖像樣本集確定樣本圖像的步驟，直至初始lora模型收斂，得到訓(xùn)練好的多模態(tài)圖像生成模型。

11、本發(fā)明提供的一種電子設(shè)備，包括處理器和存儲器，存儲器存儲有能夠被處理器執(zhí)行的機器可執(zhí)行指令，處理器執(zhí)行機器可執(zhí)行指令以實現(xiàn)上述圖像處理方法，或上述任一項的多模態(tài)圖像生成模型的訓(xùn)練方法。

12、本發(fā)明提供的圖像處理方法、多模態(tài)圖像生成模型的訓(xùn)練方法及裝置，圖像處理方法包括：獲取待處理文本；其中，待處理文本中包括缺陷特征信息；將待處理文本輸入至預(yù)先訓(xùn)練好的多模態(tài)圖像生成模型中，以通過多模態(tài)圖像生成模型，輸出待處理文本對應(yīng)的目標(biāo)缺陷圖像；其中，多模態(tài)圖像生成模型為穩(wěn)定擴散模型和目標(biāo)lora模型相結(jié)合的模型；目標(biāo)lora模型用于微調(diào)穩(wěn)定擴散模型的權(quán)重參數(shù)；目標(biāo)lora模型為與缺陷特征信息所屬缺陷類別相匹配的模型。該方式中，由于目標(biāo)lora模型為與缺陷特征信息所屬缺陷類別相匹配的模型，因此，通過該目標(biāo)lora模型和穩(wěn)定擴散模型相結(jié)合的多模態(tài)圖像生成模型，可以使生成的目標(biāo)缺陷圖像中準(zhǔn)確包含該缺陷特征信息所描述的缺陷，提高了生成目標(biāo)缺陷圖像的便利性、可控性，進而可以提供滿足需求的缺陷圖像數(shù)量。

技術(shù)特征：

1.一種圖像處理方法，其特征在于，所述方法包括：

2.一種多模態(tài)圖像生成模型的訓(xùn)練方法，其特征在于，所述方法包括：

3.根據(jù)權(quán)利要求2所述的方法，其特征在于，獲取多種缺陷類別的子缺陷圖像樣本集的步驟包括：

4.根據(jù)權(quán)利要求3所述的方法，其特征在于，獲取目標(biāo)缺陷圖像樣本集的步驟包括：

5.根據(jù)權(quán)利要求4所述的方法，其特征在于，根據(jù)所述比對結(jié)果確定目標(biāo)缺陷圖像樣本集的步驟包括：

6.根據(jù)權(quán)利要求2所述的方法，其特征在于，所述目標(biāo)命名標(biāo)簽通過下述方式確定：

7.根據(jù)權(quán)利要求6所述的方法，其特征在于，所述標(biāo)簽命名規(guī)則包括：所述初始命名標(biāo)簽中包括項目信息和該缺陷類別對應(yīng)的缺陷描述信息。

8.一種圖像處理裝置，其特征在于，所述裝置包括：

9.一種多模態(tài)圖像生成模型的訓(xùn)練裝置，其特征在于，所述裝置包括：

10.一種電子設(shè)備，其特征在于，包括處理器和存儲器，所述存儲器存儲有能夠被所述處理器執(zhí)行的機器可執(zhí)行指令，所述處理器執(zhí)行所述機器可執(zhí)行指令以實現(xiàn)權(quán)利要求1所述的圖像處理方法，或權(quán)利要求2-7任一項所述的多模態(tài)圖像生成模型的訓(xùn)練方法。

技術(shù)總結(jié)
本發(fā)明提供了圖像處理方法、多模態(tài)圖像生成模型的訓(xùn)練方法及裝置，圖像處理方法包括：將待處理文本輸入至預(yù)先訓(xùn)練好的多模態(tài)圖像生成模型中，輸出目標(biāo)缺陷圖像；多模態(tài)圖像生成模型為穩(wěn)定擴散模型和目標(biāo)LoRA模型相結(jié)合的模型；目標(biāo)LoRA模型用于微調(diào)穩(wěn)定擴散模型的權(quán)重參數(shù)；目標(biāo)LoRA模型為與缺陷特征信息所屬缺陷類別相匹配的模型。該方式中，由于目標(biāo)LoRA模型為與缺陷特征信息所屬缺陷類別相匹配的模型，因此，通過該目標(biāo)LoRA模型和穩(wěn)定擴散模型相結(jié)合的多模態(tài)圖像生成模型，可以使生成的目標(biāo)缺陷圖像中準(zhǔn)確包含該缺陷特征信息所描述的缺陷，提高了生成目標(biāo)缺陷圖像的便利性、可控性，進而可以提供滿足需求的缺陷圖像數(shù)量。

技術(shù)研發(fā)人員：王凱,方超群,孫瑞,田楷,晏文仲,曹彬,胡江洪,陳立名
受保護的技術(shù)使用者：菲特（天津）檢測技術(shù)有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/9/9

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：王凱,方超群,孫瑞,田楷,晏文仲,曹彬,胡江洪,陳立名
技術(shù)所有人：菲特（天津）檢測技術(shù)有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

圖像處理方法、多模態(tài)圖像生成模型的訓(xùn)練方法及裝置與流程

圖像處理方法、多模態(tài)圖像生成模型的訓(xùn)練方法及裝置與流程