本技術涉及圖像處理,尤其涉及一種圖像處理方法、設備、存儲介質及程序產品。
背景技術:
1、隨著人工智能技術的飛速發(fā)展,特別是在自動駕駛領域的深入探索,世界模型(world?model)作為一種新興且強大的工具,正逐步展現出其在理解和仿真現實世界方面的巨大潛力。
2、但是當前世界模型的構建方式主要依賴于全圖推理,全圖推理能夠捕捉圖像或場景的整體結構和關系,但在處理單一對象時存在明顯不足。由于全圖推理將多個對象、對象和背景融為一體進行考量,使得對單一對象進行調整變得極為困難。即現有世界模型構建方法難以實現單一對象的調整。
3、上述內容僅用于輔助理解本技術的技術方案,并不代表承認上述內容是現有技術。
技術實現思路
1、本技術的主要目的在于提供一種圖像處理方法、設備、存儲介質及程序產品,旨在解決現有世界模型構建方法難以實現單一對象的調整的技術問題。
2、為實現上述目的,本技術提出一種圖像處理方法,所述圖像處理方法包括:
3、獲取原始圖像、所述原始圖像的語義圖,以及針對所述原始圖像的修改內容描述信息;
4、根據所述語義圖,識別出所述修改內容描述信息指向的目標對象所處目標修改區(qū)域;
5、基于所述語義圖對所述原始圖像的目標修改區(qū)域進行覆蓋和重繪,得到背景圖像;
6、將所述目標對象與所述背景圖像融合后,得到目標圖像,用于構建世界模型。
7、在一實施例中,在獲取原始圖像的語義圖的步驟之前,包括:
8、對所述原始圖像中各像素點進行語義提取,得到像素表征語義;
9、對所述原始圖像中各標簽類別的特征進行語義提取,得到標簽特征語義;
10、根據所述像素表征語義和所述標簽特征語義,生成所述原始圖像的語義圖。
11、在一實施例中,所述基于所述語義圖對所述原始圖像的目標修改區(qū)域進行覆蓋和重繪,得到背景圖像的步驟,包括:
12、獲取所述原始圖像的背景信息,并根據所述背景信息生成初始背景;
13、對所述原始圖像的目標修改區(qū)域進行覆蓋,并基于所述語義圖和所述初始背景對覆蓋的區(qū)域進行重繪,生成所述原始圖像對應的背景圖像。
14、在一實施例中,所述對所述原始圖像的目標修改區(qū)域進行覆蓋,并基于所述語義圖和所述初始背景對覆蓋的區(qū)域進行重繪,生成所述原始圖像對應的背景圖像的步驟,包括:
15、對所述原始圖像的目標修改區(qū)域進行覆蓋和加噪處理,并基于所述語義圖從加噪處理后的原始圖像中刪去覆蓋區(qū)域內的對象,得到第一圖像;
16、對初始背景進行去噪處理,并基于所述語義圖從所述初始背景中刪去所述目標修改區(qū)域以外的對象,得到第二圖像;
17、融合所述第一圖像和所述第二圖像,得到當前修改圖像;
18、將所述當前修改圖像作為新的初始背景,并執(zhí)行步驟:對所述原始圖像的目標修改區(qū)域進行覆蓋和加噪處理,并基于所述語義圖從加噪處理后的原始圖像中刪去覆蓋區(qū)域內的對象,得到第一圖像;
19、在預定迭代時長后,將當前修改圖像作為背景圖像。
20、在一實施例中,所述將所述目標對象與所述背景圖像融合后,得到目標圖像的步驟,包括:
21、對所述修改內容描述信息進行文本提煉,得到所述修改內容描述信息對應的位置修改指令,并確定所述位置修改指令指示的目標位置;
22、將所述目標對象移動至所述目標位置后,將移動后的目標對象與所述背景圖像進行融合,得到目標圖像。
23、在一實施例中,在所述將所述目標對象移動至所述目標位置后,將移動后的目標對象與所述背景圖像進行融合,得到目標圖像的步驟之前,包括:
24、獲取所述目標對象在所述原始圖像中的初始位置;
25、根據所述初始位置和所述目標位置,確定所述初始位置在世界坐標系下的第一映射比例和所述目標位置在所述世界坐標系下的第二映射比例;
26、根據所述第一映射比例和所述第二映射比例,對所述目標對象的尺寸進行調整,得到調整后的目標對象。
27、在一實施例中,在所述根據所述修改內容描述信息對應的修改指令,將所述目標對象與所述背景圖像融合后,得到目標圖像的步驟之后,包括:
28、獲取圖像序列,以及拍攝所述原始圖像的攝像頭的先驗光流信息,其中所述圖像序列包括目標圖像;
29、根據所述目標圖像,生成所述目標圖像的三維布局信息;
30、基于所述先驗光流信息對所述圖像序列進行光流估計,得到所述圖像序列中相鄰幀之間的稠密光流;
31、根據所述稠密光流、所述三維布局信息和所述圖像序列,生成場景視頻,用于構建世界模型。
32、此外,為實現上述目的,本技術還提出一種圖像處理設備,所述設備包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述計算機程序配置為實現如上文所述的圖像處理方法的步驟。
33、此外,為實現上述目的,本技術還提出一種存儲介質,所述存儲介質為計算機可讀存儲介質,所述存儲介質上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現如上文所述的圖像處理方法的步驟。
34、此外,為實現上述目的,本技術還提供一種計算機程序產品,所述計算機程序產品包括計算機程序,所述計算機程序被處理器執(zhí)行時實現如上文所述的圖像處理方法的步驟。
35、本技術提出的一個或多個技術方案,至少具有以下技術效果:
36、本技術通過獲取原始圖像、所述原始圖像的語義圖,以及針對所述原始圖像的修改內容描述信息。由此獲得了期望用于構建世界模型的原始圖像及其語義圖,以及用戶下發(fā)針對所述原始圖像的修改需求的文本內容。進而根據所述語義圖,識別出所述修改內容描述信息指向的目標對象所處目標修改區(qū)域,由于語義圖中會對所述原始圖像中各對象進行分割,因此將分割后的區(qū)域與所述修改內容描述信息指向的目標對象進行匹配,則可以識別出需要進行修改的目標修改區(qū)域?;谒稣Z義圖對所述原始圖像的目標修改區(qū)域進行覆蓋和重繪,得到背景圖像,由于所述語義圖描述了所述原始圖像中各對象的特征,因此基于所述語義圖進行覆蓋重繪,則可以保障所述原始圖像中各對象的形態(tài)不會在圖像處理過程中出現失控、變形。進而根據所述修改內容描述信息對應的修改指令(如增加、刪除、調整目標對象等),將所述目標對象與所述背景圖像融合后,得到目標圖像,用于構建世界模型。由此本技術一方面通過原始圖像的語義圖,能夠準確地識別出需要修改的目標對象,進而通過對所述目標對象的修改,實現可根據具體需求對原始圖像進行個性化的編輯和調整,另一方面通過在語義圖的指導下進行重繪和融合,則可以約束所述原始圖像中各對象的形態(tài),避免在圖像編輯和調整過程中出現形態(tài)變形和失控,導致調整后得到的目標圖像無法用于構建世界模型。由此本技術通過對原始圖像在對象形態(tài)可控的前提下可針對單一對象的圖像編輯與調整,可以實現對于構建的世界模型中單一對象的調整,有效提高了世界模型的適用范圍和構建的靈活性。