本公開(kāi)的方面涉及用于自動(dòng)裁剪數(shù)字圖像的系統(tǒng)和方法。
背景技術(shù):
1、數(shù)字圖像用于相當(dāng)多的各種各樣的環(huán)境中:相冊(cè)、網(wǎng)站、社交媒體服務(wù)、廣告/營(yíng)銷(xiāo)等等。
2、一旦捕獲了原始數(shù)字圖像,用戶(hù)就將經(jīng)常通過(guò)圖像編輯應(yīng)用程序操縱(或編輯)圖像。由此類(lèi)應(yīng)用程序執(zhí)行的常見(jiàn)操縱是裁剪原始圖像。例如,可以執(zhí)行此以改善(或至少改變)原始圖像的構(gòu)圖和/或改變?cè)紙D像的寬高比。
3、手動(dòng)圖像裁剪典型地是可以通過(guò)多種方式執(zhí)行的直接了當(dāng)過(guò)程。然而,對(duì)于不熟練的用戶(hù)來(lái)說(shuō),執(zhí)行提供良好美學(xué)結(jié)果的裁剪可能具有挑戰(zhàn)性且耗時(shí)。例如,沒(méi)有經(jīng)驗(yàn)的用戶(hù)在找到他們滿(mǎn)意的裁剪之前可能需要在試錯(cuò)過(guò)程中執(zhí)行許多裁剪操作。
4、即使對(duì)于有經(jīng)驗(yàn)的用戶(hù),圖像裁剪也可能是一項(xiàng)乏味的任務(wù)—特別是在用戶(hù)必須裁剪大量圖像的情況下。
技術(shù)實(shí)現(xiàn)思路
1、本文描述了一種用于自動(dòng)生成輸入圖像的裁剪版本的計(jì)算機(jī)實(shí)施的方法,該方法包括:由處理單元處理輸入圖像以檢測(cè)輸入圖像的顯著區(qū)域;基于輸入圖像的顯著區(qū)域來(lái)生成裁剪候選集,每個(gè)裁剪候選定義不同的圖像裁剪;計(jì)算候選分?jǐn)?shù)集,每個(gè)候選分?jǐn)?shù)對(duì)應(yīng)一裁剪候選;基于裁剪候選分?jǐn)?shù)集來(lái)選擇第一裁剪候選;基于由第一裁剪候選定義的圖像裁剪來(lái)生成輸入圖像的裁剪版本;以及輸出輸入圖像的裁剪版本。
1.一種用于自動(dòng)生成輸入圖像的裁剪版本的計(jì)算機(jī)實(shí)施的方法,所述方法包括:
2.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)施的方法,其中,基于所述輸入圖像的所述顯著區(qū)域生成所述裁剪候選集包括:
3.根據(jù)權(quán)利要求2所述的計(jì)算機(jī)實(shí)施的方法,其中,確定所述一個(gè)或多個(gè)目標(biāo)寬高比包括確定單個(gè)定義的目標(biāo)寬高比。
4.根據(jù)權(quán)利要求2所述的計(jì)算機(jī)實(shí)施的方法,其中,確定所述一個(gè)或多個(gè)目標(biāo)寬高比包括確定多個(gè)預(yù)定義目標(biāo)寬高比。
5.根據(jù)權(quán)利要求4所述的計(jì)算機(jī)實(shí)施的方法,其中,確定所述多個(gè)預(yù)定義目標(biāo)寬高比包括:
6.根據(jù)權(quán)利要求2所述的計(jì)算機(jī)實(shí)施的方法,其中,生成所述種子點(diǎn)第一集包括生成中心種子點(diǎn),所述中心種子點(diǎn)定義所述輸入圖像的所述顯著區(qū)域的中心。
7.根據(jù)權(quán)利要求2所述的計(jì)算機(jī)實(shí)施的方法,其中,生成所述種子點(diǎn)第一集包括生成偏移種子點(diǎn),所述偏移種子點(diǎn)定義從所述輸入圖像的所述顯著區(qū)域的中心偏移的點(diǎn)。
8.根據(jù)權(quán)利要求2所述的計(jì)算機(jī)實(shí)施的方法,其中,基于所述第一種子點(diǎn)生成所述裁剪候選第一子集包括基于所述第一種子點(diǎn)、所述第一目標(biāo)寬高比和縮放值集生成多個(gè)裁剪候選。
9.根據(jù)權(quán)利要求8所述的計(jì)算機(jī)實(shí)施的方法,其中,基于所述第一種子點(diǎn)、所述第一目標(biāo)寬高比和所述縮放值集生成所述多個(gè)裁剪候選包括:
10.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)施的方法,其中,在處理所述輸入圖像以檢測(cè)所述輸入圖像的所述顯著區(qū)域之前,所述方法還包括:
11.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)施的方法,其中,處理所述輸入圖像以檢測(cè)所述輸入圖像的所述顯著區(qū)域包括使用第一經(jīng)訓(xùn)練的機(jī)器學(xué)習(xí)模型來(lái)處理所述輸入圖像。
12.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)施的方法,其中,計(jì)算第一裁剪候選的第一候選分?jǐn)?shù)包括:
13.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)施的方法,其中,輸出所述輸入圖像的所述裁剪版本包括以下各項(xiàng)中的一項(xiàng)或多項(xiàng):顯示所述輸入圖像的所述裁剪版本;保存所述輸入圖像的所述裁剪版本;發(fā)布所述輸入圖像的所述裁剪版本;打印所述輸入圖像的所述裁剪版本;將所述輸入圖像的所述裁剪版本附加到電子通信。
14.一種計(jì)算機(jī)處理系統(tǒng),包括:
15.根據(jù)權(quán)利要求14所述的計(jì)算機(jī)處理系統(tǒng),其中,基于所述輸入圖像的所述顯著區(qū)域生成所述裁剪候選集包括:
16.根據(jù)權(quán)利要求15所述的計(jì)算機(jī)處理系統(tǒng)實(shí)施的方法,其中,確定所述一個(gè)或多個(gè)目標(biāo)寬高比包括確定多個(gè)預(yù)定義目標(biāo)寬高比,并且其中,確定所述多個(gè)預(yù)定義目標(biāo)寬高比包括:
17.根據(jù)權(quán)利要求15所述的計(jì)算機(jī)處理系統(tǒng),其中,生成所述種子點(diǎn)第一集包括:
18.根據(jù)權(quán)利要求15所述的計(jì)算機(jī)處理系統(tǒng),其中,基于所述第一種子點(diǎn)生成所述裁剪候選第一子集包括基于所述第一種子點(diǎn)、所述第一目標(biāo)寬高比和縮放值集生成多個(gè)裁剪候選。
19.根據(jù)權(quán)利要求14所述的計(jì)算機(jī)處理系統(tǒng),其中,在處理所述輸入圖像以檢測(cè)所述輸入圖像的所述顯著區(qū)域之前,所述方法還包括:
20.一種非暫態(tài)存儲(chǔ),其存儲(chǔ)指令,所述指令能由一個(gè)或多個(gè)計(jì)算機(jī)處理單元執(zhí)行以使所述一個(gè)或多個(gè)計(jì)算機(jī)處理單元執(zhí)行包括以下步驟的方法: