用于提取圖像中對(duì)象邊界的裝置、方法以及電子設(shè)備的制作方法
【專利摘要】本發(fā)明提供了用于提取圖像中對(duì)象邊界的裝置、方法以及電子設(shè)備,以至少克服現(xiàn)有的邊界提取技術(shù)中存在的提取精度低或者需要多次手工調(diào)整的問題。上述裝置包括:用于確定圖像中對(duì)象的邊界的起點(diǎn)和終點(diǎn)、以及確定與上述起點(diǎn)和終點(diǎn)相關(guān)的參考點(diǎn)的位置的位置確定單元;用于確定邊界的第一方向的第一方向確定單元;用于獲得第一區(qū)域的梯度圖的梯度圖獲得單元;用于衰減梯度圖中第二區(qū)域的梯度的梯度衰減單元;以及用于提取對(duì)象邊界的提取單元。上述方法用于執(zhí)行能夠?qū)崿F(xiàn)上述裝置的功能的處理。上述電子設(shè)備包括上述裝置。本發(fā)明的上述技術(shù)能夠提高邊界提取的精度,可以應(yīng)用于圖像處理領(lǐng)域。
【專利說明】用于提取圖像中對(duì)象邊界的裝置、方法以及電子設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及圖像處理領(lǐng)域,尤其涉及一種用于提取圖像中對(duì)象邊界的裝置、方法以及電子設(shè)備。
【背景技術(shù)】
[0002]隨著現(xiàn)代電子科技的發(fā)展,諸如數(shù)碼相機(jī)、掃描儀等產(chǎn)品越來越被廣泛地應(yīng)用于人們的日常生活、工作等各個(gè)領(lǐng)域。然而,諸如數(shù)碼相機(jī)、掃描儀等產(chǎn)品針對(duì)文檔、實(shí)物等對(duì)象所捕獲的圖像,都存在如透視變換、拉伸變形等失真的可能。為了去除圖像失真,得到準(zhǔn)確的對(duì)象邊界變得較為重要。
[0003]無論使用什么邊界追蹤算法,都不能達(dá)到100%的準(zhǔn)確率。因此,在提取圖像中對(duì)象邊界時(shí)通常需要用戶的交互,例如通過用戶點(diǎn)擊鼠標(biāo)來輸入正確的邊界點(diǎn)。然而,這種利用基于已知邊界點(diǎn)來提取對(duì)象邊界的技術(shù)所提取的對(duì)象邊界常常精度較低。
[0004]此外,另一些傳統(tǒng)的邊界提取技術(shù)采用幾個(gè)控制點(diǎn)來代表整條曲線,用戶可以調(diào)整每個(gè)控制點(diǎn)的縱坐標(biāo),邊界曲線采用局部擬合這些控制點(diǎn)來獲得更新。為了調(diào)整整條曲線,用戶需要多次手工調(diào)整,最終得到的曲線也不是整體意義上的平滑。
【發(fā)明內(nèi)容】
[0005]在下文中給出了關(guān)于本發(fā)明的簡要概述,以便提供關(guān)于本發(fā)明的某些方面的基本理解。應(yīng)當(dāng)理解,這個(gè)概述并不是關(guān)于本發(fā)明的窮舉性概述。它并不是意圖確定本發(fā)明的關(guān)鍵或重要部分,也不是意圖限定本發(fā)明的范圍。其目的僅僅是以簡化的形式給出某些概念,以此作為稍后論述的更詳細(xì)描述的前序。
[0006]鑒于現(xiàn)有技術(shù)的上述缺陷,本發(fā)明的目的之一是提供一種用于提取圖像中對(duì)象邊界的裝置、方法以及電子設(shè)備,以至少克服現(xiàn)有的邊界提取技術(shù)中存在的提取精度低或者需要多次手工調(diào)整的問題。
[0007]為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的一個(gè)方面,提供了一種用于提取圖像中對(duì)象邊界的裝置,包括:位置確定單元,其被配置用于確定上述圖像中的對(duì)象的邊界的起點(diǎn)和終點(diǎn),以及確定與上述起點(diǎn)和上述終點(diǎn)相關(guān)的參考點(diǎn)的位置;第一方向確定單元,其被配置用于確定上述邊界的第一方向;第二方向確定單兀,其被配置用于確定與上述邊界的第一方向相交的第二方向;梯度圖獲得單元,其被配置用于在上述圖像中確定包含上述起點(diǎn)、上述終點(diǎn)和上述參考點(diǎn)的第一區(qū)域,并獲得上述第一區(qū)域的梯度圖;梯度衰減單元,其被配置用于在上述參考點(diǎn)的沿第二方向的兩側(cè)中的至少一側(cè)確定至少一個(gè)第二區(qū)域,并在上述梯度圖中對(duì)上述第二區(qū)域的梯度進(jìn)行衰減;以及提取單元,其被配置用于基于衰減后的梯度圖在上述起點(diǎn)和上述終點(diǎn)之間進(jìn)行邊界提取以獲得上述對(duì)象邊界。
[0008]根據(jù)本發(fā)明的另一個(gè)方面,還提供了一種用于提取圖像中對(duì)象邊界的方法,包括:確定上述圖像中的對(duì)象的邊界的起點(diǎn)和終點(diǎn),以及確定與上述起點(diǎn)和上述終點(diǎn)相關(guān)的參考點(diǎn)的位置;確定上述邊界的第一方向;確定與上述邊界的第一方向相交的第二方向;在上述圖像中確定包含上述起點(diǎn)、上述終點(diǎn)和上述參考點(diǎn)的第一區(qū)域,并獲得上述第一區(qū)域的梯度圖;在上述參考點(diǎn)的沿第二方向的兩側(cè)中的至少一側(cè)確定至少一個(gè)第二區(qū)域;在上述梯度圖中對(duì)上述第二區(qū)域的梯度進(jìn)行衰減,并基于衰減后的梯度圖在上述起點(diǎn)和上述終點(diǎn)之間進(jìn)行邊界提取以獲得上述對(duì)象邊界。
[0009]根據(jù)本發(fā)明的另一個(gè)方面,還提供了一種電子設(shè)備,該設(shè)備包括如上所述的用于提取圖像中對(duì)象邊界的裝置。
[0010]依據(jù)本發(fā)明的其它方面,還提供了相應(yīng)的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有能夠由計(jì)算設(shè)備執(zhí)行的計(jì)算機(jī)程序,所述程序在執(zhí)行時(shí)能夠使所述計(jì)算設(shè)備執(zhí)行上述用于提取圖像中對(duì)象邊界的方法。
[0011]上述根據(jù)本發(fā)明實(shí)施例的用于提取圖像中對(duì)象邊界的裝置、方法以及電子設(shè)備,至少能夠獲得以下益處之一:提高邊界提取的精度;不需要用戶多次的手工調(diào)整;提高處理效率;以及方便用戶使用。
[0012]通過以下結(jié)合附圖對(duì)本發(fā)明的最佳實(shí)施例的詳細(xì)說明,本發(fā)明的這些以及其他優(yōu)點(diǎn)將更加明顯。
【專利附圖】
【附圖說明】
[0013]本發(fā)明可以通過參考下文中結(jié)合附圖所給出的描述而得到更好的理解,其中在所有附圖中使用了相同或相似的附圖標(biāo)記來表示相同或者相似的部件。所述附圖連同下面的詳細(xì)說明一起包含在本說明書中并且形成本說明書的一部分,而且用來進(jìn)一步舉例說明本發(fā)明的優(yōu)選實(shí)施例和解釋本發(fā)明的原理和優(yōu)點(diǎn)。在附圖中:
[0014]圖1是示意性地示出根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的裝置的一種示例結(jié)構(gòu)的框圖。
[0015]圖2是示出針對(duì)文檔所捕獲的掃描圖像的一個(gè)示例的示意圖。
[0016]圖3A是示出第一區(qū)域的梯度圖的一個(gè)示例的示意圖,圖3B是示出第一區(qū)域的梯度圖的另一個(gè)示例的示意圖。
[0017]圖4是示意性地示出了如圖1所示的提取單元的一種可能的示例結(jié)構(gòu)。
[0018]圖5是示意性地示出了根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的裝置的另一種示例結(jié)構(gòu)的框圖。
[0019]圖6是示意性地示出根據(jù)本發(fā)明的用于提取圖像中對(duì)象邊界的方法的一種示例性處理的流程圖。
[0020]圖7是示出了可用來實(shí)現(xiàn)根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的裝置和方法的一種可能的信息處理設(shè)備的硬件配置的結(jié)構(gòu)簡圖。
[0021]本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,附圖中的元件僅僅是為了簡單和清楚起見而示出的,而且不一定是按比例繪制的。例如,附圖中某些元件的尺寸可能相對(duì)于其他元件放大了,以便有助于提高對(duì)本發(fā)明實(shí)施例的理解。
【具體實(shí)施方式】
[0022]在下文中將結(jié)合附圖對(duì)本發(fā)明的示范性實(shí)施例進(jìn)行描述。為了清楚和簡明起見,在說明書中并未描述實(shí)際實(shí)施方式的所有特征。然而,應(yīng)該了解,在開發(fā)任何這種實(shí)際實(shí)施例的過程中必須做出很多特定于實(shí)施方式的決定,以便實(shí)現(xiàn)開發(fā)人員的具體目標(biāo),例如,符合與系統(tǒng)及業(yè)務(wù)相關(guān)的那些限制條件,并且這些限制條件可能會(huì)隨著實(shí)施方式的不同而有所改變。此外,還應(yīng)該了解,雖然開發(fā)工作有可能是非常復(fù)雜和費(fèi)時(shí)的,但對(duì)得益于本公開內(nèi)容的本領(lǐng)域技術(shù)人員來說,這種開發(fā)工作僅僅是例行的任務(wù)。
[0023]在此,還需要說明的一點(diǎn)是,為了避免因不必要的細(xì)節(jié)而模糊了本發(fā)明,在附圖中僅僅示出了與根據(jù)本發(fā)明的方案密切相關(guān)的裝置結(jié)構(gòu)和/或處理步驟,而省略了與本發(fā)明關(guān)系不大的其他細(xì)節(jié)。
[0024]如上所述,現(xiàn)有的邊界提取技術(shù)存在提取精度低或者需要多次手工調(diào)整的問題。針對(duì)這一問題,本發(fā)明提出了 了一種用于提取圖像中對(duì)象邊界的裝置。
[0025]上述用于提取圖像中對(duì)象邊界的裝置包括:位置確定單元,其被配置用于確定上述圖像中的對(duì)象的邊界的起點(diǎn)和終點(diǎn),以及確定與上述起點(diǎn)和上述終點(diǎn)相關(guān)的參考點(diǎn)的位置;第一方向確定單兀,其被配置用于確定上述邊界的第一方向;第二方向確定單兀,其被配置用于確定與上述邊界的第一方向相交的第二方向;梯度圖獲得單元,其被配置用于在上述圖像中確定包含上述起點(diǎn)、上述終點(diǎn)和上述參考點(diǎn)的第一區(qū)域,并獲得上述第一區(qū)域的梯度圖;梯度衰減單元,其被配置用于在上述參考點(diǎn)的沿第二方向的兩側(cè)中的至少一側(cè)確定至少一個(gè)第二區(qū)域,并在上述梯度圖中對(duì)上述第二區(qū)域的梯度進(jìn)行衰減;以及提取單元,其被配置用于基于衰減后的梯度圖在上述起點(diǎn)和上述終點(diǎn)之間進(jìn)行邊界提取以獲得上述對(duì)象邊界。
[0026]圖1是示意性地示出根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的裝置的一種示例結(jié)構(gòu)的框圖。
[0027]如圖1所示,根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的裝置100包括位置確定單元110、第一方向確定單元120、第二方向確定單元130、梯度圖獲得單元140、梯度衰減單元150和提取單元160。
[0028]如圖1所示,位置確定單元110用于確定圖像中對(duì)象的邊界的起點(diǎn)和終點(diǎn)。
[0029]其中,在根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的裝置的具體實(shí)現(xiàn)方式中,上述圖像例如可以是針對(duì)實(shí)物等對(duì)象所拍攝的圖像,或者可以是針對(duì)諸如文檔等對(duì)象所捕獲的掃描圖像。
[0030]下文中將主要以針對(duì)文檔所捕獲的掃描圖像為例來詳細(xì)描述根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的裝置100,在該例子中,上述掃描圖像中的對(duì)象的邊界即為文檔的一個(gè)邊界。
[0031]圖2示意性地示出了上述針對(duì)文檔所捕獲的掃描圖像的一個(gè)例子。如圖2所示,I為文檔d的一個(gè)邊界(也即真實(shí)的邊界),Pl和P2分別為邊界I的起點(diǎn)和終點(diǎn),其中,這里即為邊界I對(duì)應(yīng)的兩個(gè)文檔角點(diǎn)。需要說明的是,這兩個(gè)文檔角點(diǎn)(也即,邊界的起點(diǎn)和終點(diǎn))可以由用戶輸入,例如,由用戶通過鼠標(biāo)或觸摸屏等輸入設(shè)備來輸入;或者,上述兩個(gè)文檔角點(diǎn)也可以通過一些現(xiàn)有的角點(diǎn)提取技術(shù)來獲得,在此不再詳述。需要說明的是,為了簡明和清除起見,在圖2中未示出文檔d中的內(nèi)容,但在實(shí)際應(yīng)用中,文檔d中可以包含諸如文字、圖畫等各種內(nèi)容。
[0032]圖2中所示出的11為在上述角點(diǎn)Pl和P2之間利用現(xiàn)有的邊界提取技術(shù)(例如,基于圖像梯度的邊界提取技術(shù))所提取的邊界。由圖2可以看出,基于角點(diǎn)Pl和P2所提取的邊界11與真實(shí)邊界I之間的差異較大,這是由于文檔d所包含的諸如文字、圖畫等內(nèi)容的梯度(下文簡稱為“內(nèi)容梯度”)對(duì)邊界提取會(huì)產(chǎn)生影響,使得基于圖像梯度所提取的邊界產(chǎn)生偏差。而使用根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的裝置100,則能夠改善這種偏差。下面結(jié)合圖1和圖2繼續(xù)描述裝置100中的其他各組成單元的功能和處理。
[0033]位置確定單元110還可以用于確定與上述邊界的起點(diǎn)和終點(diǎn)(在圖2所示例子中為角點(diǎn)Pl和P2)有關(guān)的參考點(diǎn)的位置。在圖2所示的例子中,P3為參考點(diǎn)的一個(gè)示例。其中,參考點(diǎn)P3例如可以由用戶通過鼠標(biāo)或觸摸屏等輸入設(shè)備來輸入。
[0034]其中,這里所說的“起點(diǎn)”、“終點(diǎn)”以及“參考點(diǎn)”均分別為圖像中的單個(gè)像素點(diǎn)。當(dāng)輸入的作為“起點(diǎn)”、“終點(diǎn)”或“參考點(diǎn)”的點(diǎn)包括多個(gè)像素點(diǎn)時(shí),可以在其中選擇一個(gè)(例如多個(gè)像素點(diǎn)的中心像素點(diǎn))作為對(duì)應(yīng)的“起點(diǎn)”、“終點(diǎn)”或“參考點(diǎn)”。
[0035]如圖2所示,第一方向確定單元120可以用于確定邊界I的第一方向。
[0036]其中,如圖2所示,在根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的裝置的一種實(shí)施方式中,第一方向確定單兀120可以這樣來估計(jì)邊界I的第一方向:獲得角點(diǎn)Pl和P2之間的連線Ipip2的斜率方向,以及將連線Ipip2的斜率方向確定為邊界I的第一方向。
[0037]此外,在根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的裝置的另一種實(shí)施方式中,第一方向確定單元120也可以通過現(xiàn)有的諸如傾斜度估計(jì)方法來獲得邊界I的第一方向。例如,在參考點(diǎn)P3附近截取一個(gè)圖像塊,通過現(xiàn)有方法獲得該圖像塊的傾斜度(例如,與水平方向的夾角,等等),將該圖像塊的傾斜度作為邊界I的第一方向。
[0038]如圖2所示,第二方向確定單元130用于確定與邊界I的第一方向相交的第二方向k。其中,第二方向k例如可以是與邊界I的第一方向相交的任意方向,優(yōu)選地,第二方向k可以是與邊界I的第一方向垂直的那個(gè)方向。需要說明的是,這里所說的與第一方向相交的第二方向,是指第二方向所在直線與第一方向所在直線相交(也即夾角不為0),而第二方向與第一方向垂直則是指第二方向所在直線與第一方向所在直線之間的夾角為90度。
[0039]此外,梯度圖獲得單元140用于在圖像中確定包含角點(diǎn)P1、角點(diǎn)P2和參考點(diǎn)P3的第一區(qū)域,以及獲得上述第一區(qū)域的梯度圖。其中,在根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的裝置的具體實(shí)現(xiàn)方式中,上述第一區(qū)域的形狀可以是矩形、方形、圓形以及橢圓形等形狀中的任意一種。
[0040]例如,在如圖2所示的例子中,上述第一區(qū)域可以是包含角點(diǎn)P1、角點(diǎn)P2和參考點(diǎn)P3的矩形區(qū)域SI,其中,矩形區(qū)域SI的長度方向例如可以沿角點(diǎn)Pl和P2之間的連線Ipip2的斜率方向延伸。
[0041]此外,在獲得第一區(qū)域的梯度圖后,梯度衰減單元150可以在參考點(diǎn)P3的沿第二方向k的兩側(cè)中的至少一側(cè)確定至少一個(gè)第二區(qū)域,并在第一區(qū)域的梯度圖中對(duì)第二區(qū)域的梯度進(jìn)行衰減。在根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的裝置的一種實(shí)現(xiàn)方式中,在第一區(qū)域的梯度圖為經(jīng)過反色處理的梯度圖的情況下,梯度衰減單元150可以將衰減后的梯度圖中的第二區(qū)域的梯度的數(shù)值設(shè)為比衰減前的梯度圖中的第二區(qū)域的梯度的數(shù)值更大;此外,該實(shí)現(xiàn)方式中,在第一區(qū)域的梯度圖為未經(jīng)過反色處理的梯度圖的情況下,梯度衰減單元150可以將衰減后的梯度圖中的第二區(qū)域的梯度的數(shù)值設(shè)為比衰減前的梯度圖中的第二區(qū)域的梯度的數(shù)值更小。
[0042]此外,第二區(qū)域可以是三角型區(qū)域、扇形區(qū)域、帶狀區(qū)域以及拋物線型區(qū)域等各種形狀區(qū)域中的任意一種,或者,也可以是以上各種區(qū)域中的至少兩種的疊加。需要說明的是,所確定的第二區(qū)域可以包含參考點(diǎn)P3,也可以不包含參考點(diǎn)P3,優(yōu)選地,可以使第二區(qū)域不包含參考點(diǎn)P3。
[0043]其中,第二區(qū)域可以具有預(yù)定的形狀和/或尺寸。例如,在第二區(qū)域?yàn)槿切蛥^(qū)域的情況下,該三角型區(qū)域的頂角大小例如可以為10度、30度或其他預(yù)設(shè)角度,其中,該頂角在第二方向k兩側(cè)的部分角α和角β可以均勻分配,也可以按其他比例分配(例如,角α為10度,角β為20度)
[0044];此外,上述頂角以及角α和角β也可以根據(jù)經(jīng)驗(yàn)值或通過試驗(yàn)的方式來確定。
[0045]此外,為了防止衰減掉真實(shí)邊界上的梯度,梯度衰減單元150可以在第二區(qū)域和參考點(diǎn)Ρ3之間留有一些冗余。
[0046]例如,在根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的裝置的具體實(shí)現(xiàn)方式中,可以令第二區(qū)域位于參考點(diǎn)Ρ3的預(yù)定大小鄰域之外。在一個(gè)例子中,上述預(yù)定大小鄰域可以是包含參考點(diǎn)Ρ3的具有預(yù)定大小的圓形區(qū)域或帶狀區(qū)域等區(qū)域。
[0047]在根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的裝置的一種實(shí)現(xiàn)方式中,第二區(qū)域的形狀和/或位置可以根據(jù)用戶的輸入指令進(jìn)行調(diào)整。例如,當(dāng)用戶輸入?yún)⒖键c(diǎn)Ρ3的位置時(shí),可以在參考點(diǎn)Ρ3的沿第二方向k的兩側(cè)以虛線框的方式顯示諸如三角型區(qū)域、扇形區(qū)域、帶狀區(qū)域以及拋物線型區(qū)域等多個(gè)不同形狀的區(qū)域,由用戶選擇其中至少一個(gè)區(qū)域來作為第二區(qū)域。此外,在一些例子中,用戶可以手動(dòng)調(diào)整上述第二區(qū)域的形狀和/或位置,例如,對(duì)選定作為第二區(qū)域的三角型區(qū)域的邊長、頂角等實(shí)施手動(dòng)調(diào)整,以能夠?qū)崿F(xiàn)最佳處理效果。
[0048]圖3A和圖3B分別示出了如圖2所示的第一區(qū)域SI的梯度圖。需要說明的是,一般情況下,直接獲得的圖像的梯度圖(以下稱為未經(jīng)過反色處理的梯度圖)的背景梯度的數(shù)值通常為O或接近O。而圖3A和圖3B所示的梯度圖是通過對(duì)上述直接獲得的第一區(qū)域SI的梯度圖經(jīng)過反色處理所得到的梯度圖(用255分別減去正常梯度圖中各像素點(diǎn)的梯度值,利用所得到的梯度值構(gòu)建的梯度圖即為上述正常梯度圖的反色梯度圖)(以下稱為經(jīng)過反色處理的梯度圖),因此,圖3A和圖3B所示的梯度圖中的背景梯度為255或接近255。
[0049]在一個(gè)示例中,如圖3A所示,梯度衰減單元150可以首先確定參考點(diǎn)P3的預(yù)定大小鄰域,例如,圖3A中的以參考點(diǎn)P3為圓心的、具有預(yù)定大小的圓形鄰域S0,其中,圓形鄰域SO的大小例如可以根據(jù)經(jīng)驗(yàn)或?qū)嶋H需要來設(shè)定。然后,梯度衰減單元150可以分別在參考點(diǎn)P3的沿第二方向k的兩側(cè)各確定一個(gè)三角形區(qū)域,也即324和S2b,分別作為第二區(qū)域。其中,三角形區(qū)域S2a和S2b分別位于參考點(diǎn)P3的圓形鄰域SO之外。確定了第二區(qū)域后,梯度衰減單元150可以在第一區(qū)域SI中對(duì)第二區(qū)域(也即三角形區(qū)域S2a和S2B)的梯度進(jìn)行衰減,使得衰減后的第二區(qū)域的梯度比其衰減前更大。在一個(gè)例子中,可以增大三角形區(qū)域S2a和S2b的梯度(例如,若三角形區(qū)域S2a和S2b原來的梯度為20,則衰減后的三角形區(qū)域S2a和三角形區(qū)域S2b的梯度可以是100或更高);在另一個(gè)例子中,也可以將三角形區(qū)域S2a和S2b的梯度直接設(shè)為255。
[0050]在另一個(gè)示例中,如圖3B所示,梯度衰減單元150可以首先確定參考點(diǎn)P3的預(yù)定大小鄰域,例如,圖3B中的以參考點(diǎn)P3為中心、具有預(yù)定大小的帶狀鄰域S0’,且該帶狀鄰域S0’的長度方向沿邊界I的第一方向延伸。其中,參考點(diǎn)P3的帶狀鄰域S0’的大小例如可以根據(jù)經(jīng)驗(yàn)或?qū)嶋H需要來設(shè)定。然后,梯度衰減單元150可以分別在參考點(diǎn)P3的沿第二方向k的兩側(cè)各確定一個(gè)帶狀區(qū)域,也即334和S3B,分別作為第二區(qū)域。類似地,帶狀區(qū)域334和S3b分別位于參考點(diǎn)P3的帶狀鄰域S0’之外,并使得衰減后的第二區(qū)域的梯度比其衰減前更大。這里,對(duì)帶狀區(qū)域334和S3b的梯度進(jìn)行衰減的具體例子可參考上文對(duì)圖3A所示的三角形區(qū)域S2a和S2b進(jìn)行衰減的具體例子的描述,在此不再贅述。
[0051]此外,需要說明的是,在其他示例中,若第一區(qū)域的梯度圖是未經(jīng)反色處理的梯度圖,則可以通過梯度衰減單元150使得衰減后的第二區(qū)域的梯度比其衰減前更小。在一個(gè)例子中,可以減小第二區(qū)域的梯度(例如,若第二區(qū)域的原來梯度為200,則衰減后的第二區(qū)域的梯度可以為100或更低);在另一個(gè)例子中,也可以將第二區(qū)域的梯度直接設(shè)為O。
[0052]此外,在根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的裝置100和500的其他實(shí)現(xiàn)方式中,梯度衰減單元150也可以在參考點(diǎn)P3的沿第二方向k的兩側(cè)中的其中一側(cè)確定一個(gè)第二區(qū)域。例如,參考圖3A,梯度衰減單元150可以僅在參考點(diǎn)P3的沿第二方向k的一側(cè)確定三角形區(qū)域S2a或三角形區(qū)域S2b作為第二區(qū)域,然后在第一區(qū)域的梯度圖中對(duì)第二區(qū)域的梯度進(jìn)行類似上文所述的衰減。
[0053]參考圖3A,在一個(gè)例子中,在文檔d內(nèi)存在內(nèi)容、而文檔d外不存在內(nèi)容的情況下,梯度衰減單元150可以在參考點(diǎn)P3的沿第二方向k的一側(cè)確定三角形區(qū)域S2a作為第二區(qū)域(在此情況下,第二區(qū)域不包含圖3A中的三角形區(qū)域S2B),并在第一區(qū)域SI內(nèi)按照上文所述方式對(duì)第二區(qū)域S2a的梯度進(jìn)行衰減。此外,在另一個(gè)例子中,在文檔d內(nèi)的頁邊距附近例如不存在內(nèi)容,而在文檔d外存在內(nèi)容的情況下,梯度衰減單元150可以在參考點(diǎn)P3的沿第二方向k的另一側(cè)確定三角形區(qū)域S2b作為第二區(qū)域(在此情況下,第二區(qū)域不包含圖3A中的三角形區(qū)域S2a),并在第一區(qū)域SI內(nèi)按照上文所述方式對(duì)第二區(qū)域S2b的梯度進(jìn)行衰減。
[0054]獲得衰減后的梯度圖之后,提取單元160可以用于在角點(diǎn)Pl和P2之間進(jìn)行邊界提取,以獲得文檔d的邊界。
[0055]圖4示意性地示出了如圖1所示的提取單元160的一種可能的示例結(jié)構(gòu)。如圖4所示,在根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的裝置的一種實(shí)現(xiàn)方式中,提取單元160可以包括梯度設(shè)置子單元410和提取子單元420。
[0056]其中,在該實(shí)現(xiàn)方式中,梯度設(shè)置子單元410可以對(duì)參考點(diǎn)的梯度進(jìn)行設(shè)置,進(jìn)而提取子單元420可以利用邊界追蹤方法(例如,動(dòng)態(tài)規(guī)劃算法)在上述起點(diǎn)和終點(diǎn)之間提取邊界。
[0057]在一個(gè)例子中,在第一區(qū)域的梯度圖是經(jīng)過反色處理的梯度圖的情況下,可以將參考點(diǎn)的梯度值設(shè)為小于第一預(yù)定閾值的數(shù)值(例如設(shè)為小于O的負(fù)數(shù),如-999)。在另一個(gè)例子中,在第一區(qū)域的梯度圖是未經(jīng)過反色處理的梯度圖的情況下,可以將參考點(diǎn)的梯度值設(shè)為大于第二預(yù)定閾值的數(shù)值(例如設(shè)為大于255的正數(shù),如999)。
[0058]由此,可以使得提取子單元420在上述起點(diǎn)和終點(diǎn)之間提取到的邊界能夠較大可能地通過上述參考點(diǎn)。
[0059]如圖2所示,12是利用根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的裝置所提取的邊界。由圖2可知,與11相比,利用根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的裝置所提取的邊界12與真實(shí)邊界I更為接近,因此,其提取精度相對(duì)較高。[0060]此外,圖5示意性地示出了根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的裝置的另一種示例結(jié)構(gòu)。如圖5所示,根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的裝置500可以包括位置確定單元510、第一方向確定單元520、第二方向確定單元530、梯度圖獲得單元540、梯度衰減單元550和提取單元560,此外,裝置500還可以包括擬合單元570。其中,位置確定單元510、第一方向確定單元520、第二方向確定單元530、梯度圖獲得單元540、梯度衰減單元550和提取單元560可以具有與圖1所示的裝置100中的對(duì)應(yīng)單元相同的結(jié)構(gòu)和功能,并能夠達(dá)到類似的技術(shù)效果,在此省略其描述。
[0061]如圖5所示,擬合單元570可以對(duì)提取單元560所獲得的對(duì)象邊界進(jìn)行擬合。其中,在一個(gè)例子中,在對(duì)上述對(duì)象邊界進(jìn)行擬合的過程中,可以將參考點(diǎn)的權(quán)重設(shè)置成大于第三預(yù)定閾值的數(shù)值。
[0062]這樣,通過擬合單元570可以對(duì)提取單元560所獲得的對(duì)象邊界起到平滑。另外,由于考慮了全局的模型,能夠使得處理之后的對(duì)象邊界是全局平滑且符合實(shí)際情況的。此夕卜,可以根據(jù)不同的實(shí)際情況采用不同的擬合算法。例如,在已知文檔邊界為直線的情況下,可以使用直線擬合算法來對(duì)提取單元560所獲得的對(duì)象邊界進(jìn)行擬合。又如,在已知文檔邊界為曲線的情況下,可以采用高階的多項(xiàng)式擬合算法來對(duì)提取單元560所獲得的對(duì)象邊界進(jìn)行擬合。
[0063]需要說明的是,上文所提到的第一、第二和第三預(yù)定閾值可以根據(jù)經(jīng)驗(yàn)值或通過試驗(yàn)的方式來確定,在此不再詳述。
[0064]此外,通過本發(fā)明的以上實(shí)施例可知,在參考點(diǎn)數(shù)量為I個(gè)的情況下即可完成上文所述的邊界提取。然而,在本發(fā)明的其他實(shí)施例中,參考點(diǎn)的數(shù)量也可以為2個(gè)或更多個(gè),這樣,可以使得所提取的邊界的精度更高。在參考點(diǎn)的數(shù)量為2個(gè)或多個(gè)的情況下,例如可以在用戶每輸入一個(gè)參考點(diǎn)的情況下即完成一次邊界提取,并將當(dāng)前所提取的邊界顯示給用戶,用戶可以根據(jù)當(dāng)前邊界的準(zhǔn)確情況來判斷是否輸入下一個(gè)參考點(diǎn)。其中,每次所執(zhí)行的邊界提取利用當(dāng)前所存在的所有參考點(diǎn)來實(shí)現(xiàn),也即,在當(dāng)前存在的各個(gè)參考點(diǎn)附近分別確定至少一個(gè)第二區(qū)域,并對(duì)各個(gè)第二區(qū)域的梯度進(jìn)行衰減,進(jìn)而完成邊界提取。
[0065]在根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的裝置的一個(gè)示例中,在參考點(diǎn)的數(shù)量為2個(gè)或多個(gè)的情況下,若上述2個(gè)或多個(gè)參考點(diǎn)中存在距離在預(yù)定距離范圍內(nèi)(例如,相距在3個(gè)像素點(diǎn)之內(nèi))的兩個(gè)參考點(diǎn),則可以通過梯度設(shè)置子單元410按照如下方式來設(shè)置這兩個(gè)參考點(diǎn)之間連線上各點(diǎn)的梯度:在第一區(qū)域的梯度圖是經(jīng)過反色處理的梯度圖的情況下,可以將上述距離在預(yù)定距離范圍內(nèi)的兩個(gè)參考點(diǎn)的梯度設(shè)為O的第三預(yù)定鄰域范圍內(nèi)的數(shù)值(例如設(shè)為(-10,10)中的任意數(shù)值);在第一區(qū)域的梯度圖是未經(jīng)過反色處理的梯度圖的情況下,可以將上述距離在預(yù)定距離范圍內(nèi)的兩個(gè)參考點(diǎn)的梯度設(shè)為255的第四預(yù)定鄰域范圍內(nèi)的數(shù)值(例如設(shè)為(245,265)中的任意數(shù)值)。這樣,可以使得提取子單元420所提取的邊界能夠較大可能地通過這兩個(gè)參考點(diǎn)間連線。
[0066]此外,還需要說明的是,上述根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的裝置100和500中各個(gè)單元的操作處理不一定按照上文所描述的先后順序來執(zhí)行,只要能夠?qū)崿F(xiàn)各個(gè)單元的功能即可。
[0067]此外,雖然在本發(fā)明的上述實(shí)施例中以文檔作為圖像中對(duì)象的一個(gè)示例來進(jìn)行描述,但本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,在本發(fā)明的其他實(shí)施例中,上述圖像中的對(duì)象也可以是諸如實(shí)物等其他對(duì)象,以及邊界的起點(diǎn)和終點(diǎn)也可以是除角點(diǎn)Pl和P2之外的其他類型的起點(diǎn)和終點(diǎn)。
[0068]通過以上描述可知,根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的裝置,其通過在圖像的梯度圖中衰減參考點(diǎn)附近的內(nèi)容梯度,可以使得所提取的邊界能夠較大可能地通過上述參考點(diǎn),進(jìn)而可以提高邊界提取的精度。
[0069]此外,在確定邊界的起點(diǎn)和終點(diǎn)的情況下,相比于傳統(tǒng)的采用幾個(gè)控制點(diǎn)來代表整條曲線的邊界提取技術(shù),應(yīng)用根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的裝置可以在僅獲知一個(gè)參考點(diǎn)位置的情況下提取到相對(duì)較準(zhǔn)確的邊界,而不需要用戶多次的手工調(diào)整,能夠提高處理效率,方便用戶使用。
[0070]此外,本發(fā)明的實(shí)施例還提供了一種用于提取圖像中對(duì)象邊界的方法,下面結(jié)合圖6來描述上述用于提取圖像中對(duì)象邊界的方法的一種示例性處理。
[0071]圖6是示意性地示出根據(jù)本發(fā)明的用于提取圖像中對(duì)象邊界的方法的一種示例性處理的流程圖。
[0072]如圖6所示,根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的方法的處理流程600開始于步驟S610,然后執(zhí)行步驟S620。
[0073]在步驟S620中,確定圖像中的對(duì)象的邊界的起點(diǎn)和終點(diǎn),以及確定與上述起點(diǎn)和上述終點(diǎn)相關(guān)的參考點(diǎn)的位置。然后執(zhí)行步驟S630。
[0074]其中,上述對(duì)象例如可以是文檔,或者也可以是諸如實(shí)物等其他類型的對(duì)象。
[0075]在步驟S630中,確定上述邊界的第一方向。然后執(zhí)行步驟S640。
[0076]在一個(gè)具體實(shí)現(xiàn)方式中,可以獲得上述起點(diǎn)和上述終點(diǎn)之間連線的斜率方向,并將該斜率方向確定為上述邊界的第一方向。或者,也可以采用上文所述的其他方式來確定上述邊界的第一方向。
[0077]在步驟S640中,確定與上述邊界的第一方向相交(例如垂直)的第二方向。然后執(zhí)行步驟S650。
[0078]在步驟S650中,在上述圖像中確定包含上述起點(diǎn)、上述終點(diǎn)和上述參考點(diǎn)的第一區(qū)域,并獲得上述第一區(qū)域的梯度圖。然后執(zhí)行步驟S660。
[0079]在步驟S660中,在上述參考點(diǎn)的沿第二方向的兩側(cè)中的至少一側(cè)確定至少一個(gè)第二區(qū)域。然后執(zhí)行步驟S670。
[0080]其中,第二區(qū)域可以是三角型區(qū)域、扇形區(qū)域、帶狀區(qū)域以及拋物線型區(qū)域等各種形狀區(qū)域中的任意一種,此外,也可以是以上各種區(qū)域中的至少兩種的疊加。
[0081]此外,第二區(qū)域可以位于參考點(diǎn)的預(yù)定大小鄰域之外。其中,參考點(diǎn)的預(yù)定大小鄰域例如可以是包含參考點(diǎn)、且具有預(yù)定大小的圓形區(qū)域,或者可以是包含參考點(diǎn)、其長度沿邊界的第一方向延伸且具有預(yù)定大小的帶狀區(qū)域。參考點(diǎn)的預(yù)定大小鄰域的具體描述可以參考上文所描述的內(nèi)容,在此不再贅述。
[0082]在步驟S670中,在上述梯度圖中對(duì)上述第二區(qū)域的梯度進(jìn)行衰減,并基于衰減后的梯度圖在上述起點(diǎn)和上述終點(diǎn)之間進(jìn)行邊界提取以獲得上述對(duì)象邊界。然后執(zhí)行步驟S680。
[0083]其中,在步驟S670中,可以在上述梯度圖中對(duì)第二區(qū)域的梯度進(jìn)行衰減。其中,衰減的過程可以參考上文中結(jié)合圖1所描述的梯度衰減單元150的處理和操作,在此不再贅述。
[0084]此外,在步驟S670中,基于衰減后的梯度圖在上述起點(diǎn)和上述終點(diǎn)之間進(jìn)行邊界提取的處理過程可以參考上文中結(jié)合圖4所描述的梯度設(shè)置子單元410和提取子單元420的處理操作來執(zhí)行,在此不再贅述。
[0085]處理流程600結(jié)束于步驟S680。
[0086]此外,在根據(jù)本發(fā)明的用于提取圖像中對(duì)象邊界的方法的其他示例性處理中,步驟S670中除包括上文所述的處理之外,還可以包括對(duì)獲得的對(duì)象邊界進(jìn)行擬合的處理,其處理的過程可以參考上文中結(jié)合圖5所描述的擬合單元570的處理和操作,在此不再贅述。
[0087]需要說明的是,在實(shí)際處理中,以上各步驟的處理順序不一定按照上述描述順序來執(zhí)行,也可以按照其他方式來執(zhí)行。
[0088]通過以上描述可知,根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的方法,其通過在圖像的梯度圖中衰減參考點(diǎn)附近的內(nèi)容梯度,可以使得所提取的邊界能夠較大可能地通過上述參考點(diǎn),進(jìn)而可以提高邊界提取的精度。
[0089]此外,在確定邊界的起點(diǎn)和終點(diǎn)的情況下,相比于傳統(tǒng)的采用幾個(gè)控制點(diǎn)來代表整條曲線的邊界提取技術(shù),應(yīng)用根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的裝置可以在僅獲知一個(gè)參考點(diǎn)位置的情況下提取到相對(duì)較準(zhǔn)確的邊界,而不需要用戶多次的手工調(diào)整,能夠提高處理效率,方便用戶使用。
[0090]此外,本發(fā)明的實(shí)施例還提供了一種電子設(shè)備,該電子設(shè)備被配置包括如上所述的用于提取圖像中對(duì)象邊界的裝置。該電子設(shè)備例如可以是以下設(shè)備中的任意一種:掃描儀;相機(jī);計(jì)算機(jī);手機(jī);平板電腦;以及個(gè)人數(shù)字助理等。該電子設(shè)備能夠擁有如上所述的用于提取圖像中對(duì)象邊界的裝置的有益效果和優(yōu)點(diǎn)。
[0091]上述根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的裝置中的各個(gè)組成單元、子單元等可以通過軟件、固件、硬件或其任意組合的方式進(jìn)行配置。在通過軟件或固件實(shí)現(xiàn)的情況下,可從存儲(chǔ)介質(zhì)或網(wǎng)絡(luò)向具有專用硬件結(jié)構(gòu)的機(jī)器(例如圖7所示的通用機(jī)器700)安裝構(gòu)成該軟件或固件的程序,該機(jī)器在安裝有各種程序時(shí),能夠執(zhí)行上述各組成單元、子單元的各種功能。
[0092]圖7是示出了可用來實(shí)現(xiàn)根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的裝置和方法的一種可能的信息處理設(shè)備的硬件配置的結(jié)構(gòu)簡圖。
[0093]在圖7中,中央處理單元(CPU) 701根據(jù)只讀存儲(chǔ)器(ROM) 702中存儲(chǔ)的程序或從存儲(chǔ)部分708加載到隨機(jī)存取存儲(chǔ)器(RAM) 703的程序執(zhí)行各種處理。在RAM 703中,還根據(jù)需要存儲(chǔ)當(dāng)CPU 701執(zhí)行各種處理等等時(shí)所需的數(shù)據(jù)。CPU 70KROM 702和RAM 703經(jīng)由總線704彼此連接。輸入/輸出接口 705也連接到總線704。
[0094]下述部件也連接到輸入/輸出接口 705:輸入部分706 (包括鍵盤、鼠標(biāo)等等)、輸出部分707 (包括顯示器,例如陰極射線管(CRT)、液晶顯示器(LCD)等,和揚(yáng)聲器等)、存儲(chǔ)部分708 (包括硬盤等)、通信部分709 (包括網(wǎng)絡(luò)接口卡例如LAN卡、調(diào)制解調(diào)器等)。通信部分709經(jīng)由網(wǎng)絡(luò)例如因特網(wǎng)執(zhí)行通信處理。根據(jù)需要,驅(qū)動(dòng)器710也可連接到輸入/輸出接口 705。可拆卸介質(zhì)711例如磁盤、光盤、磁光盤、半導(dǎo)體存儲(chǔ)器等等可以根據(jù)需要被安裝在驅(qū)動(dòng)器710上,使得從中讀出的計(jì)算機(jī)程序可根據(jù)需要被安裝到存儲(chǔ)部分708中。
[0095]在通過軟件實(shí)現(xiàn)上述系列處理的情況下,可以從網(wǎng)絡(luò)例如因特網(wǎng)或從存儲(chǔ)介質(zhì)例如可拆卸介質(zhì)711安裝構(gòu)成軟件的程序。
[0096]本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,這種存儲(chǔ)介質(zhì)不局限于圖7所示的其中存儲(chǔ)有程序、與設(shè)備相分離地分發(fā)以向用戶提供程序的可拆卸介質(zhì)711??刹鹦督橘|(zhì)711的例子包含磁盤(包含軟盤)、光盤(包含光盤只讀存儲(chǔ)器(⑶-ROM)和數(shù)字通用盤(DVD))、磁光盤(包含迷你盤(MD)(注冊(cè)商標(biāo)))和半導(dǎo)體存儲(chǔ)器?;蛘?,存儲(chǔ)介質(zhì)可以是ROM 702、存儲(chǔ)部分708中包含的硬盤等等,其中存有程序,并且與包含它們的設(shè)備一起被分發(fā)給用戶。
[0097]此外,本發(fā)明還提出了一種存儲(chǔ)有機(jī)器可讀取的指令代碼的程序產(chǎn)品。上述指令代碼由機(jī)器讀取并執(zhí)行時(shí),可執(zhí)行上述根據(jù)本發(fā)明的實(shí)施例的用于提取圖像中對(duì)象邊界的方法。相應(yīng)地,用于承載這種程序產(chǎn)品的例如磁盤、光盤、磁光盤、半導(dǎo)體存儲(chǔ)器等的各種存儲(chǔ)介質(zhì)也包括在本發(fā)明的公開中。
[0098]在上面對(duì)本發(fā)明具體實(shí)施例的描述中,針對(duì)一種實(shí)施方式描述和/或示出的特征可以以相同或類似的方式在一個(gè)或更多個(gè)其它實(shí)施方式中使用,與其它實(shí)施方式中的特征相組合,或替代其它實(shí)施方式中的特征。
[0099]此外,本發(fā)明的各實(shí)施例的方法不限于按照說明書中描述的或者附圖中示出的時(shí)間順序來執(zhí)行,也可以按照其他的時(shí)間順序、并行地或獨(dú)立地執(zhí)行。因此,本說明書中描述的方法的執(zhí)行順序不對(duì)本發(fā)明的技術(shù)范圍構(gòu)成限制。
[0100]此外,顯然,根據(jù)本發(fā)明的上述方法的各個(gè)操作過程也可以以存儲(chǔ)在各種機(jī)器可讀的存儲(chǔ)介質(zhì)中的計(jì)算機(jī)可執(zhí)行程序的方式實(shí)現(xiàn)。
[0101]而且,本發(fā)明的目的也可以通過下述方式實(shí)現(xiàn):將存儲(chǔ)有上述可執(zhí)行程序代碼的存儲(chǔ)介質(zhì)直接或者間接地提供給系統(tǒng)或設(shè)備,并且該系統(tǒng)或設(shè)備中的計(jì)算機(jī)或者中央處理單元(CPU)讀出并執(zhí)行上述程序代碼。
[0102]此時(shí),只要該系統(tǒng)或者設(shè)備具有執(zhí)行程序的功能,則本發(fā)明的實(shí)施方式不局限于程序,并且該程序也可以是任意的形式,例如,目標(biāo)程序、解釋器執(zhí)行的程序或者提供給操作系統(tǒng)的腳本程序等。
[0103]上述這些機(jī)器可讀存儲(chǔ)介質(zhì)包括但不限于:各種存儲(chǔ)器和存儲(chǔ)單元,半導(dǎo)體設(shè)備,磁盤單元例如光、磁和磁光盤,以及其它適于存儲(chǔ)信息的介質(zhì)等。
[0104]另外,客戶計(jì)算機(jī)通過連接到因特網(wǎng)上的相應(yīng)網(wǎng)站,并且將依據(jù)本發(fā)明的計(jì)算機(jī)程序代碼下載和安裝到計(jì)算機(jī)中然后執(zhí)行該程序,也可以實(shí)現(xiàn)本發(fā)明。
[0105]最后,還需要說明的是,在本文中,諸如左和右、第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開來,而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。
[0106]綜上,在根據(jù)本發(fā)明的實(shí)施例中,本發(fā)明提供了如下方案:
[0107]附記1.一種用于提取圖像中對(duì)象邊界的裝置,包括:
[0108]位置確定單元,其被配置用于確定所述圖像中的對(duì)象的邊界的起點(diǎn)和終點(diǎn),以及確定與所述起點(diǎn)和所述終點(diǎn)相關(guān)的參考點(diǎn)的位置;[0109]第一方向確定單元,其被配置用于確定所述邊界的第一方向;
[0110]第二方向確定單元,其被配置用于確定與所述第一方向相交的第二方向;
[0111]梯度圖獲得單元,其被配置用于在所述圖像中確定包含所述起點(diǎn)、所述終點(diǎn)和所述參考點(diǎn)的第一區(qū)域,并獲得所述第一區(qū)域的梯度圖;
[0112]梯度衰減單元,其被配置用于在所述參考點(diǎn)的沿所述第二方向的兩側(cè)中的至少一側(cè)確定至少一個(gè)第二區(qū)域,并在所述梯度圖中對(duì)所述第二區(qū)域的梯度進(jìn)行衰減;以及
[0113]提取單元,其被配置用于基于衰減后的梯度圖在所述起點(diǎn)和所述終點(diǎn)之間進(jìn)行邊界提取以獲得所述對(duì)象邊界。
[0114]附記2.根據(jù)權(quán)利要求1所述的用于提取圖像中對(duì)象邊界的裝置,其中,所述對(duì)象為文檔。
[0115]附記3.根據(jù)權(quán)利要求1或2所述的用于提取圖像中對(duì)象邊界的裝置,其中,所述第一方向確定單元被配置用于:
[0116]獲得所述起點(diǎn)和所述終點(diǎn)之間連線的斜率方向;以及
[0117]將所述連線的斜率方向確定為所述邊界的第一方向。
[0118]附記4.根據(jù)權(quán)利要求1-3中任一所述的用于提取圖像中對(duì)象邊界的裝置,其中,所述第二方向垂直于所述邊界的第一方向。
[0119]附記5.根據(jù)權(quán)利要求1-4中任一所述的用于提取圖像中對(duì)象邊界的裝置,其中,所述第二區(qū)域包括以下區(qū)域中的一種或其中至少兩種的疊加:三角型區(qū)域;扇形區(qū)域;帶狀區(qū)域;以及拋物線型區(qū)域。
[0120]附記6.根據(jù)權(quán)利要求1-5任一所述的用于提取圖像中對(duì)象邊界的裝置,其中,所述第二區(qū)域的形狀和/或位置根據(jù)用戶輸入指令進(jìn)行調(diào)整。
[0121]附記7.根據(jù)權(quán)利要求1-6中任一所述的用于提取圖像中對(duì)象邊界的裝置,其中,所述第二區(qū)域位于所述參考點(diǎn)的預(yù)定大小鄰域之外。
[0122]附記8.根據(jù)權(quán)利要求7所述的用于提取圖像中對(duì)象邊界的裝置,其中,所述參考點(diǎn)的預(yù)定大小鄰域?yàn)槿缦聟^(qū)域:
[0123]包含所述參考點(diǎn)、其長度沿所述邊界的第一方向延伸且具有預(yù)定大小的帶狀區(qū)域-或
[0124]以所述參考點(diǎn)為圓心的圓形區(qū)域。
[0125]附記9.根據(jù)權(quán)利要求1-8中任一所述的用于提取圖像中對(duì)象邊界的裝置,其中,
[0126]在所述梯度圖為經(jīng)過反色處理的梯度圖的情況下,所述衰減后的梯度圖中的所述第二區(qū)域的梯度的數(shù)值比衰減前的梯度圖中的所述第二區(qū)域的梯度的數(shù)值更大;以及
[0127]在所述梯度圖為未經(jīng)過反色處理的梯度圖的情況下,所述衰減后的梯度圖中的所述第二區(qū)域的梯度的數(shù)值比衰減前的梯度圖中的所述第二區(qū)域的梯度的數(shù)值更小。
[0128]附記10.根據(jù)權(quán)利要求1-9中任一所述的用于提取圖像中對(duì)象邊界的裝置,其中,所述提取單元包括:
[0129]梯度設(shè)置子單元,其被配置用于在所述梯度圖是經(jīng)過反色處理的梯度圖的情況下,將所述參考點(diǎn)的梯度值設(shè)為小于第一預(yù)定閾值的數(shù)值,以及在所述梯度圖是未經(jīng)過反色處理的梯度圖的情況下,將所述參考點(diǎn)的梯度值設(shè)為大于第二預(yù)定閾值的數(shù)值;以及
[0130]提取子單元,其被配置用于利用邊界追蹤方法在所述起點(diǎn)和所述終點(diǎn)之間進(jìn)行邊界提取,并將提取到的邊界確定為所述對(duì)象的邊界。
[0131]附記11.根據(jù)權(quán)利要求10所述的用于提取圖像中對(duì)象邊界的裝置,其中,所述梯度設(shè)置子單元還被配置用于:
[0132]在所述參考點(diǎn)中存在距離在預(yù)定距離范圍內(nèi)的兩個(gè)參考點(diǎn)的情況下,
[0133]當(dāng)所述梯度圖是經(jīng)過反色處理的梯度圖時(shí),將所述距離在預(yù)定距離范圍內(nèi)的兩個(gè)參考點(diǎn)的梯度設(shè)為O的第三預(yù)定鄰域范圍內(nèi)的數(shù)值,以及
[0134]當(dāng)在所述梯度圖是未經(jīng)過反色處理的梯度圖時(shí),將所述距離在預(yù)定距離范圍內(nèi)的兩個(gè)參考點(diǎn)的梯度設(shè)為255的第四預(yù)定鄰域范圍內(nèi)的數(shù)值。
[0135]附記12.根據(jù)權(quán)利要求1-11中任一所述的用于提取圖像中對(duì)象邊界的裝置,還包括:擬合單元,其被配置用于對(duì)所述提取單元所獲得的所述對(duì)象邊界進(jìn)行擬合。
[0136]附記13.根據(jù)權(quán)利要求12所述的用于提取圖像中對(duì)象邊界的裝置,其中,所述擬合單元被配置用于:在對(duì)所述提取單元所獲得的所述對(duì)象邊界進(jìn)行擬合的過程中,將所述參考點(diǎn)的權(quán)重設(shè)置為大于第三預(yù)定閾值。
[0137]附記14.一種用于提取圖像中對(duì)象邊界的方法,包括:
[0138]確定所述圖像中的對(duì)象的邊界的起點(diǎn)和終點(diǎn),以及確定與所述起點(diǎn)和所述終點(diǎn)相關(guān)的參考點(diǎn)的位置;
[0139]確定所述邊界的第一方向;
[0140]確定與所述第一方向相交的第二方向;
[0141]在所述圖像中確定包含所述起點(diǎn)、所述終點(diǎn)和所述參考點(diǎn)的第一區(qū)域,并獲得所述第一區(qū)域的梯度圖;
[0142]在所述參考點(diǎn)的沿所述第二方向的兩側(cè)中的至少一側(cè)確定至少一個(gè)第二區(qū)域;以及
[0143]在所述梯度圖中對(duì)所述第二區(qū)域的梯度進(jìn)行衰減,并基于衰減后的梯度圖在所述起點(diǎn)和所述終點(diǎn)之間進(jìn)行邊界提取以獲得所述對(duì)象邊界。
[0144]附記15.根據(jù)權(quán)利要求14所述的用于提取圖像中對(duì)象邊界的方法,其中,所述對(duì)象為文檔。
[0145]附記16.根據(jù)權(quán)利要求14或15所述的用于提取圖像中對(duì)象邊界的方法,其中,所述的確定所述邊界的第一方向的步驟包括:
[0146]獲得所述起點(diǎn)和所述終點(diǎn)之間連線的斜率方向;以及
[0147]將所述連線的斜率方向確定為所述邊界的第一方向。
[0148]附記17.根據(jù)權(quán)利要求14-16中任一所述的用于提取圖像中對(duì)象邊界的方法,其中,所述第二方向垂直于所述邊界的第一方向。
[0149]附記18.根據(jù)權(quán)利要求14-17中任一所述的用于提取圖像中對(duì)象邊界的方法,其中,所述第二區(qū)域包括以下區(qū)域中的一種或其中至少兩種的疊加:三角型區(qū)域;扇形區(qū)域;帶狀區(qū)域;以及拋物線型區(qū)域。
[0150]附記19.根據(jù)權(quán)利要求14-18中任一所述的用于提取圖像中對(duì)象邊界的方法,其中,所述第二區(qū)域位于所述參考點(diǎn)的預(yù)定大小鄰域之外。
[0151]附記20.根據(jù)權(quán)利要求19所述的用于提取圖像中對(duì)象邊界的方法,其中,所述參考點(diǎn)的預(yù)定大小鄰域?yàn)槿缦聟^(qū)域:包含所述參考點(diǎn)、其長度沿所述邊界的第一方向延伸且具有預(yù)定大小的帶狀區(qū)域;或以所述參考點(diǎn)為圓心的圓形區(qū)域。
[0152]附記21.根據(jù)權(quán)利要求14-20中任一所述的用于提取圖像中對(duì)象邊界的方法,其中,所述的基于衰減后的梯度圖在所述起點(diǎn)和所述終點(diǎn)之間進(jìn)行邊界提取的步驟包括:
[0153]在所述梯度圖是經(jīng)過反色處理的梯度圖的情況下,將所述參考點(diǎn)的梯度值設(shè)為小于第一預(yù)定閾值的數(shù)值;
[0154]在所述梯度圖是未經(jīng)過反色處理的梯度圖的情況下,將所述參考點(diǎn)的梯度值設(shè)為大于第二預(yù)定閾值的數(shù)值;以及
[0155]利用邊界追蹤方法在所述起點(diǎn)和所述終點(diǎn)之間進(jìn)行邊界提取,并將提取到的邊界確定為所述對(duì)象邊界。
[0156]附記22.根據(jù)權(quán)利要求14-21中任一所述的用于提取圖像中對(duì)象邊界的方法,還包括:對(duì)獲得的所述對(duì)象邊界進(jìn)行擬合。
[0157]附記23.—種電子設(shè)備,包括如權(quán)利要求1-13中任一項(xiàng)所述的用于提取圖像中對(duì)象邊界的裝置。
[0158]附記24.根據(jù)權(quán)利要求23所述的電子設(shè)備,其中,所述電子設(shè)備是以下設(shè)備中的任一種:掃描儀;相機(jī);計(jì)算機(jī);手機(jī);平板電腦;以及個(gè)人數(shù)字助理。
[0159]附記25.—種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有能夠由計(jì)算設(shè)備執(zhí)行的計(jì)算機(jī)程序,所述程序在執(zhí)行時(shí)能夠使所述計(jì)算設(shè)備執(zhí)行根據(jù)權(quán)利要求14-22中任意一項(xiàng)所述的用于提取圖像中對(duì)象邊界的方法。
【權(quán)利要求】
1.一種用于提取圖像中對(duì)象邊界的裝置,包括: 位置確定單元,其被配置用于確定所述圖像中的對(duì)象的邊界的起點(diǎn)和終點(diǎn),以及確定與所述起點(diǎn)和所述終點(diǎn)相關(guān)的參考點(diǎn)的位置; 第一方向確定單元,其被配置用于確定所述邊界的第一方向; 第二方向確定單元,其被配置用于確定與所述第一方向相交的第二方向; 梯度圖獲得單元,其被配置用于在所述圖像中確定包含所述起點(diǎn)、所述終點(diǎn)和所述參考點(diǎn)的第一區(qū)域,并獲得所述第一區(qū)域的梯度圖; 梯度衰減單元,其被配置用于在所述參考點(diǎn)的沿所述第二方向的兩側(cè)中的至少一側(cè)確定至少一個(gè)第二區(qū)域,并在所述梯度圖中對(duì)所述第二區(qū)域的梯度進(jìn)行衰減;以及 提取單元,其被配置用于基于衰減后的梯度圖在所述起點(diǎn)和所述終點(diǎn)之間進(jìn)行邊界提取以獲得所述對(duì)象邊界。
2.根據(jù)權(quán)利要求1所述的用于提取圖像中對(duì)象邊界的裝置,其中,所述第一方向確定單元被配置用于: 獲得所述起點(diǎn)和所述終點(diǎn)之間連線的斜率方向;以及 將所述連線的斜率方向確定為所述邊界的第一方向。
3.根據(jù)權(quán)利要求1或2所述的用于提取圖像中對(duì)象邊界的裝置,其中,所述第二區(qū)域包括以下區(qū)域中的一種或其中至少兩種的疊加: 三角型區(qū)域;扇形區(qū)域;帶狀區(qū)域;以及拋物線型區(qū)域。
4.根據(jù)權(quán)利要求1-3任一所述的用于提取圖像中對(duì)象邊界的裝置,其中,所述第二區(qū)域的形狀和/或位置根據(jù)用戶輸入指令進(jìn)行調(diào)整。
5.根據(jù)權(quán)利要求1-4中任一所述的用于提取圖像中對(duì)象邊界的裝置,其中,所述第二區(qū)域位于所述參考點(diǎn)的預(yù)定大小鄰域之外。
6.根據(jù)權(quán)利要求1-5中任一所述的用于提取圖像中對(duì)象邊界的裝置,其中, 在所述梯度圖為經(jīng)過反色處理的梯度圖的情況下,所述衰減后的梯度圖中的所述第二區(qū)域的梯度的數(shù)值比衰減前的梯度圖中的所述第二區(qū)域的梯度的數(shù)值更大;以及 在所述梯度圖為未經(jīng)過反色處理的梯度圖的情況下,所述衰減后的梯度圖中的所述第二區(qū)域的梯度的數(shù)值比衰減前的梯度圖中的所述第二區(qū)域的梯度的數(shù)值更小。
7.根據(jù)權(quán)利要求1-6中任一所述的用于提取圖像中對(duì)象邊界的裝置,其中,所述提取單元包括: 梯度設(shè)置子單元,其被配置用于在所述梯度圖為經(jīng)過反色處理的梯度圖的情況下,將所述參考點(diǎn)的梯度值設(shè)為小于第一預(yù)定閾值的數(shù)值,以及在所述梯度圖為未經(jīng)過反色處理的梯度圖的情況下,將所述參考點(diǎn)的梯度值設(shè)為大于第二預(yù)定閾值的數(shù)值;以及 提取子單元,其被配置用于利用邊界追蹤方法在所述起點(diǎn)和所述終點(diǎn)之間進(jìn)行邊界提取,并將提取到的邊界確定為所述對(duì)象的邊界。
8.根據(jù)權(quán)利要求1-7中任一所述的用于提取圖像中對(duì)象邊界的裝置,還包括: 擬合單元,其被配置用于對(duì)所述提取單元所獲得的所述對(duì)象邊界進(jìn)行擬合。
9.一種用于提取圖像中對(duì)象邊界的方法,包括: 確定所述圖像中的對(duì)象的邊界的起點(diǎn)和終點(diǎn),以及確定與所述起點(diǎn)和所述終點(diǎn)相關(guān)的參考點(diǎn)的位置;確定所述邊界的第一方向; 確定與所述第一方向相交的第二方向; 在所述圖像中確定包含所述起點(diǎn)、所述終點(diǎn)和所述參考點(diǎn)的第一區(qū)域,并獲得所述第一區(qū)域的梯度圖; 在所述參考點(diǎn)的沿所述第二方向的兩側(cè)中的至少一側(cè)確定至少一個(gè)第二區(qū)域;以及在所述梯度圖中對(duì)所述第二區(qū)域的梯度進(jìn)行衰減,并基于衰減后的梯度圖在所述起點(diǎn)和所述終點(diǎn)之間進(jìn)行邊界提取以獲得所述對(duì)象邊界。
10.一種電子設(shè)備,包括如權(quán)利要求1-8中任一項(xiàng)所述的用于提取圖像中對(duì)象邊界的 裝直。
【文檔編號(hào)】G06K9/46GK103473543SQ201210187523
【公開日】2013年12月25日 申請(qǐng)日期:2012年6月7日 優(yōu)先權(quán)日:2012年6月7日
【發(fā)明者】潘攀, 何源, 孫俊, 直井聰 申請(qǐng)人:富士通株式會(huì)社