專利名稱:用于文檔處理的系統(tǒng)和方法
技術領域:
本發(fā)明涉及用于處理文檔的系統(tǒng)和方法,且更特別涉及一種系統(tǒng)以及實現(xiàn)該系統(tǒng)的方法的實施例,在其中,相對于與附加到該文檔的可解碼標記相關聯(lián)的基準來標識該文檔的內容。
背景技術:
可獲得多個種類的標記讀取終端。這些種類中眾所周知的是一般在零售商店結賬臺看到的槍型終端。也可以獲得提供增強功能的其他終端,其具有鍵盤和顯示器,并且包括高級聯(lián)網(wǎng)通信能力。這些終端可用于讀取和解碼被編碼在可解碼標記中的信息。從編碼對包裹的運送和追蹤信息到任何數(shù)目的表單和文檔,其包括但不限于稅單、訂單、業(yè)務單、調查表、遞送單、處方、收據(jù)、報紙、產(chǎn)品文檔、報告等等,這樣的可解碼標記被廣泛利用。此外,雖然一般使用終端和掃描儀來解碼這些表單和文檔上的可解碼標記,但是也可以使用諸如可以生成該表單和/或文檔的數(shù)字版本的設備之類的其他設備。這些設備典型地利用圖像傳感器來解碼被編碼在條形碼符號中的信息,且更特別用來通過條形碼解碼算法處理表單和文檔的捕獲圖像。然而,由于諸如具有日益增長的數(shù)目的像素的陣列之類的更高密度圖像傳感器陣列的可獲得性,增加了必須要處理的像素值數(shù)目以獲得例如在條形碼符號體系(symbology )中編碼的信息。雖然更大數(shù)目的像素值通常提供了更高分辨率的圖像表示,但是這樣的分辨率是以處理速度為代價的。存在對包括用于處理文檔的這些終端的系統(tǒng)的需要,其在工作中被配置成以高度可靠和準確的方式標識文檔內容而基本上不犧牲處理時間。發(fā)明概述
如下面更詳細地論述的,提供了用于處理文檔的系統(tǒng)和方法,其具有改進的處理特性。 這些系統(tǒng)的實施例可以包括標記讀取終端,其在工作中被配置成解碼附加到文檔的可解碼標記,以便定位相對于與該可解碼標記相關聯(lián)的基準的內容。在一個實施例中,一種用于處理文檔的系統(tǒng)。該系統(tǒng)包括標記讀取終端,其包括 包括沿著圖像平面延伸的多個像素的二維圖像傳感器陣列,供在將成像光線聚焦到所述二維圖像傳感器陣列的多個像素上時使用的光學組件,以及封裝二維圖像傳感器陣列和光學組件的殼體。在一個示例中,該系統(tǒng)這樣的模式工作,在該模式中該系統(tǒng)響應于操作者發(fā)起的命令,捕獲圖像數(shù)據(jù)幀并處理該圖像數(shù)據(jù)幀以嘗試解碼該文檔上的表單條形碼。在另一示例中,該系統(tǒng)用來根據(jù)存儲在該表單條形碼中的信息來標識圖像平面上的坐標系。在又一示例中,該系統(tǒng)又用來相對于該表單條形碼且在該坐標系中標識位于該文檔上的內容域的位置。在該系統(tǒng)的再一示例中,與對在沒有表單條形碼的第二文檔上的圖像數(shù)據(jù)幀的處理相比,對在其上設置有表單條形碼的第一文檔上的圖像數(shù)據(jù)幀的處理更快。在另一實施例中,一種用于自動處理文檔的系統(tǒng)。該系統(tǒng)包括標記讀取終端,其包括包括沿著圖像平面延伸的多個像素的二維圖像傳感器陣列,供在將成像光線聚焦到所述二維圖像傳感器陣列的多個像素上時使用的光學組件,以及封裝二維圖像傳感器陣列和光學組件的殼體。該系統(tǒng)還包括與該標記讀取終端通信的外部服務器,該外部服務器在標記讀取終端的外部。在一個示例中,該系統(tǒng)以這樣的模式工作,在該模式中,該系統(tǒng)響應于操作者發(fā)起的命令,捕獲圖像數(shù)據(jù)幀并處理該圖像數(shù)據(jù)幀以嘗試解碼文檔上的表單條形碼。在另一示例中,該系統(tǒng)用來形成圖像平面,在該圖像平面上定位有與坐標系相關的網(wǎng)格。在該系統(tǒng)的又一示例中,該網(wǎng)格具有根據(jù)該表單條形碼的至少一個拐角建立的網(wǎng)格點。 在再一示例中,該系統(tǒng)用來在該網(wǎng)格上標識具有與該表單條形碼中所編碼的信息相對應的坐標系上的坐標的內容域。在該系統(tǒng)的再有另外的示例中,與對在沒有表單條形碼的第二文檔上的圖像數(shù)據(jù)幀的處理相比,對在其上設置有表單條形碼的第一文檔上的圖像數(shù)據(jù)幀的處理更快。在又一實施例中,一種處理文檔的方法包括捕獲與該文檔對應的圖像數(shù)據(jù)幀的步驟,和處理該圖像數(shù)據(jù)幀以定位附加到該文檔的表單條形碼的步驟。該方法還包括用于在與所捕獲的圖像數(shù)據(jù)相關的圖像平面上建立坐標系的步驟。該方法還包括相對于該表單條形碼且在該坐標系上定位該文檔上的內容域的步驟。在該方法的一個示例中,與對在沒有表單條形碼的第二文檔上的圖像數(shù)據(jù)幀的處理相比,對在其上設置有表單條形碼的第一文檔上的圖像數(shù)據(jù)幀的處理更快。
通過參照實施例,因此可以得到本發(fā)明的上面陳述特征能夠被詳細地理解的方式,對上面簡要概述的本發(fā)明的更特定的說明,其中的一些實施例在附圖中予以圖示了。然而,要注意的是,由于本發(fā)明可以認可其他等效實施例,所以這些附圖僅用于圖示此發(fā)明的典型實施例,且因此不被視為是對其范圍的限制。此外,該附圖未必按比例繪制,重點通常放在圖示本發(fā)明的一定實施例的原理。因而,為了進一步理解本發(fā)明的概念,可以參照結合附圖閱讀的以下詳細說明,其中
圖1是具有與本發(fā)明的概念一致的特征的文檔的示意圖; 圖2是圖1的文檔的圖像平面的示意圖; 圖3是示例性標記讀取終端的示意圖4是利用附加到文檔的可解碼標記來處理諸如圖1的文檔之類的文檔的方法的一個示例的流程圖5是利用附加到文檔的可解碼標記來處理諸如圖1的文檔之類的文檔的方法的另一示例的流程圖6是利用附加到文檔的可解碼標記來處理諸如圖1的文檔之類的文檔的方法的又一示例的流程圖;圖7是利用附加到文檔的可解碼標記來處理諸如圖1的文檔之類的文檔的方法的再一示例的流程圖8是供在圖3的標記讀取終端中使用的成像模塊的示例的分解透視裝配圖; 圖9是供在圖3的標記讀取終端中使用的諸如圖5的成像模塊之類的成像模塊的另一示例的透視裝配圖10是結合了諸如圖6和圖7的成像模塊之類的成像模塊的標記讀取終端的透視和
圖11是在諸如圖3和圖10的標記讀取終端之類的標記讀取終端中實現(xiàn)的示例性硬件平臺的框圖。
具體實施例方式下面呈現(xiàn)的本發(fā)明的概念可以被實現(xiàn)為文檔管理和/或文檔處理系統(tǒng)的一部分, 其被配置成捕獲文檔的圖像數(shù)據(jù),處理所捕獲的文檔圖像數(shù)據(jù),并通過對所捕獲的文檔圖像數(shù)據(jù)進行處理來標識該文檔的各方面(或區(qū)域或域)。為了減少這樣的系統(tǒng)的處理時間并因而改進其吞吐量、準確性和可靠性,本公開內容的實施例可以利用諸如條形碼之類的可解碼標記來標識在其上附加有該可解碼標記的文檔的各方面。例如,一個實施例可以實施可解碼標記或表單條形碼,其具有在其中被編碼有與定位、位置和其他特性有關的信息,所述其他特性與該文檔內相對于該表單條形碼(form barcode)的域的地點相關。此相關是有利的,這是因為它能夠通過在處理期間顯示關于該文檔的信息來減少處理時間和錯誤的可能性,這在正常情況下會要求對捕獲的文檔圖像數(shù)據(jù)進行大量處理。為了進一步理解這些概念,則現(xiàn)在參照圖1,提供了具有依據(jù)本發(fā)明的概念形成的特征的文檔100的示例。如圖1所示,文檔100可以具有結構102,其具有邊界特征104和至少在某種程度上由該邊界特征104定義的內容區(qū)域106。在該內容區(qū)域106的內部是文檔內容108,諸如與表單(例如IRS表單)的主題相關聯(lián)的文本。該文檔內容108可以被配置為一個或多個內容域(content field) 110和內容條形碼118,所述內容域110諸如文本域112、簽名域114、復選框域116,其中每一個的內容被特別標識以便使如下面更詳細地論述的對文檔100的處理便利。每個內容域110可以包括內容域邊界120,諸如本示例的矩形框,其畫出了文檔內容108的特定部分。文檔100還可以包括通常由數(shù)字122標識的一個或多個表單條形碼。該表單條形碼122可以是條形碼或其他可解碼標記,在其中嵌入了與文檔內容108相關的信息。該表單條形碼122可以具有由表單條形碼邊界1 標識的形狀因子(form factor) 124。在一個示例中,表單條形碼邊界1 可以包括拐角(corner) 128,并且為了下面所討論的說明性示例的目的,拐角1 包括拐角128A、U8B、128C和128D。表單條形碼122還可以包括基準 (reference)130,諸如至少一個基準點132,相對于該基準130可以標識出內容域110的位置。這里要注意的是,雖然基準130和基準點132僅僅被特別地圖示和論述為表單條形碼 122的獨特部分,但是這些特征也可以與表單條形碼邊界126、拐角1 或該文檔100的可以提供標識內容域110的基礎的任何其他部分相關聯(lián)。內容域110和表單條形碼122之間的關系可以被用來使對文檔100的處理便利。 本發(fā)明人已經(jīng)確定了,在所設計的程度上,此關系可以在需要對圖像數(shù)據(jù)進行任何詳細分析之前提供對內容域110的快速定位。通過避免這些所涉及的分析和處理步驟,或者在一個實施例中通過簡單搜索和解碼表單條形碼122,本發(fā)明的實施例可以用來改進文檔處理系統(tǒng)的吞吐量。在一個實施例中,表單條形碼122具有在其中被編碼的內容,諸如表單結構。表單結構可以用來標識與表單設計有關的數(shù)據(jù)和信息,諸如像內容域110的定位、內容域110中的信息、其他表單條形碼的定位等等。在一個示例中,該內容是表單ID。這樣的表單ID可以用來標識一個或多個表格或數(shù)據(jù)庫中的條目。此條目可以包括關于表單設計的信息,由此在需要對文檔100的所捕獲圖像的完全處理之前,提供了對這樣的信息的迅速訪問。在另一示例中,該內容包括與內容域110之間的關系以及內容域110、表單條形碼122和文檔 100的其他部分之間的關系有關的信息。內容域110和表單條形碼122之間的關系可以被表征為內容域110相對于基準 130 (諸如相對于基準點132)的相對位置。此表征可以以各種方式來提供,其中的一些可以依賴于系統(tǒng)級概念、結構和用來實現(xiàn)這里所公開的概念而提供的可執(zhí)行指令。舉例來說, 可以使用笛卡爾和極坐標系來標識每個基準130 (例如基準點132)和內容域110的一部分 (諸如內容域邊界120的一部分)的定位。這些坐標系可以用來建立諸如該內容區(qū)域106內的各個定位之間的偏移和距離,其更特別地如這些偏移可以用來表征內容域110與表單條形碼122之間的關系。表單條形碼122可以被特別標識以便使在對文檔100的所捕獲圖像的處理期間其標識便利。如圖1所描繪,表單條形碼122可以被定位成沿著文檔100的一個或多個邊緣, 或者以其它方式在不與文檔內容108相干擾的位置。適當位置的示例還可以將一個或多個表單條形碼122定位在文檔100的頁邊空白,沿著文檔100的一個或多個邊緣,以及嵌入在文檔100的內容區(qū)域106內。這些位置還可以被選擇成便利在圖像分析的初級或預處理階段中對表單條形碼122的解碼。除了表單條形碼122的特定定位之外,也可以使用表單條形碼122的配置來標識和將其與文檔100的其他部分相區(qū)分。這些配置中的一些可以由形狀因子IM來描述,所述形狀因子1 描述了尺寸、形狀、顏色和能夠在最小處理能力下促進表單條形碼122中的信息的解碼的其他物理特性中的任何一個。在一個示例中,通過表單條形碼122的印刷材料(例如紫外線墨、紅外線墨等)將其與文檔100的周圍區(qū)域區(qū)分開來。在另一示例中,在文檔100上以將表單條形碼122與文檔100的其他部分區(qū)分開的形狀來提供該表單條形碼 122。在又一示例中,表單條形碼122被定位在文檔100上預選區(qū)域中或者使用預選坐標或者在文檔100的預指明的部分中。在再一示例中,表單條形碼122可以包含條形碼指示符, 諸如是預分配的幾何圖案和/或采用全新或特別設計的符號體系的類型,它們中的任何一個均可與這里所預期的其他條形碼和符號體系區(qū)分開。表單條形碼122的特征可以用來快速且準確地定位并解碼表單條形碼122,在其中存儲了關于文檔100的信息。這樣的解碼將發(fā)生在對文檔100的圖像分析的初始、初級或預處理階段期間。因而在一個實施例中,形狀因子IM應當是容許這樣的標識發(fā)生的類型。例如,形狀因子IM應當足夠大以便容易地被檢測到,以致可以被選擇以容許解碼發(fā)生在初始或原始數(shù)據(jù)階段,即在對文檔100的詳細分析和處理之前。形狀因子IM還應當足夠大以表示內容域110的標度和位置,一致會被用來建立文檔100的文檔坐標系。
在一個實施例中,文檔100的坐標系可以具有在其中結合的針對上面提及的笛卡爾和/或極坐標系的原點。仍然應當將形狀因子1 定尺寸成允許文檔內容108的其余部分被分配了具有足夠分辨率的相關特性、位置、尺寸和形狀,以便容許對在其中查找到的信息進行解碼。在一個示例中,且與圖1所描繪的相似,表單條形碼122可以沿著文檔100的最長邊的至少大約60%延伸。可以通過表單條形碼122中的一個單獨產(chǎn)生此覆蓋(見圖1 ), 或者可以以表單條形碼122中的若干個產(chǎn)生此覆蓋,其中該形狀因子IM在尺寸方面更小并且總的來說被分布和附加在內容區(qū)域106和/或文檔100中的不同位置。內容域110可以用來標識和/或畫出文檔內容108的各部分。諸如圖1中的本示例的框之類的內容域邊界120可以由為了處理文檔100的目的而提供的可執(zhí)行指令自動生成,或者在另一示例中,可以由文檔100的用戶例如經(jīng)由合適的用戶接口或圖形用戶界面 (GUI)來標識和生成該內容域邊界120。特別對于本示例的內容域110而言,文本域112可以標識文檔100的一定相干文本或其他信息,其例如可以是對于探知文檔100的內容必要的。此文本可以包括題目、標識號、頁碼等。類似地,簽名域114可以用來選擇性地標識文檔100的區(qū)域,在其中存在期望的簽名、郵戳、指紋和例如由文檔100的用戶提供的和/或由該用戶請求的其他個人標識信息。由復選框域116標識的信息的示例可以包括復選框的數(shù)目、復選框的方向和定位、由每個復選框所指示的收集信息(例如來自文檔100的用戶的回答)等等。在一個實施例中,內容條形碼118具有在其中使用全文所論述和預期的多種符號體系中的任何一個或多個編碼的、與該文檔相干的信息。一個或多個內容域110中的信息可以被編碼到表單條形碼122中,而在一個特定實現(xiàn)方式中,在處理所捕獲的文檔圖像數(shù)據(jù)的其他片段之前,對所捕獲的文檔圖像數(shù)據(jù)的初始處理可以讀取和解碼此信息。繼續(xù)參照圖1,且現(xiàn)在還參照圖2,描述了通過表單條形碼122(圖1)對內容域110 (圖1)的定位的標識的一個示例。圖2圖示了例如使用這里所預期和描述的成像和成像技術所捕獲的文檔100的圖像200的示例。該圖像200包括具有圖像邊界204的圖像平面 202,在其中見到了圖像網(wǎng)格206的存在。該圖像網(wǎng)格206可以包括多個圖像網(wǎng)格線208,諸如在網(wǎng)格點214交叉的水平網(wǎng)格線210和垂直網(wǎng)格線212,如本示例中所描繪的。該圖像網(wǎng)格206覆蓋在圖像平面202上,其表示無限虛線(infinite imaginary line),該無限虛線建立了供在標識和定位內容域110在文檔100中的相對位置時使用的坐標系216。圖像 200還包括具有拐角218A、218B、218C和218D的標記表示218,以及一個或多個內容域表示 220,所有這些都表示在例如文檔100的物理表現(xiàn)形式上查找到的對應特征。標記表示218 例如表示表單條形碼122 (圖1)。圖像邊界204可以包括文檔100 (圖1)的全部內容,或者在其他示例中,圖像邊界 204僅表示文檔100 (圖1)的一部分。本公開內容的創(chuàng)造性概念的配置與圖像邊界204的各種尺寸和形狀兼容。將理解,有用的是,使用各種定標因子、方向因子和其他因子來確定圖像邊界204的相對尺寸、形狀,以及用來將該尺寸和形狀插入到在對表單條形碼122 (圖 1)進行解碼期間捕獲的文檔100 (圖1)的相對部分中。在一個實施例中,為了通過表單條形碼122 (圖1)來表征內容域110 (圖1)在文檔100 (圖1)中的相對位置,可以使用拐角218A、218B、218C和218D來標識圖像平面202 以及建立坐標系216。因為本公開內容主要是用于成像以及相關的成像設備,所以可以使用計算和算法來使像素定位與坐標系216相關,并且更特別地建立水平210網(wǎng)格線和垂直212
8網(wǎng)格線以及在其中建立的網(wǎng)格點214的定位。在授予Meier等人的美國專利第65614 號中查找到了可以被應用以供對諸如標識和表征圖像網(wǎng)格206之類的對圖像數(shù)據(jù)進行顯現(xiàn)和處理中使用的概念的細節(jié),其內容通過引用全部結合于此。與對圖像數(shù)據(jù)的處理一致的,關于內容域110(圖1)相對于一個或多個基準點132 (圖1)的定位和位置的信息可以轉換為內容域表示220中的每一個的坐標位置。這些坐標位置可以反映網(wǎng)格點214中的一個或多個,經(jīng)由水平210和垂直212網(wǎng)格線208所標識的水平和垂直定位,或者在圖像平面202內查找到的點和線的其他組合。在一個實施例中,解碼表單條形碼122(圖1)對于提供圖像網(wǎng)格206的布局(例如圖像網(wǎng)格線208和網(wǎng)格點214 的布局和定位)以及如由內容域表示220所表示的內容域110的相對位置是有效的。因而, 在這樣的示例性構造中,簡單通過對表單條形碼122 (圖1)進行解碼就能完成對文檔100 (圖1)的處理。參照圖3所示的示例性文檔300和相關的系統(tǒng)級信息,可以進一步地理解上面結合文檔100所論述的概念的實現(xiàn)方式。除了文檔300及其相關的特征(其中同樣的數(shù)字被用來標識如文檔100和文檔300之間同樣的組成部分),圖3中描繪了示例性標記讀取終端 334的示意圖。該標記讀取終端334可以包括設備結構336,其具有成像模塊338、例如中央處理單元(“CPU”)之類的處理模塊340以及存儲模塊342,所述存儲模塊342諸如具有例如用于存儲關于文檔300的一定內容的至少一個區(qū)344。在一個實施例中,該標記讀取終端 334可以在工作中被配置成具有例如由成像模塊338建立的視野346??梢园言撘曇?46 定尺寸成捕獲與文檔300相關的文檔圖像348。存在可以便利文檔圖像數(shù)據(jù)的捕獲的其他部件和硬件,下面結合圖8-11中所圖示的標記讀取終端對它們中的一些進行更詳細地論述和描述。標記讀取終端336可以是系統(tǒng)2000的一部分,該系統(tǒng)2000具有本地服務器2250、 遠程服務器2750以及耦合該本地服務器2250和遠程服務器2750的網(wǎng)絡2500。系統(tǒng)2000 的此配置可以被利用來處理捕獲的文檔圖像數(shù)據(jù),且在一種配置中,該本地服務器2250和遠程服務器2750中的一個或多個被利用來以與下面公開內容一致的方式對該捕獲的文檔圖像數(shù)據(jù)進行全部處理。在一個實施例中,處理模塊340和存儲模塊342、或其補充裝置中的一個或多個可以定位在該標記讀取終端336的外部,以便容許將標記讀取終端336所捕獲的數(shù)據(jù)和信息從該標記讀取終端336傳送到例如對應的存儲模塊342,以對所捕獲的文檔圖像數(shù)據(jù)進行直接和/或進一步處理。在另一實施例中,這里所公開、描述和預期的圖像處理步驟可以被分布為在該標記讀取終端336、本地服務器2250和遠程服務器2750之間, 其中還有其他實施例可以被配置成由標記讀取終端336全部執(zhí)行圖像處理步驟。表單條形碼322和內容條形碼318的符號體系、編碼和其他方面可以依據(jù)處理模塊340的配置和性能來選擇。在一個實施例中,處理模塊340可以是任何類型的CPU或微處理器,其具有被設計成對可機讀類型的符號體系進行解碼的示例性功能,并且特別地,其與在所捕獲的文檔圖像數(shù)據(jù)中查找到的符號體系相結合。解碼是用來描述對成像模塊338 所捕獲的圖像中所包含的可機讀標記進行成功解釋的術語。該代碼具有在其中被編碼的數(shù)據(jù)或信息。與各種參考解碼算法相關的信息可以從各種公布的標準,諸如由國際標準組織 (“ISO”)公布的標準獲得。示例可以包括一維(或線性)符號體系、堆疊式符號體系、矩陣符號體系、復合符號體系、或其他可機讀標記。一維(或線性)符號體系且可以包括從巨大到超小的,碼128,交叉二五碼,Codabar (庫德巴碼),碼93,碼11,碼39,UPC,EAN,MSI,或者其他線性符號體系。堆疊式符號體系可以包括PDF,碼16K,碼49,或其他堆疊式符號體系。 矩陣符號體系可以包括Aztec (阿茲特克碼),Datamatrix (數(shù)據(jù)矩陣碼),Maxicode,QR碼或其他2D符號體系。復合符號體系可以包括與堆疊式符號體系組合的線性符號體系。其他符合體系示例可以包括OCR-A,OCR-B, MICR類型的符號體系。UPC/ΕΑΝ符號體系或條形碼在整個北美、歐洲以及全世界的若干其他國家在標準方面被用來標記零售產(chǎn)品。繼續(xù)參照圖3,且現(xiàn)在還參照圖4,圖示了用于處理文檔(例如文檔300)的方法400 的示例性實施例。方法400包括在塊402,捕獲文檔的圖像和;在塊404,處理該文檔圖像以標識設置在該文檔上的表單條形碼。該方法400還包括在塊406,對該表單條形碼進行解碼,由此檢索嵌入于其中的信息。在一個實施例中,該方法還可以包括,在塊408,定位該文檔的其他部分,其例如包括該表單條形碼的基準、坐標系、和/或一個或多個內容域。在一個示例中,該基準包括如上所論述的一個或多個點或該文檔的其他特征。方法400和類似實施例的執(zhí)行對于減少該文檔圖像的處理時間有用。例如,可以對原始或相對低分辨率捕獲的圖像數(shù)據(jù)進行在塊404的處理,以從該文檔圖像的背景噪聲中拾取和標識該表單條形碼。此特征減少了對于高級別處理技術的需要。此外,在一個實施例中,當把與該文檔內容相關的信息編碼到基本上在文檔中例如沿8. 5 in (英寸)X 11 的長度延伸的低密度條形碼中時,可以進一步減少該處理需求。通過從文檔內容中標識出表單條形碼,能夠辨識出與該文檔有關的其他信息而不必對該文檔圖像進行完全處理。在一個示例中,表單條形碼可以具有在其中被編碼的、與諸如內容域相對于表單條形碼的相對位置之類的內容有關的信息。此相對位置可以以坐標和 /或偏移的方式給出,其中這些坐標的原點由與該表單條形碼相關聯(lián)的基準提供。如上所論述,這些坐標可以源自文檔坐標系,在其中該文檔坐標系的原點、標度和方向可以基于該文檔圖像中的基準點的位置來構建。當方法400的實施例標識出諸如表單條形碼的單個基準點之類的基準時,就可以定位該內容域的位置,而不需要對該圖像進行進一步處理以尋找該相關內容域的特定標識特性。圖5中圖示了方法500的另一示例性實施例。在一個實施例中,該方法500包括 在塊502,捕獲文檔的圖像;在塊504,確定在該文檔的所捕獲圖像中是否存在表單條形碼。 如果不存在表單條形碼(或者在所捕獲圖像中未被標識出),則該方法500還可以包括在塊506,諸如從該標記讀取終端的端用戶或操作者請求信息以及;在塊508,確定是否提供了輸入,諸如該輸入是否為表單ID。如果端用戶例如未經(jīng)由手動輸進來提供條目,則該方法 500可以繼續(xù)到塊510,繼續(xù)完全處理所捕獲的圖像數(shù)據(jù)。然而,如果提供了表單ID或其他標識信息,則該方法500包括在塊512,基于表格和/或數(shù)據(jù)庫中的信息查找條目。所請求的信息例如可以包括用來標識該表格或數(shù)據(jù)庫中的條目的表單ID。這樣的條目可以包括關于該文檔的多種信息,諸如內容域的定位(例如坐標)。此信息是有用的,這是因為由于該信息提供了是被成像的特定文檔或者可能與其相干的相關或預選域的信息,所以不要求對該文檔進行完全處理。當存在并標識出表單條形碼時,該方法還包括在塊514,對該表單條形碼進行解碼,以及在塊516,確定該表單條形碼中是否存在被編碼的信息,諸如關于表單設計和/或表單設計數(shù)據(jù)的信息。此信息可以是處理該文檔必要的所有相關信息,由此節(jié)省了時間和處理資源。例如,如果在表單條形碼中存在與表單設計和相關數(shù)據(jù)有關的信息,則該方法可以包括,在塊518,使用該表單條形碼中被編碼的數(shù)據(jù)處理該文檔。另一方面,如果在表單條形碼中沒查找到表單設計或表單設計數(shù)據(jù),則方法500可以包括,在塊520,確定是否提供表單ID。再次,如果找到了表單ID,則該方法500使用該表單ID從表格或數(shù)據(jù)庫中檢索信息(例如,在塊512)。在一個實施例中,方法500可以繼續(xù)向終端用戶請求輸入(例如,在塊 506)和執(zhí)行如圖5中所描繪的其余處理步驟。例如當僅關于結構的信息被編碼在表單條形碼中時,方法400和方法500的實施例是有用的。此信息可以用來訪問其他信息,諸如存儲在表格、數(shù)據(jù)庫或其他存儲庫中的信息。所存儲的信息可以提供關于該文檔內容的另外細節(jié)。在一個示例中,從預處理的文檔, 諸如先前在這里所公開的類型的處理和協(xié)議下的那些文檔獲得該存儲庫中的信息。所獲得的信息可以被存儲、索引并且可用于加速如諸如第一文檔和第二文檔之類的一個或多個文檔之間的處理,這兩個文檔均包括相同或相似類型的表單條形碼和/或相同或相似構造的表單結構。繼續(xù)參照圖5,且現(xiàn)在還參照圖6,關注聚焦在使用表單設計和表單設計數(shù)據(jù)對所捕獲的圖像數(shù)據(jù)的處理上,如將在例如圖5的塊518中發(fā)生的且如上面所提及的。在使用該表單設計和表單設計數(shù)據(jù)的處理的方法600的示例中提供了對于這樣的處理有用的處理步驟的樣例。在一個實施例中,方法600包括在塊602,標識文檔的所捕獲圖像中的表單條形碼的位置和在塊604,基于該表單條形碼的位置確定坐標系。方法600還包括在塊 606,算出把該坐標系關連到真實圖像坐標系的變換T。在一個示例中,此計算可以利用表單條形碼位置與真實圖像條形碼位置之間的對應。在一個實施例中,對于該文檔的每個內容域,諸如在表單條形碼中、通過表單ID、 和/或在表單設計和表單設計數(shù)據(jù)中所標識的那些內容域,方法600還包括在塊608,基于變換T算出該內容域在所捕獲圖像中的真實偏移。方法600還可以包括在塊610,使用所算出的偏移從所捕獲圖像中剪切(crop)該內容域。在一個示例中,所算出的偏移通過詳細地標識了內容域的定位和位置,由此把處理算法(和電路)導向和/或指示到正確定位而節(jié)省了處理時間。關于內容域的剪切可以類似地包括所執(zhí)行的步驟、塊和指令,其在廣義上對于聚焦于對所捕獲圖像的特定區(qū)域進行處理有用,在所捕獲圖像中定位有感興趣內容域。方法600還可以包括在塊612,例如根據(jù)在表單條形碼中所編碼的信息或者以其他方式可獲得(例如,如存儲在存儲器中)的信息,確定是否存在另外的內容域。如果要處理另外的內容域,則在一個實施例中,方法600可以返回塊608和/或610,且繼續(xù)處理該文檔。另一方面,如果沒有另外的內容域或者所有內容域都已經(jīng)處理了,則該方法可以包括塊 614,繼續(xù)進行該文檔的另外的處理。可以由被配置成適應如被掃描文檔之間的差異的系統(tǒng)(例如文檔管理系統(tǒng))來實現(xiàn)方法500和方法600的實施例。這些系統(tǒng)常??梢圆捎谜障鄼C、手持掃描儀等來捕獲文檔的圖像數(shù)據(jù)。在文檔的形狀方面,且更特別是在所捕獲圖像的形狀方面可能存在差異。 在一個示例中,變換T的計算和確定容許這樣的系統(tǒng)諸如通過使用表單條形碼的已知方面 (例如表單條形碼的拐角的定位和/或位置)來算出任何指明位置的真實位置。此外,還可以預期到,方法500和方法600的塊中的一個或多個塊可以一起實施。這些塊的協(xié)作可以擴大應用范圍,由此呈遞了能夠使用表單條形碼和在表單條形碼中編碼的信息來處理許多不同類型的文檔的魯棒文檔管理系統(tǒng)。在一個示例中,可以將來自表單條形碼的信息(例如塊514對表單條形碼進行解碼的輸出)提供到塊602。在另一示例中,可以將關于文檔的信息(例如,塊518對文檔進行處理的輸出)提供到塊606。在又一示例中, 可以將關于表單設計和/或表單結構的信息(例如,塊516所請求的輸入)提供到塊608。現(xiàn)在參照圖7中描繪的方法700的示例性實施例來擴展本發(fā)明的概念。在此示例中,方法700包括塊702,用于捕獲文檔的圖像;塊704,用于處理文檔圖像以查找表單條形碼;以及塊706,用于定位表單條形碼在文檔上的基準。方法700還包括在塊708,諸如通過自動文檔處理來接收該文檔,所述自動文檔處理可以操縱大量表單并且可以與大型表單處理系統(tǒng)相關。該方法還包括塊710,對表單條形碼進行解碼;在塊712,標識表單條形碼的拐角;以及在塊714,諸如基于表單條形碼的拐角附加圖像平面和相關聯(lián)的坐標系。該方法還包括在塊716,確定基準(及其定位)是否被編碼;以及在塊718,例如通過使用在表單條形碼中所編碼的定位來標識該基準。該方法還包括在塊720,確定在表單條形碼中內容域是否被編碼。如果不存在被編碼的內容域,則該方法700可以包括在塊722,繼續(xù)完全處理該文檔圖像,諸如以便標識該內容域而不使用或相對于該表單條形碼的基準。當諸如通過表單條形碼中的被編碼的內容域的定位和/或坐標查找到了一個或多個內容域時,方法700可以包括在塊724,例如使用該坐標查找相對于該基準的內容域。 方法700還可以包括在塊726,讀取所查找到的內容域的信息;且在塊728,確定是否要定位另一內容域。如果沒有其他內容域被指明為需要或者對于處理該文檔是必要的,則方法 700可以繼續(xù)到塊722,用來對該文檔圖像進行完全處理。另一方面,如果指明了其他的內容域,則方法700可以繼續(xù)到塊720,以確定在表單條形碼中新的內容域是否被編碼。方法700的實施例適合于與系統(tǒng)(例如文檔管理系統(tǒng))結合實施,其中從文檔到文檔僅有很小差異。在一個實施例中,結合具有相同或基本相似尺寸和形狀的文檔(例如所有矩形輪廓具有與原始文檔相同的大小)來實施方法700。方法700可以利用偏移數(shù)據(jù),諸如將內容域的位置關聯(lián)到表單條形碼的數(shù)據(jù)。在一個示例中,可以通過此偏移數(shù)據(jù)來完成剪切。圖8-11中圖示了諸如圖3的標記讀取終端334之類的標記讀取終端的其他細節(jié), 且下面將對其進行更詳細地論述。在圖8和9中提供了例如用作成像模塊338 (圖2)的成像模塊800的示例,且下面將對其進行更詳細地描述。在標記讀取終端334的一個實施例中,成像模塊800可以包括聚焦元件802 ;和圖像傳感器集成電路804,其與照明圖案光源組808 (“照明組”)一起設置在印刷電路板806上;以及瞄準圖案光源組810 (“瞄準組”)。 這里,照明組808和瞄準組810中的每一個都被提供為單個光源。該成像模塊800還可以包括光學板812,其具有光學元件,用來將來自照明組808和瞄準組810的光成形為預定圖案。成像模塊800可以設置在標記讀取終端中,所述標記讀取終端諸如標記讀取終端 334 (圖2)和圖10中所示出的標記讀取終端900的示例性實施例。標記讀取終端900可以包括手持殼體902,其支持具有指示器控制器906、鍵盤908、觸摸板910和觸發(fā)器912的用戶輸入接口 904。該手持殼體902還可以支持具有顯示器916的用戶輸出接口 914。通常,下面緊接著論述可以被用于用戶輸入接口 904的設備的示例性設備。這些設備中的每一個都可以被實施為手持殼體902的一部分,并且常常集成到其中,以便容許操作者輸入一個或多個操作者發(fā)起的命令。這些命令可以指定和/或激活標記讀取終端的一定功能。它們還可以發(fā)起應用、驅動器和其他可執(zhí)行指令中的確定的一些,以便促使該標記讀取終端900在工作模式下操作。被用于指示器控制器906的設備通常被配置成以使得將操作者發(fā)起的命令轉換為由標記讀取終端900的操作系統(tǒng)的圖形用戶界面(“GUI”)提供的虛擬指示器。它可以包括諸如拇指輪、滾球和觸摸板之類的設備。在一些其他配置中,該設備還可以包括鼠標或例如經(jīng)由有線或無線通信技術連接到標記讀取終端的其他輔助設備。鍵盤908的實現(xiàn)可以使用一個或多個按鈕來提供,其在手持殼體902上被呈現(xiàn)給操作者。觸摸板910可以補充或替代鍵盤908的按鈕。例如,操作系統(tǒng)的GUI之一可以被配置成提供一個或多個虛擬圖標,用于顯示在例如顯示器916上,或者作為標記讀取終端900 上的或連接到標記讀取終端900的另一顯示設備的一部分。這樣的虛擬圖標(例如按鈕和滑動條)被配置成使得操作者可以例如通過用指示筆(未示出)或手指(未示出)按壓或選擇虛擬圖標來選擇它們。該虛擬圖標還可以被用來實現(xiàn)觸發(fā)器912。另一方面,其他被用作觸發(fā)器912的設備也可以被支持在手持殼體902內或作為手持殼體902的一部分。這些包括但不限于, 按鈕、開關、或可以被結合到標記讀取終端900的實施例中的相似類型的可動作的硬件。這些可以被用來激活該便攜式數(shù)據(jù)終端中的一個或多個設備,例如下面所論述的條形碼讀取
ο適合用在標記讀取終端900上的類型的顯示器通常被配置成顯示圖像、數(shù)據(jù)以及與標記讀取終端900的操作系統(tǒng)和/或軟件(及其相關應用)相關聯(lián)的GUI。除了許多其他顯示器以外該顯示器還可以包括但不限于,LCD顯示器、等離子顯示器、LED顯示器、和其組合。雖然標記讀取終端900的優(yōu)選構造將包括顯示彩色數(shù)據(jù)(例如圖像和文本)的設備,但是為顯示器916選擇的顯示器也可以以單色(例如灰度)顯示此數(shù)據(jù)。還可以是可希望的, 顯示器916被配置成顯示⑶I,而在標記讀取終端900的特定配置中,該顯示器916可以具有相關聯(lián)的交互覆蓋,像覆蓋在觸摸板910上的觸摸屏。這容許顯示器916被用作⑶I的一部分,以便容許操作者與該GUI的虛擬圖標、按鈕和其他實現(xiàn)方式交互以發(fā)起由操作者發(fā)起的命令,例如通過用指示筆(未示出)或手指(未示出)在顯示器916和/或觸摸板910 上進行按壓來發(fā)起。手持殼體902可以被構造成使得其具有形狀或“形狀因子”,所述形狀或“形狀因子”可以適應上面提及且下面論述的硬件和設備中的一些或全部。形狀因子定義了手持殼體902的整體配置??梢杂糜谑殖謿んw902的合適的形狀因子包括但不限于,蜂窩電話、移動電話、個人數(shù)字助理(PDA)、以及被定尺寸和成形成例如作為槍型設備被操作者持握、捧抱和支撐在操作者的(一個或多個)手中的其他形狀因子。在本圖8中所圖示的標記讀取終端900的實施例中圖示了一個示例性形狀因子。參照圖11的示意性框示和描述了例如供在標記讀取終端334和900中使用的示例性硬件平臺。在圖11中,看出的是,標記讀取終端1000 (“終端”)可以包括圖像傳感器1002,其包括多像素圖像傳感器陣列1004 (“圖像傳感器陣列”),該多像素圖像傳感器陣列1004具有以行像素和列像素的形式布置的像素,其包括列電路1006和行電路1008。與圖像傳感器1002相關聯(lián)的可以是放大器電路1010,以及模數(shù)轉換器1012,其將從圖像傳感器陣列1004讀出的、以模擬信號形式的圖像信息轉換為以數(shù)字信號形式的圖像信息。圖像傳感器1002還可以具有相關聯(lián)的定時和控制電路1014,供在例如控制圖像傳感器1002 的曝光周期和/或施加到放大器1010的增益時使用。所注明的電路部件1002、1010、1012 和1014可以被封裝到圖像傳感器集成電路1016中。在一個示例中,圖像傳感器集成電路 1016可以由從Micron Technology, Inc.獲得的MT9V022圖像傳感器集成電路獲得。在另一示例中,圖像傳感器集成電路1016可以結合Bayer模式濾波器。在這樣的實施例中,CPU 1018在使幀經(jīng)受進一步處理前,可以插入綠色像素值中間的像素值以顯現(xiàn)(develop)圖像數(shù)據(jù)的單色幀。在其他實施例中,可以對該單色圖像數(shù)據(jù)利用紅色和/或藍色像素值。在終端1000工作期間,可以從圖像傳感器1002讀出圖像信號,轉換并存儲到諸如 RAM 1020之類的系統(tǒng)存儲器中。終端1000的存儲器1022可以包括RAM 1020,例如EPROM 1024之類的非易失性存儲器,以及諸如可以由閃速存儲器或硬盤驅動存儲器提供的儲存器存儲器設備1(^6。在一個實施例中,終端1000可以包括CPU 1018,其可以被適配成讀出存儲在存儲器1022中的圖像數(shù)據(jù)并使這樣的圖像數(shù)據(jù)經(jīng)受各種圖像處理算法。終端1000可以包括直接存儲器存取單元(DMA) 1028,用于將從圖像傳感器1002讀出的、已經(jīng)經(jīng)受轉換的信息路由到RAM 1020。在另一實施例中,終端1000可以采用用于總線仲裁機構而提供的系統(tǒng)總線(例如PCI總線),因而消除了對中央DMA控制器的需要。本領域技術人員會認識到,為在圖像傳感器1002和RAM 1020之間有效數(shù)據(jù)傳送而提供的系統(tǒng)總線體系結構和 /或直接存儲器存取部件的其他實施例在本發(fā)明的范圍和精神內。參照終端1000的其他方面,終端1000可以包括成像透鏡組件1030,用于將位于基板1036上的視野1034內的表單條形碼1032的圖像聚焦到圖像傳感器陣列1004上。成像光線可以圍繞光軸1040被傳輸。該成像透鏡組件1030可以被適配成能夠實現(xiàn)多個焦距和 /或多個最佳焦點距離。終端1000還可以包括照明圖案光源組1042,用于生成基本上對應于終端1000的視野1034的照明圖案1044,以及瞄準圖案光源組1046,用于在基板1036上生成瞄準圖案 1048。在使用中,終端1000可以由操作者相對于承載表單條形碼1032的基板1036,以瞄準圖案1048投射到表單條形碼1032上的方式來定向。在圖9的示例中,表單條形碼1032 由ID條形碼符號提供。表單條形碼還可以由2D條形碼符號、堆疊式線性或光學字符識別 (OCR)字符等提供。照明圖案光源組1042和瞄準圖案光源組1046中的每一個可以包括一個或多個光源。該成像透鏡組件1030可以通過使用透鏡組件控制電路1050來控制,且包括照明圖案光源組1042和瞄準圖案光源組1046的照明組件可以通過使用照明組件控制電路1052來控制。透鏡組件控制電路1050可以向成像透鏡組件1030發(fā)送信號,例如用于改變焦距和/ 或成像透鏡組件1030的最佳焦點距離的信號。這例如可以包括向壓電致動器提供信號以改變上面論述的聚焦元件的可變位置元件的位置。照明組件控制電路1052可以向照明圖案光源組1042發(fā)送信號,例如用于改變由照明圖案光源組1042輸出的照明水平的信號。終端1000還可以包括多個外圍設備,諸如用于顯示諸如通過使用終端1000所捕獲的圖像幀之類的信息的顯示器1054、鍵盤1056、指向設備1058、和可以用來產(chǎn)生用于激活幀讀出和/或一定解碼過程的活動信號的觸發(fā)器1060。終端1000可以被適配成使得對觸發(fā)器1060的激活激活了一個這樣的信號并發(fā)起對表單條形碼1032的解碼嘗試。終端1000可以包括各種接口電路,用于將外圍設備中的若干外圍設備耦合到系統(tǒng)地址/數(shù)據(jù)總線(系統(tǒng)總線)1062,以便與也耦合到系統(tǒng)總線1062的CPU 1018通信。終端1000可以包括用于將圖像傳感器定時和控制電路1014耦合到系統(tǒng)總線1062的接口電路1064,用于將透鏡組件控制電路1050耦合到系統(tǒng)總線1062的接口電路1068,用于將照明組件控制電路1052耦合到系統(tǒng)總線1062的接口電路1070,用于將顯示器IOM耦合到系統(tǒng)總線1062的接口電路1072,以及用于將鍵盤1056、指向設備1058和觸發(fā)器1060耦合到系統(tǒng)總線1062的接口電路1076。在其它方面,終端1000可以包括一個或多個I/O接口 1073、1080,用來提供與外部設備(例如收銀機服務器、商店服務器、庫存設備服務器、同位終端、局域網(wǎng)基站、蜂窩式基站等)的通信。I/O接口 1073、1080可以是已知計算機接口中的任何組合的接口,例如以太網(wǎng)(IEEE 802. 3)、USB、IEEE 802. 11、藍牙、CDMA、GSM、IEEE 1394、RS232 或任何其他計算機接口??梢灶A期到,不管是由對本公開內容的論述明確陳述的還是固有導出的,這里所記載的數(shù)值以及其他值可以被術語“大約”修改。如這里所使用的,術語“大約”定義了該修改值的數(shù)字邊界,以便包括但不限于容差和直達到的值,并且包括了如此修改的數(shù)值。也就是說,數(shù)值可以包括明確陳述的實際值,以及是或可能是在本公開內容中所指示和/或描述的實際值的小數(shù)、分數(shù)或其他倍數(shù)的其他值。
在這里所闡述的系統(tǒng)、設備和方法中,這里闡述了 Al. 一種用于處理文檔的系統(tǒng),其包括
標記讀取終端,其包括包括沿著圖像平面延伸的多個像素的二維圖像傳感器陣列,供在將成像光線聚焦到所述二維圖像傳感器陣列的多個像素上時使用的光學組件,以及封裝所述二維圖像傳感器陣列和所述光學組件的殼體,
其中該系統(tǒng)以這樣的模式工作,在該模式中,該系統(tǒng)響應于操作者發(fā)起的命令,捕獲圖像數(shù)據(jù)幀并處理所述圖像數(shù)據(jù)幀以嘗試對文檔上的表單條形碼進行解碼,
其中該系統(tǒng)還用來根據(jù)存儲在所述表單條形碼中的信息標識圖像平面上的坐標系, 其中該系統(tǒng)又用來相對于所述表單條形碼標且在所述坐標系中標識位于文檔上的內容域的位置,以及
其中與對在沒有表單條形碼的第二文檔上的圖像數(shù)據(jù)幀的處理相比,對在其上設置有表單條形碼的第一文檔上的圖像數(shù)據(jù)幀的處理更快。A2.根據(jù)Al的系統(tǒng),其中該系統(tǒng)用來標識在所述表單條形碼中所編碼的表單ID, 并且其中所述表單ID標識表格中的條目。A3.根據(jù)Al的系統(tǒng),其中該系統(tǒng)用來在文檔的其他內容域之前定位和解碼所述表單條形碼。A4.根據(jù)A3的系統(tǒng),其中該系統(tǒng)還用來標識在所述表單條形碼中所編碼的預分配幾何圖案。A5.根據(jù)Al的系統(tǒng),其中該系統(tǒng)用來標識所述表單條形碼的至少一個拐角,并且其中所述坐標系是相對于所標識的拐角來定位的。
A6.根據(jù)Al的系統(tǒng),其中該系統(tǒng)用來根據(jù)所述表單條形碼來標識所述內容域中的
fn息οA7.根據(jù)Al的系統(tǒng),其中該系統(tǒng)用來定位所述表單條形碼的至少一個拐角,其中該系統(tǒng)用來相對于所述至少一個拐角定位所述表單條形碼上的基準,并且其中該系統(tǒng)用來相對于所述基準定位所述內容域。A8.根據(jù)Al的系統(tǒng),其中該系統(tǒng)用來在所述圖像平面上建立具有水平和垂直網(wǎng)格線的網(wǎng)格,其中該系統(tǒng)還用來在所述網(wǎng)格上定位所述內容區(qū)域,并且其中所述網(wǎng)格與所述坐標系相關聯(lián)。Bi. 一種用于自動處理文檔的系統(tǒng),所述系統(tǒng)包括
標記讀取終端,其包括包括沿著圖像平面延伸的多個像素的二維圖像傳感器陣列,供在將成像光線聚焦到所述二維圖像傳感器陣列的多個像素上時使用的光學組件,以及封裝所述二維圖像傳感器陣列和所述光學組件的殼體;
與所述標記讀取終端通信的外部服務器,所述外部服務器在所述標記讀取終端的外
部;
其中該系統(tǒng)以這樣的模式工作,在該模式中,該系統(tǒng)響應于操作者發(fā)起的命令,捕獲圖像數(shù)據(jù)幀并處理所述圖像數(shù)據(jù)幀以嘗試對文檔上的表單條形碼進行解碼,
其中該系統(tǒng)用來形成圖像平面,在所述圖像平面上定位有與坐標系相關的網(wǎng)格, 其中,所述網(wǎng)格具有根據(jù)所述表單條形碼的至少一個拐角建立的網(wǎng)格點, 其中,該系統(tǒng)還用來在所述網(wǎng)格上標識具有與所述表單條形碼中所編碼的信息相對應的坐標系上的坐標的內容域,和
其中,與對在沒有表單條形碼的第二文檔上的圖像數(shù)據(jù)幀的處理相比,對在其上設置有表單條形碼的第一文檔上的圖像數(shù)據(jù)幀的處理更快。Cl. 一種處理文檔的方法,其包括 捕獲與文檔對應的圖像數(shù)據(jù)幀;
處理所述圖像數(shù)據(jù)幀以定位附加到文檔的表單條形碼; 在與所捕獲圖像數(shù)據(jù)相關的圖像平面上建立坐標系;和相對于所述表單條形碼且在所述坐標系上定位文檔上的內容域, 其中,與對在沒有表單條形碼的第二文檔上的圖像數(shù)據(jù)幀的處理相比,對在其上設置有表單條形碼的第一文檔上的圖像數(shù)據(jù)幀的處理更快。C2.根據(jù)Cl的方法,還包括根據(jù)所述表單條形碼標識表單設計,其中所述表單設計包括與文檔的內容域的定位和內容中的一個或多個相關的信息。C3.根據(jù)Cl的方法,還包括 對所述表單條形碼進行解碼;和標識表格中的條目,
其中所述條目對應于所述表單條形碼中的信息。C4.根據(jù)Cl的方法,還包括算出變換,并且使用所述變換來算出所述圖像數(shù)據(jù)幀中的內容域的偏移。C5.根據(jù)C4的方法,還包括剪切與所述內容域有關的圖像數(shù)據(jù)幀。C6.根據(jù)Cl的方法,還包括定位所述表單條形碼的至少一個拐角,其中相對于所述至少一個拐角建立所述坐標系。C7.根據(jù)Cl的方法,還包括根據(jù)所述表單條形碼查找基準,其中所述內容域的位置是相對于所述基準的。C8.根據(jù)Cl的方法,還包括 嘗試對所述表單條形碼進行解碼;和根據(jù)所解碼的表單條形碼標識所述基準。C9.根據(jù)Cl的方法,還包括經(jīng)由自動饋送機制接收所述第一文檔和所述第二文檔。C10.根據(jù)Cl的方法,其中所述內容區(qū)域的位置被嵌入到所述表單條形碼中。Cll.根據(jù)Cl的方法,其中在標記讀取終端外部的外部服務器上完成用于捕獲圖像數(shù)據(jù)幀的處理。雖然參照一定示例性實施例已經(jīng)特別示出和描述了本發(fā)明,但是本領域技術人員將理解,不偏離如權利要求所定義的本發(fā)明的精神和范圍的情況下,在其中可以實現(xiàn)各種詳細改變,所述權利要求能夠被所撰寫的說明和附圖支持。此外,雖然參照一定數(shù)目的元件描述了示例性實施例,將理解,可以利用少于或多于該一定數(shù)目的元件來實踐示例性實施例。
權利要求
1.一種處理文檔的系統(tǒng),其包括標記讀取終端,其包括包括沿著圖像平面延伸的多個像素的二維圖像傳感器陣列,供在將成像光線聚焦到所述二維圖像傳感器陣列的多個像素上時使用的光學組件,以及封裝所述二維圖像傳感器陣列和所述光學組件的殼體,其中該系統(tǒng)以這樣的模式工作,在該模式中,該系統(tǒng)響應于操作者發(fā)起的命令,捕獲圖像數(shù)據(jù)幀并處理所述圖像數(shù)據(jù)幀以嘗試對文檔上的表單條形碼進行解碼,其中該系統(tǒng)還用來根據(jù)存儲在所述表單條形碼中的信息來在圖像平面上標識坐標系, 其中該系統(tǒng)又用來相對于所述表單條形碼標且在所述坐標系中標識位于文檔上的內容域的位置,以及其中與對在沒有表單條形碼的第二文檔上的圖像數(shù)據(jù)幀的處理相比,對在其上設置有表單條形碼的第一文檔上的圖像數(shù)據(jù)幀的處理更快。
2.如權利要求1所述的系統(tǒng),其中該系統(tǒng)用來標識在所述表單條形碼中所編碼的表單 ID,并且其中所述表單ID標識表格中的條目。
3.如權利要求1所述的系統(tǒng),其中該系統(tǒng)用來在文檔的其他內容域之前定位和解碼所述表單條形碼。
4.如權利要求1所述的系統(tǒng),其中該系統(tǒng)用來標識所述表單條形碼的至少一個拐角, 并且其中所述坐標系是相對于所標識的拐角來定位的。
5.如權利要求1所述的系統(tǒng),其中該系統(tǒng)用來根據(jù)所述表單條形碼來標識所述內容域中的信息。
6.如權利要求1所述的系統(tǒng),其中該系統(tǒng)用來在所述圖像平面上建立具有水平和垂直網(wǎng)格線的網(wǎng)格,其中該系統(tǒng)還用來在所述網(wǎng)格上定位所述內容區(qū)域,并且其中所述網(wǎng)格與所述坐標系相關聯(lián)。
7.一種用于自動處理文檔的系統(tǒng),所述系統(tǒng)包括標記讀取終端,其包括包括沿著圖像平面延伸的多個像素的二維圖像傳感器陣列,供在將成像光線聚焦到所述二維圖像傳感器陣列的多個像素上時使用的光學組件,以及封裝所述二維圖像傳感器陣列和所述光學組件的殼體;與所述標記讀取終端通信的外部服務器,所述外部服務器在所述標記讀取終端的外部;其中該系統(tǒng)以這樣的模式工作,在該模式中,該系統(tǒng)響應于操作者發(fā)起的命令,捕獲圖像數(shù)據(jù)幀并處理所述圖像數(shù)據(jù)幀以嘗試對文檔上的表單條形碼進行解碼,其中該系統(tǒng)用來形成圖像平面,在所述圖像平面上定位有與坐標系相關的網(wǎng)格, 其中,所述網(wǎng)格具有根據(jù)所述表單條形碼的至少一個拐角建立的網(wǎng)格點, 其中,該系統(tǒng)還用來在所述網(wǎng)格上標識具有與所述表單條形碼中所編碼的信息相對應的坐標系上的坐標的內容域,和其中,與對在沒有表單條形碼的第二文檔上的圖像數(shù)據(jù)幀的處理相比,對在其上設置有表單條形碼的第一文檔上的圖像數(shù)據(jù)幀的處理更快。
8.—種處理文檔的方法,其包括 捕獲與文檔對應的圖像數(shù)據(jù)幀;處理所述圖像數(shù)據(jù)幀以定位附加到文檔的表單條形碼;在與所捕獲圖像數(shù)據(jù)相關的圖像平面上建立坐標系;和相對于所述表單條形碼且在所述坐標系上定位文檔上的內容域,其中,與對在沒有表單條形碼的第二文檔上的圖像數(shù)據(jù)幀的處理相比,對在其上設置有表單條形碼的第一文檔上的圖像數(shù)據(jù)幀的處理更快。
9.如權利要求8所述的方法,還包括根據(jù)所述表單條形碼標識表單設計,其中所述表單設計包括與文檔的內容域的定位和內容中的一個或多個相關的信息。
10.如權利要求8所述的方法,還包括對所述表單條形碼進行解碼;和標識表格中的條目,其中所述條目對應于所述表單條形碼中的信息。
11.如權利要求8所述的方法,還包括剪切與所述內容域有關的圖像數(shù)據(jù)幀。
12.如權利要求8所述的方法,還包括定位所述表單條形碼的至少一個拐角,其中相對于所述至少一個拐角建立所述坐標系。
13.如權利要求8所述的方法,還包括根據(jù)所述表單條形碼查找基準,其中所述內容域的位置是相對于所述基準的。
14.如權利要求8所述的方法,還包括經(jīng)由自動饋送機制接收所述第一文檔和所述第二文檔。
15.如權利要求8所述的方法,其中在標記讀取終端外部的外部服務器上完成用于捕獲圖像數(shù)據(jù)幀的處理。
全文摘要
本發(fā)明公開了一種用于文檔處理的系統(tǒng)和方法。本發(fā)明的實施例更特別針對可以利用該文檔的內容與附加到該文檔的可解碼標記之間的相對位置的系統(tǒng)和方法。在一個實施例中,提供了標記讀取終端,其包括成像模塊,用于捕獲文檔的圖像數(shù)據(jù)幀。該文檔可以包括諸如表單條形碼之類的一個或多個可解碼標記和各種內容域,所述內容域畫出了該文檔的特定內容。該表單條形碼可以包括與表單設計和表單設計數(shù)據(jù)相關的信息。此信息可以被用來處理該文檔的內容,諸如通過提供坐標或類似的位置和定位量度以供在處理該文檔的內容時使用。在一個示例中,分析圖像數(shù)據(jù)幀以標識表單條形碼,根據(jù)該表單條形碼可以辨識出內容域的相對位置而不需要對圖像數(shù)據(jù)幀進行大量處理。
文檔編號G06K7/10GK102375969SQ20111022363
公開日2012年3月14日 申請日期2011年8月5日 優(yōu)先權日2010年8月6日
發(fā)明者李 J., 赫納托 J., P. 德羅奇 S., P. 梅爾 T. 申請人:手持產(chǎn)品公司