国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      文本提取方法和裝置的制造方法

      文檔序號:8412845閱讀:361來源:國知局
      文本提取方法和裝置的制造方法
      【技術(shù)領(lǐng)域】
      [0001] 本發(fā)明涉及字符識別領(lǐng)域,更具體地涉及一種基于用戶對圖像上感興趣文本的指 定來快速提取圖像中的文本的方法和裝置。
      【背景技術(shù)】
      [0002] 隨著智能手機(jī)、便攜式電腦等手持設(shè)備的越來越廣泛的使用,基于用戶引導(dǎo)的文 本檢測在用戶感興趣信息檢索、用戶體驗(yàn)及人機(jī)交互領(lǐng)域等方面扮演的角色不斷增加。但 是由于文本大小、方向、傾斜、光照、復(fù)雜背景等因素的影響,快速且準(zhǔn)確的進(jìn)行文本檢測是 一項艱巨的任務(wù)。大部分的傳統(tǒng)方法更關(guān)注于整個圖像區(qū)域【文獻(xiàn)1】及所有文本檢測【文 獻(xiàn)2】,而沒有關(guān)注用戶感興趣的文本,而這部分文本對用戶來說恰好是最重要的。用戶感興 趣的文本可以用來作為圖像名稱、標(biāo)簽、或人機(jī)交互的關(guān)鍵詞等。
      [0003] 其中,基于全圖處理的方法經(jīng)常使用邊緣、顏色、連通部件、機(jī)器學(xué)習(xí)的方法對全 圖提取全部文本,并篩選用戶感興趣文本。全圖處理中有很多無用的操作,并且可能加入噪 聲,更加糟糕的是處理時間將會災(zāi)難性的增長,那么這項技術(shù)就很難應(yīng)用于對處理速度比 較敏感的手持設(shè)備中。
      [0004] 全部文本提取的方法試圖提取出所有的文本,以提供給用戶。對用戶來說,其中可 能存在大量無用的文本,并且消耗大量的處理時間,與此同時,用戶感興趣的信息被夾雜在 所有的文本信息之中,用戶可能感到困惑,無所適從。
      [0005] 因此需要一種能夠基于用戶的指定來快速提取圖像中的文本的方法和裝置。
      [0006] [非專利文獻(xiàn) 1] J. Du, Q. Huo, L. Sun, J. Sun, " Snap and Translate Using Windows Phone,,' International Conference on Document Analysis and Recognition, pp. 809-813,2011.
      [0007] [非專利文獻(xiàn) 2]H. G. Zhang, K. Zhao, Y. Z. Song, J. Guo, "Text extraction from natural scene image:A survey, ^Neurocomputing, 2013.
      [0008] [專利文獻(xiàn) 3] Ron karidi, Lai Chee Man, "Method and apparatus for text detection, "W02002101637A2, 2002.

      【發(fā)明內(nèi)容】

      [0009] 在下文中給出關(guān)于本發(fā)明的簡要概述,以便提供關(guān)于本發(fā)明的某些方面的基本理 解。應(yīng)當(dāng)理解,這個概述并不是關(guān)于本發(fā)明的窮舉性概述。它并不是意圖確定本發(fā)明的關(guān) 鍵或重要部分,也不是意圖限定本發(fā)明的范圍。其目的僅僅是以簡化的形式給出某些概念, 以此作為稍后論述的更詳細(xì)描述的前序。
      [0010] 本發(fā)明的一個主要目的在于,提供一種文本提取方法,包括:獲取用戶對圖像上感 興趣的文本的指定;確定文本的大??;確定文本的排列方向;估計文本的排列方向的偏移 角度;根據(jù)文本的大小、排列方向和偏移角度來確定包含文本的圖像片段;對圖像片段中 的種子連通部件進(jìn)行種子連通部件生長以提取用戶感興趣的文本。 toon] 根據(jù)本發(fā)明的一個方面,提供了一種文本提取裝置,包括:文本指定單元,文本指 定單元被配置為獲取用戶對圖像上感興趣的文本的指定;文本大小確定單元,文本大小確 定單元被配置為確定文本的大??;文本排列方向確定單元,文本排列方向確定單元被配置 為確定文本的排列方向;排列方向偏移角度估計單元,排列方向偏移角度估計單元被配置 為估計文本的排列方向的偏移角度;圖像片段確定單元,圖像片段確定單元被配置為根據(jù) 文本的大小、排列方向和偏移角度來確定包含文本的圖像片段;文本提取單元,文本提取單 元被配置為對圖像片段中的種子連通部件進(jìn)行種子連通部件生長以提取用戶感興趣的文 本。
      [0012] 另外,本發(fā)明的實(shí)施例還提供了用于實(shí)現(xiàn)上述方法的計算機(jī)程序。
      [0013] 此外,本發(fā)明的實(shí)施例還提供了至少計算機(jī)可讀介質(zhì)形式的計算機(jī)程序產(chǎn)品,其 上記錄有用于實(shí)現(xiàn)上述方法的計算機(jī)程序代碼。
      [0014] 通過本發(fā)明,可以只處理用戶感興趣文本位置的部分圖像,速度快,精度高,并能 有效地自適應(yīng)文本大小、方向和傾斜角度。
      [0015] 通過以下結(jié)合附圖對本發(fā)明的最佳實(shí)施例的詳細(xì)說明,本發(fā)明的這些以及其他優(yōu) 點(diǎn)將更加明顯。
      【附圖說明】
      [0016] 參照下面結(jié)合附圖對本發(fā)明實(shí)施例的說明,會更加容易地理解本發(fā)明的以上和其 它目的、特點(diǎn)和優(yōu)點(diǎn)。附圖中的部件只是為了示出本發(fā)明的原理。在附圖中,相同的或類似 的技術(shù)特征或部件將采用相同或類似的附圖標(biāo)記來表示。
      [0017] 圖1示出了對圖像應(yīng)用根據(jù)本發(fā)明的一個實(shí)施例的文本提取方法的示意圖;
      [0018] 圖2是示出根據(jù)本發(fā)明的一個實(shí)施例的文本提取方法200的示例性流程圖;
      [0019] 圖3示出了確定圖像中的用戶感興趣的文本的大小的示例性流程圖;
      [0020] 圖4A示出了圖像中的窗口的示意圖;
      [0021] 圖4B示出了水平方向檢測子和堅直方向檢測子的示意圖;
      [0022] 圖4C示出了正方形檢測子的示意圖;
      [0023] 圖5A示出了排列在水平方向上的兩個連通部件的示意圖;
      [0024] 圖5B示出了排列在堅直方向上的兩個連通部件的示意圖;
      [0025] 圖6示出了圖像中的種子連通部件;
      [0026] 圖7是示出圖像坐標(biāo)系轉(zhuǎn)換到世界坐標(biāo)系的示意圖;
      [0027] 圖8是示出文本的排列方向的傾斜角度的示意圖;
      [0028] 圖9是截取圖像片段的示意圖;
      [0029] 圖10A-10B是示出對種子連通部件進(jìn)行種子連通部件生長來定位用戶感興趣的 文本的不意圖;
      [0030] 圖11是示出根據(jù)本發(fā)明的一個實(shí)施例的文本提取裝置1100的示例性配置的框 圖;
      [0031] 圖12是示出文本大小確定單元1120的示例性配置的框圖;
      [0032] 圖13是示出排列方向偏移角度估計單元1140的示例性配置的框圖;
      [0033] 圖14是示出圖像片段確定單元1150的示例性配置的框圖;
      [0034] 圖15是示出文本提取單元1160的示例性配置的框圖;
      [0035] 圖16是示出可以用于實(shí)施本發(fā)明的文本提取方法和裝置的計算設(shè)備的舉例的結(jié) 構(gòu)圖。
      【具體實(shí)施方式】
      [0036] 下面參照附圖來說明本發(fā)明的實(shí)施例。在本發(fā)明的一個附圖或一種實(shí)施方式中描 述的元素和特征可以與一個或更多個其它附圖或?qū)嵤┓绞街惺境龅脑睾吞卣飨嘟Y(jié)合。應(yīng) 當(dāng)注意,為了清楚的目的,附圖和說明中省略了與本發(fā)明無關(guān)的、本領(lǐng)域普通技術(shù)人員已知 的部件和處理的表示和描述。
      [0037] 圖1示出了對圖像應(yīng)用根據(jù)本發(fā)明的一個實(shí)施例的文本提取方法的示意圖。
      [0038] 根據(jù)本發(fā)明的文本提取方法可以基于用戶對其感興趣的文本所在的區(qū)域的指定, 從圖1中左側(cè)所示的圖像中截取出包含用戶感興趣的文本"清水寺公園"的圖像片段,對該 圖像片段進(jìn)行處理,提取出其中包含的文本,所提取的文本可以進(jìn)一步作為圖像名稱、圖像 標(biāo)簽、或作為互聯(lián)網(wǎng)搜索的關(guān)鍵詞來應(yīng)用。下面將詳細(xì)說明根據(jù)本發(fā)明的一個實(shí)施例的文 本提取方法從圖像中提取用戶感興趣的文本的具體過程。
      [0039] 圖2是示出根據(jù)本發(fā)明的一個實(shí)施例的文本提取方法200的示例性流程圖。
      [0040] 如圖2所示,首先,在步驟S210中,獲取用戶對圖像上感興趣文本的指定。
      [0041] 具體地,用戶可以通過智能手機(jī)、便攜式電腦、平板電腦、照相機(jī)等設(shè)備獲取圖像。 然后用戶可以在圖像上指定他/她所感興趣的文本所在區(qū)域。例如,用戶可以通過用手指 點(diǎn)擊手機(jī)或電腦上的其感興趣的文本所在的區(qū)域,也可以通過使照相機(jī)或攝像頭的焦距對 準(zhǔn)感興趣的文本所在的區(qū)域來指定。<
      當(dāng)前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1