国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      轉(zhuǎn)換文本的制作方法

      文檔序號(hào):6476266閱讀:177來源:國知局
      專利名稱:轉(zhuǎn)換文本的制作方法
      轉(zhuǎn)換文本
      扭息 冃尿
      文本編輯器是用來創(chuàng)建和編輯諸如電子文檔等文件的軟件應(yīng)用程序。
      在某些情況下,文本編輯器可被用來記錄諸如在一節(jié)課或商務(wù)會(huì)議中記下 的筆記等信息。例如,用戶(例如學(xué)生)可使用計(jì)算機(jī)和文本編輯軟件在 一節(jié)課期間記筆記。學(xué)生在電子文檔中所記錄的筆記可包括圖像。該電子 文檔中的圖像例如可包含位于圖像中的可視的嵌入文本或文本的圖片。
      概述
      提供本概述是為了以簡化的形式介紹將在以下詳細(xì)描述中進(jìn)一步描述 的一些概念。本概述并不旨在標(biāo)識(shí)出所要求保護(hù)的主題的關(guān)鍵特征或必要 特征。本概述也不旨在用于限制所要求保護(hù)的主題的范圍。
      首先,使用用戶可選擇元素,可選擇包括電子文檔中的第一文本和位 于該電子文檔中的圖像內(nèi)的第二文本的選擇文本。隨后,響應(yīng)于選擇該選 擇文本,圖像內(nèi)的第二文本可被轉(zhuǎn)換為字符信息。
      前述一般描述和以下詳細(xì)描述兩者都提供示例且都只是說明性的。因 此,前述一般描述和以下詳細(xì)描述不應(yīng)被認(rèn)為是限制性的。此外,除了此 處所闡明的那些之外還可提供其它特征或變型。例如,各實(shí)施例可涉及在 詳細(xì)描述中描述的各種特征組合和子組合。
      附圖簡述
      合并在本發(fā)明中并構(gòu)成其一部分的附圖示出本發(fā)明的各種實(shí)施例。在 附圖中


      圖1是操作環(huán)境;
      圖2是用于提供轉(zhuǎn)換文本的方法的流程圖3是圖2的用于轉(zhuǎn)換文本的方法中所使用的子例程的流程圖; 圖4是另一操作環(huán)境;以及圖5是包括計(jì)算設(shè)備的系統(tǒng)的框圖。
      詳細(xì)描述
      以下詳細(xì)描述參考各個(gè)附圖。只要可能,就在附圖和以下描述中使用 相同的附圖標(biāo)記來指示相同或類似的元素。盡管可能描述了本發(fā)明的各實(shí) 施例,但修改、改編和其它實(shí)現(xiàn)也是可能的。例如,可以對(duì)附圖中所示出 的元素進(jìn)行置換、添加、或修改,且可以通過對(duì)所公開的方法置換、重新 排序、或添加階段來修改此處所描述的方法。因此,以下詳細(xì)描述并不限 制本發(fā)明。相反,本發(fā)明的正確范圍由所附權(quán)利要求書來定義。
      根據(jù)本發(fā)明的各實(shí)施例,文本編輯器可以允許用戶在其頁面上插入多 種不同的內(nèi)容類型。這些內(nèi)容類型例如可以是文本、手寫筆跡(例如數(shù)字 墨水)、圖片、屏幕剪輯、音頻等等。本發(fā)明的各實(shí)施例可以幫助用戶在 該文檔編輯器中找到他們正在尋找的事物而不管內(nèi)容類型。例如,在用戶
      在該文本編輯器中運(yùn)行搜索時(shí),能夠搜索圖片(聯(lián)合圖像專家組(JPEG)、 位圖(BMP)等),并將該圖片內(nèi)部的文本加亮。用戶可不必指定用戶正 在尋找的文本在圖片中。相反,本發(fā)明的各實(shí)施例可以允許文本編輯器搜 索所有不同的內(nèi)容類型。同樣,如所有其它內(nèi)容類型一樣,文本編輯器可 以執(zhí)行光學(xué)字符識(shí)別(OCR)并索引背景中的圖片,而用戶不必做任何事 情。因此,在用戶搜索某一事物時(shí),可以找到該事物而不管其中對(duì)應(yīng)于該 搜索的命中發(fā)生的內(nèi)容類型。
      根據(jù)本發(fā)明的各實(shí)施例,在決定運(yùn)行OCR類型時(shí),該文本編輯器可以 嘗試作出關(guān)于該圖片源于何處的邏輯判定。因?yàn)椴煌脑纯删哂胁煌奶?征,所以如果識(shí)別引擎了解關(guān)于該圖像來自何處的某些信息,則可以獲得 更好的結(jié)果。
      圖1示出根據(jù)本發(fā)明的各實(shí)施例的操作環(huán)境。計(jì)算設(shè)備105可以顯示 電子文檔110。電子文檔110可包含第一文本115、第一圖像120和第二圖 像130。第一圖像120和第二圖像130可分別包含第二文本125和第三文本 135。本發(fā)明的各實(shí)施例可以允許用戶用一個(gè)用戶可選擇元素來選擇第一文 本115和例如第二文本125,即使第二文本125在第一圖像120內(nèi)。圖2是闡明根據(jù)本發(fā)明的各實(shí)施例的用于轉(zhuǎn)換文本的方法200中所涉 及的一般階段的流程圖。方法200可以使用以下參考圖5更詳細(xì)地描述的 計(jì)算設(shè)備105來實(shí)現(xiàn)。以下將參考圖2、圖3和圖4更詳細(xì)地描述實(shí)現(xiàn)方法 200的各階段的方式。圖3示出圖2的用于轉(zhuǎn)換文本的方法中所使用的子例 程的流程圖。圖4示出操作環(huán)境。
      方法200可在開始框205處開始,并前進(jìn)至階段210,其中計(jì)算設(shè)備 105可以將位于電子文檔中的第一圖像120內(nèi)的第二文本125轉(zhuǎn)換為字符信 息。例如,第二文本125可被轉(zhuǎn)換為字符"X" 、 "Y"和"Z"。實(shí)現(xiàn)子 例程210的方式以下將參考圖3更詳細(xì)地描述。
      從其中第二文本125可被轉(zhuǎn)換為字符信息的階段210,方法200可前 進(jìn)至子例程220,其中使用計(jì)算設(shè)備105,用戶可用圖4所示的用戶可選擇 元素405來選擇選擇文本。該選擇文本可包括可視的嵌入文本或位于圖像 中的文本的圖片。用戶可能希望復(fù)制電子文檔中所示出的文本。為做到這 點(diǎn),用戶可用用戶可選擇元素來覆蓋用戶希望復(fù)制的任何文本(例如選擇 文本)。選擇文本可包括電子文檔110中的第一文本115和位于電子文檔 110中的第一圖像120內(nèi)的第二文本125。例如,用戶可選擇元素405可被 用來選擇第一文本115和第二文本125。可以通過點(diǎn)擊并拖曳輸入設(shè)備514 (例如鼠標(biāo)等定點(diǎn)設(shè)備)以創(chuàng)建用戶可選擇元素405,來選擇用戶可選擇元 素405。另外,可以通過選擇邊界框來選擇用戶可選擇元素405。邊界框可 以從光學(xué)字符識(shí)別過程返回。另外,光學(xué)字符識(shí)別過程可以返回每一字母、 單詞、文本行等的坐標(biāo)。
      從其中可用用戶可選擇元素選擇選擇文本的子例程220,方法200可
      前進(jìn)至階段230,其中計(jì)算設(shè)備105可加亮第二文本125。例如,在臨時(shí)地 在第二文本125上停頓輸入設(shè)備514之后,可加亮第二文本125。此外,第 二文本125可提供第二文本125 (被加亮的文本)可被選擇的指示。例如, 在臨時(shí)地在第二文本125上停頓輸入設(shè)備514后,第二文本125可以閃爍、 改變顏色、改變字體、改變格式等。 一旦計(jì)算設(shè)備105在階段230加亮了 第二文本125,則方法200隨后可在階段240處結(jié)束。
      圖3是闡明根據(jù)本發(fā)明的各實(shí)施例的用于轉(zhuǎn)換文本的子例程210中所涉及的一般階段的流程圖。子例程210可以在開始框305處開始并前進(jìn)至 階段310,其中計(jì)算設(shè)備105可以接收第一圖像125。第一圖像125可具有 圖像字符信息。圖像字符信息可包括文本、對(duì)應(yīng)于文本的文本位置、指示 圖像120的源的數(shù)據(jù)、以及其它信息。此外,圖像130可具有圖像類型。 圖像類型可包括照相機(jī)圖像、屏幕剪輯、屏幕捕捉、攝像頭照片、來自照 相機(jī)電話的圖片等。第一圖像120可以是高或低分辨率圖像。
      從其中計(jì)算設(shè)備105接收第一圖像120的階段310,子例程210可前 進(jìn)至階段315,其中計(jì)算設(shè)備105可基于圖像類型來調(diào)整第一圖像120的外 觀。例如,計(jì)算設(shè)備105可填充第一圖像120的邊。填充第一圖像120可 包括在圖像周圍添加空間以使第二文本125可具有最小邊距。例如,第一 圖像120中的第二文本125可具有100像素的邊界。在階段315處,計(jì)算 設(shè)備105可填充第一圖像120以使第二文本125具有150像素的邊界。對(duì) 第一圖像120的外觀調(diào)整可提高第一圖像120中的第二文本125可使用 OCR來識(shí)別的可能性。
      此外,調(diào)整第一圖像120的外觀可包括例如移除第一圖像120中可妨 礙字符識(shí)別的元素。例如,第一圖像120可以是將校對(duì)標(biāo)記置于文檔中的 文字處理程序的屏幕捕捉。校對(duì)標(biāo)記可干擾光學(xué)字符識(shí)別過程。例如,文 字處理程序可在誤拼寫單詞下劃紅線。在調(diào)整第一圖像120的外觀的同時(shí), 計(jì)算設(shè)備105可移除該紅線、任何其它下劃線或其它校對(duì)標(biāo)記。
      另外,計(jì)算設(shè)備105可基于第一圖像120的分辨率來調(diào)整第一圖像120 的外觀。例如,第一圖像120可能是使用數(shù)字照相機(jī)來拍攝的。數(shù)字照相 機(jī)可具有高分辨率(例如數(shù)字照相機(jī))或低分辨率(例如照相機(jī)電話、攝 像頭)。對(duì)于高分辨率圖像,調(diào)整可能是或可能不是必須的。然而,對(duì)于 低分辨率圖像,各個(gè)像素可能需要被調(diào)整或"清理",以使嵌入的文本在 OCR期間更可識(shí)別。
      計(jì)算設(shè)備105還可以基于圖像分辨率來調(diào)整第一圖像120,以幫助更 好地區(qū)分各個(gè)字符。另外,計(jì)算設(shè)備105可以基于文本比例來調(diào)整第一圖 像120。文本比例可以基于第一圖像120的像素大小。例如,第一圖像120 可能在小寫字母"L"上方的位置處具有雜散的"點(diǎn)"。例如,雜散的點(diǎn)可被移除以使小寫字母"L"不被誤認(rèn)為是"i"。
      此外,計(jì)算設(shè)備105可在第一圖像120上執(zhí)行光線調(diào)整。例如,第一 圖像120可能曝光過度或曝光不足。因此,計(jì)算設(shè)備105可調(diào)用光線調(diào)整 應(yīng)用程序522來幫助校正曝光度或其它光照問題。
      從其中計(jì)算設(shè)備105調(diào)整第一圖像120的外觀的階段315,子例程210 可前進(jìn)至階段320,其中計(jì)算設(shè)備105可在所調(diào)整的第一圖像120上執(zhí)行光 學(xué)字符識(shí)別。該光學(xué)字符識(shí)別過程可在所調(diào)整的第一圖像120上提取字符 信息和字符的對(duì)應(yīng)的位置信息。例如,光學(xué)字符識(shí)別過程可將第一文本125 作為"X" 、 "Y"和"Z"來返回。另外,光學(xué)字符識(shí)別過程可返回第一 文本125的位置信息。例如,位置信息可包括頁碼、行號(hào)、段落號(hào)、顯示 屏上的像素位置、平面中的坐標(biāo)等。
      從其中計(jì)算設(shè)備105執(zhí)行光學(xué)字符識(shí)別的階段320,子例程210可前 進(jìn)至階段325,其中計(jì)算設(shè)備105可評(píng)估所提取的字符信息來與圖像字符信 息(例如第一文本125)相比改進(jìn)所提取的字符信息的識(shí)別質(zhì)量。例如,所 調(diào)整的圖像的環(huán)境元素可被用來確定所提取的字符。環(huán)境元素例如可以是 字符或單詞。如果環(huán)境元素是單詞,則可以使用語法信息來幫助確定該字 符。
      可以向所提取的字符分配置信度水平。置信度水平可以是準(zhǔn)確度度量。 例如,光學(xué)字符識(shí)別過程可返回具有置信度O (在0-100范圍內(nèi))的"L"。 此外,光學(xué)字符識(shí)別過程可返回具有置信度95的"I"。在這種情況下, 可以用"I"替換"L"來返回正確的字符。
      仍然根據(jù)本發(fā)明的各實(shí)施例,可以實(shí)現(xiàn)多個(gè)光學(xué)字符識(shí)別過程。例如, 可以實(shí)現(xiàn)默認(rèn)光學(xué)字符識(shí)別。該默認(rèn)光學(xué)字符識(shí)別可返回第一置信度水平。 如果第一置信度水平低于最小置信度水平,則可以實(shí)現(xiàn)第二光學(xué)字符識(shí)別 過程。該第二光學(xué)字符識(shí)別過程可返回第二置信度水平。如果第二置信度 水平低于最小置信度水平,則可以實(shí)現(xiàn)第三光學(xué)字符識(shí)別過程。該光學(xué)字 符識(shí)別過程鏈可繼續(xù),直到所返回的置信度水平超過最小置信度水平或已 經(jīng)執(zhí)行了最多數(shù)量的光學(xué)字符識(shí)別過程為止。
      另外,所返回的字符可以是單詞的一部分。該單詞可以通過比較字典中的單詞來確定。例如,所返回的所提取的字符可以是"teh",并且評(píng)估 過程可將其與字典中的單詞進(jìn)行比較并可以確定"teh"實(shí)際上可能是"the"。 此外,可以使用語法模塊來幫助在句子級(jí)評(píng)估所提取的文本。從其中計(jì)算 設(shè)備105評(píng)估所提取的字符信息的步驟325,子例程210可前進(jìn)至階段330, 其中計(jì)算設(shè)備105可返回到階段230 (圖2)。
      根據(jù)本發(fā)明的一實(shí)施例可以包括用于提供轉(zhuǎn)換文本的系統(tǒng)。該系統(tǒng)可 以包括存儲(chǔ)器存儲(chǔ)和耦合到該存儲(chǔ)器存儲(chǔ)的處理單元。處理單元可用于用 用戶可選擇元素來選擇包括電子文檔中的第一文本和位于該電子文檔中的 圖像內(nèi)的第二文本的選擇文本。另外,處理單元可用于響應(yīng)于選擇選擇文 本來將圖像內(nèi)的第二文本轉(zhuǎn)換為字符信息。
      根據(jù)本發(fā)明的另一實(shí)施例可以包括用于提供選擇文本的系統(tǒng)。該系統(tǒng) 可以包括存儲(chǔ)器存儲(chǔ)和耦合到該存儲(chǔ)器存儲(chǔ)的處理單元。處理單元可用于 接收具有圖像字符信息和圖像類型的圖像。此外,處理單元可用于基于圖 像類型來調(diào)整所接收到的圖像的外觀。另外,處理單元可用于在所調(diào)整的 圖像上執(zhí)行光學(xué)字符識(shí)別,以提取包括所調(diào)整的圖像上的字符和該字符的 對(duì)應(yīng)的位置信息的字符信息。此外,處理單元可用于評(píng)估所提取的字符信 息,以與圖像字符信息相比改進(jìn)所提取的字符信息的識(shí)別質(zhì)量。
      根據(jù)本發(fā)明的又一實(shí)施例可以包括用于提供選擇文本的系統(tǒng)。該系統(tǒng) 可以包括存儲(chǔ)器存儲(chǔ)和耦合到該存儲(chǔ)器存儲(chǔ)的處理單元。處理單元可用于 用用戶可選擇元素來選擇包括電子文檔中的第一文本和位于該電子文檔中 的圖像內(nèi)的第二文本的選擇文本。另外,處理單元可用于響應(yīng)于選擇選擇 文本來將圖像內(nèi)的第二文本轉(zhuǎn)換為字符信息??捎糜趯D像內(nèi)的第二文本 轉(zhuǎn)換為字符信息的處理單元可包括可用于接收具有圖像類型的圖像并基于 圖像類型調(diào)整所接收到的圖像的外觀的處理單元。另外,可用于轉(zhuǎn)換的處 理單元可包括可用于在所調(diào)整的圖像上執(zhí)行光學(xué)字符識(shí)別,以提取包括所 調(diào)整的圖像上的字符和該字符的對(duì)應(yīng)的位置信息的字符信息的處理單元。 此外,可用于轉(zhuǎn)換的處理單元可包括可用于評(píng)估所提取的字符信息以與第 二文本相比改進(jìn)所提取的字符信息的識(shí)別質(zhì)量的處理單元。處理單元還可 用于將所選文本粘貼到另 一 電子文檔中。圖5是包括計(jì)算設(shè)備105的系統(tǒng)的框圖。根據(jù)本發(fā)明的一實(shí)施例,上 述存儲(chǔ)器存儲(chǔ)和處理單元可以在諸如圖5的計(jì)算設(shè)備105等計(jì)算設(shè)備中實(shí) 現(xiàn)??梢允褂萌魏魏线m的硬件、軟件或固件的組合來實(shí)現(xiàn)該存儲(chǔ)器存儲(chǔ)和 處理單元。例如,存儲(chǔ)器存儲(chǔ)和處理單元可以用計(jì)算設(shè)備105或結(jié)合計(jì)算 設(shè)備105的任何其它計(jì)算設(shè)備518來實(shí)現(xiàn)。根據(jù)本發(fā)明的各實(shí)施例,上述 系統(tǒng)、設(shè)備和處理器是示例,且其它系統(tǒng)、設(shè)備和處理器可以包括上述存 儲(chǔ)器存儲(chǔ)和處理單元。
      根據(jù)本發(fā)明的各實(shí)施例,文本編輯器是允許在電子文檔中結(jié)合文本和 圖像的任何程序。文本編輯器的示例包括MICROSOFT WORD、 MICROSOFT POWERPOINT 、 MICROSOFT FRONTPAGE 、 MICROSFT ONENOTE、 MICROSOFT VISIO和MICROSOFT PUBLISHER。
      參考圖5,根據(jù)本發(fā)明的一實(shí)施例的系統(tǒng)可以包括諸如計(jì)算設(shè)備105 等計(jì)算設(shè)備。在基本配置中,計(jì)算設(shè)備105可以包括至少一個(gè)處理單元502 和系統(tǒng)存儲(chǔ)器504。取決于計(jì)算設(shè)備的配置和類型,系統(tǒng)存儲(chǔ)器504可以包 括,但不限于,易失性存儲(chǔ)器(例如,隨機(jī)存取存儲(chǔ)器(RAM))、非易 失性存儲(chǔ)器(例如,只讀存儲(chǔ)器(ROM))、閃存或任何組合。系統(tǒng)存儲(chǔ) 器504可以包括操作系統(tǒng)505、 一個(gè)或多個(gè)編程模塊506,且可以包括程序 數(shù)據(jù)507。例如,操作系統(tǒng)505可以適用于控制計(jì)算設(shè)備105的操作。在一 個(gè)實(shí)施例中,編程模塊506可包括文本選擇應(yīng)用程序520和光線調(diào)整應(yīng)用 程序522。此外,本發(fā)明的各實(shí)施例可以結(jié)合圖形庫、其它操作系統(tǒng)、或任 何其它應(yīng)用程序來實(shí)踐,且不限于任何特定應(yīng)用程序或系統(tǒng)。該基本配置 在圖5中由虛線508內(nèi)的組件示出。
      計(jì)算設(shè)備105還可具有附加特征或功能。例如,計(jì)算設(shè)備105還可包 括附加數(shù)據(jù)存儲(chǔ)設(shè)備(可移動(dòng)和/或不可移動(dòng)),諸如,例如磁盤、光盤或 磁帶。這些附加存儲(chǔ)在圖5中由可移動(dòng)存儲(chǔ)509和不可移動(dòng)存儲(chǔ)510示出。 計(jì)算機(jī)存儲(chǔ)介質(zhì)可包括以用于存儲(chǔ)諸如計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序
      模塊或其它數(shù)據(jù)等信息的任何方法或技術(shù)實(shí)現(xiàn)的易失性和非易失性、可移 動(dòng)和不可移動(dòng)介質(zhì)。系統(tǒng)存儲(chǔ)器504、可移動(dòng)存儲(chǔ)509和不可移動(dòng)存儲(chǔ)510 都是計(jì)算機(jī)存儲(chǔ)介質(zhì)的示例(即,存儲(chǔ)器存儲(chǔ))。計(jì)算機(jī)存儲(chǔ)介質(zhì)可以包括,但不限于,RAM、 ROM、電可擦除只讀存儲(chǔ)器(EEPROM)、閃存或 其它存儲(chǔ)器技術(shù)、CD-ROM、數(shù)字多功能盤(DVD)或其它光盤存儲(chǔ)、磁 帶盒、磁帶、磁盤存儲(chǔ)或其它磁性存儲(chǔ)設(shè)備、或可用于存儲(chǔ)信息且可以由 計(jì)算設(shè)備105訪問的任何其它介質(zhì)。任何這樣的計(jì)算機(jī)存儲(chǔ)介質(zhì)都可以是 計(jì)算設(shè)備105的一部分。計(jì)算設(shè)備105還可以具有輸入設(shè)備512,如鍵盤、 鼠標(biāo)、筆、聲音輸入設(shè)備、觸摸輸入設(shè)備等。也可包括諸如顯示器、揚(yáng)聲 器、打印機(jī)等輸出設(shè)備514。上述設(shè)備是示例且可以使用其它設(shè)備。
      計(jì)算設(shè)備105還可包含可允許計(jì)算設(shè)備105如通過分布式計(jì)算環(huán)境中 的網(wǎng)絡(luò),例如,內(nèi)聯(lián)網(wǎng)或因特網(wǎng)來與其它計(jì)算設(shè)備518進(jìn)行通信的通信連 接516。通信連接516是通信介質(zhì)的一個(gè)示例。通信介質(zhì)通常由諸如載波或 其它傳輸機(jī)制等已調(diào)制數(shù)據(jù)信號(hào)中計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊 或其它數(shù)據(jù)來體現(xiàn),并包括任何信息傳遞介質(zhì)。術(shù)語"已調(diào)制數(shù)據(jù)信號(hào)" 指以對(duì)信號(hào)中的信息進(jìn)行編碼的方式設(shè)置或改變其一個(gè)或多個(gè)特征的信 號(hào)。作為示例而非限制,通信介質(zhì)包括諸如有線網(wǎng)絡(luò)或直接線連接等有線 介質(zhì),以及諸如聲學(xué)、射頻(RF)、紅外線和其它無線介質(zhì)等無線介質(zhì)。 如此處所使用的術(shù)語計(jì)算機(jī)可讀介質(zhì)可以包括存儲(chǔ)介質(zhì)和通信介質(zhì)兩者。
      如上所述,可以在系統(tǒng)存儲(chǔ)器504中存儲(chǔ)包括操作系統(tǒng)505在內(nèi)的多 個(gè)程序模塊和數(shù)據(jù)文件。當(dāng)在處理單元502上執(zhí)行時(shí),編程模塊506(例如, 文本選擇應(yīng)用程序520和光線調(diào)整應(yīng)用程序522)可以執(zhí)行各過程,包括例 如,如上所述的方法200的一個(gè)或多個(gè)階段。前述過程是示例,且處理單 元502可以執(zhí)行其它過程。根據(jù)本發(fā)明的各實(shí)施例可以使用的其它編程模 塊可以包括電子郵件和聯(lián)系人應(yīng)用程序、文字處理應(yīng)用程序、電子表格應(yīng) 用程序、數(shù)據(jù)庫應(yīng)用程序、幻燈片演示應(yīng)用程序、繪圖或計(jì)算機(jī)輔助應(yīng)用 程序等。
      一般而言,根據(jù)本發(fā)明的各實(shí)施例,程序模塊可以包括可以執(zhí)行特定 任務(wù)或可以實(shí)現(xiàn)特定的抽象數(shù)據(jù)類型的例程、程序、組件、數(shù)據(jù)結(jié)構(gòu)和其 它類型的結(jié)構(gòu)。此外,本發(fā)明的各實(shí)施例可用其它計(jì)算機(jī)系統(tǒng)配置來實(shí)踐, 包括手持式設(shè)備、多處理器系統(tǒng)、基于微處理器的系統(tǒng)或可編程消費(fèi)電子 產(chǎn)品、小型機(jī)、大型計(jì)算機(jī)等。本發(fā)明的各實(shí)施例也可以在其中任務(wù)由通過通信網(wǎng)絡(luò)鏈接的遠(yuǎn)程處理設(shè)備執(zhí)行的分布式計(jì)算環(huán)境中實(shí)現(xiàn)。在分布式 計(jì)算環(huán)境中,程序模塊可以位于本地和遠(yuǎn)程存儲(chǔ)器存儲(chǔ)設(shè)備中。
      此外,本發(fā)明的各實(shí)施例可在包括分立電子元件、包含邏輯門的封裝 或集成電子芯片、利用微處理器的電路、或在包含電子元件或微處理器的 單個(gè)芯片等的電路中實(shí)現(xiàn)。本發(fā)明的各實(shí)施例還可以使用能夠執(zhí)行諸如,
      例如,AND (與)、OR (或)禾nNOT (非)等邏輯運(yùn)算的其它技術(shù)來實(shí)踐, 包括但不限于,機(jī)械、光學(xué)、流體和量子技術(shù)。另外,本發(fā)明的各實(shí)施例 可以在通用計(jì)算機(jī)或任何其它電路或系統(tǒng)中實(shí)現(xiàn)。
      例如,本發(fā)明的各實(shí)施例可被實(shí)現(xiàn)為計(jì)算機(jī)過程(方法)、計(jì)算系統(tǒng) 或諸如計(jì)算機(jī)程序產(chǎn)品或計(jì)算機(jī)可讀介質(zhì)等制品。計(jì)算機(jī)程序產(chǎn)品可以是 計(jì)算機(jī)系統(tǒng)可讀并編碼用于執(zhí)行計(jì)算機(jī)進(jìn)程的指令的計(jì)算機(jī)程序的計(jì)算機(jī) 存儲(chǔ)介質(zhì)。計(jì)算機(jī)程序產(chǎn)品也可以是計(jì)算系統(tǒng)可讀并編碼用于執(zhí)行計(jì)算機(jī) 進(jìn)程的指令的計(jì)算機(jī)程序的載波上的傳播信號(hào)。因此,本發(fā)明能以硬件和/ 或軟件(包括固件、常駐軟件、微碼等)來具體化。換言之,本發(fā)明的各 實(shí)施例可以采用其上包含有供指令執(zhí)行系統(tǒng)使用或結(jié)合其使用的計(jì)算機(jī)可 使用或計(jì)算機(jī)可讀程序代碼的計(jì)算機(jī)可使用或計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上的計(jì) 算機(jī)程序產(chǎn)品的形式。計(jì)算機(jī)可使用或計(jì)算機(jī)可讀介質(zhì)可以是可以包含、 存儲(chǔ)、通信、傳播、或傳輸程序以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備使用或結(jié) 合其使用的任何介質(zhì)。
      計(jì)算機(jī)可使用或計(jì)算機(jī)可讀介質(zhì)可以是,例如,但不限于,電、磁、
      光、電磁、紅外、或半導(dǎo)體系統(tǒng)、裝置、設(shè)備或傳播介質(zhì)。更具體的計(jì)算
      機(jī)可讀介質(zhì)示例(非窮盡列表),計(jì)算機(jī)可讀介質(zhì)可以包括以下具有一
      條或多條導(dǎo)線的電連接、便攜式計(jì)算機(jī)盤、隨機(jī)存取存儲(chǔ)器(RAM)、只 讀存儲(chǔ)器(ROM)、可擦除可編程只讀存儲(chǔ)器(EPROM或閃存)、光纖、 和便攜式壓縮盤只讀存儲(chǔ)器(CD-ROM)。注意,計(jì)算機(jī)可使用或計(jì)算機(jī) 可讀介質(zhì)甚至可以是其上打印有程序的紙張或另一合適的介質(zhì),因?yàn)槌绦?可以經(jīng)由例如對(duì)紙張或其它介質(zhì)的光學(xué)掃描而電子地捕獲,隨后如有必要 被編譯、解釋,或以其它合適的方式處理,并隨后存儲(chǔ)在計(jì)算機(jī)存儲(chǔ)器中。 例如,以上參考根據(jù)本發(fā)明的各實(shí)施例的方法、系統(tǒng)和計(jì)算機(jī)程序產(chǎn)品的框圖和/或操作圖示描述了本發(fā)明的各實(shí)施例??蛑兴⒚鞯母鞴δ? 動(dòng)作可以按不同于任何流程圖所示的次序出現(xiàn)。例如,取決于所涉及的功 能/動(dòng)作,連續(xù)示出的兩個(gè)框?qū)嶋H上可以基本上同時(shí)執(zhí)行,或者這些框有時(shí) 可以按相反的順序來執(zhí)行。
      盡管己經(jīng)描述了本發(fā)明的某些實(shí)施例,但也可能存在其它實(shí)施例。此 外,雖然本發(fā)明的各實(shí)施例被描述為與存儲(chǔ)在存儲(chǔ)器和其它存儲(chǔ)介質(zhì)中的 數(shù)據(jù)相關(guān)聯(lián),但數(shù)據(jù)還可以被存儲(chǔ)在或讀取自其它類型的計(jì)算機(jī)可讀介質(zhì),
      如次級(jí)存儲(chǔ)設(shè)備,像硬盤、軟盤、或CD-ROM、來自因特網(wǎng)的載波、或其 它形式的RAM或ROM。此外,所公開的各方法的各階段可以按任何方式 來修改,包括通過對(duì)各階段重新排序和/或插入或刪除階段,而不背離本發(fā) 明。
      包括此處所包括的代碼中的版權(quán)在內(nèi)的所有權(quán)利都?xì)w屬于申請(qǐng)人并且
      是該申請(qǐng)人的財(cái)產(chǎn)。申請(qǐng)人保持并保留此處所包括的代碼中的所有權(quán)利,
      并授予僅關(guān)于所授權(quán)的專利的再現(xiàn)且未出于其它目的再現(xiàn)該材料的許可。 雖然本說明書包括各示例,但本發(fā)明的范圍由所附權(quán)利要求書來指示。
      此外,盡管用對(duì)結(jié)構(gòu)特征和/或方法邏輯動(dòng)作專用的語言描述了本說明書, 但權(quán)利要求書并不限于上述特征或動(dòng)作。相反,上述具體特征和動(dòng)作是作 為本發(fā)明的各實(shí)施例的示例來公開的。
      權(quán)利要求
      1.一種存儲(chǔ)一組指令的計(jì)算機(jī)可讀介質(zhì),所述一組指令在被執(zhí)行時(shí)執(zhí)行一種用于轉(zhuǎn)換文本的方法,所述由所述一組指令執(zhí)行的方法包括將位于電子文檔(110)中的圖像內(nèi)的第一文本轉(zhuǎn)換為字符信息(210);以及使用用戶可選擇元素(405)來選擇包括所述圖像內(nèi)的第一文本和位于所述電子文檔(110)中的第二文本的選擇文本(220)。
      2. 如權(quán)利要求1所述的計(jì)算機(jī)可讀介質(zhì),其特征在于,還包括在定點(diǎn) 設(shè)備(512)的移動(dòng)臨時(shí)地在所轉(zhuǎn)換的第一文本上方停頓時(shí),加亮所述第一 文本(230)。
      3. 如權(quán)利要求2所述的計(jì)算機(jī)可讀介質(zhì),其特征在于,在定點(diǎn)設(shè)備的 移動(dòng)臨時(shí)地在所轉(zhuǎn)換的第一文本上方停頓時(shí)加亮所轉(zhuǎn)換的第一文本包括, 在定點(diǎn)設(shè)備的移動(dòng)臨時(shí)地在所轉(zhuǎn)換的第一文本上方停頓時(shí)加亮所轉(zhuǎn)換的第 一文本,包括提供加亮的文本可選擇的指示。
      4. 如權(quán)利要求1所述的計(jì)算機(jī)可讀介質(zhì),其特征在于,在所述電子文 檔(110)中選擇所述用戶可選擇元素,包括在所述用戶可選擇元素上方點(diǎn) 擊并拖曳定點(diǎn)設(shè)備(512)。
      5. 如權(quán)利要求1所述的計(jì)算機(jī)可讀介質(zhì),其特征在于,在所述電子文 檔(110)中選擇所述用戶可選擇元素包括選擇邊界框,所述邊界框是從光 學(xué)字符識(shí)別過程返回的。
      6. —種用于轉(zhuǎn)換文本的方法,所述方法包括 接收具有圖像字符信息和圖像類型的圖像(310); 基于所述圖像類型調(diào)整所接收到的圖像的外觀(315); 在所調(diào)整的圖像上執(zhí)行光學(xué)字符識(shí)別(320),以提取包括所調(diào)整的圖像上的字符和所述字符的對(duì)應(yīng)的位置信息的字符信息;以及評(píng)估所提取的字符信息來與所述圖像字符信息相比改進(jìn)所提取的字符 信息的識(shí)別質(zhì)量(325)。
      7. 如權(quán)利要求6所述的方法,其特征在于,基于所述圖像類型調(diào)整所 接收到的圖像的外觀包括基于圖像類型來調(diào)整所接收到的圖像的外觀,所述圖像類型包括屏幕剪輯和照相機(jī)圖像中的一個(gè)。
      8. 如權(quán)利要求6所述的方法,其特征在于,基于所述圖像類型調(diào)整所接收到的圖像的外觀包括基于所述圖像類型來調(diào)整所接收到的圖像的外 觀,包括填充所接收到的圖像以在所接收到的圖像周圍創(chuàng)建邊界。
      9. 如權(quán)利要求6所述的方法,其特征在于,基于所述圖像類型調(diào)整所 接收到的圖像的外觀包括基于所述圖像類型來調(diào)整所接收到的圖像的外 觀,包括從所接收到的圖像中移除至少一個(gè)校對(duì)標(biāo)記。
      10. 如權(quán)利要求6所述的方法,其特征在于,基于所述圖像類型調(diào)整 所接收到的圖像的外觀包括基于所述圖像類型來調(diào)整所接收到的圖像的外 觀,包括基于所接收到的圖像的分辨率來調(diào)整所述外觀。
      11. 如權(quán)利要求6所述的方法,其特征在于,基于所述圖像類型調(diào)整 所接收到的圖像的外觀包括基于所述圖像類型來調(diào)整所接收到的圖像的外 觀,包括在所接收到的圖像上執(zhí)行光線調(diào)整。
      12. 如權(quán)利要求6所述的方法,其特征在于,基于所述圖像類型調(diào)整 所接收到的圖像的外觀包括基于所述圖像類型來調(diào)整所接收到的圖像的外 觀,包括基于文本比例來調(diào)整所述外觀,其中所述文本比例基于所接收到 的圖像的像素大小。
      13. 如權(quán)利要求6所述的方法,其特征在于,評(píng)估所提取的字符信息 來相比于所述圖像字符信息改進(jìn)所提取的字符信息的識(shí)別質(zhì)量(325)包括 評(píng)估所提取的字符信息來相比于所述圖像字符信息改進(jìn)所提取的字符信息 的識(shí)別質(zhì)量,包括使用所調(diào)整的圖像的環(huán)境元素來確定所調(diào)整的圖像的所 提取的字符。
      14. 如權(quán)利要求6所述的方法,其特征在于,評(píng)估所提取的字符信息 來相比于所述圖像字符信息改進(jìn)所提取的字符信息的識(shí)別質(zhì)量(325)包括 向所提取的字符分配置信度水平,所述置信度水平是準(zhǔn)確度度量。
      15. 如權(quán)利要求14所述的方法,其特征在于,向所提取的字符分配置信度水平,所述置信度水平是準(zhǔn)確度度量包括確定所提取的字符是否與 字典中的單詞相匹配。
      16. —種用于轉(zhuǎn)換文本的系統(tǒng),所述系統(tǒng)包括存儲(chǔ)器存儲(chǔ)(504、 509、 510);以及耦合到所述存儲(chǔ)器存儲(chǔ)(504、 509、 510)的處理單元(502),其中 所述處理單元可用于使用用戶可選擇元素來選擇包括電子文檔(110)中的第一文本(115) 和位于所述電子文檔(110)中的圖像內(nèi)的第二文本(125)的選擇文本(220); 以及響應(yīng)于選擇所述選擇文本,將所述圖像內(nèi)的第二文本轉(zhuǎn)換為字符信 息(210),其中可用于轉(zhuǎn)換的所述處理單元(502)還包括可用于執(zhí)行以 下動(dòng)作的所述處理單元(502):接收所述具有圖像類型的圖像(310);基于所述圖像類型調(diào)整所接收到的圖像的外觀(315);在所調(diào)整的圖像上執(zhí)行光學(xué)字符識(shí)別(320),以提取包括所調(diào) 整的圖像上的字符和所述字符的對(duì)應(yīng)的位置信息的字符信息;以及評(píng)估所提取的字符信息來與所述第二文本相比改進(jìn)所提取的字 符信息的識(shí)別質(zhì)量(325);以及將所選擇的文本粘貼到另一電子文檔中。
      17. 如權(quán)利要求16所述的系統(tǒng),其特征在于,可用于評(píng)估所提取的 字符信息來與所接收到的字符信息相比改進(jìn)所提取的字符信息的識(shí)別質(zhì)量(325)的所述處理單元(502)還包括,可用于向所提取的單詞分配置信 度水平并解釋所述置信度水平來確定所提取的單詞是否與字典單詞相匹配 的所述處理單元(502)。
      18. 如權(quán)利要求16所述的系統(tǒng),其特征在于,可用于基于所述圖像 類型調(diào)整所接收到的圖像的外觀(315)的所述處理單元(502)還包括可 用于基于所述圖像類型來調(diào)整所接收到的圖像的外觀,包括填充所接收到 的圖像以在所接收到的圖像周圍創(chuàng)建邊界的所述處理單元(502)。
      19. 如權(quán)利要求16所述的系統(tǒng),其特征在于,可用于基于所述圖像 類型調(diào)整所接收到的圖像的外觀(315)的所述處理單元(502)還包括可 用于從所接收到的圖像中移除至少一個(gè)校對(duì)標(biāo)記的所述處理單元(502)。
      20. 如權(quán)利要求16所述的系統(tǒng),其特征在于,可用于基于所述圖像類型調(diào)整所接收到的圖像的外觀(315)的所述處理單元(502)還包括可用于在所接收到的圖像上執(zhí)行光線調(diào)整的所述處理單元(502)。
      全文摘要
      可以提供轉(zhuǎn)換文本??梢允褂糜脩艨蛇x擇元素來選擇文本。所選擇的文本可包括電子文檔中的第一文本和圖像中的第二文本。通過接收?qǐng)D像,該圖像中的第二文本可被轉(zhuǎn)換為字符信息。該圖像可具有圖像字符信息和圖像類型。所接收到的圖像的外觀可以基于圖像類型來調(diào)整。可在所調(diào)整的圖像上執(zhí)行光學(xué)字符識(shí)別以提取字符信息。字符信息可包括字符和字符的對(duì)應(yīng)的位置信息??稍u(píng)估所提取的字符信息來與圖像字符信息相比改進(jìn)所提取的字符信息的識(shí)別質(zhì)量。
      文檔編號(hào)G06F17/21GK101578597SQ200880002169
      公開日2009年11月11日 申請(qǐng)日期2008年1月4日 優(yōu)先權(quán)日2007年1月15日
      發(fā)明者A·J·西蒙斯, I·考夫曼, P·貝爾, R·P·尼克洛夫, V·拉斯考克斯 申請(qǐng)人:微軟公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1