国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      圖像中信息提取的方法及裝置的制造方法_2

      文檔序號(hào):9217569閱讀:來源:國知局
      進(jìn)一步說明。
      【具體實(shí)施方式】
      [0056]應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
      [0057]本發(fā)明涉及對(duì)紙質(zhì)材料類醫(yī)學(xué)信息(以處方單為例)的識(shí)別過程和對(duì)識(shí)別后的醫(yī)學(xué)信息的準(zhǔn)確性的判定過程。其中,對(duì)醫(yī)學(xué)信息的識(shí)別過程涉及魯棒的行分割和列分割,可提高對(duì)醫(yī)學(xué)信息的識(shí)別精度和對(duì)醫(yī)學(xué)信息內(nèi)容準(zhǔn)確性的判定精度。
      [0058]本發(fā)明提供一種圖像中信息提取的方法,參照?qǐng)D1和圖9至圖13,圖1為本發(fā)明圖像中信息提取的方法第一實(shí)施例的流程示意圖;圖9為本發(fā)明未處理的處方單圖像;圖10為本發(fā)明處方單圖像經(jīng)過光照處理后的圖像;圖11為本發(fā)明處方單圖像經(jīng)過二值化處理后的圖像;圖12為本發(fā)明處方單圖像的病患信息經(jīng)過行列切割后的圖像;圖13為本發(fā)明處方單圖像的處方信息經(jīng)過二重行列切割后的圖像。
      [0059]在一實(shí)施例中,圖像中信息提取的方法包括以下步驟:
      [0060]S10:獲取源圖像內(nèi)的信息區(qū)域的位置,對(duì)每個(gè)信息區(qū)域的源圖像進(jìn)行獨(dú)立的二值化操作并生成信息區(qū)域預(yù)處理圖像;
      [0061]Sll:對(duì)源圖像進(jìn)行區(qū)域識(shí)別以獲取信息區(qū)域的位置;
      [0062]S12:對(duì)信息區(qū)域的源圖像進(jìn)行圖像旋轉(zhuǎn)以使源圖像位于預(yù)設(shè)的位置;
      [0063]S13:對(duì)預(yù)設(shè)位置的源圖像進(jìn)行二值化操作;
      [0064]S14:根據(jù)二值化操作的結(jié)果生成信息區(qū)域的預(yù)處理圖像。
      [0065]本實(shí)施例中,圖像為處方單圖像,獲取圖像的方法有很多,以掃描獲取為例,本實(shí)施例中,圖像以處方單圖像為例。對(duì)獲取的圖像進(jìn)行區(qū)域識(shí)別,具體為,先對(duì)圖像進(jìn)行光照處理,通常光照處理采用光照歸一化方法,光照歸一化是將原始圖像的灰度分布平均化的一種操作,通常采用一種將非均勻化轉(zhuǎn)化為均勻化的變換,例如累積概率分布變換。再采用邊緣檢測(cè)方法,有效識(shí)別出處方單的邊緣。即對(duì)光照處理后的圖像進(jìn)行圖像膨脹處理,從而獲得處方單圖像的區(qū)域特征,即對(duì)處方單的信息進(jìn)行分區(qū)或區(qū)域識(shí)別,確定圖像的哪些區(qū)域有需要提取的字符信息。分區(qū)或區(qū)域識(shí)別的準(zhǔn)確性是為了更好地二值化。
      [0066]在對(duì)源圖像進(jìn)行二值化操作之前,還需要將源圖像放置到預(yù)設(shè)的位置上。S卩,當(dāng)源圖像的位置不正確時(shí),需要經(jīng)過旋轉(zhuǎn)、偏移等操作,將源圖像調(diào)整至預(yù)設(shè)的位置上。在對(duì)源圖像進(jìn)行二值化操作的過程中,源圖像在不同的位置,將得到不同的二值化結(jié)果,其中預(yù)設(shè)位置為二值化效果最好的位置。例如,以字符的水平性或垂直性為度量,當(dāng)源圖像中同一行的字符的中心線與水平方向的夾角最小為O時(shí),即是最好的位置,但是當(dāng)源圖像存在透視等拍攝效果時(shí),并不能保證所有行都能旋轉(zhuǎn)到最好的位置。
      [0067]需要說明的是,光照及旋轉(zhuǎn)處理并不是必須的操作,在處理光照條件均勻,沒有旋轉(zhuǎn)的圖像時(shí),可不進(jìn)行光照歸一化和選擇處理。
      [0068]一幅圖像包括目標(biāo)信息、背景還有噪聲,要從多值的數(shù)字圖像中直接提取出目標(biāo)信息,最常用的方法就是設(shè)定一個(gè)全局的閾值T,用T將圖像的數(shù)據(jù)分成兩部分:大于T的像素群和小于T的像素群。將大于T的像素群的像素值設(shè)定為白色(或者黑色),小于T的像素群的像素值設(shè)定為黑色(或者白色)。在區(qū)域識(shí)別后對(duì)圖像進(jìn)行二值化,二值化就是將圖像上的像素點(diǎn)的灰度值設(shè)置為O或255,也就是將整個(gè)圖像呈現(xiàn)出明顯的只有黑和白的視覺效果。以生成預(yù)處理圖像。在二值化操作過程中,為了使二值化效果更加明顯,可設(shè)置多個(gè)灰度臨界值,即灰度門限。通過為每個(gè)區(qū)域圖像設(shè)置一種圖像灰度門限,可使區(qū)域圖像的二值化操作的效果更好,更準(zhǔn)確。
      [0069]S20:對(duì)預(yù)處理圖像進(jìn)行格式特征分析以獲取預(yù)處理圖像的關(guān)鍵分割點(diǎn);
      [0070]對(duì)預(yù)處理圖像進(jìn)行格式特征分析是為了獲取關(guān)鍵分割點(diǎn),對(duì)于一份處方單圖像來說,其格式特征包括醫(yī)院名稱、醫(yī)院地址、二維碼、信息區(qū)域的位置、處方單的圖像上的特征圖型等特征中的一個(gè)或多個(gè)。如果根據(jù)上述格式特征可確定處方單圖像的模板,則根據(jù)處方單圖形的模板確定關(guān)鍵分割點(diǎn),其中,確定處方單是否存在模板的方法可以為從預(yù)設(shè)的模板庫中查找符合上述格式特征的模板;
      [0071]如果根據(jù)上述格式特征不能確定處方單的模板或者沒有獲取格式特征時(shí),則對(duì)預(yù)處理圖像進(jìn)行自動(dòng)檢測(cè),以獲取關(guān)鍵分割點(diǎn)。
      [0072]S30:根據(jù)關(guān)鍵分割點(diǎn)對(duì)信息區(qū)域進(jìn)行二重字符行列分割以獲取信息區(qū)域內(nèi)源字符的區(qū)域;
      [0073]根據(jù)關(guān)鍵分割點(diǎn)對(duì)信息區(qū)域進(jìn)行一次字符行列分割,一次字符行列分割指對(duì)信息區(qū)域預(yù)處理圖像的能量在行列兩個(gè)方向進(jìn)行投影,并根據(jù)能量強(qiáng)度對(duì)字符進(jìn)行行列分割得到源字符的一次分割信息,一次分割信息包括源字符的初始區(qū)域,初始區(qū)域包括一次分割后得到的源字符的初始行寬、初始列寬,以及源字符的初始位置;此處的初始區(qū)域不限定為矩形區(qū)域,也可以為根據(jù)具體字符的形狀而形成的區(qū)域,如“小”字,可形成菱形的區(qū)域,如此分割可減少提取字符信息的工作量;
      [0074]根據(jù)一次分割信息對(duì)信息區(qū)域進(jìn)行二次字符行列分割,二次行列分割是指根據(jù)一次分割信息對(duì)行列分割的可靠性進(jìn)行檢查和調(diào)整,得到二次分割信息,二次分割信息為源字符的目標(biāo)區(qū)域,即二次分割后得到源字符的目標(biāo)行寬、目標(biāo)列寬以及目標(biāo)位置,這是源字符的最終區(qū)域信息,可以用于提取每個(gè)源字符的圖像信息,即圖像中的字符信息。
      [0075]本實(shí)施例中信息區(qū)域包括病患信息區(qū)域、處方信息區(qū)域、醫(yī)院信息區(qū)域、醫(yī)生信息區(qū)域等中的一個(gè)或多個(gè)。關(guān)鍵分割點(diǎn)為不同源字符區(qū)域之間的分界標(biāo)識(shí),可以為分界線。
      [0076]在確定信息區(qū)域后,對(duì)每一信息區(qū)域進(jìn)行字符分割,以確定各信息區(qū)域內(nèi)每一源字符的位置。字符分割包括行分割和列分割。
      [0077]其中,行分割包括:行預(yù)分割、行分割檢查、行分割調(diào)整。即,對(duì)信息區(qū)域根據(jù)字符行進(jìn)行預(yù)分割,再對(duì)預(yù)分割后的預(yù)分割行進(jìn)行行分割檢查,當(dāng)檢查判定行預(yù)分割有誤(例如將某些上下結(jié)構(gòu)的字符分成兩個(gè)字符)時(shí),則對(duì)預(yù)分割行進(jìn)行調(diào)整,以使每一行的分割無誤;
      [0078]列分割包括:列預(yù)分割、列分割檢查、列分割調(diào)整。即,對(duì)對(duì)信息區(qū)域根據(jù)字符列進(jìn)列預(yù)分割,再對(duì)預(yù)分割后的預(yù)分割列進(jìn)行列分割檢查,當(dāng)檢查判定列預(yù)分割有誤(例如將某些左右結(jié)構(gòu)的字符分割成兩個(gè)字符)時(shí),則對(duì)預(yù)分割列進(jìn)行調(diào)整,以使每一列的分割無誤。
      [0079]根據(jù)一次分割信息對(duì)信息區(qū)域進(jìn)行二次字符行列分割,二次行列分割是指根據(jù)一次分割信息對(duì)行列分割的可靠性進(jìn)行行列分割檢查和行列分割調(diào)整,得到二次分割信息,二次分割信息為源字符的目標(biāo)區(qū)域。二重行列分割可提高字符行列識(shí)別準(zhǔn)確性。當(dāng)行列清晰且沒有特殊干擾圖案或字符影響時(shí),通常采用一重行列切割就能夠正確識(shí)別行列信息。例如,醫(yī)院信息,醫(yī)院名稱是單獨(dú)一行,經(jīng)過一重行列切割后能夠準(zhǔn)確判斷每個(gè)字符的位置。但是處方信息區(qū)域一般存在多種形式,各家醫(yī)院不盡相同,以本實(shí)施例中的為例,如果通過常規(guī)的一重行列分割,前三種藥物由于大括號(hào)的影響,在某些光照和圖片質(zhì)量的情況下會(huì)被分析成一行,基于其他已經(jīng)識(shí)別的標(biāo)準(zhǔn)行寬的信息,本發(fā)明采用第二次行列切割,從而有效的識(shí)別出各個(gè)有效行和有效列。
      [0080]在對(duì)信息區(qū)域進(jìn)行行分割和列分割后,每一源字符的行寬、列寬以及位置被確定,即每一源字符所占目標(biāo)區(qū)域也被確定。
      [0081]S40:從源字符的目標(biāo)區(qū)域提取字符信息,并從預(yù)設(shè)的字符庫內(nèi)獲取與字符信息相關(guān)度最大的目標(biāo)字符;
      [0082]S50:將目標(biāo)字符存儲(chǔ)至預(yù)設(shè)的位置。
      [0083]在確定每一源字符所在的位置后,提取源字符的字符信息,利用字符信息從預(yù)設(shè)的字符庫中查找與該字符信息相關(guān)的字符,并將與該字符信息相關(guān)度最高的字符確定為目標(biāo)字符,并將目標(biāo)字符存貯至預(yù)設(shè)的文字,在獲取每一信息區(qū)域所有源字符的目標(biāo)字符同時(shí),將目標(biāo)字符按照源字符的順序排列,形成與每一信息區(qū)域?qū)?yīng)的電子化信息區(qū)域,電子化信息區(qū)域內(nèi)的每一字符都可供用戶查詢。
      [0084]本實(shí)施例中,通過先對(duì)獲取的圖像進(jìn)行區(qū)域識(shí)別和二值化生成預(yù)處理圖像,再對(duì)預(yù)處理圖像進(jìn)行格式特征分析以獲取預(yù)處理圖片的關(guān)鍵分割點(diǎn),然后根據(jù)關(guān)鍵分割點(diǎn)對(duì)信息區(qū)域進(jìn)行字符分割以獲取信息區(qū)域內(nèi)每一源字符的位置,然后提取源字符的字
      當(dāng)前第2頁1 2 3 4 5 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1