国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種視頻圖像文字的檢測(cè)方法和裝置的制造方法

      文檔序號(hào):8445868閱讀:391來(lái)源:國(guó)知局
      一種視頻圖像文字的檢測(cè)方法和裝置的制造方法
      【技術(shù)領(lǐng)域】
      [0001] 本發(fā)明涉及視頻文字處理技術(shù)領(lǐng)域,特別是涉及一種視頻圖像文字的檢測(cè)方法和 裝置。
      【背景技術(shù)】
      [0002] 隨著數(shù)字化網(wǎng)絡(luò)化的發(fā)展,數(shù)字圖像和視頻越來(lái)越多,圖片或視頻中的文字能夠 提供直接的高層語(yǔ)義信息,因此開(kāi)發(fā)視頻圖像文字的檢測(cè)技術(shù),有助于對(duì)視頻圖像進(jìn)行理 解和管理。
      [0003] 現(xiàn)有的光學(xué)字符識(shí)別技術(shù)(OpticalCharacterRecognition,OCR)主要針對(duì)的 是圖像,尤其是照片中文字的檢測(cè),并且對(duì)圖像預(yù)處理效果較為敏感。若想獲得較好的文字 識(shí)別效果,必須通過(guò)圖像處理技術(shù),將文字與背景清晰的分割出來(lái)。然而,對(duì)于視頻文字檢 測(cè),由于背景較為復(fù)雜,視頻壓縮造成的畫質(zhì)損失,以及為了視覺(jué)效果在視頻文字的邊緣加 入陰影等處理,使得通用的文字檢測(cè)技術(shù)如OCR,很難取得滿意的檢測(cè)效果。
      [0004] 此外,還有一個(gè)比較重要的影響因素是光照變化,因此必須考慮文字顏色的變化 問(wèn)題。而視頻文字一般為后期添加,雖然背景比較復(fù)雜,但是文字顏色比較均一,因此,若使 用針對(duì)圖像的檢測(cè)方法,由于考慮了不必要的因素,會(huì)導(dǎo)致檢測(cè)精度有所降低。

      【發(fā)明內(nèi)容】

      [0005] 本發(fā)明實(shí)施例所要解決的技術(shù)問(wèn)題是提供一種視頻圖像文字的檢測(cè)方法和裝置, 能夠提高視頻圖像文字檢測(cè)的效果。
      [0006] 為了解決上述問(wèn)題,本發(fā)明公開(kāi)了一種視頻圖像文字的檢測(cè)方法,包括:
      [0007] 對(duì)視頻圖像進(jìn)行文字檢測(cè),確定所述視頻圖像的文本區(qū)域;
      [0008] 利用所述視頻圖像的顏色信息對(duì)所述視頻圖像的文本區(qū)域進(jìn)行文字和背景分割, 得到二值化文字圖像;
      [0009] 對(duì)所述二值化文字圖像進(jìn)行過(guò)濾處理,得到過(guò)濾后的文字圖像。
      [0010] 優(yōu)選地,所述確定所述視頻圖像的文本區(qū)域之后,還包括:
      [0011] 對(duì)所述視頻圖像的文本區(qū)域進(jìn)行侵蝕處理,得到侵蝕后的文本區(qū)域。
      [0012] 優(yōu)選地,所述利用所述視頻圖像的顏色信息對(duì)所述視頻圖像的文本區(qū)域進(jìn)行文字 和背景分割,得到二值化文字圖像的步驟,包括:
      [0013] 確定所述視頻圖像文字對(duì)應(yīng)的三通道中心像素值;
      [0014] 判斷所述文本區(qū)域中每個(gè)像素點(diǎn)與所述中心像素值是否符合預(yù)置條件,若符合, 則確定當(dāng)前像素點(diǎn)為文字;若不符合,則確定當(dāng)前像素點(diǎn)為背景。
      [0015] 優(yōu)選地,所述確定所述視頻圖像文字對(duì)應(yīng)的三通道中心像素值的步驟,包括:
      [0016] 利用所述文本區(qū)域作為掩板,從所述視頻圖像中過(guò)濾掉背景,得到文字;
      [0017] 提取所述文字的三通道像素值;
      [0018] 對(duì)每個(gè)通道提取的像素值進(jìn)行排序,并依據(jù)排序結(jié)果確定中位數(shù)為所述文字對(duì)應(yīng) 的三通道中心像素值。
      [0019] 優(yōu)選地,所述對(duì)所述二值化文字圖像進(jìn)行過(guò)濾處理,得到過(guò)濾后的文字圖像的步 驟,包括:
      [0020] 依據(jù)對(duì)所述文本區(qū)域分割出的文字,獲取所述文字的筆畫寬度信息以及所述文字 的寬度信息;
      [0021] 依據(jù)所述文字的筆畫寬度信息和所述文字的寬度信息,對(duì)所述文本區(qū)域的文字進(jìn) 行切割緊縮處理;
      [0022] 對(duì)所述切割緊縮處理后的文本區(qū)域進(jìn)行去噪處理,得到過(guò)濾后的文字圖像。
      [0023] 優(yōu)選地,所述得到過(guò)濾后的文字圖像之后,還包括:
      [0024] 利用所述過(guò)濾后的文字圖像作為掩板,從所述視頻圖像中獲取文字顏色信息,得 到彩色文字圖像。
      [0025] 優(yōu)選地,所述對(duì)視頻圖像進(jìn)行文字檢測(cè),確定所述視頻圖像的文本區(qū)域的步驟,包 括:
      [0026] 利用筆畫寬度變換的檢測(cè)方法對(duì)所述視頻圖像進(jìn)行文字檢測(cè),確定所述視頻圖 像的文本區(qū)域。
      [0027] 依據(jù)本發(fā)明的另一個(gè)方面,提供了一種視頻圖像文字的檢測(cè)裝置,包括:
      [0028] 檢測(cè)模塊,用于對(duì)視頻圖像進(jìn)行文字檢測(cè),確定所述視頻圖像的文本區(qū)域;
      [0029] 分割模塊,用于利用所述視頻圖像的顏色信息對(duì)所述視頻圖像的文本區(qū)域進(jìn)行文 字和背景分割,得到二值化文字圖像;
      [0030] 過(guò)濾模塊,用于對(duì)所述二值化文字圖像進(jìn)行過(guò)濾處理,得到過(guò)濾后的文字圖像。
      [0031] 優(yōu)選地,所述裝置還包括:
      [0032] 侵蝕模塊,用于對(duì)所述視頻圖像的文本區(qū)域進(jìn)行侵蝕處理,得到侵蝕后的文本區(qū) 域。
      [0033] 優(yōu)選地,所述分割模塊,具體包括:
      [0034] 中心確定子模塊,用于確定所述視頻圖像文字對(duì)應(yīng)的三通道中心像素值;
      [0035] 判斷子模塊,用于判斷所述文本區(qū)域中每個(gè)像素點(diǎn)與所述中心像素值是否符合預(yù) 置條件,若符合,則確定當(dāng)前像素點(diǎn)為文字;若不符合,則確定當(dāng)前像素點(diǎn)為背景。
      [0036] 優(yōu)選地,所述中心確定子模塊,具體包括:
      [0037] 背景過(guò)濾單元,用于利用所述文本區(qū)域作為掩板,從所述視頻圖像中過(guò)濾掉背景, 得到文字;
      [0038] 提取單元,用于提取所述文字的三通道像素值;
      [0039] 中心確定單元,用于對(duì)每個(gè)通道提取的像素值進(jìn)行排序,并依據(jù)排序結(jié)果確定中 位數(shù)為所述文字對(duì)應(yīng)的三通道中心像素值。
      [0040] 優(yōu)選地,所述過(guò)濾模塊,具體包括:
      [0041] 文字信息獲取子模塊,用于依據(jù)對(duì)所述文本區(qū)域分割出的文字,獲取所述文字的 筆畫寬度信息以及所述文字的寬度信息;
      [0042] 切割緊縮子模塊,用于依據(jù)所述文字的筆畫寬度信息和所述文字的寬度信息,對(duì) 所述文本區(qū)域的文字進(jìn)行切割緊縮處理;
      [0043] 去噪子模塊,用于對(duì)所述切割緊縮處理后的文本區(qū)域進(jìn)行去噪處理,得到過(guò)濾后 的文字圖像。
      [0044] 優(yōu)選地,所述裝置還包括:
      [0045] 顏色獲取模塊,用于利用所述過(guò)濾后的文字圖像作為掩板,從所述視頻圖像中獲 取文字顏色信息,得到彩色文字圖像。
      [0046] 優(yōu)選地,所述檢測(cè)模塊,具體包括:
      [0047] 檢測(cè)子模塊,用于利用筆畫寬度變換的檢測(cè)方法對(duì)所述視頻圖像進(jìn)行文字檢測(cè), 確定所述視頻圖像的文本區(qū)域。
      [0048] 與現(xiàn)有技術(shù)相比,本發(fā)明實(shí)施例包括以下優(yōu)點(diǎn):
      [0049] 本發(fā)明實(shí)施例首先對(duì)視頻圖像進(jìn)行文字檢測(cè),確定文本區(qū)域,然后利用顏色信息 對(duì)文本區(qū)域的文字和背景進(jìn)行分割,得到二值化文字圖像,最后對(duì)二值化文字圖像進(jìn)行過(guò) 濾得到去除噪點(diǎn)的文字圖像。由于視頻圖像文字具有背景復(fù)雜、文字顏色均一的特點(diǎn),而本 發(fā)明實(shí)施例在對(duì)視頻圖像進(jìn)行文字檢測(cè)之后,再利用顏色信息進(jìn)行圖像分割,可以進(jìn)一步 地區(qū)分文字和復(fù)雜的背景,避免單獨(dú)利用針對(duì)圖像的邊緣檢測(cè)方法如OCR導(dǎo)致檢測(cè)效果較 差的問(wèn)題;此外,由于視頻文字顏色均一,利用顏色信息進(jìn)行圖像分割,還可以避免光照變 化對(duì)于檢測(cè)效果的影響,從而可以提高視頻圖像文字檢測(cè)的效果。
      【附圖說(shuō)明】
      [0050] 圖1示出了本發(fā)明的一種視頻圖像文字的檢測(cè)方法實(shí)施例的步驟流程圖;
      [0051] 圖2示出了兩幅視頻圖像的局部圖像示意圖;
      [0052] 圖3示出了應(yīng)用SWT算法對(duì)圖2中的視頻圖像進(jìn)行文字檢測(cè)的結(jié)果示意圖;
      [0053] 圖4示出了本發(fā)明的一種基于顏色信息進(jìn)行圖像分割后得到的二值化文字圖像 示意圖;
      [0054] 圖5示出了本發(fā)明的一種對(duì)ROI侵蝕處理后的結(jié)果示意圖;
      [0055] 圖6示出了本發(fā)明利用所述視頻圖像的顏色信息對(duì)所述視頻圖像的文本區(qū)域進(jìn) 行文字和背景分割,得到二值化文字圖像的步驟流程圖;
      [0056] 圖7示出了本發(fā)明對(duì)二值化文字圖像進(jìn)行過(guò)濾處理,得到過(guò)濾后的文字圖像的步 驟流程圖;
      [0057] 圖8示出了本發(fā)明的一種獲取文字筆畫寬度的示意圖;
      [0058] 圖9示出了本發(fā)明的一種文字垂直方向灰度投影的結(jié)果示意圖;
      [0059] 圖10示出了本發(fā)明的一種文字水平方向灰度投影的結(jié)果示意圖;
      [0060] 圖11示出了本發(fā)明的一種切割粘連文字的結(jié)果示意圖;
      [0061] 圖12示出了本發(fā)明對(duì)二值化文字圖像去除噪音后的結(jié)果示意圖;
      [0062] 圖13示出了本發(fā)明的一種視頻圖像文字的檢測(cè)方法系統(tǒng)流程圖;
      [0063] 圖14示出了圖13對(duì)應(yīng)的檢測(cè)方法步驟流程圖;及
      [0064] 圖15示出了本發(fā)明一種視頻圖像文字的檢測(cè)裝置的結(jié)構(gòu)框圖。
      【具體實(shí)施方式】
      [0065] 為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí) 施方式對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說(shuō)明。
      [0066] 實(shí)施例一
      [0067] 參照?qǐng)D1,示出了本發(fā)明的一種視頻圖像文字的檢測(cè)方法實(shí)施例的步驟流程圖,具 體可以包括:
      [0068] 步驟101、對(duì)視頻圖像進(jìn)行文字檢測(cè),確定所述視頻圖像的文本區(qū)域;
      [0069] 本發(fā)明實(shí)施例可以應(yīng)用于公司新聞拆分系統(tǒng)等各種應(yīng)用場(chǎng)景中,用于提高應(yīng)用場(chǎng) 景中視頻圖像文字檢測(cè)的效果。例如,在應(yīng)用于公司新聞拆分系統(tǒng)時(shí),一方面,由于標(biāo)題一 般出現(xiàn)在相關(guān)新聞段落的開(kāi)頭,所以可以采用本發(fā)明實(shí)施例識(shí)別出每個(gè)新聞段落的標(biāo)題, 從而可以分割開(kāi)各標(biāo)題對(duì)應(yīng)的新聞段落;另一方面,文字檢測(cè)結(jié)果還可以作為分割出來(lái)的 新聞段落的標(biāo)題,因此,本發(fā)明實(shí)施例能夠減輕編輯手工輸入新聞標(biāo)題的工作量。
      [0070] 在具體實(shí)現(xiàn)中,對(duì)視頻圖像進(jìn)行文字檢測(cè)的算法很多,比如基于梯度、基于能量或 基于學(xué)習(xí)模型的文字檢測(cè)算法等。但是有的算法速度較慢,比如基于能量的算法,有的算 法的檢測(cè)精度不能滿足要求,有的算法需要大量樣本,如學(xué)習(xí)模型的文字檢測(cè)算法,在綜 合考慮了各個(gè)算法的效果和效率后,本發(fā)明實(shí)施例優(yōu)選采用筆畫寬度變換(strokeWidth TranSf〇rm,SWT)的算法對(duì)視頻圖像進(jìn)行文字檢測(cè)。當(dāng)然,本領(lǐng)域技術(shù)人員可以靈活選擇文 字檢測(cè)算法,本發(fā)明對(duì)文字檢測(cè)的具體算法不加以限制。
      [0071] SWT算法是一種通用的效果較好的文字檢測(cè)算法,一般情況下,應(yīng)用該算法能夠很 好的找到視頻圖像中文字所在的位置,本發(fā)明實(shí)施例利用其檢測(cè)文字,作為進(jìn)一步圖像分 割的基礎(chǔ)。參照?qǐng)D2,示出了兩幅視頻圖像的局部圖像示意圖,以及參照?qǐng)D3,示出了應(yīng)用 SWT算法對(duì)圖2中的視頻圖像進(jìn)行文字檢測(cè)的結(jié)果示意圖,從圖3中可以看出,SWT算法可 以初步檢測(cè)出文字的大體輪廓,但是單獨(dú)使用SWT算法等基于邊緣的檢測(cè)方法,視頻圖像 的文字檢測(cè)效果較差,例如圖3中的文字還有部分殘缺
      當(dāng)前第1頁(yè)1 2 
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1