專利名稱:一種具有字幕識(shí)別和清晰化顯示功能的機(jī)頂盒的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種消費(fèi)類電子產(chǎn)品,能夠檢測(cè)、識(shí)別視頻信號(hào)中的字幕,并且進(jìn)行清晰化、放大顯示的機(jī)頂盒。
背景技術(shù):
隨著電視技術(shù)的發(fā)展,電視屏幕已從9英寸發(fā)展到17寸、29寸、32寸、40寸等,但是由于對(duì)近距離電視輻射、眼睛損傷的考慮,人們提倡在2-3米以外觀看電視。對(duì)于年老或弱視的人來說,圖象接收質(zhì)量的下降能夠接受,但是無法接受模糊的字幕,特別在屏幕相對(duì)較小、視頻節(jié)目質(zhì)量不清晰的情況。這就提出來一個(gè)功能,通過檢測(cè)并識(shí)別視頻信號(hào)中的字幕,將識(shí)別出的文字重新采用更加清晰的字體、更加鮮明的顏色和更合適的大小顯示在屏幕上,同時(shí)不影響其他部分的圖像。對(duì)于視力正常的觀眾來說,也能夠以更加舒適的方式瀏覽視頻子眷。這個(gè)功能可以依附于IPTV機(jī)頂盒上,通過網(wǎng)絡(luò)獲取到的視頻資源經(jīng)過視頻解碼后以圖片的格式保存到緩存區(qū)中,處理器運(yùn)行OCR (光學(xué)字符識(shí)別)的應(yīng)用程序周期性地對(duì)緩存中的某幀圖像指定區(qū)域進(jìn)行識(shí)別,將識(shí)別出來的文字顯示獨(dú)立到屏幕上。
發(fā)明內(nèi)容
為了能夠解決由于電視屏幕相對(duì)較小、視頻解碼質(zhì)量不好導(dǎo)致的字幕不清晰,使年老或視弱的人能夠清晰的看出字幕,使視力正常的觀眾能夠更加舒適的瀏覽字幕,需要在電視機(jī)頂盒中增加字幕識(shí)別功能,將指定區(qū)域的字幕識(shí)別后,以更加清晰的字體、更加鮮明的顏色和更合適的大小顯示在屏幕上。為實(shí)現(xiàn)上述技術(shù)目的,達(dá)到上述技術(shù)效果,本發(fā)明通過以下技術(shù)方案實(shí)現(xiàn)
一種具有字幕識(shí)別和清晰化顯示功能的機(jī)頂盒,包括配置部分及流媒體處理部分,所
述流媒體處理部分包括依次連接的網(wǎng)絡(luò)處理模塊、音視頻解碼模塊、圖像混合電視信號(hào)輸出模塊,所述音視頻解碼模塊與所述圖像混合電視信號(hào)輸出模塊之間還連接有字幕識(shí)別模塊;所述字幕識(shí)別模塊包括以下處理過程整幀圖像字幕區(qū)域獲取、圖像銳化、光學(xué)字符識(shí)另O、字幕格式化、與視頻同步顯示;所述配置部分增加了字幕識(shí)別開關(guān)功能及字幕設(shè)置格式。進(jìn)一步的,所述字幕識(shí)別模塊包括以下處理步驟
步驟I)設(shè)置定時(shí)器;
步驟2)定時(shí)器超時(shí)后進(jìn)入下一步;
步驟3)獲取視頻緩存區(qū)信息,形成一幀圖像;
步驟4)根據(jù)設(shè)置將圖像指定區(qū)域進(jìn)行緩存;
步驟5)將緩存圖像進(jìn)行銳化處理;
步驟6)進(jìn)行光學(xué)字符識(shí)別;
步驟7)根據(jù)設(shè)置形成字幕;步驟8)與視頻進(jìn)行混合顯示;
步驟9)返回步驟2。本發(fā)明的有益效果是
1、能夠?qū)θ魏涡吞?hào)的IPTV機(jī)頂盒進(jìn)行軟件功能擴(kuò)展,不需要進(jìn)行硬件調(diào)整能夠?qū)崿F(xiàn)子眷識(shí)別功能;
2、通過檢測(cè)并識(shí)別視頻信號(hào)中的字幕,將識(shí)別出的文字重新采用更加清晰的字體、更加鮮明的顏色和更合適的大小顯示在屏幕上,同時(shí)不影響其他部分的圖像,大大幫助年老或視弱的人觀看視頻,同時(shí)也讓視力正常的觀眾以更加舒適的方式瀏覽字幕。上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,并可依照說明書的內(nèi)容予以實(shí)施,以下以本發(fā)明的較佳實(shí)施例并配合附圖詳細(xì)說明如后。本發(fā)明的具體實(shí)施方式
由以下實(shí)施例及其附圖詳細(xì)給出。
此處所說明的附圖用來提供對(duì)本發(fā)明的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本發(fā)明的示意性實(shí)施例及其說明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中
圖I是本發(fā)明實(shí)現(xiàn)字幕識(shí)別和清晰化顯示功能的模塊化框 圖2是本發(fā)明中核心模塊——光學(xué)字符識(shí)別模塊的軟件實(shí)現(xiàn)流程圖。
具體實(shí)施例方式下面將參考附圖并結(jié)合實(shí)施例,來詳細(xì)說明本發(fā)明。一種支持視頻圖像處理,能夠?qū)D像指定區(qū)域的字幕進(jìn)行光學(xué)字符識(shí)別,并清晰化顯示的機(jī)頂盒,在普通IPTV機(jī)頂盒的基礎(chǔ)上,增加光學(xué)字符識(shí)別的功能,并在功能配置界面上增加能夠指定識(shí)別區(qū)域的部分,以及增加字幕重新顯示的字體,顏色,大小等的設(shè)置。IPTV機(jī)頂盒的實(shí)現(xiàn)大體框架一般分為兩個(gè)大部分,一是配置部分,二是流媒體處理部分。配置部分,需要在菜單中包含啟用和取消字幕識(shí)別功能的選項(xiàng),并且能夠在播放視頻的同時(shí),允許用戶對(duì)字幕區(qū)域進(jìn)行選擇,也可以采用自動(dòng)識(shí)別選擇的方式,同時(shí),配置中還要包含對(duì)顯示字幕的字體、顏色、大小和位置進(jìn)行設(shè)置的頁面,這里不進(jìn)行圖示??蛇x擴(kuò)展機(jī)頂盒遙控器,增加開啟/關(guān)閉字幕識(shí)別功能。流媒體處理部分的擴(kuò)展可參照?qǐng)DI所示,流媒體處理部分,一般包括網(wǎng)絡(luò)處理(流媒體接收)、音視頻解碼、圖像混合電視信號(hào)輸出(根據(jù)輸出接口,包括數(shù)字信號(hào)和模擬信號(hào))等模塊,為實(shí)現(xiàn)本發(fā)明功能,需要增加光學(xué)字符識(shí)別模塊,該模塊處于音視頻解碼模塊和圖像混合輸出模塊之間,從解碼模塊的輸出緩存中獲取圖像,進(jìn)行光學(xué)字符識(shí)別,再根據(jù)設(shè)置的方式混合如視頻圖像中顯示到屏幕。IPTV機(jī)頂盒目前的實(shí)現(xiàn)一般都基于嵌入式Iinux開發(fā)平臺(tái),設(shè)備上電啟動(dòng)時(shí),當(dāng)操作系統(tǒng)啟動(dòng)完成,主應(yīng)用程序啟動(dòng)。在初始化時(shí),主應(yīng)用程序會(huì)判斷配置參數(shù)是否表明開啟了字幕識(shí)別功能,如果是,則執(zhí)行字幕識(shí)別程序。字幕識(shí)別主進(jìn)程的主要工作是創(chuàng)建一個(gè)定時(shí)器線程,用于字幕識(shí)別,定時(shí)器時(shí)常可以根據(jù)字幕切換時(shí)間經(jīng)驗(yàn)值進(jìn)行設(shè)定,以盡量避免字幕丟失(時(shí)間過長)或者過分占用處理器資源(時(shí)間過短)。、
所述字幕識(shí)別模塊內(nèi)部的軟件實(shí)現(xiàn)流程如圖2所示,當(dāng)系統(tǒng)啟動(dòng)時(shí)(字幕識(shí)別設(shè)置為啟動(dòng))或者用戶開啟字幕識(shí)別時(shí),字幕識(shí)別程序會(huì)被執(zhí)行,字幕識(shí)別主進(jìn)程的主要工作是創(chuàng)建一個(gè)定時(shí)器線程,用于字幕識(shí)別。當(dāng)定時(shí)器超時(shí)時(shí),超時(shí)程序的設(shè)計(jì)如下
1、從視頻緩存區(qū)獲取一幀圖像,需要說明的是,為了節(jié)省視頻資源對(duì)網(wǎng)絡(luò)帶寬的消耗,根據(jù)視頻相鄰幀之間區(qū)別較少的經(jīng)驗(yàn),很多情況下會(huì)采用差分的方式傳輸視頻信息。一般的實(shí)現(xiàn)為周期性地傳送一個(gè)整幀的圖像A,在周期之間則只傳送本幀圖像與圖像A的區(qū)別部分。在這種情況,則需要做一些處理以獲取到一個(gè)整幀的圖像信息(也可以由解碼模塊完成);
2、將獲取的整幀圖像中指定獲取字幕的區(qū)域緩存起來,可以采用二維數(shù)組的方式維護(hù),供后續(xù)處理;
3、由于視頻本身質(zhì)量問題或者圖像本身對(duì)字幕的干擾,會(huì)造成光學(xué)字符識(shí)別的準(zhǔn)確率降低,所以在進(jìn)行識(shí)別之前需要銳化處理,銳化的作用就是突出字符跟周圍背景的區(qū)別,銳化的算法已經(jīng)非常成熟;
4、執(zhí)行光學(xué)字符識(shí)別,將識(shí)別得到的字符緩存起來,實(shí)現(xiàn)的算法可參考目前的開源軟件FreeOCR等,也可以采用成熟的商用軟件;
5、根據(jù)設(shè)置的字幕文字的字體、顏色、大小形成新的字幕圖像,并根據(jù)位置與視頻圖像進(jìn)行混合,顯示到屏幕。以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,對(duì)于本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種具有字幕識(shí)別和清晰化顯示功能的機(jī)頂盒,包括配置部分及流媒體處理部分,所述流媒體處理部分包括依次連接的網(wǎng)絡(luò)處理模塊、音視頻解碼模塊、圖像混合電視信號(hào)輸出模塊,其特征在于所述音視頻解碼模塊與所述圖像混合電視信號(hào)輸出模塊之間還連接有字幕識(shí)別模塊;所述字幕識(shí)別模塊包括以下處理過程整幀圖像字幕區(qū)域獲取、圖像銳化、光學(xué)字符識(shí)別、字幕格式化、與視頻同步顯示;所述配置部分增加了字幕識(shí)別開關(guān)功能及字幕設(shè)置格式。
2.根據(jù)權(quán)利要求I所述的具有字幕識(shí)別和清晰化顯示功能的機(jī)頂盒,其特征在于,所述字幕識(shí)別模塊包括以下處理步驟 步驟I)設(shè)置定時(shí)器; 步驟2)定時(shí)器超時(shí)后進(jìn)入下一步; 步驟3)獲取視頻緩存區(qū)信息,形成一幀圖像; 步驟4)根據(jù)設(shè)置將圖像指定區(qū)域進(jìn)行緩存; 步驟5)將緩存圖像進(jìn)行銳化處理; 步驟6)進(jìn)行光學(xué)字符識(shí)別; 步驟7)根據(jù)設(shè)置形成字幕; 步驟8)與視頻進(jìn)行混合顯示; 步驟9)返回步驟2。
全文摘要
本發(fā)明公開了一種具有字幕識(shí)別和清晰化顯示功能的機(jī)頂盒,包括配置部分及流媒體處理部分,所述流媒體處理部分包括依次連接的網(wǎng)絡(luò)處理模塊、音視頻解碼模塊、圖像混合電視信號(hào)輸出模塊,所述音視頻解碼模塊與所述圖像混合電視信號(hào)輸出模塊之間還連接有字幕識(shí)別模塊;所述字幕識(shí)別模塊包括以下處理過程整幀圖像字幕區(qū)域獲取、圖像銳化、光學(xué)字符識(shí)別、字幕格式化、與視頻同步顯示;所述配置部分增加了字幕識(shí)別開關(guān)功能及字幕設(shè)置格式。本發(fā)明能夠?qū)θ魏涡吞?hào)的IPTV機(jī)頂盒進(jìn)行軟件功能擴(kuò)展,不需要進(jìn)行硬件調(diào)整能夠?qū)崿F(xiàn)字幕識(shí)別功能。
文檔編號(hào)H04N21/431GK102625181SQ201210072388
公開日2012年8月1日 申請(qǐng)日期2012年3月19日 優(yōu)先權(quán)日2012年3月19日
發(fā)明者王曉蘭 申請(qǐng)人:蘇州經(jīng)貿(mào)職業(yè)技術(shù)學(xué)院