臺標識別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計算機軟件領(lǐng)域,尤其涉及圖像識別技術(shù)領(lǐng)域,具體是指一種臺標識 別方法。
【背景技術(shù)】
[0002] 臺標即用來表示電視臺或電視頻道的專用標識,其是媒介形象的濃縮和集中表 現(xiàn),是媒介目標、媒介哲學、媒介精神等的凝聚和載體。同時也是實現(xiàn)視頻分析、檢索的重要 語義源之一。
[0003] 隨著電視技術(shù)的飛速發(fā)展,當前,我國整個電視系統(tǒng)變得越來越龐大和復雜,各級 電視臺的節(jié)目已經(jīng)多達幾百套,然而一些非法電視信號從未放棄過試圖滲透到正常電視頻 道,可見對視頻信號進行監(jiān)測是非常必要的。如何有效的對視頻信號進行監(jiān)測呢,臺標識別 技術(shù)應運而生,并被廣泛應用于視頻圖像分析、檢索領(lǐng)域。
[0004] 臺標識別主要包括2個方面的內(nèi)容:臺標提取和臺標識別。臺標提取和識別目前主 要存在四方面的難點:1)電視視頻背景情況復雜,有人工合成的不動背景、有光線變化強的 背景、有內(nèi)容變換快的背景,使得對臺標進行有效的提取變得異常困難;2)部分臺標呈現(xiàn)半 透明性,如cctv系列,容易受背景干擾,自身固有特征受到破壞,對臺標的檢測和識別均帶 來困難;3)相似臺標太多,如cctv系列以及很多省市地方臺系列;4)針對不同分辨率的視 頻,臺標不是按比例進行縮放的,而且臺標在和節(jié)目畫面融合時往往也會輕微形變。臺標是 一種藝術(shù)性的設計,其特征無規(guī)矩可循,很難找到一種可以唯一區(qū)分臺標的特征,這給臺標 識別帶來很大的挑戰(zhàn)。
[0005] 臺標提取指從組播的視頻流中把幀圖像感興趣的臺標從背景中提取出來。臺標提 取是整個臺標識別中基礎又關(guān)鍵的一步,臺標提取結(jié)果直接影響甚至決定臺標識別的好 壞。視頻流本質(zhì)上是時空多維的隨機過程,而臺標的顯著特征是具有一定的時空不變性。目 前國內(nèi)主要的關(guān)于臺標提取的方法均基于臺標的這一特征。如專利CN 102436575A"一種臺 標的自動檢測和分類方法"提出的基于視頻流作幀間差方法,該方法對于半透明臺標識別 效果不理想。專利CN 103714314A "一種結(jié)合邊緣和顏色信息的電視視頻臺標識別方法"提 出基于邊緣檢測的疊加求平均方法,該方法雖然一定程度上可以解決臺標半透明情況,但 是對于視頻流畫面上邊沿出現(xiàn)固定寬度黑邊和畫面中存在懸浮不變的小廣告的情況是無 法很好提取臺標的。而且這些方法針對視頻流的臺標提取并未從本質(zhì)上闡述臺標提取何時 收斂以及是否收斂問題。
[0006] 臺標識別即根據(jù)臺標圖像的特征得到最終識別結(jié)果的過程。目前臺標識別主要被 作為分類問題和檢索問題兩大類。將臺標識別認為是一個檢索匹配問題,相較分類問題而 言,無需事先訓練η個分類器,并且可以動態(tài)增刪臺標庫,不僅簡化問題,而且減少了人工干 預。目前臺標特征提取主要都是采用Hu不變矩、顏色直方圖、以及局部特征描述子(Sift、 311"、!106)。專利0~ 10406370^"基于31]1^詞匯樹和模板匹配的快速電視臺臺標識別系統(tǒng) 及其實現(xiàn)方法"提出了結(jié)合surf算子和模板匹配的兩級臺標識別方法。對于待檢索的臺標 圖片,首先通過surf詞匯樹模塊找出相似臺標,然后將待檢索圖片與相似臺標集進行模板 匹配,得分最高的即為最后結(jié)果。專利CN 103473551A "基于SIFT算子的臺標識別方法及系 統(tǒng)"提出了通過將標準臺標圖和待識別臺標圖都劃分為歸屬塊和決定塊兩個區(qū)域,然后分 別對歸屬塊和決定塊進行sift匹配,獲得最終的識別結(jié)果。該算法獲得了較好的實驗結(jié)果。 但是由于臺標圖像受光線影響,部分臺標的匹配sift點數(shù)很少,達不到閾值,同時,與視頻 流進行融合的臺標一般均有輕微的形變,單純的模板匹配會失效。為了進一步提高識別的 準確率。
【發(fā)明內(nèi)容】
[0007] 本發(fā)明的目的是克服了上述現(xiàn)有技術(shù)的缺點,提供了一種解決了半透明臺標無法 有效提取臺標圖像,提取的臺標圖像背景不干凈、存在噪點,以及對及其相似的地方臺標無 法有效區(qū)分識別等問題的臺標識別方法。
[0008] 為了實現(xiàn)上述目的,本發(fā)明的臺標識別方法具有如下構(gòu)成:
[0009] 該臺標識別方法,其主要特點是,所述的方法包括以下步驟:
[0010] (1)系統(tǒng)接收外部視頻流;
[0011] (2)所述的系統(tǒng)基于視頻的概率統(tǒng)計特征并集合臺標區(qū)域的時空不變性從所述的 視頻流中提取臺標圖片;
[0012] (3)所述的系統(tǒng)基于sift特征以及模板匹配識別臺標圖片中的臺標后并輸出識別 結(jié)果。
[0013] 進一步地,所述的步驟(2)具體為:
[0014] 所述的系統(tǒng)根據(jù)所述的視頻流每個位置上的像素值的統(tǒng)計分布特征提取臺標圖 片。
[0015] 進一步地,所述的步驟(3)具體包括以下步驟:
[0016] (3.1)提取所述的臺標圖片的sift特征,并與臺標庫中存儲的臺標進行匹配;
[0017] (3.2)如果匹配的可信度大于第一閾值,則輸出識別結(jié)果;
[0018] (3.3)如果匹配的可信度小于等于第一閾值,則選取匹配的可信度較大的前N個臺 標作為候選臺標集;
[0019] (3.4)所述的系統(tǒng)基于模板匹配將所述的臺標圖片與所述的候選臺標集中的臺標 進行匹配;
[0020] (3.5)如果匹配成功,則輸出識別結(jié)果;
[0021] (3.6)如果匹配失敗,則輸出無相關(guān)臺標的結(jié)果。
[0022] 更進一步地,所述的步驟(3.4)具體包括以下步驟:
[0023] (3.4.1)根據(jù)顏色特征從所述的候選臺標集中刪除顏色不匹配的臺標,并計算所 述的候選臺標集中其它臺標的sif t特征與提取的臺標圖片中臺標的sif t特征的仿射變換 矩陣,其將其歸一化;
[0024] (3.4.2)計算歸一化后該提取的臺標圖片中的臺標的空間分布特征,并與所述的 候選臺標集中的臺標進行匹配;
[0025] (3.4.3)如果空間分布特征匹配的可信度大于第二閾值,則返回匹配成功的結(jié)果;
[0026] (3.4.4)如果匹配的可信度小于等于第二閾值,則將歸一化的提取的臺標圖片中 臺標與所述的候選臺標集中的臺標的臺標圖案塊、臺標頻道名稱塊以及臺標頻道號塊進行 匹配;
[0027] (3.4.5)如果臺標圖案塊、臺標頻道名稱塊以及臺標頻道號塊匹配的可信度均大 于第三閾值,則返回匹配成功的結(jié)果;
[0028] (3.4.6)如果臺標圖案塊、臺標頻道名稱塊以及臺標頻道號塊其中某塊的可信度 小于第四閾值,則返回匹配失敗的結(jié)果;
[0029] (3.4.7)如果臺標圖案塊、臺標頻道名稱塊以及臺標頻道號塊其中某塊的可信度 大于等于第四閾值且小于等于第三閾值,則所述的系統(tǒng)提示將該臺標加入臺標庫中。
[0030] 更進一步地,所述的步驟(1)之前還包括以下步驟:
[0031] (0)收集標準臺標圖片形成臺標庫。
[0032] 采用了該發(fā)明中的臺標識別方法,與現(xiàn)有技術(shù)相比,具有以下有益的技術(shù)效果:
[0033] (1)通過基于概率分布特征的臺標提取方法,針對絕大部分視頻均可獲得完整干 凈的臺標圖片,有助于提升臺標識別系統(tǒng)整體的識別率,通過實驗結(jié)果,發(fā)現(xiàn)提取的完整干 凈的臺標達到95%,證明了該理論的正確性。
[0034] (2)通過基于sift和模板匹配的臺標識別方法,可以處理具有一定形變的臺標(實 際視頻流顯示的臺標都有輕微變形)以及極其相似的地方臺標區(qū)分識別問題,有效解決針 對形變以及相似臺標識別率不高的問題;而且針對不同分辨率的視頻只需要做一套標準模 板,同時支持模板的實時錄入,更具有實用價值。
【附圖說明】
[0035]圖1為本發(fā)明的臺標識別方法的總體技術(shù)方案的原理示意圖。
[0036]圖2為本發(fā)明的臺標識別步驟的流程圖。
【具體實施方式】
[0037]為了能夠更清楚地描述本發(fā)明的技術(shù)內(nèi)容,下面結(jié)合具體實施例來進行進一步的 描述。
[0038] 本發(fā)明主要針對臺標識別問題,分別提出了基于概率分布特征的臺標提取方法和 基于sift和模板匹配的臺標識別方法。有效解決了半透明臺標無法有效提取臺標圖像,提 取的臺標圖像背景不干凈、存在噪點,以及對及其相似的地方臺標無法有效區(qū)分識別等問 題。而且可以處理一定形變的臺標,同時支持臺標模板的實時錄入,使之更具有實用性。
[0039] 本發(fā)明的臺標識別方法主要包括臺標提取和識別兩個步驟。臺標提取主要是基于 視頻的概率統(tǒng)計特征,同時結(jié)合臺標區(qū)域的時空不變性來進行臺標提取,通過這一特征可 以有效的提取出干凈、完整的臺標。臺標識別主要是針對臺標提取步驟已經(jīng)提取的臺標圖 片,首先計算其s i f t特征,根據(jù)s i f t特征來進行粗刪除匹配;其次根據(jù)s i f t特征點進行仿射 變換校正,然后結(jié)合臺標自身特性,根據(jù)臺標的顏色、空間分布特征進一步匹配,最后根據(jù) 臺標圖案、臺標頻道名稱以及臺標頻道號進行模板匹配。
[0040] 請參閱圖1至圖2所示,本發(fā)明的臺標提取步驟具體包括以下內(nèi)容:
[0041] 視頻流本質(zhì)上是信息流,在空間和時間上不斷發(fā)生變化來承載信息。1)雖然每段 有限視頻表達不同的含義,從內(nèi)容和時間邏輯上并不是完全隨機的,但是從整個全體角度 某個時間切片橫向觀察,它是完全隨機的;2)如果有限時間延長至充分長,在空間上觀察每 幀圖像上某個位置I(x,y,t)的灰度直方圖,幾乎近似完全隨機的。
[0042]臺標一般可以分為a)不透明臺標,b)半透明臺標和c)近全透明臺標。透明與否取 決于α混合系數(shù)。具體關(guān)系可表述如下:
[