專利名稱:用于媒體鑒別的隱蔽且魯棒的標(biāo)記的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及數(shù)字媒體,并且具體地涉及嵌入承載媒體(carrier media)中的安全、察覺不到且魯棒的媒體標(biāo)記,其可被呈現(xiàn) 為可識別(recognizable)的圖像,從而鑒別(identify)承栽媒體。
背景技術(shù):
數(shù)字媒體的數(shù)字表示、存儲、分發(fā)和復(fù)制已經(jīng)非常普遍,這是因 為其成本低、易于使用并且保證媒體的質(zhì)量。然而,這些優(yōu)點(diǎn)卻使得 諸如在因特網(wǎng)上未經(jīng)授權(quán)地分發(fā)數(shù)字圖像和視頻之類的非法分發(fā)和 使用已取得版權(quán)的材料非常普遍。已經(jīng)提出了多種不同的方法來防止數(shù)字媒體免于未經(jīng)授權(quán)的使 用。例如,針對使得能夠安全通信和交付,數(shù)字加密技術(shù)是有效的。 然而,如果以對人來講是可視和可聽的方式對加密的內(nèi)容解密或呈 現(xiàn),那么該內(nèi)容可被再錄制,并且可獲得未經(jīng)保護(hù)的拷貝。通過在媒體中嵌入接收方信息來標(biāo)記媒體可有助于鑒別以未經(jīng) 授權(quán)的方式接收媒體并且使用該內(nèi)容的個(gè)體。此外,在媒體中嵌入的 所有權(quán)信息可指示拷貝限制以及可闡明該媒體的所有權(quán)。一種標(biāo)記媒體的方式是通過對數(shù)字媒體文件格式添加注解來實(shí) 現(xiàn)的,其可從未修改的文件中讀出并且在播放期間被忽略。然而,如 果將該文件再記錄或?qū)⑵滢D(zhuǎn)換為另 一種格式,那么可能會(huì)丟失該信為了在視頻媒體中實(shí)現(xiàn)魯棒和永久的標(biāo)記,已經(jīng)提出了在回放期 間顯示版權(quán)信息的可視和重疊的圖像。重疊的圖像針對修改具有魯棒 性并易于讀出。然而,該方法可降低標(biāo)記視頻的品質(zhì),這是因?yàn)橹丿B 的圖像干擾了原始視頻,其降低了收看體驗(yàn)的品質(zhì)。此外,重疊的圖像是明顯的并且因此容易進(jìn)行鑒別,以及可通過蓋寫或剪裁而去除。數(shù)字水印是另一種方法,其已經(jīng)提出幾種不同的變化方式。許多 普通的數(shù)字水印方案包括通過在空間或時(shí)間的某些位置上引入機(jī)器 可讀操作而將數(shù)字比特序列嵌入數(shù)字媒體中。在讀出期間,使用軟件 來解譯這些操作并得到用來組裝所嵌消息的數(shù)字比特序列。為了解譯 這些操作,需要在空間或時(shí)間上的操作的位置的知識。當(dāng)該操作失真 (即,例如,偏位或變?nèi)?時(shí),該讀出(也被稱作檢測)經(jīng)常是困難 或不可能的。在諸如剪裁、旋轉(zhuǎn)、轉(zhuǎn)換到另一種文件格式以及幀速率 的修改之類的簡單媒體處理期間可能出現(xiàn)失真。此外,該操作的有意 偏位可由攻擊者來實(shí)施,從而去除標(biāo)記,以及可通過諸如移位、旋轉(zhuǎn) 和回放速度變化之類的察覺不到、輕微且組合的失真來達(dá)到。公共可 用的工具以自動(dòng)方式應(yīng)用一定的這些操作,其也被稱作攻擊。當(dāng)前的數(shù)字水印算法對識別(recognize)失真內(nèi)容的偏位(也,皮稱作配準(zhǔn)(registration)的處理)經(jīng)常不夠有效。所以,有意的偏位可導(dǎo)致數(shù)字 水印不可讀。機(jī)器可讀出操作也易受到另外的安全風(fēng)險(xiǎn)的攻擊,將在下面進(jìn)行 說明。機(jī)器可讀出操作的檢測通常需要已執(zhí)行操作的知識。所以,試 圖繞過水印的人通過觀察要讀出或被嵌入的水印可確定操作的位置 和含義。通過分析、或反向工程、嵌入或檢測處理可執(zhí)行該觀察。隨 后,有技能的攻擊者可去除或轉(zhuǎn)化該操作,即,有效地去除該水印。 除了去除水印,上述的反向工程方法還使得能夠修改嵌入水印中的信 息。即使利用密鑰來加密操作的位置,這也是成立的。由于對于嵌入 和檢測通常使用相同的密鑰,所以限制了通過使用密鑰提供的保護(hù)。 攻擊者可分析或反向工程研究嵌入或檢測應(yīng)用并獲得對所述位置的 接入,即使其被加密。此外,通過分析該檢測或嵌入應(yīng)用可觀察密鑰。除了配準(zhǔn)和安全,針對有損壓縮和過濾的魯棒性是多媒體內(nèi)容的察覺不到標(biāo)記的重要部分。在形成水印期間,通過操作數(shù)字媒體的區(qū) 域,通常將消息嵌入數(shù)字媒體中,該區(qū)域適于隱藏機(jī)器可讀的信息并 且使人對標(biāo)記內(nèi)容沒有明顯察覺。在數(shù)字媒體中這樣區(qū)域的示例包括含有細(xì)節(jié)(例如,高頻)的區(qū)域。然而,可改變或去除這些區(qū)域,同時(shí)內(nèi)容維持在可接受的品質(zhì)。例如,如MPEG2和H.264之類的通常的 有損壓縮方案去除了這種感知不明顯的信息,從而減少了數(shù)字媒體文 件的大小,并且因此去除了存儲在那兒的水印信息。所以,利用這種 有損壓縮方案的媒體壓縮可使一些或全部水印信息去除。數(shù)字靜止圖像已經(jīng)是早期水印研究的焦點(diǎn)。視頻水印方法通?;?于對每一視頻幀應(yīng)用靜止圖像水印。原因在于對每一視頻幀應(yīng)用靜止 圖像水印是顯而易見的并且易于實(shí)現(xiàn)。然而,該方法沒有有效地使用 時(shí)域以來收集嵌入的信息。水印檢測通常僅在可恢復(fù)來自各個(gè)幀的某 些信息的情況下是成功的。如果由于配準(zhǔn)不成功或視頻幀的相關(guān)區(qū)域 的損壞導(dǎo)致在任何幀中不能讀出水印,那么這種方法經(jīng)常失敗。此外, 如果使幀水印化為各個(gè)圖像并且水印在幀之間變化,那么因?yàn)榭蓪υ?一個(gè)視頻內(nèi)的類似幀求平均從而消弱水印,所以水印易于受攻擊的影 響。如果所述幀中的每一幀包含相同的水印,那么該幀可被用來分析 在每幀中的水印的結(jié)構(gòu),從而理解和隨后去除該水印。此外,數(shù)字水印的處理通常包括初始圖像和要嵌入的消息的復(fù)雜 轉(zhuǎn)換。這樣復(fù)雜變換的示例是DCT、快速傅立葉或小波變換。執(zhí)行這 些變換所需要的計(jì)算是時(shí)間密集處理,當(dāng)實(shí)時(shí)地(例如,在回放或下 栽期間)嵌入數(shù)字水印時(shí),這個(gè)可能是明顯的限制。此外,水印方法 通常包括清楚限定的修改、允許變化的靈活性較小,從而采用不同的 壓縮格式、安全或性能要求。發(fā)明內(nèi)容本發(fā)明通常涉及數(shù)字和模擬媒體,并且更具體地涉及重復(fù)地將信 息嵌入承載媒體的系統(tǒng)和處理,該信息可被揭示(uncover)以鑒別該承栽媒體。本發(fā)明的一個(gè)實(shí)施例包括以以媒體的形式呈現(xiàn)所述信息;從所 述承載媒體中選擇多個(gè)媒體組分(portion of media);將被呈現(xiàn)的媒體 的至少一部分與該承載媒體的所選擇的媒體組分中的每個(gè)媒體組分組合以形成修改后的媒體組分,其中對所述修改后的媒體組分的所述修改對于人類觀察者是不可見的;以及使用所述修改后的媒體組分來創(chuàng)建修改后的承載媒體。在進(jìn)一步的實(shí)施例中,所述承栽媒體包括視頻序列;承載媒體的每個(gè)所述媒體組分是單個(gè)視頻幀;并且所述被呈現(xiàn)的媒體是圖像。 另一實(shí)施例還包括改變表示被呈現(xiàn)的媒體的圖像的幾何形狀。 在又進(jìn)一步的實(shí)施例中,將所述被呈現(xiàn)的媒體的部分與所述承載媒體的每個(gè)所述媒體組分組合包括根據(jù)感知模型來修改所述被呈現(xiàn)的媒體。在另一實(shí)施例中,偽隨機(jī)地選擇被呈現(xiàn)的媒體的、與所述承載媒 體的媒體組分組合的部分。在還有的進(jìn)一步的實(shí)施例中,所述承載媒體包括音頻序列,所述 承載媒體的每個(gè)所述媒體組分是一段音頻,并且所述被呈現(xiàn)的媒體是 音頻序列。在另一實(shí)施例中,承載媒體包括視頻,并且被呈現(xiàn)的媒體包括通 過其可投影或錄制視頻的透鏡。在進(jìn)一步的實(shí)施例中,所述信息包括與媒體有關(guān)的元數(shù)據(jù)。 在另 一實(shí)施例中,所述信息標(biāo)識(identify)視頻回放的時(shí)間和位置。在進(jìn)一步的實(shí)施例中,所述信息標(biāo)識版權(quán)的擁有者或媒體的接收方。在另一附加的實(shí)施例中,所述信息包括對數(shù)據(jù)庫的引用。 進(jìn)一步的實(shí)施例包括從所述承載媒體中選擇多個(gè)媒體組分;選擇每個(gè)所述媒體組分的至少一部分;強(qiáng)調(diào)來自所述媒體組分的所述部分;以及組合來自所述媒體組分的所迷部分。在另 一實(shí)施例中,強(qiáng)調(diào)所述媒體組分的部分包括對每個(gè)媒體組分應(yīng)用高通濾波。在進(jìn)一步的實(shí)施例中,強(qiáng)調(diào)所述媒體組分的部分包括從含有所述體。在另一實(shí)施例中,所述承載媒體包括視頻序列;所述嵌入媒體包 括數(shù)字圖像;每個(gè)媒體組分是視頻幀,并且被強(qiáng)調(diào)的每個(gè)視頻幀的部 分包括一組像素。在進(jìn)一步的實(shí)施例中,將所述媒體組分的每個(gè)部分組合在一起包 括對所述媒體組分的每個(gè)部分求平均。在另一附加實(shí)施例中,在組合所述媒體組分的所述部分之后,通 過一設(shè)備來識別所述嵌入媒體。在進(jìn)一步的實(shí)施例中,所述承載媒體包括音頻序列;所述嵌入媒 體包括音頻序列;音頻的每個(gè)組分包括音頻序列的組分;并且所述音 頻序列的每個(gè)組分的所述部分包括一組音頻取樣。
在附圖中,在全部不同的視圖中,類似的附圖標(biāo)記一般涉及相同 的部件。此外,在圖解說明本發(fā)明的原理時(shí),附圖沒有必要按比例畫 出,通常代替地給予強(qiáng)調(diào)。圖1是示出根據(jù)本發(fā)明實(shí)施例的媒體分發(fā)系統(tǒng)的示意圖。圖2是示出根據(jù)本發(fā)明實(shí)施例的配置來在^L頻序列和/或音頻序 列中嵌入媒體標(biāo)記的用戶電子設(shè)備的示意圖。圖3是示出根據(jù)本發(fā)明實(shí)施例的將媒體標(biāo)記嵌入媒體中的處理流程圖。圖4是示出根據(jù)本發(fā)明實(shí)施例的生成媒體標(biāo)記的處理流程圖,該 媒體標(biāo)記可被嵌入視頻序列或圖像組中。圖5是示出根據(jù)本發(fā)明實(shí)施例的對用于媒體標(biāo)記的信息進(jìn)行編碼 的處理流程圖。圖6是示出根據(jù)本發(fā)明另 一實(shí)施例的對用于媒體標(biāo)記的信息進(jìn)行 編碼的處理流程圖。圖7是示出根據(jù)本發(fā)明實(shí)施例的呈現(xiàn)媒體標(biāo)記的處理流程圖。 圖8是根據(jù)本發(fā)明實(shí)施例應(yīng)用的文本信息的媒體標(biāo)記的示例,其被呈現(xiàn)成具有幾何變化的圖像。圖9是示出根據(jù)本發(fā)明實(shí)施例的用于選擇嵌入媒體標(biāo)記的預(yù)定的 媒體組分的處理流程圖。圖10是示出根據(jù)本發(fā)明實(shí)施例的用于選擇要嵌入媒體標(biāo)記的媒 體組分的處理流程圖。圖ll是示出根據(jù)本發(fā)明實(shí)施例的用于組合媒體標(biāo)記和媒體組分 的處理流程圖。圖12是示出根據(jù)本發(fā)明實(shí)施例的用于利用感知模型來修改媒體 組分以包括來自媒體標(biāo)記的信息的處理流程圖。圖13是嵌入處理的圖解說明示例,其中包括具有文本"ABC 12 " 的標(biāo)識圖形的標(biāo)記被可感知地整形并與顯示地球的視頻幀組合。圖13A是根據(jù)本發(fā)明另 一 實(shí)施例的在模擬視頻的投影或錄制期 間利用透鏡的媒體標(biāo)記應(yīng)用的圖解說明示例。圖14是示出根據(jù)本發(fā)明實(shí)施例的揭示媒體標(biāo)記的處理流程圖。圖15是根據(jù)本發(fā)明實(shí)施例的通過累計(jì)結(jié)果來揭示媒體標(biāo)記的處 理流程圖。圖16是根據(jù)本發(fā)明另 一實(shí)施例的用于通過在幾個(gè)視頻幀中強(qiáng)調(diào) 數(shù)據(jù)操作和組合結(jié)果來揭示媒體標(biāo)記的揭示處理的圖解說明示例。
具體實(shí)施方式
現(xiàn)在參考附圖,示出了根據(jù)本發(fā)明實(shí)施例的嵌入和揭示媒體標(biāo)記 的系統(tǒng)和方法。在許多實(shí)施例中,媒體標(biāo)記是以信息的形式存在,其 被重復(fù)地嵌入媒體序列或媒體組中,并且嵌入的信息通常對于人類觀 察者來講是察覺不到的。然而,構(gòu)成媒體標(biāo)記的信息是可恢復(fù)的,并 且通常該信息被設(shè)計(jì)成 一 旦被恢復(fù)便為人可理解的。在多個(gè)實(shí)施例 中,通過強(qiáng)調(diào)和組合來自媒體序列或媒體組中的所選擇的媒體組分的 信息來揭示媒體標(biāo)記。在媒體標(biāo)記被重復(fù)地嵌入媒體中的實(shí)施例中, 組合來自多個(gè)媒體組分的信息相對于基礎(chǔ)媒體信息增強(qiáng)了標(biāo)記。通過 重復(fù)地將標(biāo)記嵌入媒體中,難以通過對媒體的操作去除媒體標(biāo)記。此外,在媒體系列中嵌入媒體標(biāo)記使得在諸如由重定格式或錄制引起的 品質(zhì)下降后,媒體序列或媒體組能保持媒體標(biāo)記。根據(jù)本發(fā)明實(shí)施例的嵌入和揭示媒體標(biāo)記的處理是不對稱的。嵌 入和揭示處理是利用不同算法實(shí)現(xiàn)的不同處理。揭示媒體標(biāo)記時(shí)所需 要的或所獲得的信息不足以從媒體中去除媒體標(biāo)記。此外,嵌入和揭 示處理通常由計(jì)算機(jī)來執(zhí)行,但是實(shí)際的識別和解譯通常由人來執(zhí) 行。在媒體序列是一 系列視頻幀的實(shí)施例中,媒體標(biāo)記可采用可視信 息的形式,其被重復(fù)地與來自視頻序列的幀的圖像信息組合。在多個(gè)實(shí)施例中,感知掩蔽(perceptual mask )被用來以減少人類觀察者將 察覺所呈現(xiàn)的視頻幀中存在可視信息的可能性的方式來組合該可視 信息和視頻幀的圖像信息。在其它實(shí)施例中,媒體標(biāo)記是音頻信息,其被周期地嵌入音頻序 列中,或者媒體標(biāo)記是可視信息,其被嵌入圖像組中類似的位置處。 媒體標(biāo)記可以是插入數(shù)字媒體中的數(shù)字信息或者利用模擬處理插入 的數(shù)字信息。根據(jù)本發(fā)明實(shí)施例的媒體標(biāo)記可被用來鑒別(標(biāo)識)媒體 的接收方以及跟蹤特定媒體序列或媒體組的分發(fā)。此外,媒體標(biāo)記可 被用來將檔案信息嵌入媒體中、執(zhí)行拷貝控制、執(zhí)行廣播監(jiān)視和/或分 發(fā)保密通信。用于嵌入媒體標(biāo)記的系統(tǒng)圖l中示出了用于分發(fā)媒體的根據(jù)本發(fā)明的系統(tǒng)的實(shí)施例。系統(tǒng) 10包括多個(gè)服務(wù)器12,其通過網(wǎng)絡(luò)14被連接到多個(gè)設(shè)備。在圖解說明 的實(shí)施例中,網(wǎng)絡(luò)是有線電視網(wǎng),而被連接到網(wǎng)絡(luò)的設(shè)備之一是計(jì)算 機(jī)16,其通過有線調(diào)制解調(diào)器17而連接到網(wǎng)絡(luò)。連接到網(wǎng)絡(luò)的另一設(shè) 備是向電視機(jī)20提供輸出的電視譯碼器18。服務(wù)器12存儲可被提供給連接到網(wǎng)絡(luò)的設(shè)備的媒體。在多個(gè)實(shí)施 例中,在服務(wù)器和設(shè)備之間的媒體傳遞利用加密碼來保護(hù)。通常壓縮 媒體以減少被要求來傳送的數(shù)據(jù)量。從服務(wù)器接收的加密媒體通常被解密和解壓縮以進(jìn)行呈現(xiàn)(render),并且部分解密和解壓縮處理包括 將媒體標(biāo)記嵌入被解密的和被解壓縮的媒體中。在由諸如電視譯碼器 18的用戶電子設(shè)備接收的媒體的情況下,經(jīng)常在硬件中執(zhí)行解密和嵌 入處理。當(dāng)可配置接收加密的媒體軟件的設(shè)備(例如,計(jì)算機(jī)16)時(shí), 在硬件中執(zhí)行或利用客戶端軟件執(zhí)行解密、解壓縮和/或在媒體中嵌入 媒體標(biāo)記。如果媒體被復(fù)制或被傳遞,那么一旦媒體標(biāo)記被嵌入解密 的和解壓縮的媒體中,媒體標(biāo)記將出現(xiàn)在媒體中。在多個(gè)實(shí)施例中, 媒體標(biāo)記對于接收和解密媒體的設(shè)備是唯一的。在多個(gè)實(shí)施例中,媒 體標(biāo)記包括涉及接收內(nèi)容的日期和時(shí)間以及用于接收設(shè)備或用戶的 標(biāo)識的信息。諸如日期、時(shí)間和標(biāo)識的將被嵌入的信息可由服務(wù)器產(chǎn) 生并且可使其隨著媒體來交付,或者所述設(shè)備可以使用本地存儲的信 息,例如其序列號以及根據(jù)其內(nèi)部時(shí)鐘的日期和時(shí)間。在壓縮加密的媒體的實(shí)施例中,在解壓縮之前或之后,媒體標(biāo)記可被嵌入媒體。在 下面將進(jìn)一步討論用于嵌入媒體標(biāo)記的技術(shù)。盡管圖l所示的實(shí)施例包括有線電視網(wǎng),但是本發(fā)明的其它實(shí)施 例可包括其它使得能在連接到網(wǎng)絡(luò)的服務(wù)器和設(shè)備之間進(jìn)行通信的 網(wǎng)絡(luò)技術(shù)。此外,根據(jù)本發(fā)明實(shí)施例的可接收媒體和嵌入的媒體標(biāo)記 的設(shè)備不限于電視譯碼器和計(jì)算機(jī)。根據(jù)本發(fā)明實(shí)施例,任何多種連 接和斷開的用戶電子設(shè)備和計(jì)算設(shè)備可嵌入媒體標(biāo)記。圖1中所示的實(shí)施例包括通過網(wǎng)絡(luò)的媒體分發(fā)和在分發(fā)后媒體標(biāo) 記的嵌入。本發(fā)明的多個(gè)實(shí)施例包括在媒體分發(fā)之前將媒體標(biāo)記嵌入 媒體中。在多個(gè)實(shí)施例中,媒體標(biāo)記通過服務(wù)器(即,在頭端)被嵌 入媒體中。當(dāng)通過服務(wù)器嵌入媒體標(biāo)記或者將被嵌入的信息由服務(wù)器 來確定時(shí),服務(wù)器可記錄有關(guān)嵌入的媒體標(biāo)記的信息。例如,服務(wù)器 可存儲有關(guān)請求者的賬單信息的信息和/或有關(guān)接收設(shè)備以及關(guān)于傳 輸?shù)拿襟w和信息的通信協(xié)議的信息。在許多實(shí)施例中,在媒體的分發(fā) 或處理中,或者同時(shí)或者在不同階段地將多個(gè)媒體標(biāo)記嵌入媒體中。 可才艮據(jù)揭示的標(biāo)記來跟蹤添加單獨(dú)標(biāo)記的每一個(gè)分發(fā)或處理步驟。此術(shù)兼容,其中,在相同的媒體中媒體標(biāo)記可與傳統(tǒng)的水印技術(shù)共存而 沒有明顯的干擾。所以,本發(fā)明的實(shí)施例可被用來在形成水印的媒體 中嵌入媒體標(biāo)記或者將水印施加到含有媒體標(biāo)記的媒體中。圖2示出了根據(jù)本發(fā)明實(shí)施例的可將媒體標(biāo)記嵌入媒體中的用戶 電子設(shè)備的實(shí)施例。用戶電子設(shè)備40包括連接到存儲器46的處理器 44、 1/0控制器48和視頻轉(zhuǎn)換器50。 1/0控制器48被連接到網(wǎng)絡(luò)接口設(shè) 備52、輸入接口設(shè)備54、附加存儲器56和音頻輸出設(shè)備58。在圖解說 明的實(shí)施例中,網(wǎng)絡(luò)接口設(shè)備52被連接到網(wǎng)絡(luò)并且通過網(wǎng)絡(luò)接收媒 體。所接收的媒體由處理器來操作以進(jìn)行呈現(xiàn)。如上所述,可由處理 器執(zhí)行的操作之一是將媒體標(biāo)記嵌入媒體中。處理器可利用固件或軟 件配置的微處理器的形式而存在?;蛘撸蓪⑻幚砥鲗?shí)現(xiàn)為一部分?jǐn)?shù) 字信號處理電路或?qū)S眉呻娐?。在多個(gè)實(shí)施例中,將微處理器和其 它電路進(jìn)行組合以用來實(shí)現(xiàn)處理器。盡管在圖2中示出了特定的結(jié)構(gòu), 但是本發(fā)明的實(shí)施例可采用任何用戶電子器件、嵌入設(shè)備和計(jì)算設(shè)備 的形式。例如,本發(fā)明的實(shí)施例包括VHS磁帶播放器、DVD播放器、 視頻投影儀、像機(jī)、數(shù)字視頻攝像機(jī)、處理媒體數(shù)據(jù)的個(gè)人計(jì)算機(jī)、 手持視頻回放設(shè)備(包括蜂窩式電話和游戲機(jī))以及可處理視頻的個(gè) 人信息管理器。嵌入媒體標(biāo)記以上的討論包括根據(jù)本發(fā)明實(shí)施例的可將媒體標(biāo)記嵌入媒體中 的系統(tǒng)的描述。圖3中示出了根據(jù)本發(fā)明實(shí)施例的可被用來在媒體中 嵌入媒體標(biāo)記的處理。處理60包括產(chǎn)生媒體標(biāo)記(62)并且然后選擇 其中將嵌入標(biāo)記的媒體組分(64)。然后將該媒體標(biāo)記與媒體組分進(jìn) 行組合以形成其中嵌入了標(biāo)記的修改后的媒體組分(66)。然后對其 中要嵌入標(biāo)記的任何另外的媒體是否可獲得做出判斷(68)。如果存 在另外的媒體,那么選擇另一媒體組分并且將媒體標(biāo)記與該媒體組分 進(jìn)行組合直到?jīng)]有另外的媒體為止。 一旦沒有另外的媒體,就通過再 組合該多個(gè)媒體組分來完成該處理(70)。在許多實(shí)施例中,由于當(dāng)媒體組分被播放時(shí)媒體標(biāo)記與媒體組分進(jìn)行了組合,所以再組合不是 必要的。在上述處理中,其中嵌入媒體標(biāo)記的媒體可以是媒體序列或媒體 組的部分。如以下將詳細(xì)描述的,在媒體序列或媒體組中不需要媒體 標(biāo)記與每個(gè)媒體組分進(jìn)行組合。當(dāng)只將媒體標(biāo)記與多個(gè)媒體組分中的 一些進(jìn)行組合時(shí),然后將修改的多個(gè)媒體組分與未修改的多個(gè)媒體組 分進(jìn)行組合以創(chuàng)建其中嵌入媒體標(biāo)記的媒體。以下的討論更加詳細(xì)地 針對上述處理的多個(gè)方面。生成媒體標(biāo)記如上所討論的,根據(jù)本發(fā)明實(shí)施例的媒體標(biāo)記通常采用以人可理 解的形式表示的信息形式。例如,將被嵌入視頻序列或圖像組中的媒 體標(biāo)記可包括文字和/或圖像。由特定的大小、形狀、紋理、字體類型 或符號的位置也可表示信息。要被嵌入音頻序列的媒體標(biāo)記可包括聲 音、音調(diào)或口語單詞。在多個(gè)實(shí)施例中,媒體標(biāo)記也可包括諸如條形碼或OCR字體的機(jī)器可理解的信息。可包括在媒體標(biāo)記中的信息其多樣性方面幾乎是無限的。在多個(gè) 實(shí)施例中,媒體標(biāo)記包括有關(guān)接收方、擁有者和/或傳送或顯示的時(shí)間 和位置的信息。媒體標(biāo)記也可包括作為大量信息的散列碼和/或?qū)ζ渌?信息(諸如數(shù)據(jù)庫記錄)的索引的信息。在多個(gè)實(shí)施例中,媒體標(biāo)記 包括關(guān)于分發(fā)或處理限制的信息,該處理限制表示允許的工作流、對 媒體的修改、允許拷貝的量或允許的媒體文件拷貝的接收方。生成用于視頻序列或圖像組的媒體標(biāo)記圖4中示出了產(chǎn)生可被嵌入視頻序列或圖像組的媒體標(biāo)記的處 理。處理72包括確定要被嵌入的信息(74)、對該信息編碼(76)和 呈現(xiàn)編碼的信息(78)。如上所討論的可被嵌入媒體標(biāo)記的信息實(shí)際上沒有限制。該信息 可以是人可理解的和/或機(jī)器可理解的。 一旦已經(jīng)確定要被嵌入的信息,就對該信息進(jìn)行編碼??蓪⒃撔畔H僅編碼為然后被呈現(xiàn)的一系 列字母數(shù)字符號。在其它實(shí)施例中,在呈現(xiàn)之前修改基本信息。在多 個(gè)實(shí)施例中,可對信息進(jìn)行壓縮、用錯(cuò)誤鑒別或糾錯(cuò)信息對其進(jìn)行補(bǔ) 償和/或?qū)ζ溥M(jìn)行編碼。該呈現(xiàn)處理包括利用編碼的信息來生成媒體。 在視頻序列或圖像組中將被嵌入的媒體標(biāo)記的情況下,呈現(xiàn)編碼的信 息為圖像。在音頻序列中將被嵌入的媒體標(biāo)記的情況下,將編碼的信 息轉(zhuǎn)換為音頻序列。對信息編碼以呈現(xiàn)為媒體標(biāo)記根據(jù)本發(fā)明實(shí)施例的對信息編碼包括確定包含在媒體標(biāo)記中的 信息將被表示的方式。如上所討論的,嵌入視頻序列或圖像組中的媒 體標(biāo)記可包括文字和/或圖像,而嵌入音頻序列中的媒體標(biāo)記可包括聲 音、音調(diào)或口語單詞。在多個(gè)實(shí)施例中,利用大的符號和/或諸如AHal之類的簡單字體 (例如,大約視頻幀的l/4高度)來表示信息。大的符號具有很少的細(xì) 節(jié)并且因此大部分由較低頻率分量組成。低頻分量是非常魯棒的并且 在視頻通過諸如壓縮、再錄制和濾波之類的各種處理而降級后,低頻 分量保留在視頻內(nèi)??梢赃@樣的方式來進(jìn)一步選擇符號,該方式為 該符號對于人們來講較為熟悉以易于識別,諸如根據(jù)文字的符號,且 當(dāng)其被嵌入時(shí)最好為不易見到,諸如垂直和圓滑線而不是水平或垂直 線,例如,或者其具有彼此之間的最大差,諸如垂直和水平條。當(dāng)選 擇要表示嵌入信息的符號時(shí)的另一考慮是符號可被機(jī)器應(yīng)用的效率, 例如可有效地存儲和應(yīng)用的塊(blocks)。在多個(gè)方式中,通過符號的位置來表示信息。將幀大小邏輯地劃 分為幾個(gè)不同的區(qū),并且通過使能或無效在區(qū)域中的符號來對信息進(jìn) 行編碼。在多個(gè)實(shí)施例中,在特定位置中符號的存在或不存在被用來 編碼二進(jìn)制信息。在幾個(gè)實(shí)施例中,將同一類的信息存儲在相同的位 置,使得被平均以去除媒體標(biāo)記的標(biāo)記視頻在每一類中維持共同的信 息。以分等級的方式進(jìn)一步構(gòu)建信息以在相同的位置具有顯著的值。例如,如果將包含不同時(shí)間碼但包含相同郵政區(qū)號(zip code)的幾部電 影進(jìn)行平均,那么郵政區(qū)號信息不會(huì)被平均處理弱化。如果來自不同 區(qū)域的拷貝被平均,那么根據(jù)彼此接近的并且差異不大的郵政區(qū)號來 維持第一數(shù)字位。在其它實(shí)施例中,從幾個(gè)不相關(guān)的區(qū)域中選擇標(biāo)記的位置,使得 ;故求平均的標(biāo)記浮見頻可能包含幾個(gè)可讀的標(biāo)記而不重疊。一組實(shí)施例對信息進(jìn)行編碼以在固定位置提供固定的符號,從而 鑒別某部電影已被標(biāo)記。如果試圖通過對來自多個(gè)不同的媒體拷貝的 幀進(jìn)行組合來去除嵌入的媒體標(biāo)記,那么可弱化不在所有媒體拷貝中 出現(xiàn)的、在媒體標(biāo)記中的信息。然而,可揭示包含在每一個(gè)拷貝的媒 體標(biāo)記中的共同信息(即,在多個(gè)固定位置中的多個(gè)固定符號)。除了信息的表現(xiàn),編碼處理可包括設(shè)計(jì)來壓縮或保護(hù)在媒體標(biāo)記 內(nèi)包含的信息的附加處理以及設(shè)計(jì)來糾正由隨后的媒體處理引入信 息的錯(cuò)誤的處理。圖5中示出了根據(jù)本發(fā)明實(shí)施例的包括壓縮和嵌入 糾錯(cuò)碼的編碼信息的處理。處理90包括提供(92)接著被壓縮(94) 的信息,以及處理接著的壓縮以生成糾錯(cuò)信息,該糾錯(cuò)信息被附加到 壓縮的信息(96)。用于糾錯(cuò)的附加信息增加了冗余,其可被用來糾 正潛在的錯(cuò)讀,并且恢復(fù)在識別揭示的媒體標(biāo)記期間缺失的或不可識 別的符號。當(dāng)對信息編碼以形成媒體標(biāo)記時(shí),可應(yīng)用任何種類的處理。圖6 中示出了根據(jù)本發(fā)明實(shí)施例的包括加密的用于對信息進(jìn)行編碼的另 一處理。處理90,包括提供隨后被壓縮(94,)和被加密(96,)的信息。 對包括在媒體標(biāo)記中的信息加密使得在媒體中的信息能安全傳送。在 多個(gè)實(shí)施例中,包括(或以視頻或音頻格式的)加密信息的媒體標(biāo)記 可被用來發(fā)送媒體內(nèi)的保密消息。因?yàn)楦鶕?jù)以上的討論顯而易見,在 呈現(xiàn)為媒體標(biāo)記之前,任何不同的編碼技術(shù)和處理可被用來編碼信 息。編碼處理的特性通常取決于存儲在媒體中的信息、該信息的隨后 使用和該信息的期望的降級以及與存儲在標(biāo)記中的信息相關(guān)的信息 的可用性。呈現(xiàn)編碼的信息以形成媒體標(biāo)記一旦編碼被期望處于媒體標(biāo)記內(nèi)的信息,通過呈現(xiàn)作為媒體的編 碼信息可創(chuàng)建根據(jù)本發(fā)明實(shí)施例的媒體標(biāo)記。在用于嵌入視頻序列或 圖像組中的媒體標(biāo)記的情況下,通常將編碼信息呈現(xiàn)為圖像,而在用 于嵌入音頻序列中的媒體標(biāo)記的情況下,通常將編碼信息呈現(xiàn)為音頻 序列。在編碼為符號的信息被嵌入視頻序列或圖像組中的實(shí)施例中,可 將該符號呈現(xiàn)為圖像,使得符號具有與背景不同的色彩和亮度信息。 在多個(gè)實(shí)施例中,要形成媒體標(biāo)記的圖像的背景是中等灰度。在嵌入 媒體標(biāo)記后,具有中等灰度背景色彩的區(qū)域通常不會(huì)修改視頻幀。在 幾個(gè)實(shí)施例中,當(dāng)使暗的內(nèi)容具有亮邊界而在符號的輪廓處提供強(qiáng)的 對比時(shí),呈現(xiàn)符號。在許多實(shí)施例中,最亮和最暗的區(qū)域從中等灰度改變大約8%。對于8位灰度圖像,像素值范圍為0至255。中等灰度具 有127的像素值,而最小和最大像素值分別是大約107和147。此外, 利用較強(qiáng)的標(biāo)記可強(qiáng)調(diào)用來識別字符的感知重要的區(qū)域,使得每一個(gè) 字符線的端點(diǎn)較暗,從而實(shí)現(xiàn)更強(qiáng)的嵌入。更強(qiáng)的嵌入在所揭示的媒 體標(biāo)記中可提供更好的可讀性,即使內(nèi)容被降級的情況。作為根據(jù)本發(fā)明實(shí)施例的呈現(xiàn)媒體標(biāo)記的部分處理,在生成圖像 后,可應(yīng)用各種濾波和/或轉(zhuǎn)換。由濾波和轉(zhuǎn)換導(dǎo)致的變化通常不妨礙 人識別揭示的媒體標(biāo)記。然而,利用針對自動(dòng)識別而提高保護(hù)的機(jī)器, 該變化可使媒體標(biāo)記位置的檢測變得復(fù)雜。圖7中示出了根據(jù)本發(fā)明 實(shí)施例的呈現(xiàn)嵌入視頻序列或圖像組中的媒體標(biāo)記的處理。處理IOO 包括使用編碼的信息生成圖像(102)以及對所生成的圖像應(yīng)用濾波 (104)。在圖解說明的實(shí)施例中,該濾波是具有大約0.5的西格馬的 高斯模糊和大約0.5的標(biāo)準(zhǔn)偏差。應(yīng)用高斯模糊可去除在標(biāo)記的內(nèi)容中 是可視的強(qiáng)的邊緣。在應(yīng)用濾波后,對圖像進(jìn)行轉(zhuǎn)換(106)。在圖 解說明的實(shí)施例中,該轉(zhuǎn)換包括將偽隨機(jī)幾何變化應(yīng)用到圖像。例如, 應(yīng)用-5和+5度之間的旋轉(zhuǎn)、圖像大小的-10%和+10%之間位置變化以及在水平和垂直方向上+10%和-10°/。之間的拉伸。盡管在其它實(shí)施例中,可應(yīng)用其它偽隨機(jī)變化。在多個(gè)實(shí)施例中,偽隨機(jī)變化的應(yīng)用取決于保密密鑰的使用而生 成偽隨機(jī)序列,根據(jù)該偽隨機(jī)序列可得到針對變化的參數(shù)??捎捎脩?提供密鑰或者隨機(jī)地生成密鑰。當(dāng)以上述方式應(yīng)用偽隨機(jī)變化來生成 媒體標(biāo)記時(shí),媒體標(biāo)記不能從媒體中理想地去除,在該媒體中嵌入該 媒體標(biāo)記而不用知道密鑰。所以,根據(jù)本發(fā)明的系統(tǒng)的多個(gè)實(shí)施例存 儲密鑰以使得能使用密鑰來從其中嵌入媒體標(biāo)記的媒體中去除媒體 標(biāo)記。如果不用去除媒體標(biāo)記,那么在嵌入媒體標(biāo)記后可丟棄該密鑰, 這是因?yàn)閷τ跈z測不需要該密鑰。除了上述的參考圖7的濾波和轉(zhuǎn)換,本發(fā)明的實(shí)施例還在呈現(xiàn)媒 體標(biāo)記時(shí)可利用任何的濾波、轉(zhuǎn)換或數(shù)據(jù)操作處理。例如,對用于嵌 入視頻序列或圖像組中的媒體標(biāo)記的呈現(xiàn)可包括紋理、字體類型或符 號形狀的修改。通常,基于使用媒體標(biāo)記的特定應(yīng)用的要求來確定針 對基本呈現(xiàn)的媒體所執(zhí)行的處理。圖8示出了根據(jù)本發(fā)明實(shí)施例的所呈現(xiàn)的媒體標(biāo)記。媒體標(biāo)記210 包括文本信息205和圖形206,其利用應(yīng)用的幾何變化而呈現(xiàn)到圖像 200。在圖解說明的實(shí)施例中,文本信息205和圖形206呈現(xiàn)為具有亮 的邊界區(qū)域207和暗的內(nèi)部區(qū)域208。應(yīng)用到圖像的幾何變化的至少一 個(gè)是圖像的部分旋轉(zhuǎn),使得文本信息的線條沒有與圖像的邊緣相平行 地延伸。在其它實(shí)施例中,使用單色或不同的區(qū)域組合可呈現(xiàn)文本和 圖形。此外,各種其它濾波、轉(zhuǎn)換和/或處理可被用來創(chuàng)建圖像的其它 變化(見以上說明)。此外,可使用濾波或字體,其消弱(breakup) 媒體標(biāo)記中的線條,并且可向媒體標(biāo)記應(yīng)用偽隨機(jī)噪音模式以進(jìn)一步 減少已嵌入的媒體標(biāo)記的可視性。選擇其中將嵌入媒體標(biāo)記的媒體如上所討論的,根據(jù)本發(fā)明實(shí)施例的媒體標(biāo)記被重復(fù)地嵌入媒體 中。隨著時(shí)間擴(kuò)展媒體標(biāo)記可增加媒體標(biāo)記的魯棒性,這是因?yàn)榻沂咎幚戆S著時(shí)間根據(jù)若干媒體組分累積結(jié)果。盡管媒體標(biāo)記通常不 能根據(jù)單個(gè)媒體組分來恢復(fù),所以每個(gè)媒體組分對總的檢測結(jié)果有貢 獻(xiàn)。當(dāng)處理高度降級的媒體時(shí),通過使用較長周期的媒體和處理更多 的單獨(dú)媒體組分可使媒體標(biāo)記經(jīng)常被揭示(即使媒體標(biāo)記在單獨(dú)媒體 組分中已經(jīng)明顯地被減弱)。在多個(gè)實(shí)施例中,遍及媒體分發(fā)媒體標(biāo) 記包括選擇其中將以周期間隔嵌入媒體標(biāo)記的媒體組分。在其它實(shí)施 例中,基于媒體組分的特性來選擇其中將嵌入媒體標(biāo)記的媒體組分。 例如,可只將媒體標(biāo)記嵌入不可能使媒體標(biāo)記的存在為可觀察到的多 個(gè)媒體組分中。圖9中示出了根據(jù)本發(fā)明實(shí)施例的選擇其中將嵌入媒體標(biāo)記的媒 體組分的處理。處理220包括選擇笫一媒體組分(222 )、忽略預(yù)定份 的媒體(224 )、確定是否還有另外的媒體(226 )以及選擇另一媒體 組分直到?jīng)]有另外的媒體保留為止(222 )。為此,結(jié)束該處理(228 )。在其中處理被用來從視頻序列中選擇幀的以上處理的實(shí)施例中, 媒體標(biāo)記可被嵌入數(shù)字視頻的每個(gè)幀、數(shù)字視頻的每隔N個(gè)幀或隨機(jī) 的數(shù)字視頻的多個(gè)幀中。在多個(gè)實(shí)施例中,在每隔N個(gè)幀嵌入媒體標(biāo) 記的第一部分,而數(shù)字視頻的每隔M個(gè)幀嵌入媒體標(biāo)記的第二部分。 遍及媒體重復(fù)地嵌入不同的多個(gè)媒體組分標(biāo)記可增加定位媒體標(biāo)記 的困難以及從媒體中去除媒體標(biāo)記的復(fù)雜性。圖10中示出了用于選擇其中將嵌入媒體標(biāo)記的媒體組分的另一 處理。處理240包括檢查(242 )媒體組分以確定(244 )該媒體組分 是否具有適于根據(jù)一組標(biāo)準(zhǔn)嵌入(246)媒體標(biāo)記的特性。例如,該 標(biāo)準(zhǔn)可包括在媒體中變化的程度和/或背景噪聲。當(dāng)在包括高程度的變 化和/或背景噪聲的媒體組分內(nèi)進(jìn)行嵌入時(shí),媒體標(biāo)記不大可能被檢 測。如果該媒體組分的特性被確定為合適的,那么選擇該媒體組分 (246)以嵌入媒體標(biāo)記。該處理確定是否還有另外的媒體(248)。 如果存在另外的媒體,那么對下一組分的特性進(jìn)行檢查(242 )。 一 旦已檢查了所有的媒體,那么該處理就完成了 (250)。在多個(gè)實(shí)施例中,以上處理的組合可被用來選擇其中將嵌入媒體標(biāo)記的多個(gè)媒體組分。此外,根據(jù)本發(fā)明的實(shí)施例可使用其它處理來 確定其中將嵌入媒體標(biāo)記的多個(gè)媒體組分。組合媒體標(biāo)記和媒體根據(jù)本發(fā)明的實(shí)施例,可使用多種技術(shù)來組合媒體標(biāo)記和媒體。 該處理的屬性通常取決于媒體的屬性以及在特定應(yīng)用中指定的任何 的不可見性、性能和格式要求。如上所討論的,媒體的屬性影響被用來組合媒體標(biāo)記和媒體的處 理。該媒體可被壓縮或被解壓縮,并且可使根據(jù)本發(fā)明實(shí)施例的媒體 標(biāo)記與或被壓縮的或解壓縮的媒體信息進(jìn)行組合。圖11中示出了根據(jù)本發(fā)明實(shí)施例的組合媒體標(biāo)記和媒體的處理。處理260包括將初始的媒體組分轉(zhuǎn)換到嵌入域中(如果被要求的話) (262 )。 一旦在嵌入域中,那么修改形成初始的媒體組分的信息以 包括媒體標(biāo)記的信息。該修改通常在單個(gè)媒體組分中不明顯。在對于 幾個(gè)媒體組分的所選位置中弱修改的分布使得使用空間和時(shí)間域并 且使得三維(即,高、寬和時(shí)間)標(biāo)記嵌入媒體中。以上討論涉及嵌入域。嵌入域是信息的屬性,其中可嵌入媒體標(biāo) 記。例如,用于視頻幀或圖像的嵌入域可以是空間域或頻域。在媒體 組分是視頻幀的多個(gè)實(shí)施例中,嵌入域是解壓縮的空間域??梢砸赃m于其中將嵌入媒體標(biāo)記的媒體組分的嵌入域的任何方 式來執(zhí)行根據(jù)本發(fā)明實(shí)施例的對媒體組分的修改。在將媒體標(biāo)記與視 頻幀或圖像進(jìn)行組合的多個(gè)實(shí)施例中,該組合是逐個(gè)像素地將媒體標(biāo) 記加到初始視頻幀的亮度分量。從呈現(xiàn)在中等灰度級背景上的媒體標(biāo) 記中減去中等灰度值,使得媒體灰度值不對幀進(jìn)行修改,并且要嵌入 的圖形由正和負(fù)數(shù)組成。只有這些被呈現(xiàn)的媒體標(biāo)記的較亮和較暗的 區(qū)對該媒體組分引入了修改。圖12中示出了根據(jù)本發(fā)明實(shí)施例的用于修改視頻幀的部分的處 理。處理280包括將感知掩蔽應(yīng)用到媒體標(biāo)記(282 )、施加表示對媒 體標(biāo)記的嵌入長度的加權(quán)(284 )并且然后將應(yīng)用掩蔽和加權(quán)的媒體標(biāo)記與視頻幀或圖像的像素進(jìn)行組合(286 )。以上處理涉及感知掩 蔽的使用。感知掩蔽用來將對區(qū)域的媒體組分的改變限制到該改變對 人類觀察者來講不可能可見的區(qū)域。下面將更為詳細(xì)地討論感知掩 蔽。在多個(gè)實(shí)施例中,根據(jù)以下公式來執(zhí)行應(yīng)用掩蔽和加權(quán)的媒體標(biāo) 記與視頻幀或圖像的像素的組合Sx,y,f = Ox,y,f + (Cx,y - (V/2))* Mx,y/R 其中Sx,y,f是在幀號為f的加標(biāo)記的視頻中、在位置x, y處的像素。S被 限制在允許的像素值范圍內(nèi);Ox,y,f是在幀號為f的初始未加標(biāo)記的視頻中、在位置x, y處的像素;C、y是在呈現(xiàn)的媒體標(biāo)記圖像的位置x, y處的像素; V/2是中等灰度值;Mx,y,f是在幀號為f中、在位置x, y處感知模型計(jì)算的結(jié)果; R是確定多么強(qiáng)的修改被應(yīng)用到視頻幀或圖像上、并且因此其的 可視性是多大以及媒體標(biāo)記抵制內(nèi)容的修改是多強(qiáng)的魯棒性值。將越 高的R值嵌入可視性更高但也對修改抵制更強(qiáng)的標(biāo)記,其中在較低品 質(zhì)版本的媒體標(biāo)記視頻中很快可以檢測到它。在優(yōu)選實(shí)施例中,R具 有1的值。在其它實(shí)施例中,從視頻中減去媒體標(biāo)記,并且在多個(gè)實(shí)施例中, 只有背景被標(biāo)記(即,不包含信息的媒體標(biāo)記的區(qū)域),其使負(fù)像被 嵌入。在一些實(shí)施例中,按照類似的幀之間的差對媒體標(biāo)記編碼。利 用閾值來測量相似性。該閾值可以是固定的或根據(jù)視頻來動(dòng)態(tài)確定, 例如使得5%的幀是在具有至少 一個(gè)其它類似的幀的組中。在編碼時(shí), 差被引入彼此類似的幀之間。在由媒體標(biāo)記覆蓋的區(qū)域中,通過在幀 之間引入差來對媒體標(biāo)記進(jìn)行編碼??筛鶕?jù)可視性考慮和安全性考慮 來選擇這些區(qū)域。如上所討論的,多個(gè)本發(fā)明的實(shí)施例在除了亮度的域中修改了視頻幀或圖像。在多個(gè)實(shí)施例中,修改單個(gè)或多個(gè)色彩分量值??筛鶕?jù)諸如lab、 RGB、 YUV、 HSL和CMYK之類的色彩空間得到色彩分量。 嵌入域的選擇可通過處理能力來確定以將承載媒體轉(zhuǎn)換成那一處理 域。這對應(yīng)用來講特別相關(guān),其中要求標(biāo)記的有效應(yīng)用,諸如在回放 或下載期間嵌入。如果媒體被解壓縮以回放,那么可使用解壓縮的域, 而如果亮度域例如在YUV像素格式中是可用的,那么亮度、解壓縮的 像素域可被用來應(yīng)用標(biāo)記。如果例如在下載期間視頻在壓縮域中是可 用的,那么標(biāo)記可被應(yīng)用在壓縮域中,如下面將進(jìn)一步說明的。感知模型組合媒體標(biāo)記和媒體組分的以上討論涉及感知掩蔽的應(yīng)用。通常 使用感知模型來生成感知掩蔽以分析該媒體組分以及鑒別何處對該 媒體組分的改變對人類觀察者來講可視性較低。根據(jù)本發(fā)明實(shí)施例的 感知模型通常以這樣的下述方式來生成與媒體標(biāo)記組合的掩蔽,該方 式即為通過與掩蔽的媒體標(biāo)記的組合創(chuàng)建的媒體組分的改變在其中 降低人對該媒體組分的改變的察覺能力的區(qū)域中相對較大。在多個(gè)實(shí) 施例中,感知掩蔽限定了最大不可感知的修改,該最大不可感知的修 改可在進(jìn)行媒體組分的改變時(shí)被執(zhí)行。當(dāng)為了組合媒體標(biāo)記和視頻幀或圖像而創(chuàng)建感知掩蔽時(shí),考慮人 的視覺系統(tǒng)的屬性。人的視覺系統(tǒng)的屬性限定了人根據(jù)區(qū)域的局部和 時(shí)間相鄰(temporal neighborhood)的屬性而看見對一見頻幀或圖像的 修改(即,嵌入的媒體標(biāo)記的信息)的能力。該屬性包括亮度、對比 度、噪聲、色彩以及這些特性在時(shí)間和空間上發(fā)生的變化。例如,在 作為非常暗或非常亮的區(qū)域中、在包含對比度的區(qū)域中、在與諸如場 景變化之類的先前幀或隨后幀不同的區(qū)域中、以及在包含大量高頻信 息的區(qū)域中,對幀的修改可察覺性較低。根據(jù)本發(fā)明實(shí)施例的感知模 型也可考慮其上將顯示視頻的設(shè)備以根據(jù)使用的顯示設(shè)備來適應(yīng)不 同的—見頻感知。以下將討論根據(jù)本發(fā)明實(shí)施例的用于生成感知掩蔽的處理,該感知掩蔽表示在視頻幀或圖像中對于每一個(gè)像素的允許修改量。在下列等式中,Px,y,f表示在幀號為f中在位置x,y處的亮度的像素值。V是對于該^泉素值的最大值。此外,M是不可感知值Mlx,y,f、 M2x,y,f和M3x,y,f的加權(quán)的總和,其由下迷的幾個(gè)不同感知屬性的分析得到。在其它實(shí)施 例中,M可形成為相同或其它不可感知值的函數(shù)。Mlx,y,f是對于Px,y,f的空間對比度掩蔽的量度并且是針對那 一像素 的對比度,其被測量為Px,y,f和相鄰像素之間絕對差的平均值。下列公式限定了對于3x3像素的區(qū)域的這一計(jì)算,其適于640x480像素的幀大 小。<formula>formula see original document page 22</formula>通過增加計(jì)算量并對于較大的幀尺寸使用更大的范圍,以上用于 Mlx,y,f的z^式可容易地適應(yīng)于對應(yīng)于超過640x480的幀大小或小于 640x480的幀大小的像素區(qū)。M2x,y,f是Px,y,f的亮度并對于很暗和很亮的區(qū)具有更高的值,如由以下/〉式所確定的。M2-ld廣K/2|,其中V/2是中等灰度。M3 x,y,f是時(shí)間對比度掩蔽并且是Px,y,f和先前幀的相同位置中的像素之間的^對差,即,M3wHc「d作為處理的部分,使無感知值M1至M3標(biāo)準(zhǔn)化以具有范圍從0至1 的值。可進(jìn)一步限定M1至M3為最大值以對于特定的或不尋常的幀內(nèi) 容避免極端值。無感知值的加權(quán)總和由以下等式來確定<formula>formula see original document page 22</formula> 其中,W1是M1的加權(quán),W2是M2的加權(quán),而W3是M3的加權(quán)。 加權(quán)W1、 W2和W3確定感知屬性對感知掩蔽的影響并且可4艮據(jù)可^L性測試或視頻內(nèi)容來改善。在優(yōu)選實(shí)施例中,M1和M3具有1的加權(quán),而M2具有0.5的加權(quán)。以上的討論說明了關(guān)于空間域的感知掩蔽的創(chuàng)建。在多個(gè)實(shí)施例中,當(dāng)壓縮的內(nèi)容被標(biāo)記時(shí),將用于壓縮的信息用于感知模型。普遍在MPEG1和MPEG2中使用的壓縮分量包括運(yùn)動(dòng)矢量,其表示再使用 在不同位置中的先前幀的幀內(nèi)容。運(yùn)動(dòng)矢量確定所包括的運(yùn)動(dòng)量,其 是感知模型的重要屬性。具有長運(yùn)動(dòng)矢量(long motion vector )或缺 失運(yùn)動(dòng)矢量的幀通常與先前的幀有很少的相似性。壓縮幀或壓縮區(qū)的 大小也可以是在幀或區(qū)域中噪聲或頻率量的表示。如果表現(xiàn)多個(gè)頻 率,那么所述幀包含大量信息并且可被標(biāo)記而無感知降級。通過使用 壓縮信息來創(chuàng)建感知掩蔽,獲得有關(guān)圖像和特征的有價(jià)值的信息而不 消耗時(shí)間的分析。數(shù)據(jù)可被用于在嵌入之前可感知地對媒體標(biāo)記整形 并且動(dòng)態(tài)地適配在特定區(qū)域中嵌入的長度。在幾個(gè)實(shí)施例中,執(zhí)行一次對于視頻序列或圖像組的感知模型的 生成,并且將其應(yīng)用到幾個(gè)單獨(dú)標(biāo)記的視頻序列或圖像組的拷貝。也 可電子地壓縮、傳送所生成的信息并在稍后的階段被應(yīng)用。例如,可 將感知模型分開地存儲并且可將其在視頻序列或圖像組的每次回放 期間進(jìn)行應(yīng)用而不用修改所存儲的媒體。存儲分開的感知模型可允許 以靈活的方式使能、無效或修改的暫時(shí)性標(biāo)記。圖13中示出了根據(jù)本發(fā)明的嵌入處理的圖解說明的示例。消息 "ABC12⑥,,301被編碼并被呈現(xiàn)以形成媒體標(biāo)記305。在嵌入期間,針 對在嵌入期間修改的區(qū)域來創(chuàng)建感知掩蔽310。根據(jù)感知掩蔽310來組 合媒體標(biāo)記305和本例中為地球315的視頻幀以生成具有嵌入媒體標(biāo) 記320的幀。在多個(gè)實(shí)施例中,因?yàn)楦兄P蛯⑨槍︻愃茙峁╊愃频慕Y(jié)果, 所以在類似的幀中以類似的方式嵌入媒體標(biāo)記。對于類似的幀生成類似結(jié)果的能力可妨礙通過比較在兩個(gè)可視類似的幀中引入的差而確 定媒體標(biāo)記的屬性的統(tǒng)計(jì)分析的使用。此外,以類似的方式在每幀中嵌入媒體標(biāo)記增加了媒體標(biāo)記將表現(xiàn)在任何新的視頻序列的可能性, 其中該新的視頻序列是通過對其中嵌入媒體標(biāo)記的視頻序列的幀一 起求平均或者通過改變視頻序列的幀的順序而創(chuàng)建的。在多個(gè)實(shí)施例中,感知模型可被簡化,并且要被修改的像素和嵌入符號的數(shù)量及大小可根據(jù)性能要求而改變。此外,可將初始視頻劃 分為幾段并且利用不同的媒體標(biāo)記來標(biāo)記以隱藏大量信息。
對媒體標(biāo)記和壓縮媒體進(jìn)行組合
在幾個(gè)實(shí)施例中,通過修改壓縮的元素來執(zhí)行修改??稍谥T如
DCT、 Wavelet(小波)和快速傅立葉之類的普通壓縮域中執(zhí)行感知模型 的分析以及實(shí)際的組合。媒體標(biāo)記以及幀被表示并被組合在特定的域 中。對于用于MPEG1、 MPEG2和MPEG4的DTC域,空間對比度量 度Ml是包含Px,y,f的塊(block)的所有DCT分量的絕對總和,亮度量 度M2可根據(jù)DC分量的值得到,以及時(shí)間對比度量度M3是在當(dāng)前幀和 先前幀中頻率之間的絕對差的總和。媒體標(biāo)記與DCT壓縮的幀的組合 是對應(yīng)DCT系數(shù)的相加并且可按以下公式來計(jì)算
標(biāo)記幀0<:1分量=初始視頻001分量+ (媒體標(biāo)記DCT分量-中等 灰度值DCT分量)*M*R
在另 一實(shí)施例中,媒體標(biāo)記浮皮嵌入諸如Wavelet或快速傅立葉域 的不同域中。當(dāng)在經(jīng)轉(zhuǎn)換的域中對媒體標(biāo)記與媒體組分進(jìn)行組合時(shí), 在經(jīng)轉(zhuǎn)換的域或空間域中,該媒體標(biāo)記是人可識別的。例如,可將標(biāo) 記的空間表示嵌入初始視頻的經(jīng)轉(zhuǎn)換的域中(揭示的媒體標(biāo)記在經(jīng)轉(zhuǎn) 換的域中是可識別的,當(dāng)在經(jīng)快速傅立葉變換的圖像中查看時(shí)可視的 圖像),或者標(biāo)記的轉(zhuǎn)換表示被嵌入初始視頻的經(jīng)轉(zhuǎn)換的域中。在經(jīng) 轉(zhuǎn)換的域中嵌入空間信息可導(dǎo)致偽像(artifact),其不可識別為人可 讀的符號而卻是噪聲。
在多個(gè)實(shí)施例中,將信息嵌入多個(gè)嵌入域中。將信息放入多個(gè)域 中可減少其中嵌入了媒體標(biāo)記的媒體的操作將導(dǎo)致所有媒體標(biāo)記信 息消除的可能性。不同的域也可用作由每一個(gè)用戶獨(dú)立嵌入的不同信 息的栽體,以保護(hù)在相同內(nèi)容中的不同位置和時(shí)間應(yīng)用的若干獨(dú)立的 標(biāo)記。
嵌入位置的修改在另一實(shí)施例中,利用密碼處理使嵌入位置得到保護(hù)以防止未經(jīng) 授權(quán)地去除媒體標(biāo)記。該處理包括根據(jù)密鑰或密鑰序列來改變嵌入位 置。在時(shí)間間隔中可偽隨機(jī)地被生成密鑰序列,或者可根據(jù)有效載荷 生成密鑰序列以便被嵌入,或者可通過用戶來提供密鑰序列。在一些 本發(fā)明的實(shí)施例中,在每一個(gè)幀內(nèi)實(shí)施變化,并且使用幀的相同位置 以嵌入比其它位置更強(qiáng)的標(biāo)記。這些變化對于每一個(gè)幀和對于不同電 影中的相同幀來講不相同。該變化妨礙了在不知道密鑰的情況下嵌入 處理的理想反轉(zhuǎn)。因?yàn)閷τ诮沂净蜃R別媒體標(biāo)記不需要密鑰,所以密 鑰是非對稱的。僅對于嵌入和去除媒體標(biāo)記需要密鑰。在嵌入后,如 果不需要去除,那么可丟棄該密鑰。
在本發(fā)明的其它實(shí)施例中,使用另一密鑰或密鑰序列來通過改變 在幀中圖形的位置而對幀序列實(shí)施變化??稍跁r(shí)間間隔中偽隨機(jī)地生 成密鑰序列,或者可根據(jù)要被嵌入的有效栽荷生成密鑰系列,或者可 通過用戶來提供密鑰序列。取決于密鑰序列,不同的幀序列會(huì)包含不 同位置的圖形,并且因而形成的電影的間隔會(huì)包含不同的標(biāo)記。由于 去除內(nèi)容的試圖通常實(shí)施到整部電影,所以提高了安全性,并且盡管 其可能影響一個(gè)間隔,但是在其它間隔中可能不明顯地影響標(biāo)記。為 了揭示,可存儲該密鑰序列,因?yàn)槠湓诮沂酒陂g會(huì)有幫助于而鑒別具 有相同位置的媒體標(biāo)記的幀序列。
在音頻中嵌入媒體標(biāo)記
盡管上述的許多實(shí)施例說明了媒體標(biāo)記對視頻的應(yīng)用,但是以對 視頻所描述的類似方式可將音頻媒體標(biāo)記添加到音頻。媒體標(biāo)記是短 音頻,其由信號音調(diào)或口述的單詞或數(shù)字組成。媒體標(biāo)記(音頻標(biāo)記) 以弱的、不可聽見的方式被重復(fù)地嵌入媒體內(nèi)容中。在一個(gè)實(shí)施例中, 對音頻標(biāo)記可感知地整形,在修改的可聽見性較弱的位置應(yīng)用較強(qiáng)的 標(biāo)記。這些是表示許多其它可聽見頻率的周期。通過對音頻應(yīng)用高通 濾波并且對短音頻標(biāo)記的長度的子區(qū)段求平均來執(zhí)行揭示。
在多個(gè)實(shí)施例中,音頻媒體標(biāo)記的長度是s秒,其被可感知地整形以及被重復(fù)地加到音頻。在檢測期間,將數(shù)字音頻分成s秒長度的 多個(gè)區(qū)段。利用高通濾波來處理這些區(qū)段并且對其進(jìn)行平均直到隱藏 的聲音對人成為可聽見的。
利用透鏡將媒體標(biāo)記嵌入視頻中 除了在媒體中嵌入媒體標(biāo)記的數(shù)字技術(shù),本發(fā)明的實(shí)施例還可利
用模擬技術(shù)。圖13A中示出了根據(jù)本發(fā)明實(shí)施例的利用透鏡可在視頻 序列中嵌入媒體標(biāo)記的系統(tǒng)的實(shí)施例。該系統(tǒng)利用具有視頻投影儀 605或記錄裝置的透鏡610將媒體標(biāo)記嵌入模擬視頻中,透鏡610被用 來在投影期間或錄制視頻期間嵌入標(biāo)記。透鏡610包括一個(gè)或多個(gè)半 透明字符615。字符615起著媒體標(biāo)記的作用并且表示視頻的標(biāo)識信 息。當(dāng)通過該透鏡投影視頻時(shí),標(biāo)識信息被重疊在所顯示的視頻上, 并且該字符被輕微地疊合在所投影的視頻上,以及因此造成了對所投 影視頻的修改,其類似于在本發(fā)明中公開的數(shù)字處理。這些字符的透 明度被調(diào)整到足夠弱,使得它們在投影的圖像上通常是不可察覺的 (為了說明的目的而在圖13A中示出),并且這些字符的透明度還被 調(diào)整到足夠強(qiáng)來輕微地改變所投影的視頻。利用根據(jù)再錄制內(nèi)容的數(shù) 字版本的本發(fā)明中公開的過程,這些改變通??杀唤沂尽T诹硪粚?shí)施
例中,透鏡被安全地固定在投影儀上或者利用防篡改密封來密封。該 應(yīng)用對于在所投影的視頻中隱藏像機(jī)標(biāo)識信息是有用的并且在錄制 時(shí)間保護(hù)運(yùn)動(dòng)畫面內(nèi)容。在另一實(shí)施例中,利用像機(jī)鏡頭來執(zhí)行媒體 標(biāo)記的嵌入,并且媒體標(biāo)記的嵌入被用來鑒別用于錄制的像機(jī)。
揭示媒體標(biāo)記
根據(jù)本發(fā)明實(shí)施例的揭示媒體中嵌入的媒體標(biāo)記通常包括使用 被設(shè)計(jì)來強(qiáng)調(diào)其中嵌入媒體標(biāo)記的媒體組分之間的細(xì)微差別的處理。 強(qiáng)調(diào)該差別使得對由嵌入處理引入的媒體的細(xì)微變化進(jìn)行強(qiáng)調(diào)。通過 對媒體的幾個(gè)間隔進(jìn)行結(jié)果累計(jì),該差別可被顯示以進(jìn)行識別。在多 個(gè)實(shí)施例中,由人來執(zhí)行所提取的媒體標(biāo)記的識別和解譯。人感知的能力經(jīng)常較高地適于降級的圖像或音頻的識別。在多個(gè)實(shí)施例中,通 過來自多個(gè)媒體組分的組合信息來揭示標(biāo)記,并且當(dāng)組合信息時(shí),執(zhí) 行檢查。根據(jù)媒體的不同部分使用多個(gè)媒體組分的能力意味著不需要 媒體的同步來揭示媒體標(biāo)記。當(dāng)與信息的組合同時(shí)執(zhí)行檢查時(shí),當(dāng)利 用足夠的清晰度揭示了媒體標(biāo)記時(shí),用戶可停止組合處理。在其它實(shí) 施例中,所有的媒體組分被組合或者可組合預(yù)定的媒體組分,并且然 后執(zhí)行檢查。圖14中示出了根據(jù)本發(fā)明實(shí)施例的揭示、識別和解譯嵌入媒體中 的媒體標(biāo)記的處理。處理340包括選擇第一媒體組分(342 )以及將來 自另外的媒體組分的信息與第一組分進(jìn)行組合以強(qiáng)調(diào)媒體標(biāo)記 (344)。然后檢查組合的信息(346),以及對關(guān)于媒體標(biāo)記是否已 用足夠的清晰度來揭示而執(zhí)行識別做出判斷(348)。當(dāng)媒體標(biāo)記沒 有被充分地揭示時(shí),來自另外的媒體組分的信息與先前組合的信息進(jìn) 行組合(344 )直到揭示媒體標(biāo)記為止。 一旦媒體標(biāo)記被揭示,則可 執(zhí)4亍識別(350 )。在許多實(shí)施例中,組合來自媒體組分的信息以強(qiáng)調(diào)媒體標(biāo)記包括 高通濾波。其可通過處理每幀的每一個(gè)像素來實(shí)現(xiàn),其中通過對其分 配對應(yīng)于在圍繞該像素的NxN像素區(qū)(例如,9x9)上拉伸的直方圖 的值來處理每一個(gè)幀的每一個(gè)像素。該操作是特定版本的高通濾波。 在一些實(shí)施例中,與密鑰無關(guān)地實(shí)施揭示處理,并且該揭示處理只根 據(jù)其內(nèi)容處理視頻的所有位置。在其它實(shí)施例中,以由密鑰限定的間 隔來處理媒體,如上所述。在許多實(shí)施例中,諸如對比度提高、鈍化 掩蔽、如直方圖拉伸的直方圖功能、自動(dòng)達(dá)到級別(auto to level)和 利用諸如Sobel濾波器或其它邊緣檢測濾波器的濾波器進(jìn)行濾波的應(yīng) 用的其它處理被用來強(qiáng)調(diào)媒體標(biāo)記。在幾個(gè)實(shí)施例中,對多個(gè)幀求平 均,并且然后應(yīng)用濾波處理。在其它實(shí)施例中,對多個(gè)幀進(jìn)行濾波, 并且然后平均經(jīng)過濾波的幀以強(qiáng)調(diào)媒體標(biāo)記。圖15中示出了根據(jù)本發(fā)明實(shí)施例的揭示視頻序列中嵌入的媒體 標(biāo)記的處理。如以上所討論的,該揭示處理包括對不同的媒體組分所共同的不十分明顯的信息加高亮。在圖解說明的實(shí)施例中,將揭示處 理應(yīng)用到潛在地經(jīng)受了 一些轉(zhuǎn)換的標(biāo)記視頻中,該轉(zhuǎn)換諸如再錄制、 再編碼或?yàn)V波。首先,對于揭示處理,選擇可包括媒體標(biāo)記的視頻序列(405)。 從視頻序列中獲得視頻的幀(410)。如果有必要,那么將該幀轉(zhuǎn)換 到檢測域。在一些實(shí)施例中,對檢測域進(jìn)行解壓縮。根據(jù)該幀,選擇 適于對媒體標(biāo)記加高亮的像素的相關(guān)區(qū)域(415)。根據(jù)自從媒體標(biāo) 記的嵌入起視頻已經(jīng)經(jīng)受了的降級,由于媒體標(biāo)記造成的改變在每幀 的某些區(qū)域中可能較強(qiáng),并且因此對于揭示媒體標(biāo)記更為相關(guān)。這些 相關(guān)的區(qū)域可包括與先前的幀相比存在差異的像素區(qū)、包括相當(dāng)數(shù)量 的低頻信息的像素區(qū)或者通常適于揭示媒體標(biāo)記的像素區(qū)。然后強(qiáng)調(diào) 像素區(qū)內(nèi)的細(xì)微差別(420)。然后可對揭示的幀進(jìn)行組合(425),并且將該結(jié)果呈現(xiàn)給人類 觀察者以便檢測(430 )。在一些實(shí)施例中,然后可使用該結(jié)果來查 詢數(shù)據(jù)庫項(xiàng)、停止機(jī)器進(jìn)行錄制或者將該視頻是非法的拷貝通知給擁 有者或初始接收方。在許多實(shí)施例中,強(qiáng)調(diào)細(xì)微差別的處理包括在每一個(gè)色彩域(諸 如紅、綠和藍(lán))中針對每幀f的每一個(gè)位置x,y處的每一個(gè)像素Px,y,f的 下列處理的應(yīng)用。該處理包括NxN高通濾波的應(yīng)用(見以上討論)。A. 選擇區(qū)域Gx,y,f。這是圍繞像素Px,y,f的區(qū)域。在該示例中,GX,y,f的大小是9x9像素區(qū),并且在這種情況下,其由4個(gè)角落的像素位置 (x-4,y-4), (x+4,y-4), (x-4,y+4), (x+4,y+4)來限定。根據(jù)應(yīng)用到視頻和/ 或幀分辨率的變化,該區(qū)域的大小、寬度和高度可改變。B. 通過計(jì)算在區(qū)域Gx,y,f上的直方圖拉伸來強(qiáng)調(diào)區(qū)域Gx,y,f中的像 素之間的差別。然后,根據(jù)下述的公式,值Lp,x,y,f (直方圖拉伸的結(jié) 果)被存儲在像素Px,y,f的位置。Lp, x,y,f = ( Px,y,f - Lmin xy,f) *V/ ( Lmax x,y,廣Lmin x,yf) 其中,Lminx,y,f=在區(qū)域Gw中的任何像素的最小值;Lman x,y,f =在區(qū)域Gx,y,f中的任何像素的最大值;以及 Lp, x,y,f =對于像素Px,y,f的這種直方圖拉伸的結(jié)果。 V=最大像素值,最小像素值為O。C.通過確定在揭示的媒體標(biāo)記的位置(x, y)處的對應(yīng)像素Ex,y 來對每一個(gè)位置(x, y)處的每一個(gè)像素的處理過的幀求平均作為對 所有幀的Lp,的平均,如下列等式中所示的。Z7 — / ='其中,Nf =用于揭示處理的標(biāo)記幀的總量 Ex,y-在位置x, y處的已揭示的媒體標(biāo)記的像素 在幾個(gè)實(shí)施例中,以上算法的步驟B包括對比度提高、鈍化掩蔽、 高通濾波、直方圖拉伸、直方圖均衡化和諸如邊緣檢測濾波器實(shí)現(xiàn)的 邊緣檢測。最佳結(jié)果可根據(jù)視頻內(nèi)容和降級來改變。根據(jù)不同揭示方 法的結(jié)果可通過人員來分析,以便在任何給定應(yīng)用中選擇用于識別的 最佳結(jié)果。在幾個(gè)實(shí)施例中,例如,直接使用諸如在DCT壓縮幀而不是像素 中的DC系數(shù)之類的壓縮分量來執(zhí)行檢測。當(dāng)使用如MPEG1、 MPEG2 或H.264的DCT壓縮的視頻時(shí),DCT塊可被作為要被分析的區(qū)域?;?者,如果視頻序列具有足夠高的分辨率(例如,640x480像素),那 么可分析DC分量而不是單獨(dú)的像素。盡管根據(jù)本發(fā)明實(shí)施例不需要初始視頻序列來揭示媒體標(biāo)記,但 是接入初始視頻基本上可改進(jìn)所揭示的媒體標(biāo)記的清晰度。在處理之 前,可從利用媒體標(biāo)記所標(biāo)記的幀中減去初始視頻幀。圖16中示出了根據(jù)本發(fā)明實(shí)施例的應(yīng)用于視頻序列的揭示處理 的圖解說明示例。利用嵌入的媒體標(biāo)記示出了三個(gè)數(shù)字電影幀505、 510、 515,為了示范的目的,其為可視的。處理每一個(gè)視頻幀505、 510、 515以強(qiáng)調(diào)媒體標(biāo)記,如上所述。該處理分別產(chǎn)生了三個(gè)修改的 幀520、 525、 530。如上所述,組合^務(wù)改的幀520、 525、 530以獲得可視的且人可讀的揭示的媒體標(biāo)記540。當(dāng)在視頻序列或圖像組中揭示媒體標(biāo)記時(shí),盡管由于應(yīng)用到視頻 序列或圖像組的諸如旋轉(zhuǎn)、移位和拉伸之類的轉(zhuǎn)換造成了 一些幾何變 形,但是人的視覺系統(tǒng)通??蓤?zhí)行配準(zhǔn)并且可識別字符。幾何變形的 根源可包括在諸如利用攝像機(jī)再錄制的視頻處理期間所引入的幾何 轉(zhuǎn)換。此外,即使視頻已經(jīng)具有主動(dòng)應(yīng)用的幾何轉(zhuǎn)換來破壞水印或者 即使(例如,通過壓縮、轉(zhuǎn)換、色彩變換、附加噪聲等等)使視頻明 顯地降級,但是所揭示的媒體標(biāo)記仍然可讀。媒體標(biāo)記的機(jī)器識別在另一實(shí)施例中,媒體標(biāo)記包括計(jì)算機(jī)可讀信息。在利用揭示處 理對其進(jìn)行揭示之后,通過機(jī)器解譯揭示的媒體標(biāo)記以使能自動(dòng)讀 出。機(jī)器可讀信息可包括諸如或者字符(OCR字體,如OCR-A或 OCR-B)、條形碼(例如,線性條碼、堆疊式條碼、二維條碼)或者 可由計(jì)算機(jī)識別的符號的機(jī)器可讀元素。例如,條形碼包括以下符號 表示UPC、 Interleaved 2 of 5、 Code 39、 Code 93、 Code 128、 EAN, 堆疊式條碼符號表示,如PDF417,利用符號表示的也稱作矩陣碼 的2D條碼,如Aztec Code、 Bullseye、 DataGlyphs、 Datamatrix、 DotCode。為了識別,使用條碼讀取、模式識別或光學(xué)字符識別。去除媒體標(biāo)記在嵌入處理期間,只有某些視頻數(shù)據(jù)被修改,然而,為了揭示, 使用所有的視頻數(shù)據(jù)。因此,即使可識別揭示的媒體標(biāo)記,但是個(gè)體 變化的精確位置不能通過分析或者逆向操縱揭示處理而被觀察到。所 以,使媒體標(biāo)記免于未授權(quán)的去除,因?yàn)閷τ谌コ齺碇v必須知道嵌入 位置和修改。然而,如果知道媒體標(biāo)記、嵌入?yún)?shù)和所有隨后的修改, 那么嵌入處理是可逆的。如果需要去除媒體標(biāo)記,那么嵌入處理可以 被逆轉(zhuǎn),使得視頻好像從來未被標(biāo)記過。去除媒體標(biāo)記的處理基本上 包括^f吏用嵌入處理的知識來反向地應(yīng)用嵌入處理。應(yīng)用的說明可將上述系統(tǒng)和技術(shù)用于基本上無限制范圍的應(yīng)用。提供下列作 為 一 系列應(yīng)用的示例,其中根據(jù)本發(fā)明實(shí)施例的系統(tǒng)和處理可以是有 用的。跟蹤保密的或取得版權(quán)的信息的無授權(quán)分發(fā)面對許多產(chǎn)業(yè)的問題是信息的未授權(quán)分發(fā)??墒褂酶鶕?jù)本發(fā)明實(shí)息中??衫弥T如接收方標(biāo)識號和時(shí)戳之類的信息來唯一地標(biāo)記每一 個(gè)分發(fā)的拷貝,并且如果該拷貝是公共可獲得的、或處于未經(jīng)授權(quán)來 擁有該信息的個(gè)體或?qū)嶓w的擁有中,那么可揭示該信息并且可鑒別作 為媒體的接收方和未經(jīng)授權(quán)分發(fā)的可能的源的個(gè)人或?qū)嶓w。在多個(gè)實(shí)例中,在制作和授權(quán)的分發(fā)期間,保密的或取得版權(quán)的 信息在幾個(gè)不同的實(shí)體和/或個(gè)體之間傳遞。在幾個(gè)實(shí)施例中,在沒有 授權(quán)的情況下信息從其被分發(fā)的點(diǎn)可在交付前、通過嵌入與信息的最 終接收方關(guān)聯(lián)的媒體標(biāo)記來確定??苫诒患拥矫襟w的最終媒體標(biāo)記 來鑒別負(fù)責(zé)未授權(quán)分發(fā)的實(shí)體或個(gè)體然后。其中分發(fā)取得版權(quán)的信息的 一般實(shí)例是通過網(wǎng)絡(luò)對媒體播放器 分發(fā)取得版權(quán)的媒體。在多個(gè)實(shí)施例中,播放器是諸如機(jī)頂盒或個(gè)人 計(jì)算機(jī)之類的用戶電子設(shè)備。通常以壓縮和加密的形式將取得版權(quán)的 媒體分發(fā)到播放器。在解密后,根據(jù)本發(fā)明的實(shí)施例可將媒體標(biāo)記嵌 入媒體中。媒體標(biāo)記可包含與播放器的擁有者相關(guān)的信息以及標(biāo)識傳 送或播放的時(shí)間的信息。如果知道信息的接收方,那么將被嵌入的信 息可通過提供媒體的服務(wù)器(或首端)來生成。也可通過服務(wù)器將嵌 入的信息存入數(shù)據(jù)庫,其包括諸如用戶的賬單信息之類的有關(guān)交易的 附加信息和有關(guān)接收設(shè)備的細(xì)節(jié)。在其它實(shí)施例中,播放器維持諸如 播放器標(biāo)識號和時(shí)間的信息,其在存儲和/或回放期間作為媒體標(biāo)記被 嵌入。其中未授權(quán)的分發(fā)是普遍問題的另 一 實(shí)例是在媒體的制作中。在 制作期間,內(nèi)容易于被未授權(quán)的分發(fā),其可能對媒體的出品人造成極 大的損害。在多個(gè)實(shí)施例中,媒體標(biāo)記在制作的各個(gè)階段期間被嵌入 媒體中,其標(biāo)識媒體的接收方和媒體的接收時(shí)間。如果使拷貝可^^共 地獲得,那么可揭示媒體標(biāo)記并且可鑒別負(fù)責(zé)人或?qū)嶓w。在上述的多個(gè)實(shí)施例中,針對分發(fā)的媒體而創(chuàng)建感知模型,并且 利用該媒體對其進(jìn)行存儲和分發(fā)。因?yàn)槊襟w標(biāo)記被嵌入媒體中,所以 然后可使用感知模型。在其它實(shí)施例中,每當(dāng)媒體標(biāo)記被嵌入媒體中 時(shí),創(chuàng)建感知模型。所有權(quán)的驗(yàn)證一旦媒體經(jīng)歷了公共分發(fā),在媒體中驗(yàn)證版權(quán)的所有權(quán)可能成了 問題。在多個(gè)實(shí)施例中,使媒體標(biāo)記嵌入媒體中以驗(yàn)證內(nèi)容的所有權(quán)。 在多個(gè)實(shí)施例中,媒體標(biāo)記包括對于取得版權(quán)的內(nèi)容的所有權(quán)信息或 標(biāo)識。該標(biāo)記可被自動(dòng)讀取并且可評估它的存在與否以限制或允許分 發(fā),或者證明分發(fā)媒體的源是該媒體的合法分發(fā)者。也可以使用該標(biāo) 記,使得相對于內(nèi)容有興趣獲得權(quán)利的實(shí)體或個(gè)體通過揭示嵌入的媒 體標(biāo)記可鑒別內(nèi)容的擁有者。對于由特定用戶或用戶組擁有的內(nèi)容來 講,標(biāo)識擁有者的媒體標(biāo)記的另 一使用是在例如通過因特網(wǎng)可接入的 公共可用的數(shù)據(jù)庫中自動(dòng)鑒別內(nèi)容以防止進(jìn)一步地分發(fā)。最終,在爭 論的情況下,該標(biāo)記可被用來驗(yàn)證所有權(quán)。存儲魯棒的元信息在長期的存儲和存檔期間,利用媒體存儲的信息可能被丟失,這 或是因?yàn)槠浔慌既坏貏h除或是因?yàn)槠洳豢杀蛔x取。本發(fā)明的許多實(shí)施 例被配置成利用媒體標(biāo)記來存儲有關(guān)媒體的信息。利用媒體標(biāo)記存儲 信息可使得能在格式改變后取回信息,并且不需要額外的存儲空間??截惪刂圃诙鄠€(gè)實(shí)施例中,機(jī)器可讀的強(qiáng)媒體標(biāo)記可被嵌入媒體中。然后 通過播放器可使用媒體標(biāo)記以控制媒體的回放和/或錄制。播放器可揭 示媒體標(biāo)記并且確定播放媒體所需要的授權(quán)。如果播放器具有適當(dāng)?shù)?授權(quán),那么播放器可播放媒體或拒絕回放。廣播監(jiān)視通過電視或廣播臺,根據(jù)本發(fā)明實(shí)施例的機(jī)器可讀媒體標(biāo)記也可 被嵌入媒體廣播中。然后通過接收設(shè)備可使用機(jī)器可讀媒體標(biāo)記以自 動(dòng)錄制作為廣播的內(nèi)容并且跟蹤廣播的頻率和時(shí)間。嵌入媒體中的媒 體標(biāo)記針對每項(xiàng)工作和廣播可能是不同的。保密通信如上所述,媒體標(biāo)記可用來利用媒體傳送保密信息。盡管可觀察 到媒體的傳送,但是事實(shí)上媒體包含另外的媒體標(biāo)記是不明顯的并且 可被用來傳送信息,而不允許其它人觀察到除了媒體內(nèi)容之外還傳送 信息。公共顯示的媒體的標(biāo)識被公共顯示的媒體經(jīng)常是錄制的對象。在多個(gè)實(shí)施例中,媒體標(biāo) 記被嵌入公共顯示的媒體中,其標(biāo)識公共顯示的時(shí)間和/或位置。如果 在公共顯示期間再錄制媒體,那么媒體標(biāo)記被嵌入未授權(quán)的再錄制, 并且揭示該信息可有助于阻止將來在其中進(jìn)行再錄制的場所再錄制 公共顯示的媒體。盡管以上說明包含了許多特定的本發(fā)明的實(shí)施例,但是這些將不 構(gòu)成對本發(fā)明范圍的限制,而是作為本發(fā)明的一個(gè)實(shí)施例的示例。所 以,通過圖解說明的實(shí)施例并不應(yīng)該確定本發(fā)明的范圍,而是通過所 附權(quán)利要求和它們的等價(jià)物來確定。
權(quán)利要求
1.一種在承載媒體中嵌入信息的方法,包括以媒體的形式呈現(xiàn)所述信息;從所述承載媒體中選擇多個(gè)媒體組分;將被呈現(xiàn)的媒體的至少一部分與該承載媒體的所選擇的媒體組分中的每個(gè)媒體組分組合以形成修改后的媒體組分,其中對所述修改后的媒體組分的所述修改對于人類觀察者是不可見的;以及使用所述修改后的媒體組分來創(chuàng)建修改后的承載媒體。
2. 如權(quán)利要求l所述的方法,其中 所迷承載媒體包括視頻序列; 承載媒體的每個(gè)所述媒體組分是單個(gè)視頻幀;并且 所述被呈現(xiàn)的媒體是圖像。
3. 如權(quán)利要求2所述的方法,還包括改變表示所述被呈現(xiàn)的媒體 的所迷圖像的幾何形狀。
4. 如權(quán)利要求l所述的方法,其中,將所述被呈現(xiàn)的媒體的部分 與所述承載媒體的每個(gè)所述媒體組分組合包括根據(jù)感知模型來修改 所述被呈現(xiàn)的媒體。
5. 如權(quán)利要求l所述的方法,其中,偽隨機(jī)地選擇被呈現(xiàn)的媒體 的、與所述承載媒體的媒體組分組合的部分。
6. 如權(quán)利要求l所述的方法,其中 所述承栽媒體包括音頻序列,所述承栽媒體的每個(gè)所述媒體組分是一段音頻,并且 所述被呈現(xiàn)的媒體是音頻序列。
7. 如權(quán)利要求l所述的方法,其中 所述承載媒體包括視頻;并且所述被呈現(xiàn)的媒體包括通過其可投影或錄制視頻的透鏡。
8. 如權(quán)利要求l所述的方法,其中,所述信息包括與所述媒體相 關(guān)的元數(shù)據(jù)。
9. 如權(quán)利要求l所述的方法,其中,所述信息標(biāo)識視頻回放的時(shí) 間和位置。
10. 如權(quán)利要求l所述的方法,其中,所述信息標(biāo)識版權(quán)擁有者 或媒體的接收方。
11. 如權(quán)利要求l所述的方法,其中,所述信息包括對數(shù)據(jù)庫的引用。
12. —種從承載媒體揭示嵌入媒體的方法,包括 從所述承載媒體中選擇多個(gè)媒體組分; 選擇每個(gè)所述媒體組分的至少一部分; 強(qiáng)調(diào)來自所述媒體組分的所述部分;以及 組合來自所述媒體組分的所述部分。
13. 如權(quán)利要求12所述的方法,其中,強(qiáng)調(diào)所述媒體組分的部分 包括對每個(gè)媒體組分應(yīng)用高通濾波。
14. 如權(quán)利要求12所述的方法,其中,強(qiáng)調(diào)所述媒體組分的部分體的所述承載媒體。
15. 如權(quán)利要求12所述的方法,其中 所述承載媒體包括視頻序列; 所述嵌入媒體包括數(shù)字圖像;每個(gè)媒體組分是視頻幀,并且被強(qiáng)調(diào)的每個(gè)視頻幀的部分包括一 組像素。
16. 如權(quán)利要求12所述的方法,其中,將所述媒體組分的每個(gè)部 分組合在一起包括對所述媒體組分的每個(gè)部分求平均。
17. 如權(quán)利要求12所述的方法,其中,在組合所述媒體組分的所 述部分之后,通過一設(shè)備來識別所述嵌入媒體。
18. 如權(quán)利要求12所述的方法,其中 所述承載媒體包括音頻序列; 所述嵌入媒體包括音頻序列; 音頻的每個(gè)組分包括音頻序列的組分;并且 所述音頻序列的每個(gè)組分的所述部分包括一組音頻取樣。
全文摘要
描述了將信息重復(fù)嵌入媒體中的系統(tǒng)和方法,該信息可通過強(qiáng)調(diào)媒體之間的細(xì)微變化而恢復(fù)。在許多實(shí)施利中,感知模型被用來鑒別媒體組分,其中所嵌入的信息不大可能被人類觀察者看到。本發(fā)明的一個(gè)實(shí)施例包括以媒體的形式呈現(xiàn)所述信息;從所述承載媒體中選擇多個(gè)媒體組分;將被呈現(xiàn)的媒體的至少一部分與該承載媒體的所選擇的媒體組分中的每個(gè)媒體組分組合以形成修改后的媒體組分,其中對所述修改后的媒體組分的所述修改對于人類觀察者是不可見的;以及使用所述修改后的媒體組分來創(chuàng)建修改后的承載媒體。
文檔編號G06K9/00GK101273367SQ200680032570
公開日2008年9月24日 申請日期2006年7月19日 優(yōu)先權(quán)日2005年7月19日
發(fā)明者尼爾斯·索維爾瑟 申請人:美國唯美安視國際有限公司