專利名稱:視頻流中運(yùn)動(dòng)對(duì)象的標(biāo)記的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻流中對(duì)象的標(biāo)記。
當(dāng)我們“標(biāo)記”一個(gè)對(duì)象時(shí),他就把那個(gè)對(duì)象周圍(或那個(gè)對(duì)象附近)的視頻屏幕區(qū)建成“激活區(qū)”。如果觀眾隨后點(diǎn)擊這個(gè)激活區(qū),那么將調(diào)用一個(gè)鏈接。回來(lái)參照上例,如果賽車之一被標(biāo)記,那么,那個(gè)賽車的圖象的周圍或附近將是激活區(qū)。如果觀眾把光標(biāo)移動(dòng)到那個(gè)“激活區(qū)”,并在那個(gè)激活區(qū)上點(diǎn)擊一下,那么將會(huì)調(diào)用上述鏈接。
在賽車的視頻中,汽車不斷地運(yùn)動(dòng)著,并且它在視頻屏幕上的位置也在不斷地發(fā)生變化。這樣,與汽車相對(duì)應(yīng)的激活區(qū)也必然不斷地變化,以“跟上”汽車。因此,必須用與那輛汽車相適應(yīng)的激活區(qū)標(biāo)記視頻的每一幀。這往往通過(guò)圖象識(shí)別來(lái)完成。換句話來(lái)說(shuō),在編輯處理期間,視頻編輯設(shè)備識(shí)別汽車是否已經(jīng)從視頻屏幕的右側(cè)移動(dòng)到視頻屏幕的左側(cè)。如果這種情況已經(jīng)發(fā)生了,該編輯設(shè)備將為汽車在屏幕左側(cè)的那些視頻幀建立在屏幕左側(cè)的那輛汽車的新激活區(qū)。不幸的是,這種圖象識(shí)別存在著幾個(gè)問(wèn)題。例如,圖象識(shí)別系統(tǒng)通常利用對(duì)象的顏色來(lái)示蹤它的位置。如果對(duì)象移動(dòng)到照明發(fā)生變化的區(qū)域,例如,由于陰影投射到對(duì)象上,那就會(huì)妨礙精確的圖象識(shí)別。另外,圖象識(shí)別還存在著能夠把誤差引入到標(biāo)記對(duì)象的處理中的其它問(wèn)題。
圖象識(shí)別在現(xiàn)有技術(shù)中是眾所周知的,J.P.Lewis在“快速歸一化交叉相關(guān)”(“Fast Normalized Cross-Correlation”,http//www.idiom.com/~zilla/Papers/nvisionInterface/nip.htm)中;頒發(fā)給Walch等人的美國(guó)專利5,267,332;頒發(fā)給Netravali等人的美國(guó)專利4,611,347;頒發(fā)給Watson,III的美國(guó)專利4,868,871;R.O.Duda等人在由John Wiley和Sons于1973年出版的“模式分類和場(chǎng)景分析”(“Pattern Classfication and Scene Analysis”)中;和R.C.Gonzalez等人在由Addison-Wesley于1992出版的“數(shù)字圖象處理”(“DigitalImage Processing”)第3版中對(duì)圖象識(shí)別作了討論。把Lewis、Walch、Netravali、Watson、Duda和Gonzalez等人的著作或?qū)@性谶@里,以供參考。
我們可以不利用圖象識(shí)別設(shè)備,而是人工地標(biāo)記視頻的每一幀。但是,標(biāo)記視頻的每一幀是非常乏味和耗時(shí)的。需要的是能降低所需的人機(jī)交互量的、對(duì)運(yùn)動(dòng)對(duì)象進(jìn)行標(biāo)記的新方法。
概述根據(jù)本發(fā)明的方法包括用鏈接標(biāo)識(shí)視頻片段的步驟。(視頻片段可以是動(dòng)畫(huà),和正如在這里所使用的,“視頻”包括動(dòng)畫(huà))。這種鏈接可以是與網(wǎng)頁(yè)或與其它信息源的鏈接,或與應(yīng)用軟件的鏈接。在一個(gè)實(shí)施例中,例如,利用視頻編輯設(shè)備標(biāo)識(shí)視頻片段內(nèi)的第一組幀。在這個(gè)標(biāo)識(shí)步驟中,每個(gè)標(biāo)識(shí)幀的一部分被指定為“激活區(qū)”。這意味著,如果我們把光標(biāo)移動(dòng)到激活區(qū),并在激活區(qū)內(nèi)點(diǎn)擊,那么將執(zhí)行與激活區(qū)相關(guān)聯(lián)的鏈接。
激活區(qū)通常與一個(gè)對(duì)象的圖象,例如,沿著跑道競(jìng)賽的汽車、場(chǎng)景中的演員、顯示在商業(yè)廣告節(jié)目中的產(chǎn)品、卡通角色、或一些其它人物或物體的圖象相關(guān)聯(lián)。這樣,在對(duì)幀進(jìn)行標(biāo)識(shí)時(shí),標(biāo)識(shí)視頻片段的人員將建立與那個(gè)對(duì)象相關(guān)聯(lián)的激活區(qū)的位置。(激活區(qū)通常是所考慮的對(duì)象周圍的長(zhǎng)方形或圓形區(qū)域。)按照這種方式標(biāo)識(shí)視頻片段中的每一幀是極為繁重的。因此,按照本發(fā)明,只標(biāo)識(shí)幀的一個(gè)子組(例如,每隔9幀)。在其它幀中的激活區(qū)的位置通過(guò)內(nèi)插方法建立。位置可以通過(guò)線性內(nèi)插技術(shù)建立?;蛘撸恢每梢酝ㄟ^(guò)諸如樣條內(nèi)插技術(shù)的生成曲線的內(nèi)插技術(shù)建立。
在按照本發(fā)明的方法的另一個(gè)實(shí)施例中,人工標(biāo)識(shí)幀的一個(gè)子組,例如,像幀序列的第一幀和最后一幀這樣的兩幀。接著,視頻編輯系統(tǒng)根據(jù)內(nèi)插算法,計(jì)算在序列中的這些人工標(biāo)識(shí)幀之間的每一幀的激活區(qū)的位置。然后,系統(tǒng)為每一幀確定激活區(qū)的內(nèi)插位置與相關(guān)于激活區(qū)的對(duì)象的位置之間的差異。這個(gè)計(jì)算是基于圖象識(shí)別的。圖象識(shí)別可以通過(guò)圖象識(shí)別軟件來(lái)實(shí)現(xiàn)?;蛘撸瑘D象識(shí)別可以通過(guò)硬件和軟件的組合體來(lái)實(shí)現(xiàn)(圖象識(shí)別也可以通過(guò)硬件來(lái)實(shí)現(xiàn)。硬件和軟件之間的分配可以用不同方式進(jìn)行)。此后,系統(tǒng)高亮顯示已經(jīng)由系統(tǒng)確定其呈現(xiàn)最大誤差的那些幀。即,系統(tǒng)高亮顯示激活區(qū)與相關(guān)于該激活區(qū)的對(duì)象之間的距離最大的那些幀。本領(lǐng)域的普通技術(shù)人員可以根據(jù)所選區(qū)域和對(duì)象內(nèi)各點(diǎn)之間的最大、最小或平均距離,定義激活區(qū)和對(duì)象之間的距離。
在一個(gè)實(shí)施例中,系統(tǒng)用最大誤差來(lái)標(biāo)志(flag)幀。在另一個(gè)實(shí)施例中,系統(tǒng)用n個(gè)最大誤差來(lái)標(biāo)志n個(gè)幀,此處n是整數(shù)。在另一個(gè)實(shí)施例中,系統(tǒng)標(biāo)志誤差在某一閾值以上的所有幀。
此后,標(biāo)識(shí)視頻片段的那個(gè)人可以觀察受標(biāo)志的幀,并決定他或她是否需要去人工標(biāo)識(shí)那些幀。標(biāo)識(shí)視頻片段的那個(gè)人還擁有重新計(jì)算內(nèi)插值的選項(xiàng)。在重新計(jì)算內(nèi)插值之后,用戶可以看一下可能需要人工標(biāo)識(shí)的其它幀是否都得到標(biāo)志。
標(biāo)志可以通過(guò)在顯示器上高亮顯示標(biāo)志幀來(lái)實(shí)現(xiàn),也可以通過(guò)提供一些其它形式的輸出指示符來(lái)實(shí)現(xiàn)。
根據(jù)本發(fā)明的另一個(gè)方面,把視頻信號(hào)發(fā)送到一個(gè)或多個(gè)視頻觀看系統(tǒng),以便一個(gè)或多個(gè)觀眾可以觀看視頻信號(hào)。視頻信號(hào)可以向許多觀眾廣播。相關(guān)于視頻信號(hào)的一些幀、但不是視頻信號(hào)的其它幀的視頻信號(hào)的一個(gè)或多個(gè)激活區(qū)的位置也被傳送到一個(gè)或多個(gè)視頻觀看系統(tǒng)。一個(gè)或多個(gè)視頻觀看系統(tǒng)通過(guò)內(nèi)插法確定一個(gè)或多個(gè)其它幀的激活區(qū)的位置。這樣,無(wú)需把與每一幀的激活區(qū)位置有關(guān)的數(shù)據(jù)提供給視頻觀看系統(tǒng),而只為所選幀提供這樣的數(shù)據(jù),并且視頻觀看系統(tǒng)通過(guò)利用例如線性內(nèi)插技術(shù)或樣條內(nèi)插技術(shù)等內(nèi)插法,計(jì)算其它幀的激活區(qū)應(yīng)該在什么地方。由于視頻信號(hào)源不需要為信號(hào)的每一幀提供激活區(qū)信息,因此降低了傳送這個(gè)信息的帶寬要求。
在一個(gè)實(shí)施例中,不僅激活區(qū)的位置以這種方式傳送,而且激活區(qū)的尺寸也以這種方式傳送的。
根據(jù)本發(fā)明的另一個(gè)方面,包括一組幀的視頻信號(hào)與一些幀、但不是其它幀的激活區(qū)的位置一起被傳送。激活區(qū)對(duì)應(yīng)于在那些幀中所描繪的對(duì)象。該對(duì)象可以是產(chǎn)品、人物、卡通角色、或可以在視頻中描繪的其它任何東西。如上所述,盡管在其它幀中也描繪了對(duì)象,但并不傳送其它幀的激活區(qū)。接收系統(tǒng)根據(jù)所述一些幀的激活區(qū)的位置,通過(guò)內(nèi)插法計(jì)算激活區(qū)的位置。這樣,降低了用于傳送激活區(qū)位置的帶寬要求。
詳細(xì)描述
圖1顯示了描繪標(biāo)記編輯器的典型圖形用戶界面(“GUI”)的顯示屏100。這樣的界面可以用在根據(jù)本發(fā)明的方法中。屏幕100在編輯區(qū)中顯示了一列所謂關(guān)鍵幀100a至101p。正如在現(xiàn)有技術(shù)中所知的,視頻圖象包括一列幀。對(duì)于數(shù)字視頻,每一幀對(duì)應(yīng)于一個(gè)像素陣列。每個(gè)像素是與幀的一個(gè)小區(qū)的顏色、亮度和飽和度相對(duì)應(yīng)的數(shù)據(jù)值。在某些視頻壓縮或加密方案中,不是存儲(chǔ)每一幀的每個(gè)像素陣列,而只存儲(chǔ)某些“關(guān)鍵幀”的整個(gè)像素陣列。對(duì)其它幀,僅存儲(chǔ)代表那些其它幀中的圖象與前面關(guān)鍵幀中的圖象之間的差異的數(shù)據(jù)。使用這種方案的壓縮技術(shù)的例子是MPEG-2(運(yùn)動(dòng)圖象專家組標(biāo)準(zhǔn)2)。
對(duì)于未經(jīng)壓縮或加密的線性數(shù)字化模擬視頻的情況,可以每隔n-1個(gè)幀(例如,每隔9個(gè)幀)選擇一幀作為關(guān)鍵幀(與場(chǎng)景變化相對(duì)應(yīng)的幀)。如上所述,屏幕100描繪了一列關(guān)鍵幀101a至101p。
在屏幕100上沒(méi)有描繪出箭頭104a至104d。把箭頭箭頭104a至104d包括在圖1中僅僅是為了用符號(hào)表示幀的時(shí)間順序。
屏幕100包括描繪關(guān)鍵幀101a至101p之一的區(qū)域106。與在屏幕上其它地方描繪的關(guān)鍵幀101a至101p相比,區(qū)域106中的圖象被放大了,并且,它還代表當(dāng)前正在編輯的幀。在圖1的例子中,正在編輯關(guān)鍵幀101g。這通過(guò)在幀101g中呈現(xiàn)的圖標(biāo)或標(biāo)記101g′來(lái)表示。
通常,屏幕100還描繪諸如快進(jìn)、快退、新文件等功能的導(dǎo)航欄和工具欄。驅(qū)動(dòng)顯示器100的系統(tǒng)包括用于支持導(dǎo)航欄和工具欄的軟件驅(qū)動(dòng)程序。為了簡(jiǎn)潔起見(jiàn),在圖1未示出這些導(dǎo)航欄和工具欄。
在屏幕100上顯示的還有使用戶能夠選擇相關(guān)于觀眾能夠點(diǎn)擊的對(duì)象的激活區(qū)的形狀的菜單框100。方框100使編輯者能夠在可用于激活區(qū)的許多不同形狀中只選擇在圖1中描繪的一些形狀。如上所述,激活區(qū)是在屏幕上顯示的感興趣的對(duì)象(例如,汽車或人物)的位置。通過(guò)在與那個(gè)對(duì)象或人物相關(guān)聯(lián)的激活區(qū)內(nèi)點(diǎn)擊,我們就可以有效地點(diǎn)擊在那個(gè)對(duì)象或人物上。
(當(dāng)觀眾最后觀看視頻片段時(shí),可以顯示、也可以不顯示激活區(qū)。例如,顯示視頻的系統(tǒng)可以高亮顯示激活區(qū)?;蛘?,顯示視頻的其它系統(tǒng)也可以不高亮顯示激活區(qū)。在另一些系統(tǒng)中,觀眾可以擁有決定是否高亮顯示激活區(qū)的選項(xiàng)。)回來(lái)參照?qǐng)D1,方框110是讓編輯者把鏈接引入圖象的菜單框,它通常是URL。但是,可以提供其它類型的鏈接,包括啟用所需應(yīng)用軟件的專門鏈接。
如圖1所示,區(qū)域106描繪了一個(gè)人112,他的頭部113已經(jīng)用正方形114標(biāo)記上,并且鏈接到鏈接L1(正方形形狀是從菜單框108中選擇出來(lái)的,并且鏈接L1是從菜單框110中選擇出來(lái)的)。正方形114代表激活區(qū)。在播放視頻中場(chǎng)景時(shí),對(duì)象(例如,人物的頭部)通常以有限、非跳動(dòng)的方式移動(dòng)(在電影、電視節(jié)目或其它視頻的拍攝過(guò)程中的良好鏡頭控制,通常涉及到使屏幕上感興趣對(duì)象的任何跳動(dòng)達(dá)到最小的問(wèn)題。此外,當(dāng)觀眾觀看經(jīng)標(biāo)識(shí)的視頻時(shí),即使密切注視著以跳動(dòng)方式移動(dòng)的小對(duì)象,也難以盯住目標(biāo))。
正方形114代表當(dāng)觀眾想要訪問(wèn)與人物112相鏈接的信息時(shí)、他將點(diǎn)擊的視頻屏幕的激活區(qū)。例如,如果視頻是肥皂劇,并且觀眾想要獲取有關(guān)由人物112扮演的角色的更多信息,那么,他將點(diǎn)擊在人物112上,具體地說(shuō),他將把光標(biāo)定位在正方形114所代表的那個(gè)激活區(qū)內(nèi)。
在視頻播放時(shí),人物112通常相對(duì)于布景移動(dòng)。于是,有必要讓激活區(qū)114相對(duì)于屏幕移動(dòng)。這是必要的,因?yàn)槿绻宋?12從視頻屏幕的左側(cè)行走到視頻屏幕的右側(cè),并且觀眾想要弄清楚有關(guān)人物112的更多情況,那么,他就要點(diǎn)擊在人物112的當(dāng)前位置上。
從原理上,我們能夠標(biāo)識(shí)視頻的每一幀,以確定應(yīng)該把激活區(qū)114定位在什么地方,但是,這樣做將是非常單調(diào)乏味的費(fèi)時(shí)工作。于是,需要簡(jiǎn)化這種工作。根據(jù)本發(fā)明,通過(guò)把激活區(qū)114定位在適當(dāng)?shù)奈恢蒙蟻?lái)標(biāo)識(shí)一些幀(這可以人工地或通過(guò)其它技術(shù)來(lái)完成)。其它幀則通過(guò)如下所述的內(nèi)插方法來(lái)標(biāo)識(shí)。
圖2顯示了對(duì)于從起始幀A到結(jié)束幀D的一系列幀的每幀視頻中頭部113沿著y方向的位置。點(diǎn)203代表在場(chǎng)景的開(kāi)始處頭部113的起始位置,和點(diǎn)204代表在場(chǎng)景的結(jié)尾處頭部113的結(jié)束位置。線206隨著場(chǎng)景演化而示蹤頭部113在點(diǎn)203和204之間的位置(例如,在視頻播放時(shí),隨著人物112相對(duì)于布景的移動(dòng),頭部113改變著它的位置)。
直線208示出了通過(guò)在兩個(gè)位置203和204之間連成一條直線得出的直接線性內(nèi)插。即,不是人工地標(biāo)識(shí)每一幀、而是通過(guò)在位置203和204之間進(jìn)行線性內(nèi)插,自動(dòng)地把激活區(qū)114的位置插入到每一幀中??梢钥闯?,這決不是標(biāo)識(shí)幀的最精確方式。我們可以通過(guò)人工地標(biāo)識(shí)更多的幀、并在已經(jīng)進(jìn)行了人工標(biāo)識(shí)的幀與幀之間進(jìn)行線性內(nèi)插,來(lái)改善線性內(nèi)插的精度。
圖2還顯示了中間點(diǎn)216和218,它們分別表示幀B和C中頭部113的位置。在一個(gè)實(shí)施例中,對(duì)于一組幀,例如,幀A、B、C和D,人工地(例如,可視地)插入激活區(qū)114的位置。激活區(qū)114的位置通過(guò)在已經(jīng)人工地標(biāo)識(shí)了激活區(qū)114的位置的點(diǎn)與點(diǎn)之間進(jìn)行線性內(nèi)插來(lái)建立。因此,在圖2中,直線224、226和228是分別在點(diǎn)203和216之間、點(diǎn)216和218之間以及點(diǎn)218和204之間進(jìn)行線性內(nèi)插的結(jié)果。
內(nèi)插法的更精確方式是使用可以生成代表對(duì)象從一幀到另一幀的位置的曲線的內(nèi)插技術(shù)。這樣的技術(shù)的例子有樣條內(nèi)插法。當(dāng)執(zhí)行樣條內(nèi)插時(shí),我們通常只需要端點(diǎn)和一二個(gè)中間點(diǎn),并且樣條內(nèi)插技術(shù)將精確地計(jì)算出對(duì)象的軌跡。樣條技術(shù)將使運(yùn)動(dòng)平滑化并消除經(jīng)過(guò)圖象識(shí)別常看到的那種跳動(dòng)。
應(yīng)該明白,我們不僅必須沿著y方向建立對(duì)象的位置,而且必須沿著x方向建立對(duì)象的位置。因此,在使用根據(jù)本發(fā)明的方法的過(guò)程中,將通過(guò)內(nèi)插法在y和x方向上建立激活區(qū)的位置。另外,在視頻場(chǎng)景的演化過(guò)程中,能夠放大或縮小與激活區(qū)相關(guān)聯(lián)的對(duì)象,例如,因?yàn)樗x攝像機(jī)更近了或離攝像機(jī)更遠(yuǎn)了。于是,在一個(gè)實(shí)施例中,在一個(gè)場(chǎng)景期間中,還要為幾個(gè)幀人工標(biāo)識(shí)激活區(qū)114的尺寸,并在此后,使用與用于對(duì)象位置相同的方式,內(nèi)插激活區(qū)的尺寸。
圖3是顯示根據(jù)本發(fā)明第一實(shí)施例的方法的方框圖。參照?qǐng)D3,該方法開(kāi)始于把一塊視頻幀裝載到存儲(chǔ)器中(步驟301)。存儲(chǔ)器可以是磁性存儲(chǔ)器(例如,磁盤、磁帶或磁光盤)。存儲(chǔ)器也可以是光盤或半導(dǎo)體存儲(chǔ)器,諸如DRAM(動(dòng)態(tài)隨機(jī)讀寫(xiě)存儲(chǔ)器)、SRAM(靜態(tài)隨機(jī)讀寫(xiě)存儲(chǔ)器)、EPROM(可擦除可編程只讀存儲(chǔ)器)或其它類型的存儲(chǔ)器。視頻信息可以是模擬形式,也可以是數(shù)字形式。
此后,我們?nèi)斯さ貥?biāo)識(shí)那些幀的一個(gè)子組(步驟302)。在這個(gè)人工標(biāo)識(shí)步驟中,通常在屏幕100的部分101a至101p上顯示一組幀,并且每次可以選擇那些幀之一進(jìn)行標(biāo)識(shí)。所選幀顯示在屏幕100的部分106上。在正在標(biāo)識(shí)的那些幀內(nèi)建立激活區(qū)的位置、尺寸和形狀,并且建立與那個(gè)激活區(qū)相關(guān)聯(lián)的鏈接。人工標(biāo)識(shí)可以利用鼠標(biāo)、觸板、操縱桿、跟蹤球、光標(biāo)控制鍵之類的輸入設(shè)備或視頻編輯系統(tǒng)的其它輸入設(shè)備進(jìn)行。在這個(gè)步驟中,例如,按如下所述,把標(biāo)識(shí)信息存儲(chǔ)在存儲(chǔ)器中。
對(duì)于不人工標(biāo)識(shí)的幀,通過(guò)內(nèi)插法進(jìn)行標(biāo)識(shí)(步驟303)。這可以通過(guò)如下任何步驟來(lái)執(zhí)行a)線性內(nèi)插激活區(qū)的位置、和線性內(nèi)插激活區(qū)的尺寸;b)線性內(nèi)插激活區(qū)的位置、和激活區(qū)尺寸不變;c)樣條內(nèi)插激活區(qū)的位置、和樣條內(nèi)插激活區(qū)的尺寸;或d)樣條內(nèi)插激活區(qū)的位置、和激活區(qū)尺寸不變。
可以用其它內(nèi)插技術(shù)代替線性或樣條內(nèi)插法。舉例來(lái)說(shuō),內(nèi)插可以是a)在視頻片段中的起始幀和結(jié)束幀之間;或b)從每個(gè)人工標(biāo)識(shí)幀到下一人工標(biāo)識(shí)幀的內(nèi)插(通常,片段的起始幀和結(jié)束幀都在人工標(biāo)識(shí)的那些幀之內(nèi))。
參照方塊304,內(nèi)插可能對(duì)激活區(qū)的位置造成誤差。即,在對(duì)象的位置和與那個(gè)對(duì)象相關(guān)聯(lián)的激活區(qū)的位置之間將存在著差異。在內(nèi)插之后,標(biāo)識(shí)視頻片段的人員可以觀看屏幕100的部分101a至101p上各個(gè)幀的激活區(qū)的位置。如果這些幀之一顯示出在對(duì)象113和激活區(qū)114的位置之間存在巨大差異,那么,標(biāo)識(shí)視頻片段的人員可以人工標(biāo)識(shí)那個(gè)幀,并讓編碼系統(tǒng)重新計(jì)算(例如,通過(guò)內(nèi)插法)所有還沒(méi)有經(jīng)過(guò)人工標(biāo)識(shí)的那些幀的激活區(qū)位置。
在建立了激活區(qū)114的位置之后,標(biāo)識(shí)視頻片段的人員為用戶選擇所表示的鏈接的形式。除了使用方框、圓形、橢圓形或其它形狀之外,還可以把激活區(qū)描繪成標(biāo)志圖(例如,GIF文件)、一段動(dòng)畫(huà)(例如,畫(huà)成動(dòng)畫(huà)的GIF文件)或其它視頻流片段(GIF是圖形交換格式的縮寫(xiě))。如上所述,可選地,當(dāng)以后觀看經(jīng)標(biāo)識(shí)的視頻片段時(shí),可以可視地指示激活區(qū)。
參照方塊306,在進(jìn)行內(nèi)插之前或之后,可以將到URL的鏈接與每個(gè)激活區(qū)相關(guān)聯(lián)。因此,當(dāng)觀眾點(diǎn)擊在那個(gè)激活區(qū)上時(shí),將調(diào)用該URL。如上所述,該鏈接不一定是到URL的。它也可以是到應(yīng)用軟件、或到存儲(chǔ)在特定地址上的信息源的鏈接。
圖4顯示了用于標(biāo)記視頻片段的視頻編輯器/播放器的實(shí)施例的數(shù)據(jù)結(jié)構(gòu)。這樣的視頻編輯器/播放器包括可以含有許多視頻片段的大型數(shù)據(jù)存儲(chǔ)設(shè)備406。大型數(shù)據(jù)存儲(chǔ)設(shè)備可以是磁盤、磁光盤、光盤、半導(dǎo)體存儲(chǔ)器、或其它類型存儲(chǔ)器的存儲(chǔ)設(shè)備。
盡管在存儲(chǔ)設(shè)備406中可能存儲(chǔ)著多于一個(gè)的視頻片段和標(biāo)識(shí)文件,但為了簡(jiǎn)潔起見(jiàn),圖4只顯示了一個(gè)視頻片段420a,以及一個(gè)匹配的標(biāo)識(shí)文件421a。每個(gè)視頻片段可以存在多于一個(gè)的標(biāo)識(shí)文件。標(biāo)識(shí)文件包含如樣條(作為公式或作為一組預(yù)定樣條類型的參考)及其相關(guān)參數(shù)、它本身的鏈接、以及激活區(qū)的標(biāo)記的顏色和尺寸那樣的東西。單元450是表格或數(shù)據(jù)庫(kù),包含幀的每個(gè)視頻序列的所有相關(guān)標(biāo)號(hào),以此作為視頻播放的目錄。當(dāng)然,可以存在可能以分層結(jié)構(gòu)組織的節(jié)目和標(biāo)識(shí)文件的幾個(gè)數(shù)據(jù)庫(kù),它們根據(jù)所作的編輯,可以共享文件420或421的一些文件。
在一個(gè)實(shí)施例中,在標(biāo)識(shí)過(guò)程中,把數(shù)據(jù)裝載到與幀號(hào)、激活區(qū)的位置、它的形狀、它的尺寸、以及與相關(guān)于那個(gè)激活區(qū)的URL或其它鏈接相對(duì)應(yīng)的存儲(chǔ)器中。那個(gè)數(shù)據(jù)與通常在一個(gè)獨(dú)立文件中的視頻信號(hào)將一起提供給觀眾??梢园堰@個(gè)信息作為獨(dú)立數(shù)據(jù)流提供給觀眾。觀眾的視頻顯示系統(tǒng)跟蹤幀號(hào),并對(duì)于每一幀,確定光標(biāo)是否定位在為那一幀建立的激活區(qū)之一內(nèi)。
在另一個(gè)實(shí)施例中,與激活區(qū)的位置、它的形狀、它的尺寸、和鏈接有關(guān)的信息是作為視頻信號(hào)的一部分傳送和嵌入的。這個(gè)信息可以在信號(hào)的消隱間隔之一期間或在通常不使用的信號(hào)的一些其它部分期間提供。使內(nèi)插誤差達(dá)到最小或糾正內(nèi)插誤差的實(shí)施例從圖2可以看出,當(dāng)利用內(nèi)插法在視頻屏幕上建立激活區(qū)時(shí),在標(biāo)記對(duì)象的位置和激活區(qū)的位置之間可能存在誤差。根據(jù)本發(fā)明另一個(gè)實(shí)施例,通過(guò)如下技術(shù)可以降低這些誤差或使這些誤差達(dá)到最小。
1.把一塊視頻幀裝載到存儲(chǔ)器中(圖3的步驟301)。
2.人工標(biāo)識(shí)n個(gè)幀的第一組,此處,n大于或等于2(圖2的步驟302)。n個(gè)幀可以是視頻序列中的第一幀和最后一幀。
3.執(zhí)行內(nèi)插,為視頻序列內(nèi)那些沒(méi)有被人工標(biāo)識(shí)的幀建立激活區(qū)的估計(jì)位置(圖3的步驟303)。內(nèi)插可以通過(guò)線性內(nèi)插來(lái)執(zhí)行?;蛘?,內(nèi)插可以通過(guò)形成曲線的技術(shù),例如樣條技術(shù)來(lái)執(zhí)行。如上所述,幾種內(nèi)插技術(shù)可以用于生成直線或曲線,并且標(biāo)識(shí)視頻片段的人員可以從中選擇。
4.對(duì)于沒(méi)有被人工標(biāo)識(shí)的每一幀,視頻系統(tǒng)計(jì)算激活區(qū)和與激活區(qū)相關(guān)聯(lián)的對(duì)象之間的距離(激活區(qū)的位置通過(guò)內(nèi)插法建立。對(duì)象的位置是通過(guò),例如,如上所述的自動(dòng)圖象識(shí)別技術(shù)建立的。正如前面所指出的,圖象識(shí)別可能精確,也可能不精確)。
5.系統(tǒng)對(duì)具有在激活區(qū)114和與激活區(qū)114相關(guān)聯(lián)的對(duì)象113之間的距離最大的那些幀進(jìn)行標(biāo)識(shí)。系統(tǒng)可以高亮顯示呈現(xiàn)出這些距離的那些幀(例如,一個(gè)或多個(gè)幀101a至101p),并把圖標(biāo)或其它標(biāo)記定位在那些幀上,或者,它可以把一些其它技術(shù)用于為用戶標(biāo)識(shí)這些幀。用戶可以查看這些幀,并核實(shí)激活區(qū)和與之相關(guān)聯(lián)的對(duì)象之間的距離,在事實(shí)上是否是不能接受的。
6.如果用戶認(rèn)為這個(gè)距離是不能接受的,他或她就可以人工地標(biāo)識(shí)呈現(xiàn)出不可接受誤差的幀(圖3的步驟304)。
7.在人工標(biāo)識(shí)呈現(xiàn)不可接受的幀之后,用戶可以讓系統(tǒng)根據(jù)包括新的人工標(biāo)識(shí)的數(shù)據(jù)重新計(jì)算(例如,再次通過(guò)內(nèi)插法)激活區(qū)的位置。
8.可選地,用戶可以讓系統(tǒng)采用新的內(nèi)插的激活區(qū)位置,并建立具有最大誤差的幀的另一個(gè)列表。如果用戶發(fā)現(xiàn)這些誤差是可以接受的,或發(fā)現(xiàn)只是與圖象識(shí)別誤差相關(guān)的假像,他或她就可以忽略它們。
9.然后,我們可以把激活區(qū)形狀(和可選地,可視指示符)及鏈接與激活區(qū)相關(guān)聯(lián)。
如上所述,在圖3的步驟304中,我們可以讓系統(tǒng)計(jì)算激活區(qū)和與那個(gè)激活區(qū)相關(guān)聯(lián)的對(duì)象之間的距離,并標(biāo)志具有不能接受誤差的、如屏幕100的部分101a至101p所示的那些幀。用戶可以人工標(biāo)識(shí)呈現(xiàn)如上所述的不能接受誤差的那些幀(這種處理可以用來(lái)調(diào)整激活區(qū)的位置(沿著x和y軸)和尺寸)。把與激活區(qū)相關(guān)的信息傳送給電視觀眾用與激活區(qū)相關(guān)的信息標(biāo)記視頻幀之后,有必要把該信息傳送到觀眾的視頻系統(tǒng)。圖5顯示了包括大型數(shù)據(jù)存儲(chǔ)設(shè)備506的視頻發(fā)送系統(tǒng)500,大型數(shù)據(jù)存儲(chǔ)設(shè)備506包含存儲(chǔ)要發(fā)送的視頻節(jié)目的部分520。視頻節(jié)目可以是任何類型的節(jié)目-體育賽事、肥皂劇、教育節(jié)目、卡通和其它動(dòng)畫(huà)等。此外,包含在大型數(shù)據(jù)存儲(chǔ)設(shè)備506中的還有含有標(biāo)識(shí)信息的部分521。這個(gè)標(biāo)識(shí)信息包括a)與視頻節(jié)目的各個(gè)幀相關(guān)聯(lián)的幾個(gè)激活區(qū)的位置;b)那些激活區(qū)的尺寸;和c)那些與激活區(qū)相關(guān)聯(lián)的鏈接(鏈接可以是URL的形式)。即,標(biāo)識(shí)信息可以指示,在視頻節(jié)目的特定幀中,存在著位于視頻幀左上角的第一激活區(qū),并且激活區(qū)具有一定的尺寸。如果觀眾點(diǎn)擊在那個(gè)激活區(qū)上,那就應(yīng)該激活到特定網(wǎng)頁(yè)的鏈接。
大型存儲(chǔ)設(shè)備506可以是任何類型的大型存儲(chǔ)設(shè)備,例如,磁盤、磁帶、光或磁光介質(zhì)、或其它數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)。
把來(lái)自大型存儲(chǔ)設(shè)備506的信息提供給數(shù)據(jù)分離電路505,該數(shù)據(jù)分離電路505分離出視頻信號(hào)并把該視頻信號(hào)提供給傳統(tǒng)發(fā)送器504(數(shù)據(jù)分離電路505通常是服務(wù)器)。電視系統(tǒng)501包括用于接收視頻信號(hào)的接收器511。雖然圖5包括指示如傳統(tǒng)電視無(wú)線電信號(hào)那樣發(fā)送和接收視頻信號(hào)的符號(hào),但是視頻信號(hào)也可以通過(guò)其它手段傳送,例如,電纜、光纜、微波、衛(wèi)星通信、電話線、因特網(wǎng)、或其它信號(hào)通信技術(shù)。
標(biāo)識(shí)信息(例如,激活區(qū)的位置和尺寸,以及與激活區(qū)相關(guān)聯(lián)的URL信息)通過(guò)通信媒體503傳送到電視系統(tǒng)501,通信媒體503可以與傳送視頻信號(hào)的媒體相同,也可以與之不同。因此,通信媒體503可以是傳統(tǒng)無(wú)線電信號(hào)、電纜、光纜、微波、衛(wèi)星通信、電話線、因特網(wǎng)、或其它信號(hào)通信技術(shù)。
標(biāo)識(shí)信息由預(yù)處理單元512接收。預(yù)處理單元512通過(guò)內(nèi)插技術(shù),為其中的數(shù)據(jù)不是由發(fā)送系統(tǒng)500提供的那些幀計(jì)算每一幀的每個(gè)激活區(qū)的位置。在一個(gè)實(shí)施例中,內(nèi)插技術(shù)是例如,如參照?qǐng)D2所述的線性內(nèi)插技術(shù)。例如,假設(shè)發(fā)送系統(tǒng)500每隔九個(gè)幀提供激活區(qū)的位置。圖6顯示了分別由點(diǎn)600、601、602和603指示的、幀0、10、20和30的激活區(qū)的y坐標(biāo)值。如果使用了線性內(nèi)插技術(shù),那么,應(yīng)該認(rèn)為激活區(qū)的y坐標(biāo)值將通過(guò)直線604、605和606建立??梢允褂闷渌鼉?nèi)插技術(shù),例如,在特定點(diǎn)之間形成曲線而不是直線的技術(shù)。例如,可以使用樣條內(nèi)插技術(shù)。如果使用了樣條內(nèi)插技術(shù),則根據(jù)樣條計(jì)算參數(shù),應(yīng)該認(rèn)為激活區(qū)的y坐標(biāo)將沿著曲線607。
圖6顯示了激活區(qū)的y坐標(biāo)與幀號(hào)之間的關(guān)系。對(duì)于激活區(qū)的x坐標(biāo)和激活區(qū)的尺寸,進(jìn)行類似的計(jì)算(例如,根據(jù)與激活區(qū)相關(guān)聯(lián)的對(duì)象是靠近攝像機(jī),還是遠(yuǎn)離攝像機(jī),激活區(qū)的尺寸可以擴(kuò)大或縮小)。
再參照?qǐng)D5,可以看出,預(yù)處理單元512向視頻顯示單元514提供視頻信號(hào)。預(yù)處理單元512與用戶接口513耦合。用戶接口513允許用戶控制顯示在顯示單元514上的圖象的某些特征,例如,屏幕上是否將顯示指示激活區(qū)位置的標(biāo)記。用戶接口513也允許用戶點(diǎn)擊在各種激活區(qū)上,激活與之相關(guān)聯(lián)的鏈接。
用戶接口513通常擁有諸如跟蹤球、鼠標(biāo)、觸板或操縱桿之類的適當(dāng)控制機(jī)械裝置。這種接口用于在視頻顯示單元514上定位可視光標(biāo),以便觀眾知道他正在點(diǎn)擊什么對(duì)象。預(yù)處理單元512確定是否已經(jīng)把光標(biāo)定位在激活區(qū)上。在一個(gè)實(shí)施例中,預(yù)處理單元512包括微處理器系統(tǒng)。
如上所述,在本發(fā)明的一個(gè)實(shí)施例中,所選幀的激活區(qū)是例如利用人工標(biāo)識(shí)系統(tǒng)建立的。激活區(qū)與描繪在視頻幀中的對(duì)象相關(guān)聯(lián)。在這種方法中,為視頻片段的一些(不是全部)幀建立每個(gè)激活區(qū)的位置、尺寸和形狀。對(duì)于視頻片段的其它幀,通過(guò)在幀之間進(jìn)行內(nèi)插建立激活區(qū)的位置和尺寸。在一個(gè)實(shí)施例中,把人工標(biāo)識(shí)的那些幀的激活區(qū)的位置和尺寸傳送到視頻系統(tǒng)501。在其它實(shí)施例中,根據(jù)其它理由選擇傳送激活區(qū)位置和尺寸的幀。例如,可以每隔九個(gè)幀把激活區(qū)的位置和尺寸傳送給視頻接收系統(tǒng)501?;蛘?,可以只傳送視頻片段的所謂“關(guān)鍵幀”的激活區(qū)的位置和尺寸(如上所述,某些視頻壓縮算法只傳送某些關(guān)鍵幀的整個(gè)像素陣列。對(duì)于其它幀,只傳送與一個(gè)幀和下一幀之間的改變相對(duì)應(yīng)的信息。關(guān)鍵幀是傳送整個(gè)像素陣列的那些幀)。
再參照?qǐng)D5,在一個(gè)實(shí)施例中,工作站550可以與視頻發(fā)送系統(tǒng)500耦合。工作站550包括個(gè)人計(jì)算機(jī)(“PC”)551和本地存儲(chǔ)器存儲(chǔ)設(shè)備552(例如,磁盤)或包含編輯軟件553的非本地存儲(chǔ)設(shè)備(例如,服務(wù)器)。工作站550用于標(biāo)識(shí)視頻片段。在這個(gè)例子中,工作站通過(guò)通信線路554與服務(wù)器505耦合,但是,可以使用許多其它方式聯(lián)網(wǎng)工作站550和服務(wù)器505。在一些實(shí)施例中,編輯軟件553可以在服務(wù)器505上運(yùn)行。在其它實(shí)施例中,各種文件(視頻文件和標(biāo)識(shí)文件兩者)可以駐留在本地存儲(chǔ)器552上。
雖然參照特定實(shí)施例已經(jīng)對(duì)本發(fā)明作了描述,但本領(lǐng)域的普通技術(shù)人員應(yīng)該明白,可以在形式上和細(xì)節(jié)上對(duì)其作各種改變,而不偏離本發(fā)明的實(shí)質(zhì)和范圍。例如,可以以RGB值的形式存儲(chǔ)視頻幀的像素(RGB指的是與像素相關(guān)聯(lián)的紅色、藍(lán)色和綠色分量)?;蛘?,可以以顏色、飽和度和亮度的形式存儲(chǔ)像素值。屏幕100和/或視頻顯示單元514可以是CRT(陰極射線管)、LCD(液晶顯示器)、投影顯示器、或其它合適的顯示技術(shù)。不同類型的視頻編輯/標(biāo)識(shí)系統(tǒng)可以用于實(shí)現(xiàn)本發(fā)明的方法。內(nèi)插法可以由系統(tǒng)內(nèi)的微處理器或其它計(jì)算設(shè)備執(zhí)行。
本發(fā)明的方法可以用于提供或接收視頻片段中多于一個(gè)的激活區(qū)。
可以用不同方式選擇用于人工內(nèi)插的幀。例如,在一個(gè)實(shí)施例中,每隔n-1個(gè)幀人工內(nèi)插一次,此處,n是整數(shù)(例如,10)。
為執(zhí)行內(nèi)插和編輯而選擇的設(shè)備可以是具有執(zhí)行視頻編輯的顯示屏幕和/或圖象識(shí)別軟件程序的基于微處理器的系統(tǒng)。
在一個(gè)實(shí)施例中,不人工標(biāo)識(shí)第一幀和最后一幀。因此,在這樣的實(shí)施例中,外插激活區(qū)的位置和尺寸。
當(dāng)把視頻信號(hào)發(fā)送給觀眾時(shí),可以把視頻信息和標(biāo)識(shí)信息作為獨(dú)立信號(hào)發(fā)送給接收系統(tǒng)501,或可以把它們作為組合信號(hào)的組成部分來(lái)傳送。組合信息可以由發(fā)送器504通過(guò)廣播媒體502來(lái)提供?;蛘?,組合信息可以通過(guò)上述通信媒體的任何一種,例如,光、纜線、微波傳輸、衛(wèi)星傳輸?shù)忍峁?br>
本發(fā)明的各個(gè)方面可以彼此獨(dú)立地實(shí)現(xiàn)。例如,可以使用圖1的標(biāo)識(shí)設(shè)備,而不使用圖5的信號(hào)通信設(shè)備。同樣,可以利用圖4的通信設(shè)備傳送利用除了參照?qǐng)D1至4所述的方法之外的方法標(biāo)識(shí)的視頻片段。因此,所有這樣的改變均在本發(fā)明的范圍之內(nèi)。
權(quán)利要求
1.一種在視頻片段中建立激活區(qū)的位置的方法,所述視頻片段包括一組幀,所述方法包括下列步驟(a)為所述一組幀內(nèi)的第一數(shù)個(gè)幀建立所述激活區(qū)的位置;(b)根據(jù)在上面步驟(a)中建立的位置,通過(guò)內(nèi)插法為所述一組幀內(nèi)的第二數(shù)個(gè)幀建立所述激活區(qū)的位置。
2.根據(jù)權(quán)利要求1所述的方法,其中,在步驟(a)和(b)中建立的位置存儲(chǔ)在存儲(chǔ)設(shè)備中。
3.根據(jù)權(quán)利要求1所述的方法,其中,步驟(a)包括在顯示設(shè)備上顯示所述第一數(shù)個(gè)幀;和通過(guò)把與所述第一數(shù)個(gè)幀內(nèi)所述激活區(qū)的位置相關(guān)的信息存儲(chǔ)在存儲(chǔ)器內(nèi),人工標(biāo)識(shí)所述幀。
4.根據(jù)權(quán)利要求1所述的方法,其中,所述內(nèi)插法是線性內(nèi)插法。
5.根據(jù)權(quán)利要求1所述的方法,其中,所述內(nèi)插法是樣條內(nèi)插法。
6.根據(jù)權(quán)利要求1所述的方法,其中,所述第一數(shù)個(gè)幀是關(guān)鍵幀。
7.根據(jù)權(quán)利要求1所述的方法,其中,所述內(nèi)插法是由編輯系統(tǒng)內(nèi)的計(jì)算設(shè)備執(zhí)行的。
8.根據(jù)權(quán)利要求1所述的方法,還包括下列步驟(c)顯示所述一組幀內(nèi)第三數(shù)個(gè)幀的激活區(qū);(d)標(biāo)識(shí)所述第二數(shù)個(gè)幀內(nèi)的所述幀的至少一些幀;和(e)在執(zhí)行步驟(d)之后,通過(guò)內(nèi)插法建立在所述第二數(shù)個(gè)幀內(nèi)、但不在所述幀的所述一些幀內(nèi)的所述激活區(qū)的位置。
9.一種包括下列單元的設(shè)備存儲(chǔ)設(shè)備,用于存儲(chǔ)視頻片段,所述視頻片段包括數(shù)個(gè)視頻幀;輸入設(shè)備,用于把指示所述視頻幀的一些幀內(nèi)激活區(qū)的位置的信息輸入到所述設(shè)備;在所述設(shè)備內(nèi)的計(jì)算設(shè)備,用于為所述數(shù)個(gè)視頻幀內(nèi)的其它幀建立所述激活區(qū)的位置。
10.根據(jù)權(quán)利要求9所述的設(shè)備,其中,所述計(jì)算設(shè)備為所述數(shù)個(gè)內(nèi)插幀內(nèi)的所述其它幀建立所述激活區(qū)的位置。
11.一種包括下列步驟的方法提供包括一組幀的視頻片段,所述一組幀內(nèi)的第一數(shù)個(gè)幀用指示激活區(qū)的位置的信息標(biāo)識(shí),所述激活區(qū)與出現(xiàn)在所述視頻片段內(nèi)的對(duì)象相關(guān)聯(lián);通過(guò)內(nèi)插法,為不是在所述第一數(shù)個(gè)幀內(nèi)的那些幀建立所述激活區(qū)的位置數(shù)據(jù);利用自動(dòng)圖象識(shí)別,確定與不是在所述第一數(shù)個(gè)幀內(nèi)的所述幀的其它幀相比、其所述激活區(qū)和所述對(duì)象之間的距離較大的、不在所述第一數(shù)個(gè)幀內(nèi)的所述幀的一個(gè)或多個(gè)幀。
12.根據(jù)權(quán)利要求11所述的方法,其中,所述自動(dòng)圖象識(shí)別確定所述激活區(qū)和所述對(duì)象之間的距離超過(guò)閾值的幀。
13.根據(jù)權(quán)利要求11所述的方法,其中,所述自動(dòng)圖象識(shí)別確定所述激活區(qū)和所述對(duì)象之間的距離最大的n個(gè)幀,此處,n是整數(shù)。
14.根據(jù)權(quán)利要求11所述的方法,還包括下列步驟在顯示器上顯示所述一個(gè)或多個(gè)幀,以便觀眾能夠看見(jiàn)在一個(gè)或多個(gè)幀中所述激活區(qū)和所述對(duì)象之間的距離。
15.根據(jù)權(quán)利要求11所述的方法,還包括下列步驟在所述利用步驟之后,標(biāo)識(shí)所述一個(gè)或多個(gè)幀的至少一個(gè)幀。
16.根據(jù)權(quán)利要求15所述的方法,還包括下列步驟通過(guò)內(nèi)插法,為不在所述第一數(shù)個(gè)幀內(nèi)和不在所述至少一個(gè)幀內(nèi)的那些幀建立所述激活區(qū)的位置數(shù)據(jù)。
17.根據(jù)權(quán)利要求16所述的方法,還包括下列步驟顯示通過(guò)內(nèi)插法已經(jīng)建立了位置數(shù)據(jù)的幀,以便用戶可以看見(jiàn)激活區(qū)離對(duì)象有多遠(yuǎn)。
18.根據(jù)權(quán)利要求11所述的方法,其中,操作人員在所述建立步驟之前,用所述信息標(biāo)識(shí)所述第一數(shù)個(gè)幀。
19.根據(jù)權(quán)利要求18所述的方法,其中,通過(guò)把指示所述第一數(shù)個(gè)幀的所述激活區(qū)的位置的數(shù)據(jù)存儲(chǔ)在存儲(chǔ)器中,進(jìn)行所述標(biāo)識(shí)。
20.根據(jù)權(quán)利要求11所述的方法,其中,所述視頻片段存儲(chǔ)在存儲(chǔ)設(shè)備中。
21.根據(jù)權(quán)利要求20所述的方法,其中,指示激活區(qū)的位置的所述信息存儲(chǔ)在與所述視頻片段相同的存儲(chǔ)設(shè)備中。
22.根據(jù)權(quán)利要求21所述的方法,其中,所述視頻片段和指示激活區(qū)的位置的所述信息位于所述存儲(chǔ)設(shè)備內(nèi)的不同文件中。
23.根據(jù)權(quán)利要求21所述的方法,其中,指示所述激活區(qū)的位置的所述信息嵌在所述視頻片段中。
24.一種包括下列步驟的方法提供視頻片段,所述視頻片段包括一組幀,所述視頻片段描繪一個(gè)對(duì)象;通過(guò)把與所述對(duì)象相關(guān)聯(lián)的所述幀的一些幀內(nèi)激活區(qū)的位置存儲(chǔ)在存儲(chǔ)器中,標(biāo)識(shí)所述一組幀內(nèi)所述幀的一些幀,但不標(biāo)識(shí)所述一組內(nèi)所述幀的其它幀;通過(guò)內(nèi)插法,為所述幀的所述其它幀建立所述激活區(qū)的位置;利用自動(dòng)圖象識(shí)別,確定與不在所述第一數(shù)個(gè)幀內(nèi)的所述幀的其它幀相比、其所述激活區(qū)和所述對(duì)象之間的距離較大的、在所述幀的所述其它幀內(nèi)的那些幀。
25.一種包括下列單元的設(shè)備用于存儲(chǔ)視頻片段的存儲(chǔ)結(jié)構(gòu),所述視頻片段包括一組幀,所述一組幀內(nèi)的第一數(shù)個(gè)幀用指示激活區(qū)的位置信息標(biāo)識(shí),所述激活區(qū)與出現(xiàn)在所述視頻片段中的對(duì)象相關(guān)聯(lián);通過(guò)內(nèi)插法,為不在所述第一數(shù)個(gè)幀內(nèi)的那些幀建立所述激活區(qū)的位置的裝置;利用自動(dòng)圖象識(shí)別、確定與不在所述第一數(shù)個(gè)幀內(nèi)的所述幀的其它幀相比、其所述激活區(qū)和所述對(duì)象之間的距離較大的所述幀的一個(gè)或多個(gè)幀的裝置。
26.一種包括下列步驟的方法接收視頻圖象;把所述視頻圖象顯示成一列幀;接收與所述幀的一些幀、但不是所述幀的其它幀的至少一個(gè)激活區(qū)的位置相對(duì)應(yīng)的信息;和根據(jù)所述接收信息,為所述幀的其它幀確定所述激活區(qū)的位置。
27.根據(jù)權(quán)利要求26所述的方法,其中,所述確定步驟是通過(guò)線性內(nèi)插法執(zhí)行的。
28.根據(jù)權(quán)利要求26所述的方法,其中,所述確定步驟是通過(guò)樣條內(nèi)插法執(zhí)行的。
29.根據(jù)權(quán)利要求26所述的方法,其中,與所述激活區(qū)的尺寸相對(duì)應(yīng)的信息是為所述幀的所述一些幀、但不是所述幀的所述其它幀而接收的,所述方法還包括下列步驟通過(guò)內(nèi)插法,為所述幀的所述其它幀確定所述激活區(qū)的尺寸。
30.根據(jù)權(quán)利要求26所述的方法,其中,所述激活區(qū)與一個(gè)鏈接相關(guān)聯(lián),所述方法還包括激活所述鏈接的步驟。
31.根據(jù)權(quán)利要求26所述的方法,其中,所述鏈接是到因特網(wǎng)頁(yè)的鏈接。
32.根據(jù)權(quán)利要求26所述的方法,還包括激活所述鏈接。
33.根據(jù)權(quán)利要求32所述的方法,其中,所述顯示包括在顯示屏幕上顯示所述視頻,和所述激活包括在所述顯示屏幕上點(diǎn)擊激活區(qū)。
34.一種包括下列步驟的方法傳送視頻片段,所述視頻片段包括一組視頻幀,所述一組視頻幀內(nèi)的一些視頻幀被標(biāo)識(shí),以便為所述視頻幀的所述一些視頻幀建立激活區(qū);傳送所述一組視頻幀內(nèi)的所述一些視頻幀的、但不是所述一組視頻幀內(nèi)的所述視頻幀的其它視頻幀的所述激活區(qū)的位置。
35.根據(jù)權(quán)利要求34所述的方法,其中,所述視頻片段是通過(guò)第一通信媒體傳送的,并且所述激活區(qū)的所述位置是通過(guò)與所述第一通信媒體不同的第二通信媒體傳送的。
36.根據(jù)權(quán)利要求34所述的方法,還包括下列步驟接收所述視頻片段和所述一組視頻幀內(nèi)的所述一些視頻幀的、但不是所述視頻幀的其它視頻幀的所述激活區(qū)的位置;和通過(guò)內(nèi)插法,為所述視頻幀的其它視頻幀建立所述激活區(qū)的位置。
37.根據(jù)權(quán)利要求36所述的方法,其中,所述激活區(qū)與一個(gè)對(duì)象相關(guān)聯(lián),所述對(duì)象出現(xiàn)在所述一組視頻幀內(nèi)所述視頻幀的每個(gè)幀中。
38.一種包括下列單元的系統(tǒng)接收器,用于接收視頻信號(hào);顯示器,與所述接收器耦合,用于顯示與所述視頻信號(hào)相對(duì)應(yīng)的視頻圖象,所述視頻圖象包括一組幀;接收指示所述幀的一些幀的、但不是所述幀的其它幀的至少一個(gè)激活區(qū)的位置的信息的電路,所述電路根據(jù)所述幀的所述一些幀的所述激活區(qū)的位置,通過(guò)內(nèi)插法確定所述幀的所述其它幀的所述激活區(qū)的位置。
39.根據(jù)權(quán)利要求38所述的系統(tǒng),還包括發(fā)送系統(tǒng),用于發(fā)送所述視頻信號(hào)和與所述幀的所述一個(gè)幀、但不是所述幀的所述其它幀的至少一個(gè)激活區(qū)的位置相對(duì)應(yīng)的所述信息。
40.一種包括下列單元的設(shè)備第一存儲(chǔ)器存儲(chǔ)設(shè)備,用于存儲(chǔ)視頻信號(hào),所述視頻信號(hào)包括一組幀;第二存儲(chǔ)器存儲(chǔ)設(shè)備,用于存儲(chǔ)所述幀的一些幀的激活區(qū)的位置;發(fā)送器,用于發(fā)送所述視頻信號(hào)和所述幀的所述一些幀、但不是所述幀的所述其它幀的所述激活區(qū)的所述位置,從而,接收所述視頻信號(hào)和所述幀的所述一些幀的所述激活區(qū)的所述位置的系統(tǒng)可以通過(guò)內(nèi)插法,為所述幀的所述其它幀建立所述激活區(qū)的位置。
41.一種包括下列單元的設(shè)備存儲(chǔ)器,用于存儲(chǔ)視頻片段;為視頻片段的一些幀、但不是視頻片段的其它幀建立激活區(qū)的位置的結(jié)構(gòu);以及發(fā)送系統(tǒng),用于發(fā)送視頻片段和視頻片段的所述幀的所述一些幀、但不是視頻片段的其它幀的所述激活區(qū)的位置。
42.根據(jù)權(quán)利要求41所述的設(shè)備,還包括接收單元,用于接收和顯示視頻片段,和通過(guò)內(nèi)插法,為所述其它幀建立所述激活區(qū)的位置。
43.一種在圖象的一系列幀內(nèi)建立激活區(qū)的位置的方法,所述方法包括下列步驟(a)為所述一系列幀內(nèi)第一數(shù)個(gè)幀建立所述激活區(qū)的位置和/或尺寸;(b)根據(jù)在上述步驟(a)中建立的位置,通過(guò)計(jì)算,為所述一系列幀內(nèi)所述幀的第二數(shù)個(gè)幀建立所述激活區(qū)的位置和/或尺寸。
44.根據(jù)權(quán)利要求40所述的設(shè)備,其中,所述存儲(chǔ)器存儲(chǔ)設(shè)備存儲(chǔ)所述幀的一些幀、但不是所述幀的其它幀的所述激活區(qū)的位置。
全文摘要
一種標(biāo)識(shí)視頻圖象以含有交互式鏈接的方法,包括下列步驟在視頻圖象的幀的一個(gè)子組中,人工建立激活區(qū)(114),和利用內(nèi)插法為其余幀建立激活區(qū)。所述激活區(qū)是在屏幕(514)上的、觀眾可以把光標(biāo)放在上面并進(jìn)行點(diǎn)擊、從而激活鏈接的區(qū)域。這個(gè)鏈接可以是到URL、或一些其它類型鏈接的鏈接。內(nèi)插法可以是線性內(nèi)插法或樣條內(nèi)插技術(shù)。視頻圖象可以與對(duì)應(yīng)于視頻幀的一些幀、但不是視頻幀的其它幀的標(biāo)識(shí)一起傳送到顯示系統(tǒng)。接收系統(tǒng)可以通過(guò)內(nèi)插法,為所述幀的其它幀確定激活區(qū)。
文檔編號(hào)H04N7/16GK1391676SQ00812075
公開(kāi)日2003年1月15日 申請(qǐng)日期2000年9月2日 優(yōu)先權(quán)日1999年9月3日
發(fā)明者亞科夫·卡門, 利昂·舍曼 申請(qǐng)人:伊瑟夫電視公司