使用運動估計的目標檢測的制作方法
【專利摘要】使用運動估計來檢測目標的系統(tǒng)和方法可以包括處理器和耦合到該處理器的運動估計和目標檢測邏輯單元。運動估計和目標檢測邏輯單元可以被配置為包括用于基于運動估計來檢測視頻的幀中的目標的邏輯單元。視頻可以包括第一幀和第二幀。可以使用第二幀的區(qū)域和第一幀的對應區(qū)域之間的絕對差之和在第二幀的區(qū)域上執(zhí)行運動估計。
【專利說明】使用運動估計的目標檢測
【背景技術(shù)】
[0001]在可視化搜索中,自然圖像和視頻中的可靠的實時目標檢測和識別可能是重要的。一種在視頻中進行目標跟蹤的方法用于在每個視頻幀中執(zhí)行完全目標檢測。然而,該方法可能是計算非常密集的。
【專利附圖】
【附圖說明】
[0002]對本領(lǐng)技術(shù)人員來說,通過閱讀下面的說明書和所附權(quán)利要求書,并通過參照下面的附圖,本發(fā)明的實施例的各種優(yōu)勢將變得顯而易見,在下面的附圖中:
[0003]圖1是根據(jù)一些實施例的、示出了示例性計算機系統(tǒng)的框圖;
[0004]圖2是根據(jù)一些實施例的、示出了使用滑動窗口來掃描圖像的例子的框圖;
[0005]圖3是根據(jù)一些實施例的、示出了示例性視頻運動估計和檢測系統(tǒng)的框圖;
[0006]圖4是根據(jù)一些實施例的、示出了宏塊的例子的框圖;
[0007]圖5示出了根據(jù)一些實施例的幀的示例性區(qū)域;
[0008]圖6A是根據(jù)一些實施例的、運動估計和目標檢測的示例性方法的流程圖;
[0009]圖6B是根據(jù)一些實施例的、使用絕對差之和(SAD)來執(zhí)行運動估計和目標檢測的示例性方法的流程圖;
[0010]圖7示出了根據(jù)一些實施例的示例性計算機系統(tǒng);以及
[0011]圖8示出了根據(jù)一些實施例的示例性小外形規(guī)格設(shè)備。
【具體實施方式】
[0012]實施例可以涉及包括用于在具有第一幀和第二幀的視頻的該第二幀的區(qū)域上執(zhí)行運動估計的邏輯單元的裝置。該裝置還可以包括用于基于在第二幀的區(qū)域上的運動估計來確定是否在第二幀的該區(qū)域上執(zhí)行目標檢測的邏輯單元。運動估計可以基于用于執(zhí)行絕對差之和的邏輯單元。目標檢測可以基于分類器函數(shù)。
[0013]實施例可以涉及系統(tǒng),該系統(tǒng)可以包括處理器和耦合到該處理器的運動估計和目標檢測邏輯單元。運動估計和目標檢測邏輯單元可以被配置為包括用于基于運動估計來檢測視頻的幀中的目標的邏輯單元。視頻可以包括第一幀和第二幀。可以使用第二幀的區(qū)域和第一幀的對應區(qū)域之間的絕對差之和來在第二幀的該區(qū)域上執(zhí)行運動估計??梢栽诤陦K上執(zhí)行絕對差之和,所述宏塊包括在第二幀的區(qū)域中和第一幀的對應區(qū)域中。第二幀可以是視頻中的第一幀的后續(xù)幀。
[0014]實施例可以涉及計算機實現(xiàn)的方法,該方法可以包括在視頻的第一幀的多個區(qū)域上執(zhí)行目標檢測以檢測第一幀中包括的目標。該方法還可以包括在視頻的第二幀的區(qū)域上執(zhí)行運動估計,基于第二幀的區(qū)域上的運動估計來確定是否在第二幀的該區(qū)域上執(zhí)行目標檢測。第二幀可以在視頻中處于所述第一幀之后??梢允褂梅诸惼骱瘮?shù)來執(zhí)行目標檢測。
[0015]實施例可以涉及系統(tǒng),該系統(tǒng)可以包括處理器、耦合到該處理器的外部供電設(shè)備、以及耦合到該處理器的運動估計和目標檢測邏輯單元。運動估計和目標檢測邏輯單元可以被配置為包括用于基于運動估計來檢測視頻的幀中的目標的邏輯單元。視頻可以包括第一幀和第二幀。可以使用第二幀的區(qū)域和第一幀的對應區(qū)域之間的絕對差之和來在第二幀的該區(qū)域上執(zhí)行運動估計。
[0016]轉(zhuǎn)到圖1,根據(jù)一些實施例示出了對示例性計算機系統(tǒng)100進行說明的框圖。計算機系統(tǒng)100可以包括中央處理單元(CPU) 105、圖形和存儲器控制器中心(GMCH) 110、和輸入/輸出控制器中心(ICH) 125。GMCH110可以經(jīng)由總線107耦合到CPU105。ICH125可以經(jīng)由總線122耦合到GMCHl 10。GMCHl 10還可以耦合到存儲器設(shè)備115和顯示設(shè)備120。ICH125可以耦合到I/O設(shè)備130。GMCH110可以包括圖形系統(tǒng)200(在圖2中示出)。雖然CPU105、GMCHl 10和ICH125被示出為單獨的組件,但是可以將這些組件中的兩個或更多個組件的功能進行組合??梢允褂霉╇娫O(shè)備150向計算機系統(tǒng)100供電。供電設(shè)備150可以是電池或外部電源。計算機系統(tǒng)100還可以包括許多其它組件;然而,為了簡單起見,它們沒有被示出。
[0017]轉(zhuǎn)到圖2,示出了對使用示例性滑動窗口 200來掃描圖像進行說明的框圖?;瑒哟翱谑强梢杂糜谠趫D像中執(zhí)行目標檢測和識別的技術(shù)?;瑒哟翱诩夹g(shù)可以與可以用于檢測目標的分類器函數(shù)相關(guān)聯(lián)。當最大分類分數(shù)超過了閾值時,目標可以被確定為出現(xiàn)在圖像中。例如,可以使用滑動窗口 200從左上位置向右下位置掃描圖像201。對于圖像201,滑動窗口 200可以掃描子圖像205至260?;瑒哟翱?200可以具有不同的尺寸。例如,滑動窗口 200可以是16像素X16像素。通常來說,對于具有NXN尺寸的圖像,子圖像的數(shù)量可以由N提高至N的四次方(N4)。例如,子圖像的數(shù)目可以超過十億。將需要針對每個子圖像來執(zhí)行與目標檢測相關(guān)聯(lián)的操作。也就是說,滑動窗口 200越小,需要執(zhí)行的計算數(shù)量越高。其結(jié)果是,為所有的子圖像詳盡地估計分類器函數(shù)在計算上可能是非常昂貴的。當將滑動窗技術(shù)應用于視頻的多個幀以檢測目標時,計算成本可能是更加昂貴的。例如,對于25Hz/30Hz的視頻,用于在視頻中執(zhí)行目標檢測的計算成本可能比執(zhí)行針對單個圖像的目標檢測的計算成本大十倍。
[0018]轉(zhuǎn)到圖3,根據(jù)一些實施例示出了對示例性視頻運動估計和檢測系統(tǒng)300進行說明的框圖。運動估計和檢測系統(tǒng)300可以包括運動估計邏輯單元305、目標檢測邏輯單元310、滑動窗口邏輯單元325、和視頻處理邏輯單元330。運動估計邏輯單元305可以包括絕對差之和邏輯單元315。目標檢測邏輯單元310可以包括分類器函數(shù)邏輯單元320。
[0019]對于一些實施例,滑動窗口邏輯單元325可以被配置為建立不同尺寸的滑動窗口。例如,小的滑動窗口可以用于掃描視頻幀以檢測該視頻幀中的小的目標,而大的滑動窗口可以用于檢測視頻幀中的大的目標。視頻幀可以由視頻處理邏輯單元330接收。對于一些實施例,可以使用不同尺寸的滑動窗口來執(zhí)行針對第一幀的完全掃描。為了檢測小的和大的目標,可以使用不同尺寸的滑動窗口來多次執(zhí)行完全掃描。對于隨后的幀,取代執(zhí)行完全掃描,運動估計邏輯單元305可以用于降低計算成本。
[0020]可以將可以由滑動窗口覆蓋的幀的區(qū)段(area)稱為區(qū)域。例如,對于視頻圖形陣列(VGA)尺寸的視頻輸入,滑動窗口可以從可以覆蓋幀的區(qū)域的最小尺寸20X20像素變化到可以覆蓋整個幀的最大尺寸480X480像素。
[0021]分類器函數(shù)邏輯單元320可以被配置為檢測目標是否存在于由滑動窗口覆蓋的幀的區(qū)域內(nèi)。分類器函數(shù)邏輯單元320可以基于最大分類分值來執(zhí)行檢測操作。對于一些實施例,可以使用分類器函數(shù)邏輯單元320來執(zhí)行針對第一幀的每個區(qū)域的目標檢測。如將更加詳細地描述的,如果滿足了特定條件,則分類器函數(shù)邏輯單元320可以用于執(zhí)行針對后續(xù)幀的一些區(qū)域的目標檢測。
[0022]運動估計邏輯單元305可以被配置為在將當前幀與之前幀做比較時確定在特定區(qū)域內(nèi)部是否發(fā)生了任何運動。運動估計邏輯單元305的操作可以基于通常用于視頻編碼中的運動向量信息和針對每個宏塊(在圖4中描述)的絕對差之和(SAD)的值。
[0023]運動估計邏輯單元305可以被配置為移除視頻的連續(xù)幀中的圖像之間的時間冗余,這是因為連續(xù)幀中的大多數(shù)的圖像可能是基本相似的。這可以使得能夠重新使用之前幀中包括的信息來找到針對當前幀的運動向量信息以提高編碼效率。對于一些實施例,運動估計邏輯單元305可以使用SAD邏輯單元315來確定當前幀的區(qū)域是否類似于之前幀的對應區(qū)域。
[0024]目標檢測邏輯單元310可以被配置為檢測當前幀的區(qū)域中的目標。例如,當滿足了特定條件時,目標檢測邏輯單元310可以應用分類器函數(shù)邏輯單元320以檢測區(qū)域中的目標。
[0025]轉(zhuǎn)到圖4,示出了根據(jù)一些實施例的宏塊的例子。宏塊(MB)可以是用于運動估計的基本元素,并且可以用于編碼。宏塊可以為16X16像素。在當前的例子中,滑動窗口 200可以覆蓋包括405至445的9個宏塊的區(qū)域(由具有對角模式的矩形表示)。通常來說,當與當前幀相關(guān)聯(lián)的宏塊類似于與之前幀相關(guān)聯(lián)的區(qū)域(其具有相同的MB尺寸)時,針對當前幀可以不需要對該宏塊進行編碼??梢灾匦率褂冕槍碜灾皫念愃茍D像區(qū)域的編碼信息。
[0026]SAD邏輯單元315 (圖3)可以被配置為確定與宏塊相關(guān)聯(lián)的SAD和與區(qū)域相關(guān)聯(lián)的SAD。SAD邏輯單元315可以被配置為確定當前幀的一個宏塊中的每個像素與之前幀的另一個宏塊中的對應像素之間的絕對差??梢詫υ摬钋蠛鸵詣?chuàng)建對塊相似性的度量??梢允褂瞄撝祦泶_定相似性。
[0027]對于一些實施例,可以對來自宏塊405至445的SAD進行累加并將其用作針對宏塊405至445可以與其相關(guān)聯(lián)的區(qū)域的SAD。隨后可以將針對該區(qū)域的SAD與可以與宏塊的數(shù)量成比例的閾值進行比較。當針對該區(qū)域的SAD大于閾值時,可以表明滑動窗口 200所覆蓋的當前幀的區(qū)域與之前幀的對應區(qū)域不匹配。在這種情況下,有必要使用分類器函數(shù)來執(zhí)行針對當前幀的區(qū)域的目標檢測。例如,之前幀的區(qū)域可以不包含目標,但是當前幀的對應區(qū)域可以包含目標。作為另一個例子,之前幀的區(qū)域可以在第一位置中包含目標,而當前幀的對應區(qū)域還可以在第二位置中包含該目標。這可以表明該目標已經(jīng)通過運動離開,因此,將需要在當前幀中檢測該目標。當針對該區(qū)域的SAD小于閾值時,重新使用來自之前幀的對應區(qū)域的編碼信息是可能的。例如,如果在之前幀中的區(qū)域不包含目標,則可以認為當前幀的對應區(qū)域不包含目標。
[0028]轉(zhuǎn)到圖5,示出了根據(jù)一些實施例的示例性區(qū)域。區(qū)域500、520和540可以與之前幀相關(guān)聯(lián),而區(qū)域510、530和550可以與當前幀相關(guān)聯(lián)??梢允褂脜^(qū)域500和510來說明當區(qū)域500和510兩者都包含同一個目標505、但是在不同的位置包含該目標時的情況。由于第二位置可以非常接近(或幾乎相同)第一位置,所以針對區(qū)域510的SAD可以小于閾值。可以確定區(qū)域510的樣本區(qū)域(例如,中心點),并驗證該樣本區(qū)域是否位于區(qū)域505。這可以類似于對目標505進行跟蹤。對于一些實施例,當區(qū)域510的樣本區(qū)域也在區(qū)域505中時,可以將分類器函數(shù)邏輯單元320 (圖3)應用于區(qū)域510。
[0029]可以使用區(qū)域520和530來說明當目標525包含在區(qū)域530中、但是目標525沒有包含在區(qū)域520中時的情況。針對區(qū)域530的SAD可以大于閾值并且可以將分類器函數(shù)邏輯單元320應用于區(qū)域530。在目標525可以包含在區(qū)域520中但不包含在區(qū)域530中時,該情況可以顛倒。針對區(qū)域530的SAD可以大于閾值并且可以將分類器函數(shù)邏輯單元320應用于區(qū)域530??梢允褂脜^(qū)域540和550來說明當沒有目標在區(qū)域540和550中時的情況。針對區(qū)域550的SAD可以小于閾值并且不需要將分類器函數(shù)邏輯單元320應用于區(qū)域550。
[0030]轉(zhuǎn)到圖6A,示出了根據(jù)一些實施例的運動估計和目標檢測的方法600。方法600可以與圖3的運動估計和目標檢測系統(tǒng)300相關(guān)聯(lián)??梢詫⒎椒?00應用于視頻的幀。
[0031]在框605處,可以接收視頻的第一幀。在框610處,可以使用不同尺寸的滑動窗口來檢測在第一幀中的目標。在框615處,使用所述滑動窗口,分類器函數(shù)可以用于檢測第一幀中的目標。在框620處,接收第二視頻幀。在框625處,可以使用第二幀和第一幀之間的運動估計來檢測在第二幀中的目標。
[0032]轉(zhuǎn)到圖6B,示出了根據(jù)一些實施例的、使用絕對差之和(SAD)來執(zhí)行運動估計和目標檢測的方法650??梢詫⒎椒?50應用于巾貞的區(qū)域。在框655處,可以基于當前巾貞的區(qū)域和之前幀的對應區(qū)域來確定運動向量信息和SAD。該區(qū)域的SAD可以基于包括在該區(qū)域中的宏塊的SAD。在框660處,可以將SAD與閾值做比較。如果SAD大于閾值,則過程可以繼續(xù)到框665,在此處,可以執(zhí)行分類器函數(shù)以檢測當前幀的區(qū)域中的目標。例如,在當前幀的區(qū)域中存在目標而之前幀的對應區(qū)域中不存在目標時,這種情況可以發(fā)生。
[0033]如果SAD小于或等于閾值,隨后該過程可以從框660繼續(xù)到框670,在此處,可以執(zhí)行測試以確定當前幀的區(qū)域的樣本(例如,中心點)區(qū)段是否可以在之前幀的對應區(qū)域中找到。如果樣本區(qū)段也在之前幀的對應區(qū)域中,則該過程可繼續(xù)到框665,在此處,可以應用分類器函數(shù)以檢測當前幀的區(qū)域中的目標。例如,當在當前幀的區(qū)域中存在目標、并且可能由于運動的原因該目標還輕微不同地存在于之前幀的對應區(qū)域中時,這種情況可以發(fā)生。
[0034]可選地,該過程可以從框670繼續(xù)到框675,在此處,可以將之前幀的對應區(qū)域的編碼信息重新用于當前幀。例如,當在當前幀與之前幀兩者中的相同區(qū)域不包含任何目標時,這種情況可以發(fā)生。方法600和650可以使得能夠不必對不包含任何目標的區(qū)域執(zhí)行分類器函數(shù)??梢詫⒎椒?50重復用于當前幀的所有區(qū)域。
[0035]通過估計較少區(qū)域而同時保持與如同執(zhí)行了針對每個視頻幀的完全檢測相同的精確度,本發(fā)明的實施例可以極大地提高目標檢測操作的性能。本發(fā)明的實施例對視頻相關(guān)的應用(例如,視頻會議、視頻監(jiān)控等)可以是有用的,在該視頻相關(guān)的應用中,可以使用固定的攝像機,這是因為大多數(shù)的視頻背景的區(qū)域可以是無目標區(qū)域,并且除非視頻中出現(xiàn)了新的目標,其不會隨著時間明顯改變。本發(fā)明的實施例可直接應用于原始視頻,而不必縮放視頻幀。當縮放是必要的時,需要圖形控制器以恒定的縮放因子來維持一連串的視頻幀。需要將每個縮放的視頻幀與其自身的運動信息相關(guān)聯(lián)。可以在軟件、硬件或兩者的組合中執(zhí)行本發(fā)明的實施例。對于一些實施例,可以在硬件中執(zhí)行SAD邏輯單元315(圖3)的操作或框655中執(zhí)行的操作,以提高性能并降低運動估計成本。例如,一些圖形控制器可以包括可以用來執(zhí)行SAD邏輯單元315的操作的硬件加速引擎。
[0036]以上描述的方法可以被實現(xiàn)為存儲在機器可讀或計算機可讀存儲介質(zhì)、可配置邏輯單元、使用了電路技術(shù)的固定功能的邏輯硬件或其任意組合中的一組邏輯指令,機器可讀或計算機可讀存儲介質(zhì)例如是隨機存取存儲器(RAM)、只讀存儲器(ROM)、可編程ROM(PROM)、閃存等,可配置邏輯單元例如是可編程邏輯陣列(PLA)、現(xiàn)場可編程門陣列(FPGA)、復雜可編程邏輯設(shè)備(CPLD),使用的電路技術(shù)例如是專用集成電路(ASIC)、互補金屬氧化物半導體(CMOS)或晶體管-晶體管邏輯(TTL)技術(shù)。例如,可以以一種或多種編程語言的任意組合來編寫用于執(zhí)行該方法中示出的操作的計算機程序代碼,該一種或多種編程語言包括面向?qū)ο蟮木幊陶Z言(例如C++之類)和常規(guī)程序性編程語言(例如“C”編程語言或類似編程語言)。
[0037]圖7示出了系統(tǒng)700的實施例。在實施例中,系統(tǒng)700可以是介質(zhì)系統(tǒng),盡管系統(tǒng)700不限于本上下文。例如,可以將系統(tǒng)700合并到以下設(shè)備中:個人計算機(PC)、膝上型計算機、超薄膝上型計算機、平板電腦、觸摸平板、便攜計算機、手持計算機、掌上計算機、個人數(shù)字助理(PDA)、蜂窩電話、蜂窩電話/PDA的組合、電視機、智能設(shè)備(例如,智能手機、智能平板或智能電視機)、移動互聯(lián)網(wǎng)設(shè)備(MID)、通訊設(shè)備、數(shù)據(jù)通信設(shè)備等。
[0038]在實施例中,系統(tǒng)700包括耦合到顯示器720的平臺702。平臺702可以接收來自內(nèi)容設(shè)備的內(nèi)容,內(nèi)容設(shè)備例如是內(nèi)容服務設(shè)備730或內(nèi)容傳遞設(shè)備740或其它類似的內(nèi)容源。導航控制器750包括可以用于與例如平臺702和/或顯示器720交互的一個或多個導航特征。下面更加詳細地描述這些組件中的每一個組件。
[0039]在實施例中,平臺702可以包括以下的任意組合:芯片集705、處理器710、存儲器712、存儲設(shè)備714、圖形子系統(tǒng)715、應用716和/或無線電設(shè)備718。芯片集705可以在處理器710、存儲器712、存儲設(shè)備714、圖形子系統(tǒng)715、應用716和/或無線電設(shè)備718之間提供互相通信。例如,芯片集705可以包括能夠提供與存儲設(shè)備714的互相通信的存儲設(shè)備適配器(未描述)。
[0040]處理器710可以被實現(xiàn)為復雜指令集計算機(CISC)或精簡指令集計算機(RISC)處理器、X86指令集兼容處理器、多內(nèi)核、或任意其它微處理器或中央處理單元(CPU)。在實施例中,處理器710可以包括雙核處理器、雙核移動處理器等等。
[0041]存儲器712可以被實現(xiàn)為易失性存儲器設(shè)備,例如但不限于隨機存取存儲器(RAM)、動態(tài)隨機存取存儲器(DRAM)、或靜態(tài)RAM(SRAM)。
[0042]存儲設(shè)備714可以被實現(xiàn)為非易失性存儲設(shè)備,例如但不限于磁盤驅(qū)動器、光盤驅(qū)動器、磁帶驅(qū)動器、內(nèi)部存儲設(shè)備、附加存儲設(shè)備、快速存儲器、電池支持的SDRAM(同步DRAM)、和/或網(wǎng)絡可訪問存儲設(shè)備。在實施例中,當例如包括多個硬盤驅(qū)動器時,存儲設(shè)備714可以包括用于增加對有價值的數(shù)字媒體的存儲性能增強保護的工藝。
[0043]圖形子系統(tǒng)715可以執(zhí)行圖像(例如靜止的圖像或視頻圖像)處理以用于顯示。圖形子系統(tǒng)715可以例如是圖形處理單元(GPU)或視覺處理單元(VPU)??梢允褂媚M或數(shù)字接口來通信地耦合圖形子系統(tǒng)715和顯示器720。例如,接口可以是以下各項中的任意接口:高清晰度多媒體接口、顯示端口(DisplayPort)、無線HDM1、和/或適應無線HD的技術(shù)。圖形子系統(tǒng)715可以集成在處理器710或芯片集705中。圖形子系統(tǒng)715可以是通信地耦合到芯片集705的獨立卡。[0044]可以在各種硬件架構(gòu)中實現(xiàn)本文所描述的圖形和/或視頻處理技術(shù)。例如,可以將圖形和/或視頻功能集成在芯片集內(nèi)?;蛘?,可以使用分立的圖形和/或視頻處理器。作為另一個實施例,可以由包括多核處理器的通用處理器來實現(xiàn)圖形和/或視頻功能。在進一步的實施例中,可以在消費者電子設(shè)備中實現(xiàn)所述功能。
[0045]無線電設(shè)備718可以包括一個或多個能夠使用各種適當?shù)臒o線通信技術(shù)來發(fā)送和接收信號的無線電設(shè)備。這種技術(shù)可以包括跨越一個或多個無線網(wǎng)絡的通信。示例性無線網(wǎng)絡包括(但不限于)無線局域網(wǎng)(WLAN)、無線個域網(wǎng)(WPAN)、無線城域網(wǎng)(WMAN)、蜂窩網(wǎng)絡、和衛(wèi)星網(wǎng)絡。在跨越這些網(wǎng)絡的通信中,可以根據(jù)任何版本的一個或多個適用標準來操作無線電設(shè)備718。
[0046]在實施例中,顯示器720可以包括任何電視類型監(jiān)視器或顯示器。顯示器720可以包括例如:計算機顯示屏、觸摸屏顯示器、視頻監(jiān)視器、類電視設(shè)備、和/或電視機。顯示器720可以是數(shù)字的和/或模擬的。在實施例中,顯示器720可以是全息顯示器。此外,顯示器720可以是可以接收視覺投影的透明表面。這種投影可以傳遞各種形式的信息、圖像、和/或目標。例如,這種投影可以是用于移動增強現(xiàn)實(MAR)應用的視覺覆蓋。在一個或多個軟件應用716的控制之下,平臺702可以在顯示器720上顯示用戶界面722。
[0047]在實施例中,內(nèi)容服務設(shè)備730可以作為任意國家的、國際的、和/或獨立的服務的主機,并因此可以由平臺702經(jīng)由例如因特網(wǎng)來訪問。內(nèi)容服務設(shè)備730可以耦合到平臺702和/或顯示器720。平臺702和/或內(nèi)容服務設(shè)備730可以耦合到網(wǎng)絡760以向網(wǎng)絡760和從網(wǎng)絡760傳輸(例如,發(fā)送和/或接收)媒體信息。內(nèi)容傳遞設(shè)備740還可以耦合到平臺702和/或顯示器720。
[0048]在實施例中,內(nèi)容服務設(shè)備730可以包括有線電視盒、個人計算機、網(wǎng)絡、電話、支持因特網(wǎng)的設(shè)備或能夠傳遞數(shù)字信息和/或內(nèi)容的電器、以及能夠在內(nèi)容提供方和平臺702和/顯示器720之間單向地或雙向地(經(jīng)由網(wǎng)絡760或直接地)傳輸內(nèi)容的任何其它類似設(shè)備。應該意識到,可以經(jīng)由網(wǎng)絡760向系統(tǒng)700中的組件和內(nèi)容提供方中的任何一個以及從系統(tǒng)700中的組件和內(nèi)容提供方中的任何一個單向地和/或雙向地傳輸內(nèi)容。內(nèi)容的例子可以包括任何媒體信息,包括例如視頻、音樂、醫(yī)療和游戲信息等等。
[0049]內(nèi)容服務設(shè)備730接收例如包括媒體信息、數(shù)字信息的有線電視節(jié)目的內(nèi)容和/或其它內(nèi)容。內(nèi)容提供方的例子可以包括任何有線內(nèi)容提供方或衛(wèi)星電視內(nèi)容提供方或無線內(nèi)容提供方或因特網(wǎng)內(nèi)容提供方。所提供的例子并不意味著限制根據(jù)本發(fā)明的實施例。
[0050]在實施例中,平臺702可以從具有一個或多個導航特征的導航控制器750接收控制信號??刂破?50的導航特征可以被用于與例如用戶界面722互動。在實施例中,導航控制器750可以是定點設(shè)備,該定點設(shè)備可以是允許用戶輸入空間(例如,連續(xù)的且多維的)數(shù)據(jù)到計算機中的計算機硬件組件(具體地,人機接口設(shè)備)。很多系統(tǒng)(諸如圖形用戶界面(GUI))以及電視機和監(jiān)視器允許用戶使用形體姿勢來控制并提供數(shù)據(jù)給計算機或電視機。
[0051]控制器750的導航特征的運動可以通過顯示在顯示器(例如顯示器720)上的指針、光標、聚焦環(huán)或其它視覺指示符的運動而被回顯在顯示器上。例如,在軟件應用716的控制之下,位于導航控制器750上的導航特征可以被映射到例如顯示在用戶界面722上的虛擬導航特征。在實施例中,控制器750可以不是單獨的組件而可以被集成到平臺702和/或顯示器720中。然而,實施例不限于本文示出或描述的元件或上下文。
[0052]在實施例中,驅(qū)動器(未示出)可以包括例如在使能時,使用戶能夠在初始啟動之后通過觸摸按鈕來立刻打開和關(guān)閉平臺702 (像打開和關(guān)閉電視機一樣)的技術(shù)。當平臺被“關(guān)閉”時,程序邏輯單元可以允許平臺702將內(nèi)容流向媒體適配器或其它內(nèi)容服務設(shè)備730或內(nèi)容傳遞設(shè)備740。另外,芯片集705可以包括支持例如5.1環(huán)繞聲音頻和/或高清晰度7.1環(huán)繞聲音頻的硬件和/或軟件。驅(qū)動器可以包括用于所集成的圖形平臺的圖形驅(qū)動器。在實施例中,圖形驅(qū)動器可以包括外圍組件互連高速(PCIExpress)圖形卡。
[0053]在各種實施例中,可以集成系統(tǒng)700中示出的任意一個或多個組件。例如,可以集成平臺702和內(nèi)容服務設(shè)備730、或可以集成平臺702和內(nèi)容傳遞設(shè)備740,或可以集成例如平臺702、內(nèi)容服務設(shè)備730以及內(nèi)容傳遞設(shè)備740。在各種實施例中,平臺702和顯示器720可以是一集成單元。例如可以集成顯示器720和內(nèi)容服務設(shè)備730,或可以集成顯示器720和內(nèi)容傳遞設(shè)備740。這些例子并不意味著限制本發(fā)明。
[0054]在各種實施例中,系統(tǒng)700可以被實現(xiàn)為無線系統(tǒng)、有線系統(tǒng)或兩者的組合。當被實現(xiàn)為無線系統(tǒng)時,系統(tǒng)700可以包括適于通過無線共享介質(zhì)進行通信的組件和接口,例如一個或多個天線、發(fā)射機、接收機、收發(fā)機、放大器、濾波器、控制邏輯單元等等。無線共享介質(zhì)的一個例子可以包括部分的無線頻譜(例如RF頻譜等等)。當被實現(xiàn)為有線系統(tǒng)時,系統(tǒng)700可以包括適于通過有線通信介質(zhì)進行通信的組件和接口,例如輸入/輸出(I/O)適配器、物理連接器(用于連接I/O適配器與對應的有線通信介質(zhì))、網(wǎng)絡接口卡(NIC)、磁碟控制器、視頻控制器、音頻控制器等等。有線通信介質(zhì)的例子可以包括電線、電纜、金屬引線、印刷電路板(PCB)、底板、交換機結(jié)構(gòu)、半導體材料、雙絞線、同軸電纜、光纖等等。
[0055]平臺702可以建立一個或多個邏輯信道或物理信道以傳輸信息。信息可以包括媒體信息和控制信息。媒體信息可以指的是代表針對用戶的內(nèi)容的任何數(shù)據(jù)。內(nèi)容的例子可以包括例如來自以下的數(shù)據(jù):語音對話、視頻會議、流視頻、電子郵件(“email”)消息、語音郵件消息、字母數(shù)字符號、圖形、圖像、視頻、文本等等。來自語音對話的數(shù)據(jù)可以是例如:談話信息、靜默時段、背景噪聲、舒適噪聲、音調(diào)等等??刂菩畔⒖梢灾傅氖谴磲槍ψ詣踊到y(tǒng)的命令、指令、或控制字的任何數(shù)據(jù)。例如,控制信息可以用于通過系統(tǒng)來路由媒體信息,或指示節(jié)點以預先確定的方式來處理該媒體信息。然而,實施例并不受限于圖7中示出或描述的元件或上下文。
[0056]如上所述,系統(tǒng)700可以以變化的物理形式或外形規(guī)格來加以實施。圖8示出了小外形規(guī)格設(shè)備800的實施例,在該小外形規(guī)格設(shè)備800中可以實施系統(tǒng)700。在實施例中,例如,設(shè)備800可以被實現(xiàn)為具有無線能力的移動計算設(shè)備。移動計算設(shè)備可以指的是具有處理系統(tǒng)和移動電源或供電設(shè)備(例如一個或多個電池)的任何設(shè)備。
[0057]如上所述,移動計算設(shè)備的例子可以包括:個人計算機(PC)、膝上型計算機、超薄膝上型計算機、平板電腦、觸摸平板、便攜計算機、手持計算機、掌上計算機、個人數(shù)字助理(PDA)、蜂窩電話、蜂窩電話/PDA的組合、電視機、智能設(shè)備(例如,智能手機、智能平板或智能電視機)、移動互聯(lián)網(wǎng)設(shè)備(MID)、通訊設(shè)備、數(shù)據(jù)通信設(shè)備等等。
[0058]移動計算設(shè)備的例子還可以包括被設(shè)置為由人穿戴的計算機,例如:腕上計算機、指上計算機、指環(huán)計算機、眼鏡計算機、帶夾計算機、環(huán)臂計算機、鞋式計算機、衣式計算機、以及其它可穿戴計算機。在實施例中,例如,移動計算設(shè)備可以被實現(xiàn)為能夠執(zhí)行計算機應用、以及語音通信和/或數(shù)據(jù)通信的智能電話。盡管一些實施例可以被描述為具有移動計算設(shè)備(通過舉例的方式被實現(xiàn)為智能電話),但是應當理解,也可以使用其它無線移動計算設(shè)備來實現(xiàn)其它的實施例。所述實施例并不受限于該上下文。
[0059]如圖8所示,設(shè)備800可以包括殼體802、顯示器804、輸入/輸出(I/O)設(shè)備806、以及天線808。設(shè)備800還可以包括導航特征812。顯示器804可以包括用于顯示適于移動計算設(shè)備的信息的任意適當?shù)娘@示單元。I/O設(shè)備806可以包括用于輸入信息到移動計算設(shè)備中的任意適當?shù)腎/O設(shè)備。I/O設(shè)備806的例子可以包括字母數(shù)字鍵盤、數(shù)字鍵板、觸摸平板、輸入鍵盤、按鈕、開關(guān)、搖臂開關(guān)、話筒、揚聲器、語音識別設(shè)備和軟件等等。還可以通過話筒將信息輸入到設(shè)備800中。這種信息可以由語音識別設(shè)備來數(shù)字化。所述實施例不受限于該上下文。
[0060]可以使用硬件元件、軟件元件或兩者的組合來實現(xiàn)各種實施例。硬件元件的例子可以包括處理器、微處理器、電路、電路元件(例如,晶體管、電阻器、電容器、電感器等等)、集成電路、專用集成電路(ASIC)、可編程邏輯設(shè)備(PLD)、數(shù)字信號處理器(DSP)、現(xiàn)場可編程門陣列(FPGA)、邏輯門、寄存器、半導體設(shè)備、芯片、微芯片、芯片集等等。軟件的例子可以包括:軟件組件、程序、應用、計算機程序、應用程序、系統(tǒng)程序、機器程序、操作系統(tǒng)軟件、中間件、固件、軟件模塊、例程、子例程、函數(shù)、方法、過程、軟件接口、應用程序接口(API)、指令集、計算代碼、計算機代碼、代碼段、計算機代碼段、字、值、符號或其任意組合。確定是否使用硬件元件和/或軟件元件來實現(xiàn)實施例可以根據(jù)以下任意數(shù)量的因素來變化:例如所希望的計算速率、功率電平、耐熱性、處理周期預算、輸入數(shù)據(jù)速率、輸出數(shù)據(jù)速率、存儲器資源、數(shù)據(jù)總線速度和其它設(shè)計或性能限制。
[0061]至少一個實施例的一個或多個方面可以由存儲在機器可讀介質(zhì)中的代表性指令來實現(xiàn),該機器可讀介質(zhì)表示處理器內(nèi)的各種邏輯單元,當這些邏輯單元由機器讀取時,使得機器構(gòu)造邏輯單元以執(zhí)行本文中描述的技術(shù)。這種被稱為“IP內(nèi)核”的表示可以存儲在有形的機器可讀介質(zhì)上并供應給各種消費者或制造設(shè)施以加載到實際制造所述邏輯單元或處理器的制造機器中。
[0062]已經(jīng)給出了示例性尺寸/模型/值/范圍,盡管本發(fā)明的實施例并不限于同樣的尺寸/模型/值/范圍。由于制造技術(shù)(例如,光刻法)隨著時間日益成熟,可以期待的是可以制造較小型的設(shè)備。另外,為了說明和討論的簡單,在附圖中可以示出或可以不示出到集成電路(IC)芯片和其它組件的公知的功率/接地連接,以免模糊本發(fā)明的實施例的某些方面。進一步的,可以以框圖形式示出設(shè)置以免模糊本發(fā)明的實施例,并且也考慮到以下事實:關(guān)于這種框圖設(shè)置的實施方式的細節(jié)是高度取決于實施例將要在其中實施的平臺的,即,這種細節(jié)應當完全處于本領(lǐng)域技術(shù)人員的范圍內(nèi)。在闡述了具體細節(jié)(例如電路)以描述本發(fā)明的示例性實施例的情況下,對本領(lǐng)域技術(shù)人員來說應當顯而易見的是,可以在不具有這些具體細節(jié)或具有這些具體細節(jié)的變型的情況下實踐本發(fā)明的實施例。因此,本說明書被認為是說明性的而非限制性的。
[0063]可以在本文中使用的術(shù)語“耦合”指的是任意類型的以下關(guān)系:直接的或間接的、在正討論的組件之間的、以及可以應用到電子的、機械的、流體的、光學的、電磁的、機電的或其它連接。另外,除非另外指示,否則可以在本文中使用的術(shù)語“第一”、“第二”等僅僅有助于討論,并不表達具體的時間上的或按照時間順序的意義。[0064]根據(jù)前面的描述,本領(lǐng)域技術(shù)人員將理解,可以以各種形式來實施本發(fā)明的實施例的廣義技術(shù)。因此,盡管已經(jīng)結(jié)合了本發(fā)明的特定例子來描述了本發(fā)明的實施例,但是對有技術(shù)的實踐者來說,在學習了附圖、說明書、以及下面的權(quán)利要求之后,其它的修改將變的顯而易見,所以本發(fā)明的實施例的真正范圍不應該被如此限制。
【權(quán)利要求】
1.一種裝置,包括: 用于在具有第一幀和第二幀的視頻的所述第二幀的區(qū)域上執(zhí)行運動估計的邏輯單元;以及 用于基于所述第二幀的所述區(qū)域上的所述運動估計來確定是否在所述第二幀的所述區(qū)域上執(zhí)行目標檢測的邏輯單元。
2.根據(jù)權(quán)利要求1所述的裝置,其中所述第二幀是在所述視頻中相對于所述第一幀的后續(xù)幀,以及其中所述用于執(zhí)行所述運動估計的邏輯單元包括用于確定所述第二幀的所述區(qū)域與所述第一幀的對應區(qū)域之間的絕對差之和的邏輯單元。
3.根據(jù)權(quán)利要求2所述的裝置,其中所述用于確定所述絕對差之和的邏輯單元包括用于確定包括在所述第二幀的所述區(qū)域中和所述第一幀的所述對應區(qū)域中的宏塊上的絕對差之和的邏輯單元。
4.根據(jù)權(quán)利要求3所述的裝置,其中所述用于確定是否執(zhí)行所述目標檢測的邏輯單元包括用于執(zhí)行分類器函數(shù)的邏輯單元 。
5.根據(jù)權(quán)利要求4所述的裝置,還包括:用于將所述絕對差之和與閾值進行比較以確定是否在所述第二幀的所述區(qū)域上執(zhí)行所述目標檢測的邏輯單元。
6.根據(jù)權(quán)利要求5所述的裝置,其中如果所述絕對差之和大于所述閾值,則將在所述第二幀的所述區(qū)域上執(zhí)行所述目標檢測。
7.根據(jù)權(quán)利要求6所述的裝置,其中如果所述絕對差之和小于或等于所述閾值并且如果所述第二幀的所述區(qū)域的樣本區(qū)段包括在所述第一幀的所述對應區(qū)域中,則將在所述第二幀的所述區(qū)域上執(zhí)行所述目標檢測。
8.根據(jù)權(quán)利要求7所述的裝置,其中如果所述絕對差之和小于或等于所述閾值并且如果所述第二幀的所述區(qū)域的所述樣本區(qū)段未包括在所述第一幀的所述對應區(qū)域中,則不在所述第二幀的所述區(qū)域上執(zhí)行所述目標檢測。
9.根據(jù)權(quán)利要求8所述的裝置,其中所述第一幀的所述對應區(qū)域的編碼信息將被重新用于所述第二幀的所述區(qū)域。
10.一種系統(tǒng),包括: 處理器;以及 運動估計和目標檢測邏輯單元,所述運動估計和目標檢測邏輯單元與所述處理器耦合而且被配置為基于運動估計來檢測視頻的幀中的目標,其中所述視頻包括第一幀和第二幀,以及其中使用所述第二幀的區(qū)域和所述第一幀的對應區(qū)域之間的絕對差之和來在所述第二幀的所述區(qū)域上執(zhí)行所述運動估計。
11.根據(jù)權(quán)利要求10所述的系統(tǒng),其中在包括在所述第二幀的所述區(qū)域中以及所述第一幀的所述對應區(qū)域中的宏塊上執(zhí)行所述絕對差之和,以及其中所述第二幀是所述第一幀的后續(xù)幀。
12.根據(jù)權(quán)利要求11所述的系統(tǒng),其中所述運動估計和目標檢測邏輯單元還被配置為基于所述絕對差之和與閾值的比較來確定是否在所述第二幀的所述區(qū)域中檢測目標。
13.根據(jù)權(quán)利要求12所述的系統(tǒng),其中如果所述絕對差之和大于所述閾值,則將執(zhí)行所述用于在所述第二幀的所述區(qū)域中檢測所述目標的邏輯單元。
14.根據(jù)權(quán)利要求13所述的系統(tǒng),其中如果所述絕對差之和小于或等于所述閾值并且如果所述第二幀的所述區(qū)域的樣本區(qū)段包括在所述第一幀的所述對應區(qū)域中,則將執(zhí)行所述用于在所述第二幀的所述區(qū)域上檢測所述目標的邏輯單元。
15.根據(jù)權(quán)利要求14所述的系統(tǒng),其中如果所述絕對差之和小于或等于所述閾值并且如果所述第二幀的所述區(qū)域的所述樣本區(qū)段未包括在所述第一幀的所述對應區(qū)域中,則將不在所述第二幀的所述區(qū)域上執(zhí)行所述目標檢測。
16.根據(jù)權(quán)利要求15所述的系統(tǒng),還包括:用于在所述第二幀的所述區(qū)域上執(zhí)行分類器函數(shù)以在所述第二幀的所述區(qū)域中檢測所述目標的邏輯單元。
17.根據(jù)權(quán)利要求16所述的系統(tǒng),其中如果未在所述第二幀的所述區(qū)域上執(zhí)行所述目標檢測,則所述第一幀的所述對應區(qū)域的編碼信息將被重新用于所述第二幀的所述區(qū)域。
18.—種計算機實現(xiàn)的方法,包括: 在視頻的第一幀的多個區(qū)域上執(zhí)行目標檢測,以檢測包括在所述第一幀中的目標; 在所述視頻的第二幀的區(qū)域上執(zhí)行運動估計;以及 基于所述第二幀的所述區(qū)域上的所述運動估計來確定是否在所述第二幀的所述區(qū)域上執(zhí)行目標檢測。
19.根據(jù)權(quán)利要求18所述的方法,其中所述第二幀在所述視頻中處于所述第一幀之后,以及其中執(zhí)行所述目標檢測包括執(zhí)行分類器函數(shù)。
20.根據(jù)權(quán)利要求19所述的方法,其中在所述第二幀的所述區(qū)域上執(zhí)行所述運動估計包括確定所述第二幀的所述區(qū)域和所述第一幀的對應區(qū)域之間的絕對差之和。
21.根據(jù)權(quán)利要求20所述的方法,其中確定是否在所述第二幀的所述區(qū)域上執(zhí)行所述目標檢測包括將所述絕對差之和與閾值做比較。
22.根據(jù)權(quán)利要求21所述的方法,其中如果所述絕對差之和大于所述閾值,則在所述第二幀的所述區(qū)域上執(zhí)行所述目標檢測。
23.根據(jù)權(quán)利要求22所述的方法,其中如果所述絕對差之和小于或等于所述閾值并且如果所述第二幀的所述區(qū)域的樣本區(qū)段包括在所述第一幀的所述對應區(qū)域中,則在所述第二幀的所述區(qū)域上執(zhí)行所述目標檢測。
24.根據(jù)權(quán)利要求23所述的方法,其中如果所述絕對差之和小于或等于所述閾值并且如果所述第二幀的所述區(qū)域的所述樣本區(qū)段未包括在所述第一幀的所述對應區(qū)域中,則不在所述第二幀的所述區(qū)域上執(zhí)行所述目標檢測。
25.根據(jù)權(quán)利要求24所述的方法,其中當未在所述第二幀的所述區(qū)域上執(zhí)行所述目標檢測時,所述第一幀的所述對應區(qū)域的編碼信息被重新用于所述第二幀的所述區(qū)域。
26.—種系統(tǒng),包括: 處理器; 耦合到所述處理器的外部供電設(shè)備; 運動估計和目標檢測邏輯單元,所述運動估計和目標檢測邏輯單元耦合到所述處理器且被配置為基于運動估計來檢測視頻的幀中的目標,其中所述視頻包括第一幀和第二幀,以及其中使用所述第二幀的區(qū)域和所述第一幀的對應區(qū)域之間的絕對差之和來在所述第二幀的所述區(qū)域上執(zhí)行所述運動估計。
27.根據(jù)權(quán)利要求26所述的系統(tǒng),其中在包括在所述第二幀的所述區(qū)域中以及所述第一幀的所述對應區(qū)域中的宏塊上執(zhí)行所述絕對差之和,以及還包括用于在所述第二幀的所述區(qū)域上執(zhí)行分類器函數(shù)以在所述第二幀的所述區(qū)域中檢測所述目標的邏輯單元。
28.根據(jù)權(quán)利要求27所述的系統(tǒng),其中所述第二幀是所述第一幀的后續(xù)幀,以及其中所述運動估計和目標檢測邏輯單元還被配置為基于所述絕對差之和與閾值的比較來確定是否在所述第二幀的所述區(qū)域中檢測目標。
29.根據(jù)權(quán)利要求28所述的系統(tǒng),其中如果所述絕對差之和大于所述閾值,則將執(zhí)行用于在所述第二幀的所述區(qū)域中檢測所述目標的邏輯單元,其中如果所述絕對差之和小于或等于所述閾值,則將不在所述第二幀的所述區(qū)域上執(zhí)行所述目標檢測,以及其中如果未在所述第二幀的所述區(qū) 域上執(zhí)行所述目標檢測,則所述第一幀的所述對應區(qū)域的編碼信息將被重新用于所述第二幀的所述區(qū)域。
【文檔編號】H04N5/14GK104012072SQ201180076093
【公開日】2014年8月27日 申請日期:2011年12月30日 優(yōu)先權(quán)日:2011年12月30日
【發(fā)明者】Q·栗, Y-J·秋, Y-t·彭, Y·杜, J·李 申請人:英特爾公司