針對多視角視頻內容的運動跳躍和單環(huán)路編碼的制作方法

文檔序號：7941882閱讀：181來源：國知局

專利名稱：針對多視角視頻內容的運動跳躍和單環(huán)路編碼的制作方法
技術領域：
本發(fā)明的示例性實施方式一般涉及視頻編碼，更具體地，本發(fā)明涉及針對多視角視頻內容的視頻編碼。
背景技術：
本部分意在為權利要求書中闡述的本發(fā)明提供背景或上下文。此處的描述可以包括可被探究的原理，但是這些原理并不必須是以前已經(jīng)構思過或者探究過的那些。因此，除非在此指出，否則在本部分中所描述的并不是本申請說明書和權利要求書的現(xiàn)有技術，也不因為包括在此部分中就承認是現(xiàn)有技術。視頻編碼標準包括ITU-T H. 261、IS0/IEC運動圖片專家組(MPEG)-I Visual、 ITU-T H. 262 或 IS0/IEC MPEG-2 Video、ITU-TH. 263、IS0/IEC MPEG-4 Visual 和 ITU-T H. 264(也稱為IS0/IECMPEG-4高級視頻編碼(AVC))。另外，當前正在努力開發(fā)新的視頻編碼標準。正在開發(fā)的一個這種標準是可伸縮視頻編碼(SVC)標準，其將成為對H.264/AVC 的可伸縮擴展。另一正在開發(fā)的這種標準是多視角視頻編碼(MVC)標準，其將成為H. 264/ AVC的另一種擴展。在多視角視頻編碼中，從不同照相機輸出的視頻序列被編碼成一個比特流，其中每個視頻序列對應于不同的視角。在解碼之后，為了顯示特定視角，重建屬于該視角的已解碼圖片并進行顯示。還有可能對不止一個視角進行重建和顯示。多視角視頻編碼具有廣泛的應用，包括自由視點視頻/電視、3D TV和監(jiān)視應用。目前，IS0/IEC運動圖片專家組 (MPEG)和ITU-T視頻編碼專家組的聯(lián)合視頻組(JVT)正在從事開發(fā)MVC標準的工作，其正成為H. 264/AVC的擴展。這些標準在此分別稱為MVC和AVC。MVC的最新工作草案在2007年6_7月于瑞士日內瓦舉辦的第24次JVT會議中提出的 JVT-X209，“Joint Draft 4.0 on MultiviewVideo Coding”中講行了描沭,其可從 ftp3. itu. ch/av-arch/ivt-site/2007 06 Geneva/.TVT-X209. zip 得到。除了在 MVC 的工作草案中定義的特征之外，其他潛在的特征，尤其是關注于編碼工具的那些特征在聯(lián)合多視角視頻模型(JMVM)中進行了描述。最新版本的JMVM在2007年6-7月于瑞士日內瓦舉辦的第 24 次 JVT 會議中提出的 JVT-X207，“Joint Multiview Video Model (JMVM) 5· 0” 中進行了描述，其可從 fto3. itu. ch/av-arch/ivt-site/2007 06 Geneva/.TVT-X207. zip 得到。圖1是示出了典型的MVC解碼順序(也即，比特流順序)的表示。解碼順序安排稱為時間優(yōu)先編碼。每個存取單元定義為包含針對一個輸出時間實例的所有視角的編碼圖片。應當注意，存取單元的解碼順序可以與輸出順序或顯示順序不相同。圖2中示出了用于多視角視頻編碼的典型的MVC預測(包括每個視角內的圖片間預測和視角間預測二者) 結構。在圖2中，通過箭頭指示預測，其中每個被指向的對象使用相應的來源對象作為預測參考。傳統(tǒng)上，在MVC中使用多環(huán)路解碼。在多環(huán)路解碼中，為了解碼目標視角，除了目標視角本身之外，還需要利用運動補償環(huán)路對目標視角進行視角間預測所需的每個視角進行完全的重建。例如，如果只輸出視角1(圖2中示出為Si)，則視角0和視角2中的所有圖片必須被完全地重建。多環(huán)路解碼相比于單視角編碼(其中每個視角使用例如H. 264/ AVC獨立地編碼成其自己的比特流)需要多得多的計算和存儲器。這是因為，在多環(huán)路解碼中，屬于其他視角但卻是視角間預測所需要的所有圖片必須被完全地重建并且存儲在解碼圖片緩存器中。在MVC聯(lián)合草案(JD)4. 0中，在序列參數(shù)集合(SPS)MVC擴展中規(guī)定了視角依賴關系。針對錨圖片和非錨圖片的依賴關系是單獨規(guī)定的。因此，錨圖片和非錨圖片可以具有不同的視角依賴關系。然而，對于參考相同SPS的圖片集合，所有錨圖片必須具有相同的視角依賴關系，而且所有非錨圖片必須具有相同的視角依賴關系。在SPS MVC擴展中，針對在 RefPicListO和RefPicListl中用作參考圖片的視角，用信號單獨發(fā)送給各依賴視角。存在多個僅需要輸出編碼視角的子集的用例。這些特定視角稱為目標視角或輸出視角。目標視角可以依賴于其他視角，這些其他視角不是用于輸出，或者說不是用于解碼的。目標視角所依賴的但是不用于輸出的這些特定視角稱為依賴視角。由圖片P使用于視角間預測的圖片稱為圖片P的視角間參考圖片。視角間參考圖片可以屬于目標視角或依賴視角。盡管按照在SPSMVC擴展中用信號發(fā)送的視角依賴關系，一個視角被其他視角所依賴，但是在一個視角中的特定圖片可能從來不會用于視角間預測。在JD 4.0中，在網(wǎng)絡提取層(NAL)單元報頭中存在視角間標志(inter_View_flag)，其指示包含此NAL單元的圖片是否用于其他視角中的圖片的視角間預測?？梢栽趦蓚€方向上用信號發(fā)送依賴視角。這些方向對應于兩個參考圖片列表的視角間預測參考圖片，這兩個參考圖片列表即第一參考圖片列表RefPicLiStO,也稱為前向參考圖片列表，和第二參考圖片列表RefPicListl，也稱為后向參考圖片列表。對應于 RefPicListO的依賴視角稱為前向依賴視角，而對應于RefPicListl的依賴視角稱為后向依賴視角。就圖2中所示的示例而言，視角0是視角1的前向依賴視角，而視角2是視角1 的后向依賴視角。在MVC JD 4.0中，僅紋理預測支持視角間預測(也即，僅重建的樣本值可以用于視角間預測)，并且僅僅那些與當前圖片相同輸出時間實例的重建圖片用于視角間預測。如此處所討論的，MVC JD4.0中傳統(tǒng)的視角間預測稱為視角間樣本預測。作為JMVM中的編碼工具，運動跳躍根據(jù)視角間參考圖片來預測宏塊(MB)模式和運動矢量，并且其僅應用于非錨圖片。在編碼期間，當對錨圖片進行編碼時，估計全局視差運動矢量(GDMV)，繼而導出用于非錨圖片的GDMV，使得用于非錨圖片的GDMV是根據(jù)兩個相鄰錨圖片的GDMV的加權平均。GDMV具有16像素精度，也即，對于當前圖片(即正被編碼或解碼的圖片)中的任何MB，按照GDMV在視角間參考圖片中移動的對應區(qū)域剛好覆蓋視角間參考圖片中的一個MB。出于簡化目的，集合術語“同位(co-located)塊”在此用于描述運動視差補償后，視角間參考圖片中對應的4 X 4、8 X 4、4 X 8塊或8 X 8MB分區(qū)。在一些情況下，術語“同位 MB分區(qū)”用于描述對應的MB分區(qū)，而術語“同位MB”用于描述對應的MB。正常情況下，來自第一前向依賴視角的圖片用作運動跳躍視角間參考圖片。然而，如果第一前向依賴視角的圖片中的同位MB是幀內編碼的，那么考慮另一候選，來自第一后向依賴視角的圖片的同位MB(如果存在的話)。如果這兩個MB都是幀內編碼的，那么不能使用運動跳躍來對當前的MB進行編碼。圖3中示出了運動跳躍的一個示例，其中視角0是依賴視角，視角1是將要被輸出和顯示的目標視角(在圖3中標記為“當前解碼視角”)。利用視差運動，當對視角1中的諸多MB進行解碼時，定位視角0中對應的MB，并且將它們的模式和運動矢量被重復用作針對視角1中的各MB的MB模式和運動矢量。視角間樣本預測對應于多環(huán)路解碼，因為其需要針對用于視角間樣本預測的視角間參考圖片進行運動補償，而與之不同，運動跳躍本身并不需要對用于運動跳躍的視角間參考圖片進行運動補償。然而，在當前的MVC標準草案中，由于視角間樣本預測和運動跳躍同時存在，因此需要多環(huán)路解碼。在H. 264/AVC的擴展版本(也稱為SVC)中支持單環(huán)路解碼(SLD)。在2007年 6-7月于瑞士日內瓦舉辦的第24次JVT會議中提出的JVT-X201，“ Joint Draft 11 of SVC Amendment”中描述了 SVC 規(guī)范，該文檔可從 ftp3. itu. ch/av-arch/ ivt-site/2007 06 GeneVa/.TVT-X201.ziD得到。SVC中SLD的基本概念如下。為了對依賴于多個較低層的目標層進行解碼，僅需要對目標層本身進行完全解碼。對于較低層，僅需要對幀內MB進行解析和解碼。SVC中的SLD僅需要目標層處的運動補償。因而，SLD提供了顯著的復雜度降低。而且，由于較低層不需要運動補償，并且在解碼圖片緩存器(DPB)中不需要存儲樣本值，因此解碼器存儲需求相比于多環(huán)路解碼得以明顯降低，而在多環(huán)路解碼中，正如在早期視頻編碼標準的可擴展簡檔中一樣，在每一層中都需要運動補償和完全解碼。同樣原理可應用于WC,從而僅對目標視角進行完全解碼。以下是對H. 264/AVC中選擇的特征的討論。在H. 264/AVC中，片(slice)中的各 MB可以具有用于幀間預測的不同參考圖片。用于特定MB或MB分區(qū)的參考圖片選自參考圖片列表，所述參考圖片列表提供針對解碼圖片緩存器中可用的并且用于預測參考的解碼圖片的索引。針對每個MB或MB分區(qū)以及每個預測方向，用信號發(fā)送參考索引以指派用于幀間預測的參考圖片。H. 264/AVC中的參考圖片列表構造可以描述如下。首先，構造包括所有短期和長期參考圖片的初始參考圖片列表，這些參考圖片標記為“用于參考”。然后在片報頭包含參考圖片列表重排序(RPLR)命令時，執(zhí)行參考圖片列表重排序。RPLR過程可以將參考圖片重新排序成與初始列表中的順序不同的順序。在重新排序之后，初始列表和最終列表二者都只包含由片報頭中的語法元素或由該片所參考的圖片參數(shù)集合所指示的特定數(shù)目的條目。在H. 264/AVC中，每個圖片編碼成一個或多個片，其可以包括五種片類型一1、SI、 P、SP或B。I片中的MB被編碼為幀內MB。P片或B片中的MB被編碼為幀內MB或幀間MB。 P片中的每個幀間MB是一個P間MB或由P間MB分區(qū)構成。B片中的每個幀間MB是一個 P間MB或一個B間MB，或者由P間MB分區(qū)或B間MB分區(qū)構成。對于P間MB或MB分區(qū)，可以使用僅來自一個方向的預測。對于B間MB或MB分區(qū)，可以使用來自兩個方向的預測，其中對來自兩個參考圖片的兩個預測塊進行樣本加權以得到最終的預測MB或MB分區(qū)。對于P片中的P間MB或MB分區(qū)，唯一的預測方向來自RefPicListO。來自 RefPicListO的預測稱為前向預測，盡管參考幀在顯示順序上可以是在當前圖片之前或之后。對于B片中的P間MB或MB分區(qū)，唯一的預測方向可以來自RefPicListO或 RefPicListl0當預測來自RefPicListO時，其稱為前向預測。否則，其稱為后向預測。當MB或MB分區(qū)具有僅來自RefPicListO的參考索引時，其參考狀態(tài)定義為前向預測。當MB或MB分區(qū)具有僅來自RefPicListl的參考索引時，其參考狀態(tài)定義為后向預測。當MB或MB分區(qū)具有來自RefPicListO和RefPicListl 二者的兩個參考索引時，其參考狀態(tài)定義為雙向預測。對于任何MB或MB分區(qū)，取決于編碼模式，其參考狀態(tài)可以是以下之一 (a)幀內， (b)B間(雙向預測)，(C)P間前向預測以及(d)P間后向預測。此處第一狀態(tài)指示為非法，其他三個狀態(tài)指示是合法的。對于每個MB，MB可以被編碼為幀內MB或幀間MB。當對MB進行幀間編碼時，其可以被進一步劃分為MB分區(qū)，其大小可以為16X 16、16X8、8X 16或8X8，如圖4上部分所示。每個MB或MB分區(qū)共享相同的參考狀態(tài)和相同的參考索引(若為雙向預測，則有多個索引)。此外，每個MB或MB分區(qū)可以劃分為8 X 8、8 X 4、4 X 8或4 X 4的塊(或子宏塊分區(qū))，如圖4下部分所示。每個塊中的樣本共享相同的運動矢量(或者針對雙向預測為2個運動矢量，針對一個方向存在一個運動矢量)。迄今開發(fā)的所有基于H. 264/AVC或兼容的標準都遵循此層級化MB分區(qū)，因為其將使得針對運動補償部分的硬件設計模塊可應用于 H. 264/AVC的擴展標準。對于每個MB、MB分區(qū)或4X4塊，如果使用來自RefPicListX的幀間預測，則此MB、 MB分區(qū)或4X4塊標記為“使用ListX”(其中X是0或1)。否則，此MB、MB分區(qū)或4X4塊標記為“未使用ListX”。JMVM中傳統(tǒng)的運動跳躍方法基于全局視差運動，并且全局視差運動在水平和垂直兩個方向上均具有16像素的精度。利用16像素精度的全局視差運動，直接復制完整MB的模式和運動矢量，使得此信息不需要逐塊地來計算。然而，全局視差運動的精度影響運動跳躍的性能，因為全局視差運動的精度越高，將導致越有效的運動跳躍，由此導致更高的編碼效率。通常此全局運動可以通過圖像配準算法來找出，其中位移是優(yōu)化問題的解。當使用 8像素精度時，在位移的每個方向(χ軸或y軸)上，一個單位對應于8個像素。因此，各同位MB與視角間參考圖片中8X8塊的邊界對準。當使用4像素精度時，在位移的每個方向 (χ軸或y軸)上，一個單位對應于4個像素。因此，各同位MB與視角間參考圖片中4X4塊的邊界對準。測試序列的一個測試涉及針對同一時間實例內但是來自不同視角的圖片對，搜索具有4像素精度的最優(yōu)位移。在此測試中，具有導致MB邊界對準的最優(yōu)位移(χ軸和y軸上的位移值可以被4整除)的圖片對的百分比大約為20%。這表示，基于4像素精度的配準可以提供比基于16像素精度的配準更好的配準性能。在H. 264/AVC中，運動場中的運動矢量可以分配給每個4X4塊，也即，運動場的樣本具有4像素的精度。因此，視差運動(其目的在于重復使用來自視角間參考圖片的運動矢量)可以適宜地具有相同的精度。當運動視差具有4像素精度并且假設運動視差值的每個單位代表4個像素時，當前圖片中的每個8 X 8MB分區(qū)可以定位到4個8 X 8MB分區(qū)中(例如，如圖5和圖6所示)、1 個8X8MB分區(qū)中(例如，如圖7所示)或者2個8X8MB分區(qū)中(例如，如圖8所示)。第一情形中運動視差的值與(1，1)是模2同余的，第二情形中這些值與(0，0)是模2同余的，而第三情形中這些值與(1，0)或(0，1)是模2同余的。正如在此所使用的那樣并且除非明確指出，否則MB分區(qū)默認是指8 X 8MB分區(qū)，而塊默認是指4X 4 土夬。
當視差運動具有4像素精度時，可能產(chǎn)生多個問題。在B片中，按照H. 264/AVC層級化宏塊分區(qū)，每個MB分區(qū)中的所有塊必須同時被前向預測(“使用ListO”但是“未使用 Listl”)、后向預測(“使用Listl”但是“未使用ListO”)或雙向預測(“使用ListO”且 “使用Listl”)。然而，如果視差矢量與(1，1)模2同余，則同位MB分區(qū)可能打破此規(guī)則。例如如圖5所示，同位MB分區(qū)的四個同位塊屬于四個分別進行了后向預測、前向預測、雙向預測和雙向預測的MB分區(qū)。附加地，當使用多個參考圖片時，MB分區(qū)可能具有不同的參考索引并且參考不同的參考圖片。如圖6所示，如果視差矢量與(1，1)模2同余，那么存在來自視角間參考圖片的四個MB分區(qū)，其覆蓋了同位MB中的左上同位MB分區(qū)。這些8 X 8MB分區(qū)可以具有不同的參考索引。例如，如圖6所示，在前向預測方向上，參考索引可以分別是0、1、2和0。然而，按照H. 264/AVC層級化宏塊分區(qū)，無論何時“使用ListX”(其中X為0或1)，在H. 264/ AVC中幀間MB的8X8MB分區(qū)中的塊都只可能具有針對一個預測方向的相同參考索引。而且，如果視差矢量與(0，0)模2同余，并且視差矢量與8X8塊(或者說MB分區(qū))邊界對準，則可能出現(xiàn)這樣的情況同位MB中的一個或多個同位MB分區(qū)對應于來自針對運動跳躍所考慮的視角間參考圖片的幀內MB中的像素。例如如圖7所示，當前MB的右上 8 X 8MB分區(qū)對應于幀內MB中的像素。因此，不能使用運動跳躍，因為沒有可供右上8 X 8MB 分區(qū)復制的運動信息。當視差運動矢量具有8像素精度(其中視差運動矢量的每個單位表示8個像素)并且值不與(0，0)模2同余時，也存在這一問題。除以上之外，針對運動跳躍信令還存在多個問題。例如，對于依賴視角中的圖片，根據(jù)視角依賴關系可以確定其可以用作視角間參考圖片。然而，不能知曉其是否用于視角間樣本預測或用于運動跳躍。NAL單元報頭中的視角間標志(inter_View_flag)指示圖片是否被任何其他視角用于視角間樣本預測。如果依賴視角圖片僅用于運動跳躍，則不需要重建樣本值，其中如果圖片是幀間編碼的，則樣本值的重建需要運動補償。因而，解碼器常規(guī)上仍然必須對圖片進行完全解碼并且存儲已解碼圖片，即使該圖片僅用于運動跳躍。這導致了較高的復雜度和額外的存儲器使用。此外，盡管有些片可以受益于運動跳躍，但是其他片可能不能從中受益。然而，在傳統(tǒng)的JMVM布置中，每個MB需要指示來指明在該MB中是否使用運動跳躍。這不必要地浪費了比特并且降低了編碼效率。而且，傳統(tǒng)的JMVM布置僅用信號發(fā)送錨圖片處的全局視差運動，這引起多個其自身的問題。這些問題包括(1)事實上最優(yōu)視差可能隨圖片而變化，因而推導出的視差可能并非對于所有圖片都是最優(yōu)的；以及(2)用于錨圖片的視角間參考圖片可能不同于用于非錨圖片的那些視角間參考圖片，這意味著，對于特定非錨圖片，在兩個相鄰錨圖片中針對視角間參考圖片而用信號發(fā)送的視差運動即使在加權之后也可能不適用。更進一步地，對于特定MVC比特流，針對所有非錨圖片，如果基于依賴視角的視角間預測僅包含運動跳躍，也即，沒有視角間樣本預測，則依賴視角不需要在非錨圖片處進行完全重建。相反，可以簡單地對依賴視角中的非錨圖片進行解析以獲取MB模式和用于運動跳躍的運動信息。然而，在傳統(tǒng)布置中，解碼器并不知道有可能是單環(huán)路解碼。除上述內容之外，當前的運動跳躍基于全局視差運動。然而，在實踐中，兩個視角之間的最優(yōu)轉換可能是非線性的，并且具有不同深度和不同位置的對象可能需要不同的視差。在有些具有從一個小區(qū)域到另一個區(qū)域快速變化的運動行為的序列中，對于每個MB而言全局視差不夠精確。因此，從編碼效率的角度看，運動跳躍編碼系統(tǒng)是次優(yōu)的。

發(fā)明內容
通過使用本發(fā)明的示例性實施方式，解決了前述和其他問題，并且實現(xiàn)了其他優(yōu)勢。在本發(fā)明示例性實施方式的第一方面中，提供一種方法，包括將第一輸入圖片序列和第二輸入圖片序列編碼到比特流中，其中第一輸入圖片序列的第一輸入圖片可以或者可以不旨在用于輸出，并且其中第二輸入圖片序列的第二輸入圖片旨在用于輸出；包括指示視差運動的視差信號指示；使用運動推導方法、按照所述視差運動從第一輸入圖片推導出至少一個運動矢量；以及在對第二輸入圖片的編碼中使用至少一個推導出的運動矢量。在本發(fā)明示例性實施方式的另一方面中，提供一種設備，包括處理器；以及可通信地連接到處理器的存儲器單元，其包括被配置用于將第一輸入圖片序列和第二輸入圖片序列編碼到比特流中的計算機代碼，其中第一輸入圖片序列的第一輸入圖片可以或者可以不旨在用于輸出，并且其中第二輸入圖片序列的第二輸入圖片旨在用于輸出；被配置用于包括指示視差運動的視差信號指示的計算機代碼；被配置用于使用運動推導方法、按照所述視差運動從第一輸入圖片推導出至少一個運動矢量的計算機代碼；以及被配置用于在對第二輸入圖片的編碼中使用至少一個推導出的運動矢量的計算機代碼。在本發(fā)明示例性實施方式的另一方面中，提供一種設備，包括用于將第一輸入圖片序列和第二輸入圖片序列編碼到比特流中的裝置，其中第一輸入圖片序列的第一輸入圖片可以或者可以不旨在用于輸出，并且其中第二輸入圖片序列的第二輸入圖片旨在用于輸出；用于包括指示視差運動的視差信號指示的裝置；用于使用運動推導方法、按照所述視差運動從第一輸入圖片推導出至少一個運動矢量的裝置；以及用于在對第二輸入圖片的編碼中使用至少一個推導出的運動矢量的裝置。在本發(fā)明示例性實施方式的又一方面中，提供一種方法、計算機程序和設備，其被配置用于將第一輸入圖片序列和第二輸入圖片序列編碼到比特流中；以及在第一輸入圖片序列的片報頭中用信號發(fā)送運動是否是通過從第二序列中的圖片的推導而生成的。在本發(fā)明示例性實施方式的再一方面中，提供一種方法、計算機程序和設備，其被配置用于將第一輸入圖片序列和第二輸入圖片序列編碼到比特流中；以及在網(wǎng)絡提取層單元報頭中用信號發(fā)送第二輸入圖片序列中的圖片是否被第一輸入圖片序列中的至少一個圖片用于運動跳躍。在本發(fā)明示例性實施方式的另一方面中，提供一種方法、計算機程序和設備，其被配置用于從比特流接收第一輸入圖片序列和第二輸入圖片序列；接收網(wǎng)絡提取層單元報頭中的信號，該信號指示第二輸入圖片序列中的圖片是否被第一輸入圖片序列中的至少一個圖片用于運動跳躍，以及如果該信號指示第二輸入圖片序列中的圖片被第一輸入圖片序列中的至少一個圖片用于運動跳躍，則在對第一輸入圖片序列中的所述至少一個圖片進行解碼時，使用第二輸入圖片序列中的所述圖片以用于運動跳躍。在本發(fā)明示例性實施方式的另一方面中，提供一種方法、計算機程序和設備，其被配置用于接收第一輸入圖片序列和第二輸入圖片序列，第一輸入圖片序列的片報頭包括有關運動是否是通過從第二序列中的圖片的推導而生成的信號，以及如果第一輸入圖片序列的片報頭中的所述信號指示運動是通過從第二序列中的圖片的推導而生成的，則使用從第二序列中的圖片推導出的運動來對第一輸入圖片序列中的至少一個圖片進行解碼。在本發(fā)明示例性實施方式的又一方面中，提供一種方法、計算機程序和設備，其被配置用于將第一輸入圖片序列和第二輸入圖片序列編碼到比特流中，其中第一輸入圖片序列的第一輸入圖片可以或者可以不旨在用于輸出，并且其中第二輸入圖片序列的第二輸入圖片旨在用于輸出；包括指示宏塊視差運動的視差信號指示；使用運動推導方法、按照所述視差運動從第一輸入圖片推導出至少一個運動矢量；以及使用至少一個推導出的運動矢量以用于運動補償。在本發(fā)明示例性實施方式的又一方面中，提供一種設備，其包括用于將第一輸入圖片序列和第二輸入圖片序列編碼到比特流中的裝置，其中第一輸入圖片序列的第一輸入圖片可以或者可以不旨在用于輸出，并且其中第二輸入圖片序列的第二輸入圖片旨在用于輸出；用于包括指示宏塊視差運動的視差信號指示的裝置。所述設備進一步包括用于使用運動推導方法、按照所述視差運動從第一輸入圖片推導出至少一個運動矢量的裝置，該至少一個推導出的運動矢量用于運動補償。所述設備進一步包括用于在比特流中包括至少一個進一步指示的裝置，所述至少一個進一步指示用于指示以下中的至少一個圖片是否在對所述至少一個運動矢量的推導中使用，視角是否使用任何其他視角以用于視角間樣本預測，以及視角是否支持單環(huán)路解碼。

圖1是示出了典型的MVC解碼順序(也即，比特流順序)的表示；圖2是用于多視角視頻編碼的典型的MVC預測(包括每個視角內的圖片間預測以及視角間預測二者)結構的表示；圖3是示出了使用視差運動矢量的運動跳躍示例的圖示；圖4是示出了在傳統(tǒng)的基于H. 264/AVC或兼容的標準中使用的層級化宏塊分區(qū)布置的表示；圖5是位于在針對運動跳躍所考慮的視角間參考圖片中具有不同參考狀態(tài)的多個MB分區(qū)中的同位8 X 8分區(qū)示例；圖6是位于在針對運動跳躍所考慮的視角間參考圖片中具有不同參考索引值的多個MB分區(qū)中的同位分區(qū)示例；圖7是對應于針對運動跳躍所考慮的視角間參考圖片的幀內MB中的像素的同位 8X8分區(qū)示例；圖8是位于兩個8 X 8MB分區(qū)內的8 X 8分區(qū)的表示；圖9是可以在其中實施本發(fā)明各種實施方式的通用多媒體通信系統(tǒng)的圖形表示；圖10是示出了按照各種實施方式當存在一個或多個視角間參考圖片時所遵循的算法中涉及的過程的流程圖；圖11是按照各種實施方式的運動矢量縮放的圖形表示；圖12(a)是在非法同位MB分區(qū)中的四個塊以及它們的類別(縮放1、縮放2和縮放3)的表示；以及圖12(b)是代表圖12(a)中諸多塊的單個塊以及該塊的相應的4個相鄰塊的圖示；圖13是示出了由兩個視角間參考圖片預測的可用運動信息的示例；圖14是來自相鄰MB的(A，B, D和C)的運動視差預測的表示；圖15是可以結合本發(fā)明各種實施方式的實現(xiàn)一起使用的電子設備的透視圖；以及圖16是可以包括在圖15的電子設備中的電路的示意性表示。
具體實施例方式本發(fā)明的各種示例性實施方式涉及用于實現(xiàn)運動跳躍和單環(huán)路解碼以用于多視角視頻編碼的系統(tǒng)和方法。在各種示例性實施方式中，針對當前具有8X8或4X4像素視差運動矢量精度的JMVM布置使用更有效的運動跳躍，同時維持與有關分層化宏塊分區(qū)的 H. 264/AVC設計相兼容的運動補償過程。該系統(tǒng)和方法可應用于多環(huán)路解碼和單環(huán)路解碼。針對上面提到的有關8像素或4像素精度運動跳躍的問題，可以使用自適應參考合并以便實現(xiàn)從一個視角間參考圖片更精確的運動跳躍。這種自適應參考合并也可以應用于多個視角間參考圖片。對于存在多個視角間參考圖片的情形，尤其是針對不同方向上的多個視角間參考圖片的情形，可以使用組合的運動跳躍算法。針對前面提到的信令問題，為了指示圖片是否將用于運動跳躍，可以使用NAL單元報頭中的語法變型或新的語法元素。為了指示圖片是否使用了運動跳躍，可以在片報頭中添加標志，并且可以在用于每個片的片報頭中用信號發(fā)送相關的視差運動矢量。比特流的單環(huán)路解碼功能可以在序列級別用信號發(fā)送。還可以用信號發(fā)送針對每個MB或MB分區(qū) 的運動視差。在視角之間使用視角間預測時，使用本發(fā)明各種示例性實施方式以用于改善編碼效率，同時在不將某些視角用于輸出時還降低整體復雜度。此外，此處討論的各種運動跳躍布置也可以用于單環(huán)路解碼，其針對僅視角間預測需要而不用于輸出的那些視角不應用運動補償。本發(fā)明的這些和其他優(yōu)勢和特征，以及其組織和操作的方式將從結合附圖的下述具體描述中變得明顯，其中貫穿下述若干附圖，類似的元素具有類似的標號圖9是可以在其內實現(xiàn)本發(fā)明的各種實施方式的通用多媒體通信系統(tǒng)的圖形表示。如圖9所示，數(shù)據(jù)源100以模擬格式、未壓縮數(shù)字格式或壓縮數(shù)字格式或這些格式的任意組合來提供源信號。編碼器110將源信號編碼成已編碼媒體比特流。應當注意，要解碼的比特流可以直接或間接地接收自實際上位于任意類型的網(wǎng)絡內的遠程設備。此外，比特流可以接收自本地硬件或軟件。編碼器110可能能夠對不止一種媒體類型(諸如，音頻和視頻)進行編碼，或者可能需要不止一個編碼器110以對源信號的不同媒體類型進行編碼。編碼器110還可以得到合成產(chǎn)生的輸入，諸如圖形和文本，或者其能夠產(chǎn)生合成媒體的已編碼比特流。在下文中，僅考慮對一種媒體類型的一個已編碼媒體比特流進行處理，以便簡化描述。然而，應當注意的是，典型實時廣播服務包括若干流(典型地，至少一個音頻、視頻和文本字幕流)。還應當注意的是，系統(tǒng)可以包括很多編碼器，但是在圖9中，不失一般性地，僅示出一個編碼器110，以簡化描述。進一步應當理解，盡管包含在此的文字和示例可能具體描述了編碼過程，但是本領域技術人員容易理解，相同的概念和原理還可以應用至對應的解碼過程，反之亦然。已編碼媒體比特流傳輸至儲存器120。儲存器120可以包括任何類型的海量存儲器以存儲已編碼媒體比特流。儲存器120中已編碼媒體比特流的格式可以是基本自包含的(elementary self-contained)比特流格式，或者一個或多個已編碼比特流可以封裝至容器文件中。某些系統(tǒng)“直播”操作，即，省略儲存器而直接將已編碼媒體比特流從編碼器 110傳輸至發(fā)送器130。已編碼媒體比特流隨后傳輸至發(fā)送器130，根據(jù)需要，也稱為服務器。在傳輸中使用的格式可以是基本自包含的比特流格式、分組流格式，或者一個或多個已編碼媒體比特流可以封裝至容器文件中。編碼器110、儲存器120和服務器130可以位于相同物理設備中，或者它們可以包括在單獨的設備中。編碼器110和服務器130可以利用直播實時內容進行操作，在該情況下，已編碼媒體比特流通常不會被永久存儲，而是在內容編碼器110和/或在服務器130中緩沖一小段時間，以平滑處理延遲、傳輸延遲和已編碼媒體比特速率中的變動。服務器130使用通信協(xié)議棧來發(fā)送已編碼媒體比特流。作為多個非限制性示例， ?？梢园ǖ幌抻趯崟r傳輸協(xié)議(RTP)、用戶數(shù)據(jù)報協(xié)議(UDP)和因特網(wǎng)協(xié)議(IP)。當通信協(xié)議棧是面向分組的時候，服務器130將已編碼媒體比特流封裝至分組中。例如，當使用 RTP時，服務器130根據(jù)RTP凈荷格式將已編碼媒體比特流封裝至RTP分組中。通常，每個媒體類型具有專用的RTP凈荷格式。再次需要注意，系統(tǒng)可以包含多于一個的服務器130，但是為了簡化，以下描述僅考慮一個服務器130。服務器130可以或可以不通過通信網(wǎng)絡連接至網(wǎng)關140。網(wǎng)關140可以執(zhí)行不同類型的功能，諸如將按照一種通信協(xié)議棧的分組流轉譯成另一通信協(xié)議棧，對數(shù)據(jù)流進行合并以及分流，以及根據(jù)下行鏈路和/或接收器的能力操縱數(shù)據(jù)流，諸如根據(jù)現(xiàn)行的下行鏈路網(wǎng)絡條件控制轉發(fā)的流的比特速率。網(wǎng)關140的各種非限制性示例包括MCU、電路交換和分組交換視頻電話之間的網(wǎng)關、蜂窩一鍵通(PoC)服務器、手持數(shù)字視頻廣播(DVB-H)系統(tǒng)中的IP封裝器，或者將廣播傳輸本地轉發(fā)到家庭無線網(wǎng)絡的機頂盒。當使用RTP時，網(wǎng) 關140被稱為RTP混合器或者RTP轉譯器，并且通常充當RTP連接的端點。系統(tǒng)包括一個或者多個接收器150，其通常能夠接收并解調已傳輸?shù)男盘枺约皩?其解封裝為已編碼的媒體比特流。已編碼的媒體比特流被傳送到記錄儲存器155。記錄儲存器155可以包括任意類型的海量存儲器以便存儲已編碼的媒體比特流。記錄儲存器155可以備選地或附加地包括計算存儲器，諸如隨機訪問存儲器。記錄儲存器155中的已編碼媒體比特流的格式可以是基本自包含的比特流格式，或者一個或多個已編碼媒體比特流可以封裝至容器文件中。如果有很多已編碼媒體比特流，諸如音頻流和視頻流，其彼此相關聯(lián)，則通常使用容器文件，并且接收器150包括或者附接至基于輸入流而產(chǎn)生容器文件的容器文件生成器。某些系統(tǒng)“直播”操作，即，省略記錄儲存器155而直接將已編碼媒體比特流從接收器150傳輸至解碼器160。在有些系統(tǒng)中，僅所記錄流的最新的部分，例如所記錄流的最近10分鐘的摘錄，被保持在記錄儲存器155中，而從記錄儲存器155中丟棄任何更早的記錄數(shù)據(jù)。已編碼媒體比特流從記錄儲存器155傳輸至解碼器160。如果有很多已編碼媒體比特流，諸如音頻流和視頻流，其彼此相關聯(lián)并且被封裝到容器文件中，則可以使用文件解析器(圖中未示出)來將每個已編碼媒體比特流從該容器文件中解封裝出來。記錄儲存器155或解碼器160可以包括該文件解析器，或者該文件解析器附接至記錄儲存器155或解碼器 160。已編碼媒體比特流通常進一步由解碼器160處理，解碼器的輸出是一個或者多個未壓縮的媒體流。最后，呈現(xiàn)器170可以例如通過揚聲器或者顯示器來重現(xiàn)未壓縮的媒體流。接收器150、記錄儲存器155、解碼器160和呈現(xiàn)器170可以位于相同物理設備中，或者它們可以被包含在單獨的設備中。按照本發(fā)明各種示例性實施方式的發(fā)送器130可以被配置用于出于多個理由而選擇傳輸?shù)膶?，諸如為了響應接收器150的請求或者響應傳送比特流的網(wǎng)絡的主導條件。來自接收器150的請求例如可以是針對用于顯示的層的改變或者相比于先前的設備具有不同功能的呈現(xiàn)設備的改變的請求。以下描述和討論是當僅有一個視角間參考圖片用于運動跳躍時用于使得同位MB 可用于運動跳躍的算法。下文提供對早先定義的一些概念的多個新的定義和擴展。之后是至少解決前面討論的各種問題的算法的非限制性示例。正如前面已討論的那樣，視角間參考圖片中的同位MB分區(qū)可能不服從層級化宏塊分區(qū)，因此不能直接用于運動跳躍。一種此類情形涉及這樣的場景，一個或多個塊被指定“使用ListX”，而其他塊被指定“未使用ListX”。正如此處所討論的那樣，如果同位MB 分區(qū)的所有塊都被指定為“使用ListX”(其中X為0或1)，則該同位MB分區(qū)被指定“使用 ListX”。如果以下所有條件都為真，則同位MB分區(qū)被定義為合法的首先，該MB分區(qū)內的所有塊都同時是“使用ListO”且“使用Listl”，或者“使用ListO”且“未使用Listl”，或者 “未使用ListO”且“使用Listl”。滿足此條件的MB分區(qū)具有“好參考”。否則該MB分區(qū)具有“壞參考”。第二，如果MB分區(qū)被指定“使用ListX”，那么該MB分區(qū)內的所有塊都同時使用RefPicListX(其中X為0或1)中列出的相同參考圖片。應當注意，如果所有塊都在同一片內，或者如果所有塊都在包含相同的參考圖片列表重排序命令(如果存在的話)的片內，那么使用RefPicListX中列出的同一參考圖片的所有塊等效于使用RefPicListX中同一參考圖片索引的所有塊。如果上述條件中任一為假，則同位MB分區(qū)被定義為非法的。如果MB的所有MB分區(qū)都是合法的，則該MB被定義為合法的。否則該MB被定義為非法的。如果視差矢量和(0，0)模2同余，也即，同位MB分區(qū)與視角間參考圖片的MB分區(qū)邊界對準，則這些同位MB分區(qū)中的每一個自然是合法的，只要其位于視角間參考圖片中的幀內MB內。這是因為視角間參考圖片中的任何MB分區(qū)都服從層級化宏塊分區(qū)。圖10是示出了按照各種實施方式、當存在一個或多個視角間參考圖片時所遵循的算法中涉及的過程的流程圖。當對當前圖片的MB進行編碼時并且在運動跳躍模式的檢查期間，在使用視差運動獲取同位MB分區(qū)之后，調用圖10中繪出的算法。圖10中繪出的算法導致兩種類型的退出合法MB退出或非法MB退出。合法MB 退出是指當前MB支持運動跳躍模式。非法MB退出是指運動跳躍模式不用于當前MB。對于 MB,如果支持運動跳躍模式，則運動跳躍模式最終是否用于對MB進行編碼取決于在編碼效率方面其是否比其他編碼模式更好。對于MB，如果使用運動跳躍模式，則使用為此MB生成的運動信息，從而直接或間接地用于進一步的運動補償。在圖10所繪的算法中涉及一對過程。在圖10中，第一過程開始于1005處所繪的點，在1075處所繪的點之前結束。此過程稱為MB分區(qū)運動合并。在MB分區(qū)運動合并中，非法同位MB分區(qū)可以轉變成合法同位MB分區(qū)。第二過程開始于第一過程結束時(如1075 處所繪)，結束于1072、1085、1100或1110處所繪的點處。第二過程負責將非法同位MB進一步轉變成合法同位MB，并且以非法MB退出或合法MB退出結束。此過程稱為MB運動合并。在解碼期間，如果MB使用運動跳躍模式，則類似地應用此算法，除非可能的退出是合法 MB退出。將為此MB生成的運動信息直接或間接地用于進一步的運動補償。在MB分區(qū)運動合并過程中，逐個檢查同位MB分區(qū)。如下處理每個同位MB分區(qū)。如果當前的同位MB分區(qū) 是合法的，則在此過程中不需要進一步的處理并且接著處理下一個同位MB分區(qū)。否則，如果當前的同位MB分區(qū)是非法的，則應用如下處理。如果當前的同位MB分區(qū)具有“壞參考”，則應用參考狀態(tài)合并過程以將“壞參考”修復為“好參考”。如果參考狀態(tài)合并過程失敗，則同位MB分區(qū)仍然為非法，接著處理下一個同位MB分區(qū)。如果當前的同位MB分區(qū)具有“好參考”(可以是在上述過程之前同位MB分區(qū)就具有“好參考”，或者通過上述過程而使得具有“好參考”)，則首先針對X為0，然后針對X為1 應用如下處理。如果當前的同位MB分區(qū)是“使用Listx”，則順序地調用參考索引合并過程和運動矢量生成和縮放過程(下文描述)。參考索引合并過程保證在此過程之后，當前同位MB分區(qū)內的塊使用相同的參考圖片用于每個預測方向的幀間預測。運動矢量生成和縮放過程對用于在參考索引合并過程期間RefPicListX中的參考圖片已經(jīng)改變的塊的運動矢量進行縮放，以及生成用于在參考索引合并過程之前不與RefPicListX的運動信息相關聯(lián)的塊的運動矢量。只要當前同位MB內的一個同位MB分區(qū)是非法的，圖10中所繪算法的MB運動合并過程就試圖將非法同位MB修復為合法。當對該非法同位MB分區(qū)進行處理時，忽略其運動信息(如果存在的話)。代替地，由MB運動合并過程來生成用于此非法同位MB分區(qū)的運動信息，其中MB運動合并過程包括預測生成過程和運動矢量生成過程。對于X的每個值 (0或1)，預測生成過程試圖將非法同位MB分區(qū)設置為“使用ListX”并且試圖為此同位MB 分區(qū)設置參考索引。對于X的每個值(0或1)，當同位MB分區(qū)“使用ListX”時，運動矢量生成過程生成與用于RefPicListX的參考索引相關聯(lián)的運動矢量。此描述假設僅使用了一個視角間參考圖片。然而，圖10的算法也可以擴展到多個視角間參考圖片可用的情形，如后文所描述的。MB分區(qū)運動合并的第一過程試圖使非法同位MB分區(qū)變成合法，并且此過程逐一應用于當前同位MB中的所有四個同位MB分區(qū)。如果同位MB分區(qū)碰巧橫過視角間參考圖片的片邊界，那么不同塊中的相同參考索引值可能不對應于相同的參考圖片。在這種情況下，每個塊中的參考索引(如果可用的話)首先被映射到它的參考圖片P，并且在當前圖片的 RefPicListX中搜索參考圖片P的參考索引。如果找到可用的參考索引(標記為idx)，那么應用此處所定義的過程，就如同該塊的參考索引是針對當前圖片的RefPicListX的idx。如果未找到可用的參考索引，則將其視為“未使用ListX”。如果同位塊或MB分區(qū)具有引用 RefPicListX中的視角間參考圖片的參考索引，則也將其視為“未使用ListX”。以下描述了 MB分區(qū)運動合并過程的參考狀態(tài)合并過程、參考索引合并過程以及運動矢量生成和縮放過程。參考狀態(tài)合并過程嘗試將具有“壞參考”的同位MB分區(qū)轉變?yōu)榫哂小昂脜⒖肌?。前向和后向預測狀態(tài)分別對應于“使用ListO”和“使用Listl”，其可以分開處理。以下處理首先應用于為0的X，然后是為1的X。情況1涉及視差矢量和(0，0)模2同余的情形。同位MB分區(qū)位于視角間參考圖片的一個MB分區(qū)中。不需要進行合并。情況2涉及視差矢量和(1，0)或(0，1)模2同余的情形。同位MB分區(qū)位于視角間參考圖片的兩個MB分區(qū)中。如果這兩個MB分區(qū)都“使用ListX”，則該同位MB分區(qū)被指定“使用ListX”。否則，該同位 MB分區(qū)被指定“未使用ListX”。情況3涉及視差矢量和(1，1)模2同余的情形。同位MB 分區(qū)包括視角間參考圖片的4個MB分區(qū)中的四個塊。如果這些塊中有3個或4個被指定 “使用ListX”，則該同位MB分區(qū)被指定“使用ListX”。否則，該同位MB分區(qū)被指定“未使用ListX”。如果該同位MB分區(qū)被指定“使用ListX”，則其所有塊都被指定“使用ListX”。在參考狀態(tài)合并之后，如果同位MB分區(qū)被指定“使用ListO”但“未使用Listl”、 “使用Listl”但“未使用ListO”或者“使用ListO”且“使用Listl”，則其具有“好參考”。以下過程(也即，參考索引合并過程和運動矢量生成和縮放過程)僅可應用于具有“好參考”的MB分區(qū)。在本文另一實施方式中，同位MB分區(qū)可設置成具有“壞參考”，如果其屬于 B片并且不是雙向預測，也即“未使用ListO”或者“未使用Listl”，則在針對此同位MB分區(qū)的該過程中停止進一步的處理。如果同位MB分區(qū)在參考狀態(tài)合并過程中已經(jīng)修復成具有“好參考”，則其可以通過參考索引合并過程而轉變成合法同位MB分區(qū)。當X為0或1時應用參考索引合并過程。針對參考索引合并引入兩個規(guī)則。第一個規(guī)則用于選擇最小參考索引值。第二個規(guī)則用于從此同位MB分區(qū)中的諸多塊中選擇最常用參考索引值。根據(jù)需要或希望，也可以實施其他規(guī)則。針對上述情況1、2和3的解決方案如下。如果當前同位MB分區(qū)“使用ListX”，則應用以下處理。在情況1的情形下(其中視差矢量和(0，0)模2同余)，跳過參考索引合并過程。在情況2的情形下(其中視差矢量和(1，0)或(0，1)模2同余)，選擇視角間參考圖片中這兩個MB分區(qū)的最小參考索引值。在情況3的情形下(其中視差矢量和(1，1)模2 同余)，應用如下四個解決方案之一。第一，選擇視角間參考圖片中四個塊的最小參考索引值。第二，從視角間參考圖片中的四個塊中選擇對應于在顯示順序上與當前圖片最接近的參考圖片的參考索引值。第三，選擇視角間參考圖片中的四個塊中最常用的參考索引。如果有不止一個值最常使用，則選擇具有較小(最小)參考索引值的值。第四，選擇視角間參考圖片中的四個塊中最常用的參考索引。如果有不止一個值最常使用，則選擇對應于在顯示順序上與當前圖片最接近的參考圖片的值。由上可知，用于這四個塊的、引用RefPicListX中的圖片的可能不同的參考索引可以統(tǒng)一成一個參考索引。用于該同位MB分區(qū)的最終參考索引稱為統(tǒng)一參考索引，并且對應的參考圖片稱為統(tǒng)一參考圖片。圖11圖形化表示出了當X為0或1時應用運動矢量縮放和生成過程，該過程逐一應用于當前同位MB分區(qū)中的所有四個塊。針對同位MB分區(qū)中的塊，以下任一情況都有可能。在第一種情況中，塊在參考狀態(tài)合并之前被指定“使用ListX”并且參考索引值在參考索引合并期間未被修改。在第二種情況中，塊在參考狀態(tài)合并之前被指定“使用ListX”，但其參考索引值在參考索引合并期間被修改。在第三種情況中，塊被指定“未使用ListX”，但其已經(jīng)轉變?yōu)椤笆褂肔istX”，并且在參考索引合并期間已經(jīng)為它指派了參考索引。
在上述第一種情況中，不需要運動矢量縮放和生成。在第二種情況中，按照公式 mv' = td*mv/to對運動矢量進行縮放，其中再次參考圖ll，mv是原始運動矢量，mv'是經(jīng) 縮放的運動矢量，td是當前圖片與統(tǒng)一參考圖片之間的距離，to是當前圖片與原始(在先)參考圖片之間的距離。td和to的單位都是PicOrderCnt差值，其中PicOrderCnt指示如H.264/AVC中所規(guī)定的圖片輸出順序(也即，顯示順序)。在上述第三種情況中，如下生成運動矢量。根據(jù)參考狀態(tài)合并過程，針對RefPicListX,如果MB分區(qū)已經(jīng)轉變成“使用 ListX”，則在同位MB分區(qū)中至多一個塊可以是“未使用ListX”。因此，同位MB分區(qū)包含至多一個塊屬于第三種情況。此塊的參考索引被設置為統(tǒng)一參考索引。通過下述兩種方法中的任一方法來為引用RefPicListX中的圖片的塊生成運動矢量1.使用基于其他塊中三個運動矢量的中值操作。如果這3個運動矢量中的任意運動矢量已被縮放，則在此中值操作中使用已縮放的運動矢量。繼而將該塊的運動矢量設置為這三個運動矢量的中值。2.使用尚未被縮放的運動矢量。如果僅有一個運動矢量尚未被縮放，則使用此運動矢量作為該塊的運動矢量。如果有兩個塊的兩個運動矢量尚未被縮放，則將這兩個運動矢量的平均用作該塊的運動矢量。在其他情況下(也即，如果沒有運動矢量被縮放)，則使用第一種方法中的中值操作。應當注意，對于上述第三種情況，針對同位MB分區(qū)中的至多兩個塊，可以由于參考索引合并過程期間所引用的圖片的改變而對運動矢量進行縮放。算法的第二個過程，也即MB運動合并，可以將僅具有一個非法同位MB分區(qū)的非法同位MB轉變成合法同位MB。在此過程期間，若存在非法同位MB分區(qū)的運動信息，則將其忽略。在此過程的開始，非法同位MB被設置為“未使用ListO”且“未使用Listl”。此過程包含兩個主要過程，預測生成和運動矢量生成。預測生成過程試圖使非法同位MB分區(qū)從“未使用ListO”且“未使用Listl”變成 “使用ListO”或“使用Listl”或二者均有。以下處理首先應用于為0的X，接著是為1的X。如果其他三個同位MB分區(qū)被指定“使用ListX”，則該非法同位MB分區(qū)被設置為“使用ListX”，并且基于以下規(guī)則中的任一規(guī)則來為此同位MB分區(qū)選擇參考索引(1)從其他3個同位MB分區(qū)中選擇最小參考索引值；(2)從其他三個同位MB分區(qū)中選擇最常用參考索引值。在⑵中，如果有不止一個值最常使用，則選擇具有較小(最小)參考索引值的那個值。運動矢量生成過程根據(jù)其他三個同位MB分區(qū)中的運動矢量，為非法同位MB分區(qū) 中的四個塊生成四個運動矢量。以下處理首先應用于為0的X，接著應用于為1的X。在其他三個同位MB分區(qū)中，以下處理中僅考慮與該非法同位MB分區(qū)具有相同的參考索引的那些的運動矢量。將非法同位MB分區(qū)中的四個塊劃分為3個類型(1)縮放1，該塊最接近同位MB的中心；(2)縮放3，該塊離同位MB的中心最遠；以及(3)縮放2，其他兩個塊，如圖 12(a)所示。對于每個塊，如圖12(b)所示，左邊、右邊、上面和下面的塊稱為4相鄰塊。按照下述來生成用于非法同位MB分區(qū)中的四個塊的運動矢量。1.對于縮放1中的塊，其具有兩個位于該同位MB中的其他同位MB分區(qū)內的4相鄰塊。這兩個4相鄰塊被稱為候選塊1和2。其他同位MB分區(qū)中的第三候選塊是作為候選塊1和2 二者的4相鄰塊的那個塊。對于這三個候選塊，使用與非法同位MB分區(qū)具有相同的參考索引值(其由預測生成過程生成)的那些的運動矢量來生成縮放1中的塊的運動矢量。如果這三個候選塊中僅有一個合格，那么將此塊的運動矢量復制作為縮放1中的塊的運動矢量。如果三個候選塊中有兩個合格，則將縮放1中的塊的運動矢量設置成這兩個塊的運動矢量的平均。如果所有三個候選塊都合格，則將縮放1中的塊的運動矢量設置成這三個候選塊的三個運動矢量的中值。2.對于縮放2中的塊，其具有一個位于其他同位MB分區(qū)內的4相鄰塊。這個4相鄰塊是唯一的候選塊。如果此候選塊與非法同位MB分區(qū)具有相同的參考索引，則將縮放2 中的塊的運動矢量設置為該候選塊的運動矢量。否則，將該縮放2中的塊的運動矢量設置為縮放1中的塊的運動矢量。3.針對縮放2中的另一塊重復過程(2)。4.針對縮放3中的塊，其不具有位于同位MB中的其他同位MB分區(qū)內的4相鄰塊。如果在過程(2)或(3)中，候選塊具有與非法同位MB分區(qū)不同的參考索引，則將縮放3中的塊的運動矢量設置為縮放1中的塊的運動矢量。否則，將此塊的運動矢量設置為同一同位MB分區(qū)中其他3個塊的3個運動矢量的中值。如上面所提到的，圖10是示出了按照各種實施方式、當存在一個或多個視角間參考圖片時所遵循的算法中涉及的過程的流程圖。在此詳細討論圖10。在1000處，算法開始于當前MB。在1005處，將第一 MB分區(qū)設置為當前MB分區(qū)。在1010處，確定是否有MB分區(qū)尚待處理。如果還有MB分區(qū)不得不被處理，則在1015處將待處理的下一 MB分區(qū)設置為當前MB分區(qū)。在1020處，確定當前MB分區(qū)是否是合法的。如果是，則過程返回到1010。如果否，則在1025處進行參考狀態(tài)合并，在此之后在1030處確定當前MB分區(qū)內的所有塊是否都標識為“使用ListO”、“使用Listl”或者標識為“使用ListO”且“使用Listl，，。如果否，則在1035處，將當前MB分區(qū)標識為非法MB分區(qū)，并且返回1010。然而，如果是，則在1040處將χ設置為0，并且在1045處確定當前MB分區(qū)是否標識為“使用Listx”。如果是，則在1050處針對Iistx發(fā)生參考索引合并。在1055處確定參考圖片是否已改變。如果是，則在1060處進行運動矢量生成和縮放，并且在1065處確定χ是否大于0。如果χ不大于0，則過程返回到1045。如果χ大于0，則在1070處將當前MB分區(qū)設置為合法并且過程返回到1010。還應當注意，如果針對框1045和1055任一處的確定的答案是“否”，則過程跳轉到1065。再次參考圖10中的1010，如果不再有MB分區(qū)要處理，則在1072處確定是否所有 MB分區(qū)都是合法的。如果所有MB分區(qū)都是合法的，則過程在1075處以合法MB退出結束。然而如果不是，則在1080處確定是否有三個MB分區(qū)是合法的。如果不是，則過程以1085 處的非法MB退出結束。如果有三個MB分區(qū)，則在1090處針對非法MB進行預測生成。繼而在1095處確定是否該非法MB分區(qū)中的所有塊都標識為“使用ListO”或“使用Listl”。如果否，則該過程以1100處的非法MB退出結束。然而如果是，則在1105處進行運動矢量預測，并且過程以1110處的合法MB退出結束。當存在不止一個視角間參考圖片時，在對片進行編碼時，可以選擇這些視角間參考圖片中的任一用于運動跳躍。下面描述用于選擇的備選方法。當僅有一個視角間參考圖片用于運動跳躍時，包含MB模式的同位MB和將用于預測當前MB的運動矢量來自于這一個視角間參考圖片。由于同位MB可能已被上面討論的且在圖10中繪出的算法所改變，因此將最終的同位MB稱為預測值(predictor)MB。應當注意，圖10中示出的各個框可以視為方法步驟，和/或由計算機程序代碼的運行而導致的操作，和/或構建來執(zhí)行相關功能的多個耦接的邏輯電路元件。以下更詳細地討論有關用于運動跳躍的視角間參考圖片的選擇。對于每個片，用于運動跳躍的視角間參考圖片或者是推導出的，或者是用信號發(fā) 送的。因此，用于運動跳躍的圖片可能不同于在視角依賴關系中用信號發(fā)送的第一視角間參考圖片，并且其可以是任何視角間參考圖片。例如，將對應于RefPicListO的視角依賴關系信息中用信號發(fā)送的第一視角間參考圖片選擇為用于運動跳躍的視角間參考圖片。作為另一示例，選擇在RefPicListO中的第一視角間參考圖片。應當注意，RPLR命令可以使得任何視角間參考圖片成為RefPicListO中的第一個。作為上述的備選，在當前圖片具有后向視角間參考圖片時，在上述兩個方法中，用RefPicListl替換RefPicListO。在另一備選中，在當前圖片既具有前向視角間參考圖片又具有后向視角間參考圖片時，可以應用上述方法以選擇分別對應于RefPicListO和 RefPicListl的兩個視角間參考圖片，并且用信號發(fā)送一標志以選擇這兩個被選的視角間參考圖片之一。仍然備選地，可以顯式地用信號發(fā)送所使用的視角間參考圖片，例如通過在片報頭中包括出現(xiàn)在視角依賴關系中的視角標識符的索引以及指示其為前向還是后向視角間參考圖片的標志。仍然備選地，用于運動跳躍的視角的視角標識符也可以包括在該片報頭中。上述方法用于從多個可用的視角間參考圖片中選擇一個視角間參考圖片以在運動跳躍中使用。當存在不止一個視角間參考圖片可用時，也有可能針對待編碼的每個MBdi 用不止一個視角間參考圖片用于運動跳躍。在這種情況下，根據(jù)當前圖片與視角間參考圖片之間的視差運動，當前MB在所使用的每個視角間參考圖片中具有同位MB。這些同位MB 的每一個稱為候選同位MB以用于生成預測值MB，并且根據(jù)所有候選同位MB來生成預測值 MB。以下提供用于利用多個視角間參考圖片為運動跳躍生成預測值MB的解決方案。這些解決方案也稱為組合運動跳躍算法。首先，從候選同位MB分區(qū)中選擇預測值MB的每個預測值MB分區(qū)。這稱為參考組合。在參考組合之后，上面討論的并且在圖10中繪出的算法的第二個過程被應用于這四個預測值MB分區(qū)。在參考組合中，為了從候選同位MB分區(qū)中選擇預測值MB分區(qū)，按預先確定的順序來考慮候選同位MB分區(qū)，例如首先是前向依賴視角，然后是后向依賴視角。對于每個參考圖片列表中的視角間參考圖片，其順序與參考圖片列表中的相同，或者與序列參數(shù)集合MVC 擴展中的相同?；谠擁樞颍绻l(fā)現(xiàn)視角間參考圖片中的同位MB分區(qū)是合法的，則對該同位MB分區(qū)應用上面討論的并且在圖10中繪出的算法的第一個過程，并且將此同位MB分區(qū)選擇為預測值MB分區(qū)，而無需進一步考慮來自剩余的視角間參考圖片的候選同位MB分區(qū)。如果在任一視角間參考圖片中沒有合法的同位MB分區(qū)，則應用以下處理。按上述相同的順序，從候選同位MB分區(qū)中搜索具有“好參考”的第一同位MB分區(qū)。如果找到，則將具有“好參考”的第一候選同位MB分區(qū)選擇為預測值MB分區(qū)，而無需進一步考慮剩余的候選同位MB分區(qū)。繼而對預測值MB分區(qū)應用參考索引合并過程和運動矢量生成和縮放過程。如果沒找到具有“好參考”的同位MB分區(qū)，則按照上述順序對候選同位MB分區(qū)應用參考狀態(tài)合并過程。無論何時針對候選同位MB分區(qū)的參考狀態(tài)合并過程成功，就將修復后具有“好參考”的候選同位MB分區(qū)選擇為預測值MB分區(qū)，而無需進一步考慮剩余的候選同位 MB分區(qū)。繼而對預測值MB分區(qū)應用參考索引合并過程和運動矢量生成和縮放過程。如果參考狀態(tài)合并過程對于所有候選同位MB分區(qū)都失敗，則該預測值MB分區(qū)是非法的。圖13中示出了參考組合的一個示例，其中前向視角間參考圖片(左邊的視角間參考圖片)和后向視角間參考圖片(右邊的視角間參考圖片)都僅包含P片。當前圖片與前向視角間參考圖片之間的視差矢量與(0，0)模2同余，并且當前圖片與后向視角間參考圖片之間的視差運動與(1，1)模2同余。對于左上的預測值MB分區(qū)，來自前向視角間參考圖片的候選同位MB分區(qū)落入幀間MB中，因此它是合法的并且被選擇作為預測值MB分區(qū)。因此針對此左上預測值MB分區(qū)的過程1完成。對右上預測值MB分區(qū)和右下預測值MB分區(qū) 應用相同的過程。對于左下預測值MB分區(qū)，來自前向視角間參考圖片的候選同位MB分區(qū) 落入幀內MB中，因而是非法的。因此，檢查來自后向視角間參考圖片的下一候選同位MB分區(qū)。此候選同位MB分區(qū)落入幀間MB中，因此它是合法的，并且被選擇作為預測值MB分區(qū)。因此針對此左下預測值MB分區(qū)的過程1完成。從而在此示例中，生成了合法的預測值MB，其具有來自前向視角間參考圖片的三個合法的預測值MB分區(qū)和來自后向視角間參考圖片的一個合法的預測值MB分區(qū)。在參考組合中，預測值MB分區(qū)所來源的視角間參考圖片按照前面說明的那樣進行推導。在下面的備選方案中，針對每個MB或MB分區(qū)用信號顯式地發(fā)送用于運動跳躍的視角間參考圖片。在此備選方案中，針對每個MB，當支持運動跳躍時，還用信號發(fā)送用于運動跳躍的視角。因此，運動跳躍算法可以適應性地選擇視角間參考圖片，從該視角間參考圖片推導出當前MB的運動矢量。在此MB自適應選擇情況下，在編碼器中，針對每個同位MB 分別應用圖10中所繪算法的兩個過程，并且最終選擇導致最佳速率失真性能的過程，以及針對正在被編碼的當前MB用信號發(fā)送將標識此視角間參考圖片的必要信息。在解碼器中，當運動跳躍是當前MB的模式時，讀取指示使用哪個視角間參考圖片的信息，并且找到同位 MB。繼而調用圖10中所繪算法的第一個和第二個過程。上述處理是在MB級別，但是也可以擴展到MB分區(qū)級別。除了針對圖片使用全局視差運動之外，還可以使用在MB或MB分區(qū)級別中的自適應視差運動。在各種實施方式中，相對于用信號發(fā)送的全局視差運動對局部視差進行編碼。在當前MB使用運動跳躍模式時，用信號發(fā)送局部視差運動。對局部視差運動的編碼類似于運動矢量的預測編碼。如圖14所示，針對當前MB (Curr MB)，基于正上MB (B)、左MB (A)和左上MB(D)來預測中值視差運動。如果D不可用，則使用右上MB (C)。在其他情況下，如果 MB不用信號發(fā)送局部視差運動，則可以推斷局部視差運動等于全局視差運動，從而被使用在針對相鄰MB的局部視差運動的預測中。在編碼器處，可以通過典型的運動估計來生成期望的視差，繼而取決于所使用的精度，將期望的視差量化為16像素、8像素或4像素精度。另一實施方式涉及通過搜索視差運動預測值周圍的區(qū)域來細化視差運動預測。在生成預測值和期望的視差之后，以與 H. 264/AVC中的運動矢量差編碼相類似的方式對視差運動和預測值之間的差進行編碼。運動跳躍可以推導出當前MB的運動。然而，推導出的運動可能不夠精確。在此情形下，可以通過細化來進一步改善運動矢量精度，例如通過用信號發(fā)送推導出的運動矢量與最優(yōu)(期望的)運動矢量之間的差。為了解決涉及運動跳躍信令的各種問題，提供了各種實施方式。在一個實施方式中，使用指示符(在一個實施方式中采用標志的形式)來指定當前圖片是否被其他視角中的任何圖片用于運動跳躍?？蛇x地，將inter_View_flag改為interjiewjdc，后者包括兩個比特。第一比特等效于原始的inter_View_flag，第二比特等效于新引入的標志。在一個實施方式中采用標志形式的指示符也可以提供于片報頭中，以便指示片是否正在使用運動跳躍。如果未使用，則不用信號發(fā)送針對當前片中所有宏塊的運動跳躍標志，其因而可被推斷為假。如果此標志為真，則用信號發(fā)送運動視差。在一個實施方式中采用標志形式的另一指示符可以用于序列級別(例如序列參數(shù)集合MVC擴展)中的每個視角，以便指示其是否可以利用單環(huán)路解碼來進行解碼。而且，可以針對序列級別(例如序列參數(shù)集合MVC擴展)中的每個視角添加標志或其他指示符，以指示其他視角中的任一是否需要該視角以用于運動跳躍，并且另一標志或其他指示符用于指示其他視角中的任一是否需要該視角以用于傳統(tǒng)的視角間樣本預測。以下是可以在上述各種實施中使用的示例信令。然而，應當注意，此信令本質上僅僅是示例性的，本領域技術人員可以理解其他信令也是可能的。為了用信號發(fā)送用于運動跳躍的圖片，NAL單元報頭SVC MVC擴展語法可以如下。
權利要求
1.一種方法，包括將第一輸入圖片序列和第二輸入圖片序列編碼到比特流中，其中所述第一輸入圖片序列的第一輸入圖片可以或者可以不旨在用于輸出，并且其中所述第二輸入圖片序列的第二輸入圖片旨在用于輸出；包括指示視差運動的視差信號指示；使用運動推導方法、按照所述視差運動從所述第一輸入圖片推導出至少一個運動矢量；以及在對所述第二輸入圖片的編碼中使用所述至少一個推導出的運動矢量。
2.根據(jù)權利要求1的方法，其中所述視差運動具有8像素精度。
3.根據(jù)權利要求1或2的方法，其中在推導所述至少一個運動矢量期間，所述第一輸入圖片中至少一個塊的前向預測、后向預測和雙向預測之一的參考狀態(tài)被改變。
4.根據(jù)前述任一權利要求的方法，其中在推導所述至少一個運動矢量期間，所述第一輸入圖片中的至少一個塊的參考索引被改變。
5.根據(jù)前述任一權利要求的方法，其中在推導所述至少一個運動矢量期間，所述第一輸入圖片中的至少一個塊的參考索引被生成。
6.根據(jù)前述任一權利要求的方法，其中在推導所述至少一個運動矢量期間，所述第一輸入圖片中的至少一個塊的運動矢量被改變。
7.根據(jù)前述任一權利要求的方法，其中在推導所述至少一個運動矢量期間，所述第一輸入圖片中的至少一個塊的運動矢量被生成。
8.根據(jù)前述任一權利要求的方法，其中所述視差信號指示包括在用于圖片、片、宏塊和宏塊分區(qū)之一的比特流中。
9.根據(jù)前述任一權利要求的方法，其中所述比特流中包括一個指示，所述指示用于指示圖片是否在對所述至少一個運動矢量的推導中使用。
10.根據(jù)前述任一權利要求的方法，其中所述比特流中包括一個指示，所述指示用于指示視角是否使用任何其他視角以用于視角間樣本預測。
11.根據(jù)前述任一權利要求的方法，其中所述比特流中包括一個指示，所述指示用于指示針對視角是否支持單環(huán)路解碼。
12.根據(jù)前述任一權利要求的方法，其中對所述至少一個推導出的運動矢量進行細化，從而針對宏塊和宏塊分區(qū)之一用信號發(fā)送所述至少一個推導出的運動矢量與期望的運動矢量之間的運動矢量差。
13.根據(jù)權利要求1的方法，其中所述視差運動具有4像素精度。
14.一種計算機可讀介質，包括被配置用于執(zhí)行權利要求1的方法的計算機代碼。
15.一種設備，包括處理器；以及可通信地連接到所述處理器的存儲器單元，其包括被配置用于將第一輸入圖片序列和第二輸入圖片序列編碼到比特流中的計算機代碼，其中所述第一輸入圖片序列的第一輸入圖片可以或者可以不旨在用于輸出，并且其中所述第二輸入圖片序列的第二輸入圖片旨在用于輸出；被配置用于包括指示視差運動的視差信號指示的計算機代碼；被配置用于使用運動推導方法、按照所述視差運動從所述第一輸入圖片推導出至少一個運動矢量的計算機代碼；以及被配置用于在對所述第二輸入圖片的編碼中使用所述至少一個推導出的運動矢量的計算機代碼。
16.根據(jù)權利要求15的設備，其中所述視差運動具有8像素精度。
17.根據(jù)權利要求15或16的設備，其中在推導所述至少一個運動矢量期間，所述第一輸入圖片中至少一個塊的前向預測、后向預測和雙向預測之一的參考狀態(tài)被改變。
18.根據(jù)前述任一權利要求的設備，其中在推導所述至少一個運動矢量期間，所述第一輸入圖片中的至少一個塊的參考索引被改變。
19.根據(jù)前述任一權利要求的設備，其中在推導所述至少一個運動矢量期間，所述第一輸入圖片中的至少一個塊的參考索引被生成。
20.根據(jù)前述任一權利要求的設備，其中在推導所述至少一個運動矢量期間，所述第一輸入圖片中的至少一個塊的運動矢量被改變。
21.根據(jù)前述任一權利要求的設備，其中在推導所述至少一個運動矢量期間，所述第一輸入圖片中的至少一個塊的運動矢量被生成。
22.根據(jù)前述任一權利要求的設備，其中所述視差信號指示包括在用于圖片、片、宏塊和宏塊分區(qū)之一的比特流中。
23.根據(jù)前述任一權利要求的設備，其中所述比特流中包括一個指示，所述指示用于指示圖片是否在對所述至少一個運動矢量的推導中使用。
24.根據(jù)前述任一權利要求的設備，其中所述比特流中包括一個指示，所述指示用于指示視角是否使用任何其他視角以用于視角間樣本預測。
25.根據(jù)前述任一權利要求的設備，其中所述比特流中包括一個指示，所述指示用于指示針對視角是否支持單環(huán)路解碼。
26.根據(jù)前述任一權利要求的設備，其中所述至少一個推導出的運動矢量被細化，從而針對宏塊和宏塊分區(qū)之一用信號發(fā)送所述至少一個推導出的運動矢量與期望的運動矢量之間的運動矢量差。
27.根據(jù)權利要求15的設備，其中所述視差運動具有4像素精度。
28.根據(jù)權利要求15的設備，其至少部分地實現(xiàn)為至少一個集成電路。
29.一種設備，包括用于將第一輸入圖片序列和第二輸入圖片序列編碼到比特流中的裝置，其中所述第一輸入圖片序列的第一輸入圖片可以或者可以不旨在用于輸出，并且其中所述第二輸入圖片序列的第二輸入圖片旨在用于輸出；用于包括指示視差運動的視差信號指示的裝置；用于使用運動推導方法、按照所述視差運動從所述第一輸入圖片推導出至少一個運動矢量的裝置；以及用于在對所述第二輸入圖片的編碼中使用所述至少一個推導出的運動矢量的裝置。
30.根據(jù)權利要求29的設備，其中所述視差運動具有8像素精度。
31.一種方法，包括將第一輸入圖片序列和第二輸入圖片序列編碼到比特流中；在所述第一輸入圖片序列的片報頭中用信號發(fā)送運動是否是通過從第二序列中的圖片的推導而生成的。
32.—種計算機可讀存儲介質，其存儲有被配置用于執(zhí)行權利要求31的方法的計算機程序指令。
33.一種設備，包括處理器；以及可通信地連接到所述處理器的存儲器單元，其包括被配置用于將第一輸入圖片序列和第二輸入圖片序列編碼到比特流中的計算機代碼；以及被配置用于在所述第一輸入圖片序列的片報頭中用信號發(fā)送運動是否是通過從第二序列中的圖片的推導而生成的計算機代碼。
34.根據(jù)權利要求33的設備，其至少部分地實現(xiàn)為至少一個集成電路。
35.一種設備，包括用于將第一輸入圖片序列和第二輸入圖片序列編碼到比特流中的裝置；以及用于在所述第一輸入圖片序列的片報頭中用信號發(fā)送運動是否是通過從第二序列中的圖片的推導而生成的裝置。
36.根據(jù)權利要求35的設備，其至少部分地實現(xiàn)為至少一個集成電路。
37.一種方法，包括將第一輸入圖片序列和第二輸入圖片序列編碼到比特流中；以及在網(wǎng)絡提取層單元報頭中用信號發(fā)送所述第二輸入圖片序列中的圖片是否被所述第一輸入圖片序列中的至少一個圖片用于運動跳躍。
38.一種計算機可讀存儲介質，其存儲有被配置用于執(zhí)行權利要求37的方法的計算機程序指令。
39.一種設備，包括處理器；以及可通信地連接到所述處理器的存儲器單元，其包括被配置用于將第一輸入圖片序列和第二輸入圖片序列編碼到比特流中的計算機代碼；以及被配置用于在網(wǎng)絡提取層單元報頭中用信號發(fā)送所述第二輸入圖片序列中的圖片是否被所述第一輸入圖片序列中的至少一個圖片用于運動跳躍的計算機代碼。
40.根據(jù)權利要求39的設備，其至少部分地實現(xiàn)為至少一個集成電路。
41.一種設備，包括用于將第一輸入圖片序列和第二輸入圖片序列編碼到比特流中的裝置；以及用于在網(wǎng)絡提取層單元報頭中用信號發(fā)送所述第二輸入圖片序列中的圖片是否被所述第一輸入圖片序列中的至少一個圖片用于運動跳躍的裝置。
42.根據(jù)權利要求41的設備，其至少部分地實現(xiàn)為至少一個集成電路。
43.一種方法，包括從比特流接收第一輸入圖片序列和第二輸入圖片序列；接收網(wǎng)絡提取層單元報頭中的信號，所述信號指示所述第二輸入圖片序列中的圖片是否被所述第一輸入圖片序列中的至少一個圖片用于運動跳躍；以及如果所述信號指示所述第二輸入圖片序列中的圖片被所述第一輸入圖片序列中的至少一個圖片用于運動跳躍，則在對所述第一輸入圖片序列中的所述至少一個圖片進行解碼時，使用所述第二輸入圖片序列中的所述圖片以用于運動跳躍。
44.一種計算機可讀存儲介質，其存儲有被配置用于執(zhí)行權利要求43的方法的計算機程序指令。
45.一種設備，包括處理器；以及可通信地連接到所述處理器的存儲器單元，其包括被配置用于從比特流接收第一輸入圖片序列和第二輸入圖片序列的計算機代碼；被配置用于接收網(wǎng)絡提取層單元報頭中的信號的計算機代碼，所述信號指示所述第二輸入圖片序列中的圖片是否被所述第一輸入圖片序列中的至少一個圖片用于運動跳躍；以及被配置用于，如果所述信號指示所述第二輸入圖片序列中的圖片被所述第一輸入圖片序列中的至少一個圖片用于運動跳躍，則在對所述第一輸入圖片序列中的所述至少一個圖片進行解碼時，使用所述第二輸入圖片序列中的所述圖片以用于運動跳躍的計算機代碼。
46.根據(jù)權利要求45的設備，其至少部分地實現(xiàn)為至少一個集成電路。
47.一種設備，包括用于從比特流接收第一輸入圖片序列和第二輸入圖片序列的裝置；用于接收網(wǎng)絡提取層單元報頭中的信號的裝置，所述信號指示所述第二輸入圖片序列中的圖片是否被所述第一輸入圖片序列中的至少一個圖片用于運動跳躍；以及用于如果所述信號指示所述第二輸入圖片序列中的圖片被所述第一輸入圖片序列中的至少一個圖片用于運動跳躍，則在對所述第一輸入圖片序列中的所述至少一個圖片進行解碼時，使用所述第二輸入圖片序列中的所述圖片以用于運動跳躍的裝置。
48.根據(jù)權利要求47的設備，其至少部分地實現(xiàn)為至少一個集成電路。
49.一種方法，包括接收第一輸入圖片序列和第二輸入圖片序列，所述第一輸入圖片序列的片報頭包括有關運動是否是通過從第二序列中的圖片的推導而生成的信號；以及如果所述第一輸入圖片序列的片報頭中的所述信號指示運動是通過從第二序列中的圖片的推導而生成的，則使用從第二序列中的圖片推導出的運動來對所述第一輸入圖片序列中的至少一個圖片進行解碼。
50.一種計算機可讀存儲介質，其存儲有被配置用于執(zhí)行權利要求49的方法的計算機程序指令。
51.一種設備，包括處理器；以及可通信地連接到所述處理器的存儲器單元，其包括被配置用于接收第一輸入圖片序列和第二輸入圖片序列的計算機代碼，所述第一輸入圖片序列的片報頭包括有關運動是否是通過從第二序列中的圖片的推導而生成的信號；以及被配置用于，如果所述第一輸入圖片序列的片報頭中的所述信號指示運動是通過從第二序列中的圖片的推導而生成的，則使用從第二序列中的圖片推導出的運動來對所述第一輸入圖片序列中的至少一個圖片進行解碼的計算機代碼。
52.根據(jù)權利要求51的設備，其至少部分地實現(xiàn)為至少一個集成電路。
53.一種設備，包括用于接收第一輸入圖片序列和第二輸入圖片序列的裝置，所述第一輸入圖片序列的片報頭包括有關運動是否是通過從第二序列中的圖片的推導而生成的信號；以及用于如果所述第一輸入圖片序列的片報頭中的所述信號指示運動是通過從第二序列中的圖片的推導而生成的，則使用從第二序列中的圖片推導出的運動來對所述第一輸入圖片序列中的至少一個圖片進行解碼的裝置。
54.根據(jù)權利要求53的設備，其至少部分地實現(xiàn)為至少一個集成電路。
55.一種方法，包括將第一輸入圖片序列和第二輸入圖片序列編碼到比特流中，其中所述第一輸入圖片序列的第一輸入圖片可以或者可以不旨在用于輸出，并且其中所述第二輸入圖片序列的第二輸入圖片旨在用于輸出；包括指示宏塊視差運動的視差信號指示；使用運動推導方法、按照所述視差運動從所述第一輸入圖片推導出至少一個運動矢量；以及使用所述至少一個推導出的運動矢量以用于運動補償。
56.根據(jù)權利要求55的方法，進一步包括在所述比特流中包括至少一個指示，所述至少一個指示用于指示以下中的至少一個圖片是否在對所述至少一個運動矢量的推導中使用，視角是否使用任何其他視角以用于視角間樣本預測，以及針對視角是否支持單環(huán)路解碼。
57.一種計算機可讀存儲介質，其存儲有被配置用于執(zhí)行權利要求55的方法的計算機程序指令。
58.一種存儲有計算機程序指令的計算機可讀存儲介質，所述計算機程序指令的執(zhí)行導致以下操作，包括將第一輸入圖片序列和第二輸入圖片序列編碼到比特流中，其中所述第一輸入圖片序列的第一輸入圖片可以或者可以不旨在用于輸出，并且其中所述第二輸入圖片序列的第二輸入圖片旨在用于輸出；包括指示宏塊視差運動的視差信號指示；使用運動推導方法、按照所述視差運動從所述第一輸入圖片推導出至少一個運動矢量，所述至少一個推導出的運動矢量用于運動補償。
59.根據(jù)權利要求58的計算機可讀存儲介質，其中在所述比特流中包括至少一個指示，所述至少一個指示用于指示以下中的至少一個圖片是否在對所述至少一個運動矢量的推導中使用，視角是否使用任何其他視角以用于視角間樣本預測，以及針對視角是否支持單環(huán)路解碼。
60.一種設備，包括用于將第一輸入圖片序列和第二輸入圖片序列編碼到比特流中的裝置，其中所述第一輸入圖片序列的第一輸入圖片可以或者可以不旨在用于輸出，并且其中所述第二輸入圖片序列的第二輸入圖片旨在用于輸出；用于包括指示宏塊視差運動的視差信號指示的裝置；用于使用運動推導方法、按照所述視差運動從第一輸入圖片推導出至少一個運動矢量的裝置，所述至少一個推導出的運動矢量用于運動補償；以及用于在所述比特流中包括至少一個進一步指示的裝置，所述至少一個進一步指示用于指示以下中的至少一個圖片是否在對所述至少一個運動矢量的推導中使用，視角是否使用任何其他視角以用于視角間樣本預測，以及針對視角是否支持單環(huán)路解碼。
61.根據(jù)權利要求60的設備，其至少部分地實現(xiàn)為至少一個集成電路。
全文摘要
提供了系統(tǒng)、方法和有形地包含在存儲介質中的計算機程序，用于針對多視角視頻編碼來實現(xiàn)運動跳躍和單環(huán)路解碼。在各種實施方式中，針對當前具有8×8或4×4像素視差運動矢量精度的JMVM布置使用更有效的運動跳躍，同時維持與有關分層化宏塊分區(qū)的H.264/AVC設計相兼容的運動補償過程?？梢允褂米赃m應參考合并以便實現(xiàn)從一個視角間參考圖片更精確的運動跳躍。為了指示圖片是否將用于運動跳躍，可以使用NAL單元報頭中的語法變型或新的語法元素。
文檔編號H04N7/50GK101999228SQ200880120881
公開日2011年3月30日申請日期2008年10月15日優(yōu)先權日2007年10月15日
發(fā)明者M·安尼克塞拉, 王業(yè)奎, 陳穎申請人:諾基亞公司

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：陳穎;Ｍ.安尼克塞拉;王業(yè)奎
技術所有人：諾基亞公司
我是此專利的發(fā)明人

上一篇：無線電通信網(wǎng)絡中的指派和切換的制作方法
上一篇：用于接收視頻數(shù)據(jù)分組的設備和方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術及應用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術 5.逆向工程技術研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設計 2.汽車檢測系統(tǒng)設計 3.汽車電子控制系統(tǒng)設計
4、畢老師：機構動力學與控制
5、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

跳躍運動相關技術

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

針對多視角視頻內容的運動跳躍和單環(huán)路編碼的制作方法