專利名稱:壓縮的數(shù)字音頻和視頻數(shù)據(jù)的存儲方法
技術(shù)領(lǐng)域:
本發(fā)明涉及到權(quán)利要求1前序部分中限定的一種方法。傳統(tǒng)的視頻數(shù)據(jù)記錄允許執(zhí)行快進和快退等等特技模式。為了獲得在圖像組(GOP)基礎(chǔ)上壓縮的數(shù)字視頻數(shù)據(jù),特技模式已經(jīng)變得越加復(fù)雜了,因為均勻的視頻間隔可能對應(yīng)著連續(xù)的不均勻長度的數(shù)據(jù)分組,這取決于視頻數(shù)據(jù)的信息內(nèi)容。美國專利US 5701386是通過為每個圖像組提供一個GOP標(biāo)題并且為每個順序的GOP提供其前一個GOP和后一個GOP的順序標(biāo)題來實現(xiàn)快進和快退的。本文中一貫使用“圖像”這一術(shù)語。按照實際的視頻標(biāo)準(zhǔn),術(shù)語“圖像”可能包括“幀”和“場”。然而,按照用于發(fā)送多信道音頻和/或視頻數(shù)據(jù)的系統(tǒng)層標(biāo)準(zhǔn)ISO/IEC13818-1,特別是通過衛(wèi)星的新式數(shù)字廣播是采用傳送數(shù)據(jù)流(TS)。視頻層標(biāo)準(zhǔn)可以采用H262或ISO/IEC 13818-2,音頻層標(biāo)準(zhǔn)是ISO/IEC 13818-3。這些特征特別被用于DVB并且用于沒有來自解碼器的反饋的線性播放。分組一個接一個地到達接收機,并且在一個分組到達之前往往不知道它們所屬于的具體的程序;實際上是通過PSI-表來分配的。為了存儲,從一個接收的傳送數(shù)據(jù)流中選擇一或多個特定的程序。這就需要在存儲時間或重放時間采用某些流動參數(shù)來保證有效地重放傳送數(shù)據(jù)流。
重放系統(tǒng)一般都支持跳過一個選擇的物理存儲距離,但是隨后命中實際存儲程序的入口點的概率卻很低。要找到這種入口點需要反復(fù)和費時的檢索,可能造成緩沖器下溢。另外,幾乎不可能以整數(shù)n倍的高速度重放數(shù)據(jù)流,并且準(zhǔn)確著陸在可以獨立播放的一個視頻片段上。因此,如果存儲是在一個專用設(shè)備上完成的,必須要直接或是通過指針立即獲得入口點的位置。如果需要存儲多個程序,問題就會變得更加嚴(yán)重。
總而言之,本發(fā)明的目的是用這樣一種方法來格式化存儲的視頻數(shù)據(jù),可以在傳送數(shù)據(jù)流環(huán)境下使用各種特技模式,同時保留在這種環(huán)境便于處理數(shù)據(jù)的特點。
權(quán)利要求1的特征部分限定了按照本發(fā)明一個方面的特征。本發(fā)明還涉及到用來重放這樣記錄的傳送數(shù)據(jù)流的方法,以及用來實現(xiàn)本發(fā)明的裝置。從屬權(quán)利要求限定了本發(fā)明的其他有利方面。
以下要特別參照附圖通過對本發(fā)明最佳實施例的具體描述來討論本發(fā)明的上述及其他各個方面和優(yōu)點,在附圖中
圖1是一種記錄結(jié)構(gòu)的框圖;圖2是一種傳送數(shù)據(jù)流結(jié)構(gòu)的示意圖;圖3是存儲的數(shù)據(jù)結(jié)構(gòu)示意圖;圖4是一種重放結(jié)構(gòu)的框圖;圖5是一個傳送數(shù)據(jù)流的分組;圖6是一個傳送數(shù)據(jù)流的拆組。
有關(guān)環(huán)境的結(jié)構(gòu)說明按照傳送數(shù)據(jù)流分組的規(guī)定格式,開頭是傳送數(shù)據(jù)流分組標(biāo)題,它包含一個分組標(biāo)識符PID。通過程序說明信息PSI表就可以知道一個TS分組中的數(shù)據(jù)內(nèi)容。每個發(fā)送程序的視頻數(shù)據(jù)的PID,也就是V_PID被存儲在傳送數(shù)據(jù)流的PSI表中。一個可變payload_unit_start_indicator pusi被存儲在傳送數(shù)據(jù)流分組標(biāo)題中,并且表示這一分組的有效負(fù)載是否確實是從分組基本數(shù)據(jù)流PES分組(上述ISO/IEC標(biāo)準(zhǔn))的第一字節(jié)開始的。最后,adaptation_field_control(afc)表示傳送數(shù)據(jù)流分組是否確實包含一個適配場和/或有效負(fù)載。
為了設(shè)定指針,系統(tǒng)通常僅僅需要進入具有PID=V_PID,pusi=1和一個等于1或等于3的afc的那些分組。如果這種表對于單個188字節(jié)分組來說是過長了,就必須進入具有PID=V_PID的兩個以上連續(xù)的分組。僅僅需要在這樣的分組中檢查入口點。入口點可能是這樣的*開頭有一個I-圖象的TS分組;*開頭有一個GOP的TS分組;*開頭有一個順序標(biāo)題的TS分組;指針可以過渡性地存儲在RAM存儲器中,并且最終被寫的盤上。具有每秒25個圖象,GOP大小為12個圖象和一個長度為4字節(jié)的指針的135分鐘長度視頻圖象的一個程序會產(chǎn)生大約0.54Mbit或67KByte指針信息。按照16Mbaud傳輸速度,如果占用一個單獨的盤區(qū),要寫入所有指針大約需要35毫秒。如果RAM太小,就必須提前寫入指針。指針可以保留在存儲的數(shù)據(jù)流內(nèi),例如是在達到一定數(shù)目例如1000個選定的分組時存儲指針。在重放時就能立即獲得指針位置?;蛘呤强梢允褂靡粋€指針位置表。如果將指針保存在一個單獨的位置,可以在一定時間間隔之后寫入,也可以在實際比特率降低時寫入,或者是在達到緩沖器存儲容量之前寫入。
為了便于重放存儲的程序,可以和指針一起存儲以下的進一步信息*視頻圖象在記錄時以秒為單位的長度,用來計算剩余時間;*GOP的大小,以及GOP在應(yīng)用中是否關(guān)閉的特性,例如是按照MEPG標(biāo)準(zhǔn),以及它們的大小是否均勻;*包含程序圖表PMT的分組的PID;*存儲程序參考時鐘(Program Clock Reference)PCR的分組的PID;*具有視頻信息的分組的PID;*可以用來計算經(jīng)過時間的起始時間代碼;*配合著均勻的GOP大小可以用來跳到一個特定瞬時的幀速率;*TS分組的總數(shù),可以用來計算程序的結(jié)尾;*I-,B-和P-圖象的總數(shù);*I圖象總數(shù)*平均比特率。
使用指針可以支持高速重放一個指定的程序。通過避免參考不存在的圖象來維持傳送數(shù)據(jù)流的狀態(tài)。進而可能需要改編一些場。
僅僅向編碼器提供包含視頻信息,包括SI信息的TS分組和PCR分組就能實現(xiàn)特技播放。通常不需要快速播放聲音。額外信息的存儲可以用來選擇前進,排除那些具有對應(yīng)著PAT,PMT,PCR和V_PID的PID的分組。在重放完整的GOP時,GOP大小信息可以在“非關(guān)閉的”GOP的環(huán)境下使用,有選擇地繞過特定的B-圖象,并且能夠適合暫時參考其他分組??梢耘浜现鎯υ贕OP標(biāo)題中的時間代碼使用記錄時的視頻圖象持續(xù)時間,用來計算和顯示經(jīng)過的時間。幀速率和固定的GOP大小的組合可以周期性地準(zhǔn)確重放規(guī)定的秒數(shù),并且依次跳過前一個數(shù)的n倍,n的取值范圍例如是1-100。由指針支持的存儲帶來的額外優(yōu)點是程序僅僅需要存儲一次。上述結(jié)構(gòu)可以支持在二次傳送數(shù)據(jù)流中以交錯的方式并行記錄多個程序。在這種情況下,每個程序需要有相應(yīng)的指針陣列。
圖1是一種記錄結(jié)構(gòu)的框圖。輸入20接收一個傳送數(shù)據(jù)流。在框22中選擇需要的TS分組和插入的時標(biāo),然后存儲在數(shù)據(jù)流信息存儲器24中。在框26中對選定的TS分組計數(shù),并且將實際計數(shù)提供給指針信息存儲器28。在框32中提取入口點,并且在框30中計數(shù)計數(shù)同時被提供給指針信息存儲器28和實際上與框24相同的數(shù)據(jù)流信息存儲器36。在框34中從GOP標(biāo)題中找到時間代碼,如果它的值是零,就執(zhí)行任何必要的修改。在框38中提取起始時間代碼,并且提供給數(shù)據(jù)流信息存儲器。在框40中提取GOP大小和圖象速率信息,并提供給框50的數(shù)據(jù)信息存儲器。在框42提取關(guān)閉的GOP指示器,在框44提取PCR_PID,在框46提取PMT_PID,在框48提取視頻PID,全都提供給數(shù)據(jù)流信息存儲器50。輸出49的上的信息可供存儲。圖中沒有規(guī)定各種局部功能性硬件的結(jié)構(gòu),可以按常規(guī)的手段實現(xiàn),為簡要而沒有表示。
圖2是傳送數(shù)據(jù)流結(jié)構(gòu)的示意性實施例。最上級表示各自包括188字節(jié)的順序的傳送數(shù)據(jù)流分組。下一級是由至少容納PID,pusi和afc信息的一個千字節(jié)標(biāo)題構(gòu)成的一個分組。第三組的數(shù)據(jù)場包含大小根據(jù)需要而定的一個適配場和/或一個有效負(fù)載場,并且可以通過afc信息在內(nèi)部規(guī)定。
圖3是存儲的數(shù)據(jù)結(jié)構(gòu)示意圖???4代表由包含根據(jù)從圖1中的輸入22接收的信息流選擇的所有信息的TS分組構(gòu)成的數(shù)據(jù)流信息。框62代表由圖1中的框26、30、32產(chǎn)生的指針信息???0代表由圖1中的各個框產(chǎn)生的數(shù)據(jù)流信息,具體的框有22,30,38,40,42,44,46和48。首先將來自框60和62的信息加以組合后連續(xù)存儲。接著將形成的合成信息和來自框64的信息存儲在媒體上。后一種信息的實際存儲位置可以和前者分開;通過文件系統(tǒng)來鏈接。完整的信息按照圖2所示的結(jié)構(gòu)被集中存儲在盤上。程序中的TS分組可以連續(xù)寫入。指針和數(shù)據(jù)流信息可以在視頻信號之后寫入,或者是在視頻信號期間的少量時間內(nèi)寫入。
圖4是一種重放結(jié)構(gòu)的框圖。70代表可寫入的存儲盤及其用于驅(qū)動和存取的有關(guān)的機電,光電和電子部件,包括在低于本發(fā)明的結(jié)構(gòu)層次上工作的解調(diào),糾錯和類似特征???2執(zhí)行分解成三個子數(shù)據(jù)流的多路分解???4代表指針信息存儲器子數(shù)據(jù)流???6代表數(shù)據(jù)流信息存儲器子數(shù)據(jù)流。這兩個數(shù)據(jù)流被提供給可以執(zhí)行以下用戶控制功能的控制單元80*設(shè)定盤重放速度,例如1…n倍正常速度;*在執(zhí)行跳躍之前選擇設(shè)定最小播放時間;此處存在各種的可能性,例如在跳躍之前播放n個GOP,跳躍速度xnGOP;或者是重復(fù)n次播放一個I-圖象,然后跳到下一個I-圖象,等等;*如果存儲了多個程序選擇程序;*設(shè)定開始播放指定程序的視頻起始位置;*播放/記錄;*停止;*轉(zhuǎn)到一個特定的時間點;快進和快退。
以下是控制功能的例子*顯示從正在讀出的程序的開頭實際經(jīng)過的時間;*從盤上提取指針和數(shù)據(jù)流信息;*控制轉(zhuǎn)向特定字節(jié)位置的操作,例如是存取一個入口點;*從一個特定的位置開始播放;*在一個特定物理位置上記錄。
控制單元可以通過控制線路92,94,96,98將由此產(chǎn)生的信號提供給以下的各個子系統(tǒng)。首先提供控制線路92控制盤導(dǎo)向子系統(tǒng)70。從框72多路分解的傳送數(shù)據(jù)流被提供給框82以提取時間代碼。框84檢測指示器Closed_GOP是不是虛假的(≠1)并且播放n個GOP,用無效分組代替第一個B-圖象。另外,框84檢測指示器Closed_GOP是不是虛假的(≠1),或是僅僅播放I-圖象,更新TS分組標(biāo)題中的連續(xù)計數(shù)器,更新圖象標(biāo)題中的時間參考,并且將GOP標(biāo)題中的斷線設(shè)定為1,后者是由解碼器類型確定的。
框86檢測重放速度是否≠1,在這種位置上用無效分組替換除了Video PID分組,PCR PID分組,PMT PID分組和PAT PID(0)分組之外的所有TS分組。另外,為了反映準(zhǔn)確的顯示和解碼時間,還要修改Presentation Time Stamp,Decoding Time Stamp和PCR數(shù)目。
框88檢測是否存在時標(biāo);如果有,就重組Time Base并且取消Time Stamp。輸出90可以提供一個符合MPEG-2標(biāo)準(zhǔn)的修改的傳送數(shù)據(jù)流。為了簡便,圖中沒有規(guī)定各種局部功能性硬件的構(gòu)圖。
傳送數(shù)據(jù)流的一個特點是所有TS分組的開頭都是一個包含PID的TS標(biāo)題。
圖5表示一個傳送數(shù)據(jù)流的編組過程。從左邊起,視頻數(shù)據(jù)和音頻數(shù)據(jù)到達各自的編碼器110和112。兩個編碼器分別提供給各自的編碼器112和116,各自產(chǎn)生一個視頻PES數(shù)據(jù)流和一個音頻PES數(shù)據(jù)流。在多路復(fù)用器118中多路復(fù)用兩個數(shù)據(jù)流,構(gòu)成一個可以存儲的輸入傳送數(shù)據(jù)流。
圖6表示一個傳送數(shù)據(jù)流的拆組方法。從左邊起,合成的傳送數(shù)據(jù)流進入一個多路分解器附加解碼器120,將視頻和音頻分開???26進一步執(zhí)行時鐘提取,然后是同步視頻解碼器框122和音頻解碼器框124。解碼的視頻和音頻信息隨后就可以重放了。
本發(fā)明的各個有關(guān)方面如下*可以從GOP-標(biāo)題和起始時間代碼中提取經(jīng)過時間指示器,與比特率和GOP的大小無關(guān);*便于任何速度的快進和快退,即使在盤上實際包含多個程序,但是邏輯上不會混淆;*指針表和TS信息都可以存儲在盤上的任意位置。有些指針表和TS信息表的內(nèi)容可以用于包含TS分組/程序起始位置的所有程序。
*特技播放不需要圖象順序的額外重組或重新格式化;*可以使用外部和內(nèi)部解碼器;*對包含一個入口點的TS分組不需要使用直接的扇區(qū)指示;*實際上不需要連續(xù)地存儲數(shù)據(jù);*可以交錯地存儲音頻,視頻和其他數(shù)據(jù);*本發(fā)明適合所有的GOP大小,即使是不均勻的GOP大小。
權(quán)利要求
1.一種將在圖象組(GOP)的基礎(chǔ)上壓縮的一或多個數(shù)字音頻和/或視頻程序記錄在媒體上的方法,通過協(xié)調(diào)存儲傳送數(shù)據(jù)流分組和指針信息在組與組之間直接跳變,其特征是在上述存儲的同時從主傳送數(shù)據(jù)流中獲取連續(xù)的指針,它們集中指向包含入口點的一個二次傳送數(shù)據(jù)流中的數(shù)據(jù)分組,而這些指針被存儲在上述媒體的預(yù)定位置上。
2.按照權(quán)利要求1的方法,其特征是上述預(yù)定位置處在上述二次傳送數(shù)據(jù)流內(nèi)部。
3.按照權(quán)利要求1的方法,其特征是上述預(yù)定位置處在上述二次傳送數(shù)據(jù)流外部的一個表區(qū)域內(nèi)。
4.按照權(quán)利要求1的方法,其特征是,為了配合上述二次傳送數(shù)據(jù)流中的多個交錯的程序,同時為每個這種程序提供一個指針的專用陣列。
5.按照權(quán)利要求1的方法,其特征是進一步指示GOP的大小,并且在使用時旨示GOP是否關(guān)閉以及大小是否均勻的特征。
6.按照權(quán)利要求1的方法,其特征是進一步指示包含一個程序圖表的分組的PID。
7.按照權(quán)利要求1的方法,其特征是進一步指示包含一個程序參考時鐘的分組的PID。
8.按照權(quán)利要求1的方法,其特征是進一步指示包含視頻信息的一個分組的PID。
9.按照權(quán)利要求1的方法,其特征是進一步指示用來計算經(jīng)歷時間的起始時間代碼。
10.按照權(quán)利要求1的方法,其特征是進一步指示在結(jié)合一個均勻的GOP大小為跳到一個特定瞬時而使用的幀速率。
11.一種用來從媒體上重放在圖象組(GOP)的基礎(chǔ)上壓縮的編碼數(shù)據(jù)組成的一或多個數(shù)字音頻和/或視頻程序的方法,通過存儲的傳送數(shù)據(jù)流分組和指針信息在組與組之間直接跳變,其特征是按照實時的連續(xù)指針訪問需要重放的一個單獨或復(fù)合的傳送數(shù)據(jù)流,它們集中指向包含入口點的一個特定傳送數(shù)據(jù)流中的數(shù)據(jù)分組,在上述媒體上的預(yù)定位置訪問這些指針。
12.按照權(quán)利要求11的方法,其特征是上述預(yù)定位置處在上述二次傳送數(shù)據(jù)流內(nèi)部。
13.按照權(quán)利要求11的方法,其特征是上述預(yù)定位置在上述二次傳送數(shù)據(jù)流外部的一個表區(qū)域內(nèi)。
14.按照權(quán)利要求11的方法,其特征是進一步檢索在結(jié)合一個均勻的GOP大小為跳到一個特定瞬時而使用的幀速率。
15.用來實現(xiàn)權(quán)利要求1所述方法的一種記錄裝置。
16.用于按照權(quán)利要求1的方法記錄的信息接口的一種重放裝置。
17.按照權(quán)利要求15或16的裝置,其特征是還安置一種對可重寫盤的接口。
全文摘要
在圖象組(GOP)的基礎(chǔ)上壓縮的數(shù)據(jù)音頻和/或視頻程序被記錄在一個媒體上,通過協(xié)調(diào)存儲傳送數(shù)據(jù)流分組和指針信息在組與組之間直接跳變。特別是在存儲的同時從主傳送數(shù)據(jù)流中獲取連續(xù)的指針,它們集中指向一個重組的包含入口點的傳送數(shù)據(jù)流中的數(shù)據(jù)分組。這些指針被存儲在媒體上的預(yù)定位置。
文檔編號H04N7/24GK1299556SQ99805904
公開日2001年6月13日 申請日期1999年4月29日 優(yōu)先權(quán)日1998年5月8日
發(fā)明者C·托伊尼森 申請人:皇家菲利浦電子有限公司