專利名稱:記錄多媒體文件的計算機可讀記錄媒體及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻、視頻同步多媒體數(shù)據(jù)文件及和音頻、視頻同步化裝置,尤 其涉及把音頻、視頻同步用媒體數(shù)據(jù)文件制作軟件作為編程的計算機的一種記錄用 于音頻/視頻同步的多媒體文件的計算機可讀媒體及音頻/視頻同步化裝置。
背景技術(shù):
現(xiàn)在,便攜式電話、PDA (Personal Digital Assistant掌上電腦)、智能電話 等個人便攜式終端機正成為現(xiàn)實世界中必備的生活工具。這些個人便攜式終端機除 了基本通訊功能外,還提供電子郵件功能、游戲功能、攝影攝像功能、錄音功能、 音樂播放功能、靜止圖像及活動影像播放功能等多種功能。
尤其最近以來,正在開發(fā)既有播放MP3(MPEG-1 Audio Layer 3)等音樂播放功 能,又具有伴隨音樂播放一定影像功能的個人便攜式終端機產(chǎn)品。這是利用提取音 樂的特性,在播放音樂的同時,將與此相對應(yīng)的影像同步播放的技術(shù)。
在現(xiàn)在的技術(shù)中,為了提取音樂的特性,利用主要音樂的波動(wave)波形。 作為參考,如韓國申請專利No. 2002-0023140中所公開的內(nèi)容,提出了利用數(shù)字音 頻設(shè)備中每幀最大的波動(wave)音高(wave pitch)值來將多個影像和音樂同步化 的技術(shù)。
圖la是現(xiàn)有技術(shù)的根據(jù)時間表示音壓力的普通波動(wave)波形(a、 b)曲線圖。
圖lb是現(xiàn)有技術(shù)的在特定時間出現(xiàn)的各頻率音壓(c、 d、 e、 f)曲線圖。 如圖la及圖lb所示,現(xiàn)有技術(shù)是依靠音壓力的波動(wave)波形的。圖la
所示的波動(wave )波形表示按各個時間向左側(cè)揚聲器及右側(cè)揚聲器輸出的音壓力
(a、 b)。
另外,圖lb所示的波動(wave)波形是將各頻率音壓力(c、 d、 e、 f)只表示 為數(shù)4個采樣(0. 1、 1、 10、 20)。普通音頻、視頻同步化裝置將音頻數(shù)據(jù)以幀為單位進4亍解石馬,同時分析上述音壓力的波動(wave)波形,提取其特性。
另外,上述音頻、視頻同步化裝置具有在提取音頻數(shù)據(jù)的特性時,根據(jù)各個 特性事先標簽的等級來標引影像數(shù)據(jù)采樣,實時將相關(guān)影像數(shù)據(jù)采樣同步化輸出的功能。
但在音讀取頻數(shù)據(jù)時,音頻、視頻同步化裝置必須實時執(zhí)行的運算程序過度, 因此,安裝音頻、視頻同步化裝置的移動通信終端機的硬件資源負荷過重。
另外,如果利用波動(wave)音高值實時將音樂和多個影像同步化,因為各 種音頻數(shù)據(jù)一律執(zhí)行運算,所以可能導(dǎo)致影像放映速度過快,波動(wave)音高值 因音樂文件的各個幀有很大差異,產(chǎn)生同步化表現(xiàn)不自然的問題。
發(fā)明內(nèi)容
本發(fā)明的目的在于解決上述問題,提供一種記錄用于音頻/視頻同步的多媒體 文件的計算機可讀媒體,即指在外部計算機上應(yīng)用,分析音頻數(shù)據(jù)的表現(xiàn)特性, 按所分析的表現(xiàn)特性的水準與影像數(shù)據(jù)采樣進行對應(yīng),將標引信息插入到文件自 身,從而使移動通信終端機的音頻、視頻同步化裝置在讀取下載的多媒體數(shù)據(jù)文件 時,也可以用記錄將音頻數(shù)據(jù)、視頻數(shù)據(jù)自然同步化的記錄用于音頻/視頻同步的 多媒體文件的計算機可讀媒體。
另外,本發(fā)明的目的還在于提供在外部計算機上選擇音頻數(shù)據(jù)、影像數(shù)據(jù)采 樣和同步化周期,以最小的長度插入到音頻數(shù)據(jù)和影像數(shù)據(jù)采樣之間的標引信息 中,生成新的多媒體數(shù)據(jù)文件,從而減小音頻、視頻同步化裝置的運算負擔(dān),有效 利用存儲器的存儲空間的記錄用于音頻/視頻同步的多媒體文件的計算機可讀媒 體。
另外,本發(fā)明的目的還在于提供以最小的長度插入到所需的全部標引信息 中,分析事先生成的音頻、視頻同步用多媒體數(shù)據(jù)文件,并根據(jù)分析的周期信息同 時讀取音頻數(shù)據(jù)及標引的影像數(shù)據(jù)采樣,從而沒有運算負擔(dān)地、自然地處理同步化 的音頻、視頻同步化裝置。
為了實現(xiàn)上述目的,依據(jù)本發(fā)明的記錄用于音頻/視頻同步的多媒體文件的計 算機可讀媒體,即對于在計算機上應(yīng)用的記錄多媒體數(shù)據(jù)文件制作程序的記錄媒體 來說,記錄可使下列模塊發(fā)揮效用的音頻、視頻同步多媒體文件制作程序可供 輸入影像數(shù)據(jù)采樣及音頻數(shù)據(jù)的數(shù)據(jù)輸入模塊;依次向上述輸入的影像數(shù)據(jù)采樣標 簽索引信息的索引生成模塊;將上述音頻數(shù)據(jù)進行信號處理,將可轉(zhuǎn)換成一定特性
數(shù)值的表現(xiàn)區(qū)域分成一定區(qū)間,生成上述索引信息及上述分開的表現(xiàn)區(qū)域區(qū)間之間
的對應(yīng)信息的索引對應(yīng)模塊;將上述音頻數(shù)據(jù)以一定周期為單位轉(zhuǎn)換成上述特性數(shù) 值的表現(xiàn)區(qū)域,根據(jù)上述對應(yīng)信息標簽索引信息的音頻分析模塊;以及形成旨在生 成上述媒體數(shù)據(jù)文件的作業(yè)區(qū)域,依次記錄上述音頻數(shù)據(jù)、標簽數(shù)據(jù)列和根據(jù)上述 對應(yīng)信息標簽的索引信息,從而生成一個媒體數(shù)據(jù)文件的文件生成模塊。
另外,依據(jù)本發(fā)明的記錄用于音頻/視頻同步的多媒體文件的計算機可讀媒體 具有以下特征還包括將以一定格式解碼的上述音頻數(shù)據(jù)解密成PCM(Pulse Code
Modulation脈沖編碼調(diào)制)數(shù)據(jù),將上述PCM數(shù)據(jù)向上述音頻分析模塊傳送的解密 模塊。
另外,本發(fā)明的記錄用于音頻/視頻同步的多媒體文件的計算機可讀媒體的上 述數(shù)據(jù)輸入模塊具有以下特征提供用戶面板,可以從上述計算機上所存儲的影像 數(shù)據(jù)中選擇將用于上述影像數(shù)據(jù)采樣的影像數(shù)據(jù)。
另外,本發(fā)明的記錄用于音頻/視頻同步的多媒體文件的計算機可讀媒體的上 述數(shù)據(jù)輸入模塊具有以下特征提供用戶面板,可以從上述計算機上所存儲的音頻 數(shù)據(jù)中選擇將用于上述信號處理的音頻數(shù)據(jù)。
另外,本發(fā)明的記錄用于音頻/視頻同步的多媒體文件的計算機可讀媒體的上 述數(shù)據(jù)輸入模塊具有以下特征將所輸入的上述一定周期向上述音頻分析模塊傳 送。
另外,本發(fā)明的記錄用于音頻/視頻同步的多媒體文件的計算機可讀媒體的上 述文件生成模塊具有以下特征在上述標簽數(shù)據(jù)列上記錄標簽名稱和標簽大小。
另外,本發(fā)明的記錄用于音頻/視頻同步的多媒體文件的計算機可讀媒體的上 述文件生成模塊具有以下特征在上述標簽數(shù)據(jù)列上記錄上述一定周期。
另外,本發(fā)明的記錄用于音頻/視頻同步的多媒體文件的計算機可讀媒體的上 述文件生成模塊具有以下特征上述文件生成模塊在順次記錄上述索引數(shù)值時,將 最初的索引數(shù)值記錄為一定的數(shù)值,繼上述最初的索引數(shù)值之后順次記錄的索引數(shù) 值是與其前面索引數(shù)值的變化量。
另外,本發(fā)明的記錄用于音頻/視頻同步的多媒體文件的計算機可讀媒體的上 述文件生成模塊具有以下特征上述作業(yè)區(qū)域上還記錄上述影像數(shù)據(jù)采樣。
為了實現(xiàn)上述的其它目的,本發(fā)明的音頻、視頻同步化裝置具有由以下幾個 裝置構(gòu)成的特征可供輸入存儲所記錄的音頻數(shù)據(jù)、影像數(shù)據(jù)采樣、讀取上述音頻 數(shù)據(jù)時,以一定周期同步化上述影像數(shù)據(jù)采樣的影像同步用索引順序列、上述一定 周期和用于區(qū)別上述音頻數(shù)據(jù)和其它數(shù)據(jù)區(qū)域的標簽數(shù)據(jù)列的多媒體數(shù)據(jù)文件的 存儲裝置;按照上述一定周期,將上迷音頻數(shù)據(jù)解密成PCM(Pulse Code Modulation:脈沖編碼調(diào)制)數(shù)據(jù)進行傳送的解密裝置;把上述解密裝置傳送的上述 PCM數(shù)據(jù)轉(zhuǎn)換成模擬信號進行輸出的音頻輸出裝置;上述解密裝置運行時,按照上 述一定周期順次讀取上述影像同步用索引順序列,將與讀取的索引相對應(yīng)的影像數(shù) 據(jù)采樣與通過上述音頻輸出裝置進行輸出的PCM數(shù)據(jù)同步化播放的影像同步裝置。
另外,本發(fā)明的音頻、視頻同步化裝置的上述影像同步用索引順序列具有以下 特征將最初的索引數(shù)值記錄為一定數(shù)值,對于上述最初的索引數(shù)值來說,順次記 錄的索引數(shù)值是記錄為與其前面的索引數(shù)值的變化量的順序列,上述影像同步裝置 運算與最初的索引數(shù)值的變化量,順次還原以后的索引數(shù)值,從而讀取上述影像同 步用索引順序列。
本發(fā)明的效果
本發(fā)明的一種記錄用于音頻/視頻同步的多媒體文件的計算機可讀媒體及音 頻/視頻同步化裝置具有以下效果
第一,本發(fā)明可以將現(xiàn)有的媒體數(shù)據(jù)文件在移動通信終端機上實時分析,進 行標引處理,改善音頻、視頻數(shù)據(jù)同步化的方式。分析數(shù)據(jù),進行標引處理,生成 插入索^ 1信息的多媒體數(shù)據(jù)的過程由外部計算機來執(zhí)行,移動通信終端機只是根據(jù) 周期信息,同時讀取各個數(shù)據(jù)。這樣,既可以最大地減少移動通信終端機硬件資源 的使用,又具有自動地將音樂和影像同步化的效果。
另外,本發(fā)明具有以下優(yōu)點不需要將媒體數(shù)據(jù)的音樂和影像同步化的另外裝 置和復(fù)雜的軟件,很容易在現(xiàn)有的任意種類的移動通信終端機上實現(xiàn)同步化功能。
另外,依據(jù)本發(fā)明,用戶可以在自己的計算機上選擇影像數(shù)據(jù)采樣、音頻數(shù)據(jù) 和同步化周期等,可以自由制作音頻、視頻同步多媒體數(shù)據(jù)文件,將其向移動通信 終端機卸載,所以不但可以最大限度地提高音樂欣賞的效果,還可以制作反映個人 興趣的各種多媒體數(shù)據(jù)文件。
總之,本發(fā)明中分析數(shù)據(jù),生成插入索引信息的多媒體數(shù)據(jù)的過程由外部計 算機來執(zhí)行,移動通信終端機只根據(jù)周期信息,就能同時讀取各自的數(shù)據(jù)。這樣, 既能最大限度地減少移動通信終端機硬件資源的使用,又能自動將音樂和影像同步 化。
為進一步說明本發(fā)明的上述目的、結(jié)構(gòu)特點和效果,以下將結(jié)合附圖對本 發(fā)明進行詳細的描述。
圖la是現(xiàn)有技術(shù)的根據(jù)時間表示音壓力的普通波動(wave)波形曲線圖。 圖lb是現(xiàn)有技術(shù)的在特定時間出現(xiàn)的音頻水準曲線圖。 圖2是概略說明應(yīng)用本發(fā)明的音頻、視頻同步多媒體文件制作程序的計算機 的構(gòu)成要素模塊圖。
圖3是應(yīng)用本發(fā)明的音頻、視頻同步多媒體文件制作程序的計算機的文件生 成模塊記錄的數(shù)據(jù)區(qū)域的結(jié)構(gòu)示例圖。
圖4是應(yīng)用本發(fā)明的音頻、視頻同步多媒體文件制作程序的計算機的文件生 成^^莫塊記錄最初索引區(qū)域后面的索引區(qū)域的形態(tài)示例圖。
圖5是概略說明本發(fā)明實施例的音頻、視頻同步化裝置的構(gòu)成要素模塊圖。
圖6是本發(fā)明實施例的音頻、視頻同步化裝置處理音頻、視頻同步的多媒體 數(shù)據(jù)文件的形態(tài)示例圖。
附圖中主要部分的符號說明
100應(yīng)用音頻、視頻同步多媒體文件制作程序的計算機105數(shù)據(jù)輸入模塊110索引生成模塊
115解密模塊120索引對應(yīng)模塊
125音頻分析才莫塊130文件生成模塊
135控制部140存儲部
145顯示部150音頻輸出部
具體實施例方式
下面參照附圖對本發(fā)明的記錄用于音頻/視頻同步的多媒體文件的計算機可 讀媒體及音頻/視頻同步化裝置的實施方式進行詳細說明。
首先,上述計算機是事先制作將用于上述音頻、視頻同步化裝置的多媒體數(shù)據(jù) 文件的裝置,是指搭載上述存儲媒體,安裝本發(fā)明的音頻、視頻同步多媒體文件制 作程序,從而執(zhí)行上述文件制作程序所指示的步驟進行編程的計算機。
圖2是概略說明安裝本發(fā)明的音頻、視頻同步多媒體文件制作程序(以下稱
"本發(fā)明的文件制作程序")的計算機ioo的構(gòu)成要素的模塊圖。
如圖2所示,應(yīng)用本發(fā)明的文件制作程序的計算機100由以下幾個部分構(gòu)成 數(shù)據(jù)輸入模塊105、索引生成模塊IIO、解密模塊ll5、索引對應(yīng)模塊UO、音頻分 析模塊125、文件生成模塊130、控制部135、存儲部140、播放部145和音頻輸出 部150。上述數(shù)據(jù)輸入模塊105、索引生成模塊IIO、解密模塊115、索引對應(yīng)模塊 120、音頻分析模塊125和文件生成模塊130是用本發(fā)明的文件制作程序來運行的 上述計算機100的構(gòu)成要素。
首先,上述存儲部140存有影像數(shù)據(jù)和音頻數(shù)據(jù)。
上述音頻數(shù)據(jù)可以按解碼格式使用"wave (wave文件),,、"wma (windows media audio)',、 "mp3(mpeg audio layer-3) " 、 "ogg(支持VBR的壓縮音樂文件)"、 "mid(SMF文件)"等多種文件形式。本發(fā)明的實施例使用"mp3"格式。
另外,上述影傳4史據(jù)可用"BMP"、 "GIF"、 "JPG"、 "PCX"、 "TGA"、 "TIF"和 、、WMF〃格式等靜止圖像和"AVI"、 "MPG"、 "M0V,'、 "RM"和"麗"格式等的活動影 像。本發(fā)明的實施例使用"JPG"格式。
上述控制部135具有內(nèi)核,提供與各個構(gòu)成部的界面,處理中斷信號,提供 申請?zhí)幚頃r間和運算順序,使構(gòu)成部順次運行。另外,上述控制部135管理存儲部 140的地址,控制數(shù)據(jù)的輸入輸出。
上述數(shù)據(jù)輸入模塊105提供用戶面板,可供從存儲部140現(xiàn)存的jpeg文件中 選擇用于本發(fā)明的影像數(shù)據(jù)采樣的jpeg文件,可供從上述存儲部140存儲的mp3 文件中選擇本發(fā)明的文件制作程序?qū)⒁幚淼囊粋€mp3文件。
上述數(shù)據(jù)輸入模塊105所提供的用戶面板與計算機100上的音頻輸出部150 及播放部145聯(lián)動,向揚聲器輸出選擇的對象一mp3文件,或者向畫面輸出jpeg 文件,從而使用戶可以確認圖像數(shù)據(jù)和音頻數(shù)據(jù),進行選擇。
此時,調(diào)整將要用于影像數(shù)據(jù)采樣的jpeg文件的數(shù)量和順序。
另外,上述數(shù)據(jù)輸入模塊105通過上述用戶面板接收所輸入的周期信息。例如 接收所輸入的"0. 5秒"、"l秒"等周期信息。
上述周期信息是指通過數(shù)據(jù)輸入模塊105將所選擇的mp3文件與上述所選擇 的影像數(shù)據(jù)采樣同步化的時間單位。
上述索引生成模塊110給上述所選擇的影像數(shù)據(jù)采樣順次標簽索引。例如,如
果選擇10個影像數(shù)據(jù)采樣,索引可以按照影像數(shù)據(jù)采樣的順序從'T,號標簽至"10"號。
這些索引是在播放上述所選擇的mp3文件時,按上述周期進行選擇,從而將 有關(guān)影像數(shù)據(jù)采樣同步化時使用的。因此,如果上述mp3文件的總播放時間定為2 分鐘,周期信息定為0. 5秒,那么上述索引 一共應(yīng)選擇240次(120秒+ 0. 5秒)。
上述解密模塊115將即3文件格式的音頻數(shù)據(jù)解密成PCM (Pulse Code Modulation:脈沖編碼調(diào)制)數(shù)據(jù),將解密的PCM數(shù)據(jù)向音頻分析模塊125傳送。 在這里,PCM方式是將音樂信號的頻率波形量子化,將振幅值用2進位來表示的方 式,一般以44. 1KHz的采樣和16比特量子化方式用于數(shù)字音樂數(shù)據(jù)的錄音和播放。
上述音頻分析模塊125將解密模塊115所傳送的PCM數(shù)據(jù)以上述所選擇的時 間周期為單位,變換特性數(shù)值的表現(xiàn)區(qū)域。上述索引對應(yīng)模塊120根據(jù)上述影像數(shù) 據(jù)采樣的個數(shù),區(qū)分上述表現(xiàn)區(qū)域的所有區(qū)間,設(shè)定部分區(qū)域,生成與各部分區(qū)域 和上述索引的對應(yīng)信息。
例如,上述表現(xiàn)區(qū)域的第1區(qū)間可以生成索引編號"1",第2區(qū)間可以生成索 引編號"2"等對應(yīng)信息。
如上所述,上述影像數(shù)據(jù)采樣如果選擇為10個,上述部分區(qū)域最好應(yīng)分為10 個,以與圖像影像數(shù)據(jù)采樣的索引相對應(yīng)。
如上所述,上述音頻分析模塊125將解密模塊115所傳送的PCM數(shù)據(jù)以上述 所選4奪的時間周期為單位,變換成特性數(shù)值的表現(xiàn)區(qū)域。
例如,上述音頻分析模塊125將上述PCM數(shù)據(jù)進行信號處理,變換成波動 (wave )波形的音壓和頻率數(shù)值的表現(xiàn)區(qū)域,上述索引對應(yīng)模塊120按照所設(shè)定的 音壓,根據(jù)區(qū)域的對應(yīng)信息選擇識別相關(guān)的索引。
通過上述過程,例如,上述mp3數(shù)據(jù)以0. 5秒的播放單位分析頻率特性,選 擇與頻率特性的等級對應(yīng)的影像數(shù)據(jù)采樣的索引,從而可在每0.5秒使影像同步 化。
圖3是應(yīng)用本發(fā)明的音頻、視頻同步多媒體文件制作程序的計算機100的文 件生成模塊130記錄的數(shù)據(jù)區(qū)域的結(jié)構(gòu)示例圖。
上述文件生成模塊130提供生成本發(fā)明的音頻、視頻同步媒體數(shù)據(jù)文件的作 業(yè)區(qū)域,記錄上述mp3音頻數(shù)據(jù),在以后區(qū)域上記錄標簽數(shù)據(jù)列。
如圖3所示,上述標簽數(shù)據(jù)列是用于區(qū)別音頻數(shù)據(jù)和其它數(shù)據(jù)區(qū)域的,它記 錄標簽的名稱(A)、標簽的大小(B)和周期信息(C)。
上述文件生成模塊130繼標簽數(shù)據(jù)列之后記錄上述所選擇的索引(D、 Dl、 D2、 D3、 D4)。如上述所舉的例子,如果即3文件的總播放時間定為2分鐘,周期信息 定為"0. 5秒",那么上述索引一共選擇240次(120秒+0. 5秒),因此,按照次序 共記錄240個選擇的索引。
本發(fā)明上述過程在移動通信終端機上進行處理,是為了減少移動通信終端機 的音頻、視頻同步化裝置復(fù)雜的運算程序。通過應(yīng)用本發(fā)明的文件制作程序的計算 機100事先處理同步化所需的運算,選擇所有的索引,生成一個媒體文件。這樣, 移動通信終端機只要讀取這個媒體文件即可。
但是,如果240個索引全部記錄在媒體文件內(nèi),那么文件容量變大,所以在
移動通信終端機卸載本發(fā)明的音頻、視頻同步媒體數(shù)據(jù)文件時,會發(fā)生存儲器不能 正常工作的現(xiàn)象。
因此,上述文件生成模塊130在按次序記錄上述索引數(shù)值時,最初的索引數(shù) 值(D)記錄為lbyte大小的數(shù)值,后面的索引(Dl、 D2、 D3、 D4)包含最初的索引(D), 只計算與前面的索引的變化量,將其進行記錄。
一般來說,音頻數(shù)據(jù)和視頻數(shù)據(jù)在同步化時,影像的變化量很少發(fā)生急劇變 化,所以,索引以線形來記錄的概率很高。因此,前后的索引之間數(shù)值差異(變化 量)也很小。
上述文件生成模塊130以bit為單位記錄這些索引間的變化量(參照圖3,最 初索引(D)后面的lbyte中有4個bit,即,可以確認記錄4個后面索引),可大大 減少記錄全部索SI的數(shù)據(jù)區(qū)間。
圖4是應(yīng)用本發(fā)明的音頻、視頻同步多媒體文件制作程序的計算機100的文 件生成模塊130記錄最初索引區(qū)域后面的索引區(qū)域的形態(tài)示例圖。
如圖4所示,最初索引(D)后面的byte區(qū)域按順序記錄4個bit。第一個bit "D1"記錄為"00",表示"與前面索引無差異,'。第二個bit "D2"記錄為"01", 表示"比前面索引數(shù)值增加1 ,,。
另外,第三個bit "D3"記錄為"10",表示"比前面索引數(shù)值減少1",第四 個bit "D4〃記錄為"11",表示"比前面索引數(shù)值增加2(第四個bit根據(jù)情況可 以適用多種數(shù)值),,。
例如,以bit為單位只記錄索引之間的變化量時,如果周期為0.5秒,每分 鐘需要30byte左右的數(shù)據(jù)區(qū)域,如果周期為0. 25秒,每分鐘可以在60 byte左右 的數(shù)據(jù)區(qū)域上記錄索引信息。作為參考,因為最初的索引分配lbyte,所以可以表 現(xiàn)的數(shù)值范圍為0—255。這就是說,影像數(shù)據(jù)采樣可以選擇256個。
另夕卜,上述文件生成模塊130可以在標簽數(shù)據(jù)列內(nèi)部同時記錄影像數(shù)據(jù)采樣。 影像數(shù)據(jù)采樣最好記錄在上述索引的記錄區(qū)域的前后。
通過上述過程在作業(yè)區(qū)域記錄各數(shù)據(jù),上述文件生成模塊130最后將其存儲 在上述存儲部140中,生成本發(fā)明的音頻、視頻同步媒體數(shù)據(jù)文件。
本發(fā)明的音頻、視頻同步媒體數(shù)據(jù)文件可以通過通信端口和存儲卡等傳輸和 記錄媒體向具有音頻、視頻同步化裝置的移動通信終端機卸載。
下面對應(yīng)用通過上述過程生成的音頻、視頻同步媒體數(shù)據(jù)文件的音頻、視頻 同步化裝置進行說明。
本發(fā)明的實施例的音頻、視頻同步化裝置是移動通信終端機上所配備的。
圖5是概略說明本發(fā)明實施例的音頻、視頻同步化裝置200的構(gòu)成要素的模 塊圖。圖6是本發(fā)明實施例的音頻、視頻同步化裝置200處理音頻、視頻同步媒體 數(shù)據(jù)文件的形態(tài)示例圖。
如圖5所示,本發(fā)明的實施例的音頻、視頻同步化裝置200由以下幾個部分 構(gòu)成存儲裝置210、解密裝置220、音頻輸出裝置240、視頻輸出裝置250和影 像同步裝置230。上述存儲裝置210安裝存有圖2至圖4所說明的本發(fā)明的音頻、 視頻同步媒體數(shù)據(jù)文件(以下稱"本發(fā)明的媒體數(shù)據(jù)文件")。
上述解密裝置220從存儲裝置210讀取本發(fā)明的媒體數(shù)據(jù)文件,分析標簽數(shù) 據(jù)列區(qū)域,根據(jù)標簽數(shù)據(jù)列的標簽名稱分離音頻數(shù)據(jù),確認周期。
上述解密裝置220以已確認的周期為單位,將音頻數(shù)據(jù)解密成PCM(Pulse Code Modulation)數(shù)據(jù),向音頻輸出裝置240傳送。
上述音頻輸出裝置240將解密裝置220傳送的PCM數(shù)據(jù)轉(zhuǎn)換成模擬信號,通 過揚聲器進行輸出。
上述影像同步裝置230與上述解密裝置220同時運行,從存儲裝置210讀取 本發(fā)明的媒體數(shù)據(jù)文件,分析標簽名稱區(qū)域以下的標簽數(shù)據(jù)列。
上述影像同步裝置230確認上述周期后,根據(jù)標簽大小尋找索引順序列(圖6 中的索引'T,、索引"3"、索引"4,,、索引"7,,)的起始點。接著,上述影像同步 裝置230根據(jù)已確認的周期,從初期索引區(qū)域按次序讀取其數(shù)值,選出與讀取的索
引相對應(yīng)的影像數(shù)據(jù)采樣(圖6中的F1),向上述視頻輸出裝置250傳送。
此時,上述影像同步裝置230在處理初期索引以下的后面索引時,在前面的索
引數(shù)值基礎(chǔ)上運算按各bit表現(xiàn)的變化量,還原成原來的索引數(shù)值,選出與已還原
的索引相對應(yīng)的影傳4t據(jù)采樣。
上述視頻輸出裝置250將影像同步裝置230傳送的影像數(shù)據(jù)采樣進行解碼,
向畫面上輸出。
如圖6所示,上述解密裝置220和影像同步裝置230同時從存儲裝置210選 取本發(fā)明的媒體數(shù)據(jù)文件進行分析,以相同的周期(F2) (l周期、2周期、3周期、 4周期)為標準來處理各個音頻數(shù)據(jù)(F3)和影像數(shù)據(jù)采樣(Fl)。
另外,上述解密裝置220和影像同步裝置230將以相同的周期處理的音頻數(shù)據(jù) 和影像數(shù)據(jù)采樣分別同時向音頻輸出裝置240和視頻輸出裝置250傳送。這樣,省 略了同步化所需的其它運算過程,可以自動播放已同步化的音樂和影像。
另外,上述解密裝置220和影像同步裝置230按幀分析讀取的音頻數(shù)據(jù),根據(jù) 分析的音樂特性,可以省略選取相關(guān)影像數(shù)據(jù)采樣的運算過程。因此,上述解密裝 置220和影像同步裝置230可以相互獨立地處理數(shù)據(jù),從這一點上來說,也極大地 減少了運算程序的負擔(dān)。
上面以理想實施例為中心對本發(fā)明進行了說明。但本發(fā)明并不僅僅局限于上 述示例,凡本發(fā)明所屬領(lǐng)域具有常識的人員都可以在不脫離本發(fā)明的本質(zhì)特性的范 圍內(nèi)進行以上未示例的各種變形和應(yīng)用。例如,可以對本發(fā)明的實施例中具體出現(xiàn) 的各構(gòu)成要素進行變形。都是,本技術(shù)領(lǐng)域中的普通技術(shù)人員應(yīng)當(dāng)認識到,以上的 實施例僅是用來說明本發(fā)明,而并非用作為對本發(fā)明的限定,只要在本發(fā)明的實質(zhì) 精神范圍內(nèi),對以上所述實施例的變化、變型都將落在本發(fā)明權(quán)利要求書的范圍內(nèi)。
權(quán)利要求
1、一種記錄用于音頻/視頻同步的多媒體文件的計算機可讀媒體,對于在計算機上應(yīng)用的記錄多媒體數(shù)據(jù)文件制作程序的記錄媒體來說,它可以使以下模塊發(fā)揮效用可供輸入影像數(shù)據(jù)采樣及音頻數(shù)據(jù)的數(shù)據(jù)輸入模塊;依次向上述輸入的影像數(shù)據(jù)采樣標簽索引信息的索引生成模塊;將上述音頻數(shù)據(jù)進行信號處理,將可轉(zhuǎn)換成一定特性數(shù)值的表現(xiàn)區(qū)域分成一定區(qū)間,生成上述索引信息及上述分開的表現(xiàn)區(qū)域區(qū)間之間的對應(yīng)信息的索引對應(yīng)模塊;將上述音頻數(shù)據(jù)以一定周期為單位轉(zhuǎn)換成上述特性數(shù)值的表現(xiàn)區(qū)域,根據(jù)上述對應(yīng)信息標簽索引信息的音頻分析模塊;形成旨在生成上述媒體數(shù)據(jù)文件的作業(yè)區(qū)域,依次記錄上述音頻數(shù)據(jù)、標簽數(shù)據(jù)列和根據(jù)上述對應(yīng)信息標簽的索引信息,從而生成一個媒體數(shù)據(jù)文件的文件生成模塊。
2、 如權(quán)利要求1所述的記錄用于音頻/視頻同步的多媒體文件的計算機可讀 媒體,其特征在于還包括將以 一定格式解碼的上述音頻數(shù)據(jù)解密成脈沖編碼調(diào)制數(shù)據(jù),將上述 脈沖編碼調(diào)制數(shù)據(jù)向上述音頻分析模塊傳送的解密模塊。
3、 如權(quán)利要求1所述的記錄用于音頻/視頻同步的多媒體文件的計算機可讀 媒體,其特征在于上述數(shù)據(jù)輸入模塊提供用戶面板,可以從上述計算機上所存儲的影像數(shù)據(jù)中 選擇將用于上述影像數(shù)據(jù)采樣的影像數(shù)據(jù)。
4、 如權(quán)利要求1所述的記錄用于音頻/視頻同步的多媒體文件的計算機可讀 媒體,其特征在于上述數(shù)據(jù)輸入模塊提供用戶面板,可以從上述計算機上所存儲的音頻數(shù)據(jù)中 選擇將用于上述信號處理的音頻數(shù)據(jù)。
5、 如權(quán)利要求項1所述的記錄用于音頻/視頻同步的多媒體文件的計算機可讀媒體,其特征在于上述數(shù)據(jù)輸入模塊將所輸入的上迷一定周期向上述音頻分析模塊傳送。
6、 如權(quán)利要求1所述的記錄用于音頻/視頻同步的多媒體文件的計算機可讀 媒體,其特征在于上述文件生成模塊在上述標簽數(shù)據(jù)列上記錄標簽名稱和標簽大小。
7、 如權(quán)利要求1所述的記錄用于音頻/視頻同步的多媒體文件的計算機可讀 媒體,其特征在于上述文件生成模塊在上述標簽數(shù)據(jù)列上記錄上述一定周期。
8、 如權(quán)利要求1所述的記錄用于音頻/視頻同步的多媒體文件的計算機可讀 媒體,其特征在于上述文件生成模塊在順次記錄索引數(shù)值時,將最初的索引數(shù)值記錄為一定的 數(shù)值,繼上述最初的索引數(shù)值之后順次記錄的索引數(shù)值是與其前面索引數(shù)值的變化量。
9、 如權(quán)利要求1所述的可以用記錄音頻、視頻同步多媒體文件制作程序的計 算機讀取的記錄用于音頻/視頻同步的多媒體文件的計算機可讀媒體,其特征在于上述文件生成模塊在上述作業(yè)區(qū)域上還記錄上述影像數(shù)據(jù)采樣。
10、 一種音頻/視頻同步化裝置,其特征在于包括以下幾個部分 可供輸入存儲所記錄的音頻數(shù)據(jù)、影像數(shù)據(jù)采樣、讀取上述音頻數(shù)據(jù)時,以—定周期使上述影像數(shù)據(jù)采樣同步化的影像同步用索引順序列、上述一定周期和用 于區(qū)別上述音頻數(shù)據(jù)不同的數(shù)據(jù)區(qū)域的標簽數(shù)據(jù)列的多媒體文件的存儲裝置;按照上述一定周期,將上述音頻數(shù)據(jù)解密成脈沖編碼調(diào)制數(shù)據(jù)進行傳送的解 密裝置;把上述解密裝置傳送的上述脈沖編碼調(diào)制數(shù)據(jù)轉(zhuǎn)換成模擬信號進行輸出的音 頻輸出裝置;上述解密裝置運行時,按照上述一定周期順次讀取上述影像同步用索引順序 列,將與讀取的索引相對應(yīng)的影像數(shù)據(jù)采樣與通過上述音頻輸出裝置進行輸出的脈沖編碼調(diào)制數(shù)據(jù)同步化播^文的影像同步裝置。
11、如權(quán)利要求10所述的音頻/視頻同步化裝置,其特征在于 上述影像同步裝置中的影像同步用索引順序列將最初的索引數(shù)值記錄成一定 的數(shù)值,繼上述最初的索引數(shù)值之后順次記錄的索引數(shù)值是記錄與其前面索引數(shù)值 的變化量的順序列,上述影像同步裝置在最初的索引數(shù)值上運算的變化量,順次還 原后面的索引數(shù)值,從而讀取上述影像同步用索引順序列。
全文摘要
一種記錄用于音頻/視頻同步的多媒體文件的計算機可讀媒體及音頻/視頻同步化裝置,對于在計算機上應(yīng)用的記錄多媒體數(shù)據(jù)文件制作程序的記錄媒體,使以下模塊發(fā)揮效用供輸入影像數(shù)據(jù)采樣及音頻數(shù)據(jù)的數(shù)據(jù)輸入模塊;依次向影像數(shù)據(jù)采樣標簽索引信息的索引生成模塊;把音頻數(shù)據(jù)分成一定區(qū)間,生成索引信息和分成的區(qū)域區(qū)間間的對應(yīng)信息的索引對應(yīng)模塊;將音頻數(shù)據(jù)以一定周期轉(zhuǎn)換成上述特性數(shù)值的區(qū)域,根據(jù)對應(yīng)信息標簽索引信息的音頻分析模塊;形成文件作業(yè)區(qū)域,依次記錄音頻數(shù)據(jù)、標簽數(shù)據(jù)列和根據(jù)標簽的索引信息,生成一個多媒體數(shù)據(jù)文件的文件生成模塊。本發(fā)明既能最大限度地減少移動通信終端機硬件資源的使用,又能自動將音樂和影像同步化。
文檔編號H04N5/928GK101193251SQ20061011858
公開日2008年6月4日 申請日期2006年11月22日 優(yōu)先權(quán)日2006年11月22日
發(fā)明者全慧政, 宋建虎, 崔宇英, 曹成文, 裴小英, 都大源 申請人:上海樂金廣電電子有限公司