專利名稱:一種dat缺失音頻的數據識別和替換方法
技術領域:
本發(fā)明涉及一種數據識別和替換方法,尤其涉及一種缺失音頻數據的識別和替換方法。
背景技術:
Audio DAT是一種用于磁帶數字錄音的專業(yè)品質級別的標準媒體和技術。Audio DAT設備是一個數字磁帶轉錄機,大多數的Audio DAT轉錄機都能以44.1千赫、CD音頻標準錄音。DAT已經成為掌握錄音的專業(yè)和半專業(yè)環(huán)境中的標準存檔技術。Audio DAT轉錄機在轉錄過程中經過一次模擬音頻信號轉換,由于其本身固有的缺陷,轉錄得到的音頻數據會被轉錄過程中產生的噪音干擾,而且用Audio DAT轉錄機器轉錄數據時還會隨機產生小段的扭曲、丟失等現象。這些轉錄數據出現的噪音干擾和扭曲、缺失現象大致分為兩種情況:1.數據缺失,即缺失數據段的樣本值為O ;2.數據畸變,即聲音樣本未出現斷音現象,只是聲音質量下降。對于這兩種情況,數據缺失比較容易辨識,而數據畸變比較復雜,需要通過多種方法綜合使用才能識別和修復。這種數據缺失畸變的情況不是個別機器出現的偶然現象,而是幾乎每臺機器在轉錄時都會發(fā)生的,只是出現的頻率或時間不同。這種轉錄過程出現的不可避免的數據缺失畸變情況嚴重影響了轉錄出的數字音頻文件的文化特色和音質特點。由于目前DAT技術逐步退出了市場,這種DAT轉錄機已經停產,而廠家也不再提供技術支持,因此在硬件上修復轉錄得到的數字音頻是不可能的。而到國外專門的修復機構去修復的話,成本會很高。因此必須考慮通過數字處理等技術手段來對轉錄得到的音頻結果進行分析、研究,以找到修復方法、手段,實現對DAT的轉錄音頻的修復。因此,本領域的技術人員致力于開發(fā)一種音頻數據的識別和替換方法,在DAT轉錄音頻中找到可用的數據并對DAT音頻進行替換修復。
發(fā)明內容
有鑒于現有技術的上述缺陷,本發(fā)明所要解決的技術問題是提供一種音頻數據的識別和替換方法,通過對磁帶的兩次轉錄得到的兩個轉錄音頻文件,使用技術手段找到兩個文件的音頻數據的匹配關系,并根據匹配關系,對文件中的不可用數據段,即缺失數據段進行替換,修復音頻數據。為實現上述目的,本發(fā)明提供了一種DAT缺失音頻的數據識別和替換方法,其特征在于,包括:步驟100使用DAT轉錄機對DAT磁帶進行第一次轉錄,得到第一次轉錄音頻;再使用所述DAT轉錄機對所述磁帶進行第二次轉錄,得到第二次轉錄音頻;對所述第一轉錄音頻和所述第二轉錄音頻做歸一化處理,再將其中長度較長的一個作為主文件,長度較短的一個作為輔文件;步驟200將所述主文件和所述輔文件對齊;
步驟300將所述主文件分割成η個樣本段,并對分割后的所述主文件的樣本段賦予編號,得到樣本段Al、樣本段Α2、…、樣本段An,在所述輔文件中搜索與各個所述主文件樣本段匹配的樣本段作為所述輔文件的樣本段,得到m個所述輔文件的樣本段:樣本段B1、樣本段B2、…、樣本段Bm ;各個所述主文件樣本段與各個所述輔文件樣本段之間的匹配關系為:所述樣本段BI與所述樣本段Al匹配、所述樣本段B2與所述樣本段A2匹配、…、所述樣本段Bm與所述樣本段Am匹配,所述m < η ;建立所述匹配關系的匹配表;步驟400分析所述的匹配表,找出所述主文件的樣本段和所述輔文件的樣本段中的可用樣本段,并對各個所述可用樣本段作標識;步驟500建立新文件,按照所述編號順序,依次將所述主文件和所述輔文件中的所述可用樣本段寫入所述新文件;步驟600輸出所述新文件;步驟700結束。進一步地,所述的第一轉錄音頻和所述的第二轉錄音頻的采樣頻率都為44.1kHz ;所述第一轉錄音頻和所述第二轉錄音頻的長度都要大于3X217。進一步地,所述的步驟200中的所述主文件和所述輔文件的對齊包括:在所述輔文件中的前20%位置處取一個長度為217的樣本段m,所述樣本段m的起始位置為PBm,并在所述主文件的前10%-30%的范圍內搜索與所述樣本段m匹配的匹配樣本段,根據所述的匹配樣本段的起始位置來對齊所述主文件和所述輔文件。進一步地,在所述主文件的前10%_30%的范圍內搜索匹配的匹配樣本段,包括:從所述主文件的10%的位置到所述主文件的30%的位置,按所述樣本段m的長度分別選取多個樣本段,計算所述樣本段m和各個選取的所述樣本段之間的匹配誤差,與所述樣本段m之間的所述匹配誤差最小的選取的所述樣本段就是所述樣本段m的匹配樣本段,所述匹配樣本段的起始位置為Pniint5進一步地,所述的根據所述的匹配樣本段的起始位置來對齊所述主文件和所述輔文件,包括:若Pmin〈0,則對齊失敗,直接跳入所述步驟700,結束; 若Pmin>PBm,則設定所述主文件上與所述輔文件匹配的起始位置Pa1i為:PAh=Pmin_PBm,所述輔文件上與所述主文件匹配的起始位置P Bh為所述輔文件的起始位置P BO ;若Pmin〈PBm,則設定所述主文件上與所述輔文件匹配的起始位置PAh為所述主文件的起始位置Paci,所述輔文件上與所述主文件匹配的起始位置PBh為:PBh=PBm-Pmin ;若Pmin=PBm,則所述主文件和所述輔文件已對齊,設定所述主文件上與所述輔文件匹配的起始位置PAh為所述主文件的起始位置Paci,所述輔文件上與所述主文件匹配的起始位置P Bh為所述輔文件的起始位置P K!。進一步地,所述步驟300中的所述主文件的分割是從所述主文件的所述起始位置開始。進一步地,對所述主文件的分割是等長度的分割,經過分割得到的所述各個主文件樣本段的長度皆為214。進一步地, 所述步驟300中在所述輔文件中搜索與各個所述主文件的樣本段的匹配的樣本段為:從所述樣本段A2開始對所述主文件中的各個樣本段在所述輔文件中搜索與其匹配的樣本段,包括:對于所述樣本段A2,從所述輔文件的起始位置開始,到27X214的范圍內按所述樣本段A2的長度在所述輔文件中分別選取多個樣本段,計算出所述輔文件的各選取的所述樣本段與所述主文件的樣本段A2之間的匹配誤差,與所述主文件的樣本段A2之間的匹配誤差最小的樣本段即為所述樣本段A2在所述輔文件中的匹配的樣本段B2 ;對于所述主文件中在所述樣本段A2之后的待匹配的樣本段,從與所述主文件中所述待匹配的樣本段的前一個樣本段在所述輔文件中的匹配的樣本段的末端開始,在27X 214的范圍內按長度為214在所述輔文件中分別選取多個樣本段,計算出所述輔文件的各選取的所述樣本段與所述待匹配的樣本段之間的匹配誤差,與所述待匹配的樣本段之間的匹配誤差最小的樣本段即為所述待匹配的樣本段在所述輔文件中的匹配的樣本段。進一步地,所述的步驟400中的所述的可用樣本段的判斷依據為:所述主文件的樣本段在所述主文件中的位置為Pa,根據所述匹配表,獲得其在所述輔文件中的匹配的樣本段和所述匹配的樣本段在所述輔文件中的位置PB,若Pa=Pb,則所述主文件樣本段和所述輔文件樣本段為所述可用的所述主文件樣本段和所述可用的所述輔文件樣本段;若PA>PB,則所述主文件樣本段為所述可用的所述主文件樣本段;若PB>PA,則所述輔文件樣本段為所述可用的所述輔文件樣本段;在所述輔文件中,若所述編號連續(xù)的兩個樣本段均為可用樣本段,則所述編號連續(xù)的兩個樣本段之間的空隙段亦為可用樣本段。進一步地,在所述的步驟500中,依次將所述主文件和所述輔文件的所述可用樣本段寫入所述新文件中以構造所述新文件的各個樣本段Ck,其中k=l、2、…、n,包括:當k=l時,將所述主文件的樣本段Al寫入所述新文件以構造所述樣本段Cl ;
當k>l 時,若所述主文件的樣本段Ak是可用的,則直接將所述主文件的可用的樣本段Ak寫入所述新文件以構造所述樣本段Ck ;若所述主文件的樣本段Ak是不可用的,且所述輔文件中樣本段Bk與樣本段Bk-1之間無空隙段,則用所述輔文件的可用的樣本段Bk替換所述主文件的不可用的樣本段Ak,寫入所述新文件以構造所述樣本段Ck ;若所述主文件的樣本段Ak是不可用的,且所述輔文件中的樣本段Bk與樣本段Bk-1之間具有空隙段并且此空隙段可用,則用所述輔文件的可用樣本段Bk和此空隙段一起替換所述主文件的不可用樣本段Ak,寫入所述新文件以構造所述樣本段Ck ;若所述主文件的樣本段Ak是不可用的,且所述輔文件中的樣本段Bk與樣本段Bk-1之間具有的空隙段并且此空隙段不可用,則用所述輔文件的可用樣本段Bk替換所述主文件的不可用樣本段Ak,寫入所述新文件以構造所述樣本段Ck。在本發(fā)明的較佳實施方式中,使用本發(fā)明的缺失音頻的數據識別和替換方法對DAT磁帶進行了音頻修復,包括步驟:使用DAT轉錄機對DAT磁帶進行第一次轉錄,獲得的數字波形音頻作為第一轉錄音頻,使用上述DAT轉錄機對該DAT磁帶進行第二次轉錄,獲得的數字波形音頻作為第二轉錄音頻,其中,第一轉錄音頻和第二轉錄音頻的采樣頻率皆為44.1kHz ;將第一轉錄音頻和第二轉錄音頻的數據進行歸一化處理,并將其中長度較長的一個作為主文件,長度較短的一個作為輔文件。確定主文件上與輔文件匹配的起始位置,確定輔文件上與主文件匹配的起始位置,使輔文件相對于主文件對齊。等長度分割主文件,得到η個長度皆為214的樣本段作為主文件樣本段,并對各個主文件樣本段進行編號;在輔文件上,從起始位置開始選取樣本段,搜索輔文件中與各個編號的主文件樣本段的匹配誤差最小的樣本段作為輔文件與主文件各個編號的樣本段匹配的匹配樣本段,得到各個主文件樣本段與各個輔文件樣本段之間的匹配關系。分析該匹配關系,得到可用的主文件樣本段,可用的輔文件樣本段和可用空隙段。建立新文件,依次將主文件和符文的可用樣本段寫入新文件,以構造新文件的各個樣本段Ck,其中k=l、2、3、…、η:首先直接將主文件的可用樣本段Al直接寫入新文件的樣本段Cl,其次,當k>l時,若主文件樣本段Ak是可用的,則直接將可用的主文件樣本段Ak寫入新文件的樣本段以構造所述樣本段Ck ;若所述主文件的樣本段Ak是不可用的,且輔文件中樣本段Bk與樣本段Bk-1之間無空隙段,則用輔文件的可用的樣本段Bk替換主文件的不可用的樣本段Ak,寫入新文件以構造所述樣本段Ck;若主文件的樣本段Ak是不可用的,且輔文件中的樣本段Bk與樣本段Bk-1之間具有空隙段并且此空隙段可用,則用輔文件的可用樣本段Bk和此空隙段一起替換主文件的不可用樣本段Ak,寫入新文件以構造所述樣本段Ck ;若主文件的樣本段Ak是不可用的,且輔文件中的樣本段Bk與樣本段Bk-1之間具有的空隙段并且此空隙段不可用,則用輔文件的可用樣本段Bk替換主文件的不可用樣本段Ak,寫入新文件以構造樣本段Ck。該新文件就是對該DAT磁帶的轉錄音頻進行識別和替換后的數據。由此可見,本發(fā)明的DAT缺失音頻的數據識別和替換方法,通過對DAT磁帶進行兩次轉錄得到兩個轉錄音頻文件,分別為主文件和輔文件;然后對主文件和輔文件的樣本段進行匹配,分析,得到主文件和輔文件的可用樣本段;對于主文件中的不可用樣本段用輔文件中與之匹配的可用樣本段進行替換,得到缺失音頻的數據識別和替換后的文件。該方法對缺失音頻數據的識別能力很高,通過替換的方法,缺失的音頻數據可以得到有效的修復,從而有利于轉錄DAT磁帶以搶救這些磁帶中存儲的珍貴錄音資料,而且本發(fā)明的數據識別和替換方法并不限于用于DAT磁帶,還可用于其他磁帶或存儲媒介,因而具有廣泛的應用領域和應用前景。以下將結合附圖對本發(fā)明的構思、具體結構及產生的技術效果作進一步說明,以充分地了解本發(fā)明的目的、特 征和效果。
圖1是本發(fā)明的DAT缺失音頻的數據識別和替換方法的流程圖;圖2是本發(fā)明的DAT缺失音頻的數據識別和替換方法的文件對齊的一個示例的示意圖;圖3是本發(fā)明的DAT缺失音頻的數據識別和替換方法的文件對齊的另一個示例的示意圖;圖4是本發(fā)明的DAT缺失音頻的數據識別和替換方法的實施例的樣本段匹配示意圖和可用段標識;圖5是本發(fā)明的DAT缺失音頻的數據識別和替換方法的實施例的新文件的寫入示意圖。
具體實施例方式下面結合附圖來來具體說明本發(fā)明的實施例。在本實施例中,如圖1所示,應用本發(fā)明的DAT缺失音頻的數據識別和替換方法對DAT磁帶進行音頻修復,包括步驟:步驟100,首先使用一臺DAT轉錄機對需要修復的磁帶連續(xù)進行轉錄兩次,轉錄后的音頻文件分別為第一轉錄音頻和第二轉錄音頻,其中第一轉錄音頻和第二轉錄音頻的采樣頻率為44.1kHz ;然后對第一轉錄音頻和所述第二轉錄音頻做歸一化處理,使第一轉錄音頻和第二轉錄音頻的數據的值在-1.0 1.0的范圍內,再將其中文件長度較長的一個作為主文件A,長度較短的一個作為輔文件B。典型地,轉錄音頻的長度為228。步驟200,匹配主文件A和輔文件B,如圖2和3所示,其中A表示主文件A,B表示輔文件B。在輔文件的前20%位置處取長度為217的樣本段m,該樣本段m的起始位置為ΡΒηι,在主文件A的前10%-30%的范圍內,按長度為217,從主文件A的10%的位置開始到主文件A的30%的位置,按步長為I調整取樣位置,依次分別選取樣本(即數據)c1、c2、…、Ci作為樣本段c,分別計算樣本段m中的各個數據Hii和樣本段c中的各個樣本Cp C2,…、Ci之間誤差并將誤差之和作為匹配誤差
權利要求
1.種DAT缺失音頻的數據識別和替換方法,其特征在于,包括: 步驟(100)使用DAT轉錄機對DAT磁帶進行第一次轉錄,得到第一次轉錄音頻;再使用所述DAT轉錄機對所述磁帶進行第二次轉錄,得到第二次轉錄音頻;對所述第一轉錄音頻和所述第二轉錄音頻做歸一化處理,再將其中長度較長的ー個作為主文件,長度較短的一個作為輔文件; 步驟(200)將所述主文件和所述輔文件對齊; 步驟(300)將所述主文件分割成n個樣本段,并對分割后的所述主文件的樣本段賦予編號,得到樣本段(Al)、樣本段(A2)、…、樣本段(An),在所述輔文件中捜索與各個所述主文件樣本段匹配的樣本段作為所述輔文件的樣本段,得到m個所述輔文件的樣本段:樣本段(BI)、樣本段(B2)、…、樣本段(Bm);各個所述主文件樣本段與各個所述輔文件樣本段之間的匹配關系為:所述樣本段(BI)與所述樣本段(Al)匹配、所述樣本段(B2)與所述樣本段(A2)匹配、 、所述樣本段(Bm)與所述樣本段(Am)匹配,所述m彡n ;建立所述匹配關系的匹配表; 步驟(400)分析所述的匹配表,找出所述主文件的樣本段和所述輔文件的樣本段中的可用樣本段,并對各個所述可用樣本段作標識; 步驟(500)建立新文件,按照所述編號順序,依次將所述主文件和所述輔文件中的所述可用樣本段寫入所述新文件; 步驟(600)輸出所述新文件; 步驟(700)結束。
2.權利要求1所述的ー種DAT缺失音頻的數據識別和替換方法,其中所述的第一轉錄音頻和所述的第二轉錄音頻的采樣頻率都為44.1kHz ;所述第一轉錄音頻和所述第二轉錄音頻的長度都要大 于3 X 217。
3.權利要求1所述的ー種DAT缺失音頻的數據識別和替換方法,其中所述的步驟(200)中的所述主文件和所述輔文件的對齊包括:在所述輔文件中的前20%位置處選取一個長度為217的樣本段(m),所述樣本段(m)的起始位置為PBm,并在所述主文件的前10%-30%的范圍內捜索與所述樣本段(m)匹配的匹配樣本段,根據所述的匹配樣本段的起始位置來對齊所述主文件和所述輔文件。
4.權利要求3所述的ー種DAT缺失音頻的數據識別和替換方法,其中在所述主文件的前10%-30%的范圍內搜索匹配的匹配樣本段,包括:從所述主文件的10%的位置到所述主文件的30%的位置,按所述樣本段(m)的長度分別選取多個樣本段,計算所述樣本段(m)和各個選取的所述樣本段之間的匹配誤差,與所述樣本段(m)之間的所述匹配誤差最小的選取的所述樣本段就是所述樣本段(m)的匹配樣本段,所述匹配樣本段的起始位置為Pmin。
5.權利要求3所述的ー種DAT缺失音頻的數據識別和替換方法,其中所述的根據所述的匹配樣本段的起始位置來對齊所述主文件和所述輔文件,包括: 若Pmin〈0,則對齊失敗,直接跳入所述步驟(700),結束; 若P-〉、,則設定所述主文件上與所述輔文件匹配的起始位置(PAh)為:PAh=Pmin-PBm,所述輔文件上與所述主文件匹配的起始位置(P Bh)為所述輔文件的起始位置(P B0); 若Pmin〈PBm,則設定所述主文件上與所述輔文件匹配的起始位置(Pm)為所述主文件的起始位置(PACI),所述輔文件上與所述主文件匹配的起始位置(PBh)為:PBh=PBm_Pmin ;若Pmin=PBm,則所述主文件和所述輔文件已對齊,設定所述主文件上與所述輔文件匹配的起始位置(PAh)為所述主文件的起始位置(P A(l),所述輔文件上與所述主文件匹配的起始位置(P Bh)為所述輔文件的起始位置(P Βθ)°
6.權利要求1所述的一種DAT缺失音頻的數據識別和替換方法,其中所述步驟(300)中的所述主文件的分割是從所述主文件的所述起始位置開始。
7.權利要求6所述的一種DAT缺失音頻的數據識別和替換方法,其中對所述主文件的分割是等長度的分割,經過分割得到的所述各個主文件樣本段的長度皆為214。
8.權利要求6所述的一種DAT缺失音頻的數據識別和替換方法,其中所述步驟(300)中在所述輔文件中搜索與各個所述主文件的樣本段的匹配的樣本段為:從所述樣本段(A2)開始對所述主文件中的各個樣本段在所述輔文件中搜索與其匹配的樣本段,包括:對于所述樣本段(A2),從所述輔文件的起始位置開始到27X214的范圍內,按所述樣本段(A2)的長度在所述輔文件中分別選取多個樣本段,計算出所述輔文件的各選取的所述樣本段與所述主文件的樣本段(A2)之間的匹配誤差,與所述主文件的樣本段(A2)之間的匹配誤差最小的樣本段即為所述樣本段(A2)在所述輔文件中的匹配的樣本段(B2);對于所述主文件中在所述樣本段(A2)之后的待匹配的樣本段,從與所述主文件中所述待匹配的樣本段的前一個樣本段在所述輔文件中的匹配的樣本段的末端開始,在27X 214的范圍內按長度為214在所述輔文件中分別選取多個樣本段,計算出所述輔文件的各選取的所述樣本段與所述待匹配的樣本段之間的匹配誤差,與所述待匹配的樣本段之間的匹配誤差最小的樣本段即為所述待匹配的樣本段在所述輔文件中的匹配的樣本段。
9.權利要求1所述的一種DAT缺失音頻的數據識別和替換方法,其中所述的步驟(400)中的所述的可用樣本段的判斷依據為:所述主文件的樣本段在所述主文件中的位置SPa,根據所述匹配表,獲得其在所述輔文件中的匹配的樣本段和所述匹配的樣本段在所述輔文件中的位置PB, 若Pa=Pb,則所述主文件樣本段和所述輔文件樣本段為所述可用的所述主文件樣本段和所述可用的所述輔文件樣本段; 若PA>PB,則所述主文件樣本段為所述可用的所述主文件樣本段; 若PB>PA,則所述輔文件樣本段為所述可用的所述輔文件樣本段; 在所述輔文件中,若所述編號連續(xù)的兩個樣本段均為可用樣本段,則所述編號連續(xù)的兩個樣本段之間的空隙段亦為可用樣本段。
10.權利要求1所述的一種DAT缺失音頻的數據識別和替換方法,其中在所述的步驟(500)中,依次將所述主文件和所述輔文件的所述可用樣本段寫入所述新文件中以構造所述新文件的各個樣本段(Ck),其中k=l、2、…、n,包括: 當k=l時,將所述主文件的樣本段(Al)寫入所述新文件以構造所述樣本段(Cl); 當k>l時, 若所述主文件的樣本段(Ak)是可用的,則直接將所述主文件的可用的樣本段(Ak)寫入所述新文件以構造所述樣本段(Ck); 若所述主文件的樣本段(Ak)是不可用的,且所述輔文件中樣本段(Bk)與樣本段(Bk-1)之間無空隙段,則用所述輔文件的可用的樣本段(Bk)替換所述主文件的不可用的樣本段(Ak),寫入所述新文件以構造所述樣本段(Ck);若所述主文件的樣本段(Ak)是不可用的,且所述輔文件中的樣本段(Bi)與樣本段(Bk-1)之間具有空隙段并且此空隙段可用,則用所述輔文件的可用樣本段(Bk)和此空隙段一起替換所述主文件的不可用樣本段(Ak),寫入所述新文件以構造所述樣本段(Ck); 若所述主文件的樣本段(Ak)是不可用的,且所述輔文件中的樣本段(Bk)與樣本段(Bk-1)之間具有的空隙段并且此空隙段不可用,則用所述輔文件的可用樣本段(Bk)替換所述主文件的不可用樣本段(Ak),寫 入所述新文件以構造所述樣本段(Ck)。
全文摘要
本發(fā)明公開了一種DAT缺失音頻的數據識別和替換方法,包括使用DAT轉錄機對磁帶進行轉錄兩次,得到主文件和輔文件;將輔文件相對于主文件對齊;在輔文件中搜索與各個主文件樣本段相匹配的樣本段,得到主文件和輔文件的樣本段的匹配關系;分析匹配關系,得到可用的主文件樣本段和輔文件樣本段;建立新文件,按順序將主文件的樣本段寫入新文件,可用的樣本段直接寫入新文件,不可用的樣本段用輔文件中的與之匹配的可用樣本段替換后寫入新文件,該新文件是對DAT缺失音頻修復好的文件。本發(fā)明的DAT缺失音頻的數據識別和替換方法,對轉錄的音頻文件出現的缺失音頻的識別能力很高,又通過替換方法,對DAT缺失音頻進行了有效修復。
文檔編號G11B5/86GK103093782SQ20131005368
公開日2013年5月8日 申請日期2013年2月19日 優(yōu)先權日2013年2月19日
發(fā)明者葉丹, 李柏巖, 王良鳴, 宋暉, 王勁松, 閔友鋼 申請人:上海東方傳媒集團有限公司, 上海協言科學技術服務有限公司