国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      特定音響信號(hào)含有區(qū)間檢測系統(tǒng)及其方法以及程序的制作方法

      文檔序號(hào):2827946閱讀:312來源:國知局
      專利名稱:特定音響信號(hào)含有區(qū)間檢測系統(tǒng)及其方法以及程序的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及從作為參考信號(hào)的參考音響信號(hào)和比該參考音響信號(hào)長的儲(chǔ)存音響信號(hào)中探測相似的信號(hào)的位置的信號(hào)檢測,例如,將音樂CD(Compact Disc壓縮盤)的曲目的一部分作為參考信號(hào)用于音響信號(hào)檢測的特定音響信號(hào)含有區(qū)間檢測系統(tǒng)。
      即本發(fā)明將記錄在音樂CD上的特定音樂的一部分作為參考信號(hào),檢測包含儲(chǔ)存音響信號(hào)中的參考信號(hào)的區(qū)間,由此,從龐大的數(shù)據(jù)庫例如從錄制有電視播放的曲目中檢索出將該音樂作為BGM(BackGround Music背景音樂)而使用的區(qū)間。
      本申請(qǐng)以在2004年7月1日申請(qǐng)的專利申請(qǐng)2004-195995號(hào)為優(yōu)先權(quán),在此引用其內(nèi)容。
      背景技術(shù)
      如圖6所示,包含特定音響信號(hào)的區(qū)間檢測,通過在比稱為儲(chǔ)存信號(hào)的參考信號(hào)長的音響信號(hào)(儲(chǔ)存音響信號(hào))中,檢測出包含與稱為參考信號(hào)的特定音響信號(hào)(參考音響信號(hào))相似的聲音的相似區(qū)間。
      此外,在本說明書中,檢測上述相似區(qū)間定義為檢測該相似區(qū)間開始的區(qū)間的起始時(shí)刻。
      以往,作為檢測儲(chǔ)存信號(hào)中的與參考信號(hào)相似的區(qū)間的高速方法,有時(shí)序主動(dòng)搜索法等(例如專利第3065314號(hào)“高速信號(hào)搜索方法、裝置及其記錄介質(zhì)”)。
      但是,如上所述的儲(chǔ)存信號(hào)中的參考信號(hào)的檢測方法多數(shù)是以儲(chǔ)存信號(hào)中的與參考信號(hào)相似的區(qū)間和參考信號(hào)幾乎相同為前提的。
      因此,當(dāng)檢索信號(hào)中要檢測的音樂中疊加有解說等其他聲音的情況下(附加有相加噪聲的情況下),該區(qū)間的音響信號(hào)與參考信號(hào)顯著不同,因而無法進(jìn)行檢測。
      并且,包含作為BGM而使用的以音樂的檢測等為目的的特定音響信號(hào)的區(qū)間檢測方法,以往幾乎沒有例子,唯一有自優(yōu)化頻譜相關(guān)法(例如M.Abe and M.NishiguchiSelf-optimized Spectral Correlation Method for Background Music Indentification,Proc.IEEE ICME’02,Lausanne,Vol.1,333/336(2002))。
      但是,上述自優(yōu)化頻譜相關(guān)法存在因其計(jì)算量的大進(jìn)行檢測非?;〞r(shí)間的問題。
      因此,作為更高速地進(jìn)行包含特定音響信號(hào)的區(qū)間的檢測的方法,提出了分割一致搜索法(例如特開2004-102023“特定音響信號(hào)檢測方法、信號(hào)檢測裝置、信號(hào)檢測程序及記錄介質(zhì)”)。
      &lt;分割一致搜索法的概要&gt;
      其次,圖7表示上述分割一致搜索法的概要,以下對(duì)分割一致搜索法的處理步驟進(jìn)行說明。
      首先,如圖7的步驟(a),從參考信號(hào)及儲(chǔ)存信號(hào)的各聲音波形信號(hào)中抽出功率頻譜,得到各自的頻譜圖(spectrogram)。
      接著,從參考信號(hào)的頻譜圖中等間隔地切出固定尺寸的小區(qū)域的頻譜圖。
      在頻率軸方向以及時(shí)間軸方向,從原來的頻譜圖上切出各個(gè)的固定個(gè)數(shù)的頻譜圖上的點(diǎn),由此,得到該小區(qū)域的頻譜圖。這些小區(qū)域頻譜圖也可以重疊。
      將這樣切出的小區(qū)域的頻譜圖稱為小區(qū)域頻譜圖(small-region spectrogram)。
      并且,將起始時(shí)刻記為ti、頻帶為ωm的參考信號(hào)中的小區(qū)域頻譜圖記為Fti,ωm。
      另外,在儲(chǔ)存信號(hào)的頻譜圖中,將起始時(shí)刻記為t、將與頻帶為ωm的Fti,ωm相同尺寸的小區(qū)域頻譜圖記為Gt,ωm。
      另外,在參考信號(hào)的頻譜圖中,設(shè)切出小區(qū)域頻譜圖Fti,ωm后的參考信號(hào)中的全部時(shí)刻ti的集合為TR(TR={t1,t2,…}),設(shè)全部頻帶ωm的集合為W(W={ω1,ω2,…})。
      此外,為了吸收音量的變動(dòng),各小區(qū)域頻譜圖的功率值按各小區(qū)域頻譜圖進(jìn)行標(biāo)準(zhǔn)化。
      其次,如圖7的步驟(b),對(duì)于參考信號(hào)中的各Fti,ωm,在頻帶ωm從儲(chǔ)存信號(hào)中搜索與Fti,ωm相似的時(shí)刻。
      使用時(shí)序主動(dòng)搜索法(TAS專利第3065314號(hào)“高速信號(hào)搜索方法、裝置及其記錄介質(zhì)”)進(jìn)行該搜索。
      此外,在此與Fti,ωm相似的時(shí)刻是Fti,ωm和Gt,ωm的小區(qū)域相似度s’P(Fti,ωm,Gt,ωm)超過小區(qū)域用搜索閾值s’Pth那樣的時(shí)刻t。
      此外,在分割一致搜索法中,由于在具有該相似的小區(qū)域頻譜圖的時(shí)刻的搜索上使用TAS,因此,作為小區(qū)域相似度s’Pth(Fti,ωm,Gt, ωm),使用Fti,ωm和Gt,ωm之間的直方圖重疊率。
      將根據(jù)該直方圖重疊率的小區(qū)域相似度特別地稱為小區(qū)域直方圖相似度。
      在此,簡單地說明上述時(shí)序主動(dòng)搜索法。時(shí)序主動(dòng)搜索法(TAS)的概要如圖8所示。
      對(duì)于時(shí)序主動(dòng)搜索法來說,根據(jù)與參考信號(hào)的頻譜圖的直方圖重疊率的相似度,從儲(chǔ)存信號(hào)的頻譜圖中搜索與具有比閾值θ大的頻譜圖的參考信號(hào)相同長度的區(qū)域。
      首先,說明頻譜圖X和頻譜圖Y中的直方圖重疊率。
      在此,X和Y是在時(shí)間軸方向和頻率軸方向上相同尺寸的頻譜圖。
      首先,在將頻譜圖上的各時(shí)刻的頻譜特征進(jìn)行標(biāo)準(zhǔn)化的基礎(chǔ)上,根據(jù)矢量量子化進(jìn)行代碼化,對(duì)各頻譜圖作成代碼(根據(jù)矢量量子化的代碼化而得到的代碼。矢量量子化代碼)序列(代碼串)。
      其次,作為直方圖重疊率的計(jì)算,對(duì)各頻譜圖,作成對(duì)上述矢量量子化代碼的出現(xiàn)次數(shù)進(jìn)行了計(jì)數(shù)的直方圖(直方圖特征)。
      并且,設(shè)hX和hY為X和Y的直方圖特征,則X和Y的直方圖重疊率Sh(hX,hY)根據(jù)以下所示的式(1)進(jìn)行運(yùn)算。
      sh(hX,hY)=1D&Sigma;r=1Lmin(h&gamma;X,h&gamma;Y)---(1)]]>此外,在此hγX和hγY是分別包含在hX和hY中的第γ個(gè)維值(bin)的次數(shù)(矢量量子化代碼的出現(xiàn)次數(shù)),L是直方圖的維值的數(shù)目,D是一個(gè)直方圖的總次數(shù)。
      并且,在時(shí)序主動(dòng)搜索法中,將上述直方圖重疊率用于直方圖的相似度上。
      在此,當(dāng)參考信號(hào)的頻譜圖和儲(chǔ)存信號(hào)中的區(qū)間t的頻譜圖的直方圖重疊率為S”(t)時(shí),在時(shí)刻t比對(duì)后,如(2)式用S”(t)對(duì)到下一比對(duì)位置的跳躍寬度(skip width)進(jìn)行計(jì)算,使比對(duì)位置只移動(dòng)z,并重新計(jì)算跳躍寬度。
      z=floor(D(&theta;-S&prime;&prime;(T))+1&CenterDot;&CenterDot;&CenterDot;ifS&prime;&prime;(t)&lt;&theta;1&CenterDot;&CenterDot;&CenterDot;otherwise---(2)]]>在(2)式中,floor(x)是不超過x的最大整數(shù)。
      時(shí)序主動(dòng)搜索法通過重復(fù)上述處理,進(jìn)行搜索處理。
      并且,在比對(duì)后的區(qū)間的直方圖重疊率當(dāng)比θ大時(shí),檢測出該區(qū)域作為與參考信號(hào)相似的區(qū)間。
      另外,在時(shí)序主動(dòng)搜索法中,這樣通過跳躍減少比對(duì)次數(shù),同時(shí)可不遺漏直方圖重疊率比閾值θ大的區(qū)域而進(jìn)行搜索。
      其次,返回圖7,如圖7(c),基于上述各小區(qū)域頻譜圖Fti,ωm的搜索結(jié)果,對(duì)于儲(chǔ)存信號(hào)中的各時(shí)刻t,統(tǒng)一小區(qū)域相似度,用以下的(3)式運(yùn)算求出t時(shí)刻的與參考信號(hào)的相似度(區(qū)間相似度)S’(t)。
      S&prime;(t)=1|TR|&Sigma;ti&Element;TR(max&omega;m&Element;W(s&prime;P(Fti,&omega;m,Gt+ti,&omega;m)))---(3)]]>在(3)式中,|TR|表示TR的要素?cái)?shù)。此外,對(duì)于Fti,ωm的搜索結(jié)果來說,在儲(chǔ)存信號(hào)的時(shí)刻t,當(dāng)Gt+ti,ωm沒有作為與Fti,ωm相似的小區(qū)域頻譜圖而被檢測出的情況下,即以下所示(4)式的情況下,該小區(qū)域頻譜圖間的相似度(小區(qū)域相似度)如(5)式。

      s′P(Fti,ωm,Gt+ti,ωm)≤s′Pth…(4)[式5]s′P(Fti,ωm,Gt+ti,ωm)=0 …(5)因此,在實(shí)際的搜索中,僅在當(dāng)Gt+ti,ωm沒有作為與Fti,ωm相似的小區(qū)域頻譜圖而被檢測出的情況下,在(3)式中累加s’P(Fti,ωm,Gt+ti,ωm)。
      另外,在(3)式中,作為以下所示的(6)式,對(duì)于s’P(Fti,ωm,Gt+ti,ωm),從全頻帶的集合W中選擇其值為最大的頻帶ωm。
      max&omega;m&Element;W(s&prime;P(Fti,&omega;m,Gt+ti,&omega;m))---(6)]]>執(zhí)行上述處理的理由在于對(duì)于參考信號(hào)中的相同時(shí)刻的多個(gè)不同頻帶的小區(qū)域頻譜圖,儲(chǔ)存信號(hào)中的相同時(shí)刻的不同的多個(gè)頻帶的小區(qū)域頻譜圖作為與這些相似的小區(qū)域頻譜圖而被檢測出的情況下,小區(qū)域直方圖相似度最高的頻帶即所疊加的聲音與靜音最接近,選擇可考慮為與參考信號(hào)的疊加最少的頻帶。
      基于上述得到的區(qū)間相似度,在以區(qū)間相似度S’(t)比搜索閾值S’th大的時(shí)刻t為起始的區(qū)域檢測出參考信號(hào)。
      但是,在上述的分割一致搜索法中,在某頻帶ωm,當(dāng)檢測出相似的小區(qū)域頻譜圖時(shí),為計(jì)算Fti,ωm和Gt+ti,ωm的直方圖重疊率,該直方圖疊加率的計(jì)算需要時(shí)間,并且對(duì)于不相似的Fti,ωm和Gt+ti,ωm的組合,也要計(jì)算直方圖疊加率,因此,包含特定音響信號(hào)的區(qū)間的檢測需要很長時(shí)間。

      發(fā)明內(nèi)容
      本發(fā)明的目的在于提供一種特定音響信號(hào)的區(qū)域的檢測系統(tǒng),在通過上述公知方法中需要長時(shí)間進(jìn)行相似的小區(qū)域頻譜圖的檢測中,高速進(jìn)行參考信號(hào)及儲(chǔ)存信號(hào)的2個(gè)小區(qū)域頻譜圖是否相似的判斷,省略了無相似可能性的小區(qū)域頻譜圖的組合的相似性判斷,由此,與以往進(jìn)行比較,可高速進(jìn)行包含特定音響信號(hào)的區(qū)間的檢測。本發(fā)明的特定音響信號(hào)含有區(qū)間檢測系統(tǒng),在作為比參考信號(hào)長的音響信號(hào)的儲(chǔ)存信號(hào)中檢測包含與特定音響信號(hào)即參考信號(hào)相似的聲音的區(qū)間,其特征在于,具有參考信號(hào)頻譜圖分割部,將作為參考信號(hào)的時(shí)間頻率頻譜圖的參考信號(hào)頻譜圖分割成稱為小區(qū)域參考信號(hào)頻譜圖的小區(qū)域的頻譜圖;小區(qū)域參考信號(hào)頻譜圖代碼化部,對(duì)小區(qū)域參考信號(hào)頻譜圖進(jìn)行代碼化,作為參考信號(hào)小區(qū)域代碼;小區(qū)域儲(chǔ)存信號(hào)頻譜圖代碼化部,將作為儲(chǔ)存信號(hào)的時(shí)間頻譜圖的儲(chǔ)存信號(hào)頻譜圖中的、作為小區(qū)域的頻譜圖的小區(qū)域儲(chǔ)存信號(hào)頻譜圖進(jìn)行代碼化,作為儲(chǔ)存信號(hào)小區(qū)域代碼;相似小區(qū)域頻譜圖檢測部,根據(jù)代碼的相似度,從小區(qū)域儲(chǔ)存信號(hào)頻譜圖中檢測出與各小區(qū)域參考信號(hào)頻譜圖相似的小區(qū)域頻譜圖;區(qū)間相似度計(jì)算部,使用與小區(qū)域參考信號(hào)頻譜圖和與其相似的小區(qū)域儲(chǔ)存信號(hào)頻譜圖之間的小區(qū)域相似度,計(jì)算包含該小區(qū)域儲(chǔ)存信號(hào)頻譜圖的儲(chǔ)存信號(hào)的區(qū)間和參考信號(hào)的相似度;根據(jù)區(qū)間相似度,檢測儲(chǔ)存信號(hào)中包含的與參考信號(hào)相似的聲音的區(qū)間。
      因此,相對(duì)于以往技術(shù)根據(jù)直方圖重疊率來判斷兩個(gè)小區(qū)域頻譜圖的相似性,本發(fā)明對(duì)2個(gè)小區(qū)域頻譜圖進(jìn)行代碼化,僅檢測相似性,因此,與以往例相比,能夠大幅度地削減運(yùn)算量,可高速地進(jìn)行特定音響信號(hào)含有區(qū)間的檢測。
      在本發(fā)明的第1、2及3方面,小區(qū)域參考信號(hào)頻譜圖代碼化部以及小區(qū)域儲(chǔ)存信號(hào)頻譜圖代碼化部,對(duì)各小區(qū)域頻譜圖分配代碼(稱為小區(qū)域代碼),相似小區(qū)域頻譜圖檢測部根據(jù)上述小區(qū)域代碼的相似度,檢測與所述各區(qū)域參考信號(hào)頻譜圖相似的小區(qū)域儲(chǔ)存信號(hào)頻譜圖。即,僅根據(jù)小區(qū)域代碼的相似性來判斷兩個(gè)小區(qū)域頻譜圖的相似性。
      由此,本發(fā)明的特定音響信號(hào)含有區(qū)間檢測系統(tǒng)與計(jì)算直方圖重疊率的以往例相比較,無需進(jìn)行直方圖的計(jì)數(shù)處理等,從而能夠大幅度地削減運(yùn)算量,可更高速地進(jìn)行兩個(gè)小區(qū)域頻譜圖的相似性判斷,縮短特定音響信號(hào)含有區(qū)間檢測的時(shí)間。
      在本發(fā)明的第4方面,小區(qū)域參考信號(hào)頻譜圖代碼化部和小區(qū)域儲(chǔ)存信號(hào)頻譜圖代碼化部,作成各小區(qū)域頻譜圖的小區(qū)域代碼,相似小區(qū)域頻譜圖檢測部,根據(jù)小區(qū)域代碼的相似度,按順序?qū)λ龈餍^(qū)域參考信號(hào)頻譜圖與各小區(qū)域儲(chǔ)存信號(hào)頻譜圖進(jìn)行比較,僅檢測相似的小區(qū)域儲(chǔ)存信號(hào)頻譜圖,該各小區(qū)域儲(chǔ)存信號(hào)頻譜圖是將對(duì)應(yīng)頻帶的小區(qū)域儲(chǔ)存信號(hào)頻譜圖按時(shí)間順序排列的列表。
      由此,本發(fā)明的特定音響信號(hào)含有區(qū)間檢測系統(tǒng)與計(jì)算直方圖重疊率的以往例相比較,無需進(jìn)行直方圖的計(jì)數(shù)處理等,從而能夠大幅度地削減運(yùn)算量,可更高速地進(jìn)行兩個(gè)小區(qū)域頻譜圖的相似性判斷,縮短特定音響信號(hào)含有區(qū)間檢測的時(shí)間。
      在本發(fā)明的第5及6方面,小區(qū)域參考信號(hào)頻譜圖代碼化部和小區(qū)域儲(chǔ)存信號(hào)頻譜圖代碼化部,作成各小區(qū)域頻譜圖的小區(qū)域代碼,相似小區(qū)域頻譜圖檢測部,對(duì)所述各小區(qū)域參考信號(hào)頻譜圖,按每個(gè)對(duì)應(yīng)頻帶的小區(qū)域儲(chǔ)存信號(hào)頻譜圖的各小區(qū)域代碼,準(zhǔn)備索引,該索引是表示了具有該小區(qū)域代碼的小區(qū)域儲(chǔ)存信號(hào)頻譜圖在儲(chǔ)存信號(hào)中出現(xiàn)的時(shí)刻的列表。另外,事先計(jì)算全部的小區(qū)域代碼間的相似度并作成表,對(duì)其進(jìn)行參考,由此,取出與小區(qū)域參考頻譜圖的小區(qū)域代碼相似的小區(qū)域符號(hào),進(jìn)而通過參考所述索引,檢測出與該小區(qū)域參考信號(hào)頻譜圖相似的小區(qū)域儲(chǔ)存信號(hào)頻譜圖。
      由此,本發(fā)明的特定音響信號(hào)含有區(qū)間檢測系統(tǒng)與計(jì)算直方圖重疊率的相比較,可更高速地進(jìn)行兩個(gè)小區(qū)域頻譜圖的相似性判斷,并且,如以往例那樣,由于對(duì)于不相似的兩個(gè)小區(qū)域頻譜圖不進(jìn)行比對(duì),能夠省略無相似的可能性的小區(qū)域頻譜圖間的相似性判斷,可更高速地進(jìn)行特定音響信號(hào)含有區(qū)間檢測。


      圖1是表示本發(fā)明的一實(shí)施例的特定音響信號(hào)含有區(qū)間檢測系統(tǒng)的一個(gè)構(gòu)成例的框圖。
      圖2是說明圖1的特定聲音含有區(qū)間檢測系統(tǒng)的處理的概念圖。
      圖3是表示按每個(gè)小區(qū)域代碼對(duì)使其相似度對(duì)應(yīng)的小區(qū)域代碼間相似度表的結(jié)構(gòu)的概念圖。
      圖4是表示按每個(gè)小區(qū)域代碼將儲(chǔ)存信號(hào)小區(qū)域頻譜圖的出現(xiàn)時(shí)刻一覽化的索引的概念圖。
      圖5是表示圖1所示的特定音響信號(hào)含有區(qū)間檢測系統(tǒng)的動(dòng)作例的流程圖。
      圖6是說明特定音響信號(hào)含有區(qū)間檢測的概要的概念圖。
      圖7是說明以往例中的分割一致搜索法的概要的概念圖。
      圖8是用于說明TAS(時(shí)序主動(dòng)搜索法)的概念圖。
      具體實(shí)施例方式
      以下,參考

      本發(fā)明的優(yōu)選實(shí)施例。但是,本發(fā)明并不限定于以下的各實(shí)施例,例如也可以使這些實(shí)施例的構(gòu)成要素間的適當(dāng)組合。
      圖1是表示本發(fā)明的特定音響信號(hào)含有區(qū)間檢測系統(tǒng)的一實(shí)施例的框圖。圖1所示的特定音響信號(hào)含有區(qū)間檢測系統(tǒng),是在比稱為儲(chǔ)存信號(hào)的參考信號(hào)長的音響信號(hào)中檢測包含與稱為參考信號(hào)的某個(gè)特定的音響信號(hào)相似的聲音的區(qū)間的系統(tǒng),具體地說,是在具有CPU(Central Processing Unit中央處理器)或儲(chǔ)存器的普通的計(jì)算機(jī)上實(shí)現(xiàn)。
      在該圖中,小區(qū)域儲(chǔ)存信號(hào)頻譜圖代碼化部101對(duì)作為上述儲(chǔ)存信號(hào)的時(shí)間頻率頻譜圖的儲(chǔ)存信號(hào)頻譜圖中的、作為小區(qū)域頻譜圖的小區(qū)域儲(chǔ)存信號(hào)頻譜圖進(jìn)行代碼化,并作為儲(chǔ)存信號(hào)小區(qū)域代碼進(jìn)行輸出。
      相似小區(qū)域頻譜圖檢測部102具有如下功能在內(nèi)部對(duì)小區(qū)域儲(chǔ)存信號(hào)頻譜圖的出現(xiàn)時(shí)刻進(jìn)行索引化;通過參考索引,檢測與小區(qū)域參考信號(hào)頻譜圖相似的小區(qū)域儲(chǔ)存信號(hào)頻譜圖。即前者通過從小區(qū)域儲(chǔ)存信號(hào)頻譜圖代碼化部101輸入的儲(chǔ)存信號(hào)小區(qū)域代碼,取代進(jìn)行區(qū)間檢測,詳細(xì)地檢測出小區(qū)域的頻譜圖的相似性,是抽出進(jìn)行區(qū)間檢測的時(shí)刻用的前處理,具體地說,生成圖4所示的索引。
      后者用事先作成的小區(qū)域代碼相似度表(圖3)抽出與參考信號(hào)小區(qū)域代碼相似的小區(qū)域代碼,通過索引檢測出具有該小區(qū)域代碼的小區(qū)域參考信號(hào)頻譜圖,并輸出該出現(xiàn)時(shí)刻和小區(qū)域相似度。
      參考信號(hào)頻譜圖分割部103將作為上述參考信號(hào)(被檢測信號(hào))的時(shí)間頻率頻譜圖的參考信號(hào)頻譜圖分割成稱為小區(qū)域參考信號(hào)頻譜圖的小區(qū)域的頻譜圖。
      小區(qū)域參考信號(hào)頻譜圖代碼化部104對(duì)上述小區(qū)域參考信號(hào)頻譜圖進(jìn)行代碼化,并作為參考信號(hào)小區(qū)域代碼進(jìn)行輸出。
      區(qū)間相似度計(jì)算部105使用在相似小區(qū)域頻譜圖檢測部102中所檢測出的小區(qū)域參考信號(hào)頻譜圖和與其相似的小區(qū)域儲(chǔ)存信號(hào)頻譜圖間的相似度(小區(qū)域相似度),計(jì)算包含該相似的小區(qū)域儲(chǔ)存信號(hào)頻譜圖的儲(chǔ)存信號(hào)的區(qū)間信號(hào)和參考信號(hào)的相似度(區(qū)間相似度)。
      相似區(qū)域檢測部106根據(jù)上述區(qū)間相似度檢測包含與儲(chǔ)存信號(hào)中的參考信號(hào)相似的區(qū)域。
      其次,參考圖1及圖2,對(duì)本發(fā)明的一實(shí)施方式的特定音響信號(hào)含有區(qū)間檢測系統(tǒng)的處理進(jìn)行說明。圖2是說明本發(fā)明的特定聲音含有區(qū)間檢測的處理過程的概念圖。
      未圖示的儲(chǔ)存信號(hào)頻譜圖抽出部及參考信號(hào)頻譜圖抽出部讀入各自的儲(chǔ)存信號(hào)、參考信號(hào)的各聲音波形信號(hào),分別抽出功率頻譜,作為儲(chǔ)存信號(hào)頻譜圖、參考信號(hào)頻譜圖進(jìn)行輸出。
      并且,如圖2的步驟(a)所示,參考信號(hào)頻譜圖分割部103從參考信號(hào)頻譜圖中等間隔地切出固定尺寸(固定時(shí)間寬度)的小區(qū)域頻譜圖,作為小區(qū)域參考信號(hào)頻譜圖進(jìn)行輸出。
      此外,切出小區(qū)域參考信號(hào)頻譜圖時(shí),也可以在小區(qū)域參考信號(hào)頻譜圖間有疊加。
      在此,參考信號(hào)頻譜圖分割部103,通過在頻率軸方向以及時(shí)間軸方向上從原來的頻譜圖上切出各個(gè)固定個(gè)數(shù)的頻譜圖上的點(diǎn),由此,得到所述小區(qū)域參考信號(hào)頻譜圖。
      將上述的小區(qū)域頻譜圖稱為小區(qū)域頻譜(small-region spectrogram)。
      另外,以下將起始時(shí)刻為ti、頻帶為ωm的參考信號(hào)中的小區(qū)域頻譜圖表示為Fti,ωm。
      同樣,在儲(chǔ)存信號(hào)的頻譜圖中,將起始時(shí)刻為t、頻帶為ωm的與上述Fti,ωm尺寸相同的小區(qū)域頻譜圖表示為Gt,ωm。
      另外,在參考信號(hào)的頻譜圖中,設(shè)切出小區(qū)域頻譜圖Fti,ωm后的全部時(shí)刻ti的集合為TR(TR={t1,t2,…}),設(shè)全部頻帶ωm的集合為W(W={ω1,ω2,…})。此外,在此的W要素和TR的要素?cái)?shù)也可以分別為1。
      此外,為了吸收音量的變動(dòng),按各小區(qū)域頻譜圖將各小區(qū)域頻譜圖(小區(qū)域儲(chǔ)存信號(hào)頻譜圖及小區(qū)域參考信號(hào)頻譜圖)的功率頻譜進(jìn)行標(biāo)準(zhǔn)化。
      即,根據(jù)小區(qū)域頻帶內(nèi)的該時(shí)刻的功率頻譜值的平均值,對(duì)小區(qū)域內(nèi)的各時(shí)刻的功率頻譜值進(jìn)行標(biāo)準(zhǔn)化。
      其次,與在以往例的說明中所說明的分割一致搜索法相同,小區(qū)域參考信號(hào)頻譜圖代碼化部104從小區(qū)域參考信號(hào)頻譜圖Fti,ωm中抽出直方圖特征(雖然已經(jīng)在以往例的說明中進(jìn)行了敘述,但是,在對(duì)頻譜圖上的各時(shí)刻的頻譜特征進(jìn)行標(biāo)準(zhǔn)化的基礎(chǔ)上,通過矢量量子化進(jìn)行代碼化,對(duì)與代碼對(duì)應(yīng)的維值對(duì)各代碼的出現(xiàn)數(shù)進(jìn)行計(jì)數(shù),得到直方圖)。
      該直方圖特征是以直方圖的各維值的值(各矢量量子化代碼的小區(qū)域頻譜內(nèi)的出現(xiàn)次數(shù))為成分的特征矢量。
      并且,小區(qū)域參考信號(hào)頻譜圖代碼化部104,通過矢量量子化按每個(gè)頻帶對(duì)該直方圖特征進(jìn)行代碼化,進(jìn)行各小區(qū)域參考信號(hào)頻譜圖的代碼化。
      此外,在本發(fā)明中,矢量量子化是指將一個(gè)代碼分配給被給予的矢量的步驟。
      與根據(jù)小區(qū)域參考信號(hào)頻譜圖代碼化部104的小區(qū)域參考信號(hào)頻譜圖的代碼化相同,小區(qū)域儲(chǔ)存信號(hào)頻譜圖代碼化部101按各頻帶對(duì)各小區(qū)域儲(chǔ)存信號(hào)頻譜圖進(jìn)行代碼化。
      在各頻帶中對(duì)小區(qū)域頻譜圖進(jìn)行代碼化時(shí),小區(qū)域儲(chǔ)存信號(hào)頻譜圖代碼化部101和小區(qū)域參考信號(hào)頻譜圖代碼化部104使用相同的代碼薄。
      將在此得到的小區(qū)域頻譜圖的直方圖特征進(jìn)行代碼化后得到的代碼稱為小區(qū)域代碼(參考信號(hào)小區(qū)域代碼,儲(chǔ)存信號(hào)小區(qū)域代碼;這些按頻帶單位對(duì)直方圖進(jìn)行矢量量子化后的矢量量子化代碼),將小區(qū)域參考信號(hào)頻譜圖Fti,ωm的參考信號(hào)小區(qū)域代碼表示為c(Fti,ωm),將小區(qū)域儲(chǔ)存信號(hào)頻譜圖Gt,ωm的儲(chǔ)存信號(hào)小區(qū)域代碼表示為c(Gt,ωm)。
      并且,這些小區(qū)域頻譜圖的代碼化也可以是不使用直方圖,分別將小區(qū)域參考信號(hào)頻譜圖以及小區(qū)域儲(chǔ)存信號(hào)頻譜圖上的各時(shí)刻的功率譜值作為特征矢量,通過矢量量子化對(duì)這些特征矢量進(jìn)行代碼化,作為各個(gè)參考小區(qū)域代碼以及儲(chǔ)存信號(hào)小區(qū)域代碼(與方案2中記載的結(jié)構(gòu)對(duì)應(yīng))。
      此外,相似小區(qū)域頻譜圖檢測部102,將參考信號(hào)小區(qū)域代碼及儲(chǔ)存信號(hào)小區(qū)域代碼間的相似度作為小區(qū)域參考信號(hào)頻譜圖和小區(qū)域儲(chǔ)存信號(hào)頻譜之間的相似度,如圖2的步驟(b),對(duì)于各小區(qū)域參考信號(hào)頻譜圖Fti,ωm,從儲(chǔ)存信號(hào)頻譜圖中檢測出相似的小區(qū)域儲(chǔ)存信號(hào)頻譜圖。
      此外,如圖3所示,相似小區(qū)域頻譜圖檢測部102,按每個(gè)小區(qū)域代碼對(duì),在表上定義其相似度(小區(qū)域代碼間相似度)(相似小區(qū)域頻譜圖檢測部102使內(nèi)部的存儲(chǔ)部進(jìn)行存儲(chǔ)),通過參考該表(稱為小區(qū)域代碼間相似度表),可以得知參考信號(hào)小區(qū)域代碼和儲(chǔ)存信號(hào)小區(qū)域代碼間的相似度。
      圖3表示上述小區(qū)域代碼間相似度表的結(jié)構(gòu)。在該表中,υ(ωm,j,k)表示頻帶ωm中的小區(qū)域代碼q(ωm,j)以及小區(qū)域代碼q(ωm,k)之間的小區(qū)域代碼間相似度。
      此外,在此,頻帶ωm中的小區(qū)域代碼表示為q(ωm,1),q(ωm,2),…。
      并且,相似小區(qū)域頻譜圖檢測部102計(jì)算小區(qū)域代碼q(ωm,j)和q(ωm,k)的代表矢量間的距離,當(dāng)所計(jì)算出的距離較小時(shí)將較大的值設(shè)為υ(ωm,j,k),當(dāng)距離較大時(shí)設(shè)為較小的值為υ(ωm,j,k)。例如有使用歐幾里德距離(Euclidean distance)計(jì)算代表矢量間的距離的方法。
      此外,在本實(shí)施例中,將υ(ωm,j,k)定義為從0到1的實(shí)數(shù)值。即,在各頻帶ωm,進(jìn)行運(yùn)算使得距離最大時(shí)υ(ωm,j,k)為0、距離最小時(shí)υ(ωm,j,k)為1。
      并且,F(xiàn)ti,ωm和Gt,ωm的小區(qū)域相似度sP(Fti,ωm,Gt,ωm)定義為υ(ωm,c(Fti,ωm),c(Gt+ti,ωm))。
      在此,與Fti,ωm相似的小區(qū)域儲(chǔ)存信號(hào)頻譜圖是Fti,ωm和Gt,ωm的小區(qū)域相似度sP(Fti,ωm,Gt,ωm)超過所設(shè)定的小區(qū)域搜索閾值sPth那樣的小區(qū)域頻譜圖Gt,ωm。
      在此,例如為了閾值設(shè)定,事先在多個(gè)參考信號(hào)以及儲(chǔ)存信號(hào)中實(shí)驗(yàn)性地進(jìn)行測定,沒有相似區(qū)間的檢索遺漏,或者求出較少值,設(shè)定小區(qū)域搜索閾值sPth。
      此外,該sPth也可以在W的所有頻帶設(shè)定相同的值,還可以按頻帶設(shè)定不同的值。在本實(shí)施例中設(shè)定相同的值。
      即,如圖4所示,在相似小區(qū)域頻譜圖檢測部102中,按每個(gè)儲(chǔ)存信號(hào)頻譜圖的小區(qū)域代碼,使用對(duì)小區(qū)域儲(chǔ)存信號(hào)頻譜圖進(jìn)行分類后的索引,參考圖3所示的小區(qū)域代碼間相似度表,由此,檢測小區(qū)域儲(chǔ)存信號(hào)頻譜圖,該小區(qū)域儲(chǔ)存信號(hào)頻譜圖具有與參考信號(hào)小區(qū)域代碼c(Fti,ωm)相似的儲(chǔ)存信號(hào)小區(qū)域代碼,即與c(Fti,ωm)的小區(qū)域代碼間相似度超過小區(qū)域用搜索閾值sPth的小區(qū)域代碼。這是通過從圖4的索引參照具有小區(qū)域代碼的小區(qū)域儲(chǔ)存信號(hào)頻譜圖的出現(xiàn)位置(時(shí)刻)的列表來執(zhí)行的,所有該小區(qū)域代碼相對(duì)于各Fti,ωm,具有比小區(qū)域用搜索閾值sPth大的與c(Fti,ωm)間的小區(qū)域代碼間相似度。
      并且,在圖4的索引中,在儲(chǔ)存信號(hào)小區(qū)域代碼上具有q(ωm,j)的全部的小區(qū)域儲(chǔ)存信號(hào)頻譜圖的時(shí)刻作為按時(shí)序進(jìn)行排列的排列而存儲(chǔ)在q(ωm,j)指向的列表(時(shí)刻排列;橫向排列)上。
      此外,該相似小區(qū)域頻譜圖檢測部102,對(duì)于各小區(qū)域參考信號(hào)頻譜圖,根據(jù)小區(qū)域代碼的相似度,將相似的小區(qū)域儲(chǔ)存信號(hào)頻譜圖、對(duì)應(yīng)的頻帶的小區(qū)域儲(chǔ)存信號(hào)頻譜圖按時(shí)間順序排列的列表的各小區(qū)域儲(chǔ)存信號(hào)頻譜圖和該儲(chǔ)存信號(hào)頻譜圖按順序進(jìn)行比較,可僅檢測相似的小區(qū)域儲(chǔ)存信號(hào)頻譜圖(方案4記載的結(jié)構(gòu))。
      即,相似小區(qū)域頻譜圖檢測部102,對(duì)于上述各小區(qū)域參考信號(hào)頻譜圖,也可以根據(jù)小區(qū)域代碼的相似度,按順序和將對(duì)應(yīng)頻帶的小區(qū)域儲(chǔ)存信號(hào)頻譜圖按時(shí)間順序排列的列表的各小區(qū)域儲(chǔ)存信號(hào)頻譜圖進(jìn)行比較,僅檢測相似小區(qū)域儲(chǔ)存信號(hào)頻譜圖。
      區(qū)間相似度計(jì)算部105,根據(jù)小區(qū)域參考信號(hào)頻譜圖的參考信號(hào)中的出現(xiàn)時(shí)刻和與其相似的小區(qū)域儲(chǔ)存信號(hào)頻譜圖的儲(chǔ)存信號(hào)中的出現(xiàn)時(shí)刻的位置關(guān)系,求出對(duì)包含參考信號(hào)和該小區(qū)域儲(chǔ)存信號(hào)頻譜圖的儲(chǔ)存信號(hào)中的區(qū)間的相似度(區(qū)間相似度)進(jìn)行計(jì)算的區(qū)間開始時(shí)刻t。并且,如圖2(c)所示,統(tǒng)一上述各小區(qū)域相似度,根據(jù)以下的(7)式求出t時(shí)刻的與參考信號(hào)頻譜圖的相似度(區(qū)間相似度)S(t)。
      S(t)=1|TR||W|&Sigma;&omega;m&Element;W&Sigma;ti&Element;TR(sp(Fti,&omega;m,Gt+ti,&omega;m))---(7)]]>在此,|TR|表示時(shí)刻的集合TR的要素?cái)?shù)。|W|表示頻譜頻帶的集合W的要素?cái)?shù)。
      此外,計(jì)算區(qū)間相似度時(shí),在儲(chǔ)存信號(hào)的時(shí)刻t,當(dāng)Gt+ti,ωm沒有作為與Fti,ωm相似的小區(qū)域頻譜圖而被檢測出的情況下,即,如以下的(8)式所示,小區(qū)域相似度sP(Fti,ωm,Gt+ti,ωm)在小區(qū)域用搜索閾值sPth以下時(shí),將小區(qū)域相似度sP(Fti,ωm,Gt+ti,ωm)設(shè)為以下的(9)式。
      sP(Fti,ωm,Gt+ti,ωm)≤sPth …(8)[式9]sP(Fti,ωm,Gt+ti,ωm)=0 …(9)在實(shí)際的搜索中,區(qū)間相似度計(jì)算部105在使用圖3和圖4的索引檢索中,當(dāng)Gt+ti,ωm作為與Fti,ωm相似的小區(qū)域頻譜圖而被檢測出的情況下,即,在圖3中的小區(qū)域相似度sP(Fti,ωm,Gt+ti,ωm)超出了所設(shè)定的小區(qū)域用搜索閾值sPth時(shí),如圖(7)式所示,將sP(Fti,ω m,Gt+ti,ωm)累加到時(shí)刻t時(shí)的區(qū)間相似度S(t)上。并且,對(duì)于全部的小區(qū)域參考信號(hào)頻譜圖,當(dāng)與相似的小區(qū)域儲(chǔ)存信號(hào)頻譜圖的小區(qū)域相似度的累加結(jié)束時(shí),在各時(shí)刻t,將在t累加的結(jié)果用|TR|和|W|進(jìn)行除法運(yùn)算并進(jìn)行標(biāo)準(zhǔn)化,進(jìn)行求出t時(shí)刻的區(qū)間相似度S(t)。
      并且,相似區(qū)域檢測部106,根據(jù)如上所述得到的區(qū)間相似度S(t),在儲(chǔ)存信號(hào)頻譜圖中,將以區(qū)間相似度S(t)比搜索閾值Sth大的時(shí)刻t為起始的區(qū)間作為與參考信號(hào)頻譜圖相似的區(qū)間而檢測出。
      此時(shí),在相似區(qū)域檢測部106,上述搜索閾值Sth可以設(shè)定實(shí)驗(yàn)上或經(jīng)驗(yàn)上得到的值,另外,除此之外,能夠取得所得到的多個(gè)區(qū)間相似度S(t)的分布,進(jìn)行標(biāo)準(zhǔn)偏差的運(yùn)算,對(duì)于所得到的區(qū)間相似度S(t)的最大值,將-3σ的值作為搜索閾值Sth,來選擇相似的區(qū)間。
      該-3可變更為其他實(shí)驗(yàn)測定得到的值。
      其次,參考圖1及圖5,對(duì)本發(fā)明的特定音響信號(hào)含有區(qū)間檢測系統(tǒng)的動(dòng)作進(jìn)行說明。該圖5是表示圖1所示的特定音響信號(hào)含有區(qū)間檢測系統(tǒng)的動(dòng)作例的流程圖。
      圖1的小區(qū)域儲(chǔ)存信號(hào)頻譜圖代碼化部101從未圖示的儲(chǔ)存信號(hào)頻譜圖抽出部讀出儲(chǔ)存信號(hào)頻譜圖。
      并且,小區(qū)域儲(chǔ)存信號(hào)頻譜圖代碼化部101依次對(duì)儲(chǔ)存信號(hào)頻譜圖的小區(qū)域頻譜圖進(jìn)行代碼化。
      從小區(qū)域儲(chǔ)存信號(hào)頻譜圖代碼化部101向相似小區(qū)域頻譜圖檢測部102提供通過上述處理得到的儲(chǔ)存信號(hào)小區(qū)域代碼(步驟S1)。
      其次,相似小區(qū)域頻譜圖檢測部102將所供給的上述儲(chǔ)存信號(hào)小區(qū)域代碼進(jìn)行分類,生成圖4所示的索引(步驟S2)。
      并且,參考信號(hào)頻譜圖分割部103,例如從文件(記錄有由未圖示的參考信號(hào)頻譜圖抽出部生成的參考信號(hào)頻譜圖的文件)中讀入?yún)⒖夹盘?hào)頻譜圖。
      其次,參考信號(hào)頻譜圖分割部103,將這些分割成小區(qū)域參考信號(hào)頻譜圖,將分割后的小區(qū)域參考信號(hào)頻譜圖依次提供給小區(qū)域參考信號(hào)頻譜圖代碼化部104(步驟S3)。
      并且,小區(qū)域參考信號(hào)頻譜圖代碼化部104依次對(duì)小區(qū)域參考信號(hào)頻譜圖進(jìn)行代碼化,將得到的參考信號(hào)小區(qū)域代碼c(Fti,ωm)和在該參考信號(hào)上的時(shí)刻ti提供給相似小區(qū)域頻譜圖檢測部102(步驟S4)。
      其次,相似小區(qū)域頻譜圖檢測部102,對(duì)于小區(qū)域參考信號(hào)頻譜圖,參考存儲(chǔ)在內(nèi)部的圖3的小區(qū)域代碼間相似度表,將對(duì)應(yīng)的小區(qū)域代碼間相似度(小區(qū)域相似度)和小區(qū)域用搜索閾值進(jìn)行比較,取出超過該小區(qū)域用搜索閾值的小區(qū)域代碼。并且,用圖4的索引檢索該小區(qū)域代碼在儲(chǔ)存信號(hào)中出現(xiàn)的時(shí)刻t+ti。
      進(jìn)而,基于具有相似的小區(qū)域代碼的小區(qū)域儲(chǔ)存信號(hào)頻譜圖的出現(xiàn)位置t+ti,求出與參考信號(hào)相似的儲(chǔ)存信號(hào)的區(qū)間開始時(shí)刻t,使該小區(qū)域代碼間相似度(即小區(qū)域相似度)對(duì)應(yīng)于t并提供給區(qū)間相似度計(jì)算部105(步驟S5)。
      并且,區(qū)間相似度計(jì)算部105,將小區(qū)域參考信號(hào)頻譜圖(Fti,ωm)和與其相似的小區(qū)域儲(chǔ)存信號(hào)頻譜圖(Gt+ti,ωm)間的小區(qū)域相似度sP累加到時(shí)刻t的區(qū)間相似度上(步驟S6)。
      此時(shí),區(qū)間相似度計(jì)算部105判斷是否從小區(qū)域參考信號(hào)頻譜圖代碼化部104對(duì)于全部的小區(qū)域參考信號(hào)頻譜圖供給參考信號(hào)小區(qū)域代碼、步驟S5及S6的處理是否已經(jīng)結(jié)束(步驟S7)。
      并且,區(qū)間相似度計(jì)算部105判斷為對(duì)于全部的小區(qū)域參考信號(hào)頻譜圖已經(jīng)結(jié)束時(shí),處理進(jìn)入步驟S8,當(dāng)判斷為沒有結(jié)束時(shí),處理進(jìn)行步驟S5。
      其次,區(qū)間相似度計(jì)算部105,用(7)式將累加后的各時(shí)刻的區(qū)間相似度以所提供的小區(qū)域參考信號(hào)頻譜圖的數(shù)目相除并進(jìn)行標(biāo)準(zhǔn)化(步驟S8)。
      并且,相似區(qū)域區(qū)間檢測部106,使得在標(biāo)準(zhǔn)化后的區(qū)間相似度比搜索閾值Sth大的、以時(shí)刻t為起始的區(qū)間存在參考信號(hào),輸出該時(shí)刻t,結(jié)束處理(步驟S9)。
      另外,相似區(qū)域區(qū)間檢測部106也可以不輸出超過搜索閾值的多個(gè)區(qū)間,而僅輸出超過搜索閾值、具有最大區(qū)間相似度的區(qū)間。
      其次,對(duì)使用上述實(shí)施例進(jìn)行的實(shí)驗(yàn)例進(jìn)行說明。
      將上述實(shí)施例和作為以往技術(shù)的分割一致搜索法安裝到以下所示規(guī)格的個(gè)人計(jì)算機(jī)上,測量檢測速度,將實(shí)施例和以往例進(jìn)行比較。
      CPU使用Intel(注冊(cè)商標(biāo))Xeon(注冊(cè)商標(biāo))3.2GHz,OS使用REDHAT(注冊(cè)商標(biāo))Linux(注冊(cè)商標(biāo))9,編譯器使用GNU gcc。
      在此,執(zhí)行文件通過編譯器最佳化選項(xiàng)“-O3”進(jìn)行編譯。
      另外,在本試驗(yàn)中,設(shè)頻率的頻帶數(shù)|W|為4,在從525Hz到2000Hz的頻帶上,將在對(duì)數(shù)軸上等間隔配置的28個(gè)帶通濾波器的每2毫秒的輸出的頻譜圖,沿頻率軸方向分割成4個(gè)頻帶。
      此時(shí),作為小區(qū)域參考信號(hào)頻譜圖,在上述各頻率頻帶上每隔0.6秒抽出長度100毫秒的頻譜。
      并且,在實(shí)驗(yàn)中,從約30分鐘的音響信號(hào)(儲(chǔ)存信號(hào))中,作為約15秒的音樂斷片(參考信號(hào)),檢測出100個(gè),測量各參考信號(hào)的檢測所需要的時(shí)間的平均值(檢測時(shí)間)。
      實(shí)驗(yàn)的結(jié)果,作為平均的檢測時(shí)間,在以往的方法中大約需要0.58秒,在上述本發(fā)明的實(shí)施例中小于0.01秒,在單純的計(jì)算中,可進(jìn)行約70倍的高速檢測。
      此外,此時(shí)儲(chǔ)存信號(hào)是音樂信號(hào)和聲音信號(hào)以功率比(音樂信號(hào)的功率/聲音信號(hào)的功率)為平均5dB進(jìn)行混合后的信號(hào),此時(shí)搜索精度在以往方法為99.9%(參考特開2004-102023“特定音響信號(hào)檢測方法、信號(hào)檢測裝置、信號(hào)檢測程序及記錄介質(zhì)”),在本實(shí)施例中是99.0%,判斷為搜索精度相同。
      此外,也可以通過將用于實(shí)現(xiàn)圖1中特定音響信號(hào)含有區(qū)間檢測系統(tǒng)的功能的程序記錄到計(jì)算機(jī)可讀取的記錄介質(zhì)上,計(jì)算機(jī)系統(tǒng)讀入并執(zhí)行記錄在該記錄介質(zhì)上的程序,從而進(jìn)行特定音響信號(hào)含有區(qū)間檢測的處理。在此所說的“計(jì)算機(jī)系統(tǒng)”是包含OS或外圍設(shè)備等硬件的總稱。另外,“計(jì)算機(jī)系統(tǒng)”也包含具備主頁提供環(huán)境(或者顯示環(huán)境)的WWW系統(tǒng)。另外,“計(jì)算機(jī)可讀取的記錄介質(zhì)”是指軟盤、磁光盤、ROM、CD-ROM等可移動(dòng)介質(zhì)、內(nèi)置于計(jì)算機(jī)系統(tǒng)的硬盤等存儲(chǔ)裝置。進(jìn)而,“計(jì)算機(jī)可讀取的記錄介質(zhì)”還包括如經(jīng)因特網(wǎng)等網(wǎng)絡(luò)或電話線等通信線路發(fā)送程序的情況下成為服務(wù)器或客戶端的計(jì)算機(jī)系統(tǒng)內(nèi)部的非易失性存儲(chǔ)器(RAM)那樣將程序保持固定時(shí)間的介質(zhì)。
      另外,上述程序也可以從在存儲(chǔ)裝置等中存儲(chǔ)該程序的計(jì)算機(jī)系統(tǒng)經(jīng)傳送介質(zhì)或者傳送介質(zhì)中的傳送波,傳送到其他的計(jì)算機(jī)系統(tǒng)。在此,傳送程序的“傳送介質(zhì)”是指如因特網(wǎng)等網(wǎng)絡(luò)(通信網(wǎng))或電話線等通信線路(通信線)那樣,具有傳送信息的功能的介質(zhì)。另外,上述程序也可以是實(shí)現(xiàn)上述功能的一部分的程序。進(jìn)而,也可以是將上述功能與已經(jīng)記錄在計(jì)算機(jī)系統(tǒng)上的程序進(jìn)行組合來實(shí)現(xiàn)的文件即所謂的差分文件(差分程序)。
      工業(yè)上的可適用性相對(duì)以往技術(shù)根據(jù)直方圖重疊率判斷兩個(gè)小區(qū)域頻譜圖的相似性,本發(fā)明對(duì)兩個(gè)小區(qū)域頻譜圖進(jìn)行代碼化,通過索引僅檢測相似性,從而與以往例比較,可以大幅度地削減運(yùn)算量,高速地進(jìn)行特定音響信號(hào)含有區(qū)間的檢測。
      權(quán)利要求
      1.一種特定音響信號(hào)含有區(qū)間檢測系統(tǒng),在儲(chǔ)存信號(hào)中檢測包含與作為特定音響信號(hào)的參考信號(hào)相似的聲音的區(qū)間,其特征在于,具有參考信號(hào)頻譜圖分割部,將作為所述參考信號(hào)的時(shí)間頻率頻譜圖的參考信號(hào)頻譜圖分割成稱為小區(qū)域參考信號(hào)頻譜圖的小區(qū)域的頻譜圖;小區(qū)域參考信號(hào)頻譜圖代碼化部,對(duì)所述小區(qū)域參考信號(hào)頻譜圖進(jìn)行代碼化,作為參考信號(hào)小區(qū)域代碼;小區(qū)域儲(chǔ)存信號(hào)頻譜圖代碼化部,將作為所述儲(chǔ)存信號(hào)的時(shí)間頻率頻譜圖的儲(chǔ)存信號(hào)頻譜圖中的、作為小區(qū)域的頻譜圖的小區(qū)域儲(chǔ)存信號(hào)頻譜圖進(jìn)行代碼化,作為儲(chǔ)存信號(hào)小區(qū)域代碼;相似小區(qū)域頻譜圖檢測部,根據(jù)代碼的相似度,從所述小區(qū)域儲(chǔ)存信號(hào)頻譜圖中檢測與所述各小區(qū)域參考信號(hào)頻譜圖相似的小區(qū)域頻譜圖;區(qū)間相似度計(jì)算部,在檢測出的儲(chǔ)存信號(hào)頻譜圖中,使用與小區(qū)域參考信號(hào)頻譜圖相似的小區(qū)域儲(chǔ)存信號(hào)頻譜圖的小區(qū)域相似度,計(jì)算包含該小區(qū)域儲(chǔ)存信號(hào)頻譜圖的儲(chǔ)存信號(hào)的區(qū)間和參考信號(hào)的相似度,根據(jù)所述區(qū)間相似度,檢測儲(chǔ)存信號(hào)中包含的與參考信號(hào)相似的聲音的區(qū)間。
      2.根據(jù)權(quán)利要求1記載的特定音響信號(hào)含有區(qū)間檢測系統(tǒng),其特征在于小區(qū)域參考信號(hào)頻譜圖代碼化部以及小區(qū)域儲(chǔ)存信號(hào)頻譜圖代碼化部,將小區(qū)域頻譜圖上的各點(diǎn)的功率頻譜值設(shè)為特征矢量,根據(jù)矢量量子化,分別對(duì)這些特征矢量進(jìn)行代碼化,分別作為參考信號(hào)小區(qū)域代碼、儲(chǔ)存信號(hào)小區(qū)域代碼。
      3.根據(jù)權(quán)利要求1記載的特定音響信號(hào)含有區(qū)間檢測系統(tǒng),其特征在于小區(qū)域參考信號(hào)頻譜圖代碼化部以及小區(qū)域儲(chǔ)存信號(hào)頻譜圖代碼化部,根據(jù)矢量量子化,對(duì)小區(qū)域頻譜圖上的各時(shí)刻的頻譜特征進(jìn)行代碼化,作成按每個(gè)代碼對(duì)這些代碼的小區(qū)域頻譜圖內(nèi)的出現(xiàn)次數(shù)進(jìn)行計(jì)數(shù)的直方圖,生成以該直方圖的各維值的值為成分的作為特征矢量的直方圖特征,進(jìn)而根據(jù)矢量量子化對(duì)該直方圖特征進(jìn)行代碼化,分別作為參考信號(hào)小區(qū)域代碼、儲(chǔ)存信號(hào)小區(qū)域代碼。
      4.根據(jù)權(quán)利要求1至3任意一項(xiàng)記載的特定音響信號(hào)含有區(qū)間檢測系統(tǒng),其特征在于相似小區(qū)域頻譜圖檢測部,根據(jù)小區(qū)域代碼的相似度,按順序?qū)λ龈餍^(qū)域參考信號(hào)頻譜圖與各小區(qū)域儲(chǔ)存信號(hào)頻譜圖進(jìn)行比較,僅檢測相似的小區(qū)域儲(chǔ)存信號(hào)頻譜圖,該各小區(qū)域儲(chǔ)存信號(hào)頻譜圖是將對(duì)應(yīng)頻帶的小區(qū)域儲(chǔ)存信號(hào)頻譜圖按時(shí)間順序排列的列表。
      5.根據(jù)權(quán)利要求1至3任意一項(xiàng)記載的特定音響信號(hào)含有區(qū)間檢測系統(tǒng),其特征在于還具有小區(qū)域代碼間相似度表作成功能,對(duì)于所述小區(qū)域頻譜圖代碼化而得到的小區(qū)域代碼,事先計(jì)算全部的小區(qū)域代碼間的相似度,作成小區(qū)域代碼間相似度表,所述相似小區(qū)域頻譜圖檢測部,通過參考該小區(qū)域代碼間相似度表,判斷所述小區(qū)域參考信號(hào)頻譜圖和所述小區(qū)域儲(chǔ)存信號(hào)頻譜圖的相似性。
      6.根據(jù)權(quán)利要求5所述的特定音響信號(hào)含有區(qū)間檢測系統(tǒng),其特征在于還具有索引作成功能,對(duì)于各頻帶的所述小區(qū)域儲(chǔ)存信號(hào)頻譜圖,使用所述小區(qū)域代碼作成對(duì)儲(chǔ)存信號(hào)中的出現(xiàn)時(shí)刻進(jìn)行分類的索引,所述相似小區(qū)域頻譜圖檢測部,使用與參考信號(hào)小區(qū)域代碼相似的小區(qū)域代碼,參考所述索引,將具有所選擇的小區(qū)域代碼的小區(qū)域儲(chǔ)存信號(hào)頻譜圖作為與小區(qū)域參考信號(hào)頻譜圖相似的小區(qū)域儲(chǔ)存信號(hào)頻譜圖進(jìn)行檢測,該參考信號(hào)小區(qū)域代碼是通過參考所述小區(qū)域代碼間相似度表而選擇的。
      7.一種特定音響信號(hào)含有區(qū)間檢測方法,在儲(chǔ)存信號(hào)中檢測包含與作為特定音響信號(hào)的參考信號(hào)相似的聲音的區(qū)間,其特征在于,具有如下步驟參考信號(hào)頻譜圖分割步驟,將作為所述參考信號(hào)的時(shí)間頻率頻譜圖的參考信號(hào)頻譜圖分割成稱為小區(qū)域參考信號(hào)頻譜圖的小區(qū)域的頻譜圖;小區(qū)域參考信號(hào)頻譜圖代碼化步驟,對(duì)所述小區(qū)域參考信號(hào)頻譜圖進(jìn)行代碼化,作為參考信號(hào)小區(qū)域代碼;小區(qū)域儲(chǔ)存信號(hào)頻譜圖代碼化步驟,將作為所述儲(chǔ)存信號(hào)的時(shí)間頻率頻譜圖的儲(chǔ)存信號(hào)頻譜圖中的、作為小區(qū)域的頻譜圖的小區(qū)域儲(chǔ)存信號(hào)頻譜圖進(jìn)行代碼化,作為儲(chǔ)存信號(hào)小區(qū)域代碼;相似小區(qū)域頻譜圖檢測步驟,根據(jù)代碼的相似度,從所述小區(qū)域儲(chǔ)存信號(hào)頻譜圖中檢測出與所述各小區(qū)域參考信號(hào)頻譜圖相似的小區(qū)域頻譜圖;區(qū)間相似度計(jì)算步驟,在所檢測出的儲(chǔ)存信號(hào)頻譜圖中,使用與小區(qū)域參考信號(hào)頻譜圖相似的小區(qū)域頻譜圖的小區(qū)域相似度,計(jì)算包含該小區(qū)域頻譜圖的儲(chǔ)存信號(hào)的區(qū)間與參考信號(hào)之間的相似度,根據(jù)所述區(qū)間相似度,檢測儲(chǔ)存信號(hào)中包含的與參考信號(hào)相似的聲音的區(qū)間。
      8.根據(jù)權(quán)利要求7記載的特定音響信號(hào)含有區(qū)間檢測方法,其特征在于在小區(qū)域參考信號(hào)頻譜圖代碼化步驟以及小區(qū)域儲(chǔ)存信號(hào)頻譜圖代碼化步驟中,設(shè)小區(qū)域頻譜圖上的各點(diǎn)的功率值為特征矢量,根據(jù)矢量量子化,分別對(duì)這些特征矢量進(jìn)行代碼化,分別作為參考信號(hào)小區(qū)域代碼、儲(chǔ)存信號(hào)小區(qū)域代碼。
      9.根據(jù)權(quán)利要求7記載的特定音響信號(hào)含有區(qū)間檢測方法,其特征在于在小區(qū)域參考信號(hào)頻譜圖代碼化步驟以及小區(qū)域儲(chǔ)存信號(hào)頻譜圖代碼化步驟中,根據(jù)矢量量子化,對(duì)小區(qū)域頻譜圖上的各時(shí)刻的頻譜特征進(jìn)行代碼化,作成按每個(gè)代碼對(duì)這些代碼的小區(qū)域頻譜圖內(nèi)的出現(xiàn)次數(shù)進(jìn)行計(jì)數(shù)的直方圖,生成以該直方圖的各維值的值為成分的作為特征矢量的直方圖特征,進(jìn)而根據(jù)矢量量子化對(duì)該直方圖特征進(jìn)行代碼化,分別作為參考信號(hào)小區(qū)域代碼、儲(chǔ)存信號(hào)小區(qū)域代碼。
      10.根據(jù)權(quán)利要求7至9任意一項(xiàng)記載的特定音響信號(hào)含有區(qū)間檢測方法,其特征在于在相似小區(qū)域頻譜圖檢測步驟中,根據(jù)小區(qū)域代碼的相似度,按順序?qū)λ龈餍^(qū)域參考信號(hào)頻譜圖與各小區(qū)域儲(chǔ)存信號(hào)頻譜圖進(jìn)行比較,僅檢測相似的小區(qū)域儲(chǔ)存信號(hào)頻譜圖,該各小區(qū)域儲(chǔ)存信號(hào)頻譜圖是將對(duì)應(yīng)頻帶的小區(qū)域儲(chǔ)存信號(hào)頻譜圖按時(shí)間順序排列的列表。
      11.根據(jù)權(quán)利要求7至9任意一項(xiàng)記載的特定音響信號(hào)含有區(qū)間檢測方法,其特征在于還具有如下步驟,對(duì)于所述小區(qū)域頻譜圖代碼化而得到的小區(qū)域代碼,事先計(jì)算全部的小區(qū)域代碼間的相似度,作成小區(qū)域代碼間相似度表,在所述相似小區(qū)域頻譜圖檢測步驟中,通過參考該小區(qū)域代碼間相似度表,判斷所述小區(qū)域參考信號(hào)頻譜圖與所述小區(qū)域儲(chǔ)存信號(hào)頻譜圖之間的相似性。
      12.根據(jù)權(quán)利要求11記載的特定音響信號(hào)含有區(qū)間檢測方法,其特征在于還具有索引作成步驟,對(duì)于各頻帶的所述小區(qū)域儲(chǔ)存信號(hào)頻譜圖,使用所述小區(qū)域代碼作成對(duì)儲(chǔ)存信號(hào)中的出現(xiàn)時(shí)刻進(jìn)行分類后的索引,在所述相似小區(qū)域頻譜圖檢測步驟中,使用與參考信號(hào)小區(qū)域代碼相似的小區(qū)域代碼,參考所述索引,將具有所選擇的小區(qū)域代碼的小區(qū)域儲(chǔ)存信號(hào)頻譜圖作為與小區(qū)域參考信號(hào)頻譜圖相似的小區(qū)域儲(chǔ)存信號(hào)頻譜圖進(jìn)行檢測,該參考信號(hào)小區(qū)域代碼是通過參考所述小區(qū)域代碼間相似度表而選擇的。
      13.一種特定音響信號(hào)含有區(qū)間檢測處理程序,該程序使計(jì)算機(jī)作為權(quán)利要求1至6的任意一項(xiàng)記載的特定音響信號(hào)含有區(qū)間檢測系統(tǒng)而起作用。
      14.一種計(jì)算機(jī)可讀取的記錄介質(zhì),其記錄了權(quán)利要求13記載的特定音響信號(hào)含有區(qū)間檢測處理程序。
      全文摘要
      本發(fā)明是在儲(chǔ)存信號(hào)中檢測包含與參考信號(hào)相似的區(qū)間的特定音響信號(hào)含有區(qū)間檢測系統(tǒng)。具有參考信號(hào)頻譜圖分割部,將參考信號(hào)頻譜圖分割成小區(qū)域參考信號(hào)頻譜圖;小區(qū)域參考信號(hào)頻譜圖代碼化部,對(duì)小區(qū)域參考信號(hào)頻譜圖進(jìn)行代碼化,作為參考信號(hào)小區(qū)域代碼;小區(qū)域儲(chǔ)存信號(hào)頻譜圖代碼化部,對(duì)小區(qū)域儲(chǔ)存信號(hào)頻譜圖進(jìn)行代碼化,作為儲(chǔ)存信號(hào)小區(qū)域代碼;相似小區(qū)域頻譜圖檢測部,通過代碼相似度求出和小區(qū)域參考信號(hào)頻譜圖相似的小區(qū)域頻譜圖;區(qū)間相似度計(jì)算部,用小區(qū)域相似度,求出儲(chǔ)存信號(hào)的區(qū)間和參考信號(hào)的相似度。
      文檔編號(hào)G10L15/10GK1910651SQ20058000249
      公開日2007年2月7日 申請(qǐng)日期2005年7月1日 優(yōu)先權(quán)日2004年7月1日
      發(fā)明者永野秀尚, 黑住隆行, 柏野邦夫 申請(qǐng)人:日本電信電話株式會(huì)社
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1