專利名稱:增益控制裝置和增益控制方法、聲音輸出裝置的制作方法
技術領域:
本發(fā)明涉及增益控制裝置和增益控制方法、以及聲音輸出裝置,例如涉及在音響信號中包含聲音信號時進行放大處理的增益控制裝置和增益控制方法、以及聲音輸出裝置。
背景技術:
觀眾從電視機等收看包含講話或會話的內容時,多數(shù)情況下觀眾將會話調整到容易聽到的音量再收看。然而,如果內容變化,則所收錄的聲音級別也會變化。此外,由于即使在同一內容中,也根據(jù)說話人的性別、年齡、聲音性質等,實際聽到的講話或會話的音量感將變得不同,因此每次難以聽到會話時,觀眾就要調整音量?;谶@種背景,為了容易聽到內容中的會話而提出了各種技術。例如,提出的技術有在輸入信號中生成聲音頻帶信號,并利用AGC進行校正(參照專利文獻1)。該技術利用聲音頻帶BPF對輸入信號進行頻帶分割,并生成聲音頻帶信號。而且,檢測出聲音頻帶信號在一定時間內的最大振幅值,并生成進行了與此相對應的振幅控制的強調聲音頻帶信號。 然后,將對輸入信號進行了 AGC壓縮處理的信號、和對強調聲音頻帶信號進行了 AGC壓縮處理的信號相加,作為輸出信號。此外,作為其它技術,有如下一種技術將電視接收機的聲音信號輸出作為輸入, 從輸入信號中檢測出實際人的聲音部分區(qū)間,再強調該區(qū)間信號的子音并輸出(參照專利文獻2)。另外還有如下一種技術從輸入信號提取包含基于人的聽覺的頻率信息的信號并進行濾波,將該濾波后的信號轉換為表示人的感知音量度的聽覺音量信號,將輸入信號振幅進行控制,使得接近所設定的音量值(參照專利文獻3)?,F(xiàn)有技術文獻專利文獻專利文獻1 日本專利特開2008-89982號公報專利文獻2 日本專利特開平8-275087號公報專利文獻3 日本專利特開2004-318164號公報
發(fā)明內容
本發(fā)明要解決的問題然而,在專利文獻1所公開的技術中,由于最大振幅值不一定與實際觀眾感覺的音量相一致,因此存在的問題有很難進行有效果的強調。在專利文獻2所公開的技術中,由于子音的強調程度一定,因此對子音進行強調是與說話者的性別或聲音性質無關,存在的問題有容易有損原來的音質或聲音性質。此外, 由于根據(jù)所輸入的內容,說話者的音量也變得不同,因此存在的問題有音量絕對小時即使對子音進行強調也難以提高清晰性。而且,沒有公開檢測聲音部分區(qū)間的具體方法,難以討
4論如何引入該技術,還需要其它技術。在專利文獻3所公開的技術中,由于在全部期間內使輸入信號接近設定音量值, 因此對電影等內容而言,有可能會大大有損動態(tài)范圍感。鑒于上述問題,本發(fā)明的目的在于提供一種技術,該技術通過調整輸入信號,使得內容中的會話、講話的音量大致一定,從而減輕觀眾的音量操作負擔。用于解決問題的方法本發(fā)明的裝置涉及增益控制裝置。該裝置包括聲音檢測單元,該聲音檢測單元從音響信號檢測聲音區(qū)間;響度級別變換單元,該響度級別變換單元計算出作為所述音響信號的人的實際聽覺音量級別的響度級別;級別比較單元,該級別比較單元比較所述計算出的響度級別和規(guī)定目標級別;放大量計算單元,該放大量計算單元基于所述聲音檢測單元的檢測結果和所述級別比較單元的比較結果,計算出所述音響信號的增益控制量;以及聲音放大單元,該聲音放大單元根據(jù)計算出的所述增益控制量對所述音響信號進行增益調整。
此外,所述響度級別變換單元也可在所述聲音檢測單元檢測出聲音區(qū)間時計算出所述響度級別。此外,所述響度級別變換單元也可按由規(guī)定采樣數(shù)構成的幀單位計算出響度級別。此外,所述響度級別變換單元也可按作為聲音區(qū)間單位的短句(phrase)單位計算出響度級別。此外,所述響度級別變換單元也可按短句單位計算出響度級別的峰值,所述級別比較單元也可比較所述響度級別的峰值和所述規(guī)定目標級別。此外,也可在當前短句的響度峰值超過先前短句的響度峰值的情況下,所述級別比較單元比較當前短句的響度峰值和所述規(guī)定目標級別,在當前短句的響度峰值為先前短句的響度峰值以下的情況下,所述級別比較單元比較先前短句的響度峰值和所述規(guī)定目標級別。此外,所述聲音檢測單元也可包括基頻提取單元,該基頻提取單元從所述音響信號對每一幀提取基頻;基頻變化檢測單元,該基頻變化檢測單元檢測出連續(xù)預定數(shù)的多個幀中的所述基頻的變化;以及聲音判定單元,該聲音判定單元利用所述基頻變化檢測單元檢測所述基頻是否單調變化、或者是否從單調變化變成一定頻率、或者是否從一定頻率變成單調變化,并且當所述基頻在預定頻率范圍內變化、且所述基頻變化寬度比預定頻率寬度要小時,將所述音響信號判定為聲音。本發(fā)明的方法涉及增益控制方法。該方法包括聲音檢測工序,該聲音檢測工序從緩沖了規(guī)定時間的音響信號檢測出聲音區(qū)間;響度級別變換工序,該響度級別變換工序從所述音響信號計算出作為人的實際聽覺音量級別的響度級別;級別比較工序,該級別比較工序比較所述計算出的響度級別和規(guī)定目標級別;放大量計算工序,該放大量計算工序基于所述聲音檢測工序的檢測結果和所述級別比較工序的比較結果,計算出所述被緩沖的音響信號的增益控制量;以及聲音放大單元,該聲音放大單元根據(jù)計算出的所述增益控制量對所述音響信號進行增益調整。此外,所述響度級別變換工序也可在所述聲音檢測工序檢測出聲音區(qū)間時計算出所述響度級別。此外,所述響度級別變換工序也可按由規(guī)定采樣數(shù)構成的幀單位計算出響度級別。此外,所述響度級別變換工序也可按作為聲音區(qū)間單位的短句單位計算出響度級別。此外,所述響度級別變換工序也可按短句單位計算出響度級別的峰值,所述級別比較工序也可比較所述響度級別的峰值和所述規(guī)定目標級別。此外,也可在當前短句的響度峰值超過先前短句的響度峰值的情況下,所述級別比較工序比較當前短句的響度峰值和所述規(guī)定目標級別,在當前短句的響度峰值為先前短句的響度峰值以下的情況下,所述級別比較工序比較先前短句的響度峰值和所述規(guī)定目標級別。此外,所述聲音檢測工序也可包括基頻提取工序,該基頻提取工序從所述音響信號對所述每一幀提取基頻;基頻變化檢測工序,該基頻變化檢測工序檢測出連續(xù)預定數(shù)的多個幀中的所述基頻的變化;以及聲音判定工序,該聲音判定工序利用所述基頻變化檢測工序檢測所述基頻是否單調變化、或者是否從單調變化變成一定頻率、或者是否從一定頻率變成單調變化,并且當所述基頻在預定頻率范圍內變化、且所述基頻變化寬度比預定頻率寬度要小時,將所述音響信號判定為聲音。本發(fā)明所涉及的另一裝置為聲音輸出裝置,該聲音輸出裝置包括上述增益控制裝置。發(fā)明的效果根據(jù)本發(fā)明,能夠提供一種技術,該技術通過調整輸入信號,使得內容中的會話、 講話的音量大致一定,從而減輕觀眾的音量操作負擔。
圖1是表示實施方式所涉及的音響信號處理裝置的簡要結構的功能框圖。圖2是表示實施方式所涉及的聲音檢測部的簡要結構的功能框圖。圖3是表示實施方式所涉及的音響信號處理裝置的動作的流程圖。圖4是表示第一變形例所涉及的音響信號處理裝置的動作的流程圖。圖5是表示第二變形例所涉及的音響信號處理裝置的動作的流程圖。
具體實施例方式接著,參照附圖,來具體說明用于實施本發(fā)明的方式(以下稱作“實施方式”)。實施方式的概要如下。即,在1個以上頻道的輸入信號中檢測講話或會話區(qū)間。另外,在本實施方式中,將包含人聲或人聲以外的聲音的信號稱作音響信號,將音響信號中的相當于講話或會話等人聲的信號稱作聲音。此外,音響信號中的相當于聲音的區(qū)域的信號稱作聲音信號。接著,計算出所檢測的區(qū)間中的音響信號的響度級別,控制所檢測的區(qū)間(或者相鄰區(qū)間)的信號振幅,使得該級別接近預定目標級別。通過這樣,在所有內容中,講話或會話的音量變得一定,由此觀眾始終能更清晰地聽到講話或會話內容而不用進行音量操作。下面進行具體說明。
圖1是表示實施方式所涉及的音響信號處理裝置10的簡要結構的功能框圖。該音響信號處理裝置10裝載于電視機或DVD播放器等具有聲音輸出功能的設備。音響信號處理裝置10從上游到下游包括音響信號輸入部12、音響信號存儲部 14、音響信號放大部16、以及音響信號輸出部18。而且,作為獲取音響信號存儲部14的輸出并且為了放大聲音信號而進行計算的路徑,音響信號處理裝置10包括聲音檢測部20和聲音放大量計算部22。此外,作為根據(jù)響度級別而控制振幅的路徑,音響信號處理裝置10 包括響度級別變換部M和閾值/級別比較部26。另外,上述各結構要素例如由CPU、存儲器、加載到存儲器的程序等來實現(xiàn),在此畫出由它們相互連接來實現(xiàn)的結構。本領域技術人員明白,這些功能塊能夠通過只用硬件、只用軟件、或其組合以各種形式來實現(xiàn)。具體而言,音響信號輸入部12獲取音響信號的輸入信號S_in并向音響信號存儲部14輸出。音響信號存儲部14作為緩沖器存儲由音響信號輸入部12輸入的音響信號、例如IOM樣本(采樣頻率為48kHz時,約21. 3ms)。以下將由該10 樣本構成的信號稱作 “1 幀,,。聲音檢測部20檢測被音響信號存儲部14緩沖的音響信號是否為講話或會話。以下在圖2中對聲音檢測部20的結構和處理進行敘述。由聲音檢測部20檢測出是講話或會話的情況下,聲音放大量計算部22在抵消由閾值/級別比較部26計算出的差值級別的方向上計算出聲音放大量。檢測出不是會話聲音的情況下,聲音放大量計算部22將聲音放大量作為OdB,即既不放大也不衰減。響度級別變換部M從由音響信號存儲部14緩沖的音響信號變換到作為人的實際聽覺音量級別的響度級別。對該響度級別變換,可利用例如ITU-R(國際通信聯(lián)盟廣播通信部International Telecommunication Union Radiocommunications Sector)BS 1770所公開的技術。更具體而言,將由響度曲線表示的特性進行反轉來計算出響度級別。因而,在本實施方式中,使用幀平均響度級別。閾值/級別比較部沈比較經(jīng)變換的響度級別和預設目標級別,計算出差值級別。音響信號放大部16調出由音響信號存儲部14緩沖的音響信號,利用聲音放大量計算部22計算出的放大/衰減量來進行放大/衰減后向音響信號輸出部18輸出。接著, 音響信號輸出部18向揚聲器等輸出增益調整后的信號S_out(S_輸出)。接著,對聲音檢測部20的結構和處理進行說明。圖2是表示聲音檢測部20的簡要結構的功能框圖。本實施方式中所適用的聲音辨別處理,是將音響信號分割成上述幀,對連續(xù)多個幀進行頻率分析,判定是否為會話聲音。然后,當音響信號包括短句成分或聲調成分的情況下,聲音辨別處理判斷為該音響信號是聲音信號。即,聲音判定處理檢測下述幀的基頻是否單調變化(單調增加或單調減少)、或者是否從單調變化變成一定頻率(即,從單調增加變成一定頻率、或從單調減少變成一定頻率)、再或者是否從一定頻率變成單調變化(即,從一定頻率變成單調增加、或從一定頻率變成單調減少),另外上述基頻在預定頻率范圍內變化、且上述基頻變化寬度比預定寬度要小時,將上述音響信號判定為聲音。聲音判定是基于以下知識。即,上述基頻變化是單調變化的情況下,能確認表示人聲(聲音)的短句成分的可能性高。此外,上述基頻從單調變化變成一定頻率的情況下、或者上述基頻從一定頻率變成單調變化的情況下,能確認表示人聲的聲調成分的可能性高。
人聲的基頻頻帶一般在約IOOHz 400Hz之間。更詳細而言,男性聲音的基頻頻帶約為150Hz士50Hz,而女性聲音的基頻頻帶約為250Hz士50Hz。此外,小孩的基頻頻帶比女性還高50Hz,約為300Hz 士50Hz。而且,人聲的短句成分或聲調成分的情況下,基頻變化寬度約為120Hz。S卩,上述基頻進行單調變化、或從單調變化變成一定頻率、或從一定頻率變成單調變化的情況下,且基頻最大值和最小值不在規(guī)定范圍內的情況下,判定為非聲音。此外,上述基頻進行單調變化、或從單調變化變成一定頻率、或從一定頻率變成單調變化的情況下, 且基頻最大值和最小值之差比規(guī)定值要大的情況下,也判定為非聲音。因而,上述基頻進行單調變化、或從單調變化變成一定頻率、或從一定頻率變成單調變化時,基頻變化在預定頻率范圍內變化的情況下(基頻最大值和最小值在規(guī)定范圍內),且基頻頻率變化寬度比預定頻率寬度要小的情況下(基頻最大值和最小值之差比規(guī)定值要小的情況),該聲音辨別處理判定為是短句成分或聲調成分。而且,如果與男性聲音、 女性聲音、小孩聲音相對應地設定上述預定頻率范圍,則還能夠區(qū)分男性聲音、女性聲音、 小孩聲音。由此,音響信號處理裝置10的聲音檢測部20能夠高精度地檢測人聲,而且可檢測出男性聲音、女性聲音這兩種聲音,同時在某種程度上可檢測出是女性聲音還是小孩聲音。接著,基于圖2對實現(xiàn)上述聲音辨別處理的聲音檢測部20的具體結構進行說明。 聲音檢測部20包括頻譜變換部30、縱軸對數(shù)變換部31、頻率時間變換部32、基頻提取部 33、基頻保存部34、LPF部35、短句成分分析部36、聲調成分分析部37、聲音/非聲音判定部38。頻譜變換部30對從音響信號存儲部14獲取的音響信號以幀單位執(zhí)行FFT(快速傅里葉變換fast Fourier Transform),將時域聲音信號變換成頻域數(shù)據(jù)(頻譜)。另外,在FFT處理前,為了減小頻率分析誤差,也可對分割成幀單位的音響信號適用漢寧窗 (Harming Window)等窗函數(shù)??v軸對數(shù)變換部31將頻率軸變換成底數(shù)10的對數(shù)。頻率時間變換部32對由縱軸對數(shù)變換部31進行對數(shù)變換的頻譜執(zhí)行IOM點逆FFT,并變換到時域。另外,經(jīng)變換的系數(shù)被稱作“倒頻譜(cepstrum)”。然后,基頻提取部33求出倒頻譜高次側(采樣頻率大致在fs/800以上)的最大倒頻譜,將其倒數(shù)作為基頻F0?;l保存部34保存所計算的基頻F0。在之后的處理中,由于使用5幀數(shù)量的基頻F0,因此必須至少保存該幀數(shù)量。LPF部35從基頻保存部34獲取所檢測的基頻F0、之前幀的基頻F0,并進行低通濾波。利用低通濾波能對基頻FO除去噪聲。短句成分分析部36分析經(jīng)低通濾波的、之前5幀數(shù)量的基頻FO是否單調增加或單調減少,如果增加或減少的頻帶寬度在規(guī)定值內、例如在120Hz內轉變,就判定為是短句成分。聲調成分分析部37分析經(jīng)低通濾波的、之前5幀數(shù)量的基頻FO是否從單調增加轉變到平坦(無變化)、或從平坦轉變到單調減少、或進行平坦轉變,如果頻帶寬度在120Hz 內轉變,就判定為是聲調成分。如果由聲調成分分析部37判斷為是上述短句成分或聲調成分的情況下,聲音/非聲音判定部38判定為聲音場景,如果任一條件都未滿足的情況下,判定為非聲音場景。
對具有上述結構的音響信號處理裝置10的動作進行說明。圖3是表示音響信號處理裝置10的動作的流程圖。輸入到音響信號處理裝置10的音響信號輸入部12的音響信號利用音響信號存儲部14進行緩沖,聲音檢測部20執(zhí)行辨別該經(jīng)緩沖的音響信號中是否包含聲音的上述聲音辨別處理(SlO)。即,聲音檢測部20如上所述地分析規(guī)定幀數(shù)的數(shù)據(jù),判定是聲音場景還是
非聲音場景。接著,未檢測到聲音的情況下(S12的N),聲音放大量計算部22確認當前設定的增益是否為OdB (S14)。增益為OdB的情況下(S14的Y),結束該流程的處理,對下一幀從SlO 開始再次進行處理。增益不為OdB的情況下(S14的N),為了在規(guī)定釋放時間使增益回到 OdB,聲音放大量計算部22計算出每一樣本的增益變化量(S16)。將計算出的增益變化量通知給音響信號放大部16,音響信號放大部16使設定的增益反映該增益變化量并更新增益 (S18)。這樣,結束是非聲音場景、且設定的增益不為OdB時的處理。S12的處理中判斷為檢測到聲音時(S12的Y),響度級別變換部M計算出響度級別(S20)。接著,閾值/級別比較部沈計算出與預設的聲音目標級別的差值(S22)。接著, 聲音放大量計算部22根據(jù)計算出的差值和預定獲取的比例,計算出實際反映的增益量(目標增益)(SM)。即,上述比例設定了計算出的差值以多大程度反映在以下說明的增益變化量中。接著,聲音放大量計算部22根據(jù)從當前目標增益所設定的起動時間來計算增益變化量6 )。接著,音響信號放大部16利用聲音放大量計算部22所計算出的增益變化量來更新增益(S18)。當音響信號中包含聲音(人聲)的情況下,根據(jù)以上結構和處理,通過基于作為人的實際聽覺音量級別的響度級別進行放大處理,能夠容易聽到內容的會話等。此外,由于觀眾不用進行音量操作,因此不會妨礙收看內容。即,通過調整輸入信號,使得內容中的會話、 講話的音量大致一定,從而能夠減輕觀眾的音量操作負擔。接著,基于圖4的流程圖對在圖3的流程圖所示的處理的第一變形例進行說明。在該第一變形例中,進行上述處理的響度級別計算處理(S20)之后,作為并行處理,進行計算出增益變化量的第一系統(tǒng)處理(S21 S26)、和計算出峰值的第二系統(tǒng)處理(S31 S33)。在此,短句是指檢測到聲音之后到檢測不到聲音為止的期間。然后在本變形例中, 聲音放大量計算部22針對每一短句是檢測響度級別的峰值,而不是檢測幀平均響度級別, 計算出當前目標級別與先前短句中的響度級別的峰值之差,與該差值相對應地計算出目標增益。另外,對與圖3的流程圖相同的處理,就簡化說明來進行說明。聲音檢測部20進行聲音辨別處理(SlO),當沒有檢測到聲音的情況下(S12的N), 如上所述進行增益確認處理(S14),增益不為OdB的情況下(S14的N),進行增益變化量計算處理(S16)、以及使所設定的增益反映該增益變化量并進行增益更新處理(S18)。檢測到聲音的情況下(S12的Y),轉移到短句的峰值級別值檢測處理。首先,進行響度級別計算處理(S20)。另外,SlO的聲音檢測處理將檢測出聲音的區(qū)間與在音響信號存儲部14中存儲的音響信號相關聯(lián)來存儲在規(guī)定存儲區(qū)域(音響信號存儲部14或未圖示的操作存儲區(qū)域等)中。即,在SlO的聲音檢測處理中來確定短句。在響度級別變換部M中計算出短句中的響度級別的峰值。接著,作為并行處理,進行計算出增益變化量的第一系統(tǒng)處理(S21 S^)、和計算出峰值的第二系統(tǒng)處理(S31 S33)。首先,在第一系統(tǒng)處理(S21 S26)中,閾值/級別比較部沈確認是否存在先前短句的峰值數(shù)據(jù)(S21)。不存在峰值的情況下(S21的N), 轉移到上述S14之后的處理。另外,例如電視機的頻道被切換時、或DVD播放器重放新內容時,在本變形例中對峰值等變量進行初始化。因而,重放新內容時,峰值不存在。存在先前短句的峰值數(shù)據(jù)的情況下(S21的Y),聲音放大量計算部22計算出預設目標級別與前一短句的峰值之差(S22),根據(jù)設定的比例計算出目標增益(SM),而且根據(jù)設定的起動時間計算出每一樣本的增益變化量(S26)。從而音響信號放大部16依據(jù)所計算的增益變化量來更新增益(S18)。這樣,第一系統(tǒng)處理就結束了。另一方面,在作為并行處理的另一處理的第二系統(tǒng)處理(S31 S33)中,閾值/級別比較部沈確認是否為短句的最初的幀(S31)。是短句的最初的幀的情況下(S31的Y), 將該計算出的響度級別作為短句內的初始峰值來更新峰值(S32)。不是最初的幀的情況下 (S31的N),閾值/級別比較部沈比較計算出的響度級別與到先前幀為止的臨時峰值。所計算的響度級別比到先前幀為止的臨時峰值要大的情況下(S33的Y),將該計算出的響度級別作為到當前幀為止的臨時峰值來更新峰值(S32),所計算的響度級別為到先前幀為止的臨時峰值以下的情況下(S33的N),不更新峰值而結束處理。如上所述,根據(jù)本變形例,能實現(xiàn)與上述實施方式相同的效果。而且,由于該結構中以短句單位來反映與目標級別的差值,因此能夠防止因增益控制而相應產(chǎn)生的輸出不穩(wěn)定。由此,觀眾不會意識到在進行增益控制,能夠在收看中沒有異樣感。另外,在音響信號處理裝置10的處理速度充分快的情況下、或到最終信號輸出為止所經(jīng)過的處理時間不成問題的情況下,可不用前一短句的峰值,而用當前短句的峰值。然而,根據(jù)內容之間的響度級別平均化的觀點,即使使用前一短句的峰值,也能達到充分的效果。接著,基于圖5的流程圖對第二變形例進行說明。在第一變形例中,檢測出聲音時,利用先前短句的峰值來進行放大量計算。然而在第二變形例中,在當前短句的臨時峰值超過先前短句的峰值的情況下,基于當前短句的臨時峰值計算出放大量。另外,對與圖4的流程圖相同的處理,就簡化說明來進行說明。首先,聲音檢測部20進行聲音辨別處理(SlO),當沒有檢測到聲音的情況下(S12 的N),進行增益確認處理(S14),增益不為OdB的情況下(S14的N),進行增益變化量計算處理(S16)、以及使所設定的增益反映該增益變化量并進行增益更新處理(S18)。檢測到聲音的情況下(S12的Y),轉移到短句的峰值級別值檢測處理。首先,進行響度級別計算處理(S20),接著,利用并行處理,進行計算出增益變化量的第一系統(tǒng)處理 (S21 S26)、和計算出峰值的第二系統(tǒng)處理(S31 S33)。首先,在第一系統(tǒng)處理(S21 S26)中,閾值/級別比較部沈確認是否存在先前短句的峰值數(shù)據(jù)(S21)。不存在峰值的情況下(S21的N),轉移到上述S14之后的處理。存在先前短句的峰值數(shù)據(jù)的情況下(S21的Y),在進行S22的處理之前,確定用于 S22的差值計算處理的峰值(S21a)。具體而言,閾值/級別比較部沈比較到前一短句為止的峰值(以下稱作“老峰值”)與當前短句的峰值(以下稱作“新峰值”),當老峰值比新峰值要大的情況下,選定老峰值作為用于差值計算處理的峰值,當老峰值為新峰值以下的情況下,選定新峰值作為用于差值計算處理的峰值。接著,聲音放大量計算部22計算出預設目標級別與在S21a的處理中確定的峰值之差(S22),根據(jù)設定的比例計算出目標增益(S24),
10而且根據(jù)設定的起動時間計算出每一樣本的增益變化量(S26)。從而音響信號放大部16依據(jù)所計算的增益變化量來更新增益(S18)。此外,在作為并行處理的另一處理的第二系統(tǒng)處理(S31 S33)中,如第一變形例,進行確認是否為短句的最初的幀的確認處理(S31)、峰值更新處理(S32)、計算出的響度級別與到先前幀為止的臨時峰值的比較處理(S33)。當前短句的峰值比先前短句的峰值要大的情況下,通過進行這些處理,能夠抑制不必要的放大。以上,基于實施方式對本發(fā)明進行了說明。本領域技術人員能夠明白,該實施方式例是示例,通過組合這些示例的各結構要素可實現(xiàn)各種變形例,而且這樣得到的變形例也在本發(fā)明的范圍中。附圖標記說明10音響信號處理裝置12音響信號輸入部14音響信號存儲部16音響信號放大部18音響信號輸出部20聲音檢測部22聲音放大量計算部M響度級別變換部26閾值/級別比較部30頻譜變換部31縱軸對數(shù)變換部32頻率時間變換部33基頻提取部34基頻保存部35LPF 部36短句成分分析部37聲調成分分析部38聲音/非聲音判定部
權利要求
1.一種增益控制裝置,包括聲音檢測單元,該聲音檢測單元從音響信號檢測出聲音區(qū)間; 響度級別變換單元,該響度級別變換單元計算出作為所述音響信號的人的實際聽覺音量級別的響度級別;級別比較單元,該級別比較單元比較所述計算出的響度級別和規(guī)定目標級別; 放大量計算單元,該放大量計算單元基于所述聲音檢測單元的檢測結果和所述級別比較單元的比較結果,計算出所述音響信號的增益控制量;以及聲音放大單元,該聲音放大單元根據(jù)計算出的所述增益控制量對所述音響信號進行增益調整。
2.如權利要求1所述的增益控制裝置,其特征在于,當所述聲音檢測單元檢測出聲音區(qū)間時,所述響度級別變換單元計算出所述響度級別。
3.如權利要求1或2所述的增益控制裝置,其特征在于,所述響度級別變換單元以由規(guī)定樣本數(shù)構成的幀單位來計算出響度級別。
4.如權利要求1或2所述的增益控制裝置,其特征在于,所述響度級別變換單元以作為聲音區(qū)間單位的短句單位來計算出響度級別。
5.如權利要求4所述的增益控制裝置,其特征在于,所述響度級別變換單元以短句單位計算出響度級別的峰值;所述級別比較單元比較所述響度級別的峰值和所述規(guī)定目標級別。
6.如權利要求5所述的增益控制裝置,其特征在于,當前短句的響度峰值超過先前短句的響度峰值的情況下,所述級別比較單元比較當前短句的響度峰值和所述規(guī)定目標級別;當前短句的響度峰值為先前短句的響度峰值以下的情況下,所述級別比較單元比較先前短句的響度峰值和所述規(guī)定目標級別。
7.如權利要求1至6的任一項所述的增益控制裝置,其特征在于,所述聲音檢測單元包括基頻提取單元,該基頻提取單元從所述音響信號對每一幀提取基頻; 基頻變化檢測單元,該基頻變化檢測單元檢測出連續(xù)預定數(shù)的多個幀中的所述基頻的變化;以及聲音判定單元,該聲音判定單元利用所述基頻變化檢測單元檢測所述基頻是否單調變化、或者是否從單調變化變成一定頻率、或者是否從一定頻率變成單調變化,并且當所述基頻在預定頻率范圍內變化、且所述基頻變化寬度比預定頻率寬度要小時,將所述音響信號判定為聲音。
8.一種增益控制方法,包括聲音檢測工序,該聲音檢測工序從緩沖了規(guī)定時間的音響信號檢測出聲音區(qū)間; 響度級別變換工序,該響度級別變換工序從所述音響信號計算出作為人的實際聽覺音量級別的響度級別;級別比較工序,該級別比較工序比較所述計算出的響度級別和規(guī)定目標級別; 放大量計算工序,該放大量計算工序基于所述聲音檢測工序的檢測結果和所述級別比較工序的比較結果,計算出所述被緩沖的音響信號的增益控制量;以及聲音放大單元,該聲音放大單元根據(jù)計算出的所述增益控制量對所述音響信號進行增益調整。
9.如權利要求8所述的增益控制方法,其特征在于,當所述聲音檢測工序檢測出聲音區(qū)間時,所述響度級別變換工序計算出所述響度級別。
10.如權利要求8或9所述的增益控制方法,其特征在于,所述響度級別變換工序以由規(guī)定樣本數(shù)構成的幀單位來計算出響度級別。
11.如權利要求8或9所述的增益控制方法,其特征在于,所述響度級別變換工序以作為聲音區(qū)間單位的短句單位來計算出響度級別。
12.如權利要求11所述的增益控制方法,其特征在于,所述響度級別變換工序以短句單位計算出響度級別的峰值,所述級別比較工序比較所述響度級別的峰值和所述規(guī)定目標級別。
13.如權利要求12所述的增益控制方法,其特征在于,當前短句的響度峰值超過先前短句的響度峰值的情況下,所述級別比較工序比較當前短句的響度峰值和所述規(guī)定目標級別,當前短句的響度峰值為先前短句的響度峰值以下的情況下,所述級別比較工序比較先前短句的響度峰值和所述規(guī)定目標級別。
14.如權利要求8至13的任一項所述的增益控制方法,其特征在于,所述聲音檢測工序包括基頻提取工序,該基頻提取工序從所述音響信號對所述每一幀提取基頻;基頻變化檢測工序,該基頻變化檢測工序檢測出連續(xù)預定數(shù)的多個幀中的所述基頻的變化;以及聲音判定工序,該聲音判定工序利用所述基頻變化檢測工序檢測所述基頻是否單調變化、或者是否從單調變化變成一定頻率、或者是否從一定頻率變成單調變化,并且當所述基頻在預定頻率范圍內變化、且所述基頻變化寬度比預定頻率寬度要小時,將所述音響信號判定為聲音。
15.一種聲音輸出裝置,其特征在于,包括如權利要求1至7的任一項所述的增益控制直ο
全文摘要
本發(fā)明提供一種技術,該技術通過調整輸入信號,使得內容中的會話、講話的音量大致一定,從而減輕觀眾的音量操作負擔。音響信號處理裝置(10)包括將音響輸入信號緩沖規(guī)定時間的音響信號存儲部(14);從經(jīng)緩沖的音響信號檢測出聲音區(qū)間的聲音檢測部(20);從經(jīng)緩沖的音響信號計算出作為人的實際聽覺音量級別的響度級別的聲音檢測部(20);比較計算出的響度級別和規(guī)定目標級別的閾值/級別比較部(26);基于聲音檢測部(20)的檢測結果和閾值/級別比較部(26)的比較結果、計算出經(jīng)緩沖的音響信號的增益控制量的聲音放大量計算部(22);以及根據(jù)計算經(jīng)緩沖的音響信號的增益控制量來放大/衰減的音響信號放大部(16)。
文檔編號H03G3/20GK102422349SQ20108002197
公開日2012年4月18日 申請日期2010年5月13日 優(yōu)先權日2009年5月14日
發(fā)明者后田成文 申請人:夏普株式會社