音頻輸出裝置和音頻輸出方法

文檔序號(hào)：2832850閱讀：291來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：音頻輸出裝置和音頻輸出方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種輸出掩蔽聲音的音頻輸出裝置，并且還涉及一種音頻輸出方法。
背景技術(shù)：
傳統(tǒng)上已提出這樣一種技術(shù)，其中在辦公室或類似的地方中，將揚(yáng)聲器附接至隔離物上，將與說話者語音具有低相關(guān)性的聲音輸出作為掩蔽聲音，以使存在于說話者所在的空間以及相鄰其它空間中的人幾乎聽不見說話者的語音(例如，參見專利文獻(xiàn)I )。根據(jù)該配置，幾乎不能理解說話者的發(fā)聲內(nèi)容，并因此能夠維持說話者的私密性?，F(xiàn)有文獻(xiàn)參考專利文獻(xiàn)專利文獻(xiàn)I JP-A-6-17566
發(fā)明內(nèi)容
本發(fā)明將要解決的問題然而，在專利文獻(xiàn)I的系統(tǒng)中，從不同位置聽見掩蔽聲音和說話者語音。因此，存在這樣的可能性:由于所謂的雞尾酒會(huì)效應(yīng)，聽者可以辨別說話者語音并且理解發(fā)聲內(nèi)容。因此，本發(fā)明的目的是提供一種能夠充分地抑制雞尾酒會(huì)效應(yīng)的音頻輸出裝置和音頻輸出方法。解決問題的手段能夠解決問題的音頻輸出裝置包括:說話者位置檢測部，其適于檢測說話者的位置；掩蔽聲音產(chǎn)生部，其適于產(chǎn)生掩蔽聲音；多個(gè)揚(yáng)聲器，其適于輸出掩蔽聲音；以及定位控制部，其適于基于由說話者位置檢測部檢測到的說話者位置來控制掩蔽聲音的定位位置，并且將與掩蔽聲音有關(guān)的聲音信號(hào)供給到多個(gè)揚(yáng)聲器中的至少一個(gè)。優(yōu)選地，定位控制部將掩蔽聲音的定位位置設(shè)定至由說話者位置檢測部檢測到的說話者位置。優(yōu)選地，音頻輸出裝置包括布置有用于拾取聲音的多個(gè)麥克風(fēng)的麥克風(fēng)陣列，并且說話者位置檢測部基于由多個(gè)麥克風(fēng)拾取的聲音的相位差來檢測說話者位置。優(yōu)選地，在由說話者位置檢測部檢測到的說話者位置發(fā)生變化的情況下，掩蔽聲音產(chǎn)生部將掩蔽聲音的水平設(shè)定到高水平。優(yōu)選地，說話者位置檢測部將拾取的聲音的音量水平最高的麥克風(fēng)的位置設(shè)定為說話者位置，并且定位控制部將與掩蔽聲音有關(guān)的聲音信號(hào)供給到與拾取的聲音的音量水平最高的麥克風(fēng)最接近的揚(yáng)聲器。能夠解決問題的音頻輸出裝置包括:多個(gè)麥克風(fēng)，其適于拾取聲音；掩蔽聲音產(chǎn)生部，其適于產(chǎn)生掩蔽聲音；多個(gè)揚(yáng)聲器，將與掩蔽聲音有關(guān)的聲音信號(hào)供給至多個(gè)揚(yáng)聲器，并且多個(gè)揚(yáng)聲器適于發(fā)出掩蔽聲音；以及定位控制部，其適于控制將要供給到多個(gè)揚(yáng)聲器的與掩蔽聲音有關(guān)的聲音信號(hào)的增益，并且定位控制部將多個(gè)麥克風(fēng)的拾音信號(hào)的水平乘以增益設(shè)置系數(shù)以調(diào)節(jié)將要供給到多個(gè)揚(yáng)聲器的與掩蔽聲音有關(guān)的聲音信號(hào)的增益，增益設(shè)置系數(shù)的值隨著多個(gè)麥克風(fēng)與多個(gè)揚(yáng)聲器之間的距離的變大而變小。能夠解決問題的音頻輸出方法包括以下步驟:檢測說話者的位置；產(chǎn)生掩蔽聲音；從多個(gè)揚(yáng)聲器中的至少一個(gè)輸出掩蔽聲音；以及控制掩蔽聲音的虛擬聲源的定位位置使得虛擬聲源的位置處于或鄰近在說話者位置檢測步驟中檢測到的說話者位置，并且將與掩蔽聲音有關(guān)的聲音信號(hào)供給到多個(gè)揚(yáng)聲器中的至少一個(gè)。優(yōu)選地，在定位控制步驟中，掩蔽聲音的定位位置被設(shè)定至在說話者位置檢測步驟中檢測到的說話者位置。優(yōu)選地,音頻輸出方法還包括通過布置有多個(gè)麥克風(fēng)的麥克風(fēng)陣列拾取聲音的步驟，并且，在說話者位置檢測步驟中，從由多個(gè)麥克風(fēng)拾取的聲音的相位差來檢測說話者位置。優(yōu)選地，在說話者位置檢測步驟中檢測到的說話者位置發(fā)生變化的情況下，掩蔽聲音產(chǎn)生步驟將掩蔽聲音的水平設(shè)定至高水平。優(yōu)選地，在說話者位置檢測步驟中，拾取的聲音的音量水平最高的麥克風(fēng)的位置被設(shè)定為說話者位置，并且，在定位控制步驟中，與掩蔽聲音有關(guān)的聲音信號(hào)被供給到與拾取的聲音的音量水平最高的麥克風(fēng)最接近的揚(yáng)聲器。能夠解決問題的音頻輸出方法包括以下步驟:通過多個(gè)麥克風(fēng)拾取聲音；產(chǎn)生掩蔽聲音；將與掩蔽聲音有關(guān)的聲音信號(hào)供給到多個(gè)揚(yáng)聲器，并且通過多個(gè)揚(yáng)聲器發(fā)出掩蔽聲音；以及控制將要供給到多個(gè)揚(yáng)聲器的與掩蔽聲音有關(guān)的聲音信號(hào)的增益，并且定位控制步驟將多個(gè)麥克風(fēng)的拾音信號(hào)的水平乘以增益設(shè)置系數(shù)以調(diào)節(jié)將要供給到多個(gè)揚(yáng)聲器的與掩蔽聲音有關(guān)的聲音信號(hào)的增益，增益設(shè)置系數(shù)的值隨著多個(gè)麥克風(fēng)與多個(gè)揚(yáng)聲器之間的距離的變大而變小。本發(fā)明的有益效果根據(jù)本發(fā)明，在相同方向上聽見掩蔽聲音和說話者語音，因此能夠充分地抑制雞尾酒會(huì)效應(yīng)。

圖1是顯示掩蔽系統(tǒng)的配置的框圖。圖2是顯示麥克風(fēng)陣列、揚(yáng)聲器陣列以及聲音處理裝置的配置的框圖。圖3是顯示通過使用麥克風(fēng)陣列來檢測說話者位置的方法的示圖。圖4是顯示通過使用揚(yáng)聲器陣列來定位虛擬聲源的方法的示圖。圖5是顯示揚(yáng)聲器陣列和麥克風(fēng)陣列之間的位置關(guān)系的示圖。圖6是顯示聲音處理裝置的操作的流程圖。圖7是顯示另一實(shí)施例中的掩蔽系統(tǒng)的配置的示圖。圖8是顯不圖7所不的掩蔽系統(tǒng)的麥克風(fēng)陣列、揚(yáng)聲器陣列和聲音處理裝置的配置的框圖。圖9是顯示圖7所示的掩蔽系統(tǒng)中的聲音處理裝置的操作的流程圖。圖10是顯示又一實(shí)施例中的掩蔽系統(tǒng)的配置的示圖。圖11是顯不圖10所不的掩蔽系統(tǒng)的麥克風(fēng)陣列、揚(yáng)聲器陣列和聲音處理裝置的配置的框圖。
具體實(shí)施例方式圖1是顯示包括本發(fā)明的音頻輸出裝置的掩蔽系統(tǒng)的配置的框圖。例如，掩蔽系統(tǒng)布置在銀行、調(diào)劑藥房等中的交互式柜臺(tái)上，并且向第三人發(fā)出掩蔽聲音，該掩蔽聲音使柜臺(tái)兩側(cè)的相互談話人之間的談話內(nèi)容不被第三人理解。在圖1中，說話者Hl和聽者H2在柜臺(tái)兩側(cè)，并且多個(gè)第三人H3在遠(yuǎn)離柜臺(tái)的位置處。由于Hl和H2相互交談，因此偶爾，Hl是聽者并且H2是說話者。例如，說話者Hl是對(duì)藥物進(jìn)行解釋的藥劑師，聽者H2是傾聽藥物解釋的患者，并且第三人H3是等待的患者。麥克風(fēng)陣列I布置在柜臺(tái)的上表面上。在麥克風(fēng)陣列I中，布置了多個(gè)麥克風(fēng)，并且麥克風(fēng)中的每一個(gè)均拾取柜臺(tái)周邊的聲音。在柜臺(tái)的第三人所處的方向(紙張中的向下方向)上，布置了朝向第三人輸出聲音的揚(yáng)聲器陣列2。例如,揚(yáng)聲器陣列2布置在桌子下面使得聽者H2幾乎聽不見從揚(yáng)聲器陣列2輸出的聲音。麥克風(fēng)陣列I和揚(yáng)聲器陣列2連接至聲音處理裝置3。麥克風(fēng)陣列I通過布置的麥克風(fēng)拾取說話者Hl的語音，并且將拾取的語音輸出至聲音處理裝置3。聲音處理裝置3基于由麥克風(fēng)陣列I的麥克風(fēng)拾取的說話者Hl的語音來檢測說話者Hl的位置。此外，聲音處理裝置3基于由麥克風(fēng)陣列I的麥克風(fēng)拾取的說話者Hl的語音來產(chǎn)生掩蔽聲音以掩蔽說話者Hl的語音，并且將該掩蔽聲音輸出至揚(yáng)聲器陣列2。此時(shí)，聲音處理裝置3控制將要對(duì)揚(yáng)聲器陣列2的各揚(yáng)聲器提供的聲音信號(hào)的延遲量，由此被第三人H3感知的聲源的位置(虛擬聲源的位置)被設(shè)定至說話者Hl的位置。這使第三人H3聽到說話者Hl的語音和來自相同位置的掩蔽聲音，并且充分地抑制雞尾酒會(huì)效應(yīng)。下文，將描述用于實(shí)現(xiàn)上述掩蔽系統(tǒng)的具體配置和操作。圖2是顯示麥克風(fēng)陣列
1、揚(yáng)聲器陣列2以及聲音處理裝置3的配置的框圖。麥克風(fēng)陣列I包括七個(gè)麥克風(fēng)11至
17。聲音處理裝置3包括A/D轉(zhuǎn)換器51至57、拾音信號(hào)處理部71、控制部72、掩蔽聲音產(chǎn)生部73、延遲處理部8和D/A轉(zhuǎn)換器61至68。揚(yáng)聲器陣列2包括八個(gè)揚(yáng)聲器21至28。麥克風(fēng)陣列的麥克風(fēng)的數(shù)量以及揚(yáng)聲器陣列的揚(yáng)聲器的數(shù)量不限于該示例。A/D轉(zhuǎn)換器51至57分別接收由麥克風(fēng)11至17拾取的語音，并且將該語音轉(zhuǎn)換成數(shù)字聲音信號(hào)。由A/D轉(zhuǎn)換器51至57轉(zhuǎn)換的數(shù)字聲音信號(hào)被供給到拾音信號(hào)處理部71。拾音信號(hào)處理部71檢測各數(shù)字聲音信號(hào)之間的相位差以檢測說話者的位置。圖3是顯示檢測說話者位置的方法的示例的示圖。如圖中所示，當(dāng)說話者Hl發(fā)出語音時(shí)，該聲音首先到達(dá)最接近說話者Hl的麥克風(fēng)(圖中為麥克風(fēng)17)，并且之后隨著時(shí)間流逝按照麥克風(fēng)16至麥克風(fēng)11的順序到達(dá)其它麥克風(fēng)。拾音信號(hào)處理部71獲得由麥克風(fēng)拾取的各聲音之間的相關(guān)性，并且獲取聲音從相同聲源到達(dá)的時(shí)間之間的差(相位差)。拾音信號(hào)處理部71假定麥克風(fēng)位于考慮了相位差的虛擬位置(圖中，通過虛線所指示的每個(gè)圓圈的位置)處，并且在聲源(說話者Hl)存在于離麥克風(fēng)的虛擬位置的距離彼此相等的位置處的假設(shè)下檢測說話者位置。檢測到的聲源位置的信息被輸出至控制部72。例如，聲源位置的信息是指示相對(duì)于麥克風(fēng)陣列I的中心位置的距離和方向(在向前方向設(shè)定為O度的情況下的偏轉(zhuǎn)角度)的信息。此外，拾音信號(hào)處理部71將與從檢測到的說話者位置拾取的說話者語音相關(guān)的數(shù)字聲音信號(hào)輸出到掩蔽聲音產(chǎn)生部73。拾音信號(hào)處理部71可以具有這樣一種配置:輸出由麥克風(fēng)陣列I的一個(gè)麥克風(fēng)拾取的聲音，或者可以具有另一種配置:在將由麥克風(fēng)拾取的數(shù)字聲音信號(hào)基于上述相位差進(jìn)行延遲以使相位均衡之后進(jìn)行合成，由此實(shí)現(xiàn)在聲源的位置方面具有高敏感性(方向性)的特性，并且輸出合成的數(shù)字聲音信號(hào)。根據(jù)該配置，主要以高信噪比拾取說話者語音，并且使從揚(yáng)聲器陣列輸出的掩蔽聲音的不需要的噪聲和反饋聲音幾乎不被麥克風(fēng)陣列I拾取。接下來，基于從拾音信號(hào)處理部71提供的說話者語音，掩蔽聲音產(chǎn)生部73產(chǎn)生掩蔽聲音以掩蔽說話者語音。掩蔽聲音可以是任何一種聲音，但優(yōu)選地可以是為聽者帶來較少不舒服感的聲音。例如，可以使用按如下方式產(chǎn)生的聲音:通過使說話者Hl發(fā)出的語音保持預(yù)定時(shí)間段，并且在時(shí)間軸或頻率軸上改變語音以轉(zhuǎn)換成無詞匯含義(談話內(nèi)容不能被理解)的聲音?；蛘?，作為多個(gè)男人和女人的語音且沒有詞匯含義的通用發(fā)出語音可以預(yù)先存儲(chǔ)在內(nèi)部存儲(chǔ)部(未示出)中，并且可以使用通用語音的頻率特性(例如，共振峰)接近說話者Hl的語音的聲音。此外，環(huán)境聲音(例如小溪的潺潺聲)和戲劇聲(例如鳥鳴)可以增加至掩蔽聲音中。所產(chǎn)生的掩蔽聲音被供給到延遲處理部8的延遲裝置81至88。延遲處理部8的延遲裝置81至88分別對(duì)應(yīng)于揚(yáng)聲器陣列2的揚(yáng)聲器21至28進(jìn)行布置，并且獨(dú)立地改變將要供給到各揚(yáng)聲器的聲音信號(hào)的延遲量。延遲裝置81至88中的延遲量受到控制部72的控制?？刂撇?2通過控制延遲裝置81至88中的延遲量而能夠?qū)⑻摂M聲源設(shè)定至預(yù)定位置。圖4是顯示通過使用揚(yáng)聲器陣列來定位虛擬聲源的方法的示圖。如圖中所示，控制部72將虛擬聲源Vl設(shè)定至從拾音信號(hào)處理部71提供的說話者Hl的位置。從虛擬聲源Vl至揚(yáng)聲器陣列2的各揚(yáng)聲器的距離彼此不同。當(dāng)按照從最接近虛擬聲源Vl的揚(yáng)聲器(圖中為揚(yáng)聲器21)開始且隨著時(shí)間流逝從揚(yáng)聲器22至揚(yáng)聲器28的順序從各揚(yáng)聲器輸出聲音時(shí)，可以使第三人(聽者)H3感知:揚(yáng)聲器存在于離用作焦點(diǎn)的虛擬聲源的位置的距離彼此相等的位置(圖中，由虛線指示的各個(gè)揚(yáng)聲器的位置)處，并且從這些虛擬揚(yáng)聲器位置同時(shí)發(fā)出掩蔽聲音。因此，第三人H3感知掩蔽聲音從說話者Hl的位置虛擬地發(fā)出。不要求說話者Hl的位置如圖所示地與虛擬聲源Vl的位置完全一致。例如，可以僅僅使各聲音的到來方向彼此一致?？刂撇?2可以在麥克風(fēng)陣列I和揚(yáng)聲器陣列2布置在相同位置處的假設(shè)下來設(shè)定將要供給到揚(yáng)聲器的聲音信號(hào)的延遲量。然而，更優(yōu)選的是基于麥克風(fēng)陣列I與揚(yáng)聲器陣列2之間的位置關(guān)系來設(shè)定延遲量。例如，在麥克風(fēng)陣列I與揚(yáng)聲器陣列2平行布置的情況下，控制部72接收麥克風(fēng)陣列I與揚(yáng)聲器陣列2之間的中心距，校正揚(yáng)聲器陣列的各揚(yáng)聲器的位置偏移，然后計(jì)算各延遲量。關(guān)于麥克風(fēng)陣列I與揚(yáng)聲器陣列2之間的位置關(guān)系，可以采用這樣的配置:設(shè)置了由使用者操作的操作部(未示出)，并且接收使用者的手動(dòng)輸入?；蛘?，例如，通過從揚(yáng)聲器陣列2的各揚(yáng)聲器輸出聲音并且由麥克風(fēng)陣列I的麥克風(fēng)拾取這些聲音以測量各到達(dá)時(shí)間，可以檢測麥克風(fēng)陣列I與揚(yáng)聲器陣列2之間的位置關(guān)系。在這種情況下，采用這樣的配置:如圖5所不,從揚(yáng)聲器陣列2的端部揚(yáng)聲器21和28輸出測量聲音(例如脈沖聲音),并且測量由麥克風(fēng)陣列I的端部麥克風(fēng)11和17拾取該測量聲音的時(shí)間。在這種情況下，可以測量麥克風(fēng)陣列I和揚(yáng)聲器陣列2的端部之間的距離，并且可以檢測麥克風(fēng)陣列I和揚(yáng)聲器陣列2的布置角度。在將揚(yáng)聲器陣列2和麥克風(fēng)陣列I彼此結(jié)合到一起的外殼中，揚(yáng)聲器陣列2與麥克風(fēng)陣列I之間的位置關(guān)系是固定的，并且，當(dāng)預(yù)先存儲(chǔ)位置關(guān)系時(shí)，無需在每次啟動(dòng)聲音處理裝置3時(shí)輸入或測量位置關(guān)系。接下來，圖6是顯示聲音處理裝置3的操作的流程圖。當(dāng)初始啟動(dòng)(打開電源)時(shí)，聲音處理裝置3開始操作。首先，聲音處理裝置3執(zhí)行麥克風(fēng)陣列I和揚(yáng)聲器陣列2的上述位置關(guān)系的測量(校準(zhǔn))(Sll)0在將揚(yáng)聲器陣列2和麥克風(fēng)陣列I彼此一起結(jié)合到外殼中的情況下，則不需要進(jìn)行該處理。其后，聲音處理裝置3等待直到拾取了說話者語音(sl2)。例如，當(dāng)具有可以確定聲音存在的水平的聲音被拾取時(shí)，確定拾取了說話者語音。在未拾取說話者語音且談話未進(jìn)行的情況下，掩蔽聲音是不需要的，并因此設(shè)定這樣的模式:產(chǎn)生掩蔽聲音的處理以及定位的處理處于等待狀態(tài)。然而，可以省去等待過程，并且可以設(shè)定始終執(zhí)行產(chǎn)生掩蔽聲音的處理以及定位的處理的模式。如果拾取了說話者語音，那么聲音處理裝置3通過拾音信號(hào)處理部71檢測說話者位置(sl3)。通過如上所述地檢測由麥克風(fēng)陣列I的各麥克風(fēng)拾取的聲音的相位差來檢測說話者位置。然后，聲音處理裝置3通過掩蔽聲音產(chǎn)生部73產(chǎn)生掩蔽聲音(sl4)。此時(shí)，優(yōu)選地，在使麥克風(fēng)的相位均衡的同時(shí)合成的聲音信號(hào)(其中方向性指向說話者位置)從拾音信號(hào)處理部71輸入至掩蔽聲音產(chǎn)生部73，并且產(chǎn)生根據(jù)說話者語音的掩蔽聲音。優(yōu)選地，掩蔽聲音處于其音量根據(jù)拾取的說話者語音的水平而變化的模式下。在拾取的說話者語音的水平低的情況下，說話者語音以低水平到達(dá)第三人H3，并且談話內(nèi)容幾乎不會(huì)被理解。因此，掩蔽聲音的水平也可以降低。在拾取的說話者語音的水平高的情況下，相比之下，說話者語音以高水平到達(dá)第三人H3，并且談話內(nèi)容易于被理解。因此，優(yōu)選的是掩蔽聲音的水平也設(shè)定為高。最后，在聲音處理裝置3中，控制部72設(shè)定延遲量使得掩蔽聲音定位在說話者位置處(sl5)。當(dāng)通過拾音信號(hào)處理部71檢測到的說話者位置發(fā)生變化時(shí)，優(yōu)選地，掩蔽聲音產(chǎn)生部73執(zhí)行增加掩蔽聲音的水平的處理。在這種情況下，當(dāng)確定說話者位置變化時(shí)，拾音信號(hào)處理部71將觸發(fā)信號(hào)輸出至掩蔽聲音產(chǎn)生部73，并且，當(dāng)輸入觸發(fā)信號(hào)時(shí)，掩蔽聲音產(chǎn)生部73臨時(shí)將掩蔽聲音的水平設(shè)定為高。當(dāng)說話者位置變化時(shí)，預(yù)期的是，說話者位置和掩蔽聲音的虛擬聲源的位置暫時(shí)彼此不同直到由控制部72進(jìn)行的延遲量的計(jì)算結(jié)束。在這種情況下，存在生成雞尾酒會(huì)效應(yīng)且降低掩蔽效果的可能性，并因此設(shè)定了這樣的模式:臨時(shí)增大掩蔽聲音的音量并防止掩蔽效果降低。如上所述，聲音處理裝置3將掩蔽聲音的虛擬聲源的位置定位至檢測到的說話者位置，由此使第三人H3聽見說話者Hl的語音和來自相同位置的掩蔽聲音，并且能夠充分地抑制雞尾酒會(huì)效應(yīng)。在該實(shí)施例中，已對(duì)通過檢測麥克風(fēng)陣列I的麥克風(fēng)的相位差而檢測說話者位置的示例進(jìn)行了描述。檢測說話者位置的方法不限于該示例。例如，可以采用這樣的示例:其中說話者具有包含GPS功能的遠(yuǎn)程控制器，并且將位置信息傳輸至聲音處理裝置。或者，將麥克風(fēng)設(shè)置在遠(yuǎn)程控制器中，從揚(yáng)聲器陣列的多個(gè)揚(yáng)聲器輸出測量聲音，并且聲音處理裝置測量各到達(dá)時(shí)間，由此檢測說話者位置。在上面的描述中，已對(duì)使用布置有多個(gè)揚(yáng)聲器的揚(yáng)聲器陣列以及布置有多個(gè)麥克風(fēng)的麥克風(fēng)陣列I的示例進(jìn)行了描述。作為替代，將單獨(dú)的揚(yáng)聲器和麥克風(fēng)置于相應(yīng)預(yù)定位置處，并且生成掩蔽聲音。圖7是顯示另一實(shí)施例中的掩蔽系統(tǒng)的配置的示圖。圖8是顯示圖7所示的掩蔽系統(tǒng)的各麥克風(fēng)、各揚(yáng)聲器和聲音處理裝置的配置的框圖。如圖7所示，在該實(shí)施例的掩蔽系統(tǒng)中，將均由單獨(dú)的裝置配置的麥克風(fēng)1A、1B、IC布置在說話者H1A、H1B、HlC所處的區(qū)域中。麥克風(fēng)IA被置于說話者HlA附近，麥克風(fēng)IB被置于說話者HlB附近，并且麥克風(fēng)IC被置于說話者HlC附近。揚(yáng)聲器2A被置于麥克風(fēng)IA附近,揚(yáng)聲器2B被置于麥克風(fēng)IB附近,并且揚(yáng)聲器2C被置于麥克風(fēng)IC附近。揚(yáng)聲器2A、2B、2C布置成朝向第三人H3所處的區(qū)域發(fā)出聲音。以與上述實(shí)施例相似的方式，麥克風(fēng)1A、1B、1C的拾音信號(hào)經(jīng)由A/D轉(zhuǎn)換器51至53進(jìn)行模數(shù)轉(zhuǎn)換，并且之后被供給到拾音信號(hào)處理部71A。拾音信號(hào)處理部7IA根據(jù)拾音信號(hào)的音量水平來檢測與發(fā)聲的說話者接近的麥克風(fēng)，并且將檢測信息輸出至控制部72A。將拾音信號(hào)給予掩蔽聲音產(chǎn)生部73A。以上面實(shí)施例所述的方式，通過使用拾音信號(hào)，掩蔽聲音產(chǎn)生部73A產(chǎn)生掩蔽聲音，并且將掩蔽聲音供給到聲音信號(hào)處理部801、802、
803。在控制部72A中，對(duì)彼此接近的麥克風(fēng)和揚(yáng)聲器之間的對(duì)應(yīng)關(guān)系進(jìn)行存儲(chǔ)?？刂撇?2A選擇與由拾音信號(hào)處理部7IA檢測到的麥克風(fēng)相對(duì)應(yīng)的揚(yáng)聲器,并且控制聲音信號(hào)處理部801、802、803使得僅該揚(yáng)聲器發(fā)出聲音。具體地，當(dāng)說話者HlA發(fā)出語音聲音并且檢測到麥克風(fēng)IA時(shí)，控制部72A僅使聲音信號(hào)處理部801輸出掩蔽聲音，使得掩蔽聲音僅從與檢測到的麥克風(fēng)接近的揚(yáng)聲器2A發(fā)出。當(dāng)說話者HlB發(fā)出語音聲音并且檢測到麥克風(fēng)IB時(shí)，控制部72A僅使聲音信號(hào)處理部802輸出掩蔽聲音，使得掩蔽聲音僅從與檢測到的麥克風(fēng)接近的揚(yáng)聲器2B發(fā)出。當(dāng)說話者HlC發(fā)出語音聲音并且檢測到麥克風(fēng)IC時(shí)，控制部72A僅使聲音信號(hào)處理部803輸出掩蔽聲音，使得掩蔽聲音僅從與檢測到的麥克風(fēng)接近的揚(yáng)聲器2C發(fā)出。圖9是顯示圖7所示的掩蔽系統(tǒng)中的聲音處理裝置的操作的流程圖。聲音處理裝置3A等待(slOl:否)直到拾取了說話者語音。檢測拾取的聲音的方法類似于圖6所示的上述流程圖。如果拾取了說話者語音(slOl:是)，則聲音處理裝置3A對(duì)麥克風(fēng)1A、1B、1C的拾音信號(hào)進(jìn)行分析以識(shí)別拾取說話者語音的麥克風(fēng)(sl02)。接下來，聲音處理裝置3A檢測與識(shí)別出的麥克風(fēng)相對(duì)應(yīng)的揚(yáng)聲器(sl03)。然后，聲音處理裝置3A僅使檢測到的揚(yáng)聲器發(fā)出掩蔽聲音(sl04)。根據(jù)上述配置和處理，從發(fā)聲的說話者的位置的附近發(fā)出掩蔽聲音，并且能夠充分地抑制雞尾酒會(huì)效應(yīng)?？梢圆捎靡韵旅娴姆绞脚渲玫难诒蜗到y(tǒng)。圖10是顯示不同于上述掩蔽系統(tǒng)的實(shí)施例中的掩蔽系統(tǒng)的配置的不圖。圖11是顯不圖10所不的掩蔽系統(tǒng)的各麥克風(fēng)、各揚(yáng)聲器和聲音處理裝置的配置的框圖。
在圖10所示的掩蔽系統(tǒng)中，其上安裝有麥克風(fēng)ΙΑ、1B、1C、ID、IE、IF的桌子被置于說話者H1A、H1B、HlC所處的區(qū)域中。將麥克風(fēng)1A、1B、1C和麥克風(fēng)ID、1E、1F放置成使得相應(yīng)的聲音拾取方向是彼此相對(duì)的。在圖10的示例中，具體地，麥克風(fēng)1A、1B、1C拾取說話者H1A、HlB所在側(cè)的聲音，并且麥克風(fēng)ID、IE、IF拾取說話者HlC所在側(cè)的聲音。揚(yáng)聲器2A、2B、2C、2D被置于說話者H1A、H1B、HlC所在的區(qū)域與第三人H3所在的
區(qū)域之間，并且放置間隔和位置關(guān)系可以是不固定的。以與上述實(shí)施例相似的方式，麥克風(fēng)1A、1B、1C、1D、1E、1F的拾音信號(hào)經(jīng)由A/D轉(zhuǎn)換器51至56進(jìn)行模數(shù)轉(zhuǎn)換，并且之后供給拾音信號(hào)處理部71B。拾音信號(hào)處理部71B根據(jù)拾音信號(hào)的音量水平來檢測與發(fā)聲的說話者接近的麥克風(fēng)，并且將檢測信息輸出至控制部72B。還將拾音信號(hào)供給掩蔽聲音產(chǎn)生部73B。以上面實(shí)施例所述的方式，通過使用拾音信號(hào)，掩蔽聲音產(chǎn)生部73B產(chǎn)生掩蔽聲音，并且將掩蔽聲音供給到聲音信號(hào)處理部801至
804。在控制部72B中，對(duì)麥克風(fēng)認(rèn)、川、1(:、10、^、1 與揚(yáng)聲器24、28、2(:、20之間的位
置關(guān)系進(jìn)行存儲(chǔ)。能夠通過上述實(shí)施例中所謂校準(zhǔn)的處理來獲得位置關(guān)系?？刂撇?2B選擇最接近由拾音信號(hào)處理部71B檢測到的麥克風(fēng)的揚(yáng)聲器，并且控制聲音信號(hào)處理部801至804使得僅該揚(yáng)聲器發(fā)出聲音。根據(jù)上述配置和處理，第三人H3能夠沿該揚(yáng)聲器方向聽見掩蔽聲音，并且能夠充分地抑制雞尾酒會(huì)效應(yīng)。控制部72B可以通過利用揚(yáng)聲器2A、2B、2C、2D與麥克風(fēng)ΙΑ、1B、1C、ID、IE、IF之
間的距離來確定從揚(yáng)聲器2A、2B、2C、2D發(fā)出的聲音的水平，并且執(zhí)行調(diào)節(jié)聲音信號(hào)處理部801至804的增益的控制。在這種情況下，拾音信號(hào)處理部71B檢測麥克風(fēng)1A、1B、1C、1D、1E、1F的拾音信號(hào)的水平，并且將這些水平輸出至控制部72B?？刂撇?2B預(yù)先測量麥克風(fēng)ΙΑ、1B、1C、ID、IE、IF與揚(yáng)聲器2A、2B、2C、2D之間的距
離。這可以通過上述校準(zhǔn)處理而得以實(shí)現(xiàn)。接下來，控制部72B針對(duì)麥克風(fēng)認(rèn)、川、1(:、10、比、1 和揚(yáng)聲器24、28、2(:、20的每
個(gè)組合計(jì)算系數(shù)(該系數(shù)為距離的倒數(shù))，并且存儲(chǔ)針對(duì)各麥克風(fēng)和各揚(yáng)聲器的相應(yīng)組合計(jì)算出的各系數(shù)。例如，系數(shù)All存儲(chǔ)用于揚(yáng)聲器2A和麥克風(fēng)IA的組合，并且系數(shù)A45存儲(chǔ)用于揚(yáng)聲器2D和麥克風(fēng)IE的組合。結(jié)果，設(shè)定了下面5X4系數(shù)矩陣A。每個(gè)系數(shù)可以例如根據(jù)距離的平方的倒數(shù)進(jìn)行計(jì)算，并且設(shè)定成使得值隨著距離變大而變小。[表達(dá)式I]
"AU Al 2 Al 3 Al 4 A15"
A21 A22 A23 A24 A25A31 A32 A33 A34 A35 ,A41 A42 Λ43 A44 A45,然后，控制部72B獲得麥克風(fēng)ΙΑ、1B、1C、ID、IE、IF的拾音信號(hào)水平作為拾音信號(hào)水平序列Ss= (Ssl, Ss2，Ss3，Ss4，Ss5) T，其中Ssl是麥克風(fēng)IA的拾音信號(hào)水平，Ss2是麥克風(fēng)IB的拾音信號(hào)水平，Ss3是麥克風(fēng)IC的拾音信號(hào)水平，Ss4是麥克風(fēng)ID的拾音信號(hào)水平，以及Ss5是麥克風(fēng)IE的拾音信號(hào)水平?？刂撇?2B使拾音信號(hào)水平序列Ss與系數(shù)矩陣A相乘，如下面表達(dá)式所示，以計(jì)算增益序列G= (Ga，Gb, Ge，Gd)。在表達(dá)式中，Ga是揚(yáng)聲器2A的增益，Gb是揚(yáng)聲器2B的增益，Ge是揚(yáng)聲器2C的增益，以及Gd是揚(yáng)聲器2D的增益。[表達(dá)式2]
權(quán)利要求
1.一種音頻輸出裝置，包括: 說話者位置檢測部，其適于檢測說話者的位置；掩蔽聲音產(chǎn)生部，其適于產(chǎn)生掩蔽聲音；多個(gè)揚(yáng)聲器，其適于輸出所述掩蔽聲音；以及定位控制部，其適于基于由所述說話者位置檢測部檢測到的說話者位置來控制所述掩蔽聲音的定位位置，并且將與所述掩蔽聲音有關(guān)的聲音信號(hào)供給到所述多個(gè)揚(yáng)聲器中的至少一個(gè)。
2.根據(jù)權(quán)利要求1所述的音頻輸出裝置，其中，所述定位控制部將所述掩蔽聲音的定位位置設(shè)定至由所述說話者位置檢測部檢測到的說話者位置。
3.根據(jù)權(quán)利要求1或2所述的音頻輸出裝置，還包括: 麥克風(fēng)陣列，其中布置有用于拾取聲音的多個(gè)麥克風(fēng)，其中所述說話者位置檢測部基于由所述多個(gè)麥克風(fēng)拾取的聲音的相位差來檢測所述說話者位置。
4.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的音頻輸出裝置，其中，在由所述說話者位置檢測部檢測到的說話者位置發(fā)生變化的情況下，所述掩蔽聲音產(chǎn)生部將所述掩蔽聲音的水平設(shè)定到高水平。
5.根據(jù)權(quán)利要求1所述的音頻輸出裝置，其中，所述說話者位置檢測部將拾取的聲音的音量水平最高的麥克風(fēng)的位置設(shè)定為所述說話者位置；并且其中所述定位控制部將與所述掩蔽聲音有關(guān)的聲音信號(hào)供給到與所述拾取的聲音的音量水平最高的麥克風(fēng)最接近的揚(yáng)聲器。
6.一種音頻輸出裝置，包括: 多個(gè)麥克風(fēng)，其適于拾取聲音；掩蔽聲音產(chǎn)生部，其適于產(chǎn)生掩蔽聲音；多個(gè)揚(yáng)聲器，其被供給與所述掩蔽聲音有關(guān)的聲音信號(hào)，并且所述多個(gè)揚(yáng)聲器適于發(fā)出所述掩蔽聲音；以及定位控制部，其適于控制將要供給到所述多個(gè)揚(yáng)聲器的與所述掩蔽聲音有關(guān)的聲音信號(hào)的增益，其中，所述定位控制部將所述多個(gè)麥克風(fēng)的各拾音信號(hào)的水平乘以增益設(shè)置系數(shù)以調(diào)節(jié)將要供給到所述多個(gè)揚(yáng)聲器的與所述掩蔽聲音有關(guān)的聲音信號(hào)的增益，所述增益設(shè)置系數(shù)的值隨著所述多個(gè)麥克風(fēng)與所述多個(gè)揚(yáng)聲器之間的距離的變大而變小。
7.一種音頻輸出方法，其包括以下步驟: 檢測說話者的位置；產(chǎn)生掩蔽聲音；從多個(gè)揚(yáng)聲器中的至少一個(gè)輸出所述掩蔽聲音；以及控制所述掩蔽聲音的虛擬聲源的定位位置以使得所述虛擬聲源的位置處于或鄰近于在說話者位置檢測步驟中檢測到的說話者位置，并且將與所述掩蔽聲音有關(guān)的聲音信號(hào)供給到所述多個(gè)揚(yáng)聲器中的至少一個(gè)。
8.根據(jù)權(quán)利要求7所述的音頻輸出方法，其中，在定位控制步驟中，所述掩蔽聲音的定位位置被設(shè)定至在所述說話者位置檢測步驟中檢測到的所述說話者位置。
9.根據(jù)權(quán)利要求7或8所述的音頻輸出方法，還包括: 通過布置有多個(gè) 麥克風(fēng)的麥克風(fēng)陣列來拾取聲音的步驟，其中在所述說話者位置檢測步驟中，基于由所述多個(gè)麥克風(fēng)拾取的聲音的相位差來檢測所述說話者位置。
10.根據(jù)權(quán)利要求7至9中任一項(xiàng)所述的音頻輸出方法，其中，當(dāng)在所述說話者位置檢測步驟中檢測到的所述說話者位置發(fā)生變化的情況下，在掩蔽聲音產(chǎn)生步驟中，所述掩蔽聲音的水平被設(shè)定至高水平。
11.根據(jù)權(quán)利要求7所述的音頻輸出方法，其中，在所述說話者位置檢測步驟中，拾取的聲音的音量水平最高的麥克風(fēng)的位置被設(shè)定為所述說話者位置；并且其中在定位控制步驟中，與所述掩蔽聲音有關(guān)的聲音信號(hào)被供給到與所述拾取的聲音的音量水平最高的麥克風(fēng)最接近的揚(yáng)聲器。
12.—種音頻輸出方法，其包括以下步驟: 通過多個(gè)麥克風(fēng)拾取聲音；產(chǎn)生掩蔽聲音；將與所述掩蔽聲音有關(guān)的聲音信號(hào)供給到多個(gè)揚(yáng)聲器，并且通過所述多個(gè)揚(yáng)聲器發(fā)出所述掩蔽聲音；以及控制將要供給到所述多個(gè)揚(yáng)聲器的與所述掩蔽聲音有關(guān)的聲音信號(hào)的增益，其中在定位控制步驟中，將所述多個(gè)麥克風(fēng)的各拾音信號(hào)的水平乘以增益設(shè)置系數(shù)以調(diào)節(jié)將要供給到所述多個(gè)揚(yáng)聲器的與所述掩蔽聲音有關(guān)的聲音信號(hào)的增益，所述增益設(shè)置系數(shù)的值隨著所述多個(gè)麥克風(fēng)與所述多個(gè)揚(yáng)聲器之間的距離的變大而變小。
全文摘要
一種音頻輸出裝置包括檢測說話者位置的說話者位置檢測裝置；產(chǎn)生掩蔽噪聲的掩蔽噪聲產(chǎn)生部；輸出掩蔽噪聲的多個(gè)揚(yáng)聲器；以及定位控制單元，定位控制單元基于由說話者位置檢測單元檢測到的說話者位置來控制掩蔽噪聲的定位位置，并且將與掩蔽噪聲有關(guān)的音頻信號(hào)供給至多個(gè)揚(yáng)聲器中的至少一個(gè)。
文檔編號(hào)G10K11/178GK103119642SQ20118004526
公開日2013年5月22日申請(qǐng)日期2011年9月27日優(yōu)先權(quán)日2010年9月28日
發(fā)明者里吉一浩, 齋藤康祐申請(qǐng)人:雅馬哈株式會(huì)社

完整全部詳細(xì)技術(shù)資料下載