專利名稱:聲音發(fā)射和采集設備以及聲音發(fā)射和采集設備的控制方法
技術領域:
本發(fā)明涉及一種用于在多個點之間通過網(wǎng)絡等進行的電話會議 等中的聲音發(fā)射和采集設備,具體地講,涉及一種聲音發(fā)射和采集設 備以及這種聲音發(fā)射和采集設備的控制方法,在這種設備中,將麥克 風和揚聲器放置在相對較近的位置。
背景技術:
通常,已經(jīng)將用于在舉行電話會議的每個點安裝聲音發(fā)射和采 集設備、通過網(wǎng)絡連接這些設備以及傳播聲音信號的方法用作在遠程 位置之間進行電話會議的方法。于是,提供了很多這樣的設備,其中, 在這些聲音發(fā)射和采集設備的機柜中同時安裝了用于發(fā)射對方設備
端的聲音的揚聲器和用于采集自己一方設備端的聲音的麥克風。
例如,在專利參考文獻1的電話會議設備(聲音發(fā)射和采集設 備)中,從放置在天花板表面上的揚聲器發(fā)射通過網(wǎng)絡輸入的聲音信 號,采集每個麥克風的聲音信號,并通過網(wǎng)絡將聲音采集信號發(fā)送到 外面,這些麥克風放置在側表面,采用多個不同的方向作為各自的前 向。
專利參考文獻1: JP-A-8-29869
發(fā)明內容
本發(fā)明要解決的問題
不過,在專利參考文獻1的設備中,麥克風鄰接揚聲器,從而, 在每個麥克風的聲音采集信號中大量地包括來自揚聲器的繞射聲音。 于是,當這個繞射聲音的音量比較大,而且來自講話者的發(fā)言聲音的 音量較小時,不能準確地檢測到講話者的方位來準確地采集來自這個 方位的聲音。
6從而,本發(fā)明的目的是提供一種聲音發(fā)射和采集設備以及這種 聲音發(fā)射和采集設備的控制方法,該設備能夠在不被繞射聲音影響的 情況下檢測到講話者方位,并能夠確實地采集和輸出來自講話者的聲
音
解決這些問題的手段
本發(fā)明的聲音發(fā)射和采集設備的特征在于包括聲音發(fā)射裝置, 其包括揚聲器;聲音采集裝置,其包括多個以預定格局布置的多個麥 克風;聲音采集束信號產(chǎn)生裝置,用于通過對聲音采集裝置的每個麥 克風的聲音采集信號執(zhí)行延遲和幅度處理,來產(chǎn)生多個具有各自不同 的指向性的聲音采集束信號;以及聲音采集束信號選擇裝置,用于計 算在各個定時處每個聲音采集束信號的能量和所有聲音采集束信號 的平均能量之間的能量比值,并選擇能量比值的絕對值電平是預定值 或高于預定值的聲音采集束信號。
在這種結構中,聲音采集束信號選擇裝置計算聲音采集束信號 產(chǎn)生裝置所產(chǎn)生的所有聲音采集束信號的信號能量的平均值。然后, 聲音采集束信號選擇裝置計算每個聲音采集束信號的信號能量對信 號能量平均值的能量比值。在本文中,當從某個方位采集發(fā)言聲音時, 對應于該方位的聲音采集束信號的信號能量變高,在與該方位不對應 的聲音采集束信號的信號能量中沒有變化。從而,只有對應于發(fā)言聲 音的入射方位的聲音采集束信號的能量比值變高。聲音采集束信號選 擇裝置參照平均值來預置一個預定的閾值,當檢測到其具有的信號能 量比值的絕對值電平超過了閾值的聲音釆集束信號時,選擇該聲音采 集束信號。因此,對于每個聲音采集裝置選擇了對應于講話者方位的 聲音采集束信號,而不會受到信號能量基本相等的繞射聲音的影響。
而且,本發(fā)明的聲音發(fā)射和采集設備的特征在于包括聲音發(fā) 射裝置,其包括揚聲器;聲音采集裝置,其包括多個具有以預定格局 布置的各自不同定向中的指向性的麥克風,并將來自每個麥克風的輸 出信號用作聲音采集束信號;以及聲音采集束信號選擇裝置,用于計 算在各個定時處每個聲音采集束信號的能量和所有聲音采集束信號 的平均能量之間的能量比值,并選擇能量比值的絕對值電平是預定值或高于預定值的聲音采集束信號。
在這種結構中,為每個麥克風提供指向性,在不采用聲音采集 束信號產(chǎn)生裝置的情況下根據(jù)每個麥克風的輸出直接形成聲音采集 束信號。而且在這種結構中,如上文所述,由聲音采集束信號選擇裝 置選擇聲音采集束。
而且,本發(fā)明的聲音發(fā)射和采集設備的特征在于包括包括揚 聲器的聲音發(fā)射裝置,其用于以關于預定的參考平面對稱的聲壓來發(fā) 射輸入的聲音信號;聲音采集裝置,其由第一麥克風組和第二麥克風 組組成,第一麥克風組采集預定參考平面的一側的聲音,第二麥克風 組采集另一側的聲音;聲音采集束信號產(chǎn)生裝置,用于產(chǎn)生第一聲音 采集束信號組的每個聲音采集束信號和第二聲音采集束信號組的每 個聲音采集束信號,第一聲音采集束信號組是通過對第一麥克風組的 聲音采集信號執(zhí)行延遲和幅度處理獲得的,第二聲音采集束信號組是 通過對關于預定參考平面與第一麥克風組的聲音采集信號對稱的第 二麥克風組的聲音采集信號執(zhí)行延遲和幅度處理獲得的;聲音采集束 信號選擇裝置計算在各個定時處關于參考平面彼此對稱的聲音采集 束信號之間的能量比值,檢測出能量比值不在預定參考電平范圍內的 聲音采集束信號的組合,并根據(jù)關于能量比值高于或低于參考電平范 圍的信息,來從組成這個組合的兩個聲音采集束信號中選擇一個聲音 采集束信號。
在這個結構中,聲音采集束信號選擇裝置計算在彼此關于參考 平面對稱的位置上的聲音采集束信號之間的能量比值。在本文中,對 應于講話者方位并相對于參考平面出現(xiàn)在講話方的聲音采集束信號 的信號能量變高,而與這個聲音釆集束信號對稱的聲音采集束信號的 能量變化很小。從而,這個組合的能量比值改變。而且,與講話者方 位不對應的聲音采集束信號的信號能量變化很小,從而其它組合的能 量比值不變。結果,只有包括對應于發(fā)言聲音入射方位的聲音采集束 信號的組合的能量比值變高。參照該組合的能量比值的平均值,聲音 采集束信號選擇裝置預置預定的閾值,并且當檢測到了信號能量比值 的絕對值電平超過了閾值的聲音采集束信號組合時,選擇該組合。然后,根據(jù)關于檢測到的組合的信號能量是高于還是低于平均值的信 息,聲音采集束信號選擇裝置選擇聲音采集束信號中的任意一個。即, 采用下述事實來選擇聲音采集束信號在計算能量比值時,當作用參 考方的聲音采集束信號的能量信號較小時,在能量比值變大的方向上 進行改變,當用作參考方的聲音采集束信號的能量信號較大時,在能 量比值變小的方向上進行改變。
而且,本發(fā)明的聲音發(fā)射和采集設備的特征在于包括包括揚 聲器的聲音發(fā)射裝置,用于以關于預定的參考平面對稱的聲壓來發(fā)射 輸入的聲音信號;聲音采集裝置,其包括第一麥克風組和第二麥克風 組,第一麥克風組包括多個在相對于參考平面的一側具有各個不同方 位上的指向性的麥克風,并將來自每個麥克風的輸出信號用作聲音采 集束信號,第二麥克風組包括在相對于另一側具有各個不同方位上的 指向性的多個麥克風,并將來自每個麥克風的輸出信號用作聲音采集 束信號,所述聲音采集裝置用于把通過第一麥克風組獲得的聲音采集 束信號和通過第二麥克風組獲得的聲音采集束信號設置成關于參考 平面對稱;以及聲音采集束信號選擇裝置,用于計算在各個定時處關 于參考平面彼此對稱的聲音采集束信號之間的能量比值,檢測出能量 比值不在預定參考電平范圍內的聲音采集束信號的組合,并根據(jù)關于 能量比值高于或低于參考電平范圍的信息,從組成這個組合的兩個聲 音采集束信號中選擇一個聲音采集束信號。
在這種結構中,在不采用聲音采集束信號的情況下,通過為每 個麥克風提供指向性來根據(jù)麥克風輸出直接形成聲音采集束信號。在 這種情況下,關于參考平面對稱地設置第一麥克風組的麥克風的指向 性所形成的聲音采集束組和第二麥克風組的麥克風的指向性所形成 的聲音采集束組。因此,由聲音采集束信號選擇裝置如上文所述地選 擇聲音采集束。
而且,本發(fā)明的聲音發(fā)射和采集設備的特征在于通過聲音采 集束信號選擇裝置,將能量比值轉換為以分貝為單位,并根據(jù)轉換為 以分貝為單位的值來選擇聲音采集束信號。
在這種結構中,通過采用以分貝為單位,可以明顯地指示信號能量比值中的微小變化。因此,能夠更精確地執(zhí)行用信號能量比值來 檢測對稱位置上的聲音采集束信號組合和聲音采集束信號。
本發(fā)明的聲音發(fā)射和采集設備的控制方法包括下列步驟根據(jù) 從預定格局布置的多個麥克風輸出的聲音采集信號,產(chǎn)生具有各自不 同的指向性的多個聲音采集束信號的步驟;計算在各個定時處每個聲 音采集束信號的能量和所有聲音采集束信號的平均能量之間的能量 比值的步驟;以及選擇其中的能量比值的絕對值電平是預定值或大于 預定值的聲音采集束信號的步驟。
本發(fā)明的聲音發(fā)射和采集設備的控制方法包括下列步驟根據(jù) 從用于對預定參考平面的一側的聲音進行采集的第一麥克風組輸出 的聲音采集信號,產(chǎn)生多個具有各自不同的指向性的第一聲音采集束 信號的步驟;根據(jù)從用于對關于預定參考平面分別與多個第一聲音采 集束信號對稱的另一側聲音進行采集的第二麥克風組輸出的聲音采 集信號,產(chǎn)生多個具有各自不同的指向性的第二聲音采集束信號的步 驟;計算在各個定時處彼此關于參考平面對稱的聲音采集束信號之間
的能量比值的步驟;檢測出其中的能量比值不在預定參考電平范圍內 的聲音采集束信號的組合的步驟;以及根據(jù)關于能量比值高于還是低 于參考電平范圍的信息,從構成所述組合的兩個聲音采集束信號中選 擇一個聲音采集束信號的步驟。
本發(fā)明的效果
根據(jù)本發(fā)明,可以精確地檢測到諸如講話者之類的聲音源的方 位,并確定地采集和輸出來自該方位的聲音,而不會受繞射聲音電平 的影響。
圖1A是示出了根據(jù)本發(fā)明的聲音發(fā)射和采集設備的麥克風和揚 聲器的布置的平面圖。
圖1B是示出了所述聲音發(fā)射和采集設備所形成的聲音采集束區(qū) 域的圖。
圖2是實施例的聲音發(fā)射和采集設備的功能框圖。圖3是示出了圖2所示的聲音采集束選擇部件19的結構的框圖。
圖4A是示出了實施例的聲音發(fā)射和采集設備1被放置在桌面C 上,兩個會議人員A、 B主持會議,會議人員A說話時的情況的圖示。
圖4B是示出了實施例的聲音發(fā)射和采集設備1被放置在桌面C 上,兩個會議人員A、 B主持會議,會議人員B說話時的情況的圖示。
圖4C是示出了實施例的聲音發(fā)射和采集設備1被放置在桌面C 上,兩個會議人員A、 B主持會議,會議人員A、 B不說話時的情況的 圖示。
圖5是示出了每個聲音采集束信號的發(fā)射聲音的信號電平數(shù)據(jù) Esp和每個聲音采集束信號的信號電平數(shù)據(jù)E11 E14、 E21 E24的 時間序列(T)分布的圖示。
圖6是示出了平均信號電平數(shù)據(jù)Eav以及電平比值CE11 CE14、 CE21 CE24的時間序列(T)分布的圖示。
圖7是分別示出了電平比值CE1至CE4的時間序列(T)分布的圖示。
參考數(shù)字和標號的說明
1聲音發(fā)射和采集設備
101機柜
11輸入輸出連接器
12輸入輸出I/F
13聲音發(fā)射指向性控制宕 件
14D/A轉換器
15聲音發(fā)射放大器
16聲音采集放大器
17A/D轉換器
181,182 聲音采集束生成部件
19聲音采集束選擇部件
191BPF (帶通濾波器)
192全波整流電路
193電平檢測電路194 電平比值計算電路
195 電平比較器
196 聲音采集束信號選擇電路 20 回聲消除部件
201 自適應濾波器
202 后處理器 SP1 SP3 揚聲器 SPA10 揚聲器陣列 MIC11 MIC17, MIC21 MIC27 麥克風 MA10,MA20 麥克風陣列
具體實施例方式
參照附圖對根據(jù)本發(fā)明第一實施例的聲音發(fā)射和采集設備進行 說明。
圖1A是示出了根據(jù)本發(fā)明的聲音發(fā)射和采集設備的麥克風和揚
聲器的布置的平面圖,圖1B是示出了圖1A中所示的聲音發(fā)射和采集
設備所形成的聲音采集束區(qū)域的圖。
圖2是該實施例的聲音發(fā)射和采集設備1的功能框圖。 該實施例的聲音發(fā)射和采集設備1被配置為在機柜101中包括
如圖2所示的多個揚聲器SP1 SP3、多個麥克風MIC11 MIC17、
MIC21 MIC27以及功能性部件。
機柜ioi基本上被制成為在一個方向上為長尺寸的長方體形狀,
在機柜101的長尺寸側(表面)的兩端上安裝了具有固定高度的支撐 部件(未示出),該支撐部件用來將機柜101的較低表面與安裝表面 分開一個預定距離。另外,在下文的說明中,將機柜101的四個側表 面中的長尺寸的表面叫做長尺寸表面,將四個側表面中的短尺寸的表 面叫做短尺寸表面。
在機柜101的下表面上安裝具有相同形狀的無指向性單元揚聲 器SP1 SP3。沿長尺寸方向以固定間距線性地安裝這些單元揚聲器 SP1 SP3,并且這些單元揚聲器被安裝來使得連接各個單元揚聲器
12SP1 SP3的中心的直線沿機柜101的長尺寸表面延伸、水平方向位 置與連接短尺寸表面中心的中心軸100匹配。也就是說,連接揚聲器 SP1 SP3的中心的直線被放置在包括中心軸100的垂直參考平面中。 從而,通過布置和放置單元揚聲器SP1 SP3來構建揚聲器陣列 SPAIO。在這種狀態(tài)下,當從揚聲器陣列SPA10的單元揚聲器SP1 SP3的每一個發(fā)出聲音時,發(fā)出的聲音同樣地傳播到兩個長尺寸表 面。在這種情況下,發(fā)出來傳播到兩個相對的長尺寸表面的聲音在垂 直于參考平面的相互對稱的方向上傳播。
在機柜101的一個長尺寸表面上安裝規(guī)格相同的麥克風 MIC11 MIC17。在沿長尺寸方向上以固定間距線性地安裝這些麥克風 MIC11 MIC17,從而構建麥克風陣列MAIO。而且,在機柜101的另 一個長尺寸表面上安裝相同規(guī)格的麥克風MIC21 MIC27。同樣在沿 長尺寸方向上以固定間距線性地安裝這些麥克風MIC21 MIC27,從 而構建麥克風陣列MA20。放置麥克風陣列MA10和麥克風陣列MA20, 以便這種布置的軸的垂直位置相匹配,而且,將麥克風陣列MA10的 每個麥克風MIC11 MIC17和麥克風陣列MA20的每個麥克風MIC21 MIC27分別放置在相對于參考平面的對稱位置上。例如,具體來講, 麥克風MIC11和麥克風MIC21具有相對于參考平面的對稱關系,以及 類似地,麥克風MIC17和麥克風MIC27具有對稱關系。
另外,在該實施例中,揚聲器陣列SPA10的揚聲器的數(shù)量被設 置為3,每個麥克風陣列MA10、MA20的麥克風的數(shù)量分別被設置為7, 但不限于此,可以根據(jù)規(guī)格適當?shù)卦O置揚聲器的數(shù)量和麥克風的數(shù) 量。而且,揚聲器陣列的每個揚聲器之間的距離和麥克風陣列的每個 麥克風之間的距離可以不是固定的,例如,可以采用在沿長尺寸方向 的中心上密集地放置和朝向兩端松散地放置的形式。
接下來,該實施例的聲音發(fā)射和采集設備1功能性地包括如圖2 所示的輸入輸出連接器11、輸入輸出I/F 12、聲音發(fā)射指向性控制 部件13、 D/A轉換器14、聲音發(fā)射放大器15、揚聲器陣列SPA10 (揚 聲器SP1 SP3)、麥克風陣列MAIO、 MA20 (麥克風MIC11 MIC17, MIC21 MIC27)、聲音采集放大器16、 A/D轉換器17、聲音采集束生成部件181和182、聲音采集束選擇部件19、以及回聲消除部件 20。
輸入輸出I/F 12根據(jù)對應于網(wǎng)絡的數(shù)據(jù)格式(協(xié)議)來對從另 一個聲音發(fā)射和采集設備輸入端通過輸入輸出連接器11輸入的輸入 聲音信號進行轉換,并通過回聲消除部件20將聲音信號提供給聲音 發(fā)射指向性控制部件13。而且,輸入輸出1/F12將回聲消除部件20 所產(chǎn)生的輸出聲音信號轉換為對應于網(wǎng)絡的數(shù)據(jù)格式(協(xié)議),并通 過輸入輸出連接器11將輸出聲音信號發(fā)送至網(wǎng)絡。
當沒有設置聲音發(fā)射指向性時,聲音發(fā)射指向性控制部件13將 基于輸入聲音信號的聲音發(fā)射信號同時提供給揚聲器陣列SPA10的 每個揚聲器SP1 SP3。而且,當指定了虛擬點聲源的聲音發(fā)射指向 性等設置時,聲音發(fā)射指向性控制部件13通過根據(jù)指定的聲音發(fā)射 指向性來對輸入聲音信號分別執(zhí)行揚聲器陣列SPA10的每個揚聲器 SP1 SP3所特有的幅度處理和延遲處理,來產(chǎn)生各自的聲音發(fā)射信 號。聲音發(fā)射指向性控制部件13將這些各自的聲音發(fā)射信號輸出到 安裝在每個揚聲器SP1 SP3前面的D/A轉換器14。每個D/A轉換器 14將各自的聲音發(fā)射信號轉換為模擬格式,并將信號輸出到每個聲 音發(fā)射放大器15,每個聲音發(fā)射放大器15放大各自的聲音發(fā)射信號, 并將信號提供給揚聲器SP1 SP3。
揚聲器SP1 SP3對提供的聲音發(fā)射信號和各自的聲音發(fā)射信號 進行聲音轉換,并向外發(fā)射聲音。揚聲器SP1 SP3安裝在機柜101 的下表面,以便發(fā)射的聲音被其上安裝了聲音發(fā)射和采集設備1的桌 子的安裝表面所反射,并從會議人員所在的設備側向斜向上部分傳 播。而且, 一部分發(fā)射的聲音從聲音發(fā)射和采集設備1的底面被繞射 至安裝了麥克風陣列MAIO、 MA20的側表面。
麥克風陣列MA10和MA20的每個麥克風MIC11 MIC17和 MIC21 MIC27可以是無指向性的或有指向性的,但希望這些麥克風 是有指向性的,采集來自聲音發(fā)射和采集設備1外面的聲音,進行電 轉換,并將聲音采集信號輸出到每個聲音采集放大器16。
在這種情況下,麥克風陣列MA10的麥克風MICln (n=l到7)和麥克風陣列MA20的麥克風MlC2n (n二l到7)相同地采集來自揚聲器 陣列SPA10的單元揚聲器SP1 SP3的繞射聲音,麥克風陣列MA10 和MA20位于根據(jù)這種揚聲器陣列SPA10的配置以及麥克風陣列MA10 和MA20的配置而相對于參考平面的對稱位置。
每個聲音采集放大器16放大聲音采集信號,并分別將這些信號 提供給A/D轉換器17, A/D轉換器17進行這些聲音采集信號的數(shù)字 化轉換,并將這些信號輸出到聲音采集束產(chǎn)生部件181、 182。將安 裝在長尺寸表面的麥克風陣列MA10的每個揚聲器MIC11 MIC17的聲 音采集信號輸入聲音采集束產(chǎn)生部件181,將安裝在另一個長尺寸表 面的麥克風陣列MA20的每個揚聲器MIC21 MIC27的聲音采集信號輸 入聲音采集束產(chǎn)生部件182。
聲音采集束產(chǎn)生部件181對每個麥克風MIC11 MIC17的聲音采 集信號執(zhí)行預定延遲和幅度處理等,并產(chǎn)生聲音采集束信號MB11 MB14。在聲音采集束信號MB11 MB14中,在如圖l (B)所示安裝了 麥克風MIC11 MIC17的長尺寸表面?zhèn)龋亻L尺寸表面的聲音采集束 區(qū)域中分別設置具有不同預定寬度的區(qū)域。
聲音采集束產(chǎn)生部件182對每個麥克風MIC21 MIC27的聲音采 集信號執(zhí)行預定延遲和幅度處理等,并產(chǎn)生聲音采集束信號MB21 鵬24。在聲音采集束信號MB21 MB24中,在如圖l (B)所示安裝了 麥克風MIC21 MIC27的長尺寸表面?zhèn)?,沿長尺寸表面的聲音采集束 區(qū)域中分別設置具有不同預定寬度的區(qū)域。
在這種情況下,將聲音采集束信號MB11和聲音采集束信號MB21 形成為關于具有中心軸100的垂直平面(參考平面)對稱的束。相似 地,將聲音采集束信號MB12和聲音采集束信號MB22對、聲音采集束 信號MB13和聲音采集束信號MB23對、以及聲音采集束信號MB14和 聲音采集束信號MB24對形成為關于參考平面對稱的束。
聲音采集束選擇部件19選擇出其揚聲器聲音主要從輸入聲音采 集束信號MB11 MB14、 MB21 MB24中進行采集的聲音采集束信號, 并將該束信號作為聲音采集束信號MB輸出到回聲消除部件20。
圖3是示出了聲音采集束選擇部件19的主要結構的框圖。
15聲音采集束選擇部件19包括BPF(帶通濾波器)191、全波整流 電路192、電平檢測電路193、電平比值計算電路194、電平比較器 195、以及聲音采集束信號選擇電路196。
BPF 191是一種采用人聲音的主要分量頻帶和主要具有束特征 的頻帶作為通帶的帶通濾波器,執(zhí)行聲音采集束信號MB11 MB14、 MB21 MB24的帶通濾波,并向全波整流電路192輸出束信號。
全波整流電路192執(zhí)行聲音采集束信號MB11 MB14、 MB21 MB24的全波整流(絕對化)。
電平檢測電路193對執(zhí)行了全波整流的聲音采集束信號MB11 MB14、 MB21 MB24進行峰值檢測,將這個峰值用作其定時處的信號 電平(信號能量),并分別向電平比值計算電路194輸出信號電平數(shù) 據(jù)E11 E14、 E21 E24。
具體地講,當在如圖4A 4C所示的情況下發(fā)射和采集聲音,并 產(chǎn)生會議人員A、 B的聲音發(fā)射和發(fā)言時,如下對每個信號電平數(shù)據(jù) E11 E14、 E21 E24進行說明。
圖4A 4C是示出了該實施例的聲音發(fā)射和采集設備1被放置在 桌面C上,兩個會議人員A、 B主持會議時的情況的圖示,圖4A示出 了會議人員A說話時的情況,圖4B示出了會議人員B說話時的情況, 圖4C示出了會議人員A和B都沒有說話的情況。
圖5是示出了每個聲音采集束信號的發(fā)射聲音的信號電平數(shù)據(jù) Esp和每個聲音采集束信號的信號電平數(shù)據(jù)E11 E14、 E21 E24的 時間序列(T)分布的圖示,Esp表示發(fā)射聲音的信號電平數(shù)據(jù)Esp, E11 E14分別表示對應于聲音采集束信號MB11 MB14的信號電平數(shù) 據(jù)E11 E14, E21 E24分別表示對應于聲音采集束信號MB21 MB24 的信號電平數(shù)據(jù)E21 E24。而且,在圖5的Esp中,數(shù)字200是輸 入聲音信號的發(fā)射聲音分量,在圖5的E11 E24中,數(shù)字201是在 采集繞射聲音時所產(chǎn)生的繞射聲音分量。而且,在圖5的E11 E24 中,數(shù)字301是在采集會議人員A的發(fā)言聲音時所產(chǎn)生的采集聲音分 量,數(shù)字302是在采集會議人員B的發(fā)言聲音時所產(chǎn)生的采集聲音分如圖5所示,當產(chǎn)生發(fā)射聲音時,電平檢測電路193檢測在每 個聲音采集信號MB11 MB14、MB21 MB24的信號電平數(shù)據(jù)E11 E14、 E21 E24中的如圖5的E11 E24中所示的繞射聲音分量201。而且, 當會議人員A在如圖4A和圖5的E21中所示的時間Tl至T2說話時, 電平檢測電路193檢測聲音采集束信號MB21的信號電平數(shù)據(jù)E21中 的采集聲音分量301。而且,當會議人員B在如圖4B和圖5的E13 中所示的時間T3至T4說話時,電平檢測電路193檢測聲音采集束信 號MB13的信號電平數(shù)據(jù)E13中的采集聲音分量302。
不過,采集聲音分量301、 302的信號電平可能比圖5的E13、 E21中所示的繞射聲音分量201的信號電平低。在這種情況下,不能 從繞射聲音分量201中區(qū)分出采集聲音分量301、 302,不能檢測出 講話者的方位。為了解決這個問題,在本申請的發(fā)明中,通過下述的 電平比值計算電路194計算預定的信號比值,來檢測講話者的方位。
電平比值計算電路194計算從電平檢測電路193輸入的信號電 平數(shù)據(jù)E11 E14、 E21 E24的平均信號電平數(shù)據(jù)Eav。然后,電平 比值計算電路194計算平均信號電平數(shù)據(jù)Eav和每個信號電平數(shù)據(jù) E11 E14、 E21 E24之間的電平比值CE11 CE14、 CE21 CE24。具 體地講,采用下述公式,用分貝單位來對每個信號電平數(shù)據(jù)Emi (m二l,2, n二l 4)計算電平比值CE11 CE14、 CE21 CE24:
CEmn = A禮og(Emn/Eav) (A是一個常量) (1)
圖6是示出了平均信號電平數(shù)據(jù)Eav以及電平比值CE11 CE14、 CE21 CE24的時間序列(T)分布的圖示,平均值Eav表示平均信號 數(shù)據(jù)Eav,以及Log(Ell/Eav) Log(E14/Eav)分別表示對應于聲音采 集束信號MB11 MB14的電平比值數(shù)據(jù)CE11 CE14, Log (E21/Eav) Log(E24/Eav)分別表示對應于聲音采集束信號MB21 MB24的電平比 值數(shù)據(jù)CE21 CE24。
通過將每個信號電平數(shù)據(jù)除以平均信號電平數(shù)據(jù)來這樣計算比 值,基本上相同地包括在所有信號電平數(shù)據(jù)E11 E14、 E21 E24中 的繞射聲音分量201變得基本上等于"1",也就是說,基本上相當 于分貝單位中的"0"。另一方面,采集聲音分量301是信號電平數(shù)據(jù)E21特有的分量,采集聲音分量302是信號電平數(shù)據(jù)E13特有的分 量,使得在電平比值數(shù)據(jù)CE21中,在產(chǎn)生采集數(shù)據(jù)分量301的定時 (Tl到T2)產(chǎn)生高電平分量401,在電平比值數(shù)據(jù)CE13中,在產(chǎn)生 采集聲音分量302的定時(T3到T4)產(chǎn)生高電平分量402。另外, 當這樣利用分貝單位來適當?shù)卦O置常量A時,可以比其他部分更顯著 地產(chǎn)生高電平分量401、 402。
電平比值計算電路194向電平比較器195輸出這些電平比值數(shù) 據(jù)CE11 CE14、 CE21 CE24。
當電平比較器195對電平比值數(shù)據(jù)CE預置了閾值DEth,并檢測 到超過了閾值DEth的電平數(shù)據(jù)時,將對應于相應電平比值數(shù)據(jù)CE 的聲音采集束信號MB11 MB14、鵬21 鵬24的相關選擇信息輸出到 聲音采集束信號選擇電路196。在本文中,根據(jù)對于有意產(chǎn)生的發(fā)射 聲音的繞射聲音的聲音采集電平等或根據(jù)沒有發(fā)言聲音的采集聲音 的情況下的背景噪聲來適當?shù)仡A置閾值的值DEth。
具體地講,在圖6的情況下,在采樣定時Tl到T2的時間點, 檢測到高電平分量401,輸出用于選擇與電平比值數(shù)據(jù)CE21對應的 聲音采集束信號MB21的選擇信息。而且,在采樣定時T3到T4的時 間點,檢測到高電平分量402,輸出用于選擇與電平比值數(shù)據(jù)CE13 對應的聲音采集束信號MB13的選擇信息。
基于從電平比較器195輸入的選擇信息,聲音采集束信號選擇 電路196從聲音采集束信號MB11 MB14、 MB21 MB24中選擇對應的
聲音采集束信號,并將該聲音采集束信號作為輸出聲音采集束信號 MB輸出到回聲消除部件20。
具體地講,在圖6的情況下,在采樣定時Tl到T2的時間點選 擇和輸出聲音釆集束信號MB21,在采樣定時T3到T4的時間點選擇 和輸出聲音采集束信號MB13。
通過采用這種配置和處理,即使在會議人員(講話者)的發(fā)言 聲音的聲音采集信號電平等于繞射聲音信號電平,或者變得比繞射聲 音信號電平低時,也可以確定地選擇處對應于發(fā)言聲音的聲音采集束 信號MB?;芈曄考?0包括自適應濾波器201和后處理器202。自適 應濾波器201根據(jù)被選作輸入聲音信號的聲音采集束信號MB的聲音 采集指向性來產(chǎn)生偽回歸聲音信號。后處理器202從聲音采集束選擇 部件19輸出的聲音采集束信號MB中減去偽回歸聲音信號,并向輸入 輸出I/F 12輸出偽回歸聲音信號作為輸出聲音信號。通過執(zhí)行這種 回聲消除處理,可以采集發(fā)言聲音并以高的信噪比輸出發(fā)言聲音。
接下來,參照附圖對根據(jù)第二個實施例的聲音發(fā)射和采集設備 進行說明。
本實施例的聲音發(fā)射和采集設備與第一實施例中的聲音發(fā)射和 采集設備的區(qū)別僅在于聲音采集束選擇部件19的電平比值計算電路 194、電平比較器195和聲音采集束信號選擇電路196的處理,而其 他結構與第一實施例中所示的聲音發(fā)射和采集設備的結構是相同的, 因此只對電平比值計算電路194、電平比較器195和聲音采集束信號 選擇電路196的處理進行說明,而省略對其他結構的說明。
根據(jù)從電平檢測電路193輸入的信號電平數(shù)據(jù)E11 E14、E21 E24,電平比值計算電路194計算互相關于圖1的參考平面100對稱 的聲音采集束的信號電平數(shù)據(jù)E之間的電平比值CE1 CE4。具體地 講,采用下列公式用分貝單位來計算相對于每個信號電平數(shù)據(jù)Eln、 E2n (n=l至ij 4)的電平比值CE1 CE4:
CEn = B承Log(E2n/Eln) (B是一個常量) (2) 圖7是示出了電平比值CE1 CE4的時間序列(T)分布的圖示。 通過對處在關于參考平面100彼此對稱的位置上的信號電平數(shù) 據(jù)相除并這樣計算比值,具有關于參考平面100實質上對稱的特征的 繞射聲音分量201基本上變成"1",也就是說,基本上相當于分貝 單位中的"0"。另一方面,采集聲音分量301出現(xiàn)在與會議人員A 的方位對應的聲音采集束信號MB21的信號電平數(shù)據(jù)E21中,而不會 出現(xiàn)在關于參考平面100與聲音采集束信號MB21對稱的聲音采集束 信號MBll中。從而,在電平比值數(shù)據(jù)CE1中,根據(jù)公式(2)在產(chǎn)生 采集聲音分量301的定時(T1到T2)產(chǎn)生在正方向上比參考電平0 dB 高的正方向高電平分量501。另外,采集聲音分量302出現(xiàn)在與會議人員B的方位對應的聲音采集束信號MB13的信號電平數(shù)據(jù)E13中, 而不會出現(xiàn)在關于參考平面100與聲音采集束信號MB13對稱的聲音 采集束信號MB23中。從而,在電平比值數(shù)據(jù)CE3中,根據(jù)公式(2) 在產(chǎn)生采集聲音分量302的定時(T3到T4)產(chǎn)生比參考電平0 dB 低(即在負方向上高)的負方向高電平分量502。另外,在這樣利用 分貝單位適當?shù)卦O置常量B時,可以比其他部分更顯著地產(chǎn)生正方向 高電平分量501和負方向高電平分量502。
電平比值計算電路194向電平比較器195輸出這些電平比值數(shù) 據(jù)CE1 CE4。
當電平比較器195對電平比值數(shù)據(jù)CE1 CE4預置預定電平范圍 DWth,并檢測在正方向或負方向上超過電平范圍DWth的電平的數(shù)據(jù) 時,檢測到對應于相應的電平比值數(shù)據(jù)CE的聲音采集束信號的組合, 并將這個組合的相關選擇信息輸出到聲音采集束信號選擇電路196。 另外,電平比較器195向聲音采集束信號選擇電路196輸出正和負電 平信息,該信息指示相應的電平比值數(shù)據(jù)CE是具有正方向上的高電 平還是負方向上的高電平。在本文中,采用與上面所述的閾值DEth 相類似的方式,還根據(jù)對于有意產(chǎn)生的發(fā)射聲音的繞射聲音的聲音采 集電平等或根據(jù)沒有對發(fā)言聲音進行采集聲音的情況下的背景噪聲 來適當?shù)卦O置閾值的值DWth。
具體地講,在圖7的情況下,在采樣定時Tl到T2的一個時間 點,檢測到正方向高電平分量501,輸出用于選擇與電平比值數(shù)據(jù)CE1 相對應的聲音采集束信號MBll、 MB21組合的選擇信息。而且,對顯 示它是正方向上的高電平的正電平信息進行輸出。
另一方面,在采樣定時T3到T4的一個時間點,檢測到負方向 高電平分量502,輸出用于選擇與電平比值數(shù)據(jù)CE3相對應的聲音采 集束信號MB13、 MB23組合的選擇信息。而且,對顯示它是負方向上 的高電平的負電平信息進行輸出。
聲音選擇束信號選擇電路196根據(jù)從電平比較器195輸入的選 擇信息來從聲音采集束信號MB11 MB14、 MB21 MB24中選擇聲音采 集束信號的組合,并根據(jù)正和負電平信息,從兩個選擇的聲音采集束信號中選擇一個具有較大信號電平的聲音采集束信號,并將該聲音采
集束信號作為輸出聲音采集束信號MB輸出到回聲消除部件20。
具體地講,在圖7的情況下,在采樣定時Tl到T2的一個時間 點,選擇聲音采集束信號MBll、 MB21。另外,成為公式(2)中的正 方向上的高電平的情況是信號電平數(shù)據(jù)E21比信號電平數(shù)據(jù)E11高的 情況,因此根據(jù)正電平信息選擇聲音采集束信號MB21。
另一方面,在采樣定時T3到T4的一個時間點,選擇聲音采集 束信號MB13、 MB23。而且,成為公式(2)中的負方向上的高電平的 情況是信號電平數(shù)據(jù)E13比信號電平數(shù)據(jù)E21高的情況,因此根據(jù)負 電平信息選擇聲音采集束信號MB13。
而且,通過采用這樣的配置和處理,即使會議人員(講話者) 的發(fā)言聲音的聲音釆集信號電平等于繞射聲音信號電平,或變得低于 繞射聲音信號電平,也可以確定地選擇對應于發(fā)言聲音的聲音采集束 信號MB。
而且,在上文的說明中,已經(jīng)示出了關于與揚聲器布置方向平 行的參考平面對稱放置麥克風陣列的例子,但它還可以應用于在采用 第一實施例的方法時麥克風陣列只出現(xiàn)在相對于參考平面的一側的 情況。
而且,在上文的每個實施例的說明中,已經(jīng)示出了用聲音采集 束產(chǎn)生部件產(chǎn)生聲音采集束信號的情況,但還可以構建來為每個麥克 風MIC11 MIC17、 MIC21 MIC27提供聲音采集指向性,并將來自每 個麥克風MIC11 MIC17、 MIC21 MIC27的輸出信號用作實際上的聲 音采集束信號。在這種情況下,當在彼此關于參考平面100對稱的位 置上的麥克風的聲音采集指向性被設置為關于參考平面100對稱時, 它還可以應用于第二實施例。
2權利要求
1. 一種聲音發(fā)射和采集設備,其包括聲音發(fā)射裝置,包括揚聲器;聲音采集裝置,包括以預定格局布置的多個麥克風;聲音采集束信號產(chǎn)生裝置,其用于通過對聲音采集裝置的多個麥克風中的每一個的聲音采集信號執(zhí)行延遲和幅度處理,來產(chǎn)生多個具有各自不同的指向性的聲音采集束信號;以及聲音采集束信號選擇裝置,其用于計算在各個定時處所有聲音采集束信號的平均能量和每個聲音采集束信號的能量之間的能量比值,并且選擇其中能量比值的絕對值電平是預定值或高于預定值的聲音采集束信號。
2. 根據(jù)權利要求1所述的聲音發(fā)射和采集設備,其中,所述聲 音采集束信號選擇裝置將所述能量比值轉換為一個以分貝為單位的 值,并根據(jù)所述以分貝為單位的值選擇聲音采集束信號。
3. —種聲音發(fā)射和采集設備,其包括 聲音發(fā)射裝置,包括揚聲器;聲音采集裝置,包括多個具有各自不同的指向性并以預定格局 布置的麥克風,并將來自每個所述麥克風的輸出信號用作聲音釆集束 信號;以及聲音采集束信號選擇裝置,其用于計算在各個定時處所有聲音 采集束信號的平均能量和各個聲音采集束信號的能量之間的能量比 值,并且選擇其中能量比值的絕對值電平是預定值或高于預定值的聲 音采集束信號。
4. 根據(jù)權利要求3所述的聲音發(fā)射和采集設備,其中,所述聲 音采集束信號選擇裝置將所述能量比值轉換為一個以分貝為單位的 值,并根據(jù)所述以分貝為單位的值來選擇聲音采集束信號。
5. —種聲音發(fā)射和采集設備,其包括包括揚聲器的聲音發(fā)射裝置,用于以關于預定的參考平面對稱 的聲壓來發(fā)射輸入的聲音信號;聲音采集裝置,包括第一麥克風組和第二麥克風組,第一麥克 風組采集預定參考平面的一側的聲音,第二麥克風組采集另一側的聲聲音采集束信號產(chǎn)生裝置,其用于產(chǎn)生第一聲音采集束信號組 的每個聲音采集束信號和產(chǎn)生第二聲音采集束信號組的每個聲音采集束信號,第一聲音采集束信號組是通過對第一麥克風組的聲音采集 信號執(zhí)行延遲和幅度處理獲得的,第二聲音采集束信號組是通過對第 二麥克風組的聲音采集信號執(zhí)行延遲和幅度處理獲得的,第一聲音采 集束信號組的每個聲音采集束信號與第二聲音采集束信號組的每個聲音采集束信號關于預定的參考平面對稱;以及聲音采集束信號選擇裝置,其用于計算在各個定時處關于參考 平面彼此對稱的聲音采集束信號之間的能量比值,檢測出能量比值不 在預定參考電平范圍內的聲音采集束信號的組合,并根據(jù)關于能量比 值高于或低于參考電平范圍的信息,來從組成所述組合的兩個聲音采 集束信號中選擇一個聲音采集束信號。
6. 根據(jù)權利要求5所述的聲音發(fā)射和采集設備,其中,所述聲 音采集束信號選擇裝置將所述能量比值轉換為一個以分貝為單位的 值,并根據(jù)所述以分貝為單位的值選擇聲音采集束信號。
7. —種聲音發(fā)射和采集設備,其包括包括揚聲器的聲音發(fā)射裝置,用于以關于預定的參考平面對稱 的聲壓來發(fā)射輸入的聲音信號;聲音采集裝置,其包括第一麥克風組和第二麥克風組,第一麥 克風組包括多個在相對于預定參考平面的一側具有各自不同的指向 性的麥克風,并將來自每個所述麥克風的輸出信號用作聲音采集束信號,第二麥克風組包括多個在相對于另一側具有各自不同的指向性的 麥克風,并將來自每個所述麥克風的輸出信號用作聲音采集束信號, 所述聲音采集裝置把通過第一麥克風組獲得的聲音采集束信號和通 過第二麥克風組獲得的聲音采集束信號設置成關于參考平面對稱;以 及聲音采集束信號選擇裝置,其計算在各個定時處關于參考平面 彼此對稱的聲音采集束信號之間的能量比值,檢測出能量比值不在預 定參考電平范圍內的聲音采集束信號的組合,并根據(jù)關于能量比值高 于或低于參考電平范圍的信息,來從組成所述組合的兩個聲音采集束 信號中選擇一個聲音采集束信號。
8. 根據(jù)權利要求7所述的聲音發(fā)射和采集設備,其中,所述聲 音采集束信號選擇裝置將所述能量比值轉換為一個以分貝為單位的 值,并根據(jù)所述以分貝為單位的值選擇聲音采集束信號。
9. 一種聲音發(fā)射和采集設備的控制方法,其包括步驟根據(jù)從以預定格局布置的多個麥克風輸出的聲音采集信號,來產(chǎn)生具有各自不同的指向性的多個聲音采集束信號的步驟;計算在各個定時處每個聲音采集束信號的能量和所有聲音采集束信號的平均能量之間的能量比值的步驟;以及選擇其中的能量比值的絕對值電平是預定值或大于預定值的聲音采集束信號的歩驟。
10. —種聲音發(fā)射和采集設備的控制方法,其包括步驟 根據(jù)從用于對預定參考平面一側的聲音進行采集的第一麥克風組輸出的聲音采集信號,來產(chǎn)生多個具有各自不同的指向性的第一聲 音采集束信號的步驟;根據(jù)從用于對關于預定參考平面分別與多個第一聲音釆集束信 號對稱的另一側的聲音進行采集的第二麥克風組輸出的聲音采集信 號,來產(chǎn)生多個具有各自不同的指向性的第二聲音采集束信號的步驟;計算在各個定時處關于參考平面彼此對稱的聲音采集束信號之 間的能量比值的步驟;檢測出其中的能量比值不在預定參考電平范圍內的聲音采集束 信號的組合的步驟;以及根據(jù)關于能量比值高于或低于參考電平范圍的信息,從構成所 述組合的兩個聲音采集束信號中選擇一個聲音采集束信號的步驟。
全文摘要
電平比值計算電路計算與每個采集聲音束信號對應的信號電平數(shù)據(jù)的平均信號分貝數(shù)據(jù),以及每個信號電平數(shù)據(jù)對平均信號電平數(shù)據(jù)的電平比值。由于回繞聲音基本上等于所有信號電平,因此平均信號電平數(shù)據(jù)的回繞聲音分量也基本上相同。一方面,從講話者發(fā)出的采集聲音對于相應的采集聲音束信號的信號電平數(shù)據(jù)而言是固有的。從而,對應于回繞聲音的部分是平的,并且電平只在對應于采集聲音的部分局部地變高。采用這種方法,檢測出包括采集聲音的采集聲音束信號。
文檔編號H04R3/00GK101455094SQ200780019469
公開日2009年6月10日 申請日期2007年5月24日 優(yōu)先權日2006年5月26日
發(fā)明者田中良, 石橋利晃, 鵜飼訓史 申請人:雅馬哈株式會社