處理音頻信號(hào)的制作方法
【專利摘要】一種對(duì)通信會(huì)話期間在用戶設(shè)備與遠(yuǎn)程節(jié)點(diǎn)之間的音頻信號(hào)進(jìn)行處理的方法、用戶設(shè)備和計(jì)算機(jī)程序產(chǎn)品,所述方法包括:接收在所述用戶設(shè)備處的音頻輸入裝置處的多個(gè)音頻信號(hào),該多個(gè)音頻信號(hào)包括至少一個(gè)主音頻信號(hào)和不希望的信號(hào);在增益控制裝置處接收所述音頻信號(hào)的到達(dá)方向信息;向所述增益控制裝置提供代表至少一些所述不希望信號(hào)的已知的到達(dá)方向信息;通過施加某一水平的增益來處理在所述增益控制裝置處的音頻信號(hào),以生成供發(fā)送至遠(yuǎn)程節(jié)點(diǎn)用的增益控制的信號(hào),其中所施加的增益水平取決于所述音頻信號(hào)的到達(dá)方向信息與已知的到達(dá)方向信息之間的比較。
【專利說明】處理音頻信號(hào) 發(fā)明領(lǐng)域
[0001] 本發(fā)明涉及在通信會(huì)話期間處理音頻信號(hào)。
【背景技術(shù)】
[0002] 通信系統(tǒng)允許用戶在網(wǎng)絡(luò)上彼此通信。網(wǎng)絡(luò)可W是例如互聯(lián)網(wǎng)或公眾交換電話網(wǎng) 絡(luò)(PSTN)。可W在網(wǎng)絡(luò)的節(jié)點(diǎn)之間傳輸音頻信號(hào),從而允許用戶在通信系統(tǒng)上在通信會(huì)話 中向彼此發(fā)送和接收音頻信號(hào)巧日語(yǔ)音數(shù)據(jù)等)。
[0003] 用戶設(shè)備可W具有諸如麥克風(fēng)等可W用來接收來自用戶的諸如語(yǔ)音等音頻信號(hào) 的音頻輸入裝置。用戶可W進(jìn)入諸如私人電話(只有兩人在通話中)或會(huì)議電話(多于兩人 在通話中)等與另一用戶的通信會(huì)話。用戶的語(yǔ)音在麥克風(fēng)處被接收、處理,然后在網(wǎng)絡(luò)上 被發(fā)送至通話中的其它用戶。
[0004] 不僅是來自用戶的音頻信號(hào),麥克風(fēng)還可W接收諸如背景噪聲等其它音頻信號(hào), 該些其它音頻信號(hào)可能會(huì)干擾從用戶接收到的音頻信號(hào)。
[0005] 用戶設(shè)備還可W具有諸如揚(yáng)聲器等音頻輸出裝置,用于將在通話期間在網(wǎng)絡(luò)上從 用戶接收到的音頻信號(hào)輸出給用戶。然而,揚(yáng)聲器還可W被用來輸出來自在用戶設(shè)備處執(zhí) 行的其它應(yīng)用的音頻信號(hào)。例如,用戶設(shè)備可W是執(zhí)行諸如用于在網(wǎng)絡(luò)上通信的通信客戶 端等應(yīng)用的TV。當(dāng)用戶設(shè)備忙于通話時(shí),連接至用戶設(shè)備的麥克風(fēng)意圖接收由用戶提供的、 意在發(fā)送至通話中的其它用戶的語(yǔ)音或其它音頻信號(hào)。然而,麥克風(fēng)可能會(huì)拾取從用戶設(shè) 備的揚(yáng)聲器輸出的不希望的音頻信號(hào)。從用戶設(shè)備輸出的不希望的音頻信號(hào)可能會(huì)對(duì)在麥 克風(fēng)處從用戶接收到的用于在通話中發(fā)送的音頻信號(hào)帶來干擾。
[0006] 當(dāng)在具有可W被麥克風(fēng)拾取的其它噪聲源的房間中使用用戶設(shè)備時(shí),也會(huì)出現(xiàn)問 題。
[0007] 為了改進(jìn)如用于通話中等信號(hào)的品質(zhì),希望抑制在用戶設(shè)備的音頻輸入裝置處接 收到的不希望的音頻信號(hào)(背景噪聲和不希望的音頻信號(hào))。
[0008] 使用立體聲麥克風(fēng)和麥克風(fēng)陣列(其中多個(gè)麥克風(fēng)作為單個(gè)設(shè)備而工作)正變得 愈來愈普通。該些使得除了可W在單個(gè)麥克風(fēng)中實(shí)現(xiàn)的W外、還可W使用所提取的空間信 息。當(dāng)使用該種設(shè)備時(shí),抑制不希望的音頻信號(hào)的一種方法是應(yīng)用波束形成器。波束形成 是試圖通過施加信號(hào)處理來增強(qiáng)從一個(gè)或更多想要的方向來的聲音而使麥克風(fēng)陣列所接 收的信號(hào)會(huì)聚的處理。為了簡(jiǎn)化,我們將在下面描述僅有單個(gè)想要的方向的情況,但當(dāng)有更 多感興趣的方向時(shí)也適用相同的方法。波束形成是通過首先估計(jì)在麥克風(fēng)處接收到希望信 號(hào)的角度即所謂到達(dá)方向(D0A)信息而實(shí)現(xiàn)的。適應(yīng)性波束形成器使用D0A信息來處理來 自陣列中的麥克風(fēng)的信號(hào),W形成一個(gè)或更多該樣的波束:其中在麥克風(fēng)陣列處接收到希 望信號(hào)的方向上增益高,而在其它任何方向上增益低。
[0009] 盡管波束形成器企圖抑制從不希望方向而來的不希望的音頻信號(hào),但是麥克風(fēng)的 數(shù)量W及麥克風(fēng)陣列的形狀和尺寸會(huì)限制波束形成器的效果,結(jié)果,不希望的音頻信號(hào)雖 然被抑制,但是仍然聽得見。
[0010] 為了后續(xù)的單信道處理,波束形成器的輸出通常被作為輸入信號(hào)供給自動(dòng)增益控 巧IJ(AGC)處理級(jí)。AGC處理級(jí)對(duì)信道上的整個(gè)信號(hào)施加增益并且基于輸入信號(hào)電平將增益 隨時(shí)間調(diào)整到適宜的水平。
[0011] 當(dāng)有遠(yuǎn)端活動(dòng)時(shí),可W估計(jì)從卿趴到達(dá)的回波來自哪個(gè)方向。相同的卿趴可W被 用來播放例如音樂,或者,如果端點(diǎn)是TV則它可W是來自當(dāng)前觀看的節(jié)目的音頻。當(dāng)揚(yáng)聲 器正播放音頻而不是遠(yuǎn)端語(yǔ)音時(shí),它通常被歸類為近端活動(dòng),并且自動(dòng)增益控制會(huì)將它放 大到常規(guī)語(yǔ)音水平。當(dāng)近端揚(yáng)聲器隨后發(fā)聲時(shí),自動(dòng)增益控制可能已針對(duì)錯(cuò)誤的信號(hào)調(diào)整, 并且可能不得不再調(diào)整到近端語(yǔ)音。在調(diào)整回到最佳增益所花的時(shí)間期間,信號(hào)可能被削 波和/或嚴(yán)重地壓縮,或是信號(hào)幅度(即音量)在與代表聽得見的語(yǔ)音的目標(biāo)水平相比時(shí)可 能太低。
[0012] 在W下說明的本發(fā)明的實(shí)施例中,關(guān)于聲音到來的角度的信息也可W用于自動(dòng)模 擬和數(shù)字增益控制。D0A信息被用來使得增益控制對(duì)于從某些方向到達(dá)的音頻是魯棒的。 憑借當(dāng)前發(fā)明的實(shí)施例,可W檢測(cè)到音頻是從揚(yáng)聲器的角度到達(dá)的并且使增益保持恒定、 直到還是該聲音又從(人的)近端揚(yáng)聲器的角度到達(dá)為止。該樣,將會(huì)防止增益對(duì)于從不希 望的方向到達(dá)的聲音而增加。
【發(fā)明內(nèi)容】
[0013] 根據(jù)本發(fā)明的第一方面,提供了一種對(duì)通信會(huì)話期間在用戶設(shè)備與遠(yuǎn)程節(jié)點(diǎn)之間 的音頻信號(hào)進(jìn)行處理的方法,所述方法包括:接收在所述用戶設(shè)備處的音頻輸入裝置處的 多個(gè)音頻信號(hào),該多個(gè)音頻信號(hào)包括至少一個(gè)主音頻信號(hào)和不希望的信號(hào);在增益控制裝 置處接收所述音頻信號(hào)的到達(dá)方向信息;向所述增益控制裝置提供代表至少一些所述不希 望信號(hào)的已知的到達(dá)方向信息;W及通過施加某一水平的增益來處理在所述增益控制裝置 處的音頻信號(hào),W生成供發(fā)送至遠(yuǎn)程節(jié)點(diǎn)用的增益控制信號(hào),其中所述施加的增益的水平 取決于所述音頻信號(hào)的所述到達(dá)方向信息與所述已知的到達(dá)方向信息之間的比較。
[0014] 優(yōu)選地,所述音頻輸入裝置處理所述多個(gè)音頻信號(hào)W生成包括峽序列的單信道音 頻輸出信號(hào),所述增益控制裝置按順序處理每一所述峽。
[0015] 優(yōu)選地,在所述增益控制裝置處接收到正在被處理的當(dāng)前峽的主信號(hào)成分的到達(dá) 方向信息,所述方法進(jìn)一步包括:將所述當(dāng)前峽的所述主信號(hào)成分的到達(dá)方向信息與所述 已知的到達(dá)方向信息作比較??蒞基于所述比較對(duì)是否禁止所述增益控制裝置的活動(dòng)做出 決定。
[0016] 所述已知的到達(dá)方向信息可W包括在所述音頻輸入裝置處接收到遠(yuǎn)端信號(hào)的至 少一個(gè)方向,所述決定基于是否在所述音頻輸入裝置處、從在所述音頻輸入裝置處接收到 遠(yuǎn)端信號(hào)的所述至少一個(gè)方向接收到所述當(dāng)前峽的所述主信號(hào)成分。
[0017] 替代地或附加地,所述已知的到達(dá)方向信息可W包括至少一個(gè)歸類的方向,所述 決定基于是否在所述音頻輸入裝置處、從所述至少一個(gè)歸類的方向接收到當(dāng)前峽的所述主 信號(hào)成分,所述至少一個(gè)歸類的方向可W是至少一個(gè)不希望的音頻信號(hào)到達(dá)所述音頻輸入 裝置的方向,并且基于所述至少一個(gè)不希望的音頻信號(hào)的信號(hào)特性被識(shí)別。
[0018] 替代地或附加地,所述已知的到達(dá)方向信息可W包括在所述音頻輸入裝置處接收 到所述至少一個(gè)主音頻信號(hào)的至少一個(gè)主方向,所述決定基于是否在所述音頻輸入裝置 處、從所述至少一個(gè)主方向接收到所述當(dāng)前峽的所述主信號(hào)成分。
[0019] 優(yōu)選地,所述至少一個(gè)主方向是通過該樣來確定的;確定使在所述音頻輸入裝置 處接收到的所述音頻信號(hào)之間的互相關(guān)最大化的時(shí)間延遲;W及檢測(cè)在所述音頻輸入裝置 處接收到的、帶有最大互相關(guān)的時(shí)間延遲的所述音頻信號(hào)中的語(yǔ)音特性。
[0020] 所述音頻輸入裝置可W包括波束形成器,該波束形成器被配置為;估計(jì)所述至少 一個(gè)主方向;W及處理所述多個(gè)音頻信號(hào),W通過在所述至少一個(gè)主方向上形成波束并且 實(shí)質(zhì)地抑制來自除所述主方向W外其它任何方向的音頻信號(hào)而生成所述單信道音頻輸出 信號(hào)。所述已知的到達(dá)方向信息可W包括所述波束形成器的波束圖。
[0021] 如果從所述比較確定為應(yīng)禁止所述增益控制裝置的活動(dòng),則所述增益控制裝置可 W被配置為對(duì)正在被處理的當(dāng)前峽施加曾對(duì)就在所述當(dāng)前峽之前處理的峽施加的某一水 平的增益。替代地,如果從所述比較確定為應(yīng)禁止所述增益控制裝置的活動(dòng),則所述增益控 制裝置可W被配置為取決于就在所述當(dāng)前峽之前處理的峽的信號(hào)電平、受被約束(capped) 的當(dāng)前峽和前一峽之間的增益的變化的影響、對(duì)所述當(dāng)前峽施加某一水平的增益。
[0022] 如果從所述比較確定為不應(yīng)禁止所述增益控制裝置的活動(dòng),則所述增益控制裝置 可W被配置為將所處理的峽的信號(hào)電平與就在所述當(dāng)前峽之前處理的峽的信號(hào)電平做比 較;并且如果所述當(dāng)前峽的信號(hào)電平比所述就在當(dāng)前峽之前處理的峽的信號(hào)電平更高,貝U 所述增益控制裝置被配置為減小增益的水平并且將所述減小的增益的水平施加至所述當(dāng) 前峽;并且如果所述當(dāng)前峽的信號(hào)電平比所述就在當(dāng)前峽之前處理的峽的信號(hào)電平更低, 則所述增益控制裝置被配置為增加增益的水平并且將所述增加的增益的水平施加至所述 當(dāng)前中貞。
[0023] 在一種實(shí)施例中,所述音頻輸入裝置包括第一和第二音頻輸入裝置,每一音頻輸 入裝置處理所述多個(gè)音頻信號(hào)W生成輸出信道,所述方法進(jìn)一步包括:通過對(duì)每一輸出信 道施加某一水平的增益來處理在各個(gè)增益控制裝置處的每一輸出信道,W生成供發(fā)送至遠(yuǎn) 程節(jié)點(diǎn)用的第一和第二增益控制信號(hào),其中所述增益的水平取決于所述音頻信號(hào)的到達(dá)方 向信息與所述已知的到達(dá)方向信息之間的比較,并且對(duì)于每一輸出信道都相同。
[0024] 優(yōu)選地,在所述通信會(huì)話中在所述用戶設(shè)備處從所述遠(yuǎn)程節(jié)點(diǎn)接收到的音頻數(shù)據(jù) 從所述用戶設(shè)備的音頻輸出裝置輸出。
[0025] 所述不希望的信號(hào)可W由在所述用戶設(shè)備處的源生成,所述源包括W下中的至少 一個(gè):所述用戶設(shè)備的音頻輸出裝置;在所述用戶設(shè)備處的活動(dòng)的源,其中所述活動(dòng)包括 點(diǎn)擊活動(dòng),該點(diǎn)擊活動(dòng)包括按鈕點(diǎn)擊活動(dòng)、鍵盤點(diǎn)擊活動(dòng)和鼠標(biāo)器點(diǎn)擊活動(dòng)。
[0026] 替代地,所述不希望的信號(hào)可W由所述用戶設(shè)備外部的源生成。
[0027] 優(yōu)選地,所述至少一個(gè)主音頻信號(hào)是在所述音頻輸入裝置處接收到的語(yǔ)音信號(hào)。
[0028] 根據(jù)本發(fā)明的第二方面,提供了一種對(duì)通信會(huì)話期間在用戶設(shè)備與遠(yuǎn)程節(jié)點(diǎn)之間 的音頻信號(hào)進(jìn)行處理的用戶設(shè)備,所述用戶終端包括:音頻輸入裝置,所述音頻輸入裝置接 收多個(gè)音頻信號(hào),該多個(gè)音頻信號(hào)包括至少一個(gè)主音頻信號(hào)和不希望的信號(hào);W及增益控 制裝置,所述增益控制裝置接收所述音頻信號(hào)的到達(dá)方向信息和代表至少一些所述不希望 信號(hào)的已知的到達(dá)方向信息,所述增益控制裝置被配置為通過施加某一水平的增益來處理 所述音頻信號(hào),W生成供發(fā)送至遠(yuǎn)程節(jié)點(diǎn)用的增益控制信號(hào),其中所述施加的增益的水平 取決于所述音頻信號(hào)的所述到達(dá)方向信息與所述已知的到達(dá)方向信息之間的比較。
[0029] 根據(jù)本發(fā)明的第H方面,提供了一種包括由在用戶設(shè)備處的計(jì)算機(jī)處理裝置執(zhí)行 的、對(duì)通信會(huì)話期間在所述用戶設(shè)備與遠(yuǎn)程節(jié)點(diǎn)之間的音頻信號(hào)進(jìn)行處理的計(jì)算機(jī)可讀指 令的計(jì)算機(jī)程序產(chǎn)品,所述指令包括用于施行根據(jù)本發(fā)明的第一方面的方法的指令。
【專利附圖】
【附圖說明】
[0030] 為了更好地理解本發(fā)明并且示出本發(fā)明可W如何投入實(shí)用,下面通過示例參照W 下附圖,在附圖中: 圖1表示根據(jù)優(yōu)選實(shí)施例的通信系統(tǒng); 圖2表示根據(jù)優(yōu)選實(shí)施例的用戶終端的示意圖; 圖3表示用戶終端的示例環(huán)境; 圖4a表示根據(jù)一個(gè)實(shí)施例的用戶終端處的音頻輸入裝置的示意圖; 圖4b表示根據(jù)替代實(shí)施例的用戶終端處的音頻輸入裝置的示意圖; 圖5表示代表如何估計(jì)D0A信息的圖; 圖6圖示了可W被用來對(duì)施加至音頻信道的增益的水平進(jìn)行調(diào)整的兩種方法。
【具體實(shí)施方式】
[0031] 在下列本發(fā)明的實(shí)施例中,說明了該樣的技術(shù);其中,不是完全依賴波束形成器使 不從聚焦方向來的聲音衰減,相反,使用自動(dòng)增益控制中的D0A信息明確地增加了對(duì)來自 任何其它方向的聲音的魯棒性。該在可W通過使用空間信息將不想要的信號(hào)與想要的近端 語(yǔ)音信號(hào)區(qū)分開時(shí)非常有利。該種源的實(shí)例是播放音樂的卿趴、吹風(fēng)的風(fēng)扇和關(guān)閉的口。
[0032] 通過使用信號(hào)歸類也可W找到其它源的方向。該種源的實(shí)例可能是例如致涼風(fēng)扇 /空調(diào)系統(tǒng)、背景音樂播放和鍵盤敲擊。
[0033] 可W采取兩種補(bǔ)充方法。第一,可W識(shí)別從某些方向到達(dá)的不想要的源,并且將該 角度從允許增益控制做出反應(yīng)的角度中排除。
[0034] 第二,可W使得增益控制對(duì)除期待近端語(yǔ)音到達(dá)的方向外的任何其它方向都更不 敏感。第二種方法會(huì)確保沒有基于移動(dòng)噪聲源的調(diào)整,該移動(dòng)噪聲源不與主揚(yáng)聲器從相同 方向到達(dá),并且也還未被檢測(cè)為噪聲源。
[00巧]首先參照?qǐng)D1,圖1示出了優(yōu)選實(shí)施例的通信系統(tǒng)100。通信系統(tǒng)的第一用戶(用 戶A 102)操作用戶設(shè)備104。用戶設(shè)備104可W是例如移動(dòng)電話、電視、個(gè)人數(shù)字助理 ("PDA")、個(gè)人計(jì)算機(jī)("PC")(包括例如Windows ?、Mac 0S?和Linux? PC)、游戲設(shè)備或其 它能夠在通信系統(tǒng)100上通信的嵌入式設(shè)備。
[0036] 用戶設(shè)備104包括中央處理裝置(CPU) 108,它可W被配置為諸如執(zhí)行在通信系統(tǒng) 100上通信的通信客戶端等應(yīng)用。該應(yīng)用允許用戶設(shè)備104從事通信系統(tǒng)100上的通話和 其它通信會(huì)話(例如,即時(shí)消息通信會(huì)話)。用戶設(shè)備104可W經(jīng)由可W是例如因特網(wǎng)或公 眾交換電話網(wǎng)絡(luò)(PSTN)的網(wǎng)絡(luò)106在通信系統(tǒng)100上通信。用戶設(shè)備104可W在鏈路110 上向網(wǎng)絡(luò)106發(fā)送數(shù)據(jù)和從網(wǎng)絡(luò)106接收數(shù)據(jù)。
[0037] 圖1還示出了用戶設(shè)備104可W與之在通信系統(tǒng)100上通信的遠(yuǎn)程節(jié)點(diǎn)。在圖1 中示出的例子中,遠(yuǎn)程節(jié)點(diǎn)是可W被第二用戶112使用的、并且包括CPU 116的第二用戶 設(shè)備114,其中CPU 116可W執(zhí)行應(yīng)用(例如通信客戶端)W便W與用戶設(shè)備104在通信系 統(tǒng)100中的通信網(wǎng)絡(luò)106上通信相同的方式在通信網(wǎng)絡(luò)106上通信。用戶設(shè)備114可w是 例如移動(dòng)電話、電視、個(gè)人數(shù)字助理(叩DA")、個(gè)人計(jì)算機(jī)("PC")飽括例如Windows ?、Mac OS?和Linux? PC)、游戲設(shè)備或其它能夠在通信系統(tǒng)100上通信的嵌入式設(shè)備。用戶設(shè)備 114可W在鏈路118上向網(wǎng)絡(luò)106發(fā)送數(shù)據(jù)和從網(wǎng)絡(luò)106接收數(shù)據(jù)。因此用戶A 102和用 戶B 112可W在通信網(wǎng)絡(luò)106上彼此通信。
[0038] 圖2示出了執(zhí)行客戶應(yīng)用的用戶終端104的示意圖。用戶終端104包括連接有諸 如屏幕等顯示器204、諸如鍵盤214等輸入設(shè)備和諸如鼠標(biāo)器212等指點(diǎn)設(shè)備的CPU 108。 顯示器204可W包括用于向CPU 108輸入數(shù)據(jù)的觸摸屏。輸出音頻設(shè)備206 (例如揚(yáng)聲器) 連接至CPU 108。諸如麥克風(fēng)208等輸入音頻設(shè)備經(jīng)由自動(dòng)增益控制裝置228連接至CPU 108。盡管在圖2中自動(dòng)增益控制裝置228被表示為獨(dú)立的硬件設(shè)備,但是自動(dòng)增益控制裝 置228可軟件來實(shí)施。例如,自動(dòng)增益控制裝置可W被包括在客戶端中。
[0039] CPU 108連接至諸如用于與網(wǎng)絡(luò)106通信的調(diào)制解調(diào)器等網(wǎng)絡(luò)接口 226。
[0040] 下面參照?qǐng)D3,圖3示出了用戶終端104的示例環(huán)境300。
[0041] 當(dāng)音頻信號(hào)在已在麥克風(fēng)208處被接收到后被處理時(shí),識(shí)別想要的音頻信號(hào)。在 處理期間,基于類語(yǔ)音特性的檢測(cè)來識(shí)別想要的音頻信號(hào)并且確定主揚(yáng)聲器的主方向。該 在圖3中示出,其中主揚(yáng)聲器(用戶102)被圖示為從主方向dl到達(dá)麥克風(fēng)208處的想要的 音頻信號(hào)的源302。盡管為簡(jiǎn)單起見在圖3中示出單個(gè)主揚(yáng)聲器,但應(yīng)當(dāng)明白,在環(huán)境300 中可W存在任何數(shù)量的希望的音頻信號(hào)的源。
[0042] 在環(huán)境300中可W存在不希望的噪聲信號(hào)的源。圖3示出了在環(huán)境300中可W從 方向d3到達(dá)麥克風(fēng)208處的不希望的噪聲信號(hào)的噪聲源304。不希望的噪聲信號(hào)的源包括 例如致涼風(fēng)扇、空調(diào)系統(tǒng)和播放音樂的設(shè)備。
[0043] 不希望的噪聲信號(hào)例如鼠標(biāo)器212的點(diǎn)擊、鍵盤214的敲擊和從揚(yáng)聲器206輸出 的音頻信號(hào),還可W從用戶終端104處的噪聲源到達(dá)麥克風(fēng)208。圖3示出了連接至麥克 風(fēng)208和揚(yáng)聲器206的用戶終端104。在圖3中,揚(yáng)聲器206是可W從方向d2到達(dá)麥克風(fēng) 208處的不希望的音頻信號(hào)的源。
[0044] 盡管麥克風(fēng)208和揚(yáng)聲器206被圖示為連接至用戶終端的外部設(shè)備,但應(yīng)當(dāng)明白, 麥克風(fēng)208和揚(yáng)聲器206可W集成在用戶終端104中。
[0045] 在傳統(tǒng)方法中,AGC處理級(jí)將取決于輸入信號(hào)電平將整個(gè)信道上的增益水平調(diào)整 至適宜的水平。從不希望的方向接收到的、存在于AGC處理級(jí)的輸入處的不希望的噪聲信 號(hào)當(dāng)任何時(shí)候被誤W為是語(yǔ)音時(shí),都被AGC處理級(jí)放大至常規(guī)語(yǔ)音水平。該影響到通話中 所傳輸?shù)恼Z(yǔ)音品質(zhì)。
[0046] 現(xiàn)在參照?qǐng)D4a,圖4a示出了根據(jù)一個(gè)實(shí)施例的麥克風(fēng)208和自動(dòng)增益控制裝置 228的更詳細(xì)的視圖。
[0047] 麥克風(fēng)208包括將多個(gè)麥克風(fēng)包含在內(nèi)的麥克風(fēng)陣列402, W及波束形成器404。 麥克風(fēng)陣列402中的每一麥克風(fēng)的輸出被禪合至波束形成器404。本領(lǐng)域的技術(shù)人員應(yīng)明 白,需要多輸入來實(shí)施波束形成。在圖4中麥克風(fēng)陣列402被圖示為具有3個(gè)麥克風(fēng),但應(yīng) 當(dāng)理解,該麥克風(fēng)的數(shù)量?jī)H是示例而不W任何方式進(jìn)行限制。
[0048] 波束形成器404包括從麥克風(fēng)陣列402接收音頻信號(hào)的處理塊409。處理塊409 包括語(yǔ)音活動(dòng)檢測(cè)器(VAD) 411和D0A估計(jì)塊413 (它的工作將在后面說明)。處理塊409 確認(rèn)由麥克風(fēng)陣列402接收到的音頻信號(hào)的性質(zhì),并且基于由VAD 411檢測(cè)到的類語(yǔ)音品 質(zhì)的檢測(cè)和在塊413中估計(jì)的DOA信息,確定主揚(yáng)聲器的一個(gè)或更多主方向。波束形成器 404通過形成在來自一個(gè)或更多主方向的、在麥克風(fēng)陣列處接收到希望信號(hào)的方向上具有 高增益而在任何其它方向上具有低增益的波束,從而使用DOA信息來處理音頻信號(hào)。盡管 W上說明了處理塊409能確定任何數(shù)量的主方向,但所確定的主方向的數(shù)量影響波束形成 器的特性,例如,與只確定單個(gè)主方向相比,在麥克風(fēng)陣列處從其它(不希望的)方向接收到 的信號(hào)的衰減更少。波束形成器404的輸出W單個(gè)要處理的信道的形式在線406上提供給 自動(dòng)增益控制裝置228。
[0049] 自動(dòng)增益控制裝置228對(duì)波束形成器的輸出施加某一水平的增益。從波束形成器 施加至信道輸出的增益的水平取決于在自動(dòng)增益控制裝置228處接收到的D0A信息。后面 將參照?qǐng)D6來說明如何確定增益的水平。
[0050] 波束形成器404的輸出可W受到進(jìn)一步信號(hào)處理巧日噪聲抑制等)的影響。在圖4 中未示出該種進(jìn)一步信號(hào)處理的電路。噪聲抑制可W被施加至自動(dòng)增益控制裝置228的輸 出處的放大信號(hào),然后再在線410上被送至客戶端W供在網(wǎng)絡(luò)106上經(jīng)由網(wǎng)絡(luò)接口 226傳 輸。然而,優(yōu)選地,噪聲抑制在由自動(dòng)增益控制裝置228即在線406上施加增益的水平之前 被施加至波束形成器的輸出。該是因?yàn)樵肼曇种评碚撋蠒?huì)輕微地降低語(yǔ)音水平(無意地), 并且自動(dòng)增益控制裝置228會(huì)在噪聲抑制后增加語(yǔ)音水平并且為由噪聲抑制造成的語(yǔ)音 水平的輕微降低做出補(bǔ)償。
[0051] 下面參照?qǐng)D4b,圖4b示出了根據(jù)替代實(shí)施例的麥克風(fēng)208和自動(dòng)增益控制裝置 228的更詳細(xì)的視圖。
[0052] 用戶可能希望使用兩個(gè)或更多獨(dú)立音頻信道的立體聲效果,可W提供從波束形成 器輸出的立體聲,然而在一些情況下可能不希望應(yīng)用波束形成器。在該種替代實(shí)施例中不 使用波束形成器。
[0053] 麥克風(fēng)208包括多個(gè)麥克風(fēng)402 (包括麥克風(fēng)403和麥克風(fēng)405)和處理塊409。
[0054] 在該種實(shí)施例中,在多個(gè)麥克風(fēng)402處接收到音頻信號(hào)。為簡(jiǎn)單起見,圖4b示出 了包括兩個(gè)麥克風(fēng)403和405的多個(gè)麥克風(fēng)402,但應(yīng)當(dāng)理解,該麥克風(fēng)的數(shù)量?jī)H是示例而 不W任何方式進(jìn)行限制。
[00巧]多個(gè)麥克風(fēng)402分別在麥克風(fēng)403和405處接收兩個(gè)輸入信道上的音頻信號(hào)。麥 克風(fēng)403和405的信道輸出被禪合至相應(yīng)自動(dòng)增益控制裝置228、229。麥克風(fēng)403和405 的輸出還分別通過線420、422禪合至處理塊409。自動(dòng)增益控制裝置228、229將相同水平 的增益施加至它們各自的麥克風(fēng)208的信道輸出。施加至麥克風(fēng)208的輸出的增益的水平 取決于在自動(dòng)增益控制裝置228、229處接收到的D0A信息。后面將參照?qǐng)D6來說明如何確 定增益的水平。
[005引麥克風(fēng)208的輸出可受到進(jìn)一步信號(hào)處理巧日噪聲抑制等)的影響。噪聲抑制可W 被施加至自動(dòng)增益控制裝置228、229的輸出處的放大信號(hào),然后再在線414、415上被送至 客戶端W便經(jīng)由網(wǎng)絡(luò)接口 226在網(wǎng)絡(luò)106上傳輸。然而,優(yōu)選地,噪聲抑制在由自動(dòng)增益控 制裝置228、229施加增益的水平之前被施加至麥克風(fēng)208的輸出;W上已參照?qǐng)D4討論了 為何該是優(yōu)選的解釋。
[0057] 下面參照?qǐng)D5更詳細(xì)地說明D0A估計(jì)塊413的工作。
[0058] 在DOA估計(jì)塊413中,通過(例如使用相關(guān)方法)估計(jì)在多個(gè)麥克風(fēng)處接收到的音 頻信號(hào)之間的時(shí)間延遲、并且使用關(guān)于所述多個(gè)麥克風(fēng)的位置的先驗(yàn)知識(shí)來估計(jì)音頻信號(hào) 的源,從而估計(jì)D0A信息。
[0059] 作為一例,圖5示出從音頻源516接收兩個(gè)獨(dú)立輸入信道上的音頻信號(hào)的麥克風(fēng) 403和405。在被分開了距離d的麥克風(fēng)403和405處的音頻信號(hào)的到達(dá)方向可W使用公 式(1)來估計(jì): 爵=arc藍(lán)化(學(xué)) (1) 其中V是聲速,而T D是來自源516的音頻信號(hào)到達(dá)麥克風(fēng)403和405的時(shí)間差--即 時(shí)間延遲。時(shí)間延遲是作為使在麥克風(fēng)403和405的輸出處的信號(hào)之間的互相關(guān)最大化的 時(shí)延而得到的。然后可得到與該時(shí)間延遲對(duì)應(yīng)的角度0。在接收到的帶有最大互相關(guān)的延 遲的信號(hào)中可W檢測(cè)語(yǔ)音特性,W確定主揚(yáng)聲器的一個(gè)或更多主方向。
[0060] 應(yīng)當(dāng)注意,計(jì)算信號(hào)的互相關(guān)是信號(hào)處理領(lǐng)域中的普通技術(shù),因而此處不再更詳 細(xì)地說明了。
[0061] 應(yīng)當(dāng)注意,在單信道和多信道實(shí)施例該兩者中,本發(fā)明都不要求使用波束形成器。
[0062] 下面更詳細(xì)地說明自動(dòng)增益控制裝置228的工作。對(duì)于圖4b的實(shí)施例,應(yīng)當(dāng)注意, 自動(dòng)增益控制裝置229 W相同方式發(fā)揮功能。在本發(fā)明的所有實(shí)施例中,自動(dòng)增益控制裝 置228使用在用戶終端處已知的、并且由D0A塊427代表的D0A信息,并且接收要處理的音 頻信號(hào)。自動(dòng)增益控制裝置228在逐峽的基礎(chǔ)上處理音頻信號(hào)。在自動(dòng)增益控制裝置228 中執(zhí)行的處理包括對(duì)輸入到自動(dòng)增益控制裝置228的音頻信號(hào)的每一峽施加某一水平的 增益。由自動(dòng)增益控制裝置228施加至音頻信號(hào)的每一峽的增益的水平取決于正在被處理 的當(dāng)前峽的所提取的D0A信息與在用戶終端處已知的各種音頻源的D0A信息的現(xiàn)有知識(shí)之 間的比較。所提取的D0A信息沿著峽被傳遞,從而它被用作除了峽自身W外的、到自動(dòng)增益 控制裝置228的輸入?yún)?shù)。
[0063] 在傳統(tǒng)方法中,AGC處理級(jí)可W在逐峽的基礎(chǔ)上處理輸入音頻信號(hào),但是要憑借被 允許從一個(gè)取樣值到下一個(gè)取樣值平滑變化的增益。AGC處理級(jí)取決于正在被處理的當(dāng)前 中貞的信號(hào)電平與就在當(dāng)前峽之前處理的峽的信號(hào)電平之間的比較對(duì)正在被處理的當(dāng)前峽 施加某一水平的增益,而不將D0A信息考慮在內(nèi)。
[0064] 如果正在被處理的當(dāng)前峽的信號(hào)電平比就在當(dāng)前峽之前處理的峽的信號(hào)電平更 低,則AGC處理級(jí)將增加增益的水平并將增加的增益的水平施加至正在被處理的當(dāng)前峽。
[0065] 如果正在被處理的當(dāng)前峽的信號(hào)電平比就在當(dāng)前峽之前處理的峽的信號(hào)電平更 高,則AGC處理級(jí)將減少增益的水平并將減少的增益的水平施加至正在被處理的當(dāng)前峽。
[0066] 根據(jù)本發(fā)明的實(shí)施例,由自動(dòng)增益控制裝置228施加至輸入音頻信號(hào)的增益的水 平可W被D0A信息W多種方式影響。
[0067] 從被識(shí)別為來自希望的源的方向到達(dá)麥克風(fēng)208的音頻信號(hào)是基于類語(yǔ)音特性 的檢測(cè)來識(shí)別的,并且被識(shí)別為來自主揚(yáng)聲器的主方向。
[006引在用戶終端處已知的D0A信息可W包括波束形成器的波束圖408。自動(dòng)增益控制 裝置228在逐峽的基礎(chǔ)上處理音頻輸入信號(hào)。在峽的處理期間,自動(dòng)增益控制裝置228讀 取峽的D0A信息,W找出在麥克風(fēng)208處接收到峽中音頻信號(hào)的主成分的角度。峽的D0A 信息與在用戶終端處已知的DOA信息427作比較。該比較決定是否在麥克風(fēng)208處從希望 的源的方向接收到正在被處理的峽中音頻信號(hào)的主成分。
[0069] 替代地或附加地,在用戶終端處已知的D0A信息427可W包括在麥克風(fēng)208處從 用戶終端處的揚(yáng)聲器巧日206等)接收到(在線407上供給自動(dòng)增益控制裝置228、229的)遠(yuǎn) 端信號(hào)的角度0。
[0070] 替代地或附加地,在用戶終端處已知的D0A信息427可W從功能425得來,該功能 425對(duì)來自不同方向的音頻進(jìn)行歸類W定位非常增雜的、可能是由固定噪聲源產(chǎn)生的某一 方向。
[0071] 當(dāng)D0A信息427代表主要希望的方向并且通過比較確定在麥克風(fēng)208處從主方向 接收到正在被處理的峽的主成分時(shí),自動(dòng)增益控制裝置228使用W上說明的傳統(tǒng)方法確定 增益的水平。
[0072] 在第一種辦法中,如果確定在麥克風(fēng)208處從主方向W外的方向接收到正在被處 理的峽主成分,則禁止自動(dòng)增益控制裝置228的正常操作,并且自動(dòng)增益控制裝置228對(duì)正 在被處理的當(dāng)前峽施加曾對(duì)就在當(dāng)前峽之前處理的峽施加的某一水平的增益,即增益的水 平保持恒定。
[0073] 該防止了當(dāng)在通話期間在麥克風(fēng)208處接收到不希望的音頻信號(hào)時(shí)自動(dòng)增益控 制裝置228調(diào)整要施加至峽的增益。替代地,可W防止自動(dòng)增益控制裝置228在帶有不希 望的音頻信號(hào)的峽上增加。
[0074] 圖6示出了在一種示例場(chǎng)景中根據(jù)第一種辦法的自動(dòng)增益控制裝置228的操作。 [00巧]在通話期間,自動(dòng)增益控制裝置228接收識(shí)別主揚(yáng)聲器的主方向的D0A信息(波束 圖408),并且它被保持在塊427中。當(dāng)處理第一峽時(shí),自動(dòng)增益控制裝置228讀取第一峽的 D0A信息,W找出在麥克風(fēng)208處接收到第一峽中音頻信號(hào)的主成分的角度。第一峽的D0A 信息與在用戶終端處已知的D0A信息427作比較。作為該比較的結(jié)果,自動(dòng)增益控制裝置 228確定在麥克風(fēng)208處從主方向接收到正在被處理的第一峽中音頻信號(hào)的主成分?;?該D0A信息,自動(dòng)增益控制裝置228通過施加某一水平的增益gl來處理第一峽(信號(hào)電平 為 si)。
[0076] 當(dāng)處理第二峽時(shí),自動(dòng)增益控制裝置228讀取第二峽的DOA信息,W找出在麥克風(fēng) 208處接收到第二峽中音頻信號(hào)的主成分的角度。第二峽的D0A信息與在用戶終端處已知 的D0A信息作比較。作為該比較的結(jié)果,自動(dòng)增益控制裝置228確定在麥克風(fēng)208處從主 方向未接收到正在被處理的第二峽中音頻信號(hào)的主成分?;谠揇0A信息,自動(dòng)增益控制 裝置228通過施加增益水平gl來處理第二峽(信號(hào)電平為s2),即增益的水平保持恒定。
[0077] 在傳統(tǒng)方法中,由于正在被處理的第二峽的信號(hào)電平s2比(就在第二峽之前處理 的)第一峽的信號(hào)電平si更低,因而增加了增益水平并將增加的增益水平施加至第二峽中 的音頻信號(hào),即第二峽中的音頻信號(hào)被提升至常規(guī)語(yǔ)音水平。
[007引通??蒞假設(shè)語(yǔ)音加噪聲的信號(hào)電平比噪聲的信號(hào)電平更高,但是語(yǔ)音爆發(fā)之間 的噪聲的信號(hào)電平在極少情況下能夠比語(yǔ)音更高。在所說明的實(shí)施例中,自動(dòng)增益控制裝 置228使用兩者中的較大者來確定增益因子。
[0079] 當(dāng)處理第H峽時(shí),自動(dòng)增益控制裝置228讀取第H峽的D0A信息,W找出在麥克風(fēng) 208處接收到第H峽中音頻信號(hào)的主成分的角度。第H峽的D0A信息與在用戶終端處已知 的DOA信息作比較。作為該比較的結(jié)果,自動(dòng)增益控制裝置228確定在麥克風(fēng)208處從主 方向接收到正在被處理的第H峽中音頻信號(hào)的主成分?;谠揇0A信息,自動(dòng)增益控制裝 置228通過施加增益水平g3來處理第H巾貞(信號(hào)電平為S3)。
[0080] 增益水平的與在傳統(tǒng)方法中同樣地被調(diào)整。在本例中,第H峽具有比第二峽的信 號(hào)電平更高的信號(hào)電平,即s3〉s2,因此自動(dòng)增益控制裝置228將增益水平從gl減小至的 并將減小后的增益水平的施加至輸入自動(dòng)增益控制裝置228的音頻信號(hào)。
[0081] 該樣,在該第一種辦法中可W取決于是否在麥克風(fēng)208處從主方向接收到正在被 處理的峽中音頻信號(hào)的主成分來允許或禁止由自動(dòng)增益控制裝置228對(duì)增益水平的調(diào)整。
[0082] 如上述,自動(dòng)增益控制裝置228可W從功能425接收D0A信息,該功能425識(shí)別從 不同方向的噪聲源到達(dá)麥克風(fēng)208的不希望的音頻信號(hào)。該些不希望的音頻信號(hào)是從它 們的特征識(shí)別的,例如來自鍵盤上的鍵盤敲擊或風(fēng)扇的音頻信號(hào)具有與人類語(yǔ)音不同的特 征。不希望的音頻信號(hào)到達(dá)麥克風(fēng)208的角度可W從自動(dòng)增益控制裝置228可能做出反應(yīng) 的角度中排除。因此,當(dāng)在麥克風(fēng)208處從被排除的方向接收到正在被處理的峽中音頻信 號(hào)的主成分時(shí),自動(dòng)增益控制裝置228對(duì)正在被處理的峽施加曾對(duì)就在當(dāng)前峽之前處理的 峽施加的某一水平的增益,即增益的水平保持恒定。
[0083] 還可W進(jìn)一步包括驗(yàn)證裝置423。例如,一旦已經(jīng)(例如在波束形成器的情況下基 于波束圖408)檢測(cè)到一個(gè)或更多主方向,則客戶端將檢測(cè)到的主方向經(jīng)過客戶端用戶界面 通知給用戶102并且詢問用戶102所檢測(cè)到的主方向是否正確。如圖4a中的虛線所示,該 驗(yàn)證是可選的。
[0084] 如果用戶102確認(rèn)所檢測(cè)到的主方向正確,則將所檢測(cè)到的主方向作為D0A信息 發(fā)至自動(dòng)增益控制裝置228,并且自動(dòng)增益控制裝置228如W上說明的那樣操作。一旦用 戶102登入客戶端并且確認(rèn)所檢測(cè)到的主方向正確,則通信客戶端可W將所檢測(cè)到的主方 向存儲(chǔ)在存儲(chǔ)器210中,隨后繼續(xù)登入客戶端,如果所檢測(cè)到的主方向與存儲(chǔ)器中已確認(rèn) 的正確的主方向一致,則認(rèn)為所檢測(cè)到的主方向正確。該防止了用戶102被迫在每次登入 客戶端時(shí)都確認(rèn)主方向。
[0085] 如果用戶示意所檢測(cè)到的主方向不正確,則不將所檢測(cè)到的主方向作為D0A信息 發(fā)至自動(dòng)增益控制裝置228。在該種情況下,處理塊409將繼續(xù)檢測(cè)主方向,并且只待用戶 102確認(rèn)所檢測(cè)到的主方向正確時(shí)才將所檢測(cè)到的主方向發(fā)至自動(dòng)增益控制裝置228。
[0086] 在第一種辦法中,操作模式是使得可W基于D0A信息完全地阻止對(duì)增益水平的調(diào) 整。
[0087] 在第二種辦法中,自動(dòng)增益控制裝置228不W該種嚴(yán)格的操作模式操作。
[0088] 相反,在該第二種辦法中,自動(dòng)增益控制裝置228可W在第一種辦法會(huì)阻止它的 情況下調(diào)整要施加至音頻信號(hào)的峽的增益的水平;然而僅對(duì)增益的水平做出小的調(diào)整。對(duì) 增益的水平的小的調(diào)整可W通過采取更小的增益階或更少的增益階來實(shí)施。在任一情況下 自動(dòng)增益控制裝置都做出反應(yīng),但是比在傳統(tǒng)場(chǎng)景中反應(yīng)得更少。
[0089] W下說明在圖6中示出的示例場(chǎng)景中根據(jù)第二種辦法的自動(dòng)增益控制裝置228的 操作。
[0090] 與在第一種辦法中相同,在通話期間,自動(dòng)增益控制裝置228具有識(shí)別主揚(yáng)聲器 的主方向的D0A信息427。當(dāng)處理第一峽時(shí),自動(dòng)增益控制裝置228讀取第一峽的D0A信 息,W找出在麥克風(fēng)208處接收到第一峽中音頻信號(hào)的主成分的角度。第一峽的DOA信息 與在用戶終端處已知的D0A信息作比較。作為該比較的結(jié)果,自動(dòng)增益控制裝置228確定 在麥克風(fēng)208處從主方向接收到正在被處理的第一峽中音頻信號(hào)的主成分?;谠揇0A信 息,自動(dòng)增益控制裝置228通過施加某一水平的增益gl來處理第一峽(信號(hào)電平為si)。
[0091] 當(dāng)處理第二峽時(shí),自動(dòng)增益控制裝置228讀取第二峽的D0A信息,W找出在麥克風(fēng) 208處接收到第二峽中音頻信號(hào)的主成分的角度。第二峽的D0A信息與在用戶終端處已知 的D0A信息作比較。作為該比較的結(jié)果,自動(dòng)增益控制裝置228確定在麥克風(fēng)208處從主方 向未接收到正在被處理的第二峽中音頻信號(hào)的主成分?;谠揇0A信息,自動(dòng)增益控制裝 置228通過與傳統(tǒng)方法相同地施加更高或更低的增益水平來處理第二峽(信號(hào)電平為s2)。 在該例中第二峽具有比第一峽更低的信號(hào)電平,即s2<sl,自動(dòng)增益控制裝置228將增益水 平從gl增加至g2并將增加后的增益水平g2施加至第二峽。該與傳統(tǒng)方法更接近,但在該 種情況下增益的變化A g = g2 - gl被約束在例如0. 1地的小的數(shù)量處。
[0092] 當(dāng)處理第H巾貞時(shí),自動(dòng)增益控制裝置228讀取第H巾貞的D0A信息,W找出在麥克風(fēng) 208處接收到第H峽中音頻信號(hào)的主成分的角度。第H峽的D0A信息與在用戶終端處已知 的D0A信息作比較。作為該比較的結(jié)果,自動(dòng)增益控制裝置228確定在麥克風(fēng)208處從主 方向接收到正在被處理的第H峽中音頻信號(hào)的主成分?;谠揇0A信息,自動(dòng)增益控制裝 置228通過施加增益水平的來處理第H峽(信號(hào)電平為S3)。增益水平的與傳統(tǒng)方法相同 地向上或向下變動(dòng)。在本例中,第H峽具有比第二峽的信號(hào)電平更高的信號(hào)電平,即s3〉s2, 因此自動(dòng)增益控制裝置228將增益水平從g2減小至的并將減小后的增益水平的施加至 輸入自動(dòng)增益控制裝置228的音頻信號(hào)。在該種情況下,從g2到的的改變不被約束但是 進(jìn)行操作W使信號(hào)電平為S3的峽提升至常規(guī)語(yǔ)音水平。
[0093] 在W上說明的示例場(chǎng)景中,如圖6所示,自動(dòng)增益控制裝置228施加至在自動(dòng)增益 控制裝置228處輸入的音頻信號(hào)的增益水平將W小的遞減或"階"來減小。理想的是,自動(dòng) 增益控制裝置228在麥克風(fēng)208接收背景音頻信號(hào)時(shí)不調(diào)整增益,而僅當(dāng)需要達(dá)到目標(biāo)水 平的語(yǔ)音時(shí)才平滑地調(diào)整增益。非平滑增益改變會(huì)影響通話的品質(zhì),因此第二種辦法因其 提供導(dǎo)致改進(jìn)的通話品質(zhì)的更平滑的增益控制而比第一種辦法更具優(yōu)勢(shì)。
[0094] 盡管W上說明的實(shí)施例指的是從單個(gè)用戶102接收音頻信號(hào)的麥克風(fēng)208,但應(yīng) 當(dāng)理解,麥克風(fēng)可W例如在會(huì)議電話中接收來自多個(gè)用戶的音頻信號(hào)。在該種場(chǎng)景中,多個(gè) 不希望的音頻信號(hào)的源到達(dá)麥克風(fēng)208。
[0095] 盡管已經(jīng)參照優(yōu)選實(shí)施例特別地示出和說明了本發(fā)明,但本領(lǐng)域的技術(shù)人員應(yīng)當(dāng) 理解,可W在形式上和細(xì)節(jié)上做出各種改變而不脫離由所附權(quán)利要求所定義的本發(fā)明的范 圍。
【權(quán)利要求】
1. 一種對(duì)通信會(huì)話期間在用戶設(shè)備與遠(yuǎn)程節(jié)點(diǎn)之間的音頻信號(hào)進(jìn)行處理的方法,所 述方法包括: 接收在所述用戶設(shè)備處的音頻輸入裝置處的多個(gè)音頻信號(hào),該多個(gè)音頻信號(hào)包括至少 一個(gè)主音頻信號(hào)和不希望的信號(hào); 在增益控制裝置處接收所述音頻信號(hào)的到達(dá)方向信息; 向所述增益控制裝置提供代表至少一些所述不希望信號(hào)的已知的到達(dá)方向信息; 通過施加某一水平的增益來處理在所述增益控制裝置處的音頻信號(hào),以生成供發(fā)送至 遠(yuǎn)程節(jié)點(diǎn)用的增益控制信號(hào),其中所施加的增益水平取決于所述音頻信號(hào)的到達(dá)方向信息 與所述已知的到達(dá)方向信息之間的比較。
2. 根據(jù)權(quán)利要求1所述的方法,其中所述音頻輸入裝置處理所述多個(gè)音頻信號(hào)以生 成包括幀序列的單信道音頻輸出信號(hào),所述增益控制裝置按順序處理每一所述幀。
3. 根據(jù)權(quán)利要求2所述的方法,其中在所述增益控制裝置處接收到正在被處理的當(dāng) 前幀的主信號(hào)成分的到達(dá)方向信息,所述方法進(jìn)一步包括: 將所述當(dāng)前幀的所述主信號(hào)成分的到達(dá)方向信息與所述已知的到達(dá)方向信息作比較。
4. 根據(jù)權(quán)利要求3所述的方法,進(jìn)一步包括:基于所述比較來決定是否禁止所述增益 控制裝置的活動(dòng)。
5. 根據(jù)權(quán)利要求4所述的方法,其中所述已知的到達(dá)方向信息包括在所述音頻輸入 裝置處接收到遠(yuǎn)端信號(hào)的至少一個(gè)方向,所述決定基于是否在所述音頻輸入裝置處從在所 述音頻輸入裝置處接收到遠(yuǎn)端信號(hào)的所述至少一個(gè)方向接收到所述當(dāng)前幀的所述主信號(hào) 成分。
6. 根據(jù)權(quán)利要求4或5中的任一項(xiàng)所述的方法,其中所述已知的到達(dá)方向信息包括至 少一個(gè)歸類的方向,所述決定基于是否在所述音頻輸入裝置處從所述至少一個(gè)歸類的方向 接收到所述當(dāng)前幀的所述主信號(hào)成分。
7. 根據(jù)權(quán)利要求6所述的方法,其中所述至少一個(gè)歸類的方向是至少一個(gè)不希望的 音頻信號(hào)到達(dá)所述音頻輸入裝置的方向,并且基于所述至少一個(gè)不希望的音頻信號(hào)的信號(hào) 特性來識(shí)別。
8. 根據(jù)權(quán)利要求4?7中的任一項(xiàng)所述的方法,其中所述已知的到達(dá)方向信息包括在 所述音頻輸入裝置處接收到所述至少一個(gè)主音頻信號(hào)的至少一個(gè)主方向,所述決定基于是 否在所述音頻輸入裝置處從所述至少一個(gè)主方向接收到所述當(dāng)前幀的主信號(hào)成分。
9. 根據(jù)權(quán)利要求8所述的方法,其中所述至少一個(gè)主方向是通過這樣來確定的: 確定使在所述音頻輸入裝置處接收到的所述音頻信號(hào)之間的互相關(guān)最大化的時(shí)間延 遲;以及 檢測(cè)在所述音頻輸入裝置處接收到的、帶有最大互相關(guān)的所述時(shí)間延遲的所述音頻信 號(hào)中的語(yǔ)音特性。
10. 根據(jù)權(quán)利要求8或9中的任一項(xiàng)所述的方法,其中所述音頻輸入裝置包括波束形 成器,該波束形成器被配置為: 估計(jì)所述至少一個(gè)主方向;以及 處理所述多個(gè)音頻信號(hào),以通過在所述至少一個(gè)主方向上形成波束并且實(shí)質(zhì)地抑制來 自除所述主方向以外其它任何方向的音頻信號(hào)而生成所述單信道音頻輸出信號(hào)。
11. 根據(jù)權(quán)利要求10所述的方法,其中所述已知的到達(dá)方向信息進(jìn)一步包括所述波 束形成器的波束圖。
12. 根據(jù)權(quán)利要求4?11中的任一項(xiàng)所述的方法,其中如果從所述比較確定為應(yīng)禁止 所述增益控制裝置的活動(dòng),則所述增益控制裝置被配置為對(duì)所述正在被處理的當(dāng)前幀施加 曾對(duì)就在所述當(dāng)前幀之前處理的幀施加的某一水平的增益。
13. 根據(jù)權(quán)利要求4?11中的任一項(xiàng)所述的方法,其中如果從所述比較確定為應(yīng)禁止 所述增益控制裝置的活動(dòng),則所述增益控制裝置被配置為取決于就在所述當(dāng)前幀之前處理 的幀的信號(hào)電平、受被約束的當(dāng)前幀和前一幀之間的增益的變化的影響而對(duì)所述當(dāng)前幀施 加某一水平的增益。
14. 根據(jù)權(quán)利要求4?11中的任一項(xiàng)所述的方法,其中如果從所述比較確定為不禁止 所述增益控制裝置的活動(dòng),則所述增益控制裝置被配置為將所處理的幀的信號(hào)電平與就在 所述當(dāng)前幀之前處理的幀的信號(hào)電平做比較;并且 如果所述當(dāng)前幀的信號(hào)電平比所述就在當(dāng)前幀之前處理的幀的信號(hào)電平更高,則所述 增益控制裝置被配置為減小增益的水平并且將所述減小的增益的水平施加至所述當(dāng)前幀; 以及 如果所述當(dāng)前幀的信號(hào)電平比所述就在當(dāng)前幀之前處理的幀的信號(hào)電平更低,則所述 增益控制裝置被配置為增加增益的水平并且將所述增加的增益的水平施加至所述當(dāng)前幀。
15. 根據(jù)權(quán)利要求1所述的方法,其中所述音頻輸入裝置包括第一和第二音頻輸入裝 置,每一音頻輸入裝置處理所述多個(gè)音頻信號(hào)以生成輸出信道,所述方法進(jìn)一步包括: 通過對(duì)每一輸出信道施加某一水平的增益來處理在各個(gè)增益控制裝置處的每一輸出 信道,以生成供發(fā)送至遠(yuǎn)程節(jié)點(diǎn)用的第一和第二增益控制的信號(hào),其中所述增益的水平取 決于所述音頻信號(hào)的所述到達(dá)方向信息與所述已知的到達(dá)方向信息之間的比較,并且對(duì)于 每一輸出信道都相同。
16. 根據(jù)任一項(xiàng)前述權(quán)利要求所述的方法,進(jìn)一步包括:從所述用戶設(shè)備的音頻輸出 裝置輸出在所述通信會(huì)話中在所述用戶設(shè)備處從所述遠(yuǎn)程節(jié)點(diǎn)接收到的音頻數(shù)據(jù)。
17. 根據(jù)任一項(xiàng)前述權(quán)利要求所述的方法,其中所述不希望的信號(hào)由在所述用戶設(shè)備 處的源生成,所述源包括以下中的至少一個(gè):所述用戶設(shè)備的音頻輸出裝置;在所述用戶 設(shè)備處的活動(dòng)的源,其中所述活動(dòng)包括點(diǎn)擊活動(dòng),該點(diǎn)擊活動(dòng)包括按鈕點(diǎn)擊活動(dòng)、鍵盤點(diǎn)擊 活動(dòng)和鼠標(biāo)器點(diǎn)擊活動(dòng)。
18. 根據(jù)權(quán)利要求1至16中的任一項(xiàng)所述的方法,其中所述不希望的信號(hào)由所述用戶 設(shè)備外部的源生成。
19. 根據(jù)任一項(xiàng)前述權(quán)利要求所述的方法,其中所述至少一個(gè)主音頻信號(hào)是在所述音 頻輸入裝置處接收到的語(yǔ)音信號(hào)。
20. -種對(duì)通信會(huì)話期間在用戶設(shè)備與遠(yuǎn)程節(jié)點(diǎn)之間的音頻信號(hào)進(jìn)行處理的用戶設(shè) 備,所述用戶終端包括: 音頻輸入裝置,所述音頻輸入裝置接收多個(gè)音頻信號(hào),該多個(gè)音頻信號(hào)包括至少一個(gè) 主音頻信號(hào)和不希望的信號(hào);以及 增益控制裝置,所述增益控制裝置接收所述音頻信號(hào)的到達(dá)方向信息和代表至少一些 所述不希望信號(hào)的已知的到達(dá)方向信息,所述增益控制裝置被配置為通過施加某一水平的 增益來處理所述音頻信號(hào),以生成供發(fā)送至遠(yuǎn)程節(jié)點(diǎn)用的增益控制的信號(hào),其中所施加的 增益水平取決于所述音頻信號(hào)的所述到達(dá)方向信息與所述已知的到達(dá)方向信息之間的比 較。
21. -種計(jì)算機(jī)程序產(chǎn)品,包括由在用戶設(shè)備處的計(jì)算機(jī)處理裝置執(zhí)行的、對(duì)通信會(huì) 話期間在所述用戶設(shè)備與遠(yuǎn)程節(jié)點(diǎn)之間的音頻信號(hào)進(jìn)行處理的計(jì)算機(jī)可讀指令,所述指令 包括用于施行根據(jù)權(quán)利要求1所述的方法的指令。
【文檔編號(hào)】H04R3/00GK104488224SQ201280025394
【公開日】2015年4月1日 申請(qǐng)日期:2012年5月28日 優(yōu)先權(quán)日:2011年5月26日
【發(fā)明者】V. 索倫森 K. 申請(qǐng)人:斯凱普公司