1.一種用于生成一個(gè)或更多個(gè)音頻輸出信號(hào)的系統(tǒng),包括:
分解模塊(101);
信號(hào)處理器(105);以及
輸出接口(106),
其中分解模塊(101)被配置為接收兩個(gè)或更多個(gè)音頻輸入信號(hào),其中分解模塊(101)被配置為生成包括兩個(gè)或更多個(gè)音頻輸入信號(hào)的直達(dá)信號(hào)分量在內(nèi)的直達(dá)分量信號(hào),并且其中分解模塊(101)被配置為生成包括所述兩個(gè)或更多個(gè)音頻輸入信號(hào)的擴(kuò)散信號(hào)分量在內(nèi)的擴(kuò)散分量信號(hào),
其中信號(hào)處理器(105)被配置為接收直達(dá)分量信號(hào)、擴(kuò)散分量信號(hào)和方向信息,所述方向信息取決于所述兩個(gè)或更多個(gè)音頻輸入信號(hào)的直達(dá)信號(hào)分量的到達(dá)方向,
其中信號(hào)處理器(105)被配置為根據(jù)擴(kuò)散分量信號(hào)生成一個(gè)或更多個(gè)經(jīng)處理的擴(kuò)散信號(hào),
其中,對(duì)于所述一個(gè)或更多個(gè)音頻輸出信號(hào)的每個(gè)音頻輸出信號(hào),信號(hào)處理器(105)被配置為根據(jù)到達(dá)方向確定直達(dá)增益,并且信號(hào)處理器(105)被配置為將所述直達(dá)增益應(yīng)用于所述直達(dá)分量信號(hào)以獲得經(jīng)處理的直達(dá)信號(hào),并且信號(hào)處理器(105)被配置為將所述經(jīng)處理的直達(dá)信號(hào)與所述一個(gè)或更多個(gè)經(jīng)處理的擴(kuò)散信號(hào)中的一個(gè)進(jìn)行組合以生成所述音頻輸出信號(hào),以及
其中輸出接口(106)被配置為輸出所述一個(gè)或更多個(gè)音頻輸出信號(hào),
其中信號(hào)處理器(105)包括用于計(jì)算一個(gè)或更多個(gè)增益函數(shù)的增益函數(shù)計(jì)算模塊(104),其中所述一個(gè)或更多個(gè)增益函數(shù)中的每個(gè)增益函數(shù)包括多個(gè)增益函數(shù)自變量值,其中增益函數(shù)返回值被分配給每個(gè)所述增益函數(shù)自變量值,其中,當(dāng)所述增益函數(shù)接收到所述增益函數(shù)自變量值中的一個(gè)值時(shí),所述增益函數(shù)被配置為返回分配給所述增益函數(shù)自變量值中的所述一個(gè)值的增益函數(shù)返回值,以及
其中,信號(hào)處理器(105)還包括信號(hào)修改器(103),用于根據(jù)到達(dá)方向從所述一個(gè)或更多個(gè)增益函數(shù)的增益函數(shù)的增益函數(shù)自變量值中選擇取決于方向的自變量值,以用于從所述增益函數(shù)獲得分配給所述取決于方向的自變量值的增益函數(shù)返回值,并且用于根據(jù)從所述增益函數(shù)獲得的所述增益函數(shù)返回值來確定所述一個(gè)或更多個(gè)音頻輸出信號(hào)中的至少一個(gè)信號(hào)的增益值。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),
其中所述增益函數(shù)計(jì)算模塊(104)被配置為:為所述一個(gè)或更多個(gè)增益函數(shù)的每個(gè)增益函數(shù)生成查找表,其中所述查找表包括多個(gè)條目,所述查找表中的每個(gè)條目包括增益函數(shù)自變量值之一和被分配給所述增益函數(shù)自變量值的增益函數(shù)返回值,
其中增益函數(shù)計(jì)算模塊(104)被配置為將每個(gè)增益函數(shù)的查找表存儲(chǔ)在持久性或非持久性存儲(chǔ)器中,以及
其中信號(hào)修改器(103)被配置為通過從被存儲(chǔ)在存儲(chǔ)器中的所述一個(gè)或更多個(gè)查找表之一讀出所述增益函數(shù)返回值,來獲得被分配給所述取決于方向的自變量值的增益函數(shù)返回值。
3.根據(jù)權(quán)利要求1或2所述的系統(tǒng),
其中信號(hào)處理器(105)被配置為確定兩個(gè)或更多個(gè)音頻輸出信號(hào),
其中增益函數(shù)計(jì)算模塊(104)被配置為計(jì)算兩個(gè)或更多個(gè)增益函數(shù),
其中,對(duì)于所述兩個(gè)或更多個(gè)音頻輸出信號(hào)中的每個(gè)音頻輸出信號(hào),增益函數(shù)計(jì)算模塊(104)被配置為計(jì)算分配給所述音頻輸出信號(hào)的平移增益函數(shù)作為所述兩個(gè)或更多個(gè)增益函數(shù)之一,其中信號(hào)修改器(103)被配置為取決于所述平移增益函數(shù)來生成所述音頻輸出信號(hào)。
4.根據(jù)權(quán)利要求3所述的系統(tǒng),
其中所述兩個(gè)或更多個(gè)音頻輸出信號(hào)中的每一個(gè)的平移增益函數(shù)具有作為所述平移增益函數(shù)的增益函數(shù)自變量值之一的一個(gè)或更多個(gè)全局最大值,其中對(duì)于所述平移增益函數(shù)的一個(gè)或更多個(gè)全局最大值中的每一個(gè),不存在使得所述平移增益函數(shù)返回比所述全局最大值使所述平移增益函數(shù)返回的增益函數(shù)返回值更大的增益函數(shù)返回值的其他增益函數(shù)自變量值,以及
其中對(duì)于所述兩個(gè)或更多個(gè)音頻輸出信號(hào)中的第一音頻輸出信號(hào)和第二音頻輸出信號(hào)的每對(duì),第一音頻輸出信號(hào)的平移增益函數(shù)的一個(gè)或更多個(gè)全局最大值中的至少一個(gè)不同于第二音頻輸出信號(hào)的平移增益函數(shù)的一個(gè)或更多個(gè)全局最大值中的任一個(gè)。
5.根據(jù)權(quán)利要求3或4所述的系統(tǒng),
其中,對(duì)于所述兩個(gè)或更多個(gè)音頻輸出信號(hào)中的每個(gè)音頻輸出信號(hào),增益函數(shù)計(jì)算模塊(104)被配置為計(jì)算分配給所述音頻輸出信號(hào)的窗增益函數(shù)作為所述兩個(gè)或更多個(gè)增益函數(shù)之一,
其中信號(hào)修改器(103)被配置為根據(jù)所述窗增益函數(shù)生成所述音頻輸出信號(hào),以及
其中如果所述窗增益函數(shù)的自變量值大于下窗閾值并且小于上窗閾值,則窗增益函數(shù)被配置為返回比在窗函數(shù)自變量值小于下閾值或大于上閾值的情況下由所述窗增益函數(shù)返回的任何增益函數(shù)返回值大的增益函數(shù)返回值。
6.根據(jù)權(quán)利要求5所述的系統(tǒng),
其中所述兩個(gè)或更多個(gè)音頻輸出信號(hào)中的每一個(gè)的窗增益函數(shù)具有作為所述窗增益函數(shù)的增益函數(shù)自變量值之一的一個(gè)或更多個(gè)全局最大值,其中對(duì)于所述窗增益函數(shù)的一個(gè)或更多個(gè)全局最大值中的每一個(gè),不存在使得所述窗增益函數(shù)返回比所述全局最大值使所述窗增益函數(shù)返回的增益函數(shù)返回值更大的增益函數(shù)返回值的其他增益函數(shù)自變量值,以及
其中對(duì)于所述兩個(gè)或更多個(gè)音頻輸出信號(hào)中的第一音頻輸出信號(hào)和第二音頻輸出信號(hào)的每對(duì),第一音頻輸出信號(hào)的窗增益函數(shù)的一個(gè)或更多個(gè)全局最大值中的至少一個(gè)等于第二音頻輸出信號(hào)的窗增益函數(shù)的一個(gè)或更多個(gè)全局最大值中的一個(gè)。
7.根據(jù)權(quán)利要求5或6所述的系統(tǒng),
其中增益函數(shù)計(jì)算模塊(104)被配置為進(jìn)一步接收指示觀看方向相對(duì)于到達(dá)方向的角位移的取向信息,以及
其中,增益函數(shù)計(jì)算模塊(104)被配置為根據(jù)取向信息生成每個(gè)音頻輸出信號(hào)的平移增益函數(shù)。
8.根據(jù)權(quán)利要求7所述的系統(tǒng),其中增益函數(shù)計(jì)算模塊(104)被配置為根據(jù)取向信息生成每個(gè)音頻輸出信號(hào)的窗增益函數(shù)。
9.根據(jù)權(quán)利要求5至8之一所述的系統(tǒng),
其中增益函數(shù)計(jì)算模塊(104)被配置為進(jìn)一步接收縮放信息,其中所述縮放信息指示相機(jī)的打開角度,以及
其中,增益函數(shù)計(jì)算模塊(104)被配置為根據(jù)縮放信息生成每個(gè)音頻輸出信號(hào)的平移增益函數(shù)。
10.根據(jù)權(quán)利要求9所述的系統(tǒng),其中增益函數(shù)計(jì)算模塊(104)被配置為根據(jù)縮放信息生成每個(gè)音頻輸出信號(hào)的窗增益函數(shù)。
11.根據(jù)權(quán)利要求5至10之一所述的系統(tǒng),
其中增益函數(shù)計(jì)算模塊(104)被配置為進(jìn)一步接收用于對(duì)齊視覺圖像和聲學(xué)圖像的校準(zhǔn)參數(shù),以及
其中增益函數(shù)計(jì)算模塊(104)被配置為根據(jù)校準(zhǔn)參數(shù)生成每個(gè)音頻輸出信號(hào)的平移增益函數(shù)。
12.根據(jù)權(quán)利要求11所述的系統(tǒng),其中增益函數(shù)計(jì)算模塊(104)被配置為根據(jù)校準(zhǔn)參數(shù)生成每個(gè)音頻輸出信號(hào)的窗增益函數(shù)。
13.根據(jù)前述權(quán)利要求中的任一項(xiàng)所述的系統(tǒng),
其中增益函數(shù)計(jì)算模塊(104)被配置為接收關(guān)于視覺圖像的信息,以及
其中增益函數(shù)計(jì)算模塊(104)被配置為根據(jù)關(guān)于視覺圖像的信息生成模糊函數(shù),所述模糊函數(shù)返回復(fù)數(shù)增益以實(shí)現(xiàn)聲源的感知擴(kuò)展。
14.一種用于生成一個(gè)或更多個(gè)音頻輸出信號(hào)的裝置,包括:
信號(hào)處理器(105);以及
輸出接口(106),
其中,信號(hào)處理器(105)被配置為接收包括兩個(gè)或更多個(gè)原始音頻信號(hào)的直達(dá)信號(hào)分量在內(nèi)的直達(dá)分量信號(hào),其中信號(hào)處理器(105)被配置為接收包括所述兩個(gè)或更多個(gè)原始音頻信號(hào)的擴(kuò)散信號(hào)分量在內(nèi)的擴(kuò)散分量信號(hào),并且其中信號(hào)處理器(105)被配置為接收方向信息,所述方向信息取決于所述兩個(gè)或更多個(gè)音頻輸入信號(hào)的直達(dá)信號(hào)分量的到達(dá)方向,
其中信號(hào)處理器(105)被配置為根據(jù)擴(kuò)散分量信號(hào)生成一個(gè)或更多個(gè)經(jīng)處理的擴(kuò)散信號(hào),
其中,對(duì)于所述一個(gè)或更多個(gè)音頻輸出信號(hào)的每個(gè)音頻輸出信號(hào),信號(hào)處理器(105)被配置為根據(jù)到達(dá)方向確定直達(dá)增益,并且信號(hào)處理器(105)被配置為將所述直達(dá)增益應(yīng)用于所述直達(dá)分量信號(hào)以獲得經(jīng)處理的直達(dá)信號(hào),并且信號(hào)處理器(105)被配置為將所述經(jīng)處理的直達(dá)信號(hào)與所述一個(gè)或更多個(gè)經(jīng)處理的擴(kuò)散信號(hào)中的一個(gè)進(jìn)行組合以生成所述音頻輸出信號(hào),以及
其中輸出接口(106)被配置為輸出所述一個(gè)或更多個(gè)音頻輸出信號(hào),
其中信號(hào)處理器(105)包括用于計(jì)算一個(gè)或更多個(gè)增益函數(shù)的增益函數(shù)計(jì)算模塊(104),其中所述一個(gè)或更多個(gè)增益函數(shù)中的每個(gè)增益函數(shù)包括多個(gè)增益函數(shù)自變量值,其中增益函數(shù)返回值被分配給每個(gè)所述增益函數(shù)自變量值,其中,當(dāng)所述增益函數(shù)接收到所述增益函數(shù)自變量值中的一個(gè)值時(shí),所述增益函數(shù)被配置為返回分配給所述增益函數(shù)自變量值中的所述一個(gè)值的增益函數(shù)返回值,以及
其中,信號(hào)處理器(105)還包括信號(hào)修改器(103),用于根據(jù)到達(dá)方向從所述一個(gè)或更多個(gè)增益函數(shù)的增益函數(shù)的增益函數(shù)自變量值中選擇取決于方向的自變量值,以用于從所述增益函數(shù)獲得分配給所述取決于方向的自變量值的增益函數(shù)返回值,并且用于根據(jù)從所述增益函數(shù)獲得的所述增益函數(shù)返回值來確定所述一個(gè)或更多個(gè)音頻輸出信號(hào)中的至少一個(gè)信號(hào)的增益值。
15.一種用于生成一個(gè)或更多個(gè)音頻輸出信號(hào)的方法,包括:
接收兩個(gè)或更多個(gè)音頻輸入信號(hào),
生成包括所述兩個(gè)或更多個(gè)音頻輸入信號(hào)的直達(dá)信號(hào)分量在內(nèi)的直達(dá)分量信號(hào),
生成包括所述兩個(gè)或更多個(gè)音頻輸入信號(hào)的擴(kuò)散信號(hào)分量在內(nèi)的擴(kuò)散分量信號(hào),
接收取決于所述兩個(gè)或更多個(gè)音頻輸入信號(hào)的直達(dá)信號(hào)分量的到達(dá)方向的方向信息,
根據(jù)擴(kuò)散分量信號(hào)生成一個(gè)或更多個(gè)經(jīng)處理的擴(kuò)散信號(hào),
對(duì)于一個(gè)或更多個(gè)音頻輸出信號(hào)中的每個(gè)音頻輸出信號(hào),根據(jù)到達(dá)方向確定直達(dá)增益,將所述直達(dá)增益應(yīng)用于所述直達(dá)分量信號(hào)以獲得經(jīng)處理的直達(dá)信號(hào),以及將所述經(jīng)處理的直達(dá)信號(hào)與所述一個(gè)或更多個(gè)經(jīng)處理的擴(kuò)散信號(hào)中的一個(gè)進(jìn)行組合以生成所述音頻輸出信號(hào),以及
輸出所述一個(gè)或更多個(gè)音頻輸出信號(hào),
其中生成所述一個(gè)或更多個(gè)音頻輸出信號(hào)包括:計(jì)算一個(gè)或更多個(gè)增益函數(shù),其中所述一個(gè)或更多個(gè)增益函數(shù)中的每個(gè)增益函數(shù)包括多個(gè)增益函數(shù)自變量值,其中增益函數(shù)返回值被分配給每個(gè)所述增益函數(shù)自變量值,其中,當(dāng)所述增益函數(shù)接收到所述增益函數(shù)自變量值中的一個(gè)值時(shí),其中所述增益函數(shù)被配置為返回分配給所述增益函數(shù)自變量值中的所述一個(gè)值的增益函數(shù)返回值,以及
其中生成所述一個(gè)或更多個(gè)音頻輸出信號(hào)包括:根據(jù)到達(dá)方向從所述一個(gè)或更多個(gè)增益函數(shù)的增益函數(shù)中的增益函數(shù)自變量值中選擇取決于方向的自變量值,以用于從所述增益函數(shù)獲得分配給所述取決于方向的自變量值的增益函數(shù)返回值,并且用于根據(jù)從所述增益函數(shù)獲得的所述增益函數(shù)返回值來確定所述一個(gè)或更多個(gè)音頻輸出信號(hào)中的至少一個(gè)信號(hào)的增益值。
16.一種用于生成一個(gè)或更多個(gè)音頻輸出信號(hào)的方法,包括:
接收包括所述兩個(gè)或更多個(gè)原始音頻信號(hào)的直達(dá)信號(hào)分量在內(nèi)的直達(dá)分量信號(hào),
接收包括所述兩個(gè)或更多個(gè)原始音頻信號(hào)的擴(kuò)散信號(hào)分量在內(nèi)的擴(kuò)散分量信號(hào),
接收方向信息,所述方向信息取決于所述兩個(gè)或更多個(gè)音頻輸入信號(hào)的直達(dá)信號(hào)分量的到達(dá)方向,
根據(jù)擴(kuò)散分量信號(hào)生成一個(gè)或更多個(gè)經(jīng)處理的擴(kuò)散信號(hào),
對(duì)于一個(gè)或更多個(gè)音頻輸出信號(hào)的每個(gè)音頻輸出信號(hào),根據(jù)到達(dá)方向確定直達(dá)增益,將所述直達(dá)增益應(yīng)用于所述直達(dá)分量信號(hào)以獲得經(jīng)處理的直達(dá)信號(hào),以及將所述經(jīng)處理的直達(dá)信號(hào)與所述一個(gè)或更多個(gè)經(jīng)處理的擴(kuò)散信號(hào)中的一個(gè)進(jìn)行組合以生成所述音頻輸出信號(hào),以及
輸出所述一個(gè)或更多個(gè)音頻輸出信號(hào),
其中生成所述一個(gè)或更多個(gè)音頻輸出信號(hào)包括:計(jì)算一個(gè)或更多個(gè)增益函數(shù),其中所述一個(gè)或更多個(gè)增益函數(shù)中的每個(gè)增益函數(shù)包括多個(gè)增益函數(shù)自變量值,其中增益函數(shù)返回值被分配給每個(gè)所述增益函數(shù)自變量值,其中,當(dāng)所述增益函數(shù)接收到所述增益函數(shù)自變量值中的一個(gè)值時(shí),其中所述增益函數(shù)被配置為返回分配給所述增益函數(shù)自變量值中的所述一個(gè)值的增益函數(shù)返回值,以及
其中生成所述一個(gè)或更多個(gè)音頻輸出信號(hào)包括:根據(jù)到達(dá)方向從所述一個(gè)或更多個(gè)增益函數(shù)的增益函數(shù)的增益函數(shù)自變量值中選擇取決于方向的自變量值,以用于從所述增益函數(shù)獲得分配給所述取決于方向的自變量值的增益函數(shù)返回值,并且用于根據(jù)從所述增益函數(shù)獲得的所述增益函數(shù)返回值來確定所述一個(gè)或更多個(gè)音頻輸出信號(hào)中的至少一個(gè)信號(hào)的增益值。
17.一種計(jì)算機(jī)程序,用于在計(jì)算機(jī)或信號(hào)處理器上執(zhí)行時(shí)實(shí)施根據(jù)權(quán)利要求15或16所述的方法。