音頻信號中的指向性信號的比重較小。
[0056] 其中,分析第一音頻信號,得到第一音頻信號包括的指向性信號比重的步驟還可 以通過以下步驟(A)至(C)實(shí)現(xiàn),包括:
[0057] (A):對第一音頻信號建立協(xié)方差矩陣;
[0058] 協(xié)方差矩P
[0059] cov( ω i ,n ., . ω i,n)*SH( ω i,η)。
[0060] 如果第一音頻信號包括W、X和Υ,
[0061] 則S( c〇i,n) = [W( ω?,η)Χ( ω?,η)Υ( ω?,η)]τ,
[0062] 如果第一音頻信號包括W、X、Y和Ζ,
[0063] 則 S(c〇i,n) = [W(t0i,n)X(t0i,n)Y(t0i,n)Z(t0i,n)]T〇
[0064] 其中,ωι為第一音頻信號的頻率,n為對時(shí)間軸上幀數(shù)的索引,[]H代表向量共輒轉(zhuǎn) 置;α是平滑因子,且α可以事先設(shè)定或者根據(jù)第一音頻信號的信號特性動態(tài)調(diào)整,例如,α可 以0.92。ω ,包括了所有感興趣的頻率并且ω ,可以根據(jù)需要進(jìn)行設(shè)置并更改;例如,ω ,為 100-16000ΗΖ。
[0065] 并且,可以設(shè)置每個(gè)ω ,的權(quán)重,則對第一音頻信號建立協(xié)方差矩陣時(shí),可以根據(jù) 每個(gè)ω,的權(quán)重計(jì)算第一音頻信號的協(xié)方差矩陣,則協(xié)方差矩陣
[0066] cov(n) = Σ cov( ω i,n)*p,p為 ω i的權(quán)重。
[0067] (B):對協(xié)方差矩陣進(jìn)行特征分析,得到特征值;
[0068] 通過Matlab函數(shù)對協(xié)方差矩陣進(jìn)行特征分析,得到[V,Λ ]=eigs(cov(n))。
[0069] 其中,V是3*3的矩陣或者4*4的矩陣,該矩陣的每列代表cov(n)的特征向量;Λ包 含了以降序排列的相應(yīng)特征值。
[0070] (C):根據(jù)特征值,計(jì)算指向信號的比重。
[0071]從特征值中選擇最大特征值作為第一特征值,從除最大特征值之外的特征值中選 擇最大特征值作為第二特征值,根據(jù)第一特征值和第二特征值,通過以下公式(1)計(jì)算指向 性信號的比重。
[0072]
[0073] 其中,DRR為指向性信號的比重為第一特征值,且心對應(yīng)于直達(dá)聲能量;λ2為第 二特征值,且λ2對應(yīng)反射,回聲,環(huán)境聲等。DRR的值在[0,1 ]之間,DRR的值越小代表直達(dá)聲 比重越低,聲場方向性越弱,也即指向性信號比重越低;DRR的值越大代表直達(dá)聲比重越高, 聲場方向性越強(qiáng),也即指向性信號比重越高。
[0074] 進(jìn)一步地,通過direction <^31'1';^31(聲源到達(dá)方向)算法分析第一音頻信號,得 到第一音頻信號主要聲源的方向。
[0075] 進(jìn)一步地,通過Instrument classification(樂器分類)算法分析第一音頻信號, 得到第一音頻信號的樂器類別;通過Speechmusic classification(語音音樂分類)算法分 析第一音頻信號,得到第一音頻信號的聲音類別。
[0076] 進(jìn)一步地,通過Object extraction(對象提取)算法提取第一音頻信號包括的對 象。
[0077]例如,第一音頻信號為一段語音,則通過Object extraction算法提取第一音頻信 號的對象為語音;再如,第一音頻信號為一段雷聲,則通過Object extraction算法提取第 一音頻信號的對象為雷聲等;再如,第一音頻信號為一段音樂,則通過Object extraction 算法提取第一音頻信號的對象為音樂等。
[0078] 進(jìn)一步地,可以事先分析第一音頻信號,得到第一音頻信號的內(nèi)容,將第一音頻信 號和第一音頻信號的內(nèi)容存儲在音頻信號和內(nèi)容的對應(yīng)關(guān)系中,則本步驟可以為:
[0079] 根據(jù)第一音頻信號,從存儲的音頻信號和內(nèi)容的對應(yīng)關(guān)系中獲取第一音頻信號的 內(nèi)容。
[0080] 其中,存儲的音頻信號和內(nèi)容的對應(yīng)關(guān)系可以以元數(shù)據(jù)的形式存儲在服務(wù)器中, 并且可以直接將第一音頻信號的內(nèi)容嵌入第一音頻信號中,也可以將第一音頻信號的內(nèi)容 單獨(dú)存放,建立內(nèi)容文件夾,將第一音頻信號的內(nèi)容存儲在該內(nèi)容文件夾中,并建立第一音 頻信號和該內(nèi)容文件夾的對應(yīng)關(guān)系。
[0081] 可以在獲取音頻文件的第一音頻時(shí),獲取第一音頻信號的內(nèi)容,也可以在本步驟 中獲取第一音頻文件的內(nèi)容。并且,從存儲的音頻信號和內(nèi)容的對應(yīng)關(guān)系中獲取第一音頻 信號的內(nèi)容,能夠減輕運(yùn)算負(fù)擔(dān),并且提高終端生成虛擬環(huán)繞聲的效率。
[0082] (1-2):根據(jù)第一音頻信號的內(nèi)容,確定第一音頻信號的錄制場景。
[0083] 存儲內(nèi)容和錄制場景的對應(yīng)關(guān)系,相應(yīng)的,本步驟可以為:
[0084] 根據(jù)第一音頻信號的內(nèi)容,從存儲的內(nèi)容和錄制場景的對應(yīng)關(guān)系中獲取第一音頻 信號的錄制場景。
[0085] 在本步驟中,也可以獲取內(nèi)容和錄制場景的對應(yīng)關(guān)系,存儲內(nèi)容和錄制場景的對 應(yīng)關(guān)系;相應(yīng)的,本步驟可以為:
[0086] 根據(jù)第一音頻信號的內(nèi)容,從存儲的內(nèi)容和錄制場景的對應(yīng)關(guān)系中獲取第一音頻 信號的錄制場景。
[0087] 其中,內(nèi)容和錄制場景的對應(yīng)關(guān)系可以以元數(shù)據(jù)的形式存儲,并且可以直接將第 一音頻信號的錄制場景嵌入第一音頻信號的內(nèi)容中,也可以將第一音頻信號的錄制場景單 獨(dú)存放,建立錄制場景文件夾,將第一音頻信號的錄制場景存儲在該錄制場景文件夾中,并 建立第一音頻信號的內(nèi)容和該錄制場景的對應(yīng)關(guān)系。
[0088] 進(jìn)一步地,將第一音頻信號和第一音頻信號的錄制場景存儲在音頻信號和錄制場 景的對應(yīng)關(guān)系中;從而再次播放第一音頻信號時(shí),不用通過以上方法確定第一音頻信號的 錄制場景,直接從音頻信號和錄制場景的對應(yīng)關(guān)系中獲取第一音頻信號的錄制場景。
[0089] 例如,存儲的指向性信號的比重大于0.5時(shí),確定第一音頻信號的錄制場景為商務(wù) 會議;指向性信號的比重小于0.5時(shí),確定第一音頻信號的錄制場景為演唱會。
[0090] (2):根據(jù)錄制場景,從錄制場景和調(diào)整參數(shù)的對應(yīng)關(guān)系中獲取第一音頻信號的調(diào) 整參數(shù)。
[0091]存儲錄制場景和調(diào)整參數(shù)的對應(yīng)關(guān)系,則本步驟可以為:
[0092] 根據(jù)錄制場景,從存儲的錄制場景和調(diào)整參數(shù)的對應(yīng)關(guān)系中獲取第一音頻信號的 調(diào)整參數(shù)。
[0093] 在本步驟中,也可以獲取錄制場景和調(diào)整參數(shù)的對應(yīng)關(guān)系,存儲錄制場景和調(diào)整 參數(shù)的對應(yīng)關(guān)系;相應(yīng)的,本步驟可以為:
[0094]根據(jù)錄制場景,從存儲的錄制場景和調(diào)整參數(shù)的對應(yīng)關(guān)系中獲取第一音頻信號的 調(diào)整參數(shù)。
[0095] 進(jìn)一步地,將第一音頻信號和第一音頻信號的調(diào)整參數(shù)存儲在音頻信號和調(diào)整參 數(shù)的對應(yīng)關(guān)系中,從而再次播放第一音頻信號時(shí),不用通過以上方法確定第一音頻信號的 錄制場景,在根據(jù)錄制場景獲取調(diào)整參數(shù),而是直接從音頻信號和調(diào)整參數(shù)的對應(yīng)關(guān)系中 獲取第一音頻信號的調(diào)整參數(shù),從而縮短了獲取第一音頻信號的調(diào)整參數(shù)的獲取時(shí)間,提 高了獲取效率。
[0096] 進(jìn)一步地,對于第二種實(shí)現(xiàn)方式,本步驟可以為:
[0097]存儲音頻信號和調(diào)整參數(shù)的對應(yīng)關(guān)系,根據(jù)第一音頻信號,從存儲的音頻信號和 調(diào)整參數(shù)的對應(yīng)關(guān)系中獲取第一音頻信號的調(diào)整參數(shù)。
[0098] 進(jìn)一步地,音頻信號和調(diào)整參數(shù)的對應(yīng)關(guān)系可以以元數(shù)據(jù)的形式存儲,并且可以 直接將第一音頻信號的調(diào)整參數(shù)嵌入第一音頻信號中,也可以將第一音頻信號的調(diào)整參數(shù) 單獨(dú)存放,建立調(diào)整參數(shù)文件夾,將第一音頻信號的調(diào)整參數(shù)存儲在調(diào)整參數(shù)文件中,并建 立第一音頻信號和該調(diào)整參數(shù)文件夾的對應(yīng)關(guān)系。
[0099] 例如,第一音頻信號中指向性信號的比重大于0.5,則上混階數(shù)為3,且虛擬揚(yáng)聲器 的拓?fù)浣Y(jié)構(gòu)包括6個(gè)虛擬揚(yáng)聲器;再如,第一音頻信號中指向性信號的比重小于0.5,則上混 階數(shù)為1,且虛擬揚(yáng)聲器的拓?fù)浣Y(jié)構(gòu)包括4個(gè)虛擬揚(yáng)聲器。
[0100] 例如,第一音頻信號的方向性聲源分布在某一方向,比如聲場內(nèi)容為音樂會,聲場 集中在舞臺方向也即正前方,則將虛擬揚(yáng)聲器的拓?fù)浣Y(jié)構(gòu)中的左前方和右前方揚(yáng)聲器的距 離變大。
[0101] 虛擬揚(yáng)聲器的拓?fù)浣Y(jié)構(gòu)對虛擬環(huán)繞聲的質(zhì)量有重大的影響,并且對虛擬環(huán)繞聲的 影響根據(jù)第一音頻信號的內(nèi)容的不同而不同;例如,第一