本發(fā)明涉及一種頭相關(guān)傳輸函數(shù)(HRTF)張量降維方法,具體地說,是涉及一種基于正交張量近鄰保持嵌入(OTNPE)的頭相關(guān)傳輸函數(shù)降維方法,屬于3D音頻和語音信號處理的技術(shù)領(lǐng)域。
背景技術(shù):
頭相關(guān)傳輸函數(shù)(Head-relatedtransferfunction,HRTF)是實(shí)現(xiàn)虛擬3D音頻的核心部分。它是多變量聲學(xué)傳輸函數(shù)包含了聲音的空間方位信息(方位角和俯仰角),還與聲音的頻率相關(guān)。通過實(shí)驗(yàn)測量方法可以得到不同聲源方向的HRTF,其維數(shù)高且數(shù)據(jù)結(jié)構(gòu)復(fù)雜。這樣在聲學(xué)應(yīng)用領(lǐng)域中直接利用和研究測量得到的HRTF數(shù)據(jù)是很困難的。因此需要對高維復(fù)雜的HRTF進(jìn)行降維處理,提取出HRTF的低維特征以便于觀察研究其特性。目前傳統(tǒng)的降維方法如主成分分析、奇異值分解可以實(shí)現(xiàn)HRTF數(shù)據(jù)從高維到低維的簡化,他們都基于向量模型進(jìn)行降維。然而多維HRTF數(shù)據(jù)的向量化操作不僅增加計(jì)算的復(fù)雜度,還破壞原本數(shù)據(jù)的結(jié)構(gòu)信息以及不同變量之間的相互關(guān)系。為了避免這些問題,利用張量表示多維結(jié)構(gòu)的HRTF而后進(jìn)行降維保持了原始數(shù)據(jù)的結(jié)構(gòu)信息,并實(shí)現(xiàn)了較傳統(tǒng)降維方法更高的數(shù)據(jù)壓縮比。實(shí)際上HRTF是當(dāng)聲源處于聽者頭部不同方位(方位角和俯仰角)時(shí)所測得的頻率響應(yīng),是多種因素綜合作用產(chǎn)生的聲學(xué)濾波器。HRTF存在這樣的數(shù)據(jù)特征,不同方位角的HRTF既有相似之處,也有各自不同的特征。方位角差異越小,其對應(yīng)的HRTF之間的“距離”越小,共性特征越多。當(dāng)方位角度差異增大時(shí),HRTF數(shù)據(jù)之間的關(guān)聯(lián)性減弱,所以在對HRTF進(jìn)行降維后得到的低維特征能夠保留原始HRTF所蘊(yùn)藏的局部幾何特性和近鄰信息才更加符合聽覺特性。但是之前的降維方法則忽略了這些潛在的特征關(guān)系。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于針對現(xiàn)有技術(shù)的不足,提出一種基于正交張量近鄰保持嵌入的HRTF降維方法,能夠通過投影矩陣的正交化較好地保持原始HRTF的局部幾何特性和近鄰關(guān)系,并且將高維HRTF張量嵌入到低維空間,使原始數(shù)據(jù)得到較大的壓縮和精簡,也更加符合聽覺感知。為了達(dá)到上述目的,本發(fā)明的構(gòu)思是:正交張量近鄰保持嵌入是最近幾年得到廣泛運(yùn)用的一種挖掘高維復(fù)雜數(shù)據(jù)低維特征信息的方法,其原理是通過構(gòu)建近鄰圖保持原始數(shù)據(jù)流形上的局部結(jié)構(gòu),使得原始張量數(shù)據(jù)的正交化張量近鄰保持嵌入得以實(shí)現(xiàn)。本發(fā)明充分利用頭相關(guān)傳輸函數(shù)本身潛在的局部特征關(guān)系,來學(xué)習(xí)HRTF張量的子空間且保證子空間基向量的正交性,以實(shí)現(xiàn)高維HRTF張量到低維空間的嵌入并更加符合聽覺特性。本發(fā)明首先構(gòu)建HRTF張量樣本集的近鄰圖;然后按照近鄰圖計(jì)算權(quán)重矩陣。根據(jù)正交張量近鄰保持嵌入方法,且保證不同投影矩陣中基向量互相正交的前提下來學(xué)習(xí)HRTF的正交張量子空間。接著,得到逼近正交子空間的參數(shù)的更新等式,循環(huán)迭代更新等式直到滿足收斂條件。最后,利用上述得到的張量子空間的正交性完成HRTF的投影并保持局部近鄰重構(gòu)關(guān)系。根據(jù)上述發(fā)明構(gòu)思,本發(fā)明采用下述技術(shù)方案:一種基于正交張量近鄰保持嵌入的頭相傳輸函數(shù)降維方法包括以下幾個(gè)步驟:1.針對頭相關(guān)傳輸函數(shù)的訓(xùn)練樣本構(gòu)建近鄰圖。近鄰圖的點(diǎn)是由HRTF樣本集構(gòu)成,按照k-近鄰的方法選擇近鄰點(diǎn);2.利用近鄰圖計(jì)算權(quán)重矩陣,HRTF訓(xùn)練樣本集中的每一點(diǎn)都可以通過它的k近鄰點(diǎn)的線性組合進(jìn)行重建。通過求解約束條件下的最小化目標(biāo)函數(shù):(1)其中代表權(quán)值矩陣,則為近鄰圖中第個(gè)HRTF樣本到第個(gè)樣本的權(quán)值。如果第個(gè)樣本不屬于第個(gè)樣本的K近鄰時(shí),為0;3.根據(jù)HRTF訓(xùn)練樣本數(shù)據(jù)集的階數(shù),以及在第模式下的維數(shù),確定基函數(shù)(投影矩陣)的個(gè)數(shù)為和第個(gè)基函數(shù)的維數(shù)為,個(gè)基函數(shù)標(biāo)記為。4.假設(shè)第個(gè)基函數(shù)未知,其余基函數(shù)已知并初始化為相應(yīng)維數(shù)的單位矩陣,保證基函數(shù)中基向量間的正交性,利用初始化的已知基函數(shù)來求解未知的基函數(shù);5.利用步驟4中的已知初始化基函數(shù)對HRTF訓(xùn)練樣本集進(jìn)行低維嵌入,得到每個(gè)樣本的低維特征張量,由個(gè)樣本的得到矩陣,再結(jié)合權(quán)重矩陣計(jì)算得到矩陣?;瘮?shù)中每個(gè)列向量是正交的,但是其第一個(gè)列向量是不受限制的。利用特征分解求解出即的最小特征值對應(yīng)的特征向量。再根據(jù)其余個(gè)列向量與已求解出向量的正交關(guān)系,利用拉格朗日乘數(shù)法將正交條件加入到目標(biāo)函數(shù)中逐一求解出中剩余的個(gè)列向量。6.利用步驟5求解出的基函數(shù)再代入到步驟5中,此時(shí)更新為且基函數(shù)作為已知條件重復(fù)步驟5,求解基函數(shù);7.預(yù)先設(shè)定一個(gè)閾值。將步驟6得到的基函數(shù)標(biāo)記為,重復(fù)步驟5得到,使得兩者之間歐氏距離小于閾值結(jié)束循環(huán),否則一直重復(fù)步驟5和步驟6。8.對于新的HRTF測試樣本可以利用上述過程獲取的基函數(shù)將測試HRTF嵌入到低維正交子空間去。由于基函數(shù)的正交性,較好的保持了原本高維數(shù)據(jù)中蘊(yùn)藏的局部流形結(jié)構(gòu)。本發(fā)明與現(xiàn)有技術(shù)相比較,具有如下顯而易見的突出實(shí)質(zhì)性特點(diǎn)和顯著優(yōu)點(diǎn):本發(fā)明充分利用張量近鄰保持嵌入的優(yōu)點(diǎn),并在此基礎(chǔ)上保證基函數(shù)的正交性,使得投影的同時(shí)更加完好的保持頭相關(guān)傳輸函數(shù)高維數(shù)據(jù)空間中的近鄰重構(gòu)關(guān)系,提取了符合聽覺特性的HRTF低維特征。附圖說明圖1為本發(fā)明所述方法的流程圖。具體實(shí)施方式為了更好地理解本發(fā)明的技術(shù)方案,以下對本發(fā)明的優(yōu)選實(shí)施例作進(jìn)一步的詳細(xì)描述:實(shí)施例一:參見圖1,本基于正交張量近鄰保持嵌入的頭相關(guān)傳輸函數(shù)的降維方法,其特征是1)針對頭相關(guān)傳輸函數(shù)的訓(xùn)練樣本構(gòu)建近鄰圖,近鄰圖的點(diǎn)是由樣本集構(gòu)成,按照k-近鄰的方法選擇近鄰點(diǎn);2)利用近鄰圖計(jì)算權(quán)重矩陣,頭相關(guān)傳輸函數(shù)訓(xùn)練樣本集中的每一點(diǎn)都可以通過它的k近鄰點(diǎn)的線性組合進(jìn)行重建;通過求解約束條件下的最小化目標(biāo)函數(shù):其中代表權(quán)值矩陣,則為第近鄰圖中第個(gè)HRTF樣本到第個(gè)HRTF樣本的權(quán)值。如果第第個(gè)樣本不屬于第個(gè)樣本的K近鄰時(shí),為0;3)根據(jù)頭相關(guān)傳輸函數(shù)訓(xùn)練樣本數(shù)據(jù)集的階數(shù),以及在第模式下的維數(shù),確定基函數(shù)的個(gè)數(shù)為和第個(gè)基函數(shù)的維數(shù)為,個(gè)基函數(shù)標(biāo)記為;4)假設(shè)第個(gè)基函數(shù)未知,其余基函數(shù)已知并初始化為相應(yīng)維數(shù)的單位矩陣,保證基函數(shù)中基向量間的正交性,利用初始化的已知基函數(shù)來求解未知的基函數(shù);5)利用步驟4)中的已知初始化基函數(shù)對頭相關(guān)傳輸函數(shù)訓(xùn)練樣本集進(jìn)行低維嵌入,得到每個(gè)樣本的低維特征張量,由個(gè)樣本的得到矩陣,再結(jié)合權(quán)重矩陣計(jì)算得到矩陣;基函數(shù)中每個(gè)列向量是正交的,但是其第一個(gè)列向量是不受限制的;利用特征分解求解出即的最小特征值對應(yīng)的特征向量;再將其余個(gè)列向量與已求解出的向量的正交關(guān)系,利用拉格朗日乘數(shù)法將正交條件加入到目標(biāo)函數(shù)中逐一求解出中剩余的個(gè)列向量;6)利用步驟5)求解出的基函數(shù)滿足預(yù)先設(shè)定條件之后,再代入到步驟5)中,此時(shí)更新為且基函數(shù)作為已知條件重復(fù)步驟5),求解基函數(shù);7)預(yù)先設(shè)定一個(gè)閾值,將步驟6)得到的基函數(shù)標(biāo)記為,重復(fù)步驟5)得到,使得兩者之間歐氏距離小于閾值結(jié)束循環(huán),否則一直重復(fù)步驟5)和步驟6);8)對于新的頭相關(guān)傳輸函數(shù)測試樣本可以利用獲得的基函數(shù)將其嵌入到低維子空間去,由于基函數(shù)的正交性,較好的保持了原本高維數(shù)據(jù)中蘊(yùn)藏的局部流形結(jié)構(gòu)。實(shí)施例二:參見圖1,本基于正交張量近鄰保持嵌入的頭相關(guān)傳輸函數(shù)的降維方法,利用張量建模HRTF,結(jié)合張量近鄰保持嵌入,并保證投影矩陣的正交性,實(shí)現(xiàn)張量HRTF投影到低維特征空間中并保持著原本高維數(shù)據(jù)空間中的局部幾何特性和近鄰關(guān)系,其具體實(shí)施步驟如下:1.頭相關(guān)傳輸函數(shù)的個(gè)3階張量形式的訓(xùn)練樣本,其中3個(gè)指標(biāo)分別代表聲源方位信息的方位角、俯仰角以及頻率的個(gè)數(shù)。針對HRTF張量樣本集構(gòu)建近鄰圖,圖中的點(diǎn)是由樣本集構(gòu)成。假設(shè)樣本對應(yīng)著近鄰圖中第個(gè)節(jié)點(diǎn),若存在樣本是樣本的近鄰,則有一條邊連接近鄰圖中的第點(diǎn)和第點(diǎn)。按照k-近鄰的方法選擇近鄰點(diǎn);2.按照下述過程計(jì)算權(quán)值矩陣:代表權(quán)值矩陣,則為第近鄰圖中第個(gè)HRTF樣本到第個(gè)HRTF樣本的權(quán)值。如果第個(gè)樣本不屬于第個(gè)樣本的K近鄰時(shí),為0。通過求解下述約束條件下的最小化目標(biāo)函數(shù):(2)3.利用步驟1中3階HRTF訓(xùn)練樣本張量得知階數(shù)n=3,以及在第模式下的維數(shù)。這樣確定了基函數(shù)的個(gè)數(shù)為3,且第個(gè)基函數(shù)的維數(shù)為,3個(gè)基函數(shù)分別為;4.假設(shè)第個(gè)基函數(shù)未知,其余兩個(gè)基函數(shù)已知并初始化為單位矩陣,保證基函數(shù)中基向量間的正交性,利用初始化的已知基函數(shù)來求解未知的基函數(shù);5.利用步驟4中的已知初始化基函數(shù)對HRTF訓(xùn)練樣本集進(jìn)行低維嵌入,得到每個(gè)樣本的低維特征張量:(3)其中為樣本個(gè)數(shù),且對按第k模式展開為矩陣。利用個(gè)樣本的低維特征矩陣計(jì)算得到為(4)然后再結(jié)合步驟2中求出的權(quán)重矩陣來計(jì)算矩陣:(5)基函數(shù)中每個(gè)列向量是正交的,但是其第一個(gè)列向量是不受限制的。求解下列泛化特征向量問題:(6)為特征向量中最小特征值對應(yīng)的特征向量,即的最小非零特征值對應(yīng)的特征向量。如果為奇異矩陣,則進(jìn)行規(guī)范化操作令,為很小的標(biāo)量,例如0.01。5.1.根據(jù)基函數(shù)中的基向量之間是正交性,假設(shè)已確定前正交向量,第個(gè)正交向量可以通過求解下面的約束條件下的最小化目標(biāo)函數(shù):(7)為了排除尺度因子的影響,增加約束條件。利用拉格朗日乘數(shù)法,構(gòu)造輔助函數(shù),對求偏導(dǎo)并利用已知進(jìn)行運(yùn)算,得到(8)其中,。5.2.顯然根據(jù)正是需要最小化的目標(biāo)函數(shù),而為式(8)的最小非零特征值對應(yīng)的特征向量。標(biāo)記,為的最小特征值對應(yīng)的特征向量。將得到的第個(gè)正交向量進(jìn)行歸一化(9)5.3.重復(fù)步驟5.1和5.2更新由2到之后結(jié)束循環(huán),即計(jì)算得到個(gè)正交的基向量組成基函數(shù)結(jié)束循環(huán)運(yùn)算。的維數(shù)為,其每個(gè)列向量之間是正交的,因此能夠?qū)崿F(xiàn)HRTF張量第k模式下的低維嵌入,并且能夠由基函數(shù)和低維特征張量重構(gòu)出HRTF原始高維的數(shù)據(jù)。6.利用步驟5求解出的基函數(shù),再代入到步驟5中,且基函數(shù)作為已知條件重復(fù)步驟5,此時(shí)更新為求解基函數(shù);7.預(yù)先設(shè)定一個(gè)閾值。將步驟6得到的基函數(shù)標(biāo)記為,重復(fù)步驟5得到,使得兩者之間歐氏距離小于閾值結(jié)束循環(huán),否則一直重復(fù)步驟5和步驟6。8.根據(jù)上述過程求得的嵌入矩陣對測試的新樣本進(jìn)行特征提取,得到的測試樣本映射到低維空間的特征張量(10)其維數(shù)為。由于基函數(shù)向量的正交性,較好的保持了原本高維數(shù)據(jù)中蘊(yùn)藏的局部流形結(jié)構(gòu),并且可以由低維特征張量和基函數(shù)重構(gòu)回頭相關(guān)傳輸函數(shù)原始高維空間的數(shù)據(jù)。