專利名稱:延遲估計器的制作方法
技術領域:
本發(fā)明一般涉及用在通信網(wǎng)絡中的方法和設備。更精確地,它涉及一種用于在通信網(wǎng)絡中估計兩個點之間的信號行進(travel)的延遲的方法和設備。本發(fā)明可以具體地用在用于在通信設備中估計或減輕回波(echo)的應用中。
背景技術:
考慮在參考點處已知并且在有限時間中通過系統(tǒng)行進到接收點的聲波或電信號。 延遲是所述特征信號特性在參考點處出現(xiàn)與它在接收點處重現(xiàn)之間經(jīng)過的時間。在系統(tǒng)是通信網(wǎng)絡的具體情況下,延遲可以是在各種傳導材料中的傳播時間、在解碼器和編碼器 (具體地是模擬和數(shù)字格式之間的轉換)中的處理時間、在分組交換網(wǎng)中的路由期間的等待時間、以及當信號在路徑的一些段中以聲波形式發(fā)送時可能的在空氣中的傳播時間。通過系統(tǒng)行進的聲波或電信號的延遲的準確估計在許多應用中是很有價值的,例如在通信設備中的回波消除和回波抑制、去混響、回波定位、為了指紋識別目的的音頻文件的校準、以及在錄音室中的音頻信號的校準。延遲估計的一個重要應用是在電話中的回波抑制和回波消除。關于這一點,遠端方和近端方使用電信網(wǎng)通信。近端方想要只接收由遠端說話者說的語音信號。但是,由于聲波回波或由于網(wǎng)絡回波,近端方可能另外接收到由他或她自己說的(失真的和延遲的) 語音信號。向近端方行進的信號中的此信號分量被稱為回波信號。在聲波回波的情況下, 反饋路徑是聲波并且包括遠端處的聲波揚聲器和獲得回波信號的麥克風。在網(wǎng)絡回波的情況下,反饋路徑是電子的并且由有缺陷的傳輸線終端負載引起。為了減少由近端方感覺到的回波,必須減少或消除回波信號。這通常通過使用自適應濾波(回波消除)的數(shù)字計算機制和/或通過增益控制(回波抑制)來完成。回波消除的自適應濾波器被優(yōu)化以通過從向近端方行進的信號中減去向遠端方行進的信號來去除與向遠端方行進的信號相關的信號分量。發(fā)現(xiàn)向遠端行進的信號與回波信號的相對延遲 (主體延遲(bulk delay))隱含在此優(yōu)化中并且一般基于相關性,即使有時是從廣義上來說的。主體延遲的初始估計通常用于減少回波消除所需的相關性計算數(shù)量。在回波抑制的情況下,每當向近端行進的信號主要由近端方說的信號構成時,試探(heuristic)規(guī)則一般用于抑制它?;夭ㄒ种菩枰老蜻h端行進的信號和回波信號之間的相對延遲。相對延遲的估計通常通過互相關性來計算。用于回波消除的可用的延遲估計方法,諸如在國際專利申請PCT/FI94/00577(作為WO 95/17784公開)中公開的方法,一般直接或間接地基于互相關性。但是互相關性運算具有缺陷。這些缺陷包括,對于長序列以及如果使用可能的延遲的大的搜索范圍,則該方法具有高的計算復雜度。第二缺陷是,如果通過線性濾波運算不能準確地描述回波信號和向遠端行進的信號之間的關系,則基于互相關性的方法的性能一般會惡化。也就是說,如果反饋路徑引入了非線性失真,則性能降低。第三個缺陷適用于具有隨時間變化的延遲的系統(tǒng)它難以平衡關于延遲的舊的和新的信息。使用長的但有限的估計間隔強化了大容量存
4儲器和計算要求??商鎿Q地,必須使用更舊的數(shù)據(jù)的隱含的指數(shù)衰減,諸如通過迭代乘以小于一的因子,其一般執(zhí)行得不那么好。高計算工作量、對反饋路徑中的非線性失真敏感、以及去除舊的信息的困難性推動了替代的延遲估計方法。替代的延遲估計方法可以用于減小回波消除中的搜索范圍并且作為用于回波抑制的延遲的第一或最終的估計。
發(fā)明內容
本發(fā)明的目的是完全或部分克服現(xiàn)有技術的上述缺點和缺陷并且提供用于延遲估計的改進的方法和設備。另一個目的是提供對反饋路徑中的非線性失真的低敏感性。期望以相對低的計算工作量獲得具有相對高的精度的估計。因此,如所附的獨立權利要求所限定的,本發(fā)明提供一種用于找到在空間中分開的兩個點之間的信號的延遲的估計的方法和設備。本發(fā)明的當前優(yōu)選的實施例由從屬權利要求限定。盡管本發(fā)明不需要穩(wěn)定的統(tǒng)計量,但是它的公式化基于參考點處的信號的測量的值和接收點處的信號的測量的值的聯(lián)合概率的概念,作為測量之間的時間延遲的函數(shù)。測量可以具有任何合適的量,諸如瞬時或平均的能量內容。用于延遲估計的現(xiàn)有方法一般使用互相關性的平均值或測量之間的差的平均值來估計延遲。相反,本發(fā)明基于對兩個測量集合中的值的范圍的共生進行計數(shù),其形成向具有穩(wěn)定的統(tǒng)計量的數(shù)據(jù)的聯(lián)合概率的離散近似。本領域技術人員公知聯(lián)合概率比平均互相關性或平均差提供關于兩個變量之間的關系的更多的信息。因而,聯(lián)合概率的使用便于延遲的更好估計。有利地,通過與適合在參考點和接收點處估計的量的通常大小(magnitude)的閾值比較,測量值被量化到簡化的、優(yōu)選地是二進制的形式。在信號的通常的衰減或放大之后,該方法可以向給定的量的值在兩個點處應用不同的閾值。因此,獲得兩個二進制序列, 由在參考點和接收點處估計的量的一位量化的值(即,布爾值)構成。在音頻信號的具體情況下,二進制1表示強的音頻活性,諸如說話者說話,而二進制0表示弱的音頻活性,諸如靜默或接近靜默。存在四個可能的量化值的共生(0,0), (0,1), (1,0), (1,1) (1)這里(0,1)表示在參考點處的0(低的值)和在接收點處的1(高的值)。相似的對可以由接收點和參考點處的同時測量值形成或由時移的測量值形成??紤]以自然方式選擇閾值的本發(fā)明構思的實施例。首先,假如信號在參考點和接收點之間沒有延遲地傳播。然后與對(1,0)對應的接收點處的強音頻活性和參考點處的弱音頻活性的組合應該不可能成一對,因為在參考點處測量的高的值應當也已經(jīng)引起接收點處的高的值。在實踐中,這意味著(1,0)具有低的出現(xiàn)概率?,F(xiàn)在,如果延遲為D,D為非零的數(shù)字,則對(1,0)可以以同時測量的值的對出現(xiàn)。但是,當延遲已經(jīng)通過向后移位、至少向后移位D或接近于D的數(shù)字而被適當?shù)匮a償時,有理由期望它具有低的出現(xiàn)概率。對于除D外的其他的向后移位,對(1,0)具有更高的出現(xiàn)概率。因而,可以通過對于不同的向后移位對共生(1,0)進行計數(shù)并選擇具有最低的計數(shù)的延遲(相對頻率)來得到延遲D。為了更好的性能,也可以考慮其他的共生。通過如權利要求1所限定的根據(jù)本發(fā)明的第一方面的方法,此過程可以被概括為,不確定相對頻率,而是將代價(penalty)分配給最小可能的共生(或多個共生)并存儲在表中。在定義候選延遲的集合之后,從該表中讀取在向后移位候選延遲之一時關于二進制序列中的相應量化值的代價并求和。通過在合適的時間間隔內比較對于不同的候選延遲的各個平均代價,可以選擇與最可能的真正延遲對應的候選延遲。在上面討論的示范性情況下,本領域技術人員因此可以向共生(1,0)分配代價-1并向另外三個分配代價0。在不同的具體實施例中,從信號中估計的量可以是瞬時值或在有限長度的時間片段內的平均值。適當?shù)?,長度在50和1000毫秒之間。在一些實施例中,兩個或多個這樣的時間片段可以重疊。在適合具體操作情況的實施例中,本領域技術人員優(yōu)選使用易于估計并且引出已經(jīng)具有少量測量的延遲的區(qū)別指示的量。除了如前提到的信號能量之外,各種實施例可以使用·編碼的音頻或視頻格式中的分量,諸如MPEG格式,·預定頻帶中的信號的功率,·信號的絕對值, 信號的幅度,·時域信號包絡的幅度,·信號的絕對值隨時間的積分,或·信號的時間導數(shù)的絕對值隨時間的積分。對于上述量中的每一個,非零代價將與四個可能的共生(見公式(1))中的一個或多個有關,以使得分配的代價反映信號的測量的兩個并行序列的同步程度。代價分數(shù)可以具有相當簡單的結構,用正的常數(shù)處罰最小可能的共生,如上所述,或者可以是與期望的概率大致對應的負值(即,反代價或品質因數(shù))。不論哪一種情況,具有最大似然性的候選延遲將與最小的(帶符號的)代價平均值有關。根據(jù)具體實施例,從信號中可以估計多于一個的量。由于更多的信息因而可用于給定數(shù)目的時刻,因此將以增大瞬時計算負載為代價更快地獲得最有可能的候選延遲的指
7J\ ο在一個實施例中,關于多個頻帶中的窗口信號片段(windowed signal segment) 的信號功率被用作量。然后有益的是在估計信號功率之前將信號通過濾波器組。濾波器可以是數(shù)字的,優(yōu)選地應用一些傅里葉變換方法,或者可以是模擬的。作為頻帶的函數(shù)的窗口信號片段的信號功率被稱為周期圖。如果然后將周期圖中的每個分量與閾值比較,則獲得具有和周期圖一樣多的分量的二進制矢量。這意味著,如果使用32個波段,則表示信號的短時功率譜的每個周期圖可以被存儲在單個32位整數(shù)中,因此存儲要求是可忽略的。根據(jù)另一個實施例,除兩個步長外,可以以更多的步長來量化該量的值,因此獲得多位量化的值。如果例如將值與三個不同的閾值相比較,則每個值可以位于四個間隔之一中,四個間隔的端點對應于閾值。如所公知的,四個間隔中包含所述值的那個間隔可以由它的序號的兩位二進制表示來表征。用于參考值的閾值的數(shù)目可以不同于用于接收值的數(shù)目。盡管可用的計算機一般以二進制形式存儲信息,但是本發(fā)明的實施例可以同樣包括不是2的冪的量化電平數(shù)。雖然優(yōu)選地閾值的數(shù)目較小,但是一些應用可能使用在參考點處或接收點處或這二者處增大數(shù)目的閾值是有益的。
根據(jù)本發(fā)明的第二方面,提供一種如在所附權利要求7中限定的延遲估計設備。在一個實施例中,延遲估計設備包括至少一個閾值電路,用于量化至少一個量的測量值,其中閾值的值是可變的并且由指定電路提供。在延遲估計設備的另一個實施例中, 閾值電路被適配為相對于用于每一個量的多于一個閾值來量化該量或多個量(在參考點、 接收點或二者處測量的)的值。在延遲估計設備的進一步的實施例中,參考點和接收點中的至少一個位于通信網(wǎng)絡中。在其他的實施例中,類似于根據(jù)本發(fā)明的第一方面的方法,延遲估計設備可以被適配為測量作為瞬時值的至少一個量或作為在有限時間間隔內的時間平均值的至少一個量。這樣的時間間隔可以或可以不在時間上重疊。根據(jù)本發(fā)明的第三方面,根據(jù)本發(fā)明的延遲估計設備可以是由權利要求15限定的回波消除電路中的一個組件。該回波消除電路可以例如包含前饋自適應濾波器,其數(shù)量特征是作為由根據(jù)本發(fā)明的設備估計的延遲的函數(shù)的變量。當考慮以下詳細公開、附圖和所附權利要求書時,本發(fā)明的進一步的目的、特性和優(yōu)點將變得清楚。本領域技術人員將認識到,本發(fā)明的不同的特征可以被組合以產(chǎn)生除了描述的實施例之外的其他實施例。
通過以下詳細描述和附圖,本發(fā)明的上述以及附加的目的、特性和優(yōu)點將得到更好的理解,其中圖1示出了可以應用本發(fā)明的說明性的情況;圖2示出了根據(jù)本發(fā)明的實施例的用于延遲估計的設備;圖3示出了根據(jù)本發(fā)明的實施例的用于預處理信號數(shù)據(jù)的裝置;圖4是根據(jù)本發(fā)明的實施例的用于估計信號的延遲的方法的流程圖;和圖5示出了用于評定量化值的同時性的算法。所有圖是示意性的并且一般僅僅示出為了說明本發(fā)明必要的部分,其中其他部分可以被省略或僅僅暗示。
具體實施例方式圖1示出了通常存在于諸如經(jīng)由IP的語音揚聲器電話的計算機的非手持式通信設備或非手持式電話之類中的聲反饋環(huán)路。要被解決的技術問題可以由涉及一個近端方和一個遠端方的電話呼叫的情況示范。輸入信號500是近端方說的語音信號。它以數(shù)字格式到達遠端,并且可以以壓縮比特流的形式。解碼器211包含將信號轉換成連續(xù)時間模擬信號的數(shù)模轉換器。如果信號是壓縮的,則解碼器211也使用解碼算法來解壓縮信號。模擬信號501被發(fā)送給一個或多個揚聲器212,其產(chǎn)生服從房間傳遞函數(shù)213的聲學信號502。 麥克風214獲得修改的聲學信號503。麥克風214可以另外具有由遠端方說的輸入504和其他遠端產(chǎn)生的聲學信號。形成麥克風的輸出的模擬信號505被發(fā)送給編碼器215,其或者執(zhí)行模數(shù)轉換或者執(zhí)行模數(shù)轉換以及之后通過任何合適的算法進行壓縮。結果得到的比特流510被發(fā)送到近端方。本領域技術人員將清楚,甚至當信號504不是有效的(為零)時,信號510的幅度和光譜色一般也與信號500顯著不同,并且被延遲。在沒有合適的補償?shù)那闆r下,近端方將接收由他或她自己說的語音信號的延遲和失真的副本。近端方聽見的此回波使得談話困難。為了消除該問題,使用回波消除和/或抑制。如果信號510相對于信號500的延遲是已知的話,則執(zhí)行回波消除和抑制的計算工作量顯著減少。本發(fā)明適合于僅僅使用信號500 和510作為估計過程的輸入來估計從近端發(fā)送的信號500和在近端處接收的信號510之間的延遲?;夭ㄏ鸵种剖潜景l(fā)明的重要應用。 在顯示適于執(zhí)行本發(fā)明方法的設備之前,將就接收和處理的信息方面描述基礎的方法。在說明性的示例中,用于估計信號之間的延遲的量將是不同頻帶中的信號功率。更精確地,在參考點處的信號510的測量和在接收點處的信號500的測量被分別建模為連續(xù)時
間的函數(shù)χ (t)、y (t)。為了處理的目的,該方法將考慮時間間隔:
(,P = I'
P和頻帶(這些可以對應于傅里葉變換濾波器的頻率窗口(bin)) Fg=(/^,fqm),q
1,
,Q。通過傳統(tǒng)的模擬濾波或數(shù)字處理,對于每一個信號和每個時間間隔計算周期圖,
在時間間隔Td中,x(t)的周期圖是非負的實數(shù)矢量ξ。= (ξ u,ξ 其中w(t)是窗,其有利地可以被選擇為漢寧(Harm)窗。對于離散時間處理,用求和來代替時間積分,并且不使用頻率上的積分;然后q簡單地為頻率窗口編索引。類似地, y(t)的周期圖是 np= (H1,p, n2,p,...,nQ,p),其中 為了后面方便,定義術語“信道”,以意指矢量ξα= (ξα,ι; ξ,,2, ..., ξα,Ρ)和它
在接收點處的信號的對應矢量。 固定閾值1, ,...,ξ”其每個表示信號功率的最低有效電平,每個周期圖被量化為二進制 Q 矢量 Xd = (X1id,X2jd, ... , & J,其中 類似地,本領域技術人員可以固定對于其他信號的閾值以獲得 閾值也可以是平均信道值、中間信道值或信道的任何其他分位值(quantile value)。緩沖器將這些二進制矢量收集到有限序列中,換言之是二進制矩陣
x^(xlf...,xK+DJmY = (Y1,..., γκ);不久將定義用在索引中的常數(shù)。如上面建立的,現(xiàn)在根據(jù)四個可能的共生的每一個的期望概率來分配它們的代價,該期望概率由經(jīng)驗學習是先驗已知的或者是可以利用足夠的精度估計的。對于如上所述的示范性情況,可以將代價選擇為表1的第四列中每個,這將在下面進一步討論。注意, 周期圖值Xtbl^PYtiv —般表示不同的時間間隔。此外,注意可以定義概率分布的工作并不是實施例所必需的。該方法的強項在于它甚至在測量的統(tǒng)計量是時變時也可以工作。表 權利要求
1.一種用于估計參考點和接收點之間的信號的延遲的方法,包括步驟 定義所述信號的至少一個量;對于每一個量,執(zhí)行下述步驟在多個時刻估計在該參考點(510)和在該接收點處的該量,從而分別輸出參考點值和接收點值;通過比較所述參考點值的每一個與第一時不變閾值來量化所述參考點值,以及通過比較所述接收點值的每一個與第二時不變閾值來量化所述接收點值,從而分別輸出量化的參考點值和量化的接收點值(514、515);存儲最新的量化的參考點值和最新的接收點值(516、517);向所有可能的量化值對的每一個分配代價,每個對由量化的參考點值以及之后的量化的接收點值構成,所述代價基于在正確地估計延遲時所述對的值的同時事件的期望概率; 以及對于來自于候選延遲的集合的每一個候選延遲,每個候選延遲被表示為連續(xù)的時刻之間的時間距離的倍數(shù),通過將多個所存儲的量化值對的代價求平均來計算平均代價,每對由存儲的在第一時刻估計的量化的參考點值以及之后的存儲的在第二時刻估計的量化的接收點值構成,其中第一時刻和第二時刻時移了該候選延遲;以及基于計算的平均代價從候選延遲的集合中選擇估計的延遲(518)。
2.根據(jù)權利要求1所述的方法,其中,對于特定的量,將第一恒定代價分配給高量化的參考點值和低量化的接收點值的同時事件,并且將第二代價分配給所有其他的事件,其中第一代價大于第二代價。
3.根據(jù)權利要求2所述的方法,其中,所述特定的量是預定頻帶中的信號功率。
4.根據(jù)前述權利要求中任何一個所述的方法,其中,從包括下述的組中選擇至少一個量編碼的音頻或視頻格式的分量, 預定頻帶中的信號的功率, 信號的絕對值, 信號的幅度,信號包絡的幅度,信號的絕對值隨時間的積分,和信號的時間導數(shù)的絕對值隨時間的積分。
5.根據(jù)前述權利要求中任何一個所述的方法,其中,所述量化的步驟還包括將所述至少一個量的值與至少一個另外的時不變閾值相比較,從而輸出多位量化值。
6.根據(jù)權利要求5所述的方法,其中,另外的時不變閾值的數(shù)目最多為20。
7.一種用于估計參考點(510)和接收點(500)之間的信號的延遲的設備,包括 第一和第二預處理器(1110、1111),用于在多個時刻估計來自該參考點(510)和該接收點(500)處的信號的至少一個量,以分別輸出參考點值(512)和接收點值(513);第一和第二閾值電路(1130、1131),用于相對于第一閾值量化所述參考點值以及相對于第二閾值量化所述接收點值,其值分別從所述第一和第二預處理器(1110、1111)接收到;第一和第二移位寄存器(1150、1151),用于存儲最新的量化的參考點值和最新的量化的接收點值(514、515),其量化值分別從所述第一和第二閾值電路(1130、1131)接收到;和延遲評定電路(118),用于從所述第一和第二移位寄存器(1150、1151)接收存儲的量化值(516、517),其中預定代價與所有可能的量化值對的每一個有關,每個對由量化的參考點值以及之后的量化的接收點值構成,所述代價基于在正確地估計延遲時所述對的值的同時事件的期望概率,以及所述電路(118)被配置為對于候選延遲的集合中的每一個候選延遲,每個候選延遲被表示為連續(xù)的時刻之間的時間距離的倍數(shù),通過將多個對存儲的量化值的代價求平均來計算平均代價,每對由存儲的在第一時刻估計的量化的參考點值以及存儲的在第二時刻估計的量化的接收點值構成, 其中第一時刻和第二時刻時移了該候選延遲;以及基于計算的平均代價從候選延遲的集合中選擇估計的延遲(518)。
8.根據(jù)權利要求7所述的設備,還包括指定電路(112),用于分別為所述第一和第二閾值電路(1130、1131)提供所述第一和第二閾值。
9.根據(jù)權利要求7或8所述的設備,其中,所述第一和第二閾值電路的每一個被適配為分別相對于至少一個另外的第一閾值以及相對于至少一個另外的第二閾值來量化所述至少一個量的值(512、513)。
10.根據(jù)權利要求7至9中的任何一個所述的設備,其中,該參考點(500)和接收點 (510)位于通信系統(tǒng)中。
11.根據(jù)權利要求7至10中的任何一個所述的設備,其中,所述至少一個量是瞬時值。
12.根據(jù)權利要求7至10中的任何一個所述的設備,其中,對于每一個時刻,在有限時間間隔內將所述至少一個量求平均。
13.根據(jù)權利要求12所述的設備,其中,所述間隔中的兩個在時間上重疊。
14.根據(jù)權利要求12或13所述的設備,其中,所述間隔的長度在50毫秒和1000毫秒之間。
15.一種包括根據(jù)權利要求7至14中的任何一個所述的設備的回波消除電路。
全文摘要
本發(fā)明提供一種用于找到在兩個點之間行進的信號的延遲的估計的方法和裝置。在參考點和接收點二者處在最終數(shù)目的時刻由該信號估計一個量。通過與適合于該量的典型大小的閾值相比較來量化該值。如果來自于接收點的量化值相對于來自于參考點的量化值向后移位了真實的延遲,則量化值的某些共生具有非常低的概率。因此,最佳延遲估計是輸出最小數(shù)目的低概率共生的那個移位。
文檔編號H04M9/08GK102318328SQ200980156611
公開日2012年1月11日 申請日期2009年10月20日 優(yōu)先權日2008年12月12日
發(fā)明者W.B.克雷恩 申請人:谷歌股份有限公司