国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      用于信號內(nèi)容檢測的概率網(wǎng)絡(luò)的制作方法

      文檔序號:2819406閱讀:353來源:國知局
      專利名稱:用于信號內(nèi)容檢測的概率網(wǎng)絡(luò)的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明一般地涉及概率網(wǎng)絡(luò),更特別地涉及實(shí)現(xiàn)檢測信號內(nèi)容的概率網(wǎng)絡(luò)。
      背景技術(shù)
      承載了內(nèi)容的模擬信號和數(shù)字位流信號可以使用電流、電磁輻射(無線電波和光波)、聲波以及其他的傳輸和存儲裝置作為內(nèi)容載體,所述內(nèi)容例如聲音、圖像和傳真圖案。例如,當(dāng)發(fā)送者的話音信號通過電話線、光纖電纜、蜂窩電話傳輸天線以及揚(yáng)聲器傳播時(shí),電話系統(tǒng)可在單個(gè)連接中使用多種載體。無論載體是什么,信號的特定間隔可以表示內(nèi)容,而信號的其他間隔或特征僅表示有載體存在,而不包括或疊加有任何內(nèi)容。有時(shí),將信號包含內(nèi)容的部分與信號不包含內(nèi)容的部分分隔是有好處的。
      話音活動(dòng)檢測(VAD)和數(shù)據(jù)壓縮是依賴于將信號內(nèi)容部分與非內(nèi)容部分分隔的技術(shù)的例子。根據(jù)存在話音活動(dòng)或語音流的方向,揚(yáng)聲器電話或蜂窩電話系統(tǒng)使用VAD來切換信號傳輸?shù)倪M(jìn)行和中斷。在用于口述和轉(zhuǎn)錄的麥克風(fēng)及數(shù)字錄音機(jī)中,在噪聲抑制系統(tǒng)中以及在語音合成器、語音激活應(yīng)用和語音識別產(chǎn)品中,也可以使用VAD。通過防止記錄和傳輸那些不包含話音活動(dòng)的不需要的信號或數(shù)字位流,VAD被使用來節(jié)省數(shù)據(jù)存儲空間和傳輸帶寬。
      VAD通常依賴于對信號的一個(gè)或多個(gè)屬性的測量來估計(jì)在信號的間隔中何時(shí)有話音活動(dòng)。例如,能級是這樣的信號屬性,其可以使用信號的電壓電平的均方根來測量,以估計(jì)信號的哪個(gè)間隔包含話音活動(dòng)。同樣的能級測量可以被用在估計(jì)存在話音活動(dòng)的不同方法中。例如,授予Cason的美國專利No.6,249,757指出了一種VAD系統(tǒng),其使用兩個(gè)信號濾波器來提供通信信號中的總能量和噪聲基底之間的差值。將該信號被劃分為若干個(gè)幀以用于譜分析。如果總能量和噪聲基底之間的差值超過閾值,那么就檢測到話音活動(dòng)。授予Mekuria的美國專利No.6,023,674指出了一種周期檢測器,其從信號提取聲調(diào)(pitch)頻率并且使用非線性信號處理塊來確定語音音軌。
      有很多種方法使用能量測量和/或其他信號屬性來估計(jì)信號中存在有話音活動(dòng)。能級估計(jì)、過零(zero-crossing)估計(jì)以及回波消除是公知的估計(jì)或幫助估計(jì)信號中存在話音活動(dòng)的方法。音調(diào)檢測機(jī)制(tone detectionmechanism,DTMF)的音調(diào)分析,通過排除產(chǎn)生錯(cuò)誤的VAD檢測的DTMF音調(diào),可以用來幫助估計(jì)存在話音活動(dòng)。信號斜率分析、信號平均方差分析、相關(guān)系數(shù)分析、純譜分析和其他方法可以被用來估計(jì)話音活動(dòng)。對于檢測話音活動(dòng),每種VAD方法都有不足,這取決于實(shí)現(xiàn)這種方法的應(yīng)用和被處理的信號。
      數(shù)據(jù)壓縮是另一種依賴于信號內(nèi)容檢測的技術(shù)。數(shù)據(jù)壓縮正日益被使用來減少存儲或傳輸數(shù)字?jǐn)?shù)據(jù)所需的位數(shù)。例如,用于圖像或電影數(shù)字表示的JPEG和MPEG標(biāo)準(zhǔn),允許多種數(shù)據(jù)壓縮方案使用緊湊標(biāo)記來表示圖片空的或重復(fù)的部分。這通常節(jié)省非壓縮圖像所需存儲空間和傳輸帶寬的很大一部分。
      雖然使用VAD檢測載波信號中話音活動(dòng)的間隔,以及為數(shù)據(jù)壓縮而檢測信號的可壓縮部分是使用信號內(nèi)容檢測的應(yīng)用的兩個(gè)例子,后者比如靜音壓縮記錄(Silence Compression Record),但是還有許多其他可以使用本發(fā)明的應(yīng)用,例如,分辨隨機(jī)無線電波中的通信模式,搜索隨機(jī)數(shù)據(jù)的模式以及計(jì)算設(shè)備間的通信同步。


      圖1是包含內(nèi)容間隔的模擬信號的圖形化表示;圖2是包含內(nèi)容間隔的數(shù)字位流的圖形化表示;圖3是適于本發(fā)明使用的計(jì)算設(shè)備的框圖;圖4是信念網(wǎng)絡(luò)的圖形化表示;圖5是圖4的信念網(wǎng)絡(luò)的圖形化表示,其中從網(wǎng)絡(luò)中去掉了一些變量并添加了一個(gè)變量;圖6是本發(fā)明一個(gè)裝置實(shí)施例的框圖;圖7是本發(fā)明一個(gè)組合器實(shí)施例的框圖;圖8是本發(fā)明的話音活動(dòng)檢測裝置的框圖;圖9是本發(fā)明第一方法實(shí)施例的流程圖;圖10是本發(fā)明第二方法實(shí)施例的流程圖;圖11是本發(fā)明第三方法實(shí)施例的流程圖;圖12是一種機(jī)器可讀介質(zhì)的圖形化表示,其具有的指令用于執(zhí)行本發(fā)明的一個(gè)或多個(gè)方法和/或裝置。
      具體實(shí)施例方式
      在這里說明了一種使用概率網(wǎng)絡(luò)對信號內(nèi)容的間隔進(jìn)行檢測的方法和裝置,該概率網(wǎng)絡(luò)可以在運(yùn)行時(shí)進(jìn)行配置。
      根據(jù)本發(fā)明的一個(gè)方面,概率網(wǎng)絡(luò)包括貝葉斯信念網(wǎng)絡(luò)(Bayes beliefnetwork)。貝氏網(wǎng)絡(luò)表示一個(gè)系統(tǒng)子部分狀態(tài)之間的概率關(guān)系。狀態(tài)能夠進(jìn)行變化,所以被稱為節(jié)點(diǎn)或變量。信念網(wǎng)絡(luò)可以圖像化為有向無環(huán)圖(acyclic directed graph),其中變量是圖形中的節(jié)點(diǎn),這些節(jié)點(diǎn)由代表各變量間關(guān)系的直線或弧線連接。與信念網(wǎng)絡(luò)中每個(gè)變量相關(guān)的是概率分布的集合。使用條件概率符號,變量“x”的概率分布的集合,可以用p(x|n)表示,其中“p”表示概率分布,“n”表示變量“x”的一個(gè)或多個(gè)直接前趨(predecessor)或“雙親”(parent)。雙親是與變量“x”相連接、并且對x的概率狀態(tài)施加影響的任何其他變量。如下讀出表達(dá)式p(x|n)“給定x的直接前趨n時(shí),變量x的概率分布?!备怕史植济鞔_了變量間關(guān)系的強(qiáng)度。例如,如果n是x的雙親,并且n有兩個(gè)狀態(tài)(例如,“true(真)”和“false(假)”),那么與n相關(guān)的是單一概率分布p(n|φ),與x相關(guān)的是兩個(gè)概率分布p(x|nTRUE)和p(x|nFALSE)。概率分布可以是在前或在后的。在前的概率分布指在新數(shù)據(jù)被輸入到網(wǎng)絡(luò)中之前的概率分布,而在后的概率分布指在新數(shù)據(jù)被輸入到網(wǎng)絡(luò)之后的概率分布。
      在比如用于VAD和數(shù)據(jù)壓縮的方法和裝置的應(yīng)用中,可以實(shí)現(xiàn)決策理論和概率推理??梢圆捎酶怕守惾~斯信念網(wǎng)絡(luò)(“網(wǎng)絡(luò)”)的變體作為決定工具。給定網(wǎng)絡(luò)中其他相關(guān)變量的數(shù)據(jù),網(wǎng)絡(luò)能夠?yàn)橛?jì)算該網(wǎng)絡(luò)中的變量集合的概率分布提供直觀的推理。在具有多個(gè)部分(步驟、狀態(tài)和/或模塊)的實(shí)際方法或設(shè)備中,可以采用網(wǎng)絡(luò)來描述若干部分之間的概率關(guān)系,并對來自其他部分的行為、狀態(tài)和/或輸入使用概率推理而對一個(gè)或多個(gè)部分做出決定。
      本發(fā)明使用概率網(wǎng)絡(luò)來檢測、決定和/或估計(jì)(“檢測”)在至少部分信號中是否存在內(nèi)容。內(nèi)容是任何被信號或載體(“信號”)的間隔、屬性和/或特征(總稱為“部分”)承載、包括或疊加的數(shù)據(jù)、樣式、主觀上有意義的信號屬性和/或主觀上有意義的信號特征。
      在概率網(wǎng)絡(luò)中可以組合進(jìn)多種用于檢測信號內(nèi)容的方法和/或模塊(“估計(jì)器”)。即使在運(yùn)行時(shí),也能對網(wǎng)絡(luò)進(jìn)行調(diào)整,以使估計(jì)器啟動(dòng)和/或禁止。于是,通過僅啟動(dòng)一定數(shù)量的估計(jì)器并在概率上對它們進(jìn)行組合,來比任何單個(gè)估計(jì)器或固定的一組估計(jì)器更加精確地檢測內(nèi)容的存在,該網(wǎng)絡(luò)可以被用于改善內(nèi)容檢測技術(shù),比如VAD和數(shù)據(jù)壓縮?;蛘?,通過啟動(dòng)所有估計(jì)器,但是僅從估計(jì)器選擇一些概率值用在網(wǎng)絡(luò)中,而丟棄其他的概率值,本發(fā)明也可以改善內(nèi)容檢測。本發(fā)明的網(wǎng)絡(luò)可以通過啟動(dòng)一些估計(jì)器并禁止其他的估計(jì)器,而在運(yùn)行時(shí)手動(dòng)地配置、或自動(dòng)地使自己符合系統(tǒng)和/或信號條件。
      除了在運(yùn)行時(shí)使一定數(shù)目的估計(jì)器容易被啟動(dòng)或禁止以符合系統(tǒng)和/或信號的特征外,該網(wǎng)絡(luò)還允許向網(wǎng)絡(luò)增加任意數(shù)目的新估計(jì)器。例如,新估計(jì)器可以包括進(jìn)行內(nèi)容檢測的硬件插入模塊、軟件模塊和/或算法。被添加到網(wǎng)絡(luò)中的新估計(jì)器可以是對公知的內(nèi)容檢測模塊的改進(jìn)版本,或可以是還未發(fā)明的內(nèi)容檢測方法和模塊。
      只要是每個(gè)估計(jì)器能夠?qū)π盘栔械膬?nèi)容存在進(jìn)行估計(jì)并能夠?qū)⒐烙?jì)結(jié)果傳遞到網(wǎng)絡(luò),具有眾多物理和功能特征的估計(jì)器都可以被本發(fā)明的網(wǎng)絡(luò)所使用。一般,估計(jì)結(jié)果可以是概率值。一些估計(jì)器可以如同切換開關(guān)一樣來工作,該切換開關(guān)具有對應(yīng)于信號中存在內(nèi)容的概率為100%的“開”狀態(tài),和對應(yīng)于概率為0%的“關(guān)”狀態(tài)。應(yīng)該注意的是,概率通常被表述為整數(shù)0和1之間的值,其中0等于概率為0%,1等于概率為100%。如果事件的概率為p,那么反概率即不發(fā)生該事件的概率表述為(1-p)。例如,發(fā)生的概率值為0.6(60%)的事件的反概率值(不發(fā)生的概率)為0.4(40%)。
      在使用有效的概率推理來組合來自所有被啟動(dòng)的估計(jì)器的初始概率估計(jì)結(jié)果時(shí),本發(fā)明對信號中是否存在內(nèi)容做出決定,這通常比僅僅對初始概率估計(jì)結(jié)果進(jìn)行平均要更復(fù)雜。該網(wǎng)絡(luò)可以考慮一個(gè)或多個(gè)正被處理的信號的部分表示了內(nèi)容的在前的概率。
      已經(jīng)使用C計(jì)算機(jī)編程語言的各個(gè)版本和Matlab,在自動(dòng)語音識別和靜音壓縮記錄應(yīng)用的框架內(nèi)采用了本發(fā)明,Matlab是一種計(jì)算機(jī)編程環(huán)境語言。本發(fā)明也已經(jīng)在56300 Motorola DSP芯片上實(shí)現(xiàn)。
      圖1示出了承載了內(nèi)容的無線信號的例子。調(diào)幅(AM)無線電波在載波的幅度變化中承載了比如話音活動(dòng)的內(nèi)容100。內(nèi)容間隔100可以由沒有內(nèi)容的間隔102分隔開。調(diào)頻(FM)無線電波在載波的頻率變化中承載了比如話音活動(dòng)的內(nèi)容104。內(nèi)容間隔104可以由沒有內(nèi)容的間隔106分隔開。
      圖2示出了數(shù)字位流,其中內(nèi)容200由高、低位的有序序列表示。沒有內(nèi)容的間隔202可以散布在具有內(nèi)容的間隔200中。雖然圖1、2示出了承載內(nèi)容的信號的具體例子,但是本發(fā)明可以適用于任何承載內(nèi)容的信號。
      圖3示出了適于實(shí)現(xiàn)本發(fā)明一些實(shí)施例的計(jì)算機(jī)系統(tǒng)。計(jì)算機(jī)系統(tǒng)300包括處理器302、存儲器304和存儲裝置306。處理器302訪問存儲裝置306上的數(shù)據(jù),包括計(jì)算機(jī)程序。此外,處理器302將計(jì)算機(jī)程序轉(zhuǎn)移到存儲器304,并執(zhí)行已駐留于存儲器的程序。本領(lǐng)域的普通技術(shù)人員將意識到,適于實(shí)現(xiàn)本發(fā)明的計(jì)算機(jī)系統(tǒng)可以包括附加的或不同的部件。其他設(shè)備也可以使用本發(fā)明,包括蜂窩電話、揚(yáng)聲器電話、手持個(gè)人數(shù)字助理和自然語言處理器。
      圖4示出了以多樹(poly-tree)400表示的單一連接的貝葉斯信念網(wǎng)絡(luò),多樹400具有變量“x1”402、“x2”404、“x3”406、“xn”408和變量“x5”410。因?yàn)樽兞縳1402、x2404、x3406和xn408每一個(gè)都與公共變量x5410有單獨(dú)的鏈接,但在它們自身之間沒有多重連接,所以網(wǎng)絡(luò)被稱為單一連接的。信念網(wǎng)絡(luò)表示對于網(wǎng)絡(luò)中n個(gè)變量的全聯(lián)合概率分布(full joint probability distribution)。所以,給定其余變量的數(shù)據(jù)時(shí),該網(wǎng)絡(luò)允許獲得網(wǎng)絡(luò)中任意變量的概率。換句話說,在信念網(wǎng)絡(luò)中對任何變量的查詢都能夠從全聯(lián)合概率中計(jì)算得到。
      能夠使用等式(1)能夠計(jì)算全聯(lián)合概率分布p(x1,...,xn)=&Pi;i=1np(xi|&pi;i)--(1)]]>其中,x1...xn是n個(gè)相互獨(dú)立的變量,給定它們在信念網(wǎng)絡(luò)中對應(yīng)的在前值π1...πn;πi是xi的直接前趨(雙親)集合;如果πi不是空集,那么項(xiàng)p(xi|πi)是變量xi的條件概率,否則是xi的邊際概率。變量x5410總的概率值取決于變量x1402、x2404、x3406和xn408單獨(dú)的概率分布,這是由于在所圖示的多樹400中這些變量是變量x5410的直接前趨。當(dāng)給定每個(gè)單獨(dú)的前趨變量的概率分布時(shí),分別考慮的變量x5410單獨(dú)的概率表示為p(x5|x1)、p(x5|x2)、p(x5|x3)以及p(x5|xn)。給定所有前趨變量的聯(lián)合概率,變量x5410的概率查詢表示為p(x5|x1,x2,x3,xn)。
      圖5示出了子集信念網(wǎng)絡(luò)500新的查詢(該子集圖示為圖4的單連通貝葉斯信念網(wǎng)絡(luò)的一個(gè)多樹子集),該子集信念網(wǎng)絡(luò)具有被邊際化(被移除或禁止)的變量“x1”502、“x3”506和“xn”508,以及向查詢添加的新變量“x4”507。出于計(jì)算上僅考慮初始網(wǎng)絡(luò)的子集和/或擴(kuò)展,可以向信念網(wǎng)絡(luò)添加或從中移除變量,而不改變初始網(wǎng)絡(luò)的結(jié)構(gòu)。
      新查詢中變量的概率分布能夠通過首先計(jì)算子集網(wǎng)絡(luò)500的完全聯(lián)合概率而得到。變量x5510總的概率值現(xiàn)在取決于變量x2504和x4507的單獨(dú)的概率分布,這是由于在所圖示的多樹500中這些變量是變量x5510的直接前趨。給定從每個(gè)單獨(dú)的前趨變量得到的概率分布,變量x5510單獨(dú)的概率表示為p(x5|x2)和p(x5|x4)。給定從被啟動(dòng)的前趨變量x2和x4得到的聯(lián)合概率分布,子集信念網(wǎng)絡(luò)500中變量x5510的概率分布是p(x5|x2,x4)。
      圖6示出了本發(fā)明的一個(gè)實(shí)施例,其中,在概率網(wǎng)絡(luò)600中估計(jì)器602、604和606被耦合到組合器610。通常,能有n個(gè)估計(jì)器,每個(gè)都基于它們自己對一個(gè)或多個(gè)信號屬性的測量來估計(jì)信號內(nèi)容的概率。在該實(shí)施例中,估計(jì)器602、604和606每個(gè)都估計(jì)正被測量的信號部分表示了內(nèi)容的初始概率,并可以使用任何可以使用的方法來獲得初始概率估計(jì)結(jié)果,這包括測量至少部分信號的一個(gè)或多個(gè)屬性。雖然所圖示的實(shí)施例600有三個(gè)估計(jì)器,但是可以使用任意數(shù)目的估計(jì)器,包括一個(gè)估計(jì)器。在一個(gè)實(shí)施例中,組合器610直接將來自每個(gè)估計(jì)器的每個(gè)初始概率值組合為總的概率值。在其他實(shí)施例中,組合器610可以僅在每個(gè)初始概率值被在前概率因子加權(quán)后再對初始概率值進(jìn)行組合。在前概率因子可以是來自一個(gè)或多個(gè)估計(jì)器的在前初始概率值,或可以表示來自組合器610的在前的總概率值。
      網(wǎng)絡(luò)600所獲得的總的概率值可以與預(yù)建立的或運(yùn)行時(shí)建立的閾值進(jìn)行比較,以決定正被處理的信號部分是否代表內(nèi)容?;蛘?,總的概率值可以被用作另一個(gè)設(shè)備、過程和/或概率網(wǎng)絡(luò)的輸入。
      在一個(gè)實(shí)施例中,假定給定變量c的值時(shí)x1,...,xn是n個(gè)相互獨(dú)立的變量,使用等式(2)對圖6所示的網(wǎng)絡(luò)可以獲得信號內(nèi)容“c”總的概率值。
      p(c|x1,...,xn)=&Pi;i=1n[p(c|xi)]*(1-p(s))n-1&Pi;i=1n[p(c|xi)]*(1-p(s))n-1+&Pi;i=1n[1-p(c|xi)]*p(s)n-1---(2)]]>其中,n是被啟動(dòng)單元的數(shù)目,p(c)是在前的總概率值。換句話說,p(c)是在不知道其他信息時(shí)信號內(nèi)容的概率。如上所討論的,信號內(nèi)容總的概率p(c|x1,...,xn)可以與閾值進(jìn)行比較以決定當(dāng)前的信號間隔是否包含內(nèi)容。當(dāng)模塊被啟動(dòng)或禁止時(shí),等式(2)中n的值改變,但是該等式可以被編碼成很容易地在運(yùn)行時(shí)進(jìn)行變化。或者,等式(2)可以被編碼,以通常使用相同數(shù)目的n個(gè)模塊。在一個(gè)實(shí)施例中,使用等式(2)的組合器610可以組合僅來自被啟動(dòng)的估計(jì)器的初始概率值。因此,例如如果估計(jì)器1602被禁止或它的數(shù)據(jù)就是不可用,那么條件概率p(c|x1)能夠被設(shè)定為0.5,這自動(dòng)地禁止了估計(jì)器x1對關(guān)于內(nèi)容是否出現(xiàn)在部分信號中總的判決的貢獻(xiàn)。表示中性概率的值0.5取消了估計(jì)器在等式(2)中的貢獻(xiàn)。網(wǎng)絡(luò)可以通過僅使用來自被啟動(dòng)的估計(jì)器的數(shù)據(jù),僅使用可用的數(shù)據(jù)(由此忽視不具有可用數(shù)據(jù)的估計(jì)器)和/或主動(dòng)地啟動(dòng)和禁止多個(gè)估計(jì)器,使其自己符合特定系統(tǒng)或特定信號的特征。等式(2)允許很容易地添加新的估計(jì)器,而不改變作為基礎(chǔ)的概率網(wǎng)絡(luò)600。而且,每個(gè)估計(jì)器對信號內(nèi)容總概率的貢獻(xiàn),能夠很容易地通過設(shè)定第i個(gè)估計(jì)器的條件概率p(c|xi)的上、下限進(jìn)行控制。這是一個(gè)更通常的方法,其中只要上限等于下限且等于0.5時(shí),該估計(jì)器就被禁止,只要上限被設(shè)定為1且下限被設(shè)定為0時(shí),那么該估計(jì)器就是完全啟動(dòng)的。
      圖7示出了本發(fā)明新的組合器700的一個(gè)實(shí)施例,根據(jù)等式(2),組合器700部分地基于至少一個(gè)在前概率值,將來自估計(jì)器的初始概率值x、y和z組合為當(dāng)前的總概率值p(c|x,y,z)。在前的總概率值“P”可以被用作在前概率值。在這個(gè)實(shí)施例中,第一反轉(zhuǎn)器702將根據(jù)自估計(jì)器引導(dǎo)到組合器700的初始概率值x、y和z獲得初始反概率值(1-x)、(1-y)和(1-z)。第二反轉(zhuǎn)器704獲得在前的總概率值P的取反(1-P)。第一模塊706獲得包括初始概率值的乘積的第一量Q1。第二模塊708獲得包括將在前反概率值進(jìn)行乘方的第二量Q2,指數(shù)等于初始概率值的數(shù)目。在這個(gè)實(shí)施例中,估計(jì)器的數(shù)目減一(n-1)被用作指數(shù)。第三模塊710獲得第三量Q3,其包括初始反概率值的乘積。第四模塊712獲得包括將在前初始概率值進(jìn)行乘方的第四量Q4,指數(shù)等于初始概率值的數(shù)目。在這個(gè)實(shí)施例中,估計(jì)器的數(shù)目減一(n-1)被用作指數(shù)。第五模塊714將第一量Q1與第二量Q2相乘得到第五量Q5。第六模塊716將第一量Q3與第二量Q4相乘得到第六量Q6。第七模塊718通過將第五量Q5除以第五量Q5與第六量Q6的和,而獲得總的概率值p(c|x1...xn)。
      雖然為了便于說明,一直用術(shù)語“模塊”來描述組合器700,但一個(gè)或多個(gè)電路、元件、寄存器、處理器、軟件子程序或任何它們的組合都可以來替代一個(gè)、幾個(gè)或所有的模塊。
      圖8是出了本發(fā)明的一個(gè)實(shí)施例——VAD裝置800,其使用具有實(shí)現(xiàn)等式(2)的組合器802的概率網(wǎng)絡(luò)。該組合器接收來自三個(gè)估計(jì)器的輸入基于能量單元(E)804、過零單元(Z)806和回波消除器信息單元(I)808?;谀芰繂卧?E)804可以從輸入信號所估計(jì)的能級特征E來計(jì)算話音活動(dòng)概率值p(c|E)。過零單元(Z)806可以從輸入信號所估計(jì)的過零率Z來計(jì)算話音活動(dòng)概率值p(c|Z)?;夭ㄏ餍畔卧?I)808如果可用的話,則可以基于來自回波消除器的信息來計(jì)算話音活動(dòng)概率值p(c|I),回波消除器可以使用遠(yuǎn)端話音活動(dòng)、近端話音活動(dòng)和/或收斂來辨別駐留回波和真正的近端話音活動(dòng)間隔。
      組合器802使用等式(2)將初始概率值p(c|E)、p(c|Z)和p(c|I)組合為總的概率值p(c|E,Z,I)。根據(jù)來自單元E 804、Z 806和I808的初始概率值,實(shí)體p(c|E,Z,I)是信號內(nèi)容“c”總的條件概率。雖然在其他實(shí)施例中,組合器802在等式(2)中能夠使用在前的概率值,但是在本實(shí)施例中圖示的VAD組合器802假設(shè)了中性的在前概率,將一般的等式(2)中使用的在前概率值設(shè)定為值0.5(50%)。在一般的等式(2)中,消去中性概率,得到簡化的一般等式(3)p(c|x1,...,xn)=&Pi;i=1n[p(c|xi)]&Pi;i=1np(c|xi)+&Pi;i=1n[1-p(c|xi)]--(3)]]>當(dāng)來自單元E 804、Z 806和I808的初始概率值被插入等式(3)時(shí),總的概率值p(c|E,Z,I)由下式給出。
      p=(c|E,Z,I)=p(c|E)*p(c|Z)*p(c|I)p(c|E)*p(c|Z)*p(c|I)+(1-p(c|E))*(1-p(c|Z))*(1-p(c|I))--(4)]]>在示出的VAD裝置800的實(shí)施例中,反轉(zhuǎn)器810和第一模塊812每個(gè)都接收來自估計(jì)器E 804、Z 806和I808的初始概率估計(jì)結(jié)果。反轉(zhuǎn)器810從初始概率值獲得初始反概率值(1-p(c|E))、(1-p(c|Z))和(1-p(c|I)),并將初始反概率值傳遞到第三模塊814。然而,初始概率值是信號至少部分代表內(nèi)容的概率,初始反概率值是沒有部分信號代表內(nèi)容的概率。每個(gè)初始反概率值可以通過從整數(shù)1中減去每個(gè)初始概率值得到,概率值以整數(shù)0和1之間包含的值表示。
      第一模塊812通過將每個(gè)初始概率值相乘到一起而得到第一乘積Π1Π1=p(c|E)×p(c|Z)×p(c|I)。第二模塊814通過將每個(gè)初始反概率值相乘到一起而得到第二乘積Π2Π2=(1-p(c|E))×(1-p(c|Z))×(1-p(c|I))。第三模塊816通過將第一乘積Π1除以第一乘積Π1與第二乘積Π2的和,得到總的概率值p(c|E,Z,I)=Π1/(Π1+Π2)。
      由圖示的實(shí)施例進(jìn)行的話音活動(dòng)檢測例子中,基于能量單元(E)804將初始概率值p(c|E)0.6傳給組合器802,過零單元(Z)806將初始概率值p(c|Z)0.7傳給組合器802,回波消除器信息單元(I)808將初始概率值p(c|I)0.4傳給組合器802。組合器802的反轉(zhuǎn)器810得到與每個(gè)初始概率值相對應(yīng)的初始反概率值。對于基于能量單元804,初始反概率值為(1-p(c|E))=0.4;對于過零單元806,初始反概率值為(1-p(c|z))=0.3;對于回波消除器信息單元808,初始反概率值為(1-p(c|I))=0.6。第一模塊812將每個(gè)初始概率值相乘到一起而得到第一乘積Π1=p(c|E)×p(c|Z)×p(c|I)=0.6×0.7×0.4=0.168。第二模塊814將每個(gè)初始反概率值相乘到一起而得到第二乘積Π2=(1-p(c|E))×(1-p(c|Z))×(1-p(c|I))=0.4×0.3×0.6=0.072。第三模塊816將第一乘積Π1除以第一乘積Π1與第二乘積Π2的和,得到代表信號中話音活動(dòng)可能性的總概率值p(c|E,Z,I)=Π1/(Π1+Π2)=0.168/(0.168+0.072)=0.7。該總概率值可以不受限制的方式被使用來檢測話音活動(dòng)是否存在,這包括將總概率值與閾值相比較。
      在組合器802或網(wǎng)絡(luò)中可以包括優(yōu)化器818以使網(wǎng)絡(luò)符合正被處理的特定系統(tǒng)或特定信號。優(yōu)化器818是改善了信號內(nèi)容檢測的任何裝置。優(yōu)化器818可以過濾來自估計(jì)器的概率值、或啟動(dòng)和/或禁止估計(jì)器以對內(nèi)容檢測進(jìn)行優(yōu)化。例如,優(yōu)化器818可以通過拋棄偏離所有初始概率值的平均太多的異常初始概率值,而發(fā)揮作用。在其他變體中,優(yōu)化器818可以自己測量正被估計(jì)器處理的同一信號的一個(gè)或多個(gè)屬性,并且基于對輸入的比較進(jìn)行優(yōu)化。在另外的變體中,優(yōu)化器818可以與利用總概率值的實(shí)體相鏈接,并基于最終結(jié)果對內(nèi)容檢測進(jìn)行優(yōu)化。例如,優(yōu)化器818可以通過試錯(cuò)地啟動(dòng)或禁止估計(jì)器,尋找沒有話音剪裁(voice clipping)和其他錯(cuò)誤的“干凈”VAD結(jié)果。取決于所圖示的3個(gè)話音活動(dòng)估計(jì)器804、806和808在運(yùn)行時(shí)的可用性、計(jì)算資源以及在其中使用VAD的框架,優(yōu)化器818可以啟動(dòng)或限制一些或所有的估計(jì)器。由于估計(jì)器被組合到一個(gè)網(wǎng)絡(luò)中,該網(wǎng)絡(luò)能夠在運(yùn)行時(shí)被調(diào)整和優(yōu)化來啟動(dòng)或禁止話音活動(dòng)估計(jì)器而不用重構(gòu)網(wǎng)絡(luò),所以其他的估計(jì)器也可以由優(yōu)化器添加,并在運(yùn)行時(shí)被配置。本發(fā)明的概率網(wǎng)絡(luò)使圖示的VAD裝置800更加容忍話音活動(dòng)估計(jì)器的初始概率值估計(jì)結(jié)果中的噪聲。
      盡管為了便于說明,一直用術(shù)語“模塊”來描述組合器802,但是一個(gè)或多個(gè)電路、元件、寄存器、處理器、軟件子程序或它們的任何組合都能夠替代一個(gè)、幾個(gè)或所有模塊。
      圖9示出了本發(fā)明的第一方法實(shí)施例。估計(jì)初始概率值902,其代表至少部分信號表示了內(nèi)容的概率,并使用概率網(wǎng)絡(luò)將初始概率值組合為總的概率值904,其代表至少部分信號表示了內(nèi)容的總概率。在一些實(shí)施例中,信號內(nèi)容可以是音調(diào)或話音活動(dòng),比如語音、近端語音和遠(yuǎn)端語音。如所討論的那樣,內(nèi)容也可以是圖片、傳真和任何其他重要的數(shù)據(jù)、信號屬性或信號特征??梢酝ㄟ^測量信號屬性或通過比如使用估值設(shè)備的任何其他方式,可以獲得對初始概率值的估計(jì)。可以使用多個(gè)估計(jì)器來進(jìn)行估計(jì),其中一些可以被啟動(dòng),而另一些被禁止。在一個(gè)實(shí)施例中,只有來自被啟動(dòng)的估計(jì)器的初始概率值被組合到總概率值中。通過僅組合一些初始概率值或通過啟動(dòng)和/或禁止估計(jì)器對信號內(nèi)容檢測進(jìn)行優(yōu)化906可以被包括在方法中。
      圖10示出了本發(fā)明使用概率網(wǎng)絡(luò)方法的第二方法實(shí)施例。概率網(wǎng)絡(luò)可以使用概率比率。獲得初始概率值1002,每個(gè)值代表至少部分信號表示了內(nèi)容的概率。從每個(gè)對應(yīng)的初始概率值獲得反概率值1004。每個(gè)初始反概率值是所有信號部分都未表示內(nèi)容的概率。通過將所有的初始概率值相乘到一起而獲得第一乘積Π11006。通過將每個(gè)初始反概率值相乘到一起而得到第二乘積Π21008。通過將第一乘積Π1除以第一乘積Π1與第二乘積Π2的和,得到總的概率值1010。通過僅使用一些初始概率值或通過啟動(dòng)和/或禁止估計(jì)器對內(nèi)容檢測進(jìn)行優(yōu)化1012可以被包括在方法中。
      圖11示出了本發(fā)明使用包括至少一個(gè)在前概率的概率網(wǎng)絡(luò)方法的第三方法實(shí)施例。獲得初始概率值的量“n”1102,還獲得初始反概率值1104。每個(gè)概率值是至少部分信號表示了內(nèi)容的概率,而每個(gè)反概率值包括所有信號部分都未表示內(nèi)容的概率。獲得在前概率值1106,還獲得或計(jì)算在前概率值的取反1108。將初始概率值相乘到一起而獲得第一量1110。將在前反概率值進(jìn)行乘方來產(chǎn)生第二量1112,指數(shù)包括初始概率值的數(shù)目,比如為初始概率值的數(shù)目n減去1(n-1)。將初始反概率值相乘到一起而得到第三量1114。將在前概率值進(jìn)行乘方產(chǎn)生第四量1116,指數(shù)包括初始概率值的數(shù)目,比如為初始概率值的數(shù)目n減去1(n-1)。第一和第二量相乘得到第五量1118。第三和第四量相乘得到第六量1120。通過將第五量除以第五量與第六量的和得到當(dāng)前的總概率值1122。通過僅使用一些初始概率值或通過啟動(dòng)和/或禁止估計(jì)器對內(nèi)容檢測進(jìn)行優(yōu)化1124可以被包括在方法中。
      圖12示出了包括提供指令1204的機(jī)器可讀介質(zhì)1202的裝置,指令1204使機(jī)器對至少部分信號表示了內(nèi)容的初始概率值進(jìn)行估計(jì),并將每個(gè)初始概率值組合為總的概率值。該裝置還可以包括指令,其基于例如使用一個(gè)或多個(gè)估計(jì)器對信號屬性進(jìn)行測量,來估計(jì)初始概率值。為了使裝置符合特定系統(tǒng)或信號特征,指令可以使估計(jì)器或其他概率估計(jì)裝置啟動(dòng)或禁止。在一些實(shí)施例中,指令包括使用概率網(wǎng)絡(luò)來獲得總的概率值。概率網(wǎng)絡(luò)可以使用概率比率,其中可以包括至少一個(gè)在前概率值。指令也可以包括為每個(gè)初始概率值獲得對應(yīng)的初始反概率值的指令、通過將所有初始概率值相乘到一起而獲得第一乘積的指令、將初始反概率值相乘到一起而獲得第二乘積的指令、通過將第一乘積除以第一乘積與第二乘積的和得到總的概率值的指令。該裝置還可以包括指令,其啟動(dòng)和/或禁止估計(jì)器或其他概率估計(jì)裝置來對信號內(nèi)容檢測進(jìn)行優(yōu)化。
      這些方法以它們最基本的形式進(jìn)行說明,但是在不背離基本范圍的情形下,可以進(jìn)行添加和刪除。本領(lǐng)域普通技術(shù)人員應(yīng)該清楚的是,可以進(jìn)行許多進(jìn)一步的修改和變通。具體的實(shí)施例不是被提供來對本發(fā)明進(jìn)行限制的,而是對其進(jìn)行說明。本發(fā)明的范圍不是由以上提供的特定例子確定,而僅由權(quán)利要求確定。
      權(quán)利要求
      1.一種方法,包括估計(jì)至少部分信號表示了內(nèi)容的概率值;以及將每個(gè)概率值組合為總的概率值。
      2.如權(quán)利要求1的方法,其中,所述內(nèi)容是從以下組成的組中選出的話音活動(dòng)音調(diào)、語音、近端話音活動(dòng)和遠(yuǎn)端話音活動(dòng)。
      3.如權(quán)利要求1的方法,其中,所述內(nèi)容是用于數(shù)據(jù)壓縮的數(shù)據(jù)。
      4.如權(quán)利要求1的方法,還包括基于對至少一個(gè)信號屬性的測量,來估計(jì)概率值。
      5.如權(quán)利要求1的方法,還包括使用至少一個(gè)估計(jì)器來估計(jì)概率值。
      6.如權(quán)利要求5的方法,還包括使用多個(gè)估計(jì)器對至少一個(gè)信號屬性進(jìn)行測量,在所述多個(gè)估計(jì)器中,一些估計(jì)器被啟動(dòng)而其他的估計(jì)器被禁止。
      7.如權(quán)利要求6的方法,其中,將每個(gè)概率值組合為總的概率值包括將來自被啟動(dòng)的估計(jì)器的概率值進(jìn)行組合。
      8.如權(quán)利要求1的方法,其中,將每個(gè)概率值組合為總的概率值包括使用概率網(wǎng)絡(luò)進(jìn)行組合。
      9.如權(quán)利要求8的方法,還包括使用這樣的概率網(wǎng)絡(luò),所述概率網(wǎng)絡(luò)使用概率比率。
      10.如權(quán)利要求9的方法,其中,使用概率網(wǎng)絡(luò)包括,將至少部分信號表示了內(nèi)容的概率值的乘積,除以將至少部分信號表示了內(nèi)容的概率值的乘積加上所有信號部分都未表示內(nèi)容的概率值的乘積的和。
      11.如權(quán)利要求9的方法,還包括為每個(gè)概率值獲得對應(yīng)的反概率值;通過將所有概率值相乘到一起而獲得第一乘積;通過將所有反概率值相乘到一起而獲得第二乘積;以及通過將所述第一乘積除以所述第一乘積與所述第二乘積的和而獲得總的概率值。
      12.如權(quán)利要求11的方法,其中,每個(gè)概率值是至少部分信號表示了內(nèi)容的概率,每個(gè)反概率值是所有信號部分都未表示內(nèi)容的概率。
      13.如權(quán)利要求11的方法,其中,每個(gè)反概率值是通過從值1中減去每個(gè)概率值而獲得,所述每個(gè)概率值以0到1之間所包括的值表示。
      14.如權(quán)利要求1的方法,所述將每個(gè)概率值組合為總的概率值還包括至少部分基于至少一個(gè)在前概率值進(jìn)行組合。
      15.如權(quán)利要求14的方法,所述組合還包括至少部分基于在前的總概率值進(jìn)行組合。
      16.如權(quán)利要求15的方法,還包括使用中性的在前總概率值來獲得總的概率值。
      17.如權(quán)利要求14的方法,還包括使用概率網(wǎng)絡(luò)。
      18.如權(quán)利要求14的方法,還包括使用這樣的概率網(wǎng)絡(luò),所述概率網(wǎng)絡(luò)使用概率比率。
      19.如權(quán)利要求18的方法,其中使用概率網(wǎng)絡(luò)包括,將由在前概率因子加權(quán)的概率值的乘積,除以由在前概率因子加權(quán)的概率值的乘積與由在前概率因子加權(quán)的反概率值的乘積的和。
      20.如權(quán)利要求18的方法,還包括估計(jì)初始概率值;獲得初始反概率值;獲得在前的總反概率值;獲得包括初始概率值的乘積的第一量;獲得包括將在前的總反概率值進(jìn)行乘方的第二量;獲得包括所有初始反概率值的乘積的第三量;獲得包括將在前的總概率值進(jìn)行乘方的第四量;將所述第一量與所述第二量相乘獲得第五量;將所述第三量與所述第四量相乘獲得第六量;以及通過將所述第五量除以所述第五量與所述第六量的和而獲得當(dāng)前的總概率值。
      21.如權(quán)利要求20的方法,其中,每個(gè)概率值是至少部分信號表示了內(nèi)容的概率,每個(gè)反概率值包括所有信號部分都未表示內(nèi)容的概率。
      22.如權(quán)利要求20的方法,其中,每個(gè)反概率值是通過從值1中減去對應(yīng)的概率值而獲得,所述概率值以0到1之間所包括的值表示。
      23.如權(quán)利要求1的方法,還包括通過使用概率網(wǎng)絡(luò)來組合概率值而對內(nèi)容檢測進(jìn)行優(yōu)化,所述概率網(wǎng)絡(luò)選擇要組合的概率值。
      24.如權(quán)利要求23的方法,還包括拋棄偏離所有概率值的平均值的概率值。
      25.如權(quán)利要求1的方法,還包括使用估計(jì)器來估計(jì)至少部分信號表示了內(nèi)容的概率值,并且啟動(dòng)和/或禁止一些估計(jì)器以對內(nèi)容檢測進(jìn)行優(yōu)化。
      26.如權(quán)利要求25的方法,還包括基于信號類型來啟動(dòng)和/或禁止一個(gè)或多個(gè)估計(jì)器。
      27.如權(quán)利要求25的方法,還包括基于是否存在至少一個(gè)信號特征來啟動(dòng)和/或禁止一個(gè)或多個(gè)估計(jì)器。
      28.一種裝置,包括至少一個(gè)估計(jì)器,估計(jì)至少部分信號表示了內(nèi)容的初始概率值;以及組合器,將每個(gè)初始概率值組合為總的概率值。
      29.如權(quán)利要求28的裝置,其中,所述內(nèi)容是從以下組成的組中選出的話音活動(dòng)音調(diào)、語音、近端語音和遠(yuǎn)端語音。
      30.如權(quán)利要求28的裝置,其中,所述內(nèi)容是用于數(shù)據(jù)壓縮的數(shù)據(jù)。
      31.如權(quán)利要求28的裝置,其中,所述至少一個(gè)估計(jì)器通過測量信號的屬性來估計(jì)初始概率值。
      32.如權(quán)利要求28的裝置,所述至少一個(gè)估計(jì)器還包括多個(gè)估計(jì)器,其中一些估計(jì)器被啟動(dòng)而其他的估計(jì)器被禁止。
      33.如權(quán)利要求32的裝置,所述組合器僅對來自被啟動(dòng)的估計(jì)器的初始概率值進(jìn)行組合。
      34.如權(quán)利要求28的裝置,還包括概率網(wǎng)絡(luò)。
      35.如權(quán)利要求28的裝置,所述組合器還包括一個(gè)或多個(gè)模塊,所述一個(gè)或多個(gè)模塊為每個(gè)初始概率值獲得對應(yīng)的初始反概率值;獲得包括由初始概率值相乘到一起的乘積的第一乘積;獲得包括由初始反概率值相乘到一起的乘積的第二乘積;通過將所述第一乘積除以所述第一乘積與所述第二乘積的和而獲得總的概率值。
      36.如權(quán)利要求28的裝置,其中,每個(gè)初始概率值是至少部分信號表示了內(nèi)容的概率,每個(gè)初始反概率值是所有信號部分都未表示內(nèi)容的概率。
      37.如權(quán)利要求28的裝置,其中,每個(gè)初始反概率值是通過從值1中減去每個(gè)初始概率值而獲得,所述每個(gè)初始概率值以0到1之間所包括的值表示。
      38.如權(quán)利要求28的裝置,所述組合器至少部分基于至少一個(gè)在前概率值,將每個(gè)初始概率值組合為當(dāng)前時(shí)間間隔的總的概率值。
      39.如權(quán)利要求38的裝置,其中,所述至少一個(gè)在前概率值是在前的總概率值。
      40.如權(quán)利要求39的裝置,其中,中性概率值被用于所述在前的總概率值。
      41.如權(quán)利要求39的裝置,所述組合器還包括一個(gè)或多個(gè)模塊,所述模塊獲得若干個(gè)初始反概率值;獲得在前反概率值;獲得包括初始概率值的乘積的第一量;獲得包括將所述在前反概率值進(jìn)行乘方的第二量;獲得包括初始反概率值的乘積的第三量;獲得包括將所述在前概率值進(jìn)行乘方的第四量;將所述第一量與所述第二量相乘獲得第五量;將所述第三量與所述第四量相乘獲得第六量;以及通過將所述第五量除以所述第五量與所述第六量的和而獲得總的概率值。
      42.如權(quán)利要求41的裝置,其中,每個(gè)概率值是至少部分信號表示了內(nèi)容的概率,每個(gè)反概率值包括所有信號部分都未表示內(nèi)容的概率。
      43.如權(quán)利要求41的裝置,其中,每個(gè)反概率值是通過從值1中減去每個(gè)概率值而獲得,所述每個(gè)概率值以0到1之間所包括的值表示。
      44.如權(quán)利要求28的裝置,還包括優(yōu)化內(nèi)容檢測的優(yōu)化器。
      45.如權(quán)利要求44的裝置,所述優(yōu)化器通過使用概率網(wǎng)絡(luò)來組合概率值而檢測內(nèi)容,所述概率網(wǎng)絡(luò)可選擇要組合的概率值。
      46.如權(quán)利要求45的裝置,所述優(yōu)化器拋棄偏離所有概率值的平均值的概率值。
      47.如權(quán)利要求44的裝置,所述優(yōu)化器啟動(dòng)和/或禁止一些估計(jì)器來優(yōu)化對內(nèi)容的檢測。
      48.如權(quán)利要求47的裝置,所述優(yōu)化器基于信號類型來啟動(dòng)和/或禁止一個(gè)或多個(gè)估計(jì)器。
      49.如權(quán)利要求47的裝置,所述優(yōu)化器基于是否存在至少一個(gè)信號特征來啟動(dòng)和/或禁止一個(gè)或多個(gè)估計(jì)器。
      50.一種裝置,包括提供指令的機(jī)器可讀介質(zhì),所述指令使機(jī)器對至少部分信號表示了內(nèi)容的初始概率值進(jìn)行估計(jì),并且使機(jī)器將每個(gè)初始概率值組合為總的概率值。
      51.如權(quán)利要求50的裝置,其中,所述內(nèi)容是從以下組成的組中選出的話音活動(dòng)音調(diào)、語音、近端語音和遠(yuǎn)端語音。
      52.如權(quán)利要求50的裝置,其中,所述內(nèi)容是用于數(shù)據(jù)壓縮的數(shù)據(jù)。
      53.如權(quán)利要求50的裝置,還包括基于對信號屬性的測量來估計(jì)初始概率值的指令。
      54.如權(quán)利要求50的裝置,還包括基于使用至少一個(gè)估計(jì)器對信號屬性的測量,來估計(jì)初始概率值的指令。
      55.如權(quán)利要求54的裝置,還包括使用多個(gè)估計(jì)器測量屬性的指令,在所述多個(gè)估計(jì)器中,一些估計(jì)器被啟動(dòng)而其他的估計(jì)器被禁止。
      56.如權(quán)利要求55的裝置,還包括僅對來自被啟動(dòng)的估計(jì)器的初始概率值進(jìn)行組合的指令。
      57.如權(quán)利要求50的裝置,還包括使用概率網(wǎng)絡(luò)獲得總的概率值的指令。
      58.如權(quán)利要求57的裝置,還包括使用這樣的概率網(wǎng)絡(luò)的指令,所述概率網(wǎng)絡(luò)使用概率比率。
      59.如權(quán)利要求58的裝置,還包括使用概率網(wǎng)絡(luò)方法的指令,所述概率網(wǎng)絡(luò)方法包括獲得初始反概率值;以及通過將初始概率值的乘積除以將初始概率值的乘積與初始反概率值的乘積相加的和而獲得總的概率值。
      60.如權(quán)利要求58的裝置,還包括用于如下操作的指令為每個(gè)初始概率值獲得對應(yīng)的初始反概率值;通過將所有初始概率值相乘到一起而獲得第一乘積;通過將初始反概率值相乘到一起而獲得第二乘積;以及通過將所述第一乘積除以所述第一乘積與所述第二乘積的和而獲得總的概率值。
      61.如權(quán)利要求50的裝置,還包括通過使用概率網(wǎng)絡(luò)來組合概率值而對內(nèi)容檢測進(jìn)行優(yōu)化的指令,所述概率網(wǎng)絡(luò)選擇要組合的概率值。
      62.如權(quán)利要求61的裝置,還包括拋棄偏離所有概率值的平均值的概率值的指令。
      63.如權(quán)利要求50的裝置,還包括這樣的指令使用估計(jì)器來估計(jì)至少部分信號表示了內(nèi)容的概率值,并且啟動(dòng)和/或禁止一些所述估計(jì)器以對內(nèi)容檢測進(jìn)行優(yōu)化。
      64.如權(quán)利要求63的裝置,還包括基于信號類型來啟動(dòng)和/或禁止一個(gè)或多個(gè)估計(jì)器的指令。
      65.如權(quán)利要求63的裝置,還包括基于是否存在至少一個(gè)信號特征來啟動(dòng)和/或禁止一個(gè)或多個(gè)估計(jì)器的指令。
      66.一種話音活動(dòng)檢測器,包括至少一個(gè)話音活動(dòng)估計(jì)器,估計(jì)至少部分信號表示了話音活動(dòng)的初始概率值;以及組合器,將每個(gè)初始概率值組合為總的概率值。
      67.如權(quán)利要求66的話音活動(dòng)估計(jì)器,其中,所述話音活動(dòng)是從以下組成的話音活動(dòng)組中選出的音調(diào)、語音、近端語音和遠(yuǎn)端語音。
      68.如權(quán)利要求66的話音活動(dòng)估計(jì)器,其中,至少一個(gè)話音活動(dòng)檢測器是從以下組成的組中選出的基于能量的話音活動(dòng)估計(jì)器、過零話音活動(dòng)估計(jì)器和回波消除器話音活動(dòng)估計(jì)器。
      69.如權(quán)利要求66的話音活動(dòng)估計(jì)器,所述至少一個(gè)話音活動(dòng)估計(jì)器通過測量所述信號的屬性來估計(jì)初始概率值。
      70.如權(quán)利要求66的話音活動(dòng)估計(jì)器,所述至少一個(gè)話音活動(dòng)估計(jì)器還包括多個(gè)估計(jì)器,其中一些估計(jì)器被啟動(dòng)而其他的估計(jì)器被禁止。
      71.如權(quán)利要求70的話音活動(dòng)估計(jì)器,所述組合器僅對來自被啟動(dòng)的估計(jì)器的初始概率值進(jìn)行組合。
      72.如權(quán)利要求66的話音活動(dòng)估計(jì)器,還包括概率網(wǎng)絡(luò)。
      73.如權(quán)利要求66的話音活動(dòng)估計(jì)器,所述組合器還包括一個(gè)或多個(gè)模塊,所述模塊為每個(gè)初始概率值獲得對應(yīng)的初始反概率值;獲得包括由初始概率值相乘到一起的乘積的第一乘積;獲得包括由初始反概率值相乘到一起的乘積的第二乘積;通過將所述第一乘積除以所述第一乘積與所述第二乘積的和而獲得總的概率值。
      74.如權(quán)利要求66的話音活動(dòng)估計(jì)器,所述組合器至少部分基于至少一個(gè)在前概率值,將每個(gè)初始概率值組合為當(dāng)前時(shí)間間隔的總的概率值。
      75.如權(quán)利要求74的話音活動(dòng)估計(jì)器,其中,所述至少一個(gè)在前概率值是在前的總概率值。
      76.如權(quán)利要求75的話音活動(dòng)估計(jì)器,其中,中性概率值的值被用于所述在前的總概率值。
      77.如權(quán)利要求75的話音活動(dòng)估計(jì)器,所述組合器還包括一個(gè)或多個(gè)模塊,所述模塊獲得若干個(gè)初始反概率值;獲得在前反概率值;獲得包括初始概率值的乘積的第一量;獲得包括將所述在前反概率值進(jìn)行乘方的第二量;獲得包括初始反概率值的乘積的第三量;獲得包括將所述在前概率值進(jìn)行乘方的第四量;將所述第一量與所述第二量相乘獲得第五量;將所述第三量與所述第四量相乘獲得第六量;以及通過將所述第五量除以所述第五量與所述第六量的和,得到總的概率值。
      78.如權(quán)利要求66的話音活動(dòng)估計(jì)器,還包括改進(jìn)話音活動(dòng)檢測的優(yōu)化器。
      79.如權(quán)利要求78的話音活動(dòng)估計(jì)器,所述優(yōu)化器通過使用概率網(wǎng)絡(luò)來組合概率值而檢測話音活動(dòng),所述概率網(wǎng)絡(luò)可選擇要組合的概率值。
      80.如權(quán)利要求79的話音活動(dòng)估計(jì)器,所述優(yōu)化器拋棄偏離所有概率值的平均值的概率值。
      81.如權(quán)利要求78的話音活動(dòng)估計(jì)器,所述優(yōu)化器啟動(dòng)和/或禁止一些話音活動(dòng)估計(jì)器來優(yōu)化對話音活動(dòng)的檢測。
      82.如權(quán)利要求81的話音活動(dòng)估計(jì)器,所述優(yōu)化器基于信號類型來啟動(dòng)和/或禁止一個(gè)或多個(gè)話音活動(dòng)估計(jì)器。
      83.如權(quán)利要求81的話音活動(dòng)估計(jì)器,所述優(yōu)化器基于是否存在一個(gè)信號特征來啟動(dòng)和/或禁止一個(gè)或多個(gè)話音活動(dòng)估計(jì)器。
      84.如權(quán)利要求81的話音活動(dòng)估計(jì)器,所述優(yōu)化器通過試錯(cuò)來啟動(dòng)和/或禁止一個(gè)或多個(gè)話音活動(dòng)估計(jì)器,以獲得最優(yōu)的話音活動(dòng)檢測。
      全文摘要
      一種方法和裝置,其使用概率網(wǎng)絡(luò)來估計(jì)概率值并將這些概率值組合為總的概率值,每個(gè)概率值代表至少部分信號表示了內(nèi)容的概率,這些內(nèi)容比如話音活動(dòng)。本發(fā)明可通過使用一些概率估計(jì)結(jié)果并拋棄其他概率估計(jì)結(jié)果,而使自身與特定系統(tǒng)和/或信號特征符合。
      文檔編號G10L11/00GK1559067SQ02818839
      公開日2004年12月29日 申請日期2002年9月5日 優(yōu)先權(quán)日2001年9月25日
      發(fā)明者穆拉特·埃倫, 馬克西姆·利哈喬夫, 姆 利哈喬夫, 穆拉特 埃倫 申請人:英特爾公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
      1