會議系統(tǒng)和用于會議系統(tǒng)中的語音激活的方法
【技術領域】
[0001] 本發(fā)明涉及一種會議系統(tǒng)。更具體地說,本發(fā)明涉及如下會議系統(tǒng),其包括:多個 代表單元,每個代表單元具有用于從周圍接收音頻信號的麥克風;和中心服務模塊,其操縱 多個促進通道,由此,促進通道的音頻輸出促進了會議系統(tǒng)的放大的音頻輸出,由此,每個 代表單元適于將對促進通道委托的請求發(fā)送至中心服務模塊,該服務模塊適于準許請求, 并將促進通道分配給正在請求的代表單元,從而將正在請求的代表單元設定在激活狀態(tài) 下。此外,本發(fā)明涉及一種用于會議系統(tǒng)中的語音激活的方法。
【背景技術】
[0002] 會議系統(tǒng)例如用于討論,并且通常包括具有麥克風的多個代表單元,由此,在討論 中,每個討論參與者使用他自己的代表單元。通常,代表單元具有允許在代表單元前面的參 與者請求激活他的麥克風的開關等,使得參與者的語音被輸入會議系統(tǒng),并被會議系統(tǒng)放 大。
[0003] 例如,可能代表最接近的現(xiàn)有技術的文獻EP 1686835A1公開了一種具有多個這 樣的代表單元的會議系統(tǒng),由此,在代表單元上安置有各種指示器,用于指示代表單元的不 同狀態(tài)。
[0004] 根據本發(fā)明,提出了一種具有權利要求1的特征的會議系統(tǒng)。此外,介紹了一種具 有權利要求11的特征的方法。本發(fā)明的優(yōu)選或有利的實施例由從屬權利要求、說明書和所 附的圖公開。
【發(fā)明內容】
[0005] 根據本發(fā)明,提供了一種會議系統(tǒng),其可操作,以安裝在會議室中或安裝在全會廳 中,并且例如由互相討論的政治家或其他參與者使用。會議系統(tǒng)還能取名為會議裝置。
[0006] 會議系統(tǒng)包括多個代表單元。優(yōu)選地超過50個、尤其地超過100個代表單元用于 會議系統(tǒng)。每個代表單元具有用于從周圍接收音頻信號的麥克風。音頻信號尤其地是來自 站或坐在代表單元前面并從而在麥克風前面的參與者的語音信號。優(yōu)選地,代表單元具體 化為具有可選擇地帶或不帶揚聲器的基體的桌面單元,由此,麥克風布置在基體上。為了處 理數(shù)據,優(yōu)選的是,代表單元包括優(yōu)選地集成在基體中的本地處理單元。
[0007] 會議系統(tǒng)還包括中心服務單元,其可操作,以操縱多個促進通道、尤其放大通道, 由此,促進通道的音頻輸出促進了會議系統(tǒng)的放大的音頻輸出。會議系統(tǒng)的放大的音頻輸 出是在周圍由會議系統(tǒng)提供的合成的音頻氣氛。優(yōu)選地,會議系統(tǒng)可操作,以通過利用促進 通道將來自代表單元的音頻信號放大成放大的音頻信號,由此,放大的音頻信號是例如全 會廳或會議室中的音頻氣氛的一部分。
[0008] 每個代表單元適于將對促進通道委托的請求發(fā)送或發(fā)射至中心服務模塊。通過請 求,代表單元要求與促進通道中的一個促進通道連接,以便將自己的音頻信號發(fā)射至促進 通道,使得音頻信號被放大,并形成放大的音頻輸出的一部分并從而形成音頻氣氛的一部 分。中心服務模塊適于準許請求,并將促進通道中的一個促進通道分配給正在請求的代表 單元。通過該程序,正在請求的代表單元被設定在激活狀態(tài)下,并將其狀態(tài)從未激活代表單 元變成激活代表單元。
[0009] 中心服務模塊可具體化為計算機,尤其地具體化為服務器。中心服務模塊與代表 單元之間的通信優(yōu)選地是尤其地利用網絡協(xié)議的數(shù)字通信,用于發(fā)送請求和/或用于發(fā)射 音頻信號。
[0010] 根據本發(fā)明,代表單元適于通過語音激活觸發(fā)請求和因此地傳輸請求。會議系統(tǒng) 從而允許代表單元通過語音激活由未激活狀態(tài)變成激活狀態(tài)。語音激活意味著僅在代表單 元前面的演講者必須開始說話,以便啟動請求的觸發(fā)。語音激活模式的優(yōu)點是,討論的參與 者無須通過按壓按鈕等來請求促進討論,而是能通過簡單地開始說話來加入討論。語音激 活方法不僅用于互動討論,而且能用于其它討論方法,以限制促進樓層音頻(floor audio) 的通道的數(shù)量。
[0011] 代表單元中可觸發(fā)請求的一個代表單元稱作正在請求的可能代表單元,由此,代 表單元中的每個代表單元能夠是這樣的正在請求的可能單元。正在請求的可能代表單元適 于在滿足至少第一觸發(fā)條件的情況下觸發(fā)請求,這要求正在請求的可能代表單元的音頻信 號水平高于對于在激活狀態(tài)下的每個其他的代表單元的個體測試值。正在請求的可能代表 單元自己的音頻信號水平是由正在請求的可能代表單元的麥克風接收的音頻信號的水平。 對于每個其他激活的代表單元,個體測試值被估計或計算。個體測試值是由提供至其他激 活的代表單元的音頻或語音信號產生并且在正在請求的可能單元的麥克風中耦合的正在 請求的可能代表單元的估計或計算音頻信號水平。
[0012] 本發(fā)明的基本思想是在代表單元例如以小于1米、尤其地小于60厘米的距離靠近 彼此布置的情況下,并且關于代表單元常常具有大的動態(tài)音頻入點范圍的事實,在沒有附 加信息的情況下代表單元不能確定它是正在請求的可能代表單元還是鄰近的代表單元。此 外,房間狀況(反射和混響)能在房間中引起音頻積累至被錯誤地識別成演講者的水平的 點。
[0013] 通過進行第一觸發(fā)條件的測試,正在請求的可能代表單元測試自己的音頻信號是 來自演講者還是用自己的麥克風說話的參與者,或者語音信號是來自演講者還是對著鄰近 的代表單元說話的參與者。在該情況下,該鄰近的代表單元的個體測試值將高于自己的音 頻信號水平,并且正在請求的可能代表單元斷定其未被語音激活。因此,正在請求的可能代 表單元測試第一觸發(fā)條件是真還是假。
[0014] 對于測試代表單元的個體測試值優(yōu)選地通過使個體聲學耦合系數(shù)與在測試周期 期間的測試代表單元的音頻信號水平、并且可選擇地與閾值系數(shù)相乘來估計、尤其地來計 算,所述個體聲學耦合系數(shù)被限定用于每對正在請求的可能代表單元與測試代表單元。因 此,為每對(正在請求的可能代表單元一一測試代表單元)限定個體聲學耦合系數(shù)。測試 代表單元的音頻信號水平被限定為從相應的測試代表單元的麥克風接收的音頻信號的水 平。測試周期優(yōu)選地短于1秒,尤其地短于0. 1秒。優(yōu)選地,僅激活代表單元被評價為測試 代表。
[0015] 在本發(fā)明的替代性實施例中,代替當前測試周期的音頻信號水平,使用在最后幾 個時間周期測試代表的音頻信號水平的最大值。例如,至少將最后的3、5或10個時間周期 用于確定最大值。該替代方式改善了值的魯棒性以及從而語音激活的魯棒性。
[0016] 在本發(fā)明的另一改進中,對于樣本塊、例如以48kHz的采樣率的1024個樣本的塊 更新個體測試值,使得個體測試值21毫秒全部更新。能使用用于采樣率和塊長度的其他 值。還優(yōu)選的是,對每個樣本進行第一觸發(fā)條件的測試。因此,對于上述示例,每隔1/48000 秒進行測試。
[0017] 在語音信號由演講者利用測試代表單元產生的情況下,個體聲學耦合系數(shù)描述或 代表正在請求的可能代表單元的音頻信號水平與測試代表單元的音頻信號水平之間的比 率。換句話說,個體聲學耦合系數(shù)能在演講者對著測試代表單元的麥克風說話的情形下得 到,由此,正在請求的可能代表單元的音頻信號除以請求代表單元的音頻信號,以重新得到 聲學耦合系數(shù)。換句話說,聲學耦合系數(shù)描述正在請求的可能代表單元的麥克風與測試代 表單元的麥克風從語音信號接收的音頻信號水平的比率。
[0018] 會議系統(tǒng)還能在正在請求的可能代表單元從其自己或另一揚聲器接收音頻信號 的情況下操作。在該情況下,個體聲學耦合系數(shù)實際上還從揚聲器會聚于音頻,從而防止請 求被揚聲器信號觸發(fā)。這是可能的,由于已知(激活的)代表單元有助于揚