未知的說話者識別系統(tǒng)的制作方法

文檔序號：2827444閱讀：240來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

未知的說話者識別系統(tǒng)的制作方法
【專利摘要】本發(fā)明包括用于在說話者（30）與至少一個收聽者（30）之間的語言通信中使用的設(shè)備，其中該說話者和該至少一個收聽者形成多個參與者中的全部或部分，其中該說話者和該至少一個收聽者在空間上彼此分開，該設(shè)備能操作成向收聽者提供與說話者的身份關(guān)聯(lián)的感知輸出。該設(shè)備包括識別裝置（40），該識別裝置包括振動傳感器（46），用于檢測與說話者的講話關(guān)聯(lián)的振動。該識別裝置（40）配置成存儲代表說話者和識別裝置中的任一個或兩個的識別數(shù)據(jù)，由此識別裝置能與說話者的身份關(guān)聯(lián)。該識別裝置（40）能操作使得響應(yīng)于振動傳感器檢測與所述說話者的講話（S）關(guān)聯(lián)的振動（V），傳送器傳送識別信號（50），其包括存儲的識別數(shù)據(jù)或從存儲的識別數(shù)據(jù)生成。設(shè)備進一步包括用于由收聽者使用的顯示裝置（70）。
【專利說明】未知的說話者識別系統(tǒng)

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及用于在多個參與者的說話者與收聽者之間的語言通信中使用的設(shè)備、部件的套件和有關(guān)的方法，其中該收聽者不能容易地看到誰正講話，該設(shè)備能操作成向收聽者提供指示說話者的身份的感知輸出。

【背景技術(shù)】
[0002] 存在需要多個參與者的說話者與收聽者之間的語言通信的許多環(huán)境，其中該說話者和該收聽者的分開使得一個或多個收聽者可能難以確定誰在說話。
[0003] 困難可能在說話者和一個或多個收聽者定位在直接視線外時出現(xiàn)。一個這樣的示例是定位在不同地理位置處的多個參與者之間的電信網(wǎng)絡(luò)上舉行的音頻會議電話的使用。這作為實施商業(yè)通信的部件而是眾所周知的。然而，當(dāng)會話中的參與者的數(shù)量超過兩個時，參與者可能難以解答他們中是誰在任何給定時間講話。該問題是參與者未處于彼此的直接視線內(nèi)并且因此必須僅依靠音頻信號來識別在會話的另一端是誰在講話的后果。問題在通過常規(guī)的普通老式電話服務(wù)（POTS)網(wǎng)絡(luò)實施會議會話時加劇，因為在POTS網(wǎng)絡(luò)上能使用的語音頻帶局限于近似300Hz至3400Hz，即代表人類聽力范圍的頻帶(大約20Hz至 20000Hz)的小部分。因此，除收聽參與者必須僅依靠它們的聽覺來識別誰在講話外，那些相同的參與者必須使識別基于被壓縮的音頻信號。說話者識別可以進一步被說話參與者的講話中的任何失真(其可由通過POTS網(wǎng)絡(luò)的傳送引入）所阻礙。
[0004] -個或多個收聽者識別誰在講話的相同困難也可以在具有定位在單個房間(例如擁擠的演講劇場）中的多個參與者的會議或演講中出現(xiàn)。在單個房間中有大量的參與者的情況下，收聽的那些人可能難以確定這些參與者之中是誰在講話，即使說話者與收聽的那些人在直接視線內(nèi)也如此。
[0005] 能夠基于從他們的語音簽名認(rèn)出給定人的語音而識別誰在講話的語音識別系統(tǒng) 的使用是已知的。然而，這樣的系統(tǒng)將需要訓(xùn)練來建立足以識別給定人的語音簡檔，以及包含給定會話上的所有人的語音簡檔的數(shù)據(jù)庫。這樣的系統(tǒng)因此在時間和基礎(chǔ)設(shè)施兩方面將是昂貴的。
[0006] 因此，存在對于在收聽者與說話者之間的語言通信場景(其中該收聽者不能容易地看到誰在講話）中識別誰在講話的改進的部件的需要。

【發(fā)明內(nèi)容】

[0007] 因此，本發(fā)明的第一方面提供用于在說話者與至少一個收聽者之間的語言通信中使用的設(shè)備，該說話者和該至少一個收聽者形成多個參與者中的全部或部分，其中說話者和至少一個收聽者在空間上彼此分開，該設(shè)備能操作成向收聽者提供與說話者的身份關(guān)聯(lián) 的感知輸出；該設(shè)備包括：識別裝置，其中該識別裝置可被說話者穿戴或攜帶，識別裝置包括振動傳感器，用于檢測與說話者的講話關(guān)聯(lián)的振動，其中識別裝置配置成存儲代表說話者和識別裝置中的任一個或兩個的識別數(shù)據(jù)，由此識別裝置能與說話者的身份關(guān)聯(lián)，其中識別裝置能操作使得響應(yīng)于振動傳感器檢測與說話者的講話關(guān)聯(lián)的振動，傳送器傳送識別信號，其包括存儲的識別數(shù)據(jù)或從存儲的識別數(shù)據(jù)生成；設(shè)備進一步包括用于由收聽者使用的顯示裝置，該顯示裝置能操作成接收這樣的識別信號并且從接收的識別信號生成感知輸出，其指示說話者和識別裝置中的任一個或兩個的身份。
[0008] 為了本發(fā)明的目的，就"多個"參與者而言意指兩個或以上的參與者。此外，"說話者"和"收聽者"還可在該文本中分別稱為"說話參與者"和"收聽參與者"，其中術(shù)語能互換地使用。
[0009] 本發(fā)明在說話者與收聽者之間的任何語言通信場景中（其中收聽者不能容易地看到誰在說話）獲得應(yīng)用，由此妨礙收聽者確認(rèn)說話者的身份的能力。應(yīng)用可包括但不限于：籲在具有多個參與者的會議或演講中使用來幫助在任何給定時間確認(rèn)在說話的人的身份。在單個房間(例如擁擠的演講劇場）中有大量參與者的情況下，收聽的那些人(即"收聽者"）可能難以確定這些參與者之中是誰在講話，即使說話者與收聽的那些人在直接視線內(nèi)也如此。本發(fā)明的設(shè)備提供容易使收聽者能夠在擁擠的空間確定誰在說話的身份的部件。
[0010] ?在其中說話者和收聽者不在彼此的直接視線內(nèi)的電信或無線電應(yīng)用中的使用。本發(fā)明的設(shè)備將在定位在不同地理位置(其對應(yīng)于網(wǎng)絡(luò)的不同節(jié)點）處的多個參與者之間的電信或無線電網(wǎng)絡(luò)上所承擔(dān)的音頻通信會議中特別有用。本發(fā)明的設(shè)備可與之一起使用的電信網(wǎng)絡(luò)的非限制性示例包括普通老式電話服務(wù)（POTS)、蜂窩電話網(wǎng)絡(luò)和/或因特網(wǎng)語音協(xié)議（V0IP)。本發(fā)明對于在飛機上的飛行員與空中交通控制器和/或其他飛機之間的無線電通信中的使用也將是有益的。備選地，本發(fā)明在用作對于基于地面的運輸?shù)臒o線電通信系統(tǒng)的部分一例如用于出租車公司或卡車運輸公司使用時將是有益的。
[0011] 在考慮本發(fā)明在任何這樣的具有多個參與者的"語言通信"場景中的使用時，值得注意的是每個參與者可在不同的時間說話或收聽。因此，"說話者"和"收聽者"的角色不一定是固定的。這在考慮本發(fā)明在多個不同參與者之間的電信或無線電網(wǎng)絡(luò)上的音頻通信會議期間的使用時可以更清楚地理解一給定參與者在會議中的一個情形中可以是"說話者" 并且在會議中的另一個情形處是"收聽者"。因此，在描述本發(fā)明的識別裝置和顯示裝置的使用時，如本文使用的術(shù)語"說話者"和"收聽者"可以適用于一個人和相同的人(根據(jù)該人在語言通信期間的給定時間點處是碰巧在說話或收聽)。
[0012] 使識別裝置配置成存儲代表說話者和識別裝置中的任一個或兩個的身份的識別數(shù)據(jù)可以采用各種不同的方式來實現(xiàn)。非限制性示例可包括采用雇員ID標(biāo)簽的形式提供的識別裝置，其中該標(biāo)簽包含用代表給定雇員的身份的識別數(shù)據(jù)而編碼的芯片。識別數(shù)據(jù) 可采取雇員的名字和雇員編號的形式。備選地，識別數(shù)據(jù)可包括與給定識別裝置關(guān)聯(lián)的顏色和形狀中的一個或兩個。取網(wǎng)絡(luò)的不同節(jié)點處的多個參與者之間的電信或無線電網(wǎng)絡(luò)上實施的音頻通信會議的非限制性示例，會議的參與者中的每個可提供有他們自己的識別裝置，其配置有代表與該識別裝置唯一聯(lián)系起來的可見標(biāo)記的識別數(shù)據(jù)。該唯一聯(lián)系可采取每個識別裝置具有采用顏色、形狀或其組合的形式的唯一可見標(biāo)記的形式，其中在每個識別裝置上提供不同的顏色和/或形狀，并且其中識別裝置包括用代表顏色和/或形狀的識別數(shù)據(jù)編碼的芯片或其他存儲部件。這樣的顏色和/或形狀的使用提供其中存儲的識別數(shù) 據(jù)將代表識別裝置自身的身份并且將提供避免存儲在識別裝置上的數(shù)據(jù)包含參與者中的任一個的任何個人信息(例如，名字、生日和/或地址）的需要的益處的示例。
[0013] 感知輸出優(yōu)選地包括視覺輸出、觸覺輸出和可聽輸出中的一個或多個?？陕犦敵?可采用提供說話者的名字的聽覺畫外音的形式，盡管承認(rèn)這可潛在地阻礙一個或多個收聽者聽到說話者正在說什么的能力。由于那些原因，視覺輸出是優(yōu)選的。視覺輸出采取對于收聽者足以確認(rèn)說話者和說話者的識別裝置中的任一個或兩個的身份(基于在識別信號中包含的信息）的任何視覺表示的形式。例如，視覺輸出可簡單地是說話者的名字的文本表示，或代表說話者和識別裝置中的任一個或兩個的任何字母數(shù)字標(biāo)識符。備選地，視覺輸出可采取顏色和/或形狀的形式。例如，在每個識別裝置提供有它自己的唯一可見標(biāo)記(采用顏色、形狀或其組合的形式)并且識別數(shù)據(jù)代表顏色和/或形狀(如在前面的段落中概述的）的情況下，在顯示裝置上提供的感知輸出可以是顏色和/或形狀的視覺表示。備選地，觸覺輸出可采取Braille (適合于盲人參與者）或振動(例如對應(yīng)于從不同識別裝置傳送的不同識別信號的不同振動信號的輸出）的形式。
[0014] 識別裝置包括對于說話者能操作成用識別數(shù)據(jù)來預(yù)先配置識別裝置的輸入部件，這是優(yōu)選的。用于預(yù)先配置識別裝置的這樣的輸入部件的提供將允許說話者用代表他們自己的身份的識別數(shù)據(jù)來預(yù)先配置給定的識別裝置。在使用中，這樣的預(yù)先配置將在"語言通信"開始之前出現(xiàn)，這是優(yōu)選的。進一步解釋起來，當(dāng)考慮在飛機中的飛行員與空中交通控制器之間的空中ο地面通信中使用時，飛行員將優(yōu)選地在起飛之前預(yù)先配置他們的識別裝置；當(dāng)考慮多個參與者之間的電信或無線電網(wǎng)絡(luò)上的音頻通信會議的示例時，每個參與者將優(yōu)選地在開始會議之前配置他們的識別裝置。便利地，輸入部件包括小鍵盤和音頻記錄裝置中的一個或兩個。說話者將因此能夠通過鍵盤輸入和/或音頻輸入的方式用例如他們的名字(或任何其他個人標(biāo)識符）等識別數(shù)據(jù)來預(yù)先配置識別裝置。
[0015] 識別裝置配置成與另一個人的身份能重新關(guān)聯(lián)，這是特別優(yōu)選的。本發(fā)明的該特征將確保識別裝置不限于與給定的人永久關(guān)聯(lián)，由此確保識別裝置可以在將來時間被另一個人使用。當(dāng)考慮本發(fā)明的設(shè)備在具有大量雇員的組織內(nèi)使用時，"能重新關(guān)聯(lián)性"的特征避免必須向每個雇員提供他們自己的識別裝置，其中所有雇員將同時參與相同的"語言通信"，這是不可能的。此外，能重新關(guān)聯(lián)性的特征還提供在一段時間內(nèi)與任何數(shù)量的人一起重新使用給定的識別裝置的能力。
[0016] 設(shè)想在"語言通信"場景期間的使用中，參與者中的全部將提供有他們自己的可穿戴或可攜帶識別裝置。這由此將確保每個參與者擁有適合于在他們說話時生成與他們唯一關(guān)聯(lián)的識別信號的部件。必需的顯示裝置的數(shù)量將取決于特定語言通信場景?？紤]本發(fā)明在單個房間中具有多個參與者的會議或演講期間的使用，存在可以被參與者中的全部所觀看的僅單個共同顯示裝置，這可是足夠的。然而，考慮到本發(fā)明在定位在不同地理位置(其對應(yīng)于網(wǎng)絡(luò)的多個不同節(jié)點）處的多個參與者之間的電信(或無線電）網(wǎng)絡(luò)上承擔(dān)的音頻通信會議期間的使用，設(shè)想至少一個顯示裝置將在網(wǎng)絡(luò)的每個節(jié)點處提供。這由此將基于通過網(wǎng)絡(luò)從在說話的參與者的識別裝置接收的識別信號而對在網(wǎng)絡(luò)的每個節(jié)點處存在并且收聽的那些一個或多個參與者提供被給予在不同節(jié)點處誰在說話的實時感知指示的能力。
[0017] 優(yōu)選地，配置識別裝置使得傳送器在來自說話者的持續(xù)講話的最小持續(xù)時間后僅傳送識別信號。本發(fā)明的該特征具有避免顯示裝置基于說話者咳嗽或打噴嚏而觸發(fā)由此有助于避免在設(shè)備使用期間參與者說話的錯誤指示的有益效果。便利地，最小持續(xù)時間在0. 5 與2秒之間。具有太大的最小持續(xù)時間將在a)說話者的講話首先被一個或多個收聽者聽見與b)顯示裝置(對于一個或多個收聽者）接收識別信號來生成在說話的人的身份的感知輸出之間有不可接受的時滯的風(fēng)險。
[0018] 優(yōu)選地，識別裝置能定位在說話者的頸部或胸部附近。本發(fā)明的該特征幫助更好地確保振動傳感器能夠從說話者的聲帶的使用檢測振動。識別裝置可便利地附連到項鏈用于戴在說話者的頸部周圍。便利地，識別裝置可被手持、能貼附于說話者所穿的一件衣服，或直接能貼附于說話者的身體(例如，通過使用帶子或膠帶）一這些全部落在是"可穿戴或可攜帶"的識別裝置的范圍內(nèi)。
[0019] 具有識別裝置使得它在使用中被參與者使用中穿戴或攜帶提供了識別傳感器到該參與者的接近性。這提供能夠更易于校準(zhǔn)振動傳感器使得它僅檢測來自正穿戴或攜帶識別裝置的參與者的講話的優(yōu)勢。該優(yōu)勢在其他人出現(xiàn)在與特定參與者相同的房間中的情況下尤其相關(guān)，因為它避免識別裝置被來自除正穿戴或攜帶特定識別裝置的參與者以外的人的講話所觸發(fā)。
[0020] 識別裝置的傳送器可配置成將識別信號作為具有在20Hz與20000Hz之間的頻率的音頻信號來傳送。這樣的頻率范圍對應(yīng)于人類聽力可聽到的頻率的通常接受范圍。便利地，傳送器配置成將識別信號作為具有在300Hz與3400Hz之間的較窄頻帶內(nèi)的頻率的音頻信號來傳送。該較窄頻帶特別適合于識別信號采用普通老式電話服務(wù)（POTS)的形式在電信網(wǎng)絡(luò)上的直接傳送，對于其可傳送音頻頻率范圍僅代表與人類聽力的范圍（20Hz至 20000Hz)普遍關(guān)聯(lián)的頻率范圍的一部分。
[0021] 備選地，傳送器可配置成在20000Hz以上的頻率無線傳送識別信號，設(shè)備進一步包括通信地能耦合于識別裝置與電信或無線電網(wǎng)絡(luò)之間的第一編碼器，該第一編碼器能操作成接收傳送的識別信號并且將其轉(zhuǎn)換成以下中的一個： a)具有在20Hz至20000Hz范圍內(nèi)（或備選地，在300Hz至3400Hz范圍內(nèi)）的頻率的音頻信號；或 b )加密數(shù)字信號，其中對于b )顯示裝置包括用于對加密數(shù)字信號解碼的解碼器或通信地與之能耦合。
[0022] 識別信號在20000Hz以上的頻率從識別裝置的傳送具有確保它不被說話者聽見并且因此不干擾他們的注意力和影響他們講話的有益效果。隨后由第一編碼器轉(zhuǎn)換成在 20Hz至20000Hz范圍內(nèi)的音頻頻率在設(shè)備的識別裝置與能夠傳送對應(yīng)于人類聽力的全范圍的音頻信號的電信或無線電網(wǎng)絡(luò)一起使用時是有益的；而轉(zhuǎn)換成具有在300Hz至3400Hz 范圍內(nèi)的頻率的音頻信號在設(shè)備與采用POTS形式的電信網(wǎng)絡(luò)一起使用時是特別有益的。 [0023] 除使用如上文概述的第一編碼器外，識別裝置還可能操作成對識別信號編碼以作為無線藍牙信號由傳送器傳送，其中識別裝置和第一編碼器彼此是能藍牙配對的。藍牙協(xié) 議的使用提供在識別裝置與第一編碼器之間無線連接和交換信息的安全方式。
[0024] 便利地，第一編碼器集成在能連接到電信或無線電網(wǎng)絡(luò)的節(jié)點的終端內(nèi)，該終端能操作成用于到和/或來自網(wǎng)絡(luò)的音頻通信。在一個示例中，終端可以是通過POTS而能連接的電話，該電話具有用于檢測接近于其而定位的一個或多個參與者的講話的麥克風(fēng)和用于將通過POTS接收的音頻信號輸送到收聽的任何人的揚聲器。
[0025] 優(yōu)選地，設(shè)備進一步包括集成在顯示裝置內(nèi)或通信地能連接到顯示裝置的濾波器，其中該濾波器能操作成接收組合信號(其包括識別信號和說話者的講話的音頻信號兩者)，并且進一步能操作成對該組合信號濾波以在濾波信號向收聽者的音頻輸出之前從組合信號提取識別信號。這樣的濾波器的使用有助于確保一個或多個收聽者聽見在網(wǎng)絡(luò)的另一個節(jié)點處說話的參與者所講的詞而沒有來自識別信號的干擾或失真。
[0026] 優(yōu)選地，顯示裝置集成在能連接到電信或無線電網(wǎng)絡(luò)的節(jié)點的終端內(nèi)，該終端能操作成用于到和/或來自網(wǎng)絡(luò)的音頻通信。本發(fā)明的該特征提供這樣的優(yōu)勢：提供可以用于提供到/來自電信或無線電網(wǎng)絡(luò)的音頻輸入和音頻輸出同時還起到提供在網(wǎng)絡(luò)的另一個節(jié)點處誰在說話的視覺指示的作用的單個集成終端。備選地或另外，識別裝置集成在能連接到電信或無線電網(wǎng)絡(luò)的節(jié)點的終端內(nèi)，該終端能操作成用于到和/或來自網(wǎng)絡(luò)的音頻通信；例如，終端可以是蜂窩電話，其可充當(dāng)識別裝置和顯示裝置兩者。
[0027] 在本發(fā)明的另一個方面中，提供有終端，其能操作成用于到和/或來自電信或無線電網(wǎng)絡(luò)的音頻通信，其中該終端包括本發(fā)明的識別裝置和顯示裝置中的一個或兩個。在本發(fā)明的一個形式中，終端可以是蜂窩電話。
[0028] 在本發(fā)明的另一個方面中，提供有部件的套件，其包括本發(fā)明的識別裝置和顯示裝置。這樣的套件因為它將向人提供以下兩者而有價值： a) 生成與他們的身份關(guān)聯(lián)的識別信號所必需的部件（即"識別裝置"）一適合于在語言通信期間在那個人是說話者時被他使用；以及 b) 在那個人在語言通信期間是收聽者時提供指示在說話的人的身份的視覺輸出所必需的部件（即"顯示裝置")。
[0029] 在本發(fā)明的另一個方面中，提供有在說話者與至少一個收聽者之間的語言通信中識別誰在說話的方法，該說話者和該至少一個收聽者形成多個參與者中的全部或部分，其中該說話者和該至少一個收聽者在空間上彼此分開，該方法向至少一個收聽者提供與說話者的身份關(guān)聯(lián)的感知輸出，該方法包括：提供識別裝置，其中該識別裝置可被說話者穿戴或攜帶，識別裝置包括振動傳感器，用于檢測與說話者的講話關(guān)聯(lián)的振動，其中識別裝置存儲代表說話者和識別裝置中的任一個或兩個的身份的識別數(shù)據(jù)，由此識別裝置與說話者的身份關(guān)聯(lián)；用振動傳感器檢測與說話者的講話關(guān)聯(lián)的振動，在說話者正穿戴或攜帶識別裝置時執(zhí) 行檢測；響應(yīng)于振動的檢測，從識別裝置傳送識別信號，其包括存儲的識別數(shù)據(jù)或從存儲的識別數(shù)據(jù)生成；以及提供顯示裝置用于由至少一個收聽者使用，其中該顯示裝置接收這樣的識別信號并且從接收的識別信號生成指示說話者和識別裝置中的任一個或兩個的身份的感知輸出。
[0030] 本發(fā)明的方法還可包含對應(yīng)于由上文概述的設(shè)備的各種可能特征所提供的功能性的步驟。
[0031] 提供一種用于在說話者與至少一個收聽者之間的語言通信中使用的設(shè)備，其中所述說話者和所述至少一個收聽者形成多個參與者中的全部或部分，其中所述說話者和所述至少一個收聽者在空間上彼此分開，所述設(shè)備能操作成向所述收聽者提供與所述說話者的身份關(guān)聯(lián)的感知輸出；所述設(shè)備包括：識別裝置，其中所述識別裝置可被說話者穿戴或攜帶，所述識別裝置包括振動傳感器，用于檢測與所述說話者的講話關(guān)聯(lián)的振動，其中所述識別裝置配置成存儲代表所述說話者和所述識別裝置中的任一個或兩個的的身份的識別數(shù)據(jù)，由此所述識別裝置能與所述說話者的身份關(guān)聯(lián)，其中所述識別裝置能操作使得響應(yīng)于所述振動傳感器檢測與所述說話者的講話關(guān)聯(lián) 的振動，傳送器傳送識別信號，其包括存儲的識別數(shù)據(jù)或從所述存儲的識別數(shù)據(jù)生成；所述設(shè)備進一步包括用于由收聽者使用的顯示裝置，所述顯示裝置能操作成接收這樣的識別信號并且從接收的識別信號生成感知輸出，其指示所述說話者和所述識別裝置中的任一個或兩個的身份。
[0032] 優(yōu)選的，所述識別裝置包括輸入部件，其對于所述說話者能操作成用代表所述說話者的身份的識別數(shù)據(jù)來預(yù)先配置所述識別裝置。
[0033] 優(yōu)選的，所述輸入部件包括小鍵盤和音頻記錄裝置中的一個或兩個。
[0034] 優(yōu)選的，所述識別裝置配置成與另一個人的身份能重新關(guān)聯(lián)。
[0035] 優(yōu)選的，所述感知輸出包括視覺輸出、觸覺輸出和可聽輸出中的一個或多個。
[0036] 優(yōu)選的，所述識別裝置提供有可見標(biāo)記，其中所述存儲的識別數(shù)據(jù)代表所述可見記。
[0037] 優(yōu)選的，所述可見標(biāo)記包括顏色和形狀中的一個或兩個。
[0038] 優(yōu)選的，所述顯示裝置能操作成生成所述感知輸出，其包括所述可見標(biāo)記的視覺表不。
[0039] 優(yōu)選的，配置所述識別裝置使得所述傳送器在來自所述說話者的連續(xù)講話的最小持續(xù)時間后僅傳送所述識別信號。
[0040] 優(yōu)選的，所述最小持續(xù)時間是在0. 5與2秒之間。
[0041] 優(yōu)選的，所述識別裝置能定位在所述說話者的頸部或胸部附近。
[0042] 優(yōu)選的，所述識別裝置的傳送器配置成將所述識別信號作為具有在20Hz與 20000Hz之間的頻率的音頻信號來傳送。
[0043] 優(yōu)選的，所述傳送器配置成將所述識別信號作為具有在300Hz與3400Hz之間的頻率的音頻信號來傳送以采用普通老式電話服務(wù)POTS形式通過電信網(wǎng)絡(luò)傳送。
[0044] 優(yōu)選的，所述傳送器配置成在20000Hz以上的頻率無線傳送識別信號，所述設(shè)備進一步包括通信地能耦合于所述識別裝置與電信或無線電網(wǎng)絡(luò)之間的第一編碼器，所述第一編碼器能操作成接收傳送的識別信號并且將其轉(zhuǎn)換成以下中的一個： a)具有在20Hz至20000Hz范圍內(nèi)的頻率的音頻信號；或 b )加密數(shù)字信號，其中對于b )所述顯示裝置包括用于對所述數(shù)字信號解碼的解碼器或通信地與之能耦合。
[0045] 優(yōu)選的，所述第一編碼器能操作成接收傳送的識別信號并且將其轉(zhuǎn)換成具有在 300Hz至3400Hz范圍內(nèi)的頻率的音頻信號。
[0046] 優(yōu)選的，所述識別裝置能操作成對所述識別信號編碼以作為藍牙信號由所述傳送器無線傳送，其中所述識別裝置和所述第一編碼器彼此是能藍牙配對的。
[0047] 優(yōu)選的，所述第一編碼器集成在能連接到電信或無線電網(wǎng)絡(luò)的節(jié)點的終端內(nèi)，所述終端能操作用于到和/或來自所述網(wǎng)絡(luò)的音頻通信。
[0048] 優(yōu)選的，所述設(shè)備進一步包括集成在所述顯示裝置內(nèi)或通信地能連接到所述顯示裝置的濾波器，其中所述濾波器能操作成接收組合信號并且進一步能操作成對所述組合信號濾波以在濾波信號向所述收聽者的音頻輸出之前從所述組合信號提取所述識別信號，所述組合信號包括所述識別信號和所述說話者的講話的音頻信號兩者。
[0049] 優(yōu)選的，所述顯示裝置在能連接到電信或無線電網(wǎng)絡(luò)的節(jié)點的終端內(nèi)，所述終端能操作用于到和/或來自所述網(wǎng)絡(luò)的音頻通信。
[0050] 優(yōu)選的，所述識別裝置集成在能連接到電信或無線電網(wǎng)絡(luò)的節(jié)點的終端內(nèi)，所述終端能操作用于到和/或來自所述網(wǎng)絡(luò)的音頻通信。
[0051 ] 優(yōu)選的，所述終端是蜂窩電話。
[0052] 提供一種能連接到電信或無線電網(wǎng)絡(luò)的節(jié)點的終端，所述終端能操作用于到和/ 或來自所述網(wǎng)絡(luò)的音頻通信，其中所述終端包括如權(quán)利要求1至18中任一項所述的識別裝置和顯示裝置中的一個或兩個。
[0053] 優(yōu)選的，所述終端是蜂窩電話。
[0054] 提供一種部件的套件，所述套件包括如權(quán)利要求1至18中任一項所述的識別裝置和顯示裝置。
[0055] 提供一種在說話者與至少一個收聽者之間的語言通信中識別誰在說話的方法，其中所述說話者和所述至少一個收聽者形成多個參與者中的全部或部分，其中所述說話者和所述至少一個收聽者在空間上彼此分開，所述方法向所述至少一個收聽者提供與所述說話者的身份關(guān)聯(lián)的感知輸出，所述方法包括：提供識別裝置，其中所述識別裝置可被說話者穿戴或攜帶，所述識別裝置包括振動傳感器，用于檢測與所述說話者的講話關(guān)聯(lián)的振動，其中所述識別裝置存儲代表所述說話者和所述識別裝置中的任一個或兩個的身份的識別數(shù)據(jù)，由此所述識別裝置與所述說話者的身份關(guān)聯(lián)；用所述振動傳感器檢測與所述說話者的講話關(guān)聯(lián)的振動，在所述說話者正穿戴或攜帶識別裝置時執(zhí)行檢測；響應(yīng)于所述振動的檢測，從所述識別裝置傳送識別信號，其包括存儲的識別數(shù)據(jù)或從所述存儲的識別數(shù)據(jù)生成；以及提供顯示裝置用于由所述至少一個收聽者使用，其中所述顯示裝置接收這樣的識別信號并且從接收的識別信號生成指示所述說話者和所述識別裝置中的任一個或兩個的身份的感知輸出。
[0056] 優(yōu)選的，所述識別裝置提供有對于所述說話者的輸入部件，用于用所述識別數(shù)據(jù) 來預(yù)先配置所述識別裝置，所述方法進一步包括所述說話者用所述識別數(shù)據(jù)中的一些或全部來預(yù)先配置所述識別裝置的步驟，其中預(yù)先配置的識別數(shù)據(jù)代表所述說話者的身份。 [0057] 優(yōu)選的，所述識別裝置提供有用于所述識別裝置的預(yù)先配置的小鍵盤和音頻記錄裝置中的一個或兩個。
[0058] 優(yōu)選的，所述識別裝置配置成與另一個人的身份能重新關(guān)聯(lián)。
[0059] 優(yōu)選的，所述感知輸出包括視覺輸出、觸覺輸出和可聽輸出中的一個或多個。
[0060] 優(yōu)選的，所述識別裝置提供有可見標(biāo)記，其中所述存儲的識別數(shù)據(jù)代表所述可見記。
[0061] 優(yōu)選的，所述可見標(biāo)記包括顏色和形狀中的一個或兩個。
[0062] 優(yōu)選的，所述顯示裝置能操作成生成所述感知輸出，其包括所述可見標(biāo)記的視覺表不。
[0063] 優(yōu)選的，所述識別信號的傳送僅在來自所述說話者的連續(xù)講話的最小持續(xù)時間后出現(xiàn)。
[0064] 優(yōu)選的，所述最小持續(xù)時間是在0. 5與2秒之間。
[0065] 優(yōu)選的，所述識別裝置由所述說話者的穿戴或攜帶包括使所述識別裝置定位在所述說話者的頸部或胸部附近。
[0066] 優(yōu)選的，所述識別信號的傳送包括將所述識別信號作為具有在20Hz與20000Hz之間的頻率的音頻信號來傳送。
[0067] 優(yōu)選的，所述音頻信號具有在300Hz與3400Hz之間的頻率。
[0068] 優(yōu)選的，所述識別信號的傳送包括在20000Hz以上的頻率無線傳送所述識別信號，所述方法進一步包括提供通信地能耦合于所述識別裝置與電信或無線電網(wǎng)絡(luò)之間的第一編碼器，所述第一編碼器接收傳送的識別信號并且將其轉(zhuǎn)換成以下中的一個： a)具有在20Hz至20000Hz范圍內(nèi)的頻率的音頻信號；或 b )加密數(shù)字信號，其中對于b )所述顯示裝置包括用于對所述數(shù)字信號解碼的解碼器或與之通信地耦合。
[0069] 優(yōu)選的，所述第一編碼器接收傳送的識別信號并且將其轉(zhuǎn)換成具有在300Hz至 3400Hz范圍內(nèi)的頻率的音頻信號。
[0070] 優(yōu)選的，所述方法進一步包括對所述識別信號編碼使得它作為藍牙信號從所述識別裝置無線傳送。
[0071 ] 優(yōu)選的，所述方法進一步包括提供集成在所述顯示裝置內(nèi)或通信地連接到所述顯示裝置的濾波器，其中所述濾波器接收組合信號，其包括所述識別信號和所述說話者的講話的音頻信號兩者，所述濾波器對所述組合信號濾波以在濾波信號向所述收聽者的音頻輸出之前從所述組合信號提取所述識別信號。
[0072] 提供一種大致上如在本文參考描述和圖限定的設(shè)備。
[0073] 提供一種大致上如在本文參考描述和圖限定的終端。
[0074] 提供一種大致上如在本文參考描述和圖限定的套件。
[0075] 提供一種大致上如在本文參考描述和圖限定的方法。

【專利附圖】

【附圖說明】
[0076] 本發(fā)明的實施例參考下列附圖描述：圖1示出具有多個不同節(jié)點的電信網(wǎng)絡(luò)的表示。
[0077] 圖2示出在與在圖1中示出的電信網(wǎng)絡(luò)一起使用時的本發(fā)明的第一實施例。
[0078] 圖3示出在與在圖1中示出的電信網(wǎng)絡(luò)一起使用時的本發(fā)明的第二實施例。
[0079] 圖4示出在與在圖1中示出的電信網(wǎng)絡(luò)一起使用時的本發(fā)明的第三實施例。
[0080] 圖5示出其中三個不同的識別裝置的殼體每個提供有它們自己的唯一可見標(biāo)記的本發(fā)明的實施例。
[0081] 請注意圖未按比例繪制，并且規(guī)定為本發(fā)明的各種可能實施例的非限制性示例。

【具體實施方式】
[0082] 圖1示出用于在音頻通信會議期間使用的電信網(wǎng)絡(luò)10的簡化表示，該網(wǎng)絡(luò)具有多個不同的節(jié)點11。這些節(jié)點11中的每個對應(yīng)于不同的地理位置。在圖1中示出的實施例中，終端20在每個相應(yīng)的節(jié)點11處連接到電信網(wǎng)絡(luò)10,其中該終端提供到和來自電信網(wǎng) 絡(luò)10的音頻通信。本發(fā)明的示例在圖2、3和4中描述，這時電信網(wǎng)絡(luò)是普通老式電話服務(wù)（P0TS)，其中POTS系統(tǒng)仍然廣泛用于音頻會議。然而，如可以通過描述的較早部分所理解的，本發(fā)明能適用于與其他形式的電信網(wǎng)絡(luò)(例如，蜂窩電話網(wǎng)絡(luò)和/或因特網(wǎng)語音協(xié)議 (V0IP))-起使用。
[0083] 在未在圖中示出的備選實施例中，網(wǎng)絡(luò)10將是無線電通信網(wǎng)絡(luò)。一個這樣的無線電通信網(wǎng)絡(luò)10是形成飛機與地面站之間的無線電系統(tǒng)的部分的無線電網(wǎng)絡(luò)，其中該飛機和地面站對應(yīng)于網(wǎng)絡(luò)的不同節(jié)點11。
[0084] 在多個參與者30之間的音頻通信會議期間，這些參與者中的一個或多個定位在每個節(jié)點位置11處(如在圖1中圖示的)。
[0085] 圖2、3和4示出從在音頻通信會議期間的一個時間點處在說話的參與者（S卩，充當(dāng) "說話者"）和在另一個時間點在收聽的參與者（即，充當(dāng)"收聽者"）的角度來看的本發(fā)明的示范性表示。設(shè)備具有識別裝置40和顯示裝置70。
[0086] 在未試圖限制如在權(quán)利要求中概述的本發(fā)明的范圍的情況下，識別裝置40和顯示裝置70的形式和功能在下文概述。
[0087] 圖2的實施例示出在項鏈41上提供的識別裝置40。在使用中，該項鏈41將戴在參與者30中的給定一個的頸部周圍，使得識別裝置靠近頸部并且由此靠近該參與者的聲帶而定位。音頻通信會議的每個參與者30提供有要被他們穿戴或攜帶的他們自己的識別裝置40。識別裝置40包括殼體，其包含振動傳感器42、輸入部件43、存儲器44、處理器45 和傳送器46。
[0088] 圖2還示出采用連接到電信網(wǎng)絡(luò)10的會議使能的電話形式的終端20,該網(wǎng)絡(luò)具有普通老式電話服務(wù)（POTS)的形式。該終端20具有麥克風(fēng)21和揚聲器22,用于實現(xiàn)到和來自網(wǎng)絡(luò)10的音頻通信。
[0089] 在音頻通信會議開始之前，每個參與者30將使用輸入部件43來將識別數(shù)據(jù)輸入他們自己的相應(yīng)識別裝置40的存儲器44內(nèi)。該識別數(shù)據(jù)將代表該參與者的身份。未示出輸入部件43的形式，但如在描述的較早部分中概述的那樣，它可包括小鍵盤和/或音頻記錄器。識別數(shù)據(jù)可采取參與者的名字或與參與者的身份唯一關(guān)聯(lián)的另一個標(biāo)識符(例如，雇員員工編號）的形式。預(yù)先配置的行為確保識別裝置40與給定參與者30的身份成對（即，關(guān)聯(lián)）直到預(yù)先配置有另一個人的識別數(shù)據(jù)。
[0090] 在參與者30開始說話時(在該點處他們?yōu)榱吮景l(fā)明的目的而變成"說話者")，振動傳感器42檢測與說話者30的講話S關(guān)聯(lián)的振動'V'（參見圖2)。識別裝置40到說話者30的聲帶的接近性幫助振動傳感器42檢測來自說話者的講話S的開始，然而，在未在圖中示出的備選實施例中，識別裝置40被參與者30手持，或附連到參與者所穿的一件衣服。
[0091] 響應(yīng)于振動傳感器42檢測說話者30的講話S，處理器45和存儲器44與傳送器46 協(xié)作來促使傳送器無線傳送識別信號50。該識別信號50從在上文概述的預(yù)先配置步驟期間輸入的識別數(shù)據(jù)生成或包括它。在圖2中示出的實施例中，處理器45執(zhí)行存儲在存儲器 44中的計算機代碼，該計算機代碼作用于識別數(shù)據(jù)以從其生成識別信號50。計算機例如確保傳送器46在振動傳感器42已檢測來自說話者的連續(xù)講話S的最小持續(xù)時間后僅傳送識別信號50。對于圖2的實施例，識別信號50是采用具有在300Hz至3400Hz范圍中的頻率的"線性調(diào)頻脈沖"形式的音頻信號，其中該線性調(diào)頻脈沖代表識別數(shù)據(jù)的壓縮形式。
[0092] "線性調(diào)頻脈沖" 50 (即"識別信號"）被終端20的麥克風(fēng)21檢測，其中麥克風(fēng)21 還檢測說話者30的講話S。終端20然后跨網(wǎng)絡(luò)10將組合信號550發(fā)送到定位在網(wǎng)絡(luò)的其他節(jié)點11處的其他參與者30的對應(yīng)終端20,該組合信號550包含i)線性調(diào)頻脈沖50 和ii)代表說話者30的講話S的音頻信號500兩者。接收組合信號550的這些其他參與者30中的每個為了本發(fā)明的目的而變成"收聽者"。
[0093] 為了方便起見，圖2還用于從這樣的"收聽者"的角度描述本發(fā)明。
[0094] 圖2示出集成到終端20內(nèi)的顯示裝置70,其中該顯示裝置包括顯示屏71。濾波器80也集成到終端20內(nèi)。在接收組合信號550的終端上，信號首先經(jīng)過濾波器80,其對組合信號550濾波來從組合信號550提取識別信號50。在濾波后，提取的識別信號50然后輸送到顯示裝置70。如在圖2中示出的，顯示裝置70包括存儲器72和處理器73,其中該處理器73執(zhí)行存儲在存儲器72中的計算機代碼。該計算機代碼作用于提取的識別信號 50來生成采用說話者身份的視覺表示的形式的感知輸出，該視覺表示輸出到顯示屏71。在圖2中示出的實施例中，視覺表示是說話者的名字。講話信號500然后能夠輸送到終端20 的揚聲器22來使收聽者能夠聽見說話者在說什么。
[0095] 本發(fā)明的備選形式在圖3中示出，其中與圖2的實施例共同的那些特征具有相同的標(biāo)號。在圖3的實施例中，顯示裝置700作為在結(jié)構(gòu)上與終端20截然不同并且在網(wǎng)絡(luò)10 與終端20之間串聯(lián)連接的獨立模塊而提供。示出集成到顯示裝置700內(nèi)的濾波器800。濾波器800采用與圖2的實施例中的濾波器80相似的方式起作用，由此使僅包含說話者的講話的干凈音頻信號能夠輸送到終端20以經(jīng)由揚聲器22輸出到收聽者。此外，從組合信號 550提取的識別信號50將在顯示裝置70內(nèi)處理來生成在顯示屏710上的說話者身份的視覺表示。顯示裝置700的該備選形式將具有優(yōu)于圖2的實施例的不一定需要修改終端20 由此允許常規(guī)會議使能的電話用作終端的優(yōu)勢。
[0096] 對于圖3的實施例，每個參與者將提供有部件的套件，該套件包含識別裝置40和顯示裝置700,其中識別裝置和顯示裝置能與終端20 -起使用但在結(jié)構(gòu)上與終端20截然不同。
[0097] 本發(fā)明的另外的備選形式在圖4中示出。該實施例是圖3的實施例的變化形式。與圖2和3的實施例相比之下，圖4的實施例包括編碼器60,其中該編碼器60在空間上與識別裝置60和終端20截然不同并且分開，并且通過有線連接而連接到終端20。在未在圖中示出的備選實施例中，編碼器60集成在終端20本身內(nèi)。圖4的實施例還與圖2和3不同之處在于由傳送器46無線傳送的識別信號50是20000Hz以上的非可聽信號。非可聽識別信號50被編碼器60接收，其中編碼器60起到將識別信號50轉(zhuǎn)換成具有在范圍300Hz至 3400Hz內(nèi)的頻率的音頻信號的作用，其中轉(zhuǎn)換的識別信號50然后經(jīng)由有線連接輸送到終端20。終端20然后跨網(wǎng)絡(luò)10發(fā)送轉(zhuǎn)換的識別信號50連同說話者30的講話500的音頻信號。圖4的實施例優(yōu)于圖2和3的優(yōu)勢在于識別信號50作為非可聽信號（S卩，具有20000Hz 以上的頻率)從識別裝置40到編碼器60的無線傳送避免識別信號干擾說話者30的注意力和講話。在圖中未示出的實施例中，識別信號50可作為藍牙信號無線傳送，其中識別裝置 40和編碼器60是能藍牙配對的。
[0098] 圖5示出三個不同識別裝置40a、40b、40c的殼體的外部視圖的視圖。識別裝置 40a、40b、40c中的每個在殼體的外表面上提供有它自己的唯一可見標(biāo)記90a、90b、90c。在圖5中示出的實施例示出這些可見標(biāo)記90a、90b、90c，其采用具有特定紋理的形狀或顏色的形式。識別裝置40a、40b、40c中的每個使它的存儲器44用代表它相應(yīng)的可見標(biāo)記90a、 90b、90c的識別數(shù)據(jù)來編碼。在使用中，從每個識別裝置40a、40b、40c傳送的識別信號50 將對應(yīng)于每個裝置的標(biāo)記90a、90b、90c。盡管在圖中的任一個未明確示出，顯示裝置70、 700將顯示對應(yīng)于識別裝置(其屬于說話的任一個參與者30)的視覺標(biāo)記的視覺表示。 [〇〇99] 該描述使用示例來公開本發(fā)明并且還使本領(lǐng)域內(nèi)技術(shù)人員能夠制作和使用本發(fā) 明。為了避免有疑慮，如在權(quán)利要求中限定的本發(fā)明可在它的范圍內(nèi)包括本領(lǐng)域內(nèi)技術(shù)人員所想起的其他示例，其可與在該文獻的圖中指示的那些示例不同。
【權(quán)利要求】
1. 一種用于在說話者與至少一個收聽者之間的語言通信中使用的設(shè)備，其中所述說話者和所述至少一個收聽者形成多個參與者中的全部或部分，其中所述說話者和所述至少一個收聽者在空間上彼此分開，所述設(shè)備能操作成向所述收聽者提供與所述說話者的身份關(guān) 聯(lián)的感知輸出；所述設(shè)備包括：識別裝置，其中所述識別裝置可被說話者穿戴或攜帶，所述識別裝置包括振動傳感器，用于檢測與所述說話者的講話關(guān)聯(lián)的振動，其中所述識別裝置配置成存儲代表所述說話者和所述識別裝置中的任一個或兩個的身份的識別數(shù)據(jù)，由此所述識別裝置能與所述說話者的身份關(guān)聯(lián)，其中所述識別裝置能操作使得響應(yīng)于所述振動傳感器檢測與所述說話者的講話關(guān)聯(lián) 的振動，傳送器傳送識別信號，其包括存儲的識別數(shù)據(jù)或從所述存儲的識別數(shù)據(jù)生成；所述設(shè)備進一步包括用于由收聽者使用的顯示裝置，所述顯示裝置能操作成接收這樣的識別信號并且從接收的識別信號生成感知輸出，其指示所述說話者和所述識別裝置中的任一個或兩個的身份。
2. 如權(quán)利要求1所述的設(shè)備，其中所述識別裝置包括輸入部件，其對于所述說話者能操作成用代表所述說話者的身份的識別數(shù)據(jù)來預(yù)先配置所述識別裝置。
3. 如權(quán)利要求2所述的設(shè)備，其中所述輸入部件包括小鍵盤和音頻記錄裝置中的一個或兩個。
4. 如前述權(quán)利要求中任一項所述的設(shè)備，其中所述識別裝置配置成與另一個人的身份能重新關(guān)聯(lián)。
5. 如前述權(quán)利要求中任一項所述的設(shè)備，其中所述感知輸出包括視覺輸出、觸覺輸出和可聽輸出中的一個或多個。
6. 如前述權(quán)利要求中任一項所述的設(shè)備，其中所述識別裝置提供有可見標(biāo)記，其中所述存儲的識別數(shù)據(jù)代表所述可見標(biāo)記。
7. 如權(quán)利要求6所述的設(shè)備，其中所述可見標(biāo)記包括顏色和形狀中的一個或兩個。
8. 如權(quán)利要求6或7中任一項所述的設(shè)備，其中所述顯示裝置能操作成生成所述感知輸出，其包括所述可見標(biāo)記的視覺表示。
9. 如前述權(quán)利要求中任一項所述的設(shè)備，其中配置所述識別裝置使得所述傳送器在來自所述說話者的連續(xù)講話的最小持續(xù)時間后僅傳送所述識別信號。
10. 如權(quán)利要求9所述的設(shè)備，其中所述最小持續(xù)時間是在0. 5與2秒之間。
【文檔編號】G10L17/26GK104112449SQ201410162182
【公開日】2014年10月22日申請日期:2014年4月22日優(yōu)先權(quán)日:2013年4月22日
【發(fā)明者】L.W.帕特里奇, J.D.彭伯西申請人:通用電氣航空系統(tǒng)有限公司

完整全部詳細技術(shù)資料下載