專利名稱:增進(jìn)語音即時(shí)輸出的方法及助聽器的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于聽障者的助聽器。
背景技術(shù):
助聽器的發(fā)展由來已久,主要概念為將聲音放大,以幫助聽障者聽見原本聽不到的聲音,將聲音放大的處理幾乎不會(huì)產(chǎn)生延遲。另外助聽器若針對(duì)頻率進(jìn)行處理,通常是將聲音頻率降低,譬如現(xiàn)有技術(shù)美國(guó)專利第6,577,739號(hào)”Apparatus and methods for proportional audio compression and frequency shifting,,嘗聲音信號(hào)以某 I匕{列壓縮后,提供給對(duì)某特定范圍有聽力損失的聽障者,然此技術(shù)是對(duì)全體聲音做壓縮,雖然可即時(shí)輸出,但會(huì)使得聲音失真嚴(yán)重。
若只針對(duì)部分高頻聲音進(jìn)行降頻,則失真就會(huì)降低,然而這牽涉大量運(yùn)算,因此會(huì)造成延遲的問題,常常不適用于即時(shí)語音的處理,例如申請(qǐng)人于專利申請(qǐng)第099141772號(hào) (美國(guó)專利申請(qǐng)第13/064,645號(hào))雖可減少失真,但會(huì)有輸出延遲的問題產(chǎn)生。
因此如何減少聲音輸出的失真的狀況下,也能減少聲音輸出延遲的問題是有需要被解決的。發(fā)明內(nèi)容
語音在處理變頻的過程中,有時(shí)會(huì)產(chǎn)生延遲的現(xiàn)象,造成輸出的語音不能同步輸出,本發(fā)明的主要目的在于增進(jìn)語音即時(shí)輸出的方法。
為達(dá)成上述的目的,本發(fā)明包括下列步驟
將該輸入聲音切割為多個(gè)聲音段。
由多個(gè)聲音段中尋找至少二種不同屬性的聲音段
靜音聲音段,靜音聲音段的聲音能量小于一聲音能量門濫值;
非靜音聲音段,非靜音聲音段的聲音能量大于一聲音能量門濫值,在實(shí)施例中,非靜音聲音段被區(qū)分為高頻及低頻兩種屬性。
輸出部分的多個(gè)聲音段,其中
針對(duì)全部或部分非靜音聲音段進(jìn)行變頻處理后全部輸出。在實(shí)施例中,當(dāng)非靜音聲音段的屬性為高頻時(shí),則要進(jìn)行變頻處理;當(dāng)非靜音聲音段的屬性為低頻時(shí),則不進(jìn)行變頻處理。
以及
針對(duì)全部或部分該靜音聲音段消除而不輸出。
利用上述的步驟,全部或部分非靜音聲音段進(jìn)行變頻處理而產(chǎn)生時(shí)間延遲,可通過消除全部或部分該靜音聲音段,以降低或消除播放非靜音聲音段的延遲。
以下結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明進(jìn)行詳細(xì)描述,但不作為對(duì)本發(fā)明的限定。
圖1本發(fā)明的助聽器的整體架構(gòu)圖2本發(fā)明的聲音處理模塊的步驟流程圖3解釋本發(fā)明處理聲音的示意圖4解釋本發(fā)明處理聲音的示意圖。
其中,附圖標(biāo)記
助聽器10收音器11
聲音處理模塊12聲音輸出模塊13
輸入聲音20改造輸入聲音21
聲源80聽障者8具體實(shí)施方式
為讓本發(fā)明的上述和其他目的、特征和優(yōu)點(diǎn)能更明顯易懂,下文特舉出本發(fā)明的具體實(shí)施例,并配合所附附圖,作詳細(xì)說明如下。
本發(fā)明的助聽器10包括收音器11、聲音處理模塊12及聲音輸出模塊13。收音器11用于接收聲源80發(fā)出的輸入聲音20,交由聲音處理模塊12處理后,由聲音輸出模塊13 輸出。收音器11可為麥克風(fēng)等任何可收音的器材,聲音輸出模塊13可包括揚(yáng)聲器,耳機(jī)等任何可播音的器材,但本發(fā)明不以上述列舉的裝置為限。聲音處理模塊12 —般為音效處理芯片搭配控制電路、放大電路所組成;也可為處理器、記憶體搭配控制電路、放大電路所組成的解決技術(shù)。聲音處理模塊12的重點(diǎn)為聲音信號(hào)的放大處理、濾除噪音、改變聲音頻率組成以及為了達(dá)成本發(fā)明目的而需要的處理,由于聲音處理模塊12可用現(xiàn)有的硬件搭配新的固件或軟件,因此聲音處理模塊12的硬件架構(gòu)不再贅述。本發(fā)明的助聽器10基本上可以為將硬件特制化的專用機(jī),也可為小型計(jì)算機(jī)如PDA、PDA手機(jī),或智能型手機(jī)以及個(gè)人計(jì)算機(jī)。譬如以手機(jī)而言,處理器執(zhí)行記憶體內(nèi)的軟件程序后,配合聲音芯片、麥克風(fēng)及喇叭(外接式或耳機(jī))即形成如圖1聲音處理模塊12的主要架構(gòu),現(xiàn)在手機(jī)處理器執(zhí)行速度加快,手機(jī)配合適當(dāng)軟件即可成為助聽器。
接著請(qǐng)參考圖2,關(guān)于本發(fā)明聲音處理模塊的步驟流程圖。另請(qǐng)一并參考圖3及圖4,關(guān)于本發(fā)明的相關(guān)實(shí)施例的示意圖,圖3及圖4以每一階段接著每一階段(step by step)的方式(階段O 階段11)呈現(xiàn)示意圖,以方便了解本發(fā)明的重點(diǎn)。
步驟2Ol:
接收一輸入聲音20。
此步驟由收音器11完成,接收自聲源80發(fā)出的輸入聲音20。
步驟202
將輸入聲音20切割為多個(gè)聲音段。
請(qǐng)參考圖3的“階段0”,為方便說明起見被切割的輸入聲音20依照時(shí)間順序被標(biāo)注為SI,S2,S3....聲音段,而每一聲音段(SfSll)的屬性被標(biāo)注為” L”,“H”,或“Q”。 譬如聲音段SI被標(biāo)注為”L”的意義代表聲音段SI的聲音偏向低頻聲音;如聲音段S3被標(biāo)注為” H”的意義代表聲音段S3的聲音偏向高頻聲音;而如聲音段S8被標(biāo)注為” Q”的意義代表聲音段S8的聲音為靜音(譬如分貝數(shù)低于15以下)。
每一聲音段的時(shí)間長(zhǎng)度建議為O. 000Γ0.1秒之間,以1-Phone4做為助聽器的實(shí)驗(yàn)中(根據(jù)本發(fā)明所制作的軟件于1-Phone4中執(zhí)行),聲音段的時(shí)間長(zhǎng)度約在O. ΟΟΟΓΟΟ.1 秒之間效果不錯(cuò)。
步驟203
由多個(gè)聲音段中尋找至少二種不同屬性的聲音段
靜音聲音段,該靜音聲音段的聲音能量小于一聲音能量門濫值;
非靜音聲音段,該非靜音聲音段的聲音能量大于一聲音能量門濫值。
聲音處理模塊12除了將輸入聲音20切割為多個(gè)聲音段之外,并且要判斷每一聲音段的屬性” L”,“H”,或“Q”。聲音段是否為靜音(”Q”)非常容易判斷,基本上只要給一聲音能量門檻值(如15分貝),只要低于設(shè)定的門檻值則被判斷為靜音。聲音能量只要高于門檻值都是非靜音聲音段,在本實(shí)施例中,非靜音聲音段分為至少兩種屬性,被標(biāo)注為” L” (低頻聲音)或“H”(高頻聲音)。
至于聲音段的聲音是偏向高頻聲音或低頻聲音,主要判斷的方式是根據(jù)聽障者的狀況而定。一般而言,人類語言溝通的頻率為20赫茲 16000赫茲,而一般聽障者難以聽到 3000赫茲或4000赫茲以上的頻率,聽障程度越重度,則所能聽到的高頻范圍越少。因此每一聲音段的屬性為”L”或“H”即以聽障者做為判斷。關(guān)于如何判斷哪一聲音段是屬于”L” 或“H”的判斷方式很多,譬如分析每一聲音段有無出現(xiàn)高于某一赫茲(如3000赫茲)的聲音,然而此種簡(jiǎn)單方式判斷上較不精準(zhǔn)。申請(qǐng)人于專利申請(qǐng)第099141772號(hào)(美國(guó)專利申請(qǐng)第13/064,645號(hào))也揭露以高頻或低頻能量來判斷,譬如以下是幾種可行的判斷方式
若1000赫茲(Hz)以下頻率的聲音能量是最多占30%,且2500赫茲(Hz)以上頻率的聲音能量至少占70%則為高頻” H”屬性,反之屬于低頻” L”屬性。
若1000赫茲(Hz)以下頻率的聲音能量是至少占30%則為低頻” L”屬性,反之屬于高頻” H”屬性。
若1000赫茲(Hz)以下頻率的聲音能量最多占30%則為高頻” H”屬性,反之屬于低頻” L”屬性。
若2500赫茲(Hz)以上頻率的聲音能量至少占70%則為高頻” H”屬性,反之屬于低頻” L”屬性。
聲音處理模塊12基本上可以一切割出聲音段,馬上判斷其屬性,也可每切割出如 5個(gè)聲音段,再一次判斷各聲音段的屬性的批次方式進(jìn)行。
步驟204
輸出部分的多個(gè)聲音段,其中
針對(duì)全部或部分非靜音聲音段進(jìn)行變頻處理后全部輸出;以及
針對(duì)全部或部分該靜音聲音段消除而不輸出。
于本實(shí)施例中,僅針對(duì)非靜音聲音段但屬性為“H”(高頻聲音)進(jìn)行變頻處理,對(duì)于非靜音聲音段但屬性為“L”(低頻聲音)不進(jìn)行變頻處理。這是因?yàn)槁犝险唠y以聽到高頻聲音,因此屬性為“H”的聲音段為“需處理聲音段”,而屬性為“L”的聲音段為“不需處理聲音段”。為了聽障者聽到高頻聲音,因此變頻處理基本上為降低聲音頻率的處理,譬如以壓頻或移頻方式處理。關(guān)于壓頻或移頻的技術(shù)為已知技術(shù),在此不再贅述。需注意的是,為了使聽障者聽到高頻聲音,傳統(tǒng)技術(shù)是將整段聲音進(jìn)行降低聲音頻率的處理,因此處理過的聲音失真很嚴(yán)重。專利申請(qǐng)第099141772號(hào)(美國(guó)專利申請(qǐng)第13/064,645號(hào))即是改善此問題,然而采用先判斷是否為高頻或低頻,再?zèng)Q定僅針對(duì)高頻聲音段進(jìn)行處理則會(huì)有延遲的問題,因此采用專利申請(qǐng)第099141772號(hào)(美國(guó)專利申請(qǐng)第13/064,645號(hào))的技術(shù)對(duì)于即時(shí)性聲音輸出會(huì)有較明顯延遲的問題產(chǎn)生,因此本發(fā)明即針對(duì)此問題進(jìn)行改善。
以下請(qǐng)參考圖3及圖4關(guān)于實(shí)施例的敘述。
階段O :—開始的狀態(tài),關(guān)于標(biāo)注請(qǐng)見步驟202的說明。
階段1:第一個(gè)聲音段SI屬性為低頻”L”,因此不進(jìn)行變頻處理然后輸出。需注意的是,為使聽障者聽到聲音,輸出的聲音段一般要經(jīng)過放大處理(增加聲音能量)。
階段2 :第二個(gè)聲音段S2屬性為低頻” L”,因此不進(jìn)行變頻處理然后輸出。
階段3 :第三個(gè)聲音段S3屬性為高頻”H”,因此需要進(jìn)行變頻處理,由于進(jìn)行變頻處理需要一時(shí)間,此時(shí)開始產(chǎn)生延遲輸出,聲音段S3此時(shí)無法即時(shí)輸出。為方便解說起見, 在階段3以聲音段SX做為一個(gè)虛擬輸出,聲音段SX事實(shí)上無聲音也代表延遲的時(shí)段。
階段4 :第四個(gè)聲音段S4屬性為高頻”H”,因此需要進(jìn)行變頻處理,在本實(shí)施例假設(shè)處理變頻所需時(shí)間等于兩個(gè)聲音段時(shí)間,因此聲音段S3仍無法輸出,當(dāng)然S4也還在處理變頻因此也無法輸出,同樣的另一個(gè)聲音段SX加入階段4。
階段5 :由于聲音段S3已經(jīng)處理好了,因此輸出聲音段S3。由圖可知,若完全無延遲,在階段5時(shí),聲音段S5應(yīng)該要輸出,但因?yàn)橛袃蓚€(gè)延遲SX,因此在階段5時(shí)聲音段S3才輸出。
階段6 :由于聲音段S4已經(jīng)處理好了,因此輸出聲音段S4。
階段7 :第五個(gè)聲音段S5屬性為低頻” L”,因此不進(jìn)行變頻處理然后輸出。
階段8 :第六個(gè)聲音段S6屬性為低頻” L”,因此不進(jìn)行變頻處理然后輸出。
階段9 :第七個(gè)聲音段S7屬性為低頻”L”,因此不進(jìn)行變頻處理然后輸出。由圖可知,階段3的延遲為一個(gè)聲音段時(shí)間(一個(gè)SX),而從階段4 階段9的延遲為兩個(gè)聲音段時(shí)間(兩個(gè)SX)。
階段10 :接下來聲音段S8,聲音段S9及聲音段SlO都是靜音。本發(fā)明針對(duì)全部或部分靜音聲音段消除而不輸出。以此實(shí)施例而言,因?yàn)檠舆t了兩個(gè)聲音段時(shí)間,因此聲音段 S8及聲音段S9都不輸出,只輸出聲音段S10。
因此之前有延遲時(shí),本發(fā)明即以不輸出全部或部分靜音聲音,以達(dá)成減少或消除延遲。假設(shè)目前累積有6個(gè)聲音段的延遲,而若后面有4個(gè)靜音聲音段,則4個(gè)靜音聲音段都不輸出;當(dāng)后面有8個(gè)靜音聲音段,則有6個(gè)靜音聲音段不輸出,但會(huì)輸出2個(gè)靜音聲音段。
一般而言,語音溝通高頻聲音段占得最少(常常10%以下),而低頻聲音段占得最多,靜音聲音段比高頻聲音段多了許多。因此當(dāng)聲音處理模塊12夠快時(shí),去除一些靜音聲音段可以彌補(bǔ)高頻聲音段進(jìn)行變頻所延遲的時(shí)間。
階段11 :第十一個(gè)聲音段Sll屬性為低頻”L”,因此不進(jìn)行變頻處理然后輸出。在階段11輸出聲音段Sii顯示沒有延遲發(fā)生了。`
需注意的是,一般助聽器中聲音處理模塊12基本上會(huì)包括放大聲音以及噪聲消除處理,上述由于放大聲音以及噪聲消除的處理并非本發(fā)明的重點(diǎn),因此不再此贅述。
當(dāng)然,本發(fā)明還可有其它多種實(shí)施例,在不背離本發(fā)明精神及其實(shí)質(zhì)的情況下,熟悉本領(lǐng)域的技術(shù)人員當(dāng)可根據(jù)本發(fā)明作出各種相應(yīng)的改變和變形,但這些相應(yīng)的改變和變形都應(yīng)屬于本發(fā)明所附 的權(quán)利要求的保護(hù)范圍。
權(quán)利要求
1.一種增進(jìn)語音即時(shí)輸出的方法,用于一助聽器,其特征在于,該方法包括接收一輸入聲音;將該輸入聲音切割為多個(gè)聲音段;由多個(gè)聲音段中尋找至少二種不同屬性的聲音段靜音聲音段,該靜音聲音段的聲音能量小于一聲音能量門濫值;非靜音聲音段,該非靜音聲音段的聲音能量大于一聲音能量門濫值;輸出部分的多個(gè)聲音段,其中針對(duì)全部或部分非靜音聲音段進(jìn)行變頻處理后全部輸出;以及針對(duì)全部或部分該靜音聲音段消除而不輸出;利用上述的步驟,全部或部分非靜音聲音段進(jìn)行變頻處理而產(chǎn)生時(shí)間延遲,可通過消除全部或部分該靜音聲音段,以降低或消除播放非靜音聲音段的延遲。
2.根據(jù)權(quán)利要求1所述的增進(jìn)語音即時(shí)輸出的方法,其特征在于,非靜音聲音段包括不需處理聲音段及需處理聲音段兩種,其中于輸出部分的多個(gè)聲音段時(shí)當(dāng)聲音段為需處理聲音段時(shí),將需處理聲音段進(jìn)行變頻處理后輸出;以及當(dāng)聲音段為不需處理聲音段時(shí),將不需處理聲音段以不進(jìn)行變頻處理輸出。
3.根據(jù)權(quán)利要求2所述的增進(jìn)語音即時(shí)輸出的方法,其特征在于,變頻處理為降低聲音頻率的處理。
4.根據(jù)權(quán)利要求3所述的增進(jìn)語音即時(shí)輸出的方法,其特征在于,降低聲音頻率的處理以壓頻或移頻方式處理。
5.根據(jù)權(quán)利要求3所述的增進(jìn)語音即時(shí)輸出的方法,其特征在于,不需處理聲音段是合乎下列條件1000赫茲以下頻率的聲音能量至少占30%。
6.根據(jù)權(quán)利要求3所述的增進(jìn)語音即時(shí)輸出的方法,其特征在于,需處理聲音段是合乎下列其中至少一條件1000赫茲以下頻率的聲音能量最多占30%且2500赫茲以上頻率的聲音能量至少占70% ;2500赫茲以上頻率的聲音能量至少占70% ;1000赫茲以下頻率的聲音能量最多占30% ;或 2500赫茲以上頻率的聲音能量至少占70%。
7.根據(jù)權(quán)利要求1至6任意一項(xiàng)所述的增進(jìn)語音即時(shí)輸出的方法,其特征在于,,每一聲音段的時(shí)間長(zhǎng)度為O. 000Γ0.1秒之間。
8.一種助聽器,其特征在于,包括一收音器,用以接收一輸入聲音;一聲音處理模塊,與該收音器電性連接,用以將該輸入聲音切割為多個(gè)聲音段;由多個(gè)聲音段中尋找至少二種不同屬性的聲音段靜音聲音段,該靜音聲音段的聲音能量小于一聲音能量門濫值;非靜音聲音段,該非靜音聲音段的聲音能量大于一聲音能量門濫值;針對(duì)全部或部分非靜音聲音段進(jìn)行變頻處理;針對(duì)全部或部分該靜音聲音段消除;以及一聲音輸出模塊,與該聲音處理模塊電性連接,用以輸出該聲音處理模塊處理后的全部或部分的多個(gè)聲音段;利用上述的構(gòu)造,全部或部分非靜音聲音段進(jìn)行變頻處理而產(chǎn)生時(shí)間延遲,可通過消除全部或部分該靜音聲音段,以降低或消除播放非靜音聲音段的延遲。
9.根據(jù)權(quán)利要求8所述的助聽器,其特征在于,非靜音聲音段包括不需處理聲音段及需處理聲音段兩種,其中于輸出部分的多個(gè)聲音段時(shí)當(dāng)聲音段為需處理聲音段時(shí),將需處理聲音段進(jìn)行變頻處理后輸出;以及當(dāng)聲音段為不需處理聲音段時(shí),將不需處理聲音段以不進(jìn)行變頻處理輸出。
10.根據(jù)權(quán)利要求9所述的助聽器,其特征在于,變頻處理為降低聲音頻率的處理。
11.根據(jù)權(quán)利要求11所述的助聽器,其特征在于,降低聲音頻率的處理以壓頻或移頻方式處理。
12.根據(jù)權(quán)利要求10所述的助聽器,其特征在于,不需處理聲音段是合乎下列條件 1000赫茲以下頻率的聲音能量至少占30%。
13.根據(jù)權(quán)利要求10所述的助聽器,其特征在于,需處理聲音段是合乎下列其中至少一條件1000赫茲以下頻率的聲音能量最多占30%且2500赫茲以上頻率的聲音能量至少占70% ;2500赫茲以上頻率的聲音能量至少占70% ;1000赫茲以下頻率的聲音能量最多占30% ;或 2500赫茲以上頻率的聲音能量至少占70%。
14.根據(jù)權(quán)利要求8至13任意一項(xiàng)所述的助聽器,其特征在于,每一聲音段的時(shí)間長(zhǎng)度為O. 000Γ0.1秒之間。
全文摘要
一種增進(jìn)語音即時(shí)輸出的方法及助聽器,增進(jìn)語音即時(shí)輸出的方法用于一助聽器。首先將輸入聲音切割為多個(gè)聲音段,再判斷各聲音段的屬性,分別為高頻、低頻、靜音。在輸出語音時(shí),低頻聲音段不進(jìn)行變頻處理,高頻聲音段則進(jìn)行變頻處理才輸出,而全部或部分該靜音聲音段消除而不輸出,以降低或消除播放非靜音聲音段的延遲。
文檔編號(hào)H04R25/00GK103067840SQ201210301908
公開日2013年4月24日 申請(qǐng)日期2012年8月22日 優(yōu)先權(quán)日2011年10月20日
發(fā)明者趙冠力, 楊治勇, 李京蔚, 楊國(guó)屏 申請(qǐng)人:楊國(guó)屏