語音增強(qiáng)處理方法及裝置的制造方法

文檔序號(hào)：8261287閱讀：364來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

語音增強(qiáng)處理方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域，尤其涉及一種語音增強(qiáng)處理方法及裝置。
【背景技術(shù)】
[0002]隨著智能硬件的聲學(xué)環(huán)境越來越復(fù)雜，對于智能硬件的語音識(shí)別也愈發(fā)有挑戰(zhàn)性，當(dāng)用戶說話時(shí)離麥克風(fēng)比較遠(yuǎn)時(shí)，智能硬件有可能識(shí)別不出用戶的語音輸入，因此需要對輸入的語音進(jìn)行降噪和語音增強(qiáng)處理?，F(xiàn)有技術(shù)通過在智能硬件中設(shè)置語音增強(qiáng)芯片或者通過智能硬件的中央處理器(CPU)對輸入的語音進(jìn)行語音增強(qiáng)，如果采用語音增強(qiáng)芯片對輸入的語音進(jìn)行語音增強(qiáng)處理，當(dāng)對語音增強(qiáng)質(zhì)量要求高時(shí)，需要選取能夠適用計(jì)算復(fù)雜度高的語音增強(qiáng)芯片以提升語音增強(qiáng)質(zhì)量，從而會(huì)提高終端設(shè)備的硬件成本，如果采用(PU對輸入的語音進(jìn)行語音增強(qiáng)，則會(huì)占用和消耗終端設(shè)備本地大量的計(jì)算資源。

【發(fā)明內(nèi)容】

[0003]有鑒于此，本發(fā)明提供一種語音增強(qiáng)處理處理方法及裝置，進(jìn)一步節(jié)約終端設(shè)備的硬件成本以及計(jì)算資源。
[0004]根據(jù)本方法實(shí)施例的第一方面，提供一種語音增強(qiáng)處理方法，應(yīng)用在服務(wù)器上，包括:
[0005]獲取來自終端設(shè)備的語音信息，所述語音信息中攜帶有語音增強(qiáng)輔助信息；
[0006]若根據(jù)所述終端設(shè)備的設(shè)備標(biāo)識(shí)判斷獲知所述語音信息需要進(jìn)行語音增強(qiáng)處理，則根據(jù)所述語音增強(qiáng)輔助信息在本地的多個(gè)語音增強(qiáng)算法中，獲取對應(yīng)的語音增強(qiáng)算法；
[0007]根據(jù)獲取的所述語音增強(qiáng)算法對所述語音信息進(jìn)行語音增強(qiáng)處理。
[0008]根據(jù)本方法實(shí)施例的第二方面，提供一種語音增強(qiáng)處理裝置，應(yīng)用在服務(wù)器上，包括:
[0009]第一獲取模塊，用于獲取來自終端設(shè)備的語音信息，所述語音信息中攜帶有語音增強(qiáng)輔助信息；
[0010]第二獲取模塊，用于若根據(jù)所述終端設(shè)備的設(shè)備標(biāo)識(shí)判斷獲知所述第一獲取模塊獲取的所述語音信息需要進(jìn)行語音增強(qiáng)處理，則根據(jù)所述語音增強(qiáng)輔助信息在本地的多個(gè)語音增強(qiáng)算法中，獲取對應(yīng)的語音增強(qiáng)算法；
[0011]語音增強(qiáng)模塊，用于根據(jù)所述第二獲取模塊獲取的所述語音增強(qiáng)算法對所述語音信息進(jìn)行語音增強(qiáng)處理。
[0012]由以上技術(shù)方案可見，本發(fā)明對根據(jù)終端設(shè)備的設(shè)備標(biāo)識(shí)判斷獲知語音信息需要進(jìn)行語音增強(qiáng)處理，根據(jù)語音增強(qiáng)輔助信息在本地的多個(gè)語音增強(qiáng)算法中，獲取對應(yīng)的語音增強(qiáng)算法，由于可以適用在服務(wù)器上，因此避免了在終端設(shè)備上進(jìn)行語音增強(qiáng)，從而減輕了終端設(shè)備的計(jì)算負(fù)擔(dān)；由于可以對終端設(shè)備的語音信息采用對應(yīng)的語音增強(qiáng)算法，避免了不必要的語音增強(qiáng)算法對語音信息進(jìn)行增強(qiáng)處理，使對語音信息進(jìn)行語音增強(qiáng)更具針對性，從而能夠最大化地降低服務(wù)器在進(jìn)行語音增強(qiáng)時(shí)的計(jì)算復(fù)雜度，提高語音增強(qiáng)的質(zhì)量，進(jìn)而使后續(xù)的語音識(shí)別更準(zhǔn)確。
[0013]應(yīng)當(dāng)理解的是，以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的，并不能限制本發(fā)明實(shí)施例。
【附圖說明】
[0014]圖1是本發(fā)明一種實(shí)施方式中語音增強(qiáng)處理方法的流程圖；
[0015]圖2是本發(fā)明另一種實(shí)施方式中語音增強(qiáng)處理方法的流程圖；
[0016]圖3是本發(fā)明再一種實(shí)施例方式中語音增強(qiáng)處理方法的流程圖；
[0017]圖4是本發(fā)明一種實(shí)施方式中語音增強(qiáng)服務(wù)器的結(jié)構(gòu)圖；
[0018]圖5是本發(fā)明一種實(shí)施方式中語音增強(qiáng)處理的系統(tǒng)結(jié)構(gòu)圖；
[0019]圖6是本發(fā)明一種實(shí)施方式中語音增強(qiáng)處理裝置的邏輯結(jié)構(gòu)圖；
[0020]圖7是本發(fā)明另一種實(shí)施方式中語音增強(qiáng)處理裝置的邏輯結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0021]這里將詳細(xì)地對示例性實(shí)施例進(jìn)行說明，其示例表示在附圖中。下面的描述涉及附圖時(shí)，除非另有表示，不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實(shí)施例中所描述的實(shí)施方式并不代表與本申請相一致的所有實(shí)施方式。相反，它們僅是與如所附權(quán)利要求書中所詳述的、本申請的一些方面相一致的裝置和方法的例子。
[0022]在本申請使用的術(shù)語是僅僅出于描述特定實(shí)施例的目的，而非旨在限制本申請。在本申請和所附權(quán)利要求書中所使用的單數(shù)形式的“一種”、“所述”和“該”也旨在包括多數(shù)形式，除非上下文清楚地表示其他含義。還應(yīng)當(dāng)理解，本文中使用的術(shù)語“和/或”是指并包含一個(gè)或多個(gè)相關(guān)聯(lián)的列出項(xiàng)目的任何或所有可能組合。
[0023]應(yīng)當(dāng)理解，盡管在本申請可能采用術(shù)語第一、第二、第三等來描述各種信息，但這些信息不應(yīng)限于這些術(shù)語。這些術(shù)語僅用來將同一類型的信息彼此區(qū)分開。例如，在不脫離本申請范圍的情況下，第一信息也可以被稱為第二信息，類似地，第二信息也可以被稱為第一信息。取決于語境，如在此所使用的詞語“如果”可以被解釋成為“在……時(shí)”或“當(dāng)……時(shí)”或“響應(yīng)于確定”。
[0024]本申請通過服務(wù)器根據(jù)語音增強(qiáng)輔助信息對獲取到的終端設(shè)備的語音信息確定語音增強(qiáng)的語音增強(qiáng)算法，并通過對應(yīng)的語音增強(qiáng)算法對語音信息進(jìn)行語音增強(qiáng)處理，因此避免了在終端設(shè)備上進(jìn)行語音增強(qiáng)，從而減輕了終端設(shè)備的計(jì)算負(fù)擔(dān)；由于可以對終端設(shè)備的語音信息采用對應(yīng)的語音增強(qiáng)算法，從而可以采用更具針對性的語音增強(qiáng)算法對終端設(shè)備的語音信息進(jìn)行語音增強(qiáng)處理，避免服務(wù)器采用計(jì)算復(fù)雜度高的語音增強(qiáng)算法對終端設(shè)備的語音信息進(jìn)行不必要的語音增強(qiáng)處理，最大化地降低服務(wù)器在進(jìn)行語音增強(qiáng)處理時(shí)計(jì)算復(fù)雜度，提高語音增強(qiáng)的質(zhì)量，進(jìn)而使后續(xù)的語音識(shí)別更準(zhǔn)確。為對本申請進(jìn)行進(jìn)一步說明，提供下列實(shí)施例。
[0025]請參考圖1，圖1是本發(fā)明一種實(shí)施方式中語音增強(qiáng)處理方法的流程圖，可以應(yīng)用在服務(wù)器上，本發(fā)明實(shí)施例中的終端設(shè)備可以包括:車載電視、智能遙控器、智能手機(jī)、平板電腦等各種具有語音輸入功能的設(shè)備，包括如下步驟:
[0026]步驟101，獲取來自終端設(shè)備的語音信息，其中，語音信息中攜帶有語音增強(qiáng)輔助信息。
[0027]在一實(shí)施例中，可以通過終端設(shè)備的麥克風(fēng)捕獲到模擬語音，終端設(shè)備對模擬語音進(jìn)行模數(shù)轉(zhuǎn)換以及語音壓縮后，形成本發(fā)明實(shí)施例中所述的語音信息。
[0028]步驟102，若根據(jù)終端設(shè)備的設(shè)備標(biāo)識(shí)判斷獲知語音信息需要進(jìn)行語音增強(qiáng)處理，則根據(jù)語音增強(qiáng)輔助信息在本地的多個(gè)語音增強(qiáng)算法中，獲取對應(yīng)的語音增強(qiáng)算法。
[0029]由于語音增強(qiáng)不僅涉及到語音信號(hào)數(shù)字處理，還涉及到人的聽覺感知和語音學(xué)范疇；再加上終端設(shè)備所處環(huán)境的不同，噪聲來源也會(huì)不同，因而語音增強(qiáng)算法與終端設(shè)備所處的環(huán)境相關(guān)；此外，由于終端設(shè)備當(dāng)前的工作狀態(tài)的不同，終端設(shè)備通過麥克風(fēng)捕獲到的模擬語音也會(huì)不同，例如，終端設(shè)備處于免提模式以及地圖模式時(shí)，麥克風(fēng)能夠較容易捕獲到外界的噪聲，因此本發(fā)明實(shí)施例可以將工作狀態(tài)信息以及環(huán)境參數(shù)信息以語音增強(qiáng)輔助信息的方式發(fā)送給服務(wù)器，服務(wù)器通過語音增強(qiáng)輔助信息確定在本地的多個(gè)語音增強(qiáng)算法中獲取對應(yīng)的語音增強(qiáng)算法，從而可以獲取到更具針對性的語音增強(qiáng)算法從而對語音信息進(jìn)行語音增強(qiáng)。
[0030]步驟103，根據(jù)獲取的語音增強(qiáng)算法對語音信息進(jìn)行語音增強(qiáng)處理。
[0031 ] 在一實(shí)施例中，例如，終端設(shè)備處于免提模式或者地圖模式，對處于免提模式與地圖模式的終端設(shè)備的語音信息而言，可以采用計(jì)算復(fù)雜度更高的語音增強(qiáng)算法進(jìn)行語音增強(qiáng)，而對于正常模式下的終端設(shè)備，可以采用計(jì)算復(fù)雜度較低的語音增強(qiáng)算法進(jìn)行語音增強(qiáng)，由此使得語音增強(qiáng)實(shí)現(xiàn)過程更具針對性，在確保語音增強(qiáng)質(zhì)量的情況下可以降低服務(wù)器不必要的計(jì)算負(fù)擔(dān)。在另一實(shí)施例中，終端設(shè)備處于商場中(噪聲來源以人的吵雜聲為主)，或者，終端設(shè)備處于馬路上(噪聲來源以車輛的鳴笛聲為主)，或者，終端設(shè)備處于教室(基本上無噪聲)，在該種情形下，若終端設(shè)備處于商場中，可以采用以消除人的吵雜聲(可以通過頻率來識(shí)別)的語音增強(qiáng)算法對終端設(shè)備的語音信息進(jìn)行語音增強(qiáng)，若終端設(shè)備位于馬路上，可以采用以消除車輛的鳴笛聲的語音增強(qiáng)算法對終端設(shè)備的語音信息進(jìn)行語音增強(qiáng)，若終端設(shè)備處于教室，可以采用較簡單的普通的語音增強(qiáng)算法對終端設(shè)備的語音信息進(jìn)行語音增強(qiáng)，由此使得語音增強(qiáng)處理采用更具針對性的語音增強(qiáng)算法。
[0032]從步驟101-步驟103可以看出，本發(fā)明根據(jù)終端設(shè)備的設(shè)備標(biāo)識(shí)判斷獲知語音信息需要進(jìn)行語音

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3