語音增強(qiáng)處理方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種語音增強(qiáng)處理方法及裝置。
【背景技術(shù)】
[0002]隨著智能硬件的聲學(xué)環(huán)境越來越復(fù)雜,對于智能硬件的語音識(shí)別也愈發(fā)有挑戰(zhàn)性,當(dāng)用戶說話時(shí)離麥克風(fēng)比較遠(yuǎn)時(shí),智能硬件有可能識(shí)別不出用戶的語音輸入,因此需要對輸入的語音進(jìn)行降噪和語音增強(qiáng)處理?,F(xiàn)有技術(shù)通過在智能硬件中設(shè)置語音增強(qiáng)芯片或者通過智能硬件的中央處理器(CPU)對輸入的語音進(jìn)行語音增強(qiáng),如果采用語音增強(qiáng)芯片對輸入的語音進(jìn)行語音增強(qiáng)處理,當(dāng)對語音增強(qiáng)質(zhì)量要求高時(shí),需要選取能夠適用計(jì)算復(fù)雜度高的語音增強(qiáng)芯片以提升語音增強(qiáng)質(zhì)量,從而會(huì)提高終端設(shè)備的硬件成本,如果采用(PU對輸入的語音進(jìn)行語音增強(qiáng),則會(huì)占用和消耗終端設(shè)備本地大量的計(jì)算資源。
【發(fā)明內(nèi)容】
[0003]有鑒于此,本發(fā)明提供一種語音增強(qiáng)處理處理方法及裝置,進(jìn)一步節(jié)約終端設(shè)備的硬件成本以及計(jì)算資源。
[0004]根據(jù)本方法實(shí)施例的第一方面,提供一種語音增強(qiáng)處理方法,應(yīng)用在服務(wù)器上,包括:
[0005]獲取來自終端設(shè)備的語音信息,所述語音信息中攜帶有語音增強(qiáng)輔助信息;
[0006]若根據(jù)所述終端設(shè)備的設(shè)備標(biāo)識(shí)判斷獲知所述語音信息需要進(jìn)行語音增強(qiáng)處理,則根據(jù)所述語音增強(qiáng)輔助信息在本地的多個(gè)語音增強(qiáng)算法中,獲取對應(yīng)的語音增強(qiáng)算法;
[0007]根據(jù)獲取的所述語音增強(qiáng)算法對所述語音信息進(jìn)行語音增強(qiáng)處理。
[0008]根據(jù)本方法實(shí)施例的第二方面,提供一種語音增強(qiáng)處理裝置,應(yīng)用在服務(wù)器上,包括:
[0009]第一獲取模塊,用于獲取來自終端設(shè)備的語音信息,所述語音信息中攜帶有語音增強(qiáng)輔助信息;
[0010]第二獲取模塊,用于若根據(jù)所述終端設(shè)備的設(shè)備標(biāo)識(shí)判斷獲知所述第一獲取模塊獲取的所述語音信息需要進(jìn)行語音增強(qiáng)處理,則根據(jù)所述語音增強(qiáng)輔助信息在本地的多個(gè)語音增強(qiáng)算法中,獲取對應(yīng)的語音增強(qiáng)算法;
[0011]語音增強(qiáng)模塊,用于根據(jù)所述第二獲取模塊獲取的所述語音增強(qiáng)算法對所述語音信息進(jìn)行語音增強(qiáng)處理。
[0012]由以上技術(shù)方案可見,本發(fā)明對根據(jù)終端設(shè)備的設(shè)備標(biāo)識(shí)判斷獲知語音信息需要進(jìn)行語音增強(qiáng)處理,根據(jù)語音增強(qiáng)輔助信息在本地的多個(gè)語音增強(qiáng)算法中,獲取對應(yīng)的語音增強(qiáng)算法,由于可以適用在服務(wù)器上,因此避免了在終端設(shè)備上進(jìn)行語音增強(qiáng),從而減輕了終端設(shè)備的計(jì)算負(fù)擔(dān);由于可以對終端設(shè)備的語音信息采用對應(yīng)的語音增強(qiáng)算法,避免了不必要的語音增強(qiáng)算法對語音信息進(jìn)行增強(qiáng)處理,使對語音信息進(jìn)行語音增強(qiáng)更具針對性,從而能夠最大化地降低服務(wù)器在進(jìn)行語音增強(qiáng)時(shí)的計(jì)算復(fù)雜度,提高語音增強(qiáng)的質(zhì)量,進(jìn)而使后續(xù)的語音識(shí)別更準(zhǔn)確。
[0013]應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本發(fā)明實(shí)施例。
【附圖說明】
[0014]圖1是本發(fā)明一種實(shí)施方式中語音增強(qiáng)處理方法的流程圖;
[0015]圖2是本發(fā)明另一種實(shí)施方式中語音增強(qiáng)處理方法的流程圖;
[0016]圖3是本發(fā)明再一種實(shí)施例方式中語音增強(qiáng)處理方法的流程圖;
[0017]圖4是本發(fā)明一種實(shí)施方式中語音增強(qiáng)服務(wù)器的結(jié)構(gòu)圖;
[0018]圖5是本發(fā)明一種實(shí)施方式中語音增強(qiáng)處理的系統(tǒng)結(jié)構(gòu)圖;
[0019]圖6是本發(fā)明一種實(shí)施方式中語音增強(qiáng)處理裝置的邏輯結(jié)構(gòu)圖;
[0020]圖7是本發(fā)明另一種實(shí)施方式中語音增強(qiáng)處理裝置的邏輯結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0021]這里將詳細(xì)地對示例性實(shí)施例進(jìn)行說明,其示例表示在附圖中。下面的描述涉及附圖時(shí),除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實(shí)施例中所描述的實(shí)施方式并不代表與本申請相一致的所有實(shí)施方式。相反,它們僅是與如所附權(quán)利要求書中所詳述的、本申請的一些方面相一致的裝置和方法的例子。
[0022]在本申請使用的術(shù)語是僅僅出于描述特定實(shí)施例的目的,而非旨在限制本申請。在本申請和所附權(quán)利要求書中所使用的單數(shù)形式的“一種”、“所述”和“該”也旨在包括多數(shù)形式,除非上下文清楚地表示其他含義。還應(yīng)當(dāng)理解,本文中使用的術(shù)語“和/或”是指并包含一個(gè)或多個(gè)相關(guān)聯(lián)的列出項(xiàng)目的任何或所有可能組合。
[0023]應(yīng)當(dāng)理解,盡管在本申請可能采用術(shù)語第一、第二、第三等來描述各種信息,但這些信息不應(yīng)限于這些術(shù)語。這些術(shù)語僅用來將同一類型的信息彼此區(qū)分開。例如,在不脫離本申請范圍的情況下,第一信息也可以被稱為第二信息,類似地,第二信息也可以被稱為第一信息。取決于語境,如在此所使用的詞語“如果”可以被解釋成為“在……時(shí)”或“當(dāng)……時(shí)”或“響應(yīng)于確定”。
[0024]本申請通過服務(wù)器根據(jù)語音增強(qiáng)輔助信息對獲取到的終端設(shè)備的語音信息確定語音增強(qiáng)的語音增強(qiáng)算法,并通過對應(yīng)的語音增強(qiáng)算法對語音信息進(jìn)行語音增強(qiáng)處理,因此避免了在終端設(shè)備上進(jìn)行語音增強(qiáng),從而減輕了終端設(shè)備的計(jì)算負(fù)擔(dān);由于可以對終端設(shè)備的語音信息采用對應(yīng)的語音增強(qiáng)算法,從而可以采用更具針對性的語音增強(qiáng)算法對終端設(shè)備的語音信息進(jìn)行語音增強(qiáng)處理,避免服務(wù)器采用計(jì)算復(fù)雜度高的語音增強(qiáng)算法對終端設(shè)備的語音信息進(jìn)行不必要的語音增強(qiáng)處理,最大化地降低服務(wù)器在進(jìn)行語音增強(qiáng)處理時(shí)計(jì)算復(fù)雜度,提高語音增強(qiáng)的質(zhì)量,進(jìn)而使后續(xù)的語音識(shí)別更準(zhǔn)確。為對本申請進(jìn)行進(jìn)一步說明,提供下列實(shí)施例。
[0025]請參考圖1,圖1是本發(fā)明一種實(shí)施方式中語音增強(qiáng)處理方法的流程圖,可以應(yīng)用在服務(wù)器上,本發(fā)明實(shí)施例中的終端設(shè)備可以包括:車載電視、智能遙控器、智能手機(jī)、平板電腦等各種具有語音輸入功能的設(shè)備,包括如下步驟:
[0026]步驟101,獲取來自終端設(shè)備的語音信息,其中,語音信息中攜帶有語音增強(qiáng)輔助信息。
[0027]在一實(shí)施例中,可以通過終端設(shè)備的麥克風(fēng)捕獲到模擬語音,終端設(shè)備對模擬語音進(jìn)行模數(shù)轉(zhuǎn)換以及語音壓縮后,形成本發(fā)明實(shí)施例中所述的語音信息。
[0028]步驟102,若根據(jù)終端設(shè)備的設(shè)備標(biāo)識(shí)判斷獲知語音信息需要進(jìn)行語音增強(qiáng)處理,則根據(jù)語音增強(qiáng)輔助信息在本地的多個(gè)語音增強(qiáng)算法中,獲取對應(yīng)的語音增強(qiáng)算法。
[0029]由于語音增強(qiáng)不僅涉及到語音信號(hào)數(shù)字處理,還涉及到人的聽覺感知和語音學(xué)范疇;再加上終端設(shè)備所處環(huán)境的不同,噪聲來源也會(huì)不同,因而語音增強(qiáng)算法與終端設(shè)備所處的環(huán)境相關(guān);此外,由于終端設(shè)備當(dāng)前的工作狀態(tài)的不同,終端設(shè)備通過麥克風(fēng)捕獲到的模擬語音也會(huì)不同,例如,終端設(shè)備處于免提模式以及地圖模式時(shí),麥克風(fēng)能夠較容易捕獲到外界的噪聲,因此本發(fā)明實(shí)施例可以將工作狀態(tài)信息以及環(huán)境參數(shù)信息以語音增強(qiáng)輔助信息的方式發(fā)送給服務(wù)器,服務(wù)器通過語音增強(qiáng)輔助信息確定在本地的多個(gè)語音增強(qiáng)算法中獲取對應(yīng)的語音增強(qiáng)算法,從而可以獲取到更具針對性的語音增強(qiáng)算法從而對語音信息進(jìn)行語音增強(qiáng)。
[0030]步驟103,根據(jù)獲取的語音增強(qiáng)算法對語音信息進(jìn)行語音增強(qiáng)處理。
[0031 ] 在一實(shí)施例中,例如,終端設(shè)備處于免提模式或者地圖模式,對處于免提模式與地圖模式的終端設(shè)備的語音信息而言,可以采用計(jì)算復(fù)雜度更高的語音增強(qiáng)算法進(jìn)行語音增強(qiáng),而對于正常模式下的終端設(shè)備,可以采用計(jì)算復(fù)雜度較低的語音增強(qiáng)算法進(jìn)行語音增強(qiáng),由此使得語音增強(qiáng)實(shí)現(xiàn)過程更具針對性,在確保語音增強(qiáng)質(zhì)量的情況下可以降低服務(wù)器不必要的計(jì)算負(fù)擔(dān)。在另一實(shí)施例中,終端設(shè)備處于商場中(噪聲來源以人的吵雜聲為主),或者,終端設(shè)備處于馬路上(噪聲來源以車輛的鳴笛聲為主),或者,終端設(shè)備處于教室(基本上無噪聲),在該種情形下,若終端設(shè)備處于商場中,可以采用以消除人的吵雜聲(可以通過頻率來識(shí)別)的語音增強(qiáng)算法對終端設(shè)備的語音信息進(jìn)行語音增強(qiáng),若終端設(shè)備位于馬路上,可以采用以消除車輛的鳴笛聲的語音增強(qiáng)算法對終端設(shè)備的語音信息進(jìn)行語音增強(qiáng),若終端設(shè)備處于教室,可以采用較簡單的普通的語音增強(qiáng)算法對終端設(shè)備的語音信息進(jìn)行語音增強(qiáng),由此使得語音增強(qiáng)處理采用更具針對性的語音增強(qiáng)算法。
[0032]從步驟101-步驟103可以看出,本發(fā)明根據(jù)終端設(shè)備的設(shè)備標(biāo)識(shí)判斷獲知語音信息需要進(jìn)行語音