語音信號(hào)識(shí)別處理方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本申請涉及語音信號(hào)識(shí)別處理技術(shù)領(lǐng)域,尤其涉及一種語音信號(hào)識(shí)別處理方法及
目.0
【背景技術(shù)】
[0002]在互聯(lián)網(wǎng)應(yīng)用中,語音識(shí)別的輸入形式越來越多地被使用在各個(gè)場景中,輸入法、搜索、導(dǎo)航和各種助手類工具交互中。目前絕大多數(shù)語音識(shí)別還處在有語義的語言識(shí)別,即將輸入的語音識(shí)別為某一種語言文字,機(jī)器再根據(jù)語言文字來轉(zhuǎn)化為具體的需求指令來執(zhí)行。
[0003]然而,有些用戶不具有或者喪失了語言表達(dá)的能力,以嬰兒為例進(jìn)行說明:新手爸媽聽到寶寶哭泣時(shí)總是手足無措,除了哭泣以外,稍大的嬰兒也會(huì)有笑聲、不知名的發(fā)音。
[0004]由此可見,目前的語音識(shí)別技術(shù)無法識(shí)別沒有語義的語音信號(hào)的目標(biāo)需求,因此,亟需一種針對上述情況的語音識(shí)別處理方法。
【發(fā)明內(nèi)容】
[0005]本申請旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
[0006]為此,本申請的第一個(gè)目的在于提出一種語音信號(hào)識(shí)別處理方法,該方法實(shí)現(xiàn)了能夠識(shí)別無語義語音信號(hào)的需求意圖,提高了語音信號(hào)處理的全面性和適用性。
[0007]本申請的第二個(gè)目的在于提出一種語音信號(hào)識(shí)別處理裝置。
[0008]為達(dá)上述目的,本申請第一方面實(shí)施例提出了一種語音信號(hào)識(shí)別處理方法,包括:接收待識(shí)別的語音信號(hào);提取所述語音信號(hào)的特征信息;根據(jù)特征庫中語音信號(hào)的需求類型與特征樣本的對應(yīng)關(guān)系,識(shí)別與所述特征信息對應(yīng)的需求類型。
[0009]本申請實(shí)施例的語音信號(hào)識(shí)別處理方法,首先接收待識(shí)別的語音信號(hào);然后提取所述語音信號(hào)的特征信息;最后根據(jù)特征庫中語音信號(hào)的需求類型與特征樣本的對應(yīng)關(guān)系,識(shí)別與所述特征信息對應(yīng)的需求類型。由此,實(shí)現(xiàn)了能夠識(shí)別無語義語音信號(hào)的需求意圖,提高了語音信號(hào)處理的全面性和適用性。
[0010]為達(dá)上述目的,本申請第二方面實(shí)施例提出了一種語音信號(hào)識(shí)別處理裝置,包括:接收模塊,用于接收待識(shí)別的語音信號(hào);提取模塊,用于提取所述語音信號(hào)的特征信息;識(shí)別模塊,用于根據(jù)特征庫中語音信號(hào)的需求類型與特征樣本的對應(yīng)關(guān)系,識(shí)別與所述特征信息對應(yīng)的需求類型。
[0011]本申請實(shí)施例的語音信號(hào)識(shí)別處理裝置,通過接收模塊接收待識(shí)別的語音信號(hào);通過提取模塊提取所述語音信號(hào)的特征信息;通過識(shí)別模塊根據(jù)特征庫中語音信號(hào)的需求類型與特征樣本的對應(yīng)關(guān)系,識(shí)別與所述特征信息對應(yīng)的需求類型。由此,實(shí)現(xiàn)了能夠識(shí)別無語義語音信號(hào)的需求意圖,提高了語音信號(hào)處理的全面性和適用性。
【附圖說明】
[0012]本發(fā)明上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對實(shí)施例的描述中將變得明顯和容易理解,其中:
[0013]圖1是本申請一個(gè)實(shí)施例的語音信號(hào)識(shí)別處理方法的流程圖;
[0014]圖2為建立用于語音識(shí)別的特征庫的預(yù)處理示意圖;
[0015]圖3是本申請另一個(gè)實(shí)施例的語音信號(hào)識(shí)別處理方法的流程圖;
[0016]圖4是本申請另一個(gè)實(shí)施例的語音信號(hào)識(shí)別處理方法的流程圖;
[0017]圖5是本申請另一個(gè)實(shí)施例的語音信號(hào)識(shí)別處理方法的流程圖;
[0018]圖6為采用特征庫進(jìn)行語音識(shí)別的處理示意圖;
[0019]圖7是本申請一個(gè)實(shí)施例的語音信號(hào)識(shí)別處理裝置的結(jié)構(gòu)示意圖;
[0020]圖8是本申請另一個(gè)實(shí)施例的語音信號(hào)識(shí)別處理裝置的結(jié)構(gòu)示意圖;
[0021]圖9是本申請另一個(gè)實(shí)施例的語音信號(hào)識(shí)別處理裝置的結(jié)構(gòu)示意圖;
[0022]圖10是本申請另一個(gè)實(shí)施例的語音信號(hào)識(shí)別處理裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0023]下面詳細(xì)描述本申請的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號(hào)表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實(shí)施例是示例性的,旨在用于解釋本申請,而不能理解為對本申請的限制。
[0024]下面參考附圖描述本申請實(shí)施例的語音信號(hào)識(shí)別處理方法及裝置。
[0025]圖1是本申請一個(gè)實(shí)施例的語音信號(hào)識(shí)別處理方法的流程圖。
[0026]如圖1所示,該語音信號(hào)識(shí)別處理方法包括:
[0027]步驟101,接收待識(shí)別的語音信號(hào)。
[0028]接收其他終端設(shè)備采集并上傳的待識(shí)別的語音信號(hào)。其中,其他終端設(shè)備可以通過設(shè)備上的麥克風(fēng)或者錄音設(shè)備采集待識(shí)別的語音信號(hào),采集方式很多,根據(jù)實(shí)際應(yīng)用需要進(jìn)行選擇,例如可以包括:自動(dòng)采集和人工采集,以嬰兒發(fā)出的語音信號(hào)為例具體說明如下:
[0029]場景一:人工采集方式,
[0030]當(dāng)有嬰兒發(fā)出的語音信號(hào)需要識(shí)別時(shí),通過用戶主動(dòng)設(shè)置的方式,打開聲音采集設(shè)備比如錄音設(shè)備,采集一定長度的語音信號(hào)并上傳。
[0031]場景二:自動(dòng)采集,
[0032]當(dāng)根據(jù)聲音傳感器監(jiān)測到有嬰兒發(fā)出的語音信號(hào)時(shí),即自動(dòng)打開聲音采集設(shè)備,采集一定長度的語音信號(hào)并上傳。
[0033]步驟102,提取所述語音信號(hào)的特征信息。
[0034]提取待識(shí)別的語音信號(hào)的特征信息,其中,可以根據(jù)實(shí)際應(yīng)用需要選擇提取語音信號(hào)不同的特征信息。舉例說明:該語音信號(hào)的特征信息可以為頻譜、基因周期、線譜對、線形預(yù)測倒譜和美爾頻標(biāo)倒譜系數(shù)等,可以根據(jù)應(yīng)用需要采用不同的信號(hào)處理手段對語音信號(hào)進(jìn)行處理,提取相應(yīng)的特征信息。
[0035]步驟103,根據(jù)特征庫中語音信號(hào)的需求類型與特征樣本的對應(yīng)關(guān)系,識(shí)別與所述特征信息對應(yīng)的需求類型。
[0036]根據(jù)特征庫中語音信號(hào)的需求類型與特征樣本的對應(yīng)關(guān)系,識(shí)別與獲取的特征信息對應(yīng)的需求類型,其中,特征庫中語音信號(hào)的需求類型與特征樣本的對應(yīng)關(guān)系是預(yù)先對大量的數(shù)據(jù)進(jìn)行采集、清洗、挖掘、學(xué)習(xí)生成的,圖2為建立用于語音識(shí)別的特征庫的預(yù)處理示意圖,參見圖2,具體實(shí)施過程可以包括如下步驟:
[0037]步驟一,采集攜帶需求類型的語音信號(hào)的基礎(chǔ)數(shù)據(jù);
[0038]步驟二,對所述基礎(chǔ)數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗和數(shù)據(jù)挖掘,訓(xùn)練語音信號(hào)的特征樣本與需求類型的對應(yīng)關(guān)系;
[0039]步驟三,建立包含所述對應(yīng)關(guān)系的特征庫。
[0040]具體地,首先,采集攜帶需求類型的語音信號(hào)的基礎(chǔ)數(shù)據(jù),其中,采集方式和來源有很多,例如:可以在相關(guān)領(lǐng)域獲取攜帶需求類型的語音信號(hào),其中的語音信號(hào)已經(jīng)由相關(guān)人員標(biāo)記需求類型;較為靈活的是,實(shí)時(shí)從各種網(wǎng)絡(luò)應(yīng)用中獲取相關(guān)用戶發(fā)送的攜帶需求類型的語音信號(hào)。以嬰兒哭聲作為無語義的語音信號(hào)為例說明如下:
[0041]通常來說,嬰兒的哭聲對應(yīng)的需求類型包括:1、生理性啼哭;2、需求性啼哭,包括:a)饑餓性啼哭;b) 口渴性啼哭;c)尿濕了啼哭;d)身體冷啼哭;e)身體熱啼哭;f)困倦新啼哭;g)要媽咪抱啼哭;h)疼痛引起的啼哭;3、疾病性啼哭,包括:a)營養(yǎng)性疾病引起的驚哭山)腸痙攣性啼哭;c)陣發(fā)性劇哭;d)突發(fā)尖叫啼哭;e)啼哭伴抓耳撓腮;f)疝氣嵌頓性啼哭等,其中,每種類型的哭聲具有一定的特征,以生理性啼哭為例:啼哭的聲音響亮而不刺耳,富有節(jié)奏感;常??薅鵁o淚,吃奶、睡眠、玩耍都很好,每次哭得時(shí)間也很短,其他不再贅述。
[0042]基礎(chǔ)數(shù)據(jù)的采集方式主要通過兩種方式:方式一:在專業(yè)場所(如醫(yī)院、月子會(huì)所等)錄入嬰兒的哭聲,并在醫(yī)生、專家的指導(dǎo)下對哭聲的需求類型進(jìn)行標(biāo)注;方式二:通過軟件系統(tǒng)(網(wǎng)頁、移動(dòng)APP等應(yīng)用)引導(dǎo)用戶對嬰兒哭聲進(jìn)行錄音并上傳,并對語音信號(hào)的需求類型進(jìn)行標(biāo)注。
[0043]然后