一種數(shù)據(jù)處理的方法及電子設(shè)備的制造方法
【技術(shù)領(lǐng)域】
[0001] 本申請(qǐng)涉及電子技術(shù)領(lǐng)域,特別涉及一種數(shù)據(jù)處理的方法及電子設(shè)備。
【背景技術(shù)】
[0002] 隨著電子技術(shù)的快速發(fā)展,語(yǔ)音識(shí)別技術(shù)也得到了快速的發(fā)展和廣泛的應(yīng)用,語(yǔ) 音識(shí)別的目的是將人類語(yǔ)音中的詞匯內(nèi)容轉(zhuǎn)換為電子設(shè)備可讀的輸入,例如按鍵、二進(jìn)制 編碼或者字符序列。語(yǔ)音識(shí)別技術(shù)的應(yīng)用包括語(yǔ)音撥號(hào)、語(yǔ)音導(dǎo)航、室內(nèi)設(shè)備控制、語(yǔ)音文 檔檢索、簡(jiǎn)單的聽(tīng)寫(xiě)數(shù)據(jù)錄入等。
[0003] 語(yǔ)音識(shí)別方法主要是模式匹配法,包括訓(xùn)練和識(shí)別兩個(gè)階段。不管是訓(xùn)練還是識(shí) 另IJ,都必須對(duì)輸入語(yǔ)音預(yù)處理和特征提取。訓(xùn)練階段所做的具體工作是通過(guò)用戶輸入若干 次訓(xùn)練語(yǔ)音,經(jīng)過(guò)預(yù)處理和特征提取后得到特征矢量參數(shù),最后通過(guò)特征建模達(dá)到建立訓(xùn) 練語(yǔ)音的參考模型庫(kù)的目的;而識(shí)別階段所做的主要工作是將輸入語(yǔ)音的特征矢量參數(shù)和 參考模型庫(kù)中的參考模型進(jìn)行相似性度量比較,然后把相似性最高的輸入特征矢量作為識(shí) 別結(jié)果輸出。該樣,最終就達(dá)到了語(yǔ)音識(shí)別的目的。
[0004] 語(yǔ)音識(shí)別主要應(yīng)用于PC領(lǐng)域和嵌入式領(lǐng)域。目前國(guó)內(nèi)在PC應(yīng)用領(lǐng)域,具有代表性 的有;科大訊飛的InterReco2. 0、中科模式識(shí)別的化ttekASR3. 0、捷通華聲的jASRv5. 5; 在嵌入式應(yīng)用領(lǐng)域,具有代表性的有;凌陽(yáng)的SPCE061A、ICRoute的LD332X、上海華鎮(zhèn)電子 的WS-117;總而言之,是通過(guò)在各語(yǔ)音識(shí)別硬件模塊內(nèi)部集成語(yǔ)音識(shí)別算法,從而通過(guò)軟 硬件結(jié)合來(lái)實(shí)現(xiàn)語(yǔ)音識(shí)別。
[0005] 但本申請(qǐng)發(fā)明人在實(shí)現(xiàn)本申請(qǐng)實(shí)施例中發(fā)明技術(shù)方案的過(guò)程中,發(fā)現(xiàn)上述技術(shù)至 少存在如下技術(shù)問(wèn)題:
[0006]當(dāng)目標(biāo)聲音輸出者所在的環(huán)境中噪聲很大時(shí),電子設(shè)備通過(guò)語(yǔ)音識(shí)別硬件系統(tǒng)和 軟件算法進(jìn)行語(yǔ)音識(shí)別的識(shí)別率不高,也就是說(shuō),現(xiàn)有技術(shù)中存在當(dāng)環(huán)境噪聲較大時(shí),語(yǔ)音 識(shí)別系統(tǒng)難W達(dá)到較高的識(shí)別率的技術(shù)問(wèn)題。
【發(fā)明內(nèi)容】
[0007] 本申請(qǐng)實(shí)施例通過(guò)提供一種數(shù)據(jù)處理的方法及電子設(shè)備,用W解決現(xiàn)有技術(shù)中存 在當(dāng)環(huán)境噪聲較大時(shí),語(yǔ)音識(shí)別系統(tǒng)難W達(dá)到較高的識(shí)別率的技術(shù)問(wèn)題,提高了電子設(shè)備 在環(huán)境噪聲較大時(shí)的語(yǔ)音識(shí)別率。
[0008] -方面,本申請(qǐng)實(shí)施例提供了一種數(shù)據(jù)處理的方法,應(yīng)用于一電子設(shè)備中,所述方 法包括:
[0009]獲得通過(guò)一圖像采集單元采集獲得的聲音輸出對(duì)象的目標(biāo)圖像數(shù)據(jù);
[0010] 基于所述目標(biāo)圖像數(shù)據(jù),獲取所述聲音輸出對(duì)象與所述圖像采集單元的第一位置 間的第一參考距離值和第一參考角度值;
[0011] 當(dāng)一聲音采集單元位于與所述第一位置不同的第二位置時(shí),至少基于所述第一參 考距離值和所述第一參考角度值,對(duì)通過(guò)所述聲音采集單元采集獲得的所述聲音輸出對(duì)象 所在環(huán)境的聲音信息進(jìn)行識(shí)別處理,w獲得一語(yǔ)音識(shí)別結(jié)果。
[0012] 可選的,所述圖像采集單元至少包括第一攝像頭和第二攝像頭,所述獲得通過(guò)一 圖像采集單元采集獲得的聲音輸出對(duì)象的目標(biāo)圖像數(shù)據(jù),具體包括:
[0013] 獲得通過(guò)所述第一攝像頭采集獲得的所述聲音輸出對(duì)象的第一圖像數(shù)據(jù);
[0014] 獲得通過(guò)所述第二攝像頭采集獲得的所述聲音輸出對(duì)象的第二圖像數(shù)據(jù);
[0015] 基于所述第一圖像數(shù)據(jù)和所述第二圖像數(shù)據(jù),獲得所述目標(biāo)圖像數(shù)據(jù)。
[0016] 可選的,所述基于所述目標(biāo)圖像數(shù)據(jù),獲取所述聲音輸出對(duì)象與所述圖像采集單 元的第一位置間的第一參考距離值和第一參考角度值,具體為:
[0017] 基于所述第一圖像數(shù)據(jù)和所述第二圖像數(shù)據(jù),獲取所述聲音輸出對(duì)象與所述第一 位置間的所述第一參考距離值和所述第一參考角度值。
[0018] 可選的,所述第一攝像頭與所述第二攝像頭之間的距離為第一預(yù)設(shè)距離,所述基 于所述第一圖像數(shù)據(jù)和所述第二圖像數(shù)據(jù),獲取所述聲音輸出對(duì)象與所述第一位置間的所 述第一參考距離值和所述第一參考角度值,具體包括:
[0019] 基于所述第一圖像數(shù)據(jù),獲取所述第一攝像頭與所述聲音輸出對(duì)象的第一角度 值擬及
[0020] 基于所述第二圖像數(shù)據(jù),獲取所述第二攝像頭與所述聲音輸出對(duì)象的第二角度 值;
[0021] 基于所述第一預(yù)設(shè)距離,所述第一角度值W及所述第二角度值,確定所述第一參 考距離值和所述第一參考角度值。
[0022] 可選的,所述當(dāng)一聲音采集單元位于與所述第一位置不同的第二位置時(shí),至少基 于所述第一參考距離值和所述第一參考角度值,對(duì)通過(guò)所述聲音采集單元采集獲得的所述 聲音輸出對(duì)象所在環(huán)境的聲音信息進(jìn)行識(shí)別處理,W獲得一語(yǔ)音識(shí)別結(jié)果,具體包括:
[0023] 獲取所述聲音采集單元的所述第二位置;
[0024] 判斷所述第二位置與所述第一位置間的距離是否小于等于第二預(yù)設(shè)距離,獲得第 一判斷結(jié)果;
[00巧]當(dāng)所述第一判斷結(jié)果為是時(shí),至少基于所述第一參考距離值和所述第一參考角度 值,對(duì)所述聲音信息進(jìn)行識(shí)別處理,W獲得所述語(yǔ)音識(shí)別結(jié)果。
[0026] 可選的,在所述判斷所述第二位置與所述第一位置間的距離是否小于等于第二預(yù) 設(shè)距離,獲得第一判斷結(jié)果之后,所述方法還包括:
[0027] 當(dāng)所述第一判斷結(jié)果為否時(shí),基于所述第一位置與所述第二位置獲得所述圖像采 集單元與所述聲音采集單元的第二參考距離值和第二參考角度值;
[0028] 至少基于所述第一參考距離值,所述第一參考角度值,所述第二參考距離值W及 所述第二參考角度值,對(duì)所述聲音信息進(jìn)行識(shí)別處理,W獲得所述語(yǔ)音識(shí)別結(jié)果。
[0029] 可選的,所述獲取所述聲音采集單元的所述第二位置,具體為:
[0030] 通過(guò)所述圖像采集單元獲取包含所述聲音采集單元的第一圖像;
[0031] 對(duì)所述第一圖像進(jìn)行處理,確定所述第二位置。
[0032] 可選的,所述獲得通過(guò)一圖像采集單元采集獲得的聲音輸出對(duì)象的目標(biāo)圖像數(shù) 據(jù),具體包括:
[0033] 獲得通過(guò)所述圖像采集單元采集獲得的所述聲音輸出對(duì)象的環(huán)境圖像畫(huà)面,其 中,所述環(huán)境圖像畫(huà)面包含所述聲音輸出對(duì)象的目標(biāo)圖像畫(huà)面;
[0034] 判斷所述目標(biāo)圖像畫(huà)面是否位于所述環(huán)境圖像畫(huà)面的預(yù)設(shè)位置,獲得第二判斷結(jié) 果;
[0035] 當(dāng)所述第二判斷結(jié)果為是時(shí),基于所述目標(biāo)圖像畫(huà)面獲得所述目標(biāo)圖像數(shù)據(jù)。
[0036] 可選的,在所述判斷所述目標(biāo)圖像畫(huà)面是否位于所述環(huán)境圖像畫(huà)面的預(yù)設(shè)位置, 獲得第二判斷結(jié)果之后,所述方法還包括:
[0037]當(dāng)所述第二判斷結(jié)果為否時(shí),對(duì)所述圖像采集單元進(jìn)行調(diào)整,W使所述圖像采集 單元采集獲得的所述目標(biāo)圖像畫(huà)面位于所述預(yù)設(shè)位置。
[0038]可選的,在所述對(duì)所述圖像采集單元進(jìn)行調(diào)整,W使所述圖像采集單元采集獲得 的所述目標(biāo)圖像畫(huà)面位于所述預(yù)設(shè)位置之后,所述方法還包括:
[0039] 獲取用于對(duì)所述圖像采集單元進(jìn)行調(diào)整的第一調(diào)整參數(shù);
[0040] 基于所述第一調(diào)整參數(shù),對(duì)所述聲音采集單元進(jìn)行調(diào)整,使所述聲音采集單元位 于所述第二位置,其中,當(dāng)所述聲音采集單元位于所述第二位置時(shí),所述聲音采集單元指向 所述聲音輸出對(duì)象。
[0041] 另一方面,本申請(qǐng)實(shí)施例還提供了一種數(shù)據(jù)處理的電子設(shè)備,包括:
[0042] 第一獲取單元,用于獲得通過(guò)一圖像采集單元采集獲得的聲音輸出對(duì)象的目標(biāo)圖 像數(shù)據(jù);
[0043] 第二獲取單元,用于基于所述目標(biāo)圖像數(shù)據(jù),獲取所述聲音輸出對(duì)象與所述圖像 采集單元的第一位置間的第一參考距離值和第一參考角度值;
[0044] 第一處理單元,用于當(dāng)一聲音采集單元位于與所述第一位置不同的第二位置時(shí), 至少基于所述第一參考距離值和所述第一參考角度值,對(duì)通過(guò)所述聲音采集單元采集獲得 的所述聲音輸出對(duì)象所在環(huán)境的聲音信息進(jìn)行識(shí)別處理,W獲得一語(yǔ)音識(shí)別結(jié)果。
[0045]可選的,所述圖像采集單元至少包括第一攝像頭和第二攝像頭,所述第一獲取單 元,具體包括:
[0046] 第一獲取子單元,用于獲得通過(guò)所述第一攝像頭采集獲得的所述聲音輸出對(duì)象的 第一圖像數(shù)據(jù);
[0047] 第二獲取子單元,用于獲得通過(guò)所述第二攝像頭采集獲得的所述聲音輸出對(duì)象的 第二圖像數(shù)據(jù);
[0048] 第H獲取子單元,用于基于所述第一圖像數(shù)據(jù)和所述第二圖像數(shù)據(jù),獲得所述目 標(biāo)圖像數(shù)據(jù)。
[0049] 可選的,所述第二獲取單元基于所述目標(biāo)圖像數(shù)據(jù),獲取所述聲音輸出對(duì)象與所 述圖像采集單元的第一位置間的第一參考距離值和第一參考角度值,具體為:
[0050] 基于所述第一圖像數(shù)據(jù)和所述第二圖像數(shù)據(jù),獲取所述聲音輸出對(duì)象與所述第一 位置間的所述第一參考距離值和所述第一參考角度值。
[0051] 可選的,所述第一攝像頭與所述第二攝像頭之間的距離為第一預(yù)設(shè)距離,所述第 二獲取單元具體包括:
[0052] 第四獲取子單元,用于基于所述第一圖像數(shù)據(jù),獲取所述第一攝像頭與所述聲音 輸出對(duì)象的第一角度值;
[0053] 第五獲取子單元,用于在所述第四獲取子單元基于所述第一圖像數(shù)