在所述語(yǔ)音信號(hào)中的末端靜音區(qū)間的長(zhǎng)度的末端靜音區(qū)間調(diào)整部122。
[0044]因此,所述末端靜音區(qū)間預(yù)處理部120從變換為所述數(shù)字信號(hào)的用戶(hù)的語(yǔ)音信號(hào)中檢測(cè)末端靜音區(qū)間(時(shí)間),并將包含在所述語(yǔ)音信號(hào)中的所述末端靜音區(qū)間調(diào)整成基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度。
[0045]例如,當(dāng)從所述語(yǔ)音信號(hào)中檢測(cè)的末端靜音區(qū)間的長(zhǎng)度短于基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度時(shí),通過(guò)延長(zhǎng)所述語(yǔ)音信號(hào)中的末端靜音區(qū)間的長(zhǎng)度,以調(diào)整成基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度。相反,當(dāng)從所述語(yǔ)音信號(hào)中檢測(cè)的末端靜音區(qū)間的長(zhǎng)度長(zhǎng)于基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度時(shí),通過(guò)縮短所述語(yǔ)音信號(hào)的末端靜音區(qū)間的長(zhǎng)度,以調(diào)整成基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度。
[0046]這時(shí),所述末端靜音區(qū)間預(yù)處理部120可利用如微處理器或者數(shù)字信號(hào)處理器等一種控制構(gòu)件實(shí)現(xiàn),以軟件方式處理所述末端靜音區(qū)間的調(diào)整。
[0047]在此,所述末端靜音區(qū)間是從輸出語(yǔ)音識(shí)別開(kāi)始音(嘟嘟(BEEP)音)后至通過(guò)所述語(yǔ)音輸入部MIC檢測(cè)到的語(yǔ)音信號(hào)中輸入有實(shí)際的用戶(hù)語(yǔ)音的時(shí)間的區(qū)間,考慮到便利性,本實(shí)施例中將所述末端靜音區(qū)間假設(shè)為10ms進(jìn)行說(shuō)明。這時(shí),所述實(shí)際用戶(hù)的語(yǔ)音輸入的點(diǎn)是語(yǔ)音信號(hào)中預(yù)先設(shè)定的臨界值(Threshold Level)以上的點(diǎn)。
[0048]所述信號(hào)預(yù)處理部130接收所述末端靜音區(qū)間經(jīng)過(guò)預(yù)處理后的語(yǔ)音信號(hào),以執(zhí)行信號(hào)預(yù)處理。
[0049]S卩,對(duì)所述語(yǔ)音信號(hào)執(zhí)行消除噪音及自動(dòng)增益調(diào)節(jié)等識(shí)別語(yǔ)音所需的信號(hào)預(yù)處理作業(yè)。
[0050]所述語(yǔ)音識(shí)別部140識(shí)別經(jīng)過(guò)所述信號(hào)預(yù)處理后的語(yǔ)音信號(hào)。
[0051]即,識(shí)別相應(yīng)于所述語(yǔ)音信號(hào)的命令的含義。換言之判斷相當(dāng)于所述語(yǔ)音的命令。
[0052]另外,在本實(shí)施例中省略與本發(fā)明的技術(shù)主題無(wú)直接關(guān)聯(lián)的所述信號(hào)預(yù)處理部130及所述語(yǔ)音識(shí)別部140的具體說(shuō)明。
[0053]圖3為說(shuō)明本發(fā)明的一個(gè)實(shí)施例的用于語(yǔ)音識(shí)別的預(yù)處理方法的流程圖,圖4為所述圖3中說(shuō)明末端靜音區(qū)間的調(diào)整方法的語(yǔ)音信號(hào)的示意圖。
[0054]以下,參考圖3和圖4說(shuō)明包含在所述語(yǔ)音信號(hào)中的末端靜音區(qū)間的長(zhǎng)度調(diào)整方法。
[0055]在步驟SlOl中,所述末端靜音區(qū)間預(yù)處理部120接收變換為所述數(shù)字信號(hào)的語(yǔ)音信號(hào)。
[0056]并且在步驟S102中,檢測(cè)包含在所述語(yǔ)音信號(hào)中的末端靜音區(qū)間的長(zhǎng)度。
[0057]這時(shí),包含在所述語(yǔ)音信號(hào)的末端靜音區(qū)間的長(zhǎng)度可能如圖4中的(a)所示,短于基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度(例如:100ms),或可能如圖4中的(b)所示,長(zhǎng)于基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度。
[0058]因此當(dāng)如圖4中的(a)所示,從語(yǔ)音信號(hào)中檢測(cè)的末端靜音區(qū)間的長(zhǎng)度短(例如:20ms)的情況下,在步驟S103中所述末端靜音區(qū)間預(yù)處理部120按照基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度(例如:100ms)增加末端靜音區(qū)間的長(zhǎng)度(例如:80ms),以進(jìn)行調(diào)整。
[0059]同樣,當(dāng)如圖4中的(b)所示,從語(yǔ)音信號(hào)檢測(cè)的末端靜音區(qū)間的長(zhǎng)度長(zhǎng)(例如:200ms)的情況下,在步驟S103中所述末端靜音區(qū)間預(yù)處理部120按照基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度(例如:100ms)去除末端靜音區(qū)間的部分長(zhǎng)度(例如:100ms)。
[0060]這時(shí),所述末端靜音區(qū)間的調(diào)整部分是語(yǔ)音信號(hào)開(kāi)始的初始部分。
[0061]如上所述,通過(guò)末端靜音區(qū)間預(yù)處理部120,按照基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度調(diào)整包含在語(yǔ)音信號(hào)中的末端靜音區(qū)間的長(zhǎng)度,從而能夠提高語(yǔ)音識(shí)別率。
[0062]圖5為顯示比較本發(fā)明的一個(gè)實(shí)施例的調(diào)整包含在語(yǔ)音信號(hào)中的末端靜音區(qū)間的長(zhǎng)度的情況與未調(diào)整時(shí)的情況的語(yǔ)音識(shí)別率比較表格。
[0063]如圖5所示,當(dāng)包含在語(yǔ)音信號(hào)中的末端靜音區(qū)間的長(zhǎng)度比基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度(例如:100ms)短(例如:20ms)或長(zhǎng)(例如:200ms)時(shí),語(yǔ)音識(shí)別率為90%,處于低水平,但是當(dāng)利用本發(fā)明的方法,按照基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度(例如:100ms)調(diào)整包含在語(yǔ)音信號(hào)中的末端靜音區(qū)間的長(zhǎng)度時(shí),可以確認(rèn)到語(yǔ)音識(shí)別率提高到95%。
[0064]以上,參考附圖所示的實(shí)施例對(duì)本發(fā)明做了說(shuō)明,但這只是例子,本發(fā)明所屬領(lǐng)域的普通技術(shù)人員應(yīng)該理解,可以由此實(shí)現(xiàn)多種變更及均等的其他實(shí)施例。因此,本發(fā)明的技術(shù)保護(hù)范圍應(yīng)以本發(fā)明的技術(shù)方案的范圍為準(zhǔn)。
【主權(quán)項(xiàng)】
1.一種用于識(shí)別語(yǔ)音的預(yù)處理裝置,其特征在于,包括: 末端靜音區(qū)間檢測(cè)部,其用于檢測(cè)包含在語(yǔ)音信號(hào)中的末端靜音區(qū)間的長(zhǎng)度; 基準(zhǔn)末端靜音區(qū)間存儲(chǔ)部,其用于存儲(chǔ)基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度;以及 末端靜音區(qū)間調(diào)整部,其用于按照所述基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度調(diào)整包含在所述語(yǔ)音信號(hào)中的末端靜音區(qū)間的長(zhǎng)度。
2.根據(jù)權(quán)利要求1所述的用于識(shí)別語(yǔ)音的預(yù)處理裝置,其特征在于: 所述末端靜音區(qū)間是輸出語(yǔ)音識(shí)別開(kāi)始音后,至通過(guò)語(yǔ)音輸入構(gòu)件輸入的語(yǔ)音信號(hào)中輸入有實(shí)際用戶(hù)的語(yǔ)音的時(shí)間的無(wú)音區(qū)間。
3.根據(jù)權(quán)利要求1所述的用于識(shí)別語(yǔ)音的預(yù)處理裝置,其特征在于: 所述末端靜音區(qū)間調(diào)整部在從所述語(yǔ)音信號(hào)中檢測(cè)到的末端靜音區(qū)間的長(zhǎng)度短于基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度時(shí),通過(guò)延長(zhǎng)所述語(yǔ)音信號(hào)的末端靜音區(qū)間的長(zhǎng)度,以調(diào)整成基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度。
4.根據(jù)權(quán)利要求3所述的用于識(shí)別語(yǔ)音的預(yù)處理裝置,其特征在于: 所述末端靜音區(qū)間調(diào)整部在從所述語(yǔ)音信號(hào)中檢測(cè)到的末端靜音區(qū)間的長(zhǎng)度長(zhǎng)于基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度時(shí),通過(guò)縮短所述語(yǔ)音信號(hào)的末端靜音區(qū)間的長(zhǎng)度,以調(diào)整成基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度。
5.根據(jù)權(quán)利要求1所述的用于識(shí)別語(yǔ)音的預(yù)處理裝置,其特征在于: 所述末端靜音區(qū)間調(diào)整部在調(diào)整所述末端靜音區(qū)間時(shí),通過(guò)添加或刪除所述語(yǔ)音信號(hào)開(kāi)始的初始部分的區(qū)間進(jìn)行調(diào)整。
6.一種用于識(shí)別語(yǔ)音的預(yù)處理方法,其特征在于,包括: 接收語(yǔ)音信號(hào)的步驟; 檢測(cè)包含在所述語(yǔ)音信號(hào)中的末端靜音區(qū)間的長(zhǎng)度的步驟;以及 按照預(yù)先設(shè)定的基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度調(diào)整包含在所述語(yǔ)音信號(hào)中的末端靜音區(qū)間的長(zhǎng)度的步驟。
7.根據(jù)權(quán)利要求6所述的用于識(shí)別語(yǔ)音的預(yù)處理方法,其特征在于: 所述調(diào)整包含在所述語(yǔ)音信號(hào)中的末端靜音區(qū)間的長(zhǎng)度的步驟具體是,在從所述語(yǔ)音信號(hào)中檢測(cè)到的末端靜音區(qū)間的長(zhǎng)度短于基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度時(shí),通過(guò)延長(zhǎng)所述語(yǔ)音信號(hào)的末端靜音區(qū)間的長(zhǎng)度,以調(diào)整成基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度。
8.根據(jù)權(quán)利要求7所述的用于識(shí)別語(yǔ)音的預(yù)處理方法,其特征在于: 所述調(diào)整包含在所述語(yǔ)音信號(hào)中的末端靜音區(qū)間的長(zhǎng)度的步驟具體是,在從所述語(yǔ)音信號(hào)檢測(cè)到的末端靜音區(qū)間的長(zhǎng)度長(zhǎng)于基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度時(shí),通過(guò)縮短所述語(yǔ)音信號(hào)的末端靜音區(qū)間的長(zhǎng)度,以調(diào)整成基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度。
9.根據(jù)權(quán)利要求6所述的用于識(shí)別語(yǔ)音的預(yù)處理方法,其特征在于: 所述調(diào)整包含在所述語(yǔ)音信號(hào)中的末端靜音區(qū)間的長(zhǎng)度的步驟具體是在調(diào)整所述末端靜音區(qū)間時(shí),通過(guò)添加或刪除所述語(yǔ)音信號(hào)開(kāi)始的初始部分的區(qū)間進(jìn)行調(diào)整。
10.根據(jù)權(quán)利要求6所述的用于識(shí)別語(yǔ)音的預(yù)處理方法,其特征在于: 所述末端靜音區(qū)間是輸出語(yǔ)音識(shí)別開(kāi)始音后,至通過(guò)語(yǔ)音輸入構(gòu)件輸入的語(yǔ)音信號(hào)中輸入有實(shí)際用戶(hù)的語(yǔ)音的時(shí)間的無(wú)音區(qū)間。
【專(zhuān)利摘要】本發(fā)明涉及一種用于識(shí)別語(yǔ)音的預(yù)處理裝置及其方法,所述裝置包括:末端靜音區(qū)間檢測(cè)部,其用于檢測(cè)包含在語(yǔ)音信號(hào)中的末端靜音區(qū)間的長(zhǎng)度;基準(zhǔn)末端靜音區(qū)間存儲(chǔ)部,其用于存儲(chǔ)基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度;以及末端靜音區(qū)間調(diào)整部,其用于按照所述基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度調(diào)整包含在所述語(yǔ)音信號(hào)中的末端靜音區(qū)間的長(zhǎng)度。根據(jù)本發(fā)明,在識(shí)別語(yǔ)音時(shí)考慮用戶(hù)的聲響預(yù)處理語(yǔ)音信號(hào),使得末端靜音區(qū)間保持一定,從而提高語(yǔ)音識(shí)別性能。
【IPC分類(lèi)】G10L15-26, G10L25-78, G10L21-00
【公開(kāi)號(hào)】CN104658549
【申請(qǐng)?zhí)枴緾N201410392228
【發(fā)明人】權(quán)珉湖
【申請(qǐng)人】現(xiàn)代摩比斯株式會(huì)社
【公開(kāi)日】2015年5月27日
【申請(qǐng)日】2014年8月11日
【公告號(hào)】EP2874148A1, US20150142430