本發(fā)明涉及聲音識(shí)別裝置以及計(jì)算機(jī)可讀取的記錄介質(zhì)。
背景技術(shù):
1、當(dāng)前,在制造業(yè)等產(chǎn)業(yè)領(lǐng)域中,機(jī)器人、搬運(yùn)機(jī)、機(jī)床、機(jī)械設(shè)備等各種設(shè)備正在工作。在這樣的設(shè)備中,具備操作部的設(shè)備較多,plc(programmable?logic?controller:可編程邏輯控制器)、nc(numerical?controller:數(shù)值控制器)、控制盤等控制各設(shè)備的設(shè)備也具備操作部。
2、設(shè)備的操作部的按鈕、操作畫面較多,但有時(shí)操作復(fù)雜且熟練花費(fèi)時(shí)間。聲音輸入接口僅通過發(fā)出聲音命令就能夠執(zhí)行目標(biāo)操作。因此,嘗試了使用聲音輸入接口來提高操作性。
3、在設(shè)備的操作中使用的聲音命令能夠根據(jù)使用聲音命令的設(shè)備的種類、設(shè)置設(shè)備的現(xiàn)場(chǎng)、設(shè)備的操作內(nèi)容等來設(shè)想。因此,能夠通過語法(文章結(jié)構(gòu)以及單詞)來制作所設(shè)想的聲音命令。例如,參照專利文獻(xiàn)1。
4、現(xiàn)有技術(shù)文獻(xiàn)
5、專利文獻(xiàn)
6、專利文獻(xiàn)1:日本特開平9-325787號(hào)公報(bào)
技術(shù)實(shí)現(xiàn)思路
1、發(fā)明所要解決的課題
2、作為決定成為識(shí)別對(duì)象的聲音的性質(zhì)的屬性,存在聲音區(qū)間截取位置、背景噪聲的附著方式、發(fā)聲速度等各種屬性。由于這些屬性的微小偏差,聲音的識(shí)別結(jié)果(轉(zhuǎn)錄字符串、可靠度等)有時(shí)會(huì)紊亂。該紊亂導(dǎo)致聲音識(shí)別的正確率的降低。
3、在制造現(xiàn)場(chǎng),由于在該環(huán)境中運(yùn)轉(zhuǎn)的機(jī)械的數(shù)量、種類、作業(yè)者的作業(yè)等原因而產(chǎn)生的現(xiàn)象,有時(shí)在這些屬性中產(chǎn)生偏差。因此,在制造現(xiàn)場(chǎng)利用的聲音識(shí)別所涉及的應(yīng)用的開發(fā)、現(xiàn)場(chǎng)實(shí)際運(yùn)用時(shí)的調(diào)整時(shí),為了提高聲音識(shí)別的精度,在制造現(xiàn)場(chǎng)產(chǎn)生的現(xiàn)象的再現(xiàn)性變得重要。若發(fā)生上述紊亂,則聲音識(shí)別的誤識(shí)別的再現(xiàn)性降低。作為結(jié)果,聲音識(shí)別處理的故障調(diào)查等變得困難。這樣,與一般的家庭、事務(wù)現(xiàn)場(chǎng)中的利用不同,在制造業(yè)等工業(yè)領(lǐng)域中使用的聲音識(shí)別的應(yīng)用中,識(shí)別結(jié)果的隨機(jī)性容易成為問題。
4、因此,期望在制造現(xiàn)場(chǎng)能夠應(yīng)對(duì)識(shí)別結(jié)果的紊亂的聲音識(shí)別的技術(shù)。
5、用于解決課題的手段
6、本發(fā)明的聲音識(shí)別裝置生成對(duì)所輸入的聲音信號(hào)的預(yù)定屬性(波形參數(shù))進(jìn)行了微小調(diào)整的多個(gè)聲音信號(hào),將這些聲音信號(hào)分別作為聲音識(shí)別的對(duì)象。并且,通過將該識(shí)別結(jié)果的最頻值作為正確的識(shí)別結(jié)果來解決上述課題。
7、并且,本公開的一個(gè)方式是一種聲音識(shí)別裝置,其對(duì)在制造現(xiàn)場(chǎng)輸入的聲音信號(hào)進(jìn)行聲音識(shí)別并用作聲音命令,所述聲音識(shí)別裝置具備:調(diào)整波形組生成部,其對(duì)輸入的聲音信號(hào)的預(yù)定屬性進(jìn)行多個(gè)不同的調(diào)整,生成與調(diào)整對(duì)應(yīng)的多個(gè)調(diào)整完畢聲音信號(hào);以及聲音識(shí)別部,其對(duì)所述調(diào)整波形組生成部輸出的所述聲音信號(hào)以及多個(gè)所述調(diào)整完畢聲音信號(hào)進(jìn)行聲音識(shí)別,在所述調(diào)整波形組生成部進(jìn)行的調(diào)整中,作為調(diào)整對(duì)象的屬性而包含發(fā)聲速度。
8、本公開的另一方式是一種計(jì)算機(jī)可讀取的記錄介質(zhì),其記錄由聲音識(shí)別裝置執(zhí)行的程序,所述聲音識(shí)別裝置對(duì)在制造現(xiàn)場(chǎng)輸入的聲音信號(hào)進(jìn)行聲音識(shí)別并用作聲音命令,所述程序使計(jì)算機(jī)作為如下部件發(fā)揮功能:調(diào)整波形組生成部,其對(duì)包含輸入的聲音信號(hào)的發(fā)聲速度的預(yù)定屬性進(jìn)行多個(gè)不同的調(diào)整,生成與調(diào)整對(duì)應(yīng)的多個(gè)調(diào)整完畢聲音信號(hào);以及聲音識(shí)別部,其對(duì)所述調(diào)整波形組生成部輸出的所述聲音信號(hào)以及多個(gè)所述調(diào)整完畢聲音信號(hào)進(jìn)行聲音識(shí)別。
9、發(fā)明效果
10、根據(jù)本公開的一個(gè)方式,即使聲音波形的預(yù)定屬性產(chǎn)生紊亂,聲音識(shí)別的處理精度也被穩(wěn)健化。因此,預(yù)計(jì)聲音識(shí)別的正確率也提高。
1.一種聲音識(shí)別裝置,其對(duì)在制造現(xiàn)場(chǎng)輸入的聲音信號(hào)進(jìn)行聲音識(shí)別并用作聲音命令,其特征在于,
2.根據(jù)權(quán)利要求1所述的聲音識(shí)別裝置,其特征在于,
3.根據(jù)權(quán)利要求1或2所述的聲音識(shí)別裝置,其特征在于,
4.根據(jù)權(quán)利要求3所述的聲音識(shí)別裝置,其特征在于,
5.根據(jù)權(quán)利要求3所述的聲音識(shí)別裝置,其特征在于,
6.根據(jù)權(quán)利要求3至5中的任一項(xiàng)所述的聲音識(shí)別裝置,其特征在于,
7.根據(jù)權(quán)利要求1至6中的任一項(xiàng)所述的聲音識(shí)別裝置,其特征在于,
8.根據(jù)權(quán)利要求3至6中的任一項(xiàng)所述的聲音識(shí)別裝置,其特征在于,
9.一種計(jì)算機(jī)可讀取的記錄介質(zhì),其記錄由聲音識(shí)別裝置執(zhí)行的程序,所述聲音識(shí)別裝置對(duì)在制造現(xiàn)場(chǎng)輸入的聲音信號(hào)進(jìn)行聲音識(shí)別并用作聲音命令,其特征在于,