專利名稱:操作系統(tǒng)及方法
技術(shù)領(lǐng)域:
本發(fā)明是關(guān)于一種操作系統(tǒng)及方法,特別是關(guān)于一種語(yǔ)音信息處理操作系統(tǒng)及方法,應(yīng)用在計(jì)算機(jī)環(huán)境中,使用者可利用容易使用的操作接口輸入語(yǔ)音信息,容易使用的操作接口將輸入的語(yǔ)音信息轉(zhuǎn)換成輸入信號(hào),并將此輸入信號(hào)傳送到此操作系統(tǒng)的語(yǔ)音識(shí)別模塊,語(yǔ)音識(shí)別模塊將處理此輸入信號(hào)并配合語(yǔ)音數(shù)據(jù)庫(kù)以及接口處理模塊,將處理后的結(jié)果展現(xiàn)在容易使用的操作接口上,即便使用者對(duì)于操作系統(tǒng)操作接口不熟悉,仍能以最簡(jiǎn)便、快捷的方式來(lái)服務(wù)使用者,并且,使用者將能夠以語(yǔ)音信息輸入的形式找出資料、輸入資料以及激活所需的程序。
背景技術(shù):
現(xiàn)有的操作系統(tǒng),無(wú)論是微軟(Microsoft)公司的Windows操作系統(tǒng)系列,例如Win.XP,Win.2000,Win.98等,抑或是Linux以及Unix操作系統(tǒng),當(dāng)操作系統(tǒng)開(kāi)始運(yùn)行后,通常在屏幕上,會(huì)出現(xiàn)由圖像(icon)組成的畫(huà)面,當(dāng)使用者利用鼠標(biāo)抑或鍵盤(pán)點(diǎn)選某些圖像后將出現(xiàn)選單,例如,在微軟操作系統(tǒng)中,點(diǎn)選[開(kāi)始]圖像后將出現(xiàn)選項(xiàng),而此選項(xiàng)包括[程序集、文件、設(shè)定、搜尋、說(shuō)明、執(zhí)行]等項(xiàng)目,使用者可利用鼠標(biāo)抑或鍵盤(pán)來(lái)點(diǎn)選選單中的項(xiàng)目,所點(diǎn)選出的項(xiàng)目將以窗口的形式展現(xiàn)開(kāi)啟。
當(dāng)使用者不熟悉操作系統(tǒng)時(shí),常常必須花很多的時(shí)間在點(diǎn)選圖像、選項(xiàng)上,以找出、激活所需的程序抑或資料,所以,對(duì)使用者而言經(jīng)常造成不便。并且,當(dāng)使用者不方便使用鼠標(biāo)抑或鍵盤(pán)來(lái)點(diǎn)選圖像、選項(xiàng)時(shí),使用者將無(wú)法以語(yǔ)音信息輸入的形式來(lái)找出、激活所需的資料抑或程序。也就是,如果使用現(xiàn)有的操作系統(tǒng),使用者將無(wú)法以語(yǔ)音信息輸入的形式來(lái)找出資料、輸入資料以及激活所需的程序。
所以,如何克服上述現(xiàn)有操作系統(tǒng)及方法,當(dāng)使用者對(duì)于操作系統(tǒng)操作接口不熟悉時(shí),如何能以最簡(jiǎn)便、快捷的方式來(lái)服務(wù)使用者,以及使用者無(wú)法以語(yǔ)音信息輸入的形式來(lái)找出資料、輸入資料以及激活所需的程序,是現(xiàn)有的操作系統(tǒng)待解決的問(wèn)題。
發(fā)明內(nèi)容
為克服上述現(xiàn)有技術(shù)的缺點(diǎn),本發(fā)明的主要目的便是在于提供一種操作系統(tǒng)及方法,應(yīng)用在計(jì)算機(jī)環(huán)境中,當(dāng)使用者利用容易使用操作接口而輸入語(yǔ)音信息后,此操作系統(tǒng)將依由容易使用操作接口而來(lái)的輸入信號(hào),而激活語(yǔ)音處理模塊以便處理這些信號(hào),并將處理后的結(jié)果展現(xiàn)于容易使用操作接口上,以讓使用者明了操作過(guò)程、結(jié)果,無(wú)論使用者熟悉計(jì)算機(jī)系統(tǒng)與否,使用者可輕松地依容易使用操作接口而輸入語(yǔ)音信息,以進(jìn)行所需的工作。
本發(fā)明的又一目的便是在于提供一種操作系統(tǒng)及方法,應(yīng)用在計(jì)算機(jī)環(huán)境中,當(dāng)使用者對(duì)于操作系統(tǒng)操作接口不熟悉時(shí),能以最簡(jiǎn)便、快捷的方式,以及容易使用操作接口來(lái)服務(wù)使用者。
本發(fā)明的再一目的便是在于提供一種操作系統(tǒng)及方法,應(yīng)用在計(jì)算機(jī)環(huán)境中,使用者將能以語(yǔ)音信息輸入的形式來(lái)找出資料、輸入資料、以及激活所需的程序。
本發(fā)明的再一目的便是在于提供一種操作系統(tǒng)及方法,應(yīng)用在計(jì)算機(jī)環(huán)境中,使用者將能以語(yǔ)音信息輸入的形式來(lái)激活所需的程序。
根據(jù)以上所述的目的,本發(fā)明提供了一種新穎的操作系統(tǒng)及方法。本發(fā)明的操作系統(tǒng)包括一語(yǔ)音識(shí)別處理模塊,該語(yǔ)音處理模塊接收到輸入信號(hào)后,將對(duì)輸入信號(hào)中的至少一個(gè)的語(yǔ)音音包做處理,當(dāng)輸入信號(hào)含有一個(gè)以上的語(yǔ)音音包時(shí),語(yǔ)音識(shí)別模塊對(duì)一個(gè)以上的語(yǔ)音音包予以切割成各別單一的語(yǔ)音音包,語(yǔ)音識(shí)別處理模塊將依照語(yǔ)音數(shù)據(jù)庫(kù)中的語(yǔ)音識(shí)別原則,對(duì)單一語(yǔ)音音包波形信號(hào)予以各別進(jìn)行分析,以取出各別語(yǔ)音音包的各項(xiàng)特征參數(shù),將各個(gè)語(yǔ)音音包分成子音、風(fēng)聲以及元音部份;語(yǔ)音識(shí)別處理模塊利用語(yǔ)音識(shí)別原則對(duì)各個(gè)語(yǔ)音音包的子音、風(fēng)聲、以及元音部份分別進(jìn)行識(shí)別、處理,以及組合子音與元音部份;語(yǔ)音識(shí)別處理模塊并將由各個(gè)語(yǔ)音音包所識(shí)別出的子音以及元音所組成的語(yǔ)音組合與語(yǔ)音數(shù)據(jù)庫(kù)中的語(yǔ)音對(duì)應(yīng)資料進(jìn)行對(duì)比,以得出語(yǔ)音組合所對(duì)應(yīng)的信息為何,語(yǔ)音識(shí)別處理模塊并將所得出的信息傳遞給接口處理模塊;一語(yǔ)音數(shù)據(jù)庫(kù),該語(yǔ)音數(shù)據(jù)庫(kù)含有一語(yǔ)音識(shí)別原則以及語(yǔ)音對(duì)應(yīng)資料,該語(yǔ)音識(shí)別原則是用來(lái)識(shí)別子音、風(fēng)聲以及元音,該語(yǔ)音對(duì)應(yīng)資料是用來(lái)對(duì)比出子音與元音組合部份的信息為何;以及一接口處理模塊,該接口處理模塊根據(jù)所接收到來(lái)自于語(yǔ)音識(shí)別處理模塊的信息,而調(diào)用其它程序來(lái)執(zhí)行使用者所需的動(dòng)作,接口處理模塊并將處理、執(zhí)行結(jié)果經(jīng)由容易使用操作接口而提供給使用者。
在進(jìn)行操作方法過(guò)程時(shí),當(dāng)操作系統(tǒng)開(kāi)始運(yùn)作后,使用者利用容易使用操作接口而輸入語(yǔ)音信息后,容易使用操作接口將輸入的語(yǔ)音信息轉(zhuǎn)換為輸入信號(hào),此輸入信號(hào)為使用者所輸入的語(yǔ)音信息所對(duì)應(yīng)的物理表征波形信號(hào),容易使用操作接口并將此輸入信號(hào)(物理表征波形信號(hào))傳送到操作系統(tǒng)的語(yǔ)音識(shí)別模塊。此輸入信號(hào)為物理表征波形,待語(yǔ)音識(shí)別模塊接收到此物理表征波形信號(hào)后,將依照語(yǔ)音數(shù)據(jù)庫(kù)中的語(yǔ)音識(shí)別原則,對(duì)語(yǔ)音信息所對(duì)應(yīng)的波形信號(hào)的表征波形物理特性進(jìn)行分析,以取出此物理表征波形的各項(xiàng)特征參數(shù)將此物理表征波形信號(hào)中的語(yǔ)音音包分成子音、風(fēng)聲以及元音部份,并取出語(yǔ)音音包的首頻以及尾頻,利用語(yǔ)音識(shí)別原則對(duì)子音、風(fēng)聲以及元音部份分別進(jìn)行識(shí)別,以判斷出子音以及元音為何。該語(yǔ)音識(shí)別原則乃以首頻、尾頻的運(yùn)算判斷法則,配合元音部份的頻率以及波形振幅外廓變化情形,而識(shí)別出中文語(yǔ)音中的四聲變化,語(yǔ)音識(shí)別原則并可將識(shí)別出的子音、元音部份,也或子音、元音部份以及四聲變化予以組合,將所得出的語(yǔ)音組合與語(yǔ)音數(shù)據(jù)庫(kù)中的語(yǔ)音對(duì)應(yīng)資料進(jìn)行對(duì)比,以得出語(yǔ)音所對(duì)應(yīng)的信息為何,然后,即由該語(yǔ)音識(shí)別處理模塊將所得出的信息傳遞給接口處理模塊。接口處理模塊根據(jù)所接收到來(lái)自于語(yǔ)音識(shí)別處理模塊的信息,即調(diào)用其它程序來(lái)進(jìn)行找出資料及/或輸入資料及/或激活所需的程序的動(dòng)作,接口處理模塊將配合其它程序,將處理及執(zhí)行結(jié)果展現(xiàn)在容易使用操作接口上,抑或通過(guò)容易使用操作接口而以語(yǔ)音的形式提供給使用者,以讓使用者進(jìn)行進(jìn)一步的動(dòng)作。
語(yǔ)音識(shí)別原則將語(yǔ)音音包區(qū)分為子音、風(fēng)聲以及元音部份,并對(duì)整個(gè)語(yǔ)音音包進(jìn)行處理而取出首頻以及尾頻,對(duì)子音、風(fēng)聲以及元音部份分別進(jìn)行識(shí)別、處理以及組合。將子音以及元音予以組合后,應(yīng)用語(yǔ)音識(shí)別原則,對(duì)由子音與元音所構(gòu)成的語(yǔ)音以及語(yǔ)音對(duì)應(yīng)資料進(jìn)行對(duì)比,以得到使用者所輸入的語(yǔ)音信息所對(duì)應(yīng)的信息為何。應(yīng)用語(yǔ)音識(shí)別原則,對(duì)整個(gè)語(yǔ)音音包的載波以及其上的調(diào)變鋸齒波邊緣,做分析處理而可得到語(yǔ)音的音色特征。除了能利用子音以及元音的組合,而識(shí)別出語(yǔ)音音包所對(duì)應(yīng)的信息外,尚能利用首頻、尾頻的運(yùn)算判斷法則,配合元音部份的頻率以及波形振幅外廓變化情形,識(shí)別出中文語(yǔ)音中的四聲變化。以子音以及元音的組合,加上中文語(yǔ)音中的四聲變化,而得以正確地識(shí)別出中文發(fā)音所對(duì)應(yīng)的信息。也就是,應(yīng)用語(yǔ)音識(shí)別原則除了可識(shí)別出無(wú)四聲變化的語(yǔ)音所對(duì)應(yīng)的信息,例如,無(wú)四聲變化的西方語(yǔ)音之外,尚可識(shí)別出具有四聲變化的中文語(yǔ)音所對(duì)應(yīng)出的信息。
應(yīng)用本操作系統(tǒng)時(shí),除了能讓對(duì)于操作系統(tǒng)操作接口不熟悉的使用者,能以最簡(jiǎn)便、快捷的方式,以及容易使用操作的形式來(lái)操作使用操作系統(tǒng),并可讓使用者能以語(yǔ)音信息輸入的形式來(lái)找出資料、輸入資料以及激活所需的程序。況且,可在無(wú)須預(yù)先建立每個(gè)人專屬的語(yǔ)音識(shí)別數(shù)據(jù)庫(kù)的形態(tài)下,應(yīng)用識(shí)別語(yǔ)音原則,以通用的語(yǔ)音對(duì)應(yīng)資料,來(lái)分析、判別語(yǔ)音所對(duì)應(yīng)的表征波形的物理特性,而能判斷出語(yǔ)音所對(duì)應(yīng)的信息,讓每一個(gè)使用者均能以個(gè)人語(yǔ)音信息的輸入方式來(lái)與此操作系統(tǒng)做溝通、并執(zhí)行使用者所需的工作。
圖1是一系統(tǒng)方塊圖,顯示應(yīng)用本發(fā)明的操作系統(tǒng)的系統(tǒng)基本組織架構(gòu)的方塊模塊圖,以及此操作系統(tǒng)與容易使用操作接口以及其它程序的運(yùn)作形式;圖2(a)是一示意圖,用以解釋在圖1中輸入信號(hào)的語(yǔ)音音包的組成特性結(jié)構(gòu);圖2(b)是一示意圖,用以解釋圖1中輸入信號(hào)的語(yǔ)音音包的子音、風(fēng)聲以及元音部份;圖2(c)是一示意圖,解釋圖2(b)中子音區(qū)的爆發(fā)音的波形特性;圖2(d)是一示意圖,解釋圖2(b)中子音區(qū)的爆擦音的波形特性;
圖3是一示意圖,用以解釋圖2(b)中的語(yǔ)音波形的元音部份的組成特性結(jié)構(gòu);圖4為一示意圖,用以解釋圖2(b)中的物理表征波形信號(hào)的語(yǔ)音音包的元音部份的組成特征參數(shù);圖5是一示意圖,是關(guān)于中文四聲聲調(diào)變化的聲調(diào)頻率統(tǒng)計(jì);圖6是一運(yùn)作流程圖,顯示應(yīng)用在圖1中的操作系統(tǒng)進(jìn)行作業(yè)方法的流程程序;圖7是一運(yùn)作流程圖,用以更詳細(xì)地解釋圖6中的物理表征波形信號(hào)進(jìn)行分析、處理以及識(shí)別步驟的一流程程序;圖8是一運(yùn)作流程圖,用以更詳細(xì)地解釋圖6中的物理表征波形信號(hào)進(jìn)行分析、處理以及識(shí)別步驟的另一流程程序;圖9是一運(yùn)作流程圖,其中顯示應(yīng)用本發(fā)明的操作系統(tǒng)及方法的一實(shí)施例運(yùn)作的流程程序;圖10是一示意圖,用以展現(xiàn)容易使用操作接口的屏幕上所顯示出的一畫(huà)面;圖11是一示意圖,用以顯示當(dāng)使用者輸入語(yǔ)音信息后,在容易使用操作接口的屏幕上顯示出的一畫(huà)面;圖12是一運(yùn)作流程圖,其中顯示應(yīng)用本發(fā)明的操作系統(tǒng)及方法的另一實(shí)施例運(yùn)作的流程程序;圖13是一示意圖,用以展現(xiàn)在容易使用操作接口的屏幕上所顯示出的另一畫(huà)面;圖14是一示意圖,用以顯示當(dāng)使用者輸入語(yǔ)音信息后,在容易使用操作接口的屏幕上所顯示出的另一畫(huà)面;圖15是一運(yùn)作流程圖,其中顯示應(yīng)用本發(fā)明的操作系統(tǒng)及方法的再一實(shí)施例運(yùn)作的流程程序;圖16是一示意圖,用以展現(xiàn)在容易使用操作接口的屏幕上所顯示出的再一畫(huà)面;以及圖17是一示意圖,用以顯示當(dāng)使用者輸入語(yǔ)音信息后,在容易使用操作接口的屏幕上所顯示出的再一畫(huà)面。
具體實(shí)施例方式
實(shí)施例以下即配合附圖,詳細(xì)說(shuō)明本發(fā)明的操作系統(tǒng)及方法的實(shí)施例。
圖1為一系統(tǒng)方塊圖,其中顯示應(yīng)用本發(fā)明的操作系統(tǒng)的系統(tǒng)基本組織架構(gòu)的方塊模塊圖,以及此操作系統(tǒng)與容易使用操作接口以及其它程序的運(yùn)作形式。如圖1所示,操作系統(tǒng)1與容易使用操作接口6做連接,操作系統(tǒng)1包括語(yǔ)音識(shí)別處理模塊2、語(yǔ)音數(shù)據(jù)庫(kù)3以及接口處理模塊4,容易使用操作接口6則包括屏幕61、語(yǔ)音轉(zhuǎn)換裝置62以及鍵盤(pán)63。
使用者利用容易使用操作接口6輸入語(yǔ)音信息11后,容易使用操作接口6將輸入的語(yǔ)音信息11轉(zhuǎn)換為表征波形21,此表征波形21為使用者所輸入的語(yǔ)音信息11所對(duì)應(yīng)的物理表征波形信號(hào),容易使用操作接口6并將此表征波形21傳送到操作系統(tǒng)1的語(yǔ)音識(shí)別處理模塊2。
語(yǔ)音識(shí)別處理模塊2接收到此物理表征波形21后,將依照語(yǔ)音數(shù)據(jù)庫(kù)3中的語(yǔ)音識(shí)別原則31,對(duì)語(yǔ)音信息11所對(duì)應(yīng)波形信號(hào)的表征波形21物理特性進(jìn)行分析,以提取出此物理表征波形21的各項(xiàng)特征參數(shù),將此物理表征波形21信號(hào)中的語(yǔ)音音包22分成子音201、風(fēng)聲202以及元音203部份(請(qǐng)參閱圖2(a)及圖2(b)),并取出語(yǔ)音音包22的首頻301以及尾頻302,利用語(yǔ)音識(shí)別原則31對(duì)子音201、風(fēng)聲202以及元音203部份分別進(jìn)行識(shí)別,以判斷出子音以及元音為何,語(yǔ)音識(shí)別原則31并以首頻301、尾頻302的運(yùn)算判斷法則,配合元音203部份的頻率以及波形振幅外廓變化情形,識(shí)別出中文語(yǔ)音中的四聲變化,語(yǔ)音識(shí)別原則31可將識(shí)別出的子音201、元音203部份,也或子音201、元音部份203以及四聲變化予以組合,并將得出的語(yǔ)音組合與語(yǔ)音數(shù)據(jù)庫(kù)3中的語(yǔ)音對(duì)應(yīng)資料32進(jìn)行對(duì)比,以得出語(yǔ)音所對(duì)應(yīng)的信息為何,語(yǔ)音識(shí)別處理模塊2并將得出的信息傳遞給接口處理模塊4。
語(yǔ)音識(shí)別原則31將語(yǔ)音音包22區(qū)分為子音201、風(fēng)聲202以及元音203部份,并對(duì)整個(gè)語(yǔ)音音包22進(jìn)行處理而取出首頻301以及尾頻302,對(duì)子音201、風(fēng)聲202以及元音203部份分別進(jìn)行識(shí)別、處理以及組合。將子音201以及元音203予以組合后,應(yīng)用語(yǔ)音識(shí)別原則31,對(duì)由子音201與元音203所構(gòu)成的語(yǔ)音以及語(yǔ)音對(duì)應(yīng)資料32進(jìn)行對(duì)比,以得到使用者輸入的語(yǔ)音信息11所對(duì)應(yīng)的信息為何。應(yīng)用語(yǔ)音識(shí)別原則31,對(duì)整個(gè)語(yǔ)音音包22的載波以及其上的調(diào)變鋸齒波邊緣,做分析處理而可得到語(yǔ)音的音色特征。除了能利用子音201以及元音203的組合,而識(shí)別出語(yǔ)音音包22所對(duì)應(yīng)的信息外,尚能利用首頻301、尾頻302的運(yùn)算判斷法則,配合元音203部份的頻率以及波形振幅外廓變化情形,識(shí)別出中文語(yǔ)音中的四聲變化。以子音201以及元音203的組合,加上中文語(yǔ)音中的四聲變化,能夠正確地識(shí)別出中文發(fā)音所對(duì)應(yīng)的信息。也就是,應(yīng)用語(yǔ)音識(shí)別原則31除了可識(shí)別出無(wú)四聲變化的語(yǔ)音所對(duì)應(yīng)的信息,例如,無(wú)四聲變化的西方語(yǔ)音之外,還可識(shí)別出具有四聲變化的中文語(yǔ)音所對(duì)應(yīng)出的信息。
對(duì)于西方語(yǔ)言語(yǔ)音而言,無(wú)四聲變化的情況,應(yīng)用語(yǔ)音識(shí)別原則31,對(duì)由子音201與元音203所構(gòu)成的語(yǔ)音以及語(yǔ)音對(duì)應(yīng)資料32進(jìn)行對(duì)比,以得到使用者所輸入的語(yǔ)音信息11所對(duì)應(yīng)的信息為何。
對(duì)于具有四聲變化的中文語(yǔ)音而言,除了能利用子音201以及元音203的組合,而識(shí)別出語(yǔ)音音包22所對(duì)應(yīng)的信息外,對(duì)于中文語(yǔ)音而言,尚能利用首頻301、尾頻302的運(yùn)算判斷法則,配合元音203部份的頻率以及波形振幅外廓變化情形,識(shí)別出中文語(yǔ)音中的四聲變化;以子音201以及元音203的組合,加上中文語(yǔ)音中的四聲變化,從而得以正確地識(shí)別出中文發(fā)音所對(duì)應(yīng)的信息。
語(yǔ)音數(shù)據(jù)庫(kù)3中的語(yǔ)音識(shí)別原則31,將于圖2(a)至圖2(d)、圖3、圖4以及圖5中予以說(shuō)明。
接口處理模塊4根據(jù)接收到來(lái)自于語(yǔ)音識(shí)別處理模塊2的信息,調(diào)用其它程序進(jìn)行找出資料及/或輸入資料及/或激活所需的程序的動(dòng)作,接口處理模塊4將配合其它程序7、8、9,將處理、執(zhí)行結(jié)果展現(xiàn)在容易使用操作接口6上,抑或通過(guò)容易使用操作接口6以語(yǔ)音的形式提供給使用者,讓使用者可進(jìn)行進(jìn)一步的動(dòng)作。
可在無(wú)須預(yù)先建立每個(gè)人專屬的語(yǔ)音識(shí)別數(shù)據(jù)庫(kù)的形態(tài)下,應(yīng)用識(shí)別語(yǔ)音原則31,以通用的語(yǔ)音對(duì)應(yīng)資料,來(lái)分析、判別語(yǔ)音所對(duì)應(yīng)的表征波形21的物理特性,從而能判斷出語(yǔ)音所對(duì)應(yīng)的信息,讓每一個(gè)使用者均能以個(gè)人語(yǔ)音信息的輸入方式與此操作系統(tǒng)做溝通、并執(zhí)行使用者所需的工作。
圖2(a)為一示意圖,用以解釋在圖1中表征波形的語(yǔ)音音包的組成特性結(jié)構(gòu)。如圖2(a)所示,物理表征波形21的語(yǔ)音音包22可分為前段、中段以及后段,風(fēng)聲202和子音201區(qū)都位于前段的區(qū)域內(nèi),緊接在風(fēng)聲202和子音201區(qū)之后的即是元音203區(qū),而風(fēng)聲202的頻率比子音201和元音203高出許多。在語(yǔ)音音包22之前1/4區(qū)域內(nèi),任取幾個(gè)音包的平均頻率即可得到首頻301,在語(yǔ)音音包22的最后1/4區(qū)域內(nèi),任取幾個(gè)音包的平均頻率即可得到尾頻302。圖中也顯示出語(yǔ)音音包22的載波以及其上的調(diào)變鋸齒波邊緣以及語(yǔ)音音包22的振幅音量變化。
圖2(b)為一示意圖,用以解釋在圖1中表征波形的語(yǔ)音音包的子音、風(fēng)聲以及元音部份。如圖2(a)所示,一般物理表征波形21的語(yǔ)音音包22可分為子音20l部份、風(fēng)聲202部份以及元音203部份。
一般的子音201部份,可由子音波形而分成漸近音、爆擦音、擠壓音以及爆發(fā)音。漸近音的特征為子音波形的前后僅有音量的增減,例如,中文的注音符號(hào)的ㄏ、ㄒ、ㄖ、ㄙ;爆擦音的特征為子音波形的一段余音后,將變?yōu)樵舨ㄐ?,也就是,爆擦音子音波形的一段余音后將連接一元音波形,例如,中文的注音符號(hào)的ㄇ、ㄈ、ㄋ、 ㄐ;擠壓音的特征為子音波形為較慢的爆發(fā)音,例如,中文的注音符號(hào)的ㄓ、ㄗ;而爆發(fā)音的特征為子音波形具有二個(gè)至數(shù)個(gè)立即放大的波峰,例如,中文的注音符號(hào)的ㄅ、ㄆ、ㄉ、ㄊ、ㄍ、ㄎ、ㄑ。風(fēng)聲202部份的頻率比子音和元音高出許多。元音203部份為緊接在子音201后的波形區(qū)域。
圖2(c)為一示意圖,用以解釋在圖2(b)中子音區(qū)的爆發(fā)音的波形特性。爆發(fā)音的特征為子音波形具有二個(gè)至數(shù)個(gè)立即放大的波峰,例如,中文的注音符號(hào)的ㄅ、ㄆ、ㄉ、ㄊ、巜、ㄎ、ㄑ。
圖2(d)為一示意圖,用以解釋在圖2(b)中子音區(qū)的爆擦音的波形特性。爆擦音的特征為子音波形的一段余音后,將變?yōu)樵舨ㄐ?,也就是,爆擦音子音波形的一段余音后將連接一元音波形,例如,中文的注音符號(hào)的ㄇ、ㄈ、ㄋ、 ㄐ。
圖3為一示意圖,用以解釋在圖2(b)中的語(yǔ)音波形的元音部份的組成特性結(jié)構(gòu)。如圖3中所示,在元音203部份中所重復(fù)出現(xiàn)的音包波形區(qū)域,稱之為元音包,即圖中的元音包23。元音包0為元音剛開(kāi)始形成時(shí)所產(chǎn)生的元音小音包,而元音包1至3則為元音開(kāi)始重復(fù)時(shí)所產(chǎn)生的元音小音包,而對(duì)于之后的元音包(例如4)則依此類(lèi)推。在此,所謂的切割音包,就是將元音波形分割出多個(gè)獨(dú)立元音小音包(230、231、232及233),即元音包。
圖4為一示意圖,用以解釋在圖2(b)中的物理表征波形的語(yǔ)音音包的元音部份的組成特征參數(shù)。如圖4所示,根據(jù)分割出的元音包可找出特征參數(shù),例如,轉(zhuǎn)折數(shù)、波數(shù)以及斜率。在此,所謂的轉(zhuǎn)折數(shù),為圖中波形有方框的部份,方框中的轉(zhuǎn)折處稱之為轉(zhuǎn)折點(diǎn)。至于波數(shù)則為元音包中波形通過(guò)X方向零軸的次數(shù),以圖為例,波形共有四個(gè)過(guò)零,即波數(shù)為4。斜率則為圖中的1c號(hào)方框和2c號(hào)方框之間的斜率或取樣個(gè)數(shù)。得到以上三個(gè)元音包參數(shù)后,以規(guī)則來(lái)識(shí)別出元音。例如,ㄚ為波數(shù)>=斜率,若不符合此情況則為ㄛ;或ㄚ為波數(shù)>=6,轉(zhuǎn)折數(shù)<10,若不符合此情況則為ㄧ。ㄝ為轉(zhuǎn)折數(shù)>波數(shù);或ㄝ為波數(shù)=3,轉(zhuǎn)折數(shù)<13,若不符合此情況則為ㄧ。ㄧ為轉(zhuǎn)折數(shù)>波數(shù);或ㄧ為波數(shù)=4,5,轉(zhuǎn)折數(shù)>3倍波數(shù)。ㄛ為波數(shù)=3,轉(zhuǎn)折數(shù)<6。ㄨ為波數(shù)=2,轉(zhuǎn)折數(shù)<5若不符合此情況則為ㄧ;或波數(shù)=1,轉(zhuǎn)折數(shù)<7,若不符合此情況則為ㄧ。
在判斷四聲變化時(shí),在語(yǔ)音音包的前1/4區(qū)域內(nèi),任取幾個(gè)音包的平均頻率即可得到首頻,而在語(yǔ)音音包的最后1/4區(qū)域內(nèi),任取幾個(gè)音包的平均頻率即可得到尾頻。
所謂″相差幾點(diǎn)″的「點(diǎn)」是指取樣的點(diǎn)數(shù),與頻率有關(guān),例如以11KHz為取樣頻率,則相當(dāng)于每1/11000秒會(huì)有一個(gè)取樣點(diǎn),即于1秒取樣時(shí)間內(nèi)有11K個(gè)取樣點(diǎn),而若以50KHz為取樣頻率,則相當(dāng)于每1/50000秒會(huì)有一個(gè)取樣點(diǎn),即于1秒取樣時(shí)間內(nèi)有50K個(gè)取樣點(diǎn),也就是于1秒的時(shí)間內(nèi),取樣點(diǎn)的數(shù)目即為頻率數(shù)字。
待取出首頻以及尾頻后,利用判斷規(guī)則1.當(dāng)首頻以及尾頻相差四點(diǎn),將可判得語(yǔ)音聲調(diào)為中文字發(fā)音的一聲;2.當(dāng)首頻以及尾頻相差五點(diǎn),并且首頻高于尾頻時(shí),將可判得語(yǔ)音聲調(diào)為中文字發(fā)音的一聲,也或二聲;3.當(dāng)尾頻高于首頻,且尾頻減去首頻的值大于首頻的一半時(shí),將可判得語(yǔ)音聲調(diào)為中文字發(fā)音的四聲;以及4.將用首頻以及尾頻來(lái)分辨中文字發(fā)音的三聲以及四聲;若女生所發(fā)出的語(yǔ)音聲調(diào)的首頻小于38點(diǎn)時(shí),則將所判得的聲調(diào)歸為四聲;若女生所發(fā)出的語(yǔ)音聲調(diào)的首頻大于60點(diǎn)時(shí),則將所判得的聲調(diào)歸為三聲;若男生所發(fā)出的語(yǔ)音聲調(diào)的首頻小于80點(diǎn)時(shí),則將所判得的聲調(diào)歸為四聲;以及,若男生所發(fā)出的語(yǔ)音聲調(diào)的首頻大于92點(diǎn)時(shí),則將所判得的聲調(diào)歸為三聲。
在判別音色時(shí),對(duì)整個(gè)語(yǔ)音音包的載波以及其上的調(diào)變鋸齒波邊緣,做分析處理可得到語(yǔ)音的音色特征。語(yǔ)音音包的載波為語(yǔ)音波形的鋸齒狀邊緣,每個(gè)人所發(fā)出的語(yǔ)音所對(duì)應(yīng)的波形的語(yǔ)音音包上的載波的頻率以及振幅變化均不相同,應(yīng)用識(shí)別語(yǔ)音原則對(duì)整個(gè)語(yǔ)音音包做分析處理可得到語(yǔ)音的音色特征。
圖5為一示意圖,為關(guān)于中文四聲聲調(diào)變化的聲調(diào)頻率統(tǒng)計(jì)。如圖5所示,例如,當(dāng)發(fā)聲聲調(diào)頻率介于259Hz至344Hz之間時(shí),所發(fā)聲調(diào)為一聲;當(dāng)發(fā)聲聲調(diào)頻率介于182Hz至196Hz之間時(shí),所發(fā)聲調(diào)為二聲;當(dāng)發(fā)聲聲調(diào)頻率介于220Hz至225Hz之間時(shí),所發(fā)聲調(diào)為三聲;以及,當(dāng)發(fā)聲聲調(diào)頻率介于176Hz至206Hz之間時(shí),所發(fā)聲調(diào)為四聲。
圖6為一運(yùn)作流程圖,其中顯示應(yīng)用在圖1中的操作系統(tǒng)以進(jìn)行作業(yè)方法的流程程序。如圖6所示,首先,在步驟41,使用者利用容易使用操作接口6輸入語(yǔ)音信息11,容易使用操作接口6將輸入的語(yǔ)音信息11轉(zhuǎn)換為表征波形21,此表征波形21為使用者所輸入的語(yǔ)音信息11所對(duì)應(yīng)的物理表征波形信號(hào),容易使用操作接口6并將此表征波形21傳送到操作系統(tǒng)1的語(yǔ)音識(shí)別處理模塊2,并進(jìn)到步驟42。
在步驟42,語(yǔ)音識(shí)別處理模塊2接收到此物理表征波形21后,將依照語(yǔ)音數(shù)據(jù)庫(kù)3中的語(yǔ)音識(shí)別原則31,對(duì)語(yǔ)音信息11所對(duì)應(yīng)的波形信號(hào)的物理表征波形21物理特性進(jìn)行分析以及處理,語(yǔ)音識(shí)別處理模塊2配合語(yǔ)音數(shù)據(jù)庫(kù)3中的語(yǔ)音識(shí)別原則31以及語(yǔ)音對(duì)應(yīng)資料32,將識(shí)別出表征波形21所對(duì)應(yīng)的信息為何,語(yǔ)音識(shí)別處理模塊2并將所得出的信息傳遞給接口處理模塊4,并進(jìn)到步驟43。
在步驟43,接口處理模塊4根據(jù)接收到來(lái)自于語(yǔ)音識(shí)別處理模塊2的信息,調(diào)用其它程序7、8、9進(jìn)行找出資料及/或輸入資料及/或激活所需的程序的動(dòng)作,接口處理模塊4將配合其它程序7、8、9,將處理、執(zhí)行結(jié)果展現(xiàn)在容易使用操作接口6上,抑或通過(guò)容易使用操作接口6以語(yǔ)音的形式提供給使用者,讓使用者可進(jìn)行下一步的動(dòng)作。
圖7為一運(yùn)作流程圖,用以更詳細(xì)地解釋在圖6中的物理表征波形進(jìn)行分析、處理以及識(shí)別步驟的一流程程序。如圖7所示,在步驟421,語(yǔ)音識(shí)別處理模塊2將依照語(yǔ)音數(shù)據(jù)庫(kù)3中的語(yǔ)音識(shí)別原則31,對(duì)語(yǔ)音信息11所對(duì)應(yīng)的波形信號(hào)的表征波形21物理特性進(jìn)行分析,以取出此物理表征波形21的各項(xiàng)特征參數(shù),將此物理表征波形21信號(hào)中的語(yǔ)音音包22分成子音201、風(fēng)聲202以及元音203部份,并進(jìn)到步驟422。
在步驟422,語(yǔ)音識(shí)別處理模塊2利用語(yǔ)音識(shí)別原則31對(duì)語(yǔ)音音包22的子音201、風(fēng)聲202以及元音203部份分別進(jìn)行識(shí)別、處理以及組合;語(yǔ)音識(shí)別處理模塊2并根據(jù)語(yǔ)音識(shí)別原則31,對(duì)語(yǔ)音音包22進(jìn)行子音201、風(fēng)聲202以及元音203部份分別進(jìn)行識(shí)別,針對(duì)子音201、風(fēng)聲202以及元音203所具有的波形特征進(jìn)行判斷、分析,以得出子音以及元音為何,語(yǔ)音識(shí)別原則31并可將識(shí)別出的子音201、元音203部份予以組合,并進(jìn)到步驟423。
在步驟423,語(yǔ)音識(shí)別處理模塊2并將所得出的語(yǔ)音組合與語(yǔ)音數(shù)據(jù)庫(kù)3中的語(yǔ)音對(duì)應(yīng)資料32進(jìn)行對(duì)比,以得出語(yǔ)音所對(duì)應(yīng)的信息為何,語(yǔ)音識(shí)別處理模塊2并將所得出的信息傳遞給接口處理模塊4,從而結(jié)束對(duì)物理表征波形信號(hào)21的分析、處理以及識(shí)別的過(guò)程。
圖8為一運(yùn)作流程圖,用以更詳細(xì)地解釋在圖6中的物理表征波形信號(hào)進(jìn)行分析、處理以及識(shí)別步驟的另一流程程序。如圖8所示,在步驟431,語(yǔ)音識(shí)別處理模塊2將依照語(yǔ)音數(shù)據(jù)庫(kù)3中的語(yǔ)音識(shí)別原則31,對(duì)語(yǔ)音信息11所對(duì)應(yīng)的波形信號(hào)的表征波形21物理特性進(jìn)行分析,以取出此物理表征波形21的各項(xiàng)特征參數(shù),將此物理表征波形21信號(hào)中的語(yǔ)音音包22分成子音201、風(fēng)聲202以及元音203部份,并取出語(yǔ)音音包22的首頻301以及尾頻302,并進(jìn)到步驟432。
在步驟432,語(yǔ)音識(shí)別處理模塊2利用語(yǔ)音識(shí)別原則31對(duì)語(yǔ)音音包22的子音201、風(fēng)聲202以及元音203部份分別進(jìn)行識(shí)別、處理以及組合,以判斷出子音以及元音為何,語(yǔ)音識(shí)別原則31并以首頻301、尾頻302的運(yùn)算判斷法則,配合元音203部份的頻率以及波形振幅外廓變化情形,識(shí)別出中文語(yǔ)音中的四聲變化,語(yǔ)音識(shí)別原則31并可將識(shí)別出的子音201、元音203部份,也或子音201、元音部份203以及四聲變化予以組合,并進(jìn)到步驟433。
在步驟433,語(yǔ)音識(shí)別處理模塊2并將所得出的語(yǔ)音組合與語(yǔ)音數(shù)據(jù)庫(kù)3中的語(yǔ)音對(duì)應(yīng)資料32進(jìn)行對(duì)比,以得出語(yǔ)音所對(duì)應(yīng)的信息為何,語(yǔ)音識(shí)別處理模塊2并將所得出的信息傳遞給接口處理模塊4,從而結(jié)束對(duì)物理表征波形信號(hào)21的分析、處理以及識(shí)別的過(guò)程。
圖9為一運(yùn)作流程圖,其中顯示應(yīng)用本發(fā)明的操作系統(tǒng)及方法的一實(shí)施例運(yùn)作的流程程序。如圖9所示,首先,在步驟51,在使用者容易操作接口6的屏幕61上將顯現(xiàn)出一人形畫(huà)面64,此人形畫(huà)面64如圖10所示,使用者將對(duì)著容易使用操作接口6的語(yǔ)音轉(zhuǎn)換裝置62輸入語(yǔ)音信息11,在此,使用者所使用的語(yǔ)言為西方語(yǔ)言,而語(yǔ)音信息11為[find a data file xxx.yyy];容易使用操作接口6將輸入的語(yǔ)音信息11轉(zhuǎn)換為表征波形21,此表征波形21為使用者所輸入的語(yǔ)音信息11所對(duì)應(yīng)的物理表征波形信號(hào),容易使用操作接口6并將此物理表征波形21傳送到操作系統(tǒng)1的語(yǔ)音識(shí)別處理模塊2,并進(jìn)到步驟52。
在步驟52,在此,由于使用者所輸入的語(yǔ)音信息11并非為單一單字語(yǔ)音,而是一文句語(yǔ)音,所以,表征波形21的波形為多個(gè)語(yǔ)音音包22所組成,語(yǔ)音識(shí)別模塊2將此文句語(yǔ)音所對(duì)應(yīng)的多個(gè)語(yǔ)音音包22群,予以切割成多個(gè)各別單一的語(yǔ)音音包22,將分別對(duì)單一各別的語(yǔ)音音包22做處理,語(yǔ)音識(shí)別處理模塊2將依照語(yǔ)音數(shù)據(jù)庫(kù)3中的語(yǔ)音識(shí)別原則31,對(duì)各個(gè)單一語(yǔ)音音包22波形信號(hào)的表征波形物理特性予以各別進(jìn)行分析,以取出各別語(yǔ)音音包22的各項(xiàng)特征參數(shù),將各個(gè)語(yǔ)音音包22分成子音201、風(fēng)聲202以及元音203部份,并進(jìn)到步驟53。
在步驟53,語(yǔ)音識(shí)別處理模塊2利用語(yǔ)音識(shí)別原則31對(duì)各個(gè)語(yǔ)音音包22的子音201、風(fēng)聲202以及元音203部份分別進(jìn)行識(shí)別、處理以及組合;語(yǔ)音識(shí)別處理模塊2并根據(jù)語(yǔ)音識(shí)別原則31,對(duì)各個(gè)語(yǔ)音音包22進(jìn)行子音201、風(fēng)聲202以及元音203部份分別進(jìn)行識(shí)別,針對(duì)子音201、風(fēng)聲202以及元音203所具有的波形特征進(jìn)行判斷、分析,以得出各個(gè)語(yǔ)音音包22的子音201以及元音203為何,語(yǔ)音識(shí)別原則31并可將識(shí)別出的各個(gè)語(yǔ)音音包22的子音201、元音203部份予以組合,并進(jìn)到步驟54。
在步驟54,語(yǔ)音識(shí)別處理模塊2并將由各個(gè)語(yǔ)音音包22所識(shí)別出的子音201以及元音203所組成的語(yǔ)音組合與語(yǔ)音數(shù)據(jù)庫(kù)3中的語(yǔ)音對(duì)應(yīng)資料32進(jìn)行對(duì)比,以得出語(yǔ)音組合所對(duì)應(yīng)的信息為何,語(yǔ)音識(shí)別處理模塊2并將所得出的信息傳遞給接口處理模塊4,并進(jìn)到步驟55。
在步驟55,接口處理模塊4根據(jù)所接收到來(lái)自于語(yǔ)音識(shí)別處理模塊2的信息,知道使用者在找尋數(shù)據(jù)文件xxx.yyy而調(diào)用其它程序7,進(jìn)行找出數(shù)據(jù)文件xxx.yyy的動(dòng)作,接口處理模塊4將配合其它程序7,將處理、執(zhí)行結(jié)果展現(xiàn)在容易使用操作接口6的屏幕61上,所展現(xiàn)出來(lái)的畫(huà)面如圖11中所示,讓使用者可進(jìn)行下一步的動(dòng)作。
圖10為一示意圖,用以展現(xiàn)在容易使用操作接口的屏幕上所顯示出的畫(huà)面。如圖10中所示,在容易使用操作接口6的屏幕61上將顯現(xiàn)出一人形圖樣64,使用者可如同與真人對(duì)話一般,通過(guò)容易使用操作接口6的語(yǔ)音轉(zhuǎn)換裝置62輸入語(yǔ)音信息11,而屏幕61也將隨著語(yǔ)音信息11而呈現(xiàn)出不同的畫(huà)面出來(lái)。
圖11為一示意圖,用以顯示當(dāng)使用者輸入語(yǔ)音信息后,在容易使用操作接口的屏幕上所顯示出的畫(huà)面。當(dāng)使用者利用容易使用操作接口6的語(yǔ)音轉(zhuǎn)換裝置62輸入語(yǔ)音信息11,在此,語(yǔ)音信息11為[find adata file xxx.yyy];容易使用操作接口6將輸入的語(yǔ)音信息11轉(zhuǎn)換為表征波形21,此表征波形21為使用者所輸入的語(yǔ)音信息11所對(duì)應(yīng)的物理表征波形信號(hào),容易使用操作接口6并將此表征波形21,也就是,物理表征波形21,傳送到操作系統(tǒng)1中進(jìn)行處理。操作系統(tǒng)1將處理后的結(jié)果展現(xiàn)在容易使用操作接口6的屏幕61上。如圖11所示,在屏幕61上將出現(xiàn)人形圖樣64,以及所搜尋到的數(shù)據(jù)文件xxx.yyy的所在目錄路徑。
圖12為一運(yùn)作流程圖,其中顯示應(yīng)用本發(fā)明的操作系統(tǒng)及方法的另一實(shí)施例運(yùn)作的流程程序。在此,利用對(duì)話框的形式,使用者將進(jìn)行查詢提問(wèn)動(dòng)作,希望能得到所需的答案、說(shuō)明。如圖12所示,首先,在步驟71,在使用者容易使用操作接口6的屏幕61上將顯現(xiàn)出一人形圖樣65以及對(duì)話框66,如圖13所示,使用者將對(duì)著容易使用操作接口6的語(yǔ)音轉(zhuǎn)換裝置62輸入語(yǔ)音信息11,在此,使用者所使用的語(yǔ)言為中文語(yǔ)言,語(yǔ)音信息11為[如何進(jìn)行網(wǎng)絡(luò)聯(lián)機(jī)];容易使用操作接口6將輸入的語(yǔ)音信息11轉(zhuǎn)換為表征波形21,此表征波形21為使用者所輸入的語(yǔ)音信息11所對(duì)應(yīng)的物理表征波形信號(hào),容易使用操作接口6并將此表征波形21,也就是,物理表征波形21,傳送到操作系統(tǒng)1的語(yǔ)音識(shí)別處理模塊2,并進(jìn)到步驟72。
在步驟72,在此,由于使用者所輸入的語(yǔ)音信息11并非為單一單字語(yǔ)音,而是一中文句語(yǔ)音,所以,表征波形21的波形為多個(gè)語(yǔ)音音包22所組成,語(yǔ)音識(shí)別模塊2將此文句語(yǔ)音所對(duì)應(yīng)的多個(gè)語(yǔ)音音包22群,予以切割成多個(gè)各別單一的語(yǔ)音音包22,將分別對(duì)單一各別的語(yǔ)音音包22做處理,語(yǔ)音識(shí)別處理模塊2將依照語(yǔ)音數(shù)據(jù)庫(kù)3中的語(yǔ)音識(shí)別原則31,對(duì)各個(gè)單一語(yǔ)音音包22波形信號(hào)的表征波形物理特性予以各別進(jìn)行分析,以取出各別語(yǔ)音音包22的各項(xiàng)特征參數(shù),將各個(gè)語(yǔ)音音包22分成子音201、風(fēng)聲202以及元音203部份,并取出各個(gè)語(yǔ)音音包22的首頻301以及尾頻302,并進(jìn)到步驟73。
在步驟73,語(yǔ)音識(shí)別處理模塊2利用語(yǔ)音識(shí)別原則31對(duì)各個(gè)語(yǔ)音音包22的子音201、風(fēng)聲202以及元音203部份分別進(jìn)行識(shí)別,針對(duì)子音201、風(fēng)聲202以及元音203所具有的波形特征進(jìn)行判斷、分析,以得出各個(gè)語(yǔ)音音包22的子音201以及元音203為何;語(yǔ)音識(shí)別原則31并以首頻301、尾頻302的運(yùn)算判斷法則,配合各個(gè)語(yǔ)音音包22的元音203部份的頻率以及波形振幅外廓變化情形,而識(shí)別出中文語(yǔ)音中的四聲變化;語(yǔ)音識(shí)別原則31并可將識(shí)別出的各個(gè)語(yǔ)音音包22的子音201、元音203部份予以組合,也或?qū)⒆R(shí)別出的各個(gè)語(yǔ)音音包22的子音201、元音部份203以及四聲變化予以組合,并進(jìn)到步驟74。
在步驟74,語(yǔ)音識(shí)別處理模塊2并將由各個(gè)語(yǔ)音音包22所識(shí)別出的子音201以及元音203所組成的語(yǔ)音組合,以及由子音201、元音部份203以及四聲變化所組成的語(yǔ)音組合,與語(yǔ)音數(shù)據(jù)庫(kù)3中的語(yǔ)音對(duì)應(yīng)資料32進(jìn)行對(duì)比,以得出語(yǔ)音組合所對(duì)應(yīng)的信息為何,語(yǔ)音識(shí)別處理模塊2并將所得出的信息傳遞給接口處理模塊4,并進(jìn)到步驟75。
在步驟75,接口處理模塊4根據(jù)所接收到來(lái)自于語(yǔ)音識(shí)別處理模塊2的信息,知道使用者在查詢[如何進(jìn)行網(wǎng)絡(luò)聯(lián)機(jī)]而調(diào)用其它程序8來(lái)進(jìn)行說(shuō)明的動(dòng)作,接口處理模塊4將配合其它程序8而將處理、執(zhí)行結(jié)果展現(xiàn)在容易使用操作接口6的屏幕61上,所展現(xiàn)出來(lái)的畫(huà)面如圖14所示,讓使用者可進(jìn)行下一步的動(dòng)作。
圖13為一示意圖,用以展現(xiàn)在容易使用操作接口的屏幕上所顯示出的另一畫(huà)面。如圖13所示,在容易使用操作接口6的屏幕61上將顯現(xiàn)出一人形圖樣65以及對(duì)話框66,使用者可如同與真人對(duì)話一般,通過(guò)容易使用操作接口6的語(yǔ)音轉(zhuǎn)換裝置62輸入語(yǔ)音信息11,而屏幕61也將隨著語(yǔ)音信息11而呈現(xiàn)出查詢結(jié)果。
圖14為一示意圖,用以顯示當(dāng)使用者輸入語(yǔ)音信息后,在容易使用操作接口的屏幕上所顯示出的另一畫(huà)面。當(dāng)使用者利用容易使用操作接口6的語(yǔ)音轉(zhuǎn)換裝置62而輸入語(yǔ)音信息11,在此,語(yǔ)音信息11為[如何進(jìn)行網(wǎng)絡(luò)聯(lián)機(jī)];容易使用操作接口6將輸入的語(yǔ)音信息11轉(zhuǎn)換為表征波形21,此表征波形21為使用者所輸入的語(yǔ)音信息11所對(duì)應(yīng)的物理表征波形信號(hào),容易使用操作接口6并將此物理表征波形21,傳送到操作系統(tǒng)1中進(jìn)行處理。操作系統(tǒng)1將處理后的結(jié)果展現(xiàn)在容易使用操作接口6的屏幕61上。如圖14所示,在屏幕61上的對(duì)話框66中將出現(xiàn)網(wǎng)絡(luò)連接的說(shuō)明細(xì)節(jié),利用對(duì)話框的形式,將說(shuō)明細(xì)節(jié)展現(xiàn)在對(duì)話框66中。
圖15為一運(yùn)作流程圖,其中顯示應(yīng)用本發(fā)明的操作系統(tǒng)及方法的再一實(shí)施例運(yùn)作的流程程序。在此,使用者將進(jìn)行激活所需程序的動(dòng)作,所使用的語(yǔ)言為西方語(yǔ)言以及中文語(yǔ)言的組合,而語(yǔ)音信息11為[激活影像處理程序]。如圖15所示,首先,在步驟81,在使用者容易使用操作接口6的屏幕61上將顯現(xiàn)出一人形圖樣67,此人形圖樣67如圖16所示,使用者將對(duì)著容易使用操作接口6的語(yǔ)音轉(zhuǎn)換裝置62而輸入語(yǔ)音信息11,在此,使用者所使用的語(yǔ)言為西方語(yǔ)言以及中文語(yǔ)言的組合,而語(yǔ)音信息11為[激活影像處理程序];容易使用操作接口6將輸入的語(yǔ)音信息11轉(zhuǎn)換為表征波形21,此表征波形21為使用者所輸入的語(yǔ)音信息11所對(duì)應(yīng)的物理表征波形信號(hào),容易使用操作接口6并將此物理表征波形21,傳送到操作系統(tǒng)1的語(yǔ)音識(shí)別處理模塊2,并進(jìn)到步驟82。
在步驟82,在此,由于使用者所輸入的語(yǔ)音信息11并非為單一單字語(yǔ)音,而是由西方語(yǔ)言以及中文語(yǔ)言的組合而成的語(yǔ)句,所以,表征波形21的波形為多個(gè)語(yǔ)音音包22所組成,語(yǔ)音識(shí)別模塊2將此文句語(yǔ)音所對(duì)應(yīng)的多個(gè)語(yǔ)音音包22群,予以切割成多個(gè)各別單一的語(yǔ)音音包22,將分別對(duì)單一各別的語(yǔ)音音包22做處理,語(yǔ)音識(shí)別處理模塊2將依照語(yǔ)音數(shù)據(jù)庫(kù)3中的語(yǔ)音識(shí)別原則31,對(duì)各個(gè)單一語(yǔ)音音包22波形信號(hào)的表征波形物理特性予以各別進(jìn)行分析,以取出各別語(yǔ)音音包22的各項(xiàng)特征參數(shù),將各個(gè)西方語(yǔ)音音包22分成子音201、風(fēng)聲202以及元音203部份,并把各個(gè)中文語(yǔ)音音包22分成子音201、風(fēng)聲202以及元音203部份,并取出各個(gè)中文語(yǔ)音音包22的首頻301以及尾頻302,并進(jìn)到步驟83。
在步驟83,語(yǔ)音識(shí)別處理模塊2利用語(yǔ)音識(shí)別原則31對(duì)各個(gè)西方語(yǔ)音音包22的子音201、風(fēng)聲202以及元音203部份分別進(jìn)行識(shí)別,針對(duì)子音201、風(fēng)聲202以及元音203所具有的波形特征進(jìn)行判斷、分析,以得出各個(gè)語(yǔ)音音包22的子音201以及元音203為何;針對(duì)中文語(yǔ)音音包22,語(yǔ)音識(shí)別處理模塊2除利用語(yǔ)音識(shí)別原則31對(duì)各個(gè)中文語(yǔ)音音包22的子音201、風(fēng)聲202以及元音203部份分別進(jìn)行識(shí)別,針對(duì)子音201、風(fēng)聲202以及元音203所具有的波形特征進(jìn)行判斷、分析,以得出各個(gè)語(yǔ)音音包22的子音201以及元音203為何之外,語(yǔ)音識(shí)別原則31尚以首頻301、尾頻302的運(yùn)算判斷法則,配合各個(gè)中文語(yǔ)音音包22的元音203部份的頻率以及波形振幅外廓變化情形,而識(shí)別出中文語(yǔ)音中的四聲變化;語(yǔ)音識(shí)別原則31并可將識(shí)別出的各個(gè)語(yǔ)音音包22的子音201、元音203部份予以組合,也或?qū)⒆R(shí)別出的各個(gè)語(yǔ)音音包22的子音201、元音部份203以及四聲變化予以組合,并進(jìn)到步驟84。
在步驟84,語(yǔ)音識(shí)別處理模塊2并將由各個(gè)語(yǔ)音音包22所識(shí)別出的子音201以及元音203所組成的語(yǔ)音組合,以及由子音201、元音部份203以及四聲變化所組成的語(yǔ)音組合,與語(yǔ)音數(shù)據(jù)庫(kù)3中的語(yǔ)音對(duì)應(yīng)資料32進(jìn)行對(duì)比,以得出語(yǔ)音組合所對(duì)應(yīng)的信息為何,語(yǔ)音識(shí)別處理模塊2并將所得出的信息傳遞給接口處理模塊4,并進(jìn)到步驟85。
在步驟85,接口處理模塊4根據(jù)所接收到來(lái)自于語(yǔ)音識(shí)別處理模塊2的信息,而調(diào)用其它程序9來(lái)進(jìn)行激活影像處理程序動(dòng)作,接口處理模塊4將配合其它程序9,將處理、執(zhí)行結(jié)果展現(xiàn)在容易使用操作接口6的屏幕61上,所展現(xiàn)出來(lái)的畫(huà)面如圖17所示,以讓使用者可進(jìn)行下一步的動(dòng)作。
圖16為一示意圖,用以展現(xiàn)在容易使用操作接口的屏幕上所顯示出的又一畫(huà)面。如圖16所示,在容易使用操作接口6的屏幕61上將顯現(xiàn)出一人形圖樣67,使用者可如同與真人對(duì)話一般,通過(guò)容易使用操作接口6的語(yǔ)音轉(zhuǎn)換裝置62而輸入語(yǔ)音信息11,而屏幕61也將隨著語(yǔ)音信息11而呈現(xiàn)激活影像處理程序后的結(jié)果。
圖17為一示意圖,用以顯示當(dāng)使用者輸入語(yǔ)音信息后,在容易使用操作接口的屏幕上所顯示出的再一畫(huà)面。當(dāng)使用者利用容易使用操作接口6的語(yǔ)音轉(zhuǎn)換裝置62而輸入語(yǔ)音信息11,在此,語(yǔ)音信息11為[激活影像程序];容易使用操作接口6將輸入的語(yǔ)音信息11轉(zhuǎn)換為表征波形21,此表征波形21為使用者所輸入的語(yǔ)音信息11所對(duì)應(yīng)的物理表征波形信號(hào),容易使用操作接口6并將此物理表征波形21,傳送到操作系統(tǒng)1中進(jìn)行處理。操作系統(tǒng)1將處理后的結(jié)果展現(xiàn)在容易使用操作接口6的屏幕61上。如圖17所示,在屏幕61上將出現(xiàn)激活后的影像處理程序的操作接口66。
綜合以上的實(shí)施例,我們可以得到本發(fā)明的一種操作系統(tǒng)及方法,應(yīng)用在計(jì)算機(jī)環(huán)境中,使用者可利用容易使用操作接口而輸入語(yǔ)音信息,容易使用操作接口將輸入的語(yǔ)音信息轉(zhuǎn)換成輸入信號(hào),并將此輸入信號(hào)傳送到此操作系統(tǒng)的語(yǔ)音識(shí)別模塊,語(yǔ)音識(shí)別模塊將處理此輸入信號(hào)并配合語(yǔ)音數(shù)據(jù)庫(kù)以及接口處理模塊,將處理后的結(jié)果展現(xiàn)在容易使用操作接口上,即便使用者對(duì)于操作系統(tǒng)操作接口不熟悉,仍能以最簡(jiǎn)便、快捷的方式服務(wù)使用者,并且,使用者將能以語(yǔ)音信息輸入的形式來(lái)找出資料、輸入資料以及激活所需的程序。本發(fā)明的操作系統(tǒng)及方法的優(yōu)點(diǎn)如下1.此操作系統(tǒng)將依由容易使用操作接口而來(lái)的輸入信號(hào),激活語(yǔ)音處理模塊以便處理這些信號(hào),并將處理后的結(jié)果展現(xiàn)在容易使用操作接口上,讓使用者明了操作過(guò)程、結(jié)果,無(wú)論使用者熟悉計(jì)算機(jī)系統(tǒng)與否,使用者可輕松地依容易使用操作接口而輸入語(yǔ)音信息,以進(jìn)行所需的工作。
2.當(dāng)使用者對(duì)于操作系統(tǒng)操作接口不熟悉時(shí),能以最簡(jiǎn)便、快捷的方式,以及容易使用操作接口來(lái)服務(wù)使用者。
3.使用者將能以語(yǔ)音信息輸入的形式來(lái)找出資料、輸入資料、以及激活所需的程序。
權(quán)利要求
1.一種操作方法,應(yīng)用在計(jì)算機(jī)環(huán)境中,其特征在于,該操作方法包括以下程序操作系統(tǒng)接收到輸入信號(hào)后,對(duì)輸入信號(hào)進(jìn)行分析以及處理,得出輸入信號(hào)所對(duì)應(yīng)的信息為何;以及操作系統(tǒng)根據(jù)輸入信號(hào)所對(duì)應(yīng)的信息,調(diào)用程序并做執(zhí)行。
2.如權(quán)利要求1所述的操作方法,其特征在于,該對(duì)輸入信號(hào)進(jìn)行分析以及處理的程序包括以下步驟將輸入信號(hào)的語(yǔ)音音包分為不同部份并予以識(shí)別;以及將識(shí)別出的子音以及元音進(jìn)行組合,以判斷出語(yǔ)音所對(duì)應(yīng)的信息為何。
3.如權(quán)利要求2所述的操作方法,其特征在于,該語(yǔ)音音包分為子音、風(fēng)聲以及元音部份。
4.如權(quán)利要求3所述的操作方法,其特征在于,該子音部份的波形為漸近音,爆擦音,擠壓音,爆發(fā)音中的一種,元音部份含有重復(fù)出現(xiàn)的音包波形區(qū)域,風(fēng)聲部份的頻率比子音以及元音部份高。
5.如權(quán)利要求4所述的操作方法,其特征在于,該元音部份的組成特征參數(shù)包括轉(zhuǎn)折數(shù)、波數(shù)以及斜率。
6.如權(quán)利要求2、3、4或5所述的操作方法,其特征在于,將對(duì)元音部份含有重復(fù)出現(xiàn)的音包波形區(qū)域進(jìn)行切割。
7.如權(quán)利要求1所述的操作方法,其特征在于,該對(duì)輸入信號(hào)進(jìn)行分析以及處理的程序包括以下步驟將輸入信號(hào)的語(yǔ)音音包分為不同部份并予以識(shí)別,并對(duì)整個(gè)音包選取首頻以及尾頻,利用首頻、尾頻的運(yùn)算判斷法則,識(shí)別出語(yǔ)音中的聲調(diào)變化;以及將識(shí)別出的子音、元音以及聲調(diào)變化進(jìn)行組合,以判斷出語(yǔ)音所對(duì)應(yīng)的信息為何。
8.如權(quán)利要求7所述的操作方法,其特征在于,該語(yǔ)音音包分為子音、風(fēng)聲以及元音部份。
9.如權(quán)利要求8所述的操作方法,其特征在于,該子音部份的波形為漸近音、爆擦音、擠壓音及爆發(fā)音中的一種,元音部份含有重復(fù)出現(xiàn)的音包波形區(qū)域,風(fēng)聲部份的頻率比子音以及元音部份高。
10.如權(quán)利要求9所述的操作方法,其特征在于,該元音部份的組成特征參數(shù)包括轉(zhuǎn)折數(shù)、波數(shù)以及斜率。
11.如權(quán)利要求7、8、9或10所述的操作方法,其特征在于,將對(duì)元音部份含有重復(fù)出現(xiàn)的音包波形區(qū)域進(jìn)行切割。
12.一種操作方法,應(yīng)用在計(jì)算機(jī)環(huán)境中,使用者可利用容易使用操作接口輸入語(yǔ)音信息,容易使用操作接口將輸入的語(yǔ)音信息轉(zhuǎn)換成輸入信號(hào)并傳送到操作系統(tǒng),其特征在于,此操作方法包括以下程序操作系統(tǒng)的語(yǔ)音識(shí)別處理模塊接收到輸入信號(hào)后,將依照語(yǔ)音識(shí)別原則,對(duì)輸入信號(hào)物理特性進(jìn)行分析以及處理,并將識(shí)別出輸入信號(hào)所對(duì)應(yīng)的信息傳遞給接口處理模塊;以及接口處理模塊根據(jù)所接收到來(lái)自于語(yǔ)音識(shí)別處理模塊的信息,調(diào)用其它程序來(lái)執(zhí)行使用者所需的動(dòng)作。
13.一種操作方法,應(yīng)用在計(jì)算機(jī)環(huán)境中,使用者可利用容易使用操作接口輸入語(yǔ)音信息,容易使用操作接口將輸入的語(yǔ)音信息轉(zhuǎn)換成輸入信號(hào)并傳送到操作系統(tǒng),其特征在于,此操作方法包括以下程序操作系統(tǒng)的語(yǔ)音識(shí)別處理模塊接收到輸入信號(hào)后,將依照語(yǔ)音識(shí)別原則,對(duì)輸入信號(hào)物理特性進(jìn)行分析以及處理,語(yǔ)音識(shí)別處理模塊配合語(yǔ)音識(shí)別原則以及語(yǔ)音對(duì)應(yīng)資料將識(shí)別出輸入信號(hào)所對(duì)應(yīng)的信息為何,語(yǔ)音識(shí)別處理模塊并將所得出的信息傳遞給接口處理模塊;以及接口處理模塊根據(jù)所接收到來(lái)自于語(yǔ)音識(shí)別處理模塊的信息,調(diào)用其它程序來(lái)執(zhí)行使用者所需的動(dòng)作,接口處理模塊并將處理、執(zhí)行結(jié)果經(jīng)由容易使用操作接口而提供給使用者。
14.如權(quán)利要求12或13所述的操作方法,其特征在于,該對(duì)輸入信號(hào)進(jìn)行分析以及處理的程序包括以下步驟將輸入信號(hào)的語(yǔ)音音包分為不同部份并予以識(shí)別;以及將識(shí)別出的子音以及元音進(jìn)行組合,以判斷出語(yǔ)音所對(duì)應(yīng)的信息為何。
15.如權(quán)利要求14所述的操作方法,其特征在于,該語(yǔ)音音包分為子音、風(fēng)聲以及元音部份。
16.如權(quán)利要求15所述的操作方法,其特征在于,該子音部份的波形為漸近音、爆擦音、擠壓音及爆發(fā)音中的一種,元音部份含有重復(fù)出現(xiàn)的音包波形區(qū)域,風(fēng)聲部份的頻率比子音以及元音部份高。
17.如權(quán)利要求16所述的操作方法,其特征在于,該元音部份的組成特征參數(shù)包括轉(zhuǎn)折數(shù)、波數(shù)以及斜率。
18.如權(quán)利要求14所述的操作方法,其特征在于,將對(duì)元音部份含有重復(fù)出現(xiàn)的音包波形區(qū)域進(jìn)行切割。
19.如權(quán)利要求15所述的操作方法,其特征在于,將對(duì)元音部份含有重復(fù)出現(xiàn)的音包波形區(qū)域進(jìn)行切割。
20.如權(quán)利要求16所述的操作方法,其特征在于,將對(duì)元音部份含有重復(fù)出現(xiàn)的音包波形區(qū)域進(jìn)行切割。
21.如權(quán)利要求17所述的操作方法,其特征在于,將對(duì)元音部份含有重復(fù)出現(xiàn)的音包波形區(qū)域進(jìn)行切割。
22.如權(quán)利要求12項(xiàng)或13所述的操作方法,其特征在于,該對(duì)輸入信號(hào)進(jìn)行分析以及處理的程序包括以下步驟將輸入信號(hào)的語(yǔ)音音包分為不同部份并予以識(shí)別,并對(duì)整個(gè)音包選取首頻以及尾頻,利用首頻、尾頻的運(yùn)算判斷法則,識(shí)別出語(yǔ)音中的聲調(diào)變化;以及將識(shí)別出的子音、元音以及聲調(diào)變化進(jìn)行組合,以判斷出語(yǔ)音所對(duì)應(yīng)的信息為何。
23.如權(quán)利要求22所述的操作方法,其特征在于,該語(yǔ)音音包分為子音、風(fēng)聲以及元音部份。
24.如權(quán)利要求23所述的操作方法,其特征在于,該子音部份的波形為漸近音、爆擦音、擠壓音及爆發(fā)音中的一種,元音部份含有重復(fù)出現(xiàn)的音包波形區(qū)域,風(fēng)聲部份的頻率比子音以及元音部份高。
25.如權(quán)利要求22所述的操作方法,其特征在于,該元音部份的組成特征參數(shù)包括轉(zhuǎn)折數(shù)、波數(shù)以及斜率。
26.如權(quán)利要求19所述的操作方法,其特征在于,將對(duì)元音部份含有重復(fù)出現(xiàn)的音包波形區(qū)域進(jìn)行切割。
27.如權(quán)利要求22所述的操作方法,其特征在于,將對(duì)元音部份含有重復(fù)出現(xiàn)的音包波形區(qū)域進(jìn)行切割。
28.如權(quán)利要求23所述的操作方法,其特征在于,將對(duì)元音部份含有重復(fù)出現(xiàn)的音包波形區(qū)域進(jìn)行切割。
29.如權(quán)利要求24所述的操作方法,其特征在于,將對(duì)元音部份含有重復(fù)出現(xiàn)的音包波形區(qū)域進(jìn)行切割。
30.一種操作方法,應(yīng)用在計(jì)算機(jī)環(huán)境中,使用者可利用容易使用操作接口而入語(yǔ)音信息,容易使用操作接口將輸入的語(yǔ)音信息轉(zhuǎn)換成輸入信號(hào)并傳送到操作系統(tǒng),其特征在于,該操作方法包括以下程序操作系統(tǒng)的語(yǔ)音識(shí)別處理模塊接收到輸入信號(hào)后,將對(duì)輸入信號(hào)中的至少一個(gè)的語(yǔ)音音包做處理,當(dāng)輸入信號(hào)含有一個(gè)以上的語(yǔ)音音包時(shí),語(yǔ)音識(shí)別模塊對(duì)一個(gè)以上的語(yǔ)音音包予以切割成各別單一的語(yǔ)音音包,語(yǔ)音識(shí)別處理模塊將依照語(yǔ)音數(shù)據(jù)庫(kù)中的語(yǔ)音識(shí)別原則,對(duì)單一語(yǔ)音音包波形信號(hào)予以各別進(jìn)行分析,以取出各別語(yǔ)音音包的各項(xiàng)特征參數(shù),將各個(gè)語(yǔ)音音包分成子音、風(fēng)聲、以及元音部份;語(yǔ)音識(shí)別處理模塊利用語(yǔ)音識(shí)別原則對(duì)各個(gè)語(yǔ)音音包的子音、風(fēng)聲以及元音部份分別進(jìn)行識(shí)別、處理以及組合子音與元音部份;語(yǔ)音識(shí)別處理模塊并將由各個(gè)語(yǔ)音音包所識(shí)別出的子音以及元音所組成的語(yǔ)音組合與語(yǔ)音數(shù)據(jù)庫(kù)中的語(yǔ)音對(duì)應(yīng)資料進(jìn)行對(duì)比,以得出語(yǔ)音組合所對(duì)應(yīng)的信息為何,語(yǔ)音識(shí)別處理模塊并將所得出的信息傳遞給接口處理模塊;以及接口處理模塊根據(jù)所接收到來(lái)自于語(yǔ)音識(shí)別處理模塊的信息,而調(diào)用其它程序來(lái)執(zhí)行使用者所需的動(dòng)作,接口處理模塊并將處理、執(zhí)行結(jié)果經(jīng)由容易使用操作接口而提供給使用者。
31.如權(quán)利要求30所述的操作方法,其特征在于,該語(yǔ)音識(shí)別處理模塊并取出各個(gè)語(yǔ)音音包的首頻以及尾頻,配合首頻、尾頻的運(yùn)算判斷法則、各個(gè)語(yǔ)音音包的元音部份的頻率以及波形振幅外廓變化情形,而識(shí)別出中文語(yǔ)音中的四聲變化。
32.如權(quán)利要求30所述的操作方法,其特征在于,該語(yǔ)音識(shí)別處理模塊利用語(yǔ)音識(shí)別原則對(duì)各個(gè)語(yǔ)音音包的子音、風(fēng)聲以及元音部份分別進(jìn)行識(shí)別、處理,以及組合子音與元音部份。
33.如權(quán)利要求30所述的操作方法,其特征在于,該語(yǔ)音識(shí)別處理模塊利用語(yǔ)音識(shí)別原則對(duì)各個(gè)語(yǔ)音音包的子音、風(fēng)聲以及元音部份分別進(jìn)行識(shí)別、處理,將識(shí)別出的各個(gè)語(yǔ)音音包的子音、元音部份以及四聲變化予以組合。
34.如權(quán)利要求31、32或33所述的操作方法,其特征在于,該語(yǔ)音數(shù)據(jù)庫(kù)的語(yǔ)音識(shí)別原則是用來(lái)識(shí)別子音、風(fēng)聲以及元音,并可依首頻、尾頻的運(yùn)算判斷法則而識(shí)別出中文語(yǔ)音的四聲變化,該語(yǔ)音對(duì)應(yīng)資料是用來(lái)對(duì)比出子音與元音組合的信息為何、以及用來(lái)對(duì)比出子音與元音與四聲變化組合的信息為何。
35.一種操作系統(tǒng),應(yīng)用在計(jì)算機(jī)環(huán)境中,使用者可利用容易使用操作接口而輸入語(yǔ)音信息,容易使用操作接口將輸入的語(yǔ)音信息轉(zhuǎn)換成輸入信號(hào)并傳送到操作系統(tǒng),其特征在于,此操作系統(tǒng)包括一語(yǔ)音識(shí)別處理模塊,該語(yǔ)音處理模塊接收到輸入信號(hào)后,將對(duì)輸入信號(hào)中的至少一個(gè)的語(yǔ)音音包做處理,當(dāng)輸入信號(hào)含有一個(gè)以上的語(yǔ)音音包時(shí),語(yǔ)音識(shí)別模塊對(duì)一個(gè)以上的語(yǔ)音音包予以切割成各別單一的語(yǔ)音音包,語(yǔ)音識(shí)別處理模塊將依照語(yǔ)音數(shù)據(jù)庫(kù)中的語(yǔ)音識(shí)別原則,對(duì)單一語(yǔ)音音包波形信號(hào)予以各別進(jìn)行分析,以取出各別語(yǔ)音音包的各項(xiàng)特征參數(shù),將各個(gè)語(yǔ)音音包分成子音、風(fēng)聲以及元音部份;語(yǔ)音識(shí)別處理模塊利用語(yǔ)音識(shí)別原則對(duì)各個(gè)語(yǔ)音音包的子音、風(fēng)聲、以及元音部份分別進(jìn)行識(shí)別、處理,以及組合子音與元音部份;語(yǔ)音識(shí)別處理模塊并將由各個(gè)語(yǔ)音音包所識(shí)別出的子音以及元音所組成的語(yǔ)音組合與語(yǔ)音數(shù)據(jù)庫(kù)中的語(yǔ)音對(duì)應(yīng)資料進(jìn)行對(duì)比,以得出語(yǔ)音組合所對(duì)應(yīng)的信息為何,語(yǔ)音識(shí)別處理模塊并將所得出的信息傳遞給接口處理模塊;一語(yǔ)音數(shù)據(jù)庫(kù),該語(yǔ)音數(shù)據(jù)庫(kù)含有一語(yǔ)音識(shí)別原則以及語(yǔ)音對(duì)應(yīng)資料,該語(yǔ)音識(shí)別原則是用來(lái)識(shí)別子音、風(fēng)聲以及元音,該語(yǔ)音對(duì)應(yīng)資料是用來(lái)對(duì)比出子音與元音組合部份的信息為何;以及一接口處理模塊,該接口處理模塊根據(jù)所接收到來(lái)自于語(yǔ)音識(shí)別處理模塊的信息,而調(diào)用其它程序來(lái)執(zhí)行使用者所需的動(dòng)作,接口處理模塊并將處理、執(zhí)行結(jié)果經(jīng)由容易使用操作接口而提供給使用者。
36.如權(quán)利要求35所述的操作系統(tǒng),其特征在于,該語(yǔ)音識(shí)別處理模塊接收到輸入信號(hào)后,將依照語(yǔ)音數(shù)據(jù)庫(kù)中的語(yǔ)音識(shí)別原則,對(duì)輸入信號(hào)物理特性進(jìn)行分析,以取出此輸入信號(hào)物理表征波形的各項(xiàng)特征參數(shù),將輸入信號(hào)中的語(yǔ)音音包分成子音、風(fēng)聲以及元音部份,并取出語(yǔ)音音包的首頻以及尾頻,利用語(yǔ)音識(shí)別原則對(duì)子音、風(fēng)聲以及元音部份分別進(jìn)行識(shí)別,語(yǔ)音識(shí)別原則并以首頻、尾頻的運(yùn)算判斷法則,配合元音部份的頻率以及波形振幅外廓變化情形,而識(shí)別出中文語(yǔ)音中的四聲變化,語(yǔ)音識(shí)別原則并可將識(shí)別出的子音、元音部份以及四聲變化予以組合,并將所得出的語(yǔ)音組合與語(yǔ)音數(shù)據(jù)庫(kù)中的語(yǔ)音對(duì)應(yīng)資料進(jìn)行對(duì)比,以得出語(yǔ)音所對(duì)應(yīng)的信息為何,語(yǔ)音識(shí)別處理模塊并將所得出的信息傳遞給接口處理模塊。
37.如權(quán)利要求36所述的操作系統(tǒng),其特征在于,應(yīng)用該語(yǔ)音數(shù)據(jù)庫(kù)的語(yǔ)音識(shí)別原則可將語(yǔ)音音包區(qū)分為子音、風(fēng)聲以及元音部份,并對(duì)整個(gè)語(yǔ)音音包進(jìn)行處理而取出首頻以及尾頻,對(duì)子音、風(fēng)聲以及元音部份分別進(jìn)行識(shí)別、處理;將子音以及元音予以組合后,應(yīng)用該語(yǔ)音識(shí)別原則,對(duì)由子音與元音所構(gòu)成的語(yǔ)音以及語(yǔ)音對(duì)應(yīng)資料進(jìn)行對(duì)比,以得到使用者所輸入的語(yǔ)音信息所對(duì)應(yīng)的信息為何;且能利用子音以及元音的組合,而識(shí)別出語(yǔ)音音包所對(duì)應(yīng)的信息,并能利用首頻、尾頻的運(yùn)算判斷法則,配合元音部份的頻率以及波形振幅外廓變化情形,識(shí)別出中文語(yǔ)音中的四聲變化;以子音以及元音的組合,加上中文語(yǔ)音中的四聲變化,與語(yǔ)音對(duì)應(yīng)資料進(jìn)行對(duì)比,而得以正確地識(shí)別出中文發(fā)音所對(duì)應(yīng)的信息。
全文摘要
一種操作系統(tǒng)及方法,應(yīng)用在計(jì)算機(jī)環(huán)境中,使用者可利用容易使用操作接口輸入語(yǔ)音信息,容易使用操作接口將輸入的語(yǔ)音信息轉(zhuǎn)換成此操作系統(tǒng)可處理的輸入信號(hào),并將此輸入信號(hào)傳送到此操作系統(tǒng)中進(jìn)行信號(hào)處理,此操作系統(tǒng)的語(yǔ)音識(shí)別模塊將處理此輸入信號(hào)并配合語(yǔ)音數(shù)據(jù)庫(kù)以及接口處理模塊,將處理后的結(jié)果展現(xiàn)在容易使用操作接口上,讓使用者明了操作過(guò)程、結(jié)果。利用此操作方法過(guò)程時(shí),即便使用者對(duì)于操作系統(tǒng)操作接口不熟悉,仍能以最簡(jiǎn)便、快捷的方式來(lái)服務(wù)使用者,并且,使用者將能以語(yǔ)音信息輸入的形式來(lái)找出資料、輸入資料以及激活所需的程序。
文檔編號(hào)G10L15/08GK1722229SQ200410069669
公開(kāi)日2006年1月18日 申請(qǐng)日期2004年7月14日 優(yōu)先權(quán)日2004年7月14日
發(fā)明者封家麟 申請(qǐng)人:文化傳信科技(澳門(mén))有限公司