專利名稱:聲控文件查詢系統(tǒng)以及聲控文件查詢方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種文件查詢系統(tǒng)和文件查詢方法,尤其涉及一種可以通過聲控方式查詢存儲器中的文件和/或文件夾的聲控文件查詢系統(tǒng)和聲控文件查詢方法。
背景技術(shù):
隨著數(shù)碼技術(shù)的不斷發(fā)展,人們在日常生活中越來越多地使用了便攜式電子產(chǎn)品。例如,PDA(個人數(shù)字助理)、手機、U盤、移動硬盤、MP3播放器等。人們可以利用這些便攜式電子產(chǎn)品存儲各種文件,以便隨時查看或其它操作。但是隨著便攜式電子產(chǎn)品中存儲器容量的不斷增大,其內(nèi)存儲的文件也日益增多,因而查詢起來極不方便。在現(xiàn)有的計算機等系統(tǒng)中(例如在裝有Windows操作系統(tǒng)的計算機中),可以通過手動輸入文字信息在計算機硬盤上查詢文件名或文件夾名相匹配的文件或文件夾。但是這種輸入都是通過手動完成的,用戶使用起來極不方便。而對于那些沒有文字輸入設備的便攜式電子產(chǎn)品中,更是無法使用這種方法進行文件查詢。
發(fā)明內(nèi)容為了解決現(xiàn)有技術(shù)的電子產(chǎn)品無法進行文件查詢或者文件查詢條件需要語音輸入而不便用戶使用的技術(shù)問題,本發(fā)明提供了一種利用聲控方式對電子產(chǎn)品存儲器內(nèi)的文件和/或進行查詢的聲控文件查詢系統(tǒng)和聲控文件查詢方法。
本發(fā)明解決現(xiàn)有技術(shù)的電子產(chǎn)品無法進行文件查詢或者文件查詢條件需要語音輸入而不便用戶使用的技術(shù)問題所采用的技術(shù)方案是提供一種聲控文件查詢系統(tǒng),該查詢系統(tǒng)包括處理器以及存儲多媒體文件的存儲器,該查詢系統(tǒng)還包括語音識別模塊以及與語音識別模塊相連接的語音輸入模塊,語音輸入模塊輸入語音識別信息并由語音識別模塊進行識別,處理器從存儲器內(nèi)選擇識別信息與語音識別信息相匹配的文件夾或文件。
根據(jù)本發(fā)明聲控文件查詢系統(tǒng)一優(yōu)選實施例,識別信息是文件夾名或文件名。
根據(jù)本發(fā)明聲控文件查詢系統(tǒng)一優(yōu)選實施例,聲控文件查詢系統(tǒng)為便攜式電子設備。
根據(jù)本發(fā)明聲控文件查詢系統(tǒng)一優(yōu)選實施例,語音識別模塊是針對非特定用戶的語音識別模塊。
根據(jù)本發(fā)明聲控文件查詢系統(tǒng)一優(yōu)選實施例,聲控文件查詢系統(tǒng)還包括與處理器相連接的用于顯示選擇的文件夾或文件的顯示單元。
本發(fā)明解決現(xiàn)有技術(shù)的電子產(chǎn)品無法進行文件查詢或者文件查詢條件需要語音輸入而不便用戶使用的技術(shù)問題所采用的另一技術(shù)方案是提供一種聲控文件查詢方法,該方法包括以下步驟利用語音輸入模塊輸入語音識別信息,并由語音識別模塊進行識別;利用處理器從存儲器內(nèi)選擇識別信息與語音識別信息相匹配的文件夾或文件。
根據(jù)本發(fā)明聲控文件查詢系統(tǒng)一優(yōu)選實施例,識別信息是文件夾或文件名。
根據(jù)本發(fā)明聲控文件查詢系統(tǒng)一優(yōu)選實施例,在步驟a中,語音識別模塊利用針對非特定用戶的語音識別方法識別語音識別信息。
根據(jù)本發(fā)明聲控文件查詢系統(tǒng)一優(yōu)選實施例,存儲器是便攜式電子產(chǎn)品的存儲器。
根據(jù)本發(fā)明聲控文件查詢系統(tǒng)一優(yōu)選實施例,該方法還進一步包括步驟c通過與處理器相連接的顯示單元顯示選擇的文件夾或文件。。
上述結(jié)構(gòu)的有益效果是通過語音識別輸入模塊輸入查詢條件并由語音識別模塊進行識別查詢條件,可以方便用戶對存儲器內(nèi)存儲的文件進行查詢以及下一步操作。在本實用新型中,查詢條件優(yōu)選采用文件名或文件夾名。
圖1是本發(fā)明的聲控文件查詢系統(tǒng)的示意框圖;圖2是使用本發(fā)明聲控文件查詢系統(tǒng)的聲控MP4播放器一實施例的結(jié)構(gòu)示意圖;圖3是圖2所示的聲控MP4播放器的示意框圖。
具體實施方式
下面結(jié)合附圖和實施例對本發(fā)明進一步說明。
參見圖1,本發(fā)明的聲控文件查詢系統(tǒng)包括處理器111、存儲器113、語音識別模塊115以及與語音識別模塊115相連接的語音輸入模塊117。其中,存儲器113分成指令存儲模塊和數(shù)據(jù)存儲模塊。語音輸入模塊117接收用戶輸入的語音識別信息,該語音識別信息經(jīng)語音識別模塊117進行A/D轉(zhuǎn)換、特征量提取等數(shù)據(jù)處理過程。處理器111將經(jīng)語音識別模塊115的語音識別信息同存儲器113的數(shù)據(jù)存儲模塊中存儲文件的識別信息進行比較,并根據(jù)二者的相似度選擇識別信息相匹配的文件或文件夾。其中,識別信息可以采用多種識別信息,例如視頻文件和/或音頻文件的ID3標簽內(nèi)的信息以及文件名或文件夾名稱等。在本實施例中,由于ID3標簽內(nèi)的信息不易修改,因而優(yōu)選采用文件名或文件夾名作為識別信息,以方便用戶根據(jù)自己的需要修改識別信息。
本發(fā)明聲控文件查詢系統(tǒng)的語音識別系統(tǒng)可以采用針對特定人的語音識別系統(tǒng)或針對非特定人的語音識別系統(tǒng)。在針對特定人的語音識別系統(tǒng)中,用戶需要事先對每一個語音識別信息進行訓練。這種語音識別系統(tǒng)的識別性能隨著語音指令數(shù)目的增加會有明顯的下降,并且對于不同用戶、在不同的噪聲環(huán)境中,以及不同的時間相同用戶的不同生理、心理狀態(tài)下,系統(tǒng)的性能都會受到明顯的影響。而針對非特定人的語音識別系統(tǒng)采用基于統(tǒng)計模型的算法,系統(tǒng)開發(fā)者事先采集大量的語音數(shù)據(jù)進行訓練,得到聲學模型并存儲在存儲器中。在識別階段,語音識別模塊將用戶的輸入語音識別信息的特征量與通過聲學模型構(gòu)建的識別網(wǎng)絡進行匹配解碼。處理器可根據(jù)語音識別模塊輸出的識別結(jié)果對存儲器內(nèi)的文件進行選擇。非特定人語音識別系統(tǒng)對于用戶而言,不需要引入繁瑣的訓練過程,方便了用戶的使用;同時它可以供不同的人使用,因此大大拓寬了應用范圍。另一方面,由于采用了基于統(tǒng)計模型的算法,其穩(wěn)健性和識別性能都比特定人識別系統(tǒng)大大的提高,識別性能不會隨著識別詞條數(shù)目的增加有明顯的下降,并且具有一定的抗噪能力。
參見圖2和圖3,其中,圖2是應用本發(fā)明的聲控文件查詢系統(tǒng)的MP4播放器的結(jié)構(gòu)示意圖,圖3是圖2所示MP4播放器的示意框圖。在本實施例中,聲控MP4播放器2包括設置在播放器主機21上的用戶控制界面221、液晶顯示屏223、揚聲器225和受話器227(麥克風)。播放器主機21內(nèi)部的電路板上設置有處理器211、存儲器213、語音識別模塊215等功能模塊以及USB接口、耳機插孔等外部接口。其中,處理器211負責MP4文件的視頻、音頻解碼、USB接口傳入數(shù)據(jù)的處理、寫入/讀取存儲器213內(nèi)的數(shù)據(jù)以及液晶顯示屏221的顯示,以便連接播放器主機21內(nèi)的所有主要部件,協(xié)調(diào)各部件工作狀態(tài)。MP4播放器除了能夠播放MP3、MP4等格式的音頻或視頻壓縮文件外,還可以查看各種格式的圖片或電子書籍。
使用時(例如,利用MP4播放器閱讀電子書籍時),用戶利用切換鍵從工作模式切換到聲控查詢模式。當處于聲控查詢模式時,用戶通過受話器227輸入自己想要閱讀書籍的文件名或文件夾名,該語音識別信息輸入到語音識別模塊215,語音識別模塊215對語音識別信息進行A/D轉(zhuǎn)換以及特征量提取等處理,主控模塊211根據(jù)處理結(jié)果從存儲器213選擇文件名或文件夾名相同或相似的文件或文件夾,隨后顯示選擇的文件或文件夾下的所有文件。主控模塊111可以根據(jù)用戶控制界面221的輸入指令對所選擇的文件或文件夾下的文件進行操作,例如刪除、顯示內(nèi)容以及跳轉(zhuǎn)到相鄰頁等操作。
由于采用了本發(fā)明的聲控文件查詢系統(tǒng),用戶可以通過聲控方式便捷地查詢到自己想要的文件或文件夾,以便對其進行直接播放、顯示內(nèi)容或進行下一步操作。
在上述實施例中,針對MP4播放器對本發(fā)明的聲控文件查詢系統(tǒng)進行了示范性描述,但本發(fā)明的范圍同樣適用于MP3播放器、數(shù)碼相機、DVD機、PDA、計算機等任何需要對文件進行查詢的電子產(chǎn)品。例如,通過利用輸入文件創(chuàng)建日期,在數(shù)碼相機內(nèi)查詢當日拍攝的照片,以便對這些照片進行管理。而且本發(fā)明的語音輸入模塊采用任意公知的以無線或有線方式連接到語音識別模塊的語音輸入系統(tǒng)。例如,在上述的MP4播放器中將采用將麥克風設置在有線耳機的耳機線上。這樣用戶不需要直接對著MP3播放器主機輸入語音信息,方便用戶使用。
上述的詳細描述僅是示范性描述,本領(lǐng)域技術(shù)人員在不脫離本發(fā)明所保護的范圍和精神的情況下,可根據(jù)不同的實際需要設計出各種實施方式。
權(quán)利要求
1.一種聲控文件查詢系統(tǒng),所述查詢系統(tǒng)包括處理器以及存儲多媒體文件的存儲器,其特征在于所述查詢系統(tǒng)還包括語音識別模塊以及與所述語音識別模塊相連接的語音輸入模塊,所述語音輸入模塊輸入語音識別信息并由所述語音識別模塊進行識別,所述處理器從所述存儲器內(nèi)選擇識別信息與所述語音識別信息相匹配的文件夾或文件。
2.根據(jù)權(quán)利要求1所述的聲控文件查詢系統(tǒng),其特征在于所述識別信息是文件夾名或文件名。
3.根據(jù)權(quán)利要求2所述的聲控文件查詢系統(tǒng),其特征在于所述聲控文件查詢系統(tǒng)為便攜式電子設備。
4.根據(jù)權(quán)利要求2所述的聲控文件查詢系統(tǒng),其特征在于所述語音識別模塊是針對非特定用戶的語音識別模塊。
5.根據(jù)權(quán)利要求2所述的聲控文件查詢系統(tǒng),其特征在于所述聲控文件查詢系統(tǒng)還包括與所述處理器相連接的用于顯示所述選擇的文件夾或文件的顯示單元。
6.一種聲控文件查詢方法,所述方法包括以下步驟a.利用語音輸入模塊輸入語音識別信息,并由語音識別模塊進行識別;b.利用處理器從存儲器內(nèi)選擇識別信息與所述語音識別信息相匹配的文件夾或文件。
7.根據(jù)權(quán)利要求6所述的聲控文件查詢方法,其特征在于所述識別信息是文件夾或文件名。
8.根據(jù)權(quán)利要求6所述的聲控文件查詢方法,其特征在于在所述步驟a中,所述語音識別模塊利用針對非特定用戶的語音識別方法識別所述語音識別信息。
9.根據(jù)權(quán)利要求6所述的聲控文件查詢方法,其特征在于所述存儲器是便攜式電子產(chǎn)品的存儲器。
10.根據(jù)權(quán)利要求6所述的聲控文件查詢方法,其特征在于所述方法還進一步包括步驟c通過與所述處理器相連接的顯示單元顯示所述選擇的文件夾或文件。
全文摘要
本發(fā)明涉及一種聲控文件查詢系統(tǒng),該查詢系統(tǒng)包括處理器以及存儲文件的存儲器,該查詢系統(tǒng)還包括語音識別模塊以及與語音識別模塊相連接的語音輸入模塊,語音輸入模塊輸入語音識別信息并由語音識別模塊進行識別,處理器從存儲器內(nèi)選擇識別信息與語音識別信息相匹配的文件夾或文件。當采用上述結(jié)構(gòu)時,用戶可以通過語音輸入模塊便捷地輸入查詢條件,不需要使用鍵盤等輸入設備手動輸入,方便用戶進行對查詢存儲器存儲的文件進行查詢和管理。
文檔編號G10L15/00GK1979468SQ20051010160
公開日2007年6月13日 申請日期2005年11月29日 優(yōu)先權(quán)日2005年11月29日
發(fā)明者陳修志 申請人:陳修志