專利名稱:口授系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種口授系統(tǒng)(dictation system),它包括一種將語音信號存儲于存儲部件中的手持式口授裝置,此裝置包含將語音信號壓縮成壓縮語音信號的數(shù)據(jù)壓縮部件和在存儲部件內(nèi)存儲壓縮語音信號的存儲部件。本發(fā)明還涉及一種在該口授系統(tǒng)中使用的口授裝置、一種復(fù)讀裝置和一種可拆卸式固態(tài)存儲單元。首段中定義的口授系統(tǒng)在本技術(shù)領(lǐng)域是眾所周知的。
現(xiàn)有技術(shù)中的口授系統(tǒng)通過丟棄常見于語音信號中的無音周期來實現(xiàn)數(shù)據(jù)壓縮。進而,可以保存一個指示信號,表示無音周期的長度和它在語音信號中的位置。在復(fù)讀時,通過在所壓縮的語音信號中所標(biāo)記的地方插入相應(yīng)的無語音周期,從而再生語音的副本。
本發(fā)明的目的在于提供一種改進的口授系統(tǒng)。根據(jù)本發(fā)明的口授系統(tǒng),其特征在于數(shù)據(jù)壓縮部件被設(shè)計成對語音信號至少以可用兩種不同的數(shù)據(jù)壓縮模式之一進行數(shù)據(jù)壓縮,當(dāng)用該至少兩種不同的數(shù)據(jù)壓縮模式對同一語音信號進行數(shù)據(jù)壓縮時會得到不同的壓縮比。用戶可選擇所說的至少兩種不同的數(shù)據(jù)壓縮模式。數(shù)據(jù)壓縮部件還可進一步生成包含壓縮語音信號部分的數(shù)據(jù)文件,該數(shù)據(jù)文件包含一個文件頭。該數(shù)據(jù)壓縮部件還生成用于標(biāo)識所選的數(shù)據(jù)壓縮模式的標(biāo)識信號并將該標(biāo)識信號存于所述文件頭中。本發(fā)明基于下列認(rèn)識口授裝置中的存儲器容量有限。而存儲部件中應(yīng)最好存儲數(shù)目不斷增長的口授段,這在本領(lǐng)域中通過丟棄語音信號中的無語音周期來實現(xiàn)。利用更強有力的壓縮技術(shù)可獲得更高的壓縮比。更具體地說,有損耗的壓縮技術(shù)產(chǎn)生高數(shù)據(jù)壓縮比。但是,較高的壓縮比會導(dǎo)致數(shù)據(jù)展開時所恢復(fù)的語音信號的質(zhì)量下降。本發(fā)明提出這樣一種口授系統(tǒng),它允許用戶從兩種或多種數(shù)據(jù)壓縮模式中選擇其一,手持式口授裝置據(jù)此可對語音信號進行壓縮。用戶可在一個內(nèi)存單元中可口授和存儲的語音段數(shù)目與語音信號的重現(xiàn)質(zhì)量之間作出權(quán)衡。假如用戶希望內(nèi)存部件中存儲較多的語音段,他就應(yīng)選擇具有較高數(shù)據(jù)壓縮比的數(shù)據(jù)壓縮模式;假如用戶更注重語音復(fù)讀質(zhì)量,他就應(yīng)選擇較低壓縮比的數(shù)據(jù)壓縮模式。
從屬權(quán)利要求定義了口授系統(tǒng),手持式口授裝置,復(fù)讀裝置及可拆卸式固態(tài)內(nèi)存單元的較佳實施例。
參照下列實施例附圖的說明,我們將弄清楚并闡明本發(fā)明的這些和其他方面。
圖1表示手持式口授裝置的一種實施例。
圖2表示用手持式口授裝置的存儲卡的一種實施例。
圖3表示手持式口授裝置的電路圖。
圖4表示手持式口授裝置中處理器生成的信號塊序列。
圖5是以桌面機或PC機形式實現(xiàn)的復(fù)讀裝置的一個實施例。
圖1是手持式口授裝置1的正面視圖,開關(guān)2位于該裝置外殼的側(cè)面,外殼底部設(shè)有電池艙3(沒畫出)??梢詮耐鈿け趁嫒》烹姵?,殼的正面有滑動開關(guān)4,用于在不同口授模式之間進行切換。該裝置還有幾個按鈕按鈕5是錄音按鈕,按鈕6是LETTER(語句)按鈕,按鈕7是MODE(模式)按鈕,按鈕8是INSERT(插入)按鈕,按鈕9是DELETE(刪除)按鈕。開關(guān)10是錄音模式開關(guān)。開關(guān)11是靈敏度開關(guān)。裝置1還提供顯示有關(guān)口授的各種信息用的LCD顯示器,例如,語音段的錄制時間、剩余錄制時間、錄制模式、語音段數(shù)目等。
外殼內(nèi)設(shè)有麥克風(fēng)13和揚聲器18。殼的側(cè)面裝有音量控制旋鈕14。另外,該裝置上側(cè)有一插槽,用于插入存儲卡15。
存儲卡15也示于圖2中。存儲卡15具有一個固態(tài)存儲器20及多個與固態(tài)存儲器20相連的電氣端子22。固態(tài)存儲器20可以是,例如,EEPROM或快速可擦式存儲器。電氣端子22在電氣上能與PC機上的符合國際標(biāo)準(zhǔn)的PCMCIA接口相接。
圖3表示裝置1的電氣結(jié)構(gòu)及其與存儲卡15的配合。裝置1包括數(shù)字信號處理器30,該處理器30具有與端子34相接的數(shù)字輸入/輸出端32,而端子34在電氣上又與插入槽16中的存儲卡15的端子22相接。麥克風(fēng)13連接處理器30的模擬輸入端36。若需要的話,可通過放大器38相接。處理器30還包括模擬輸出端40,它通過放大器42與揚聲器18相接。圖3中用參考數(shù)字44所指的各種旋鈕和按鈕與處理器30的控制輸入端46相接。另外,處理器30的控制輸出端48與用于控制顯示器12上顯示信息的顯示控制單元50相接。
用戶把存儲卡15插入裝置1的插槽16中,直到存儲卡15的端子22與裝置1的插槽中的端子34相接觸。現(xiàn)在,存儲卡就在電氣和機械上與裝置1相接。
處理器30能通過輸入端36接受模擬語音信號并通過A/D轉(zhuǎn)換器將語音信號轉(zhuǎn)換成數(shù)字語音信號。進而,通過用戶的選擇,處理器30能對該數(shù)字語音信號用至少兩種不同的數(shù)據(jù)壓縮步驟之一進行處理。假設(shè)處理器30能對該語音信號進行兩種數(shù)據(jù)壓縮處理,每種壓縮處理步驟在對同一語音信號壓縮后得到的壓縮比是各不相同的。該數(shù)據(jù)壓縮處理步驟可以是無損耗的。這意味著實際上沒有丟失任何數(shù)據(jù)。且在解壓數(shù)據(jù)時可得到與原有語音一模一樣的語音信號。無損耗數(shù)據(jù)壓縮方法的一個例子是線性預(yù)測編碼,隨后是對線性預(yù)測編碼器的輸出進行的Huffman編碼,數(shù)據(jù)壓縮也可是帶損耗的。一種帶損耗數(shù)據(jù)壓縮方法是本領(lǐng)域所熟知的分波段編碼(subband coding),并應(yīng)用于DCC數(shù)字式磁記錄系統(tǒng)中。在帶損耗數(shù)據(jù)壓縮方法中,聽不到的那部分語音信息實際上被丟棄了。數(shù)據(jù)解壓就是恢復(fù)原始語音信號。既然在數(shù)據(jù)壓縮時被丟棄的那部分語音是聽不見的,那么在再現(xiàn)語音信號時用戶聽到的語音信號就和原有的一樣。
處理器30既能執(zhí)行無損耗數(shù)據(jù)壓縮處理步驟,也能執(zhí)行帶損耗的數(shù)據(jù)壓縮處理步驟,這是處理器30能實現(xiàn)的兩種不同數(shù)據(jù)壓縮步驟。作為一種替代,處理器30能執(zhí)行兩種不同的無損耗數(shù)據(jù)壓縮步驟,它們分別產(chǎn)生不同的數(shù)據(jù)壓縮比。另外一種替代是,處理器30能對語音信號執(zhí)行兩種不同的無損耗數(shù)據(jù)壓縮處理步驟,它們產(chǎn)生不同的數(shù)據(jù)壓縮比。這兒給出后一種可能性的一個例子與用于DCC中一樣,給處理器30配備一個簡單分波段編碼器??捎煤唵蔚脑摲植ǘ尉幋a器是因為要求用于編碼語音信號的分波段數(shù)目較少,因為語音信號的帶寬比寬帶音頻信號小得多,只需較少數(shù)目的分波段,例如5,而不是用于DCC分波段編碼器的32。通過在對簡化的分波段編碼器進行位分配操作時改變其位池(bitpool),就可以簡單化的分波段編碼器得到不同壓縮比。關(guān)于這方面的信息請參考列于本說明書末尾的文件(1),(2),(3a),(3b)。
當(dāng)用戶想往裝置中灌錄一段語音時,按一下LETTER按鈕6,此按鈕表示用戶想存儲一段語音,另外用戶可按動MODE按鈕7,以便選擇不同的模式。如該語音段是否具有(高)優(yōu)先權(quán),或該語音段是否受保護以免被覆蓋。隨后用戶啟動按鈕10來選擇錄制模式。選擇錄制模式意味著用戶選擇了數(shù)據(jù)壓縮模式。若用戶想讓錄制音質(zhì)較好,他/她就選擇產(chǎn)生最低數(shù)據(jù)壓縮比的數(shù)據(jù)壓縮模式,這樣存儲器20將存儲這一語音段的更多信息用于所述口授,結(jié)果是存儲器能存儲的語音段數(shù)目更少。如果用戶想在存儲器存儲盡可能多的語音段,他/她就選擇具有較高數(shù)據(jù)壓縮比的數(shù)據(jù)壓縮模式,結(jié)果是存儲的語音段的音質(zhì)較差。
所壓縮的信息包括在信息塊(或“文件”)Bi、Bi+1、Bi+2,…中。如圖4所示。每一信息塊Bi具有一信息頭(用HDR表示),和信息體(用IP表示)。另外,在信息頭中存有一標(biāo)識信號,信號塊的頭部HDR中的標(biāo)識信號標(biāo)識對語音信號的壓縮模式,以便生成存儲在同一信號塊的信息體IP部分的數(shù)據(jù)壓縮信息。信號塊的序列號提供給處理器30的數(shù)字輸出端32,然后存于存儲卡15的存儲器20中。
這里應(yīng)當(dāng)指出,處理器30能生成盡可能長的信號塊用來完整記錄每一語音段的信息。處理器30也能產(chǎn)生固定長度的信號塊,這樣,一個語音段的數(shù)據(jù)壓縮信息就存儲在由處理器30產(chǎn)生的多個連續(xù)的信號塊中。
如果用戶想得到存儲在存儲器20中的語音段,處理器30能恢復(fù)存儲器20中的壓縮數(shù)據(jù)信息并對存于存儲器20中的壓縮數(shù)據(jù)信息執(zhí)行數(shù)據(jù)解壓操作。顯然,數(shù)據(jù)解壓操作就是在口授階段執(zhí)行的數(shù)據(jù)壓縮操作的逆操作。在后面用圖5說明復(fù)讀裝置的實施例時,將進一步解釋處理器30執(zhí)行的數(shù)據(jù)解壓操作。得到語音信號副本后,經(jīng)處理器進行數(shù)/模轉(zhuǎn)換,供給輸出端40,用于揚聲器18重放。
為將存儲于存儲卡15上存儲器20中的語音段復(fù)讀出來,將裝置1上的存儲卡15拔出,插入桌面的復(fù)讀裝置50中,見圖5。復(fù)讀裝置52包含一數(shù)字信號處理器53,它具有數(shù)字輸入端54,與端子56相連,當(dāng)將存儲卡插入該裝置52中的插入槽(沒畫出)時,該端子56在電氣上和存儲卡15的管腳22相連。揚聲器58經(jīng)放大器62與處理器53的模擬輸出端60相連。處理器53還包括與顯示器68上控制顯示信息的顯示控制單元66相連的控制輸出端64。鍵盤70與處理器53的控制輸入端72相連。
用戶將存儲卡15插入復(fù)讀裝置52的插槽(沒畫出)中。直到存儲卡15的端子22與復(fù)讀裝置52的插槽中的端子56相接觸,現(xiàn)在存貯卡在機械和電氣上就與裝置52相連。
按動鍵盤70上的RETRIEVE(恢復(fù))鍵,存儲卡15上存儲器20中的信息就被讀出,并保存在數(shù)字信號處理器53的內(nèi)部存儲器中。處理器對從存儲卡中恢復(fù)的信息能執(zhí)行至少兩種不同的數(shù)據(jù)解壓操作。顯然,處理器53執(zhí)行的解壓模式正好與處理器30在口授階段執(zhí)行的壓縮模式相反。處理器53從信號塊頭部HDR中檢索到標(biāo)識信號,并按此標(biāo)識信號執(zhí)行數(shù)據(jù)解壓操作,結(jié)果得到數(shù)字化語音信號的副本。
處理器53進一步將數(shù)字語音信號副本進行數(shù)/模轉(zhuǎn)換轉(zhuǎn)換成模擬語音信號,并將模擬語音信號經(jīng)輸出端60供給揚聲器58,這樣打字員或別人就能聽到需要復(fù)讀的語音信號。
打字員用鍵盤70打出由揚聲器播出的語音段,于是就得到了該語音段的打字形式。
復(fù)讀裝置52的另一實施例,采用具有充分大的存儲容量的個人計算機時,該裝置可配上語音識別算法,使該裝置在對語音信號識別后從語音信號生成字符文件,借助顯示器68能見到字符文件的內(nèi)容。這樣打字員就能一邊閱讀顯示屏幕68上的文本檢查錯誤,一邊監(jiān)聽從揚聲器58出來的語音,同時還可通過鍵盤70改正文本中的錯誤。
前面介紹了一個無損耗數(shù)據(jù)壓縮方法的例子,即線性預(yù)測編碼,后隨Huffman編碼。不言而喻,處理器53肯定能執(zhí)行相應(yīng)的Huffman解碼,后隨相應(yīng)的線性預(yù)測解碼,用于再生原語音信號。
前面也介紹了一種帶損耗的數(shù)據(jù)壓縮方法的實例,即分波段編碼。不言而喻,處理器53應(yīng)能執(zhí)行相應(yīng)的分波段解碼操作,用于再生成原語音信號的副本。
盡管本說明描述了本發(fā)明及其優(yōu)選實施方案,應(yīng)當(dāng)相信,并不局限于上述這些例子。因此,本領(lǐng)域的技術(shù)人員可在不超出本發(fā)明權(quán)利要求規(guī)定的范圍內(nèi)作各種明顯的改動。進一步講,本發(fā)明在于這兒公開的特性所蘊含的每個新特性或各種特性的組合。
相關(guān)文檔(1)歐洲專利申請?zhí)?02,973(PHN13.241)(2)歐洲專利申請?zhí)?00,755(PHQ89.018A)(3a)歐洲專利申請?zhí)?57,390(PHN13.328)(3b)歐洲專利申請?zhí)?57,391(PHN13.329)
權(quán)利要求
1.一種口授系統(tǒng),包括一種用于將語音信號存于存儲部件中的手持式口授裝置,該裝置包含能將語音信號壓縮成數(shù)據(jù)壓縮語音信號的數(shù)據(jù)壓縮部件,和在存儲部件中存儲數(shù)據(jù)壓縮語音信號的存儲部件,其特征在于數(shù)據(jù)壓縮部件被設(shè)計成至少可用兩種不同的數(shù)據(jù)壓縮模式之一對語音信號進行數(shù)據(jù)壓縮,當(dāng)對同一語音信號用至少兩種不同的數(shù)據(jù)壓縮模式進行壓縮時會得到不同的數(shù)據(jù)壓縮比,用戶可選擇所述至少兩種不同的數(shù)據(jù)壓縮模式,數(shù)據(jù)壓縮部件還可生成包含數(shù)據(jù)壓縮語音信號部分的數(shù)據(jù)文件,該數(shù)據(jù)文件包含一個文件頭,數(shù)據(jù)壓縮部件還適于生成用于標(biāo)識所選擇的數(shù)據(jù)壓縮模式的標(biāo)識信號并將其保存于文件頭中。
2.權(quán)利要求1的口授系統(tǒng),其特征在于存儲部件包括用于存儲該數(shù)據(jù)文件的可拆卸式固態(tài)存貯單元,該固態(tài)存儲單元帶有連接部件,用于將存儲單元與手持式口授裝置在機械和電氣上相連。
3.權(quán)利要求2的口授系統(tǒng),其特征在于連接部件還被設(shè)計成在機械和電氣上將該存儲單元與PC機相連。
4.權(quán)利要求3的口授系統(tǒng),其特征在于連接部件被設(shè)計成在機械和電氣上將該存儲單元與該PC機的國際標(biāo)準(zhǔn)接口相連。
5.權(quán)利要求4的口授系統(tǒng),其特征在于所述接口就是PCMCLA接口。
6.權(quán)利要求2-5中任一項權(quán)利要求的口授系統(tǒng),其特征在于固態(tài)存儲單元包括一種EEPROM。
7.權(quán)利要求2-5中的任一項權(quán)利要求的口授系統(tǒng),其特征在于固態(tài)存儲單元包括快速可擦式存儲單元。
8.權(quán)利要求1-5中任一項權(quán)利要求的口授系統(tǒng),其特征在于固態(tài)存儲單元包括一個后備電池。
9.前述權(quán)利要求中任一項權(quán)利要求的口授系統(tǒng),其特征在于數(shù)據(jù)壓縮部件被設(shè)計成至少可用兩種不同的數(shù)據(jù)壓縮模式之一對語音信號進行數(shù)據(jù)壓縮處理,所述至少兩種數(shù)據(jù)壓縮模式中至少有一種是帶損耗的數(shù)據(jù)壓縮模式。
10.用于前述任一項權(quán)利要求的口授系統(tǒng)中的手持式口授裝置,該裝置包括將語音信號壓縮成數(shù)據(jù)壓縮語音信號的數(shù)據(jù)壓縮部件,其特征在于,該數(shù)據(jù)壓縮部件被設(shè)計成至少能用兩種不同的數(shù)據(jù)壓縮模式之一對語音信號進行數(shù)據(jù)壓縮處理,該至少兩種不同的數(shù)據(jù)壓縮模式所得的壓縮比是不同的,用戶可選擇所說的至少兩種不同的數(shù)據(jù)壓縮模式,該數(shù)據(jù)壓縮部件還可生成包含數(shù)據(jù)壓縮語音信號部分的數(shù)據(jù)文件,該數(shù)據(jù)文件包括一個文件頭,該數(shù)據(jù)壓縮部件還生成用于標(biāo)識被選的數(shù)據(jù)壓縮模式的標(biāo)識信號并將該標(biāo)識信號保存于所述文件頭中。
11.權(quán)利要求10的手持式口授裝置,其特征在于,它具有與可拆卸式固態(tài)存儲單元的連接部件在機械上和電氣上相連的連接部件。
12.權(quán)利要求11的手持式口授裝置,其特征在于連接部件是按照一種國際標(biāo)準(zhǔn)接口制造的。
13.權(quán)利要求12的手持式口授裝置,其特征在于所述的接口是PCMCLA接口。
14權(quán)利要求10-13中任一項權(quán)利要求的手持式口授裝置,其特征在于數(shù)據(jù)壓縮部件適于用至少兩種不同的數(shù)據(jù)壓縮模式之一對語音信號進行數(shù)據(jù)壓縮,所說的至少兩種不同的數(shù)據(jù)壓縮模式中至少有一種是帶損耗的數(shù)據(jù)壓縮模式。
15.用于復(fù)讀語音信息的復(fù)讀裝置,其特征在于它包括用于對存儲于存儲部件中的數(shù)據(jù)壓縮語音信號進行解壓操作的數(shù)據(jù)解壓部件,所述數(shù)據(jù)壓縮語音信號由至少兩種不同數(shù)據(jù)壓縮模式中的一種進行數(shù)據(jù)壓縮而成,對于相同語音信號,用該至少兩種不同的數(shù)據(jù)壓縮模式進行數(shù)據(jù)壓縮得到不同的數(shù)據(jù)壓縮比,該數(shù)據(jù)壓縮語音信號作為數(shù)據(jù)文件存于存儲部件中,該數(shù)據(jù)文件包含數(shù)據(jù)壓縮語音信號部分,數(shù)據(jù)文件還包括存有標(biāo)識信號的文件頭,該標(biāo)識信號表示對語音信號進行數(shù)據(jù)壓縮時所選的數(shù)據(jù)壓縮模式,數(shù)據(jù)解壓部件能從文件頭中檢索到該標(biāo)識信號,并按此標(biāo)識信號的要求用至少兩種不同數(shù)據(jù)解壓模式中的一種對文件中的數(shù)據(jù)壓縮語音信息進行解壓操作,以便得到該語音信號的副本。
16.權(quán)利要求15的復(fù)讀裝置,其特征在于存儲部件是可拆卸式固態(tài)存儲單元,該復(fù)讀裝置具有與該固態(tài)存儲單元的連接部件在機械上、電氣上相連的連接部件。
17.權(quán)利要求16的復(fù)讀裝置,其特征在于該連接部件是按照一種國際標(biāo)準(zhǔn)接口的要求制造的。
18.權(quán)利要求17的復(fù)讀裝置,其特征在于所述接口是PCMCIA接口。
19.可拆卸式固態(tài)存儲單元,包含數(shù)據(jù)壓縮語音信號,所述數(shù)據(jù)壓縮語音信號是采用至少兩種不同的數(shù)據(jù)壓縮模式中的一種進行數(shù)據(jù)壓縮的,當(dāng)對相同的語音信號用至少兩種不同的數(shù)據(jù)壓縮模式進行數(shù)據(jù)壓縮時所得到的數(shù)據(jù)壓縮比是不同的,該數(shù)據(jù)壓縮語音信號以數(shù)據(jù)文件形式存于存儲部件中,該數(shù)據(jù)文件包含數(shù)據(jù)壓縮語音信號部分,該數(shù)據(jù)文件包括存有標(biāo)識信號的文件頭,該標(biāo)識信號識別對語音信號進行數(shù)據(jù)壓縮時所選的數(shù)據(jù)壓縮模式。
20.權(quán)利要求19的固態(tài)存儲單元,其特征在于它具有將該存儲器與PC機在機械、電氣上相連的連接部件。
21.權(quán)利要求20的固態(tài)存儲單元,其特征在于該連接部件將該存儲單元與PC機的一種國際標(biāo)準(zhǔn)接口在機械、電氣上相連。
22.權(quán)利要求21的固態(tài)存儲單元,其特征在于所述的接口是PCMCIA接口。
全文摘要
此處公開的口授系統(tǒng)包括一種將語音信號存于存儲部件(15,20)的手持式口授裝置(1),該裝置包含能將語音信號壓縮成數(shù)據(jù)壓縮語音信號的數(shù)據(jù)壓縮部件(30)和存儲數(shù)據(jù)壓縮語音信號在存儲器部件內(nèi)的存儲部件。數(shù)據(jù)壓縮部件(30)被設(shè)計成以至少可用兩種不同的數(shù)據(jù)壓縮模式之一對語音信號進行數(shù)據(jù)壓縮,當(dāng)用至少兩種不同的數(shù)據(jù)壓縮模式對同一語音信號進行壓縮時將得到不同的數(shù)據(jù)壓縮比。用戶可選擇至少所述兩種不同的數(shù)據(jù)壓縮模式。數(shù)據(jù)壓縮部件(30)還適于生成包含數(shù)據(jù)壓縮語音信號部分的數(shù)據(jù)文件(Bi),數(shù)據(jù)文件包含一文件頭(HDR)。數(shù)據(jù)壓縮部件還適于生成用于標(biāo)識被選數(shù)據(jù)壓縮模式的標(biāo)識信號并將該標(biāo)識信號保存于文件頭中。
文檔編號G10L19/00GK1185854SQ97190285
公開日1998年6月24日 申請日期1997年1月24日 優(yōu)先權(quán)日1996年2月12日
發(fā)明者H·博爾德爾 申請人:菲利浦電子有限公司