專利名稱:一種字符輸入的方法和輸入法系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計算機信息輸入領(lǐng)域,特別是涉及一種字符輸入的方法和系 統(tǒng), 一種臨時詞庫的生成方法和系統(tǒng),以及一種優(yōu)化輸入法詞庫的方法和系統(tǒng)。
背景技術(shù):
隨著計算機技術(shù)以及互聯(lián)網(wǎng)技術(shù)的普及與發(fā)展,不同專業(yè)領(lǐng)域、不同 興趣以及使用習(xí)慣的用戶對于輸入法系統(tǒng)的智能性和個性化要求越來越高。在現(xiàn)有技術(shù)中,輸入法系統(tǒng)一般包括系統(tǒng)詞庫,所述系統(tǒng)詞庫通過對眾多 文檔集合(例如,傳統(tǒng)新聞、報紙)的分析得到比較通用的詞頻及排序,從而 保證輸入法系統(tǒng)的首選詞命中率。但是由于生成詞庫所依賴的文檔集合來源都是封閉的、特定的,所以不能滿足人們生活中信息迅速膨脹、詞匯變化頻繁的 情況。中國專利文件CN1936893中公開了 "一種基于互聯(lián)網(wǎng)信息的輸入法詞頻庫 的生成方法和系統(tǒng)",其輸入法詞庫可以從浩瀚的互聯(lián)網(wǎng)信息中統(tǒng)計分析得到, 從而能夠滿足信息快速傳播的需要,提高了使用者的首選詞的命中率,提高了 輸入速度和效率。但是上面的兩種輸入法詞庫都存在一個共同的問題,即在一段時間內(nèi)是一 個固定的綜合詞庫。也就是說,現(xiàn)有的輸入法詞庫沒有考慮到輸入法用戶在 不同的應(yīng)用環(huán)境中需要不同的詞匯集合,比如,用戶是在聊天、回郵件、寫文 檔......等等。輸入法用戶在不同的應(yīng)用環(huán)境中,面臨的是一些不同的詞語,比如輸入拼音"ciba",在計算機領(lǐng)域"詞霸"的可能性更大一些,而在談?wù)撌称窌r 是"糨粑"的可能性更大一些,再比如,寫論文時所使用的詞匯和聊天時所使用的詞匯肯定不相同??傊?,迫切需要本領(lǐng)域技術(shù)人員解決的一個技術(shù)問題就是如何改進現(xiàn)有 的輸入法詞庫,使其能夠滿足不同應(yīng)用環(huán)境用戶的需求,更好的實現(xiàn)用戶的個 性化輸入。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是提供一種字符輸入的方法和輸入法系統(tǒng),能 夠使輸入法用戶在不同的應(yīng)用環(huán)境中都能最快最好的得到希望輸入的字詞。
相應(yīng)的,本發(fā)明的一個目的在于,提供一種臨時詞庫的生成方法和系統(tǒng), 以及一種優(yōu)化輸入法詞庫的方法和系統(tǒng),用于幫助得到最佳的輸入法詞庫,從 而使得輸入法用戶在不同的應(yīng)用環(huán)境中都能得到非常好的體驗。
為了解決上述問題,依據(jù)本發(fā)明的實施例,公開了一種字符輸入的方法,
具體可以包括以下步驟獲取當(dāng)前系統(tǒng)環(huán)境中,應(yīng)用程序所涉及的文本數(shù)據(jù); 對所述文本數(shù)據(jù)進行分析,生成臨時詞庫;加載輸入法已有詞庫和所述臨時詞 庫;接收用戶的輸入信息;依據(jù)所接收的輸入信息,在輸入法已有詞庫和所述 臨時詞庫中進行檢索,得到相應(yīng)的候選項;接收用戶的選擇信息,將指定的候 選項上屏輸出。
其中,可以通過以下方式獲取所述文本數(shù)據(jù)當(dāng)顯示文本數(shù)據(jù)時,通過預(yù) 置函數(shù),截獲操作系統(tǒng)中文本輸出函數(shù)的輸出內(nèi)容。
或者,也可以通過以下步驟獲取所述文本數(shù)據(jù)獲取文件的路徑;通過操 作系統(tǒng)提供的接口讀取該文件的文本內(nèi)容,或者直沖矣讀取該文件的文本內(nèi)容。 優(yōu)選的,通過掃描進程獲得文件路徑或者通過監(jiān)控應(yīng)用程序獲取新接收文件的 路徑。
或者,也可以通過以下方式獲取所述文本數(shù)據(jù)模擬復(fù)制操作;從操作系 統(tǒng)緩存中獲取應(yīng)用程序所涉及的文本數(shù)據(jù)。
優(yōu)選的,該方法中,可以針對當(dāng)前系統(tǒng)環(huán)境中的一個應(yīng)用程序文檔生成一 個臨時詞庫;或者,也可以針對當(dāng)前系統(tǒng)環(huán)境中的一個應(yīng)用程序生成一個臨時 詞庫;或者,也可以針對當(dāng)前系統(tǒng)環(huán)境中的多個應(yīng)用程序生成一個臨時詞庫。
優(yōu)選的,所述臨時詞庫包括詞序信息、二元或多元關(guān)系信息。
優(yōu)選的,該方法還可以包括針對臨時詞庫中的每個詞條,依據(jù)臨時詞庫 中的詞頻信息和輸入法已有詞庫中的詞頻信息,得到權(quán)重參數(shù),所述權(quán)重參數(shù) 用于候選項排序。
優(yōu)選的,該方法還可以包括存儲所述臨時詞庫,以及;整理分析所述臨 時詞庫,獲取有效信息。其中,所述有效信息可以包括新詞;或者,當(dāng)臨時詞庫記錄有詞條相應(yīng)的輸入環(huán)境信息時,所述有效信息也可以包括針對詞條及其 輸入環(huán)境的分析結(jié)果。優(yōu)選的,該方法還可以包括對應(yīng)用程序進行篩選;和/或,對應(yīng)用程序 的文本數(shù)據(jù)進行篩選。依據(jù)本發(fā)明另一實施例,公開了一種輸入法系統(tǒng),具體可以包括 文本數(shù)據(jù)獲取模塊,用于獲取當(dāng)前系統(tǒng)環(huán)境中,應(yīng)用程序所涉及的文本數(shù)據(jù);臨時詞庫生成模塊,用于對所述文本數(shù)據(jù)進行分析,生成臨時詞庫; 輸入接口模塊,用于接收用戶的輸入信息;信息轉(zhuǎn)換模塊,用于依據(jù)所接收的輸入信息,在輸入法已有詞庫和所述臨 時詞庫中進行;險索,得到相應(yīng)的候選項;顯示輸出模塊,用于顯示所述候選項,以及接收用戶的選擇信息,將指定 的候選項上屏輸出。其中,可以通過以下方式獲取所述文本數(shù)據(jù)當(dāng)顯示文本數(shù)據(jù)時,通過預(yù) 置函數(shù),截獲操作系統(tǒng)中文本輸出函數(shù)的輸出內(nèi)容;或者,獲取文件的路徑; 通過操作系統(tǒng)提供的接口讀取該文件的文本內(nèi)容,或者直接讀取該文件的文本 內(nèi)容;或者,模擬復(fù)制操作;從操作系統(tǒng)緩存中獲取應(yīng)用程序所涉及的文本數(shù) 據(jù)。優(yōu)選的,所述的系統(tǒng)還可以包括系統(tǒng)監(jiān)控^^莫塊,用于監(jiān)控系統(tǒng)當(dāng)前的狀 態(tài),以及當(dāng)符合預(yù)置條件時,通知啟動文本數(shù)據(jù)獲取模塊;和/或,用于監(jiān)控 所獲取的文本數(shù)據(jù),以及當(dāng)符合預(yù)置條件時,通知啟動臨時詞庫生成模塊。優(yōu)選的,所述的系統(tǒng)還可以包括權(quán)重參數(shù)生成模塊,用于針對臨時詞庫 中的每個詞條,依據(jù)臨時詞庫中的詞頻信息和輸入法已有詞庫中的詞頻信息, 得到權(quán)重參數(shù),所述權(quán)重參數(shù)用于候選項排序。優(yōu)選的,所述的系統(tǒng)還可以包括臨時存儲模塊,用于存儲所述臨時詞庫; 優(yōu)化模塊,用于整理分析所述臨時詞庫,獲取有效信息。其中,所述有效信息 可以包括新詞;或者,當(dāng)臨時詞庫記錄有詞條相應(yīng)的輸入環(huán)境信息時,所述有 效信息也可以包括針對詞條及其輸入環(huán)境的分析結(jié)果。依據(jù)本發(fā)明的另一實施例,公開了一種臨時詞庫的生成方法,可以包括獲取當(dāng)前系統(tǒng)環(huán)境中,應(yīng)用程序所涉及的文本數(shù)據(jù);對所述文本數(shù)據(jù)進行分析, 生成臨時詞庫;所述臨時詞庫用于檢索獲得輸入法候選項。其中,可以通過以下方式獲取所述文本數(shù)據(jù)當(dāng)顯示文本數(shù)據(jù)時,通過預(yù) 置函數(shù),截獲操作系統(tǒng)中文本輸出函數(shù)的輸出內(nèi)容;或者,獲取文件的路徑; 通過操作系統(tǒng)提供的接口讀取該文件的文本內(nèi)容,或者直接讀取該文件的文本 內(nèi)容;或者,模擬復(fù)制操作;從操作系統(tǒng)緩存中荻取應(yīng)用程序所涉及的文本數(shù) 據(jù)。依據(jù)本發(fā)明的另一實施例,公開了一種臨時詞庫的生成系統(tǒng),可以包括.-文本數(shù)據(jù)獲取單元,用于獲取當(dāng)前系統(tǒng)環(huán)境中,應(yīng)用程序所涉及的文本數(shù)據(jù);臨時詞庫生成單元,用于對所述文本數(shù)據(jù)進行分析,生成臨時詞庫;所述 臨時詞庫,用于同輸入法已有詞庫一起,檢索獲得輸入法候選項。其中,可以通過以下方式獲取所述文本數(shù)據(jù)當(dāng)顯示文本數(shù)據(jù)時,通過預(yù) 置函數(shù),截獲操作系統(tǒng)中文本輸出函數(shù)的輸出內(nèi)容;或者,獲取文件的路徑; 通過操作系統(tǒng)提供的接口讀取該文件的文本內(nèi)容,或者直接讀取該文件的文本 內(nèi)容;或者,模擬復(fù)制操作;從操作系統(tǒng)緩存中獲取應(yīng)用程序所涉及的文本數(shù) 據(jù)。依據(jù)本發(fā)明的另一實施例,公開了 一種優(yōu)化輸入法詞庫的方法,可以包括 獲取當(dāng)前系統(tǒng)環(huán)境中,應(yīng)用程序所涉及的文本數(shù)據(jù);對所述文本數(shù)據(jù)進行分析, 生成臨時詞庫;整理分析所述臨時詞庫,獲取有效信息。其中,所述有效信息 可以包括新詞;或者,當(dāng)臨時詞庫記錄有詞條相應(yīng)的輸入環(huán)境信息時,所述有 效信息也可以包括針對詞條及其輸入環(huán)境的分析結(jié)果。依據(jù)本發(fā)明的另 一實施例,公開了 一種優(yōu)化輸入法詞庫的系統(tǒng),可以包括 文本數(shù)據(jù)獲取單元,用于獲取當(dāng)前系統(tǒng)環(huán)境中,應(yīng)用程序所涉及的文本數(shù)據(jù);臨時詞庫生成單元,用于對所述文本數(shù)據(jù)進行分析,生成臨時詞庫; 優(yōu)化單元,用于整理分析所述臨時詞庫,獲取有效信息。 其中,所述有效信息可以包括新詞;或者,當(dāng)臨時詞庫記錄有詞條相應(yīng)的 輸入環(huán)境信息時,所述有效信息也可以包括針對詞條及其輸入環(huán)境的分析結(jié)果。與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點當(dāng)用戶使用輸入法時,往往伴隨著相應(yīng)文檔的操作,也就是說存在一定的 語言上下文,比如,用戶打開一篇文檔,從IM收到新的消息,收到新的郵件......等等。應(yīng)用本發(fā)明,當(dāng)用戶在這些應(yīng)用環(huán)境中使用輸入法,輸入法就可以自動 學(xué)習(xí)對應(yīng)環(huán)境中的這些文本內(nèi)容,形成一個臨時詞語關(guān)系庫,供用戶使用。通 過這種方式,用戶在每一個新的會話中,都可以得到很好的輸入體驗,從而可 以從根本上解決現(xiàn)有的輸入法詞庫綜合性太強、個性化較弱的問題。并且,本發(fā)明可以進一步對所得到的臨時詞庫進行分析,通過不斷分析用 戶的臨時詞庫,提取有效信息,例如,新詞等等,從而進一步優(yōu)化輸入法,例 如,可以形成一個針對該用戶自己的個性化詞庫。進一步,優(yōu)選的,所述有效 信息還可以包括針對詞條及其輸入環(huán)境的分析結(jié)果,進而形成細(xì)胞詞庫(針對 某一特定環(huán)境的專用詞庫)等等,從另一角度優(yōu)化輸入法。
圖l是一種字符輸入的方法實施例的步驟流程圖;圖2是一種輸入法系統(tǒng)的實施例的結(jié)構(gòu)框圖;圖3是一種臨時詞庫生成方法實施例的步驟流程圖;圖4是一種臨時詞庫生成系統(tǒng)的實施例的結(jié)構(gòu)框圖;圖5是一種優(yōu)化輸入法詞庫的方法實施例的步驟流程圖。
具體實施方式
為使本發(fā)明的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結(jié)合附圖和具體實施方式
對本發(fā)明作進一步詳細(xì)的iJt明。本發(fā)明可以適用于各種語言,例如,中文、日文、韓文、英文等,由于本 發(fā)明在各種語言文字中的應(yīng)用流程都是相似的,所以為了方便說明,下面僅僅 對本發(fā)明應(yīng)用在中文的情況進行說明。本發(fā)明可以采用的輸入方式可以包括鍵盤符號、手寫信息以及語音輸入 等等,由于這些輸入方式中的信息轉(zhuǎn)換方式都屬于公知技術(shù),在此就不詳 述了。本發(fā)明所實現(xiàn)的個性化輸入過程可用于眾多通用或?qū)S玫挠嬎阆到y(tǒng)環(huán)境或配置中。例如個人計算機、服務(wù)器計算機、手持移動設(shè)備或便攜式設(shè)備、平板型設(shè)備、多處理器系統(tǒng)、基于微處理器的系統(tǒng)、置頂盒、可編程的消費電子設(shè)備、網(wǎng)絡(luò)PC、小型計算機、大型計算機、包括以上任何系統(tǒng)或設(shè)備的分 布式計算環(huán)境等等。參照圖1,示出了一種字符輸入的方法實施例,具體可以包括以下步驟步驟IOI,獲取當(dāng)前系統(tǒng)環(huán)境中,應(yīng)用程序所涉及的文本數(shù)據(jù);所述的應(yīng)用程序可以包括各種涉及文本內(nèi)容的軟件,例如,Word、 PDF、 txt文件、郵件、即時通訊工具、網(wǎng)頁瀏覽器等等。對于具體的獲取方式將在 本說明書的后面進行詳細(xì)介紹。步驟102,對所述文本數(shù)據(jù)進行分析,生成臨時詞庫;一般的分析過程可以包括分詞統(tǒng)計過程,例如,發(fā)現(xiàn)新詞、統(tǒng)計詞頻和統(tǒng) 計詞語關(guān)系信息。 一般的,臨時詞庫可以包括詞條、詞序信息和二元信息。因 為通常情況下,對于詞語關(guān)系的統(tǒng)計,僅僅統(tǒng)計二元信息即可。所述的二元信 息是指表示文本前后詞之間的連接關(guān)系, 一般也可以稱為二元統(tǒng)計(或者, Bigram),其中的"二元"特指兩兩相鄰關(guān)系的統(tǒng)計。例如,輸入信息為"不到長 城非好漢",如果我們以字作為最小的拆分單位時,我們可以拆分出 "不,,"到,,"長,,"城""非""好""漢"7個單字,而其中的二元包括"不到","到長", "長城,,,"城非","非好","好漢"。所收集的輸入信息中的詞頻和二元組合關(guān) 系可以反映該用戶在日常輸入過程中常用的一些詞匯和語言使用風(fēng)格,從而可 以滿足該用戶的個性化輸入需求。需要說明的是,二元信息并不僅基于字,也可以基于詞,或者字和詞之間。 當(dāng)然,為了統(tǒng)計基于詞的二元信息,是需要一分詞模塊的。當(dāng)然,本發(fā)明并不限定僅僅收集二元信息,實際上從效果而言,能夠收集 n元(論2)的關(guān)系信息是更佳的,只是限于目前用戶終端的計算能力,僅僅 獲取二元信息是一個比較優(yōu)選的方案。當(dāng)然,在計算能力容許的情況下,所述臨時詞庫還可以包括更多的信息(例 如,字與字之間、字與詞之間的概率關(guān)系、字詞所來自的應(yīng)用程序等等),其生成過程也可以采用更為精密的計算方法,本發(fā)明對此并不需要加以限定。進一步,臨時詞庫的生成還可以包括一些優(yōu)化措施,例如,對文本數(shù)據(jù)分 析后某些不符合預(yù)置條件的詞就可以不需要加入到臨時詞庫中,例如,排序很 靠后的詞,或者該詞雖然在臨時詞庫中排序靠前,但是在輸入法已有詞庫中也 排序靠前,頻率很高,則都可以排除在臨時詞庫之外。所述排序一般是指編碼 字符串相同的字詞的排序,例如,對于拼音輸入法,則就是拼音相同的字詞的 排序。步驟103,加載輸入法已有詞庫和所述臨時詞庫;所述的輸入法已有詞庫可以包括輸入法系統(tǒng)詞庫,也可以包括輸入法用戶 詞庫等等,總之就是指不需要臨時生成的詞庫。所述的加載過程可以為:將臨時詞庫與已有詞庫合并為一個詞庫,置于緩 存中。這樣用戶在后續(xù)操作中可以按照普通詞庫的使用方式直接使用。即當(dāng)用 戶觸發(fā)某個臨時詞庫時,則將該臨時詞庫與已有詞庫合并,置于緩存中,用于 用戶輸入時的檢索。當(dāng)然,還可以在合并后的詞庫中通過添加標(biāo)記等方式,以 區(qū)分某個詞條是屬于臨時詞庫還是已有詞庫。所述的加載過程也可以為將臨時詞庫與已有詞庫作為兩個獨立詞庫置于 緩存中,并依據(jù)預(yù)置規(guī)則設(shè)定詞庫優(yōu)先級;所述優(yōu)先級用于候選項的顯示排序。 一般情況下,臨時詞庫的優(yōu)先級高于已有詞庫。即在加載過程中,將臨時詞庫 置于已有詞庫以外指定的空間,并在檢索已有詞庫的同時也檢索臨時詞庫。步驟104,接收用戶的輸入信息;步驟105,依據(jù)所接收的輸入信息,在輸入法已有詞庫和所述臨時詞庫中 進行^r索,得到相應(yīng)的候選項;一般的,臨時詞庫的權(quán)重值大于已有詞庫的權(quán)重值,例如,最簡單的一種 情況,搜索策略可以直接設(shè)定為臨時詞庫中詞的排序都先于已有詞庫中的詞。 當(dāng)然,也可以通過用戶設(shè)定的方式或者通過自動設(shè)定的方式,將臨時詞庫中的 詞條直接以固定位置輸出。優(yōu)選的,在本實施例中,采用的搜索策略可以為當(dāng)某個候選項僅僅在已 有詞庫中檢索到,則輸出該候選項,并以已有詞庫中的詞頻或其他信息為依據(jù) 進行排序;當(dāng)某個候選項僅僅在臨時詞庫中檢索到,則輸出該候選項,并以臨時詞庫中的詞序或者其他信息為依據(jù)進行排序;當(dāng)某個候選項在兩個詞庫中都 找到,則可以對已有詞庫中的詞頻進行加權(quán)^修正,依據(jù)修正后的詞頻進行排序 (當(dāng)然,對于修正后的詞頻可以進行存儲,也可以不進行存儲)。進一步,本發(fā)明還可以采用其他可行的搜索策略,例如,當(dāng)生成臨時詞庫 時,對于每個詞條,計算得到一個權(quán)重值(或者叫權(quán)重參數(shù)),所述權(quán)重值和輸入法已有詞庫中的詞頻有關(guān);則,當(dāng)匹配輸出時,依據(jù)該權(quán)重值對各候選項進行排序輸出。例如, 一種簡單的實現(xiàn)方式,由臨時詞庫的詞頻或者已有詞庫 的詞頻乘以該權(quán)重值得到針對該候選項的排序參數(shù)。步驟106,接收用戶的選擇信息,將指定的候選項上屏輸出。 步驟104至步驟106的實現(xiàn)可以采用現(xiàn)有的各種輸入法實現(xiàn)方案,在此不 再詳述。需要說明的是,本實施例中所述的臨時詞庫的生成,可以針對當(dāng)前系統(tǒng)環(huán) 境中的一個文檔生成一個臨時詞庫,例如,用戶打開了 5個word文檔,則生 成5個相應(yīng)的臨時詞庫。臨時詞庫也可以針對當(dāng)前系統(tǒng)環(huán)境中的 一個應(yīng)用程序生成一個臨時詞庫, 例如,雖然用戶打開了 5個記事本,但是將這5個記事本中的文本內(nèi)容綜合處 理生成一個臨時詞庫;然后針對該用戶打開的一個ppt文檔生成另 一個臨時詞 庫。臨時詞庫也可以針對當(dāng)前系統(tǒng)環(huán)境中的多個應(yīng)用程序生成一個臨時詞庫, 例如,用戶打開了 l個word文檔,l個記事本, 一個ppt文檔,則綜合處理該 3個應(yīng)用程序所涉及的文本內(nèi)容,生成一個臨時詞庫。上述各種生成方式(或者稱生成策略)可以應(yīng)用于各種不同的場合,本領(lǐng) 域技術(shù)人員根據(jù)需要選用即可,本發(fā)明并不需要對臨時詞庫的具體生成情況加 以限制。如果生成了多個臨時詞庫,則各個臨時詞庫之間可以通過標(biāo)識進行區(qū) 分,以指向正確的輸入環(huán)境。當(dāng)生成了多個臨時詞庫時,具體的加載過程可能有所變化。 一般的,可以 僅僅加載用戶當(dāng)前正在操作的文檔所對應(yīng)的臨時詞庫即可。當(dāng)然,也可以加載 全部的臨時詞庫,依據(jù)用戶當(dāng)前是否正在操作,賦予各個臨時詞庫不同的權(quán)重 值。例如,賦予當(dāng)前操作的臨時詞庫最高的權(quán)重值,檢索時僅僅檢索該臨時詞庫和已有詞庫即可;或者,也可以檢索權(quán)重值高于一定閾值的多個臨時詞庫。需要說明的是,對于本實施例中的上述多個步驟之間的順序關(guān)系并非固定 不變,在此依次說明僅僅是為了描述方便。例如,輸入法啟動,加載已有詞庫, 然后獲取文本數(shù)據(jù)和生成臨時詞庫,加載臨時詞庫;當(dāng)然,也可以事先完成文 本數(shù)據(jù)的獲取和臨時詞庫的生成,當(dāng)輸入法系統(tǒng)啟動時,完成加載即可。對于數(shù)據(jù)獲取,可以在用戶操作的整個過程中進行積累;而對于詞庫生成, 則實際上可以在任意時刻完成。臨時詞庫生成之后,隨著時間的推移,應(yīng)用程序所涉及的文本內(nèi)容可能發(fā) 生變化(例如,用戶在一段時間內(nèi)向word文檔新輸入了 3000字的文本內(nèi)容), 則臨時詞庫就需要更新。對于獲取文本內(nèi)容的過程可以一直在進行,然后當(dāng)符 合預(yù)置條件時(例如,滿足預(yù)置的時間間隔),生成新的臨時詞庫并更新舊的 臨時詞庫,進而通知輸入法加載新的臨時詞庫。由于臨時詞庫的數(shù)據(jù)量較小, 所以其更新過程一般不會影響用戶的輸入行為。當(dāng)然,如果數(shù)據(jù)量較大的話, 則可以通過異步的方式進行。優(yōu)選的,本實施例還可以包括以下步驟存儲所述臨時詞庫,以及整理分 析所述臨時詞庫,獲取有效信息,合并至所述輸入法已有詞庫中。例如,將臨 時詞庫存儲在用戶本地硬盤上,利用本地系統(tǒng)空閑的計算資源,對所有的臨時詞庫進行整理分析,提取符合預(yù)置條件的信息一一有效信息(例如,詞頻和2 元關(guān)系大于一定閾值),將這些信息按照歸并的方式合并到已有詞庫中,從而 在一定程度豐富用戶本地的已有詞庫,從另一個角度滿足該用戶的個性化需 求。整理分析后的臨時詞庫可以^v本地刪除,以減少對本地存儲資源的占用。 進一步,對于臨時詞庫的分析可以有各種各樣的方式,例如,將各個用戶 的臨時詞庫進行匯集,通過網(wǎng)絡(luò)上傳至服務(wù)器端,由服務(wù)器進行分析從而發(fā)現(xiàn) 新詞。再例如,匯集各個臨時詞庫,分析各個詞條及其輸入環(huán)境(例如應(yīng)用程 序名稱或者類型等)的關(guān)系,從而形成多個分別針對某個特定環(huán)境的專用詞 庫——細(xì)胞詞庫,這些新詞或者細(xì)胞詞庫都可以提供給其他用戶,用來進一步 優(yōu)化輸入法系統(tǒng)。當(dāng)然,為了得到準(zhǔn)確的細(xì)胞詞庫,需要從臨時詞庫中去除非 用戶輸入的詞匯,因為非用戶輸入的詞匯可能對分析結(jié)果帶來不恰當(dāng)?shù)挠绊憽?對于如何獲取用戶的輸入詞匯,可以有多種實現(xiàn)方式,例如,可以通過截獲輸入法上屏詞匯而獲得,也可以通過當(dāng)用戶打開一應(yīng)用程序時所獲得文本婆:據(jù)和經(jīng)過一段時間后所獲得的文本數(shù)據(jù)的差別,得到該用戶的輸入詞匯。下面對步驟101中的獲取文本數(shù)據(jù)的具體可能采用的幾種方式進行介紹, 僅僅用于舉例說明本發(fā)明的實現(xiàn),而不應(yīng)理解為對本發(fā)明的限制,本領(lǐng)域技術(shù)的各種才乘作系統(tǒng)中,例如,Windows、 Linux、 MacOS、 FreeBSD, Unix, Solaris 等等,以及用于移動終端的PalmOS, Windows Mobile, Symbian等等。下面 的說明僅僅以常用的Windows操作系統(tǒng)為例進行說明。獲取方式1:通過監(jiān)控計算設(shè)備屏幕顯示內(nèi)容,實現(xiàn)截獲文本內(nèi)容的目的。 例如,可以通過以下步驟獲取所述文本數(shù)據(jù)在操作系統(tǒng)中預(yù)置API鉤子函數(shù); 當(dāng)顯示文本數(shù)據(jù)時,截獲文本輸出函數(shù)的輸出內(nèi)容。以Windows操作系統(tǒng)為例, 一般的屏幕顯示內(nèi)容都需要通過文本輸出函 數(shù)(例如TextOut等)完成,則本發(fā)明可以給系統(tǒng)掛API鉤子函數(shù)(Hook函 數(shù))的方式實現(xiàn)屏幕文字的截取,如在TextOut等文字輸出函數(shù)的開頭寫了一 個jmp語句,通過Hook函數(shù),跳轉(zhuǎn)到事先定義好的函數(shù)中,獲取要TextOut 繪制的文本。通過這種方式,可以獲取通過屏幕顯示的各種文本數(shù)據(jù)。例如,打開的郵 件、即使通訊消息、word文檔等等。獲取方式2,通過直接讀取文件中的文本數(shù)據(jù)的方式獲取。例如,可以通 過以下步驟獲取所述文本數(shù)據(jù)獲取文件的路徑;通過操作系統(tǒng)提供的COM 接口讀取該文件的文本內(nèi)容,或者直接讀取該文件的文本內(nèi)容。具體而言,對于文本文件(例如txt文件),可以直接讀取其文本數(shù)據(jù)。而 對于非文本文件,現(xiàn)有的操作系統(tǒng)一般都提供了 OLE技術(shù),OLE是Object Linking and Embedding的縮寫,可以翻譯為對象鏈接和嵌入。OLE是在客戶應(yīng) 用程序間傳輸和共享信息的一組綜合標(biāo)準(zhǔn),其允許創(chuàng)建帶有指向應(yīng)用程序的鏈 接的混合文檔以使用戶修改時不必在應(yīng)用程序間切換的協(xié)議。本發(fā)明可以利用 OLE技術(shù)讀取現(xiàn)有操作系統(tǒng)上大部分文件中的文本數(shù)據(jù)。例如,像O伍ce、 PDF等文件在windows 2000以后的操作系統(tǒng),提供了一個IFilter的COM接口,允許應(yīng)用程序注冊這個接口 。凡是注冊了這個接 口的應(yīng)用程序產(chǎn)生的文件,其他的應(yīng)用程序可以通過這個接口讀取其文本內(nèi) 容,比如對于O伍ce、 Adobe、 PDF等文件,本發(fā)明都可以通過這種方式讀取 其文本內(nèi)容。 一般過程可以為依據(jù)文件路徑獲取相應(yīng)文件的IFilter對象, 判斷該文件是否已被注冊,如果該文件已被注冊,則通過IFilter::GetValue獲 取文本內(nèi)容。其中,如何獲取文件的路徑,是一個需要解決的技術(shù)問題。本發(fā)明在這里 給出幾種可行的方式a、通過掃描系統(tǒng)進程的方式獲得文件路徑;b、通過監(jiān) 控應(yīng)用程序接口的方式獲取文件路徑(例如,可以應(yīng)用于郵件、即時通訊等程 序,通過解析其接口實現(xiàn)監(jiān)控);c、通過監(jiān)控應(yīng)用程序通過屏幕顯示的文本內(nèi) 容,得知文件路徑(例如,獲取即時通訊工具所新接收文件的存儲路徑)。例 如在live messenger的聊天窗口中,出現(xiàn)"You have successfully received E:\Documents\My Received Files\txt.txt from (C).",則說明其文件接收完畢,并 可以從中將涉及的文件路徑取出來。通過獲取方式2,可以獲得文件中的各種數(shù)據(jù),包括通過屏幕顯示的文本 數(shù)據(jù),也可以包括那些沒有通過屏幕顯示的數(shù)據(jù),例如, 一個word文檔有30 頁,該輸入法用戶僅僅瀏覽了前5頁,并正在對第5頁添加批注,則通過獲取 方式l,僅僅能夠獲得前5頁的文本數(shù)據(jù),而通過獲取方式2,則可以獲得該 文檔所有的文本數(shù)據(jù)。通過獲取方式2,還可以獲取并不屬于當(dāng)前操作文檔中 的文本數(shù)據(jù),例如,用戶打開了兩個word文檔,正在操作一個文檔,通過荻 取方式2,可以獲得另一文檔中的文本數(shù)據(jù);以及用戶通過msn接收了一個文 件,但是還沒有打開,而通過獲取方式2就可以獲得該文件中的文本數(shù)據(jù)。獲取方式3,通過讀取操作系統(tǒng)緩存的方式實現(xiàn),例如剪貼板。現(xiàn)有的大部分應(yīng)用程序都支持文本解析(例如,word),針對某個應(yīng)用程 序模擬"全選(Ctrl—A)""復(fù)制(Ctrl—C)"消息。如果應(yīng)用程序處理這些消息, 數(shù)據(jù)就能夠進入剪貼板;則進而可以通過讀取剪貼板中數(shù)據(jù)的方式獲取所需的 文本數(shù)據(jù)。當(dāng)然,模擬"全選(Ctrl_A)""復(fù)制(Ctrl—C)"消息僅僅是一個舉 例,實際上可以通過模擬各種4泉盤組合消息或者鼠標(biāo)消息,以達到對某個應(yīng)用 程序中任意文本數(shù)據(jù)的選取。優(yōu)選的,圖1所示的實施例還可以包括篩選步驟對應(yīng)用程序進行篩選,和/或,對應(yīng)用程序的文本數(shù)據(jù)進行篩選;從中去除一些非文本數(shù)據(jù),或者去除 一些非輸入環(huán)境。例如,用戶打開的應(yīng)用程序是音視頻播放器,或者是畫圖程序,則對該應(yīng) 用程序所涉及的文本數(shù)據(jù)就不需要獲取,當(dāng)用戶操作的程序符合預(yù)置條件(所 述預(yù)置條件可以為事先定義的程序名稱或者屬性等)時,才開始獲取文本數(shù)據(jù) 的步驟或者才開始進行對文本數(shù)據(jù)的分析。再例如,用戶雖然打開的是word文檔,但是當(dāng)通過獲取方式1所獲取的 文本數(shù)據(jù)會包括一些無效數(shù)據(jù)(如,文件、編輯、試圖、插入、格式、工具、 表格、窗口和幫助等工具欄名稱等文字),而這些文本數(shù)據(jù)并不能反映輸入用 戶的環(huán)境,所以這些文本數(shù)據(jù)不應(yīng)該進入分析流程,因此,可以通過一些預(yù)置 的策略將這些無效數(shù)據(jù)進行篩除。參照圖2,示出了本發(fā)明一種輸入法系統(tǒng)的實施例,具體可以包括 文本數(shù)據(jù)獲^Mt塊201,用于獲取當(dāng)前系統(tǒng)環(huán)境中,應(yīng)用程序所涉及的文 本數(shù)據(jù);臨時詞庫生成模塊202,用于對所述文本數(shù)據(jù)進行分析,生成臨時詞庫206;輸入接口模塊203,用于接收用戶的輸入信息;其中所述的用戶輸入信息 可以包括鍵盤符號、手寫信息以及語音輸入等等;信息轉(zhuǎn)換模塊204,用于依據(jù)所接收的輸入信息,在輸入法已有詞庫207 和所述臨時詞庫206中進行檢索,得到相應(yīng)的候選項;顯示輸出模塊205,用于顯示所述候選項,以及接收用戶的選擇信息,將 指定的候選項上屏輸出。本輸入法系統(tǒng)的實施例可以針對用戶的輸入環(huán)境生成相應(yīng)的臨時詞庫,以 滿足用戶個性化輸入的需求。所述的文本數(shù)據(jù)獲取模塊201中獲取文本數(shù)據(jù)的方式可以為在操作系統(tǒng) 中預(yù)置API鉤子函數(shù);當(dāng)顯示文本數(shù)據(jù)時,截獲文本輸出函數(shù)的輸出內(nèi)容。所 述的文本數(shù)據(jù)獲取模塊201也可以通過以下方式獲取所述文本數(shù)據(jù)獲取文件的路徑;通過操作系統(tǒng)提供的COM接口讀取該文件的文本內(nèi)容,或者直接讀 取該文件的文本內(nèi)容。其中,可以通過掃描進程獲得文件路徑或者通過監(jiān)控應(yīng) 用程序獲取新接收文件的路徑。當(dāng)然,也可以通過模擬復(fù)制操作;從操作系統(tǒng) 緩存中獲取應(yīng)用程序所涉及的文本數(shù)據(jù)。進一步,本輸入法實施例還可以包括系統(tǒng)監(jiān)控模塊,用于監(jiān)控系統(tǒng)當(dāng)前的狀態(tài),以及當(dāng)符合預(yù)置條件時,通知啟動文本數(shù)據(jù)獲取模塊;和/或,用于 監(jiān)控所獲取的文本數(shù)據(jù),以及當(dāng)符合預(yù)置條件時,通知啟動臨時詞庫生成模塊。 進一步避免無效的數(shù)據(jù)處理過程,提高計算效率。為了避免臨時詞庫和已有詞庫的沖突,以及進一步提高排序的準(zhǔn)確性,本 實施例還可以包括權(quán)重參數(shù)生成模塊,用于針對臨時詞庫中的每個詞條,依據(jù) 臨時詞庫中的詞頻信息和輸入法已有詞庫中的詞頻信息,得到權(quán)重參數(shù),所述 權(quán)重參數(shù)用于候選項排序。為了進一步利用所匯集的文本數(shù)據(jù),則本實施例還可以包括用于存儲所 述臨時詞庫的臨時存儲模塊;以及,用于整理分析所述臨時詞庫,獲取有效信 息,合并至所述輸入法已有詞庫中的優(yōu)化模塊。上述輸入法系統(tǒng)的實施例可以為普通輸入法系統(tǒng),如,通過用戶本地 計算設(shè)備完成整個輸入過程,包括信息輸入、信息轉(zhuǎn)換以及顯示輸出。上 述輸入法系統(tǒng)的實施例也可以為網(wǎng)絡(luò)輸入法系統(tǒng),如,通過用戶本地計算 設(shè)備完成輸入信息的接入,以及候選項的顯示輸出,而信息轉(zhuǎn)換過程則在 另一計算設(shè)備中完成。當(dāng)然,如果應(yīng)用于網(wǎng)絡(luò)輸入法系統(tǒng),則本實施例還需要將生成的臨時詞庫發(fā)送至另一計算設(shè)備,或者將獲取的文本數(shù)據(jù)發(fā)送 至另一計算設(shè)備。也就是說,本發(fā)明并不需要限定輸入法系統(tǒng)實施例中的各個模塊的具體地理位置,只要具有相應(yīng)的功能和相應(yīng)的連接關(guān)系即可。參照圖3,示出了一種臨時詞庫的生成方法實施例,具體可以包括 步驟301,獲取當(dāng)前系統(tǒng)環(huán)境中,應(yīng)用程序所涉及的文本數(shù)據(jù); 步驟302,對所述文本數(shù)據(jù)進行分析,生成臨時詞庫;所述臨時詞庫用于 ;險索獲得輸入法候選項。例如,生成臨時詞庫之后,通過通知輸入法系統(tǒng)啟動 加載臨時詞庫的方式,以實現(xiàn)在用戶輸入過程中發(fā)揮臨時詞庫的作用。所述臨時詞庫的生成可以針對一個應(yīng)用程序文檔生成,也可以針對一個應(yīng)用程序生 成,也可以針對多個應(yīng)用程序生成。其中,可以通過以下步驟獲取所述文本數(shù)據(jù)在操作系統(tǒng)中預(yù)置API鉤子 函數(shù);當(dāng)顯示文本數(shù)據(jù)時,截獲文本輸出函數(shù)的輸出內(nèi)容?;蛘?,也可以通過 以下步驟獲取所述文本數(shù)據(jù)獲得文件的路徑;通過操作系統(tǒng)提供的COM接 口讀取該文件的文本內(nèi)容,或者直接讀取該文件的文本內(nèi)容。當(dāng)然,也可以通 過模擬復(fù)制操作;從操作系統(tǒng)緩存中獲取應(yīng)用程序所涉及的文本數(shù)據(jù)。優(yōu)選的,本實施例還可以包括步驟303,存儲所述臨時詞庫;以及,步驟 304,整理分析所述臨時詞庫,獲取有效信息。所述有效信息可以合并至所述 輸入法已有詞庫中,也可以用于獲取新詞或者用于生成細(xì)胞詞庫等等。本發(fā)明 并不需要對有效信息的具體內(nèi)容以及有效信息的具體應(yīng)用方式加以限定。參照圖4,示出了一種臨時詞庫的生成系統(tǒng)實施例,可以包括文本數(shù)據(jù)獲取單元401,用于獲取當(dāng)前系統(tǒng)環(huán)境中,應(yīng)用程序所涉及的文 本數(shù)據(jù);臨時詞庫生成單元402,用于對所述文本數(shù)據(jù)進4亍分析,生成臨時詞庫 403;所述臨時詞庫403,用于同輸入法已有詞庫一起,4全索獲得輸入法候選 項。臨時詞庫生成之后,可以由本實施例將其發(fā)送給輸入法系統(tǒng)進行加載,從 而幫助實現(xiàn)個性化的輸入,或者由本實施例將臨時詞庫存儲在約定位置,輸入 法直接調(diào)用,以完成個性化輸入。其中,可以通過以下步驟獲取所述文本數(shù)據(jù)在操作系統(tǒng)中預(yù)置API鉤子 函數(shù);當(dāng)顯示文本數(shù)據(jù)時,截獲文本輸出函數(shù)的輸出內(nèi)容?;蛘撸部梢酝ㄟ^ 以下步驟獲取所述文本數(shù)據(jù)獲得文件的路徑;通過操作系統(tǒng)提供的COM接 口讀取該文件的文本內(nèi)容,或者直接讀取該文件的文本內(nèi)容。由于臨時詞庫記錄了很多準(zhǔn)確的用戶個性輸入信息,所以本實施例還可以 通過以下模塊,將這些個性信息綜合分析后添加到輸入法已有詞庫中用于存 儲所述臨時詞庫的臨時存儲單元404;以及,用于整理分析所述臨時詞庫403, 獲取有效信息,合并至所述輸入法已有詞庫406中的優(yōu)化單元405。當(dāng)然,所 述有效信息可以合并至所述輸入法已有詞庫中,也可以用于獲取新詞或者用于生成細(xì)詞庫。參照圖5,示出了本發(fā)明一種優(yōu)化輸入法詞庫的方法實施例,可以包括步驟501、獲取當(dāng)前系統(tǒng)環(huán)境中,應(yīng)用程序所涉及的文本數(shù)據(jù);步驟502、對所述文本數(shù)據(jù)進行分析,生成臨時詞庫;步驟503、整理分析所述臨時詞庫,獲取有效信息。所述有效信息可以合 并至所述輸入法已有詞庫中,也可以用于獲取新詞或者用于生成細(xì)胞詞庫。步 驟503可以定期執(zhí)行,例如,每隔一定的時間間隔,或者臨時詞庫的數(shù)量達到 預(yù)定閾值,或者臨時詞庫的數(shù)據(jù)量達到預(yù)定閾值等等。需要說明的是,所生成的臨時詞庫可以不提供給輸入法應(yīng)用,即本實施例 可以作為純粹的優(yōu)化輸入法詞庫的實施例。相應(yīng)的,還可以存在一種優(yōu)化輸入法詞庫的系統(tǒng)實施例,具體包括文本數(shù)據(jù)獲取單元,用于獲取當(dāng)前系統(tǒng)環(huán)境中,應(yīng)用程序所涉及的文本數(shù)據(jù);臨時詞庫生成單元,用于對所述文本數(shù)據(jù)進行分析,生成臨時詞庫; 優(yōu)化單元,用于整理分析所述臨時詞庫,獲取有效信息。所述有效信息可以合并至所述輸入法已有詞庫中,也可以用于獲取新詞或者用于生成細(xì)胞詞庫。本說明書中的各個實施例均采用遞進的方式描述,各個實施例之間相同相 似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之 處。尤其,對于系統(tǒng)實施例而言,由于其基本相似于方法實施例,所以描述的 比較簡單,相關(guān)之處參見方法實施例的部分說明即可。以上對本發(fā)明所提供的一種字符輸入的方法和系統(tǒng), 一種臨時詞庫的生成 方法和系統(tǒng),以及一種優(yōu)化輸入法詞庫的方法和系統(tǒng),進4亍了詳細(xì)介紹,本文只是用于幫助理解本發(fā)明的方法及其核心思想;同時,對于本領(lǐng)域的一般技術(shù) 人員,依據(jù)本發(fā)明的思想,在具體實施方式
及應(yīng)用范圍上均會有改變之處,綜 上所述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。
權(quán)利要求
1、一種字符輸入的方法,其特征在于,包括獲取當(dāng)前系統(tǒng)環(huán)境中,應(yīng)用程序所涉及的文本數(shù)據(jù);對所述文本數(shù)據(jù)進行分析,生成臨時詞庫;加載輸入法已有詞庫和所述臨時詞庫;接收用戶的輸入信息;依據(jù)所接收的輸入信息,在輸入法已有詞庫和所述臨時詞庫中進行檢索,得到相應(yīng)的候選項;接收用戶的選擇信息,將指定的候選項上屏輸出。
2、 如權(quán)利要求1所述的方法,其特征在于,通過以下方式獲取所述文本 數(shù)據(jù)當(dāng)顯示文本數(shù)據(jù)時,通過預(yù)置函數(shù),截獲操作系統(tǒng)中文本輸出函數(shù)的輸出 內(nèi)容。
3、 如權(quán)利要求1所述的方法,其特征在于,通過以下步驟獲取所述文本 數(shù)據(jù)獲取文件的路徑;通過操作系統(tǒng)提供的接口讀取該文件的文本內(nèi)容,或者直接讀取該文件的 文本內(nèi)容。
4、 如權(quán)利要求3所述的方法,其特征在于,通過掃描進程獲得文件路徑 或者通過監(jiān)控應(yīng)用程序獲取新接收文件的路徑。
5、 如權(quán)利要求1所述的方法,其特征在于,通過以下方式獲取所述文本 數(shù)據(jù)模擬復(fù)制操作;從操作系統(tǒng)緩存中獲取應(yīng)用程序所涉及的文本數(shù)據(jù)。
6、 如權(quán)利要求l所述的方法,其特征在于,針對當(dāng)前系統(tǒng)環(huán)境中的一個應(yīng)用程序文檔生成一個臨時詞庫; 或者,針對當(dāng)前系統(tǒng)環(huán)境中的一個應(yīng)用程序生成一個臨時詞庫; 或者,針對當(dāng)前系統(tǒng)環(huán)境中的多個應(yīng)用程序生成一個臨時詞庫。
7、 如權(quán)利要求l所述的方法,其特征在于,所述臨時詞庫包括詞序信息、 二元或多元關(guān)系信息。
8、 如權(quán)利要求l所述的方法,其特征在于,還包括針對臨時詞庫中的每個詞條,依據(jù)臨時詞庫中的詞頻信息和輸入法已有詞 庫中的詞頻信息,得到權(quán)重參數(shù),所述權(quán)重參數(shù)用于候選項排序。
9、 如權(quán)利要求l所述的方法,其特征在于,還包括 存儲所述臨時詞庫,以及; 整理分析所述臨時詞庫,獲取有效信息。
10、 如權(quán)利要求9所述的方法,其特征在于 所述有效信息包括新詞;或者,當(dāng)臨時詞庫記錄有詞條相應(yīng)的輸入環(huán)境信息時,所述有效信息包括 針對詞條及其輸入環(huán)境的分析結(jié)果。
11、 如權(quán)利要求l所述的方法,其特征在于,還包括 對應(yīng)用程序進行篩選;和/或,對應(yīng)用程序的文本數(shù)據(jù)進行篩選。
12、 一種輸入法系統(tǒng),其特征在于,包括文本數(shù)據(jù)獲取模塊,用于獲取當(dāng)前系統(tǒng)環(huán)境中,應(yīng)用程序所涉及的文本數(shù)據(jù);臨時詞庫生成模塊,用于對所述文本數(shù)據(jù)進行分析,生成臨時詞庫; 輸入接口模塊,用于接收用戶的輸入信息;信息轉(zhuǎn)換模塊,用于依據(jù)所接收的輸入信息,在輸入法已有詞庫和所述臨 時詞庫中進行檢索,得到相應(yīng)的候選項;顯示輸出模塊,用于顯示所述候選項,以及接收用戶的選擇信息,將指定 的候選項上屏輸出。
13、 如權(quán)利要求12所述的系統(tǒng),其特征在于,通過以下方式獲取所述文 本數(shù)據(jù)當(dāng)顯示文本數(shù)據(jù)時,通過預(yù)置函數(shù),截獲操作系統(tǒng)中文本輸出函數(shù)的輸出 內(nèi)容;或者,獲取文件的路徑;通過操作系統(tǒng)提供的接口讀取該文件的文本內(nèi)容, 或者直接讀取該文件的文本內(nèi)容;或者,才莫擬復(fù)制操作;從操作系統(tǒng)緩存中獲取應(yīng)用程序所涉及的文本數(shù)據(jù)。
14、 如權(quán)利要求12所述的系統(tǒng),其特征在于,還包括 系統(tǒng)監(jiān)控模塊,用于監(jiān)控系統(tǒng)當(dāng)前的狀態(tài),以及當(dāng)符合預(yù)置條件時,通知啟動文本數(shù)據(jù)獲取模塊;和/或,用于監(jiān)控所獲取的文本數(shù)據(jù),以及當(dāng)符合預(yù)置條件時,通知啟動臨時詞庫生成模塊。
15、 如權(quán)利要求12所述的系統(tǒng),其特征在于,還包括 ^l重參數(shù)生成^f莫塊,用于針對臨時詞庫中的每個詞條,依據(jù)臨時詞庫中的詞頻信息和輸入法已有詞庫中的詞頻信息,得到權(quán)重參數(shù),所述權(quán)重參數(shù)用于 候選項排序。
16、 如權(quán)利要求12所述的系統(tǒng),其特征在于,還包括 臨時存儲^^莫塊,用于存儲所述臨時詞庫;優(yōu)化模塊,用于整理分析所述臨時詞庫,獲取有效信息。
17、 如權(quán)利要求16所述的系統(tǒng),其特征在于 所述有效信息包括新詞;或者,當(dāng)臨時詞庫記錄有詞條相應(yīng)的輸入環(huán)境信息時,所述有效信息包括 針對詞條及其輸入環(huán)境的分析結(jié)果。
18、 一種臨時詞庫的生成方法,其特征在于,包括 獲取當(dāng)前系統(tǒng)環(huán)境中,應(yīng)用程序所涉及的文本數(shù)據(jù); 對所述文本數(shù)據(jù)進行分析,生成臨時詞庫;所述臨時詞庫用于檢索獲得輸入法4美選項。
19、 如權(quán)利要求18所述的方法,其特征在于,通過以下方式獲取所述文 本數(shù)據(jù)當(dāng)顯示文本數(shù)據(jù)時,通過預(yù)置函數(shù),截獲操作系統(tǒng)中文本輸出函數(shù)的輸出 內(nèi)容;或者,獲取文件的路徑;通過操作系統(tǒng)提供的接口讀取該文件的文本內(nèi)容, 或者直接讀取該文件的文本內(nèi)容;或者,模擬復(fù)制操作;從操作系統(tǒng)緩存中獲取應(yīng)用程序所涉及的文本數(shù)據(jù)。
20、 一種臨時詞庫的生成系統(tǒng),其特征在于,包括 文本數(shù)據(jù)獲取單元,用于獲取當(dāng)前系統(tǒng)環(huán)境中,應(yīng)用程序所涉及的文本數(shù)據(jù);臨時詞庫生成單元,用于對所述文本數(shù)據(jù)進行分析,生成臨時詞庫;所述 臨時詞庫,用于同輸入法已有詞庫一起,;險索獲得輸入法候選項。
21、 如權(quán)利要求20所述的系統(tǒng),其特征在于,通過以下方式獲取所述文 本數(shù)據(jù)當(dāng)顯示文本數(shù)據(jù)時,通過預(yù)置函數(shù),截獲操作系統(tǒng)中文本輸出函數(shù)的輸出 內(nèi)容;或者,獲取文件的路徑;通過操作系統(tǒng)提供的接口讀取該文件的文本內(nèi)容, 或者直接讀取該文件的文本內(nèi)容;或者,模擬復(fù)制操作;從操作系統(tǒng)緩存中獲取應(yīng)用程序所涉及的文本數(shù)據(jù)。
22、 一種優(yōu)化輸入法詞庫的方法,其特征在于,包括 獲取當(dāng)前系統(tǒng)環(huán)境中,應(yīng)用程序所涉及的文本數(shù)據(jù); 對所述文本數(shù)據(jù)進行分析,生成臨時詞庫; 整理分析所述臨時詞庫,獲取有效信息。
23、 如權(quán)利要求22所述的方法,其特征在于 所述有效信息包括新詞;或者,當(dāng)臨時詞庫記錄有詞條相應(yīng)的輸入環(huán)境信息時,所述有效信息包括 針對詞條及其輸入環(huán)境的分析結(jié)果。
24、 一種優(yōu)化輸入法詞庫的系統(tǒng),其特征在于,包括 文本數(shù)據(jù)獲取單元,用于獲取當(dāng)前系統(tǒng)環(huán)境中,應(yīng)用程序所涉及的文本數(shù)據(jù);臨時詞庫生成單元,用于對所述文本數(shù)據(jù)進行分析,生成臨時詞庫; 優(yōu)化單元,用于整理分析所述臨時詞庫,獲取有效信息。
25、 如權(quán)利要求24所述的系統(tǒng),其特征在于 所述有效信息包括新詞;或者,當(dāng)臨時詞庫記錄有詞條相應(yīng)的輸入環(huán)境信息時,所述有效信息包括 針對詞條及其輸入環(huán)境的分析結(jié)果。
全文摘要
本發(fā)明提供了一種字符輸入的方法,具體可以包括以下步驟獲取當(dāng)前系統(tǒng)環(huán)境中,應(yīng)用程序所涉及的文本數(shù)據(jù);對所述文本數(shù)據(jù)進行分析,生成臨時詞庫;加載輸入法已有詞庫和所述臨時詞庫;接收用戶的輸入信息;依據(jù)所接收的輸入信息,在輸入法已有詞庫和所述臨時詞庫中進行檢索,得到相應(yīng)的候選項;接收用戶的選擇信息,將指定的候選項上屏輸出。應(yīng)用本發(fā)明,當(dāng)用戶使用輸入法時,輸入法就可以自動學(xué)習(xí)對應(yīng)環(huán)境中的這些文本內(nèi)容,形成一個臨時詞語關(guān)系庫,供用戶使用。通過這種方式,用戶在每一個新的會話中,都可以得到很好的輸入體驗,從而可以從根本上解決現(xiàn)有的輸入法詞庫綜合性太強、個性化較弱的問題。
文檔編號G06F17/30GK101334774SQ20071011817
公開日2008年12月31日 申請日期2007年6月29日 優(yōu)先權(quán)日2007年6月29日
發(fā)明者張智敏 申請人:北京搜狗科技發(fā)展有限公司