国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      計(jì)算機(jī)文字輸入方法和系統(tǒng)及其詞庫(kù)維護(hù)方法和裝置的制作方法

      文檔序號(hào):6460151閱讀:189來(lái)源:國(guó)知局
      專(zhuān)利名稱(chēng):計(jì)算機(jī)文字輸入方法和系統(tǒng)及其詞庫(kù)維護(hù)方法和裝置的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及計(jì)算機(jī)的文字處理技術(shù),尤其涉及一種計(jì)算機(jī)文字輸入方法 和文字輸入系統(tǒng),及其的詞庫(kù)維護(hù)方法和維護(hù)裝置。
      背景技術(shù)
      計(jì)算機(jī)文字輸入方法很多,主要通過(guò)計(jì)算機(jī)的鍵盤(pán)輸入特定的文字編 碼,根據(jù)該文字編碼生成對(duì)應(yīng)的文字,完成最終的輸入。所述的特定文字編 碼有許多種,對(duì)于漢字來(lái)講,主要有拼音編碼、五筆字型編碼、筆劃編碼等。對(duì)于文字輸入法系統(tǒng),一般都設(shè)置有用戶(hù)詞庫(kù),用于記錄用戶(hù)輸入的文 字,并在用戶(hù)下次輸入文字時(shí),優(yōu)先顯示用戶(hù)詞庫(kù)中詞頻較高的文字作為候 選對(duì)象供用戶(hù)選擇輸入,以提高用戶(hù)輸入速度。圖1為一種現(xiàn)有的拼音輸入法的處理流程示意圖。參見(jiàn)圖l,該流程包括三個(gè)階段,即音節(jié)劃分,候選詞生成和智能組詞。用戶(hù)首先輸入拼音串(也就是文字編碼);文字輸入系統(tǒng)按照一定的劃 分策略對(duì)輸入的拼音串進(jìn)行拼音劃分;再根據(jù)音節(jié)劃分的結(jié)果,生成音節(jié)序 列對(duì)應(yīng)的候選詞并按照一定的詞頻或最后記憶功能依次排列顯示給用戶(hù)進(jìn) 行選擇;在整個(gè)音節(jié)序列沒(méi)有對(duì)應(yīng)候選詞的情況下,則需要智能組詞,即通 過(guò)某種算法進(jìn)行動(dòng)態(tài)組詞以形成完整的整句結(jié)果,然后顯示給用戶(hù);用戶(hù)在 候選的字詞或整句中選擇一個(gè)需要的就完成了一次文字的輸入。并且在輸入 字詞或整句的同時(shí),文字輸入系統(tǒng)需要將輸入的文字記錄到用戶(hù)詞庫(kù)中,并 統(tǒng)計(jì)對(duì)應(yīng)的輸入頻率,即詞頻。但是,現(xiàn)有的文字輸入系統(tǒng)中,用戶(hù)詞庫(kù)只是簡(jiǎn)單地對(duì)用戶(hù)所輸入的所 有文字都進(jìn)行記錄,并進(jìn)行詞頻統(tǒng)計(jì)。然而對(duì)于世界上的大部分語(yǔ)言,存在著這樣的客觀語(yǔ)言規(guī)律,即既有實(shí)詞、也有虛詞。對(duì)計(jì)算機(jī)輸入法的用戶(hù)來(lái)說(shuō),對(duì)文字輸入速度起實(shí)質(zhì)影響的是實(shí)詞,而且是使用頻率高的實(shí)詞;并且實(shí)詞之間也會(huì)呈現(xiàn)出各種組合,從而得到意義不同的短語(yǔ),例如用戶(hù)輸入"喜歡"這個(gè)詞的詞頻達(dá)到100,但是其中有90次前面都是加有"不"字, 所以用戶(hù)的習(xí)慣用語(yǔ)應(yīng)該是"不喜歡"而不是"喜歡"?,F(xiàn)有文字輸入系統(tǒng)將用戶(hù)輸入的所有文字都存入用戶(hù)詞庫(kù),而真正利用 到的只是其中的實(shí)詞,其中大量的虛詞都是沒(méi)有實(shí)際意義的冗余信息,并且 對(duì)實(shí)詞之間也沒(méi)有進(jìn)行本意分析以正確反映用戶(hù)的習(xí)慣用語(yǔ)。這樣導(dǎo)致用戶(hù) 詞庫(kù)所占的存儲(chǔ)空間較大,并且在進(jìn)行詞頻排序等處理時(shí)所需計(jì)算量也較 大,影響文字輸入系統(tǒng)的處理速度;并且輸出的候選詞常常不能精確反映用 戶(hù)的習(xí)慣用語(yǔ),影響用戶(hù)文字輸入的速度。另外,目前也出現(xiàn)了一種網(wǎng)絡(luò)文字輸入系統(tǒng)及其對(duì)應(yīng)的輸入法,該方法 在網(wǎng)絡(luò)側(cè)的服務(wù)器上設(shè)置有核心詞庫(kù),參見(jiàn)圖1中的核心詞庫(kù),各個(gè)終端上 的文字輸入系統(tǒng)可以將本地輸入的文字上報(bào)給服務(wù)器,或者將本地的用戶(hù)詞 庫(kù)上報(bào)給服務(wù)器,由服務(wù)器將各個(gè)用戶(hù)詞庫(kù)內(nèi)的文字記錄到核心詞庫(kù)中,并 對(duì)各個(gè)文字進(jìn)行詞頻統(tǒng)計(jì)排序。終端用戶(hù)也可以從服務(wù)器下載所述核心詞庫(kù) 作為本地的用戶(hù)詞庫(kù)進(jìn)行文字輸入。鑒于現(xiàn)有技術(shù)中用戶(hù)詞庫(kù)的冗余信息較多,終端將用戶(hù)詞庫(kù)上報(bào)給服務(wù) 器后,核心詞庫(kù)的冗余信息將會(huì)更大,導(dǎo)致既占用過(guò)多的網(wǎng)絡(luò)存儲(chǔ)資源,又 浪費(fèi)了大量的計(jì)算資源。并且, 一般利用網(wǎng)絡(luò)文字輸入系統(tǒng)的用戶(hù)都是通過(guò) 網(wǎng)絡(luò)傳輸方式進(jìn)行文字交流的,對(duì)于同一段時(shí)期、或者同一個(gè)網(wǎng)絡(luò)區(qū)域的用 戶(hù)來(lái)說(shuō),由于需要相互交流,因此各個(gè)用戶(hù)所用到的習(xí)慣用語(yǔ)非常雷同,然 而現(xiàn)有的這種核心詞庫(kù)也不能精確體現(xiàn)出整體用戶(hù)的習(xí)慣用語(yǔ),從而影響用 戶(hù)的文字輸入速度和文字交流速度。發(fā)明內(nèi)容有鑒于此,本發(fā)明所要解決的技術(shù)問(wèn)題在于提供一種計(jì)算機(jī)文字輸入系統(tǒng)的詞庫(kù)維護(hù)方法和維護(hù)裝置,以節(jié)省存儲(chǔ)資源和計(jì)算資源,提高文字輸入 效率和輸入精度。本發(fā)明所要解決的另一技術(shù)問(wèn)題在于提供一種計(jì)算機(jī)文件輸入方法和 輸入系統(tǒng),以節(jié)省存儲(chǔ)資源和計(jì)算資源,提高文字輸入效率和輸入精度。 為了實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明的主要技術(shù)方案為一種計(jì)算機(jī)文字輸入系統(tǒng)的詞庫(kù)維護(hù)方法,該方法預(yù)先存儲(chǔ)虛詞庫(kù),并包括將輸入到計(jì)算機(jī)的文字信息記錄到用戶(hù)詞庫(kù)中,并統(tǒng)計(jì)輸入的詞頻; 查找用戶(hù)詞庫(kù)中是否有與所述虛詞庫(kù)中的虛詞相同的文字,如果有則將該文字從用戶(hù)詞庫(kù)中刪除;對(duì)用戶(hù)詞庫(kù)中的文字詞頻進(jìn)行分析,對(duì)搭配詞頻達(dá)到特定要求的一個(gè)以 上的文字進(jìn)行合并。優(yōu)選的,該方法預(yù)先設(shè)置與詞性對(duì)應(yīng)的分析報(bào)告模版;并進(jìn)一步包括 對(duì)用戶(hù)詞庫(kù)進(jìn)行詞頻排序,生成詞頻列表; 選出詞頻列表中符合指定詞頻條件的文字;判斷所選文字的詞性,選擇該詞性對(duì)應(yīng)的分析報(bào)告模版,將所選文字填 入到對(duì)應(yīng)的分析報(bào)告模版中,生成分析報(bào)告。優(yōu)選的,所述文字輸入系統(tǒng)具有網(wǎng)絡(luò)賬號(hào);且該方法在生成所述分析報(bào) 告后,進(jìn)一步包括檢測(cè)用戶(hù)輸入的上傳指令;當(dāng)檢測(cè)到上傳指令時(shí),判斷當(dāng)前的文字輸入系統(tǒng)的網(wǎng)絡(luò)賬號(hào)是否與用戶(hù) 指定的業(yè)務(wù)服務(wù)器的網(wǎng)絡(luò)賬號(hào)關(guān)聯(lián),如果是,則執(zhí)行下一步驟;否則結(jié)東本 流程;將所述分析報(bào)告上傳到所述網(wǎng)絡(luò)賬號(hào)對(duì)應(yīng)的業(yè)務(wù)服務(wù)器上。優(yōu)選的,該方法預(yù)先設(shè)置與所述業(yè)務(wù)服務(wù)器的業(yè)務(wù)類(lèi)型對(duì)應(yīng)的上傳模版;所述上傳分析報(bào)告的具體方法為讀取文字輸入系統(tǒng)所關(guān)聯(lián)的業(yè)務(wù)類(lèi)型所對(duì)應(yīng)的上傳模版,將所述用戶(hù)網(wǎng)絡(luò)賬號(hào)和分析報(bào)告的內(nèi)容填入到上傳模版 中,通過(guò)上傳模版的特定格式將所述分析報(bào)告的內(nèi)容上傳到對(duì)應(yīng)的網(wǎng)絡(luò)服務(wù) 器。優(yōu)選的,所述進(jìn)行詞頻分析以及合并文字的具體方法為判斷一個(gè)文字 與其它文字的搭配詞頻是否大于該被搭配文字總詞頻的特定比率,如果是, 則將所述相互搭配的文字進(jìn)行合并。優(yōu)選的,在將輸入計(jì)算機(jī)的文字記錄到用戶(hù)詞庫(kù)時(shí),進(jìn)一步記錄對(duì)應(yīng)的 輸入時(shí)間;并且,在后續(xù)的對(duì)用戶(hù)詞庫(kù)的維護(hù)過(guò)程中,首先讀取預(yù)先存儲(chǔ)的 詞頻分析時(shí)間段,并在用戶(hù)詞庫(kù)中選擇符合所述詞頻分析時(shí)間段內(nèi)的文字, 然后將選出的文字作為后續(xù)步驟的處理對(duì)象進(jìn)行處理。一種計(jì)算機(jī)文字輸入系統(tǒng)的詞庫(kù)維護(hù)裝置,包括詞庫(kù)輸入模塊,用于將通過(guò)文字輸入系統(tǒng)輸入計(jì)算機(jī)的文字記錄到用戶(hù)詞庫(kù)中,并進(jìn)行詞頻統(tǒng)計(jì);第一維護(hù)模塊,其中存儲(chǔ)有虛詞庫(kù),用于判斷用戶(hù)詞庫(kù)中的文字中是否 有與預(yù)設(shè)虛詞庫(kù)中的虛詞相同的詞,如果是則將該詞從用戶(hù)詞庫(kù)中刪除;第二維護(hù)模塊,用于對(duì)用戶(hù)詞庫(kù)中的文字詞頻進(jìn)行分析,對(duì)搭配詞頻達(dá) 到特定要求的 一個(gè)以上的文字進(jìn)行合并。優(yōu)選的,該詞庫(kù)維護(hù)裝置進(jìn)一步包括排序模塊,用于對(duì)所述用戶(hù)詞庫(kù)中 的文字進(jìn)行詞頻排序,生成詞頻列表。優(yōu)選的,該詞庫(kù)維護(hù)裝置進(jìn)一步包括分析報(bào)告自動(dòng)生成模塊,其中存儲(chǔ) 有與詞性對(duì)應(yīng)的分析報(bào)告模版,用于選出詞頻列表中符合指定詞頻條件的文 字,并判斷所選文字的詞性,選擇該詞性對(duì)應(yīng)的分析報(bào)告模版,將所選文字 填入到對(duì)應(yīng)的分析報(bào)告模版中,生成分析報(bào)告。優(yōu)選的,該詞庫(kù)維護(hù)裝置進(jìn)一步包括一鍵上傳模塊,用于檢測(cè)用戶(hù)輸入 的上傳指令, 一旦檢測(cè)到上傳指令則判斷本地文字輸入系統(tǒng)的網(wǎng)絡(luò)賬號(hào)是否 與用戶(hù)指定的業(yè)務(wù)服務(wù)器的網(wǎng)絡(luò)賬號(hào)關(guān)聯(lián),當(dāng)判定關(guān)聯(lián)時(shí),將所述分析報(bào)告 上傳到所述網(wǎng)絡(luò)賬號(hào)對(duì)應(yīng)的業(yè)務(wù)服務(wù)器上。優(yōu)選的,所述用戶(hù)詞庫(kù)進(jìn)一步包括輸入時(shí)間記錄模塊,用于在將輸入計(jì) 算機(jī)的文字記錄到用戶(hù)詞庫(kù)時(shí),進(jìn)一步記錄對(duì)應(yīng)的輸入時(shí)間;所述詞庫(kù)維護(hù)裝置進(jìn)一步包括第三維護(hù)模塊,其中存儲(chǔ)詞頻分析時(shí)間 段,用于在用戶(hù)詞庫(kù)中選擇符合所述詞頻分析時(shí)間段內(nèi)的文字,將選出的文 字作為所述第一維護(hù)模塊和第二維護(hù)模塊的維護(hù)對(duì)象。一種計(jì)算機(jī)文字輸入方法,包括a、 將輸入計(jì)算機(jī)的文字記錄到用戶(hù)詞庫(kù)中,并進(jìn)行詞頻統(tǒng)計(jì);b、 判斷用戶(hù)詞庫(kù)中的文字中是否有與預(yù)設(shè)虛詞庫(kù)中的虛詞相同的詞, 如果是則將該詞從用戶(hù)詞庫(kù)中刪除;并對(duì)用戶(hù)詞庫(kù)中的文字詞頻進(jìn)行分析, 對(duì)搭配詞頻達(dá)到特定要求的一個(gè)以上的文字進(jìn)行合并;c、 當(dāng)檢測(cè)到用戶(hù)的文字輸入編碼時(shí),在所述用戶(hù)詞庫(kù)中査找與輸入編 碼匹配的文字;d、 對(duì)查找到的文字進(jìn)行詞頻排序,選擇詞頻符合指定詞頻條件的文字 作為輸入候選對(duì)象顯示;e、 根據(jù)用戶(hù)輸入的選擇指令從所述候選對(duì)象中確定最終的文字完成輸 入,返回步驟a。優(yōu)選的,該方法預(yù)先設(shè)置存儲(chǔ)指定的詞頻輸入時(shí)間段;并且,步驟a中, 在將輸入計(jì)算機(jī)的文字記錄到用戶(hù)詞庫(kù)時(shí),進(jìn)一步記錄對(duì)應(yīng)的輸入時(shí)間;步 驟c中,當(dāng)檢測(cè)到用戶(hù)的文字輸入編碼時(shí),在所述用戶(hù)詞庫(kù)中查找處于所述 指定詞頻輸入時(shí)間段內(nèi)的、且與輸入編碼匹配的文字。一種計(jì)算機(jī)文字輸入系統(tǒng),該系統(tǒng)包括用戶(hù)詞庫(kù),用于存儲(chǔ)用戶(hù)文字;編碼輸入匹配模塊,用于檢測(cè)用戶(hù)的文字輸入編碼,在所述用戶(hù)詞庫(kù)中 查找與輸入編碼匹配的文字;候選對(duì)象顯示模塊,用于對(duì)所述編碼輸入匹配模塊査找到的文字進(jìn)行詞 頻排序,選擇詞頻符合指定詞頻條件的文字作為輸入候選對(duì)象顯示;文字輸入模塊,用于根據(jù)用戶(hù)輸入的選擇指令從所述候選對(duì)象中確定最終的文字完成輸入;詞庫(kù)輸入模塊,用于將所述文字輸入模塊輸入的文字記錄到用戶(hù)詞庫(kù)中,并進(jìn)行詞頻統(tǒng)計(jì);詞庫(kù)維護(hù)模塊,其中存儲(chǔ)有虛詞庫(kù),用于判斷用戶(hù)詞庫(kù)中的文字中是否有與預(yù)設(shè)虛詞庫(kù)中的虛詞相同的詞,如果是則將該詞從用戶(hù)詞庫(kù)中刪除;并 對(duì)用戶(hù)詞庫(kù)中的文字詞頻進(jìn)行分析,對(duì)搭配詞頻達(dá)到特定要求的 一個(gè)以上的 文字進(jìn)行合并。優(yōu)選的,所述詞庫(kù)輸入模塊中進(jìn)一步包括輸入時(shí)間記錄模塊,用于在將 輸入計(jì)算機(jī)的文字記錄到用戶(hù)詞庫(kù)時(shí),進(jìn)一步記錄對(duì)應(yīng)的輸入時(shí)間;所述編碼輸入匹配模塊中進(jìn)一步包括詞頻輸入時(shí)間存儲(chǔ)單元;所述編碼 輸入匹配模塊根據(jù)詞頻輸入時(shí)間存儲(chǔ)單元的存儲(chǔ)信息,在所述用戶(hù)詞庫(kù)中査 找處于所述指定詞頻輸入時(shí)間段內(nèi)的、且與輸入編碼匹配的文字。相對(duì)于現(xiàn)有技術(shù),本發(fā)明可以對(duì)用戶(hù)詞庫(kù)中的文字進(jìn)行虛詞過(guò)濾,以及 進(jìn)行詞頻本意分析以正確反映用戶(hù)的習(xí)慣用語(yǔ),因此本發(fā)明可以實(shí)現(xiàn)用戶(hù)詞庫(kù)中文字的精簡(jiǎn)組合,降低用戶(hù)詞庫(kù)的存儲(chǔ)量,減少對(duì)計(jì)算機(jī)存儲(chǔ)資源的占 用,減少輸入系統(tǒng)的計(jì)算量,并可以精確體現(xiàn)用戶(hù)實(shí)際的習(xí)慣用語(yǔ),將這些 習(xí)慣用語(yǔ)作為候選詞進(jìn)行輸入,可以大幅提高文字輸入系統(tǒng)的文字輸入效率 和文字輸入精度。并且,本發(fā)明還可以設(shè)置詞頻輸入的時(shí)間段,只對(duì)該時(shí)間段內(nèi)容的詞庫(kù) 進(jìn)行精簡(jiǎn)分析排序,從而使用戶(hù)可以精確地得知在某一特定時(shí)間段內(nèi)的習(xí)慣 用語(yǔ)是什么。對(duì)于某些特殊專(zhuān)業(yè)的用戶(hù),例如一些專(zhuān)業(yè)的文檔錄入人員,經(jīng) 常會(huì)遇到這種場(chǎng)景例如在第一個(gè)月輸入的文檔主要涉及互聯(lián)網(wǎng)領(lǐng)域,在該 段時(shí)間內(nèi)產(chǎn)生的習(xí)慣用語(yǔ)主要涉及互聯(lián)網(wǎng)術(shù)語(yǔ);在第二個(gè)月輸入的文檔可能 主要涉及機(jī)械制造領(lǐng)域,在該段時(shí)間內(nèi)產(chǎn)生的習(xí)慣用語(yǔ)主要涉及機(jī)器制造的 術(shù)語(yǔ);而到了第三個(gè)月可能又會(huì)輸入涉及互聯(lián)網(wǎng)領(lǐng)域的文檔,這時(shí)就可以利 用本發(fā)明設(shè)置只對(duì)第一個(gè)月內(nèi)的用戶(hù)詞庫(kù)進(jìn)行精簡(jiǎn)分析排序,從而使文字輸 入系統(tǒng)輸出的用戶(hù)習(xí)慣用語(yǔ)又主要涉及互聯(lián)網(wǎng)術(shù)語(yǔ),從而極大地方便了用戶(hù)輸入特定的術(shù)語(yǔ),提高了文字輸入效率。然而現(xiàn)有技術(shù)的用戶(hù)詞庫(kù)只能粗略 地得到過(guò)去總體的習(xí)慣用語(yǔ),不能精確輸出過(guò)去某 一 時(shí)間段內(nèi)的習(xí)慣用語(yǔ)。對(duì)于網(wǎng)絡(luò)文字輸入系統(tǒng)來(lái)說(shuō),由于精簡(jiǎn)了用戶(hù)詞庫(kù),對(duì)應(yīng)的網(wǎng)絡(luò)核心詞 庫(kù)的內(nèi)容也相應(yīng)地精簡(jiǎn)了 ,核心詞庫(kù)可以體現(xiàn)某 一 段時(shí)間內(nèi)整體終端用戶(hù)的 習(xí)慣用語(yǔ),方便用戶(hù)利用習(xí)慣用語(yǔ)進(jìn)行文字輸入。尤其在不同用戶(hù)之間進(jìn)行 文字交流的情況下,由于客觀的討論主題是一致的,根據(jù)客觀的語(yǔ)言規(guī)律, 討論主題一致時(shí),對(duì)話(huà)中采用相同習(xí)慣用語(yǔ)的概率較大,因此通過(guò)本發(fā)明更 新核心詞庫(kù),討論組的各方可以在更短的時(shí)間內(nèi)容選擇輸入包括習(xí)慣用語(yǔ)的 文字,提高了通訊各方的文字輸入速度交流效率。另外,本發(fā)明還可以對(duì)用戶(hù)詞庫(kù)進(jìn)行詞頻排序,對(duì)符合詞頻條件的文字 添加到其詞性對(duì)應(yīng)的分析報(bào)告模版中,生成分析報(bào)告,從而可以使用戶(hù)更加 了解自己的語(yǔ)言習(xí)慣,進(jìn)一步方便用戶(hù)使用文字輸入系統(tǒng)。對(duì)于與網(wǎng)絡(luò)上的特定業(yè)務(wù)服務(wù)器關(guān)聯(lián)的文字輸入系統(tǒng),本發(fā)明還可以將 所述分析報(bào)告一鍵上傳到對(duì)應(yīng)的業(yè)務(wù)服務(wù)器,并以該業(yè)務(wù)服務(wù)器特定的發(fā)表 方式進(jìn)行發(fā)表,以方便用戶(hù)到業(yè)務(wù)服務(wù)器上查看分析報(bào)告。


      圖1為一種現(xiàn)有的拼音輸入法的處理流程示意圖;圖2為本發(fā)明所述對(duì)詞庫(kù)進(jìn)行維護(hù)的 一 種實(shí)施處理流程圖; 圖3為本發(fā)明所述自動(dòng)生成用戶(hù)習(xí)慣用語(yǔ)分析報(bào)告的一種實(shí)施流程圖; 圖4為本發(fā)明所述一鍵上傳的具體實(shí)現(xiàn)方法的流程示意圖; 圖5為本發(fā)明所述的計(jì)算機(jī)文字輸入方法的一種流程圖; 圖6為本發(fā)明所述計(jì)算機(jī)文字輸入系統(tǒng)的詞庫(kù)維護(hù)裝置的一種結(jié)構(gòu)示 意圖;圖7為本發(fā)明所述計(jì)算機(jī)文字輸入系統(tǒng)的詞庫(kù)維護(hù)裝置的另一種結(jié)構(gòu) 示意圖;圖8為本發(fā)明所述的計(jì)算機(jī)文字輸入系統(tǒng)的 一種結(jié)構(gòu)示意圖。
      具體實(shí)施方式
      下面通過(guò)具體實(shí)施例和附圖對(duì)本發(fā)明做進(jìn)一步詳細(xì)說(shuō)明。 本發(fā)明所述的方法適合于任何具有用戶(hù)詞庫(kù)的文字輸入系統(tǒng),例如對(duì)于 漢字來(lái)講,可以適用于拼音輸入系統(tǒng)、五筆字型輸入系統(tǒng)、筆劃輸入系統(tǒng)等。 下面的實(shí)施例以常用的拼音輸入系統(tǒng)為例對(duì)本發(fā)明進(jìn)行說(shuō)明。本發(fā)明的核心技術(shù)方案為預(yù)先存儲(chǔ)虛詞庫(kù),將通過(guò)計(jì)算機(jī)文字輸入系 統(tǒng)輸入到計(jì)算機(jī)的文字信息記錄到用戶(hù)詞庫(kù)中,并統(tǒng)計(jì)輸入的詞頻;然后是 對(duì)用戶(hù)詞庫(kù)的后期維護(hù)過(guò)程,至少包括虛詞過(guò)濾和本意分析合并。所述虛詞過(guò)濾即對(duì)于用戶(hù)詞庫(kù)中的文字,查找其中是否有與所述虛詞庫(kù)中的虛詞相 同的文字,如果有則將該文字從用戶(hù)詞庫(kù)中刪除;所述本意分析合并即對(duì) 用戶(hù)詞庫(kù)中的文字詞頻進(jìn)行分析,對(duì)搭配詞頻達(dá)到特定要求的 一 個(gè)以.上的文 字進(jìn)行合并。所述向用戶(hù)詞庫(kù)記錄文字信息并統(tǒng)計(jì)詞頻的具體方法例如每完成一次 文字的輸入,則判斷用戶(hù)詞庫(kù)中有沒(méi)有該文字,如果沒(méi)有,則將該文字加入 詞庫(kù),詞頻設(shè)置為1,如果有,則將其對(duì)應(yīng)的詞頻加1。本發(fā)明所述的文字 可以是單個(gè)的字或詞,或者是一個(gè)整句。所述虛詞過(guò)濾和本意分析合并的觸發(fā)時(shí)機(jī)可以是由用戶(hù)通過(guò)輸入指令 進(jìn)行觸發(fā),也可以在用戶(hù)詞庫(kù)中每記錄一個(gè)文字信息后就自動(dòng)觸發(fā)。圖2為本發(fā)明所述對(duì)詞庫(kù)進(jìn)行維護(hù)的一種實(shí)施處理流程圖。參見(jiàn)圖2, 在本實(shí)施例中,由用戶(hù)通過(guò)觸發(fā)指令觸發(fā)對(duì)用戶(hù)詞庫(kù)的后期維護(hù)過(guò)程,即圖 2中的用戶(hù)詞庫(kù)200已經(jīng)記錄了用戶(hù)輸入的文字并進(jìn)行了詞頻統(tǒng)計(jì)。該流程 包括步驟201、對(duì)用戶(hù)詞庫(kù)中的文字內(nèi)容進(jìn)行時(shí)間判斷。為了實(shí)現(xiàn)本步驟,在將輸入計(jì)算機(jī)的文字記錄到用戶(hù)詞庫(kù)時(shí),需要進(jìn)--步記錄對(duì)應(yīng)的輸入時(shí)間;用戶(hù)可以在文字輸入系統(tǒng)中預(yù)先設(shè)置詞頻分析時(shí)間 段,該時(shí)間段例如可以是最近一個(gè)星期、最近一個(gè)月甚至一年(用戶(hù)可以自行選擇設(shè)置)。在本步驟201中,首先讀取用戶(hù)設(shè)置的詞頻分析時(shí)間段,并 對(duì)所述用戶(hù)詞庫(kù)中的文字的輸入時(shí)間進(jìn)行判斷,選擇符合所述詞頻分析時(shí)間 段內(nèi)的文字,執(zhí)行后續(xù)步驟;對(duì)于不符合所述詞頻分析時(shí)間的文字則不屬于 后續(xù)步驟的處理對(duì)象。通過(guò)設(shè)定時(shí)間段,可以實(shí)現(xiàn)只對(duì)某個(gè)時(shí)間段內(nèi)的用戶(hù) 詞庫(kù)進(jìn)行精簡(jiǎn)排序,從而使用戶(hù)可以精確地得知在某 一特定時(shí)間段內(nèi)的習(xí)慣 用語(yǔ)是什么。當(dāng)然,本步驟201是可選步驟,也可以只對(duì)所述用戶(hù)詞庫(kù)200執(zhí)行步驟 202及后續(xù)步驟。步驟202 、對(duì)用戶(hù)詞庫(kù)中的屬于所述詞頻分析時(shí)間內(nèi)的文字進(jìn)行詞頻排 序,當(dāng)然如果沒(méi)有執(zhí)行步驟201則對(duì)用戶(hù)詞庫(kù)中的所有文字進(jìn)行詞頻;排序 后生成詞頻列表,即按照詞頻由高到低對(duì)所述文字進(jìn)行排序。所述的文字的 詞頻就是該文字的輸入頻率。步驟203、對(duì)詞頻排序中的文字進(jìn)行虛詞過(guò)濾處理。具體的處理過(guò)程為 判斷所述詞頻列表中是否有與所述預(yù)設(shè)虛詞庫(kù)中的虛詞相同的文字,如果有 則將該文字從用戶(hù)詞庫(kù)中刪除;如果沒(méi)有則保留該文字。例如根據(jù)特定語(yǔ)言 的客觀語(yǔ)言規(guī)律,在所述虛詞庫(kù)中可以設(shè)置存儲(chǔ)獨(dú)立出來(lái)沒(méi)有具體意義的虛 詞,例如"的"、"了""吧"等助詞,從而使獨(dú)立出來(lái)具備具體意義的實(shí) 詞在用戶(hù)詞庫(kù)繼續(xù)保留。步驟204、對(duì)文字進(jìn)行本意分析,即對(duì)用戶(hù)詞庫(kù)中的文字詞頻進(jìn)行分析, 對(duì)搭配詞頻達(dá)到特定要求的一個(gè)以上的文字進(jìn)行合并。具體包括用戶(hù)是否 在使用此詞的時(shí)候同時(shí)搭配了其他用來(lái)形容和確定此詞真實(shí)意思的其他詞, 如果兩個(gè)詞的搭配使用到達(dá)特定的概率,則需要把這兩個(gè)詞合并,在詞頻排 序中的位置則是以中心詞的詞頻為準(zhǔn)。此處具體的處理方法例如可以為假設(shè)詞A的總詞頻為N,詞B的總 詞頻為M, A+B的搭配詞頻為X,則將該X和所述M和N進(jìn)行比較,如果 X小于N的特定比率(例如N x 50% ,這個(gè)特定比率可以預(yù)先設(shè)置存儲(chǔ)在文 字輸入系統(tǒng)中),同時(shí)X小于M的特定比率(例如Mx50M,這個(gè)特定比率可以預(yù)先設(shè)置存儲(chǔ)在文字輸入系統(tǒng)中),那么A和B作為單獨(dú)的詞,不進(jìn)行合并;如果X大于N的所述特定比率,或者X大于M的所述特定比率, 則需要合并A和B。并且可以將X作為合并后的A+B的詞頻,或者將A和 B 二者中的中心詞的詞頻作為A+B的詞頻。例如用戶(hù)可能輸入"喜歡",但如果用戶(hù)輸入"喜歡"的同時(shí),有 90%以上的幾率在"喜歡"的前面加上了 "不"字,那么其實(shí)用戶(hù)輸入習(xí)慣 中,經(jīng)常使用的應(yīng)該為"不喜歡",因此需要將"不"和"喜歡"合并成"不 喜歡",由于"喜歡"為中心詞,則繼續(xù)以"喜歡"的詞頻作為合并詞即"不 喜歡"的詞頻。步驟205、對(duì)詞頻列表中詞頻位置進(jìn)行調(diào)整處理,生成最終的詞頻列表300。由于上述步驟203和步驟204的處理,所述詞頻列表中的某些文字可能 被刪除或合并,從而導(dǎo)致按照某種規(guī)則排序的詞頻順序出現(xiàn)空缺,所以需要 從最后一個(gè)文字開(kāi)始,自動(dòng)檢測(cè)上一詞頻位置是否空缺,如果空缺將詞頻位 置向上調(diào)整,直到不再有空缺為止。當(dāng)然,上述步驟202和步驟205也是可選的步驟,是為后續(xù)生成分析報(bào) 告或生成候選輸入文字所做的準(zhǔn)備,對(duì)于僅實(shí)現(xiàn)減少用戶(hù)詞庫(kù)量這個(gè)目的來(lái) 講,步驟202和步驟205也是可以省略的。針對(duì)上述的用戶(hù)詞庫(kù),本發(fā)明還可以自動(dòng)生成用戶(hù)習(xí)慣用語(yǔ)的分析報(bào) 告,以方便用戶(hù)査看自己的語(yǔ)言習(xí)慣。為了實(shí)現(xiàn)自動(dòng)生成分析報(bào)告,本發(fā)明 需要預(yù)先存儲(chǔ)與詞性對(duì)應(yīng)的分析報(bào)告模版,并需要對(duì)用戶(hù)詞庫(kù)進(jìn)行詞頻排 序,生成詞頻列表(這個(gè)步驟在圖2所示的流程中已經(jīng)完成)。例如可以分 別設(shè)置與名詞、動(dòng)詞、形容詞、或者其它詞性對(duì)應(yīng)的分析報(bào)告模版。所述與 詞性對(duì)應(yīng)的分析報(bào)告模版中可以預(yù)先設(shè)置(可以默認(rèn)設(shè)置也可以由用戶(hù)自行 設(shè)置)與所述詞性相匹配的文字信息,并留出相應(yīng)的空白位置以填入從詞頻 列表中選出的文字。例如對(duì)于名詞,在一種比較簡(jiǎn)單的分析報(bào)告模版中可以 將對(duì)應(yīng)的文字信息設(shè)置為"您最近經(jīng)常提到—,您是不是需要一個(gè)了?',。圖3為本發(fā)明所述自動(dòng)生成用戶(hù)習(xí)慣用語(yǔ)分析報(bào)告的一種實(shí)施流程閨。 參見(jiàn)圖3,步驟301、對(duì)所述經(jīng)過(guò)排序處理的詞頻列表300進(jìn)行分析,選出詞頻列 表中符合指定詞頻條件的文字。所述指定詞頻條件例如可以是詞頻最高的文 字、或者詞頻處于前十位的文字、或者詞頻達(dá)到某個(gè)特定值的文字。所述的 詞頻條件可以預(yù)先指定并存儲(chǔ)到文字輸入系統(tǒng)中。步驟302、確定所選文字的詞性,讀取該詞性對(duì)應(yīng)的分析報(bào)告模版。所述確定詞性的方法可以為預(yù)先設(shè)置語(yǔ)法庫(kù),其中存儲(chǔ)所有文字的詞 性信息,可以從該語(yǔ)法庫(kù)中查找所選文字的詞性。如果所選的文字為上述步驟204所合并成的復(fù)合詞匯,則詞性以合并后 的中心詞為主,所述語(yǔ)法庫(kù)中也可以設(shè)置中心詞信息,可以通過(guò)查詢(xún)語(yǔ)法庫(kù) 確定中心詞。例如"好開(kāi)心"這個(gè)復(fù)合詞的中心詞是"開(kāi)心","好"只 是用來(lái)形容的,所以就以"開(kāi)心"的詞性,即動(dòng)詞為準(zhǔn),調(diào)出相應(yīng)的預(yù)先設(shè) 置好為動(dòng)詞匹配的語(yǔ)句。步驟303、將所選文字填入到與其詞性對(duì)應(yīng)的分析報(bào)告模版中,生成分 析報(bào)告。下面是一個(gè)具體的實(shí)例,假設(shè)所述詞頻列表中詞頻最高的文字為"電 腦",分析得出其詞性為名詞,如果名詞對(duì)應(yīng)的分析報(bào)告模版為"您最近經(jīng) 常提到—,是不是需要一個(gè)—了?"則對(duì)應(yīng)生成的分析報(bào)告內(nèi)容是"您 最近經(jīng)常提高電腦,是不是需要一個(gè)電腦了?"另外,本發(fā)明所述的方法同樣適用于網(wǎng)絡(luò)文字輸入系統(tǒng),目前許多網(wǎng)絡(luò) 文字輸入系統(tǒng)都設(shè)置有網(wǎng)絡(luò)賬號(hào),可以與提供具體網(wǎng)絡(luò)應(yīng)用服務(wù)的業(yè)務(wù)服務(wù) 器關(guān)聯(lián),也就是說(shuō)文字輸入系統(tǒng)的網(wǎng)絡(luò)賬號(hào)可以登錄關(guān)聯(lián)的業(yè)務(wù)服務(wù)器,在 該業(yè)務(wù)服務(wù)器上享受相關(guān)聯(lián)的業(yè)務(wù)服務(wù),例如目前有一種即時(shí)通訊文字輸入 法,可以與提供網(wǎng)絡(luò)郵件的郵件服務(wù)關(guān)聯(lián),利用同一個(gè)網(wǎng)絡(luò)賬號(hào),既可以實(shí) 現(xiàn)即時(shí)通訊文字輸入法的網(wǎng)絡(luò)用戶(hù)詞庫(kù)更新,又實(shí)現(xiàn)收發(fā)郵件的關(guān)聯(lián)業(yè)務(wù);對(duì)應(yīng)的也可以與提供發(fā)貼功能的論壇服務(wù)器(例如目前的博客服務(wù)器、論壇 服務(wù)器、群空間服務(wù)器等)進(jìn)行關(guān)聯(lián),利用同一個(gè)網(wǎng)絡(luò)賬號(hào)可以登錄相應(yīng)的 服務(wù)器以實(shí)現(xiàn)發(fā)帖的關(guān)聯(lián)業(yè)務(wù)。對(duì)于網(wǎng)絡(luò)文字輸入系統(tǒng),本發(fā)明還可以實(shí)現(xiàn)一鍵上傳功能,即將所述分 析報(bào)告400通過(guò)一鍵觸發(fā),自動(dòng)上傳到所述網(wǎng)絡(luò)文字輸入系統(tǒng)關(guān)聯(lián)的業(yè)務(wù)服 務(wù)器上,且可以預(yù)先設(shè)置與所述業(yè)務(wù)服務(wù)器的業(yè)務(wù)類(lèi)型對(duì)應(yīng)的上傳模版,在 上傳時(shí)以所關(guān)聯(lián)的業(yè)務(wù)類(lèi)型對(duì)應(yīng)的上傳格式進(jìn)行上傳。例如可以分別設(shè)置郵 箱服務(wù)器、博客服務(wù)器、論壇服務(wù)器、群空間服務(wù)器的上傳模板,上傳模板 對(duì)應(yīng)的格式與所述業(yè)務(wù)類(lèi)型對(duì)應(yīng),例如對(duì)于郵箱服務(wù)器的郵件業(yè)務(wù),上傳模 板的格式包括郵件主題、郵件內(nèi)容等待填格式,對(duì)于論壇服務(wù)器的發(fā)貼業(yè)務(wù), 所述上傳模板的格式包括帖子主題、作者、內(nèi)容等待填格式。圖4為本發(fā)明所述一鍵上傳的具體實(shí)現(xiàn)方法的流程示意圖。參見(jiàn)圖4, 該流程包括步驟401、檢測(cè)一鍵上傳的觸發(fā)事件,即檢測(cè)用戶(hù)是否輸入上傳指令, 所述的上傳指令可以對(duì)應(yīng)設(shè)置一個(gè)計(jì)算機(jī)快捷鍵進(jìn)行觸發(fā)。步驟402、當(dāng)檢測(cè)到上傳指令時(shí),判斷當(dāng)前的文字輸入系統(tǒng)的網(wǎng)絡(luò)賬號(hào) 是否與指定業(yè)務(wù)服務(wù)器的網(wǎng)絡(luò)賬號(hào)關(guān)聯(lián),如果是,則執(zhí)行下一步驟;否則需 要提醒用戶(hù)檢查關(guān)聯(lián)情況,然后返回步驟401再次觸發(fā)上傳指令并進(jìn)行網(wǎng)絡(luò) 賬號(hào)關(guān)聯(lián)。步驟403、對(duì)用戶(hù)關(guān)聯(lián)的業(yè)務(wù)類(lèi)型進(jìn)行分析,提取該關(guān)聯(lián)業(yè)務(wù)對(duì)應(yīng)的上 傳模版。步驟404、套用所述上傳模板的格式,將所述分析報(bào)告的內(nèi)容上傳到對(duì) 應(yīng)的服務(wù)器上。例如對(duì)于帖子發(fā)表類(lèi)的業(yè)務(wù)類(lèi)型,所述的上傳模版的套用格式為發(fā)表帖 子的相關(guān)格式,其中包括標(biāo)題、作者、內(nèi)容等待填寫(xiě)格式,還包括目的服務(wù) 器的地址,并且最終的上傳格式為發(fā)帖請(qǐng)求數(shù)據(jù)包。當(dāng)檢測(cè)到上傳指令后, 文字輸入系統(tǒng)自動(dòng)關(guān)聯(lián)對(duì)應(yīng)的服務(wù)器及業(yè)務(wù)類(lèi)型,如果發(fā)現(xiàn)關(guān)聯(lián)到的是發(fā)帖業(yè)務(wù)類(lèi)型,則讀取對(duì)應(yīng)的上傳模版,將所述分析報(bào)告的內(nèi)容填入所述內(nèi)容格 式中,所述標(biāo)題可以填入預(yù)先設(shè)定的內(nèi)容例如"用戶(hù)詞庫(kù)分析報(bào)告",所述 作者可以填入所述的網(wǎng)絡(luò)賬號(hào)信息;然后將所述上傳模板中的對(duì)應(yīng)內(nèi)容打包 成發(fā)帖請(qǐng)求數(shù)據(jù)包,根據(jù)上傳模版中的目的服務(wù)器地址,將所述發(fā)帖請(qǐng)求數(shù) 據(jù)包上傳給對(duì)應(yīng)的服務(wù)器;服務(wù)器在收到數(shù)據(jù)包后,解析出是發(fā)帖請(qǐng)求數(shù)據(jù) 包,則將其中的數(shù)據(jù)按照規(guī)定的格式存儲(chǔ)并發(fā)表。圖5為本發(fā)明所述的計(jì)算機(jī)文字輸入方法的一種流程圖。參見(jiàn)圖5,該 流程不但包括對(duì)用戶(hù)詞庫(kù)進(jìn)行上述的維護(hù)處理,而且還根據(jù)經(jīng)過(guò)維護(hù)處理后的用戶(hù)詞庫(kù)生成候選輸入詞完成文字的輸入。具體包括以下步驟步驟501、將輸入計(jì)算機(jī)的文字記錄到用戶(hù)詞庫(kù)中,并進(jìn)行詞頻統(tǒng)計(jì)。步驟502、進(jìn)行虛詞過(guò)濾判斷,即判斷用戶(hù)詞庫(kù)中的文字中是否有與預(yù) 設(shè)虛詞庫(kù)中的虛詞相同的詞,如果是則將該詞從用戶(hù)詞庫(kù)中刪除。本步驟的 具體方法與上述步驟203相同。步驟503、對(duì)用戶(hù)詞庫(kù)中的文字詞頻進(jìn)行分析,對(duì)搭配詞頻達(dá)到特定要 求的一個(gè)以上的文字進(jìn)行合并。本步驟的具體方法與上述步驟204相同。步驟504、當(dāng)檢測(cè)到用戶(hù)的文字輸入編碼(例如拼音編碼、五筆字型編 碼、手寫(xiě)識(shí)別輸入編碼)時(shí),在所述用戶(hù)詞庫(kù)中查找與輸入編碼匹配的文字。步驟505、對(duì)查找到的文字進(jìn)行詞頻排序,選擇詞頻符合指定詞頻條件 的文字作為輸入候選對(duì)象顯示;步驟506、根據(jù)用戶(hù)輸入的選擇指令從所述候選對(duì)象中確定最終的文字 完成輸入,返回步驟501。通過(guò)上述輸入方法,使得文字輸入系統(tǒng)在檢測(cè)到用戶(hù)的文字輸入編碼 后,輸出的候選對(duì)象都是經(jīng)過(guò)精簡(jiǎn)分析的習(xí)慣用語(yǔ),從而更加準(zhǔn)確地反映用 戶(hù)的文字輸入意圖,提高文字輸入效率。另外,所述文字輸入方法還可以預(yù)先設(shè)置存儲(chǔ)指定的詞頻輸入時(shí)間段; 并且,步驟501中,在將輸入計(jì)算機(jī)的文字記錄到用戶(hù)詞庫(kù)時(shí),進(jìn)一步記錄 對(duì)應(yīng)的輸入時(shí)間;步驟503中,當(dāng)檢測(cè)到用戶(hù)的文字輸入編碼時(shí),在所述用戶(hù)詞庫(kù)中査找處于所述指定詞頻輸入時(shí)間段內(nèi)的、且與輸入編碼匹配的文字 作為輸入的候選對(duì)象顯示,然后根據(jù)用戶(hù)的選擇指令從中選擇確定最終輸入 的文字以完成輸入。通過(guò)這種方式,可以使文字輸入系統(tǒng)精確地輸出在某一 特定時(shí)間段內(nèi)的習(xí)慣用語(yǔ)作為文字編碼的候選對(duì)象,從而進(jìn)一步方便專(zhuān)業(yè)錄 入人員的文字輸入需求?;谏鲜龅姆椒?,本發(fā)明還公開(kāi)了可以執(zhí)行上述詞庫(kù)維護(hù)方法的計(jì)算機(jī) 文字輸入系統(tǒng)的詞庫(kù)維護(hù)裝置,以及可以執(zhí)行上述文字輸入方法的計(jì)算機(jī)文 字輸入系統(tǒng)。圖6為本發(fā)明所述計(jì)算機(jī)文字輸入系統(tǒng)的詞庫(kù)維護(hù)裝置的一種結(jié)構(gòu)示意圖。參見(jiàn)圖6,該詞庫(kù)維護(hù)裝置600主要包括詞庫(kù)輸入模塊601,用于將通過(guò)文字輸入系統(tǒng)輸入計(jì)算機(jī)的文字記錄到 用戶(hù)詞庫(kù)610中,并進(jìn)行詞頻統(tǒng)計(jì),并將統(tǒng)計(jì)信息記錄到用戶(hù)詞庫(kù)中。第一維護(hù)模塊602,其中存儲(chǔ)有虛詞庫(kù),用于實(shí)現(xiàn)虛詞過(guò)濾的功能,即 判斷用戶(hù)詞庫(kù)中的文字中是否有與預(yù)設(shè)虛詞庫(kù)中的虛詞相同的詞,如果是則 將該詞從用戶(hù)詞庫(kù)中刪除。第二維護(hù)模塊603,用于實(shí)現(xiàn)本意分析合并的功能,即對(duì)用戶(hù)詞庫(kù)中的 文字詞頻進(jìn)行分析,對(duì)搭配詞頻達(dá)到特定要求的一個(gè)以上的文字進(jìn)行合并。在一種可選實(shí)施例中,所述詞庫(kù)維護(hù)裝置還可以進(jìn)一步包括排序模塊 604,用于對(duì)所述用戶(hù)詞庫(kù)中的文字進(jìn)行詞頻排序,生成詞頻列表。在另一種可選實(shí)施例中,所述詞庫(kù)維護(hù)裝置還可以進(jìn)一步包括分析報(bào)告 自動(dòng)生成模塊605,其中存儲(chǔ)有與詞性對(duì)應(yīng)的分析報(bào)告模版,用于選出詞頻 列表中符合指定詞頻條件的文字,并判斷所選文字的詞性,選擇該詞性對(duì)應(yīng) 的分析報(bào)告模版,將所選文字填入到對(duì)應(yīng)的分析報(bào)告模版中,生成分析報(bào)告。所述詞庫(kù)維護(hù)裝置還可以進(jìn)一步包括一鍵上傳模塊606,用于檢測(cè)用戶(hù) 輸入的上傳指令, 一旦檢測(cè)到上傳指令則判斷本地文字輸入系統(tǒng)的網(wǎng)絡(luò)賬號(hào) 是否與用戶(hù)指定的業(yè)務(wù)服務(wù)器的網(wǎng)絡(luò)賬號(hào)關(guān)聯(lián),當(dāng)判定關(guān)聯(lián)時(shí),將所述分析 報(bào)告上傳到所述網(wǎng)絡(luò)賬號(hào)對(duì)應(yīng)的業(yè)務(wù)服務(wù)器上。圖7為本發(fā)明所述計(jì)算機(jī)文字輸入系統(tǒng)的詞庫(kù)維護(hù)裝置的另一種結(jié)構(gòu)示意圖。參見(jiàn)圖7,所述詞庫(kù)輸入模塊601進(jìn)一步包括輸入時(shí)間記錄模塊611, 用于在將輸入計(jì)算機(jī)的文字記錄到用戶(hù)詞庫(kù)610時(shí),進(jìn)一步記錄對(duì)應(yīng)的輸入 時(shí)間;所述詞庫(kù)維護(hù)裝置600進(jìn)一步包括第三維護(hù)模塊607,其中存儲(chǔ)詞頻 分析時(shí)間段,用于在用戶(hù)詞庫(kù)610中選擇符合所述詞頻分析時(shí)間段內(nèi)的文 字,將選出的文字作為所述第一維護(hù)模塊602和第二維護(hù)模塊603的維護(hù)對(duì) 象輸出。所述第一維護(hù)模塊602和第二維護(hù)模塊603可以依次對(duì)所述詞頻分 析時(shí)間段內(nèi)的文字進(jìn)行處理,之后可以交給排序模塊604進(jìn)行排序,然后由 分析報(bào)告自動(dòng)生成模塊605從排序后從詞頻列表中選出符合預(yù)定詞頻條件 的文字生成分析報(bào)告,最后可以由一鍵上傳模塊606上傳給相關(guān)聯(lián)的服務(wù) 器o圖8為本發(fā)明所述的計(jì)算機(jī)文字輸入系統(tǒng)的一種結(jié)構(gòu)示意圖。參見(jiàn)圖8, 該計(jì)算機(jī)文字輸入系統(tǒng)包括用戶(hù)詞庫(kù)610,用于存儲(chǔ)用戶(hù)文字。編碼輸入匹配模塊801,用于檢測(cè)用戶(hù)通過(guò)鍵盤(pán)輸入的編碼,在所述用 戶(hù)詞庫(kù)中查找與輸入編碼匹配的文字。候選對(duì)象顯示模塊802,用于對(duì)所述編碼輸入匹配模塊查找到的文字進(jìn) 行詞頻排序,選擇詞頻符合指定詞頻條件的文字作為輸入候選對(duì)象顯示。文字輸入模塊803,用于根據(jù)用戶(hù)輸入的選擇指令從所述候選對(duì)象中確 定最終的文字并向計(jì)算機(jī)輸入該文字。詞庫(kù)輸入模塊804,用于將所述文字輸入模塊803輸入的文字記錄到用 戶(hù)詞庫(kù)中,并進(jìn)行詞頻統(tǒng)計(jì),并可以將統(tǒng)計(jì)的詞頻記錄到用戶(hù)詞庫(kù)610中。詞庫(kù)維護(hù)模塊600,其中存儲(chǔ)有虛詞庫(kù),用于判斷用戶(hù)詞庫(kù)中的文字中 是否有與預(yù)設(shè)虛詞庫(kù)中的虛詞相同的詞,如果是則將該詞從用戶(hù)詞庫(kù)中刪 除;并對(duì)用戶(hù)詞庫(kù)中的文字詞頻進(jìn)行分析,對(duì)搭配詞頻達(dá)到特定要求的一個(gè) 以上的文字進(jìn)行合并。該詞庫(kù)維護(hù)模塊的具體結(jié)構(gòu)請(qǐng)參見(jiàn)圖6和圖7的相關(guān) 描述。另外,所述詞庫(kù)輸入模塊804中進(jìn)一步包括輸入時(shí)間記錄模塊(圖8中 未標(biāo)出),用于在將輸入計(jì)算機(jī)的文字記錄到用戶(hù)詞庫(kù)時(shí),進(jìn)一步記錄對(duì)應(yīng) 的輸入時(shí)間;所述編碼輸入匹配模塊中進(jìn) 一 步包括詞頻輸入時(shí)間存儲(chǔ)單元(圖8中未標(biāo)出);所述編碼輸入匹配模塊根據(jù)詞頻輸入時(shí)間存儲(chǔ)單元的存 儲(chǔ)信息,在所述用戶(hù)詞庫(kù)中查找處于所述指定詞頻輸入時(shí)間段內(nèi)的、且與輸 入編碼匹配的文字。以上所述,僅為本發(fā)明較佳的具體實(shí)施方式
      ,但本發(fā)明的保護(hù)范圍并不 局限于此,任何熟悉該技術(shù)的人在本發(fā)明所揭露的技術(shù)范圍內(nèi),可輕易想到 的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。
      權(quán)利要求
      1、一種計(jì)算機(jī)文字輸入系統(tǒng)的詞庫(kù)維護(hù)方法,其特征在于,該方法預(yù)先存儲(chǔ)虛詞庫(kù),并包括將輸入到計(jì)算機(jī)的文字信息記錄到用戶(hù)詞庫(kù)中,并統(tǒng)計(jì)輸入的詞頻;查找用戶(hù)詞庫(kù)中是否有與所述虛詞庫(kù)中的虛詞相同的文字,如果有則將該文字從用戶(hù)詞庫(kù)中刪除;對(duì)用戶(hù)詞庫(kù)中的文字詞頻進(jìn)行分析,對(duì)搭配詞頻達(dá)到特定要求的一個(gè)以上的文字進(jìn)行合并。
      2、 根據(jù)權(quán)利要求l所述的方法,其特征在于,該方法預(yù)先設(shè)置與詞性 對(duì)應(yīng)的分析報(bào)告模版;并進(jìn)一步包括對(duì)用戶(hù)詞庫(kù)進(jìn)行詞頻排序,生成詞頻列表; 選出詞頻列表中符合指定詞頻條件的文字;判斷所選文字的詞性,選擇該詞性對(duì)應(yīng)的分析報(bào)告模版,將所選文字填 入到對(duì)應(yīng)的分析報(bào)告模版中,生成分析報(bào)告。
      3、 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述文字輸入系統(tǒng)具有 網(wǎng)絡(luò)賬號(hào);且該方法在生成所述分析報(bào)告后,進(jìn)一步包括檢測(cè)用戶(hù)輸入的上傳指令;當(dāng)檢測(cè)到上傳指令時(shí),判斷當(dāng)前的文字輸入系統(tǒng)的網(wǎng)絡(luò)賬號(hào)是否與用戶(hù) 指定的業(yè)務(wù)服務(wù)器的網(wǎng)絡(luò)賬號(hào)關(guān)聯(lián),如果是,則執(zhí)行下一步驟;否則結(jié)束本 流程;將所述分析報(bào)告上傳到所述網(wǎng)絡(luò)賬號(hào)對(duì)應(yīng)的業(yè)務(wù)服務(wù)器上。
      4、 根據(jù)權(quán)利要求3所述的方法,其特征在于,該方法預(yù)先設(shè)置與所述 業(yè)務(wù)服務(wù)器的業(yè)務(wù)類(lèi)型對(duì)應(yīng)的上傳模版;所述上傳分析報(bào)告的具體方法為讀取文字輸入系統(tǒng)所關(guān)聯(lián)的業(yè)務(wù)類(lèi)型 所對(duì)應(yīng)的上傳模版,將所述用戶(hù)網(wǎng)絡(luò)賬號(hào)和分析報(bào)告的內(nèi)容填入到上傳模版 中,通過(guò)上傳模版的特定格式將所述分析報(bào)告的內(nèi)容上傳到對(duì)應(yīng)的網(wǎng)絡(luò)服務(wù)器。
      5、 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述進(jìn)行詞頻分析以及 合并文字的具體方法為判斷一個(gè)文字與其它文字的搭配詞頻是否大于該被 搭配文字總詞頻的特定比率,如果是,則將所述相互搭配的文字進(jìn)行合并。
      6、 根據(jù)權(quán)利要求1至5任一項(xiàng)所述的方法,其特征在于,在將輸入計(jì)算機(jī)的文字記錄到用戶(hù)詞庫(kù)時(shí),進(jìn)一步記錄對(duì)應(yīng)的輸入時(shí) 間;并且,在后續(xù)的對(duì)用戶(hù)詞庫(kù)的維護(hù)過(guò)程中,首先讀取預(yù)先存儲(chǔ)的詞頻分 析時(shí)間段,并在用戶(hù)詞庫(kù)中選擇符合所述詞頻分析時(shí)間段內(nèi)的文字,然后將 選出的文字作為后續(xù)步驟的處理對(duì)象進(jìn)行處理。
      7、 一種計(jì)算機(jī)文字輸入系統(tǒng)的詞庫(kù)維護(hù)裝置,其特征在于,包括 詞庫(kù)輸入模塊,用于將通過(guò)文字輸入系統(tǒng)輸入計(jì)算機(jī)的文字記錄到用戶(hù)詞庫(kù)中,并進(jìn)行詞頻統(tǒng)計(jì);第一維護(hù)模塊,其中存儲(chǔ)有虛詞庫(kù),用于判斷用戶(hù)詞庫(kù)中的文字中是否 有與預(yù)設(shè)虛詞庫(kù)中的虛詞相同的詞,如果是則將該詞從用戶(hù)詞庫(kù)中刪除;第二維護(hù)模塊,用于對(duì)用戶(hù)詞庫(kù)中的文字詞頻進(jìn)行分析,對(duì)搭配詞頻達(dá) 到特定要求的一個(gè)以上的文字進(jìn)行合并。
      8、 根據(jù)權(quán)利要求7所述的詞庫(kù)維護(hù)裝置,其特征在于,該詞庫(kù)維護(hù)裝置進(jìn)一步包括排序模塊,用于對(duì)所述用戶(hù)詞庫(kù)中的文字進(jìn)行詞頻排序,生成 詞頻列表。
      9、 根據(jù)權(quán)利要求8所述的詞庫(kù)維護(hù)裝置,其特征在于,該詞庫(kù)維護(hù)裝 置進(jìn)一步包括分析報(bào)告自動(dòng)生成模塊,其中存儲(chǔ)有與詞性對(duì)應(yīng)的分析報(bào)告模 版,用于選出詞頻列表中符合指定詞頻條件的文字,并判斷所選文字的詞性, 選擇該詞性對(duì)應(yīng)的分析報(bào)告模版,將所選文字填入到對(duì)應(yīng)的分析報(bào)告模版 中,生成分析報(bào)告。
      10、 根據(jù)權(quán)利要求9所述的詞庫(kù)維護(hù)裝置,其特征在于,該詞庫(kù)維護(hù)裝 置進(jìn)一步包括一鍵上傳模塊,用于檢測(cè)用戶(hù)輸入的上傳指令, 一旦檢測(cè)到上 傳指令則判斷本地文字輸入系統(tǒng)的網(wǎng)絡(luò)賬號(hào)是否與用戶(hù)指定的業(yè)務(wù)服務(wù)器的網(wǎng)絡(luò)賬號(hào)關(guān)聯(lián),當(dāng)判定關(guān)聯(lián)時(shí),將所述分析報(bào)告上傳到所述網(wǎng)絡(luò)賬號(hào)對(duì)應(yīng) 的業(yè)務(wù)服務(wù)器上。
      11、 根據(jù)權(quán)利要求IO所述的詞庫(kù)維護(hù)裝置,其特征在于, 所述用戶(hù)詞庫(kù)進(jìn)一步包括輸入時(shí)間記錄模塊,用于在將輸入計(jì)算機(jī)的文字記錄到用戶(hù)詞庫(kù)時(shí),進(jìn)一步記錄對(duì)應(yīng)的輸入時(shí)間;所述詞庫(kù)維護(hù)裝置進(jìn)一步包括第三維護(hù)模塊,其中存儲(chǔ)詞頻分析時(shí)間 段,用于在用戶(hù)詞庫(kù)中選擇符合所述詞頻分析時(shí)間段內(nèi)的文字,將選出的文 字作為所述第一維護(hù)模塊和第二維護(hù)模塊的維護(hù)對(duì)象。
      12、 一種計(jì)算機(jī)文字輸入方法,其特征在于,包括a、 將輸入計(jì)算機(jī)的文字記錄到用戶(hù)詞庫(kù)中,并進(jìn)行詞頻統(tǒng)計(jì);b、 判斷用戶(hù)詞庫(kù)中的文字中是否有與預(yù)設(shè)虛詞庫(kù)中的虛詞相同的詞, 如果是則將該詞從用戶(hù)詞庫(kù)中刪除;并對(duì)用戶(hù)詞庫(kù)中的文字詞頻進(jìn)行分析, 對(duì)搭配詞頻達(dá)到特定要求的一個(gè)以上的文字進(jìn)行合并;c、 當(dāng)檢測(cè)到用戶(hù)的文字輸入編碼時(shí),在所述用戶(hù)詞庫(kù)中查找與輸入編 碼匹配的文字;d、 對(duì)查找到的文字進(jìn)行詞頻排序,選擇詞頻符合指定詞頻條件的文字 作為輸入候選對(duì)象顯示;e、 根據(jù)用戶(hù)輸入的選擇指令從所述候選對(duì)象中確定最終的文字完成輸 入,返回步驟a。
      13、 根據(jù)權(quán)利要求12所述的計(jì)算機(jī)文字輸入方法,其特征在于,該方 法預(yù)先設(shè)置存儲(chǔ)指定的詞頻輸入時(shí)間段;并且,步驟a中,在將輸入計(jì)算機(jī) 的文字記錄到用戶(hù)詞庫(kù)時(shí),進(jìn)一步記錄對(duì)應(yīng)的輸入時(shí)間;步驟c中,當(dāng)檢測(cè) 到用戶(hù)的文字輸入編碼時(shí),在所述用戶(hù)詞庫(kù)中查找處于所述指定詞頻輸入時(shí) 間段內(nèi)的、且與輸入編碼匹配的文字。
      14、 一種計(jì)算機(jī)文字輸入系統(tǒng),其特征在于,該系統(tǒng)包括 用戶(hù)詞庫(kù),用于存儲(chǔ)用戶(hù)文字;編碼輸入匹配模塊,用于檢測(cè)用戶(hù)的文字輸入編碼,在所述用戶(hù)詞庫(kù)中查找與輸入編碼匹配的文字;候選對(duì)象顯示模塊,用于對(duì)所述編碼輸入匹配模塊查找到的文字進(jìn)行詞頻排序,選擇詞頻符合指定詞頻條件的文字作為輸入候選對(duì)象顯示;文字輸入模塊,用于根據(jù)用戶(hù)輸入的選擇指令從所述候選對(duì)象中確定最終的文字完成輸入;詞庫(kù)輸入模塊,用于將所述文字輸入模塊輸入的文字記錄到用戶(hù)詞庫(kù)中,并進(jìn)行詞頻統(tǒng)計(jì);詞庫(kù)維護(hù)模塊,其中存儲(chǔ)有虛詞庫(kù),用于判斷用戶(hù)詞庫(kù)中的文字中是否 有與預(yù)設(shè)虛詞庫(kù)中的虛詞相同的詞,如果是則將該詞從用戶(hù)詞庫(kù)中刪除;并 對(duì)用戶(hù)詞庫(kù)中的文字詞頻進(jìn)行分析,對(duì)搭配詞頻達(dá)到特定要求的一個(gè)以上的 文字進(jìn)行合并。
      15、根據(jù)權(quán)利要求14所述的計(jì)算機(jī)文字輸入系統(tǒng),其特征在于, 所述詞庫(kù)輸入模塊中進(jìn)一步包括輸入時(shí)間記錄模塊,用于在將輸入計(jì)算 機(jī)的文字記錄到用戶(hù)詞庫(kù)時(shí),進(jìn)一步記錄對(duì)應(yīng)的輸入時(shí)間;所述編碼輸入匹配模塊中進(jìn)一步包括詞頻輸入時(shí)間存儲(chǔ)單元;所述編碼 輸入匹配模塊根據(jù)詞頻輸入時(shí)間存儲(chǔ)單元的存儲(chǔ)信息,在所述用戶(hù)詞庫(kù)中査 找處于所述指定詞頻輸入時(shí)間段內(nèi)的、且與輸入編碼匹配的文字。
      全文摘要
      本發(fā)明公開(kāi)了一種計(jì)算機(jī)文字輸入方法和系統(tǒng)及其詞庫(kù)的維護(hù)方法和維護(hù)裝置。本發(fā)明方法預(yù)先存儲(chǔ)虛詞庫(kù),將通過(guò)計(jì)算機(jī)文字輸入系統(tǒng)輸入計(jì)算機(jī)的文字信息記錄到用戶(hù)詞庫(kù)中,并統(tǒng)計(jì)輸入的詞頻;查找用戶(hù)詞庫(kù)中是否有與所述虛詞庫(kù)中的虛詞相同的文字,如果有則將該文字從用戶(hù)詞庫(kù)中刪除;對(duì)用戶(hù)詞庫(kù)中的文字詞頻進(jìn)行分析,對(duì)搭配詞頻達(dá)到特定要求的一個(gè)以上的文字進(jìn)行合并。本發(fā)明通過(guò)維護(hù)用戶(hù)詞庫(kù),可以減少用戶(hù)詞庫(kù)對(duì)存儲(chǔ)資源和計(jì)算資源的占用,提高輸入效率和輸入精度。本發(fā)明還從所述維護(hù)后的用戶(hù)詞庫(kù)中按照詞頻選擇候選詞以供輸入選擇,從而進(jìn)一步提高了輸入效率和輸入精度。
      文檔編號(hào)G06F17/30GK101216854SQ200810056238
      公開(kāi)日2008年7月9日 申請(qǐng)日期2008年1月15日 優(yōu)先權(quán)日2008年1月15日
      發(fā)明者陳麗菲 申請(qǐng)人:騰訊科技(深圳)有限公司
      網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1