專利名稱:在線輸入中文的方法、客戶端和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及輸入法領(lǐng)域,特別涉及一種在線輸入中文的方法、客戶端和系統(tǒng)。
背景技術(shù):
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,云計(jì)算技術(shù)的普及,越來越多的網(wǎng)絡(luò)應(yīng)用程序?qū)?huì)代替 傳統(tǒng)的單機(jī)應(yīng)用程序。在線輸入法就是一種利用服務(wù)器和網(wǎng)頁(yè)編程技術(shù),將輸入法取詞的 過程放在服務(wù)器上,以服務(wù)器強(qiáng)大計(jì)算能力和存儲(chǔ)能力的來實(shí)現(xiàn)精確匹配候選詞的一種在 線輸入中文的網(wǎng)絡(luò)應(yīng)用程序。現(xiàn)有的在線輸入法是通過一個(gè)網(wǎng)站提供的一個(gè)頁(yè)面來實(shí)現(xiàn)在線的中文輸入。用戶 在需要輸入文字時(shí),先要到指定的的頁(yè)面進(jìn)行文字的輸入,然后將該頁(yè)面輸出的文字復(fù)制 并拷貝到用戶需要輸入文字的頁(yè)面中完成輸入過程。在實(shí)現(xiàn)本發(fā)明的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在以下問題現(xiàn)有技術(shù)中用戶不能在需要輸入的網(wǎng)頁(yè)中直接進(jìn)行輸入操作,需要在專用的網(wǎng)面 中進(jìn)行輸入和選字。還需將輸入結(jié)果復(fù)制并拷貝到用戶進(jìn)行輸入的網(wǎng)頁(yè)的輸入框中才能完 成整個(gè)輸入的過程。使得用戶的輸入速度慢,輸入過程不方便,同時(shí)用戶的輸入體驗(yàn)也很不
王困相
發(fā)明內(nèi)容
為了解決現(xiàn)有技術(shù)中每次輸入都要到指定的頁(yè)面進(jìn)行中文輸入的問題。本發(fā)明實(shí) 施例提出了在線輸入中文的方法、客戶端和系統(tǒng)。所述技術(shù)方案如下本發(fā)明實(shí)施例提出了一種在線中文輸入的方法,包括監(jiān)聽客戶端網(wǎng)頁(yè)的用戶輸入;根據(jù)所述用戶輸入向服務(wù)器發(fā)送獲取候選字詞請(qǐng)求信息,使服務(wù)器根據(jù)所述獲取 候選字詞請(qǐng)求信息進(jìn)行取詞;將所述取詞結(jié)果輸出到所述客戶端網(wǎng)頁(yè)。作為上述技術(shù)方案的優(yōu)選,所述根據(jù)所述用戶輸入向服務(wù)器發(fā)送獲取候選字詞請(qǐng) 求信息,包括每當(dāng)所述用戶進(jìn)行輸入操作,實(shí)時(shí)向服務(wù)器發(fā)送一條包含所有用戶輸入的字母或 字母組合的獲取候選字詞請(qǐng)求信息。作為上述技術(shù)方案的優(yōu)選,所述服務(wù)器根據(jù)所述獲取候選字詞請(qǐng)求信息進(jìn)行取 詞,包括服務(wù)器根據(jù)所述獲取候選字詞請(qǐng)求信息中的字母組合數(shù),確定所述字母組合數(shù)所 對(duì)應(yīng)的多元組概率計(jì)算模型,根據(jù)所述對(duì)應(yīng)的概率計(jì)算模型進(jìn)行取詞。作為上述技術(shù)方案的優(yōu)選,所述監(jiān)聽客戶端網(wǎng)頁(yè)的用戶輸入,之前還包括預(yù)先采集所述客戶端網(wǎng)頁(yè)的網(wǎng)頁(yè)信息發(fā)送至服務(wù)器,使服務(wù)器選出一個(gè)與所述網(wǎng) 頁(yè)信息最匹配的詞庫(kù),用于根據(jù)所述獲取候選字詞請(qǐng)求信息進(jìn)行取詞。
作為上述技術(shù)方案的優(yōu)選,所述根據(jù)所述用戶輸入向服務(wù)器發(fā)送獲取候選字詞請(qǐng) 求信息,使服務(wù)器根據(jù)所述獲取候選字詞請(qǐng)求信息進(jìn)行取詞,之后還包括向服務(wù)器發(fā)送候選字詞選取習(xí)慣的參數(shù),使服務(wù)器根據(jù)所述參數(shù)進(jìn)行候選字詞選 取的調(diào)整。作為上述技術(shù)方案的優(yōu)選,所述方法還包括根據(jù)用戶選詞結(jié)果對(duì)服務(wù)器詞庫(kù)進(jìn)行全局詞頻調(diào)整。本發(fā)明實(shí)施例還提出了一種在線中文輸入的客戶端,包括監(jiān)聽模塊,用于監(jiān)聽客戶端網(wǎng)頁(yè)的用戶輸入;發(fā)送模塊,用于根據(jù)所述用戶輸入向服務(wù)器發(fā)送獲取候選字詞請(qǐng)求信息;輸出模塊,用于將取詞結(jié)果輸出到所述客戶端網(wǎng)頁(yè)。作為上述技術(shù)方案的優(yōu)選,所述發(fā)送模塊至少包括所述發(fā)送模塊具體用于每當(dāng)所述用戶進(jìn)行輸入操作,實(shí)時(shí)向服務(wù)器發(fā)送一條包含 所有用戶輸入的字母或字母組合的獲取候選字詞請(qǐng)求信息。作為上述技術(shù)方案的優(yōu)選,所述客戶端還包括預(yù)處理模塊,用于預(yù)先采集所述客戶端網(wǎng)頁(yè)的網(wǎng)頁(yè)信息發(fā)送至服務(wù)器,使服務(wù)器 選出一個(gè)與所述網(wǎng)頁(yè)信息最匹配的詞庫(kù),用于根據(jù)所述獲取候選字詞請(qǐng)求信息進(jìn)行取詞。作為上述技術(shù)方案的優(yōu)選,所述客戶端還包括設(shè)置模塊,用于向服務(wù)器發(fā)送候選字詞選取習(xí)慣的參數(shù)。本發(fā)明實(shí)施例還提出了一種在線中文輸入的系統(tǒng),包括客戶端和服務(wù)器;其特 征在于,所述客戶端包括監(jiān)聽模塊,用于監(jiān)聽客戶端網(wǎng)頁(yè)的用戶輸入;發(fā)送模塊,用于根據(jù)所述用戶輸入向服務(wù)器發(fā)送獲取候選字詞請(qǐng)求信息;輸出模塊,用于將取詞結(jié)果輸出到所述客戶端網(wǎng)頁(yè)。所述服務(wù)器包括取詞模塊,用于接收客戶端發(fā)送的獲取候選字詞請(qǐng)求信息,根據(jù)所述獲取候選字 詞請(qǐng)求信息進(jìn)行取詞。作為上述技術(shù)方案的優(yōu)選,所述發(fā)送模塊至少包括所述發(fā)送模塊具體用于每當(dāng)所述用戶進(jìn)行輸入操作,實(shí)時(shí)向服務(wù)器發(fā)送一條包含 所有用戶輸入的字母或字母組合的獲取候選字詞請(qǐng)求信息。作為上述技術(shù)方案的優(yōu)選,所述取詞模塊至少包括所述取詞模塊具體用于服務(wù)器根據(jù)所述獲取候選字詞請(qǐng)求信息中的字母組合數(shù), 確定所述字母組合數(shù)所對(duì)應(yīng)的多元組概率計(jì)算模型,根據(jù)所述對(duì)應(yīng)的概率計(jì)算模型進(jìn)行取 詞。作為上述技術(shù)方案的優(yōu)選,所述客戶端還包括預(yù)處理模塊,用于預(yù)先采集所述客戶端網(wǎng)頁(yè)的網(wǎng)頁(yè)信息發(fā)送至服務(wù)器,使服務(wù)器 選出一個(gè)與所述網(wǎng)頁(yè)信息最匹配的詞庫(kù),用于根據(jù)所述獲取候選字詞請(qǐng)求信息進(jìn)行取詞。作為上述技術(shù)方案的優(yōu)選,所述客戶端還包括設(shè)置模塊,用于向服務(wù)器發(fā)送候選字詞選取習(xí)慣的參數(shù)。作為上述技術(shù)方案的優(yōu)選,所述服務(wù)器還包括
5
第一調(diào)整模塊,用于根據(jù)所述客戶端發(fā)送的候選字詞選取習(xí)慣的參數(shù)進(jìn)行候選字 詞的調(diào)整。作為上述技術(shù)方案的優(yōu)選,所述服務(wù)器還包括第二調(diào)整模塊,用于根據(jù)客戶端選詞結(jié)果對(duì)服務(wù)器詞庫(kù)進(jìn)行全局詞頻調(diào)整。作為上述技術(shù)方案的優(yōu)選,所述服務(wù)器還包括更新模塊,用于服務(wù)器自動(dòng)搜尋熱門詞匯進(jìn)行詞庫(kù)更新。本發(fā)明實(shí)施例提供的技術(shù)方案的有益效果是通過對(duì)監(jiān)聽客戶端網(wǎng)頁(yè)的用戶輸 入,根據(jù)所述用戶輸入向服務(wù)器發(fā)送獲取候選字詞請(qǐng)求信息,使服務(wù)器根據(jù)所述獲取候選 字詞請(qǐng)求信息進(jìn)行取詞,并將所述取詞結(jié)果輸出到所述客戶端網(wǎng)頁(yè)。實(shí)現(xiàn)了用戶在需要進(jìn) 行輸入的頁(yè)面中直接進(jìn)行中文輸入的操作,擺脫了傳統(tǒng)的必須在特定網(wǎng)頁(yè)中進(jìn)行中文輸 入,還需將輸出的文字拷貝到需要進(jìn)行輸入的網(wǎng)頁(yè)中的過程。另一方面,服務(wù)器通過多元組 概率計(jì)算模型,可以使用戶進(jìn)行單字、詞、句子的輸入,同時(shí)更精確的與用戶輸入的字母組 合進(jìn)行匹配,提高了對(duì)用戶輸入意圖的理解程度,并提高了用戶輸入的效率與用戶的輸入 體驗(yàn)。
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可 以根據(jù)這些附圖獲得其他的附圖。圖1是為本發(fā)明實(shí)施例1提供的在線中文輸入的方法流程示意圖;圖2是為本發(fā)明實(shí)施例2提供的在線中文輸入的方法流程示意圖;圖3是為本發(fā)明實(shí)施例3提供的在線中文輸入的裝置結(jié)構(gòu)示意圖;圖4是為本發(fā)明實(shí)施例4提供的在線中文輸入的裝置結(jié)構(gòu)示意圖;圖5是為本發(fā)明實(shí)施例5提供的在線中文輸入的裝置結(jié)構(gòu)示意圖;圖6是為本發(fā)明實(shí)施例6提供的在線中文輸入的裝置結(jié)構(gòu)示意圖。
具體實(shí)施例方式為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明實(shí)施方 式作進(jìn)一步地詳細(xì)描述。實(shí)施例1本發(fā)明第一實(shí)施例提出了一種在線中文輸入的方法,其流程如圖1所示,包括步驟101 監(jiān)聽客戶端網(wǎng)頁(yè)的用戶輸入;步驟102 根據(jù)所述用戶輸入向服務(wù)器發(fā)送獲取候選字詞請(qǐng)求信息,使服務(wù)器根 據(jù)所述獲取候選字詞請(qǐng)求信息進(jìn)行取詞;步驟103 將所述取詞結(jié)果輸出到所述客戶端網(wǎng)頁(yè)。本發(fā)明實(shí)施例中,通過對(duì)監(jiān)聽客戶端網(wǎng)頁(yè)的用戶輸入,根據(jù)所述用戶輸入向服務(wù) 器發(fā)送獲取候選字詞請(qǐng)求信息,使服務(wù)器根據(jù)所述獲取候選字詞請(qǐng)求信息進(jìn)行取詞,并將 所述取詞結(jié)果輸出到所述客戶端網(wǎng)頁(yè)。實(shí)現(xiàn)了用戶在需要進(jìn)行輸入的頁(yè)面中直接進(jìn)行中文輸入的操作,擺脫了傳統(tǒng)的必須在特定網(wǎng)頁(yè)中進(jìn)行中文單字輸入,還需將輸出的文字拷貝 到需要進(jìn)行輸入的網(wǎng)頁(yè)中的過程。提高了用戶輸入的效率,并提高了用戶的輸入體驗(yàn)。實(shí)施例2本發(fā)明第二實(shí)施例是對(duì)第一實(shí)施例的進(jìn)一步證明,其流程如圖2所示,包括步驟201 監(jiān)聽客戶端網(wǎng)頁(yè)的用戶輸入。具體的,在本實(shí)施例中在客戶端網(wǎng)頁(yè)中生成在線輸入法并對(duì)用戶所輸入的內(nèi)容進(jìn) 行監(jiān)聽。因此,步驟201可以具體為步驟2011 預(yù)先存儲(chǔ)啟動(dòng)輸入法的代碼的鏈接。具體的,用戶在使用在線輸入法之前,預(yù)先將啟動(dòng)在線輸入法的代碼的鏈接保存 在瀏覽器的收藏夾中。進(jìn)一步,當(dāng)用戶在瀏覽網(wǎng)頁(yè)并且需要在網(wǎng)頁(yè)內(nèi)使用輸入法輸入中文時(shí),只需在瀏 覽器收藏夾中點(diǎn)擊該鏈接,執(zhí)行其中的代碼,進(jìn)而啟動(dòng)在線輸入法使用戶進(jìn)行輸入操作。此鏈接不同于一般的網(wǎng)址,它是由一段JavaScript (客戶端腳本語言)代碼組成 的。JavMcript是一種面向?qū)ο蟮摹⒚枋鲂缘目蛻舳四_本語言,可以插入到HTML(超文本標(biāo) 記語言)代碼中,由瀏覽器解析并運(yùn)行。使用JavMcript可以在網(wǎng)頁(yè)中創(chuàng)建動(dòng)態(tài)效果,并 能與用戶或服務(wù)器進(jìn)行互動(dòng)。腳本語言的共同點(diǎn)都是作用在客戶端,讓客戶端的瀏覽器解 析并執(zhí)行。點(diǎn)擊該鏈接后,瀏覽器會(huì)對(duì)鏈接所對(duì)應(yīng)的代碼進(jìn)行解析并執(zhí)行,這段代碼的作用 是指引瀏覽器通過指定的鏈接訪問在線輸入法的CDN(Content Delivery Network,內(nèi)容分 發(fā)網(wǎng)絡(luò))服務(wù)器獲取最新版本的JavMcript文件。⑶N服務(wù)器通過在現(xiàn)有的hternet中 增加一層新的網(wǎng)絡(luò)架構(gòu),將網(wǎng)站的內(nèi)容發(fā)布到最接近用戶的網(wǎng)絡(luò)“邊緣”,使用戶可以就近 取得所需的內(nèi)容,解決^ternet網(wǎng)絡(luò)擁擠的狀況,提高用戶訪問網(wǎng)站的響應(yīng)速度。步驟2012 獲取在線輸入法程序文件。具體的,從在線輸入法的⑶N服務(wù)器中獲取最新版本的JavMcript文件,這些 JavaScript文件存儲(chǔ)的是用于在客戶端生成輸入法的狀態(tài)欄、輸入欄、候選詞欄以及設(shè)置 輸入各種屬性的狀態(tài)欄等交互界面并構(gòu)成在線輸入法的腳本語言代碼。步驟2013 啟動(dòng)在線輸入法并生成輸入法,并監(jiān)聽客戶端網(wǎng)頁(yè)的用戶輸入。具體的,瀏覽器在獲取到在線輸入法的客戶端Javakript文件后,對(duì)Javakript 代碼進(jìn)行解析并執(zhí)行,在所述需要進(jìn)行輸入文字的頁(yè)面上生成在線輸入法的狀態(tài)欄,此界 面中包括輸入法的基本設(shè)置,如中英文輸入的切換按鈕,全角字符與半角字符的切換按鈕, 簡(jiǎn)體中文與繁體中文輸入的切換按鈕,中文與英文標(biāo)點(diǎn)符號(hào)的切換按鈕,屬性設(shè)置的開關(guān) 按鈕,點(diǎn)擊屬性設(shè)置按鈕,會(huì)生成輸入習(xí)慣設(shè)置欄的界面。當(dāng)用戶進(jìn)行輸入操作時(shí),會(huì)生成 輸入欄和候選詞欄的界面??蛻舳藶g覽器生成在線輸入法后,會(huì)通過監(jiān)聽網(wǎng)頁(yè)內(nèi)輸入欄中 的按鍵事件來捕獲用戶的輸入,并將用戶所輸入的內(nèi)容顯示到在線輸入法的輸入欄內(nèi)。進(jìn)一步的,在現(xiàn)有技術(shù)中,需要一個(gè)特定的網(wǎng)頁(yè)來進(jìn)行文字輸入,在選字后需將輸 出的文字復(fù)制并拷貝到需要輸入文字的頁(yè)面中才能完成輸入過程。本發(fā)明完全改變了這種 繁瑣的輸入過程,直接在需要進(jìn)行輸入的頁(yè)面中進(jìn)行輸入操作,且可以實(shí)現(xiàn)字、詞語、整句 話、整段話的各種輸入方式的輸入。同時(shí)可以根據(jù)網(wǎng)頁(yè)環(huán)境為用戶提供更智能的候選詞。與傳統(tǒng)的單機(jī)輸入法相比,本發(fā)明不用下載和安裝輸入法的客戶端應(yīng)用程序。并 且由于服務(wù)器強(qiáng)大的計(jì)算能力和存儲(chǔ)能力,使得用戶得到單機(jī)輸入法無法比擬的輸入體驗(yàn)。步驟2014 預(yù)先采集所述客戶端網(wǎng)頁(yè)的網(wǎng)頁(yè)信息發(fā)送至服務(wù)器,使服務(wù)器選出一 個(gè)與所述網(wǎng)頁(yè)信息最匹配的詞庫(kù),用于根據(jù)所述獲取候選字詞請(qǐng)求信息進(jìn)行取詞。具體的,在線輸入法初始化完畢后,客戶端會(huì)將所在網(wǎng)頁(yè)內(nèi)的實(shí)時(shí)網(wǎng)頁(yè)環(huán)境采集 并上報(bào)服務(wù)器。所述網(wǎng)頁(yè)環(huán)境是指用戶進(jìn)行輸入操作的網(wǎng)頁(yè)中的文字信息,服務(wù)器會(huì)從這 些文字信息從中找出關(guān)鍵字,通過關(guān)鍵字計(jì)算出與當(dāng)前網(wǎng)頁(yè)環(huán)境最匹配的詞庫(kù)。用戶進(jìn)行 輸入過程時(shí),服務(wù)器的智能取詞服務(wù)器通過預(yù)先匹配到的最適合此次輸入的詞庫(kù)進(jìn)行篩 選,縮小了選詞范圍,將盡可能精確的匹配到用戶輸入意圖的詞語,提高了匹配候選詞的時(shí) 間。當(dāng)用戶切換頁(yè)面時(shí),客戶端會(huì)重新上報(bào)當(dāng)前的網(wǎng)頁(yè)環(huán)境,服務(wù)器會(huì)根據(jù)新采集的網(wǎng)頁(yè)環(huán) 境重新計(jì)算并給出匹配的詞庫(kù)。本步驟是可選的,也可以不執(zhí)行本步驟的操作。進(jìn)一步的,客戶端Jav必cript代碼上報(bào)網(wǎng)頁(yè)環(huán)境這個(gè)過程,無需對(duì)網(wǎng)頁(yè)進(jìn)行 刷新操作即可與在線輸入法服務(wù)器進(jìn)行通信。這個(gè)過程使用的是AJAX(Asynchronous JavaScript and XML,異步Javakript和XML)異步通信技術(shù)。傳統(tǒng)Web應(yīng)用程序都使用 請(qǐng)求/響應(yīng)模型從服務(wù)器上獲得客戶端請(qǐng)求的數(shù)據(jù),AJAX異步通信技術(shù)的工作原理可以看 作在用戶和服務(wù)器之間加了一個(gè)中間層,使用戶操作與服務(wù)器響應(yīng)異步化,它提供客戶端 同服務(wù)器異步通信的協(xié)議,通過這個(gè)協(xié)議,AJAX可以使頁(yè)面像桌面程序一樣同服務(wù)器進(jìn)行 數(shù)據(jù)層面的交換,而無需刷新頁(yè)面便可向服務(wù)器傳輸或讀寫數(shù)據(jù),也不用每次將數(shù)據(jù)處理 的工作提交給服務(wù)器來做,這樣即減輕了服務(wù)器的負(fù)擔(dān)又加快了響應(yīng)速度、縮短了用戶等 候時(shí)間。AJAX異步通信技術(shù)屬于現(xiàn)有技術(shù),本發(fā)明實(shí)施例中并不對(duì)此做出限定。步驟202 根據(jù)所述用戶輸入向服務(wù)器發(fā)送獲取候選字詞請(qǐng)求信息,使服務(wù)器根 據(jù)所述獲取候選字詞請(qǐng)求信息進(jìn)行取詞。具體的,客戶端將用戶所輸入的字母或字母組合發(fā)送至服務(wù)器進(jìn)行取詞。因此步 驟202可以具體為步驟2021 每當(dāng)所述用戶進(jìn)行輸入操作,實(shí)時(shí)向服務(wù)器發(fā)送一條包含所有用戶輸 入的字母或字母組合的獲取候選字詞請(qǐng)求信息。具體的,在線輸入法的詞庫(kù)存儲(chǔ)和智能取詞計(jì)算都是在大規(guī)模服務(wù)器集群上完成 的,這些服務(wù)器不僅存儲(chǔ)能力巨大,而且處理器性能超強(qiáng),能夠同時(shí)支持成千上萬的用戶進(jìn) 行在線輸入的取詞計(jì)算。用戶端只需要通過網(wǎng)絡(luò)把復(fù)雜的計(jì)算任務(wù)請(qǐng)求發(fā)送到服務(wù)器集 群上然后等待服務(wù)器集群返回計(jì)算結(jié)果即可。當(dāng)用戶開始進(jìn)行輸入操作時(shí),在線輸入法會(huì) 監(jiān)聽按鍵事件中用戶輸入的字母,并將用戶所輸入的字母顯示在輸入法的輸入欄內(nèi)。通過 AJAX異步通信技術(shù),根據(jù)用戶輸入的字母或字母組合,生成一條向服務(wù)器獲取候選字詞的 請(qǐng)求,客戶端將此請(qǐng)求異步的發(fā)送至服務(wù)器。服務(wù)器的智能取詞服務(wù)器會(huì)根據(jù)發(fā)送來的用 戶輸入的字母或字母組合,并結(jié)合所述客戶端上報(bào)的用戶網(wǎng)頁(yè)環(huán)境所匹配到的詞庫(kù)進(jìn)行取 詞。用戶使用拼音輸入中文,在輸入組成一個(gè)文字的每一個(gè)字母的時(shí)候,從輸入的第一個(gè)字 母到輸入完構(gòu)成該文字的每一個(gè)字母的過程中,客戶端對(duì)用戶輸入的進(jìn)行記錄,并實(shí)時(shí)的 根據(jù)用戶對(duì)詞語的輸入情況將用戶輸入的從第一字母開始到每增加一個(gè)字母的字母組合 逐一的發(fā)送取詞請(qǐng)求至服務(wù)器,進(jìn)行發(fā)送請(qǐng)求的次數(shù)即構(gòu)成該文字或詞語的拼音字母的個(gè) 數(shù),服務(wù)器會(huì)根據(jù)取詞請(qǐng)求逐一的將每一條請(qǐng)求的字母組合進(jìn)行分詞,并返回每一條請(qǐng)求 的取詞結(jié)果。假如在輸入的過程中有輸入錯(cuò)誤的情況,通過backspace鍵刪除輸入錯(cuò)誤的字母,在每刪除一個(gè)字母后,客戶端也會(huì)發(fā)送一條包含用戶輸入所有字母的獲取候選字詞 的請(qǐng)求信息至服務(wù)器,對(duì)這些字母組合進(jìn)行取詞,并返回客戶端。在線輸入法不僅包含拼音 輸入法,本發(fā)明實(shí)施例中并不對(duì)此做出限定。進(jìn)一步的,在現(xiàn)有技術(shù)的應(yīng)用中,是在一個(gè)網(wǎng)站提供的一個(gè)頁(yè)面中來實(shí)現(xiàn)簡(jiǎn)單的 基于拼音單字的輸入。用戶將想要輸入的文字一個(gè)一個(gè)的輸入并分別進(jìn)行選詞后,再將輸 出的結(jié)果拷貝到需要進(jìn)行文字輸入的輸入框中。這種方法不能進(jìn)行文字的整句、整段的輸 入,而且不能在所需要進(jìn)行輸入的頁(yè)面直接輸入,需要專用的頁(yè)面才能輸出選字,效率很 低。傳統(tǒng)的單機(jī)輸入法,用戶在輸入文字時(shí),經(jīng)常會(huì)進(jìn)行整句、整段甚至整篇文章的輸 入,中途不進(jìn)行候選詞的選取過程。由于中文同音字的特殊性,輸入法要想輸出符合用戶需 求的準(zhǔn)確結(jié)果,理論上必須要求用戶對(duì)于每一個(gè)輸入的單字進(jìn)行選擇。而要想讓輸入法提 升效率,最合理的解決方案便是盡可能“智能化”地把最準(zhǔn)確的結(jié)果顯示在候選詞欄的第一 順位。對(duì)常用詞組、上下文語境等判斷是傳統(tǒng)單機(jī)輸入法用于決定候選詞排列順序的重要 方式,從理論上講,用戶輸入的拼音代碼越長(zhǎng),輸入法對(duì)于用戶輸入意圖的理解也應(yīng)該越清 晰,假設(shè)用戶輸入的所有拼音代碼都能被輸入法準(zhǔn)確的識(shí)別,那么輸入一整句話的準(zhǔn)確率 應(yīng)該遠(yuǎn)高于輸入一個(gè)字的準(zhǔn)確率,輸入的效率就會(huì)極大的提高。但受限于單機(jī)輸入法的計(jì)算能力、字庫(kù)等客觀因素,傳統(tǒng)單機(jī)輸入法在整句輸入 方面很難有所作為。因?yàn)橛脩裘慷噍斎胍粋€(gè)字,要求輸入法所做出的計(jì)算就呈幾何級(jí)數(shù)增 長(zhǎng)。也正是因?yàn)檫@樣的原因,盡管“整句判斷”理論上是提高準(zhǔn)確性最有效的辦法,但在單機(jī) 輸入法上很難實(shí)現(xiàn)。在線輸入法完全可以忽略這些限制,因?yàn)橄鄬?duì)于單機(jī)的計(jì)算能力和存 儲(chǔ)能力來說,服務(wù)器采用的是大規(guī)模服務(wù)器集群的存儲(chǔ)與計(jì)算能力,相對(duì)于單機(jī)輸入法的 詞庫(kù)容量,服務(wù)器也是有著極大的優(yōu)勢(shì)。存儲(chǔ)的詞庫(kù)容量大,可以做到無論是口語、古文、散 文、現(xiàn)代文、詩(shī)詞歌賦等不同文體,還是政治、經(jīng)濟(jì)、體育、娛樂等不同領(lǐng)域,都能面面俱到, 應(yīng)有盡有。權(quán)威詞條,高頻口語,方言俚語,專業(yè)詞匯等都可以統(tǒng)統(tǒng)納入詞庫(kù)而不受任何限 制。同時(shí)服務(wù)器還會(huì)實(shí)時(shí)的在網(wǎng)絡(luò)中搜尋熱門詞匯,將熱門詞匯進(jìn)行整理分類后實(shí)時(shí)的更 新到詞庫(kù)中,還可以收集用戶輸入的選詞信息,對(duì)詞庫(kù)中詞語的詞頻進(jìn)行實(shí)時(shí)的調(diào)整,由此 可以提高用戶取詞的智能性和關(guān)聯(lián)性。用戶使用的客戶端只是一個(gè)終端,所有復(fù)雜的運(yùn)算 都由服務(wù)器進(jìn)行處理,因此在線輸入法可以實(shí)現(xiàn)整句,甚至整篇文章輸入,并且輸入的準(zhǔn)確 率比現(xiàn)有技術(shù)單機(jī)輸入法有著極大的提高。步驟2022 向服務(wù)器發(fā)送候選字詞選取習(xí)慣的參數(shù),使服務(wù)器根據(jù)所述參數(shù)進(jìn)行 候選字詞選取的調(diào)整。具體的,用戶可以根據(jù)輸入習(xí)慣和愛好分別進(jìn)行設(shè)置項(xiàng)的調(diào)整。本步驟是可選的, 也可以不執(zhí)行本步驟的操作。因此,步驟2022可以具體如下步驟20221 將輸入習(xí)慣調(diào)整后的參數(shù)附加在獲取候選字詞的請(qǐng)求信息中發(fā)送至 服務(wù)器。具體的,用戶可以針對(duì)個(gè)人的輸入習(xí)慣進(jìn)行具體設(shè)置項(xiàng)的設(shè)置。例如對(duì)模糊音的 開啟或關(guān)閉設(shè)置,每頁(yè)候選詞個(gè)數(shù)的設(shè)置,簡(jiǎn)體或繁體字的輸入。用戶在進(jìn)行了輸入習(xí)慣的 設(shè)置后,在進(jìn)行下一次輸入的時(shí)候,客戶端會(huì)將用戶更改的設(shè)置以參數(shù)的形式附加到獲取 候選字詞的請(qǐng)求信息中發(fā)送至服務(wù)器。服務(wù)器會(huì)根據(jù)請(qǐng)求信息中附加的參數(shù)進(jìn)行具體的設(shè)
9置更改,然后對(duì)候選詞結(jié)果進(jìn)行重新篩選,生成適合用戶設(shè)置習(xí)慣的候選詞并返回客戶端。 輸入習(xí)慣設(shè)置項(xiàng)內(nèi)容和參數(shù)如表1所示
設(shè)置項(xiàng)名稱設(shè)置項(xiàng)取值URL參數(shù)模糊音開啟或者關(guān)閉mh=l表示開啟 mh=0表示關(guān)閉每頁(yè)候選詞數(shù)目5或者9pg=5表示每頁(yè)5個(gè)pg=9表示每頁(yè)9個(gè)筒繁輸入筒體還是繁體jf=0表示繁體 jf=l表示筒體表 1步驟20222 調(diào)整設(shè)置重新生成客戶端交互界面。具體的,用戶也可以根據(jù)自己的愛好設(shè)置客戶端的交互界面。例如候選詞橫排或 豎排的顯示方式,候選詞字體的大小,為候選詞增加文本修飾的設(shè)置。更改了客戶端界面愛 好設(shè)置后,在線輸入法會(huì)根據(jù)更改的項(xiàng)目重新讀取配置文件進(jìn)而對(duì)界面進(jìn)行重新的生成, 以更友好的交互界面來提高用戶的體驗(yàn)。步驟2023 服務(wù)器根據(jù)所述獲取候選字詞請(qǐng)求信息中的字母組合數(shù),確定所述字 母組合數(shù)所對(duì)應(yīng)的多元組概率計(jì)算模型,根據(jù)所述對(duì)應(yīng)的概率計(jì)算模型進(jìn)行取詞。具體的,通過服務(wù)器取詞CGI (Common Gate hterface,通用網(wǎng)關(guān)接口 )接收來自 客戶端的取詞請(qǐng)求,根據(jù)客戶端選擇的不同的輸入法,將獲取候選字詞的請(qǐng)求信息分別發(fā) 送至對(duì)應(yīng)的智能取詞服務(wù)器。所述智能取詞服務(wù)器根據(jù)請(qǐng)求信息中用戶輸入的字母組合進(jìn) 行分詞,并結(jié)合上報(bào)的網(wǎng)頁(yè)環(huán)境所匹配的詞庫(kù)進(jìn)行取詞。進(jìn)一步的,傳統(tǒng)的單機(jī)輸入法使用的是基于“二元組”的概率計(jì)算模型,即對(duì)相鄰 的兩個(gè)詞語關(guān)系出現(xiàn)的概率進(jìn)行計(jì)算,最后輸出出現(xiàn)概率最大的兩個(gè)詞語,這種計(jì)算方法 局限于詞語的規(guī)模以及機(jī)器的計(jì)算存儲(chǔ)能力,從計(jì)算效率和效果上,都不能令人滿意。例如 輸入“緩解工作壓力”,通過二元概率計(jì)算模型進(jìn)行詞語輸出的單機(jī)輸入法得到的輸出結(jié)果 為“換屆工作壓力”,這是因?yàn)檩斎敕ㄍㄟ^二元概率計(jì)算模型對(duì)換屆和工作這兩個(gè)詞的所有 同音的詞語進(jìn)行計(jì)算,得出換屆和工作這兩個(gè)詞是出現(xiàn)概率最高的二元組合,但是卻無法 將緩解和壓力這兩個(gè)詞的聯(lián)系體現(xiàn)出來。在線輸入法可以彌補(bǔ)二元概率計(jì)算模型的局限 性,借助服務(wù)器強(qiáng)大的計(jì)算能力和存儲(chǔ)能力,除了使用二元概率計(jì)算模型進(jìn)行取詞,還可以 通過對(duì)三元組甚至更多詞語組合的多元組的概率進(jìn)行存儲(chǔ)并且在計(jì)算整體概率時(shí)使用。以拼音輸入法來說,多元組概率計(jì)算模型是通過對(duì)用戶輸入的三個(gè)或三個(gè)以上的 詞語拼音組合進(jìn)行相關(guān)性概率計(jì)算,在所有同音的拼音組合中輸出計(jì)算后概率最高的詞語 組合。理論上講,詞語相關(guān)性概率計(jì)算的組合越多,輸入法計(jì)算后所得到的詞語組合或者句 子的準(zhǔn)確性越高,越符合輸入者的輸入意圖。以上例為例,多元組概率計(jì)算模型會(huì)對(duì)緩解, 工作,壓力這三個(gè)詞的拼音進(jìn)行相關(guān)性概率計(jì)算,在眾多同音的拼音組合中,會(huì)找到這三個(gè) 詞構(gòu)成的句子出現(xiàn)概率最高,是最符合用戶輸入意圖的。多元組的計(jì)算方法一種更合理的整句概率計(jì)算方法,進(jìn)一步加強(qiáng)了前后詞之間的聯(lián)系,使得輸入法可以輸出更高準(zhǔn)確率的 取詞結(jié)果。步驟203 將所述取詞結(jié)果輸出到所述客戶端網(wǎng)頁(yè)。具體的,智能取詞服務(wù)器將取詞結(jié)果轉(zhuǎn)化為JSON數(shù)據(jù)格式,返回給客戶端。JSON 數(shù)據(jù)格式是一種輕量級(jí)的數(shù)據(jù)交換格式,非常適合于服務(wù)器與客戶端JavMcript的交互。 將返回的候選詞按照詞頻順序顯示到在線輸入法的候選詞欄中。此時(shí)在線輸入法會(huì)對(duì)用戶 所進(jìn)行的候選詞選擇進(jìn)行監(jiān)聽,用戶在候選詞中選擇符合自己輸入意圖的詞語后,會(huì)將用 戶所選擇的候選詞回調(diào)到網(wǎng)頁(yè)上用戶所進(jìn)行輸入的輸入欄中,同時(shí)將輸入欄和候選詞欄隱 藏,等待用戶再一次的輸入操作。步驟204 根據(jù)用戶選詞結(jié)果對(duì)服務(wù)器詞庫(kù)進(jìn)行全局詞頻調(diào)整。具體的,在線輸入法記錄用戶的選詞信息,通過AJAX異步通信技術(shù)將記錄在客戶 端的選詞信息傳送至服務(wù)器。服務(wù)器詞庫(kù)的詞序會(huì)根據(jù)用戶的詞語使用情況進(jìn)行變動(dòng),提 高常用詞匯的詞頻,使得取詞效率得到進(jìn)一步提高。本步驟是可選的,也可以不執(zhí)行本步驟 的操作。因此,步驟204可以具體如下步驟2041 獲取用戶選詞信息。具體的,客戶端的JavMcript程序會(huì)記錄下用戶的選詞信息,可以根據(jù)預(yù)設(shè)置的 選詞次數(shù)或者使用時(shí)間,將用戶的選詞信息發(fā)送至服務(wù)器進(jìn)行處理。通過服務(wù)器上報(bào)CGI 接收來自客戶端上報(bào)的用戶選詞信息。預(yù)設(shè)置的選詞次數(shù)或者使用時(shí)間等觸發(fā)上報(bào)選詞信 息的條件,本發(fā)明實(shí)施例中并不對(duì)此做出限定。步驟2042 根據(jù)用戶選詞結(jié)果進(jìn)行詞語使用頻率統(tǒng)計(jì)。具體的,將所有收集來的用戶選詞信息匯總,進(jìn)行用戶選詞統(tǒng)計(jì),按照用戶對(duì)詞語 的使用情況,對(duì)頻繁使用的詞語進(jìn)行調(diào)頻,使其獲得更高的詞頻,在返回給用戶的候選詞列 表中的候選位置會(huì)比其原來的位置更靠前。另一方面,收集來的信息會(huì)發(fā)送至在線統(tǒng)計(jì)服務(wù)器,對(duì)在線輸入法的在線使用人 數(shù)進(jìn)行統(tǒng)計(jì),進(jìn)而對(duì)在線輸入法進(jìn)行優(yōu)化處理。例如對(duì)長(zhǎng)時(shí)間閑置不用的客戶端,對(duì)其與服 務(wù)器的連接進(jìn)行切斷處理,保證服務(wù)器的資源利用率得到最高效的利用。步驟2043 根據(jù)所述統(tǒng)計(jì)結(jié)果更新服務(wù)器詞庫(kù)的詞頻。具體的,將調(diào)整詞頻后的用戶選詞信息更新到服務(wù)器的詞庫(kù)中,對(duì)服務(wù)器詞庫(kù)中 的詞頻實(shí)現(xiàn)實(shí)時(shí)的更新,隨時(shí)對(duì)詞庫(kù)的詞頻做出合理的調(diào)整。用戶在進(jìn)行文字輸入的時(shí)候, 服務(wù)器按照用戶的輸入將實(shí)時(shí)調(diào)整后的詞頻與之匹配,按實(shí)時(shí)更新后的詞頻順序?qū)⒑蜻x詞 返回給客戶端以備用戶選取。步驟205 服務(wù)器自動(dòng)搜尋熱門詞匯進(jìn)行詞庫(kù)更新。具體的,服務(wù)器通過詞庫(kù)采集整理服務(wù)器實(shí)時(shí)的在網(wǎng)絡(luò)中搜尋熱門詞匯,并將熱 門詞匯進(jìn)行整理分類后實(shí)時(shí)的更新到詞庫(kù)服務(wù)器中,并調(diào)整詞庫(kù)服務(wù)器中詞語的詞頻,無 需等待熱門詞匯被用戶頻繁輸入后服務(wù)器對(duì)其詞頻的調(diào)高,從而使用戶取詞的智能性和關(guān) 聯(lián)性更高,由此提高了服務(wù)器取詞的效率,并且用戶的體驗(yàn)也得到了提高。本步驟是可選 的,也可以不執(zhí)行本步驟的操作。本發(fā)明實(shí)施例提供的技術(shù)方案的有益效果是通過對(duì)監(jiān)聽客戶端網(wǎng)頁(yè)的用戶輸 入,根據(jù)所述用戶輸入向服務(wù)器發(fā)送獲取候選字詞請(qǐng)求信息,使服務(wù)器根據(jù)所述獲取候選字詞請(qǐng)求信息進(jìn)行取詞,并將所述取詞結(jié)果輸出到所述客戶端網(wǎng)頁(yè)。實(shí)現(xiàn)了用戶在需要進(jìn) 行輸入的頁(yè)面中直接進(jìn)行中文輸入的操作,擺脫了傳統(tǒng)的必須在特定網(wǎng)頁(yè)中進(jìn)行中文輸 入,還需將輸出的文字拷貝到需要進(jìn)行輸入的網(wǎng)頁(yè)中的過程。另一方面,服務(wù)器通過多元組 概率計(jì)算模型,可以使用戶進(jìn)行單字、詞、句子的輸入,同時(shí)更精確的與用戶輸入的字母組 合進(jìn)行匹配,提高了對(duì)用戶輸入意圖的理解程度,并提高了用戶輸入的效率與用戶的輸入 體驗(yàn)。實(shí)施例3本發(fā)明第三實(shí)施例提出了一種在線中文輸入的客戶端,其結(jié)構(gòu)如圖3所示,包括監(jiān)聽模塊1,用于監(jiān)聽客戶端網(wǎng)頁(yè)的用戶輸入;發(fā)送模塊2,用于根據(jù)所述用戶輸入向服務(wù)器發(fā)送獲取候選字詞請(qǐng)求信息;輸出模塊3,用于將取詞結(jié)果輸出到所述客戶端網(wǎng)頁(yè)。本發(fā)明實(shí)施例中,通過對(duì)監(jiān)聽客戶端網(wǎng)頁(yè)的用戶輸入,根據(jù)所述用戶輸入向服務(wù) 器發(fā)送獲取候選字詞請(qǐng)求信息,使服務(wù)器根據(jù)所述獲取候選字詞請(qǐng)求信息進(jìn)行取詞,并將 所述取詞結(jié)果輸出到所述客戶端網(wǎng)頁(yè)。實(shí)現(xiàn)了用戶在需要進(jìn)行輸入的頁(yè)面中直接進(jìn)行中文 輸入的操作,擺脫了傳統(tǒng)的必須在特定網(wǎng)頁(yè)中進(jìn)行中文單字輸入,還需將輸出的文字拷貝 到需要進(jìn)行輸入的網(wǎng)頁(yè)中的過程。提高了用戶輸入的效率,并提高了用戶的輸入體驗(yàn)。實(shí)施例4本發(fā)明第四實(shí)施例提出了一種在線中文輸入的客戶端,是對(duì)第三實(shí)施例的進(jìn)一步 證明,其結(jié)構(gòu)如圖4所示,在線中文輸入的裝置包括監(jiān)聽模塊1、發(fā)送模塊2和輸出模塊3, 還可以包括預(yù)處理模塊4,設(shè)置模塊5。監(jiān)聽模塊1,用于監(jiān)聽客戶端網(wǎng)頁(yè)的用戶輸入。監(jiān)聽模塊1可以具體包括預(yù)存儲(chǔ)單元11,用于預(yù)先存儲(chǔ)啟動(dòng)輸入法的代碼的鏈接。第一獲取單元12,用于獲取在線輸入法程序文件。監(jiān)聽單元13,用于在客戶端生成輸入法,并監(jiān)聽客戶端網(wǎng)頁(yè)的用戶輸入。預(yù)處理模塊4,用于預(yù)先采集所述客戶端網(wǎng)頁(yè)的網(wǎng)頁(yè)信息發(fā)送至服務(wù)器,使服務(wù)器 選出一個(gè)與所述網(wǎng)頁(yè)信息最匹配的詞庫(kù),用于根據(jù)所述獲取候選字詞請(qǐng)求信息進(jìn)行取詞。發(fā)送模塊2,用于根據(jù)所述用戶輸入向服務(wù)器發(fā)送獲取候選字詞請(qǐng)求信息,使服務(wù) 器根據(jù)所述獲取候選字詞請(qǐng)求信息進(jìn)行取詞??梢跃唧w用于每當(dāng)所述用戶進(jìn)行輸入操作,實(shí)時(shí)向服務(wù)器發(fā)送一條包含所有用戶 輸入的字母或字母組合的獲取候選字詞請(qǐng)求信息。設(shè)置模塊5,用于向服務(wù)器發(fā)送候選字詞選取習(xí)慣的參數(shù)。設(shè)置模塊5可以具體包括第一設(shè)置單元51,用于將輸入習(xí)慣調(diào)整后的參數(shù)附加在獲取候選字詞的請(qǐng)求信息 中發(fā)送至服務(wù)器。第二設(shè)置單元52,用于調(diào)整設(shè)置重新生成客戶端交互界面。輸出模塊3,用于將取詞結(jié)果輸出到所述客戶端網(wǎng)頁(yè)。本發(fā)明實(shí)施例中,通過對(duì)監(jiān)聽客戶端網(wǎng)頁(yè)的用戶輸入,根據(jù)所述用戶輸入向服務(wù) 器發(fā)送獲取候選字詞請(qǐng)求信息,使服務(wù)器根據(jù)所述獲取候選字詞請(qǐng)求信息進(jìn)行取詞,并將所述取詞結(jié)果輸出到所述客戶端網(wǎng)頁(yè)。實(shí)現(xiàn)了用戶在需要進(jìn)行輸入的頁(yè)面中直接進(jìn)行中文 輸入的操作,擺脫了傳統(tǒng)的必須在特定網(wǎng)頁(yè)中進(jìn)行中文單字輸入,還需將輸出的文字拷貝 到需要進(jìn)行輸入的網(wǎng)頁(yè)中的過程。提高了用戶輸入的效率,并提高了用戶的輸入體驗(yàn)。本發(fā)明實(shí)施例第三和第四實(shí)施例的客戶端,與前述的第一和第二實(shí)施例的方法構(gòu) 思和原理相同,因此在第三和第四實(shí)施例中對(duì)與第一和第二實(shí)施例中相同的部分不再贅 述。實(shí)施例5本發(fā)明第五實(shí)施例提出了一種終端登錄系統(tǒng),其結(jié)構(gòu)如圖5所示,包括客戶端1 和服務(wù)器2 ;其中,客戶端1包括監(jiān)聽模塊11,用于監(jiān)聽客戶端網(wǎng)頁(yè)的用戶輸入。預(yù)處理模塊12,用于預(yù)先采集所述客戶端網(wǎng)頁(yè)的網(wǎng)頁(yè)信息發(fā)送至服務(wù)器,使服務(wù) 器選出一個(gè)與所述網(wǎng)頁(yè)信息最匹配的詞庫(kù),用于根據(jù)所述獲取候選字詞請(qǐng)求信息進(jìn)行取 詞。發(fā)送模塊13,用于根據(jù)所述用戶輸入向服務(wù)器發(fā)送獲取候選字詞請(qǐng)求信息。設(shè)置模塊14,用于向服務(wù)器發(fā)送候選字詞選取習(xí)慣的參數(shù)。輸出模塊15,用于將取詞結(jié)果輸出到所述客戶端網(wǎng)頁(yè)。其中,服務(wù)器2包括取詞模塊21,用于接收客戶端發(fā)送的獲取候選字詞請(qǐng)求信息,根據(jù)所述獲取候選 字詞請(qǐng)求信息進(jìn)行取詞。第一調(diào)整模塊22,用于根據(jù)所述客戶端發(fā)送的候選字詞選取習(xí)慣的參數(shù)進(jìn)行候選 字詞的調(diào)整。第二調(diào)整模塊23,用于根據(jù)客戶端選詞結(jié)果對(duì)服務(wù)器詞庫(kù)進(jìn)行全局詞頻調(diào)整。更新模塊M,用于服務(wù)器自動(dòng)搜尋熱門詞匯進(jìn)行詞庫(kù)更新。本發(fā)明實(shí)施例提供的技術(shù)方案的有益效果是通過對(duì)監(jiān)聽客戶端網(wǎng)頁(yè)的用戶輸 入,根據(jù)所述用戶輸入向服務(wù)器發(fā)送獲取候選字詞請(qǐng)求信息,使服務(wù)器根據(jù)所述獲取候選 字詞請(qǐng)求信息進(jìn)行取詞,并將所述取詞結(jié)果輸出到所述客戶端網(wǎng)頁(yè)。實(shí)現(xiàn)了用戶在需要進(jìn) 行輸入的頁(yè)面中直接進(jìn)行中文輸入的操作,擺脫了傳統(tǒng)的必須在特定網(wǎng)頁(yè)中進(jìn)行中文輸 入,還需將輸出的文字拷貝到需要進(jìn)行輸入的網(wǎng)頁(yè)中的過程。另一方面,服務(wù)器通過多元組 概率計(jì)算模型,可以使用戶進(jìn)行單字、詞、句子的輸入,同時(shí)更精確的與用戶輸入的字母組 合進(jìn)行匹配,提高了對(duì)用戶輸入意圖的理解程度,并提高了用戶輸入的效率與用戶的輸入 體驗(yàn)。實(shí)施例6本發(fā)明第六實(shí)施例提出了一種終端登錄系統(tǒng),是對(duì)第五實(shí)施例的進(jìn)一步證明,其 結(jié)構(gòu)如圖6所示,包括終端1和服務(wù)器2 ;其中,客戶端1包括監(jiān)聽模塊11,用于監(jiān)聽客戶端網(wǎng)頁(yè)的用戶輸入。監(jiān)聽模塊11可以具體包括預(yù)存儲(chǔ)單元111,用于預(yù)先存儲(chǔ)啟動(dòng)輸入法的代碼的鏈接。
13
第一獲取單元112,用于獲取在線輸入法程序文件。監(jiān)聽單元113,用于在客戶端生成輸入法,并監(jiān)聽客戶端網(wǎng)頁(yè)的用戶輸入。預(yù)處理模塊12,用于預(yù)先采集所述客戶端網(wǎng)頁(yè)的網(wǎng)頁(yè)信息發(fā)送至服務(wù)器,使服務(wù) 器選出一個(gè)與所述網(wǎng)頁(yè)信息最匹配的詞庫(kù),用于根據(jù)所述獲取候選字詞請(qǐng)求信息進(jìn)行取 詞。發(fā)送模塊13,用于根據(jù)所述用戶輸入向服務(wù)器發(fā)送獲取候選字詞請(qǐng)求信息,使服 務(wù)器根據(jù)所述獲取候選字詞請(qǐng)求信息進(jìn)行取詞。可以具體用于每當(dāng)所述用戶進(jìn)行輸入操作,實(shí)時(shí)向服務(wù)器發(fā)送一條包含所有用戶 輸入的字母或字母組合的獲取候選字詞請(qǐng)求信息。設(shè)置模塊14,用于向服務(wù)器發(fā)送候選字詞選取習(xí)慣的參數(shù)。設(shè)置模塊14可以具體包括第一設(shè)置單元141,用于將輸入習(xí)慣調(diào)整后的參數(shù)附加在獲取候選字詞的請(qǐng)求信 息中發(fā)送至服務(wù)器。第二設(shè)置單元142,用于調(diào)整設(shè)置重新生成客戶端交互界面。輸出模塊15,用于將取詞結(jié)果輸出到所述客戶端網(wǎng)頁(yè)。其中,服務(wù)器2包括取詞模塊21,用于接收客戶端發(fā)送的獲取候選字詞請(qǐng)求信息,根據(jù)所述獲取候選 字詞請(qǐng)求信息進(jìn)行取詞。具體用于服務(wù)器根據(jù)所述獲取候選字詞請(qǐng)求信息中的字母組合數(shù),確定所述字母 組合數(shù)所對(duì)應(yīng)的多元組概率計(jì)算模型,根據(jù)所述對(duì)應(yīng)的概率計(jì)算模型進(jìn)行取詞。第一調(diào)整模塊22,用于根據(jù)所述客戶端發(fā)送的候選字詞選取習(xí)慣的參數(shù)進(jìn)行候選 字詞的調(diào)整。第二調(diào)整模塊23,用于根據(jù)客戶端選詞結(jié)果對(duì)服務(wù)器詞庫(kù)進(jìn)行全局詞頻調(diào)整。第二調(diào)整模塊23可以為第二獲取單元231,用于獲取用戶選詞信息。統(tǒng)計(jì)單元232,用于根據(jù)用戶選詞結(jié)果進(jìn)行詞語使用頻率統(tǒng)計(jì)。調(diào)整單元233,用于根據(jù)所述統(tǒng)計(jì)結(jié)果更新服務(wù)器詞庫(kù)的詞頻。更新模塊3,用于服務(wù)器自動(dòng)搜尋熱門詞匯進(jìn)行詞庫(kù)更新。本發(fā)明實(shí)施例提供的技術(shù)方案的有益效果是通過對(duì)監(jiān)聽客戶端網(wǎng)頁(yè)的用戶輸 入,根據(jù)所述用戶輸入向服務(wù)器發(fā)送獲取候選字詞請(qǐng)求信息,使服務(wù)器根據(jù)所述獲取候選 字詞請(qǐng)求信息進(jìn)行取詞,并將所述取詞結(jié)果輸出到所述客戶端網(wǎng)頁(yè)。實(shí)現(xiàn)了用戶在需要進(jìn) 行輸入的頁(yè)面中直接進(jìn)行中文輸入的操作,擺脫了傳統(tǒng)的必須在特定網(wǎng)頁(yè)中進(jìn)行中文輸 入,還需將輸出的文字拷貝到需要進(jìn)行輸入的網(wǎng)頁(yè)中的過程。另一方面,服務(wù)器通過多元組 概率計(jì)算模型,可以使用戶進(jìn)行單字、詞、句子的輸入,同時(shí)更精確的與用戶輸入的字母組 合進(jìn)行匹配,提高了對(duì)用戶輸入意圖的理解程度,并提高了用戶輸入的效率與用戶的輸入 體驗(yàn)。本發(fā)明實(shí)施例第五和第六的系統(tǒng),與前述的第一和第二實(shí)施例的方法構(gòu)思和原理 相同,因此在第五和第六實(shí)施例中對(duì)與第一和第二實(shí)施例中相同的部分不再贅述。本發(fā)明實(shí)施例所述集成的單元如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),也可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。基于這樣的理解,本發(fā)明的 技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì) 算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè) 人計(jì)算機(jī),網(wǎng)站,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的全部或部分。而前述 的存儲(chǔ)介質(zhì)包括U盤、移動(dòng)硬盤、只讀存儲(chǔ)器(ROM,Read-Only Memory)、隨機(jī)存取存儲(chǔ)器 (RAM, Random Access Memory)、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
以上僅為本發(fā)明的較佳實(shí)施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則 之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種在線輸入中文的方法,其特征在于,所述方法包括 監(jiān)聽客戶端網(wǎng)頁(yè)的用戶輸入;根據(jù)所述用戶輸入向服務(wù)器發(fā)送獲取候選字詞請(qǐng)求信息,使服務(wù)器根據(jù)所述獲取候選 字詞請(qǐng)求信息進(jìn)行取詞;將所述取詞結(jié)果輸出到所述客戶端網(wǎng)頁(yè)。
2.根據(jù)權(quán)利要求1所述的一種在線輸入中文的方法,其特征在于,所述根據(jù)所述用戶 輸入向服務(wù)器發(fā)送獲取候選字詞請(qǐng)求信息,包括每當(dāng)所述用戶進(jìn)行輸入操作,實(shí)時(shí)向服務(wù)器發(fā)送一條包含所有用戶輸入的字母或字母 組合的獲取候選字詞請(qǐng)求信息。
3.根據(jù)權(quán)利要求1所述的一種在線輸入中文的方法,其特征在于,所述服務(wù)器根據(jù)所 述獲取候選字詞請(qǐng)求信息進(jìn)行取詞,包括服務(wù)器根據(jù)所述獲取候選字詞請(qǐng)求信息中的字母組合數(shù),確定所述字母組合數(shù)所對(duì)應(yīng) 的多元組概率計(jì)算模型,根據(jù)所述對(duì)應(yīng)的概率計(jì)算模型進(jìn)行取詞。
4.根據(jù)權(quán)利要求1所述的一種在線輸入中文的方法,其特征在于,所述監(jiān)聽客戶端網(wǎng) 頁(yè)的用戶輸入,之前還包括預(yù)先采集所述客戶端網(wǎng)頁(yè)的網(wǎng)頁(yè)信息發(fā)送至服務(wù)器,使服務(wù)器選出一個(gè)與所述網(wǎng)頁(yè)信 息最匹配的詞庫(kù),用于根據(jù)所述獲取候選字詞請(qǐng)求信息進(jìn)行取詞。
5.根據(jù)權(quán)利要求1所述的一種在線輸入中文的方法,其特征在于,所述根據(jù)所述用戶 輸入向服務(wù)器發(fā)送獲取候選字詞請(qǐng)求信息,使服務(wù)器根據(jù)所述獲取候選字詞請(qǐng)求信息進(jìn)行 取詞,之后還包括向服務(wù)器發(fā)送候選字詞選取習(xí)慣的參數(shù),使服務(wù)器根據(jù)所述參數(shù)進(jìn)行候選字詞選取的調(diào)整。
6.根據(jù)權(quán)利要求1所述的一種在線輸入中文的方法,其特征在于,所述方法還包括 根據(jù)用戶選詞結(jié)果對(duì)服務(wù)器詞庫(kù)進(jìn)行全局詞頻調(diào)整。
7.—種在線輸入中文的客戶端,其特征在于,所述裝置包括 監(jiān)聽模塊,用于監(jiān)聽客戶端網(wǎng)頁(yè)的用戶輸入;發(fā)送模塊,用于根據(jù)所述用戶輸入向服務(wù)器發(fā)送獲取候選字詞請(qǐng)求信息,使服務(wù)器根 據(jù)所述獲取候選字詞請(qǐng)求信息進(jìn)行取詞;輸出模塊,用于將取詞結(jié)果輸出到所述客戶端網(wǎng)頁(yè)。
8.根據(jù)權(quán)利要求7所述的一種在線輸入中文的客戶端,其特征在于,所述發(fā)送模塊具 體用于每當(dāng)所述用戶進(jìn)行輸入操作,實(shí)時(shí)向服務(wù)器發(fā)送一條包含所有用戶輸入的字母或字 母組合的獲取候選字詞請(qǐng)求信息。
9.根據(jù)權(quán)利要求7所述的一種在線輸入中文的客戶端,其特征在于,所述裝置還包括 預(yù)處理模塊,用于預(yù)先采集所述客戶端網(wǎng)頁(yè)的網(wǎng)頁(yè)信息發(fā)送至服務(wù)器,使服務(wù)器選出一個(gè)與所述網(wǎng)頁(yè)信息最匹配的詞庫(kù),用于根據(jù)所述獲取候選字詞請(qǐng)求信息進(jìn)行取詞。
10.根據(jù)權(quán)利要求7所述的一種在線輸入中文的客戶端,其特征在于,所述裝置還包括設(shè)置模塊,用于向服務(wù)器發(fā)送候選字詞選取習(xí)慣的參數(shù)。
11.一種在線輸入中文的系統(tǒng),包括客戶端和服務(wù)器;其特征在于,所述客戶端包括監(jiān)聽模塊,用于監(jiān)聽客戶端網(wǎng)頁(yè)的用戶輸入;發(fā)送模塊,用于根據(jù)所述用戶輸入向服務(wù)器發(fā)送獲取候選字詞請(qǐng)求信息; 輸出模塊,用于將取詞結(jié)果輸出到所述客戶端網(wǎng)頁(yè); 所述服務(wù)器包括取詞模塊,用于接收客戶端發(fā)送的獲取候選字詞請(qǐng)求信息,根據(jù)所述獲取候選字詞請(qǐng) 求信息進(jìn)行取詞。
12.根據(jù)權(quán)利要求11所述的一種在線輸入中文的系統(tǒng),其特征在于,所述發(fā)送模塊具 體用于每當(dāng)所述用戶進(jìn)行輸入操作,實(shí)時(shí)向服務(wù)器發(fā)送一條包含所有用戶輸入的字母或字 母組合的獲取候選字詞請(qǐng)求信息。
13.根據(jù)權(quán)利要求11所述的一種在線輸入中文的系統(tǒng),其特征在于,所述取詞模塊具 體用于服務(wù)器根據(jù)所述獲取候選字詞請(qǐng)求信息中的字母組合數(shù),確定所述字母組合數(shù)所對(duì) 應(yīng)的多元組概率計(jì)算模型,根據(jù)所述對(duì)應(yīng)的概率計(jì)算模型進(jìn)行取詞。
14.根據(jù)權(quán)利要求11所述的一種在線輸入中文的系統(tǒng),其特征在于,所述客戶端還包括預(yù)處理模塊,用于預(yù)先采集所述客戶端網(wǎng)頁(yè)的網(wǎng)頁(yè)信息發(fā)送至服務(wù)器,使服務(wù)器選出 一個(gè)與所述網(wǎng)頁(yè)信息最匹配的詞庫(kù),用于根據(jù)所述獲取候選字詞請(qǐng)求信息進(jìn)行取詞。
15.根據(jù)權(quán)利要求11所述的一種在線輸入中文的系統(tǒng),其特征在于,所述客戶端還包括設(shè)置模塊,用于向服務(wù)器發(fā)送候選字詞選取習(xí)慣的參數(shù)。
16.根據(jù)權(quán)利要求11所述的一種在線輸入中文的系統(tǒng),其特征在于,所述服務(wù)器還包括第一調(diào)整模塊,用于根據(jù)所述客戶端發(fā)送的候選字詞選取習(xí)慣的參數(shù)進(jìn)行候選字詞的 調(diào)整。
17.根據(jù)權(quán)利要求11所述的一種在線輸入中文的系統(tǒng),其特征在于,所述服務(wù)器還包括第二調(diào)整模塊,用于根據(jù)客戶端選詞結(jié)果對(duì)服務(wù)器詞庫(kù)進(jìn)行全局詞頻調(diào)整。
18.根據(jù)權(quán)利要求11所述的一種在線輸入中文的系統(tǒng),其特征在于,所述服務(wù)器還包括更新模塊,用于服務(wù)器自動(dòng)搜尋熱門詞匯進(jìn)行詞庫(kù)更新。
全文摘要
本發(fā)明提出了一種在線輸入中文的方法、客戶端和系統(tǒng),屬于計(jì)算機(jī)技術(shù)領(lǐng)域。本發(fā)明實(shí)施例通過對(duì)監(jiān)聽客戶端網(wǎng)頁(yè)的用戶輸入,根據(jù)所述用戶輸入向服務(wù)器發(fā)送獲取候選字詞請(qǐng)求信息,使服務(wù)器根據(jù)所述獲取候選字詞請(qǐng)求信息進(jìn)行取詞,并將所述取詞結(jié)果輸出到所述客戶端網(wǎng)頁(yè)。實(shí)現(xiàn)了用戶在需要進(jìn)行輸入的頁(yè)面中直接進(jìn)行中文輸入的操作,擺脫了傳統(tǒng)的必須在特定網(wǎng)頁(yè)中進(jìn)行中文輸入,還需將輸出的文字拷貝到需要進(jìn)行輸入的網(wǎng)頁(yè)中的過程。另一方面,服務(wù)器通過多元組概率計(jì)算模型,可以使用戶進(jìn)行單字、詞、句子的輸入,同時(shí)更精確的與用戶輸入的字母組合進(jìn)行匹配,提高了對(duì)用戶輸入意圖的理解程度,并提高了用戶輸入的效率與用戶的輸入體驗(yàn)。
文檔編號(hào)G06F17/30GK102063504SQ201110001858
公開日2011年5月18日 申請(qǐng)日期2011年1月6日 優(yōu)先權(quán)日2011年1月6日
發(fā)明者屈超, 邵付東 申請(qǐng)人:騰訊科技(深圳)有限公司