專利名稱:一種獲取新的字詞組的方法和裝置的制作方法
技術領域:
本發(fā)明涉及輸入法技術領域,特別涉及一種獲取新的字詞組的方法和裝置。
背景技術:
隨著計算機通信技術的快速發(fā)展,計算機已逐漸成為人們?nèi)粘I詈凸ぷ髦胁豢?缺少的工具,在使用計算機的過程中,用戶通過使用輸入法系統(tǒng),實現(xiàn)將字詞輸入計算機 中。 輸入法系統(tǒng)是運行于計算機操作系統(tǒng)上的一個工具軟件,可以將用戶通過鍵盤輸
入的編碼轉換成字或詞輸入計算機。在現(xiàn)有的輸入法系統(tǒng)中,為每一個字或詞設定有相應
的編碼,并將每一個字或詞及其相應的編碼存儲在輸入法系統(tǒng)中的詞庫中,用戶在使用輸
入法系統(tǒng)進行輸入時,只要輸入相應的編碼就能獲得所需的字或詞。 然而,在實現(xiàn)本發(fā)明的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術至少存在以下缺點 用戶在使用輸入法系統(tǒng)輸入字或詞的過程中,經(jīng)常需要輸入一些復合詞、人名之
類的詞語;而現(xiàn)有輸入法系統(tǒng)自帶的詞庫中沒有包括這類詞語,使得用戶在需要輸入這類
詞語時,只能拆開按字或單純詞一個一個進行輸入,影響了輸入速度。
發(fā)明內(nèi)容
為了提高用戶的輸入速度,本發(fā)明實施例提供了一種獲取新的字詞組的方法和裝 置。所述技術方案如下 —方面,本發(fā)明實施例提供了一種獲取新的字詞組的方法,包括 獲取用戶連續(xù)N次輸入的N個字詞單元,所述N為大于等于2的自然數(shù); 計算所述N個字詞單元之間的語義相關度,根據(jù)計算出的所述N個字詞單元之間
的語義相關度和預設的語義相關度閾值,確定所述N個字詞單元是否可以組合為新的字詞
組; 當確定所述N個字詞單元可以組合為新的字詞組時,將所述新的字詞組加入指定 詞庫中。 進一步地,所述根據(jù)計算出的所述N個字詞單元之間的語義相關度和預設的語義
相關度閾值,確定所述N個字詞單元是否可以組合為新的字詞組,具體包括 判斷計算出的所述N個字詞單元之間的語義相關度是否大于預設的語義相關度
閾值; 如果大于,則確定所述N個字詞單元可以組合為新的字詞組;否則,確定所述N個 字詞單元不可以組合為新的字詞組。
進一步地,所述語義相關度包括上下文關聯(lián)度、或人名關聯(lián)度; 相應地,所述預設的語義相關度閾值包括預設的上下文關聯(lián)度閾值、或預設的人
名關聯(lián)度閾值; 相應地,所述判斷計算出的所述N個字詞單元之間的語義相關度是否大于預設的語義相關度閾值具體為 判斷計算出的所述N個字詞單元之間的上下文關聯(lián)度是否大于預設的上下文關 聯(lián)度閾值;或 判斷計算出的所述N個字詞單元之間的人名關聯(lián)度是否大于預設的人名關聯(lián)度 閾值。
進一步地,所述語義相關度包括上下文關聯(lián)度和人名關聯(lián)度; 相應地,所述預設的語義相關度閾值包括預設的上下文關聯(lián)度閾值和預設的人 名關聯(lián)度閾值; 相應地,所述計算所述N個字詞單元之間的語義相關度,根據(jù)計算出的所述N個字 詞單元之間的語義相關度和預設的語義相關度閾值,確定所述N個字詞單元是否可以組合 為新的字詞組,具體包括 計算所述N個字詞單元之間的上下文關聯(lián)度; 判斷計算出的所述N個字詞單元之間的上下文關聯(lián)度是否大于預設的上下文關 聯(lián)度閾值; 如果大于,則確定所述N個字詞單元可以組合為新的字詞組,然后執(zhí)行將所述新
的字詞組加入指定詞庫的步驟;否則,計算所述N個字詞單元之間的人名關聯(lián)度,然后判斷
計算出的所述N個字詞單元之間的人名關聯(lián)度是否大于預設的人名關聯(lián)度閾值; 如果大于,則確定所述N個字詞單元可以組合為新的字詞組;否則,確定所述N個
字詞單元不可以組合為新的字詞組。
進一步地,所述語義相關度包括上下文關聯(lián)度和人名關聯(lián)度; 相應地,所述預設的語義相關度閾值包括預設的上下文關聯(lián)度閾值和預設的人 名關聯(lián)度閾值; 相應地,所述計算所述N個字詞單元之間的語義相關度,根據(jù)計算出的所述N個字 詞單元之間的語義相關度和預設的語義相關度閾值,確定所述N個字詞單元是否可以組合 為新的字詞組,具體包括 計算所述N個字詞單元之間的人名關聯(lián)度; 判斷計算出的所述N個字詞單元之間的人名關聯(lián)度是否大于預設的人名關聯(lián)度 閾值; 如果大于,則確定所述N個字詞單元可以組合為新的字詞組,然后執(zhí)行將所述新 的字詞組加入指定詞庫的步驟;否則,計算所述N個字詞單元之間的上下文關聯(lián)度,然后判 斷計算出的所述N個字詞單元之間的上下文關聯(lián)度,是否大于預設的上下文關聯(lián)度閾值;
如果大于,則確定所述N個字詞單元可以組合為新的字詞組;否則,確定所述N個 字詞單元不可以組合為新的字詞組。 進一步地,所述獲取用戶連續(xù)N次輸入的N個字詞單元之后,計算所述N個字詞單 元之間的語義相關度之前還包括 判斷現(xiàn)有詞庫和所述指定詞庫中是否存在所述N個字詞單元; 如果所述現(xiàn)有詞庫和所述指定詞庫中均不存在所述N個字詞單元,則執(zhí)行計算所
述N個字詞單元之間的語義相關度的步驟。
另一方面,本發(fā)明實施例提供了一種獲取新的字詞組的裝置,包括
獲取模塊,用于獲取用戶連續(xù)N次輸入的N個字詞單元,所述N為大于等于2的自 然數(shù); 處理模塊,用于在所述獲取模塊獲取到N個字詞單元后,計算所述N個字詞單元之 間的語義相關度,根據(jù)計算出的所述N個字詞單元之間的語義相關度和預設的語義相關度 閾值,確定所述N個字詞單元是否可以組合為新的字詞組; 更新模塊,用于當所述處理模塊確定所述N個字詞單元可以組合為新的字詞組 時,將所述新的字詞組加入指定詞庫中。
進一步地,所述處理模塊具體包括 第一計算單元,用于在所述獲取模塊獲取到N個字詞單元后,計算所述N個字詞單 元之間的語義相關度; 第一判斷單元,用于在所述第一計算單元計算出所述N個字詞單元之間的語義相 關度后,判斷計算出的所述N個字詞單元之間的語義相關度是否大于預設的語義相關度閾 值; 第一確定單元,用于當所述第一判斷單元的判斷結果是大于時,確定所述N個字 詞單元可以組合為新的字詞組;當所述第一判斷單元的判斷結果是小于等于時,確定所述 N個字詞單元不可以組合為新的字詞組。 進一步地,當所述語義相關度包括上下文關聯(lián)度、或人名關聯(lián)度;相應地,所述預 設的語義相關度閾值包括預設的上下文關聯(lián)度閾值、或預設的人名關聯(lián)度閾值時,所述第 一判斷單元,具體用于在所述第一計算單元計算出所述N個字詞單元之間的上下文關聯(lián)度 后,判斷計算出的所述N個字詞單元之間的上下文關聯(lián)度是否大于預設的語義相關度閾 值;或 所述第一判斷單元,具體用于在所述第一計算單元計算出所述N個字詞單元之間 的人名關聯(lián)度后,判斷計算出的所述N個字詞單元之間的人名關聯(lián)度是否大于預設的語義 相關度閾值。 進一步地,當所述語義相關度包括上下文關聯(lián)度和人名關聯(lián)度,相應地,所述預設 的語義相關度閾值包括預設的上下文關聯(lián)度閾值和預設的人名關聯(lián)度閾值時,所述處理模 塊具體包括 第二計算單元,用于在所述獲取模塊獲取到N個字詞單元后,計算所述N個字詞單 元之間的上下文關聯(lián)度; 第二判斷單元,用于在所述第二計算單元計算出所述N個字詞單元之間的上下文 關聯(lián)度后,判斷計算出的所述N個字詞單元之間的上下文關聯(lián)度是否大于預設的上下文關 聯(lián)度閾值; 第二確定單元,用于當所述第二判斷單元的判斷結果是大于時,確定所述N個字 詞單元可以組合為新的字詞組,然后通知所述更新模塊執(zhí)行將所述新的字詞組加入指定詞 庫的步驟; 第三計算單元,用于當所述第二判斷單元的判斷結果是小于等于時,計算所述N 個字詞單元之間的人名關聯(lián)度; 第三判斷單元,用于在所述第三計算單元計算出所述N個字詞單元之間的人名關 聯(lián)度后,判斷計算出的所述N個字詞單元之間的人名關聯(lián)度是否大于預設的人名關聯(lián)度閾值; 第三確定單元,用于當所述第三判斷單元的判斷結果是大于時,確定所述N個字 詞單元可以組合為新的字詞組;當所述第三判斷單元的判斷結果是小于等于時,確定所述 N個字詞單元不可以組合為新的字詞組。 進一步地,當所述語義相關度包括上下文關聯(lián)度和人名關聯(lián)度,相應地,預設的語 義相關度閾值包括預設的上下文關聯(lián)度閾值和預設的人名關聯(lián)度閾值時,所述處理模塊具 體包括 第四計算單元,用于在所述獲取模塊獲取到N個字詞單元后,計算所述N個字詞單 元之間的人名關聯(lián)度; 第四判斷單元,用于在所述第四計算單元計算出所述N個字詞單元之間的人名關 聯(lián)度后,判斷計算出的所述N個字詞單元之間的人名關聯(lián)度是否大于預設的人名關聯(lián)度閾 值; 第四確定單元,用于當所述第四判斷單元的判斷結果是大于時,確定所述N個字 詞單元可以組合為新的字詞組,然后通知所述更新模塊執(zhí)行將所述新的字詞組加入指定詞 庫的步驟; 第五計算單元,用于當所述第四判斷單元的判斷結果是小于等于時,計算所述N 個字詞單元之間的上下文關聯(lián)度;; 第五判斷單元,用于在所述第五計算單元計算出所述N個字詞單元之間的上下文 關聯(lián)度后,判斷計算出的所述N個字詞單元之間的上下文關聯(lián)度是否大于預設的上下文關 聯(lián)度閾值; 第五確定單元,用于當所述第五判斷單元的判斷結果是大于時,確定所述N個字 詞單元可以組合為新的字詞組;當所述第五判斷單元的判斷結果是小于等于時,確定所述 N個字詞單元不可以組合為新的字詞組。
進一步地,所述裝置還包括 判斷模塊,用于在所述獲取模塊獲取到N個字詞單元后,判斷現(xiàn)有詞庫和所述指 定詞庫中是否存在所述N個字詞單元; 通知模塊,用于當所述判斷模塊的判斷結果是所述現(xiàn)有詞庫和所述指定詞庫中均 不存在所述N個字詞單元時,通知所述處理模塊執(zhí)行計算所述N個字詞單元之間的語義相 關度的步驟。
本發(fā)明實施例提供的技術方案的有益效果是 本發(fā)明實施例所述的獲取新的字詞組的方法,根據(jù)實時計算得到的用戶連續(xù)輸入 的N個字詞單元之間的語義相關度,組合出新的字詞組,并將新的字詞組加入指定詞庫中, 使得用戶需要再次輸入該N個字詞單元時,指定詞庫可以以字詞組的形式提供該N個字詞 單元的候選項,減少了用戶的擊鍵次數(shù),大大提高了用戶輸入字詞時的輸入速度,可以節(jié)省 用戶的時間,方便用戶的輸入。并且,語義相關度可以為上下文關聯(lián)度和人名關聯(lián)度,為輸 入一些復合詞和中國人名提供了很大便利。
圖1是本發(fā)明實施例1提供的一種獲取新的字詞組的方法流程9
圖2是本發(fā)明實施例2提供的一種獲取新的字詞組的方法流程圖; 圖3是本發(fā)明實施例3提供的一種獲取新的字詞組的方法流程圖; 圖4是本發(fā)明實施例4提供的一種獲取新的字詞組的裝置結構示意圖; 圖5是本發(fā)明實施例4提供的另一種獲取新的字詞組的裝置結構示意圖。
具體實施例方式
為使本發(fā)明的目的、技術方案和優(yōu)點更加清楚,下面將結合附圖對本發(fā)明實施方
式作進一步地詳細描述。
實施例1 參見圖l,本發(fā)明實施例提供了一種獲取新的字詞組的方法,包括 101 :獲取用戶連續(xù)N次輸入的N個字詞單元,N為大于等于2的自然數(shù)。 102 :計算N個字詞單元之間的語義相關度,根據(jù)計算出的N個字詞單元之間的語
義相關度和預設的語義相關度閾值,確定N個字詞單元是否可以組合為新的字詞組。 103:當確定N個字詞單元可以組合為新的字詞組時,將新的字詞組加入指定詞庫中。 進一步地,根據(jù)計算出的N個字詞單元之間的語義相關度和預設的語義相關度閾 值,確定N個字詞單元是否可以組合為新的字詞組,具體可以包括 判斷計算出的N個字詞單元之間的語義相關度是否大于預設的語義相關度閾值;
如果大于,則確定N個字詞單元可以組合為新的字詞組;否則,確定N個字詞單元 不可以組合為新的字詞組。
進一步地,語義相關度包括上下文關聯(lián)度、或人名關聯(lián)度; 相應地,預設的語義相關度閾值包括預設的上下文關聯(lián)度閾值、或預設的人名關 聯(lián)度閾值; 相應地,判斷計算出的N個字詞單元之間的語義相關度是否大于預設的語義相關 度閾值具體為 判斷計算出的N個字詞單元之間的上下文關聯(lián)度是否大于預設的上下文關聯(lián)度 閾值;或 判斷計算出的N個字詞單元之間的人名關聯(lián)度是否大于預設的人名關聯(lián)度閾值。
進一步地,語義相關度包括上下文關聯(lián)度和人名關聯(lián)度; 相應地,預設的語義相關度閾值包括預設的上下文關聯(lián)度閾值和預設的人名關 聯(lián)度閾值; 相應地,計算N個字詞單元之間的語義相關度,根據(jù)計算出的N個字詞單元之間的 語義相關度和預設的語義相關度閾值,確定N個字詞單元是否可以組合為新的字詞組,具 體可以包括 計算N個字詞單元之間的上下文關聯(lián)度; 判斷計算出的N個字詞單元之間的上下文關聯(lián)度是否大于預設的上下文關聯(lián)度 閾值; 如果大于,則確定N個字詞單元可以組合為新的字詞組,然后執(zhí)行將新的字詞組 加入指定詞庫的步驟;否則,計算N個字詞單元之間的人名關聯(lián)度,然后判斷計算出的N個字詞單元之間的人名關聯(lián)度是否大于預設的人名關聯(lián)度閾值; 如果大于,則確定N個字詞單元可以組合為新的字詞組;否則,確定N個字詞單元 不可以組合為新的字詞組。
進一步地,語義相關度包括上下文關聯(lián)度和人名關聯(lián)度; 相應地,預設的語義相關度閾值包括預設的上下文關聯(lián)度閾值和預設的人名關 聯(lián)度閾值時; 相應地,計算N個字詞單元之間的語義相關度,根據(jù)計算出的N個字詞單元之間的 語義相關度和預設的語義相關度閾值,確定N個字詞單元是否可以組合為新的字詞組,具 體可以包括 計算N個字詞單元之間的人名關聯(lián)度; 判斷計算出的N個字詞單元之間的人名關聯(lián)度是否大于預設的人名關聯(lián)度閾值;
如果大于,則確定N個字詞單元可以組合為新的字詞組,然后執(zhí)行將新的字詞組 加入指定詞庫的步驟;否則,計算N個字詞單元之間的上下文關聯(lián)度,然后判斷計算出的N 個字詞單元之間的上下文關聯(lián)度是否大于預設的上下文關聯(lián)度閾值; 如果大于,則確定N個字詞單元可以組合為新的字詞組;否則,確定N個字詞單元 不可以組合為新的字詞組。 進一步地,獲取用戶連續(xù)N次輸入的N個字詞單元之后,計算N個字詞單元之間的 語義相關度之前還包括 判斷現(xiàn)有詞庫和指定詞庫中是否存在該N個字詞單元; 如果現(xiàn)有詞庫和指定詞庫中均不存在該N個字詞單元,則執(zhí)行計算N個字詞單元 之間的語義相關度的步驟。 本發(fā)明實施例所述的獲取新的字詞組的方法,根據(jù)實時計算得到的用戶連續(xù)輸入 的N個字詞單元之間的語義相關度,組合出新的字詞組,并將新的字詞組加入指定詞庫中, 使得用戶需要再次輸入該N個字詞單元時,指定詞庫可以以字詞組的形式提供該N個字詞 單元的候選項,減少了用戶的擊鍵次數(shù),大大提高了用戶輸入字詞時的輸入速度,可以節(jié)省 用戶的時間,方便用戶的輸入。并且,語義相關度可以為上下文關聯(lián)度和人名關聯(lián)度,為輸 入一些復合詞和中國人名提供了很大便利。
實施例2 參見圖2,本發(fā)明實施例提供了一種獲取新的字詞組的方法,包括
201 :獲取用戶連續(xù)N次輸入的N個字詞單元,其中,N為大于等于2的自然數(shù)。
本發(fā)明實施例中將用戶通過按鍵輸入編碼(可以是拼音、五筆字型等可以實現(xiàn)字 詞輸入的符號),并輸入該編碼對應的字詞(即選詞上屏)為一次輸入字詞單元,而且,一次 輸入的字詞單元可以是單個字(如中、國等),或可以是單個詞(如和平、解放等),或可 以是一個短語(如我愛北京、天安門等)等,也就是說本發(fā)明實施例的字詞單元表示字、詞 或短語等用戶一次性輸入的內(nèi)容,相應地N個字詞單元表示用戶連續(xù)N次輸入的內(nèi)容。并 且,可以采用任何可行的方式獲取用戶連續(xù)N次輸入的N個字詞單元,如可以在用戶輸入過 程中,實時緩存用戶當前一次輸入的字詞單元,連續(xù)緩存N次即得到用戶連續(xù)N次輸入的N 個字詞單元。另外,可以根據(jù)實際應用狀況,選擇N的具體取值,如N可以取值為2、3、5等。
例如用戶通過拼音輸入字詞,并且N取值為2。在用戶一次輸入過程中,用戶先輸
11入"hua",并選擇"hua"對應的"花"作為一次輸入,然后用戶輸入"duo ",并選擇"duo "對 應的"朵"作為一次輸入,此時獲取到用戶連續(xù)2次輸入的2個字詞單元為"花朵"。在用戶 另一次輸入過程中,用戶先輸入"ziben",并選擇"ziben"對應的"資本"作為一次輸入,接 著用戶輸入"zhuyi",并選擇"zhuyi"對應的"主義"作為一次輸入,此時獲取到用戶連續(xù)2 次輸入的2個字詞單元為"資本主義",再接著用戶輸入"shehui",并選擇"shehui"對應的 "社會"作為一次輸入,此時獲取到用戶連續(xù)2次輸入的2個字詞單元為"主義社會"。
202 :判斷現(xiàn)有詞庫和指定詞庫中是否存在獲取的該N個字詞單元,如果存在,則 執(zhí)行207 ;否則,執(zhí)行203。 其中,現(xiàn)有詞庫可以是核心詞庫、用戶詞庫等輸入法系統(tǒng)自帶的各種詞庫;指定詞 庫是本發(fā)明實施例指定的存儲通過本發(fā)明實施例獲取到的新的字詞組的詞庫,需要說明的 是,也可以將現(xiàn)有詞庫中的任意一個詞庫作為指定詞庫,不對此進行限定。具體地,可以通 過將獲取的N個字詞單元與現(xiàn)有詞庫和指定詞庫中存在的字詞進行比對,得出現(xiàn)有詞庫和 指定詞庫中是否存在當前獲取的N個字詞單元。并且需要說明的是,在比對時是將N個字 詞單元作為一個整體進行比對,如獲取的N個字詞單元為"資本主義",則判斷"資本主義" 是否存在現(xiàn)有詞庫和指定詞庫中。 203 :計算獲取的N個字詞單元之間的語義相關度。 在用戶輸入字詞的過程中,通過對用戶連續(xù)輸入的N個字詞單元的語義(語義表 示字、詞的詞性、釋義以及在不同語境中出現(xiàn)時的屬性等)進行分析,可以知道用戶輸入的 N個字詞單元之間的關聯(lián)性,從而可以將用戶連續(xù)輸入的N個字詞單元組合為一個整體,以 便用戶再次輸入?;谏鲜鲈?,本發(fā)明實施例使用語義相關度來表示連續(xù)輸入的N個字 詞單元之間的語義相關程度。例如獲取到用戶連續(xù)輸入的"學習"+ "知識","學習"+ "知 識"之間存在很大的語義關聯(lián)性,組成"學習知識"非常合理,因此"學習"+ "知識"之間的 語義相關度應該很大。相反,獲取到用戶連續(xù)輸入的"小"+ "張"+ "的"+ "事情",雖然它 們也是連續(xù)輸入,但沒有語義上的關聯(lián)性,組成"小張的事情"就是一個沒有意義的詞,因此 "小"+ "張"+ "的"+ "事情"之間的語義相關度應該很小。具體地,可以通過下面的方法計 算獲取的N個字詞單元之間的語義相關度
第一種方法
1)獲取語料集。 其中,語料集可以是計算機通過搜素引擎實時搜索到的各種文字材料的集合,如 網(wǎng)絡新聞、文章等,或可以是預存的各種文字材料的集合,如預存的各種文章、論文等。本發(fā) 明實施例對語料集不做限制,可以根據(jù)實際應用狀況靈活選擇。 2)統(tǒng)計獲取的N個字詞單元在語料集中出現(xiàn)的次數(shù),將統(tǒng)計得到的次數(shù)作為語義 相關度。 其中,統(tǒng)計N個字詞單元在語料集中出現(xiàn)的次數(shù)時,是將N個字詞單元作為一個整 體進行統(tǒng)計的。并且需要說明的是,獲取的語料集的數(shù)量越大、范圍越廣,得到的語義相關 度就越具有代表性,但需要的計算時間也就會相應地越長,實際應用中,可以根據(jù)具體應用 情況,靈活選擇語料集的數(shù)量和范圍。
第二種方法 使用N元條件概率公式計算N個字詞單元可能被連續(xù)輸入的概率AN,將計算出的概率作為語義相關度。N元條件概率公式如下
AN = P(Sn^、S2…Sn—》 其中,N表示輸入的次數(shù),N為大于等于2的自然數(shù),SN表示第N次輸入的字詞單 元,P (SNI SpS," SN—》表示條件概率??梢圆捎萌魏慰尚械姆椒ㄓ嬎鉖 (S》、P (S2) 、P (S^2)... P(S^…S,)等,例如可以采用對收集的語料集進行統(tǒng)計的方法進行,也可以通過對多個用 戶的輸入過程進行統(tǒng)計得到。 通過N元條件概率公式可以表現(xiàn)連續(xù)N次輸入的N個字詞單元之間的關聯(lián)程度。 在連續(xù)輸入時,N元條件概率就表現(xiàn)為在已有前(N-l)次輸入的情況下,后一次輸入內(nèi)容出 現(xiàn)的可能性,即連續(xù)N次輸入的N個字詞單元之間的條件概率。并且需要說明的是,選取的 N越大,計算概率AN需要的計算量和存儲數(shù)據(jù)也越大,邊輸入邊計算的要求也越難滿足,因 此在實際應用中,可以根據(jù)實際應用狀況選擇N的取值。 需要說明的是,計算獲取的N個字詞單元之間的語義相關度并不限于上述的二種 方法,可以根據(jù)實際應用狀況,采用任何其他可行的方法。 另外,根據(jù)語義的不同表現(xiàn),可以將語義分為純粹的上下文內(nèi)容之間的關聯(lián),或是 人名的姓與名之間的關聯(lián),因此語義相關度可以包括上下文關聯(lián)度和人名關聯(lián)度。
上下文關聯(lián)度主要反應了上下文內(nèi)容之間的關聯(lián)性,如獲取用戶連續(xù)輸入的"學 習"+"知識",這兩個字詞單元之間具有很強的上下文關聯(lián)性;相反,如果獲取用戶連續(xù)輸入 的是"小張"+ "打球",則這兩個字詞單元之間的關聯(lián)性就明顯不如"學習"+ "知識"這兩 個字詞單元之間的上下文關聯(lián)性強。 人名關聯(lián)度主要反應了一個名字的姓與名之間的關聯(lián)性,如獲取用戶連續(xù)輸入 的"張"+ "三",這兩個字詞單元之間具有很強的人名關聯(lián)性,相反,如果獲取用戶連續(xù)輸入 的是"張"+ "開",則這兩個字詞單元之間的人名關聯(lián)性就明顯不如"張"+ "三"這兩個字 詞單元之間的人名關聯(lián)性強。對于漢語而言,可以將數(shù)億中國人的人名作為語料集,進行統(tǒng) 計計算得到人名關聯(lián)度。并且,對于漢語而言,人名一般是2到3個字,所以可以將N取值 為2或3。 需要說明的是,上下文關聯(lián)度和人名關聯(lián)度的具體計算方式與計算語義相關度的 方式類似,此處不再贅述。并且需要說明的是,上下文關聯(lián)度和人名關聯(lián)度只是語義相關度 的兩種形式,并不限于此,可以根據(jù)實際應用狀況進行設置。 204 :判斷計算出的語義相關度,是否大于預設的語義相關度閾值,如果大于,則執(zhí) 行205 ;否則,執(zhí)行206。 預設的語義相關度閾值可以根據(jù)實驗或經(jīng)驗進行設置,不對此進行具體限定。如 可以計算所有N個連續(xù)的字詞單元出現(xiàn)在語料集中的次數(shù),并進行加權和歸一化處理,取 平均值,作為預設的語義相關度閾值。并且與步驟203中的語義相關度相對應,預設的語義 相關度閾值可以包括上下文關聯(lián)度閾值和人名關聯(lián)度閾值。如當步驟203中的語義相關度 具體為上下文關聯(lián)度時,該步驟中預設的語義相關度閾值具體為上下文關聯(lián)度閾值。
205 :確定獲取的N個字詞單元可以組合為一個新的字詞組,并將該新的字詞組加 入指定詞庫中,然后執(zhí)行207。 需要說明的是,本領域的技術人員很容易想到,在將新的字詞組加入指定詞庫時, 可以將與該新的字詞組對應的編碼(可以是拼音、和/或五筆字型等可以實現(xiàn)字詞輸入的符號)也加入指定詞庫,這樣指定詞庫可以以字詞組的形式提供該N個字詞單元的候選項, 可以減少用戶的擊鍵次數(shù)。例如用戶通過拼音輸入現(xiàn)有詞庫不存在的人名"金日昆",用 戶先輸入"jin"選擇"金"作為一次輸入,接著輸入"ri"選擇"日"作為一次輸入,然后輸 入"kirn"選擇"昆"作為一次輸入,得到"金日昆",在用戶輸入過程中通過本發(fā)明實施例的 方法,獲取到"金日昆",將"金日昆"和其對應的編碼"jinrikun"加入指定詞庫,這樣下次 用戶需要再次輸入"金日昆"時,只需輸入jinrik皿"即可。 206 :確定獲取的N個字詞單元不可以組合為一個新的字詞組,然后執(zhí)行207。
207 :重新獲取用戶連續(xù)N次輸入的N個字詞單元,然后執(zhí)行202。
本發(fā)明實施例所述的獲取新的字詞組的方法,根據(jù)實時計算得到的用戶連續(xù)輸入 的N個字詞單元之間的語義相關度,組合出新的字詞組,并將新的字詞組加入指定詞庫中, 使得用戶需要再次輸入該N個字詞單元時,指定詞庫可以以字詞組的形式提供該N個字詞 單元的候選項,減少了用戶的擊鍵次數(shù),大大提高了用戶輸入字詞時的輸入速度,可以節(jié)省 用戶的時間,方便用戶的輸入。并且,語義相關度可以為上下文關聯(lián)度和人名關聯(lián)度,為輸 入一些復合詞和中國人名提供了很大便利。 需要說明的是,由于語義相關度可以包括上下文關聯(lián)度和人名關聯(lián)度,所以在實 際應用中可以只使用上下文關聯(lián)度,或只使用人名關聯(lián)度,或?qū)⑸舷挛年P聯(lián)度和人名關聯(lián) 度結合起來使用。并且在將上下文關聯(lián)度和人名關聯(lián)度結合起來使用時,可以是先利用上 下文關聯(lián)度確定N個字詞單元是否可以組合為一個新的字詞組,再利用人名關聯(lián)度確定N 個字詞單元是否可以組合為一個新的字詞組;或可以是先利用人名關聯(lián)度確定N個字詞單 元是否可以組合為一個新的字詞組,再利用上下文關聯(lián)度確定N個字詞單元是否可以組合 為一個新的字詞組。下面以先利用上下文關聯(lián)度確定N個字詞單元是否可以組合為一個新 的字詞組,再利用人名關聯(lián)度確定N個字詞單元是否可以組合為一個新的字詞組為例進行
進一步說明。
實施例3 參見圖3,本發(fā)明實施例提供了一種獲取新的字詞組的方法,包括 301 :獲取用戶連續(xù)N次輸入的N個字詞單元,其中,N為大于等于2的自然數(shù)。 與步驟201類似,此處不再贅述。 302 :判斷現(xiàn)有詞庫和指定詞庫中是否存在獲取的N個字詞單元,如果存在,則執(zhí)
行309 ;否則,執(zhí)行303。 與步驟202類似,此處不再贅述。 303 :計算獲取的N個字詞單元之間的上下文關聯(lián)度。 與步驟203中計算語義相關度的方法類似,此處不再贅述。 304:判斷計算出的上下文關聯(lián)度,是否大于預設的上下文關聯(lián)度閾值,如果大于, 則執(zhí)行307 ;否則,執(zhí)行305。 305 :計算獲取的N個字詞單元之間的人名關聯(lián)度。 與步驟203中計算語義相關度的方法類似,此處不再贅述。 306:判斷計算出的人名關聯(lián)度是否大于預設的人名關聯(lián)度閾值,如果大于,則執(zhí) 行307 ;否則,執(zhí)行308。 307 :確定獲取的N個字詞單元可以組合為一個新的字詞組,并將該新的字詞組加入指定詞庫中,然后執(zhí)行309。 與步驟205類似,此處不再贅述。 308 :確定獲取的N個字詞單元不可以組合為一個新的字詞組,然后執(zhí)行309。 309 :重新獲取用戶連續(xù)N次輸入的N個字詞單元,然后執(zhí)行302。 本發(fā)明實施例所述的獲取新的字詞組的方法,根據(jù)實時計算得到的用戶連續(xù)輸入
的N個字詞單元之間的上下文關聯(lián)度和人名關聯(lián)度,組合出新的字詞組,并將新的字詞組
加入指定詞庫中,使得用戶需要再次輸入該N個字詞單元時,指定詞庫可以以字詞組的形
式提供該N個字詞單元的候選項,減少了用戶的擊鍵次數(shù),大大提高了用戶輸入字詞時的
輸入速度,可以節(jié)省用戶的時間,方便用戶的輸入,為輸入一些復合詞和中國人名提供了很
大便利。 實施例4 參見圖4,本發(fā)明實施例提供了一種獲取新的字詞組的裝置,包括 獲取模塊401,用于獲取用戶連續(xù)N次輸入的N個字詞單元,N為大于等于2的自然數(shù)。 處理模塊402,用于在獲取模塊401獲取到N個字詞單元后,計算N個字詞單元 之間的語義相關度,根據(jù)計算出的N個字詞單元之間的語義相關度和預設的語義相關度閾 值,確定N個字詞單元是否可以組合為新的字詞組; 更新模塊403,用于當處理模塊402確定N個字詞單元可以組合為新的字詞組時,
將新的字詞組加入指定詞庫中。 進一步地,處理模塊402具體可以包括 第一計算單元,用于在獲取模塊401獲取到N個字詞單元后,計算N個字詞單元之 間的語義相關度; 第一判斷單元,用于在第一計算單元計算出N個字詞單元之間的語義相關度后,
判斷計算出的N個字詞單元之間的語義相關度是否大于預設的語義相關度閾值; 第一確定單元,用于當?shù)谝慌袛鄦卧呐袛嘟Y果是大于時,確定N個字詞單元可
以組合為新的字詞組;當?shù)谝慌袛鄦卧呐袛嘟Y果是小于等于時,確定N個字詞單元不可
以組合為新的字詞組。 進一步地,當語義相關度包括上下文關聯(lián)度、或人名關聯(lián)度;相應地,預設的語義 相關度閾值包括預設的上下文關聯(lián)度閾值、或預設的人名關聯(lián)度閾值時,第一判斷單元,具 體用于在第一計算單元計算出N個字詞單元之間的上下文關聯(lián)度后,判斷計算出的N個字 詞單元之間的上下文關聯(lián)度是否大于預設的語義相關度閾值;或 第一判斷單元,具體用于在第一計算單元計算出N個字詞單元之間的人名關聯(lián)度 后,判斷計算出的N個字詞單元之間的人名關聯(lián)度是否大于預設的語義相關度閾值。
進一步地,當語義相關度包括上下文關聯(lián)度和人名關聯(lián)度,相應地,預設的語義相 關度閾值包括預設的上下文關聯(lián)度閾值和預設的人名關聯(lián)度閾值時,處理模塊402具體可 以包括 第二計算單元,用于在獲取模塊401獲取到N個字詞單元后,計算N個字詞單元之 間的上下文關聯(lián)度; 第二判斷單元,用于在第二計算單元計算出N個字詞單元之間的上下文關聯(lián)度后,判斷計算出的N個字詞單元之間的上下文關聯(lián)度是否大于預設的上下文關聯(lián)度閾值; 第二確定單元,用于當?shù)诙袛鄦卧呐袛嘟Y果是大于時,確定N個字詞單元可以組合為新的字詞組,然后通知更新模塊403執(zhí)行將新的字詞組加入指定詞庫的步驟;
第三計算單元,用于當?shù)诙袛鄦卧呐袛嘟Y果是小于等于時,計算N個字詞單元之間的人名關聯(lián)度; 第三判斷單元,用于在第三計算單元計算出N個字詞單元之間的人名關聯(lián)度后,
判斷計算出的N個字詞單元之間的人名關聯(lián)度是否大于預設的人名關聯(lián)度閾值; 第三確定單元,用于當?shù)谌袛鄦卧呐袛嘟Y果是大于時,確定N個字詞單元可
以組合為新的字詞組;當?shù)谌袛鄦卧呐袛嘟Y果是小于等于時,確定N個字詞單元不可
以組合為新的字詞組。 進一步地,當語義相關度包括上下文關聯(lián)度和人名關聯(lián)度,相應地,預設的語義相關度閾值包括預設的上下文關聯(lián)度閾值和預設的人名關聯(lián)度閾值時,處理模塊402具體可以包括 第四計算單元,用于在獲取模塊401獲取到N個字詞單元后,計算N個字詞單元之間的人名關聯(lián)度; 第四判斷單元,用于在第四計算單元計算出N個字詞單元之間的人名關聯(lián)度后,判斷計算出的N個字詞單元之間的人名關聯(lián)度,是否大于預設的人名關聯(lián)度閾值;
第四確定單元,用于當?shù)谒呐袛鄦卧呐袛嘟Y果是大于時,確定N個字詞單元可以組合為新的字詞組,然后通知更新模塊403執(zhí)行將新的字詞組加入指定詞庫的步驟;
第五計算單元,用于當?shù)谒呐袛鄦卧呐袛嘟Y果是小于等于時,計算N個字詞單元之間的上下文關聯(lián)度; 第五判斷單元,用于在第五計算單元計算出N個字詞單元之間的上下文關聯(lián)度后,判斷計算出的N個字詞單元之間的上下文關聯(lián)度,是否大于預設的上下文關聯(lián)度閾值;
第五確定單元,用于當?shù)谖迮袛鄦卧呐袛嘟Y果是大于時,確定N個字詞單元可以組合為新的字詞組;當?shù)谖迮袛鄦卧呐袛嘟Y果是大于等于時,確定N個字詞單元不可以組合為新的字詞組。 進一步地,參見圖5,該裝置還包括 判斷模塊404,用于在獲取模塊401獲取到N個字詞單元后,判斷現(xiàn)有詞庫和指定詞庫中是否存在該N個字詞單元; 通知模塊405,用于當判斷模塊404的判斷結果是現(xiàn)有詞庫和指定詞庫中均不存在該N個字詞單元時,通知處理模塊402執(zhí)行計算N個字詞單元之間的語義相關度的步驟。
本發(fā)明實施例所述的獲取新的字詞組的裝置,根據(jù)實時計算得到的用戶連續(xù)輸入的N個字詞單元之間的語義相關度,組合出新的字詞組,并將新的字詞組加入指定詞庫中,使得用戶需要再次輸入該N個字詞單元時,指定詞庫可以以字詞組的形式提供該N個字詞單元的候選項,減少了用戶的擊鍵次數(shù),大大提高了用戶輸入字詞時的輸入速度,可以節(jié)省用戶的時間,方便用戶的輸入。并且,語義相關度可以為上下文關聯(lián)度和人名關聯(lián)度,為輸入一些復合詞和中國人名提供了很大便利。 以上實施例提供的技術方案中的全部或部分內(nèi)容可以通過軟件編程實現(xiàn),其軟件程序存儲在可讀取的存儲介質(zhì)中,存儲介質(zhì)例如計算機中的硬盤、光盤或軟盤。
以上所述僅為本發(fā)明的較佳實施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內(nèi)。
權利要求
一種獲取新的字詞組的方法,其特征在于,包括獲取用戶連續(xù)N次輸入的N個字詞單元,所述N為大于等于2的自然數(shù);計算所述N個字詞單元之間的語義相關度,根據(jù)計算出的所述N個字詞單元之間的語義相關度和預設的語義相關度閾值,確定所述N個字詞單元是否可以組合為新的字詞組;當確定所述N個字詞單元可以組合為新的字詞組時,將所述新的字詞組加入指定詞庫中。
2. 根據(jù)權利要求1所述的獲取新的字詞組的方法,其特征在于,所述根據(jù)計算出的所 述N個字詞單元之間的語義相關度和預設的語義相關度閾值,確定所述N個字詞單元是否可以組合為新的字詞組,具體包括判斷計算出的所述N個字詞單元之間的語義相關度是否大于預設的語義相關度閾值; 如果大于,則確定所述N個字詞單元可以組合為新的字詞組;否則,確定所述N個字詞單元不可以組合為新的字詞組。
3. 根據(jù)權利要求2所述的獲取新的字詞組的方法,其特征在于,所述語義相關度包括上下文關聯(lián)度、或人名關聯(lián)度;相應地,所述預設的語義相關度閾值包括預設的上下文關聯(lián)度閾值、或預設的人名關 聯(lián)度閾值;相應地,所述判斷計算出的所述N個字詞單元之間的語義相關度是否大于預設的語義 相關度閾值具體為判斷計算出的所述N個字詞單元之間的上下文關聯(lián)度是否大于預設的上下文關聯(lián)度 閾值;或判斷計算出的所述N個字詞單元之間的人名關聯(lián)度是否大于預設的人名關聯(lián)度閾值。
4. 根據(jù)權利要求1所述的獲取新的字詞組的方法,其特征在于,所述語義相關度包括 上下文關聯(lián)度和人名關聯(lián)度;相應地,所述預設的語義相關度閾值包括預設的上下文關聯(lián)度閾值和預設的人名關 聯(lián)度閾值;相應地,所述計算所述N個字詞單元之間的語義相關度,根據(jù)計算出的所述N個字詞單 元之間的語義相關度和預設的語義相關度閾值,確定所述N個字詞單元是否可以組合為新 的字詞組,具體包括計算所述N個字詞單元之間的上下文關聯(lián)度;判斷計算出的所述N個字詞單元之間的上下文關聯(lián)度是否大于預設的上下文關聯(lián)度 閾值;如果大于,則確定所述N個字詞單元可以組合為新的字詞組,然后執(zhí)行將所述新的字 詞組加入指定詞庫的步驟;否則,計算所述N個字詞單元之間的人名關聯(lián)度,然后判斷計算 出的所述N個字詞單元之間的人名關聯(lián)度是否大于預設的人名關聯(lián)度閾值;如果大于,則確定所述N個字詞單元可以組合為新的字詞組;否則,確定所述N個字詞 單元不可以組合為新的字詞組。
5. 根據(jù)權利要求1所述的獲取新的字詞組的方法,其特征在于,所述語義相關度包括 上下文關聯(lián)度和人名關聯(lián)度;相應地,所述預設的語義相關度閾值包括預設的上下文關聯(lián)度閾值和預設的人名關聯(lián)度閾值;相應地,所述計算所述N個字詞單元之間的語義相關度,根據(jù)計算出的所述N個字詞單 元之間的語義相關度和預設的語義相關度閾值,確定所述N個字詞單元是否可以組合為新 的字詞組,具體包括計算所述N個字詞單元之間的人名關聯(lián)度;判斷計算出的所述N個字詞單元之間的人名關聯(lián)度是否大于預設的人名關聯(lián)度閾值;如果大于,則確定所述N個字詞單元可以組合為新的字詞組,然后執(zhí)行將所述新的字 詞組加入指定詞庫的步驟;否則,計算所述N個字詞單元之間的上下文關聯(lián)度,然后判斷計 算出的所述N個字詞單元之間的上下文關聯(lián)度,是否大于預設的上下文關聯(lián)度閾值;如果大于,則確定所述N個字詞單元可以組合為新的字詞組;否則,確定所述N個字詞 單元不可以組合為新的字詞組。
6. 根據(jù)權利要求1至5中任一權利要求所述的獲取新的字詞組的方法,其特征在于,所 述獲取用戶連續(xù)N次輸入的N個字詞單元之后,計算所述N個字詞單元之間的語義相關度之前還包括判斷現(xiàn)有詞庫和所述指定詞庫中是否存在所述N個字詞單元;如果所述現(xiàn)有詞庫和所述指定詞庫中均不存在所述N個字詞單元,則執(zhí)行計算所述N 個字詞單元之間的語義相關度的步驟。
7. —種獲取新的字詞組的裝置,其特征在于,包括獲取模塊,用于獲取用戶連續(xù)N次輸入的N個字詞單元,所述N為大于等于2的自然數(shù);處理模塊,用于在所述獲取模塊獲取到N個字詞單元后,計算所述N個字詞單元之間 的語義相關度,根據(jù)計算出的所述N個字詞單元之間的語義相關度和預設的語義相關度閾 值,確定所述N個字詞單元是否可以組合為新的字詞組;更新模塊,用于當所述處理模塊確定所述N個字詞單元可以組合為新的字詞組時,將 所述新的字詞組加入指定詞庫中。
8. 根據(jù)權利要求7所述的獲取新的字詞組的裝置,其特征在于,所述處理模塊具體包括第一計算單元,用于在所述獲取模塊獲取到N個字詞單元后,計算所述N個字詞單元之 間的語義相關度;第一判斷單元,用于在所述第一計算單元計算出所述N個字詞單元之間的語義相關度 后,判斷計算出的所述N個字詞單元之間的語義相關度是否大于預設的語義相關度閾值;第一確定單元,用于當所述第一判斷單元的判斷結果是大于時,確定所述N個字詞單 元可以組合為新的字詞組;當所述第一判斷單元的判斷結果是小于等于時,確定所述N個 字詞單元不可以組合為新的字詞組。
9. 根據(jù)權利要求8所述的獲取新的字詞組的裝置,其特征在于,當所述語義相關度包 括上下文關聯(lián)度、或人名關聯(lián)度;相應地,所述預設的語義相關度閾值包括預設的上下文關 聯(lián)度閾值、或預設的人名關聯(lián)度閾值時所述第一判斷單元,具體用于在所述第一計算單元計算出所述N個字詞單元之間的上 下文關聯(lián)度后,判斷計算出的所述N個字詞單元之間的上下文關聯(lián)度是否大于預設的語義相關度閾值;或所述第一判斷單元,具體用于在所述第一計算單元計算出所述N個字詞單元之間的人 名關聯(lián)度后,判斷計算出的所述N個字詞單元之間的人名關聯(lián)度是否大于預設的語義相關 度閾值。
10. 根據(jù)權利要求7所述的獲取新的字詞組的裝置,其特征在于,當所述語義相關度包 括上下文關聯(lián)度和人名關聯(lián)度,相應地,所述預設的語義相關度閾值包括預設的上下文關 聯(lián)度閾值和預設的人名關聯(lián)度閾值時,所述處理模塊具體包括第二計算單元,用于在所述獲取模塊獲取到N個字詞單元后,計算所述N個字詞單元之 間的上下文關聯(lián)度;第二判斷單元,用于在所述第二計算單元計算出所述N個字詞單元之間的上下文關聯(lián) 度后,判斷計算出的所述N個字詞單元之間的上下文關聯(lián)度是否大于預設的上下文關聯(lián)度 閾值;第二確定單元,用于當所述第二判斷單元的判斷結果是大于時,確定所述N個字詞單 元可以組合為新的字詞組,然后通知所述更新模塊執(zhí)行將所述新的字詞組加入指定詞庫的 步驟;第三計算單元,用于當所述第二判斷單元的判斷結果是小于等于時,計算所述N個字 詞單元之間的人名關聯(lián)度;第三判斷單元,用于在所述第三計算單元計算出所述N個字詞單元之間的人名關聯(lián)度 后,判斷計算出的所述N個字詞單元之間的人名關聯(lián)度是否大于預設的人名關聯(lián)度閾值;第三確定單元,用于當所述第三判斷單元的判斷結果是大于時,確定所述N個字詞單 元可以組合為新的字詞組;當所述第三判斷單元的判斷結果是小于等于時,確定所述N個 字詞單元不可以組合為新的字詞組。
11. 根據(jù)權利要求7所述的獲取新的字詞組的裝置,其特征在于,當所述語義相關度包 括上下文關聯(lián)度和人名關聯(lián)度,相應地,所述預設的語義相關度閾值包括預設的上下文關 聯(lián)度閾值和預設的人名關聯(lián)度閾值時,所述處理模塊具體包括第四計算單元,用于在所述獲取模塊獲取到N個字詞單元后,計算所述N個字詞單元之 間的人名關聯(lián)度;第四判斷單元,用于在所述第四計算單元計算出所述N個字詞單元之間的人名關聯(lián)度 后,判斷計算出的所述N個字詞單元之間的人名關聯(lián)度是否大于預設的人名關聯(lián)度閾值;第四確定單元,用于當所述第四判斷單元的判斷結果是大于時,確定所述N個字詞單 元可以組合為新的字詞組,然后通知所述更新模塊執(zhí)行將所述新的字詞組加入指定詞庫的 步驟;第五計算單元,用于當所述第四判斷單元的判斷結果是小于等于時,計算所述N個字 詞單元之間的上下文關聯(lián)度;;第五判斷單元,用于在所述第五計算單元計算出所述N個字詞單元之間的上下文關聯(lián) 度后,判斷計算出的所述N個字詞單元之間的上下文關聯(lián)度是否大于預設的上下文關聯(lián)度 閾值;第五確定單元,用于當所述第五判斷單元的判斷結果是大于時,確定所述N個字詞單 元可以組合為新的字詞組;當所述第五判斷單元的判斷結果是小于等于時,確定所述N個字詞單元不可以組合為新的字詞組。
12.根據(jù)權利要求7-11中任一權利要求所述的獲取新的字詞組的裝置,其特征在于, 所述裝置還包括判斷模塊,用于在所述獲取模塊獲取到N個字詞單元后,判斷現(xiàn)有詞庫和所述指定詞庫中是否存在所述N個字詞單元;通知模塊,用于當所述判斷模塊的判斷結果是所述現(xiàn)有詞庫和所述指定詞庫中均不存在所述N個字詞單元時,通知所述處理模塊執(zhí)行計算所述N個字詞單元之間的語義相關度 的步驟。
全文摘要
本發(fā)明公開了一種獲取新的字詞組的方法和裝置,屬于輸入法技術領域。方法包括獲取用戶連續(xù)N次輸入的N個字詞單元,N為大于等于2的自然數(shù);計算N個字詞單元之間的語義相關度,根據(jù)計算出的N個字詞單元之間的語義相關度和預設的語義相關度閾值,確定N個字詞單元是否可以組合為新的字詞組;當確定N個字詞單元可以組合為新的字詞組時,將新的字詞組加入指定詞庫中。裝置包括獲取模塊、處理模塊和更新模塊。本發(fā)明根據(jù)實時計算得到的用戶連續(xù)輸入的N個字詞單元之間的語義相關度,組合出新的字詞組,并將新的字詞組加入指定詞庫中,使得用戶需要再次輸入該N個字詞單元時,指定詞庫可以以字詞組的形式提供該N個字詞單元的候選項,減少了用戶的擊鍵次數(shù),大大提高了用戶輸入字詞時的輸入速度。
文檔編號G06F3/023GK101719020SQ20091024145
公開日2010年6月2日 申請日期2009年12月2日 優(yōu)先權日2009年12月2日
發(fā)明者張靖 申請人:騰訊科技(深圳)有限公司