專利名稱:一種數(shù)字鍵盤上的韓國(guó)語(yǔ)輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及的是韓國(guó)語(yǔ)輸入法領(lǐng)域,特別是涉及一種在數(shù)字簡(jiǎn)化鍵盤上的韓國(guó)語(yǔ)簡(jiǎn)拼輸 入法,和一種在數(shù)字簡(jiǎn)化鍵盤上韓國(guó)語(yǔ)詞語(yǔ)或連句輸入時(shí)的音節(jié)切分方法。
技術(shù)背景韓文在1443年世宗大王在位期間發(fā)明,主要使用于韓國(guó)、朝鮮以及中華人民共和國(guó)境內(nèi) 的朝鮮族,屬于阿爾泰語(yǔ)系韓日-琉球語(yǔ)族,屬于粘著語(yǔ)。韓國(guó)語(yǔ)語(yǔ)音系統(tǒng)由元音, 輔音和收音組成。現(xiàn)在使用的字母有21個(gè)元音和19個(gè)輔音,輔音是仿照人的發(fā)音器官的模樣創(chuàng)造的,其 中14個(gè)簡(jiǎn)單輔音字母~i, i~,匚,s, td,人,o' x,夭'=1, e, n,古,5個(gè)雙重子音,,[[,出,從,w。元音則是——天( )、地(一)、人(I )為基本創(chuàng) 造而來(lái)的。韓文是拼音文字,由基本母音、基本子音、雙母音、雙子音和收音所組成,為拼音字。 字的組合方式共有5種一 一個(gè)子音,加一個(gè)母音,如仝(牛)。二 一個(gè)子音,加一個(gè)母音,加一個(gè)收音,如t (眼睛)。三 一個(gè)子音,加兩個(gè)母音,如?l (耳朵)。四 一個(gè)子音,加兩個(gè)母音,加一個(gè)收音,如哥(一下子)。五 一個(gè)子音,加一個(gè)母音,加兩個(gè)收音,如& (價(jià)錢)。目前在數(shù)字簡(jiǎn)化鍵盤上的韓國(guó)語(yǔ)輸入法, 一般輸入全部的拼音符號(hào),每個(gè)文字需要按鍵 多次,導(dǎo)致輸入速度過(guò)慢,或者在詞語(yǔ)輸入中由于中間連接的輔音個(gè)數(shù)不確定而無(wú)法準(zhǔn)確切 分音節(jié),不能很好的實(shí)現(xiàn)詞語(yǔ)輸入或者連句輸入。發(fā)明內(nèi)容本發(fā)明的目的是提出一種減少按鍵次數(shù)實(shí)現(xiàn)快速輸入的韓國(guó)語(yǔ)輸入法,和一種能實(shí)現(xiàn)準(zhǔn) 確切分音節(jié)和詞語(yǔ)的輸入法,實(shí)現(xiàn)更快、更準(zhǔn)確的輸入。一種韓國(guó)語(yǔ)簡(jiǎn)拼輸入法,根據(jù)韓國(guó)文字的主要組合方式為韓國(guó)語(yǔ)的輸入設(shè)置兩個(gè)基本的模型"子音——元音——收音"、"子音——元音"。鍵盤設(shè)置需要把元音和輔音分開,不 相混合。三個(gè)元音組合符號(hào)"一"、"I " 、 " "各單獨(dú)一鍵,其它14個(gè)輔音""i、l、 [、 s、 □、 a、人、o、兀、天、=)、e、 n、古"每?jī)蓚€(gè)一鍵分布在數(shù)字鍵盤上的其它7鍵,是實(shí)現(xiàn)本輸入法的理想鍵位設(shè)置(圖1)。輸入外碼時(shí),文字模型的每部分無(wú)需 完整輸入,處理器首先對(duì)每部分的外碼分別搜索識(shí)別,找出每部分外碼對(duì)應(yīng)的可能的音節(jié)符 號(hào)存入緩存,處理器再對(duì)緩存中的數(shù)據(jù)進(jìn)行處理,以各部分為并列要求,生成文字列表顯示 在顯示器(圖2)。文字列表以最接近外碼輸入確定優(yōu)選項(xiàng),接近程度相同則按文字的使用頻 率和語(yǔ)法、語(yǔ)義排定序列。一種韓國(guó)語(yǔ)詞語(yǔ)或連句輸入的切分方法,由于韓國(guó)語(yǔ)文字音節(jié)結(jié)構(gòu)復(fù)雜,在輸入時(shí)音節(jié) 切分困難。本發(fā)明方法簡(jiǎn)化音節(jié)的輸入結(jié)構(gòu)為"子音——元音——收音"、"子音——元音" 兩種,在"子音——元音——收音"——"子音——元音——收音"模型中有連續(xù)兩個(gè)輔音 按鍵,處理器默認(rèn)連續(xù)的兩個(gè)輔音中的前一個(gè)為前一個(gè)字的收音,后一個(gè)輔音為后一個(gè)字的 子音。在"子音——元音"——"子音——元音——收音"模型中輸入是"輔音——元音一 _輔音——元音——輔音"的外碼串,沒有出現(xiàn)連續(xù)兩個(gè)輔音的外碼,處理器默認(rèn)一個(gè)音節(jié) 后一個(gè)輔音為后一個(gè)字的子音。這樣處理器可以準(zhǔn)確切分外碼輸入的音節(jié),并且簡(jiǎn)化輸入, 提高輸入的速度(圖3)。在準(zhǔn)確的切分了音節(jié)后,處理器根據(jù)語(yǔ)法、語(yǔ)義對(duì)詞語(yǔ)的切分將更加準(zhǔn)確、符合目標(biāo)輸 入。通過(guò)對(duì)詞語(yǔ)的準(zhǔn)確切分及詞語(yǔ)選擇的上下文預(yù)測(cè)可以實(shí)現(xiàn)連句或整句輸入。 本發(fā)明提出的韓國(guó)語(yǔ)簡(jiǎn)拼輸入法及詞語(yǔ)或句子輸入時(shí)的切分方法的有點(diǎn)在于1、 減少需要按鍵的數(shù)量,無(wú)需對(duì)音節(jié)完整輸入,音節(jié)可以根據(jù)已有的輸入分部分獨(dú)立檢索。2、 音節(jié)輸入結(jié)構(gòu)清晰,可以實(shí)現(xiàn)準(zhǔn)確切分,以更好的實(shí)現(xiàn)詞語(yǔ)或連句輸入。
圖1為適用本發(fā)明的一種數(shù)字鍵盤設(shè)置。圖2為一種韓國(guó)語(yǔ)簡(jiǎn)拼輸入法流程圖。圖3為一種韓國(guó)語(yǔ)詞語(yǔ)或連句輸入的切分方法流程圖。
具體實(shí)施方式
首先確定一種符合本發(fā)明的鍵盤設(shè)置,元音和輔音必須分開設(shè)置。該鍵盤設(shè)置非常符合 本發(fā)明方法的要求,盡量的減少了重碼的出現(xiàn),也無(wú)需太多次數(shù)的按鍵。在圖1這種鍵盤上,根據(jù)音節(jié)結(jié)構(gòu)按照"子音——元音——收音"或者"子音——元音" 模型輸入,模型每部分無(wú)需完整輸入,且輔音部分只能輸入一個(gè)。對(duì)輸入的外碼處理器首先 對(duì)每部分分開檢索,然后以各部分為并列條件在文字?jǐn)?shù)據(jù)庫(kù)中檢索符合條件的文字,按照相 符程度及使用頻率排列候選字表,選擇目標(biāo)文字確定上屏,就可以完成輸入。下面以輸入"效"為例,按照"子音——元音——收音"的模型首先按"4"鍵輸入子 音,接著按"2、 1、 1"鍵輸入元音'HI ",該字有兩個(gè)收音,只需按"8"鍵輸入第 一個(gè)"人"即可。由于數(shù)字鍵盤上鍵位設(shè)置的多義性,因而在輸入外碼后有多個(gè)候選字顯示。 候選字以與外碼相符程度排列,相符程度同等,則按照字頻、語(yǔ)義或語(yǔ)法排列。 外碼"42118"的候選列表為"1 3 2改3望4 e!! 5裂",按數(shù)字鍵或方向鍵選擇目標(biāo)字, 完成輸入。由于音節(jié)結(jié)構(gòu)確定,有明顯的切分標(biāo)志,在進(jìn)行詞語(yǔ)輸入時(shí)處理器可以準(zhǔn)確的切分。下 面以輸入"望e!吾"為例,按照確定的結(jié)構(gòu)模型,每部分輔音只輸入一個(gè),元音可以部分輸入,也可以完整輸入。按照這種方法,我們輸入外碼"02150125430",處理器首先切分音節(jié) "0215 — 0125—430",然后對(duì)比數(shù)據(jù)庫(kù)是否存在符合外碼輸入的詞語(yǔ),詞語(yǔ)優(yōu)先顯示,詞語(yǔ) 之間按照符合程度和使用頻率排列,沒有相應(yīng)的詞語(yǔ)則顯示第一個(gè)音節(jié)的字。 外碼"02150125430"的候選列表為"1望&l吾221 3S! 4望5望"。
權(quán)利要求
1、 一種基于數(shù)字鍵盤上的簡(jiǎn)拼韓國(guó)語(yǔ)輸入法,其步驟是(1) 在元音后面有收音的音節(jié)按照"子音——元音——收音"的結(jié)構(gòu)輸入音節(jié)外碼;在 元音后面沒有收音的音節(jié)按照"子音——元音"的結(jié)構(gòu)輸入音節(jié)外碼;(2) 雙子音和雙收音都只輸入其中第一個(gè)輔音外碼,元音輸入按照元音書寫順序全部或 部分輸入;(3) 處理器接受輸入的外碼,在數(shù)據(jù)庫(kù)中搜索外碼對(duì)應(yīng)的詞語(yǔ)或詞素;(4) 在顯示器上顯示候選文字,確認(rèn)或翻頁(yè)尋找并確認(rèn)文字。
2、 如權(quán)利要求l所述的方法,其特征在于韓語(yǔ)中的21個(gè)元音由分別單獨(dú)設(shè)置在不同 鍵位的"一"、"I "、 " "三個(gè)符號(hào)組合而成,不與輔音混合,14個(gè)基本輔音分列在數(shù)字 鍵盤的其它7個(gè)數(shù)字鍵。
3、 如權(quán)利要求l所述的方法,其特征在于以"子音——元音——收音"、"子音—— 元音"的模型輸入,處理器在結(jié)構(gòu)模型下實(shí)現(xiàn)模型每個(gè)部分的單獨(dú)檢索,特別是各部分按照 書寫順序部分不完整輸入的情況下,處理器搜索每部分所有與輸入外碼相符的音符并組合成 字列表顯示。
4、 如權(quán)利要求3所述的方法,其特征在于候選列表顯示以與輸入外碼最接近的優(yōu)先, 相符程度相同則以文字使用頻率或上下文預(yù)測(cè)來(lái)確定候選字列表。
5、 如權(quán)利要求4所述的方法,其特征在于其中的文字使用頻率是可以根據(jù)用戶平時(shí)使 用進(jìn)行調(diào)整的。
6、 如權(quán)利要求4所述的方法,其特征在于候選列表的排列依據(jù)上下文預(yù)測(cè)包括語(yǔ)法、 語(yǔ)義、詞語(yǔ)固定搭配以及語(yǔ)句模型。
7、 一種韓國(guó)語(yǔ)詞語(yǔ)或連句輸入過(guò)程中的音節(jié)切分方法,其特征是按照"子音——元音 ——收音"或"子音——元音"的結(jié)構(gòu)輸入韓國(guó)語(yǔ)文字,雙子音和雙收音都只輸入其中第一 個(gè)輔音外碼,元音輸入按照元音書寫順序全部或部分輸入,明確的結(jié)構(gòu)模型可以讓處理器準(zhǔn) 確識(shí)別并切分詞語(yǔ)或句子輸入中單個(gè)文字。
8、 如權(quán)利要求7所述的方法,其特征在于元音和輔音鍵位設(shè)置分列,不互相混合。
9、 如權(quán)利要求7所述的方法,其特征在于在詞語(yǔ)或句子輸入中,處理器對(duì)音節(jié)作出準(zhǔn) 確切分后,根據(jù)語(yǔ)法、語(yǔ)義及語(yǔ)句模型對(duì)上下文作出預(yù)測(cè)。
10、 如權(quán)利要求7所述的方法,其特征在于在"子音——元音——收音"——"子音 ——元音——收音"模型中有連續(xù)兩個(gè)輔音按鍵,處理器默認(rèn)連續(xù)的兩個(gè)輔音中的前一個(gè)為前一個(gè)字的收音,后一個(gè)輔音為后一個(gè)字的子音;在"子音——元音"——"子音一一元音——收音"模型中輸入是輔音——元音——輔音——元音——輔音的外碼串,沒有出現(xiàn)連續(xù) 兩個(gè)輔音的外碼,處理器默認(rèn)一個(gè)音節(jié)后一個(gè)輔音為后一個(gè)字的子音。
11、 如權(quán)利要求7所述的方法,其特征在于在句子輸入中,對(duì)外碼串中的詞語(yǔ)根據(jù)語(yǔ) 法、語(yǔ)義進(jìn)行切分。
12、 如權(quán)利要求ll所述的方法,其特征在于在輸入設(shè)備的數(shù)據(jù)庫(kù)中存儲(chǔ)有固定搭配的 詞語(yǔ)及與外碼對(duì)應(yīng)的關(guān)系。
13、 如權(quán)利要求12所述的方法,其特征在于數(shù)據(jù)庫(kù)中詞語(yǔ)按照使用頻率及最近的使用 來(lái)排定詞語(yǔ)的優(yōu)先級(jí)。
14、 如權(quán)利要求7所述的方法,其特征在于在數(shù)據(jù)庫(kù)中沒有相應(yīng)的詞語(yǔ),在第一次輸 入后,數(shù)據(jù)庫(kù)保留這次輸入記錄并存儲(chǔ)在數(shù)據(jù)庫(kù)中作為新增詞語(yǔ)。
全文摘要
本發(fā)明涉及的是韓國(guó)語(yǔ)輸入法領(lǐng)域,特別是涉及一種在數(shù)字簡(jiǎn)化鍵盤上的韓國(guó)語(yǔ)簡(jiǎn)拼輸入法,和一種在數(shù)字簡(jiǎn)化鍵盤上韓國(guó)語(yǔ)詞語(yǔ)或連句輸入時(shí)的音節(jié)切分方法。目的是提出一種減少按鍵次數(shù)實(shí)現(xiàn)快速輸入的韓國(guó)語(yǔ)輸入法,和一種能實(shí)現(xiàn)準(zhǔn)確切分音節(jié)和詞語(yǔ)的輸入法,實(shí)現(xiàn)更快、更準(zhǔn)確的輸入。
文檔編號(hào)G06F3/023GK101145085SQ20071016271
公開日2008年3月19日 申請(qǐng)日期2007年9月28日 優(yōu)先權(quán)日2007年9月28日
發(fā)明者譚春桃, 陳炳輝, 黃新春 申請(qǐng)人:廣東國(guó)筆科技有限公司