方言輸入法的制作方法

文檔序號：6483434閱讀：270來源：國知局

專利名稱：方言輸入法的制作方法
方言輸入法技術領域
本發(fā)明屬于計算機漢字輸入法領域，特別涉及帶有形碼輔助碼的拼音輸入法。技術背景
目前拼音輸入法占有90%以上的計算機漢字輸入法市場，這些拼音輸入法均是以《漢語拼音方案》對漢字編碼將漢字輸入計算機設備。然而以普通話做為母語的人群只有幾千萬，不足漢語總人口的10%。即使在最接近普通話的官話方言區(qū)內，用戶的發(fā) 音也總是帶有方音口語，從而形成了一種方言普通話現象。
針對普通話拼音輸入法無法滿足用戶使用方音口語輸入漢字的需要，出現了一些方言輸入法。然而在方言與方言之間并沒有清晰的界限，而且在方言內部還可以分化出次級方言。具體到每一個特定用戶的方音口語更是千差萬別。所以這些方言輸入法無法做到通用性，只能局限于區(qū)域土語。發(fā)明內容
針對拼音輸入法無法滿足每一個特定用戶使用方音口語輸入漢字的需要的技術問題，本發(fā)明的目的在于提供一種可以學習用戶方音口語的漢字輸入法。
本發(fā)明的目的是通過以下技術方案實現的
(a)本發(fā)明包括以下裝置
用于存儲漢字的“聲母碼元”、“韻母碼元”、“拼音字頻”、“形碼編碼”、 “已輸入編碼”和“已輸入編碼頻度”的“漢字數據庫”；
用于存儲“聲母碼元”、“韻母碼元”的“碼元編碼”和“碼元編碼頻度”的 “碼元數據庫”；
用于存儲編碼為拼音編碼的候選字的“拼音候選字列表”；
用于存儲編碼為拼音編碼和形碼編碼的候選字的“形碼候選字列表”；
當用戶輸入編碼后，用于切分輸入編碼，將編碼為拼音編碼的候選字存儲到 “拼音候選字列表”中，將編碼為拼音編碼和形碼編碼的候選字存儲到“形碼候選字列表”中的“輸入編碼分析器”；
用于根據“碼元編碼頻度”為候選字排序的“拼音序值分析器”；
當用戶選擇候選字后，用于將輸入編碼中的聲母編碼、韻母編碼做為“聲母碼元”、“韻母碼元”的“碼元編碼”存儲到“碼元數據庫”中，將輸入編碼做為“已輸入編碼”存儲到“漢字數據庫”該漢字的“已輸入編碼”中的“輸入編碼處理器”；
(b) “輸入編碼分析器”將編碼為拼音編碼的候選字存儲到“拼音候選字列表” 中，其特征在于包含以下步驟
在“漢字數據庫”中查找，“已輸入編碼”等于輸入編碼的漢字；將該“已輸入編碼”的“已輸入編碼頻度”設置為該候選字的“序度”；將所有符合條件的漢字，按“序度”由大到小的順序排序，添加到“拼音候選字列表”中；
在其余未添加到“拼音候選字列表”的漢字中查找，“已輸入編碼”中的拼音編碼等于輸入編碼中的拼音編碼的漢字；將相應“已輸入編碼”的“已輸入編碼頻度” 總和的值設置為該候選字的“序度”；將所有符合條件的漢字，按“序度”由大到小的順序排序，添加到“拼音候選字列表”中；
在其余未添加到“拼音候選字列表”的漢字中查找，漢字發(fā)音的“聲母碼元” 在“碼元數據庫”中的“碼元編碼”等于輸入編碼中的聲母編碼并且該發(fā)音的“韻母碼元”在“碼元數據庫”中的“碼元編碼”等于輸入編碼中的韻母編碼，并且沒有“已輸入編碼”的漢字；將所有符合條件的漢字，使用“拼音序值分析器”排序，添加到“拼音候選字列表”中；
在其余未添加到“拼音候選字列表”的漢字中查找，漢字發(fā)音的“聲母碼元” 在“碼元數據庫”中的“碼元編碼”等于輸入編碼中的聲母編碼并且該發(fā)音的“韻母碼元”在“碼元數據庫”中的“碼元編碼”等于輸入編碼中的韻母編碼的漢字；將所有符合條件的漢字，使用“拼音序值分析器”排序，添加到“拼音候選字列表”中；
(c) “輸入編碼分析器”將編碼為拼音編碼和形碼編碼的候選字存儲到“形碼候選字列表”中，其特征在于包含以下步驟
在“漢字數據庫”中查找，“已輸入編碼”等于輸入編碼的漢字；將該“已輸入編碼”的“已輸入編碼頻度”設置為該候選字的“序度”；將所有符合條件的漢字，按“序度”由大到小的順序排序，添加到“形碼候選字列表”中；
在其余未添加到“形碼候選字列表”的漢字中查找，“已輸入編碼”中的拼音編碼等于輸入編碼中的拼音編碼，并且“形碼編碼”等于輸入編碼中的形碼編碼的漢字；將相應“已輸入編碼”的“已輸入編碼頻度”總和的值設置為該候選字的“序度”；將所有符合條件的漢字，按“序度”由大到小的順序排序，添加到“形碼候選字列表”中；
在其余未添加到“形碼候選字列表”的漢字中查找，“已輸入編碼”中的拼音編碼等于輸入編碼中的拼音編碼，并且“形碼編碼”的前幾個代碼等于輸入編碼中的形碼編碼的漢字；將相應“已輸入編碼”的“已輸入編碼頻度”總和的值設置為該候選字的“序度”；將所有符合條件的漢字，按“序度”由大到小的順序排序，添加到“形碼候選字列表”中；
在其余未添加到“形碼候選字列表”的漢字中查找，漢字發(fā)音的“聲母碼元” 在“碼元數據庫”中的“碼元編碼”等于輸入編碼中的聲母編碼并且該發(fā)音的“韻母碼元”在“碼元數據庫”中的“碼元編碼”等于輸入編碼中的韻母編碼，并且“形碼編碼”等于輸入編碼中的形碼編碼的漢字；將所有符合條件的漢字，使用“拼音序值分析器”排序，添加到“形碼候選字列表”中；
在其余未添加到“形碼候選字列表”的漢字中查找，漢字發(fā)音的“聲母碼元” 在“碼元數據庫”中的“碼元編碼”等于輸入編碼中的聲母編碼并且該發(fā)音的“韻母碼元”在“碼元數據庫”中的“碼元編碼”等于輸入編碼中的韻母編碼，并且“形碼編碼”的前幾個代碼等于輸入編碼中的形碼編碼的漢字；將所有符合條件的漢字，使用“拼音序值分析器”排序，添加到“形碼候選字列表”中；
在其余未添加到“形碼候選字列表”的漢字中查找，漢字發(fā)音的“聲母碼元”在“碼元數據庫”中的“碼元編碼”等于輸入編碼中的聲母編碼或者該發(fā)音的“韻母碼元”在“碼元數據庫”中的“碼元編碼”等于輸入編碼中的韻母編碼，并且“形碼編碼”等于輸入編碼中的形碼編碼的漢字；將所有符合條件的漢字，使用“拼音序值分析器”排序，添加到“形碼候選字列表”中；
在其余未添加到“形碼候選字列表”的漢字中查找，“形碼編碼”等于輸入編碼中的形碼編碼的漢字；將該漢字的“拼音字頻”總和的值設置為該候選字的“序度”；將所有符合條件的漢字，按“序度”由大到小的順序排序，添加到“形碼候選字列表”中；
(d) “拼音序值分析器”根據“碼元編碼頻度”為候選字排序，其特征在于包含以下步驟
當漢字發(fā)音的“聲母碼元”在“碼元數據庫”中的“碼元編碼”等于輸入編碼中的聲母編碼時，將該“碼元編碼”的“碼元編碼頻度”除以該“聲母碼元”的所有 “碼元編碼頻度”總和的商設置為“聲母系數”；
如果漢字發(fā)音的“聲母碼元”在“碼元數據庫”中的“碼元編碼”均不等于輸入編碼中的聲母編碼，那么將該漢字該拼音的“聲母系數”設置為一個小于“漢字數據庫”中，最大的“拼音字頻”除以不為零的最小的“拼音字頻”的商的倒數的正小數；
當該漢字該發(fā)音的“韻母碼元”在“碼元數據庫”中的“碼元編碼”等于輸入編碼中的韻母編碼時，將該“碼元編碼”的“碼元編碼頻度”除以該“韻母碼元”的所有“碼元編碼頻度”總和的商設置為“韻母系數”；
如果漢字發(fā)音的“韻母碼元”在“碼元數據庫”中的“碼元編碼”均不等于輸入編碼中的韻母編碼，那么將該漢字該拼音的“韻母系數”設置為一個小于“漢字數據庫”中，最大的“拼音字頻”除以不為零的最小的“拼音字頻”的商的倒數的正小數；
將該漢字該發(fā)音的“聲母系數”乘以該發(fā)音的“韻母系數”再乘以該發(fā)音的 “拼音字頻”設置為該發(fā)音的“拼音序值”；將該漢字所有發(fā)音的“拼音序值”的最大值設置為該漢字的“序度”；將所有符合條件的漢字按“序度”由大到小的順序排序；
(e)當用戶選擇候選字后，“輸入編碼處理器”將輸入編碼中的聲母編碼、韻母編碼做為“聲母碼元”、“韻母碼元”的“碼元編碼”存儲到“碼元數據庫”中，其特征在于包含以下步驟
如果用戶選擇的候選字沒有“已輸入編碼”或者“已輸入編碼”中的拼音編碼均不等于該輸入編碼中的拼音編碼，那么“輸入編碼處理器”將該輸入編碼中的聲母編碼做為該“聲母碼元”的“碼元編碼”存儲到“碼元數據庫”中，將該輸入編碼中的韻母編碼做為該“韻母碼元”的“碼元編碼”存儲到“碼元數據庫”中；具體過程為
如果該漢字的“聲母碼元”在“碼元數據庫”中已經存儲了等于該輸入編碼中的聲母編碼的“碼元編碼”，那么將該“碼元編碼”的“碼元編碼頻度”加1 ；如果該漢字的“聲母碼元”在“碼元數據庫”中沒有等于該輸入編碼中的聲母編碼的“碼元編碼”，那么將該輸入編碼中的聲母編碼存儲為該“聲母碼元”的“碼元編碼”，并將該“碼元編碼”的“碼元編碼頻度”設置為1 ；
如果該漢字的“韻母碼元”在“碼元數據庫”中已經存儲了等于該輸入編碼中的韻母編碼的“碼元編碼”，那么將該“碼元編碼”的“碼元編碼頻度”加1 ；如果該9漢字的“韻母碼元”在“碼元數據庫”中沒有等于該輸入編碼中的韻母編碼的“碼元編碼”，那么將該輸入編碼中的韻母編碼存儲為該“韻母碼元”的“碼元編碼”，并將該 “碼元編碼”的“碼元編碼頻度”設置為1 ；
如果“聲母碼元”、“韻母碼元”在“碼元數據庫”中預設的“碼元編碼” 不等于用戶輸入的拼音編碼，那么可以判斷出用戶該漢字的發(fā)音不等于該漢字的典型發(fā)曰；
(f)當用戶選擇候選字后，“輸入編碼處理器”將輸入編碼做為“已輸入編碼” 存儲到“漢字數據庫”該漢字的“已輸入編碼”中，其特征在于包含以下步驟
如果該漢字在“漢字數據庫”中已經存儲了等于該輸入編碼的“已輸入編碼”，那么將該“已輸入編碼”的“已輸入編碼頻度”加1;如果該漢字在“漢字數據庫”中沒有“已輸入編碼”或者“已輸入編碼”均不等于該輸入編碼，那么將該輸入編碼存儲為該漢字的“已輸入編碼”，并將該漢字相應的“拼音字頻”加1的值設置為該“已輸入編碼”的“已輸入編碼頻度”。
(g)將漢字的每一個發(fā)音的聲母音位、韻母音位做為漢字拼音編碼的編碼碼元；將漢字的每一個發(fā)音的“聲母碼元”、“韻母碼元”和該發(fā)音的“拼音字頻”設置為一組，存儲在“漢字數據庫”中；
在“漢字數據庫中”為每一個漢字記錄設置多組“聲母碼元”、“韻母碼元”、“拼音字頻”字段，設置一個“形碼編碼”字段，設置多組“已輸入編碼”、“已輸入編碼頻度”字段，可以如下結構
{
聲母碼元1 ；韻母碼元1 ；拼音字頻1 ；
聲母碼元2 ；韻母碼元2 ；拼音字頻2 ；
.…..
形碼編碼；
已輸入編碼1 ；已輸入編碼頻度1 ；
已輸入編碼2;已輸入編碼頻度2;
……
}
(h)在“碼元數據庫”中，為每一個“聲母碼元”、“韻母碼元”記錄設置多組“碼元編碼”、“碼元編碼頻度”字段，可以如下結構
{
碼元編碼1 ；碼元編碼頻度1 ；碼元編碼2 ；碼元編碼頻度2 ；......
}
在“碼元數據庫”中，為每一個“聲母碼元”、“韻母碼元”預設一個“碼元編碼”。
⑴選取150個常用偏旁部首做為對漢字字形編碼的編碼碼元；將150個編碼碼元，按其漢語拼音首字母分成21組，指定到計算機通用鍵盤的21個字母鍵上，具體為
b 卜、八、匕、勹、7、貝、白、貝；10
c 廠、廿、寸、#、、車、$、蟲、車；
d 、、丨」、刀、大、歹；
e 兒、耳；
f 、匚、P、幾、方；
g 廣、弓、戈、革；
h 一、V、火、；、、、、戶、禾、嚴；
j 門、幾、P、巾、彐、己、孑、見、斤、、臼、見、角、$、金；
k U、口；
1 力、卜、立；
m“、門、…、馬、木、目、皿、米、門、
η 女、牛、4、鳥、廣、鳥；
ρ J、夂；
q 豸、犬、氣；
r: 4、人、日；
s J、 I、十、厶、士、、山、彡、亇、？、尸、巳、纟、水、彳、石、 M、系、身；
t 丄、土、田；
w 口、王、文；
χ 、卜、小、夕、個、心、穴、商；
y 、、i、又、1_、弋、已、曰、月、卒、頁、羊、目、雨、魚、頁、
ζ 、、乙、ι、L、欠、4、子、止、-、自、舟、走、足、疋、Π;
依筆順取漢字字形的第一、第二、最末一個編碼碼元的代碼進行編碼；當漢字的字形由兩個編碼碼元組成時，依筆順依次取其字形的第一、第二個編碼碼元的代碼進行編碼；當漢字的字形由一個編碼碼元組成時，取這個編碼碼元的代碼進行編碼；
單字輸入
輸入漢字的拼音編碼；
先輸入漢字的拼音編碼，再輸入漢字的形碼編碼；
詞組輸入
依次輸入構成詞組的漢字的拼音編碼；
先依次輸入構成詞組的漢字的拼音編碼，再依次輸入漢字的形碼編碼。
(j)輸入法候選字詞窗口，分為拼音候選欄和形碼候選欄；拼音候選欄用于顯示 “拼音候選字列表”中的候選字詞；形碼候選欄用于顯示“形碼候選字列表”中的候選字詞；
1、2、3、4、5五個數字鍵定義為拼音候選字詞選擇鍵，用于選擇拼音候選欄中的候選字詞；7、8、9、0四個數字鍵定義為形碼候選字詞選擇鍵，用于選擇形碼候選欄中的候選字詞。
本發(fā)明分欄顯示候選字詞，有效地解決了輸入編碼切分沖突的問題。
本發(fā)明克服拼音輸入法必須要有拼音編碼的技術偏見，在“漢字數據庫”中沒有預設漢字的拼音編碼，將漢字發(fā)音的“聲母碼元”、“韻母碼元”做為拼音編碼的編碼碼元具有實質性特點。本發(fā)明提供了一種不同構思的解決方案，輸入法通過學習“聲母碼元”、“韻母碼元”的“碼元編碼”，可以動態(tài)生成漢字的拼音編碼。本發(fā)明不是讓用戶按照漢字的典型發(fā)音輸入漢字，而是讓輸入法學習用戶的方音口語，能夠讓用戶使用自己的方音口語輸入不等于典型發(fā)音的漢字，取得了預料不到的技術效果。本發(fā)明解決了拼音輸入法無法輸入方音口語的技術難題，具有顯著的技術進步。

圖1是本發(fā)明拼音編碼和形碼全碼輸入單字的一個實施例；
圖2是本發(fā)明拼音編碼和形碼簡碼輸入單字的一個實施例；
圖3是本發(fā)明拼音編碼輸入單字的一個實施例；
圖4是本發(fā)明拼音編碼輸入詞組的一個實施例。
具體實施方式
本發(fā)明可以使用任意一種音標系統標記漢字的發(fā)音。例如可以使用《漢語拼音方案》標記漢字的發(fā)音；在“音標數據庫”中，為每一個《漢語拼音方案》標記的“聲母碼元”、“韻母碼元”預設一個《漢語拼音方案》編碼的“碼元編碼”。還可以使用國際音標標記漢字的發(fā)音；在“音標數據庫”中，為每一個國際音標標記的“聲母碼元”、“韻母碼元”預設一個方言拼音方案編碼的“碼元編碼”。
下面舉例說明本發(fā)明使用《漢語拼音方案》標記漢字的發(fā)音時，輸入漢字的具體過程。
在“漢字數據庫”中使用《漢語拼音方案》標記漢字的發(fā)音。其中/y/、/w/ 是虛音標，不表示實際發(fā)音。
權利要求
1. 一種計算機漢字輸入法，其特征在于(a)本發(fā)明包括以下裝置用于存儲漢字的“聲母碼元”、“韻母碼元”、“拼音字頻”、“形碼編碼”、“已輸入編碼”和“已輸入編碼頻度”的“漢字數據庫”；用于存儲“聲母碼元”、“韻母碼元”的“碼元編碼”和“碼元編碼頻度”的“碼元數據庫”；用于存儲編碼為拼音編碼的候選字的“拼音候選字列表”；用于存儲編碼為拼音編碼和形碼編碼的候選字的“形碼候選字列表”；當用戶輸入編碼后，用于切分輸入編碼，將編碼為拼音編碼的候選字存儲到“拼音候選字列表”中，將編碼為拼音編碼和形碼編碼的候選字存儲到“形碼候選字列表”中的“輸入編碼分析器”；用于根據“碼元編碼頻度”為候選字排序的“拼音序值分析器”；當用戶選擇候選字后，用于將輸入編碼中的聲母編碼、韻母編碼做為“聲母碼元”、“韻母碼元”的“碼元編碼”存儲到“碼元數據庫”中，將輸入編碼做為“已輸入編碼”存儲到“漢字數據庫”該漢字的“已輸入編碼”中的“輸入編碼處理器”；(b)“輸入編碼分析器”將編碼為拼音編碼的候選字存儲到“拼音候選字列表”中，其特征在于包含以下步驟在“漢字數據庫”中查找，“已輸入編碼”等于輸入編碼的漢字；將該“已輸入編碼”的“已輸入編碼頻度”設置為該候選字的“序度”；將所有符合條件的漢字，按 “序度”由大到小的順序排序，添加到“拼音候選字列表”中；在其余未添加到“拼音候選字列表”的漢字中查找，“已輸入編碼”中的拼音編碼等于輸入編碼中的拼音編碼的漢字；將相應“已輸入編碼”的“已輸入編碼頻度”總和的值設置為該候選字的“序度”；將所有符合條件的漢字，按“序度”由大到小的順序排序，添加到“拼音候選字列表”中；在其余未添加到“拼音候選字列表”的漢字中查找，漢字發(fā)音的“聲母碼元”在 “碼元數據庫”中的“碼元編碼”等于輸入編碼中的聲母編碼并且該發(fā)音的“韻母碼元”在“碼元數據庫”中的“碼元編碼”等于輸入編碼中的韻母編碼，并且沒有“已輸入編碼”的漢字；將所有符合條件的漢字，使用“拼音序值分析器”排序，添加到“拼音候選字列表”中；在其余未添加到“拼音候選字列表”的漢字中查找，漢字發(fā)音的“聲母碼元”在 “碼元數據庫”中的“碼元編碼”等于輸入編碼中的聲母編碼并且該發(fā)音的“韻母碼元”在“碼元數據庫”中的“碼元編碼”等于輸入編碼中的韻母編碼的漢字；將所有符合條件的漢字，使用“拼音序值分析器”排序，添加到“拼音候選字列表”中；(c)“輸入編碼分析器”將編碼為拼音編碼和形碼編碼的候選字存儲到“形碼候選字列表”中，其特征在于包含以下步驟在“漢字數據庫”中查找，“已輸入編碼”等于輸入編碼的漢字；將該“已輸入編碼”的“已輸入編碼頻度”設置為該候選字的“序度”；將所有符合條件的漢字，按 “序度”由大到小的順序排序，添加到“形碼候選字列表”中；在其余未添加到“形碼候選字列表”的漢字中查找，“已輸入編碼”中的拼音編碼等于輸入編碼中的拼音編碼，并且“形碼編碼”等于輸入編碼中的形碼編碼的漢字；將相應“已輸入編碼”的“已輸入編碼頻度”總和的值設置為該候選字的“序度”；將所有符合條件的漢字，按“序度”由大到小的順序排序，添加到“形碼候選字列表”中；在其余未添加到“形碼候選字列表”的漢字中查找，“已輸入編碼”中的拼音編碼等于輸入編碼中的拼音編碼，并且“形碼編碼”的前幾個代碼等于輸入編碼中的形碼編碼的漢字；將相應“已輸入編碼”的“已輸入編碼頻度”總和的值設置為該候選字的 “序度”；將所有符合條件的漢字，按“序度”由大到小的順序排序，添加到“形碼候選字列表”中；在其余未添加到“形碼候選字列表”的漢字中查找，漢字發(fā)音的“聲母碼元”在 “碼元數據庫”中的“碼元編碼”等于輸入編碼中的聲母編碼并且該發(fā)音的“韻母碼元”在“碼元數據庫”中的“碼元編碼”等于輸入編碼中的韻母編碼，并且“形碼編碼”等于輸入編碼中的形碼編碼的漢字；將所有符合條件的漢字，使用“拼音序值分析器”排序，添加到“形碼候選字列表”中；在其余未添加到“形碼候選字列表”的漢字中查找，漢字發(fā)音的“聲母碼元”在 “碼元數據庫”中的“碼元編碼”等于輸入編碼中的聲母編碼并且該發(fā)音的“韻母碼元”在“碼元數據庫”中的“碼元編碼”等于輸入編碼中的韻母編碼，并且“形碼編碼”的前幾個代碼等于輸入編碼中的形碼編碼的漢字；將所有符合條件的漢字，使用 “拼音序值分析器”排序，添加到“形碼候選字列表”中；在其余未添加到“形碼候選字列表”的漢字中查找，漢字發(fā)音的“聲母碼元”在 “碼元數據庫”中的“碼元編碼”等于輸入編碼中的聲母編碼或者該發(fā)音的“韻母碼元”在“碼元數據庫”中的“碼元編碼”等于輸入編碼中的韻母編碼，并且“形碼編碼”等于輸入編碼中的形碼編碼的漢字；將所有符合條件的漢字，使用“拼音序值分析器”排序，添加到“形碼候選字列表”中；在其余未添加到“形碼候選字列表”的漢字中查找，“形碼編碼”等于輸入編碼中的形碼編碼的漢字；將該漢字的“拼音字頻”總和的值設置為該候選字的“序度”；將所有符合條件的漢字，按“序度”由大到小的順序排序，添加到“形碼候選字列表” 中；(d)“拼音序值分析器”根據“碼元編碼頻度”為候選字排序，其特征在于包含以下步驟當漢字發(fā)音的“聲母碼元”在“碼元數據庫”中的“碼元編碼”等于輸入編碼中的聲母編碼時，將該“碼元編碼”的“碼元編碼頻度”除以該“聲母碼元”的所有“碼元編碼頻度”總和的商設置為“聲母系數”；當該漢字該發(fā)音的“韻母碼元”在“碼元數據庫”中的“碼元編碼”等于輸入編碼中的韻母編碼時，將該“碼元編碼”的“碼元編碼頻度”除以該“韻母碼元”的所有 “碼元編碼頻度”總和的商設置為“韻母系數”；將該漢字該發(fā)音的“聲母系數”乘以該發(fā)音的“韻母系數”再乘以該發(fā)音的“拼音字頻”設置為該發(fā)音的“拼音序值”；將該漢字所有發(fā)音的“拼音序值”的最大值設置為該漢字的“序度”；將所有符合條件的漢字按“序度”由大到小的順序排序；(e)當用戶選擇候選字后，“輸入編碼處理器”將輸入編碼中的聲母編碼、韻母編碼做為“聲母碼元”、“韻母碼元”的“碼元編碼”存儲到“碼元數據庫”中，其特征在于包含以下步驟如果用戶選擇的候選字沒有“已輸入編碼”或者“已輸入編碼”中的拼音編碼均不等于該輸入編碼中的拼音編碼，那么“輸入編碼處理器”將該輸入編碼中的聲母編碼做為該“聲母碼元”的“碼元編碼”存儲到“碼元數據庫”中，將該輸入編碼中的韻母編碼做為該“韻母碼元”的“碼元編碼”存儲到“碼元數據庫”中；具體過程為如果該漢字的“聲母碼元”在“碼元數據庫”中已經存儲了等于該輸入編碼中的聲母編碼的“碼元編碼”，那么將該“碼元編碼”的“碼元編碼頻度”加1 ；如果該漢字的“聲母碼元”在“碼元數據庫”中沒有等于該輸入編碼中的聲母編碼的“碼元編碼”，那么將該輸入編碼中的聲母編碼存儲為該“聲母碼元”的“碼元編碼”，并將該 “碼元編碼”的“碼元編碼頻度”設置為1 ；如果該漢字的“韻母碼元”在“碼元數據庫”中已經存儲了等于該輸入編碼中的韻母編碼的“碼元編碼”，那么將該“碼元編碼”的“碼元編碼頻度”加1;如果該漢字的“韻母碼元”在“碼元數據庫”中沒有等于該輸入編碼中的韻母編碼的“碼元編碼”，那么將該輸入編碼中的韻母編碼存儲為該“韻母碼元”的“碼元編碼”，并將該 “碼元編碼”的“碼元編碼頻度”設置為1 ；(f)當用戶選擇候選字后，“輸入編碼處理器”將輸入編碼做為“已輸入編碼”存儲到“漢字數據庫”該漢字的“已輸入編碼”中，其特征在于包含以下步驟如果該漢字在“漢字數據庫”中已經存儲了等于該輸入編碼的“已輸入編碼”，那么將該“已輸入編碼”的“已輸入編碼頻度”加1;如果該漢字在“漢字數據庫”中沒有“已輸入編碼”或者“已輸入編碼”均不等于該輸入編碼，那么將該輸入編碼存儲為該漢字的“已輸入編碼”，并將該漢字相應的“拼音字頻”加1的值設置為該“已輸入編碼”的“已輸入編碼頻度”。
2.根據權利要求1所述的漢字輸入法，其特征在于將漢字的每一個發(fā)音的聲母音位、韻母音位做為漢字拼音編碼的編碼碼元；將漢字的每一個發(fā)音的“聲母碼元”、“韻母碼元”和該發(fā)音的“拼音字頻”設置為一組，存儲在“漢字數據庫”中；在“漢字數據庫中”為每一個漢字記錄設置多組“聲母碼元”、“韻母碼元”、 “拼音字頻”字段，設置一個“形碼編碼”字段，設置多組“已輸入編碼”、“已輸入編碼頻度”字段，可以如下結構 {聲母碼元1 ；韻母碼元1 ；拼音字頻1 ；聲母碼元2 ；韻母碼元2 ；拼音字頻2 ；……形碼編碼；已輸入編碼1;已輸入編碼頻度1; 已輸入編碼2;已輸入編碼頻度2;……}
3.根據權利要求1所述的漢字輸入法，其特征在于在“碼元數據庫”中，為每一個“聲母碼元”、“韻母碼元”記錄設置多組“碼元編碼”、“碼元編碼頻度”字段，可以如下結構 {碼元編碼1 ；碼元編碼頻度1 ；碼元編碼2 ；碼元編碼頻度2 ；…… }在“碼元數據庫”中，為每一個“聲母碼元”、“韻母碼元”預設一個“碼元編碼”。
4.根據權利要求1所述的漢字輸入法，其特征在于選取150個常用偏旁部首做為對漢字字形編碼的編碼碼元；將150個編碼碼元，按其漢語拼音首字母分成21組，指定到計算機通用鍵盤的21個字母鍵上，具體為 b卜、八、匕、勹、7、貝、白、貝； c:廠、*、寸、4、、車、車、蟲、車； d:、、ij、刀、大、歹； e 兒、耳；f、匚、P、幾、方；g 廣、弓、戈、革；h 一、ν、火、川、、戶、禾、嚴；j 門、幾、P、巾、彐、己、孑、見、斤、、臼、見、角、I、金； k U、口； 1 力、卜、立；m“、門、…、馬、木、目、皿、米、門、^■、馬； η:女、牛、4、鳥、廣、鳥； P J、夂； q:各、犬、氣； r “、人、日；s J、 1、十、厶、士、、山、彡、亇、？、尸、巳、鄉(xiāng)、水、彳、石、m、糸、身；t 丄、土、田；w 口、王、文； X M'、小、夕、個、心、穴、商；y 、、i、又、1_、弋、已、曰、月、卒、頁、羊、目、雨、魚、頁、魚； Z 、、乙、1、L、欠、4、子、止、W、自、舟、走、足、At、n;依筆順取漢字字形的第一、第二、最末一個編碼碼元的代碼進行編碼；當漢字的字形由兩個編碼碼元組成時，依筆順依次取其字形的第一、第二個編碼碼元的代碼進行編碼；當漢字的字形由一個編碼碼元組成時，取這個編碼碼元的代碼進行編碼；單字輸入輸入漢字的拼音編碼；先輸入漢字的拼音編碼，再輸入漢字的形碼編碼；詞組輸入依次輸入構成詞組的漢字的拼音編碼；先依次輸入構成詞組的漢字的拼音編碼，再依次輸入漢字的形碼編碼。
5.根據權利要求1所述的漢字輸入法，其特征在于輸入法候選字詞窗口，分為拼音候選欄和形碼候選欄；拼音候選欄用于顯示“拼音候選字列表”中的候選字詞；形碼候選欄用于顯示“形碼候選字列表”中的候選字詞； 1、2、3、4、5五個數字鍵定義為拼音候選字詞選擇鍵，用于選擇拼音候選欄中的候選字詞；7、8、9、0四個數字鍵定義為形碼候選字詞選擇鍵，用于選擇形碼候選欄中的候選字詞。
全文摘要
本發(fā)明屬于計算機漢字輸入法領域，特別涉及帶有形碼輔助碼的拼音輸入法。當用戶輸入編碼后，“輸入編碼分析器”將編碼為拼音編碼的候選字存儲到“拼音候選字列表”中，將編碼為拼音編碼和形碼編碼的候選字存儲到“形碼候選字列表”中；“拼音序值分析器”根據“碼元編碼頻度”為候選字排序；當用戶選擇候選字后，“輸入編碼處理器”將輸入編碼中的聲母編碼、韻母編碼做為“聲母碼元”、“韻母碼元”的“碼元編碼”存儲到“碼元數據庫”中，將輸入編碼做為“已輸入編碼”存儲到“漢字數據庫”該漢字的“已輸入編碼”中。發(fā)明解決了拼音輸入法無法輸入方音口語的技術難題，具有顯著的技術進步。
文檔編號G06F3/023GK102023711SQ20091007055
公開日2011年4月20日申請日期2009年9月23日優(yōu)先權日2009年9月23日
發(fā)明者王雅弟申請人:王雅弟

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯系技術所有人。
技術研發(fā)人員：王雅弟
技術所有人：王雅弟
我是此專利的發(fā)明人

上一篇：模糊編碼輸入法的制作方法
上一篇：基于極線幾何以及ess的圖像定位方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網絡及物聯網
4、王老師：1.計算機網絡安全 2.計算機仿真技術
5、王老師：1.網絡安全；物聯網安全、大數據安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯系我們加入專家?guī)臁?/a>

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

方言輸入法的制作方法