專利名稱:一種調(diào)整字頻的方法
技術(shù)領(lǐng)域:
本發(fā)明有關(guān)調(diào)整字頻的方法,特別是有關(guān)一種文字輸入法中動態(tài)調(diào)整字詞使用頻率的方法。
基于目前知識蓬勃的發(fā)展,隨著信息計算機(jī)市場不斷的擴(kuò)充,以及互聯(lián)網(wǎng)的無限市場,因此改變了對于信息取得的方式,互聯(lián)網(wǎng)也逐漸變成信息取得來源之一。計算機(jī)科技儼然變成人們生活中不可缺少的工具,不論是數(shù)據(jù)的處理、數(shù)據(jù)保管、信息的取得以及多媒體的制作均離不開計算機(jī)的使用。此外,計算機(jī)也被用來將數(shù)據(jù)制作成電子文件以利于建立數(shù)據(jù)庫,方便于管理、運用、數(shù)據(jù)處理或從事商業(yè)上的利用。通過互聯(lián)網(wǎng)在伺服器或計算機(jī)中讀取數(shù)據(jù),其易于保管且不占空間。也可以提供商業(yè)服務(wù)協(xié)助客戶將其數(shù)據(jù)轉(zhuǎn)換為電子文件以利于客戶的利用與運用。因此在網(wǎng)絡(luò)市場蓬勃發(fā)展之際,電子商務(wù)如火如荼的展開,也需要有效率的輸入方法。
基于上述的考慮,任何數(shù)據(jù)的輸入均必須通過輸入裝置以匹配的輸入方法將文字輸入,以有利計算機(jī)處理器的讀取、處理或交換信息。而以華人市場而言所使用的文字均屬于漢字系統(tǒng),一般漢字可以分為繁體與簡體字形,而輸入的方法也有數(shù)種,如拼音輸入法(如羅馬拼音)、拆字輸入法(如倉頡輸入法)、注音輸入以及其它輸入法數(shù)種。不論是使用何種輸入方法,均需配合其相關(guān)的軟件,且一般均會建立詞庫或字庫以利于快速搜尋出使用者所需要的字詞。
在現(xiàn)有的漢字輸入法中,除了內(nèi)建的字詞會先行供給使用者選用之外,也會依據(jù)使用者使用的字詞狀況調(diào)整字詞的優(yōu)先順序。調(diào)整字詞頻率的方式多采用將每次使用者最近輸入的字詞調(diào)整到最優(yōu)先次序的方式調(diào)整字詞頻率,其缺點是無法科學(xué)地記錄使用者輸入過程中真正使用的字詞頻率,其“最近使用,調(diào)整到最優(yōu)先次序”的處理方式常將使用者使用次數(shù)極少的字詞調(diào)整到最優(yōu)先的次序。如此的執(zhí)行方式不僅無法使使用者便利,反而有時會增加使用者的困擾。
目前也有使用記錄每個字詞使用的次數(shù)用以調(diào)整字詞選用的優(yōu)先順序的方法,但這種方法需要提供每個字詞較大的儲存空間,以利于解決使用者字詞頻率不斷加大的問題。目前每個字詞均超過八位(bit)以上,在特定量字庫的情形下,增加了許多的儲存空間。而且這種機(jī)械地記錄字詞所使用的頻率,使得某些字詞在某一階段多次使用之后頻率值變的非常的高。在后續(xù)狀態(tài)下,或許另一相同讀音的字詞雖然最近使用的頻率更高,但是因為上次相同讀音的字詞頻率過高,也無法將其取代成為最近使用最高頻率的字詞,也就是系統(tǒng)無法將其被選用的優(yōu)先順序動態(tài)地調(diào)整。假使最近均使用后面相同讀音的字詞,卻一直出現(xiàn)不是所要選用的字詞,也增加了使用者的困擾。而上述記錄字詞使用次數(shù)的方式不可避免地會達(dá)到所能記錄的最大值,因無法繼續(xù)增加字詞的頻率值而將字詞的使用頻率記錄清除,造成字詞頻率記錄的喪失,使得使用者在使用者會出現(xiàn)頻率較不高的字詞供使用者選用,且最常使用的字詞又需重新累積記錄時,往往無法超越已經(jīng)有累積記錄的其它字詞。
在目前電子信息蓬勃發(fā)展、網(wǎng)絡(luò)科技日新月異激烈競爭的時代,急需一種新的調(diào)整字詞使用頻率的方法以增加使用者的親和力以及提高輸入效率。
本發(fā)明的目的是提供一種文字輸入法中動態(tài)調(diào)整字詞使用頻率的方法。
本發(fā)明的再一目的是提供一種包含設(shè)定一字詞頻率區(qū)間的調(diào)整字頻的方法。
本發(fā)明的再一目的是提供一種包含在選用字詞的使用頻率已達(dá)可記錄頻率的最大值時調(diào)整相同讀音的所有字詞頻率的調(diào)整字頻的方法。
一種調(diào)整字頻的方法,該方法包含初始化各字詞的初始使用頻率,之后判斷與輸入字詞相同讀音的字詞個別的頻率,下一步驟再判斷使用者所選用的字詞的頻率值是否大于字詞頻率區(qū)間,若上述判斷為是,則保持原有的字詞頻率,若上述判斷為否,則調(diào)整該選用字詞的頻率值,且包含調(diào)整該相同讀音字詞間的被選用優(yōu)先順序。上述的字詞頻率區(qū)間在不同頻率范圍內(nèi)其區(qū)間數(shù)可以相同或不同。接著判斷選用字詞的使用頻率是否已達(dá)到可記錄頻率的最大值,若該選用字詞的使用頻率已達(dá)到該可記錄頻率的最大值,則調(diào)整該相同讀音的所有字詞頻率。
其中上述調(diào)整該相同讀音的所有字詞頻率步驟包含依據(jù)各字詞所處頻率相對應(yīng)的頻率區(qū)間降低、或各字詞均降低一常數(shù)或各字詞等比例降低相對應(yīng)的字詞頻率。
本發(fā)明的較佳實施例將在下面結(jié)合附圖詳細(xì)說明
圖1為本發(fā)明方法的流程圖。
由于已知的字詞頻率調(diào)整方法不具親和力、效率低且操作不便、以現(xiàn)今的觀點而言不符合經(jīng)濟(jì)效益,因此本發(fā)明將披露一種動態(tài)調(diào)整字詞使用頻率的方法以利于提高效率,以利于其它的商業(yè)利用、文件管理、數(shù)據(jù)庫的建立、數(shù)據(jù)保存、或制作多媒體的應(yīng)用。當(dāng)然,本發(fā)明不限定于上述的應(yīng)用,本方法可以應(yīng)用于其它相關(guān)的領(lǐng)域。
本方法詳細(xì)說明如下,所述的較佳實施例只用做說明而并非用以限定本發(fā)明,圖1所示的流程圖為本方法的流程,首先在步驟100中建立常用字詞的數(shù)據(jù)庫,在存儲空間中為每個所需記錄的字詞設(shè)置儲存空間以利于記錄字詞使用次數(shù)頻率值。設(shè)置初始狀態(tài)下各個不同字詞,包含相同讀音但意義不同的初始頻率值。一般可以依據(jù)統(tǒng)計或其它調(diào)查方式內(nèi)建經(jīng)常所使用的詞庫以及其相對應(yīng)的頻率值。依據(jù)不同的頻率值可以供給使用者選用,而依據(jù)使用者的狀態(tài)在后續(xù)步驟中可以調(diào)整字詞的使用頻率。在本發(fā)明中記錄每個字詞所使用的儲存空間很小,僅需4-5位。以5位而言,可以儲存32次記錄,每使用一次字詞,則增加一次記錄,上述所舉的數(shù)量級僅作一例子非用以限定本發(fā)明。
在步驟102中等待使用者輸入字詞,接著在步驟104中系統(tǒng)對使用者所輸入字詞由字詞頻率記錄中判斷相同發(fā)音的字詞個別的頻率值。再依據(jù)字詞頻率的多寡依序供使用者選擇使用,一般字詞頻率相對較高者先行輸出提供給使用者。當(dāng)使用者選用某一特定字詞時,則系統(tǒng)記錄一次選用記錄增加其字詞頻率。
在本方法中,記錄每一字詞的詞頻,因此當(dāng)選用一字詞時,步驟106中將會對其所選用的字詞加以判斷該選用的字詞的頻率值是否大于最大的“字詞頻率區(qū)間”。而本發(fā)明方法對字詞均設(shè)定一頻率區(qū)間,此區(qū)間為確保兩個字詞的頻率差異保持在某一數(shù)值之下。若某一字詞的頻率超過此區(qū)間,則認(rèn)為此字詞的頻率已經(jīng)使用很頻繁也就是頻率已經(jīng)足夠大,不再調(diào)整其頻率。定義此頻率區(qū)間的目的在于不會因某些檔案特定輸入某讀音的第一字詞,而造成其頻率記錄遠(yuǎn)遠(yuǎn)大于其它相同發(fā)音的第二字詞頻率。換言之,就是造成使用頻繁的第一字詞與較不頻繁的第二字詞間的頻率最大差異在一定的區(qū)間之內(nèi)。
假如沒有上述字詞頻率區(qū)間的限制,將使得在處理另一檔案時,在第二字詞出現(xiàn)機(jī)會較大的情況下,仍然出現(xiàn)頻率較高的第一字詞,但此第一字詞并非使用者所要選用的字詞,因此在處理其它檔案時,仍然以前者的第一字詞出現(xiàn)。若原先第一字詞與第二字詞的詞頻記錄相關(guān)很大,則在處理后者檔案時,即使使用者選用第二字詞的頻率增加,也無法使系統(tǒng)立即提供第二字詞給使用者,造成不便。所以本發(fā)明定義一最大的“字詞頻率區(qū)間”,也就是使用者輸入一讀音的字詞達(dá)到與第二字詞差異在一定的區(qū)間后,便不再增加該字詞的詞頻。也就是認(rèn)為此字詞的使用頻率已經(jīng)足夠大,使其字頻與其它字詞的頻率不至于相關(guān)太多。因此在使用其它讀音的第二字詞時,只要選用數(shù)次之后,便可以超過區(qū)間次數(shù)而取代原先的第一字詞。再者,上述區(qū)間數(shù)在不同字頻范圍內(nèi)可以相同或不相同。
在步驟106中的判斷的結(jié)果若選用的字詞的頻率值大于最大的字詞頻率區(qū)間,則進(jìn)入步驟108,保持原有的字詞頻率而不再增加,之后在步驟116中確定輸入是否結(jié)束。
若上述的判斷為否,則在步驟110中調(diào)整該字詞的使用頻率。之后,系統(tǒng)在步驟112中將判斷該字詞的使用頻率是否已經(jīng)達(dá)到所能記錄頻率的最大值。若判斷為否,則在步驟116中確定是否輸入結(jié)束。若上述的判斷已經(jīng)達(dá)到字詞所可以記錄的最大容量,則在步驟114中將進(jìn)行字頻記錄的調(diào)整,以避免無法記錄相關(guān)數(shù)據(jù),或因其它字詞持續(xù)累積記錄而達(dá)到相同的頻率,若產(chǎn)生此現(xiàn)象則已失去字詞間相對應(yīng)的頻率而無優(yōu)先次序可言,而喪失字頻的意義。因此,在步驟114中將目前集中的所有字詞的頻率做一調(diào)整,可按照各個字詞所對應(yīng)的區(qū)間相對應(yīng)調(diào)整。例如,所有相同讀音的字詞的詞頻均下降一常數(shù),例如五,則所有詞頻均下降五,用以保持原先各字詞詞頻的相對優(yōu)先順序。也可以利用上述區(qū)間數(shù)來做一調(diào)整的依據(jù)。假使所處字頻范圍的字頻區(qū)間數(shù)不同,也可以依據(jù)所處區(qū)間數(shù)目來調(diào)整。
更詳細(xì)舉例如下,假使第一字詞已達(dá)到最大記錄容量,如32次,第二字詞目前出現(xiàn)頻率為23,第三字詞出現(xiàn)的頻率目前為27。在此情形下勢必相對調(diào)整詞頻,例如均下降10,則第一字詞記錄容量變?yōu)?2次,第二字詞目前出現(xiàn)頻率為13,第三字詞出現(xiàn)的頻率目前為17。因此,不改變字詞間相對應(yīng)優(yōu)先次序但可以繼續(xù)記錄使用字詞的頻率。之后于步驟116中確定輸入是否結(jié)束。若是,則結(jié)束輸入(步驟118),反之,重復(fù)輸入步驟102。此外,也可以按照另一比例下降詞頻。
本方法定義字詞頻率的區(qū)間,可以使得字詞間頻率最大相關(guān)值限定在一定范圍內(nèi),而相對應(yīng)調(diào)整各字詞的頻率用以保持字詞間的優(yōu)先次序且可以繼續(xù)記錄字頻。
本發(fā)明以較佳實施例說明如上,但本領(lǐng)域的技術(shù)人員,在不脫離本發(fā)明的精神范圍的前提下,可作若干變更和潤飾,其專利保護(hù)范圍以后附的權(quán)利要求范圍及其等同領(lǐng)域而定。
權(quán)利要求
1.一種調(diào)整字頻的方法,該方法包含步驟初始化各字詞的初始使用頻率;輸入字詞;判斷與該輸入字詞相同讀音的字詞個別的頻率;判斷使用者所選用的字詞的頻率值是否大于字詞頻率區(qū)間;若上述判斷為是,則保持原有的字詞頻率;若上述判斷為否,則調(diào)整該選用字詞的頻率值;判斷該選用字詞的使用頻率是否已達(dá)到可記錄頻率的最大值;及若該選用字詞的使用頻率已達(dá)該可記錄頻率的最大值,則調(diào)整該相同讀音的所有字詞頻率。
2.如權(quán)利要求1的調(diào)整字頻的方法,其中上述的字詞頻率區(qū)間在不同頻率范圍內(nèi)其區(qū)間數(shù)不同。
3.如權(quán)利要求1的調(diào)整字頻的方法,其中上述的字詞頻率區(qū)間在不同頻率范圍內(nèi)其區(qū)間數(shù)相同。
4.如權(quán)利要求1的調(diào)整字頻的方法,其中調(diào)整該選用字詞的頻率值時還包含調(diào)整該相同讀音字詞間的被選用優(yōu)先順序。
5.如權(quán)利要求1的調(diào)整字頻的方法,其中調(diào)整該相同讀音的所有字詞頻率步驟包含依據(jù)各字詞所處頻率相對應(yīng)的頻率區(qū)間降低。
6.如權(quán)利要求1的調(diào)整字頻的方法,其中調(diào)整該相同讀音的所有字詞頻率步驟包含各字詞均降低一常數(shù)。
7.如權(quán)利要求1的調(diào)整字頻的方法,其中調(diào)整該相同讀音的所有字詞頻率步驟包含各字詞等比例降低相對應(yīng)的字詞頻率。
8.如權(quán)利要求1的調(diào)整字頻的方法,其中上述可記錄頻率最大值的存儲容量小于或等于5位。
9.一種調(diào)整字頻的方法,該方法包含步驟初始化各字詞的初始使用頻率;輸入字詞;判斷與該輸入字詞相同讀音的字詞個別的頻率;判斷使用者所選用的字詞的頻率值是否大于字詞頻率區(qū)間;若上述判斷為是,則保持原有的字詞頻率;及若上述判斷為否,則調(diào)整該選用字詞的頻率值。
10.如權(quán)利要求9的調(diào)整字頻的方法,其中上述的字詞頻率區(qū)間在不同頻率范圍內(nèi)其區(qū)間數(shù)不同。
11.如權(quán)利要求9的調(diào)整字頻的方法,其中上述的字詞頻率區(qū)間在不同頻率范圍內(nèi)其區(qū)間數(shù)相同。
12.如權(quán)利要求9的調(diào)整字頻的方法,其中調(diào)整該選用字詞的頻率值時還包含調(diào)整該相同讀音字詞間的被選用優(yōu)先順序。
13.一種調(diào)整字頻的方法,該方法包含步驟初始化各字詞的初始使用頻率;輸入字詞;判斷與該輸入字詞相同讀音的字詞個別的頻率;判斷該選用字詞的使用頻率是否已達(dá)到可記錄頻率的最大值;及若該選用字詞的使用頻率已達(dá)該可記錄頻率的最大值,則調(diào)整該相同讀音的所有字詞頻率。
14.如權(quán)利要求13的調(diào)整字頻的方法,其中調(diào)整該選用字詞的頻率值時還包含調(diào)整該相同讀音字詞間的被選用優(yōu)先順序。
15.如權(quán)利要求13的調(diào)整字頻的方法,其中調(diào)整該相同讀音的所有字詞頻率步驟包含依據(jù)各字詞所處頻率相對應(yīng)的頻率區(qū)間降低。
16.如權(quán)利要求13的調(diào)整字頻的方法,其中調(diào)整該相同讀音的所有字詞頻率步驟包含各字詞均降低一常數(shù)。
17.如權(quán)利要求13的調(diào)整字頻的方法,其中調(diào)整該相同讀音的所有字詞頻率步驟包含各字詞等比例降低相對應(yīng)的字詞頻率。
18.如權(quán)利要求13的調(diào)整字頻的方法,其中上述可記錄頻率最大值的存儲容量小于或等于5位。
全文摘要
一種調(diào)整字頻的方法包含初始化各字詞的初始使用頻率,判斷與輸入字詞相同讀音的字詞個別的頻率,再判斷使用者所選用的字詞的頻率值是否大于字詞頻率區(qū)間,若上述判斷為是,則保持原有的字詞頻率,若上述判斷為否,則調(diào)整該選用字詞的頻率值,接著判斷選用字詞的使用頻率是否已達(dá)到可記錄頻率的最大值,若該選用字詞的使用頻率已達(dá)該可記錄頻率的最大值,則調(diào)整該相同讀音的所有字詞頻率。
文檔編號G06F17/40GK1369776SQ01104609
公開日2002年9月18日 申請日期2001年2月15日 優(yōu)先權(quán)日2001年2月15日
發(fā)明者魏永杰, 宋建福, 林光信 申請人:英業(yè)達(dá)股份有限公司