專利名稱:讀音符號自動標(biāo)注的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種文字讀音符號的自動標(biāo)注方法,特別涉及一種漢字注音符號及羅馬拼音符號的自動標(biāo)注方法。
在傳統(tǒng)計算機(jī)的中文顯示環(huán)境下,漢字讀音符號的顯示必須藉由人工鍵入的方法來達(dá)成。然而,人工鍵入極易造成輸入錯誤;并且,當(dāng)相對應(yīng)的漢字有更改時,此鍵入的讀音符號無法跟著改變,必須以人工重新鍵入,因此,缺乏使用上的靈活性。
此外,讀音符號,例如注音符號,總共使用到四十二個鍵,要存儲其排列位置相當(dāng)不易;而且,不同的機(jī)器型式可能使用不同的排列方式,因此造成使用上的不便。另外,通常在每個小小的按鍵上均印有英文、注音、倉頡、簡易等符號,更易造成人工鍵入時的困難。
鑒于上述現(xiàn)有技術(shù)中,傳統(tǒng)的讀音符號標(biāo)注方法所產(chǎn)生的諸多缺點與不便,本發(fā)明的主要目的是將文字的讀音符號自動顯示于顯示裝置上。
本發(fā)明的另一目的在于避免因人工鍵入讀音符號所造成的錯誤及速度慢等缺點;對于多音字,則顯示其最常用音,并可單獨標(biāo)注其特定讀音符號。
為達(dá)到上述目的,本發(fā)明提供一種讀音符號自動標(biāo)注的方法,它是將一文字的讀音符號自動標(biāo)示于一顯示裝置上,該方法包含下列步驟得到該文字的內(nèi)碼;產(chǎn)生該內(nèi)碼位于一索引中的偏移量;依據(jù)該偏移量從該索引中讀取一讀音碼;依據(jù)該讀音碼以產(chǎn)生該讀音符號;及將該讀音符號顯示于該顯示裝置上。
根據(jù)以上所述的目的,本發(fā)明還提供了一種漢字讀音符號的自動標(biāo)注方法,它是將一漢字的讀音符號,例如注音符號,自動標(biāo)示于一顯示裝置上。首先,由一文字檔得到漢字的內(nèi)碼,并判斷漢字之后是否包含有表示多音漢字的特殊符號。產(chǎn)生內(nèi)碼的索引偏移量,并依據(jù)偏移量從索引中讀取一包含聲母、介音、韻母及音調(diào)的注音碼。當(dāng)漢字之后包含有特殊符號,則將特殊符號后所包含的多數(shù)個符號轉(zhuǎn)換為注音碼。最后,依據(jù)注音碼以產(chǎn)生注音符號,并顯示于顯示裝置上。
本發(fā)明的另一方面是提供一種將一漢字的讀音符號,例如羅馬拼音符號,自動標(biāo)示于一顯示裝置上。首先,由一文字檔得到漢字的內(nèi)碼,并判斷漢字之后是否包含有表示多音漢字的特殊符號。接著,產(chǎn)生內(nèi)碼的索引偏移量,并依據(jù)偏移量從索引中讀取一包含拼音碼、音調(diào)位置號及音調(diào)號的羅馬拼音碼。當(dāng)漢字之后包含有特殊符號,則將特殊符號后所包含的多數(shù)個符號轉(zhuǎn)換為羅馬拼音碼。最后,依據(jù)羅馬拼音碼以產(chǎn)生羅馬拼音符號,并顯示于顯示裝置上。
圖1顯示本發(fā)明的流程圖。
圖2顯示一依照BIG_5編碼并使用本發(fā)明所達(dá)到的注音符號自動標(biāo)注的顯示例。
圖3顯示一依照GB2312編碼并使用本發(fā)明所達(dá)到的羅馬拼音符號自動標(biāo)注的顯示例。
圖1顯示本發(fā)明的流程圖。首先,在步驟10中建立一索引對應(yīng)表。此索引對應(yīng)表的建立是借助于漢字系統(tǒng),例如BIG_5及GB2312系統(tǒng)的內(nèi)部索引碼,對其進(jìn)行逆轉(zhuǎn)換以生成所需的相對應(yīng)索引表;并且,通常索引中的讀音碼是以漢字內(nèi)碼的順序來排列。以注音符號為例,此漢字的內(nèi)碼包含聲母、介音、韻母及音調(diào)四個部分。至于羅馬拼音符號,則其內(nèi)碼包含拼音碼、音調(diào)位置號及音調(diào)號三部分。至于一些具有多音的漢字,則在索引中存放一最常用者。表一列出四十二個注音符號的聲母、介音、韻母及音調(diào)部分。
表一
接著,在步驟11中打開一內(nèi)含漢字的文字擋,再由此文字檔內(nèi)的漢字得到漢字的內(nèi)碼。這些漢字的取得也可以經(jīng)由鍵盤如步驟12所示。步驟13是用以判斷漢字之后是否包含有表示多音漢字的特殊符號,如“>”。如果漢字之后不包含特殊符號,則進(jìn)入步驟14,根據(jù)內(nèi)碼產(chǎn)生內(nèi)碼的索引偏移量。以BIG_5漢字編碼規(guī)則為例,其注音碼包含二個字節(jié)(bytes)
AAAAAABB CCCCDDDD,其中最高的6位AAAAAA存放聲母,最高的第7至第8位BB存放介音,最低的第5至第8位CCCC存放韻母,而最低的4位DDDD存放音調(diào)。例如,“故”字的注音為《
,其中《為聲母部分的第九個符號(見表一),因此AAAAAA=9=001001;
為介音部分的第二個符號,因此BB=2=10;由于沒有韻母部分因此CCCC=0=0000;
為音調(diào)部分的第四個符號,因此DDDD=4=0100;因此“故”字編碼成AAAAAABBCCCCDDDD=00100110 00000100。至于其產(chǎn)生偏移量的步驟如下當(dāng)內(nèi)碼的低字節(jié)的值大于127,則偏移量計算公式為157(內(nèi)碼的高字節(jié)-164)+內(nèi)碼的低字節(jié)-98;然而,當(dāng)內(nèi)碼的低字節(jié)的值小于、等于127,則偏移量計算公式為157*(內(nèi)碼的高字節(jié)-164)+內(nèi)碼的低字節(jié)-64。
若使用GB2312編碼系統(tǒng),其羅馬拼音碼包含七個字節(jié)(bytes),其中第1至第6字節(jié)存放拼音碼,第七字節(jié)的高4位存放音調(diào)位置號,而第七字節(jié)的低4位存放音調(diào)號。至于其偏移量計算公式為94*(內(nèi)碼的高字節(jié)-164)+內(nèi)碼的低字節(jié)-161。
在步驟15中,依據(jù)偏移量從索引中讀取一注音碼或羅馬拼音碼;接著,依據(jù)此讀音碼、表一及上述的編碼規(guī)則以得到讀音符號(步驟16)。
然而,當(dāng)漢字之后包含有特殊符號,則將此特殊符號后所包含的多數(shù)個符號所組成的讀音碼,依據(jù)此讀音碼、表一及上述的編碼規(guī)則將其轉(zhuǎn)換為注音碼。例如假設(shè)文字檔中包含下列文字青山郭外斜<141012則依據(jù)表一,14代表聲母的T,1代表介音的一,01代表韻母的Y,而2代表音調(diào)
(第二聲)。
在步驟17中,依據(jù)讀音碼以得到讀音符號,并將其儲存于一儲存裝置內(nèi)(步驟18),例如磁盤內(nèi);或是將讀音符號標(biāo)注顯示于裝置,例如終端機(jī)上(步驟19)。顯示漢字及讀音符號在終端機(jī)上的方法,是使用一般的顯示方法并配合自建函數(shù)及一些調(diào)用模組來達(dá)成。
圖2顯示一依照BIG_5編碼并使用本發(fā)明所達(dá)到的注音符號自動標(biāo)注的顯示例,而圖3則顯示一依據(jù)GB2312編碼并使用本發(fā)明所達(dá)到的羅馬拼音符號自動標(biāo)注的顯示例。根據(jù)統(tǒng)計及經(jīng)驗,在一般的文字檔中,需要特定標(biāo)注多音字的情形不到3%。因此,幾乎大部分的文字檔都可以達(dá)到自動標(biāo)注讀音符號。
以上所述僅為本發(fā)明的較佳實施例而已,并非用以限定本發(fā)明的權(quán)利要求的范圍;凡其它未脫離本發(fā)明所揭示的精神下所完成的等效改變或修飾,均應(yīng)包括在所述的權(quán)利要求范圍內(nèi)。例如,說明書內(nèi)是以漢字讀音符號的自動標(biāo)注作為實施例,然而其他的文字,尤其是非拼音的文字系統(tǒng),皆符合本發(fā)明所要求保護(hù)范圍的精神。此外,實施例是采用漢字BIG_5及GB2312編碼系統(tǒng),然而,其他的編碼系統(tǒng)一樣可以適用于本發(fā)明所要求保護(hù)的范圍中。
權(quán)利要求
1.一種讀音符號自動標(biāo)注的方法,是將一文字的讀音符號自動標(biāo)示于一顯示裝置上,該方法包含下列步驟得到該文字的內(nèi)碼;產(chǎn)生該內(nèi)碼位于一索引中的偏移量;依據(jù)該偏移量從該索引中讀取一讀音碼;依據(jù)該讀音碼以產(chǎn)生該讀音符號;及將該讀音符號顯示于該顯示裝置上。
2.如權(quán)利要求1的方法,其中所述索引中的讀音碼是以該文字內(nèi)碼的順序排列。
3.如權(quán)利要求1的方法,還包含將該讀音符號儲存于一存儲裝置內(nèi)的步驟。
4.如權(quán)利要求1的方法,其中所述的文字是由一文字檔中讀出。
5.如權(quán)利要求1的方法,其中所述的文字是由一鍵盤鍵入。
6.如權(quán)利要求1的方法,其中所述的顯示裝置為一終端機(jī)。
7.如權(quán)利要求1的方法,還包含下列步驟依據(jù)該文字的內(nèi)碼以儲存與該文字內(nèi)碼相對應(yīng)的該讀音碼于該索引中。
8.如權(quán)利要求7的方法,其中當(dāng)該文字為一多音字,則存放該文字內(nèi)碼相對應(yīng)的一最常用讀音碼于該索引中。
9.如權(quán)利要求1的方法,其中所述的文字為一漢字。
10.如權(quán)利要求9的方法,其中所述漢字的內(nèi)碼是屬于一BIG_5編碼系統(tǒng)。
11.如權(quán)利要求9的方法,其中所述漢字的內(nèi)碼是屬于一GB2312編碼系統(tǒng)。
12.如權(quán)利要求1的方法,其中,在得到該文字的內(nèi)碼后,還包含判斷該文字之后是否包含一特殊符號的步驟,該特殊符號是表示該文字為一多音文字。
13.如權(quán)利要求12的方法,還包含將上述特殊符號后所包含的多數(shù)個符號轉(zhuǎn)換為該讀音碼的步驟。
14.如權(quán)利要求1的方法,其中所述的讀音碼為一注音碼。
15.如權(quán)利要求14的方法,其中所述的注音碼包含一聲母、一介音、一韻母及一音調(diào)。
16.如權(quán)利要求15的方法,其中所述的注音碼包含二個字節(jié),其中最高的6位存放該聲母,最高的第7至第8位存放該介音,最低的第5至第8位存放該韻母,及最低的4位存放該音調(diào)。
17.如權(quán)利要求1的方法,其中所述的讀音碼是為一羅馬拼音碼。
18.如權(quán)利要求17的方法,其中所述的羅馬拼音碼包含一拼音碼、一音調(diào)位置號及一音調(diào)號。
19.如權(quán)利要求18的方法,其中所述的羅馬拼音碼包含七個字節(jié)(bytes),其中第1至第6字節(jié)存放該拼音碼,第七字節(jié)的高4位存放該音調(diào)位置號,及第七字節(jié)的低4位存放該音調(diào)號。
20.如權(quán)利要求10的方法,其中所述產(chǎn)生偏移量的步驟包含當(dāng)該內(nèi)碼的低字節(jié)的值大于127,則該偏移量等于157*(該內(nèi)碼的高字節(jié)-164)+該內(nèi)碼的低字節(jié)-98;及當(dāng)該內(nèi)碼的低字節(jié)的值小于、等于127,則該偏移量等于157*(該內(nèi)碼的高字節(jié)-164)+該內(nèi)碼的低字節(jié)-64。
21.如權(quán)利要求11的方法,其中所述的偏移量等于94*(該內(nèi)碼的高字節(jié)-164)+該內(nèi)碼的低字節(jié)-161。
22.一種漢字注音符號自動標(biāo)注的方法,是將該漢字的注音符號自動標(biāo)示于一顯示裝置上,該方法包含下列步驟由一文字檔得到該漢字的內(nèi)碼;判斷該漢字之后是否包含一特殊符號,該特殊符號是表示該漢字為一多音漢字;產(chǎn)生該內(nèi)碼位于一索引中的偏移量;依據(jù)該偏移量從該索引中讀取一注音碼,該注音碼包含一聲母、一介音、一韻母及一音調(diào);當(dāng)該漢字之后包含該特殊符號,則將該特殊符號后所包含的多數(shù)個符號轉(zhuǎn)換為該注音碼;依據(jù)該注音碼以產(chǎn)生該注音符號;及將該注音符號顯示于該顯示裝置上。
23.如權(quán)利要求22的方法,其中所述索引中的注音碼是以該漢字內(nèi)碼的順序排列。
24.如權(quán)利要求22的方法,還包含將該注音符號儲存于一存儲裝置內(nèi)的步驟。
25.如權(quán)利要求22的方法,其中所述的顯示裝置為一終端機(jī)。
26.如權(quán)利要求22的方法,還包含下列步驟依據(jù)該漢字的內(nèi)碼以儲存與該漢字內(nèi)碼相對應(yīng)的該注音碼于該索引中。
27.如權(quán)利要求26的方法,其中,當(dāng)該文字為所述的多音字時,則存放該漢字內(nèi)碼相對應(yīng)的一最常用注音碼于該索引中。
28.如權(quán)利要求22的方法,其中所述漢字的內(nèi)碼屬于一BIG_5編碼系統(tǒng)。
29.如權(quán)利要求22的方法,其中所述的注音碼包含二個字節(jié),其中,最高的6位存放該聲母,最高的第7至第8位存放該介音,最低的第5至第8位存放該韻母,及最低的4位存放該音調(diào)。
30.如權(quán)利要求28的方法,其中所述產(chǎn)生偏移量的步驟包含當(dāng)該內(nèi)碼的低字節(jié)的值大于127,則該偏移量等于157*(該內(nèi)碼的高字節(jié)-164)+該內(nèi)碼的低字節(jié)-98;及當(dāng)該內(nèi)碼的低字節(jié)的值小于、等于127,則該偏移量等于157*(該內(nèi)碼的高字節(jié)-164)+該內(nèi)碼的低字節(jié)-64。
31.一種漢字羅馬拼音符號自動標(biāo)注的方法,是將該漢字的羅馬拼音符號自動標(biāo)示于一顯示裝置上,該方法包含下列步驟由一文字檔得到該漢字的內(nèi)碼;判斷該漢字之后是否包含一特殊符號,該特殊符號是表示該漢字為一多音漢字;產(chǎn)生該內(nèi)碼位于一索引中的偏移量;依據(jù)該偏移量從該索引中讀取一羅馬拼音碼,該羅馬拼音碼包含一拼音碼、一音調(diào)位置號及一音調(diào)號;當(dāng)該漢字之后包含該特殊符號,則將該特殊符號后所包含的多數(shù)個符號轉(zhuǎn)換為該羅馬拼音碼;依據(jù)該羅馬拼音碼以產(chǎn)生該羅馬拼音符號;及將該羅馬拼音符號顯示于該顯示裝置上。
32.如權(quán)利要求31的方法,其中所述索引中的羅馬拼音碼是以該漢字內(nèi)碼的順序排列。
33.如權(quán)利要求31的方法,還包含將該羅馬拼音符號儲存于一存儲裝置內(nèi)的步驟。
34.如權(quán)利要求31的方法,其中所述的顯示裝置為一終端機(jī)。
35.如權(quán)利要求31的方法,還包含下列步驟依據(jù)該漢字的內(nèi)碼以儲存與該漢字內(nèi)碼相對應(yīng)的該羅馬拼音碼于該索引中。
36.如權(quán)利要求35的方法,當(dāng)該文字為所述的多音字,則存放該漢字內(nèi)碼相對應(yīng)之一最常用羅馬拼音碼于該索引中。
37.如權(quán)利要求31的方法,其中所述漢字的內(nèi)碼是屬于一GB2312編碼系統(tǒng)。
38.如權(quán)利要求31的方法,其中所述的羅馬拼音碼包含七個字節(jié),其中第1至第6字節(jié)存放該拼音碼,第七字節(jié)的高4位存放該音調(diào)位置號,及第七字節(jié)的低4位存放該音調(diào)號。
39.如權(quán)利要求37的方法,其中所述的偏移量等于94*(該內(nèi)碼的高字節(jié)-164)+該內(nèi)碼的低字節(jié)-161。
全文摘要
一種文字讀音符號的自動標(biāo)注方法,是將一文字的讀音符號自動標(biāo)示于一顯示裝置上。首先,讀取文字的內(nèi)碼,并產(chǎn)生此內(nèi)碼位于索引中的偏移量。依據(jù)偏移量從索引中讀取一讀音碼,再依據(jù)讀音碼以得到讀音符號。最后,將讀音符號顯示于顯示裝置上。
文檔編號G06F17/20GK1196535SQ9711036
公開日1998年10月21日 申請日期1997年4月15日 優(yōu)先權(quán)日1997年4月15日
發(fā)明者張景嵩, 林光信, 趙海 申請人:英業(yè)達(dá)股份有限公司