專利名稱::拼音漢字編碼的制作方法拼音漢字編碼
技術(shù)領(lǐng)域:
在全面研究漢語拼音規(guī)律及漢語常用語素(詞根)使用規(guī)律的基礎(chǔ)上,產(chǎn)生二者最佳結(jié)合的拼音漢字編碼。屬漢字輸入音碼系列。
背景技術(shù):
:國家語委《2005年中國語言生活狀況報告》調(diào)查平面媒體、有聲媒體、網(wǎng)絡(luò)媒體文本文件890多萬個共9億字次,其中漢字7億多字次。上述三類媒體共用漢字5607個,但僅581個漢字就可以覆蓋其中80%,2315個漢字可覆蓋99%,一個人掌握1萬多條詞語,900多個漢字就可閱讀90%的出版物。這些資料說明,漢語從用字形區(qū)分同音語素(比如創(chuàng)造越來越多的漢字),向用語音區(qū)分同音語素(更多的使用常用字組詞)的方向發(fā)展,基本語素(詞根)的作用越來越突出?!稘h語拼音方案》所展示的漢語語音系統(tǒng)和2300多個常用字所代表的漢語基本語素(詞根),是漢語的兩大基礎(chǔ)。本發(fā)明是以這套語音系統(tǒng)為基礎(chǔ),用最簡潔的形式來準確標識漢語基本語素(詞根),給2400多個漢語詞根予拼音定型,基本實現(xiàn)--對應(yīng)o
發(fā)明內(nèi)容本發(fā)明作為一種電腦漢字輸入的音碼,主要優(yōu)點在于構(gòu)成編碼的符號標準化、國際化、音素化,全由26個拉丁字母組成。編碼所依賴的語音表達系統(tǒng)更簡潔,更有規(guī)律。編碼保留漢字意、音明確的構(gòu)詞單元特點,把漢字的聲調(diào)、詞性等重要特征引入編碼中,使其在準確反映字音的同時對字意能有所提示。見碼能讀,見字知音能編碼,編碼規(guī)律簡單,易學(xué)易記。這是用拉丁字母準確標識漢字的重要突破。本發(fā)明主要解決如下三方面的問題1、創(chuàng)造一種不依賴漢字字形,只依賴字音、詞性的漢字輸入編碼;2、創(chuàng)造一種通訊中使用的可讀性編碼;3、減輕外國人學(xué)習(xí)漢語的難度,避開學(xué)習(xí)漢字,直接學(xué)習(xí)漢語,不依賴漢字也能準確表達漢語,用電腦處理漢字的讀、寫。本發(fā)明的技術(shù)方案包括拼音漢字編碼韻母表,韻母變式,拼音漢字編碼聲調(diào)表示法及詞性調(diào)符的使用。第一、《拼音漢字編碼》方案1、《拼音漢字編碼》聲母表([]內(nèi)為國際音標,與《漢語拼音》相同)b[b]P[P]m[m]f[f]d[d]t[tn[n]1[1]g[g]k[k]h[h]w[w]j[d3]q["x[4>]y[j]z[ts]c[ts']s[s]zh[t§]ch[ts'sh[f]r[zJ其中與英語發(fā)音區(qū)別較大的是q[U]x[4>]z[ts]c[ts']zh[t§]ch[ts']r[zt]每個聲母只讀一個音2、《拼音漢字編碼》韻母表"拼音漢字編碼"韻母表是本發(fā)明的重要發(fā)明成果之一,其示意圖見圖l,通過圖1的韻母表,漢語韻母完全歸結(jié)為七個單韻母及其變讀組成的23個雙韻母,稱為30韻圖。為了區(qū)別一些同音詞根,還需要使用韻母變式。見圖2.3、《拼音漢字編碼》韻母與《漢語拼音》韻母對照表-"拼音漢字編碼"韻母與漢語拼音韻母對照見圖3,拼音漢字編碼拼音規(guī)則與《漢語拼音》相同,聲母發(fā)音輕短,韻母重讀。4、聲調(diào)的表示——詞性調(diào)符漢語詞根中,大多數(shù)是名詞、動詞、形容詞三類,詞性都比較明顯,如果在字形上能有所反映,對于區(qū)別同音語素,表達詞意將大有幫助。本方案用k作為名詞調(diào)符,r作為動詞調(diào)符,v作為形容詞調(diào)符,(這三個字母經(jīng)過各聲調(diào)的篩選,在漢語的拼音中最不容易混淆),就可以既標調(diào)又表示詞性。調(diào)符在拼音時不發(fā)音。拼音漢字編碼表示聲調(diào)、詞性方法見圖4,圖4為本發(fā)明重要成果之一。5、拼音漢字編碼定型舉例使用拼音漢字編碼方法根據(jù)詞性及聲調(diào)對漢字進行拼音定型舉例見圖5.下面列舉一些有代表性的拼音漢字編碼caik菜草dda打d已v大rdiu丟kdom冬f肌r方夂rfei飛f犯法vdo多shatau少goo果gwnk罐hran寒haau好ten看rnryu描kwiv快vpyn偏pynr騙p:ra爬kqym槍qqym搶guiv蟲貝yur遇挖wka娃mmai買脆ir賣講rjum捐尋qvom窮6、高頻常用字采用特殊定型-zh這sh是o我d的mey沒he和i一bw不wey為詞綴字1兒z子7、其它詞根它們包括某些副詞、方位詞、語氣詞、量詞、助詞、介詞、連詞等不用調(diào)符。需要標調(diào)時可用","例陰平ma陽平,ma上聲m,a去聲ma,8、數(shù)詞、方位詞不用調(diào)符,采用韻母變式定型-如soan三soi四bay百deom東nosn南sho柳上xoa下9、單純詞和連綿詞整體定型.-舉例lindim伶仃yautyu窈窕paihwi徘徊duzhwn杜撰comcom匆匆wubi務(wù)必xynshem先生sh6nni6什么bijim必競soyi所以laji垃圾zhuyi主義xyutyu蕭條pempai澎湃comrotn從容fambyn方便kanke坎坷cenci參差goudam勾當jilym伎倆tyujyn條件biram必然yimgai應(yīng)該mahu馬虎hutu糊涂pembo蓬勃10、基本定型字組詞像漢字一樣,兩個基本定型字聯(lián)寫在一起可組成詞如dda打rkai開組成ddarkai打開wenr問tki題組成訓(xùn)rtki問題dik地dauk道組成dikdauk地道區(qū)別dikdauk是復(fù)合詞表示地下通道。didau是整體定型詞,表示真正的,純粹的。由于漢語常用重疊式組詞,如"自","己"意思差不多,重疊組成詞"自己",類似的有:干凈、平安、快捷、檢查、學(xué)習(xí)、討論、休息、打擊等。在組詞時,其中一個字就可以詞綴化。分別為(橫線部分為詞綴)kwiv.jydda.ji.j.jynchattyuxin挑釁ggaig^改革zi.]iiganjoinvpvimanxrue^iittaulonrxiwxi也有基本定型字直接加詞綴組詞的。如2ixiv仔細rhui^揮霍vhuihwn輝煌xumliv絢麗jiyyam給養(yǎng)zzhishi指示許多非常用(因而也不定型)字都作為詞綴處理。整體定型詞也有詞綴化的情況。如yuzhou(宇宙)是整體定型詞。在迎h(huán)ram(宇航)中被詞綴化為yu。yizham(儀仗)yishi(儀式)是整體定型詞在Xlbyyu(儀表)yiqoik(儀器)xirkeom(儀容)Yitaik(儀態(tài))loiiii(禮儀)中被詞綴化為yi。jihui(機會)是整體定型詞。在^iiyur(機遇)vweyji(危機)shkoiii(時機)zzhwni(轉(zhuǎn)機)中被詞綴化為ji。jigwn(機關(guān))是整體定型詞。在jigour(機構(gòu))jitii(機體)yyouji(有機)iiqoik(機器)iinren(機能)中被詞綴化為ji。上述兩種情況的詞綴ji的詞源不同。jimji(經(jīng)濟)是整體定型詞。在cka;i.jim(財經(jīng))jimykim(經(jīng)營)中被詞綴化為jinu11、應(yīng)用舉例hvanxumyyu寒宣語niihaau!你好!zaauchkenhaau!早晨好!0shZhanHw.我是張華niidxynshemhaauraaktahenhaau,xyrxyr.waanoantaitai.jinktynktynqihenhaauzaijynr.yyoukomvlraiwranl.單字(詞)你的先生好嗎?他很好,謝謝。晚安太太。今天天氣很好。再見。有空來玩。nii你xynshem先生ktynqi天氣h犯u好kta他.zai再早hen很jynr見chken晨xyr謝yyou有0我vm3n晚komw空sh是osn安lrai來d的teitai太太玩(兒)ma嗎jinktyn今天hv肌xum寒宣yyu語vzhenzhenvdchwmrvxinwamwamrchuyuouran,bimqyduixynvyyouzhixukgourchemmeemlydttyuzhanr,dandeemjivzonvbeidrgewnnynhevzonzhomvxynvyyouzhixukdchrwntoom,wamwamddauzhirsiweishoamdxreunkguiddaujuu,ggaibynrzhixysorxuyaurdyuumbwzzhipandavdyanrjuiyuvswnr.第二、《拼音漢字編碼》對漢字的整理1、漢字中的多音(因而也多義)字在《拼音漢字編碼》中完全被分開了。廣vpau(形)如?fijpauk(名)Lpaur(動)rd肌k(名)彈〗一Ltran(動)「hai(副)hrwn(動)vgan(形)gani:(動)gank(名)發(fā)行還干倒{2、有些一音多義字也被分開了,lii(名)lli(動)gTO(畐lj)rg怖(名)如關(guān)核rfa(動)fak(名)xrim(動)hkam(名)rbei(動)beik(名)frem(動)femk(名)dauv(形)daau(形)gwwn(名)ggwn(動)hkoe(名)hroe(動)hui(副)gank(名)felhuik(名)干"Cganr(動)-j-buk(名)上^sham,(方位詞)布丄bur(動)丄shamr(動)3、有一些實在無法分離的重音字,只好按重碼處理。如jur聚、據(jù)jeur拒、懼juk句、炬b露辦、扮bo證拌、泮......據(jù)統(tǒng)計,漢字常用字中多音(因而多義)字占16.7%,加上一音多義字,多義字比例還會更大,而《拼音漢字編碼》無多音字(這對外國人學(xué)習(xí)漢語大有好處),編碼2452個,重碼169個,重碼率6.9%。重碼時,按字的常用、單用頻率由高到低排列,考慮到2315個常用字使用頻率占99%,非單用字是按詞組輸入,實際操作碰到的重碼字很少。圖1是設(shè)計的拼音漢字編碼韻母表。圖2是韻母變式的表示方法表。圖3是拼音漢字編碼設(shè)計的韻母與漢語拼音韻母對照表,其中省去了韻母ia、jia、qia、xia寫成ja、qa、xa。不再使用非標準字母U。(類似情況等同處理)圖4是拼音漢字編碼表示聲調(diào)、詞性的方法示意表。圖5是拼音漢字編碼定型的舉例。具體實施方案1、用電腦鍵盤直接輸入編碼,鍵盤表示無須改動。2、注意整體定型詞,要整詞作為一個編碼輸入。3、由于常用字、單用字都經(jīng)由編碼輸入,已解決99%的漢字輸入問題(按實際使用字計算,不是按所有漢字計算),其余通過組詞輸入解決。4、對于地名、人名等需要單獨輸入非常用、非單用字時,可使用類似"漢語拼音輸入法"的查找選字方式輸入。權(quán)利要求1.《拼音漢字編碼》韻母表(30韻圖)把漢語韻母歸結(jié)為a、o、e、i、y、u、w7個單韻母系列包括它們的鼻音變讀,u變讀,i變讀及其表示方法。(其中與《漢語拼音方案》相同的不在權(quán)利要求之內(nèi))拼音漢字編碼韻母表<tablesid="tabl0001"num="0001">id="icf0001"file="S2008100582308C00011.gif"wi="154"he="67"top="48"left="32"img-content="drawing"img-format="tif"orientation="portrait"inline="no"/></tables>2.韻母變式的表示方法韻母變式表<image>imageseeoriginaldocumentpage2</image>3、拼音漢字編碼表示聲調(diào)、詞性的方法,包括用k、r、v做名詞、動詞、形容詞調(diào)符,以及調(diào)符位置表示聲調(diào)的方法,特別是上聲調(diào)采用雙寫聲母(或韻母)的表示方法。<table>tableseeoriginaldocumentpage3</column></row><table>4、副詞、語氣詞、量詞、助詞、介詞等用","的標調(diào)方式。舉例陰平ma陽平,ma上聲m,a去聲ma,5、高頻常用字的特殊編碼方式zh這,sh是,o我,d的,沒mey,he和,i一,bw不,wey為,詞綴字z子,l兒。6、利用權(quán)利要求l、2、3、4、5給漢字常用詞根的編碼方式。舉例caik菜,hoo火,yyou有,kanr看,guiv貴,jjim講,xrun尋,yaur要。7、用此種編碼進行中文信息處理,用此種編碼進行漢字輸入電腦、手機等其它使用編碼的系統(tǒng)。8、使用此種編碼進行教學(xué)、出版文字、音像等出版物,用此種編碼在網(wǎng)絡(luò)上使用。9、用此種編碼進行通訊、編制密碼。全文摘要拼音漢字編碼發(fā)明屬電腦輸入漢字編碼中的音碼序列。在電腦輸入漢字編碼中,創(chuàng)造一種不依賴漢字字形,只依賴字音、詞性的漢字輸入可續(xù)性編碼。本發(fā)明在“漢語拼音方案”的基礎(chǔ)上建立了符合漢語規(guī)律的簡潔的語音系統(tǒng),把漢字的聲調(diào)、詞性等重要特征引入編碼中,給漢語常用詞根定型,并在組詞輸入中解決非常用、非單用字的輸入問題。本發(fā)明主要用于漢字輸入電腦、手機等各種電子系統(tǒng),以及通訊密碼的編制。本發(fā)明還可用于對外漢語教學(xué),幫助外國人避開較難的漢字學(xué)習(xí)直接學(xué)習(xí)漢語,用電腦來讀寫漢字。文檔編號G06F3/023GK101266521SQ200810058230公開日2008年9月17日申請日期2008年3月28日優(yōu)先權(quán)日2008年3月28日發(fā)明者嚴魯生申請人:嚴魯生