專利名稱:簡(jiǎn)式漢語(yǔ)拼音文字——一種漢字輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明系漢語(yǔ)拼音文字,現(xiàn)在作為漢字的輸入法投入實(shí)用;因此它是一種“漢字輸入法”,屬于電子計(jì)算機(jī)中文信息處理的技術(shù)領(lǐng)域。
現(xiàn)有的“漢字輸入法”很多,據(jù)有關(guān)資料表明目前,漢字編碼方案的總數(shù)已達(dá)上千種,已經(jīng)在計(jì)算機(jī)上實(shí)現(xiàn)實(shí)際使用的也有上百種。但是實(shí)際被用戶廣泛使用的漢字輸入方法非常有限,大約為十幾種,其中又以使用拼音進(jìn)行漢字輸入的用戶為最多。
漢字編碼方案主要可以劃分為音碼、形碼、音形結(jié)合碼三大類。
音碼的編碼以漢字拼音為基礎(chǔ),對(duì)于熟悉拼音的用戶不需要專門學(xué)習(xí)或僅需很少的時(shí)間進(jìn)行學(xué)習(xí)。但音碼的缺點(diǎn)也是顯而易見的,主要是漢字輸入時(shí)同碼過多,很多情況下需要翻頁(yè),另外全拼編碼的冗余度很大,平均編碼長(zhǎng)度高,從而大大限制了漢字輸入速度。音碼容易掌握的優(yōu)點(diǎn)也被實(shí)際工作的低效率所掩蓋。盡管人們?cè)O(shè)計(jì)了多種改進(jìn)方案,始終未能達(dá)到令人滿意的程度。
形碼的編碼則是以漢字書寫形狀為基礎(chǔ),抓住漢字的字形特征進(jìn)行編碼,由于漢字形狀特征與英文字母沒有直接的聯(lián)系,所以掌握一種形碼的難度相對(duì)于音碼要大得多。盡管近年來(lái)新研制的許多形碼在編碼上都盡量考慮到易學(xué)易記,但由于漢字字形結(jié)構(gòu)的復(fù)雜性,往往無(wú)法使用幾條簡(jiǎn)短的規(guī)則嚴(yán)格地制定字形拆分標(biāo)準(zhǔn),而其中最令人頭痛的恐怕就是漢字拆分的二義性問題。對(duì)專業(yè)打字員來(lái)說,形碼的輸入速度比較高,但由于“難學(xué)易忘”的特點(diǎn),始終無(wú)法做到真正意義上的普及。
信息化時(shí)代要求一種“漢字輸入法”既能夠做到全民普及,同時(shí)又能夠達(dá)到高效率。沒有“效率”的普及將會(huì)失去普及的意義,不能“普及”的效率實(shí)際上也不會(huì)有真正的效率。事實(shí)已經(jīng)證明了這一點(diǎn)。因此,簡(jiǎn)單易學(xué)和輸入速度之間的矛盾已成了問題的焦點(diǎn)。本發(fā)明力圖解決的正是這個(gè)問題。
本發(fā)明的作者認(rèn)為現(xiàn)行編碼有一個(gè)共同的特征,它們都是作為方塊字的代碼而存在,其本身不具備可讀性和可逆性。例如,aps、apl,這是“五筆字型”對(duì)兩個(gè)方塊字所作的編碼,誰(shuí)能直接看出它們代表哪兩個(gè)方塊字嗎?恐怕不能!所以,人們只能臨時(shí)根據(jù)方塊字分拆規(guī)則給出編碼,而不能直接去學(xué)習(xí)和記憶編碼,更無(wú)法直接去認(rèn)識(shí)和閱讀編碼;同樣,現(xiàn)在的音碼也存在這個(gè)問題,例如niu、ma,這是漢語(yǔ)拼音方案中的兩個(gè)音節(jié),有誰(shuí)能說出與之對(duì)應(yīng)的是哪兩個(gè)方塊字嗎?恐怕也不能!--這就是沒有可讀性和可逆性的具體體現(xiàn),這也正是“漢字編碼”的通病-難以學(xué)習(xí)、難以記憶,難以做到真正意義上的普及和大眾化--之所以產(chǎn)生的根本原因。
本發(fā)明的作者還認(rèn)為要克服現(xiàn)行編碼所存在的弊病,唯一方法是設(shè)計(jì)一個(gè)具有文字性質(zhì)的系統(tǒng)的符號(hào)體系,把漢字輸入法、漢字注音法和漢語(yǔ)的拼音文字結(jié)合起來(lái)考慮,只有這樣才能真正解決問題。本發(fā)明就是根據(jù)這個(gè)指導(dǎo)思想而產(chǎn)生的。
所以,本發(fā)明,即“簡(jiǎn)式漢語(yǔ)拼音文字”(以下簡(jiǎn)稱“拼音文字”),其實(shí)質(zhì)與通常所說的“漢字編碼”是不同的,正如其名稱所表明的那樣,它是一個(gè)可以獨(dú)立記錄漢語(yǔ)(以普通話為標(biāo)準(zhǔn)音)的文字系統(tǒng),凡是方塊字能夠加以記錄的,這個(gè)文字系統(tǒng)都能夠完全的、無(wú)條件的加以記錄。因此,它與方塊字系統(tǒng)的詞匯體系具有對(duì)應(yīng)性,“拼音文字”系統(tǒng)的詞匯輸入鍵盤后,通過電腦程序的即時(shí)轉(zhuǎn)換,與之相應(yīng)的方塊字系統(tǒng)的詞匯就出現(xiàn)在屏幕上,正如“編碼”輸入后馬上顯示出方塊字一樣。因?yàn)樗且粋€(gè)可以獨(dú)立存在的漢語(yǔ)文字體系,所以它本身具有非常清晰、明確的可讀性和互逆性,這也是“拼音文字”與編碼的本質(zhì)區(qū)別之一。
現(xiàn)將本發(fā)明的主要內(nèi)容公開于下。
在普通話語(yǔ)音系統(tǒng)中,不計(jì)聲調(diào)變化,約有434個(gè)音節(jié)。這些音節(jié)在《漢語(yǔ)拼音方案》中又是由21個(gè)聲母和38個(gè)韻母拼合而成。作為注音方案,它已可謂簡(jiǎn)單明了。然而作為“拼音文字”的音節(jié)拼式,它還是過于煩瑣冗長(zhǎng)的。為此本發(fā)明制訂了簡(jiǎn)式漢語(yǔ)拼音方案。它包括漢語(yǔ)基礎(chǔ)字母表、漢語(yǔ)元音表、漢語(yǔ)輔音表和漢語(yǔ)音節(jié)表?,F(xiàn)詳細(xì)描述如下漢語(yǔ)的基礎(chǔ)字母表與英文字母表一樣字母排列順序和字母名稱讀音都一樣。但是,為了使這個(gè)國(guó)際字母表能夠更好地適應(yīng)漢語(yǔ)的語(yǔ)音及其拼式需要,本發(fā)明還將選用êü
等5個(gè)字母進(jìn)入拼式。這正如德文的 ü,捷克文的
和世界語(yǔ)的
ǔ等字母一樣。不過,本發(fā)明并不主張把新增的5個(gè)字母列入字母表。見下表
漢語(yǔ)元音表就內(nèi)容而言是直接反映我們漢語(yǔ)語(yǔ)音成分的,就形式而言是直接表現(xiàn)“拼音文字”拼寫樣式的。因此,它既不等同于任何其它一種語(yǔ)言的元音表,也不等同于任何其它一種漢語(yǔ)拼音方案的元音拼式。在《漢語(yǔ)拼音方案》中,它甚至也不是被叫成元音,而是被稱作韻母。韻母中又可分成韻頭、韻腹、韻尾。而在本發(fā)明的漢語(yǔ)元音表中,元音可分成單字母元音(單元音)和多字母元音(組合元音或稱多元音)。見下表單元音 (n、i、u)組合元音a[阿] an[昂]au[奧]ai[哀] ia[呀]ua[蛙]e[安兒]en[恩] ie[耶]ue[彎]ê[鵝] ei[欸]i[衣] in[因]iu[又] ui[威]o[喔] on[] ou[歐] uo[窩]u[烏] un[溫]ü[迂]本發(fā)明認(rèn)為元音i、u、ü同時(shí)兼具輔音性質(zhì),即可以作聲母。因此,當(dāng)其作為輔音使用時(shí)分別寫成y、w、v。
另外值得指出的是,本發(fā)明中的所有字母都是音素字母,在拼式中都有其固定的而且是唯一的讀音。不過字母n是個(gè)例外,它在組合元音中根據(jù)國(guó)際慣例發(fā)成鼻音[η]。
漢語(yǔ)輔音表與《漢語(yǔ)拼音方案》中的聲母表差不多。所不同的是,在本發(fā)明中將z、c、s和zh、ch、sh合寫成了單一的z、c、s(注本發(fā)明并無(wú)意取消zh、ch、sh與z、c、s之間在語(yǔ)音上的區(qū)別,但是也無(wú)意強(qiáng)調(diào)它們之間在語(yǔ)音上的區(qū)別)。其主要目的是為了方便語(yǔ)音教學(xué),同時(shí)也使音節(jié)拼式更趨簡(jiǎn)潔易學(xué)并使查字典更加容易。此外,本表增添了
三個(gè)字母,依次相當(dāng)于jü、qü、xü。采用這種寫法可使拼式簡(jiǎn)短明了,而且也有國(guó)際先例。在詞典編序時(shí),它們可分別附于g、c、s之后。見下表b[玻]p[坡]m[摸]f[佛]d[得]t[特]n[訥]l[勒]g[哥]k[科]h[喝]j[基]q[欺]x[希]z[知;資]c[嗤;雌]s[詩(shī);思]r[日]y[醫(yī)]w[巫]v[雨]
(注元音表、輔音表中方括號(hào)內(nèi)的漢字僅作臨時(shí)注音用。)下面介紹漢語(yǔ)音節(jié)表,它提供了300多個(gè)音節(jié)拼式。其中,最長(zhǎng)的音節(jié)拼式為4字母,最短的為1字母。這個(gè)音節(jié)表基本上準(zhǔn)確地反映了漢語(yǔ)音節(jié)在“拼音文字”字符上的表現(xiàn)形式,同時(shí)也基本上反映了漢語(yǔ)語(yǔ)音的全貌。值得指出的是,該表主要是屬于字符學(xué)方面的。本發(fā)明認(rèn)為,字符學(xué)上的拼寫音節(jié)與語(yǔ)音學(xué)上的理論音節(jié)總是有些出入。換言之,語(yǔ)音學(xué)上的幾個(gè)相近音節(jié)在字符學(xué)中有可能表現(xiàn)為同一個(gè)拼式,而語(yǔ)音學(xué)中的一個(gè)音節(jié)在字符學(xué)中也有可能表現(xiàn)為不同的幾個(gè)拼式。其原因在于前者主要是為了節(jié)約拼式。因?yàn)槠词竭^多勢(shì)必造成字母不夠用的現(xiàn)象,而且要是語(yǔ)音上的細(xì)微差別都在拼式上一一反映出來(lái),也會(huì)增加學(xué)習(xí)難度,從而給學(xué)習(xí)者帶來(lái)不必要的困難。后者主要是作為區(qū)分同音詞的手段。這現(xiàn)象在各種語(yǔ)文中都不同程度地存在著,在英語(yǔ)中也不例外。而在本發(fā)明中主要存在的是前一現(xiàn)象。如輔音表中的z、c、s和zh、ch、sh的合寫即屬這一現(xiàn)象。
因此,原《漢語(yǔ)拼音方案》中有400多“音節(jié)”,而本發(fā)明中只有300多“音節(jié)”也就不足為奇了。事實(shí)上,在實(shí)際運(yùn)用中音節(jié)拼式比上述數(shù)目要稍多一些。原因是方言特有的音節(jié)進(jìn)入語(yǔ)文;非漢語(yǔ)者特有的音節(jié)隨著外來(lái)詞進(jìn)入語(yǔ)文。
方塊漢字字符是一種奇妙的混合體。它既是構(gòu)形學(xué)的基本單位,又是構(gòu)詞學(xué)中的基本單位,同時(shí)也是語(yǔ)音學(xué)中的基本單位之一。我們且了解一下漢字字符集合的總體情況。
據(jù)專家分析,漢字字符合計(jì)有6萬(wàn)個(gè)左右。其中絕大部分系古體字符、異體字符,有效字符則在1萬(wàn)上下。在這1萬(wàn)左右字符中,很大一部分是專用字符,包括譯音專用字符,人、地名專用字符,等等。此外,還有一部分是構(gòu)詞能力很小或者在語(yǔ)文環(huán)境中非常罕用的字符。我們且稱上述字符為“第二級(jí)字符”,其余的則稱為“第一級(jí)字符”。
本發(fā)明認(rèn)為,第一級(jí)字符是整個(gè)方塊漢字體系的基干,也是研究的主要對(duì)象。分類工作就是針對(duì)第一級(jí)字符進(jìn)行的。
分類的基礎(chǔ)是方塊字的“義”(包括語(yǔ)法意義)。對(duì)漢字進(jìn)行分類有多種方法可根據(jù)方塊字的讀音分,可根據(jù)方塊字的字形分,也可根據(jù)方塊字的含義分。在本發(fā)明中基本上是根據(jù)方塊字的含義分的,并以漢語(yǔ)單音節(jié)詞的義項(xiàng)作為分類的基本單位。這樣,一方面避免了方塊字字形的糾纏,一方面又沒有脫離方塊字符這種固定單位。因?yàn)?,漢語(yǔ)的單音節(jié)詞必定是一個(gè)方塊字,而一個(gè)方塊字并非就是一個(gè)單音節(jié)詞,這就使分類對(duì)象的數(shù)目局限在一定范圍內(nèi)。同時(shí),用義項(xiàng)作為分類的基本單位可擺脫因字符的多義性帶來(lái)的麻煩。這種既能利用方塊字符又不會(huì)受制于方塊字符的分類法,是唯一可行的方法。過去,曾有人試圖以“詞”為基本單位進(jìn)行分類,但沒能成功。因?yàn)椤霸~”已然突破了“方塊字”的界限,從而使得分類對(duì)象多無(wú)盡數(shù)。另外,這做法也已遠(yuǎn)離了為漢字分類這個(gè)問題。
本發(fā)明以字典中的義項(xiàng)為單位,把第一級(jí)字符分成300多組同義或近義字,然后按邏輯歸納為30多類,并逐一制定邏輯義符。見下表
上表是邏輯分類的成果。它不是主觀預(yù)定的產(chǎn)物,而是由成千方塊字符所擁有的上萬(wàn)義項(xiàng)中分析歸納出來(lái)的。邏輯分類的直接目的是便于系統(tǒng)地區(qū)分同音字,所以在歸類的同時(shí)也適當(dāng)考慮到了語(yǔ)音這個(gè)因素(分類的具體程序參見附件二)。
詞性在漢語(yǔ)中是客觀存在的,諸如名詞、代詞、動(dòng)詞和介詞等等,但它沒有從方塊字符中得到體現(xiàn)。因此,方塊字符在記錄漢語(yǔ)時(shí)有不夠靈活、準(zhǔn)確之處。例如衣、食、雨,等等,通常都是作名詞使用,但是在特定的場(chǎng)合,尤其是在文言文中,它們還可作動(dòng)詞使用。另外,在現(xiàn)代漢語(yǔ)中,這種現(xiàn)象也是普遍存在的,比如“經(jīng)濟(jì)”,它既是名詞又是形容詞,這種例子不勝枚舉。如果這種實(shí)際上普遍存在的詞性變化現(xiàn)象能夠從詞形中反映出來(lái),則對(duì)語(yǔ)文的理解和對(duì)語(yǔ)文精密度以及用詞的靈活性的提高都會(huì)有重大意義。
鑒于上述理由,本發(fā)明為“拼音文字”體系制定了詞性符號(hào),稱之為“語(yǔ)法性詞尾”。如表詞性名詞動(dòng)詞形容詞副詞符號(hào)-o -i -a(-u)-e語(yǔ)法性詞尾有別于慣常所說的詞頭詞尾。按照某些字典的稱呼,常把名詞后面的“-頭”、“-子”等說成詞尾,同時(shí)也把名詞前面的“老-”、“阿-”等叫成詞頭。本發(fā)明將繼承這種稱呼。在實(shí)際運(yùn)用中,語(yǔ)法性詞尾總是粘著于詞體,成為整個(gè)字符的組成部分,但是不發(fā)音;與此相反,詞頭詞尾則必須發(fā)音,而且-般都是作為構(gòu)詞成分出現(xiàn)。本發(fā)明根據(jù)實(shí)際需要,將(-子、-兒)等詞尾分別定型為’z和’e,其余類推。
本發(fā)明認(rèn)為,漢語(yǔ)“拼音文字”是一個(gè)獨(dú)立完整的體系。無(wú)論是在語(yǔ)音方面還是在語(yǔ)法方面,它都有自己的系統(tǒng)的表現(xiàn)形式。它一方面要盡可能地忠實(shí)于原有語(yǔ)文的精神實(shí)質(zhì),另一方面又不能拘泥于原有語(yǔ)文的外表形式。當(dāng)然,人們還可以為漢語(yǔ)建立別種樣式的文字體系,在語(yǔ)音、語(yǔ)法方面同樣也可以擁有其系統(tǒng)的表現(xiàn)形式。但是,要拿任何的另一種體系的具體表現(xiàn)形式來(lái)拘束或穿鑿本發(fā)明建立的這個(gè)體系,那是肯定不對(duì)的。盡管本發(fā)明運(yùn)用了大量的現(xiàn)成的材料,但這個(gè)體系卻是根據(jù)一整套特有的理論創(chuàng)立起來(lái)的。這理論,當(dāng)然也包括語(yǔ)法性詞尾在內(nèi)。
本發(fā)明實(shí)際上不是為方塊字而作,是為漢語(yǔ)而作,也就是說它不是建立在方塊字的基礎(chǔ)上,而是建立在漢語(yǔ)基礎(chǔ)上。以下是它的“創(chuàng)制大綱”
1.以普通話為標(biāo)準(zhǔn)語(yǔ)音,根據(jù)具體情況進(jìn)行極個(gè)別的、有限度的調(diào)整,并以二十六個(gè)拉丁字母為基礎(chǔ)制定拼音方案。(詳見《簡(jiǎn)式漢語(yǔ)拼音方案》)2.介詞、連詞、代詞及部分單音節(jié)副詞的形體,單由簡(jiǎn)式拼音構(gòu)成;嘆詞和助詞由簡(jiǎn)式拼音+y構(gòu)成;象聲詞由簡(jiǎn)式拼音+j構(gòu)成。(簡(jiǎn)式拼音,就是指《簡(jiǎn)式漢語(yǔ)拼音方案》所制定的音節(jié)拼式)3.上述以外的單音節(jié)詞的形體依次由“簡(jiǎn)式拼音”、“邏輯義符”、“語(yǔ)法詞尾”,共三個(gè)部分構(gòu)成。前兩部分作為字符的主體,密不可分,具有高度的穩(wěn)定性。
4.多音節(jié)詞的形體,依次由“簡(jiǎn)式拼音”、“語(yǔ)法詞尾”,共兩個(gè)部分構(gòu)成。
5.成語(yǔ)及諺語(yǔ)等短語(yǔ)和詞組不在本方案的造形之列。
6.外來(lái)詞,包括非漢語(yǔ)人地名,其詞形在原則上一律還原。
以上六條,即為“拼音文字創(chuàng)制大綱”,它構(gòu)成了整個(gè)“拼音文字”體系的總體框架。下面,將結(jié)合本大綱具體說明“拼音文字”的詞匯定型方法。
首先要指出的是在本發(fā)明中,狹義的“字”的概念是不存在的,所存在的只有“詞”。而“詞”可以分為單音節(jié)詞和多音節(jié)詞。定型是針對(duì)于“詞”而言。
本發(fā)明認(rèn)為,每個(gè)單音節(jié)詞必然有個(gè)方塊字與之相對(duì)應(yīng),但不是每個(gè)方塊字都稱得上是單音節(jié)詞。例如蚯、蟋、蚓、蟀,等等,這些方塊字就不是也不能稱其為單音節(jié)詞。本方案對(duì)這些方塊字是不加單獨(dú)定型的。
根據(jù)“創(chuàng)制大綱”第2條,以下方塊字(單音節(jié)詞)定型如下ni(你)、nin(您)、wo(我)、ta(他)、ze(咱)、zei(這)、na(那)、naa(哪)、sei(誰(shuí))以上為代詞。
ay(啊)、yoy(喲)、kaj(喀)、may(嗎)、bay(吧)、ney(呢)、luoy(羅)以上為助詞和象聲詞。
zai(在)、vi(于)、wi(為)、xan(向),bi(比)、qi(其)、gen(更)、hen(很)、gan(剛)……等等。
以上為介詞和副詞。
根據(jù)“創(chuàng)制大綱”第3條,以下方塊字(單音節(jié)詞)定型如下公式單音節(jié)詞=簡(jiǎn)式拼音+邏輯義符+語(yǔ)法詞尾舉例baiosa(白) =bai + os +agudo(鴿)=g + ud +0zouovi(走) =zou + ov +iyom(億) =y + om(數(shù)詞無(wú)語(yǔ)法性詞尾)maudo(馬) =ma + ud +omauzo(麻) =ma + uz +omaulo(媽) =ma + ul +o這是單音節(jié)詞的定型公式。除了單純用簡(jiǎn)式拼音已經(jīng)定型者外,所有漢語(yǔ)單音節(jié)詞,都用這種方式構(gòu)形。
人們也許覺得這種構(gòu)形方式太累贅,但事實(shí)將會(huì)證明隨便是作為漢字輸入法還是作為文字,它都是十分有效的,甚至也是非常美觀的。而且,以這種方式定型的詞,充其量也不會(huì)超過四千條,在漢語(yǔ)詞匯庫(kù)中所占比例遠(yuǎn)遠(yuǎn)不到百分之十;再說,它們的使用頻率比人們想象的要低得多,例如麻煩、麻痹、麻木、麻利、麻臉、麻子、麻雀、麻將等等,將依次寫成mafea,mabia,mamua,malia,malieo, nazo,mac’eo,majano,真正寫mauzo的機(jī)會(huì)是很少的,其它詞的情況也是如此。
根據(jù)“創(chuàng)制大綱”第4條和第2條,以下方塊字(多音節(jié)詞)定型如下公式 簡(jiǎn)式拼音+語(yǔ)法詞尾=多音節(jié)詞舉例 suidau +o =suidauo水稻(名詞)qencu +i =qencui 清除(動(dòng)詞)qencu +a =qencua 清楚(形容詞)qencu +u =qencuu 清清楚楚(形容詞,重疊)fanfu +e =f8nfue 仿佛(副詞)kaca +j =kacaj 喀嚓(象聲詞)
uhu +y=uhuy嗚呼(嘆詞)ql ai+y=qlaiy 起來(lái)(助詞)這是多音節(jié)詞的定型公式。任何一個(gè)由兩個(gè)或兩個(gè)以上的音節(jié)構(gòu)成的詞,都可以用這種方式進(jìn)行定型。在整個(gè)漢語(yǔ)詞匯庫(kù)中,它所占的比例是極大的,而這種定型法又是最經(jīng)濟(jì)、簡(jiǎn)潔的。例如jenlii(經(jīng)歷),jenlio(經(jīng)理);qilino(麒麟),qilini(欺凌);gauxena(高興),xenfena(興奮),kuaihuoa(快活);xezaie(現(xiàn)在),janlaie(將來(lái))……等等。總之,最末一個(gè)字母始終是語(yǔ)法詞尾;它不發(fā)音,但有辨義作用。
非漢語(yǔ)人、地名以及進(jìn)入漢語(yǔ)使用的非漢語(yǔ)詞匯,統(tǒng)稱為外來(lái)詞。根據(jù)“創(chuàng)制大綱”第6條,所有使用拉丁字母的外來(lái)詞一般地都將采用其原形,非拉丁字母者則以國(guó)際通用的拉丁字母轉(zhuǎn)寫式為準(zhǔn)。貫徹“名從主人,按形照轉(zhuǎn)”的國(guó)際原則,例如羅馬、華沙、倫敦、莫斯科將定型拼寫為Roma、Warszawa、London、Moskva,其讀音則嚴(yán)格按照《簡(jiǎn)式漢語(yǔ)拼音方案》拼讀。這樣,既不破壞改變?cè)~形,以便于國(guó)際接軌,又能確保漢語(yǔ)文讀寫統(tǒng)一的原則怎么讀就怎么寫,怎么寫就怎么讀。如Stalin(斯大林)、Lenin(列寧)、Marx(馬克思)、Engels(恩格斯),等等。
參照國(guó)際上的一般慣例,姓氏、地名、民族名稱、國(guó)家名稱,及自然地理要素,如海洋、河流、湖泊、山脈、島嶼、海角、沙漠等,還有節(jié)氣名稱、干支紀(jì)年、年號(hào)等等,等等,都屬于專有名詞。專有名詞的定型與普通詞匯定型一樣,所不同的是,凡專有名詞的第一個(gè)字母一律用大寫字母。舉例如下Aihuio 璦琿〔縣名,在黑龍江?!矪eijeno北京Canceno長(zhǎng)城Donzuo 侗族〔民族名稱〕Ehuio 安徽〔中國(guó)省名〕Fujeo 福建〔中國(guó)省名〕Guizouo貴州〔中國(guó)省名〕Hilonjano 黑龍江〔中國(guó)省名〕Jilino 吉林〔中國(guó)省名〕
Kanxio康熙〔清圣祖年號(hào)〕Qiniko秦Qencauo 清朝Heiko 韓根據(jù)上述方法,本發(fā)明可以對(duì)古今漢語(yǔ)的全部詞匯加以定型?!稄埵洗笤~庫(kù)》就是這樣建立起來(lái)的,它目前擁有近八萬(wàn)詞匯,幾乎囊括了《現(xiàn)代漢語(yǔ)詞典》中的全部詞條;另外,它還收錄了世界上幾乎所有的國(guó)家和大部分國(guó)家的首都名稱,也收錄了我國(guó)縣級(jí)以上的全部行政區(qū)名稱兩千余條。
“創(chuàng)制大綱”第5條指出成語(yǔ)、諺語(yǔ)及歇后語(yǔ)等短語(yǔ)和詞組不在本方案的造形之列。而本發(fā)明考慮到漢字輸入的需要,特為它們開通了“簡(jiǎn)縮系統(tǒng)”,成語(yǔ)收錄了八千余條,諺語(yǔ)、歇后語(yǔ)等各收錄了兩千余條。舉例如下abss愛不釋手〔漢語(yǔ)成語(yǔ)〕blbl不倫不類〔漢語(yǔ)成語(yǔ)〕cnly長(zhǎng)年累月〔漢語(yǔ)成語(yǔ)〕dqsj大千世界〔漢語(yǔ)成語(yǔ)〕e'vfy 阿諛逢迎〔漢語(yǔ)成語(yǔ)〕yymeh 又要馬兒好,又要馬兒不吃草〔諺語(yǔ)〕rqzd人窮志短,馬瘦毛長(zhǎng)〔諺語(yǔ)〕rwyr人外有人,山外有山〔諺語(yǔ)〕ssbt十事半通,不如一事精通〔諺語(yǔ)〕snhcw 十年寒窗無(wú)人問,一舉成名天下知〔諺語(yǔ)〕yglbs 一個(gè)籬笆三個(gè)樁,一個(gè)好漢三個(gè)幫〔諺語(yǔ)〕lbshz 劉備摔孩子--收買人心〔歇后語(yǔ)〕htgfz 虎頭掛佛珠--假慈悲〔歇后語(yǔ)〕“創(chuàng)制大綱”第6條指出外來(lái)詞,包括非漢語(yǔ)人、地名,其詞形在原則上一律還原。這是國(guó)際社會(huì)的要求,是大勢(shì)所趨。例如,英國(guó)的首都是London,本方案規(guī)定的實(shí)際讀音是“隆冬”。但目前的習(xí)慣寫法是倫敦,人們也會(huì)習(xí)慣于寫成Lunduno。因此,本發(fā)明將London定為正式寫法,而把Lunduno作為“容錯(cuò)碼”存在。當(dāng)你需要寫出“倫敦”時(shí)。既可以輸入London,也允許輸入Lunduno。
本發(fā)明是建立在拼音原理的基礎(chǔ)上,作為漢字的輸入法,有人擔(dān)心個(gè)別方塊字由于發(fā)音不準(zhǔn)或者不認(rèn)識(shí),從而無(wú)法輸入。為了解除這個(gè)后顧之憂,本發(fā)明在不違背“創(chuàng)制大綱”原則的前提下,開通了“小字典”系統(tǒng)。舉例如下derenpano〔小字典·單人旁〕suanrenpano 〔小字典·雙人旁〕baugaieo 〔小字典·寶蓋兒〕sediesuio〔小字典·三點(diǎn)水〕jauspano 〔小字典·絞絲旁〕cautoueo 〔小字典·草頭兒〕這樣,當(dāng)你輸入derenpano的時(shí)候,凡是單人旁的方塊字就會(huì)出現(xiàn)在顯示框里,你需要哪個(gè)就可以挑選哪個(gè)。就好象翻查字典一樣,以備不時(shí)之需。當(dāng)然,在實(shí)際輸入漢字的過程中,需要翻查“小字典”的現(xiàn)象是極個(gè)別的。而且,這種現(xiàn)象將會(huì)隨著“拼音文字”的推行和普及而漸漸消失。
本發(fā)明已經(jīng)制作成軟件,并在計(jì)算機(jī)上進(jìn)行實(shí)際使用。現(xiàn)在簡(jiǎn)單介紹如下名稱=拼音文字功能鍵號(hào)=2碼元表=AaBbCcDdEeFfGgHhIiJjKkLlMmNnOoPpQqRrSsTtUuVvWwXxYyZz’萬(wàn)能鍵=;最大碼長(zhǎng)=12是否自動(dòng)選擇輸入=N是否執(zhí)行模糊搜索=Y是否使用自定義詞組=N自定義詞組編碼方案=O說明碼元表包括26個(gè)大寫拉丁字母和26個(gè)小寫拉丁字母,另加一個(gè)(’),共計(jì)53個(gè)碼元。輸入時(shí),字母
、
、
、ê、ü分別采用g’、c’、s’、e’、u’的形式。輸入時(shí),由于執(zhí)行模糊搜索,很多詞匯無(wú)需鍵入全碼即能出現(xiàn)。
本輸入法,基本上不存在翻頁(yè)。它還有一個(gè)特點(diǎn),許多詞條后面附有注釋,例如輸入labahuao 時(shí),顯示框?qū)@示出 1喇叭花2〔牽牛的通稱〕輸入epeo 時(shí),顯示框?qū)@示出 1暗盤2〔舊時(shí)商業(yè)用語(yǔ)〕輸入Zanzouo 時(shí),顯示框?qū)@示出 1漳州2〔福建〕輸入Gonsuno 時(shí),顯示框?qū)@示出 1公孫2〔姓氏〕輸入Canada 時(shí),顯示框?qū)@示出 1加拿大2〔北美洲國(guó)家〕輸入leishman 時(shí),顯示框?qū)@示出 1利什曼2〔原生動(dòng)物,外采詞〕輸入Kanxio 時(shí),顯示框?qū)@示出 1康熙2〔清圣祖年號(hào)〕輸入Lisbon 時(shí),顯示框?qū)@示出 1里斯本2〔葡萄牙的首都〕因此,“張氏大詞庫(kù)”既是輸入法的碼本又是“拼音文字”的詞典,兩者有機(jī)地統(tǒng)一起來(lái)。它的實(shí)際意義遠(yuǎn)遠(yuǎn)超出了輸入法本身。(關(guān)于“張氏大詞庫(kù)”,請(qǐng)參見附件三)
權(quán)利要求
1.簡(jiǎn)式漢語(yǔ)拼音文字-一種漢字輸入法,是一個(gè)以普通話為標(biāo)準(zhǔn)音,以二十六個(gè)拉丁字母為基礎(chǔ)而制定的漢字輸入法,其特征在于該輸入法是由“簡(jiǎn)式拼音”、“邏輯義符”、“語(yǔ)法詞尾”共三部分組成,外來(lái)詞,其詞形在原則上一律還原,成語(yǔ)及諺語(yǔ)等短語(yǔ)另行處理。
2.根據(jù)權(quán)利要求1所述的簡(jiǎn)式漢語(yǔ)拼音文字-一種漢字輸入法,其特征在于“簡(jiǎn)式拼音”是由“漢語(yǔ)基礎(chǔ)字母表”、“漢語(yǔ)元音表”、“漢語(yǔ)輔音標(biāo)”、“漢語(yǔ)音節(jié)表”四表所組成。
3.根據(jù)權(quán)利要求2所述的簡(jiǎn)式漢語(yǔ)拼音文字-一種漢字輸入法,其特征在于與《漢語(yǔ)拼音方案》相比較①在“漢語(yǔ)元音表”中元音可分成單字母元音<單元音>和多字母元音<組合元音>,元音i、u、ü同時(shí)兼具輔音性質(zhì),即可以作聲母,當(dāng)其作為輔音使用時(shí)分別寫成y、w、v;②在“漢語(yǔ)輔音表”中將z、c、s和zh、ch、sh合寫成單一的z、c、s,增添了
三個(gè)字母,依次相當(dāng)于jü、qü、xü;③在“漢語(yǔ)音節(jié)表”中,提供了300多個(gè)音節(jié)拼式,其中,最長(zhǎng)的音節(jié)拼式為4字母,最短的為1字母。
4.根據(jù)權(quán)利要求1所述的簡(jiǎn)式漢語(yǔ)拼音文字-一種漢字輸入法,其特征在于“邏輯義符”分類的基礎(chǔ)是以字典的義項(xiàng)為單位,把整個(gè)方塊漢字體系的基干分成300多組同義或近義字,然后按邏輯歸納為30多類,并逐一制定邏輯義符。
5.根據(jù)權(quán)利要求1所述的簡(jiǎn)式漢語(yǔ)拼音文字-一種漢字輸入法,其特征在于“語(yǔ)法詞尾”中的各詞尾在運(yùn)用中粘著詞體,成為整個(gè)字符的組成部分,但是不發(fā)音。
6.根據(jù)權(quán)利要求書1、2、5所述的簡(jiǎn)式漢語(yǔ)拼音文字-一種漢字輸入法,其特征在于介詞、連詞、代詞及部分單音節(jié)副詞的形體,單由簡(jiǎn)式拼音構(gòu)成;嘆詞和助詞由簡(jiǎn)式拼音加語(yǔ)法性詞尾-y構(gòu)成;象聲詞由簡(jiǎn)式拼音加語(yǔ)法性詞尾-j構(gòu)成。
7.根據(jù)權(quán)利要求1、2、4、5所述的簡(jiǎn)式漢語(yǔ)拼音文字-一種漢字輸入法,其特征在于,具有權(quán)利要求6所述的特征以外的單音節(jié)詞的形體依次由“簡(jiǎn)式拼音”、“邏輯義符”、“語(yǔ)法詞尾”共三部分構(gòu)成,前兩部分作為字符的主體,多音節(jié)詞的形體,依次由“簡(jiǎn)式拼音”、“語(yǔ)法詞尾”共兩個(gè)部分構(gòu)成。
8.根據(jù)權(quán)利要求1所述的簡(jiǎn)式漢語(yǔ)拼音文字-一種漢字輸入法,其特征在于非漢語(yǔ)人、地名以及進(jìn)入漢語(yǔ)使用的非漢語(yǔ)詞匯,統(tǒng)稱為外來(lái)詞,所有外來(lái)詞一般都將恢復(fù)原形,例羅馬、華沙、莫斯科將定型拼寫為Roma、Warsaw、Moscow,其讀音則嚴(yán)格按照《簡(jiǎn)式漢語(yǔ)拼音方案》拼讀。
全文摘要
本發(fā)明是以普通話為標(biāo)準(zhǔn)音,以二十六個(gè)拉丁字母為基礎(chǔ)而制定的漢字輸入法,其特征在于該“輸入法”是由“簡(jiǎn)式拼音”、“邏輯義符”、“語(yǔ)法詞尾”三部分組成。本輸入法中西文兼容,Ascll通用鍵盤,基本上不存在重碼問題,無(wú)須拆碼,但因其具有非常清晰、明確的可讀性和互逆性,在實(shí)際學(xué)習(xí)中,好學(xué)、易懂、易用,可廣泛用于各類中文信息處理系統(tǒng)中。
文檔編號(hào)G06F3/023GK1233007SQ99101558
公開日1999年10月27日 申請(qǐng)日期1999年1月20日 優(yōu)先權(quán)日1999年1月20日
發(fā)明者張森榮 申請(qǐng)人:張森榮