專(zhuān)利名稱(chēng):漢語(yǔ)語(yǔ)音碼全拼和簡(jiǎn)拼漢語(yǔ)全息信息處理方法
技術(shù)領(lǐng)域:
本發(fā)明申請(qǐng)的技術(shù)是一種計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)漢語(yǔ)語(yǔ)音碼全拼和簡(jiǎn)拼漢語(yǔ)全息信息處理方法,該信息處理的方法屬于計(jì)算機(jī)漢字漢語(yǔ)信息處理技術(shù)領(lǐng)域。它用且僅用26個(gè)拉丁字母以詞為單位對(duì)漢語(yǔ)信息進(jìn)行全息處理,能夠與ASCCII碼100%兼容。該信息處理的方法包括但不限于漢語(yǔ)全息信息用能夠識(shí)別西文的書(shū)寫(xiě)筆書(shū)寫(xiě)輸入、標(biāo)準(zhǔn)西文鍵盤(pán)鍵入、多樣信息輸入、印刷、打印、儲(chǔ)存、顯示、通訊、信息傳輸、語(yǔ)音識(shí)別、語(yǔ)音合成、漢語(yǔ)智能分詞、機(jī)器翻譯、信息搜索、各種計(jì)算機(jī)文件格式和網(wǎng)頁(yè)信息表示及顯示、與各種網(wǎng)絡(luò)合法域名前后綴組成網(wǎng)絡(luò)域名用于登陸相應(yīng)網(wǎng)站、漢字漢語(yǔ)編程、商標(biāo)的標(biāo)識(shí)等方法,它是建立在使用世界通用的計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)基礎(chǔ)上的方法,以下將計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)簡(jiǎn)稱(chēng)為計(jì)算機(jī)或計(jì)算機(jī)系統(tǒng),該漢語(yǔ)全息信息處理方法所采用的漢語(yǔ)語(yǔ)音碼有全拼和簡(jiǎn)拼兩種拼寫(xiě)法。
二、背景技術(shù)
二十世紀(jì)四十年代起,計(jì)算機(jī)的飛速發(fā)展在全球范圍內(nèi)引起了一場(chǎng)以電子計(jì)算機(jī)為中心的第三次技術(shù)革命,它把人類(lèi)從繁重的腦力勞動(dòng)中解放出來(lái),開(kāi)創(chuàng)了人類(lèi)智力解放的新紀(jì)元。眾所周知,計(jì)算機(jī)主要是通過(guò)處理128個(gè)ASCII碼符號(hào)的方法來(lái)進(jìn)行字符信息處理的,由于26個(gè)拉丁字母在ASCII碼符集內(nèi),因此,使用以英文為代表的,以26個(gè)拉丁字母為碼元的拼音文字的國(guó)家能夠順利地進(jìn)行這次新技術(shù)革命,從飛躍發(fā)展的經(jīng)濟(jì)中得到好處。在第一次世界大戰(zhàn)之前世界上只有60個(gè)國(guó)家用26個(gè)拉丁字母來(lái)拼寫(xiě)表達(dá)本國(guó)的語(yǔ)言信息,而第二次世界大戰(zhàn)后使用26個(gè)字母來(lái)拼寫(xiě)表達(dá)本國(guó)語(yǔ)言信息的國(guó)家已經(jīng)達(dá)到了 120個(gè),其實(shí)這也反映了我們這個(gè)星球上的大多數(shù)國(guó)家在這個(gè)問(wèn)題上的價(jià)值取向。由于我國(guó)長(zhǎng)期來(lái)一直未能發(fā)明出用且僅用26個(gè)字母全息拼寫(xiě)表達(dá)漢語(yǔ)信息的技術(shù),因此與世界極大多數(shù)國(guó)家不同,我國(guó)記錄漢語(yǔ)語(yǔ)言信息仍然使用的是方塊表意漢字,它不是一種拼音文字,這就給計(jì)算機(jī)的漢語(yǔ)和漢字信息處理帶來(lái)很大的麻煩。盡管1958年中國(guó)中央人民政府頒布了《漢語(yǔ)拼音方案》作為表達(dá)漢語(yǔ)信息另一種輔助手段,但是由于受到當(dāng)時(shí)歷史條件的局限,從現(xiàn)代計(jì)算機(jī)對(duì)信息處理技術(shù)的要求來(lái)看,《漢語(yǔ)拼音方案》本身還存在以下幾個(gè)方面的不足第一拼式太長(zhǎng),第二五個(gè)聲調(diào)沒(méi)有字母化且不在ASCII碼的范圍內(nèi),第三漢語(yǔ)單詞音節(jié)的聲、韻、調(diào)沒(méi)有便于計(jì)算機(jī)信息處理的從左到右的一維線性排列,而是上下排列,第四如果沒(méi)有非字母化的漢語(yǔ)拼音隔音節(jié)符號(hào)的隔音節(jié)幫助,漢語(yǔ)拼音在以詞為單位連寫(xiě)時(shí),音節(jié)和音節(jié)之間往往容易發(fā)生混淆,產(chǎn)生混音現(xiàn)象。所有這些都不便于計(jì)算機(jī)對(duì)漢語(yǔ)信息的處理。一個(gè)便于計(jì)算機(jī)對(duì)漢語(yǔ)信息進(jìn)行處理的漢語(yǔ)音節(jié)的語(yǔ)音碼的理想狀況是第一每一個(gè)漢語(yǔ)音節(jié)必須含有聲韻調(diào)全部信息,第二任意多的音節(jié)被連寫(xiě)在一起后,音節(jié)與音節(jié)之間不能發(fā)生混淆,產(chǎn)生混音現(xiàn)象。第三整個(gè)語(yǔ)音碼必須采用26個(gè)拉丁字母從左到右一維線性排列,這樣一方面能與ASCII碼100%兼容,另一方面便于計(jì)算機(jī)信息處理;第四整個(gè)語(yǔ)音碼必須方便地與漢語(yǔ)拼音、漢語(yǔ)語(yǔ)音和以詞為單位的漢字的轉(zhuǎn)換;第五該語(yǔ)音碼本身不需要被轉(zhuǎn)換成漢字或漢語(yǔ)拼音或漢語(yǔ)語(yǔ)音就能夠方便地直接表達(dá)漢語(yǔ)信息,能夠非常容易地被人們拼讀成漢語(yǔ)標(biāo)準(zhǔn)語(yǔ)音,從而根據(jù)這漢語(yǔ)標(biāo)準(zhǔn)語(yǔ)音理解出它所要表達(dá)的漢語(yǔ)信息的意義。為此,眾多專(zhuān)家,學(xué)者在這方面進(jìn)行了研究和探索,但是由于漢語(yǔ)是一種有聲調(diào)的非常特別的語(yǔ)言,要想用且僅用26個(gè)拉丁字母,就能夠?qū)Π瑵h語(yǔ)的22個(gè)聲母(含一個(gè)零聲母),38個(gè)韻母,5個(gè)聲調(diào)(包含一個(gè)輕聲)進(jìn)行編碼,而且為了讓任意多的音節(jié)被連寫(xiě)在一起后,音節(jié)與音節(jié)之間不能發(fā)生混淆,產(chǎn)生混音現(xiàn)象,每一個(gè)音節(jié)里還必須隱含一個(gè)字母化的隔音節(jié)符號(hào),這樣就使得該技術(shù)方案的難度非常大,這也可能是長(zhǎng)期以來(lái)這個(gè)問(wèn)題一直沒(méi)有人有效解決的根本原因,據(jù)了解,目前只有歷史上的中國(guó)的文字改革方案中和目前的微軟拼音里用阿拉伯?dāng)?shù)字表示漢語(yǔ)音節(jié)的聲調(diào),表示漢語(yǔ)語(yǔ)音音節(jié)時(shí)采用“聲母全拼+韻母全拼+數(shù)字表示的聲調(diào)”的方式,這樣做是比目前的漢語(yǔ)拼音聲調(diào)寫(xiě)在韻母上面有進(jìn)步,解決了上面提到的《漢語(yǔ)拼音方案》本身還存在以下幾個(gè)方面的不足中的其中一個(gè)不足,即漢語(yǔ)單詞音節(jié)的聲、韻、調(diào)沒(méi)有便于計(jì)算機(jī)信息處理的從左到右的一維線性排列,但上面提到的《漢語(yǔ)拼音方案》本身還存在以下其它幾個(gè)方面的主要不足還是未能解決,從漢語(yǔ)信息的編碼技術(shù)角度看,其實(shí)質(zhì)是未能發(fā)明出用且僅用26個(gè)碼元,特別是用且僅用26個(gè) 拉丁字母作為碼元對(duì)包含漢語(yǔ)的22個(gè)聲母(含一個(gè)零聲母),38個(gè)韻母,5個(gè)聲調(diào)(含一個(gè)輕聲)進(jìn)行編碼的技術(shù),更不要說(shuō)發(fā)明出由于僅用26個(gè)拉丁字母作為碼元,漢語(yǔ)按詞連寫(xiě)后的音節(jié)和音節(jié)之間的隔音節(jié)技術(shù),并用該技術(shù)組成的語(yǔ)音碼來(lái)進(jìn)行各種漢語(yǔ)信息的計(jì)算機(jī)漢語(yǔ)信息處理。
發(fā)明內(nèi)容
本發(fā)明的目的是為了通過(guò)提供一種全新的根據(jù)漢語(yǔ)語(yǔ)音特點(diǎn),用且僅用26個(gè)拉丁字母對(duì)組成每一個(gè)漢語(yǔ)單詞音節(jié)的聲母、介母、韻母、聲調(diào)進(jìn)行科學(xué)合理的編碼,在漢語(yǔ)語(yǔ)音碼全拼時(shí)以詞為單位的漢語(yǔ)語(yǔ)音碼每一個(gè)音節(jié)依次按“漢語(yǔ)拼音相同的聲母+漢語(yǔ)拼音相同的介母+漢語(yǔ)拼音相同的韻母+調(diào)碼兼隔音節(jié)符號(hào)”的順序編碼,在漢語(yǔ)語(yǔ)音碼簡(jiǎn)拼時(shí)漢語(yǔ)單詞的每一個(gè)音節(jié)按照“聲碼+介碼+韻碼+調(diào)碼兼隔音節(jié)符號(hào)”的順序,以按詞連寫(xiě)的方式進(jìn)行書(shū)寫(xiě)筆書(shū)寫(xiě)輸入、標(biāo)準(zhǔn)西文鍵盤(pán)鍵入、多樣信息輸入、印刷、打印、儲(chǔ)存、顯示、通訊、信息傳輸、語(yǔ)音識(shí)別、語(yǔ)音合成、漢語(yǔ)智能分詞、機(jī)器翻譯、信息搜索、各種計(jì)算機(jī)文件格式和網(wǎng)頁(yè)信息表示及顯示、與各種網(wǎng)絡(luò)合法域名前后綴組成網(wǎng)絡(luò)域名用于登陸相應(yīng)網(wǎng)站、漢字漢語(yǔ)編程、商標(biāo)的標(biāo)識(shí)等,從而達(dá)到用它來(lái)直接處理漢語(yǔ)信息,以克服以上不足的目的。眾所周知漢語(yǔ)是通過(guò)語(yǔ)言中最小的有意義的能夠自由運(yùn)用的單位——漢語(yǔ)單詞來(lái)進(jìn)行信息表達(dá)和傳遞的,漢語(yǔ)單詞由若干個(gè)音節(jié)組成(一般一個(gè)音節(jié)對(duì)應(yīng)一個(gè)漢字,因此我們可以將單獨(dú)運(yùn)用的一個(gè)漢字看作為一個(gè)單音節(jié)詞,以上以下均同),不管每一個(gè)音節(jié)有多復(fù)雜,它都是由聲、韻、調(diào)三個(gè)部份組成。本發(fā)明采用世界上通用的26個(gè)拉丁字母,按同音同形法則對(duì)《漢語(yǔ)拼音方案》中的全部聲母、介母、韻母、聲調(diào)進(jìn)行上述編碼,并以一定的順序書(shū)寫(xiě)、標(biāo)準(zhǔn)西文鍵盤(pán)鍵入、印刷、打印、儲(chǔ)存、顯示、通訊、傳輸,再按照漢語(yǔ)的組詞規(guī)律將任意多個(gè)音節(jié)以詞為單位,音節(jié)與音節(jié)之間不用空格連續(xù)書(shū)寫(xiě)、標(biāo)準(zhǔn)西文鍵盤(pán)鍵入、印刷、打印、儲(chǔ)存、顯示、通訊、傳輸就完成了漢語(yǔ)單詞的書(shū)寫(xiě)、標(biāo)準(zhǔn)西文鍵盤(pán)鍵入、印刷、打印、儲(chǔ)存、顯示、通訊、傳輸,以這些書(shū)寫(xiě)、標(biāo)準(zhǔn)西文鍵盤(pán)鍵入、印刷、打印、儲(chǔ)存、顯示、通訊、傳輸?shù)臐h語(yǔ)單詞(包括單音節(jié)詞漢字)為基礎(chǔ)就可以進(jìn)行上述各種方法的計(jì)算機(jī)漢語(yǔ)信息處理了。例如我們利用本發(fā)明的方法分別表示以下漢語(yǔ)單詞
漢字漢語(yǔ)拼音全拼漢語(yǔ)語(yǔ)音碼簡(jiǎn)拼漢語(yǔ)語(yǔ)音碼
我們 (women) wovmenowovmno
會(huì)(hu丨) huiuhuiu
使用 (shT yong) shivyonguxrvydu
漢語(yǔ) (han yu) hanuyyvhcuyyv
拉丁文(IadTngwen ) IaadingawenvIaadqawnv將以上單詞按照所要表達(dá)漢語(yǔ)意思的語(yǔ)序以單詞為單位,詞與詞之間用空格隔開(kāi)依次書(shū)寫(xiě)、標(biāo)準(zhǔn)西文鍵盤(pán)鍵入、印刷、打印、儲(chǔ)存、顯示、通訊、傳輸就可以表達(dá)一句漢語(yǔ)句子,該漢語(yǔ)句子可以有以下四種表達(dá)方式I、直接用本發(fā)明方法的全拼漢語(yǔ)語(yǔ)音碼所表達(dá)的漢語(yǔ)信息Wovmeno huiu shivyongu hanuyyv laadingawenv.2、直接用本發(fā)明方法的簡(jiǎn)拼漢語(yǔ)語(yǔ)音碼所表達(dá)的漢語(yǔ)信息Wovmno huiu xrvyduhcuyyv laadqawnv.3、用《漢拼》表達(dá)的漢語(yǔ)信息Women hui shiyong han yu ladlngwen。4、用漢字表達(dá)的漢語(yǔ)信息我們會(huì)使用漢語(yǔ)拉丁文。同理我們可以用同樣的方法書(shū)寫(xiě)、標(biāo)準(zhǔn)西文鍵盤(pán)鍵入、印刷、打印、儲(chǔ)存、顯示、通訊、傳輸所有的漢語(yǔ)單詞,以這些單詞為基礎(chǔ),我們就可以書(shū)寫(xiě)、標(biāo)準(zhǔn)西文鍵盤(pán)鍵入、印刷、打印、儲(chǔ)存、顯示、通訊、傳輸任何我們想要處理的漢語(yǔ)信息。通過(guò)以上四種用不同方式表達(dá)的漢語(yǔ)同一句子,我們還可以看到由于本發(fā)明的編碼與《漢語(yǔ)拼音方案》具有一一對(duì)應(yīng)關(guān)系(詳見(jiàn)下面編碼與漢拼對(duì)照表),又由于《漢語(yǔ)拼音方案》可以脫離漢字直接用來(lái)表達(dá)漢語(yǔ)信息,同理根據(jù)本發(fā)明的方法書(shū)寫(xiě)、標(biāo)準(zhǔn)西文鍵盤(pán)鍵入、印刷、打印、儲(chǔ)存、顯示、通訊、傳輸?shù)臐h語(yǔ)單詞也可以脫離漢字直接用來(lái)表達(dá)漢語(yǔ)信息,又由于《漢語(yǔ)拼音方案》所表達(dá)的以詞為單位的漢語(yǔ)信息結(jié)合前后語(yǔ)義與以詞為單位的相對(duì)應(yīng)漢字基本上具有一一對(duì)應(yīng)關(guān)系,根據(jù)遞推規(guī)律用本發(fā)明書(shū)寫(xiě)、標(biāo)準(zhǔn)西文鍵盤(pán)鍵入、印刷、打印、儲(chǔ)存、顯示、通訊、傳輸?shù)囊栽~為單位的漢語(yǔ)單詞與相對(duì)應(yīng)的以詞為單位的漢字也具有這種一一對(duì)應(yīng)關(guān)系,同時(shí)在用本發(fā)明方法書(shū)寫(xiě)、標(biāo)準(zhǔn)西文鍵盤(pán)鍵入、印刷、打印、儲(chǔ)存、顯示、通訊、傳輸?shù)臐h語(yǔ)單詞碼直接表達(dá)漢語(yǔ)信息時(shí),其標(biāo)點(diǎn)符號(hào)的用法和意義采用同英文相一致的方法,這樣用本發(fā)明方法書(shū)寫(xiě)、標(biāo)準(zhǔn)西文鍵盤(pán)鍵入、印刷、打印、儲(chǔ)存、顯示、通訊、傳輸顯示、通訊、傳輸?shù)臐h語(yǔ)單詞碼就可以脫離漢字直接以與ASCII碼100%兼容的西碼狀態(tài)(26個(gè)拉丁字母狀態(tài))表達(dá)漢字漢語(yǔ)信息,同時(shí)也就決定了它可以僅在需要時(shí)轉(zhuǎn)換成相對(duì)應(yīng)的漢字或漢語(yǔ)拼音或漢語(yǔ)語(yǔ)音。這也就表明了,用本發(fā)明方法書(shū)寫(xiě)、標(biāo)準(zhǔn)西文鍵盤(pán)鍵入、印刷、打印、儲(chǔ)存、顯示、通訊、傳輸?shù)臐h語(yǔ)單詞碼具有全息可逆的特點(diǎn)。由于與漢字或漢語(yǔ)拼音不同,本發(fā)明方法所采用的語(yǔ)音碼與ASCII碼100%兼容,因此,所有西文軟硬件資源不加改造就能用來(lái)處理用本發(fā)明方法的語(yǔ)音碼所表達(dá)的漢語(yǔ)信息,這些也就是與當(dāng)今所有其它各類(lèi)漢語(yǔ)信息表達(dá)方式相比本發(fā)明取得顯著技術(shù)進(jìn)步的地方。本發(fā)明具有簡(jiǎn)單易學(xué)的特點(diǎn),能廣泛應(yīng)用于計(jì)算機(jī)漢語(yǔ)、漢字信息處理,為漢語(yǔ)閱讀機(jī)、口授機(jī)、外文翻譯機(jī)的誕生奠定了基礎(chǔ),同時(shí)由于采用26個(gè)字母進(jìn)行編碼,因此世界上一切能處理26個(gè)字母的信息處理機(jī)都能處理利用本發(fā)明的漢語(yǔ)語(yǔ)音碼所表達(dá)的漢語(yǔ)信息。通過(guò)在實(shí)踐中的不斷完善和普及,用本發(fā)明方法書(shū)寫(xiě)、標(biāo)準(zhǔn)西文鍵盤(pán)鍵入、印刷、打印、儲(chǔ)存、顯示、通訊、傳輸?shù)刃畔⒎椒ㄌ幚淼臐h語(yǔ)單詞碼,還可以發(fā)展成為一種漢語(yǔ)的拼音文字,可以象用英文處理英語(yǔ)信息一樣方便地處理漢語(yǔ)信息。
四具體實(shí)施方式
下面結(jié)合實(shí)施例對(duì)本發(fā)明的具體實(shí)施方式
作進(jìn)一步的說(shuō)明。(一 )漢語(yǔ)每一音節(jié)聲、韻、調(diào)的編碼方法漢語(yǔ)語(yǔ)音碼簡(jiǎn)拼時(shí)所采用的漢語(yǔ)語(yǔ)音碼的每一音節(jié)聲、韻、調(diào)的編碼方法采用以下的方法注括號(hào)內(nèi)的符號(hào)均為漢語(yǔ)拼音符號(hào),不帶括號(hào)的字母為所采用的漢語(yǔ)每一音節(jié)聲、韻、調(diào)的編碼,以上以下將下列聲、韻、調(diào)的對(duì)照編碼表簡(jiǎn)稱(chēng)為碼表(I).用于表示漢語(yǔ)信息的語(yǔ)音碼的聲母全部采用一個(gè)拉丁字母表示,例如采用如下的輔音拉丁字母表示聲碼的編碼b (b) P : (P) m (m) f (f) d (d)t (t)η (η) I (I) g (g) k (k) h (h)j (zh), (j) q (ch), (q) x (sh), (x) r (r)z : (z) c : (c) s (s) y (y) w (w)(2).用于表示漢語(yǔ)信息的語(yǔ)音碼用26個(gè)字母中的一個(gè)拉丁字母來(lái)表示介母,例如用y來(lái)表示原來(lái)漢語(yǔ)拼音單韻母和介母中的(U),其余單韻母和介母的編碼采用與漢語(yǔ)拼音單韻母和介母相同的符號(hào),比如采用如下介母的編碼i (i) u : (u) y (U)(3).用于表示漢語(yǔ)信息的語(yǔ)音碼除了部分帶有介母的復(fù)合韻母外,其余的復(fù)合韻母的韻碼在簡(jiǎn)拼時(shí)用一個(gè)拉丁字母來(lái)表示,比如用一個(gè)輔音字母表示,例如在漢語(yǔ)語(yǔ)音碼簡(jiǎn)拼時(shí)采用如下的韻碼的編碼a (a) ο (o) e (e) i (i) u (u) y (ii)ζ (ao) t (ai) c (an) s (ou) w (ei) η (en)k (ua) I (uo) g (ang) d (ong) b (eng) q (ing)p (ng)er (er)(無(wú)聲母韻母)(er用西文鍵盤(pán)鍵入時(shí)分別鍵入E和R兩個(gè)鍵)r :⑴[只與(zh)、(ch)、(sh)相拼](4).用于表示漢語(yǔ)信息的語(yǔ)音碼其調(diào)碼可以用五個(gè)拉丁字母表示,也可以用5個(gè)阿拉伯?dāng)?shù)字表示,例如采用如下四個(gè)拉丁字母和一個(gè)漢語(yǔ)不用的字母V表示調(diào)碼的編碼
a :(_)陰平e :(/)陽(yáng)平v : ( V )上聲u : (\)去聲ο :(不標(biāo))輕聲又例如采用如下5個(gè)阿拉伯?dāng)?shù)字表示調(diào)碼的編碼1:(_)陰平2:(/)陽(yáng)平3:(V)上聲4:(\)去聲5 :(不標(biāo))輕聲( 二)利用上述編碼的漢語(yǔ)信息全息表示采用如下的方法以單詞為單位,這里將單個(gè)漢字看作單音節(jié)詞,根據(jù)組成該單詞的每個(gè)音節(jié)的《漢語(yǔ)拼音方案》中的拼音,在漢語(yǔ)語(yǔ)音碼全拼時(shí)除了U的表示可以采用一個(gè)拉丁字母比如y表示外,聲母表示和介母表示以及韻母表示均與漢語(yǔ)拼音方案相同,與漢語(yǔ)拼音方案所不同的是調(diào)碼采用一個(gè)拉丁字母或阿拉伯?dāng)?shù)字表示,且該調(diào)碼兼隔音節(jié)符號(hào),即漢語(yǔ)語(yǔ)音碼每一個(gè)音節(jié)依次按“漢語(yǔ)拼音相同的聲母+漢語(yǔ)拼音相同的介母+漢語(yǔ)拼音相同的韻母+調(diào)碼兼隔音節(jié)符號(hào)”的順序編碼,在漢語(yǔ)語(yǔ)音碼簡(jiǎn)拼時(shí)依次按“聲碼+介碼+韻碼+調(diào)碼兼隔音節(jié)符號(hào)”的順序編碼,無(wú)論是全拼和簡(jiǎn)拼,同一個(gè)單詞的多個(gè)音節(jié)不用空格隔開(kāi)連寫(xiě),單詞與單詞之間的編碼用空格隔開(kāi),組成單詞時(shí),單詞的每一個(gè)音節(jié)既可以全部用全拼或簡(jiǎn) 拼音節(jié)組成,也可以將組成詞的任意一個(gè)音節(jié)根據(jù)需要采用全拼或簡(jiǎn)拼混合搭配組成,也即在組成單詞的多個(gè)音節(jié)中有的音節(jié)可以是簡(jiǎn)拼,有的音節(jié)可以是全拼,以下以上將漢語(yǔ)語(yǔ)音碼全拼和簡(jiǎn)拼統(tǒng)稱(chēng)為漢語(yǔ)語(yǔ)音碼或語(yǔ)音碼;漢語(yǔ)語(yǔ)音碼全拼或簡(jiǎn)拼可以單獨(dú)也可以與漢字、漢語(yǔ)拼音、外文、少數(shù)民族文字以及全拼或簡(jiǎn)拼進(jìn)行對(duì)照印刷、打印、儲(chǔ)存、顯示、通訊、信息傳輸?shù)?;?dāng)漢語(yǔ)信息處于全拼或簡(jiǎn)拼語(yǔ)音碼狀態(tài)時(shí),其標(biāo)點(diǎn)符號(hào)的用法同英文的標(biāo)點(diǎn)符號(hào)的用法相同;這里由于將獨(dú)立運(yùn)用的漢字看作單音節(jié)詞,因此,本發(fā)明方法的漢字語(yǔ)音碼的書(shū)寫(xiě)、標(biāo)準(zhǔn)西文鍵盤(pán)鍵入、印刷、打印、儲(chǔ)存、顯示、通訊、傳輸方法和漢語(yǔ)單詞的方法相同,我們將由若干個(gè)單詞組成的一組詞稱(chēng)為詞組,本發(fā)明的詞組的表示方法同漢語(yǔ)句子表示方法相同。一般整句整篇以詞為單位表示漢語(yǔ)信息時(shí),理解時(shí)一般不需要進(jìn)行同音字詞的選擇,原則上聽(tīng)起來(lái)不會(huì)產(chǎn)生歧義的句子,書(shū)寫(xiě)、標(biāo)準(zhǔn)西文鍵盤(pán)鍵入、印刷、打印、儲(chǔ)存、顯示、通訊、傳輸后也不會(huì)產(chǎn)生歧義。下面例舉一些用本發(fā)明方法表示的漢語(yǔ)單詞碼和相對(duì)應(yīng)的以詞為單位的漢字及用《漢語(yǔ)拼音方案》表達(dá)的相對(duì)應(yīng)的漢語(yǔ)拼音。(帶括號(hào)的是《漢拼》不帶括號(hào)的是用本發(fā)明方法表示的漢語(yǔ)單詞碼和相應(yīng)的漢字)。
漢語(yǔ)語(yǔ)音碼簡(jiǎn)拼漢字漢語(yǔ)拼音漢語(yǔ)語(yǔ)音碼全拼不同音節(jié)數(shù)的詞wovmno我們 (w6men) wovmeno .(雙音節(jié)詞)
huiu會(huì) (hu〗)huiu(單音節(jié)詞)
xrvydu使用 (shiydng) shivyongu (雙音節(jié)詞)
Iaadqawnv拉丁文(l§dingw§n ) laadingawenv (三音節(jié)詞)將這些單詞詞與詞之間用空格隔開(kāi),單詞與單詞之間依漢語(yǔ)語(yǔ)序連續(xù)書(shū)寫(xiě)、標(biāo)準(zhǔn)西文鍵盤(pán)鍵入、印刷、打印、儲(chǔ)存、顯示、通訊、傳輸就可以表示一個(gè)漢語(yǔ)詞組或漢語(yǔ)句子信息,由于詞組的表示方式和漢語(yǔ)句子的表示的方式相同,這里就不再累述,僅以書(shū)寫(xiě)、標(biāo)準(zhǔn)西文鍵盤(pán)鍵入、印刷、打印、儲(chǔ)存、顯示、通訊、傳輸?shù)囊痪錆h語(yǔ)句子信息為例wovmno huiu xrvydu laadqawnv.(漢語(yǔ)語(yǔ)音碼簡(jiǎn)拼表示的漢語(yǔ)信息)
我們會(huì) 使用拉丁文。(用漢字表示的漢語(yǔ)信息)women hui shiyong l0dlngwgn。(用漢語(yǔ)拼音表示的漢語(yǔ)信息)wovmeno huiu shivyongu laadingawenv.(用漢語(yǔ)語(yǔ)音碼全拼表示的漢語(yǔ)信息)依次類(lèi)推用上述方法可以對(duì)所有的任意多音節(jié)的漢語(yǔ)單詞信息進(jìn)行書(shū)寫(xiě)、標(biāo)準(zhǔn)西文鍵盤(pán)鍵入、印刷、打印、儲(chǔ)存、顯示、通訊、傳輸?shù)刃畔⑻幚恚赃@些漢語(yǔ)單詞為基礎(chǔ)就可以表示任何漢語(yǔ)信息,從而方便進(jìn)行各種漢字、漢語(yǔ)信息處理。由于漢語(yǔ)語(yǔ)音碼的全拼和簡(jiǎn)拼之間可以方便地進(jìn)行雙向轉(zhuǎn)換,為敘述簡(jiǎn) 單明了起見(jiàn),在下面的舉例中一般用簡(jiǎn)拼漢語(yǔ)語(yǔ)音碼為例,其實(shí)只要對(duì)簡(jiǎn)拼漢語(yǔ)語(yǔ)音碼能成立的步驟和方法對(duì)全拼漢語(yǔ)語(yǔ)音碼也同樣成立,這里特別聲明一下。(三)漢語(yǔ)智能分詞采用以下步驟和方法(I)漢語(yǔ)智能分詞采用一種主要基于與英語(yǔ)語(yǔ)法的詞法句法及其構(gòu)詞法基本相一致的新型漢語(yǔ)語(yǔ)法分析基礎(chǔ)上的計(jì)算機(jī)或嵌入式可移動(dòng)設(shè)備的漢字文本和與《漢語(yǔ)拼音方案》具有一一對(duì)應(yīng)關(guān)系的漢語(yǔ)拼音文本的分詞方法,其所用的新型漢語(yǔ)語(yǔ)法主要特點(diǎn)是詞法方面將漢語(yǔ)的詞類(lèi)分成名詞、代詞、數(shù)量詞、副詞、形容詞、動(dòng)詞、介詞、連詞、語(yǔ)氣詞和象聲詞;句法方面將漢語(yǔ)的句子成份劃為主語(yǔ)、謂語(yǔ)、賓語(yǔ)、表語(yǔ)、同位語(yǔ)、定語(yǔ)、狀語(yǔ)、補(bǔ)語(yǔ);將句子的復(fù)句分為并列復(fù)句和主從復(fù)句;主從復(fù)句又可以分為主語(yǔ)從句、賓語(yǔ)從句、表語(yǔ)從句、同位語(yǔ)從句、定語(yǔ)從句、狀語(yǔ)從句;將漢語(yǔ)動(dòng)詞時(shí)態(tài)分為過(guò)去時(shí)、現(xiàn)在時(shí)、現(xiàn)在將來(lái)時(shí)、過(guò)去將來(lái)時(shí);漢語(yǔ)動(dòng)詞體式分為一般式、進(jìn)行式、完成式、完成進(jìn)行式;建立漢語(yǔ)動(dòng)詞被動(dòng)語(yǔ)態(tài)和謂語(yǔ)動(dòng)詞的虛擬語(yǔ)氣;漢語(yǔ)的構(gòu)詞法方面主要通過(guò)在詞根基礎(chǔ)上加前綴、中綴、后綴、前后綴的方法以及詞根與詞根復(fù)合的方法來(lái)構(gòu)詞;將漢語(yǔ)的非單個(gè)漢字或音節(jié)的專(zhuān)用名詞、代詞、數(shù)量詞、部分副詞、介詞、連詞、語(yǔ)氣詞和象聲詞、表征并列復(fù)句和各個(gè)從句的特征詞、動(dòng)詞各種時(shí)體系統(tǒng)、被動(dòng)語(yǔ)態(tài)、虛擬語(yǔ)氣的特征詞、構(gòu)詞法的前后綴分類(lèi)列入一級(jí)詞庫(kù),將主要表征漢語(yǔ)成語(yǔ)的四字詞、單音詞、形容詞、動(dòng)詞、未列入一級(jí)詞庫(kù)的其它名詞和副詞分類(lèi)列入二級(jí)詞庫(kù),將漢語(yǔ)的構(gòu)詞法的前綴、中綴、后綴、詞根分類(lèi)列入三級(jí)詞庫(kù);在分詞時(shí)總是要利用句子或字符串的斷點(diǎn),從斷點(diǎn)左右兩側(cè)開(kāi)始對(duì)需要切分的漢字或音節(jié)進(jìn)行匹配切分,對(duì)所有已經(jīng)匹配成功的詞要加空格隔開(kāi)并在后臺(tái)作匹配完成標(biāo)識(shí),等全部完成切詞后再撤消該標(biāo)識(shí)回到原來(lái)的字體格式;所利用斷點(diǎn)形成的位置主要包括但不限于句子的起首、句子的結(jié)尾、各種標(biāo)點(diǎn)符號(hào)、各種表示數(shù)量和序號(hào)的阿拉伯?dāng)?shù)字、各種特種符號(hào)、原來(lái)漢字或音節(jié)中含有的空格、上一級(jí)詞庫(kù)分詞以后所形成的斷點(diǎn);分詞時(shí)第一步先用一級(jí)詞庫(kù)里的詞和前后綴,對(duì)需要分詞的整個(gè)文本中的漢字或音節(jié)進(jìn)行掃描,把經(jīng)掃描匹配成功的漢字或音節(jié)看作一個(gè)需要切分的詞進(jìn)行切分,前后綴匹配成功后,以前后綴為界將包括前后綴在內(nèi)的所有字符當(dāng)作一個(gè)詞切分,有不止一種匹配結(jié)果時(shí)以產(chǎn)生最少孤立漢字或音節(jié)的匹配結(jié)果為準(zhǔn);一級(jí)詞庫(kù)分完后,從斷點(diǎn)的左右兩側(cè)依次分別取四個(gè)、兩個(gè)、三個(gè)以及一個(gè)沒(méi)有匹配成功的漢字或音節(jié),然后與二級(jí)詞庫(kù)里的詞進(jìn)行匹配,如果所取的漢字或音節(jié)匹配成功,并且對(duì)同一處理對(duì)象從斷點(diǎn)的左右兩側(cè)進(jìn)行正向和逆向匹配的結(jié)果相同,就認(rèn)為這是一個(gè)成功的匹配結(jié)果,如果匹配的結(jié)果不相同,產(chǎn)生最少孤立漢字或音節(jié)的匹配結(jié)果被認(rèn)為是成功的匹配;二級(jí)詞庫(kù)分完詞后,在進(jìn)一步分詞時(shí),首先對(duì)照三級(jí)詞庫(kù)對(duì)未匹配成功的漢字或音節(jié)進(jìn)行前綴、后綴、中綴和詞根的匹配判斷,如果是前綴的話,向后吸收一個(gè)孤立漢字或音節(jié)構(gòu)成一個(gè)詞并作切分,如果后面是兩個(gè)匹配好的漢字或音節(jié),則與匹配好的這兩個(gè)漢字或音節(jié)結(jié)合,按三字詞切分;如果是后綴的話,向前吸收一個(gè)孤立漢字或音節(jié)構(gòu)成一個(gè)詞并作切分,如果前面是兩個(gè)匹配好的漢字或音節(jié),則與匹配好的這兩個(gè)漢字或音節(jié)結(jié)合,按三字詞切分;如果是中綴的話則吸收前面和后面各一個(gè)字或音節(jié)組成一個(gè)詞,如果吸收后導(dǎo)致前面或后面出現(xiàn)一個(gè)孤立的沒(méi)有匹配的漢字或音節(jié)時(shí),則要將這個(gè)漢字或音節(jié)吸收進(jìn)這個(gè)中綴組成的詞,一般組成的詞的漢字或音節(jié)數(shù)不超過(guò)四個(gè),如果是詞根的話,根據(jù)它前面能加字或音節(jié),還是后面能加字或音節(jié),還是前后都能加字或音節(jié)的情況,分別采用前綴、后綴、中綴的切詞方法進(jìn)行切詞,以上方法所切分到的詞,當(dāng)在同一篇文檔中的不同句子中累計(jì)出現(xiàn)次數(shù)不少于兩次時(shí),系統(tǒng)自動(dòng)將該詞存入二級(jí)詞庫(kù);當(dāng)用以上三個(gè)詞庫(kù)切分完后,句子中仍然出現(xiàn)未匹配成功的漢字或音節(jié)串,或者 雖然匹配成功但屬于三個(gè)以上連續(xù)孤立的漢字或音節(jié)串時(shí),把它們合并在一起組成一個(gè)詞來(lái)切分,以上方法所切分到的詞,當(dāng)在同一篇文檔中的不同句子中累計(jì)出現(xiàn)次數(shù)不少于兩次時(shí),系統(tǒng)會(huì)根據(jù)設(shè)定自動(dòng)或經(jīng)人工確認(rèn)后將其存入一級(jí)詞庫(kù);對(duì)最后的分詞結(jié)果和檢查規(guī)則還可以進(jìn)行人工干預(yù)修改,對(duì)人工干預(yù)形成的新詞根據(jù)詞的特點(diǎn)經(jīng)人工確認(rèn)后分類(lèi)存入一級(jí)詞庫(kù)或二級(jí)詞庫(kù),各級(jí)詞庫(kù)里的詞還可以進(jìn)行人工增刪,且詞庫(kù)里的詞按高頻優(yōu)先分類(lèi)排列在前的原則排列,當(dāng)達(dá)到一定閥值時(shí),經(jīng)人工確認(rèn)系統(tǒng)可以將二級(jí)詞庫(kù)里的詞分類(lèi)提升到一級(jí)詞庫(kù),一級(jí)詞庫(kù)里的詞分類(lèi)下降到二級(jí)詞庫(kù),以上以下將該智能分詞步驟稱(chēng)為分詞模塊;由于本發(fā)明例所用的漢語(yǔ)語(yǔ)音碼的聲調(diào)具有隔音節(jié)作用,這樣即使將組成句子的語(yǔ)音碼的任意多的音節(jié)連寫(xiě)在一起也不會(huì)發(fā)生音節(jié)與音節(jié)之間的相互混淆,借助于聲調(diào)的隔音節(jié)作用,我們?nèi)耘f可以將一個(gè)一個(gè)漢語(yǔ)語(yǔ)音的音節(jié)準(zhǔn)確區(qū)分出來(lái),比如對(duì)上面的漢語(yǔ)語(yǔ)音碼的句子按一個(gè)一個(gè)音節(jié)進(jìn)行區(qū)分,我們可以得到“wov mno huiu xrv ydu hsu yyv Iaa dqa wnv. ”用上面同樣的分詞方法,我們可以將“wovmnohuiuxrvyduhcuyyvlaadqawnv. ”語(yǔ)音碼串分詞切分成簡(jiǎn)拼漢語(yǔ)語(yǔ)音碼為“wovmno huiu xrvydu hcuyyv laadqawnv. ”相應(yīng)的完成分詞切分的《漢語(yǔ)拼音方案》中的漢語(yǔ)拼音文本為iiWomen hui shiyong hanyuladlngwen0相應(yīng)的完成分詞切分的漢語(yǔ)漢字文本為“我們會(huì)使用漢語(yǔ)拉丁文?!毕鄳?yīng)的完成分詞切分的全拼漢語(yǔ)語(yǔ)音碼為“wovmeno huiu shivyongu hanuyyv laadingawenv. ”依次類(lèi)推,這樣我們就可以完成所有漢字文本和與《漢語(yǔ)拼音方案》中的漢語(yǔ)拼音具有一一對(duì)應(yīng)關(guān)系的語(yǔ)音碼在內(nèi)的音節(jié)清楚沒(méi)有發(fā)生混音的各種漢語(yǔ)拼音文本的分詞切分。下面結(jié)合實(shí)施例對(duì)本發(fā)明的具體實(shí)施方式
作進(jìn)一步的說(shuō)明。
本發(fā)明例的一級(jí)詞庫(kù)的特征詞可以吸收如下的特征詞,比如用來(lái)代替人或事物的名稱(chēng)的代詞,例如我們、你們、他們、她們、它們等等;構(gòu)成自身代詞的詞,例如自己、本人、等等;指代事物的詞,例如這個(gè)、那個(gè),這種、那種、這些、那些等等;指代性狀的詞,例如這么、那么(指代副詞)、這樣、那樣、等等;指代時(shí)間的詞,例如這時(shí)、那時(shí)、等等;指代地點(diǎn)的詞,例如這兒、那兒、這里、那里等等;
漢語(yǔ)里的疑問(wèn)代詞,例如什么、什么樣、哪個(gè)、哪些等等;漢語(yǔ)中的不定代詞,例如一些、某些、有的、有些、有人、一切、所有、任何、其它、許
多、各種、各個(gè)、每個(gè)、每種、等等;漢語(yǔ)時(shí)體系統(tǒng)的詞,例如已經(jīng)……了、正在……著、曾經(jīng)……過(guò)、一直……著等等;這里需要說(shuō)明的是對(duì)于類(lèi)似“已經(jīng)……了 ”這樣的形式表示的詞串,在匹配時(shí)是成對(duì)匹配的,也就是說(shuō),找到了前面的“已經(jīng)”不管中間隔了多少字符,要找到“了”才算這個(gè)詞串匹配成功,并按兩個(gè)詞“已經(jīng)”和“了”單獨(dú)標(biāo)識(shí)和切分,這點(diǎn)在本文中均同,不再累述。構(gòu)成被動(dòng)語(yǔ)態(tài)常用句型的詞,例如是……由等等;構(gòu)成漢語(yǔ)謂語(yǔ)動(dòng)詞的虛擬語(yǔ)氣的詞,例如如果……了……早就……了、如果……過(guò)……早就……了、如果……了……就……、萬(wàn)一……了……就……等等;漢語(yǔ)的聯(lián)系動(dòng)詞,例如算作、等于、顯得、變得等等;由“感官動(dòng)詞+起來(lái)”構(gòu)成的聯(lián)系動(dòng)詞,例如看起來(lái)、看上去、聽(tīng)起來(lái)、聽(tīng)上去等等;表示具有某種能力的漢語(yǔ)情態(tài)動(dòng)詞,例如能夠、可以等等;表示可能性、猜測(cè)性、懷疑、不肯定等語(yǔ)氣的詞,例如可能、或許、也許、會(huì)等等;表示允許語(yǔ)氣的的詞,例如可以等等;表示客觀的需要的的詞,例如必須、不得不、應(yīng)該、應(yīng)當(dāng)、需要等等;表不愿意、決心、保證、敢不敢等心理狀態(tài)的常用情態(tài)動(dòng)詞,例如愿意、決心、一定坐坐.
寸寸;表示時(shí)態(tài)的漢語(yǔ)助動(dòng)詞,例如正在、已經(jīng)、曾經(jīng)等等;表示否定的詞,例如沒(méi)有等等;表不肯定語(yǔ)氣的詞,例如的確、確實(shí)等等;漢語(yǔ)的表示時(shí)間的副詞,例如立刻、馬上、頓時(shí)、然后、然后、終于、從來(lái)等等;漢語(yǔ)的表示的地點(diǎn)副詞,例如到處、隨處、隨地、遍地等等;漢語(yǔ)的表示的程度副詞,例如稍微、尤其、更加、非常、等等;漢語(yǔ)的表示的性狀副詞,例如也許、簡(jiǎn)直、偏偏、特地、驀地、樂(lè)于、便于等等;表示副詞比較級(jí)的詞,例如比……更(或比較)等等;表不副詞最聞級(jí)的詞,例如在......中......最......,最最等等;表示時(shí)間、處所、方向的介詞。比如自從、朝著、當(dāng)……時(shí)候等等;表示對(duì)象的介詞,例如對(duì)于等等;表示目的、手段、方式的介詞,例如為了、為著、以便、按照、根據(jù)、本著、等等;
表示排除的介詞,例如除了、除掉、除開(kāi)等等表不原因的介詞,例如由于、因?yàn)榈鹊龋?下面所列的連詞在復(fù)句中可以作為連接各個(gè)從句的關(guān)聯(lián)詞,所表示的從句之間的關(guān)系與該連詞所表示的關(guān)系相同,由于是相同的一組詞,相應(yīng)的從句關(guān)聯(lián)詞下面不在累述)表示漢語(yǔ)并列關(guān)系的連詞,例如一方面……一方面、既……又、不是……而是等等;表示漢語(yǔ)順接關(guān)系的連詞,例如然后、接著、于是等等;表示漢語(yǔ)遞進(jìn)關(guān)系的連詞,例如不但(不僅、不光、不只)……而且、甚至、尤其、不但......反而等等;
表示漢語(yǔ)選擇關(guān)系的連詞,例如或者……或者、不是……就是、要么……要么、與其......不如等等;表示漢語(yǔ)因果關(guān)系的連詞,例如因而、因此、所以、那么等等;表示漢語(yǔ)轉(zhuǎn)折關(guān)系的連詞,例如但是、可是、不過(guò)、然而等等;表示漢語(yǔ)時(shí)間從屬關(guān)系的連詞,例如正當(dāng)……時(shí)、等到……(時(shí))、直到……(時(shí))、等到……以后、(直到)……以前、每當(dāng)……(時(shí))等等;表示漢語(yǔ)原因從屬關(guān)系的連詞,例如因?yàn)椤浴⒂捎凇虼?、既然……就坐?
寸寸;表示漢語(yǔ)目的從屬關(guān)系的連詞,例如為了、以便、借以、以免、好讓等等;表示漢語(yǔ)結(jié)果從屬關(guān)系的連詞,例如以致、結(jié)果、導(dǎo)致等等;表示漢語(yǔ)假設(shè)從屬關(guān)系的連詞,例如如果……就、假如……那么、即使……也、哪怕......也等等;表示漢語(yǔ)條件從屬關(guān)系的連詞,例如只有……才、只要……就、除非……不、無(wú)論……都、不管……也(總)、無(wú)論……總等等;表示漢語(yǔ)讓步從屬關(guān)系的連詞,例如雖然……但是(可是、卻、不過(guò)、然而)、盡
管......可是等等;表示漢語(yǔ)方式從屬關(guān)系的連詞,例如好似……一般、好象……一樣、象……似的坐坐.
寸寸;表示漢語(yǔ)比較從屬關(guān)系的連詞,例如勝過(guò)、不如、真如、和……一樣,越……越等等;表示漢語(yǔ)地點(diǎn)從屬關(guān)系的連詞,例如哪里……哪里等等;指特定的人、事物、地點(diǎn)或機(jī)構(gòu)所專(zhuān)有的名稱(chēng)的專(zhuān)有名詞,例如毛澤東、上海、國(guó)務(wù)院等等;漢語(yǔ)用于表示分?jǐn)?shù)的詞,例如……分之……等等;漢語(yǔ)用于表示小數(shù)的詞,例如零點(diǎn)零……等等;漢語(yǔ)表示概數(shù)的詞,例如“左右”等等;漢語(yǔ)中用于表示次序的序數(shù)詞,例如“第……號(hào)”等等;漢語(yǔ)中的復(fù)合量詞,例如架次、人次、千米、小時(shí)、千瓦小時(shí)等等;漢語(yǔ)感嘆詞,例如哎呀、哎喲嘿嘿、哈哈、等等。一般后面跟有標(biāo)點(diǎn)符號(hào)。
漢語(yǔ)單純擬聲詞,例如嗷嗷、吧嗒、刺溜、咯吧、咯吱、咯咯、咕咚、咕嘟、咕隆、呱呱、呱嗒、嘩啦、嘩啦啦、撲通、撲騰、撲味、叮當(dāng)、叮鈴、當(dāng)啷、轟隆、霍霍、瑯瑯、潺潺淙淙、颯颯、瑟瑟、沙沙、嗚嗚、當(dāng)當(dāng)、翁嗡、哇哇、哇啦、咯嚓、眶啷、梆梆梆、咚咚咚、哼兒哈兒、咿咿唔唔、咿咿呀呀、噼噼啪啪、唧唧喳喳,等等。一般后面跟“的"地” “一聲”等詞。表示陳述語(yǔ)氣的語(yǔ)氣詞,例如著呢、嘛、罷了、而已、也罷等等。后面一般有逗號(hào)“,”或句號(hào)“?!北硎緷h語(yǔ)形容詞比較級(jí)詞,例如更……的、比較……的、……一點(diǎn)、……一些、
比……更……一些等等;最聞級(jí)最......的......之一、......極了等等;表示相同和……一樣……等等; 表示倍數(shù)比......高......倍、比......多......倍、比......好......倍等等;表示一方程度比另一方高時(shí)比……更……一些(一點(diǎn))、比……更……一點(diǎn)等等;當(dāng)不需要或不必說(shuō)出比較對(duì)象時(shí),采用的比較級(jí)形容詞,例如比較……等等;前后綴例如可.......注、易.......注、等等;漢語(yǔ)中引起倒裝的常用介詞,例如連……都、連……也、對(duì)于……、把……等等;強(qiáng)調(diào)賓語(yǔ)把詞型的句子的介詞,例如把……給等等;將主要表征漢語(yǔ)成語(yǔ)的四字詞、所有的單音詞、形容詞、動(dòng)詞、未列入一級(jí)詞庫(kù)的其它名詞和副詞分類(lèi)列入二級(jí)詞庫(kù),這些詞具有常用、固定但量大的特點(diǎn)。比如偉大、光榮、工作、打獵、看見(jiàn)、學(xué)生、老師、非常、的、地、得、在、年、月、日、一、二、1、2等等,除去已經(jīng)列入一級(jí)詞庫(kù)的詞,整個(gè)最新《漢語(yǔ)大詞典》中的詞都可以存入該詞庫(kù),同時(shí)對(duì)漢語(yǔ)形容詞、數(shù)量詞、動(dòng)詞等的活用形式的組詞規(guī)律在二級(jí)詞庫(kù)中要予以標(biāo)識(shí)并將能列出的活用詞形盡可能列出,以提高二級(jí)詞庫(kù)分詞的準(zhǔn)確性。比如形容活用“A+于”轉(zhuǎn)化為“A+于”形式的副詞,A代表形容詞意義的單音節(jié)詞比如“勇、樂(lè)+于”分別形成“勇于”和“樂(lè)于”兩個(gè)副詞等等;也就是說(shuō)遇到這類(lèi)詞的匹配,“于”相當(dāng)于一個(gè)后綴,當(dāng)前面有一個(gè)形容詞意義的單音節(jié)未匹配詞,就可以將其吸納和“于”構(gòu)成為一個(gè)詞。形容詞意義的單音節(jié)A重疊可以轉(zhuǎn)化為AA形式的副詞。比如“快的”(形容詞)、“白的”(形容詞)分別轉(zhuǎn)換成“快快地”(副詞)、“白白地”(副詞)。此外漢語(yǔ)形容詞與切詞有關(guān)的還有重疊式活用形式。重疊式主要有AA、ABB、AABB、等幾種形式。其中AA式用于單音形容詞的重疊,他們重疊后表示程度加深,比如長(zhǎng)的、高的、白的、胖的,重疊后分別變成長(zhǎng)長(zhǎng)的、高高的、白白的、胖胖的。其中第二個(gè)音節(jié)念陰平。經(jīng)過(guò)AA式重疊后漢語(yǔ)形容詞的形容程度都較原來(lái)程度深一些。ABB式重疊比如亮堂、明晃;重疊后分別變成亮堂堂、明晃晃。AABB式重疊比如干凈、甜蜜、恩愛(ài);重疊后分別變成干干凈凈、甜甜蜜蜜、恩恩愛(ài)愛(ài)。經(jīng)過(guò)以上各式重疊后漢語(yǔ)形容詞的形容程度都較原來(lái)程度加深一些。數(shù)量詞活用漢語(yǔ)數(shù)量詞和量詞可以重疊使用,重疊后的數(shù)量詞具有“每一"許多”之意。比如量詞AA式重疊樣樣、條條、遍遍、趟趟等等;再比如數(shù)量詞ABB式重疊一群群、一個(gè)個(gè)、一排排等等。動(dòng)詞的活用單音節(jié)動(dòng)詞轉(zhuǎn)化成副詞的詞,例如“A著A著”、“A啊A啊”A表示單音節(jié)動(dòng)詞如“哭”哭著哭著、哭啊哭啊。起加重語(yǔ)氣作用重疊式動(dòng)詞ABB式,比如“幫忙”變成“幫幫忙”。也就是說(shuō)上面相當(dāng)一部分活用形是AA式、ABB式、AABB式,利用這些規(guī)律如果遇到“AA”式、“ABB”式、“AABB”式的詞可以切分成“AA”、“ABB”、“AABB”形式的詞。如果遇到“A著A著”、“A啊A啊”形式的也可以將“A著A著”、“A啊A啊”分別切成一個(gè)詞,其實(shí)上面的活用形還有ABAB式,對(duì)于這種形式還是按AB形式切分成兩個(gè)詞,所以從分詞角度來(lái)說(shuō)對(duì)活用形ABAB式在這里不作進(jìn)一步的討論。將漢語(yǔ)的構(gòu)詞法的前綴、中綴、后綴、詞根列入三級(jí)詞庫(kù)。這類(lèi)前綴、中綴、后綴組詞能力強(qiáng),一般前面詞庫(kù)分詞無(wú)效后,采用該詞庫(kù)里的“詞綴”和“詞根”進(jìn)行分詞判別。比如前綴小……、老……、阿……,比如后綴……者、……子、……兒,比如中綴…… 不……、……里……、……七八……、……三……四,一般中綴構(gòu)成成語(yǔ)。比如詞根“機(jī)”和“街”,可以分別組成機(jī)床、趁機(jī)、飛機(jī)場(chǎng)、街道、當(dāng)街、丁字街等等,一般詞根既可以放在前面構(gòu)成詞,也可以放在后面構(gòu)成詞,除了構(gòu)成四字詞的成語(yǔ)外,詞根最多構(gòu)成的是兩字詞少數(shù)是三字詞,五字詞基本沒(méi)有這里我們可以不考慮。三級(jí)詞庫(kù)中共收錄了中國(guó)人民大學(xué)語(yǔ)言文字研究所1984年3月出版的《常用構(gòu)詞字典》中所列的近4000個(gè)可以作為詞根的漢字。隨著語(yǔ)言的發(fā)展,根據(jù)需要也可以增加沒(méi)有被列入三級(jí)詞庫(kù)的詞根。運(yùn)用上面的詞庫(kù)和方法分詞如下原句我已經(jīng)告訴你們了,古蘭丹牡是公主墳王爺?shù)膶氊惻畠?,如果你們不趕緊把古蘭丹牡尋找回來(lái),我就找你們算賬!找到以后趕緊向王爺他本人報(bào)告。運(yùn)用一級(jí)詞庫(kù)分詞結(jié)果
我己麥告訴你們飛,古蘭丹牡是公主墳王爺?shù)膶氊惻畠海绻銈儾悔s緊把古蘭丹牡尋找回來(lái),我就找你們算賬!找到以后趕緊向王爺他本乂報(bào)告。運(yùn)用二級(jí)詞庫(kù)分詞結(jié)果
我已經(jīng)告訴你們7,古蘭丹牡是公主玟王爺?shù)膶氊惻畠?'如果你們不致緊把古蘭丹牡尋找回來(lái),我栽找你們算賬\找到以后趕緊向王爺他本人報(bào)
口 O(假設(shè)“趕緊”沒(méi)有列入二級(jí)詞庫(kù))運(yùn)用三級(jí)詞庫(kù)分詞結(jié)果
我已經(jīng)告訴你們了、古蘭丹牡是公主墳王爺?shù)膶氊惻畠?,如果你們不趕紫把古蘭丹牡尋找回來(lái),我就找你們算賬\找到以后趕緊向王爺他本人
報(bào)告。(從三級(jí)詞庫(kù)中找到“趕”是一個(gè)詞根,它后面有一個(gè)未匹配成功的孤立字“緊”,于是
“趕”與后面的“緊”組成一個(gè)“趕緊”兩字詞。又由于“趕緊”在同一文本不同的句子中至
少出現(xiàn)了兩次,因此、分詞系統(tǒng)自動(dòng)將“趕緊”保存到二級(jí)詞庫(kù),下次在二級(jí)詞庫(kù)分詞時(shí)就直接將其匹配成功并切分)運(yùn)用分詞檢查規(guī)則檢查后的分詞結(jié)果
我已經(jīng)告訴你們了,古蘭丹牡是公主墳王爺?shù)膶氊惻畠?如果你們不趕緊把古蘭丹牡尋找回來(lái),我就找你們算賬\找到以后趕緊向王爺他本人報(bào)
告。.(“古蘭丹牡”是一個(gè)連續(xù)孤立未匹配成功的漢字,根據(jù)檢查規(guī)則將其作為一個(gè)漢 字串合并成一個(gè)詞進(jìn)行切分,由于這串連續(xù)孤立未匹配成功的字符,在同一文本不同的句子中至少出現(xiàn)了兩次,因此、分詞系統(tǒng)自動(dòng)將“古蘭丹牡”保存到一級(jí)詞庫(kù),下次在一級(jí)詞庫(kù)分詞時(shí)就可以直接將其匹配成功并切分)最后進(jìn)行人工干預(yù)后的分詞結(jié)果
我已經(jīng)告訴你們了、古蘭丹牡是公主墳王爺?shù)膶氊惻畠?如果你們不趕M把古蘭丹牡尋找回來(lái),我就找你們算賬!找到以后BM向王爺他本人報(bào)
ο(由于“公主墳”是一個(gè)地名,因此不能切分成“公主墳”,經(jīng)過(guò)人工干預(yù)成為一個(gè)專(zhuān)有名詞,系統(tǒng)會(huì)檢測(cè)到這個(gè)人工干預(yù)的結(jié)果,根據(jù)這個(gè)詞的性質(zhì)屬于專(zhuān)用名詞經(jīng)人工確認(rèn)后系統(tǒng)會(huì)自動(dòng)將其存入一級(jí)詞庫(kù),下次在一級(jí)詞庫(kù)分詞時(shí)就直接將其匹配成功并切分。)全部切分完后系統(tǒng)消除句子中的匹配成功的標(biāo)識(shí),字體還原到正常格式我已經(jīng)告訴你們了,古蘭丹牡是公主墳王爺?shù)膶氊惻畠海绻銈儾悔s緊把古蘭丹牡尋找回來(lái),我就找你們算賬!找到以后趕緊向王爺他本人報(bào)告。這樣就得到了我們所需要的分詞結(jié)果。經(jīng)過(guò)上面的句子切分過(guò)程的實(shí)踐,我們?cè)賮?lái)對(duì)下面的句子進(jìn)行切分原句經(jīng)過(guò)他們的艱苦努力尋找,終于在1936年4月8日下午5點(diǎn)左右,他們?cè)谛陆疄豸斈君R找到了古蘭丹牡,于是趕緊派人到公主墳向王爺報(bào)告。運(yùn)用一級(jí)詞庫(kù)分詞結(jié)果
經(jīng)過(guò)他們的艱苦努力尋找 '終于在1936年4月8日下午5點(diǎn)左右細(xì)在新U烏魯木齊找到了古蘭丹牡,于是趕緊派人到公主墳向王爺報(bào)告。(“古蘭丹牡”和“公主墳”由于在上次切分后被存入一級(jí)詞庫(kù),這次在一級(jí)詞庫(kù)就切分成功)運(yùn)用二級(jí)詞庫(kù)分詞結(jié)果
經(jīng)過(guò)他們的艱苦努力尋找、終于在1936年4月8日下午5點(diǎn)左右 ' 他們?cè)谛陆疄醪湍君R找到7古蘭丹牡,于是趕紫派人M公主墳向王爺報(bào)告。(由于“趕緊”在上次切分后被存入二級(jí)詞庫(kù),這次在二級(jí)詞庫(kù)就切分成功,有阿拉伯?dāng)?shù)字的地方系統(tǒng)不會(huì)將其與漢字字符合并)所有的切分出來(lái)的詞都已經(jīng)作了標(biāo)識(shí)在這里比如是字體傾斜,表明在二級(jí)詞庫(kù)分詞階段系統(tǒng)就完成了匹配分詞過(guò)程,比上一次減少了分詞步驟,證明本方法具有自動(dòng)完善分詞方法的功能。全部切分完后系統(tǒng)消除句子中的匹配成功的標(biāo)識(shí),字體還原到正常格式,我們得到最后的分詞結(jié)果為經(jīng)過(guò)他們的艱苦努力尋找,終于在1936年4月8日下午5點(diǎn)左右,他們?cè)谛陆疄豸斈君R找到了古蘭丹牡,于是趕緊派人到公主墳向王爺報(bào)告。依次類(lèi)推,通過(guò)不斷豐富和根據(jù)頻度調(diào)整各級(jí)詞庫(kù)的單詞以及完善分詞結(jié)果檢查規(guī)則,再經(jīng)過(guò)實(shí)踐中的不斷磨合,分詞系統(tǒng)會(huì)越來(lái)越人性化智能化地進(jìn)行分詞。由于《漢語(yǔ)拼音方案》中的漢語(yǔ)拼音與以詞為單位的漢字具有對(duì)應(yīng)關(guān)系,因此在該漢語(yǔ)拼音文本中的漢語(yǔ)拼音音節(jié)本身標(biāo)注清楚沒(méi)有產(chǎn)生混音的情況下,上面對(duì)漢字文本分 詞切分的方法同樣適用于對(duì)《漢語(yǔ)拼音方案》中的漢語(yǔ)拼音文本的分詞切分,所要增加的工作主要是對(duì)應(yīng)各級(jí)詞庫(kù)的漢字組成的詞或詞綴加上相應(yīng)的《漢語(yǔ)拼音方案》中的漢語(yǔ)拼音便可。比如用漢字表達(dá)的原句為“我們會(huì)使用漢語(yǔ)拉丁文。”相應(yīng)的《漢語(yǔ)拼音方案》中的漢語(yǔ)拼音文本為^ffomenhuishiyonghanyuladlngwen ”用上述分詞方法我們可以將漢字原句分詞切分成“我們會(huì)使用漢語(yǔ)拉丁
文。”用同樣的方法我們可以將上述漢語(yǔ)拼音文本原句分詞切分成iiWomen hui shiyong hanyu IadIngwen0同理對(duì)與《漢語(yǔ)拼音方案》中的漢語(yǔ)拼音具有一一對(duì)應(yīng)關(guān)系的任何文本比如全拼和簡(jiǎn)拼的漢語(yǔ)語(yǔ)音碼,只要滿足在分詞切分前,該漢語(yǔ)拼音文本中的漢語(yǔ)拼音音節(jié)本身標(biāo)注清楚沒(méi)有產(chǎn)生混音,我們就能用上面的方法對(duì)該具有對(duì)應(yīng)關(guān)系的漢語(yǔ)拼音文本進(jìn)行分詞切分,所要增加的工作是對(duì)應(yīng)各級(jí)詞庫(kù)的漢字組成的詞或詞綴加上相應(yīng)的與《漢語(yǔ)拼音方案》中的漢語(yǔ)拼音具有一一對(duì)應(yīng)關(guān)系的編碼便可。比如對(duì)上述句子對(duì)應(yīng)的全拼漢語(yǔ)語(yǔ)音碼和簡(jiǎn)拼的漢語(yǔ)語(yǔ)音碼的按詞切分,這里不再累述。(四)漢字或漢語(yǔ)拼音轉(zhuǎn)換成漢語(yǔ)語(yǔ)音碼及漢語(yǔ)語(yǔ)音碼全拼與簡(jiǎn)拼之間的雙向轉(zhuǎn)化采用以下步驟和方法在漢字或漢語(yǔ)拼音轉(zhuǎn)換成漢語(yǔ)語(yǔ)音碼時(shí),漢字先轉(zhuǎn)換成漢語(yǔ)拼音,遇異音同形字時(shí)將可能的漢語(yǔ)拼音全部列出,漢語(yǔ)拼音則無(wú)須先轉(zhuǎn)換,然后再根據(jù)碼表先轉(zhuǎn)換成相應(yīng)的漢語(yǔ)音節(jié)語(yǔ)音碼串,然后在調(diào)用預(yù)先儲(chǔ)存在計(jì)算機(jī)系統(tǒng)中的分詞模塊再進(jìn)行按詞切分;對(duì)已經(jīng)分過(guò)詞的漢字和漢語(yǔ)拼音轉(zhuǎn)換成漢語(yǔ)語(yǔ)音碼后則不必再進(jìn)行單詞切分,仍以原來(lái)的單詞為單位進(jìn)行轉(zhuǎn)換;當(dāng)漢語(yǔ)語(yǔ)音碼需要轉(zhuǎn)換成漢語(yǔ)拼音時(shí),既可以采用查預(yù)先儲(chǔ)存在計(jì)算機(jī)系統(tǒng)中的碼表,也可以查通過(guò)該碼表生成的以音節(jié)或詞為單位的漢語(yǔ)語(yǔ)音碼與以音節(jié)或詞為單位的漢語(yǔ)拼音對(duì)照表,匹配后輸出相應(yīng)的漢語(yǔ)拼音;當(dāng)漢語(yǔ)語(yǔ)音碼需要轉(zhuǎn)換成漢字時(shí),既可以先轉(zhuǎn)換成以詞為單位的漢語(yǔ)拼音再轉(zhuǎn)換成以詞為單位的漢字,也可以直接采用查預(yù)先儲(chǔ)存在計(jì)算機(jī)系統(tǒng)中的語(yǔ)音碼與以詞為單位的漢字對(duì)照表、匹配后輸出相應(yīng)的漢字;
遇同音詞時(shí),先依據(jù)漢語(yǔ)詞法句法上下文聯(lián)系及統(tǒng)計(jì)規(guī)律等手段進(jìn)行判別,判別后再進(jìn)行以詞為單位的漢字選定;當(dāng)需要將全拼的漢語(yǔ)語(yǔ)音碼轉(zhuǎn)換成簡(jiǎn)拼的漢語(yǔ)語(yǔ)音碼時(shí),通過(guò)查預(yù)先存儲(chǔ)在計(jì)算機(jī)中的碼表,將全拼的漢語(yǔ)語(yǔ)音碼的聲母、介母、韻母換成簡(jiǎn)拼的漢語(yǔ)語(yǔ)音碼的聲碼、介碼和韻碼,調(diào)碼保持不變,或調(diào)碼用阿拉伯?dāng)?shù)字或一個(gè)拉丁字母表示;反之當(dāng)需要將簡(jiǎn)拼的漢語(yǔ)語(yǔ)音碼轉(zhuǎn)換成全拼的漢語(yǔ)語(yǔ)音碼時(shí),通過(guò)查預(yù)先存儲(chǔ)在計(jì)算機(jī)中的碼表,將簡(jiǎn)拼的漢語(yǔ)語(yǔ)音碼的聲碼、介碼和韻碼換成全拼的與漢語(yǔ)拼音相同的漢語(yǔ)語(yǔ)音碼的聲母、介母、韻母,調(diào)碼則保持不變,或用阿拉伯?dāng)?shù)字或一個(gè)拉丁字母表示;當(dāng)需要僅將漢語(yǔ)語(yǔ)音碼的調(diào)碼進(jìn)行阿拉伯?dāng)?shù)字表示的調(diào)碼和拉丁字母表示的調(diào)碼之間進(jìn)行雙向轉(zhuǎn)換時(shí),根據(jù)碼表將阿拉伯?dāng)?shù)字表示的調(diào)碼轉(zhuǎn)換成拉丁字母表示的調(diào)碼或根據(jù)碼表將拉丁字母表示的調(diào)碼轉(zhuǎn)換成阿拉伯?dāng)?shù)字表示的調(diào)碼便可,其它全拼漢語(yǔ)語(yǔ)音碼的聲母、介母、韻母和簡(jiǎn)拼漢語(yǔ)語(yǔ)音碼的聲碼、介碼和韻碼則保持不變;
在漢語(yǔ)語(yǔ)音碼轉(zhuǎn)換成漢字和漢語(yǔ)拼音時(shí),其標(biāo)點(diǎn)符號(hào)也從與英文相同的狀態(tài)轉(zhuǎn)變?yōu)橄鄳?yīng)的中文標(biāo)點(diǎn)符號(hào)狀態(tài),以上以下將該步驟的方法稱(chēng)為漢字漢語(yǔ)拼音與漢語(yǔ)語(yǔ)音碼雙向轉(zhuǎn)換模塊。下面例舉一些用本發(fā)明方法對(duì)以詞為單位的漢字漢語(yǔ)拼音進(jìn)行雙向轉(zhuǎn)換時(shí)的例子I、漢字和漢語(yǔ)拼音轉(zhuǎn)換成漢語(yǔ)語(yǔ)音碼(I)對(duì)漢字首先將漢字通過(guò)查表的方式轉(zhuǎn)換成對(duì)應(yīng)的漢語(yǔ)拼音比如我們會(huì)使用漢語(yǔ)拉丁文。轉(zhuǎn)換成拼音后成為women hui shiyong han yu la ding wen。(2)對(duì)由漢字轉(zhuǎn)換過(guò)來(lái)的或原有的漢語(yǔ)拼音則通過(guò)以上漢語(yǔ)拼音和語(yǔ)音碼碼表對(duì)照表將漢語(yǔ)拼音轉(zhuǎn)換成如下漢語(yǔ)語(yǔ)音碼串。wov mno huiu xrv ydu hsu yyv Iaa dqa wnv.(音節(jié)和音節(jié)之間用空格隔開(kāi))或woxmnghuigxrxydyjicgyyxlaadqawnx.(音節(jié)和音節(jié)之間不用空格隔開(kāi))(熟練后mno中的輕音符ο在不引起混音時(shí)可以省略,以上以下均同。)為了讓大家看清楚,這里將表示聲調(diào)的字母加了下劃線,語(yǔ)音碼中的聲調(diào)字母同時(shí)具隔音節(jié)作用,實(shí)際語(yǔ)音碼中聲調(diào)無(wú)下劃線,熟練語(yǔ)音碼后,聲調(diào)兼隔音節(jié)符能夠方便區(qū)分出來(lái)。(3)將語(yǔ)音碼串進(jìn)行分詞切割,最終完成語(yǔ)音碼轉(zhuǎn)換。通過(guò)查找預(yù)先分好詞的漢語(yǔ)語(yǔ)音碼單詞詞庫(kù),將同一個(gè)單詞的多個(gè)音節(jié)連寫(xiě),詞與詞之間用空格隔開(kāi)便得到以下我們最終需要的漢語(yǔ)語(yǔ)音碼wovmno huiu xrvydu hcuyyv laadqawnv.2、漢語(yǔ)語(yǔ)音碼轉(zhuǎn)換成漢字和漢語(yǔ)拼音通過(guò)分別查找漢語(yǔ)語(yǔ)音碼與以詞為單位的漢字和漢語(yǔ)拼音對(duì)照表可以方便地將漢語(yǔ)語(yǔ)音碼轉(zhuǎn)換成漢字和漢語(yǔ)拼音,比如wovmno通過(guò)查聲碼、介碼、韻碼、調(diào)碼和漢語(yǔ)拼音對(duì)照表或根據(jù)該對(duì)照表生成的漢語(yǔ)語(yǔ)音碼音節(jié)或單詞和拼音音節(jié)或單詞對(duì)照表得到w0men,再通過(guò)w0men查找到以詞為單位的漢字,當(dāng)以單詞為單位的語(yǔ)音碼通過(guò)以單詞為單位的漢語(yǔ)拼音與以單詞為單位的漢字建立對(duì)應(yīng)關(guān)系后,一且需要以單詞為單位的語(yǔ)音碼可以不再需要通過(guò)以單詞為單位的漢語(yǔ)拼音,直接與以單詞為單位的漢字建立對(duì)應(yīng)關(guān)系并實(shí)行相應(yīng)的轉(zhuǎn)換。比如=Wovmno可以轉(zhuǎn)換為wdmen,再通過(guò)wdmen可以轉(zhuǎn)換成“我們”,這樣wovmno和“我們”便直接建立了對(duì)應(yīng)關(guān)系,需要時(shí)可以不通過(guò)漢語(yǔ)拼音wdmen進(jìn)行轉(zhuǎn)換,而直接在wovmno和“我們”之間實(shí)現(xiàn)雙向可逆轉(zhuǎn)換。遇同音詞時(shí),可以依據(jù)漢語(yǔ)詞法句法上下文聯(lián)系及統(tǒng)計(jì)規(guī)律等手段進(jìn)行判別后進(jìn)行以詞為單位的漢字選定。比如ysvlune上裝滿了郵包。ysvlune上裝滿了原油。結(jié)合上下文的聯(lián)系可以知道前面一句中的“ysvlune”代表郵輪,后面一句中的“ysvlune”代表油輪,這兩句話分別會(huì)轉(zhuǎn)換成“郵輪上裝滿了郵包”和“油輪上裝滿了原油”。對(duì)其它單詞情況也依次類(lèi)推。上述雙向可逆轉(zhuǎn)換的結(jié)果既可以單獨(dú)顯示也可以對(duì)照顯示,比如原句“我們會(huì)使用漢語(yǔ)拉丁文?!庇帽景l(fā)明方法計(jì)算機(jī)可以可逆地轉(zhuǎn)換為以下幾種形式
1.11Women hui shiyong hanyu IadTngwen 0M
2.wWovmno huiu xrvydu hcuyyv laadqawnv."
3."wovmeno huiu shivyongu hanuyyv laadingawenv.”
4.KW6menhui shiyonghanyu IadTngwen0"
我們會(huì) 使用漢語(yǔ)拉丁文。
5.‘*wovmnohuiu xrvydu hcuyyv laadqawnv."
我們會(huì) 使用漢語(yǔ)拉丁文。
6.'Women hui shiyonghanyu IadTngwen0"
"wovmnohuiu xrvyduhcuyyv laadqawnv.”等等。為了讓外國(guó)人或中國(guó)少數(shù)民族更方面地了解漢語(yǔ)的含義和學(xué)習(xí)漢語(yǔ),也可以在每個(gè)對(duì)照的單詞中插入相應(yīng)的外語(yǔ)單詞或少數(shù)民族文字,比如在下面的單詞中加入相應(yīng)的英語(yǔ)單詞作中文意思的注解“wovmno Women huiu hui xrvydu shiyong hcuyyv hanyulaadqawnv IadIngwen0,,我們We 會(huì) can 使用 use 漢語(yǔ) Chinese 拉丁文 Latine。依次類(lèi)推,用上述方法,可以對(duì)所有的任意多音節(jié)的以詞為單位的漢字漢語(yǔ)拼音與漢語(yǔ)語(yǔ)音碼之間進(jìn)行雙向可逆轉(zhuǎn)換,并根據(jù)需要單獨(dú)或?qū)φ诊@示,以這些漢語(yǔ)單詞為基礎(chǔ),就可以實(shí)現(xiàn)任何以詞為單位的漢字和漢語(yǔ)拼音與全拼和簡(jiǎn)拼漢語(yǔ)語(yǔ)音碼之間的雙向可逆轉(zhuǎn)換,從而方便進(jìn)行各種漢字、漢語(yǔ)信息處理。對(duì)簡(jiǎn)拼漢語(yǔ)語(yǔ)音碼“wovmno huiu xrvydu hcuyyv laadqawnv. ”通過(guò)查碼表可以轉(zhuǎn)換成下列幾種全拼形式
I. wovmeno huiu shivyongu hanuyyv laadingawenv.聲調(diào)字母化全拼2. wo3men5 hui4 shi3yong4 han4yy3 laldinglwen3.聲調(diào)數(shù)字化全拼3. wovmeno huiu shivydu hanuyyv laadqawenv.聲調(diào)字母化混拼等等。 (五)漢語(yǔ)語(yǔ)音碼與漢語(yǔ)語(yǔ)音雙向轉(zhuǎn)換的步驟和方法I.漢語(yǔ)語(yǔ)音碼轉(zhuǎn)換成漢語(yǔ)語(yǔ)音的步驟和方法當(dāng)漢語(yǔ)語(yǔ)音碼轉(zhuǎn)換成漢語(yǔ)語(yǔ)音時(shí),可以分別采用查漢語(yǔ)語(yǔ)音碼中的漢語(yǔ)音節(jié)與漢語(yǔ)音節(jié)語(yǔ)音合成文件對(duì)照表、以詞為單位的漢語(yǔ)語(yǔ)音碼與漢語(yǔ)單詞語(yǔ)音合成文件對(duì)照表,還可以通過(guò)最大匹配法,采用查以最大語(yǔ)段為單位的漢語(yǔ)語(yǔ)音碼串和漢語(yǔ)語(yǔ)段語(yǔ)音合成文件對(duì)照表輸出相應(yīng)的漢語(yǔ)語(yǔ)音,當(dāng)將上述漢語(yǔ)語(yǔ)音碼或漢語(yǔ)語(yǔ)音碼串所分別對(duì)應(yīng)的音節(jié)、單詞或語(yǔ)段的語(yǔ)音合成文件分別換成漢語(yǔ)特定人、中國(guó)方言、少數(shù)民族語(yǔ)言的語(yǔ)音合成文件時(shí),通過(guò)查漢語(yǔ)語(yǔ)音碼或漢語(yǔ)語(yǔ)音碼串與相應(yīng)音節(jié)、單詞或語(yǔ)段的語(yǔ)音合成文件對(duì)照表,可以分別輸出相應(yīng)的漢語(yǔ)特定人、中國(guó)方言、少數(shù)民族語(yǔ)言的語(yǔ)音,當(dāng)合成外語(yǔ)語(yǔ)音時(shí),要進(jìn)行查以詞、詞組或短語(yǔ)為單位的漢語(yǔ)語(yǔ)音碼和相應(yīng)外語(yǔ)單詞、外語(yǔ)詞組或外語(yǔ)短語(yǔ)語(yǔ)音合成文件對(duì)照表輸出相應(yīng)的外語(yǔ)單詞、外語(yǔ)詞組或外語(yǔ)短語(yǔ)的語(yǔ)音,對(duì)需要輸入漢語(yǔ)每一個(gè)音節(jié)的聲母、介母、韻母和聲調(diào)信息才能進(jìn)行漢語(yǔ)語(yǔ)音合成的系統(tǒng),可以根據(jù)碼表將漢語(yǔ)語(yǔ)音碼轉(zhuǎn)換成漢語(yǔ)拼音聲母、介母、韻母和聲調(diào)的信息后,再輸入到漢語(yǔ)語(yǔ)音合成系統(tǒng)中進(jìn)行漢語(yǔ)語(yǔ)音合成,當(dāng)對(duì)漢語(yǔ)語(yǔ)音碼文章中的標(biāo)點(diǎn)符號(hào)和移行號(hào)進(jìn)行語(yǔ)音合成時(shí),我們只要將相應(yīng)的預(yù)先儲(chǔ)存在計(jì)算機(jī)中的漢語(yǔ)的六種點(diǎn)號(hào)七種標(biāo)號(hào)和一個(gè)移行號(hào)的聲音文件提取出來(lái),用聲音播放軟件進(jìn)行播放便可。當(dāng)輸入的是用漢字或漢語(yǔ)拼音表達(dá)的漢語(yǔ)信息時(shí),漢字或漢語(yǔ)拼音可以通過(guò)預(yù)先儲(chǔ)存在計(jì)算機(jī)系統(tǒng)中的漢字漢語(yǔ)拼音與漢語(yǔ)語(yǔ)音碼雙向轉(zhuǎn)換模塊,先轉(zhuǎn)換成全拼或簡(jiǎn)拼漢語(yǔ)語(yǔ)音碼再進(jìn)行上述漢語(yǔ)、漢語(yǔ)特定人、中國(guó)方言、少數(shù)民族語(yǔ)言、外語(yǔ)單詞、外語(yǔ)詞組或外語(yǔ)短語(yǔ)的語(yǔ)音轉(zhuǎn)換,以上以下將該步驟方法稱(chēng)為語(yǔ)音碼語(yǔ)音合成模塊,下面例舉一些用本發(fā)明方法將漢語(yǔ)語(yǔ)音碼轉(zhuǎn)換成語(yǔ)音的例子t匕如wovmno huiu xrvydu hcuyyv laadqawnv.它是漢語(yǔ)語(yǔ)音碼所表達(dá)的漢語(yǔ)信息,其意義用漢字表達(dá)為“我們會(huì)使用漢語(yǔ)拉丁文?!?I)通過(guò)查漢語(yǔ)語(yǔ)音碼和音節(jié)漢語(yǔ)語(yǔ)音合成文件對(duì)照表進(jìn)行語(yǔ)音合成的方法查漢語(yǔ)語(yǔ)音碼和音節(jié)漢語(yǔ)語(yǔ)音合成文件對(duì)照表后得到與語(yǔ)音碼對(duì)應(yīng)的漢語(yǔ)語(yǔ)音的聲音文件(為表述方便該聲音文件用“相對(duì)應(yīng)的音節(jié)漢語(yǔ)拼音.wav”表示,實(shí)際情況中是沒(méi)有漢語(yǔ)拼音符號(hào)的,它只是預(yù)先儲(chǔ)存在計(jì)算機(jī)中,可以通過(guò)一定的聲音播放軟件播放的表示相應(yīng)音節(jié)漢語(yǔ)語(yǔ)音的聲音文件)wov (wo. wav) mno (men. wav) huiu (hui. wav) xrv (shi. wav) ydu (yong. wav)hsu (han. wav) yyv (yu. wav) Iaa (la. wav) dqa (dlng. wav) wnv (wen. wav).對(duì)查找到的代表該音節(jié)漢語(yǔ)語(yǔ)音的相應(yīng)的聲音文件用聲音播放軟件依次順序播出,詞與詞之間采用比同一單詞音節(jié)之間更長(zhǎng)的時(shí)間間隔來(lái)依次連續(xù)播出,這樣會(huì)聽(tīng)起來(lái)更接近按詞朗讀的效果,更符合人們聽(tīng)語(yǔ)音的習(xí)慣。(2)通過(guò)查漢語(yǔ)單詞語(yǔ)音碼和單詞漢語(yǔ)語(yǔ)音合成文件對(duì)照表進(jìn)行語(yǔ)音合成的方法:查漢語(yǔ)單詞語(yǔ)音碼和單詞語(yǔ)音合成文件對(duì)照表后得到預(yù)先儲(chǔ)存在計(jì)算機(jī)中的與單詞語(yǔ)音碼對(duì)應(yīng)的以單詞為單位的漢語(yǔ)語(yǔ)音的聲音文件(為表述方便該以單詞為單位的漢語(yǔ)聲音文件用“相對(duì)應(yīng)的以單詞為單位的漢語(yǔ)拼音.wav”表示,實(shí)際情況是沒(méi)有漢語(yǔ)拼音符號(hào)的,它只是預(yù)先儲(chǔ)存在計(jì)算機(jī)中,可以通過(guò)一定的聲音播放軟件播放的表示相應(yīng)以單詞為單位的漢語(yǔ)語(yǔ)音的聲音文件)wovmno (women, wav) huiu (hui. wav) xrvydu (shi yong. wav) hcuyyv (hanyu. wav)laadqawnv(lad!ngwen. wav).對(duì)查找到的以單詞為單位代表該漢語(yǔ)語(yǔ)音的相應(yīng)的聲音文件用聲音播放軟件依次順序播出,詞與詞之間采用比同一單詞音節(jié)之間更長(zhǎng)的時(shí)間間隔來(lái)依次連續(xù)播出,這樣會(huì)聽(tīng)起來(lái)更接近按詞朗讀的效果,更符合人們聽(tīng)語(yǔ)音的習(xí)慣。(3)通過(guò)查漢語(yǔ)語(yǔ)音碼串和最大匹配語(yǔ)段漢語(yǔ)語(yǔ)音合成文件對(duì)照表進(jìn)行語(yǔ)音合成 的方法該方法采用最大匹配法,通過(guò)查以最大語(yǔ)段為單位的漢語(yǔ)語(yǔ)音碼串和語(yǔ)段漢語(yǔ)語(yǔ)音合成文件對(duì)照表輸出相應(yīng)的漢語(yǔ)語(yǔ)音。比如通過(guò)查預(yù)先儲(chǔ)存在計(jì)算機(jī)中的最大語(yǔ)段為“wovmno huiu xrvydu我們會(huì)使用”和“hcuyyv laadqawnv漢語(yǔ)拉丁文”那么漢語(yǔ)語(yǔ)音合成按下面的方式進(jìn)行wovmno huiu xrvydu (women hui shiyong.wav)hcuyyv laadqawnv(hanyuIadIngwen. wav).(為表述方便上述該以語(yǔ)段為單位的漢語(yǔ)聲音文件用“相對(duì)應(yīng)的以該語(yǔ)段為單位的漢語(yǔ)拼音.wav”表示,實(shí)際情況是沒(méi)有漢語(yǔ)拼音符號(hào)的,它只是預(yù)先儲(chǔ)存在計(jì)算機(jī)中,可以通過(guò)一定的聲音播放軟件播放的表示相應(yīng)以該語(yǔ)段為單位的漢語(yǔ)語(yǔ)音的聲音文件)依次類(lèi)推,上述三種情況中如果語(yǔ)音碼對(duì)應(yīng)的音節(jié)、單詞、語(yǔ)段的漢語(yǔ)語(yǔ)音合成文件分別換成漢語(yǔ)特定人、中國(guó)方言、少數(shù)民族語(yǔ)言的語(yǔ)音合成文件時(shí),則計(jì)算機(jī)合成出來(lái)的就分別是漢語(yǔ)特定人、中國(guó)方言、少數(shù)民族語(yǔ)言的語(yǔ)音?!銇?lái)說(shuō),由于外語(yǔ)的音節(jié)的聲音與漢語(yǔ)音節(jié)的聲音不能建立某種對(duì)應(yīng)關(guān)系,夕卜語(yǔ)的句子的語(yǔ)序與漢語(yǔ)句子的語(yǔ)序也不同,只有漢語(yǔ)單詞、詞組或短語(yǔ)和外語(yǔ)單詞、詞組或短語(yǔ)之間可以建立某種對(duì)應(yīng)關(guān)系,因此漢語(yǔ)語(yǔ)音碼與外語(yǔ)語(yǔ)音的合成只能在單詞、詞組或短語(yǔ)之間進(jìn)行,而不能在音節(jié)和音節(jié)或句子和句子之間進(jìn)行。比如單詞“wovmno我們”可以合成英語(yǔ)單詞(we.wav)的聲音,詞組或短語(yǔ)hcuyyv laadqawnv合成英語(yǔ)詞組或短語(yǔ)(Chinese Latin, wav)的聲音,(這里we. wav和Chinese Latin, wav分別代表預(yù)先儲(chǔ)存在計(jì)算機(jī)中的英語(yǔ)we和Chinese Latin的聲音文件,可以通過(guò)聲音播放軟件播放),如果某種中國(guó)方言或少數(shù)民族語(yǔ)言出現(xiàn)上述與外語(yǔ)同樣的情況,我們也采取與外語(yǔ)同樣的方法只進(jìn)行單詞、詞組或短語(yǔ)與短語(yǔ)之間的語(yǔ)音合成。對(duì)有些需要模仿人類(lèi)發(fā)音時(shí)口型變化的機(jī)器人等語(yǔ)音合成系統(tǒng),它在漢語(yǔ)語(yǔ)音合成時(shí)往往需要知道漢語(yǔ)每一個(gè)音節(jié)的聲母、介母、韻母、聲調(diào)信息才能進(jìn)行漢語(yǔ)語(yǔ)音合成,由于本發(fā)明所采用的漢語(yǔ)語(yǔ)音碼含有漢語(yǔ)每一個(gè)音節(jié)的聲母、介母、韻母、聲調(diào)信息,因此可以根據(jù)上面的漢語(yǔ)語(yǔ)音碼與漢語(yǔ)拼音聲母、介母、韻母、聲調(diào)編碼對(duì)照表,將漢語(yǔ)語(yǔ)音碼轉(zhuǎn)換成漢語(yǔ)拼音聲母、介母、韻母、聲調(diào)的信息后,再輸入到機(jī)器人漢語(yǔ)語(yǔ)音合成系統(tǒng)中進(jìn)行漢語(yǔ)語(yǔ)音合成便可。比如對(duì)漢語(yǔ)語(yǔ)音碼“wovmno”,查上面漢語(yǔ)語(yǔ)音碼與漢語(yǔ)拼音聲母、介母、韻母、聲調(diào)編碼對(duì)照表可以知道w代表漢語(yǔ)拼音的聲母(W),ο代表漢語(yǔ)拼音的韻母
(O),V代表漢語(yǔ)拼音的第三聲聲調(diào)(V),m代表漢語(yǔ)拼音的聲母(m),η代表漢語(yǔ)拼音的韻母(en),ο代表漢語(yǔ)拼音的輕聲(不標(biāo))。同理,用上述方法,我們可以將所有的任意多音節(jié)的漢語(yǔ)語(yǔ)音碼轉(zhuǎn)換成漢語(yǔ)拼音的聲母、介母、韻母、聲調(diào)信息,輸入到所需要的類(lèi)似上面機(jī)器人的漢語(yǔ)語(yǔ)音合成系統(tǒng)中便可滿足系統(tǒng)的要求,達(dá)到我們所需要的目的。有時(shí)為了校對(duì)文章的方便,我們需要將漢語(yǔ)語(yǔ)音碼文章中的標(biāo)點(diǎn)符號(hào)和移行號(hào)朗讀出來(lái),這就要對(duì)漢語(yǔ)語(yǔ)音碼文章中的標(biāo)點(diǎn)符號(hào)和移行號(hào)進(jìn)行語(yǔ)音合成,為了使得漢語(yǔ)語(yǔ)音碼所表達(dá)的漢語(yǔ)信息與ASCII碼100%兼容,這里我們特別規(guī)定漢語(yǔ)語(yǔ)音碼文章中的標(biāo)點(diǎn)符號(hào)和移行號(hào)分別與英文的標(biāo)點(diǎn)符號(hào)和移行號(hào)相同,在具體語(yǔ)音合成時(shí)我們只要將相應(yīng)的預(yù)先儲(chǔ)存在計(jì)算機(jī)中的標(biāo)點(diǎn)符號(hào)和移行號(hào)的聲音文件提取出來(lái),用聲音播放軟件進(jìn)行播放便可,比如 六種點(diǎn)號(hào)句號(hào)“· ”(jiihdio. wav)、問(wèn)號(hào)“? ”(wSnhdio· wav)、感嘆號(hào)“ ! ” (gantanhao. wav)、逗號(hào)“,” (douhao. wav)、冒號(hào)“” (maohao. wav)、分號(hào)“;” (fenhao.wav) ο七種標(biāo)號(hào)引號(hào)“”(yinhdio.wav)、括號(hào) O (ku6hdio. wav)、破折號(hào) (pozhehao.wav)、省略號(hào)…(shengluehao. wav) > 著重號(hào).(zhu0zh6nghdio.wav)、書(shū)名號(hào)(())(shHmi nghdio. wav)、間隔號(hào).(jiangehao. wav)。一個(gè)移行號(hào)移行號(hào) (yi hanghao. wav) 上面列出了本發(fā)明所采用的與英語(yǔ)相同的六種點(diǎn)號(hào)、七種標(biāo)號(hào)和一個(gè)移行號(hào),括號(hào)中的wav”文件就是與標(biāo)點(diǎn)符號(hào)或移行號(hào)發(fā)音相應(yīng)的語(yǔ)音合成文件,當(dāng)該語(yǔ)音合成文件是漢語(yǔ)的語(yǔ)音合成文件時(shí),則該標(biāo)點(diǎn)符號(hào)或移行號(hào)朗讀出來(lái)的聲音便是漢語(yǔ)相應(yīng)的標(biāo)點(diǎn)符號(hào)或移行號(hào)的聲音,當(dāng)該語(yǔ)音合成文件分別是漢語(yǔ)特定人、中國(guó)方言、少數(shù)民族語(yǔ)言的語(yǔ)音合成文件時(shí),則該標(biāo)點(diǎn)符號(hào)或移行號(hào)朗讀出來(lái)的聲音便分別是漢語(yǔ)特定人、中國(guó)方言、少數(shù)民族語(yǔ)言的相應(yīng)的標(biāo)點(diǎn)符號(hào)或移行號(hào)的聲音。當(dāng)輸入的是用漢字或漢語(yǔ)拼音表達(dá)的漢語(yǔ)信息時(shí),漢字或漢語(yǔ)拼音可以通過(guò)漢字漢語(yǔ)拼音與漢語(yǔ)語(yǔ)音碼雙向轉(zhuǎn)換模塊先轉(zhuǎn)換成漢語(yǔ)語(yǔ)音碼后再進(jìn)行上述外語(yǔ)單詞、詞組或短語(yǔ)、漢語(yǔ)、漢語(yǔ)特定人、中國(guó)方言、少數(shù)民族語(yǔ)言等的語(yǔ)音轉(zhuǎn)換。2.漢語(yǔ)語(yǔ)音轉(zhuǎn)換成漢語(yǔ)語(yǔ)音碼的步驟和方法在漢語(yǔ)語(yǔ)音轉(zhuǎn)換成漢語(yǔ)語(yǔ)音碼時(shí),漢語(yǔ)語(yǔ)音識(shí)別系統(tǒng)可以依次分別將漢語(yǔ)語(yǔ)段、漢語(yǔ)單詞、漢語(yǔ)音節(jié)作為識(shí)別的基元,通過(guò)查找預(yù)先儲(chǔ)存在計(jì)算機(jī)中的漢語(yǔ)語(yǔ)段語(yǔ)音模板和漢語(yǔ)語(yǔ)段語(yǔ)音碼對(duì)照表、漢語(yǔ)單詞語(yǔ)音模板和漢語(yǔ)單詞語(yǔ)音碼對(duì)照表、漢語(yǔ)音節(jié)語(yǔ)音模板和漢語(yǔ)語(yǔ)音音節(jié)碼對(duì)照表,匹配后識(shí)別出相應(yīng)的漢語(yǔ)語(yǔ)段語(yǔ)音碼、漢語(yǔ)單詞語(yǔ)音碼、漢語(yǔ)音節(jié)語(yǔ)音碼,語(yǔ)音連續(xù)輸入時(shí)便依次分別得到連續(xù)的漢語(yǔ)語(yǔ)段語(yǔ)音碼串、漢語(yǔ)單詞語(yǔ)音碼串、漢語(yǔ)音節(jié)語(yǔ)音碼串,對(duì)上述得到漢語(yǔ)音節(jié)語(yǔ)音碼串通過(guò)預(yù)先儲(chǔ)存在計(jì)算機(jī)系統(tǒng)中的分詞模塊進(jìn)行按詞切分,對(duì)已經(jīng)分過(guò)詞的漢語(yǔ)單詞語(yǔ)音碼串和漢語(yǔ)語(yǔ)段語(yǔ)音碼串則不必再進(jìn)行單詞切分,對(duì)切分出的單詞采取同一單詞的音節(jié)與音節(jié)之間連寫(xiě),詞與詞之間空格的方式表示,當(dāng)漢語(yǔ)語(yǔ)音碼需要進(jìn)一步轉(zhuǎn)換成漢字或漢語(yǔ)拼音時(shí),通過(guò)預(yù)先儲(chǔ)存在計(jì)算機(jī)系統(tǒng)中的漢字漢語(yǔ)拼音與漢語(yǔ)語(yǔ)音碼雙向轉(zhuǎn)換模塊轉(zhuǎn)換輸出相應(yīng)的漢字或漢語(yǔ)拼音,對(duì)于漢語(yǔ)語(yǔ)音是帶某種方言口音的漢語(yǔ)或某一種中國(guó)的方言,只要這種中國(guó)的方言的音節(jié)或單詞或語(yǔ)段分別與漢語(yǔ)音節(jié)或單詞或語(yǔ)段具有某種對(duì)應(yīng)關(guān)系,我們通過(guò)以上相類(lèi)似的方法即通過(guò)查找預(yù)先儲(chǔ)存在計(jì)算機(jī)中的帶某種方言口音的漢語(yǔ)的漢語(yǔ)音節(jié)或單詞或語(yǔ)段的語(yǔ)音模板與漢語(yǔ)音節(jié)或單詞或語(yǔ)段語(yǔ)音碼對(duì)照表,以及具有某種對(duì)應(yīng)關(guān)系的方言音節(jié)或單詞或語(yǔ)段的語(yǔ)音模板和漢語(yǔ)語(yǔ)音音節(jié)碼或單詞或語(yǔ)段對(duì)照表,匹配后識(shí)別出相應(yīng)的漢語(yǔ)音節(jié)或單詞或語(yǔ)段語(yǔ)音碼串,就可以實(shí)現(xiàn)對(duì)該帶某種方言口音的漢語(yǔ)或方言的漢語(yǔ)語(yǔ)音碼識(shí)別,實(shí)現(xiàn)該帶某種方言口音的漢語(yǔ)或方言與漢語(yǔ)語(yǔ)音碼的轉(zhuǎn)換,以上以下將該步驟方法稱(chēng)為漢語(yǔ)語(yǔ)音碼語(yǔ)音識(shí)別模塊;下面例舉一些用本發(fā)明方法對(duì)漢語(yǔ)語(yǔ)音進(jìn)行語(yǔ)音碼轉(zhuǎn)換的例子比如我們用漢語(yǔ)語(yǔ)音朗讀“我們會(huì)使用漢語(yǔ)拉丁文?!?I)通過(guò)查找預(yù)先儲(chǔ)存在計(jì)算機(jī)中的漢語(yǔ)音節(jié)語(yǔ)音模板和漢語(yǔ)語(yǔ)音音節(jié)碼對(duì)照表,匹配后識(shí)別出相應(yīng)的漢語(yǔ)音節(jié)語(yǔ)音碼串
wov mno huiu xrv ydu hsu yyv Iaa dqa wnv.(音節(jié)與音節(jié)之間有空格)或woxmnghuiipTxydyJicyjyxla^dq^wnx.(音節(jié)與音節(jié)之間無(wú)空格)(熟練后mno中的輕音符ο在不引起混音時(shí)可以省略,以上以下均同。)為了讓大家看清楚這里將表示聲調(diào)的字母加了下劃線,語(yǔ)音碼中的聲調(diào)字母同時(shí)具隔音節(jié)作用,實(shí)際語(yǔ)音碼中聲調(diào)無(wú)下劃線,熟練語(yǔ)音碼后聲調(diào)兼隔音節(jié)符能夠方便區(qū)分出來(lái)。這樣便完成了一個(gè)系統(tǒng)的復(fù)雜性與系統(tǒng)的詞庫(kù)規(guī)模性無(wú)關(guān)的純語(yǔ)音識(shí)別過(guò)程。如果漢語(yǔ)語(yǔ)音是帶某種方言口音的漢語(yǔ)或是某一種中國(guó)的方言,只要這種中國(guó)的方言的音節(jié)與漢語(yǔ)音節(jié)具有某種對(duì)應(yīng)關(guān)系,我們通過(guò)以上相類(lèi)似的方法即通過(guò)查找預(yù)先儲(chǔ)存在計(jì)算機(jī)中的帶某種方言口音的漢語(yǔ)或與漢語(yǔ)音節(jié)具有某種對(duì)應(yīng)關(guān)系的方言音節(jié)的語(yǔ)音模板和漢語(yǔ)語(yǔ)音音節(jié)碼對(duì)照表,匹配后識(shí)別出相應(yīng)的漢語(yǔ)音節(jié)語(yǔ)音碼串,就可以實(shí)現(xiàn)對(duì)該帶某種方言口音的漢語(yǔ)或方言的漢語(yǔ)語(yǔ)音碼識(shí)別,實(shí)現(xiàn)該帶某種方言口音的漢語(yǔ)或方言與漢語(yǔ)語(yǔ)音碼的轉(zhuǎn)換。(2)將語(yǔ)音碼串進(jìn)行單詞切分,最終完成以詞為單位的語(yǔ)音碼轉(zhuǎn)換。通過(guò)查找預(yù)先分好詞的漢語(yǔ)語(yǔ)音碼單詞詞庫(kù),將同一個(gè)單詞的多個(gè)音節(jié)連寫(xiě),詞與詞之間用空格隔開(kāi)便得到以下我們最終需要的漢語(yǔ)語(yǔ)音碼wovmno huiu xrvydu hcuyyv laadqawnv.為了得到傳統(tǒng)的語(yǔ)音識(shí)別結(jié)果,我們還可以進(jìn)行如下的轉(zhuǎn)換,這里需要強(qiáng)調(diào)的是該過(guò)程與語(yǔ)音識(shí)別系統(tǒng)沒(méi)有必然的聯(lián)系,該標(biāo)準(zhǔn)轉(zhuǎn)換模塊可以脫離語(yǔ)音識(shí)別系統(tǒng)獨(dú)立運(yùn)行。漢語(yǔ)語(yǔ)音碼轉(zhuǎn)換成漢字和漢語(yǔ)拼音時(shí)只要通過(guò)漢字漢語(yǔ)拼音與漢語(yǔ)語(yǔ)音碼雙向轉(zhuǎn)換模塊的轉(zhuǎn)換就可以實(shí)現(xiàn)漢語(yǔ)語(yǔ)音碼轉(zhuǎn)換成漢字和漢語(yǔ)拼音比如,我們可以得到 “wovmno huiu xrvydu hcuyyv laadqawnv.”經(jīng)該模塊轉(zhuǎn)換的拼音和漢字組成的下列句子iiWomen hui shiyong hanyu IadIngwen0“我們會(huì)使用漢語(yǔ)拉丁文?!?br>
上述識(shí)別的結(jié)果既可以單獨(dú)顯示也可以對(duì)照顯示,比如原句“我們會(huì)使用漢語(yǔ)拉丁文?!笨梢赞D(zhuǎn)換為以下幾種形式
1.'tWomen hui shiyonghanyu IacfTngwen0"
S-ltWovmno huiu xrvydu hcuyyv laadqawnv.”
3.‘*W0men hui shiyonghanyii IadTngwen0"
我們會(huì) 使用漢語(yǔ)拉丁文。
(uWovmno huiu xrvydu hcuyyv laadqawnv.”
我們會(huì) 使用漢語(yǔ)拉丁文。
5."Wdmen hui shiyonghanyii IadTngwen0"
"wovmno huiu xrvyduhcuyyv laadqawnv."為了讓外國(guó)人或中國(guó)少數(shù)民族更方面地了解漢語(yǔ)的含義和學(xué)習(xí)漢語(yǔ),也可以在每個(gè)對(duì)照的單詞中插入相應(yīng)的外語(yǔ)單詞或少數(shù)民族文字,比如在下面的單詞中加入相應(yīng)的英語(yǔ)單詞作中文意思的注解“wovmno Women huiu huixrvydu shiyong hcuyyv hanyu laadqawnv ladlngwen。,,我們 We 會(huì)can 使用 use漢語(yǔ)Chinese 拉丁文Latine。依次類(lèi)推,用上述方法同樣可以進(jìn)行語(yǔ)段和單詞為單位的語(yǔ)音識(shí)別,并可以將任意多音節(jié)的漢語(yǔ)語(yǔ)音識(shí)別成漢語(yǔ)語(yǔ)音碼,并根據(jù)需要進(jìn)一步轉(zhuǎn)換成漢字或漢語(yǔ)拼音,漢語(yǔ)語(yǔ)音碼、漢字或漢語(yǔ)拼音可以單獨(dú)顯示也可以對(duì)照顯示,以這些漢語(yǔ)單詞為基礎(chǔ),就可以實(shí)現(xiàn)任何漢語(yǔ)語(yǔ)音信息的識(shí)別,從而方便進(jìn)行各種漢語(yǔ)語(yǔ)音信息處理。(六)漢語(yǔ)與外語(yǔ)的雙向機(jī)器翻譯的步驟和方法所采用的漢語(yǔ)與外語(yǔ)的雙向機(jī)器翻譯的方法,是在建立源語(yǔ)言與目標(biāo)語(yǔ)言基本相一致的詞法句法基礎(chǔ)上,通過(guò)漢語(yǔ)與外語(yǔ)雙向句型轉(zhuǎn)換,來(lái)實(shí)現(xiàn)漢語(yǔ)與外語(yǔ)的雙向機(jī)器翻譯,這里的機(jī)器翻譯所用的機(jī)器是指世界通用的計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng),以下簡(jiǎn)稱(chēng)為計(jì)算機(jī)或計(jì)算機(jī)系統(tǒng),這里的詞法就是關(guān)于詞類(lèi)的定義和劃分以及研究單詞、詞形的變化及其用法,句法就是是關(guān)于句子成分的定義和劃分以及研究句子種類(lèi)、句子結(jié)構(gòu)及其內(nèi)部形式,句型就是句子內(nèi)部各個(gè)單詞、詞組、短語(yǔ)、從句的詞性或相當(dāng)詞性及其在句子中所擔(dān)當(dāng)成分的排列順序及其形式,翻譯前首先運(yùn)用人工的方法建立同一種語(yǔ)言句子的詞性串與句型的對(duì)應(yīng)關(guān)系,然后再在建立漢語(yǔ)與需要翻譯的外語(yǔ)基本相一致的詞法系統(tǒng)和句法系統(tǒng)基礎(chǔ)上,建立所需要翻譯的兩種語(yǔ)言間的句型對(duì)照關(guān)系并儲(chǔ)存在計(jì)算機(jī)中,翻譯時(shí)機(jī)器先掃描源語(yǔ)言的句子,通過(guò)查預(yù)先儲(chǔ)存在計(jì)算機(jī)中的源語(yǔ)言標(biāo)注詞性的詞典得到源語(yǔ)言的句子的詞性串,通過(guò)查預(yù)先儲(chǔ)存在計(jì)算機(jī)中的源語(yǔ)言詞性串與源語(yǔ)言句型的對(duì)應(yīng)關(guān)系表,將源語(yǔ)言的句子的詞性串轉(zhuǎn)換成對(duì)應(yīng)的源語(yǔ)言句型,再通過(guò)查預(yù)先儲(chǔ)存在計(jì)算機(jī)中的源語(yǔ)言句型與目標(biāo)語(yǔ)言句型對(duì)照表,將源語(yǔ)言句型轉(zhuǎn)換成匹配的目標(biāo)語(yǔ)言句型,最后通過(guò)查預(yù)先儲(chǔ)存在計(jì)算機(jī)中的源語(yǔ)言與目標(biāo)語(yǔ)言對(duì)照詞典的方法,將源語(yǔ)言中的單詞或詞組翻譯成目標(biāo)語(yǔ)言的單詞或詞組,并按目標(biāo)語(yǔ)言句型的順序以詞為單位排列輸出,便得到我們所需要的目標(biāo)語(yǔ)言語(yǔ)句;對(duì)源語(yǔ)言中的復(fù)句先進(jìn)行語(yǔ)法分析將復(fù)句中的所有從句提取出來(lái),通過(guò)層層提取直到最后將從句提成單句為止,再按上述翻譯單句的方式進(jìn)行機(jī)器翻譯,復(fù)句部分則通過(guò)查預(yù)先儲(chǔ)存在計(jì)算機(jī)中的源語(yǔ)言和目標(biāo)語(yǔ)言句型對(duì)照表完成復(fù)句句型轉(zhuǎn)換,并完成除從句的復(fù)句其它成分的翻譯,最后將翻譯好的從句放入轉(zhuǎn)換后相應(yīng)復(fù)句句型中的相應(yīng)位置,如此循環(huán)往復(fù)一直到得到我們所需要的整個(gè)目標(biāo)語(yǔ)言句子為止;當(dāng)源語(yǔ)言是用漢字或漢語(yǔ)拼音或漢語(yǔ)語(yǔ)音表達(dá)的漢語(yǔ)時(shí),通過(guò)預(yù)先儲(chǔ)存在計(jì)算機(jī)中的漢字漢語(yǔ)拼音與漢語(yǔ)語(yǔ)音碼雙向轉(zhuǎn)換模塊、漢語(yǔ)語(yǔ)音碼語(yǔ)音識(shí)別模塊先將漢字或漢語(yǔ)拼音或漢語(yǔ)語(yǔ)音轉(zhuǎn)換成漢語(yǔ)語(yǔ)音碼再進(jìn)行翻譯,外語(yǔ)翻漢語(yǔ)時(shí),翻譯得到的用漢語(yǔ)語(yǔ)音碼表示的目標(biāo)語(yǔ)言或直接用于表達(dá)漢語(yǔ)信息,或必要時(shí)通過(guò)預(yù)先儲(chǔ)存在計(jì)算機(jī)中的漢字漢語(yǔ)拼音與漢語(yǔ)語(yǔ)音碼雙向轉(zhuǎn)換模塊和漢語(yǔ)語(yǔ)音碼語(yǔ)音合成模塊轉(zhuǎn)換成漢字或漢語(yǔ)拼音或漢語(yǔ)語(yǔ)音或漢語(yǔ)特定人或漢語(yǔ)方言以及少數(shù)民族語(yǔ)言語(yǔ)音輸出; 對(duì)于源語(yǔ)言中的文言文、詩(shī)詞、成語(yǔ)、典故、俚語(yǔ)、縮略語(yǔ)等不便進(jìn)行語(yǔ)法分析的內(nèi)容,不進(jìn)行詞性查詢和句型轉(zhuǎn)換,在詞性查詢和句型轉(zhuǎn)換前直接通過(guò)查找預(yù)先儲(chǔ)存在機(jī)器中的--對(duì)應(yīng)的實(shí)例庫(kù)匹配后輸出;下面例舉一些用本發(fā)明方法對(duì)漢語(yǔ)和英語(yǔ)進(jìn)行雙向翻譯的例子I. wovmno mwvtisa xrvydu laadqawnv.(漢語(yǔ)語(yǔ)音碼表不的漢語(yǔ)信息)我們每天使用拉丁文。(用漢字表示的漢語(yǔ)信息)a)查標(biāo)注單詞詞性的漢語(yǔ)詞典建立單詞詞性串(句中括號(hào)內(nèi)的部分是詞性,以下均同)wovmno (人稱(chēng)代詞I) +mwvtisa (時(shí)間名詞I) +xrvydu (動(dòng)詞I) +laadqawnv (名詞2).我們(人稱(chēng)代詞I) +每天(時(shí)間名詞I) +使用(動(dòng)詞I)+拉丁文(名詞2)。b)根據(jù)上面得到的句子詞性串查表得到預(yù)先儲(chǔ)存在表中的漢語(yǔ)句型(詞性和該詞所作的句子成分串組成句型,以下均同Wovmno(人稱(chēng)代詞I作主語(yǔ))+mwvtisa(時(shí)間名詞I作時(shí)間狀語(yǔ))+xrvydu (動(dòng)詞I作謂語(yǔ))+laadqawnv (名詞2作賓語(yǔ))我們(人稱(chēng)代詞I作主語(yǔ))+每天(時(shí)間名詞I作時(shí)間狀語(yǔ))+使用(動(dòng)詞I作謂語(yǔ))+拉丁文(名詞2作賓語(yǔ))c)根據(jù)上面得到漢語(yǔ)句型的查表得到預(yù)先儲(chǔ)存在表中的對(duì)應(yīng)的英語(yǔ)句型wovmno (人稱(chēng)代詞I作主語(yǔ))+xrvydu (動(dòng)詞I作謂語(yǔ))+laadqawnv (名詞2作賓語(yǔ))+mwvtisa(時(shí)間名詞I作時(shí)間狀語(yǔ))我們(人稱(chēng)代詞I作主語(yǔ))+使用(動(dòng)詞I作謂語(yǔ))+拉丁文(名詞2作賓語(yǔ))+每天(時(shí)間名詞I作時(shí)間狀語(yǔ))此時(shí)查漢英詞庫(kù)進(jìn)行單詞或詞組意思的轉(zhuǎn)換并按此句型順序輸出便完成漢語(yǔ)翻譯成英語(yǔ)的轉(zhuǎn)換,為了表明此機(jī)器翻譯過(guò)程的可雙向性,我們?cè)僮飨旅孢M(jìn)一步的變換d)根據(jù)上面得到英語(yǔ)句型查表得到預(yù)先儲(chǔ)存在表中的與對(duì)應(yīng)的英語(yǔ)單詞或詞組詞性相一致的詞性串(該詞性串也可從得到的目標(biāo)語(yǔ)言句型中提取得到,以下均同)wovmno (人稱(chēng)代詞 I)+xrvydu (動(dòng)詞 I)+laadqawnv (名詞 2)+mwvtisa (時(shí)間名詞 I).
我們(人稱(chēng)代詞I) +使用(動(dòng)詞I) +拉丁文(名詞2) +每天(時(shí)間名詞I)。e)查漢英詞庫(kù)進(jìn)行單詞或詞組意思的轉(zhuǎn)換并按上面所得到的英語(yǔ)句型的順序輸出we(人稱(chēng)代詞 I) use(動(dòng)詞 I) Iatin(名詞 2) every day(時(shí)間名詞 I).weuselatinevery day.這樣便完成了漢語(yǔ)翻譯成英語(yǔ)的轉(zhuǎn)換,同時(shí)我們還可以看到除了從a轉(zhuǎn)換到e外,我們還可以用同樣的方法從e回到a,此時(shí)英語(yǔ)被轉(zhuǎn)換成了漢語(yǔ),表明用本發(fā)明的方法可以實(shí)現(xiàn)機(jī)器翻譯過(guò)程可雙向性。同理我們可以采用上述對(duì)復(fù)句的翻譯方法實(shí)現(xiàn)漢語(yǔ)對(duì)復(fù)句的雙向翻譯。 當(dāng)源語(yǔ)言是用漢字或漢語(yǔ)拼音或漢語(yǔ)語(yǔ)音表達(dá)的漢語(yǔ)時(shí),通過(guò)預(yù)先儲(chǔ)存在計(jì)算機(jī)中的漢字漢語(yǔ)拼音與漢語(yǔ)語(yǔ)音碼雙向轉(zhuǎn)換模塊、漢語(yǔ)語(yǔ)音碼語(yǔ)音識(shí)別模塊先將漢字或漢語(yǔ)拼音或漢語(yǔ)語(yǔ)音轉(zhuǎn)換成漢語(yǔ)語(yǔ)音碼再進(jìn)行翻譯,外語(yǔ)翻漢語(yǔ)時(shí),翻譯得到的用漢語(yǔ)語(yǔ)音碼表示的目標(biāo)語(yǔ)言或直接用于表達(dá)漢語(yǔ)信息,或必要時(shí)通過(guò)預(yù)先儲(chǔ)存在計(jì)算機(jī)中的漢字漢語(yǔ)拼音與漢語(yǔ)語(yǔ)音碼雙向轉(zhuǎn)換模塊和漢語(yǔ)語(yǔ)音碼語(yǔ)音合成模塊轉(zhuǎn)換成漢字或漢語(yǔ)拼音或漢語(yǔ)語(yǔ)音或漢語(yǔ)特定人或漢語(yǔ)方言以及少數(shù)民族語(yǔ)言語(yǔ)音輸出;對(duì)于源語(yǔ)言中的文言文、詩(shī)詞、成語(yǔ)、典故、俚語(yǔ)、縮略語(yǔ)等不便進(jìn)行語(yǔ)法分析的內(nèi)容,不進(jìn)行詞性查詢和句型轉(zhuǎn)換,在詞性查詢和句型轉(zhuǎn)換前直接通過(guò)查找預(yù)先儲(chǔ)存在機(jī)器中的--對(duì)應(yīng)的實(shí)例庫(kù)匹配后輸出;如果我們將任意源語(yǔ)言和目標(biāo)語(yǔ)言的不便于語(yǔ)法分析內(nèi)容的實(shí)例庫(kù)、任意源語(yǔ)言和目標(biāo)語(yǔ)言的標(biāo)注詞性的雙向翻譯詞典、同一語(yǔ)言的句子詞性串的表達(dá)式和句型表達(dá)式的對(duì)照關(guān)系表以及不同語(yǔ)言間的句型轉(zhuǎn)換對(duì)照表加入系統(tǒng)中,并用相同的翻譯程序運(yùn)行它,我們就可以實(shí)現(xiàn)任意語(yǔ)言間的雙向翻譯,值得指出的是上述各種轉(zhuǎn)換對(duì)照表盡量要建立在相同或相近的詞法系統(tǒng)和句法系統(tǒng)基礎(chǔ)上,這樣源語(yǔ)言和目標(biāo)語(yǔ)言的不同就僅僅表現(xiàn)為單詞或詞組及句型的不同,在機(jī)器翻譯過(guò)程中需要轉(zhuǎn)換的僅僅是單詞或詞組及句型,詞法系統(tǒng)和句法系統(tǒng)由于相同或相近,因此一般不再需要轉(zhuǎn)換。當(dāng)將該翻譯方法用到的與漢語(yǔ)對(duì)應(yīng)的各個(gè)要素如漢語(yǔ)標(biāo)注詞性的詞典、漢語(yǔ)人工建立的詞性串與漢語(yǔ)句型對(duì)照表以及漢語(yǔ)與目標(biāo)外語(yǔ)句型轉(zhuǎn)換對(duì)照表?yè)Q成另外一種外語(yǔ)翻譯時(shí)相應(yīng)用到的上述各個(gè)要素并預(yù)先儲(chǔ)存在計(jì)算機(jī)中的時(shí),上述翻譯方法還能夠擴(kuò)展成一種外語(yǔ)翻譯成另外一種外語(yǔ)的機(jī)器翻譯方法,以上以下將該步驟的方法稱(chēng)為漢語(yǔ)語(yǔ)音碼漢語(yǔ)外文雙向翻譯模塊。(七)漢語(yǔ)語(yǔ)音碼域名轉(zhuǎn)換和網(wǎng)頁(yè)登陸步驟和方法所采用的登陸各種網(wǎng)站或電子郵箱的網(wǎng)址是各種含有全拼和簡(jiǎn)拼的漢語(yǔ)語(yǔ)音碼的合法網(wǎng)址,網(wǎng)站既可以采用以全拼和簡(jiǎn)拼的漢語(yǔ)語(yǔ)音碼為詞干加各種合法網(wǎng)址的前后綴組成,電子郵箱采用全拼和簡(jiǎn)拼的漢語(yǔ)語(yǔ)音碼為詞干+0+各種電子郵箱的合法后綴組成,也可以將全拼和簡(jiǎn)拼的漢語(yǔ)語(yǔ)音碼與各種合法網(wǎng)址的前后綴以及各種電子郵箱的合法后綴建立對(duì)應(yīng)關(guān)系,全部用全拼或簡(jiǎn)拼的漢語(yǔ)語(yǔ)音碼來(lái)向計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)輸入各種網(wǎng)址和電子郵箱地址,在漢語(yǔ)語(yǔ)音碼以詞組、句子形式組成網(wǎng)址或電子郵箱地址時(shí),對(duì)應(yīng)網(wǎng)絡(luò)域名或電子郵箱地址的漢語(yǔ)語(yǔ)音碼的詞組或句子里的所有單詞相互之間不空格,輸入時(shí)既可以通過(guò)標(biāo)準(zhǔn)西文鍵盤(pán)輸入,也可以通過(guò)西文手寫(xiě)識(shí)別、西文光學(xué)識(shí)別、西文字母語(yǔ)音識(shí)別和漢語(yǔ)語(yǔ)音碼語(yǔ)音識(shí)別的方式輸入,當(dāng)向計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)發(fā)出預(yù)先存入其中的與某網(wǎng)站的網(wǎng)址或電子郵箱地址相對(duì)應(yīng)的語(yǔ)音時(shí),計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)會(huì)查找預(yù)先儲(chǔ)存在計(jì)算機(jī)中與該語(yǔ)音相對(duì)應(yīng)的網(wǎng)址或電子郵箱地址,并在瀏覽器地址欄中顯示與該語(yǔ)音相對(duì)應(yīng)的網(wǎng)址或電子郵箱地址,并打開(kāi)相應(yīng)的網(wǎng)頁(yè)或網(wǎng)站或電子郵箱,瀏覽器可以預(yù)先人工打開(kāi),也可以在計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)聽(tīng)到語(yǔ)音信號(hào)后根據(jù)預(yù)先對(duì)計(jì)算機(jī)系統(tǒng)的設(shè)定自動(dòng)打開(kāi),網(wǎng)站打開(kāi)后,計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)可以繼續(xù)識(shí)別后續(xù)的語(yǔ)音,經(jīng)識(shí)別搜索后,打開(kāi)該網(wǎng)站的相應(yīng)網(wǎng)頁(yè)或光標(biāo)指向相應(yīng)的網(wǎng)頁(yè)內(nèi)容,并根據(jù)預(yù)先的設(shè)定計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)做進(jìn)一步的后續(xù)處理,以上以上將該步驟的方法稱(chēng)作為漢語(yǔ)語(yǔ)音碼域名轉(zhuǎn)換和網(wǎng)頁(yè)登陸模塊;(八)漢語(yǔ)語(yǔ)音碼多樣信息輸入的步驟和方法用于多樣信息輸入的漢語(yǔ)語(yǔ)音碼既可以通過(guò)標(biāo)準(zhǔn)西文鍵盤(pán)輸入,也可以通過(guò)西文手寫(xiě)識(shí)別、西文光學(xué)識(shí)別、西文字母語(yǔ)音識(shí)別和漢語(yǔ)語(yǔ)音碼語(yǔ)音識(shí)別的方式輸入,當(dāng)向編碼輸入框中輸入漢語(yǔ)語(yǔ)音碼時(shí),與該漢語(yǔ)語(yǔ)音碼所表示的意義相一致的多樣信息所包括的各對(duì)應(yīng)項(xiàng)可以根據(jù)設(shè)定全部或部分先出現(xiàn)在候選輸入框中,經(jīng)選擇確認(rèn)后最終輸入到所需輸 入的計(jì)算機(jī)或各種手持嵌入式可移動(dòng)設(shè)備中,所輸入的多樣信息主要包括但不限于與所輸入的漢語(yǔ)語(yǔ)音碼意義相一致的以詞、詞組、句子為單位的漢字、傳統(tǒng)《漢語(yǔ)拼音方案》中所使用的漢語(yǔ)拼音、漢語(yǔ)語(yǔ)音碼全拼和簡(jiǎn)拼、與傳統(tǒng)《漢語(yǔ)拼音方案》具有一一對(duì)應(yīng)關(guān)系的其它各種漢語(yǔ)拼音、外文、中國(guó)少數(shù)民族文字以及與所輸入的漢語(yǔ)語(yǔ)音碼全拼和簡(jiǎn)拼相對(duì)應(yīng)的各種有線和無(wú)線網(wǎng)絡(luò)域名或網(wǎng)址,根據(jù)系統(tǒng)設(shè)定所輸入的漢語(yǔ)語(yǔ)音碼全拼和簡(jiǎn)拼相對(duì)應(yīng)的各種有線和無(wú)線網(wǎng)絡(luò)域名或網(wǎng)址可以根據(jù)對(duì)應(yīng)的碼表相互自動(dòng)轉(zhuǎn)換,當(dāng)向編碼輸入框中輸入漢語(yǔ)語(yǔ)音碼時(shí),如遇到聲母、韻母、聲調(diào)全部相同的漢語(yǔ)同音字詞,則在候選輸入框中分別用特定字符比如阿拉伯?dāng)?shù)字順序全部列出這些同音字詞及其與其意義相一致的外文、少數(shù)民族文字,經(jīng)選擇確認(rèn)后最終輸入到所需輸入的計(jì)算機(jī)或各種手持嵌入式可移動(dòng)設(shè)備中;與所輸入的漢語(yǔ)語(yǔ)音碼相對(duì)應(yīng)的各種有線和無(wú)線網(wǎng)絡(luò)域名或網(wǎng)址,可以直接通過(guò)各種合法的有線和無(wú)線網(wǎng)絡(luò)域名或網(wǎng)址的前綴+所輸入的漢語(yǔ)語(yǔ)音碼+各種合法有線和無(wú)線網(wǎng)絡(luò)域名或網(wǎng)址的后綴組成來(lái)得到,也可以通過(guò)調(diào)用漢語(yǔ)語(yǔ)音碼域名轉(zhuǎn)換和網(wǎng)頁(yè)登陸模塊轉(zhuǎn)換來(lái)得到,在漢語(yǔ)語(yǔ)音碼以詞組、句子形式輸入時(shí),對(duì)應(yīng)網(wǎng)絡(luò)域名或網(wǎng)址中的漢語(yǔ)語(yǔ)音碼的詞組或句子里的所有單詞相互之間不空格,當(dāng)出現(xiàn)漢字的同音字詞時(shí),與所輸入的漢語(yǔ)語(yǔ)音碼相對(duì)應(yīng)的各種有線和無(wú)線網(wǎng)絡(luò)域名或網(wǎng)址不變;當(dāng)向編碼輸入框中輸入漢語(yǔ)語(yǔ)音碼后,在候選輸入框中顯示的多樣信息所包括的各對(duì)應(yīng)項(xiàng)既可以在每一對(duì)應(yīng)項(xiàng)前加特定字符如阿拉伯?dāng)?shù)字,通過(guò)鍵入該特定字符來(lái)進(jìn)行單項(xiàng)對(duì)應(yīng)項(xiàng)的輸入顯示,也可以將包括輸入的漢語(yǔ)語(yǔ)音碼在內(nèi)的所有多樣信息所包括的對(duì)應(yīng)項(xiàng)僅用一個(gè)特定字符如阿拉伯?dāng)?shù)字來(lái)標(biāo)識(shí),通過(guò)鍵入該特定字符來(lái)進(jìn)行所有多樣信息所包括的各對(duì)應(yīng)項(xiàng)的同時(shí)一次性對(duì)照輸入顯不;通過(guò)建立多樣信息各對(duì)應(yīng)項(xiàng)之間的對(duì)應(yīng)關(guān)系,當(dāng)向輸入框中輸入多樣信息對(duì)應(yīng)項(xiàng)中的任意一項(xiàng)時(shí),多樣信息所包括的其它各對(duì)應(yīng)項(xiàng)就會(huì)以預(yù)先設(shè)定的格式在候選輸入框中顯示,經(jīng)選擇確認(rèn)后最終以所設(shè)定的顯示格式輸入到所需輸入的計(jì)算機(jī)或各種手持嵌入式可移動(dòng)設(shè)備中。
下面例舉一些用本發(fā)明方法進(jìn)行多樣信息輸入的例子比如在編碼輸入框中輸入漢語(yǔ)語(yǔ)音碼“wovmno”根據(jù)選擇符號(hào)的不同設(shè)置,候選框顯示的方式可以采取以下兩種不同的方式(為了方便簡(jiǎn)潔地?cái)⑹銮宄景l(fā)明例、,本發(fā)明例的外文以英文為例,對(duì)其它對(duì)應(yīng)外文項(xiàng)和少數(shù)民族文字項(xiàng)分別用其它外文一、其它外文二和少數(shù)民族文字一、少數(shù)民族文字二等表示,實(shí)際應(yīng)用時(shí)相應(yīng)的位置要分別顯示實(shí)際的其它外文和少數(shù)民族文字,比如其它外文一可以顯示日文、其它外文二可以顯示俄文,少數(shù)民族文字一可以顯示藏文、少數(shù)民族文字二可以顯示維吾爾文等,且外文和少數(shù)民族文字的種類(lèi)和數(shù)量不限,此外與傳統(tǒng)《漢語(yǔ)拼音方案》具有一一對(duì)應(yīng)關(guān)系的各種漢語(yǔ)拼音本發(fā)明例中只列出漢語(yǔ)語(yǔ)音碼,其它如臺(tái)灣使用的漢語(yǔ)拼音注音符號(hào)以及用數(shù)字做調(diào)號(hào)的漢語(yǔ)拼音等未在本發(fā)明例中列出,各種有線和無(wú)線網(wǎng)絡(luò)域名或網(wǎng)址也只列出了常用的PC互聯(lián)網(wǎng)網(wǎng)址,對(duì)于其它未列出的部分可以根據(jù)實(shí)際需要用同樣的方法進(jìn)行候選顯示和輸入顯示,以上以下均同)(I)如果在每一個(gè)候選項(xiàng)前面加一個(gè)特定的選擇符號(hào)比如阿拉伯?dāng)?shù)字,則此時(shí)候選框中顯示與所輸入的漢語(yǔ)語(yǔ)音碼“wovmno”意義相一致的多樣信息的對(duì)應(yīng)項(xiàng)1.我 們2.w0men 3. we 4.其它外文一 5.其它外文二 6.少數(shù)民族文字一 7.少數(shù)民族文字二
8.http:"www. wovmno. com,分別鍵入1、2、3、4、5、6、7、8就可以分別選中并輸入漢字、拼音、英文、其它外文一、其它外文二、少數(shù)民族文字一、少數(shù)民族文字二和相應(yīng)的網(wǎng)址。這樣就可以方便選中輸入任意一個(gè)候選對(duì)應(yīng)項(xiàng)。(2)如果采用包括所輸入的漢語(yǔ)語(yǔ)音碼在內(nèi)的所有意義一致的多樣信息的對(duì)應(yīng)項(xiàng)僅用一個(gè)選擇符號(hào),比如用阿拉伯?dāng)?shù)字標(biāo)識(shí),則候選框中可以采用如下顯示1.我們women wovmno we其它外文一其它外文二少數(shù)民族文字一少數(shù)民族文字二 http://www. wovmno. com,鍵入數(shù)字鍵“ I ”則“我們w0men wovmno we其它外文一其它外文二少數(shù)民族文字一少數(shù)民族文字二 http://www. wovmno. com”同時(shí)被對(duì)照輸入顯示在所需要輸入的計(jì)算機(jī)或各種手持嵌入式可移動(dòng)設(shè)備中,輸入后的對(duì)照顯示可以全部項(xiàng)或根據(jù)需要選擇部分項(xiàng)左右橫向?qū)φ诊@示,也可以全部項(xiàng)或根據(jù)需要選擇部分項(xiàng)上下豎式對(duì)照顯示。采用這種格式可以方便地將所有意義一致的對(duì)應(yīng)項(xiàng)一次選中同時(shí)全部項(xiàng)或根據(jù)需要有選擇地部分項(xiàng)對(duì)照輸入顯示。這里還需要強(qiáng)調(diào)的是,對(duì)應(yīng)的各種有線和無(wú)線網(wǎng)絡(luò)域名或網(wǎng)址本發(fā)明采用的是“各種有線和無(wú)線網(wǎng)絡(luò)域名或網(wǎng)址前綴+所輸入的漢語(yǔ)語(yǔ)音碼+各種有線和無(wú)線網(wǎng)絡(luò)域名或網(wǎng)址后綴”的編碼方法,本發(fā)明例中的網(wǎng)址前綴是http://WWW.,本發(fā)明例中組成網(wǎng)址的所輸入的漢語(yǔ)語(yǔ)音碼就是“wovmno”,本發(fā)明例中的網(wǎng)址后綴是“.com”,實(shí)際應(yīng)用時(shí)網(wǎng)絡(luò)域名或網(wǎng)址前綴和后綴不限于這些,只要是各種有線和無(wú)線的互聯(lián)網(wǎng)合法的域名或網(wǎng)址前綴和后綴便可,比如網(wǎng)址前綴還可以分別用FTP://、GOPHER://、TELNET://、NWES://, http://wap.等等類(lèi)型,比如網(wǎng)絡(luò)域名或網(wǎng)址后綴還可以分別用“.net " ·org” “· cn” “· cc” “· tv" . mobi " .biz" .info" . com. cn” 等等類(lèi)型。在以漢語(yǔ)語(yǔ)音碼作為輸入碼輸入多樣信息時(shí),如遇到聲母韻母聲調(diào)同時(shí)都相同的用漢字表達(dá)的漢語(yǔ)同音詞時(shí),根據(jù)需要可以將漢語(yǔ)的同音詞按以上兩種格式中的任意一種在候選框中逐條依次順號(hào)顯示,顯示時(shí)總是以漢字字符表示的漢語(yǔ)單詞開(kāi)始,表明后面的各個(gè)文種的對(duì)照項(xiàng)是與該漢字單詞意義相一致的對(duì)照項(xiàng),通過(guò)按每項(xiàng)前面的特定符號(hào)比如數(shù)字鍵或逐項(xiàng)輸入或?qū)φ蛰斎?。比如漢語(yǔ)語(yǔ)音碼“yxvlune”聲母韻母聲調(diào)同時(shí)都相同的用漢字表達(dá)的漢語(yǔ)同音詞有兩個(gè)“油輪”和“郵輪”,輸入漢語(yǔ)語(yǔ)音碼“yxvlune”后,對(duì)于需要逐項(xiàng)輸入的情況,在選擇候選框中按如下方法顯示1油輪2對(duì)應(yīng)油輪的外文3對(duì)應(yīng)油輪的少數(shù)民族文字4對(duì)應(yīng)yxvlune的網(wǎng)絡(luò)域名或網(wǎng)址5郵輪6對(duì)應(yīng)郵輪的外文7對(duì)應(yīng)郵輪的少數(shù)民族文字,鍵入前面的數(shù)字就可以實(shí)現(xiàn)逐項(xiàng)輸入。如果我們?yōu)榱送瑫r(shí)一次對(duì)照輸入,在候選顯示框中也可以采用如下方法顯示1油輪對(duì)應(yīng)油輪的外文對(duì)應(yīng)油輪的少數(shù)民族文字對(duì)應(yīng)yxvlune的網(wǎng)絡(luò)域名或網(wǎng)址2郵輪對(duì)應(yīng)郵輪的外文對(duì)應(yīng)郵輪的少數(shù)民族文字。鍵入前面的數(shù)字就可以實(shí)現(xiàn)各意義一致的對(duì)應(yīng)項(xiàng)同時(shí)一次輸入。以此類(lèi)推,當(dāng)對(duì)應(yīng)的外文和對(duì)應(yīng)的少數(shù)民族文字有更多種時(shí),采用上述相同的方法順號(hào)在相應(yīng)的位置上全部列出,遇更多個(gè)同音詞時(shí)仍然可以按照上面的方法,直至在候選顯示框中順號(hào)顯示完所有的同音詞及其與外文和少數(shù)民族文字的對(duì)應(yīng)項(xiàng)。由于對(duì)應(yīng)的yxvlune的網(wǎng)絡(luò)域名或網(wǎng)址在不同的漢字同音字詞中是相同的,因此在候選顯示框中可以只出現(xiàn)一次。由于在本發(fā)明中將獨(dú)立運(yùn)用的漢字看作單音節(jié)詞,因此,本發(fā)明所采用的對(duì)漢字的漢語(yǔ)語(yǔ)音碼的編碼方法和對(duì)漢語(yǔ)單詞音節(jié)的漢語(yǔ)語(yǔ)音碼的編碼方法相同,在本發(fā)明中采用單詞音節(jié)的漢語(yǔ)語(yǔ)音碼的編碼按詞連寫(xiě)后得到單詞的漢語(yǔ)語(yǔ)音碼的編碼,我們將由若干個(gè)單詞組成的一組詞稱(chēng)為詞組,由于單詞可以表示詞組和漢語(yǔ)句子,因此在本發(fā)明中所采 用的詞組的漢語(yǔ)語(yǔ)音碼的編碼和漢語(yǔ)句子的漢語(yǔ)語(yǔ)音碼的編碼都可以通過(guò)單詞的漢語(yǔ)語(yǔ)音碼的編碼實(shí)現(xiàn),而不需要對(duì)詞組和漢語(yǔ)句子另外制定一套專(zhuān)門(mén)的的漢語(yǔ)語(yǔ)音碼的編碼。這樣我們也就可以用與輸入漢語(yǔ)語(yǔ)音碼相同的方法實(shí)現(xiàn)詞組與詞組、句子與句子之間的多樣信息的對(duì)照候選并逐項(xiàng)或?qū)φ蛰斎搿?I)對(duì)照候選并逐項(xiàng)輸入比如在輸入框中輸入“wovmno huiu xrvydu hcuyyvlaadqawnv. ”則在候選顯示框中顯示1我們會(huì)使用漢語(yǔ)拉丁文。2 Women hui shiyonghanyu l0dlngwgn。3 We can use Chinese Latine。4 相應(yīng)的其它外文一組成的句子 5相應(yīng)的其它外文二組成的句子6相應(yīng)的少數(shù)民族文字一組成的句子7相應(yīng)的少數(shù)民族文字二組成的句子 8. http://www. wovmnohuiuxrvyduhcuyyvlaadqawnv. com0 分別鍵入 1、2、3、4、5、6、7、8就可以分別選中并輸入漢字、拼音、英文、相應(yīng)的外文一組成的句子、相應(yīng)的外文二組成的句子、相應(yīng)的少數(shù)民族文字一組成的句子、相應(yīng)的少數(shù)民族文字二組成的句子以及與所輸入的語(yǔ)音碼相對(duì)應(yīng)的網(wǎng)址。,這里需要強(qiáng)調(diào)的是在漢語(yǔ)語(yǔ)音碼以詞組、句子形式輸入時(shí),對(duì)應(yīng)網(wǎng)絡(luò)域名或網(wǎng)址中的漢語(yǔ)語(yǔ)音碼的詞組或句子里的單詞之間不空格,連在一起組成一個(gè)字符串,并以這個(gè)字符串為關(guān)鍵詞加各種網(wǎng)絡(luò)域名或網(wǎng)址前后綴就構(gòu)成了一個(gè)與所輸入的漢語(yǔ)語(yǔ)音碼相對(duì)應(yīng)的網(wǎng)絡(luò)域名或網(wǎng)址,之所以要這樣做,是因?yàn)楦鶕?jù)互聯(lián)網(wǎng)域名或網(wǎng)址的規(guī)定,組成互聯(lián)網(wǎng)域名或網(wǎng)址的關(guān)鍵詞的字符串之間不能有空格,如果以后規(guī)定可以有空格,我們也可以按有空格的形式來(lái)組成與所輸入的漢語(yǔ)語(yǔ)音碼相對(duì)應(yīng)的網(wǎng)絡(luò)域名或網(wǎng)址,之所以可以這樣做,這與本發(fā)明所用的漢語(yǔ)語(yǔ)音碼的聲調(diào)具有隔音節(jié)作用的特點(diǎn)有關(guān),由于本發(fā)明所用的漢語(yǔ)語(yǔ)音碼的聲調(diào)具有隔音節(jié)作用,這樣即使將任意多的音節(jié)連寫(xiě)在一起也不會(huì)發(fā)生音節(jié)與音節(jié)之間的相互混淆,仍舊可以將一個(gè)一個(gè)音節(jié)準(zhǔn)確讀出來(lái),從而根據(jù)這些漢語(yǔ)音節(jié)的讀音人們可以理解這串單詞與單詞連寫(xiě)在一起的漢語(yǔ)語(yǔ)音碼所代表的意義,同理對(duì)漢語(yǔ)語(yǔ)音碼詞組也一樣。這樣的格式排列可以方便選中輸入任意一個(gè)詞組、句子或網(wǎng)址候選項(xiàng)。(2)對(duì)照候選并對(duì)照輸入比如在輸入框中輸入“wovmno huiu xrvydu hcuyyvlaadqawnv. ”后,我們也可以讓候選顯示框按以下格式顯示1我們會(huì)使用漢語(yǔ)拉丁文。W0men hui shiyong hanyu Iadingwen。 wovmno huiu xrvydu hcuyyv laadqawnv.We can use Chinese Latine.相應(yīng)的其它外文一組成的句子相應(yīng)的其它外文二組成的句子相應(yīng)的少數(shù)民族文字一組成的句子相應(yīng)的少數(shù)民族文字二組成的句子、http://www. wovmnohuiuxrvyduhcuyyvlaadqawnv. com。鍵入I后就可以選中并同時(shí)對(duì)照輸入漢字、拼音、英文、相應(yīng)的其它外文一組成的句子、相應(yīng)的其它外文二組成的句子、相應(yīng)的少數(shù)民族文字一組成的句子、相應(yīng)的少數(shù)民族文字二組成的句子、http: //www.wovmnohuiuxrvyduhcuyyvlaadqawnv. com。對(duì)照輸入顯示除了按橫向?qū)φ蛰斎氡热缥覀儠?huì)使用漢語(yǔ)拉丁文。W0men hui shiyong hanyu IadIngwen0 wovmno huiu xrvydu hcuyyvlaadqawnv. We can use Chinese Latine.相應(yīng)的其它外文一組成的句子相應(yīng)的其它外文二組成的句子相應(yīng)的少數(shù)民族文字一組成的句子相應(yīng)的少數(shù)民族文字二組成的句子、http://www. wovmnohuiuxrvyduhcuyyvlaadqawnv. com。也可以根據(jù)設(shè)定按全部或部分按上
下豎式對(duì)照輸入顯示.比如根據(jù)選擇部分按上下豎式對(duì)照輸入顯示
權(quán)利要求
1. 一種計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)漢語(yǔ)語(yǔ)音碼全拼和簡(jiǎn)拼漢語(yǔ)全息信息處理方法,以下將計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)簡(jiǎn)稱(chēng)為計(jì)算機(jī)或計(jì)算機(jī)系統(tǒng),該信息處理的方法包括但不限于漢語(yǔ)全息信息用能夠識(shí)別西文的書(shū)寫(xiě)筆書(shū)寫(xiě)輸入、OCR西文光學(xué)掃描輸入、標(biāo)準(zhǔn)西文鍵盤(pán)鍵入、西文字母語(yǔ)音識(shí)別輸入、多樣信息輸入、印刷、打印、儲(chǔ)存、顯示、通訊、信息傳輸、語(yǔ)音識(shí)別、語(yǔ)音合成、漢語(yǔ)智能分詞、機(jī)器翻譯、信息搜索、各種計(jì)算機(jī)文件格式和網(wǎng)頁(yè)信息表示及顯示、與各種網(wǎng)絡(luò)合法域名前后綴組成網(wǎng)絡(luò)域名用于登陸相應(yīng)網(wǎng)站、漢字漢語(yǔ)編程、商標(biāo)的標(biāo)識(shí)的方法,它是建立在使用世界通用的計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)基礎(chǔ)上的方法,該漢語(yǔ)全息信息處理方法所采用的漢語(yǔ)語(yǔ)音碼有全拼和簡(jiǎn)拼兩種拼寫(xiě)法,其特征主要包括以下步驟 步驟A : (一)漢語(yǔ)語(yǔ)音碼簡(jiǎn)拼時(shí)所采用的漢語(yǔ)語(yǔ)音碼的每一音節(jié)聲、韻、調(diào)的編碼方法采用以下的方法 注括號(hào)內(nèi)的符號(hào)均為漢語(yǔ)拼音符號(hào),不帶括號(hào)的字母為所采用的漢語(yǔ)每一音節(jié)聲、韻、調(diào)的編碼,以上以下將下列聲、韻、調(diào)的對(duì)照編碼表簡(jiǎn)稱(chēng)為碼表 (1).用于表示漢語(yǔ)信息的語(yǔ)音碼的聲母全部采用一個(gè)拉丁字母表示,例如采用如下的輔音拉丁字母表示聲碼的編碼b (b) P : (P) m (m) f (f) d (d)t (t)η (η) I (I) g (g) k (k) h (h)j (zh), (j) q (ch), (q) x (sh), (x) r (r)z : (z) c : (c) s (s) y (y) w (w) (2).用于表示漢語(yǔ)信息的語(yǔ)音碼用26個(gè)字母中的一個(gè)拉丁字母來(lái)表示介母,例如用y來(lái)表示原來(lái)漢語(yǔ)拼音單韻母和介母中的(U),其余單韻母和介母的編碼采用與漢語(yǔ)拼音單韻母和介母相同的符號(hào),比如采用如下介母的編碼 i (i) u : (u) y (U) (3).用于表示漢語(yǔ)信息的語(yǔ)音碼除了部分帶有介母的復(fù)合韻母外,其余的復(fù)合韻母的韻碼在簡(jiǎn)拼時(shí)用一個(gè)拉丁字母來(lái)表示,比如用一個(gè)輔音字母表示,例如在漢語(yǔ)語(yǔ)音碼簡(jiǎn)拼時(shí)采用如下的韻碼的編碼a (a) ο (o) e (e) i (i) u (u) y (ii)z (ao) t (ai) c (an) s (ou) w (ei) n (en)k (ua) I (uo) g (ang) d (ong) b (eng) q (ing) P (ng) er (er)(無(wú)聲母韻母)(er用西文鍵盤(pán)鍵入時(shí)分別鍵入E和R兩個(gè)鍵) r:(i)[只與(zh)、(ch)、(sh)相拼] (4).用于表示漢語(yǔ)信息的語(yǔ)音碼其調(diào)碼可以用五個(gè)拉丁字母表示,也可以用5個(gè)阿拉伯?dāng)?shù)字表示,例如采用如下四個(gè)拉丁字母和一個(gè)漢語(yǔ)不用的字母V表示調(diào)碼的編碼 a ㈠陰平e : (/)陽(yáng)平V : ( V )上聲u :⑴去聲ο :(不標(biāo))輕聲 又例如采用如下5個(gè)阿拉伯?dāng)?shù)字表示調(diào)碼的編碼 1:(_)陰平2:(/)陽(yáng)平3:(V)上聲4:(\)去聲5 :(不標(biāo))輕聲 (二)利用上述編碼的漢語(yǔ)信息全息表示采用如下的方法以單詞為單位,這里將單個(gè)漢字看作單音節(jié)詞,根據(jù)組成該單詞的每個(gè)音節(jié)的《漢語(yǔ)拼音方案》中的拼音,在漢語(yǔ)語(yǔ)音碼全拼時(shí)除了 U的表示可以采用一個(gè)拉丁字母比如I表示夕卜,聲母表示和介母表示以及韻母表示均與漢語(yǔ)拼音方案相同,與漢語(yǔ)拼音方案所不同的是調(diào)碼采用一個(gè)拉丁字母或阿拉伯?dāng)?shù)字表示,且該調(diào)碼兼隔音節(jié)符號(hào),即漢語(yǔ)語(yǔ)音碼每一個(gè)音節(jié)依次按"漢語(yǔ)拼音相同的聲母+漢語(yǔ)拼音相同的介母+漢語(yǔ)拼音相同的韻母+調(diào)碼兼隔音節(jié)符號(hào)"的順序編碼,在漢語(yǔ)語(yǔ)音碼簡(jiǎn)拼時(shí)依次按"聲碼+介碼+韻碼+調(diào)碼兼隔音節(jié)符號(hào)"的順序編碼,無(wú)論是全拼和簡(jiǎn)拼,同一個(gè)單詞的多個(gè)音節(jié)不用空格隔開(kāi)連寫(xiě),單詞與單詞之間的編碼用空格隔開(kāi),組成單詞時(shí),單詞的每一個(gè)音節(jié)既可以全部用全拼或簡(jiǎn)拼音節(jié)組成,也可以將組成詞的任意一個(gè)音節(jié)根據(jù)需要采用全拼或簡(jiǎn)拼混合搭配組成,也即在組成單詞的多個(gè)音節(jié)中有的音節(jié)可以是簡(jiǎn)拼,有的音節(jié)可以是全拼,以下以上將漢語(yǔ)語(yǔ)音碼全拼和簡(jiǎn)拼統(tǒng)稱(chēng)為漢語(yǔ)語(yǔ)音碼或語(yǔ)音碼; 當(dāng)漢語(yǔ)信息處于全拼或簡(jiǎn)拼語(yǔ)音碼狀態(tài)時(shí),其標(biāo)點(diǎn)符號(hào)的用法同英文的標(biāo)點(diǎn)符號(hào)的用法相同; 步驟B : (一)根據(jù)需要漢字、漢語(yǔ)拼音、漢語(yǔ)語(yǔ)音碼全拼、漢語(yǔ)語(yǔ)音碼簡(jiǎn)拼相互之間可以通過(guò)漢字漢語(yǔ)拼音與漢語(yǔ)語(yǔ)音碼雙向轉(zhuǎn)換模塊實(shí)現(xiàn)雙向轉(zhuǎn)換; (二)漢語(yǔ)語(yǔ)音碼全拼、漢語(yǔ)語(yǔ)音碼簡(jiǎn)拼均可以通過(guò)相應(yīng)的模塊或方法來(lái)進(jìn)行語(yǔ)音識(shí)另IJ、語(yǔ)音合成、漢語(yǔ)智能分詞、機(jī)器翻譯、信息搜索、各種計(jì)算機(jī)文件格式和網(wǎng)頁(yè)信息表示及顯示、與各種網(wǎng)絡(luò)合法域名前后綴組成網(wǎng)絡(luò)域名用于登陸相應(yīng)網(wǎng)站、漢字漢語(yǔ)編程、商標(biāo)與域名統(tǒng)一標(biāo)識(shí)的信息處理; (三)漢語(yǔ)語(yǔ)音碼全拼、漢語(yǔ)語(yǔ)音碼簡(jiǎn)拼組成的漢語(yǔ)全息信息可以用一切處理西文的軟硬件資源來(lái)進(jìn)行信息處理,比如能夠用能夠識(shí)別西文的書(shū)寫(xiě)筆書(shū)寫(xiě)輸入、OCR西文光學(xué)掃描輸入、標(biāo)準(zhǔn)西文鍵盤(pán)鍵入、西文字母語(yǔ)音識(shí)別輸入; (四)漢語(yǔ)語(yǔ)音碼全拼或簡(jiǎn)拼可以單獨(dú)也可以與漢字、漢語(yǔ)拼音、外文、少數(shù)民族文字以及全拼或簡(jiǎn)拼進(jìn)行對(duì)照印刷、打印、儲(chǔ)存、顯示、通訊、信息傳輸。
2.如權(quán)利要求I所述的計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)漢語(yǔ)語(yǔ)音碼漢語(yǔ)全息信息處理方法,其進(jìn)一步特征在于漢語(yǔ)智能分詞采用一種主要基于與英語(yǔ)語(yǔ)法的詞法句法及其構(gòu)詞法基本相一致的新型漢語(yǔ)語(yǔ)法分析基礎(chǔ)上的計(jì)算機(jī)或嵌入式可移動(dòng)設(shè)備的漢字文本和與《漢語(yǔ)拼音方案》具有一一對(duì)應(yīng)關(guān)系的漢語(yǔ)拼音文本的分詞方法,其所用的新型漢語(yǔ)語(yǔ)法主要特點(diǎn)是詞法方面將漢語(yǔ)的詞類(lèi)分成名詞、代詞、數(shù)量詞、副詞、形容詞、動(dòng)詞、介詞、連詞、語(yǔ)氣詞和象聲詞;句法方面將漢語(yǔ)的句子成份劃為主語(yǔ)、謂語(yǔ)、賓語(yǔ)、表語(yǔ)、同位語(yǔ)、定語(yǔ)、狀語(yǔ)、補(bǔ)語(yǔ);將句子的復(fù)句分為并列復(fù)句和主從復(fù)句;主從復(fù)句又可以分為主語(yǔ)從句、賓語(yǔ)從句、表語(yǔ)從句、同位語(yǔ)從句、定語(yǔ)從句、狀語(yǔ)從句;將漢語(yǔ)動(dòng)詞時(shí)態(tài)分為過(guò)去時(shí)、現(xiàn)在時(shí)、現(xiàn)在將來(lái)時(shí)、過(guò)去將來(lái)時(shí);漢語(yǔ)動(dòng)詞體式分為一般式、進(jìn)行式、完成式、完成進(jìn)行式;建立漢語(yǔ)動(dòng)詞被動(dòng)語(yǔ)態(tài)和謂語(yǔ)動(dòng)詞的虛擬語(yǔ)氣;漢語(yǔ)的構(gòu)詞法方面主要通過(guò)在詞根基礎(chǔ)上加前綴、中綴、后綴、前后綴的方法以及詞根與詞根復(fù)合的方法來(lái)構(gòu)詞; 將漢語(yǔ)的非單個(gè)漢字或音節(jié)的專(zhuān)用名詞、代詞、數(shù)量詞、部分副詞、介詞、連詞、語(yǔ)氣詞和象聲詞、表征并列復(fù)句和各個(gè)從句的特征詞、動(dòng)詞各種時(shí)體系統(tǒng)、被動(dòng)語(yǔ)態(tài)、虛擬語(yǔ)氣的特征詞、構(gòu)詞法的前后綴分類(lèi)列入一級(jí)詞庫(kù),將主要表征漢語(yǔ)成語(yǔ)的四字詞、單音詞、形容詞、動(dòng)詞、未列入一級(jí)詞庫(kù)的其它名詞和副詞分類(lèi)列入二級(jí)詞庫(kù),將漢語(yǔ)的構(gòu)詞法的前綴、中綴、后綴、詞根分類(lèi)列入三級(jí)詞庫(kù); 在分詞時(shí)總是要利用句子或字符串的斷點(diǎn),從斷點(diǎn)左右兩側(cè)開(kāi)始對(duì)需要切分的漢字或音節(jié)進(jìn)行匹配切分,對(duì)所有已經(jīng)匹配成功的詞要加空格隔開(kāi)并在后臺(tái)作匹配完成標(biāo)識(shí),等全部完成切詞后再撤消該標(biāo)識(shí)回到原來(lái)的字體格式; 所利用斷點(diǎn)形成的位置主要包括但不限于句子的起首、句子的結(jié)尾、各種標(biāo)點(diǎn)符號(hào)、各種表示數(shù)量和序號(hào)的阿拉伯?dāng)?shù)字、各種特種符號(hào)、原來(lái)漢字或音節(jié)中合有的空格、上一級(jí)詞庫(kù)分詞以后所形成的斷點(diǎn); 分詞時(shí)第一步先用一級(jí)詞庫(kù)里的詞和前后綴,對(duì)需要分詞的整個(gè)文本中的漢字或音節(jié)進(jìn)行掃描,把經(jīng)掃描匹配成功的漢字或音節(jié)看作一個(gè)需要切分的詞進(jìn)行切分,前后綴匹配成功后,以前后綴為界將包括前后綴在內(nèi)的所有字符當(dāng)作一個(gè)詞切分,有不止一種匹配結(jié)果時(shí)以產(chǎn)生最少孤立漢字或音節(jié)的匹配結(jié)果為準(zhǔn); 一級(jí)詞庫(kù)分完后,從斷點(diǎn)的左右兩側(cè)依次分別取四個(gè)、兩個(gè)、三個(gè)以及一個(gè)沒(méi)有匹配成功的漢字或音節(jié),然后與二級(jí)詞庫(kù)里的詞進(jìn)行匹配,如果所取的漢字或音節(jié)匹配成功,并且對(duì)同一處理對(duì)象從斷點(diǎn)的左右兩側(cè)進(jìn)行正向和逆向匹配的結(jié)果相同,就認(rèn)為這是一個(gè)成功的匹配結(jié)果,如果匹配的結(jié)果不相同,產(chǎn)生最少孤立漢字或音節(jié)的匹配結(jié)果被認(rèn)為是成功的匹配; 二級(jí)詞庫(kù)分完詞后,在進(jìn)一步分詞時(shí),首先對(duì)照三級(jí)詞庫(kù)對(duì)未匹配成功的漢字或音節(jié)進(jìn)行前綴、后綴、中綴和詞根的匹配判斷,如果是前綴的話,向后吸收一個(gè)孤立漢字或音節(jié)構(gòu)成一個(gè)詞并作切分,如果后面是兩個(gè)匹配好的漢字或音節(jié),則與匹配好的這兩個(gè)漢字或音節(jié)結(jié)合,按三字詞切分;如果是后綴的話,向前吸收一個(gè)孤立漢字或音節(jié)構(gòu)成一個(gè)詞并作切分,如果前面是兩個(gè)匹配好的漢字或音節(jié),則與匹配好的這兩個(gè)漢字或音節(jié)結(jié)合,按三字詞切分;如果是中綴的話則吸收前面和后面各一個(gè)字或音節(jié)組成一個(gè)詞,如果吸收后導(dǎo)致前面或后面出現(xiàn)一個(gè)孤立的沒(méi)有匹配的漢字或音節(jié)時(shí),則要將這個(gè)漢字或音節(jié)吸收進(jìn)這個(gè)中綴組成的詞,一般組成的詞的漢字或音節(jié)數(shù)不超過(guò)四個(gè),如果是詞根的話,根據(jù)它前面能加字或音節(jié),還是后面能加字或音節(jié),還是前后都能加字或音節(jié)的情況,分別采用前綴、后綴、中綴的切詞方法進(jìn)行切詞,以上方法所切分到的詞,當(dāng)在同一篇文檔中的不同句子中累計(jì)出現(xiàn)次數(shù)不少于兩次時(shí),系統(tǒng)自動(dòng)將該詞存入二級(jí)詞庫(kù); 當(dāng)用以上三個(gè)詞庫(kù)切分完后,句子中仍然出現(xiàn)未匹配成功的漢字或音節(jié)串,或者雖然匹配成功但屬于三個(gè)以上連續(xù)孤立的漢字或音節(jié)串時(shí),把它們合并在一起組成一個(gè)詞來(lái)切分,以上方法所切分到的詞,當(dāng)在同一篇文檔中的不同句子中累計(jì)出現(xiàn)次數(shù)不少于兩次時(shí),系統(tǒng)會(huì)根據(jù)設(shè)定自動(dòng)或經(jīng)人工確認(rèn)后將其存入一級(jí)詞庫(kù); 對(duì)最后的分詞結(jié)果和檢查規(guī)則還可以進(jìn)行人工干預(yù)修改,對(duì)人工干預(yù)形成的新詞根據(jù)詞的特點(diǎn)經(jīng)人工確認(rèn)后分類(lèi)存入一級(jí)詞庫(kù)或二級(jí)詞庫(kù),各級(jí)詞庫(kù)里的詞還可以進(jìn)行人工增刪,且詞庫(kù)里的詞按高頻優(yōu)先分類(lèi)排列在前的原則排列,當(dāng)達(dá)到一定閥值時(shí),經(jīng)人工確認(rèn)系統(tǒng)可以將二級(jí)詞庫(kù)里的詞分類(lèi)提升到一級(jí)詞庫(kù),一級(jí)詞庫(kù)里的詞分類(lèi)下降到二級(jí)詞庫(kù),以上以下將該智能分詞步驟稱(chēng)為分詞模塊。
3.如權(quán)利要求I所述的計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)漢語(yǔ)語(yǔ)音碼漢語(yǔ)全息信息處理方法,其進(jìn)一步特征在于在漢字或漢語(yǔ)拼音轉(zhuǎn)換成漢語(yǔ)語(yǔ)音碼時(shí),漢字先轉(zhuǎn)換成漢語(yǔ)拼音,遇異音同形字時(shí)將可能的漢語(yǔ)拼音全部列出,漢語(yǔ)拼音則無(wú)須先轉(zhuǎn)換,然后再根據(jù)碼表先轉(zhuǎn)換成相應(yīng)的漢語(yǔ)音節(jié)語(yǔ)音碼串,然后在調(diào)用預(yù)先儲(chǔ)存在計(jì)算機(jī)系統(tǒng)中的分詞模塊再進(jìn)行按詞切分; 對(duì)已經(jīng)分過(guò)詞的漢字和漢語(yǔ)拼音轉(zhuǎn)換成漢語(yǔ)語(yǔ)音碼后則不必再進(jìn)行單詞切分,仍以原來(lái)的單詞為單位進(jìn)行轉(zhuǎn)換; 當(dāng)漢語(yǔ)語(yǔ)音碼需要轉(zhuǎn)換成漢語(yǔ)拼音時(shí),既可以采用查預(yù)先儲(chǔ)存在計(jì)算機(jī)系統(tǒng)中的碼表,也可以查通過(guò)該碼表生成的以音節(jié)或詞為單位的漢語(yǔ)語(yǔ)音碼與以音節(jié)或詞為單位的漢語(yǔ)拼音對(duì)照表,匹配后輸出相應(yīng)的漢語(yǔ)拼音; 當(dāng)漢語(yǔ)語(yǔ)音碼需要轉(zhuǎn)換成漢字時(shí),既可以先轉(zhuǎn)換成以詞為單位的漢語(yǔ)拼音再轉(zhuǎn)換成以詞為單位的漢字,也可以直接采用查預(yù)先儲(chǔ)存在計(jì)算機(jī)系統(tǒng)中的語(yǔ)音碼與以詞為單位的漢字對(duì)照表、匹配后輸出相應(yīng)的漢字; 遇同音詞時(shí),先依據(jù)漢語(yǔ)詞法句法上下文聯(lián)系及統(tǒng)計(jì)規(guī)律等手段進(jìn)行判別,判別后再進(jìn)行以詞為單位的漢字選定; 當(dāng)需要將全拼的漢語(yǔ)語(yǔ)音碼轉(zhuǎn)換成簡(jiǎn)拼的漢語(yǔ)語(yǔ)音碼時(shí),通過(guò)查預(yù)先存儲(chǔ)在計(jì)算機(jī)中的碼表,將全拼的漢語(yǔ)語(yǔ)音碼的聲母、介母、韻母換成簡(jiǎn)拼的漢語(yǔ)語(yǔ)音碼的聲碼、介碼和韻碼,調(diào)碼保持不變,或調(diào)碼用阿拉伯?dāng)?shù)字或一個(gè)拉丁字母表示; 反之當(dāng)需要將簡(jiǎn)拼的漢語(yǔ)語(yǔ)音碼轉(zhuǎn)換成全拼的漢語(yǔ)語(yǔ)音碼時(shí),通過(guò)查預(yù)先存儲(chǔ)在計(jì)算機(jī)中的碼表,將簡(jiǎn)拼的漢語(yǔ)語(yǔ)音碼的聲碼、介碼和韻碼換成全拼的漢語(yǔ)語(yǔ)音碼的聲母、介母、韻母,調(diào)碼保持不變,或用阿拉伯?dāng)?shù)字或一個(gè)拉丁字母表示; 當(dāng)需要僅將漢語(yǔ)語(yǔ)音碼的調(diào)碼進(jìn)行阿拉伯?dāng)?shù)字表示的調(diào)碼和拉丁字母表示的調(diào)碼之間進(jìn)行雙向轉(zhuǎn)換時(shí),根據(jù)碼表將阿拉伯?dāng)?shù)字表示的調(diào)碼轉(zhuǎn)換成拉丁字母表示的調(diào)碼或根據(jù)碼表將拉丁字母表示的調(diào)碼轉(zhuǎn)換成阿拉伯?dāng)?shù)字表示的調(diào)碼便可,其它全拼漢語(yǔ)語(yǔ)音碼的聲母、介母、韻母和簡(jiǎn)拼漢語(yǔ)語(yǔ)音碼的聲碼、介碼和韻碼則保持不變; 在漢語(yǔ)語(yǔ)音碼轉(zhuǎn)換成漢字和漢語(yǔ)拼音時(shí),其標(biāo)點(diǎn)符號(hào)也從與英文相同的狀態(tài)轉(zhuǎn)變?yōu)橄鄳?yīng)的中文標(biāo)點(diǎn)符號(hào)狀態(tài),以上以下將該步驟的方法稱(chēng)為漢字漢語(yǔ)拼音與漢語(yǔ)語(yǔ)音碼雙向轉(zhuǎn)換模塊。
4.如權(quán)利要求I所述的計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)漢語(yǔ)語(yǔ)音碼漢語(yǔ)全息信息處理方法,其進(jìn)一步特征在于當(dāng)漢語(yǔ)語(yǔ)音碼轉(zhuǎn)換成漢語(yǔ)語(yǔ)音時(shí),可以分別采用查漢語(yǔ)語(yǔ)音碼中的漢語(yǔ)音節(jié)與漢語(yǔ)音節(jié)語(yǔ)音合成文件對(duì)照表、以詞為單位的漢語(yǔ)語(yǔ)音碼與漢語(yǔ)單詞語(yǔ)音合成文件對(duì)照表,還可以通過(guò)最大匹配法,采用查以最大語(yǔ)段為單位的漢語(yǔ)語(yǔ)音碼串和漢語(yǔ)語(yǔ)段語(yǔ)音合成文件對(duì)照表輸出相應(yīng)的漢語(yǔ)語(yǔ)音,當(dāng)將上述漢語(yǔ)語(yǔ)音碼或漢語(yǔ)語(yǔ)音碼串所分別對(duì)應(yīng)的音節(jié)、單詞或語(yǔ)段的語(yǔ)音合成文件分別換成漢語(yǔ)特定人、中國(guó)方言、少數(shù)民族語(yǔ)言的語(yǔ)音合成文件時(shí),通過(guò)查漢語(yǔ)語(yǔ)音碼或漢語(yǔ)語(yǔ)音碼串與相應(yīng)音節(jié)、單詞或語(yǔ)段的語(yǔ)音合成 文件對(duì)照表,可以分別輸出相應(yīng)的漢語(yǔ)特定人、中國(guó)方言、少數(shù)民族語(yǔ)言的語(yǔ)音,當(dāng)合成外語(yǔ)語(yǔ)音時(shí),要進(jìn)行查以詞、詞組或短語(yǔ)為單位的漢語(yǔ)語(yǔ)音碼和相應(yīng)外語(yǔ)單詞、外語(yǔ)詞組或外語(yǔ)短語(yǔ)語(yǔ)音合成文件對(duì)照表輸出相應(yīng)的外語(yǔ)單詞、外語(yǔ)詞組或外語(yǔ)短語(yǔ)的語(yǔ)音,對(duì)需要輸入漢語(yǔ)每一個(gè)音節(jié)的聲母、介母、韻母和聲調(diào)信息才能進(jìn)行漢語(yǔ)語(yǔ)音合成的系統(tǒng),可以根據(jù)碼表將漢語(yǔ)語(yǔ)音碼轉(zhuǎn)換成漢語(yǔ)拼音聲母、介母、韻母和聲調(diào)的信息后,再輸入到漢語(yǔ)語(yǔ)音合成系統(tǒng)中進(jìn)行漢語(yǔ)語(yǔ)音合成,當(dāng)對(duì)漢語(yǔ)語(yǔ)音碼文章中的標(biāo)點(diǎn)符號(hào)和移行號(hào)進(jìn)行語(yǔ)音合成時(shí),我們只要將相應(yīng)的預(yù)先儲(chǔ)存在計(jì)算機(jī)中的漢語(yǔ)的六種點(diǎn)號(hào)七種標(biāo)號(hào)和一個(gè)移行號(hào)的聲音文件提取出來(lái),用聲音播放軟件進(jìn)行播放便可; 當(dāng)該語(yǔ)音合成文件是漢語(yǔ)的語(yǔ)音合成文件時(shí),則該標(biāo)點(diǎn)符號(hào)或移行號(hào)朗讀出來(lái)的聲音便是漢語(yǔ)相應(yīng)的標(biāo)點(diǎn)符號(hào)或移行號(hào)的聲音,當(dāng)該語(yǔ)音合成文件分別是漢語(yǔ)特定人、中國(guó)方言、少數(shù)民族語(yǔ)言的語(yǔ)音合成文件時(shí),則該標(biāo)點(diǎn)符號(hào)或移行號(hào)朗讀出來(lái)的聲音便分別是漢語(yǔ)特定人、中國(guó)方言、少數(shù)民族語(yǔ)言的相應(yīng)的標(biāo)點(diǎn)符號(hào)或移行號(hào)的聲音,當(dāng)輸入的是用漢字或漢語(yǔ)拼音表達(dá)的漢語(yǔ)信息時(shí),漢字或漢語(yǔ)拼音可以通過(guò)預(yù)先儲(chǔ)存在計(jì)算機(jī)系統(tǒng)中的漢字漢語(yǔ)拼音與漢語(yǔ)語(yǔ)音碼雙向轉(zhuǎn)換模塊,先轉(zhuǎn)換成全拼或簡(jiǎn)拼漢語(yǔ)語(yǔ)音碼再進(jìn)行上述漢語(yǔ)、漢語(yǔ)特定人、中國(guó)方言、少數(shù)民族語(yǔ)言、外語(yǔ)單詞、外語(yǔ)詞組或外語(yǔ)短語(yǔ)的語(yǔ)音轉(zhuǎn)換; 在漢語(yǔ)語(yǔ)音轉(zhuǎn)換成漢語(yǔ)語(yǔ)音碼時(shí),漢語(yǔ)語(yǔ)音識(shí)別系統(tǒng)可以依次分別將漢語(yǔ)語(yǔ)段、漢語(yǔ)單詞、漢語(yǔ)音節(jié)作為識(shí)別的基元,通過(guò)查找預(yù)先儲(chǔ)存在計(jì)算機(jī)中的漢語(yǔ)語(yǔ)段語(yǔ)音模板和漢語(yǔ)語(yǔ)段語(yǔ)音碼對(duì)照表、漢語(yǔ)單詞語(yǔ)音模板和漢語(yǔ)單詞語(yǔ)音碼對(duì)照表、漢語(yǔ)音節(jié)語(yǔ)音模板和漢語(yǔ)語(yǔ)音音節(jié)碼對(duì)照表,匹配后識(shí)別出相應(yīng)的漢語(yǔ)語(yǔ)段語(yǔ)音碼、漢語(yǔ)單詞語(yǔ)音碼、漢語(yǔ)音節(jié)語(yǔ)音碼,語(yǔ)音連續(xù)輸入時(shí)便依次分別得到連續(xù)的漢語(yǔ)語(yǔ)段語(yǔ)音碼串、漢語(yǔ)單詞語(yǔ)音碼串、漢語(yǔ)音節(jié)語(yǔ)音碼串,對(duì)上述得到漢語(yǔ)音節(jié)語(yǔ)音碼串通過(guò)預(yù)先儲(chǔ)存在計(jì)算機(jī)系統(tǒng)中的分詞模塊進(jìn)行按詞切分,對(duì)已經(jīng)分過(guò)詞的漢語(yǔ)單詞語(yǔ)音碼串和漢語(yǔ)語(yǔ)段語(yǔ)音碼串則不必再進(jìn)行單詞切分,對(duì)切分出的單詞采取同一單詞的音節(jié)與音節(jié)之間連寫(xiě),單詞與單詞之間空格的方式表示,當(dāng)漢語(yǔ)語(yǔ)音碼需要進(jìn)一步轉(zhuǎn)換成漢字或漢語(yǔ)拼音時(shí),通過(guò)預(yù)先儲(chǔ)存在計(jì)算機(jī)系統(tǒng)中的漢字漢語(yǔ)拼音與漢語(yǔ)語(yǔ)音碼雙向轉(zhuǎn)換模塊轉(zhuǎn)換輸出相應(yīng)的漢字或漢語(yǔ)拼音,對(duì)于漢語(yǔ)語(yǔ)音是帶某種方言口音的漢語(yǔ)或某一種中國(guó)的方言,只要這種中國(guó)的方言的音節(jié)或單詞或語(yǔ)段分別與漢語(yǔ)音節(jié)或單詞或語(yǔ)段具有某種對(duì)應(yīng)關(guān)系,我們通過(guò)以上相類(lèi)似的方法即通過(guò)查找預(yù)先儲(chǔ)存在計(jì)算機(jī)中的帶某種方言口音的漢語(yǔ)的漢語(yǔ)音節(jié)或單詞或語(yǔ)段的語(yǔ)音模板與漢語(yǔ)音節(jié)或單詞或語(yǔ)段語(yǔ)音碼對(duì)照表,以及具有某種對(duì)應(yīng)關(guān)系的方言音節(jié)或單詞或語(yǔ)段的語(yǔ)音模板和漢語(yǔ)語(yǔ)音音節(jié)碼或單詞或語(yǔ)段對(duì)照表,匹配后識(shí)別出相應(yīng)的漢語(yǔ)音節(jié)或單詞或語(yǔ)段語(yǔ)音碼串,就可以實(shí)現(xiàn)對(duì)該帶某種方言口音的漢語(yǔ)或方言的漢語(yǔ)語(yǔ)音碼識(shí)別,實(shí)現(xiàn)該帶某種方言口音的漢語(yǔ)或方言與漢語(yǔ)語(yǔ)音碼的轉(zhuǎn)換,以上以下將該步驟方法稱(chēng)為漢語(yǔ)語(yǔ)音碼語(yǔ)音合成與識(shí)別模塊。
5.如權(quán)利要求I所述的計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)漢語(yǔ)語(yǔ)音碼漢語(yǔ)全息信息處理方法,其進(jìn)一步特征在于所采用的漢語(yǔ)與外語(yǔ)的雙向機(jī)器翻譯的方法,是在建立源語(yǔ)言與目標(biāo)語(yǔ)言基本相一致的詞法句法基礎(chǔ)上,通過(guò)漢語(yǔ)與外語(yǔ)雙向句型轉(zhuǎn)換,來(lái)實(shí)現(xiàn)漢語(yǔ)與外語(yǔ)的雙向機(jī)器翻譯,這里的機(jī)器翻譯所用的機(jī)器是指世界通用的計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng),以下簡(jiǎn)稱(chēng)為計(jì)算機(jī)或計(jì)算機(jī)系統(tǒng),這里的詞法就是關(guān)于詞類(lèi)的定義和劃分以及研究單詞、詞形的變化及其用法,句法就是是關(guān)于句子成分的定義和劃分以及研究句子種類(lèi)、句子結(jié)構(gòu)及其內(nèi)部形式,句型就是句子內(nèi)部各個(gè)單詞、詞組、短語(yǔ)、從句的詞性或相當(dāng)詞性及其在句子中所擔(dān)當(dāng)成分的排列順序及其形式,翻譯前首先運(yùn)用人工的方法建立同一種語(yǔ)言句子的詞性串與句型的對(duì)應(yīng)關(guān)系,然后再在建立漢語(yǔ)與需要翻譯的外語(yǔ)基本相一致的詞法系統(tǒng)和句法系統(tǒng)基礎(chǔ)上,建立所需要翻譯的兩種語(yǔ)言間的句型對(duì)照關(guān)系并儲(chǔ)存在計(jì)算機(jī)中,翻譯時(shí)機(jī)器先掃描源語(yǔ)言的句子,通過(guò)查預(yù)先儲(chǔ)存在計(jì)算機(jī)中的源語(yǔ)言標(biāo)注詞性的詞典得到源語(yǔ)言的句子的詞性串,通過(guò)查預(yù)先儲(chǔ)存在計(jì)算機(jī)中的源語(yǔ)言詞性串與源語(yǔ)言句型的對(duì)應(yīng)關(guān)系表,將源語(yǔ)言的句子的詞性串轉(zhuǎn)換成對(duì)應(yīng)的源語(yǔ)言句型,再通過(guò)查預(yù)先儲(chǔ)存在計(jì)算機(jī)中的源語(yǔ)言句型與目標(biāo)語(yǔ)言句型對(duì)照表,將源語(yǔ)言句型轉(zhuǎn)換成匹配的目標(biāo)語(yǔ)言句型,最后通過(guò)查預(yù)先儲(chǔ)存在計(jì)算機(jī)中的源語(yǔ)言與目標(biāo)語(yǔ)言對(duì)照詞典的方法,將源語(yǔ)言中的單詞或詞組翻譯成目標(biāo)語(yǔ)言的單詞或詞組,并按目標(biāo)語(yǔ)言句型的順序以詞為單位排列輸出,便得到我們所需要的目標(biāo)語(yǔ)言語(yǔ)句; 對(duì)源語(yǔ)言中的復(fù)句先進(jìn)行語(yǔ)法分析將復(fù)句中的所有從句提取出來(lái),通過(guò)層層提取直到最后將從句提成單句為止,再按上述翻譯單句的方式進(jìn)行機(jī)器翻譯,復(fù)句部分則通過(guò)查預(yù)先儲(chǔ)存在計(jì)算機(jī)中的源語(yǔ)言和目標(biāo)語(yǔ)言句型對(duì)照表完成復(fù)句句型轉(zhuǎn)換,并完成除從句的復(fù)句其它成分的翻譯,最后將翻譯好的從句放入轉(zhuǎn)換后相應(yīng)復(fù)句句型中的相應(yīng)位置,如此循環(huán)往復(fù)一直到得到我們所需要的整個(gè)目標(biāo)語(yǔ)言句子為止; 當(dāng)源語(yǔ)言是用漢字或漢語(yǔ)拼音或漢語(yǔ)語(yǔ)音表達(dá)的漢語(yǔ)時(shí),通過(guò)預(yù)先儲(chǔ)存在計(jì)算機(jī)中的漢字漢語(yǔ)拼音與漢語(yǔ)語(yǔ)音碼雙向轉(zhuǎn)換模塊、漢語(yǔ)語(yǔ)音碼語(yǔ)音合成和識(shí)別模塊先將漢字或漢語(yǔ)拼音或漢語(yǔ)語(yǔ)音轉(zhuǎn)換成漢語(yǔ)語(yǔ)音碼再進(jìn)行翻譯,外語(yǔ)翻漢語(yǔ)時(shí),翻譯得到的用漢語(yǔ)語(yǔ)音 碼表示的目標(biāo)語(yǔ)言或直接用于表達(dá)漢語(yǔ)信息,或必要時(shí)通過(guò)預(yù)先儲(chǔ)存在計(jì)算機(jī)中的漢字漢語(yǔ)拼音與漢語(yǔ)語(yǔ)音碼雙向轉(zhuǎn)換模塊和漢語(yǔ)語(yǔ)音碼語(yǔ)音合成和識(shí)別模塊轉(zhuǎn)換成漢字或漢語(yǔ)拼音或漢語(yǔ)語(yǔ)音或漢語(yǔ)特定人或漢語(yǔ)方言以及少數(shù)民族語(yǔ)言語(yǔ)音輸出; 對(duì)于源語(yǔ)言中的文言文、詩(shī)詞、成語(yǔ)、典故、俚語(yǔ)、縮略語(yǔ)等不便進(jìn)行語(yǔ)法分析的內(nèi)容,不進(jìn)行詞性查詢和句型轉(zhuǎn)換,在詞性查詢和句型轉(zhuǎn)換前直接通過(guò)查找預(yù)先儲(chǔ)存在機(jī)器中的一一對(duì)應(yīng)的實(shí)例庫(kù)匹配后輸出; 當(dāng)將該翻譯方法用到的與漢語(yǔ)對(duì)應(yīng)的各個(gè)要素如漢語(yǔ)標(biāo)注詞性的詞典、漢語(yǔ)人工建立的詞性串與漢語(yǔ)句型對(duì)照表以及漢語(yǔ)與目標(biāo)外語(yǔ)句型轉(zhuǎn)換對(duì)照表?yè)Q成另外一種外語(yǔ)翻譯時(shí)相應(yīng)用到的上述各個(gè)要素并預(yù)先儲(chǔ)存在計(jì)算機(jī)中的時(shí),上述翻譯方法還能夠擴(kuò)展成一種外語(yǔ)翻譯成另外一種外語(yǔ)的機(jī)器翻譯方法,以上以下將該步驟的方法稱(chēng)為漢語(yǔ)語(yǔ)音碼漢語(yǔ)外文雙向翻譯模塊。
6.如權(quán)利要求I所述的計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)漢語(yǔ)語(yǔ)音碼漢語(yǔ)全息信息處理方法,其進(jìn)一步特征在于所采用的登陸各種網(wǎng)站或電子郵箱的網(wǎng)址是各種含有全拼和簡(jiǎn)拼的漢語(yǔ)語(yǔ)音碼的合法網(wǎng)址,網(wǎng)站既可以采用以全拼和簡(jiǎn)拼的漢語(yǔ)語(yǔ)音碼為詞干加各種合法網(wǎng)址的前后綴組成,電子郵箱采用全拼和簡(jiǎn)拼的漢語(yǔ)語(yǔ)音碼為詞干+0+各種電子郵箱的合法后綴組成,也可以將全拼和簡(jiǎn)拼的漢語(yǔ)語(yǔ)音碼與各種合法網(wǎng)址的前后綴以及各種電子郵箱的合法后綴建立對(duì)應(yīng)關(guān)系,全部用全拼或簡(jiǎn)拼的漢語(yǔ)語(yǔ)音碼來(lái)向計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)輸入各種網(wǎng)址和電子郵箱地址,在漢語(yǔ)語(yǔ)音碼以詞組、句子形式組成網(wǎng)址或電子郵箱地址時(shí),對(duì)應(yīng)網(wǎng)絡(luò)域名或電子郵箱地址的漢語(yǔ)語(yǔ)音碼的詞組或句子里的所有單詞相互之間不空格,輸入時(shí)既可以通過(guò)標(biāo)準(zhǔn)西文鍵盤(pán)輸入,也可以通過(guò)西文手寫(xiě)識(shí)別、西文光學(xué)識(shí)別、西文字母語(yǔ)音識(shí)別和漢語(yǔ)語(yǔ)音碼語(yǔ)音識(shí)別的方式輸入,當(dāng)向計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)發(fā)出預(yù)先存入其中的與某網(wǎng)站的網(wǎng)址或電子郵箱地址相對(duì)應(yīng)的語(yǔ)音時(shí),計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)會(huì)查找預(yù)先儲(chǔ)存在計(jì)算機(jī)中與該語(yǔ)音相對(duì)應(yīng)的網(wǎng)址或電子郵箱地址,并在瀏覽器地址欄中顯示與該語(yǔ)音相對(duì)應(yīng)的網(wǎng)址或電子郵箱地址,并打開(kāi)相應(yīng)的網(wǎng)頁(yè)或網(wǎng)站或電子郵箱,瀏覽器可以預(yù)先人工打開(kāi),也可以在計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)聽(tīng)到語(yǔ)音信號(hào)后根據(jù)預(yù)先對(duì)計(jì)算機(jī)系統(tǒng)的設(shè)定自動(dòng)打開(kāi),網(wǎng)站打開(kāi)后,計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)可以繼續(xù)識(shí)別后續(xù)的語(yǔ)音,經(jīng)識(shí)別搜索后,打開(kāi)該網(wǎng)站的相應(yīng)網(wǎng)頁(yè)或光標(biāo)指向相應(yīng)的網(wǎng)頁(yè)內(nèi)容,并根據(jù)預(yù)先的設(shè)定計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)做進(jìn)一步的后續(xù)處理,以上以上將該步驟的方法稱(chēng)作為漢語(yǔ)語(yǔ)音碼域名轉(zhuǎn)換和網(wǎng)頁(yè)登陸模塊。
7.如權(quán)利要求I所述的計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)漢語(yǔ)語(yǔ)音碼漢語(yǔ)全息信息處理方法,其進(jìn)一步特征在于用于多樣信息輸入的漢語(yǔ)語(yǔ)音碼既可以通過(guò)標(biāo)準(zhǔn)西文鍵盤(pán)輸入,也可以通過(guò)西文手寫(xiě)識(shí)別、西文光學(xué)識(shí)別、西文字母語(yǔ)音識(shí)別和漢語(yǔ)語(yǔ)音碼語(yǔ)音識(shí)別的方式輸入,當(dāng)向編碼輸入框中輸入漢語(yǔ)語(yǔ)音碼時(shí),與該漢語(yǔ)語(yǔ)音碼所表示的意義相一致的多樣信息所包括的各對(duì)應(yīng)項(xiàng)可以根據(jù)設(shè)定全部或部分先出現(xiàn)在候選輸入框中,經(jīng)選擇確認(rèn)后最終輸入到所需輸入的計(jì)算機(jī)或各種手持嵌入式可移動(dòng)設(shè)備中,所輸入的多樣信息主要包括但不限于與所輸入的漢語(yǔ)語(yǔ)音碼意義相一致的以詞、詞組、句子為單位的漢字、傳統(tǒng)《漢語(yǔ)拼音方案》中所使用的漢語(yǔ)拼音、漢語(yǔ)語(yǔ)音碼全拼和簡(jiǎn)拼、與傳統(tǒng)《漢語(yǔ)拼音方案》具有一一對(duì)應(yīng)關(guān)系的其它各種漢語(yǔ)拼音、外文、中國(guó)少數(shù)民族文字以及與所輸入的漢語(yǔ)語(yǔ)音碼全拼和簡(jiǎn)拼相對(duì)應(yīng)的各種有線和無(wú)線網(wǎng)絡(luò)域名或網(wǎng)址,根據(jù)系統(tǒng)設(shè)定所輸入的漢語(yǔ)語(yǔ)音碼全拼和簡(jiǎn)拼相對(duì)應(yīng)的各種有線和無(wú)線網(wǎng)絡(luò)域名或網(wǎng)址可以根據(jù)對(duì)應(yīng)的碼表相互自動(dòng)轉(zhuǎn)換,當(dāng)向編碼輸入框中輸入漢語(yǔ)語(yǔ)音碼時(shí),如遇到聲母、韻母、聲調(diào)全部相同的漢語(yǔ)同音字詞,則在候選輸入框中分別用特定字符比如阿拉伯?dāng)?shù)字順序全部列出這些同音字詞及其與其意義相一致的外文、少數(shù)民族文字,經(jīng)選擇確認(rèn)后最終輸入到所需輸入的計(jì)算機(jī)或各種手持嵌入式可移動(dòng)設(shè)備中; 與所輸入的漢語(yǔ)語(yǔ)音碼相對(duì)應(yīng)的各種有線和無(wú)線網(wǎng)絡(luò)域名或網(wǎng)址,可以直接通過(guò)各種合法的有線和無(wú)線網(wǎng)絡(luò)域名或網(wǎng)址的前綴+所輸入的漢語(yǔ)語(yǔ)音碼+各種合法有線和無(wú)線網(wǎng)絡(luò)域名或網(wǎng)址的后綴組成來(lái)得到,也可以通過(guò)調(diào)用漢語(yǔ)語(yǔ)音碼域名轉(zhuǎn)換和網(wǎng)頁(yè)登陸模塊轉(zhuǎn)換來(lái)得到,在漢語(yǔ)語(yǔ)音碼以詞組、句子形式輸入時(shí),對(duì)應(yīng)網(wǎng)絡(luò)域名或網(wǎng)址中的漢語(yǔ)語(yǔ)音碼的詞組或句子里的所有單詞相互之間不空格,當(dāng)出現(xiàn)漢字的同音字詞時(shí),與所輸入的漢語(yǔ)語(yǔ)音碼相對(duì)應(yīng)的各種有線和無(wú)線網(wǎng)絡(luò)域名或網(wǎng)址不變; 當(dāng)向編碼輸入框中輸入漢語(yǔ)語(yǔ)音碼后,在候選輸入框中顯示的多樣信息所包括的各對(duì)應(yīng)項(xiàng)既可以在每一對(duì)應(yīng)項(xiàng)前加特定字符如阿拉伯?dāng)?shù)字,通過(guò)鍵入該特定字符來(lái)進(jìn)行單項(xiàng)對(duì)應(yīng)項(xiàng)的輸入顯示,也可以將包括輸入的漢語(yǔ)語(yǔ)音碼在內(nèi)的所有多樣信息所包括的對(duì)應(yīng)項(xiàng)僅用一個(gè)特定字符如阿拉伯?dāng)?shù)字來(lái)標(biāo)識(shí),通過(guò)鍵入該特定字符來(lái)進(jìn)行所有多樣信息所包括的各對(duì)應(yīng)項(xiàng)的同時(shí)一次性對(duì)照輸入顯示; 通過(guò)建立多樣信息各對(duì)應(yīng)項(xiàng)之間的對(duì)應(yīng)關(guān)系,當(dāng)向輸入框中輸入多樣信息對(duì)應(yīng)項(xiàng)中的任意一項(xiàng)時(shí),多樣信息所包括的其它各對(duì)應(yīng)項(xiàng)就會(huì)以預(yù)先設(shè)定的格式在候選輸入框中顯示,經(jīng)選擇確認(rèn)后最終以所設(shè)定的顯示格式輸入到所需輸入的計(jì)算機(jī)或各種手持嵌入式可移動(dòng)設(shè)備中。
8.如權(quán)利要求I所述的計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)漢語(yǔ)語(yǔ)音碼漢語(yǔ)全息信息處理方法,其進(jìn)一步特征在于在進(jìn)行漢語(yǔ)編程時(shí),首先將編程用的計(jì)算機(jī)語(yǔ)言關(guān)鍵詞和語(yǔ)句及其組成語(yǔ)句的關(guān)鍵詞,根據(jù)它們?cè)跐h語(yǔ)中的意義或功用翻譯成用漢字和漢語(yǔ)拼音以及漢語(yǔ)語(yǔ)音碼全拼及簡(jiǎn)拼關(guān)鍵詞表達(dá)的漢語(yǔ)信息,并建立一一對(duì)應(yīng)的關(guān)鍵詞對(duì)照表預(yù)先儲(chǔ)存在計(jì)算機(jī)中; 任何計(jì)算機(jī)和可移動(dòng)嵌入式計(jì)算機(jī)系統(tǒng)軟件程序都是一個(gè)文本文件,在用漢語(yǔ)進(jìn)行計(jì)算機(jī)和可移動(dòng)嵌入式計(jì)算機(jī)系統(tǒng)軟件編程時(shí),可以用與編程用的關(guān)鍵詞和語(yǔ)句及其組成語(yǔ)句的關(guān)鍵詞一一對(duì)應(yīng)的漢字關(guān)鍵詞或漢語(yǔ)拼音關(guān)鍵詞或漢語(yǔ)語(yǔ)音碼全拼及簡(jiǎn)拼關(guān)鍵詞進(jìn)行編程,除計(jì)算機(jī)編程語(yǔ)言的關(guān)鍵詞和語(yǔ)句及其組成語(yǔ)句的關(guān)鍵詞要改用漢字關(guān)鍵詞或漢語(yǔ)拼音關(guān)鍵詞或漢語(yǔ)語(yǔ)音碼全拼及簡(jiǎn)拼關(guān)鍵詞進(jìn)行編程外,其它原計(jì)算機(jī)程序語(yǔ)言的符號(hào)和各種編程規(guī)定及規(guī)則保持不變; 在計(jì)算機(jī)系統(tǒng)是純西碼也即ASCII碼系統(tǒng)時(shí),除了關(guān)鍵詞和語(yǔ)句及其組成語(yǔ)句的關(guān)鍵詞的漢字或漢語(yǔ)拼音需要轉(zhuǎn)換成漢語(yǔ)語(yǔ)音碼關(guān)鍵詞外,其它用漢字或漢語(yǔ)拼音表示的漢語(yǔ)信息也需要轉(zhuǎn)換成漢語(yǔ)語(yǔ)音碼; 該作為源程序的文本文件在進(jìn)行編譯前,計(jì)算機(jī)先根據(jù)預(yù)先儲(chǔ)存在計(jì)算機(jī)中的關(guān)鍵詞對(duì)照表,將與英文關(guān)鍵詞和語(yǔ)句及其組成語(yǔ)句的關(guān)鍵詞一一對(duì)應(yīng)的漢字或漢語(yǔ)拼音或漢語(yǔ)語(yǔ)音碼全拼及簡(jiǎn)拼關(guān)鍵詞批量轉(zhuǎn)換成原來(lái)轉(zhuǎn)換前相對(duì)應(yīng)的編譯系統(tǒng)能夠編譯的英文關(guān)鍵詞和語(yǔ)句及其組成語(yǔ)句的關(guān)鍵詞,轉(zhuǎn)換完成后再按照對(duì)原來(lái)用英文編程的計(jì)算機(jī)軟件程序的編譯方式進(jìn)行編譯或解釋?zhuān)呒?jí)計(jì)算機(jī)語(yǔ)言先編譯或解釋成匯編程序,再由匯編程序匯編成機(jī)器碼后交計(jì)算機(jī)執(zhí)行,而漢語(yǔ)匯編語(yǔ)言程序轉(zhuǎn)換成英文關(guān)鍵詞匯編語(yǔ)言程序后,則直接匯編成機(jī)器碼后交計(jì)算機(jī)執(zhí)行; 當(dāng)需要閱讀源程序代碼時(shí),計(jì)算機(jī)可以根據(jù)所用的計(jì)算機(jī)編程語(yǔ)言的關(guān)鍵詞和語(yǔ)句及其組成語(yǔ)句的關(guān)鍵詞與漢字或漢語(yǔ)拼音或漢語(yǔ)語(yǔ)音碼關(guān)鍵詞一一對(duì)應(yīng)關(guān)系,根據(jù)預(yù)先的設(shè)定,計(jì)算機(jī)編程語(yǔ)言的關(guān)鍵詞和語(yǔ)句及其組成語(yǔ)句的關(guān)鍵詞能夠分別以英文、漢字或漢語(yǔ)拼音或漢語(yǔ)語(yǔ)音碼全拼及簡(jiǎn)拼的方式顯示; 其它非關(guān)鍵詞和語(yǔ)句的編程內(nèi)容和字符表達(dá)方式可以不變,也可以經(jīng)過(guò)漢字漢語(yǔ)拼音與漢語(yǔ)語(yǔ)音碼雙向轉(zhuǎn)換模塊和漢語(yǔ)語(yǔ)音碼漢語(yǔ)與外文雙向翻譯模塊轉(zhuǎn)換再輸出成系統(tǒng)預(yù)先設(shè)定的信息種類(lèi)的文本文件程序源代碼,該信息種類(lèi)可以是但不限于漢字、漢語(yǔ)拼音、漢語(yǔ)語(yǔ)音碼全拼及簡(jiǎn)拼、外文; 當(dāng)英文匯編語(yǔ)言的助記符關(guān)鍵詞與相對(duì)應(yīng)的漢語(yǔ)語(yǔ)音碼全拼及簡(jiǎn)拼關(guān)鍵詞建立一一對(duì)應(yīng)關(guān)系后,漢語(yǔ)語(yǔ)音碼全拼及簡(jiǎn)拼關(guān)鍵詞還可以與英文匯編語(yǔ)言的助記符關(guān)鍵詞相對(duì)應(yīng)的機(jī)器碼建立一一對(duì)應(yīng)關(guān)系,這樣便形成漢語(yǔ)高級(jí)程序可以直接編譯成漢語(yǔ)匯編語(yǔ)言程序,再由漢語(yǔ)匯編語(yǔ)言程序匯編成機(jī)器碼后交計(jì)算機(jī)執(zhí)行; 進(jìn)一步通過(guò)對(duì)計(jì)算機(jī)硬件電路進(jìn)行改造,使計(jì)算機(jī)的硬件電路相對(duì)應(yīng)的指令系統(tǒng)更適合漢語(yǔ)編程指令,這樣便可以設(shè)計(jì)出更符合漢語(yǔ)特點(diǎn)和習(xí)慣的計(jì)算機(jī)指令系統(tǒng),從而實(shí)現(xiàn)從漢語(yǔ)高級(jí)計(jì)算機(jī)語(yǔ)言到漢語(yǔ)低級(jí)計(jì)算機(jī)語(yǔ)言再到與漢語(yǔ)相適應(yīng)的計(jì)算機(jī)機(jī)器語(yǔ)言即機(jī)器碼的一脈相承的計(jì)算機(jī)漢語(yǔ)編程語(yǔ)言。
9.如權(quán)利要求I所述的計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)漢語(yǔ)語(yǔ)音碼漢語(yǔ)全息信息處理方法,其進(jìn)一步特征在于在進(jìn)行信息搜索時(shí)可以以現(xiàn)有的傳統(tǒng)的信息搜索引擎為基礎(chǔ),既能夠?qū)h字、漢語(yǔ)拼音、漢語(yǔ)語(yǔ)音碼全拼及簡(jiǎn)拼、外文作為信息搜索的關(guān)鍵詞直接輸入搜索引擎的關(guān)鍵詞輸入框進(jìn)行信息搜索,也能夠通過(guò)將輸入搜索引擎關(guān)鍵詞輸入框的漢字、漢語(yǔ)拼音、漢語(yǔ)語(yǔ)音碼全拼及簡(jiǎn)拼、外文或漢語(yǔ)語(yǔ)音,通過(guò)上述漢字漢語(yǔ)拼音與漢語(yǔ)語(yǔ)音碼雙向轉(zhuǎn)換模塊、漢語(yǔ)語(yǔ)音碼語(yǔ)音合成和識(shí)別模塊、漢語(yǔ)語(yǔ)音碼漢語(yǔ)外文雙向翻譯模塊轉(zhuǎn)換成預(yù)先設(shè)定的信息種類(lèi)后,再進(jìn)行信息搜索,輸出查詢到的信息,能夠按照系統(tǒng)默認(rèn)或預(yù)先設(shè)定的信息種類(lèi)方式輸出,上述這種信息種類(lèi)可以是但不限于漢字、漢語(yǔ)拼音、漢語(yǔ)語(yǔ)音碼全拼及簡(jiǎn)拼、外文、漢語(yǔ)特定人語(yǔ)音、中國(guó)方言語(yǔ)音、少數(shù)民族語(yǔ)言語(yǔ)音、漢語(yǔ)語(yǔ)音或外語(yǔ)語(yǔ)音;當(dāng)需要將搜索引擎搜索到的用漢字或漢語(yǔ)拼音表示的漢語(yǔ)信息的網(wǎng)頁(yè)轉(zhuǎn)換成漢語(yǔ)語(yǔ)音碼全拼及簡(jiǎn)拼表示的漢語(yǔ)信息的網(wǎng)頁(yè)時(shí),計(jì)算機(jī)系統(tǒng)首先找到該網(wǎng)頁(yè)的源文件,該網(wǎng)頁(yè)的源文件比如以一個(gè)擴(kuò)展名為".html"或".hml"的文本文件為例,通過(guò)調(diào)用預(yù)先儲(chǔ)存在計(jì)算機(jī)系統(tǒng)中的漢字漢語(yǔ)拼音與漢語(yǔ)語(yǔ)音碼雙向轉(zhuǎn)換模塊,將該文本文件中所有會(huì)顯示出來(lái)的漢字或全部漢語(yǔ)拼音,在它們?cè)瓉?lái)的網(wǎng)頁(yè)的位置上轉(zhuǎn)換成漢語(yǔ)語(yǔ)音碼全拼或簡(jiǎn)拼,一般需要轉(zhuǎn)換的漢字是除作為文件名的漢字和作為漢字字體名稱(chēng)的漢字外的所有漢字; 在將漢字網(wǎng)頁(yè)轉(zhuǎn)換成漢語(yǔ)語(yǔ)音碼全拼及簡(jiǎn)拼表示的網(wǎng)頁(yè)時(shí),原來(lái)網(wǎng)頁(yè)中的英文、英文字母、阿拉伯?dāng)?shù)字、西文標(biāo)點(diǎn)符號(hào)、移行號(hào)不需要轉(zhuǎn)換,保留原樣; 網(wǎng)頁(yè)中作為文件名的漢字,為了能在純西碼也可以稱(chēng)為純ASCII碼的計(jì)算機(jī)系統(tǒng)中顯示和運(yùn)行,需要將網(wǎng)頁(yè)中作為文件名的漢字轉(zhuǎn)換成漢語(yǔ)語(yǔ)音碼,被轉(zhuǎn)換后的原用漢字作為文件名的文件要復(fù)制并儲(chǔ)存在合適的位置,比如指定服務(wù)器或本地機(jī)中的指定文件夾中,以確保計(jì)算機(jī)系統(tǒng)能夠找到這個(gè)被轉(zhuǎn)換成漢語(yǔ)語(yǔ)音碼名稱(chēng)的文件; 對(duì)于漢字字體名稱(chēng)的漢字,當(dāng)西碼也即ASCII碼系統(tǒng)里不存在該漢字字體名稱(chēng)時(shí),計(jì)算機(jī)可以將該漢字字體名稱(chēng)自動(dòng)換成預(yù)先設(shè)定并儲(chǔ)存在計(jì)算機(jī)中的較為相近的西文字體名稱(chēng),或計(jì)算機(jī)預(yù)先設(shè)定的默認(rèn)的西文字體名稱(chēng); 當(dāng)網(wǎng)頁(yè)中的漢語(yǔ)語(yǔ)音碼需要轉(zhuǎn)換成漢字或漢語(yǔ)拼音時(shí),通過(guò)調(diào)用預(yù)先儲(chǔ)存在計(jì)算機(jī)系統(tǒng)漢字漢語(yǔ)拼音與漢語(yǔ)語(yǔ)音碼雙向轉(zhuǎn)換模塊的轉(zhuǎn)換,得到相應(yīng)的漢字或漢語(yǔ)拼音,并用這些漢字或漢語(yǔ)拼音在原來(lái)網(wǎng)頁(yè)中的漢語(yǔ)語(yǔ)音碼的位置替換掉被轉(zhuǎn)換了的漢語(yǔ)語(yǔ)音碼; 當(dāng)網(wǎng)頁(yè)中的漢語(yǔ)語(yǔ)音碼或標(biāo)點(diǎn)符號(hào)移行號(hào)需要轉(zhuǎn)換成語(yǔ)音時(shí),可以分別采用查預(yù)先儲(chǔ)存在計(jì)算機(jī)系統(tǒng)中的漢語(yǔ)語(yǔ)音碼語(yǔ)音合成和識(shí)別模塊輸出相應(yīng)的漢語(yǔ)、漢語(yǔ)特定人、中國(guó)方言、少數(shù)民族語(yǔ)言和標(biāo)點(diǎn)符號(hào)的語(yǔ)音; 當(dāng)網(wǎng)頁(yè)中以英文為主的外文需要轉(zhuǎn)換成語(yǔ)音時(shí),可以采用現(xiàn)有以英文為主的外文語(yǔ)音合成模塊,將會(huì)在網(wǎng)頁(yè)中顯示出來(lái)的以英文為主的外文朗讀出來(lái); 當(dāng)需要將網(wǎng)頁(yè)中的漢語(yǔ)語(yǔ)音碼表示的漢語(yǔ)信息轉(zhuǎn)換成以英文為主的外文,或者網(wǎng)頁(yè)中的英文為主的外文需要轉(zhuǎn)換成漢語(yǔ)語(yǔ)音碼全拼及簡(jiǎn)拼表示的漢語(yǔ)信息時(shí),可以調(diào)用預(yù)先儲(chǔ)存在計(jì)算機(jī)中的漢語(yǔ)語(yǔ)音碼漢語(yǔ)與外文雙向轉(zhuǎn)換模塊,在被轉(zhuǎn)換的語(yǔ)音碼的網(wǎng)頁(yè)中的位置,將漢語(yǔ)語(yǔ)音碼表示的漢語(yǔ)信息轉(zhuǎn)換成以英文為主的外文,或者在被轉(zhuǎn)換的以英文為主的外文的網(wǎng)頁(yè)中的位置,將網(wǎng)頁(yè)中英文為主的外文轉(zhuǎn)換成漢語(yǔ)語(yǔ)音碼全拼或簡(jiǎn)拼表示的漢語(yǔ)息; 對(duì)采用以上方法搜索到的所有網(wǎng)頁(yè),可以根據(jù)需要將原網(wǎng)頁(yè)中的全部或部分內(nèi)容以及超聯(lián)接的路徑或文件,改成指定的內(nèi)容以及指定的超聯(lián)接的路徑或文件; 當(dāng)我們獲得的網(wǎng)頁(yè)不是通過(guò)搜索引擎,而是通過(guò)其它方式比如各種網(wǎng)頁(yè)瀏覽器來(lái)獲得的時(shí),所得到的用漢字、漢語(yǔ)拼音、漢語(yǔ)語(yǔ)音碼或外文表示信息的網(wǎng)頁(yè),可以通過(guò)上述各種模塊的轉(zhuǎn)換再輸出成系統(tǒng)預(yù)先設(shè)定的信息種類(lèi)的網(wǎng)頁(yè),該信息種類(lèi)可以是但不限于漢字、漢語(yǔ)拼音、漢語(yǔ)語(yǔ)音碼全拼及簡(jiǎn)拼、外文、漢語(yǔ)特定人語(yǔ)音、中國(guó)方言語(yǔ)音、少數(shù)民族語(yǔ)言語(yǔ)音、漢語(yǔ)語(yǔ)音或外語(yǔ)語(yǔ)音。
10.如權(quán)利要求I所述的計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)漢語(yǔ)語(yǔ)音碼漢語(yǔ)全息信息處理方法,其進(jìn)一步特征在于漢語(yǔ)語(yǔ)音碼的全拼或簡(jiǎn)拼可以作為單位組織或個(gè)人的標(biāo)識(shí),該標(biāo)識(shí)包括但不限于作為產(chǎn)品或服務(wù)的商標(biāo)的標(biāo)識(shí)及組織機(jī)構(gòu)代碼,該商標(biāo)的標(biāo)識(shí)及組織機(jī)構(gòu)代碼可以進(jìn)行合法注冊(cè),可以印在各種實(shí)物上,也可以但不限于作為手機(jī)短信網(wǎng)址和手機(jī)移動(dòng)商街及計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)的關(guān)鍵字符或關(guān)鍵詞輸入到手機(jī)或計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)的各種搜索引擎和瀏覽器地址欄中,以便找到與該標(biāo)識(shí)或代碼相關(guān)聯(lián)的網(wǎng)頁(yè)或網(wǎng)站,與作為單 位組織或個(gè)人的標(biāo)識(shí)或產(chǎn)品或服務(wù)的商標(biāo)的標(biāo)識(shí)及組織機(jī)構(gòu)代碼的漢語(yǔ)語(yǔ)音碼相對(duì)應(yīng)的各種有線和無(wú)線網(wǎng)絡(luò)域名或網(wǎng)址,可以通過(guò)調(diào)用漢語(yǔ)語(yǔ)音碼域名轉(zhuǎn)換和網(wǎng)頁(yè)登陸模塊得到,這樣就可以將手機(jī)漢語(yǔ)語(yǔ)音碼的短信網(wǎng)址和手機(jī)移動(dòng)商街漢語(yǔ)語(yǔ)音碼關(guān)鍵詞及計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)的漢語(yǔ)語(yǔ)音碼關(guān)鍵詞及由漢語(yǔ)語(yǔ)音碼的關(guān)鍵詞的詞干組成的網(wǎng)絡(luò)域名與單位組織或個(gè)人的標(biāo)識(shí)或產(chǎn)品或服務(wù)的商標(biāo)的標(biāo)識(shí)及組織機(jī)構(gòu)代碼相統(tǒng)一起來(lái)。
全文摘要
本發(fā)明是一種計(jì)算機(jī)或嵌入式計(jì)算機(jī)系統(tǒng)漢語(yǔ)語(yǔ)音碼全拼和簡(jiǎn)拼漢語(yǔ)全息信息處理方法,屬于計(jì)算機(jī)漢字漢語(yǔ)信息處理技術(shù)領(lǐng)域。它用且僅用26個(gè)拉丁字母以詞為單位對(duì)漢語(yǔ)信息進(jìn)行全息處理,能夠與ASCCII碼100%兼容。本發(fā)明能廣泛應(yīng)用于漢語(yǔ)信息處理、圖書(shū)出版、漢語(yǔ)教學(xué)、農(nóng)村地區(qū)掃盲、對(duì)外漢語(yǔ)教學(xué)、漢語(yǔ)語(yǔ)音合成和識(shí)別、各種格式的計(jì)算機(jī)文件和網(wǎng)頁(yè)漢語(yǔ)信息顯示、信息搜索、漢語(yǔ)編程,具有漢語(yǔ)合義的各種用于登陸互聯(lián)網(wǎng)站點(diǎn)的網(wǎng)絡(luò)域名的標(biāo)識(shí)、商標(biāo)的標(biāo)識(shí)等領(lǐng)域。本發(fā)明采用的漢語(yǔ)語(yǔ)音碼可以直接用于表達(dá)漢語(yǔ)信息,特別是為不識(shí)或不習(xí)慣漢字的人學(xué)習(xí)、了解、掌握、表達(dá)漢語(yǔ)信息和漢語(yǔ)普通話提供了極大的便利。
文檔編號(hào)G06F3/023GK102902660SQ20111021239
公開(kāi)日2013年1月30日 申請(qǐng)日期2011年7月26日 優(yōu)先權(quán)日2011年7月26日
發(fā)明者苗玉水 申請(qǐng)人:苗玉水