專利名稱:語句構(gòu)件裝置、構(gòu)件制作和基于該構(gòu)件的母語讀外文方法
語句構(gòu)件裝置、構(gòu)件制作和基于該構(gòu)件的母語讀外文方法技術(shù)領(lǐng)域:
本發(fā)明涉及一種自然語言的處理或轉(zhuǎn)換的裝置和方法特別涉及一種文本轉(zhuǎn)換的裝置和 方法即語句構(gòu)件裝置、語句構(gòu)件制作方法以及基于語句構(gòu)件的母語讀外文的文本轉(zhuǎn)換方法。背景技術(shù):
計算機語言文字的信息處理代表是機器翻譯、是技術(shù)難度的至高點。它的操作對象是文 本文件,由計算機的文字處理技術(shù)所產(chǎn)生?,F(xiàn)有的文字處理技術(shù)是把各種語言文字的字符進 行編碼,然后利用字符代碼(內(nèi)碼)生成文本文件。缺點是如此產(chǎn)生的計算機文本文件和紙 上的文件一樣,只能供各自語種的人們讀寫、交流。因而不同語種的人們必須借助翻譯。機器翻譯如《自然語言的計算機處理》馮志偉著,上海外語教育出版社1996年10月出 版,其中第八章第一節(jié)機器翻譯。全文詳細闡述了 19世紀30年代初法國科學(xué)家阿爾楚尼提 出用機器來進行語言翻譯的想法開始;到1946年世界第一臺計算機問世,同年就開始了機器 翻譯的研究,并一時興旺起來;1966年11月美國科學(xué)院的語言自動處理咨詢委員會公布了 題為"語言與機器(ALPAC)"的報吿,否定了機器翻譯并指出機器翻譯遇到了難以克服的 "語義障礙";繼后機器翻譯出現(xiàn)的空前蕭條;1970-1976年復(fù)蘇以至1976年后的繁榮等等, 洋洋兩萬言,最后指出"1964年,美國ALPAC報告指出的機器翻譯遇到的 <語義障礙'至 今仍然存在,機器翻譯技術(shù)至今似乎仍然沒有突破性的進展"。"機器翻譯系統(tǒng)的實用化和商 品化問題面臨著嚴峻的考驗"。大眾軟件,2004年第二期,作者王槊,采訪業(yè)界多位專家后報道,《機器翻譯,哮在何 方》 一文中寫道"目前的機器翻譯主要有兩種形式,MT和TM。 MT (machine translation) 就是我們常見的基于規(guī)則的機器翻譯軟件,其主要用途是為了幫助英文不好的用戶提供翻譯 參考,但準確性不高。MT的關(guān)鍵技術(shù)有4個方面單詞分析、語法分析、意義分析和文理分 析。它的工作過程是,先把語句分成幾個單詞,通過存放于機器數(shù)據(jù)庫內(nèi)的電子字典査清詞 義,根據(jù)語法規(guī)則分析語句的意思,并把它變換成概念構(gòu)造,然后借助語言模型生成目標語 言。盡管從原理上來看,要實現(xiàn)這一系列步驟并不困難,但由于語言的特殊性和多樣化,以 及人工智能技術(shù)發(fā)展水平的限制,目前要做到不同語種間正確互譯是不可能的,這也是為什 么現(xiàn)在的機器翻譯軟件無法滿足人們的要求,翻譯出來的結(jié)果往往令人啼笑皆非的原因?!?TM (Translation Memory,翻譯記憶),主要面向?qū)I(yè)翻譯人員和機構(gòu)設(shè)計,以翻譯記憶和人 機交互為核心,要求使用者具備獨立的翻譯能力。TM的原理是基于數(shù)據(jù)庫,將翻譯過的所有 材料以句子為單位存入數(shù)據(jù)庫。翻譯時系統(tǒng)自動對電子文檔進行分析,100%匹配的句子可以 自動替換,部分匹配的句子可根據(jù)匹配度提出翻譯建議,新句子則通過系統(tǒng)提供的翻譯建議 進行人工翻譯。科學(xué)研究表明,翻譯中的重復(fù)工作量約為30%, TM翻譯軟件使"相同的句子永 遠不需要翻譯第二遍",從而提高了工作效率。"但70%還得靠人工…。最后作者指出"機 器翻譯技術(shù)本身存在的問題是阻礙其發(fā)展的硬傷。目前不僅在中國,整個世界范圍內(nèi)機器翻 譯技術(shù)都沒有很大的突破。試圖用機器通過有限的規(guī)則和語料提高翻譯準確性,在短期內(nèi)無 法實現(xiàn)。在語言智能化研究理論不成熟的情況下,MT軟件研究在技術(shù)上碰到瓶頸,無法解決. 一個單詞在不同語言環(huán)境下的詞義選擇問題,同樣也無法在復(fù)雜多變的語境中正確選擇語法規(guī)則,因此,翻譯水平無法實現(xiàn)明顯提高。" 現(xiàn)有技術(shù)既然如此,希望在于另辟蹊徑!本發(fā)明人認為,對于計算機語言文字信息處理來說,語法、語音、詞匯不同不是難題, 關(guān)鍵是不同自然語言的字、詞、句表意不對等,也不統(tǒng)一只好讓計算機要象人一樣理解分 析它,致使"語義障礙'至今仍然存在,翻譯出來的結(jié)果往往令人啼笑皆非"。句型構(gòu)件理論(本發(fā)明人的發(fā)現(xiàn),末公開)我們明白,電腦還不能象人腦一樣理解語義;電腦之長在于存貯和搜索。人腦正好與電 腦相反,能理解語義,但存貯和搜索能力都遠遠不及電腦。人腦與電腦有著很好的互補,但 能否實現(xiàn)很好的互補,有懶于語言文字在計算機內(nèi)的表達。非常慶幸,自然語言的本質(zhì)就是 表意,并且所表之意人類互通。各種語言文字都由字符組成詞匯,詞匯組成句子,句子組成 文章;其本質(zhì)屬性是句子是表達完整語意的基本單元不同語言文字的句子可以表達相同 的語意。自然語言是整個人類社會發(fā)展的產(chǎn)物。人類產(chǎn)生語言文字的時候,由于時空的隔離, 人們被分散在許多獨立的社會里生活;語言文字也在這許多獨立社會里,在各自獨立體系內(nèi) 緩慢演變和發(fā)展。正因為各種語言文字都在各自的獨立體系內(nèi)緩慢地演變發(fā)展而來。不同語 言文字之間,語音不同,語法不一樣,詞匯字符更是形形色色。這也就造成了不同語言文字 之間字、詞、句表意不對等也不統(tǒng)一。假如不同語言文字之間,字、詞、句表意能夠?qū)Φ群?統(tǒng)一;不同語言文字之間的翻譯和轉(zhuǎn)換就不是什么難事了。如何才能使不同語言文字之間的 字、詞、句表意能夠?qū)Φ群徒y(tǒng)一呢?本發(fā)明人從句型著手研究,不是語法書上的句型,是便于計算機操作的句型。經(jīng)過多年 的探討,得出語句構(gòu)件理論。這里把語句構(gòu)件論所涉及的主要論斷、與本發(fā)明有關(guān)的、具有 特定意義的概念定義和解釋如下-句子——在自然語言里,表達完整語意的基本單元稱為句子;不同語言文字的句子可以 表達相同的語意。句子可分為句型、句艙兩部分,一個句型至少包含一個句艙。句型一出自一類句子的抽象,在句子中相對穩(wěn)定,體現(xiàn)句子基本語意及類屬;構(gòu)成該 類句子基本結(jié)構(gòu)框架部分稱句型。句型體現(xiàn)句子基本語意及類屬是面向全人類的、跨語種的; 而其基本結(jié)構(gòu)框架是面向具體自然語言的,并包攬著自然語言復(fù)雜、個性化的語法現(xiàn)象。句艙一鑲嵌在句型這個基本結(jié)構(gòu)框架上的那些靈活的可替換部分稱為句艙。句艙接受 句型的選擇和制約句艙可用意群串填充或替換,形成豐富多彩的、具體的句子。句艙個數(shù)、 其語意內(nèi)容是面向全人類的、跨語種的;但其在句型基本結(jié)構(gòu)框架中的位置、次序和用以填 充的意群串是面向具體自然語言的;句艙即使有語法現(xiàn)象也極為簡單。句型句艙舉例解釋(#示行號〉 1#只要會句型(01074) 2個艙 2共 只要你{1},你就會{2}。 3#{1} and you will {2}. 4# Earn {1} , to {2}. 5# 略(其它語種) 6#象一句型(00892) 4個艙 7S {1}象{4}一樣{3}{2}嗎? 8# Does{1}{2}as{3}as{4} 9# {lH2}TaK{3}KaK{4} 1{堅持不懈} 2{成功} 1{Persevere} 2{succeed} l{BUHacTanBaeTe} 2{6ynere c ycnexoM)1{約翰}4{亨利}3{努力}2{工作} 1{John}2{work}3{hard}4{Henry}1(Pa6oTaeT口(取oH) 3{ycepHo} 4{reHjw)ioa 略(其它語種)11#的高句型(00922) 3個艙12共 {2}的{1)高于{3} 。 2{智慧} 1{價值} 3〖紅寶石}13 TheU)of {2} is above{3} . Uprice} 2{wisdom} 3{rubiesJ14# {1} {2} Bb皿e {3} . 1{Ctohmocti>} 2(Myapocra) 3{py6HHa}15略(其它語種)上例①1恥W說三行各表示三個句型的表示基本語意和類屬,面向世界、跨語種部分;其 中如"只要會句型"表示類屬和基本語意,(01074)表示句型號,是意通代碼低位字十進制數(shù)。(D2 5#、 7 10#、 12 15S表示三個句型的結(jié)構(gòu)框架,是面向具體自然語言的。每行的 左前部分是句型的框架結(jié)構(gòu),花括號內(nèi)是句艙右后部分是相應(yīng)句艙及內(nèi)容例。其中2共7#12# 面向中文;3#8#13#面向英文;4#9#14#面向俄語;5WO井15ft面向其它語種等。③上述舉例花括號內(nèi)或其前面的數(shù)字為句艙號。句艙的個數(shù)(如l共有2個艙、6#有4個 艙),和各句艙表示的語意是面向世界、跨語種的;而其在句型框架結(jié)構(gòu)中的位置、次序、用 以填充的意群串是面向語種的(如7 9#中的{2}在中英俄文句型內(nèi)的位次不同;填充的意群 串分別是.'工作、work 、 豕o h )。對于語法而言,復(fù)雜的語法現(xiàn)象都攬在句型上;句艙即使含有語法也極其簡單。上述就 是句型、句艙的定義和解釋的簡潔舉例。句艙由意群統(tǒng)領(lǐng)的意群串填充或組成(也可初步近似地理解為由詞串填充或組成)。但 句艙的大小有較大差別。最小的句艙只包含一個意群串最大的句艙可以包含一個從句或分 句。我們把句艙分為簡單句艙和復(fù)雜句艙兩種意群——意群是自然語言的字、詞、詞組或短語之"意"的對等和統(tǒng)一;是人類思維活 動的基本單元。意群無語種之限,屬于全人類;也隨人類社會發(fā)展而代謝著。意群串一意群在語言文字里相應(yīng)的表示稱意群文字串,簡稱意群串。意群串分單串、 復(fù)串兩種;只含有一個原有詞串的為單串(如圖5a中的英文串)由兩個或兩個以上原有詞 串組成,并用相連為復(fù)串(如圖5b中的英文串)。簡單句艙一除不表意虛詞外不超過三個意群串的句艙稱簡單句艙(如圖2所標203 204)。英文如"a朋 the in on to and"等不表意時忽略不計;中文的量詞同樣不 計。其它語種如此類推。不同語種之間,這三個串只要求有相應(yīng)的、語意相同的串就可以, 不要求它們前后次序的一致。^ 句1&—大于簡單句艙,含有艙模的句艙稱復(fù)雜句艙。上文所列舉例句的句艙都屬于簡單句艙。下面這個例句含有復(fù)雜句艙1{the fisherman} consents to 2{ return the—feather—suit) , on condition that 3{fairy dance and play heavenly music for him}.在3{仙女為他跳舞并演奏天上的樂曲}的條件下,1 {漁夫}答應(yīng)2{歸還羽衣}。本例句艙l、句艙2都是簡單句艙,句艙2英文含復(fù)串;句艙3大于簡單句艙,含有艙 模,屬于復(fù)雜句艙。艙模和艙眼一進一步剖析復(fù)雜句艙的內(nèi)容;得出如同句型的框架結(jié)構(gòu)部分稱艙模;鑲 嵌在艙??蚣芙Y(jié)構(gòu)上的可替換部分稱艙眼。句艙和艙眼是上、下位概念;但簡單句艙和艙眼 的大小相等,同樣是除不表意虛詞外不大于三個意群串。如上例句艙3〖fairy dance and play heavenly咖sic for him} 3H山女為他跳舞并 演奏天上的樂曲}利用句型理論剖析,可得出艙模(00205) {l} + {2}+and+(3}+for him {1}+為他+{2}+并+{3}其中(00205)是艙模號;這個艙模包含3個艙眼,三個艙眼的內(nèi)容都不大于三個意群串-3 {1 {fairy} 2 {dance} and 3 {play heavenly music} for him} 3{1{仙女}為他2{跳舞} 并3{演奏天上的樂曲}}小習(xí)S~過于簡短不足以分出句型、句艙的句子為小習(xí)語。如"How do you do 您 好! Get away!滾開!"等等。語句構(gòu)件一語句構(gòu)件是不同語言文字之間,字、詞、句表意的對等和統(tǒng)一。根據(jù)自然 語言之表意人類互通,剖析比對多語句對;得出表意對等和統(tǒng)一的句型、艙模、意群串和小習(xí) 語等語句構(gòu)件。經(jīng)建庫編碼后的語句構(gòu)件可以是組裝句子的另部件或?qū)渥舆M行編碼的標準 件。語句構(gòu)件包括句型構(gòu)件、艙模構(gòu)件、意群串構(gòu)件和小習(xí)語構(gòu)件。意通代碼一面向多語種,語意相等、互通的語句構(gòu)件的統(tǒng)一編碼稱意通代碼。世界文一一由意通代碼生成,體現(xiàn)多文種i吾意互通,并可進行多文種讀出或文本轉(zhuǎn)換特 殊的文本文件,這種特殊的文件有望通用于世界而稱世界文。句型構(gòu)件理論簡化了自然語言的復(fù)雜性、又適應(yīng)它的靈活性;并化解它們之間語法不一 致難題。然而,我們把辺語法分析、語義理解分配給人腦。組織專家根據(jù)句型原理,對句子 進行句型、意群串兩個層面的語意剖析、比對整理。這些需要理解的艱難的也是一勞永逸的 事由人腦完成。同時②把經(jīng)常性的、單調(diào)、繁瑣的記憶、搜索、匹配等工作交給電腦。讓計 算機提供一個便捷的操作的平臺,利用人機交互的形式,讓人腦、電腦能夠很好地互補。把 剖析、比對過程中產(chǎn)生的句型、艙模、意群串和小習(xí)語等語句構(gòu)件建庫保存,并統(tǒng)一編制意 通代碼,如此產(chǎn)生語句構(gòu)件庫。語句構(gòu)件庫存貯的是語句構(gòu)件。這些語句構(gòu)件,是多種語言文字之間表意得以對等的、 可以組裝、拼接成句子的(圖2)。我們可以利用這些構(gòu)件組裝句子;也可以把句子利用這些構(gòu) 件來編碼,利用與它們相匹配的意通代碼生成世界文等。在這過程中計算機只要做簡單的査 表、判斷;編碼或者譯碼等操作就可了?;谡Z句構(gòu)件進行自然語言的翻譯、轉(zhuǎn)換或者文 本轉(zhuǎn)換等;得到的譯文或所轉(zhuǎn)換出來的文本不但可讀性好,而且表意能與原文一致。發(fā)明目的本發(fā)明要解決的技術(shù)問題是-1、 現(xiàn)有計算機的語言文字表達,對不同語言文字的字、詞、句表意不對等也不統(tǒng)一;2、 現(xiàn)有機器翻譯、文本轉(zhuǎn)換;其結(jié)果可讀性差,不能表達原文本意。本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供①一種語句構(gòu)件裝置及②語句構(gòu)件制作方 法;用人機交互的技術(shù)手段,解決現(xiàn)有計算機的語言文字表達,即解決不同語言文字的字、 詞、句表意不對等也不統(tǒng)一的技術(shù)問題。從而產(chǎn)生貯存于語句構(gòu)件庫的、不同語言字、詞、 句表意得以對等和統(tǒng)一的語句構(gòu)件的技術(shù)效果。本發(fā)明的進一步目的是提供③一種基于語句構(gòu)件的母語讀外文的文本轉(zhuǎn)換方法;解決現(xiàn) 有機器翻譯、文本轉(zhuǎn)換,其結(jié)果可讀性差,不能表達原文本意的技術(shù)問題;從而提高譯文或 轉(zhuǎn)換文本的可讀性,表意能與原文一致的技術(shù)效果。轉(zhuǎn)換的同時還生成世界文,產(chǎn)生可多語 種讀出的技術(shù)效果。大大改觀了現(xiàn)有字處理文本只供本語種人們讀寫交流的現(xiàn)狀。技術(shù)方案
本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是〈一〉、提供一種語句構(gòu)件裝置,包括CPU和用于存放響應(yīng)査詢的相關(guān)索引表的原有部102,其特征在于還包括語句構(gòu)件存儲部101,含有包括用電子數(shù)據(jù)形式構(gòu)成的、存儲了多語種語意對等的語句構(gòu) 件的語句構(gòu)件庫句型庫300,用于存儲句型構(gòu)件,有句型碼、英文句型、中文句型、俄文句型字段, 其包含至少一個記錄,相同語意的句型同處一個記錄,相應(yīng)文種的句型存儲在相應(yīng)文種句型 字段內(nèi),句型碼代表了同一記錄內(nèi)各文種句型字段內(nèi)的各文種句型的語意艙模庫400,用于存儲艙模構(gòu)件,有艙模碼、英文艙模、中文艙模、俄文艙模字段, 其包含至少一個記錄,相同語意的艙模同處一個記錄,相應(yīng)文種的艙模存儲在相應(yīng)文種艙模 字段內(nèi),艙模碼代表了同一記錄內(nèi)各文種艙模字段內(nèi)的各文種艙模的語意;意群串庫500、 502,用于存儲意群串構(gòu)件,有意群碼、英文串、中文串、俄文串字 段,其包含至少一個記錄,相同語意的意群串同處一個記錄,相應(yīng)文種的意群串存儲在相應(yīng) 文種串字段內(nèi),意群碼代表了同一記錄內(nèi)各文種串字段內(nèi)的各文種意群串的語意;習(xí)語庫600,用于存儲小習(xí)語構(gòu)件,有習(xí)語碼、英文習(xí)語、中文習(xí)語、俄文習(xí)語字段, 其包含至少一個記錄,相同語意的小習(xí)語同處一個記錄,相應(yīng)文種的小習(xí)語存儲在相應(yīng)文種 習(xí)語字段內(nèi),習(xí)語碼代表了同一記錄內(nèi)各文種習(xí)語字段內(nèi)的各文種習(xí)語的語意;意通代碼編制部103,與語句構(gòu)件存儲部101相連,用于接收構(gòu)件添加部106的通知, 僅當(dāng)上述四個庫任何之一出現(xiàn)新記錄時,把當(dāng)前庫代表數(shù)作高位字加上當(dāng)前庫記錄號生成意 通代碼,并填入當(dāng)前庫的某某碼字段,作為語句構(gòu)件統(tǒng)一的雙字節(jié)定長的多語種語意互通的 意通代碼,意通代碼對于當(dāng)前庫當(dāng)前記錄內(nèi)各語種構(gòu)件的同一語意表示是唯一的;構(gòu)件讀出部104,與語句構(gòu)件存儲部101相連,用于接收讀出命令,以意通代碼所含數(shù) 段確定某庫某記錄,并到相應(yīng)庫相應(yīng)記錄讀出所需要的語種構(gòu)件;構(gòu)件匹配給出部105,與語句構(gòu)件存儲部101相連,用于接收匹配命令,根據(jù)所給語種 的句子或句艙內(nèi)容以及當(dāng)前操作點的指引,在相應(yīng)構(gòu)件庫相應(yīng)語種索引字段查詢匹配,給出 匹配的所需要的語種構(gòu)件或返回?zé)o匹配信號構(gòu)件添加部106,分別與語句構(gòu)件存儲部101、意通代碼編制部103相連,用于接收添 加新構(gòu)件命令,在査詢證實相應(yīng)構(gòu)件庫沒有相同構(gòu)件后,將新構(gòu)件添加到相應(yīng)構(gòu)件庫的相應(yīng) 語種構(gòu)件字段內(nèi),當(dāng)給一個新記錄添加新構(gòu)件時,同時發(fā)信息通知意通代碼編制部103:構(gòu)件庫操作控制、接口部107,通過構(gòu)件讀出部104、構(gòu)件匹配給出部105、構(gòu)件添加部 106與語句構(gòu)件存儲部101相連,接收基于本語句構(gòu)件的各種應(yīng)用的調(diào)用或接收相關(guān)命令進行 操作,返回調(diào)用者所需語句構(gòu)件,或通過本接口與基于語句構(gòu)件的其它應(yīng)用裝置相連接。所述的語句構(gòu)件裝置中的語句構(gòu)件語句構(gòu)件通過專家操作、人機交互的方式Z來自剖析比對雙語對訓(xùn)練樣本語料得到; 語句構(gòu)件的另一個來源是用戶的反饋信息經(jīng)專家審核后再加入;語句構(gòu)件是用于組裝語言句子的另部件、或?qū)渥舆M行編碼的標準件,包括如下四種① 句型構(gòu)件201,301,用于構(gòu)成句子的基本結(jié)構(gòu)框架,代表了該類句子基本語意類屬, 也決定了該類句子所含句艙的位次和個數(shù),并包攬了該類句子的較復(fù)雜的語法現(xiàn)象;② 艙模構(gòu)件202,401,用于構(gòu)成復(fù)雜句艙的基本結(jié)構(gòu)框架,代表了該類句艙基本語意類 屬,也決定了該類句艙所含艙眼的位次和個數(shù),并包攬了該類句艙的較復(fù)雜的語法現(xiàn)象③ 意群串構(gòu)件501、 503,是由意群串充當(dāng)?shù)臉?gòu)件,用于填充簡單句艙203 204或紐眼 205~207的構(gòu)件,簡單句艙與艙眼是上、下位概念而大小一樣,都是除不表意虛詞外不超過三個意群串;④小習(xí)語構(gòu)件601,由過于簡短不足以分出句型、句艙的句子充當(dāng)小習(xí)語構(gòu)件,用于直 接構(gòu)成簡短的句子。所述的語句構(gòu)件裝置中的語句構(gòu)件庫庫內(nèi)所包括文種,除英文、中文、俄文外,每增加一個文種,首先應(yīng)將句型庫、艙模庫、 意群串庫、習(xí)語庫分別依次各增加一個某文句型、某文艙模、某文串、某文習(xí)語字段,新加 文種構(gòu)件只有與已有文種構(gòu)件語意相同的才能填加在同一個記錄上;提取其中句型庫、艙模庫、意群串庫、習(xí)語庫中的某文句型、某文艙模、某文串或某文 習(xí)語和某某碼兩個字段構(gòu)成某某語言庫、第一語言庫或第二語言庫,用于語言翻譯或文本轉(zhuǎn) 換?!炊怠⑻峁┮环N語句構(gòu)件的制作方法,利用相同內(nèi)容的雙語或多語種文字版本的語料 作為訓(xùn)練樣本,利用人機交互的方式進行句型、句艙兩個層面的剖析比對,得出字、詞、句表意得以對等和統(tǒng)一的語句構(gòu)件,包括如下步驟51. 利用相同內(nèi)容的雙語或多語種文字版本的語料作為訓(xùn)練樣本,每輪選A、 B雙語作 為一個樣本對,其中A語分配給拼音文字或已經(jīng)比對過的文種,B語可以分配給拼音文字也 可分配給表意文字以及新加入的文種;第一輪雙語對訓(xùn)練樣本的剖析比對,其中雙語對樣本的A語為英文,B語為中文,從第 二輪開始新語對中必須其一是已經(jīng)進行過剖析比對的,如當(dāng)加入俄文時,只能取中俄或英俄 語料作為雙語對訓(xùn)練樣本,第二輪剖析比對的雙語對樣本中A語應(yīng)是已比對過的中文或英文, B語應(yīng)是新加的俄文;每一輪的訓(xùn)練語料樣本應(yīng)大到新增句型/句例比<1%后方可考慮增加新語種、進行次一 輪的剖析比對,另一方面,可以根據(jù)訓(xùn)練樣本語料的行業(yè)來源或應(yīng)用范圍來源來標記、劃分 句型庫、艙模庫、意群串庫、習(xí)語庫來構(gòu)成相應(yīng)分庫,用于行業(yè)或?qū)S冒姹荆?2. 句型層面剖析比對,讀取雙語樣本句對,劃分出句型、句艙,把句型作為句型構(gòu)件 存入句型庫,把不足以分出句型、句艙的小習(xí)語作為小習(xí)語構(gòu)件存入習(xí)語庫53. 句艙層面剖析比對,把已經(jīng)劃分出句型、句艙的樣本句例對,依次取出句艙內(nèi)容, 進一步劃分出艙模、艙眼,把艙模作為艙模構(gòu)件存入艙模庫,把經(jīng)過意群對齊的艙B艮或簡單 句艙的內(nèi)容以意群串為單元作為意群串構(gòu)件存入意群串庫處理完所有句艙,接著下一個的 雙語樣本句對處理、接續(xù)執(zhí)行步驟S2。所述語句構(gòu)件的制作方法中的句型層面剖析比對的步驟S2進一步包括如下步驟521. 讀入一個雙語樣本句對;522. 調(diào)用配句型子程序查找句型庫返回A、 B語匹配句型,若否、沒有匹配句型,執(zhí)行 步驟S23,若是、有匹配句型執(zhí)行步驟S26;523. 以當(dāng)前雙語樣本句對為例制作新句型,彈開一窗口,上橫行顯示A語句、下橫行顯 示B語句,橫行下再顯示挖句艙、存句型兩個命令按鈕,并提示專家點擊A、 B語例句的待挖 句艙的首尾點,挖句艙計數(shù)器N《;524. 當(dāng)接收到挖句艙命令按鈕被點擊后,N=N+1,檢査A、 B語是否都被點擊兩個點以及 這商個點是否有效,若否,提示重作,如果點擊正確并且有效,將A、 B語句兩點之間的內(nèi)容 挖去并填入"[N]",該輪挖句艙結(jié)束,下一輪重復(fù)步驟S24再挖下一個句艙525. 當(dāng)接收到存句型命令按鈕被點擊并且Ngl,表示挖句艙制作新句型操作完畢,清除步驟S23、 S24的顯示,把兩個新句型作為句型構(gòu)件分別寫入句型庫A文句型、B文句型字段, 如果接收到存句型命令按鈕被點擊、但N-O,表示當(dāng)前雙語樣本句對不足以分出句型、句艙 而被判定為小習(xí)語,清除步驟S23、 S24的顯示,把兩個小習(xí)語作為小習(xí)語構(gòu)件分別寫入習(xí)語 庫A文習(xí)語、B文習(xí)語字段;S26.把當(dāng)前雙語樣本例句對號入座地填入當(dāng)前匹配句型、或填入當(dāng)前新作句型,作為已 經(jīng)劃分出句型、句艙的樣本句例對存盤備S3步驟讀取,再執(zhí)行步驟S21。所述語句構(gòu)件的制作方法中的句艙層面剖析比對的歩驟S3進一步包括如下步驟531. 讀入一個由S26步驟存盤的已經(jīng)劃分出句型、句艙的樣本句例對;532. 取句艙,依次取出已經(jīng)劃分出句型、句艙的樣本句例對當(dāng)中的一個句艙作為當(dāng)前句 艙,開窗口一上部顯示A、 B語樣本句例,下部顯示A、 B語當(dāng)前句艙內(nèi)容;同時,把A語當(dāng)前句艙以詞串為單元切分并依次填入?yún)⒖急鞟語字段,再依次取出一個 詞串査找意群串庫的A文串字段,找到后取出同記錄的B文串字段內(nèi)容,如果該B文串內(nèi)容 在B語當(dāng)前句艙中含有,把B文串內(nèi)容填入?yún)⒖急鞡語字段,不含有讓它為空如果意群串庫的A文串字段有相同的記錄,相應(yīng)參考表也多一條A語字段有重的記錄備 選,作完整個參考表,開窗口二顯示參考表、組復(fù)詞命令按鈕以及可組復(fù)詞操作提示;接受專家點擊參考表并在被點記錄標志字段作標志;當(dāng)組復(fù)詞命令按鈕被點擊并且參考表有連續(xù)記錄被點擊,將參考表中有標志記錄的A語 字段內(nèi)容以" "相連組成復(fù)詞,并把有標志記錄合并成一條記錄,A語字段填入該復(fù)詞,B 語字段以相等語意的詞串填寫;533. 判斷當(dāng)前句艙是否簡單句艙,若是執(zhí)行步驟S37,若否、進一步査詢艙模庫判斷當(dāng) 前句艙是否含有艙模,若否、不含艙模執(zhí)行步驟S34,若是、該所含艙模作為當(dāng)前艙模并對 號入座地納入當(dāng)前句艙內(nèi)容,執(zhí)行步驟S36;534. 開窗口三作為可編輯窗口,將當(dāng)前雙語句艙內(nèi)容再顯示,接受專家以此為基礎(chǔ)編寫 艙模,還顯示存艙模命令按鈕;535. 當(dāng)存艙模命令按鈕被點擊,并且可編輯窗口已經(jīng)被編輯過,新編艙模也符合格式要 求,將新編A、 B語艙模作為艙模構(gòu)件存入艙模庫A文艙模、B文艙模字段,同時,將當(dāng)前句艙 內(nèi)容對號入座地填入當(dāng)前艙模,或填入新編艙模作為已經(jīng)劃分出艙模、艙眼的復(fù)雜句艙顯示:536. 依次取出一個艙眼的內(nèi)容,接續(xù)執(zhí)行步驟S37;537. 意群對齊,在第二個窗口參考表下顯示對齊確定命令按鈕,參考表接受專家按實 例延伸或增補詞義、不改變原有字、單詞的前提下加減串長度、粘帶附隨字、詞形變化增補 詞義項等意群對齊的修改,或優(yōu)選記錄;538. 當(dāng)對齊確定命令按鈕被點擊,表示參考表內(nèi)A、 B語的詞串已經(jīng)意群對齊、即已成意 群串,然后逐記錄地把A、 B語字段內(nèi)容作為意群串構(gòu)件存入意群串庫的A文串或B文串字段;539. 如果當(dāng)前操作的是艙眼,并且當(dāng)前句艙還有艙眼沒有操作,執(zhí)行步驟S36直到作完 當(dāng)前句艙的所有艙眼,再判斷當(dāng)前已經(jīng)劃分出句型、句艙的樣本句例對中是否還有未處理的 句艙,是,執(zhí)行步驟S32繼續(xù)處理句艙,否,全部句艙處理完畢,執(zhí)行步驟S31,進行下一 輪句對操作?!慈?、提供一種基于語句構(gòu)件的母語讀外文方法,包括如下步驟 S4.界面,由用戶指定母語和源語各是構(gòu)件庫所含的哪一個文種,把屏幕分成上、中、 下或前、中、后三個窗口,中部窗口用于顯示當(dāng)前操作句以及操作中的相關(guān)信息,下或后部窗口用于顯示源語待讀文本,上或前部窗口用于顯示己讀的母語文本,此外,在提示行顯示 悔操作、存盤退出等命令按鈕以及4、一移詞序按鈕,或把它們作成浮條緊隨中部下或用戶 可移;55. 源語句讀入,讀入源語一個句子作為當(dāng)前句顯示在中部窗口,母語文本顯示尾加已 處理的前一句內(nèi)容,源語文本顯示減當(dāng)前句內(nèi)容;56. 利用四個語句構(gòu)件庫對當(dāng)前句通過查表得出意通代碼的編碼操作、同時又給出同記 錄的母語字段內(nèi)容;57. 判斷處理,如果當(dāng)前句的全部句艙處理完畢,査詢反饋緩存區(qū)和命令按鈕 當(dāng)反饋緩存區(qū)不為空,將反饋緩存區(qū)的信息加上源語、母語、當(dāng)前源語句子等信息作成電子郵件反饋到支持網(wǎng)站,清空反饋緩存區(qū),在世界文緩存區(qū)存入"反饋句"標志當(dāng)悔操作命令按鈕被點擊,根據(jù)用戶點擊的欲悔詞串,取出悔選擇緩存中的相應(yīng)內(nèi)容讓用戶重選詞串并作相關(guān)修改當(dāng)接收到存盤退出命令時,將世界文緩存區(qū)的內(nèi)容存盤為世界文,文件名-源語文件名.SJW,如果源文未完,文件頭中記下源文偏移當(dāng)悔操作、存盤退出命令按鈕都沒有被點擊時,執(zhí)行步驟S5。所述一種基于語句構(gòu)件的母語讀外文方法,其中利用四個語句構(gòu)件庫對當(dāng)前句通過査表 得出意通代碼的編碼操作、同時又給出同記錄的母語字段內(nèi)容的步驟S6進一步包括如下步 驟5601. 判小習(xí)語,以當(dāng)前句査詢習(xí)語庫的源語習(xí)語字段,若無,沒有找到,執(zhí)行步驟S602, 若有,取出同記錄的母語習(xí)語字段中的母語小習(xí)語,顯示在中部窗口,并將同記錄的習(xí)語碼 讀入世界文緩存區(qū),然后執(zhí)行步驟S5:5602. 調(diào)用配句型子程序,以當(dāng)前句查詢句型庫的源語句型字段,若査到一個匹配的句 型,執(zhí)行步驟S603,如果査到多個匹配句型,在中部窗口下部顯示相應(yīng)的母語句型,接受用 戶選定后再執(zhí)行步驟S603,如果一個匹配的句型也沒有,存句型庫代表數(shù)于反饋緩存區(qū);5603. 給出同記錄的句型碼、母語句型以及源語句型,將母語句型著重顯示在中部窗口 的上部,把源語句子對號入座地套入源語句型,附注式顯示在該窗口母語下方,并把句型碼 讀入世界文緩存區(qū);3604.取句艙,從左到右在中部窗口標示母語句型中的當(dāng)前句艙,存入當(dāng)前句艙標號于 世界文緩存區(qū),同時標示和取出源語相應(yīng)句艙內(nèi)容作為當(dāng)前句艙內(nèi)容,判斷當(dāng)前句艙內(nèi)容是 否屬于簡單句艙,若否,執(zhí)行步驟S605,若是執(zhí)行步驟S608:5605. 査配艙模,以當(dāng)前句艙內(nèi)容査詢艙模庫的源語艙模字段,若査到一個匹配的艙模, 執(zhí)行步驟S606,如果查到多個匹配艙模,向下擴展中部窗口,在擴展部顯示相應(yīng)的母語艙模,接 受用戶選定后再執(zhí)行步驟S606,如果一個匹配的艙模也沒有,存艙模庫代表數(shù)于反饋緩存區(qū);5606. 給出同記錄的艙模碼、母語艙模以及源語艙模,將母語艙模著重顯示在中部窗口 的擴展部,把源語句艙內(nèi)容對號入座地套入源語艙模,附注式顯示在該窗口母語艙模的下方, 并把艙模碼讀入世界文緩存區(qū);5607. 取艙眼,以母語艙模為準從左到右,在母語艙模上逐個標示當(dāng)前艙眼,存當(dāng)前艙 眼標號于世界文緩存區(qū),同時標示和取出源語相應(yīng)艙眼內(nèi)容,執(zhí)行步驟S608;5608. 詞義確定,從左到右讀出源語的簡單句艙或艙眼中的一個詞串,査詢意群串庫的 源語文串字段,若只査到一條相同詞串,執(zhí)行步驟S609,若査到多條相同詞串,分別取出它們的同記錄母語串字段內(nèi)容,備份于悔選擇緩存,并顯示在已擴展的中部窗口下部,接收用戶選定 后再執(zhí)行步驟S609,如果一條相同的詞串也沒有,存當(dāng)前源語詞串于反饋緩存區(qū);5609. 取出當(dāng)前記錄的母語串字段內(nèi)容填入到當(dāng)前母語句艙或當(dāng)前母語艙眼,取出意群 碼存入世界文緩存區(qū);繼續(xù)執(zhí)行步驟S608,直到當(dāng)前簡單句艙或當(dāng)前艙眼操作完畢根據(jù)個性丟失表的信息進行當(dāng)前句艙或艙眼的個性丟失補償操作; 再根據(jù)母語詞序表的信息糾正當(dāng)前句艙或艙眼的母語詞序;最后査詢一、 一移詞序按鈕,當(dāng)一按鈕被點擊將當(dāng)前句艙或艙眼用戶所點擊詞串后移于 后一詞串之后,當(dāng)一按鈕被點擊將當(dāng)前句艙或艙眼用戶所點擊詞串前移于前一詞串之前,同 時將移后的詞序加入母語詞序表備用,后續(xù)執(zhí)行步驟S610;5610. 判斷,如果當(dāng)前句艙還有艙眼未處理,執(zhí)行步驟S607,若否而當(dāng)前句子還有句艙 未處理,執(zhí)行步驟S604,若當(dāng)前句子所有句艙全部處理完畢,后續(xù)步驟S7。所述的一種基于語句構(gòu)件的母語讀外文的方法其中作成電子郵件反饋到支持網(wǎng)站,當(dāng)支持網(wǎng)站接收到來自用戶的反饋郵件時,由專家 實時處理后,新構(gòu)件加入相應(yīng)構(gòu)件庫,并將新構(gòu)件及相關(guān)信息實時反饋給用戶,并在用戶的 參與下替換原"反饋句"標志;其中將世界文緩存區(qū)的內(nèi)容存盤為世界文,是在用戶利用母語讀外文的過程中,世界文 緩存區(qū)被同時實時地存入了句型碼、習(xí)語碼、艙模碼、意群碼等構(gòu)件代碼,以及句艙標號、 艙眼標號等,將它們存盤生成世界文,利用母語直接閱讀外文,讀后還生成了世界文, 一篇外文 只要一人讀過,,后面的千千萬萬人就可以讀世界文了,讀世界文比母語讀外文更快捷、不用 干預(yù),語意準確,讀出文種用戶自選,世界文的多語讀出過程只是譯碼過程,具體步驟是① 依次逐個取出代碼;② 用開關(guān)語句將代碼分類分別處理;③ 其中如果是句尬標號、艙眼標號,用以指示當(dāng)前句艙或當(dāng)前艙眼;(D把句型碼、習(xí)語碼、艙模碼、意群碼分解為某庫某記錄號,給出某庫、某記錄的某讀 出文種字段內(nèi)容,如果是意群碼則按指示給出到當(dāng)前句艙或當(dāng)前艙眼; ⑤接續(xù)執(zhí)行①直到文本結(jié)束。所述的一種基于語句構(gòu)件的母語讀外文的方法,其實是基于語句構(gòu)件的應(yīng)用之一,參照 其中利用四個語句構(gòu)件庫對當(dāng)前句的編碼步驟、世界文讀出的譯碼步驟,可以產(chǎn)生多種基于 語句構(gòu)件的應(yīng)用系統(tǒng)基于語句構(gòu)件的世界文生成的方法系統(tǒng),用于將傳統(tǒng)文本轉(zhuǎn)換成世界文,繼后可以進行 多語種讀出;基于語句構(gòu)件的文本轉(zhuǎn)換方法,用于將某源語文本轉(zhuǎn)換成某目語文本給出,或轉(zhuǎn)換成多 文種給出;基于語句構(gòu)件的機器翻譯方法,用于將某源語翻譯成目語給出,或翻譯成多語種。有益的效果與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是1、語句構(gòu)件裝置的語句構(gòu)件存貯部設(shè)有四個庫,分別存貯句型、艙模、意群串和小習(xí) 語四類語句構(gòu)件,只有相同語意的同類構(gòu)件同處一個記錄,同一記錄又設(shè)計了某某碼字段, 用以編制意通代碼。意通代碼不但唯一地代表了同記錄同類構(gòu)件的共同語意,而且可以分解 為某庫某記錄。這樣的設(shè)計得到構(gòu)件與構(gòu)件之間可以直接轉(zhuǎn)換或通過意通代碼轉(zhuǎn)換而語意不變的有益效果。2、 句型、艙模構(gòu)件為句子提供了一個框架,包攬了復(fù)雜的語法,決定了所含句艙及艙 眼的位次,這就避免了現(xiàn)有技術(shù)利用人工智能作句法分析、語法分析之苦。有效益于結(jié)果表 意能與原文一致。3、 根據(jù)訓(xùn)練樣本語料的行業(yè)來源或應(yīng)用范圍來源來標記,分出相應(yīng)分庫,適宜于行業(yè) 或?qū)S冒姹?,并且設(shè)有支持網(wǎng)站;有益于用戶細分,有更適應(yīng)用戶的有益效果。4、 所述語句構(gòu)件的制作方法的步驟特征,必然產(chǎn)生不同語言文字的字、詞、句的表意 得以對等和統(tǒng)一而成為語句構(gòu)件的有益效果。5、 所述語句構(gòu)件庫的特征,比現(xiàn)有技術(shù)機器翻譯的電子詞典、規(guī)則庫對翻譯質(zhì)量、文 本轉(zhuǎn)換質(zhì)量的貢獻更大更可靠;必然使基于語句構(gòu)件的各種應(yīng)用,產(chǎn)生譯文或轉(zhuǎn)換文本質(zhì)量 提高的有益效果。6、 母語讀外文方法是基于語句構(gòu)件的應(yīng)用之一。能用母語直接閱讀外文,人人可讀。 而且讀后還生成世界文;這樣, 一篇外文只要一人讀過,后面的千千萬萬人就可以讀世界文 —不必干預(yù)地多語種母語讀出;這一直是人們所夢昧以求的。7、 設(shè)有網(wǎng)站支持能保證基于語句構(gòu)件的產(chǎn)品的應(yīng)用,并建立了用戶聯(lián)系,對服務(wù)質(zhì)量 以及版本升級具有益的效果。
圖1是語句構(gòu)件裝置結(jié)構(gòu)示意圖圖2是語句構(gòu)件示意圖;圖3是句型庫示意圖;圖4是艙模庫示意圖;圖5a是意群串庫(英單串)示意圖;圖5b是意群串庫(英復(fù)串)示意圖;圖6是習(xí)語庫示意圖;圖7是句型層面比對流程圖;圖8是句艙層面比對流程圖;圖9是基于語句構(gòu)件的母語讀外文方法流程圖;具體實施方式下文參照附圖、利用實施例將本發(fā)明的內(nèi)容迸一步說明如下 —、 一種語句構(gòu)件裝置圖I是語句構(gòu)件裝置結(jié)構(gòu)示意圖。如圖1所示,語句構(gòu)件裝置包括:語句構(gòu)件存儲部101、 原有部102、意通代碼編制部103、構(gòu)件讀出部104、構(gòu)件匹配給出部105、構(gòu)件添加部106 和構(gòu)件庫操作控制、接口部107等七個部件(-)語句構(gòu)件存儲部101,是本裝置的中心部件。含有用電子數(shù)據(jù)形式構(gòu)成的、存儲了多 語種語意對等的語句構(gòu)件的二維數(shù)據(jù)庫表。它們是句型庫、艙模庫、意群串庫和習(xí)語庫(參 附圖3 6)四個語句構(gòu)件庫1、句型庫300,用于存儲句型構(gòu)件,有句型碼、英文句型、中文句型、俄文句型字段, 如圖3所示。其包含至少一個記錄,相同語意的句型同處一個記錄,相應(yīng)文種的句型存儲在 相應(yīng)文種句型字段內(nèi)301。這句所述文種句型實際是指句型的框架部分,是面向各自然語言的。其中的花括號表示句艙,中間的數(shù)字是該句艙的編號,句艙由意群串填充,句艙在句型 中的位置、次序以及填充的意群串都是面向各自然語言的;從圖3的庫中內(nèi)容301可以看出, 同一個句艙,其標號一樣但它在各語種句型中的位置、次序并不一致。句型碼字段存放句型 碼,句型碼代表了同一記錄內(nèi)各文種句型字段內(nèi)的各文種句型的語意。句型體現(xiàn)該類句子基 本語意及類屬是面向全人類的、跨語種的;它所包含的句艙個數(shù)、句艙語意都是面向全人類, 跨語種的;面向人類,跨語種的表示就是句型碼。也就是說,句型碼代表句型語意,影射了 各文種句型;各文種句型又可以通過句型碼影射另一個文種句型。至于語法是屬于各自然語 言的,句型的框架部分包攬著自然語言復(fù)雜、個性化的語法現(xiàn)象,然而句艙即使有語法現(xiàn)象 也極為簡單了。2、 艙模庫400,用于存儲艙模構(gòu)件,有艙模碼、英文艙模、中文艙模、俄文艙模字段, 如圖4所示。其包含至少一個記錄,相同語意的艙模同處一個記錄,相應(yīng)文種的艙模存儲在 相應(yīng)文種艙模字段內(nèi)401。艙模是復(fù)雜句艙的框架結(jié)構(gòu)部分,是面向各自然語言的。其中的 方括號表示艙眼,中間的數(shù)字是該艙眼的編號,艙眼也由意群串填充。艙眼在艙模中的位置、 次序以及填充的意群串都是面向各自然語言的;從圖4的庫中內(nèi)容401可以看出,同一個艙 眼,其標號一樣但它在各語種艙模中的位置、次序并不一致。艙模碼字段存放艙模碼,艙模 碼代表了同一記錄內(nèi)各文種艙模字段內(nèi)的各文種艙模的語意。艙模的基本語意,是面向全人 類的、跨語種的;它所包含的艙眼個數(shù)、船眼語意都是面向全人類,跨語種的;其表示就是 艙模碼。也就是說,艙模碼代表艙模語意,影射了各文種艙模各文種艙模又可以通過艙模 碼影射另一個文種艙模。至于句艙內(nèi)的語法也是屬于各自然語言的,艙模包攬著自然語言的 語法現(xiàn)象,然而艙眼即使有語法現(xiàn)象也極為簡單。3、 意群串庫500、 502,用于存儲意群串構(gòu)件,有意群碼、英文串、中文串、俄文串字 段,如圖5a-b所示。其包含至少一個記錄,相同語意的意群串同處一個記錄,相應(yīng)文種的意 群串存儲在相應(yīng)文種串字段內(nèi)501、 503。意群串是句艙或艙眼的內(nèi)容,句艙與艙眼是上下位 概念,句艙分簡單句艙和復(fù)雜句艙兩種,復(fù)雜句艙抽出如同句型的框架結(jié)構(gòu)后就是艙眼。句 艙和艙眼是上、下位概念;但簡單句艙和艙眼的大小相等,同樣是除不表意虛詞外不大于三 個意群串。拼音文字的意群串有單串復(fù)串兩種,單串即一個原有詞串501,復(fù)串是由多于一 個原有詞串,并以"相連而成503。意群碼字段存放意群碼,意群碼代表了同一記錄內(nèi)各 文種意群串字段內(nèi)的各文種意群串的語意,是面向人類,跨語種的;各文種意群串是面向各 自然語言的。也就是說,意群碼代表意群串的語意,影射了各文種意群串;各文種意群串又 可以通過意群碼影射另一個文種意群串。4、 習(xí)語庫600,用于存儲小習(xí)語構(gòu)件,有習(xí)語碼、英文習(xí)語、中文習(xí)語、俄文習(xí)語字段, 如圖6所示。其包含至少一個記錄,相同語意的小習(xí)語同處一個記錄,相應(yīng)文種的小習(xí)語存 儲在相應(yīng)文種習(xí)語字段內(nèi)601。習(xí)語碼代表了同一記錄內(nèi)各文種習(xí)語字段內(nèi)的各文種小習(xí)語 的語意。也就是說,習(xí)語碼代表小習(xí)語的語意,影射了各文種小習(xí)語;各文種小習(xí)語又可以 通過習(xí)語碼影射另一個文種小習(xí)語。上述四個庫的結(jié)構(gòu)強調(diào)只有相同語意的同類構(gòu)件才同處一個記錄,同一記錄又設(shè)計了某 某碼字段,用以編制意通代碼。意通代碼與同記錄的同類構(gòu)件的相互影射。這樣的結(jié)構(gòu)保證 了構(gòu)件與構(gòu)件之間可以直接轉(zhuǎn)換或通過意通代碼轉(zhuǎn)換而語意不變;也就是說,不同語種之間可以借此進行相互轉(zhuǎn)換。上述四個庫之間的關(guān)系是平列的,它們互不干預(yù)又共處語句構(gòu)件存 貯部之中。都要接受其它部件的操作或控制。〇原有部102,存貯有關(guān)上述四個庫的索引文件;也包括原有CPU等。曰意通代碼編制部103,分別與語句構(gòu)件存儲部101,意通代碼編制部103相連。僅當(dāng) 上述四個庫任何之一出現(xiàn)新記錄時,把當(dāng)前庫代表數(shù)例如習(xí)語庫-PF00H、句型庫寸000H、 艙摸庫-EF00H、意群串庫-0001H (也是這四個庫的庫標、數(shù)值段段標;數(shù)段的起點,止點即 下一個庫標數(shù)-1)作高位字加上當(dāng)前庫記錄號合成意通代碼;并填入當(dāng)前庫的某某碼字段, 作為語句構(gòu)件統(tǒng)一的雙字節(jié)定長的多語種語意互通的意通代碼。意通代碼對于當(dāng)前庫、當(dāng)前 記錄內(nèi)各語種構(gòu)件的同一語意的代表是唯一的樹構(gòu)件讀出部104,與語句構(gòu)件存儲部101直接相連,用于接收讀出命令,以意通代碼 所含數(shù)段標確定某庫某記錄,即意通代碼數(shù)一最小庫標數(shù)=最小庫標數(shù)所指庫的記錄號。然 后到相應(yīng)庫相應(yīng)記錄讀出所需要的語種構(gòu)件。OO構(gòu)件匹配給出部105,與語句構(gòu)件存儲部101直接相連,用于接收匹配命令。根據(jù)所 給語種的句子或句艙內(nèi)容以及當(dāng)前操作點的指引,在相應(yīng)構(gòu)件庫相應(yīng)語種索引字段查詢與其 相匹配的記錄,給出匹配的所需要的語種構(gòu)件。如沒有匹配記錄則返回?zé)o匹配信號。的構(gòu)件添加部106,與語句構(gòu)件存儲部101直接相連。用于接收添加新構(gòu)件命令,在査 詢證實相應(yīng)構(gòu)件庫沒有相同構(gòu)件后,將新構(gòu)件添加到相應(yīng)構(gòu)件庫的相應(yīng)語種構(gòu)件字段內(nèi)。當(dāng) 給一個新記錄添加新構(gòu)件時,同時發(fā)信息通知意通代碼編制部103。(力構(gòu)件庫操作控制、接口部107,通過構(gòu)件讀出部104、構(gòu)件匹配操作部105、構(gòu)件添加 部106與語句構(gòu)件存儲部101相連。用于接收基于本語句構(gòu)件的各種應(yīng)用的調(diào)用或接收相關(guān) 命令進行操作,返回調(diào)用者所需語句構(gòu)件,或通過本接口與基于語句構(gòu)件的其它應(yīng)用裝置相 連接。上文所述語句構(gòu)件(參附圖2及3 6〉是用于組裝語言句子的另部件,也是對句子進行 另部件拆分、編碼的標準件。有如下四種-1、 句型構(gòu)件201,301,用于構(gòu)成句子的基本結(jié)構(gòu)框架。代表了該類句子基本語意類屬, 也決定了該類句子所含句艙的位次和個數(shù),并包攬了該類句子的較復(fù)雜的語法現(xiàn)象。2、 艙模構(gòu)件202,401,用于構(gòu)成復(fù)雜句艙的基本結(jié)構(gòu)框架。代表了該類句艙基本語意類 屬,也決定了該類句艙所含艙眼的位次和個數(shù),并包攬了該類句艙的較復(fù)雜的語法現(xiàn)象。句型和艙模構(gòu)件都為句子提供了框架結(jié)構(gòu),包攬了復(fù)雜的語法,決定了所含句艙及艙眼 的位次,這就避免了現(xiàn)有技術(shù)利用人工智能作句法分析、語法分析之苦。有貢獻于結(jié)果表意 能與原文一致。3、 意群串構(gòu)件501 503,是由意群串充當(dāng)?shù)臉?gòu)件。用于填充簡單句艙203 204或艙眼 205 207的構(gòu)件,簡單句艙與艙眼是上、下位概念而大小一樣,都是除不表意虛詞外不超過 三個意群串4、 小習(xí)語構(gòu)件601,由過于簡短不足以分出句型、句艙的句子充當(dāng)小習(xí)語構(gòu)件。用于直 接構(gòu)成簡短的句子。上文所述的語句構(gòu)件裝置,除已有的相應(yīng)文種(英文、中文、俄文)外,每增加一個語 種,首先應(yīng)將句型庫、艙模庫、意群串庫、習(xí)語庫分別依次各增加一個某文句型、某文艙模、 某文串、某文習(xí)語字段。并且新加文種的構(gòu)件只有與已有語種構(gòu)件的語意相同的才能填加在 同一個記錄上。也即再次強調(diào)只有相同語意的語句構(gòu)件才能共處一個記錄。對于上述四個庫,可以只提取二個字段構(gòu)成相應(yīng)分庫即提取句型庫、艙模庫、意群串 庫、習(xí)語庫中的某文句型、某文艙模、某文串或某文習(xí)語和某某碼兩個字段,構(gòu)成某某語言庫或第一語言庫、第二語言庫而應(yīng)用于語言翻譯或文本轉(zhuǎn)換等場合。上文所述語句構(gòu)件的來源,其一、是通過專家操作、人機交互的方式,剖析比對雙語對 訓(xùn)練樣本語料得到。其二、即另一個來源是用戶的反饋信息經(jīng)專家審核后再加入;通過支持 網(wǎng)站實現(xiàn)。二、 一種語句構(gòu)件的制作方法語句構(gòu)件的制作方法①準備樣本語料,取相同內(nèi)容的雙語或多語種文字版本的語料作 為訓(xùn)練樣本。利用人機交互的方式先②進行句型層面的剖析比對;然后③進行句艙層面的剖 析比對。從而得出字、詞、句表意得以對等和統(tǒng)一的語句構(gòu)件,包括如下步驟H準備樣本語料,利用相同內(nèi)容的雙語或多語種文字版本的語料作為訓(xùn)練樣本。每輪 比對選A、 B雙語作為一個樣本對。其中A語分配給拼音文字或已經(jīng)比對過的文種;B語可以分配給拼音文字也可分配給表意文字以及新加入的文種。第一輪雙語對訓(xùn)練樣本的剖析比對。其中雙語對樣本的A語為英文,B語為中文。從第 二輪開始新語對中必須其一是已經(jīng)進行過剖析比對的。如當(dāng)加入俄文時,只能取中俄或英俄 語料作為雙語對訓(xùn)練樣本,第二輪剖析比對的雙語對樣本中A語應(yīng)是已比對過的中文或英文, B語應(yīng)是新加的俄文。這個特征就是上文所強調(diào)的,保證相同語意的構(gòu)件才共處一個記錄, 是一個強有力的措施。每一輪的訓(xùn)練語料樣本應(yīng)大到新增句型/句例比<淺后方可考慮增加新語種例如在操 作過程中, 一個工作日下來統(tǒng)計,新增的句型數(shù)除以新增的樣本句對的比例<1%。 <1%后再 考慮進行次一輪的剖析比對。另一方面,根據(jù)訓(xùn)練樣本語料的行業(yè)來源或應(yīng)用范圍來源來標 記。借此劃分句型庫、艙模庫、意群串庫、習(xí)語庫為若干個相應(yīng)分庫。這些分庫用于相應(yīng)行 業(yè)或?qū)S冒姹?。加上設(shè)有支持網(wǎng)站;有益于用戶細分;也有益于版本升級。上述語料的收集過程中、必要時的錄入是自然的事。 句型層面剖析比對圖7是句型層面比對流程圖。句型層面剖析比對。讀取雙語樣本句對,劃分出句型、句 艙,把句型作為語句構(gòu)件存入句型庫,把不足以分出句型、句艙的小習(xí)語作為小習(xí)語構(gòu)件存入習(xí)語庫;同時保存已經(jīng)劃分出句型、句艙的雙語樣本句例對,以備句艙層面的進一步比對。具體步驟如圖7所示開始,先讀入一個雙語樣本句對701。然后調(diào)用配句型字程序702, 査找句型庫返回A、 B語匹配句型。判有匹配句型703,若是、有匹配句型,下續(xù)型例配707: 若否、沒有匹配句型,續(xù)挖句艙作句型操作704。即以當(dāng)前雙語樣本句對為例制作新句型, 彈開一窗口,上橫行顯示A語句、下橫行顯示B語句,橫行下再顯示挖句艙、存句型兩個命 令按鈕,并提示專家點擊A、 B語例句的待挖句艙的首尾點,挖句艙計數(shù)器N-O。當(dāng)挖句艙命 令按鈕被點擊后,置N1+1,檢查A、 B語是否都被點擊兩個點以及這兩個點是否有效。拼音 文字兩點間^一個詞串、表意文字fe—個字為有效。若否,提示重作如果點擊正確并且有 效,將A、 B語句兩點之間的內(nèi)容挖去并填入"洲",該輪挖句艙結(jié)束,下一輪重復(fù)挖句艙作 句型操作704再挖下一個句艙。當(dāng)判斷到存句型705命令按鈕被點擊并且NS1,表示挖句艙 制作新句型操作完畢。清除上述相應(yīng)顯示,迸行存句型或存小習(xí)語706。把兩個新句型作為 句型構(gòu)件分別加入句型庫A文句型、B文句型字段。如果這時N-O,表示當(dāng)前雙語樣本句對不 足以分出句型、句艙而被判定為小習(xí)語。那么,清除相應(yīng)顯示,則把兩個小習(xí)語作為小習(xí)語 構(gòu)件分別加入習(xí)語庫A文習(xí)語、B文習(xí)語字段。再接續(xù)型例配707,把當(dāng)前雙語樣本例句對號入座地填入當(dāng)前匹配句型、或填入當(dāng)前新作句型,作為已經(jīng)劃分出句型、句艙的樣本句例對 存盤備句艙層面的剖析比對讀取接續(xù)。本步驟結(jié)束。下一個雙語樣本句對開始,再執(zhí)行讀入 雙語樣本句對701。配句型字程序,其優(yōu)選例是事先把句型變?yōu)榫湫驮~串(如把"Does UH2} as {3} as {4} "變?yōu)?does as as"),再把例句從左到右,英(拼音文字)逐個單詞、中(非拼音 文字)逐個字取下,以它們査句型首字或首單詞;把符合的句型集于臨時庫。然后以循環(huán)語 句再逐個句型考測。循環(huán)中又設(shè)開關(guān)語句,以句型詞串空之?dāng)?shù)作開關(guān)語句(如句型詞串"does as as" = 2空3段),進入后句型詞串每段依次與例句比對,比對后兩者都棄去(相同者 無影響)。當(dāng)各段都分別能在例句段中找到為之中選,即是匹配例句的句型,列表給出。如果 有數(shù)個句型符合,選取所含句型詞串最長的那個句型。如果出現(xiàn)串長度相同的情況,接受人 工干預(yù)。以下以具體的句例對進一步來說明上述步驟流程開始,讀入一個雙語樣本句對701, 如果讀入的句對是"Does John work as hard as Henry 約翰象亨利一樣努力工作嗎?" 調(diào)用配句型字程序702,査找句型庫返回A、 B語匹配句型。判有匹配句型703,若否、沒有 匹配句型,續(xù)挖句艙作句型操作704步驟。即以當(dāng)前雙語樣本句對為例制作新句型。彈開一 窗口,上橫行顯示A語句,"Does John work as hard as Henry "、下橫行顯示B語句"約 翰象亨利一樣努力工作嗎?",橫行下再顯示挖句艙、存句型兩個命令按鈕,并提示專家點擊 A、B語例句的待挖句艙的首尾點,挖句艙計數(shù)器N-0。當(dāng)挖句艙命令按鈕被點擊后,置N-N+1, 檢査A、 B語是否都被點擊兩個點以及這兩個點是否有效。如"Does I John i*ork as hard as Hemr "" l約翰i象亨利一樣努力工作嗎? "(1,為被點擊處)。它們的點擊正確并且有效, 將A、B語句兩點之間的內(nèi)容挖去,這時N=l填入"{1}",為"Does {1} work as hard as Henry " "{1}象亨利一樣努力工作嗎?"。存句型命令按鈕沒有被點擊;下一輪重復(fù)挖句艙作句型操 作704再挖下一個句艙;如"Does {1} |work |as hard as Henry " " {1}象亨利一樣努力 i工作i嗎? " N=2,填入"{2}",為"Does {1) {2) as hard as Henry " " {1}象亨利一 樣努力{2}嗎?"。如果存句型命令按鈕沒有被點擊;繼續(xù),N=3、 N=4。當(dāng)為"Does {1} {2} as {3} as {4} ", "{1}象{4}—樣{3}{2}嗎 "時,判斷到存句型705命令按鈕被點擊并且N ^1,表示挖句艙制作新句型操作完畢。清除上述相應(yīng)顯示,進行存句型706步驟;把兩個新 句型作為句型構(gòu)件"Does W {2} as {3) as {4} "加入句型庫A文句型字段;"聽{4} 一樣{3}{2}嗎?"加入句型庫B文句型字段。再接續(xù)型例配707步驟,把當(dāng)前雙語樣本例句 對號入座地填入當(dāng)前新作句型,作為已經(jīng)劃分出句型、句艙的樣本句例對,如"Does njohn} 2 {work) as 3 {hard} as 4 {Henry} 1{約翰)象4{亨利)一樣2{努力}3{工作}榪?",并存 盤保留,備句艙層面的剖析比對讀取,本步驟結(jié)束。下一個雙語樣本句對開始,再執(zhí)行讀入 雙語樣本句對701。假如上面讀入的句對是"How do you do "、"您好!",當(dāng)判斷到存句型705命令按鈕 被點擊,這時N-0,表示當(dāng)前雙語樣本句對不足以分出句型、句艙而被判定為小習(xí)語。那么, 清除相應(yīng)顯示。存小習(xí)語706,把兩個小習(xí)語作為小習(xí)語構(gòu)件,"Hov do you do "加入習(xí)語 庫A文習(xí)語、"您好!"加入B文習(xí)語字段。再接續(xù)型例配707,本步驟結(jié)束。下一個雙語樣 本句對開始,再執(zhí)行讀入雙語樣本句對701。句型層面比對整理的要點是挖句艙作句型,其中該如何挖、該如何制作句型。要求就是 保證可操作性的前提下追求代表性??刹僮餍约醋岆娔X無需理解、分析做諸如上述的查表、判斷、存儲等操作。代表性即句型涵蓋的句例多少,可涵蓋句例越多代表性越好。句型層面 比對過程中要求專家掌握的原則措施如下-(D多語對語義考慮原則從多語對、至少是雙語對的語義上考慮。如果條件許可,自然是取盡可能多的語對同時進行句型提取;正是因為不可能才要求至少是雙語對進行。如We used to go to the movies about once a week.通常我們每周大約去看一次電影。 這個句對,英文可以把"go to the raovies",作為一個句艙,但是中文相應(yīng)的"看電 影"中間插有"一次"。"onceaweek"作為一個句艙,中文的"每周一次"又被其它詞隔開。 這兩種情況都不行,必須在雙語對語義上考慮均可才行。這個句對可-1{We) used to 2{go to the movies about once} a week,通常1{我們}每周2{大約去看一次電影}。② 代表性考慮原則句艙的多少、大小直接影響句型的代表性。我們的原則是保證可操作性的前提下追求代 表性。關(guān)于句艙大小以何為宜,下文解說。這里先解釋一下代表性的問題 How many are there in your family1 你家有幾CJ人7這個句對如果只把"your family"作為句艙可用"his family: John' s family: your class"等等填充。但是由于"Ho* many"與"f細ily"語義有關(guān)聯(lián)。中文對于"家" 問"幾口人";但對于"班級"應(yīng)問"多少學(xué)生",或"多少人"。這樣只把"your family" 作為句艙代表性就差。如果把"Ho* many"與"family"作成兩個句艙,不但語意上可以相 互照應(yīng);而且代表性也增加了。③ 樸質(zhì)準確的考慮原則鑒于意通文本的定位是"樸質(zhì)準確地傳遞語義",當(dāng)挖句艙顧此失彼而無耐時,可以修 改華麗的譯句為樸質(zhì)直譯,再挖句型。如-There can never be too much deception in war , 兵不厭詐。該例譯句"兵不厭詐"既華麗又簡練,但句型采集難以操作。把中文改為樸質(zhì)直譯"戰(zhàn) 爭中再多的詭計也不為過。"再作挖句艙處理There can never be too much 1{deception} in 2{var}. 2{戰(zhàn)爭}中再多的1{詭計}也不為過。For al〗their great size ,the elephants moved absolutely noiselessly ,盡管象的身軀龐大,它走動起來卻一點聲音也沒有。這"一點聲音也沒有";很難落實到句型或某個句艙;將它改為樸質(zhì)直譯"走動起來卻 靜靜地"問題便迎刃而解了For all their 1{great size} , 2{the elephants} 3{moved} absolutely 4{noiselessly}.盡管2{象}的1{身軀龐大} , 2{它} 3汰動}起來卻4{靜靜地}。 0ig法簡繁的原則從語法方面考慮,復(fù)雜的、個性化的語法現(xiàn)象都攬到句型上;使句艙內(nèi)語法極為簡單。 上面所舉的例子不難明白這一點。在具體操作上還可以適當(dāng)增加句艙個數(shù)來降低句艙復(fù)雜程 度,盡量少作大句艙(詳下文)。l{Shej never 2ico祖esJ but 1{she} 3{brings something for the children}.li她)沒有一次2{來}不是就3{為孩子們帶來一些東西)。 如增加句艙,把句艙{3}改成{3}{4}復(fù)雜性就降低了。如l{She} never 2 {comes) but 1 {she} brings 3 {something} for the ^children), 1{她1沒有一次2{耒}不是就為4{孩子們}帶來3{—些東西}。⑤ 詞性和可替換性的原則句艙是可以被其它詞匯替換的部分,可替換的詞匯越多,可替代性越強;間接地使句型 的代表性加強。句艙內(nèi)詞匯的詞性盡可能局限于數(shù)詞、名詞、形容詞、復(fù)串,少數(shù)情況才考 慮其它詞類(如動詞、副詞等〉。如果說要給做句艙的詞類排優(yōu)先次序,那首先就是數(shù)串、 專用串,次則名串、形容詞串……,最后考慮動詞串。最不考慮的是介詞和連詞。也就是介 詞、連詞幾乎都納歸句型部分。⑥ 句型詞不宜太少的原則要求句型釆集達到句艙內(nèi)語法極為簡單,復(fù)雜語法現(xiàn)象盡攬于句型;挖去句艙后留下的 句型,所含句型詞不宜太少,因為太少了不便句型的檢出。最理想的情況是每個句艙之前后都有句型詞,也就是沒有連續(xù)句艙的情況。原則是任何 一個句型,在任何文種里的框架結(jié)構(gòu)必須有一個或一個以上的文字串作為句型詞。不允許在 多語對當(dāng)中,某文種甚至沒有句型詞,中文因為最簡潔,這種情況時有發(fā)生,一但發(fā)生就得 返工,必須避免。有時連續(xù)出現(xiàn)幾個句艙,即連續(xù)句艙何題。還有是句艙的大小,盡量少作大句艙何題, 這些都與句型詞不宜太少相關(guān),這些情況在相關(guān)標題下闡述。⑦ 多連續(xù)句艙盡量避免的原則1{1} 2{get to work} at 3{nine o'clock} every morning . 每天早上3(九點鐘} 1{我} 2{開始工作}。上例英連續(xù)出現(xiàn)UH2)兩個句艙;相應(yīng)的中文則變?yōu)閧3}{1}{2}三個連續(xù)句艙。二個或二個以上句艙相連稱連續(xù)句艙;三個或三個以上句艙相連稱多連續(xù)句艙。連續(xù)句艙不但具有句型詞太少之弊,套句型還得人工干預(yù)。特別是連續(xù)三個或更多的情況應(yīng)盡量避免。如上例 減少到兩個句艙就無此之慮了 I 1 {get to work) at 2{nine o'clock} every morning , 每天早上2{九點鐘}我1{開始工作}。⑧ 盡量少作大句艙的原則句艙有大有小,最小的句艙只含一個意群串;最大的句艙可以包含一個分句或從句。我 們在作句型時,宜盡量少作大句艙。那么,如何掌握這個盡量少,以何為尺度呢?以"只能 這樣"為準。例如下面句對Can, you guess 1{what I was doing} 2{this morning} 7你能猜到2{今天上午} 1{我在做什么}嗎?I have forgotten 1(賣hat time} he said he 2{had dinner} 3{last night}.我忘記他說他3{昨天晚上}是1{什么時候} 2{吃的晚飯}。What were you doing賣hen 1{I called you on the telephone} 71{我打電話給你}的時候,你在做什么?I have forgotten 1{what he said his address was}.我忘記1{他說他的住址在哪里了}。上面四個句對,分別由what、 when引出一個從句。第一對可以把主謂、時間狀語分開 作成兩個句艙。第二對可以作成三個句艙。第三對不能將狀語分開,只能作成一個句艙;第四對What針對表語提問,也不能分開,只能作成一個句艙。第三、四兩對都"只能這樣", 這就是少作大句艙要把握的尺度。 ⑨挖句艙后的審定原則挖句艙之后還得認真審定將句型、以至每個句艙分別審定。先看句型義, 一定要都來 自句型詞,與句艙內(nèi)容無粘連。然后審定每個句艙,它們必須是可替換的,與句型分開的, 不與句型義有粘連。如果某句艙與某句型詞有所粘連,必須修改之。例如When do you think l{the meeting trill be held) 你認為1{會議在什么時候召開} 這樣劃句型、句艙不對,句艙內(nèi)容"什么時候"與句型詞"When"有粘連。應(yīng)修改為-When do you think 1 {the meeting} irill be 2{held} 7 你認為1{會議}會在什么時候2{召開} 〇句艙層面剖析比對圖8是句艙層面比對流程圖。如圖8所示,開始運行,讀入已經(jīng)劃分出句型、句艙的雙 語樣本對801。執(zhí)行取句艙、顯示、組復(fù)詞802步驟,依次取出已經(jīng)劃分出句型、句艙的樣 本句例對當(dāng)中的一個句艙,開窗口一上部顯示A、 B語樣本句例,下部顯示A、 B語當(dāng)前句艙 內(nèi)容。同時,把A語當(dāng)前句艙以詞串為單元切分并依次填入?yún)⒖急鞟語字段,再依次取出一 個詞串査找意群串庫的A文串字段,找到后取出同記錄的B文串字段內(nèi)容。如果該B文串內(nèi) 容在B語當(dāng)前句艙中含有,把B文串內(nèi)容填入?yún)⒖急鞡語字段,不含有讓它為空。作完整個 參考表,開窗口二顯示參考表、組復(fù)詞命令按鈕以及可組復(fù)詞操作提示。接受專家點擊參考 表并在被點記錄標志字段作標志。當(dāng)組復(fù)詞命令按鈕被點擊并且參考表有連續(xù)記錄被點擊, 將參考表中有標志記錄的A語字段內(nèi)容以"-"相連組成復(fù)詞,并把有標志記錄合并成一條記 錄,A語字段填入該復(fù)詞,B語字段以相等語意的詞串填寫。接續(xù)判斷是否簡單句艙803,若 是接續(xù)意群對齊808;若否、査詢艙模庫判斷當(dāng)前句艙是否含有艙模804。若不含艙模執(zhí)行編 寫艙模805,開窗口三作為可編輯窗口,將當(dāng)前雙語句艙內(nèi)容再顯示,接受專家以此為基礎(chǔ) 編寫艙模,還顯示存艙模命令按鈕。若含有艙模,把所含艙模作為當(dāng)前艙模執(zhí)行步驟劃分 出艙模、艙眼806。當(dāng)存艙模命令按鈕被點擊,并且可編輯窗口已經(jīng)被編輯過,新編艙模也符 合格式要求,將新編A、 B語艙模作為艙模構(gòu)件存入艙模庫A文艙模、B文艙模字段,同時,將 當(dāng)前句艙內(nèi)容對號入座地填入當(dāng)前艙模,或填入新編艙模作為已經(jīng)劃分出艙模、艙眼的復(fù)雜 句艙顯示。續(xù)取艙眼807,依次取出一個艙眼的內(nèi)容,接續(xù)執(zhí)行意群對齊808步驟。在第二個窗口 參考表下顯示對齊確定命令按鈕,參考表接受專家按實例延伸或增補詞義、不改變原有字單 詞的前提下加減串長度、粘帶附隨字、詞形變化增補詞義項等意群對齊的修改,或優(yōu)選記錄。 當(dāng)對齊確定命令按鈕被點擊,表示參考表內(nèi)A、 B語的詞串已經(jīng)意群對齊、即已成意群串,進行 保存意群串808操作,逐記錄地把A、 B語字段內(nèi)容作為意群串構(gòu)件存入意群串庫的A文串或 B文串字段。如果當(dāng)前操作的是艙眼,判艙眼完809,否,如果當(dāng)前句艙還有艙眼沒有操作, 再執(zhí)行取艙眼807步驟;直到作完當(dāng)前句艙的所有艙眼。再判句艙完810,判當(dāng)前已經(jīng)劃分 出句型、句艙的樣本句例對中是否還有未處理的句艙,否,還有未處理句艙,執(zhí)行取句艙802 步驟;繼續(xù)處理句艙。如果全部句艙處理完畢,執(zhí)行再讀入句對801步驟,讀入下一個已經(jīng) 劃分出句型、句艙的雙語樣本句對。進行下一輪操作。下面以具體的句例對進一步來說明上述步驟流程開始運行,讀入(經(jīng)句型層面比對過)已經(jīng)劃分出句型、句艙的雙語樣本對801,例如 是"Hthe fisherman} consents to 2{ return the—feather—suit} , on condition that 3{fairy dance and play heavenly music for him}.","在3 (仙女為他跳舞并演奏天上 的樂曲}的條件下,1{漁夫}答應(yīng)2{歸還羽衣}。"這個例句對各有1、 2、 3,三個句艙。執(zhí)行 取句艙、顯示、組復(fù)詞802步驟,依次取出已經(jīng)劃分出句型、句艙的樣本句例對當(dāng)中的一個 句艙,開窗口一上部顯示A、 B語樣本句例,下部顯示A、 B語當(dāng)前句艙內(nèi)容。同時,把A語 當(dāng)前句艙以詞串為單元切分并依次填入?yún)⒖急鞟語字段,再依次取出一個詞串査找意群串庫 的A文串字段,找到后取出同記錄的B文串字段內(nèi)容。如果該B文串內(nèi)容在B語當(dāng)前句艙中 含有,把B文串內(nèi)容填入?yún)⒖急鞡語字段,不含有讓它為空。作完整個參考表,開窗口二顯 示參考表、組復(fù)詞命令按鈕以及可組復(fù)詞操作提示。假如句艙2為當(dāng)前句艙,當(dāng)前句艙A語 是"return the feather suit"; B語是"歸還羽衣";這時的參考表為A語字段 return the feather suitB語字段 歸還 VV V參考表B語有三個記錄為空,但對應(yīng)于"feather"有"羽毛";對應(yīng)于"suit"有"衣 服";并且這三個記錄都有專家點擊的"V "標志。并且復(fù)詞命令按鈕已被點擊,將參考表中 有標志記錄的A語字段內(nèi)容以"相連組成復(fù)詞,并把有標志記錄合并成一條記錄,A語字 段填入該復(fù)詞,B語字段以相等語意的詞串填寫。這時參考表變?yōu)?A語字段 return the—feather—suitB語字段歸還 羽衣現(xiàn)在,當(dāng)前句艙A語是"return the—feather—suit"; B語是"歸還羽衣";接續(xù)判斷 是否簡單句艙803,是,接續(xù)意群對齊保存意群串808步驟;這時已經(jīng)是意群對齊,然而保 存意群串,把"return"、"歸還",加入意群串庫A、 B文串字段,如圖5a:把"the_feather—suit"、"羽衣"加入意群串庫A、 B文串字段,如圖5b。否,假如當(dāng)前句艙 是句艙3,不是簡單句艙,判有無艙模804,査詢艙模庫判斷當(dāng)前句艙是否含有艙模。否,不 含艙模,執(zhí)行編寫艙模805步驟,開窗口三作為可編輯窗口,將當(dāng)前雙語句艙內(nèi),fairy dance and play heavenly music for hi鵬"、"仙女為他跳舞并演奏天上的樂曲"再顯示,接受專 家以此為基礎(chǔ)編寫艙模,還顯示存艙模命令按鈕。若含有艙模,把所含艙模作為當(dāng)前艙模執(zhí) 行步驟劃分出艙模、艙眼806。當(dāng)存艙模命令按鈕被點擊,并且可編輯窗口,如這時為"{1}{2} and {3} for him"、 " {1}為他{2}并{3}",已經(jīng)被編輯過;是新編艙模也符合格式要求, 將新編A、 B語艙模作為艙模構(gòu)件存入艙模庫A文艙模、B文艙模字段,如圖4所示。同時,將 當(dāng)前句艙內(nèi)容對號入座地填入當(dāng)前艙模,或填入新編艙模,如"l{fairy} 2(danCe} and 3 {play heavenly music} for him"、 " 1 {仙女}為他2 {跳舞}并3{演奏天上的樂曲}"作為已 經(jīng)劃分出艙模、艙眼的復(fù)雜句艙顯示。這個復(fù)雜句艙含有3個艙眼。續(xù)取艙眼807,依次取 出一個艙眼的內(nèi)容,接續(xù)執(zhí)行意群對齊808步驟。在第二個窗口參考表下顯示對齊確定命令 按鈕,參考表接受專家按實例延伸或增補詞義、不改變原有字單詞的前提下加減串長度、粘 帶附隨字、詞形變化增補詞義項等意群對齊的修改,或優(yōu)選記錄。這三個艙眼A、 B文都有相 對應(yīng)的原有詞串,不用多說明。其中"play"中文原有詞典只有"游戲,比賽,運動,賭博, 劇本;玩,扮演,播放,進行比賽、播放"等而沒有"演奏"接受專家"按實例延伸或增補 詞義"加上"play"、"演奏",當(dāng)前艙眼是艙眼3,參考表為 A語字段play heavenly musicB語字段演奏 天上的 樂曲當(dāng)對齊確定命令按鈕被點擊,表示參考表內(nèi)A、 B語的詞串已成意群串,進行保存意群串808操作,逐記錄地把A、 B語字段內(nèi)容作為意群串構(gòu)件存入意群串庫的A文串或B文串字段。 如果當(dāng)前操作的是艙眼,判艙眼完809,否,如果當(dāng)前句艙還有艙眼沒有操作,再執(zhí)行取艙 眼807歩驟直到作完當(dāng)前句艙的所有艙眼。再判句艙完810,判當(dāng)前已經(jīng)劃分出句型、句 艙的樣本句例對中是否還有未處理的句艙,是,還有未處理句艙,執(zhí)行取句艙802步驟;繼 續(xù)處理句艙。如果全部句艙處理完畢,執(zhí)行再讀入句對801步驟,.讀入下一個已經(jīng)劃分出句 型、句艙的雙語樣本句對。進行下一輪操作。句艙層面比對操作如上述"組復(fù)詞",將原有詞串以"-"相連成復(fù)詞(復(fù)串);它們的目 的是便于更好地體現(xiàn)詞義;以便不同文種之間詞匯表意的對齊。主要有如下幾種情況,要求 專家掌握-① 直接詞譯不能表達時,按意群組成復(fù)串you were gone直譯應(yīng)是"你(是)走";"了"來源于過去式,故組成復(fù)串 "you—were—gone你走了"call—on—me來訪我 knew—nothing—about—it —無所知compelled—to—go非去不可show—himself—in_his—true—colours現(xiàn)出原形、現(xiàn)出本色② 以簡潔看齊,復(fù)雜表示者組成復(fù)串英"per-咖grain yield ,每畝谷物產(chǎn)量";中為"畝產(chǎn)"。將英組成復(fù)串 "per-mu—grain—yield", 向中看齊。又如 'Late—at—night 深夜 down—to一the一countryside下鄉(xiāng) fightjt—out—to—the—end 斗爭到底③ 有轉(zhuǎn)義表示一事物,或經(jīng)常性搭配的組成復(fù)串fell—asleep入睡 knows—nothing —無所知come—back—from—the—front 下火線the—sweat_was_pouring—down 汗如雨.下-pictures一it一have一just一taken 近照put—my—finger—on 指出④ 詞義有重合或重復(fù)的組成復(fù)串very—well 不錯; doubts—of—questions疑問,' bear—fruit結(jié)果; the—far—distance遠處;經(jīng)過上述組復(fù)詞的操作,往往在一個句艙里,部分詞串組成了復(fù)串,使部分看似復(fù)雜的 句艙變?yōu)楹唵尉渑?。組復(fù)詞也是意群對齊的措施之一,應(yīng)靈活應(yīng)用。句艙層面比對操作如上述"意群對齊"的操作要求專家掌握的原則、措施如下 ①依照實例、延伸或增補詞義Nothing can be 1 {wholly beautiful} that is加t 2{useful}.凡是未經(jīng)2{應(yīng)用的} 就不可能1{完美}。其中 sefur詞義有"有用的、有幫手的、有益的",選它們都不適合;增補,"應(yīng)用的,, 詞義項。l(She) ■ 2 {strong} , for all "she} was so 3 {small} . 1{她}雖然3〖瘦小}, 但很2{結(jié)實}。如其中small小的,增補"瘦小"詞義項。I柳very ill.我患重病。把動詞"咖"增補"患"的詞義。 Leamthetruth明白真相,Learn增補"明白"詞義項。② 不改變原有字、單詞的前提下加減串長度,便于拼接I ask you to teach me every other day.我請你每隔一天來教我。其中'teach" v有 "講授、教授"詞義減詞串長為"教"便于拼接,增加"教"詞義項。Sttend school入學(xué);sttend加"入"詞義項,簡釋"加入";school加"學(xué)"詞義項,簡釋"學(xué)校"。③ 粘帶附隨詞串如"good好"粘帶成"好處、好事、好心、好用"等(中文別附隨量詞,后者另行處理)。 如"word詞"粘帶成"詞兒"等。④詞形變化增補詞義(分詞,比較級等表達的語意,增加相應(yīng)詞義),這樣可以省略詞形 分析、處理。been增補"還是、怎么樣"詞義; punished增補"受處分"詞義best增補"最好的"詞義; had增補"以前"詞義;done增補"做好了、完成了"詞義; villagei增補"多個農(nóng)村"詞義;三、 一種基于語句構(gòu)件的母語讀外文方法圖9是基于語句構(gòu)件的母語讀外文方法流程圖。如圖9所示,開始作一些界面等準備。 由用戶指定母語和源語各是構(gòu)件庫所含的哪一個文種。把屏幕分成上、中、下或前、中、后 三個窗口;中部窗口用于顯示當(dāng)前操作句以及操作中的相關(guān)信息,下或后部窗口用于顯示源 語待讀文本,上或前部窗口用于顯示已讀的母語文本。此外,在提示行顯示悔操作、存盤退 出等命令按鈕以及一、一移詞序按鈕;或把它們作成浮條緊隨中部下或用戶可移。然后,運 行,源語句讀入901,讀入源語一個句子作為當(dāng)前句顯示在中部窗口,母語文本顯示尾加已 處理的前一句內(nèi)容,源語文本顯示減當(dāng)前句內(nèi)容。判斷小習(xí)語902,以當(dāng)前句査詢習(xí)語庫的 源語習(xí)語字段。若有,給出小習(xí)語903,取出同記錄的母語習(xí)語字段中的母語小習(xí)語,顯示 在中部窗口,并將同記錄的習(xí)語碼讀入世界文緩存區(qū),然后再執(zhí)行步驟源語句讀入901。若 無,沒有找到,續(xù)調(diào)用配句型子程序904。以當(dāng)前句査詢句型庫的源語句型字段,如果一個 匹配的句型也沒有,存句型庫代表數(shù)于反饋緩存區(qū)。如果査到多個匹配句型,在中部窗口下 部顯示相應(yīng)的母語句型,接受用戶選定一個句型?;蛘咧粬说揭粋€匹配的句型,給出同記錄 的句型碼、母語句型以及源語句型,將母語句型著重顯示在中部窗口的上部,把源語句子對 號入座地套入源語句型,附注式顯示在該窗口母語下方,并把句型碼讀入世界文緩存區(qū)。接 著執(zhí)行取句艙905步驟,從左到右在中部窗口標示母語句型中的當(dāng)前句艙,存入當(dāng)前句艙標 號,即(句型內(nèi)原句艙標號+ FFE0H)于世界文緩存區(qū)。同時標示和取出源語相應(yīng)句艙內(nèi)容 作為當(dāng)前句艙內(nèi)容,判斷當(dāng)前句艙內(nèi)容是否屬于簡單句艙906。若是簡單句艙,執(zhí)行步驟詞 義確定909。若否,執(zhí)行步驟査配艙模907。以當(dāng)前句艙內(nèi)容査詢艙模庫的源語艙模字段。如 果一個匹配的艙模也沒有,存艙模庫代表數(shù)于反饋緩存區(qū)。如果査到多個匹配艙模,向下擴 展中部窗口,在擴展部顯示相應(yīng)的母語艙模,接受用戶選定其一;或只査到一個匹配的艙模 給出同記錄的艙模碼、母語艙模以及源語艙模。將母語艙模著重顯示在中部窗口的擴展部, 把源語句艙內(nèi)容對號入座地套入源語艙模,附注式顯示在該窗口母語艙模的下方,并把艙模 碼讀入世界文緩存區(qū)。然而后續(xù)取艙眼908步驟。以母語艙模為準從左到右,在母語艙模上逐個標示當(dāng)前艙眼存當(dāng)前艙眼標號(艙模上原艙眼標號+FFDOH)于世界文緩存區(qū);同時標 示和取出源語相應(yīng)艙眼內(nèi)容,執(zhí)行步驟詞義確定909。從左到右讀出源語的簡單句艙或艙眼 中的一個詞串,査詢意群串庫的源語文串字段。如果一條相同的詞串也沒有,存當(dāng)前源語詞串 于反饋緩存區(qū)。若查到多條相同詞串,分別取出它們的同記錄母語串字段內(nèi)容,備份于悔選擇 緩存,并顯示在已擴展的中部窗口下部,接收用戶選定其一;或只査到一條相同詞串,執(zhí)行步驟 給出母語串909。取出當(dāng)前記錄的母語串字段內(nèi)容填入到當(dāng)前母語句艙或當(dāng)前母語艙眼,取 出意群碼存入世界文緩存區(qū)繼續(xù)執(zhí)行詞義確定909,直到當(dāng)前簡單句艙或當(dāng)前艙眼操作完 畢。根據(jù)個性丟失表的信息進行當(dāng)前句艙或艙眼的個性丟失補償911。再根據(jù)母語詞序表的 信息糾正當(dāng)前句艙或艙眼的母語詞序911。并査詢 、一移詞序按鈕。當(dāng)一按鈕被點擊將當(dāng) 前句艙或艙眼用戶所點擊詞串后移于后一詞串之后當(dāng)一按鈕被點擊將當(dāng)前句艙或艙眼用戶 所點擊詞串前移于前一詞串之前;同時將移動后的詞序加入母語詞序表備用。后續(xù)判斷912, 如果當(dāng)前句艙還有艙眼未處理,執(zhí)行步驟取艙眼908。后續(xù)判斷句結(jié)束913,若否,而當(dāng)前句 子還有句艙未處理,執(zhí)行步驟取句艙905。若當(dāng)前句子所有句艙全部處理完畢,査詢反饋緩 存區(qū)和命令按鈕當(dāng)反饋緩存區(qū)不為空,將反饋緩存區(qū)的信息加上源語種、母語種、當(dāng)前源 語句子等信息作成電子郵件反饋到支持網(wǎng)站;清空反饋緩存區(qū),在世界文緩存區(qū)存入"反饋 句"標志。當(dāng)悔操作命令按鈕被點擊,根據(jù)用戶點擊的欲悔詞串,取出悔選擇緩存中的相應(yīng) 內(nèi)容讓用戶重選詞串并作相關(guān)修改。當(dāng)接收到存盤退出命令時,將世界文緩存區(qū)的內(nèi)容存盤 為世界文,文件名^源語文件名.SJW;如果源文未完,文件頭中記下源文偏移。如果悔操作、 存盤退出命令按鈕都沒有被點擊時,接續(xù)執(zhí)行步驟源語句讀入901。下面以實例進一步來說明上述步驟流程開始作一些界面等準備。源語句讀入901,讀入源語一個句子如"Children not Allowed!" 作為當(dāng)前句顯示在中部窗口,母語文本顯示尾加已處理的前一句內(nèi)容,源語文本顯示減當(dāng)前 句內(nèi)容。判斷小習(xí)語902,以當(dāng)前句査詢習(xí)語庫的源語習(xí)語字段。有,給出小習(xí)語903,取出 同記錄的母語習(xí)語字段中的"兒童不許入內(nèi)!"這個母語小習(xí)語,顯示在中部窗口,并將同記 錄的習(xí)語碼(便于閱讀給編碼名稱及低字位十迸制數(shù),下同;如"^語礙,")讀入世界 文緩存區(qū),然后再執(zhí)行步驟源語句讀入901。假如讀入的源語句子是"The doctor told his patient that he would prescribe him some patent medicine on condition that he strictly follow his instructions.",作為當(dāng)前句顯示在中部窗口,母語文本顯示尾加已處理的前一 句內(nèi)容"兒童不許入內(nèi)!",源語文本顯示減當(dāng)前句內(nèi)容。判小習(xí)語902,以當(dāng)前句査詢習(xí)語 庫的源語習(xí)語字段。無,沒有找到,續(xù)調(diào)用配句型子程序904。以當(dāng)前句査詢句型庫的源語 句型字段,這時只査到一個匹配的句型,給出同記錄的句型碼、母語句型以及源語句型,將 母語句型"{1}告訴他的{2},如果能{4},就可以{3}。"著重顯示在中部窗口的上部, 把源語句子對號入座地套入源語句型"the {1} told Ms {2} that {3} on condition that {4}.",附注式顯示在該窗口母語下方"the 1 {doctor} told his 2 {patient} that 3 {he would prescribe hi加some patent medicine} on condition that 4{he strictly follow his instructions}.",并把句型碼"OWOW讀入世界文緩存區(qū)。接著執(zhí)行取句艙905 步驟,從左到右在中部窗口標示母語句型中的當(dāng)前句艙,存入當(dāng)前句艙標號于世界文緩存區(qū)。 同時標示和取出源語相應(yīng)句艙內(nèi)容作為當(dāng)前句艙內(nèi)容,判斷當(dāng)前句艙內(nèi)容是否屬于簡單句艙 906。若是簡單句艙,執(zhí)行步驟詞義確定909。例如這里母語依次標示句艙1、句艙2;存句艙標號"包敏叛專W"、"場^"叛爭C;取出源語相應(yīng)句艙內(nèi)容"doctor"、 " patient" 判斷都是簡單句艙(一個詞串不展開;下有三個串者再展開),詞義確定分別為"醫(yī)生"、"病 人"。執(zhí)行步驟給出母語串909。取出當(dāng)前記錄的母語串字段內(nèi)容填入到當(dāng)前母語句艙l、句 艙2,成為"1{醫(yī)生}告訴他的2{病人},如果能{4},就可以{3}。"取句艙,從左到右 在中部窗口標示母語句型中的當(dāng)前句艙,現(xiàn)在應(yīng)處理句艙4。續(xù)取句艙905;取出源語相應(yīng)句 艙內(nèi)容"he strictly follo, his instructions"。 判簡單句艙906,否,執(zhí)行步驟査配艙 模907。給出同記錄的艙模碼"邀裙礙0傲卵7"、母語艙模"[l]+他的+[2]"以及源語艙模"he+[l]+his+[2]"。源語句艙內(nèi)容對號入座地套入源語艙模為"he 1 [strictly folio*] his 2[instructions]"。似句艙1-2處理后的母語是"醫(yī)生告訴他的病人,如果能4{1[確實地執(zhí) 行]+他的+2[醫(yī)囑]},就可以{3}。"接續(xù)(這里略丟失補償911后述)取句艙905,取出句 艙3的內(nèi)容"he would prescribe him some patent medicine",判簡單句艙906,否,執(zhí) 行步驟査配艙模907。以當(dāng)前句艙內(nèi)容査詢艙模庫的源語艙模字段。只査到一個匹配的艙模"he would prescribe him 給出同記錄的艙模碼"潛裙礙W似W"、母語艙模"開[1]給他"以及源語艙模"he would prescribe him [1]"。將母語艙模著重顯示在中部窗口的 擴展部,把源語句艙內(nèi)容對號入座地套入源語艙模"he would prescribe him i[some patent medicine]",附注式顯示在該窗口母語艙模的下方,并把艙模碼"^^^"礙^W^^"讀入世界 文緩存區(qū)。然而后續(xù)取艙眼908步驟。以母語艙模為準從左到右,在母語艙模上逐個標示當(dāng) 前艙眼;存當(dāng)前艙眼標號于世界文緩存區(qū);同時標示和取出源語相應(yīng)艙眼內(nèi) 容,"some patent鵬dicine"。執(zhí)行步驟詞義確定909。從左到右讀出源語的艙眼中的一個 詞串,査詢意群串庫的源語文串字段。若査到多條相同詞串,分別取出它們的同記錄母語串字 段內(nèi)容,備份于悔選擇緩存,并顯示在已擴展的中部窗口下部,接收用戶選定其一。這三個串分 別如some 若干 一些 相當(dāng)?shù)?幾個…… patent 專利的 執(zhí)照 特效 明白的…… medicine 內(nèi)科的 內(nèi)服 藥 ......用戶選定為" 一些特效藥"。執(zhí)行步驟給出母語串909。取出當(dāng)前記錄的母語 串字段內(nèi)容填入到當(dāng)前母語艙眼為"開l[一些特效藥]給他",取出意群碼"虜:^^^!^似"、 "J:^^移W7必,5"、"盧薪賴^5必,存入世界文緩存區(qū);當(dāng)前艙眼操作完畢。(這里有"丟 失補償、母語詞序911"因未涉及,待下文補述)。母語句為"醫(yī)生告訴他的病人,如果能確 實地執(zhí)行他的醫(yī)囑,就可以3(開l[一些特效藥]給他}。"判還有艙眼912,無。再續(xù)判 斷句結(jié)束913,是。至此,當(dāng)前句子所有句艙全部處理完畢,査詢反饋緩存區(qū)和命令按鈕當(dāng)反饋緩存區(qū)不 為空,將反饋緩存區(qū)的信息加上源語、母語、當(dāng)前源語句子等信息作成電子郵件反饋到支持 網(wǎng)站;清空反饋緩存區(qū),在世界文緩存區(qū)存入"反饋句"標志。當(dāng)悔操作命令按鈕被點擊, 根據(jù)用戶點擊的欲悔詞串,取出悔選擇緩存中的相應(yīng)內(nèi)容讓用戶重選詞串并作相關(guān)修改。這 已足夠清楚完整,所屬技術(shù)領(lǐng)域的技術(shù)人員能夠?qū)崿F(xiàn)。其中悔操作即在詞義確定中,從多個 詞義當(dāng)中選一時,將當(dāng)時所屬之艙、眼,多個詞條全部納入一個"悔操作表"內(nèi),悔操作時 在用戶所點擊的母語句中,根據(jù)其所處句艙、艙眼及詞串給出同批表中內(nèi)容,讓用戶重選并 作相應(yīng)修改?;诓僮鞅碛谢谂?、句船號、艙眼號、詞串、意群碼等字段。艙號、眼號相同, 源語串不同悔批號也就不同。這時,假如接收到存盤退出命令時,將世界文緩存區(qū)的內(nèi)容,如上例2句內(nèi)容"萬薪礙 O朋錄每麥礙簾盧/號,'簠莽賴W^7W,'《邀2號,'盧薦礙W& 紙'哲# 4號,'盧模礙 ^^7,#銜J號,'盧界礙煮莽礙W7效力盧凝2號,'蘆,礙。"朋iV《盧號,'邀裙 賴漢微&應(yīng)貌7號zl券礙^W欽盧薪移W7tf私蘆薪馮W5必《'"存盤為世界文,文件名= 源語文件名.SJf;如果源文未完,文件頭中記下源文偏移。然而,整個流程步驟終止。假如悔操作、存盤退出命令按鈕都沒有被點擊時,接續(xù)執(zhí)行步驟源語句讀入901。補述(上文有"丟失補償、母語詞序911"等,這里補述)根據(jù)個性丟失表的信息進行當(dāng)前句艙或艙眼的個性丟失補償911。個性丟失補償因由是 上文述及簡單句艙和艙眼雖然是上、下位概念,但大小一樣,都是除不表意虛詞外少于或等 于三個意群串。不表意虛詞例如中文的量詞,英文的冠詞等。這些丟失了的詞串在以母語讀 出時給以補償。其信息來源于個性丟失表,個性丟失表含有關(guān)聯(lián)詞串、補償串等字段。母語詞序有時需要調(diào)整,其因由也是來自于句艙、艙眼,它們大小一樣,都是除不表意 虛詞外少于或等于三個意群串。在機內(nèi)這三個意群串的前后次序沒有要求,所以基于本語句 構(gòu)件的各種應(yīng)用。有可能存在母語詞序有時需要調(diào)整的情況。其調(diào)整簡單方便,先可利用一 個母語詞序表,母語詞序表含有首詞串、讀出串、調(diào)整串字段。讀出串即當(dāng)用母語讀出時的 串序;首詞串即讀出串的首串;調(diào)整串即應(yīng)調(diào)整的詞序。當(dāng)當(dāng)前句艙或當(dāng)前艙眼全部詞串詞 義確定之后,査該表,査到符合者自動調(diào)整之。然后,讓系統(tǒng)判讀按鈕"和"一按鈕" 按鈕。如果被用戶點擊,根據(jù)用戶意圖再調(diào)整之。當(dāng)"一按鈕"被點擊將當(dāng)前句艙或艙眼用 戶所點擊詞串后移于后一詞串之后;當(dāng)"一按鈕"被點擊將當(dāng)前句艙或艙眼用戶所點擊詞串 前移于前一詞串之前;同時將移動后的詞序加入母語詞序表備用。有一個不必干預(yù)的情況是當(dāng)用戶讀者要求讀出速度、不介意時也可不必干預(yù)。因而丟失 補償、母語詞序等功能是作成讓用戶可選的。有關(guān)支持網(wǎng)站上文述及作成電子郵件反饋到支持網(wǎng)站。當(dāng)支持網(wǎng)站接收到來自用戶的 反饋郵件時,由專家實時處理后,新構(gòu)件加入相應(yīng)構(gòu)件庫,并將新構(gòu)件及相關(guān)信息實時反饋 給用戶,并在用戶的參與下替換原"反饋句"標志。這是①用戶支持之一用戶有什么意見、 建議等等都可以通過這個方式進行溝通和支持。此外對于②版本升級,可以得到社會性檢驗 和社會性的積累。③引導(dǎo)多語種共同發(fā)展,本發(fā)明的應(yīng)用,為世界性跨語種交流提供了一個 平臺。同時也結(jié)束了自然語言在各自獨立體系內(nèi)緩慢地演變和發(fā)展的歷史開始了多語種共 同快速發(fā)展的歷程。例如要修正、淘汰或新增意群文字串;推廣新術(shù)語等等可以通過本發(fā)明 的應(yīng)用直接向?qū)懽髡呓ㄗh、推薦向閱讀者宣傳解釋。上文述及在用戶利用母語讀外文的過程中,把世界文緩存區(qū)的內(nèi)容存盤生成世界文。這 樣一篇外語文章只要一人讀過,后面的千千萬萬人就可以讀世界文了,讀世界文比母語讀外 文更快捷、不用干預(yù),語意準確,讀出文種用戶自選,世界文的多語讀出過程只是譯碼過程, 例如上例世界文"^語礙Wtf錄旬費礙朋^ W;布嫩J號;盧薦礙0似"7, 包敏i"號,盧薦媽 朋M紙'句廢4號/靡裙賴做^ 7,'激欲7蕭薦礙W7必/,'淤淤2專,'意薦礙 《# 號,'浙裙辨做^ 《,'浙淑J號Z鳶,礙《 松《7;盧莽礙WW55,蕭,藥m 必《" 假如以中文讀出,執(zhí)行步驟(D依次逐個取出代碼;②用開關(guān)語句將代碼分類分別處理;③ 其中如果是句艙標號、艙眼標號,用以指示當(dāng)前句艙或當(dāng)前艙眼;@把句型碼、習(xí)語碼、艙 模碼、意群碼分解為某庫某記錄號,給出某庫、某記錄的某讀出文種字段內(nèi)容,如果是意群 碼則按指示給出到當(dāng)前句艙或當(dāng)前艙眼;(D^續(xù)執(zhí)行①直到文本結(jié)束。例如-7^^^^tf—取-習(xí)語庫64記錄的中文習(xí)語字段內(nèi)容"兒童不許入內(nèi)!"。 ^^^賴W7W/-取-句型庫1061記錄的中文句型 "U)告訴他的{2},如果能{4},就可以{3}。".薪^^^^^ /-取-意群串庫2131記錄的中文串"醫(yī)生"據(jù)所指填入句艙1成為 "1{醫(yī)生}告訴他的{2},如果能{4},就可以{3}。"意群串庫6386記錄的中文串"病人"據(jù)所指填入句艙2成為 "醫(yī)生告訴他的2{病人},如果能{4},就可以{3}。" 《庸4專,示盧漠賴W鄰7-取-艙模庫207記錄的中文艙模"[1]+他的+[2]"據(jù)所指填入句艙4成為 "醫(yī)生告訴他的病人,如果能4{ [1]他的[2]},就可以{3}。"盧教段W儲W-取-意群串庫16841記錄的中文串"確實地"蓄獰礙WZ95/-取-意群串庫17951記錄的中文串"執(zhí)行"據(jù)所指填入艙眼1成為 "醫(yī)生告訴他的病人,如果能4U[確實地執(zhí)行]他的[2]),就可以{3}。"J^^移W9《S^^-意群串庫19882記錄的中文串"醫(yī)囑"據(jù)所指填入艙眼2成為 "醫(yī)生告訴他的病人,如果能4{確實地執(zhí)行他的2[醫(yī)囑]},就可以{3}。"取-艙模庫206記錄的中文艙模"開[1]給他"據(jù)所指填入句艙3成為 "醫(yī)生告訴他的病人,如果能確實地執(zhí)行他的醫(yī)囑,就可以3{開[1]給他}。" 應(yīng)腐J專,示J1^1^^^^0,-意群串庫8260記錄的中文串"一些"J^^賴W7i 55-取-意群串庫17655記錄的中文串"特效";J^^礙WWW,-意群串庫5484記錄的中文串"藥";據(jù)所指填入艙眼l成為 "醫(yī)生告訴他的病人,如果能確實地執(zhí)行他的醫(yī)囑,就可以3 {開1 [一些特效藥]給他}。"母語讀外文方法是基于語句構(gòu)件的應(yīng)用之一。參照其中利用四個語句構(gòu)件庫對當(dāng)前句的 編碼步驟、世界文讀出的譯碼步驟,可以產(chǎn)生多種基于語句構(gòu)件的應(yīng)用系統(tǒng)基于語句構(gòu)件的世界文生成的方法系統(tǒng)。用于將傳統(tǒng)文本轉(zhuǎn)換成世界文,然后可以進行 多語種讀出?;谡Z句構(gòu)件的文本轉(zhuǎn)換方法。用于將某源語文本轉(zhuǎn)換成目語文本給出,或轉(zhuǎn)換成多文 種給出。基于語句構(gòu)件的機器翻譯方法。用于將某源語翻譯成目語給出,或翻譯成多語種。 實施本發(fā)明所產(chǎn)生的軟件系統(tǒng)可以在現(xiàn)有的中型、小型、微、巨型計算機,筆記本電腦、 掌上電腦等單獨的或者相連成網(wǎng)的計算機上運行實施??梢栽诟鞣N計算機網(wǎng)絡(luò),特別是在因 特網(wǎng)上運行實施。還可以在諸如"個人數(shù)字助理",PM (Personal Digital Assistant)的裝 置上運行實施。本發(fā)明實施后的產(chǎn)品,可以應(yīng)用于需要和其它語種的人們進行交流的工作、 學(xué)習(xí)、休閑、旅游等等場合;可以用于家庭、機關(guān)、學(xué)校以及各行各業(yè)涉及外文的場合。
權(quán)利要求
1.一種語句構(gòu)件裝置,包括CPU和用于存放響應(yīng)查詢的相關(guān)索引表的原有部,其特征在于還包括語句構(gòu)件存儲部101,含有包括用電子數(shù)據(jù)形式構(gòu)成的、存儲了多語種語意對等的語句構(gòu)件的語句構(gòu)件庫句型庫300,用于存儲句型構(gòu)件,有句型碼、英文句型、中文句型、俄文句型字段,其包含至少一個記錄,相同語意的句型同處一個記錄,相應(yīng)文種的句型存儲在相應(yīng)文種句型字段內(nèi),句型碼代表了同一記錄內(nèi)各文種句型字段內(nèi)的各文種句型的語意;艙模庫400,用于存儲艙模構(gòu)件,有艙模碼、英文艙模、中文艙模、俄文艙模字段,其包含至少一個記錄,相同語意的艙模同處一個記錄,相應(yīng)文種的艙模存儲在相應(yīng)文種艙模字段內(nèi),艙模碼代表了同一記錄內(nèi)各文種艙模字段內(nèi)的各文種艙模的語意;意群串庫500、502,用于存儲意群串構(gòu)件,有意群碼、英文串、中文串、俄文串字段,其包含至少一個記錄,相同語意的意群串同處一個記錄,相應(yīng)文種的意群串存儲在相應(yīng)文種串字段內(nèi),意群碼代表了同一記錄內(nèi)各文種串字段內(nèi)的各文種意群串的語意;習(xí)語庫600,用于存儲小習(xí)語構(gòu)件,有習(xí)語碼、英文習(xí)語、中文習(xí)語、俄文習(xí)語字段,其包含至少一個記錄,相同語意的小習(xí)語同處一個記錄,相應(yīng)文種的小習(xí)語存儲在相應(yīng)文種習(xí)語字段內(nèi),習(xí)語碼代表了同一記錄內(nèi)各文種習(xí)語字段內(nèi)的各文種習(xí)語的語意;意通代碼編制部103,與語句構(gòu)件存儲部101相連,用于接收構(gòu)件添加部106的通知,僅當(dāng)上述四個庫任何之一出現(xiàn)新記錄時,把當(dāng)前庫代表數(shù)作高位字加上當(dāng)前庫記錄號生成意通代碼,并填入當(dāng)前庫的某某碼字段,作為語句構(gòu)件統(tǒng)一的雙字節(jié)定長的多語種語意互通的意通代碼,意通代碼對于當(dāng)前庫當(dāng)前記錄內(nèi)各語種構(gòu)件的同一語意表示是唯一的;構(gòu)件讀出部104,與語句構(gòu)件存儲部101相連,用于接收讀出命令,以意通代碼所含數(shù)段確定某庫某記錄,并到相應(yīng)庫相應(yīng)記錄讀出所需要的語種構(gòu)件;構(gòu)件匹配給出部105,與語句構(gòu)件存儲部101相連,用于接收匹配命令,根據(jù)所給語種的句子或旬艙內(nèi)容以及當(dāng)前操作點的指引,在相應(yīng)構(gòu)件庫相應(yīng)語種索引字段查詢匹配,給出匹配的所需要的語種構(gòu)件或返回?zé)o匹配信號;構(gòu)件添加部106,分別與語句構(gòu)件存儲部101、意通代碼編制部103相連,用于接收添加新構(gòu)件命令,在查詢證實相應(yīng)構(gòu)件庫沒有相同構(gòu)件后,將新構(gòu)件添加到相應(yīng)構(gòu)件庫的相應(yīng)語種構(gòu)件字段內(nèi),當(dāng)給一個新記錄添加新構(gòu)件時,同時發(fā)信息通知意通代碼編制部103;構(gòu)件庫操作控制、接口部107,通過構(gòu)件讀出部104、構(gòu)件匹配給出部105、構(gòu)件添加部106與語句構(gòu)件存儲部101相連,接收基于本語句構(gòu)件庫的各種應(yīng)用的調(diào)用或接收相關(guān)命令進行操作,返回調(diào)用者所需語句構(gòu)件,或通過本接口與基于語句構(gòu)件庫的其它應(yīng)用裝置相連接。
2. 根據(jù)權(quán)利要求1所述的語句構(gòu)件裝置,其特征是所述語句構(gòu)件-語句構(gòu)件通過專家操作、人機交互的方式,來自剖析比對雙語對訓(xùn)練樣本語料得到; 語句構(gòu)件的另一個來源是用戶的反饋信息經(jīng)專家審核后再加入;語句構(gòu)件是用于組裝語言句子的另部件、或?qū)渥舆M行編碼的標準件,包括如下四種① 句型構(gòu)件201,301,用于構(gòu)成句子的基本結(jié)構(gòu)框架,代表了該類句子基本語意類屬, 也決定了該類句子所含句艙的位次和個數(shù),并包攬了該類句子的較復(fù)雜的語法現(xiàn)象;② 艙模構(gòu)件202,401,用于構(gòu)成復(fù)雜句艙的基本結(jié)構(gòu)框架,代表了該類句艙基本語意類屬,也決定T該類句艙所含艙眼的位次和個數(shù),并包攬了該類句艙的較復(fù)雜的語法現(xiàn)象;③ 意群串構(gòu)件501、 503,是由意群串充當(dāng)?shù)臉?gòu)件,用于填充簡單句艙203 204或艙眼 205 207的構(gòu)件,簡單句艙與艙眼是上、下位概念而大小一樣,都是除不表意虛詞外不超過 三個意群串;④ 小習(xí)語構(gòu)件601,由過于簡短不足以分出句型、句艙的句子充當(dāng)小習(xí)語構(gòu)件,用于直 接構(gòu)成簡短的句子。
3. 根據(jù)權(quán)利要求1所述的語句構(gòu)件裝置,其特征是所述語句構(gòu)件庫 庫內(nèi)所包括文種,除英文、中文、俄文外,每增加一個文種,首先應(yīng)將句型庫、艙模庫、意群串庫、習(xí)語庫分別依次各增加一個某文句型、某文艙模、某文串、某文習(xí)語字段,新加 文種構(gòu)件只有與己有文種構(gòu)件語意相同的才能填加在同一個記錄上;提取其中句型庫、艙模庫、意群串庫、習(xí)語庫中的某文句型、某文艙模、某文串或某文 習(xí)語和某某碼兩個字段構(gòu)成某某語言庫、第一語言庫或第二語言庫,用于語言翻譯或文本轉(zhuǎn) 換。
4. 一種語句構(gòu)件制作方法,其特征在于利用相同內(nèi)容的雙語或多語種文字版本的語料 作為訓(xùn)練樣本,利用人機交互的方式進行句型、句艙兩個層面的剖析比對,得出字、詞、句 表意得以對等和統(tǒng)一的語句構(gòu)件,包括如下步驟 51. 利用相同內(nèi)容的雙語或多語種文字版本的語料作為訓(xùn)練樣本,每輪選A、 B雙語作 為一個樣本對,其中A語分配給拼音文字或己經(jīng)比對過的文種,B語可以分配給拼音文字也 可分配給表意文字以及新加入的文種;第一輪雙語對訓(xùn)練樣本的剖析比對,其中雙語對樣本的A語為英文,B語為中文,從第 二輪開始新語對中必須其一是已經(jīng)進行過剖析比對的,如當(dāng)加入俄文時,只能取中俄或英俄 語料作為雙語對訓(xùn)練樣本,第二輪剖析比對的雙語對樣本中A語應(yīng)是已比對過的中文或英文, B語應(yīng)是新加的俄文;每一輪的訓(xùn)練語料樣本應(yīng)大到新增句型/句例比<1%后方可考慮增加新語種、進行次一 輪的剖析比對,另一方面,可以根據(jù)訓(xùn)練樣本語料的行業(yè)來源或應(yīng)用范圍來源來標記、劃分 句型庫、艙模庫、意群串庫、習(xí)語庫來構(gòu)成相應(yīng)分庫,用于行業(yè)或?qū)S冒姹荆?52. 句型層面剖析比對,讀取雙語樣本句對,劃分出句型、句艙,把句型作為句型構(gòu)件 存入句型庫,把不足以分出句型、句艙的小習(xí)語作為小習(xí)語構(gòu)件存入習(xí)語庫; 53. 句艙層面剖析比對,把已經(jīng)劃分出句型、句艙的樣本句例對,依次取出句艙內(nèi)容, 進一步劃分出艙模、艙眼,把艙模作為艙模構(gòu)件存入艙模庫,把經(jīng)過意群對齊的艙眼或簡單 句艙的內(nèi)容以意群串為單元作為意群串構(gòu)件存入意群串庫;處理完所有句艙,接著下一個的 雙語樣本句對處理、接續(xù)執(zhí)行步驟S2。
5. 根據(jù)權(quán)利要求4所述語句構(gòu)件的制作方法,其特征是所述句型層面剖析比對的步驟S2 進一步包括如下步驟 521. 讀入一個雙語樣本句對; 522. 調(diào)用配句型子程序査找句型庫返lHi A、 B語匹配句型,若否、沒有匹配句型,執(zhí)行 步驟S23,若是、有匹配句型執(zhí)行步驟S26; 523. 以當(dāng)前雙語樣本句對為例制作新句型,彈開一窗口,上橫行顯示A語句、下橫行顯 示B語句,橫行下再顯示挖句艙、存句型兩個命令按鈕,并提示專家點擊A、 B語樹句的待挖 句艙的首尾點,挖句艙計數(shù)器N-O;524. 當(dāng)接收到挖句艙命令按鈕被點擊后,N-N+l,檢査A、 B語是否都被點擊兩個點以及 這兩個點是否有效,如果無效,提示重作,如果點擊正確并且有效,將A、 B語句兩點之間的 內(nèi)容挖去并填入"[N]",該輪挖句艙結(jié)束,下一輪重復(fù)步驟S24再挖下一個句艙; 525. 當(dāng)接收到存句型命令按鈕被點擊并且NS1,表示挖句艙制作新句型操作完畢,清除 步驟S23、 S24的顯示,把兩個新句型作為句型構(gòu)件分別寫入句型庫A文句型、B文句型字段, 如果接收到存句型命令按鈕被點擊、但N-0,表示當(dāng)前雙語樣本句對不足以分出句型、句艙 而被判定為小習(xí)語,清除步驟S23、 S24的顯示,把兩個小習(xí)語作為小習(xí)語構(gòu)件分別寫入習(xí)語 庫A文習(xí)語、B文習(xí)語字段; 526. 把當(dāng)前雙語樣本例句對號入座地填入當(dāng)前匹配句型、或填入當(dāng)前新作句型,作為已 經(jīng)劃分出句型、句艙的樣本句例對存盤備S3步驟讀取,再執(zhí)行步驟S21。
6.根據(jù)權(quán)利要求4所述語句構(gòu)件的制作方法,其特征是所述句艙層面剖析比對的步驟S3 進一步包括如下步驟 531. 讀入一個由S26歩驟存盤的已經(jīng)劃分出句型、句艙的樣本句例對; 532. 取句艙,依次取出已經(jīng)劃分出句型、句艙的樣本句例對當(dāng)中的一個句艙,開窗口一 上部顯示A、 B語樣本句例,下部顯示A、 B語當(dāng)前句艙內(nèi)容;同時,把A語當(dāng)前句艙以詞串為單元切分并依次填入?yún)⒖急鞟語字段,再依次取出一個 詞串査找意群串庫的A文串字段,找到后取出同記錄的B文串字段內(nèi)容,如果該B文串內(nèi)容 在B語當(dāng)前句艙中含有,把B文串內(nèi)容填入?yún)⒖急鞡語字段,不含有讓它為空;如果意群串庫的A文串字段有相同的記錄,相應(yīng)參考表也多一條A語字段有重的記錄備 選,作完整個參考表,開窗口二顯示參考表、組復(fù)詞命令按鈕以及可組復(fù)詞操作提示;接受專家點擊參考表并在被點記錄標志字段作標志;當(dāng)組復(fù)詞命令按鈕被點擊并且參考表有連續(xù)記錄被點擊,將參考表中有標志記錄的A語 字段內(nèi)容以"—"相連組成復(fù)詞,并把有標志記錄合并成一條記錄,A語字段填入該復(fù)詞,B 語字段以相等語意的詞串填寫; 533. 判斷當(dāng)前句艙是否簡單句艙,若是執(zhí)行步驟S37,若否、進一步查詢艙模庫判斷當(dāng) 前句艙是否含有艙模,若否、不含艙模執(zhí)行步驟S34,若是、該所含艙模作為當(dāng)前艙模并對 號入座地納入當(dāng)前句艙內(nèi)容,執(zhí)行步驟S36; 534. 開窗口三作為可編輯窗口,將當(dāng)前雙語句艙內(nèi)容再顯示,接受專家以此為基礎(chǔ)編寫 艙模,還顯示存艙模命令按鈕; 535. 當(dāng)存艙模命令按鈕被點擊,并且可編輯窗口己經(jīng)被編輯過,新編艙模也符合格式要 求,將新編A、 B語艙模作為艙模構(gòu)件存入艙模庫A文艙模、B文艙模字段,同時,將當(dāng)前句艙 內(nèi)容對號入座地填入當(dāng)前艙模,或填入新編艙模作為已經(jīng)劃分出艙模、艙眼的復(fù)雜句艙顯示; 536. 依次取出一個艙眼的內(nèi)容,接續(xù)執(zhí)行步驟S37; 537. 意群對齊,在第二個窗口參考表下顯示對齊確定命令按鈕,參考表接受專家按實 例延伸或增補詞義、不改變原有字單詞的前提下加減串長度、粘帶附隨字、詞形變化增補詞 義項等意群對齊的修改,或優(yōu)選記錄; 538. 當(dāng)對齊確定命令按鈕被點擊,表示參考表內(nèi)A、 B語的詞串已經(jīng)意群對齊、即已成意 群串,然后逐記錄地把A、 B語字段內(nèi)容作為意群串構(gòu)件存入意群串庫的A文串或B文串字段 539. 如果當(dāng)前操作的是艙眼,并且當(dāng)前句艙還有艙眼沒有操作,執(zhí)行步驟S36直到作完 當(dāng)前句艙的所有艙眼,再判斷當(dāng)前已經(jīng)劃分出句型、句艙的樣本句例對中是否還有未處理的句艙,是,執(zhí)行步驟S32繼續(xù)處理句艙,否,全部句艙處理完畢,執(zhí)行步驟S31,迸行下一 輪操作。
7. —種基于語句構(gòu)件的母語讀外文方法,其特征在于包括如下步驟s4. 界面,由用戶指定母語和源語各是構(gòu)件庫所含的哪一個文種,把屏幕分成上、中、 下或前、中、后三個窗口,中部窗口用于顯示當(dāng)前操作句以及操作中的相關(guān)信息,下或后部 窗口用于顯示源語待讀文本,上或前部窗口用于顯示已讀的母語文本,此外,在提示行顯示 悔操作、存盤退出等命令按鈕以及一、一移詞序按鈕,或把它們作成浮條緊隨中部下或用戶 可移;s5. 源語句讀入,讀入源語一個句子作為當(dāng)前句顯示在中部窗口,母語文本顯示尾加已 處理的前一句內(nèi)容,源語文本顯示減當(dāng)前句內(nèi)容;s6. 利用四個語句構(gòu)件庫對當(dāng)前句通過査表得出意通代碼的編碼操作、同時又給出同記 錄的母語字段內(nèi)容;s7. 判斷處理,如果當(dāng)前句的全部句艙處理完畢,査詢反饋緩存區(qū)和命令按鈕 當(dāng)反饋緩存區(qū)不為空,將反饋緩存區(qū)的信息加上源語、母語、當(dāng)前源語句子等信息作成電子郵件反饋到支持網(wǎng)站,清空反饋緩存區(qū),在世界文緩存區(qū)存入"反饋句"標志;當(dāng)悔操作命令按鈕被點擊,根據(jù)用戶點擊的欲悔詞串,取出悔選擇緩存中的相應(yīng)內(nèi)容讓用戶重選詞串并作相關(guān)修改;當(dāng)接收到存盤退出命令時,將世界文緩存區(qū)的內(nèi)容存盤為世界文,文件名-源語文件名.SJW,如果源文未完,文件頭中記下源文偏移;當(dāng)悔操作、存盤退出命令按鈕都沒有被點擊時,執(zhí)行步驟S5。
8. 根據(jù)權(quán)利要求7所述一種基于語句構(gòu)件的母語讀外文方法,其特征是所述利用四個語 句構(gòu)件庫對當(dāng)前句通過査表得出意通代碼的編碼操作、同時又給出同記錄的母語字段內(nèi)容的 步驟S6進一步包括如下步驟s601. 判小習(xí)語,以當(dāng)前句査詢習(xí)語庫的源語習(xí)語字段,若無,沒有找到,執(zhí)行步驟S602, 若有,取出同記錄的母語習(xí)語字段中的母語小習(xí)語,顯示在中部窗口,并將同記錄的習(xí)語碼 讀入世界文緩存區(qū),然后執(zhí)行步驟S5:s602. 調(diào)用配句型子程序,以當(dāng)前句査詢句型庫的源語句型字段,若査到一個匹配的句 型,執(zhí)行步驟S603,如果査到多個匹配句型,在中部窗口下部顯示相應(yīng)的母語句型,接受用 戶選定后再執(zhí)行步驟S603,如果一個匹配的句型也沒有,存句型庫代表數(shù)于反饋緩存區(qū);s603. 給出同記錄的句型碼、母語句型以及源語句型,將母語句型著重顯示在中部窗口 的上部,把源語句子對號入座地套入源語句型,附注式顯示在該窗口母語下方,并把句型碼 讀入世界文緩存區(qū);s604.取句艙,從左到右在中部窗口標示母語句型中的當(dāng)前句艙,存入當(dāng)前句艙標號于 世界文緩存區(qū),同時標示和取出源語相應(yīng)句艙內(nèi)容作為當(dāng)前句艙內(nèi)容,判斷當(dāng)前句艙內(nèi)容是 否屬于簡單句艙,若否,執(zhí)行步驟S605,若是執(zhí)行步驟S608;s605. 査配艙模,以當(dāng)前句艙內(nèi)容査詢艙模庫的源語艙模字段,若査到一個匹配的艙模, 執(zhí)行步驟S606,如果査到多個匹配艙模,向下擴展中部窗口,在擴展部顯示相應(yīng)的母語艙模, 接受用戶選定后再執(zhí)行步驟S606,如果一個匹配的艙模也沒有,存艙模庫代表數(shù)于反一饋緩存 區(qū);s606. 給出同記錄的艙模碼、母語艙模以及源語艙模,將母語艙模著重顯示在中部窗口的擴展部,把源語句艙內(nèi)容對號入座地套入源語艙模,附注式顯示在該窗口母語艙模的下方, 并把艙模碼讀入世界文緩存區(qū);5607. 取艙眼,以母語艙模為準從左到右,在母語艙模上逐個標示當(dāng)前艙眼,存當(dāng)前艙 眼標號于世界文緩存區(qū),同時標示和取出源語相應(yīng)艙眼內(nèi)容,執(zhí)行步驟S608;5608. 詞義確定,從左到右讀出源語的簡單句艙或艙眼中的一個詞串,査詢意群串庫的 源語文串字段,若只査到一條相同詞串,執(zhí)行步驟S609,若查到多條相同詞串,分別取出它們的 同記錄母語串字段內(nèi)容,備份于悔選擇緩存,并顯示在己擴展的中部窗口下部,接收用戶選定 后再執(zhí)行步驟S609,如果一條相同的詞串也沒有,存當(dāng)前源語詞串于反饋緩存區(qū);5609. 取出當(dāng)前記錄的母語串字段內(nèi)容填入到當(dāng)前母語句艙或當(dāng)前母語艙眼,取出意群 碼存入世界文緩存區(qū);繼續(xù)執(zhí)行步驟S608,直到當(dāng)前簡單句艙或當(dāng)前艙眼操作完畢;根據(jù)個性丟失表的信息進行當(dāng)前句艙或艙眼的個性丟失補償操作; 再根據(jù)母語詞序表的信息糾正當(dāng)前句艙或艙眼的母語詞序;最后査詢一、一移詞序按鈕,當(dāng)一按鈕被點擊將當(dāng)前句艙或艙眼用戶所點擊詞串后移于 后一詞串之后,當(dāng)一按鈕被點擊將當(dāng)前句艙或艙眼用戶所點擊詞串前移于前一詞串之前,同 時將移后的詞序加入母語詞序表備用,后續(xù)執(zhí)行步驟S610;5610. 判斷,如果當(dāng)前句艙還有艙眼未處理,執(zhí)行步驟S607,若否而當(dāng)前句子還有句艙 未處理,執(zhí)行步驟S604,若當(dāng)前句子所有句艙全部處理完畢,后續(xù)步驟S7。
9. 根據(jù)權(quán)利要求7所述的一種基于語句構(gòu)件的母語讀外文的方法,其特征是 所述作成電子郵件反饋到支持網(wǎng)站,當(dāng)支持網(wǎng)站接收到來自用戶的反饋郵件時,由專家實時處理后,新構(gòu)件加入相應(yīng)構(gòu)件庫,并將新構(gòu)件及相關(guān)信息實時反饋給用戶,并在用戶的 參與下替換原"反饋句"標志所述將世界文緩存區(qū)的內(nèi)容存盤為世界文,是在用戶利用母語讀外文的過程中,世界文 緩存區(qū)被同時實時地存入了句型碼、習(xí)語碼、艙模碼、意群碼等構(gòu)件代碼,以及句艙標號、 艙眼標號等,將它們存盤生成世界文,利用母語直接閱讀外文,讀后還生成了世界文, 一篇外文 只要一人讀過,,后面的千千萬萬人就可以讀世界文了,讀世界文比母語讀外文更快捷、不用 干預(yù),語意準確,讀出文種用戶自選,世界文的多語讀出過程只是譯碼過程,具體步驟是-① 依次逐個取出代碼;② 用開關(guān)語句將代碼分類分別處理;③ 其中如果是句艙標號、艙眼標號,用以指示當(dāng)前句艙或當(dāng)前艙眼;④ 把句型碼、習(xí)語碼、艙模碼、意群碼分解為某庫某記錄號,給出某庫、某記錄的某讀 出文種字段內(nèi)容,如果是意群碼則按指示給出到當(dāng)前句艙或當(dāng)前艙眼⑤ 接續(xù)執(zhí)行①直到文本結(jié)束。
10. 根據(jù)權(quán)利要求7 9任一所述的一種基于語句構(gòu)件的母語讀外文的方法,其特征是 母語讀外文方法是基于語句構(gòu)件的應(yīng)用之一,參照其中利用四個語句構(gòu)件庫對當(dāng)前句的編碼 步驟、世界文讀出的譯碼步驟,可以產(chǎn)生多種基于語句構(gòu)件的應(yīng)用系統(tǒng)基于語句構(gòu)件的世界文生成的方法系統(tǒng),用于將傳統(tǒng)文本轉(zhuǎn)換成世界文,繼后可以進行 多語種讀出;基于語句構(gòu)件的文本轉(zhuǎn)換方法,用于將某源語文本轉(zhuǎn)換成某目語文本給出,或轉(zhuǎn)換成多 文種給出;基于語句構(gòu)件的機器翻譯方法,用于將某源語翻譯成目語或多語種給出。
全文摘要
本發(fā)明涉及一種自然語言的處理或轉(zhuǎn)換的裝置和方法。針對現(xiàn)有技術(shù)計算機的語言文字表達,不同語言文字的字、詞、句表意不對等也不統(tǒng)一;機器翻譯、文本轉(zhuǎn)換,其結(jié)果可讀性差,不能表達原文本意的缺點。提供①一種語句構(gòu)件裝置及②語句構(gòu)件制作方法。用人機交互的技術(shù)手段,解決字、詞、句表意不對等也不統(tǒng)一的技術(shù)問題。產(chǎn)生表意得以對等和統(tǒng)一的語句構(gòu)件的技術(shù)效果。進一步提供③基于語句構(gòu)件的母語讀外文及文本轉(zhuǎn)換方法。解決現(xiàn)有機器翻譯、文本轉(zhuǎn)換,其結(jié)果可讀性差,不能表達原文本意的技術(shù)問題。提高譯文或轉(zhuǎn)換文本的可讀性,其表意能與原文一致;用母語讀外文,人人可讀;讀后生成世界文,可供多語種人們用各自母語讀出。
文檔編號G06F17/28GK101246474SQ200810086229
公開日2008年8月20日 申請日期2008年3月13日 優(yōu)先權(quán)日2008年2月18日
發(fā)明者劉樹根 申請人:劉樹根