專利名稱:計(jì)算機(jī)輔助翻譯系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種計(jì)算機(jī)技術(shù)領(lǐng)域的系統(tǒng),具體地說,涉及的是一種計(jì)算機(jī)輔助翻譯系統(tǒng)。
背景技術(shù):
在當(dāng)今時(shí)代,科學(xué)、技術(shù)與醫(yī)學(xué)(STM)的發(fā)展非常迅猛,我國(guó)的科技學(xué)者與國(guó)際間的交流日益密切和頻繁,科技文獻(xiàn)需要在中英文之間進(jìn)行互譯,在現(xiàn)實(shí)中也形成了一個(gè)旺盛的科技文獻(xiàn)翻譯市場(chǎng)。我國(guó)每年的科技文獻(xiàn)發(fā)表和創(chuàng)作的質(zhì)量、數(shù)量在不斷地上升。根據(jù)2007年SCI、EI、ISTP統(tǒng)計(jì),我國(guó)作者發(fā)表在國(guó)際主要科技期刊和重要會(huì)議上的論文共 20. 8萬(wàn)篇,占世界比例的9.8%。按照國(guó)際論文數(shù)量排序,我國(guó)居世界第2位。特別在臨床醫(yī)學(xué)、電子通信與自動(dòng)控制、計(jì)算機(jī)科學(xué)技術(shù)、基礎(chǔ)醫(yī)學(xué)、農(nóng)學(xué)、藥學(xué)、生物學(xué)、預(yù)防醫(yī)學(xué)與衛(wèi)生學(xué)、中醫(yī)學(xué)、化學(xué)等領(lǐng)域我國(guó)發(fā)表的論文數(shù)居于前列。過去10年,我國(guó)材料科學(xué)發(fā)表的論文也占世界該學(xué)科論文總數(shù)的15. 9%,排在世界第2位,僅次于美國(guó),其被引用次數(shù)排在世界第3位。說明我國(guó)在STM方面的影響力不斷地增強(qiáng),交流的空間不斷地?cái)U(kuò)大,在不斷地推進(jìn)我國(guó)STM的發(fā)展。我國(guó)科技文獻(xiàn)在“走出去”交流過程中,大量的科技工作者由于存在著外語(yǔ)準(zhǔn)確、 合理應(yīng)用表達(dá)等方面的障礙,致使許多有創(chuàng)新性的研究科技文獻(xiàn)難以在第一時(shí)間引起國(guó)際上重視和反響,喪失了許多機(jī)會(huì),甚至發(fā)生了由此引發(fā)的研究成果糾紛。如何提高科技工作者的科技文獻(xiàn)翻譯水平顯得尤為重要和迫切。建立標(biāo)準(zhǔn)化的科技文獻(xiàn)雙語(yǔ)語(yǔ)料庫(kù),并基于此語(yǔ)料庫(kù)上的英漢雙語(yǔ)互譯平臺(tái),提供一種更科學(xué)合理的通過語(yǔ)料實(shí)證的科技翻譯服務(wù), 有助于我國(guó)科技人員正確應(yīng)用外語(yǔ),提升外語(yǔ)科技文獻(xiàn)的寫作和交流水平,促進(jìn)我國(guó)科技文獻(xiàn),特別是原創(chuàng)內(nèi)容更多地走向世界,提升在世界上的影響力。目前已有的計(jì)算機(jī)輔助翻譯系統(tǒng)可以羅列如下TradoS、Catalyst, Transit, Google翻譯等。前三者可歸為同一類(以Trados為例進(jìn)行說明),而Google翻譯自成一體。 Trados是以翻譯記憶(TM)見長(zhǎng)的一款軟件,其系統(tǒng)中配有翻譯記憶庫(kù)和術(shù)語(yǔ)庫(kù)。翻譯時(shí)通過句級(jí)匹配和術(shù)語(yǔ)自動(dòng)查找來實(shí)現(xiàn)翻譯。因其記憶庫(kù)容量相對(duì)強(qiáng)大之故,尤其適用于某些專業(yè)門類的翻譯。以Trados為代表的這類軟件均以音符文字為基準(zhǔn)編制,它們適用于從音符文字翻譯成音符文字或從音符文字翻譯成意符文字。Google翻譯是一種統(tǒng)計(jì)機(jī)器翻譯, 其基本的工作方法是建立統(tǒng)計(jì)模型,制訂算法規(guī)則,并使用大量高質(zhì)量的雙語(yǔ)平行語(yǔ)料, 即人工翻譯的高質(zhì)量譯文來培訓(xùn)翻譯系統(tǒng),使得翻譯系統(tǒng)中的語(yǔ)料更加真實(shí)地道,更符合人工翻譯的規(guī)范。Trados軟件有其不足之處,即購(gòu)買軟件時(shí)翻譯記憶庫(kù)和術(shù)語(yǔ)庫(kù)是空的,需要使用者往庫(kù)里添加句對(duì)和術(shù)語(yǔ)。就翻譯個(gè)體而言,難以形成規(guī)?;挠洃泿?kù),故該款軟件一般適用于團(tuán)體用戶,主要適用于特定項(xiàng)目的翻譯。適用于從音符文字翻譯成音符文字或從音符文字翻譯成意符文字,相對(duì)于意符文字的中文而言,翻譯成音符文字時(shí)存在一定的困難。Google的統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)是以音符文字為基準(zhǔn)編制而成的,從實(shí)踐應(yīng)用來看,它更適用于音符文字翻譯成音符文字,如英德互譯可以達(dá)到非常好的效果。而漢至英翻譯因其算法原因,多數(shù)情況下難以滿足高品質(zhì)翻譯之需要。
發(fā)明內(nèi)容
本發(fā)明的目的在于解決現(xiàn)有技術(shù)中的上述不足,提供一種計(jì)算機(jī)輔助翻譯系統(tǒng), 該系統(tǒng)通過對(duì)漢語(yǔ)語(yǔ)句的語(yǔ)塊結(jié)合式切分與匹配,能實(shí)現(xiàn)從意符文字翻譯成音符文字,來呈現(xiàn)更為準(zhǔn)確的專業(yè)翻譯效果,滿足高品質(zhì)翻譯之需要。為實(shí)現(xiàn)上述目的,本發(fā)明采用了以下技術(shù)方案
本發(fā)明提供一種計(jì)算機(jī)輔助翻譯系統(tǒng),包括輸入輸出模塊、語(yǔ)料庫(kù)模塊、翻譯模塊,其
中
所述輸入輸出模塊將原文導(dǎo)入系統(tǒng),傳給翻譯模塊,并輸出翻譯模塊的翻譯結(jié)果; 所述語(yǔ)料庫(kù)模塊以數(shù)據(jù)庫(kù)形式存在,是一個(gè)在語(yǔ)篇級(jí)、句級(jí)和語(yǔ)塊級(jí)三個(gè)層面上實(shí)現(xiàn)對(duì)齊的科技文獻(xiàn)雙語(yǔ)平行語(yǔ)料庫(kù),其中的語(yǔ)塊分為術(shù)語(yǔ)和句式兩部分,均已平行對(duì)齊,語(yǔ)料庫(kù)中的數(shù)據(jù)與翻譯模塊實(shí)現(xiàn)數(shù)據(jù)鏈接;
所述翻譯模塊從輸入輸出模塊接收待譯語(yǔ)句并進(jìn)行翻譯處理,翻譯時(shí),通過對(duì)待譯漢語(yǔ)語(yǔ)句的語(yǔ)塊結(jié)合式切分,并與語(yǔ)料庫(kù)模塊采用最大逆向匹配法進(jìn)行相應(yīng)的匹配(其中的句式由誘導(dǎo)詞進(jìn)行誘導(dǎo)匹配),從而提供若干最適匹配狀態(tài)的譯文語(yǔ)句,并將該譯文語(yǔ)句經(jīng)翻譯編輯后提供給輸入輸出模塊輸出顯示。所述語(yǔ)料庫(kù)模塊由語(yǔ)篇庫(kù)、句對(duì)庫(kù)、句式庫(kù)、術(shù)語(yǔ)庫(kù)四部分組成,這四個(gè)庫(kù)均已實(shí)現(xiàn)英漢平行對(duì)齊,其中的語(yǔ)篇庫(kù)、句對(duì)庫(kù)、句式庫(kù)均設(shè)置有一個(gè)相同的字段,表示具體的句對(duì)或句式出自哪一語(yǔ)篇,以利于鏈接檢索;其中
語(yǔ)篇庫(kù)存儲(chǔ)已實(shí)現(xiàn)段落級(jí)英漢對(duì)齊的語(yǔ)篇;
句對(duì)庫(kù)存儲(chǔ)已實(shí)現(xiàn)句級(jí)英漢對(duì)齊的句對(duì),這些句對(duì)均轉(zhuǎn)換自語(yǔ)篇;
句式庫(kù)存儲(chǔ)已實(shí)現(xiàn)英漢對(duì)齊的句式;
術(shù)語(yǔ)庫(kù)存儲(chǔ)英漢對(duì)照的專業(yè)術(shù)語(yǔ)。所述翻譯模塊由翻譯編輯子模塊和檢索匹配子模塊組成,翻譯編輯子模塊為一個(gè)完整的界面窗口,對(duì)于導(dǎo)入的原文進(jìn)行切分,并對(duì)待譯語(yǔ)句進(jìn)行匹配操作、翻譯編輯;檢索匹配子模塊按照已切分的術(shù)語(yǔ)進(jìn)行檢索,并行句對(duì)檢索。所述翻譯編輯子模塊由原文導(dǎo)入和譯文輸出部分、待譯語(yǔ)句選擇與操作部分、譯文編輯部分三部分組成,待譯語(yǔ)句選擇與操作部分與相應(yīng)的檢索匹配界面相鏈接,其中
原文導(dǎo)入和譯文輸出部分導(dǎo)入原文并實(shí)現(xiàn)句級(jí)自動(dòng)切分;存留完成翻譯編輯的語(yǔ)
句;
待譯語(yǔ)句選擇與操作部分一是檢索句對(duì)庫(kù)中是否存在與待譯語(yǔ)句全額匹配或70%以上匹配的句對(duì);二是將未能發(fā)現(xiàn)70%以上匹配的待譯語(yǔ)句進(jìn)行切分,切分單位為術(shù)語(yǔ)和通用關(guān)鍵詞;三是借助于通用關(guān)鍵詞檢索句式或句對(duì),或者借助于術(shù)語(yǔ)檢索句對(duì);
譯文編輯部分導(dǎo)入經(jīng)檢索的符合要求的句對(duì)或句式,可按光標(biāo)設(shè)置插入術(shù)語(yǔ),可進(jìn)行文本編輯。所述檢索匹配子模塊由句對(duì)檢索界面部分、句式檢索界面部分、術(shù)語(yǔ)檢索界面部分、語(yǔ)篇檢索界面部分四部分組成,分別與語(yǔ)料庫(kù)模塊中的句對(duì)庫(kù)、句式庫(kù)、術(shù)語(yǔ)庫(kù)、語(yǔ)篇庫(kù)鏈接,其中
句對(duì)檢索界面部分顯示按要求檢索后的所有句對(duì),以關(guān)鍵詞對(duì)齊;可行二次檢索;鏈接相關(guān)語(yǔ)篇,以確定待譯語(yǔ)句的語(yǔ)境;
句式檢索界面部分顯示按要求檢索后的所有句式,可行二次檢索;鏈接相關(guān)句對(duì); 術(shù)語(yǔ)檢索界面部分顯示按要求檢索后的所有術(shù)語(yǔ);鏈接相關(guān)句對(duì); 語(yǔ)篇檢索界面部分顯示與句對(duì)或句式對(duì)應(yīng)的語(yǔ)篇。本發(fā)明系統(tǒng)工作時(shí),先通過輸入輸出模塊將原文導(dǎo)入系統(tǒng),系統(tǒng)將原文切分成以句子為單位的待譯語(yǔ)句,然后翻譯模塊進(jìn)行翻譯匹配等處理
首先,開始全額或70%以上匹配的翻譯編輯操作。按順序選擇一個(gè)待譯語(yǔ)句進(jìn)入待譯語(yǔ)句選擇與操作部分。在句對(duì)庫(kù)中檢索是否存在全額匹配或70%以上匹配的譯文。若是全額匹配,則翻譯完畢,將譯文導(dǎo)入“原文導(dǎo)入和譯文輸出部分”即可;若是70%以上與全額之間的匹配,則尚需翻譯編輯,由譯文編輯部分完成。此時(shí)亦可進(jìn)行術(shù)語(yǔ)檢索。當(dāng)然,此處的匹配率可以根據(jù)實(shí)際的需要進(jìn)行設(shè)定。其次,對(duì)待譯語(yǔ)句進(jìn)行切分。按通用關(guān)鍵詞檢索句式,譯文編輯部分導(dǎo)入符合要求的句式。檢索術(shù)語(yǔ),在句式中插入術(shù)語(yǔ)。進(jìn)行必要的翻譯編輯。再次,按照已切分的術(shù)語(yǔ)進(jìn)行檢索,并行句對(duì)檢索。進(jìn)行必要的翻譯編輯。最后,將全文完成翻譯編輯的譯文導(dǎo)出系統(tǒng)。從以上技術(shù)方案可以看出,本發(fā)明系統(tǒng)基于雙語(yǔ)平行語(yǔ)料庫(kù)進(jìn)行計(jì)算機(jī)輔助翻譯,按照定義進(jìn)行切分與檢索匹配,通過對(duì)漢語(yǔ)語(yǔ)句的語(yǔ)塊結(jié)合式切分與匹配,實(shí)現(xiàn)從意符文字至音符文字的計(jì)算機(jī)輔助翻譯,由此呈現(xiàn)更為準(zhǔn)確的專業(yè)翻譯效果。本發(fā)明亦可用于專業(yè)英語(yǔ)文獻(xiàn)寫作。
圖1為本發(fā)明結(jié)構(gòu)框圖。
具體實(shí)施例方式以下結(jié)合附圖和實(shí)施例對(duì)本發(fā)明的技術(shù)方案作進(jìn)一步的解釋,但是以下的內(nèi)容不用于限定本發(fā)明的保護(hù)范圍。如圖1所示,本實(shí)施例提供一種計(jì)算機(jī)輔助翻譯系統(tǒng),該系統(tǒng)包括輸入輸出模塊、語(yǔ)料庫(kù)模塊、翻譯模塊,其中
所述輸入輸出模塊將原文導(dǎo)入系統(tǒng),傳給翻譯模塊,并輸出翻譯模塊的翻譯結(jié)果; 所述語(yǔ)料庫(kù)模塊以數(shù)據(jù)庫(kù)形式存在,是一個(gè)在語(yǔ)篇級(jí)、句級(jí)和語(yǔ)塊級(jí)三個(gè)層面上實(shí)現(xiàn)對(duì)齊的科技文獻(xiàn)雙語(yǔ)平行語(yǔ)料庫(kù),其中的語(yǔ)塊分為術(shù)語(yǔ)和句式兩部分,均已平行對(duì)齊,語(yǔ)料庫(kù)中的數(shù)據(jù)與翻譯模塊實(shí)現(xiàn)數(shù)據(jù)鏈接;
所述翻譯模塊從輸入輸出模塊接收待譯語(yǔ)句并進(jìn)行翻譯處理,翻譯時(shí),通過對(duì)待譯漢語(yǔ)語(yǔ)句的語(yǔ)塊結(jié)合式切分,并與語(yǔ)料庫(kù)模塊采用最大逆向匹配法進(jìn)行相應(yīng)的匹配(其中的句式由誘導(dǎo)詞進(jìn)行誘導(dǎo)匹配),從而提供若干最適匹配狀態(tài)的譯文語(yǔ)句,并將該譯文語(yǔ)句經(jīng)翻譯編輯后提供給輸入輸出模塊輸出顯示。所述語(yǔ)料庫(kù)模塊由語(yǔ)篇庫(kù)、句對(duì)庫(kù)、句式庫(kù)、術(shù)語(yǔ)庫(kù)四部分組成,這四個(gè)庫(kù)均已實(shí)現(xiàn)英漢平行對(duì)齊,其中的語(yǔ)篇庫(kù)、句對(duì)庫(kù)、句式庫(kù)均設(shè)置有一個(gè)相同的字段,表示具體的句對(duì)或句式出自哪一語(yǔ)篇,以利于鏈接檢索;其中 語(yǔ)篇庫(kù)存儲(chǔ)已實(shí)現(xiàn)段落級(jí)英漢對(duì)齊的語(yǔ)篇; 句對(duì)庫(kù)存儲(chǔ)已實(shí)現(xiàn)句級(jí)英漢對(duì)齊的句對(duì),這些句對(duì)均轉(zhuǎn)換自語(yǔ)篇; 句式庫(kù)存儲(chǔ)已實(shí)現(xiàn)英漢對(duì)齊的句式; 術(shù)語(yǔ)庫(kù)存儲(chǔ)英漢對(duì)照的專業(yè)術(shù)語(yǔ)。所述翻譯模塊由翻譯編輯子模塊和檢索匹配子模塊組成,翻譯編輯子模塊為一個(gè)完整的界面窗口,對(duì)于導(dǎo)入的原文進(jìn)行切分,并對(duì)待譯語(yǔ)句進(jìn)行匹配操作、翻譯編輯;檢索匹配子模塊按照已切分的術(shù)語(yǔ)進(jìn)行檢索,并行句對(duì)檢索。所述翻譯編輯子模塊由原文導(dǎo)入和譯文輸出部分、待譯語(yǔ)句選擇與操作部分、譯文編輯部分三部分組成,待譯語(yǔ)句選擇與操作部分與相應(yīng)的檢索匹配界面相鏈接,其中
原文導(dǎo)入和譯文輸出部分導(dǎo)入原文并實(shí)現(xiàn)句級(jí)自動(dòng)切分;存留完成翻譯編輯的語(yǔ)
句;
待譯語(yǔ)句選擇與操作部分一是檢索句對(duì)庫(kù)中是否存在與待譯語(yǔ)句全額匹配或70%以上匹配的句對(duì);二是將未能發(fā)現(xiàn)70%以上匹配的待譯語(yǔ)句進(jìn)行切分,切分單位為術(shù)語(yǔ)和通用關(guān)鍵詞;三是借助于通用關(guān)鍵詞檢索句式或句對(duì),或者借助于術(shù)語(yǔ)檢索句對(duì);
譯文編輯部分導(dǎo)入經(jīng)檢索的符合要求的句對(duì)或句式,可按光標(biāo)設(shè)置插入術(shù)語(yǔ),可進(jìn)行文本編輯;
所述檢索匹配子模塊由句對(duì)檢索界面部分、句式檢索界面部分、術(shù)語(yǔ)檢索界面部分、語(yǔ)篇檢索界面部分四部分組成,分別與句對(duì)庫(kù)、句式庫(kù)、術(shù)語(yǔ)庫(kù)、語(yǔ)篇庫(kù)鏈接,其中
句對(duì)檢索界面部分顯示按要求檢索后的所有句對(duì),以關(guān)鍵詞對(duì)齊;可行二次檢索;鏈接相關(guān)語(yǔ)篇,以確定待譯語(yǔ)句的語(yǔ)境;
句式檢索界面部分顯示按要求檢索后的所有句式,可行二次檢索;鏈接相關(guān)句對(duì); 術(shù)語(yǔ)檢索界面部分顯示按要求檢索后的所有術(shù)語(yǔ);鏈接相關(guān)句對(duì); 語(yǔ)篇檢索界面部分顯示與句對(duì)或句式對(duì)應(yīng)的語(yǔ)篇。下文為待譯漢語(yǔ)段落。在此,將該段落作為本發(fā)明具體應(yīng)用的實(shí)施例,并結(jié)合本發(fā)明的系統(tǒng)模塊進(jìn)行說明
“滑膜連結(jié)有四個(gè)識(shí)別特點(diǎn),即關(guān)節(jié)腔、關(guān)節(jié)軟骨、滑膜和纖維囊。在滑膜連結(jié)中骨的關(guān)節(jié)面被關(guān)節(jié)腔隔開,關(guān)節(jié)腔是一個(gè)含有微量滑液的潛在間隙。關(guān)節(jié)面有薄層關(guān)節(jié)軟骨覆蓋。 纖維囊附著在骨端的關(guān)節(jié)軟骨周圍,將骨連結(jié)在一起。有時(shí)纖維囊可局部增厚而形成韌帶, 纖維囊的內(nèi)面覆有滑膜?;さ诌_(dá)軟骨邊緣。關(guān)節(jié)囊及其附屬韌帶對(duì)維持相關(guān)節(jié)的骨的正常關(guān)系起著重要作用。關(guān)節(jié)嚴(yán)重外傷可使韌帶撕裂,這是運(yùn)動(dòng)中(如足球運(yùn)動(dòng))常見的外傷?!?br>
上述文檔經(jīng)由輸入輸出模塊導(dǎo)入系統(tǒng),系統(tǒng)自動(dòng)將其切分成待譯句子并顯示在翻譯模塊的原文導(dǎo)入和譯文輸出部分
“滑膜連結(jié)有四個(gè)識(shí)別特點(diǎn),即關(guān)節(jié)腔、關(guān)節(jié)軟骨、滑膜和纖維囊。在滑膜連結(jié)中骨的關(guān)節(jié)面被關(guān)節(jié)腔隔開,關(guān)節(jié)腔是一個(gè)含有微量滑液的潛在間隙。關(guān)節(jié)面有薄層關(guān)節(jié)軟骨覆蓋。
纖維囊附著在骨端的關(guān)節(jié)軟骨周圍,將骨連結(jié)在一起。有時(shí)纖維囊可局部增厚而形成韌帶,纖維囊的內(nèi)面覆有滑膜?;さ诌_(dá)軟骨邊緣。關(guān)節(jié)囊及其附屬韌帶對(duì)維持關(guān)節(jié)的骨的正常關(guān)系起著重要作用。關(guān)節(jié)嚴(yán)重外傷可使韌帶撕裂,這是運(yùn)動(dòng)中(如足球運(yùn)動(dòng))常見的外傷。”
將第一句選入待譯語(yǔ)句選擇和操作部分,與語(yǔ)料庫(kù)模塊采用最大逆向匹配法進(jìn)行相應(yīng)的匹配(其中的句式由誘導(dǎo)詞進(jìn)行誘導(dǎo)匹配),確定是否全額匹配 “滑膜連結(jié)有四個(gè)識(shí)別特點(diǎn),即關(guān)節(jié)腔、關(guān)節(jié)軟骨、滑膜和纖維囊?!?若是,則在譯文編輯部分出現(xiàn)譯文
”The four distinguishing features of a synovial joint are that they have a joint cavity, an articular cartilage, a synovial membrane, and a fibrous capsule.,,
若確認(rèn)譯文,則譯文返回原文導(dǎo)入和譯文輸出部分。繼續(xù)第二句的翻譯 “在滑膜連結(jié)中骨的關(guān)節(jié)面被關(guān)節(jié)腔隔開,關(guān)節(jié)腔是一個(gè)含有微量滑液的潛在間隙。,, 將上述句子進(jìn)行切分處理,句子中的術(shù)語(yǔ)被完全切分。進(jìn)而先進(jìn)行術(shù)語(yǔ)檢索,再按照經(jīng)檢索且被確認(rèn)的術(shù)語(yǔ)進(jìn)行句對(duì)檢索,確認(rèn)是否存在相似的譯句。選擇相似的句子在譯文編輯部分進(jìn)行翻譯編輯
"In a synovial joint the articular surfaces of the bones are separated by a joint cavity which is normally a potential space containing a trace of synovial fluid. ”
若確認(rèn)譯文,則譯文返回原文導(dǎo)入和譯文輸出部分。繼續(xù)第三句的翻譯 “關(guān)節(jié)面有薄層關(guān)節(jié)軟骨覆蓋。,,
對(duì)句子行切分后,得出兩個(gè)術(shù)語(yǔ)和一個(gè)誘導(dǎo)詞。據(jù)此誘導(dǎo)詞進(jìn)行句式檢索,找出句式“A thin layer of…is covered on”。選中進(jìn)入譯文編輯部分,將光標(biāo)設(shè)置在of之后,插入 “關(guān)節(jié)軟骨”所對(duì)應(yīng)的術(shù)語(yǔ)“articular cartilage",以同樣方法插入“關(guān)節(jié)面”所對(duì)應(yīng)的術(shù) Ig-"articular surface’,。
"A thin layer of articular cartilage is covered on the articular surface. ” 確認(rèn)后,返回原文導(dǎo)入和譯文輸出部分。繼續(xù)第四句的翻譯 “纖維囊附著在骨端的關(guān)節(jié)軟骨周圍,將骨連結(jié)在一起。,,
上句切分效果顯示,術(shù)語(yǔ)有三個(gè)、誘導(dǎo)詞有兩個(gè)。據(jù)此誘導(dǎo)詞進(jìn)行句式檢索,找出句式 "is attached to”和“are held together”。選中并經(jīng)前后換序進(jìn)入譯文編輯部分,將光標(biāo)設(shè)置在are之前插入The bones,并在together之后插入a fibrous capsule ;繼續(xù)進(jìn)行另一個(gè)誘導(dǎo)詞的翻譯編輯,將光標(biāo)設(shè)置在is之前插入which,又將光標(biāo)設(shè)置在to之后插入 the end of bones。最后得出譯句
“The bones are held together by a fibrous capsule which is attached to the end of bones surrounding the articular cartilages. ”
確認(rèn)后,返回原文導(dǎo)入和譯文輸出部分。繼續(xù)第五句和第六句的翻譯 “有時(shí)纖維囊可局部增厚而形成韌帶,纖維囊的內(nèi)面覆有滑膜。,, “滑膜抵汰軟骨邊緣?!敝詫删浜喜ⅲ蛟谟诘诹淇勺鳛榍耙痪涞膹木?。句子切分后得到上述效果, 其他操作相同。最后得出譯句
“Sometimes the fibrous capsule may be locally thickened and thus forms accessory ligaments. The inner surface of fibrous capsule is lined by synovial membrane which ends at the margin of the articular cartilages.,, 確認(rèn)后,返回原文導(dǎo)入和譯文輸出部分。繼續(xù)第七句的翻譯 “關(guān)節(jié)囊及其附屬鈿帶對(duì)維持關(guān)節(jié)的骨的If常關(guān)系起著重要作用。,, 切分后翻譯編輯,得到譯句
”The joint capsule and its associated ligaments are important in maintaining the normal relationship between the articulating bones.,, 確認(rèn)后,返回原文導(dǎo)入和譯文輸出部分。進(jìn)行最后一句的翻譯 “關(guān)節(jié)嚴(yán)重外傷可俥鈿帶撕裂,這是運(yùn)動(dòng)中(如足球運(yùn)動(dòng))常見的外傷?!?切分后翻譯編輯,得到譯句
"Severe trauma to a joint results in torn ligaments, a common injury in contact sports such as football.,,
確認(rèn)后,返回原文導(dǎo)入和譯文輸出部分。并選擇導(dǎo)出譯文經(jīng)輸入輸出模塊將翻譯完畢的譯文導(dǎo)出系統(tǒng)。上述實(shí)施例檢索匹配過程中,各部分譯文由句對(duì)檢索界面部分、句式檢索界面部分、術(shù)語(yǔ)檢索界面部分、語(yǔ)篇檢索界面部分等對(duì)應(yīng)顯示。從以上技術(shù)方案可以看出,本實(shí)施例通過對(duì)漢語(yǔ)語(yǔ)句的語(yǔ)塊結(jié)合式切分與匹配, 實(shí)現(xiàn)從意符文字至音符文字的計(jì)算機(jī)輔助翻譯,由此呈現(xiàn)更為準(zhǔn)確的專業(yè)翻譯效果。本發(fā)明亦可用于專業(yè)英語(yǔ)文獻(xiàn)寫作。盡管本發(fā)明的內(nèi)容已經(jīng)通過上述優(yōu)選實(shí)施例作了詳細(xì)介紹,但應(yīng)當(dāng)認(rèn)識(shí)到上述的描述不應(yīng)被認(rèn)為是對(duì)本發(fā)明的限制。在本領(lǐng)域技術(shù)人員閱讀了上述內(nèi)容后,對(duì)于本發(fā)明的多種修改和替代都將是顯而易見的。因此,本發(fā)明的保護(hù)范圍應(yīng)由所附的權(quán)利要求來限定。
權(quán)利要求
1.一種計(jì)算機(jī)輔助翻譯系統(tǒng),其特征在于包括輸入輸出模塊、語(yǔ)料庫(kù)模塊、翻譯模塊, 其中所述輸入輸出模塊將原文導(dǎo)入系統(tǒng),傳給翻譯模塊,并輸出翻譯模塊的翻譯結(jié)果;所述語(yǔ)料庫(kù)模塊以數(shù)據(jù)庫(kù)形式存在,是一個(gè)在語(yǔ)篇級(jí)、句級(jí)和語(yǔ)塊級(jí)三個(gè)層面上實(shí)現(xiàn)對(duì)齊的科技文獻(xiàn)雙語(yǔ)平行語(yǔ)料庫(kù),其中的語(yǔ)塊分為術(shù)語(yǔ)和句式兩部分,均已平行對(duì)齊,語(yǔ)料庫(kù)中的數(shù)據(jù)與翻譯模塊實(shí)現(xiàn)數(shù)據(jù)鏈接;所述翻譯模塊從輸入輸出模塊接收待譯語(yǔ)句并進(jìn)行翻譯處理,翻譯時(shí),通過對(duì)待譯漢語(yǔ)語(yǔ)句的語(yǔ)塊結(jié)合式切分,并與語(yǔ)料庫(kù)模塊采用最大逆向匹配法進(jìn)行相應(yīng)的匹配,從而提供多個(gè)最適匹配狀態(tài)的譯文語(yǔ)句,并將該譯文語(yǔ)句經(jīng)翻譯編輯后提供給輸入輸出模塊輸出顯不。
2.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)輔助翻譯系統(tǒng),其特征在于所述語(yǔ)料庫(kù)模塊由語(yǔ)篇庫(kù)、句對(duì)庫(kù)、句式庫(kù)、術(shù)語(yǔ)庫(kù)四部分組成,這四個(gè)庫(kù)均已實(shí)現(xiàn)英漢平行對(duì)齊,其中的語(yǔ)篇庫(kù)、 句對(duì)庫(kù)、句式庫(kù)均設(shè)置有一個(gè)相同的字段,表示具體的句對(duì)或句式出自哪一語(yǔ)篇,以利于鏈接檢索;其中語(yǔ)篇庫(kù)存儲(chǔ)已實(shí)現(xiàn)段落級(jí)英漢對(duì)齊的語(yǔ)篇;句對(duì)庫(kù)存儲(chǔ)已實(shí)現(xiàn)句級(jí)英漢對(duì)齊的句對(duì),這些句對(duì)均轉(zhuǎn)換自語(yǔ)篇;句式庫(kù)存儲(chǔ)已實(shí)現(xiàn)英漢對(duì)齊的句式;術(shù)語(yǔ)庫(kù)存儲(chǔ)英漢對(duì)照的專業(yè)術(shù)語(yǔ)。
3.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)輔助翻譯系統(tǒng),其特征在于所述翻譯模塊與語(yǔ)料庫(kù)模塊采用最大逆向匹配法進(jìn)行相應(yīng)的匹配,其中的句式由誘導(dǎo)詞進(jìn)行誘導(dǎo)匹配。
4.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)輔助翻譯系統(tǒng),其特征在于所述翻譯模塊由翻譯編輯子模塊和檢索匹配子模塊組成,翻譯編輯子模塊為一個(gè)完整的界面窗口,對(duì)于導(dǎo)入的原文進(jìn)行切分,并對(duì)待譯語(yǔ)句進(jìn)行匹配操作、翻譯編輯;檢索匹配子模塊按照已切分的術(shù)語(yǔ)進(jìn)行檢索,并行句對(duì)檢索。
5.根據(jù)權(quán)利要求4所述的計(jì)算機(jī)輔助翻譯系統(tǒng),其特征在于所述翻譯編輯子模塊由原文導(dǎo)入和譯文輸出部分、待譯語(yǔ)句選擇與操作部分、譯文編輯部分三部分組成,待譯語(yǔ)句選擇與操作部分與相應(yīng)的檢索匹配界面相鏈接,其中原文導(dǎo)入和譯文輸出部分導(dǎo)入原文并實(shí)現(xiàn)句級(jí)自動(dòng)切分;存留完成翻譯編輯的語(yǔ)句;待譯語(yǔ)句選擇與操作部分檢索句對(duì)庫(kù)中是否存在與待譯語(yǔ)句全額匹配或70%以上匹配的句對(duì);將未能發(fā)現(xiàn)70%以上匹配的待譯語(yǔ)句進(jìn)行切分,切分單位為術(shù)語(yǔ)和通用關(guān)鍵詞; 借助于通用關(guān)鍵詞檢索句式或句對(duì),或者借助于術(shù)語(yǔ)檢索句對(duì);譯文編輯部分導(dǎo)入經(jīng)檢索的符合要求的句對(duì)或句式,可按光標(biāo)設(shè)置插入術(shù)語(yǔ),可進(jìn)行文本編輯。
6.根據(jù)權(quán)利要求4所述的計(jì)算機(jī)輔助翻譯系統(tǒng),其特征在于所述檢索匹配子模塊由句對(duì)檢索界面部分、句式檢索界面部分、術(shù)語(yǔ)檢索界面部分、語(yǔ)篇檢索界面部分四部分組成,分別與句對(duì)庫(kù)、句式庫(kù)、術(shù)語(yǔ)庫(kù)、語(yǔ)篇庫(kù)鏈接,其中句對(duì)檢索界面部分顯示按要求檢索后的所有句對(duì),以關(guān)鍵詞對(duì)齊;可行二次檢索;鏈接相關(guān)語(yǔ)篇,以確定待譯語(yǔ)句的語(yǔ)境;句式檢索界面部分顯示按要求檢索后的所有句式,可行二次檢索;鏈接相關(guān)句對(duì); 術(shù)語(yǔ)檢索界面部分顯示按要求檢索后的所有術(shù)語(yǔ);鏈接相關(guān)句對(duì); 語(yǔ)篇檢索界面部分顯示與句對(duì)或句式對(duì)應(yīng)的語(yǔ)篇。
全文摘要
本發(fā)明公開一種計(jì)算機(jī)輔助翻譯系統(tǒng),包括輸入輸出模塊、語(yǔ)料庫(kù)模塊、翻譯模塊,其中所述輸入輸出模塊將原文導(dǎo)入系統(tǒng),傳給翻譯模塊,并輸出翻譯模塊的翻譯結(jié)果;所述語(yǔ)料庫(kù)模塊以數(shù)據(jù)庫(kù)形式存在,是一個(gè)在語(yǔ)篇級(jí)、句級(jí)和語(yǔ)塊級(jí)三個(gè)層面上實(shí)現(xiàn)對(duì)齊的科技文獻(xiàn)雙語(yǔ)平行語(yǔ)料庫(kù),語(yǔ)料庫(kù)中的數(shù)據(jù)與翻譯模塊實(shí)現(xiàn)數(shù)據(jù)鏈接;所述翻譯模塊從輸入輸出模塊接收待譯語(yǔ)句并進(jìn)行翻譯處理,翻譯時(shí),通過對(duì)待譯漢語(yǔ)語(yǔ)句的語(yǔ)塊結(jié)合式切分,并與語(yǔ)料庫(kù)模塊采用最大逆向匹配法進(jìn)行相應(yīng)的匹配,其中的句式由誘導(dǎo)詞進(jìn)行誘導(dǎo)匹配,從而提供最適匹配狀態(tài)的譯文語(yǔ)句。本發(fā)明通過對(duì)漢語(yǔ)語(yǔ)句的語(yǔ)塊結(jié)合式切分與匹配,呈現(xiàn)更為準(zhǔn)確的專業(yè)翻譯效果。
文檔編號(hào)G06F17/28GK102270198SQ20111023440
公開日2011年12月7日 申請(qǐng)日期2011年8月16日 優(yōu)先權(quán)日2011年8月16日
發(fā)明者管新潮 申請(qǐng)人:上海交通大學(xué)出版社有限公司