專利名稱:基于正確翻譯結果與對應關系的自動翻譯方法與系統(tǒng)的制作方法
技術領域:
本發(fā)明涉及一種翻譯方法及裝置,尤其涉及一種多語種的專業(yè)自動翻譯方法與裝置。
背景技術:
當今世界是一個高度信息化的社會。隨著以互聯(lián)網為首的信息技術的日新月異, 我們可以在瞬間,并且不受地理上的遠近限制,獲得來自世界各地的信息。但其中的很多信 息,都不是用你的母語或者你熟悉的語言來表示的。人們獲得了更多的交流方法和渠道。這 也使得語言障礙的影響更加明顯,因此克服語言障礙實現(xiàn)自動翻譯已經刻不容緩?,F(xiàn)在已經有很多進入到試用階段的機器翻譯工具,互聯(lián)網上有以此為基礎的網頁 翻譯服務。這些機器翻譯工具都是基于規(guī)則(例如通過對語法的解析,對意思的解析等) 來推斷出翻譯結果。他們的最大缺陷是不能保證翻譯結果的正確性。越是口語化的翻譯要 求,越容易出現(xiàn)錯誤。因此利用這些翻譯工具翻譯出來的結果只能作為半成品,作為專業(yè)翻 譯人員提高翻譯效率的輔助工具。對于那些不懂目標語言的人來說,由于無法判斷翻譯結 果的正確與否,因此他們無法使用這類翻譯工具。從另一個角度說,這類翻譯工具仍然不具 備商業(yè)化的前景。對于普通的用戶(自動翻譯利用者)來說,他們最大的愿望是獲得正確的翻譯結^ ο因此,業(yè)內存在一種技術需求提供一種適用于多語種之間互譯的、保證翻譯結果 正確的自動翻譯方法與系統(tǒng)。
發(fā)明內容
本發(fā)明的目的是提供一種基于正確翻譯結果與對應關系的自動翻譯方法與系統(tǒng), 本發(fā)明的技術方案如下一種基于正確翻譯結果與對應關系的自動翻譯方法,其特征在于,包含如下步 驟接收翻譯要求,翻譯要求包括源語種、源語料、目標語種;在多語種對應關系數(shù)據庫中檢索源語料是否存在,若存在,則判斷目標語種的認 證結果是否為0K,若是,則呈現(xiàn)目標語料;若否,則判斷源語料的語句類型以及類型詞是否存在,若存在,則判斷目標語種的 語句類型以及類型詞的認證結果是否為0K,若是,則呈現(xiàn)目標語料;若源語料不存在并且源語料的語句類型或類型詞不存在或者目標語種的語句類 型或類型詞不存在,則選擇機器翻譯或人工翻譯;當選擇機器翻譯時,將翻譯要求提交給翻 譯機器,然后獲得機器翻譯結果,之后提交人工認證、翻譯與分解,并將人工認證、分解的結 果記錄在多語種對應關系數(shù)據庫中;當選擇人工翻譯時,直接提交人工認證、翻譯與分解, 并將人工翻譯與分解的結果記錄在多語種對應關系數(shù)據庫中。
4
一種基于正確翻譯結果與對應關系的自動翻譯系統(tǒng),其特征在于,包含多語種對應關系數(shù)據庫,保存至少如下信息之一源語種、源語料、目標語種、目標 語料、語料屬性、語句組合規(guī)則、認證是否0K、認證的信用級別、認證人的信用級別;
接收模塊,接收翻譯要求;檢索模塊,在多語種對應關系數(shù)據庫中檢索源語料、目標語料是否存在,對應的認 證是否OK ;檢索語句類型以及類型詞是否存在;表達模塊,呈現(xiàn)目標語料;對于組合型目標語料,按照目標語種的語句組合規(guī)則的 要求,把目標語種的語句類型和目標語種的類型詞組合后,呈現(xiàn)出來;讀寫模塊,為各模塊讀、寫數(shù)據庫;人工認證、翻譯與分解模塊,獲得正確的翻譯結果,對可以分解為語句類型和類型 詞的語料進行分解;接口模塊,為接收模塊和表達模塊提供與外部設備的接口。本發(fā)明的優(yōu)點是1.使用經認證的翻譯內容,保證翻譯結果正確;2.語料的增加依靠使用用戶的積累,因此積累速度快,便于商業(yè)化;3.系統(tǒng)每增加一次使用就會更多累計語料或者更加增加信用評級,因此具有成長 能力;4.語料增加依靠用戶的使用,因此不需要花費專門的錄入人力,節(jié)約人工;5.接收翻譯要求的方式多樣,方便使用;6.呈現(xiàn)翻譯結果可以為網站、電話、手機、PDA、電腦等多種方式,便于本發(fā)明的推 廣利用。
下面結合附圖,通過對本發(fā)明的具體實施方式
的詳細描述,將使本發(fā)明的技術方 案及其他有益效果顯而易見。圖1為本發(fā)明基于正確翻譯結果與對應關系的自動翻譯方法的流程示意圖;圖2為本發(fā)明基于正確翻譯結果與對應關系的自動翻譯系統(tǒng)的組成示意圖。
具體實施例方式為了更進一步了解本發(fā)明的特征,請參閱以下有關本發(fā)明的詳細說明與附圖,然 而所附圖式僅提供參考與說明之用,并非用來對本發(fā)明的保護范圍加以限制。如圖1所示,為本發(fā)明基于正確翻譯結果與對應關系的自動翻譯方法的流程示意 圖。首先步驟101 接收翻譯要求。接收方式可以為如下之一網站、電話、手機、PDA、電腦。 翻譯要求具體包括源語種、源語料、目標語種。本發(fā)明所稱語料為單詞、語句、短語或者 段落。然后執(zhí)行步驟102,在多語種對應關系數(shù)據庫中檢索源語料是否存在。若源語料存 在,執(zhí)行步驟103,判斷目標語種的認證結果是否為0K,若是,則說明多語種對應關系數(shù)據 庫中存在目標語種的目標語料,則執(zhí)行步驟104,呈現(xiàn)目標語料。若源語料不存在但是源語 料的語句類型和類型詞存在,則判斷目標語種是否存在語句類型和類型詞,如果都存在,則呈現(xiàn)目標語料,此時的目標語料由語句類型、類型詞以及語句組織規(guī)則三部分來確定。也就 是說,本發(fā)明的語料有兩種表現(xiàn)方式完整語料形式;語句類型+類型詞的形式,對于后一 種方式,我們稱為組合型語料,即按照語句組合規(guī)則的要求,把語句類型和類型詞組合成完 整語料,呈現(xiàn)出來。比如完整的語料為我要去浦東機場。組合型語料的語句類型為要去;類型詞 為我,浦東機場。如果數(shù)據庫中沒有“我要去浦東機場”這一語料,但是在語句類型中具有 “要去”的類型,在人稱的類型詞中有“我”一詞,在地名的類型詞中有“浦東機場”一詞,按 照語句組合規(guī)則人稱+要去+地名;本語料就組合為我要去浦東機場。
再比如,完整的語料為我5點鐘下班。組合型語料的語句類型為下班;人稱的 類型詞為我;時間的類型詞為5點鐘。如果數(shù)據庫中沒有“我5點鐘下班”這一語料,但是 在語句類型中具有“下班”的類型,在人稱的類型詞中具有“我”的詞,在時間的類型詞中具 有“5點鐘”的詞,按照語句組合規(guī)則人稱+時間+下班;本語料就組合為我5點鐘下班。由上述兩個例子可以看出,根據數(shù)據庫中存儲的語句類型、類型詞以及語句組合 規(guī)則,即使沒有目標語料也可以組合出目標語料。在本發(fā)明的實施例中,將數(shù)據庫中的目標語料呈現(xiàn)給用戶可以有多種呈現(xiàn)的方 式,例如網頁呈現(xiàn)、手機文字呈現(xiàn)、語音呈現(xiàn)、PDA呈現(xiàn)、電腦呈現(xiàn)。在語音呈現(xiàn)的方式中, 多語種對應關系數(shù)據庫中具有一個多語種文字朗讀工具,因此可以將目標語料用語音呈 現(xiàn)。當找不到目標語料并且也無法組合目標語料時,則執(zhí)行步驟105,由用戶選擇人工 翻譯或機器翻譯。若選擇結果為機器翻譯,則執(zhí)行步驟106,將翻譯要求提交給翻譯機器。 本發(fā)明所稱翻譯機器為所有提供自動翻譯的網站或軟件,例如google翻譯、Yahoo翻譯、 MSN翻譯等。然后執(zhí)行步驟107,獲得機器翻譯結果。然后執(zhí)行步驟108,提交人工認證、翻譯與分解,具體由認證人來評價機器翻譯結 果是否正確,修改翻譯結果到正確為止。本發(fā)明人工認證可以是一個人認證,也可以是多個 人依次認證、依次修改(多個人修改的情況下多出現(xiàn)于翻譯結果不夠準確的情況下)。本發(fā) 明對可以分解為語句類型和類型詞的語料進行分解。分解的方法是將完整的語料分解為 語句類型和類型詞,分別存儲在數(shù)據庫中。語句類型中具有語句組合規(guī)則,其是說明語句類 型的,規(guī)定什么類型的類型詞才能組合以及組合順序,比如“我要去浦東機場”這個語料分 解為“要去”的語句類型、“我”的人稱類型詞、“浦東機場”的地名類型詞以及“人稱+要去 +地名”的語句組合規(guī)則,分別存儲在數(shù)據庫中。這樣,當置換類型詞后,語句類型和新的類 型詞組合仍然是一個通順、正確的語料。比如地名類型詞置換為南京路步行街,根據組合規(guī) 貝1J,完整的語料為我要去南京路步行街。也是通順的語料。最終正確的結果經由步驟104,呈現(xiàn)目標語料給用戶。對于組合型目標語料,按照 目標語種的語句組合規(guī)則的要求,把目標語種的語句類型和目標語種的類型詞組合后,呈 現(xiàn)出來。同時,執(zhí)行步驟109,寫數(shù)據庫即將目標語種和目標語料寫入多語種對應關系數(shù) 據庫,并將多語種對應關系數(shù)據庫中的認證結果字段變更為0K。對于可以分解為語句類型和類型詞的語料,除了將目標語種和目標語料寫入多語 種對應關系數(shù)據庫之外,還要追加把語句類型和類型詞及組合規(guī)則寫入多語種對應關系數(shù)據庫的步驟。1)語句類型的寫入方式在源語種的“語料屬性”中寫入語句類型,在“源語 料”寫入被分為語句類型的那部分語料,在源語種的“語句組合規(guī)則”中寫入語句組合規(guī)則 (例如人稱類型詞+語句類型+地名類型詞),在目標語種的“語料屬性”中寫入語句類型, 在“目標語料”寫入被分為語句類型的那部分語料,在目標語種的“語句組合規(guī)則”中寫入 語句組合規(guī)則(例如人稱類型詞+語句類型+地名類型詞);2)類型詞的寫入方式在源 語種的“語料屬性”中寫入類型詞,在“源語料”寫入被分為類型詞的那部分語料,源語種的 “語句組合規(guī)則”設定為空,在目標語種的“語料屬性”中寫入類型詞,在“目標語料”寫入被 分為類型詞的那部分語料,目標語種的“語句組合規(guī)則”設定為空。如果有多個類型詞就按 照2)的步驟追加多次。本發(fā)明為認證和認證人進行信用評級,如步驟110所示。對認證的信用評級具體 為根據翻譯結果的利用次數(shù),對翻譯結果是否有提出異議和修改的記錄,翻譯結果與最終 正確翻譯之間的差別等情況給出信用級別。例如級別共5級,本發(fā)明方法將認證的級別寫 入數(shù)據庫存儲。對認證人的信用評級具體為根據此認證人的翻譯與認證的次數(shù)、正確率給 出信用級別。例如,每增加一次翻譯,則評級結果加一分;翻譯結果被提一次異議,則評級結 果減一分。這樣用戶可以更放心的使用翻譯結果。若用戶選擇了人工翻譯,則直接執(zhí)行步驟108,將翻譯要求提交到人工認證、翻譯 與分解模塊,直接由認證人進行翻譯與分解。由上述對本發(fā)明的說明可見如果檢索到相同語料,相對應的“認證結果=0K”, 并且與之對應的目標語種不為空,對應的“認證結果=0K”的情況下,可以判定為有正確的 翻譯結果(目標語料)。把目標語料反饋給用戶就完成了翻譯過程。如果出現(xiàn)下述情況之一的都視為沒有正確的翻譯結果。a.在“列名=源語種”的 列中沒有檢索到和源語言相同的語料,也沒有檢索到和源語料的一部分相同的語句類型; b.和源語種相對應的“認證結果不等于0K”;c.相對應的目標語種里是空的;d.和目標語 種相對應的“認證結果不等于0K”。在沒有正確的翻譯結果(目標語料)的情況下,將用戶提出的翻譯要求反饋給現(xiàn) 有的機器翻譯工具,對機器翻譯的結果(半成品)進行人工認證,就開始了獲得正確翻譯結 果的過程。如果認證人判定翻譯結果為正確,就把翻譯結果直接存入多語種對應關系數(shù)據 庫。按照“列名=源語種”存入源語言,設定源語種相對應的“認證結果=0K” ;按照“列名 =目標語種”存入目標語料,設定目標語種相對應的“認證結果=0K”。如果認證人判定翻譯結果為有錯誤,就由認證人(可以是同一個認證人為也可以 不是同一個認證人)來修改錯誤,然后把修改后的翻譯結果存入多語種對應關系數(shù)據庫。 按照“列名=源語種”存入源語言,設定源語種相對應的“認證結果=0K” ;按照“列名=目 標語種”存入目標語言,設定目標語種相對應的“認證結果=0K”。如果認證人判定源語料和目標語料都可以按照相同的方式分解,就由認證人1) 把分解為語句類型的部分寫入多語種對應關系數(shù)據庫。按照在源語種的“語料屬性”中寫 入語句類型,在“源語料”寫入被分為語句類型的那部分語料,在源語種的“語句組合規(guī)則” 中寫入語句組合規(guī)則(例如人稱類型詞+語句類型+地名類型詞),設定源語種相對應的 “認證結果=0K”。在目標語種的“語料屬性”中寫入語句類型,在“目標語料”寫入被分為語句類型的那部分語料,在目標語種的“語句組合規(guī)則”中寫入語句組合規(guī)則(例如人稱 類型詞+語句類型+地名類型詞),設定目標語種相對應的“認證結果=0K” ;2)把分解為 類型詞的部分追加寫入多語種對應關系數(shù)據庫。按照在源語種的“語料屬性”中寫入類型 詞,在“源語料”寫入被分為類型詞的那部分語料,源語種的“語句組合規(guī)則”中寫入語句組 合規(guī)則設定為空,設定源語種相對應的“認證結果=0K”。在目標語種的“語料屬性”中寫 入類型詞,在“目標語料”寫入被分為類型詞的那部分語料,目標語種的“語句組合規(guī)則”設 定為空,設定目標語種相對應的“認證結果=0K”。如果有多個類型詞就按照2)的步驟追 加多次這樣就實現(xiàn)了多語種對應關系數(shù)據庫的增值過程。因此可見,使用本發(fā)明,不但獲 得的翻譯結果是正確的,而且,用戶越多,本發(fā)明累計和學習的正確結果越多,利于商業(yè)化。圖2為本發(fā)明基于正確翻譯結果與對應關系的自動翻譯系統(tǒng)的組成示意圖。201 為多語種對應關系數(shù)據庫,其中保存有本系統(tǒng)的所有數(shù)據,如源語種、源語料、目標語種、 目標語料、語料屬性、語句組合規(guī)則、認證是否0Κ、認證的信用級別、認證人的信用級別。接收模塊202通過接口模塊208接收翻譯要求。根據接口模塊208的不同,接收 方式可以為如下多種網站、電話、手機、PDA、電腦。翻譯要求具體包括源語種、源語料、目 標語種。本發(fā)明所稱語料為單詞、語句、短語或者段落。檢索模塊203在多語種對應關系數(shù)據庫201中檢索源語料是否存在。若源語料存 在,或者是若否、但是由源語料的部分構成的語句類型存在,并且由源語料的部分構成的類 型詞存在,認證結果為OK的話,則說明多語種對應關系數(shù)據庫201中存在目標語種的正確 翻譯結果,由讀寫模塊204從多語種對應關系數(shù)據庫201中讀取目標語料或者是由語句類 型+類型詞構成的組合型目標語料呈現(xiàn)給表達模塊207。本發(fā)明的實施例中,根據與表達 模塊207相連的接口模塊208的不同,因此有多種呈現(xiàn)的方式,例如網頁呈現(xiàn)、手機文字呈 現(xiàn)、語音呈現(xiàn)、PDA呈現(xiàn)、電腦呈現(xiàn)。在語音呈現(xiàn)的方式中,多語種對應關系數(shù)據庫201中具 有一個多語種文字朗讀工具,因此可以將語料用語音呈現(xiàn)。若源語料不存在,則由接口模塊208提交給機器翻譯或者提交給人工認證、翻譯 與分解模塊205。提交給翻譯機器后得到的翻譯結果為半成品,通常不準確,因此機器翻譯 的結果也提交給人工認證、翻譯與分解模塊205。本發(fā)明所稱翻譯機器為所有提供自動翻譯 的網站或軟件,例如google翻譯、Yahoo翻譯、MSN翻譯等。人工認證是由認證人(或稱翻 譯人)來評價機器翻譯結果是否正確,修改翻譯結果到正確為止。本發(fā)明人工認證可以是 一個人認證,也可以是多個人依次認證、依次修改(多個人修改的情況多出現(xiàn)于翻譯結果 不夠準確的情況下)。人工分解是由認證人根據規(guī)則把可以分解的源語料和目標語料分解 為源語言的語句類型和多個類型詞、目標語言的語句類型和多個類型詞的過程。最終正確的結果以及那些可以分解為語句類型和類型詞的語料經由讀寫模塊204 寫入多語種對應關系數(shù)據庫201,同時經由表達模塊207呈現(xiàn)給用戶。本發(fā)明的認證人為懂得翻譯的人,本發(fā)明為認證和認證人進行信用評級,如圖2 中的206所示,具體是根據翻譯結果的利用次數(shù),對翻譯結果是否有提出異議和修改的記 錄,翻譯結果與最終正確翻譯之間的差別等情況給出信用級別。這樣用戶可以更放心地使 用翻譯結果。實施例1
用戶提交的翻譯要求為“我要去浦東機場”,要求翻譯成日文。就是說源語種為中 文,(列名Chinese),源語料為“我要去浦東機場”;目標語種為“日文”(列名Japanese)。 在多語種對應關系數(shù)據庫的源語種=中文(列名=Chinese)的認證后語料中檢索。檢索結果在中文語種(列名=Chinese)中找到了相同語料和中文認證(列名 Authentication_CN = 0K),并且對應的目標語種(日文,列名Japanese)中不為空和日文 認證(列名AuthentiCati0n_JP = 0K)。這說明存在有經過認證的正確翻譯結果。具體內 容為“私( 浦東空港(二行務tz d't?!睂娜瘴?列名Japanese)中的內容(私( 浦東空港(二行t t 0 T t。)反 饋給用戶,就完成了中文翻譯成日文的全過程。實施例2:用戶提交的翻譯要求為“我要去浦東機場”,要求翻譯成英文。就是說源語種為中 文,(列名Chinese),源語料為“我要去浦東機場”;目標語種為“英文”(列名English)。 在多語種對應關系數(shù)據庫的源語種=中文(列名=Chinese)的認證后語料中檢索。檢索結果在中文語種(列名=Chinese)中沒有找到相同語料。實施第2步檢索, 在中文語種(列名=Chinese)的語句類型中檢索,找到了相同的語句類型(Chinese = “要 去”),對應的中文認證(列名:Authentication_CN = OK),并且對應的目標語種(列名 English ="going to,,)不為空,英文認證(列名Authentication_EN = OK)。就是說第 2 步檢索有結果,則準備實施第3步檢索。如果第2步檢索的結果是在源語種中沒有找到相 同的語句類型,或者對應目標語種為空,就判定為沒有翻譯結果,不進行第3步檢索了。實 施第3步檢索,在中文語種(列名=Chinese)的“人稱類型詞”中檢索,找到了相同的人稱 類型詞(Chinese = “我”),對應的中文認證(列名:Authentication_CN = OK),并且對應 的目標語種(列名=English = “I' m”)不為空,英文認證(列名Authentication_EN = 0K)。實施第4步檢索,在中文語種(列名=Chinese)的“地名類型詞”中檢索,找到了相同 的地名類型詞(Chinese = “浦東機場”),對應的中文認證(列名:Authentication_CN = 0K),并且對應的目標語種(列名=English = "Pudong Airport”)不為空,英文認證(列 名=AuthenticatioruEN = 0K)。至此,語句類型和相關的類型詞都已找到,根據目標語種的 語句類型中規(guī)定的“語句組合規(guī)則”=“人稱類型詞” + “語句類型” + “地名類型詞”,實施 組合后得到的結果是“Γ m going to Pudong Airport. ”。把它反饋給用戶,就完成了中 文翻譯成英文的全過程。實施例3 用戶提出的翻譯要求為“上海新天地在那里? ”,要求翻譯成英文(列名 English)。就是說源語種為中文(列名=Chinese),源語料為“上海新天地在那里? ”;目標語 種為“英文”(列名=English)。在多語種對應關系數(shù)據庫的源語種=中文(列名=Chinese) 的認證后語料中檢索。檢索結果在中文語種(列名=Chinese)中找到了相同語料,和中文認證(列名 Authentication_CN = 0K),但是對應的目標語種(英語,列名English)中為空和英文認 證(列名Authenticati0n_EN=“”)也沒有。進行第二步語句類型的檢索,結果沒有相同 的語句類型,這說明沒有翻譯結果。本發(fā)明推薦機器翻譯工具得出的翻譯結果,并提交人工 認證。翻譯結果認證者對機器翻譯工具得出翻譯結果(半成品)進行認證,如果翻譯結果
9正確,則作為目標語言存入多語種對應關系數(shù)據庫中對應的英文(列名=English)中。同 時把對應英文認證(列名Authentication_EN)的空白改為0K。如果翻譯結果有錯誤,則提請翻譯結果修改者改正錯誤,然后把正確的翻譯結果 作為目標語言存入多語種對應關系數(shù)據庫中對應的英文(列名English)中。同時把對應 英文認證(列名Authentication_EN)的空白改為OK。如果判定源語料和目標語料都可以按照相同的方式分解,分別把源語料和目標 語料分解為語句類型、類型詞,并寫入多語種對應關系數(shù)據庫。具體為第一步把源語種 的語句類型 (列名=Chinese = “在那里”)、語料屬性(列名Attribute_CN = “語句類 型”)、語句組合規(guī)則(列名:Rule_CN = “地名類型詞” + “語句類型”)、認證是否OK(列 名Authentication_CN = OK),和對應的目標語種的語句類型(列名English = "Where is”)、語料屬性(列名:Attribute_EN = “語句類型”)、語句組合規(guī)則(列名:Rule_EN = “語句類型” + “地名類型詞”)、認證是否OK(列名AuthentiCati0n_EN = OK);第二步把源 語種的類型詞(列名=Chinese = “上海新天地”)、語料屬性(列名Attribute_CN = “地 名類型詞”)、語句組合規(guī)則(列名Rule_CN = “ ”)、認證是否OK (列名=Authenticatioru CN = 0K),和對應的目標語種的類型詞(列名=English = "Shanghai Xintiandi ”)、語料 屬性(列名Attribute_EN = “地名類型詞”)、語句組合規(guī)則(列名Rule_EN =“”)、認證 是否OK (列名AuthentiCati0n_EN = OK)。這個過程,就是向多語種對應關系數(shù)據庫追加 語料的過程。對本發(fā)明的使用越多,本發(fā)明中積累和學習的越多,便于商業(yè)化。實施例4 用戶提出的翻譯要求為“I' m going to Pudong Airport. ”,要求翻譯成日文。 就是說源語種為英文(列名-English),源語料為“Γ m going to Pudong Airport. ”;目 標語種為“日文”(列名Japanese)。在多語種對應關系數(shù)據庫的源語種=英文(列名 English)的認證后語料中檢索。多語種對應關系數(shù)據庫的檢索結果在英文(列名=English)中找到了相同語 料和英文認證(列名Authentication_EN = 0K),并且對應的目標語種(日文,列名 Japanese)中不為空和日文認證(列名Authentication_JP = 0K)。這說明存在有經過認 證的正確翻譯結果。具體內容為“私U浦東空港(二行務tz PT t?!卑褜娜瘴?列名Japanese)中內容(私( 浦東空港(二行t t 0 T t。)反饋 給用戶,就完成了把英文翻譯成日文的全過程。由上述對本發(fā)明實施例的說明可以看到,使用本發(fā)明方法進行自動翻譯能保證結 果正確而且便于商業(yè)化。應當理解的是,上述對實施例的詳細說明僅為了理解本發(fā)明,對本領域普通技術 人員而言,可以根據上述說明加以改進或變換。只要是達到此目的的所有改進和變換都應 屬于本發(fā)明所附權利要求的保護范圍。
權利要求
一種基于正確翻譯結果與對應關系的自動翻譯方法,其特征在于,包含如下步驟接收翻譯要求,該翻譯要求包括源語種、源語料、目標語種;在多語種對應關系數(shù)據庫中檢索源語料是否存在,若存在,則判斷目標語種的認證結果是否為OK,若是,則呈現(xiàn)目標語料;若否,則判斷源語料的語句類型以及類型詞是否存在,若存在,則判斷目標語種的語句類型以及類型詞的認證結果是否為OK,若是,則呈現(xiàn)目標語料;若源語料不存在并且源語料的語句類型或類型詞不存在或者目標語種的語句類型或類型詞不存在,則選擇機器翻譯或人工翻譯;當選擇機器翻譯時,將翻譯要求提交給翻譯機器,然后獲得機器翻譯結果,之后提交人工認證、翻譯與分解,并將人工認證、分解的結果記錄在多語種對應關系數(shù)據庫中;當選擇人工翻譯時,直接提交人工認證、翻譯與分解,并將人工翻譯與分解的結果記錄在多語種對應關系數(shù)據庫中。
2.根據權利要求1所述的基于正確翻譯結果與對應關系的自動翻譯方法,其特征在 于,還包括根據翻譯結果的利用次數(shù),對翻譯結果是否有提出異議和修改的記錄,翻譯結果與最 終正確翻譯之間的差別為認證和認證人評價信用級別。
3.根據權利要求1所述的基于正確翻譯結果與對應關系的自動翻譯方法,其特征在 于,該接收翻譯要求的方式為如下之一網站、電話、手機、PDA、電腦;該呈現(xiàn)該目標語料的 方式為如下之一網站、電話、手機、PDA、電腦。
4.根據權利要求1所述的基于正確翻譯結果與對應關系的自動翻譯方法,其特征在 于,該翻譯要求具體包括源語種、源語料、目標語種。
5.根據權利要求1所述的基于正確翻譯結果與對應關系的自動翻譯方法,其特征在 于,該語料為如下之一單詞、語句、短語或者段落。
6.根據權利要求1所述的基于正確翻譯結果與對應關系的自動翻譯方法,其特征在 于,該翻譯機器為如下之一 google翻譯、Yahoo翻譯、MSN翻譯。
7.根據權利要求1所述的基于正確翻譯結果與對應關系的自動翻譯方法,其特征在 于,該將人工認證結果記錄在多語種對應關系數(shù)據庫中的步驟為將目標語種和目標語料 存儲在數(shù)據庫中,并將多語種對應關系數(shù)據庫中的認證結果字段變更為0K。
8.根據權利要求1所述的基于正確翻譯結果與對應關系的自動翻譯方法,其特征在 于,該分解為將完整語料分解為語句類型和類型詞,語句類型中具有語句組合規(guī)則。
9.一種基于正確翻譯結果與對應關系的自動翻譯系統(tǒng),其特征在于,包含多語種對應關系數(shù)據庫,保存至少如下信息之一源語種、源語料、目標語種、目標語 料、語料屬性、語句組合規(guī)則、認證是否0K、認證的信用級別、認證人的信用級別; 接收模塊,接收翻譯要求;檢索模塊,在該多語種對應關系數(shù)據庫中檢索該源語料是否存在,對應的認證是否OK ; 檢索語句類型以及類型詞是否存在;表達模塊,呈現(xiàn)該目標語料;對于組合型目標語料,按照目標語種的語句組合規(guī)則的要 求,把目標語種的語句類型和目標語種的類型詞組合后,呈現(xiàn)出來; 讀寫模塊,為各模塊讀、寫數(shù)據庫;人工翻譯與認證模塊,得到正確的目標語料;對可以分解為語句類型和類型詞的語料進行分解;接口模塊,為該接收模塊和該表達模塊提供與外部設備的接口。
10.如權利要求9所述的基于正確翻譯結果與對應關系的自動翻譯系統(tǒng),其特征在于, 還包含信用評級模塊,根據翻譯結果的利用次數(shù),對翻譯結果是否有提出異議和修改的記 錄,翻譯結果與最終正確翻譯之間的差別給出認證和認證人的信用級別。
全文摘要
本發(fā)明揭示了一種基于正確翻譯結果與對應關系的自動翻譯方法,包含如下步驟接收翻譯要求源語種、源語料、目標語種;在多語種對應關系數(shù)據庫中檢索源語料與目標語料是否存在或者可以組合,若存在或者可以組合,則呈現(xiàn)目標語料,若不存在并且不可以組合,則選擇機器翻譯或人工翻譯;當選擇機器翻譯時,獲得機器翻譯結果,之后提交人工認證、翻譯與分解;當選擇人工翻譯時,直接提交人工認證、翻譯與分解;人工認證、翻譯與分解,得到正確的目標語料;將目標語料記錄在多語種對應關系數(shù)據庫中;呈現(xiàn)目標語料。
文檔編號G06F17/28GK101957815SQ200910054690
公開日2011年1月26日 申請日期2009年7月13日 優(yōu)先權日2009年7月13日
發(fā)明者白勁實 申請人:白勁實