一種翻譯方法和裝置制造方法
【專利摘要】本發(fā)明實施例公開了一種翻譯方法和裝置,其中所述方法包括:輸入數(shù)據(jù)項;移動訪問指針以按基本詞長度降序訪問基本詞詞庫中的基本詞詞組;a:在當前訪問的基本詞詞組中查找具有獨立語意且最靠近待翻譯部分左側(cè)的基本詞作為匹配基本詞,若查找到則執(zhí)行b,否則執(zhí)行c;b:將數(shù)據(jù)項中的對應(yīng)內(nèi)容翻譯為英文并更新待翻譯部分,判斷數(shù)據(jù)項中是否還包含未翻譯為英文的部分,若是則執(zhí)行a,否則輸出翻譯結(jié)果;c:判斷當前訪問的基本詞詞組是否是最小長度的詞組,若是則輸出翻譯結(jié)果,否則移動訪問指針至下一基本詞詞組并執(zhí)行a。采用本發(fā)明可提高翻譯的準確度得到符合源語言語意的翻譯結(jié)果,尤其適用于翻譯銀行等金融專業(yè)領(lǐng)域的金融術(shù)語、短語和短句。
【專利說明】一種翻譯方法和裝置
【技術(shù)領(lǐng)域】
[0001 ] 本發(fā)明涉及一種翻譯方法和裝置。
【背景技術(shù)】
[0002]現(xiàn)有的主流翻譯技術(shù)利用統(tǒng)計學和概率方法建立包含各種句型的雙語對照語料庫,在翻譯時,從語料庫中抽取與輸入句子相類似的例句,然后模仿例句來實現(xiàn)源語言與目標語言的轉(zhuǎn)換。采用這種技術(shù)雖然能夠得到可讀性和準確性較好的譯文,但是必須建立龐大的語料庫和有效的運行機制,并且僅是一般性的翻譯,并不適用于對于翻譯結(jié)果有較高要求的專業(yè)領(lǐng)域,例如:銀行領(lǐng)域、機械領(lǐng)域、電子領(lǐng)域等。以銀行領(lǐng)域為例,現(xiàn)有的翻譯技術(shù)中并不具備一份專業(yè)的銀行領(lǐng)域詞匯,模仿例句進行翻譯的結(jié)果通常是多樣化的且得不到確定性的翻譯結(jié)果;此外,現(xiàn)有技術(shù)模仿例句實現(xiàn)語言轉(zhuǎn)換,因此無法根據(jù)源語言的詞義進行準確的詞語切分,也就不能準確地得到基于源語言詞義的翻譯結(jié)果。
【發(fā)明內(nèi)容】
[0003]為解決上述技術(shù)問題,本發(fā)明提供了一種翻譯方法和裝置,尤其適用于諸如銀行領(lǐng)域等對于翻譯結(jié)果的精確度有較高要求的專業(yè)領(lǐng)域,能根據(jù)源語言的語意相對準確地進行語言轉(zhuǎn)換。
[0004]本發(fā)明實施例提供了一種翻譯方法,包括:
[0005]輸入數(shù)據(jù)項;
[0006]移動訪問指針以按照基本詞長度從大到小的順序訪問基本詞詞庫中的基本詞詞組,其中,所述基本詞詞庫按照基本詞長度分組存儲有基本詞及對應(yīng)英文詞匯,相同長度的基本詞屬于同一基本詞詞組;
[0007]操作a:在當前訪問的基本詞詞組中查找所述數(shù)據(jù)項的待翻譯部分中具有獨立語意且最靠近所述待翻譯部分左側(cè)的基本詞作為匹配基本詞,如果查找到所述匹配基本詞,則執(zhí)行操作b,否則執(zhí)行操作C,所述待翻譯部分是所述數(shù)據(jù)項中未翻譯為英文的部分;
[0008]操作b:將所述數(shù)據(jù)項中對應(yīng)所述匹配基本詞的內(nèi)容翻譯為英文并更新所述待翻譯部分,然后判斷所述數(shù)據(jù)項中是否還包含未翻譯為英文的部分,如果包含,則執(zhí)行操作a ;如果不包含,則輸出翻譯結(jié)果;
[0009]操作c:判斷當前訪問的基本詞詞組是否是最小長度的基本詞詞組,如果是,則輸出翻譯結(jié)果;如果不是,則移動訪問指針至下一基本詞詞組并執(zhí)行操作a。
[0010]相應(yīng)地,本發(fā)明實施例還提供了一種翻譯裝置,包括:
[0011]輸入單元,用于輸入數(shù)據(jù)項;
[0012]存儲單元,用于存儲基本詞詞庫,所述基本詞詞庫按照基本詞長度分組存儲有基本詞及對應(yīng)英文詞匯,相同長度的基本詞屬于同一基本詞詞組;
[0013]指針單元,用于移動訪問指針以按照基本詞長度從大到小的順序訪問基本詞詞庫中的基本詞詞組;[0014]匹配查找單元,用于在所述指針單元當前訪問的基本詞詞組中查找所述數(shù)據(jù)項的待翻譯部分中具有獨立語意且最靠近所述待翻譯部分左側(cè)的基本詞作為匹配基本詞,如果查找到所述匹配基本詞,則觸發(fā)第一處理單元,否則觸發(fā)第二處理單元,其中,所述待翻譯部分是所述數(shù)據(jù)項中未翻譯為英文的部分;
[0015]第一處理單元,用于將所述數(shù)據(jù)項中對應(yīng)所述匹配基本詞的內(nèi)容翻譯為英文并更新所述待翻譯部分,之后判斷所述數(shù)據(jù)項中是否還包含未翻譯為英文的部分,如果包含,則觸發(fā)所述匹配查找單元;如果不包含,則觸發(fā)輸出單元;
[0016]第二處理單元,用于判斷當前訪問的基本詞詞組是否是最小長度的基本詞詞組,如果是,則觸發(fā)輸出單元;如果不是,則觸發(fā)所述指針單元將訪問指針移動至下一基本詞詞組,然后觸發(fā)所述匹配查找單元;
[0017]輸出單元,用于輸出翻譯結(jié)果。
[0018]實施本發(fā)明實施例所提供的翻譯方法和裝置,能夠根據(jù)基本詞詞庫和查找機制對中文數(shù)據(jù)項進行快速、準確地翻譯,并且能得到符合中文語意且符合領(lǐng)域內(nèi)相關(guān)人員的業(yè)務(wù)習慣的翻譯結(jié)果。
【專利附圖】
【附圖說明】
[0019]圖1是根據(jù)本發(fā)明實施例的一種翻譯方法的流程示意圖;
[0020]圖2是根據(jù)本發(fā)明實施例的一種查找匹配基本詞的方法的流程示意圖;
[0021]圖3是根據(jù)本發(fā)明實施例的一種翻譯方法的流程示意圖;
[0022]圖4A是根據(jù)本發(fā)明實施例的一種翻譯方法的流程示意圖;
[0023]圖4B是根據(jù)本發(fā)明實施例的一種規(guī)范化檢查的方法的流程示意圖;
[0024]圖5是根據(jù)本發(fā)明實施例的一種確定英文單詞的縮寫詞的方法的流程示意圖;
[0025]圖6是根據(jù)本發(fā)明實施例的一種翻譯裝置的方塊示意圖;
[0026]圖7是根據(jù)本發(fā)明實施例的一種翻譯裝置的匹配查找單元的方塊示意圖;
[0027]圖8是根據(jù)本發(fā)明實施例的一種翻譯裝置的方塊示意圖;
[0028]圖9是根據(jù)本發(fā)明實施例的一種翻譯裝置的方塊示意圖;
[0029]圖10是根據(jù)本發(fā)明實施例的一種翻譯裝置的方塊示意圖。
【具體實施方式】
[0030]下面將結(jié)合附圖對本發(fā)明實施例中的技術(shù)方案進行清楚、完整的描述。
[0031]圖1是根據(jù)本發(fā)明實施例的一種翻譯方法的流程示意圖,參照圖1,該方法包括:
[0032]100:輸入數(shù)據(jù)項。數(shù)據(jù)項是指待翻譯詞匯,本實施例并不限制數(shù)據(jù)項的多少,例如,可以輸入一整篇由數(shù)據(jù)項構(gòu)成的文檔,但針對每一個數(shù)據(jù)項均可采用本發(fā)明實施例所提供的方法進行翻譯。
[0033]102:移動訪問指針以按照基本詞長度從大到小的順序訪問基本詞詞庫中的基本詞詞組,其中,所述基本詞詞庫按照基本詞長度分組存儲有基本詞及對應(yīng)英文詞匯,相同長度的基本詞屬于同一基本詞詞組,訪問指針指向基本詞在基本詞詞庫中的存儲位置。通過分組的形式,使得查找范圍縮小,翻譯速度更快。
[0034]基本詞詞庫存儲有基本詞及對應(yīng)的英文詞匯。基本詞是經(jīng)標準化命名之后的詞匯,其具有獨立完整含義且無二義性。在本發(fā)明各個實施例中以中文數(shù)據(jù)項進行說明,本領(lǐng)域技術(shù)人員應(yīng)當理解,本發(fā)明同樣適用于其他源語言。以銀行領(lǐng)域的中文數(shù)據(jù)項為例,“基本詞”是中文名稱中具有獨立完整含義、無二義性、業(yè)務(wù)慣用且經(jīng)標準化命名之后的詞匯,“基本詞”又名“詞根”,多個基本詞可構(gòu)成一個完整的中文數(shù)據(jù)項。
[0035]104:在當前訪問的基本詞詞組中查找匹配基本詞。具體的,在當前訪問的基本詞詞組中查找所述數(shù)據(jù)項的待翻譯部分中具有獨立語意且最靠近所述待翻譯部分左側(cè)的基本詞作為匹配基本詞,如果查找到所述匹配基本詞,則執(zhí)行106,否則執(zhí)行108,所述待翻譯部分是所述數(shù)據(jù)項中未翻譯為英文的部分。
[0036]其中,“具有獨立語意”可以理解為“與在所述待翻譯部分中的前驅(qū)詞和/或后繼詞不構(gòu)成所述基本詞詞庫中的基本詞”。
[0037]106:將所述數(shù)據(jù)項中對應(yīng)所述匹配基本詞的內(nèi)容翻譯為英文并更新所述待翻譯部分,然后判斷所述數(shù)據(jù)項中是否還包含未翻譯為英文的部分(即:判斷是否還存在所述待翻譯部分),如果包含,則執(zhí)行104 ;如果不包含,則輸出翻譯結(jié)果,例如:根據(jù)所述數(shù)據(jù)項的語序輸出所述數(shù)據(jù)項的各個匹配基本詞所對應(yīng)的英文詞匯。
[0038]108:判斷當前訪問的基本詞詞組是否是最小長度的基本詞詞組,如果是,則輸出翻譯結(jié)果;如果不是,則移動訪問指針至下一基本詞詞組并執(zhí)行104。
[0039]本發(fā)明實施例所提供的翻譯方法,能夠根據(jù)基本詞詞庫和查找機制對中文數(shù)據(jù)項進行翻譯,得到符合中文數(shù)據(jù)項語意的翻譯結(jié)果,準確度較高且符合領(lǐng)域內(nèi)相關(guān)人員的業(yè)務(wù)習慣。此外,通過分組的方式存儲基本詞,有利于更加快速的進行基本詞的查找。
[0040]圖2是根據(jù)本發(fā)明實施例的一種查找匹配基本詞的方法的流程示意圖,示出了在當前訪問的基本詞詞組中查找匹配基本詞的方法,參照圖2,所述方法包括:
[0041]200:查找最靠近待翻譯部分左側(cè)的基本詞作為最左基本詞,并根據(jù)以下判斷確定所述最左基本詞是否具有獨立語意。
[0042]由于在102中訪問指針按照基本詞長度訪問基本詞詞組,所以,示例性的,對于數(shù)據(jù)項“支付方向代碼”,在基本詞詞庫中有“支付方”、“支付”、“方向”和“代碼”,那么,“支付方向代碼”就是最初的待翻譯部分,“支付方”是所有基本詞中首先查找到的最左基本詞。
[0043]202:判斷所述最左基本詞的長度是否小于3個中文字,如果是,則具有獨立語意(即:屬于所述匹配基本詞),否則觸發(fā)204。在本實施例中基于中文數(shù)據(jù)項的特點限制閾值為3個中文字,因為一般來講,2個中文字構(gòu)成的數(shù)據(jù)項的含義相對獨立且明確,當然這并不表示在本實施例中只能以3個中文字作為限制條件。
[0044]204:根據(jù)所述最左基本詞及其在所述待翻譯部分中的前驅(qū)詞和后繼詞,判斷所述最左基本詞是否具有獨立語意。當然,基于所述最左基本詞在所述待翻譯部分中的位置,可能所述最左基本詞只有前驅(qū)詞或只有后繼詞,此時,則只需根據(jù)所述最左基本詞及其前驅(qū)詞或后繼詞進行判斷。
[0045]具體的,204可以通過以下方式實現(xiàn):
[0046]將所述待翻譯部分在所述最左基本詞之前的一個字與所述最左基本詞的開頭兩個字組合構(gòu)成第一構(gòu)成詞,將所述最左基本詞的結(jié)尾一個字與所述待翻譯部分在所述最左基本詞之后的一個字組合構(gòu)成第二構(gòu)成詞,判斷所述第一構(gòu)成詞和第二構(gòu)成詞是否均不屬于基本詞,如果均不屬于基本詞,則所述最左基本詞具有獨立語意;否則,不具備獨立語意。例如,對于數(shù)據(jù)項“支付方向代碼”,在基本詞詞庫中有“支付方”、“支付”、“方向”和“代碼”,當查找到“支付方”時,組合“方”和“向”(“向”是“支付方”的后繼詞)發(fā)現(xiàn)“方向”屬于基本詞,則“支付方”不屬于匹配基本詞。再例如,對于數(shù)據(jù)項“預授信額度”,在基本詞詞庫中有“預授信”、“授信額度”和“額度”但沒有“預”,當查找到“授信額度”時,組合“預”和(“預”是“授信額度”的前驅(qū)詞)“授信”發(fā)現(xiàn)“預授信”屬于基本詞,則“授信額度”不屬于匹配基本詞。再例如,對于數(shù)據(jù)項“實賬戶金額”,基本詞詞庫中有“實賬戶”、“賬戶金額”和“金額”但沒有“實”,當查找到“賬戶金額”時,組合“實”和“賬戶”發(fā)現(xiàn)“實賬戶”屬于基本詞,則“賬戶金額”不屬于匹配基本詞。
[0047]當然,根據(jù)中文數(shù)據(jù)項的特點,也可以靈活限制部分所述最左基本詞和部分所述待翻譯部分的組合關(guān)系,而不限于上述組合字數(shù)限制。
[0048]如果在204中判斷所述最左基本詞不具有獨立語意,則可以執(zhí)行206:在當前訪問的基本詞詞組中重新查找最左基本詞,然后重復202和204的判斷。
[0049]202-206可以重復進行,直至在當前訪問的基本詞組中確定出所述匹配基本詞或直至確定不存在所述匹配基本詞。
[0050]本實施例所提供的查找匹配基本詞的方法,根據(jù)中文數(shù)據(jù)項固有的特點進行翻譯,遵循數(shù)據(jù)項所表達的語意,避免了可能存在歧義的翻譯。
[0051]圖3是根據(jù)本發(fā)明實施例的一種翻譯方法的流程示意圖,參照圖3,以源語言為中文,目標語言為英文為例,所述方法包括(在本發(fā)明提供的各種實施例的流程圖中,虛線箭頭的起始端的內(nèi)容表示流程運行所需要的準備工作,并不屬于流程順序的一部分):
[0052]300:在輸入數(shù)據(jù)項后,將數(shù)據(jù)項賦值給Word_full。
[0053]301:查找保留字清單,確定是否命中所述數(shù)據(jù)項,如果命中則輸出所述數(shù)據(jù)項的對應(yīng)英文全稱和簡稱,并將規(guī)范化標志置為是;如果未命中,執(zhí)行302。其中,保留字清單用于保存已經(jīng)完成翻譯的數(shù)據(jù)項的翻譯結(jié)果(需要說明的是,在本發(fā)明中,“已經(jīng)完成翻譯的數(shù)據(jù)項的翻譯結(jié)果”應(yīng)當理解為翻譯結(jié)果中不包含中文的翻譯結(jié)果),例如,完成翻譯的數(shù)據(jù)項的對應(yīng)英文全稱和/或簡稱。
[0054]302:將基本詞詞庫的訪問指針More指向基本詞詞庫的起始位直,從上往下訪問基本詞詞庫。其中,基本詞詞庫中保存有基本詞及相應(yīng)的英文全稱和簡稱,詞庫中的基本詞按照基本詞長度分為多個組,并且各個組按照基本詞長度降序排列,可選的,在各個組中的基本詞可按照訪問頻率降序排列,以保證常用的基本詞能夠被盡快查到。
[0055]可選的,在302的一種替代實現(xiàn)方式中,可以根據(jù)所述數(shù)據(jù)項的長度確定More指針首先指向哪個組,例如,如果所述數(shù)據(jù)項長度為k個中文字,則More指針首先指向長度為k-Ι的組的起始位置。
[0056]303:判斷More指針是否超過基本詞詞庫的最大行數(shù),如果超過,則輸出所述數(shù)據(jù)項和Word_full ;如果不超過,則執(zhí)行304??蛇x的,在輸出所述數(shù)據(jù)項和Word_full之后,還可以根據(jù)數(shù)據(jù)項中是否含有未翻譯的中文設(shè)置規(guī)范化標志(規(guī)范化標志可理解為翻譯結(jié)果的一種屬性,例如:規(guī)范化標志為“否”表示數(shù)據(jù)項的翻譯結(jié)果包含中文,為“是”表示數(shù)據(jù)項的翻譯結(jié)果不包含中文),針對規(guī)范化標志為“否”的數(shù)據(jù)項可進行后續(xù)處理,例如:修改該數(shù)據(jù)項或在基本詞詞庫中新增基本詞。
[0057]304:More指針一直往下走,設(shè)Head為當前訪問組的組頭,Tail為當前訪問組的組尾。
[0058]305:從Head至Tail的當前訪問組中,是否查找到最左基本詞?如果否,則執(zhí)行303,如果是則執(zhí)行306。
[0059]306:最左基本詞的開頭兩個字是否與前驅(qū)詞構(gòu)成基本詞詞庫中的基本詞?如果是,則執(zhí)行305,否則執(zhí)行307。
[0060]307:最左基本詞的結(jié)尾一個字是否與后繼詞構(gòu)成基本詞詞庫中的基本詞?如果是,則執(zhí)行305,否則執(zhí)行308,其中308屬于可選步驟,也可以直接執(zhí)行309。
[0061]308:將最左基本詞在基本詞詞庫中的訪問頻率加I,以便于更新基本詞詞庫中基本詞的排序。
[0062]309:分別用最左基本詞的對應(yīng)英文全稱和簡稱替換所述數(shù)據(jù)項和Word_full中的相應(yīng)中文,然后執(zhí)行310。
[0063]310:判斷所述數(shù)據(jù)項中是否包含中文,如果包含,則執(zhí)行305以從所述當前訪問組開始重新查找最左基本詞,如果不包含,則執(zhí)行311。
[0064]311:輸出數(shù)據(jù)項和Word_full。此時輸出的數(shù)據(jù)項為英文全稱,輸出的Word_full為相應(yīng)英文簡稱。當然,也可以同時輸出數(shù)據(jù)項的中文。
[0065]可選的,在311之后還可以執(zhí)行312。
[0066]在本實施例中,301為可選步驟,通過執(zhí)行301有利于快速查找到數(shù)據(jù)項的翻譯結(jié)果。實際上,在本發(fā)明的另一種實施例中,可以將保留字清單中的內(nèi)容作為基本詞詞庫中的特殊基本詞,這樣,在302中,More指針可以首先指向基本詞長度與所述輸入項長度相同的組,這樣就包含了從基本詞詞庫中直接查找到所述數(shù)據(jù)項的完整翻譯的可能。
[0067]在本實施例中,每一次確定出與所述數(shù)據(jù)項匹配的基本詞之后,均用相應(yīng)的英文詞匯和英文縮寫詞代替所述數(shù)據(jù)項中的相應(yīng)基本詞,從而在最后次確認出與所述數(shù)據(jù)項匹配的基本詞之后,輸出翻譯結(jié)果??蛇x的,也可以在確定出與所述數(shù)據(jù)項匹配的所有基本詞之后,用相應(yīng)的英文詞匯和英文縮寫詞代替所述數(shù)據(jù)項中的相應(yīng)基本詞,進而輸出翻譯結(jié)果O
[0068]在本實施例中關(guān)于More指針的說明可以看出,在按照基本詞長度從大到小依次查找不同的組時,可以將訪問指針指向當前訪問組的起始位置,然后按照所述訪問指針自上至下的順序查找當前查找的組內(nèi)的各個基本詞。
[0069]圖4A是根據(jù)本發(fā)明實施例的一種翻譯方法的流程示意圖,參照圖4A,所述方法包括:
[0070]400:輸入數(shù)據(jù)項。
[0071]402:對所述數(shù)據(jù)項進行規(guī)范化檢查,對于通過規(guī)范化檢查的數(shù)據(jù)項,執(zhí)行406 ;對于未通過規(guī)范化檢查的數(shù)據(jù)項,執(zhí)行404以進行規(guī)范化處理,之后執(zhí)行406。其中,“規(guī)范化檢查”是指:檢查所述數(shù)據(jù)項是否由所述基本詞詞庫中的基本詞構(gòu)成,并檢查所述數(shù)據(jù)項是否以類詞清單中的類詞結(jié)尾;“規(guī)范化處理”是指,當所述數(shù)據(jù)項未通過規(guī)范化檢查時,對所述數(shù)據(jù)項進行修改或?qū)驹~詞庫和類詞清單進行修改,直至該數(shù)據(jù)項通過規(guī)范化檢查的處理過程。關(guān)于規(guī)范化檢查和規(guī)范化處理流程的詳細說明,請參照圖4B所示實施例中的說明。
[0072]下面對類詞進行說明:類詞屬于基本詞,是中文數(shù)據(jù)項的最后一個基本詞。類詞反映了域組的概念,表達了中文數(shù)據(jù)項取值的屬性(通過對金融領(lǐng)域的詞匯進行總結(jié)和研究發(fā)現(xiàn),這些詞匯的屬性的取值都有一定的規(guī)則和范圍,這些規(guī)則在數(shù)據(jù)模型中可以“域”的方式定義。同時在習慣的屬性命名中,中文名稱的最后一個基本詞通常一定程度上反應(yīng)了屬性的取值,為此可以將最后一個詞單獨劃出來,加以規(guī)范管理)。通過對類詞的規(guī)范化、標準化使用,可以更加清晰明確的反應(yīng)數(shù)據(jù)項的屬性。例如:身份證呈遇、客戶編遇、交易類型包遇、客戶偏好避述、客戶偏好等,通過其名稱中的類詞(即下劃線部分),即可對數(shù)據(jù)項的屬性做初步的判斷。一種示例性的規(guī)則如下:代碼類屬性的數(shù)據(jù)項以"代碼"結(jié)尾,標志類屬性的數(shù)據(jù)項(即表示是或否之類的屬性)以"標志"結(jié)尾,編碼類的數(shù)據(jù)項一般以“編碼”或者“編號”結(jié)尾,文本類的數(shù)據(jù)項一般以“描述”結(jié)尾,數(shù)值類屬性的數(shù)據(jù)項一般以“數(shù)值”,“值”,“天數(shù)”等結(jié)尾,日期類屬性的數(shù)據(jù)項可以加“日期”或“期”結(jié)尾。
[0073]406:對規(guī)范化的數(shù)據(jù)項(包括:通過規(guī)范化檢查的數(shù)據(jù)項和規(guī)范化處理之后的數(shù)據(jù)項)進行翻譯,并輸出翻譯結(jié)果。具體的翻譯方法請參照圖1至圖3所示實施例中的詳細說明,此處不贅述。
[0074]可選的,本實施例的一種實現(xiàn)方式中,在406之后,所述方法還包括408:對輸出的翻譯結(jié)果進行檢查。包括:首先檢查輸出的翻譯結(jié)果是否包含未翻譯為英文的部分,如果包含,則將規(guī)范化標志置為否;否則,將所述規(guī)范化標志置為是。然后根據(jù)所述規(guī)范化標志進行以下處理:如果所述規(guī)范化標志為是,則將輸出的翻譯結(jié)果保存在保留字清單,所述保留字清單用于保存已經(jīng)完成翻譯的數(shù)據(jù)項的翻譯結(jié)果;如果所述規(guī)范化標志為否,則提示修改所述數(shù)據(jù)項,或根據(jù)所述未翻譯為英文的部分在所述基本詞詞庫中增加基本詞。
[0075]可選的,在本實施例的一種實現(xiàn)方式中,在406中還輸出翻譯結(jié)果中的各個英文詞匯的縮寫詞,組成縮寫翻譯結(jié)果。具體的,可從縮寫詞庫中查找翻譯結(jié)果中的各個英文詞匯的縮寫詞,組成所述數(shù)據(jù)項的英文縮寫詞匯,其中,如果所述翻譯結(jié)果中存在所述縮寫詞庫中沒有的英文詞匯,則按照預設(shè)的縮寫規(guī)則簡化相應(yīng)的英文詞匯,得到的縮寫詞可補充至縮寫詞庫中。
[0076]示例性的,目標語言的縮寫規(guī)則可包括:
[0077]1:常用單詞或詞組如果已有業(yè)界習慣的縮寫法,優(yōu)先采用。如Database縮寫為DB, China Construction Bank縮寫為CCB。2:單詞首字母保留。3:單詞中間可省去A、E、1、
0、U和Y。如China縮寫Chn,Name縮寫Nm,Write縮寫Wrt。4:數(shù)字一律采用阿拉伯數(shù)字。例如=First縮寫為1st,F(xiàn)ive縮寫為5。6:類似OfV s、The在縮寫中一般做省略處理。如ThePeope1 s Republic Of China縮寫為 PRC,再例如 Degree of Customer Relationship (客戶關(guān)系度)在縮寫時先按中文語序去除Of,即改為Customer Relationship Degree,然后縮寫為 CstRltnpDgr。7:To、For 和 And 等一般予以保留。例如:Check Credit For Load(支票圈存)縮寫為ChkCrForLoad,To Construct Area(應(yīng)動工開發(fā)建設(shè)面積)縮寫為ToCnstrctArea0 8:諸如Pre、Re、Non等前綴全部保留且不縮寫。如Pre-Repayment縮寫為PreRpy, Non-operating Income (營業(yè)外收入)縮寫為NonOprglncm。9:時態(tài)/詞性省略原貝U,諸如“-S,-1ng, -ed, -tion, -ment”等詞語的縮寫與原詞的縮寫詞相同,例如:Table和Tables的縮寫詞都是Tbl,Payment與Pay的縮寫詞都是Py。10:只有四個字母的單詞可以不縮寫,原則上每個單詞縮寫后的總長度不超過5個字符,縮寫結(jié)果保證大致可讀即可。
[0078]示例性的,一種確定英文單詞的縮寫詞的方法的流程示意圖請參照圖5,圖5中的流程圖已經(jīng)比較詳細(其中,“Taill=空串”表示當后綴為諸如“s,ing, ed, tion, ment”等后綴時,直接省略后綴,以至于拼裝時Taill不包含任何字母),此處不進行詳述。
[0079]圖4B是根據(jù)本發(fā)明實施例的一種規(guī)范化檢查的方法的流程示意圖,本領(lǐng)域技術(shù)人員應(yīng)當理解,對圖4B所示實施例進行適當修改(例如:修改流程的輸入項)即可應(yīng)用至圖4A或本發(fā)明其他處所示實施例中需要進行規(guī)范化檢查的步驟中。下面對圖4B所示實施例進行說明。
[0080]參照圖4B,該方法包括:
[0081]401':輸入《數(shù)據(jù)要求說明書》,所述《數(shù)據(jù)要求說明書》為待翻譯數(shù)據(jù)項的集合。
[0082]402':基于當前的基本詞詞庫和類詞清單對《數(shù)據(jù)要求說明書》中的數(shù)據(jù)項進行規(guī)范化檢查,即,檢查《數(shù)據(jù)要求說明書》中的數(shù)據(jù)項是否由當前的基本詞詞庫中的基本詞以及當前的類詞清單中的類詞構(gòu)成。
[0083]403':如果未通過規(guī)范化檢查,則執(zhí)行404'。如果通過規(guī)范化檢查,則《數(shù)據(jù)要求說明書》中的數(shù)據(jù)項可以進行翻譯操作,此時可執(zhí)行408'。
[0084]404':判斷是否需要新增基本詞和類詞,如果需要則執(zhí)行405';如果不需要,則進行以下處理:反饋修改意見并根據(jù)修改意見修改《數(shù)據(jù)要求說明書》,基于修改的《數(shù)據(jù)要求說明書》執(zhí)行402'。
[0085]示例性的,當待翻譯數(shù)據(jù)項中存在的詞與基本詞詞庫中的基本詞語意相同但屬于錯字、別字時,無需新增基本詞,可以僅反饋修改意見(例如:將錯字、別字修改為正確的字。例如:“帳號”統(tǒng)一改為“賬號”,“幣別”統(tǒng)一改為“幣種,“其它”統(tǒng)一改為“其他”);當待翻譯數(shù)據(jù)項中結(jié)尾的詞與類詞清單中的類詞語意相同但屬于錯字、別字時,無需新增類詞,可以僅反饋修改意見(例如:將錯字、別字修改為正確的字/詞);當待翻譯數(shù)據(jù)項中結(jié)尾的詞不是類詞清單中的類詞時,可以根據(jù)該待翻譯數(shù)據(jù)項的實際屬性反饋修改意見(例如:在該待翻譯數(shù)據(jù)項的結(jié)尾處添加已有的類詞。例如:待翻譯數(shù)據(jù)項“任務(wù)類型”,其表示代碼類屬性,可以改為“任務(wù)類型代碼”),或可以根據(jù)該待翻譯數(shù)據(jù)項的結(jié)尾的詞新增一個類詞;除上述情況之外的情況,可以考慮執(zhí)行405'。
[0086]在404'中所進行的判斷過程可以由人工執(zhí)行,也可以建立用于與待翻譯數(shù)據(jù)項進行對比的數(shù)據(jù)庫或建立專門的錯字、別字清單,通過對比進行確定。
[0087]405':輸出新增基本詞和類詞,例如:以基本詞清單和類詞清單的形式輸出。
[0088]406':對新增的基本詞和類詞進行縮寫轉(zhuǎn)換(例如:參照圖5所示實施例),從而更新縮寫詞庫。
[0089]407':基于新增的基本詞和類詞更新當前的基本詞詞庫和類詞清單。
[0090]408':對通過規(guī)范化檢查或經(jīng)過規(guī)范化處理的數(shù)據(jù)項進行翻譯(具體的翻譯操作請參照本發(fā)明相應(yīng)實施例)。
[0091]409':生成《數(shù)據(jù)要求說明書》中所有數(shù)據(jù)項的英文全稱和英文簡稱、并設(shè)置規(guī)范化標志(對于規(guī)范化標志的說明請參照圖3所示實施例)。
[0092]圖4B所示方法與本申請中的一些翻譯方法相互結(jié)合,一方面,可以通過翻譯程序的基本詞檢查和類詞檢查找出一些不合規(guī)的數(shù)據(jù),并通過改正予以規(guī)范化處理,另一方面,前期進行規(guī)范化的數(shù)據(jù)可以提高后期翻譯的準確性。
[0093]利用圖4B所示的規(guī)范化檢查方法,不僅能夠在翻譯之前對待翻譯內(nèi)容(例如:待翻譯數(shù)據(jù)項或待翻譯數(shù)據(jù)項的集合)進行規(guī)范化處理,還能夠降低維護成本,因為隨著詞庫的基本詞被復用的越來越多,隨著時間的推移需要添加的基本詞會越來越少,因此,本發(fā)明所提供的各種方法特別適用于企業(yè)級的應(yīng)用。圖6是根據(jù)本發(fā)明實施例的一種翻譯裝置的方塊示意圖,參照圖6,翻譯裝置60包括輸入單元61、存儲單元62、指針單元63、匹配查找單元64、第一處理單元65、第二處理單元66和輸出單元67,下面分別進行說明。
[0094]輸入單元61,用于輸入數(shù)據(jù)項。
[0095]存儲單元62,用于存儲基本詞詞庫,所述基本詞詞庫按照基本詞長度分組存儲有基本詞及對應(yīng)英文詞匯,相同長度的基本詞屬于同一基本詞詞組。
[0096]指針單元63,用于移動訪問指針以按照基本詞長度從大到小的順序訪問基本詞詞庫中的基本詞詞組。
[0097]匹配查找單元64,用于在所述指針單元63當前訪問的基本詞詞組中查找所述數(shù)據(jù)項的待翻譯部分中具有獨立語意且最靠近所述待翻譯部分左側(cè)的基本詞作為匹配基本詞,如果查找到所述匹配基本詞,則觸發(fā)第一處理單元65,否則觸發(fā)第二處理單元66,其中,所述待翻譯部分是所述數(shù)據(jù)項中未翻譯為英文的部分。
[0098]第一處理單元65,用于將所述數(shù)據(jù)項中對應(yīng)所述匹配基本詞的內(nèi)容翻譯為英文并更新所述待翻譯部分,之后判斷所述數(shù)據(jù)項中是否還包含未翻譯為英文的部分,如果包含,則觸發(fā)所述匹配查找單元64 ;如果不包含,則觸發(fā)輸出單元67。
[0099]第二處理單元66,用于判斷當前訪問的基本詞詞組是否是最小長度的基本詞詞組,如果是,則觸發(fā)輸出單元67 ;如果不是,則觸發(fā)所述指針單元63將訪問指針移動至下一基本詞詞組,然后觸發(fā)所述匹配查找單元64 ;
[0100]輸出單兀67,用于輸出翻譯結(jié)果。
[0101]本發(fā)明實施例所提供的翻譯方法,能夠根據(jù)基本詞詞庫和查找機制對中文數(shù)據(jù)項進行翻譯,得到符合中文數(shù)據(jù)項語意的翻譯結(jié)果,準確度較高且符合領(lǐng)域內(nèi)相關(guān)人員的業(yè)務(wù)習慣。此外,通過分組的方式存儲基本詞,有利于更加快速的查找基本詞。
[0102]圖7是根據(jù)本發(fā)明實施例的一種翻譯裝置的匹配查找單元的方塊示意圖,參照圖
7,匹配查找單元64包括:
[0103]查找子單元641,用于從指針單元63當前訪問的基本詞詞組中查找最靠近待翻譯部分左側(cè)的基本詞作為最左基本詞。
[0104]第一判斷子單元642,用于判斷所述最左基本詞的長度是否小于3個中文字,如果小于,則確定所述最左基本詞具有獨立語意,否則觸發(fā)第二判斷子單元643。
[0105]第二判斷子單元643,用于根據(jù)所述最左基本詞及其在所述待翻譯部分中的前驅(qū)詞和后繼詞,判斷所述最左基本詞是否具有獨立語意。具體而言,第二判斷子單元643可以包括:構(gòu)成詞模塊,用于將所述待翻譯部分在所述最左基本詞之前的一個字與所述最左基本詞的開頭兩個字組合構(gòu)成第一構(gòu)成詞,將所述最左基本詞的結(jié)尾一個字與所述待翻譯部分在所述最左基本詞之后的一個字組合構(gòu)成第二構(gòu)成詞;判斷模塊,用于查找所述基本詞詞庫以判斷所述第一構(gòu)成詞和第二構(gòu)成詞是否屬于基本詞,如果均不屬于基本詞,則所述最左基本詞具有獨立語意;否則,不具備獨立語意。
[0106]其中,當所述第二判斷子單元643確定所述最左基本詞不具有獨立語意時,所述查找子單元641還用于在當前訪問的基本詞詞組中重新查找最左基本詞,并調(diào)用所述第一判斷子單元642和第二判斷子單元643,直至確定出所述匹配基本詞或直至確定不存在所述匹配基本詞。
[0107]顯然,匹配查找單元64通過重復調(diào)用查找子單元641、第一判斷子單元642和第二判斷子單元643能夠在指針單元63當前訪問的基本詞詞組中查找到匹配基本詞或確定不含匹配基本詞。
[0108]圖8是根據(jù)本發(fā)明實施例的一種翻譯裝置的方塊示意圖,參照圖8,翻譯裝置80除了包括輸入單元61、存儲單元62、指針單元63、匹配查找單元64、第一處理單元65、第二處理單元66和輸出單元67外,還包括保留字查找單元81。
[0109]在本實施例中,存儲單元62除了具有圖6所示實施例中的功能外,還用于存儲保留字清單,所述保留字清單用于保存已經(jīng)完成翻譯的數(shù)據(jù)項的翻譯結(jié)果。所述保留字查找單元81用于查找所述保留字清單,如果未命中所述數(shù)據(jù)項,則觸發(fā)所述指針單元63訪問所述基本詞詞庫中的基本詞詞組;如果命中所述數(shù)據(jù)項,則可以直接輸出所述數(shù)據(jù)項的翻譯結(jié)果。
[0110]圖9是根據(jù)本發(fā)明實施例的一種翻譯裝置的方塊示意圖,參照圖9,翻譯裝置90除了包括輸入單元61、存儲單元62、指針單元63、匹配查找單元64、第一處理單元65、第二處理單元66和輸出單元67外,還包括檢查單元91和第三處理單元92。其中,
[0111]檢查單元91,用于檢查輸出的翻譯結(jié)果是否包含未翻譯為英文的部分,如果包含,則將規(guī)范化標志置為否;否則,將所述規(guī)范化標志置為是;
[0112]第三處理單元92,用于根據(jù)所述規(guī)范化標志進行以下處理:如果所述規(guī)范化標志為是,則將輸出的翻譯結(jié)果保存在保留字清單,所述保留字清單用于保存已經(jīng)完成翻譯的數(shù)據(jù)項的翻譯結(jié)果;如果所述規(guī)范化標志為否,則提示修改所述數(shù)據(jù)項,或根據(jù)所述未翻譯為英文的部分在所述基本詞詞庫中增加基本詞。
[0113]本領(lǐng)域技術(shù)人員應(yīng)當理解,利用圖9所示實施例,不僅可以實現(xiàn)中文數(shù)據(jù)項的準確、快速的翻譯,還能有效地對整個翻譯系統(tǒng)進行維護。
[0114]圖10是根據(jù)本發(fā)明實施例的一種翻譯裝置的方塊示意圖,參照圖10,翻譯裝置100除了包括輸入單元61、存儲單元62、指針單元63、匹配查找單元64、第一處理單元65、第二處理單元66和輸出單元67外,還包括基本詞檢查單元101和/或類詞檢查單元102。
[0115]所述基本詞檢查單元101,用于檢查所述數(shù)據(jù)項是否由所述基本詞詞庫中的基本詞構(gòu)成。此時,所述輸出單元67還用于在所述數(shù)據(jù)項不是由基本詞構(gòu)成的時候,輸出所述數(shù)據(jù)項中未包含在所述基本詞詞庫中的內(nèi)容,以更新所述基本詞詞庫或修改所述數(shù)據(jù)項(該動作可以發(fā)生在指針單元63訪問基本詞詞組之前或發(fā)生在輸出單元67輸出翻譯結(jié)果之后)。
[0116]所述類詞檢查單元102,用于根據(jù)類詞清單檢查所述數(shù)據(jù)項是否以類詞結(jié)尾。此時,所述存儲單元62還存儲有類詞清單,所述類詞清單保存有各種用于表示數(shù)據(jù)項屬性的類詞。所述輸出單元67還用于在所述數(shù)據(jù)項不是以類詞結(jié)尾時,輸出所述數(shù)據(jù)項,以更新所述類詞清單或修改所述數(shù)據(jù)項(該動作可以發(fā)生在指針單元63訪問基本詞詞組之前或發(fā)生在輸出單兀67輸出翻譯結(jié)果之后)。
[0117]在根據(jù)本發(fā)明的另一種實施例中(未圖示),翻譯裝置除了可以包括圖6至圖10所示實施例中的各個單元外,還可以包括縮寫單元,用于從縮寫詞庫中查找由輸出單元67輸出的翻譯結(jié)果中各個英文詞匯的縮寫詞,組成所述數(shù)據(jù)項的英文縮寫詞匯,以及在翻譯結(jié)果中存在所述縮寫詞庫中沒有的英文詞匯時,按照預設(shè)的縮寫規(guī)則確定該英文詞匯的縮寫詞。在這種情況下,存儲單元62還用于存儲所述縮寫詞庫,輸出單元67還用于輸出所述數(shù)據(jù)項的英文縮寫詞匯。
[0118]本發(fā)明所提供的各種方法、裝置實施例適用于專業(yè)領(lǐng)域的詞匯和短語的翻譯和規(guī)范化操作,翻譯具有針對性且準確率高(準確率一般在95%以上)。此外,對本發(fā)明所提供的方法和裝置進行維護的成本與時間成反比,這是因為詞庫的基本詞被復用的越來越多,所以越往后需要添加的基本詞越少,例如,在基本詞詞庫中的基本詞達到一定量之后,當新增數(shù)百個數(shù)據(jù)項時,只需要在基本詞詞庫中添加數(shù)個基本詞即可。當基本詞趨于飽和后,工作重點在于規(guī)范化檢查的修改操作而不是基本詞的新增操作。
[0119]通過以上的實施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借助軟件結(jié)合硬件平臺的方式來實現(xiàn),當然也可以全部通過硬件來實施?;谶@樣的理解,本發(fā)明的技術(shù)方案對【背景技術(shù)】做出貢獻的全部或者部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品可以存儲在存儲介質(zhì)中,如R0M/RAM、磁碟、光盤等,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機,服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例或者實施例的某些部分所述的方法。
[0120]以上所揭露的僅為本發(fā)明的優(yōu)選實施例而已,當然不能以此來限定本發(fā)明的保護范圍,因此依本發(fā)明權(quán)利要求的教導對上述實施例所作的等同變化,仍屬于本發(fā)明權(quán)利要求所涵蓋的范圍內(nèi)。
【權(quán)利要求】
1.一種翻譯方法,其特征在于,包括: 輸入數(shù)據(jù)項; 移動訪問指針以按照基本詞長度從大到小的順序訪問基本詞詞庫中的基本詞詞組,其中,所述基本詞詞庫按照基本詞長度分組存儲有基本詞及對應(yīng)英文詞匯,相同長度的基本詞屬于同一基本詞詞組; 操作a:在當前訪問的基本詞詞組中查找所述數(shù)據(jù)項的待翻譯部分中具有獨立語意且最靠近所述待翻譯部分左側(cè)的基本詞作為匹配基本詞,如果查找到所述匹配基本詞,則執(zhí)行操作b,否則執(zhí)行操作C,所述待翻譯部分是所述數(shù)據(jù)項中未翻譯為英文的部分; 操作b:將所述數(shù)據(jù)項中對應(yīng)所述匹配基本詞的內(nèi)容翻譯為英文并更新所述待翻譯部分,然后判斷所述數(shù)據(jù)項中是否還包含未翻譯為英文的部分,如果包含,則執(zhí)行操作a ;如果不包含,則輸出翻譯結(jié)果; 操作c:判斷當前訪問的基本詞詞組是否是最小長度的基本詞詞組,如果是,則輸出翻譯結(jié)果;如果不是,則移動訪問指針至下一基本詞詞組并執(zhí)行操作a。
2.如權(quán)利要求1所述的方法,其特征在于,在當前訪問的基本詞詞組中查找所述數(shù)據(jù)項的待翻譯部分中具有獨立語意且最靠近所述待翻譯部分左側(cè)的基本詞作為匹配基本詞,包括: 查找最靠近所述待翻譯部分左側(cè)的基本詞作為最左基本詞,并根據(jù)以下判斷確定所述最左基本詞是否具有獨立語意: 如果所述最左基本詞的長度小于3個中文字,則具有獨立語意; 如果所述最左基本詞的長度大于或等于3個中文字,則根據(jù)所述最左基本詞及其在所述待翻譯部分中的前驅(qū)詞和后繼詞,判斷所述最左基本詞是否具有獨立語意;其中, 當確定所述最左基本詞不具有獨立語意時,在當前訪問的基本詞詞組中重新查找最左基本詞并判斷是否具有獨立語意,直至確定出所述匹配基本詞或直至確定不存在所述匹配基本詞。
3.如權(quán)利要求2所述的方法,其特征在于,根據(jù)所述最左基本詞及其在所述待翻譯部分中的前驅(qū)詞和后繼詞,判斷所述最左基本詞是否具有獨立語意,包括: 將所述待翻譯部分在所述最左基本詞之前的一個字與所述最左基本詞的開頭兩個字組合構(gòu)成第一構(gòu)成詞,將所述最左基本詞的結(jié)尾一個字與所述待翻譯部分在所述最左基本詞之后的一個字組合構(gòu)成第二構(gòu)成詞,判斷所述第一構(gòu)成詞和第二構(gòu)成詞是否均不屬于基本詞,如果均不屬于基本詞,則所述最左基本詞具有獨立語意;否則,不具備獨立語意。
4.如權(quán)利要求1-3中任一項所述的方法,其特征在于,在輸入所述數(shù)據(jù)項之后,所述方法還包括: 查找保留字清單,如果未命中所述數(shù)據(jù)項,則移動所述訪問指針以訪問所述基本詞詞庫中的基本詞詞組,其中,所述保留字清單用于保存已經(jīng)完成翻譯的數(shù)據(jù)項的翻譯結(jié)果。
5.如權(quán)利要求1-3中任一項所述的方法,其特征在于,在輸出翻譯結(jié)果后,所述方法還包括: 對輸出的翻譯結(jié)果進行規(guī)范化檢查,包括: 檢查輸出的翻譯結(jié)果是否包含未翻譯為英文的部分,如果包含,則將規(guī)范化標志置為否;否則,將所述規(guī)范化標志置為是;根據(jù)所述規(guī)范化標志進行以下處理:如果所述規(guī)范化標志為是,則將輸出的翻譯結(jié)果保存在保留字清單,所述保留字清單用于保存已經(jīng)完成翻譯的數(shù)據(jù)項的翻譯結(jié)果;如果所述規(guī)范化標志為否,則提示修改所述數(shù)據(jù)項,或根據(jù)所述未翻譯為英文的部分在所述基本詞詞庫中增加基本詞。
6.如權(quán)利要求1-3中任一項所述的方法,其特征在于,在輸入所述數(shù)據(jù)項之后,所述方法還包括: 檢查所述數(shù)據(jù)項是否由所述基本詞詞庫中的基本詞構(gòu)成,如果不是,則輸出所述數(shù)據(jù)項中未包含在所述基本詞詞庫中的內(nèi)容,以更新所述基本詞詞庫或修改所述數(shù)據(jù)項; 根據(jù)類詞清單檢查所述數(shù)據(jù)項是否以類詞結(jié)尾,如果不是,則輸出所述數(shù)據(jù)項,以更新所述類詞清單或修改所述數(shù)據(jù)項,其中,所述類詞清單保存有各種用于表示數(shù)據(jù)項屬性的類詞。
7.如權(quán)利要求1-3中任一項所述的方法,其特征在于,在輸出翻譯結(jié)果的同時,所述方法還包括: 從縮寫詞庫中查找翻譯結(jié)果中各個英文詞匯的縮寫詞,組成所述數(shù)據(jù)項的英文縮寫詞匯并輸出,其中,如果翻譯結(jié)果中存在所述縮寫詞庫中沒有的英文詞匯,則按照預設(shè)的縮寫規(guī)則確定該英文詞匯的縮寫詞。
8.一種翻譯裝置,其特征在于,包括: 輸入單元,用于輸入數(shù)據(jù)項; 存儲單元,用于存儲基本詞詞庫,所述基本詞詞庫按照基本詞長度分組存儲有基本詞及對應(yīng)英文詞匯,相同長度的基本詞屬于同一基本詞詞組; 指針單元,用于移動訪問指針以按照基本詞長度從大到小的順序訪問基本詞詞庫中的基本詞詞組; 匹配查找單元,用于在所述指針單元當前訪問的基本詞詞組中查找所述數(shù)據(jù)項的待翻譯部分中具有獨立語意且最靠近所述待翻譯部分左側(cè)的基本詞作為匹配基本詞,如果查找到所述匹配基本詞,則觸發(fā)第一處理單元,否則觸發(fā)第二處理單元,其中,所述待翻譯部分是所述數(shù)據(jù)項中未翻譯為英文的部分; 第一處理單元,用于將所述數(shù)據(jù)項中對應(yīng)所述匹配基本詞的內(nèi)容翻譯為英文并更新所述待翻譯部分,之后判斷所述數(shù)據(jù)項中是否還包含未翻譯為英文的部分,如果包含,則觸發(fā)所述匹配查找單元;如果不包含,則觸發(fā)輸出單元; 第二處理單元,用于判斷當前訪問的基本詞詞組是否是最小長度的基本詞詞組,如果是,則觸發(fā)輸出單元;如果不是,則觸發(fā)所述指針單元將訪問指針移動至下一基本詞詞組,然后觸發(fā)所述匹配查找單元; 輸出單兀,用于輸出翻譯結(jié)果。
9.如權(quán)利要求8所述的裝置,其特征在于,所述匹配查找單元包括: 查找子單元,用于從所述指針單元當前訪問的基本詞詞組中查找最靠近所述待翻譯部分左側(cè)的基本詞作為最左基本詞; 第一判斷子單元,用于判斷所述最左基本詞的長度是否小于3個中文字,如果小于,則確定所述最左基本詞具有獨立語意,否則觸發(fā)第二判斷子單元; 第二判斷子單元,用于根據(jù)所述最左基本詞及其在所述待翻譯部分中的前驅(qū)詞和后繼詞,判斷所述最左基本詞是否具有獨立語意; 其中,當所述第二判斷子單元確定所述最左基本詞不具有獨立語意時,所述查找子單元還用于在當前訪問的基本詞詞組中重新查找最左基本詞,并調(diào)用所述第一判斷子單元和第二判斷子單元,直至確定出所述匹配基本詞或直至確定不存在所述匹配基本詞。
10.如權(quán)利要求9所述的裝置,其特征在于,所述第二判斷子單元包括: 構(gòu)成詞模塊,用于將所述待翻譯部分在所述最左基本詞之前的一個字與所述最左基本詞的開頭兩個字組合構(gòu)成第一構(gòu)成詞,將所述最左基本詞的結(jié)尾一個字與所述待翻譯部分在所述最左基本詞之后的一個字組合構(gòu)成第二構(gòu)成詞; 判斷模塊,用于查找所述基本詞詞庫以判斷所述第一構(gòu)成詞和第二構(gòu)成詞是否屬于基本詞,如果均不屬于基本詞,則所述最左基本詞具有獨立語意;否則,不具備獨立語意。
11.如權(quán)利要求8-10中任一項所述的裝置,其特征在于, 所述存儲單元還存儲有保留字清單,所述保留字清單用于保存已經(jīng)完成翻譯的數(shù)據(jù)項的翻譯結(jié)果; 所述裝置還包括 保留字查找單元,用于查找所述保留字清單,如果未命中所述數(shù)據(jù)項,則觸發(fā)所述指針單元訪問所述基本詞詞庫中的基本詞詞組。
12.如權(quán)利要求8-10中任一項所述的裝置,其特征在于,所述裝置還包括: 檢查單元,用于檢查輸出的翻譯結(jié)果是否包含未翻譯為英文的部分,如果包含,則將規(guī)范化標志置為否;否則,將所述規(guī)范化標志置為是; 第三處理單元,用于根據(jù)所述規(guī)范化標志進行以下處理:如果所述規(guī)范化標志為是,則將輸出的翻譯結(jié)果保存在保留字清單,所述保留字清單用于保存已經(jīng)完成翻譯的數(shù)據(jù)項的翻譯結(jié)果;如果所述規(guī)范化標志為否,則提示修改所述數(shù)據(jù)項,或根據(jù)所述未翻譯為英文的部分在所述基本詞詞庫中增加基本詞。
13.如權(quán)利要求8-10中任一項所述的裝置,其特征在于, 所述裝置還包括基本詞檢查單元,用于檢查所述數(shù)據(jù)項是否由所述基本詞詞庫中的基本詞構(gòu)成; 所述輸出單元還用于,在所述數(shù)據(jù)項不是由基本詞構(gòu)成的時候,輸出所述數(shù)據(jù)項中未包含在所述基本詞詞庫中的內(nèi)容,以更新所述基本詞詞庫或修改所述數(shù)據(jù)項。
14.如權(quán)利要求8-10中任一項所述的裝置,其特征在于, 所述存儲單元還存儲有類詞清單,所述類詞清單保存有各種用于表示數(shù)據(jù)項屬性的類詞; 所述裝置還包括類詞檢查單元,用于根據(jù)所述類詞清單檢查所述數(shù)據(jù)項是否以類詞結(jié)尾; 所述輸出單元還用于在所述數(shù)據(jù)項不是以類詞結(jié)尾時,輸出所述數(shù)據(jù)項,以更新所述類詞清單或修改所述數(shù)據(jù)項。
15.如權(quán)利要求8-10中任一項所述的裝置,其特征在于, 所述存儲單元還存儲有縮寫詞庫; 所述裝置還包括縮寫單元,用于從所述縮寫詞庫中查找翻譯結(jié)果中各個英文詞匯的縮寫詞,組成所述數(shù)據(jù)項的英文縮寫詞匯,以及在翻譯結(jié)果中存在所述縮寫詞庫中沒有的英文詞匯時,按照預設(shè)的縮寫規(guī)則確定該英文詞匯的縮寫詞;所述輸出單元還 用于輸出所述數(shù)據(jù)項的英文縮寫詞匯。
【文檔編號】G06F17/30GK103793378SQ201410024861
【公開日】2014年5月14日 申請日期:2014年1月20日 優(yōu)先權(quán)日:2014年1月20日
【發(fā)明者】程大慶, 車春雷, 張春銳, 趙亞敏, 孫霆, 田豐, 李明, 曲明 申請人:中國建設(shè)銀行股份有限公司