一種語料檢索匹配方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明所屬技術(shù)領(lǐng)域為自然語言處理、信息檢索,尤其涉及一種語料檢索匹配方法。
【背景技術(shù)】
[0002]隨著翻譯技術(shù)的飛速發(fā)展,各種各樣的翻譯系統(tǒng)隨處可見,各種各樣的術(shù)語語料庫也種類繁多、參差不齊,隨著術(shù)語語料庫中術(shù)語語料數(shù)量的幾何式增長,現(xiàn)在都達(dá)到千萬級,甚至是億級了,搜索起來速度慢,而且返回搜索結(jié)果多,很難查詢到譯員真正想查的術(shù)語語料。迫切需要一種對術(shù)語語料的搜索排序方法,來加快譯員對術(shù)語語料的搜索速度,甚至根據(jù)譯員經(jīng)常使用的術(shù)語語料庫、行業(yè)、語種,對譯員進(jìn)行術(shù)語語料的推薦,達(dá)到譯員快速搜索的目的,以加快譯員的翻譯速度和效率。
【發(fā)明內(nèi)容】
[0003]本方法優(yōu)化術(shù)語語料搜索排名的方法,通過登錄譯員在翻譯過程中對術(shù)語語料的匹配次數(shù)、搜索次數(shù)、使用次數(shù)、修改次數(shù)等活躍度因子進(jìn)行統(tǒng)計和記錄,使譯員在翻譯過程中使用術(shù)語語料庫時,系統(tǒng)能自動根據(jù)這些活躍度因子對術(shù)語語料的搜索結(jié)果進(jìn)行排序,已達(dá)到譯員在翻譯過程中迅速搜索到想要的術(shù)語語料。
[0004]為解決上述技術(shù)問題,本發(fā)明提供一種語料檢索匹配方法,包括如下步驟:
[0005]I)導(dǎo)入文檔,在若干個語料庫中進(jìn)行術(shù)語語料檢索,進(jìn)行語料匹配,并記錄匹配次數(shù);
[0006]2)查詢術(shù)語語料,并記錄查詢次數(shù),記錄;
[0007]3)使用術(shù)語語料,記錄術(shù)語語料使用次數(shù);
[0008]所述語料與所在的語料庫進(jìn)行關(guān)聯(lián)顯示。
[0009]優(yōu)選地,所述語料匹配的方法是將語料的檢索結(jié)果根據(jù)語料的活躍度排序,并降序顯示,所述語料的活躍度是對語料的匹配次數(shù)、查詢次數(shù)、使用次數(shù)作為因子進(jìn)行統(tǒng)計得出的統(tǒng)計結(jié)果。
[0010]優(yōu)選地,所述語料匹配的方法將語料的檢索結(jié)果根據(jù)語料庫的活躍度排序,并降序顯示,所述語料庫的活躍度是對語料庫中所有語料的活躍度進(jìn)行加權(quán)得出。
[0011]優(yōu)選地,所述語料匹配的方法將語料的檢索結(jié)果根據(jù)術(shù)語語料的使用次數(shù)排序,并降序顯示。
[0012]優(yōu)選地,所述使用術(shù)語語料包括完全使用語料,所述完全使用語料的步驟是判定所述查詢的術(shù)語語料完全正確,無需修改,則標(biāo)記并完全使用。
[0013]優(yōu)選地,所述使用術(shù)語語料包括編輯使用語料,所述編輯使用語料的步驟是判定所述查詢的術(shù)語語料部分有誤,需要修改編輯,則標(biāo)記并進(jìn)行修改編輯保存。
[0014]優(yōu)選地,所述編輯使用語料的步驟還包括保存所述編輯使用語料的歷史版本和修改記錄。
[0015]本發(fā)明的有益效果是:
[0016]I)在譯員翻譯過程中,對術(shù)語語料的匹配次數(shù)、搜索次數(shù)、使用次數(shù)、修改次數(shù)等活躍度因子進(jìn)行統(tǒng)計,進(jìn)而統(tǒng)計術(shù)語語料的活躍度。
[0017]2)搜索中根據(jù)術(shù)語語料的活躍度對搜索結(jié)果進(jìn)行排序,活躍度越高排名越靠前,使譯員能迅速找到經(jīng)常在使用的術(shù)語語料。
[0018]3)加快了譯員在翻譯中查詢術(shù)語語料的速度。
[0019]4)記錄譯員使用庫的頻率,優(yōu)先向譯員推薦該庫,及該庫中術(shù)語語料。
[0020]5)記錄譯員使用、查詢、修改的術(shù)語語料,優(yōu)先向譯員推薦這些術(shù)語語料。
[0021]6)譯員在翻譯中可以對有誤的術(shù)語語料進(jìn)行修改。
【附圖說明】
[0022]此處所說明的附圖用來提供對本發(fā)明的進(jìn)一步理解,構(gòu)成本申請的一部分,本發(fā)明的示意性實施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當(dāng)限定,在附圖中:
[0023]圖1為本發(fā)明的一種步驟示意圖;
[0024]圖2為本發(fā)明的另一種步驟示意圖。
【具體實施方式】
[0025]下面結(jié)合附圖和【具體實施方式】對本發(fā)明的技術(shù)方案作進(jìn)一步具體說明。
[0026]如圖1所示,本發(fā)明提供一種語料檢索匹配方法,包括如下步驟:
[0027]I)導(dǎo)入文檔,在若干個語料庫中進(jìn)行術(shù)語語料檢索,進(jìn)行語料匹配,并記錄匹配次數(shù);
[0028]2)查詢術(shù)語語料,并記錄查詢次數(shù),記錄;
[0029]3)使用術(shù)語語料,記錄術(shù)語語料使用次數(shù);
[0030]所述語料與所在的語料庫進(jìn)行關(guān)聯(lián)顯示。
[0031]優(yōu)選地,所述語料匹配的方法是將語料的檢索結(jié)果根據(jù)語料的活躍度排序,并降序顯示,所述語料的活躍度是對語料的匹配次數(shù)、查詢次數(shù)、使用次數(shù)作為因子進(jìn)行統(tǒng)計得出的統(tǒng)計結(jié)果。
[0032]優(yōu)選地,所述語料匹配的方法將語料的檢索結(jié)果根據(jù)語料庫的活躍度排序,并降序顯示,所述語料庫的活躍度是對語料庫中所有語料的活躍度進(jìn)行加權(quán)得出。
[0033]優(yōu)選地,所述語料匹配的方法將語料的檢索結(jié)果根據(jù)術(shù)語語料的使用次數(shù)排序,并降序顯示。
[0034]優(yōu)選地,所述使用術(shù)語語料包括完全使用語料,所述完全使用語料的步驟是判定所述查詢的術(shù)語語料完全正確,無需修改,則標(biāo)記并完全使用。
[0035]優(yōu)選地,所述使用術(shù)語語料包括編輯使用語料,所述編輯使用語料的步驟是判定所述查詢的術(shù)語語料部分有誤,需要修改編輯,則標(biāo)記并進(jìn)行修改編輯保存。
[0036]優(yōu)選地,所述編輯使用語料的步驟還包括保存所述編輯使用語料的歷史版本和修改記錄。
[0037]如圖2所示,一種語料檢索匹配方法,步驟如下:
[0038]1.導(dǎo)入文檔
[0039]a)譯員登錄系統(tǒng);
[0040]b)導(dǎo)入需要翻譯的文檔。
[0041 ]2.術(shù)語語料匹配
[0042]a)系統(tǒng)自動對導(dǎo)入的文檔進(jìn)行術(shù)語語料匹配;
[0043]b)如果術(shù)語語料被匹配上,在術(shù)語語料庫中對該條術(shù)語語料的匹配次數(shù)加I;
[0044]c)向譯員顯示已經(jīng)匹配上的術(shù)語語料;
[0045]d)譯員根據(jù)匹配上的術(shù)語語料對文檔進(jìn)行翻譯。
[0046]3.譯員翻譯過程中搜索次數(shù)的統(tǒng)計
[0047]a)譯員翻譯時需要在系統(tǒng)主動去查詢術(shù)語語料;
[0048]b)每查詢一次,該術(shù)語語料的查詢次數(shù)加I。
[0049]4.譯員翻譯過程中完全使用次數(shù)的統(tǒng)計
[0050]a)譯員翻譯時,判定該術(shù)語語料的匹配完全正確,無需修改;
[0051]b)通過譯員對該術(shù)語語料的標(biāo)記,該術(shù)語語料的使用次數(shù)加I。
[0052]5.譯員翻譯過程中修改次數(shù)的統(tǒng)計
[0053]a)譯員翻譯時,判定該術(shù)語語料本身的翻譯有誤,譯員可對術(shù)語語料進(jìn)行修改;
[0054]b)修改保存時,該術(shù)語語料的修改次數(shù)加I;
[0055]c)并保存該術(shù)語語料的歷史版本和修改記錄。
[0056]6.術(shù)語語料的活躍度統(tǒng)計
[0057]a)術(shù)語語料的匹配次數(shù)、搜索次數(shù)、使用次數(shù)、修改次數(shù)統(tǒng)稱為該術(shù)語語料的活躍度因子;
[0058]b)對術(shù)語語料的這四項活躍度因子的統(tǒng)計結(jié)果,稱為該術(shù)語語料的活躍度。
[0059]7.術(shù)語語料的的搜索排序
[0060]a)譯員對術(shù)語語料的搜索結(jié)果按活躍度排序,活躍度越高排序越靠前。
[0061]8.統(tǒng)計用戶在翻譯中對庫使用次數(shù)
[0062]a)從用戶在翻譯過程中對某庫中術(shù)語語料的匹配次數(shù)、搜索次數(shù)、使用次數(shù)、修改次數(shù),統(tǒng)計該用戶對庫的使用次數(shù);
[0063]b)用戶在下次翻譯中首先推薦該庫和該庫中的術(shù)語語料。
[0064 ]9.記錄用戶使用、查詢、修改的術(shù)語語料
[0065]a)譯員翻譯完成后,記錄該譯員使用、查詢、修改的術(shù)語語料;
[0066]b)用戶在下次翻譯中優(yōu)先推薦這些術(shù)語語料。
[0067]最后所應(yīng)說明的是,以上【具體實施方式】僅用以說明本發(fā)明的技術(shù)方案而非限制,盡管參照較佳實施例對本發(fā)明進(jìn)行了詳細(xì)說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解,可以對本發(fā)明的技術(shù)方案進(jìn)行修改或者等同替換,而不脫離本發(fā)明技術(shù)方案的精神和范圍,其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求范圍當(dāng)中。
【主權(quán)項】
1.一種語料檢索匹配方法,包括如下步驟: 1)導(dǎo)入文檔,在若干個語料庫中進(jìn)行術(shù)語語料檢索,進(jìn)行語料匹配,并記錄匹配次數(shù); 2)查詢術(shù)語語料,并記錄查詢次數(shù),記錄; 3)使用術(shù)語語料,記錄術(shù)語語料使用次數(shù); 所述語料與所在的語料庫進(jìn)行關(guān)聯(lián)顯示。2.根據(jù)權(quán)利要求1所述的一種語料檢索匹配方法,其特征是:所述語料匹配的方法是將語料的檢索結(jié)果根據(jù)語料的活躍度排序,并降序顯示,所述語料的活躍度是對語料的匹配次數(shù)、查詢次數(shù)、使用次數(shù)作為因子進(jìn)行統(tǒng)計得出的統(tǒng)計結(jié)果。3.根據(jù)權(quán)利要求1、2所述的一種語料檢索匹配方法,其特征是:所述語料匹配的方法將語料的檢索結(jié)果根據(jù)語料庫的活躍度排序,并降序顯示,所述語料庫的活躍度是對語料庫中所有語料的活躍度進(jìn)行加權(quán)得出。4.根據(jù)權(quán)利要求1所述的一種語料檢索匹配方法,其特征是:所述語料匹配的方法將語料的檢索結(jié)果根據(jù)術(shù)語語料的使用次數(shù)排序,并降序顯示。5.根據(jù)權(quán)利要求1所述的一種語料檢索匹配方法,其特征是:所述使用術(shù)語語料包括完全使用語料,所述完全使用語料的步驟是判定所述查詢的術(shù)語語料完全正確,無需修改,則標(biāo)記并完全使用。6.根據(jù)權(quán)利要求1所述的一種語料檢索匹配方法,其特征是:所述使用術(shù)語語料包括編輯使用語料,所述編輯使用語料的步驟是判定所述查詢的術(shù)語語料部分有誤,需要修改編輯,則標(biāo)記并進(jìn)行修改編輯保存。7.根據(jù)權(quán)利要求6所述的一種語料檢索匹配方法,其特征是:所述編輯使用語料的步驟還包括保存所述編輯使用語料的歷史版本和修改記錄。
【專利摘要】本發(fā)明提供一種語料檢索匹配方法,包括如下步驟:1)導(dǎo)入文檔,在若干個語料庫中進(jìn)行術(shù)語語料檢索,進(jìn)行語料匹配,并記錄匹配次數(shù);2)查詢術(shù)語語料,并記錄查詢次數(shù),記錄;3)使用術(shù)語語料,記錄術(shù)語語料使用次數(shù);所述語料與所在的語料庫進(jìn)行關(guān)聯(lián)顯示。本發(fā)明能匹配效率和精準(zhǔn)度,減少檢索過程所需要的時間。
【IPC分類】G06F17/28, G06F17/30
【公開號】CN105677706
【申請?zhí)枴緾N201510999938
【發(fā)明人】張光凌
【申請人】武漢傳神信息技術(shù)有限公司
【公開日】2016年6月15日
【申請日】2015年12月28日