一種構(gòu)建多語言網(wǎng)站實時翻譯的方法

文檔序號：8943049閱讀：404來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種構(gòu)建多語言網(wǎng)站實時翻譯的方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)信息技術(shù)領(lǐng)域，具體涉及一種構(gòu)建多語言網(wǎng)站實時翻譯的方法。
【背景技術(shù)】
[0002]隨著國際化進(jìn)程的不斷加快，機器翻譯或機器輔助在線翻譯已經(jīng)公開了極多技術(shù)，多語言網(wǎng)站在互聯(lián)網(wǎng)中的地位日漸突出，伴隨而來的是海量數(shù)據(jù)實時翻譯的問題，當(dāng)前多語言網(wǎng)站實時翻譯大多采用將數(shù)據(jù)均分到不同的翻譯機進(jìn)行翻譯的方法。此方法在高并發(fā)、數(shù)據(jù)量大的情況下，翻譯延遲現(xiàn)象比較嚴(yán)重，原因主要有兩方面:一是數(shù)據(jù)方面，由于多語言混雜，翻譯機需要頻繁切換語言接口；二是翻譯機本身翻譯速度不同，易發(fā)生木桶短板效應(yīng)。

【發(fā)明內(nèi)容】

[0003]為了解決現(xiàn)有的問題，本發(fā)明目的是，提出一種多語言網(wǎng)站實時翻譯的方法，旨在實現(xiàn)高并發(fā)、數(shù)據(jù)量大的情況下的多語言網(wǎng)站實時翻譯。
[0004]本發(fā)明技術(shù)方案是:一種多語言網(wǎng)站實時翻譯的方法，通過組建翻譯集群、劃分待翻譯數(shù)據(jù)塊和數(shù)據(jù)塊翻譯進(jìn)行高并發(fā)、數(shù)據(jù)量大情況下的多語言網(wǎng)站實時翻譯；
[0005]I)組建翻譯集群方法，具體步驟如下:
[0006]步驟一、所有集群內(nèi)的翻譯機按名稱排序，便于監(jiān)測其狀態(tài)及出現(xiàn)問題時的排查；
[0007]步驟二、按照一定規(guī)則，抽取一定數(shù)量的翻譯機，形成調(diào)度翻譯集群；
[0008]步驟三、剩余的翻譯機，按待翻譯的語言種類平均分配，形成多個有語言種類特色的獨立翻譯集群，若為各個獨立翻譯集群平均分配整數(shù)臺翻譯機后有剩下的余數(shù)，再逐個分配，各個語言種類的獨立翻譯集群的翻譯機數(shù)量差不超過一臺；
[0009]2)劃分待翻譯數(shù)據(jù)塊方法，具體步驟如下:
[0010]步驟一、將所有待翻譯數(shù)據(jù)按待翻譯的語言種類劃分，形成不同語言種類的待翻譯數(shù)據(jù)集合；
[0011]步驟二、將各類語言種類的待翻譯數(shù)據(jù)集合，按對應(yīng)語言種類獨立翻譯集群的翻譯機數(shù)量動態(tài)平均分配，形成多個待翻譯數(shù)據(jù)塊；
[0012]3)數(shù)據(jù)塊翻譯方法，具體步驟如下:
[0013]步驟一、將待翻譯數(shù)據(jù)塊發(fā)送到對應(yīng)的獨立翻譯集群中的翻譯機翻譯；
[0014]步驟二、由于每個獨立翻譯集群的翻譯速度不盡相同，對待翻譯數(shù)據(jù)的處理速度不一樣，調(diào)度翻譯集群會協(xié)助翻譯速度最慢的那個獨立翻譯集群一起翻譯，待調(diào)度翻譯集群翻譯完成后，尋找下一個需要幫助的翻譯集群。
[0015]進(jìn)一步，將翻譯機按待翻譯的語言種類形成獨立翻譯集群，大大減少翻譯機切換語言的頻率，有效地減少翻譯機卡機、死機，翻譯錯位等問題。
[0016]2)中步驟二的翻譯機數(shù)量動態(tài)平均分配，具體如下，首先將各類語言的待翻譯數(shù)據(jù)量，按對應(yīng)語言獨立翻譯集群的翻譯機數(shù)量平均分配，若為各個翻譯機平均分配整數(shù)條數(shù)據(jù)后有剩下的余數(shù)，再逐條分配各個翻譯機，各個翻譯機的翻譯數(shù)據(jù)量差不超過一條；下一次翻譯數(shù)據(jù)分配前，統(tǒng)計獨立翻譯集群內(nèi)各翻譯機未翻譯完的數(shù)據(jù)量，再分配，使得每一次分配后，一個獨立翻譯集群內(nèi)的各個翻譯機的數(shù)據(jù)量差不超過一條，如此保證所有翻譯機的平均翻譯速度，提升獨立翻譯集群的整體翻譯速度。
[0017]調(diào)度翻譯集群判斷后協(xié)助翻譯速度最慢的那個獨立翻譯集群一起翻譯，調(diào)度翻譯集群在翻譯時采用翻譯機數(shù)量動態(tài)平均分配的方法，如此提升各個獨立翻譯集群的翻譯速度，使得在數(shù)據(jù)量大、高并發(fā)的情況下，各類語言網(wǎng)站的實時翻譯不阻塞。
[0018]本發(fā)明的有益效果，與現(xiàn)有技術(shù)相比，其顯著優(yōu)點為:
[0019](I)將翻譯機按待翻譯的語言種類形成獨立翻譯集群，不需頻繁切換語言接口，有效地減少翻譯機卡機、死機，翻譯錯位等問題。
[0020](2)按一個獨立翻譯集群內(nèi)的各翻譯機的翻譯速度，動態(tài)平均分配翻譯數(shù)據(jù)量，如此保證所有翻譯機的平均翻譯速度，提升獨立翻譯集群的整體翻譯速度。
[0021](3)設(shè)有調(diào)度翻譯集群，會協(xié)助翻譯速度最慢的那個獨立翻譯集群一起翻譯，如此提升各個獨立翻譯集群的翻譯速度，使得在數(shù)據(jù)量大、高并發(fā)的情況下，不易發(fā)生木桶短板效應(yīng)。
【附圖說明】
[0022]圖1為本發(fā)明實施例組建翻譯集群的示意圖。
[0023]圖2為本發(fā)明實施例劃分待翻譯數(shù)據(jù)塊的示意圖。
[0024]圖3為本發(fā)明實施例數(shù)據(jù)塊翻譯的示意圖。
【具體實施方式】
[0025]為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚，下面結(jié)合附圖和具體實施例對本發(fā)明進(jìn)行詳細(xì)描述。
[0026]如圖1所示，為本發(fā)明實施例組建翻譯集群的示意圖，具體為:
[0027]步驟一、所有翻譯機按名稱排序，便于監(jiān)測其狀態(tài)及出現(xiàn)問題時的排查。本實施例假設(shè)名稱為翻譯機的IP。
[0028]步驟二、按照一定規(guī)則，抽取一定數(shù)量的翻譯機，形成調(diào)度翻譯集群。本實施例假設(shè)數(shù)量為X臺翻譯機。X可為語言種類的數(shù)量的1-3倍。
[0029]步驟三、剩余的翻譯機，按待翻譯的語言種類平均分配，形成多個有語言特色的獨立翻譯集群，若為各個獨立翻譯集群平均分配整數(shù)臺翻譯機后有剩下的余數(shù)，再逐個分配，各個獨立翻譯集群的翻譯機數(shù)量差不超過一臺。本實施例假設(shè)待翻譯的語言種類為N類，各個獨立翻譯集群分配到的翻譯機數(shù)量為Y臺或Z臺，則Y = Z或Y - Z = I。
[0030]如圖2所示，為本發(fā)明實施例劃分待翻譯數(shù)據(jù)塊的示意圖，具體為:
[0031]步驟一、將所有待翻譯數(shù)據(jù)按待翻譯的語言種類劃分，形成不同種類語言的待翻譯數(shù)據(jù)集合。本實施例假設(shè)待翻譯的語言種類為N類。
[0032]步驟二、將各類語言的待翻譯數(shù)據(jù)集合，按對應(yīng)語言獨立翻譯集群的翻譯機數(shù)量動態(tài)平均分配，形成多個待翻譯數(shù)據(jù)塊；
[0033]步驟二的動態(tài)平均分配具體為首先將各類語言的待翻譯數(shù)據(jù)量，按對應(yīng)語言獨立翻譯集群的翻譯機數(shù)量平均分配，若為各個翻譯機平均分配整數(shù)條數(shù)據(jù)量后有剩下的余數(shù)，再逐條分配，各個翻譯機的數(shù)據(jù)量差不超過一條；下一次分配前，統(tǒng)計獨立翻譯集群內(nèi)各翻譯機未翻譯完的數(shù)據(jù)量，再分配，使得每一次分配后，一個獨立翻譯集群內(nèi)的各個翻譯機的數(shù)據(jù)量差不超過一條。本實施例將各類語言的待翻譯數(shù)據(jù)集合，按對應(yīng)語言獨立翻譯集群的翻譯機數(shù)量(Y臺或Z臺，且Y = Z或Y-Z = I)動態(tài)平均分配，使得每一次分配后，一個獨立翻譯集群內(nèi)的各個翻譯機的數(shù)據(jù)量差不超過一條。
[0034]如圖3所示，為本發(fā)明實施例數(shù)據(jù)塊翻譯的示意圖，具體為:
[0035]步驟一、將待翻譯數(shù)據(jù)塊發(fā)送到對應(yīng)的獨立翻譯集群中的翻譯機翻譯。
[0036]步驟二、由于每個獨立翻譯集群的翻譯速度不盡相同，對待翻譯數(shù)據(jù)的處理速度不一樣，調(diào)度翻譯集群會協(xié)助翻譯速度最慢的那個獨立翻譯集群一起翻譯，待翻譯完成后，尋找下一個需要幫助的翻譯集群。本實例假設(shè)當(dāng)前防疫速度最慢的獨立翻譯集群為法語翻譯集群。調(diào)度翻譯集群在翻譯時亦參照翻譯機數(shù)量動態(tài)平均分配的方法。如此保證所有翻譯機的平均翻譯速度，提升獨立翻譯集群的整體翻譯速度。
[0037]以上所述僅為本發(fā)明專利的實施例而已，并不用以限制本發(fā)明專利，凡在本發(fā)明專利的精神和原則之內(nèi)所做的任何修改、等同替換和改進(jìn)等，均以包含在本發(fā)明專利的保護范圍之內(nèi)。
【主權(quán)項】
1.一種多語言網(wǎng)站實時翻譯的方法，其特征在于通過組建翻譯集群、劃分待翻譯數(shù)據(jù)塊和數(shù)據(jù)塊翻譯進(jìn)行高并發(fā)、數(shù)據(jù)量大情況下的多語言網(wǎng)站實時翻譯； 1)組建翻譯集群方法，具體步驟如下: 步驟一、所有集群內(nèi)的翻譯機按名稱排序，便于監(jiān)測其狀態(tài)及出現(xiàn)問題時的排查；步驟二、按照一定規(guī)則，抽取一定數(shù)量的翻譯機，形成調(diào)度翻譯集群；步驟三、剩余的翻譯機，按待翻譯的語言種類平均分配，形成多個有語言種類特色的獨立翻譯集群，若為各個獨立翻譯集群平均分配整數(shù)臺翻譯機后有剩下的余數(shù)，再逐個分配，各個語言種類的獨立翻譯集群的翻譯機數(shù)量差不超過一臺；語言獨立翻譯集群的翻譯機 2)劃分待翻譯數(shù)據(jù)塊方法，具體步驟如下: 步驟一、將所有待翻譯數(shù)據(jù)按待翻譯的語言種類劃分，形成不同語言種類的待翻譯數(shù)據(jù)集合；步驟二、將各類語言種類的待翻譯數(shù)據(jù)集合，按對應(yīng)語言種類獨立翻譯集群的翻譯機數(shù)量動態(tài)平均分配，形成多個待翻譯數(shù)據(jù)塊； 3)數(shù)據(jù)塊翻譯方法，具體步驟如下: 步驟一、將待翻譯數(shù)據(jù)塊發(fā)送到對應(yīng)的獨立翻譯集群中的翻譯機翻譯；步驟二、由于每個獨立翻譯集群的翻譯速度不盡相同，對待翻譯數(shù)據(jù)的處理速度不一樣，調(diào)度翻譯集群判斷后協(xié)助翻譯速度最慢的那個獨立翻譯集群一起翻譯，待調(diào)度翻譯集群翻譯完成后，尋找下一個需要幫助的翻譯集群。2.根據(jù)權(quán)利要求1所述的組建翻譯集群方法，其特征在于將翻譯機按待翻譯的語言種類形成獨立翻譯集群，大大減少翻譯機切換語言的頻率，有效地減少翻譯機卡機、死機，翻譯錯位等問題。3.根據(jù)權(quán)利要求1所述的劃分待翻譯數(shù)據(jù)塊方法，其特征在于2)中步驟二的翻譯機數(shù)量動態(tài)平均分配，具體如下，首先將各類語言的待翻譯數(shù)據(jù)量，按對應(yīng)語言獨立翻譯集群的翻譯機數(shù)量平均分配，若為各個翻譯機平均分配整數(shù)條數(shù)據(jù)后有剩下的余數(shù)，再逐條分配各個翻譯機，各個翻譯機的翻譯數(shù)據(jù)量差不超過一條；下一次翻譯數(shù)據(jù)分配前，統(tǒng)計獨立翻譯集群內(nèi)各翻譯機未翻譯完的數(shù)據(jù)量，再分配，使得每一次分配后，一個獨立翻譯集群內(nèi)的各個翻譯機的數(shù)據(jù)量差不超過一條，如此保證所有翻譯機的平均翻譯速度，提升獨立翻譯集群的整體翻譯速度。4.根據(jù)權(quán)利要求3所述的數(shù)據(jù)塊翻譯方法，其特征在于調(diào)度翻譯集群判斷后協(xié)助翻譯速度最慢的那個獨立翻譯集群一起翻譯，調(diào)度翻譯集群在翻譯時采用翻譯機數(shù)量動態(tài)平均分配的方法。
【專利摘要】一種多語言網(wǎng)站實時翻譯的方法，1)組建翻譯集群方法，所有集群內(nèi)的翻譯機按名稱排序，便于監(jiān)測其狀態(tài)及出現(xiàn)問題時的排查；按照一定規(guī)則，抽取一定數(shù)量的翻譯機，形成調(diào)度翻譯集群；剩余的翻譯機，按待翻譯的語言種類平均分配，形成多個有語言種類特色的獨立翻譯集群；2)劃分待翻譯數(shù)據(jù)塊方法，將所有待翻譯數(shù)據(jù)按待翻譯的語言種類劃分，形成不同語言種類的待翻譯數(shù)據(jù)集合；3)數(shù)據(jù)塊翻譯方法，將待翻譯數(shù)據(jù)塊發(fā)送到對應(yīng)的獨立翻譯集群中的翻譯機翻譯；調(diào)度翻譯集群判斷后協(xié)助翻譯速度最慢的那個獨立翻譯集群一起翻譯，待調(diào)度翻譯集群翻譯完成后，尋找下一個需要幫助的翻譯集群。
【IPC分類】G06F17/28
【公開號】CN105159891
【申請?zhí)枴緾N201510475481
【發(fā)明人】張麗, 楊晨, 賀鵬, 褚一帆, 王煒
【申請人】焦點科技股份有限公司
【公開日】2015年12月16日
【申請日】2015年8月5日

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張麗;楊晨;賀鵬;褚一帆;王煒;
技術(shù)所有人：焦點科技股份有限公司;
我是此專利的發(fā)明人

上一篇：一種語料提取器及提取語料的方法
上一篇：使用神經(jīng)網(wǎng)絡(luò)產(chǎn)生輸入序列的表示的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

快速構(gòu)建實時抓取集群相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種構(gòu)建多語言網(wǎng)站實時翻譯的方法