国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      句義表達(dá)式的生成方法、機(jī)器翻譯及電子詞典的制作方法

      文檔序號(hào):6420670閱讀:162來(lái)源:國(guó)知局
      專(zhuān)利名稱(chēng):句義表達(dá)式的生成方法、機(jī)器翻譯及電子詞典的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及數(shù)據(jù)處理技術(shù),特別涉及計(jì)算機(jī)自然語(yǔ)言處理技術(shù)。
      背景技術(shù)
      利用計(jì)算機(jī)技術(shù)來(lái)實(shí)現(xiàn)在不同自然語(yǔ)言之間的自動(dòng)翻譯一直是技術(shù)人員的努力方向,但是由于自然語(yǔ)言的復(fù)雜多樣性以及不同語(yǔ)種之間存在著的大量復(fù)雜的對(duì)應(yīng)關(guān)系,因此現(xiàn)有的機(jī)器翻譯系統(tǒng)的準(zhǔn)確率和譯文的可接受程度都比較低,始終沒(méi)有達(dá)到實(shí)用水平。
      以往機(jī)器翻譯是基于語(yǔ)法分析和基于統(tǒng)計(jì)方法兩大類(lèi),這兩大類(lèi)方法都難于做到實(shí)用。
      以往的機(jī)器翻譯三到五步——漢語(yǔ)切分、語(yǔ)法分析、語(yǔ)義分析、轉(zhuǎn)換和形成,其中轉(zhuǎn)換必須在雙語(yǔ)中進(jìn)行。通常通過(guò)中間語(yǔ)言的機(jī)器翻譯方法也需要四到六步——漢語(yǔ)切分、語(yǔ)法分析、語(yǔ)義分析、轉(zhuǎn)換成為中間語(yǔ)言、目標(biāo)語(yǔ)言的轉(zhuǎn)換和形成,其中兩個(gè)轉(zhuǎn)換都是在中間語(yǔ)言和相關(guān)語(yǔ)言的雙語(yǔ)中進(jìn)行。
      2001年12月27日提交的發(fā)明名稱(chēng)為“基于語(yǔ)義語(yǔ)言的機(jī)器翻譯系統(tǒng)及方法”的中國(guó)專(zhuān)利申請(qǐng)No.01131689.6揭示了一種基于語(yǔ)義的機(jī)器翻譯方法,用于將原始語(yǔ)種的原文自動(dòng)地翻譯成一個(gè)或多個(gè)目的語(yǔ)種的譯文,該方法包括如下步驟提取原文的一句;根據(jù)語(yǔ)義單元表示庫(kù),對(duì)該句進(jìn)行語(yǔ)義分析,從而得到該句的句義表達(dá)式;根據(jù)語(yǔ)義單元表示庫(kù),將該句義表達(dá)式用目的語(yǔ)種的表示展開(kāi);將展開(kāi)后的句子作為譯文輸出(其全部?jī)?nèi)容被包含于此,以供參考)。所述方法的翻譯只需兩步,而且N種自然語(yǔ)言之間互譯只需要研制N套翻譯系統(tǒng),不需要一般的N(N-1)/2套,也不需要一般引入中間語(yǔ)言的2N套系統(tǒng),翻譯質(zhì)量可以有效提高。在進(jìn)行語(yǔ)義分析得到句義表達(dá)式的過(guò)程中,如果僅用現(xiàn)有的搜索匹配方法,無(wú)論是橫向優(yōu)先還是縱向優(yōu)先,都是復(fù)雜和費(fèi)時(shí)的。

      發(fā)明內(nèi)容
      因此,本發(fā)明的一個(gè)方面,提供了一種高效的通過(guò)語(yǔ)義分析得到句義表達(dá)式的方法,即,利用語(yǔ)義單元表示庫(kù)自動(dòng)為一個(gè)句子生成句義表達(dá)式的方法,其中該句子為原始語(yǔ)種的句子并且所述語(yǔ)義單元表示庫(kù)至少包括所述原始語(yǔ)種的語(yǔ)義單元表示,所述方法包括根據(jù)所述語(yǔ)義單元表示庫(kù)的原始語(yǔ)種的表示,編制語(yǔ)義單元表示樹(shù)索引庫(kù);根據(jù)所述語(yǔ)義單元表示樹(shù)索引庫(kù),為該句子中的每個(gè)字提取以該字為實(shí)量開(kāi)始的語(yǔ)義單元表示樹(shù);逐字地對(duì)所述提取出的語(yǔ)義單元表示樹(shù)進(jìn)行剪枝;以及根據(jù)所述語(yǔ)義單元表示樹(shù)中沒(méi)有被剪掉的語(yǔ)義單元,求出該句子的句義表達(dá)式。
      本發(fā)明的另一個(gè)方面,提供了一種自然語(yǔ)言機(jī)器翻譯方法,用于將原始語(yǔ)種的句子翻譯成一個(gè)或多個(gè)目標(biāo)語(yǔ)種的譯文,包括通過(guò)前面描述的生成句義表達(dá)式的方法,生成所述句子的句義表達(dá)式,其中所述語(yǔ)義單元表示庫(kù)還包括對(duì)應(yīng)的所述一個(gè)或多個(gè)目標(biāo)語(yǔ)種的語(yǔ)義單元表示;以及根據(jù)所述語(yǔ)義單元表示庫(kù),將所述生成的句義表達(dá)式展開(kāi)為所述一個(gè)或多個(gè)目標(biāo)語(yǔ)種的譯文。
      本發(fā)明的另一個(gè)方面,提供了一種利用語(yǔ)義單元表示庫(kù)自動(dòng)為一個(gè)句子句義表達(dá)式的產(chǎn)生裝置,其中該句子為原始語(yǔ)種的句子,并且所述語(yǔ)義單元表示庫(kù)至少包括所述原始語(yǔ)種的語(yǔ)義單元表示,所述裝置包括語(yǔ)義單元表示樹(shù)索引庫(kù),用于記錄按照所述語(yǔ)義單元表示庫(kù)中所述原始語(yǔ)種語(yǔ)義單元的表示中實(shí)量的順序、為所述語(yǔ)義單元表示庫(kù)編制的索引;語(yǔ)義表示樹(shù)提取裝置,用于根據(jù)所述語(yǔ)義單元表示樹(shù)索引庫(kù),為該句子中的每個(gè)字提取以該字為實(shí)量開(kāi)始的語(yǔ)義單元表示樹(shù);語(yǔ)義表示樹(shù)剪枝裝置,用于逐字地對(duì)所述提取出的語(yǔ)義單元表示樹(shù)進(jìn)行剪枝;以及句義表達(dá)式生成裝置,用于根據(jù)所述提取出的語(yǔ)義單元表示樹(shù)中經(jīng)所述語(yǔ)義表示樹(shù)剪枝裝置剪枝后剩余的語(yǔ)義單元,求出該句子的句義表達(dá)式。
      本發(fā)明的另一個(gè)方面,提供了一種自然語(yǔ)言機(jī)器翻譯系統(tǒng),用于將原始語(yǔ)種的句子翻譯成一個(gè)或多個(gè)目標(biāo)語(yǔ)種的譯文,包括語(yǔ)義單元表示庫(kù),記錄有語(yǔ)義單元對(duì)應(yīng)的兩個(gè)或兩個(gè)以上語(yǔ)種的語(yǔ)義單元表示;前面描述的句義表達(dá)式的產(chǎn)生裝置;以及句義表達(dá)式展開(kāi)裝置,用于按照語(yǔ)義單元表示庫(kù)中記錄的目的語(yǔ)種的語(yǔ)義單元表示,將句義表達(dá)式的產(chǎn)生裝置生成的句義表達(dá)式展開(kāi)為目的語(yǔ)種的語(yǔ)句。
      本發(fā)明的另一個(gè)方面,提供了一種自動(dòng)根據(jù)上下文縮小詞義解釋范圍的詞語(yǔ)解釋方法,用于利用語(yǔ)義單元表示庫(kù)對(duì)原始語(yǔ)種的句子中的一個(gè)詞提供一個(gè)或多個(gè)目標(biāo)語(yǔ)種的解釋?zhuān)稣Z(yǔ)義單元表示庫(kù)含有原始語(yǔ)種的語(yǔ)義單元表示和對(duì)應(yīng)的一個(gè)或多個(gè)目標(biāo)語(yǔ)種的語(yǔ)義單元表示,所述方法包括根據(jù)所述語(yǔ)義單元表示庫(kù)的原始語(yǔ)種的表示,編制語(yǔ)義單元表示樹(shù)索引庫(kù);根據(jù)所述語(yǔ)義單元表示樹(shù)索引庫(kù),為該句子中的所述希望提供解釋的詞及其之前的每個(gè)字,提取以該字為實(shí)量開(kāi)始的語(yǔ)義單元表示樹(shù);逐字地對(duì)所述提取出的語(yǔ)義單元表示樹(shù)進(jìn)行剪枝;以及將所述希望提供解釋的詞對(duì)應(yīng)的語(yǔ)義單元表示樹(shù)中沒(méi)有被剪掉的語(yǔ)義單元所對(duì)應(yīng)的目標(biāo)語(yǔ)種的語(yǔ)義單元表示,提供作為解釋。
      本發(fā)明的另一個(gè)方面,提供了一種根據(jù)上下文縮小詞義解釋范圍的電子詞典,用于為原始語(yǔ)種的詞語(yǔ)提供一個(gè)或多個(gè)目標(biāo)語(yǔ)種的解釋?zhuān)ㄕZ(yǔ)義單元表示庫(kù),記錄有原始語(yǔ)種的語(yǔ)義單元表示和對(duì)應(yīng)的一個(gè)或多個(gè)目標(biāo)語(yǔ)種的語(yǔ)義單元表示;語(yǔ)義單元表示樹(shù)索引庫(kù),用于記錄按照所述語(yǔ)義單元表示庫(kù)中所述原始語(yǔ)種語(yǔ)義單元的表示中實(shí)量的順序、為所述語(yǔ)義單元表示庫(kù)編制的索引;字取出裝置,用于從原始語(yǔ)種的句子中取出一個(gè)字;語(yǔ)義表示樹(shù)提取裝置,用于從所述語(yǔ)義單元表示樹(shù)索引庫(kù),為原始語(yǔ)種的字提取以該字為實(shí)量開(kāi)始的語(yǔ)義單元表示樹(shù);語(yǔ)義表示樹(shù)剪枝裝置,用于對(duì)所述提取出的語(yǔ)義單元表示樹(shù)進(jìn)行剪枝;以及解釋輸出裝置,用于將所述提取出的語(yǔ)義單元表示樹(shù)中經(jīng)所述語(yǔ)義表示樹(shù)剪枝裝置剪枝后剩余的語(yǔ)義單元對(duì)應(yīng)的目標(biāo)語(yǔ)義單元表示,作為解釋輸出。


      相信通過(guò)以下結(jié)合附圖對(duì)本發(fā)明具體實(shí)施方式
      的說(shuō)明,能夠使人們更好地了解本發(fā)明上述的特點(diǎn)、優(yōu)點(diǎn)和目的。
      圖1是根據(jù)本發(fā)明的一個(gè)實(shí)施例的生成句義表達(dá)式的方法的流程圖;圖2是根據(jù)本發(fā)明的一個(gè)實(shí)施例的生成句義表達(dá)式的方法中剪枝過(guò)程的詳細(xì)流程圖;圖3是根據(jù)本發(fā)明的一個(gè)實(shí)施例的生成句義表達(dá)式的方法中剪枝過(guò)程的詳細(xì)流程圖;圖4是展示根據(jù)本發(fā)明的一個(gè)實(shí)施例的句義表達(dá)式的產(chǎn)生裝置的結(jié)構(gòu)的方塊圖;圖5是展示根據(jù)本發(fā)明的一個(gè)實(shí)施例的機(jī)器翻譯系統(tǒng)的結(jié)構(gòu)的方塊圖;圖6是根據(jù)本發(fā)明的一個(gè)實(shí)施例的自動(dòng)根據(jù)上下文縮小詞義解釋范圍的詞語(yǔ)解釋方法的流程圖;圖7是展示根據(jù)本發(fā)明的一個(gè)實(shí)施例的根據(jù)上下文縮小詞義解釋范圍的電子詞典的結(jié)構(gòu)的方塊圖。
      具體實(shí)施例方式
      下面就結(jié)合附圖對(duì)本發(fā)明的各個(gè)優(yōu)選實(shí)施例進(jìn)行詳細(xì)的說(shuō)明。
      生成句義表達(dá)式的方法如前所述在基于語(yǔ)義的機(jī)器翻譯中,根據(jù)原文的語(yǔ)句生成句義表達(dá)式的處理過(guò)程是非常關(guān)鍵的,直接影響機(jī)器翻譯的效率和譯文的準(zhǔn)確性。為此,本發(fā)明提供了一種生成句義表達(dá)式的方法。圖1是根據(jù)本發(fā)明的一個(gè)實(shí)施例的生成句義表達(dá)式的方法的流程圖。下面就參照該圖對(duì)該實(shí)施例的生成句義表達(dá)式的方法進(jìn)行說(shuō)明。
      首先在步驟101,根據(jù)語(yǔ)義單元表示庫(kù)的原始語(yǔ)種的表示,編制語(yǔ)義單元表示樹(shù)索引庫(kù)。如中國(guó)專(zhuān)利申請(qǐng)No.01131689.6中說(shuō)明的那樣,語(yǔ)義單元表示庫(kù)是記錄一種或多種自然語(yǔ)言的語(yǔ)義表示的數(shù)據(jù)集合。通常在語(yǔ)義單元表示庫(kù)中包含有每個(gè)語(yǔ)義單元對(duì)應(yīng)的兩個(gè)或兩個(gè)以上語(yǔ)種的語(yǔ)義單元表示、語(yǔ)義單元類(lèi)型以及語(yǔ)義單元的虛量(參數(shù)部分)的類(lèi)型要求(如果由虛量的話),下面的表1示例性地列舉了一個(gè)多語(yǔ)種語(yǔ)義單元表示庫(kù)的內(nèi)容,當(dāng)然,本領(lǐng)域技術(shù)人員可以作出各種變化,本發(fā)明對(duì)此沒(méi)有特別限定。
      表1.多語(yǔ)種語(yǔ)義單元表示庫(kù)的示例

      具體地,根據(jù)本實(shí)施例,步驟101,按照所述語(yǔ)義單元表示庫(kù)中所述原始語(yǔ)種語(yǔ)義單元的表示中實(shí)量的順序,為所述語(yǔ)義單元表示庫(kù)編制索引,從而使得開(kāi)始實(shí)量相同的語(yǔ)義單元集中在一起,作為語(yǔ)義單元表示樹(shù)索引庫(kù)。例如,假設(shè)需要生成句義表達(dá)式的句子是英文的句子,則在本步驟,根據(jù)語(yǔ)義單元表示庫(kù)中每個(gè)語(yǔ)義單元的英文語(yǔ)義表示中實(shí)量的順序,排序編制索引。下面的表2示例性地展示了在語(yǔ)義單元表示樹(shù)索引庫(kù)中內(nèi)容的示例,其中包含了一個(gè)以“more”為實(shí)量開(kāi)始的語(yǔ)義單元表示樹(shù)。
      表2.語(yǔ)義單元表示樹(shù)索引庫(kù)的示例

      再V一些N;VN2J,而且J;JSL多;SL比N2的多;S比J的多;毫不&lt;猶疑&gt;地V;非N所能描述;N數(shù)不清的;越來(lái)越多;越來(lái)越&lt;a&gt;;更多更好地位高貴和低賤的人死于酒者多于溺于水者;加油干;貧賤夫妻;有勇無(wú)謀;空喊而不做實(shí)事;疲勞不堪;傷不重,嚇倒不?。昏饺藨n(yōu)天害多益少;破爛不堪;名不符實(shí);言外有意;意在言外;S大半都J-S;SL左右;十分無(wú)禮|非常勇敢;杞人憂(yōu)天;太多了;不只一次;特別會(huì)V;非常高興;出乎意外地令人滿(mǎn)意完全沒(méi)有睡著;完全沒(méi)有睡著;比N卓卓有余;人多熱鬧,人少多吃或多或少;欲速而不達(dá);法律愈多,犯人就愈多;

      口角;大約;不關(guān)你的事;N的前途暗礁重重;前途暗礁重重;加油干;加油堆上去;相當(dāng)F;比N2多的N;比J多的N;A比A2多;根據(jù)本發(fā)明的一個(gè)優(yōu)選實(shí)施例,為了提高在后面描述的剪枝過(guò)程的效率,在編制語(yǔ)義單元表示樹(shù)索引庫(kù)時(shí),對(duì)于那些原始語(yǔ)種語(yǔ)義單元表示中包含由一個(gè)虛量隔開(kāi)的兩個(gè)或多個(gè)實(shí)量串的語(yǔ)義單元,或者換句話說(shuō)對(duì)于那些在語(yǔ)義單元表示中虛量和實(shí)量交替出現(xiàn)的語(yǔ)義單元,進(jìn)一步以該語(yǔ)義單元表示中后面一個(gè)實(shí)量串開(kāi)始的部分作為“子樹(shù)”加到語(yǔ)義單元表示樹(shù)索引庫(kù)中。
      具體地說(shuō)明,下面的表3列舉了一些語(yǔ)義單元表示的可能形式。
      表3.語(yǔ)義單元表示可能形式的示例


      (其中實(shí)量串-S,虛量串-X,不同語(yǔ)言的語(yǔ)義單元表示形式可能一樣)下面的表4~6舉例說(shuō)明了以語(yǔ)義單元表示中后面一個(gè)實(shí)量串開(kāi)始的部分作為“子樹(shù)”加到語(yǔ)義單元表示樹(shù)索引庫(kù)中的情況。
      表4.需要進(jìn)一步處理的語(yǔ)義單元

      比N2的多;非N所能描述;N數(shù)不清的;N的前途暗礁重重;比N2多的N;比J多的N;A比A2多;將表4的各個(gè)語(yǔ)義單元處理成為以下一棵主樹(shù)和一個(gè)子樹(shù)集表5.主樹(shù)集

      比N2的多;非N所能描述;N數(shù)不清的;N的前途暗礁重重;比N2多的N;比J多的N;A比A2多;表6.子樹(shù)集(若干棵子樹(shù))


      接著在步驟105,從需要生成句義表達(dá)式的句子中取出一個(gè)字(或單詞)。在此,按照各個(gè)字(或者單詞)在句子中的順序依次取出。
      接著在步驟110,根據(jù)語(yǔ)義單元表示樹(shù)索引庫(kù),為該取出的字提取以該字為實(shí)量開(kāi)始的語(yǔ)義單元表示樹(shù)。具體地,由于語(yǔ)義單元表示樹(shù)索引庫(kù)中已經(jīng)是按照原始語(yǔ)種的語(yǔ)義單元表示的實(shí)量部分排序了,因此,只需將以該實(shí)量為開(kāi)始的所有語(yǔ)義單元連續(xù)提取出即可。
      接著在步驟115,對(duì)于已經(jīng)提取出的語(yǔ)義單元表示樹(shù)進(jìn)行剪枝,從而減少各個(gè)提取出的語(yǔ)義單元表示樹(shù)中剩余的語(yǔ)義單元,并且隨著該句子中更多字被用于剪枝處理,最終希望每個(gè)字對(duì)應(yīng)的語(yǔ)義單元表示樹(shù)中都只剩下一個(gè)語(yǔ)義單元。具體地,剪枝過(guò)程分為實(shí)量剪枝和虛量剪枝,在后面將逐個(gè)進(jìn)行詳細(xì)說(shuō)明。
      接著在步驟120,判斷是否該句子中的全部子已經(jīng)被取出處理過(guò)了。如果沒(méi)有全部處理完,則返回到步驟105取出該句子中下一個(gè)字(或者單詞);如果全部處理完畢,則進(jìn)行到步驟125。
      在步驟125,根據(jù)剪枝剩下的語(yǔ)義單元求出句義表達(dá)式。具體地,通過(guò)將剩下的語(yǔ)義單元的原始語(yǔ)種的表示進(jìn)行代入,如果可以得到原始的句子,則將相應(yīng)的語(yǔ)義單元進(jìn)行相同的代入就可以得到句義表達(dá)式。后面還將結(jié)合具體例子對(duì)本步驟進(jìn)行詳細(xì)描述。
      圖2和圖3是根據(jù)本發(fā)明的一個(gè)實(shí)施例的生成句義表達(dá)式的方法中剪枝過(guò)程的詳細(xì)流程圖。如圖2和3所示,剪枝過(guò)程包括虛量剪枝(步驟201)和實(shí)量剪枝(步驟205)。
      所謂實(shí)量剪枝,就是將句子中后面取出的字(或者單詞)與前面已經(jīng)提取出的表述樹(shù)中語(yǔ)義單元表示的實(shí)量進(jìn)行比較,如果一致則保留,如果不一致則剪掉。例如假如句子中間包括“more”這個(gè)單詞,則在剛剛?cè)〕鲞@個(gè)單詞時(shí),與該單詞對(duì)應(yīng)的表示樹(shù)中會(huì)包括表2中的全部語(yǔ)義單元;當(dāng)取出該句子中“more”后面的第一個(gè)單詞,假設(shè)為“than”,那么就可以將“more”對(duì)應(yīng)的表示樹(shù)中所有“more”后面的實(shí)量不是“than”的語(yǔ)義單元剪掉。這樣依此類(lèi)推,隨著后面的字的取出處理,前面與各個(gè)字對(duì)應(yīng)的表示樹(shù)中的語(yǔ)義單元會(huì)越來(lái)越少。
      所謂虛量剪枝,就是將提取出的表示樹(shù)中語(yǔ)義單元表示的虛量類(lèi)型要求與相應(yīng)位置已經(jīng)確定的語(yǔ)義單元的類(lèi)型進(jìn)行比較,將不匹配的語(yǔ)義單元從表示樹(shù)中剪掉。由于一個(gè)語(yǔ)義表示中可能在一個(gè)實(shí)量的前面和后面出現(xiàn)虛量,所以虛量剪枝,如圖3所示,包括前側(cè)虛量剪枝(步驟305)和后側(cè)虛量剪枝(步驟310)。
      下面就以“I buy a beautiful vase.”為例,結(jié)合表7說(shuō)明上述剪枝過(guò)程。其中表7.1展示了有關(guān)的語(yǔ)義單元,表7.2展示了剪枝過(guò)程。
      表7.1“I buy a beautiful vase.”的有關(guān)語(yǔ)義單元

      表7.2“I buy a beautiful vase.”的剪枝過(guò)程

      如表7所示,首先取出第一個(gè)單詞“I”,并在語(yǔ)義單元表示樹(shù)索引庫(kù)中找出以該單詞為實(shí)量開(kāi)始的語(yǔ)義單元表示樹(shù)(例如包含多個(gè)語(yǔ)義單元表示,未列出)。由于只有一個(gè)以該單詞為實(shí)量開(kāi)始的語(yǔ)義表示,所以直接確定該語(yǔ)義單元(例如,語(yǔ)義單元ID為5090),匹配成功。
      接著取出下一個(gè)單詞“buy”,在語(yǔ)義單元表示樹(shù)索引庫(kù)中找出以“buy”為實(shí)量開(kāi)始的語(yǔ)義單元表示樹(shù);同時(shí),對(duì)前面“I”的表示樹(shù)進(jìn)行實(shí)量剪枝,將其中實(shí)量不匹配的語(yǔ)義單元剪掉。在本例中,假設(shè)經(jīng)過(guò)實(shí)量剪枝,“I”的表示樹(shù)中就只剩下ID為5090的語(yǔ)義單元了,因此在此就已經(jīng)確定“I”的語(yǔ)義單元。進(jìn)而,對(duì)“buy”的表示樹(shù)中,實(shí)量“buy”前的虛量類(lèi)型不是N人的語(yǔ)義單元剪掉(前側(cè)虛量剪枝)。
      接著取出下一個(gè)單詞“a”,在語(yǔ)義單元表示樹(shù)索引庫(kù)中找出以“a”為實(shí)量開(kāi)始的語(yǔ)義單元表示樹(shù);同時(shí),對(duì)前面“I”和“buy”的表示樹(shù)進(jìn)行實(shí)量剪枝,將其中實(shí)量不匹配的語(yǔ)義單元剪掉。
      接著取出下一個(gè)單詞“beautiful”,在語(yǔ)義單元表示樹(shù)索引庫(kù)中找出以“beautiful”為實(shí)量開(kāi)始的語(yǔ)義單元表示樹(shù);同時(shí),對(duì)前面“I”、“buy”和“a”的表示樹(shù)進(jìn)行實(shí)量剪枝,將其中實(shí)量不匹配的語(yǔ)義單元剪掉。
      接著取出下一個(gè)單詞“vase”,在語(yǔ)義單元表示樹(shù)索引庫(kù)中找出以“vase”為實(shí)量開(kāi)始的語(yǔ)義單元表示樹(shù);同時(shí),對(duì)前面“I”、“buy”、“a”和“beautiful”的表示樹(shù)進(jìn)行實(shí)量剪枝,將其中實(shí)量不匹配的語(yǔ)義單元剪掉。此時(shí),假設(shè)“I”、“a”和“beautiful”的表示樹(shù)中都只剩下一個(gè)語(yǔ)義單元。由于已經(jīng)到達(dá)句子的末尾,不再取詞。而且“vase”的表示樹(shù)中所有后面還有實(shí)量或虛量的語(yǔ)義單元表示都可以剪掉,因此也只剩下一個(gè)語(yǔ)義單元(ID為3050)。
      接著對(duì)“beautiful”和“vase”的確定的語(yǔ)義單元進(jìn)行類(lèi)型轉(zhuǎn)換,根據(jù)類(lèi)型處理規(guī)則,將形容義A(“beautiful”的類(lèi)型)+事物義N(“vase”的類(lèi)型)轉(zhuǎn)換為事物義N。
      具體的語(yǔ)義單元類(lèi)型處理規(guī)則有多個(gè),下面的表8示例性地列舉了一些,以供參考。
      表8.類(lèi)型處理規(guī)則舉例

      然后利用轉(zhuǎn)換得到的類(lèi)型(事物義N)對(duì)“buy”的表示樹(shù)進(jìn)行后側(cè)虛量剪枝,并最終確定“buy”的語(yǔ)義單元(ID為4009)。至此剪枝過(guò)程結(jié)束。
      下面說(shuō)明,根據(jù)剪枝剩下的語(yǔ)義單元求出句義表達(dá)式的步驟125。在剪枝結(jié)束后,在句子的每個(gè)字(或單詞)對(duì)應(yīng)的表示樹(shù)中,理想的話,都只剩下一個(gè)語(yǔ)義單元表示。在這種情況下,如果將這些語(yǔ)義單元表示代入能夠得到原始的句子,則只需將語(yǔ)義單元也按照其原始語(yǔ)種表示代入作相應(yīng)的代入,即可得到句義表達(dá)式。
      但是,也有可能經(jīng)過(guò)剪枝處理之后,從剩下的語(yǔ)義單元表示,通過(guò)代入得不到原句子,即“無(wú)解”;或者得到多個(gè)句子,即“多解”,在多解的情況下,其翻譯就會(huì)出現(xiàn)“歧義”。下面的表9就展示了多解(歧義)情況的一個(gè)例子。
      表9.“I saw a girl with telescope.”多解情況的例子。

      由上表可知,經(jīng)過(guò)剪枝處理,剩下了7個(gè)語(yǔ)義單元,在此為了簡(jiǎn)便,假設(shè)語(yǔ)義單元ID分別為1至7。其中,與“saw”對(duì)應(yīng)的表示樹(shù)中剩下了兩個(gè)語(yǔ)義單元1和3,并且這些剩下的語(yǔ)義單元表示有兩種代入方式可以得到原始句子,其對(duì)應(yīng)的句義表達(dá)式有兩個(gè)1(4,6(7),5)和3(4,2(6(7),5))。因此,這個(gè)英文句子是“歧義”。
      進(jìn)而,如果再次展開(kāi)為中文表示的話(翻譯為中文),可以得到兩個(gè)譯文“我用望遠(yuǎn)鏡看見(jiàn)一個(gè)女孩”和“我看見(jiàn)一個(gè)戴著望遠(yuǎn)鏡的女孩”。
      自然語(yǔ)言機(jī)器翻譯方法在同一發(fā)明構(gòu)思下,本發(fā)明還提供了一種自然語(yǔ)言機(jī)器翻譯方法,用于將原始語(yǔ)種的句子翻譯成一個(gè)或多個(gè)目標(biāo)語(yǔ)種的譯文。具體地,就是利用包括原始語(yǔ)種的語(yǔ)義單元表示和對(duì)應(yīng)的一個(gè)或多個(gè)目標(biāo)語(yǔ)種的語(yǔ)義單元表示的語(yǔ)義單元表示庫(kù),通過(guò)前面描述的生成句義表達(dá)式的方法,根據(jù)生成原始句子(待譯句子)的句義表達(dá)式;然后,根據(jù)語(yǔ)義單元表示庫(kù)中目標(biāo)語(yǔ)種的語(yǔ)義單元表示,將所述生成的句義表達(dá)式展開(kāi)為目標(biāo)語(yǔ)種的譯文。
      這樣就可以快速準(zhǔn)確地將待譯句子翻譯為一文。
      句義表達(dá)式的產(chǎn)生裝置在同一發(fā)明構(gòu)思下,本發(fā)明還提供了一種利用語(yǔ)義單元表示庫(kù)自動(dòng)為一個(gè)句子句義表達(dá)式的產(chǎn)生裝置。圖4是展示根據(jù)本發(fā)明的一個(gè)實(shí)施例的句義表達(dá)式的產(chǎn)生裝置的結(jié)構(gòu)的方塊圖。
      如圖4所示,該句義表達(dá)式的產(chǎn)生裝置400包括語(yǔ)義單元表示樹(shù)索引庫(kù)401,用于記錄按照語(yǔ)義單元表示庫(kù)中原始語(yǔ)種(該句子的語(yǔ)種)語(yǔ)義單元的表示中實(shí)量的順序、為語(yǔ)義單元表示庫(kù)編制的索引;語(yǔ)義表示樹(shù)提取裝置405,用于根據(jù)語(yǔ)義單元表示樹(shù)索引庫(kù)405,為該句子中的每個(gè)字提取以該字為實(shí)量開(kāi)始的語(yǔ)義單元表示樹(shù);語(yǔ)義表示樹(shù)剪枝裝置410,用于逐字地對(duì)提取出的語(yǔ)義單元表示樹(shù)進(jìn)行剪枝,具體地,執(zhí)行前面描述的實(shí)量剪枝和虛量剪枝的過(guò)程;句義表達(dá)式生成裝置415,用于根據(jù)提取出的語(yǔ)義單元表示樹(shù)中經(jīng)語(yǔ)義表示樹(shù)剪枝裝置410剪枝后剩余的語(yǔ)義單元,求出該句子的句義表達(dá)式,具體地,執(zhí)行前面描述的步驟125。
      優(yōu)選地,句義表達(dá)式的產(chǎn)生裝置400的語(yǔ)義表示樹(shù)剪枝裝置410還包括實(shí)量剪枝裝置,用于根據(jù)所述提取出的語(yǔ)義單元表示樹(shù)中各個(gè)語(yǔ)義單元的原始語(yǔ)種語(yǔ)義表示的實(shí)量,對(duì)所述提取出的語(yǔ)義單元表示樹(shù)剪枝;虛量剪枝裝置,用于根據(jù)所述提取出的語(yǔ)義單元表示樹(shù)中各個(gè)語(yǔ)義單元的原始語(yǔ)種語(yǔ)義表示的虛量,對(duì)所述提取出的語(yǔ)義單元表示樹(shù)剪枝。
      進(jìn)而,實(shí)量剪枝裝置,從所述提取出的語(yǔ)義單元表示樹(shù)中,將語(yǔ)義單元的原始語(yǔ)種語(yǔ)義表示的實(shí)量與所述句子中后續(xù)字不匹配的分支去掉。
      優(yōu)選地,該虛量剪枝裝置,從所述提取出的語(yǔ)義單元表示樹(shù)中,將語(yǔ)義單元的原始語(yǔ)種語(yǔ)義表示的虛量的類(lèi)型與所述句子的對(duì)應(yīng)部分中確定的語(yǔ)義單元的類(lèi)型不匹配的分支去掉。
      優(yōu)選地,該虛量剪枝裝置,從所述提取出的語(yǔ)義單元表示樹(shù)中,將語(yǔ)義單元的原始語(yǔ)種語(yǔ)義表示中在實(shí)量之前的虛量的類(lèi)型與前面確定的語(yǔ)義單元的類(lèi)型不匹配的分支去掉(前側(cè)剪枝),并且從所述提取出的語(yǔ)義單元表示樹(shù)中,將語(yǔ)義單元的原始語(yǔ)種語(yǔ)義表示中在實(shí)量之后的虛量的類(lèi)型與后面確定的語(yǔ)義單元的類(lèi)型不匹配的分支去掉(后側(cè)剪枝)。
      優(yōu)選地,該虛量剪枝裝置,當(dāng)出現(xiàn)兩個(gè)或多個(gè)連續(xù)的語(yǔ)義單元時(shí)進(jìn)行類(lèi)型流轉(zhuǎn)換處理。
      自然語(yǔ)言機(jī)器翻譯系統(tǒng)在同一發(fā)明構(gòu)思下,本發(fā)明還提供了一種自然語(yǔ)言機(jī)器翻譯系統(tǒng),用于將原始語(yǔ)種的句子翻譯成一個(gè)或多個(gè)目標(biāo)語(yǔ)種的譯文。圖5是展示根據(jù)本發(fā)明的一個(gè)實(shí)施例的機(jī)器翻譯系統(tǒng)的結(jié)構(gòu)的方塊圖。
      如圖5所示,該機(jī)器翻譯系統(tǒng)500包括語(yǔ)義單元表示庫(kù)510,記錄有語(yǔ)義單元對(duì)應(yīng)的兩個(gè)或兩個(gè)以上語(yǔ)種的語(yǔ)義單元表示,即,原始語(yǔ)種的語(yǔ)義單元表示和一個(gè)或多個(gè)目標(biāo)語(yǔ)種的語(yǔ)義單元表示;句義表達(dá)式的產(chǎn)生裝置400,與前面描述的句義表達(dá)式的產(chǎn)生裝置400相同;句義表達(dá)式展開(kāi)裝置520,用于按照語(yǔ)義單元表示庫(kù)中記錄的目的語(yǔ)種的語(yǔ)義單元表示,將句義表達(dá)式的產(chǎn)生裝置生成的句義表達(dá)式展開(kāi)為目的語(yǔ)種的語(yǔ)句。
      自動(dòng)根據(jù)上下文縮小詞義解釋范圍的詞語(yǔ)解釋方法在同一發(fā)明構(gòu)思下,本發(fā)明還提供了一種自動(dòng)根據(jù)上下文縮小詞義解釋范圍的詞語(yǔ)解釋方法,用于利用語(yǔ)義單元表示庫(kù)對(duì)原始語(yǔ)種的句子中的一個(gè)字或詞提供一個(gè)或多個(gè)目標(biāo)語(yǔ)種的解釋。假設(shè)用戶(hù)希望得到一個(gè)原始語(yǔ)種的句子中第i個(gè)字(或者其實(shí)量包含該字為最后一個(gè)字的詞)的目標(biāo)語(yǔ)種的解釋?zhuān)緦?shí)施例的方法就是要自動(dòng)地向用戶(hù)提供這種解釋?zhuān)⑶遗c一般電子詞典提供解釋的方式不同,本實(shí)施例的方法可以根據(jù)該句子提供準(zhǔn)確的解釋?zhuān)皇菍⒁粋€(gè)字或詞的全部可能的解釋羅列給用戶(hù)。
      圖6是根據(jù)本發(fā)明的一個(gè)實(shí)施例的自動(dòng)根據(jù)上下文縮小詞義解釋范圍的詞語(yǔ)解釋方法的流程圖。如圖6所示,首先在步驟601,編制語(yǔ)義單元表示樹(shù)索引庫(kù)。這一步驟與前面實(shí)施例中描述的相應(yīng)步驟(如圖1的步驟101)基本相同,在此省略說(shuō)明。
      接著在步驟605,提取與第i個(gè)字及其之前的字對(duì)應(yīng)的語(yǔ)義單元表示樹(shù),然后在步驟610,對(duì)已經(jīng)提取出的語(yǔ)義單元表示樹(shù)進(jìn)行剪枝,具體剪枝過(guò)程與前面實(shí)施例中描述的步驟(圖1的步驟101~115)基本相同,在此省略說(shuō)明。而且,步驟605和610也可以是逐字進(jìn)行的。
      在此,對(duì)于剪枝的過(guò)程進(jìn)一步說(shuō)明,并且在此的說(shuō)明也適用于前面實(shí)施例的情況。對(duì)于提取出的語(yǔ)義單元表示樹(shù)中的每一個(gè)語(yǔ)義單元表示,在剪枝的過(guò)程中會(huì)有三種狀態(tài),稱(chēng)為剪枝狀態(tài)正在剪枝、被剪掉和匹配成功?!氨患舻簟笔侵赣捎趯?shí)量或者虛量不匹配而被剪掉,“匹配成功”是指該語(yǔ)義表示與句子中的相應(yīng)內(nèi)容完全匹配而被確定,“正在剪枝”是指該語(yǔ)義單元表示正在被剪枝既未匹配成功又未被剪掉。其中,“匹配成功”和“被剪掉”都可以被認(rèn)為是對(duì)該語(yǔ)義表示的剪枝結(jié)束。
      接著在步驟615,判斷與第i個(gè)字相關(guān)的語(yǔ)義單元表示是否剪枝結(jié)束。所謂與一個(gè)字相關(guān)的語(yǔ)義單元表示,是指被提取出的語(yǔ)義單元表示中的實(shí)量部分或者虛量部分包含該字的那些語(yǔ)義單元表示。這些相關(guān)的語(yǔ)義單元表示有可能會(huì)成為該字解釋范圍。本實(shí)施例的方法是通過(guò)剪枝(實(shí)量剪枝和虛量剪枝)進(jìn)一步縮小該字的解釋范圍。
      如果步驟615的判斷為“是”,則進(jìn)行到步驟625,否則進(jìn)行到步驟618。在步驟618進(jìn)一步判斷句子中的全部字是否都已經(jīng)被取出,如果還沒(méi)有都被取出,則進(jìn)行到步驟620取下一個(gè)字并返回到步驟610繼續(xù)對(duì)已經(jīng)提取出的語(yǔ)義單元表示樹(shù)進(jìn)行剪枝,縮小解釋范圍。如果在步驟618判斷為句子中的全部字都已經(jīng)被取出,則也進(jìn)行到步驟625。
      最后在步驟625,將剪枝剩下的與第i個(gè)自相關(guān)的語(yǔ)義表示對(duì)應(yīng)的目標(biāo)語(yǔ)中的語(yǔ)義單元表示作為該字在句子中的解釋提供給用戶(hù)。
      由此,本實(shí)施例的方法,結(jié)合句子中的上下文,通過(guò)語(yǔ)義單元表示樹(shù)的剪枝處理,可以更有針對(duì)性地向用戶(hù)提供字(和詞)的解釋。
      根據(jù)上下文縮小詞義解釋范圍的電子詞典在同一發(fā)明構(gòu)思下,本發(fā)明還提供了一種根據(jù)上下文縮小詞義解釋范圍的電子詞典,用于為原始語(yǔ)種的詞語(yǔ)提供一個(gè)或多個(gè)目標(biāo)語(yǔ)種的解釋。圖7是展示根據(jù)本發(fā)明的一個(gè)實(shí)施例的根據(jù)上下文縮小詞義解釋范圍的電子詞典的結(jié)構(gòu)的方塊圖。
      如圖7所示,本實(shí)施例的根據(jù)上下文縮小詞義解釋范圍的電子詞典700包括語(yǔ)義單元表示庫(kù)701,記錄有原始語(yǔ)種的語(yǔ)義單元表示和對(duì)應(yīng)的一個(gè)或多個(gè)目標(biāo)語(yǔ)種的語(yǔ)義單元表示;語(yǔ)義單元表示樹(shù)索引庫(kù)702,用于記錄按照所述語(yǔ)義單元表示庫(kù)中所述原始語(yǔ)種語(yǔ)義單元的表示中實(shí)量的順序、為所述語(yǔ)義單元表示庫(kù)編制的索引;字取出裝置704,用于從原始語(yǔ)種的句子中取出一個(gè)字;語(yǔ)義表示樹(shù)提取裝置703,用于根據(jù)所述語(yǔ)義單元表示樹(shù)索引庫(kù),為原始語(yǔ)種的字提取以該字為實(shí)量開(kāi)始的語(yǔ)義單元表示樹(shù);語(yǔ)義表示樹(shù)剪枝裝置705,用于對(duì)所述提取出的語(yǔ)義單元表示樹(shù)進(jìn)行剪枝;解釋輸出裝置706,用于將所述提取出的語(yǔ)義單元表示樹(shù)中經(jīng)所述語(yǔ)義表示樹(shù)剪枝裝置剪枝后剩余的語(yǔ)義單元對(duì)應(yīng)的目標(biāo)語(yǔ)義單元表示,作為解釋輸出。
      本實(shí)施例的根據(jù)上下文縮小詞義解釋范圍的電子詞典700,在運(yùn)行時(shí)可以實(shí)現(xiàn)前面實(shí)施例中描述的自動(dòng)根據(jù)上下文縮小詞義解釋范圍的詞語(yǔ)解釋方法。
      優(yōu)選地,語(yǔ)義表示樹(shù)剪枝裝置705還包括實(shí)量剪枝裝置,用于根據(jù)所述提取出的語(yǔ)義單元表示樹(shù)中各個(gè)語(yǔ)義單元的原始語(yǔ)種語(yǔ)義表示的實(shí)量,對(duì)所述提取出的語(yǔ)義單元表示樹(shù)剪枝;以及虛量剪枝裝置,用于根據(jù)所述提取出的語(yǔ)義單元表示樹(shù)中各個(gè)語(yǔ)義單元的原始語(yǔ)種語(yǔ)義表示的虛量,對(duì)所述提取出的語(yǔ)義單元表示樹(shù)剪枝。
      進(jìn)而,所述實(shí)量剪枝裝置,從所述提取出的語(yǔ)義單元表示樹(shù)中,將語(yǔ)義單元的原始語(yǔ)種語(yǔ)義表示的實(shí)量與所述句子中后續(xù)字不匹配的分支去掉。所述虛量剪枝裝置,從所述提取出的語(yǔ)義單元表示樹(shù)中,將語(yǔ)義單元的原始語(yǔ)種語(yǔ)義表示的虛量的類(lèi)型與所述句子的對(duì)應(yīng)部分中確定的語(yǔ)義單元的類(lèi)型不匹配的分支去掉。
      優(yōu)選地,所述虛量剪枝裝置,從所述提取出的語(yǔ)義單元表示樹(shù)中,將語(yǔ)義單元的原始語(yǔ)種語(yǔ)義表示中在實(shí)量之前的虛量的類(lèi)型與前面確定的語(yǔ)義單元的類(lèi)型不匹配的分支去掉,并且從所述提取出的語(yǔ)義單元表示樹(shù)中,將語(yǔ)義單元的原始語(yǔ)種語(yǔ)義表示中在實(shí)量之后的虛量的類(lèi)型與后面確定的語(yǔ)義單元的類(lèi)型不匹配的分支去掉。
      優(yōu)選地,所述虛量剪枝裝置,當(dāng)出現(xiàn)兩個(gè)或多個(gè)連續(xù)的語(yǔ)義單元時(shí)進(jìn)行類(lèi)型流轉(zhuǎn)換處理。
      本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,本發(fā)明中的根據(jù)上下文縮小詞義解釋范圍的電子詞典、機(jī)器翻譯系統(tǒng)及它們的組成部分可以用硬件或軟件的形式實(shí)現(xiàn),并且,物理地各個(gè)組成部分也可以不在一起,而是操作上互相配合完成上述實(shí)施例中描述的功能。
      以上雖然通過(guò)一些示例性的實(shí)施例對(duì)本發(fā)明的生成句義表達(dá)式的方法及裝置、機(jī)器翻譯系統(tǒng)、自動(dòng)根據(jù)上下文縮小詞義解釋范圍的詞語(yǔ)解釋方法和根據(jù)上下文縮小詞義解釋范圍的電子詞典進(jìn)行了詳細(xì)的描述,但是以上這些實(shí)施例并不是窮舉的,本領(lǐng)域技術(shù)人員可以在本發(fā)明的精神和范圍內(nèi)實(shí)現(xiàn)各種變化和修改。因此,本發(fā)明并不限于這些實(shí)施例,本發(fā)明的范圍僅由所附權(quán)利要求為準(zhǔn)。
      權(quán)利要求
      1.一種利用語(yǔ)義單元表示庫(kù)自動(dòng)為一個(gè)句子生成句義表達(dá)式的方法,其中該句子為原始語(yǔ)種的句子并且所述語(yǔ)義單元表示庫(kù)至少包括所述原始語(yǔ)種的語(yǔ)義單元表示,所述方法包括根據(jù)所述語(yǔ)義單元表示庫(kù)的原始語(yǔ)種的表示,編制語(yǔ)義單元表示樹(shù)索引庫(kù);根據(jù)所述語(yǔ)義單元表示樹(shù)索引庫(kù),為該句子中的每個(gè)字提取以該字為實(shí)量開(kāi)始的語(yǔ)義單元表示樹(shù);逐字地對(duì)所述提取出的語(yǔ)義單元表示樹(shù)進(jìn)行剪枝;以及根據(jù)所述語(yǔ)義單元表示樹(shù)中沒(méi)有被剪掉的語(yǔ)義單元,求出該句子的句義表達(dá)式。
      2.根據(jù)權(quán)利要求1所述的生成句義表達(dá)式的方法,其特征在于,所述為所述語(yǔ)義單元表示庫(kù)編制索引的步驟,包括按照所述語(yǔ)義單元表示庫(kù)中所述原始語(yǔ)種語(yǔ)義單元的表示中實(shí)量的順序,為所述語(yǔ)義單元表示庫(kù)編制索引。
      3.根據(jù)權(quán)利要求2所述的生成句義表達(dá)式的方法,其特征在于,所述為所述語(yǔ)義單元表示庫(kù)編制索引的步驟,還包括當(dāng)所述原始語(yǔ)種語(yǔ)義單元的表示中出現(xiàn)由虛量隔開(kāi)的兩個(gè)或多個(gè)實(shí)量時(shí),將后面的實(shí)量也依次加入作為所述索引中的一個(gè)條目。
      4.根據(jù)權(quán)利要求1所述的生成句義表達(dá)式的方法,其特征在于,所述提取出的語(yǔ)義單元表示樹(shù)進(jìn)行剪枝的步驟,包括根據(jù)所述提取出的原始語(yǔ)種的語(yǔ)義單元表示樹(shù)中各個(gè)語(yǔ)義單元表示的實(shí)量,對(duì)所述提取出的語(yǔ)義單元表示樹(shù)剪枝;以及根據(jù)所述提取出的原始語(yǔ)種的語(yǔ)義單元表示樹(shù)中各個(gè)語(yǔ)義單元表示的虛量,對(duì)所述提取出的語(yǔ)義單元表示樹(shù)剪枝。
      5.根據(jù)權(quán)利要求4所述的生成句義表達(dá)式的方法,其特征在于,所述根據(jù)實(shí)量對(duì)所述提取出的語(yǔ)義單元表示樹(shù)剪枝的步驟,包括從所述提取出的原始語(yǔ)種的語(yǔ)義單元表示樹(shù)中,將其實(shí)量與所述句子中后續(xù)字不匹配的分支去掉。
      6.根據(jù)權(quán)利要求4所述的生成句義表達(dá)式的方法,其特征在于,所述根據(jù)虛量對(duì)所述提取出的語(yǔ)義單元表示樹(shù)剪枝的步驟,包括從所述提取出的原始語(yǔ)種的語(yǔ)義單元表示樹(shù)中,將其虛量與所述句子的對(duì)應(yīng)部分中確定的語(yǔ)義單元的類(lèi)型不匹配的分支去掉。
      7.根據(jù)權(quán)利要求6所述的生成句義表達(dá)式的方法,其特征在于,所述將語(yǔ)義單元的原始語(yǔ)種語(yǔ)義表示的虛量的類(lèi)型與所述句子的對(duì)應(yīng)部分中確定的語(yǔ)義單元的類(lèi)型不匹配的分支去掉的步驟,包括從所述提取出的原始語(yǔ)種的語(yǔ)義單元表示樹(shù)中,將在實(shí)量之前的虛量與所述句子的對(duì)應(yīng)部分的語(yǔ)義單元的類(lèi)型不匹配的分支去掉;以及從所述提取出的原始語(yǔ)種的語(yǔ)義單元表示樹(shù)中,將在實(shí)量之后的虛量與所述句子的對(duì)應(yīng)部分的語(yǔ)義單元的類(lèi)型不匹配的分支去掉。
      8.根據(jù)權(quán)利要求6所述的生成句義表達(dá)式的方法,其特征在于,所述根據(jù)虛量對(duì)所述提取出的語(yǔ)義單元表示樹(shù)剪枝的步驟,還包括當(dāng)出現(xiàn)兩個(gè)或多個(gè)連續(xù)的語(yǔ)義單元時(shí)進(jìn)行類(lèi)型流轉(zhuǎn)換處理。
      9.根據(jù)權(quán)利要求1所述的生成句義表達(dá)式的方法,其特征在于,所述求出該句子的句義表達(dá)式的步驟,包括將通過(guò)剩下的語(yǔ)義單元表示的代入能得到所述句子的對(duì)應(yīng)的語(yǔ)義單元進(jìn)行相同的代入得到句義表達(dá)式。
      10.根據(jù)權(quán)利要求9所述的生成句義表達(dá)式的方法,其特征在于,所述求出該句子的句義表達(dá)式的步驟,還包括如果剩下的語(yǔ)義單元表示的代入無(wú)法得到所述句子,則判斷該句子無(wú)解;以及如果剩下的語(yǔ)義單元表示的多個(gè)不同代入可以得到所述句子,則判斷該句子有歧義。
      11.一種自然語(yǔ)言機(jī)器翻譯方法,用于將原始語(yǔ)種的句子翻譯成一個(gè)或多個(gè)目標(biāo)語(yǔ)種的譯文,包括通過(guò)權(quán)利要求1~10所述的生成句義表達(dá)式的方法,生成所述句子的句義表達(dá)式,其中所述語(yǔ)義單元表示庫(kù)還包括對(duì)應(yīng)的所述一個(gè)或多個(gè)目標(biāo)語(yǔ)種的語(yǔ)義單元表示;以及根據(jù)所述語(yǔ)義單元表示庫(kù),將所述生成的句義表達(dá)式展開(kāi)為所述一個(gè)或多個(gè)目標(biāo)語(yǔ)種的譯文。
      12.一種利用語(yǔ)義單元表示庫(kù)自動(dòng)為句子產(chǎn)生句義表達(dá)式的句義表達(dá)式產(chǎn)生裝置,其中該句子為原始語(yǔ)種的句子,并且所述語(yǔ)義單元表示庫(kù)至少包括所述原始語(yǔ)種的語(yǔ)義單元表示,所述裝置包括語(yǔ)義單元表示樹(shù)索引庫(kù),用于記錄按照所述語(yǔ)義單元表示庫(kù)中所述原始語(yǔ)種語(yǔ)義單元的表示中實(shí)量的順序、為所述語(yǔ)義單元表示庫(kù)編制的索引;語(yǔ)義表示樹(shù)提取裝置,用于根據(jù)所述語(yǔ)義單元表示樹(shù)索引庫(kù),為該句子中的每個(gè)字提取以該字為實(shí)量開(kāi)始的語(yǔ)義單元表示樹(shù);語(yǔ)義表示樹(shù)剪枝裝置,用于逐字地對(duì)所述提取出的語(yǔ)義單元表示樹(shù)進(jìn)行剪枝;以及句義表達(dá)式生成裝置,用于根據(jù)所述提取出的語(yǔ)義單元表示樹(shù)中經(jīng)所述語(yǔ)義表示樹(shù)剪枝裝置剪枝后剩余的語(yǔ)義單元,求出該句子的句義表達(dá)式。
      13.根據(jù)權(quán)利要求12所述的句義表達(dá)式的產(chǎn)生裝置,其特征在于,當(dāng)所述原始語(yǔ)種語(yǔ)義單元的表示中出現(xiàn)由虛量隔開(kāi)的兩個(gè)或多個(gè)實(shí)量時(shí),將后面的實(shí)量也依次加入作為所述語(yǔ)義單元表示樹(shù)索引庫(kù)中一個(gè)條目。
      14.根據(jù)權(quán)利要求12所述的句義表達(dá)式的產(chǎn)生裝置,其特征在于,所述語(yǔ)義表示樹(shù)剪枝裝置還包括實(shí)量剪枝裝置,用于根據(jù)所述提取出的原始語(yǔ)種語(yǔ)義單元表示樹(shù)中各個(gè)語(yǔ)義單元表示的實(shí)量,對(duì)所述提取出的語(yǔ)義單元表示樹(shù)剪枝;以及虛量剪枝裝置,用于根據(jù)所述提取出的原始語(yǔ)種語(yǔ)義單元表示樹(shù)中各個(gè)語(yǔ)義單元表示的虛量,對(duì)所述提取出的語(yǔ)義單元表示樹(shù)剪枝。
      15.根據(jù)權(quán)利要求14所述的句義表達(dá)式的產(chǎn)生裝置,其特征在于,所述實(shí)量剪枝裝置,從所述提取出的原始語(yǔ)種語(yǔ)義單元表示樹(shù)中,將其實(shí)量與所述句子中后續(xù)字不匹配的分支去掉。
      16.根據(jù)權(quán)利要求14所述的句義表達(dá)式的產(chǎn)生裝置,其特征在于,所述虛量剪枝裝置,從所述提取出的原始語(yǔ)種語(yǔ)義單元表示樹(shù)中,將其虛量的類(lèi)型與所述句子的對(duì)應(yīng)部分中確定的語(yǔ)義單元的類(lèi)型不匹配的分支去掉。
      17.根據(jù)權(quán)利要求16所述的句義表達(dá)式的產(chǎn)生裝置,其特征在于,所述虛量剪枝裝置,從所述提取出的原始語(yǔ)種語(yǔ)義單元表示樹(shù)中,將在實(shí)量之前的虛量的類(lèi)型與所述句子的對(duì)應(yīng)部分的語(yǔ)義單元的類(lèi)型不匹配的分支去掉,并且從所述提取出的原始語(yǔ)種語(yǔ)義單元表示樹(shù)中,將在實(shí)量之后的虛量的類(lèi)型與所述句子的對(duì)應(yīng)部分的語(yǔ)義單元的類(lèi)型不匹配的分支去掉。
      18.根據(jù)權(quán)利要求16所述的句義表達(dá)式的產(chǎn)生裝置,其特征在于,所述虛量剪枝裝置,當(dāng)出現(xiàn)兩個(gè)或多個(gè)連續(xù)的語(yǔ)義單元時(shí)進(jìn)行類(lèi)型流轉(zhuǎn)換處理。
      19.根據(jù)權(quán)利要求12所述的句義表達(dá)式的產(chǎn)生裝置,其特征在于,所述句義表達(dá)式生成裝置,將通過(guò)剩下的語(yǔ)義單元表示的代入能得到所述句子的對(duì)應(yīng)的語(yǔ)義單元進(jìn)行相同的代入得到句義表達(dá)式。
      20.根據(jù)權(quán)利要求9所述的句義表達(dá)式的產(chǎn)生裝置,其特征在于,所述句義表達(dá)式生成裝置,如果剩下的語(yǔ)義單元表示的代入無(wú)法得到所述句子,則判斷該句子無(wú)解,并且,如果剩下的語(yǔ)義單元表示的多個(gè)不同代入可以得到所述句子,則判斷該句子有歧義。
      21.一種自然語(yǔ)言機(jī)器翻譯系統(tǒng),用于將原始語(yǔ)種的句子翻譯成一個(gè)或多個(gè)目標(biāo)語(yǔ)種的譯文,包括語(yǔ)義單元表示庫(kù),記錄有語(yǔ)義單元對(duì)應(yīng)的兩個(gè)或兩個(gè)以上語(yǔ)種的語(yǔ)義單元表示;權(quán)利要求12~20所述的句義表達(dá)式的產(chǎn)生裝置;以及句義表達(dá)式展開(kāi)裝置,用于按照語(yǔ)義單元表示庫(kù)中記錄的目的語(yǔ)種的語(yǔ)義單元表示,將句義表達(dá)式的產(chǎn)生裝置生成的句義表達(dá)式展開(kāi)為目的語(yǔ)種的語(yǔ)句。
      22.一種自動(dòng)根據(jù)上下文縮小詞義解釋范圍的詞語(yǔ)解釋方法,用于利用語(yǔ)義單元表示庫(kù)對(duì)原始語(yǔ)種的句子中的一個(gè)詞提供一個(gè)或多個(gè)目標(biāo)語(yǔ)種的解釋?zhuān)稣Z(yǔ)義單元表示庫(kù)含有原始語(yǔ)種的語(yǔ)義單元表示和對(duì)應(yīng)的一個(gè)或多個(gè)目標(biāo)語(yǔ)種的語(yǔ)義單元表示,所述方法包括根據(jù)所述語(yǔ)義單元表示庫(kù)的原始語(yǔ)種的表示,編制語(yǔ)義單元表示樹(shù)索引庫(kù);根據(jù)所述語(yǔ)義單元表示樹(shù)索引庫(kù),為該句子中的所述希望提供解釋的字及其之前的每個(gè)字,提取以該字為實(shí)量開(kāi)始的語(yǔ)義單元表示樹(shù);逐字地對(duì)所述提取出的語(yǔ)義單元表示樹(shù)進(jìn)行剪枝;以及將所述希望提供解釋的詞對(duì)應(yīng)的語(yǔ)義單元表示樹(shù)中沒(méi)有被剪掉的語(yǔ)義單元所對(duì)應(yīng)的目標(biāo)語(yǔ)種的語(yǔ)義單元表示,提供作為解釋。
      23.根據(jù)權(quán)利要求22所述的自動(dòng)根據(jù)上下文縮小詞義解釋范圍的詞語(yǔ)解釋方法,其特征在于,還包括判斷與所述希望提供解釋的字相關(guān)的語(yǔ)義單元表示是否剪枝結(jié)束;以及如果判斷為還未剪枝結(jié)束,則繼續(xù)取出該句子中的下一個(gè)字,來(lái)對(duì)前面已經(jīng)提取出的表示樹(shù)進(jìn)行剪枝。
      24.根據(jù)權(quán)利要求23所述的自動(dòng)根據(jù)上下文縮小詞義解釋范圍的詞語(yǔ)解釋方法,其特征在于,還包括判斷所述句子中的全部字是否已被取出;以及如果判斷為全部字已被取出,則清除前面提取出的還沒(méi)有匹配的語(yǔ)義單元表示。
      25.根據(jù)權(quán)利要求22所述的自動(dòng)根據(jù)上下文縮小詞義解釋范圍的詞語(yǔ)解釋方法,其特征在于,所述提取出的語(yǔ)義單元表示樹(shù)進(jìn)行剪枝的步驟,包括根據(jù)所述提取出的原始語(yǔ)種語(yǔ)義單元表示樹(shù)中各個(gè)語(yǔ)義單元表示的實(shí)量,對(duì)所述提取出的語(yǔ)義單元表示樹(shù)剪枝;以及根據(jù)所述提取出的原始語(yǔ)種語(yǔ)義單元表示樹(shù)中各個(gè)語(yǔ)義單元表示的虛量,對(duì)所述提取出的語(yǔ)義單元表示樹(shù)剪枝。
      26.根據(jù)權(quán)利要求25所述的自動(dòng)根據(jù)上下文縮小詞義解釋范圍的詞語(yǔ)解釋方法,其特征在于,所述根據(jù)實(shí)量對(duì)所述提取出的語(yǔ)義單元表示樹(shù)剪枝的步驟,包括從所述提取出的原始語(yǔ)種語(yǔ)義單元表示樹(shù)中,將其實(shí)量與所述句子中后續(xù)字不匹配的分支去掉。
      27.根據(jù)權(quán)利要求25所述的自動(dòng)根據(jù)上下文縮小詞義解釋范圍的詞語(yǔ)解釋方法,其特征在于,所述根據(jù)虛量對(duì)所述提取出的語(yǔ)義單元表示樹(shù)剪枝的步驟,包括從所述提取出的原始語(yǔ)種語(yǔ)義單元表示樹(shù)中,將其虛量的類(lèi)型與所述句子的對(duì)應(yīng)部分中確定的語(yǔ)義單元的類(lèi)型不匹配的分支去掉。
      28.根據(jù)權(quán)利要求27所述的自動(dòng)根據(jù)上下文縮小詞義解釋范圍的詞語(yǔ)解釋方法,其特征在于,所述將語(yǔ)義單元的原始語(yǔ)種語(yǔ)義表示的虛量的類(lèi)型與所述句子的對(duì)應(yīng)部分中確定的語(yǔ)義單元的類(lèi)型不匹配的分支去掉的步驟,包括從所述提取出的原始語(yǔ)種語(yǔ)義單元表示樹(shù)中,將在實(shí)量之前的虛量的類(lèi)型與所述句子的對(duì)應(yīng)部分的語(yǔ)義單元的類(lèi)型不匹配的分支去掉;以及從所述提取出的原始語(yǔ)種語(yǔ)義單元表示樹(shù)中,將在實(shí)量之后的虛量的類(lèi)型與所述句子的對(duì)應(yīng)部分的語(yǔ)義單元的類(lèi)型不匹配的分支去掉。
      29.根據(jù)權(quán)利要求27所述的自動(dòng)根據(jù)上下文縮小詞義解釋范圍的詞語(yǔ)解釋方法,其特征在于,所述根據(jù)虛量對(duì)所述提取出的語(yǔ)義單元表示樹(shù)剪枝的步驟,還包括當(dāng)出現(xiàn)兩個(gè)或多個(gè)連續(xù)的語(yǔ)義單元時(shí)進(jìn)行類(lèi)型流轉(zhuǎn)換處理。
      30.一種根據(jù)上下文縮小詞義解釋范圍的電子詞典,用于為原始語(yǔ)種的詞語(yǔ)提供一個(gè)或多個(gè)目標(biāo)語(yǔ)種的解釋?zhuān)ㄕZ(yǔ)義單元表示庫(kù),記錄有原始語(yǔ)種的語(yǔ)義單元表示和對(duì)應(yīng)的一個(gè)或多個(gè)目標(biāo)語(yǔ)種的語(yǔ)義單元表示;語(yǔ)義單元表示樹(shù)索引庫(kù),用于記錄按照所述語(yǔ)義單元表示庫(kù)中所述原始語(yǔ)種語(yǔ)義單元的表示中實(shí)量的順序、為所述語(yǔ)義單元表示庫(kù)編制的索引;字取出裝置,用于從原始語(yǔ)種的句子中取出一個(gè)字;語(yǔ)義表示樹(shù)提取裝置,用于根據(jù)所述語(yǔ)義單元表示樹(shù)索引庫(kù),為原始語(yǔ)種的字提取以該字為實(shí)量開(kāi)始的語(yǔ)義單元表示樹(shù);語(yǔ)義表示樹(shù)剪枝裝置,用于對(duì)所述提取出的語(yǔ)義單元表示樹(shù)進(jìn)行剪枝;以及解釋輸出裝置,用于將所述提取出的語(yǔ)義單元表示樹(shù)中經(jīng)所述語(yǔ)義表示樹(shù)剪枝裝置剪枝后剩余的語(yǔ)義單元對(duì)應(yīng)的目標(biāo)語(yǔ)義單元表示,作為解釋輸出。
      31.根據(jù)權(quán)利要求30所述的根據(jù)上下文縮小詞義解釋范圍的電子詞典,其特征在于,所述語(yǔ)義表示樹(shù)剪枝裝置還包括實(shí)量剪枝裝置,用于根據(jù)所述提取出的原始語(yǔ)種語(yǔ)義單元表示樹(shù)中各個(gè)語(yǔ)義單元表示的實(shí)量,對(duì)所述提取出的語(yǔ)義單元表示樹(shù)剪枝;以及虛量剪枝裝置,用于根據(jù)所述提取出的原始語(yǔ)種語(yǔ)義單元表示樹(shù)中各個(gè)語(yǔ)義單元表示的虛量,對(duì)所述提取出的語(yǔ)義單元表示樹(shù)剪枝。
      32.根據(jù)權(quán)利要求31所述的根據(jù)上下文縮小詞義解釋范圍的電子詞典,其特征在于,所述實(shí)量剪枝裝置,從所述提取出的原始語(yǔ)種語(yǔ)義單元表示樹(shù)中,將其實(shí)量與所述句子中后續(xù)字不匹配的分支去掉。
      33.根據(jù)權(quán)利要求31所述的根據(jù)上下文縮小詞義解釋范圍的電子詞典,其特征在于,所述虛量剪枝裝置,從所述提取出的原始語(yǔ)種語(yǔ)義單元表示樹(shù)中,將其虛量的類(lèi)型與所述句子的對(duì)應(yīng)部分中確定的語(yǔ)義單元的類(lèi)型不匹配的分支去掉。
      34.根據(jù)權(quán)利要求33所述的根據(jù)上下文縮小詞義解釋范圍的電子詞典,其特征在于,所述虛量剪枝裝置,從所述提取出的原始語(yǔ)種語(yǔ)義單元表示樹(shù)中,將在實(shí)量之前的虛量的類(lèi)型與所述句子的對(duì)應(yīng)部分的語(yǔ)義單元的類(lèi)型不匹配的分支去掉,并且從所述提取出的原始語(yǔ)種語(yǔ)義單元表示樹(shù)中,將在實(shí)量之后的虛量的類(lèi)型與所述句子的對(duì)應(yīng)部分的語(yǔ)義單元的類(lèi)型不匹配的分支去掉。
      35.根據(jù)權(quán)利要求33所述的根據(jù)上下文縮小詞義解釋范圍的電子詞典,其特征在于,所述虛量剪枝裝置,當(dāng)出現(xiàn)兩個(gè)或多個(gè)連續(xù)的語(yǔ)義單元時(shí)進(jìn)行類(lèi)型流轉(zhuǎn)換處理。
      全文摘要
      本發(fā)明提供了生成句義表達(dá)式的方法及裝置、機(jī)器翻譯方法及系統(tǒng)、自動(dòng)根據(jù)上下文縮小詞義解釋范圍的詞語(yǔ)解釋方法和根據(jù)上下文縮小詞義解釋范圍的電子詞典。其中為一個(gè)句子生成句義表達(dá)式的方法包括根據(jù)所述語(yǔ)義單元表示庫(kù)的原始語(yǔ)種的表示,編制語(yǔ)義單元表示樹(shù)索引庫(kù);根據(jù)所述語(yǔ)義單元表示樹(shù)索引庫(kù),為該句子中的每個(gè)字提取以該字為實(shí)量開(kāi)始的語(yǔ)義單元表示樹(shù);逐字地對(duì)所述提取出的語(yǔ)義單元表示樹(shù)進(jìn)行剪枝;以及根據(jù)所述語(yǔ)義單元表示樹(shù)中沒(méi)有被剪掉的語(yǔ)義單元,求出該句子的句義表達(dá)式。
      文檔編號(hào)G06F17/26GK1617133SQ20031011433
      公開(kāi)日2005年5月18日 申請(qǐng)日期2003年11月14日 優(yōu)先權(quán)日2003年11月14日
      發(fā)明者高小宇, 高慶獅, 胡玥 申請(qǐng)人:高慶獅
      網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1