国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于概念對(duì)象模型的問(wèn)句檢索方法

      文檔序號(hào):6636661閱讀:188來(lái)源:國(guó)知局
      一種基于概念對(duì)象模型的問(wèn)句檢索方法
      【專利摘要】一種基于概念對(duì)象模型的問(wèn)句檢索方法,依次包括如下步驟:根據(jù)研究限定領(lǐng)域問(wèn)句的特點(diǎn),依照概念對(duì)象模型知識(shí)表示方法,建立領(lǐng)域概念對(duì)象模型;用戶輸入文本問(wèn)句并確定;基于概念對(duì)象模型定義問(wèn)句的相似度計(jì)算方式;基于問(wèn)句的相似度計(jì)算方式進(jìn)行問(wèn)句檢索。該方法能夠進(jìn)行語(yǔ)義分析并提高效率,降低時(shí)間復(fù)雜度。
      【專利說(shuō)明】-種基于概念對(duì)象模型的問(wèn)句檢索方法

      【技術(shù)領(lǐng)域】
      [0001] 本發(fā)明涉及自動(dòng)問(wèn)答系統(tǒng)研究領(lǐng)域,更具體地說(shuō)涉及到自動(dòng)問(wèn)答系統(tǒng)中問(wèn)句的相 似度計(jì)算及問(wèn)句檢索研究。

      【背景技術(shù)】
      [0002] 漢語(yǔ)句子的相似度計(jì)算難度很大,傳統(tǒng)方法主要包括基于TF-IDF方法和基于語(yǔ) 義的算法?;谙蛄靠臻g模型的TF-IDF方法主要應(yīng)用于大型文檔檢索,只有當(dāng)句子所包含 的詞語(yǔ)足夠多時(shí),此方法才有比較好的效果。由于限定領(lǐng)域的問(wèn)句短小且包含的詞匯數(shù)量 少,所W應(yīng)用效果欠佳。TF-IDF方法只考慮了詞在上下文中的統(tǒng)計(jì)特性,沒(méi)有在語(yǔ)義層面上 進(jìn)行分析,不能很好的體現(xiàn)中文的特性,具有一定的局限性?;谡Z(yǔ)義的算法:由于語(yǔ)義資 料庫(kù)的限制,算法效率低下,使得問(wèn)答系統(tǒng)的實(shí)時(shí)性變差,基于語(yǔ)義的相似度計(jì)算需要某一 語(yǔ)義知識(shí)辭典的支持,而知識(shí)辭典中包含的主要是通用知識(shí),而針對(duì)某一專業(yè)領(lǐng)域知識(shí)包 含的較少,缺少對(duì)專業(yè)領(lǐng)域關(guān)鍵詞的支持,對(duì)領(lǐng)域的問(wèn)句相似度計(jì)算效果欠佳。
      [0003] 因此本發(fā)明通過(guò)對(duì)領(lǐng)域知識(shí)的相關(guān)特點(diǎn)和目前語(yǔ)句相似度計(jì)算存在的問(wèn)題進(jìn)行 研究分析,在結(jié)合一定的語(yǔ)義分析建立概念對(duì)象模型的基礎(chǔ)上,提出了基于概念對(duì)象模型 的問(wèn)句相似度計(jì)算方法,該方法能夠進(jìn)行領(lǐng)域概念對(duì)象語(yǔ)義分析并提高算法效率,降低算 法時(shí)間復(fù)雜度。


      【發(fā)明內(nèi)容】

      [0004] 本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供一種能夠進(jìn)行簡(jiǎn)單的語(yǔ)義分析并提 高算法效率,降低算法時(shí)間復(fù)雜度的基于概念對(duì)象模型的語(yǔ)句檢索方法,依次包括如下步 驟:
      [0005] 步驟1 ;根據(jù)研究限定領(lǐng)域問(wèn)句的特點(diǎn),依照概念對(duì)象模型知識(shí)表示方法,建立領(lǐng) 域概念對(duì)象模型;
      [000引步驟2 ;用戶輸入文本問(wèn)句并確定;
      [0007] 步驟3 ;字符串流處理,抽取問(wèn)句中的概念、對(duì)象及屬性,利用概念或?qū)ο竺枋鰡?wèn) 句的主題,利用概念或?qū)ο蟮膶傩悦枋鰡?wèn)句焦點(diǎn),把問(wèn)句表示為概念對(duì)象模型表示形式;
      [0008] 步驟4 ;基于概念對(duì)象模型定義問(wèn)句的相似度計(jì)算方式,具體為把問(wèn)句相似度計(jì) 算分為四部分,對(duì)象間相似度計(jì)算、屬性間相似度計(jì)算、關(guān)系間相似度計(jì)算和其余部分相似 度計(jì)算,最后加權(quán)計(jì)算得到問(wèn)句的相似度計(jì)算方式;
      [0009] 步驟5 ;基于問(wèn)句的相似度計(jì)算方式進(jìn)行問(wèn)句檢索。
      [0010] 優(yōu)選地,所述依照概念對(duì)象模型知識(shí)表示方法,建立領(lǐng)域概念對(duì)象模型,具體步驟 為;通過(guò)分析領(lǐng)域問(wèn)句特點(diǎn)從中抽取領(lǐng)域概念、領(lǐng)域?qū)ο蟆⒏拍顚傩院蛯?duì)象屬性、及它們之 間的關(guān)系,得到領(lǐng)域概念集合、領(lǐng)域?qū)ο蠹稀傩约霞瓣P(guān)系集合,經(jīng)分析關(guān)系集合中的 關(guān)系定義關(guān)系的表示形式,其中概念與屬性之間的關(guān)系、概念與概念間的繼承關(guān)系、概念與 對(duì)象之間的關(guān)系分別單獨(dú)表示,最后建立領(lǐng)域概念對(duì)象模型,具體如下:
      [0011] 步驟I. I ;抽取領(lǐng)域概念,建立領(lǐng)域概念集合Cone巧ts =咕,〔2,…C。};
      [001引步驟1. 2 ;抽取領(lǐng)域?qū)ο?,建立領(lǐng)域?qū)ο蠹匣痡ects =腳,02,…,0。};
      [001引步驟1. 3 ;抽取概念屬性和對(duì)象屬性,建立屬性集合Attributes = (Al, Ag,… .AJ ;
      [0014] 步驟1. 4 ;抽取領(lǐng)域概念、領(lǐng)域?qū)ο?、概念屬性和?duì)象屬性之間的關(guān)系,建立關(guān)系 集合Relations =出1,尺2,…,而};
      [0015] 步驟1. 5 ;定義概念、屬性和對(duì)象之間的關(guān)系、概念與屬性之間的關(guān)系、概念與概 念間的繼承關(guān)系、概念與對(duì)象之間的關(guān)系和其他關(guān)系的表示形式,建立領(lǐng)域概念對(duì)象模型。
      [0016] 優(yōu)選地,所述步驟3的具體步驟如下:
      [0017] 步驟3. 1 ;利用正向最大匹配法,根據(jù)領(lǐng)域?qū)ο髱?kù)找出用戶問(wèn)句中所有領(lǐng)域?qū)ο螅?若問(wèn)句只含有一個(gè)領(lǐng)域?qū)ο?,轉(zhuǎn)步驟3. 2,否則轉(zhuǎn)步驟3. 3 ;
      [0018] 步驟3. 2 ;對(duì)于領(lǐng)域?qū)ο?,根?jù)領(lǐng)域概念對(duì)象模型,獲取其概念的屬性作為對(duì)象屬 性,利用正向最大匹配法找出用戶問(wèn)句包含的對(duì)象屬性,如果問(wèn)句中沒(méi)有找到對(duì)象屬性,貝U 提供一個(gè)默認(rèn)屬性,最后形成查詢問(wèn)句的概念對(duì)象表示Q = {Q"wwt,Qwwbuw QaJ ;
      [0019] 步驟3. 3 ;對(duì)于包含兩個(gè)及兩個(gè)W上領(lǐng)域?qū)ο蟮那闆r,首先根據(jù)領(lǐng)域概念對(duì)象模 型,判斷對(duì)象之間的關(guān)系,如果一個(gè)對(duì)象與其他對(duì)象之間是對(duì)象和屬性的關(guān)系,則認(rèn)為問(wèn)句 只包含一個(gè)對(duì)象,其余為對(duì)象的屬性,轉(zhuǎn)步驟3. 2 ;如果一個(gè)對(duì)象所屬的概念與另一個(gè)對(duì)象 所屬的概念是上下位關(guān)系,則W下位對(duì)象為唯一的領(lǐng)域?qū)ο螅D(zhuǎn)步驟3. 2 ;其他情況轉(zhuǎn)步驟 3. 4 ;
      [0020] 步驟3. 4;對(duì)于問(wèn)句包含多個(gè)領(lǐng)域?qū)ο蟮那闆r,把問(wèn)句表示為領(lǐng)域?qū)ο?、?duì)象屬 性、對(duì)象關(guān)系及其他四部分,Q = {Q"Weet,Qattfibute, Qtehti。。,Qte日t},得到用戶問(wèn)句的概念對(duì)象模 式表示形式。
      [0021] 優(yōu)選地,所述步驟4中的問(wèn)句相似度計(jì)算分解為問(wèn)句包含的對(duì)象之間的相似度計(jì) 算、對(duì)象屬性之間的相似度計(jì)算、對(duì)象關(guān)系之間的相似度計(jì)算、其余部分相似度計(jì)算四部 分;其中各部分的計(jì)算均看作是對(duì)應(yīng)的兩個(gè)集合的相似度計(jì)算,依次從一個(gè)集合中選取一 個(gè)元素分別與另一個(gè)集合中的元素計(jì)算相似度,挑選出最大相似度的元素對(duì),循環(huán)直到第 一個(gè)集合為空;然后把挑選出的該些元素對(duì)的相似度相加,除W第一個(gè)集合包含的元素個(gè) 數(shù);最后將分別W兩個(gè)集合為基礎(chǔ)計(jì)算的結(jié)果平均得到兩個(gè)集合的相似度,問(wèn)句之間的相 似度計(jì)算由四部分計(jì)算結(jié)果加權(quán)計(jì)算得到。
      [0022] 優(yōu)選地,所述步驟4的具體步驟如下:
      [0023] 步驟4. 1 ;對(duì)象部分相似度計(jì)算:
      [0024]

      【權(quán)利要求】
      1. 一種基于概念對(duì)象模型的問(wèn)句檢索方法,其特征在于,依次包括如下步驟: 步驟1:根據(jù)研究限定領(lǐng)域問(wèn)句的特點(diǎn),依照概念對(duì)象模型知識(shí)表示方法,建立領(lǐng)域概 念對(duì)象模型; 步驟2 :用戶輸入文本問(wèn)句并確定; 步驟3:字符串流處理,抽取問(wèn)句中的概念、對(duì)象及屬性,利用概念或?qū)ο竺枋鰡?wèn)句的 主題,利用概念或?qū)ο蟮膶傩悦枋鰡?wèn)句焦點(diǎn),把問(wèn)句表示為概念對(duì)象模型表示形式; 步驟4 :基于概念對(duì)象模型定義問(wèn)句的相似度計(jì)算方式,具體為把問(wèn)句相似度計(jì)算分 為四部分,對(duì)象間相似度計(jì)算、屬性間相似度計(jì)算、關(guān)系間相似度計(jì)算和其余部分相似度計(jì) 算,最后加權(quán)計(jì)算得到問(wèn)句的相似度計(jì)算方式; 步驟5 :基于問(wèn)句的相似度計(jì)算方式進(jìn)行問(wèn)句檢索。
      2. 如權(quán)利要求1所述的一種基于概念對(duì)象模型的問(wèn)句檢索方法,其特征在于:所述依 照概念對(duì)象模型知識(shí)表示方法,建立領(lǐng)域概念對(duì)象模型,具體步驟為:通過(guò)分析領(lǐng)域問(wèn)句 特點(diǎn)從中抽取領(lǐng)域概念、領(lǐng)域?qū)ο?、概念屬性和?duì)象屬性、及它們之間的關(guān)系,得到領(lǐng)域概 念集合、領(lǐng)域?qū)ο蠹?、屬性集合及關(guān)系集合,經(jīng)分析關(guān)系集合中的關(guān)系定義關(guān)系的表示形 式,其中概念與屬性之間的關(guān)系、概念與概念間的繼承關(guān)系、概念與對(duì)象之間的關(guān)系分別單 獨(dú)表示,最后建立領(lǐng)域概念對(duì)象模型,具體如下: 步驟I. 1 :抽取領(lǐng)域概念,建立領(lǐng)域概念集合Concepts = IC1, C2,…Cj ; 步驟1. 2 :抽取領(lǐng)域?qū)ο螅㈩I(lǐng)域?qū)ο蠹螼b jects = IO1, O2,…,Oj ; 步驟L 3:抽取概念屬性和對(duì)象屬性,建立屬性集合Attributes = ; 步驟1. 4 :抽取領(lǐng)域概念、領(lǐng)域?qū)ο?、概念屬性和?duì)象屬性之間的關(guān)系,建立關(guān)系集合 Relations = (R1, R2, , R1I ; 步驟1. 5 :定義概念、屬性和對(duì)象之間的關(guān)系、概念與屬性之間的關(guān)系、概念與概念間 的繼承關(guān)系、概念與對(duì)象之間的關(guān)系和其他關(guān)系的表示形式,建立領(lǐng)域概念對(duì)象模型。
      3. 如權(quán)利要求1所述的一種基于概念對(duì)象模型的問(wèn)句檢索方法,其特征在于:所述步 驟3的具體步驟如下: 步驟3. 1 :利用正向最大匹配法,根據(jù)領(lǐng)域?qū)ο髱?kù)找出用戶問(wèn)句中所有領(lǐng)域?qū)ο?,若?wèn) 句只含有一個(gè)領(lǐng)域?qū)ο?,轉(zhuǎn)步驟3. 2,否則轉(zhuǎn)步驟3. 3 ; 步驟3. 2 :對(duì)于領(lǐng)域?qū)ο?,根?jù)領(lǐng)域概念對(duì)象模型,獲取其概念的屬性作為對(duì)象屬性, 利用正向最大匹配法找出用戶問(wèn)句包含的對(duì)象屬性,如果問(wèn)句中沒(méi)有找到對(duì)象屬性,則提 供一個(gè)默認(rèn)屬性,最后形成查詢問(wèn)句的概念對(duì)象表示Q = (Qtjwec^Qattaibute, QmJ ; 步驟3. 3 :對(duì)于包含兩個(gè)及兩個(gè)以上領(lǐng)域?qū)ο蟮那闆r,首先根據(jù)領(lǐng)域概念對(duì)象模型,判 斷對(duì)象之間的關(guān)系,如果一個(gè)對(duì)象與其他對(duì)象之間是對(duì)象和屬性的關(guān)系,則認(rèn)為問(wèn)句只包 含一個(gè)對(duì)象,其余為對(duì)象的屬性,轉(zhuǎn)步驟3. 2 ;如果一個(gè)對(duì)象所屬的概念與另一個(gè)對(duì)象所屬 的概念是上下位關(guān)系,則以下位對(duì)象為唯一的領(lǐng)域?qū)ο?,轉(zhuǎn)步驟3. 2 ;其他情況轉(zhuǎn)步驟3. 4 ; 步驟3. 4 :對(duì)于問(wèn)句包含多個(gè)領(lǐng)域?qū)ο蟮那闆r,把問(wèn)句表示為領(lǐng)域?qū)ο?、?duì)象屬性、對(duì) 象關(guān)系及其他四部分,Q = {Q_t,Qattaibute, QMlatim,QmsJ,得到用戶問(wèn)句的概念對(duì)象模式表 示形式。
      4. 如權(quán)利要求1所述的一種基于概念對(duì)象模型的問(wèn)句檢索方法,其特征在于:所述步 驟4中的問(wèn)句相似度計(jì)算分解為問(wèn)句包含的對(duì)象之間的相似度計(jì)算、對(duì)象屬性之間的相似 度計(jì)算、對(duì)象關(guān)系之間的相似度計(jì)算、其余部分相似度計(jì)算四部分;其中各部分的計(jì)算均看 作是對(duì)應(yīng)的兩個(gè)集合的相似度計(jì)算,依次從一個(gè)集合中選取一個(gè)元素分別與另一個(gè)集合中 的元素計(jì)算相似度,挑選出最大相似度的元素對(duì),循環(huán)直到第一個(gè)集合為空;然后把挑選出 的這些元素對(duì)的相似度相加,除以第一個(gè)集合包含的元素個(gè)數(shù);最后將分別以兩個(gè)集合為 基礎(chǔ)計(jì)算的結(jié)果平均得到兩個(gè)集合的相似度,問(wèn)句之間的相似度計(jì)算由四部分計(jì)算結(jié)果加 權(quán)計(jì)算得到。
      5. 如權(quán)利要求1或4所述的一種基于概念對(duì)象模型的問(wèn)句檢索方法,其特征在于:所 述步驟4的具體步驟如下:
      式中sim(Wu,Wv)為詞Wu和詞Wv的相似度,其計(jì)算方法基于語(yǔ)義計(jì)算方式,W u和Wv分別 是Q' 和Qms中的詞,n4和m4分別是Q' Mst和QMst中詞的個(gè)數(shù); 步驟4. 5 :最終問(wèn)句的相似度計(jì)算: SIM (Q' , Q) = B1SIMqobj (Q' obJ, Qobj) +B2SIMqatt (Q' att, Qatt) +B3SIMqrel (Q' rel, Qre x)+a4SIMqres (Q res, Qres) 其中,ai+a2+a3+a4 = 1,a2, a3, a4分別代表各相似度的分配系數(shù)。
      6. 如權(quán)利要求5所述的一種基于概念對(duì)象模型的問(wèn)句檢索方法,其特征在于:?jiǎn)柧渲?的對(duì)象表示問(wèn)句的主題,其屬性表示問(wèn)句的焦點(diǎn),其中S1 = 0. 3,a2 = 0. 4,a3 = 0. 15,a4 = 0? 15。
      7. 如權(quán)利要求5所述的一種基于概念對(duì)象模型的問(wèn)句檢索方法,其特征在于:如果問(wèn) 句的對(duì)象模型表示形式中缺少某一部分,則把這部分的系數(shù)按比例分配到其他系數(shù)中。
      8. 如權(quán)利要求1所述的一種基于概念對(duì)象模型的問(wèn)句檢索方法,其特征在于:所述問(wèn) 句檢索用于檢索與用戶問(wèn)句相似的問(wèn)句,通過(guò)相似度計(jì)算并排序得到檢索結(jié)果。
      【文檔編號(hào)】G06F17/30GK104331523SQ201410713510
      【公開日】2015年2月4日 申請(qǐng)日期:2014年11月27日 優(yōu)先權(quán)日:2014年11月27日
      【發(fā)明者】韓慧健, 賈可亮, 梁秀霞, 張銳, 劉崢, 其他發(fā)明人請(qǐng)求不公開姓名 申請(qǐng)人:韓慧健
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1