基于問答系統(tǒng)的信息匹配的方法和裝置的制造方法
【技術領域】
[0001] 本申請涉及問答信息技術領域,特別是涉及一種基于問答系統(tǒng)的信息匹配的方法 和裝置。
【背景技術】
[0002] 近年來,隨著自然語言處理技術的發(fā)展,智能問答系統(tǒng)受到了極大的關注,從聊天 軟件'小黃雞'的風靡,到流行于各大網絡平臺的應答機器人,智能問答系統(tǒng)在眾多領域得 到應用。
[0003] 現(xiàn)有技術中,通常采用如圖1所示的問答系統(tǒng)實現(xiàn)對用戶輸入信息的處理。
[0004] 步驟101 :問答系統(tǒng)接收用戶輸入信息。
[0005] 步驟102 :對接收的用戶輸入信息進行分析,分析包括關鍵詞提取以及關鍵詞擴 展等一系列的預處理,獲得預處理后的用戶輸入信息。
[0006] 步驟103 :將預處理后的用戶輸入彳目息進行l(wèi)ucene檢索,獲得用戶輸入彳目息的多 個問題候選結果,從多個問題候選結果中選擇出用戶輸入信息的最優(yōu)答案。
[0007] 上述檢索中通過關鍵詞匹配和關鍵詞擴展得到用戶輸入信息的最優(yōu)答案,但是由 于漢語中表達方式靈活,具有相同語義句子其關鍵詞的出現(xiàn)的位置也不定,關鍵詞按序匹 配往往不能滿足檢索要求,因此,通過關鍵詞進行檢索和匹配,盡管該算法簡單易行,畢竟 停留在語言的表層,而沒有觸及語義,因此,問答系統(tǒng)提供的最優(yōu)答案往往不是用戶所需要 的答案。
【發(fā)明內容】
[0008] 本申請?zhí)峁┮环N基于問答系統(tǒng)的信息匹配的方法和裝置,以解決現(xiàn)有技術中無法 高效準確的實現(xiàn)問答系統(tǒng)的信息匹配的問題。
[0009] 為了解決上述問題,本申請公開了一種基于問答系統(tǒng)的信息匹配方法,包括:獲取 用戶輸入信息的打分最高的模糊問題候選結果和打分最高的Lucene問題候選結果;
[0010] 判斷所述打分最高的模糊問題候選結果是否大于模糊問題候選結果的第一閾 值;
[0011] 若打分最高的模糊問題候選結果大于第一閾值,則將所述打分最高的模糊問題候 選結果作為所述用戶輸入信息的輸出結果;
[0012] 若所述打分最高的模糊問題候選結果小于或等于第一閾值時,則獲得打分最高的 Lucene問題候選結果;
[0013] 判斷打分最高的Lucene問題候選結果是否大于Lucene問題候選結果的第二閾 值,若是,則將所述打分最高的Lucene問題候選結果作為所述用戶輸入信息的輸出結果。
[0014] 優(yōu)選地,若所述打分最高的Lucene問題候選結果小于或等于第二閾值時,貝輸出 未找到用戶輸入信息。
[0015] 優(yōu)選地,包括:使用遺傳算法計算第一閾值和第二閾值的取值,其中,所述遺傳算 法包括:選擇算子、交叉算子和變異算子。
[0016] 優(yōu)選地,使用遺傳算法計算第一閾值和第二閾值的取值步驟包括:
[0017] 將所述第一閾值和第二閾值進行隨機賦值,得到多個一維數(shù)組;
[0018] 使用選擇算子選擇滿足一定標準的多個一維數(shù)組;
[0019] 使用交叉算子處理滿足一定標準的多個一維數(shù)組,得到多個交叉后的一維數(shù)組;
[0020] 使用變異算子處理所述多個交叉后的一維數(shù)組,得到多個變異后的一維數(shù)組;
[0021] 將滿足一定標準的多個一維數(shù)組、多個交叉后的一維數(shù)組和多個變異后的一維數(shù) 組輸入到問答系統(tǒng)中,得到用戶輸入信息的準確率;
[0022] 從排序后的準確率中篩選出至少兩個準確率;
[0023] 將至少兩個準確率對應的一維數(shù)組重復進行以上操作,直至找到一個收斂準確 率;
[0024] 將所述收斂準確率對應的一維數(shù)組作為第一閾值和第二閾值的取值。
[0025] 本申請公開了一種基于問答系統(tǒng)的信息匹配方法,包括:將獲取的多個Lucene問 題候選結果按照不同類型分為領域問題候選結果和閑聊問題候選結果;
[0026] 利用模糊算法對所述多個領域問題候選結果進行打分,獲得打分最高的領域問題 候選結果;
[0027] 判斷所述打分最高的領域問題候選結果是否大于模糊問題候選結果的第一閾 值;
[0028] 若打分最高的領域問題候選結果大于第一閾值,則將所述打分最高的領域問題候 選結果作為所述用戶輸入信息的輸出結果;
[0029] 若打分最高的領域問題候選結果小于或等于第一閾值時,則輸出未找到用戶輸入 信息;
[0030] 利用模糊算法對所述多個閑聊問題候選結果進行打分,獲得打分最高的閑聊問題 候選結果;
[0031] 判斷打分最高的閑聊問題候選結果是否大于閑聊問題候選結果的第三閾值;
[0032] 若打分最高的閑聊問題候選結果大于第三閾值,則將所述打分最高的閑聊問題候 選結果作為用戶輸入信息的輸出結果;
[0033] 若打分最高的閑聊問題候選結果小于或等于第三閾值時,則獲得打分最高的 Lucene問題候選結果;
[0034] 判斷打分最高的Lucene問題候選結果是否大于Lucene問題候選結果的第二閾 值,若是,則將所述打分最高的Lucene問題候選結果作為所述用戶輸入信息的輸出結果。
[0035] 優(yōu)選地,包括:若所述打分最高的Lucene問題候選結果小于或等于第二閾值時, 則輸出未找到用戶輸入信息。
[0036] 優(yōu)選地,包括:使用遺傳算法計算第一閾值、第二閾值和第三閾值的取值,其中,所 述遺傳算法包括:選擇算子、交叉算子和變異算子。
[0037] 優(yōu)選地,包括:使用遺傳算法計算第一閾值、第二閾值和第三閾值的取值步驟包 括:
[0038] 將所述第一閾值、第二閾值和第三閾值進行隨機賦值,得到多個一維數(shù)組;
[0039] 使用選擇算子從所述多個一維數(shù)組中選擇滿足一定標準的多個一維數(shù)組;
[0040] 使用交叉算子處理滿足一定標準的的多個一維數(shù)組,得到多個交叉后的一維數(shù) 組;
[0041] 使用變異算子處理所述多個交叉后的一維數(shù)組,得到多個變異后的一維數(shù)組;
[0042] 將滿足一定標準的多個一維數(shù)組、多個交叉后的一維數(shù)組和多個變異后的一維數(shù) 組輸入到問答系統(tǒng)中,得到用戶輸入信息的準確率;
[0043] 使用評價函數(shù)從所述準確率中篩選出至少兩個準確率;
[0044] 將至少兩個準確率對應的一維數(shù)組重復進行以上操作,直至找到一個收斂準確 率;
[0045] 將所述收斂準確率對應的一維數(shù)組作為第一閾值、第二閾值和第三閾值的取值。
[0046] 優(yōu)選地,所述評價函數(shù)的函數(shù)公式為: