智能應答方法、裝置、系統(tǒng)及電子設備的制造方法
【專利摘要】本發(fā)明公開了一種智能應答方法、裝置、系統(tǒng)及電子設備。其中所述智能應答方法包括:獲取對應特定待回答問題的被提問者評價為不符合要求的原始答案;以所述不符合要求的原始答案中的信息為檢索依據(jù),以預定的標準在預存的知識點集合中檢索,以獲取所述待回答問題的改進答案。采用本申請?zhí)峁┑姆椒?,使得在查詢檢索到與待回答問題直接對應的答案后,還能夠根據(jù)提問者選擇的不符合要求的原始答案進行二次檢索,獲取待回答問題的改進答案。由于提問者對原始答案的選擇反映了提問者對答案的需求,可以將其作為新的檢索依據(jù)。因此,本方法通過引入新的檢索依據(jù),能夠提高答案的覆蓋面以及準確率。
【專利說明】
智能應答方法、裝置、系統(tǒng)及電子設備
技術領域
[0001]本申請涉及互聯(lián)網技術領域,具體涉及一種智能應答方法和裝置。本申請同時涉及一種智能應答系統(tǒng),以及一種電子設備。
【背景技術】
[0002]隨著互聯(lián)網的快速發(fā)展,客戶獲取信息與知識的首選渠道已經由傳統(tǒng)電話、短信變換為即時通訊、微博、微信、網站等新渠道。隨著新渠道的各種應用增加,面對大量的咨詢查詢量,如何利用知識點庫更好的服務客戶成為一個研究熱點。
[0003]在線客服系統(tǒng)是一個網頁聊天系統(tǒng),連接“有疑問的客戶”和“解決問題的服務人員”,該系統(tǒng)采用“問答機器人”和“人工服務”共同服務客戶的方式??头摹皢柎饳C器人”,實現(xiàn)自動化、智能化、人性化、個性化的機器人自助答疑功能,突破時間、人力、地域限制,提供7*24小時不間斷咨詢服務,分擔“人工服務”工作量,節(jié)省企業(yè)用人成本,提高企業(yè)服務質量。當機器人自動回答用戶的問題無法滿足用戶的時候,會轉到人工服務。在線客服系統(tǒng)會已經成為網絡營銷的重要工具,也是提升企業(yè)網站形象,加強企業(yè)與訪客互動的必備工具。
[0004]機器人與知識點庫的整合應用使機器人可以從知識點庫迅速獲取相應答案,快速、準確的響應客戶咨詢。最終用戶通過多種渠道終端,如微信、短信、QQ等進行自然語言提問,問題如果是語音則通過ASR服務轉化為文字,提問的文字信息傳遞給智能機器人引擎進行自然語言理解,分析出關鍵詞定位到知識點,由渠道知識點庫返回知識點具體內容。
[0005]目前,機器人根據(jù)問題獲取匹配知識點通常采用一次檢索的方法,即:以“一問一答”的維度,解決用戶的問題。在知識點庫質量不變的情況下,“問”和“答”之間的關聯(lián)關系,按照現(xiàn)有文本識別算法的優(yōu)化程度,已經難以提升機器人解決用戶問題的數(shù)量。通過一次檢索的查詢方式解決問題,機器人在優(yōu)化上已經遇到了提升瓶頸,再優(yōu)化效果欠佳。
[0006]因此,現(xiàn)有技術存在通過一次檢索的方法從知識點庫中獲取與問題匹配的知識點已經難以提高回答正確率的問題。
【發(fā)明內容】
[0007]本申請?zhí)峁┮环N智能應答方法和裝置,以解決現(xiàn)有技術存在通過一次檢索的方法從知識點庫中獲取與問題匹配的知識點已經難以提高回答正確率的問題。本申請另外提供一種智能應答系統(tǒng),以及一種電子設備。
[0008]本申請?zhí)峁┮环N智能應答方法,其特征在于,包括:
[0009]獲取對應特定待回答問題的被提問者評價為不符合要求的原始答案;
[0010]以所述不符合要求的原始答案中的信息為檢索依據(jù),以預定的標準在預存的知識點集合中檢索,以獲取所述待回答問題的改進答案;所述知識點包括標題和內容。
[0011]可選的,所述不符合要求的原始答案包括標題;
[0012]所述預定的標準包括:與所述不符合要求的原始答案的標題相似度最高。
[0013]可選的,若與所述不符合要求的原始答案的標題相似度最高的知識點有多個,則選擇更新時間距離當前時間最近的知識點作為所述改進答案。
[0014]可選的,所述不符合要求的原始答案包括標題;
[0015]所述預定的標準包括:
[0016]找出與所述不符合要求的原始答案的標題相似度最高的知識點作為候選知識占.V,
[0017]判斷所述候選知識點中包含的統(tǒng)一資源定位符是否與所述不符合要求的原始答案相同;
[0018]若是,則排除該候選知識點,在剩余知識點中找出標題相似度最高的知識點作為所述候選知識點,并返回前一判斷步驟;
[0019]若否,則將所述候選知識點作為所述改進答案。
[0020]可選的,所述預定的標準包括:與所述不符合要求的原始答案的內容中的段落標題相似度最高。
[0021 ] 可選的,若與所述不符合要求的原始答案的內容中的段落標題相似度最高的知識點有多個,則選擇更新時間距離當前時間最近的知識點作為所述改進答案。
[0022]可選的,所述預定的標準包括:
[0023]找出與所述不符合要求的原始答案的內容中的段落標題相似度最高的知識點作為候選知識點;
[0024]判斷所述候選知識點中包含的統(tǒng)一資源定位符是否與所述不符合要求的原始答案相同;
[0025]若是,則排除該候選知識點,在剩余知識點中找出內容中的段落標題相似度最高的知識點作為所述候選知識點,并返回前一判斷步驟;
[0026]若否,則將所述候選知識點作為所述改進答案。
[0027]可選的,所述預定的標準包括:根據(jù)與所述不符合要求的原始答案的標題相似度、內容中的段落標題相似度和統(tǒng)一資源定位器相似度,計算整體相似度,以所述整體相似度與所述不符合要求的原始答案最接近的知識點作為改進知識點;所述整體相似度采用如下計算公式:
[0028]W = X*N1+Y*N2 - Z*N3
[0029]其中,W為所述整體相似度,X為所述標題相似度,Y為所述段落標題相似度,Z為所述統(tǒng)一資源定位器相似度,NI為所述標題相似度的權重,N2為所述段落標題相似度的權重,N3為所述統(tǒng)一資源定位器的權重。
[0030]可選的,所述預定的標準包括:
[0031]判斷當前時間與知識點的最近更新時間的時間間隔是否小于等于第一預設時間間隔;
[0032]若上述判斷結果為是,則根據(jù)與所述不符合要求的原始答案的標題相似度、內容中的段落標題相似度和統(tǒng)一資源定位器相似度,以及所述當前時間與所述知識點的最近更新時間的時間間隔,計算整體相似度,以所述整體相似度與所述不符合要求的原始答案最接近的知識點作為改進知識點;所述整體相似度采用如下計算公式:
[0033]W = X*N1+Y*N2 - Z*N 3+N4* (Ts_t)
[0034]其中,W為所述整體相似度,X為所述標題相似度,Y為所述段落標題相似度,Z為所述統(tǒng)一資源定位器相似度,NI為所述標題相似度的權重,N2為所述段落標題相似度的權重,N3為所述統(tǒng)一資源定位器的權重,N4為預設的時間權重,Ts為所述第一預設時間間隔,t為所述當前時間與所述知識點的最近更新時間的時間間隔。
[0035]可選的,所述預定的標準包括:僅將規(guī)定時間閾值范圍內更新的知識點作為檢索獲取所述改進答案的范圍;所述時間閾值為當前時間與所述知識點的最近更新時間的時間間隔長度的預設值。
[0036]可選的,其特征在于,在所述以預定的標準在預存的知識點集合中檢索獲取所述待回答問題的改進答案之前,還包括:
[0037]計算并存儲任意兩個知識點的所述標題相似度。
[0038]可選的,根據(jù)第二預設時間間隔或者當更新所述知識點時,計算并存儲任意兩個知識點的所述標題相似度。
[0039]可選的,所述計算任意兩個知識點的所述標題相似度包括:
[0040]解析第一知識點和第二知識點的標題,獲取所述第一知識點和第二知識點的標題各自包括的預先定義的關鍵詞,分別作為第一標題關鍵詞集合和第二標題關鍵詞集合;
[0041]根據(jù)所述第一標題關鍵詞集合和第二標題關鍵詞集合,計算所述第一知識點和第二知識點的標題相似度。
[0042]可選的,所述標題相似度采用下述公式計算獲取:
[0043]X(A,B) = IA H B I / IA U B
[0044]其中,A為所述第一標題關鍵詞集合,B為所述第二標題關鍵詞集合,X(A,B)為所述標題相似度。
[0045]可選的,在所述以預定的標準在預存的知識點集合中檢索獲取所述待回答問題的改進答案之前,還包括:
[0046]計算并存儲任意兩個知識點的所述內容中的段落標題相似度。
[0047]可選的,根據(jù)第二預設時間間隔或者當更新所述知識點時,計算并存儲任意兩個知識點的所述內容中的段落標題相似度。
[0048]可選的,所述計算任意兩個知識點的所述內容中的段落標題相似度包括:
[0049]解析第一知識點與第二知識點的所述段落標題,獲取所述第一知識點與第二知識點的所述段落標題各自包括的預先定義的關鍵詞,將所述第一知識點的所述段落標題包括的關鍵詞作為第一段落標題的關鍵詞集合,將所述第二知識點的所述段落標題包括的關鍵詞作為第二段落標題的關鍵詞集合;
[0050]根據(jù)所述第一段落標題的關鍵詞集合和第二段落標題的關鍵詞集合,計算所述第一知識點與第二知識點的內容中的段落標題相似度。
[0051]可選的,所述內容中的段落標題相似度采用下述公式計算獲取:
[0052]Y (C,D) = I C n D I / I C U D
[0053]其中,C為所述第一段落標題的關鍵詞集合,D為所述第二段落標題的關鍵詞集合,Y(C,D)為所述內容中的段落標題相似度。
[0054]可選的,在所述以預定的標準在預存的知識點集合中檢索獲取所述待回答問題的改進答案之前,還包括:
[0055]計算并存儲任意兩個知識點的所述內容中的統(tǒng)一資源定位器相似度。
[0056]可選的,根據(jù)第二預設時間間隔或者當更新所述知識點時,計算并存儲任意兩個知識點的所述內容中的統(tǒng)一資源定位器相似度。
[0057]可選的,所述計算任意兩個知識點的所述內容中的統(tǒng)一資源定位器相似度包括:
[0058]解析第一知識點與第二知識點的各個內容,獲取所述第一知識點與第二知識點的各自包括的統(tǒng)一資源定位器,分別作為第一統(tǒng)一資源定位器集合和第二統(tǒng)一資源定位器集合;
[0059]根據(jù)所述第一統(tǒng)一資源定位器集合和第二統(tǒng)一資源定位器集合,計算所述第一知識點與第二知識點的所述統(tǒng)一資源定位器相似度。
[0060]可選的,所述統(tǒng)一資源定位器相似度采用下述公式計算獲取:
[0061]z(e,F(xiàn)) = |e n f|/|e u f
[0062]其中,E為所述第一統(tǒng)一資源定位器集合,F(xiàn)為所述第二統(tǒng)一資源定位器集合,Z(E,F(xiàn))為所述統(tǒng)一資源定位器相似度。
[0063]可選的,在所述以預定的標準在預存的知識點集合中檢索獲取所述待回答問題的改進答案之前,還包括:
[0064]計算并存儲任意兩個知識點的所述整體相似度。
[0065]可選的,根據(jù)第二預設時間間隔或者當更新所述知識點時,計算并存儲任意兩個知識點的所述整體相似度。
[0066]可選的,所述不符合要求的原始答案采用如下步驟生成:
[0067]接收客戶端發(fā)送的對應所述待回答問題的詢問請求;
[0068]根據(jù)所述待回答問題和預存的問答關系,獲取所述待回答問題的一個或多個原始答案;
[0069]將提問者從所述一個或多個原始答案中選取的一個原始答案,作為所述不符合要求的原始答案。
[0070]可選的,所述根據(jù)所述待回答問題和預存的問答關系,獲取所述待回答問題的一個或多個原始答案,包括:
[0071]解析所述待回答問題,獲取所述待回答問題包括的預先定義的關鍵詞;
[0072]根據(jù)所述關鍵詞和所述問答關系,獲取與所述關鍵詞匹配的答案,作為所述一個或多個原始答案。
[0073]可選的,所述知識點是結構化文檔。
[0074]相應的,本申請還提供一種智能應答裝置,其特征在于,包括:
[0075]獲取單元,用于獲取對應特定待回答問題的被提問者評價為不符合要求的原始答案;
[0076]檢索單元,用于以所述不符合要求的原始答案中的信息為檢索依據(jù),以預定的標準在預存的知識點集合中檢索,以獲取所述待回答問題的改進答案;所述知識點包括標題和內容。
[0077]可選的,所述檢索單元包括:
[0078]第一檢索子單元,用于以所述不符合要求的原始答案中的信息為檢索依據(jù),以所述改進答案與所述不符合要求的原始答案的標題相似度最高為檢索標準,在所述預存的知識點集合中檢索,以獲取所述待回答問題的所述改進答案。
[0079]可選的,所述檢索單元包括:
[0080]第二檢索子單元,用于以所述不符合要求的原始答案中的信息為檢索依據(jù),在所述預存的知識點集合中檢索,以獲取所述待回答問題的所述改進答案;
[0081]所述第二檢索子單元包括:
[0082]第一查找子單元,用于找出與所述不符合要求的原始答案的標題相似度最高的知識點作為候選知識點;
[0083]判斷子單元,用于判斷所述候選知識點中包含的統(tǒng)一資源定位符是否與所述不符合要求的原始答案相同;
[0084]第二查找子單元,用于若所述候選知識點中包含的統(tǒng)一資源定位符與所述不符合要求的原始答案相同,則排除該候選知識點,在剩余知識點中找出標題相似度最高的知識點作為所述候選知識點,并返回前一判斷步驟;
[0085]判定子單元,用于若所述候選知識點中包含的統(tǒng)一資源定位符與所述不符合要求的原始答案不相同,則將所述候選知識點作為所述改進答案。
[0086]可選的,所述檢索單元包括:
[0087]第三檢索子單元,用于以所述不符合要求的原始答案中的信息為檢索依據(jù),以所述改進答案與所述不符合要求的原始答案的內容中的段落標題相似度最高為檢索標準,在所述預存的知識點集合中檢索,以獲取所述待回答問題的所述改進答案。
[0088]可選的,所述檢索單元包括:
[0089]第四檢索子單元,用于以所述不符合要求的原始答案中的信息為檢索依據(jù),在所述預存的知識點集合中檢索,以獲取所述待回答問題的所述改進答案;
[0090]所述第四檢索子單元包括:
[0091]第一查找子單元,用于找出與所述不符合要求的原始答案的內容中的段落標題相似度最高的知識點作為候選知識點;
[0092]判斷子單元,用于判斷所述候選知識點中包含的統(tǒng)一資源定位符是否與所述不符合要求的原始答案相同;
[0093]第二查找子單元,用于若所述候選知識點中包含的統(tǒng)一資源定位符與所述不符合要求的原始答案相同,則排除該候選知識點,在剩余知識點中找出內容中的段落標題相似度最高的知識點作為所述候選知識點,并返回前一判斷步驟;
[0094]判定子單元,用于若所述候選知識點中包含的統(tǒng)一資源定位符與所述不符合要求的原始答案不相同,則將所述候選知識點作為所述改進答案。
[0095]可選的,所述檢索單元包括:
[0096]第五檢索子單元,用于以所述不符合要求的原始答案中的信息為檢索依據(jù),以原始改進答案與所述不符合要求的原始答案的整體相似度最高為檢索標準,在所述預存的知識點集合中檢索,以獲取所述待回答問題的所述改進答案;
[0097]所述整體相似度是根據(jù)與所述不符合要求的原始答案的標題相似度、內容中的段落標題相似度和統(tǒng)一資源定位器相似度計算獲取的;所述整體相似度采用如下計算公式:
[0098]W = X*N1+Y*N2 - Z*N3
[0099]其中,W為所述整體相似度,X為所述標題相似度,Y為所述段落標題相似度,Z為所述統(tǒng)一資源定位器相似度,NI為所述標題相似度的權重,N2為所述段落標題相似度的權重,N3為所述統(tǒng)一資源定位器的權重。
[0100]可選的,所述檢索單元包括:
[0101]第六檢索子單元,用于以所述不符合要求的原始答案中的信息為檢索依據(jù),以所述改進答案與所述不符合要求的原始答案的整體相似度最高為檢索標準,在所述預存的知識點集合中檢索,以獲取所述待回答問題的所述改進答案;
[0102]所述整體相似度是根據(jù)與所述不符合要求的原始答案的標題相似度、內容中的段落標題相似度和統(tǒng)一資源定位器相似度,以及所述當前時間與知識點的最近更新時間的時間間隔計算獲取的;所述整體相似度采用如下計算公式:
[0103]W = X*N1+Y*N2 - Z*N3+N4*(Ts_t)
[0104]其中,W為所述整體相似度,X為所述標題相似度,Y為所述段落標題相似度,Z為所述統(tǒng)一資源定位器相似度,NI為所述標題相似度的權重,N2為所述段落標題相似度的權重,N3為所述統(tǒng)一資源定位器的權重,N4為預設的時間權重,Ts為第一預設時間間隔,t為所述當前時間與所述知識點的最近更新時間的時間間隔。
[0105]可選的,所述裝置還包括:
[0106]第一計算子單元,用于計算任意兩個知識點的所述標題相似度;
[0107]所述第一計算子單元包括:
[0108]解析子單元,用于解析第一知識點和第二知識點的標題,獲取所述第一知識點和第二知識點的標題各自包括的預先定義的關鍵詞,分別作為第一標題關鍵詞集合和第二標題關鍵詞集合;
[0109]計算子單元,用于根據(jù)所述第一標題關鍵詞集合和第二標題關鍵詞集合,計算所述第一知識點和第二知識點的標題相似度。
[0110]可選的,所述裝置還包括:
[0111]第二計算子單元,用于計算任意兩個知識點的所述內容中的段落標題相似度;
[0112]所述第二計算子單元包括:
[0113]解析子單元,用于解析第一知識點和第二知識點的所述段落標題,獲取所述第一知識點和第二知識點的所述段落標題各自包括的預先定義的關鍵詞,將所述第一知識點的所述段落標題包括的關鍵詞作為第一段落標題的關鍵詞集合,將所述第二知識點的所述段落標題包括的關鍵詞作為第二段落標題的關鍵詞集合;
[0114]計算子單元,用于根據(jù)所述第一段落標題的關鍵詞集合和第二段落標題的關鍵詞集合,計算所述第一知識點和第二知識點的內容中的段落標題相似度。
[0115]可選的,所述裝置還包括:
[0116]第三計算子單元,用于計算任意兩個知識點的所述內容中的統(tǒng)一資源定位器相似度;
[0117]所述第三計算子單元包括:
[0118]解析子單元,用于解析第一知識點和第二知識點的各個內容,獲取所述第一知識點和第二知識點的各自包括的統(tǒng)一資源定位器,分別作為第一統(tǒng)一資源定位器集合和第二統(tǒng)一資源定位器集合;
[0119]計算子單元,用于根據(jù)所述第一統(tǒng)一資源定位器集合和第二統(tǒng)一資源定位器集合,計算所述第一知識點和第二知識點的所述統(tǒng)一資源定位器相似度。
[0120]可選的,所述裝置還包括:
[0121]第四計算子單元,用于計算任意兩個知識點的所述整體相似度。
[0122]可選的,還包括:
[0123]生成單元,用于生成所述不符合要求的原始答案;
[0124]所述生成單元包括:
[0125]接收子單元,用于接收客戶端發(fā)送的對應所述待回答問題的詢問請求;
[0126]獲取子單元,用于根據(jù)所述待回答問題和預存的問答關系,獲取所述待回答問題的一個或多個原始答案;
[0127]選取子單元,用于將提問者從所述一個或多個原始答案中選取的一個原始答案,作為所述不符合要求的原始答案。
[0128]可選的,所述獲取子單元包括:
[0129]解析子單元,用于解析所述待回答問題,獲取所述待回答問題包括的預先定義的關鍵詞;
[0130]查詢子單元,用于根據(jù)所述關鍵詞和所述問答關系,獲取與所述關鍵詞匹配的答案,作為所述一個或多個原始答案。
[0131]本申請還提供一種智能應答系統(tǒng),包括:根據(jù)上述任一項所述的智能應答裝置。
[0132]此外,本申請還提供一種電子設備,所述電子設備包括:
[0133]顯示器;
[0134]處理器;以及
[0135]存儲器,所述存儲器被配置成存儲待回答問題,所述待回答問題被所述處理器執(zhí)行時,在所述顯示器顯示所述待回答問題的改進答案,所述改進答案是以被提問者評價為不符合要求的原始答案中的信息為檢索依據(jù),以預定的標準在預存的知識點集合中檢索獲取的,所述原始答案是根據(jù)所述待回答問題和預存的問答關系生成的。
[0136]可選的,所述知識點和所述問答關系存儲在服務器端。
[0137]可選的,所述電子設備是穿戴式智能設備;所述改進答案存儲在該穿戴式智能設備的存儲器中。
[0138]與現(xiàn)有技術相比,本申請具有以下優(yōu)點:
[0139]本申請?zhí)峁┑闹悄軕鸱椒?、裝置、系統(tǒng)及電子設備,通過獲取對應特定待回答問題的被提問者評價為不符合要求的原始答案,并以所述不符合要求的原始答案中的信息為檢索依據(jù),以預定的標準在預存的知識點集合中檢索,以獲取所述待回答問題的改進答案,使得在查詢檢索到與待回答問題直接對應的答案后,還能夠根據(jù)提問者選擇的不符合要求的原始答案進行二次檢索,獲取待回答問題的改進答案。由于提問者對原始答案的選擇反映了提問者對答案的需求,可以將其作為新的檢索依據(jù)。因此,本方法能夠在現(xiàn)有技術已經難以通過待回答問題本身包含的信息提高答案覆蓋面和準確率的情況下,通過引入新的檢索依據(jù)提高答案的覆蓋面以及準確率。
【附圖說明】
[0140]圖1是本申請的智能應答方法實施例的流程圖;
[0141]圖2是本申請的智能應答方法實施例中知識點的不意圖;
[0142]圖3是本申請的智能應答方法實施例中計算標題相似度的具體流程圖;
[0143]圖4是本申請的智能應答方法實施例中步驟S103的一個具體流程圖;
[0144]圖5是本申請的智能應答裝置實施例的示意圖;
[0145]圖6是本申請的智能應答裝置實施例中檢索單元103的具體示意圖;
[0146]圖7是本申請的智能應答裝置實施例中第二檢索單元1032的具體示意圖;
[0147]圖8是本申請的智能應答裝置實施例的具體示意圖;
[0148]圖9是本申請的智能應答裝置實施例中第一計算單元201的具體示意圖;
[0149]圖10是本申請的智能應答裝置實施例中生成單元205的具體示意圖;
[0150]圖11是本申請的電子設備實施例的示意圖。
【具體實施方式】
[0151]在下面的描述中闡述了很多具體細節(jié)以便于充分理解本申請。但是本申請能夠以很多不同于在此描述的其它方式來實施,本領域技術人員可以在不違背本申請內涵的情況下做類似推廣,因此本申請不受下面公開的具體實施的限制。
[0152]在本申請中,提供了一種智能應答方法和裝置,以及一種智能應答系統(tǒng)和電子設備。在下面的實施例中逐一進行詳細說明。
[0153]本申請?zhí)峁┑闹悄軕鸱椒?,是基于這樣一種設計構思,即:采用問答結果二次推薦的方式,在根據(jù)“問題”檢索獲取到“一次結果”后,能夠自動通過“一次結果”檢索“二次結果”。由于本申請?zhí)峁┑闹悄軕鸱椒ㄊ且浴敖Y果-結果”的關聯(lián)維度補充“問題-結果”的單一維度,因而能夠提升解決問題的覆蓋面。
[0154]請參考圖1,其為本申請的智能應答方法實施例的流程圖。所述方法包括如下步驟:
[0155]步驟SlOl:獲取對應特定待回答問題的被提問者評價為不符合要求的原始答案。
[0156]本申請實施例所述的原始答案和改進答案均為知識點本申請實施例所述的知識點記錄了解決用戶某一個或某一類問題的流程、操作步驟、相關系統(tǒng)鏈接等信息。知識點包括標題和內容。在實際應用中,知識點可以是一個格式化文檔,例如:web文檔、word文檔等;知識點還可以是非格式化文檔,例如:文本文件。上述不同的知識點存儲格式,都只是【具體實施方式】的變更,都不偏離本申請的核心,因此都在本申請的保護范圍之內。
[0157]在本實施例中,每一個知識點均為一個web文檔。請參考圖2,其為本申請的智能應答方法實施例中知識點的示意圖。從圖2中可見,一個web文檔表示的知識點包括三個部分:知識的標題、內容中的各個段落標題、內容中的統(tǒng)一資源定位器。其中,知識的標題表示該知識點對應的大標題,知識的標題還可以包括副標題;段落標題是一個知識點的各個組成部分的標題,即:小標題;知識點的各個組成部分的具體內容是通過統(tǒng)一資源定位器鏈接到的具體解決方案等信息。
[0158]要實施本申請?zhí)峁┑姆椒?,首先要在對應特定待回答問題的回答中,獲取被提問者評價為不符合要求的原始答案。通常,一個智能應答系統(tǒng)根據(jù)提問者提出的問題,在已有的問答關系中檢索獲取對應問題的“一次結果”,即:原始答案。由于問答關系是一對多的關系,因此對應提問者提出的問題,可以通過智能應答系統(tǒng)獲取多個原始答案?!耙淮谓Y果”可能包括多個原始答案,當提問者瀏覽完這些原始答案后,發(fā)現(xiàn)答案不滿意的時候,可以選擇將其認為大方向正確的(與提問者設想最接近)原始答案通知智能應答系統(tǒng),智能應答系統(tǒng)再根據(jù)這個提問者指定的解決問題大方向正確的原始答案,獲取改進答案。本申請實施例所述的被提問者評價為不符合要求的原始答案,即為上述“提問者指定的解決問題大方向正確的原始答案”,然而該原始答案的具體內容并不能真正解決問題。
[0159]在本實施例中,所述原始答案的生成過程分為兩個步驟:1)接收客戶端發(fā)送的對應所述待回答問題的詢問請求;2)根據(jù)所述待回答問題和預存的問答關系,獲取所述待回答問題的一個或多個原始答案。
[0160]I)接收客戶端發(fā)送的對應所述待回答問題的詢問請求。
[0161]本申請實施例所述的客戶端包括個人電腦、PAD、iPad等終端設備,以及移動通訊設備,即:通常所說的手機或者智能手機。本申請?zhí)峁┑闹悄軕鸱椒?,其應用場景也不僅僅局限于在線客服系統(tǒng)中的問答結果二次推薦,在其他需要根據(jù)一次結果進行二次推薦的場景下也可以采用本申請所提供的方法,例如:如果某個應用為了提高解決方案的準確性,不僅要求根據(jù)問題檢索一次結果,還需要根據(jù)一次結果推薦具有更高準確性的二次結果,在有類似檢索需求的場景下都可以應用本申請?zhí)峁┑姆椒?,進行問答結果二次推薦。
[0162]2)根據(jù)所述待回答問題和預存的問答關系,獲取所述待回答問題的一個或多個原始答案。
[0163]在接收到客戶端發(fā)送的對應待回答問題的詢問請求后,根據(jù)待回答問題和預先存儲的問答關系,獲取待回答問題的原始答案。原始答案是根據(jù)問答關系獲取的,因此原始答案實質是從“一問一答”的維度,解決提問者提出的問題。
[0164]本申請實施例所述的問答關系中的“問”是指“問題”中包括的關鍵詞,“答”是指“答案”對應的知識點標識。在本實施例中,根據(jù)所述待回答問題和預存的問答關系,獲取待回答問題的一個或多個原始答案,包括:1)解析所述待回答問題,獲取所述待回答問題包括的預先定義的關鍵詞;2)根據(jù)所述關鍵詞和所述問答關系,獲取與所述關鍵詞匹配的答案,作為所述一個或多個原始答案。
[0165]I)解析所述待回答問題,獲取所述待回答問題包括的預先定義的關鍵詞。
[0166]在實際應用中,待回答問題的特征是由其包含的關鍵詞表征的。因此根據(jù)問題獲取答案,實質上是根據(jù)問題中包含的特征關鍵詞獲取答案。關鍵詞是預先定義好的,存儲在關鍵詞庫中。通過關鍵詞庫,可以對待回答問題進行分詞處理,找到問題中包含的特征關鍵詞。例如,待回答問題為:“怎么使用支付寶去支付? ”;關鍵詞庫中含有“名詞:支付寶”、“名詞:余額寶”、“動詞:使用”、“動詞:提現(xiàn)”、“動詞:被盜”、“動詞:支付”等內容,則對待回答問題進行分詞處理后,從中能夠提取出的關鍵詞包括“名詞:支付寶”、“動詞:支付”、“動詞:使用”。
[0167]2)根據(jù)所述關鍵詞和所述問答關系,獲取與所述關鍵詞匹配的答案,作為所述一個或多個原始答案。
[0168]在獲取到待回答問題包括的關鍵詞后,根據(jù)關鍵詞與答案之間的問答關系,檢索獲取與關鍵詞匹配的答案。例如:問答關系i為:關鍵詞“名詞:支付寶”、“動詞:支付”、“動詞:使用”對應知識點m,則上述待回答問題:“怎么使用支付寶去支付? ”的原始答案包括“知識點m”。在本實施例中,通過問答關系檢索到“問題”對應的知識點標識后,再根據(jù)知識點標識獲取到知識點的具體內容,具體內容可以為問題的功略、解決方案、操作步驟等信息。
[0169]當用戶瀏覽完某一個原始答案后,發(fā)現(xiàn)該答案無法解決問題但該答案是解決問題的大方向時,就可以以該答案為檢索依據(jù)執(zhí)行步驟S103,以“結果-結果”的關聯(lián)維度補充“問題-結果”的單一維度,找到該原始答案的改進答案,從而提升解決問題的覆蓋面。
[0170]步驟S103:以所述不符合要求的原始答案中的信息為檢索依據(jù),以預定的標準在預存的知識點集合中檢索,以獲取所述待回答問題的改進答案;所述知識點包括標題和內容。
[0171]本申請實施例提供的方法,是基于這樣一種判斷,即:所述原始答案不符合用戶的要求,無法解決問題,但原始答案是解決問題的大方向。因此,在通過“一次結果”檢索“二次結果”的過程中,可以通過識別原始答案和改進答案的特征,并對二者的特征進行特征相似度計算,在原始答案無法解決用戶問題的時候,給用戶推薦一個更可能解決問題的改進答案。
[0172]在實際應用中,以所述不符合要求的原始答案中的信息為檢索依據(jù),在預存的知識點集合中檢索,以獲取所述待回答問題的改進答案時,所依據(jù)的檢索標準可以有很多種具體的實施方式,下面列舉本實施例中可選的部分具體標準。
[0173]I)標準一
[0174]標準一是指與所述不符合要求的原始答案的標題相似度最高。采用該標準,是將原始答案和改進答案各自的標題作為各自的特征,并根據(jù)該特征,將與原始答案的標題相似度最高的知識點作為待回答問題的改進答案。采用該標準的理論依據(jù)是:由于原始答案和改進答案的標題相似度最高,因此它們具有解決問題的最相似的大方向。例如:原始答案對應“知識點i”,改進答案對應“知識點j”,則“知識點i”和“知識點j”的標題相似度是“知識點i”與其它知識點之間的標題相似度最高的。
[0175]在實際應用中,為提高檢索效率,可以預先計算并存儲任意兩個知識點之間的標題相似度。在檢索改進答案時,對與原始答案有關聯(lián)的所有標題相似度進行排序,找到標題相似度最高值對應的知識點,作為改進答案。根據(jù)具體應用情況,可以設定根據(jù)固定的時間間隔、更新知識點后觸發(fā)等方式,更新任意兩個知識點之間的標題相似度。例如:設定每天的固定閑時時間,更新任意兩個知識點之間的標題相似度。
[0176]請參考圖3,其為本申請的智能應答方法實施例中計算標題相似度的具體流程圖。在本實施例中,任意兩個知識點(第一知識點和第二知識點)之間的標題相似度采用如下步驟計算:
[0177]步驟S301:解析第一知識點和第二知識點的標題,獲取所述第一知識點和第二知識點的標題各自包括的預先定義的關鍵詞,分別作為第一標題關鍵詞集合和第二標題關鍵詞集合。
[0178]步驟S302:根據(jù)所述第一標題關鍵詞集合和第二標題關鍵詞集合,計算所述第一知識點和第二知識點的標題相似度。
[0179]根據(jù)所述第一標題關鍵詞集合和第二標題關鍵詞集合,計算第一知識點和第二知識點的標題相似度的過程,實質為衡量兩個集合(第一標題關鍵詞集合和第二標題關鍵詞集合)的相似度。杰卡德相似系數(shù)是衡量兩個集合的相似度的一種指標。在本實施例中,標題相似度采用杰卡德(Jaccard)相似系數(shù)。兩個集合A和B的交集元素在A和B的并集中所占的比例,稱為兩個集合的杰卡德相似系數(shù),用符號J(A,B)表示。第一知識點和第二知識點的標題相似度可以采用下述公式計算獲取:
[0180]X(A,B) = IA H B I / IA U B
[0181]其中,A為所述第一標題關鍵詞集合,B為所述第二標題關鍵詞集合,X(A,B)為所述標題相似度。
[0182]由于與原始答案的標題相似度最高的改進答案可能為多個,為了獲取最新、最相似的知識點,優(yōu)選的,當與原始答案的標題相似度最高的知識點有多個時,可以選擇更新時間距離當前時間最近的知識點作為改進答案。
[0183]2)標準二
[0184]請參考圖4,其為本申請的智能應答方法實施例中步驟S103的一個具體流程圖。以所述不符合要求的原始答案中的信息為檢索依據(jù),以標準二在預存的知識點集合中檢索,以獲取所述待回答問題的改進答案,包括如下步驟:
[0185]步驟S401:找出與所述不符合要求的原始答案的標題相似度最高的知識點作為候選知識點。
[0186]步驟S402:判斷所述候選知識點中包含的統(tǒng)一資源定位符是否與所述不符合要求的原始答案相同。
[0187]根據(jù)標準二在預存的知識點集合中檢索獲取待回答問題的改進答案,主要分為兩步:通過步驟S401,找出與所述不符合要求的原始答案的標題相似度最高的知識點作為候選知識點;通過步驟S402,判斷所述候選知識點中包含的統(tǒng)一資源定位符是否與所述不符合要求的原始答案相同。采用該標準的理論依據(jù)是:原始答案和改進答案的大方向越近越好,而具體的解決方案越不同越好。原始答案和改進答案的大方向主要是由各自的標題決定的,而具體的解決方案取決于知識點包括的統(tǒng)一資源定位器的鏈接內容。如果原始答案與某一個知識點的標題相似度最高,但內容也相同,則顯然該知識點并不適合作為改進答案。可見,相對于標準一而言,標準二是一個優(yōu)化的實施方式,能夠找到更為準確的改進方案。
[0188]步驟S403:若上述判斷結果為是,則排除該候選知識點,在剩余知識點中找出標題相似度最高的知識點作為所述候選知識點,并返回前一判斷步驟。
[0189]當判定候選知識點中包含的統(tǒng)一資源定位符與原始答案相同時,則將該候選知識點排除,并根據(jù)標題相似度的順序,在剩余知識點中找出標題相似度最高的知識點作為新的候選知識點,判斷新的候選知識點中包含的統(tǒng)一資源定位符是否與原始答案相同。例如:原始答案對應“知識點i”,與其標題相似度最高的知識點為“知識點j”,而“知識點i”和“知識點j”的統(tǒng)一資源定位器相同,即:“知識點i”和“知識點j”的具體內容是相同的,則將“知識點j”排除,在剩余知識點中找出標題相似度最高的知識點作為下一個候選知識點,繼續(xù)查找改進答案。
[0190]步驟S404:若上述判斷結果為否,則將所述候選知識點作為所述改進答案。
[0191]當判定候選知識點中包含的統(tǒng)一資源定位符與原始答案不相同時,則說明該候選知識點與原始答案的解決方案不同,而且大方向較為一致,可以將該知識點作為改進答案。
[0192]3)標準三
[0193]標準三是指與所述不符合要求的原始答案的內容中的段落標題相似度最高。采用該標準,是將原始答案和改進答案各自的內容中的段落標題作為各自的特征,并根據(jù)該特征,將與原始答案的內容中的段落標題相似度最高的知識點作為待回答問題的改進答案。
[0194]判斷原始答案和改進答案的大方向是否近似的依據(jù),既可以為知識點的標題,也可以是知識點的內容中的段落標題。因此,標準三的理論依據(jù)與標準一的理論依據(jù)類似:由于原始答案和改進答案的內容中的段落標題相似度最高,因此它們具有解決問題的最相似的大方向。相對于標準一而言,標準三僅僅將特征由標準一的“標題”變更為“內容中的段落標題”。標準三與標準一實施例內容相同的部分不再贅述,請參見標準一實施例中的相應部分。
[0195]在實際應用中,為提高檢索效率,可以預先計算并存儲任意兩個知識點之間的內容中的段落標題相似度。在檢索改進答案時,對與原始答案有關聯(lián)的所有內容中的段落標題相似度進行排序,找到內容中的段落標題相似度最高值對應的知識點,作為改進答案。根據(jù)具體應用情況,可以設定根據(jù)固定的時間間隔、更新知識點后觸發(fā)等方式,更新任意兩個知識點之間的內容中的段落標題相似度。例如:設定每天的固定閑時時間,更新任意兩個知識點之間的內容中的段落標題相似度。
[0196]在本實施例中,任意兩個知識點(第一知識點和第二知識點)之間的內容中的段落標題相似度采用如下步驟計算:
[0197]步驟S501:解析第一知識點和第二知識點的所述段落標題,獲取所述第一知識點和第二知識點的所述段落標題各自包括的預先定義的關鍵詞,將所述第一知識點的所述段落標題包括的關鍵詞作為第一段落標題的關鍵詞集合,將所述第二知識點的所述段落標題包括的關鍵詞作為第二段落標題的關鍵詞集合。
[0198]步驟S502:根據(jù)所述第一段落標題的關鍵詞集合和第二段落標題的關鍵詞集合,計算所述第一知識點和第二知識點的內容中的段落標題相似度。
[0199]與標準一相同,根據(jù)所述第一段落標題的關鍵詞集合和第二段落標題的關鍵詞集合,計算第一知識點和第二知識點的內容中的段落標題相似度的過程,實質為衡量兩個集合(第一段落標題的關鍵詞集合和第二段落標題的關鍵詞集合)的相似度。在本實施例中,內容中的段落標題相似度采用杰卡德相似系數(shù)。第一知識點和第二知識點的內容中的段落標題相似度可以采用下述公式計算獲取:
[0200]Y (C,D) = I C n D I / I C U D
[0201]其中,C為所述第一段落標題的關鍵詞集合,D為所述第二段落標題的關鍵詞集合,Y(C,D)為所述內容中的段落標題相似度。
[0202]由于與原始答案的內容中的段落標題相似度最高的改進答案可能為多個,為了獲取最新、最相似的知識點,優(yōu)選的,當與原始答案的內容中的段落標題相似度最高的知識點有多個時,選擇更新時間距離當前時間最近的知識點作為改進答案。
[0203]4)標準四
[0204]以所述不符合要求的原始答案中的信息為檢索依據(jù),以標準四在預存的知識點集合中檢索,以獲取所述待回答問題的改進答案,包括如下步驟:
[0205]步驟S601:找出與所述不符合要求的原始答案的內容中的段落標題相似度最高的知識點作為候選知識點。
[0206]步驟S602:判斷所述候選知識點中包含的統(tǒng)一資源定位符是否與所述不符合要求的原始答案相同;若是,則進入步驟S603 ;若否,則進入步驟S604。
[0207]與標準二類似,根據(jù)標準四在預存的知識點集合中檢索獲取待回答問題的改進答案,主要分為兩步:通過步驟S601,找出與所述不符合要求的原始答案的內容中的段落標題相似度最高的知識點作為候選知識點;通過步驟S602,判斷所述候選知識點中包含的統(tǒng)一資源定位符是否與所述不符合要求的原始答案相同。相對于標準二而言,標準四僅僅將特征由標準二的“標題”變更為“內容中的段落標題”,標準四是將原始答案和改進答案各自的內容中的段落標題作為各自的特征,并根據(jù)該特征,將與原始答案的內容中的段落標題相似度最高的知識點作為候選知識點。標準四與標準二實施例內容相同的部分不再贅述,請參見標準二實施例中的相應部分。
[0208]采用該標準的理論依據(jù)是:原始答案和改進答案的大方向越近越好,而具體的解決方案越不同越好。在標準四中,原始答案和改進答案的大方向主要是由各自的內容中的段落標題決定的,而具體的解決方案取決于知識點包括的統(tǒng)一資源定位器的鏈接內容。如果原始答案與某一個知識點的內容中的段落標題相似度最高,而內容也相同,則顯然該知識點并不適合作為改進答案??梢姡鄬τ跇藴嗜?,標準四是一個優(yōu)化的實施方式,能夠找到更為準確的改進方案。
[0209]步驟S603:若上述判斷結果為是,則排除該候選知識點,在剩余知識點中找出內容中的段落標題相似度最高的知識點作為所述候選知識點,并返回前一判斷步驟。
[0210]步驟S604:若上述判斷結果為否,則將所述候選知識點作為所述改進答案。
[0211]5)標準五
[0212]標準五是根據(jù)與所述不符合要求的原始答案的標題相似度、內容中的段落標題相似度和統(tǒng)一資源定位器相似度,計算整體相似度,以整體相似度與所述不符合要求的原始答案最接近的知識點作為改進知識點;所述整體相似度采用如下計算公式:
[0213]W = X*N1+Y*N2 - Z*N3
[0214]其中,W為所述整體相似度,X為所述標題相似度,Y為所述段落標題相似度,Z為所述統(tǒng)一資源定位器相似度,NI為所述標題相似度的權重,N2為所述段落標題相似度的權重,N3為所述統(tǒng)一資源定位器的權重。
[0215]標準五綜合考慮標題相似度、內容中的段落標題相似度和統(tǒng)一資源定位器相似度,計算獲取兩個知識點的整體相似度,因此相對于上述四個標準,標準五是一個優(yōu)選的標準。采用該標準的理論依據(jù)是:原始答案和改進答案的大方向越近越好,而具體的解決方案越不同越好。標準五中大方向的判斷綜合考慮了知識點標題和內容中的段落標題兩個部分,因而大方向的判斷結果更為準確。
[0216]在本實施例中,通過大量試驗計算獲取標題相似度的權重、段落標題相似度的權重和統(tǒng)一資源定位器相似度的權重的經驗值,分別為:標題相似度的權重值NI為100、段落標題相似度的權重值為10、統(tǒng)一資源定位器相似度的權重值為100。上述各個權重值是一個通過大量試驗獲取的經驗值,權重值還可以通過機器學習的方式自動獲取。通過各個權重的經驗值可見,本申請實施例中的段落標題相似度的權重值明顯小于標題相似度的權重值,可見相對于段落標題相似度而言,標題相似度是決定大方向的主要因素,這與實際情況是相符合的。并且,由于希望兩個知識點之間具體的解決方案越不同越好,因此將段落標題相似度與標題相似度之和,減去統(tǒng)一資源定位器相似度,計算獲取整體相似度。
[0217]其中,標題相似度和段落標題相似度的計算方法與上述標準內容相同的部分不再贅述,請參見相關標準中的相應部分。任意兩個知識點(第一知識點和第二知識點)之間的內容中的統(tǒng)一資源定位器相似度采用如下步驟計算:
[0218]步驟S701:解析第一知識點和第二知識點的各個內容,獲取所述第一知識點和第二知識點的各自包括的統(tǒng)一資源定位器,分別作為第一統(tǒng)一資源定位器集合和第二統(tǒng)一資源定位器集合。
[0219]步驟S702:根據(jù)所述第一統(tǒng)一資源定位器集合和第二統(tǒng)一資源定位器集合,計算所述第一知識點和第二知識點的所述統(tǒng)一資源定位器相似度。
[0220]在本實施例中,內容中的統(tǒng)一資源定位器相似度采用杰卡德相似系數(shù)。第一知識點和第二知識點的內容中的統(tǒng)一資源定位器相似度可以采用下述公式計算獲取:
[0221]Z(E,F(xiàn)) = E H F|/|E U F
[0222]其中,E為所述第一統(tǒng)一資源定位器集合,F(xiàn)為所述第二統(tǒng)一資源定位器集合,Z(E,F(xiàn))為所述統(tǒng)一資源定位器相似度。
[0223]6)標準六
[0224]標準六是標準五的一個優(yōu)化標準,該標準還考慮了知識點的更新時間因素,對于預設更新時間內的知識點,根據(jù)其具體的更新時間,計算整體相似度。更新時間越近的知識點,其整體相似度越高。采用標準六獲取改進答案,包括如下步驟:
[0225]步驟S801:判斷當前時間與知識點的最近更新時間的時間間隔是否小于等于第一預設時間間隔。
[0226]步驟S802:若上述判斷結果為是,則根據(jù)與所述不符合要求的原始答案的標題相似度、內容中的段落標題相似度和統(tǒng)一資源定位器相似度,以及所述當前時間與所述知識點的最近更新時間的時間間隔,計算整體相似度,以所述整體相似度與所述不符合要求的原始答案最接近的知識點作為改進知識點;所述整體相似度采用如下計算公式:
[0227]W = X*N1+Y*N2 - Z*N3+N4*(Ts_t)
[0228]其中,W為所述整體相似度,X為所述標題相似度,Y為所述段落標題相似度,Z為所述統(tǒng)一資源定位器相似度,NI為所述標題相似度的權重,N2為所述段落標題相似度的權重,N3為所述統(tǒng)一資源定位器的權重,N4為預設的時間權重,Ts為所述第一預設時間間隔,t為所述當前時間與所述知識點的最近更新時間的時間間隔。
[0229]標準六與標準五內容相同的部分不再贅述,請參見標準五中的相應部分。在標準六的公式中,N4為預設的時間權重,Ts為所述第一預設時間間隔,這兩個權重值也是可以通過大量試驗獲取的經驗值,還可以通過機器學習的方式自動獲取。例如:N4取值為3、Ts取值為10、t為5,其含義為:兩個知識點之間的整體相似度在標準五的基礎上,再加上15分,即:更新時間越近的知識點,其整體相似度越高。
[0230]與標準一至標準四同理,對于標準五和標準六而言,在實際應用中,為提高檢索效率,可以預先計算并存儲任意兩個知識點之間的整體相似度。在檢索改進答案時,對與原始答案有關聯(lián)的所有整體相似度進行排序,找到整體相似度最高值對應的知識點,作為改進答案。根據(jù)具體應用情況,可以設定根據(jù)固定的時間間隔、更新知識點后觸發(fā)等方式,更新任意兩個知識點之間的整體相似度。例如:設定每天的固定閑時時間,更新任意兩個知識點之間的整體相似度。
[0231]通過上述六種標準,以所述不符合要求的原始答案中的信息為檢索依據(jù),能夠在預存的知識點集合中檢索獲取待回答問題的不同準確程度的改進答案。在實際應用中,可以根據(jù)具體需求選擇合適的標準,獲取原始答案的改進答案。
[0232]在實施本申請?zhí)峁┑姆椒〞r,考慮到知識點的新舊因素,對于各種檢索改進答案的預定標準,還可以在各個標準的基礎上包括:僅將規(guī)定時間閾值范圍內更新的知識點作為檢索獲取所述改進答案的范圍;所述時間閾值為當前時間與所述知識點的最近更新時間的時間間隔長度的預設值。通過該方法,能夠限定改進答案的更新時間,避免較早的知識點,例如:各種網站地址已經過期,或者解決問題的軟件已經改版等問題,從而獲取到最新的知識點。例如:將時間閾值設定為365天,則該方案獲取的改進答案的更新時間一定為365天內更新的知識點。
[0233]在上述的實施例中,提供了一種智能應答方法,與之相對應的,本申請還提供一種智能應答裝置。請參看圖5,其為本申請的智能應答裝置實施例的示意圖。該裝置是與上述智能應答方法的實施例相對應。
[0234]由于裝置實施例基本相似于方法實施例,所以描述得比較簡單,相關之處參見方法實施例的部分說明即可。下述描述的裝置實施例僅僅是示意性的。
[0235]本實施例的一種智能應答裝置,包括:獲取單元101,用于獲取對應特定待回答問題的被提問者評價為不符合要求的原始答案;檢索單元103,用于以所述不符合要求的原始答案中的信息為檢索依據(jù),以預定的標準在預存的知識點集合中檢索,以獲取所述待回答問題的改進答案;所述知識點包括標題和內容。
[0236]請參看圖6,其為本申請的智能應答裝置實施例中檢索單元103的具體示意圖??蛇x的,所述檢索單元103包括:
[0237]第一檢索子單元1031,用于以所述不符合要求的原始答案中的信息為檢索依據(jù),以所述改進答案與所述不符合要求的原始答案的標題相似度最高為檢索標準,在所述預存的知識點集合中檢索,以獲取所述待回答問題的所述改進答案。
[0238]可選的,所述檢索單元103包括:
[0239]第二檢索子單元1032,用于以所述不符合要求的原始答案中的信息為檢索依據(jù),在所述預存的知識點集合中檢索,以獲取所述待回答問題的所述改進答案。
[0240]請參看圖7,其為本申請的智能應答裝置實施例中第二檢索單元1032的具體示意圖。可選的,所述第二檢索子單元1032包括:
[0241]第一查找子單元10321,用于找出與所述不符合要求的原始答案的標題相似度最高的知識點作為候選知識點;
[0242]判斷子單元10322,用于判斷所述候選知識點中包含的統(tǒng)一資源定位符是否與所述不符合要求的原始答案相同;
[0243]第二查找子單元10323,用于若所述候選知識點中包含的統(tǒng)一資源定位符與所述不符合要求的原始答案相同,則排除該候選知識點,在剩余知識點中找出標題相似度最高的知識點作為所述候選知識點,并返回前一判斷步驟;
[0244]判定子單元10324,用于若所述候選知識點中包含的統(tǒng)一資源定位符與所述不符合要求的原始答案不相同,則將所述候選知識點作為所述改進答案。
[0245]可選的,所述檢索單元103包括:
[0246]第三檢索子單元1033,用于以所述不符合要求的原始答案中的信息為檢索依據(jù),以所述改進答案與所述不符合要求的原始答案的內容中的段落標題相似度最高為檢索標準,在所述預存的知識點集合中檢索,以獲取所述待回答問題的所述改進答案。
[0247]可選的,所述檢索單元103包括:
[0248]第四檢索子單元1034,用于以所述不符合要求的原始答案中的信息為檢索依據(jù),在所述預存的知識點集合中檢索,以獲取所述待回答問題的所述改進答案;
[0249]所述第四檢索子單元1034包括:
[0250]第一查找子單元10341,用于找出與所述不符合要求的原始答案的內容中的段落標題相似度最尚的知識點作為候選知識點;
[0251]判斷子單元10342,用于判斷所述候選知識點中包含的統(tǒng)一資源定位符是否與所述不符合要求的原始答案相同;
[0252]第二查找子單元10343,用于若所述候選知識點中包含的統(tǒng)一資源定位符與所述不符合要求的原始答案相同,則排除該候選知識點,在剩余知識點中找出內容中的段落標題相似度最高的知識點作為所述候選知識點,并返回前一判斷步驟;
[0253]判定子單元10344,用于若所述候選知識點中包含的統(tǒng)一資源定位符與所述不符合要求的原始答案不相同,則將所述候選知識點作為所述改進答案。
[0254]可選的,所述檢索單元103包括:
[0255]第五檢索子單元1035,用于以所述不符合要求的原始答案中的信息為檢索依據(jù),以原始改進答案與所述不符合要求的原始答案的整體相似度最高為檢索標準,在所述預存的知識點集合中檢索,以獲取所述待回答問題的所述改進答案;
[0256]所述整體相似度是根據(jù)與所述不符合要求的原始答案的標題相似度、內容中的段落標題相似度和統(tǒng)一資源定位器相似度計算獲取的;所述整體相似度采用如下計算公式:
[0257]W = X*N1+Y*N2 - Z*N3
[0258]其中,W為所述整體相似度,X為所述標題相似度,Y為所述段落標題相似度,Z為所述統(tǒng)一資源定位器相似度,NI為所述標題相似度的權重,N2為所述段落標題相似度的權重,N3為所述統(tǒng)一資源定位器的權重。
[0259]可選的,所述檢索單元103包括:
[0260]第六檢索子單元1036,用于以所述不符合要求的原始答案中的信息為檢索依據(jù),以所述改進答案與所述不符合要求的原始答案的整體相似度最高為檢索標準,在所述預存的知識點集合中檢索,以獲取所述待回答問題的所述改進答案;
[0261]所述整體相似度是根據(jù)與所述不符合要求的原始答案的標題相似度、內容中的段落標題相似度和統(tǒng)一資源定位器相似度,以及所述當前時間與知識點的最近更新時間的時間間隔計算獲取的;所述整體相似度采用如下計算公式:
[0262]W = X*N1+Y*N2 - Z*N3+N4*(Ts_t)
[0263]其中,W為所述整體相似度,X為所述標題相似度,Y為所述段落標題相似度,Z為所述統(tǒng)一資源定位器相似度,NI為所述標題相似度的權重,N2為所述段落標題相似度的權重,N3為所述統(tǒng)一資源定位器的權重,N4為預設的時間權重,Ts為所述預設的時間間隔,t為所述當前時間與所述知識點的最近更新時間的時間間隔。
[0264]請參看圖8,其為本申請的智能應答裝置實施例的具體示意圖??蛇x的,其特征在于,所述裝置還包括:
[0265]第一計算子單元201,用于計算任意兩個知識點的所述標題相似度。
[0266]請參看圖9,其為本申請的智能應答裝置實施例中第一計算單元201的具體示意圖。可選的,所述第一計算子單元201包括:
[0267]解析子單元2011,用于解析第一知識點和第二知識點的標題,獲取所述第一知識點和第二知識點的標題各自包括的預先定義的關鍵詞,分別作為第一標題關鍵詞集合和第二標題關鍵詞集合;
[0268]計算子單元2012,用于根據(jù)所述第一標題關鍵詞集合和第二標題關鍵詞集合,計算所述第一知識點和第二知識點的標題相似度。
[0269]可選的,所述裝置還包括:
[0270]第二計算子單元202,用于計算任意兩個知識點的所述內容中的段落標題相似度;
[0271 ] 所述第二計算子單元202包括:
[0272]解析子單元2021,用于解析第一知識點和第二知識點的所述段落標題,獲取所述第一知識點和第二知識點的所述段落標題各自包括的預先定義的關鍵詞,將所述第一知識點的所述段落標題包括的關鍵詞作為第一段落標題的關鍵詞集合,將所述第二知識點的所述段落標題包括的關鍵詞作為第二段落標題的關鍵詞集合;
[0273]計算子單元10382,用于根據(jù)所述第一段落標題的關鍵詞集合和第二段落標題的關鍵詞集合,計算所述第一知識點和第二知識點的內容中的段落標題相似度。
[0274]可選的,所述裝置還包括:
[0275]第三計算子單元203,用于計算任意兩個知識點的所述內容中的統(tǒng)一資源定位器相似度;
[0276]所述第三計算子單元203包括:
[0277]解析子單元2031,用于解析第一知識點和第二知識點的各個內容,獲取所述第一知識點和第二知識點的各自包括的統(tǒng)一資源定位器,分別作為第一統(tǒng)一資源定位器集合和第二統(tǒng)一資源定位器集合;
[0278]計算子單元2032,用于根據(jù)所述第一統(tǒng)一資源定位器集合和第二統(tǒng)一資源定位器集合,計算所述第一知識點和第二知識點的所述統(tǒng)一資源定位器相似度。
[0279]可選的,所述裝置還包括:
[0280]第四計算子單元204,用于計算任意兩個知識點的所述整體相似度。
[0281]可選的,所述裝置還包括:
[0282]生成單元205,用于生成所述不符合要求的原始答案。
[0283]請參看圖10,其為本申請的智能應答裝置實施例中生成單元205的具體示意圖??蛇x的,所述生成單元205包括:
[0284]接收子單元2051,用于接收客戶端發(fā)送的對應所述待回答問題的詢問請求;
[0285]獲取子單元2052,用于根據(jù)所述待回答問題和預存的問答關系,獲取所述待回答問題的所述一個或多個原始答案;
[0286]選取子單元2053,用于將提問者從所述一個或多個原始答案中選取的一個原始答案,作為所述不符合要求的原始答案。
[0287]可選的,所述獲取子單元2052包括:
[0288]解析子單元20521,用于解析所述待回答問題,獲取所述待回答問題包括的預先定義的關鍵詞;
[0289]查詢子單元20522,用于根據(jù)所述關鍵詞和所述問答關系,獲取與所述關鍵詞匹配的答案,作為所述一個或多個原始答案。
[0290]本申請實施例還提供了一種智能應答系統(tǒng),包括上述的智能應答裝置。
[0291]此外,本申請實施例還提供了一種電子設備,如圖11所示,該電子設備包括:顯示器1101 ;處理器1102 ;以及存儲器1103,所述存儲器1103被配置成存儲待回答問題,所述待回答問題被所述處理器1102執(zhí)行時,在所述顯示器1101顯示所述待回答問題的改進答案,所述改進答案是以被提問者評價為不符合要求的原始答案中的信息為檢索依據(jù),以預定的標準在預存的知識點集合中檢索獲取的,所述原始答案是根據(jù)所述待回答問題和預存的問答關系生成的。
[0292]本申請實施例所述的電子設備包括個人電腦、PAD、iPad等終端設備,以及移動通訊設備,即:通常所說的手機或者智能手機。電子設備還可以是穿戴式智能設備,例如,蘋果手表或者谷歌眼鏡。
[0293]本申請實施例所述的知識點和問答關系既可以存儲在電子設備中,也可以存儲在與電子設備聯(lián)網的服務器中。知識點和問答關系存儲在電子設備中的優(yōu)點在于,回答問題的速度更快;而缺點在于無法統(tǒng)一管理知識點和問答關系。
[0294]在本實施例中,電子設備作為一個聯(lián)網設備,問題的提問和回答需要和互聯(lián)網上的服務器交互。因此,所述知識點和所述問答關系存儲在服務器端,而非存儲在電子設備的存儲器中。
[0295]通過將知識點和問答關系存儲在服務器端,能夠統(tǒng)一管理知識點和問答關系,在更新知識點和問答關系時僅需更新服務器端,避免將知識點和問答關系存儲在電子設備中可能導致的數(shù)據(jù)不一致的問題。
[0296]在實際應用中,當電子設備獲取到問題的改進答案后,還可以將改進答案存儲在電子設備的存儲器中,以便于后續(xù)當電子設備離線時,能夠隨時獲取已經回答過的問題的改進答案。
[0297]本申請?zhí)峁┑闹悄軕鸱椒?、裝置、系統(tǒng)及電子設備,通過獲取對應特定待回答問題的被提問者評價為不符合要求的原始答案,并以所述不符合要求的原始答案中的信息為檢索依據(jù),以預定的標準在預存的知識點集合中檢索,以獲取所述待回答問題的改進答案,使得在查詢檢索到與待回答問題直接對應的答案后,還能夠根據(jù)提問者選擇的不符合要求的原始答案進行二次檢索,獲取待回答問題的改進答案。由于提問者對原始答案的選擇反映了提問者對答案的需求,可以將其作為新的檢索依據(jù)。因此,本方法能夠在現(xiàn)有技術已經難以通過待回答問題本身包含的信息提高答案覆蓋面和準確率的情況下,通過引入新的檢索依據(jù)提高答案的覆蓋面以及準確率。
[0298]本申請雖然以較佳實施例公開如上,但其并不是用來限定本申請,任何本領域技術人員在不脫離本申請的精神和范圍內,都可以做出可能的變動和修改,因此本申請的保護范圍應當以本申請權利要求所界定的范圍為準。
[0299]在一個典型的配置中,計算設備包括一個或多個處理器(CPU)、輸入/輸出接口、網絡接口和內存。
[0300]內存可能包括計算機可讀介質中的非永久性存儲器,隨機存取存儲器(RAM)和/或非易失性內存等形式,如只讀存儲器(ROM)或閃存(flash RAM)。內存是計算機可讀介質的示例。
[0301]1、計算機可讀介質包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術來實現(xiàn)信息存儲。信息可以是計算機可讀指令、數(shù)據(jù)結構、程序的模塊或其他數(shù)據(jù)。計算機的存儲介質的例子包括,但不限于相變內存(PRAM)、靜態(tài)隨機存取存儲器(SRAM)、動態(tài)隨機存取存儲器(DRAM)、其他類型的隨機存取存儲器(RAM)、只讀存儲器(ROM)、電可擦除可編程只讀存儲器(EEPROM)、快閃記憶體或其他內存技術、只讀光盤只讀存儲器(CD-ROM)、數(shù)字多功能光盤(DVD)或其他光學存儲、磁盒式磁帶,磁帶磁磁盤存儲或其他磁性存儲設備或任何其他非傳輸介質,可用于存儲可以被計算設備訪問的信息。按照本文中的界定,計算機可讀介質不包括非暫存電腦可讀媒體(transitory media),如調制的數(shù)據(jù)信號和載波。
[0302]2、本領域技術人員應明白,本申請的實施例可提供為方法、系統(tǒng)或計算機程序產品。因此,本申請可采用完全硬件實施例、完全軟件實施例或結合軟件和硬件方面的實施例的形式。而且,本申請可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(包括但不限于磁盤存儲器、CD-ROM、光學存儲器等)上實施的計算機程序產品的形式。
【主權項】
1.一種智能應答方法,其特征在于,包括: 獲取對應特定待回答問題的被提問者評價為不符合要求的原始答案; 以所述不符合要求的原始答案中的信息為檢索依據(jù),以預定的標準在預存的知識點集合中檢索,以獲取所述待回答問題的改進答案;所述知識點包括標題和內容。2.根據(jù)權利要求1所述的智能應答方法,其特征在于,所述不符合要求的原始答案包括標題; 所述預定的標準包括:與所述不符合要求的原始答案的標題相似度最高。3.根據(jù)權利要求2所述的智能應答方法,其特征在于,若與所述不符合要求的原始答案的標題相似度最高的知識點有多個,則選擇更新時間距離當前時間最近的知識點作為所述改進答案。4.根據(jù)權利要求1所述的智能應答方法,其特征在于,所述不符合要求的原始答案包括標題; 所述預定的標準包括: 找出與所述不符合要求的原始答案的標題相似度最高的知識點作為候選知識點; 判斷所述候選知識點中包含的統(tǒng)一資源定位符是否與所述不符合要求的原始答案相同; 若是,則排除該候選知識點,在剩余知識點中找出標題相似度最高的知識點作為所述候選知識點,并返回前一判斷步驟; 若否,則將所述候選知識點作為所述改進答案。5.根據(jù)權利要求1所述的智能應答方法,其特征在于,所述預定的標準包括:與所述不符合要求的原始答案的內容中的段落標題相似度最高。6.根據(jù)權利要求5所述的智能應答方法,其特征在于,若與所述不符合要求的原始答案的內容中的段落標題相似度最高的知識點有多個,則選擇更新時間距離當前時間最近的知識點作為所述改進答案。7.根據(jù)權利要求1所述的智能應答方法,其特征在于,所述預定的標準包括: 找出與所述不符合要求的原始答案的內容中的段落標題相似度最高的知識點作為候選知識點; 判斷所述候選知識點中包含的統(tǒng)一資源定位符是否與所述不符合要求的原始答案相同; 若是,則排除該候選知識點,在剩余知識點中找出內容中的段落標題相似度最高的知識點作為所述候選知識點,并返回前一判斷步驟; 若否,則將所述候選知識點作為所述改進答案。8.根據(jù)權利要求1所述的智能應答方法,其特征在于,所述預定的標準包括:根據(jù)與所述不符合要求的原始答案的標題相似度、內容中的段落標題相似度和統(tǒng)一資源定位器相似度,計算整體相似度,以所述整體相似度與所述不符合要求的原始答案最接近的知識點作為改進知識點;所述整體相似度采用如下計算公式:W = X*N1+Y*N2 - Z*N3 其中,W為所述整體相似度,X為所述標題相似度,Y為所述段落標題相似度,Z為所述統(tǒng)一資源定位器相似度,NI為所述標題相似度的權重,N2為所述段落標題相似度的權重,N3為所述統(tǒng)一資源定位器的權重。9.根據(jù)權利要求1所述的智能應答方法,其特征在于,所述預定的標準包括: 判斷當前時間與知識點的最近更新時間的時間間隔是否小于等于第一預設時間間隔; 若上述判斷結果為是,則根據(jù)與所述不符合要求的原始答案的標題相似度、內容中的段落標題相似度和統(tǒng)一資源定位器相似度,以及所述當前時間與所述知識點的最近更新時間的時間間隔,計算整體相似度,以所述整體相似度與所述不符合要求的原始答案最接近的知識點作為改進知識點;所述整體相似度采用如下計算公式:W = X*N1+Y*N2 - Z*N 3+N4*(Ts-t) 其中,W為所述整體相似度,X為所述標題相似度,Y為所述段落標題相似度,Z為所述統(tǒng)一資源定位器相似度,NI為所述標題相似度的權重,N2為所述段落標題相似度的權重,N3為所述統(tǒng)一資源定位器的權重,N4為預設的時間權重,Ts為所述第一預設時間間隔,t為所述當前時間與所述知識點的最近更新時間的時間間隔。10.根據(jù)權利要求1-9任意一項所述的智能應答方法,其特征在于,所述預定的標準包括:僅將規(guī)定時間閾值范圍內更新的知識點作為檢索獲取所述改進答案的范圍;所述時間閾值為當前時間與所述知識點的最近更新時間的時間間隔長度的預設值。11.根據(jù)權利要求2、3、4、8或9任意一項所述的智能應答方法,其特征在于,在所述以預定的標準在預存的知識點集合中檢索獲取所述待回答問題的改進答案之前,還包括: 計算并存儲任意兩個知識點的所述標題相似度。12.根據(jù)權利要求11所述的智能應答方法,其特征在于,根據(jù)第二預設時間間隔或者當更新所述知識點時,計算并存儲任意兩個知識點的所述標題相似度。13.根據(jù)權利要求11所述的智能應答方法,其特征在于,所述計算任意兩個知識點的所述標題相似度包括: 解析第一知識點和第二知識點的標題,獲取所述第一知識點和第二知識點的標題各自包括的預先定義的關鍵詞,分別作為第一標題關鍵詞集合和第二標題關鍵詞集合; 根據(jù)所述第一標題關鍵詞集合和第二標題關鍵詞集合,計算所述第一知識點和第二知識點的標題相似度。14.根據(jù)權利要求13所述的智能應答方法,其特征在于,所述標題相似度采用下述公式計算獲取:X(A,B) = |Α η B I / IAUB 其中,A為所述第一標題關鍵詞集合,B為所述第二標題關鍵詞集合,X(A,B)為所述標題相似度。15.根據(jù)權利要求5、6、7、8或9任意一項所述的智能應答方法,其特征在于,在所述以預定的標準在預存的知識點集合中檢索獲取所述待回答問題的改進答案之前,還包括: 計算并存儲任意兩個知識點的所述內容中的段落標題相似度。16.根據(jù)權利要求15所述的智能應答方法,其特征在于,根據(jù)第二預設時間間隔或者當更新所述知識點時,計算并存儲任意兩個知識點的所述內容中的段落標題相似度。17.根據(jù)權利要求15所述的智能應答方法,其特征在于,所述計算任意兩個知識點的所述內容中的段落標題相似度包括: 解析第一知識點與第二知識點的所述段落標題,獲取所述第一知識點與第二知識點的所述段落標題各自包括的預先定義的關鍵詞,將所述第一知識點的所述段落標題包括的關鍵詞作為第一段落標題的關鍵詞集合,將所述第二知識點的所述段落標題包括的關鍵詞作為第二段落標題的關鍵詞集合; 根據(jù)所述第一段落標題的關鍵詞集合和第二段落標題的關鍵詞集合,計算所述第一知識點與第二知識點的內容中的段落標題相似度。18.根據(jù)權利要求17所述的智能應答方法,其特征在于,所述內容中的段落標題相似度采用下述公式計算獲取: Y (C,D) = I C n D I / I CUD 其中,C為所述第一段落標題的關鍵詞集合,D為所述第二段落標題的關鍵詞集合,Y(C,D)為所述內容中的段落標題相似度。19.根據(jù)權利要求4、7、8或9任意一項所述的智能應答方法,其特征在于,在所述以預定的標準在預存的知識點集合中檢索獲取所述待回答問題的改進答案之前,還包括: 計算并存儲任意兩個知識點的所述內容中的統(tǒng)一資源定位器相似度。20.根據(jù)權利要求19所述的智能應答方法,其特征在于,根據(jù)第二預設時間間隔或者當更新所述知識點時,計算并存儲任意兩個知識點的所述內容中的統(tǒng)一資源定位器相似度。21.根據(jù)權利要求19所述的智能應答方法,其特征在于,所述計算任意兩個知識點的所述內容中的統(tǒng)一資源定位器相似度包括: 解析第一知識點與第二知識點的各個內容,獲取所述第一知識點與第二知識點的各自包括的統(tǒng)一資源定位器,分別作為第一統(tǒng)一資源定位器集合和第二統(tǒng)一資源定位器集合; 根據(jù)所述第一統(tǒng)一資源定位器集合和第二統(tǒng)一資源定位器集合,計算所述第一知識點與第二知識點的所述統(tǒng)一資源定位器相似度。22.根據(jù)權利要求21所述的智能應答方法,其特征在于,所述統(tǒng)一資源定位器相似度采用下述公式計算獲取:z(e,F(xiàn)) = |e n FI/1euf 其中,E為所述第一統(tǒng)一資源定位器集合,F(xiàn)為所述第二統(tǒng)一資源定位器集合,Z(E,F(xiàn))為所述統(tǒng)一資源定位器相似度。23.根據(jù)權利要求8或9所述的智能應答方法,其特征在于,在所述以預定的標準在預存的知識點集合中檢索獲取所述待回答問題的改進答案之前,還包括: 計算并存儲任意兩個知識點的所述整體相似度。24.根據(jù)權利要求23所述的智能應答方法,其特征在于,根據(jù)第二預設時間間隔或者當更新所述知識點時,計算并存儲任意兩個知識點的所述整體相似度。25.根據(jù)權利要求1所述的智能應答方法,其特征在于,所述不符合要求的原始答案采用如下步驟生成: 接收客戶端發(fā)送的對應所述待回答問題的詢問請求; 根據(jù)所述待回答問題和預存的問答關系,獲取所述待回答問題的一個或多個原始答案; 將提問者從所述一個或多個原始答案中選取的一個原始答案,作為所述不符合要求的原始答案。26.根據(jù)權利要求25所述的智能應答方法,其特征在于,所述根據(jù)所述待回答問題和預存的問答關系,獲取所述待回答問題的一個或多個原始答案,包括: 解析所述待回答問題,獲取所述待回答問題包括的預先定義的關鍵詞; 根據(jù)所述關鍵詞和所述問答關系,獲取與所述關鍵詞匹配的答案,作為所述一個或多個原始答案。27.根據(jù)權利要求1所述的智能應答方法,其特征在于,所述知識點是結構化文檔。28.一種智能應答裝置,其特征在于,包括: 獲取單元,用于獲取對應特定待回答問題的被提問者評價為不符合要求的原始答案; 檢索單元,用于以所述不符合要求的原始答案中的信息為檢索依據(jù),以預定的標準在預存的知識點集合中檢索,以獲取所述待回答問題的改進答案;所述知識點包括標題和內容。29.根據(jù)權利要求28所述的智能應答裝置,其特征在于,所述檢索單元包括: 第一檢索子單元,用于以所述不符合要求的原始答案中的信息為檢索依據(jù),以所述改進答案與所述不符合要求的原始答案的標題相似度最高為檢索標準,在所述預存的知識點集合中檢索,以獲取所述待回答問題的所述改進答案。30.根據(jù)權利要求28所述的智能應答裝置,其特征在于,所述檢索單元包括: 第二檢索子單元,用于以所述不符合要求的原始答案中的信息為檢索依據(jù),在所述預存的知識點集合中檢索,以獲取所述待回答問題的所述改進答案; 所述第二檢索子單元包括: 第一查找子單元,用于找出與所述不符合要求的原始答案的標題相似度最高的知識點作為候選知識點; 判斷子單元,用于判斷所述候選知識點中包含的統(tǒng)一資源定位符是否與所述不符合要求的原始答案相同; 第二查找子單元,用于若所述候選知識點中包含的統(tǒng)一資源定位符與所述不符合要求的原始答案相同,則排除該候選知識點,在剩余知識點中找出標題相似度最高的知識點作為所述候選知識點,并返回前一判斷步驟; 判定子單元,用于若所述候選知識點中包含的統(tǒng)一資源定位符與所述不符合要求的原始答案不相同,則將所述候選知識點作為所述改進答案。31.根據(jù)權利要求28所述的智能應答裝置,其特征在于,所述檢索單元包括: 第三檢索子單元,用于以所述不符合要求的原始答案中的信息為檢索依據(jù),以所述改進答案與所述不符合要求的原始答案的內容中的段落標題相似度最高為檢索標準,在所述預存的知識點集合中檢索,以獲取所述待回答問題的所述改進答案。32.根據(jù)權利要求28所述的智能應答裝置,其特征在于,所述檢索單元包括: 第四檢索子單元,用于以所述不符合要求的原始答案中的信息為檢索依據(jù),在所述預存的知識點集合中檢索,以獲取所述待回答問題的所述改進答案; 所述第四檢索子單元包括: 第一查找子單元,用于找出與所述不符合要求的原始答案的內容中的段落標題相似度最尚的知識點作為候選知識點; 判斷子單元,用于判斷所述候選知識點中包含的統(tǒng)一資源定位符是否與所述不符合要求的原始答案相同; 第二查找子單元,用于若所述候選知識點中包含的統(tǒng)一資源定位符與所述不符合要求的原始答案相同,則排除該候選知識點,在剩余知識點中找出內容中的段落標題相似度最高的知識點作為所述候選知識點,并返回前一判斷步驟; 判定子單元,用于若所述候選知識點中包含的統(tǒng)一資源定位符與所述不符合要求的原始答案不相同,則將所述候選知識點作為所述改進答案。33.根據(jù)權利要求28所述的智能應答裝置,其特征在于,所述檢索單元包括: 第五檢索子單元,用于以所述不符合要求的原始答案中的信息為檢索依據(jù),以原始改進答案與所述不符合要求的原始答案的整體相似度最高為檢索標準,在所述預存的知識點集合中檢索,以獲取所述待回答問題的所述改進答案; 所述整體相似度是根據(jù)與所述不符合要求的原始答案的標題相似度、內容中的段落標題相似度和統(tǒng)一資源定位器相似度計算獲取的;所述整體相似度采用如下計算公式:W = X*N1+Y*N2 - Z*N3 其中,W為所述整體相似度,X為所述標題相似度,Y為所述段落標題相似度,Z為所述統(tǒng)一資源定位器相似度,NI為所述標題相似度的權重,N2為所述段落標題相似度的權重,N3為所述統(tǒng)一資源定位器的權重。34.根據(jù)權利要求28所述的智能應答裝置,其特征在于,所述檢索單元包括: 第六檢索子單元,用于以所述不符合要求的原始答案中的信息為檢索依據(jù),以所述改進答案與所述不符合要求的原始答案的整體相似度最高為檢索標準,在所述預存的知識點集合中檢索,以獲取所述待回答問題的所述改進答案; 所述整體相似度是根據(jù)與所述不符合要求的原始答案的標題相似度、內容中的段落標題相似度和統(tǒng)一資源定位器相似度,以及所述當前時間與知識點的最近更新時間的時間間隔計算獲取的;所述整體相似度采用如下計算公式:W = X*N1+Y*N2 - Z*N3+N4*(Ts-t) 其中,W為所述整體相似度,X為所述標題相似度,Y為所述段落標題相似度,Z為所述統(tǒng)一資源定位器相似度,NI為所述標題相似度的權重,N2為所述段落標題相似度的權重,N3為所述統(tǒng)一資源定位器的權重,N4為預設的時間權重,Ts為第一預設時間間隔,t為所述當前時間與所述知識點的最近更新時間的時間間隔。35.根據(jù)權利要求29、30、33或34任意一項所述的智能應答裝置,其特征在于,所述裝置還包括: 第一計算子單元,用于計算任意兩個知識點的所述標題相似度; 所述第一計算子單元包括: 解析子單元,用于解析第一知識點和第二知識點的標題,獲取所述第一知識點和第二知識點的標題各自包括的預先定義的關鍵詞,分別作為第一標題關鍵詞集合和第二標題關鍵詞集合; 計算子單元,用于根據(jù)所述第一標題關鍵詞集合和第二標題關鍵詞集合,計算所述第一知識點和第二知識點的標題相似度。36.根據(jù)權利要求31、32、33或34任意一項所述的智能應答裝置,其特征在于,所述裝置還包括: 第二計算子單元,用于計算任意兩個知識點的所述內容中的段落標題相似度; 所述第二計算子單元包括: 解析子單元,用于解析第一知識點和第二知識點的所述段落標題,獲取所述第一知識點和第二知識點的所述段落標題各自包括的預先定義的關鍵詞,將所述第一知識點的所述段落標題包括的關鍵詞作為第一段落標題的關鍵詞集合,將所述第二知識點的所述段落標題包括的關鍵詞作為第二段落標題的關鍵詞集合; 計算子單元,用于根據(jù)所述第一段落標題的關鍵詞集合和第二段落標題的關鍵詞集合,計算所述第一知識點和第二知識點的內容中的段落標題相似度。37.根據(jù)權利要求33或34所述的智能應答裝置,其特征在于,其特征在于,所述裝置還包括: 第三計算子單元,用于計算任意兩個知識點的所述內容中的統(tǒng)一資源定位器相似度; 所述第三計算子單元包括: 解析子單元,用于解析第一知識點和第二知識點的各個內容,獲取所述第一知識點和第二知識點的各自包括的統(tǒng)一資源定位器,分別作為第一統(tǒng)一資源定位器集合和第二統(tǒng)一資源定位器集合; 計算子單元,用于根據(jù)所述第一統(tǒng)一資源定位器集合和第二統(tǒng)一資源定位器集合,計算所述第一知識點和第二知識點的所述統(tǒng)一資源定位器相似度。38.根據(jù)權利要求33或34所述的智能應答裝置,其特征在于,其特征在于,所述裝置還包括: 第四計算子單元,用于計算任意兩個知識點的所述整體相似度。39.根據(jù)權利要求28所述的智能應答裝置,其特征在于,還包括: 生成單元,用于生成所述不符合要求的原始答案; 所述生成單元包括: 接收子單元,用于接收客戶端發(fā)送的對應所述待回答問題的詢問請求; 獲取子單元,用于根據(jù)所述待回答問題和預存的問答關系,獲取所述待回答問題的一個或多個原始答案; 選取子單元,用于將提問者從所述一個或多個原始答案中選取的一個原始答案,作為所述不符合要求的原始答案。40.根據(jù)權利要求39所述的智能應答裝置,其特征在于,所述獲取子單元包括: 解析子單元,用于解析所述待回答問題,獲取所述待回答問題包括的預先定義的關鍵詞; 查詢子單元,用于根據(jù)所述關鍵詞和所述問答關系,獲取與所述關鍵詞匹配的答案,作為所述一個或多個原始答案。41.一種智能應答系統(tǒng),其特征在于,包括:權利要求28所述的智能應答裝置。42.一種電子設備,其特征在于,所述電子設備包括: 顯示器; 處理器;以及 存儲器,所述存儲器被配置成存儲待回答問題,所述待回答問題被所述處理器執(zhí)行時,在所述顯示器顯示所述待回答問題的改進答案,所述改進答案是以被提問者評價為不符合要求的原始答案中的信息為檢索依據(jù),以預定的標準在預存的知識點集合中檢索獲取的,所述原始答案是根據(jù)所述待回答問題和預存的問答關系生成的。43.根據(jù)權利要求42所述的電子設備,其特征在于,所述知識點和所述問答關系存儲在服務器端。44.根據(jù)權利要求42所述的電子設備,其特征在于,所述電子設備是穿戴式智能設備;所述改進答案存儲在該穿戴式智能設備的存儲器中。
【文檔編號】G06F17/30GK105893391SQ201510038536
【公開日】2016年8月24日
【申請日】2015年1月26日
【發(fā)明人】張翔
【申請人】阿里巴巴集團控股有限公司