一種對話系統(tǒng)知識庫的優(yōu)化方法及裝置的制造方法
【專利摘要】一種對話系統(tǒng)知識庫的優(yōu)化方法及裝置,該包括:目標(biāo)問答信息獲取步驟,判斷待分析問答信息的測評參數(shù)是否符合優(yōu)化標(biāo)準(zhǔn),如符合,則將待分析問答信息作為目標(biāo)問答信息;更新答案集合生成步驟,基于目標(biāo)問答信息的問題信息獲取對應(yīng)的答案信息集合,分別計(jì)算答案信息集合中各個(gè)答案信息的相關(guān)度參數(shù),并根據(jù)相關(guān)度參數(shù)生成針對目標(biāo)問答信息中問題信息的更新答案集合。該方法能夠?qū)崿F(xiàn)對對話系統(tǒng)數(shù)據(jù)庫的主動(dòng)更新,從而使得對話系統(tǒng)能夠輸出更加符合用戶使用習(xí)慣以及期望的答案,進(jìn)而提高了對話系統(tǒng)的用戶體驗(yàn)以及用戶粘度。
【專利說明】
一種對話系統(tǒng)知識庫的優(yōu)化方法及裝置
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及人機(jī)交互技術(shù)領(lǐng)域,具體地說,涉及一種對話系統(tǒng)知識庫的優(yōu)化方法及裝置。
【背景技術(shù)】
[0002]對于傳統(tǒng)的人機(jī)交互而言,人機(jī)交互主要是由用戶通過鼠標(biāo)、鍵盤以及觸摸屏等裝置來與計(jì)算機(jī)、手機(jī)等設(shè)備進(jìn)行交互。而隨著人機(jī)之間信息交互量正呈現(xiàn)爆炸性的增長,傳統(tǒng)的人機(jī)交互方式極大地影響了人機(jī)交互的效率以及效果。
[0003]人們所習(xí)慣的最自然、最便捷的交互方式是自然語言交互,因此通過對話系統(tǒng)來實(shí)現(xiàn)高效地人機(jī)交互成為了越來越普遍的選擇。然而,現(xiàn)有的對話系統(tǒng)對于用戶的一些詢問問題無法給出令人滿意的回答,這也就影響了整個(gè)對話系統(tǒng)的用戶體驗(yàn),使得產(chǎn)品的用戶粘性較差。
【發(fā)明內(nèi)容】
[0004]為解決上述問題,本發(fā)明提供了一種對話系統(tǒng)知識庫的優(yōu)化方法,包括:
[0005]目標(biāo)問答信息獲取步驟,判斷待分析問答信息的測評參數(shù)是否符合優(yōu)化標(biāo)準(zhǔn),如符合,則將所述待分析問答信息作為目標(biāo)問答信息;
[0006]更新答案集合生成步驟,基于所述目標(biāo)問答信息的問題信息獲取對應(yīng)的答案信息集合,分別計(jì)算所述答案信息集合中各個(gè)答案信息的相關(guān)度參數(shù),并根據(jù)所述相關(guān)度參數(shù)生成針對所述目標(biāo)問答信息中問題信息的更新答案集合。
[0007]根據(jù)本發(fā)明的一個(gè)實(shí)施例,在所述目標(biāo)問答信息獲取步驟中,判斷所述待分析問答信息的測評參數(shù)是否小于預(yù)設(shè)測評閾值,如果小于,則將所述待分析問答信息作為目標(biāo)問答信息。
[0008]根據(jù)本發(fā)明的一個(gè)實(shí)施例,在所述更新答案集合生成步驟中,根據(jù)問答信息中問題信息與答案信息是否具有語義相同的中心詞來確定答案信息的相關(guān)度參數(shù),其中,語義相同的中心詞的數(shù)量越多,答案信息與問題信息的相關(guān)度參數(shù)越大。
[0009]根據(jù)本發(fā)明的一個(gè)實(shí)施例,在獲取所述答案信息集合時(shí),按照預(yù)設(shè)規(guī)則選取目標(biāo)用戶,并向所述目標(biāo)用戶推送所述目標(biāo)問答信息中的問題信息,獲取所述目標(biāo)用戶針對所述問題信息所反饋的答案信息,從而得到所述問答信息集合。
[0010]根據(jù)本發(fā)明的一個(gè)實(shí)施例,在選取所述目標(biāo)用戶時(shí),
[0011]獲取對話系統(tǒng)不同用戶的用戶屬性,判斷用戶屬性是否符合預(yù)設(shè)問題推送要求,如果符合,則將對應(yīng)的用戶確定為所述目標(biāo)用戶,其中,所述用戶屬性包括以下所列項(xiàng)中的任一項(xiàng)或幾項(xiàng):
[0012]用戶身份信息、用戶位置信息、用戶年齡信息、用戶性別信息;
[0013]或,獲取對話系統(tǒng)不同用戶的交互場景和/或交互話題,判斷所述交互場景和/或交互話題是否符合預(yù)設(shè)問題推送要求,如果符合,則將對應(yīng)的用戶確定為所述目標(biāo)用戶。
[0014]本發(fā)明還提供了一種對話系統(tǒng)知識庫的優(yōu)化裝置,包括:
[0015]目標(biāo)問答信息獲取模塊,其用于判斷待分析問答信息的測評參數(shù)是否符合優(yōu)化標(biāo)準(zhǔn),如符合,則將所述待分析問答信息作為目標(biāo)問答信息;
[0016]更新答案集合生成模塊,其用于基于所述目標(biāo)問答信息的問題信息獲取對應(yīng)的答案信息集合,分別計(jì)算所述答案信息集合中各個(gè)答案信息的相關(guān)度參數(shù),并根據(jù)所述相關(guān)度參數(shù)生成針對所述目標(biāo)問答信息中問題信息的更新答案集合。
[0017]根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述目標(biāo)問答信息獲取模塊配置為判斷所述待分析問答信息的測評參數(shù)是否小于預(yù)設(shè)測評閾值,如果小于,則將所述待分析問答信息作為目標(biāo)問答信息。
[0018]根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述更新答案集合生成模塊配置為根據(jù)問答信息中問題信息與答案信息是否具有語義相同的中心詞來確定答案信息的相關(guān)度參數(shù),其中,語義相同的中心詞的數(shù)量越多,答案信息與問題信息的相關(guān)度參數(shù)越大。
[0019]根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述更新答案集合生成模塊配置為在獲取所述答案信息集合時(shí),按照預(yù)設(shè)規(guī)則選取目標(biāo)用戶,并向所述目標(biāo)用戶推送所述目標(biāo)問答信息中的問題信息,獲取所述目標(biāo)用戶針對所述問題信息所反饋的答案信息,從而得到所述問答信息
口 O
[0020]根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述更新答案集合生成模塊配置為在選取所述目標(biāo)用戶時(shí),
[0021]獲取對話系統(tǒng)不同用戶的用戶屬性,判斷用戶屬性是否符合預(yù)設(shè)問題推送要求,如果符合,則將對應(yīng)的用戶確定為所述目標(biāo)用戶,其中,所述用戶屬性包括以下所列項(xiàng)中的任一項(xiàng)或幾項(xiàng):
[0022]用戶身份信息、用戶位置信息、用戶年齡信息、用戶性別信息;
[0023]或,獲取對話系統(tǒng)不同用戶的交互場景和/或交互話題,判斷所述交互場景和/或交互話題是否符合預(yù)設(shè)問題推送要求,如果符合,則將對應(yīng)的用戶確定為所述目標(biāo)用戶。
[0024]本發(fā)明所提供的對話系統(tǒng)知識庫優(yōu)化方法通過對海量用戶的用戶請求日志進(jìn)行分析,盡可能找到這些日志中不好的或不合理的問答信息,然后通過各種渠道主動(dòng)地獲取這類問答信息中的問題信息的答案信息,并對答案信息進(jìn)行合法性的判斷,最后將符合要求的答案信息插入或更新到數(shù)據(jù)庫中。通過對對話系統(tǒng)數(shù)據(jù)庫的更新,對話系統(tǒng)能夠輸出更加符合用戶使用習(xí)慣以及期望的答案,從而提高了對話系統(tǒng)的用戶體驗(yàn)以及用戶粘度。
[0025]該方法實(shí)現(xiàn)了對話系統(tǒng)知識庫的自學(xué)習(xí)以及閉環(huán)反饋。其中,該方法可以使得對話系統(tǒng)能夠?qū)χR庫中不好的和不合理的問答信息自主地進(jìn)行合理化改進(jìn),從而使得該系統(tǒng)的質(zhì)量能夠有持續(xù)性的提升。同時(shí),該方法還能夠使得對話系統(tǒng)實(shí)現(xiàn)自主學(xué)習(xí),這樣也就可以脫離必須依賴維護(hù)人員的手動(dòng)學(xué)習(xí)方式。
[0026]該方法通過將目標(biāo)問答信息中的問題信息重新推送給用戶來獲取用戶針對該問題信息的答案,這樣便實(shí)現(xiàn)了“用戶-對話系統(tǒng)-用戶”的閉環(huán)反饋,因此對話系統(tǒng)也就可以在受到外接干擾時(shí)保持自身的穩(wěn)定性。正是基于這種閉環(huán)結(jié)構(gòu),對話系統(tǒng)才能夠持續(xù)的接收到來自用戶感知層面的反饋,并根據(jù)用戶的反饋來不斷優(yōu)化自身知識庫從而調(diào)整自身的輸出,以使得這種輸出能夠符合用戶的期望。
[0027]此外,本發(fā)明所提供的對話系統(tǒng)知識庫優(yōu)化方法還可以通過根據(jù)用戶的屬性來向特定的用戶推送目標(biāo)問答信息中的問題信息。由于這類用戶的屬性與向?qū)υ捪到y(tǒng)輸入目標(biāo)問答信息中問題信息的用戶的屬性相同或類似,因此通過這類用戶也就可以獲得針對于目標(biāo)問答信息中問題信息的更為準(zhǔn)確或契合度更高的答案信息,而根據(jù)這類答案信息所確定出的上述問題信息的更新答案集合也將更為準(zhǔn)確。
[0028]本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過在說明書、權(quán)利要求書以及附圖中所特別指出的結(jié)構(gòu)來實(shí)現(xiàn)和獲得。
【附圖說明】
[0029]為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要的附圖做簡單的介紹:
[0030]圖1是根據(jù)本發(fā)明一個(gè)實(shí)施例的對話系統(tǒng)知識庫優(yōu)化方法的實(shí)現(xiàn)流程圖;
[0031 ]圖2是根據(jù)本發(fā)明另一個(gè)實(shí)施例的對話系統(tǒng)知識庫優(yōu)化方法的實(shí)現(xiàn)流程圖;
[0032]圖3是根據(jù)本發(fā)明又一個(gè)實(shí)施例的對話系統(tǒng)知識庫優(yōu)化方法的實(shí)現(xiàn)流程圖;
[0033]圖4是根據(jù)本發(fā)明一個(gè)實(shí)施例的對話系統(tǒng)知識庫優(yōu)化裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0034]以下將結(jié)合附圖及實(shí)施例來詳細(xì)說明本發(fā)明的實(shí)施方式,借此對本發(fā)明如何應(yīng)用技術(shù)手段來解決技術(shù)問題,并達(dá)成技術(shù)效果的實(shí)現(xiàn)過程能充分理解并據(jù)以實(shí)施。需要說明的是,只要不構(gòu)成沖突,本發(fā)明中的各個(gè)實(shí)施例以及各實(shí)施例中的各個(gè)特征可以相互結(jié)合,所形成的技術(shù)方案均在本發(fā)明的保護(hù)范圍之內(nèi)。
[0035]同時(shí),在以下說明中,出于解釋的目的而闡述了許多具體細(xì)節(jié),以提供對本發(fā)明實(shí)施例的徹底理解。然而,對本領(lǐng)域的技術(shù)人員來說顯而易見的是,本發(fā)明可以不用這里的具體細(xì)節(jié)或者所描述的特定方式來實(shí)施。
[0036]另外,在附圖的流程圖示出的步驟可以在諸如一組計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。
[0037]對于智能機(jī)器人中的對話系統(tǒng)來說,從用戶的角度來看,越好的用戶體驗(yàn),那么就意味著越高的用戶粘性。目前,對于對話機(jī)器人來說,最為直觀的體驗(yàn)是用戶所詢問的問題的答案是否滿足了用戶的期望。例如,當(dāng)用戶向?qū)υ挋C(jī)器人發(fā)起詢問“總自己一個(gè)人”時(shí),對于現(xiàn)有的對話機(jī)器人來說,其反饋的答案很可能是“我不知道你在說什么耶”。由此可以看出,現(xiàn)有的對話機(jī)器人無法很好地滿足用戶的日常交互需求。
[0038]對話機(jī)器人是利用對話系統(tǒng)來實(shí)現(xiàn)機(jī)器人與用戶之間的對話交互的,其中,對話系統(tǒng)利用自身的知識庫來根據(jù)用戶輸入的問題來確定出相應(yīng)的答案。本發(fā)明正是利用上述特性,提供了一種新的對話系統(tǒng)知識庫的優(yōu)化方法,以使得對話系統(tǒng)能夠利用優(yōu)化后的知識庫更加準(zhǔn)確、合理地確定出用戶所輸入的問題的答案。該優(yōu)化方法通過不間斷地持續(xù)學(xué)習(xí),以此不斷地提升對話系統(tǒng)知識庫的質(zhì)量。
[0039]需要指出的是,本發(fā)明所指的對話系統(tǒng)知識庫的質(zhì)量的提升,既可以指知識庫中問題信息所對應(yīng)的答案信息的改善,也可以指知識庫中問題信息及其答案信息的擴(kuò)充。
[0040]為了更加清楚地闡述本發(fā)明所提供的對話系統(tǒng)知識庫優(yōu)化方法的實(shí)現(xiàn)原理、實(shí)現(xiàn)過程以及優(yōu)點(diǎn),以下分別結(jié)合不同的實(shí)施例來對該方法作進(jìn)一步地說明。
[0041 ] 實(shí)施例一:
[0042]圖1示出了本實(shí)施例所提供的對話系統(tǒng)知識庫的優(yōu)化方法的實(shí)現(xiàn)流程圖。
[0043]如圖1所示,本實(shí)施例所提供的方法首先在步驟SlOl中獲取待分析問答信息的測評參數(shù)。其中,該方法在步驟SlOl中所獲取到的測評參數(shù)優(yōu)選地為問答評價(jià)系統(tǒng)對待分析問答信息的評分。對于問答信息中的問題信息而言,其答案信息的評分越高,也就說明用戶對該答案信息的滿意程度越高;反之,如果答案信息的評分越低,也就說明用戶對該答案信息的滿意程度越低,而這類答案信息也正是需要進(jìn)行優(yōu)化的信息。
[0044]因此,本實(shí)施例中,該方法在步驟S102中判斷步驟SlOl中所獲得的測評參數(shù)是否滿足預(yù)設(shè)優(yōu)化標(biāo)準(zhǔn)。如果測評參數(shù)滿足預(yù)設(shè)優(yōu)化標(biāo)準(zhǔn),該方法則在步驟S103中將步驟SlOl中的待分析問答信息作為目標(biāo)問答信息。其中,目標(biāo)問答信息即為待優(yōu)化的問答信息。
[0045]具體地,本實(shí)施例中,由于該方法在步驟SlOl中所獲取的測評參數(shù)為問答評價(jià)系統(tǒng)針對答案信息的評分,因此該方法在步驟S102中通過判斷測評參數(shù)是否小于預(yù)設(shè)測評閾值來判斷待分析問答信息是否為目標(biāo)問答信息。
[0046]例如對于用戶輸入的問題信息“總自己一個(gè)人”來說,對話系統(tǒng)所反饋的答案信息“我不知道你在說什么耶”顯然無法令用戶感到滿意,因此其對應(yīng)的評分也就必然會很低。如果該答案信息所對應(yīng)的評分小于預(yù)設(shè)評分閾值的話,那么就表示需要對該答案信息進(jìn)行優(yōu)化,以使得用戶在輸入問題信息時(shí)對話系統(tǒng)能夠反饋令用戶更為滿意的答案。
[0047]如圖1所示,當(dāng)確定出目標(biāo)問答信息后,該方法在步驟S104中基于目標(biāo)問答信息的問題信息獲取對應(yīng)的回答信息集合。本實(shí)施例中,當(dāng)確定出對話系統(tǒng)數(shù)據(jù)庫中的目標(biāo)問答信息后,該方法會在特定的場景下把目標(biāo)問答信息中的問題信息推送給對話系統(tǒng)的用戶,并記錄用戶對該問題信息的反饋,從而得到問題信息所對應(yīng)的回答信息集合。
[0048]例如,該方法在步驟S103中所確定的目標(biāo)問答信息包括:問題信息“總自己一個(gè)人”和答案信息“我不知道你在說什么耶”,在步驟S104中,該方法會將問題信息“總自己一個(gè)人”推送給對話系統(tǒng)的用戶(此處的用戶可能為輸入該問題信息的用戶也可能為其他多個(gè)不同的用戶)。針對所推送的問題信息,用戶在對話過程中會將自己的答案反饋給對話系統(tǒng),這樣該方法通過收集用戶的反饋答案便可以得到目標(biāo)問答信息中問題信息所對應(yīng)的答案信息集合。
[0049]需要指出的是,在本發(fā)明的其他實(shí)施例中,該方法也可以通過其他合理方式來獲取對應(yīng)于目標(biāo)問答信息中問題信息的答案信息集合,本發(fā)明不限于此。
[0050]當(dāng)?shù)玫酱鸢感畔⒓虾?,由于回答信息集合中所包含的答案信息多是由多個(gè)不同的用戶所反饋的,因此其中既可能包含能夠令用戶較為滿意的答案信息,也可能包含無法令用戶滿意的答案信息,這樣也就需要對答案信息集合進(jìn)行篩選,以確定能夠作為目標(biāo)問答信息中問題信息的備選答案的信息。
[0051]具體地,如圖1所示,在得到答案信息集合后,該方法在步驟S105中分別計(jì)算答案信息集合中各個(gè)答案信息的相關(guān)度參數(shù),并在步驟S106中根據(jù)相關(guān)度參數(shù)生成針對目標(biāo)問答信息中問題信息的更新答案信息集合。
[0052]本實(shí)施例中,相關(guān)度參數(shù)用于表征答案信息與問題信息之間的聯(lián)系程度,而判斷問題信息與答案信息之間的聯(lián)系一直是人工智能領(lǐng)域中一個(gè)重要的研究課題。為了使得對話系統(tǒng)能夠盡可能高效地工作,本實(shí)施例中該方法利用預(yù)先設(shè)定的規(guī)則來計(jì)算答案信息集合中各個(gè)答案信息的相關(guān)度參數(shù)。
[0053]具體地,本實(shí)施例中,該方法利用多個(gè)適用于相關(guān)度判斷的規(guī)則來分別計(jì)算各個(gè)規(guī)則下問答信息的相關(guān)度,隨后利用各個(gè)規(guī)則的權(quán)重對利用各個(gè)規(guī)則所計(jì)算得到的相關(guān)度進(jìn)行加權(quán),從而最終得到某一答案信息總體的相關(guān)度參數(shù)。
[0054]其中,該方法所利用的預(yù)設(shè)規(guī)則優(yōu)選地包括中心詞規(guī)則,該方法根據(jù)問答信息中答案信息與問題信息是否具有語義相同的中心詞來確定答案信息的相關(guān)度參數(shù)。如果問題信息與答案信息中語義相同的中心詞越多,那么答案信息與問題信息的相關(guān)度參數(shù)的取值也就越大;反之,如果問題信息與答案信息中語義相同的中心詞越少,那么答案信息與問題信息的相關(guān)度參數(shù)的取值也就越小。
[0055]需要指出的是,在本發(fā)明的其他實(shí)施例中,該方法在計(jì)算答案信息的相關(guān)度參數(shù)時(shí)所使用的預(yù)測還可以包含其他合理規(guī)則,本發(fā)明不限于此。
[0056]本實(shí)施例中,當(dāng)?shù)玫酱鸢感畔⒓现懈鱾€(gè)答案信息的相關(guān)度參數(shù)后,該方法會按照相關(guān)度參數(shù)的取值大小對答案信息集合中的各個(gè)答案信息進(jìn)行排序,并選取排序靠前的N(N的取值可以根據(jù)實(shí)際需要進(jìn)行設(shè)定)個(gè)答案信息來作為更新答案集合,該更新答案集合即為目標(biāo)問答信息中問題信息的備選答案,由此便實(shí)現(xiàn)對對話系統(tǒng)知識庫的優(yōu)化。
[0057]需要指出的是,利用本方法對對話系統(tǒng)知識庫的更新周期可以根據(jù)實(shí)際需要進(jìn)行設(shè)定(例如可以通過對每天收集到的問答信息進(jìn)行集中處理從而實(shí)現(xiàn)每天對對話系統(tǒng)知識庫更新一次),本發(fā)明不限于此。同時(shí),該方法在執(zhí)行時(shí),所獲取的海量數(shù)據(jù)不僅包括用戶數(shù)據(jù),還包括問答評價(jià)系統(tǒng)和用戶評價(jià)系統(tǒng)的數(shù)據(jù)。具體地,這些數(shù)據(jù)包括但不限于:用戶的問題信息和對話系統(tǒng)的答案信息、對話系統(tǒng)答案信息的來源、用戶的相關(guān)數(shù)據(jù)、答案信息的評分?jǐn)?shù)據(jù)以及數(shù)據(jù)生成的時(shí)間等。
[0058]從上述描述可以看出,本實(shí)施例所提供的對話系統(tǒng)知識庫優(yōu)化方法實(shí)現(xiàn)了對話系統(tǒng)知識庫的自學(xué)習(xí)以及閉環(huán)反饋。其中,該方法可以使得對話系統(tǒng)能夠?qū)χR庫中不好的和不合理的問答信息自主地進(jìn)行合理化改進(jìn),從而使得該系統(tǒng)的質(zhì)量能夠有持續(xù)性的提升。同時(shí),該方法還能夠使得對話系統(tǒng)實(shí)現(xiàn)自主學(xué)習(xí),這樣也就可以脫離必須依賴維護(hù)人員的手動(dòng)學(xué)習(xí)方式。
[0059]該方法通過將目標(biāo)問答信息中的問題信息重新推送給用戶來獲取用戶針對該問題信息的答案,這樣便實(shí)現(xiàn)了“用戶-對話系統(tǒng)-用戶”的閉環(huán)反饋,因此對話系統(tǒng)也就可以在受到外接干擾時(shí)保持自身的穩(wěn)定性。正是基于這種閉環(huán)結(jié)構(gòu),對話系統(tǒng)才能夠持續(xù)的接收到來自用戶感知層面的反饋,并根據(jù)用戶的反饋來不斷優(yōu)化自身知識庫從而調(diào)整自身的輸出,以使得這種輸出能夠符合用戶的期望。
[0060]例如對于如上所述的目標(biāo)問答信息中的問題信息“總自己一個(gè)人”,現(xiàn)有的對話系統(tǒng)所反饋的答案信息是無法令用戶感到滿意的“我不知道你在說什么耶”。而利用本實(shí)施例所提供的方法對對話系統(tǒng)知識庫進(jìn)行更新后,對話系統(tǒng)則可以輸出諸如“我一直陪在你身邊呢”的答案信息,該答案信息顯然更加符合用戶期望。
[0061 ] 實(shí)施例二:
[0062]圖2示出了本實(shí)施例所提供的對話系統(tǒng)知識庫的優(yōu)化方法的實(shí)現(xiàn)流程圖。
[0063]如圖2所示,本實(shí)施例所提供的方法首先在步驟S201中獲取待分析問答信息的測評參數(shù),并在步驟S202中判斷測評參數(shù)是否符合預(yù)設(shè)優(yōu)化標(biāo)準(zhǔn),如果符合,則在步驟S203中將步驟S201中所獲取的待分析問答信息作為目標(biāo)問答信息,目標(biāo)問答信息即為需要進(jìn)行優(yōu)化的問答信息。
[0064]需要指出的是,本實(shí)施例中,步驟S201至步驟S203的實(shí)現(xiàn)原理以及實(shí)現(xiàn)過程與實(shí)施例一中步驟SlOl至步驟S103的實(shí)現(xiàn)原理以及實(shí)現(xiàn)過程相同,故在此不再贅述。
[0065]現(xiàn)有的對話系統(tǒng)在進(jìn)行問題推送時(shí)是不區(qū)分用戶的,這就可能造成對話系統(tǒng)會將問題信息推送給不適合的用戶,這類用戶所反饋的答案信息很可能會造成答案信息不可靠和不準(zhǔn)確。
[0066]例如,當(dāng)對話系統(tǒng)向一男性用戶推送了問題信息“X牌的化妝品怎么樣”,男性用戶通常無法準(zhǔn)確提供該問題信息的答案,因此也就可能向?qū)υ捪到y(tǒng)反饋諸如“我不知道”或“我用不上化妝品”的答案信息。
[0067]針對上述問題,本實(shí)施例所提供的方法優(yōu)選地通過用戶的用戶屬性來確定問題信息推送的目標(biāo)用戶,從而獲取更為準(zhǔn)確、可靠的答案信息。
[0068]本實(shí)施例中,當(dāng)確定出對話系統(tǒng)數(shù)據(jù)庫中的目標(biāo)問答信息后,該方法會把目標(biāo)問答信息中的問題信息推送給對話系統(tǒng)的特定用戶,并記錄用戶對該問題信息的反饋,從而得到問題信息所對應(yīng)的回答信息集合。
[0069]具體地,如圖2所示,當(dāng)確定出目標(biāo)問答信息后,該方法在步驟S204中獲取對話系統(tǒng)中不同用戶的屬性,并在步驟S205中判斷步驟S204中所獲取到的用戶屬性是否符合預(yù)設(shè)問題推送要求。如果用戶的用戶屬性符合預(yù)設(shè)問題推送要求,那么該方法則在步驟S206中將對應(yīng)的用戶確定為目標(biāo)用戶,并向目標(biāo)用戶推送目標(biāo)問答信息中的問題信息。
[0070]本實(shí)施例中,用于確定用戶是否為目標(biāo)用戶的用戶屬性優(yōu)選地包括:用戶身份信息、用戶位置信息、用戶年齡信息以及用戶性別信息等。例如對于用戶年齡信息來說,如果目標(biāo)問答信息中問題信息所涉及的用戶年齡與某用戶的年齡處于同一年齡段,那么該用戶的屬性也就符合預(yù)設(shè)問題推送要求。
[0071]當(dāng)然,在本發(fā)明的不同實(shí)施例中,該方法在步驟S205中進(jìn)行判斷時(shí),既可以僅僅使用以上所列項(xiàng)中的某一項(xiàng)或某幾項(xiàng)來進(jìn)行目標(biāo)用戶的判別,也可以利用以上未列出的其他合理項(xiàng)或其他合理項(xiàng)與上述某一項(xiàng)或某幾項(xiàng)的結(jié)合來進(jìn)行目標(biāo)用戶的判別,本發(fā)明不限于此。
[0072]當(dāng)向目標(biāo)用戶推送目標(biāo)問答信息中的問題信息后,該方法在步驟S207中通過對話系統(tǒng)獲取目標(biāo)用戶針對問題信息所反饋的答案信息,從而得到答案信息集合。
[0073]在得到答案信息集合后,該方法在步驟S208中分別計(jì)算答案信息集合中各個(gè)答案信息的相關(guān)度參數(shù),并在步驟S209中根據(jù)各個(gè)答案信息的相關(guān)度參數(shù)從答案信息結(jié)合中確定出更新答案集合。
[0074]需要指出的是,本實(shí)施例中,步驟S207至步驟S209的實(shí)現(xiàn)原理與實(shí)現(xiàn)過程與實(shí)施例一中步驟S104至步驟S106的實(shí)現(xiàn)原理以及實(shí)現(xiàn)過程類似,故在此不再贅述。
[0075]本實(shí)施例中,在對目標(biāo)問答信息中的答案信息進(jìn)行更新時(shí),更新后的該問題信息的答案信息優(yōu)選地將包含多個(gè)答案信息,這樣用戶與對話系統(tǒng)進(jìn)行交互時(shí),對話系統(tǒng)針對同一問題信息可以向用戶反饋多個(gè)不同的答案信息,從而避免了用戶在詢問同一問題時(shí)對話系統(tǒng)由于總是輸出相同的答案而使得用戶感到厭倦,這進(jìn)一步提高了對話系統(tǒng)的用戶體驗(yàn)和用戶粘度。
[0076]從上述描述可以看出,本實(shí)施例所提供的對話系統(tǒng)知識庫優(yōu)化方法在實(shí)施例一所提供的方法的基礎(chǔ)上,通過根據(jù)用戶的屬性來向特定的用戶推送目標(biāo)問答信息中的問題信息。由于這類用戶的屬性與向?qū)υ捪到y(tǒng)輸入目標(biāo)問答信息中問題信息的用戶的屬性相同或類似,因此通過這類用戶也就可以獲得針對于目標(biāo)問答信息中問題信息的更為準(zhǔn)確或契合度更高的答案信息,而根據(jù)這類答案信息所確定出的上述問題信息的更新答案集合也將更為準(zhǔn)確。
[0077]需要指出的是,在本發(fā)明的其他實(shí)施例中,該方法還可以根據(jù)其他合理的參數(shù)(例如交互場景和/或交互話題)來從對話系統(tǒng)的多個(gè)用戶中選取目標(biāo)用戶,本發(fā)明不限于此。例如在本發(fā)明的一個(gè)實(shí)施例中,對話系統(tǒng)知識庫的優(yōu)化方法的執(zhí)行步驟S301至S309與實(shí)施例二中的步驟S201至步驟S209大致相同,不同的是,在該實(shí)施例中,該方法在步驟S304中所獲取的為對話系統(tǒng)的不同用戶當(dāng)前的交互話題,并在步驟S305中是利用交互話題來選取目標(biāo)用戶的。
[0078]在具體應(yīng)用過程中,如果某一用戶與對化系統(tǒng)之間的交互話題是“足球”,而目標(biāo)問答信息中問題信息是針對“AlphaGo”的,那么此時(shí)將問題信息推送給該用戶顯然是十分突兀的,在這種情況下,將無法保證該用戶針對所推送的問題信息所反饋的答案信息的可靠性。因此這種問題信息的推送策略會使得被推送的用戶感覺到交互過程受到干擾,從而降低對話系統(tǒng)的用戶體驗(yàn)。
[0079]而本實(shí)施例所提供的方法正是通過交互話題來從對話系統(tǒng)的大量用戶中選取目標(biāo)用戶,當(dāng)用戶的當(dāng)前交互話題與目標(biāo)問答信息中問題信息所涉及的話題相關(guān)時(shí),此時(shí)將問題信息推送給該用戶不僅不會使用戶感到突兀,還能夠讓用戶感覺對話系統(tǒng)是有“思想”的。在這種情況下,用戶針對問題信息所反饋的答案信息顯然質(zhì)量更高,其更能夠準(zhǔn)確地發(fā)映出用戶對該問題信息真實(shí)回答。
[0080]需要指出的是,在本發(fā)明的其他實(shí)施例中,該對話系統(tǒng)知識庫的優(yōu)化方法可以將多個(gè)不同的參量(例如用戶的屬性、交互話題和交互場景)相結(jié)合來更加精確的選取目標(biāo)用戶,本發(fā)明同樣不限于此。
[0081]同時(shí),還需要指出的是,在上述描述中,在獲取待分析問答信息的測評參數(shù)前,還可以對獲取到的待分析問答信息進(jìn)行過濾,以此確定問答信息的合法性。
[0082]本發(fā)明還提供了一種對話系統(tǒng)知識庫的優(yōu)化裝置,圖4示出了本實(shí)施例中該裝置的結(jié)構(gòu)示意圖。
[0083]如圖4所示,本實(shí)施例所提供的對話系統(tǒng)知識庫優(yōu)化裝置優(yōu)選地包括:目標(biāo)問答信息獲取模塊401和更新答案集合生成模塊402。其中,目標(biāo)問答信息獲取模塊401用戶判斷待分析問答信息的測評參數(shù)是否符合預(yù)設(shè)優(yōu)化標(biāo)準(zhǔn)。如果符合,目標(biāo)問答信息獲取模塊401則將該問答信息作為目標(biāo)問答信息,其中目標(biāo)問答信息即為待優(yōu)化的問答信息。
[0084]本實(shí)施例中,目標(biāo)問答信息獲取模塊401所獲取到的測評參數(shù)優(yōu)選地為問答評價(jià)系統(tǒng)對待分析問答信息的評分。對于問答信息中的問題信息而言,其答案信息的評分越高,也就說明用戶對該答案信息的滿意程度越高;反之,如果答案信息的評分越低,也就說明用戶對該答案信息的滿意程度越低,而這類答案信息也正是需要進(jìn)行優(yōu)化的信息。
[0085]目標(biāo)問答信息獲取模塊401如果判斷出待分析問答信息的測評參數(shù)的取值小于預(yù)設(shè)測評閾值,那么目標(biāo)問答信息獲取模塊401將判定測評參數(shù)符合預(yù)設(shè)優(yōu)化標(biāo)準(zhǔn),因此目標(biāo)問答信息獲取模塊401也將判定該待分析問答信息為目標(biāo)問答信息。
[0086]當(dāng)確定出目標(biāo)問答信息后,目標(biāo)問答信息獲取模塊401會將目標(biāo)問答信息傳輸給更新答案集合生成模塊402,以由更新答案集合生成模塊402根據(jù)目標(biāo)問答信息生成用于更新目標(biāo)問答信息中問題信息所對應(yīng)答案的更新答案集合。
[0087]具體地,本實(shí)施例中,更新答案集合生成模塊402會在特定的場景下把目標(biāo)問答信息中的問題信息推送給對話系統(tǒng)的用戶,并記錄用戶對該問題信息的反饋,從而得到問題信息所對應(yīng)的回答信息集合。
[0088]更新答案集合生成模塊402優(yōu)選地通過用戶的用戶屬性來確定問題信息推送的目標(biāo)用戶,從而獲取更為準(zhǔn)確、可靠的答案信息。因此,本實(shí)施例中,更新答案集合生成模塊402在進(jìn)行問題推送前,會獲取對話系統(tǒng)中不同用戶的屬性,并判斷所獲取到的用戶屬性是否符合預(yù)設(shè)問題推送要求。如果用戶的用戶屬性符合預(yù)設(shè)問題推送要求,那么更新答案集合生成模塊402則將對應(yīng)的用戶確定為目標(biāo)用戶,并向目標(biāo)用戶推送目標(biāo)問答信息中的問題?目息O
[0089]本實(shí)施例中,用于確定用戶是否為目標(biāo)用戶的用戶屬性優(yōu)選地包括:用戶身份信息、用戶位置信息、用戶年齡信息以及用戶性別信息等。當(dāng)然,在本發(fā)明的不同實(shí)施例中,更新答案集合生成模塊402在對目標(biāo)用戶進(jìn)行選取時(shí),既可以僅僅使用以上所列項(xiàng)中的某一項(xiàng)或某幾項(xiàng)來進(jìn)行目標(biāo)用戶的判別,也可以利用以上未列出的其他合理項(xiàng)或其他合理項(xiàng)與上述某一項(xiàng)或某幾項(xiàng)的結(jié)合來進(jìn)行目標(biāo)用戶的判別,本發(fā)明不限于此。
[0090]需要指出的是,在本發(fā)明的其他實(shí)施例中,更新答案集合生成模塊402還可以根據(jù)其他合理的參數(shù)(例如交互場景和/或交互話題)來從對話系統(tǒng)的多個(gè)用戶中選取目標(biāo)用戶,本發(fā)明不限于此。
[0091]例如在本發(fā)明的一個(gè)實(shí)施例中,更新答案集合生成模塊402所獲取的用于選取目標(biāo)用戶的參數(shù)為對話系統(tǒng)的不同用戶當(dāng)前的交互話題。本實(shí)施例所提供的方法正是通過交互話題來從對話系統(tǒng)的大量用戶中選取目標(biāo)用戶,當(dāng)用戶的當(dāng)前交互話題與目標(biāo)問答信息中問題信息所涉及的話題相關(guān)時(shí),此時(shí)將問題信息推送給該用戶不僅不會使用戶感到突兀,還能夠讓用戶感覺對話系統(tǒng)是有“思想”的。在這種情況下,用戶針對問題信息所反饋的答案信息顯然質(zhì)量更高,其更能夠準(zhǔn)確地發(fā)映出用戶對該問題信息真實(shí)回答。
[0092]需要指出的是,在本發(fā)明的其他實(shí)施例中,該對話系統(tǒng)知識庫的優(yōu)化方法可以將多個(gè)不同的參量(例如用戶的屬性、交互話題和交互場景)相結(jié)合來更加精確的選取目標(biāo)用戶,本發(fā)明同樣不限于此。
[0093]同時(shí),還需要指出的是,在上述描述中,在獲取待分析問答信息的測評參數(shù)前,還可以對獲取到的待分析問答信息進(jìn)行過濾,以此確定問答信息的合法性。
[0094]當(dāng)?shù)玫酱鸢感畔⒓虾?,由于回答信息集合中所包含的答案信息多是由多個(gè)不同的用戶所反饋的,因此其中既可能包含能夠令用戶較為滿意的答案信息,也可能包含無法令用戶滿意的答案信息,這樣也就需要對答案信息集合進(jìn)行篩選,以確定能夠作為目標(biāo)問答信息中問題信息的備選答案的信息。
[0095]因此,在得到答案信息集合后,更新答案集合生成模塊402分別計(jì)算回答信息集合中各個(gè)答案信息的相關(guān)度參數(shù),并根據(jù)相關(guān)度參數(shù)生成針對目標(biāo)問答信息中問題信息的更新答案信息集合。
[0096]需要指出的是,本實(shí)施例中,更新答案集合生成模塊402計(jì)算各個(gè)答案信息的相關(guān)度參數(shù)的原理與上述對話系統(tǒng)知識庫的優(yōu)化方法中所闡述的原理相同,故在此不再贅述。
[0097]應(yīng)該理解的是,本發(fā)明所公開的實(shí)施例不限于這里所公開的特定結(jié)構(gòu)、處理步驟或材料,而應(yīng)當(dāng)延伸到相關(guān)領(lǐng)域的普通技術(shù)人員所理解的這些特征的等同替代。還應(yīng)當(dāng)理解的是,在此使用的術(shù)語僅用于描述特定實(shí)施例的目的,而并不意味著限制。
[0098]說明書中提到的“一個(gè)實(shí)施例”或“實(shí)施例”意指結(jié)合實(shí)施例描述的特定特征、結(jié)構(gòu)或特性包括在本發(fā)明的至少一個(gè)實(shí)施例中。因此,說明書通篇各個(gè)地方出現(xiàn)的短語“一個(gè)實(shí)施例”或“實(shí)施例”并不一定均指同一個(gè)實(shí)施例。
[0099]雖然上述示例用于說明本發(fā)明在一個(gè)或多個(gè)應(yīng)用中的原理,但對于本領(lǐng)域的技術(shù)人員來說,在不背離本發(fā)明的原理和思想的情況下,明顯可以在形式上、用法及實(shí)施的細(xì)節(jié)上作各種修改而不用付出創(chuàng)造性勞動(dòng)。因此,本發(fā)明由所附的權(quán)利要求書來限定。
【主權(quán)項(xiàng)】
1.一種對話系統(tǒng)知識庫的優(yōu)化方法,其特征在于,包括: 目標(biāo)問答信息獲取步驟,判斷待分析問答信息的測評參數(shù)是否符合優(yōu)化標(biāo)準(zhǔn),如符合,則將所述待分析問答信息作為目標(biāo)問答信息; 更新答案集合生成步驟,基于所述目標(biāo)問答信息的問題信息獲取對應(yīng)的答案信息集合,分別計(jì)算所述答案信息集合中各個(gè)答案信息的相關(guān)度參數(shù),并根據(jù)所述相關(guān)度參數(shù)生成針對所述目標(biāo)問答信息中問題信息的更新答案集合。2.如權(quán)利要求1所述的方法,其特征在于,在所述目標(biāo)問答信息獲取步驟中,判斷所述待分析問答信息的測評參數(shù)是否小于預(yù)設(shè)測評閾值,如果小于,則將所述待分析問答信息作為目標(biāo)問答信息。3.如權(quán)利要求1或2所述的方法,其特征在于,在所述更新答案集合生成步驟中,根據(jù)問答信息中問題信息與答案信息是否具有語義相同的中心詞來確定答案信息的相關(guān)度參數(shù),其中,語義相同的中心詞的數(shù)量越多,答案信息與問題信息的相關(guān)度參數(shù)越大。4.如權(quán)利要求1或2所述的方法,其特征在于,在獲取所述答案信息集合時(shí),按照預(yù)設(shè)規(guī)則選取目標(biāo)用戶,并向所述目標(biāo)用戶推送所述目標(biāo)問答信息中的問題信息,獲取所述目標(biāo)用戶針對所述問題信息所反饋的答案信息,從而得到所述問答信息集合。5.如權(quán)利要求4所述的方法,其特征在于,在選取所述目標(biāo)用戶時(shí), 獲取對話系統(tǒng)不同用戶的用戶屬性,判斷用戶屬性是否符合預(yù)設(shè)問題推送要求,如果符合,則將對應(yīng)的用戶確定為所述目標(biāo)用戶,其中,所述用戶屬性包括以下所列項(xiàng)中的任一項(xiàng)或幾項(xiàng): 用戶身份信息、用戶位置信息、用戶年齡信息、用戶性別信息; 或,獲取對話系統(tǒng)不同用戶的交互場景和/或交互話題,判斷所述交互場景和/或交互話題是否符合預(yù)設(shè)問題推送要求,如果符合,則將對應(yīng)的用戶確定為所述目標(biāo)用戶。6.一種對話系統(tǒng)知識庫的優(yōu)化裝置,其特征在于,包括: 目標(biāo)問答信息獲取模塊,其用于判斷待分析問答信息的測評參數(shù)是否符合優(yōu)化標(biāo)準(zhǔn),如符合,則將所述待分析問答信息作為目標(biāo)問答信息; 更新答案集合生成模塊,其用于基于所述目標(biāo)問答信息的問題信息獲取對應(yīng)的答案信息集合,分別計(jì)算所述答案信息集合中各個(gè)答案信息的相關(guān)度參數(shù),并根據(jù)所述相關(guān)度參數(shù)生成針對所述目標(biāo)問答信息中問題信息的更新答案集合。7.如權(quán)利要求6所述的裝置,其特征在于,所述目標(biāo)問答信息獲取模塊配置為判斷所述待分析問答信息的測評參數(shù)是否小于預(yù)設(shè)測評閾值,如果小于,則將所述待分析問答信息作為目標(biāo)問答信息。8.如權(quán)利要求6或7所述的裝置,其特征在于,所述更新答案集合生成模塊配置為根據(jù)問答信息中問題信息與答案信息是否具有語義相同的中心詞來確定答案信息的相關(guān)度參數(shù),其中,語義相同的中心詞的數(shù)量越多,答案信息與問題信息的相關(guān)度參數(shù)越大。9.如權(quán)利要求6或7所述的裝置,其特征在于,所述更新答案集合生成模塊配置為在獲取所述答案信息集合時(shí),按照預(yù)設(shè)規(guī)則選取目標(biāo)用戶,并向所述目標(biāo)用戶推送所述目標(biāo)問答信息中的問題信息,獲取所述目標(biāo)用戶針對所述問題信息所反饋的答案信息,從而得到所述問答信息集合。10.如權(quán)利要求9所述的裝置,其特征在于,所述更新答案集合生成模塊配置為在選取所述目標(biāo)用戶時(shí), 獲取對話系統(tǒng)不同用戶的用戶屬性,判斷用戶屬性是否符合預(yù)設(shè)問題推送要求,如果符合,則將對應(yīng)的用戶確定為所述目標(biāo)用戶,其中,所述用戶屬性包括以下所列項(xiàng)中的任一項(xiàng)或幾項(xiàng): 用戶身份信息、用戶位置信息、用戶年齡信息、用戶性別信息; 或,獲取對話系統(tǒng)不同用戶的交互場景和/或交互話題,判斷所述交互場景和/或交互話題是否符合預(yù)設(shè)問題推送要求,如果符合,則將對應(yīng)的用戶確定為所述目標(biāo)用戶。
【文檔編號】G06F17/30GK105912697SQ201610262475
【公開日】2016年8月31日
【申請日】2016年4月25日
【發(fā)明人】孫永超, 邱模武, 包強(qiáng)
【申請人】北京光年無限科技有限公司