本發(fā)明屬于自然語言處理,具體涉及一種用于復(fù)雜事件理解的動態(tài)假設(shè)驗(yàn)證方法及裝置。
背景技術(shù):
1、在信息爆炸時代,人們被大量關(guān)于現(xiàn)實(shí)世界事件的信息所淹沒。其中,復(fù)雜的新興事件往往涉及較長時間、復(fù)雜的原因和重大影響,導(dǎo)致互聯(lián)網(wǎng)上出現(xiàn)大量復(fù)雜且冗長的新聞。這些信息的豐富性使得用戶難以高效地消化和理解。因此,如何快速理解這些復(fù)雜事件的核心思想已成為一個關(guān)鍵問題,備受關(guān)注。
2、為了便于理解與復(fù)雜事件相關(guān)的大量信息,早期的努力主要集中在隨著時間的推移追蹤事件。這包括創(chuàng)建提供事件進(jìn)展的摘要,以及以更結(jié)構(gòu)化的方式可視化新聞?wù)Z料庫。這些方法有助于維護(hù)事件的時間記錄,使用戶更容易了解最新進(jìn)展。然而,僅僅了解事件的進(jìn)程是不夠的。我們希望人工智能能夠提供更深入、更主動和更靈活的幫助。這包括分析事件的原因和預(yù)測未來的結(jié)果,從而大大增強(qiáng)人類的決策過程。
3、解決這些問題需要復(fù)雜的信息需求和復(fù)雜的推理能力。最近,基于聊天的大型語言模型(llms)的快速進(jìn)步在復(fù)雜任務(wù)解決方面取得了顯著成就。通過將llms與檢索系統(tǒng)等外部工具結(jié)合起來,并將llms轉(zhuǎn)變?yōu)樽灾鞔?,它們還可以主動檢索最新知識以促進(jìn)推理過程,這展示了在有效復(fù)雜事件理解方面的巨大潛力。盡管如此,由于任務(wù)的復(fù)雜性,初步分析顯示,在直接適應(yīng)復(fù)雜事件理解任務(wù)的自主代理時,出現(xiàn)了一些挑戰(zhàn),包括檢索效率低、檢索證據(jù)利用率低和計(jì)算資源消耗高。因此,研究如何將這些方法與人類高效的研究和分析過程對齊至關(guān)重要。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明旨在解決現(xiàn)有技術(shù)的不足,提出一種用于復(fù)雜事件理解的動態(tài)假設(shè)驗(yàn)證方法及裝置,通過提出一種新穎的動態(tài)多視角思維代理框架使語言模型能夠主動提出并動態(tài)調(diào)整假設(shè),通過檢索和推理過程驗(yàn)證假設(shè),并最終綜合出全面的解決方案。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供了如下方案:一種用于復(fù)雜事件理解的動態(tài)假設(shè)驗(yàn)證方法,包括以下步驟:
3、s1、采集并標(biāo)注數(shù)據(jù)集;
4、s2、構(gòu)建動態(tài)多視角思維代理框架,采用所述數(shù)據(jù)集對所述動態(tài)多視角思維代理框架進(jìn)行訓(xùn)練,并基于訓(xùn)練后的所述動態(tài)多視角思維代理框架對用戶關(guān)于復(fù)雜事件的查詢生成綜合答案。
5、進(jìn)一步優(yōu)選地,得到所述數(shù)據(jù)集的方法包括:
6、采集復(fù)雜事件實(shí)例,人工對復(fù)雜事件實(shí)例進(jìn)行標(biāo)注;每個標(biāo)注實(shí)例包含一個三元組(q,k,d),其中,q表示用戶的查詢;k表示答案中包含的關(guān)鍵點(diǎn)列表;d表示與查詢中的復(fù)雜事件相關(guān)的新聞報(bào)道集。
7、進(jìn)一步優(yōu)選地,所述動態(tài)多視角思維代理框架得到所述綜合答案的方法包括:
8、步驟1:基于用戶對復(fù)雜事件的查詢,提出邏輯假設(shè)集;
9、步驟2:從邏輯假設(shè)集中選中一個假設(shè),基于所述假設(shè)檢索證據(jù)并進(jìn)行推理,得到推理結(jié)果;并將所述假設(shè)從所述邏輯假設(shè)集中刪去;
10、步驟3:基于所述推理結(jié)果,對當(dāng)前邏輯假設(shè)集進(jìn)行修改,所述修改包括刪除邏輯假設(shè)和添加新的邏輯假設(shè);對修改后的邏輯假設(shè)集重復(fù)步驟2,直到邏輯假設(shè)集為空;將所有推理結(jié)果為真的假設(shè)及檢索的證據(jù)組成最終論據(jù)集,并進(jìn)行步驟4操作;
11、步驟4:基于語言模型和記錄下的所述最終論據(jù)集,得到所述綜合答案。
12、進(jìn)一步優(yōu)選地,對于用戶對復(fù)雜事件的查詢,提出所述邏輯假設(shè);采用查詢生成器對所述邏輯假設(shè)進(jìn)行分析,生成若干獨(dú)立的查詢;對于每個查詢,采用檢索器檢索外部新聞數(shù)據(jù)庫以提供所述證據(jù);采用推理器用于對所述證據(jù)進(jìn)行合成推理,得到推理的結(jié)果。
13、進(jìn)一步優(yōu)選地,所述檢索器在檢索過程中,基于標(biāo)題相關(guān)性、內(nèi)容相關(guān)性以及時間相關(guān)性得到所述證據(jù);
14、所述標(biāo)題相關(guān)性的計(jì)算方法包括:
15、采用語言模型生成每個標(biāo)題文本的嵌入向量,計(jì)算標(biāo)題的嵌入向量與查詢嵌入向量之間的余弦相似度作為標(biāo)題相關(guān)性;
16、所述時間相關(guān)性為新聞時間戳與時間哨兵之間時間差的指數(shù)衰減函數(shù);
17、采用最小-最大縮放方法,將三種相關(guān)性分?jǐn)?shù)進(jìn)行歸一化,最終所述證據(jù)的檢索分?jǐn)?shù)為:
18、score=α1·title+α2·content+α3·\temporal,
19、式中,α1、α2、α3分別表示權(quán)重系數(shù);title、content以及temporal分別表示輸入查詢與相應(yīng)文章在標(biāo)題、內(nèi)容以及時間方面的相關(guān)性分?jǐn)?shù)。
20、本發(fā)明還提供一種用于復(fù)雜事件理解的動態(tài)假設(shè)驗(yàn)證裝置,包括:數(shù)據(jù)集構(gòu)建模塊以及動態(tài)多視角思維代理框架模塊;
21、所述數(shù)據(jù)集構(gòu)建模塊用于采集并標(biāo)注數(shù)據(jù)集;
22、所述動態(tài)多視角思維代理框架模塊用于構(gòu)建動態(tài)多視角思維代理框架,采用所述數(shù)據(jù)集對所述動態(tài)多視角思維代理框架進(jìn)行訓(xùn)練,并基于訓(xùn)練后的所述動態(tài)多視角思維代理框架對用戶關(guān)于復(fù)雜事件的查詢生成綜合答案。
23、進(jìn)一步優(yōu)選地,所述數(shù)據(jù)集構(gòu)建模塊得到所述數(shù)據(jù)集的方法包括:
24、采集復(fù)雜事件實(shí)例,人工對復(fù)雜事件實(shí)例進(jìn)行標(biāo)注;每個標(biāo)注實(shí)例包含一個三元組(q,k,d),其中,q表示用戶的查詢;k表示答案中包含的關(guān)鍵點(diǎn)列表;d表示與查詢中的復(fù)雜事件相關(guān)的新聞報(bào)道集。
25、進(jìn)一步優(yōu)選地,所述動態(tài)多視角思維代理框架模塊包括:查詢輸入單元、邏輯證明搜索與推理單元、假設(shè)修改單元以及方案生成單元;
26、所述查詢輸入單元用于基于用戶對復(fù)雜事件的查詢,提出邏輯假設(shè)集;
27、所述查詢輸入單元用于基于用戶對復(fù)雜事件的查詢,提出邏輯假設(shè)集;
28、所述邏輯證明搜索與推理單元用于對每一個假設(shè)進(jìn)行分析,基于所述假設(shè)搜索證據(jù),并基于所述證據(jù)對所述假設(shè)進(jìn)行推理,得到推理結(jié)果;并將所述假設(shè)從所述邏輯假設(shè)集中刪除;
29、所述假設(shè)修改單元用于基于所述推理結(jié)果,對所述邏輯假設(shè)集進(jìn)行修改,所述修改包括刪除邏輯假設(shè)和添加新的邏輯假設(shè);并將新的邏輯假設(shè)集輸入所述邏輯證明搜索與推理單元,直到所述邏輯假設(shè)集為空;將所有推理結(jié)果為真的假設(shè)及檢索的證據(jù)組成最終論據(jù)集,并將所述最終論據(jù)集輸入至所述方案生成單元;
30、所述方案生成單元用于基于語言模型和所述最終論據(jù)集,得到所述綜合答案。
31、進(jìn)一步優(yōu)選地,所述邏輯證明搜索與推理單元包括:查詢生成器、檢索器以及推理器;
32、所述查詢生成器用于基于對所述邏輯假設(shè)進(jìn)行分析,并生成若干獨(dú)立的查詢;
33、所述檢索器用于基于每個查詢,檢索外部新聞數(shù)據(jù)庫以提供所述證據(jù);
34、所述推理器用于對所述證據(jù)進(jìn)行合成推理,得到所述推理結(jié)果。
35、進(jìn)一步優(yōu)選地,所述檢索器在檢索過程中,基于標(biāo)題相關(guān)性、內(nèi)容相關(guān)性以及時間相關(guān)性得到所述證據(jù);
36、所述標(biāo)題相關(guān)性的計(jì)算方法包括:
37、采用語言模型生成每個標(biāo)題文本的嵌入向量,計(jì)算標(biāo)題的嵌入向量與查詢嵌入向量之間的余弦相似度作為標(biāo)題相關(guān)性;
38、所述時間相關(guān)性為新聞時間戳與時間哨兵之間時間差的指數(shù)衰減函數(shù);
39、采用最小-最大縮放方法,將三種相關(guān)性分?jǐn)?shù)進(jìn)行歸一化,最終所述證據(jù)的檢索分?jǐn)?shù)為:
40、score=α1·title+α2·content+α3·\temporal,
41、式中,α1、α2、α3分別表示權(quán)重系數(shù);title、content以及temporal分別表示輸入查詢與相應(yīng)文章在標(biāo)題、內(nèi)容以及時間方面的相關(guān)性分?jǐn)?shù)。
42、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果為:
43、本發(fā)明提出了一種新的代理框架--動態(tài)多視角思維代理,用于復(fù)雜事件理解。在動態(tài)多視角思維代理框架中,包括多視角思維,可以使llm能夠?qū)赡艿氖录尘斑M(jìn)行假設(shè)?;谶@些假設(shè),通過邏輯證明搜索和推理模塊進(jìn)行更精確的檢索和驗(yàn)證。同時,可以動態(tài)調(diào)整提出的假設(shè)方案。這允許在響應(yīng)效率和全面性之間取得有利的平衡。
44、目前沒有專門用于理解復(fù)雜事件的公開數(shù)據(jù),因此本發(fā)明策劃了一個包含100對問題-關(guān)鍵點(diǎn)列表的復(fù)雜事件理解數(shù)據(jù)集。該數(shù)據(jù)集包含從2021年至2023年間精心制作的經(jīng)濟(jì)新聞問題,并由人工標(biāo)注。每個問題都注有應(yīng)在答案中涵蓋的關(guān)鍵點(diǎn),用于自動模型評估,以評估生成和檢索過程中的答案關(guān)鍵點(diǎn)覆蓋情況。實(shí)驗(yàn)結(jié)果表明,與之前提出的rag框架相比,我們的方法在收集相關(guān)證據(jù)的效率和最終響應(yīng)質(zhì)量方面都取得了顯著進(jìn)展。