本申請涉及自然語言處理,尤其涉及到一種數(shù)據(jù)抽取方法、裝置、電子設(shè)備、存儲介質(zhì)及程序產(chǎn)品。
背景技術(shù):
1、隨著自然語言處理技術(shù)的快速發(fā)展,語言模型(如gpt系列)已經(jīng)成為數(shù)據(jù)抽取任務(wù)中的重要工具。語言模型通過學(xué)習(xí)大量的文本數(shù)據(jù),能夠理解和生成人類語言,從而實現(xiàn)對各種文本信息的抽取。
技術(shù)實現(xiàn)思路
1、本申請實施例提供一種數(shù)據(jù)抽取方法、裝置、電子設(shè)備、存儲介質(zhì)及程序產(chǎn)品。
2、一方面,本申請實施例提供一種數(shù)據(jù)抽取方法,所述方法包括:
3、確定提示內(nèi)容,所述提示內(nèi)容用于提示從目標(biāo)文本中抽取目標(biāo)名稱的數(shù)據(jù),所述提示內(nèi)容包括第一提示內(nèi)容及第二提示內(nèi)容,所述第一提示內(nèi)容包括示例模板、所述目標(biāo)文本及所述目標(biāo)名稱,所述第二提示內(nèi)容包括所述目標(biāo)文本及所述目標(biāo)名稱;
4、將所述提示內(nèi)容輸入第一語言模型進(jìn)行第一數(shù)據(jù)抽取,得到所述第一提示內(nèi)容對應(yīng)的多個第一抽取結(jié)果,及所述第二提示內(nèi)容對應(yīng)的多個第二抽取結(jié)果;
5、基于所述多個第一抽取結(jié)果和所述多個第二抽取結(jié)果,確定第一數(shù)據(jù)抽取結(jié)果。
6、可以看出,在本申請實施例中,由于提示內(nèi)容包括第一提示內(nèi)容及第二提示內(nèi)容,不同的提示內(nèi)容能夠使得第一語言模型從不同的角度或?qū)用娼沂緮?shù)據(jù)的特征,因此能夠解決由于單一的提示內(nèi)容導(dǎo)致抽取偏差以及局限性的問題,從而能夠準(zhǔn)確地對目標(biāo)文本進(jìn)行數(shù)據(jù)抽取。通過獲取多個第一抽取結(jié)果及多個第二抽取結(jié)果,能夠增加抽取結(jié)果的多樣性,進(jìn)一步提升數(shù)據(jù)抽取的準(zhǔn)確性。
7、另一方面,本申請?zhí)峁┮环N數(shù)據(jù)抽取裝置,所述數(shù)據(jù)抽取裝置包括:
8、確定模塊,用于確定提示內(nèi)容,所述提示內(nèi)容用于提示從目標(biāo)文本中抽取目標(biāo)名稱的數(shù)據(jù),所述提示內(nèi)容包括第一提示內(nèi)容及第二提示內(nèi)容,所述第一提示內(nèi)容包括示例模板、所述目標(biāo)文本及所述目標(biāo)名稱,所述第二提示內(nèi)容包括所述目標(biāo)文本及所述目標(biāo)名稱;
9、輸入模塊,用于將所述提示內(nèi)容輸入第一語言模型進(jìn)行第一數(shù)據(jù)抽取,得到所述第一提示內(nèi)容對應(yīng)的多個第一抽取結(jié)果,及所述第二提示內(nèi)容對應(yīng)的多個第二抽取結(jié)果;
10、所述確定模塊,還用于基于所述多個第一抽取結(jié)果和所述多個第二抽取結(jié)果,確定第一數(shù)據(jù)抽取結(jié)果。
11、另一方面,本申請?zhí)峁┮环N電子設(shè)備,所述電子設(shè)備包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運(yùn)行的計算機(jī)程序,所述處理器執(zhí)行所述計算機(jī)程序時實現(xiàn)如上述提供的數(shù)據(jù)抽取方法。
12、另一方面,本申請?zhí)峁┮环N計算機(jī)可讀存儲介質(zhì),所述計算機(jī)可讀存儲介質(zhì)上存儲有計算機(jī)程序,所述計算機(jī)程序被處理器執(zhí)行時實現(xiàn)如上述提供的數(shù)據(jù)抽取方法。
13、另一方面,本申請?zhí)峁┮环N計算機(jī)程序產(chǎn)品,包括計算機(jī)程序,該計算機(jī)程序被處理器執(zhí)行時實現(xiàn)如上述提供的數(shù)據(jù)抽取方法。
1.一種數(shù)據(jù)抽取方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的數(shù)據(jù)抽取方法,其特征在于,所述多個第一抽取結(jié)果包括至少一個第一類別的抽取結(jié)果,所述多個第二抽取結(jié)果包括至少一個第二類別的抽取結(jié)果;所述基于所述多個第一抽取結(jié)果和所述多個第二抽取結(jié)果,確定第一數(shù)據(jù)抽取結(jié)果,包括:
3.如權(quán)利要求2所述的數(shù)據(jù)抽取方法,其特征在于,所述根據(jù)每個所述第一類別的抽取結(jié)果的數(shù)量、每個所述第二類別的抽取結(jié)果的數(shù)量、所述多個第一抽取結(jié)果和所述多個第二抽取結(jié)果,確定第一數(shù)據(jù)抽取結(jié)果,包括:
4.如權(quán)利要求3所述的數(shù)據(jù)抽取方法,其特征在于,所述方法還包括:
5.如權(quán)利要求1所述的數(shù)據(jù)抽取方法,其特征在于,所述確定提示內(nèi)容,包括:
6.如權(quán)利要求5所述的數(shù)據(jù)抽取方法,其特征在于,所述目標(biāo)名稱對應(yīng)多個文本示例,所述方法還包括:
7.如權(quán)利要求1所述的數(shù)據(jù)抽取方法,其特征在于,所述將所述提示內(nèi)容輸入第一語言模型進(jìn)行第一數(shù)據(jù)抽取,得到所述第一提示內(nèi)容對應(yīng)的多個第一抽取結(jié)果包括:
8.根據(jù)權(quán)利要求7所述的數(shù)據(jù)抽取方法,其特征在于,每條所述第一推理路徑包括所述目標(biāo)文本中的多個文本數(shù)據(jù),所述多個文本數(shù)據(jù)之間具有對應(yīng)的排列順序,每條所述第一推理路徑的多個文本數(shù)據(jù)中包括一個所述第一抽取結(jié)果。
9.一種數(shù)據(jù)抽取裝置,其特征在于,所述數(shù)據(jù)抽取裝置包括:
10.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運(yùn)行的計算機(jī)程序,所述處理器執(zhí)行所述計算機(jī)程序時實現(xiàn)如權(quán)利要求1至8中任一項所述的數(shù)據(jù)抽取方法。
11.一種計算機(jī)可讀存儲介質(zhì),其特征在于,所述計算機(jī)可讀存儲介質(zhì)上存儲有計算機(jī)程序,所述計算機(jī)程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至8中任一項所述的數(shù)據(jù)抽取方法。
12.一種計算機(jī)程序產(chǎn)品,包括計算機(jī)程序,其特征在于,該計算機(jī)程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至8中任一項所述的數(shù)據(jù)抽取方法。