国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于大模型的SQL語句生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)與流程

      文檔序號(hào):40283039發(fā)布日期:2024-12-11 13:24閱讀:11來源:國(guó)知局
      基于大模型的SQL語句生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)與流程

      本申請(qǐng)涉及數(shù)據(jù)庫(kù)領(lǐng)域,尤其涉及一種基于大模型的sql語句生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。


      背景技術(shù):

      1、隨著深度學(xué)習(xí)技術(shù)的發(fā)展,自然語言處理領(lǐng)域在語言理解方面取得了顯著的進(jìn)展;同時(shí)大規(guī)模預(yù)訓(xùn)練語言在各種自然語言處理任務(wù)中表現(xiàn)出了強(qiáng)大的性能,可應(yīng)用于text2sql任務(wù)。text2sql任務(wù)指將自然語言描述的問題或需求轉(zhuǎn)化為結(jié)構(gòu)化查詢語言(sql)語句的過程。

      2、此外,良好的數(shù)據(jù)庫(kù)設(shè)計(jì)可以提高數(shù)據(jù)的存儲(chǔ)效率和查詢性能,同時(shí)在進(jìn)行text2sql任務(wù)時(shí),可以確保生成的sql語句能夠高效地執(zhí)行。目前,將自然語言文本轉(zhuǎn)換為結(jié)構(gòu)查詢語言(sql)的方法有:利用預(yù)訓(xùn)練的語言模型作為基礎(chǔ)模型,通過微調(diào)的方式將其應(yīng)用于text2sql任務(wù)。但由于結(jié)構(gòu)查詢語言比較復(fù)雜,語言模型對(duì)此類語言的理解程度有限,導(dǎo)致微調(diào)得到的模型并不準(zhǔn)確,進(jìn)而生成錯(cuò)誤的sql語句。


      技術(shù)實(shí)現(xiàn)思路

      1、本申請(qǐng)?zhí)峁┮环N基于大模型的sql語句生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),用以解決現(xiàn)有將自然語言文本轉(zhuǎn)化為sql語句的準(zhǔn)確性較低的技術(shù)問題。

      2、一方面,本申請(qǐng)?zhí)峁┮环N基于大模型的sql語句生成方法,包括:獲取數(shù)據(jù)庫(kù)中各數(shù)據(jù)表的模式信息,其中數(shù)據(jù)表的模式信息用于描述數(shù)據(jù)表的結(jié)構(gòu);將各數(shù)據(jù)表的模式信息進(jìn)行轉(zhuǎn)換得到各數(shù)據(jù)表對(duì)應(yīng)的第一向量信息,并根據(jù)第一向量信息構(gòu)建向量知識(shí)庫(kù);將用戶輸入的自然語言問題進(jìn)行轉(zhuǎn)換得到第二向量信息;計(jì)算各數(shù)據(jù)表對(duì)應(yīng)的第一向量信息和第二向量信息之間的相似度,并對(duì)相似度進(jìn)行降序排序;從排序中確定發(fā)生相似度驟減的第一相似度,刪除排序中的該第一相似度以及該第一相似度之后的相似度;根據(jù)排序中保留的相似度對(duì)應(yīng)的第一向量信息所對(duì)應(yīng)的數(shù)據(jù)表的模式信息,以及用戶輸入的自然語言問題,構(gòu)建提示詞;將提示詞輸入大語言模型,得到大語言模型輸出的sql語句。

      3、在一些示例中,根據(jù)排序中保留的相似度對(duì)應(yīng)的第一向量信息所對(duì)應(yīng)的數(shù)據(jù)表的模式信息,以及用戶輸入的自然語言問題,構(gòu)建提示詞,包括:確定提示詞的整體結(jié)構(gòu),整體結(jié)構(gòu)包括大模型的工作任務(wù)、提示指令、數(shù)據(jù)表的模式信息和回答;定義大模型的工作任務(wù)的開頭,工作任務(wù)為生成sql語句;解析排序中保留的相似度對(duì)應(yīng)的第一向量信息所對(duì)應(yīng)的數(shù)據(jù)表的模式信息,并將解析得到的信息與自然語言問題加入提示詞,并設(shè)置提示指令和回答,得到構(gòu)建好的提示詞。

      4、在一些示例中,第一向量信息和/或第二向量信息為低維稠密向量。

      5、在一些示例中,檢查數(shù)據(jù)表的模式信息中,數(shù)據(jù)表的主體信息、重要字段及其字段含義的描述是否清楚;若不清楚,則對(duì)模式信息進(jìn)行優(yōu)化,優(yōu)化包括增加數(shù)據(jù)庫(kù)模式信息。

      6、在一些示例中,將sql語句輸入至sql執(zhí)行器,獲得執(zhí)行結(jié)果。

      7、另一方面,本申請(qǐng)?zhí)峁┮环N基于大模型的sql語句生成裝置,包括:獲取模塊,用于獲取數(shù)據(jù)庫(kù)中各數(shù)據(jù)表的模式信息,其中數(shù)據(jù)表的模式信息用于描述數(shù)據(jù)表的結(jié)構(gòu);轉(zhuǎn)換模塊,用于將各數(shù)據(jù)表的模式信息進(jìn)行轉(zhuǎn)換得到各數(shù)據(jù)表對(duì)應(yīng)的第一向量信息,并根據(jù)第一向量信息構(gòu)建向量知識(shí)庫(kù);將用戶輸入的自然語言問題進(jìn)行轉(zhuǎn)換得到第二向量信息;處理模塊,用于計(jì)算各數(shù)據(jù)表對(duì)應(yīng)的第一向量信息和第二向量信息之間的相似度,并對(duì)相似度進(jìn)行降序排序;從排序中確定發(fā)生相似度驟減的第一相似度,刪除排序中的該第一相似度以及該第一相似度之后的相似度;執(zhí)行模塊,用于根據(jù)排序中保留的相似度對(duì)應(yīng)的第一向量信息所對(duì)應(yīng)的數(shù)據(jù)表的模式信息,以及用戶輸入的自然語言問題,構(gòu)建提示詞;將提示詞輸入大語言模型,得到大語言模型輸出的sql語句。

      8、在一些示例中,執(zhí)行模塊在根據(jù)排序中保留的相似度對(duì)應(yīng)的第一向量信息所對(duì)應(yīng)的數(shù)據(jù)表的模式信息,以及用戶輸入的自然語言問題,構(gòu)建提示詞時(shí),具體用于:確定提示詞的整體結(jié)構(gòu),整體結(jié)構(gòu)包括大模型的工作任務(wù)、提示指令、數(shù)據(jù)表的模式信息和回答;定義大模型的工作任務(wù)的開頭,工作任務(wù)為生成sql語句;解析排序中保留的相似度對(duì)應(yīng)的第一向量信息所對(duì)應(yīng)的數(shù)據(jù)表的模式信息,并將解析得到的信息與自然語言問題加入提示詞,并設(shè)置提示指令和回答,得到構(gòu)建好的提示詞。

      9、在一些示例中,獲取模塊還用于:檢查數(shù)據(jù)表的模式信息中,數(shù)據(jù)表的主體信息、重要字段及其字段含義的描述是否清楚;若不清楚,則對(duì)模式信息進(jìn)行優(yōu)化,優(yōu)化包括增加數(shù)據(jù)庫(kù)模式信息。

      10、又一方面,本申請(qǐng)?zhí)峁┮环N電子設(shè)備,包括:處理器,以及與處理器通信連接的存儲(chǔ)器;存儲(chǔ)器存儲(chǔ)計(jì)算機(jī)執(zhí)行指令;處理器執(zhí)行存儲(chǔ)器存儲(chǔ)的計(jì)算機(jī)執(zhí)行指令,以實(shí)現(xiàn)如前的方法。

      11、又一方面,本申請(qǐng)?zhí)峁┮环N計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)執(zhí)行指令,計(jì)算機(jī)執(zhí)行指令被處理器執(zhí)行時(shí)用于實(shí)現(xiàn)如前的方法。

      12、本申請(qǐng)?zhí)峁┑幕诖竽P偷膕ql語句生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),首先獲取數(shù)據(jù)庫(kù)中各數(shù)據(jù)表的模式信息,然后將各數(shù)據(jù)表的模式信息進(jìn)行轉(zhuǎn)換得到各數(shù)據(jù)表對(duì)應(yīng)得第一向量信息,再根據(jù)該第一向量信息構(gòu)建向量知識(shí)庫(kù);將用戶自然語言問題進(jìn)行轉(zhuǎn)換得到第二向量信息;計(jì)算第一向量信息和第二向量信息之間的相似度,并對(duì)相似度進(jìn)行降序排列,確定其中驟減的第一相似度,刪除該第一相似度以及之后的相似度;再根據(jù)保留的相似度對(duì)應(yīng)的第一向量信息所對(duì)應(yīng)的數(shù)據(jù)表模式信息,以及用戶輸入的自然語言問題,構(gòu)建提示詞,并將提示詞輸入大語言模型中,得到大語言模型輸出的sql語句。本方案中通過基于相似度排序選取的向量信息所對(duì)應(yīng)的模式信息構(gòu)建提示詞,可以利用提示詞優(yōu)化用戶輸入的自然語言問題,面向text2sql大模型生成sql語句,從而提高語句生成的準(zhǔn)確性,適用于復(fù)雜的查詢需求,且無需依賴繁瑣的人工工作,能夠應(yīng)用于各種業(yè)務(wù)需求。



      技術(shù)特征:

      1.一種基于大模型的sql語句生成方法,其特征在于,包括:

      2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述排序中保留的相似度對(duì)應(yīng)的第一向量信息所對(duì)應(yīng)的數(shù)據(jù)表的模式信息,以及所述用戶輸入的自然語言問題,構(gòu)建提示詞,包括:

      3.根據(jù)權(quán)利要求1所述的方法,其特征在于,包括:所述第一向量信息和/或所述第二向量信息為低維稠密向量。

      4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:

      5.根據(jù)權(quán)利要求1-4任一項(xiàng)所述的方法,其特征在于,包括:

      6.一種基于大模型的sql語句生成裝置,其特征在于,包括:

      7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述執(zhí)行模塊在根據(jù)所述排序中保留的相似度對(duì)應(yīng)的第一向量信息所對(duì)應(yīng)的數(shù)據(jù)表的模式信息,以及所述用戶輸入的自然語言問題,構(gòu)建提示詞時(shí),具體用于:

      8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述獲取模塊還用于:

      9.一種電子設(shè)備,其特征在于,包括:處理器,以及與所述處理器通信連接的存儲(chǔ)器;

      10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)執(zhí)行指令,所述計(jì)算機(jī)執(zhí)行指令被處理器執(zhí)行時(shí)用于實(shí)現(xiàn)如權(quán)利要求1至5任一項(xiàng)所述的方法。


      技術(shù)總結(jié)
      本申請(qǐng)?zhí)峁┮环N基于大模型的SQL語句生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。該方法包括:獲取數(shù)據(jù)庫(kù)中各數(shù)據(jù)表的模式信息,然后將各數(shù)據(jù)表的模式信息進(jìn)行轉(zhuǎn)換得到各數(shù)據(jù)表對(duì)應(yīng)得第一向量信息,再根據(jù)該第一向量信息構(gòu)建向量知識(shí)庫(kù);將用戶自然語言問題進(jìn)行轉(zhuǎn)換得到第二向量信息;計(jì)算第一向量信息和第二向量信息之間的相似度,并對(duì)相似度進(jìn)行降序排列,確定其中驟減的第一相似度,刪除該第一相似度以及之后的相似度;再根據(jù)保留的相似度對(duì)應(yīng)的第一向量信息所對(duì)應(yīng)的數(shù)據(jù)表模式信息,以及用戶輸入的自然語言問題,構(gòu)建提示詞,并將提示詞輸入大語言模型中,得到大語言模型輸出的SQL語句。

      技術(shù)研發(fā)人員:黃貝貝
      受保護(hù)的技術(shù)使用者:中國(guó)聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司
      技術(shù)研發(fā)日:
      技術(shù)公布日:2024/12/10
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1