指令微調(diào)數(shù)據(jù)生成方法、裝置、設(shè)備及介質(zhì)與流程

文檔序號(hào)：40403164發(fā)布日期：2024-12-20 12:26閱讀：3來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

指令微調(diào)數(shù)據(jù)生成方法、裝置、設(shè)備及介質(zhì)與流程

本發(fā)明涉及車(chē)輛模型，尤其涉及一種指令微調(diào)數(shù)據(jù)生成方法、裝置、設(shè)備及介質(zhì)。

背景技術(shù)：

1、在人工智能(ai)大模型訓(xùn)練領(lǐng)域，訓(xùn)練過(guò)程通常分為三個(gè)階段：通用知識(shí)預(yù)訓(xùn)練、專(zhuān)業(yè)領(lǐng)域預(yù)訓(xùn)練，以及專(zhuān)業(yè)領(lǐng)域的指令微調(diào)訓(xùn)練。指令微調(diào)訓(xùn)練以其高度的靈活性和可遷移性，已成為ai大模型訓(xùn)練中的一種流行方法。這種訓(xùn)練方式可以針對(duì)特定的任務(wù)或領(lǐng)域，對(duì)預(yù)訓(xùn)練模型進(jìn)行進(jìn)一步的優(yōu)化，以提高模型在特定任務(wù)上的表現(xiàn)。

2、當(dāng)前指令生成技術(shù)主要包括獲取預(yù)設(shè)語(yǔ)料庫(kù)中的多個(gè)文本，進(jìn)行預(yù)處理得到輸入表示。將輸入表示按預(yù)設(shè)規(guī)則處理，得到塊級(jí)別的文本。將塊級(jí)別文本輸入檢索庫(kù)進(jìn)行檢索，獲取一定數(shù)量的檢索文本。將輸入表示及檢索文本一起輸入預(yù)設(shè)模型中進(jìn)行訓(xùn)練，得到增強(qiáng)后的模型。

3、盡管現(xiàn)有的微調(diào)指令生成技術(shù)取得了一定進(jìn)展，但仍存在明顯不足。首先，對(duì)文本的格式有一定的要求，這限制了訓(xùn)練數(shù)據(jù)的多樣性和廣泛性。其次在處理文本時(shí)，段落的劃分可能不夠準(zhǔn)確，這可能影響模型對(duì)文本內(nèi)容的理解和訓(xùn)練效果。最后由于上述限制生成的訓(xùn)練數(shù)據(jù)可能存在質(zhì)量問(wèn)題，這會(huì)直接影響模型訓(xùn)練的效果和最終性能。因此，迫切需要一種更為高效、準(zhǔn)確的方法，以提高訓(xùn)練數(shù)據(jù)的質(zhì)量和多樣性，同時(shí)降低對(duì)人工校對(duì)和數(shù)據(jù)準(zhǔn)備的依賴(lài)，提升整個(gè)訓(xùn)練流程的效率。

技術(shù)實(shí)現(xiàn)思路

1、本申請(qǐng)的主要目的在于提供一種指令微調(diào)數(shù)據(jù)生成方法、裝置、設(shè)備及介質(zhì)，旨在解決如何提高生成的指令微調(diào)數(shù)據(jù)的準(zhǔn)確性的技術(shù)問(wèn)題。

2、為實(shí)現(xiàn)上述目的，本申請(qǐng)?zhí)岢鲆环N指令微調(diào)數(shù)據(jù)生成方法，所述方法包括：

3、獲取文本數(shù)據(jù)；

4、將所述文本數(shù)據(jù)轉(zhuǎn)換為預(yù)設(shè)文本格式，得到文本信息；

5、基于多個(gè)預(yù)設(shè)模板內(nèi)容構(gòu)建掩碼模板，得到掩碼模板內(nèi)容；

6、將所述文本信息與所述掩碼模板內(nèi)容進(jìn)行匹配，得到問(wèn)答對(duì)數(shù)據(jù)；

7、基于所述問(wèn)答對(duì)數(shù)據(jù)，生成指令微調(diào)數(shù)據(jù)。

8、在一實(shí)施例中，所述基于多個(gè)預(yù)設(shè)模板內(nèi)容構(gòu)建掩碼模板，得到掩碼模板內(nèi)容的步驟，包括：

9、確定多個(gè)預(yù)設(shè)模板，每個(gè)模板對(duì)應(yīng)不同的問(wèn)答對(duì)生成場(chǎng)景，包括摘要模板、判斷模板、補(bǔ)全模板和歸因模板；

10、根據(jù)多個(gè)所述預(yù)設(shè)模板，構(gòu)建掩碼模板，其中掩碼模板包括一個(gè)或多個(gè)占位符，用于后續(xù)填充實(shí)際文本內(nèi)容；

11、根據(jù)所述掩碼模板，得到所述掩碼模板內(nèi)容。

12、在一實(shí)施例中，所述將所述文本信息與所述掩碼模板內(nèi)容進(jìn)行匹配，得到問(wèn)答對(duì)數(shù)據(jù)的步驟，包括：

13、使用所述文本信息與所述掩碼模板內(nèi)容進(jìn)行匹配，確定是否生成問(wèn)答對(duì)；

14、當(dāng)匹配成功時(shí)，根據(jù)掩碼模板內(nèi)容填充所述文本信息，生成問(wèn)答對(duì)數(shù)據(jù)；

15、將所述文本信息與所述掩碼模板內(nèi)容進(jìn)行匹配之后，還包括：

16、當(dāng)匹配不成功時(shí)，擴(kuò)大所述文本信息范圍進(jìn)行匹配，直至達(dá)到文本數(shù)據(jù)范圍。

17、在一實(shí)施例中，所述基于所述問(wèn)答對(duì)數(shù)據(jù)，生成指令微調(diào)數(shù)據(jù)的步驟，包括：

18、基于所述問(wèn)答對(duì)數(shù)據(jù)利用關(guān)鍵詞提取技術(shù)，得到關(guān)鍵信息；

19、結(jié)合掩碼模板和所述關(guān)鍵信息，生成指令微調(diào)數(shù)據(jù)。

20、在一實(shí)施例中，所述將所述文本數(shù)據(jù)轉(zhuǎn)換為預(yù)設(shè)文本格式，得到文本信息的步驟之后，包括：

21、識(shí)別并記錄轉(zhuǎn)換過(guò)程中的信息遺漏和錯(cuò)識(shí)別問(wèn)題；

22、根據(jù)所述信息遺漏和錯(cuò)識(shí)別問(wèn)題對(duì)所述文本信息進(jìn)行逐項(xiàng)校對(duì)，得到校對(duì)結(jié)果；

23、基于所述校對(duì)結(jié)果對(duì)所述文本信息進(jìn)行修正，得到修正后的文本信息。

24、在一實(shí)施例中，所述基于所述問(wèn)答對(duì)數(shù)據(jù)，生成指令微調(diào)數(shù)據(jù)的步驟之后，包括：

25、應(yīng)用預(yù)設(shè)裁判模型對(duì)所述指令微調(diào)數(shù)據(jù)進(jìn)行評(píng)估，得到評(píng)估結(jié)果；

26、根據(jù)評(píng)估結(jié)果對(duì)所述指令微調(diào)數(shù)據(jù)進(jìn)行分類(lèi)，得到分類(lèi)結(jié)果；

27、根據(jù)所述分類(lèi)結(jié)果輸出指令數(shù)據(jù)至智能模型進(jìn)行優(yōu)化。

28、在一實(shí)施例中，所述根據(jù)評(píng)估結(jié)果對(duì)所述指令微調(diào)數(shù)據(jù)進(jìn)行分類(lèi)，得到分類(lèi)結(jié)果的步驟之后，包括：

29、根據(jù)所述分類(lèi)結(jié)果，得到高置信度數(shù)據(jù)和低置信度數(shù)據(jù)；

30、對(duì)所述低置信度的數(shù)據(jù)進(jìn)行校驗(yàn)和修正，得到修正后的數(shù)據(jù)；

31、對(duì)修正后的數(shù)據(jù)重新進(jìn)行評(píng)估，直至滿足預(yù)設(shè)質(zhì)量標(biāo)準(zhǔn)。

32、此外，為實(shí)現(xiàn)上述目的，本申請(qǐng)還提出一種指令微調(diào)數(shù)據(jù)生成裝置，所述指令微調(diào)數(shù)據(jù)生成裝置包括：

33、獲取模塊，用于獲取文本數(shù)據(jù)；

34、轉(zhuǎn)換模塊，用于將所述文本數(shù)據(jù)轉(zhuǎn)換為預(yù)設(shè)文本格式，得到文本信息；

35、構(gòu)建模塊，用于基于多個(gè)預(yù)設(shè)模板內(nèi)容構(gòu)建掩碼模板，得到掩碼模板內(nèi)容；

36、匹配模塊，用于將所述文本信息與所述掩碼模板內(nèi)容進(jìn)行匹配，生成問(wèn)答對(duì)數(shù)據(jù)；

37、結(jié)果模塊，用于基于所述問(wèn)答對(duì)數(shù)據(jù)，生成指令微調(diào)數(shù)據(jù)。

38、此外，為實(shí)現(xiàn)上述目的，本申請(qǐng)還提出一種介質(zhì)，所述介質(zhì)為計(jì)算機(jī)可讀介質(zhì)，所述介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序，所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上文所述的指令微調(diào)數(shù)據(jù)生成方法的步驟。

39、此外，為實(shí)現(xiàn)上述目的，本申請(qǐng)還提供一種計(jì)算機(jī)程序產(chǎn)品，所述計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)程序，所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上文所述的指令微調(diào)數(shù)據(jù)生成方法的步驟。

40、本申請(qǐng)通過(guò)獲取文本數(shù)據(jù)，將文本數(shù)據(jù)轉(zhuǎn)換為預(yù)設(shè)文本格式，得到文本信息，基于多個(gè)預(yù)設(shè)模板內(nèi)容構(gòu)建掩碼模板，得到掩碼模板內(nèi)容，將文本信息與掩碼模板內(nèi)容進(jìn)行匹配，得到問(wèn)答對(duì)數(shù)據(jù)，基于問(wèn)答對(duì)數(shù)據(jù)，生成指令微調(diào)數(shù)據(jù)。通過(guò)文本數(shù)據(jù)轉(zhuǎn)換、掩碼模板匹配，生成指令微調(diào)數(shù)據(jù)，提高了指令微調(diào)數(shù)據(jù)的準(zhǔn)確性。

技術(shù)特征：

1.一種指令微調(diào)數(shù)據(jù)生成方法，其特征在于，所述方法包括：

2.如權(quán)利要求1所述的方法，其特征在于，所述基于多個(gè)預(yù)設(shè)模板內(nèi)容構(gòu)建掩碼模板，得到掩碼模板內(nèi)容的步驟，包括：

3.如權(quán)利要求1所述的方法，其特征在于，所述將所述文本信息與所述掩碼模板內(nèi)容進(jìn)行匹配，得到問(wèn)答對(duì)數(shù)據(jù)的步驟，包括：

4.如權(quán)利要求1所述的方法，其特征在于，所述基于所述問(wèn)答對(duì)數(shù)據(jù)，生成指令微調(diào)數(shù)據(jù)的步驟，包括：

5.如權(quán)利要求1所述的方法，其特征在于，所述將所述文本數(shù)據(jù)轉(zhuǎn)換為預(yù)設(shè)文本格式，得到文本信息的步驟之后，包括：

6.如權(quán)利要求1所述的方法，其特征在于，所述基于所述問(wèn)答對(duì)數(shù)據(jù)，生成指令微調(diào)數(shù)據(jù)的步驟之后，包括：

7.如權(quán)利要求6所述的方法，其特征在于，所述根據(jù)評(píng)估結(jié)果對(duì)所述指令微調(diào)數(shù)據(jù)進(jìn)行分類(lèi)，得到分類(lèi)結(jié)果的步驟之后，包括：

8.一種指令微調(diào)數(shù)據(jù)生成裝置，其特征在于，所述裝置包括：

9.一種指令微調(diào)數(shù)據(jù)生成設(shè)備，其特征在于，所述設(shè)備包括：存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的指令微調(diào)數(shù)據(jù)生成程序，所述指令微調(diào)數(shù)據(jù)生成程序配置為實(shí)現(xiàn)如權(quán)利要求1至7中任一項(xiàng)所述的指令微調(diào)數(shù)據(jù)生成方法的步驟。

10.一種介質(zhì)，其特征在于，所述介質(zhì)上存儲(chǔ)有指令微調(diào)數(shù)據(jù)生成程序，所述指令微調(diào)數(shù)據(jù)生成程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述的指令微調(diào)數(shù)據(jù)生成方法的步驟。

技術(shù)總結(jié)
本申請(qǐng)公開(kāi)了一種指令微調(diào)數(shù)據(jù)生成方法、裝置、設(shè)備及介質(zhì)，涉及車(chē)輛模型技術(shù)領(lǐng)域，包括：通過(guò)獲取文本數(shù)據(jù)，將文本數(shù)據(jù)轉(zhuǎn)換為預(yù)設(shè)文本格式，得到文本信息，基于多個(gè)預(yù)設(shè)模板內(nèi)容構(gòu)建掩碼模板，得到掩碼模板內(nèi)容，將文本信息與掩碼模板內(nèi)容進(jìn)行匹配，得到問(wèn)答對(duì)數(shù)據(jù)，基于問(wèn)答對(duì)數(shù)據(jù)，生成指令微調(diào)數(shù)據(jù)。通過(guò)文本數(shù)據(jù)轉(zhuǎn)換、掩碼模板匹配，生成指令微調(diào)數(shù)據(jù)，提高了指令微調(diào)數(shù)據(jù)的準(zhǔn)確性。

技術(shù)研發(fā)人員：聶家威
受保護(hù)的技術(shù)使用者：嵐圖汽車(chē)科技有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/19

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：聶家威
技術(shù)所有人：嵐圖汽車(chē)科技有限公司
我是此專(zhuān)利的發(fā)明人

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢(xún)。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

指令微調(diào)數(shù)據(jù)生成方法、裝置、設(shè)備及介質(zhì)與流程

指令微調(diào)數(shù)據(jù)生成方法、裝置、設(shè)備及介質(zhì)與流程