国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      模型微調(diào)方法、文本處理方法、介質(zhì)、設備及程序產(chǎn)品與流程

      文檔序號:40385150發(fā)布日期:2024-12-20 12:07閱讀:5來源:國知局
      模型微調(diào)方法、文本處理方法、介質(zhì)、設備及程序產(chǎn)品與流程

      本公開涉及隱私保護領域,具體地,涉及一種模型微調(diào)方法、文本處理方法、介質(zhì)、設備及程序產(chǎn)品。


      背景技術:

      1、大語言模型(large?language?models,llm)應用變得越來越廣泛,許多客戶想要使用云服務平臺提供的llm服務??蛻敉ǔ褂胠lm服務提供的兩種典型功能:微調(diào)和推理(即預測)。首先,客戶會將私有的數(shù)據(jù)集上傳到云服務平臺用于微調(diào)部署在平臺上的預訓練模型,以提升模型在特定領域的任務效果。之后,客戶會通過平臺調(diào)用微調(diào)后所得的模型的推理功能,輸入推理文本來獲取預測結(jié)果。

      2、然而,上述方案在為客戶提供高效、可定制的llm服務的同時,也帶來了客戶數(shù)據(jù)泄露的風險。


      技術實現(xiàn)思路

      1、提供該
      技術實現(xiàn)要素:
      部分以便以簡要的形式介紹構思,這些構思將在后面的具體實施方式部分被詳細描述。該發(fā)明內(nèi)容部分并不旨在標識要求保護的技術方案的關鍵特征或必要特征,也不旨在用于限制所要求的保護的技術方案的范圍。

      2、第一方面,本公開提供一種大語言模型微調(diào)方法,包括:從服務端獲取大語言模型的詞表和嵌入層參數(shù),其中,預訓練好的所述大語言模型部署于所述服務端;對所述詞表和所述嵌入層參數(shù)分別進行混淆處理,得到目標詞表和目標嵌入層參數(shù);將所述目標嵌入層參數(shù)發(fā)送至所述服務端,以由所述服務端將所述大語言模型的嵌入層參數(shù)更新為所述目標嵌入層參數(shù),以得到新的大語言模型;利用所述目標詞表,對文本樣本進行分詞和轉(zhuǎn)索引操作,得到所述文本樣本對應的第一詞元索引;將所述第一詞元索引發(fā)送至所述服務端,以由所述服務端基于所述第一詞元索引對所述新的大語言模型進行微調(diào)。

      3、第二方面,本公開提供一種大語言模型微調(diào)方法,應用于服務端,包括:響應于接收到服務端使用方發(fā)送的目標嵌入?yún)?shù),將所述服務端的大語言模型的嵌入層參數(shù)更新為所述目標嵌入層參數(shù),得到新的大語言模型,其中,所述目標嵌入層參數(shù)由所述服務端使用方對所述嵌入層參數(shù)進行混淆處理得到;響應于接收到所述服務端使用方發(fā)送的第一詞元索引,基于所述第一詞元索引對所述新的大語言模型進行微調(diào),其中,所述第一詞元索引由所述服務端使用方基于目標詞表和文本樣本生成,所述目標詞表由所述服務端使用方對所述大語言模型的詞表進行混淆處理得到。

      4、第三方面,本公開提供一種文本處理方法,應用于服務端使用方,包括:獲取待處理文本;利用目標詞表對所述待處理文本進行分詞和轉(zhuǎn)索引操作,得到所述待處理文本對應的第二詞元索引;將所述第二詞元索引發(fā)送至服務端,以由所述服務端通過預先微調(diào)好的大語言模型基于所述第二詞元索引,生成所述待處理文本的文本處理結(jié)果,并將所述文本處理結(jié)果發(fā)送至所述服務端使用方,其中,所述大語言模型是根據(jù)本公開第一方面和第二方面提供的所述大語言模型微調(diào)方法得到的;接收所述文本處理結(jié)果。

      5、第四方面,本公開提供一種計算機可讀介質(zhì),其上存儲有計算機程序,該計算機程序被處理裝置執(zhí)行時實現(xiàn)本公開第一方面和第二方面提供的所述大語言模型微調(diào)方法的步驟或者本公開第三方面提供的所述文本處理方法的步驟。

      6、第五方面,本公開提供一種電子設備,包括:存儲裝置,其上存儲有計算機程序;處理裝置,用于執(zhí)行所述存儲裝置中的所述計算機程序,以實現(xiàn)本公開第一方面和第二方面提供的所述大語言模型微調(diào)方法的步驟或者本公開第三方面提供的所述文本處理方法的步驟。

      7、第六方面,本公開提供一種計算機程序產(chǎn)品,包括計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)本公開第一方面和第二方面提供的所述大語言模型微調(diào)方法的步驟或者本公開第三方面提供的所述文本處理方法的步驟。

      8、在上述技術方案中,在利用服務端使用方的文本樣本對服務端預訓練好的大語言模型進行微調(diào)之前,服務端使用方首先通過與服務端交互獲取大語言模型的詞表和嵌入層參數(shù);之后,服務端使用方對大語言模型的詞表和嵌入層參數(shù)分別進行混淆處理,得到目標詞表和目標嵌入層參數(shù),并將目標嵌入層參數(shù)發(fā)送至服務端,以由服務端將大語言模型的嵌入層參數(shù)更新為目標嵌入層參數(shù),以得到新的大語言模型;服務端使用方利用目標詞表,對文本樣本進行分詞和轉(zhuǎn)索引操作,得到文本樣本對應的第一詞元索引;接下來,服務端使用方將第一詞元索引發(fā)送至服務端,以由服務端基于第一詞元索引對新的大語言模型進行微調(diào)。其中,將預訓練好的大語言模型中的詞表和嵌入層參數(shù)分別進行混淆,并且,只將混淆后的嵌入層參數(shù)(即目標嵌入層參數(shù))發(fā)送至服務端,而將混淆后的詞表(即目標詞表)保留在服務端使用方,這樣,可以避免服務端獲取到嵌入向量和詞元之間的對應關系,從而能夠在有效保護服務端使用方數(shù)據(jù)的前提下,通過微調(diào)操作更好地保障模型效果。另外,目標詞表保留在服務端使用方,在模型微調(diào)階段和推理階段,服務端使用方根據(jù)目標詞表進行文本分詞,使得服務端不直接接觸服務端使用方私有數(shù)據(jù),僅能獲取到文本詞元對應的索引,能夠更好的保護服務端使用方數(shù)據(jù)。此外,僅需服務端使用方承擔一次性的嵌入擾動開銷(即對大語言模型的詞表和嵌入層參數(shù)進行混淆),以及在微調(diào)和推理階段中的文本分詞開銷,這樣,服務端使用方在執(zhí)行文本處理任務時不需要占用大量的cpu、內(nèi)存或電池電量等資源,使得文本處理任務更容易在不同類型的服務端使用方上運行,讓更多用戶享受到這項技術的便利。

      9、本公開的其他特征和優(yōu)點將在隨后的具體實施方式部分予以詳細說明。



      技術特征:

      1.一種大語言模型微調(diào)方法,其特征在于,包括:

      2.根據(jù)權利要求1所述的方法,其特征在于,所述對所述詞表和所述嵌入層參數(shù)分別進行混淆處理,得到目標詞表和目標嵌入層參數(shù),包括:

      3.根據(jù)權利要求2所述的方法,其特征在于,所述根據(jù)所述目標詞表,對所述置換嵌入層參數(shù)進行噪聲擾動處理,得到目標嵌入層參數(shù),包括:

      4.根據(jù)權利要求3所述的方法,其特征在于,所述根據(jù)聚類結(jié)果,對所述置換嵌入層參數(shù)進行噪聲擾動處理,得到目標嵌入層參數(shù),包括:

      5.根據(jù)權利要求4所述的方法,其特征在于,所述利用差分隱私機制對所述嵌入向量集進行噪聲擾動處理,得到該聚類簇對應的擾動向量集,包括:

      6.根據(jù)權利要求3所述的方法,其特征在于,所述根據(jù)所述置換嵌入層參數(shù),對所述目標詞表中的詞元進行聚類,包括:

      7.根據(jù)權利要求6所述的方法,其特征在于,所述根據(jù)所述置換嵌入層參數(shù),分別計算所述當前詞元與所述目標詞表中每一未被聚類的其他詞元之間的第二相似度,包括:

      8.根據(jù)權利要求1-7中任一項所述的方法,其特征在于,所述大語言模型為文本分類模型;

      9.根據(jù)權利要求1-7中任一項所述的方法,其特征在于,所述大語言模型為文本生成模型,其中,所述嵌入層參數(shù)包括輸入嵌入層參數(shù)和輸出嵌入層參數(shù)。

      10.一種大語言模型微調(diào)方法,其特征在于,應用于服務端,包括:

      11.根據(jù)權利要求10所述的方法,其特征在于,所述大語言模型為文本分類模型;

      12.根據(jù)權利要求10所述的方法,其特征在于,所述大語言模型為文本生成模型,其中,所述嵌入層參數(shù)包括輸入嵌入層參數(shù)和輸出嵌入層參數(shù)。

      13.一種文本處理方法,其特征在于,應用于服務端使用方,包括:

      14.根據(jù)權利要求13所述的方法,其特征在于,所述大語言模型為文本分類模型,所述文本處理結(jié)果為所述待處理文本的類別。

      15.根據(jù)權利要求13所述的方法,其特征在于,所述大語言模型為文本生成模型,所述文本處理結(jié)果為所述待處理文本對應的預測詞元索引;

      16.一種計算機可讀介質(zhì),其上存儲有計算機程序,其特征在于,該計算機程序被處理裝置執(zhí)行時實現(xiàn)權利要求1-15中任一項所述方法的步驟。

      17.一種電子設備,其特征在于,包括:

      18.一種計算機程序產(chǎn)品,包括計算機程序,其特征在于,該計算機程序被處理器執(zhí)行時實現(xiàn)權利要求1-15中任一項所述的方法的步驟。


      技術總結(jié)
      本公開涉及一種模型微調(diào)方法、文本處理方法、介質(zhì)、設備及程序產(chǎn)品。方法包括:從服務端獲取大語言模型的詞表和嵌入層參數(shù);對詞表和嵌入層參數(shù)分別進行混淆處理,得到目標詞表和目標嵌入層參數(shù);將目標嵌入層參數(shù)發(fā)送至服務端,以由服務端將大語言模型的嵌入層參數(shù)更新為目標嵌入層參數(shù),以得到新的大語言模型;利用目標詞表,對文本樣本進行分詞和轉(zhuǎn)索引操作,得到文本樣本對應的第一詞元索引;將第一詞元索引發(fā)送至服務端,以由服務端基于第一詞元索引對新的大語言模型進行微調(diào)。這樣,可避免服務端獲取到嵌入向量和詞元之間的對應關系,從而能在有效保護服務端使用方數(shù)據(jù)的前提下,通過微調(diào)操作更好地保障模型效果。

      技術研發(fā)人員:林宇,張祺智,蔡權偉,洪爵,吳燁
      受保護的技術使用者:北京火山引擎科技有限公司
      技術研發(fā)日:
      技術公布日:2024/12/19
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1