国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種數(shù)據(jù)處理方法和相關裝置與流程

      文檔序號:40282123發(fā)布日期:2024-12-11 13:22閱讀:13來源:國知局
      一種數(shù)據(jù)處理方法和相關裝置與流程

      本技術涉及數(shù)據(jù)處理,特別是涉及一種數(shù)據(jù)處理方法和相關裝置。


      背景技術:

      1、隨著人工智能(artificial?intelligence,ai)技術的快速發(fā)展,機器學習模型被廣泛的應用到各種領域,例如電子商務、互聯(lián)網(wǎng)、金融、監(jiān)管、司法、醫(yī)療和教育等領域。具體的,可以基于機器學習的方式訓練對應的機器學習模型,然后將訓練好的機器學習模型應用在預測場景中,具體可以是利用機器學習模型輸出預測結果,然后利用預測結果進行后續(xù)的相關應用。

      2、隨著機器學習模型越來越廣泛,用戶不再僅僅滿足于機器學習模型的效果(即輸出預測結果),而是希望對機器學習模型的效果背后的原因有更好的理解。相關技術中會采用可解釋性模型進行解釋,主要是指在機器學習的過程中,能夠提供對于預測結果的解釋結果,以便于用戶更好地理解機器學習模型為什么會輸出這樣的預測結果。

      3、然而,隨著ai技術的不斷發(fā)展,機器學習模型也越來越復雜,相關技術中采用的解釋方式,無法準確地進行解釋,使得對于機器學習模型輸出的預測結果缺乏可解釋性,從而降低了預測結果的可信度。


      技術實現(xiàn)思路

      1、為了解決上述技術問題,本技術提供了一種數(shù)據(jù)處理方法和相關裝置,先通過多個可解釋性子模型分別進行解釋,接著進行融合,利用融合得到的目標權重可以更為準確地解釋機器學習模型輸出的預測結果,從而提高解釋準確性,以及有利于提高預測結果的可信度。

      2、本技術實施例公開了如下技術方案:

      3、一方面,本技術實施例提供一種數(shù)據(jù)處理方法,所述方法包括:

      4、獲取待預測對象的多個維度的特征數(shù)據(jù);

      5、利用多個可解釋性子模型中的每個可解釋性子模型分別對所述多個維度的特征數(shù)據(jù)進行分析,得到多個待定解釋結果;所述多個待定解釋結果中的每個待定解釋結果用于表征所述多個維度的特征數(shù)據(jù)分別對于預測結果的整體權重,所述預測結果是根據(jù)所述多個維度的特征數(shù)據(jù),通過機器學習模型對所述待預測對象進行預測得到的結果;

      6、對所述多個待定解釋結果進行融合,得到目標解釋結果;所述目標解釋結果用于表征所述多個維度的特征數(shù)據(jù)分別對于所述預測結果的目標權重。

      7、又一方面,本技術實施例提供一種數(shù)據(jù)處理裝置,所述裝置包括獲取單元、分析單元和融合單元:

      8、所述獲取單元,用于獲取待預測對象的多個維度的特征數(shù)據(jù);

      9、所述分析單元,用于利用多個可解釋性子模型中的每個可解釋性子模型分別對所述多個維度的特征數(shù)據(jù)進行分析,得到多個待定解釋結果;所述多個待定解釋結果中的每個待定解釋結果用于表征所述多個維度的特征數(shù)據(jù)分別對于預測結果的整體權重,所述預測結果是根據(jù)所述多個維度的特征數(shù)據(jù),通過機器學習模型對所述待預測對象進行預測得到的結果;

      10、所述融合單元,用于對所述多個待定解釋結果進行融合,得到目標解釋結果;所述目標解釋結果用于表征所述多個維度的特征數(shù)據(jù)分別對于所述預測結果的目標權重。

      11、在一種可能的實現(xiàn)方式中,所述多個可解釋性子模型中包括目標可解釋性子模型,所述分析單元還用于:

      12、利用所述目標可解釋性子模型對所述多個維度的特征數(shù)據(jù)進行分析,得到對象解釋結果;所述對象解釋結果用于表征所述待預測對象的多個維度的特征數(shù)據(jù)分別對于所述預測結果的個體權重,所述個體權重與所述待預測對象相關聯(lián)。

      13、在一種可能的實現(xiàn)方式中,所述目標可解釋性子模型的數(shù)量為多個,所述分析單元還用于:

      14、利用多個所述目標可解釋性子模型中的每個目標可解釋性子模型分別對所述多個維度的特征數(shù)據(jù)進行分析,得到多個所述對象解釋結果;

      15、所述融合單元還用于:

      16、對多個所述對象解釋結果進行融合,得到目標對象解釋結果;所述目標對象解釋結果用于表征所述待預測對象的多個維度的特征數(shù)據(jù)分別對于所述預測結果的目標個體權重。

      17、在一種可能的實現(xiàn)方式中,所述分析單元還用于:

      18、利用所述目標解釋結果所表征的所述多個維度的特征數(shù)據(jù)的目標權重,對所述預測結果進行分析,得到所述預測結果在特征粒度上的第一解釋性結果;

      19、利用所述對象解釋結果所表征的所述多個維度的特征數(shù)據(jù)的個體權重,對所述預測結果進行分析,得到所述預測結果在個體粒度上的第二解釋性結果。

      20、在一種可能的實現(xiàn)方式中,所述融合單元還用于:

      21、獲取所述多個可解釋性子模型分別對應的模型權重;

      22、基于所述多個可解釋性子模型分別對應的模型權重對所述多個待定解釋結果進行加權融合,得到所述目標解釋結果。

      23、在一種可能的實現(xiàn)方式中,所述待預測對象屬于待預測場景,所述融合單元還用于:

      24、獲取所述待預測場景的權重測試樣本;所述權重測試樣本中包括測試對象的多個維度的測試特征數(shù)據(jù),所述權重測試樣本具有測試樣本標簽,所述測試樣本標簽用于表示所述多個維度的測試特征數(shù)據(jù)分別對于第一樣本預測結果的整體標準權重,所述第一樣本預測結果是通過所述機器學習模型對所述測試對象進行預測得到的;

      25、利用所述多個可解釋性子模型中的每個可解釋性子模型分別對所述多個維度的測試特征數(shù)據(jù)進行分析,得到多個測試解釋結果;所述測試解釋結果用于表征所述多個維度的測試特征數(shù)據(jù)分別對于所述第一樣本預測結果的整體測試權重;

      26、針對每個測試解釋結果,根據(jù)所述測試解釋結果與所述測試樣本標簽之間的差異,確定所述測試解釋結果對應的可解釋性子模型的模型權重,得到所述多個可解釋性子模型分別對應的模型權重;所述差異與所述模型權重呈負相關。

      27、在一種可能的實現(xiàn)方式中,所述待預測對象屬于待預測場景,所述融合單元還用于:

      28、獲取所述待預測場景的先驗信息;

      29、利用所述先驗信息確定所述多個可解釋性子模型分別對應的模型權重。

      30、在一種可能的實現(xiàn)方式中,所述多個待定解釋結果對應于第i次分析,i為大于1的整數(shù),所述融合單元還用于:

      31、根據(jù)第i-1次分析得到的多個待定解釋結果,對所述第i-1次分析所使用的所述多個可解釋性子模型分別對應的模型權重進行調整,得到所述多個可解釋性子模型分別對應的調整模型權重;

      32、將所述第i-1次分析所使用的所述多個可解釋性子模型分別對應的調整模型權重確定為所述第i次分析所使用的所述多個可解釋性子模型分別對應的模型權重。

      33、在一種可能的實現(xiàn)方式中,所述多個可解釋性子模型是通過如下方式訓練得到的:

      34、獲取所述待預測對象所屬的待預測場景的訓練樣本集;所述訓練樣本集包括多個訓練樣本,每個訓練樣本中包括訓練樣本對象的多個維度的訓練特征數(shù)據(jù),所述每個訓練樣本具有訓練樣本標簽,所述訓練樣本標簽用于表示所述多個維度的訓練特征數(shù)據(jù)分別對于第二樣本預測結果的整體標準權重,所述第二樣本預測結果是通過所述機器學習模型對所述訓練樣本對象進行預測得到的;

      35、針對所述多個可解釋性子模型中的每個可解釋性子模型,利用所述多個訓練樣本對所述可解釋性子模型進行模型訓練,直至所述可解釋性子模型輸出的訓練解釋結果與所述訓練樣本標簽之間的差異滿足結束訓練條件;所述訓練解釋結果用于表征所述多個維度的訓練特征數(shù)據(jù)分別對于所述第二樣本預測結果的整體訓練權重。

      36、在一種可能的實現(xiàn)方式中,所述裝置還包括劃分單元和訓練單元:

      37、所述劃分單元,用于將所述訓練樣本樣本集劃分為多個訓練樣本子集;所述訓練樣本子集的數(shù)量與所述可解釋性子模型的數(shù)量相同;

      38、所述訓練單元,用于針對所述多個可解釋性子模型中的每個可解釋性子模型,利用所述多個訓練樣本子集中的一個訓練樣本子集所包括的訓練樣本進行模型訓練;一個訓練樣本子集用于一個可解釋性子模型的模型訓練,不同的訓練樣本子集用于不同的可解釋性子模型的模型訓練。

      39、在一種可能的實現(xiàn)方式中,所述待預測對象所屬的待預測場景為對象分類場景,所述機器學習模型為分類模型,所述預測結果為分類結果,所述多個維度的特征數(shù)據(jù)包括歷史消費數(shù)據(jù)、瀏覽數(shù)據(jù)和搜索數(shù)據(jù),所述裝置還包括分類單元:

      40、所述分類單元,用于根據(jù)所述歷史消費數(shù)據(jù)、所述瀏覽數(shù)據(jù)和所述搜索數(shù)據(jù),利用所述分類模型對所述待預測對象進行分類,得到所述分類結果;所述分類結果用于指示所述待預測對象是否是目標對象;

      41、所述分析單元,還用于利用所述目標解釋結果所表征的所述歷史消費數(shù)據(jù)、所述瀏覽數(shù)據(jù)和所述搜索數(shù)據(jù)分別對于所述分類結果的目標權重,對所述分類結果進行分析,得到所述分類結果對應的解釋性結果。

      42、在一種可能的實現(xiàn)方式中,若所述分類結果指示所述待預測對象是所述目標對象,所述裝置還包括確定單元和推薦單元:

      43、所述確定單元,用于從所述歷史消費數(shù)據(jù)、所述瀏覽數(shù)據(jù)和所述搜索數(shù)據(jù)中篩選目標權重最大的數(shù)據(jù)確定為目標數(shù)據(jù);

      44、所述確定單元,還用于將所述對象分類場景所關聯(lián)的待推薦信息中與所述目標數(shù)據(jù)相匹配的待推薦信息確定為推薦信息;

      45、所述推薦單元,用于向所述待預測對象推薦所述推薦信息。

      46、另一方面,本技術實施例提供一種計算機設備,所述計算機設備包括處理器以及存儲器:

      47、所述存儲器用于存儲計算機程序,并將所述計算機程序傳輸給所述處理器;

      48、所述處理器用于根據(jù)所述計算機程序中的指令執(zhí)行前述任一方面所述的方法。

      49、另一方面,本技術實施例提供一種計算機可讀存儲介質,所述計算機可讀存儲介質用于存儲計算機程序,所述計算機程序被計算機設備運行時,使得所述計算機設備執(zhí)行前述任一方面所述的方法。

      50、另一方面,本技術實施例提供一種計算機程序產品,包括計算機程序,當其在計算機設備上運行時,使得所述計算機設備執(zhí)行前述任一方面所述的方法。

      51、由上述技術方案可以看出,首先可以獲取待預測對象的多個維度的特征數(shù)據(jù),待預測對象可以是指需要進行預測的對象,多個維度的特征數(shù)據(jù)可以從不同維度對待預測對象的情況進行表示。接著,可以利用多個可解釋性子模型中的每個可解釋性子模型對多個維度的特征數(shù)據(jù)進行分析,得到多個待定解釋結果,多個待定解釋結果中的每個待定解釋結果可以用于表征多個維度的特征數(shù)據(jù)分別對于預測結果的整體權重,其中,預測結果可以是根據(jù)多個維度的特征數(shù)據(jù)通過機器學習模型對待預測對象進行預測得到的結果。最后,可以對多個待定解釋結果進行融合,得到目標解釋結果,目標解釋結果可以用于表征多個維度的特征數(shù)據(jù)分別對于預測結果的目標權重。基于此,先通過多個可解釋性子模型分別進行解釋,接著進行融合,通常,不同的可解釋性子模型在進行解釋時關注于特征數(shù)據(jù)的不同層面,故基于融合能夠實現(xiàn)更全面地解釋。因此,相較于單個可解釋性子模型的待定解釋結果,目標解釋結果能夠更為準確地表征多個維度的特征數(shù)據(jù)分別對于預測結果的權重,也就是說,目標權重相較于整體權重更為準確。相應的,利用目標權重可以更為準確地解釋機器學習模型輸出的預測結果,從而提高解釋準確性,以及有利于提高預測結果的可信度。

      當前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1