本技術(shù)涉及電子,尤其涉及一種模型訓練方法及相關(guān)裝置。
背景技術(shù):
1、隨著用戶個性化需求的增加,電子設(shè)備的常規(guī)功能難以滿足用戶的使用需求。因此,電子設(shè)備可以向云端服務(wù)器發(fā)送用戶數(shù)據(jù),由云端服務(wù)器根據(jù)用戶數(shù)據(jù)來訓練模型,從而使得訓練后的模型可以實現(xiàn)與用戶有關(guān)的功能,以滿足用戶的個性化需求。
2、但是,由于用戶數(shù)據(jù)涉及用戶隱私,電子設(shè)備向云端服務(wù)器發(fā)送用戶數(shù)據(jù)的過程中可能存在泄露用戶隱私的風險。所以,電子設(shè)備在本地根據(jù)用戶數(shù)據(jù)來訓練模型,以解決用戶數(shù)據(jù)在傳輸過程中的隱私泄露問題。例如,電子設(shè)備可以在充電的過程中根據(jù)用戶數(shù)據(jù)對模型進行訓練。但是,電子設(shè)備在充電狀態(tài)下會發(fā)熱,若在充電過程中訓練模型,可能會導致電子設(shè)備的發(fā)熱量進一步增大,使得電子設(shè)備的溫度較高。若電子設(shè)備的溫度較高,可能會影響電子設(shè)備的性能、降低用戶的使用體驗。
技術(shù)實現(xiàn)思路
1、本技術(shù)實施例提供的一種模型訓練方法及相關(guān)裝置,終端設(shè)備通過在多個訓練時間段上進行模型訓練,可以減輕因模型訓練而對用戶產(chǎn)生的負面影響,提高了終端設(shè)備的能源利用率。
2、第一方面,本技術(shù)提供一種模型訓練方法,所述方法包括:
3、響應(yīng)于第一指令,獲取第一訓練數(shù)據(jù)和第一能耗數(shù)據(jù),其中,所述第一訓練數(shù)據(jù)用于表明訓練第一模型需要的總時長,所述第一能耗數(shù)據(jù)用于表征所述終端設(shè)備的電量變化情況;
4、將所述第一訓練數(shù)據(jù)和所述第一能耗數(shù)據(jù)輸入到目標決策模型中,使得所述目標決策模型輸出多個訓練時間段,其中,所述多個訓練時間段所分別對應(yīng)的時長之和與所述總時長相等,所述多個訓練時間段包括每個訓練時間段對應(yīng)的開始時刻和結(jié)束時刻,以及,所述開始時刻對應(yīng)的所述終端設(shè)備的第一電量和所述結(jié)束時刻對應(yīng)的所述終端設(shè)備的第二電量中的一項或多項;
5、按照所述多個訓練時間段對所述第一模型進行訓練。
6、上述方法中,第一訓練數(shù)據(jù)用于確定訓練第一模型需要的總時長,便于終端設(shè)備根據(jù)總時長劃分出多個訓練時間段。能耗數(shù)據(jù)包括但不限于終端設(shè)備在運行過程中產(chǎn)生能耗時所對應(yīng)的數(shù)據(jù),比如說終端設(shè)備運行應(yīng)用程序時產(chǎn)生的能耗數(shù)據(jù)、運行算法時產(chǎn)生的能耗數(shù)據(jù)等。而終端設(shè)備是響應(yīng)于用戶的操作而運行的,所以,終端設(shè)備的能耗數(shù)據(jù)可以反映用戶使用終端設(shè)備的規(guī)律,即用戶的使用習慣。因此“終端設(shè)備根據(jù)能耗數(shù)據(jù)來確定訓練時間段”,可以理解為“終端設(shè)備是根據(jù)用戶的使用習慣來確定訓練時間段”,從而可以使得確定出來的訓練時間段是符合用戶的使用習慣的。比如說,用戶的使用習慣用于反映用戶對終端設(shè)備的使用頻率,用戶的使用習慣包括但不限于時間習慣和位置習慣。終端設(shè)備根據(jù)符合用戶的使用習慣的訓練時間段來訓練第一模型,比如說,根據(jù)用戶使用終端設(shè)備的時間習慣來說,終端設(shè)備在1:00至5:00之間用戶使用頻率較低的夜晚來訓練第一模型。又例如,根據(jù)用戶使用終端設(shè)備的位置習慣來說,終端設(shè)備在處于用戶使用頻率較低的工作地點時來訓練第一模型。所以,由于在訓練時間段中,用戶對于終端設(shè)備的使用頻率較低,從而可以在訓練過程中減少用戶對于訓練過程的感知、降低對用戶的負面影響(例如終端設(shè)備發(fā)熱量增加、充電時長增加、運行卡頓等)。終端設(shè)備根據(jù)能耗數(shù)據(jù)確定出來的多個訓練時間段符合終端設(shè)備的電量變化情況,從而可以提高終端設(shè)備的能源利用率。所以,終端設(shè)備依次按照多個訓練時間段所分別指示的開始時刻和結(jié)束時刻來對第一模型進行訓練,而不是集中在一個時間段(例如終端設(shè)備充電的時間段)對第一模型進行訓練,可以提高終端設(shè)備的能源利用率、降低電量的消耗速度。從而減輕終端設(shè)備在訓練第一模型時用戶對于訓練的感知,進一步提升用戶的使用感受。
7、在一種可能的實施方式中,所述按照所述多個訓練時間段對所述第一模型進行訓練,包括:
8、按照第一訓練時間段的開始時刻開始對所述第一模型進行訓練,按照所述第一訓練時間段的結(jié)束時刻結(jié)束對所述第一模型的訓練,其中,所述第一訓練時間段為所述多個訓練時間段中的一個訓練時間段,在所述第一訓練時間段的結(jié)束時刻對應(yīng)的所述第二電量小于或等于所述第一訓練時間段的開始時刻對應(yīng)的所述第一電量的情況下,第三電量和第四電量之間的電量差值小于或等于電量閾值,所述第三電量對應(yīng)于所述終端設(shè)備在所述第一訓練時間段中的最大電量,所述第四電量對應(yīng)于所述終端設(shè)備在所述第一訓練時間段中的最小電量。
9、在上述方法中,第一訓練時間段的結(jié)束時刻對應(yīng)的第二電量小于或等于第一訓練時間段的開始時刻對應(yīng)的第一電量,可以說明終端設(shè)備在第一訓練時間段的過程中的電量是呈下降趨勢的。第三電量和第四電量之間的電量差值小于或等于電量閾值,可以說明終端設(shè)備在第一訓練時間段中的最大電量和最小電量之間的差值較小,進一步可以說明終端設(shè)備在第一訓練時間段的過程中的電量的下降趨勢較緩,即相對于在終端設(shè)備充電時進行模型訓練來說,終端設(shè)備在第一訓練時間段之間的耗電量較少。耗電量較少可以說明終端設(shè)備在第一訓練時間段間運行的數(shù)據(jù)較少,那么終端設(shè)備未使用的計算資源(例如算力或內(nèi)存等)較多。若終端設(shè)備在第一訓練時間段中訓練第一模型,那么終端設(shè)備中未使用的計算資源可以得到合理應(yīng)用,從而提高終端設(shè)備的能源及計算資源的使用率。從用戶角度來說可以理解為用戶在第一訓練時間段中對終端設(shè)備的使用頻率較低。若終端設(shè)備在第一訓練時間段中對第一模型進行訓練,由于此時用戶對終端設(shè)備的使用頻率較低,那么終端設(shè)備訓練第一模型時消耗的算力、產(chǎn)生的發(fā)熱量等負面感知因素對用戶的影響較小。
10、在一種可能的實施方式中,所述響應(yīng)于第一指令,獲取第一訓練數(shù)據(jù)和第一能耗數(shù)據(jù)之前,所述方法還包括:
11、獲取第一訓練集,所述第一訓練集包括所述第一模型的第二訓練數(shù)據(jù)和所述終端設(shè)備的第二能耗數(shù)據(jù);
12、根據(jù)所述第二訓練數(shù)據(jù)和所述第二能耗數(shù)據(jù)對原始決策模型進行訓練,得到所述目標決策模型,其中,所述原始決策模型為所述終端設(shè)備預(yù)先存儲的模型。
13、在上述方法中,第二能耗數(shù)據(jù)是終端設(shè)備對應(yīng)的能耗數(shù)據(jù),例如,可以是終端設(shè)備的實際用戶在使用終端設(shè)備時產(chǎn)生的能耗數(shù)據(jù)。由于用戶對于終端設(shè)備的使用習慣會影響終端設(shè)備實際的能耗變化,以及,終端設(shè)備中電池等硬件的健康程度也會影響終端設(shè)備實際的能耗變化。并且,目標決策模型是基于終端設(shè)備歷史的能耗數(shù)據(jù)訓練出來的。所以,若終端設(shè)備實際的能耗變化與終端設(shè)備歷史的能耗變化的差距較大,可能會導致目標決策模型輸出的多個訓練時間段的準確度較低。所以,終端設(shè)備可以基于終端設(shè)備實際的能耗數(shù)據(jù)對原始決策模型進行迭代訓練,可以降低因用戶使用習慣的變化和/或終端設(shè)備中電池等硬件健康程度的變化而對目標決策模型輸出結(jié)果的影響。
14、在一種可能的實施方式中,所述根據(jù)所述第二訓練數(shù)據(jù)和所述第二能耗數(shù)據(jù)對原始決策模型進行訓練,得到所述目標決策模型,包括:
15、將所述第二訓練數(shù)據(jù)和所述第二能耗數(shù)據(jù)輸入到所述原始決策模型中,使得所述原始決策模型輸出n個開始時刻和n個結(jié)束時刻,以及,所述終端設(shè)備的n個預(yù)估開始電量和n個預(yù)估結(jié)束電量中的一項或多項,其中,所述n為大于1的整數(shù),所述n個開始時刻中的第n個開始時刻和所述n個結(jié)束時刻中的第n個結(jié)束時刻用于確定所述第一模型的第n個訓練時間段,所述n個預(yù)估開始電量與所述n個開始時刻一一對應(yīng),所述n個預(yù)估結(jié)束電量與所述n個結(jié)束時刻一一對應(yīng);
16、基于所述n個開始時刻、所述n個結(jié)束時刻、所述n個預(yù)估開始電量和所述n個預(yù)估結(jié)束電量對所述原始決策模型進行訓練,得到所述目標決策模型。
17、在上述方法中,由于需要目標決策模型輸出的訓練時間段可以符合終端設(shè)備的能耗(電量)變化情況,所以,在對原始決策模型進行訓練時,可以基于終端設(shè)備的電量來進行訓練。例如,原始決策模型除了輸出用于訓練第一模型的開始時刻和結(jié)束時刻外,還可以推理出終端設(shè)備在開始時刻對應(yīng)的電量和在結(jié)束時刻對應(yīng)的電量,然后基于原始決策模型推理出來的電量對原始決策模型進行迭代訓練。
18、在一種可能的實施方式中,所述基于所述n個開始時刻、所述n個結(jié)束時刻、所述n個預(yù)估開始電量和所述n個預(yù)估結(jié)束電量對所述原始決策模型進行訓練,得到所述目標決策模型,包括:
19、按照所述n個開始時刻和所述n個結(jié)束時刻對所述第一模型進行模擬訓練,獲取所述終端設(shè)備的n個模擬開始電量和n個模擬結(jié)束電量,其中,所述n個模擬開始電量與所述n個開始時刻一一對應(yīng),所述n個模擬結(jié)束電量與所述n個結(jié)束時刻一一對應(yīng);
20、確定所述n個預(yù)估開始電量中的第n個預(yù)估開始電量和所述n個模擬開始電量中的第n個模擬開始電量的第一比較值,以及,所述n個預(yù)估結(jié)束電量中的第n個預(yù)估結(jié)束電量和所述n個模擬結(jié)束電量中的第n個模擬結(jié)束電量的第二比較值;
21、在所述第一比較值小于或等于第一比較閾值且所述第二比較值小于或等于第二比較閾值時,根據(jù)所述第一比較值和所述第二比較值確定所述目標決策模型的參數(shù),得到所述目標決策模型。
22、在上述方法中,服務(wù)器基于原始決策模型推理出來的開始時刻和結(jié)束時刻對第一模型進行模擬訓練,可以模擬出訓練第一模型所消耗的電量,例如模擬出開始時刻對應(yīng)的模擬開始電量,以及模擬出結(jié)束時刻對應(yīng)的模擬結(jié)束電量。然后,將原始決策模型推理出來的預(yù)估開始電量和模擬開始電量進行比較,以及,將原始決策模型推理出來的預(yù)估結(jié)束電量和模擬結(jié)束電量進行比較,根據(jù)比較值來修改原始決策模型的參數(shù)。然后繼續(xù)對原始決策模型進行迭代訓練,直到第一比較值小于或等于第一比較閾值且第二比較值小于或等于第二比較閾值時,此時目標決策模型訓練成功。由此,通過上述訓練過程,可以使得目標決策模型推理出來的訓練時間段符合終端設(shè)備的電量變化情況,提高了目標決策模型推理結(jié)果的準確性。
23、在一種可能的實施方式中,所述原始決策模型為服務(wù)器根據(jù)所述第一模型的第三訓練數(shù)據(jù)和第三能耗數(shù)據(jù)訓練出來的模型,所述第三能耗數(shù)據(jù)包括多個所述終端設(shè)備生成的能耗數(shù)據(jù),所述第三能耗數(shù)據(jù)包括多條能耗曲線,所述多條能耗曲線分別用于表明所述終端設(shè)備的電量變化情況,所述多條能耗曲線所分別對應(yīng)的電量變化情況用于將所述多條能耗曲線劃分為m個類別對應(yīng)的能耗曲線,所述m為大于1的整數(shù),所述m小于或等于所述多條能耗曲線對應(yīng)的數(shù)量。
24、在上述方法中,為了節(jié)省終端設(shè)備的計算資源,可以在服務(wù)器上訓練原始決策模型后再部署到終端設(shè)備上使用。第三能耗數(shù)據(jù)包括多個終端設(shè)備生成的能耗數(shù)據(jù),例如,包括一個或多個用戶分別使用終端設(shè)備而產(chǎn)生的能耗數(shù)據(jù)。由于不同用戶對終端設(shè)備的使用習慣是不同的,所以產(chǎn)生的能耗數(shù)據(jù)也是不同的。可以使得終端設(shè)備獲取到的第三能耗數(shù)據(jù)的類型較多,從而使得訓練出來的原始決策模型符合不同用戶對終端設(shè)備的使用習慣。為了細化第二訓練集,增強訓練原始決策模型的準確性和魯棒性,可以先將獲取到的能耗曲線進行分類,然后按照不同類別的能耗曲線分別對原始決策模型進行訓練。
25、在一種可能的實施方式中,所述原始決策模型是根據(jù)所述第三訓練數(shù)據(jù)和第四能耗數(shù)據(jù)訓練出來的模型,所述第四能耗數(shù)據(jù)是根據(jù)所述第三能耗數(shù)據(jù)確定出來的,所述第三能耗數(shù)據(jù)為所述終端設(shè)備在第一芯片平臺上運行時所產(chǎn)生的能耗數(shù)據(jù),所述第四能耗數(shù)據(jù)為所述終端設(shè)備在第二芯片平臺上運行時所產(chǎn)生的能耗數(shù)據(jù),所述終端設(shè)備的芯片搭載在所述第一芯片平臺或者所述第二芯片平臺上。
26、在上述方法中,無需大量收集終端設(shè)備在第二芯片平臺上運行時所產(chǎn)生的能耗數(shù)據(jù),直接基于第三能耗數(shù)據(jù)即可確定第四能耗數(shù)據(jù),節(jié)省了收集能耗數(shù)據(jù)的時間,降低了訓練原始決策模型的難度,縮短了訓練原始決策模型的周期。例如,在終端設(shè)備在第一芯片平臺上運行時所產(chǎn)生的第三能耗數(shù)據(jù),多于在第二芯片平臺上運行時所產(chǎn)生的能耗數(shù)據(jù)的情況下。若根據(jù)在第二芯片平臺上運行時所產(chǎn)生的能耗數(shù)據(jù)來訓練原始決策模型,可能受限于在第二芯片平臺上運行時所產(chǎn)生的能耗數(shù)據(jù)的數(shù)量,而導致確定出來的訓練集的數(shù)量和/或種類較少,影響對于原始決策模型的訓練。所以可以根據(jù)第三能耗數(shù)據(jù)來確定第四能耗數(shù)據(jù),從而可以增加第四能耗數(shù)據(jù)的數(shù)量和/或種類,以提高訓練原始決策模型的效果。
27、在一種可能的實施方式中,所述第四能耗數(shù)據(jù)包括根據(jù)能耗差值對所述第三能耗數(shù)據(jù)進行擬合處理后的數(shù)據(jù),所述能耗差值為第一能耗和第二能耗之間的差值,所述第一能耗為所述終端設(shè)備在所述第一芯片平臺上運行第一功能算法所產(chǎn)生的能耗,所述第二能耗為所述終端設(shè)備在所述第二芯片平臺上運行第二功能算法所產(chǎn)生的能耗。
28、在上述方法中,不同的芯片平臺在運行時會產(chǎn)生不同的能耗,主要是不同芯片平臺中功能算法的能耗不同導致的。所以,若電子設(shè)備可以獲取到第一芯片平臺中第一功能算法的能耗,以及第二芯片平臺中第二功能算法的能耗。那么,電子設(shè)備可以根據(jù)第一能耗和第二能耗之間的差值,來基于第三能耗數(shù)據(jù)擬合出第四能耗數(shù)據(jù),節(jié)省了收集能耗數(shù)據(jù)的時間,降低了訓練原始決策模型的難度,縮短了訓練原始決策模型的周期。
29、第二方面,本技術(shù)實施例提供的一種電子設(shè)備,所述電子設(shè)備包括:一個或多個處理器和一個或多個存儲器;其中,所述一個或多個存儲器與所述一個或多個處理器耦合,所述一個或多個存儲器用于存儲計算機程序代碼,所述計算機程序代碼包括計算機指令,所述一個或多個處理器調(diào)用所述計算機指令以使得所述電子設(shè)備執(zhí)行第一方面或第一方面的任一種可能的實現(xiàn)方式中描述的更新角標的方法。
30、第三方面,本技術(shù)提供一種芯片或者芯片系統(tǒng),該芯片或者芯片系統(tǒng)包括至少一個處理器和通信接口,通信接口和至少一個處理器通過線路互聯(lián),至少一個處理器用于運行計算機程序或指令,以執(zhí)行第一方面或第一方面的任意一種可能的實現(xiàn)方式中描述的更新角標的方法。其中,芯片中的通信接口可以為輸入/輸出接口、管腳或電路等。
31、在一種可能的實現(xiàn)中,本技術(shù)實施例中上述描述的芯片或者芯片系統(tǒng)還包括至少一個存儲器,該至少一個存儲器中存儲有指令。該存儲器可以為芯片內(nèi)部的存儲單元,例如,寄存器、緩存等,也可以是該芯片的存儲單元(例如,只讀存儲器、隨機存取存儲器等)。
32、第四方面,本技術(shù)實施例提供了一種計算機存儲介質(zhì),該計算機存儲介質(zhì)存儲有計算機程序,該計算機程序被處理器執(zhí)行時,使得計算機執(zhí)行如第一方面或第一方面的任一種可能的實現(xiàn)方式中描述的更新角標的方法。
33、第五方面,本技術(shù)實施例提供了一種計算機程序產(chǎn)品,當該計算機程序產(chǎn)品在通信裝置上運行時,使得該通信裝置執(zhí)行如第一方面或第一方面的任一種可能的實現(xiàn)方式中描述的更新角標的方法。
34、應(yīng)當理解的是,本技術(shù)中對技術(shù)特征、技術(shù)方案、有益效果或類似語言的描述并不是暗示在任意的單個實施例中可以實現(xiàn)所有的特點和優(yōu)點。相反,可以理解的是對于特征或有益效果的描述意味著在至少一個實施例中包括特定的技術(shù)特征、技術(shù)方案或有益效果。因此,本說明書中對于技術(shù)特征、技術(shù)方案或有益效果的描述并不一定是指相同的實施例。進而,還可以任何適當?shù)姆绞浇M合本實施例中所描述的技術(shù)特征、技術(shù)方案和有益效果。本領(lǐng)域技術(shù)人員將會理解,無需特定實施例的一個或多個特定的技術(shù)特征、技術(shù)方案或有益效果即可實現(xiàn)實施例。在其他實施例中,還可在沒有體現(xiàn)所有實施例的特定實施例中識別出額外的技術(shù)特征和有益效果。