本發(fā)明涉及數(shù)據(jù)挖掘,尤其涉及一種基于半高斯采樣的金融產(chǎn)品推薦方法、系統(tǒng)、設備及介質。
背景技術:
1、本部分的陳述僅僅是提供了與本發(fā)明相關的背景技術信息,不必然構成在先技術。
2、隨著科學技術的迅猛發(fā)展和金融領域的持續(xù)創(chuàng)新,金融產(chǎn)品的種類和數(shù)量不斷增加。用戶在選擇金融產(chǎn)品時需要面對海量信息,而推薦系統(tǒng)則能有效降低用戶的搜索成本,提高產(chǎn)品選擇的效率。金融行業(yè)在長期運營中積累了大量關于金融產(chǎn)品熱度及其歷史變化趨勢的時間序列數(shù)據(jù)。這些數(shù)據(jù)包含了產(chǎn)品在市場中的受關注程度及其過往表現(xiàn),是優(yōu)化推薦系統(tǒng)的核心依據(jù)。然而,目前的推薦系統(tǒng)在利用這些數(shù)據(jù)時仍存在諸多不足。
3、現(xiàn)有的推薦方法大多采用等權重訓練策略,即對所有時間序列樣本賦予相同權重。這種方法未能充分考慮金融產(chǎn)品熱度和趨勢的動態(tài)變化特性。金融市場環(huán)境變化迅速,近期的熱度和趨勢數(shù)據(jù)通常更能反映當前市場狀況,而久遠的數(shù)據(jù)影響力較弱。等權重策略可能導致模型在推薦時過于依賴歷史數(shù)據(jù),忽視近期的重要信息,從而影響推薦結果的時效性和準確性。
4、此外,傳統(tǒng)的一維卷積神經(jīng)網(wǎng)絡(cnn)在處理多維時間序列數(shù)據(jù)時具有天然優(yōu)勢,可以并行處理同一時間點上的多個特征,提升運行效率,同時能夠通過卷積操作提取局部特征,但由于卷積核大小固定且在時間維度上采用相同權重,無法靈活適應不同時間點的重要性。這種特性使其難以捕捉金融產(chǎn)品熱度和趨勢中的短期內各時間步之間的依賴關系及動態(tài)變化。
5、因此,現(xiàn)有方法可能無法充分處理時間序列數(shù)據(jù)中的長短期依賴和短期內的動態(tài)變化,導致金融產(chǎn)品的推薦結果的有效性和可靠性下降。
技術實現(xiàn)思路
1、為了解決上述背景技術中存在的技術問題,本發(fā)明提供一種基于半高斯采樣的金融產(chǎn)品推薦方法、系統(tǒng)、設備及介質,本發(fā)明結合半高斯采樣和動態(tài)時間卷積神經(jīng)網(wǎng)絡(dynamic?temporal?convolutional?network,?dtcn)的雙重優(yōu)勢,能夠更全面地利用金融產(chǎn)品熱度和歷史趨勢時間序列數(shù)據(jù),生成更加精準的推薦結果,為用戶提供更優(yōu)質的決策支持。
2、為了實現(xiàn)上述目的,本發(fā)明采用如下技術方案:
3、本發(fā)明的第一個方面提供一種基于半高斯采樣的金融產(chǎn)品推薦方法。
4、基于半高斯采樣的金融產(chǎn)品推薦方法,包括:
5、獲取多種金融產(chǎn)品的歷史屬性數(shù)據(jù)和歷史熱度數(shù)據(jù),并進行預處理,構建樣本集,其中,樣本集中的每個樣本均包括所有金融樣品標準化后的歷史屬性數(shù)據(jù)和歷史熱度數(shù)據(jù);
6、將樣本集劃分為訓練集和測試集,將訓練集中的樣本序號映射到半高斯分布的x軸區(qū)間[μ-3σ,μ]內,計算每個樣本的權重,并將權重轉化為概率值;多項式分布利用所述概率值進行有放回的抽取若干個樣本;
7、基于抽取的若干個樣本和每個樣本對應的真實值,對動態(tài)時間卷積網(wǎng)絡進行訓練,得到訓練好的動態(tài)時間卷積網(wǎng)絡,用于預測所有金融產(chǎn)品的排名,并加排名靠前的若干金融產(chǎn)品推薦給用戶。
8、進一步地,所述動態(tài)時間卷積網(wǎng)絡包括若干時間步依賴模塊和時間卷積模塊的組合、以及全連接模塊,所述時間步依賴模塊用于對權重和輸入數(shù)據(jù)進行點乘操作,其中,輸入數(shù)據(jù)包括訓練階段中的抽取的若干個樣本,或預測階段中的金融產(chǎn)品標準化后的當前屬性數(shù)據(jù)和當前熱度數(shù)據(jù)。
9、進一步地,所述時間卷積模塊包括:一維卷積層、批歸一化層、激活層(leakyrelu)和隨機失活層;所述全連接模塊包括全連接層、批歸一化層、激活層和歸一化指數(shù)函數(shù)(softmax)。
10、進一步地,在訓練過程中,采用斯皮爾曼秩相關系數(shù)損失優(yōu)化動態(tài)時間卷積網(wǎng)絡的超參數(shù)。
11、進一步地,所述每個樣本對應的真實值為每個樣本對應的熱度值排名。
12、進一步地,所述預處理包括:對歷史屬性數(shù)據(jù)和歷史熱度數(shù)據(jù)進行標準化處理,在標準化處理后,按照每個時間步對所有金融產(chǎn)品的歷史熱度數(shù)據(jù)進行排名,熱度最高排名為1。
13、進一步地,所述歷史屬性數(shù)據(jù)包括時間點、日收益率、日波動幅度以及日交易量,所述歷史熱度數(shù)據(jù)為金融產(chǎn)品的搜索指數(shù)或市場關注度指數(shù)。
14、本發(fā)明的第二個方面提供一種基于半高斯采樣的金融產(chǎn)品推薦系統(tǒng)。
15、基于半高斯采樣的金融產(chǎn)品推薦系統(tǒng),包括:
16、獲取與預處理模塊,其被配置為:獲取多種金融產(chǎn)品的歷史屬性數(shù)據(jù)和歷史熱度數(shù)據(jù),并進行預處理,構建樣本集,其中,樣本集中的每個樣本均包括所有金融樣品標準化后的歷史屬性數(shù)據(jù)和歷史熱度數(shù)據(jù);
17、權重模塊,其被配置為:將樣本集劃分為訓練集和測試集,將訓練集中的樣本序號映射到半高斯分布的x軸區(qū)間[μ-3σ,μ]內,計算每個樣本的權重,并將權重轉化為概率值;多項式分布利用所述概率值進行有放回的抽取若干個樣本;
18、訓練與預測模塊,其被配置為:基于抽取的若干個樣本和每個樣本對應的真實值,對動態(tài)時間卷積網(wǎng)絡進行訓練,得到訓練好的動態(tài)時間卷積網(wǎng)絡,用于預測所有金融產(chǎn)品的排名,并加排名靠前的若干金融產(chǎn)品推薦給用戶。
19、本發(fā)明的第三個方面提供一種計算機可讀存儲介質。
20、一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執(zhí)行時實現(xiàn)如上述第一個方面所述的基于半高斯采樣的金融產(chǎn)品推薦方法中的步驟。
21、本發(fā)明的第四個方面提供一種計算機設備。
22、一種計算機設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述程序時實現(xiàn)如上述第一個方面所述的基于半高斯采樣的金融產(chǎn)品推薦方法中的步驟。
23、與現(xiàn)有技術相比,本發(fā)明的有益效果是:
24、本發(fā)明通過獲取并預處理金融產(chǎn)品熱度及其歷史變化趨勢的時間序列數(shù)據(jù),劃分數(shù)據(jù)樣本并為樣本分配權重,采用動態(tài)時間卷積神經(jīng)網(wǎng)絡(dtcn)得到金融產(chǎn)品預測排名,選擇排名較高的金融產(chǎn)品對用戶進行展示。本發(fā)明有效解決了傳統(tǒng)等權重訓練中近期樣本重要性不足的問題,提升了模型對近期熱度的關注;同時,時間步依賴模塊通過模型動態(tài)學習樣本內各時間步動態(tài)依賴關系,提高了推薦結果的可靠性和有效性。
25、本發(fā)明采用半高斯采樣突出近期數(shù)據(jù)的重要性,使得模型能夠更加準確地捕捉市場的短期變化,從而提升推薦結果的時效性。
26、本發(fā)明采用dtcn,通過動態(tài)學習不同時間步的重要性,自適應地調整對時間序列數(shù)據(jù)的特征提取,使模型能夠同時捕捉短期內各時間步的依賴關系,提高了對多尺度動態(tài)特征的建模能力。
27、本發(fā)明結合半高斯采樣和dtcn的雙重優(yōu)勢,能夠更全面地利用金融產(chǎn)品熱度和歷史趨勢時間序列數(shù)據(jù),生成更加精準的推薦結果,為用戶提供更優(yōu)質的決策支持。
1.基于半高斯采樣的金融產(chǎn)品推薦方法,其特征在于,包括:
2.根據(jù)權利要求1所述的基于半高斯采樣的金融產(chǎn)品推薦方法,其特征在于,所述動態(tài)時間卷積網(wǎng)絡包括若干時間步依賴模塊和時間卷積模塊的組合、以及全連接模塊,所述時間步依賴模塊用于對權重和輸入數(shù)據(jù)進行點乘操作,其中,輸入數(shù)據(jù)包括訓練階段中的抽取的若干個樣本,或預測階段中的金融產(chǎn)品標準化后的當前屬性數(shù)據(jù)和當前熱度數(shù)據(jù)。
3.根據(jù)權利要求2所述的基于半高斯采樣的金融產(chǎn)品推薦方法,其特征在于,所述時間卷積模塊包括:一維卷積層、批歸一化層、激活層和隨機失活層;所述全連接模塊包括全連接層、批歸一化層、激活層和歸一化指數(shù)函數(shù)。
4.根據(jù)權利要求1所述的基于半高斯采樣的金融產(chǎn)品推薦方法,其特征在于,在訓練過程中,采用斯皮爾曼秩相關系數(shù)損失優(yōu)化動態(tài)時間卷積網(wǎng)絡的超參數(shù)。
5.根據(jù)權利要求1所述的基于半高斯采樣的金融產(chǎn)品推薦方法,其特征在于,所述每個樣本對應的真實值為每個樣本對應的熱度值排名。
6.根據(jù)權利要求1所述的基于半高斯采樣的金融產(chǎn)品推薦方法,其特征在于,所述預處理包括:對歷史屬性數(shù)據(jù)和歷史熱度數(shù)據(jù)進行標準化處理,在標準化處理后,按照每個時間步對所有金融產(chǎn)品的歷史熱度數(shù)據(jù)進行排名,熱度最高排名為1。
7.根據(jù)權利要求1所述的基于半高斯采樣的金融產(chǎn)品推薦方法,其特征在于,所述歷史屬性數(shù)據(jù)包括時間點、日收益率、日波動幅度以及日交易量,所述歷史熱度數(shù)據(jù)為金融產(chǎn)品的搜索指數(shù)或市場關注度指數(shù)。
8.基于半高斯采樣的金融產(chǎn)品推薦系統(tǒng),其特征在于,包括:
9.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執(zhí)行時實現(xiàn)如權利要求1-7中任一項所述的基于半高斯采樣的金融產(chǎn)品推薦方法中的步驟。
10.一種計算機設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述程序時實現(xiàn)如權利要求1-7中任一項所述的基于半高斯采樣的金融產(chǎn)品推薦方法中的步驟。