本發(fā)明涉及數(shù)據(jù)挖掘,尤其涉及一種空間相關(guān)興趣點推薦方法、系統(tǒng)、設(shè)備、產(chǎn)品及介質(zhì)。
背景技術(shù):
1、隨著大多數(shù)智能手機已經(jīng)配備了全球衛(wèi)星導(dǎo)航系統(tǒng)(gps),從而具有定位功能,用戶可以通過包含gps的智能手機或移動設(shè)備隨時隨地上傳他們的位置,并且能夠在基于位置的社交網(wǎng)絡(luò)中分享他們的興趣點簽到數(shù)據(jù)。近年來,越來越多的研究開始關(guān)注利用基于位置的社交網(wǎng)絡(luò)的大量用戶簽到數(shù)據(jù)來建模用戶偏好,從而呈現(xiàn)給用戶未訪問過的興趣點推薦結(jié)果。然而,簽到數(shù)據(jù)是一種隱性反饋,它反映了用戶對特定興趣點的積極偏好,但未訪問某些地點并不一定表示用戶不喜歡這些地點。
2、在興趣點的推薦任務(wù)中,地理影響因素最為顯著,因此被絕大部分興趣點推薦模型作為挖掘用戶偏好的重要建模對象。由于用戶傾向于訪問地理位置靠近用戶活動中心的興趣點,因此用戶更傾向于訪問他們之前簽到過的興趣點附近的新興趣點。所以用戶偏好學(xué)習(xí)中增強興趣點之間的地理相關(guān)性建模,可以提高用戶偏好理解的準確性。
3、在地理特征表示方面,目前興趣點推薦模型中的地理特征通常通過規(guī)則的網(wǎng)格域或均勻概率分布來表示并以此來確定興趣點之間的空間相關(guān)性。這些方法往往依賴人為的約束規(guī)則,且地理區(qū)域劃分粒度不夠精細,在捕捉所有候選興趣點之間的空間關(guān)系方面缺乏客觀性和完整性。其次,從未將空間相關(guān)性作為學(xué)習(xí)目標(biāo),從而無法使模型對那些用戶已訪問過的興趣點呈高度空間相關(guān)性的其它興趣點表現(xiàn)敏感性。
技術(shù)實現(xiàn)思路
1、本發(fā)明旨在至少解決相關(guān)技術(shù)中存在的技術(shù)問題之一。為此,本發(fā)明提供一種空間相關(guān)興趣點推薦方法、系統(tǒng)、設(shè)備、產(chǎn)品及介質(zhì),實現(xiàn)興趣點推薦效果的提高。
2、本發(fā)明提供一種空間相關(guān)興趣點推薦方法,包括:
3、s1:獲取訓(xùn)練樣本中的興趣點,構(gòu)建位置向量預(yù)訓(xùn)練網(wǎng)絡(luò),通過位置向量預(yù)訓(xùn)練網(wǎng)絡(luò)訓(xùn)練興趣點的位置向量;
4、s2:將用戶歷史簽到數(shù)據(jù)劃分為以周為間隔的軌跡切片;
5、s3:建立軌跡編碼網(wǎng)絡(luò),通過軌跡編碼網(wǎng)絡(luò)將所述軌跡切片和訓(xùn)練后的所述位置向量進行融合,獲得軌跡切片向量,構(gòu)建softmax函數(shù)對軌跡切片向量進行變換,得到軌跡切片中所有興趣點的興趣點偏好得分;
6、s4:確定每個所述軌跡切片中的用戶訪問目標(biāo)并生成每個用戶訪問目標(biāo)對應(yīng)的空間關(guān)聯(lián)目標(biāo)集合,獲取用戶訪問目標(biāo)和空間關(guān)聯(lián)目標(biāo)集合的興趣點偏好得分,對用戶訪問目標(biāo)和空間關(guān)聯(lián)目標(biāo)集合進行損失值的計算,迭代至損失值收斂以實現(xiàn)所述軌跡編碼網(wǎng)絡(luò)的訓(xùn)練;
7、s5:通過訓(xùn)練后的所述軌跡編碼網(wǎng)絡(luò)計算每個所述軌跡切片的位置偏好得分,通過對位置偏好得分進行權(quán)重相加得到興趣點推薦結(jié)果。
8、根據(jù)本發(fā)明提供的一種空間相關(guān)興趣點推薦方法,步驟s1進一步包括:
9、s11:獲取所述訓(xùn)練樣本中的所述興趣點,將訓(xùn)練樣本中的興趣點的位置信息轉(zhuǎn)化為olc序列;
10、s12:在全部的olc序列中隨機采樣成對的olc序列構(gòu)成olc序列對,計算olc序列對的真實空間相關(guān)性得分;
11、s13:構(gòu)建位置向量預(yù)訓(xùn)練網(wǎng)絡(luò),帶入真實空間相關(guān)性得分計算均方誤差損失值,迭代位置向量預(yù)訓(xùn)練網(wǎng)絡(luò)至均方誤差損失值收斂;
12、s14:利用位置向量預(yù)訓(xùn)練網(wǎng)絡(luò)對興趣點進行訓(xùn)練得到興趣點的位置向量。
13、根據(jù)本發(fā)明提供的一種空間相關(guān)興趣點推薦方法,步驟s13中還包括:
14、s131:將所述olc序列對中的每個所述olc序列的每個字符轉(zhuǎn)化為第一嵌入向量;
15、s132:構(gòu)建孿生gru網(wǎng)絡(luò)作為所述位置向量預(yù)訓(xùn)練網(wǎng)絡(luò),每個olc序列對中的兩個olc序列分別利用位置向量預(yù)訓(xùn)練網(wǎng)絡(luò)中的一個gru網(wǎng)絡(luò)更新第一嵌入向量;
16、s133:提取每個olc序列中最后一位上的經(jīng)過位置向量預(yù)訓(xùn)練網(wǎng)絡(luò)更新過的第一嵌入向量作為特征第一嵌入向量,利用曼哈頓距離計算兩個特征第一嵌入向量的語義相關(guān)性,通過語義相關(guān)性和所述真實空間相關(guān)性得分計算均方誤差損失值;
17、s134:在所有所述訓(xùn)練樣本中迭代數(shù)次,直至位置向量預(yù)訓(xùn)練網(wǎng)絡(luò)的均方誤差損失值收斂為止。
18、根據(jù)本發(fā)明提供的一種空間相關(guān)興趣點推薦方法,步驟s3進一步包括:
19、s31:構(gòu)建長短記憶網(wǎng)絡(luò)作為所述軌跡編碼網(wǎng)絡(luò),融合所述軌跡切片中的所述用戶歷史簽到數(shù)據(jù)和所述位置向量獲得第二嵌入向量,利用軌跡編碼網(wǎng)絡(luò)對每個軌跡切片中的第二嵌入向量進行更新;
20、s32:計算每個軌跡切片中的平均位置信息,將平均位置信息與當(dāng)前軌跡切片中的所有第二嵌入向量之和拼接,得到所述軌跡切片向量;
21、s33:構(gòu)建softmax函數(shù),將軌跡切片向量通過線性網(wǎng)絡(luò)進行轉(zhuǎn)換并和候選的興趣點表示相乘,對軌跡切片向量和興趣點表示通過softmax函數(shù)進行softmax變換得到所有所述興趣點的所述興趣點偏好得分。
22、根據(jù)本發(fā)明提供的一種空間相關(guān)興趣點推薦方法,步驟s4進一步包括:
23、s41:將每個所述軌跡切片中時間位于當(dāng)前軌跡切片之后的5個軌跡切片中出現(xiàn)的所述用戶歷史簽到數(shù)據(jù)中的所述興趣點確定為用戶訪問目標(biāo)集合;
24、s42:從用戶訪問目標(biāo)集合中確定所述用戶訪問目標(biāo)和所述空間關(guān)聯(lián)目標(biāo)集合;
25、s43:確定每個軌跡切片的用戶訪問目標(biāo)和空間關(guān)聯(lián)目標(biāo)集合中的所述興趣點偏好得分的集合為特征興趣點偏好得分集合,代入特征興趣點偏好得分集合并利用融合弱標(biāo)簽的多目標(biāo)交叉熵來計算用戶訪問目標(biāo)和空間關(guān)聯(lián)目標(biāo)集合的多目標(biāo)損失值;
26、s44:在所有所述訓(xùn)練樣本中迭代數(shù)次,直至軌跡編碼網(wǎng)絡(luò)的用戶訪問目標(biāo)和空間關(guān)聯(lián)目標(biāo)集合的多目標(biāo)損失值收斂為止。
27、根據(jù)本發(fā)明提供的一種空間相關(guān)興趣點推薦方法,步驟s42中還包括:
28、s421:在當(dāng)前所述軌跡切片對應(yīng)的所述用戶訪問目標(biāo)集合中,將所有的所述興趣點的粗粒度位置信息作為軌跡切片的第一空間相關(guān)olc集合;
29、s422:統(tǒng)計所有軌跡切片的第一空間相關(guān)olc集合;
30、s423:在當(dāng)前軌跡切片中確定一個用戶訪問目標(biāo),從第一空間相關(guān)olc集合中找出所有包含用戶訪問目標(biāo)的粗粒度位置信息的所有空間相關(guān)olc的集合作為第二空間相關(guān)olc集合;
31、s424:將所有第二空間相關(guān)olc集合對應(yīng)的興趣點確定為用戶訪問目標(biāo)對應(yīng)的所述空間關(guān)聯(lián)目標(biāo)集合。
32、本發(fā)明還提供一種空間相關(guān)興趣點推薦系統(tǒng),用于執(zhí)行如以上任一項所述的一種空間相關(guān)興趣點推薦方法,包括:
33、位置向量預(yù)訓(xùn)練模塊:用于獲取訓(xùn)練樣本中的興趣點,構(gòu)建位置向量預(yù)訓(xùn)練網(wǎng)絡(luò),通過位置向量預(yù)訓(xùn)練網(wǎng)絡(luò)訓(xùn)練興趣點的位置向量;
34、用戶歷史簽到數(shù)據(jù)預(yù)處理模塊:用于將用戶歷史簽到數(shù)據(jù)劃分為以周為間隔的軌跡切片;
35、軌跡編碼網(wǎng)絡(luò)建立模塊:用于建立軌跡編碼網(wǎng)絡(luò),通過軌跡編碼網(wǎng)絡(luò)將所述軌跡切片和訓(xùn)練后的所述位置向量進行融合,獲得軌跡切片向量,構(gòu)建softmax函數(shù)對軌跡切片向量進行變換,得到軌跡切片中所有興趣點的興趣點偏好得分;
36、軌跡編碼網(wǎng)絡(luò)訓(xùn)練模塊:用于確定每個所述軌跡切片中的用戶訪問目標(biāo)并生成每個用戶訪問目標(biāo)對應(yīng)的空間關(guān)聯(lián)目標(biāo)集合,獲取用戶訪問目標(biāo)和空間關(guān)聯(lián)目標(biāo)集合的興趣點偏好得分,對用戶訪問目標(biāo)和空間關(guān)聯(lián)目標(biāo)集合進行損失值的計算,迭代至損失值收斂以實現(xiàn)所述軌跡編碼網(wǎng)絡(luò)的訓(xùn)練;
37、興趣點推薦模塊:用于通過訓(xùn)練后的所述軌跡編碼網(wǎng)絡(luò)計算每個所述軌跡切片的位置偏好得分,通過對位置偏好得分進行權(quán)重相加得到興趣點推薦結(jié)果。
38、本發(fā)明還提供了一種電子設(shè)備,包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述處理器執(zhí)行所述程序時實現(xiàn)如以上任一項所述的一種空間相關(guān)興趣點推薦方法。
39、本發(fā)明還提供一種非暫態(tài)計算機可讀存儲介質(zhì),其上存儲有計算機程序所述計算機程序被處理器執(zhí)行時實現(xiàn)如以上任一項所述的一種空間相關(guān)興趣點推薦方法。
40、本發(fā)明還提供一種計算機程序產(chǎn)品,所述計算機程序產(chǎn)品包括存儲在非暫態(tài)計算機可讀存儲介質(zhì)上的計算機程序,所述計算機程序包括程序指令,當(dāng)所述程序指令被計算機執(zhí)行時,計算機能夠執(zhí)行如以上任一項所述的一種空間相關(guān)興趣點推薦方法。
41、本發(fā)明實施例中的上述一個或多個技術(shù)方案,至少具有如下技術(shù)效果之一:
42、本發(fā)明提供的一種空間相關(guān)興趣點推薦方法,通過位置向量預(yù)訓(xùn)練網(wǎng)絡(luò)生成的興趣點位置向量不僅能使每個興趣點擁有唯一的用于描述絕對位置的向量表示,同時還能捕捉任意兩個預(yù)訓(xùn)練位置向量和對應(yīng)興趣點之間的相對距離關(guān)系,從而實現(xiàn)地理位置相關(guān)性語義的準確描述。多目標(biāo)學(xué)習(xí)方法聯(lián)合用戶訪問目標(biāo)和空間相關(guān)目標(biāo)共同計算模型訓(xùn)練損失能使用戶軌跡表示在描述用戶偏好的同時,還會主動關(guān)注和用戶自身訪問過的興趣點有著高度地理關(guān)聯(lián)的其它興趣點,從而實現(xiàn)對用戶偏好的反映出的空間聚類模式的捕捉。本發(fā)明所設(shè)計的用戶訪問目標(biāo)和空間相關(guān)目標(biāo)的空間相關(guān)性建模方法共同促進了興趣點推薦的效果。
43、本發(fā)明的附加方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實踐了解到。