本發(fā)明涉及互聯(lián)網(wǎng),具體為一種基于互聯(lián)網(wǎng)的用戶興趣智能推薦方法及系統(tǒng)。
背景技術(shù):
1、隨著互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展和大數(shù)據(jù)的廣泛應(yīng)用,個性化推薦系統(tǒng)已經(jīng)成為提升用戶體驗和滿意度的關(guān)鍵技術(shù)之一;傳統(tǒng)的推薦系統(tǒng)主要依賴于協(xié)同過濾、基于內(nèi)容的推薦和基于規(guī)則的推薦;然而,這些方法在應(yīng)對用戶興趣的動態(tài)變化和多源數(shù)據(jù)的整合方面存在顯著不足。
2、協(xié)同過濾方法依賴于用戶之間的相似性或物品之間的相似性,推薦相似用戶喜歡的物品;然而,這種方法對數(shù)據(jù)稀疏性和冷啟動問題較為敏感,難以快速響應(yīng)新用戶或新物品的加入;基于內(nèi)容的推薦方法則依賴于物品的特征和用戶的歷史偏好進行推薦,但往往難以捕捉到用戶興趣的復雜性和多樣性;此外,基于規(guī)則的推薦方法通常是手動設(shè)定的,難以自動適應(yīng)用戶興趣的變化。
技術(shù)實現(xiàn)思路
1、(一)解決的技術(shù)問題
2、針對現(xiàn)有技術(shù)的不足,本發(fā)明提供了一種基于互聯(lián)網(wǎng)的用戶興趣智能推薦方法及系統(tǒng),解決了如何通過捕捉用戶興趣和興趣突變的信息,實現(xiàn)對用戶精準推薦信息的問題。
3、(二)技術(shù)方案
4、為實現(xiàn)以上目的,本發(fā)明通過以下技術(shù)方案予以實現(xiàn):一種基于互聯(lián)網(wǎng)的用戶興趣智能推薦方法及系統(tǒng),包括,
5、實時多源數(shù)據(jù)采集:獲取用戶生成的行為數(shù)據(jù),以及新聞數(shù)據(jù),實時采集和整合多個數(shù)據(jù)源的瞬時數(shù)據(jù),并結(jié)合用戶歷史行為數(shù)據(jù)形成多源數(shù)據(jù)集;
6、深度興趣分析:通過自然語言處理技術(shù)結(jié)合時序分析模型,對多源數(shù)據(jù)集中的瞬時數(shù)據(jù)進行深入分析,通過檢測用戶群體中興趣度的變化,識別潛在的興趣突增趨勢;
7、用戶興趣簇構(gòu)建:基于用戶興趣突增趨勢和多源數(shù)據(jù)集,構(gòu)建動態(tài)的用戶興趣簇,包括興趣權(quán)重、偏好指數(shù)多個維度,并根據(jù)瞬時數(shù)據(jù)動態(tài)調(diào)整用戶興趣簇的參數(shù);
8、預測性推薦生成:使用深度學習模型,基于動態(tài)的用戶興趣簇和興趣突增趨勢,預測用戶的潛在需求,生成并推送基于用戶興趣的推薦內(nèi)容。
9、優(yōu)選的,實時多源數(shù)據(jù)采集從多個數(shù)據(jù)源中實時采集瞬時數(shù)據(jù),數(shù)據(jù)源包括社交媒體平臺、新聞網(wǎng)站、視頻平臺、論壇、電子商務(wù)網(wǎng)站;通過數(shù)據(jù)爬蟲、api接口獲取包括用戶生成內(nèi)容、評論、點贊、分享、搜索查詢、點擊記錄多種形式的瞬時數(shù)據(jù);包含文字信息,還包括圖像、視頻、音頻多媒體數(shù)據(jù);在采集數(shù)據(jù)的同時,進行數(shù)據(jù)清洗和預處理,去除噪聲數(shù)據(jù)和冗余信息,將采集到的瞬時數(shù)據(jù)與用戶的歷史行為數(shù)據(jù)相結(jié)合形成多源數(shù)據(jù)集,用戶的歷史行為數(shù)據(jù)包括用戶的瀏覽記錄、搜索記錄、購買歷史、收藏夾;將多源數(shù)據(jù)集存儲在數(shù)據(jù)庫中,用于描述用戶的興趣偏好和行為模式;多源數(shù)據(jù)集反映用戶的長期興趣,捕捉用戶在短時間內(nèi)的興趣變化;多源數(shù)據(jù)集通過自然語言處理技術(shù)結(jié)合時序分析模型進行深度興趣分析。
10、優(yōu)選的,深度興趣分析通過自然語言處理技術(shù),對多源數(shù)據(jù)集中的瞬時數(shù)據(jù)進行處理,并提取特征,包括文本分詞和標注、情感分析、提取視頻和音頻中的文本;通過時序分析模型對提取的特征進行分析,時序分析模型包括時間序列模型,分析用戶在特定時間段內(nèi)的興趣度變化,其中興趣度變化包括用戶關(guān)注某些主題或內(nèi)容的頻率和強度;當檢測到某一主題或內(nèi)容的用戶興趣度在短時間內(nèi)出現(xiàn)顯著上升時,即識別為潛在的興趣突增趨勢;結(jié)合近期的新聞事件、社交媒體的熱門話題,判斷用戶的興趣突增趨勢是否受到外部因素的影響;通過分析及時捕捉用戶興趣的動態(tài)變化,從而實時推薦內(nèi)容。
11、優(yōu)選的,用戶興趣簇構(gòu)建通過聚類算法將具有相似興趣和行為特征的用戶劃分為同一簇;用戶的歷史行為數(shù)據(jù)作為聚類的主要依據(jù),用于構(gòu)建初始的用戶興趣簇,通過s2步驟中識別出的興趣突增趨勢,將突增的興趣點的權(quán)重納入用戶興趣簇的構(gòu)建過程中;在用戶興趣簇構(gòu)建完成后,實時采集瞬時數(shù)據(jù),對每個用戶興趣簇的參數(shù)進行動態(tài)調(diào)整,通過調(diào)整瞬時數(shù)據(jù)中用戶在不同平臺上的最新行為,如點擊、點贊、評論等,以及當前的熱點信息和社會事件,監(jiān)控瞬時數(shù)據(jù),識別出用戶興趣的最新變化,并將最新變化體現(xiàn)在用戶興趣簇的調(diào)整上,例如,當某個用戶興趣簇中的用戶對某一新興主題表現(xiàn)出強烈的興趣時,系統(tǒng)動態(tài)地增加該新興主題在用戶興趣簇中的權(quán)重,反映出用戶興趣簇的當前興趣傾向;系統(tǒng)根據(jù)瞬時數(shù)據(jù)的變化情況,適時調(diào)整用戶興趣簇的組成和邊界;例如,當某些用戶的興趣變化顯著且與當前所屬用戶興趣簇的特征不符時,系統(tǒng)重新評估這些用戶的歸屬,并將其重新劃分到更符合其最新興趣的用戶興趣簇中;通過動態(tài)調(diào)整,系統(tǒng)能實時反映用戶的興趣變化,從而提高推薦的準確性和相關(guān)性,確保用戶興趣簇始終保持與用戶真實興趣的高度一致。
12、優(yōu)選的,聚類算法通過dbscan聚類算法實現(xiàn),系統(tǒng)從各個平臺采集用戶的歷史行為數(shù)據(jù),包括瀏覽記錄、購買記錄和點擊行為,提取每個用戶代表用戶的興趣和行為模式的特征向量;在初始用戶興趣簇的構(gòu)建過程中,通過分析特征向量,結(jié)合s2步驟中識別出的興趣突增趨勢,將突增興趣點的權(quán)重納入考慮,并使用dbscan算法對用戶進行聚類;dbscan算法通過設(shè)定半徑參數(shù)ε和最小樣本數(shù)m?i?npts來定義用戶興趣簇的形成;對于每個用戶,dbscan聚類算法計算其ε鄰域內(nèi)的其他用戶數(shù)量,若鄰域內(nèi)的用戶數(shù)達到m?i?npts,該用戶被視為核心點,通過核心點連接直達的用戶形成一個用戶興趣簇,對于不屬于任何用戶興趣簇且不在核心點鄰域內(nèi)的用戶,標記為噪聲點;在初始用戶興趣簇構(gòu)建完成后,實時采集用戶的瞬時數(shù)據(jù),包括最新的瀏覽記錄、搜索詞、點贊和評論;通過監(jiān)控瞬時數(shù)據(jù),識別用戶興趣的最新變化,并將最新變化體現(xiàn)在用戶興趣簇的調(diào)整上;具體來說,當用戶的興趣特征發(fā)生變化時,系統(tǒng)重新評估其在當前用戶興趣簇中的位置,將用戶重新分配到更合適的用戶興趣簇中;瞬時數(shù)據(jù)的采集和分析使得用戶興趣簇的參數(shù)動態(tài)調(diào)整,系統(tǒng)根據(jù)用戶瞬時數(shù)據(jù)的變化情況適時調(diào)整簇的組成和邊界,確保用戶分組準確反映其最新的興趣變化,通過動態(tài)調(diào)整機制,dbscan算法在實施過程中有效適應(yīng)用戶興趣的變化,提供更加精準的用戶分簇。
13、優(yōu)選的,預測性推薦生成利用構(gòu)建的動態(tài)用戶興趣簇和識別出的興趣突增趨勢,提取每個用戶興趣簇中的用戶特征和興趣變化趨勢;將用戶特征和興趣變化趨勢作為模型的輸入,用于訓練機器學習和深度學習模型;通過深度學習模型學習用戶興趣簇中用戶的歷史行為模式、興趣變化規(guī)律以及興趣突增的特征,從而預測用戶未來的潛在需求;在訓練過程中,利用用戶興趣簇中的用戶行為和反饋信息優(yōu)化模型參數(shù),使深度學習模型能捕捉用戶的潛在興趣和需求;系統(tǒng)結(jié)合外部數(shù)據(jù)源中的最新趨勢和熱點信息,進一步增強模型對突發(fā)興趣的感知能力;深度學習模型訓練完成后,系統(tǒng)對新數(shù)據(jù)進行在線預測,實時生成個性化的推薦內(nèi)容,推薦內(nèi)容包括新聞、視頻、商品、社交帖子,涵蓋用戶感興趣的各個領(lǐng)域;推送個性化推薦內(nèi)容時,系統(tǒng)考慮多種因素,如推薦的多樣性、用戶偏好、內(nèi)容新鮮度、新聞的上下文信息等,以確保推薦的內(nèi)容符合用戶的興趣,還具有吸引力和時效性;推薦內(nèi)容通過多種渠道呈現(xiàn)給用戶,如主頁推薦、通知推送、個性化廣告;系統(tǒng)持續(xù)收集用戶的反饋信息,并根據(jù)反饋數(shù)據(jù)調(diào)整模型和推薦策略,基于動態(tài)用戶興趣簇和興趣突增趨勢的預測與推薦方法,能夠更加精準地滿足用戶的個性化需求,提高用戶的滿意度和忠誠度。
14、優(yōu)選的,深度學習模型通過rnn模型預測用戶潛在需求,將時序分析模型用作rnn模型的輸入層,通過時序分析模型檢測的用戶興趣變化,識別出用戶的興趣突增趨勢,同時將動態(tài)的用戶興趣簇也作為輸入層;隱藏層由lstm單元組成,lstm單元能記住長期和短期的信息,并通過輸入門、遺忘門和輸出門機制選擇更新、保存或輸出信息;在每個時間步,lstm單元接收輸入數(shù)據(jù),并在隱藏層中綜合當前和過去的瞬時數(shù)據(jù),隱藏層的輸出通過全連接層進一步處理,將高維度的lstm輸出轉(zhuǎn)換為預測值;使用softmax函數(shù),將輸出轉(zhuǎn)換為概率分布,表示每個類別的可能性;輸出用戶未來行為或興趣的預測,例如對特定內(nèi)容的興趣程度或點擊率預測;通過將時序分析模型提取出的時間特征與瞬時數(shù)據(jù)和動態(tài)用戶興趣簇特征結(jié)合后輸入lstm網(wǎng)絡(luò),lstm通過學習特征之間的關(guān)系和時間依賴性來生成預測結(jié)果;在實際應(yīng)用中,當實時采集到的瞬時數(shù)據(jù)到來時,深度學習模型能實時處理輸入數(shù)據(jù)并預測用戶未來的行為和興趣變化,根據(jù)預測結(jié)果生成個性化的推薦內(nèi)容。
15、(三)有益效果
16、本發(fā)明提供了一種基于互聯(lián)網(wǎng)的用戶興趣智能推薦方法及系統(tǒng),具備以下有益效果:
17、1、本發(fā)明能夠?qū)崟r分析和識別用戶興趣的變化,特別是潛在的興趣突增趨勢,使得推薦系統(tǒng)能夠快速響應(yīng)用戶興趣的轉(zhuǎn)變,提供最新鮮和最相關(guān)的推薦內(nèi)容,大幅提升了推薦的時效性和用戶滿意度。
18、2、本發(fā)明采用動態(tài)用戶興趣簇構(gòu)建和調(diào)整機制,通過聚類算法和瞬時數(shù)據(jù)的實時監(jiān)控,系統(tǒng)實時更新用戶興趣簇的組成和參數(shù);使用戶興趣簇能夠精確反映用戶的最新興趣傾向,即使用戶的興趣發(fā)生顯著變化,系統(tǒng)也能迅速做出調(diào)整,確保推薦內(nèi)容的高相關(guān)性。
19、3、本發(fā)明系統(tǒng)通過多源數(shù)據(jù)的實時采集和整合,包括社交媒體、新聞網(wǎng)站、視頻平臺等,不僅豐富了數(shù)據(jù)來源,還使得推薦內(nèi)容能夠涵蓋多個領(lǐng)域和形式;系統(tǒng)能夠提供基于用戶興趣和多樣化的推薦內(nèi)容,滿足用戶的多層次需求,增強用戶體驗。