本申請涉及計算機技術領域,特別是涉及一種興趣點搜索方法及裝置,電子設備。
背景技術:
隨著互聯(lián)網(wǎng)技術的發(fā)展,互聯(lián)網(wǎng)平臺信息量暴增,一些搜索引擎為了給用戶提供完全個性化的決策支持和信息服務,通常會根據(jù)用戶輸入的搜索關鍵詞,結合用戶所處地理位置為用戶搜索相關信息。現(xiàn)有技術中的通常做法是:搜索服務器首先根據(jù)用戶的搜索關鍵詞和搜索請求進行搜索,以獲得多個搜索結果;然后,搜索服務器進一步獲取用戶的當前地理位置以及用戶的用戶標識,并根據(jù)用戶標識獲得用戶的歷史位置信息;最后,搜索服務器根據(jù)歷史位置信息對多個搜索結果進行排序優(yōu)化,以便為用戶提供豐富的搜索結果。采用現(xiàn)有技術中的方法,當某一用戶在a地搜索旅游景點時,如果a地旅游資源有限,則會出現(xiàn)搜索的旅游景點不足的問題。
可見,現(xiàn)有技術中的興趣點搜索方法中,在搜索旅游景點等地理位置相關的興趣點的應用中,存在召回的興趣點不豐富的問題。
技術實現(xiàn)要素:
本申請?zhí)峁┮环N興趣點搜索方法,解決現(xiàn)有技術中存在的搜索過程中召回的興趣點不豐富的問題。
為了解決上述問題,第一方面,本申請實施例提供了一種興趣點搜索方法,包括:
確定產生搜索行為的用戶的用戶場景;
針對所述用戶場景,構建所述搜索行為對應的目標城市的城市圈興趣點庫;
基于預設模型,對所述城市圈興趣點庫中的興趣點進行混合排序并召回。
第二方面,本申請實施例提供了一種興趣點搜索裝置,包括:
用戶場景確定模塊,用于確定產生搜索行為的用戶的用戶場景;
城市圈興趣點庫構建模塊,用于針對所述用戶場景確定模塊確定的用戶場景,構建所述搜索行為對應的目標城市的城市圈興趣點庫;
混合排序模塊,用于基于預設模型,對所述城市圈興趣點庫構建模塊構建的城市圈興趣點庫中的興趣點進行混合排序并召回。
第三方面,本申請實施例提供了一種電子設備,包括存儲器、處理器及存儲在所述存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)本申請實施例公開的所述的興趣點搜索方法。
第四方面,本申請實施例提供了一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執(zhí)行時本申請實施例公開的所述興趣點搜索方法的步驟。
本申請實施例公開的興趣點搜索方法,通過確定產生搜索行為的用戶的用戶場景,并針對所述用戶場景,構建所述搜索行為對應的目標城市的城市圈興趣點庫,然后,基于預設模型,對所述城市圈興趣點庫中的興趣點進行混合排序并召回,解決了現(xiàn)有技術中存在的搜索過程中召回的興趣點不豐富的問題。通過構建城市圈興趣點庫有效地豐富了召回的興趣點,同時,通過區(qū)分用戶場景,提高了召回興趣點的準確性。
附圖說明
為了更清楚地說明本申請實施例的技術方案,下面將對實施例或現(xiàn)有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本申請實施例一的興趣點搜索方法的流程圖;
圖2是本申請實施例二的興趣點搜索方法的流程圖;
圖3是本申請實施例二的城市a的城市圈示意圖;
圖4是本申請實施例三的興趣點搜索裝置結構示意圖之一;
圖5是本申請實施例三的興趣點搜索裝置結構示意圖之二。
具體實施方式
下面將結合本申請實施例中的附圖,對本申請實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本申請一部分實施例,而不是全部的實施例?;诒旧暾堉械膶嵤├绢I域普通技術人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本申請保護的范圍。
本申請實施例公開的興趣點搜索方法中涉及的興趣點可以為具有地域差異的旅游景點、飯店、酒店等。
實施例一
本申請公開的一種興趣點搜索方法,如圖1所示,該方法包括:步驟100至步驟120。
步驟100,確定產生搜索行為的用戶的用戶場景。
用戶的搜索行為包括用戶在某一頁面上輸入搜索關鍵詞后發(fā)起的搜索行為、用戶瀏覽某個頁面后頁面程序自動發(fā)起的搜索行為、用戶在頁面上執(zhí)行篩選操作等搜索相關的操作后程序自動發(fā)起的搜索行為等。本申請對用戶發(fā)起搜索行為的具體方式不做限定。
具體實施時,每一個搜索行為都對應著一個城市,本申請稱之為搜索行為的目標城市。如,用戶進入a城市的頁面之后,在該頁面上輸入搜索關鍵詞后發(fā)起的搜索行為,則該搜索行為的目標城市為城市a。如,用戶在城市列表中進行篩選,選擇了城市a,則該搜索行為的目標城市為城市a。
具體實施時,用戶場景包括本地用戶、異地用戶。當用戶訪問應用或網(wǎng)站的某一頁面之后,應用或者網(wǎng)站的頁面會通過遠程服務器獲取用戶的id,并進一步獲取該用戶的注冊信息、行為日志等數(shù)據(jù),進而獲取用戶的常駐城市。應用或者網(wǎng)站的頁面還可以通過對用戶設備進行定位獲取用戶的當前定位城市。然后,確定產生搜索行為的用戶的常駐城市或當前定位城市,并根據(jù)目標城市和用戶的常駐城市或當前定位城市確定用戶場景,例如:若所述搜索行為對應的目標城市為所述常駐城市或當前定位城市,則確定所述用戶的用戶場景為本地用戶,否則,確定所述用戶的用戶場景為異地用戶。
步驟110,針對所述用戶場景,構建所述搜索行為對應的目標城市的城市圈興趣點庫。
當確定產生搜索行為的用戶的用戶場景之后,如果用戶場景為本地用戶,則構建所述搜索行為對應的目標城市的本地用戶的城市圈興趣點庫;如果用戶場景為異地用戶,則構建所述搜索行為對應的目標城市的異地用戶的城市圈興趣點庫。
在構建所述搜索行為對應的目標城市的本地用戶的城市圈興趣點庫時,首先分別根據(jù)所述目標城市的本地用戶的歷史行為日志(如點擊或購買日志),按照城市維度確定與所述目標城市關聯(lián)的其他城市的城市相關性第一得分;以及根據(jù)所述目標城市的所有用戶的歷史行為日志,按照用戶維度確定城市與所述目標城市關聯(lián)的其他城市的相關性第二得分,并根據(jù)第一得分和第二得分確定與所述目標城市關聯(lián)的其他城市的城市相關性得分;然后,根據(jù)獲得的城市相關性得分確定所述目標城市的城市圈,或者根據(jù)獲得的城市相關性得分以及各關聯(lián)城市與所述目標城市之間的距離確定所述目標城市的城市圈。具體實施時,所述目標城市的城市圈中通常包括多個城市。最后,確定所述城市圈中各城市的滿足預設條件的所有興趣點,構成所述目標城市的本地用戶的城市圈興趣點庫。
在構建所述搜索行為對應的目標城市的異地用戶的城市圈興趣點庫時,首先分別根據(jù)所述目標城市的異地用戶的歷史行為日志,按照城市維度確定與所述目標城市關聯(lián)的其他城市的城市相關性第一得分;以及根據(jù)所述目標城市的所有用戶的歷史行為日志,按照用戶維度確定城市與所述目標城市關聯(lián)的其他城市的相關性第二得分,并根據(jù)第一得分和第二得分確定與所述目標城市關聯(lián)的其他城市的城市相關性得分;然后,根據(jù)獲得的城市相關性得分確定所述目標城市的城市圈,或者根據(jù)獲得的城市相關性得分以及各關聯(lián)城市與所述目標城市之間的距離確定所述目標城市的城市圈。具體實施時,所述目標城市的城市圈中通常包括多個城市。最后,確定所述城市圈中各城市的滿足預設條件的所有興趣點,構成所述目標城市的異地用戶的城市圈興趣點庫。
步驟120,基于預設模型,對所述城市圈興趣點庫中的興趣點進行混合排序并召回。
具體實施時,前述步驟生成的本地用戶的城市圈興趣點庫或異地用戶的城市圈興趣點庫中包括多個興趣點。具體實施時,城市圈興趣點庫中的興趣點包括:發(fā)生過預設用戶行為(如點擊和/或購買預設興趣點)的興趣點、各城市近期的熱門興趣點。
具體實施時,預設模型包括:點擊率預估模型、短期訪購率預估模型和長期訪購率預估模型。基于預設模型,對所述城市圈興趣點庫中的興趣點進行混合排序并召回時,對于所述城市圈興趣點庫中每個興趣點,分別通過預設的點擊率預估模型、短期訪購率預估模型和長期訪購率預估模型獲取相應模型的排序得分;然后,對于所述城市圈興趣點庫中每個興趣點,綜合通過各模型獲取的排序得分得到該興趣點的混合排序得分;按照所述混合排序得分對所述城市圈興趣點庫中的興趣點進行排序,并召回。
本申請實施例公開的興趣點搜索方法,通過確定產生搜索行為的用戶的用戶場景,并針對所述用戶場景,構建所述搜索行為對應的目標城市的城市圈興趣點庫,然后,基于預設模型,對所述城市圈興趣點庫中的興趣點進行混合排序并召回,解決了現(xiàn)有技術中存在的搜索過程中召回的興趣點不豐富的問題。通過構建城市圈興趣點庫有效地豐富了召回的興趣點,同時,通過區(qū)分用戶場景,提高了召回興趣點的準確性。
實施例二
本申請公開的一種興趣點搜索方法,如圖2所示,該方法包括:步驟200至步驟240。
步驟200,創(chuàng)建多個城市興趣點庫。
具體實施時,在構建城市圈興趣點庫之前,預設有每個城市的興趣點庫,所述城市興趣點庫包括:本地用戶興趣點庫和異地用戶興趣點庫。其中,本地用戶興趣點庫中的興趣點為該城市的本地用戶關注的興趣點,異地用戶興趣點庫中的興趣點為該城市的異地用戶關注的興趣點。
步驟210,訓練點擊率預估模型和不同周期的訪購率預估模型。
本申請實施例中,訓練點擊率預估模型時,選取t~t+n天的興趣點的搜索日志作為訓練樣本,t+n+1~t+n+m天的興趣點的搜索日志作為測試樣本,其中,用戶點擊的召回興趣點對應的搜索日志作為正樣本,展示但未點擊的召回的興趣點對應的搜索日志作為負樣本,用gbrt等非線性模型訓練得到點擊率預估模型。其中n為訓練樣本的周期,比如n=30,則選取30天的興趣點的搜索日志訓練。m為測試樣本的周期,用于評估模型的泛化能力,比如m=5,則使用之后5天的興趣點的搜索日志來評估模型效果。具體實施時,m和n可以為大于1的整數(shù)。
然后,需要根據(jù)興趣點搜索日志提取各興趣點的預設特征。提取的特征包括但不限于以下四個維度:用戶維度、興趣點質量維度、交互維度和上下文維度。其中,用戶維度進一步包括:用戶標簽、價格/品類/地理偏好、基于poi-cf(興趣點協(xié)同過濾)的推薦特征等子維度;興趣點質量維度進一步包括:興趣點的銷量、點擊、評論、價格、轉化率等子維度;交互維度進一步包括:用戶過去第一周期/第二周期/第三周期內是否點擊/購買/收藏過該興趣點子維度;上下文維度進一步包括:當前搜索行為的時間、城市、天氣、與所述目標城市的距離等子維度。其中,用戶標簽用于區(qū)分本地用戶興趣點或異地用戶興趣點。興趣點質量維度中的特征區(qū)分本地用戶興趣點和異地用戶興趣點。其中,第一周期可以為7天,第二周期可以為30天,第三周期可以為90天。
具體實施時,從每條興趣點的搜索日志中提取上述特征,會得到多個預設特征構成的興趣點特征向量,如(f10,f11,f12,f20,f21,f30,...,f40,f41,...)。然后,利用gbrt等非線性模型訓練對得到的特征向量進行訓練,得到相應的點擊率預估模型。
訪購率預估模型是用于預測用戶由訪問到購買的概率的模型。本申請具體實施時,通常訓練至少兩個不同周期的訪購率預估模型。訓練訪購率預估模型時,選取t~t+n天的興趣點的搜索日志作為訓練樣本,t+n+1~t+n+m天的興趣點的搜索日志作為測試樣本,其中,用戶發(fā)生支付行為的召回興趣點對應的搜索日志作為正樣本,展示但未點擊的召回興趣點對應的搜索日志作為負樣本,用gbrt等非線性模型訓練得到點擊率預估模型。其中n為訓練樣本的周期長度,比如n=30,則選取30天的日志進行訓練。在訓練不同周期的訪購率預估模型時,訓練樣本的周期各不相同,以訓練短周期訪購率預估模型和訓練長周期訪購率預估模型為例,訓練短周期訪購率預估模型時,樣本的周期可以選擇n=30;訓練長周期訪購率預估模型時,樣本的周期可以選擇n=365。m為測試樣本的周期,用于評估模型的泛化能力,比如m=5,則使用之后5天的搜索日志來評估模型效果。
然后,需要根據(jù)興趣點搜索日志提取各興趣點的預設特征。提取的特征維度和提取方法與訓練點擊率預估模型時相同,此處不再贅述。
具體實施時,從每條興趣點搜索日志中提取上述特征,會得到多個預設特征構成的興趣點特征向量,如(f10,f11,f12,f20,f21,f30,...,f40,f41,...)。然后,利用gbrt等非線性模型訓練對得到的特征向量進行訓練,得到相應的訪購率預估模型。
在訓練模型時,通過提取用戶維度特征,設置用戶標簽以標識本地用戶的興趣點或異地用戶的興趣點,并將興趣點質量維度的特征按照本地用戶和異地用戶分別進行提取,使得訓練得到的點擊率預估模型和訪購率預估模型可以充分表征本地用戶和異地用戶的行為特點。
步驟220,確定產生搜索行為的用戶的用戶場景。
具體實施時,獲取用戶的搜索行為的具體實施方式參見實施例一,此處不再贅述。
獲取用戶的搜索行為時,同時可以確定所述搜索行為的目標城市,以及,確定發(fā)起所屬搜索行為的用戶的常駐城市或當前定位城市。確定所述搜索行為的目標城市、確定發(fā)起所屬搜索行為的用戶的常駐城市或當前定位城市的具體實施方式參見實施例一,此處不再贅述。
本申請的實施中,用戶場景包括本地用戶、異地用戶。具體實施時,所述確定產生搜索行為的用戶的用戶場景,包括:確定產生搜索行為的用戶的常駐城市或當前定位城市;若所述搜索行為對應的目標城市為所述常駐城市或當前定位城市,則確定所述用戶的用戶場景為本地用戶,否則,確定所述用戶的用戶場景為異地用戶。具體實施時,優(yōu)選的,如果已經獲取產生搜索行為的用戶的常駐城市,則判斷所述搜索行為對應的目標城市是否為產生搜索行為的用戶的常駐城市,若所述搜索行為對應的目標城市為所述常駐城市或當前定位城市,則確定所述用戶的用戶場景為本地用戶,否則,確定所述用戶的用戶場景為異地用戶。如果沒有獲取產生搜索行為的用戶的常駐城市,則獲取產生搜索行為的用戶的當前定位城市,然后,判斷所述搜索行為對應的目標城市是否為產生搜索行為的用戶的當前定位城市,若所述搜索行為對應的目標城市為所述當前定位城市,則確定所述用戶的用戶場景為本地用戶,否則,確定所述用戶的用戶場景為異地用戶。
步驟230,針對所述用戶場景,構建所述搜索行為對應的目標城市的城市圈興趣點庫。
當確定產生搜索行為的用戶的用戶場景之后,如果用戶場景為本地用戶,則構建所述搜索行為對應的目標城市的本地用戶的城市圈興趣點庫;如果用戶場景為異地用戶,則構建所述搜索行為對應的目標城市的異地用戶的城市圈興趣點庫。所述針對所述用戶場景,構建所述搜索行為對應的目標城市的城市圈興趣點庫包括:根據(jù)用戶的歷史行為日志,按照用戶維度的城市相關性、城市維度的城市相關性,構建所述搜索行為對應的目標城市的與所述用戶場景匹配的城市圈;確定所述城市圈中各城市的滿足預設條件的所有興趣點,構成所述目標城市的城市圈興趣點庫。
具體實施時,根據(jù)用戶的歷史行為日志,按照用戶維度的城市相關性、城市維度的城市相關性,構建所述搜索行為對應的目標城市的與所述用戶場景匹配的城市圈,包括以下子步驟s1至子步驟s5。
子步驟s1:根據(jù)與所述用戶場景匹配的歷史行為日志,按照城市維度確定與所述目標城市關聯(lián)的城市的城市相關性第一得分。
根據(jù)與所述用戶場景匹配的歷史行為日志,按照城市維度確定與所述目標城市關聯(lián)的城市的城市相關性第一得分時,若用戶場景為本地用戶,則根據(jù)所述目標城市的本地用戶的歷史行為日志,按照城市維度確定與所述目標城市關聯(lián)的城市的城市相關性第一得分;若用戶場景為異地用戶,則根據(jù)所述目標城市的異地用戶的歷史行為日志,按照城市維度確定與所述目標城市關聯(lián)的城市的城市相關性第一得分。
根據(jù)與所述用戶場景匹配的歷史行為日志,按照城市維度確定與所述目標城市關聯(lián)的城市的城市相關性第一得分包括:獲取與所述用戶場景匹配的歷史行為日志中以所述目標城市作為訪問入口的預設用戶行為日志,其中,所述預設用戶行為包括:點擊和/或購買預設興趣點;根據(jù)所述預設用戶行為日志,確定每個興趣點的城市維度單一得分;按照所述興趣點所屬城市對所有興趣點的城市維度單一得分進行聚合,得到所述興趣點所屬各城市與所述目標城市的城市相關性第一得分;其中,所述用戶場景為:本地用戶或異地用戶;若所述用戶場景為本地用戶,則所述與所述用戶場景匹配的歷史行為日志為所述目標城市的本地用戶的歷史行為日志;若所述用戶場景為異地用戶,則所述與所述用戶場景匹配的歷史行為日志為所述目標城市的異地用戶的歷史行為日志。
具體實施時,用戶的歷史行為日志包括本地用戶記錄和異地用戶記錄的標識,根據(jù)所述標識可以獲取到所述目標城市的本地用戶的所有歷史行為日志或異地用戶的所有歷史行為日志。獲取目標城市的用戶歷史行為日志的具體實施方式參見現(xiàn)有技術,此處不再贅述。
下面以目標城市為城市a,城市a的用戶歷史行為日志中包括用戶u1和u2的日志,其中,用戶u1是城市a的常駐用戶,用戶u2不是城市a的常駐用戶為例,說明獲取與所述用戶場景匹配的歷史行為日志中以所述目標城市作為訪問入口的預設用戶行為日志的具體過程。假設用戶歷史行為日志包括:用戶u1從城市a的頁面進入后,購買了城市b的興趣點1;用戶u1從城市a的頁面進入后,點擊了城市b的興趣點2;用戶u2從城市a的頁面進入后,點擊了城市b的興趣點2。以應用場景為本地用戶為例,則獲取與所述用戶場景匹配的歷史行為日志中以所述目標城市作為訪問入口的預設用戶行為日志包括:用戶u1從城市a的頁面進入后,購買了城市b的興趣點1;用戶u1從城市a的頁面進入后,點擊了城市b的興趣點2。以應用場景為異地用戶為例,則獲取與所述用戶場景匹配的歷史行為日志中以所述目標城市作為訪問入口的預設用戶行為日志包括:用戶u2從城市a的頁面進入后,點擊了城市b的興趣點2。獲取與所述用戶場景匹配的歷史行為日志中以所述目標城市作為訪問入口的預設用戶行為日志的具體實施方式參見現(xiàn)有技術,此處不再贅述。
根據(jù)所述預設用戶行為日志,確定每個興趣點的城市維度單一得分時,可以通過設置有時間衰減因子的求和公式對興趣點的被操作次數(shù)(如:被點擊、購買、分享等)進行求和,將得到的和作為興趣點的城市維度單一得分。設置有時間衰減因子的求和公式舉例如下:
具體實施時,orderid(i)還可以為在當前時間之前的第i個時間段內(如將當前時間之前的一個月分為4周,每周作為一個時間段)對某一城市中某個興趣點產生的預設行為的日志。其中,所述預設行為可以為點擊、購買、推薦等用戶行為中的一項或多項。具體實施時,還可以將ai或替換為其他形式的隨i增大而逐漸減小的表達形式。
在獲取到與所述用戶場景匹配的歷史行為日志中的預設用戶行為日志之后,每條日志中記錄了產生預設用戶行為的興趣點以及產生時間,可以將每個興趣點的發(fā)生過預設用戶行為的日志加入一個集合,然后按照上述公式分別計算每個興趣點的城市維度單一得分。假設根據(jù)獲取到與所述用戶場景匹配的歷史行為日志中的預設用戶行為日志確定了5個興趣點,則可以得到5個興趣點的城市維度單一得分,如:興趣點1的poi_score1、興趣點2的poi_score2、興趣點3的poi_score3、興趣點4的poi_score4和興趣點5的poi_score5。
具體實施時,每個城市具有預設興趣點,即預先設置有興趣點和城市的對應關系。如,城市b有興趣點1、興趣點2和興趣點3;城市c有興趣點4和興趣點5。按照所述興趣點所屬城市對所有興趣點的城市維度單一得分進行聚合,得到所述興趣點所屬各城市與所述目標城市的城市相關性第一得分。例如,對興趣點1、興趣點2和興趣點3的城市維度單一得分進行聚合,得到城市b與所述目標城市a的城市相關性第一得分,如w1ab;對興趣點4和興趣點5的城市維度單一得分進行聚合,得到城市c與所述目標城市a的城市相關性第一得分,如w1ac。具體實施時,聚合方法可以為累加,或求平均值等其他現(xiàn)有技術,此處不一一例舉。
子步驟s2,根據(jù)用戶的歷史行為日志,按照用戶維度確定與所述目標城市關聯(lián)的城市的城市相關性第二得分。
根據(jù)用戶的歷史行為日志,按照用戶維度確定與所述目標城市關聯(lián)的城市的城市相關性第二得分,包括:獲取所述目標城市的常駐用戶的歷史行為日志的預設用戶行為日志,其中,所述預設用戶行為包括:點擊和/或購買預設興趣點;根據(jù)所述預設用戶行為日志,確定每個興趣點的用戶維度單一得分;按照所述興趣點所屬城市對所有興趣點的用戶維度單一得分進行聚合,得到所述興趣點所屬各城市與所述目標城市的城市相關性第二得分。
具體實施時,用戶的歷史行為日志包括用戶標識、興趣點、對興趣點的預設用戶行為、行為發(fā)生地點等。根據(jù)用戶標識可以進一步獲取用戶的常駐城市,并判斷該用戶是否為所述目標城市的常駐用戶。本申請實施例中,獲取所述目標城市的常駐用戶的歷史行為日志的預設用戶行為日志,作為計算用戶維度單一得分的依據(jù)。具體實施時,可以首先獲取所述目標城市的所有用戶常駐用戶的日志,對于某個城市來說,其常駐用戶的行為更具有代表性,并且可以有效減少數(shù)據(jù)運算量。然后,提取其中預設用戶行為(如:點擊、購買興趣點)的日志,作為計算用戶維度得分的依據(jù)。
獲取目標城市的用戶歷史行為日志的具體實施方式參見現(xiàn)有技術,此處不再贅述。
根據(jù)所述預設用戶行為日志,確定每個興趣點的用戶維度單一得分時,可以通過設置有行為加速因子的求和公式對興趣點的被操作次數(shù)(如:被點擊、購買、分享等)進行求和,將得到的和作為興趣點的用戶維度單一得分。設置有行為加速因子的求和公式舉例如下:
其中,i1和i2為每個時間周期的天數(shù),i1>i2;orderid(i)為在當前時間之前的某一個時間周期內i天中對某一城市中某個興趣點產生的預設行為(如購買和/或點擊)的日志;count()為計數(shù)函數(shù);n和m為周期的數(shù)量;a1和a2是行為加速因子,a1<a2。由以上公式可見,長周期的預設用戶行為日志,在計算某一興趣點的用戶維度單一得分時,其權重小于短周期的預設用戶行為日志。具體實施時,i1可以取值30,n可以取值3,i2可以取值7,m可以取值4。
在獲取到用戶的歷史行為日志中的預設用戶行為日志之后,每條日志中記錄了產生預設用戶行為的興趣點以及產生時間,可以將每個興趣點的發(fā)生過預設用戶行為的日志加入一個集合,然后按照上述公式分別計算每個興趣點的用戶維度得分。假設根據(jù)獲取到用戶的歷史行為日志中的預設用戶行為日志確定了5個興趣點,則可以得到5個興趣點的用戶維度得分,如:興趣點1的poi_score6、興趣點2的poi_score7、興趣點3的poi_score8、興趣點4的poi_score9和興趣點5的poi_score10。
具體實施時,每個城市具有預設興趣點,即預先設置有興趣點和城市的對應關系。如,城市b有興趣點1、興趣點2和興趣點3;城市c有興趣點4和興趣點5。按照所述興趣點所屬城市對所有興趣點的用戶維度單一得分進行聚合,得到所述興趣點所屬各城市與所述目標城市的城市相關性第二得分。例如,對興趣點1、興趣點2和興趣點3的用戶維度得分進行聚合,得到城市b與所述目標城市a的城市相關性第二得分,如w2ab;對興趣點4和興趣點5的用戶維度得分進行聚合,得到城市c與所述目標城市a的城市相關性第二得分,如w2ac。具體實施時,聚合方法可以為累加,或求平均值等其他現(xiàn)有技術,此處不一一例舉。
子步驟s3,對于每個與所述目標城市關聯(lián)的城市,將所述城市相關性第一得分和第二得分進行融合,得到與所述目標城市關聯(lián)且與所述用戶場景匹配的城市的城市相關性得分。
具體實施時,對于每個與所述目標城市關聯(lián)的城市,將所述城市相關性第一得分和第二得分進行融合,得到與所述目標城市關聯(lián)且與所述用戶場景匹配的城市的城市相關性得分,包括:對于每個與所述目標城市關聯(lián)的城市,將所述城市相關性第一得分和第二得分進行加權融合,得到與所述目標城市關聯(lián)且與所述用戶場景匹配的城市的城市相關性得分。采用加權加法融合,權重可以根據(jù)實際情況調整,比如wab=0.7×w1ab+0.3×w2ab。
具體實施時,將所述城市相關性第一得分和第二得分進行融合時,還可以結合領域知識,人工增加相關性因子。例如,對在地理和風俗上屬于一個地域概念的城市(如湘西、長三角等),可以人工增加并指定w3ab,然后根據(jù)公式wab=0.7×w1ab+0.3×w2ab+w3ab計算與所述目標城市關聯(lián)且與所述用戶場景匹配的城市的城市相關性得分。通過根據(jù)用戶設定的相關性條件增加相關性因子,可以增強城市之間的相關性,便于基于用戶設定的相關性推薦興趣點。
子步驟s4,將大于預設相關性得分閾值的所述城市相關性得分對應的城市,作為所述目標城市的與所述用戶場景匹配的城市圈的備選城市。
具體實施時,可以預設一個相關性得分閾值,當計算得到的與所述目標城市關聯(lián)的城市的城市相關性得分大于所述預設相關性得分閾值時,確定該城市為所述目標城市的城市圈中的城市。所述相關性得分閾值根據(jù)具體需求確定,可以設置為大于或等于0的數(shù)值。
確定的所述目標城市的城市圈的備選城市通常包括多個關聯(lián)城市。如圖3所示,對于城市a,其城市圈300中的城市包括城市:b、c、d和e。
子步驟s5,將與所述目標城市的距離滿足預設距離閾值的所述備選城市,構成所述目標城市的與所述用戶場景匹配的城市圈。
具體實施時,所述預設距離閾值為根據(jù)用戶需求定義的需求半徑,如1公里。通過根據(jù)所述城市圈中的城市與所述目標城市的距離過濾掉一部分與所述目標城市較遠的城市,可以在滿足用戶需求半徑的前提下,減小運算量,提高召回興趣點的準確性。假設計算得到了城市a和城市b、c、d和e的城市相關性得分分別為wab、wac、wad和wae,都大于預設相關性得分閾值,城市a和城市b、c、d和e之間距離分別為dab、dac、dad和dae。如果dab、dac、dad和dae小于或等于預設距離閾值,則城市a的城市圈包括的城市為:城市a、b、c、d和e。如果dae大于預設距離閾值,則城市a的城市圈包括的城市為:城市a、b、c和d。
具體實施時,所述預設距離閾值也可以為一個距離范圍,如10公里至100公里之內。
確定的所述目標城市的城市圈通常包括多個與所述目標城市關聯(lián)的城市。在確定所述目標城市的城市圈之后,進一步確定所述城市圈中各城市的滿足預設條件的所有興趣點,構成所述目標城市的城市圈興趣點庫。
具體實施時,所述用戶場景包括:本地用戶或異地用戶。所述確定所述城市圈中各城市的滿足預設條件的所有興趣點,構成所述目標城市的城市圈興趣點庫,包括:若所述用戶場景為本地用戶,則確定所述目標城市的本地用戶的發(fā)生過預設用戶行為的興趣點、以所述目標城市作為訪問入口且發(fā)生過預設用戶行為的城市圈中除所述目標城市外的其他城市的興趣點,以及預設時間段內所述城市圈中各城市的熱門興趣點;若所述用戶場景為異地用戶,則確定所述目標城市的異地用戶的發(fā)生過預設用戶行為的興趣點、以所述目標城市作為訪問入口且發(fā)生過預設用戶行為的城市圈中除所述目標城市外的其他城市的興趣點,以及預設時間段內所述城市圈中各城市的熱門興趣點;其中,所述預設用戶行為包括:點擊和/或購買預設興趣點。
以所述目標城市為城市a,其城市圈中的城市包括城市:a、b、c、d為例,說明確定所述城市圈中各城市的滿足預設條件的所有興趣點,構成所述目標城市的城市圈興趣點庫的具體方法。
如果所述用戶場景為本地用戶,則將城市a中的本地用戶興趣點中,發(fā)生過預設用戶行為(如:點擊和/或購買)的興趣點加入所述目標城市a的城市圈興趣點庫;然后,再分別將城市b、c、d和e中的發(fā)生過以城市a作為訪問入口的預設用戶行為(如:點擊和/或購買)的興趣點加入所述目標城市a的城市圈興趣點庫。
為了豐富召回的興趣點,在將根據(jù)所述用戶的歷史行為日志確定的發(fā)生過預設用戶行為的興趣點加入城市圈興趣點庫之后,進一步將預設時間段內所述城市圈中各城市的熱門興趣點(如銷量最高的興趣點)加入所述城市圈興趣點庫。
如果所述用戶場景為異地用戶,則將城市a中的異地用戶興趣點中,發(fā)生過預設用戶行為(如:點擊和/或購買)的興趣點加入所述目標城市a的城市圈興趣點庫;然后,再分別將城市b、c、d和e中的發(fā)生過以城市a作為訪問入口的預設用戶行為(如:以城市a作為訪問入口,并執(zhí)行點擊和/或購買操作)的興趣點加入所述目標城市a的城市圈興趣點庫。
同樣,為了豐富召回的興趣點,進一步將預設時間段內所述城市圈中各城市的熱門興趣點(如銷量最高的興趣點)加入所述目標城市a的所述城市圈興趣點庫。
具體實施時,還可以先根據(jù)用戶的歷史行為日志,按照用戶維度確定與所述目標城市關聯(lián)的城市的城市相關性第二得分,再根據(jù)與所述用戶場景匹配的歷史行為日志,按照城市維度確定與所述目標城市關聯(lián)的城市的城市相關性第一得分,本申請對子步驟s1和子步驟s2的具體執(zhí)行順序不做限定。
步驟240,基于預設模型,對所述城市圈興趣點庫中的興趣點進行混合排序并召回。
具體實施時,前述步驟生成的本地用戶的城市圈興趣點庫或異地用戶的城市圈興趣點庫中包括多個興趣點。具體實施時,基于預設模型,對所述城市圈興趣點庫中的興趣點進行混合排序并召回,包括:對于所述城市圈興趣點庫中每個興趣點,分別通過預設模型獲取相應模型的排序得分;對于所述城市圈興趣點庫中每個興趣點,對通過各模型獲取的排序得分進行綜合,得到該興趣點的混合排序得分;按照所述混合排序得分對所述城市圈興趣點庫中的興趣點進行排序,并召回;其中,所述預設模型包括:點擊率預估模型、至少兩個不同周期的訪購率預估模型;所述訪購率預估模型根據(jù)設定長度周期內的興趣點購買日志訓練得到,用于預測興趣點的購買率。本申請是實施例中,以所述預設模型包括點擊率預估模型、短期訪購率預估模型和長期訪購率預估模型為例。
例如,在根據(jù)用戶場景和目標城市確定了需要為本次搜索行為返回城市a的城市圈興趣點庫之后,需要對城市a城市圈興趣點庫中的所有興趣點進行排序。假設城市a的本地用戶城市圈興趣點庫包括:城市a的興趣點1、城市a的興趣點2、城市b的興趣點3、城市b的興趣點4、城市c的興趣點5、城市d的興趣點6和城市e的興趣點7。對于興趣點1,首先,分別通過預設的點擊率預估模型、短期訪購率預估模型和長期訪購率預估模型獲取相應模型的排序得。即,通過預設的點擊率預估模型獲得點擊率預估排序得分score1,通過短期訪購率預估模型獲得短期訪購率預估排序得分score2,通過長期訪購率預估模型獲得長期訪購率預估排序得分score3。然后,對通過各模型獲取的排序得分進行綜合,得到該興趣點的混合排序得分。例如,對各模型得到的排序得分加權求和,或者根據(jù)公式
按照前述方法,可以分別獲得興趣點1至7的混合排序的分。最后,按照所述混合排序得分對所述城市圈興趣點庫中的興趣點進行排序,并召回。
在通過每個預設模型獲得相應的模型得分時,需要提取各興趣點的預設特征。提取的特征包括但不限于以下四個維度:用戶維度、興趣點質量維度、交互維度和上下文維度。其中,用戶維度進一步包括:用戶標簽、價格/品類/地理偏好、基于poi-cf(興趣點協(xié)同過濾)的推薦特征等子維度;興趣點質量維度進一步包括:興趣點的銷量、點擊、評論、價格、轉化率等子維度;交互維度進一步包括:用戶過去第一周期/第二周期/第三周期內是否點擊/購買/收藏過該興趣點子維度;上下文維度進一步包括:當前搜索行為的時間、城市、天氣、與所述目標城市的距離等子維度。其中,用戶標簽用于區(qū)分本地用戶興趣點或異地用戶興趣點。興趣點質量維度中的特征區(qū)分本地用戶興趣點和異地用戶興趣點。其中,第一周期可以為7天,第二周期可以為30天,第三周期可以為90天。
具體實施時,點擊率預估模型、短期訪購率預估模型和長期訪購率預估模型分別首先從當前興趣點中提取預設特征,構成特征向量。以點擊率預估模型h為例,模型h在獲取某一興趣點的點擊率預估得分時,首先提取興趣點的預設特征,構成特征向量如(f10,f11,f12,f20,f21,f30,...,f40,f41,...),所述預設特征包括上述四個維度的特征向量;然后,模型h根據(jù)提取的特征計算當前興趣點的點擊率預估模型對應的排序得分。
從興趣點中提取相應特征的方法,以及提取后的各維度特征組合為該興趣點的整體特征的方法與訓練各模型時,從訓練樣本中提取特征以及組合特征的方法相同,此處不再贅述。
通過利用不同周期的訪購率預估模型計算各興趣點的排序得分以便用于混合排序,實現(xiàn)了結合興趣點的需求具有周期性和季節(jié)性的特點進行興趣點召回,使召回結果更符合用戶需求,進一步提升了用戶體驗。通過短周期模型可以提升應季變化的感知能力,通過長周期模型提升興趣點召回效果的穩(wěn)定性。在o2o消費領域,結合點擊率預估模型和訪購率預測模型進行排序的分計算,以達到用戶興趣挖掘與最終需求滿足間的平衡。
本申請實施例公開的興趣點搜索方法,通過預先訓練點擊率預估模型和多個不同周期的訪購率預估模型,并在獲取到用戶的搜索行為之后,確定產生搜索行為的用戶的用戶場景,并針對所述用戶場景,構建所述搜索行為對應的目標城市的城市圈興趣點庫,然后,基于預設模型,對所述城市圈興趣點庫中的興趣點進行混合排序并召回,解決了現(xiàn)有技術中存在的搜索過程中召回的興趣點不豐富的問題。通過構建城市圈興趣點庫有效地豐富了召回的興趣點,同時,通過區(qū)分用戶場景,提高了召回興趣點的準確性。
通過結合點擊率預估模型和多個不同周期的訪購率預估模型計算的興趣點的排序得分對興趣點進行混合排序,實現(xiàn)了結合興趣點的需求具有周期性和季節(jié)性的特點進行興趣點召回,使召回結果更符合用戶需求,進一步提升了用戶體驗。
實施例三
本實施例公開的一種興趣點搜索裝置,如圖4所示,該裝置包括:
用戶場景確定模塊400,用于確定產生搜索行為的用戶的用戶場景;
城市圈興趣點庫構建模塊410,用于針對所述用戶場景確定模塊400確定的用戶場景,構建所述搜索行為對應的目標城市的城市圈興趣點庫;
混合排序模塊420,用于基于預設模型,對所述城市圈興趣點庫構建模塊410構建的城市圈興趣點庫中的興趣點進行混合排序并召回。
本申請的實施中,用戶場景包括本地用戶、異地用戶。具體實施時,所述用戶場景確定模塊400具體用于:確定產生搜索行為的用戶的常駐城市或當前定位城市;若所述搜索行為對應的目標城市為所述常駐城市或當前定位城市,則確定所述用戶的用戶場景為本地用戶,否則,確定所述用戶的用戶場景為異地用戶。
可選的,如圖5所示,所述城市圈興趣點庫構建模塊410包括:
城市圈構建單元4101,用于根據(jù)用戶的歷史行為日志,按照用戶維度的城市相關性、城市維度的城市相關性,構建所述搜索行為對應的目標城市的與所述用戶場景匹配的城市圈;
城市圈興趣點庫構建單元4102,用于確定所述城市圈中各城市的滿足預設條件的所有興趣點,構成所述目標城市的城市圈興趣點庫。
可選的,如圖5所示,所述城市圈構建單元4101包括:
城市維度得分確定子單元41011,用于根據(jù)與所述用戶場景匹配的歷史行為日志,按照城市維度確定與所述目標城市關聯(lián)的城市的城市相關性第一得分;以及,
用戶維度得分確定子單元41012,用于根據(jù)用戶的歷史行為日志,按照用戶維度確定與所述目標城市關聯(lián)的城市的城市相關性第二得分;
得分融合子單元41013,用于對于每個與所述目標城市關聯(lián)的城市,將所述城市相關性第一得分和第二得分進行融合,得到與所述目標城市關聯(lián)且與所述用戶場景匹配的城市的城市相關性得分;
關聯(lián)城市確定子單元41014,用于將大于預設相關性得分閾值的所述城市相關性得分對應的城市,作為所述目標城市的與所述用戶場景匹配的城市圈的備選城市;
城市圈構建子單元41015,用于將與所述目標城市的距離滿足預設距離閾值的所述備選城市,構成所述目標城市的與所述用戶場景匹配的城市圈。
可選的,所述城市維度得分確定子單元41011,具體用于:
獲取與所述用戶場景匹配的歷史行為日志中以所述目標城市作為訪問入口的預設用戶行為日志,其中,所述預設用戶行為包括:點擊和/或購買預設興趣點;
根據(jù)所述預設用戶行為日志,確定每個興趣點的城市維度單一得分;
按照所述興趣點所屬城市對所有興趣點的城市維度單一得分進行聚合,得到所述興趣點所屬各城市與所述目標城市的城市相關性第一得分;
其中,所述用戶場景為:本地用戶或異地用戶;若所述用戶場景為本地用戶,則所述與所述用戶場景匹配的歷史行為日志為所述目標城市的本地用戶的歷史行為日志;若所述用戶場景為異地用戶,則所述與所述用戶場景匹配的歷史行為日志為所述目標城市的異地用戶的歷史行為日志。
可選的,所述用戶維度得分確定子單元41012,具體用于:
獲取所述目標城市的常駐用戶的歷史行為日志的預設用戶行為日志,其中,所述預設用戶行為包括:點擊和/或購買預設興趣點;
根據(jù)所述預設用戶行為日志,確定每個興趣點的用戶維度單一得分;
按照所述興趣點所屬城市對所有興趣點的用戶維度單一得分進行聚合,得到所述興趣點所屬各城市與所述目標城市的城市相關性第二得分。
可選的,所述用戶場景包括:本地用戶或異地用戶,所述城市圈興趣點庫構建單元4102,具體用于:
若所述用戶場景為本地用戶,則確定所述目標城市的本地用戶的發(fā)生過預設用戶行為的興趣點、以所述目標城市作為訪問入口且發(fā)生過預設用戶行為的城市圈中除所述目標城市外的其他城市的興趣點,以及預設時間段內所述城市圈中各城市的熱門興趣點;
若所述用戶場景為異地用戶,則確定所述目標城市的異地用戶的發(fā)生過預設用戶行為的興趣點、以所述目標城市作為訪問入口且發(fā)生過預設用戶行為的城市圈中除所述目標城市外的其他城市的興趣點,以及預設時間段內所述城市圈中各城市的熱門興趣點;
其中,所述預設用戶行為包括:點擊和/或購買預設興趣點。
可選的,所述混合排序模塊420,具體用于:
對于所述城市圈興趣點庫中每個興趣點,分別通過預設模型獲取相應模型的排序得分;
對于所述城市圈興趣點庫中每個興趣點,對通過各模型獲取的排序得分進行綜合,得到該興趣點的混合排序得分;
按照所述混合排序得分對所述城市圈興趣點庫中的興趣點進行排序,并召回;
其中,所述預設模型至少包括:點擊率預估模型、至少兩個不同周期的訪購率預估模型;所述訪購率預估模型根據(jù)設定長度周期內的興趣點購買日志訓練得到,用于預測興趣點的購買率。
本實施例公開的興趣點搜索裝置的各模塊、單元和子單元的具體實施方式參見方法實施例中的相關步驟,此處不再贅述。
本申請實施例公開的興趣點搜索裝置,通過在獲取到用戶的搜索行為之后,確定產生搜索行為的用戶的用戶場景,并針對所述用戶場景,構建所述搜索行為對應的目標城市的城市圈興趣點庫,然后,基于預設模型,對所述城市圈興趣點庫中的興趣點進行混合排序并召回,解決了現(xiàn)有技術中存在的搜索過程中召回的興趣點不豐富的問題。通過構建城市圈興趣點庫有效地豐富了召回的興趣點,同時,通過區(qū)分用戶場景,提高了召回興趣點的準確性。
通過結合點擊率預估模型和多個不同周期的訪購率預估模型計算的興趣點的排序得分對興趣點進行混合排序,實現(xiàn)了結合興趣點的需求具有周期性和季節(jié)性的特點進行興趣點召回,使召回結果更符合用戶需求,進一步提升了用戶體驗。
本申請還公開了一種電子設備,包括存儲器、處理器及存儲在所述存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述計算機程序時實現(xiàn)本申請實施例一和實施例二所述的興趣點搜索方法。所述電子設備可以為pc機、移動終端、個人數(shù)字助理、平板電腦等。
本申請還公開了一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執(zhí)行時實現(xiàn)如本申請實施例一和實施例二所述的興趣點搜索方法的步驟。
本說明書中的各個實施例均采用遞進的方式描述,每個實施例重點說明的都是與其他實施例的不同之處,各個實施例之間相同相似的部分互相參見即可。對于裝置實施例而言,由于其與方法實施例基本相似,所以描述的比較簡單,相關之處參見方法實施例的部分說明即可。
以上對本申請?zhí)峁┑囊环N興趣點搜索方法及裝置,進行了詳細介紹,本文中應用了具體個例對本申請的原理及實施方式進行了闡述,以上實施例的說明只是用于幫助理解本申請的方法及其核心思想;同時,對于本領域的一般技術人員,依據(jù)本申請的思想,在具體實施方式及應用范圍上均會有改變之處,綜上所述,本說明書內容不應理解為對本申請的限制。
通過以上的實施方式的描述,本領域的技術人員可以清楚地了解到各實施方式可借助軟件加必需的通用硬件平臺的方式來實現(xiàn),當然也可以通過硬件實現(xiàn)?;谶@樣的理解,上述技術方案本質上或者說對現(xiàn)有技術做出貢獻的部分可以以軟件產品的形式體現(xiàn)出來,該計算機軟件產品可以存儲在計算機可讀存儲介質中,如rom/ram、磁碟、光盤等,包括若干指令用以使得一臺計算機設備(可以是個人計算機,服務器,或者網(wǎng)絡設備等)執(zhí)行各個實施例或者實施例的某些部分所述的方法。