動(dòng)態(tài)重復(fù)行為的預(yù)測(cè)方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及計(jì)算機(jī)數(shù)據(jù)處理技術(shù)領(lǐng)域,特別是設(shè)及一種動(dòng)態(tài)重復(fù)行為的預(yù)測(cè)方 法。
【背景技術(shù)】
[0002] 重復(fù)性行為在人們的日常生活中十分的普遍,例如人們時(shí)常重復(fù)地聽(tīng)自己喜愛(ài)的 音樂(lè),到熟悉的餐館吃飯,去同一個(gè)社交網(wǎng)站中瀏覽信息等等。對(duì)人們的重復(fù)性行為進(jìn)行分 析和預(yù)測(cè)有助于我們進(jìn)一步了解用戶的行為模式,進(jìn)而為用戶提供個(gè)性化的服務(wù),同時(shí),也 能有利于資源的有效利用。例如,若一種方法能為餐館或商場(chǎng)預(yù)測(cè)出其每一位顧客是否會(huì) 在短期內(nèi)再次前來(lái)就餐或購(gòu)物,那么該些餐館或商場(chǎng)就可W贈(zèng)送給他們更多的優(yōu)惠券,W 促進(jìn)消費(fèi)。又例如,若一個(gè)音樂(lè)推薦系統(tǒng)能預(yù)測(cè)出其用戶接下來(lái)是否會(huì)重聽(tīng)一首該用戶不 久前剛聽(tīng)過(guò)的歌曲,那么該個(gè)音樂(lè)推薦系統(tǒng)就能更有效的生成推薦結(jié)果,提升用戶的滿意 度。
[0003] 然而遺憾的是,目前尚未有公開(kāi)的、已知的、能直接預(yù)測(cè)用戶在某一給定的時(shí)刻下 是否會(huì)執(zhí)行一次重復(fù)行為的方法?,F(xiàn)有的、已公開(kāi)的關(guān)于用戶的重復(fù)行為的研究工作基本 上都局限在某一小領(lǐng)域中,例如分析餐館食物的味道與用戶再次品嘗的關(guān)系等等。該類研 究主要W分析為主,不能進(jìn)行預(yù)測(cè),同時(shí),該些研究工作過(guò)于局限,不能用于更廣泛的、普適 的用戶重復(fù)行為研究中,例如不能直接應(yīng)用于用戶重復(fù)聽(tīng)某些歌曲、重復(fù)訪問(wèn)某個(gè)網(wǎng)站等 問(wèn)題中。
[0004] 因此,目前需要本領(lǐng)域技術(shù)人員迫切解決的一個(gè)技術(shù)問(wèn)題就是:如何能夠創(chuàng)新地 提出一種有效方法,W滿足實(shí)際應(yīng)用中的更多需求,創(chuàng)造更多的應(yīng)用價(jià)值。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明所要解決的技術(shù)問(wèn)題是提供一種動(dòng)態(tài)重復(fù)行為的預(yù)測(cè)方法,能夠預(yù)測(cè)出每 一位用戶在給定的時(shí)間附近是否會(huì)執(zhí)行一次重復(fù)行為。
[0006] 為了解決上述技術(shù)問(wèn)題,本發(fā)明實(shí)施例公開(kāi)了一種動(dòng)態(tài)重復(fù)行為的預(yù)測(cè)方法,包 括:
[0007] 獲取用戶對(duì)物品的使用行為數(shù)據(jù);
[000引提取用戶和物品行為特征;
[0009] 依據(jù)所提取的行為特征生成訓(xùn)練數(shù)據(jù)集;
[0010] 通過(guò)線性擬合的方式,估算參數(shù)向量,使得訓(xùn)練數(shù)據(jù)集中每個(gè)向量與該參數(shù)向量 的乘積分別接近各自對(duì)應(yīng)的判定的標(biāo)準(zhǔn)值;
[0011] 給出判定結(jié)果,依據(jù)判定結(jié)果預(yù)測(cè)重復(fù)行為。
[0012] 優(yōu)選的,所述用戶行為特征包括動(dòng)態(tài)的窗口的特征和用戶重用率。
[0013] 優(yōu)選的,所述物品行為特征包括物品重用率和物品流行度。
[0014] 優(yōu)選的,所述用戶對(duì)物品的使用行為為重復(fù)聽(tīng)歌行為。
[0015] 與現(xiàn)有技術(shù)相比,本發(fā)明具有W下優(yōu)點(diǎn):
[0016] 本發(fā)明從用戶近期對(duì)物品的使用行為歷史記錄中抽取出重要的行為特征,并根據(jù) 該些行為特征預(yù)測(cè)該用戶在下一個(gè)行為時(shí)刻是否會(huì)執(zhí)行一次重復(fù)行為。本發(fā)明方法的實(shí)施 不依賴于具體的應(yīng)用場(chǎng)景和領(lǐng)域,具有較高的普適性,能幫助理解用戶的行為模式,并進(jìn)而 為用戶提供更加個(gè)性化的服務(wù),實(shí)現(xiàn)資源的有效配置。
【附圖說(shuō)明】
[0017] 圖1是本發(fā)明的一種動(dòng)態(tài)重復(fù)行為的預(yù)測(cè)方法實(shí)施例的流程示意圖;
[0018] 圖2是【具體實(shí)施方式】中提到的方法實(shí)施的流程圖;
[0019] 圖3是【具體實(shí)施方式】中提到的滑動(dòng)窗口及其滑動(dòng)的過(guò)程示意圖;
[0020] 圖4是【具體實(shí)施方式】中提到的預(yù)測(cè)用戶是否會(huì)在某一時(shí)刻再次聽(tīng)某首不久前剛 聽(tīng)過(guò)的歌曲為例進(jìn)行詳細(xì)說(shuō)明的示意圖。
【具體實(shí)施方式】
[0021] 為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí) 施方式對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說(shuō)明。
[0022] 參見(jiàn)圖1,本方案所述的一種動(dòng)態(tài)重復(fù)行為的預(yù)測(cè)方法的流程示意圖,具體包括:
[0023] 步驟S101,獲取用戶對(duì)物品的使用行為數(shù)據(jù);
[0024] 步驟S102,提取用戶和物品行為特征;
[0025] 步驟S103,依據(jù)所提取的行為特征生成訓(xùn)練數(shù)據(jù)集;
[0026] 步驟S104,通過(guò)線性擬合的方式,估算參數(shù)向量,使得訓(xùn)練數(shù)據(jù)集中每個(gè)向量與該 參數(shù)向量的乘積分別接近各自對(duì)應(yīng)的判定的標(biāo)準(zhǔn)值;
[0027] 步驟S105,給出判定結(jié)果,依據(jù)判定結(jié)果預(yù)測(cè)重復(fù)行為。
[002引為使本發(fā)明的方案便于理解和實(shí)現(xiàn)對(duì)技術(shù)做更為具體的介紹,方案實(shí)現(xiàn)是基于對(duì) 用戶的動(dòng)態(tài)重復(fù)行為的預(yù)測(cè)方法,包括W下具體的實(shí)施步驟:
[0029] (1)本發(fā)明通過(guò)抽取用戶近期的行為特征,并結(jié)合由機(jī)器學(xué)習(xí)方法得到線性和二 次判別函數(shù),來(lái)預(yù)測(cè)用戶在當(dāng)前時(shí)刻是否會(huì)重復(fù)執(zhí)行一次近期完成過(guò)的行為;
[0030] (2)參見(jiàn)圖2為本發(fā)明方法實(shí)施包括5個(gè)主要的實(shí)施階段示意圖;
[0031] (3)階段1,獲取用戶使用物品的行為數(shù)據(jù),設(shè)獲取到M位用戶對(duì)N個(gè)物品的使用 行為數(shù)據(jù),記用戶集合為11={111,112,''',%},物品集合為¥={¥1,¥2,''',¥^,集合11和集合 V中每一個(gè)元素分別表示唯一的一個(gè)用戶和一個(gè)物品,記Hu= {xu,i,Xu,2,…}表示用戶U的 原始的使用行為數(shù)據(jù)按其發(fā)生的時(shí)間的升序排列的列表,其中的任一元素表示用戶U 的第i次使用行為,并且V,對(duì)任意的i<j,滿足行為的發(fā)生時(shí)間早于行為Xuj的 發(fā)生時(shí)間;
[0032] (4)定義滑動(dòng)窗口大小W,該值表示在對(duì)用戶行為進(jìn)行分析時(shí),每次將按時(shí)間順序 排列的連續(xù)的W次用戶行為作為一個(gè)整體來(lái)分析,W取值自定義,如10、50、100等;
[003引 妨階段2中分別按步驟做和步驟做對(duì)V中的每個(gè)物品提取物品流行度和物 品重用率兩種特征,按步驟(10)對(duì)U中的每個(gè)用戶分別提取用戶重用率特征;
[0034] (6)分別遍歷每個(gè)用戶U的使用行為列表Hu,為每個(gè)物品V分別統(tǒng)計(jì)其被使用的 次數(shù),記為f (V),通過(guò)比較f (V)值大小,獲取V中各物品出現(xiàn)次數(shù)的最大值,記為fm",然后 計(jì)算V中各物品的歸一化的流行度,記V的物品流行度為:P〇) = 1 就只(U)) ;
[0035] (7)為V中每個(gè)物品V初始化其觀測(cè)次數(shù)c(v) =0,重用次數(shù)r(v) =0,為U中的 每個(gè)用戶U初始化其觀測(cè)次數(shù)C (U) = 0,重用次數(shù)r (U) = 0 ;
[0036] 做抽取物品重用率特征包含W下子步驟:
[0037] a.將U中所有用戶均標(biāo)記為"未訪問(wèn)"狀態(tài),然后執(zhí)行子步驟b);
[003引 b.創(chuàng)建一個(gè)大小為W的空的滑動(dòng)窗口 W,然后執(zhí)行子步驟C);
[0039] C.若U中所有用戶均標(biāo)記為"已訪問(wèn)"狀態(tài),則執(zhí)行子步驟f),否則,從U中選取 一個(gè)標(biāo)記為"未訪問(wèn)"狀態(tài)的用戶U,將U重新標(biāo)記為"已訪問(wèn)"狀態(tài),按時(shí)間升序遍歷U的 使用行為列表Hu,將Hu的前W次用戶行為添加入滑動(dòng)窗口 W中,然后執(zhí)行子步驟d);
[0040] d.判斷Hu中在W之后是否還有更新的用戶行為,若沒(méi)有,則執(zhí)行子步驟b),若有, 則記Hu中在W之后的第一次用戶行為為X,行為X使用的物品為V,將物品V的觀測(cè)次數(shù)加 1,C (V) = C (V) +1,比較物品V與W中現(xiàn)有的各物品,若物品V存在于W中,則X是一次重復(fù) 行為,并將物品V的重用次數(shù)加1,r (V) = r (V) +1,否則,X不是一次重復(fù)行為,不修改r (V) 的值,在任意情況下,均執(zhí)行子步驟e);
[0041] e.將行為X添加入滑動(dòng)窗口 W中,并將W中發(fā)生時(shí)間最早的一次行為從W中刪除, 即W按時(shí)間升序在Hu上向前"滑動(dòng)"了一步,然后返回執(zhí)行子步驟d);
[0042] f.計(jì)算V中各物品的重用率特征,物品V的物品重用率為;rvO)二此處, 也可W按:ru〇)二log(l + ^)來(lái)計(jì)算物品V的物品重用率特征,但在同一個(gè)數(shù)據(jù)集合 中,必須使用同一種計(jì)算方式;
[0043] (9)附圖3顯示了在W = 3的情況下,滑動(dòng)窗口及其滑動(dòng)的過(guò)程,例如在開(kāi)始階段, 僅用戶行為Xu,i、Xu,2、Xu,3被添加入滑動(dòng)窗口 W中,考察行為Xu,4使用的物品是否在行為Xu,i、 中被使用過(guò),判斷是否為重用行為,并更新對(duì)應(yīng)的c(v)和r(v)的值,而在連續(xù)地將 W向前滑動(dòng)4次之后,W中包含的行為為義。,5、義。,6、義。^,此時(shí),《后已無(wú)用戶行為,則停止滑動(dòng) W ;
[0044] (10)抽取用戶重用率特征包含W下子步驟:
[0045] a.將U中所有用戶均標(biāo)記為"未訪問(wèn)"狀態(tài),執(zhí)行子步驟b);
[0046] b.創(chuàng)建一個(gè)大小為W的空的滑動(dòng)窗口 W,執(zhí)行子步驟C);
[0047] C.若U中所有用戶均標(biāo)記為"已訪問(wèn)"狀態(tài),則結(jié)束循環(huán),否則,從U中選取一個(gè)標(biāo) 記為"未訪問(wèn)"狀態(tài)的用戶U,將U重新標(biāo)記為"已訪問(wèn)"狀態(tài),按時(shí)間升序遍歷U的使用行 為列表Hu,將Hu的前W次用戶行為添加入滑動(dòng)窗口 W中,然后執(zhí)行子步驟d);
[0048] d.判斷Hu中在W之后是否還有更新的用戶行為,若沒(méi)有,則計(jì)算用戶U的重用率 特征,U的用戶重用率為;ru〇.)二然后返回執(zhí)行子步驟b),若有,則記Hu上在W之后 的第一次用戶行為為X,行為X使用的物品為V,將用戶U的觀測(cè)次數(shù)加1,C (U) = C (U)+1, 比較物品V與W中現(xiàn)有的各物品,若物品V存在于W中,則X是一次重復(fù)行為,將用戶U的 重用次數(shù)加l,r(u) =r(u)+l,否則,X不是一次重復(fù)行為,不修改r(u)的值,任意情況下, 均執(zhí)行子步驟e);
[0049] e.將行為X添加入滑動(dòng)窗口 W中,并將W中發(fā)生時(shí)間最早的一次行為刪除,即W按 時(shí)間升序在Hu上向前"滑動(dòng)"一步,然后返回執(zhí)行子步驟d);
[0050] (11)階段3,生成訓(xùn)練數(shù)據(jù)集T包含W下子步驟:
[0051] a.創(chuàng)建空的訓(xùn)練集集合T = {},執(zhí)行子步驟b);
[0052] b.將U中所有用戶均標(biāo)記為"未訪問(wèn)"狀態(tài),執(zhí)行子步驟C);
[0化3] C.創(chuàng)建一個(gè)大小為W的空的滑動(dòng)窗口 W,執(zhí)行子步驟d);
[0054] d.若U中所有用戶均標(biāo)記為"已訪問(wèn)"狀態(tài),則結(jié)束循環(huán),否則,從U中選取一個(gè)標(biāo) 記為"未訪問(wèn)"狀態(tài)的用戶U,將U重新標(biāo)記為"已訪問(wèn)"狀態(tài),按時(shí)間升序遍歷U的使用行 為列表Hu,將Hu的前W次用戶行為添加入滑動(dòng)窗口 W中,然后執(zhí)行子步驟e);
[0化5] e.計(jì)算W中使用過(guò)的物品的平均物品流行度、平均物品重用率,分別記 為
【主權(quán)項(xiàng)】
1. 一種動(dòng)態(tài)重復(fù)行為的預(yù)測(cè)方法,其特征在于,包括: 獲取用戶對(duì)物品的使用行為數(shù)據(jù); 提取用戶和物品行為特征; 依據(jù)所提取的行為特征生成訓(xùn)練數(shù)據(jù)集; 通過(guò)線性擬合的方式,估算參數(shù)向量,使得訓(xùn)練數(shù)據(jù)集中每個(gè)向量與該參數(shù)向量的乘 積分別接近各自對(duì)應(yīng)的判定的標(biāo)準(zhǔn)值; 給出判定結(jié)果,依據(jù)判定結(jié)果預(yù)測(cè)重復(fù)行為。
2. 如權(quán)利要求1所述的動(dòng)態(tài)重復(fù)行為的預(yù)測(cè)方法,其特征在于,所述用戶行為特征包 括動(dòng)態(tài)的窗口的特征和用戶重用率。
3. 如權(quán)利要求1所述的動(dòng)態(tài)重復(fù)行為的預(yù)測(cè)方法,其特征在于,所述物品行為特征包 括物品重用率和物品流行度。
4. 如權(quán)利要求1所述的動(dòng)態(tài)重復(fù)行為的預(yù)測(cè)方法,其特征在于,所述用戶對(duì)物品的使 用行為為重復(fù)聽(tīng)歌行為。
【專利摘要】本發(fā)明公開(kāi)一種動(dòng)態(tài)重復(fù)行為的預(yù)測(cè)方法,涉及計(jì)算機(jī)數(shù)據(jù)處理技術(shù)領(lǐng)域,包括:獲取用戶對(duì)物品的使用行為數(shù)據(jù);提取用戶和物品行為特征;依據(jù)所提取的行為特征生成訓(xùn)練數(shù)據(jù)集;通過(guò)線性擬合的方式,估算參數(shù)向量,使得訓(xùn)練數(shù)據(jù)集中每個(gè)向量與該參數(shù)向量的乘積分別接近各自對(duì)應(yīng)的判定的標(biāo)準(zhǔn)值;給出判定結(jié)果,依據(jù)判定結(jié)果預(yù)測(cè)重復(fù)行為。本發(fā)明所要解決的技術(shù)問(wèn)題是提供一種動(dòng)態(tài)重復(fù)行為的預(yù)測(cè)方法,能夠預(yù)測(cè)出每一位用戶在給定的時(shí)間附近是否會(huì)執(zhí)行一次重復(fù)行為。
【IPC分類】G06F19-00
【公開(kāi)號(hào)】CN104537272
【申請(qǐng)?zhí)枴緾N201510030482
【發(fā)明人】王朝坤, 陳俊
【申請(qǐng)人】清華大學(xué)
【公開(kāi)日】2015年4月22日
【申請(qǐng)日】2015年1月21日