用戶覆蓋量信息的提示方法及裝置制造方法
【專利摘要】本申請(qǐng)公開了用戶覆蓋量信息的提示方法及裝置,所述方法包括:獲取基礎(chǔ)數(shù)據(jù);按照各類目在類目序列中排序距離的不同對(duì)類目進(jìn)行分類;將同一子序列中的類目劃分為多個(gè)類目組合,計(jì)算各個(gè)類目組合相對(duì)于前一個(gè)類目組合的用戶覆蓋量增長率;根據(jù)同一子序列中得到的各個(gè)用戶覆蓋量增長率以及預(yù)置的函數(shù)格式,得到對(duì)應(yīng)排序距離下的擬合函數(shù);當(dāng)信息投放方選擇了目標(biāo)關(guān)鍵詞后,映射為系統(tǒng)中的多個(gè)目標(biāo)類目,計(jì)算各個(gè)目標(biāo)組合的排序距離;分別利用各自對(duì)應(yīng)的擬合函數(shù),預(yù)估出目標(biāo)類目組合的累積用戶覆蓋量,以便提供給信息投放方。通過本申請(qǐng),能夠降低計(jì)算量,并解決同一用戶在不同的類目中重復(fù)出現(xiàn)的問題。
【專利說明】用戶覆蓋量信息的提不方法及裝置
【技術(shù)領(lǐng)域】
[0001] 本申請(qǐng)涉及興趣點(diǎn)定向投放信息過程中的信息提示【技術(shù)領(lǐng)域】,特別是涉及用戶覆 蓋量信息的提示方法及裝置。
【背景技術(shù)】
[0002] 在一些互聯(lián)網(wǎng)業(yè)務(wù)平臺(tái)中,經(jīng)常有信息投放方向業(yè)務(wù)平臺(tái)的網(wǎng)頁中投放一些特定 信息,以期該網(wǎng)頁被用戶關(guān)注的同時(shí),這些特定信息也能被關(guān)注到,甚至被點(diǎn)擊,導(dǎo)入到信 息投放方自己的頁面為其帶來流量。最初,同一網(wǎng)頁中投放的特定信息一般是固定的,然而 對(duì)于大型業(yè)務(wù)平臺(tái)而言,其用戶(瀏覽者)數(shù)量眾多,對(duì)于同一個(gè)網(wǎng)頁的不同訪問用戶而 言,用戶關(guān)注的點(diǎn)可能是不同的。例如,對(duì)于某電子商務(wù)交易平臺(tái),其提供的業(yè)務(wù)對(duì)象可以 從多個(gè)維度劃分為多個(gè)類目,如服裝類、數(shù)碼產(chǎn)品類等等,有些用戶可能對(duì)服裝類信息感興 趣,而其他用戶可能對(duì)數(shù)碼產(chǎn)品感興趣等等。此時(shí),如果向同一個(gè)網(wǎng)頁(例如某網(wǎng)站首頁) 中投放固定的特定信息,則意味著只有部分用戶會(huì)對(duì)該信息感興趣,對(duì)于其他用戶而言,相 當(dāng)于浪費(fèi)了該特定信息所在的版面。
[0003] 為此,一些系統(tǒng)中提出了"興趣點(diǎn)定向"的信息投放方式,也即將信息投放方選擇 的關(guān)鍵詞與用戶可能的興趣點(diǎn)相匹配的定向方式。信息投放方可以通過輸入其特定信息的 描述信息等方式來獲得系統(tǒng)推薦的關(guān)鍵詞,還可以對(duì)這些關(guān)鍵詞進(jìn)行篩選,根據(jù)篩選結(jié)果, 系統(tǒng)可以將關(guān)鍵詞映射到系統(tǒng)內(nèi)的類目,信息投放方選擇的關(guān)鍵詞為"性價(jià)比高",則系統(tǒng) 可以將"性價(jià)比高"映射為類目"數(shù)碼產(chǎn)品",而如果選擇的關(guān)鍵詞為"手感舒適",則系統(tǒng)可 以將"手感舒適"映射為類目"家居用品",等,這樣可以獲知信息投放方的興趣點(diǎn),這種興趣 點(diǎn)可以用各個(gè)被選中的關(guān)鍵詞對(duì)應(yīng)的類目來表示。
[0004] 同時(shí)系統(tǒng)將分析每個(gè)信息瀏覽用戶的當(dāng)前瀏覽頁面內(nèi)容以及歷史關(guān)注點(diǎn),得到各 個(gè)用戶的關(guān)注點(diǎn),這種關(guān)注點(diǎn)同樣可以用戶系統(tǒng)中的類目來表示。例如,用戶甲的關(guān)注點(diǎn)包 括"服裝"、"數(shù)碼產(chǎn)品"等等。這樣,就可以將信息投放方的興趣點(diǎn)與用戶的關(guān)注點(diǎn)相匹配, 將信息投放方的特定信息相匹配的用戶人群進(jìn)行投放。也就是說,對(duì)于同一個(gè)網(wǎng)頁而言,針 對(duì)不同的用戶ID,其能夠看到的特定信息可能是不同的,但都基本與用戶的關(guān)注點(diǎn)相匹配, 因此,可以充分利用網(wǎng)頁中用戶展現(xiàn)特定信息的版面,使得同一網(wǎng)頁可以同時(shí)為不同的信 息投放方帶來用戶流量。
[0005] 在上述這種興趣點(diǎn)定向的信息投放方式中,當(dāng)信息投放方選擇了某個(gè)或者某些關(guān) 鍵詞之后,系統(tǒng)還可以預(yù)估對(duì)應(yīng)的類目組合能夠有多大的用戶覆蓋量,并顯示給信息投放 方,進(jìn)而信息投放方可以據(jù)此決定是否選擇這些關(guān)鍵詞進(jìn)行投放。然而,對(duì)于大型的業(yè)務(wù)平 臺(tái)而言,其中包含的業(yè)務(wù)對(duì)象的類目數(shù)量一般是非常多的,如果要精確的各種可能的類目 組合對(duì)應(yīng)的用戶覆蓋量,需要巨大的計(jì)算量。例如假設(shè)有N個(gè)類目,則需要計(jì)算2~N個(gè)類目 組合的用戶覆蓋量,對(duì)于數(shù)千甚至上萬量級(jí)的N來說,這個(gè)計(jì)算量即使對(duì)于現(xiàn)有的大規(guī)模 分布式計(jì)算系統(tǒng)都是難以實(shí)現(xiàn)的。
[0006] 另外,在計(jì)算類目組合的用戶覆蓋量時(shí),還不能簡單的將各個(gè)類目單獨(dú)對(duì)應(yīng)的覆 蓋量相加,因?yàn)橥挥脩艨赡荜P(guān)注不同的類目,比如用戶A即是電子類用戶,又是母嬰群體 用戶,又是運(yùn)動(dòng)愛好者,如果信息投放方選擇的興趣類目中包括這三種類目,那用戶A只能 算一個(gè)用戶,而不能算三次。也就是說流量預(yù)估還要解決同一用戶在不同的類目中重復(fù)出 現(xiàn)的問題。
[0007] 總之,迫切需要本領(lǐng)域技術(shù)人員解決的技術(shù)問題就在于:如何在進(jìn)行流量預(yù)估的 過程中,降低計(jì)算量,并解決同一用戶在不同的類目中重復(fù)出現(xiàn)的問題。
【發(fā)明內(nèi)容】
[0008] 本申請(qǐng)?zhí)峁┝擞脩舾采w量信息的提示方法及裝置,能夠降低計(jì)算量,并解決同一 用戶在不同的類目中重復(fù)出現(xiàn)的問題。
[0009] 本申請(qǐng)?zhí)峁┝巳缦路桨福?br>
[0010] 一種用戶覆蓋量信息的提示方法,包括:
[0011] 根據(jù)預(yù)先獲取到的各個(gè)用戶分別關(guān)注的類目信息,獲取基礎(chǔ)數(shù)據(jù);所述基礎(chǔ)數(shù)據(jù) 中包括每個(gè)類目單獨(dú)的用戶覆蓋量、按照單獨(dú)的用戶覆蓋量由大到小排序后得到的類目序 列,以及各個(gè)類目在類目序列中的序號(hào);
[0012] 按照各類目在類目序列中排序距離的不同對(duì)類目進(jìn)行分類,得到預(yù)置數(shù)目個(gè)子序 列;其中,所述排序距離為兩個(gè)類目的序號(hào)之間的差值,在同一子序列中,相鄰類目之間的 序號(hào)差值均相等;
[0013] 將同一子序列中的類目劃分為多個(gè)類目組合,使得每個(gè)類目組合比前一個(gè)類目組 合多一個(gè)類目,根據(jù)所述預(yù)先獲取到的各個(gè)用戶分別關(guān)注的類目信息,統(tǒng)計(jì)各個(gè)類目組合 累積的不重復(fù)用戶覆蓋量,并計(jì)算各個(gè)類目組合相對(duì)于前一個(gè)類目組合的用戶覆蓋量增長 率;
[0014] 根據(jù)同一子序列中得到的各個(gè)用戶覆蓋量增長率以及預(yù)置的函數(shù)格式進(jìn)行擬合, 得到對(duì)應(yīng)排序距離下的擬合函數(shù);
[0015] 當(dāng)信息投放方選擇了目標(biāo)關(guān)鍵詞后,將所述目標(biāo)關(guān)鍵詞映射為系統(tǒng)中的多個(gè)目標(biāo) 類目,根據(jù)所述基礎(chǔ)數(shù)據(jù)確定各目標(biāo)類目的序號(hào)以及單獨(dú)的用戶覆蓋量;
[0016] 將序號(hào)最小的目標(biāo)類目作為目標(biāo)基準(zhǔn)類目,將該目標(biāo)基準(zhǔn)類目分別與其他各目標(biāo) 類目組成目標(biāo)組合,并計(jì)算各個(gè)目標(biāo)組合中兩個(gè)目標(biāo)類目的排序距離;
[0017] 分別利用各個(gè)目標(biāo)組合的排序距離對(duì)應(yīng)的擬合函數(shù),預(yù)估各個(gè)目標(biāo)組合相對(duì)于目 標(biāo)基準(zhǔn)類目的累積用戶增長量,并將目標(biāo)基準(zhǔn)類目單獨(dú)的用戶覆蓋量與各個(gè)目標(biāo)組合的所 述累積用戶增長量相加,預(yù)估出將所有目標(biāo)類目組合在一起時(shí)的累積用戶覆蓋量;
[0018] 在接收到獲取累積用戶覆蓋量的請(qǐng)求時(shí),將預(yù)估的累積用戶覆蓋量提供給信息投 放方。
[0019] 一種用戶覆蓋量信息的提示裝置,包括:
[0020] 基礎(chǔ)數(shù)據(jù)獲取單元,用于根據(jù)預(yù)先獲取到的各個(gè)用戶分別關(guān)注的類目信息,獲取 基礎(chǔ)數(shù)據(jù);所述基礎(chǔ)數(shù)據(jù)中包括每個(gè)類目單獨(dú)的用戶覆蓋量、按照單獨(dú)的用戶覆蓋量由大 到小排序后得到的類目序列,以及各個(gè)類目在類目序列中的序號(hào);
[0021] 類目分類單元,用于按照各類目在類目序列中排序距離的不同對(duì)類目進(jìn)行分類, 得到預(yù)置數(shù)目個(gè)子序列;其中,所述排序距離為兩個(gè)類目的序號(hào)之間的差值,在同一子序列 中,相鄰類目之間的序號(hào)差值均相等;
[0022] 增長率計(jì)算單元,用于將同一子序列中的類目劃分為多個(gè)類目組合,使得每個(gè)類 目組合比前一個(gè)類目組合多一個(gè)類目,根據(jù)所述預(yù)先獲取到的各個(gè)用戶分別關(guān)注的類目信 息,統(tǒng)計(jì)各個(gè)類目組合累積的不重復(fù)用戶覆蓋量,并計(jì)算各個(gè)類目組合相對(duì)于前一個(gè)類目 組合的用戶覆蓋量增長率;
[0023] 擬合單元,用于根據(jù)同一子序列中得到的各個(gè)用戶覆蓋量增長率以及預(yù)置的函數(shù) 格式進(jìn)行擬合,得到對(duì)應(yīng)排序距離下的擬合函數(shù);
[0024]目標(biāo)類目確定單元,用于當(dāng)信息投放方選擇了目標(biāo)關(guān)鍵詞后,將所述目標(biāo)關(guān)鍵詞 映射為系統(tǒng)中的多個(gè)目標(biāo)類目,根據(jù)所述基礎(chǔ)數(shù)據(jù)確定各目標(biāo)類目的序號(hào)以及單獨(dú)的用戶 覆蓋量;
[0025] 目標(biāo)組合確定單元,用于將序號(hào)最小的目標(biāo)類目作為目標(biāo)基準(zhǔn)類目,將該目標(biāo)基 準(zhǔn)類目分別與其他各目標(biāo)類目組成目標(biāo)組合,并計(jì)算各個(gè)目標(biāo)組合中兩個(gè)目標(biāo)類目的排序 距離;
[0026] 預(yù)估單元,用于分別利用各個(gè)目標(biāo)組合的排序距離對(duì)應(yīng)的擬合函數(shù),預(yù)估各個(gè)目 標(biāo)組合相對(duì)于目標(biāo)基準(zhǔn)類目的累積用戶增長量,并將目標(biāo)基準(zhǔn)類目單獨(dú)的用戶覆蓋量與各 個(gè)目標(biāo)組合的所述累積用戶增長量相加,預(yù)估出將所有目標(biāo)類目組合在一起時(shí)的累積用戶 覆蓋量;
[0027] 提示單元,用于在接收到獲取累積用戶覆蓋量的請(qǐng)求時(shí),將預(yù)估的累積用戶覆蓋 量提供給信息投放方。
[0028] 根據(jù)本申請(qǐng)?zhí)峁┑木唧w實(shí)施例,本申請(qǐng)公開了以下技術(shù)效果:
[0029] 通過本申請(qǐng)實(shí)施例,以有限數(shù)量的子序列內(nèi)的類目為代表,計(jì)算出一些類目組合 累積的不重復(fù)用戶覆蓋量,并且還可以得到各個(gè)排序距離下對(duì)應(yīng)的擬合函數(shù),用以擬合對(duì) 應(yīng)排序距離下,某類目組合相對(duì)于前一類目組合的累積用戶增長率,進(jìn)而就可以根據(jù)各個(gè) 排序距離下的擬合函數(shù)以及子序列內(nèi)各類目組合的累積用戶覆蓋量,預(yù)估出被信息投放方 選擇的目標(biāo)類目組合在一起時(shí)的累積用戶覆蓋量,以便向信息投放方進(jìn)行相應(yīng)的提示???見,通過以上方式,可以將計(jì)算量縮小到有限數(shù)量的排序距離對(duì)應(yīng)的子序列范圍內(nèi),使得計(jì) 算量限制在計(jì)算系統(tǒng)能夠?qū)崿F(xiàn)的范圍內(nèi)。同時(shí),利用類目組合累積的不重復(fù)用戶覆蓋量進(jìn) 行函數(shù)的擬合以及后續(xù)的預(yù)估,因此,解決了同一用戶在不同類目下重復(fù)出現(xiàn)的問題。
[0030] 當(dāng)然,實(shí)施本申請(qǐng)的任一產(chǎn)品并不一定需要同時(shí)達(dá)到以上所述的所有優(yōu)點(diǎn)。
【專利附圖】
【附圖說明】
[0031] 為了更清楚地說明本申請(qǐng)實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例中所 需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請(qǐng)的一些實(shí)施 例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲 得其他的附圖。
[0032] 圖1是本申請(qǐng)實(shí)施例提供的方法的流程圖;
[0033] 圖2是本申請(qǐng)實(shí)施例提供的裝置的示意圖。
【具體實(shí)施方式】
[0034] 下面將結(jié)合本申請(qǐng)實(shí)施例中的附圖,對(duì)本申請(qǐng)實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例僅僅是本申請(qǐng)一部分實(shí)施例,而不是全部的實(shí)施例?;?本申請(qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員所獲得的所有其他實(shí)施例,都屬于本申請(qǐng)保護(hù)的 范圍。
[0035] 在本申請(qǐng)實(shí)施例中,為了能夠在預(yù)估用戶覆蓋量時(shí),降低計(jì)算量,并解決同一用戶 在同一類目組合的不同類目中重復(fù)出現(xiàn)的問題,采用了對(duì)類目組合的用戶覆蓋量進(jìn)行分段 擬合的方式,通過擬合函數(shù)來對(duì)類目組合的累積用戶覆蓋量,并提供給信息投放方。下面對(duì) 此進(jìn)行詳細(xì)地介紹。
[0036] 參見圖1,本申請(qǐng)實(shí)施例提供了一種用戶覆蓋量信息的提示方法,該方法可以包括 以下步驟:
[0037] S101 :根據(jù)預(yù)先獲取到的各個(gè)用戶分別關(guān)注的類目信息,獲取基礎(chǔ)數(shù)據(jù);所述基 礎(chǔ)數(shù)據(jù)中包括每個(gè)類目單獨(dú)的用戶覆蓋量、按照單獨(dú)的用戶覆蓋量由大到小排序后得到的 類目序列,以及各個(gè)類目在類目序列中的序號(hào);
[0038] 其中,在獲取各個(gè)用戶分別關(guān)注的類目信息時(shí),可以對(duì)預(yù)置時(shí)間段內(nèi)收集到的用 戶的歷史操作行為記錄進(jìn)行統(tǒng)計(jì),然后統(tǒng)計(jì)出各個(gè)用戶分別對(duì)哪些類目感興趣。例如,對(duì)于 某用戶A,根據(jù)其歷史操作行為記錄發(fā)現(xiàn),該用戶A瀏覽過的網(wǎng)頁多數(shù)都是服裝類、數(shù)碼產(chǎn) 品類的業(yè)務(wù)對(duì)象所在的網(wǎng)頁,同時(shí),還可能發(fā)現(xiàn),在用戶瀏覽過的業(yè)務(wù)對(duì)象中,最終產(chǎn)生過 購買或者預(yù)訂行為的業(yè)務(wù)對(duì)象也多是服裝類以及數(shù)碼產(chǎn)品類,因此,綜合這些信息,就可以 獲取到該用戶A關(guān)注度最高的若干個(gè)類目。其他用戶也都分別進(jìn)行類似的處理,這樣,最終 就能夠得到每個(gè)用戶分別對(duì)哪些類目感興趣。其中,具體從用戶的歷史操作行為記錄中獲 取用戶對(duì)各類目的關(guān)注度的實(shí)現(xiàn)方法,可以參見已有技術(shù)中的實(shí)現(xiàn),這里不再詳述。當(dāng)然, 對(duì)于每個(gè)用戶來說,其關(guān)注過的類目可能有很多,在本申請(qǐng)實(shí)施例中,可以僅取用戶最關(guān)注 的幾個(gè)類目來加入到具體的統(tǒng)計(jì)過程,例如,每個(gè)用戶都僅取其最關(guān)注的6個(gè)類目,當(dāng)然, 如果某用戶關(guān)注的類目不足6個(gè),就將該用戶實(shí)際關(guān)注的全部類目加入到統(tǒng)計(jì)過程。
[0039] 在獲取到各個(gè)用戶分別對(duì)哪些類目的關(guān)注度比較高之后,就可以獲取各類目單獨(dú) 的用戶覆蓋量,其中,某類目單獨(dú)的用戶覆蓋量為關(guān)注點(diǎn)中包括該類目的用戶數(shù)量。也就是 說,可以根據(jù)各個(gè)用戶分別關(guān)注的類目,統(tǒng)計(jì)出各個(gè)類目分別對(duì)應(yīng)的用戶數(shù)量,將該用戶數(shù) 量確定為各個(gè)類目單獨(dú)的用戶覆蓋量。例如,假設(shè)一共有三個(gè)用戶,分別為A、B、C,其中:
[0040] 用戶A關(guān)注的類目包括:服裝類、數(shù)碼產(chǎn)品類以及化妝品類;
[0041] 用戶B關(guān)注的類目包括:服裝類、化妝品類及運(yùn)動(dòng)戶外類;
[0042] 用戶C關(guān)注的類目包括:化妝品類及數(shù)碼產(chǎn)品類。
[0043] 則對(duì)于服裝類而言,用戶A及用戶B都關(guān)注了,因此,該服裝類單獨(dú)的用戶覆蓋量 為2 ;對(duì)于數(shù)碼產(chǎn)品類而言,用戶A以及用戶C都關(guān)注了,因此,數(shù)碼產(chǎn)品類單獨(dú)的用戶覆蓋 量為2 ;對(duì)于化妝品類而言,用戶A、B、C都關(guān)注了,因此,化妝品類單獨(dú)的用戶覆蓋量為3, 以此類推。當(dāng)然,實(shí)際的系統(tǒng)中,用戶數(shù)量以及類目數(shù)量都很多,這里只是簡單的對(duì)統(tǒng)計(jì)的 原理進(jìn)行介紹。
[0044] 在得到各個(gè)類目單獨(dú)的用戶覆蓋量之后,就可以按照單獨(dú)的用戶覆蓋量對(duì)各類目 進(jìn)行排序,生成一個(gè)類目序列,并分別為序列中的各個(gè)類目賦予連續(xù)的序號(hào)。這樣,對(duì)于一 個(gè)類目而言,能夠獲取到兩方面的信息,一個(gè)是單獨(dú)的用戶覆蓋量,另一個(gè)就是在序列中的 序號(hào),可以這兩方面的信息作為類目的固有屬性,進(jìn)行后續(xù)的函數(shù)擬合以及流量預(yù)估計(jì)算。 例如,類目及屬性的存儲(chǔ)格式可以為:
[0045] (Key :類目)(value :排序序號(hào)+單獨(dú)的用戶覆蓋量)
[0046] 接下來就可以首先利用以上獲得的基礎(chǔ)數(shù)據(jù),進(jìn)行分段的函數(shù)擬合。
[0047] S102:按照各類目在類目序列中排序距離的不同對(duì)類目進(jìn)行分類,得到預(yù)置數(shù)目 個(gè)子序列;其中,所述排序距離為兩個(gè)類目的序號(hào)之間的差值,在同一子序列中,相鄰類目 之間的序號(hào)差值均相等;
[0048] 具體在按照排序距離對(duì)類目進(jìn)行分類時(shí),相當(dāng)于是從類目序列中按照一定的間隔 進(jìn)行抽取,抽取出來的類目組成一個(gè)新的序列,由于是從步驟S101中的類目序列中抽取出 來的,因此,可以稱為一個(gè)子序列。同樣的,按照其他的間隔進(jìn)行抽取時(shí),可以得到其他的子 序列。
[0049] 例如,按照各類目單獨(dú)的用戶覆蓋量從大到小排序的類目序列為:Cat_l、Cat_2、 Cat_3........Cat_N。貝U,具體在對(duì)類目進(jìn)行分類時(shí),就可以從序號(hào)為1的類目開始抽取序 號(hào)間隔為length的類目組成子序列。
[0050] 如 length = 1,則抽取{Cat_l、Cat_2、Cat_3......Cat_N}作為一個(gè)子序列;
[0051] length = 2,則抽取{Cat_l、Cat_3、Cat_5......Cat_m_2、Cat_m......}作為一 個(gè)子序列;
[0052] length = k 則分類為{Cat_l、Cat_k+1、Cat_2k+1......}作為一個(gè)子序列。
[0053] 這樣,最后可以產(chǎn)生多個(gè)子序列。
[0054] 這里需要進(jìn)行以下幾點(diǎn)說明:
[0055] 第一,對(duì)于相同的排序距離而言,如果選擇的起始類目不同,則生成的子序列可能 會(huì)有所不同,例如,當(dāng)length = 2時(shí),如果從序號(hào)為1的類目開始抽取,則得到的子序列 為{Cat_l、Cat_3、Cat_5......Cat_m_2、Cat_m、......},其中,m 為奇數(shù);但如果是從序 號(hào)為2的類目開始抽取,則得到的子序列為{Cat_2、Cat_4、Cat_6、.......Cat_n_2、Cat_ n.......},其中,n為偶數(shù)。并且,length越大時(shí),能夠產(chǎn)生的不同子序列的數(shù)目就越多。 由于在后續(xù)的函數(shù)擬合過程中,需要分別得到各個(gè)排序距離下的擬合函數(shù),而某排序距離 下的擬合函數(shù),是根據(jù)該排序距離下的子序列中各類目的用戶覆蓋量情況計(jì)算得到的。因 此,為了降低計(jì)算量,每個(gè)排序距離下可以僅抽取一個(gè)子序列,這樣,每個(gè)排序距離下,只需 要基于一個(gè)子序列就可以計(jì)算出對(duì)應(yīng)的擬合函數(shù)。其中,每個(gè)排序距離對(duì)應(yīng)的子序列都可 以是從序號(hào)為1的類目開始抽取,也就是各個(gè)子序列的起始類目均為在基礎(chǔ)數(shù)據(jù)的類目序 列中序號(hào)最小的類目。當(dāng)然,在計(jì)算量允許的情況下,同一排序距離下也可以分別以不同的 起始類目抽取出多個(gè)子序列,最終在計(jì)算擬合函數(shù)時(shí),同樣可以分別基于各個(gè)子序列進(jìn)行 計(jì)算,最后再將同一排序距離下各個(gè)子序列計(jì)算得到的值取平均值。實(shí)驗(yàn)證明,同一排序距 離下各個(gè)子序列計(jì)算得到的值是基本相等的,這也進(jìn)一步表明,同一排序距離下只抽取一 個(gè)子序列具有合理性,也就是說,能夠比較準(zhǔn)確的得到擬合函數(shù)的同時(shí),還降低了計(jì)算量。
[0056] 第二,系統(tǒng)中的類目數(shù)量眾多,例如,一般有幾千甚至上萬個(gè),理論上將,如果類目 數(shù)量為N,則不同類目之間的排序距離有N-1種。但實(shí)際按照排序距離對(duì)類目進(jìn)行分類時(shí), 不需要針對(duì)所有的排序距離都進(jìn)行函數(shù)的擬合,一般情況下,可以為排序距離設(shè)置一最大 值,只要對(duì)該最大值以下的各個(gè)排序距離進(jìn)行函數(shù)擬合即可。例如,假設(shè)類目總數(shù)為2000 個(gè),最大排序距離可以取100,然后分別針對(duì)各個(gè)排序距離進(jìn)行函數(shù)擬合。這樣,可以進(jìn)一步 減少計(jì)算量,并且這些擬合函數(shù)一般就能滿足實(shí)際應(yīng)用中的絕大部分需求。
[0057] S103:將同一子序列中的類目劃分為多個(gè)類目組合,使得每個(gè)類目組合比前一個(gè) 類目組合多一個(gè)類目,統(tǒng)計(jì)各個(gè)類目組合累積的不重復(fù)用戶覆蓋量,并計(jì)算各個(gè)類目組合 相對(duì)于前一個(gè)類目組合的用戶覆蓋量增長率;
[0058] 在同一子序列中,各類目仍然按照序號(hào)從小到大(也就是單獨(dú)的用戶覆蓋量從大 至IJ?。┑捻樞蚺帕?。具體在依據(jù)同一子序列內(nèi)各類目的用戶覆蓋量情況對(duì)對(duì)應(yīng)排序距離下 的函數(shù)進(jìn)行擬合時(shí),可以首先將同一子序列中的類目劃分為多個(gè)類目組合。具體在劃分類 目組合時(shí),可以將子序列中一個(gè)類目(例如序號(hào)最小的類目)為基準(zhǔn)類目,并按照類目在子 序列中的順序每次加入一個(gè)類目組成下一個(gè)類目組合,這樣,每個(gè)類目組合比前一個(gè)類目 組合都多一個(gè)類目。例如:
[0059] 對(duì)于子序列:{Cat_l、Cat_k+1、Cat_2k+1、......),得到的類目組合可以包括: {Cat_l}, {Cat_l>Cat_k+1}, {Cat_l>Cat_k+1, Cat_2k+1}.....
[0060] 也就是說,第一個(gè)類目組合是由子序列中的第一個(gè)類目組成,第二個(gè)類目組合就 是由子序列中的前兩個(gè)類目組成的組合,第三個(gè)類目組合就是由子序列中的前三個(gè)類目組 成的組合,也即,第i個(gè)類目組合就是由子序列中的前i個(gè)類目組成的組合,以此類推。
[0061] 在同一子序列中得到多個(gè)類目組合后,對(duì)于包含兩個(gè)及兩個(gè)以上類目的類目組合 而言,還可以根據(jù)步驟S101中統(tǒng)計(jì)出的各個(gè)用戶關(guān)注的類目信息,統(tǒng)計(jì)出類目組合累積的 不重復(fù)用戶覆蓋量。具體的,由于從預(yù)先得到的數(shù)據(jù)中可以獲知各個(gè)用戶分別對(duì)哪些類目 的關(guān)注度比較高,并且已知各個(gè)用戶的ID等身份標(biāo)識(shí)信息,因此,可以統(tǒng)計(jì)出同一類目組 合內(nèi)各個(gè)類目分別對(duì)應(yīng)的用戶標(biāo)識(shí),這樣,將用戶標(biāo)識(shí)進(jìn)行匯總,并去掉重復(fù)的用戶標(biāo)識(shí), 最終得到的用戶標(biāo)識(shí)數(shù)目,就可以確定為該類目組合累積的不重復(fù)用戶覆蓋量。
[0062] 例如,仍然假設(shè)一共有三個(gè)用戶,分別為A、B、C,其中:
[0063] 用戶A關(guān)注的類目包括:服裝類、數(shù)碼產(chǎn)品類以及化妝品類;
[0064] 用戶B關(guān)注的類目包括:服裝類、化妝品類及運(yùn)動(dòng)戶外類;
[0065] 用戶C關(guān)注的類目包括:化妝品類及數(shù)碼產(chǎn)品類。
[0066] 假設(shè)某類目組合為{服裝類、數(shù)碼產(chǎn)品類},其中,服裝類覆蓋的用戶包括用戶A及 用戶B(單獨(dú)的用戶覆蓋量為2),數(shù)碼產(chǎn)品類覆蓋的用戶包括用戶A和用戶C (單獨(dú)的用戶 覆蓋量為2),此時(shí),將服裝類及數(shù)碼產(chǎn)品類覆蓋的用戶進(jìn)行匯總,并去掉重復(fù)的用戶后,得 到的用戶包括A、B、C,因此,就可以得到該類目組合累積的不重復(fù)用戶覆蓋量為3,其中,用 戶A在兩個(gè)類目中都出現(xiàn),但只會(huì)計(jì)算一次。
[0067] 總之,針對(duì)同一子序列中的各個(gè)類目組合都可以按照上述方式統(tǒng)計(jì)出累積的用戶 覆蓋量。之后,就可以計(jì)算出子序列內(nèi)部每個(gè)類目組合相對(duì)于前一類目組合的用戶覆蓋量 增長率。例如,如果要計(jì)算類目組合{Cat_l、Cat_k+l}相對(duì)于{Cat_l}的用戶覆蓋量增長 率,則可以按照以下公式(1)進(jìn)行計(jì)算:
[0068]
【權(quán)利要求】
1. 一種用戶覆蓋量信息的提示方法,其特征在于,包括: 根據(jù)預(yù)先獲取到的各個(gè)用戶分別關(guān)注的類目信息,獲取基礎(chǔ)數(shù)據(jù);所述基礎(chǔ)數(shù)據(jù)中包 括每個(gè)類目單獨(dú)的用戶覆蓋量、按照單獨(dú)的用戶覆蓋量由大到小排序后得到的類目序列, 以及各個(gè)類目在類目序列中的序號(hào); 按照各類目在類目序列中排序距離的不同對(duì)類目進(jìn)行分類,得到預(yù)置數(shù)目個(gè)子序列; 其中,所述排序距離為兩個(gè)類目的序號(hào)之間的差值; 將同一子序列中的類目劃分為多個(gè)類目組合,使得每個(gè)類目組合比前一個(gè)類目組合多 一個(gè)類目,根據(jù)所述預(yù)先獲取到的各個(gè)用戶分別關(guān)注的類目信息,統(tǒng)計(jì)各個(gè)類目組合累積 的不重復(fù)用戶覆蓋量,并計(jì)算各個(gè)類目組合相對(duì)于前一個(gè)類目組合的用戶覆蓋量增長率; 根據(jù)同一子序列中得到的各個(gè)用戶覆蓋量增長率以及預(yù)置的函數(shù)格式進(jìn)行擬合,得到 對(duì)應(yīng)排序距離下的擬合函數(shù); 當(dāng)信息投放方選擇了目標(biāo)關(guān)鍵詞后,將所述目標(biāo)關(guān)鍵詞映射為系統(tǒng)中的多個(gè)目標(biāo)類 目,根據(jù)所述基礎(chǔ)數(shù)據(jù)確定各目標(biāo)類目的序號(hào)以及單獨(dú)的用戶覆蓋量; 在所述映射得到的多個(gè)目標(biāo)類目中選擇目標(biāo)基準(zhǔn)類目,將該目標(biāo)基準(zhǔn)類目分別與其他 各目標(biāo)類目組成目標(biāo)組合,并計(jì)算各個(gè)目標(biāo)組合中兩個(gè)目標(biāo)類目的排序距離; 分別利用各個(gè)目標(biāo)組合的排序距離對(duì)應(yīng)的擬合函數(shù),預(yù)估各個(gè)目標(biāo)組合相對(duì)于目標(biāo)基 準(zhǔn)類目的累積用戶增長量,并將目標(biāo)基準(zhǔn)類目單獨(dú)的用戶覆蓋量與各個(gè)目標(biāo)組合的所述累 積用戶增長量相加,預(yù)估出將所有目標(biāo)類目組合在一起時(shí)的累積用戶覆蓋量; 在接收到獲取累積用戶覆蓋量的請(qǐng)求時(shí),將預(yù)估的累積用戶覆蓋量提供給信息投放 方。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述預(yù)置的函數(shù)格式為冪函數(shù)格式,所述 冪函數(shù)格式中包括待確定的系數(shù)和/或冪指數(shù),所述根據(jù)同一類目子序列中得到的各個(gè)用 戶覆蓋量增長率以及預(yù)置的函數(shù)格式進(jìn)行擬合,得到對(duì)應(yīng)排序距離下的擬合函數(shù),包括: 根據(jù)同一類目子序列中得到的各個(gè)用戶覆蓋量增長率以及預(yù)置的冪函數(shù)格式,確定出 對(duì)應(yīng)排序距離下系數(shù)和/或冪指數(shù); 將所述系數(shù)和/或冪指數(shù)以及該排序距離帶入到預(yù)置的函數(shù)格式中,得到對(duì)應(yīng)排序距 離下的擬合函數(shù)。
3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,同一排序距離下取一個(gè)子序列。
4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,各個(gè)排序距離下的子序列均以所述類目 序列中序號(hào)最小的類目為起始類目。
5. 根據(jù)權(quán)利要求1至4任一項(xiàng)所述的方法,其特征在于,所述分別利用各個(gè)目標(biāo)組合的 排序距離對(duì)應(yīng)的擬合函數(shù),預(yù)估各個(gè)目標(biāo)組合相對(duì)于目標(biāo)基準(zhǔn)類目的累積用戶增長量,包 括: 將所述目標(biāo)組合對(duì)應(yīng)的排序距離以及目標(biāo)組合中目標(biāo)基準(zhǔn)類目外的另一個(gè)目標(biāo)類目 的序號(hào),帶入到該排序距離的擬合函數(shù)中,得到該目標(biāo)組合相對(duì)于目標(biāo)基準(zhǔn)類目的累積用 戶增長率; 從該排序距離對(duì)應(yīng)的子序列中,獲取與目標(biāo)基準(zhǔn)類目序號(hào)最接近的第一類目,以及與 目標(biāo)組合中另一類目的序號(hào)最接近的第二類目,根據(jù)所述第一類目單獨(dú)的用戶覆蓋量,以 及第一類目與第二類目累積的不重復(fù)用戶覆蓋量,以及所述該目標(biāo)組合相對(duì)于目標(biāo)基準(zhǔn)類 目的累積用戶增長率,預(yù)估出該目標(biāo)組合相對(duì)于目標(biāo)基準(zhǔn)類目的累積用戶增長量。
6. 根據(jù)權(quán)利要求1至4任一項(xiàng)所述的方法,其特征在于,在按照排序距離的不同對(duì)類目 進(jìn)行分類時(shí),最大排序距離與類目總數(shù)之間的比值小于預(yù)置的閾值。
7. 根據(jù)權(quán)利要求1至4任一項(xiàng)所述的方法,其特征在于,根據(jù)預(yù)先獲取到的各個(gè)用戶分 別關(guān)注的類目信息,獲取基礎(chǔ)數(shù)據(jù),包括: 預(yù)先根據(jù)用戶在預(yù)置時(shí)間段內(nèi)的歷史操作行為記錄,獲取該用戶關(guān)注度最高的預(yù)置數(shù) 目的類目信息; 將從各個(gè)用戶處獲取到的信息進(jìn)行匯總,統(tǒng)計(jì)出各個(gè)類目分別對(duì)應(yīng)的用戶數(shù)量,將該 用戶數(shù)量確定為各個(gè)類目單獨(dú)的用戶覆蓋量。
8. 根據(jù)權(quán)利要求7所述的方法,其特征在于,在進(jìn)行函數(shù)擬合時(shí),所述統(tǒng)計(jì)各個(gè)類目組 合累積的不重復(fù)用戶覆蓋量,包括: 統(tǒng)計(jì)出同一類目組合內(nèi)各個(gè)類目分別對(duì)應(yīng)的用戶標(biāo)識(shí); 將所述用戶標(biāo)識(shí)進(jìn)行匯總,并去掉重復(fù)的用戶標(biāo)識(shí),將最終的用戶標(biāo)識(shí)數(shù)目,確定為該 類目組合累積的不重復(fù)用戶覆蓋量。
9. 一種用戶覆蓋量信息的提示裝置,其特征在于,包括: 基礎(chǔ)數(shù)據(jù)獲取單元,用于根據(jù)預(yù)先獲取到的各個(gè)用戶分別關(guān)注的類目信息,獲取基礎(chǔ) 數(shù)據(jù);所述基礎(chǔ)數(shù)據(jù)中包括每個(gè)類目單獨(dú)的用戶覆蓋量、按照單獨(dú)的用戶覆蓋量由大到小 排序后得到的類目序列,以及各個(gè)類目在類目序列中的序號(hào); 類目分類單元,用于按照各類目在類目序列中排序距離的不同對(duì)類目進(jìn)行分類,得到 預(yù)置數(shù)目個(gè)子序列;其中,所述排序距離為兩個(gè)類目的序號(hào)之間的差值,在同一子序列中, 相鄰類目之間的序號(hào)差值均相等; 增長率計(jì)算單元,用于將同一子序列中的類目劃分為多個(gè)類目組合,使得每個(gè)類目組 合比前一個(gè)類目組合多一個(gè)類目,根據(jù)所述預(yù)先獲取到的各個(gè)用戶分別關(guān)注的類目信息, 統(tǒng)計(jì)各個(gè)類目組合累積的不重復(fù)用戶覆蓋量,并計(jì)算各個(gè)類目組合相對(duì)于前一個(gè)類目組合 的用戶覆蓋量增長率; 擬合單元,用于根據(jù)同一子序列中得到的各個(gè)用戶覆蓋量增長率以及預(yù)置的函數(shù)格式 進(jìn)行擬合,得到對(duì)應(yīng)排序距離下的擬合函數(shù); 目標(biāo)類目確定單元,用于當(dāng)信息投放方選擇了目標(biāo)關(guān)鍵詞后,將所述目標(biāo)關(guān)鍵詞映射 為系統(tǒng)中的多個(gè)目標(biāo)類目,根據(jù)所述基礎(chǔ)數(shù)據(jù)確定各目標(biāo)類目的序號(hào)以及單獨(dú)的用戶覆蓋 量; 目標(biāo)組合確定單元,用于將序號(hào)最小的目標(biāo)類目作為目標(biāo)基準(zhǔn)類目,將該目標(biāo)基準(zhǔn)類 目分別與其他各目標(biāo)類目組成目標(biāo)組合,并計(jì)算各個(gè)目標(biāo)組合中兩個(gè)目標(biāo)類目的排序距 離; 預(yù)估單元,用于分別利用各個(gè)目標(biāo)組合的排序距離對(duì)應(yīng)的擬合函數(shù),預(yù)估各個(gè)目標(biāo)組 合相對(duì)于目標(biāo)基準(zhǔn)類目的累積用戶增長量,并將目標(biāo)基準(zhǔn)類目單獨(dú)的用戶覆蓋量與各個(gè)目 標(biāo)組合的所述累積用戶增長量相加,預(yù)估出將所有目標(biāo)類目組合在一起時(shí)的累積用戶覆蓋 量; 提示單元,用于在接收到獲取累積用戶覆蓋量的請(qǐng)求時(shí),將預(yù)估的累積用戶覆蓋量提 供給信息投放方。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述預(yù)估單元包括: 增長率計(jì)算子單元,用于將所述目標(biāo)組合對(duì)應(yīng)的排序距離以及目標(biāo)組合中目標(biāo)基準(zhǔn)類 目外的另一個(gè)目標(biāo)類目的序號(hào),帶入到該排序距離的擬合函數(shù)中,得到該目標(biāo)組合相對(duì)于 目標(biāo)基準(zhǔn)類目的累積用戶增長率; 增長量計(jì)算子單元,用于從該排序距離對(duì)應(yīng)的子序列中,獲取與目標(biāo)基準(zhǔn)類目序號(hào)最 接近的第一類目,以及與目標(biāo)組合中另一類目的序號(hào)最接近的第二類目,根據(jù)所述第一類 目單獨(dú)的用戶覆蓋量,以及第一類目與第二類目累積的不重復(fù)用戶覆蓋量,以及所述該目 標(biāo)組合相對(duì)于目標(biāo)基準(zhǔn)類目的累積用戶增長率,預(yù)估出該目標(biāo)組合相對(duì)于目標(biāo)基準(zhǔn)類目的 累積用戶增長量。
【文檔編號(hào)】G06F17/30GK104281594SQ201310279704
【公開日】2015年1月14日 申請(qǐng)日期:2013年7月4日 優(yōu)先權(quán)日:2013年7月4日
【發(fā)明者】康生巧 申請(qǐng)人:阿里巴巴集團(tuán)控股有限公司