本發(fā)明屬于數(shù)據(jù)安全
技術(shù)領(lǐng)域:
,尤其涉及一種標(biāo)簽數(shù)據(jù)泄漏渠道檢測方法及裝置。
背景技術(shù):
:標(biāo)簽是一種互聯(lián)網(wǎng)內(nèi)容組織形式,是與對(duì)象實(shí)體的屬性相關(guān)性很強(qiáng)的關(guān)鍵字。標(biāo)簽有助于輕松的描述和分類內(nèi)容,以便于檢索和分享?;ヂ?lián)網(wǎng)發(fā)展中積累了大量以標(biāo)簽來表示的用戶偏好數(shù)據(jù),這些數(shù)據(jù)構(gòu)成了互聯(lián)網(wǎng)廣告、推薦等產(chǎn)品的基礎(chǔ)。另一方面,這些數(shù)據(jù)因?yàn)槠鋬r(jià)值,也和其他用戶個(gè)人數(shù)據(jù)(pii)一起成為數(shù)據(jù)泄露的目標(biāo),被違規(guī)獲取、轉(zhuǎn)賣?,F(xiàn)有的數(shù)據(jù)安全技術(shù)利用加密、系統(tǒng)加固、權(quán)限控制和審計(jì)監(jiān)控,來防止數(shù)據(jù)泄露出數(shù)據(jù)所有者的可控環(huán)境。但是在數(shù)據(jù)合作的業(yè)務(wù)場景中,數(shù)據(jù)通常會(huì)離開數(shù)據(jù)所有者的可控環(huán)境,進(jìn)入不可控的合作者的環(huán)境中去。在此場景中,傳統(tǒng)的數(shù)據(jù)庫水印技術(shù)和數(shù)據(jù)軌跡追蹤技術(shù)不能解決海量的、動(dòng)態(tài)的用戶標(biāo)簽數(shù)據(jù)的挑戰(zhàn)。傳統(tǒng)的數(shù)據(jù)庫水印技術(shù)和數(shù)據(jù)軌跡追蹤技術(shù)不能對(duì)用戶標(biāo)簽這樣缺乏數(shù)值型字段的數(shù)據(jù)有效地產(chǎn)生水印。其次標(biāo)簽數(shù)據(jù)通常被分散使用,從而使水印檢測很困難。另外標(biāo)簽數(shù)據(jù)具有海量、動(dòng)態(tài)特征,對(duì)水印的更新和檢測也有很大挑戰(zhàn)。標(biāo)簽數(shù)據(jù)的取值一般很常見,在互聯(lián)網(wǎng)中進(jìn)行追蹤非常困難。技術(shù)實(shí)現(xiàn)要素:本發(fā)明的目的是提供一種標(biāo)簽數(shù)據(jù)泄漏渠道檢測方法及裝置,以解決現(xiàn)有技術(shù)方案標(biāo)簽數(shù)據(jù)難以跟蹤檢測的技術(shù)問題,能夠有效地檢測可能的數(shù)據(jù)泄露渠道。為了實(shí)現(xiàn)上述目的,本發(fā)明技術(shù)方案如下:一種標(biāo)簽數(shù)據(jù)泄漏渠道檢測方法,用于檢測用戶標(biāo)簽數(shù)據(jù)的泄漏渠道,所述檢測方法包括:在用戶擁有的正常標(biāo)簽基礎(chǔ)上為用戶添加檢測標(biāo)簽,生成用戶標(biāo)簽數(shù)據(jù)集;根據(jù)用戶標(biāo)簽數(shù)據(jù)集為給定的渠道賦予檢測標(biāo)簽,建立用戶id、檢測標(biāo)簽和渠道id相關(guān)聯(lián)的渠道索引;根據(jù)由用戶正常標(biāo)簽產(chǎn)生推送信息的概率,對(duì)用戶接收的推送信息進(jìn)行攔截;對(duì)于攔截的推送信息,根據(jù)由該用戶檢測標(biāo)簽產(chǎn)生該推送信息的概率進(jìn)行篩選,如果由該用戶檢測標(biāo)簽產(chǎn)生該推送信息的概率高于給定的閾值,則將該用戶檢測標(biāo)簽加入到疑似泄漏標(biāo)簽集合;根據(jù)疑似泄漏標(biāo)簽集合,搜索渠道索引,得到對(duì)應(yīng)的疑似泄漏渠道id列表;檢測該推送信息是否來源于所搜索到的渠道,如果是,刪除對(duì)應(yīng)的渠道,將剩下的渠道作為疑似泄漏渠道輸出。進(jìn)一步地,所述在用戶擁有的正常標(biāo)簽基礎(chǔ)上為用戶添加檢測標(biāo)簽,包括:新添加的檢測標(biāo)簽與用戶現(xiàn)有標(biāo)簽同時(shí)出現(xiàn)的概率低于設(shè)定的第一閾值。進(jìn)一步地,所述根據(jù)用戶標(biāo)簽數(shù)據(jù)集為給定的渠道賦予檢測標(biāo)簽,建立用戶id、檢測標(biāo)簽和渠道id相關(guān)聯(lián)的渠道索引,包括:對(duì)于給定的渠道,根據(jù)其歷史行為計(jì)算其可信度;以該渠道的渠道id作為變量,從設(shè)定的hash函數(shù)集中選取一個(gè)hash函數(shù);基于渠道可信度抽樣用戶群;對(duì)抽樣得到的用戶群中每一個(gè)用戶,以用戶id作為變量,根據(jù)抽取得到的hash函數(shù)從該用戶的檢測標(biāo)簽中選出該渠道對(duì)應(yīng)的檢測標(biāo)簽;建立[用戶id、檢測標(biāo)簽]到渠道id的渠道索引。進(jìn)一步地,所述根據(jù)由用戶正常標(biāo)簽產(chǎn)生推送信息的概率,對(duì)用戶接收的推送信息進(jìn)行攔截,包括:如果推送信息由正常標(biāo)簽產(chǎn)生的概率低于設(shè)定的第二閾值,則進(jìn)行攔截,否則向用戶展示該推送信息。進(jìn)一步地,所述檢測方法還包括根據(jù)用戶正常標(biāo)簽的變化更新用戶檢測標(biāo)簽的步驟,具體包括:根據(jù)新的正常標(biāo)簽與現(xiàn)有檢測標(biāo)簽同時(shí)出現(xiàn)概率,刪除與用戶新的正常標(biāo)簽同時(shí)出現(xiàn)概率高的檢測標(biāo)簽;重新為用戶添加新的檢測標(biāo)簽,新添加的檢測標(biāo)簽與用戶現(xiàn)有標(biāo)簽同時(shí)出現(xiàn)的概率低于第一閾值。進(jìn)一步地,所述檢測方法還包括:從渠道索引中除去被刪除檢測標(biāo)簽相關(guān)項(xiàng)。本發(fā)明還提出了一種標(biāo)簽數(shù)據(jù)泄漏渠道檢測裝置,用于檢測用戶標(biāo)簽數(shù)據(jù)的泄漏渠道,所述檢測裝置包括:檢測標(biāo)簽添加模塊,用于在用戶擁有的正常標(biāo)簽基礎(chǔ)上為用戶添加檢測標(biāo)簽,生成用戶標(biāo)簽數(shù)據(jù)集;渠道關(guān)聯(lián)模塊,用于根據(jù)用戶標(biāo)簽數(shù)據(jù)集為給定的渠道賦予檢測標(biāo)簽,建立用戶id、檢測標(biāo)簽和渠道id相關(guān)聯(lián)的渠道索引;攔截模塊,用于根據(jù)由用戶正常標(biāo)簽產(chǎn)生推送信息的概率,對(duì)用戶接收的推送信息進(jìn)行攔截;攔截信息分析模塊,用于對(duì)于攔截的推送信息,根據(jù)由該用戶檢測標(biāo)簽產(chǎn)生該推送信息的概率進(jìn)行篩選,如果由該用戶檢測標(biāo)簽產(chǎn)生該推送信息的概率高于給定的閾值,則將該用戶檢測標(biāo)簽加入到疑似泄漏標(biāo)簽集合;渠道檢索模塊,用于根據(jù)疑似泄漏標(biāo)簽集合,搜索渠道索引,得到對(duì)應(yīng)的疑似泄漏渠道id列表;輸出模塊,用于檢測該推送信息是否來源于所搜索到的渠道,如果是,刪除對(duì)應(yīng)的渠道,將剩下的渠道作為疑似泄漏渠道輸出。進(jìn)一步地,所述檢測標(biāo)簽添加模塊在用戶擁有的正常標(biāo)簽基礎(chǔ)上為用戶添加檢測標(biāo)簽時(shí),新添加的檢測標(biāo)簽與用戶現(xiàn)有標(biāo)簽同時(shí)出現(xiàn)的概率低 于設(shè)定的第一閾值。進(jìn)一步地,所述渠道關(guān)聯(lián)模塊在根據(jù)用戶標(biāo)簽數(shù)據(jù)集為給定的渠道賦予檢測標(biāo)簽時(shí),執(zhí)行如下操作:對(duì)于給定的渠道,根據(jù)其歷史行為計(jì)算其可信度;以該渠道的渠道id作為變量,從設(shè)定的hash函數(shù)集中選取一個(gè)hash函數(shù);基于渠道可信度抽樣用戶群;對(duì)抽樣得到的用戶群中每一個(gè)用戶,以用戶id作為變量,根據(jù)抽取得到的hash函數(shù)從該用戶的檢測標(biāo)簽中選出該渠道對(duì)應(yīng)的檢測標(biāo)簽;建立[用戶id、檢測標(biāo)簽]到渠道id的渠道索引。進(jìn)一步地,所述攔截模塊在根據(jù)由用戶正常標(biāo)簽產(chǎn)生推送信息的概率,對(duì)用戶接收的推送信息進(jìn)行攔截時(shí),執(zhí)行如下操作:如果推送信息由正常標(biāo)簽產(chǎn)生的概率低于設(shè)定的第二閾值,則進(jìn)行攔截,否則向用戶展示該推送信息。進(jìn)一步地,所述檢測標(biāo)簽添加模塊還用于根據(jù)用戶正常標(biāo)簽的變化更新用戶檢測標(biāo)簽的步驟,具體執(zhí)行如下步驟:根據(jù)新的正常標(biāo)簽與現(xiàn)有檢測標(biāo)簽同時(shí)出現(xiàn)概率,刪除與用戶新的正常標(biāo)簽同時(shí)出現(xiàn)概率高的檢測標(biāo)簽;重新為用戶添加新的檢測標(biāo)簽,新添加的檢測標(biāo)簽與用戶現(xiàn)有標(biāo)簽同時(shí)出現(xiàn)的概率低于第一閾值。進(jìn)一步地,所述渠道關(guān)聯(lián)模塊還用于從渠道索引中除去被刪除檢測標(biāo)簽相關(guān)項(xiàng)。本發(fā)明提出了一種標(biāo)簽數(shù)據(jù)泄漏渠道檢測方法及裝置,利用標(biāo)簽在同一用戶出現(xiàn)的不同概率,對(duì)不同數(shù)據(jù)使用渠道產(chǎn)生不同的檢測標(biāo)簽。然后對(duì)檢測標(biāo)簽的使用進(jìn)行間接檢測,最后通過海量數(shù)據(jù)索引和搜索技術(shù)有效地檢測可能的數(shù)據(jù)泄露渠道。檢測方法效率高,能夠處理海量、動(dòng)態(tài)的用戶標(biāo)簽數(shù)據(jù)。附圖說明圖1為本發(fā)明標(biāo)簽數(shù)據(jù)泄漏渠道檢測方法流程圖;圖2為本發(fā)明標(biāo)簽數(shù)據(jù)泄漏渠道檢測裝置結(jié)構(gòu)示意圖。具體實(shí)施方式下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明技術(shù)方案做進(jìn)一步詳細(xì)說明,以下實(shí)施例不構(gòu)成對(duì)本發(fā)明的限定。用戶瀏覽互聯(lián)網(wǎng)時(shí),瀏覽的網(wǎng)頁會(huì)為用戶生成表示其偏好的標(biāo)簽,互聯(lián)網(wǎng)發(fā)展中積累了大量以標(biāo)簽來表示的用戶偏好數(shù)據(jù)。本發(fā)明在用戶擁有正常標(biāo)簽的基礎(chǔ)上,為每一個(gè)用戶加一定量的檢測標(biāo)簽,當(dāng)發(fā)現(xiàn)有檢測標(biāo)簽導(dǎo)致的推送信息時(shí),可以根據(jù)該推送信息查找用戶標(biāo)簽數(shù)據(jù)泄漏的渠道。本實(shí)施例推送信息可以包括廣告,推送的網(wǎng)頁等,以下以廣告為例進(jìn)行說明。本實(shí)施例一種標(biāo)簽數(shù)據(jù)泄漏渠道檢測方法,如圖1所示,包括:步驟s1、在用戶擁有的正常標(biāo)簽基礎(chǔ)上為用戶添加檢測標(biāo)簽,生成用戶標(biāo)簽數(shù)據(jù)集。本實(shí)施例將由用戶上網(wǎng)而產(chǎn)生的標(biāo)識(shí)用戶偏好的標(biāo)簽稱為正常標(biāo)簽,而將通過本步驟為用戶生成的用于后續(xù)檢測的標(biāo)簽稱為檢測標(biāo)簽,顯然檢測標(biāo)簽不代表用戶的偏好,僅用作后續(xù)的檢測。用戶標(biāo)簽數(shù)據(jù)集包括正常標(biāo)簽和檢測標(biāo)簽。為了后續(xù)分析方便,每個(gè)用戶需有足夠多的檢測標(biāo)簽,以便對(duì)應(yīng)不同的渠道。為此,當(dāng)用戶沒有足夠多的檢測標(biāo)簽時(shí),為用戶生成檢測標(biāo)簽,使用戶的檢測標(biāo)簽達(dá)到設(shè)定的數(shù)量。例如,用戶u1有兩個(gè)正常標(biāo)簽,分別為:看電視、垃圾快餐,而本實(shí)施例要求的檢測標(biāo)簽為兩個(gè),則為其產(chǎn)生兩個(gè)檢測標(biāo)簽,例如為:蔬菜、登山鞋。具體生成用戶檢測標(biāo)簽的過程如下:判斷用戶標(biāo)簽數(shù)據(jù)集中是否有指定數(shù)量的檢測標(biāo)簽,如果已經(jīng)達(dá)到指定的數(shù)量則結(jié)束,否則進(jìn)入下一步;生成一個(gè)與用戶現(xiàn)有標(biāo)簽同時(shí)出現(xiàn)概率低于設(shè)定的第一閾值的標(biāo)簽, 將該標(biāo)簽作為用戶的檢測標(biāo)簽加入到用戶標(biāo)簽數(shù)據(jù)集。其中,在生成新的檢測標(biāo)簽時(shí),需要在常見的標(biāo)簽中找到一個(gè)與用戶現(xiàn)有的正常標(biāo)簽、現(xiàn)有的檢測標(biāo)簽同時(shí)出現(xiàn)概率較低的標(biāo)簽,即新生成的檢測標(biāo)簽與用戶標(biāo)簽集中現(xiàn)有標(biāo)簽均不相似,具有差異性,同時(shí)出現(xiàn)的概率低。步驟s2、根據(jù)用戶標(biāo)簽數(shù)據(jù)集為給定的渠道賦予檢測標(biāo)簽,建立用戶id、檢測標(biāo)簽和渠道id相關(guān)聯(lián)的渠道索引。對(duì)于給定的渠道,可以根據(jù)其歷史行為計(jì)算其可信度。本實(shí)施例渠道是指使用用戶數(shù)據(jù)的渠道,例如一個(gè)網(wǎng)絡(luò)平臺(tái)將自己的用戶數(shù)據(jù)提供給一個(gè)廣告商,該廣告商就是網(wǎng)絡(luò)平臺(tái)的客戶,也是使用用戶數(shù)據(jù)的一個(gè)渠道。渠道的可信度是指該渠道根據(jù)用戶數(shù)據(jù)發(fā)送廣告的可信度,如果該渠道不是基于用戶數(shù)據(jù)來推送廣告,而是將用戶不感興趣的廣告推送給用戶則不可信。并且可以利用該渠道的唯一id作為變量key,從一個(gè)設(shè)定的hash函數(shù)集里面選取hash函數(shù)h1。接下來基于渠道可信度抽樣用戶群,可信度高的渠道抽樣人群可以小一些。然后對(duì)抽樣人群的每一個(gè)用戶,以用戶id為key,用h1函數(shù)從該用戶的檢測標(biāo)簽集中選出該渠道對(duì)應(yīng)的檢測標(biāo)簽。例如對(duì)于給定的渠道1,抽樣用戶中包括用戶u1,通過h1函數(shù)與用戶u1的用戶id計(jì)算得到一個(gè)隨機(jī)值,根據(jù)該隨機(jī)值從用戶u1的所有檢測標(biāo)簽中選擇一個(gè)檢測標(biāo)簽賦予給渠道1。例如渠道1,通過h1函數(shù)計(jì)算得到的隨機(jī)值為1,則根據(jù)用戶1檢測標(biāo)簽的排序,選擇第一個(gè)檢測標(biāo)簽賦予給渠道1。假設(shè)將用戶u1的檢測標(biāo)簽“蔬菜”賦予給渠道1。同樣地,將用戶u1的檢測標(biāo)簽“登山鞋”賦予給渠道2。這樣就可以建立[用戶id,檢測標(biāo)簽]到渠道id的渠道索引,即在渠道索引中建立一條記錄,例如建立如表1所示的渠道索引:序號(hào)[用戶id,檢測標(biāo)簽]渠道id1[u1,蔬菜]渠道12[u1,登山鞋]渠道2表1在用戶標(biāo)簽數(shù)據(jù)集中加入檢測標(biāo)簽,僅將與渠道對(duì)應(yīng)的檢測標(biāo)簽賦予給對(duì)應(yīng)的渠道,例如將[u1,登山鞋]賦予給渠道2。如果渠道2根據(jù)用戶標(biāo)簽數(shù)據(jù)集來推送廣告,無論是根據(jù)正常標(biāo)簽還是檢測標(biāo)簽[u1,登山鞋]發(fā)送的廣告都認(rèn)為是安全的。而非法的用戶獲得泄漏的用戶標(biāo)簽數(shù)據(jù)后,也向用戶發(fā)送登山鞋之類的廣告,根據(jù)渠道索引發(fā)現(xiàn)該非法渠道不是渠道索引中的渠道2時(shí),則認(rèn)為用戶標(biāo)簽數(shù)據(jù)發(fā)生了泄漏。步驟s3、根據(jù)由用戶正常標(biāo)簽產(chǎn)生推送信息的概率,對(duì)用戶接收的推送信息進(jìn)行攔截。一般情況下,由于用戶上網(wǎng)的終端一般都在用戶一側(cè),因此用戶接收到的廣告是反映在用戶的終端上的,對(duì)于廣告的檢測首先可以在用戶終端上的客戶端上進(jìn)行。例如現(xiàn)在很多個(gè)人電腦和智能手機(jī)上都安裝了安全助手,可以直接采用現(xiàn)有的安全助手在用戶終端上進(jìn)行廣告攔截。當(dāng)然也可以開發(fā)特定的客戶端,用于在用戶終端上進(jìn)行廣告檢測。在進(jìn)行廣告攔截時(shí),如果廣告由正常標(biāo)簽產(chǎn)生的概率低于設(shè)定的第二閾值,則進(jìn)行攔截,否則向用戶展示該廣告。容易理解的是,如果采用用戶終端現(xiàn)有的安全助手,在步驟s2中,對(duì)于用戶標(biāo)簽數(shù)據(jù)集,首先要過濾掉其中沒有安裝安全助手的人群。即僅對(duì)安裝了安全助手的人群進(jìn)行抽樣,對(duì)于沒有安裝安全助手的用戶不予考慮。這樣可以不需要額外開發(fā)客戶端,直接采用用戶的安全助手來進(jìn)行用戶終端一側(cè)的廣告過濾。具體地,對(duì)廣告進(jìn)行過濾,即根據(jù)由用戶正常標(biāo)簽產(chǎn)生廣告的概率,對(duì)用戶接收的廣告進(jìn)行攔截,如果該廣告由正常標(biāo)簽產(chǎn)生的概率低于設(shè)定的閾值,則進(jìn)入下一步處理,否則向用戶展示該廣告。需要說明的是,用戶正常標(biāo)簽需要同步到該用戶的用戶端安全助手中,以便安全助手根據(jù)正常標(biāo)簽產(chǎn)生該廣告的概率來進(jìn)行攔截。根據(jù)正常標(biāo)簽產(chǎn)生該廣告的概率,一般由安全助手根據(jù)該廣告來源與用戶正常標(biāo)簽的匹配程度來計(jì)算,這里不再贅述。對(duì)于由正常標(biāo)簽產(chǎn)生的概率低于設(shè)定的閾值的廣告,進(jìn)行攔截并發(fā)送到專門的后臺(tái)服務(wù)器端進(jìn)行下一步的處理。步驟s4、對(duì)于攔截的推送信息,根據(jù)由該用戶檢測標(biāo)簽產(chǎn)生該推送信息的概率進(jìn)行篩選,如果由該用戶檢測標(biāo)簽產(chǎn)生該推送信息的概率高于給定的閾值,則將該該用戶檢測標(biāo)簽加入到疑似泄漏標(biāo)簽集合。對(duì)于發(fā)送到后臺(tái)服務(wù)器端的廣告,進(jìn)一步根據(jù)由該用戶檢測標(biāo)簽產(chǎn)生該廣告的概率進(jìn)行篩選。如果由某一用戶檢測標(biāo)簽產(chǎn)生該廣告的概率高于給定的閾值,則將該用戶檢測標(biāo)簽加入到疑似泄漏標(biāo)簽集合。例如一個(gè)發(fā)送到用戶u1的登山杖的廣告,根據(jù)正常標(biāo)簽“看電視”、“垃圾快餐”產(chǎn)生的概率比較低,被發(fā)送到后臺(tái)服務(wù)器端。然而對(duì)于用戶u1的檢測標(biāo)簽“登山鞋”,由“登山鞋”產(chǎn)生該廣告的概率卻比較高,因此[用戶u1,登山鞋]被加入到疑似泄漏標(biāo)簽集合。步驟s5、根據(jù)疑似泄漏標(biāo)簽集合,搜索渠道索引,得到對(duì)應(yīng)的疑似泄漏渠道id列表。接下來,從疑似泄漏標(biāo)簽集合中取出疑似標(biāo)簽,并在渠道索引中進(jìn)行搜索,得到有可能的渠道id排序列表。例如前面這個(gè)例子中,從疑似泄漏標(biāo)簽集合中取出疑似泄漏標(biāo)簽[用戶u1,登山鞋],在渠道索引中因?yàn)榍?的檢測標(biāo)簽有“登山鞋”,將渠道2加入到疑似泄漏渠道id列表。步驟s6、檢測該推送信息是否來源于所搜索到的渠道,如果是,刪除對(duì)應(yīng)的渠道,將剩下的渠道作為疑似泄漏渠道輸出。最后,需要檢測該用戶終端的廣告來源是否是渠道2,如果是的話則表明是合規(guī)情況,從渠道列表中刪除。最終渠道列表中包括了所有可能的標(biāo)簽數(shù)據(jù)泄露渠道。對(duì)這些渠道,可以采取更多的調(diào)查手段收集證據(jù),例如在合作數(shù)據(jù)中加入可監(jiān)控的誘餌(蜜罐)數(shù)據(jù),結(jié)合線下調(diào)查等手段。進(jìn)一步地,由于用戶的正常標(biāo)簽經(jīng)常得到更新,在更新了用戶的正常標(biāo)簽后,需要更新該用戶的檢測標(biāo)簽。本實(shí)施例用戶檢測標(biāo)簽更新的過程如下:根據(jù)新的正常標(biāo)簽與現(xiàn)有檢測標(biāo)簽同時(shí)出現(xiàn)概率,刪除與用戶新的正常標(biāo)簽同時(shí)出現(xiàn)概率高的檢測標(biāo)簽;重新為用戶添加新的檢測標(biāo)簽,新添加的檢測標(biāo)簽與用戶現(xiàn)有標(biāo)簽同時(shí)出現(xiàn)的概率低于第一閾值。對(duì)應(yīng)地,還需要對(duì)渠道索引進(jìn)行更新:從渠道索引中除去被刪除檢測標(biāo)簽相關(guān)項(xiàng)。從而更新了渠道索引,以便再次攔截廣告時(shí),采用新的渠道索引來檢測疑似泄漏渠道。如圖2所示,一種標(biāo)簽數(shù)據(jù)泄漏渠道檢測裝置,用于檢測用戶標(biāo)簽數(shù)據(jù)的泄漏渠道,該檢測裝置包括:檢測標(biāo)簽添加模塊,用于在用戶擁有的正常標(biāo)簽基礎(chǔ)上為用戶添加檢測標(biāo)簽,生成用戶標(biāo)簽數(shù)據(jù)集;渠道關(guān)聯(lián)模塊,用于根據(jù)用戶標(biāo)簽數(shù)據(jù)集為給定的渠道賦予檢測標(biāo)簽,建立用戶id、檢測標(biāo)簽和渠道id相關(guān)聯(lián)的渠道索引;攔截模塊,用于根據(jù)由用戶正常標(biāo)簽產(chǎn)生推送信息的概率,對(duì)用戶接收的推送信息進(jìn)行攔截;攔截信息分析模塊,用于對(duì)于攔截的推送信息,根據(jù)由該用戶檢測標(biāo)簽產(chǎn)生該推送信息的概率進(jìn)行篩選,如果由該用戶檢測標(biāo)簽產(chǎn)生該推送信息的概率高于給定的閾值,則將該用戶檢測標(biāo)簽加入到疑似泄漏標(biāo)簽集合;渠道檢索模塊,用于根據(jù)疑似泄漏標(biāo)簽集合,搜索渠道索引,得到對(duì)應(yīng)的疑似泄漏渠道id列表;輸出模塊,用于檢測該推送信息是否來源于所搜索到的渠道,如果是,刪除對(duì)應(yīng)的渠道,將剩下的渠道作為疑似泄漏渠道輸出。容易理解的是,本實(shí)施例的裝置可以應(yīng)用于應(yīng)用系統(tǒng)的后臺(tái)服務(wù)器,其中攔截模塊可以集成在用戶終端,在用戶終端側(cè)進(jìn)行攔截,該攔截模塊可以采用第三方的客戶端如安全衛(wèi)士,或?qū)iT的客戶端來進(jìn)行攔截。本實(shí)施例檢測標(biāo)簽添加模塊在用戶擁有的正常標(biāo)簽基礎(chǔ)上為用戶添加檢測標(biāo)簽時(shí),新添加的檢測標(biāo)簽與用戶現(xiàn)有標(biāo)簽同時(shí)出現(xiàn)的概率低于設(shè)定的第一閾值。即新生成的檢測標(biāo)簽與用戶標(biāo)簽集中現(xiàn)有標(biāo)簽均不相似,具有差異性,同時(shí)出現(xiàn)的概率低,從而不會(huì)相互發(fā)生影響。本實(shí)施例渠道關(guān)聯(lián)模塊在根據(jù)用戶標(biāo)簽數(shù)據(jù)集為給定的渠道賦予檢 測標(biāo)簽時(shí),執(zhí)行如下操作:對(duì)于給定的渠道,根據(jù)其歷史行為計(jì)算其可信度;以該渠道的渠道id作為變量,從設(shè)定的hash函數(shù)集中選取一個(gè)hash函數(shù);基于渠道可信度抽樣用戶群;對(duì)抽樣得到的用戶群中每一個(gè)用戶,以用戶id作為變量,根據(jù)抽取得到的hash函數(shù)從該用戶的檢測標(biāo)簽中選出該渠道對(duì)應(yīng)的檢測標(biāo)簽;建立[用戶id、檢測標(biāo)簽]到渠道id的渠道索引。本實(shí)施例攔截模塊在根據(jù)由用戶正常標(biāo)簽產(chǎn)生推送信息的概率,對(duì)用戶接收的推送信息進(jìn)行攔截時(shí),執(zhí)行如下操作:如果推送信息由正常標(biāo)簽產(chǎn)生的概率低于設(shè)定的第二閾值,則進(jìn)行攔截,否則向用戶展示該推送信息。本實(shí)施例檢測標(biāo)簽添加模塊還用于根據(jù)用戶正常標(biāo)簽的變化更新用戶檢測標(biāo)簽的步驟,具體執(zhí)行如下步驟:根據(jù)新的正常標(biāo)簽與現(xiàn)有檢測標(biāo)簽同時(shí)出現(xiàn)概率,刪除與用戶新的正常標(biāo)簽同時(shí)出現(xiàn)概率高的檢測標(biāo)簽;重新為用戶添加新的檢測標(biāo)簽,新添加的檢測標(biāo)簽與用戶現(xiàn)有標(biāo)簽同時(shí)出現(xiàn)的概率低于第一閾值。本實(shí)施例渠道關(guān)聯(lián)模塊還用于從渠道索引中除去被刪除檢測標(biāo)簽相關(guān)項(xiàng)。從而在用戶產(chǎn)生新的正常標(biāo)簽時(shí),及時(shí)對(duì)用戶標(biāo)簽集進(jìn)行更新。以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案而非對(duì)其進(jìn)行限制,在不背離本發(fā)明精神及其實(shí)質(zhì)的情況下,熟悉本領(lǐng)域的技術(shù)人員當(dāng)可根據(jù)本發(fā)明作出各種相應(yīng)的改變和變形,但這些相應(yīng)的改變和變形都應(yīng)屬于本發(fā)明所附的權(quán)利要求的保護(hù)范圍。當(dāng)前第1頁12