国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種網(wǎng)絡(luò)直播平臺(tái)中的作弊用戶識(shí)別方法與系統(tǒng)的制作方法

      文檔序號(hào):10656584閱讀:510來(lái)源:國(guó)知局
      一種網(wǎng)絡(luò)直播平臺(tái)中的作弊用戶識(shí)別方法與系統(tǒng)的制作方法
      【專利摘要】本發(fā)明屬于互聯(lián)網(wǎng)技術(shù)領(lǐng)域,公開(kāi)了一種網(wǎng)絡(luò)直播平臺(tái)中的作弊用戶識(shí)別方法與系統(tǒng)。其中,所述方法包括:根據(jù)已有的作弊用戶和非作弊用戶的數(shù)據(jù)建立訓(xùn)練樣本集;利用上述訓(xùn)練樣本集訓(xùn)練作弊用戶識(shí)別模型,所述作弊用戶識(shí)別模型用于識(shí)別用戶是否為作弊用戶;利用所述作弊用戶識(shí)別模型判斷待識(shí)別用戶是否為作弊用戶。從而可以在網(wǎng)絡(luò)直接平臺(tái)中利用上述方法判斷作弊用戶,保證直播平臺(tái)發(fā)放免費(fèi)虛擬獎(jiǎng)品活動(dòng)的本身目的,節(jié)約活動(dòng)資源,有利于網(wǎng)絡(luò)直播行業(yè)的健康發(fā)展。
      【專利說(shuō)明】
      一種網(wǎng)絡(luò)直播平臺(tái)中的作弊用戶識(shí)別方法與系統(tǒng)
      技術(shù)領(lǐng)域
      [0001]本發(fā)明屬于互聯(lián)網(wǎng)技術(shù)領(lǐng)域,更具體地,涉及一種網(wǎng)絡(luò)直播平臺(tái)中的作弊用戶識(shí)別方法與系統(tǒng)。
      【背景技術(shù)】
      [0002]隨著網(wǎng)絡(luò)直播行業(yè)的發(fā)展,用戶可以通過(guò)在網(wǎng)絡(luò)直播平臺(tái)上觀看、做活動(dòng)等方式領(lǐng)取虛擬獎(jiǎng)品,并將獲得的虛擬獎(jiǎng)品贈(zèng)送給自己喜歡的主播,進(jìn)行互動(dòng),從而培養(yǎng)用戶的觀看習(xí)慣和平臺(tái)粘性。但目前,有部分用戶注冊(cè)賬號(hào)通過(guò)平臺(tái)活動(dòng)獲取大量的虛擬獎(jiǎng)品,并將免費(fèi)獲得的虛擬獎(jiǎng)品進(jìn)行售賣,獲取非法利益。這些作弊用戶的存在嚴(yán)重破壞了直播平臺(tái)發(fā)放免費(fèi)虛擬獎(jiǎng)品活動(dòng)的本身目的,侵占了活動(dòng)的資源,不利于網(wǎng)絡(luò)直播行業(yè)的健康發(fā)展。

      【發(fā)明內(nèi)容】

      [0003]針對(duì)現(xiàn)有技術(shù)的以上缺陷或改進(jìn)需求,本發(fā)明提供了一種網(wǎng)絡(luò)直播平臺(tái)中的作弊用戶識(shí)別方法與系統(tǒng),其目的在于能夠自動(dòng)識(shí)別網(wǎng)絡(luò)直播平臺(tái)中的作弊用戶,由此解決作弊用戶在網(wǎng)絡(luò)直播平臺(tái)中刷取虛擬禮物的技術(shù)問(wèn)題。
      [0004]為實(shí)現(xiàn)上述目的,按照本發(fā)明的一個(gè)方面,提供了一種網(wǎng)絡(luò)直播平臺(tái)中的作弊用戶識(shí)別方法,包括:
      [0005]根據(jù)已有的作弊用戶和非作弊用戶的數(shù)據(jù)建立訓(xùn)練樣本集;其中所述數(shù)據(jù)至少包括用戶的行為信息;
      [0006]利用上述訓(xùn)練樣本集訓(xùn)練作弊用戶識(shí)別模型,所述作弊用戶識(shí)別模型用于識(shí)別用戶是否為作弊用戶;
      [0007]利用所述作弊用戶識(shí)別模型判斷待識(shí)別用戶是否為作弊用戶。
      [0008]在本發(fā)明的一個(gè)實(shí)施例中,所述用戶的行為信息至少包括觀看信息、彈幕信息和交易信息;
      [0009]其中所述觀看信息包括統(tǒng)計(jì)月觀看天數(shù)、觀看次數(shù)、觀看時(shí)長(zhǎng)、觀看房間數(shù)、觀看設(shè)備數(shù)以及觀看IP數(shù);彈幕信息包含統(tǒng)計(jì)月發(fā)送彈幕天數(shù)、發(fā)送彈幕次數(shù)以及發(fā)送彈幕房間數(shù);交易信息包含月虛擬禮物贈(zèng)送天數(shù)、虛擬禮物贈(zèng)送次數(shù)、虛擬禮物贈(zèng)送量、虛擬禮物贈(zèng)送房間數(shù)、獲取虛擬禮物天數(shù)、獲取虛擬禮物次數(shù)、獲取虛擬禮物量、分享獲得虛擬禮物天數(shù)、分享獲得虛擬禮物次數(shù)、分享獲得虛擬禮物量和其他維度獲取虛擬禮物指標(biāo)。
      [0010]在本發(fā)明的一個(gè)實(shí)施例中,所述數(shù)據(jù)還包括用戶的基礎(chǔ)信息,所述用戶的基礎(chǔ)信息包括用戶注冊(cè)時(shí)長(zhǎng)、用戶等級(jí)、用戶郵箱認(rèn)證狀態(tài)、用戶手機(jī)認(rèn)證狀態(tài)、來(lái)源類型以及注冊(cè)地。
      [0011]在本發(fā)明的一個(gè)實(shí)施例中,其中所述用戶的行為信息還包括登錄信息和彈幕信息,其中:
      [0012]所述登錄信息包括統(tǒng)計(jì)月登錄次數(shù)、登錄天數(shù);充值信息包括統(tǒng)計(jì)月充值次數(shù)、充值金額;彈幕信息包含統(tǒng)計(jì)月發(fā)送彈幕天數(shù)、發(fā)送彈幕次數(shù)以及發(fā)送彈幕房間數(shù)。
      [0013]在本發(fā)明的一個(gè)實(shí)施例中,所述利用上述訓(xùn)練樣本集訓(xùn)練作弊用戶識(shí)別模型具體包括:
      [0014]數(shù)據(jù)處理,對(duì)上述訓(xùn)練樣本集中的數(shù)據(jù)進(jìn)行處理轉(zhuǎn)換,對(duì)缺失值進(jìn)行填充,去除極大值和極小值;
      [0015]模型構(gòu)建,將上述處理后得到的數(shù)據(jù)按照m:n的比例抽樣進(jìn)行拆分,劃分成訓(xùn)練集和測(cè)試集,利用訓(xùn)練集用戶構(gòu)建識(shí)別模型;
      [0016]模型驗(yàn)證,運(yùn)用測(cè)試集對(duì)識(shí)別模型進(jìn)行評(píng)估,選擇最優(yōu)的用戶識(shí)別模型。
      [0017]按照本發(fā)明的另一方面,還提供了一種網(wǎng)絡(luò)直播平臺(tái)中的作弊用戶識(shí)別系統(tǒng),包括訓(xùn)練樣本集建立模塊、作弊用戶識(shí)別模型建立模塊以及作弊用戶識(shí)別模塊,其中:
      [0018]所述訓(xùn)練樣本集建立模塊,用于根據(jù)已有的作弊用戶和非作弊用戶的數(shù)據(jù)建立訓(xùn)練樣本集;其中所述數(shù)據(jù)至少包括用戶的行為信息;
      [0019]所述作弊用戶識(shí)別模型建立模塊,用于利用上述訓(xùn)練樣本集訓(xùn)練作弊用戶識(shí)別模型,所述作弊用戶識(shí)別模型用于識(shí)別用戶是否為作弊用戶;
      [0020]所述作弊用戶識(shí)別模塊,用于利用所述作弊用戶識(shí)別模型判斷待識(shí)別用戶是否為作弊用戶。
      [0021]在本發(fā)明的一個(gè)實(shí)施例中,所述用戶的行為信息至少包括觀看信息、彈幕信息和交易信息;
      [0022]其中所述觀看信息包括統(tǒng)計(jì)月觀看天數(shù)、觀看次數(shù)、觀看時(shí)長(zhǎng)、觀看房間數(shù)、觀看設(shè)備數(shù)以及觀看IP數(shù);彈幕信息包含統(tǒng)計(jì)月發(fā)送彈幕天數(shù)、發(fā)送彈幕次數(shù)以及發(fā)送彈幕房間數(shù);交易信息包含月虛擬禮物贈(zèng)送天數(shù)、虛擬禮物贈(zèng)送次數(shù)、虛擬禮物贈(zèng)送量、虛擬禮物贈(zèng)送房間數(shù)、獲取虛擬禮物天數(shù)、獲取虛擬禮物次數(shù)、獲取虛擬禮物量、分享獲得虛擬禮物天數(shù)、分享獲得虛擬禮物次數(shù)、分享獲得虛擬禮物量和其他維度獲取虛擬禮物指標(biāo)。
      [0023]在本發(fā)明的一個(gè)實(shí)施例中,所述數(shù)據(jù)還包括用戶的基礎(chǔ)信息,所述用戶的基礎(chǔ)信息包括用戶注冊(cè)時(shí)長(zhǎng)、用戶等級(jí)、用戶郵箱認(rèn)證狀態(tài)、用戶手機(jī)認(rèn)證狀態(tài)、來(lái)源類型以及注冊(cè)地。
      [0024]在本發(fā)明的一個(gè)實(shí)施例中,其中所述用戶的行為信息還包括登錄信息和彈幕信息,其中:
      [0025]所述登錄信息包括統(tǒng)計(jì)月登錄次數(shù)、登錄天數(shù);充值信息包括統(tǒng)計(jì)月充值次數(shù)、充值金額;彈幕信息包含統(tǒng)計(jì)月發(fā)送彈幕天數(shù)、發(fā)送彈幕次數(shù)以及發(fā)送彈幕房間數(shù)。
      [0026]在本發(fā)明的一個(gè)實(shí)施例中,所述作弊用戶識(shí)別模型建立模塊具體包括數(shù)據(jù)處理子模塊、模型構(gòu)建子模塊以及模型驗(yàn)證子模塊,其中:
      [0027]所述數(shù)據(jù)處理子模塊,用于對(duì)上述訓(xùn)練樣本集中的數(shù)據(jù)進(jìn)行處理轉(zhuǎn)換,對(duì)缺失值進(jìn)行填充,去除極大值和極小值;
      [0028]所述模型構(gòu)建子模塊,用于將上述處理后得到的數(shù)據(jù)按照m:n的比例抽樣進(jìn)行拆分,劃分成訓(xùn)練集和測(cè)試集,利用訓(xùn)練集用戶構(gòu)建識(shí)別模型;
      [0029]所述模型驗(yàn)證子模塊,用于運(yùn)用測(cè)試集對(duì)識(shí)別模型進(jìn)行評(píng)估,選擇最優(yōu)的用戶識(shí)別模型。
      [0030]本發(fā)明實(shí)施例中,根據(jù)已有的作弊用戶和非作弊用戶的數(shù)據(jù)建立訓(xùn)練樣本集;利用上述訓(xùn)練樣本集訓(xùn)練作弊用戶識(shí)別模型,所述作弊用戶識(shí)別模型用于識(shí)別用戶是否為作弊用戶;利用所述作弊用戶識(shí)別模型判斷待識(shí)別用戶是否為作弊用戶。從而可以在網(wǎng)絡(luò)直接平臺(tái)中利用上述方法判斷作弊用戶,保證直播平臺(tái)發(fā)放免費(fèi)虛擬獎(jiǎng)品活動(dòng)的本身目的,節(jié)約活動(dòng)資源,有利于網(wǎng)絡(luò)直播行業(yè)的健康發(fā)展。。
      【附圖說(shuō)明】
      [0031]圖1是本發(fā)明實(shí)施例中一種網(wǎng)絡(luò)直播平臺(tái)中的作弊用戶識(shí)別方法的流程示意圖;
      [0032]圖2是本發(fā)明實(shí)施例中訓(xùn)練作弊用戶識(shí)別模型的方法流程示意圖;
      [0033]圖3是本發(fā)明實(shí)施例中一種網(wǎng)絡(luò)直播平臺(tái)中的作弊用戶識(shí)別系統(tǒng)的結(jié)構(gòu)示意圖;
      [0034]圖4是本發(fā)明實(shí)施例中作弊用戶識(shí)別模型建立模塊的結(jié)構(gòu)示意圖;
      [0035]圖5是本發(fā)明實(shí)施例中一種網(wǎng)絡(luò)直播平臺(tái)中的作弊用戶識(shí)別服務(wù)器的結(jié)構(gòu)示意圖。
      【具體實(shí)施方式】
      [0036]為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。此外,下面所描述的本發(fā)明各個(gè)實(shí)施方式中所涉及到的技術(shù)特征只要彼此之間未構(gòu)成沖突就可以相互組合。
      [0037]如圖1所示,本發(fā)明提供了一種網(wǎng)絡(luò)直播平臺(tái)中的作弊用戶識(shí)別方法,包括:
      [0038]S1、根據(jù)已有的作弊用戶和非作弊用戶的數(shù)據(jù)建立訓(xùn)練樣本集;其中所述數(shù)據(jù)至少包括用戶的行為信息;
      [0039]其中所述用戶的行為信息至少包括觀看信息、彈幕信息和交易信息;
      [0040]其中所述觀看信息包括統(tǒng)計(jì)月觀看天數(shù)、觀看次數(shù)、觀看時(shí)長(zhǎng)、觀看房間數(shù)、觀看設(shè)備數(shù)以及觀看IP數(shù);彈幕信息包含統(tǒng)計(jì)月發(fā)送彈幕天數(shù)、發(fā)送彈幕次數(shù)以及發(fā)送彈幕房間數(shù);交易信息包含月虛擬禮物贈(zèng)送天數(shù)、虛擬禮物贈(zèng)送次數(shù)、虛擬禮物贈(zèng)送量、虛擬禮物贈(zèng)送房間數(shù)、獲取虛擬禮物天數(shù)、獲取虛擬禮物次數(shù)、獲取虛擬禮物量、分享獲得虛擬禮物天數(shù)、分享獲得虛擬禮物次數(shù)、分享獲得虛擬禮物量和其他維度獲取虛擬禮物指標(biāo);
      [0041]進(jìn)一步地,所述用戶的行為信息還可以包括登錄信息和彈幕信息,其中:所述登錄信息包括統(tǒng)計(jì)月登錄次數(shù)、登錄天數(shù);充值信息包括統(tǒng)計(jì)月充值次數(shù)、充值金額;彈幕信息包含統(tǒng)計(jì)月發(fā)送彈幕天數(shù)、發(fā)送彈幕次數(shù)以及發(fā)送彈幕房間數(shù)。
      [0042]進(jìn)一步地,所述數(shù)據(jù)還可以包括用戶的基礎(chǔ)信息,所述用戶的基礎(chǔ)信息包括用戶注冊(cè)時(shí)長(zhǎng)、用戶等級(jí)、用戶郵箱認(rèn)證狀態(tài)、用戶手機(jī)認(rèn)證狀態(tài)、來(lái)源類型以及注冊(cè)地。
      [0043]需要說(shuō)明的是,在上述這些信息當(dāng)中,觀看信息、彈幕信息和交易信息等數(shù)據(jù)對(duì)判斷是否刷虛擬禮物起關(guān)鍵作用;用戶的基礎(chǔ)信息、登錄信息,可以輔助分析用戶是否刷虛擬禮物的特征。
      [0044]為了建立數(shù)據(jù)庫(kù),可以將已有的作弊用戶定義為正樣本,將已有的非作弊用戶定義為負(fù)樣本;按照正負(fù)樣本=1:N的比例抽樣構(gòu)建建模訓(xùn)練樣本集。其中N為預(yù)設(shè)值。具體地:
      [0045]可以將通過(guò)規(guī)則識(shí)別和反饋的疑似刷虛擬禮物用戶,定義為正樣本,將“是否刷虛擬禮物用戶”(在本發(fā)明實(shí)施例中,我們以直播平臺(tái)中刷虛擬禮物的用戶定義為作弊用戶,在此稱為刷虛擬禮物用戶)指標(biāo)標(biāo)記為I;提取當(dāng)月其他贈(zèng)送虛擬禮物的用戶,定義為負(fù)樣本,并將“是否刷虛擬禮物用戶”指標(biāo)標(biāo)記為O,按照正負(fù)樣本=1:N的比例抽樣構(gòu)建建模所需的數(shù)據(jù)。
      [0046]S2、利用上述訓(xùn)練樣本集訓(xùn)練作弊用戶識(shí)別模型,所述作弊用戶識(shí)別模型用于識(shí)別用戶是否為作弊用戶;如圖2所示,本步驟具體包括如下子步驟:
      [0047]S21、數(shù)據(jù)處理:對(duì)上述訓(xùn)練樣本集中的數(shù)據(jù)進(jìn)行處理轉(zhuǎn)換,對(duì)缺失值進(jìn)行填充,去除極大值和極小值;具體地可以通過(guò)如下方式對(duì)數(shù)據(jù)進(jìn)行處理:
      [0048]a)并對(duì)初始提取的數(shù)據(jù)進(jìn)行多維分析,剔除無(wú)意義的指標(biāo)和缺失值多的指標(biāo);如剔除用戶等級(jí)、用戶郵箱認(rèn)證狀態(tài),用戶手機(jī)認(rèn)證狀態(tài)、來(lái)源類型,注冊(cè)地等指標(biāo);
      [0049]b)對(duì)離散型指標(biāo),使用卡方檢驗(yàn),計(jì)算指標(biāo)與目標(biāo)變量(是否為刷虛擬禮物用戶)的卡方值,剔除對(duì)目標(biāo)指標(biāo)影響不顯著的指標(biāo);卡方檢驗(yàn)的基本原理是通過(guò)卡方值的大小來(lái)檢驗(yàn)實(shí)際觀察值與理論值之間的偏離程度,判斷兩個(gè)或兩個(gè)以上指標(biāo)之間是否具有關(guān)聯(lián)關(guān)系的假設(shè)檢驗(yàn)。
      [0050]c)對(duì)連續(xù)性指標(biāo),使用方差分析,剔除對(duì)目標(biāo)指標(biāo)影響不顯著的指標(biāo);方差分析,是從觀察指標(biāo)的方差入手,研究諸多連續(xù)性指標(biāo)中哪些指標(biāo)是對(duì)目標(biāo)指標(biāo)(是否刷虛擬禮物)指標(biāo),有顯著影響的變量。
      [0051]d)對(duì)剩余的連續(xù)性指標(biāo),計(jì)對(duì)與目標(biāo)指標(biāo)之間的相關(guān)系數(shù),選擇與目標(biāo)指標(biāo)相關(guān)系數(shù)大的指標(biāo),并剔除輸入指標(biāo)中強(qiáng)相關(guān)指標(biāo),構(gòu)建t吳型的最終輸入指標(biāo);
      [0052]如:贈(zèng)送虛擬禮物房間數(shù)與贈(zèng)送虛擬禮物天數(shù)兩個(gè)指標(biāo)的相關(guān)系數(shù)為0.8505,屬于強(qiáng)相關(guān)指標(biāo)(一般相關(guān)系數(shù)大于0.8的,定義為強(qiáng)相關(guān)),應(yīng)剔除一個(gè)指標(biāo);贈(zèng)送虛擬禮物房間數(shù)與“是否刷虛擬禮物用戶“兩個(gè)指標(biāo)的相關(guān)系數(shù)為0.2040,贈(zèng)送虛擬禮物天數(shù)與“是否刷虛擬禮物用戶“兩個(gè)指標(biāo)的相關(guān)系數(shù)為0.1657,根據(jù)規(guī)則,剔除與目標(biāo)變量相關(guān)性小的贈(zèng)送虛擬禮物天數(shù)指標(biāo);以此類推,最終選擇15個(gè)指標(biāo)進(jìn)行構(gòu)建模型。
      [0053]S22、模型構(gòu)建:將上述處理后得到的數(shù)據(jù)按照m:n的比例抽樣進(jìn)行拆分,劃分成訓(xùn)練集和測(cè)試集,利用訓(xùn)練集用戶構(gòu)建識(shí)別模型;
      [0054]例如,可以將處理好的建模數(shù)據(jù)按照m:n(,其中所述m,n為預(yù)設(shè)值)的比例抽樣進(jìn)行拆分,劃分成訓(xùn)練集和測(cè)試集(如為3:1,75%的數(shù)據(jù)進(jìn)行訓(xùn)練,剩余25%的數(shù)據(jù)進(jìn)行測(cè)試),訓(xùn)練集用戶構(gòu)建識(shí)別模型,測(cè)試集對(duì)構(gòu)建的模型進(jìn)行驗(yàn)證,評(píng)估模型的效果;分別運(yùn)用決策樹算法,邏輯回歸算法分別建立模型,不同的算法修改不同的模型參數(shù),建立每種算法的最優(yōu)模型。
      [0055]S23、模型驗(yàn)證:運(yùn)用測(cè)試集對(duì)識(shí)別模型進(jìn)行評(píng)估,選擇最優(yōu)的用戶識(shí)別模型;
      [0056]具體地,在本步驟中,可以運(yùn)用測(cè)試集對(duì)每種算法的模型進(jìn)行預(yù)測(cè),評(píng)估,計(jì)算每種算法模型對(duì)應(yīng)的準(zhǔn)確率、查全率、提升度、F-Measure等考核指標(biāo),對(duì)比評(píng)估指標(biāo)的值,參考模型固化部署的復(fù)雜度,選擇最優(yōu)化的作弊用戶識(shí)別方法。
      [0057]準(zhǔn)確率:正確識(shí)別的刷虛擬禮物用戶數(shù)/識(shí)別出刷虛擬禮物的用戶數(shù);
      [0058]查全率:正確識(shí)別的刷虛擬禮物用戶數(shù)/測(cè)試集中刷虛擬禮物的用戶數(shù);
      [0059]提升度:準(zhǔn)確率/(測(cè)試集中刷虛擬禮物用戶數(shù)/測(cè)試集中所有用戶數(shù));
      [0060]F-Measure:正確率*召回率*2/(正確率+召回率)(F值即為正確率和召回率的調(diào)和平均值);[0061 ]通過(guò)同比,本發(fā)明實(shí)施例選擇用決策樹C5.0算法構(gòu)建的模型。
      [0062]S3、利用所述作弊用戶識(shí)別模型判斷待識(shí)別用戶是否為作弊用戶。
      [0063]具體地,為了方便地對(duì)作弊用戶進(jìn)行識(shí)別,可以將上述構(gòu)建的作弊用戶識(shí)別模型部署到產(chǎn)品中,根據(jù)最終的作弊用戶識(shí)別方法,抽取多條建模規(guī)則(如示例:if觀看IP數(shù)〉Mand觀看時(shí)長(zhǎng)〈N and彈幕發(fā)送次數(shù)<L then IIf觀看IP數(shù)〉M and觀看時(shí)長(zhǎng)〈N and彈幕發(fā)送次數(shù)〉L then O……),撰寫sql腳本,進(jìn)行自動(dòng)化部署,每月定期將用戶的指標(biāo)數(shù)據(jù)輸入到模型中,預(yù)測(cè)該用戶為刷虛擬禮物作弊用戶的概率,判斷用戶是否為刷虛擬禮物作弊用戶,并輸出刷虛擬禮物作弊用戶清單。
      [0064]如圖3所示,本發(fā)明實(shí)施例還提供了一種網(wǎng)絡(luò)直播平臺(tái)中的作弊用戶識(shí)別系統(tǒng),包括訓(xùn)練樣本集建立模塊1、作弊用戶識(shí)別模型建立模塊2以及作弊用戶識(shí)別模塊3,其中:
      [0065]所述訓(xùn)練樣本集建立模塊I,用于根據(jù)已有的作弊用戶和非作弊用戶的數(shù)據(jù)建立訓(xùn)練樣本集;其中所述數(shù)據(jù)至少包括用戶的行為信息;
      [0066]所述作弊用戶識(shí)別模型建立模塊2,用于利用上述訓(xùn)練樣本集訓(xùn)練作弊用戶識(shí)別模型,所述作弊用戶識(shí)別模型用于識(shí)別用戶是否為作弊用戶;
      [0067]所述作弊用戶識(shí)別模塊3,用于利用所述作弊用戶識(shí)別模型判斷待識(shí)別用戶是否為作弊用戶。
      [0068]進(jìn)一步地,所述用戶的行為信息至少包括觀看信息、彈幕信息和交易信息;
      [0069]其中所述觀看信息包括統(tǒng)計(jì)月觀看天數(shù)、觀看次數(shù)、觀看時(shí)長(zhǎng)、觀看房間數(shù)、觀看設(shè)備數(shù)以及觀看IP數(shù);彈幕信息包含統(tǒng)計(jì)月發(fā)送彈幕天數(shù)、發(fā)送彈幕次數(shù)以及發(fā)送彈幕房間數(shù);交易信息包含月虛擬禮物贈(zèng)送天數(shù)、虛擬禮物贈(zèng)送次數(shù)、虛擬禮物贈(zèng)送量、虛擬禮物贈(zèng)送房間數(shù)、獲取虛擬禮物天數(shù)、獲取虛擬禮物次數(shù)、獲取虛擬禮物量、分享獲得虛擬禮物天數(shù)、分享獲得虛擬禮物次數(shù)、分享獲得虛擬禮物量和其他維度獲取虛擬禮物指標(biāo)。
      [0070]進(jìn)一步地,所述數(shù)據(jù)還包括用戶的基礎(chǔ)信息,所述用戶的基礎(chǔ)信息包括用戶注冊(cè)時(shí)長(zhǎng)、用戶等級(jí)、用戶郵箱認(rèn)證狀態(tài)、用戶手機(jī)認(rèn)證狀態(tài)、來(lái)源類型以及注冊(cè)地。
      [0071]進(jìn)一步地,所述用戶的行為信息還包括登錄信息和彈幕信息,其中:
      [0072]所述登錄信息包括統(tǒng)計(jì)月登錄次數(shù)、登錄天數(shù);充值信息包括統(tǒng)計(jì)月充值次數(shù)、充值金額;彈幕信息包含統(tǒng)計(jì)月發(fā)送彈幕天數(shù)、發(fā)送彈幕次數(shù)以及發(fā)送彈幕房間數(shù)。
      [0073]進(jìn)一步地,如圖4所示,所述作弊用戶識(shí)別模型建立模塊2具體包括數(shù)據(jù)處理子模塊21、模型構(gòu)建子模塊22以及模型驗(yàn)證子模塊23,其中:
      [0074]所述數(shù)據(jù)處理子模塊21,用于對(duì)上述訓(xùn)練樣本集中的數(shù)據(jù)進(jìn)行處理轉(zhuǎn)換,對(duì)缺失值進(jìn)行填充,去除極大值和極小值;
      [0075]所述模型構(gòu)建子模塊22,用于將上述處理后得到的數(shù)據(jù)按照m:n的比例抽樣進(jìn)行拆分,劃分成訓(xùn)練集和測(cè)試集,利用訓(xùn)練集用戶構(gòu)建識(shí)別模型,其中所述m,n為預(yù)設(shè)值;
      [0076]所述模型驗(yàn)證子模塊23,用于運(yùn)用測(cè)試集對(duì)識(shí)別模型進(jìn)行評(píng)估,選擇最優(yōu)的用戶識(shí)別模型。
      [0077]進(jìn)一步地,如圖5所示,本發(fā)明實(shí)施例還提供了一種網(wǎng)絡(luò)直播平臺(tái)中的作弊用戶識(shí)別服務(wù)器,包括處理器3和存儲(chǔ)器4,其中:
      [0078]所述處理器3,用于根據(jù)已有的作弊用戶和非作弊用戶的數(shù)據(jù)建立訓(xùn)練樣本集;其中所述數(shù)據(jù)至少包括用戶的行為信息;利用上述訓(xùn)練樣本集訓(xùn)練作弊用戶識(shí)別模型,所述作弊用戶識(shí)別模型用于識(shí)別用戶是否為作弊用戶;利用所述作弊用戶識(shí)別模型判斷待識(shí)別用戶是否為作弊用戶;
      [0079]所述存儲(chǔ)器4,用于存儲(chǔ)所述訓(xùn)練樣本集。
      [0080]在本發(fā)明實(shí)施例中,處理器為該服務(wù)器的控制中心,利用各種接口和線路連接整個(gè)電子設(shè)備的各個(gè)部分,通過(guò)運(yùn)行或執(zhí)行存儲(chǔ)在存儲(chǔ)單元內(nèi)的軟件程序和/或模塊,以及調(diào)用存儲(chǔ)在存儲(chǔ)單元內(nèi)的數(shù)據(jù),以執(zhí)行電子設(shè)備的各種功能和/或處理數(shù)據(jù)。所述處理器可以由集成電路組成,也可以由連接多顆相同功能或不同功能的封表集成芯片而組成。即處理器可以是GPU、數(shù)字信號(hào)處理器、及通信單元中的控制芯片的組合。
      [0081]專業(yè)人員應(yīng)該還可以進(jìn)一步意識(shí)到,結(jié)合本文中所公開(kāi)的實(shí)施例描述的各示例的單元及算法步驟,能夠以電子硬件、計(jì)算機(jī)軟件或者二者的結(jié)合來(lái)實(shí)現(xiàn),為了清楚地說(shuō)明硬件和軟件的可互換性,在上述說(shuō)明中已經(jīng)按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬件還是軟件方式來(lái)執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計(jì)約束條件。專業(yè)技術(shù)人員可以對(duì)每個(gè)特定的應(yīng)用來(lái)使用不同方法來(lái)實(shí)現(xiàn)所描述的功能,但是這種實(shí)現(xiàn)不應(yīng)認(rèn)為超出本發(fā)明的范圍。所述的計(jì)算機(jī)軟件可存儲(chǔ)于計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),可包括如上述各方法的實(shí)施例的流程。其中,所述的存儲(chǔ)介質(zhì)可為磁碟、光盤、只讀存儲(chǔ)記憶體或隨機(jī)存儲(chǔ)記憶體等。
      [0082]本領(lǐng)域的技術(shù)人員容易理解,以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
      【主權(quán)項(xiàng)】
      1.一種網(wǎng)絡(luò)直播平臺(tái)中的作弊用戶識(shí)別方法,其特征在于,包括: 根據(jù)已有的作弊用戶和非作弊用戶的數(shù)據(jù)建立訓(xùn)練樣本集;其中所述數(shù)據(jù)至少包括用戶的行為信息; 利用上述訓(xùn)練樣本集訓(xùn)練作弊用戶識(shí)別模型,所述作弊用戶識(shí)別模型用于識(shí)別用戶是否為作弊用戶; 利用所述作弊用戶識(shí)別模型判斷待識(shí)別用戶是否為作弊用戶。2.如權(quán)利要求1所述的網(wǎng)絡(luò)直播平臺(tái)中的作弊用戶識(shí)別方法,其特征在于,所述用戶的行為信息至少包括觀看信息、彈幕信息和交易信息; 其中所述觀看信息包括統(tǒng)計(jì)月觀看天數(shù)、觀看次數(shù)、觀看時(shí)長(zhǎng)、觀看房間數(shù)、觀看設(shè)備數(shù)以及觀看IP數(shù);彈幕信息包含統(tǒng)計(jì)月發(fā)送彈幕天數(shù)、發(fā)送彈幕次數(shù)以及發(fā)送彈幕房間數(shù);交易信息包含月虛擬禮物贈(zèng)送天數(shù)、虛擬禮物贈(zèng)送次數(shù)、虛擬禮物贈(zèng)送量、虛擬禮物贈(zèng)送房間數(shù)、獲取虛擬禮物天數(shù)、獲取虛擬禮物次數(shù)、獲取虛擬禮物量、分享獲得虛擬禮物天數(shù)、分享獲得虛擬禮物次數(shù)、分享獲得虛擬禮物量和其他維度獲取虛擬禮物指標(biāo)。3.如權(quán)利要求1或2所述的網(wǎng)絡(luò)直播平臺(tái)中的作弊用戶識(shí)別方法,其特征在于,所述數(shù)據(jù)還包括用戶的基礎(chǔ)信息,所述用戶的基礎(chǔ)信息包括用戶注冊(cè)時(shí)長(zhǎng)、用戶等級(jí)、用戶郵箱認(rèn)證狀態(tài)、用戶手機(jī)認(rèn)證狀態(tài)、來(lái)源類型以及注冊(cè)地。4.如權(quán)利要2所述的網(wǎng)絡(luò)直播平臺(tái)中的作弊用戶識(shí)別方法,其特征在于,其中所述用戶的行為信息還包括登錄信息和彈幕信息,其中: 所述登錄信息包括統(tǒng)計(jì)月登錄次數(shù)、登錄天數(shù);充值信息包括統(tǒng)計(jì)月充值次數(shù)、充值金額;彈幕信息包含統(tǒng)計(jì)月發(fā)送彈幕天數(shù)、發(fā)送彈幕次數(shù)以及發(fā)送彈幕房間數(shù)。5.如權(quán)利要I或2所述的網(wǎng)絡(luò)直播平臺(tái)中的作弊用戶識(shí)別方法,其特征在于,所述利用上述訓(xùn)練樣本集訓(xùn)練作弊用戶識(shí)別模型具體包括: 對(duì)上述訓(xùn)練樣本集中的數(shù)據(jù)進(jìn)行處理轉(zhuǎn)換,對(duì)缺失值進(jìn)行填充,去除極大值和極小值; 將上述處理后得到的數(shù)據(jù)按照m: η的比例抽樣進(jìn)行拆分,劃分成訓(xùn)練集和測(cè)試集,利用訓(xùn)練集用戶構(gòu)建識(shí)別模型,其中所述m,n為預(yù)設(shè)值; 運(yùn)用測(cè)試集對(duì)識(shí)別模型進(jìn)行評(píng)估,選擇最優(yōu)的用戶識(shí)別模型。6.—種網(wǎng)絡(luò)直播平臺(tái)中的作弊用戶識(shí)別系統(tǒng),其特征在于,包括訓(xùn)練樣本集建立模塊、作弊用戶識(shí)別模型建立模塊以及作弊用戶識(shí)別模塊,其中: 所述訓(xùn)練樣本集建立模塊,用于根據(jù)已有的作弊用戶和非作弊用戶的數(shù)據(jù)建立訓(xùn)練樣本集;其中所述數(shù)據(jù)至少包括用戶的行為信息; 所述作弊用戶識(shí)別模型建立模塊,用于利用上述訓(xùn)練樣本集訓(xùn)練作弊用戶識(shí)別模型,所述作弊用戶識(shí)別模型用于識(shí)別用戶是否為作弊用戶; 所述作弊用戶識(shí)別模塊,用于利用所述作弊用戶識(shí)別模型判斷待識(shí)別用戶是否為作弊用戶。7.如權(quán)利要求6所述的網(wǎng)絡(luò)直播平臺(tái)中的作弊用戶識(shí)別系統(tǒng),其特征在于,所述用戶的行為信息至少包括觀看信息、彈幕信息和交易信息; 其中所述觀看信息包括統(tǒng)計(jì)月觀看天數(shù)、觀看次數(shù)、觀看時(shí)長(zhǎng)、觀看房間數(shù)、觀看設(shè)備數(shù)以及觀看IP數(shù);彈幕信息包含統(tǒng)計(jì)月發(fā)送彈幕天數(shù)、發(fā)送彈幕次數(shù)以及發(fā)送彈幕房間數(shù);交易信息包含月虛擬禮物贈(zèng)送天數(shù)、虛擬禮物贈(zèng)送次數(shù)、虛擬禮物贈(zèng)送量、虛擬禮物贈(zèng)送房間數(shù)、獲取虛擬禮物天數(shù)、獲取虛擬禮物次數(shù)、獲取虛擬禮物量、分享獲得虛擬禮物天數(shù)、分享獲得虛擬禮物次數(shù)、分享獲得虛擬禮物量和其他維度獲取虛擬禮物指標(biāo)。8.如權(quán)利要求6或7所述的網(wǎng)絡(luò)直播平臺(tái)中的作弊用戶識(shí)別系統(tǒng),其特征在于,所述數(shù)據(jù)還包括用戶的基礎(chǔ)信息,所述用戶的基礎(chǔ)信息包括用戶注冊(cè)時(shí)長(zhǎng)、用戶等級(jí)、用戶郵箱認(rèn)證狀態(tài)、用戶手機(jī)認(rèn)證狀態(tài)、來(lái)源類型以及注冊(cè)地。9.如權(quán)利要7所述的網(wǎng)絡(luò)直播平臺(tái)中的作弊用戶識(shí)別系統(tǒng),其特征在于,其中所述用戶的行為信息還包括登錄信息和彈幕信息,其中: 所述登錄信息包括統(tǒng)計(jì)月登錄次數(shù)、登錄天數(shù);充值信息包括統(tǒng)計(jì)月充值次數(shù)、充值金額;彈幕信息包含統(tǒng)計(jì)月發(fā)送彈幕天數(shù)、發(fā)送彈幕次數(shù)以及發(fā)送彈幕房間數(shù)。10.如權(quán)利要6或7所述的網(wǎng)絡(luò)直播平臺(tái)中的作弊用戶識(shí)別系統(tǒng),其特征在于,所述作弊用戶識(shí)別模型建立模塊具體包括數(shù)據(jù)處理子模塊、模型構(gòu)建子模塊以及模型驗(yàn)證子模塊,其中: 所述數(shù)據(jù)處理子模塊,用于對(duì)上述訓(xùn)練樣本集中的數(shù)據(jù)進(jìn)行處理轉(zhuǎn)換,對(duì)缺失值進(jìn)行填充,去除極大值和極小值; 所述模型構(gòu)建子模塊,用于將上述處理后得到的數(shù)據(jù)按照m:n的比例抽樣進(jìn)行拆分,劃分成訓(xùn)練集和測(cè)試集,利用訓(xùn)練集用戶構(gòu)建識(shí)別模型,其中所述m,n為預(yù)設(shè)值; 所述模型驗(yàn)證子模塊,用于運(yùn)用測(cè)試集對(duì)識(shí)別模型進(jìn)行評(píng)估,選擇最優(yōu)的用戶識(shí)別模型。
      【文檔編號(hào)】G06K9/62GK106022826SQ201610328918
      【公開(kāi)日】2016年10月12日
      【申請(qǐng)日】2016年5月18日
      【發(fā)明人】程曉歌, 吳瑞誠(chéng), 王攀
      【申請(qǐng)人】武漢斗魚網(wǎng)絡(luò)科技有限公司
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1