專利名稱:在線視頻廣告精細化定向投放方法
技術領域:
本發(fā)明屬于網(wǎng)絡視頻技術領域,特別涉及一種視頻廣告投放方法。
背景技術:
目前在線視頻廣告主要通過視頻節(jié)目內(nèi)容和地域進行定向投放,還不能更準確地投放給具有特定性別、年齡、收入、職業(yè)、學歷等屬性的目標人群。比如,北京某個經(jīng)營中高端化妝品的廣告主,需要對ー款剛上市產(chǎn)品通過在線視頻進行宣傳,這款產(chǎn)品的目標人群是女性,年齡是25-45歲,月收入在5000元以上的白領。目前的在線廣告投放是方法是通過在線問卷調(diào)查,統(tǒng)計25-45歲,月收入在5000元以上的女白領觀看比較多的節(jié)目,針對ip來自北京的用戶,在這些節(jié)目上投放這款產(chǎn)品廣告。另ー種為廣告主所熱衷的廣告投放方式是在熱播劇或者剛上映不久的電影中播出廣告。這一方面由于受眾針對性差而減弱了廣告實際投放 效果,另ー方面造成廣告主對熱點資源的競爭,降低了視頻運營公司的資源利用率。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種能夠把在線視頻廣告精準的推送給合適用戶的方法。本發(fā)明的基本思路是根據(jù)調(diào)查問卷以及數(shù)據(jù)處理,得到某類用戶(如女性,年齡25-45歲)對某類視頻節(jié)目的偏好信息;對具體用戶,記錄其訪問視頻節(jié)目的歷史信息,據(jù)此判斷他的類別屬性,向其推送適合的廣告。本發(fā)明的技術方案是一種在線視頻廣告精細化定向投放方法,包括以下步驟A.通過問卷調(diào)查,收集不少于10萬名用戶的身份和視頻訪問行為數(shù)據(jù),包含用戶訪問的視頻分類,視頻標題,視頻tag等信息;B.對收集的數(shù)據(jù)做剔除空值、異常值、離群值的預處理,提升樣本數(shù)據(jù)質(zhì)量;C.統(tǒng)計問卷調(diào)查用戶訪問視頻分類、關鍵詞的次數(shù),構建正反樣本向量+1 I N1,2 N2, ......, I NI-I I M1,2 M2, ......, I MI式中+1表不某類用戶的向量,-I表不其他用戶的向量,如+1表不18-35歲的女性,則-I表示其他的女性和男性;冒號前的1,2,……,I為I個視頻分類,視頻標題,視頻tag信息,冒號后的Nx為某類用戶對這個視頻分類,視頻標題,視頻tag信息的訪問次數(shù),Mx表示其他用戶對這個視頻分類,視頻標題,視頻tag信息的訪問次數(shù);D.將正反樣本向量帶入支持向量機模型進行訓練,支持向量機的形式為
I ,;minise 一 I: 1Γ Γsubject to Yi[wxj+b]-I ^ 0 i = 1,2,......, I式中X為C步驟得到的正反樣本向量,y e {+1,-1},I是訓練樣本的個數(shù);w和b通過訓練模型得到,w為分類間隔,b是常數(shù);由此得到最優(yōu)分類面及權重w信息
solver_type L2R_LRnr_class 2label 1-1nr feature 342bias-1w其中solver_type表示訓練svm采用的類型,nr_class表示分類類別數(shù),label表示類別標簽,nr_feature表示支持向量個數(shù),w表示最后得到的向量,用于計算分類;E.使用通過訓練得到的模型對用戶做分類,分類函數(shù)為f (X) = sgn {wx+b}其中w和b由C步驟的訓練模型得到;x表示由具體用戶訪問視頻分類,視頻標題,視頻tag信息的次數(shù)構成的向量;如果f (X) > O表示這個用戶屬于+1表示的那個分類,比如上面提到的18-35歲的女性;否則屬于-I表示的分類;F.模型驗證通過實驗,將預測為真且實際為真的數(shù)據(jù)記為tp,預測為真但實際為假的數(shù)據(jù)記為fp,將預測為假但實際為真的數(shù)據(jù)記為fn,預測為假且實際為假的數(shù)據(jù)記為tn ;則模型的準確度Precision和覆蓋率recall為;
權利要求
1. 一種在線視頻廣告精細化定向投放方法,包括以下步驟 A.通過問卷調(diào)查,收集不少于10萬名用戶的身份和視頻訪問行為數(shù)據(jù),包含用戶訪問的視頻分類,視頻標題,視頻tag等信息; B.對收集的數(shù)據(jù)做剔除空值、異常值、離群值的預處理,提升樣本數(shù)據(jù)質(zhì)量; C.統(tǒng)計問卷調(diào)查用戶訪問視頻分類、關鍵詞的次數(shù),構建正反樣本向量+1 I N1,2 N2, ......,I NI-I I M1,2 M2, ......,I MI 式中+1表示某類用戶的向量,-I表示其他用戶的向量;冒號前的1,2,……,I為I個視頻分類,視頻標題,視頻tag信息,冒號后的Nx為某類用戶對這個視頻分類,視頻標題,視頻tag信息的訪問次數(shù),Mx表示其他用戶對這個視頻分類,視頻標題,視頻tag信息的訪 問次數(shù); D.將正反樣本向量帶入支持向量機模型進行訓練,支持向量機的形式為 minise — H Λ subject to yiliwXi+bj-l タ0 i = 1,2,......, I 式中χ為C步驟得到的正反樣本向量,y e {+I, -I}, I是訓練樣本的個數(shù);w和b通過訓練模型得到,w為分類間隔,b是常數(shù); 由此得到最優(yōu)分類面及權重w信息solver_type L2R_LRnr_class 2label 1-1nr feature 342bias-1w 其中solver_type表示訓練svm采用的類型,nr_class表示分類類別數(shù),label表示類別標簽,nr_feature表示支持向量個數(shù),w表示最后得到的向量,用于計算分類; E.使用通過訓練得到的模型對用戶做分類,分類函數(shù)為 f u) = sgn {wx+b} 其中w和b由C步驟的訓練模型得到;x表示由具體用戶訪問視頻分類,視頻標題,視頻tag信息的次數(shù)構成的向量; 如果f(x) > O表示這個用戶屬于+1表示的那個分類,否則屬于-I表示的分類; F.模型驗證通過實驗,將預測為真且實際為真的數(shù)據(jù)記為tp,預測為真但實際為假的數(shù)據(jù)記為fp,將預測為假但實際為真的數(shù)據(jù)記為fn,預測為假且實際為假的數(shù)據(jù)記為tn ;則模型的準確度Precision和覆蓋率recall為;Precision =-^—-― fp + J P tpRecall = —t + J > ι 如果準確度Precision和覆蓋率recall不滿足要求,則返回A步驟,收集更多的用戶的身份和視頻訪問行為數(shù)據(jù),并再次執(zhí)行B F步驟,重新調(diào)整參數(shù),直到準確度Precision和覆蓋率recall滿足要求; G.在視頻網(wǎng)站服務器上部署以上各步驟,實現(xiàn)自動化運行; H.當用戶視頻網(wǎng)站服務器時,模型記錄用戶的訪問請求,對用戶做出人群屬性分類和標識,根據(jù)用戶的屬性推送適合的廣告。
全文摘要
本發(fā)明屬于網(wǎng)絡視頻技術領域,特別涉及一種視頻廣告投放方法。在線視頻廣告精細化定向投放方法,包括A.通過問卷調(diào)查,收集用戶的身份和視頻訪問行為數(shù)據(jù);B.對數(shù)據(jù)做預處理;C.構建正反樣本向量D.將正反樣本向量帶入支持向量機模型進行訓練,得到最優(yōu)分類面及權重w信息E.使用得到的模型對用戶做分類F.模型驗證;G.在視頻網(wǎng)站服務器上實現(xiàn)自動化運行;H.當用戶視頻網(wǎng)站服務器時,模型記錄用戶的訪問請求,對用戶做出人群屬性分類和標識,根據(jù)用戶的屬性推送適合的廣告。本發(fā)明能夠把廣告精準的推送到每個合適的用戶,既能大幅提升廣告的投放效果,又能提升視頻運營公司的資源利用率,同時還能減少了用戶看不相關廣告的次數(shù)。
文檔編號G06Q30/02GK102722832SQ201210004988
公開日2012年10月10日 申請日期2012年1月5日 優(yōu)先權日2012年1月5日
發(fā)明者嚴金龍, 盧學裕, 盧述奇, 姚鍵, 尹玉宗, 潘柏宇, 王曉龍 申請人:合一網(wǎng)絡技術(北京)有限公司