国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種視頻網(wǎng)站相似用戶搜索系統(tǒng)和方法

      文檔序號:9288410閱讀:785來源:國知局
      一種視頻網(wǎng)站相似用戶搜索系統(tǒng)和方法
      【技術(shù)領(lǐng)域】
      [0001] 本發(fā)明涉及一種視頻網(wǎng)站相似用戶搜索系統(tǒng)和方法。
      【背景技術(shù)】
      [0002] 目前視頻網(wǎng)站上的視頻廣告投放常常會遇到這樣的問題:在某一廣告投放中,某 些用戶對該廣告表現(xiàn)出了興趣,發(fā)生了點(diǎn)擊或者消費(fèi)行為。相似的視頻用戶,對于廣告產(chǎn)品 的興趣具有一定程度的相似性,例如:兩個同樣觀看了健身瑜伽視頻的用戶,可能都會對減 肥產(chǎn)品、化妝品等感興趣;而兩個同樣觀看了刀塔游戲視頻的用戶,可能會對一些網(wǎng)頁游戲 廣生興趣。
      [0003]相似的用戶觀看行為,可以為推測其興趣愛好提供線索。在廣告投放過程中,一些 用戶對投放的廣告產(chǎn)生了積極的反饋(例如:點(diǎn)擊、購買等),以這些用戶作為種子用戶,進(jìn) 行相似人群的擴(kuò)展搜索,在未來的廣告投放中就可以有的放矢地鎖定這一類人群,從而使 廣告投放產(chǎn)生更大的效益。
      [0004]因此,如何利用種子用戶的觀看行為,對視頻網(wǎng)站進(jìn)行有效的相似用戶搜索,就成 了一個非常重要的問題。

      【發(fā)明內(nèi)容】

      [0005]本發(fā)明根據(jù)種子用戶的情況,提出了一種基于視頻內(nèi)容的視頻網(wǎng)站相似用戶搜索 系統(tǒng)和方法。本發(fā)明將視頻的描述詞視為視頻內(nèi)容的描述,將用戶的視頻觀看行為提煉為 用戶對視頻內(nèi)容的觀看,從而利用對視頻內(nèi)容的索引,來搜索具有相似觀看行為的用戶群。
      [0006]本發(fā)明的系統(tǒng)和方法可以搜索出更多的相似的視頻用戶,擴(kuò)展相似的視頻網(wǎng)站用 戶群,從而提升廣告中產(chǎn)品的推廣效果,使得該廣告的投放產(chǎn)生更大的效益,在廣告投放領(lǐng) 域有著重要的應(yīng)用價值。
      【附圖說明】
      [0007]本發(fā)明將參照附圖來進(jìn)一步詳細(xì)說明,其中:
      [0008] 圖1是本發(fā)明的視頻網(wǎng)站相似用戶搜索方法流程圖;
      [0009] 圖2是本發(fā)明的視頻網(wǎng)站相似用戶搜索系統(tǒng)結(jié)構(gòu)示意圖。
      【具體實(shí)施方式】
      [0010] 雖然將參照含有本發(fā)明的較佳實(shí)施例的附圖充分描述本發(fā)明,但在此描述之前應(yīng) 了解,本領(lǐng)域的普通技術(shù)人員可修改本文中所描述的發(fā)明,同時獲得本發(fā)明的技術(shù)效果。因 此,須了解以下的描述對本領(lǐng)域的普通技術(shù)人員而言為一廣泛的揭示,且其內(nèi)容不在于限 制本發(fā)明所描述的示例性實(shí)施例。
      [0011] 參考圖1所示,本發(fā)明的視頻網(wǎng)站相似用戶搜索方法包括:
      [0012] 步驟1,對用戶觀看內(nèi)容進(jìn)行統(tǒng)計分析,統(tǒng)計一段時間內(nèi)(例如一周)的用戶視頻 觀看記錄,結(jié)合視頻內(nèi)容描述詞得到每個用戶在每一種視頻內(nèi)容上的觀看次數(shù)和頻率。其 中,視頻內(nèi)容描述詞主要通過視頻標(biāo)簽、關(guān)鍵詞以及視頻標(biāo)題分詞來描述,視頻標(biāo)簽、關(guān)鍵 詞以及視頻標(biāo)題分詞都對視頻內(nèi)容進(jìn)行了簡短而抽象的描述,能夠較為有效地刻畫視頻的 內(nèi)容信息,不同的視頻可能含有相似的內(nèi)容,表現(xiàn)在它們可能擁有相同的標(biāo)簽或關(guān)鍵詞。利 用用戶的觀看記錄,結(jié)合視頻內(nèi)容描述詞,統(tǒng)計用戶在不同內(nèi)容上的觀看頻率,可以有效地 反映用戶的興趣偏好。
      [0013] 其中,步驟1進(jìn)一步包括:
      [0014] 步驟1. 1,利用視頻用戶的觀看記錄,統(tǒng)計用戶一段時間內(nèi)的視頻觀看次數(shù),得到 "用戶標(biāo)識 視頻標(biāo)識 觀看次數(shù)"的視頻觀看列表;
      [0015] 步驟1. 2,對于視頻信息,提取視頻信息列表"視頻標(biāo)識標(biāo)簽1、標(biāo)簽2、…、標(biāo) 簽i ",結(jié)合視頻觀看列表生成內(nèi)容觀看列表"用戶標(biāo)識一標(biāo)簽i-觀看次數(shù)";
      [0016]步驟1.3,對具有相同用戶標(biāo)識的內(nèi)容觀看記錄進(jìn)行合并,利用標(biāo)簽i的內(nèi)容觀看 次數(shù)計算得到標(biāo)簽i的觀看頻率,即每個用戶一段時間內(nèi)在標(biāo)簽i上的觀看頻率,計算方法 為:
      [0017]
      [0018] 其中,為標(biāo)簽i的頻率,CpC#用戶觀看標(biāo)簽i、標(biāo)簽j的次數(shù),T為該用戶觀 看的所有標(biāo)簽的集合。
      [0019] 通過步驟1,可以得到每個用戶最近一段時間內(nèi)觀看的視頻內(nèi)容以及每種視頻內(nèi) 容的觀看頻率。
      [0020] 步驟2,建立用戶的倒排索引,根據(jù)步驟1中統(tǒng)計分析得到的觀看記錄,基于視頻 內(nèi)容描述詞建立用戶的倒排索引,該索引形式以視頻內(nèi)容的描述詞作為索引關(guān)鍵字,以觀 看該描述詞的所有用戶標(biāo)識及其觀看頻率作為索引值。
      [0021] 其中,步驟2進(jìn)一步包括:
      [0022] 步驟2. 1,以標(biāo)簽為索引關(guān)鍵字,統(tǒng)計觀看過該標(biāo)簽的所有用戶以及每個用戶的觀 看頻率,計算觀看過該標(biāo)簽的用戶總數(shù);
      [0023] 步驟2. 2,利用哈希方法,對標(biāo)簽進(jìn)行哈希計算,對索引文件進(jìn)行分塊;
      [0024] 步驟2. 3,將標(biāo)簽的觀看信息存儲至哈希值所對應(yīng)的分塊處。
      [0025] 步驟3,進(jìn)行相似用戶搜索并計算相似性,利用種子用戶的視頻觀看記錄,以視頻 內(nèi)容描述詞為搜索關(guān)鍵字,在索引文件上進(jìn)行相似用戶的搜索,同時計算相應(yīng)用戶的相似 性,得到初步的搜索結(jié)果。
      [0026] 其中,步驟3進(jìn)一步包括:
      [0027] 步驟3. 1,對種子用戶的觀看記錄進(jìn)行分析,對種子用戶的每一個標(biāo)簽進(jìn)行搜索, 得到觀看過該標(biāo)簽的所有用戶總數(shù)、用戶標(biāo)識以及相應(yīng)的觀看頻率;
      [0028] 步驟3. 2,對每一個搜索返回的用戶計算相似性,其計算方法如下:
      [0029]
      [0030] 其中,SU1表示用戶u在標(biāo)簽i上的相似性,tf^表示用戶u觀看標(biāo)簽i的頻率,D 表示所有用戶總數(shù),Pi表示觀看標(biāo)簽i的用戶總數(shù);
      [0031] 步驟3. 4,對所有種子用戶的觀看標(biāo)簽進(jìn)行搜索返回的結(jié)果進(jìn)行綜合分析,計算每 個返回用戶的綜合相似性,計算方法為:
      [0032]
      [0033] 其中,Scoreu表示用戶u的綜合相似性,S U1表示用戶u在標(biāo)簽i上的相似性。
      [0034] 步驟4,進(jìn)行搜索結(jié)果排序,利用相似性對初步搜索結(jié)果進(jìn)行由大到小的排序,經(jīng) 過過濾處理得到最終的相似人群搜索結(jié)果。對于搜索返回的用戶群以及每個用戶的綜合相 似性,按照相似性進(jìn)行由大到小的排序,可以采用適當(dāng)?shù)南嗨菩蚤撝颠M(jìn)行結(jié)果過濾,將排序 過濾后的結(jié)果輸出。
      [0035] 參考圖2,本發(fā)明還提供一種視頻網(wǎng)站相似用戶搜索系統(tǒng),包括:
      [0036] 統(tǒng)計分析裝置,對用戶觀看內(nèi)容進(jìn)行統(tǒng)計分析,統(tǒng)計一段時間內(nèi)的用戶視頻觀看 記錄,結(jié)合視頻內(nèi)容描述詞得到每個用戶對每一種視頻內(nèi)容的觀看次數(shù)和頻率,其中,上述 視頻內(nèi)容描述詞通過視頻標(biāo)簽、關(guān)鍵詞以及視頻標(biāo)題分詞來描述。
      [0037] 其中,統(tǒng)計分析裝置利用視頻用戶的觀看記錄,統(tǒng)計用戶一段時間內(nèi)的視頻觀看 次數(shù),得到"用戶標(biāo)識一視頻標(biāo)識一觀看次數(shù)"視頻觀看列表;對于視頻信息,提取視頻 信息列表"視頻標(biāo)識一標(biāo)簽1、標(biāo)簽2、…、標(biāo)簽i",結(jié)合視頻觀看列表生成內(nèi)容觀看列表 "用戶標(biāo)識一標(biāo)簽i-觀看次數(shù)";對具有相同用戶標(biāo)識的內(nèi)容觀看記錄進(jìn)行合并,利用 標(biāo)簽i的觀看次數(shù)計算標(biāo)簽i的觀看頻率,即每個用戶一段時間內(nèi)在標(biāo)簽i上的觀看頻率, 計算方法為:
      [003J
      [0039] 其中,為標(biāo)簽i的頻率,C ^ (^為用戶觀看標(biāo)簽i、標(biāo)簽j的次數(shù),T為該用戶觀 看的所有標(biāo)簽的集合。
      [0040] 索引裝置,建立用戶的倒排索引,根據(jù)第一步中統(tǒng)計分析得到的觀看記錄,基于視 頻內(nèi)容描述詞建立用戶的倒排索引,該索引形式以視頻內(nèi)容描述詞作為索引關(guān)鍵字,以觀 看該描述詞的所有用戶標(biāo)識及觀看頻率作為索引值。
      [0041] 其中,索引裝置以標(biāo)簽為索引關(guān)鍵字,統(tǒng)計觀看過該標(biāo)簽的所有用戶以及每個用 戶的觀看頻率,計算觀看過該標(biāo)簽的用戶總數(shù);利用哈希方法,對標(biāo)簽進(jìn)行哈希計算,對索 引文件進(jìn)行分塊;將標(biāo)簽的觀看信息存儲至哈希值所對應(yīng)的分塊處。
      [0042] 計算裝置,進(jìn)行相似用戶搜索并計算相似性,利用種子用戶的視頻觀看記錄,以視 頻內(nèi)容描述詞為搜索關(guān)鍵字,在索引文件上進(jìn)行相似用戶的搜索,同時計算相應(yīng)用戶的相 似性,得到初步的搜索結(jié)果。
      [0043] 其中,計算裝置對種子用戶的觀看記錄進(jìn)行分析,對種子用戶的每一個標(biāo)簽進(jìn)行 搜索,得到觀看過該標(biāo)簽的所有用戶總數(shù)、用戶標(biāo)識以及相應(yīng)的觀看頻率;
      [0044] 對每一個搜索返回的用戶計算相似性,其計算方法如下:
      [0045]
      [0046] 其中,SU1表示用戶u在標(biāo)簽i上的相似性,tf。表示用戶u觀看標(biāo)簽i的頻率,D 表示所有用戶總數(shù),P,表示觀看標(biāo)簽i的用戶總數(shù);
      [0047] 對所有種子用戶的觀看標(biāo)簽進(jìn)行搜索返回的結(jié)果進(jìn)行綜合分析,計算每個返回用 戶的綜合相似性,計算方法為:
      [0048]
      [0049] 其中,Scoreu表示用戶u的綜合相似性,S U1表示用戶u在標(biāo)簽i上的相似性。
      [0050] 排序裝置,進(jìn)行搜索結(jié)果排序,利用相似性對初步搜索結(jié)果進(jìn)行由大到小的排序, 經(jīng)過過濾處理得到最終的相似人群搜索結(jié)果。
      [0051] 其中,排序裝置對于搜索返回的用戶群以及每個用戶的綜合相似性,按照相似性 進(jìn)行由大到小的排序,可以采用適當(dāng)?shù)南嗨菩蚤撝颠M(jìn)行結(jié)果過濾,將排序過濾后的結(jié)果輸 出。
      [0052] 下面,通過兩個示例進(jìn)一步詳細(xì)說明本發(fā)明的系統(tǒng)和方法。
      [0053] 示例一:某視頻網(wǎng)站相似人群搜索。
      [0054] 某網(wǎng)站有視頻集合S = {Vd. . .,VJ,每個視頻包含一組內(nèi)容描述詞(即標(biāo)簽), 不同視頻之間可能還有相同的描述詞。同時該網(wǎng)站記錄了最近一周內(nèi)的用戶觀看記錄R = iUi---Vx-clx,…,un-vy-cny}〇
      [0055] 步驟1,以標(biāo)簽作為視頻內(nèi)容的描述,根據(jù)每個視頻的標(biāo)簽信息,統(tǒng)計每個用戶一 周內(nèi)在每個標(biāo)簽上的觀看次數(shù),得到形如"用戶標(biāo)識一標(biāo)簽一觀看次數(shù)"的觀看記錄; 對于相同用戶標(biāo)識的觀看記錄進(jìn)行合并計算,得到每個用戶觀看的所有標(biāo)簽,并且計算每 個標(biāo)簽的觀羞頗鑾.i+笪方法為,
      [0056]
      [0057] 其中,為標(biāo)簽i的頻率,C ^ (^為用戶觀看標(biāo)簽i、標(biāo)簽j的次數(shù),T為該用戶觀 看的所有標(biāo)簽的集合。這樣,就得到了每個用戶在每個標(biāo)簽上的觀看頻率,部分觀看記錄示 例如下:
      [0058]
      [0059] 表1用戶觀看內(nèi)容記錄示例
      [0060] 步驟2,以標(biāo)簽作為索引關(guān)鍵字,對觀看信息建立倒排索引。對標(biāo)簽進(jìn)行哈希,得到 哈希值;對倒排索引文件進(jìn)行適當(dāng)分塊,將哈希值與文件分塊建立映射;將每個標(biāo)簽所對 應(yīng)的觀看信息(包括:該標(biāo)簽觀看的用戶總數(shù)、觀看該標(biāo)簽的所有用戶標(biāo)識和每個用戶的 觀看頻率)存儲至該標(biāo)簽哈希值所對應(yīng)的文件分塊處。
      [0061] 步驟3,對于給定的種子用戶觀看記錄,利用觀看標(biāo)簽信息在倒排索引文件上進(jìn)行 搜索。對
      當(dāng)前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1