国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種對網(wǎng)絡(luò)廣告進(jìn)行排序的方法

      文檔序號:6609931閱讀:286來源:國知局
      專利名稱:一種對網(wǎng)絡(luò)廣告進(jìn)行排序的方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及互聯(lián)網(wǎng)中文智能處理技術(shù)領(lǐng)域,尤其涉及一種對網(wǎng)絡(luò)廣告 進(jìn)行排序的方法。
      背景技術(shù)
      隨著互聯(lián)網(wǎng)的普及,網(wǎng)絡(luò)廣告出現(xiàn)了強勁的增長勢頭,選擇投放網(wǎng)絡(luò) 廣告的客戶也是越來越多。那么,在研究某一類行業(yè)或者某一類產(chǎn)品的廣 告的時候,就會面臨大量的廣告,究竟哪個廣告同用戶的檢索行為最相關(guān), 廣告排序這個問題就產(chǎn)生了。
      例如用戶輸入"汽車"這個關(guān)鍵詞,和汽車相關(guān)的廣告有成千上萬, 如何將這些廣告呈現(xiàn)給用戶,排序就顯得比較重要了。本發(fā)明就是為了解 決上述問題而產(chǎn)生的。

      發(fā)明內(nèi)容
      (一) 要解決的技術(shù)問題
      有鑒于此,本發(fā)明的主要目的在于提供一種對網(wǎng)絡(luò)廣告進(jìn)行排序的方 法,以實現(xiàn)對網(wǎng)絡(luò)廣告的排序。
      (二) 技術(shù)方案
      為達(dá)到上述目的,本發(fā)明提供了一種對網(wǎng)絡(luò)廣告進(jìn)行排序的方法,該 方法包括
      利用廣告監(jiān)控程序從網(wǎng)站獲取廣告數(shù)據(jù),從獲取的廣告數(shù)據(jù)中提取出 廣告主信息和廣告描述信息;
      分別對廣告主信息和廣告描述信息進(jìn)行分詞得到的關(guān)鍵詞,建立該關(guān)
      鍵詞的索引;
      計算每個建立索引的關(guān)鍵詞的相關(guān)性,按照計算的相關(guān)性從高到低對 網(wǎng)絡(luò)廣告進(jìn)行排序。
      上述方案中,所述利用廣告監(jiān)控程序從網(wǎng)站獲取廣告數(shù)據(jù)的步驟包 括利用廣告監(jiān)控程序spider監(jiān)控各個網(wǎng)站的廣告投放情況,并將原始網(wǎng) 頁內(nèi)容作為網(wǎng)頁快照保存到網(wǎng)頁快照庫中。
      上述方案中,所述從獲取的廣告數(shù)據(jù)中提取出廣告主信息和廣告描述 信息的步驟包括
      對網(wǎng)頁快照庫中保存的廣告數(shù)據(jù)中的文字信息進(jìn)行分詞,得到一組文 本向量;
      根據(jù)所述文本向量的特征,對所述文本向量進(jìn)行向量加權(quán)或向量減
      權(quán);
      采用空間向量模型計算所述進(jìn)行了向量加權(quán)或向量減權(quán)后的文本向 量的權(quán)重;
      對計算出來的文本向量的權(quán)重進(jìn)行排序,并根據(jù)文本向量所在網(wǎng)頁中 的上下文信息,從網(wǎng)頁中提取出廣告主信息和廣告描述信息。
      上述方案中,所述對網(wǎng)頁快照庫中保存的廣告數(shù)據(jù)中的文字信息進(jìn)行 分詞包括將現(xiàn)代漢語的普通字序列文本分解為詞序列的文本。
      上述方案中,所述對文本向量進(jìn)行向量加權(quán)或向量減權(quán)的步驟包括
      對出現(xiàn)在標(biāo)題中的文本向量,將向量權(quán)重增至原來的5至IO倍;
      對出現(xiàn)在網(wǎng)頁結(jié)構(gòu)中content的簡介,將向量權(quán)重增至原來的2至3
      對出現(xiàn)在網(wǎng)頁內(nèi)容中版權(quán)信息類的文本向量,將向量權(quán)重增至原來的 3至5倍;
      對出現(xiàn)在網(wǎng)頁內(nèi)容中與廣告主信息有關(guān)的文本向量,將向量權(quán)重增至
      原來的3至5倍;
      對出現(xiàn)的包含在停詞表中文本向量,將向量權(quán)重減至原來的1/5至 1/10。
      上述方案中,所述空間向量模型采用以下公式來表征<formula>formula see original document page 6</formula>
      其中,r(r,S)為詞f在文本S中的權(quán)重,而為詞Z在文本
      中的詞頻,7V為訓(xùn)練文本的總數(shù),",為訓(xùn)練文本集中出現(xiàn)f的文本數(shù), 分母為歸一化因子。
      上述方案中,所述對計算出來的文本向量的權(quán)重進(jìn)行排序時,首先設(shè) 定一個閾值,將權(quán)重大于該閾值的文本向量挑選出來構(gòu)成一個集合,然后 再根據(jù)所在網(wǎng)頁中的上下文信息,從所述集合中提取出需要的廣告主信息 和廣告描述信息。
      上述方案中,所述對網(wǎng)頁快照庫中保存的廣告數(shù)據(jù)中的文字信息進(jìn)行 分詞的步驟中,所述分詞包括將現(xiàn)代漢語的普通字序列文本分解為詞序 列的文本。
      上述方案中,所述計算關(guān)鍵詞的相關(guān)性的步驟中采用公式? = 31><111 +
      a2xc + a3xh來計算關(guān)鍵詞的相關(guān)性,其中al、 a2和a3是常量系數(shù),且 al+a2+a3 = 1,在實際運算時al、 a2和a3所占的權(quán)重可調(diào),m為每個廣 告的投放的網(wǎng)站/頻道信息、c為廣告內(nèi)容描述信息、h為廣告主信息,具 體計算過程包括根據(jù)實際情況確定al、 a2和a3的值,然后分別計算m、 c和h的值,將al 、 a2、 a3、 m、 c禾口 h的值帶入公式P = alxm + a2xc + a3xh 計算得到關(guān)鍵詞的相關(guān)性。
      上述方案中,所述計算每個廣告的投放的網(wǎng)站/頻道信息m的值的過
      程包括假設(shè)Tr(k"力7V("), Tr(k)代表第k篇命中廣告的Traffic Rank,
      是由n個投放的Traffic Rank之和組成,Traffic Rank為每百萬人訪問量, 則代表第 k 篇命中廣告歸 一 后的 pagemnk值的
      <formula>formula see original document page 7</formula>
      上述方案中,所述計算廣告內(nèi)容描述信息C的值和計算廣告主信息h 的值采用下面的空間向量模型進(jìn)行
      <formula>formula see original document page 7</formula>
      其中,C(/,力為詞f在文本S中的權(quán)重,為詞f在文本S 中的詞頻,iV為訓(xùn)練文本的總數(shù),^為訓(xùn)練文本集中出現(xiàn)f的文本數(shù),分
      母為歸一化因子。
      (三)有益效果 從上述技術(shù)方案可以看出,本發(fā)明具有以下有益效果
      1、 利用本發(fā)明,通過從網(wǎng)站獲取廣告數(shù)據(jù),并從獲取的廣告數(shù)據(jù)中 提取出廣告主信息和廣告描述信息;然后分別對廣告主信息和廣告描述信 息進(jìn)行分詞得到的關(guān)鍵詞,建立該關(guān)鍵詞的索引,計算每個建立索引的關(guān) 鍵詞的相關(guān)性,按照計算的相關(guān)性從高到低對網(wǎng)絡(luò)廣告進(jìn)行排序,實現(xiàn)了 對網(wǎng)絡(luò)廣告的排序。
      2、 利用本發(fā)明,能夠迅速確定一個關(guān)鍵詞對應(yīng)的眾多廣告的相關(guān)性 排序,從而能夠方便廣告設(shè)計人員用最短的時間找到適合自己的廣告資 料。同時廣告主也可以利用這個系統(tǒng)來查看競爭對手的廣告投放情況,對 設(shè)計自己的廣告投放方案提供支持。


      圖1為本發(fā)明提供的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法流程圖2為依照本發(fā)明實施例建立關(guān)鍵詞索引的示意圖3為依照本發(fā)明實施例對網(wǎng)絡(luò)廣告進(jìn)行排序的示意圖4為依照本發(fā)明實施例建立的倒排索引的示意圖5為依照本發(fā)明實施例對網(wǎng)絡(luò)廣告進(jìn)行排序的結(jié)果示意圖。
      具體實施例方式
      為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚明白,以下結(jié)合具體實 施例,并參照附圖,對本發(fā)明進(jìn)一步詳細(xì)說明。
      如圖1所示,圖1為本發(fā)明提供的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法流程圖, 該方法包括以下步驟
      步驟101:利用廣告監(jiān)控程序從網(wǎng)站獲取廣告數(shù)據(jù),從獲取的廣告數(shù) 據(jù)中提取出廣告主信息和廣告描述信息;
      步驟102:分別對廣告主信息和廣告描述信息進(jìn)行分詞得到的關(guān)鍵詞, 建立該關(guān)鍵詞的索引;
      步驟103:計算每個建立索引的關(guān)鍵詞的相關(guān)性,按照計算的相關(guān)性 從高到低對網(wǎng)絡(luò)廣告進(jìn)行排序。
      上述步驟101中所述利用廣告監(jiān)控程序從網(wǎng)站獲取廣告數(shù)據(jù)的步驟包
      括利用廣告監(jiān)控程序spider監(jiān)控各個網(wǎng)站的廣告投放情況,并將原始網(wǎng)
      頁內(nèi)容作為網(wǎng)頁快照保存到網(wǎng)頁快照庫中。
      上述步驟101中所述從獲取的廣告數(shù)據(jù)中提取出廣告主信息和廣告描
      述信息的步驟包括對網(wǎng)頁快照庫中保存的廣告數(shù)據(jù)中的文字信息進(jìn)行分 詞,得到一組文本向量;根據(jù)所述文本向量的特征,對所述文本向量進(jìn)行 向量加權(quán)或向量減權(quán);采用空間向量模型計算所述進(jìn)行了向量加權(quán)或向量 減權(quán)后的文本向量的權(quán)重;對計算出來的文本向量的權(quán)重進(jìn)行排序,并根 據(jù)文本向量所在網(wǎng)頁中的上下文信息,從網(wǎng)頁中提取出廣告主信息和廣告 描述信息。
      上述對網(wǎng)頁快照庫中保存的廣告數(shù)據(jù)中的文字信息進(jìn)行分詞包括將 現(xiàn)代漢語的普通字序列文本分解為詞序列的文本。
      上述對文本向量進(jìn)行向量加權(quán)或向量減權(quán)的步驟包括對出現(xiàn)在標(biāo)題 中的文本向量,將向量權(quán)重增至原來的5至10倍;對出現(xiàn)在網(wǎng)頁結(jié)構(gòu)中 content的簡介,將向量權(quán)重增至原來的2至3倍;對出現(xiàn)在網(wǎng)頁內(nèi)容中版 權(quán)信息類的文本向量,將向量權(quán)重增至原來的3至5倍;對出現(xiàn)在網(wǎng)頁內(nèi) 容中與廣告主信息有關(guān)的文本向量,將向量權(quán)重增至原來的3至5倍;對 出現(xiàn)的包含在停詞表中文本向量,將向量權(quán)重減至原來的1/5至1/10。
      上述空間向量模型采用以下公式來表征 昨力=,,/(")xl。g(W/",+0.01),其中,昨力為詞,在文本s中
      ^!』/(")"og(^"'+0'01)]2 的權(quán)重,而z/(r,力為詞f在文本S中的詞頻,為訓(xùn)練文本的總數(shù),
      m,為訓(xùn)練文本集中出現(xiàn)f的文本數(shù),分母為歸一化因子。
      上述對計算出來的文本向量的權(quán)重進(jìn)行排序時,首先設(shè)定一個閾值, 將權(quán)重大于該閾值的文本向量挑選出來構(gòu)成一個集合,然后再根據(jù)所在網(wǎng) 頁中的上下文信息,從所述集合中提取出需要的廣告主信息和廣告描述信 息。
      另外,在步驟101中, 一般是先準(zhǔn)備一個廣告監(jiān)控程序spider來監(jiān)控 各個網(wǎng)站的廣告投放情況,并且把這些數(shù)據(jù)作為快照(原始網(wǎng)頁內(nèi)容)保 存起來。本發(fā)明所用的spider是發(fā)明人自主研發(fā)的,主要用來監(jiān)控一百多 個媒體,二千多個頻道,幾萬個網(wǎng)頁的變化情況。然后利用廣告主信息提 取技術(shù),來提取出廣告信息,包括廣告主信息和廣告描述信息。然后把廣 告主信息和廣告描述進(jìn)行分詞,并建立索引,這樣方便通過關(guān)鍵詞來查找。 所謂分詞是指針對現(xiàn)代漢語字序列文本(普通),分解為詞序列的文本,
      如我們的祖國多美好,經(jīng)過分詞之后變?yōu)槲覀兊淖鎳嗝篮谩H?后再把每個建立索引的關(guān)鍵詞的相關(guān)性計算出來,這樣就得到了一個"關(guān)
      鍵詞-廣告集合"的倒排表(如圖2所示,圖2為依照本發(fā)明實施例建立關(guān)
      鍵詞索引的示意圖)。廣告集合是已經(jīng)按照相關(guān)性排好序的,這樣在檢索 的時候就能快速的返回結(jié)果了。
      上述步驟102中所述對網(wǎng)頁快照庫中保存的廣告數(shù)據(jù)中的文字信息進(jìn)
      行分詞的步驟中,所述分詞包括將現(xiàn)代漢語的普通字序列文本分解為詞
      序列的文本。
      上述步驟103中所述計算關(guān)鍵詞的相關(guān)性的步驟中采用公式P-alxm 十a(chǎn)2xc + a3xh來計算關(guān)鍵詞的相關(guān)性,其中al、 a2和a3是常量系數(shù),且 al+a2+a3 = 1,在實際運算時al、 a2和a3所占的權(quán)重可調(diào),m為每個廣 告的投放的網(wǎng)站/頻道信息、c為廣告內(nèi)容描述信息、h為廣告主信息,具 體計算過程包括根據(jù)實際情況確定al、 a2和a3的值,然后分別計算m、 c和h的值,將al、 a2、 a3、 m、 c禾口 h的值帶入公式P = alxm + a2xc + a3xh 計算得到關(guān)鍵詞的相關(guān)性。
      上述計算每個廣告的投放的網(wǎng)站/頻道信息m的值的過程包括假設(shè)
      Tr(k)=力 >(") , Tr(k)代表第k篇命中廣告的Traffic Rank,是由n個投放
      的Traffic Rank之和組成,Traffic Rank為每百萬人訪問量,則代表第k篇
      命中廣告歸一后的pagemnk值的MW = ^ m p "、。
      max(Pr(l), Pr(2),,, Pr(n))
      上述計算廣告內(nèi)容描述信息C的值采用下面的空間向量模型進(jìn)行
      <formula>formula see original document page 11</formula>
      中的權(quán)重,為詞^在文本^中的詞頻,為訓(xùn)練文本的總數(shù),
      為訓(xùn)練文本集中出現(xiàn)/的文本數(shù),分母為歸一化因子。
      上述計算廣告主信息h的值與計算廣告內(nèi)容描述信息c的值采用相同 的空間向量模,這里就不再贅述。
      基于圖l所示的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法流程圖,以下結(jié)合具體的 實施例對本發(fā)明提供的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法進(jìn)一步詳細(xì)說明。 實施例
      在本實施例中,以用戶輸入"汽車"這個關(guān)鍵詞為例,詳細(xì)描述對搜 索到的有關(guān)汽車的網(wǎng)絡(luò)廣告進(jìn)行排序的整個過程。
      如圖3所示,圖3為依照本發(fā)明實施例對網(wǎng)絡(luò)廣告進(jìn)行排序的示意圖,
      該方法包括以下步驟
      步驟301:采用廣告監(jiān)控程序spider監(jiān)控各個網(wǎng)站的廣告投放情況, 定期從搜狐汽車、新浪汽車等網(wǎng)站上抓取廣告數(shù)據(jù)信息,并將原始網(wǎng)頁內(nèi) 容作為網(wǎng)頁快照保存到網(wǎng)頁快照庫中。
      步驟302:從獲取的廣告數(shù)據(jù)中提取出廣告主信息和廣告描述信息, 并格式化獲取的廣告數(shù)據(jù)信息;
      在本步驟中,格式化后的廣告數(shù)據(jù)信息為
      i 、廣告內(nèi)容(圖片/flash/文字)
      廣告主 一汽大眾 廣告名稱速騰汽車
      廣告目t示URL: http:〃www.sagitar.com.cn/olympic/
      投放媒體新浪汽車頻道,愛卡汽車網(wǎng)資訊頻道,......
      ii、廣告內(nèi)容(圖片/flash/文字)
      廣告主上海通用汽車有限公司 廣告名稱別克林蔭大道汽車
      廣告目禾示URL: http:〃topic.xcar.com.cn/buickhistory/
      投放媒體搜狐汽車頻道,
      步驟303:建立關(guān)鍵詞到廣告的倒排索引
      在本步驟中,建立的倒排索引如圖4所示,圖4為依照本發(fā)明實施例 建立的倒排索引的示意圖。
      步驟304:對倒排索引表中的每個關(guān)鍵詞進(jìn)行相關(guān)性計算,具體包括:
      首先確定使用公式P = alxm + a2xc + a3xh計算關(guān)鍵詞的相關(guān)性,其 中al、 a2和a3是常量系數(shù),且al+a2+a3:l,在實際運算時al、 a2和a3 所占的權(quán)重可調(diào),m為每個廣告的投放的網(wǎng)站/頻道信息、c為廣告內(nèi)容描 述信息、h為廣告主信息;
      然后確定常量系數(shù)al、 a2和a3的取值,al=0.4, a2 = 0.2, a3 = 0.4 (當(dāng)然在實際取值的過程中,可以根據(jù)排序結(jié)果適當(dāng)進(jìn)行調(diào)整);
      然后計算m的值首先從中國互聯(lián)網(wǎng)協(xié)會提供的數(shù)據(jù)中査找頻道的
      Traffic Rank值,得到Tr (sina) =148664, Tr (sohu) =100175, Tr (xcar) =841,計算得到Tr (Al) =148664+841 = 149505, Tr (A2) =100175,
      進(jìn)而計算得到
      m (Al) =149505/ (149505+100175) =0.5988; m (A2) =100175/ (149505+100175) =0.4012;
      然后計算 C 的值采用空間向量模型 C(U)= , (l + l0g2//(U))—xlog2(iV/"t) 進(jìn)行計算,其中,c(")為詞f在
      文本S中的權(quán)重,f/(f,》為詞f在文本^中的詞頻,TV為訓(xùn)練文本的 總數(shù),n,為訓(xùn)練文本集中出現(xiàn)f的文本數(shù),分母為歸一化因子;由上述空 間向量模型得到c (Al) 二0.5233 ; c (A2) =0.5732;...... 然后計算 h 的值采用空間向量模型 C(^= ,(l + log2仰^—))"og2(W/",) 進(jìn)行計算,其中,c(^)為詞f在 a/2L [(1 + log2 力)x l。g2 (W/)]2
      文本S中的權(quán)重,r/GJ)為詞?在文本S中的詞頻,W為訓(xùn)練文本的 總數(shù),",為訓(xùn)練文本集中出現(xiàn)^的文本數(shù),分母為歸一化因子;由上述空
      間向量模型得到h (Al) =0.4817 ; h (A2) =0.5112;......
      最后采用公式P = alxm + a2xc + a3xh綜合計算關(guān)鍵詞的相關(guān)性 P (Al) =0.4x0.5988+0.2x0.5233+0.4x0.4817 = 0.5369; P (A2) =0.4x0.4012+0.2x0.5732+0,4x0.5112 = 0.4796;
      步驟305:根據(jù)計算出的結(jié)果,對計算出的相關(guān)性從高到低進(jìn)行排序, 排序結(jié)果如下
      P (Al) >P (A2) >......
      即最后利用"汽車"這個關(guān)鍵詞,得到的廣告排序如圖5所示,圖5為 依照本發(fā)明實施例對網(wǎng)絡(luò)廣告進(jìn)行排序的結(jié)果示意圖,這是選取了頭兩條 的結(jié)果。
      以上所述的具體實施例,對本發(fā)明的目的、技術(shù)方案和有益效果進(jìn)行 了進(jìn)一步詳細(xì)說明,所應(yīng)理解的是,以上所述僅為本發(fā)明的具體實施例而 已,并不用于限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修 改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
      權(quán)利要求
      1、一種對網(wǎng)絡(luò)廣告進(jìn)行排序的方法,其特征在于,該方法包括利用廣告監(jiān)控程序從網(wǎng)站獲取廣告數(shù)據(jù),從獲取的廣告數(shù)據(jù)中提取出廣告主信息和廣告描述信息;分別對廣告主信息和廣告描述信息進(jìn)行分詞得到的關(guān)鍵詞,建立該關(guān)鍵詞的索引;計算每個建立索引的關(guān)鍵詞的相關(guān)性,按照計算的相關(guān)性從高到低對網(wǎng)絡(luò)廣告進(jìn)行排序。
      6、 根據(jù)權(quán)利要求3所述的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法,其特征在于,所述空間向量模型采用以下公式來表征 昨S) = 一)xlog(iV/",+0.01) , D^)xlog(A^",+0.01)]2其中,為詞Z在文本S中的權(quán)重,而《a,》為詞/在文本 S中的詞頻,W為訓(xùn)練文本的總數(shù),",為訓(xùn)練文本集中出現(xiàn)^的文本數(shù), 分母為歸一化因子。
      7、 根據(jù)權(quán)利要求3所述的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法,其特征在于, 所述對計算出來的文本向量的權(quán)重進(jìn)行排序時,首先設(shè)定一個閾值,將權(quán) 重大于該閾值的文本向量挑選出來構(gòu)成一個集合,然后再根據(jù)所在網(wǎng)頁中 的上下文信息,從所述集合中提取出需要的廣告主信息和廣告描述信息。
      8、 根據(jù)權(quán)利要求1所述的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法,其特征在于, 所述對網(wǎng)頁快照庫中保存的廣告數(shù)據(jù)中的文字信息進(jìn)行分詞的步驟中,所 述分詞包括將現(xiàn)代漢語的普通字序列文本分解為詞序列的文本。
      9、 根據(jù)權(quán)利要求1所述的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法,其特征在于, 所述計算關(guān)鍵詞的相關(guān)性的步驟中采用公式P = alxm + a2xc + a3xh來計 算關(guān)鍵詞的相關(guān)性,其中al、 a2和a3是常量系數(shù),且al+a2+a3-l,在 實際運算時al、 a2和a3所占的權(quán)重可調(diào),m為每個廣告的投放的網(wǎng)站/ 頻道信息、c為廣告內(nèi)容描述信息、h為廣告主信息,具體計算過程包括根據(jù)實際情況確定al、 a2和a3的值,然后分別計算m、 c禾B h的值, 將al、 a2、 a3、 m、 c和h的值帶入公式P = alxm + a2xc + a3xh計算得到 關(guān)鍵詞的相關(guān)性。
      10、 根據(jù)權(quán)利要求9所述的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法,其特征在于, 所述計算每個廣告的投放的網(wǎng)站/頻道信息m的值的過程包括假設(shè)Tr(k)- ^7>("), Tr(k)代表第k篇命中廣告的Traffic Rank,是由n個投放的Traffic Rank之和組成,Traffic Rank為每百萬人訪問量,則代表第k篇命中廣告歸一后的pagerank值的M(" = ~~一,、 D ,、、。max(Pr(l), Pr(2),, , Pr(n))11、根據(jù)權(quán)利要求9所述的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法,其特征在于, 所述計算廣告內(nèi)容描述信息c的值和計算廣告主信息h的值采用下面的空間向量模型進(jìn)行c(, ^ = (l + log2^("))xl0g2(JV/",), [(1 + log2仰,力)x log2 (WZ"')f其中,C0,S)為詞f在文本S中的權(quán)重,//(/,^)為詞^在文本S 中的詞頻,為訓(xùn)練文本的總數(shù),w,為訓(xùn)練文本集中出現(xiàn)/的文本數(shù),分 母為歸一化因子。
      全文摘要
      本發(fā)明涉及互聯(lián)網(wǎng)中文智能處理技術(shù)領(lǐng)域,公開了一種對網(wǎng)絡(luò)廣告進(jìn)行排序的方法,該方法包括利用廣告監(jiān)控程序從網(wǎng)站獲取廣告數(shù)據(jù),從獲取的廣告數(shù)據(jù)中提取出廣告主信息和廣告描述信息;分別對廣告主信息和廣告描述信息進(jìn)行分詞得到的關(guān)鍵詞,建立該關(guān)鍵詞的索引;計算每個建立索引的關(guān)鍵詞的相關(guān)性,按照計算的相關(guān)性從高到低對網(wǎng)絡(luò)廣告進(jìn)行排序。利用本發(fā)明,實現(xiàn)了對網(wǎng)絡(luò)廣告的排序,能夠迅速確定一個關(guān)鍵詞對應(yīng)的眾多廣告的相關(guān)性排序,從而能夠方便廣告設(shè)計人員用最短的時間找到適合自己的廣告資料。同時廣告主也可以利用這個系統(tǒng)來查看競爭對手的廣告投放情況,對設(shè)計自己的廣告投放方案提供支持。
      文檔編號G06F17/30GK101097580SQ20071011760
      公開日2008年1月2日 申請日期2007年6月20日 優(yōu)先權(quán)日2007年6月20日
      發(fā)明者峰 鄭 申請人:精實萬維軟件(北京)有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1