一種對網(wǎng)絡(luò)廣告進(jìn)行排序的方法

文檔序號：6609931閱讀：286來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：一種對網(wǎng)絡(luò)廣告進(jìn)行排序的方法
技術(shù)領(lǐng)域：
本發(fā)明涉及互聯(lián)網(wǎng)中文智能處理技術(shù)領(lǐng)域，尤其涉及一種對網(wǎng)絡(luò)廣告進(jìn)行排序的方法。
背景技術(shù)：
隨著互聯(lián)網(wǎng)的普及，網(wǎng)絡(luò)廣告出現(xiàn)了強勁的增長勢頭，選擇投放網(wǎng)絡(luò) 廣告的客戶也是越來越多。那么，在研究某一類行業(yè)或者某一類產(chǎn)品的廣告的時候，就會面臨大量的廣告，究竟哪個廣告同用戶的檢索行為最相關(guān)，廣告排序這個問題就產(chǎn)生了。
例如用戶輸入"汽車"這個關(guān)鍵詞，和汽車相關(guān)的廣告有成千上萬，如何將這些廣告呈現(xiàn)給用戶，排序就顯得比較重要了。本發(fā)明就是為了解決上述問題而產(chǎn)生的。

發(fā)明內(nèi)容
(一) 要解決的技術(shù)問題
有鑒于此，本發(fā)明的主要目的在于提供一種對網(wǎng)絡(luò)廣告進(jìn)行排序的方法，以實現(xiàn)對網(wǎng)絡(luò)廣告的排序。
(二) 技術(shù)方案
為達(dá)到上述目的，本發(fā)明提供了一種對網(wǎng)絡(luò)廣告進(jìn)行排序的方法，該方法包括
利用廣告監(jiān)控程序從網(wǎng)站獲取廣告數(shù)據(jù)，從獲取的廣告數(shù)據(jù)中提取出廣告主信息和廣告描述信息；
分別對廣告主信息和廣告描述信息進(jìn)行分詞得到的關(guān)鍵詞，建立該關(guān)
鍵詞的索引；
計算每個建立索引的關(guān)鍵詞的相關(guān)性，按照計算的相關(guān)性從高到低對網(wǎng)絡(luò)廣告進(jìn)行排序。
上述方案中，所述利用廣告監(jiān)控程序從網(wǎng)站獲取廣告數(shù)據(jù)的步驟包括利用廣告監(jiān)控程序spider監(jiān)控各個網(wǎng)站的廣告投放情況，并將原始網(wǎng) 頁內(nèi)容作為網(wǎng)頁快照保存到網(wǎng)頁快照庫中。
上述方案中，所述從獲取的廣告數(shù)據(jù)中提取出廣告主信息和廣告描述信息的步驟包括
對網(wǎng)頁快照庫中保存的廣告數(shù)據(jù)中的文字信息進(jìn)行分詞，得到一組文本向量；
根據(jù)所述文本向量的特征，對所述文本向量進(jìn)行向量加權(quán)或向量減
權(quán)；
采用空間向量模型計算所述進(jìn)行了向量加權(quán)或向量減權(quán)后的文本向量的權(quán)重；
對計算出來的文本向量的權(quán)重進(jìn)行排序，并根據(jù)文本向量所在網(wǎng)頁中的上下文信息，從網(wǎng)頁中提取出廣告主信息和廣告描述信息。
上述方案中，所述對網(wǎng)頁快照庫中保存的廣告數(shù)據(jù)中的文字信息進(jìn)行分詞包括將現(xiàn)代漢語的普通字序列文本分解為詞序列的文本。
上述方案中，所述對文本向量進(jìn)行向量加權(quán)或向量減權(quán)的步驟包括
對出現(xiàn)在標(biāo)題中的文本向量，將向量權(quán)重增至原來的5至IO倍；
對出現(xiàn)在網(wǎng)頁結(jié)構(gòu)中content的簡介，將向量權(quán)重增至原來的2至3
對出現(xiàn)在網(wǎng)頁內(nèi)容中版權(quán)信息類的文本向量，將向量權(quán)重增至原來的 3至5倍；
對出現(xiàn)在網(wǎng)頁內(nèi)容中與廣告主信息有關(guān)的文本向量，將向量權(quán)重增至
原來的3至5倍；
對出現(xiàn)的包含在停詞表中文本向量，將向量權(quán)重減至原來的1/5至 1/10。
上述方案中，所述空間向量模型采用以下公式來表征<formula>formula see original document page 6</formula>
其中，r(r，S)為詞f在文本S中的權(quán)重，而為詞Z在文本
中的詞頻，7V為訓(xùn)練文本的總數(shù)，"，為訓(xùn)練文本集中出現(xiàn)f的文本數(shù)，分母為歸一化因子。
上述方案中，所述對計算出來的文本向量的權(quán)重進(jìn)行排序時，首先設(shè) 定一個閾值，將權(quán)重大于該閾值的文本向量挑選出來構(gòu)成一個集合，然后再根據(jù)所在網(wǎng)頁中的上下文信息，從所述集合中提取出需要的廣告主信息和廣告描述信息。
上述方案中，所述對網(wǎng)頁快照庫中保存的廣告數(shù)據(jù)中的文字信息進(jìn)行分詞的步驟中，所述分詞包括將現(xiàn)代漢語的普通字序列文本分解為詞序列的文本。
上述方案中，所述計算關(guān)鍵詞的相關(guān)性的步驟中采用公式？ = 31><111 +
a2xc + a3xh來計算關(guān)鍵詞的相關(guān)性，其中al、 a2和a3是常量系數(shù)，且 al+a2+a3 = 1，在實際運算時al、 a2和a3所占的權(quán)重可調(diào)，m為每個廣告的投放的網(wǎng)站/頻道信息、c為廣告內(nèi)容描述信息、h為廣告主信息，具體計算過程包括根據(jù)實際情況確定al、 a2和a3的值，然后分別計算m、 c和h的值，將al 、 a2、 a3、 m、 c禾口 h的值帶入公式P = alxm + a2xc + a3xh 計算得到關(guān)鍵詞的相關(guān)性。
上述方案中，所述計算每個廣告的投放的網(wǎng)站/頻道信息m的值的過
程包括假設(shè)Tr(k"力7V(")， Tr(k)代表第k篇命中廣告的Traffic Rank，
是由n個投放的Traffic Rank之和組成，Traffic Rank為每百萬人訪問量，則代表第 k 篇命中廣告歸一后的 pagemnk值的
<formula>formula see original document page 7</formula>
上述方案中，所述計算廣告內(nèi)容描述信息C的值和計算廣告主信息h 的值采用下面的空間向量模型進(jìn)行
<formula>formula see original document page 7</formula>
其中，C(/,力為詞f在文本S中的權(quán)重，為詞f在文本S 中的詞頻，iV為訓(xùn)練文本的總數(shù)，^為訓(xùn)練文本集中出現(xiàn)f的文本數(shù)，分
母為歸一化因子。
(三)有益效果從上述技術(shù)方案可以看出，本發(fā)明具有以下有益效果
1、利用本發(fā)明，通過從網(wǎng)站獲取廣告數(shù)據(jù)，并從獲取的廣告數(shù)據(jù)中提取出廣告主信息和廣告描述信息；然后分別對廣告主信息和廣告描述信息進(jìn)行分詞得到的關(guān)鍵詞，建立該關(guān)鍵詞的索引，計算每個建立索引的關(guān) 鍵詞的相關(guān)性，按照計算的相關(guān)性從高到低對網(wǎng)絡(luò)廣告進(jìn)行排序，實現(xiàn)了對網(wǎng)絡(luò)廣告的排序。
2、利用本發(fā)明，能夠迅速確定一個關(guān)鍵詞對應(yīng)的眾多廣告的相關(guān)性排序，從而能夠方便廣告設(shè)計人員用最短的時間找到適合自己的廣告資料。同時廣告主也可以利用這個系統(tǒng)來查看競爭對手的廣告投放情況，對設(shè)計自己的廣告投放方案提供支持。

圖1為本發(fā)明提供的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法流程圖2為依照本發(fā)明實施例建立關(guān)鍵詞索引的示意圖3為依照本發(fā)明實施例對網(wǎng)絡(luò)廣告進(jìn)行排序的示意圖4為依照本發(fā)明實施例建立的倒排索引的示意圖5為依照本發(fā)明實施例對網(wǎng)絡(luò)廣告進(jìn)行排序的結(jié)果示意圖。
具體實施例方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚明白，以下結(jié)合具體實施例，并參照附圖，對本發(fā)明進(jìn)一步詳細(xì)說明。
如圖1所示，圖1為本發(fā)明提供的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法流程圖，該方法包括以下步驟
步驟101:利用廣告監(jiān)控程序從網(wǎng)站獲取廣告數(shù)據(jù)，從獲取的廣告數(shù) 據(jù)中提取出廣告主信息和廣告描述信息；
步驟102:分別對廣告主信息和廣告描述信息進(jìn)行分詞得到的關(guān)鍵詞，建立該關(guān)鍵詞的索引；
步驟103:計算每個建立索引的關(guān)鍵詞的相關(guān)性，按照計算的相關(guān)性從高到低對網(wǎng)絡(luò)廣告進(jìn)行排序。
上述步驟101中所述利用廣告監(jiān)控程序從網(wǎng)站獲取廣告數(shù)據(jù)的步驟包
括利用廣告監(jiān)控程序spider監(jiān)控各個網(wǎng)站的廣告投放情況，并將原始網(wǎng)
頁內(nèi)容作為網(wǎng)頁快照保存到網(wǎng)頁快照庫中。
上述步驟101中所述從獲取的廣告數(shù)據(jù)中提取出廣告主信息和廣告描
述信息的步驟包括對網(wǎng)頁快照庫中保存的廣告數(shù)據(jù)中的文字信息進(jìn)行分詞，得到一組文本向量；根據(jù)所述文本向量的特征，對所述文本向量進(jìn)行向量加權(quán)或向量減權(quán)；采用空間向量模型計算所述進(jìn)行了向量加權(quán)或向量減權(quán)后的文本向量的權(quán)重；對計算出來的文本向量的權(quán)重進(jìn)行排序，并根據(jù)文本向量所在網(wǎng)頁中的上下文信息，從網(wǎng)頁中提取出廣告主信息和廣告描述信息。
上述對網(wǎng)頁快照庫中保存的廣告數(shù)據(jù)中的文字信息進(jìn)行分詞包括將現(xiàn)代漢語的普通字序列文本分解為詞序列的文本。
上述對文本向量進(jìn)行向量加權(quán)或向量減權(quán)的步驟包括對出現(xiàn)在標(biāo)題中的文本向量，將向量權(quán)重增至原來的5至10倍；對出現(xiàn)在網(wǎng)頁結(jié)構(gòu)中 content的簡介，將向量權(quán)重增至原來的2至3倍；對出現(xiàn)在網(wǎng)頁內(nèi)容中版權(quán)信息類的文本向量，將向量權(quán)重增至原來的3至5倍；對出現(xiàn)在網(wǎng)頁內(nèi) 容中與廣告主信息有關(guān)的文本向量，將向量權(quán)重增至原來的3至5倍；對出現(xiàn)的包含在停詞表中文本向量，將向量權(quán)重減至原來的1/5至1/10。
上述空間向量模型采用以下公式來表征昨力=,,/(")xl。g(W/",+0.01)，其中，昨力為詞,在文本s中
^!』/(")"og(^"'+0'01)]2 的權(quán)重，而z/(r,力為詞f在文本S中的詞頻，為訓(xùn)練文本的總數(shù)，
m,為訓(xùn)練文本集中出現(xiàn)f的文本數(shù)，分母為歸一化因子。
上述對計算出來的文本向量的權(quán)重進(jìn)行排序時，首先設(shè)定一個閾值，將權(quán)重大于該閾值的文本向量挑選出來構(gòu)成一個集合，然后再根據(jù)所在網(wǎng) 頁中的上下文信息，從所述集合中提取出需要的廣告主信息和廣告描述信息。
另外，在步驟101中，一般是先準(zhǔn)備一個廣告監(jiān)控程序spider來監(jiān)控各個網(wǎng)站的廣告投放情況，并且把這些數(shù)據(jù)作為快照(原始網(wǎng)頁內(nèi)容)保存起來。本發(fā)明所用的spider是發(fā)明人自主研發(fā)的，主要用來監(jiān)控一百多個媒體，二千多個頻道，幾萬個網(wǎng)頁的變化情況。然后利用廣告主信息提取技術(shù)，來提取出廣告信息，包括廣告主信息和廣告描述信息。然后把廣告主信息和廣告描述進(jìn)行分詞，并建立索引，這樣方便通過關(guān)鍵詞來查找。所謂分詞是指針對現(xiàn)代漢語字序列文本(普通)，分解為詞序列的文本，
如我們的祖國多美好，經(jīng)過分詞之后變?yōu)槲覀兊淖鎳嗝篮谩Ｈ?后再把每個建立索引的關(guān)鍵詞的相關(guān)性計算出來，這樣就得到了一個"關(guān)
鍵詞-廣告集合"的倒排表(如圖2所示，圖2為依照本發(fā)明實施例建立關(guān)
鍵詞索引的示意圖)。廣告集合是已經(jīng)按照相關(guān)性排好序的，這樣在檢索的時候就能快速的返回結(jié)果了。
上述步驟102中所述對網(wǎng)頁快照庫中保存的廣告數(shù)據(jù)中的文字信息進(jìn)
行分詞的步驟中，所述分詞包括將現(xiàn)代漢語的普通字序列文本分解為詞
序列的文本。
上述步驟103中所述計算關(guān)鍵詞的相關(guān)性的步驟中采用公式P-alxm 十a(chǎn)2xc + a3xh來計算關(guān)鍵詞的相關(guān)性，其中al、 a2和a3是常量系數(shù)，且 al+a2+a3 = 1，在實際運算時al、 a2和a3所占的權(quán)重可調(diào)，m為每個廣告的投放的網(wǎng)站/頻道信息、c為廣告內(nèi)容描述信息、h為廣告主信息，具體計算過程包括根據(jù)實際情況確定al、 a2和a3的值，然后分別計算m、 c和h的值，將al、 a2、 a3、 m、 c禾口 h的值帶入公式P = alxm + a2xc + a3xh 計算得到關(guān)鍵詞的相關(guān)性。
上述計算每個廣告的投放的網(wǎng)站/頻道信息m的值的過程包括假設(shè)
Tr(k)=力 >(") ， Tr(k)代表第k篇命中廣告的Traffic Rank,是由n個投放
的Traffic Rank之和組成，Traffic Rank為每百萬人訪問量，則代表第k篇
命中廣告歸一后的pagemnk值的MW = ^ m p "、。
max(Pr(l), Pr(2),,, Pr(n))
上述計算廣告內(nèi)容描述信息C的值采用下面的空間向量模型進(jìn)行
<formula>formula see original document page 11</formula>
中的權(quán)重，為詞^在文本^中的詞頻，為訓(xùn)練文本的總數(shù)，
為訓(xùn)練文本集中出現(xiàn)/的文本數(shù)，分母為歸一化因子。
上述計算廣告主信息h的值與計算廣告內(nèi)容描述信息c的值采用相同的空間向量模，這里就不再贅述。
基于圖l所示的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法流程圖，以下結(jié)合具體的實施例對本發(fā)明提供的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法進(jìn)一步詳細(xì)說明。實施例
在本實施例中，以用戶輸入"汽車"這個關(guān)鍵詞為例，詳細(xì)描述對搜索到的有關(guān)汽車的網(wǎng)絡(luò)廣告進(jìn)行排序的整個過程。
如圖3所示，圖3為依照本發(fā)明實施例對網(wǎng)絡(luò)廣告進(jìn)行排序的示意圖，
該方法包括以下步驟
步驟301:采用廣告監(jiān)控程序spider監(jiān)控各個網(wǎng)站的廣告投放情況，定期從搜狐汽車、新浪汽車等網(wǎng)站上抓取廣告數(shù)據(jù)信息，并將原始網(wǎng)頁內(nèi) 容作為網(wǎng)頁快照保存到網(wǎng)頁快照庫中。
步驟302:從獲取的廣告數(shù)據(jù)中提取出廣告主信息和廣告描述信息，并格式化獲取的廣告數(shù)據(jù)信息；
在本步驟中，格式化后的廣告數(shù)據(jù)信息為
i 、廣告內(nèi)容(圖片/flash/文字)
廣告主一汽大眾廣告名稱速騰汽車
廣告目t示URL: http:〃www.sagitar.com.cn/olympic/
投放媒體新浪汽車頻道，愛卡汽車網(wǎng)資訊頻道，......
ii、廣告內(nèi)容(圖片/flash/文字)
廣告主上海通用汽車有限公司廣告名稱別克林蔭大道汽車
廣告目禾示URL: http:〃topic.xcar.com.cn/buickhistory/
投放媒體搜狐汽車頻道，
步驟303:建立關(guān)鍵詞到廣告的倒排索引
在本步驟中，建立的倒排索引如圖4所示，圖4為依照本發(fā)明實施例建立的倒排索引的示意圖。
步驟304:對倒排索引表中的每個關(guān)鍵詞進(jìn)行相關(guān)性計算，具體包括:
首先確定使用公式P = alxm + a2xc + a3xh計算關(guān)鍵詞的相關(guān)性，其中al、 a2和a3是常量系數(shù)，且al+a2+a3:l，在實際運算時al、 a2和a3 所占的權(quán)重可調(diào)，m為每個廣告的投放的網(wǎng)站/頻道信息、c為廣告內(nèi)容描述信息、h為廣告主信息；
然后確定常量系數(shù)al、 a2和a3的取值，al=0.4， a2 = 0.2， a3 = 0.4 (當(dāng)然在實際取值的過程中，可以根據(jù)排序結(jié)果適當(dāng)進(jìn)行調(diào)整)；
然后計算m的值首先從中國互聯(lián)網(wǎng)協(xié)會提供的數(shù)據(jù)中査找頻道的
Traffic Rank值，得到Tr (sina) =148664， Tr (sohu) =100175， Tr (xcar) =841，計算得到Tr (Al) =148664+841 = 149505， Tr (A2) =100175，
進(jìn)而計算得到
m (Al) =149505/ (149505+100175) =0.5988; m (A2) =100175/ (149505+100175) =0.4012;
然后計算 C 的值采用空間向量模型 C(U)= , (l + l0g2//(U))—xlog2(iV/"t) 進(jìn)行計算，其中，c(")為詞f在
文本S中的權(quán)重，f/(f,》為詞f在文本^中的詞頻，TV為訓(xùn)練文本的總數(shù)，n,為訓(xùn)練文本集中出現(xiàn)f的文本數(shù)，分母為歸一化因子；由上述空間向量模型得到c (Al) 二0.5233 ; c (A2) =0.5732;...... 然后計算 h 的值采用空間向量模型 C(^= ,(l + log2仰^—))"og2(W/",) 進(jìn)行計算，其中，c(^)為詞f在 a/2L [(1 + log2 力)x l。g2 (W/)]2
文本S中的權(quán)重，r/GJ)為詞？在文本S中的詞頻，W為訓(xùn)練文本的總數(shù)，",為訓(xùn)練文本集中出現(xiàn)^的文本數(shù)，分母為歸一化因子；由上述空
間向量模型得到h (Al) =0.4817 ; h (A2) =0.5112;......
最后采用公式P = alxm + a2xc + a3xh綜合計算關(guān)鍵詞的相關(guān)性 P (Al) =0.4x0.5988+0.2x0.5233+0.4x0.4817 = 0.5369; P (A2) =0.4x0.4012+0.2x0.5732+0,4x0.5112 = 0.4796;
步驟305:根據(jù)計算出的結(jié)果，對計算出的相關(guān)性從高到低進(jìn)行排序，排序結(jié)果如下
P (Al) >P (A2) >......
即最后利用"汽車"這個關(guān)鍵詞，得到的廣告排序如圖5所示，圖5為依照本發(fā)明實施例對網(wǎng)絡(luò)廣告進(jìn)行排序的結(jié)果示意圖，這是選取了頭兩條的結(jié)果。
以上所述的具體實施例，對本發(fā)明的目的、技術(shù)方案和有益效果進(jìn)行了進(jìn)一步詳細(xì)說明，所應(yīng)理解的是，以上所述僅為本發(fā)明的具體實施例而已，并不用于限制本發(fā)明，凡在本發(fā)明的精神和原則之內(nèi)，所做的任何修改、等同替換、改進(jìn)等，均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1、一種對網(wǎng)絡(luò)廣告進(jìn)行排序的方法，其特征在于，該方法包括利用廣告監(jiān)控程序從網(wǎng)站獲取廣告數(shù)據(jù)，從獲取的廣告數(shù)據(jù)中提取出廣告主信息和廣告描述信息；分別對廣告主信息和廣告描述信息進(jìn)行分詞得到的關(guān)鍵詞，建立該關(guān)鍵詞的索引；計算每個建立索引的關(guān)鍵詞的相關(guān)性，按照計算的相關(guān)性從高到低對網(wǎng)絡(luò)廣告進(jìn)行排序。
6、根據(jù)權(quán)利要求3所述的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法，其特征在于，所述空間向量模型采用以下公式來表征昨S) = 一)xlog(iV/",+0.01) ， D^)xlog(A^",+0.01)]2其中，為詞Z在文本S中的權(quán)重，而《a,》為詞/在文本 S中的詞頻，W為訓(xùn)練文本的總數(shù)，"，為訓(xùn)練文本集中出現(xiàn)^的文本數(shù)，分母為歸一化因子。
7、根據(jù)權(quán)利要求3所述的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法，其特征在于，所述對計算出來的文本向量的權(quán)重進(jìn)行排序時，首先設(shè)定一個閾值，將權(quán) 重大于該閾值的文本向量挑選出來構(gòu)成一個集合，然后再根據(jù)所在網(wǎng)頁中的上下文信息，從所述集合中提取出需要的廣告主信息和廣告描述信息。
8、根據(jù)權(quán)利要求1所述的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法，其特征在于，所述對網(wǎng)頁快照庫中保存的廣告數(shù)據(jù)中的文字信息進(jìn)行分詞的步驟中，所述分詞包括將現(xiàn)代漢語的普通字序列文本分解為詞序列的文本。
9、根據(jù)權(quán)利要求1所述的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法，其特征在于，所述計算關(guān)鍵詞的相關(guān)性的步驟中采用公式P = alxm + a2xc + a3xh來計算關(guān)鍵詞的相關(guān)性，其中al、 a2和a3是常量系數(shù)，且al+a2+a3-l，在實際運算時al、 a2和a3所占的權(quán)重可調(diào)，m為每個廣告的投放的網(wǎng)站/ 頻道信息、c為廣告內(nèi)容描述信息、h為廣告主信息，具體計算過程包括根據(jù)實際情況確定al、 a2和a3的值，然后分別計算m、 c禾B h的值，將al、 a2、 a3、 m、 c和h的值帶入公式P = alxm + a2xc + a3xh計算得到關(guān)鍵詞的相關(guān)性。
10、根據(jù)權(quán)利要求9所述的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法，其特征在于，所述計算每個廣告的投放的網(wǎng)站/頻道信息m的值的過程包括假設(shè)Tr(k)- ^7>(")， Tr(k)代表第k篇命中廣告的Traffic Rank，是由n個投放的Traffic Rank之和組成，Traffic Rank為每百萬人訪問量，則代表第k篇命中廣告歸一后的pagerank值的M(" = ~~一，、 D ,、、。max(Pr(l), Pr(2),, ， Pr(n))11、根據(jù)權(quán)利要求9所述的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法，其特征在于，所述計算廣告內(nèi)容描述信息c的值和計算廣告主信息h的值采用下面的空間向量模型進(jìn)行c(, ^ = (l + log2^("))xl0g2(JV/",)， [(1 + log2仰,力)x log2 (WZ"')f其中，C0,S)為詞f在文本S中的權(quán)重，//(/,^)為詞^在文本S 中的詞頻，為訓(xùn)練文本的總數(shù)，w,為訓(xùn)練文本集中出現(xiàn)/的文本數(shù)，分母為歸一化因子。
全文摘要
本發(fā)明涉及互聯(lián)網(wǎng)中文智能處理技術(shù)領(lǐng)域，公開了一種對網(wǎng)絡(luò)廣告進(jìn)行排序的方法，該方法包括利用廣告監(jiān)控程序從網(wǎng)站獲取廣告數(shù)據(jù)，從獲取的廣告數(shù)據(jù)中提取出廣告主信息和廣告描述信息；分別對廣告主信息和廣告描述信息進(jìn)行分詞得到的關(guān)鍵詞，建立該關(guān)鍵詞的索引；計算每個建立索引的關(guān)鍵詞的相關(guān)性，按照計算的相關(guān)性從高到低對網(wǎng)絡(luò)廣告進(jìn)行排序。利用本發(fā)明，實現(xiàn)了對網(wǎng)絡(luò)廣告的排序，能夠迅速確定一個關(guān)鍵詞對應(yīng)的眾多廣告的相關(guān)性排序，從而能夠方便廣告設(shè)計人員用最短的時間找到適合自己的廣告資料。同時廣告主也可以利用這個系統(tǒng)來查看競爭對手的廣告投放情況，對設(shè)計自己的廣告投放方案提供支持。
文檔編號G06F17/30GK101097580SQ20071011760
公開日2008年1月2日申請日期2007年6月20日優(yōu)先權(quán)日2007年6月20日
發(fā)明者峰鄭申請人:精實萬維軟件(北京)有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：鄭峰
技術(shù)所有人：精實萬維軟件（北京）有限公司
我是此專利的發(fā)明人

上一篇：一種實現(xiàn)票據(jù)密碼驗證的方法
上一篇：一種從網(wǎng)頁中提取廣告主信息的方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

網(wǎng)絡(luò)廣告的方法和種類相關(guān)技術(shù)

網(wǎng)絡(luò)廣告推廣方法相關(guān)技術(shù)

網(wǎng)絡(luò)廣告的方法相關(guān)技術(shù)

網(wǎng)絡(luò)廣告監(jiān)測方法相關(guān)技術(shù)

網(wǎng)絡(luò)廣告的種類相關(guān)技術(shù)

16種類型的網(wǎng)絡(luò)廣告相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種對網(wǎng)絡(luò)廣告進(jìn)行排序的方法