專利名稱:一種對網(wǎng)絡(luò)廣告進(jìn)行排序的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及互聯(lián)網(wǎng)中文智能處理技術(shù)領(lǐng)域,尤其涉及一種對網(wǎng)絡(luò)廣告 進(jìn)行排序的方法。
背景技術(shù):
隨著互聯(lián)網(wǎng)的普及,網(wǎng)絡(luò)廣告出現(xiàn)了強勁的增長勢頭,選擇投放網(wǎng)絡(luò) 廣告的客戶也是越來越多。那么,在研究某一類行業(yè)或者某一類產(chǎn)品的廣 告的時候,就會面臨大量的廣告,究竟哪個廣告同用戶的檢索行為最相關(guān), 廣告排序這個問題就產(chǎn)生了。
例如用戶輸入"汽車"這個關(guān)鍵詞,和汽車相關(guān)的廣告有成千上萬, 如何將這些廣告呈現(xiàn)給用戶,排序就顯得比較重要了。本發(fā)明就是為了解 決上述問題而產(chǎn)生的。
發(fā)明內(nèi)容
(一) 要解決的技術(shù)問題
有鑒于此,本發(fā)明的主要目的在于提供一種對網(wǎng)絡(luò)廣告進(jìn)行排序的方 法,以實現(xiàn)對網(wǎng)絡(luò)廣告的排序。
(二) 技術(shù)方案
為達(dá)到上述目的,本發(fā)明提供了一種對網(wǎng)絡(luò)廣告進(jìn)行排序的方法,該 方法包括
利用廣告監(jiān)控程序從網(wǎng)站獲取廣告數(shù)據(jù),從獲取的廣告數(shù)據(jù)中提取出 廣告主信息和廣告描述信息;
分別對廣告主信息和廣告描述信息進(jìn)行分詞得到的關(guān)鍵詞,建立該關(guān)
鍵詞的索引;
計算每個建立索引的關(guān)鍵詞的相關(guān)性,按照計算的相關(guān)性從高到低對 網(wǎng)絡(luò)廣告進(jìn)行排序。
上述方案中,所述利用廣告監(jiān)控程序從網(wǎng)站獲取廣告數(shù)據(jù)的步驟包 括利用廣告監(jiān)控程序spider監(jiān)控各個網(wǎng)站的廣告投放情況,并將原始網(wǎng) 頁內(nèi)容作為網(wǎng)頁快照保存到網(wǎng)頁快照庫中。
上述方案中,所述從獲取的廣告數(shù)據(jù)中提取出廣告主信息和廣告描述 信息的步驟包括
對網(wǎng)頁快照庫中保存的廣告數(shù)據(jù)中的文字信息進(jìn)行分詞,得到一組文 本向量;
根據(jù)所述文本向量的特征,對所述文本向量進(jìn)行向量加權(quán)或向量減
權(quán);
采用空間向量模型計算所述進(jìn)行了向量加權(quán)或向量減權(quán)后的文本向 量的權(quán)重;
對計算出來的文本向量的權(quán)重進(jìn)行排序,并根據(jù)文本向量所在網(wǎng)頁中 的上下文信息,從網(wǎng)頁中提取出廣告主信息和廣告描述信息。
上述方案中,所述對網(wǎng)頁快照庫中保存的廣告數(shù)據(jù)中的文字信息進(jìn)行 分詞包括將現(xiàn)代漢語的普通字序列文本分解為詞序列的文本。
上述方案中,所述對文本向量進(jìn)行向量加權(quán)或向量減權(quán)的步驟包括
對出現(xiàn)在標(biāo)題中的文本向量,將向量權(quán)重增至原來的5至IO倍;
對出現(xiàn)在網(wǎng)頁結(jié)構(gòu)中content的簡介,將向量權(quán)重增至原來的2至3
對出現(xiàn)在網(wǎng)頁內(nèi)容中版權(quán)信息類的文本向量,將向量權(quán)重增至原來的 3至5倍;
對出現(xiàn)在網(wǎng)頁內(nèi)容中與廣告主信息有關(guān)的文本向量,將向量權(quán)重增至
原來的3至5倍;
對出現(xiàn)的包含在停詞表中文本向量,將向量權(quán)重減至原來的1/5至 1/10。
上述方案中,所述空間向量模型采用以下公式來表征<formula>formula see original document page 6</formula>
其中,r(r,S)為詞f在文本S中的權(quán)重,而為詞Z在文本
中的詞頻,7V為訓(xùn)練文本的總數(shù),",為訓(xùn)練文本集中出現(xiàn)f的文本數(shù), 分母為歸一化因子。
上述方案中,所述對計算出來的文本向量的權(quán)重進(jìn)行排序時,首先設(shè) 定一個閾值,將權(quán)重大于該閾值的文本向量挑選出來構(gòu)成一個集合,然后 再根據(jù)所在網(wǎng)頁中的上下文信息,從所述集合中提取出需要的廣告主信息 和廣告描述信息。
上述方案中,所述對網(wǎng)頁快照庫中保存的廣告數(shù)據(jù)中的文字信息進(jìn)行 分詞的步驟中,所述分詞包括將現(xiàn)代漢語的普通字序列文本分解為詞序 列的文本。
上述方案中,所述計算關(guān)鍵詞的相關(guān)性的步驟中采用公式? = 31><111 +
a2xc + a3xh來計算關(guān)鍵詞的相關(guān)性,其中al、 a2和a3是常量系數(shù),且 al+a2+a3 = 1,在實際運算時al、 a2和a3所占的權(quán)重可調(diào),m為每個廣 告的投放的網(wǎng)站/頻道信息、c為廣告內(nèi)容描述信息、h為廣告主信息,具 體計算過程包括根據(jù)實際情況確定al、 a2和a3的值,然后分別計算m、 c和h的值,將al 、 a2、 a3、 m、 c禾口 h的值帶入公式P = alxm + a2xc + a3xh 計算得到關(guān)鍵詞的相關(guān)性。
上述方案中,所述計算每個廣告的投放的網(wǎng)站/頻道信息m的值的過
程包括假設(shè)Tr(k"力7V("), Tr(k)代表第k篇命中廣告的Traffic Rank,
是由n個投放的Traffic Rank之和組成,Traffic Rank為每百萬人訪問量, 則代表第 k 篇命中廣告歸 一 后的 pagemnk值的
<formula>formula see original document page 7</formula>
上述方案中,所述計算廣告內(nèi)容描述信息C的值和計算廣告主信息h 的值采用下面的空間向量模型進(jìn)行
<formula>formula see original document page 7</formula>
其中,C(/,力為詞f在文本S中的權(quán)重,為詞f在文本S 中的詞頻,iV為訓(xùn)練文本的總數(shù),^為訓(xùn)練文本集中出現(xiàn)f的文本數(shù),分
母為歸一化因子。
(三)有益效果 從上述技術(shù)方案可以看出,本發(fā)明具有以下有益效果
1、 利用本發(fā)明,通過從網(wǎng)站獲取廣告數(shù)據(jù),并從獲取的廣告數(shù)據(jù)中 提取出廣告主信息和廣告描述信息;然后分別對廣告主信息和廣告描述信 息進(jìn)行分詞得到的關(guān)鍵詞,建立該關(guān)鍵詞的索引,計算每個建立索引的關(guān) 鍵詞的相關(guān)性,按照計算的相關(guān)性從高到低對網(wǎng)絡(luò)廣告進(jìn)行排序,實現(xiàn)了 對網(wǎng)絡(luò)廣告的排序。
2、 利用本發(fā)明,能夠迅速確定一個關(guān)鍵詞對應(yīng)的眾多廣告的相關(guān)性 排序,從而能夠方便廣告設(shè)計人員用最短的時間找到適合自己的廣告資 料。同時廣告主也可以利用這個系統(tǒng)來查看競爭對手的廣告投放情況,對 設(shè)計自己的廣告投放方案提供支持。
圖1為本發(fā)明提供的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法流程圖2為依照本發(fā)明實施例建立關(guān)鍵詞索引的示意圖3為依照本發(fā)明實施例對網(wǎng)絡(luò)廣告進(jìn)行排序的示意圖4為依照本發(fā)明實施例建立的倒排索引的示意圖5為依照本發(fā)明實施例對網(wǎng)絡(luò)廣告進(jìn)行排序的結(jié)果示意圖。
具體實施例方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚明白,以下結(jié)合具體實 施例,并參照附圖,對本發(fā)明進(jìn)一步詳細(xì)說明。
如圖1所示,圖1為本發(fā)明提供的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法流程圖, 該方法包括以下步驟
步驟101:利用廣告監(jiān)控程序從網(wǎng)站獲取廣告數(shù)據(jù),從獲取的廣告數(shù) 據(jù)中提取出廣告主信息和廣告描述信息;
步驟102:分別對廣告主信息和廣告描述信息進(jìn)行分詞得到的關(guān)鍵詞, 建立該關(guān)鍵詞的索引;
步驟103:計算每個建立索引的關(guān)鍵詞的相關(guān)性,按照計算的相關(guān)性 從高到低對網(wǎng)絡(luò)廣告進(jìn)行排序。
上述步驟101中所述利用廣告監(jiān)控程序從網(wǎng)站獲取廣告數(shù)據(jù)的步驟包
括利用廣告監(jiān)控程序spider監(jiān)控各個網(wǎng)站的廣告投放情況,并將原始網(wǎng)
頁內(nèi)容作為網(wǎng)頁快照保存到網(wǎng)頁快照庫中。
上述步驟101中所述從獲取的廣告數(shù)據(jù)中提取出廣告主信息和廣告描
述信息的步驟包括對網(wǎng)頁快照庫中保存的廣告數(shù)據(jù)中的文字信息進(jìn)行分 詞,得到一組文本向量;根據(jù)所述文本向量的特征,對所述文本向量進(jìn)行 向量加權(quán)或向量減權(quán);采用空間向量模型計算所述進(jìn)行了向量加權(quán)或向量 減權(quán)后的文本向量的權(quán)重;對計算出來的文本向量的權(quán)重進(jìn)行排序,并根 據(jù)文本向量所在網(wǎng)頁中的上下文信息,從網(wǎng)頁中提取出廣告主信息和廣告 描述信息。
上述對網(wǎng)頁快照庫中保存的廣告數(shù)據(jù)中的文字信息進(jìn)行分詞包括將 現(xiàn)代漢語的普通字序列文本分解為詞序列的文本。
上述對文本向量進(jìn)行向量加權(quán)或向量減權(quán)的步驟包括對出現(xiàn)在標(biāo)題 中的文本向量,將向量權(quán)重增至原來的5至10倍;對出現(xiàn)在網(wǎng)頁結(jié)構(gòu)中 content的簡介,將向量權(quán)重增至原來的2至3倍;對出現(xiàn)在網(wǎng)頁內(nèi)容中版 權(quán)信息類的文本向量,將向量權(quán)重增至原來的3至5倍;對出現(xiàn)在網(wǎng)頁內(nèi) 容中與廣告主信息有關(guān)的文本向量,將向量權(quán)重增至原來的3至5倍;對 出現(xiàn)的包含在停詞表中文本向量,將向量權(quán)重減至原來的1/5至1/10。
上述空間向量模型采用以下公式來表征 昨力=,,/(")xl。g(W/",+0.01),其中,昨力為詞,在文本s中
^!』/(")"og(^"'+0'01)]2 的權(quán)重,而z/(r,力為詞f在文本S中的詞頻,為訓(xùn)練文本的總數(shù),
m,為訓(xùn)練文本集中出現(xiàn)f的文本數(shù),分母為歸一化因子。
上述對計算出來的文本向量的權(quán)重進(jìn)行排序時,首先設(shè)定一個閾值, 將權(quán)重大于該閾值的文本向量挑選出來構(gòu)成一個集合,然后再根據(jù)所在網(wǎng) 頁中的上下文信息,從所述集合中提取出需要的廣告主信息和廣告描述信 息。
另外,在步驟101中, 一般是先準(zhǔn)備一個廣告監(jiān)控程序spider來監(jiān)控 各個網(wǎng)站的廣告投放情況,并且把這些數(shù)據(jù)作為快照(原始網(wǎng)頁內(nèi)容)保 存起來。本發(fā)明所用的spider是發(fā)明人自主研發(fā)的,主要用來監(jiān)控一百多 個媒體,二千多個頻道,幾萬個網(wǎng)頁的變化情況。然后利用廣告主信息提 取技術(shù),來提取出廣告信息,包括廣告主信息和廣告描述信息。然后把廣 告主信息和廣告描述進(jìn)行分詞,并建立索引,這樣方便通過關(guān)鍵詞來查找。 所謂分詞是指針對現(xiàn)代漢語字序列文本(普通),分解為詞序列的文本,
如我們的祖國多美好,經(jīng)過分詞之后變?yōu)槲覀兊淖鎳嗝篮谩H?后再把每個建立索引的關(guān)鍵詞的相關(guān)性計算出來,這樣就得到了一個"關(guān)
鍵詞-廣告集合"的倒排表(如圖2所示,圖2為依照本發(fā)明實施例建立關(guān)
鍵詞索引的示意圖)。廣告集合是已經(jīng)按照相關(guān)性排好序的,這樣在檢索 的時候就能快速的返回結(jié)果了。
上述步驟102中所述對網(wǎng)頁快照庫中保存的廣告數(shù)據(jù)中的文字信息進(jìn)
行分詞的步驟中,所述分詞包括將現(xiàn)代漢語的普通字序列文本分解為詞
序列的文本。
上述步驟103中所述計算關(guān)鍵詞的相關(guān)性的步驟中采用公式P-alxm 十a(chǎn)2xc + a3xh來計算關(guān)鍵詞的相關(guān)性,其中al、 a2和a3是常量系數(shù),且 al+a2+a3 = 1,在實際運算時al、 a2和a3所占的權(quán)重可調(diào),m為每個廣 告的投放的網(wǎng)站/頻道信息、c為廣告內(nèi)容描述信息、h為廣告主信息,具 體計算過程包括根據(jù)實際情況確定al、 a2和a3的值,然后分別計算m、 c和h的值,將al、 a2、 a3、 m、 c禾口 h的值帶入公式P = alxm + a2xc + a3xh 計算得到關(guān)鍵詞的相關(guān)性。
上述計算每個廣告的投放的網(wǎng)站/頻道信息m的值的過程包括假設(shè)
Tr(k)=力 >(") , Tr(k)代表第k篇命中廣告的Traffic Rank,是由n個投放
的Traffic Rank之和組成,Traffic Rank為每百萬人訪問量,則代表第k篇
命中廣告歸一后的pagemnk值的MW = ^ m p "、。
max(Pr(l), Pr(2),,, Pr(n))
上述計算廣告內(nèi)容描述信息C的值采用下面的空間向量模型進(jìn)行
<formula>formula see original document page 11</formula>
中的權(quán)重,為詞^在文本^中的詞頻,為訓(xùn)練文本的總數(shù),
為訓(xùn)練文本集中出現(xiàn)/的文本數(shù),分母為歸一化因子。
上述計算廣告主信息h的值與計算廣告內(nèi)容描述信息c的值采用相同 的空間向量模,這里就不再贅述。
基于圖l所示的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法流程圖,以下結(jié)合具體的 實施例對本發(fā)明提供的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法進(jìn)一步詳細(xì)說明。 實施例
在本實施例中,以用戶輸入"汽車"這個關(guān)鍵詞為例,詳細(xì)描述對搜 索到的有關(guān)汽車的網(wǎng)絡(luò)廣告進(jìn)行排序的整個過程。
如圖3所示,圖3為依照本發(fā)明實施例對網(wǎng)絡(luò)廣告進(jìn)行排序的示意圖,
該方法包括以下步驟
步驟301:采用廣告監(jiān)控程序spider監(jiān)控各個網(wǎng)站的廣告投放情況, 定期從搜狐汽車、新浪汽車等網(wǎng)站上抓取廣告數(shù)據(jù)信息,并將原始網(wǎng)頁內(nèi) 容作為網(wǎng)頁快照保存到網(wǎng)頁快照庫中。
步驟302:從獲取的廣告數(shù)據(jù)中提取出廣告主信息和廣告描述信息, 并格式化獲取的廣告數(shù)據(jù)信息;
在本步驟中,格式化后的廣告數(shù)據(jù)信息為
i 、廣告內(nèi)容(圖片/flash/文字)
廣告主 一汽大眾 廣告名稱速騰汽車
廣告目t示URL: http:〃www.sagitar.com.cn/olympic/
投放媒體新浪汽車頻道,愛卡汽車網(wǎng)資訊頻道,......
ii、廣告內(nèi)容(圖片/flash/文字)
廣告主上海通用汽車有限公司 廣告名稱別克林蔭大道汽車
廣告目禾示URL: http:〃topic.xcar.com.cn/buickhistory/
投放媒體搜狐汽車頻道,
步驟303:建立關(guān)鍵詞到廣告的倒排索引
在本步驟中,建立的倒排索引如圖4所示,圖4為依照本發(fā)明實施例 建立的倒排索引的示意圖。
步驟304:對倒排索引表中的每個關(guān)鍵詞進(jìn)行相關(guān)性計算,具體包括:
首先確定使用公式P = alxm + a2xc + a3xh計算關(guān)鍵詞的相關(guān)性,其 中al、 a2和a3是常量系數(shù),且al+a2+a3:l,在實際運算時al、 a2和a3 所占的權(quán)重可調(diào),m為每個廣告的投放的網(wǎng)站/頻道信息、c為廣告內(nèi)容描 述信息、h為廣告主信息;
然后確定常量系數(shù)al、 a2和a3的取值,al=0.4, a2 = 0.2, a3 = 0.4 (當(dāng)然在實際取值的過程中,可以根據(jù)排序結(jié)果適當(dāng)進(jìn)行調(diào)整);
然后計算m的值首先從中國互聯(lián)網(wǎng)協(xié)會提供的數(shù)據(jù)中査找頻道的
Traffic Rank值,得到Tr (sina) =148664, Tr (sohu) =100175, Tr (xcar) =841,計算得到Tr (Al) =148664+841 = 149505, Tr (A2) =100175,
進(jìn)而計算得到
m (Al) =149505/ (149505+100175) =0.5988; m (A2) =100175/ (149505+100175) =0.4012;
然后計算 C 的值采用空間向量模型 C(U)= , (l + l0g2//(U))—xlog2(iV/"t) 進(jìn)行計算,其中,c(")為詞f在
文本S中的權(quán)重,f/(f,》為詞f在文本^中的詞頻,TV為訓(xùn)練文本的 總數(shù),n,為訓(xùn)練文本集中出現(xiàn)f的文本數(shù),分母為歸一化因子;由上述空 間向量模型得到c (Al) 二0.5233 ; c (A2) =0.5732;...... 然后計算 h 的值采用空間向量模型 C(^= ,(l + log2仰^—))"og2(W/",) 進(jìn)行計算,其中,c(^)為詞f在 a/2L [(1 + log2 力)x l。g2 (W/)]2
文本S中的權(quán)重,r/GJ)為詞?在文本S中的詞頻,W為訓(xùn)練文本的 總數(shù),",為訓(xùn)練文本集中出現(xiàn)^的文本數(shù),分母為歸一化因子;由上述空
間向量模型得到h (Al) =0.4817 ; h (A2) =0.5112;......
最后采用公式P = alxm + a2xc + a3xh綜合計算關(guān)鍵詞的相關(guān)性 P (Al) =0.4x0.5988+0.2x0.5233+0.4x0.4817 = 0.5369; P (A2) =0.4x0.4012+0.2x0.5732+0,4x0.5112 = 0.4796;
步驟305:根據(jù)計算出的結(jié)果,對計算出的相關(guān)性從高到低進(jìn)行排序, 排序結(jié)果如下
P (Al) >P (A2) >......
即最后利用"汽車"這個關(guān)鍵詞,得到的廣告排序如圖5所示,圖5為 依照本發(fā)明實施例對網(wǎng)絡(luò)廣告進(jìn)行排序的結(jié)果示意圖,這是選取了頭兩條 的結(jié)果。
以上所述的具體實施例,對本發(fā)明的目的、技術(shù)方案和有益效果進(jìn)行 了進(jìn)一步詳細(xì)說明,所應(yīng)理解的是,以上所述僅為本發(fā)明的具體實施例而 已,并不用于限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修 改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1、一種對網(wǎng)絡(luò)廣告進(jìn)行排序的方法,其特征在于,該方法包括利用廣告監(jiān)控程序從網(wǎng)站獲取廣告數(shù)據(jù),從獲取的廣告數(shù)據(jù)中提取出廣告主信息和廣告描述信息;分別對廣告主信息和廣告描述信息進(jìn)行分詞得到的關(guān)鍵詞,建立該關(guān)鍵詞的索引;計算每個建立索引的關(guān)鍵詞的相關(guān)性,按照計算的相關(guān)性從高到低對網(wǎng)絡(luò)廣告進(jìn)行排序。
6、 根據(jù)權(quán)利要求3所述的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法,其特征在于,所述空間向量模型采用以下公式來表征 昨S) = 一)xlog(iV/",+0.01) , D^)xlog(A^",+0.01)]2其中,為詞Z在文本S中的權(quán)重,而《a,》為詞/在文本 S中的詞頻,W為訓(xùn)練文本的總數(shù),",為訓(xùn)練文本集中出現(xiàn)^的文本數(shù), 分母為歸一化因子。
7、 根據(jù)權(quán)利要求3所述的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法,其特征在于, 所述對計算出來的文本向量的權(quán)重進(jìn)行排序時,首先設(shè)定一個閾值,將權(quán) 重大于該閾值的文本向量挑選出來構(gòu)成一個集合,然后再根據(jù)所在網(wǎng)頁中 的上下文信息,從所述集合中提取出需要的廣告主信息和廣告描述信息。
8、 根據(jù)權(quán)利要求1所述的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法,其特征在于, 所述對網(wǎng)頁快照庫中保存的廣告數(shù)據(jù)中的文字信息進(jìn)行分詞的步驟中,所 述分詞包括將現(xiàn)代漢語的普通字序列文本分解為詞序列的文本。
9、 根據(jù)權(quán)利要求1所述的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法,其特征在于, 所述計算關(guān)鍵詞的相關(guān)性的步驟中采用公式P = alxm + a2xc + a3xh來計 算關(guān)鍵詞的相關(guān)性,其中al、 a2和a3是常量系數(shù),且al+a2+a3-l,在 實際運算時al、 a2和a3所占的權(quán)重可調(diào),m為每個廣告的投放的網(wǎng)站/ 頻道信息、c為廣告內(nèi)容描述信息、h為廣告主信息,具體計算過程包括根據(jù)實際情況確定al、 a2和a3的值,然后分別計算m、 c禾B h的值, 將al、 a2、 a3、 m、 c和h的值帶入公式P = alxm + a2xc + a3xh計算得到 關(guān)鍵詞的相關(guān)性。
10、 根據(jù)權(quán)利要求9所述的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法,其特征在于, 所述計算每個廣告的投放的網(wǎng)站/頻道信息m的值的過程包括假設(shè)Tr(k)- ^7>("), Tr(k)代表第k篇命中廣告的Traffic Rank,是由n個投放的Traffic Rank之和組成,Traffic Rank為每百萬人訪問量,則代表第k篇命中廣告歸一后的pagerank值的M(" = ~~一,、 D ,、、。max(Pr(l), Pr(2),, , Pr(n))11、根據(jù)權(quán)利要求9所述的對網(wǎng)絡(luò)廣告進(jìn)行排序的方法,其特征在于, 所述計算廣告內(nèi)容描述信息c的值和計算廣告主信息h的值采用下面的空間向量模型進(jìn)行c(, ^ = (l + log2^("))xl0g2(JV/",), [(1 + log2仰,力)x log2 (WZ"')f其中,C0,S)為詞f在文本S中的權(quán)重,//(/,^)為詞^在文本S 中的詞頻,為訓(xùn)練文本的總數(shù),w,為訓(xùn)練文本集中出現(xiàn)/的文本數(shù),分 母為歸一化因子。
全文摘要
本發(fā)明涉及互聯(lián)網(wǎng)中文智能處理技術(shù)領(lǐng)域,公開了一種對網(wǎng)絡(luò)廣告進(jìn)行排序的方法,該方法包括利用廣告監(jiān)控程序從網(wǎng)站獲取廣告數(shù)據(jù),從獲取的廣告數(shù)據(jù)中提取出廣告主信息和廣告描述信息;分別對廣告主信息和廣告描述信息進(jìn)行分詞得到的關(guān)鍵詞,建立該關(guān)鍵詞的索引;計算每個建立索引的關(guān)鍵詞的相關(guān)性,按照計算的相關(guān)性從高到低對網(wǎng)絡(luò)廣告進(jìn)行排序。利用本發(fā)明,實現(xiàn)了對網(wǎng)絡(luò)廣告的排序,能夠迅速確定一個關(guān)鍵詞對應(yīng)的眾多廣告的相關(guān)性排序,從而能夠方便廣告設(shè)計人員用最短的時間找到適合自己的廣告資料。同時廣告主也可以利用這個系統(tǒng)來查看競爭對手的廣告投放情況,對設(shè)計自己的廣告投放方案提供支持。
文檔編號G06F17/30GK101097580SQ20071011760
公開日2008年1月2日 申請日期2007年6月20日 優(yōu)先權(quán)日2007年6月20日
發(fā)明者峰 鄭 申請人:精實萬維軟件(北京)有限公司