一種自動(dòng)構(gòu)建投放關(guān)鍵詞關(guān)聯(lián)結(jié)構(gòu)的方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于計(jì)算機(jī)網(wǎng)絡(luò)搜索技術(shù)領(lǐng)域,尤其涉及一種自動(dòng)構(gòu)建關(guān)鍵詞關(guān)聯(lián)結(jié)構(gòu)的方法及裝置。
【背景技術(shù)】
[0002]隨著網(wǎng)絡(luò)的日益普及,搜索引擎利用網(wǎng)民對(duì)搜索引擎的依賴和使用習(xí)慣,在網(wǎng)民檢索信息的時(shí)候盡可能將相關(guān)信息傳遞給目標(biāo)人群。通常的做法是,網(wǎng)站通過(guò)在搜索引擎系統(tǒng)投放一些特定關(guān)鍵詞時(shí),當(dāng)網(wǎng)民通過(guò)搜索引擎搜索相關(guān)業(yè)務(wù)時(shí),一旦網(wǎng)民輸入的搜索詞與所投放的特定關(guān)鍵詞匹配,則在搜索結(jié)果網(wǎng)頁(yè)中顯示與該投放關(guān)鍵詞相對(duì)應(yīng)的推送信息。
[0003]在現(xiàn)有的搜索引擎系統(tǒng)中,在投放關(guān)鍵詞之前,需要先配置好要投放關(guān)鍵詞對(duì)應(yīng)的關(guān)聯(lián)結(jié)構(gòu),關(guān)聯(lián)結(jié)構(gòu)包括關(guān)聯(lián)計(jì)劃和關(guān)聯(lián)單元。其中關(guān)聯(lián)計(jì)劃是關(guān)聯(lián)結(jié)構(gòu)中最高的層級(jí)設(shè)置,對(duì)應(yīng)于網(wǎng)站的推送項(xiàng)目;關(guān)聯(lián)單元是關(guān)聯(lián)計(jì)劃下的層級(jí),對(duì)應(yīng)于推送項(xiàng)目中的具體業(yè)務(wù);關(guān)鍵詞是位于關(guān)聯(lián)單元層級(jí)下的;為了更加方便管理關(guān)聯(lián)結(jié)構(gòu)中的關(guān)鍵詞,通常會(huì)把將相關(guān)品類的關(guān)聯(lián)單元?jiǎng)澐种镣粋€(gè)關(guān)聯(lián)計(jì)劃中;相關(guān)品類的關(guān)鍵詞劃分至同一個(gè)關(guān)聯(lián)單元,關(guān)聯(lián)計(jì)劃和關(guān)聯(lián)單元名稱與關(guān)鍵詞品類屬性相關(guān)。
[0004]目前的做法是在投放一批關(guān)鍵詞時(shí),會(huì)根據(jù)人為觀察每個(gè)關(guān)鍵詞詞義,依據(jù)自己的經(jīng)驗(yàn)建立相關(guān)的關(guān)聯(lián)計(jì)劃和關(guān)聯(lián)單元,然后將相同品類的關(guān)鍵詞劃分至相關(guān)的關(guān)聯(lián)單
J L.ο
[0005]按現(xiàn)有人為根據(jù)關(guān)鍵詞詞義劃分關(guān)鍵詞所屬關(guān)聯(lián)結(jié)構(gòu)的方式,當(dāng)投放的關(guān)鍵詞數(shù)量較少時(shí),缺點(diǎn)還不明顯,但是,隨著投放關(guān)鍵詞數(shù)量越來(lái)越多,會(huì)有以下缺點(diǎn):
[0006]1、人為根據(jù)關(guān)鍵詞詞義劃分關(guān)鍵詞所屬關(guān)聯(lián)結(jié)構(gòu),當(dāng)多人維護(hù)同一個(gè)關(guān)聯(lián)結(jié)構(gòu)時(shí),因?yàn)槊總€(gè)人劃分標(biāo)準(zhǔn)經(jīng)驗(yàn)不一樣,可能會(huì)造成關(guān)聯(lián)結(jié)構(gòu)混亂,為后續(xù)管理監(jiān)控關(guān)聯(lián)結(jié)構(gòu)數(shù)據(jù)帶來(lái)不便;
[0007]2、當(dāng)關(guān)鍵詞數(shù)量較多時(shí),如果還是采用上述人為劃分關(guān)鍵詞關(guān)聯(lián)結(jié)構(gòu)的方式,必然會(huì)降低投放效率。
【發(fā)明內(nèi)容】
[0008]有鑒于此,本發(fā)明提供一種自動(dòng)構(gòu)建投放關(guān)鍵詞關(guān)聯(lián)結(jié)構(gòu)的方法及裝置,通過(guò)歸納好不同品類在不同業(yè)務(wù)層級(jí)下的種子詞,然后將投放關(guān)鍵詞與種子詞進(jìn)行匹配,以確定投放關(guān)鍵詞所涉及的具體品類和業(yè)務(wù)層級(jí),用于自動(dòng)生成投放關(guān)鍵詞關(guān)聯(lián)結(jié)構(gòu),省去人工參與,提高投放效率。
[0009]根據(jù)本發(fā)明一方面,其提供了一種自動(dòng)構(gòu)建投放關(guān)鍵詞關(guān)聯(lián)結(jié)構(gòu)的方法,包括:
[0010]劃分種子詞相關(guān)的行業(yè)品類以及行業(yè)品類下的業(yè)務(wù)類型;其中,所述行業(yè)品類包括種子詞所屬的行業(yè)分類,業(yè)務(wù)類型包括每個(gè)行業(yè)品類下的業(yè)務(wù)分類;
[0011]根據(jù)所劃分的行業(yè)品類和業(yè)務(wù)類型,構(gòu)建所有業(yè)務(wù)類型下的種子詞,構(gòu)成種子詞庫(kù);所述種子詞庫(kù)每個(gè)種子詞關(guān)聯(lián)存儲(chǔ)有對(duì)應(yīng)的行業(yè)品類和業(yè)務(wù)類型;
[0012]將投放關(guān)鍵詞與所述種子庫(kù)中的種子詞進(jìn)行匹配,根據(jù)匹配結(jié)果確定投放關(guān)鍵詞所屬的行業(yè)品類和業(yè)務(wù)類型,其中所述投放關(guān)鍵詞所屬的行業(yè)品類和業(yè)務(wù)類型為與其匹配的種子詞所關(guān)聯(lián)存儲(chǔ)的行業(yè)品類和業(yè)務(wù)類型;
[0013]根據(jù)匹配得到的投放關(guān)鍵詞所屬行業(yè)品類和業(yè)務(wù)類型,生成投放關(guān)鍵詞的關(guān)聯(lián)結(jié)構(gòu),所述關(guān)聯(lián)結(jié)構(gòu)包括關(guān)聯(lián)計(jì)劃及關(guān)聯(lián)單元,所述關(guān)聯(lián)計(jì)劃為所述投放關(guān)鍵詞所屬行業(yè)品類,所述關(guān)聯(lián)單元為所述投放關(guān)鍵詞所屬的業(yè)務(wù)類型。
[0014]其中,所述劃分種子詞相關(guān)的行業(yè)品類以及行業(yè)品類下的業(yè)務(wù)類型具體包括:
[0015]確定含有行業(yè)相關(guān)品類和業(yè)務(wù)類型的相關(guān)網(wǎng)址入口鏈接URL ;
[0016]使用HttpClient技術(shù),下載上述相關(guān)網(wǎng)址入口鏈接URL對(duì)應(yīng)的URL頁(yè)面源碼;
[0017]分析所下載的URL網(wǎng)頁(yè)源碼,并解析出網(wǎng)頁(yè)元素,獲取行業(yè)品類和以及相關(guān)行業(yè)品類下的業(yè)務(wù)類型數(shù)據(jù)。
[0018]其中,所述根據(jù)所劃分的行業(yè)品類和業(yè)務(wù)類型,構(gòu)建所有業(yè)務(wù)類型下的種子詞具體包括:
[0019]依據(jù)劃分好的行業(yè)品類和業(yè)務(wù)類型,確定含有相關(guān)業(yè)務(wù)的種子詞鏈接URL ;
[0020]使用HttpClient技術(shù),下載上述種子詞鏈接URL對(duì)應(yīng)的URL頁(yè)面源碼;
[0021]分析所下載的種子詞鏈接URL對(duì)應(yīng)的URL頁(yè)面源碼,并解析對(duì)應(yīng)的網(wǎng)頁(yè)元素,獲得種子詞;
[0022]將獲得的種子詞與已有種子詞進(jìn)行全匹配比較,如果有匹配的種子詞,則直接過(guò)濾掉,否則保留;
[0023]將最終得到的種子詞關(guān)聯(lián)存儲(chǔ)于對(duì)應(yīng)行業(yè)品類下的業(yè)務(wù)類型下。
[0024]其中,所述將投放關(guān)鍵詞與所述種子庫(kù)中的種子詞進(jìn)行匹配,根據(jù)匹配結(jié)果確定投放關(guān)鍵詞所屬的行業(yè)品類和業(yè)務(wù)類型,具體包括:
[0025]根據(jù)所劃分的行業(yè)品類和業(yè)務(wù)類型,讀取每一個(gè)行業(yè)品類下的業(yè)務(wù)類型中存儲(chǔ)的種子詞,放入緩存;
[0026]依次取出緩存中每個(gè)種子詞,將投放關(guān)鍵詞與種子詞進(jìn)行匹配;
[0027]當(dāng)投放關(guān)鍵詞與某一種子詞匹配時(shí),確定該種子詞所對(duì)應(yīng)的行業(yè)品類和業(yè)務(wù)類型為所述投放關(guān)鍵詞對(duì)應(yīng)的行業(yè)品類和業(yè)務(wù)類型。
[0028]其中,劃分好行業(yè)品類和業(yè)務(wù)類型后,建立對(duì)應(yīng)的文件夾,所述業(yè)務(wù)類型對(duì)應(yīng)的文件夾放入其所屬的行業(yè)品類對(duì)應(yīng)的文件夾下。
[0029]根據(jù)本發(fā)明另一方面,其提供了一種自動(dòng)構(gòu)建投放關(guān)鍵詞關(guān)聯(lián)結(jié)構(gòu)的裝置,包括:
[0030]行業(yè)和業(yè)務(wù)劃分模塊,用于劃分種子詞相關(guān)的行業(yè)品類以及行業(yè)品類下的業(yè)務(wù)類型;其中,所述行業(yè)品類包括種子詞所屬的行業(yè)分類,業(yè)務(wù)類型包括每個(gè)行業(yè)品類下的業(yè)務(wù)分類;
[0031]種子詞庫(kù)構(gòu)建模塊,用于根據(jù)所劃分的行業(yè)品類和業(yè)務(wù)類型,構(gòu)建所有業(yè)務(wù)類型下的種子詞,構(gòu)成種子詞庫(kù);所述種子詞庫(kù)每個(gè)種子詞關(guān)聯(lián)存儲(chǔ)有對(duì)應(yīng)的行業(yè)品類和業(yè)務(wù)類型;
[0032]匹配模塊,用于將投放關(guān)鍵詞與所述種子庫(kù)中的種子詞進(jìn)行匹配,根據(jù)匹配結(jié)果確定投放關(guān)鍵詞所屬的行業(yè)品類和業(yè)務(wù)類型,其中所述投放關(guān)鍵詞所屬的行業(yè)品類和業(yè)務(wù)類型為與其匹配的種子詞所關(guān)聯(lián)存儲(chǔ)的行業(yè)品類和業(yè)務(wù)類型;
[0033]投放關(guān)鍵詞關(guān)聯(lián)結(jié)構(gòu)建立模塊,用于根據(jù)匹配得到的投放關(guān)鍵詞所屬行業(yè)品類和業(yè)務(wù)類型,生成投放關(guān)鍵詞的關(guān)聯(lián)結(jié)構(gòu),所述關(guān)聯(lián)結(jié)構(gòu)包括關(guān)聯(lián)計(jì)劃及關(guān)聯(lián)單元,所述關(guān)聯(lián)計(jì)劃為所述投放關(guān)鍵詞所屬行業(yè)品類,所述關(guān)聯(lián)單元為所述投放關(guān)鍵詞所屬的業(yè)務(wù)類型。
[0034]其中,行業(yè)和業(yè)務(wù)劃分模塊包括:
[0035]行業(yè)和業(yè)務(wù)網(wǎng)頁(yè)確定模塊,用于確定含有行業(yè)相關(guān)品類和業(yè)務(wù)類型的相關(guān)網(wǎng)址入口鏈接URL ;
[0036]第一下載模塊,使用HttpCl ient技術(shù),下載上述相關(guān)網(wǎng)址入口鏈接URL對(duì)應(yīng)的URL頁(yè)面源碼;
[0037]行業(yè)和業(yè)務(wù)分析模塊,分析所下載的URL網(wǎng)頁(yè)源碼,并解析出網(wǎng)頁(yè)元素,獲取行業(yè)品類和以及相關(guān)行業(yè)品類下的業(yè)務(wù)類型數(shù)據(jù)。
[0038]其中,所述種子詞庫(kù)構(gòu)建模塊包括:
[0039]種子詞網(wǎng)頁(yè)確定模塊,用于依據(jù)劃分好的行業(yè)品類和業(yè)務(wù)類型,確定含有相關(guān)業(yè)務(wù)的種子詞鏈接URL ;
[0040]第二下載模塊,使用HttpClient技術(shù),下載上述種子詞鏈接URL對(duì)應(yīng)的URL頁(yè)面源碼;
[0041 ] 種子詞分析模塊,分析所下載的種子詞鏈接URL對(duì)應(yīng)的URL頁(yè)面源碼,并解析對(duì)應(yīng)的網(wǎng)頁(yè)元素,獲得種子詞;
[0042]種子詞篩選模塊,將獲得的種子詞與已有種子詞進(jìn)行全匹配比較,如果有匹配的種子詞,則直接過(guò)濾掉,否則保留;
[0043]種子詞存儲(chǔ)模塊,將最終得到的種子詞關(guān)聯(lián)存儲(chǔ)于對(duì)應(yīng)行業(yè)品類下的業(yè)務(wù)類型下。
[0044]其中,所述匹配模塊包括:
[0045]種子詞存儲(chǔ)模塊,根據(jù)所劃分的行業(yè)品類和業(yè)務(wù)類型,讀取每一個(gè)行業(yè)品類下的業(yè)務(wù)類型中存儲(chǔ)的種子詞,放入緩存;
[0046]投放關(guān)鍵詞匹配模塊,依次取出緩存中每個(gè)種子詞,將投放關(guān)鍵詞與種子詞進(jìn)行匹配;
[0047]投放關(guān)鍵詞行業(yè)和業(yè)務(wù)確定模塊,用于當(dāng)投放關(guān)鍵詞與某一種子詞匹配時(shí),確定該種子詞所對(duì)應(yīng)的行業(yè)品類和業(yè)務(wù)類型為所述投放關(guān)鍵詞對(duì)應(yīng)的行業(yè)品類和業(yè)務(wù)類型。
[0048]根據(jù)本發(fā)明提出的上述方案,可以按照上述步驟,統(tǒng)一對(duì)投放的關(guān)鍵詞自動(dòng)進(jìn)行構(gòu)建關(guān)鍵詞關(guān)聯(lián)結(jié)構(gòu),避免因?yàn)槎嗳司S護(hù)同一個(gè)關(guān)聯(lián)結(jié)構(gòu),造成關(guān)聯(lián)結(jié)構(gòu)層級(jí)結(jié)構(gòu)混亂;避免人工劃分關(guān)鍵詞關(guān)聯(lián)結(jié)構(gòu),提高投放關(guān)鍵詞投放效率。
【附圖說(shuō)明】
[0049]圖1是本發(fā)明中自動(dòng)構(gòu)建投放關(guān)鍵詞關(guān)聯(lián)結(jié)構(gòu)的方法流程圖;
[0050]圖2是本發(fā)明實(shí)施例中平板電視的品類和業(yè)務(wù)種子詞劃分示例圖;
[0051]圖3是本發(fā)明中自動(dòng)構(gòu)建投放關(guān)鍵詞關(guān)聯(lián)結(jié)構(gòu)的裝置框架圖。
【具體實(shí)施方式】
[0052]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白,以下結(jié)合具體實(shí)施例,并參照附圖,對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說(shuō)明。
[0053]如圖1所示,本發(fā)明提出了一種自動(dòng)構(gòu)