網(wǎng)頁相關(guān)性檢測方法及裝置制造方法
【專利摘要】本發(fā)明公開了一種網(wǎng)頁相關(guān)性檢測方法及裝置。該網(wǎng)頁相關(guān)性檢測方法包括:獲取多個目標(biāo)網(wǎng)頁鏈接,其中,多個目標(biāo)網(wǎng)頁鏈接分別位于多個外部網(wǎng)頁上;分別獲取多個外部網(wǎng)頁的頁面內(nèi)容;分別判斷多個外部網(wǎng)頁的頁面內(nèi)容中是否包括預(yù)設(shè)目標(biāo)關(guān)鍵詞;根據(jù)判斷結(jié)果分別統(tǒng)計預(yù)設(shè)目標(biāo)關(guān)鍵詞在多個外部網(wǎng)頁中出現(xiàn)的次數(shù);根據(jù)預(yù)設(shè)目標(biāo)關(guān)鍵詞在多個外部網(wǎng)頁中出現(xiàn)的次數(shù)分別計算多個外部網(wǎng)頁和目標(biāo)網(wǎng)頁的相關(guān)性。通過本發(fā)明,解決了網(wǎng)頁相關(guān)性檢測執(zhí)行效率低的問題,進而通過自動獲取多個外部網(wǎng)頁的頁面內(nèi)容并自動統(tǒng)計預(yù)設(shè)目標(biāo)關(guān)鍵詞在多個外部網(wǎng)頁中出現(xiàn)的次數(shù),達到了提高網(wǎng)頁相關(guān)性檢測執(zhí)行效率的效果。
【專利說明】網(wǎng)頁相關(guān)性檢測方法及裝置
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及互聯(lián)網(wǎng)領(lǐng)域,具體而言,涉及一種網(wǎng)頁相關(guān)性檢測方法及裝置。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)絡(luò)搜索已經(jīng)成了人們獲取信息的主要途徑之一。在搜索引 擎中如果想要網(wǎng)站信息容易被搜索到,需要排在搜索結(jié)果頁中較為靠前的位置。因此,網(wǎng)站 在搜索引擎搜索結(jié)果頁中排名靠前非常重要?,F(xiàn)有技術(shù)中主流的搜索引擎排序算法均涉及 到很多因素,除了受到網(wǎng)站文本內(nèi)容的影響之外,一個網(wǎng)站的外部鏈接數(shù)量的多少與質(zhì)量 的好壞也占有相當(dāng)大的比重。網(wǎng)站的外部鏈接,即指其他網(wǎng)站上有鏈向自己網(wǎng)站的鏈接。 高質(zhì)量的外部鏈接能夠有效的提高網(wǎng)站自身的權(quán)重值,從而影響該網(wǎng)站在搜索引擎中的排 名。低質(zhì)量的外部鏈接不僅不會提高網(wǎng)站自身的權(quán)重值,反而會降低網(wǎng)站在搜索引擎中的 排名。因此,需要一套合理有效的方式評判一個網(wǎng)站外部鏈接的質(zhì)量,來幫助網(wǎng)站進行有效 的部署和篩選網(wǎng)站的外部鏈接,為網(wǎng)站增加高質(zhì)量外部鏈接、減少低質(zhì)量外部鏈接、拒絕垃 圾外部鏈接提供可靠的數(shù)據(jù)依據(jù)。
[0003] -般情況下,網(wǎng)站的外部鏈接分布在各類不同內(nèi)容的網(wǎng)站上,搜索引擎會根據(jù)這 些網(wǎng)站的權(quán)重和與被鏈接網(wǎng)站的相關(guān)性,來評判被鏈接網(wǎng)站的外部環(huán)境。在這里,外部鏈接 質(zhì)量用于衡量外部鏈接網(wǎng)站的權(quán)重和內(nèi)容相關(guān)性,該值越大的網(wǎng)頁說明外部鏈接網(wǎng)站對自 身網(wǎng)站帶來的正面影響就越高。因此評價一個外部鏈接的質(zhì)量,從兩個方面考核,即該外部 鏈接網(wǎng)站的權(quán)重和與被鏈接網(wǎng)站的內(nèi)容相關(guān)性。
[0004] 現(xiàn)有的解決方案采用搜索引擎提供的外部鏈接數(shù)據(jù)接口,由第三方網(wǎng)站或者搜索 引擎自身的站長工具獲取網(wǎng)站所有的外部鏈接數(shù)據(jù)。然后通過人工查看外部鏈接發(fā)布的網(wǎng) 站,和外部鏈接發(fā)布的內(nèi)容,逐一排查外部鏈接網(wǎng)站的網(wǎng)站權(quán)重、頁面質(zhì)量、內(nèi)容相關(guān)性等 等。這種方法,尤其是在進行網(wǎng)頁內(nèi)容相關(guān)性檢測時,需要花費大量的人工時間來進行查看 與判斷,效率很低;并且存在一定的主觀性,準(zhǔn)確率也比較低;同時,人工排查網(wǎng)站外部鏈 接的分布情況,并不能使網(wǎng)站對外部鏈接情況有一個直觀清晰的認(rèn)識,難以根據(jù)現(xiàn)有的外 部鏈接數(shù)據(jù)去指導(dǎo)網(wǎng)站下一步的鏈接建設(shè)。
[0005] 針對相關(guān)技術(shù)中網(wǎng)頁相關(guān)性檢測執(zhí)行效率低的問題,目前尚未提出有效的解決方 案。
【發(fā)明內(nèi)容】
[0006] 針對現(xiàn)有的網(wǎng)頁相關(guān)性檢測執(zhí)行效率低的問題而提出本發(fā)明,為此,本發(fā)明的主 要目的在于提供一種網(wǎng)頁相關(guān)性檢測方法及裝置,以解決上述問題。
[0007] 為了實現(xiàn)上述目的,根據(jù)本發(fā)明的一個方面,提供了一種網(wǎng)頁相關(guān)性檢測方法。該 方法包括:獲取多個目標(biāo)網(wǎng)頁鏈接,其中,多個目標(biāo)網(wǎng)頁鏈接分別位于多個外部網(wǎng)頁上,多 個目標(biāo)網(wǎng)頁鏈接用于從多個外部網(wǎng)頁鏈接至目標(biāo)網(wǎng)頁;分別獲取多個外部網(wǎng)頁的頁面內(nèi) 容;將多個外部網(wǎng)頁的頁面內(nèi)容與預(yù)設(shè)目標(biāo)關(guān)鍵詞進行對比,分別判斷多個外部網(wǎng)頁的頁 面內(nèi)容中是否包括預(yù)設(shè)目標(biāo)關(guān)鍵詞,得到判斷結(jié)果;根據(jù)判斷結(jié)果分別統(tǒng)計預(yù)設(shè)目標(biāo)關(guān)鍵 詞在多個外部網(wǎng)頁中出現(xiàn)的次數(shù);根據(jù)預(yù)設(shè)目標(biāo)關(guān)鍵詞在多個外部網(wǎng)頁中出現(xiàn)的次數(shù)分別 計算多個外部網(wǎng)頁和目標(biāo)網(wǎng)頁的相關(guān)性。
[0008] 進一步地,根據(jù)預(yù)設(shè)目標(biāo)關(guān)鍵詞在多個外部網(wǎng)頁中出現(xiàn)的次數(shù)分別計算多個外部 網(wǎng)頁和目標(biāo)網(wǎng)頁的相關(guān)性之前,該方法還包括:分別統(tǒng)計多個外部網(wǎng)頁包含的關(guān)鍵詞的個 數(shù),按照以下公式計算多個外部網(wǎng)頁中每個外部網(wǎng)頁和目標(biāo)網(wǎng)頁的相關(guān)性:Re = C1/C2,其 中,Re為多個外部網(wǎng)頁中每個外部網(wǎng)頁和目標(biāo)網(wǎng)頁的相關(guān)性,Cl為預(yù)設(shè)目標(biāo)關(guān)鍵詞在多個 外部網(wǎng)頁中每個外部網(wǎng)頁中出現(xiàn)的次數(shù),C2為多個外部網(wǎng)頁中每個外部網(wǎng)頁包含的關(guān)鍵詞 的個數(shù)。
[0009] 進一步地,多個外部網(wǎng)頁位于外部網(wǎng)站上,根據(jù)預(yù)設(shè)目標(biāo)關(guān)鍵詞在多個外部網(wǎng)頁 中出現(xiàn)的次數(shù)分別計算多個外部網(wǎng)頁和目標(biāo)網(wǎng)頁的相關(guān)性之后,該方法還包括:獲取外部 網(wǎng)站的權(quán)重;分別獲取多個外部網(wǎng)頁的權(quán)重系數(shù);根據(jù)外部網(wǎng)站的權(quán)重、多個外部網(wǎng)頁的 權(quán)重系數(shù)和相關(guān)性,檢測目標(biāo)網(wǎng)頁的鏈接的質(zhì)量。
[0010] 進一步地,分別獲取多個外部網(wǎng)頁的權(quán)重系數(shù)包括:分別確定多個外部網(wǎng)頁所在 的目錄層級;根據(jù)目錄層級分別計算多個外部網(wǎng)頁的權(quán)重系數(shù)。
[0011] 進一步地,獲取多個目標(biāo)網(wǎng)頁鏈接之后,該方法還包括:根據(jù)多個目標(biāo)網(wǎng)頁鏈接, 確定外部網(wǎng)站的域名;判斷外部網(wǎng)站的域名是否滿足預(yù)設(shè)條件;如果外部網(wǎng)站的域名不滿 足預(yù)設(shè)條件,則確定目標(biāo)網(wǎng)頁的鏈接的質(zhì)量為預(yù)設(shè)質(zhì)量,獲取外部網(wǎng)站的權(quán)重包括:如果外 部網(wǎng)站的域名滿足預(yù)設(shè)條件,則獲取外部網(wǎng)站的權(quán)重。
[0012] 進一步地,根據(jù)多個目標(biāo)網(wǎng)頁鏈接,確定外部網(wǎng)站的域名之前,該方法還包括:創(chuàng) 建預(yù)設(shè)域名數(shù)據(jù)庫,其中,預(yù)設(shè)域名數(shù)據(jù)庫包含多個預(yù)設(shè)域名和多個預(yù)設(shè)域名對應(yīng)的網(wǎng)站 的性質(zhì),判斷外部網(wǎng)站的域名是否滿足預(yù)設(shè)條件包括:從預(yù)設(shè)域名數(shù)據(jù)庫中獲取外部網(wǎng)站 的域名對應(yīng)的網(wǎng)站的性質(zhì);以及判斷外部網(wǎng)站的域名對應(yīng)的網(wǎng)站的性質(zhì)是否滿足預(yù)設(shè)條 件。
[0013] 進一步地,根據(jù)外部網(wǎng)站的權(quán)重、多個外部網(wǎng)頁的權(quán)重系數(shù)和相關(guān)性,檢測目標(biāo)網(wǎng) 頁的鏈接的質(zhì)量包括:根據(jù)外部網(wǎng)站的權(quán)重、多個外部網(wǎng)頁的權(quán)重系數(shù)和相關(guān)性,分別檢測 多個目標(biāo)網(wǎng)頁鏈接的質(zhì)量,分別獲取多個目標(biāo)網(wǎng)頁鏈接的質(zhì)量;統(tǒng)計多個目標(biāo)網(wǎng)頁鏈接的 個數(shù);通過多個目標(biāo)網(wǎng)頁鏈接的質(zhì)量和多個目標(biāo)網(wǎng)頁鏈接的個數(shù)獲取目標(biāo)網(wǎng)頁的鏈接的質(zhì) 量。
[0014] 進一步地,根據(jù)外部網(wǎng)站的權(quán)重、多個外部網(wǎng)頁的權(quán)重系數(shù)和相關(guān)性,分別檢測多 個目標(biāo)網(wǎng)頁鏈接的質(zhì)量包括:分別確定外部網(wǎng)站的權(quán)重和相關(guān)性的比例系數(shù),其中,比例 系數(shù)用于表征外部網(wǎng)站的權(quán)重或相關(guān)性在網(wǎng)頁鏈接的質(zhì)量檢測中的重要程度,比例系數(shù)越 大,重要程度越強;按照以下公式分別檢測多個目標(biāo)網(wǎng)頁鏈接的質(zhì)量:R = Ql*Q2*kl+X*k2, 其中,R為表征多個目標(biāo)網(wǎng)頁鏈接中每個目標(biāo)網(wǎng)頁鏈接的質(zhì)量的值,R越大,每個目標(biāo)網(wǎng)頁 鏈接的質(zhì)量越好,Ql為外部網(wǎng)站的權(quán)重,Q2為多個外部網(wǎng)頁中每個外部網(wǎng)頁的權(quán)重系數(shù),X 為多個外部網(wǎng)頁中每個外部網(wǎng)頁與目標(biāo)網(wǎng)頁的相關(guān)性,kl為外部網(wǎng)站的權(quán)重的比例系數(shù), k2為相關(guān)性的比例系數(shù)。
[0015] 為了實現(xiàn)上述目的,根據(jù)本發(fā)明的另一方面,提供了一種網(wǎng)頁相關(guān)性檢測裝置,該 裝置包括:第一獲取單元,用于獲取多個目標(biāo)網(wǎng)頁鏈接,其中,多個目標(biāo)網(wǎng)頁鏈接分別位于 多個外部網(wǎng)頁上,多個目標(biāo)網(wǎng)頁鏈接用于從多個外部網(wǎng)頁鏈接至目標(biāo)網(wǎng)頁;第二獲取單元, 用于分別獲取多個外部網(wǎng)頁的頁面內(nèi)容;判斷單元,用于將多個外部網(wǎng)頁的頁面內(nèi)容與預(yù) 設(shè)目標(biāo)關(guān)鍵詞進行對比,分別判斷多個外部網(wǎng)頁的頁面內(nèi)容中是否包括預(yù)設(shè)目標(biāo)關(guān)鍵詞, 得到判斷結(jié)果;統(tǒng)計單元,用于根據(jù)判斷結(jié)果分別統(tǒng)計預(yù)設(shè)目標(biāo)關(guān)鍵詞在多個外部網(wǎng)頁中 出現(xiàn)的次數(shù);計算單元,用于根據(jù)預(yù)設(shè)目標(biāo)關(guān)鍵詞在多個外部網(wǎng)頁中出現(xiàn)的次數(shù)分別計算 多個外部網(wǎng)頁和目標(biāo)網(wǎng)頁的相關(guān)性。
[0016] 進一步地,裝置還包括:第三獲取單元,用于獲取外部網(wǎng)站的權(quán)重;第四獲取單 元,用于分別獲取多個外部網(wǎng)頁的權(quán)重系數(shù);檢測單元,用于根據(jù)外部網(wǎng)站的權(quán)重、多個外 部網(wǎng)頁的權(quán)重系數(shù)和相關(guān)性,檢測目標(biāo)網(wǎng)頁的鏈接的質(zhì)量。
[0017] 通過本發(fā)明,采用包括以下步驟的方法:獲取多個目標(biāo)網(wǎng)頁鏈接,其中,多個目標(biāo) 網(wǎng)頁鏈接分別位于多個外部網(wǎng)頁上,多個目標(biāo)網(wǎng)頁鏈接用于從多個外部網(wǎng)頁鏈接至目標(biāo)網(wǎng) 頁;分別獲取多個外部網(wǎng)頁的頁面內(nèi)容;將多個外部網(wǎng)頁的頁面內(nèi)容與預(yù)設(shè)目標(biāo)關(guān)鍵詞進 行對比,分別判斷多個外部網(wǎng)頁的頁面內(nèi)容中是否包括預(yù)設(shè)目標(biāo)關(guān)鍵詞,得到判斷結(jié)果;根 據(jù)判斷結(jié)果分別統(tǒng)計預(yù)設(shè)目標(biāo)關(guān)鍵詞在多個外部網(wǎng)頁中出現(xiàn)的次數(shù);根據(jù)預(yù)設(shè)目標(biāo)關(guān)鍵詞 在多個外部網(wǎng)頁中出現(xiàn)的次數(shù)分別計算多個外部網(wǎng)頁和目標(biāo)網(wǎng)頁的相關(guān)性,解決了網(wǎng)頁相 關(guān)性檢測執(zhí)行效率低的問題,進而通過自動獲取多個外部網(wǎng)頁的頁面內(nèi)容并自動統(tǒng)計預(yù)設(shè) 目標(biāo)關(guān)鍵詞在多個外部網(wǎng)頁中出現(xiàn)的次數(shù),達到了提高網(wǎng)頁相關(guān)性檢測執(zhí)行效率的效果。
【專利附圖】
【附圖說明】
[0018] 構(gòu)成本申請的一部分的附圖用來提供對本發(fā)明的進一步理解,本發(fā)明的示意性實 施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當(dāng)限定。在附圖中:
[0019] 圖1是根據(jù)本發(fā)明的根據(jù)本發(fā)明的網(wǎng)頁相關(guān)性檢測的第一實施例的流程圖;
[0020] 圖2是根據(jù)本發(fā)明的網(wǎng)頁相關(guān)性檢測的第二實施例的流程圖;
[0021] 圖3是根據(jù)本發(fā)明的網(wǎng)頁相關(guān)性檢測的第三實施例的流程圖;
[0022] 圖4是根據(jù)本發(fā)明的網(wǎng)頁相關(guān)性檢測裝置的第一實施例的示意圖;以及
[0023] 圖5是根據(jù)本發(fā)明的網(wǎng)頁相關(guān)性檢測裝置的第二實施例的示意圖。
【具體實施方式】
[0024] 為了使本【技術(shù)領(lǐng)域】的人員更好地理解本發(fā)明方案,下面將結(jié)合本發(fā)明實施例中的 附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是 本發(fā)明一部分的實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù) 人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都應(yīng)當(dāng)屬于本發(fā)明保護的范 圍。
[0025] 需要說明的是,本發(fā)明的說明書和權(quán)利要求書及上述附圖中的術(shù)語"第一"、"第 二"等是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。此外,術(shù)語"包括" 和"具有"以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單 元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒 有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。
[0026] 在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。下面將 參考附圖并結(jié)合實施例來詳細說明本發(fā)明。
[0027] 圖1是根據(jù)本發(fā)明的網(wǎng)頁相關(guān)性檢測的第一實施例的流程圖。如圖1所示,該方 法包括步驟S102至步驟Sl 10。
[0028] 步驟S102,獲取多個目標(biāo)網(wǎng)頁鏈接,其中,多個目標(biāo)網(wǎng)頁鏈接分別位于多個外部網(wǎng) 頁上,多個目標(biāo)網(wǎng)頁鏈接用于從多個外部網(wǎng)頁鏈接至目標(biāo)網(wǎng)頁。
[0029] 目標(biāo)網(wǎng)頁鏈接可以為一個網(wǎng)站的外部鏈接,網(wǎng)站的外部鏈接往往分布在各類不同 內(nèi)容的多個外部網(wǎng)頁上,這里,多個外部網(wǎng)頁可以位于一個網(wǎng)站,也可以位于不同的網(wǎng)站。 通過外部鏈接可以鏈接到目標(biāo)網(wǎng)頁。目標(biāo)網(wǎng)頁通常是投放該外部鏈接的網(wǎng)站的網(wǎng)頁。外 部網(wǎng)頁是部署了能鏈接到目標(biāo)網(wǎng)頁的鏈接的具體頁面,以網(wǎng)頁的形式存在于外部網(wǎng)站上, 一般具有較大的訪客量,通過部署在外部網(wǎng)頁的外部鏈接,可以起到增加投放網(wǎng)站的訪問 量的效果。根據(jù)訪問情況,投放網(wǎng)站可以優(yōu)化自身網(wǎng)站的外部環(huán)境,提升搜索引擎的認(rèn)可 度。一般來說,可以由第三方網(wǎng)站或者搜索引擎自身的站長工具獲取網(wǎng)站所有的外部鏈接 數(shù)據(jù)。可以將獲取的目標(biāo)網(wǎng)頁鏈接數(shù)據(jù)存儲于數(shù)據(jù)表中,如表1所示。
[0030] 表 1
[0031]
【權(quán)利要求】
1. 一種網(wǎng)頁相關(guān)性檢測方法,其特征在于,包括: 獲取多個目標(biāo)網(wǎng)頁鏈接,其中,所述多個目標(biāo)網(wǎng)頁鏈接分別位于多個外部網(wǎng)頁上,所述 多個目標(biāo)網(wǎng)頁鏈接用于從所述多個外部網(wǎng)頁鏈接至目標(biāo)網(wǎng)頁; 分別獲取所述多個外部網(wǎng)頁的頁面內(nèi)容; 將所述多個外部網(wǎng)頁的頁面內(nèi)容與預(yù)設(shè)目標(biāo)關(guān)鍵詞進行對比,分別判斷所述多個外部 網(wǎng)頁的頁面內(nèi)容中是否包括所述預(yù)設(shè)目標(biāo)關(guān)鍵詞,得到判斷結(jié)果; 根據(jù)所述判斷結(jié)果分別統(tǒng)計所述預(yù)設(shè)目標(biāo)關(guān)鍵詞在所述多個外部網(wǎng)頁中出現(xiàn)的次數(shù); 以及 根據(jù)所述預(yù)設(shè)目標(biāo)關(guān)鍵詞在所述多個外部網(wǎng)頁中出現(xiàn)的次數(shù)分別計算所述多個外部 網(wǎng)頁和所述目標(biāo)網(wǎng)頁的相關(guān)性。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于, 根據(jù)所述預(yù)設(shè)目標(biāo)關(guān)鍵詞在所述多個外部網(wǎng)頁中出現(xiàn)的次數(shù)分別計算所述多個外部 網(wǎng)頁和所述目標(biāo)網(wǎng)頁的相關(guān)性之前,所述方法還包括:分別統(tǒng)計所述多個外部網(wǎng)頁包含的 關(guān)鍵詞的個數(shù), 按照以下公式計算所述多個外部網(wǎng)頁中每個外部網(wǎng)頁和所述目標(biāo)網(wǎng)頁的相關(guān)性: = (VC2,其中,&為所述多個外部網(wǎng)頁中每個外部網(wǎng)頁和所述目標(biāo)網(wǎng)頁的相關(guān)性,Ci 為所述預(yù)設(shè)目標(biāo)關(guān)鍵詞在所述多個外部網(wǎng)頁中每個外部網(wǎng)頁中出現(xiàn)的次數(shù),C2為所述多個 外部網(wǎng)頁中每個外部網(wǎng)頁包含的關(guān)鍵詞的個數(shù)。
3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述多個外部網(wǎng)頁位于外部網(wǎng)站上,根據(jù) 所述預(yù)設(shè)目標(biāo)關(guān)鍵詞在所述多個外部網(wǎng)頁中出現(xiàn)的次數(shù)分別計算所述多個外部網(wǎng)頁和所 述目標(biāo)網(wǎng)頁的相關(guān)性之后,所述方法還包括: 犾取所述外部網(wǎng)站的權(quán)重; 分別獲取所述多個外部網(wǎng)頁的權(quán)重系數(shù);以及 根據(jù)所述外部網(wǎng)站的權(quán)重、所述多個外部網(wǎng)頁的權(quán)重系數(shù)和所述相關(guān)性,檢測所述目 標(biāo)網(wǎng)頁的鏈接的質(zhì)量。
4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,分別獲取所述多個外部網(wǎng)頁的權(quán)重系數(shù) 包括: 分別確定所述多個外部網(wǎng)頁所在的目錄層級;以及 根據(jù)所述目錄層級分別計算所述多個外部網(wǎng)頁的權(quán)重系數(shù)。
5. 根據(jù)權(quán)利要求3所述的方法,其特征在于, 獲取多個目標(biāo)網(wǎng)頁鏈接之后,所述方法還包括: 根據(jù)所述多個目標(biāo)網(wǎng)頁鏈接,確定所述外部網(wǎng)站的域名; 判斷所述外部網(wǎng)站的域名是否滿足預(yù)設(shè)條件;以及 如果所述外部網(wǎng)站的域名不滿足預(yù)設(shè)條件,則確定所述目標(biāo)網(wǎng)頁的鏈接的質(zhì)量為預(yù)設(shè) 質(zhì)量, 獲取所述外部網(wǎng)站的權(quán)重包括:如果所述外部網(wǎng)站的域名滿足預(yù)設(shè)條件,則獲取所述 外部網(wǎng)站的權(quán)重。
6. 根據(jù)權(quán)利要求5所述的方法,其特征在于, 根據(jù)所述多個目標(biāo)網(wǎng)頁鏈接,確定所述外部網(wǎng)站的域名之前,所述方法還包括:創(chuàng)建預(yù) 設(shè)域名數(shù)據(jù)庫,其中,所述預(yù)設(shè)域名數(shù)據(jù)庫包含多個預(yù)設(shè)域名和所述多個預(yù)設(shè)域名對應(yīng)的 網(wǎng)站的性質(zhì), 判斷所述外部網(wǎng)站的域名是否滿足預(yù)設(shè)條件包括:從所述預(yù)設(shè)域名數(shù)據(jù)庫中獲取所述 外部網(wǎng)站的域名對應(yīng)的網(wǎng)站的性質(zhì);以及判斷所述外部網(wǎng)站的域名對應(yīng)的網(wǎng)站的性質(zhì)是否 滿足預(yù)設(shè)條件。
7. 根據(jù)權(quán)利要求3所述的方法,其特征在于,根據(jù)所述外部網(wǎng)站的權(quán)重、所述多個外部 網(wǎng)頁的權(quán)重系數(shù)和所述相關(guān)性,檢測所述目標(biāo)網(wǎng)頁的鏈接的質(zhì)量包括: 根據(jù)所述外部網(wǎng)站的權(quán)重、所述多個外部網(wǎng)頁的權(quán)重系數(shù)和所述相關(guān)性,分別檢測所 述多個目標(biāo)網(wǎng)頁鏈接的質(zhì)量,分別獲取所述多個目標(biāo)網(wǎng)頁鏈接的質(zhì)量; 統(tǒng)計所述多個目標(biāo)網(wǎng)頁鏈接的個數(shù);以及 通過所述多個目標(biāo)網(wǎng)頁鏈接的質(zhì)量和所述多個目標(biāo)網(wǎng)頁鏈接的個數(shù)獲取所述目標(biāo)網(wǎng) 頁的鏈接的質(zhì)量。
8. 根據(jù)權(quán)利要求7所述的方法,其特征在于,根據(jù)所述外部網(wǎng)站的權(quán)重、所述多個外部 網(wǎng)頁的權(quán)重系數(shù)和所述相關(guān)性,分別檢測所述多個目標(biāo)網(wǎng)頁鏈接的質(zhì)量包括: 分別確定所述外部網(wǎng)站的權(quán)重和所述相關(guān)性的比例系數(shù),其中,所述比例系數(shù)用于表 征所述外部網(wǎng)站的權(quán)重或所述相關(guān)性在網(wǎng)頁鏈接的質(zhì)量檢測中的重要程度,所述比例系數(shù) 越大,重要程度越強; 按照以下公式分別檢測所述多個目標(biāo)網(wǎng)頁鏈接的質(zhì)量: R = Q^Qdki+X*!^, 其中,R為表征所述多個目標(biāo)網(wǎng)頁鏈接中每個目標(biāo)網(wǎng)頁鏈接的質(zhì)量的值,R越大,所述 每個目標(biāo)網(wǎng)頁鏈接的質(zhì)量越好,Qi為所述外部網(wǎng)站的權(quán)重,Q2為所述多個外部網(wǎng)頁中每個 外部網(wǎng)頁的權(quán)重系數(shù),X為所述多個外部網(wǎng)頁中每個外部網(wǎng)頁與所述目標(biāo)網(wǎng)頁的相關(guān)性,& 為所述外部網(wǎng)站的權(quán)重的比例系數(shù),k2為所述相關(guān)性的比例系數(shù)。
9. 一種網(wǎng)頁相關(guān)性檢測裝置,其特征在于,包括: 第一獲取單元,用于獲取多個目標(biāo)網(wǎng)頁鏈接,其中,所述多個目標(biāo)網(wǎng)頁鏈接分別位于多 個外部網(wǎng)頁上,所述多個目標(biāo)網(wǎng)頁鏈接用于從所述多個外部網(wǎng)頁鏈接至目標(biāo)網(wǎng)頁; 第二獲取單元,用于分別獲取所述多個外部網(wǎng)頁的頁面內(nèi)容; 判斷單元,用于將所述多個外部網(wǎng)頁的頁面內(nèi)容與預(yù)設(shè)目標(biāo)關(guān)鍵詞進行對比,分別判 斷所述多個外部網(wǎng)頁的頁面內(nèi)容中是否包括所述預(yù)設(shè)目標(biāo)關(guān)鍵詞,得到判斷結(jié)果; 統(tǒng)計單元,用于根據(jù)所述判斷結(jié)果分別統(tǒng)計所述預(yù)設(shè)目標(biāo)關(guān)鍵詞在所述多個外部網(wǎng)頁 中出現(xiàn)的次數(shù);以及 計算單元,用于根據(jù)所述預(yù)設(shè)目標(biāo)關(guān)鍵詞在所述多個外部網(wǎng)頁中出現(xiàn)的次數(shù)分別計算 所述多個外部網(wǎng)頁和所述目標(biāo)網(wǎng)頁的相關(guān)性。
10. 根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述裝置還包括: 第三獲取單元,用于獲取所述外部網(wǎng)站的權(quán)重; 第四獲取單元,用于分別獲取所述多個外部網(wǎng)頁的權(quán)重系數(shù);以及 檢測單元,用于根據(jù)所述外部網(wǎng)站的權(quán)重、所述多個外部網(wǎng)頁的權(quán)重系數(shù)和所述相關(guān) 性,檢測所述目標(biāo)網(wǎng)頁的鏈接的質(zhì)量。
【文檔編號】G06F17/30GK104391955SQ201410709438
【公開日】2015年3月4日 申請日期:2014年11月27日 優(yōu)先權(quán)日:2014年11月27日
【發(fā)明者】楊韜, 王曉群, 祁文, 譚紫萱 申請人:北京國雙科技有限公司