国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于網(wǎng)頁類型的信息推送方法和裝置制造方法

      文檔序號:6511027閱讀:161來源:國知局
      基于網(wǎng)頁類型的信息推送方法和裝置制造方法
      【專利摘要】本發(fā)明涉及移動通信【技術(shù)領(lǐng)域】,公開了一種基于網(wǎng)頁類型的信息推送方法和裝置,該方法包括:利用預(yù)先獲得的歷史頁面描述詞語的共現(xiàn)關(guān)系獲取各個歷史頁面描述詞語對各頁面類型的類型權(quán)值;以類型權(quán)值為詞語的屬性構(gòu)建詞語分類屬性庫;利用實時獲取的當(dāng)前頁面描述詞語在詞語分類屬性庫中進行查詢,獲取當(dāng)前頁面描述詞語的各個頁面類型的類型權(quán)值;計算每個頁面類型中各個當(dāng)前頁面描述詞語的類型權(quán)值之和,將類型權(quán)值之和最大的頁面類型設(shè)置為當(dāng)前瀏覽網(wǎng)頁的類型;基于當(dāng)前瀏覽網(wǎng)頁的類型在用戶當(dāng)前瀏覽網(wǎng)頁中推送網(wǎng)絡(luò)信息。本發(fā)明簡單、高效而準(zhǔn)確地實現(xiàn)了網(wǎng)頁類型的判定,使得基于網(wǎng)頁類型進行的信息推送的精準(zhǔn)度得到大幅提升。
      【專利說明】基于網(wǎng)頁類型的信息推送方法和裝置
      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及移動通信【技術(shù)領(lǐng)域】,特別涉及一種基于網(wǎng)頁類型的信息推送方法和裝置。
      【背景技術(shù)】
      [0002]數(shù)據(jù)聚類是當(dāng)前互聯(lián)網(wǎng)應(yīng)用的一個熱點,經(jīng)過幾十年的發(fā)展,網(wǎng)絡(luò)用戶和互聯(lián)網(wǎng)規(guī)模呈現(xiàn)爆發(fā)式增長,少量的有用信息往往會被海量的互聯(lián)網(wǎng)數(shù)據(jù)所淹沒,僅靠用戶個人主動瀏覽網(wǎng)頁已經(jīng)很難有效獲取關(guān)鍵信息。在這種情況下,互聯(lián)網(wǎng)從單純被動地展示信息開始向主動推送信息轉(zhuǎn)變,為了使推送的信息更為快速準(zhǔn)確,必須對全部互聯(lián)網(wǎng)信息進行初步篩選,數(shù)據(jù)聚類就是一種用來在互聯(lián)網(wǎng)信息之間建立關(guān)聯(lián)的信息分類方法。
      [0003]由于推送信息通常不是用戶主動要求的信息,很容易被用戶所反感,因而推送的精準(zhǔn)性顯得尤為重要。一般情況下,推送信息主要包括搜索結(jié)果、新聞、生活娛樂信息和廣告等,推送信息的精準(zhǔn)投放越來越受到重視,基于用戶當(dāng)前瀏覽網(wǎng)頁的類型推送相關(guān)的信息就是其中一種實現(xiàn)思路。比如基于網(wǎng)頁內(nèi)容的廣告定向技術(shù),就是指在瀏覽器返回的頁面中追加一條廣告,廣告的類別盡可能與網(wǎng)頁類型相符。通過數(shù)據(jù)聚類,網(wǎng)絡(luò)推送可以從關(guān)聯(lián)度較高的信息中進行優(yōu)選,但由于要實時在線對用戶當(dāng)前瀏覽的網(wǎng)頁進行歸類,對相關(guān)分類算法的性能提出了苛刻的要求。
      [0004]目前網(wǎng)頁分類通常使用機器學(xué)習(xí)算法,如樸素貝葉斯(NaiveBayes)算法、KNN(K-nearest neighbor)算法、支持向量機(Support Vector Machine, SVM)算法、神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)算法等。這些算法的基本思路都是基于文檔的向量空間模型,通過大量已標(biāo)注分類的文檔作訓(xùn)練,得到訓(xùn)練后的模型來預(yù)測新網(wǎng)頁的分類。
      [0005]現(xiàn)有技術(shù)這些機器學(xué)習(xí)算法的主要問題有:
      [0006](I)需要大量的已標(biāo)注好分類的樣本,工作量大,并且分類器的質(zhì)量受標(biāo)注樣本的質(zhì)量影響比較大。獲取標(biāo)注分類網(wǎng)頁通常是靠人工標(biāo)注,這種方法的優(yōu)點是標(biāo)注樣本質(zhì)量高,但需耗費大量人力。還有一些做法是利用互聯(lián)網(wǎng)的分類導(dǎo)航網(wǎng)站或搜索引擎定向爬取頁面,這種方法的優(yōu)點是可以自動化標(biāo)注,但樣本的質(zhì)量不高,噪音較大,類別也不一定能滿足自身所需,即獲取網(wǎng)頁的效率低、準(zhǔn)確率低。
      [0007](2)部分算法(如ANN算法、SVM算法等)本身比較復(fù)雜,運行開銷高,只適合離線處理,不能用于性能要求較高的在線實時處理,即實時性低。
      [0008]基于上述獲取網(wǎng)頁的方法,進行信息推送時,造成信息推送效率低下,實時性低。
      【發(fā)明內(nèi)容】

      [0009]針對現(xiàn)有技術(shù)的缺陷,本發(fā)明所要解決的技術(shù)問題是如何實時高效地進行精準(zhǔn)的信息推送。
      [0010]為解決上述問題,本發(fā)明的一方面提供了一種基于網(wǎng)頁類型的信息推送方法,所述方法包括步驟:[0011]利用預(yù)先獲得的歷史頁面描述詞語的共現(xiàn)關(guān)系獲取各個所述歷史頁面描述詞語對應(yīng)不同頁面類型的類型權(quán)值;其中,所述共現(xiàn)關(guān)系用于表示詞語間的共存狀態(tài);以所述類型權(quán)值為詞語的屬性構(gòu)建詞語分類屬性庫;利用實時獲取的當(dāng)前頁面描述詞語在所述詞語分類屬性庫中進行查詢,獲取當(dāng)前頁面描述詞語的各個頁面類型的類型權(quán)值;計算每個頁面類型中各個當(dāng)前頁面描述詞語的類型權(quán)值之和,將類型權(quán)值之和最大的頁面類型設(shè)置為所述當(dāng)前瀏覽網(wǎng)頁的類型;基于所述當(dāng)前瀏覽網(wǎng)頁的類型在用戶當(dāng)前瀏覽網(wǎng)頁中推送網(wǎng)絡(luò)信息。
      [0012]優(yōu)選地,所述利用預(yù)先獲得的歷史頁面描述詞語的共現(xiàn)關(guān)系獲取各個所述歷史頁面描述詞語對應(yīng)不同頁面類型的類型權(quán)值的步驟包括:
      [0013]利用歷史頁面描述詞語的共現(xiàn)關(guān)系建立詞語網(wǎng)絡(luò);
      [0014]根據(jù)所述共現(xiàn)關(guān)系獲取所述詞語網(wǎng)絡(luò)中各歷史頁面描述詞語間的關(guān)聯(lián)強度;
      [0015]遍歷所述詞語網(wǎng)絡(luò),獲取各個所述歷史頁面描述詞語間的距離;
      [0016]根據(jù)預(yù)先給每個設(shè)定的分類核心詞賦予的初始權(quán)值、所述距離、所述關(guān)聯(lián)強度以及預(yù)設(shè)的衰減強度,獲取各個所述歷史頁面描述詞語對應(yīng)不同頁面類型的類型權(quán)值。
      [0017]優(yōu)選地,所述根據(jù)共現(xiàn)關(guān)系獲取所述詞語網(wǎng)絡(luò)中各歷史頁面描述詞語間的關(guān)聯(lián)強度的步驟包括:
      [0018]根據(jù)所述共現(xiàn)關(guān)系獲取各個歷史頁面描述詞語共同出現(xiàn)的次數(shù);
      [0019]根據(jù)如下公式獲取各歷史頁面描述詞語間的關(guān)聯(lián)強度:
      [0020]Sij = Cjj/Max (C)
      [0021]其中,Cij是詞i與詞j的共現(xiàn)次數(shù);Max(C)是詞語間的共現(xiàn)次數(shù)最大的。
      [0022]優(yōu)選地,所述根據(jù)給每個分類核心詞賦予的初始權(quán)值、所述距離、所述關(guān)聯(lián)強度以及預(yù)設(shè)的衰減強度,獲取各個所述歷史頁面描述詞語對應(yīng)不同頁面類型的類型權(quán)值的步驟包括:
      [0023]利用如下公式獲取各個所述歷史頁面描述詞語對應(yīng)不同頁面類型的類型權(quán)值:
      【權(quán)利要求】
      1.一種基于網(wǎng)頁類型的信息推送方法,其特征在于,所述方法包括步驟: 利用預(yù)先獲得的歷史頁面描述詞語的共現(xiàn)關(guān)系獲取各個所述歷史頁面描述詞語對應(yīng)不同頁面類型的類型權(quán)值;其中,所述共現(xiàn)關(guān)系用于表示詞語間的共存狀態(tài); 以所述類型權(quán)值為詞語的屬性構(gòu)建詞語分類屬性庫; 利用實時獲取的當(dāng)前頁面描述詞語在所述詞語分類屬性庫中進行查詢,獲取當(dāng)前頁面描述詞語的各個頁面類型的類型權(quán)值; 計算每個頁面類型中各個當(dāng)前頁面描述詞語的類型權(quán)值之和,將類型權(quán)值之和最大的頁面類型設(shè)置為所述當(dāng)前瀏覽網(wǎng)頁的類型; 基于所述當(dāng)前瀏覽網(wǎng)頁的類型在用戶當(dāng)前瀏覽網(wǎng)頁中推送網(wǎng)絡(luò)信息。
      2.根據(jù)權(quán)利要求1所述的基于網(wǎng)頁類型的信息推送方法,其特征在于,所述利用預(yù)先獲得的歷史頁面描述詞語的共現(xiàn)關(guān)系獲取各個所述歷史頁面描述詞語對應(yīng)不同頁面類型的類型權(quán)值的步驟包括: 利用預(yù)先獲得的歷史頁面描述詞語的共現(xiàn)關(guān)系建立詞語網(wǎng)絡(luò); 根據(jù)所述共現(xiàn)關(guān)系獲取所述詞語網(wǎng)絡(luò)中各歷史頁面描述詞語間的關(guān)聯(lián)強度; 遍歷所述詞語網(wǎng)絡(luò),獲取各個所述歷史頁面描述詞語間的距離; 根據(jù)預(yù)先給每個設(shè)定的分類核心詞賦予的初始權(quán)值、所述距離、所述關(guān)聯(lián)強度以及預(yù)設(shè)的衰減強度,獲取各個所述歷史頁面描述詞語對應(yīng)不同頁面類型的類型權(quán)值。
      3.根據(jù)權(quán)利要求2所述的基于網(wǎng)頁類型的信息推送方法,其特征在于,所述根據(jù)共現(xiàn)關(guān)系獲取所述詞語網(wǎng)絡(luò)中各 史頁面描述詞語間的關(guān)聯(lián)強度的步驟包括: 根據(jù)所述共現(xiàn)關(guān)系獲取各個歷史頁面描述詞語共同出現(xiàn)的次數(shù); 根據(jù)如下公式獲取各歷史頁面描述詞語間的關(guān)聯(lián)強度:
      Sij = Cjj/Max (C) 其中,Cij是詞i與詞j的共現(xiàn)次數(shù);Max(C)是詞語間的共現(xiàn)次數(shù)最大的。
      4.根據(jù)權(quán)利要求2所述的基于網(wǎng)頁類型的信息推送方法,其特征在于,所述根據(jù)給每個分類核心詞賦予的初始權(quán)值、所述距離、所述關(guān)聯(lián)強度以及預(yù)設(shè)的衰減強度,獲取各個所述歷史頁面描述詞語對應(yīng)不同頁面類型的類型權(quán)值的步驟包括: 利用如下公式獲取各個所述歷史頁面描述詞語對應(yīng)不同頁面類型的類型權(quán)值:
      W1- = H’,.*S9 *a-{d-+l) 其中,%為詞語節(jié)點j的類型權(quán)值;i和j是詞語網(wǎng)絡(luò)中關(guān)聯(lián)的兩個詞語節(jié)點,Su是詞語節(jié)點i與詞語節(jié)點j的關(guān)聯(lián)強度,Wi是詞語節(jié)點i的類型權(quán)值;α是預(yù)設(shè)的衰減強度,(Ii是節(jié)點i與分類核心詞的距離,當(dāng)?shù)谝淮斡嬎銜r,Wi為賦予所述分類核心詞的初始權(quán)值。
      5.根據(jù)權(quán)利要求1至4任一項所述的基于網(wǎng)頁類型的信息推送方法,其特征在于,所述基于當(dāng)前瀏覽網(wǎng)頁的類型在用戶當(dāng)前瀏覽網(wǎng)頁中推送網(wǎng)絡(luò)信息的步驟包括: 在預(yù)設(shè)的網(wǎng)絡(luò)信息數(shù)據(jù)庫中查詢與當(dāng)前瀏覽網(wǎng)頁的類型相同或者相近的網(wǎng)絡(luò)信息; 將查詢到的網(wǎng)絡(luò)信息向當(dāng)前瀏覽網(wǎng)頁進行推送。
      6.一種基于網(wǎng)頁類型的信息推送裝置,其特征在于,所述裝置包括: 第一權(quán)值獲取模塊,利用預(yù)先獲得的歷史頁面描述詞語的共現(xiàn)關(guān)系獲取各個所述歷史頁面描述詞語對應(yīng)不同頁面類型的類型權(quán)值;其中,所述共現(xiàn)關(guān)系用于表示詞語間的共存狀態(tài); 屬性庫建立模塊,用于以所述類型權(quán)值為詞語的屬性構(gòu)建詞語分類屬性庫; 第二權(quán)值獲取模塊,利用實時獲取的當(dāng)前頁面描述詞語在所述詞語分類屬性庫中進行查詢,獲取當(dāng)前頁面描述詞語的各個頁面類型的類型權(quán)值; 頁面類型確定模塊,用于計算每個頁面類型中各個當(dāng)前頁面描述詞語的類型權(quán)值之和,將類型權(quán)值之和最大的頁面類型設(shè)置為所述當(dāng)前瀏覽網(wǎng)頁的類型; 信息推送模塊,用于基于所述當(dāng)前瀏覽網(wǎng)頁的類型在用戶當(dāng)前瀏覽網(wǎng)頁中推送網(wǎng)絡(luò)信肩、O
      7.根據(jù)權(quán)利要求6所述的基于網(wǎng)頁類型的信息推送裝置,其特征在于,所述第一權(quán)值獲取模塊包括: 詞語網(wǎng)絡(luò)建立單元,用于利用預(yù)先獲得的歷史頁面描述詞語的共現(xiàn)關(guān)系建立詞語網(wǎng)絡(luò); 詞語關(guān)聯(lián)強度獲取單元,用于根據(jù)所述共現(xiàn)關(guān)系獲取所述詞語網(wǎng)絡(luò)中各歷史頁面描述詞語間的關(guān)聯(lián)強度; 遍歷單元,用于遍歷所述詞語網(wǎng)絡(luò),獲取各個所述歷史頁面描述詞語間的距離; 獲取單元,用于根據(jù)預(yù)先給每個設(shè)定的分類核心詞賦予的初始權(quán)值、所述距離、所述關(guān)聯(lián)強度以及預(yù)設(shè)的衰減強度,獲取各個所述歷史頁面描述詞語對應(yīng)不同頁面類型的類型權(quán)值。
      8.根據(jù)權(quán)利要求7所述的基于網(wǎng)頁類型的信息推送裝置,其特征在于, 所述詞語關(guān)聯(lián)強度獲取單元根據(jù)所述共現(xiàn)關(guān)系獲取各個歷史頁面描述詞語共同出現(xiàn)的次數(shù);根據(jù)如下公式獲取各歷史頁面描述詞語間的關(guān)聯(lián)強度:
      Sij = Cjj/Max (C) 其中,Cij是詞i與詞j的共現(xiàn)次數(shù);Max(C)是詞語間的共現(xiàn)次數(shù)最大的。
      9.根據(jù)權(quán)利要求7所述的基于網(wǎng)頁類型的信息推送裝置,其特征在于,所述獲取單元利用如下公式獲取各個所述歷史頁面描述詞語對應(yīng)不同頁面類型的類型權(quán)值: ?=WcTκ+1> 其中,%為詞語節(jié)點j的類型權(quán)值;i和j是詞語網(wǎng)絡(luò)中關(guān)聯(lián)的兩個詞語節(jié)點,Su是詞語節(jié)點i與詞語節(jié)點j的關(guān)聯(lián)強度,Wi是詞語節(jié)點i的類型權(quán)值;α是預(yù)設(shè)的衰減強度,di是節(jié)點i與分類核心詞的距離,當(dāng)?shù)谝淮斡嬎銜r,Wi為賦予所述分類核心詞的初始權(quán)值。
      10.根據(jù)權(quán)利要求6至9任一項所述的基于網(wǎng)頁類型的信息推送裝置,其特征在于,所述信息推送模塊包括: 信息查詢單元,用于在預(yù)設(shè)的網(wǎng)絡(luò)信息數(shù)據(jù)庫中查詢與當(dāng)前瀏覽網(wǎng)頁的類型相同或者相近的網(wǎng)絡(luò)信息; 信息推送單元,用于將獲取的網(wǎng)絡(luò)信息向當(dāng)前瀏覽網(wǎng)頁進行推送。
      【文檔編號】G06F17/30GK103440342SQ201310410102
      【公開日】2013年12月11日 申請日期:2013年9月10日 優(yōu)先權(quán)日:2013年9月10日
      【發(fā)明者】梁捷, 李建興, 李建設(shè) 申請人:廣州市動景計算機科技有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1