国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種網(wǎng)頁頁面的預讀取方法、裝置及智能終端設備的制造方法_2

      文檔序號:9826311閱讀:來源:國知局
      在利用最相似用戶計算路徑推薦概率的過程中,篩選掉點擊次數(shù)低于點 擊次數(shù)閾值的點擊路徑。
      [0041] 優(yōu)選的,在利用最相似用戶計算點擊路徑的推薦概率的過程中,利用威爾遜區(qū)間 公式對網(wǎng)頁的訪問次數(shù)做置信區(qū)間計算,取區(qū)間下限作為網(wǎng)頁的訪問次數(shù)的最終值。
      [0042] 優(yōu)選的,在生成預讀取列表的過程中,多條點擊路徑在預讀取列表中以推薦概率 的大小進行排序。
      [0043] 優(yōu)選的,在生成所述預讀取列表之前或過程中,先篩選掉推薦概率低于推薦概率 閾值的點擊路徑。
      [0044] 優(yōu)選的,在從預讀取列表中查詢當前瀏覽的網(wǎng)頁頁面的點擊路徑從而預讀取相應 待瀏覽的目標網(wǎng)頁數(shù)據(jù)的步驟中,選擇最大推薦概率的點擊路徑來預讀取相應待瀏覽的目 標網(wǎng)頁數(shù)據(jù),或者按推薦概率的降序方式預讀取多個相應待瀏覽的目標網(wǎng)頁數(shù)據(jù)。
      [0045] 本發(fā)明實施例還提供了一種網(wǎng)頁頁面預讀取裝置,其特征在于,包括:獲取模塊、 確定模塊、分析模塊、和第一預讀取模塊,其中:
      [0046] 所述獲取模塊用于獲取多個用戶中的每一個用戶在一個時間段內(nèi)對多個網(wǎng)頁頁 面的訪問信息;
      [0047] 所述確定模塊用于確定該多個用戶中兩兩用戶之間的相似度以及按相似度的大 小確定1個或多個最相似用戶;
      [0048] 所述分析模塊用于在用戶瀏覽當前網(wǎng)頁的過程中,按一定的預測策略分析出所述 最相似用戶從當前網(wǎng)頁將要點擊瀏覽的目標網(wǎng)頁;
      [0049] 所述第一預讀取模塊用于預讀取出所分析出的目標網(wǎng)頁。
      [0050] 本發(fā)明實施例還提供了一種網(wǎng)頁頁面預讀取裝置,其特征在于,包括:獲取模塊、 確定模塊、計算和生成模塊、和第二預讀取模塊,其中:
      [0051] 所述獲取模塊用于獲取多個用戶中的每一個用戶在一個時間段內(nèi)對多個網(wǎng)頁頁 面的訪問信息;
      [0052] 所述確定模塊用于確定該多個用戶中兩兩用戶之間的相似度以及按相似度的大 小確定1個或多個最相似用戶;
      [0053] 所述計算和生成模塊用于利用最相似用戶計算點擊路徑的推薦概率并且生成預 讀取列表;
      [0054] 所述第二預讀取模塊用于從預讀取列表中查詢當前瀏覽的網(wǎng)頁頁面的點擊路徑, 從而預讀取相應待瀏覽的目標網(wǎng)頁數(shù)據(jù)。
      [0055] 本發(fā)明實施例提供了一種智能終端設備,其包括如上所述的網(wǎng)頁頁面預讀取裝 置。
      [0056] 本發(fā)明實施例提供了網(wǎng)頁頁面的預讀取方法、裝置及智能終端設備,其有益效果 是:通過不同用戶的相似度來獲得最相似用戶,利用預測策略分析該最相似用戶從當前網(wǎng) 頁將要點擊瀏覽的目標網(wǎng)頁,由此提前給用戶預讀取出網(wǎng)頁數(shù)據(jù),該預讀取的命中概率和 覆蓋率大大提高,進而保證了預讀取的高準確性和高有效性,在預讀取高概率的網(wǎng)頁數(shù)據(jù) 并保存到本地緩存后,提高了用戶打開網(wǎng)頁頁面的速度,提升了用戶體驗。
      【附圖說明】
      [0057] 圖1是本發(fā)明的網(wǎng)頁頁面預讀取方法的流程圖;
      [0058] 圖2是本發(fā)明的另一種網(wǎng)頁頁面的預讀取方法的流程圖;
      [0059] 圖3是本發(fā)明的網(wǎng)頁頁面預讀取裝置的結構示意圖;
      [0060] 圖4是本發(fā)明的另一網(wǎng)頁頁面預讀取裝置的結構示意圖。
      【具體實施方式】
      [0061] 下面將結合本發(fā)明實施例中附圖,對本發(fā)明實施例中的技術方案進行清楚、完整 地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。通常在 此處附圖中描述和示出的本發(fā)明實施例的組件可以以各種不同的配置來布置和設計。因 此,以下對在附圖中提供的本發(fā)明的實施例的詳細描述并非旨在限制要求保護的本發(fā)明的 范圍,而是僅僅表示本發(fā)明的選定實施例?;诒景l(fā)明的實施例,本領域技術人員在沒有做 出創(chuàng)造性勞動的前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
      [0062] 下面將結合本發(fā)明的附圖和具體實施例,對本發(fā)明的技術方案進行清楚、完整地 描述。
      [0063] 圖1是本發(fā)明的網(wǎng)頁頁面的預讀取方法的流程圖。如圖1所示,本發(fā)明的實施例 提供了一種網(wǎng)頁頁面的預讀取方法,包括:
      [0064] 步驟S101 :獲取多個用戶中的每一個用戶在一個時間段內(nèi)對多個網(wǎng)頁的訪問信 息。
      [0065] 獲取多個用戶中的每一個用戶在一個時間段內(nèi)對多個網(wǎng)頁的訪問信息的方式可 以采用讀取用戶的終端設備的網(wǎng)絡訪問的客戶端上網(wǎng)記錄日志的方式,也可以采用讀取服 務器保存的訪問網(wǎng)頁的上網(wǎng)記錄日志的方式來獲取。如果日志中沒有記錄每個頁面的訪問 量,在這里還可以在獲取了所有網(wǎng)頁的信息后,統(tǒng)計每個網(wǎng)頁的訪問量(即訪問次數(shù))以及 時間分布情況等等。一般來說,獲取多個不特定用戶在一個時間段內(nèi)對多個網(wǎng)頁頁面的訪 問信息的方式優(yōu)選采用讀取服務器保存的訪問網(wǎng)頁的上網(wǎng)記錄日志的方式。該日志記錄 的信息內(nèi)容是本領域的技術人員都知道的,這里不再舉例說明。同樣的,記錄和獲取用戶 上網(wǎng)和瀏覽網(wǎng)頁的方法可以采用任何公知的方法,例如2013年12月11日公開的申請?zhí)枮?201310364722. 0的中國專利文獻,名稱為"一種用戶操作日志信息的記錄及讀取方法",又 如2015年4月15日公開的申請?zhí)枮?01510038747. 0的中國專利文獻,名稱為"一種移動 用戶上網(wǎng)記錄的生成方法及系統(tǒng)"。這里所述的時間段可以根據(jù)實際應用情況來設定。例 如,該時間段可以設定為多個小時,例如12個小時、24個小時、30個小時、36個小時、72小 時等等。
      [0066] 在另一個實施例中,在獲取多個用戶中的每一個用戶在一個時間段內(nèi)對多個網(wǎng)頁 頁面的訪問信息的過程中對每個頁面的數(shù)據(jù)進行數(shù)據(jù)清洗的預處理的步驟。通常,無論是 客戶端保存的上網(wǎng)記錄日志還是服務器保存的上網(wǎng)記錄日志都會記錄大量的信息,其中包 括非網(wǎng)絡請求數(shù)據(jù)、不規(guī)范數(shù)據(jù)以及非主文檔請求數(shù)據(jù)、不一致的無關的數(shù)據(jù)。例如,日志 數(shù)據(jù)中可以包括用戶IP地址、用戶ID、請求訪問的URL、請求方法、訪問時間、傳輸協(xié)議、傳 輸?shù)淖止?jié)數(shù)、錯誤代碼、用戶代理等屬性。用戶的一次網(wǎng)頁瀏覽請求可能會讓瀏覽器自動下 載多個文件,如一些圖片等,下載的所有文件構成一個網(wǎng)頁頁面視圖,構成一次請求對應多 個日志項的情況。
      [0067] 因此有必要先對日志記錄的數(shù)據(jù)進行預處理,通過數(shù)據(jù)清洗步驟將無關的數(shù)據(jù)從 日志記錄的數(shù)據(jù)中清除掉。例如,清洗掉URL擴展名:一般信息網(wǎng)站中,只是網(wǎng)頁頁面正文 與用戶的請求有關,而網(wǎng)頁頁面上的圖片類的網(wǎng)頁頁面請求(后綴名為gif,jpg等)和腳 本類文件(后綴名為js,cgi,css的文件)可以被認為是與用戶請求無關的,應將其刪除。 通常情況下,用戶不會指定請求某個網(wǎng)頁上的全部圖片和腳本文件,日志中的圖片和腳本 文件大多是進行網(wǎng)頁框架配置的腳本內(nèi)容的網(wǎng)頁中攜帶的圖片信息,該圖片和腳本文件在 用戶瀏覽網(wǎng)頁頁面文字內(nèi)容時作為附屬文件自動下載的,這些圖片和腳本文件不能真實反 映出用戶的請求行為,在數(shù)據(jù)清洗過程中將會被刪除。
      [0068] 通過數(shù)據(jù)清洗的技術手段,將與用戶請求無關的數(shù)據(jù)清除掉,獲得適合于后續(xù)的 統(tǒng)計、分析操作的可靠的精確數(shù)據(jù),有利于得到準確的統(tǒng)計和分析結果,更利于減少數(shù)據(jù)的 運算量。
      [0069] 步驟S102 :確定該多個用戶中兩兩用戶之間的相似度。
      [0070] 通常,通過例如PC瀏覽器或智能終端瀏覽器等各種瀏覽器在打開某網(wǎng)頁之后,會 在瀏覽器界面中展現(xiàn)出構成該網(wǎng)頁的各種元素,例如,可能包括文字、圖片、音頻、視頻等等 內(nèi)容,還可能包括鏈接這種常見的網(wǎng)頁頁面元素。訪問者單擊網(wǎng)頁內(nèi)的鏈接就可以自動跳 轉到鏈接的目標處,其通常是另一個網(wǎng)頁。用戶通過瀏覽器瀏覽的各種網(wǎng)頁的各種信息都 會記錄在所有終端設備的網(wǎng)絡訪問的客戶端上網(wǎng)記錄日志中,例如訪問的時間(包括訪問 開始時間和訪問結束時間)、URL地址、傳送的內(nèi)容類型等。為了便于區(qū)分,可以將鏈接對應 的一個網(wǎng)頁稱為下一個網(wǎng)頁或目標網(wǎng)頁,將網(wǎng)頁內(nèi)容中包含有該鏈接的網(wǎng)頁稱為當前網(wǎng)頁 或源網(wǎng)頁,點擊路徑就是從當前網(wǎng)頁(源網(wǎng)頁)頁面點擊進入另一個網(wǎng)頁(目標網(wǎng)頁)頁 面的路徑,通常來說,該路徑的尾部是當前網(wǎng)頁(源網(wǎng)頁)頁面,該路徑的頭部是用戶點擊 進入的另一個網(wǎng)頁(目標網(wǎng)頁)頁面。
      [0071] 當用戶在一個時間段內(nèi)多次從第一網(wǎng)頁頁面點擊進入(訪問)第二網(wǎng)頁頁面時, 記錄從第一網(wǎng)頁頁面點擊進入(訪問)第二網(wǎng)頁頁面的點擊路徑的點擊次數(shù)。
      [0072] 例如,用戶在12小時內(nèi)的不同時間點從例如UC瀏覽器首頁上的資訊中心網(wǎng)頁頁 面(第一網(wǎng)頁頁面)點擊進入體育欄網(wǎng)頁頁面(第二網(wǎng)頁頁面)的點擊次數(shù)為3次,點擊 進入娛樂欄網(wǎng)頁頁面的點擊次數(shù)為6次、點擊進入財經(jīng)欄網(wǎng)頁頁面的點擊次數(shù)為4次,則從 資訊中心網(wǎng)頁頁面到體育欄網(wǎng)頁頁面形成一條點擊路徑,該點擊路徑的點擊次數(shù)為3 ;從 資訊中心網(wǎng)頁頁面到娛樂欄網(wǎng)頁頁面形成一條點擊路徑,該點擊路徑的點擊次數(shù)為6;從 資訊中心網(wǎng)頁頁面到財經(jīng)欄網(wǎng)頁頁面形成一條點擊路徑,該點擊路徑的點擊次數(shù)為4。
      [0073] 在本發(fā)明的一個實施例中,確定多個用戶中兩兩用戶之間的相似度的方法可以使 用計算余弦相似度的方法來實現(xiàn)。在本發(fā)明中,使用用戶在設定的時間段內(nèi)對不同網(wǎng)頁的 訪問量來表示用戶的特征向量。假設一個用戶在一個時間段內(nèi)訪問了 m個不同網(wǎng)頁,則用 戶的特征向量是m維陣列:{wl, w2,. . . wi. . .,wm},其中wi為第i個網(wǎng)頁的訪問量。
      [0074] 建立每個用戶在同一時間段內(nèi)訪問不同網(wǎng)頁的特征向量陣列。在該特征向量陣列 中,假設不同網(wǎng)頁的數(shù)量為n,則特征向量陣列是η維,每個向量都是按序排好,例如按
      當前第2頁1 2 3 4 5 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1