国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于蟻群算法的搜索引擎排序方法

      文檔序號:6433552閱讀:389來源:國知局
      專利名稱:一種基于蟻群算法的搜索引擎排序方法
      技術(shù)領(lǐng)域
      本發(fā)明屬于網(wǎng)頁排序技術(shù)類,是一種搜索引擎排序方法。本發(fā)明采用一定的技術(shù)手段,可以提高搜索引擎排序結(jié)果的滿意度,改善搜索系統(tǒng)性能。
      背景技術(shù)
      目前的搜索引擎返回結(jié)果過多,用戶很難從中快速篩選出真正需要的信息。如果搜索引擎只返回相關(guān)度高的網(wǎng)頁,既可以很大程度地節(jié)省用戶時間,又可以減輕網(wǎng)絡(luò)流量。 斯坦福大學(xué)的Sergey Brin等人提出的PageRank算法在Google搜索引擎得到了成功的應(yīng)用,開啟了鏈接分析技術(shù)的研究熱潮。PageRank算法的初始描繪是這樣的如果一個網(wǎng)頁的鏈入網(wǎng)頁的排序值總和高,則這個網(wǎng)頁的排序值高。PageRank算法單純從鏈接分析的角度入手進行網(wǎng)頁排序,忽略了用戶的查詢意圖,難以取得更好的排序效果。蟻群算法是Dorigo M等人提出的,螞蟻個體之間是通過一種稱之為信息素的物質(zhì)進行信息傳遞的。在運動過程中,螞蟻能夠在它所經(jīng)過的路徑上留下這種信息素,而且能夠感知信息度的濃度,并以此指導(dǎo)自己的運動方向,傾向于朝著信息濃度高的方向移動。

      發(fā)明內(nèi)容
      本發(fā)明的目的是提供一種計算搜索引擎網(wǎng)頁排序的新算法,提高用戶搜索意圖結(jié)果的查準(zhǔn)率。為達到上述發(fā)明目的,通過如下措施來實現(xiàn)。一種基于蟻群算法的搜索引擎排序方法,其特征是給定某一查詢詞的條件下,在搜索完成后,對其所顯示網(wǎng)頁進行點擊,真正被用戶需求的網(wǎng)頁被大部分用戶點擊,定義每個顯示結(jié)果頁面中的網(wǎng)頁予以不同的信息素值,越靠后的網(wǎng)頁,若被點擊到所獲得的權(quán)值較高。統(tǒng)計用戶點擊網(wǎng)頁的次數(shù),乘以該網(wǎng)頁的信息素值,所得值加上該網(wǎng)頁原始的 Pagerank值,得到該網(wǎng)頁的最終排序值,從而達到對網(wǎng)頁排序算法的改進,得到用戶查詢到目標(biāo)網(wǎng)頁的最短路徑,提升了用戶真正感興趣的網(wǎng)頁名次,從而使用戶可以更快地找到自己所需的結(jié)果。本發(fā)明的優(yōu)點效果為通過能夠鏈接到目標(biāo)網(wǎng)頁的全部路徑上的網(wǎng)頁進行加權(quán), 也就是這些網(wǎng)頁的信息熵賦予較高的值,使得最終目標(biāo)網(wǎng)絡(luò)的排序值較大,能夠排到搜索結(jié)果的前面,形成用戶查詢到目標(biāo)網(wǎng)頁的最短路徑,達到較佳的搜索效果。


      附圖是本發(fā)明原理圖。
      具體實施例方式下面對本發(fā)明作進一步描述
      一種基于蟻群算法的搜索引擎排序方法,首先用原始的PageRank算法計算出網(wǎng)頁的權(quán)值,然后用關(guān)鍵字查詢并返回推薦結(jié)果,用Fi對首次返回的排序結(jié)果按次序命名; 然后通過用戶的主觀判斷對相應(yīng)網(wǎng)頁進行點擊,并將此關(guān)鍵字在搜索到的集合中建立點擊次數(shù)屬性用于改進結(jié)果。運行一段時間后,用改進后的排序算法來計算網(wǎng)頁的權(quán)值并重新排序。其特征是在保證召回率和查準(zhǔn)率的前提下為提高用戶搜索意圖,從網(wǎng)頁相對于關(guān)鍵字的點擊率出發(fā),通過蟻群算法的信息熵概念將用戶的群體選擇加入到網(wǎng)頁權(quán)值計算中去,提高相關(guān)網(wǎng)頁的查準(zhǔn)率。
      權(quán)利要求
      1.一種基于蟻群算法的搜索引擎排序方法,其特征在于搜索結(jié)果的網(wǎng)頁被點擊的次數(shù),真正被用戶需求的網(wǎng)頁會被大部分用戶點擊,其相應(yīng)的信息度就會越來越高。
      2.如權(quán)利要求1所述的一種基于蟻群算法的搜索引擎排序方法,其特征在于網(wǎng)頁在搜索結(jié)果中的排名越靠后,其被點擊到后包含的信息熵就越高。
      3.如權(quán)利要求1所述的一種基于蟻群算法的搜索引擎排序方法,其特征是在通過用戶的主觀判斷對相關(guān)網(wǎng)頁進行點擊,并將此關(guān)鍵字在搜索到的集合中建立點擊次數(shù)屬性用于改進最終排序結(jié)果。
      全文摘要
      在PageRank算法的基礎(chǔ)上應(yīng)用蟻群算法的主要思想,對網(wǎng)頁按關(guān)鍵字檢索后被點擊的次數(shù)進行統(tǒng)計,根據(jù)其在初始排序結(jié)果中的位置對網(wǎng)頁進行分類,通過給定的函數(shù)變換對按照以上兩個因素統(tǒng)計分析所得的結(jié)果進行運算,將其作為網(wǎng)頁與關(guān)鍵字關(guān)聯(lián)度的一個評判依據(jù)。從而對網(wǎng)頁的權(quán)值(PR值)進行迭代修正,并返回一個新的排序結(jié)果。通過實驗表明,此方法在使得返回結(jié)果中相關(guān)度較高的網(wǎng)頁通過人們的自主選擇獲得了不同程度的加權(quán),使得其在返回結(jié)果中的排名得到提升,更容易被檢索到,提高了查準(zhǔn)率。
      文檔編號G06F17/30GK102279895SQ20111027945
      公開日2011年12月14日 申請日期2011年9月20日 優(yōu)先權(quán)日2011年9月20日
      發(fā)明者周延泉, 許力波 申請人:北京郵電大學(xué)
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1