国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于搜索引擎的網(wǎng)絡(luò)搜索方法

      文檔序號:6562682閱讀:374來源:國知局
      專利名稱:一種基于搜索引擎的網(wǎng)絡(luò)搜索方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及計算機(jī)科學(xué)/互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及到互聯(lián)網(wǎng)的網(wǎng)絡(luò)搜索方法。
      背景技術(shù)
      隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,人們對網(wǎng)絡(luò)的依賴程度越來越大了,據(jù)統(tǒng)計,每個月有超過100億的搜索關(guān)鍵詞提交給網(wǎng)絡(luò)搜索引擎。這些搜索大多數(shù)是由一些關(guān)鍵詞組成的,簡短、模糊并且不太準(zhǔn)確。實際上,當(dāng)用戶提交一個很短并且不準(zhǔn)確的查詢時,搜索引擎面臨的一個很大的困難是要分析出用戶的實際需求?,F(xiàn)有的眾多的搜索方法論文以及各種搜索方法專利,這些方法主要是將用戶的搜索關(guān)鍵字提交到興趣模型,利用興趣模型的處理結(jié)果進(jìn)行再次搜索,返回最終的搜索結(jié)果。 或者是根據(jù)搜索結(jié)果的相似性評價及搜索結(jié)果內(nèi)容,對搜索結(jié)果進(jìn)行優(yōu)化排序。這些方法只是考慮了用戶的最初的搜索關(guān)鍵字,建立了各種分析模型,而忽略了用戶本身的行為,因而搜索結(jié)果可能沒有太大的說服力。

      發(fā)明內(nèi)容
      本發(fā)明所要解決的技術(shù)問題是提供一種基于搜索引擎的網(wǎng)絡(luò)搜索方法,快速的幫助用戶精確定位到感興趣的內(nèi)容。為解決上述技術(shù)問題,本發(fā)明的技術(shù)構(gòu)思如下—、針對用戶提交的初始查詢詞,集中關(guān)注搜索引擎返回的結(jié)果。當(dāng)用戶初步瀏覽了各個結(jié)果的標(biāo)題和摘要后,點(diǎn)擊了某一個或幾個鏈接后,那這幾個被用戶點(diǎn)擊的頁面中必定會有一些詞是可以描述用戶的信息需求的。如果可以找出用戶感興趣的這些詞來擴(kuò)展用戶的搜索詞,必然會大大提高搜索的效率。當(dāng)用戶點(diǎn)擊搜索結(jié)果中的某個鏈接時,預(yù)示著該結(jié)果中的某一個或幾個詞語與該用戶的信息需求是相關(guān)的。找出這些詞,就可以更加清晰的了解用戶的信息需求。假如搜索結(jié)果是sada是由詞語W1W2... Wn組成的。這時就可以用空間向量模型來表示出sa。這里的關(guān)鍵問題是如何衡量各個詞語的權(quán)重。一種簡單的方法是使用詞語在該結(jié)果和整個搜索的結(jié)果集中出現(xiàn)的頻率來計算詞語的權(quán)重。同時也應(yīng)該考慮各個詞語和原始查詢詞的相關(guān)性。此方法的基本思想是考察原始查詢詞和搜索結(jié)果前列的候選詞的共現(xiàn)頻率,以此來衡量該候選詞的權(quán)重。假設(shè)⑴原始查詢詞是Q,(2) Q中的關(guān)鍵詞為qiq2q3. . . qm,(3)查詢結(jié)果排在前列的文檔集是C,C = Is1, &,. . .,sn}。用c0_deg ree(t, Qi)來表示詞t和Qi在文檔C中的共同出現(xiàn)的次數(shù)。本文使用下面的公式來計算t和Qi的共現(xiàn)次數(shù)
      Σ lo^m,力 +1) χ ^ogitfiqi, 5) + 1)co_dQgree(t,qi) = ^-公式一
      ηtf(t, s)和tf (q,s)分別代表詞t和詞Qi在搜索結(jié)果s中出現(xiàn)的頻率。將這種量度作為詞w和關(guān)鍵詞Cli在集合C中的共現(xiàn)概率。這個算法將詞語在文檔中出現(xiàn)的次數(shù)和兩詞的共現(xiàn)次數(shù)聯(lián)系起來了。得到詞t和關(guān)鍵詞化的共現(xiàn)概率C0_deg ree(t,qi)后,還要計算詞t和所有的Qi在靠前的結(jié)果集中的共現(xiàn)率。設(shè)想t和不同的查詢詞的共現(xiàn)率是獨(dú)立的,很自然的一種假設(shè)是把這些單個的共現(xiàn)率相乘。
      權(quán)利要求
      1. 一種基于搜索引擎的網(wǎng)絡(luò)搜索方法,其特征在于,包括以下步驟 步驟1、所述搜索引擎根據(jù)用戶鍵入的初始查詢詞進(jìn)行搜索,展示所述搜索結(jié)果; 步驟2、記錄所述初始查詢詞以及用戶對所述搜索結(jié)果的點(diǎn)擊日志; 步驟3、利用公式二計算出所述點(diǎn)擊日志的網(wǎng)頁中每個詞語與所述查詢詞之間的相關(guān)度,并按相關(guān)度進(jìn)行排序,挑選相關(guān)度高的前η個詞語擴(kuò)展所述初始查詢詞為擴(kuò)展查詢詞; 所述η為人為設(shè)定的自然數(shù);g(t,Q) = Π (CO _dQgree(t,q) + \ydf^公式二 q^Q其中,Q表示查詢詞,q表示查詢詞Q中的關(guān)鍵詞,t表示任意詞,C0_deg ree(t,qi)表示詞t和Qi在查詢結(jié)果排在前列的文檔集C中的共同出現(xiàn)的次數(shù);測+ 1.步驟4、將所述擴(kuò)展查詢詞提交到所述搜索引擎進(jìn)行二次搜索,并展示新的搜索結(jié)果。
      2.根據(jù)權(quán)利要求1所述的基于搜索引擎的網(wǎng)絡(luò)搜索方法,其特征在于,在所述步驟4之后,包括以下步驟步驟5、將所述初始查詢詞和擴(kuò)展查詢詞分別提交到問答社區(qū)進(jìn)行搜索,步驟6、利用公式五計算所述問答社區(qū)中的答案和搜索引擎的搜索結(jié)果的KL距離,Sim{Q,D) KL(Q 丨…)=Σ ((尸…\Q)~P(^ I D)) log公式五werP(w I D)KL距離小的問答對被認(rèn)為是反映用戶搜索意圖的問答對;步驟7、取搜索結(jié)果中KL距離值小的前m個搜索結(jié)果展示給用戶,供用戶選擇,所述m 為人為設(shè)定的自然數(shù)。
      3.根據(jù)權(quán)利要求2所述的基于搜索引擎的網(wǎng)絡(luò)搜索方法,其特征在于,在所述公式五中,P(W|Q) = APml(w|Q) + (1-A)P(w|C)0
      4.根據(jù)權(quán)利要求2或3之一所述的基于搜索引擎的網(wǎng)絡(luò)搜索方法,其特征在于,在所述步驟7之后,還包括以下步驟步驟8、采用如下公式七,, . . ^ R(i) χ pos(i)AverageFr ecision(q) = X公式七tt R(Tq)Xi其中,%為搜索結(jié)果的總數(shù),R(i)為前i個結(jié)果中與查詢詞q相關(guān)的結(jié)果的個數(shù), pos (i)是一個二元函數(shù),它指示第i個結(jié)果與查詢詞是否相關(guān);分別計算針對原始關(guān)鍵詞%的問答社區(qū)查詢結(jié)果的平均精確度aP(l以及針對擴(kuò)展關(guān)鍵詞Cl1的問答社區(qū)查詢結(jié)果的平均精確度apQ,比較apQ和aPl值大小,如果apQ和aPl的相似比例在設(shè)定范圍內(nèi),則認(rèn)為查詢結(jié)果準(zhǔn)確。
      全文摘要
      本發(fā)明涉及基于搜索引擎的網(wǎng)絡(luò)搜索方法,用于為搜索客戶端提供精確搜索,該精確搜索可以根據(jù)搜索客戶端用戶對搜索結(jié)果的點(diǎn)擊日志篩選出可以反映用戶搜索意圖的關(guān)鍵詞,并將這些搜索詞在各種專業(yè)的問答社區(qū)進(jìn)行問題匹配,以此來明確用戶的真正搜索意圖,恢復(fù)用戶的精確搜索語句,并以此語句重新提交搜索,將用戶真正感興趣的、對用戶有用的結(jié)果以高優(yōu)先級返回給用戶,從而大大減少用戶的搜索時間,提高用戶的搜索效率。
      文檔編號G06F17/30GK102254039SQ20111022964
      公開日2011年11月23日 申請日期2011年8月11日 優(yōu)先權(quán)日2011年8月11日
      發(fā)明者溫杰, 王君澤, 胡廣, 魏超, 黃本雄 申請人:武漢安問科技發(fā)展有限責(zé)任公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1