国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于查詢詞進行搜索的方法和搜索裝置的制作方法

      文檔序號:6336756閱讀:195來源:國知局
      專利名稱:一種基于查詢詞進行搜索的方法和搜索裝置的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及一種互聯(lián)網(wǎng)信息搜索方法及工具,特別涉及一種基于查詢詞進行搜索 的方法和搜索裝置。
      背景技術(shù)
      隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,搜索引擎得到了不斷的完善,通過搜索引擎可以從互聯(lián)網(wǎng) 上獲取各種信息。搜索引擎是當(dāng)前互聯(lián)網(wǎng)幫助用戶快速獲取信息的主要途徑之一。用戶提 交一個查詢詞(Query)給搜索引擎,搜索引擎返回給用戶與該查詢詞相關(guān)的搜索結(jié)果,這 些結(jié)果按與查詢詞相關(guān)的程度從高到低排列。
      現(xiàn)有的搜索引擎技術(shù)大致可以分為兩種。傳統(tǒng)搜索引擎,使用網(wǎng)絡(luò)爬蟲從互聯(lián)網(wǎng) 抓取網(wǎng)頁,建立索引,并為用戶提供查詢服務(wù),以百度、谷歌的網(wǎng)頁搜索為代表。垂直搜索引 擎,對特定領(lǐng)域的數(shù)據(jù)進行抓取、索引和搜索,并為用戶提供查詢服務(wù),以搜狗音樂搜索為 代表。例如,還存在新聞、音樂、圖片、視頻、購物、地圖等專業(yè)領(lǐng)域的垂直搜索引擎。
      傳統(tǒng)的搜索引擎技術(shù)通常包括網(wǎng)頁抓取、網(wǎng)頁處理、搜索服務(wù)等幾個部分。無論哪 一家搜索引擎,都不可能去抓取互聯(lián)網(wǎng)的全部內(nèi)容,因此各家搜索引擎通常都是索引整個 互聯(lián)網(wǎng)的一個子集;另外,傳統(tǒng)的網(wǎng)絡(luò)爬蟲基于網(wǎng)頁之間的鏈接進行抓取,對于沒有鏈接的 頁面難以抓取;最后,傳統(tǒng)搜索引擎從抓取、建立索引、提供查詢服務(wù)需要一定周期,對大部 分內(nèi)容無法做到實時更新。
      同時,一種搜索引擎可能無法滿足所有人或者一個人的所有搜索需求。在某些情 況下,為了得到較為全面及準確的搜索結(jié)果,人們需要使用多個搜索引擎來進行搜索,通過 對搜索結(jié)果進行比較和篩選來獲取搜索結(jié)果,但是其操作較為繁瑣,降低了搜索效率,也提 高了搜索的難度。
      進一步,對于候選多個搜索引擎而言,將這類候選引擎都選擇查詢并將結(jié)果返回 是不可取的(搜索時間將大大加長),且會存在某些引擎對衣服類商品詞有更好的結(jié)果,但 對電子產(chǎn)品的商品詞效果會比較差,這使得搜索結(jié)果無法更好的滿足用戶需求,即準確度 降低。
      總之,本領(lǐng)域技術(shù)人員希望能夠?qū)τ脩舻牟樵円鈭D進行分析,以便更好的提供搜 索結(jié)果,提高用戶搜索的準確性。發(fā)明內(nèi)容
      本發(fā)明所要解決的技術(shù)問題是提供一種基于查詢詞進行搜索的方法及搜索裝置, 能夠?qū)τ脩舻牟樵円鈭D進行分析,選擇與用戶需求相關(guān)的搜索引擎,進行有針對性的搜索。
      為了解決上述問題,本發(fā)明公開了一種基于查詢詞進行搜索的方法,包括以下步 驟搜索客戶端獲取用戶輸入的查詢詞,結(jié)合查詢詞屬性庫,從多個搜索引擎中選擇適合該 查詢詞的搜索引擎;所述查詢詞屬性庫用于表征各查詢詞或各查詢詞類別與各搜索引擎的 相關(guān)程度;獲取所選擇的搜索引擎的搜索結(jié)果信息,處理后進行展示。
      優(yōu)選的,所述選擇為由客戶端基于本地查詢詞屬性庫選擇。
      優(yōu)選的,所述方法還可以包括發(fā)送查詢詞至搜索服務(wù)器端,由服務(wù)器端同時執(zhí)行 查詢詞分析操作;服務(wù)器端選擇搜索引擎并將選擇的搜索引擎及其權(quán)重返回給客戶端,客 戶端根據(jù)服務(wù)器端選擇的搜索引擎及其權(quán)重對客戶端選擇的搜索引擎的權(quán)重進行調(diào)整。
      優(yōu)選的,所述方法還可以包括客戶端接收服務(wù)器端返回的查詢詞分析的相關(guān)參 數(shù);則所述處理包括利用分析查詢詞得到的相關(guān)參數(shù),通過對搜索結(jié)果數(shù)和/或搜索結(jié)果 的摘要與查詢詞的匹配程度,對搜索結(jié)果進行評估,得到評估分值;如果該評估分值低于預(yù) 設(shè)閾值,則對相應(yīng)搜索引擎的搜索結(jié)果進行降權(quán)或者刪除。
      優(yōu)選的,所述相關(guān)參數(shù)包括查詢詞分詞信息或糾錯信息等。
      優(yōu)選的,所述服務(wù)器端的查詢詞屬性庫通過如下方法建立步驟11,統(tǒng)計查詢詞 或查詢詞類別與搜索引擎的相關(guān)信息;步驟12,根據(jù)步驟11中的統(tǒng)計信息計算出查詢詞或 查詢詞類別與各搜索引擎相關(guān)程度的向量;步驟13,根據(jù)步驟12中的相關(guān)程度向量生成查 詢詞屬性庫。
      優(yōu)選的,所述客戶端查詢詞屬性庫從服務(wù)器端更新得到,其通過提取服務(wù)器端屬 性庫中的關(guān)鍵信息而生成。
      優(yōu)選的,所述步驟11中相關(guān)信息的統(tǒng)計包括以下步驟獲取各搜索引擎的查詢詞 分布數(shù)據(jù);獲取查詢詞在各搜索引擎的點擊分布數(shù)據(jù)。
      優(yōu)選的,所述方法還可以包括收集用戶在當(dāng)前搜索客戶端上,對所展示的搜索結(jié) 果的點擊情況,對查詢詞屬性庫進行修正。
      依據(jù)本發(fā)明的另一實施例,還公開了一種基于查詢詞的搜索裝置,其位于搜索客 戶端,具體可以包括
      第一選擇模塊,用于根據(jù)所獲取的查詢詞,結(jié)合查詢詞屬性庫,從多個搜索引擎中 選擇適合該查詢詞的搜索引擎;所述查詢詞屬性庫用于表征各查詢詞或各查詢詞類別與各 搜索引擎的相關(guān)程度;
      獲取模塊,用于獲取搜索引擎的搜索結(jié)果信息;
      解析展示模塊,用于對搜索結(jié)果處理后進行展示。
      優(yōu)選的,所述裝置還可以包括
      發(fā)送模塊,用于發(fā)送查詢詞至搜索服務(wù)器端;
      接收模塊,用于接收服務(wù)器端執(zhí)行查詢詞分析操作后,所選擇的搜索引擎及其權(quán) 重;
      調(diào)整模塊,用于根據(jù)服務(wù)器端選擇的搜索引擎及其權(quán)重對第一選擇模塊所選擇的 搜索引擎的權(quán)重進行調(diào)整。
      優(yōu)選的,所述接收模塊還用于接收服務(wù)器端返回的查詢詞分析的相關(guān)參數(shù);所述 相關(guān)參數(shù)包括查詢詞分詞信息或糾錯信息等;
      則所述解析展示模塊包括
      解析處理子模塊,用于利用分析查詢詞得到的相關(guān)參數(shù),通過對搜索結(jié)果數(shù)和/ 或搜索結(jié)果的摘要與查詢詞的匹配程度,對搜索結(jié)果進行評估,得到評估分值;如果該評估 分值低于預(yù)設(shè)閾值,則對相應(yīng)搜索引擎的搜索結(jié)果進行降權(quán)或者刪除;
      展示子模塊,用于展示解析處理子模塊排序修正后的搜索結(jié)果。5
      優(yōu)選的,所述第一選擇模塊所依據(jù)的查詢詞屬性庫位于本地客戶端,其通過提取 服務(wù)器端屬性庫中的關(guān)鍵信息而生成。
      優(yōu)選的,所述裝置還可以包括
      反饋模塊,用于收集用戶在當(dāng)前搜索客戶端上,對所展示的搜索結(jié)果的點擊情況, 以對查詢詞屬性庫進行修正。
      與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點
      本發(fā)明的基于查詢詞進行搜索的方法及搜索裝置在有多個搜索引擎的時候,通過 對用戶查詢詞的意圖理解分析,選擇與用戶需求相關(guān)的搜索引擎(或者在用戶意圖方向上 搜索準確性較高的搜索引擎),進行有針對性的鏈接搜索,不僅可以提高系統(tǒng)的效率,更增 加了用戶的搜索準確度。
      此外,由于客戶端計算性能或計算資源等限制,可能影響選擇結(jié)果,所以本發(fā)明優(yōu) 選的,在客戶端與服務(wù)器端兩部分都做選擇,客戶端首先對查詢意圖做判斷,選擇可能的搜 索引擎,服務(wù)器端對查詢詞做進一步的準確分析,將最后的搜索引擎選取結(jié)果,以及查詢詞 的分詞、糾錯等相關(guān)參數(shù),返回給客戶端,客戶端根據(jù)這些信息,對所選搜索引擎的查詢結(jié) 果、查詢意圖相關(guān)程度、以及搜索質(zhì)量做進一步的篩選、排序。這種客戶端與服務(wù)器相結(jié)合 方式,提升了系統(tǒng)性能、降低了對客戶端的要求和對客戶端資源的占用,進一步提高了用戶 的搜索準確度。


      圖1是本發(fā)明的一種基于查詢詞進行搜索的方法實施例一的流程圖2是本發(fā)明的一種基于查詢詞進行搜索的方法實施例一中查詢詞屬性庫的建 立方法實施例的流程圖3是本發(fā)明的一種基于查詢詞進行搜索的方法實施例一中查詢詞屬性庫的建 立方法另一實施例的流程圖4是本發(fā)明的一種基于查詢詞進行搜索的方法實施例二的流程圖5是本發(fā)明的一種基于查詢詞的搜索裝置實施例的示意圖。
      具體實施方式
      為使本發(fā)明的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結(jié)合附圖和具體實 施方式對本發(fā)明作進一步詳細的說明。
      請參照圖1,示出本發(fā)明的基于查詢詞進行搜索的方法實施例一,包括以下步驟
      步驟101,搜索客戶端獲取用戶輸入的查詢詞,結(jié)合查詢詞屬性庫,從多個搜索引 擎中選擇適合該查詢詞的搜索引擎。
      搜索客戶端獲取用戶輸入的查詢詞的方式多種多樣,本發(fā)明僅僅給出以下幾個示 例。例如,當(dāng)用戶在搜索工具欄的搜索框中輸入字符時,在瀏覽器地址欄中輸入中文詞時, 搜索客戶端可以獲取這些字符和中文詞作為查詢詞。
      在技術(shù)實現(xiàn)上,本發(fā)明的搜索客戶端可以作為一個獨立的客戶端軟件(獨立的搜 索入口),對用戶查詢請求進行獲取,也可以在搜索客戶端中集成瀏覽器模塊或者其他應(yīng)用 程序模塊,例如,IManstantMessaging,即時通訊)程序、輸入法程序、甚至文本編輯程序word等),獲取用戶的查詢請求。這樣,便于用戶在使用相關(guān)應(yīng)用時能夠方便的使用本發(fā)明 的搜索功能。
      擴展理解,用戶所使用的客戶端計算機本身也就是本發(fā)明所說的搜索客戶端,本 發(fā)明所強調(diào)的各個步驟都是由該計算機發(fā)起的,即該物理實體也可以理解為本發(fā)明所說的 搜索客戶端。當(dāng)然,為了方便說明,在下面的描述中直接采用搜索客戶端進行說明,并主要 強調(diào)其軟件屬性。
      請參照圖2,查詢詞的屬性庫可以是預(yù)先統(tǒng)計得出,并儲存在搜索客戶端,當(dāng)然,查 詢詞屬性庫也可以直接存儲在服務(wù)器端,由服務(wù)器端自己完成操作后將選擇結(jié)果返回客戶 端即可。
      具體的,在實現(xiàn)中,查詢詞屬性庫可以通過如下方法得出
      步驟1011,統(tǒng)計查詢詞與搜索引擎的相關(guān)信息。
      在具體實現(xiàn)時,可以首先統(tǒng)計獲取各搜索引擎的查詢詞分布數(shù)據(jù),再統(tǒng)計獲取查 詢詞在各搜索引擎的點擊分布數(shù)據(jù),基于這些統(tǒng)計信息就可以計算出各查詢詞與各搜索引 擎相關(guān)程度的向量。
      統(tǒng)計查詢詞與搜索引擎的相關(guān)信息包括,獲取搜索引擎中用戶查詢詞的分布數(shù) 據(jù),例如,用戶在www. taobao. com站內(nèi)搜索或者www. gougou. com等搜索引擎中所搜索的查 詢詞。
      其中,需要說明的是,www. gougou. com本身就是一搜索引擎,而www. taobao. com、 www. skycn. com等是在其站點內(nèi)擁有搜索引擎,在本發(fā)明中為了方便說明,直接采用www. taobao. com, www. skycn. com等表示搜索引擎,在此特別說明。
      同時,還包括獲取在某一特定搜索引擎下,用戶查詢詞與相應(yīng)的搜索引擎或者站 點的點擊日志數(shù)據(jù),例如,用戶在www. sogou. com下查詢“衣服”時,點擊www. taobao. com域 名下面的網(wǎng)頁鏈接的次數(shù)。
      通過上述統(tǒng)計數(shù)據(jù),可以得出每個查詢詞在各目標搜索引擎下的查詢分布統(tǒng)計信 息,以及在特定搜索引擎下的查詢詞與目標搜索引擎或站點下的點擊分布統(tǒng)計信息。
      步驟1012,分析查詢詞與目標搜索引擎的相關(guān)程度。
      根據(jù)以上查詢詞與搜索引擎的分布統(tǒng)計信息,生成每個查詢詞與目標搜索引擎的 向量,向量值表示查詢詞與此搜索引擎的相關(guān)程度。例如,“手機”與搜索引擎“www. taobao. com”的相關(guān)程度向量值為0. 8,則表示為mm. taobao. com#0. 8,“衣服”與搜索引擎“www. taobao. com”的相關(guān)程度向量為0. 9,則表示為www. taobao. com#0. 9。
      步驟1013,建立包含查詢詞與搜索引擎相關(guān)程度向量的查詢詞屬性庫。
      對計算出的每個查詢詞與目標搜索引擎的相關(guān)程度向量值進行匯總,整理為表格 或者其他形式作為查詢詞屬性庫,用于對用戶查詢詞意圖進行分析。查詢詞屬性庫可以直 接存儲在客戶端,當(dāng)用戶在客戶端進行搜索時,則可以首先通過查詢詞屬性庫對查詢詞進 行分析,選取相關(guān)的搜索引擎,進行搜索。
      請參照圖3,考慮客戶端的性能限制,不能負載完整的查詢詞屬性庫,為了保證用 戶查詢的順利,也可以在前述實現(xiàn)方式的基礎(chǔ)上增加步驟1014,提取查詢詞屬性庫中的查 詢詞所包含的實體詞及關(guān)鍵屬性詞,對查詢詞屬性庫做壓縮。壓縮后的查詢詞屬性庫可以 僅包含查詢實體詞及關(guān)鍵屬性詞。例如,“搜狗輸入法免費下載地址”通過實體詞和屬性詞提取后,壓縮為實體詞“搜狗輸入法”和屬性詞“下載”。將壓縮后的查詢詞屬性庫儲存在客 戶端,用于對用戶查詢詞做初步分析,篩選出相關(guān)的搜索引擎。
      這樣可以降低查詢詞屬性庫對客戶端存儲空間的占用,同時在查詢詞分析時也可 以降低對運算性能的要求,提高分析運算速度。
      還需要說明的是,本發(fā)明的查詢詞屬性庫還可以表征查詢詞類別與搜索引擎的相 關(guān)程度,例如,
      IT 類一A 引擎 #0. 9,B 引擎 #0. 8,C 引擎 #0. 6
      服飾類一A引擎#0. 5,B引擎#0. 7,C引擎#0. 9
      百科類一A引擎#0. 7,B引擎#0. 9,C引擎#0. 6
      采用類別相關(guān)度的方法,可以進一步縮小查詢詞屬性庫的空間占用和提高分析運 算速度。當(dāng)然,在本發(fā)明的優(yōu)選實施例中,查詢詞屬性庫也可以同時表征這樣的兩種相關(guān)度 參數(shù)。
      關(guān)于查詢詞類別分析,可以使用人工的方式確定某一個詞屬于哪一個類別(預(yù)設(shè) 詞表),或通過用戶在搜索引擎下的查詢詞與點擊內(nèi)容的關(guān)聯(lián)分析,來得到查詢詞屬于某個 或幾個特定類別。在本發(fā)明的一個優(yōu)選實施例中,具體的查詢詞類別分析過程可以通過服 務(wù)器端運算完成。
      總之,可以通過預(yù)設(shè)詞表的方式,對用戶的查詢詞進行歸類或分類,在此本發(fā)明不 再詳述。
      步驟102,獲取搜索引擎的搜索結(jié)果信息,處理后進行展示。
      簡單的,通過鏈接各個搜索引擎,就可以得到其搜索結(jié)果,進而通過對搜索結(jié)果信 息進行解析、合并濾重或重排序等操作后,將最終確認的搜索結(jié)果展示給用戶。
      具體實現(xiàn)中有很多重排序或者修正搜索結(jié)果的方案,基于實際需要本領(lǐng)域技術(shù)人 員選用即可,本發(fā)明在此不再贅述。
      在前述實施例中,本發(fā)明給出了相關(guān)程度的向量實現(xiàn)方式,實際上,為了從多個搜 索引擎中選擇適合該查詢詞的搜索引擎,可以采用更為簡單的方式。例如,對于查詢詞和搜 索引擎分別進行分類,針對某個查詢詞,選擇與其相同或者相近類別的搜索引擎即可。
      例如,用戶搜索“hp筆記本價格”,由于該查詢詞屬于IT類,則選擇IT類的搜索引 擎即可,當(dāng)然,也可以選擇相近類別的搜索引擎(例如,綜合類別的搜索引擎)。
      在選擇適合該查詢詞的搜索引擎時,通常都會選擇出多個搜索引擎,某個特定情 況下,也可能僅僅選擇出唯一的適合的搜索引擎。也就是說,本發(fā)明對于選擇得到的搜索引 擎的數(shù)量并不需要加以限定。
      請參照圖4,示出本發(fā)明的基于查詢詞進行搜索的方法實施例二,包括以下步驟
      步驟201,搜索客戶端獲取用戶輸入的查詢詞,結(jié)合客戶端的查詢詞屬性庫,從多 個搜索引擎中選擇適合該查詢詞的搜索引擎。此步驟與實施例一中相同,在此不再描述。
      步驟202,將客戶端獲取的查詢詞發(fā)送至搜索服務(wù)器端,由服務(wù)器端同時執(zhí)行查詢 詞分析操作。服務(wù)器端根據(jù)對查詢詞的分析選擇搜索引擎并將選取的搜索引擎及其權(quán)重返 回給客戶端
      步驟203,在服務(wù)器端分析的過程中,客戶端鏈接所選擇的搜索引擎,獲取所需的 搜索結(jié)果。
      步驟204,客戶端根據(jù)服務(wù)器端選擇的搜索引擎及其權(quán)重對客戶端選擇的搜索引 擎的權(quán)重進行調(diào)整;
      步驟205,客戶端接收服務(wù)器端返回的查詢詞分析的相關(guān)參數(shù);所述相關(guān)參數(shù)包 括查詢詞分詞信息或糾錯信息等.
      利用分析查詢詞得到的相關(guān)參數(shù),通過對搜索結(jié)果數(shù)和/或搜索結(jié)果的摘要與查 詢詞的匹配程度,對搜索結(jié)果進行評估,得到評估分值;如果該評估分值低于預(yù)設(shè)閾值,則 對相應(yīng)搜索引擎的搜索結(jié)果進行降權(quán)或者刪除。
      步驟206,根據(jù)調(diào)整后的搜索引擎權(quán)重對搜索結(jié)果進行篩選、排序;對修正后的搜 索結(jié)果進行展示。
      在具體實現(xiàn)中,服務(wù)器端的查詢詞屬性庫可以通過挖掘用戶日志生成完整查詢詞 庫,而客戶端的查詢詞屬性庫可以在服務(wù)器端完整詞表的基礎(chǔ)上,提取實體關(guān)鍵詞、屬性關(guān) 鍵詞生成。它們的數(shù)據(jù)源為同一個,都是用戶查詢?nèi)罩?,但是服?wù)器端的查詢詞屬性庫更完整更完善一些。
      其中,服務(wù)器端分析查詢詞并選擇搜索引擎后,可能出現(xiàn)多種情況
      1、客戶端與服務(wù)器端選擇的搜索引擎相同,若同一搜索引擎,服務(wù)器端的查詢詞 屬性庫中查詢詞與該搜索引擎的相關(guān)程度向量值與客戶端的查詢詞屬性庫中查詢詞與該 搜索引擎相關(guān)程度向量值不同,則根據(jù)服務(wù)器端確定的向量值來改變該搜索引擎的權(quán)重, 根據(jù)改變后的權(quán)重對所有搜索引擎的搜索結(jié)果按照既定的方式進行排序。若兩者相同,則 無需改變搜索引擎的權(quán)重,直接對搜索結(jié)果進行排序。
      2、客戶端與服務(wù)器端選擇的搜索引擎不同,則根據(jù)下述方法調(diào)整
      2. 1、客戶端選擇了 10個搜索引擎,服務(wù)器端選擇了 5個搜索引擎,且服務(wù)器端選 擇的5個搜索引擎屬于客戶端的10個搜索引擎中的??蛻舳藭档头?wù)器端未選擇的5個 搜索引擎的權(quán)重。同時,對于客戶端和服務(wù)器端共同選擇的那5個搜索引擎,若同一搜索引 擎,服務(wù)器端確定的與查詢詞的相關(guān)程度向量值與客戶端確定的與查詢詞的相關(guān)程度向量 值不同,則根據(jù)服務(wù)器端確定的向量值來改變該搜索引擎的權(quán)重,對搜索結(jié)果進行排序。例 如,查詢詞為“短袖襯衫價格”,服務(wù)器計算返回www. taobao. com#0. 9,www. vancl. com#0. 8 其中taobao和vancl是對應(yīng)這個查詢詞服務(wù)器計算與其相關(guān)的外部引擎,0. 9和0. 8標準 各自相關(guān)的權(quán)重信息;客戶端會根據(jù)服務(wù)器所選引擎及其權(quán)重,調(diào)整各引擎結(jié)果的排序;
      2. 2、客戶端選擇選擇了 10個搜索引擎,服務(wù)器端選擇了 5個搜索引擎,服務(wù)器端 選擇的5個搜索引擎屬于客戶端選擇的10個搜索引擎中的。同時,服務(wù)器端還返回了相關(guān) 的參數(shù)給客戶端,返回的參數(shù)包括查詢詞分類、分詞、糾錯等相應(yīng)參數(shù)信息。分類參數(shù)即是 指查詢詞與搜索引擎的相關(guān)程度向量值;分詞參數(shù)是指將將一個長查詢串分離為過更細粒 度的詞的信息,例如,“短袖襯衫價格”,分詞為“短袖”,“襯衫”,“價格”;糾錯參數(shù)是指對用戶 查詢詞中包含的輸入錯誤做糾錯的信息,例如“短袖襯衫架格”糾錯后為“短袖襯衫價格”。 同樣的,客戶端會降低未被服務(wù)器端選取的那5個搜索引擎的權(quán)重,同時,根據(jù)服務(wù)器所選 的搜索引擎及其與查詢詞的相關(guān)程度向量值來改變客戶端之前確定的該搜索引擎的權(quán)重。 另外,客戶端還會根據(jù)服務(wù)器端返回的分詞及糾錯參數(shù)對所選的5個搜索引擎的搜索結(jié)果 進行評估??蛻舳擞梅?wù)器端返回的分詞與客戶端選擇的搜索引擎的搜索結(jié)果的文本進行 比對,計算查詢詞與該搜索結(jié)果之間的相關(guān)性,得出搜索結(jié)果的評估分值,若評估分值低于預(yù)設(shè)閥值,則對相應(yīng)的搜索結(jié)果進行降權(quán)或刪除。
      2. 3、客戶端選擇了 10個,而服務(wù)器端未選擇搜索引擎,只是返回查詢詞分類、分 詞、糾錯等相應(yīng)參數(shù)信息,基于這些參數(shù)信息,客戶端對所選的10個搜索引擎的搜索結(jié)果 進行評估,并根據(jù)評估結(jié)果對搜索結(jié)果進行排序。評估的方法與2. 2中相同。
      通過2. 2及2. 3中采用服務(wù)器端返回的參數(shù)來對搜索結(jié)果重新排序的方法,可以 提高搜索結(jié)果的質(zhì)量,特別是對于某些特殊的情況具有較好的效果。比如搜索結(jié)果匹配 效果不好、引擎故障、網(wǎng)絡(luò)故障等,這些情況會導(dǎo)致所選引擎與用戶實際查詢意圖不相關(guān)、 或搜索結(jié)果質(zhì)量不好等,從而影響搜索的整體效果。為此,對最終選取的搜索引擎的查詢結(jié) 果,利用返回的參數(shù)信息,通過搜索結(jié)果數(shù),整體摘要與查詢詞的文本匹配程度等,對所選 搜索引擎與查詢詞的相關(guān)性、搜索結(jié)果質(zhì)量計算評估分值,用閾值來再次判定是否給出此 搜索引擎的結(jié)果。最后將整體結(jié)果重排序后,展現(xiàn)給用戶。
      下面結(jié)合實例進一步對本發(fā)明的基于查詢詞進行搜索的方法進行詳細說明。
      首先通過一些挖掘方法,獲取用戶查詢詞在各目標搜索引擎或站點的分布比例
      1)獲取在各目標搜索引擎站點下,用戶日常查詢詞。比如,用戶在search, taobao. com、www. gougou. com 等所搜索的查詢詞。
      2)在特定全文搜索引擎下,用戶查詢詞與相應(yīng)點擊日志數(shù)據(jù)。比如,用戶在胃W. sogou. com下查詢“手機”時,點擊過www. taobao. com站點下的網(wǎng)頁鏈接次數(shù)。
      由此生成每個查詢詞對應(yīng)某個目標搜索引擎及相應(yīng)站點域下的分布比例信息。 比如,查詢詞“手機”在搜索引擎A下查詢NA次,在m sogou. com下查詢此詞時點擊 到搜索引擎A下的頁面為MA次。此詞在搜索引擎B下查詢NB次,在www. sogou. com下 查詢此詞時點擊到搜索引擎B下的頁面為MB次。用分布比例信息我們計算出每個查詢 詞與各目標搜索引擎相關(guān)程度向量,得到“手機”與搜索引擎A的相關(guān)程度向量公式為 wl*NA/ (NA+NB) +w2*MA/ (MA+MB),與搜索弓丨擎 B 的相關(guān)程度向量為 wl*NB/ (NA+NB) +w2*MB/ (MA+MB)。其中,wl、w2為不同分布信息來源的權(quán)重。另外,在計算相關(guān)程度向量時,可認為 站點域相同的為同一目標搜索引擎,如search, taobao. com、www. taobao. com的站點域為 taobao. com,則可以認為兩者為同一目標搜索引擎。相關(guān)程度可以根據(jù)實際需要附上不同 的權(quán)重計算,本發(fā)明實施例對此不進行限定。
      通過上述方法,為每個查詢詞生成對應(yīng)于目標搜索引擎的屬性庫,例如下表1
      權(quán)利要求
      1.一種基于查詢詞進行搜索的方法,其特征在于,包括以下步驟搜索客戶端獲取用戶輸入的查詢詞,結(jié)合查詢詞屬性庫,從多個搜索引擎中選擇適合 該查詢詞的搜索引擎;所述查詢詞屬性庫用于表征各查詢詞或各查詢詞類別與各搜索引擎 的相關(guān)程度;獲取所選擇的搜索引擎的搜索結(jié)果信息,處理后進行展示。
      2.如權(quán)利要求1所述的方法,其特征在于,所述選擇為由客戶端基于本地查詢詞屬性 庫選擇。
      3.如權(quán)利要求2所述的方法,其特征在于,所述方法還包括發(fā)送查詢詞至搜索服務(wù)器端,由服務(wù)器端同時執(zhí)行查詢詞分析操作; 服務(wù)器端選擇搜索引擎并將選擇的搜索引擎及其權(quán)重返回給客戶端,客戶端根據(jù)服務(wù) 器端選擇的搜索引擎及其權(quán)重對客戶端選擇的搜索引擎的權(quán)重進行調(diào)整。
      4.如權(quán)利要求1或3所述的方法,其特征在于,所述方法還包括 客戶端接收服務(wù)器端返回的查詢詞分析的相關(guān)參數(shù);則所述處理包括利用分析查詢詞得到的相關(guān)參數(shù),通過對搜索結(jié)果數(shù)和/或搜索結(jié)果的摘要與查詢詞 的匹配程度,對搜索結(jié)果進行評估,得到評估分值;如果該評估分值低于預(yù)設(shè)閾值,則對相應(yīng)搜索引擎的搜索結(jié)果進行降權(quán)或者刪除。
      5.如權(quán)利要求4所述的方法,其特征在于,所述相關(guān)參數(shù)包括查詢詞分詞信息或糾錯fn息等。
      6.如權(quán)利要求4所述的方法,其特征在于,所述服務(wù)器端的查詢詞屬性庫通過如下方法建立步驟11,統(tǒng)計查詢詞或查詢詞類別與搜索引擎的相關(guān)信息;步驟12,根據(jù)步驟11中的統(tǒng)計信息計算出查詢詞或查詢詞類別與各搜索引擎相關(guān)程 度的向量;步驟13,根據(jù)步驟12中的相關(guān)程度向量生成查詢詞屬性庫。
      7.如權(quán)利要求6所述的方法,其特征在于,所述客戶端查詢詞屬性庫從服務(wù)器端更新 得到,其通過提取服務(wù)器端屬性庫中的關(guān)鍵信息而生成。
      8.如權(quán)利要求6所述的方法,其特征在于,所述步驟11中相關(guān)信息的統(tǒng)計包括以下步驟獲取各搜索引擎的查詢詞分布數(shù)據(jù); 獲取查詢詞在各搜索引擎的點擊分布數(shù)據(jù)。
      9.如權(quán)利要求6所述的方法,其特征在于,還包括收集用戶在當(dāng)前搜索客戶端上,對所展示的搜索結(jié)果的點擊情況,對查詢詞屬性庫進 行修正。
      10.一種基于查詢詞的搜索裝置,其特征在于,位于搜索客戶端,包括第一選擇模塊,用于根據(jù)所獲取的查詢詞,結(jié)合查詢詞屬性庫,從多個搜索引擎中選擇 適合該查詢詞的搜索引擎;所述查詢詞屬性庫用于表征各查詢詞或各查詢詞類別與各搜索 引擎的相關(guān)程度;獲取模塊,用于獲取搜索引擎的搜索結(jié)果信息;解析展示模塊,用于對搜索結(jié)果處理后進行展示。
      11.如權(quán)利要求10所述的裝置,其特征在于,所述裝置還包括發(fā)送模塊,用于發(fā)送查詢詞至搜索服務(wù)器端;接收模塊,用于接收服務(wù)器端執(zhí)行查詢詞分析操作后,所選擇的搜索引擎及其權(quán)重;調(diào)整模塊,用于根據(jù)服務(wù)器端選擇的搜索引擎及其權(quán)重對第一選擇模塊所選擇的搜索 引擎的權(quán)重進行調(diào)整。
      12.如權(quán)利要求10所述的裝置,其特征在于,所述接收模塊還用于接收服務(wù)器端返回的查詢詞分析的相關(guān)參數(shù);所述相關(guān)參數(shù)包括 查詢詞分詞信息或糾錯信息等;則所述解析展示模塊包括解析處理子模塊,用于利用分析查詢詞得到的相關(guān)參數(shù),通過對搜索結(jié)果數(shù)和/或搜 索結(jié)果的摘要與查詢詞的匹配程度,對搜索結(jié)果進行評估,得到評估分值;如果該評估分值 低于預(yù)設(shè)閾值,則對相應(yīng)搜索引擎的搜索結(jié)果進行降權(quán)或者刪除;展示子模塊,用于展示解析處理子模塊排序修正后的搜索結(jié)果。
      13.如權(quán)利要求12所述的裝置,其特征在于,所述第一選擇模塊所依據(jù)的查詢詞屬性 庫位于本地客戶端,其通過提取服務(wù)器端屬性庫中的關(guān)鍵信息而生成。
      14.如權(quán)利要求10所述的裝置,其特征在于,所述裝置還包括反饋模塊,用于收集用戶在當(dāng)前搜索客戶端上,對所展示的搜索結(jié)果的點擊情況,以對 查詢詞屬性庫進行修正。
      全文摘要
      本發(fā)明提供了一種基于查詢詞進行搜索的方法和裝置,所述方法包括以下步驟搜索客戶端獲取用戶輸入的查詢詞,結(jié)合查詢詞屬性庫,從多個搜索引擎中選擇適合該查詢詞的搜索引擎;所述查詢詞屬性庫用于表征各查詢詞或各查詢詞類別與各搜索引擎的相關(guān)程度;獲取所選擇的搜索引擎的搜索結(jié)果信息,處理后進行展示。本發(fā)明在有多個搜索引擎的時候,通過對用戶查詢詞的意圖理解分析,選擇與用戶需求相關(guān)的搜索引擎(或者在用戶意圖方向上搜索準確性較高的搜索引擎),進行有針對性的鏈接搜索,不僅可以提高系統(tǒng)的效率,更增加了用戶的搜索準確度。
      文檔編號G06F17/30GK102043833SQ201010559148
      公開日2011年5月4日 申請日期2010年11月25日 優(yōu)先權(quán)日2010年11月25日
      發(fā)明者佟子健, 馮鑫, 吳明達 申請人:北京搜狗科技發(fā)展有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1