国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      文檔搜索系統(tǒng)的制作方法

      文檔序號:6593980閱讀:220來源:國知局
      專利名稱:文檔搜索系統(tǒng)的制作方法
      技術領域
      本發(fā)明涉及文檔搜索系統(tǒng),并且例如涉及用于輔助從海量文檔DB中檢索感興趣 的文檔的文檔搜索系統(tǒng)。
      背景技術
      搜索技術是經(jīng)常運用的強大手段,在這些搜索技術中,通過輸入搜索關鍵詞來進 行搜索以試圖從因特網(wǎng)、內(nèi)部網(wǎng)或者文件服務器上積累的海量文檔DB中找到感興趣的文 檔。經(jīng)常進行因特網(wǎng)搜索以收集關于某個主題的以往發(fā)現(xiàn)和有關信息,針對該主題尚未預 先確定感興趣的特別文檔。因此,用戶猜測可能返回她/他想要的文檔的搜索關鍵詞,并且 在安排輸入它們的方式時重復地進行搜索以找到有用信息。另一方面,對于內(nèi)部網(wǎng)、文件服 務器上或者客戶端PC內(nèi)的搜索,經(jīng)常預先知道存在目標文檔,并且用戶通過給出用于找到 它的關鍵詞來執(zhí)行搜索。例如,如果希望查閱一年前向公司A發(fā)送的提案文檔,則給出“公 司A”、提案內(nèi)容、文檔的發(fā)送者等作為關鍵詞來進行搜索。如今,在公司的審計處理中經(jīng)常進行公司服務器中的文檔搜索。在這種情況下,諸 如審計員、內(nèi)部審計部門等被審計部門以外的人員或者由這樣的外部人員指示或表明的內(nèi) 部人員針對相關文檔執(zhí)行搜索。換句話說,實際執(zhí)行搜索的人經(jīng)常并非相關文檔的創(chuàng)建者, 因此不會立即知道什么種類的文檔在文件服務器上位于何處。另外,如果有多個相關文檔, 則鑒于審計的性質(zhì)將要求無遺漏地找到它們。附帶提一點,在常用的搜索系統(tǒng)中,可能輸入一個搜索關鍵詞或者多個搜索關鍵 詞并且可能包括邏輯運算,比如文檔包含所有這樣的關鍵詞(邏輯乘積或者AND搜索)、包 含它們中的任一個(邏輯和或者OR搜索)、不含它們中的任一個(取非或者NOT搜索)等。 因而可能使其更接近用戶希望得到的目標文檔組。此外,許多搜索系統(tǒng)支持基于邏輯運算 組合(例如包含關鍵詞C和A或B)的高級搜索。另外,關于顯示返回的搜索結(jié)果的列表, 也有除了文件名稱(或者網(wǎng)頁標題)之外并且在兩至三行中還顯示如下文字的搜索系統(tǒng), 該文字包括先于和跟隨搜索關鍵詞的內(nèi)容。然而,當使用這樣的搜索技術來實際檢索有關文檔時出現(xiàn)若干問題。例如,假設審 計員試圖檢索預算文檔,則考慮如下情況,其中在搜索系統(tǒng)上指定關鍵詞“預算”來進行搜 索。這里,如果在審計員希望查閱的文檔中未使用關鍵詞“預算”,而代之以在其中使用比如 “預算/運作圖表(budg. /act. figures) ”或者“商業(yè)計劃”這樣的字詞,則搜索不會返回它 /它們。換句話說,在搜索時,有可能不能提出這樣用于“預算”的同義詞或者涵蓋“預算” 概念的字詞,則將遺漏一些信息。另一方面,假設確實考慮了關鍵詞“預算/運作圖表”和 “商業(yè)計劃”并且拓寬搜索目標范圍以包含“預算”、“預算/運作圖表”和“商業(yè)計劃”中的 任一個,如果呈現(xiàn)數(shù)以千計或者數(shù)以萬計的搜索結(jié)果作為結(jié)果,則可能包括許多用戶并不 感興趣的文檔,并且讓他/她遍歷所有結(jié)果并不實際。也有如下可能性審計員希望查閱的 文檔未使用關鍵詞“預算”、“預算/運作圖表”和“商業(yè)計劃”中的任何一個。換句話說,即 使對于有關文檔的檢索無(或者很少)遺漏,如果在搜索中返回太多文檔,則通過在某種程度上縮減搜索來將它控制至合理數(shù)目也是現(xiàn)實的。反言之,如果在搜索中未返回文檔或者 返回太少文檔,則有必要通過建議可能與用戶輸入的搜索關鍵詞關聯(lián)的關鍵詞來拓寬搜索 可能性。關于這樣選擇搜索關鍵詞的方法,迄今已經(jīng)研究各種技術和方法,這些搜索關鍵 詞可獲得主要包括感興趣的內(nèi)容的合理搜索命中計數(shù)。例如,在專利文獻1中,為了包括更 多感興趣的內(nèi)容,通過向搜索關鍵詞分配屬性來克服當如在“氣候”和“天氣”中那樣具有 相同含義的關鍵詞不同時不能搜索的傳統(tǒng)問題。此外,在專利文獻2中,提供如下裝置,該 裝置查閱與操作者輸入的搜索關鍵詞有關的詞典、考慮關鍵詞的對象和更廣義概念或者更 狹義概念并且自動生成操作者隱含地打算的查詢。對于生成會獲得合理命中計數(shù)的查詢, 專利文獻3和專利文獻4提出如下方案重復搜索關鍵詞的添加、刪除、同義詞擴展等,由此 相繼地顯示由相應的查詢獲得的命中計數(shù)。這些方案不僅顯示查詢,而且針對查詢中包含 的每個搜索關鍵詞顯示搜索結(jié)果中有多少命中。此外,專利文獻5提出如下方案當選擇將 針對其搜索有關文檔的文檔時,自動生成在被動態(tài)更改時會獲得與預定義參考命中數(shù)目最 接近的命中計數(shù)的查詢。專利文獻1 日本專利公開(Kokai)號6_187374A(1994)專利文獻2 日本專利公開(Kokai)號5-25041IA (1993)專利文獻3 日本專利公開(Kokai)號5-314182A (1993)專利文獻4 日本專利公開(Kokai)號11_15841A(1999)專利文獻5 日本專利公開(Kokai)號2005-100136A專利文獻6 日本專利公開(Kokai)號2006-12078A

      發(fā)明內(nèi)容
      本發(fā)明所要解決的問題然而,就專利文獻1至專利文獻4的技術而言,由于在查閱搜索命中計數(shù)時以及基 于用戶輸入的搜索關鍵詞和邏輯運算生成了適當查詢,所以盡管它們在用戶具有清楚的搜 索意圖以及關于將通過查詢而獲得的搜索結(jié)果預先具有立體影像的情況下有效,但是它們 不能解決未清楚定義待搜索的目標的情況或者她/他不能提出表示她/他希望搜索的內(nèi)容 的適當關鍵詞的情況。例如,在審計中,如果需要關于人力資源開發(fā)的活動報告,則將難以 猜測應當用什么種類的搜索關鍵詞進行搜索。在這一情況下,將難以使用搜索關鍵詞“人力 資源開發(fā)”來找到尋求的內(nèi)容,而代之以“教育”或者“在崗培訓”可能更可取。對于這樣的 模糊目標,由于具體關鍵詞未知,所以難以用傳統(tǒng)技術來檢索有關文檔。此外,就專利文獻3和4而言,雖然在創(chuàng)建查詢的過程中產(chǎn)生針對搜索關鍵詞的建 議(比如替換為同義詞等)以讓用戶更容易縮減目標,但是仍然不可能具體知道這樣的候 選關鍵詞之間的關系。例如,在專利文獻3中示出在包含關鍵詞“信息”(在專利文獻3中 記為“ joho”)的20,568篇文檔中有包含“搜索”的9,321篇文檔和包含“介質(zhì)”的7,566 篇文檔。然而,在使用這一方案時,在執(zhí)行搜索之前不能知道例如在包含“搜索”的文檔集 合與包含“介質(zhì)”的文檔集合之間有多少重疊。為了知道這一點,必須通過針對“信息”、“搜 索”和“介質(zhì)”進行AND搜索來發(fā)現(xiàn)命中計數(shù)。圖1示出使用專利文獻3來檢查這些關鍵詞之間的關系的情況的例子。如果在針對“信息AND搜索”和“介質(zhì)”的AND搜索中有針對“介質(zhì)”的7,566個命中,則能夠斷定當 使用“介質(zhì)”時總是使用“信息”和“搜索”。換句話說,能夠斷定“介質(zhì)”和“信息或搜索”是 具有類似印象的概念。反言之,如果有0個命中,則能夠斷定“介質(zhì)”和“搜索”是用于沖突 概念的關鍵詞。由于不知道這樣的相互關系,所以通常有必要在縮減搜索目標時重復地添 加或者刪除搜索關鍵詞。利用傳統(tǒng)技術無法預先知道這樣的定量發(fā)現(xiàn)(有多少命中)和定 性發(fā)現(xiàn)(存在什么種類的關鍵詞的文檔組和有什么種類的趨勢)。此外,就專利文獻5而言,雖然可以用接近預定義的命中計數(shù)的方式自動構造查 詢,但是用戶無法一開始就知道什么可以視為從命中總計數(shù)縮減至的合理數(shù)目。例如,可以 指定100作為待查閱的有關文檔的數(shù)目,但是那些文檔中的僅10篇文檔在一些情況下對 于用戶而言可能就足夠了,而在其他情況下有關文檔中除非有300篇才可能視為被完全覆蓋。本發(fā)明是鑒于上述問題而作出的,并且提供一種能夠在使用搜索系統(tǒng)來檢索有關 文檔時有效和直觀地檢索想要的文檔的文檔搜索系統(tǒng)。用于解決問題的手段本發(fā)明的一種文檔搜索系統(tǒng)與搜索結(jié)果列表的顯示一起呈現(xiàn)新查詢候選和用該 查詢返回的命中計數(shù)。換句話說,本發(fā)明的一種文檔搜索系統(tǒng)基于搜索關鍵詞從其中積累待搜索的文檔 的文檔DB之中找到包含搜索關鍵詞的文檔,該文檔搜索系統(tǒng)包括有關字詞字典,其中收 集搜索關鍵詞的有關字詞;有關字詞查詢生成處理部分,被配置成從有關字詞字典中提取 在已經(jīng)輸入的第一查詢中包含的搜索關鍵詞的有關字詞并使用有關字詞生成作為新查詢 的第二查詢;搜索執(zhí)行部分,被配置成計算針對用第一查詢返回的搜索結(jié)果的命中計數(shù)與 針對用第二查詢返回的搜索結(jié)果的命中計數(shù)之間的增加/減少;以及搜索結(jié)果顯示處理部 分,被配置成在顯示部分上同時顯示第一查詢、用第一查詢返回的搜索結(jié)果、針對所述搜索 結(jié)果的命中計數(shù)、第二查詢、針對用第二查詢返回的搜索結(jié)果的命中計數(shù)、以及所述增加/ 減少。在上述情況下,該文檔搜索系統(tǒng)還可以包括維恩圖繪制處理部分,被配置成在顯 示部分上以及在維恩圖中顯示用第一查詢返回的搜索結(jié)果與用第二查詢返回的搜索結(jié)果 之間的相互關系。此外,根據(jù)本發(fā)明的一種文檔搜索系統(tǒng)基于搜索關鍵詞從其中積累將作為搜索目 標的文檔的文檔DB之中找到包含搜索關鍵詞的文檔,該文檔搜索系統(tǒng)包括關聯(lián)關鍵詞查 詢生成處理部分,被配置成使用在針對已經(jīng)輸入的第一查詢的搜索結(jié)果中頻繁出現(xiàn)的頻繁 出現(xiàn)關鍵詞來生成作為新查詢的第二查詢;搜索執(zhí)行部分,被配置成計算針對用第一查詢 返回的搜索結(jié)果的命中計數(shù)與針對用第二查詢返回的搜索結(jié)果的命中計數(shù)之間的增加/ 減少;以及搜索結(jié)果顯示處理部分,被配置成在顯示部分上同時顯示第一查詢;用第一查 詢返回的搜索結(jié)果;針對所述搜索結(jié)果的命中計數(shù);第二查詢;針對用第二查詢返回的搜 索結(jié)果的命中計數(shù);以及所述增加/減少。在上述情況下,該文檔搜索系統(tǒng)還可以包括維恩圖繪制處理部分,被配置成在顯 示部分上以及在維恩圖中顯示用第一查詢返回的搜索結(jié)果與用第二查詢返回的搜索結(jié)果 之間的相互關系。
      此外,本發(fā)明的一種文檔搜索系統(tǒng)基于搜索關鍵詞從其中積累將作為搜索目標的 文檔的文檔DB之中找到包含搜索關鍵詞的文檔,該文檔搜索系統(tǒng)包括部分查詢生成處理 部分,被配置成通過省略在已經(jīng)輸入的第一查詢中包含的多個搜索關鍵詞的部分來生成作 為新查詢的第二查詢;搜索執(zhí)行部分,被配置成計算針對用第一查詢返回的搜索結(jié)果的命 中計數(shù)與針對用第二查詢返回的搜索結(jié)果的命中計數(shù)之間的增加/減少;以及搜索結(jié)果顯 示處理部分,被配置成在顯示部分上同時顯示第一查詢;用第一查詢返回的搜索結(jié)果;針 對所述搜索結(jié)果的命中計數(shù);第二查詢;針對用第二查詢返回的搜索結(jié)果的命中計數(shù);以 及所述增加/減少。在上述情況下,該文檔搜索系統(tǒng)還可以包括維恩圖繪制處理部分,被配置成在顯 示部分上以及在維恩圖中顯示用第一查詢返回的搜索結(jié)果與用第二查詢返回的搜索結(jié)果 之間的相互關系。另外,在上述文檔搜索系統(tǒng)中,如果搜索執(zhí)行部分確定在用第二查詢返回的搜索 結(jié)果中包含與用第一查詢返回的搜索結(jié)果不同的新搜索結(jié)果,則搜索結(jié)果顯示處理部分在 顯示用第二查詢返回的搜索結(jié)果時在顯示部分上著重顯示新搜索結(jié)果。本發(fā)明的效果根據(jù)本發(fā)明的一種搜索系統(tǒng),在檢索有關文檔時,通過與顯示搜索結(jié)果列表一起 呈現(xiàn)用于下一查詢的候選和用該查詢返回的命中計數(shù),用戶能夠有效和直觀地檢索想要的 文檔。


      圖1是示出搜索關鍵詞之間關系的圖;圖2是根據(jù)本發(fā)明實施例的搜索系統(tǒng)的示意圖;圖3是有關字詞字典的數(shù)據(jù)結(jié)構的一個例子;圖4是示出本發(fā)明的處理流程的流程圖;圖5是本發(fā)明的搜索系統(tǒng)的初始屏幕的例子;圖6是呈現(xiàn)搜索結(jié)果列表和使用有關字詞的查詢候選列表的顯示的屏幕的例子。圖7是呈現(xiàn)搜索結(jié)果列表和使用搜索結(jié)果中的頻繁出現(xiàn)關鍵詞的查詢候選列表 的顯示的屏幕的例子;圖8是呈現(xiàn)搜索結(jié)果列表和通過省略搜索關鍵詞而創(chuàng)建的查詢候選列表的顯示 的屏幕的例子。
      具體實施例方式下文參照附圖描述根據(jù)本發(fā)明實施例的一種文檔搜索系統(tǒng)。應注意本實施例僅為 用于實現(xiàn)本發(fā)明的例子而不以任何方式限制本發(fā)明的技術范圍。<文檔搜索系統(tǒng)配置>圖2是示意性地示出作為本發(fā)明實施例而構建的文檔搜索系統(tǒng)的內(nèi)部結(jié)構的配 置圖。這一系統(tǒng)包括文檔DB 201,其中積累待搜索的文檔;文檔索引202,其中積累文檔的 索引信息;有關字詞字典203,其中收集有關字詞之間的關系;顯示設備204,用于顯示搜索 結(jié)果、查詢候選等;鍵盤205和諸如鼠標等指示設備206,用于輸入搜索關鍵詞以及進行諸
      7如從菜單中選擇等操作;中央處理單元207,被配置成進行必要算法處理、控制處理等;以 及存儲器214,用于暫時存儲搜索結(jié)果。這里,如在因特網(wǎng)上的網(wǎng)絡文檔全集中一樣,文檔 DB 201也覆蓋其實例位于網(wǎng)絡上的文檔。另外,文檔DB 201還覆蓋其作為DB的實例并非 物理上為單數(shù)而代之以復數(shù)的情況。文檔索引202用于根據(jù)輸入的查詢來快速找到想要的 文檔,并且其具體形式包括詞素與文檔DB 201內(nèi)的實際文檔之間的關聯(lián)(在基于詞素分析 的搜索算法的情況下)和N個字符的字符串與文檔DB 201內(nèi)的實際文檔之間的關聯(lián)(在 基于N-gram的搜索算法的情況下)。在執(zhí)行搜索時,使用文檔索引202來找到與查詢匹配 的文檔,并且針對搜索結(jié)果在顯示屏幕上進行與實際文檔的關聯(lián)。文檔DB 201、文檔索引 202和有關字詞字典203可以存在于本地PC內(nèi)以及網(wǎng)絡上?!粗醒胩幚韱卧渲谩抵醒胩幚韱卧?07包括搜索執(zhí)行部分208,被配置成根據(jù)輸入的查詢使用文檔索 引202來執(zhí)行搜索;搜索結(jié)果顯示處理部分209,被配置成顯示搜索結(jié)果立標和用于調(diào)節(jié)搜 索目標的查詢候選;有關字詞查詢生成處理部分210,被配置成使用查詢中包含的關鍵詞 的有關字詞來生成查詢;關聯(lián)關鍵詞查詢生成處理部分211,被配置成使用搜索結(jié)果中的 文檔組中頻繁包含的字詞來生成查詢;部分查詢生成處理部分212,被配置成如果查詢包 括多個關鍵詞則通過省略一個或者多個關鍵詞來重新生成查詢;以及維恩圖繪制處理部分 213,被配置成在維恩圖中顯示搜索結(jié)果之間的關系。另外,可以通過存儲于諸如CD-ROM、 DVD-ROM、M0、軟盤(注冊商標)、USB存儲器等記錄介質(zhì)上來提供上述處理部分和執(zhí)行部分 以及在上述處理部分和執(zhí)行部分中使用的程序、數(shù)據(jù)等。<有關字詞字典配置>圖3是有關字詞字典203中包含的數(shù)據(jù)的例子。所述數(shù)據(jù)包括成對的關鍵詞301 和有關字詞302,有關字詞302中聚集與關鍵詞有關的術語。假設根據(jù)搜索系統(tǒng)的目標來定 義有關字詞。通常,這些有關字詞可包括同義詞(比如用于在303所示的關鍵詞“文章”的 “文檔”)以及全稱或者縮略詞(比如用于在304所示的關鍵詞“第1設計分部”的“ABC商 業(yè)部第1設計分部”或者“分部1,,)。其他有關字詞包括年份的不同符號表示(比如用于 在305所示的關鍵詞“2007年”的“Heisei 19”或者“H19”)、符號表示變化(比如在306 所示的打字錯誤或拼寫錯誤,用于關鍵詞“中心(center)”的“中心(centre)”)等等。另 外,還包括并非同義、但是強有關的字詞(比如用于在307所示的關鍵詞“人力資源開發(fā)”的 “教育”、“在崗培訓”和“離崗培訓”)以及具有相互包括關系的字詞(更廣義/更狹義概念 的字詞)(比如用于在308所示的關鍵詞“東京”的“Kanto地區(qū)”,以及用于在309所示的 關鍵詞“肉類”的“牛肉”、“豬肉”、“雞肉”等)。使用因特網(wǎng)上的詞典作為這一有關字詞字 典的實施例也是可能的。<文檔搜索過程>接下來,參照圖4描述在以上述方式配置的本實施例的文檔搜索系統(tǒng)中進行的處 理。圖4是示意性地示出文檔搜索系統(tǒng)的處理流程的流程圖。在步驟401中,搜索執(zhí)行部分208接受用戶選擇的查詢生成方法。查詢生成方法 是指本搜索系統(tǒng)用以生成“用于根據(jù)搜索結(jié)果進一步縮減(或者更改)搜索目標的查詢候 選”的方法,并且根據(jù)基于什么種類的信息來生成它,有以下三種方法。第一種是使用關于 有關字詞的信息來生成查詢的方法;第二種是使用在搜索結(jié)果中的文檔組之中頻繁出現(xiàn)的
      8關鍵詞來生成查詢的方法;而第三種是通過省略查詢中的部分關鍵詞來重新生成查詢的方 法。后文將參照圖5提供對在用戶選擇查詢生成方法時用作接口的屏幕顯示的描述。在步驟402中,搜索執(zhí)行部分208根據(jù)用戶輸入到本系統(tǒng)中的查詢S使用文檔索 引202來執(zhí)行搜索。在這一點,如果必要則可以在執(zhí)行搜索之前進行預處理,比如分詞、刪 除虛詞等,在分詞過程中,使用詞素分析在查詢S中包含的字詞之間插入空格。另外,如果 用英文編寫查詢S,則進行諸如刪除介詞和連詞等預處理。在下面的步驟403-407中,針對 上文討論的三種查詢生成方法的每種情況說明如何生成用于縮減(或者更改)搜索目標的 新查詢R的候選。在步驟403和404中,如果搜索執(zhí)行部分208在步驟401中接受使用有關字詞來 生成查詢的方法,則有關字詞查詢生成處理部分210通過查閱有關字詞字典203針對在步 驟402中輸入的查詢S中包含的每個搜索關鍵詞檢查是否有有關字詞。如果有有關字詞, 則通過用邏輯運算符(AND或者OR)級聯(lián)關鍵詞及其有關字詞來重新生成查詢R。例如,如 果查詢S為“X AND Y”,并且有作為關鍵詞X的有關字詞的Z,則查詢R可為“(X AND Ζ) AND Y”、“(X OR Ζ) AND Y”和“Ζ AND Y”??商孢x地,如果在查詢S中包含的關鍵詞僅為“X”,并 且有作為關鍵詞X的有關字詞的Z,則查詢R可為“Z”、“X AND Ζ”和“X OR Ζ”。通過這樣 合并邏輯運算來列舉用于所有情況的查詢R。如果無有關字詞,或者如果有有關字詞、但是 在查詢中包含該有關字詞(例如,如果查詢S為“X AND Y”,而Y為關鍵詞X的有關字詞), 則不進行任何操作,因為不能生成基于有關字詞的查詢R。在步驟405和406中,如果搜索執(zhí)行部分208在步驟401中接受用于使用在搜索 結(jié)果中的文檔組之中出現(xiàn)的頻繁出現(xiàn)關鍵詞來生成查詢的方法,則關聯(lián)關鍵詞查詢生成處 理部分211提取在步驟402中執(zhí)行的搜索的結(jié)果中的文檔組之中頻繁出現(xiàn)的關鍵詞。如果 在這一點提取的頻繁出現(xiàn)關鍵詞之中有在查詢S中包含的關鍵詞,則將其省略。使用從搜 索結(jié)果中的文檔組之中提取的特征關鍵詞的搜索稱為“關聯(lián)搜索”并且也運用于本實施例 中。例如,正如在專利文獻6中運用的關聯(lián)搜索技術一樣,在本發(fā)明中,使用文檔索引202 來提取在搜索結(jié)果中的文檔之中使用的特征關鍵詞,并且用它進行搜索。關聯(lián)關鍵詞查詢 生成處理部分211通過使用邏輯運算符級聯(lián)通過關聯(lián)搜索提取的關鍵詞與查詢S來重新生 成查詢R。如果有許多頻繁出現(xiàn)關鍵詞,則也可想到將根據(jù)其出現(xiàn)頻率而選擇的特定數(shù)目的 靠前關鍵詞與查詢S級聯(lián)的使用。在步驟407中,如果搜索執(zhí)行部分208在步驟401中接受用于通過省略關鍵詞來 生成查詢的方法,則部分查詢生成處理部分212生成如下形式的查詢R,其中省略查詢S中 包含的多個關鍵詞中的一些關鍵詞。這里,作為待省略的關鍵詞,覆蓋出現(xiàn)于查詢S中的所 有關鍵詞之間的所有組合。以使得由于省略了省略關鍵詞,所以查詢R的搜索條件會獲得 比用查詢S的搜索條件更廣的搜索范圍(搜索命中計數(shù)增加)的方式配置查詢R。具體而 言,如果用AND和OR連接關鍵詞,則省略AND和關鍵詞,而如果僅用AND (或者僅用OR)連 接關鍵詞,則省略AND (或者OR)和關鍵詞。例如,如果查詢S為“X AND Y OR Z”,則查詢 R可為“Y OR Z”(其中省略了 X)、“X OR Ζ”(其中省略了 Y)、“X ANDY”(其中省略了 Ζ)、 “X”(其中省略了 Y和Z)、“Y”(其中省略了 X和Z)和“Ζ”(其中省略了 X和Y)。如果查 詢S僅包含一個關鍵詞,則不進行任何操作,因為不能生成查詢R。如果搜索執(zhí)行部分208在上文提到的步驟404、406或者407中確定不能生成查詢R,則處理從步驟408繼續(xù)步驟409。在步驟409中,搜索結(jié)果顯示處理部分209顯示在步驟 402中執(zhí)行的搜索的結(jié)果。隨后,處理繼續(xù)將在后文描述的步驟416。另一方面,如果有關字詞查詢生成處理部分210、關聯(lián)關鍵詞查詢生成處理部分 211或者部分查詢生成處理部分212在上文提到的步驟404、406或者407中生成查詢R,則 處理從步驟408繼續(xù)步驟410。在步驟410中,搜索執(zhí)行部分208根據(jù)該查詢R來執(zhí)行搜 索。在步驟411中,搜索執(zhí)行部分208計算針對查詢R的命中計數(shù)以及在比較針對查 詢R的命中計數(shù)與針對查詢S的命中計數(shù)時的增加/減少。在步驟412中,基于上述信息,搜索結(jié)果顯示處理部分209顯示針對查詢S的搜索 結(jié)果、查詢R以及用該查詢返回的命中計數(shù)、和在比較針對查詢R的命中計數(shù)與針對查詢 S的命中計數(shù)時的增加/減少。在以列表顯示針對查詢S的搜索結(jié)果時,以文檔的重要性 為序來顯示它們。對于用于確定這一顯示順序的算法,已知有TF-IDF,該算法以文檔和查 詢作為包括術語全集的矢量并基于矢量之間的相似度來進行確定;頁面排行(PageRank), 該算法使用網(wǎng)頁的鏈接結(jié)構來測量流行度;主題特有流行度和命中(Subject-Specific Popularity and HITS),這些算法是上述頁面排行的改進;塊級鏈接分析(Block-level Link Analysis),該算法基于頁面內(nèi)的有意義塊之間的鏈接而不是頁面之間的鏈接結(jié)構來 計算重要性;基于視覺的分頁算法(Vision-based Page Segmentation Algorithm),該算 法考慮重要內(nèi)容在頁面內(nèi)的位置;等等。在步驟413中,維恩圖繪制處理部分213借助于維恩圖來示出用查詢R返回的搜 索結(jié)果之間的關系。在維恩圖中,示出反映命中計數(shù)的分區(qū)區(qū)域,并且在每個分區(qū)中顯示搜 索結(jié)果的數(shù)目。顯示維恩圖的方法可以根據(jù)搜索執(zhí)行部分208在步驟401中接受哪種查詢 生成方法來分類成以下三種。(1)如果接受使用有關字詞來生成查詢的查詢生成方法,則以 使得可以理解每個有關字詞的搜索結(jié)果的差異的方式進行繪制。具體而言,如果查詢S包 含具有有關字詞的搜索關鍵詞,則在圖中示出針對其中已經(jīng)從查詢S中省略搜索關鍵詞的 查詢的搜索結(jié)果集合、針對搜索關鍵詞的搜索結(jié)果集合和針對搜索關鍵詞的有關字詞的搜 索結(jié)果集合之間的相互關系。例如,如果查詢S為“K AND X AND Y”、具有有關字詞的搜索 關鍵詞為“K”,有關字詞為“K' ”,則通過維恩圖示出針對查詢“XAND Y”、“K”和“K' ”的搜索結(jié)果之間的關系。另外,如果查詢S包括單個關鍵詞 “K”且有用于關鍵詞“K”的有關字詞“K' ”,則{針對在從查詢S中省略搜索關鍵詞時的搜 索結(jié)果}將是不可定義的。在這一情況下,在維恩圖中示出在關鍵詞“K”與“K' ”之間的 關系。(2)如果接受使用在搜索結(jié)果中的文檔組中出現(xiàn)的頻繁出現(xiàn)關鍵詞來生成查詢的 查詢生成方法,則以使得可以理解使用頻繁出現(xiàn)關鍵詞的搜索會如何影響搜索結(jié)果(可以 如何縮減搜索目標)的方式進行繪制。具體而言,示出針對查詢S的搜索結(jié)果集合與針對 在用頻繁出現(xiàn)關鍵詞進行搜索時的搜索結(jié)果集合之間的關系。(3)如果接受通過省略查詢中的部分關鍵詞來生成查詢的查詢生成方法,則示出 原查詢s與其中已經(jīng)省略查詢S中的部分關鍵詞的查詢R之間的關系。此外,當Al.....An為有限集時,通過組合以下容斥原理[等式1]「00621 Ckl= - ΣΙ為 η ΣΙ 々門Aj η 々卜·. ^A1 η 々‘.η 41與德摩根定律:[等式2]
      NN
      m i=\=有可能遞歸地計算每個分區(qū)中的搜索結(jié)果的數(shù)目。這里,令|A|表示集合A的元素數(shù)目(基數(shù)),A U B表示“A OR B”,A Π B表示 "AAND B”,并且[等式3]2表示‘‘NOT A”。此外,一般而言,維恩圖經(jīng)常表示三個類別之間的關系。然而,無論該關系涉及 到的類別數(shù)目如何,維恩圖都能夠表示(參閱=Frank Ruskey, Carla D. Savage, and Stan Wagon, "The Search for Simple Symmetric Venn Diagrams,,,Notices of the AMS 53(11) :1304-1311) 0然而,由于該圖在表示大量類別之間的關系時變得復雜,所以也可想 到如下使用模式,其中例如如后文描述的圖6中所示,根據(jù)用戶對顯示項目的選擇來表示 類別之間的關系等等。在步驟414和415中,如果已經(jīng)看見在步驟412中顯示的查詢R的用戶請求顯示 使用該查詢R的搜索結(jié)果,則搜索執(zhí)行部分208將查詢S替換為用戶選擇的查詢R,并且從 步驟403繼續(xù)處理。在這一點,針對新查詢S的搜索結(jié)果可為在步驟410中返回的搜索結(jié) 果。此外,也可想到如下使用模式,其中在第二次或者隨后執(zhí)行的步驟412中顯示搜索結(jié)果 列表時,著重顯示新添加的搜索結(jié)果的文檔以突出差異。在步驟416和417中,如果用戶編輯查詢S以便用新查詢重新執(zhí)行,則搜索執(zhí)行部 分208根據(jù)編輯的查詢來執(zhí)行搜索。當編輯的查詢重新取為S時,在回到步驟403時繼續(xù) 處理。另外,如果用戶未編輯查詢S以便重新執(zhí)行搜索,則終止處理。<文檔搜索系統(tǒng)的初始屏幕顯示例子>圖5是示出本系統(tǒng)的初始屏幕顯示例子的圖。在初始屏幕上,有用于輸入查詢的 查詢輸入文本框501和用于針對搜索結(jié)果縮減(或者更改)搜索目標的查詢生成方法選擇 菜單502。利用查詢生成方法選擇菜單502使得有可能使用單選按鈕從以下三種方法中選 擇(圖4中的步驟401)基于有關字詞的生成方法;使用在搜索結(jié)果中的文檔組中出現(xiàn)的 頻繁出現(xiàn)關鍵詞的生成方法;以及通過省略查詢中的部分關鍵詞的生成方法。一旦用戶輸 入這些項目或者設置并且按下搜索執(zhí)行按鈕503,就開始搜索(圖4中的步驟40 。下文 以如下例子提供描述,其中針對關于人力資源開發(fā)的活動報告從文檔DB 201中檢索文檔。<使用有關字詞的搜索結(jié)果的屏幕顯示例子>圖6示出由于按下圖5中的搜索執(zhí)行按鈕503而出現(xiàn)的搜索結(jié)果列表和使用有關 字詞的查詢候選列表的屏幕顯示例子。在搜索結(jié)果列表窗格601中顯示查詢和命中計數(shù),并且在其下面顯示搜索結(jié)果列表。在搜索返回的每個文檔的標題附近顯示包含搜索關鍵詞的文檔中的文字。用戶查看這 些標題和文字以確定搜索結(jié)果是否是用戶所希望的。在查詢候選顯示窗格602中顯示用于調(diào)節(jié)搜索目標的查詢列表。在這一窗格602 的上部中的查詢生成方法菜單603中顯示根據(jù)哪個標準生成查詢。對于根據(jù)圖6中的有關 字詞標準的查詢生成,在菜單603下面顯示與輸入的查詢有關的術語列表。換句話說,如果 在有關字詞字典203中登記輸入的查詢中包含的搜索關鍵詞作為關鍵詞301,則顯示對應 的有關字詞302。另外,顯示使用這樣的有關字詞的新查詢列表、針對用新查詢返回的搜索 結(jié)果的命中計數(shù)和通過比較針對每個新查詢的搜索結(jié)果的命中計數(shù)與針對原查詢的搜索 結(jié)果的命中計數(shù)而計算的增加/減少。一旦用戶按下位于每個查詢附近的搜索執(zhí)行按鈕 604,就基于對應的查詢來執(zhí)行搜索。在維恩圖顯示窗格605中的維恩圖中顯示針對用戶輸入的查詢的搜索結(jié)果的命 中計數(shù)與針對在查詢候選顯示窗格602中呈現(xiàn)的有關字詞的搜索結(jié)果的命中計數(shù)之間的 相互關系。在維恩圖中的文檔集合是針對用戶在有關字詞選擇菜單606中選擇的關鍵詞的 搜索結(jié)果。在這一菜單606中顯示根據(jù)用戶輸入的查詢而獲得的有關字詞列表、它們的相 應命中計數(shù)和復選框。針對與用戶選中其復選框的關鍵詞對應的搜索結(jié)果進行維恩圖顯 示。如維恩圖顯示窗格605所示,在每個分區(qū)中顯示命中計數(shù)。例如,由于針對“人力資源 開發(fā)AND教育”有2個命中、針對“教育”有2,142個命中以及針對“人力資源開發(fā)”有12 個命中,所以顯示在“教育”與“人力資源開發(fā)”之間的重疊分區(qū)中有2個命中。另外,僅針 對與用虛線或者實線包圍的每個分區(qū)有關的部分顯示命中計數(shù)。例如,在針對“人力資源開 發(fā)”的所有12個命中之中顯示在與“教育”重疊的分區(qū)中有2個命中而在其余分區(qū)中有10 個命中。在查詢輸入窗格607中有查詢輸入文本框608和用于執(zhí)行文本框608中的查詢的 搜索執(zhí)行按鈕609。也可想到如下使用模式,其中一旦用戶在維恩圖顯示窗格605中選擇維 恩圖顯示中的給定分區(qū),就在查詢輸入文本框608中自動輸入可提取該所選分區(qū)的部分的 查詢。此外,如果用戶確定關于搜索目標的搜索關鍵詞并不恰當,并且希望改寫查詢或者輸 入新查詢,則在查詢輸入文本框608中重新輸入不同的查詢并執(zhí)行該不同的查詢。通過這樣的發(fā)明,由于即使用戶并不知道與搜索關鍵詞有關的有關字詞(或者即 使她/他不能想到任何有關字詞),也自動呈現(xiàn)使用有關字詞的查詢(第二查詢),所以用 戶能夠檢索她/他希望的文檔組而遺漏甚少。另外,由于同時顯示針對用第二查詢進行的搜索的命中計數(shù)以及在比較第二查詢 與原查詢(第一查詢)時的命中計數(shù)的增加/減少,所以用戶能夠作出以適當數(shù)目檢索文 檔的決定。例如,假設用戶實際能夠查看的搜索結(jié)果的數(shù)目為數(shù)十個命中至一百個命中,則 用戶能夠作出諸如“由于添加這一搜索關鍵詞導致一千個或者更多命中,所以需要考慮不 同的關鍵詞”、“由于添加這一搜索關鍵詞僅將命中計數(shù)增加三個,所以可以承受添加它”等 決定。另外,當向該查詢添加第一查詢中包含的搜索關鍵詞的有關字詞時,可以在執(zhí)行 搜索之前確認搜索結(jié)果的趨勢和特征。換句話說,可以容易地確定接著應當用什么種類的 有關字詞執(zhí)行搜索。例如,在圖6的情況下,可以看出針對“人力資源開發(fā)”的關鍵詞搜索 返回很少結(jié)果、關于人力資源開發(fā)活動可能在針對“教育”的搜索結(jié)果中有許多有關文檔、在針對“教育”的搜索結(jié)果中包括大量文檔等等。另外,通過維恩圖顯示,有可能掌握搜索關鍵詞之間和搜索關鍵詞與有關字詞之 間的關系,并且可視地理解適當?shù)年P鍵詞組合以及這樣組合的查詢所返回的命中計數(shù)。<使用頻繁出現(xiàn)關鍵詞的搜索結(jié)果的屏幕顯示例子>圖7示出搜索結(jié)果列表和基于搜索結(jié)果中的頻繁出現(xiàn)關鍵詞的查詢候選列表的 屏幕顯示例子。其示出如下屏幕,其中在圖6中的查詢生成方法菜單603中選擇了“使用在 搜索結(jié)果中的文檔組中出現(xiàn)的頻繁出現(xiàn)關鍵詞生成”,并且已經(jīng)針對查詢用“人力資源開發(fā) OR教育”執(zhí)行了搜索。如圖6中那樣,在搜索結(jié)果列表窗格701中顯示查詢和命中計數(shù),并且在其下面顯 示針對新查詢“人力資源開發(fā)OR教育”的搜索結(jié)果列表。著重顯示了新添加到先前搜索結(jié) 果中的文檔(在圖7中用星形標示的部分)。通過這樣的發(fā)明,用戶能夠直接理解添加了什 么種類的文檔,并且能夠容易看見第二查詢的效果。在查詢候選顯示窗格702中顯示用于調(diào)節(jié)搜索目標的查詢候選列表。這里,已經(jīng) 在查詢生成方法菜單703中選擇了將使用在搜索結(jié)果中的文檔組中出現(xiàn)的頻繁出現(xiàn)關鍵 詞來進行生成。另外,在查詢生成方法菜單703下面呈現(xiàn)在實際搜索結(jié)果中出現(xiàn)的頻繁出 現(xiàn)關鍵詞。如圖6中那樣,在維恩圖顯示窗格704中通過維恩圖表示針對用戶輸入的查詢的 搜索結(jié)果的命中計數(shù)與針對在搜索結(jié)果中出現(xiàn)的頻繁出現(xiàn)關鍵詞的搜索結(jié)果的命中計數(shù) 之間的相互關系。通過這樣的發(fā)明,由于自動呈現(xiàn)使用搜索結(jié)果中的頻繁出現(xiàn)關鍵詞的查詢(第二 查詢),所以用戶能夠有效地檢索想要的文檔組。此外,對于使用頻繁出現(xiàn)關鍵詞的查詢,由于同時顯示搜索命中計數(shù)和命中計數(shù) 的增加/減少,所以用戶能夠以適當數(shù)目檢索文檔。此外,用戶能夠容易地理解什么種類的關鍵詞在針對輸入的查詢的搜索結(jié)果之中 頻繁地出現(xiàn)。例如,在圖7的情況下,能夠獲得如下概況在針對查詢“人力資源開發(fā)OR教 育”的搜索結(jié)果中大量地包含“課程指導”的通知、“課程完成報告”的通知和與“新員工”教 育有關的文檔。另外,通過維恩圖顯示,有可能掌握針對原查詢(第一查詢)的搜索結(jié)果與針對頻 繁出現(xiàn)關鍵詞的搜索結(jié)果之間的關系,并且有可能可視地理解適當?shù)年P鍵詞組合以及針對 這樣制定的查詢的命中計數(shù)。例如,在圖7的情況下,可以看出包含關鍵詞“課程完成報告” 的文檔總是包括關鍵詞“人力資源開發(fā)”或者“教育”、無文檔同時包含“課程指導”和“課程 完成通知”等。因此,如果用戶在檢索關于人力資源開發(fā)的活動報告,則她/他能夠作出從 檢索目標中排除課程指導文檔的決定,因為它們看來無關。另一方面,她/他能夠作出在檢 索目標中包括諸如“課程完成報告”、“新員工”等關鍵詞的決定,因為它們看來與人力資源 開發(fā)活動有關。<基于省略部分關鍵詞的搜索結(jié)果的屏幕顯示例子>圖8示出搜索結(jié)果列表和基于省略查詢中的部分關鍵詞的查詢候選列表的屏幕 顯示例子。其示出如下屏幕,其中在圖7中的查詢生成方法菜單703中已經(jīng)選擇“通過省略 查詢中的部分關鍵詞生成”,并且已經(jīng)針對查詢用“(人力資源開發(fā)OR教育)AND (課程完成通知OR新員工)AND財政年度2007”執(zhí)行了搜索。如圖6中那樣,在搜索結(jié)果列表窗格801中顯示查詢和命中計數(shù),并且顯示針對查 詢“(人力資源開發(fā)OR教育)AND (課程完成通知OR新員工)AND財政年度2007”的搜索結(jié) 果列表。在查詢候選顯示窗格802中顯示用于調(diào)節(jié)搜索目標的查詢候選列表。這里,已經(jīng) 在查詢生成方法菜單803中選擇了將通過省略查詢中的部分關鍵詞來進行生成。例如,圖 7中的查詢⑴為“(人力資源開發(fā)OR教育)AND(課程完成通知OR新員工)”,這是通過從 原查詢中省略關鍵詞“財政年度2007”而生成的查詢。如圖6中那樣,在維恩圖顯示窗格804中用維恩圖表示針對用戶輸入的查詢的搜 索結(jié)果的命中計數(shù)與針對通過省略部分搜索關鍵詞而生成的查詢的搜索結(jié)果的命中計數(shù) 之間的相互關系。在維恩圖中的文檔集合是針對用戶在查詢候選選擇菜單805中選擇的查 詢的搜索結(jié)果。在查詢候選選擇菜單805中顯示在查詢候選顯示窗格802中呈現(xiàn)的查詢候 選列表、它們的相應命中計數(shù)和復選框。針對與用戶選中其復選框的關鍵詞對應的搜索結(jié) 果進行維恩圖顯示。通過這樣的發(fā)明,用戶能夠看出原查詢(第一查詢)中的條件就她/他希望檢索 的目標而言是否太嚴格/太寬泛。例如,當用戶輸入的第一查詢?yōu)榫哂刑囟ㄋ阉麝P鍵詞和 通用搜索關鍵詞的AND搜索時,如果由于使用該第一查詢進行搜索而在省略該通用關鍵詞 時幾乎沒有觀察到命中計數(shù)的變化,則可以確定應當省略該關鍵詞。反言之,當?shù)谝徊樵優(yōu)?具有特定搜索關鍵詞和特殊搜索關鍵詞的AND搜索時,如果由于使用該第一查詢進行搜索 而僅返回兩至三個命中,則可以確定應當省略該特殊搜索關鍵詞。例如,在圖8的情況下, 即使當使用其中從查詢(1)、即原查詢中省略“財政年度2007”的查詢來進行搜索時,差異 也僅為兩個命中。換句話說,有如下可能性這兩篇文檔僅偶然地未包括關鍵詞“財政年度 2007”。此外,由于增加兩個命中相對于原搜索結(jié)果中的169個命中僅為略微增加,所以也 可以確定保持包括這兩個命中作為人力資源開發(fā)活動的記錄會允許更少遺漏和更徹底覆蓋。另外,通過維恩圖顯示,有可能在執(zhí)行搜索之前可視地確認針對原查詢(第一查 詢)的搜索結(jié)果和從原查詢中省略搜索關鍵詞的效果?!唇Y(jié)論〉如上文所述,根據(jù)本實施例,由于在顯示搜索結(jié)果列表時呈現(xiàn)用于調(diào)節(jié)搜索目標 的查詢,所以用戶能夠有效和直接地理解什么種類的搜索關鍵詞會適合作為后續(xù)的搜索關 鍵詞。此外,如果搜索結(jié)果未如用戶所愿(當指定錯誤的搜索關鍵詞時),她/他能夠容易 地看見它。另外,由于有可能在重復搜索過程中發(fā)現(xiàn)更合適的其它關鍵詞,則可以執(zhí)行更好 地適應用戶意圖的搜索。標號說明201 文檔 DB202文檔索引203有關字詞字典204顯示設備205 鍵盤206 鼠標
      207中央處理單元208搜索執(zhí)行部分209搜索結(jié)果顯示處理部分210有關字詞查詢生成處理部分211關聯(lián)關鍵詞查詢生成處理部分212部分查詢生成處理部分213維恩圖繪制處理部分214存儲器501查詢輸入文本框502查詢生成方法選擇菜單503搜索執(zhí)行按鈕601搜索結(jié)果列表窗格602查詢候選顯示窗格603查詢生成方法菜單604搜索執(zhí)行按鈕605維恩圖顯示窗格606有關字詞選擇菜單607查詢輸入窗格608查詢輸入文本框609搜索執(zhí)行按鈕701搜索結(jié)果列表窗格 702查詢候選顯示窗格703查詢生成方法菜單704維恩圖顯示窗格801搜索結(jié)果列表窗格802查詢候選顯示窗格803查詢生成方法菜單804維恩圖顯示窗格805查詢候選選擇菜單
      權利要求
      1.一種文檔搜索系統(tǒng),用于基于搜索關鍵詞從其中積累待作為搜索目標的文檔的文檔 DB之中找到包含所述搜索關鍵詞的文檔,所述文檔搜索系統(tǒng)包括有關字詞字典,該有關字詞字典中聚集搜索關鍵詞的有關字詞;有關字詞查詢生成處理部分,該有關字詞查詢生成處理部分被配置成從所述有關字詞 字典中提取已經(jīng)輸入的第一查詢中包含的搜索關鍵詞的有關字詞并使用所述有關字詞生 成作為新查詢的第二查詢;搜索執(zhí)行部分,該搜索執(zhí)行部分被配置成計算針對用所述第一查詢返回的搜索結(jié)果的 命中計數(shù)與針對用所述第二查詢返回的搜索結(jié)果的命中計數(shù)之間的增加/減少;以及搜索結(jié)果顯示處理部分,該搜索結(jié)果顯示處理部分被配置成在顯示部分上同時顯示 所述第一查詢;用所述第一查詢返回的搜索結(jié)果;針對所述搜索結(jié)果的命中計數(shù);所述第 二查詢;針對用所述第二查詢返回的搜索結(jié)果的命中計數(shù);以及所述增加/減少。
      2.根據(jù)權利要求1所述的文檔搜索系統(tǒng),還包括維恩圖繪制處理部分,該維恩圖繪制 處理部分被配置成在所述顯示部分上以及在維恩圖中顯示用所述第一查詢返回的搜索結(jié) 果與用所述第二查詢返回的搜索結(jié)果之間的相互關系。
      3.一種文檔搜索系統(tǒng),用于基于搜索關鍵詞從其中積累待作為搜索目標的文檔的文檔 DB之中找到包含所述搜索關鍵詞的文檔,所述文檔搜索系統(tǒng)包括關聯(lián)關鍵詞查詢生成處理部分,該關聯(lián)關鍵詞查詢生成處理部分被配置成使用在針對 已經(jīng)輸入的第一查詢的搜索結(jié)果中頻繁出現(xiàn)的頻繁出現(xiàn)關鍵詞來生成作為新查詢的第二 查詢;搜索執(zhí)行部分,該搜索執(zhí)行部分被配置成計算針對用所述第一查詢返回的搜索結(jié)果的 命中計數(shù)與針對用所述第二查詢返回的搜索結(jié)果的命中計數(shù)之間的增加/減少;以及搜索結(jié)果顯示處理部分,該搜索結(jié)果顯示處理部分被配置成在顯示部分上同時顯示 所述第一查詢;用所述第一查詢返回的搜索結(jié)果;針對所述搜索結(jié)果的命中計數(shù);所述第 二查詢;針對用所述第二查詢返回的搜索結(jié)果的命中計數(shù);以及所述增加/減少。
      4.根據(jù)權利要求3所述的文檔搜索系統(tǒng),還包括維恩圖繪制處理部分,該維恩圖繪制 處理部分被配置成在所述顯示部分上以及在維恩圖中顯示用所述第一查詢返回的搜索結(jié) 果與用所述第二查詢返回的搜索結(jié)果之間的相互關系。
      5.一種文檔搜索系統(tǒng),用于基于搜索關鍵詞從其中積累待作為搜索目標的文檔的文檔 DB之中找到包含所述搜索關鍵詞的文檔,所述文檔搜索系統(tǒng)包括部分查詢生成處理部分,該部分查詢生成處理部分被配置成通過省略在已經(jīng)輸入的第 一查詢中包含的多個搜索關鍵詞的部分來生成作為新查詢的第二查詢;搜索執(zhí)行部分,該搜索執(zhí)行部分被配置成計算針對用所述第一查詢返回的搜索結(jié)果的 命中計數(shù)與針對用所述第二查詢返回的搜索結(jié)果的命中計數(shù)之間的增加/減少;以及搜索結(jié)果顯示處理部分,該搜索結(jié)果顯示處理部分被配置成在顯示部分上同時顯示 所述第一查詢;用所述第一查詢返回的搜索結(jié)果;針對所述搜索結(jié)果的命中計數(shù);所述第 二查詢;針對用所述第二查詢返回的搜索結(jié)果的命中計數(shù);以及所述增加/減少。
      6.根據(jù)權利要求5所述的文檔搜索系統(tǒng),還包括維恩圖繪制處理部分,該維恩圖繪制 處理部分被配置成在所述顯示部分上以及在維恩圖中顯示用所述第一查詢返回的搜索結(jié) 果與用所述第二查詢返回的搜索結(jié)果之間的相互關系。
      7.根據(jù)權利要求1所述的文檔搜索系統(tǒng),其中如果所述搜索執(zhí)行部分確定在用所述第二查詢返回的搜索結(jié)果中包含與用所述第一 查詢返回的搜索結(jié)果不同的新搜索結(jié)果,則所述搜索結(jié)果顯示處理部分在顯示用所述第二查詢返回的搜索結(jié)果時在所述顯示 部分上著重顯示所述新搜索結(jié)果。
      8.根據(jù)權利要求3所述的文檔搜索系統(tǒng),其中如果所述搜索執(zhí)行部分確定在用所述第二查詢返回的搜索結(jié)果中包含與用所述第一 查詢返回的搜索結(jié)果不同的新搜索結(jié)果,則所述搜索結(jié)果顯示處理部分在顯示用所述第二查詢返回的搜索結(jié)果時在所述顯示 部分上著重顯示所述新搜索結(jié)果。
      9.根據(jù)權利要求5所述的文檔搜索系統(tǒng),其中如果所述搜索執(zhí)行部分確定在用所述第二查詢返回的搜索結(jié)果中包含與用所述第一 查詢返回的搜索結(jié)果不同的新搜索結(jié)果,則所述搜索結(jié)果顯示處理部分在顯示用所述第二查詢返回的搜索結(jié)果時在所述顯示 部分上著重顯示所述新搜索結(jié)果。
      全文摘要
      提供一種用于在使用搜索系統(tǒng)收集想要的文檔時有效和直觀地收集期望文檔的文檔搜索系統(tǒng)。與新搜索準則候選和由該搜索準則獲得的命中數(shù)目一起顯示搜索結(jié)果列表。具體地,該文檔搜索系統(tǒng)包括有關字詞字典,用于收集搜索關鍵詞的有關字詞;有關字詞搜索準則生成部分,用于從有關字詞字典中提取在已輸入的第一搜索準則中包含的搜索關鍵詞的有關字詞并使用有關字詞生成第二搜索準則;搜索執(zhí)行部分,用于計算由第一搜索準則獲得的搜索結(jié)果的命中數(shù)目與由第二搜索準則獲得的搜索結(jié)果的命中數(shù)目之間的差異;以及搜索結(jié)果顯示部分,用于同時顯示第一搜索準則、由第一搜索準則獲得的搜索結(jié)果、搜索結(jié)果的命中數(shù)目、第二搜索準則、由第二搜索準則獲得的搜索結(jié)果的命中數(shù)目以及差異。
      文檔編號G06F17/30GK102067124SQ20098012327
      公開日2011年5月18日 申請日期2009年6月12日 優(yōu)先權日2008年6月18日
      發(fā)明者野崎康行 申請人:日立系統(tǒng)解決方案有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1