国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      數(shù)據(jù)庫構(gòu)建裝置和方法、搜索應(yīng)用整合系統(tǒng)和方法

      文檔序號(hào):6435186閱讀:203來源:國知局
      專利名稱:數(shù)據(jù)庫構(gòu)建裝置和方法、搜索應(yīng)用整合系統(tǒng)和方法
      技術(shù)領(lǐng)域
      本發(fā)明總體上涉及Web應(yīng)用領(lǐng)域,更具體地,本發(fā)明涉及一種用于構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫的數(shù)據(jù)庫構(gòu)建裝置和方法、以及搜索應(yīng)用整合系統(tǒng)和方法。
      背景技術(shù)
      Web應(yīng)用的整合(Mashup)是一種用來將幾個(gè)Web應(yīng)用組合起來創(chuàng)建新功能的技術(shù)。整合可以定義為通過從不同的Web應(yīng)用中提取和合并數(shù)據(jù)與功能來向Web應(yīng)用添加新的功能,以支持用戶的需要和任務(wù)。搜索應(yīng)用整合是將來自幾個(gè)不同Web搜索應(yīng)用的搜索功能和/或搜索結(jié)果組合起來以支持用戶的搜索需要和任務(wù)的整合技術(shù)。在傳統(tǒng)的方法中,已經(jīng)研究了對(duì)一組特定的搜索應(yīng)用的整合。例如,諸如MetaCrawler的元搜索引擎(www.metacrawler.com)組合了Google (谷歌)、Yahoo !(雅虎)、Bing和Ask等幾個(gè)常用搜索應(yīng)用的搜索結(jié)果,以向終端用戶提供這幾個(gè)搜索應(yīng)用的經(jīng)整合的搜索結(jié)果。在傳統(tǒng)的搜索應(yīng)用整合方法和系統(tǒng)中,通常針對(duì)較為流行的、使用廣泛的幾個(gè)搜索應(yīng)用人工地進(jìn)行整合,而且不同的終端用戶總是使用相同的搜索應(yīng)用整合數(shù)據(jù)庫,不能根據(jù)用戶的需求、使用偏好等對(duì)搜索應(yīng)用整合進(jìn)行個(gè)性化定制。

      發(fā)明內(nèi)容
      在下文中給出了關(guān)于本發(fā)明的簡要概述,以便提供關(guān)于本發(fā)明的某些方面的基本理解。應(yīng)當(dāng)理解,這個(gè)概述并不是關(guān)于本發(fā)明的窮舉性概述。它并不是意圖確定本發(fā)明的關(guān)鍵或重要部分,也不是意圖限定本發(fā)明的范圍。其目的僅僅是以簡化的形式給出某些概念,以此作為稍后論述的更詳細(xì)描述的前序。
      `
      鑒于現(xiàn)有技術(shù)的上述缺陷,本發(fā)明的目的之一是提供一種用于構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫的數(shù)據(jù)庫構(gòu)建裝置和方法以及搜索應(yīng)用整合系統(tǒng)和方法,以至少克服在現(xiàn)有技術(shù)中存在的不能同時(shí)滿足不同用戶的使用偏好及需求的問題。為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的一個(gè)方面,提供了一種用于構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫的數(shù)據(jù)庫構(gòu)建裝置,包括瀏覽會(huì)話識(shí)別單元,其被配置用于基于用戶的瀏覽歷史記錄及其發(fā)生時(shí)間來識(shí)別瀏覽歷史中的瀏覽會(huì)話;搜索會(huì)話判定單元,其被配置用于根據(jù)瀏覽會(huì)話中的記錄的參數(shù)特征以及記錄間的關(guān)聯(lián)性來判定瀏覽會(huì)話是否為搜索會(huì)話;以及數(shù)據(jù)庫構(gòu)建單元,其被配置用于根據(jù)判定的搜索會(huì)話來獲得搜索會(huì)話中的搜索應(yīng)用信息,并基于所獲得的搜索應(yīng)用信息來構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫。根據(jù)本發(fā)明的另一個(gè)方面,還提供了一種搜索應(yīng)用整合系統(tǒng),包括如上所述的數(shù)據(jù)庫構(gòu)建裝置,還包括應(yīng)用整合單元,其被配置用于利用數(shù)據(jù)庫構(gòu)建裝置所構(gòu)建的搜索應(yīng)用信息數(shù)據(jù)庫中涉及的所有搜索應(yīng)用對(duì)用戶輸入的關(guān)鍵詞進(jìn)行搜索,得到將所有搜索應(yīng)用的搜索結(jié)果組合起來的整合搜索結(jié)果;以及接口單元,其被配置用于顯示輸入界面,接收用戶輸入的關(guān)鍵詞,以及顯示上述整合搜索結(jié)果。
      根據(jù)本發(fā)明的另一個(gè)方面,還提供了一種用于構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫的數(shù)據(jù)庫構(gòu)建方法,包括基于用戶的瀏覽歷史記錄及其發(fā)生時(shí)間來識(shí)別瀏覽歷史中的瀏覽會(huì)話;根據(jù)瀏覽會(huì)話中的記錄的參數(shù)特征以及記錄間的關(guān)聯(lián)性來判定瀏覽會(huì)話是否為搜索會(huì)話;以及根據(jù)判定的搜索會(huì)話來獲得搜索會(huì)話中的搜索應(yīng)用信息,并基于所獲得的搜索應(yīng)用信息來構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫。根據(jù)本發(fā)明的另一個(gè)方面,還提供了一種搜索應(yīng)用整合方法,包括如上所述的數(shù)據(jù)庫構(gòu)建方法,還包括接收用戶輸入的關(guān)鍵詞,并利用通過數(shù)據(jù)庫構(gòu)建方法所構(gòu)建的搜索應(yīng)用信息數(shù)據(jù)庫中涉及的所有搜索應(yīng)用對(duì)用戶輸入的關(guān)鍵詞進(jìn)行搜索,得到將所有搜索應(yīng)用的搜索結(jié)果組合起來的整合搜索結(jié)果。依據(jù)本發(fā)明的其它方面,還提供了相應(yīng)的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有能夠由計(jì)算設(shè)備執(zhí)行的計(jì)算機(jī)程序,所述程序在執(zhí)行時(shí)能夠使所述計(jì)算設(shè)備執(zhí)行上述數(shù)據(jù)庫構(gòu)建方法或者上述搜索應(yīng)用整合方法。根據(jù)上述本發(fā)明實(shí)施例的數(shù)據(jù)庫構(gòu)建裝置和方法以及搜索應(yīng)用整合裝置和方法,以能夠?qū)崿F(xiàn)至少以下益處之一通過挖掘用戶的瀏覽歷史形成一個(gè)整合型的搜索應(yīng)用信息數(shù)據(jù)庫,該數(shù)據(jù)庫可以不僅能夠包含流行的網(wǎng)絡(luò)搜索引擎,還可以包括具有很少用戶的搜索應(yīng)用;而且,由于該數(shù)據(jù)庫及整合是基于用戶的瀏覽歷史的,因此該數(shù)據(jù)庫、以及整合后的搜索結(jié)果均能夠充分地匹配用戶的使用偏好和需求;此外,數(shù)據(jù)庫的創(chuàng)建過程不需用戶的參與,使得用戶容易開始使用。通過以下結(jié)合附圖對(duì)本發(fā)明的最佳實(shí)施例的詳細(xì)說明,本發(fā)明的這些以及其他優(yōu)點(diǎn)將更加明顯。


      本發(fā)明可以通過參考下文中結(jié)合附圖所給出的描述而得到更好的理解,其中在所有附圖中使用了相同或相似的附圖標(biāo)記來表示相同或者相似的部件。所述附圖連同下面的詳細(xì)說明一起包含在本說明書中并且形成本說明書的一部分,而且用來進(jìn)一步舉例說明本發(fā)明的優(yōu)選實(shí)施例和解釋本發(fā)明的原理和優(yōu)點(diǎn)。在附圖中圖1是示意性地示出根據(jù)本發(fā)明實(shí)施例的、用于構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫的數(shù)據(jù)庫構(gòu)建裝置的結(jié)構(gòu)的方框圖。圖2是示意性地示出了根據(jù)本發(fā)明實(shí)施例的數(shù)據(jù)庫構(gòu)建裝置的另一種結(jié)構(gòu)的方框圖。圖3是示出了從網(wǎng)絡(luò)代理日志中獲得的、已濾除了無用記錄的瀏覽歷史記錄的一個(gè)示例的示意圖。圖4是示意性地示出根據(jù)本發(fā)明實(shí)施例的如圖1和圖2中所示的瀏覽會(huì)話識(shí)別單元110的結(jié)構(gòu)的框圖。圖5是示出用戶在一段時(shí)間內(nèi)的瀏覽歷史記錄的時(shí)間分布的示意圖。圖6是示意性地示出根據(jù)本發(fā)明實(shí)施例的如圖1和圖2中所示的搜索會(huì)話判定單元120的結(jié)構(gòu)的框圖。圖7是是示意性地示出根據(jù)本發(fā)明實(shí)施例的如圖1和圖2中所示的數(shù)據(jù)庫構(gòu)建單元130的結(jié)構(gòu)的框圖。
      圖8是示意性地示出根據(jù)本發(fā)明實(shí)施例的圖7中所示的搜索應(yīng)用信息提取子單元710的結(jié)構(gòu)(省略了搜索應(yīng)用信息提取子單元710除點(diǎn)擊條目統(tǒng)計(jì)模塊800之外的部件)的框圖。圖9是示出了在根據(jù)本發(fā)明實(shí)施例的數(shù)據(jù)庫構(gòu)建裝置的一個(gè)示例中獲得的一組搜索應(yīng)用信息的示意圖。圖10是是示意性地示出根據(jù)本發(fā)明實(shí)施例的數(shù)據(jù)庫構(gòu)建裝置的另一種結(jié)構(gòu)的框圖。圖11是示意性地示出根據(jù)本發(fā)明實(shí)施例的搜索應(yīng)用整合系統(tǒng)的結(jié)構(gòu)的框圖。圖12是示意性示出了根據(jù)本發(fā)明實(shí)施例的整合系統(tǒng)的另一種結(jié)構(gòu)的框圖。圖13是在根據(jù)本發(fā)明的實(shí)施例的整合系統(tǒng)的一個(gè)應(yīng)用示例中,利用第二種排序方式對(duì)整合搜索結(jié)果進(jìn)行排序后的顯示界面。圖14是示意性地示出根據(jù)本發(fā)明實(shí)施例的用于構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫的數(shù)據(jù)庫構(gòu)建方法的處理流程的示意圖。圖15示意性地示出根據(jù)本發(fā)明實(shí)施例的搜索應(yīng)用整合方法的處理流程的示意圖。圖16是示出了可用來實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的數(shù)據(jù)庫構(gòu)建裝置和方法(或搜索應(yīng)用整合裝置和整合方法)的一種可能的信息處理設(shè)備的硬件配置的結(jié)構(gòu)簡圖。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,附圖中的元件僅僅是為了簡單和清楚起見而示出的,而且不一定是按比例繪制的。例如,附圖中某些元件的尺寸可能相對(duì)于其他元件放大了,以便有助于提高對(duì)本發(fā)明實(shí)施例的理解。
      具體實(shí)施例方式在下文中將結(jié)合附圖對(duì)本發(fā)明的示范性實(shí)施例進(jìn)行描述。為了清楚和簡明起見,在說明書中并未描述實(shí)際實(shí)施方式的所有特征。然而,應(yīng)該了解,在開發(fā)任何這種實(shí)際實(shí)施例的過程中必須做出很多特定于實(shí)施方式的決定,以便實(shí)現(xiàn)開發(fā)人員的具體目標(biāo),例如,符合與系統(tǒng)及業(yè)務(wù)相關(guān)的那些限制條件,并且這些限制條件可能會(huì)隨著實(shí)施方式的不同而有所改變。此外,還應(yīng)該了解,雖然開發(fā)工作有可能是非常復(fù)雜和費(fèi)時(shí)的,但對(duì)得益于本公開內(nèi)容的本領(lǐng)域技術(shù)人員來說,這種開發(fā)工作僅僅是例行的任務(wù)。在此,還需要說明的一點(diǎn)是,為了避免因不必要的細(xì)節(jié)而模糊了本發(fā)明,在附圖中僅僅示出了與根據(jù)本發(fā)明的方案密切相關(guān)的裝置結(jié)構(gòu)和/或處理步驟,而省略了與本發(fā)明關(guān)系不大的其他細(xì)節(jié)。圖1是示意性地示出根據(jù)本發(fā)明實(shí)施例的、用于構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫的數(shù)據(jù)庫構(gòu)建裝置的結(jié)構(gòu)的方框圖。如圖1所示,數(shù)據(jù)庫構(gòu)建裝置100包括瀏覽會(huì)話識(shí)別單元110、搜索會(huì)話判定單元120和數(shù)據(jù)庫構(gòu)建單元130。其中,瀏覽會(huì)話識(shí)別單元110基于用戶的瀏覽歷史記錄及其發(fā)生時(shí)間來識(shí)別用戶瀏覽歷史中的瀏覽會(huì)話,搜索會(huì)話判定單元120根據(jù)瀏覽會(huì)話中的記錄的參數(shù)特征以及記錄間的關(guān)聯(lián)性來判定瀏覽會(huì)話是否為搜索會(huì)話,數(shù)據(jù)庫構(gòu)建單元130根據(jù)所判定的搜索會(huì)話來獲得該搜索會(huì)話中的搜索應(yīng)用信息,并基于所獲得的搜索應(yīng)用信息來構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫。目前,Web瀏覽器作為用戶使用Web應(yīng)用的平臺(tái)已被廣泛使用,當(dāng)用戶通過瀏覽器瀏覽網(wǎng)頁或者是使用某個(gè)Web應(yīng)用的時(shí)候,用戶的每個(gè)動(dòng)作(比如訪問某個(gè)鏈接,或者向遠(yuǎn)程服務(wù)器提交一些數(shù)據(jù)等等)都會(huì)被記錄成為一條用戶的瀏覽歷史記錄。在一個(gè)例子中,用戶的瀏覽歷史記錄可以是直接獲得的原始瀏覽歷史記錄。原始瀏覽歷史記錄可以通過用戶端計(jì)算機(jī)來獲得,例如,通過安裝在用戶端計(jì)算機(jī)上的瀏覽器插件或網(wǎng)絡(luò)嗅探器等技術(shù)來獲得。此外,在用戶使用網(wǎng)絡(luò)代理上網(wǎng)的情況下,原始瀏覽歷史記錄也可以通過網(wǎng)絡(luò)代理的日志來獲得。在另一個(gè)例子中,用戶的瀏覽歷史記錄也可以是按預(yù)定過濾條件對(duì)上述原始瀏覽歷史記錄進(jìn)行過濾后得到的結(jié)果。例如,圖2示意性地示出了根據(jù)本發(fā)明實(shí)施例的數(shù)據(jù)庫構(gòu)建裝置的另一種結(jié)構(gòu)。如圖2所示,數(shù)據(jù)庫構(gòu)建裝置200除包括瀏覽會(huì)話識(shí)別單元110、搜索會(huì)話判定單元120和數(shù)據(jù)庫構(gòu)建單元130外,還包括過濾單元140。過濾單元140用于從獲得的用戶的原始瀏覽歷史記錄中濾除掉無用記錄,并將過濾后的瀏覽歷史記錄發(fā)送至瀏覽會(huì)話識(shí)別單元進(jìn)行處理。其中,無用記錄是指在本發(fā)明實(shí)施例的實(shí)際應(yīng)用中不重要的那些記錄條目、數(shù)據(jù)等。利用過濾單元140,可以得到例如如圖3所示的瀏覽歷史記錄。圖3是示出了從網(wǎng)絡(luò)代理日志中獲得的、已濾除了無用記錄的瀏覽歷史記錄的一個(gè)示例的示意圖。在如圖3所示出的瀏覽歷史記錄中可以包括訪問時(shí)間(time)、訪問方法(method)、正被訪問的URL(統(tǒng)一資源定位符)、指向本鏈接URL的網(wǎng)頁的URL(以下簡稱為參照頁)(referer)、從遠(yuǎn)程主機(jī)返回的數(shù)據(jù)內(nèi)容的類型(content-type)等信息,另外,還包括了從遠(yuǎn)程服務(wù)器得到的原始的HTML(超文本標(biāo)記語言)頁面。可以通過使用規(guī)則表達(dá)式或者其它公知的技術(shù)把URL分解成遠(yuǎn)程服務(wù)器的域名(hostname)、請(qǐng)求路徑(S卩,遠(yuǎn)程服務(wù)器上的執(zhí)行腳本路徑)(requestpath)以及本次請(qǐng)求的參數(shù)(parameters)。由此,一條瀏覽歷史記錄可以表示為如下形式SR = (time, method, hostname, requestpath,parameters, content-type, referer, body)其中,上式中的“body”是記錄中的正文部分,表示來自遠(yuǎn)程服務(wù)器的應(yīng)答內(nèi)容,通常是HTML源代碼的形式。為了簡潔與清楚起見,圖3所示出的瀏覽歷史記錄中省略了“body”的內(nèi)容。另外,訪問方法可以包括GET、POST、PUT、DELETE等。此外,referer即HTTP Referer,當(dāng)瀏覽器向web服務(wù)器發(fā)送請(qǐng)求的時(shí)候,一般會(huì)帶上referer,告訴服務(wù)器是從哪個(gè)頁面鏈接過來的,服務(wù)器借此可以獲得一些信息用于處理。例如,從A的主頁上鏈接到B的網(wǎng)站,則B的服務(wù)器能夠根據(jù)HTTP Referer統(tǒng)計(jì)出每天有多少用戶通過點(diǎn)擊A的主頁上的鏈接來訪問B的網(wǎng)站。 圖3中所示出的瀏覽歷史記錄可以是根據(jù)基于規(guī)則的方法從原始瀏覽歷史記錄中濾除掉無用記錄后獲得的剩余記錄。具體地,可以將過濾單元140配置成能夠?qū)崿F(xiàn)基于規(guī)則的方法來濾除無用記錄的功能,上述規(guī)則可以是若記錄的內(nèi)容類型不是文本或html,則去除該記錄;若記錄的訪問方式不是GET或POST,則去除該記錄;若記錄的請(qǐng)求路徑包含后綴css”、“.1co”或js”中的一個(gè),則去除該記錄;以及若記錄的body為空,則去除該記錄。只要記錄滿足上述規(guī)則中的任何一個(gè),過濾單元140就將該記錄濾除。由此,可以從用戶的瀏覽歷史記錄中濾除對(duì)于本發(fā)明而言不重要的、可被看作是搜索應(yīng)用的噪聲記錄的那些記錄,從而可以減少要由瀏覽會(huì)話識(shí)別單元110處理的記錄的數(shù)量,因此有助于提供整個(gè)裝置的處理效率。下面結(jié)合圖4 圖9對(duì)瀏覽會(huì)話識(shí)別單元110、搜索會(huì)話判定單元120和數(shù)據(jù)庫構(gòu)建單元130的具體處理操作進(jìn)行描述。在用戶通過瀏覽器進(jìn)行瀏覽時(shí),可能有若干個(gè)活躍的瀏覽期,也即,用戶可能并非一直連續(xù)地通過瀏覽器進(jìn)行瀏覽。例如,用戶可能通過瀏覽器使用了 5分鐘的Web應(yīng)用,然后用戶停止了瀏覽,轉(zhuǎn)而以其他的方式使用電腦,例如使用Microsoft office進(jìn)行了 10分鐘的文檔操作,然后又開始通過瀏覽器進(jìn)行網(wǎng)頁瀏覽等。因此,需要利用瀏覽會(huì)話識(shí)別單元110從用戶的瀏覽歷史中識(shí)別出活躍的瀏覽期、即瀏覽會(huì)話,然后才能利用搜索會(huì)話判定單元從瀏覽會(huì)話中找出包含搜索應(yīng)用的活躍瀏覽期、即搜索會(huì)話。圖4是示意性地示出根據(jù)本發(fā)明實(shí)施例的如圖1和圖2中所示的瀏覽會(huì)話識(shí)別單元110的結(jié)構(gòu)的框圖。如圖4所示,瀏覽會(huì)話識(shí)別單元110可以進(jìn)一步包括第一判定子單元410和識(shí)別子單元420。第一判定子單元410可以被配置用于判定用戶的瀏覽歷史記錄中的相鄰瀏覽歷史記錄是否屬于同一瀏覽會(huì)話。例如,第一判定子單元410可以通過判定用戶的瀏覽歷史記錄中的相鄰瀏覽歷史記錄之間的時(shí)間間隔是否大于或等于預(yù)設(shè)時(shí)間間隔,來判定所述相鄰瀏覽歷史記錄是否屬于同一瀏覽會(huì)話。具體來說,在用戶的瀏覽歷史記錄中的相鄰瀏覽歷史記錄之間的時(shí)間間隔大于或等于預(yù)設(shè)時(shí)間間隔的情況下,第一判定子單元410判定所述相鄰瀏覽歷史記錄分別屬于不同的瀏覽會(huì)話,否則,第一判定子單元410判定所述相鄰瀏覽歷史記錄屬于同一個(gè)瀏覽會(huì)話。當(dāng)然,也可以通過其他的方式來判斷相鄰瀏覽歷史記錄是否屬于同一瀏覽會(huì)話。圖5示出了用戶在一段時(shí)間內(nèi)的瀏覽歷史記錄的時(shí)間分布圖。在圖5中,橫坐標(biāo)表示歷史記錄發(fā)生的時(shí)間(假設(shè)沿橫坐標(biāo)軸方向的時(shí)間單位為I分鐘),縱坐標(biāo)表示在每個(gè)時(shí)間單位內(nèi)產(chǎn)生的歷史記錄的數(shù)量。識(shí)別子單元420可以被配置用于根據(jù)第一判定子單元410的判定結(jié)果在用戶的瀏覽歷史記錄中識(shí)別出多個(gè)瀏覽會(huì)話。由此,可以把用戶的大量瀏覽歷史記錄分為多個(gè)組,每組即一個(gè)瀏覽會(huì)話,其中,每個(gè)瀏覽會(huì)話中可以包括一個(gè)或多個(gè)瀏覽歷史記錄。對(duì)于如圖5所示的用戶瀏覽歷史記錄而言,假設(shè)預(yù)設(shè)時(shí)間間隔為5分鐘,則第一判定子單元410把彼此間的時(shí)間間隔大于或等于5分鐘的兩個(gè)相鄰歷史記錄判定為屬于不同的瀏覽會(huì)話,而把彼此間的時(shí)間間隔小于5分鐘的兩個(gè)相鄰歷史記錄判定為同一瀏覽會(huì)話。這樣的話,識(shí)別子單元420可以從如圖5所示的用戶瀏覽歷史中識(shí)別出3個(gè)瀏覽會(huì)話。但是,本發(fā)明并不局限于該結(jié)構(gòu),其他能夠根據(jù)瀏覽歷史記錄及其發(fā)生時(shí)間來識(shí)別瀏覽會(huì)話的類似結(jié)構(gòu)也應(yīng)當(dāng)包括在本發(fā)明的范圍中。例如,通過配置瀏覽會(huì)話識(shí)別單元110,使其能夠通過識(shí)別用戶瀏覽歷史中的空白時(shí)間期來對(duì)瀏覽歷史進(jìn)行分割,從而獲得多個(gè)瀏覽會(huì)話,換句話說,將每相鄰兩個(gè)空白時(shí)間期之間的瀏覽歷史記錄判定為一個(gè)瀏覽會(huì)話。如上所述,在用戶的瀏覽歷史中,不僅包括使用搜索應(yīng)用的歷史記錄,還可能包括其他的歷史記錄,例如使用諸如用于讀新聞或查收郵件等功能的各種網(wǎng)絡(luò)Web應(yīng)用的歷史記錄。因此,需要從識(shí)別出的瀏覽會(huì)話中進(jìn)一步地識(shí)別出那些包含搜索應(yīng)用信息的會(huì)話、即搜索會(huì)話。
      通過觀察可以發(fā)現(xiàn),搜索結(jié)果的body中通常包含突出顯示的搜索關(guān)鍵詞,并且用戶可能經(jīng)常點(diǎn)擊搜索結(jié)果,在用戶點(diǎn)擊搜索結(jié)果之前和之后產(chǎn)生的記錄之間存在一定關(guān)聯(lián)性(即,所點(diǎn)擊的記錄的referer是搜索操作記錄的URL),因此可以根據(jù)瀏覽會(huì)話中的記錄的參數(shù)特征(例如,搜索關(guān)鍵詞的出現(xiàn)頻率、高亮顯示特征等)以及記錄間的關(guān)聯(lián)性來判定瀏覽會(huì)話中的搜索會(huì)話。圖6是示意性地示出根據(jù)本發(fā)明實(shí)施例的如圖1和圖2中所示的搜索會(huì)話判定單元120的結(jié)構(gòu)的框圖。如圖6所示,搜索會(huì)話判定單元120可以進(jìn)一步包括第二判定子單元610、第三判定子單元620和第四判定子單元630。第二判定子單元610可以被配置用于判定在所識(shí)別的瀏覽會(huì)話中是否存在搜索操作記錄,其中搜索操作記錄是在正文、即body中具有出現(xiàn)次數(shù)超過預(yù)設(shè)值且被突出顯示的參數(shù)值的記錄,假設(shè)用SILsearch表示。第三判定子單元620可以被配置用于在第二判定子單元610的判定結(jié)果為肯定、即在所識(shí)別的瀏覽會(huì)話中存在搜索操作記錄的情況下,判定在該瀏覽會(huì)話中是否存在這樣的記錄發(fā)生在搜索操作記錄SR_search之后的、并以搜索操作記錄的URL為參照頁referer的記錄。第四判定子單元630可以被配置用于在第三判定子單元620的判定結(jié)果為肯定的情況下,將該瀏覽會(huì)話判定為搜索會(huì)話。由此,通過具有如圖6所示的結(jié)構(gòu)的搜索會(huì)話判定單元,可以在所識(shí)別出的瀏覽會(huì)話中進(jìn)一步識(shí)別出哪些瀏覽會(huì)話是搜索會(huì)話。圖7是示意性地示出根據(jù)本發(fā)明實(shí)施例的如圖1和圖2中所示的數(shù)據(jù)庫構(gòu)建單元130的結(jié)構(gòu)的框圖。如圖7所示,數(shù)據(jù)庫構(gòu)建單元130可以包括搜索應(yīng)用信息提取子單元710和數(shù)據(jù)庫建立子單元720。其中,搜索應(yīng)用信息提取子單元710可以被配置用于從所判定的搜索會(huì)話中包括的記錄中提取搜索應(yīng)用信息,該搜索應(yīng)用信息至少可以包括以下的信息搜索應(yīng)用的域名(即,搜索操作記錄中包含的hostname);與該搜索應(yīng)用的域名相對(duì)應(yīng)的請(qǐng)求路徑(即,所述搜索操作記錄中包含的request path);與所述域名和所述請(qǐng)求路徑相對(duì)應(yīng)的搜索關(guān)鍵詞參數(shù);與所述域名、所述請(qǐng)求路徑和所述搜索關(guān)鍵詞參數(shù)相對(duì)應(yīng)的搜索時(shí)間;以及與所述域名、所述請(qǐng)求路徑、所述搜索關(guān)鍵詞參數(shù)和所述搜索時(shí)間相對(duì)應(yīng)的搜索結(jié)果中被點(diǎn)擊過的條目數(shù)。其中,與所述域名和所述請(qǐng)求路徑相對(duì)應(yīng)的搜索關(guān)鍵詞參數(shù)是在所述搜索操作記錄的正文(即body)中的出現(xiàn)次數(shù)超過預(yù)定閾值且被突出顯示的參數(shù)值。通常,一組搜索應(yīng)用的域名和請(qǐng)求路徑可對(duì)應(yīng)于至少一個(gè)關(guān)鍵詞,這表明用戶可以在同一域名、同一請(qǐng)求路徑下先后進(jìn)行多次搜索,而且每次搜索可以使用相同的或不同的搜索關(guān)鍵詞。由于用戶可能在同一域名、同一路徑下對(duì)同一關(guān)鍵詞進(jìn)行了一次或多次的搜索,所以相應(yīng)地,與同一域名、同一請(qǐng)求路徑以及同一搜索關(guān)鍵詞參數(shù)相對(duì)應(yīng)的搜索時(shí)間也可以為一個(gè)或多個(gè)。此外,由于與確定的域名、請(qǐng)求路徑、搜索關(guān)鍵詞及搜索時(shí)間相對(duì)應(yīng)的搜索結(jié)果是唯一的,因此該搜索結(jié)果中被點(diǎn)擊過的條目數(shù)也是唯一確定的。在根據(jù)本發(fā)明實(shí)施例的數(shù)據(jù)庫構(gòu)建裝置的另一個(gè)具體實(shí)現(xiàn)方式中,可以通過在搜索應(yīng)用信息提取子單元710中設(shè)置一個(gè)如圖8所示的點(diǎn)擊條目統(tǒng)計(jì)模塊800,來確定在搜索結(jié)果中被點(diǎn)擊過的條目數(shù)。即,點(diǎn)擊條目統(tǒng)計(jì)模塊800被配置用于統(tǒng)計(jì)與上述域名、上述請(qǐng)求路徑、上述搜索關(guān)鍵詞參數(shù)和上述搜索時(shí)間相對(duì)應(yīng)的搜索結(jié)果中被點(diǎn)擊過的條目數(shù)。具體地,如圖8所示,點(diǎn)擊條目統(tǒng)計(jì)模塊800可以包括確定子模塊810和統(tǒng)計(jì)子模塊820。其中,確定子模塊810被配置用于確定在所判定的搜索會(huì)話中的、具有在正文中出現(xiàn)次數(shù)超過預(yù)設(shè)值且被突出顯示的參數(shù)值的搜索操作記錄。統(tǒng)計(jì)子模塊820被配置用于在所述搜索會(huì)話中統(tǒng)計(jì)在所述搜索操作記錄之后發(fā)生的、以所述搜索操作記錄的URL為參照頁的記錄的條數(shù),并將該條數(shù)確定為與所述域名、所述請(qǐng)求路徑、所述搜索關(guān)鍵詞參數(shù)和所述搜索時(shí)間相對(duì)應(yīng)的搜索結(jié)果中被點(diǎn)擊過的條目數(shù)。由此,可以確定在搜索結(jié)果中被點(diǎn)擊過的條目數(shù)。此外,如圖7所示的數(shù)據(jù)庫建立子單元720可被配置用于根據(jù)搜索應(yīng)用信息提取子單元710所提取的搜索應(yīng)用信息來建立搜索應(yīng)用信息數(shù)據(jù)庫。在所述搜索應(yīng)用信息數(shù)據(jù)庫中,搜索應(yīng)用信息可以是按照所述域名和所述請(qǐng)求路徑進(jìn)行分組的,即,可以將與同一域名和同一請(qǐng)求路徑有關(guān)的搜索應(yīng)用信息分為同一組信息。例如,圖9示出了在根據(jù)本發(fā)明實(shí)施例的數(shù)據(jù)庫構(gòu)建裝置的一個(gè)示例中獲得的一組搜索應(yīng)用信息。如圖9所示,搜索應(yīng)用的域名為“www. baidu. com”,請(qǐng)求路徑為“s”,用戶在2010年12月24日16:38:35對(duì)關(guān)鍵詞“富士通”進(jìn)行了搜索,并且在相應(yīng)的搜索結(jié)果中點(diǎn)擊了 3個(gè)條目,用戶在2010年12月27日15:22:12對(duì)關(guān)鍵詞“日本”進(jìn)行了搜索,并且在相應(yīng)的搜索結(jié)果中點(diǎn)擊了 6個(gè)條目,等等。此外,除上面舉例所說明的信息之外,例如通過公知技術(shù)獲得的諸如搜索應(yīng)用標(biāo)題、標(biāo)識(shí)圖等信息也可以被包括在本發(fā)明實(shí)施例所涉及的“搜索應(yīng)用信息”中。圖10是示意性地示出根據(jù)本發(fā)明實(shí)施例的數(shù)據(jù)庫構(gòu)建裝置的另一種結(jié)構(gòu)的框圖,其中,在圖10中使用實(shí)線框描繪的單元為必選部件,而使用虛線框描繪的單元為非必要的可選部件,在實(shí)際應(yīng)用中可根據(jù)需要選用。如圖10所示,在根據(jù)本發(fā)明實(shí)施例的數(shù)據(jù)庫構(gòu)建裝置1000中,裝置1000除包括瀏覽會(huì)話識(shí)別單元110、搜索會(huì)話判定單元120和數(shù)據(jù)庫構(gòu)建單元130以及可選的過濾單元140外,還可以包括更新單元150。其中,更新單元150被配置用于定期地啟動(dòng)包括在裝置1000中的瀏覽會(huì)話識(shí)別單元110、搜索會(huì)話判定單元120和數(shù)據(jù)庫構(gòu)建單元130以及可選的過濾單元140以重新構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫,并用新構(gòu)建的搜索應(yīng)用信息數(shù)據(jù)庫來替換原來的搜索應(yīng)用信息數(shù)據(jù)庫。具體地,例如,更新單元150可以按照預(yù)設(shè)的時(shí)間間隔周期啟動(dòng)瀏覽會(huì)話識(shí)別單元110、搜索會(huì)話判定單元120、數(shù)據(jù)庫構(gòu)建單元130以及可選的過濾單元140進(jìn)行各自相應(yīng)的處理,以重新構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫,并用該新構(gòu)建的搜索應(yīng)用信息數(shù)據(jù)庫替代原來的數(shù)據(jù)庫。由此,可以實(shí)現(xiàn)裝置1000的定期更新功能,使得由該裝置獲得的搜索應(yīng)用信息數(shù)據(jù)庫能夠與用戶的最新瀏覽歷史相匹配,并且能夠更符合用戶當(dāng)前的搜索習(xí)慣以及需求。通過以上的描述可以看出,在根據(jù)本發(fā)明實(shí)施例的數(shù)據(jù)庫構(gòu)建裝置中,能夠通過挖掘用戶的上網(wǎng)瀏覽歷史,創(chuàng)建一個(gè)包括與用戶瀏覽歷史有關(guān)的搜索應(yīng)用的相關(guān)信息的數(shù)據(jù)庫,即搜索應(yīng)用信息數(shù)據(jù)庫,從而實(shí)現(xiàn)對(duì)用戶瀏覽歷史中包含的搜索應(yīng)用相關(guān)信息的整合。所創(chuàng)建的搜索應(yīng)用信息數(shù)據(jù)庫可支持用戶的個(gè)性化搜索,這是因?yàn)?,該搜索?yīng)用信息數(shù)據(jù)庫中的搜索應(yīng)用及信息是通過基于對(duì)特定用戶的瀏覽歷史進(jìn)行挖掘而獲得的,因此能夠充分地匹配用戶的使用偏好與需求。傳統(tǒng)的搜索應(yīng)用整合中構(gòu)建的數(shù)據(jù)庫通常是對(duì)幾個(gè)固定的搜索應(yīng)用的相關(guān)信息的整合,其中通常只包括網(wǎng)絡(luò)上較為流行的、使用廣泛的若干個(gè)搜索應(yīng)用的相關(guān)信息,因此不能同時(shí)滿足不同用戶的各種不同的使用偏好及需求;而由根據(jù)本發(fā)明實(shí)施例的裝置創(chuàng)建的數(shù)據(jù)庫中可以包括用戶曾經(jīng)使用過的所有搜索應(yīng)用的相關(guān)信息,或用戶在最近一段時(shí)間內(nèi)使用過的所有搜索應(yīng)用的相關(guān)信息,因此其中可以包含網(wǎng)絡(luò)上較不流行、鮮少使用的某些搜索應(yīng)用的相關(guān)信息,而這些非主流的搜索應(yīng)用卻有可能恰好是最適合某類用戶的需求及習(xí)慣的搜索應(yīng)用,因此,由根據(jù)本發(fā)明實(shí)施例的裝置創(chuàng)建的數(shù)據(jù)庫可以支持不同用戶的不同搜索需求。根據(jù)本發(fā)明的實(shí)施例,還提供了一種搜索應(yīng)用整合系統(tǒng),該整合系統(tǒng)包括以上所描述的用于構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫的數(shù)據(jù)庫構(gòu)建裝置,下面結(jié)合圖11來進(jìn)行描述。圖11是示意性地示出根據(jù)本發(fā)明實(shí)施例的搜索應(yīng)用整合系統(tǒng)的結(jié)構(gòu)的框圖。如圖11所示,整合系統(tǒng)1100包括以上結(jié)合圖1-10所描述的用于構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫的數(shù)據(jù)庫構(gòu)建裝置1110、應(yīng)用整合單元1120和接口單元1130。其中,數(shù)據(jù)庫構(gòu)建裝置1110可以具有例如如圖1、2和10所示的結(jié)構(gòu)和功能,為了避免重復(fù),在此省略了對(duì)數(shù)據(jù)庫構(gòu)建裝置1110的結(jié)構(gòu)和功能的描述。此外,數(shù)據(jù)庫構(gòu)建裝置1110中各組成部件的結(jié)構(gòu)也可以具有例如如圖4、6、7及8所示的結(jié)構(gòu)和功能,例如,數(shù)據(jù)庫構(gòu)建裝置1110中包括的數(shù)據(jù)庫構(gòu)建單元可以具有與以上結(jié)合圖7所描述的數(shù)據(jù)庫構(gòu)建單元130相同的結(jié)構(gòu)和功能,即,數(shù)據(jù)庫構(gòu)建裝置1110中包括的數(shù)據(jù)庫構(gòu)建單元可以包括搜索應(yīng)用信息提取子單元和數(shù)據(jù)庫建立子單元,其中,搜索應(yīng)用信息提取子單元和數(shù)據(jù)庫建立子單元的功能可參見以上結(jié)合圖7所描述的搜索應(yīng)用信息提取子單元710和數(shù)據(jù)庫建立子單元720的功能,等等,在此省略其具體描述。參見圖11,應(yīng)用整合單元1120可以被配置用于利用數(shù)據(jù)庫構(gòu)建裝置1110所構(gòu)建的搜索應(yīng)用信息數(shù)據(jù)庫中涉及的所有搜索應(yīng)用對(duì)用戶輸入的關(guān)鍵詞進(jìn)行搜索,得到將所有搜索應(yīng)用的搜索結(jié)果組合起來的整合搜索結(jié)果。接口單元1130可以被配置用于顯示輸入界面,接收用戶輸入的關(guān)鍵詞,以及顯示上述整合搜索結(jié)果。在利用根據(jù)本發(fā)明實(shí)施例的搜索應(yīng)用整合系統(tǒng)進(jìn)行搜索的一個(gè)應(yīng)用實(shí)例中,當(dāng)用戶通過接口單元1130輸入一個(gè)關(guān)鍵詞開始搜索時(shí),應(yīng)用整合單元1120利用由數(shù)據(jù)庫構(gòu)建裝置1110已創(chuàng)建的搜索應(yīng)用信息數(shù)據(jù)庫中的所涉及到的各個(gè)搜索應(yīng)用,來分別對(duì)用戶所輸入的關(guān)鍵詞在網(wǎng)絡(luò)上進(jìn)行搜索,然后應(yīng)用整合單元1120將各個(gè)搜索應(yīng)用的搜索結(jié)果整合到一起,并通過接口單元1130顯示當(dāng)前得到的整合搜索結(jié)果。此外,接口單元1130可以按照一定的順序顯示上述整合搜索結(jié)果。例如,圖12示意性示出了根據(jù)本發(fā)明實(shí)施例的整合系統(tǒng)的另一種結(jié)構(gòu)。如圖12所示,整合系統(tǒng)1200除包括數(shù)據(jù)庫構(gòu)建裝置1110、應(yīng)用整合單元1120和接口單元1130之外,還包括排序單元1140。排序單元1140被配置用于按照以下三種方式之一對(duì)整合搜索結(jié)果進(jìn)行排序,并將排序后的整合搜索結(jié)果發(fā)送至接口單元1130,之后由接口單元1130顯示該排序后的整合搜索結(jié)果。第一種排序方式是按照與整合搜索結(jié)果相關(guān)的搜索應(yīng)用被使用過的次數(shù)進(jìn)行排序。具體地,可以計(jì)算與整合搜索結(jié)果相關(guān)的搜索應(yīng)用的域名各自對(duì)應(yīng)的搜索應(yīng)用信息的組數(shù),將各個(gè)搜索應(yīng)用的域名對(duì)應(yīng)的搜索應(yīng)用信息的組數(shù)作為對(duì)應(yīng)的搜索應(yīng)用被使用過的次數(shù)。第二種排序方式是按照與整合搜索結(jié)果相關(guān)的搜索應(yīng)用的域名各自對(duì)應(yīng)的搜索結(jié)果中被點(diǎn)擊過的條目數(shù)的多少進(jìn)行排序。第三種排序方式是按照與整合搜索結(jié)果相關(guān)的搜索應(yīng)用的域名各自對(duì)應(yīng)的最新的搜索時(shí)間的先后進(jìn)行排序,也即,根據(jù)其最后一次的使用時(shí)間來排序。其中,上述所有的排序方式可以是將同一應(yīng)用對(duì)應(yīng)的搜索結(jié)果作為整體來進(jìn)行排序的,也即,排序的目的是對(duì)各個(gè)應(yīng)用之間進(jìn)行排序,而一個(gè)應(yīng)用對(duì)應(yīng)的若干搜索結(jié)果則采用該應(yīng)用本身的排序方式。例如,以第二種排序方式為例來說明,在根據(jù)本發(fā)明的實(shí)施例的整合系統(tǒng)的一個(gè)應(yīng)用示例中,在根據(jù)用戶的瀏覽歷史構(gòu)建的搜索應(yīng)用信息數(shù)據(jù)庫中,共涉及Google、某公司內(nèi)部管理部網(wǎng)站、Nifty以及百度四個(gè)搜索應(yīng)用,也即上述“與整合搜索結(jié)果相關(guān)的搜索應(yīng)用的域名”包括以上四個(gè)搜索應(yīng)用各自的域名。例如,在Google中搜索“富士通”的結(jié)果cn. fujitsu. com和detail, zol. com. cn這兩個(gè)結(jié)果被點(diǎn)擊過,而在Google中搜索“NEC”,又有nec. com和nec. jp兩個(gè)結(jié)果被點(diǎn)擊過,則Google所對(duì)應(yīng)的史搜索結(jié)果中被點(diǎn)擊過的條目數(shù)為4。同樣地,可以獲得某公司內(nèi)部管理部網(wǎng)站、Nifty以及百度三個(gè)搜索應(yīng)用對(duì)應(yīng)的搜索結(jié)果中被點(diǎn)擊過的條目數(shù),在本示例中,該3個(gè)條目數(shù)依次分別為2、1和3。則根據(jù)上述第二種排序方式對(duì)整合搜索結(jié)果進(jìn)行排序的結(jié)果為G00gle、百度、某公司內(nèi)部管理部網(wǎng)站和Nifty。如圖13所示,圖13是在根據(jù)本發(fā)明的實(shí)施例的整合系統(tǒng)的一個(gè)應(yīng)用示例中,利用第二種排序方式對(duì)整合搜索結(jié)果進(jìn)行排序后的顯示界面。其中,在圖13中,每個(gè)應(yīng)用以及其對(duì)應(yīng)的搜索結(jié)果是位于同一行的。本發(fā)明的實(shí)施例還提供了一種用于構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫的數(shù)據(jù)庫構(gòu)建方法,圖14示出了該方法的處理流程。如圖14所示,該數(shù)據(jù)庫構(gòu)建方法的處理流程1400開始于步驟S1410,然后執(zhí)行步驟 S1420。在步驟S1420中,基于用戶的瀏覽歷史記錄及其發(fā)生時(shí)間來識(shí)別瀏覽歷史中的瀏覽會(huì)話,然后執(zhí)行步驟S1430。在一個(gè)例子中,用戶的瀏覽歷史記錄可以是直接獲得的原始瀏覽歷史記錄。其中,原始瀏覽歷史記錄可以通過在上文中描述的獲得原始瀏覽歷史記錄的方式而獲得,具體可參見上文描述。在另一個(gè)例子中,用戶的瀏覽歷史記錄也可以是通過從獲得的用戶的原始瀏覽歷史記錄中濾除掉無用記錄后獲得的過濾后的瀏覽歷史記錄此外,在處理流程1400的一個(gè)具體實(shí)現(xiàn)方式中,步驟S1420中的識(shí)別瀏覽歷史中的瀏覽會(huì)話的步驟可以包括判定用戶的瀏覽歷史記錄中的相鄰瀏覽歷史記錄是否屬于同一瀏覽會(huì)話;以及根據(jù)判定的結(jié)果在用戶的瀏覽歷史記錄中識(shí)別出多個(gè)瀏覽會(huì)話。其中,上述判定用戶的瀏覽歷史記錄中的相鄰瀏覽歷史記錄是否屬于同一瀏覽會(huì)話的具體判定過程可與上文中結(jié)合圖4所描述的利用第一判定子單元410的判定過程相同,具體描述不再重復(fù)。在步驟S1430中,根據(jù)瀏覽會(huì)話中的記錄的參數(shù)特征以及記錄間的關(guān)聯(lián)性,來判定上述瀏覽會(huì)話是否為搜索會(huì)話,然后執(zhí)行步驟S1440。例如,在處理流程1400的一個(gè)具體實(shí)現(xiàn)方式中,在步驟S1430中可以通過以下方式來判定搜索會(huì)話在瀏覽會(huì)話同時(shí)滿足以下兩個(gè)條件的情況下,將該瀏覽會(huì)話判定為搜索會(huì)話。其中,一個(gè)條件是在所識(shí)別的瀏覽會(huì)話中存在搜索操作記錄,其中,搜索操作記錄是具有在正文中出現(xiàn)次數(shù)超過預(yù)設(shè)值且被突出顯示的參數(shù)值的記錄。另一個(gè)條件是在瀏覽會(huì)話中存在這樣的記錄發(fā)生在搜索操作記錄之后、并以搜索操作記錄的URL為參照頁的記錄。由此,基于以上兩個(gè)條件即可在已識(shí)別的瀏覽會(huì)話中判斷出哪些會(huì)話是搜索會(huì)話。在步驟S1440中,根據(jù)判定的搜索會(huì)話來獲得搜索會(huì)話中的搜索應(yīng)用信息,并由該搜索應(yīng)用信息構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫,然后執(zhí)行步驟S1450。其中,在處理流程1400的一個(gè)具體實(shí)現(xiàn)方式中,可以在已判定的搜索會(huì)話中包括的瀏覽記錄中提取搜索應(yīng)用信息,進(jìn)而來構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫,其中,提取的搜索應(yīng)用信息可以至少包括以下信息搜索應(yīng)用的域名,與上述域名相對(duì)應(yīng)的請(qǐng)求路徑,與上述域名和上述請(qǐng)求路徑相對(duì)應(yīng)的搜索關(guān)鍵詞參數(shù),與上述域名、上述請(qǐng)求路徑和上述搜索關(guān)鍵詞參數(shù)相對(duì)應(yīng)的搜索時(shí)間,以及與上述域名、上述請(qǐng)求路徑、上述搜索關(guān)鍵詞參數(shù)和上述搜索時(shí)間相對(duì)應(yīng)的搜索結(jié)果中被點(diǎn)擊過的條目數(shù);其中,上述搜索應(yīng)用信息是按照所述域名和所述請(qǐng)求路徑進(jìn)行分組后的信息。此外,除上面舉例所說明的信息類型,例如通過公知技術(shù)獲得的諸如搜索應(yīng)用標(biāo)題、標(biāo)識(shí)圖等信息也可以包括在本發(fā)明實(shí)施例所涉及的“搜索應(yīng)用信息”中。在此說明,這里所提及的搜索應(yīng)用信息與上文中結(jié)合圖7所描述的搜索應(yīng)用信息提取子單元710所提取的搜索應(yīng)用信息相同,其具體意義參見上文描述。此外,這里所提及的搜索應(yīng)用信息中包括的各個(gè)信息的獲取方法也可與上文中描述的各個(gè)對(duì)應(yīng)信息的獲得方法相同。例如,在處理流程1400的一個(gè)具體實(shí)現(xiàn)方式中,“與上述域名、上述請(qǐng)求路徑、上述搜索關(guān)鍵詞參數(shù)和上述搜索時(shí)間相對(duì)應(yīng)的搜索結(jié)果中被點(diǎn)擊過的條目數(shù)”可以通過以下方式獲得確定在所判定的搜索會(huì)話中的、具有在正文中出現(xiàn)次數(shù)超過預(yù)設(shè)值且被突出顯示的參數(shù)值的搜索操作記錄;以及在上述搜索會(huì)話中統(tǒng)計(jì)在上述搜索操作記錄之后發(fā)生的、以上述搜索操作記錄的URL為參照頁的記錄的條數(shù),并將該條數(shù)確定為與上述域名、上述請(qǐng)求路徑、上述搜索關(guān)鍵詞參數(shù)和上述搜索時(shí)間相對(duì)應(yīng)的搜索結(jié)果中被點(diǎn)擊過的條目數(shù)。處理流程1400結(jié)束于步驟S1450。此外,在處理流程1400的另一個(gè)具體實(shí)現(xiàn)方式中,處理流程1400還可以包括更新步驟定期地重新構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫,并使用新構(gòu)建的搜索應(yīng)用信息數(shù)據(jù)庫替換原來的搜索應(yīng)用信息數(shù)據(jù)庫。例如,在根據(jù)處理流程1400的該另一個(gè)具體實(shí)現(xiàn)方式圖中,可以預(yù)設(shè)一個(gè)時(shí)間間隔,并使處理流程1400每經(jīng)過該時(shí)間間隔便重新執(zhí)行一次步驟S1420-1440,從而對(duì)搜索應(yīng)用信息數(shù)據(jù)庫進(jìn)行了更新。更新步驟能夠更符合用戶最近的瀏覽歷史,也從而更滿足用戶當(dāng)前的使用偏好和習(xí)慣。根據(jù)本發(fā)明實(shí)施例的數(shù)據(jù)庫構(gòu)建方法創(chuàng)建的數(shù)據(jù)庫,其中可以包括用戶使用過的所有搜索應(yīng)用及信息或用戶在最近一段時(shí)間內(nèi)使用過的所有搜索應(yīng)用及信息,因此其中可以包括網(wǎng)絡(luò)上較不流行、鮮為使用的某些搜索應(yīng)用及信息,而有可能這些非主流的搜索應(yīng)用卻恰恰是最適合某類用戶的需求及習(xí)慣的,因此,根據(jù)本發(fā)明實(shí)施例的數(shù)據(jù)庫構(gòu)建方法創(chuàng)建的數(shù)據(jù)庫可以支持不同用戶的不同搜索需求。本發(fā)明的實(shí)施例還提供了一種搜索應(yīng)用整合方法,該整合方法包括上述數(shù)據(jù)庫構(gòu)建方法,圖15示出了該整合方法的處理流程。如圖15所示該整合方法的處理流程1500開始于步驟S1510,然后在步驟S1520中基于用戶的瀏覽歷史記錄及其發(fā)生時(shí)間,識(shí)別瀏覽歷史中的瀏覽會(huì)話,在步驟S1530中根據(jù)瀏覽會(huì)話中的記錄的參數(shù)特征以及記錄間的關(guān)聯(lián)性,判定上述瀏覽會(huì)話是否為搜索會(huì)話,在步驟S1540中根據(jù)判定的搜索會(huì)話,獲得搜索會(huì)話中的搜索應(yīng)用信息,并由搜索應(yīng)用信息構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫,在步驟S1550中,使用與構(gòu)建的搜索應(yīng)用信息數(shù)據(jù)庫有關(guān)的所有搜索應(yīng)用對(duì)用戶輸入的關(guān)鍵詞進(jìn)行搜索,并得到整合搜索結(jié)果,上述整合方法結(jié)束于步驟S1560。其中,該處理流程1500中所包括的步驟S1520 S1540分別對(duì)應(yīng)于上文描述的處理流程1400中包括的步驟S1420 S1440,其具體實(shí)現(xiàn)過程可參見上文描述,亦可獲得類似的技術(shù)效果,在此不再贅述。上述根據(jù)本發(fā)明實(shí)施例的數(shù)據(jù)庫構(gòu)建裝置(或搜索應(yīng)用整合裝置)中的各個(gè)組成單元、子單元等可以通過軟件、固件、硬件或其任意組合的方式進(jìn)行配置。在通過軟件或固件實(shí)現(xiàn)的情況下,可從存儲(chǔ)介質(zhì)或網(wǎng)絡(luò)向具有專用硬件結(jié)構(gòu)的機(jī)器(例如圖16所示的通用機(jī)器1600)安裝構(gòu)成該軟件或固件的程序,該機(jī)器在安裝有各種程序時(shí),能夠執(zhí)行上述各組成單元、子單元的各種功能。圖16是示出了可用來實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的數(shù)據(jù)庫構(gòu)建裝置和方法(或搜索應(yīng)用整合裝置和整合方法)的一種可能的信息處理設(shè)備的硬件配置的結(jié)構(gòu)簡圖。在圖16中,中央處理單元(CPU) 1601根據(jù)只讀存儲(chǔ)器(ROM) 1602中存儲(chǔ)的程序或從存儲(chǔ)部分1608加載到隨機(jī)存取存儲(chǔ)器(RAM) 1603的程序執(zhí)行各種處理。在RAM 1603中,還根據(jù)需要存儲(chǔ)當(dāng)CPU 1601執(zhí)行各種處理等等時(shí)所需的數(shù)據(jù)。CPU 160KROM 1602和RAM1603經(jīng)由總線1604彼此連接。輸入/輸出接口 1605也連接到總線1604。下述部件也連接到輸入/輸出接口 1605 :輸入部分1606(包括鍵盤、鼠標(biāo)等等)、輸出部分1607(包括顯示器,例如陰極射線管(CRT)、液晶顯示器(LCD)等,和揚(yáng)聲器等)、存儲(chǔ)部分1608 (包括硬盤等)、通信部分1609 (包括網(wǎng)絡(luò)接口卡例如LAN卡、調(diào)制解調(diào)器等)。通信部分1609經(jīng)由網(wǎng)絡(luò)例如因特網(wǎng)執(zhí)行通信處理。根據(jù)需要,驅(qū)動(dòng)器1610也可連接到輸入/輸出接口 1605。可拆卸介質(zhì)1611例如磁盤、光盤、磁光盤、半導(dǎo)體存儲(chǔ)器等等可以根據(jù)需要被安裝在驅(qū)動(dòng)器1610上,使得從中讀出的計(jì)算機(jī)程序可根據(jù)需要被安裝到存儲(chǔ)部分1608中。在通過軟件實(shí)現(xiàn)上述系列處理的情況下,可以從網(wǎng)絡(luò)例如因特網(wǎng)或從存儲(chǔ)介質(zhì)例如可拆卸介質(zhì)1611安裝構(gòu)成軟件的程序。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,這種存儲(chǔ)介質(zhì)不局限于圖16所示的其中存儲(chǔ)有程序、與設(shè)備相分離地分發(fā)以向用戶提供程序的可拆卸介質(zhì)1611。可拆卸介質(zhì)1611的例子包含磁盤(包含軟盤)、光盤(包含光盤只讀存儲(chǔ)器(⑶-ROM)和數(shù)字通用盤(DVD))、磁光盤(包含迷你盤(MD)(注冊(cè)商標(biāo)))和半導(dǎo)體存儲(chǔ)器。或者,存儲(chǔ)介質(zhì)可以是ROM 1602、存儲(chǔ)部分1608中包含的硬盤等等,其中存有程序,并且與包含它們的設(shè)備一起被分發(fā)給用戶。
      此外,本發(fā)明還提出了 一種存儲(chǔ)有機(jī)器可讀取的指令代碼的程序產(chǎn)品。所述指令代碼由機(jī)器讀取并執(zhí)行時(shí),可執(zhí)行上述根據(jù)本發(fā)明實(shí)施例的數(shù)據(jù)庫構(gòu)建方法(或搜索應(yīng)用整合方法)。相應(yīng)地,用于承載這種程序產(chǎn)品的例如磁盤、光盤、磁光盤、半導(dǎo)體存儲(chǔ)器等的各種存儲(chǔ)介質(zhì)也包括在本發(fā)明的公開中。根據(jù)本發(fā)明實(shí)施例的上述數(shù)據(jù)庫構(gòu)建裝置和方法、以及搜索應(yīng)用整合裝置和方法,通過挖掘用戶的瀏覽歷史,能夠通過挖掘用戶的瀏覽歷史來創(chuàng)建一個(gè)包括與用戶瀏覽歷史有關(guān)的搜索應(yīng)用及相關(guān)信息的整合型數(shù)據(jù)庫,使得該該數(shù)據(jù)庫可以不僅能夠包含流行的網(wǎng)絡(luò)搜索引擎,還可以包括具有很少用戶的搜索應(yīng)用;而且,由于該數(shù)據(jù)庫及整合是基于用戶的瀏覽歷史的,因此能夠充分地匹配用戶的使用偏好和需求;此外,數(shù)據(jù)庫的創(chuàng)建過程不需用戶的參與,使得用戶容易開始使用。在上面對(duì)本發(fā)明具體實(shí)施例的描述中,針對(duì)一種實(shí)施方式描述和/或示出的特征可以以相同或類似的方式在一個(gè)或更多個(gè)其它實(shí)施方式中使用,與其它實(shí)施方式中的特征相組合,或替代其它實(shí)施方式中的特征。應(yīng)該強(qiáng)調(diào),術(shù)語“包括/包含”在本文使用時(shí)指特征、要素、步驟或組件的存在,但并不排除一個(gè)或更多個(gè)其它特征、要素、步驟或組件的存在或附加。涉及序數(shù)的術(shù)語“第一”,“第二”等并不表示這些術(shù)語所限定的特征、要素、步驟或組件的實(shí)施順序或者重要性程度,而僅僅是為了描述清楚起見而被配置用于在這些特征、要素、步驟或組件之間進(jìn)行標(biāo)識(shí)。此外,本發(fā)明的各實(shí)施例的方法不限于按照說明書中描述的或者附圖中示出的時(shí)間順序來執(zhí)行,也可以按照其他的時(shí)間順序、并行地或獨(dú)立地執(zhí)行。因此,本說明書中描述的方法的執(zhí)行順序不對(duì)本發(fā)明的技術(shù)范圍構(gòu)成限制。盡管上面已經(jīng)通過對(duì)本發(fā)明的具體實(shí)施例的描述對(duì)本發(fā)明進(jìn)行了披露,但是,應(yīng)該理解,本領(lǐng)域的技術(shù)人員可在所附權(quán)利要求的精神和范圍內(nèi)設(shè)計(jì)對(duì)本發(fā)明的各種修改、改進(jìn)或者等同物。這些修改、改進(jìn)或者等同物也應(yīng)當(dāng)被認(rèn)為包括在本發(fā)明的保護(hù)范圍內(nèi)。此外,顯然,根據(jù)本發(fā)明的上述方法的各個(gè)操作過程也可以以存儲(chǔ)在各種機(jī)器可讀的存儲(chǔ)介質(zhì)中的計(jì)算機(jī)可執(zhí)行程序的方式實(shí)現(xiàn)。而且,本發(fā)明的目的也可以通過下述方式實(shí)現(xiàn)將存儲(chǔ)有上述可執(zhí)行程序代碼的存儲(chǔ)介質(zhì)直接或者間接地提供給系統(tǒng)或設(shè)備,并且該系統(tǒng)或設(shè)備中的計(jì)算機(jī)或者中央處理單元(CPU)讀出并執(zhí)行上述程序代碼。此時(shí),只要該系統(tǒng)或者設(shè)備具有執(zhí)行程序的功能,則本發(fā)明的實(shí)施方式不局限于程序,并且該程序也可以是任意的形式,例如,目標(biāo)程序、解釋器執(zhí)行的程序或者提供給操作系統(tǒng)的腳本程序等。上述這些機(jī)器可讀存儲(chǔ)介質(zhì)包括但不限于各種存儲(chǔ)器和存儲(chǔ)單元,半導(dǎo)體設(shè)備,磁盤單元例如光、磁和磁光盤,以及其它適于存儲(chǔ)信息的介質(zhì)等。另外,客戶計(jì)算機(jī)通過連接到因特網(wǎng)上的相應(yīng)網(wǎng)站,并且將依據(jù)本發(fā)明的計(jì)算機(jī)程序代碼下載和安裝到計(jì)算機(jī)中然后執(zhí)行該程序,也可以實(shí)現(xiàn)本發(fā)明。最后,還需要說明的是,在本文中,諸如左和右、第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開來,而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、
      物品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個(gè)......”限定的
      要素,并不排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。綜上,在根據(jù)本發(fā)明的實(shí)施例中,本發(fā)明提供了如下方案
      附記1. 一種用于構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫的數(shù)據(jù)庫構(gòu)建裝置,包括瀏覽會(huì)話識(shí)別單元,其被配置用于基于用戶的瀏覽歷史記錄及其發(fā)生時(shí)間來識(shí)別所述瀏覽歷史中的瀏覽會(huì)話;搜索會(huì)話判定單元,其被配置用于根據(jù)所述瀏覽會(huì)話中的記錄的參數(shù)特征以及記錄間的關(guān)聯(lián)性來判定所述瀏覽會(huì)話是否為搜索會(huì)話;以及數(shù)據(jù)庫構(gòu)建單元,其被配置用于根據(jù)判定的搜索會(huì)話來獲得所述搜索會(huì)話中的搜索應(yīng)用信息,并基于所獲得的搜索應(yīng)用信息來構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫。附記2.根據(jù)附記I所述的數(shù)據(jù)庫構(gòu)建裝置,其中,所述瀏覽會(huì)話識(shí)別單元包括 第一判定子單元,其被配置用于判定用戶的瀏覽歷史記錄中的相鄰瀏覽歷史記錄是否屬于同一瀏覽會(huì)話;以及識(shí)別子單元,其被配置用于根據(jù)第一判定子單元410的判定結(jié)果在用戶的瀏覽歷史記錄中識(shí)別出多個(gè)瀏覽會(huì)話。附記3.根據(jù)附記I所述的數(shù)據(jù)庫構(gòu)建裝置,其中,所述搜索會(huì)話判定單元包括 第二判定子單元,其被配置用于判定在所識(shí)別的瀏覽會(huì)話中是否存在搜索操作記錄,其中,所述搜索操作記錄是具有在正文中具有出現(xiàn)次數(shù)超過預(yù)設(shè)值且被突出顯示的參數(shù)值的記錄;第三判定子單元,其被配置用于在所述第二判定子單元的判定結(jié)果為肯定的情況下,判定在所述瀏覽會(huì)話中是否存在這樣的記錄發(fā)生在所述搜索操作記錄之后、并以所述搜索操作記錄的URL為參照頁的記錄;以及第四判定子單元,其被配置用于在所述第三判定子單元的判定結(jié)果為肯定的情況下,將所述瀏覽會(huì)話判定為搜索會(huì)話。附記4.根據(jù)附記I所述的數(shù)據(jù)庫構(gòu)建裝置,還包括過濾單元,其被配置用于從獲得的用戶的原始瀏覽歷史記錄中濾除掉無用記錄,并將過濾后的瀏覽歷史記錄發(fā)送至瀏覽會(huì)話識(shí)別單元進(jìn)行處理。附記5.根據(jù)附記I所述的數(shù)據(jù)庫構(gòu)建裝置,還包括更新單元,其被配置用于定期地啟動(dòng)包括在所述數(shù)據(jù)庫構(gòu)建裝置中的、除所述更新單元之外的其他部件,以重新構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫,并用新構(gòu)建的搜索應(yīng)用信息數(shù)據(jù)庫來替換原來的搜索應(yīng)用信息數(shù)據(jù)庫。附記6.根據(jù)附記1-5中任意一項(xiàng)所述的數(shù)據(jù)庫構(gòu)建裝置,其中,所述數(shù)據(jù)庫構(gòu)建單元包括搜索應(yīng)用信息提取子單元,其被配置用于從所判定的搜索會(huì)話中包括的記錄中提取搜索應(yīng)用信息,所述搜索應(yīng)用信息至少包括以下信息搜索應(yīng)用的域名,與所述域名相對(duì)應(yīng)的請(qǐng)求路徑,與所述域名和所述請(qǐng)求路徑相對(duì)應(yīng)的搜索關(guān)鍵詞參數(shù),與所述域名、所述請(qǐng)求路徑和所述搜索關(guān)鍵詞參數(shù)相對(duì)應(yīng)的搜索時(shí)間,以及與所述域名、所述請(qǐng)求路徑、所述搜索關(guān)鍵詞參數(shù)和所述搜索時(shí)間相對(duì)應(yīng)的搜索結(jié)果中被點(diǎn)擊過的條目數(shù);以及數(shù)據(jù)庫建立子單元,其被配置用于根據(jù)搜索應(yīng)用信息提取子單元所提取的所述搜索應(yīng)用信息來建立搜索應(yīng)用信息數(shù)據(jù)庫,并且,在所述搜索應(yīng)用信息數(shù)據(jù)庫中,所述搜索應(yīng)用信息是按照所述域名和所述請(qǐng)求路徑進(jìn)行分組的。附記7.根據(jù)附記6所述的數(shù)據(jù)庫構(gòu)建裝置,其中,在所述搜索應(yīng)用信息提取子單元中包括點(diǎn)擊條目統(tǒng)計(jì)模塊,所述點(diǎn)擊條目統(tǒng)計(jì)模塊被配置用于統(tǒng)計(jì)所述與所述域名、所述請(qǐng)求路徑、所述搜索關(guān)鍵詞參數(shù)和所述搜索時(shí)間相對(duì)應(yīng)的搜索結(jié)果中被點(diǎn)擊過的條目數(shù),其中所述點(diǎn)擊條目統(tǒng)計(jì)模塊包括確定子模塊,其被配置用于確定在所判定的搜索會(huì)話中的、具有在正文中出現(xiàn)次數(shù)超過預(yù)設(shè)值且被突出顯示的參數(shù)值的搜索操作記錄;以及統(tǒng)計(jì)子模塊,其被配置用于在所述搜索會(huì)話中統(tǒng)計(jì)在所述搜索操作記錄之后發(fā)生的、以所述搜索操作記錄的URL為參照頁的記錄的條數(shù),并將該條數(shù)確定為與所述域名、所述請(qǐng)求路徑、所述搜索關(guān)鍵詞參數(shù)和所述搜索時(shí)間相對(duì)應(yīng)的搜索結(jié)果中被點(diǎn)擊過的條目數(shù)。附記8. —種搜索應(yīng)用整合系統(tǒng),包括如附記1-5中的任意一種數(shù)據(jù)庫構(gòu)建裝置,還包括應(yīng)用整合單元,其被配置用于利用數(shù)據(jù)庫構(gòu)建裝置所構(gòu)建的搜索應(yīng)用信息數(shù)據(jù)庫中涉及的所有搜索應(yīng)用對(duì)用戶輸入的關(guān)鍵詞進(jìn)行搜索,得到將所有搜索應(yīng)用的搜索結(jié)果組合起來的整合搜索結(jié)果;以及接口單元,其被配置用于顯示輸入界面,接收用戶輸入的關(guān)鍵詞,以及顯示所述整合搜索結(jié)果。附記9.根據(jù)附記8所述的搜索應(yīng)用整合系統(tǒng),其中,所述數(shù)據(jù)庫構(gòu)建裝置中包含的數(shù)據(jù)庫構(gòu)建單元包括搜索應(yīng)用信息提取子單元,其被配置用于從所判定的搜索會(huì)話中包括的記錄中提取搜索應(yīng)用信息,所述搜索應(yīng)用信息至少包括以下信息搜索應(yīng)用的域名,與所述域名相對(duì)應(yīng)的請(qǐng)求路徑,與所述域名和所述請(qǐng)求路徑相對(duì)應(yīng)的搜索關(guān)鍵詞參數(shù),與所述域名、所述請(qǐng)求路徑和所述搜索關(guān)鍵詞參數(shù)相對(duì)應(yīng)的搜索時(shí)間,以及與所述域名、所述請(qǐng)求路徑、所述搜索關(guān)鍵詞參數(shù)和所述搜索時(shí)間相對(duì)應(yīng)的搜索結(jié)果中被點(diǎn)擊過的條目數(shù);以及數(shù)據(jù)庫建立子單元,其被配置用于根據(jù)搜索應(yīng)用信息提取子單元所提取的所述搜索應(yīng)用信息來建立搜索應(yīng)用信息數(shù)據(jù)庫,并且,在所述搜索應(yīng)用信息數(shù)據(jù)庫中,所述搜索應(yīng)用信息是按照所述域名和所述請(qǐng)求路徑進(jìn)行分組的。附記10.根據(jù)附記9所述的搜索應(yīng)用整合系統(tǒng),還包括排序單元,所述排序單元被配置用于按照以下三種方式之一對(duì)所述整合搜索結(jié)果進(jìn)行排序,并將排序后的整合搜索結(jié)果發(fā)送至接口單元按照與所述整合搜索結(jié)果相關(guān)的搜索應(yīng)用被使用過的次數(shù)進(jìn)行排序;按照與所述整合搜索結(jié)果相關(guān)的搜索應(yīng)用的域名各自對(duì)應(yīng)的搜索結(jié)果中被點(diǎn)擊過的條目數(shù)的多少進(jìn)行排序;或者按照與所述整合搜索結(jié)果相關(guān)的搜索應(yīng)用的域名各自對(duì)應(yīng)的最新的搜索時(shí)間的先后進(jìn)行排序。附記11. 一種用于構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫的數(shù)據(jù)庫構(gòu)建方法,包括基于用戶的瀏覽歷史記錄及其發(fā)生時(shí)間來識(shí)別所述瀏覽歷史中的瀏覽會(huì)話;根據(jù)所述瀏覽會(huì)話中的記錄的參數(shù)特征以及記錄間的關(guān)聯(lián)性來判定所述瀏覽會(huì)話是否為搜索會(huì)話;以及根據(jù)判定的搜索會(huì)話來獲得所述搜索會(huì)話中的搜索應(yīng)用信息,并基于所獲得的搜索應(yīng)用信息來構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫。附記12.根據(jù)附記11所述的數(shù)據(jù)庫構(gòu)建方法,所述的識(shí)別所述瀏覽歷史中的瀏覽會(huì)話包括判定用戶的瀏覽歷史記錄中的相鄰瀏覽歷史記錄是否屬于同一瀏覽會(huì)話;以及根據(jù)判定的結(jié)果在用戶的瀏覽歷史記錄中識(shí)別出多個(gè)瀏覽會(huì)話。附記13.根據(jù)附記11所述的數(shù)據(jù)庫構(gòu)建方法,其中,所述的判定所述瀏覽會(huì)話是否為搜索會(huì)話包括在所述瀏覽會(huì)話同時(shí)滿足以下兩個(gè)條件的情況下,判定所述瀏覽會(huì)話為搜索會(huì)話在所識(shí)別的瀏覽會(huì)話中存在搜索操作記錄,其中,所述搜索操作記錄是具有在正文中具有出現(xiàn)次數(shù)超過預(yù)設(shè)值且被突出顯示的參數(shù)值的記錄;以及判定在所述瀏覽會(huì)話中是否存在這樣的記錄發(fā)生在所述搜索操作記錄之后、并以所述搜索操作記錄的URL為參照頁的記錄。附記14.根據(jù)附記11所述的數(shù)據(jù)庫構(gòu)建方法,其中,所述的用戶的瀏覽歷史記錄是通過從獲得的用戶的原始瀏覽歷史記錄中濾除掉無用記錄后獲得的過濾后的瀏覽歷史記錄。附記15.根據(jù)附記11所述的數(shù)據(jù)庫構(gòu)建方法,還包括定期地重新構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫,并使用新構(gòu)建的搜索應(yīng)用信息數(shù)據(jù)庫替換原來的搜索應(yīng)用信息數(shù)據(jù)庫。附記16.根據(jù)附記11-15中任意一項(xiàng)所述的數(shù)據(jù)庫構(gòu)建方法,其中,所述搜索應(yīng)用信息至少包括以下信息搜索應(yīng)用的域名,與所述域名相對(duì)應(yīng)的請(qǐng)求路徑,與所述域名和所述請(qǐng)求路徑相對(duì)應(yīng)的搜索關(guān)鍵詞參數(shù),與所述域名、所述請(qǐng)求路徑和所述搜索關(guān)鍵詞參數(shù)相對(duì)應(yīng)的搜索時(shí)間,以及與所述域名、所述請(qǐng)求路徑、所述搜索關(guān)鍵詞參數(shù)和所述搜索時(shí)間相對(duì)應(yīng)的搜索結(jié)果中被點(diǎn)擊過的條目數(shù);其中,所述搜索應(yīng)用信息是按照所述域名和所述請(qǐng)求路徑進(jìn)行分組后的信息。附記17.根據(jù)附記16所述的數(shù)據(jù)庫構(gòu)建方法,其中所述與所述域名、所述請(qǐng)求路徑、所述搜索關(guān)鍵詞參數(shù)和所述搜索時(shí)間相對(duì)應(yīng)的搜索結(jié)果中被點(diǎn)擊過的條目數(shù)通過以下方式獲得確定在所判定的搜索會(huì)話中的、具有在正文中出現(xiàn)次數(shù)超過預(yù)設(shè)值且被突出顯示的參數(shù)值的搜索操作記錄;以及在所述搜索會(huì)話中統(tǒng)計(jì)在所述搜索操作記錄之后發(fā)生的、以所述搜索操作記錄的URL為參照頁的記錄的條數(shù),并將所述條數(shù)確定為與所述域名、所述請(qǐng)求路徑、所述搜索關(guān)鍵詞參數(shù)和所述搜索時(shí)間相對(duì)應(yīng)的搜索結(jié)果中被點(diǎn)擊過的條目數(shù)。附記18. —種搜索應(yīng)用整合方法,包括如附記11-17中的任意一種數(shù)據(jù)庫構(gòu)建方法,還包括接收用戶輸入的關(guān)鍵詞,并利用通過數(shù)據(jù)庫構(gòu)建方法所構(gòu)建的搜索應(yīng)用信息數(shù)據(jù)庫中涉及的所有搜索應(yīng)用對(duì)用戶輸入的關(guān)鍵詞進(jìn)行搜索,得到將所有搜索應(yīng)用的搜索結(jié)果組合起來的整合搜索結(jié)果。附記19. 一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有能夠由計(jì)算設(shè)備執(zhí)行的計(jì)算機(jī)程序,所述程序在執(zhí)行時(shí)能夠使所述計(jì)算設(shè)備執(zhí)行根據(jù)附記11-17中任意一項(xiàng)所述的數(shù)據(jù)庫構(gòu)建方法或者根據(jù)附記18所述的搜索應(yīng)用整合方法。雖然已經(jīng)詳細(xì)說明了本發(fā)明及其優(yōu)點(diǎn),但是應(yīng)當(dāng)理解在不脫離由所附的權(quán)利要求所限定的本發(fā)明的精神和范圍的情況下可以進(jìn)行各種改變、替代和變換。而且,本申請(qǐng)的范圍不僅限于說明書所描述的過程、設(shè)備、制造、物質(zhì)的結(jié)構(gòu)、手段、方法和步驟的具體實(shí)施例。本領(lǐng)域內(nèi)的普通技術(shù)人員從本發(fā)明的公開內(nèi)容將容易理解,根據(jù)本發(fā)明可以使用執(zhí)行與在此所述的相應(yīng)實(shí)施例基本相同的功能或者獲得與其基本相同的結(jié)果的、現(xiàn)有和將來要被開發(fā)的過程、設(shè)備、制造、物質(zhì)的結(jié)構(gòu)、手段、方法或者步驟。因此,所附的權(quán)利要求旨在它們的范圍內(nèi)包括這樣的過程、設(shè)備、制造、物質(zhì)的結(jié)構(gòu)、手段、方法或者步驟。以上雖然結(jié)合附圖詳細(xì)描述了本發(fā)明的實(shí)施例,但是應(yīng)當(dāng)明白,上面所描述的實(shí)施方式只是用于說明本發(fā)明,而并不構(gòu)成對(duì)本發(fā)明的限制。對(duì)于本領(lǐng)域的技術(shù)人員來說,可以對(duì)上述實(shí)施方式作出各種修改和變更而沒有背離本發(fā)明的實(shí)質(zhì)和范圍。因此,本發(fā)明的范圍僅由所附的權(quán)利要求及其等效含義來限定。
      權(quán)利要求
      1.一種用于構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫的數(shù)據(jù)庫構(gòu)建裝置,包括 瀏覽會(huì)話識(shí)別單元,其被配置用于基于用戶的瀏覽歷史記錄及其發(fā)生時(shí)間來識(shí)別所述瀏覽歷史中的瀏覽會(huì)話; 搜索會(huì)話判定單元,其被配置用于根據(jù)所述瀏覽會(huì)話中的記錄的參數(shù)特征以及記錄間的關(guān)聯(lián)性來判定所述瀏覽會(huì)話是否為搜索會(huì)話;以及 數(shù)據(jù)庫構(gòu)建單元,其被配置用于根據(jù)判定的搜索會(huì)話來獲得所述搜索會(huì)話中的搜索應(yīng)用信息,并基于所獲得的搜索應(yīng)用信息來構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫。
      2.根據(jù)權(quán)利要求1所述的數(shù)據(jù)庫構(gòu)建裝置,還包括 過濾單元,其被配置用于從獲得的用戶的原始瀏覽歷史記錄中濾除掉無用記錄,并將過濾后的瀏覽歷史記錄發(fā)送至瀏覽會(huì)話識(shí)別單元進(jìn)行處理。
      3.根據(jù)權(quán)利要求1所述的數(shù)據(jù)庫構(gòu)建裝置,還包括 更新單元,其被配置用于定期地啟動(dòng)包括在所述數(shù)據(jù)庫構(gòu)建裝置中的、除所述更新單元之外的其他部件,以重新構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫,并用新構(gòu)建的搜索應(yīng)用信息數(shù)據(jù)庫來替換原來的搜索應(yīng)用信息數(shù)據(jù)庫。
      4.根據(jù)權(quán)利要求1-3中任意一項(xiàng)所述的數(shù)據(jù)庫構(gòu)建裝置,其中,所述數(shù)據(jù)庫構(gòu)建單元包括 搜索應(yīng)用信息提取子單元,其被配置用于從所判定的搜索會(huì)話中包括的記錄中提取搜索應(yīng)用信息,所述搜索應(yīng)用信息至少包括以下信息搜索應(yīng)用的域名;與所述域名相對(duì)應(yīng)的請(qǐng)求路徑;與所述域名和所述請(qǐng)求路徑相對(duì)應(yīng)的搜索關(guān)鍵詞參數(shù);與所述域名、所述請(qǐng)求路徑和所述搜索關(guān)鍵詞參數(shù)相對(duì)應(yīng)的搜索時(shí)間;以及與所述域名、所述請(qǐng)求路徑、所述搜索關(guān)鍵詞參數(shù)和所述搜索時(shí)間相對(duì)應(yīng)的搜索結(jié)果中被點(diǎn)擊過的條目數(shù);以及 數(shù)據(jù)庫建立子單元,其被配置用于根據(jù)搜索應(yīng)用信息提取子單元所提取的所述搜索應(yīng)用信息來建立搜索應(yīng)用信息數(shù)據(jù)庫,并且,在所述搜索應(yīng)用信息數(shù)據(jù)庫中,所述搜索應(yīng)用信息是按照所述域名和所述請(qǐng)求路徑進(jìn)行分組的。
      5.根據(jù)權(quán)利要求4中所述的數(shù)據(jù)庫構(gòu)建裝置,其中,在所述搜索應(yīng)用信息提取子單元中包括點(diǎn)擊條目統(tǒng)計(jì)模塊,所述點(diǎn)擊條目統(tǒng)計(jì)模塊被配置用于統(tǒng)計(jì)所述與所述域名、所述請(qǐng)求路徑、所述搜索關(guān)鍵詞參數(shù)和所述搜索時(shí)間相對(duì)應(yīng)的搜索結(jié)果中被點(diǎn)擊過的條目數(shù),其中 所述點(diǎn)擊條目統(tǒng)計(jì)模塊包括 確定子模塊,其被配置用于確定在所判定的搜索會(huì)話中的、具有在正文中出現(xiàn)次數(shù)超過預(yù)設(shè)值且被突出顯示的參數(shù)值的搜索操作記錄;以及 統(tǒng)計(jì)子模塊,其被配置用于在所述搜索會(huì)話中統(tǒng)計(jì)在所述搜索操作記錄之后發(fā)生的、以所述搜索操作記錄的URL為參照頁的記錄的條數(shù),并將該條數(shù)確定為與所述域名、所述請(qǐng)求路徑、所述搜索關(guān)鍵詞參數(shù)和所述搜索時(shí)間相對(duì)應(yīng)的搜索結(jié)果中被點(diǎn)擊過的條目數(shù)。
      6.一種搜索應(yīng)用整合系統(tǒng),包括如權(quán)利要求1-3中的任意一種數(shù)據(jù)庫構(gòu)建裝置,還包括 應(yīng)用整合單元,其被配置用于利用數(shù)據(jù)庫構(gòu)建裝置所構(gòu)建的搜索應(yīng)用信息數(shù)據(jù)庫中涉及的所有搜索應(yīng)用對(duì)用戶輸入的關(guān)鍵詞進(jìn)行搜索,得到將所有搜索應(yīng)用的搜索結(jié)果組合起來的整合搜索結(jié)果;以及接口單元,其被配置用于顯示輸入界面,接收用戶輸入的關(guān)鍵詞,以及顯示所述整合搜索結(jié)果。
      7.根據(jù)權(quán)利要求6所述的搜索應(yīng)用整合系統(tǒng),其中,所述數(shù)據(jù)庫構(gòu)建裝置中包含的數(shù)據(jù)庫構(gòu)建單元包括 搜索應(yīng)用信息提取子單元,其被配置用于從所判定的搜索會(huì)話中包括的記錄中提取搜索應(yīng)用信息,所述搜索應(yīng)用信息至少包括以下信息搜索應(yīng)用的域名;與所述域名相對(duì)應(yīng)的請(qǐng)求路徑;與所述域名和所述請(qǐng)求路徑相對(duì)應(yīng)的搜索關(guān)鍵詞參數(shù);與所述域名、所述請(qǐng)求路徑和所述搜索關(guān)鍵詞參數(shù)相對(duì)應(yīng)的搜索時(shí)間;以及與所述域名、所述請(qǐng)求路徑、所述搜索關(guān)鍵詞參數(shù)和所述搜索時(shí)間相對(duì)應(yīng)的搜索結(jié)果中被點(diǎn)擊過的條目數(shù);和 數(shù)據(jù)庫建立子單元,其被配置用于根據(jù)搜索應(yīng)用信息提取子單元所提取的所述搜索應(yīng)用信息來建立搜索應(yīng)用信息數(shù)據(jù)庫,并且,在所述搜索應(yīng)用信息數(shù)據(jù)庫中,所述搜索應(yīng)用信息是按照所述域名和所述請(qǐng)求路徑進(jìn)行分組的。
      8.根據(jù)權(quán)利要求7所述的搜索應(yīng)用整合系統(tǒng),還包括 排序單元,其被配置用于按照以下三種方式之一對(duì)所述整合搜索結(jié)果進(jìn)行排序 按照與所述整合搜索結(jié)果相關(guān)的搜索應(yīng)用被使用過的次數(shù)進(jìn)行排序; 按照與所述整合搜索結(jié)果相關(guān)的搜索應(yīng)用的域名各自對(duì)應(yīng)的搜索結(jié)果中被點(diǎn)擊過的條目數(shù)的多少進(jìn)行排序;或者 按照與所述整合搜索結(jié)果相關(guān)的搜索應(yīng)用的域名各自對(duì)應(yīng)的最新的搜索時(shí)間的先后進(jìn)行排序。
      9.一種用于構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫的數(shù)據(jù)庫構(gòu)建方法,包括 基于用戶的瀏覽歷史記錄及其發(fā)生時(shí)間來識(shí)別所述瀏覽歷史中的瀏覽會(huì)話; 根據(jù)所述瀏覽會(huì)話中的記錄的參數(shù)特征以及記錄間的關(guān)聯(lián)性來判定所述瀏覽會(huì)話是否為搜索會(huì)話;以及 根據(jù)判定的搜索會(huì)話來獲得所述搜索會(huì)話中的搜索應(yīng)用信息,并基于所獲得的搜索應(yīng)用信息來構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫。
      10.一種搜索應(yīng)用整合方法,包括如權(quán)利要求9所述的數(shù)據(jù)庫構(gòu)建方法,還包括 接收用戶輸入的關(guān)鍵詞,并利用通過數(shù)據(jù)庫構(gòu)建方法所構(gòu)建的搜索應(yīng)用信息數(shù)據(jù)庫中涉及的所有搜索應(yīng)用對(duì)用戶輸入的關(guān)鍵詞進(jìn)行搜索,得到將所有搜索應(yīng)用的搜索結(jié)果組合起來的整合搜索結(jié)果。
      全文摘要
      本發(fā)明提供了用于構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫的數(shù)據(jù)庫構(gòu)建裝置和方法、以及搜索應(yīng)用整合裝置和方法,以克服在現(xiàn)有技術(shù)中存在的不能同時(shí)滿足不同用戶的使用偏好及需求的問題。數(shù)據(jù)庫構(gòu)建裝置包括被配置用于識(shí)別瀏覽歷史中的瀏覽會(huì)話的瀏覽會(huì)話識(shí)別單元;被配置用于判定瀏覽會(huì)話是否為搜索會(huì)話的搜索會(huì)話判定單元;以及被配置用于獲得搜索會(huì)話中的搜索應(yīng)用信息、并基于所獲得的搜索應(yīng)用信息來構(gòu)建搜索應(yīng)用信息數(shù)據(jù)庫的數(shù)據(jù)庫構(gòu)建單元。整合裝置包括上述構(gòu)建裝置,還包括應(yīng)用整合單元和接口單元,用于進(jìn)行搜索、整合及顯示。應(yīng)用本發(fā)明的上述技術(shù),能夠更充分地匹配用戶的使用偏好和需求。
      文檔編號(hào)G06F17/30GK103034662SQ20111030483
      公開日2013年4月10日 申請(qǐng)日期2011年9月28日 優(yōu)先權(quán)日2011年9月28日
      發(fā)明者張軍, 鐘朝亮, 李邵明, 松尾昭彥, 鄒綱 申請(qǐng)人:富士通株式會(huì)社
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1