国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      用于實(shí)現(xiàn)元數(shù)據(jù)搜索的系統(tǒng)和方法

      文檔序號(hào):6466674閱讀:194來(lái)源:國(guó)知局
      專利名稱:用于實(shí)現(xiàn)元數(shù)據(jù)搜索的系統(tǒng)和方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及數(shù)據(jù)處理領(lǐng)域,具體涉及一種用于實(shí)現(xiàn)元數(shù)據(jù)搜索的系統(tǒng) 和方法。
      背景技術(shù)
      隨著數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用、面向服務(wù)架構(gòu)(SOA)等的t艮,信息系統(tǒng)中的
      元數(shù)據(jù),即關(guān)于數(shù)據(jù)的數(shù)據(jù)層,變得越來(lái)越重要。特別是在企業(yè)場(chǎng)景中,
      在不同的儲(chǔ)存庫(kù)中存儲(chǔ)和管理著各種類型的元數(shù)據(jù)。例如,WebSphere
      Service Registry and Repository (WSRR)是存儲(chǔ)關(guān)于服務(wù)的元數(shù)據(jù)信息
      的地方;WebSphere Business Glossary (WBG )管理著針對(duì)企業(yè)和IT用
      戶的通用詞匯表和分類信息;WebSphere DataStage用于開(kāi)發(fā)和存儲(chǔ)ETL
      作業(yè)的元數(shù)據(jù),等等。沒(méi)有有效的元數(shù)據(jù)搜索方法,則元數(shù)據(jù)管理員和用
      戶很可能被企業(yè)中所存在的大量的元數(shù)據(jù)所淹沒(méi);重要的元數(shù)據(jù)信息可能
      難于發(fā)現(xiàn),而用戶可能創(chuàng)建冗余的元數(shù)據(jù)。因此, 一種元數(shù)據(jù)搜索引擎和
      元數(shù)據(jù)搜索方法對(duì)于成功的元數(shù)據(jù)管理來(lái)說(shuō)是必不可少的。
      存在著各種類型的元數(shù)據(jù)資源,例如XSD文檔中的
      ComplexTypeDefinition, WSDL文檔中的Service描述,BusinessTerm定 義,BusinessCategory定義等等。每一個(gè)元數(shù)據(jù)資源具有某些屬性,例如 它的標(biāo)簽,用于描述它的注釋等。不同的元數(shù)據(jù)資源可能是相互關(guān)聯(lián)的。 例如, 一個(gè)BusinessTerm可能對(duì)一個(gè)Service進(jìn)4亍分類(c/cw;w>3;), 一個(gè) BusinessCategory可能包含(cow,"/") —個(gè)BusinessTerm,等等。這種關(guān) 聯(lián)信息被認(rèn)為是元數(shù)據(jù)的結(jié)構(gòu)信息。如果將每個(gè)元數(shù)據(jù)資源視為一個(gè)節(jié)點(diǎn), 而將元數(shù)據(jù)資源之間的關(guān)系視為節(jié)點(diǎn)之間的邊,則可將這些元數(shù)據(jù)資源鏈接起來(lái)而產(chǎn)生一個(gè)元數(shù)據(jù)圖。這樣,元數(shù)據(jù)搜索的問(wèn)題就是在這種元數(shù)據(jù) 圖中發(fā)現(xiàn)相關(guān)的元數(shù)據(jù)資源。由于元數(shù)據(jù)的數(shù)量和種類往往很大,因此, 元數(shù)據(jù)管理員和用戶m難在其中找到所需要的元數(shù)據(jù)信息。圖l示意性地
      示出了在包^i殳計(jì)開(kāi)發(fā)階段和運(yùn)行時(shí)階段的一示例性企業(yè)場(chǎng)景中涉及的各 種元數(shù)據(jù)資源及其復(fù)雜的關(guān)系。
      在現(xiàn)有技術(shù)中存在一些可用于進(jìn)行元數(shù)據(jù)搜索的工具。這些工具所采 用的元數(shù)據(jù)搜索方法可被劃分為如下兩類。
      第一類是利用基于關(guān)鍵字的搜索引擎??梢詫⒃獢?shù)據(jù)資源的描述發(fā)布 為HTML頁(yè)面,這樣,就可以使用現(xiàn)有的基于HTML頁(yè)面內(nèi)容中的關(guān)鍵 字的Web搜索引擎來(lái)進(jìn)行元數(shù)據(jù)搜索。例如,圖2示出了一示例性的用于 元數(shù)據(jù)資源BusinessTerm AddressNumber的HTML頁(yè)面。IBM OmiFind Yahoo! Edition提供了用于Web站點(diǎn)的爬行器和簡(jiǎn)單的搜索引擎??梢耘?置OmniFind以使其獲取用于元數(shù)據(jù)資源的所有HTML頁(yè)面,然后可使用 其搜索引擎來(lái)搜索元數(shù)據(jù)。例如,使用圖2中的頁(yè)面中包含的關(guān)鍵字"street address"進(jìn)行搜索,可以返回元數(shù)據(jù)資源BusinessTerm AddressNumber。 這種傳統(tǒng)的關(guān)鍵字搜索方法不需要用戶知道元數(shù)據(jù)的結(jié)構(gòu),因而具有操作 簡(jiǎn)單的優(yōu)點(diǎn),然而,由于它只是利用了元數(shù)據(jù)中的小的文本片段,而沒(méi)有 利用元數(shù)據(jù)資源內(nèi)部的結(jié)構(gòu)信息以及不同元數(shù)據(jù)資源之間的結(jié)構(gòu)和語(yǔ)義信 息,因此往往不足以搜索到有用的或相關(guān)的元數(shù)據(jù)信息。
      第二類是利用基于查詢的搜索引擎。如果用戶知道元數(shù)據(jù)的結(jié)構(gòu),則 有可能通過(guò)發(fā)出基于結(jié)構(gòu)的查詢來(lái)發(fā)現(xiàn)目標(biāo)元數(shù)據(jù)資源。例如,如果使用 資源描述框架(RDF)格式來(lái)表示元數(shù)據(jù)圖,則可以利用SPARQL查詢 來(lái)獲得元數(shù)據(jù)資源。圖3示出了一示例性元數(shù)據(jù)圖。針對(duì)該元數(shù)據(jù)圖,如 果要尋找l吏用ComplexTypeDefinition D并由BusinessTerm T分類 (classify)的Service,則可構(gòu)造并發(fā)出如下SPARQL查詢
      Select x
      where { x implement y. y interfaceOperation z. z interfaceMessageReference w. w use v. v name D. u classify x. uname
      然而,這種基于查詢的搜索方法盡管能返回與元數(shù)據(jù)的結(jié)構(gòu)相關(guān)的有 用信息,但它的缺點(diǎn)是需要用戶知道并指定從一個(gè)元數(shù)據(jù)資源到另一個(gè)元 數(shù)據(jù)資源的精確路徑。由于搜索引擎的用戶通常并不確切地知道他們想要 尋找的數(shù)據(jù)的結(jié)構(gòu),因此,用戶很難構(gòu)造這樣的查詢。

      發(fā)明內(nèi)容
      本發(fā)明提供這樣一種用于實(shí)現(xiàn)元數(shù)據(jù)搜索的解決方案,其既能夠返回 與元數(shù)據(jù)的結(jié)構(gòu)有關(guān)的有用的元數(shù)據(jù)資源,同時(shí)又不需要用戶知道和指明 元數(shù)據(jù)資源之間的精確路徑。
      根據(jù)本發(fā)明的一個(gè)方面,提供了一種用于實(shí)現(xiàn)元數(shù)據(jù)搜索的系統(tǒng),包 括接收模塊,其用于接收針對(duì)多個(gè)元數(shù)據(jù)資源的搜索查詢,其中所述搜 索查詢中指定了元數(shù)據(jù)資源中的文本信息,而沒(méi)有指定元數(shù)據(jù)資源之間的
      結(jié)構(gòu)信息,或者僅指定了元數(shù)據(jù)資源之間的部分結(jié)構(gòu)信息;查詢處理器,
      其用于分析所述搜索查詢,并根據(jù)對(duì)所述搜索查詢的分析搜索相關(guān)的元數(shù) 據(jù)資源以及所勤目關(guān)的元數(shù)據(jù)資源之間的結(jié)構(gòu)信息,從而形成搜索結(jié)果, 其中所述搜索結(jié)果中包含了所述相關(guān)的元數(shù)據(jù)資源之間的完整的結(jié)構(gòu)信
      息;以及輸出模塊,其用于輸出所述搜索結(jié)果,從而實(shí)現(xiàn)了針對(duì)所述多個(gè) 元數(shù)據(jù)資源的模糊結(jié)構(gòu)搜索。
      根據(jù)本發(fā)明的另一個(gè)方面,提供了一種用于實(shí)現(xiàn)元數(shù)據(jù)搜索的方法, 包括接收針對(duì)多個(gè)元數(shù)據(jù)資源的搜索查詢,其中所述搜索查詢中指定了 元數(shù)據(jù)資源中的文本信息,而沒(méi)有指定元數(shù)據(jù)資源之間的結(jié)構(gòu)信息,或者 僅指定了元數(shù)據(jù)資源之間的部分結(jié)構(gòu)信息;分析所述搜索查詢,并根據(jù) 對(duì)所述搜索查詢的分析搜索相關(guān)的元數(shù)據(jù)資源以及所勤目關(guān)的元數(shù)據(jù)資源 之間的結(jié)構(gòu)信息,從而形成搜索結(jié)果,其中所述搜索結(jié)果中包含了所^目
      關(guān)的元數(shù)據(jù)資源之間的完整的結(jié)構(gòu)信息;以及輸出所述搜索結(jié)果,從而實(shí)
      現(xiàn)了針對(duì)所述多個(gè)元數(shù)據(jù)資源的模糊結(jié)構(gòu)搜索。
      本發(fā)明能夠同時(shí)實(shí)現(xiàn)針對(duì)元數(shù)據(jù)資源的基于關(guān)鍵字的搜索和模糊結(jié)構(gòu)搜索,這樣,不僅能夠搜索元數(shù)據(jù)資源中的文本信息,而且能夠獲得元數(shù)
      據(jù)資源中的結(jié)構(gòu)信息,從而為用戶提供了更有用和相關(guān)的信息;同時(shí),不 需要用戶了解和指明元數(shù)據(jù)資源中的精確結(jié)構(gòu),從而方便了用戶的搜索操作。


      所附權(quán)利要求中闡述了被認(rèn)為是本發(fā)明的特點(diǎn)的創(chuàng)造性特征。但是, 通過(guò)參照附圖閱讀下面對(duì)說(shuō)明性實(shí)施例的詳細(xì)說(shuō)明可更好地理解發(fā)明本身 以及其優(yōu)選使用模式、目標(biāo)、特征以及優(yōu)點(diǎn),在附圖中
      圖1示意性地示出了在包^i殳計(jì)開(kāi)發(fā)階段和運(yùn)行時(shí)階段的一示例性企 業(yè)場(chǎng)景中涉及的各種元數(shù)據(jù)資源及其復(fù)雜的關(guān)系;
      圖 2示出了 一示例性的用于元數(shù)據(jù)資源BusinessTerm AddressNumber的HTML頁(yè)面;
      圖3示出了 一示例性元數(shù)據(jù)圖4示出了根據(jù)本發(fā)明的實(shí)施例的用于實(shí)現(xiàn)元數(shù)據(jù)搜索的系統(tǒng);
      圖5A示出了 一組示例性元數(shù)據(jù)資源以及元數(shù)據(jù)資源之間的語(yǔ)義關(guān)系;
      圖5B示出了具有等價(jià)關(guān)系的元數(shù)據(jù)資源的示例;
      圖6示出了響應(yīng)于輸入關(guān)鍵字credit所返回的搜索結(jié)果的示例;
      圖7示出了根據(jù)本發(fā)明的實(shí)施例根據(jù)如圖5A中所示的示例性元數(shù)據(jù)
      資源生成的文本索引的示例。
      圖8示出了根據(jù)本發(fā)明的實(shí)施例根據(jù)圖5A所示的示例性元數(shù)據(jù)資源
      生成的結(jié)構(gòu)索引的示例;
      圖9示出了根據(jù)本發(fā)明的另一實(shí)施例根據(jù)圖5A所示的示例性元數(shù)據(jù)
      資源生成的結(jié)構(gòu)索引的示例;以及
      圖IO示出了根據(jù)本發(fā)明的實(shí)施例的用于實(shí)現(xiàn)元數(shù)據(jù)搜索的方法。
      具體實(shí)施例方式
      下面參照附圖來(lái)說(shuō)明本發(fā)明的實(shí)施例。在下面的說(shuō)明中,闡述了許多具體細(xì)節(jié)以便更全面地了解本發(fā)明。但是,對(duì)于本技術(shù)領(lǐng)域內(nèi)的技術(shù)人員 明顯的是,本發(fā)明的實(shí)現(xiàn)可不具有這些具體細(xì)節(jié)中的一些。此外,應(yīng)當(dāng)理 解的是,本發(fā)明并不限于所介紹的特定實(shí)施例。相反,可以考慮用下面的 特征和要素的任意組合來(lái)實(shí)施本發(fā)明,而無(wú)論它們是否涉及不同的實(shí)施例。 因此,下面的方面、特征、實(shí)施例和優(yōu)點(diǎn)僅作說(shuō)明之用而不應(yīng)被看作是所 附權(quán)利要求的要素或限定,除非權(quán)利要求中明確提出。
      根據(jù)本發(fā)明的實(shí)施例,提出了 一種新的用于實(shí)現(xiàn)元數(shù)據(jù)搜索的系統(tǒng)和 方法。該系統(tǒng)利用了元數(shù)據(jù)中的文本和結(jié)構(gòu)信息這兩者來(lái)處理搜索查詢,
      并對(duì)搜索結(jié)果進(jìn)行排序。簡(jiǎn)言之,本發(fā)明的系統(tǒng)的貢獻(xiàn)包括如下幾個(gè)方面 首先,提供了新的搜索類型,這種新的搜索類型使得能夠進(jìn)行針對(duì)元 數(shù)據(jù)的關(guān)鍵字搜索和模糊結(jié)構(gòu)搜索這兩者,而且還能獲得元數(shù)據(jù)中的類型 信息。為了減輕最終用戶構(gòu)造和發(fā)出搜索查詢的負(fù)擔(dān),采用了簡(jiǎn)單的查詢 語(yǔ)法,使得用戶不需要了解和指明元數(shù)據(jù)之間的精確的關(guān)系路徑等結(jié)構(gòu)信 息。所述模糊結(jié)構(gòu)搜索是指在搜索查詢中沒(méi)有指定元數(shù)據(jù)資源之間的精確 的或完整的關(guān)系路徑,例如,沒(méi)有指定元數(shù)據(jù)資源之間的任何關(guān)系路徑信 息,或者只是提供了元數(shù)據(jù)資源之間不完整的或不精確的關(guān)系信息,然而 在搜索結(jié)果中卻包含了元數(shù)據(jù)資源之間的完整的或精確的關(guān)系路徑信息。
      其次,進(jìn)一步提出了向用戶顯示搜索結(jié)果中的結(jié)構(gòu)信息??紤]到元數(shù) 據(jù)的結(jié)構(gòu)信息的重要性,因此除了顯示滿足查詢的元數(shù)據(jù)資源的文本片段 外,還提供了所涉及的元數(shù)據(jù)資源之間的關(guān)系,這樣用戶可以迅速確定所 返回的元數(shù)據(jù)資源是否確實(shí)是相關(guān)的。此外,還提出了一種新的對(duì)搜索結(jié) 果進(jìn)行排序的度量,該新的排序度量結(jié)合了文本搜索因素和結(jié)構(gòu)相關(guān)因素 這兩者。
      最后,提出了用于實(shí)現(xiàn)上述新的搜索類型的索引結(jié)構(gòu)。該索引結(jié)構(gòu)存 儲(chǔ)了元數(shù)據(jù)資源中的文本信息,以及元數(shù)據(jù)資源之間的關(guān)系路徑信息,以 便在不同的元數(shù)據(jù)資源之間導(dǎo)航。
      圖4示出了根據(jù)本發(fā)明的實(shí)施例的用于實(shí)現(xiàn)元數(shù)據(jù)搜索的系統(tǒng)。如圖 所示,該系統(tǒng)包括接收模塊401,其用于接收針對(duì)多個(gè)元數(shù)據(jù)資源的搜索查詢,其中所述搜索查詢中指定了元數(shù)據(jù)資源中的文本信息,而沒(méi)有指 定元數(shù)據(jù)資源之間的結(jié)構(gòu)信息,或者僅指定了元數(shù)據(jù)資源之間的部分結(jié)構(gòu)
      信息;查詢處理器402,其用于分析所述搜索查詢,并根據(jù)對(duì)所述搜索查
      息,從而形成搜索結(jié)果,其中所述搜索結(jié)果中包含了所述相關(guān)的元數(shù)據(jù)資 源之間的完整的結(jié)構(gòu)信息;以及輸出模塊403,其用于輸出所述從而實(shí)現(xiàn) 了針對(duì)所述多個(gè)元數(shù)據(jù)資源的模糊結(jié)構(gòu)搜索。
      根據(jù)本發(fā)明的實(shí)施例,在所述搜索查詢中指定了關(guān)鍵字,查詢處理器 402可通過(guò)接收并處理該搜索查詢,獲得包含所指定的關(guān)鍵字的元數(shù)據(jù)資 源(可能還有該元數(shù)據(jù)資源中包含所指定關(guān)鍵字的文本片段和該文本片段 在該元數(shù)據(jù)資源中所屬的屬性),從而實(shí)現(xiàn)了針對(duì)多個(gè)元數(shù)據(jù)資源的基于 關(guān)鍵字的搜索;此外,查詢處理器402還可通過(guò)接收并處理該搜索查詢, 獲得與包含所指定的關(guān)鍵字的元數(shù)據(jù)資源具有直接或間接關(guān)系的元數(shù)據(jù)資 源,從而實(shí)現(xiàn)了針對(duì)多個(gè)元數(shù)據(jù)資源的模糊結(jié)構(gòu)搜索。另外,還可在所述 搜索查詢中指定元數(shù)據(jù)資源之間的關(guān)系,查詢處理器402可通過(guò)接收并處 理該搜索查詢,獲得在其間的關(guān)系路徑中包含了所指定的關(guān)系的元數(shù)據(jù)資 源,從而實(shí)現(xiàn)了針對(duì)多個(gè)元數(shù)據(jù)資源的模糊結(jié)構(gòu)搜索。
      根據(jù)本發(fā)明的進(jìn)一步的實(shí)施例,所述搜索查詢的類型為以下五種類型 中的一個(gè),即本發(fā)明的系統(tǒng)能夠處理以下五種查詢類型。
      *查詢類型一,用于搜索直接相關(guān)的元數(shù)據(jù)資源,即其中搜索查詢指 定了 一組關(guān)鍵字,用于搜索其文本片段包含所指定的 一組關(guān)鍵字的元數(shù)據(jù) 資源。
      該查詢類型的示例性語(yǔ)法可以是":K",其中K為一組關(guān)鍵字。相 應(yīng)的語(yǔ)義為返回其文本片段包含指定的一組關(guān)鍵字K的元數(shù)據(jù)資源。文 本片段是指元數(shù)據(jù)資源的某個(gè)屬性的值,所述屬性例如可以是標(biāo)簽、名稱、
      注釋等。
      例如,圖5A示出了一組示例性元數(shù)據(jù)資源以及這些元數(shù)據(jù)資源之間 的語(yǔ)義關(guān)系。其中,元數(shù)據(jù)資源R!的名稱(name)為Accounting,類型(type)為BusinessCategory,元數(shù)據(jù)資源R2的名稱為Account,類型為 BusinessTerm,元數(shù)據(jù)資源R3的標(biāo)簽(label)為ProcessCredit,類型為 Service , 元數(shù)據(jù)資源R4的標(biāo)簽為ProcessCreditStatus , 類型為 InterfaceOperation,這些元數(shù)據(jù)資源之間的關(guān)系為Ri包含(contain ) R2, R2對(duì)R3分類(classify) , R3實(shí)現(xiàn)(implement) R4。針對(duì)該組示例性元 數(shù)據(jù)資源,如果輸入的搜索查詢?yōu)?:credit",則輸出的搜索結(jié)果為"R3, R4"。因?yàn)?,R3和R4各自的屬性label的值ProcessCredit和 ProcessCreditStatus中分別包含了搜索查詢中指定的關(guān)鍵字credit。
      *查詢類型二,用于搜索間接相關(guān)的元數(shù)據(jù)資源,即其中搜索查詢指 定了一組關(guān)鍵字,用于搜索這樣的元數(shù)據(jù)資源,所述元數(shù)據(jù)資源具有到其 文本片段包含所指定的 一組關(guān)鍵字的元數(shù)據(jù)資源的關(guān)系路徑。
      該查詢類型的示例性語(yǔ)法可以是"K",其中K為一組關(guān)鍵字。相應(yīng) 的語(yǔ)義為返回這樣的元數(shù)據(jù)資源,所述元數(shù)據(jù)資源具有到其文本片段包 含所指定的一組關(guān)鍵字K的元數(shù)據(jù)資源的關(guān)系路徑。
      例如,針對(duì)圖5A中所示的一組示例性元數(shù)據(jù)資源,如果輸入的搜索 查詢?yōu)?credit",則輸出的搜索結(jié)果為R,、 R2、 R3、 R4。其中,R3和 R4 #皮返回是因?yàn)槠涓髯缘膶傩詌abel的值ProcessCredit和 ProcessCreditStatus中分別包含了搜索查詢中指定的關(guān)鍵字credit,而R2 被返回是因?yàn)镽2具有到元數(shù)據(jù)資源R3的關(guān)系路徑R2 classify R3,或具有 到R4的關(guān)系路徑R2 classify R3 implementR4, Rj皮返回是因?yàn)镽!具有到 元數(shù)據(jù)資源R3的關(guān)系路徑R, contains R2 classify R3,或具有到R4的關(guān)系 路徑R, contains R2 classify R3 implement R4。根據(jù)本發(fā)明的進(jìn)一步的實(shí)施 例,該查詢類型二用于搜索如下幾類元數(shù)據(jù)資源其文本片段中包含所指 定的一組關(guān)鍵字的元數(shù)據(jù)資源S,具有到S中的任何一個(gè)元數(shù)據(jù)資源的直 接關(guān)系路徑的元數(shù)據(jù)資源S,,以及具有到S,中的任何一個(gè)元數(shù)據(jù)資源的包 括等價(jià)關(guān)系或包含關(guān)系的關(guān)系路徑的元數(shù)據(jù)資源。等價(jià)關(guān)系是指元數(shù)據(jù)資 源之間語(yǔ)義上相同或相近的關(guān)系。圖5B示出了具有等價(jià)關(guān)系的元數(shù)據(jù)資 源的示例。如圖所示,類型為BusinessTerm、名稱為Account的元數(shù)據(jù)資源Ri和類型為BusinessTerm、名稱為Banking的元數(shù)據(jù)資源R2具有 hasSynonym關(guān)系,而hasSynonym關(guān)系是一種等價(jià)關(guān)系,因此元數(shù)據(jù)資 源R, andR2具有等價(jià)關(guān)系,當(dāng)樣,當(dāng)用戶使用關(guān)鍵字"banking"進(jìn)行搜 索時(shí),R2作為結(jié)果^皮返回,同時(shí)Ri也作為結(jié)果4皮返回,因?yàn)镽!具有與 R2的等價(jià)關(guān)系。包含關(guān)系是指元數(shù)據(jù)資源之間語(yǔ)義上的包含關(guān)系,例如圖 5A中類型為BusinessCategory、名稱為Accounting的元數(shù)據(jù)資源R,與類 型為BusinessTerm、名稱為Account的元數(shù)據(jù)資源R2之間的關(guān)系是包含 關(guān)系,這樣,當(dāng)用戶使用關(guān)鍵字"account"進(jìn)行搜索時(shí),議2作為結(jié)果被返 回,同時(shí)Ri也作為結(jié)果被返回,因?yàn)镽i具有與R2的包含關(guān)系。*查詢類 型三,用于搜索具有類型約束的直接相關(guān)的元數(shù)據(jù)資源,即其中搜索查詢 指定了一組關(guān)鍵字以及元數(shù)據(jù)資源類型,用于搜索其文本片段包含所指定 的一組關(guān)鍵字且其類型為所指定類型的元數(shù)據(jù)資源。
      該查詢類型的示例性語(yǔ)法可以是"T:K,,,其中K為一組關(guān)鍵字,T 為元數(shù)據(jù)資源的類型。相應(yīng)的語(yǔ)義為返回其文本片段包含所指定的一組 關(guān)鍵字K、且其類型為所指定的類型T的元數(shù)據(jù)資源。
      例如,針對(duì)圖5A中所示的一組示例性元數(shù)據(jù)資源,如果輸入的搜索 查詢?yōu)?BusinessTerm: credit",則返回的搜索結(jié)果為空。這是因?yàn)椴淮?在其文本片段包含關(guān)鍵字credit、而其類型為BusinessTerm的元數(shù)據(jù)資源。
      *查詢類型四,用于搜索具有類型約束的間接相關(guān)的元數(shù)據(jù)資源,即 其中搜索查詢指定了一組關(guān)鍵字以及元數(shù)據(jù)資源類型,用于搜索這樣的元 數(shù)據(jù)資源,所述元數(shù)據(jù)資源的類型為所指定類型且具有到其文本片段包含 所指定的 一組關(guān)鍵字的元數(shù)據(jù)資源的關(guān)系路徑。
      該查詢類型的示例性語(yǔ)法可以是"TK",其中K為一組關(guān)鍵字,T 為元數(shù)據(jù)資源的類型。相應(yīng)的語(yǔ)義為返回這些樣的元數(shù)據(jù)資源,所述元 數(shù)據(jù)資源的類型為指定的類型K,且具有到其文本片段包含所指定的一組 關(guān)鍵字K的元數(shù)據(jù)資源的關(guān)系路徑,
      例如,針對(duì)圖5A中所示的一組示例性元數(shù)據(jù)資源,如果輸入的搜索 查詢?yōu)?BusinessTerm credit",則返回的搜索結(jié)果為R2。這是因?yàn)樵獢?shù)
      15據(jù)資源R2的類型為BusinessTerm,同時(shí)議2具有到R3的關(guān)系路徑R2 classify R3,而R3的屬性label的文本片段中包含關(guān)鍵字credit。
      根據(jù)本發(fā)明的另一實(shí)施例,該查詢類型四用于搜索如下幾類元數(shù)據(jù)資 源類型為指定類型且其文本片段中包含所指定的一組關(guān)鍵字的元數(shù)據(jù)資 源S,類型為指定類型且具有到S中的任何一個(gè)元數(shù)據(jù)資源的直接關(guān)系路 徑的元數(shù)據(jù)資源S,,類型為指定類型且具有到S,中的任何一個(gè)元數(shù)據(jù)資源 的包括等價(jià)關(guān)系或包含關(guān)系的關(guān)系路徑的元數(shù)據(jù)資源。
      *查詢類型五,用于搜索具有某種關(guān)系的相關(guān)的元數(shù)據(jù)資源,即其中 搜索查詢指定了第一組關(guān)鍵字、第二組關(guān)鍵字以及關(guān)系,用于獲得第一元 數(shù)據(jù)資源,所述第 一元數(shù)據(jù)資源具有到第二元數(shù)據(jù)資源的關(guān)系路徑且該關(guān) 系路徑包含所指定的關(guān)系,所述第一元數(shù)據(jù)資源包含第一組關(guān)鍵字或具有 到包含第 一組關(guān)鍵字的元數(shù)據(jù)資源的關(guān)系路徑,所述第二元數(shù)據(jù)資源包含 第二組關(guān)鍵字或具有到包含第二組關(guān)鍵字的元數(shù)據(jù)資源的關(guān)系路徑。
      該查詢類型的示例性語(yǔ)法可以是"ARA,",其中A=:K|K|T:K|TK, A,=:K,|K,|T,:K,|T,K,, K和K,分別為一組關(guān)鍵字,T和T,分別為元數(shù)據(jù) 資源的類型,R為元數(shù)據(jù)資源之間的關(guān)系。相應(yīng)的語(yǔ)義為返回由A指定 的元數(shù)據(jù)資源,該元數(shù)據(jù)資源具有到由A,指定的元數(shù)據(jù)資源的關(guān)系路徑, 且該關(guān)系路徑包含指定的關(guān)系R,其中A和A,以如上查詢類型一、二、三、 四中的方式指定元數(shù)據(jù)資源。
      例如,針對(duì)圖5A中所示的一組示例性元數(shù)據(jù)資源,如果輸入的搜索 查詢?yōu)?"Service:credit implement InterfaceOperation:credit,,, 則返回的 搜索結(jié)果為R3。這是因?yàn)樵獢?shù)據(jù)資源R3的類型為指定的Service,其label 屬性的文本片段中包含了指定的credit,數(shù)據(jù)資源R4的類型為指定類型 InterfaceOperation,其label屬性的文本片段中包含了指定的credit,并且 R3具有到R4的路徑R3 implement R4,且該路徑包含了指定的關(guān)系 implement。
      以上示出了才艮據(jù)本發(fā)明的實(shí)施例的系統(tǒng)能夠支持的五種查詢類型。應(yīng) 指出的是,在本發(fā)明的其他實(shí)施例中,該系統(tǒng)也可以只支持這五種查詢類型的一部分,例如只支持查詢類型二、四、五中的一個(gè)或多個(gè)以及查詢類 型一、三中的零個(gè)、 一個(gè)或兩個(gè)。
      返回圖4,根據(jù)本發(fā)明的實(shí)施例,所述輸出模塊403還用于顯示搜索 結(jié)果,所述搜索結(jié)果包括響應(yīng)于所述搜索查詢所返回的元數(shù)據(jù)資源或其部 分(例如包含搜索查詢中指定的關(guān)鍵字的文本片段,或具有到包含搜索查 詢中指定的關(guān)鍵字的元數(shù)據(jù)資源的關(guān)系路徑的元數(shù)據(jù)資源中的某個(gè)文本片 段)和/或到所述元數(shù)據(jù)資源的鏈接,以及響應(yīng)于所述搜索查詢所返回的元 數(shù)據(jù)資源與包含所述搜索查詢中指定的關(guān)鍵字的元數(shù)據(jù)資源之間的關(guān)系路 徑或用于在被點(diǎn)擊時(shí)顯示所述關(guān)系路徑的鏈接。所述關(guān)系路徑的信息可以 告知用戶為什么特定元數(shù)據(jù)資源作為結(jié)果被返回,從而使用戶可以迅速確 定該特定元數(shù)據(jù)資源是否是所需要的。
      圖6示出了響應(yīng)于輸入關(guān)鍵字credit所返回的搜索結(jié)果的示例。其中, Accounting|Metadata Web WBGRepository為元數(shù)據(jù)資源的名稱及其所在 的儲(chǔ)存庫(kù),http:〃wbg.dyn.webahead.abc.com/resource/2008/wbg/category/ Accounting為該元數(shù)據(jù)資源的網(wǎng)絡(luò)地址,Relationship為到關(guān)系路徑信息 的鏈接,點(diǎn)擊該鏈接將顯示下面的關(guān)系路徑信息,其中顯示了所返回的名 稱為Accounting的元數(shù)據(jù)資源R到其屬性label的文本片段中包含搜索查 詢中指定的關(guān)鍵字的元數(shù)據(jù)資源R3的關(guān)系路徑。
      根據(jù)本發(fā)明的實(shí)施例,該系統(tǒng)中包括的輸出模塊402還可以可選地被 配置用于對(duì)搜索結(jié)果中響應(yīng)于搜索查詢所返回的元數(shù)據(jù)資源進(jìn)行排序,且 所述排序是根據(jù)基于關(guān)鍵字匹配的度量以及基于所獲得的元數(shù)據(jù)資源與包 含搜索查詢中指定的關(guān)鍵字的元數(shù)據(jù)資源之間的路徑的度量進(jìn)行的。也就 是說(shuō),對(duì)搜索結(jié)果中返回的多個(gè)元數(shù)據(jù)資源的排序綜合了文本匹配度量和 結(jié)構(gòu)匹配度量。在文本匹配度量方面,可利用現(xiàn)有的web搜索引擎中提供 的基于關(guān)鍵字匹配的度量。在結(jié)構(gòu)匹配度量方面,可利用下述假設(shè)由較
      為相關(guān)。因此,僅作為示例,排序可按如下公式進(jìn)行: <formula>formula see original document page 17</formula>其中,mt是通過(guò)基于關(guān)鍵字的匹配計(jì)算的;lnl是從作為搜索結(jié)果返回的元 數(shù)據(jù)資源到其文本片段中包含搜索查詢中指定的關(guān)鍵字的元數(shù)據(jù)資源的路 徑中的步數(shù);ot和P是用于調(diào)整這兩個(gè)度量的權(quán)重的系數(shù)。這樣,排序后 的搜索結(jié)果既反映了作為搜索結(jié)果返回的元數(shù)據(jù)資源與搜索查詢中指定的 關(guān)鍵字之間的文本匹配程度,又反映了作為搜索結(jié)果返回的元數(shù)據(jù)資源與 搜索查詢中指定的關(guān)鍵字之間的結(jié)構(gòu)匹配程度,從而可以為用戶提供更有 用和更相關(guān)的信息。
      返回圖4,根據(jù)本發(fā)明的實(shí)施例,該系統(tǒng)還包括可選的索引器403,其 用于對(duì)所述多個(gè)元數(shù)據(jù)資源進(jìn)行索引,以生成關(guān)于所述多個(gè)元數(shù)據(jù)資源中
      的關(guān)系路徑的信息的結(jié)構(gòu)索引;且其中,所述查詢處理器402還可以可選 地被配置用于通過(guò)使用所述文本索引以及所述結(jié)構(gòu)索引來(lái)處理所述搜索查 詢,并生成搜索結(jié)果。當(dāng)然,在本發(fā)明的其他一些實(shí)施例中,該系統(tǒng)可以 不包括索引器403,且所述查詢處理器402可通過(guò)直接搜索元數(shù)據(jù)資源來(lái) 處理所述搜索查詢,并生成搜索結(jié)果。
      索引器403可以使用元數(shù)據(jù)資源以及這些元數(shù)據(jù)資源所遵循的元才莫型 來(lái)生成關(guān)于這些元數(shù)據(jù)資源的文本索引和結(jié)構(gòu)索引。所述元才莫型可以是元 數(shù)據(jù)資源所在的儲(chǔ)存庫(kù)所采用的本領(lǐng)域中所知的任何元模型。僅作為示例, 索引器403可以首先使用元數(shù)據(jù)資源以及元模型來(lái)產(chǎn)生關(guān)于反映這些元數(shù) 據(jù)資源及其之間的關(guān)系的元數(shù)據(jù)圖(如圖3所例示的),并由該元數(shù)據(jù)圖 來(lái)產(chǎn)生所述文本索引和結(jié)構(gòu)索引。所述元數(shù)據(jù)圖例如可以是RDF格式的。 使用元數(shù)據(jù)資源和元模型產(chǎn)生元數(shù)據(jù)圖的方法是本領(lǐng)域中公知的。當(dāng)然, 索引器403也可以直接由元數(shù)據(jù)資源以及元模型生成所述文本索引和結(jié)構(gòu) 索引。
      根據(jù)本發(fā)明進(jìn)一步的實(shí)施例,所述文本索引存儲(chǔ)了多個(gè)元數(shù)據(jù)資源中 的文本片段或其部分與相應(yīng)的元數(shù)據(jù)資源以及所述文本片段在相應(yīng)的元數(shù) 據(jù)資源中所屬的屬性之間的映射。根據(jù)本發(fā)明的更進(jìn)一步的實(shí)施例,所述 文本索引還存儲(chǔ)了元數(shù)據(jù)資源的類型信息。為了生成所述文本索引,可以首先識(shí)別其中每一個(gè)元數(shù)據(jù)資源中的文
      本片段。然后,可以利用信息檢索(IR)中使用的經(jīng)典的反相索引結(jié)構(gòu)來(lái) 構(gòu)建文本索引。Lucene是一個(gè)基于文檔、域(例如,標(biāo)題、正文等)和項(xiàng) 的概念的著名的基于IR的索引引擎。僅作為示例,本發(fā)明的系統(tǒng)中的索 引器403可以利用Lucene來(lái)生成所述文本索引。這樣,元數(shù)據(jù)資源可被 一見(jiàn)為文檔;文本片段所屬的屬性,例如BusinessTerm的longDescription, Service的label等,可以被視為域;而這種屬性的值,即文本片段本身, 可以被視為項(xiàng)。此外,元數(shù)據(jù)資源的類型也可以被浮見(jiàn)為域,以便在文本索 引中存儲(chǔ)元數(shù)據(jù)資源的類型信息。當(dāng)然,以上所述用于生成元數(shù)據(jù)資源的 文本索引的具體方法僅為示例,而不是對(duì)本發(fā)明的限制。本發(fā)明的系統(tǒng)中 的索引器403可以使用本領(lǐng)域中已知的或未來(lái)開(kāi)發(fā)的任何方法來(lái)生成元數(shù) 據(jù)資源的文本索引。
      圖7示出了本發(fā)明的系統(tǒng)中的索引器403才艮據(jù)如圖5A中所示的示例 性元數(shù)據(jù)資源生成的文本索引的示例。如圖所示,該文本索引存儲(chǔ)了元數(shù) 據(jù)資源中的文本片段中的關(guān)鍵字,例如"accounting" 、 "account" "credit" 等,與相應(yīng)的元數(shù)據(jù)資源Rp R2、 R3及相應(yīng)的屬性name、 label等之間的 映射,還存儲(chǔ)了元數(shù)據(jù)資源R3、R4等的諸如"service" 、 "interfaceOperaiotn" 等類型信息(類型可^f見(jiàn)為一種屬性,即type屬性)。這樣,利用該文本索 引,就可以通過(guò)所輸入的搜索查詢中的關(guān)鍵字,例如"credit"等,方便地 找到包含該關(guān)鍵字的元數(shù)據(jù)資源R3、 R4及相應(yīng)的屬性,例如label等。如 該圖所示的,在文本索引中既可以存儲(chǔ)某個(gè)屬性的整個(gè)文本片段作為關(guān)鍵 字,例如,"service" 、"interfaceOperaiotn" 、"businessTerm"、
      "businessCategory" "accounting"和"account",也可以存儲(chǔ)某個(gè)屬性 的文本片段的部分作為關(guān)鍵字,例如。"credit" 、 "process"和"status"。 因此,可選地,在將元數(shù)據(jù)資源中的文本片段或某中的關(guān)鍵字存儲(chǔ)到文本 索引之前,可以首先使用本領(lǐng)域中已知的任何分詞方法將所述文本片段劃 分為部分,作為關(guān)鍵字。
      根據(jù)本發(fā)明的實(shí)施例,所述結(jié)構(gòu)索引是由兩級(jí)散列表實(shí)現(xiàn)的,且第一級(jí)散列表中的條目是作為關(guān)系路徑的終節(jié)點(diǎn)的元數(shù)據(jù)資源的標(biāo)識(shí),而第二 級(jí)散列表中的條目是作為關(guān)系路徑的起始節(jié)點(diǎn)的元數(shù)據(jù)資源的標(biāo)識(shí)以及所
      述關(guān)系路徑的信息。例如,對(duì)于給定的關(guān)系路徑np^p2…rn,其中n表示 元數(shù)據(jù)資源,pj表示元數(shù)據(jù)資源之間的關(guān)系,i=l...n,j=l...n-l, rn被存儲(chǔ) 在散列表的第一級(jí),而r"皮存儲(chǔ)在散列表的第二級(jí)對(duì)應(yīng)于i^的條目中,且
      關(guān)系路徑npii"2p2…rn被存儲(chǔ)在n的條目中。
      根據(jù)本發(fā)明的一個(gè)實(shí)施例,在結(jié)構(gòu)索引中存儲(chǔ)了一組元數(shù)據(jù)資源中任
      何一對(duì)元數(shù)據(jù)資源之間的路徑,包括所有直接路徑和間接路徑。圖8示出 了根據(jù)本發(fā)明的該實(shí)施例根據(jù)圖5A所示的示例性元數(shù)據(jù)資源生成的結(jié)構(gòu) 索引的示例。如圖所示,根據(jù)該結(jié)構(gòu)索引,可以很容易地獲得到達(dá)任何一 個(gè)元數(shù)據(jù)資源例如R4的所有關(guān)系路徑,例如,R3 implement R4, R2 classify R3 implement R4, Ri contains R2 classify R3 implement R4。
      為了減少結(jié)構(gòu)索引中存儲(chǔ)的關(guān)系路徑的數(shù)量,而只保留那些最相關(guān)的 關(guān)系路徑,根據(jù)本發(fā)明的進(jìn)一步的實(shí)施例,在結(jié)構(gòu)索引中存儲(chǔ)的關(guān)系路徑 包括以下三類
      *元數(shù)據(jù)資源對(duì)之間的直接關(guān)系路徑。直接關(guān)系路徑表示作為該直接 關(guān)系路徑的起始節(jié)點(diǎn)和終節(jié)點(diǎn)的元數(shù)據(jù)資源之間具有直接的關(guān)系。這種直 接關(guān)系路徑可以直接從元數(shù)據(jù)圖中獲得,因?yàn)樗鼈兙褪窃獢?shù)據(jù)圖中的邊。
      *元數(shù)據(jù)資源對(duì)之間的包括等價(jià)關(guān)系的關(guān)系路徑。這種路徑指示了一 組等價(jià)的元數(shù)據(jù)資源,且是可傳遞的,例如,類型為businessTerm且具有 hasSynonym的一組元數(shù)據(jù)資源之間的等價(jià)關(guān)系。僅作為示例,用戶可以 通過(guò)在元模型的級(jí)別上提供注釋來(lái)指示等價(jià)關(guān)系,例如,在WebSphere Business Glossary儲(chǔ)存庫(kù)的元模型中,用戶可以指示屬性hasSynonym表 示等價(jià)關(guān)系。這樣,索引器403將索引所有具有hasSynonym屬性的路徑。
      *元數(shù)據(jù)資源對(duì)之間的包括包含關(guān)系的關(guān)系路徑,這種關(guān)系路徑指示 了元數(shù)據(jù)資源之間的包含關(guān)系,且是可傳遞的。例如, 一個(gè)類型為 businessCategory的元數(shù)據(jù)資源包含一個(gè)類型為businessTerm的元數(shù)據(jù)資 源。考慮到元模型通常是由UML模型表示的,并且UML模型中的組合關(guān)系和聚集關(guān)系具有包含關(guān)系的語(yǔ)義,默認(rèn)地,可以從元模型中提取這些關(guān)系作為包含關(guān)系。此外,還可以允許用戶在元^=莫型級(jí)別上對(duì)包含關(guān)系進(jìn)行定制。
      圖9示出了根據(jù)本發(fā)明的該另一實(shí)施例根據(jù)圖5A所示的示例性元數(shù)據(jù)資源生成的結(jié)構(gòu)索引的示例。如圖中所示,在該結(jié)構(gòu)索引中首先存儲(chǔ)了根據(jù)元模型獲得的從R3到R4、從R2到R3、以及從到R2的直接關(guān)系路徑,其次還存儲(chǔ)了在圖中以陰影表示的根據(jù)元模型獲得的從R到R2的包含關(guān)系路徑。
      在本發(fā)明的系統(tǒng)中,所述查詢處理器402使用上述索引結(jié)構(gòu)來(lái)處理搜索查詢的方法可以如下所述
      *對(duì)于查詢類型一,例如":K",使用文本索引通過(guò)關(guān)鍵字K來(lái)尋找相應(yīng)的元數(shù)據(jù)資源。
      *對(duì)于查詢類型二,例如"T: K",使用類型信息進(jìn)一步過(guò)濾掉那些不屬于類型T的元數(shù)據(jù)資源。
      *對(duì)于查詢類型三(才艮據(jù)本發(fā)明的所述進(jìn)一步的實(shí)施例),例如"K",首先,使用文本索引通過(guò)關(guān)鍵字K來(lái)尋找相應(yīng)的元數(shù)據(jù)資源,記為S。其次,對(duì)于S中的每個(gè)條目,使用結(jié)構(gòu)索引來(lái)尋找所有與其直接相關(guān)的元數(shù)據(jù)資源,記為S,。最后,對(duì)于S,中的每個(gè)條目,使用結(jié)構(gòu)索引來(lái)尋找所有具有等價(jià)或包含關(guān)系的元數(shù)據(jù)資源。
      例如,針對(duì)如圖7所示的文本索引示例以及如圖9所示的結(jié)構(gòu)索引的示例,如果發(fā)出的搜索查詢?yōu)?credit",則索引結(jié)果為R,、 R2、 R3、其中R3和R4是直接包含關(guān)鍵字credit的元數(shù)據(jù)資源,而112具有到R3的直接關(guān)系,R1具有到R2的包含關(guān)系。
      *對(duì)于查詢類型四,例如"T K",進(jìn)一步使用類型信息來(lái)過(guò)濾掉不屬于類型T的元數(shù)據(jù)資源。
      *對(duì)于查詢類型五,首先使用文本索引或者文本索引和結(jié)構(gòu)索引兩者來(lái)尋找由A和A,表示的元數(shù)據(jù)資源。其次,使用結(jié)構(gòu)索引過(guò)濾掉這樣的由A表示的元數(shù)據(jù)資源,該元數(shù)據(jù)資源到由A,表示的元數(shù)據(jù)資源的路徑不包
      21含關(guān)系R。
      以上描述了根據(jù)本發(fā)明的實(shí)施例的用于實(shí)現(xiàn)元數(shù)據(jù)搜索的系統(tǒng),應(yīng)指 出的是,以上描述僅為示例性說(shuō)明,而不是對(duì)本發(fā)明的限制。根據(jù)本發(fā)明 的其他實(shí)施例,該系統(tǒng)可具有更多、更少或不同的模塊,各模塊的功能或 各模塊之間的關(guān)系可以與所描述和圖示的不同,某些模塊可劃分為更小的 模塊或合并為更大的模塊,某些模塊的某些功能也可以由其他模塊執(zhí)行, 等等。例如,在本發(fā)明的一些實(shí)施例中,該系統(tǒng)可以包括上述可選^^莫塊中 的一個(gè)或多個(gè)。又例如,所述查詢處理器402可進(jìn)一步包括一個(gè)用于對(duì)搜 索查詢進(jìn)行分析的查詢分析器,以及一個(gè)根據(jù)查詢分析器的分析結(jié)果對(duì)元 數(shù)據(jù)資源進(jìn)行搜索的搜索引擎。再例如,在以上描述中由輸出模塊403執(zhí) 行的排序功能也可以由查詢處理器402來(lái)完成。此外,以上描述的4艮據(jù)本 發(fā)明的實(shí)施例的索引結(jié)構(gòu)僅為示例,而不是對(duì)本發(fā)明的限制。在根據(jù)本發(fā)
      現(xiàn)基于關(guān):字的搜索^模:結(jié)構(gòu)搜索,等等。所有^些變化都處于本發(fā)曰; 的范圍之內(nèi)。
      下面描述才艮據(jù)本發(fā)明的實(shí)施例的用于實(shí)現(xiàn)元數(shù)據(jù)搜索的方法。該方法 可以由根據(jù)本發(fā)明的實(shí)施例的用于實(shí)現(xiàn)元數(shù)據(jù)搜索的系統(tǒng)來(lái)執(zhí)行,也可以 由任何其他系統(tǒng)或裝置來(lái)執(zhí)行。為簡(jiǎn)明起見(jiàn),在以下描述中省略了與以上 描述的內(nèi)容重復(fù)的部分細(xì)節(jié),因此請(qǐng)參照以上描述獲得對(duì)根據(jù)本發(fā)明的實(shí) 施例的用于實(shí)現(xiàn)元數(shù)據(jù)搜索的方法的更詳細(xì)的理解。
      圖10示出了根據(jù)本發(fā)明的實(shí)施例的用于實(shí)現(xiàn)元數(shù)據(jù)搜索的方法。如圖 所示,該方法包括如下步驟
      在步驟1002,接收針對(duì)多個(gè)元數(shù)據(jù)資源的搜索查詢,其中所述搜索查 詢中指定了元數(shù)據(jù)資源中的文本信息,而沒(méi)有指定元數(shù)據(jù)資源之間的結(jié)構(gòu) 信息,或者僅指定了元數(shù)據(jù)資源之間的部分結(jié)構(gòu)信息。
      在步驟1003,分析所述搜索查詢,并根據(jù)對(duì)所述搜索查詢的分析搜索 相關(guān)的元數(shù)據(jù)資源以及所勤目關(guān)的元數(shù)據(jù)資源之間的結(jié)構(gòu)信息,從而形成 搜索結(jié)果,其中所述搜索結(jié)果中包含了所勤目關(guān)的元數(shù)據(jù)資源之間的完整的結(jié)構(gòu)信息。
      在步驟1004,輸出所述搜索結(jié)果,從而實(shí)現(xiàn)了針對(duì)所述多個(gè)元數(shù)據(jù)資 源的模糊結(jié)構(gòu)搜索。
      根據(jù)本發(fā)明的實(shí)施例,該方法還包括可選步驟IOOI,在該步驟中對(duì)所 述多個(gè)元數(shù)據(jù)資源進(jìn)行索引,以生成關(guān)于所述多個(gè)元數(shù)據(jù)資源中的文本的
      徑的信息的結(jié)構(gòu)索引;且其中,所述搜索查詢,并生成搜索結(jié)果是通過(guò)使 用所述文本索引以及所述結(jié)構(gòu)索SI執(zhí)行的。
      根據(jù)本發(fā)明的實(shí)施例,所述文本索引存儲(chǔ)了所述多個(gè)元數(shù)據(jù)資源中的
      屬的屬性之間的映射,還存儲(chǔ)了所述元數(shù)據(jù)資源的類型信息。
      根據(jù)本發(fā)明的實(shí)施例,所述結(jié)構(gòu)索引是由兩級(jí)散列表實(shí)現(xiàn)的,且第一
      級(jí)散列表中的條目是作為所述關(guān)系路徑的終節(jié)點(diǎn)的元數(shù)據(jù)資源的標(biāo)識(shí),而
      第二級(jí)散列表中的條目是作為所述關(guān)系路徑的起始節(jié)點(diǎn)的元數(shù)據(jù)資源的標(biāo)
      識(shí)以及所述關(guān)系路徑的信息。
      根據(jù)本發(fā)明的實(shí)施例,所述關(guān)系路徑包括元數(shù)據(jù)資源對(duì)之間的直接
      關(guān)系路徑;元數(shù)據(jù)資源對(duì)之間的包括等價(jià)關(guān)系的間接關(guān)系路徑;以及元數(shù)
      據(jù)資源對(duì)之間的包括包含關(guān)系的間接關(guān)系路徑。
      根據(jù)本發(fā)明的實(shí)施例,所述搜索查詢的類型為包含以下任何一個(gè)或多
      個(gè)類型的組中的一個(gè)
      查詢類型一,其中搜索查詢指定了一組關(guān)鍵字,用于獲得其文本片段
      包含所指定的一組關(guān)鍵字的元數(shù)據(jù)資源;
      查詢類型二,其中搜索查詢指定了一組關(guān)鍵字,用于獲得這樣的元數(shù)
      據(jù)資源,所述元數(shù)據(jù)資源具有到其文本片段包含所指定的一組關(guān)鍵字的元
      數(shù)據(jù)資源的關(guān)系路徑;
      查詢類型三,其中搜索查詢指定了一組關(guān)鍵字以及元數(shù)據(jù)資源類型,
      用于獲得其文本片段包含所指定的一組關(guān)鍵字且其類型為所指定類型的元
      數(shù)據(jù)資源;查詢類型四,其中搜索查詢指定了一組關(guān)鍵字以及元數(shù)據(jù)資源類型,用于獲得這樣的元數(shù)據(jù)資源,所述元數(shù)據(jù)資源的類型為所指定類型且具有
      到其文本片段包含所指定的 一組關(guān)鍵字的元數(shù)據(jù)資源的關(guān)系路徑;以及
      查詢類型五,其中搜索查詢指定了第一組關(guān)鍵字、第二組關(guān)鍵字以及關(guān)系,用于獲得第一元數(shù)據(jù)資源,所述第一元數(shù)據(jù)資源具有到第二元數(shù)據(jù)資源的關(guān)系路徑且該關(guān)系路徑包含所指定的關(guān)系,所述第 一元數(shù)據(jù)資源包含第 一組關(guān)鍵字或具有到包含第 一組關(guān)鍵字的元數(shù)據(jù)資源的關(guān)系路徑,所述第二元數(shù)據(jù)資源包含第二組關(guān)鍵字或具有到包含第二組關(guān)鍵字的元數(shù)據(jù)資源的關(guān)系路徑。
      根據(jù)本發(fā)明的實(shí)施例,在所述步驟1004中,還可以可選地對(duì)所述搜索結(jié)果中響應(yīng)于所述搜索查詢所獲得的元數(shù)據(jù)資源進(jìn)行排序,且所述排序是根據(jù)基于關(guān)鍵字匹配的度量以及基于所獲得的元數(shù)據(jù)資源與包含搜索查詢中指定的關(guān)鍵字的元數(shù)據(jù)資源之間的路徑的度量進(jìn)行的。
      根據(jù)本發(fā)明的實(shí)施例,在所述步驟1004中,還可以可選地顯示所述搜索結(jié)果,包括響應(yīng)于所述搜索查詢所獲得的元數(shù)據(jù)資源或其部分和/或到所述元數(shù)據(jù)資源的鏈接,以及響應(yīng)于所述搜索查詢所獲得的元數(shù)據(jù)資源與包含所述搜索查詢中指定的關(guān)鍵字的元數(shù)據(jù)資源之間的關(guān)系路徑或用于在被點(diǎn)擊時(shí)顯示所述關(guān)系路徑的鏈接。
      以上描述了根據(jù)本發(fā)明的實(shí)施例的用于實(shí)現(xiàn)元數(shù)據(jù)搜索的方法,應(yīng)指出的是,以上描述僅為示例性說(shuō)明,而不是對(duì)本發(fā)明的限制。例如,在本發(fā)明的一些實(shí)施例中,該方法可不包括以上可選步驟中的一個(gè)或多個(gè)。
      本發(fā)明可以硬件、軟件、或硬件與軟件的結(jié)合的方式實(shí)現(xiàn)。本發(fā)明可以集中的方式在一個(gè)計(jì)算機(jī)系統(tǒng)中實(shí)現(xiàn),或以分布方式實(shí)現(xiàn),在這種分布方式中,不同的部件分布在若干互連的計(jì)算機(jī)系統(tǒng)中。適于執(zhí)行本文中描述的方法的任何計(jì)算機(jī)系統(tǒng)或其它裝置都是合適的。 一種典型的硬件和軟件的組合可以是帶有計(jì)算機(jī)程序的通用計(jì)算機(jī)系統(tǒng),當(dāng)該計(jì)算機(jī)程序#>載和執(zhí)行時(shí),控制該計(jì)算機(jī)系統(tǒng)而使其執(zhí)行本發(fā)明的方法,并構(gòu)成本發(fā)明的裝置。本發(fā)明也可體現(xiàn)在計(jì)算機(jī)程序產(chǎn)品中,該程序產(chǎn)品包含使能實(shí)現(xiàn)本文 中描述的方法的所有特征,并且當(dāng)其#>載到計(jì)算機(jī)系統(tǒng)中時(shí),能夠執(zhí)行 所述方法。
      盡管已參照優(yōu)選實(shí)施例具體示出和說(shuō)明了本發(fā)明,但是本領(lǐng)域內(nèi)的那 些技術(shù)人員應(yīng)理解,可在形式和細(xì)節(jié)上對(duì)其進(jìn)行各種改變而不會(huì)背離本發(fā) 明的精神和范圍。
      權(quán)利要求
      1.一種用于實(shí)現(xiàn)元數(shù)據(jù)搜索的系統(tǒng),包括接收模塊,其用于接收針對(duì)多個(gè)元數(shù)據(jù)資源的搜索查詢,其中所述搜索查詢中指定了元數(shù)據(jù)資源中的文本信息,而沒(méi)有指定元數(shù)據(jù)資源之間的結(jié)構(gòu)信息,或者僅指定了元數(shù)據(jù)資源之間的部分結(jié)構(gòu)信息;查詢處理器,其用于分析所述搜索查詢,并根據(jù)對(duì)所述搜索查詢的分析搜索相關(guān)的元數(shù)據(jù)資源以及所述相關(guān)的元數(shù)據(jù)資源之間的結(jié)構(gòu)信息,從而形成搜索結(jié)果,其中所述搜索結(jié)果中包含了所述相關(guān)的元數(shù)據(jù)資源之間的完整的結(jié)構(gòu)信息;以及輸出模塊,其用于輸出所述搜索結(jié)果,從而實(shí)現(xiàn)了針對(duì)所述多個(gè)元數(shù)據(jù)資源的模糊結(jié)構(gòu)搜索。
      2. 根據(jù)權(quán)利要求l的系統(tǒng),還包括索引器,其用于對(duì)所述多個(gè)元數(shù)據(jù)資源進(jìn)行索引,以生成關(guān)于所述多個(gè)元數(shù)據(jù)資源中的文本的文本索引以及存儲(chǔ)了所述多個(gè)元數(shù)據(jù)資源中的元數(shù)據(jù)資源對(duì)之間的關(guān)系路徑的信息的結(jié)構(gòu)索引;且其中,所述查詢處理器用于通過(guò)使用所述文本索引以及所述結(jié)構(gòu)索引來(lái)處理所述搜索查詢,并生成搜索結(jié)果。
      3. 根據(jù)權(quán)利要求2的系統(tǒng),其中,所述文本索引存儲(chǔ)了所述多個(gè)元數(shù)據(jù)資源中的文本片段或其部分與相應(yīng)的元數(shù)據(jù)資源以及存儲(chǔ)了所述元數(shù)據(jù)資源的類型信息。
      4. 根據(jù)權(quán)利要求2的系統(tǒng),其中,所述結(jié)構(gòu)索引是由兩級(jí)散列表實(shí)現(xiàn)的,且第一級(jí)散列表中的條目是作為所述關(guān)系路徑的終節(jié)點(diǎn)的元數(shù)據(jù)資源的標(biāo)識(shí),而第二級(jí)散列表中的條目是作為所述關(guān)系路徑的起始節(jié)點(diǎn)的元數(shù)據(jù)資源的標(biāo)識(shí)以及所述關(guān)系路徑的信息。
      5. 根據(jù)權(quán)利要求2的系統(tǒng),其中,所述關(guān)系路徑包括元數(shù)據(jù)資源對(duì)之間的直接關(guān)系路徑;元數(shù)據(jù)資源對(duì)之間的包括等價(jià)關(guān)系的關(guān)系路徑;以及元數(shù)據(jù)資源對(duì)之間的包括包含關(guān)系的關(guān)系路徑。
      6. 根據(jù)權(quán)利要求1的系統(tǒng),其中,所述搜索查詢的類型為包含以下任何一個(gè)或多個(gè)類型的組中的一個(gè)查詢類型一,其中搜索查詢指定了一組關(guān)鍵字,用于搜索其文本片段包含所指定的一組關(guān)鍵字的元數(shù)據(jù)資源;查詢類型二,其中搜索查詢指定了一組關(guān)鍵字,用于搜索這樣的元數(shù)據(jù)資源,所述元數(shù)據(jù)資源具有到其文本片段包含所指定的一組關(guān)鍵字的元數(shù)據(jù)資源的關(guān)系路徑;查詢類型三,其中搜索查詢指定了一組關(guān)鍵字以及元數(shù)據(jù)資源類型,用于搜索其文本片段包含所指定的一組關(guān)鍵字且其類型為所指定類型的元數(shù)據(jù)資源;查詢類型四,其中搜索查詢指定了一組關(guān)鍵字以及元數(shù)據(jù)資源類型,用于搜索這樣的元數(shù)據(jù)資源,所迷元數(shù)據(jù)資源的類型為所指定類型且具有到其文本片段包含所指定的一組關(guān)鍵字的元數(shù)據(jù)資源的關(guān)系路徑;以及查詢類型五,其中搜索查詢指定了第一組關(guān)鍵字、第二組關(guān)鍵字以及關(guān)系,用于搜索第一元數(shù)據(jù)資源,所述第一元數(shù)據(jù)資源具有到第二元數(shù)據(jù)資源的關(guān)系路徑且該關(guān)系路徑包含所指定的關(guān)系,所述第一元數(shù)據(jù)資源包含第一組關(guān)鍵字或具有到包含第一組關(guān)鍵字的元數(shù)據(jù)資源的關(guān)系路徑,所述第二元數(shù)據(jù)資源包含第二組關(guān)鍵字或具有到包含第二組關(guān)鍵字的元數(shù)據(jù)資源的關(guān)系路徑。
      7. 根據(jù)權(quán)利要求6的系統(tǒng),其中所述查詢類型二用于搜索如下元數(shù)據(jù)資源其文本片段中包含所指定的一組關(guān)鍵字的元數(shù)據(jù)資源S,具有到S中的任何一個(gè)元數(shù)據(jù)資源的直接關(guān)系路徑的元數(shù)據(jù)資源s,,以及具有到s,中的任何一個(gè)元數(shù)據(jù)資源的包括等價(jià)關(guān)系或包含關(guān)系的關(guān)系路徑的元數(shù)據(jù)資源類型;且所述查詢類型四用于搜索如下元數(shù)據(jù)資源類型為指定類型且其文本片段中包含所指定的一組關(guān)鍵字的元數(shù)據(jù)資源S,類型為指定類型且具有到S中的任何一個(gè)元數(shù)據(jù)資源的直接關(guān)系路徑的元數(shù)據(jù)資源S,,以及類型為指定類型且具有到S,中的任何一個(gè)元數(shù)據(jù)資源的包括等價(jià)關(guān)系或包含關(guān)系的關(guān)系路徑的元數(shù)據(jù)資源。
      8. 根據(jù)權(quán)利要求l的系統(tǒng),其中,所述輸出模塊還用于顯示所述搜索結(jié)果,包括響應(yīng)于所述搜索查詢所獲得的元數(shù)據(jù)資源或其部分和/或到所述元數(shù)據(jù)資源的鏈接,以及響應(yīng)于所述搜索查詢所獲得的元數(shù)據(jù)資源與包含所述搜索查詢中指定的關(guān)鍵字的元數(shù)據(jù)資源之間的關(guān)系路徑或用于在被點(diǎn)擊時(shí)顯示所述關(guān)系路徑的鏈接。
      9. 根據(jù)權(quán)利要求1的系統(tǒng),其中,所述輸出模塊還用于對(duì)所述搜索結(jié)果中響應(yīng)于所述搜索查詢所獲得的元數(shù)據(jù)資源進(jìn)行排序,且所述排序是根據(jù)基于關(guān)鍵字匹配的度量以及基于所獲得的元數(shù)據(jù)資源與包含搜索查詢中指定的關(guān)鍵字的元數(shù)據(jù)資源之間的路徑的度量進(jìn)行的。
      10. —種用于實(shí)現(xiàn)元數(shù)據(jù)搜索的方法,包括接收針對(duì)多個(gè)元數(shù)據(jù)資源的搜索查詢,其中所述搜索查詢中指定了元數(shù)據(jù)資源中的文本信息,而沒(méi)有指定元數(shù)據(jù)資源之間的結(jié)構(gòu)信息,或者僅指定了元數(shù)據(jù)資源之間的部分結(jié)構(gòu)信息;分析所述搜索查詢,并根據(jù)對(duì)所述搜索查詢的分析搜索相關(guān)的元數(shù)據(jù)資源以及所述相關(guān)的元數(shù)據(jù)資源之間的結(jié)構(gòu)信息,從而形成搜索結(jié)果,其中所述搜索結(jié)果包含了元數(shù)據(jù)資源之間的完整的結(jié)構(gòu)信息;以及輸出所述搜索結(jié)果,從而實(shí)現(xiàn)了針對(duì)所述多個(gè)元數(shù)據(jù)資源的模糊結(jié)構(gòu)搜索。
      11.根據(jù)權(quán)利要求10的方法,還包括對(duì)所述多個(gè)元數(shù)據(jù)資源進(jìn)行索引,以生成關(guān)于所述多個(gè)元數(shù)元數(shù)據(jù)資源對(duì)之間的關(guān)系路徑的信息的結(jié)構(gòu)索引;且其中,所述搜索查詢,并生成搜索結(jié)果是通過(guò)使用所述文本索引以及所述結(jié)構(gòu)索引執(zhí)行的。
      12.根據(jù)權(quán)利要求11的方法,其中,所述文本索引存儲(chǔ)了所本片段在相應(yīng)的元數(shù)據(jù)資源中所屬的屬性之間的映射,還存儲(chǔ)了 所述元數(shù)據(jù)資源的類型信息。
      13. 根據(jù)權(quán)利要求11的方法,其中,所述結(jié)構(gòu)索引是由兩級(jí) 散列表實(shí)現(xiàn)的,且第一級(jí)散列表中的條目是作為所述關(guān)系路徑的 終節(jié)點(diǎn)的元數(shù)據(jù)資源的標(biāo)識(shí),而第二級(jí)散列表中的條目是作為所 述關(guān)系路徑的起始節(jié)點(diǎn)的元數(shù)據(jù)資源的標(biāo)識(shí)以及所述關(guān)系路徑的 信息。
      14. 根據(jù)權(quán)利要求11的方法,其中,所述關(guān)系路徑包括 元數(shù)據(jù)資源對(duì)之間的直接關(guān)系路徑; 元數(shù)據(jù)資源對(duì)之間的包括等價(jià)關(guān)系的關(guān)系路徑;以及 元數(shù)據(jù)資源對(duì)之間的包括包含關(guān)系的關(guān)系路徑。
      15. 根據(jù)權(quán)利要求10的方法,其中,所述搜索查詢的類型為 包含以下任何一個(gè)或多個(gè)類型的組中的一個(gè)查詢類型一,其中搜索查詢指定了一組關(guān)鍵字,用于獲得其文本片段包含所指定的一組關(guān)鍵字的元數(shù)據(jù)資源;查詢類型二,其中搜索查詢指定了一組關(guān)鍵字,用于獲得這 樣的元數(shù)據(jù)資源,所述元數(shù)據(jù)資源具有到其文本片段包含所指定的一組關(guān)鍵字的元數(shù)據(jù)資源的關(guān)系路徑;查詢類型三,其中搜索查詢指定了一組關(guān)鍵字以及元數(shù)據(jù)資 源類型,用于獲得其文本片段包含所指定的一組關(guān)鍵字且其類型為所指定類型的元數(shù)據(jù)資源;查詢類型四,其中搜索查詢指定了一組關(guān)鍵字以及元數(shù)據(jù)資 源類型,用于獲得這樣的元數(shù)據(jù)資源,所述元數(shù)據(jù)資源的類型為 所指定類型且具有到其文本片段包含所指定的一組關(guān)鍵字的元數(shù) 據(jù)資源的關(guān)系路徑;以及查詢類型五,其中搜索查詢指定了第一組關(guān)鍵字、第二組關(guān) 鍵字以及關(guān)系,用于獲得第一元數(shù)據(jù)資源,所述第一元數(shù)據(jù)資源 具有到第二元數(shù)據(jù)資源的關(guān)系路徑且該關(guān)系路徑包含所指定的關(guān) 系,所述第一元數(shù)據(jù)資源包含第一組關(guān)鍵字或具有到包含第一組 關(guān)鍵字的元數(shù)據(jù)資源的關(guān)系路徑,所述第二元數(shù)據(jù)資源包含第二 組關(guān)鍵字或具有到包含第二組關(guān)鍵字的元數(shù)據(jù)資源的關(guān)系路徑。
      16. 根據(jù)權(quán)利要求15的方法,其中所述查詢類型二用于搜索 如下元數(shù)據(jù)資源其文本片段中包含所指定的一組關(guān)鍵字的元數(shù)據(jù) 資源S,具有到S中的任何一個(gè)元數(shù)據(jù)資源的直接關(guān)系路徑的元 數(shù)據(jù)資源S,,以及具有到S,中的任何一個(gè)元數(shù)據(jù)資源的包括等價(jià) 關(guān)系或包含關(guān)系的關(guān)系路徑的元數(shù)據(jù)資源類型;且所述查詢類型 四用于搜索如下元數(shù)據(jù)資源類型為指定類型且其文本片段中包 含所指定的一組關(guān)鍵字的元數(shù)據(jù)資源S,類型為指定類型且具有到 S中的任何一個(gè)元數(shù)據(jù)資源的直接關(guān)系路徑的元數(shù)據(jù)資源S,,以 及類型為指定類型且具有到S,中的任何一個(gè)元數(shù)據(jù)資源的包括等 價(jià)關(guān)系或包含關(guān)系的關(guān)系路徑的元數(shù)據(jù)資源。
      17. 根據(jù)權(quán)利要求10的方法,其中所述輸出搜索結(jié)果進(jìn)一步 包括顯示所述搜索結(jié)果,包括響應(yīng)于所述搜索查詢所獲得的元數(shù) 據(jù)資源或其部分和/或到所述元數(shù)據(jù)資源的鏈接,以及響應(yīng)于所述 搜索查詢所獲得的元數(shù)據(jù)資源與包含所述搜索查詢中指定的關(guān)鍵 字的元數(shù)據(jù)資源之間的關(guān)系路徑或用于在被點(diǎn)擊時(shí)顯示所述關(guān)系 路徑的鏈接。
      18.根據(jù)權(quán)利要求10的方法,其中所述輸出搜索結(jié)果還包括 對(duì)所述搜索結(jié)果中響應(yīng)于所述搜索的元數(shù)據(jù)資源進(jìn)行排序, 且所述排序是根據(jù)基于關(guān)鍵字匹配的度量以及基于所獲得的元數(shù) 據(jù)資源與包含搜索查詢中指定的關(guān)鍵字的元數(shù)據(jù)資源之間的路徑 的度量進(jìn)行的。
      全文摘要
      提出了一種用于實(shí)現(xiàn)元數(shù)據(jù)搜索的系統(tǒng)和方法,該系統(tǒng)包括接收模塊,其用于接收針對(duì)多個(gè)元數(shù)據(jù)資源的搜索查詢,其中所述搜索查詢中指定了元數(shù)據(jù)資源中的文本信息,而沒(méi)有指定元數(shù)據(jù)資源之間的結(jié)構(gòu)信息,或者僅指定了元數(shù)據(jù)資源之間的部分結(jié)構(gòu)信息;查詢處理器,其用于分析所述搜索查詢,并根據(jù)對(duì)所述搜索查詢的分析搜索相關(guān)的元數(shù)據(jù)資源以及相關(guān)的元數(shù)據(jù)資源之間的結(jié)構(gòu)信息,從而形成搜索結(jié)果,其中所述搜索結(jié)果中包含了相關(guān)的元數(shù)據(jù)資源之間的完整的結(jié)構(gòu)信息;以及輸出模塊,其用于輸出所述搜索結(jié)果,從而實(shí)現(xiàn)了針對(duì)所述多個(gè)元數(shù)據(jù)資源的模糊結(jié)構(gòu)搜索。這樣,不僅能夠搜索元數(shù)據(jù)資源中的文本信息,而且能夠獲得元數(shù)據(jù)資源中的結(jié)構(gòu)信息,同時(shí),不需要用戶了解和指明元數(shù)據(jù)資源中的精確結(jié)構(gòu),從而方便了用戶的搜索操作。
      文檔編號(hào)G06F17/30GK101685444SQ20081014981
      公開(kāi)日2010年3月31日 申請(qǐng)日期2008年9月27日 優(yōu)先權(quán)日2008年9月27日
      發(fā)明者淵 倪, 越 潘, 謝國(guó)彤 申請(qǐng)人:國(guó)際商業(yè)機(jī)器公司
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1