国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      存儲(chǔ)數(shù)據(jù)的方法和設(shè)備的制造方法

      文檔序號(hào):8259004閱讀:383來(lái)源:國(guó)知局
      存儲(chǔ)數(shù)據(jù)的方法和設(shè)備的制造方法
      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及互聯(lián)網(wǎng)領(lǐng)域,特別涉及存儲(chǔ)數(shù)據(jù)的方法和設(shè)備。
      【背景技術(shù)】
      [0002]目前,在網(wǎng)絡(luò)搜索查詢時(shí),用戶的查詢?cè)~中會(huì)包含大量的精確意圖,這些精確意圖是無(wú)法通過(guò)網(wǎng)頁(yè)粒度得到滿足,是需要在查詢時(shí)直接返回答案的。例如:查詢“劉德華的身高”,期望返回“174CM”;查詢“身高超過(guò)180cm的明星”,期望返回結(jié)果如“古巨基,鄭少秋”等身高在規(guī)定范圍的明星列表;輸入“唐宋八大家”,期望返回“柳宗元”等人。
      [0003]然而,傳統(tǒng)的搜索產(chǎn)品是通過(guò)比對(duì)用戶的查詢?cè)~和收錄網(wǎng)頁(yè)的文本匹配程度返回網(wǎng)頁(yè)鏈接作為查詢結(jié)果,通過(guò)相關(guān)性算法保證返回的結(jié)果符合用戶的查詢意圖。但是,用戶需要連接到所找到的網(wǎng)頁(yè),進(jìn)行閱讀,才能得到所需要的答案。
      [0004]目前,一些搜索公司開(kāi)始采用知識(shí)庫(kù)系統(tǒng)對(duì)知識(shí)進(jìn)行結(jié)構(gòu)化描述,建立實(shí)體間關(guān)系,但是現(xiàn)有知識(shí)庫(kù)系統(tǒng)通常使用節(jié)點(diǎn)-邊-節(jié)點(diǎn)三元組的簡(jiǎn)單數(shù)據(jù)結(jié)構(gòu)來(lái)表示實(shí)體屬性和實(shí)體關(guān)系,這樣會(huì)產(chǎn)生存在許多相同實(shí)體的冗余節(jié)點(diǎn)。
      [0005]另一方面,使用三元組的知識(shí)庫(kù)由于表示過(guò)于松散,也存在查詢時(shí)需要對(duì)返回結(jié)果進(jìn)行大量的過(guò)濾及數(shù)據(jù)組合拼接操作的問(wèn)題,不便于后期的查詢操作。
      [0006]因此,需要一種節(jié)省存儲(chǔ)空間,又便于查詢的數(shù)據(jù)存儲(chǔ)的方法和設(shè)備。

      【發(fā)明內(nèi)容】

      [0007]本發(fā)明所要解決的一個(gè)技術(shù)問(wèn)題是提供了一種節(jié)省存儲(chǔ)空間,又便于查詢的數(shù)據(jù)存儲(chǔ)的方法和設(shè)備。
      [0008]根據(jù)本發(fā)明的一個(gè)方面,提供了一種存儲(chǔ)數(shù)據(jù)的方法,包括:
      [0009]從網(wǎng)頁(yè)中獲取與實(shí)體相關(guān)的實(shí)體相關(guān)數(shù)據(jù),實(shí)體相關(guān)數(shù)據(jù)包括表示實(shí)體的實(shí)體數(shù)據(jù)、描述實(shí)體的屬性的實(shí)體屬性數(shù)據(jù)、以及描述兩個(gè)實(shí)體之間的關(guān)系的實(shí)體間關(guān)系數(shù)據(jù);
      [0010]將實(shí)體數(shù)據(jù)和與其對(duì)應(yīng)的實(shí)體屬性數(shù)據(jù)關(guān)聯(lián)地存儲(chǔ)在實(shí)體數(shù)據(jù)庫(kù)中;以及
      [0011]將實(shí)體間關(guān)系數(shù)據(jù)存儲(chǔ)在關(guān)系數(shù)據(jù)庫(kù)中。
      [0012]由此,將實(shí)體數(shù)據(jù)及其屬性數(shù)據(jù)集中存儲(chǔ)在實(shí)體數(shù)據(jù)庫(kù),而將實(shí)體間關(guān)系數(shù)據(jù)區(qū)分存儲(chǔ)到關(guān)系數(shù)據(jù)庫(kù);這種數(shù)據(jù)存儲(chǔ)方法避免了數(shù)據(jù)存儲(chǔ)冗余和查詢聚合,節(jié)省存儲(chǔ)空間,又便于查詢。另外,實(shí)體數(shù)據(jù)字段可以對(duì)應(yīng)一個(gè)或多個(gè)可變屬性字段實(shí)體,使得同一實(shí)體的屬性數(shù)據(jù)信息整合存儲(chǔ),避免了在線查詢時(shí)需要聚合大量的屬性信息的問(wèn)題,也不需要對(duì)查詢返回結(jié)果進(jìn)行大量的過(guò)濾及數(shù)據(jù)組合拼接操作,從而大量地節(jié)省了查詢時(shí)間,進(jìn)一步提升了用戶體驗(yàn)。
      [0013]優(yōu)選地,實(shí)體數(shù)據(jù)庫(kù)中針對(duì)一個(gè)實(shí)體的記錄可以包括實(shí)體數(shù)據(jù)字段和一個(gè)或多個(gè)與實(shí)體數(shù)據(jù)字段相關(guān)聯(lián)的可變屬性字段,其中,將實(shí)體數(shù)據(jù)存儲(chǔ)在實(shí)體數(shù)據(jù)字段中,將實(shí)體屬性數(shù)據(jù)存儲(chǔ)在可變屬性字段中。
      [0014]優(yōu)選地,關(guān)系數(shù)據(jù)庫(kù)中的每條記錄可以包括兩個(gè)節(jié)點(diǎn)和邊信息,其中,將分別表示兩個(gè)實(shí)體的兩個(gè)實(shí)體數(shù)據(jù)分別存儲(chǔ)在兩個(gè)節(jié)點(diǎn)中,將表示兩個(gè)實(shí)體之間的關(guān)系的實(shí)體間關(guān)系數(shù)據(jù)存儲(chǔ)在邊信息中。
      [0015]優(yōu)選地,實(shí)體數(shù)據(jù)庫(kù)中針對(duì)一個(gè)實(shí)體的記錄還可以包括元信息字段。
      [0016]實(shí)體相關(guān)數(shù)據(jù)還可以包括與實(shí)體相關(guān)的元信息,元信息是使實(shí)體區(qū)別于其他實(shí)體的信息。
      [0017]該方法還可以包括:將元信息存儲(chǔ)在實(shí)體數(shù)據(jù)庫(kù)中針對(duì)實(shí)體的記錄中的元信息字段中。
      [0018]這樣,作為實(shí)體數(shù)據(jù)中的核心信息數(shù)據(jù),元信息,就將不同的實(shí)體和實(shí)體數(shù)據(jù)進(jìn)行了區(qū)分,特別是相同實(shí)體名稱的不同實(shí)體。以便后期在對(duì)實(shí)體查詢的時(shí)候可以準(zhǔn)確地獲得實(shí)體的相關(guān)信息。
      [0019]優(yōu)選地,實(shí)體相關(guān)數(shù)據(jù)還可以包括描述實(shí)體的類別的實(shí)體類別數(shù)據(jù)。該方法還可以包括:將與實(shí)體類別數(shù)據(jù)對(duì)應(yīng)的類別標(biāo)簽存儲(chǔ)在實(shí)體數(shù)據(jù)庫(kù)中針對(duì)實(shí)體的記錄中的元信息字段中,作為元信息字段中存儲(chǔ)的內(nèi)容的一部分。
      [0020]其中,在類別數(shù)據(jù)庫(kù)中,對(duì)應(yīng)地存儲(chǔ)有多個(gè)實(shí)體類別數(shù)據(jù)和類別標(biāo)簽,多個(gè)實(shí)體類別數(shù)據(jù)被劃分為多個(gè)層次,較低層次的實(shí)體類別數(shù)據(jù)從屬于與其關(guān)聯(lián)的較高層次的實(shí)體類別數(shù)據(jù)。
      [0021]這樣,將實(shí)體類別數(shù)據(jù)分層次存儲(chǔ),使得實(shí)體相關(guān)數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu)靈活,分類清晰。
      [0022]優(yōu)選地,在類別數(shù)據(jù)庫(kù)中,可以與每個(gè)實(shí)體類別數(shù)據(jù)關(guān)聯(lián)地存儲(chǔ)有針對(duì)該實(shí)體類別數(shù)據(jù)所表示的實(shí)體類別定義的實(shí)體類別相關(guān)屬性。
      [0023]獲取實(shí)體屬性數(shù)據(jù)的步驟可以包括:
      [0024]從類別數(shù)據(jù)庫(kù)獲得針對(duì)該實(shí)體所屬的實(shí)體類別定義的實(shí)體類別相關(guān)屬性;以及
      [0025]從網(wǎng)頁(yè)中獲取描述該實(shí)體類別相關(guān)屬性的實(shí)體屬性數(shù)據(jù)。
      [0026]這樣,可以根據(jù)實(shí)體類別有針對(duì)性地獲取實(shí)體屬性數(shù)據(jù),便于響應(yīng)后期針對(duì)性地查詢操作。在獲取實(shí)體屬性數(shù)據(jù)時(shí),針對(duì)具體的實(shí)體,可以根據(jù)其類別,有針對(duì)性地獲取實(shí)體屬性數(shù)據(jù),而不必去考慮與其無(wú)關(guān)的實(shí)體屬性數(shù)據(jù)。例如,不會(huì)針對(duì)演員獲取其國(guó)土面積。
      [0027]優(yōu)選地,可以將從多個(gè)網(wǎng)頁(yè)獲取的針對(duì)同一個(gè)實(shí)體的實(shí)體相關(guān)數(shù)據(jù)整合在一起;和/或
      [0028]將所獲取的實(shí)體相關(guān)數(shù)據(jù)轉(zhuǎn)換為用標(biāo)準(zhǔn)方式表示的實(shí)體相關(guān)數(shù)據(jù)。
      [0029]這樣,將所獲得的同一實(shí)體相關(guān)數(shù)據(jù)整理,并將表達(dá)方式不同的實(shí)體相關(guān)數(shù)據(jù)統(tǒng)一化處理,避免了存儲(chǔ)冗余問(wèn)題。
      [0030]優(yōu)選地,當(dāng)針對(duì)同一個(gè)實(shí)體的同一個(gè)實(shí)體屬性所獲取的多個(gè)實(shí)體屬性數(shù)據(jù)不同時(shí),可以保留置信度高的實(shí)體屬性數(shù)據(jù),并刪除置信度低的實(shí)體屬性數(shù)據(jù)。
      [0031]這樣,可以保證所存儲(chǔ)的實(shí)體屬性數(shù)據(jù)的可靠性和準(zhǔn)確性。
      [0032]根據(jù)本發(fā)明的另一個(gè)方面,提供了一種用于存儲(chǔ)數(shù)據(jù)的設(shè)備,包括:
      [0033]數(shù)據(jù)獲取裝置,用于從網(wǎng)頁(yè)中獲取與實(shí)體相關(guān)的實(shí)體相關(guān)數(shù)據(jù),數(shù)據(jù)獲取裝置包括:
      [0034]實(shí)體數(shù)據(jù)獲取裝置,用于從網(wǎng)頁(yè)中獲取表示實(shí)體的實(shí)體數(shù)據(jù);
      [0035]屬性數(shù)據(jù)獲取裝置,用于從網(wǎng)頁(yè)中獲取描述實(shí)體的屬性的實(shí)體屬性數(shù)據(jù);以及
      [0036]關(guān)系數(shù)據(jù)獲取裝置,用于從網(wǎng)頁(yè)中獲取描述兩個(gè)實(shí)體之間的關(guān)系的實(shí)體間關(guān)系數(shù)據(jù);
      [0037]實(shí)體數(shù)據(jù)庫(kù)存儲(chǔ)裝置,用于將實(shí)體數(shù)據(jù)和與其對(duì)應(yīng)的實(shí)體屬性數(shù)據(jù)關(guān)聯(lián)地存儲(chǔ)在實(shí)體數(shù)據(jù)庫(kù)中;以及
      [0038]關(guān)系數(shù)據(jù)庫(kù)存儲(chǔ)裝置,用于將實(shí)體間關(guān)系數(shù)據(jù)存儲(chǔ)在關(guān)系數(shù)據(jù)庫(kù)中。
      [0039]優(yōu)選地,實(shí)體數(shù)據(jù)庫(kù)中針對(duì)一個(gè)實(shí)體的記錄可以包括實(shí)體數(shù)據(jù)字段和一個(gè)或多個(gè)與實(shí)體數(shù)據(jù)字段相關(guān)聯(lián)的可變屬性字段,實(shí)體數(shù)據(jù)庫(kù)存儲(chǔ)裝置可以包括:
      [0040]實(shí)體數(shù)據(jù)存儲(chǔ)裝置,用于將實(shí)體數(shù)據(jù)存儲(chǔ)在實(shí)體數(shù)據(jù)字段中;以及
      [0041]屬性數(shù)據(jù)存儲(chǔ)裝置,用于將實(shí)體屬性數(shù)據(jù)存儲(chǔ)在可變屬性字段中。
      [0042]優(yōu)選地,關(guān)系數(shù)據(jù)庫(kù)中的每條記錄可以包括兩個(gè)節(jié)點(diǎn)和邊信息,其中,將分別表示兩個(gè)實(shí)體的兩個(gè)實(shí)體數(shù)據(jù)分別存儲(chǔ)在兩個(gè)節(jié)點(diǎn)中,將表示兩個(gè)實(shí)體之間的關(guān)系的實(shí)體間關(guān)系數(shù)據(jù)存儲(chǔ)在邊信息中。
      [0043]優(yōu)選地,實(shí)體數(shù)據(jù)庫(kù)中針對(duì)一個(gè)實(shí)體的記錄還可以包括元信息字段。
      [0044]數(shù)據(jù)獲取裝置還可以包括元信息獲取裝置,用于從網(wǎng)頁(yè)中獲取與實(shí)體相關(guān)的元信息,元信息是使實(shí)體區(qū)別于其他實(shí)體的信息;并且
      [0045]實(shí)體數(shù)據(jù)庫(kù)存儲(chǔ)裝置還可以包括元信息存儲(chǔ)裝置,用于將元信息存儲(chǔ)在實(shí)體數(shù)據(jù)庫(kù)中針對(duì)實(shí)體的記錄中的元信息字段。
      [0046]優(yōu)選地,數(shù)據(jù)獲取裝置還可以包括類別數(shù)據(jù)獲取裝置,用于從網(wǎng)頁(yè)中獲取描述實(shí)體類別的實(shí)體類別數(shù)據(jù)。
      [0047]元信息存儲(chǔ)裝置可以包括類別數(shù)據(jù)存儲(chǔ)裝置,用于將與實(shí)體類別數(shù)據(jù)對(duì)應(yīng)的類別標(biāo)簽存儲(chǔ)在實(shí)體數(shù)據(jù)庫(kù)中針對(duì)實(shí)體的記錄中的元信息字段中,作為元信息字段中存儲(chǔ)的內(nèi)容的一部分。
      [0048]在類別數(shù)據(jù)庫(kù)中,可以對(duì)應(yīng)地存儲(chǔ)有多個(gè)實(shí)體類別數(shù)據(jù)和類別標(biāo)簽,多個(gè)實(shí)體類別數(shù)據(jù)被劃分為多個(gè)層次,較低層次的實(shí)體類別數(shù)據(jù)從屬于與其關(guān)聯(lián)的較高層次的實(shí)體類別數(shù)據(jù)。
      [0049]優(yōu)選地,在類別數(shù)據(jù)庫(kù)中,可以與每個(gè)實(shí)體類別數(shù)據(jù)關(guān)聯(lián)地存儲(chǔ)有針對(duì)該實(shí)體類別數(shù)據(jù)所表示的實(shí)體類別定義的實(shí)體類別相關(guān)屬性。
      [0050]屬性數(shù)據(jù)獲取裝置可以包括:
      [0051]實(shí)體屬性檢索裝置,用于從類別數(shù)據(jù)庫(kù)獲得針對(duì)該實(shí)體所屬的實(shí)體類別定義的實(shí)體類別相關(guān)屬性;以及
      [0052]實(shí)體屬性數(shù)
      當(dāng)前第1頁(yè)1 2 3 4 
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1