国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種快速查找方法和裝置的制造方法

      文檔序號:8445685閱讀:151來源:國知局
      一種快速查找方法和裝置的制造方法
      【技術(shù)領(lǐng)域】
      [0001] 本發(fā)明涉及數(shù)據(jù)處理領(lǐng)域,特別是涉及一種快速查找方法和裝置。
      【背景技術(shù)】
      [0002] 隨著互聯(lián)網(wǎng)的普及以及智能移動終端的出現(xiàn),人們每天基本上會有很長時間處在 網(wǎng)絡(luò)上,上網(wǎng)行為中有很大一部分是在通過瀏覽器訪問網(wǎng)站,瀏覽網(wǎng)頁。所瀏覽的網(wǎng)站中存 儲有信息庫,信息庫中具有包含網(wǎng)站所提供頁面中的字符信息的海量數(shù)據(jù)標簽,所述數(shù)據(jù) 標簽中的字符信息可以根據(jù)特征的不同分為多個級別,相鄰級別之間的字符信息具有對應(yīng) 關(guān)系。
      [0003] 當用戶在通過瀏覽器瀏覽網(wǎng)站所提供的頁面時,分析服務(wù)器可以根據(jù)獲取的信息 庫中的海量數(shù)據(jù)標簽,分析該用戶所打開的頁面的標題信息,根據(jù)標題信息或標題信息中 的關(guān)鍵字在海量數(shù)據(jù)標簽中進行查找,當通過查找能夠從信息庫中查找到一條數(shù)據(jù)標簽與 所述標題信息或標題信息中的關(guān)鍵字相符時,則可以根據(jù)通過所述查找得出的該條數(shù)據(jù)標 簽中的字符信息確定該用戶本次瀏覽頁面的特征值。所述分析服務(wù)器可以對所述特征值進 行相應(yīng)的處理,例如當該用戶再次訪問網(wǎng)絡(luò)頁面時,所述分析服務(wù)器可以在該用戶打開的 頁面上展示與所述特征值相應(yīng)的內(nèi)容。
      [0004] 由于用于查找的信息庫中包含有海量的數(shù)據(jù)標簽,而現(xiàn)有技術(shù)在進行查找時需要 將標題信息或標題信息中的關(guān)鍵字與海量數(shù)據(jù)標簽逐一比對。故查找過程非常耗時,效率 低且會消耗大量系統(tǒng)資源。

      【發(fā)明內(nèi)容】

      [0005] 為了解決上述技術(shù)問題,本發(fā)明提供了一種快速查找方法和裝置,以單個字符為 單位,將多條數(shù)據(jù)標簽中的字符信息合并構(gòu)建為以單個字符作為節(jié)點的搜索樹,在進行查 找時,在具有樹狀結(jié)構(gòu)的搜索樹中查找速度將遠大于對多條所述數(shù)據(jù)標簽逐一進行查找的 速度,提高了查找速度,節(jié)約了系統(tǒng)資源。
      [0006] 本發(fā)明實施例公開了如下技術(shù)方案:
      [0007] -種快速查找方法,包括:
      [0008] 獲取包括多條數(shù)據(jù)標簽的標簽庫,所述數(shù)據(jù)標簽包括字符信息,所述數(shù)據(jù)標簽具 有一一對應(yīng)的標簽值;
      [0009] 將所述標簽庫中的所述多條數(shù)據(jù)標簽以單個字符為單位進行拆分,將相同的單個 字符合并,以單個字符作為節(jié)點構(gòu)建搜索樹,所述搜索樹中的節(jié)點連接為樹狀結(jié)構(gòu),所述樹 狀結(jié)構(gòu)中的節(jié)點的連接順序與多個所述數(shù)據(jù)標簽中字符信息的字符順序相同,在所述搜索 樹中,所述數(shù)據(jù)標簽所包括的字符信息的末位字符的節(jié)點中存儲對應(yīng)所述數(shù)據(jù)標簽的標簽 值;
      [0010] 當獲取用戶終端所打開頁面的頁面字符信息時,根據(jù)所述頁面字符信息或所述頁 面字符信息的關(guān)鍵字,以單個字符為單位在所述搜索樹中進行查找;
      [0011] 通過所述查找獲取與所述頁面對應(yīng)的標簽值;
      [0012] 根據(jù)所述標簽值從所述標簽庫中確定對應(yīng)的數(shù)據(jù)標簽。
      [0013] 優(yōu)選的,當通過所述查找獲取與所述頁面對應(yīng)的標簽值的數(shù)量為至少兩個時,根 據(jù)所述標簽值從所述標簽庫中確定對應(yīng)的數(shù)據(jù)標簽,具體包括:
      [0014] 所述數(shù)據(jù)標簽中的字符信息被分為多個級別,比對所述至少兩個標簽值對應(yīng)的至 少兩個數(shù)據(jù)標簽的級別數(shù)量,以及所述至少兩個數(shù)據(jù)標簽與所述頁面字符信息或所述頁面 字符信息的關(guān)鍵字的關(guān)聯(lián)性;
      [0015] 從具有級別數(shù)量最多的數(shù)據(jù)標簽中所述關(guān)聯(lián)性最大的數(shù)據(jù)標簽作為與所述頁面 字符信息或所述頁面字符信息的關(guān)鍵字對應(yīng)的數(shù)據(jù)標簽。
      [0016] 優(yōu)選的,
      [0017] 所述頁面字符信息的關(guān)鍵字至少為一個,當所述頁面字符信息的關(guān)鍵字多于一個 時,根據(jù)所述頁面字符信息的關(guān)鍵字確定與所述至少兩個數(shù)據(jù)標簽的關(guān)聯(lián)性。
      [0018] 優(yōu)選的,還包括:
      [0019] 根據(jù)類別從所述多條數(shù)據(jù)標簽包括的字符信息中提取特征詞;
      [0020] 根據(jù)提出去的多個特征詞生成詞典;
      [0021] 當獲取用戶終端所打開頁面的頁面字符信息時,根據(jù)所述詞典中的特征詞對所述 頁面字符信息進行切詞,得到所述頁面字符信息的關(guān)鍵字。
      [0022] 優(yōu)選的,
      [0023] 所述頁面字符信息包括頁面標題信息、頁面重要信息和頁面搜索信息中任意一個 或多個的組合。
      [0024] -種快速查找裝置,包括:
      [0025] 第一獲取單元,用于獲取包括多條數(shù)據(jù)標簽的標簽庫,所述數(shù)據(jù)標簽包括字符信 息,所述數(shù)據(jù)標簽具有一一對應(yīng)的標簽值;
      [0026] 構(gòu)建單元,用于將所述標簽庫中的所述多條數(shù)據(jù)標簽以單個字符為單位進行拆 分,將相同的單個字符合并,以單個字符作為節(jié)點構(gòu)建搜索樹,所述搜索樹中的節(jié)點連接為 樹狀結(jié)構(gòu),所述樹狀結(jié)構(gòu)中的節(jié)點的連接順序與多個所述數(shù)據(jù)標簽中字符信息的字符順序 相同,在所述搜索樹中,所述數(shù)據(jù)標簽所包括的字符信息的末位字符的節(jié)點中存儲對應(yīng)所 述數(shù)據(jù)標簽的標簽值;
      [0027] 查找單元,用于當獲取用戶終端所打開頁面的頁面字符信息時,根據(jù)所述頁面字 符信息或所述頁面字符信息的關(guān)鍵字,以單個字符為單位在所述搜索樹中進行查找;
      [0028] 第二獲取單元,用于通過所述查找獲取與所述頁面對應(yīng)的標簽值;
      [0029] 確定單元,用于根據(jù)所述標簽值從所述標簽庫中確定對應(yīng)的數(shù)據(jù)標簽。
      [0030] 優(yōu)選的,所述數(shù)據(jù)標簽中的字符信息被分為多個級別,比對所述至少兩個標簽值 對應(yīng)的至少兩個數(shù)據(jù)標簽的級別數(shù)量,以及所述至少兩個數(shù)據(jù)標簽與所述頁面字符信息或 所述頁面字符信息的關(guān)鍵字的關(guān)聯(lián)性;
      [0031] 所述確定單元具體用于當所述第二獲取單元獲取與所述頁面對應(yīng)的標簽值的數(shù) 量為至少兩個時,從具有級別數(shù)量最多的數(shù)據(jù)標簽中所述關(guān)聯(lián)性最大的數(shù)據(jù)標簽作為與所 述頁面字符信息或所述頁面字符信息的關(guān)鍵字對應(yīng)的數(shù)據(jù)標簽。
      [0032] 優(yōu)選的,
      [0033] 所述頁面字符信息的關(guān)鍵字至少為一個,當所述頁面字符信息的關(guān)鍵字多于一個 時,所述確定單元具體用于根據(jù)所述頁面字符信息的關(guān)鍵字確定與所述至少兩個數(shù)據(jù)標簽 的關(guān)聯(lián)性。
      [0034] 優(yōu)選的,還包括:
      [0035] 提取單元,用于根據(jù)類別從所述多條數(shù)據(jù)標簽包括的字符信息中提取特征詞;
      [0036] 生成單元,用于根據(jù)提出去的多個特征詞生成詞典;
      [0037] 切詞單元,用于當獲取用戶終端所打開頁面的頁面字符信息時,根據(jù)所述詞典中 的特征詞對所述頁面字符信息進行切詞,得到所述頁面字符信息的關(guān)鍵字。
      [0038] 優(yōu)選的,
      [0039] 所述頁面字符信息包括頁面標題信息、頁面重要信息和頁面搜索信息中任意一個 或多個的組合。
      [0040] 由上述技術(shù)方案可以看出,對獲取的多條數(shù)據(jù)標簽中字符信息以單個字符為單位 進行拆分并合并相同的單個字符,在保證原本數(shù)據(jù)標簽中字符順序的前提下,構(gòu)建以單個 字符作為節(jié)點的且具有樹狀結(jié)構(gòu)的搜索樹,在所述搜索樹中,所述數(shù)據(jù)標簽所包括的字符 信息的末位字符的節(jié)點中存儲對應(yīng)所述數(shù)據(jù)標簽的標簽值。當在對用戶所打開頁面的頁面 字符信息在所述搜索樹中以單個字符為單位進行查找時,通過樹狀結(jié)構(gòu)的搜索樹可以快速 的查找到對應(yīng)標簽值,通過所述標簽值可以確定出對應(yīng)的數(shù)據(jù)標簽,在具有樹狀結(jié)構(gòu)的搜 索樹中查找速度將遠大于對多條所述數(shù)據(jù)標簽逐一進行查找的速度,提高了查找速度,節(jié) 約了系統(tǒng)資源。
      【附圖說明】
      [0041] 為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可 以根據(jù)這些附圖獲得其他的附圖。
      [0042] 圖1為本發(fā)明實施例提供的一種快速查找方法的方法流程圖;
      [0043] 圖2為本發(fā)明實施例提供的一種搜索樹的結(jié)構(gòu)示意圖;
      [0044]圖3為本發(fā)明實施例提供的一種快速查找裝置的裝置結(jié)構(gòu)
      當前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1