国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種搜索的方法和裝置制造方法

      文檔序號(hào):6639728閱讀:140來(lái)源:國(guó)知局
      一種搜索的方法和裝置制造方法
      【專利摘要】本發(fā)明實(shí)施例提供了一種搜索方法和裝置,所述方法包括:接收用戶的搜索關(guān)鍵詞;識(shí)別所述搜索關(guān)鍵詞中的一個(gè)或多個(gè)搜索信息;當(dāng)所述搜索信息包括指定位數(shù)的數(shù)字序列時(shí),提高搜索結(jié)果中具有與所述指定位數(shù)的數(shù)字序列匹配的通訊特征信息的搜索結(jié)果項(xiàng)的權(quán)重。本發(fā)明實(shí)施例將具有與電話號(hào)碼匹配的通訊特征信息的網(wǎng)頁(yè)優(yōu)先展示,提高了搜索的準(zhǔn)確率,進(jìn)而減少在搜索結(jié)果中翻頁(yè)查找、重新輸入搜索關(guān)鍵詞等方式進(jìn)行搜索,提高了操作的簡(jiǎn)便性,減少了搜索引擎和本地系統(tǒng)的資源的消耗,減少帶寬消耗,提高了搜索效率。
      【專利說(shuō)明】一種搜索的方法和裝置

      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及搜索【技術(shù)領(lǐng)域】,特別是涉及一種搜索的方法和一種搜索的裝置。

      【背景技術(shù)】
      [0002]隨著網(wǎng)絡(luò)的迅速發(fā)展,網(wǎng)絡(luò)上的信息急劇增加。用戶為了在海量的信息中尋找所需的信息,通常使用搜索引擎進(jìn)行搜索。
      [0003]搜索引擎指自動(dòng)從因特網(wǎng)搜集信息,經(jīng)過(guò)一定整理以后,提供給用戶進(jìn)行查詢的系統(tǒng)。信息浩瀚萬(wàn)千,而且毫無(wú)秩序,所有的信息像汪洋上的一個(gè)個(gè)小島,網(wǎng)頁(yè)鏈接是這些小島之間縱橫交錯(cuò)的橋梁,而搜索引擎,則為用戶繪制一幅一目了然的信息地圖,供用戶隨時(shí)查閱。
      [0004]但是,如圖1所示,用戶在搜索常用電話號(hào)碼(如2223256)時(shí),搜索引擎仍按通用算法給出結(jié)果。由于標(biāo)題和鏈接的權(quán)重較高,排在前面的結(jié)果往往在標(biāo)題或鏈接中出現(xiàn)查詢?cè)~,而這些結(jié)果有時(shí)并非用戶所需,準(zhǔn)確率低。用戶在未搜索到所需的信息時(shí),通常在搜索結(jié)果中翻頁(yè)查找、重新輸入搜索關(guān)鍵詞等方式進(jìn)行搜索,操作麻煩,搜索引擎和本地系統(tǒng)的資源消耗大,帶寬消耗大,搜索效率低。


      【發(fā)明內(nèi)容】

      [0005]鑒于上述問(wèn)題,提出了本發(fā)明以便提供一種克服上述問(wèn)題或者至少部分地解決上述問(wèn)題的一種搜索的方法和相應(yīng)的一種搜索的裝置。
      [0006]依據(jù)本發(fā)明的一個(gè)方面,提供了一種搜索方法,包括:
      [0007]接收用戶的搜索關(guān)鍵詞;
      [0008]識(shí)別所述搜索關(guān)鍵詞中的一個(gè)或多個(gè)搜索信息;
      [0009]當(dāng)所述搜索信息包括指定位數(shù)的數(shù)字序列時(shí),提高搜索結(jié)果中具有與所述指定位數(shù)的數(shù)字序列匹配的通訊特征信息的搜索結(jié)果項(xiàng)的權(quán)重。
      [0010]可選地,所述方法還包括:
      [0011 ] 當(dāng)所述搜索信息包括通訊標(biāo)識(shí)時(shí),提高具有與所述通訊標(biāo)識(shí)匹配的通訊特征信息的搜索結(jié)果項(xiàng)的權(quán)重。
      [0012]可選地,所述方法還包括:
      [0013]獲取當(dāng)前所在位置的電話區(qū)號(hào);
      [0014]當(dāng)所述電話區(qū)號(hào)與所述通訊特征信息匹配時(shí),提高具有所述通訊特征信息的搜索結(jié)果的權(quán)重。
      [0015]可選地,所述方法還包括:
      [0016]按照所述權(quán)重對(duì)所述一個(gè)或多個(gè)搜索結(jié)果項(xiàng)進(jìn)行順序排序;
      [0017]將順序排序后的搜索結(jié)果返回客戶端進(jìn)行展示。
      [0018]可選地,所述搜索結(jié)果項(xiàng)包括網(wǎng)頁(yè)摘要信息,所述網(wǎng)頁(yè)摘要信息包括所述通訊特征信息在網(wǎng)頁(yè)中出現(xiàn)的位置對(duì)應(yīng)的網(wǎng)頁(yè)信息。
      [0019]可選地,在所述接收用戶的搜索關(guān)鍵詞的步驟之前,所述方法還包括:
      [0020]建立文檔索引。
      [0021]可選地,所述建立文檔索引的步驟包括:
      [0022]提取網(wǎng)頁(yè)中的文本信息;
      [0023]判斷所述文本信息中是否具有通訊特征信息;若是,則提取所述通訊特征信息;
      [0024]采用所述通訊特征信息和所述網(wǎng)頁(yè)建立文檔索引。
      [0025]可選地,所述網(wǎng)頁(yè)包括頁(yè)面標(biāo)題、網(wǎng)頁(yè)標(biāo)識(shí)、頁(yè)眉、頁(yè)腳、導(dǎo)航、主體內(nèi)容中的至少一個(gè)區(qū)域;
      [0026]所述提取網(wǎng)頁(yè)中的文本信息的步驟包括:
      [0027]提取網(wǎng)頁(yè)中頁(yè)面標(biāo)題、頁(yè)眉、頁(yè)腳、主體內(nèi)容、功能區(qū)、導(dǎo)航區(qū)中的至少一個(gè)區(qū)域的文本信息。
      [0028]可選地,所述通訊特征信息包括指定位數(shù)的電話號(hào)碼;
      [0029]所述判斷所述文本信息中是否具有通訊特征信息的步驟包括:
      [0030]對(duì)所述文本信息進(jìn)行分詞處理,獲得一個(gè)或多個(gè)文本分詞;
      [0031]當(dāng)所述文本分詞與預(yù)設(shè)的通訊標(biāo)識(shí)匹配時(shí),判斷第一目標(biāo)文本分詞是否為指定位數(shù)的數(shù)字序列;所述第一目標(biāo)文本分詞為與所述通訊標(biāo)識(shí)匹配的文本分詞之后的文本分詞;
      [0032]若是,則判斷所述第一目標(biāo)文本分詞為指定位數(shù)的電話號(hào)碼。
      [0033]可選地,所述通訊特征信息還包括電話區(qū)號(hào);
      [0034]所述判斷所述文本信息中是否具有通訊特征信息的步驟還包括:
      [0035]判斷第二目標(biāo)文本分詞中是否具有區(qū)號(hào)標(biāo)識(shí);若是,則判斷所述目標(biāo)文本分詞對(duì)應(yīng)的文本分詞為電話區(qū)號(hào);所述第二目標(biāo)文本分詞為與所述通訊標(biāo)識(shí)匹配的文本分詞之后的文本分詞。
      [0036]可選地,所述判斷所述目標(biāo)文本分詞對(duì)應(yīng)的文本分詞為區(qū)號(hào)信息的步驟包括:
      [0037]判斷所述目標(biāo)文本分詞包含的文本分詞為電話區(qū)號(hào);
      [0038]或者,
      [0039]判斷在所述目標(biāo)文本分詞之前的文本分詞為電話區(qū)號(hào)。
      [0040]可選地,所述指定位數(shù)為7位或8位。
      [0041]可選地,所述采用所述通訊特征信息和所述網(wǎng)頁(yè)建立文檔索引的步驟包括:
      [0042]記錄出現(xiàn)的所述通訊特征信息在所述網(wǎng)頁(yè)中出現(xiàn)的位置;
      [0043]將所述通訊特征信息及所述出現(xiàn)的位置記錄在文檔索引中。
      [0044]根據(jù)本發(fā)明的另一方面,提供了一種搜索裝置,包括:
      [0045]接收模塊,適于接收用戶的搜索關(guān)鍵詞;
      [0046]識(shí)別模塊,適于識(shí)別所述搜索關(guān)鍵詞中的一個(gè)或多個(gè)搜索信息;
      [0047]第一提高模塊,適于在所述搜索信息包括指定位數(shù)的數(shù)字序列時(shí),提高搜索結(jié)果中具有與所述指定位數(shù)的數(shù)字序列匹配的通訊特征信息的搜索結(jié)果項(xiàng)的權(quán)重。
      [0048]可選地,所述裝置還包括:
      [0049]第二提高模塊,適于在所述搜索信息包括通訊標(biāo)識(shí)時(shí),提高具有與所述通訊標(biāo)識(shí)匹配的通訊特征信息的搜索結(jié)果項(xiàng)的權(quán)重。
      [0050]可選地,所述裝置還包括:
      [0051]獲取模塊,適于獲取當(dāng)前所在位置的電話區(qū)號(hào);
      [0052]第三提高模塊,適于在所述電話區(qū)號(hào)與所述通訊特征信息匹配時(shí),提高具有所述通訊特征信息的搜索結(jié)果的權(quán)重。
      [0053]可選地,所述裝置還包括:
      [0054]排序模塊,適于按照所述權(quán)重對(duì)所述一個(gè)或多個(gè)搜索結(jié)果項(xiàng)進(jìn)行順序排序;
      [0055]返回模塊,適于將順序排序后的搜索結(jié)果返回客戶端進(jìn)行展示。
      [0056]可選地,所述搜索結(jié)果項(xiàng)包括網(wǎng)頁(yè)摘要信息,所述網(wǎng)頁(yè)摘要信息包括所述通訊特征信息在網(wǎng)頁(yè)中出現(xiàn)的位置對(duì)應(yīng)的網(wǎng)頁(yè)信息。
      [0057]可選地,所述裝置還包括:
      [0058]文檔索引建立模塊,適于建立文檔索引。
      [0059]可選地,所述文檔索引建立模塊還適于:
      [0060]提取網(wǎng)頁(yè)中的文本信息;
      [0061]判斷所述文本信息中是否具有通訊特征信息;若是,則提取所述通訊特征信息;
      [0062]采用所述通訊特征信息和所述網(wǎng)頁(yè)建立文檔索引。
      [0063]可選地,所述網(wǎng)頁(yè)包括頁(yè)面標(biāo)題、網(wǎng)頁(yè)標(biāo)識(shí)、頁(yè)眉、頁(yè)腳、導(dǎo)航、主體內(nèi)容中的至少一個(gè)區(qū)域;
      [0064]所述文檔索引建立模塊還適于:
      [0065]提取網(wǎng)頁(yè)中頁(yè)面標(biāo)題、頁(yè)眉、頁(yè)腳、主體內(nèi)容、功能區(qū)、導(dǎo)航區(qū)中的至少一個(gè)區(qū)域的文本信息。
      [0066]可選地,所述通訊特征信息包括指定位數(shù)的電話號(hào)碼;所述文檔索引建立模塊還適于:
      [0067]對(duì)所述文本信息進(jìn)行分詞處理,獲得一個(gè)或多個(gè)文本分詞;
      [0068]當(dāng)所述文本分詞與預(yù)設(shè)的通訊標(biāo)識(shí)匹配時(shí),判斷第一目標(biāo)文本分詞是否為指定位數(shù)的數(shù)字序列;所述第一目標(biāo)文本分詞為與所述通訊標(biāo)識(shí)匹配的文本分詞之后的文本分詞;
      [0069]若是,則判斷所述第一目標(biāo)文本分詞為指定位數(shù)的電話號(hào)碼。
      [0070]可選地,所述通訊特征信息還包括電話區(qū)號(hào);所述文檔索引建立模塊還適于:
      [0071]判斷第二目標(biāo)文本分詞中是否具有區(qū)號(hào)標(biāo)識(shí);若是,則判斷所述目標(biāo)文本分詞對(duì)應(yīng)的文本分詞為電話區(qū)號(hào);所述第二目標(biāo)文本分詞為與所述通訊標(biāo)識(shí)匹配的文本分詞之后的文本分詞。
      [0072]可選地,所述文檔索引建立模塊還適于:
      [0073]判斷所述目標(biāo)文本分詞包含的文本分詞為電話區(qū)號(hào);
      [0074]或者,
      [0075]判斷在所述目標(biāo)文本分詞之前的文本分詞為電話區(qū)號(hào)。
      [0076]可選地,所述指定位數(shù)為7位或8位。
      [0077]可選地,所述文檔索引建立模塊還適于:
      [0078]記錄出現(xiàn)的所述通訊特征信息在所述網(wǎng)頁(yè)中出現(xiàn)的位置;
      [0079]將所述通訊特征信息及所述出現(xiàn)的位置記錄在文檔索引中。
      [0080]本發(fā)明實(shí)施例對(duì)于接收到的搜索關(guān)鍵詞,識(shí)別其中的一個(gè)或多個(gè)搜索信息,在搜索信息包括指定位數(shù)的數(shù)字序列時(shí),提高搜索結(jié)果中具有與指定位數(shù)的數(shù)字序列匹配的通訊特征信息的搜索結(jié)果項(xiàng)的權(quán)重,將具有與電話號(hào)碼匹配的通訊特征信息的網(wǎng)頁(yè)優(yōu)先展示,提高了搜索的準(zhǔn)確率,進(jìn)而減少在搜索結(jié)果中翻頁(yè)查找、重新輸入搜索關(guān)鍵詞等方式進(jìn)行搜索,提高了操作的簡(jiǎn)便性,減少了搜索引擎和本地系統(tǒng)的資源的消耗,減少帶寬消耗,提高了搜索效率。
      [0081]本發(fā)明實(shí)施例當(dāng)搜索信息包括通訊標(biāo)識(shí)時(shí),提高具有與通訊標(biāo)識(shí)匹配的通訊特征信息的搜索結(jié)果項(xiàng)的權(quán)重,進(jìn)一步提高了搜索的準(zhǔn)確率。
      [0082]本發(fā)明實(shí)施例在當(dāng)前位置的電話區(qū)號(hào)與通訊特征信息匹配時(shí),提高具有該通訊特征信息的搜索結(jié)果的權(quán)重,進(jìn)一步提高了搜索的準(zhǔn)確率。
      [0083]本發(fā)明實(shí)施例中將通訊特征信息及出現(xiàn)的位置制作網(wǎng)頁(yè)摘要信息,可以在搜索結(jié)果項(xiàng)中的摘要信息獲取到電話號(hào)碼及其歸屬的信息,減少用戶點(diǎn)擊搜索結(jié)果的頻次,減少網(wǎng)頁(yè)服務(wù)器、當(dāng)前電子設(shè)備的資源以及帶寬的消耗。
      [0084]上述說(shuō)明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說(shuō)明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的【具體實(shí)施方式】。

      【專利附圖】

      【附圖說(shuō)明】
      [0085]通過(guò)閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:
      [0086]圖1示出了一種搜索結(jié)果示例圖;
      [0087]圖2示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種文檔索引的建立方法實(shí)施例的步驟流程圖;
      [0088]圖3示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種搜索結(jié)果示例圖;
      [0089]圖4示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種搜索的方法實(shí)施例1的步驟流程圖;
      [0090]圖5示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種搜索的方法實(shí)施例2方法實(shí)施例的步驟流程圖;
      [0091]圖6不出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種搜索結(jié)果不例圖;
      [0092]圖7示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種文檔索引的建立裝置實(shí)施例的結(jié)構(gòu)框圖;以及
      [0093]圖8示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種搜索的裝置實(shí)施例的結(jié)構(gòu)框圖。

      【具體實(shí)施方式】
      [0094]下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施例。雖然附圖中顯示了本公開的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
      [0095]參照?qǐng)D2,示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種文檔索引的建立方法實(shí)施例的步驟流程圖,具體可以包括如下步驟:
      [0096]步驟201,提取網(wǎng)頁(yè)中的文本信息;
      [0097]搜索引擎的處理流程一般可以分為二個(gè)部分,第一部分是前端用戶請(qǐng)求,第二部分是后端制作數(shù)據(jù)。
      [0098]一、前端用戶請(qǐng)求處理過(guò)程可以包括:
      [0099]1.用戶輸入關(guān)鍵字;
      [0100]2.查詢?cè)~分析,搜索引擎對(duì)關(guān)鍵字分詞;
      [0101]3.檢索,根據(jù)分詞結(jié)果,從事先制作的文檔索引中,找出相關(guān)的網(wǎng)頁(yè)集合;
      [0102]4.排序,對(duì)候選的網(wǎng)頁(yè)集合,根據(jù)內(nèi)容相關(guān)性、時(shí)效性等維度進(jìn)行排序;
      [0103]5.展現(xiàn):將排序后的網(wǎng)頁(yè)進(jìn)行展現(xiàn)。
      [0104]二、后端制作數(shù)據(jù)過(guò)程可以包括:
      [0105]1.網(wǎng)頁(yè)抓取,爬蟲通過(guò)網(wǎng)頁(yè)間的鏈接關(guān)系,抓取互聯(lián)網(wǎng)的網(wǎng)頁(yè)并保存;
      [0106]2.索引制作,對(duì)已抓取保存的網(wǎng)頁(yè)進(jìn)行分析,對(duì)網(wǎng)頁(yè)標(biāo)題和頁(yè)面文本分詞,根據(jù)分詞結(jié)果制作文檔索引,供前端檢索使用。
      [0107]爬蟲抓取的網(wǎng)頁(yè)可以保存在網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中形成大量的搜索資源,而網(wǎng)頁(yè)內(nèi)容中可以包括大量的文本信息。則在本發(fā)明實(shí)施例中,可以從網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中提取網(wǎng)頁(yè)中的文本信息。
      [0108]在本發(fā)明實(shí)施例的一種可選示例中,所述網(wǎng)頁(yè)包括頁(yè)面標(biāo)題、頁(yè)眉、頁(yè)腳、主體內(nèi)容、功能區(qū)、導(dǎo)航區(qū)中的至少一個(gè)區(qū)域;則在本發(fā)明實(shí)施例中,步驟201可以包括如下子步驟:
      [0109]子步驟S11,提取網(wǎng)頁(yè)中頁(yè)面標(biāo)題、頁(yè)眉、頁(yè)腳、主體內(nèi)容、功能區(qū)、導(dǎo)航區(qū)中的至少一個(gè)區(qū)域的文本信息。
      [0110]不同性質(zhì)和類別的網(wǎng)站,網(wǎng)頁(yè)的內(nèi)容安排一般是不同的。但是一般的網(wǎng)頁(yè)的基本內(nèi)容包括標(biāo)題、頁(yè)眉、頁(yè)腳、主體內(nèi)容、功能區(qū)、導(dǎo)航區(qū)廣告欄等。這些元素在網(wǎng)頁(yè)的位置安排,就是網(wǎng)頁(yè)的整體布局。
      [0111]每個(gè)網(wǎng)頁(yè)的最頂端都有一條信息,這條信息往往出現(xiàn)在瀏覽器的標(biāo)題欄,而非網(wǎng)頁(yè)中,但是這條信息也是網(wǎng)頁(yè)布局中的一部分。這條信息是對(duì)這個(gè)網(wǎng)頁(yè)中主要內(nèi)容的提示,即標(biāo)題。
      [0112]LOGO是網(wǎng)站所有者對(duì)外宣傳自身形象的工具。
      [0113]網(wǎng)頁(yè)的上端即是這個(gè)頁(yè)面的頁(yè)眉。頁(yè)眉并不是在所有的網(wǎng)頁(yè)中都有,其往往在一個(gè)頁(yè)面中相當(dāng)重要的位置,容易引起瀏覽者的注意,所以很多網(wǎng)站都會(huì)在頁(yè)眉中設(shè)置宣傳本網(wǎng)站的內(nèi)容,如網(wǎng)站宗旨、網(wǎng)站LOGO等。
      [0114]主體內(nèi)容是網(wǎng)頁(yè)中的最重要的元素。主體內(nèi)容并不完整,往往由下一級(jí)內(nèi)容的標(biāo)題、內(nèi)容提要、內(nèi)容摘編的超鏈接構(gòu)成。主體內(nèi)容借助超鏈接,可以利用一個(gè)頁(yè)面,高度概括幾個(gè)頁(yè)面所表達(dá)的內(nèi)容,而首頁(yè)的主體內(nèi)容甚至能在一個(gè)頁(yè)面中高度概括整個(gè)網(wǎng)站的內(nèi)容。
      [0115]網(wǎng)頁(yè)的最底端部分被稱為頁(yè)腳,頁(yè)腳部分通常被用來(lái)介紹網(wǎng)站所有者的具體信息和聯(lián)絡(luò)方式,如名稱、地址、聯(lián)系方式、版權(quán)信息等。其中一些內(nèi)容被做成標(biāo)題式的超鏈接,引導(dǎo)瀏覽者進(jìn)一步了解詳細(xì)的內(nèi)容。
      [0116]功能區(qū)是網(wǎng)站主要功能的集中表現(xiàn)。一般位于網(wǎng)頁(yè)的右上方或右側(cè)邊欄。功能區(qū)包括:電子郵件、信息發(fā)布、用戶名注冊(cè)、登陸網(wǎng)站等內(nèi)容。有些網(wǎng)站使用了 IP定位功能,定位瀏覽者所在地,然后可在功能區(qū)顯示當(dāng)?shù)氐奶鞖狻⑿侣劦葌€(gè)性化信息。
      [0117]導(dǎo)航區(qū)可以通過(guò)一定的技術(shù)手段,為網(wǎng)站的訪問(wèn)者提供一定的途徑,時(shí)期可以方便地訪問(wèn)所需的內(nèi)容,導(dǎo)航區(qū)一般分為4種位置,分別是左側(cè)、右側(cè)、頂部和底部。一般網(wǎng)站使用的導(dǎo)航區(qū)都是單一的,也可以多導(dǎo)航,如采用了左側(cè)導(dǎo)航與底部導(dǎo)航相結(jié)合的方式。但是無(wú)論采用幾個(gè)導(dǎo)航區(qū),網(wǎng)站中的每個(gè)頁(yè)面的導(dǎo)航區(qū)位置均是固定的。
      [0118]廣告區(qū)是網(wǎng)站實(shí)現(xiàn)贏利或自我展示的區(qū)域。一般位于網(wǎng)頁(yè)的頁(yè)眉、右側(cè)和底部。廣告區(qū)內(nèi)容以文字、圖像、Flash動(dòng)畫為主。通過(guò)吸引瀏覽者點(diǎn)擊鏈接的方式達(dá)成廣告效果。廣告區(qū)設(shè)置要達(dá)到明顯、合理、引人注目,這對(duì)整個(gè)網(wǎng)站的布局很重要。
      [0119]需要說(shuō)明的是,頁(yè)腳在一般的文檔索引中不會(huì)被收錄,但是,由于頁(yè)腳部分通常被用來(lái)介紹網(wǎng)站所有者的具體信息和聯(lián)絡(luò)方式,在用戶搜索電話號(hào)碼的情景中的地位較為重要,因此,本發(fā)明實(shí)施例中可以收錄頁(yè)腳部分。
      [0120]步驟202,判斷所述文本信息中是否具有通訊特征信息;若是,則執(zhí)行步驟203 ;
      [0121 ] 通訊特征信息,可以為表征用于通信的信息。
      [0122]在本發(fā)明的一種可選實(shí)施例中,所述通訊特征信息可以包括指定位數(shù)的電話號(hào)碼;
      [0123]電話號(hào)碼是一連串?dāng)?shù)字的組合,一組號(hào)碼對(duì)應(yīng)一個(gè)電話線,如要撥打至另一方,可以撥對(duì)方的對(duì)應(yīng)號(hào)碼組合。在電話號(hào)碼剛開始使用時(shí),號(hào)碼較短,大約只有兩三個(gè)數(shù)字,也只能撥打給附近的電話用戶,逐漸地,電話系統(tǒng)越趨發(fā)達(dá),涵蓋范圍達(dá)全球,電話號(hào)碼也相對(duì)增長(zhǎng)。電話號(hào)碼除了連接電話,也可連接電腦及傳真機(jī)。電話管理部門為電話機(jī)設(shè)定的號(hào)碼。一般7或8位數(shù)組成的(手機(jī)號(hào)碼為11位),早期有過(guò)5或6位的情況。
      [0124]則在本發(fā)明實(shí)施例中,步驟202可以包括如下子步驟:
      [0125]子步驟S21,對(duì)所述文本信息進(jìn)行分詞處理,獲得一個(gè)或多個(gè)文本分詞;
      [0126]下面介紹一些常用的分詞方法:
      [0127]1、基于字符串匹配的分詞方法:是指按照一定的策略將待分析的漢字串與一個(gè)預(yù)置的機(jī)器詞典中的詞條進(jìn)行匹配,若在詞典中找到某個(gè)字符串,則匹配成功(識(shí)別出一個(gè)詞
      [0128]2、基于特征掃描或標(biāo)志切分的分詞方法:是指優(yōu)先在待分析字符串中識(shí)別和切分出一些帶有明顯特征的詞,以這些詞作為斷點(diǎn),可將原字符串分為較小的串再來(lái)進(jìn)機(jī)械分詞,從而減少匹配的錯(cuò)誤率;或者將分詞和詞類標(biāo)注結(jié)合起來(lái),利用豐富的詞類信息對(duì)分詞決策提供幫助,并且在標(biāo)注過(guò)程中又反過(guò)來(lái)對(duì)分詞結(jié)果進(jìn)行檢驗(yàn)、調(diào)整,從而提高切分的準(zhǔn)確率。
      [0129]3、基于理解的分詞方法:是指通過(guò)讓計(jì)算機(jī)模擬人對(duì)句子的理解,達(dá)到識(shí)別詞的效果。其基本思想就是在分詞的同時(shí)進(jìn)行句法、語(yǔ)義分析,利用句法信息和語(yǔ)義信息來(lái)處理歧義現(xiàn)象。它通常包括三個(gè)部分:分詞子系統(tǒng)、句法語(yǔ)義子系統(tǒng)、總控部分。在總控部分的協(xié)調(diào)下,分詞子系統(tǒng)可以獲得有關(guān)詞、句子等的句法和語(yǔ)義信息來(lái)對(duì)分詞歧義進(jìn)行判斷,即它模擬了人對(duì)句子的理解過(guò)程。這種分詞方法需要使用大量的語(yǔ)言知識(shí)和信息。
      [0130]4、基于統(tǒng)計(jì)的分詞方法:是指,中文信息中由于字與字相鄰共現(xiàn)的頻率或概率能夠較好的反映成詞的可信度,所以可以對(duì)語(yǔ)料中相鄰共現(xiàn)的各個(gè)字的組合的頻度進(jìn)行統(tǒng)計(jì),計(jì)算它們的互現(xiàn)信息,以及計(jì)算兩個(gè)漢字Χ、γ的相鄰共現(xiàn)概率。互現(xiàn)信息可以體現(xiàn)漢字之間結(jié)合關(guān)系的緊密程度。當(dāng)緊密程度高于某一個(gè)閾值時(shí),便可認(rèn)為此字組可能構(gòu)成了一個(gè)詞。這種方法對(duì)語(yǔ)料中的字組頻度進(jìn)行統(tǒng)計(jì),不需要切分詞典。
      [0131]子步驟S22,當(dāng)所述文本分詞與預(yù)設(shè)的通訊標(biāo)識(shí)匹配時(shí),判斷第一目標(biāo)文本分詞是否為指定位數(shù)的數(shù)字序列;若是,則執(zhí)行子步驟S23 ;
      [0132]通訊標(biāo)識(shí),可以為標(biāo)識(shí)電話號(hào)碼的信息,例如,“請(qǐng)聯(lián)系”、“電話”、“手機(jī)”、“Tel”、“Mobile” 等等。
      [0133]其中,所述第一目標(biāo)文本分詞可以為與所述通訊標(biāo)識(shí)匹配的文本分詞之后的文本分詞,例如,若文本分詞“電話”與通訊標(biāo)識(shí)匹配,則文本分詞“電話”后的文本分詞可以為第一目標(biāo)文本分詞。
      [0134]子步驟S23,判斷所述第一目標(biāo)文本分詞為指定位數(shù)的電話號(hào)碼。
      [0135]在本發(fā)明實(shí)施例中,在第一目標(biāo)文本分詞為指定位數(shù)的數(shù)字時(shí),可以判斷該指定位數(shù)的數(shù)字為指定位數(shù)的電話號(hào)碼。
      [0136]例如,若文本分詞“電話”后的第一目標(biāo)文本分詞為“ 2223256 ”,由于“ 2223256 ”為7位的數(shù)字序列,則可以判斷“2223256”為7位的電話號(hào)碼。
      [0137]在本發(fā)明的一種可選實(shí)施例中,所述通訊特征信息還可以包括電話區(qū)號(hào);電話區(qū)號(hào)是指各行政區(qū)域常用電話區(qū)劃號(hào)碼,這些號(hào)碼主要用于國(guó)內(nèi)、國(guó)際長(zhǎng)途電話接入。比如,中國(guó)大陸國(guó)際區(qū)號(hào)86,成都區(qū)號(hào)28。而在使用國(guó)內(nèi)長(zhǎng)途電話時(shí),區(qū)號(hào)前要加撥O。
      [0138]則在本發(fā)明實(shí)施例中,步驟202可以包括如下子步驟:
      [0139]子步驟S24,判斷第二目標(biāo)文本分詞中是否具有區(qū)號(hào)標(biāo)識(shí);若是,則執(zhí)行子步驟S25 ;
      [0140]區(qū)號(hào)標(biāo)識(shí),可以為標(biāo)識(shí)電話區(qū)號(hào)的信息,例如,“(010)2223256”中的“O”為區(qū)號(hào)標(biāo)識(shí)、“ 010-2223256 ”中的“”為區(qū)號(hào)標(biāo)識(shí)等等。
      [0141]其中,所述第二目標(biāo)文本分詞可以為與所述通訊標(biāo)識(shí)匹配的文本分詞之后的文本分詞,例如,若文本分詞“電話”與通訊標(biāo)識(shí)匹配,則文本分詞“電話”后的文本分詞可以為第二目標(biāo)文本分詞。
      [0142]子步驟S25,判斷所述目標(biāo)文本分詞對(duì)應(yīng)的文本分詞為電話區(qū)號(hào);
      [0143]在本發(fā)明實(shí)施例中,在目標(biāo)文本分詞與通訊標(biāo)識(shí)匹配時(shí),可以判斷該目標(biāo)文本分詞對(duì)應(yīng)的為文本分詞的電話號(hào)碼。
      [0144]在本發(fā)明實(shí)施例的一種可選示例中,子步驟S25可以包括如下子步驟:
      [0145]子步驟S251,判斷所述目標(biāo)文本分詞包含的文本分詞為電話區(qū)號(hào);
      [0146]例如,“(010)2223256”中的“ O ”為區(qū)號(hào)標(biāo)識(shí),則文本分詞“010”可以為電話區(qū)號(hào)。
      [0147]或者,
      [0148]子步驟S252,判斷在所述目標(biāo)文本分詞之前的文本分詞為電話區(qū)號(hào)。
      [0149]例如,“ 010-2223256 ”中的“”為區(qū)號(hào)標(biāo)識(shí),,則文本分詞“ 010 ”可以為電話區(qū)號(hào)。
      [0150]步驟204,提取所述通訊特征信息;
      [0151]在本發(fā)明實(shí)施例中,若判斷網(wǎng)頁(yè)中的文本信息中具有通訊特征信息,則可以提取該通訊特征信息,例如指定位數(shù)的電話號(hào)碼、電話區(qū)號(hào)等等,以建立文檔索引。
      [0152]步驟205,采用所述通訊特征信息和所述網(wǎng)頁(yè)建立文檔索引。
      [0153]在具體實(shí)現(xiàn)中,文檔索引可以包括倒排索引、正排索引等等,而文檔索引可以由索引表和主文件兩部分構(gòu)成。
      [0154]索引表可以是一張指示邏輯記錄和物理記錄之間對(duì)應(yīng)關(guān)系的表。索引表中的每項(xiàng)稱作索引項(xiàng)。索引項(xiàng)是按鍵(或邏輯記錄號(hào))順序排列。
      [0155]在本發(fā)明的一種可選實(shí)施例中,步驟205可以包括如下子步驟:
      [0156]子步驟S31,記錄出現(xiàn)的所述通訊特征信息在所述網(wǎng)頁(yè)中出現(xiàn)的位置;
      [0157]子步驟S32,將所述通訊特征信息及所述出現(xiàn)的位置記錄在文檔索引中。
      [0158]本發(fā)明實(shí)施例中,可以將出現(xiàn)的位置記錄寫入倒排索引中,以在搜索結(jié)果項(xiàng)中作為網(wǎng)頁(yè)摘要信息進(jìn)行展示。
      [0159]在很多情景中,用戶搜索電話號(hào)碼,需要獲取的信息大多是確定這個(gè)是電話號(hào)碼以及這個(gè)電話號(hào)碼的歸屬,如公司、店鋪等等。若用戶在搜索結(jié)果項(xiàng)中的摘要信息獲取到電話號(hào)碼及其歸屬的信息,往往無(wú)需點(diǎn)擊該搜索結(jié)果項(xiàng)進(jìn)行詳細(xì)的查詢。
      [0160]本發(fā)明實(shí)施例中將通訊特征信息及出現(xiàn)的位置記錄在文檔索引中,可以在搜索結(jié)果項(xiàng)中的網(wǎng)頁(yè)摘要信息獲取到電話號(hào)碼及其歸屬的信息,減少用戶點(diǎn)擊搜索結(jié)果的頻次,減少網(wǎng)頁(yè)服務(wù)器、當(dāng)前電子設(shè)備的資源以及帶寬的消耗。
      [0161]倒排索引源于實(shí)際應(yīng)用中需要根據(jù)屬性的值來(lái)查找記錄。這種索引表中的每一項(xiàng)都包括一個(gè)屬性值和具有該屬性值的各記錄的地址。由于不是由記錄來(lái)確定屬性值,而是由屬性值來(lái)確定記錄的位置,因而稱為倒排索引(inverted index)。帶有倒排索引的文件稱為倒排索引文件,簡(jiǎn)稱倒排文件(inverted file)。
      [0162]倒排文件(倒排索引),索引對(duì)象是文檔或者文檔集合(例如網(wǎng)頁(yè))中的單詞等,用來(lái)存儲(chǔ)這些單詞在一個(gè)文檔或者一組文檔中的存儲(chǔ)位置,是對(duì)文檔或者文檔集合的一種常用的索引機(jī)制。
      [0163]在具體實(shí)現(xiàn)中,通訊特征信息的出現(xiàn)位置可以包括出現(xiàn)的網(wǎng)頁(yè)、出現(xiàn)的網(wǎng)頁(yè)及其在該網(wǎng)頁(yè)中的位置。
      [0164]以英文為例,以下為要被索引的網(wǎng)頁(yè)中的文本信息:
      [0165]Tl = "it is what it is";
      [0166]T2 = "what is it";
      [0167]? = 〃it is a banana";
      [0168]以下為倒排索引:
      [0169]〃a〃:{(2,2)}
      [0170]"banana": {(2, 3)}
      [0171]〃is": {(0,I), (0, 4), (I, I), (2,I)}
      [0172]"it": {(0,0), (0, 3), (1,2), (2,0)}
      [0173]"what": {(0,2),(1,0)}
      [0174]其中,〃banana〃: {(2,3)}為〃banana〃在第三個(gè)網(wǎng)頁(yè)(T3)的文本信息里,而且在第三個(gè)網(wǎng)頁(yè)的位置是第四個(gè)單詞(地址為3)。
      [0175]一般的頁(yè)面分析不對(duì)特別的點(diǎn)(如電話號(hào)碼、電話區(qū)號(hào))做標(biāo)識(shí),有可能主要針對(duì)標(biāo)題或站長(zhǎng)給出的關(guān)鍵字等重點(diǎn)部分做文檔索引,在文檔索引中可能會(huì)被忽略很多東西,用戶有查詢電話號(hào)碼的需求時(shí),返回不了用戶所需的結(jié)果。
      [0176]此外,銀行、網(wǎng)上商城等各大商業(yè)機(jī)構(gòu),一般會(huì)設(shè)置5位的電話號(hào)碼、400開頭的電話號(hào)碼,而這些電話號(hào)碼,通常會(huì)被該商業(yè)機(jī)構(gòu)通過(guò)競(jìng)價(jià)的方式優(yōu)先提升到搜索結(jié)果的首頁(yè)進(jìn)行展示。
      [0177]而7位或8位的電話號(hào)碼為一般為小公司、小店鋪等小型機(jī)構(gòu)的電話號(hào)碼,通常無(wú)力支付競(jìng)價(jià)所需的費(fèi)用,一般設(shè)置低于標(biāo)題、網(wǎng)址等的重要性,在搜索結(jié)果中通常被埋藏在很深的位置,甚至無(wú)法搜索到。
      [0178]本發(fā)明實(shí)施例在網(wǎng)頁(yè)中的文本信息中具有通訊特征信息時(shí),采用通訊特征信息和網(wǎng)頁(yè)建立文檔索引,通過(guò)標(biāo)記通訊特征信息,形象地可稱為建立大范圍內(nèi)(如全國(guó))的電話簿,以支持后續(xù)其他用戶在搜索電話號(hào)碼時(shí),將具有與該電話號(hào)碼匹配的通訊特征信息的網(wǎng)頁(yè)優(yōu)先展示,提高了搜索的準(zhǔn)確率,進(jìn)而減少在搜索結(jié)果中翻頁(yè)查找、重新輸入搜索關(guān)鍵詞等方式進(jìn)行搜索,提高了操作的簡(jiǎn)便性,減少了搜索引擎和本地系統(tǒng)的資源的消耗,減少帶寬消耗,提高了搜索效率。
      [0179]參照?qǐng)D3,示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種搜索方法實(shí)施例1的步驟流程圖,具體可以包括如下步驟:
      [0180]步驟301,接收用戶的搜索關(guān)鍵詞;
      [0181]在具體實(shí)現(xiàn)中,用戶可以從任何一種電子設(shè)備訪問(wèn)搜索引擎,例如手機(jī)、PDA (Personal Digital Assistant,個(gè)人數(shù)字助理)、膝上型計(jì)算機(jī)、掌上電腦等等,本發(fā)明實(shí)施例對(duì)此不加以限制。
      [0182]這些電子設(shè)備可以支持包括Android (安卓)、1S、WindowsPhone或者windows等的操作系統(tǒng),通??梢赃\(yùn)行通過(guò)互聯(lián)網(wǎng)訪問(wèn)網(wǎng)頁(yè)的瀏覽器或內(nèi)置微型瀏覽器的應(yīng)用程序。
      [0183]在本發(fā)明實(shí)施例的一種可選示例中,用戶可以在瀏覽器或內(nèi)置微型瀏覽器的應(yīng)用程序中打開搜索引擎所在的網(wǎng)頁(yè),在該網(wǎng)頁(yè)中通常會(huì)包括搜索框,用戶可以在該搜索框中輸入搜索關(guān)鍵詞。
      [0184]在本發(fā)明實(shí)施例的另一種可選示例中,瀏覽器或內(nèi)置微型瀏覽器的應(yīng)用程序中可以安裝有搜索插件(plug-1ns,可以通過(guò)與搜索引擎進(jìn)行交互,在瀏覽器或內(nèi)置微型瀏覽器的應(yīng)用程序中增加搜索功能),該搜索插件可以提供搜索框,用戶可以在該搜索框中輸入搜索關(guān)鍵詞。
      [0185]瀏覽器或內(nèi)置微型瀏覽器的應(yīng)用程序在用戶輸入的搜索關(guān)鍵詞時(shí),可以將其組裝成搜索請(qǐng)求,向搜索引擎發(fā)送搜索請(qǐng)求,以請(qǐng)求搜索引擎搜索與該搜索關(guān)鍵詞相關(guān)的信息。
      [0186]在實(shí)際應(yīng)用中,該搜索請(qǐng)求可以為HTTP (Hypertext transfer protocol,超文本傳輸協(xié)議)請(qǐng)求。其中,搜索請(qǐng)求的內(nèi)容可以包括用戶請(qǐng)求加載的網(wǎng)頁(yè)的標(biāo)識(shí)和/或網(wǎng)頁(yè)的特征。網(wǎng)頁(yè)標(biāo)識(shí)可以是能夠代表一個(gè)唯一確定的網(wǎng)頁(yè)的信息,例如統(tǒng)一資源標(biāo)識(shí)符(Uniform Resource Identifier, URI),統(tǒng)一資源標(biāo)識(shí)符又具體可以包括統(tǒng)一資源定位符(Uniform Resource Locator,URL),或者統(tǒng)一資源名稱(Uniform Resource Name, URN)等等。
      [0187]瀏覽器或內(nèi)置微型瀏覽器的應(yīng)用程序可以通過(guò)DNS (Domain Name System,域名解析系統(tǒng))解析查找該網(wǎng)頁(yè)URL中的域名(Domain Name)所映射的IP(Internet Protocol,網(wǎng)絡(luò)之間互連的協(xié)議)地址。在獲取IP地址成功之后,瀏覽器或內(nèi)置微型瀏覽器的應(yīng)用程序可以向該IP地址所在的搜索引擎請(qǐng)求連接。在成功連接該IP地址所在的搜索引擎之后,瀏覽器或內(nèi)置微型瀏覽器的應(yīng)用程序可以將請(qǐng)求頭信息通過(guò)HTTP協(xié)議向此IP地址所在的搜索引擎發(fā)起搜索請(qǐng)求。
      [0188]搜索引擎接收到搜索請(qǐng)求,則可以從該搜索請(qǐng)求中提取搜索關(guān)鍵詞,則可以根據(jù)該搜索關(guān)鍵詞在文檔索引中快速檢出搜索結(jié)果,在該搜索結(jié)果中可以包括一個(gè)或多個(gè)搜索結(jié)果項(xiàng)。
      [0189]步驟302,識(shí)別所述搜索關(guān)鍵詞中的一個(gè)或多個(gè)搜索信息;
      [0190]在本發(fā)明實(shí)施例中,可以通過(guò)分詞處理等手段識(shí)別所述搜索關(guān)鍵詞中的一個(gè)或多個(gè)搜索信息。
      [0191]例如,若搜索關(guān)鍵詞為“ 2223256 ”,則該搜索關(guān)鍵詞包括一個(gè)搜索信息“ 2223256 ” ;若搜索關(guān)鍵詞為“電話2223256”,則該搜索關(guān)鍵詞包括搜索信息“電話”、“2223256”。
      [0192]步驟303,當(dāng)所述搜索信息包括指定位數(shù)的數(shù)字序列時(shí),提高搜索結(jié)果中具有與所述指定位數(shù)的數(shù)字序列匹配的通訊特征信息的搜索結(jié)果項(xiàng)的權(quán)重。
      [0193]在實(shí)際應(yīng)用中,用戶搜索指定位數(shù)(如7位或8位)的數(shù)字序列,則其查詢目的可能為查詢電話號(hào)碼。
      [0194]在搜索結(jié)果項(xiàng)中的通訊特征信息(如電話號(hào)碼)與該指定位數(shù)(如7位或8位)的數(shù)字序列匹配時(shí),可以提高該搜索結(jié)果項(xiàng)的權(quán)重,以提高該搜索結(jié)果項(xiàng)在搜索結(jié)果中的展示順序。
      [0195]例如,如圖4所示,若用戶搜索“2223256”,可以將包含電話“2223256”的搜索結(jié)果項(xiàng)的展示位置提升至搜索結(jié)果的前幾項(xiàng),方便用戶快捷查詢。
      [0196]本發(fā)明實(shí)施例對(duì)于接收到的搜索關(guān)鍵詞,識(shí)別其中的一個(gè)或多個(gè)搜索信息,在搜索信息包括指定位數(shù)的數(shù)字序列時(shí),提高搜索結(jié)果中具有與指定位數(shù)的數(shù)字序列匹配的通訊特征信息的搜索結(jié)果項(xiàng)的權(quán)重,將具有與電話號(hào)碼匹配的通訊特征信息的網(wǎng)頁(yè)優(yōu)先展示,提高了搜索的準(zhǔn)確率,進(jìn)而減少在搜索結(jié)果中翻頁(yè)查找、重新輸入搜索關(guān)鍵詞等方式進(jìn)行搜索,提高了操作的簡(jiǎn)便性,減少了搜索引擎和本地系統(tǒng)的資源的消耗,減少帶寬消耗,提高了搜索效率。
      [0197]參照?qǐng)D5,示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種搜索方法實(shí)施例2的步驟流程圖,具體可以包括如下步驟:
      [0198]步驟501,建立文檔索引;
      [0199]在本發(fā)明的一種可選實(shí)施例中,步驟501可以包括如下子步驟:
      [0200]子步驟S41,提取網(wǎng)頁(yè)中的文本信息;
      [0201]在本發(fā)明實(shí)施例的一種可選示例中,所述網(wǎng)頁(yè)可以包括頁(yè)面標(biāo)題、頁(yè)眉、頁(yè)腳、主體內(nèi)容、功能區(qū)、導(dǎo)航區(qū)中的至少一個(gè)區(qū)域,則在本示例中,子步驟S41可以包括如下子步驟:
      [0202]子步驟S411,提取網(wǎng)頁(yè)中頁(yè)面標(biāo)題、頁(yè)眉、頁(yè)腳、主體內(nèi)容、功能區(qū)、導(dǎo)航區(qū)中的至少一個(gè)區(qū)域的文本信息。
      [0203]子步驟S42,判斷所述文本信息中是否具有通訊特征信息;若是,則執(zhí)行子步驟S43 ;
      [0204]在本發(fā)明的一種可選實(shí)施例中,所述通訊特征信息可以包括指定位數(shù)的電話號(hào)碼,所述指定位數(shù)可以為7位或8位。則在本發(fā)明實(shí)施例中,子步驟S42可以包括如下子步驟:
      [0205]子步驟S421,對(duì)所述文本信息進(jìn)行分詞處理,獲得一個(gè)或多個(gè)文本分詞;
      [0206]子步驟S422,當(dāng)所述文本分詞與預(yù)設(shè)的通訊標(biāo)識(shí)匹配時(shí),判斷第一目標(biāo)文本分詞是否為指定位數(shù)的數(shù)字序列;若是,則執(zhí)行子步驟S423 ;
      [0207]所述第一目標(biāo)文本分詞可以為與所述通訊標(biāo)識(shí)匹配的文本分詞之后的文本分詞;
      [0208]子步驟S423,判斷所述第一目標(biāo)文本分詞為指定位數(shù)的電話號(hào)碼。
      [0209]在本發(fā)明的一種可選實(shí)施例中,所述通訊特征信息還可以包括電話區(qū)號(hào);則在本發(fā)明實(shí)施例中,子步驟S42還可以包括如下子步驟:
      [0210]子步驟S424,判斷第二目標(biāo)文本分詞中是否具有區(qū)號(hào)標(biāo)識(shí);若是,則執(zhí)行子步驟S425 ;
      [0211]所述第二目標(biāo)文本分詞可以為與所述通訊標(biāo)識(shí)匹配的文本分詞之后的文本分詞;
      [0212]子步驟S425,判斷所述目標(biāo)文本分詞對(duì)應(yīng)的文本分詞為電話區(qū)號(hào)。
      [0213]在本發(fā)明實(shí)施例的一種可選示例中,子步驟S425可以包括如下子步驟:
      [0214]子步驟S4251,判斷所述目標(biāo)文本分詞包含的文本分詞為電話區(qū)號(hào);
      [0215]或者,
      [0216]子步驟S4252,判斷在所述目標(biāo)文本分詞之前的文本分詞為電話區(qū)號(hào)。
      [0217]子步驟S43,提取所述通訊特征信息;
      [0218]子步驟S44,采用所述通訊特征信息和所述網(wǎng)頁(yè)建立文檔索引。
      [0219]在本發(fā)明的一種可選實(shí)施例中,子步驟S44可以包括如下子步驟:
      [0220]子步驟S441,記錄出現(xiàn)的所述通訊特征信息在所述網(wǎng)頁(yè)中出現(xiàn)的位置;
      [0221]子步驟S442,將所述通訊特征信息及所述出現(xiàn)的位置記錄在文檔索引中。
      [0222]在本發(fā)明實(shí)施例中,由于步驟501與方法實(shí)施例1的應(yīng)用基本相似,所以描述的比較簡(jiǎn)單,相關(guān)之處參見方法實(shí)施例1的部分說(shuō)明即可,本發(fā)明實(shí)施例在此不加以詳述。
      [0223]步驟502,接收用戶的搜索關(guān)鍵詞;
      [0224]步驟503,識(shí)別所述搜索關(guān)鍵詞中的一個(gè)或多個(gè)搜索信息;
      [0225]步驟504,當(dāng)所述搜索信息包括指定位數(shù)的數(shù)字序列時(shí),提高搜索結(jié)果中具有與所述指定位數(shù)的數(shù)字序列匹配的通訊特征信息的搜索結(jié)果項(xiàng)的權(quán)重。
      [0226]步驟505,當(dāng)所述搜索信息包括通訊標(biāo)識(shí)時(shí),提高具有與所述通訊標(biāo)識(shí)匹配的通訊特征信息的搜索結(jié)果項(xiàng)的權(quán)重;
      [0227]在具體實(shí)現(xiàn)中,用戶搜索與通訊特征詞匹配的通訊標(biāo)識(shí),則其查詢目的可能為查詢電話號(hào)碼,則可以提高包含該通訊特征詞的搜索結(jié)果項(xiàng)的權(quán)重,以進(jìn)一步提高該搜索結(jié)果項(xiàng)在搜索結(jié)果中的展示順序。
      [0228]本發(fā)明實(shí)施例當(dāng)搜索信息包括通訊標(biāo)識(shí)時(shí),提高具有與通訊標(biāo)識(shí)匹配的通訊特征信息的搜索結(jié)果項(xiàng)的權(quán)重,進(jìn)一步提高了搜索的準(zhǔn)確率。
      [0229]步驟506,獲取當(dāng)前所在位置的電話區(qū)號(hào);
      [0230]在本發(fā)明實(shí)施例中,可以獲取用戶當(dāng)前所在的位置,再查詢?cè)撐恢脤?duì)應(yīng)的電話區(qū)號(hào)。
      [0231]若用戶通過(guò)手機(jī)等移動(dòng)設(shè)備提交搜索關(guān)鍵詞時(shí),可以定位當(dāng)前的經(jīng)瑋度,通過(guò)逆地理編碼等方式識(shí)別該經(jīng)瑋度所在的位置。
      [0232]若用戶通過(guò)電腦等固定設(shè)備提交搜索關(guān)鍵詞時(shí),可以查詢當(dāng)前的IP地址(Internet Protocol Address,又譯為網(wǎng)際協(xié)議地址),再識(shí)別該IP地址所在的位置。
      [0233]步驟507,當(dāng)所述電話區(qū)號(hào)與所述通訊特征信息匹配時(shí),提高具有所述通訊特征信息的搜索結(jié)果的權(quán)重。
      [0234]在具體實(shí)現(xiàn)中,用戶當(dāng)前所在位置的區(qū)號(hào)與通訊特征詞(如電話區(qū)號(hào))匹配,則可以提高包含該通訊特征詞(如電話區(qū)號(hào))的搜索結(jié)果項(xiàng)的權(quán)重,以進(jìn)一步提高該搜索結(jié)果項(xiàng)在搜索結(jié)果中的展示順序。
      [0235]本發(fā)明實(shí)施例在當(dāng)前位置的電話區(qū)號(hào)與通訊特征信息匹配時(shí),提高具有該通訊特征信息的搜索結(jié)果的權(quán)重,進(jìn)一步提高了搜索的準(zhǔn)確率。
      [0236]在實(shí)際應(yīng)用中,所述搜索結(jié)果項(xiàng)可以包括網(wǎng)頁(yè)摘要信息,所述網(wǎng)頁(yè)摘要信息可以包括所述通訊特征信息(如電話號(hào)碼、電話區(qū)號(hào))在網(wǎng)頁(yè)中出現(xiàn)的位置對(duì)應(yīng)的網(wǎng)頁(yè)信息。
      [0237]例如,如圖6所示,若用戶搜索“電話2223256”,可以將包含電話“電話”(通訊標(biāo)識(shí))、“2223256” (指定位數(shù)的數(shù)字序列)的搜索結(jié)果項(xiàng)的展示位置提升至搜索結(jié)果的前幾項(xiàng),方便用戶快捷查詢。
      [0238]本發(fā)明實(shí)施例中將通訊特征信息及出現(xiàn)的位置制作網(wǎng)頁(yè)摘要信息,可以在搜索結(jié)果項(xiàng)中的摘要信息獲取到電話號(hào)碼及其歸屬的信息,減少用戶點(diǎn)擊搜索結(jié)果的頻次,減少網(wǎng)頁(yè)服務(wù)器、當(dāng)前電子設(shè)備的資源以及帶寬的消耗。
      [0239]步驟508,按照所述權(quán)重對(duì)所述一個(gè)或多個(gè)搜索結(jié)果項(xiàng)進(jìn)行順序排序;
      [0240]本發(fā)明實(shí)施例中,可以按照權(quán)重對(duì)一個(gè)或多個(gè)搜索結(jié)果項(xiàng)進(jìn)行順序排序,權(quán)重越高的搜索結(jié)果項(xiàng),排序越在前,權(quán)重越低的搜索結(jié)果項(xiàng),排序越在后。
      [0241]步驟509,將順序排序后的搜索結(jié)果返回客戶端進(jìn)行展示。
      [0242]在HTTP協(xié)議下,瀏覽器或內(nèi)置微型瀏覽器的應(yīng)用程序可以從搜索引擎所在的服務(wù)器接收到HTML (Hypertext Markup Language,超文本標(biāo)記語(yǔ)言)類型的文檔。
      [0243]瀏覽器或內(nèi)置微型瀏覽器的應(yīng)用程序可以解析HTML文檔,生成樹狀結(jié)構(gòu)的對(duì)象,即DOM(Document Object Model,文件對(duì)象模型),每個(gè)對(duì)象是DOM上的一個(gè)結(jié)點(diǎn),而這些對(duì)象可以代表文字、圖片等網(wǎng)頁(yè)資源。瀏覽器或內(nèi)置微型瀏覽器的應(yīng)用程序可以開始顯示此HTML文檔,并獲取其中內(nèi)嵌的網(wǎng)頁(yè)資源的地址,然后瀏覽器再向服務(wù)器發(fā)起請(qǐng)求來(lái)獲取這些網(wǎng)頁(yè)資源,并在瀏覽器或內(nèi)置微型瀏覽器的應(yīng)用程序的HTML文檔中顯示搜索結(jié)果。
      [0244]對(duì)于方法實(shí)施例,為了簡(jiǎn)單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明實(shí)施例并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本發(fā)明實(shí)施例,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說(shuō)明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作并不一定是本發(fā)明實(shí)施例所必須的。
      [0245]參照?qǐng)D7,示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種文檔索引的建立裝置實(shí)施例的結(jié)構(gòu)框圖,具體可以包括如下模塊:
      [0246]第一提取模塊701,適于提取網(wǎng)頁(yè)中的文本信息;
      [0247]判斷模塊702,適于判斷所述文本信息中是否具有通訊特征信息;若是,則調(diào)用第二提取模塊703 ;
      [0248]第二提取模塊703,適于提取所述通訊特征信息;
      [0249]建立模塊704,適于采用所述通訊特征信息和所述網(wǎng)頁(yè)建立文檔索引。
      [0250]在本發(fā)明實(shí)施例的一種可選示例中,所述網(wǎng)頁(yè)可以包括頁(yè)面標(biāo)題、頁(yè)眉、頁(yè)腳、主體內(nèi)容、功能區(qū)、導(dǎo)航區(qū)中的至少一個(gè)區(qū)域;
      [0251]所述第一提取模塊701還可以適于:
      [0252]提取網(wǎng)頁(yè)中頁(yè)面標(biāo)題、頁(yè)眉、頁(yè)腳、主體內(nèi)容、功能區(qū)、導(dǎo)航區(qū)中的至少一個(gè)區(qū)域的文本信息。
      [0253]在本發(fā)明的一種可選實(shí)施例中,所述通訊特征信息可以包括指定位數(shù)的電話號(hào)碼;所述判斷模塊702還可以適于:
      [0254]對(duì)所述文本信息進(jìn)行分詞處理,獲得一個(gè)或多個(gè)文本分詞;
      [0255]當(dāng)所述文本分詞與預(yù)設(shè)的通訊標(biāo)識(shí)匹配時(shí),判斷第一目標(biāo)文本分詞是否為指定位數(shù)的數(shù)字序列;所述第一目標(biāo)文本分詞為與所述通訊標(biāo)識(shí)匹配的文本分詞之后的文本分詞;
      [0256]若是,則判斷所述第一目標(biāo)文本分詞為指定位數(shù)的電話號(hào)碼。
      [0257]在本發(fā)明的一種可選實(shí)施例中,所述通訊特征信息還可以包括電話區(qū)號(hào);所述判斷模塊702還可以適于:
      [0258]判斷第二目標(biāo)文本分詞中是否具有區(qū)號(hào)標(biāo)識(shí);若是,則判斷所述目標(biāo)文本分詞對(duì)應(yīng)的文本分詞為電話區(qū)號(hào);所述第二目標(biāo)文本分詞為與所述通訊標(biāo)識(shí)匹配的文本分詞之后的文本分詞。
      [0259]在本發(fā)明實(shí)施例的一種可選示例中,所述判斷模塊702還可以適于:
      [0260]判斷所述目標(biāo)文本分詞包含的文本分詞為電話區(qū)號(hào);
      [0261]或者,
      [0262]判斷在所述目標(biāo)文本分詞之前的文本分詞為電話區(qū)號(hào)。
      [0263]在本發(fā)明實(shí)施例的一種可選示例中,所述指定位數(shù)可以為7位或8位。
      [0264]在本發(fā)明的一種可選實(shí)施例中,所述建立模塊704還可以適于:
      [0265]記錄出現(xiàn)的所述通訊特征信息在所述網(wǎng)頁(yè)中出現(xiàn)的位置;
      [0266]將所述通訊特征信息及所述出現(xiàn)的位置記錄在文檔索引中。
      [0267]參照?qǐng)D8,示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種搜索的裝置實(shí)施例的結(jié)構(gòu)框圖,具體可以包括如下模塊:
      [0268]接收模塊801,適于接收用戶的搜索關(guān)鍵詞;
      [0269]識(shí)別模塊802,適于識(shí)別所述搜索關(guān)鍵詞中的一個(gè)或多個(gè)搜索信息;
      [0270]第一提高模塊803,適于在所述搜索信息包括指定位數(shù)的數(shù)字序列時(shí),提高搜索結(jié)果中具有與所述指定位數(shù)的數(shù)字序列匹配的通訊特征信息的搜索結(jié)果項(xiàng)的權(quán)重。
      [0271]在本發(fā)明的一種可選實(shí)施例中,所述裝置還可以包括如下模塊:
      [0272]第二提高模塊,適于在所述搜索信息包括通訊標(biāo)識(shí)時(shí),提高具有與所述通訊標(biāo)識(shí)匹配的通訊特征信息的搜索結(jié)果項(xiàng)的權(quán)重。
      [0273]在本發(fā)明的一種可選實(shí)施例中,所述裝置還可以包括如下模塊:
      [0274]獲取模塊,適于獲取當(dāng)前所在位置的電話區(qū)號(hào);
      [0275]第三提高模塊,適于在所述電話區(qū)號(hào)與所述通訊特征信息匹配時(shí),提高具有所述通訊特征信息的搜索結(jié)果的權(quán)重。
      [0276]在本發(fā)明的一種可選實(shí)施例中,所述裝置還可以包括如下模塊:
      [0277]排序模塊,適于按照所述權(quán)重對(duì)所述一個(gè)或多個(gè)搜索結(jié)果項(xiàng)進(jìn)行順序排序;
      [0278]返回模塊,適于將順序排序后的搜索結(jié)果返回客戶端進(jìn)行展示。
      [0279]在本發(fā)明的一種可選實(shí)施例中,所述搜索結(jié)果項(xiàng)可以包括網(wǎng)頁(yè)摘要信息,所述網(wǎng)頁(yè)摘要信息可以包括所述通訊特征信息在網(wǎng)頁(yè)中出現(xiàn)的位置對(duì)應(yīng)的網(wǎng)頁(yè)信息。
      [0280]在本發(fā)明的一種可選實(shí)施例中,所述裝置還可以包括如下模塊:
      [0281]文檔索引建立模塊,適于建立文檔索引。
      [0282]在本發(fā)明的一種可選實(shí)施例中,所述文檔索引建立模塊還可以適于:
      [0283]提取網(wǎng)頁(yè)中的文本信息;
      [0284]判斷所述文本信息中是否具有通訊特征信息;若是,則提取所述通訊特征信息;
      [0285]采用所述通訊特征信息和所述網(wǎng)頁(yè)建立文檔索引。
      [0286]在本發(fā)明實(shí)施例的一種可選示例中,所述網(wǎng)頁(yè)可以包括頁(yè)面標(biāo)題、網(wǎng)頁(yè)標(biāo)識(shí)、頁(yè)眉、頁(yè)腳、導(dǎo)航、主體內(nèi)容中的至少一個(gè)區(qū)域;
      [0287]所述文檔索引建立模塊還可以適于:
      [0288]提取網(wǎng)頁(yè)中頁(yè)面標(biāo)題、頁(yè)眉、頁(yè)腳、主體內(nèi)容、功能區(qū)、導(dǎo)航區(qū)中的至少一個(gè)區(qū)域的文本信息。
      [0289]在本發(fā)明的一種可選實(shí)施例中,所述通訊特征信息可以包括指定位數(shù)的電話號(hào)碼;所述文檔索引建立模塊還可以適于:
      [0290]對(duì)所述文本信息進(jìn)行分詞處理,獲得一個(gè)或多個(gè)文本分詞;
      [0291]當(dāng)所述文本分詞與預(yù)設(shè)的通訊標(biāo)識(shí)匹配時(shí),判斷第一目標(biāo)文本分詞是否為指定位數(shù)的數(shù)字序列;所述第一目標(biāo)文本分詞為與所述通訊標(biāo)識(shí)匹配的文本分詞之后的文本分詞;
      [0292]若是,則判斷所述第一目標(biāo)文本分詞為指定位數(shù)的電話號(hào)碼。
      [0293]在本發(fā)明的一種可選實(shí)施例中,所述通訊特征信息還可以包括電話區(qū)號(hào);所述文檔索引建立模塊還可以適于:
      [0294]判斷第二目標(biāo)文本分詞中是否具有區(qū)號(hào)標(biāo)識(shí);若是,則判斷所述目標(biāo)文本分詞對(duì)應(yīng)的文本分詞為電話區(qū)號(hào);所述第二目標(biāo)文本分詞為與所述通訊標(biāo)識(shí)匹配的文本分詞之后的文本分詞。
      [0295]在本發(fā)明實(shí)施例的一種可選示例中,所述文檔索引建立模塊還可以適于:
      [0296]判斷所述目標(biāo)文本分詞包含的文本分詞為電話區(qū)號(hào);
      [0297]或者,
      [0298]判斷在所述目標(biāo)文本分詞之前的文本分詞為電話區(qū)號(hào)。
      [0299]在本發(fā)明實(shí)施例的一種可選示例中,所述指定位數(shù)可以為7位或8位。
      [0300]在本發(fā)明的一種可選實(shí)施例中,所述文檔索引建立模塊還可以適于:
      [0301]記錄出現(xiàn)的所述通訊特征信息在所述網(wǎng)頁(yè)中出現(xiàn)的位置;
      [0302]將所述通訊特征信息及所述出現(xiàn)的位置記錄在文檔索引中。
      [0303]對(duì)于裝置實(shí)施例而言,由于其與方法實(shí)施例基本相似,所以描述的比較簡(jiǎn)單,相關(guān)之處參見方法實(shí)施例的部分說(shuō)明即可。
      [0304]在此提供的算法和顯示不與任何特定計(jì)算機(jī)、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對(duì)任何特定編程語(yǔ)言。應(yīng)當(dāng)明白,可以利用各種編程語(yǔ)言實(shí)現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對(duì)特定語(yǔ)言所做的描述是為了披露本發(fā)明的最佳實(shí)施方式。
      [0305]在此處所提供的說(shuō)明書中,說(shuō)明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒(méi)有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對(duì)本說(shuō)明書的理解。
      [0306]類似地,應(yīng)當(dāng)理解,為了精簡(jiǎn)本公開并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在上面對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說(shuō),如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個(gè)實(shí)施例的所有特征。因此,遵循【具體實(shí)施方式】的權(quán)利要求書由此明確地并入該【具體實(shí)施方式】,其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。
      [0307]本領(lǐng)域那些技術(shù)人員可以理解,可以對(duì)實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們?cè)O(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)設(shè)備中??梢园褜?shí)施例中的模塊或單元或組件組合成一個(gè)模塊或單元或組件,以及此外可以把它們分成多個(gè)子模塊或子單元或子組件。除了這樣的特征和/或過(guò)程或者單元中的至少一些是相互排斥之外,可以采用任何組合對(duì)本說(shuō)明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過(guò)程或單元進(jìn)行組合。除非另外明確陳述,本說(shuō)明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來(lái)代替。
      [0308]此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在下面的權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來(lái)使用。
      [0309]本發(fā)明的各個(gè)部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號(hào)處理器(DSP)來(lái)實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的搜索的設(shè)備中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè)信號(hào)的形式。這樣的信號(hào)可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號(hào)上提供,或者以任何其他形式提供。
      [0310]應(yīng)該注意的是上述實(shí)施例對(duì)本發(fā)明進(jìn)行說(shuō)明而不是對(duì)本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號(hào)之間的任何參考符號(hào)構(gòu)造成對(duì)權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個(gè)”不排除存在多個(gè)這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來(lái)實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個(gè)可以是通過(guò)同一個(gè)硬件項(xiàng)來(lái)具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
      【權(quán)利要求】
      1.一種搜索方法,包括: 接收用戶的搜索關(guān)鍵詞; 識(shí)別所述搜索關(guān)鍵詞中的一個(gè)或多個(gè)搜索信息; 當(dāng)所述搜索信息包括指定位數(shù)的數(shù)字序列時(shí),提高搜索結(jié)果中具有與所述指定位數(shù)的數(shù)字序列匹配的通訊特征信息的搜索結(jié)果項(xiàng)的權(quán)重。
      2.如權(quán)利要求1所述的方法,其特征在于,還包括: 當(dāng)所述搜索信息包括通訊標(biāo)識(shí)時(shí),提高具有與所述通訊標(biāo)識(shí)匹配的通訊特征信息的搜索結(jié)果項(xiàng)的權(quán)重。
      3.如權(quán)利要求1-2任一項(xiàng)所述的方法,其特征在于,還包括: 獲取當(dāng)前所在位置的電話區(qū)號(hào); 當(dāng)所述電話區(qū)號(hào)與所述通訊特征信息匹配時(shí),提高具有所述通訊特征信息的搜索結(jié)果的權(quán)重。
      4.如權(quán)利要求1或2或3所述的方法,其特征在于,還包括: 按照所述權(quán)重對(duì)所述一個(gè)或多個(gè)搜索結(jié)果項(xiàng)進(jìn)行順序排序; 將順序排序后的搜索結(jié)果返回客戶端進(jìn)行展示。
      5.如權(quán)利要求1-3任一項(xiàng)所述的方法,其特征在于,所述搜索結(jié)果項(xiàng)包括網(wǎng)頁(yè)摘要信息,所述網(wǎng)頁(yè)摘要信息包括所述通訊特征信息在網(wǎng)頁(yè)中出現(xiàn)的位置對(duì)應(yīng)的網(wǎng)頁(yè)信息。
      6.如權(quán)利要求1-5任一項(xiàng)所述的方法,其特征在于,所述建立文檔索引的步驟包括: 提取網(wǎng)頁(yè)中的文本信息; 判斷所述文本信息中是否具有通訊特征信息;若是,則提取所述通訊特征信息; 采用所述通訊特征信息和所述網(wǎng)頁(yè)建立文檔索引。
      7.—種搜索裝置,包括: 接收模塊,適于接收用戶的搜索關(guān)鍵詞; 識(shí)別模塊,適于識(shí)別所述搜索關(guān)鍵詞中的一個(gè)或多個(gè)搜索信息; 第一提高模塊,適于在所述搜索信息包括指定位數(shù)的數(shù)字序列時(shí),提高搜索結(jié)果中具有與所述指定位數(shù)的數(shù)字序列匹配的通訊特征信息的搜索結(jié)果項(xiàng)的權(quán)重。
      8.如權(quán)利要求7所述的裝置,其特征在于,還包括: 第二提高模塊,適于在所述搜索信息包括通訊標(biāo)識(shí)時(shí),提高具有與所述通訊標(biāo)識(shí)匹配的通訊特征信息的搜索結(jié)果項(xiàng)的權(quán)重。
      9.如權(quán)利要求7-8任一項(xiàng)所述的裝置,其特征在于,還包括: 獲取模塊,適于獲取當(dāng)前所在位置的電話區(qū)號(hào); 第三提高模塊,適于在所述電話區(qū)號(hào)與所述通訊特征信息匹配時(shí),提高具有所述通訊特征信息的搜索結(jié)果的權(quán)重。
      10.如權(quán)利要求7-9任一項(xiàng)所述的裝置,其特征在于,還包括: 排序模塊,適于按照所述權(quán)重對(duì)所述一個(gè)或多個(gè)搜索結(jié)果項(xiàng)進(jìn)行順序排序; 返回模塊,適于將順序排序后的搜索結(jié)果返回客戶端進(jìn)行展示。
      【文檔編號(hào)】G06F17/30GK104504070SQ201410806935
      【公開日】2015年4月8日 申請(qǐng)日期:2014年12月22日 優(yōu)先權(quán)日:2014年12月22日
      【發(fā)明者】王翀, 陳進(jìn)平 申請(qǐng)人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1