一種范文檢索請(qǐng)求的處理方法和裝置制造方法
【專利摘要】本發(fā)明提供了一種范文檢索請(qǐng)求的處理方法,包括:獲取用戶的檢索請(qǐng)求;根據(jù)請(qǐng)求內(nèi)容的關(guān)鍵詞,判斷所述檢索請(qǐng)求是否是范文檢索請(qǐng)求;如果是,根據(jù)請(qǐng)求內(nèi)容的關(guān)鍵詞,在范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)進(jìn)行檢索;提取檢索到的與所述關(guān)鍵詞匹配的范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)的關(guān)鍵項(xiàng)信息;將所述關(guān)鍵項(xiàng)信息以應(yīng)用框結(jié)構(gòu)嵌入檢索結(jié)果頁(yè)中。根據(jù)本發(fā)明提供的方法,使得真正與用戶所要求的范文字?jǐn)?shù)相同、相近的范文網(wǎng)頁(yè)出現(xiàn)在搜索結(jié)果頁(yè)中,并且在搜索結(jié)果排序時(shí)排在搜索結(jié)果頁(yè)的前面,提高了范文搜索的質(zhì)量。本發(fā)明提供了一種相應(yīng)的處理裝置。
【專利說(shuō)明】一種范文檢索請(qǐng)求的處理方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)搜索領(lǐng)域,特別是涉及一種范文檢索請(qǐng)求的處理方法和裝置?!颈尘凹夹g(shù)】
[0002]范文搜索是網(wǎng)頁(yè)搜索中一種很重要的需求,被搜索的范文類型眾多,包括但不限于各類公文、文秘書信、工作計(jì)劃、總結(jié)報(bào)告、心得體會(huì)、演講致辭、作文作業(yè)、各種論文等等。在例如學(xué)生非放假期間、年底工作總結(jié)期間的高峰期,每天可以占到總網(wǎng)頁(yè)搜索量的1%左右。實(shí)際中,大多數(shù)范文需求對(duì)于字?jǐn)?shù)都有固定要求,因而很多用戶都會(huì)在進(jìn)行范文搜索時(shí)輸入字?jǐn)?shù),如“讀后感400字”、“獎(jiǎng)學(xué)金申請(qǐng)書800字”等。即使在搜索時(shí)沒有明確將字?jǐn)?shù)輸入,也會(huì)存在有對(duì)于該范文字?jǐn)?shù)的潛在要求;例如,論文類的范文一般不低于8000字;入黨申請(qǐng)書類的范文一般要求有3000?5000字,等等。
[0003]對(duì)于范文搜索,目前存在的問(wèn)題主要有兩個(gè):一是當(dāng)前檢索機(jī)制只能通過(guò)標(biāo)題、網(wǎng)頁(yè)內(nèi)容匹配來(lái)命中字?jǐn)?shù)的需求,對(duì)于沒有相關(guān)字?jǐn)?shù)的網(wǎng)頁(yè)排序不公平;由于找不到相應(yīng)的字?jǐn)?shù)的字段,也使得召回率不足;二是在目前檢索結(jié)果的標(biāo)題摘要下,用戶只能通過(guò)相應(yīng)字段飄紅來(lái)判定是否是自己想要的信息,對(duì)于很多有欺騙性質(zhì)的頁(yè)面、字?jǐn)?shù)是否滿足要求等都是沒有預(yù)期的。
[0004]圖1示出了當(dāng)前范文搜索的搜索結(jié)果頁(yè)示意圖,用戶輸入的范文搜索請(qǐng)求是“以家為題的作文350字”;在搜索結(jié)果頁(yè)中,除了第一條結(jié)果的標(biāo)題摘要直接命中350字外,其它結(jié)果都不知道有多少字?jǐn)?shù),只能將“350字”這個(gè)關(guān)鍵詞丟棄來(lái)進(jìn)行排序,對(duì)于一些潛在與350字非常接近的結(jié)果來(lái)說(shuō)就顯得非常不公平;用戶也不知道什么結(jié)果是好結(jié)果,只能逐個(gè)點(diǎn)擊查看,效率比較低下。
【發(fā)明內(nèi)容】
[0005]鑒于上述問(wèn)題,提出了本發(fā)明以便提供一種克服上述問(wèn)題或者至少部分地解決上述問(wèn)題的范文檢索請(qǐng)求的處理方法和相應(yīng)的裝置。
[0006]依據(jù)本發(fā)明的一個(gè)方面,提供了一種范文檢索請(qǐng)求的處理方法,包括:
[0007]獲取用戶的檢索請(qǐng)求;
[0008]根據(jù)請(qǐng)求內(nèi)容的關(guān)鍵詞,判斷所述檢索請(qǐng)求是否是范文檢索請(qǐng)求;
[0009]如果是,根據(jù)請(qǐng)求內(nèi)容的關(guān)鍵詞,在范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)進(jìn)行檢索;
[0010]提取檢索到的與所述關(guān)鍵詞匹配的范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)的關(guān)鍵項(xiàng)信息;
[0011 ] 將所述關(guān)鍵項(xiàng)信息以應(yīng)用框結(jié)構(gòu)嵌入檢索結(jié)果頁(yè)中。
[0012]可選地,所述范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)包括多個(gè)范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng),一范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)包括一范文網(wǎng)頁(yè)的范文類型、范文數(shù)據(jù)和URL,且所述范文數(shù)據(jù)包括范文標(biāo)題,范文正文和范文字?jǐn)?shù);所述請(qǐng)求內(nèi)容包括主題關(guān)鍵詞和字?jǐn)?shù)關(guān)鍵詞;其中,檢索步驟包括,在范文類型和/或范文標(biāo)題和/或范文正文中匹配主題關(guān)鍵詞,并將字?jǐn)?shù)關(guān)鍵詞與范文字?jǐn)?shù)進(jìn)行匹配;且所述提取的關(guān)鍵項(xiàng)信息至少包括范文標(biāo)題和范文字?jǐn)?shù)。[0013]可選地,一范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)包括多個(gè)范文數(shù)據(jù);其中,檢索步驟包括,在該范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)的多個(gè)范文數(shù)據(jù)中分別進(jìn)行關(guān)鍵詞匹配;且提取步驟包括,對(duì)于檢索到的與所述關(guān)鍵詞匹配的多個(gè)范文數(shù)據(jù),提取匹配的多個(gè)范文數(shù)據(jù)中的范文標(biāo)題和范文字?jǐn)?shù)。
[0014]可選地,所述范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)包括多個(gè)范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng),一范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)包括一范文網(wǎng)頁(yè)的范文類型、范文數(shù)據(jù)和URL ;且所述范文數(shù)據(jù)包括范文標(biāo)題,和范文文檔或范文文檔的下載鏈接;所述請(qǐng)求內(nèi)容包括主題關(guān)鍵詞和字?jǐn)?shù)關(guān)鍵詞;其中,檢索步驟包括,在范文類型和/或范文標(biāo)題中匹配主題關(guān)鍵詞;且所述提取的關(guān)鍵項(xiàng)信息至少包括范文標(biāo)題。
[0015]可選地,檢索步驟還包括,根據(jù)請(qǐng)求內(nèi)容的關(guān)鍵詞,在基礎(chǔ)網(wǎng)頁(yè)庫(kù)進(jìn)行檢索;其中所述基礎(chǔ)網(wǎng)頁(yè)庫(kù)包括由網(wǎng)絡(luò)爬蟲下載存儲(chǔ)到服務(wù)器側(cè)的網(wǎng)頁(yè);并且所述方法還包括,在檢索結(jié)果頁(yè)中合并在范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)檢索到的范文網(wǎng)頁(yè)和在基礎(chǔ)網(wǎng)頁(yè)庫(kù)檢索到的范文網(wǎng)頁(yè),且iu者在檢索結(jié)果頁(yè)的排序聞?dòng)诤笳摺?br>
[0016]可選地,對(duì)于檢索結(jié)果頁(yè)中在范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)檢索到的范文網(wǎng)頁(yè),根據(jù)其范文字?jǐn)?shù)與字?jǐn)?shù)關(guān)鍵詞的匹配度由高到低進(jìn)行排序。
[0017]依據(jù)本發(fā)明的另一方面,還提供一種范文檢索請(qǐng)求的處理裝置,包括:
[0018]請(qǐng)求獲取單元,適于獲取用戶的檢索請(qǐng)求;
[0019]請(qǐng)求判斷單元,適于根據(jù)請(qǐng)求內(nèi)容的關(guān)鍵詞,判斷所述檢索請(qǐng)求是否是范文檢索請(qǐng)求;
[0020]檢索單元,適于根據(jù)請(qǐng)求內(nèi)容的關(guān)鍵詞,在范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)進(jìn)行檢索;
[0021]關(guān)鍵項(xiàng)提取單元,適于提取檢索到的與所述關(guān)鍵詞匹配的范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)的關(guān)鍵項(xiàng)信息;
[0022]信息嵌入單元,適于將所述關(guān)鍵項(xiàng)信息以應(yīng)用框結(jié)構(gòu)嵌入檢索結(jié)果頁(yè)中。
[0023]可選地,所述范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)包括多個(gè)范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng),一范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)包括一范文網(wǎng)頁(yè)的范文類型、范文數(shù)據(jù)和URL,且所述范文數(shù)據(jù)包括范文標(biāo)題,范文正文和范文字?jǐn)?shù);所述請(qǐng)求內(nèi)容包括主題關(guān)鍵詞和字?jǐn)?shù)關(guān)鍵詞;其中,檢索單元適于,在范文類型和/或范文標(biāo)題和/或范文正文中匹配主題關(guān)鍵詞,并將字?jǐn)?shù)關(guān)鍵詞與范文字?jǐn)?shù)進(jìn)行匹配;且所述提取的關(guān)鍵項(xiàng)信息至少包括范文標(biāo)題和范文字?jǐn)?shù)。
[0024]可選地,一范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)包括多個(gè)范文數(shù)據(jù);其中檢索單元適于,在該范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)的多個(gè)范文數(shù)據(jù)中分別進(jìn)行關(guān)鍵詞匹配;且關(guān)鍵項(xiàng)提取單元適于,對(duì)于檢索到的與所述關(guān)鍵詞匹配的多個(gè)范文數(shù)據(jù),提取匹配的多個(gè)范文數(shù)據(jù)中的范文標(biāo)題和范文字?jǐn)?shù)。
[0025]可選地,所述范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)包括多個(gè)范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng),一范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)包括一范文網(wǎng)頁(yè)的范文類型、范文數(shù)據(jù)和URL ;且所述范文數(shù)據(jù)包括范文標(biāo)題,和范文文檔或范文文檔的下載鏈接;所述請(qǐng)求內(nèi)容包括主題關(guān)鍵詞和字?jǐn)?shù)關(guān)鍵詞;其中,檢索單元適于,在范文類型和/或范文標(biāo)題中匹配主題關(guān)鍵詞;且所述提取的關(guān)鍵項(xiàng)信息至少包括范文標(biāo)題。
[0026]可選地,檢索單元還適于,根據(jù)請(qǐng)求內(nèi)容的關(guān)鍵詞,在基礎(chǔ)網(wǎng)頁(yè)庫(kù)進(jìn)行檢索;其中所述基礎(chǔ)網(wǎng)頁(yè)庫(kù)包括由網(wǎng)絡(luò)爬蟲下載存儲(chǔ)到服務(wù)器側(cè)的網(wǎng)頁(yè);并且所述裝置還包括合并排序單元,其適于在檢索結(jié)果頁(yè)中合并在范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)檢索到的范文網(wǎng)頁(yè)和在基礎(chǔ)網(wǎng)頁(yè)庫(kù)檢索到的范文網(wǎng)頁(yè),且前者在檢索結(jié)果頁(yè)的排序高于后者。[0027]可選地,所述合并排序單元還適于對(duì)于檢索結(jié)果頁(yè)中在范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)檢索到的范文網(wǎng)頁(yè),根據(jù)其范文字?jǐn)?shù)與字?jǐn)?shù)關(guān)鍵詞的匹配度由高到低進(jìn)行排序。
[0028]根據(jù)本發(fā)明的范文檢索請(qǐng)求的處理方法和裝置,用戶發(fā)出范文搜索請(qǐng)求時(shí),在網(wǎng)頁(yè)爬蟲抓取的基礎(chǔ)網(wǎng)頁(yè)庫(kù)進(jìn)行常規(guī)搜索的同時(shí),還在范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中進(jìn)行搜索。由于范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中包含了各種范文網(wǎng)頁(yè)的范文標(biāo)題、正文以及字?jǐn)?shù),使得真正與用戶所要求的范文字?jǐn)?shù)相同、相近的范文網(wǎng)頁(yè)出現(xiàn)在搜索結(jié)果頁(yè)中,并且能在搜索結(jié)果排序時(shí)能排在前面,提高了范文搜索的質(zhì)量;進(jìn)一步還能在搜索結(jié)果頁(yè)中將范文標(biāo)題和范文字?jǐn)?shù)顯示給用戶,以使得用戶在不點(diǎn)擊查看檢索結(jié)果內(nèi)容的情況下就能知道檢索到的范文網(wǎng)頁(yè)的字?jǐn)?shù),能更快速地決定哪些結(jié)果需要查看,提高了整體效率和用戶體驗(yàn)。
[0029]上述說(shuō)明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說(shuō)明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的【具體實(shí)施方式】。
【專利附圖】
【附圖說(shuō)明】
[0030]通過(guò)閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:
[0031]圖1是現(xiàn)有技術(shù)的范文搜索的搜索結(jié)果頁(yè)示意圖;
[0032]圖2是根據(jù)本發(fā)明一實(shí)施例的范文檢索請(qǐng)求的處理方法的流程圖;
[0033]圖3是根據(jù)本發(fā)明一實(shí)施例中使用的范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)的數(shù)據(jù)結(jié)構(gòu)示意圖;
[0034]圖4是根據(jù)本發(fā)明一實(shí)施例中使用的范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)的一范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)的示意圖;
[0035]圖5是根據(jù)本發(fā)明一實(shí)施例的范文搜索的搜索結(jié)果頁(yè)示意圖;
[0036]圖6是根據(jù)本發(fā)明另一實(shí)施例的范文搜索請(qǐng)求的處理裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0037]下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施例。雖然附圖中顯示了本公開的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
[0038]實(shí)施例一
[0039]本實(shí)施例提供一種范文檢索請(qǐng)求的處理方法。當(dāng)用戶向搜索引擎發(fā)起范文搜索請(qǐng)求時(shí),所述處理方法在搜索引擎的服務(wù)器側(cè)執(zhí)行。
[0040]圖2示出了根據(jù)本實(shí)施例的范文檢索請(qǐng)求的處理方法,包括步驟S201-S207,其中:
[0041]步驟S201:獲取用戶的檢索請(qǐng)求;
[0042]步驟S202:判斷所述檢索請(qǐng)求是否是范文檢索請(qǐng)求;
[0043]步驟S203:在范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)進(jìn)行檢索;
[0044]步驟S204:提取檢索到的范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)的關(guān)鍵項(xiàng)信息;[0045]步驟S205:將關(guān)鍵項(xiàng)信息嵌入檢索結(jié)果頁(yè)中。
[0046]本實(shí)施例方法從步驟S201開始,搜索引擎的服務(wù)器獲取用戶的檢索請(qǐng)求,例如“入黨申請(qǐng)書2000字”,此請(qǐng)求表示用戶希望搜索到字?jǐn)?shù)在2000字左右的入黨申請(qǐng)書范文;“以家為主題的作文350字”,表示用戶希望搜索以家主題的作文范文,并且字?jǐn)?shù)應(yīng)該在350
字左右;等等。
[0047]服務(wù)器接收到檢索請(qǐng)求后,會(huì)對(duì)檢索請(qǐng)求的內(nèi)容進(jìn)行分析,獲取其中的檢索項(xiàng),即此時(shí)進(jìn)入步驟S202。對(duì)于檢索請(qǐng)求“入黨申請(qǐng)書2000字”,其檢索項(xiàng)為“入黨申請(qǐng)書”和“2000字”;對(duì)于檢索請(qǐng)求“以家為主題的作文350字”,其檢索項(xiàng)為“家”、“作文”和“350字”。根據(jù)檢索項(xiàng)“入黨申請(qǐng)書”或“作文”,步驟S202判斷其為范文檢索請(qǐng)求。關(guān)于對(duì)檢索請(qǐng)求進(jìn)行分析獲取檢索項(xiàng),有多種成熟的技術(shù)能夠?qū)崿F(xiàn),在此不再贅述。
[0048]當(dāng)步驟S202判斷用戶的檢索請(qǐng)求是范文檢索請(qǐng)求時(shí),進(jìn)入步驟S203,根據(jù)檢索請(qǐng)求攜帶的關(guān)鍵詞,在范文數(shù)據(jù)庫(kù)中進(jìn)行檢索。
[0049]對(duì)于檢索請(qǐng)求攜帶的關(guān)鍵詞,對(duì)應(yīng)于步驟S202中確定的檢索項(xiàng),包括主題關(guān)鍵詞和字?jǐn)?shù)關(guān)鍵詞。例如,檢索請(qǐng)求“入黨申請(qǐng)書2000字”,其主題關(guān)鍵詞為“入黨申請(qǐng)書”,字?jǐn)?shù)關(guān)鍵詞為“2000” ;檢索請(qǐng)求“以家為主題的作文350字”,主題關(guān)鍵詞為“家”和“作文”,字?jǐn)?shù)關(guān)鍵詞為“350”。
[0050]對(duì)于范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù),其包括多個(gè)范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng),每一范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)對(duì)應(yīng)一范文網(wǎng)頁(yè),具體包括該范文網(wǎng)頁(yè)的范文類型、范文網(wǎng)頁(yè)的范文數(shù)據(jù)和范文網(wǎng)頁(yè)對(duì)應(yīng)的URL。典型地,范文網(wǎng)頁(yè)的范文數(shù)據(jù)包括范文標(biāo)題、范文正文和范文字?jǐn)?shù)。圖3示意性地示出了本發(fā)明所述范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)的數(shù)據(jù)結(jié)構(gòu)示意圖。
[0051]范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)應(yīng)在范文檢索前在搜索引擎的服務(wù)器端建立。首先,通過(guò)網(wǎng)絡(luò)爬蟲對(duì)互聯(lián)網(wǎng)上范文資源網(wǎng)站的范文網(wǎng)頁(yè)進(jìn)行抓取;網(wǎng)絡(luò)爬蟲是一個(gè)技術(shù)成熟的、能自動(dòng)提取互聯(lián)網(wǎng)上網(wǎng)頁(yè)的程序,它根據(jù)既定的規(guī)則為搜索引擎從互聯(lián)網(wǎng)上下載網(wǎng)頁(yè),是搜索引擎的重要組成。所有被網(wǎng)絡(luò)爬蟲抓取的網(wǎng)頁(yè)將會(huì)被存貯在服務(wù)器側(cè);同時(shí)可進(jìn)行一定的分析、過(guò)濾,建立索引,生成供用戶檢索使用的基礎(chǔ)檢索庫(kù)(或索引數(shù)據(jù)庫(kù));網(wǎng)絡(luò)爬蟲可以在全網(wǎng)絡(luò)范圍內(nèi)進(jìn)行范文網(wǎng)頁(yè)的抓取,也可以在指定的多個(gè)范文資源網(wǎng)站的范圍內(nèi)進(jìn)行網(wǎng)頁(yè)抓取,所述指定的范文資源網(wǎng)站可以由搜索服務(wù)提供商和/或用戶不斷進(jìn)行添加和更新。然后,針對(duì)存儲(chǔ)在服務(wù)器側(cè)的、已被抓取到的范文網(wǎng)頁(yè),根據(jù)與所要提取的范文類型相對(duì)應(yīng)的關(guān)鍵詞,提取該類型范文網(wǎng)頁(yè)的范文數(shù)據(jù)。具體地,首先需要將關(guān)鍵詞與范文網(wǎng)頁(yè)的內(nèi)容進(jìn)行匹配;如匹配,則從范文網(wǎng)頁(yè)的內(nèi)容中提取范文數(shù)據(jù)。發(fā)明人發(fā)現(xiàn),互聯(lián)網(wǎng)上的范文資源網(wǎng)站主要包括三大類:問(wèn)答社區(qū)網(wǎng)站,文字網(wǎng)站和文庫(kù)資源網(wǎng)站。優(yōu)選地,針對(duì)不同類型的范文資源網(wǎng)站,使用相應(yīng)的范文數(shù)據(jù)提取規(guī)則,能夠更準(zhǔn)確地提供范文數(shù)據(jù)。特別地,對(duì)于某些范文網(wǎng)頁(yè),例如問(wèn)答社區(qū)網(wǎng)站的一個(gè)范文網(wǎng)頁(yè),其有可能包括了多篇范文,相應(yīng)地該范文網(wǎng)頁(yè)對(duì)應(yīng)的范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)將包括多條范文數(shù)據(jù),如圖4所示,其中每條范文數(shù)據(jù)與范文網(wǎng)頁(yè)中的一篇范文內(nèi)容對(duì)應(yīng)。最后,基于已提取的范文網(wǎng)頁(yè)的范文數(shù)據(jù),建立范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)。
[0052]在步驟S203的檢索過(guò)程中,可先將主題關(guān)鍵詞與范文類型進(jìn)行匹配,然后根據(jù)二者匹配情況,進(jìn)一步將主題關(guān)鍵詞在相應(yīng)的范文標(biāo)題和/或范文正文中進(jìn)行匹配。示例性地,對(duì)于檢索請(qǐng)求“入黨申請(qǐng)書2000字”,步驟S203先在范文類型中對(duì)主題關(guān)鍵詞“入黨申請(qǐng)書”進(jìn)行匹配,若匹配成功,即判斷主題關(guān)鍵詞檢索命中;對(duì)于檢索請(qǐng)求“以家為主題的作文350字”,先在范文類型中對(duì)主題關(guān)鍵詞“作文”進(jìn)行匹配;若匹配成功,進(jìn)一步將主題關(guān)鍵詞“家”在相應(yīng)的范文標(biāo)題和/或范文正文中進(jìn)行匹配;若繼續(xù)匹配成功,則判斷主題關(guān)鍵詞檢索命中。
[0053]在主題關(guān)鍵詞檢索命中之后,在命中的范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)中,進(jìn)一步將字?jǐn)?shù)關(guān)鍵詞與范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)的范文字?jǐn)?shù)進(jìn)行匹配,并建立二者的匹配度。示例性地,對(duì)于檢索請(qǐng)求“以家為主題的作文350字”,若一范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)的范文字?jǐn)?shù)為350字,則匹配度為100% ;另一數(shù)據(jù)項(xiàng)的范文字?jǐn)?shù)為385字,則匹配度為91%。優(yōu)選地,若字?jǐn)?shù)匹配度低于某一閾值,例如匹配度低于30%,可在檢索結(jié)果中舍棄此范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)對(duì)應(yīng)的范文網(wǎng)頁(yè)。
[0054]特別地,對(duì)于一條范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)包括多條范文數(shù)據(jù)的情況,在主題關(guān)鍵詞與范文類型匹配成功后,應(yīng)對(duì)每條范文數(shù)據(jù)進(jìn)行主題關(guān)鍵詞和/或字?jǐn)?shù)關(guān)鍵詞匹配。
[0055]在檢索步驟S203之后,進(jìn)入步驟S204,提取檢索到的與所述關(guān)鍵詞匹配的范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)的關(guān)鍵項(xiàng)信息;和步驟S205,將所述關(guān)鍵項(xiàng)信息以應(yīng)用框結(jié)構(gòu)嵌入檢索結(jié)果頁(yè)中,從而提供給用戶。根據(jù)本實(shí)施例,被提取的關(guān)鍵項(xiàng)信息包括范文標(biāo)題和范文字?jǐn)?shù),范文標(biāo)題可以讓用戶初步了解范文的具體主題,范文字?jǐn)?shù)則能夠讓用戶直觀了解該范文字?jǐn)?shù)是否滿足自己的需求。優(yōu)選地,被提取的關(guān)鍵項(xiàng)信息還可包括部分范文正文,以使得用戶能夠在不點(diǎn)擊打開范文網(wǎng)頁(yè)的情況下就知曉范文的部分內(nèi)容。
[0056]對(duì)于檢索請(qǐng)求“以家為主題的作文350字”,圖5示出了根據(jù)本實(shí)施例在范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中進(jìn)行范文搜索的搜索結(jié)果頁(yè)示意圖。在搜索結(jié)果頁(yè)中,根據(jù)范文字?jǐn)?shù)與字?jǐn)?shù)關(guān)鍵詞的匹配度由高到低對(duì)在范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中檢索到的范文網(wǎng)頁(yè)進(jìn)行排序;如圖5所示,字?jǐn)?shù)完全匹配的作為“我的家鄉(xiāng)”排在第一位,排在第二位的范文網(wǎng)頁(yè)包括了兩篇范文,367字的“我的爸爸媽媽”和385字的“我的家鄉(xiāng)”。與圖1所示的現(xiàn)有技術(shù)中的范文搜索,搜索結(jié)果更加在準(zhǔn)確,呈現(xiàn)內(nèi)容更加豐富,極大程度上提高了用戶體驗(yàn)。
[0057]另一方面,優(yōu)選地,在步驟S202之后,本實(shí)施例所述方法還進(jìn)入步驟S206,根據(jù)請(qǐng)求內(nèi)容的關(guān)鍵詞,在基礎(chǔ)網(wǎng)頁(yè)庫(kù)進(jìn)行檢索。如上所述,基礎(chǔ)網(wǎng)頁(yè)庫(kù),即搜索引擎的索引數(shù)據(jù)庫(kù),包括由網(wǎng)絡(luò)爬蟲下載存儲(chǔ)到服務(wù)器側(cè)的網(wǎng)頁(yè);在基礎(chǔ)網(wǎng)頁(yè)庫(kù)的檢索是互聯(lián)網(wǎng)搜索領(lǐng)域的一項(xiàng)成熟技術(shù),在此不再贅述。
[0058]最后,進(jìn)入步驟S207,在檢索結(jié)果頁(yè)中合并在范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)檢索到的范文網(wǎng)頁(yè)和在基礎(chǔ)網(wǎng)頁(yè)庫(kù)檢索到的范文網(wǎng)頁(yè)。具體地,在檢索結(jié)果頁(yè)中,在范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)檢索到的范文網(wǎng)頁(yè)排在基礎(chǔ)網(wǎng)頁(yè)庫(kù)檢索到的范文網(wǎng)頁(yè)的前面;一方面,優(yōu)先向用戶提供在范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中檢索到的、更準(zhǔn)確的檢索結(jié)果,另一方面將普通搜索的搜索結(jié)果同時(shí)呈現(xiàn)給用戶,使得檢索結(jié)果更全面。
[0059]實(shí)施例二
[0060]在本實(shí)施例中,對(duì)于互聯(lián)網(wǎng)中為用戶提供各種文章、論文的下載服務(wù)的文庫(kù)資源網(wǎng)站(例如萬(wàn)方數(shù)據(jù)網(wǎng)等等),其網(wǎng)頁(yè)中包括范文文檔的URL資源鏈接和描述該范文文檔的文字內(nèi)容;范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中這類文庫(kù)資源網(wǎng)頁(yè)的范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng),其范文數(shù)據(jù)包括:范文標(biāo)題,其對(duì)應(yīng)于描述該范文文檔的文字內(nèi)容;和范文正文,其對(duì)應(yīng)于已下載的范文文檔或范文文檔的下載鏈接;
[0061]相對(duì)于實(shí)施例一所述方法,本實(shí)施例所述方法具有如下區(qū)別:在關(guān)鍵詞檢索步驟中,僅在范文類型和/或范文標(biāo)題中匹配主題關(guān)鍵詞;而且,在提取步驟中,所提取的關(guān)鍵項(xiàng)信息包括范文標(biāo)題。
[0062]實(shí)施例三
[0063]在本實(shí)施例中,提供了一種范文搜索請(qǐng)求的處理裝置,其設(shè)置在搜索引擎的服務(wù)器側(cè)。圖6示出了所述處理裝置的結(jié)構(gòu)示意圖,所述處理裝置至少包括單元601-單元605。
[0064]當(dāng)用戶向搜索引擎發(fā)出檢索請(qǐng)求時(shí),請(qǐng)求獲取單元601獲取用戶的檢索請(qǐng)求;然后請(qǐng)求判斷單元602根據(jù)請(qǐng)求內(nèi)容的關(guān)鍵詞,判斷所述檢索請(qǐng)求是否是范文檢索請(qǐng)求。例如,對(duì)于檢索請(qǐng)求“以家為主題的作文350字”,其包含了檢索項(xiàng)“家”、“作文”和“ 350字”,請(qǐng)求判斷單元602根據(jù)其中檢索項(xiàng)“作文”判斷其為范文檢索請(qǐng)求。
[0065]接下來(lái),檢索單元603根據(jù)請(qǐng)求內(nèi)容中與上述檢索項(xiàng)相對(duì)應(yīng)的主題關(guān)鍵詞“家”和“作文”以及字?jǐn)?shù)關(guān)鍵詞“350”,在范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)進(jìn)行檢索,其中范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)參見實(shí)施例一和二中的描述。在檢索過(guò)程中,可先將主題關(guān)鍵詞與范文類型進(jìn)行匹配,然后根據(jù)二者匹配情況,再進(jìn)一步將主題關(guān)鍵詞在相應(yīng)的范文標(biāo)題和/或范文正文中進(jìn)行匹配。在主題關(guān)鍵詞檢索命中之后,在命中的范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)中,進(jìn)一步將字?jǐn)?shù)關(guān)鍵詞與范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)中的范文字?jǐn)?shù)進(jìn)行匹配,并建立二者的匹配度。特別地,對(duì)于一條范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)包括多條范文數(shù)據(jù)的情況,在主題關(guān)鍵詞與范文類型匹配成功后,應(yīng)對(duì)每條范文數(shù)據(jù)進(jìn)行主題關(guān)鍵詞和/或字?jǐn)?shù)關(guān)鍵詞匹配。
[0066]檢索到范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)后,關(guān)鍵項(xiàng)提取單元604提取所述范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)的關(guān)鍵項(xiàng)信息,然后由信息嵌入單元605將所述關(guān)鍵項(xiàng)信息以應(yīng)用框結(jié)構(gòu)嵌入檢索結(jié)果頁(yè)中。根據(jù)本實(shí)施例,被提取的關(guān)鍵項(xiàng)信息包括范文標(biāo)題和范文字?jǐn)?shù),范文標(biāo)題可以讓用戶初步了解范文的具體主題,范文字?jǐn)?shù)則能夠讓用戶直觀了解該范文字?jǐn)?shù)是否滿足自己的需求。優(yōu)選地,被提取的關(guān)鍵項(xiàng)信息還可包括部分范文正文,以使得用戶能夠在不點(diǎn)擊打開范文網(wǎng)頁(yè)的情況下就知曉范文的部分內(nèi)容。
[0067]進(jìn)一步地,本實(shí)施例所述裝置的檢索單元603還同時(shí)根據(jù)請(qǐng)求內(nèi)容的關(guān)鍵詞在基礎(chǔ)網(wǎng)頁(yè)庫(kù)進(jìn)行檢索;其中所述基礎(chǔ)網(wǎng)頁(yè)庫(kù)包括由網(wǎng)絡(luò)爬蟲下載存儲(chǔ)到服務(wù)器側(cè)的網(wǎng)頁(yè)。并且,本實(shí)施例所述裝置還包括合并排序單元,其適于在檢索結(jié)果頁(yè)中合并在范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)檢索到的范文網(wǎng)頁(yè)和在基礎(chǔ)網(wǎng)頁(yè)庫(kù)檢索到的范文網(wǎng)頁(yè),且前者在檢索結(jié)果頁(yè)的排序高于后者。一方面,優(yōu)先向用戶提供在范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中檢索到的、更準(zhǔn)確的檢索結(jié)果,另一方面將普通搜索的搜索結(jié)果同時(shí)呈現(xiàn)給用戶,使得檢索結(jié)果更全面。
[0068]在此提供的算法和顯示不與任何特定計(jì)算機(jī)、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對(duì)任何特定編程語(yǔ)言。應(yīng)當(dāng)明白,可以利用各種編程語(yǔ)言實(shí)現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對(duì)特定語(yǔ)言所做的描述是為了披露本發(fā)明的最佳實(shí)施方式。
[0069]在此處所提供的說(shuō)明書中,說(shuō)明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對(duì)本說(shuō)明書的理解。
[0070]類似地,應(yīng)當(dāng)理解,為了精簡(jiǎn)本公開并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在上面對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說(shuō),如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個(gè)實(shí)施例的所有特征。因此,遵循【具體實(shí)施方式】的權(quán)利要求書由此明確地并入該【具體實(shí)施方式】,其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。
[0071 ] 本領(lǐng)域那些技術(shù)人員可以理解,可以對(duì)實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們?cè)O(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)設(shè)備中??梢园褜?shí)施例中的模塊或單元或組件組合成一個(gè)模塊或單元或組件,以及此外可以把它們分成多個(gè)子模塊或子單元或子組件。除了這樣的特征和/或過(guò)程或者單元中的至少一些是相互排斥之外,可以采用任何組合對(duì)本說(shuō)明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過(guò)程或單元進(jìn)行組合。除非另外明確陳述,本說(shuō)明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來(lái)代替。
[0072]此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在下面的權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來(lái)使用。
[0073]本發(fā)明的各個(gè)部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號(hào)處理器(DSP )來(lái)實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的處理裝置中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè)信號(hào)的形式。這樣的信號(hào)可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號(hào)上提供,或者以任何其他形式提供。
[0074]應(yīng)該注意的是上述實(shí)施例對(duì)本發(fā)明進(jìn)行說(shuō)明而不是對(duì)本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號(hào)之間的任何參考符號(hào)構(gòu)造成對(duì)權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個(gè)”不排除存在多個(gè)這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來(lái)實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個(gè)可以是通過(guò)同一個(gè)硬件項(xiàng)來(lái)具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
【權(quán)利要求】
1.一種范文檢索請(qǐng)求的處理方法,包括: 獲取用戶的檢索請(qǐng)求; 根據(jù)請(qǐng)求內(nèi)容的關(guān)鍵詞,判斷所述檢索請(qǐng)求是否是范文檢索請(qǐng)求; 如果是,根據(jù)請(qǐng)求內(nèi)容的關(guān)鍵詞,在范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)進(jìn)行檢索; 提取檢索到的與所述關(guān)鍵詞匹配的范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)的關(guān)鍵項(xiàng)信息; 將所述關(guān)鍵項(xiàng)信息以應(yīng)用框結(jié)構(gòu)嵌入檢索結(jié)果頁(yè)中。
2.根據(jù)權(quán)利要求1所述的方法,其中所述范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)包括多個(gè)范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng),一范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)包括一范文網(wǎng)頁(yè)的范文類型、范文數(shù)據(jù)和URL,且所述范文數(shù)據(jù)包括范文標(biāo)題,范文正文和范文字?jǐn)?shù);所述請(qǐng)求內(nèi)容包括主題關(guān)鍵詞和字?jǐn)?shù)關(guān)鍵詞;其中, 檢索步驟包括,在范文類型和/或范文標(biāo)題和/或范文正文中匹配主題關(guān)鍵詞,并將字?jǐn)?shù)關(guān)鍵詞與范文字?jǐn)?shù)進(jìn)行匹配;且 所述提取的關(guān)鍵項(xiàng)信息至少包括范文標(biāo)題和范文字?jǐn)?shù)。
3.根據(jù)權(quán)利要求1或2所述的方法,其中一范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)包括多個(gè)范文數(shù)據(jù);其中, 檢索步驟包括,在該范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)的多個(gè)范文數(shù)據(jù)中分別進(jìn)行關(guān)鍵詞匹配;且 提取步驟包括,對(duì)于檢索到的與所述關(guān)鍵詞匹配的多個(gè)范文數(shù)據(jù),提取匹配的多個(gè)范文數(shù)據(jù)中的范文標(biāo)題和范文字?jǐn)?shù)。
4.根據(jù)權(quán)利要求1-3任一項(xiàng)所述的方法,其中所述范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)包括多個(gè)范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng),一范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)包括一范文網(wǎng)頁(yè)的范文類型、范文數(shù)據(jù)和URL;且所述范文數(shù)據(jù)包括范文標(biāo)題,和范文文檔 或范文文檔的下載鏈接;所述請(qǐng)求內(nèi)容包括主題關(guān)鍵詞和字?jǐn)?shù)關(guān)鍵詞;其中, 檢索步驟包括,在范文類型和/或范文標(biāo)題中匹配主題關(guān)鍵詞;且 所述提取的關(guān)鍵項(xiàng)信息至少包括范文標(biāo)題。
5.根據(jù)權(quán)利要求1-4之任一所述的方法,其中 檢索步驟還包括,根據(jù)請(qǐng)求內(nèi)容的關(guān)鍵詞,在基礎(chǔ)網(wǎng)頁(yè)庫(kù)進(jìn)行檢索;其中所述基礎(chǔ)網(wǎng)頁(yè)庫(kù)包括由網(wǎng)絡(luò)爬蟲下載存儲(chǔ)到服務(wù)器側(cè)的網(wǎng)頁(yè);并且 所述方法還包括,在檢索結(jié)果頁(yè)中合并在范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)檢索到的范文網(wǎng)頁(yè)和在基礎(chǔ)網(wǎng)頁(yè)庫(kù)檢索到的范文網(wǎng)頁(yè),且前者在檢索結(jié)果頁(yè)的排序高于后者。
6.根據(jù)權(quán)利要求1-5任一項(xiàng)所述的方法,其中對(duì)于檢索結(jié)果頁(yè)中在范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)檢索到的范文網(wǎng)頁(yè),根據(jù)其范文字?jǐn)?shù)與字?jǐn)?shù)關(guān)鍵詞的匹配度由高到低進(jìn)行排序。
7.一種范文檢索請(qǐng)求的處理裝置,包括: 請(qǐng)求獲取單元,適于獲取用戶的檢索請(qǐng)求; 請(qǐng)求判斷單元,適于根據(jù)請(qǐng)求內(nèi)容的關(guān)鍵詞,判斷所述檢索請(qǐng)求是否是范文檢索請(qǐng)求; 檢索單元,適于根據(jù)請(qǐng)求內(nèi)容的關(guān)鍵詞,在范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)進(jìn)行檢索; 關(guān)鍵項(xiàng)提取單元,適于提取檢索到的與所述關(guān)鍵詞匹配的范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)的關(guān)鍵項(xiàng)信息; 信息嵌入單元,適于將所述關(guān)鍵項(xiàng)信息以應(yīng)用框結(jié)構(gòu)嵌入檢索結(jié)果頁(yè)中。
8.根據(jù)權(quán)利要求7所述的裝置,其中所述范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)包括多個(gè)范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng),一范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)包括一范文網(wǎng)頁(yè)的范文類型、范文數(shù)據(jù)和URL,且所述范文數(shù)據(jù)包括范文標(biāo)題,范文正文和范文字?jǐn)?shù);所述請(qǐng)求內(nèi)容包括主題關(guān)鍵詞和字?jǐn)?shù)關(guān)鍵詞;其中, 檢索單元適于,在范文類型和/或范文標(biāo)題和/或范文正文中匹配主題關(guān)鍵詞,并將字?jǐn)?shù)關(guān)鍵詞與范文字?jǐn)?shù)進(jìn)行匹配;且 所述提取的關(guān)鍵項(xiàng)信息至少包括范文標(biāo)題和范文字?jǐn)?shù)。
9.根據(jù)權(quán)利要求7或8所述的裝置,其中一范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)包括多個(gè)范文數(shù)據(jù);其中 檢索單元適于,在該范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)的多個(gè)范文數(shù)據(jù)中分別進(jìn)行關(guān)鍵詞匹配;且 關(guān)鍵項(xiàng)提取單元適于,對(duì)于檢索到的與所述關(guān)鍵詞匹配的多個(gè)范文數(shù)據(jù),提取匹配的多個(gè)范文數(shù)據(jù)中的范文標(biāo)題和范文字?jǐn)?shù)。
10.根據(jù)權(quán)利要求7-9任一項(xiàng)所述的裝置,其中所述范文網(wǎng)頁(yè)數(shù)據(jù)庫(kù)包括多個(gè)范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng),一范文網(wǎng)頁(yè)數(shù)據(jù)項(xiàng)包括一范文網(wǎng)頁(yè)的范文類型、范文數(shù)據(jù)和URL;且所述范文數(shù)據(jù)包括范文標(biāo)題,和范文文檔或范文文檔的下載鏈接;所述請(qǐng)求內(nèi)容包括主題關(guān)鍵詞和字?jǐn)?shù)關(guān)鍵詞;其中, 檢索單元適于,在范文類型和/或范文標(biāo)題中匹配主題關(guān)鍵詞;且 所述提取的關(guān)鍵項(xiàng)信息至少`包括范文標(biāo)題。
【文檔編號(hào)】G06F17/30GK103678601SQ201310685293
【公開日】2014年3月26日 申請(qǐng)日期:2013年12月13日 優(yōu)先權(quán)日:2013年12月13日
【發(fā)明者】侯小虎 申請(qǐng)人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司