專利名稱:一種網(wǎng)頁(yè)信息存儲(chǔ)方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及互聯(lián)網(wǎng)領(lǐng)域,特別是涉及一種網(wǎng)頁(yè)信息存儲(chǔ)方法和裝置。
背景技術(shù):
當(dāng)前的網(wǎng)頁(yè)信息存儲(chǔ)主要有兩種方式。一種為僅保存網(wǎng)頁(yè)的URL地址,在這種情況下,會(huì)將網(wǎng)頁(yè)中所包含的廣告以及其它用戶不想保留的內(nèi)容一并存儲(chǔ),在這種情況下,雖然滿足了用戶對(duì)于網(wǎng)頁(yè)信息保存的需求,但是用戶無(wú)法對(duì)一個(gè)網(wǎng)頁(yè)有選擇性地保存部分模塊并在需要的時(shí)候復(fù)原。另一種方式為同時(shí)存儲(chǔ)URL地址和網(wǎng)頁(yè)內(nèi)容,這種情況下雖然可以克服第一種方式帶來(lái)的缺點(diǎn),即這種方式雖然可以將網(wǎng)頁(yè)內(nèi)容摘取保存,但還可能因復(fù)制保存第三方網(wǎng)站內(nèi)容而帶來(lái)知識(shí)產(chǎn)權(quán)風(fēng)險(xiǎn)。為此,需要一種新的網(wǎng)頁(yè)信息存儲(chǔ)方法,既解決網(wǎng)頁(yè)內(nèi)容部分保存問(wèn)題,同時(shí)又可·規(guī)避不必要的風(fēng)險(xiǎn)。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實(shí)施例提供一種網(wǎng)頁(yè)信息存儲(chǔ)方法和裝置,解決網(wǎng)頁(yè)內(nèi)容部分保存問(wèn)題的同時(shí)又可規(guī)避不必要的知識(shí)產(chǎn)權(quán)風(fēng)險(xiǎn)。為了達(dá)到上述目的,本發(fā)明實(shí)施例提供的一種網(wǎng)頁(yè)信息存儲(chǔ)方法,包括當(dāng)需要保存第三方網(wǎng)頁(yè)中一個(gè)或多個(gè)內(nèi)容模塊的內(nèi)容時(shí),記錄并保存所述一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址;當(dāng)用戶請(qǐng)求所保存的網(wǎng)頁(yè)內(nèi)容時(shí),取出所保存一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址;根據(jù)所述一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址,定位到所述一個(gè)或多個(gè)內(nèi)容模塊對(duì)應(yīng)的DOM結(jié)點(diǎn),取出DOM結(jié)點(diǎn)對(duì)應(yīng)的網(wǎng)頁(yè)內(nèi)容。為了達(dá)到上述目的,本發(fā)明實(shí)施例提供的一種網(wǎng)頁(yè)信息存儲(chǔ)裝置,包括記錄模塊,用于當(dāng)需要保存第三方網(wǎng)頁(yè)中某一個(gè)或多個(gè)內(nèi)容模塊的內(nèi)容時(shí),記錄所述一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址;保存模塊,用于保存記錄模塊記錄下的所述一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址;提取模塊,用于當(dāng)用戶請(qǐng)求所保存的網(wǎng)頁(yè)內(nèi)容時(shí),取出保存模塊所保存一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址;內(nèi)容還原模塊,用于根據(jù)提取模塊提取出的URL地址和內(nèi)容模塊的Xpath地址信息,定位到該一個(gè)或多個(gè)內(nèi)容模塊對(duì)應(yīng)的DOM結(jié)點(diǎn),取出該DOM結(jié)點(diǎn)對(duì)應(yīng)的網(wǎng)頁(yè)內(nèi)容。利用本發(fā)明實(shí)施例提供的網(wǎng)頁(yè)信息存儲(chǔ)方法及裝置,服務(wù)器僅保存網(wǎng)頁(yè)的URL以及每個(gè)模塊的Xpath路徑信息,不保存原網(wǎng)頁(yè)任何模塊的具體內(nèi)容。當(dāng)用戶請(qǐng)求所保存的網(wǎng)頁(yè)信息時(shí),根據(jù)所儲(chǔ)存的URL和Xpath路徑將網(wǎng)頁(yè)內(nèi)容還原在用戶側(cè)設(shè)備上,以此避免保存原網(wǎng)頁(yè)內(nèi)容所帶來(lái)的知識(shí)產(chǎn)權(quán)風(fēng)險(xiǎn)。
圖I是本發(fā)明實(shí)施例中提供的網(wǎng)頁(yè)信息存儲(chǔ)的方法流程圖。圖2是本發(fā)明實(shí)施例中提供的網(wǎng)頁(yè)信息存儲(chǔ)裝置的結(jié)構(gòu)示意圖。
具體實(shí)施例方式為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步的詳細(xì)描述。在闡述本發(fā)明實(shí)施例之前,先介紹幾個(gè)基本概念。HTML (Hyper Text Markup Language超文本標(biāo)記語(yǔ)言),是為“網(wǎng)頁(yè)創(chuàng)建和其它可在網(wǎng)頁(yè)瀏覽器中看到的信息”設(shè)計(jì)的一種標(biāo)記語(yǔ)言。HTML被用來(lái)描述結(jié)構(gòu)化信息—— 例如標(biāo)題、段落和列表等等,也可用來(lái)在一定程度上描述文檔的外觀和語(yǔ)義。URL (Uniform/Universal Resource Locator,統(tǒng)一資源定位符),也被稱為網(wǎng)頁(yè)地址;網(wǎng)頁(yè)的內(nèi)容就是由HTML代碼來(lái)構(gòu)成。DOM (Document Object Model,文檔對(duì)象模型),是一種處理可擴(kuò)展標(biāo)記語(yǔ)言(包括HTML)的標(biāo)準(zhǔn)編程接口,應(yīng)用程序和腳本可以通過(guò)這個(gè)接口訪問(wèn)和修改XML和HTML文檔數(shù)據(jù)。DOM將文檔看成是一棵擁有許多結(jié)點(diǎn)(D0MD結(jié)點(diǎn))的樹(shù)。XPath為路徑表達(dá)式,遵循DOM的路徑格式,可以描述從一個(gè)XMLD結(jié)點(diǎn)(D0MD結(jié)點(diǎn))到另一個(gè)D結(jié)點(diǎn)、或一組D結(jié)點(diǎn)的步驟順序。圖I是本發(fā)明實(shí)施例中提供的網(wǎng)頁(yè)信息存儲(chǔ)的方法流程圖。如圖I所示,該方法包括如下步驟步驟101 :當(dāng)需要保存第三方網(wǎng)頁(yè)中某一個(gè)或多個(gè)內(nèi)容模塊的內(nèi)容時(shí),記錄并保存該一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址。在本發(fā)明一實(shí)施例中,每一個(gè)HTML網(wǎng)頁(yè)都可以利用DOM樹(shù)來(lái)描述,即網(wǎng)頁(yè)中的某一個(gè)內(nèi)容模塊都是DOM樹(shù)中的一個(gè)結(jié)點(diǎn)。以一個(gè)新聞網(wǎng)頁(yè)為例,如果該網(wǎng)頁(yè)包含導(dǎo)航、兩側(cè)的廣告欄以及新聞?wù)模渲性撔侣務(wù)挠职?biāo)題、作者信息以及三段正文,那么該網(wǎng)頁(yè)的DOM樹(shù)可能的構(gòu)成結(jié)構(gòu)如下(假設(shè)該網(wǎng)頁(yè)的URL為a. com/b/c)a. com/b/c (根結(jié)點(diǎn))-導(dǎo)航(一級(jí)結(jié)點(diǎn))-廣告欄(一級(jí)結(jié)點(diǎn))-廣告I(二級(jí)結(jié)點(diǎn))-廣告2(二級(jí)結(jié)點(diǎn))-其他網(wǎng)址鏈接(一級(jí)結(jié)點(diǎn))-網(wǎng)址鏈接I(二級(jí)結(jié)點(diǎn))-網(wǎng)址鏈接2(二級(jí)結(jié)點(diǎn))-新聞(一級(jí)結(jié)點(diǎn))-新聞標(biāo)題(二級(jí)結(jié)點(diǎn))-作者信息(二級(jí)結(jié)點(diǎn))-新聞?wù)?二級(jí)結(jié)點(diǎn))
一正文第一段(三級(jí)結(jié)點(diǎn))一正文第二段(三級(jí)結(jié)點(diǎn))一正文第三段(三級(jí)結(jié)點(diǎn))............一旦已知每一個(gè)網(wǎng)頁(yè)的URL地址,即可知曉該網(wǎng)頁(yè)的DOM樹(shù)。每棵DOM樹(shù)中的每一個(gè)DOM結(jié)點(diǎn),無(wú)論是一級(jí)結(jié)點(diǎn)還是葉子結(jié)點(diǎn),又都具有唯一的XPath,一旦知曉Xpath路徑和URL地址,即可取出該Xpath路徑對(duì)應(yīng)的結(jié)點(diǎn)的內(nèi)容。在本發(fā)明一實(shí)施例中,可以是用戶選擇某一個(gè)HTML網(wǎng)頁(yè)的部分內(nèi)容(內(nèi)容模塊)進(jìn)行保存,此時(shí)記錄下用戶選擇的內(nèi)容模塊對(duì)應(yīng)的DOM結(jié)點(diǎn)的XPath,然后保存該網(wǎng)頁(yè)的URL 地址和該內(nèi)容模塊的XPath。在本發(fā)明一實(shí)施例中,用戶通過(guò)瀏覽器訪問(wèn)第三方網(wǎng)頁(yè),此時(shí)客戶端監(jiān)控用戶光標(biāo)在瀏覽器中的運(yùn)動(dòng)軌跡,以確定用戶是否選擇內(nèi)容模塊。在本發(fā)明一實(shí)施例中,可保存的區(qū)域(內(nèi)容模塊)只能是HTML代碼樹(shù)形結(jié)構(gòu)中包含的DOM結(jié)點(diǎn)及其組合,即可保存的最小單元就是一個(gè)DOM結(jié)點(diǎn)。步驟102 :當(dāng)用戶請(qǐng)求所保存的網(wǎng)頁(yè)內(nèi)容時(shí),取出所保存一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址,根據(jù)所保存一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址,定位到該一個(gè)或多個(gè)內(nèi)容模塊對(duì)應(yīng)的DOM結(jié)點(diǎn),取出DOM結(jié)點(diǎn)對(duì)應(yīng)的網(wǎng)頁(yè)內(nèi)容。具體來(lái)說(shuō),根據(jù)URL地址和Xpath地址信息實(shí)時(shí)連接到該URL所對(duì)應(yīng)的網(wǎng)站,并獲取該網(wǎng)站的DOM樹(shù)結(jié)構(gòu),根據(jù)所述Xpath地址,定位到所述一個(gè)或多個(gè)內(nèi)容模塊對(duì)應(yīng)的DOM結(jié)點(diǎn),讀取所述DOM結(jié)點(diǎn)對(duì)應(yīng)的網(wǎng)頁(yè)內(nèi)容。步驟103 :將所述網(wǎng)頁(yè)內(nèi)容推送展示在用戶的終端屏幕上。在本發(fā)明一實(shí)施例中,在步驟101中,一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址均保存在服務(wù)端,在步驟102中,用戶向服務(wù)器端請(qǐng)求所保存的網(wǎng)頁(yè)內(nèi)容時(shí),服務(wù)器取出所保存一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址,根據(jù)該URL地址和內(nèi)容模塊的Xpath地址信息,定位到該內(nèi)容模塊對(duì)應(yīng)的DOM結(jié)點(diǎn),取出該DOM結(jié)點(diǎn)對(duì)應(yīng)的網(wǎng)頁(yè)內(nèi)容,然后在步驟103中,服務(wù)器將取出的網(wǎng)頁(yè)內(nèi)容發(fā)送到用戶側(cè),由用戶側(cè)的客戶端進(jìn)行展示。在該實(shí)施例中,整個(gè)步驟102的執(zhí)行過(guò)程均在緩存中執(zhí)行,這樣的好處是服務(wù)器的持久性存儲(chǔ)硬盤上并不保留第三方網(wǎng)頁(yè)的任何明文內(nèi)容,因而不會(huì)涉及到侵權(quán)風(fēng)險(xiǎn);同時(shí)這種方式由于客戶端只需要被動(dòng)接收直接可供閱讀的內(nèi)容片段,不需要用戶側(cè)的客戶端進(jìn)行大量的運(yùn)算,因此對(duì)客戶端的要求也大大減低。在本發(fā)明另一實(shí)施例中,服務(wù)器在緩存內(nèi)執(zhí)行完步驟102后,并不立即清除緩存,而是保留一個(gè)預(yù)定的短時(shí)間,這樣,當(dāng)這段時(shí)間內(nèi)有其他用戶請(qǐng)求同樣的內(nèi)容時(shí),服務(wù)器端無(wú)需再重新執(zhí)行步驟102,而只需將緩存內(nèi)的網(wǎng)頁(yè)內(nèi)容發(fā)送給用戶側(cè)即可,處理起來(lái)更加簡(jiǎn)單快捷。當(dāng)然,在本發(fā)明另一實(shí)施例中,還可以是服務(wù)器取出所保存一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址,將所述一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址發(fā)送給用戶側(cè)的客戶端,客戶端根據(jù)該URL地址和內(nèi)容模塊的Xpath地址信息,定位到該內(nèi)容模塊對(duì)應(yīng)的DOM結(jié)點(diǎn),取出該DOM結(jié)點(diǎn)對(duì)應(yīng)的網(wǎng)頁(yè)內(nèi)容,然后直接進(jìn)行展示。正如前一實(shí)施例所述,這種情況,對(duì)客戶端的計(jì)算能力要求較高。在本發(fā)明另一實(shí)施例中,在步驟101中,可以將網(wǎng)頁(yè)中的多個(gè)內(nèi)容模塊組合成一個(gè)新的內(nèi)容(保存在同一個(gè)網(wǎng)頁(yè)中),此時(shí),記錄下內(nèi)容模塊對(duì)應(yīng)的Xpath路徑以及所述多個(gè)內(nèi)容模塊的組合方式。在步驟102中,根據(jù)所保存的網(wǎng)頁(yè)的URL地址和所述多個(gè)內(nèi)容模塊的Xpath路徑分別提取出多個(gè)內(nèi)容模塊對(duì)應(yīng)的DOM結(jié)點(diǎn)的內(nèi)容,然后根據(jù)所述多個(gè)內(nèi)容模塊的組合方式,將提取出的多個(gè)內(nèi)容模塊對(duì)應(yīng)的DOM結(jié)點(diǎn)的內(nèi)容組合成新的網(wǎng)頁(yè)內(nèi)容。在本發(fā)明一實(shí)施例中,多個(gè)內(nèi)容模塊的組合方式可以是按照用戶選擇內(nèi)容模塊的時(shí)間順序來(lái)組合。以以上提到的Dom樹(shù)結(jié)構(gòu)為例說(shuō)明該實(shí)施例的技術(shù)方案,假設(shè)希望保存的內(nèi)容模塊為新聞?wù)牡牡谝欢我约暗谌?;并且用戶點(diǎn)擊的順序是先點(diǎn)擊選中新聞?wù)牡牡谌巍⒑簏c(diǎn)擊選中第一段,那么系統(tǒng)會(huì)記錄下來(lái)第三段和第一段的Xpath,以及組合方式(按點(diǎn)擊選擇順序組合),當(dāng)用戶請(qǐng)求所保存的內(nèi)容模塊的內(nèi)容時(shí),根據(jù)第三段和第一段的Xpath信息,取出第三段和第一段的內(nèi)容,按照點(diǎn)擊選擇順序組合成新的內(nèi)容,在該新的內(nèi)容中,第三段在前面,第一段在后。組合后的多個(gè)內(nèi)容模塊的內(nèi)容對(duì)應(yīng)的DOM結(jié)構(gòu)如下(假設(shè)該組合后內(nèi)容的URL地址為WWW. vjianke. com/e/f) www. vjianke. com/e/f (根結(jié)點(diǎn))一正文第三段(一級(jí)結(jié)點(diǎn))一正文第一段(一級(jí)結(jié)點(diǎn))當(dāng)然,在本發(fā)明一實(shí)施例中,系統(tǒng)可以默認(rèn)一種固定的組合方式。在本發(fā)明一實(shí)施例中,也可以將來(lái)自不同的網(wǎng)頁(yè)的多個(gè)內(nèi)容模塊的內(nèi)容組合成一個(gè)新的內(nèi)容(保存在同一個(gè)網(wǎng)頁(yè)中),在這種情況,只需要記錄每個(gè)內(nèi)容模塊對(duì)應(yīng)的URL地址以及該內(nèi)容模塊的Xpath路徑。后續(xù)根據(jù)每個(gè)內(nèi)容模塊所對(duì)應(yīng)的網(wǎng)頁(yè)的URL地址、內(nèi)容模塊的Xpath路徑以及多個(gè)內(nèi)容模塊的組合方式,分別讀取多個(gè)內(nèi)容模塊對(duì)應(yīng)的內(nèi)容,然后根據(jù)這些內(nèi)容組合成新的內(nèi)容。本領(lǐng)域技術(shù)人員可以理解,上述多種實(shí)施例可以相互結(jié)合成新的實(shí)施例。在本發(fā)明實(shí)施例提供的網(wǎng)頁(yè)信息存儲(chǔ)方法中,服務(wù)器僅保存網(wǎng)頁(yè)的URL以及每個(gè)模塊的Xpath路徑信息,不保存原網(wǎng)頁(yè)任何模塊的具體內(nèi)容。當(dāng)用戶訪問(wèn)服務(wù)器時(shí),服務(wù)器根據(jù)所儲(chǔ)存的URL和Xpath路徑將網(wǎng)頁(yè)內(nèi)容還原在用戶的瀏覽器上,以此避免保存原網(wǎng)頁(yè)內(nèi)容所帶來(lái)的知識(shí)產(chǎn)權(quán)風(fēng)險(xiǎn)。圖2是本發(fā)明實(shí)施例中提供的網(wǎng)頁(yè)信息存儲(chǔ)的裝置流程圖。如圖2所示,該裝置包括如下模塊記錄模塊用于當(dāng)需要保存第三方網(wǎng)頁(yè)中某一個(gè)或多個(gè)內(nèi)容模塊的內(nèi)容時(shí),記錄所述一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址;保存模塊,用于保存記錄模塊記錄下的所述一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址;提取模塊,用于當(dāng)用戶請(qǐng)求所保存的網(wǎng)頁(yè)內(nèi)容時(shí),取出保存模塊所保存一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址內(nèi)容還原模塊,用于根據(jù)提取模塊提取出的URL地址和內(nèi)容模塊的Xpath地址信息,定位到該一個(gè)或多個(gè)內(nèi)容模塊對(duì)應(yīng)的DOM結(jié)點(diǎn),取出該DOM結(jié)點(diǎn)對(duì)應(yīng)的網(wǎng)頁(yè)內(nèi)容;將其發(fā)送給推送模塊;推送模塊,用于接收將內(nèi)容還原模塊還原出的網(wǎng)頁(yè)內(nèi)容,將其展示在用戶的終端屏幕上。在本發(fā)明一實(shí)施例中,記錄模塊、保存模塊、提取模塊、內(nèi)容還原模塊位于服務(wù)器端,推送模塊位于用戶側(cè)的客戶端。也可以是記錄模塊和推送模塊位于用戶側(cè)的客戶端,保存模塊、提取模塊、內(nèi)容還原模塊位于服務(wù)器端。在本發(fā)明一實(shí)施例中,內(nèi)容還原模塊并不將還原出來(lái)的網(wǎng)頁(yè)內(nèi)容存儲(chǔ)在服務(wù)器的持久性存儲(chǔ)硬盤上中,而是將其存放在緩存中。在本發(fā)明另一實(shí)施例中,記錄模塊、內(nèi)容還原模塊、推送模塊位于用戶側(cè)的客戶端;保存模塊、提取模塊位于服務(wù)器端。或者內(nèi)容還原模塊、推送模塊位于用戶側(cè)的客戶端;記錄模塊、保存模塊、提取模塊位于服務(wù)器端。無(wú)論上述哪種實(shí)施例,客戶端和服務(wù)器端均各自包括一個(gè)通信模塊,用于與對(duì)方進(jìn)行信息交互。在本發(fā)明一實(shí)施例中,客戶端形式上可以是用戶瀏覽器或?yàn)g覽器上的插件,也可以是獨(dú)立運(yùn)行于用戶側(cè)操作系統(tǒng)的軟件,如APP應(yīng)用。本領(lǐng)域技術(shù)人員可以理解,無(wú)論是上述記載的方法、系統(tǒng)、客戶端還是服務(wù)器,均可以利用計(jì)算機(jī)軟件來(lái)實(shí)現(xiàn),該計(jì)算機(jī)軟件運(yùn)行在有CPU、存儲(chǔ)磁盤等構(gòu)成的物理計(jì)算機(jī)或服務(wù)器上,即可實(shí)現(xiàn)上述描述的功能。本發(fā)明實(shí)施例所記載的計(jì)算機(jī)軟件也可以是固化CD\DVD等存儲(chǔ)媒介上的可執(zhí)行文件,一旦執(zhí)行,即可實(shí)現(xiàn)上述描述的功能。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種網(wǎng)頁(yè)信息存儲(chǔ)方法,其特征在于,包括 當(dāng)需要保存第三方網(wǎng)頁(yè)中一個(gè)或多個(gè)內(nèi)容模塊的內(nèi)容時(shí),記錄并保存所述一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址; 當(dāng)用戶請(qǐng)求所保存的網(wǎng)頁(yè)內(nèi)容時(shí),取出所保存一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址; 根據(jù)所述一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址,定位到所述一個(gè)或多個(gè)內(nèi)容模塊對(duì)應(yīng)的DOM結(jié)點(diǎn),取出DOM結(jié)點(diǎn)對(duì)應(yīng)的網(wǎng)頁(yè)內(nèi)容。
2.如權(quán)利要求I所述的方法,其特征在于,所述一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址保存在服務(wù)端; 用戶向服務(wù)器端請(qǐng)求所保存的網(wǎng)頁(yè)內(nèi)容時(shí),服務(wù)器取出所保存一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址,根據(jù)所保存一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址,定位到所述一個(gè)或多個(gè)內(nèi)容模塊對(duì)應(yīng)的DOM結(jié)點(diǎn),取出與所述DOM結(jié)點(diǎn)對(duì)應(yīng)的網(wǎng)頁(yè)內(nèi)容。
3.如權(quán)利要求2所述的方法,其特征在于,所述服務(wù)器將取出的DOM結(jié)點(diǎn)對(duì)應(yīng)的網(wǎng)頁(yè)內(nèi)容存放在緩存中。
4.如權(quán)利要求3所述的方法,其特征在于,所述服務(wù)器將緩存內(nèi)容保留預(yù)定的短時(shí)間;當(dāng)其他用戶請(qǐng)求同樣的內(nèi)容時(shí),服務(wù)器端將緩存內(nèi)的網(wǎng)頁(yè)內(nèi)容發(fā)送給用戶側(cè)。
5.如權(quán)利要求I所述的方法,其特征在于,服務(wù)器取出所保存一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址,將所述一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址發(fā)送給客戶端; 客戶端根據(jù)所述一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址,定位到所述一個(gè)或多個(gè)內(nèi)容模塊對(duì)應(yīng)的DOM結(jié)點(diǎn),取出所述DOM結(jié)點(diǎn)對(duì)應(yīng)的網(wǎng)頁(yè)內(nèi)容。
6.如權(quán)利要求I至5任一所述的方法,其特征在于,所述根據(jù)所述一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址,定位到所述一個(gè)或多個(gè)內(nèi)容模塊對(duì)應(yīng)的DOM結(jié)點(diǎn),取出DOM結(jié)點(diǎn)對(duì)應(yīng)的網(wǎng)頁(yè)內(nèi)容包括 根據(jù)URL地址和Xpath地址信息實(shí)時(shí)連接到所述URL所對(duì)應(yīng)的網(wǎng)站,獲取所述網(wǎng)站的DOM樹(shù)結(jié)構(gòu),根據(jù)所述Xpath地址,定位到所述一個(gè)或多個(gè)內(nèi)容模塊對(duì)應(yīng)的DOM結(jié)點(diǎn),讀取所述DOM結(jié)點(diǎn)對(duì)應(yīng)的網(wǎng)頁(yè)內(nèi)容。
7.如權(quán)利要求I至5任一所述的方法,其特征在于,進(jìn)一步包括將所述取出的DOM結(jié)點(diǎn)對(duì)應(yīng)的網(wǎng)頁(yè)內(nèi)容推送展示在用戶的終端屏幕上。
8.如權(quán)利要求I至5任一所述的方法,其特征在于,所保存的內(nèi)容模塊多于一個(gè),則所述方法進(jìn)一步包括 記錄并保存下所述多個(gè)內(nèi)容模塊的組合方式; 貝U,當(dāng)用戶請(qǐng)求所保存的網(wǎng)頁(yè)內(nèi)容時(shí),根據(jù)將所保存的網(wǎng)頁(yè)的URL地址和所述多個(gè)內(nèi)容模塊的Xpath路徑,分別提取出多個(gè)內(nèi)容模塊對(duì)應(yīng)的DOM結(jié)點(diǎn)的內(nèi)容; 根據(jù)所述多個(gè)內(nèi)容模塊的組合方式,將提取出的多個(gè)內(nèi)容模塊對(duì)應(yīng)的DOM結(jié)點(diǎn)的內(nèi)容組合成新的網(wǎng)頁(yè)內(nèi)容。
9.如權(quán)利要求8所述的方法,其特征在于,所述多個(gè)內(nèi)容模塊的組合方式為按照用戶選擇內(nèi)容模塊的時(shí)間順序來(lái)組合。
10.如權(quán)利要求8所述的方法,其特征在于,用戶選擇的多個(gè)內(nèi)容模塊來(lái)自不同的URL地址。
11.一種網(wǎng)頁(yè)信息存儲(chǔ)裝置,其特征在于,包括 記錄模塊,用于當(dāng)需要保存第三方網(wǎng)頁(yè)中某一個(gè)或多個(gè)內(nèi)容模塊的內(nèi)容時(shí),記錄所述一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址; 保存模塊,用于保存記錄模塊記錄下的所述一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址; 提取模塊,用于當(dāng)用戶請(qǐng)求所保存的網(wǎng)頁(yè)內(nèi)容時(shí),取出保存模塊所保存一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址; 內(nèi)容還原模塊,用于根據(jù)提取模塊提取出的URL地址和內(nèi)容模塊的Xpath地址信息,定位到該一個(gè)或多個(gè)內(nèi)容模塊對(duì)應(yīng)的DOM結(jié)點(diǎn),取出該DOM結(jié)點(diǎn)對(duì)應(yīng)的網(wǎng)頁(yè)內(nèi)容。
12.如權(quán)利要求11所述的裝置,其特征在于,記錄模塊、保存模塊、提取模塊、內(nèi)容還原模塊位于服務(wù)器端;或 所述記錄模塊位于客戶端;所述保存模塊、提取模塊、內(nèi)容還原模塊位于服務(wù)器端。
13.如在權(quán)利要求12所述的裝置,其特征在于,所述內(nèi)容還原模塊還原出來(lái)的網(wǎng)頁(yè)內(nèi)容存儲(chǔ)在緩存中。
14.如權(quán)利要求11所述的裝置,其特征在于,記錄模塊、內(nèi)容還原模塊、推送模塊位于客戶端;保存模塊、提取模塊位于服務(wù)器端,或 內(nèi)容還原模塊、推送模塊位于用戶側(cè)的客戶端;記錄模塊、保存模塊、提取模塊位于服務(wù)器端。
15.如權(quán)利要求11至14任一所述的裝置,其特征在于,進(jìn)一步包括 推送模塊,用于接收內(nèi)容還原模塊還原出的網(wǎng)頁(yè)內(nèi)容,將其展示在用戶的終端屏幕上。
16.如權(quán)利要求15所述的裝置,其特征在于,所述推送模塊位于客戶端。
17.如權(quán)利要求16所述的裝置,其特征在于,所述客戶端和服務(wù)器端均進(jìn)一步包括通信模塊,用于與對(duì)方進(jìn)行信息交互。
18.如權(quán)利要求16所述的裝置,其特征在于,所述客戶端為瀏覽器或?yàn)g覽器上的插件,或APP應(yīng)用。
全文摘要
本發(fā)明實(shí)施例提供了一種網(wǎng)頁(yè)信息存儲(chǔ)方法和裝置,解決網(wǎng)頁(yè)內(nèi)容部分保存問(wèn)題的同時(shí)又可規(guī)避不必要的知識(shí)產(chǎn)權(quán)風(fēng)險(xiǎn)。其中,該方法包括當(dāng)需要保存第三方網(wǎng)頁(yè)中一個(gè)或多個(gè)內(nèi)容模塊的內(nèi)容時(shí),記錄并保存所述一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址;當(dāng)用戶請(qǐng)求所保存的網(wǎng)頁(yè)內(nèi)容時(shí),取出所保存一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址;根據(jù)所述一個(gè)或多個(gè)內(nèi)容模塊的Xpath路徑以及對(duì)應(yīng)網(wǎng)頁(yè)的URL地址,定位到所述一個(gè)或多個(gè)內(nèi)容模塊對(duì)應(yīng)的DOM結(jié)點(diǎn),取出DOM結(jié)點(diǎn)對(duì)應(yīng)的網(wǎng)頁(yè)內(nèi)容。
文檔編號(hào)G06F17/30GK102880679SQ20121033466
公開(kāi)日2013年1月16日 申請(qǐng)日期2012年9月11日 優(yōu)先權(quán)日2012年9月11日
發(fā)明者徐建忠 申請(qǐng)人:北京易云剪客科技有限公司