專利名稱:網(wǎng)絡(luò)內(nèi)容在電紙書上的展示方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種展示方法,特別涉及一種利用電子墨水在電紙書上展示網(wǎng)絡(luò)內(nèi)容
的方法。
背景技術(shù):
科學(xué)技術(shù)的發(fā)展,使得E-Ink技術(shù)越來越多的應(yīng)用于顯示閱讀方面。E-Ink—般稱 之為電子墨水技術(shù)(電泳式電子紙),它是一種屏幕技術(shù),E-Ink的電子紙由電子墨水及兩 片基板所組成,它上面涂有一種由無數(shù)微小的透明顆粒組成的電子墨水,顆粒直徑只有人 的頭發(fā)絲的一半大小。只要調(diào)整顆粒內(nèi)的染料和微型粒子的顏色,便能夠使電子墨水展現(xiàn) 色彩和圖案來。當(dāng)這種電子墨水被涂到紙、布或其他平面物體上后,人們只要適當(dāng)?shù)貙?duì)它予 以電擊,就能使數(shù)以億計(jì)的顆粒變幻顏色,從而根據(jù)人們的設(shè)定不斷地改變所顯現(xiàn)的圖案 和文字。電子墨水具有包括刷新速度快、易讀性,柔性,廉價(jià)制造和低功耗的優(yōu)點(diǎn)。
隨著電子墨水技術(shù)的日益流行以及人們對(duì)互聯(lián)網(wǎng)信息的依賴,在移動(dòng)設(shè)備上方便 即時(shí)的查看互聯(lián)網(wǎng)信息已經(jīng)成為大眾的需求。但由于大多數(shù)網(wǎng)頁仍然是為PC計(jì)算機(jī)的標(biāo) 準(zhǔn)顯示器而設(shè)計(jì)的,他們?cè)谝苿?dòng)設(shè)備上的顯示存在著缺陷第一,由于移動(dòng)設(shè)備的屏幕受硬 件限制,較寬的網(wǎng)頁在較小的設(shè)備上無法很好的顯示,需要根據(jù)顯示屏對(duì)網(wǎng)頁進(jìn)行優(yōu)化和 過濾,比如黑白屏和彩色屏,大屏和小屏,電子紙屏和LCD屏;第二,由于移動(dòng)設(shè)備的目的性 更強(qiáng),而且網(wǎng)絡(luò)運(yùn)營商往往會(huì)按照流量收費(fèi),因此移動(dòng)用戶對(duì)于內(nèi)容的選擇性更加強(qiáng)烈,需 要根據(jù)內(nèi)容對(duì)網(wǎng)頁進(jìn)行優(yōu)化和過濾,比如是否顯示廣告,是否顯示不適合閱讀的內(nèi)容;第 三,由于移動(dòng)設(shè)備對(duì)于電池要求較高,需要通過優(yōu)化網(wǎng)頁達(dá)到節(jié)能的目的;第四,由于互聯(lián) 網(wǎng)信息的及時(shí)性特征,上述的優(yōu)化和過濾需要在一定時(shí)間內(nèi)完成,否則不能滿足快速閱讀 的需求;第五,雖然目前市場(chǎng)上部分網(wǎng)頁推出了移動(dòng)設(shè)備版本,比如WAP版、3G版、RSS版,但 是這些網(wǎng)站只是所有網(wǎng)站中的鳳毛麟角,而且他們不能靈活的根據(jù)不同的移動(dòng)設(shè)備進(jìn)行靈 活的優(yōu)化。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供一種網(wǎng)絡(luò)內(nèi)容在電紙書上的展示方 法,以滿足客戶對(duì)于網(wǎng)頁易讀性,費(fèi)用低和低功耗的需求。 為了達(dá)到上述目的,本發(fā)明采用的技術(shù)方案是一種網(wǎng)絡(luò)內(nèi)容在電紙書上的展示 方法,用于即時(shí)展示適應(yīng)移動(dòng)設(shè)備的網(wǎng)頁,依次由頁面分解、選擇過濾、頁面單元過濾、頁面 整合渲染四個(gè)步驟組成。原始頁面經(jīng)過頁面提取后分割為一系列頁面單元,根據(jù)從頁面單 元的信息,確定頁面的具體分類從而選擇過濾器。之后,通過選定的過濾器過濾設(shè)備不支持 的頁面單元,過濾移動(dòng)設(shè)備用戶不需要的頁面單元(比如導(dǎo)航條,用戶評(píng)論等)。最后,系統(tǒng) 將篩選過后的頁面單元整合后發(fā)往客戶端并重新渲染,在客戶端設(shè)備上顯示適合以電紙書 為代表的移動(dòng)設(shè)備閱讀的頁面。 與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是第一、適用性范圍廣,可以轉(zhuǎn)化互聯(lián)網(wǎng)上
3的所有網(wǎng)頁;第二、靈活。本方法通過簡單的配置,可以使用于不同的移動(dòng)設(shè)備;第三、提 高了移動(dòng)設(shè)備顯示屏的適用范圍,比如,使得電子油墨(E-Ink)等不適合瀏覽網(wǎng)頁的屏幕, 可以容易的瀏覽網(wǎng)頁;第四、增強(qiáng)了用戶體驗(yàn),減少了與用戶無關(guān)的內(nèi)容,節(jié)約了流量費(fèi)用; 第五、速度快,用戶基本不會(huì)體會(huì)出來延遲。
圖l為本發(fā)明的原理框圖;
圖2為本發(fā)明的系統(tǒng)結(jié)構(gòu)圖。
具體實(shí)施例方式
本發(fā)明的設(shè)計(jì)方案在于克服現(xiàn)有技術(shù)的不足,提供一種網(wǎng)絡(luò)內(nèi)容在電紙書上的展 示方法,以滿足客戶對(duì)網(wǎng)頁易讀性、費(fèi)用低和低功耗的需求。下面結(jié)合實(shí)施例參照附圖進(jìn)行 詳細(xì)說明,以便對(duì)本發(fā)明的技術(shù)特征及優(yōu)點(diǎn)進(jìn)行更深入的詮釋。 本發(fā)明的原理框圖如圖l所述,依次由頁面分解、選擇過濾、頁面單元過濾、頁面 整合渲染四個(gè)步驟組成。原始頁面經(jīng)過頁面提取后分割為一系列頁面單元,根據(jù)從頁面單 元的信息,確定頁面的具體分類從而選擇過濾器。之后,通過選定的過濾器過濾設(shè)備不支持 的頁面單元,過濾移動(dòng)設(shè)備用戶不需要的頁面單元(比如導(dǎo)航條,用戶評(píng)論等)。最后,系統(tǒng) 將篩選過后的頁面單元整合后發(fā)往客戶端并重新渲染,在客戶端設(shè)備上顯示適合以電紙書 為代表的移動(dòng)設(shè)備閱讀的頁面。 下面結(jié)合圖進(jìn)行進(jìn)一步說明,如圖2所示,該方法所所依托的系統(tǒng)依次由數(shù)據(jù)獲
取層、分解層、選擇過濾層、過濾層、數(shù)據(jù)重組層和數(shù)據(jù)整合渲染層組成,整個(gè)轉(zhuǎn)換過程可以
分為四個(gè)步驟 步驟一頁面分解 基本功能將頁面分解為一系列頁面單元。 輸入原始頁面的亂(Uniform/Universal Resource Locator的縮寫,統(tǒng)一資源 也被稱為網(wǎng)頁地址,是因特網(wǎng)上標(biāo)準(zhǔn)的資源的地址)。 輸出一個(gè)頁面單元的集合,其中絕大多數(shù)頁面單元可以通過renderengine的 API (Application Programming Interface,應(yīng)用程序編程接口 )直接訪問。
頁面分解步驟由數(shù)據(jù)獲取層和分解層共同組成。對(duì)于每一個(gè)需要處理的網(wǎng)頁。系 統(tǒng)將原始頁面轉(zhuǎn)化為若干頁面單元的集合,并收集每個(gè)頁面單元的內(nèi)容和位置信息。每一 個(gè)頁面單元都是一個(gè)基本信息單位,并在渲染后的頁面上占據(jù)一定的位置。 一個(gè)鏈接、一個(gè) 文字域、一個(gè)表格或者一個(gè)圖面都是頁面單元。每一個(gè)頁面單元都包含其在頁面顯示位置 的信息。 一個(gè)頁面單元還能夠同時(shí)包含其他頁面單元。同時(shí)并行使用三個(gè)開源html渲染 引擎,渲染引擎將下載下來的html頁面直接轉(zhuǎn)化為頁面單元的集合,而最終使用的頁面單 元集合就是三個(gè)渲染結(jié)果的交集。從而確保頁面不出現(xiàn)非標(biāo)準(zhǔn)展示的信息。
步驟二選擇過濾 基本功能根據(jù)從頁面單元等信息,確定需要使用的過濾器。
輸入信息原始頁面數(shù)據(jù)、頁面單元集合數(shù)據(jù)。
輸出信息需要使用的過濾器。
因?yàn)椴⒉皇撬械捻撁鎲卧歼m合在移動(dòng)設(shè)備上展示的,所以需要對(duì)頁面單元集 合中的元素進(jìn)行過濾,篩除不適合在便攜式設(shè)備上展示的內(nèi)容。比如Flash或者GIF動(dòng)畫, 就非常不適合在使用E-ink屏幕技術(shù)的電紙書閱讀器上觀看。此時(shí),我們選擇使用一系列 的過濾器去篩選頁面單元中不適合在電紙閱讀器上觀看的部分。 系統(tǒng)主要包括三種類型的過濾器。第一類過濾器是和頁面的分類結(jié)果相關(guān)的,只 有當(dāng)一個(gè)頁面被分為特殊的分類的時(shí)候,這種過濾器才會(huì)被觸發(fā),我們稱這類過濾器為"分 類過濾器";第二類過濾器是和特定的現(xiàn)實(shí)設(shè)備相關(guān)的,我們稱這類過濾器為設(shè)備過濾器, 這類過濾器的主要作用是去掉那些無法和電紙書設(shè)備顯示模式兼容的頁面單元;第三類過 濾器是內(nèi)容過濾器,這類過濾器完全按照頁面單元所包含的內(nèi)容來決定是否保留對(duì)應(yīng)的頁 面單元。 其中對(duì)于分類過濾器的選擇方法如下根據(jù)從頁面對(duì)象抓取的信息,對(duì)輸入網(wǎng)頁 進(jìn)行分類,不同類型的網(wǎng)站對(duì)信息的處理方式是非常不同的。根據(jù)從頁面單元中提取出來 的信息,為頁面標(biāo)定類別,并把頁面的類別作為重要的參數(shù),使用在對(duì)頁面單元過濾器的選 擇中。 頁面分類步驟通過對(duì)頁面單元的分析,決定特定網(wǎng)頁歸屬的類別。 一般情況下, 頁面的分類按照以下步驟進(jìn)行首先通過對(duì)頁面單元的統(tǒng)計(jì)得到分類的參數(shù)。每一個(gè)參數(shù) 可以是數(shù)值型,也可以是字符串型。比如,一個(gè)頁面對(duì)應(yīng)的標(biāo)題頁面單元的文字內(nèi)容,就是 作為頁面分類的一個(gè)參數(shù)。通過收集分類參數(shù)的值并代入事先訓(xùn)練好的分類模型,就可以 通過自動(dòng)化的方式得到頁面的類別信息。實(shí)現(xiàn)過程中,一個(gè)頁面的分類標(biāo)簽可以是新聞,博 客,電子商務(wù)等品類中的一個(gè)。而每一個(gè)分類標(biāo)簽,都有自己獨(dú)有的頁面單元過濾器,這些 過濾器會(huì)在下一步中,用來過濾特定的頁面單元。
步驟三頁面單元過濾 基本功能應(yīng)用過濾器減少需要展示的頁面單元的數(shù)量。
輸入頁面單元的集合以及選中的過濾器集合。
輸出一個(gè)精簡過的頁面單元集合。
在現(xiàn)實(shí)生活中,通過應(yīng)用過濾器的方式減少需要顯示的頁面單元的數(shù)量。每一個(gè)
過濾器都會(huì)攔截滿足特定條件的頁面單元,使其無法最終在用戶終端顯示出來。
步驟四頁面重組整合渲染 基本功能將篩選過后的頁面單位重組整合后發(fā)往客戶端,并重新渲染展示。
輸入保存在服務(wù)器上的頁面單元集合。
輸出在客戶端設(shè)備上顯示處理過的頁面。 根據(jù)終端設(shè)備的配置和用戶的使用偏好,對(duì)過濾后的頁面進(jìn)行重新渲染。 一旦頁 面單元過濾完成,剩下被選中的頁面單元就需要重新進(jìn)行組合,以便在客戶端設(shè)備上展示 出來??梢杂靡韵聝煞N方式展示新頁面第一,剩余的頁面元素按照一定的邏輯規(guī)則寫入業(yè) 界標(biāo)準(zhǔn)的數(shù)據(jù)格式,這樣的數(shù)據(jù)傳到客戶端一后,會(huì)按照標(biāo)準(zhǔn)的流程對(duì)頁面的內(nèi)容進(jìn)行渲 染和展示;第二,頁面單元集合被直接送到了客戶端設(shè)備,由客戶端設(shè)備直接進(jìn)行調(diào)整傳來 頁面元素的標(biāo)記位置。 頁面重渲染采用分步的方式,篩選之后的頁面單元集合首先轉(zhuǎn)化成為XML數(shù)據(jù)文 件,傳輸?shù)娇蛻舳艘院蟾鶕?jù)客戶端的具體設(shè)置重新組織展示出來。在系統(tǒng)中,最終顯示界面可能存在兩種情況一是一系列頭條消息的列表,用戶隨便點(diǎn)擊一個(gè)就可以直接看到相關(guān) 的內(nèi)容頁面;二是經(jīng)過簡化過的內(nèi)容頁面,在這個(gè)頁面中,用戶可以看到經(jīng)過精簡過的頁面 內(nèi)容。
權(quán)利要求
一種網(wǎng)絡(luò)內(nèi)容在電紙書上的展示方法,用于即時(shí)展示適應(yīng)移動(dòng)設(shè)備的網(wǎng)頁,其特征在于該方法依次由頁面分解、選擇過濾、頁面單元過濾、頁面重組整合渲染四個(gè)步驟組成。
2. 根據(jù)權(quán)利要求1所述的網(wǎng)絡(luò)內(nèi)容在電紙書上的展示方法,其特征在于所述的步驟依托于依次由數(shù)據(jù)獲取層、分解層、選擇過濾層、過濾層、數(shù)據(jù)重組層和數(shù)據(jù)整合渲染層組成的系統(tǒng)。
3. 根據(jù)權(quán)利要求2所述的網(wǎng)絡(luò)內(nèi)容在電紙書上的展示方法,其特征在于所述的數(shù)據(jù)提取層和分解層組成了頁面分解步驟,頁面經(jīng)過頁面提取后成為原始數(shù)據(jù)提供給分解層,分解層通過渲染引擎將頁面直接轉(zhuǎn)化為頁面單元的集合。
4. 根據(jù)權(quán)利要求3所述的網(wǎng)絡(luò)內(nèi)容在電紙書上的展示方法,其特征在于所述的經(jīng)過數(shù)據(jù)分解的頁面單元進(jìn)入選擇過濾層,根據(jù)設(shè)備信息,以及頁面的分類,選擇合適的過濾器。
5. 根據(jù)權(quán)利要求4所述的網(wǎng)絡(luò)內(nèi)容在電紙書上的展示方法,其特征在于所述的頁面單元經(jīng)過選擇的過濾器,進(jìn)行基于分類的過濾,基于設(shè)備的過濾以及基于內(nèi)容的過濾。
6. 根據(jù)權(quán)利要求5所述的網(wǎng)絡(luò)內(nèi)容在電紙書上的展示方法,其特征在于所述的經(jīng)過過濾的頁面單元進(jìn)入數(shù)據(jù)重組層,對(duì)數(shù)據(jù)進(jìn)行實(shí)體檢測(cè)、協(xié)同式聚類、個(gè)性化語意分析、時(shí)間序列分析,從而將無序的網(wǎng)頁單元整合成為有序的集合。
7. 根據(jù)權(quán)利要求6所述的網(wǎng)絡(luò)內(nèi)容在電紙書上的展示方法,其特征在于所述的經(jīng)過數(shù)據(jù)重組的頁面單元集合進(jìn)入位于數(shù)據(jù)整合層,將篩選過后的頁面單元整合成為一個(gè)整體。
8. 根據(jù)權(quán)利要求7所述的網(wǎng)絡(luò)內(nèi)容在電紙書上的展示方法,其特征在于所述的經(jīng)過整合后的頁面單元在在客戶端設(shè)備上顯示成為適合移動(dòng)設(shè)備閱讀的頁面。
9. 根據(jù)權(quán)利要求1 8所述的網(wǎng)絡(luò)內(nèi)容在電紙書上的展示方法,其特征在于整個(gè)轉(zhuǎn)換過程在服務(wù)器端完成,用時(shí)少于1秒。
全文摘要
本發(fā)明公開了一種網(wǎng)絡(luò)內(nèi)容在電紙書上的展示方法,用于即時(shí)展示適應(yīng)移動(dòng)設(shè)備的網(wǎng)頁,依次由頁面分解、選擇過濾、頁面單元過濾、頁面整合渲染四個(gè)步驟組成。原始頁面經(jīng)過頁面提取后分割為一系列頁面單元,根據(jù)從頁面單元搜集的信息、設(shè)備的特性以及頁面的具體分類選擇過濾器,通過選定的過濾器過濾設(shè)備不支持的頁面單元以及移動(dòng)設(shè)備用戶不需要的頁面單元。最后,系統(tǒng)將篩選過后的頁面單元重組整合后發(fā)往客戶端并重新渲染,在客戶端設(shè)備上顯示。本發(fā)明具有適用性范圍廣、靈活、讀取方便快捷、節(jié)省流量費(fèi)用等優(yōu)點(diǎn),可以滿足各種移動(dòng)設(shè)備用戶的需求,特別是對(duì)于電紙書類使用特殊屏幕的產(chǎn)品尤為適用。
文檔編號(hào)G06F17/30GK101794301SQ201010104330
公開日2010年8月4日 申請(qǐng)日期2010年2月1日 優(yōu)先權(quán)日2010年2月1日
發(fā)明者黃崢 申請(qǐng)人:東莞市樂其網(wǎng)絡(luò)科技有限公司