專(zhuān)利名稱(chēng):一種文檔共享平臺(tái)及文檔處理方法
技術(shù)領(lǐng)域:
本發(fā)明涉及網(wǎng)絡(luò)技術(shù),特別涉及一種文檔共享平臺(tái)及文檔處理方法。
背景技術(shù):
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,在線文檔閱讀服務(wù)于互聯(lián)網(wǎng)絡(luò)中業(yè)已廣泛提供,而傳統(tǒng) 的在線文檔閱讀服務(wù)不會(huì)區(qū)分文檔格式,只是統(tǒng)一將文檔轉(zhuǎn)檔成HTML或Flash格式頁(yè)面, 并在線播放該HTML或Flash頁(yè)面。另外,在播放文件格式較小的純文本格式文檔時(shí),傳統(tǒng) 的在線文檔播放技術(shù)皆將文件格式較小的純文本格式文檔轉(zhuǎn)換為文件格式較大的圖像,并 以播放圖像形式播放文檔。因此,若原始文檔為純文本格式文檔,由于傳統(tǒng)在線文檔閱讀技術(shù)將需要播放的 文檔轉(zhuǎn)檔成Flash頁(yè)面,則原本純文本格式文檔相較Flash頁(yè)面所具有傳輸量小、字體清晰 等優(yōu)點(diǎn)無(wú)法發(fā)揮。并且,由于傳統(tǒng)在線文檔閱讀統(tǒng)一將需要播放的文檔轉(zhuǎn)檔成Flash頁(yè)面,因此,會(huì) 將純文本格式文檔中的文字轉(zhuǎn)成圖像,有可能造成文字不清晰,使得用戶的閱讀體驗(yàn)不佳。
發(fā)明內(nèi)容
本發(fā)明提供了一種文檔共享平臺(tái)及文檔處理方法,以提升用戶閱讀體驗(yàn)。具體技術(shù)方案如下提供一種文檔共享平臺(tái)的文檔處理方法,包括a.接收用戶 上傳文檔;b.對(duì)用戶上傳文檔進(jìn)行格式判斷;C.在判斷到用戶上傳文檔為純文本格式文檔 時(shí),存儲(chǔ)純文本格式文檔,在判斷到用戶上傳文檔為非純文本格式文檔時(shí),將非純文本格式 文檔轉(zhuǎn)換預(yù)定格式文檔,并存儲(chǔ)預(yù)定格式文檔。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,文檔處理方法進(jìn)一步包括步驟d 將純文本格式文 檔作為播放文件發(fā)送至瀏覽器,并由純文本播放器進(jìn)行在線播放。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,步驟d進(jìn)一步包括從純文本格式文檔抽取純文本 信息,在純文本信息與純文本格式文檔之間建立索引關(guān)系。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,將純文本信息發(fā)送至瀏覽器作為檢索索引以供用戶 瀏覽點(diǎn)擊。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,步驟C進(jìn)一步包括對(duì)純文本格式文檔進(jìn)行文字編 碼格式轉(zhuǎn)換,并存儲(chǔ)轉(zhuǎn)換后的純文本格式文檔。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,步驟b進(jìn)一步包括對(duì)用戶上傳文檔進(jìn)行加密判斷, 在判斷到用戶上傳文檔為加密文檔時(shí),對(duì)用戶上傳文檔進(jìn)行解密處理。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,步驟b進(jìn)一步包括判斷用戶上傳文檔是否為已存 儲(chǔ)文檔,若為已存儲(chǔ)文檔,則退出。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,預(yù)定格式文檔為swf或html格式文檔,文檔處理方 法進(jìn)一步包括步驟d 將swf或html格式文檔作為播放文件發(fā)送至瀏覽器,并由flash播 放器進(jìn)行在線播放。
根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,步驟c進(jìn)一步包括在判斷到用戶上傳文檔為非純 文本格式文檔時(shí),先將非純文本格式文檔轉(zhuǎn)換為中間格式文檔,再將中間格式文檔轉(zhuǎn)換為 swf或html格式文檔。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,中間格式文檔為pdf文檔。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,步驟c進(jìn)一步包括對(duì)pdf格式文檔進(jìn)行截圖處理以 獲取截圖,在截圖與SWf或html格式文檔之間建立索引關(guān)系。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,步驟d進(jìn)一步包括將截圖發(fā)送至瀏覽器作為檢索 索引以供用戶瀏覽點(diǎn)擊。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,步驟c進(jìn)一步包括從pdf格式文檔抽取純文本信息 以獲取純文本信息,在純文本信息與SWf或html格式文檔之間建立索引關(guān)系。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,步驟d進(jìn)一步包括將純文本信息發(fā)送至瀏覽器作 為檢索索引以供用戶瀏覽點(diǎn)擊。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,非純文本格式文檔包括doc文檔、docx文檔、ppt文 檔、PPtX文檔、XSl文檔、xslx文檔、pdf文檔、VSd文檔、rtf文檔、pps文檔、wps文檔、et 文檔、dps文檔或pot文檔。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,純文本格式文檔包括txt文檔。本發(fā)明進(jìn)一步提供一種文檔共享平臺(tái),包括文檔接收模塊,用于接收用戶上傳文 檔;文檔處理模塊,包括格式判斷模塊、格式轉(zhuǎn)換模塊以及數(shù)據(jù)庫(kù),格式判斷模塊用于對(duì)用 戶上傳文檔進(jìn)行格式判斷,在判斷到用戶上傳文檔為純文本格式文檔時(shí),存儲(chǔ)純文本格式 文檔至數(shù)據(jù)庫(kù),在判斷到用戶上傳文檔為非純文本格式文檔時(shí),格式轉(zhuǎn)換模塊將非純文本 格式文檔轉(zhuǎn)換為預(yù)定格式文檔,并存儲(chǔ)預(yù)定格式文檔至數(shù)據(jù)庫(kù)。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,文檔處理模塊進(jìn)一步包括收發(fā)模塊,收發(fā)模塊用于 將純文本格式文檔作為播放文件發(fā)送至瀏覽器,并由純文本播放器進(jìn)行在線播放。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,文檔處理模塊進(jìn)一步包括純文本信息抽取模塊,純 文本信息抽取模塊用于從純文本格式文檔抽取純文本信息,在純文本信息與純文本格式文 檔之間建立索引關(guān)系。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,收發(fā)模塊進(jìn)一步用于將純文本信息發(fā)送至瀏覽器作 為檢索索引以供用戶瀏覽點(diǎn)擊。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,格式轉(zhuǎn)換模塊進(jìn)一步用于對(duì)純文本格式文檔進(jìn)行文 字編碼格式轉(zhuǎn)換,并存儲(chǔ)轉(zhuǎn)換后的純文本格式文檔。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,文檔處理模塊進(jìn)一步包括解密模塊,解密模塊用于 對(duì)用戶上傳文檔進(jìn)行加密判斷,在判斷到用戶上傳文檔為加密文檔時(shí),對(duì)用戶上傳文檔進(jìn) 行解密處理。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,文檔處理模塊進(jìn)一步包括存儲(chǔ)判斷模塊,存儲(chǔ)判斷 模塊用于判斷用戶上傳文檔是否為已存儲(chǔ)文檔,若為已存儲(chǔ)文檔,則不處理用戶上傳文檔。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,預(yù)定格式文檔為swf或html格式文檔,收發(fā)模塊進(jìn) 一步將swf或html格式文檔作為播放文件發(fā)送至瀏覽器,并由flash播放器進(jìn)行在線播 放。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,在格式判斷模塊判斷到用戶上傳文檔為非純文本格式文檔時(shí),格式轉(zhuǎn)換模塊先將非純文本格式文檔轉(zhuǎn)換為中間格式文檔,再將中間格式文檔 轉(zhuǎn)換為swf或html格式文檔。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,中間格式文檔為pdf文檔。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,文檔處理模塊進(jìn)一步包括截圖模塊,截圖模塊對(duì)pdf 格式文檔進(jìn)行截圖處理以獲取截圖,在截圖與SWf或html格式文檔之間建立索引關(guān)系。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,收發(fā)模塊進(jìn)一步用于將截圖發(fā)送至瀏覽器作為檢索 索引以供用戶瀏覽點(diǎn)擊。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,文檔處理模塊進(jìn)一步包括純文本信息抽取模塊,純 文本信息抽取模塊用于從Pdf格式文檔抽取純文本信息以獲取純文本信息,在純文本信息 與swf或html格式文檔之間建立索引關(guān)系。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,文收發(fā)模塊進(jìn)一步用于將純文本信息發(fā)送至瀏覽器 作為檢索索引以供用戶瀏覽點(diǎn)擊。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,非純文本格式文檔包括doc文檔、docx文檔、ppt文 檔、PPtX文檔、XSl文檔、xslx文檔、pdf文檔、VSd文檔、rtf文檔、pps文檔、wps文檔、et 文檔、dps文檔或pot文檔。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,純文本格式文檔包括txt文檔。由以上技術(shù)方案可以看出,通過(guò)上述方式,可以充分利用純文本格式文檔相傳輸 量小、字體清晰等優(yōu)點(diǎn),并且可提升用戶的閱讀體驗(yàn)。
圖1是本發(fā)明的文檔共享平臺(tái)的示意框圖;圖2是根據(jù)本發(fā)明第一實(shí)施例的文檔共享平臺(tái)的示意框圖;圖3是本發(fā)明的文檔共享平臺(tái)的文檔處理方法的流程圖;圖4是根據(jù)本發(fā)明第二實(shí)施例的文檔共享平臺(tái)的文檔處理方法的流程圖;圖5是根據(jù)本發(fā)明第三實(shí)施例的文檔共享平臺(tái)的文檔處理方法的流程圖;圖6是根據(jù)本發(fā)明第四實(shí)施例的文檔共享平臺(tái)的文檔處理方法的流程圖;圖7是根據(jù)本發(fā)明第五實(shí)施例的文檔共享平臺(tái)的文檔處理方法的流程圖;圖8是根據(jù)本發(fā)明第六實(shí)施例的文檔共享平臺(tái)的文檔處理方法的流程圖;圖9是根據(jù)本發(fā)明第七實(shí)施例的文檔共享平臺(tái)的示意框圖;圖10是本發(fā)明的文檔共享平臺(tái)的在線文檔閱讀裝置的示意框圖;圖11是本發(fā)明的文檔共享平臺(tái)的在線文檔閱讀方法的流程圖;圖12是根據(jù)本發(fā)明第八實(shí)施例的在線文檔閱讀裝置的示意框圖;圖13是根據(jù)本發(fā)明第九實(shí)施例的在線文檔閱讀裝置的示意框圖;圖14是根據(jù)本發(fā)明第九實(shí)施例的在線文檔閱讀方法的流程圖;圖15是根據(jù)本發(fā)明第十實(shí)施例的在線文檔閱讀裝置中的播放器設(shè)置模塊的示意 框圖;圖16是根據(jù)本發(fā)明第十實(shí)施例的在線文檔閱讀裝置的播放器設(shè)置模塊8031的文 檔加載模塊的加載流程圖;圖17是根據(jù)本發(fā)明第十一實(shí)施例的文檔共享平臺(tái)與在線文檔閱讀裝置組合使用的示意框圖;圖18是根據(jù)本發(fā)明第十二實(shí)施例的文檔共享平臺(tái)與在線文檔閱讀裝置組合使用 的示意框圖;圖19是根據(jù)本發(fā)明第十三實(shí)施例的文檔共享平臺(tái)與在線文檔閱讀裝置組合使用 的示意框圖;以及圖20為根據(jù)本發(fā)明第十四實(shí)施例的在線文檔閱讀裝置結(jié)合在線應(yīng)用系統(tǒng)向用戶 提供在線電子書(shū)搜索服務(wù)的示意框圖。
具體實(shí)施例方式為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面結(jié)合附圖和具體實(shí)施例對(duì) 本發(fā)明進(jìn)行詳細(xì)描述。首先請(qǐng)參見(jiàn)圖1,圖1是本發(fā)明的文檔共享平臺(tái)的示意框圖。如圖1所示,本發(fā)明所揭示的文檔共享平臺(tái)120包括文檔接收模塊121和文檔處 理模塊100。其中,文檔接收模塊121用于接收用戶上傳文檔(于下文將會(huì)詳細(xì)描述);文 檔處理模塊100用于對(duì)用戶上傳文檔進(jìn)行格式判斷,在判斷到用戶上傳文檔為純文本格式 文檔時(shí),存儲(chǔ)純文本格式文檔,在判斷到用戶上傳文檔為非純文本格式文檔時(shí),將非純文本 格式文檔轉(zhuǎn)換預(yù)定格式文檔,并存儲(chǔ)預(yù)定格式文檔。值得注意的是本發(fā)明的文檔共享平臺(tái)120及所包括的文檔接收模塊121和文檔處 理模塊100可利用軟件或硬件(或二者之結(jié)合來(lái)實(shí)現(xiàn)),當(dāng)采用軟件實(shí)現(xiàn)時(shí),可采用各種通 用的網(wǎng)絡(luò)開(kāi)發(fā)語(yǔ)言,如c#、PHP、JAVA、RUBY、以及PYTHON等。請(qǐng)參見(jiàn)圖2,圖2是根據(jù)本發(fā)明第一實(shí)施例的文檔共享平臺(tái)的示意框圖。如圖2所示,在本發(fā)明的第一實(shí)施例中,用戶上傳用戶上傳文檔110到文檔共享平 臺(tái)120,文檔共享平臺(tái)120的文檔接收模塊121接收用戶上傳文檔110,文檔處理模塊100 對(duì)用戶上傳文檔110進(jìn)行格式判斷,在判斷到用戶上傳文檔110為純文本格式文檔時(shí),存儲(chǔ) 純文本格式文檔,在判斷到用戶上傳文檔110為非純文本格式文檔時(shí),將非純文本格式文 檔轉(zhuǎn)換預(yù)定格式文檔,并存儲(chǔ)預(yù)定格式文檔。其中,在本發(fā)明的優(yōu)選實(shí)施例中,用戶可利用ftp協(xié)議上傳用戶上傳文檔110。并 且,文檔處理模塊100可利用linux、unix或windows命令對(duì)用戶上傳文檔110進(jìn)行格式 判斷(如可利用Iinux系統(tǒng)自帶的file命令或trid命令對(duì)用戶上傳文檔110進(jìn)行格式判 斷)。在本發(fā)明的第一實(shí)施例中,在判斷到用戶上傳文檔110為純文本格式文檔時(shí),文 檔處理模塊100將純文本格式文檔作為播放文件發(fā)送至瀏覽器130,并由嵌入到瀏覽器130 的純文本播放器131進(jìn)行在線播放。并且,在判斷到用戶上傳文檔110為非純文本格式文 檔時(shí),文檔處理模塊100將非純文本格式文檔作為播放文件發(fā)送至瀏覽器130,并由嵌入到 瀏覽器130的非純文本播放器132進(jìn)行在線播放。其中,瀏覽器130可以插件方式安裝純文本播放器131或非純文本播放器132。請(qǐng)參見(jiàn)圖3,圖3是本發(fā)明的文檔共享平臺(tái)的文檔處理方法的流程圖。如圖3所示,本發(fā)明的文檔共享平臺(tái)的文檔處理方法包括以下步驟在步驟201,接收用戶上傳文檔。
8
在步驟202,判斷用戶上傳文檔是否為純文本格式文檔,在判斷到用戶上傳文檔為 純文本格式文檔時(shí),執(zhí)行步驟203,否則,執(zhí)行步驟204。在步驟203,存儲(chǔ)純文本格式文檔。在步驟204,將非純文本格式文檔轉(zhuǎn)換為預(yù)定格式文檔。其中,步驟201由文檔接收模塊121完成,步驟202-204由文檔處理模塊100完成。請(qǐng)參見(jiàn)圖4,圖4是根據(jù)本發(fā)明第二實(shí)施例的文檔共享平臺(tái)的文檔處理方法的流 程圖。如圖4所示,相較于上述的本發(fā)明的第一實(shí)施例而言,本發(fā)明的第二實(shí)施例中進(jìn) 一步對(duì)非純文本格式文檔進(jìn)行中間格式轉(zhuǎn)換處理,具體步驟如下步驟301,接收用戶上傳文檔。步驟302,判斷用戶上傳文檔是否為純文本格式文檔,在判斷到用戶上傳文檔為純 文本格式文檔時(shí),執(zhí)行步驟303。在步驟303,存儲(chǔ)純文本格式文檔。并且,在完成步驟303后,執(zhí)行步驟305。在步驟305,將純文本格式文檔作為播放文件發(fā)送至瀏覽器,并由純文本播放器進(jìn) 行在線播放。當(dāng)在步驟302判斷到用戶上傳文檔為非純文本格式文檔時(shí),執(zhí)行步驟304。在步驟304,將非純文本格式文檔轉(zhuǎn)換為中間格式文檔,并存儲(chǔ)中間格式文檔。并 且,在完成步驟304后,執(zhí)行步驟306和步驟307。在步驟306,將中間格式文檔轉(zhuǎn)換為預(yù)定格式文檔,并存儲(chǔ)預(yù)定格式文檔。在步驟307,將預(yù)定格式文檔作為播放文件發(fā)送至瀏覽器,并由非純文本播放器進(jìn) 行在線播放。其中,步驟301由文檔接收模塊121完成,步驟302-207由文檔處理模塊100完成。 以上步驟中,由于對(duì)非純文本格式文檔進(jìn)行了中間格式轉(zhuǎn)換處理,因此,可進(jìn)一步利用所獲 取的中間格式文檔進(jìn)行相關(guān)操作(于下文將會(huì)詳細(xì)描述)。請(qǐng)進(jìn)一步參見(jiàn)圖5,圖5是根據(jù)本發(fā)明第三實(shí)施例的文檔共享平臺(tái)的文檔處理方 法的流程圖。如圖5所示,本發(fā)明的第三實(shí)施例對(duì)上述第一及第二實(shí)施例作進(jìn)一步改良,進(jìn)一 步提供了加密判斷、已存儲(chǔ)判斷、純文本格式文檔文字編碼轉(zhuǎn)換等文檔處理步驟,并且將中 間格式文檔具體指定為Pdf格式文檔。其具體流程如下在步驟401,接收用戶上傳文檔。在步驟402,判斷用戶上傳文檔是否為加密文檔。當(dāng)判斷到用戶上傳文檔為加密文 檔時(shí),執(zhí)行步驟403,反之,直接執(zhí)行步驟404。在步驟403,對(duì)用戶上傳文檔進(jìn)行解密處理,相關(guān)的解密處理可采用各種現(xiàn)有的解 密處理算法,對(duì)此不作多余描述。在步驟404,判斷用戶上傳文檔是否為已存儲(chǔ)文檔。當(dāng)判斷到用戶上傳文檔為已存 儲(chǔ)文檔時(shí),執(zhí)行步驟405,退出本流程。當(dāng)判斷到用戶上傳文檔為未存儲(chǔ)文檔時(shí),執(zhí)行步驟 406。其中,可通過(guò)計(jì)算MD5、標(biāo)題大小、內(nèi)容相似度在數(shù)據(jù)庫(kù)中查找重復(fù)文檔。在步驟406,判斷用戶上傳文檔是否為純文本格式文檔。當(dāng)判斷到用戶上傳文檔為 純文本格式文檔時(shí),執(zhí)行步驟407、408、409。
在步驟407,存儲(chǔ)純文本格式文檔。在步驟408,對(duì)純文本格式文檔進(jìn)行文字編碼格式轉(zhuǎn)換,并存儲(chǔ)轉(zhuǎn)換后的純文本格 式文檔。具體而言,純文本格式文檔包括gbk、utf-8、utf-16編碼格式,可指定其中一種作 為轉(zhuǎn)換后的統(tǒng)一格式,如在本發(fā)明的優(yōu)選實(shí)施方式中,優(yōu)選將所有的純文本格式統(tǒng)一轉(zhuǎn)換 為utf-8編碼格式。在步驟409,將轉(zhuǎn)換后的純文本格式文檔作為播放文件發(fā)送至瀏覽器,并由瀏覽器 可利用純文本播放器進(jìn)行在線播放。當(dāng)在步驟406中判斷到用戶上傳文檔為非純文本格式文檔時(shí),執(zhí)行步驟410、411、 412。在步驟410,將非純文本格式文檔轉(zhuǎn)換為pdf格式文檔,并存儲(chǔ)該pdf格式文檔。在步驟411,將pdf格式文檔轉(zhuǎn)換為swf或html格式文檔,并存儲(chǔ)swf或html格 式文檔。在步驟412,將swf或html格式文檔作為播放文件發(fā)送至瀏覽器,并由flash播放 器進(jìn)行在線播放。其中,步驟401由文檔接收模塊121完成,步驟402-412由文檔處理模塊100完成。請(qǐng)進(jìn)一步參見(jiàn)圖6,圖6是根據(jù)本發(fā)明第四實(shí)施例的文檔共享平臺(tái)的文檔處理方 法的流程圖。值得注意的是,中間格式文檔除為pdf格式文檔外,還可以是其他格式文檔,如圖 片格式文檔等,具體可根據(jù)實(shí)際需要選采。如圖6所示,在本發(fā)明的第四實(shí)施例中,對(duì)上述第三實(shí)施例進(jìn)行改良,進(jìn)一步提供 截圖處理步驟。具體如下,當(dāng)在本發(fā)明的第三實(shí)施例中執(zhí)行到步驟410時(shí),可在完成步驟 410后執(zhí)行步驟501,對(duì)pdf格式文檔進(jìn)行截圖處理以獲取截圖,在截圖與swf或html格式 文檔之間建立索引關(guān)系。并且,在完成步驟501后繼續(xù)執(zhí)行步驟502,將截圖發(fā)送至瀏覽器 作為檢索索引以供用戶瀏覽點(diǎn)擊。具體而言,當(dāng)用戶在瀏覽器中觀看到截圖時(shí)(其在瀏覽器上呈現(xiàn)于用戶的是一頁(yè) 頁(yè)的縮略圖),用戶可點(diǎn)擊某一特定截圖,此時(shí)瀏覽器可發(fā)送帶有該截圖信息的http請(qǐng)求 至文檔處理模塊100,文檔處理模塊100可根據(jù)存儲(chǔ)的索引關(guān)系調(diào)用該截圖信息所對(duì)應(yīng)的 swf或html格式文檔,并將所對(duì)應(yīng)的swf或html格式文檔發(fā)送至瀏覽器,瀏覽器在獲取所 對(duì)應(yīng)的swf或html格式文檔后,可將其設(shè)置為當(dāng)前頁(yè)面,使得用戶可看到截圖所對(duì)應(yīng)的swf 或html格式文檔。請(qǐng)進(jìn)一步參見(jiàn)圖7,圖7是根據(jù)本發(fā)明第五實(shí)施例的文檔共享平臺(tái)的文檔處理方 法的流程圖。如圖7所示,在本發(fā)明的第五實(shí)施例中,在第三及第四實(shí)施例的基礎(chǔ)上進(jìn)一步提 供純文本信息抽取步驟。具體如下,當(dāng)在本發(fā)明的第三實(shí)施例中執(zhí)行到步驟410,可在完成 步驟410后執(zhí)行步驟601,從pdf格式文檔抽取純文本信息,并在純文本信息與swf或html 格式文檔之間建立索引關(guān)系。并且,在完成步驟601后執(zhí)行步驟602,將純文本信息發(fā)送至 瀏覽器作為檢索索引以供用戶瀏覽點(diǎn)擊。同樣地,與上一實(shí)施例所采取的機(jī)制相類(lèi)似,當(dāng)用戶在瀏覽器中觀看到文檔目錄 時(shí)(其在瀏覽器上呈現(xiàn)于用戶的是純文本格式文檔的文檔目錄),用戶可點(diǎn)擊某一特定目錄,此時(shí)瀏覽器可發(fā)送帶有該目錄信息的http請(qǐng)求至文檔處理模塊100,文檔處理模塊100 可根據(jù)存儲(chǔ)的索引關(guān)系調(diào)用該目錄信息所對(duì)應(yīng)的swf或html格式文檔,并將所對(duì)應(yīng)的swf 或html格式文檔發(fā)送至瀏覽器,瀏覽器在獲取所對(duì)應(yīng)的swf或html格式文檔后,可將其設(shè) 置為當(dāng)前頁(yè)面,使得用戶可看到所點(diǎn)擊目錄所對(duì)應(yīng)的swf或html格式文檔。請(qǐng)進(jìn)一步參見(jiàn)圖8,圖8是根據(jù)本發(fā)明第六實(shí)施例的文檔共享平臺(tái)的文檔處理方 法的流程圖。如圖8所示,在本實(shí)施例中,可以對(duì)純文本格式文檔進(jìn)行純文本信息抽取處理,具 體如下,當(dāng)在本發(fā)明的第三實(shí)施例中執(zhí)行到步驟407,可在完成步驟407后執(zhí)行步驟701,從 純文本格式文檔抽取純文本信息,并在純文本信息與純文本格式文檔之間建立索引關(guān)系, 并且,在完成步驟701后執(zhí)行步驟702,將純文本信息發(fā)送至瀏覽器作為檢索索引以供用戶 瀏覽點(diǎn)擊。同樣地,與上兩個(gè)實(shí)施例所采取的機(jī)制相類(lèi)似,當(dāng)用戶在瀏覽器中觀看到文檔目 錄時(shí)(其在瀏覽器上呈現(xiàn)于用戶的是純文本格式文檔的文檔目錄),用戶可點(diǎn)擊某一特定 目錄,此時(shí)瀏覽器可發(fā)送帶有該目錄信息的http請(qǐng)求至文檔處理模塊100,文檔處理模塊 100可根據(jù)存儲(chǔ)的索引關(guān)系調(diào)用該目錄信息所對(duì)應(yīng)的純文本格式文檔,并將所對(duì)應(yīng)的純文 本格式文檔發(fā)送至瀏覽器,瀏覽器在獲取所對(duì)應(yīng)的純文本格式文檔后,可將其設(shè)置為當(dāng)前 頁(yè)面,使得用戶可看到所點(diǎn)擊目錄所對(duì)應(yīng)的純文本格式文檔。請(qǐng)參見(jiàn)圖9,圖9是根據(jù)本發(fā)明第七實(shí)施例的文檔共享平臺(tái)的示意框圖。如圖9所示,在本發(fā)明的第七實(shí)施例中,圖1所示的文檔處理模塊100可進(jìn)一步包 括解密模塊101、存儲(chǔ)判斷模塊102、格式判斷模塊103、格式轉(zhuǎn)換模塊104、數(shù)據(jù)庫(kù)105、截 圖模塊106、純文本信息抽取模塊107以及收發(fā)模塊108。其中,解密模塊101用于判斷文檔接收模塊121所接收的用戶上傳文檔110是否 加密,若判斷為加密文檔,則對(duì)其進(jìn)行解密處理,并將解密處理后的用戶上傳文檔發(fā)送至存 儲(chǔ)判斷模塊102,若判斷為非加密文檔,則直接將用戶上傳文檔110發(fā)送至存儲(chǔ)判斷模塊 102。存儲(chǔ)判斷模塊102用于判斷用戶上傳文檔是否已經(jīng)在數(shù)據(jù)庫(kù)105中存儲(chǔ),當(dāng)判斷 到在數(shù)據(jù)庫(kù)105中已經(jīng)存儲(chǔ)時(shí),可停止對(duì)用戶上傳文檔進(jìn)行處理。當(dāng)判斷到在數(shù)據(jù)庫(kù)105 中沒(méi)有存儲(chǔ)時(shí),可將用戶上傳文檔110發(fā)送至格式判斷模塊103。其中,可通過(guò)計(jì)算MD5、標(biāo) 題大小、內(nèi)容相似度在數(shù)據(jù)庫(kù)105中查找重復(fù)文檔。格式判斷模塊103用于判斷用戶上傳文檔110是否為純文本格式文檔并發(fā)送判斷 結(jié)果及用戶上傳文檔110至格式轉(zhuǎn)換模塊104。其中,格式判斷模塊103可利用liniDuimix 或windows命令對(duì)用戶上傳文檔110進(jìn)行格式判斷(如可利用Iinux系統(tǒng)自帶的file命 令或trid命令對(duì)用戶上傳文檔110進(jìn)行格式判斷)。在格式判斷模塊103判斷到用戶上傳文檔110為純文本格式文檔時(shí),格式轉(zhuǎn)換模 塊104可對(duì)純文本格式文檔進(jìn)行文字編碼格式轉(zhuǎn)換,并存儲(chǔ)轉(zhuǎn)換后的純文本格式文檔至數(shù) 據(jù)庫(kù)105中,而在本發(fā)明的優(yōu)選實(shí)施方式中,可將gbk、utf-16等純文本格式文檔統(tǒng)一轉(zhuǎn)換 為utf-8編碼格式。當(dāng)在判斷到用戶上傳文檔110為非純文檔格式文檔時(shí),格式轉(zhuǎn)換模塊104可將用 戶上傳文檔110轉(zhuǎn)換為中間格式文檔,將中間格式文檔存儲(chǔ)到數(shù)據(jù)庫(kù)105中,并且可進(jìn)一步
11將中間格式文檔轉(zhuǎn)換為預(yù)定格式文檔,并將預(yù)定格式文檔存儲(chǔ)到數(shù)據(jù)庫(kù)105中。在本發(fā)明 的優(yōu)選實(shí)施例中,中間格式文檔優(yōu)選為Pdf格式文檔,預(yù)定格式文檔優(yōu)選為swf或html格 式文檔。截圖模塊106可對(duì)數(shù)據(jù)庫(kù)105中所存儲(chǔ)的pdf格式文檔進(jìn)行截圖處理以獲取截 圖,并在截圖與swf或html格式文檔之間建立索引關(guān)系,并且可將將截圖發(fā)送至瀏覽器130 作為檢索索引以供用戶瀏覽點(diǎn)擊,此時(shí),呈現(xiàn)在用戶的瀏覽器130上的截圖可為縮略圖,當(dāng) 用戶點(diǎn)擊該縮略圖的某一頁(yè)時(shí),瀏覽器130會(huì)發(fā)送請(qǐng)求至文檔共享平臺(tái)120,文檔共享平臺(tái) 120的文檔處理模塊100可根據(jù)索引關(guān)系找到對(duì)應(yīng)swf或html格式文檔,并將其發(fā)送至瀏 覽器130以供用戶瀏覽點(diǎn)擊。純文本信息抽取模塊107可從pdf格式文檔抽取純文本信息以獲取純文本信息, 在純文本信息與swf或html格式文檔之間建立索引關(guān)系,并且可將純文本信息發(fā)送至瀏覽 器130作為檢索索引以供用戶瀏覽點(diǎn)擊,此時(shí),呈現(xiàn)在用戶的瀏覽器130上的純文本信息可 為目錄信息,當(dāng)用戶點(diǎn)擊該目錄信息的某一條時(shí),瀏覽器130會(huì)發(fā)送請(qǐng)求至文檔共享平臺(tái) 120,文檔共享平臺(tái)120的文檔處理模塊100可根據(jù)索引關(guān)系找到對(duì)應(yīng)swf或html格式文 檔,并將其發(fā)送至瀏覽器130以供用戶瀏覽。同樣地,純文本信息抽取模塊107可從純文本格式文檔抽取純文本信息,在純文 本信息與純文本格式文檔之間建立索引關(guān)系,并將純文本信息發(fā)送至瀏覽器130作為檢索 索引以供用戶瀏覽點(diǎn)擊,此時(shí),呈現(xiàn)在用戶的瀏覽器130上的純文本信息可為目錄信息,當(dāng) 用戶點(diǎn)擊該目錄信息的某一條時(shí),瀏覽器130會(huì)發(fā)送請(qǐng)求至文檔共享平臺(tái)120,文檔共享平 臺(tái)120的文檔處理模塊100可根據(jù)索引關(guān)系找到對(duì)應(yīng)純文本格式文檔,并將其發(fā)送至瀏覽 器130以供用戶瀏覽。其中,以上所述的索引關(guān)系可保存于數(shù)據(jù)庫(kù)105中,當(dāng)用戶瀏覽器上的點(diǎn)擊目錄 或截圖時(shí),瀏覽器發(fā)送帶有標(biāo)示目錄或截圖信息的http請(qǐng)求至收發(fā)模塊108,收發(fā)模塊108 獲取請(qǐng)求后,可在數(shù)據(jù)庫(kù)105中查找索引關(guān)系,并根據(jù)索引關(guān)系獲取對(duì)應(yīng)格式文檔,并將對(duì) 應(yīng)格式文檔發(fā)送至瀏覽器進(jìn)行顯示。值得注意的是,在本發(fā)明的優(yōu)選實(shí)施方式中,數(shù)據(jù)庫(kù)105優(yōu)選為mola(Model Transformation Language,模式轉(zhuǎn)換語(yǔ)言)數(shù)據(jù)庫(kù),并且其數(shù)量取決于實(shí)際應(yīng)用可為一個(gè) 或多個(gè)。在以上所揭示的揭示方案中,提供了一種文檔共享平臺(tái),其可接收用戶所提供的 各種格式文檔,并且通過(guò)判斷各種格式文檔為非純文本格式或純文本格式,進(jìn)而作出相應(yīng) 處理,從而因應(yīng)文檔格式的不同而作出不同處理,極大地提高了系統(tǒng)效能,并降低了文檔共 享平臺(tái)的負(fù)載。對(duì)應(yīng)于上述的文檔共享平臺(tái),本發(fā)明更提供一種在線文檔閱讀裝置及在線文檔閱 讀方法,其中該在線文檔閱讀裝置可與本發(fā)明所揭示的文檔共享平臺(tái)配合使用,以進(jìn)一步 降低用戶端負(fù)載。以下將參見(jiàn)圖10-20對(duì)本發(fā)明的在線文檔閱讀裝置及在線文檔閱讀方法作詳細(xì) 介紹。首先請(qǐng)參見(jiàn)圖10,圖10是本發(fā)明的文檔共享平臺(tái)的在線文檔閱讀裝置的示意框 圖。如圖10所示,本發(fā)明的文檔共享平臺(tái)的在線文檔閱讀裝置包括播放文件獲取模塊801、播放文件判斷模塊802以及播放器設(shè)置模塊803,其中,播放文件獲取模塊801用于獲 取播放文件,播放文件判斷模塊802用于對(duì)播放文件進(jìn)行格式判斷,播放器設(shè)置模塊803用 于在判斷到播放文件為純文本格式文檔時(shí),在瀏覽器上設(shè)置純文本播放器,以由純文本播 放器播放純文本格式文檔。其中,播放文件獲取模塊801可響應(yīng)于用戶請(qǐng)求從圖9所述的文檔共享平臺(tái)120 的數(shù)據(jù)庫(kù)105中獲取對(duì)應(yīng)的播放文件。同樣地,播放文件獲取模塊801、播放文件判斷模塊802以及播放器設(shè)置模塊803 可采用通用的開(kāi)發(fā)語(yǔ)言來(lái)實(shí)現(xiàn),如c#、C++、VB、PHP、JAVA、RUBY、以及PYTHON等。并請(qǐng)參見(jiàn)圖11,圖11是本發(fā)明的文檔共享平臺(tái)的在線文檔閱讀方法的流程圖。如 圖11所示,本發(fā)明所揭示的在線文檔閱讀方法包括步驟901,獲取播放文件。步驟902,對(duì)播放文件進(jìn)行格式判斷。步驟903,在判斷到播放文件為純文本格式文檔時(shí),在瀏覽器上設(shè)置純文本播放 器,以由純文本播放器播放純文本格式文檔。其中,步驟901由播放文件獲取模塊801執(zhí)行,步驟902由播放文件判斷模塊802 執(zhí)行,步驟903由播放器設(shè)置模塊803執(zhí)行。請(qǐng)參見(jiàn)圖12,圖12是根據(jù)本發(fā)明第八實(shí)施例的在線文檔閱讀裝置的示意框圖。如 圖12所示,在本發(fā)明的第八實(shí)施例中,包括播放文件獲取模塊801、播放文件判斷模塊802 以及播放器設(shè)置模塊803的在線文檔閱讀裝置嵌入于瀏覽器130,并且在播放文件判斷模 塊802判斷到播放文件為純文本格式文檔時(shí),播放器設(shè)置模塊在瀏覽器130上設(shè)置純文本 播放器131,以由純文本播放器131播放純文本格式文檔。其中,包括播放文件獲取模塊801、播放文件判斷模塊802以及播放器設(shè)置模塊 803的在線文檔閱讀裝置可以插件安裝方式嵌入安裝于瀏覽器130。請(qǐng)參見(jiàn)圖13,圖13是根據(jù)本發(fā)明第九實(shí)施例的在線文檔閱讀裝置的示意框圖。如 圖13所示,在本發(fā)明的第九實(shí)施例中,包括播放文件獲取模塊801、播放文件判斷模塊802 以及播放器設(shè)置模塊803的在線文檔閱讀裝置嵌入于瀏覽器130,并且,在播放文件判斷模 塊802判斷到播放文件為純文本格式文檔時(shí),播放器設(shè)置模塊803在瀏覽器130上設(shè)置純 文本播放器131,以由純文本播放器131播放純文本格式文檔。另外,在播放文件判斷模塊 802判斷到播放文件為非純文本格式文檔時(shí),播放器設(shè)置模塊803在瀏覽器130上設(shè)置非純 文本播放器132,以由非純文本播放器132播放非純文本格式文檔。值得注意的是,在本發(fā)明的優(yōu)選實(shí)施例中,非純文本播放器優(yōu)選為flash播放器。請(qǐng)參見(jiàn)圖14,圖14是根據(jù)本發(fā)明第九實(shí)施例的在線文檔閱讀方法的流程圖。如圖 14所示,根據(jù)本發(fā)明第八實(shí)施例的文檔共享平臺(tái)的在線文檔閱讀方法可包括以下步驟步驟1001,獲取播放文件。步驟1002,對(duì)播放文件進(jìn)行格式判斷,當(dāng)判斷到播放文件為純文本格式文檔,可執(zhí) 行步驟1003,當(dāng)判斷到播放文件為非純文本格式文檔,可執(zhí)行步驟1004。步驟1003,在瀏覽器上設(shè)置純文本播放器,以由純文本播放器播放純文本格式文 件。步驟1004,在瀏覽器上設(shè)置非純文本播放器,以由非純文本播放器播放非純文本格式文檔。其中,步驟1001由播放文件獲取模塊801執(zhí)行,步驟1002由播放文件判斷模塊 802執(zhí)行,步驟1003-1004由播放器設(shè)置模塊803執(zhí)行。請(qǐng)參見(jiàn)圖15,圖15是根據(jù)本發(fā)明第十實(shí)施例的在線文檔閱讀裝置中的播放器設(shè) 置模塊的示意框圖。如圖15所示,在本發(fā)明的第十實(shí)施例中,播放器設(shè)置模塊803可包括文檔加載模 塊8031、尺寸調(diào)整模塊8033、編輯模塊8032、符號(hào)過(guò)濾模塊8034、目錄顯示模塊8035以及 無(wú)限下拉模塊8036。其中,文檔加載模塊8031用于加載包含當(dāng)前頁(yè)面的多個(gè)預(yù)加載頁(yè)面(其具體實(shí)現(xiàn) 方式將會(huì)于下文結(jié)合圖16詳細(xì)介紹),其可判斷所述當(dāng)前頁(yè)面在預(yù)加載頁(yè)面中的位置,并 在當(dāng)前頁(yè)面處于預(yù)定位置時(shí)控制純文本播放器預(yù)加載后續(xù)頁(yè)面。而在本發(fā)明的優(yōu)選實(shí)施例 中,可以3000個(gè)字節(jié)為一頁(yè)面,并一次預(yù)加載50頁(yè)。尺寸調(diào)整模塊8033用于在頁(yè)面展現(xiàn)時(shí)偵測(cè)瀏覽器130的可視空間尺寸,根據(jù)瀏覽 器130的可視空間尺寸調(diào)整純文本播放器131的尺寸,在本發(fā)明的優(yōu)選實(shí)施例中,可按預(yù)定 比例調(diào)整純文本播放器131的尺寸,并且使得純文本播放器131的最大化尺寸不超過(guò)瀏覽 器130可視空間。編輯模塊8032用于根據(jù)用戶操作信息調(diào)整所述純文本播放器的播放頁(yè)面內(nèi)的字 體大小、字節(jié)數(shù)量或頁(yè)面背景。并且,編輯模塊8032可接收輸入信息,根據(jù)所述輸入信息對(duì) 純文本格式文檔進(jìn)行全文搜索,以在純文本格式文檔中獲取與所述輸入信息匹配的符合字 串,并突出顯示符合字串。另外編輯模塊8032更可接收目標(biāo)頁(yè)面位置,將目標(biāo)頁(yè)面位置對(duì) 應(yīng)的頁(yè)面作為當(dāng)前頁(yè)面顯示。符號(hào)過(guò)濾模塊8034用于在頁(yè)面展現(xiàn)時(shí)對(duì)純文本格式文檔進(jìn)行空行及符號(hào)過(guò)濾處 理。具體而言可對(duì)純文本格式文檔中除換行符外編碼為Oxlf以內(nèi)的符號(hào)進(jìn)行過(guò)濾,并對(duì)純 文本格式文檔中連續(xù)的空行進(jìn)行過(guò)濾。目錄顯示模塊8035用于在瀏覽器130上顯示與純文本格式文檔相關(guān)的純文本信 息,以作為檢索索引供用戶瀏覽點(diǎn)擊。其中與純文本格式文檔相關(guān)的純文本信息在上文中 已經(jīng)介紹,其由文檔共享平臺(tái)100中的純文本信息抽取模塊107對(duì)純文本格式文檔進(jìn)行信 息抽取所獲取。無(wú)限下拉模塊8036用于根據(jù)已經(jīng)加載的文檔頁(yè)面和未加載頁(yè)面計(jì)算整體文檔高 度,根據(jù)整體文檔高度計(jì)算滾動(dòng)條長(zhǎng)度,并根據(jù)當(dāng)前頁(yè)面在整體文檔高度中的位置,計(jì)算當(dāng) 前滾動(dòng)條位置,并控制所純文本播放器顯示滾動(dòng)條。并且無(wú)限下拉模塊8036可獲取滾動(dòng)條 的當(dāng)前位置,將滾動(dòng)條的當(dāng)前位置對(duì)應(yīng)的頁(yè)面作為當(dāng)前頁(yè)面進(jìn)行顯示。請(qǐng)參見(jiàn)圖16,圖16是根據(jù)本發(fā)明第十實(shí)施例的在線文檔閱讀裝置的播放器設(shè)置 模塊8031的文檔加載模塊的加載流程圖。如圖16所示,文檔加載模塊的加載流程如下步驟1101,以多個(gè)連續(xù)頁(yè)面作為一個(gè)加載集合,并將加載集合切分出前單元、后單 元以及中單元。步驟1102,判斷當(dāng)前頁(yè)面在加載集合中的位置,當(dāng)判斷到在當(dāng)前頁(yè)面在前單元時(shí), 執(zhí)行步驟1103,當(dāng)判斷到當(dāng)前頁(yè)面在后單元時(shí),執(zhí)行步驟1104,當(dāng)判斷到當(dāng)前頁(yè)面在后單元時(shí),執(zhí)行步驟1105。步驟1103,控制純文本播放器預(yù)加載當(dāng)前加載集合以及當(dāng)前加載集合之前的加載步驟1104,控制純文本播放器預(yù)加載當(dāng)前加載集合以及當(dāng)前加載集合之后的加載步驟1105,控制純文本播放器僅預(yù)加載當(dāng)前加載集合。以上所采用的加載流程能夠充分利用純文本格式文檔傳輸量較小的特點(diǎn),能夠?qū)?現(xiàn)快速加載的效果。在本實(shí)施例中,播放器設(shè)置模塊803中的文檔加載模塊8031、尺寸調(diào)整模塊8033、 編輯模塊8032、符號(hào)過(guò)濾模塊8034、目錄顯示模塊8035以及無(wú)限下拉模塊8036使得純文 本格式文檔可在瀏覽器130上進(jìn)行快速加載,可以在瀏覽器130進(jìn)行頁(yè)面的初次展現(xiàn)時(shí)進(jìn) 行尺寸調(diào)整,用戶更可在瀏覽器130上編輯純文本格式文檔,并且,由于可濾了多余的符號(hào) (如空格、空行等),更為用戶提升了閱讀體驗(yàn)。請(qǐng)參見(jiàn)圖17,圖17是根據(jù)本發(fā)明第十一實(shí)施例的文檔共享平臺(tái)與在線文檔閱讀 裝置組合使用的示意框圖。如圖17所示,本發(fā)明所揭示的文檔共享平臺(tái)可與在線文檔閱讀裝置組合使用,其 中,在本實(shí)施例中,在包括播放文件獲取模塊801、播放文件判斷模塊802以及播放器設(shè)置 模塊803的在線文檔閱讀裝置嵌入到瀏覽器130中,用戶在閱讀在線文檔時(shí),可點(diǎn)擊瀏覽器 130上所提供的相關(guān)按鈕(或點(diǎn)擊框),向文檔共享平臺(tái)120發(fā)送http請(qǐng)求,文檔共享平 臺(tái)120的文檔處理模塊100在接收到http請(qǐng)求后,可調(diào)用數(shù)據(jù)庫(kù)(如圖8中所述的數(shù)據(jù)庫(kù) 105)中所存儲(chǔ)的對(duì)應(yīng)文檔(包括純文本格式文檔和非純文本格式文檔),將其發(fā)送至在線 文檔閱讀裝置,在線文檔閱讀裝置的播放文件獲取模塊801可獲取到播放文件(即前述之 對(duì)應(yīng)文檔),并利用播放文件判斷模塊802判斷該播放文件的格式,在判斷到該播放文件格 式為純文本格式文檔格式時(shí),可將播放文件發(fā)送至純文本播放器131進(jìn)行在線播放,而在 判斷到該播放文件格式為非純文本格式文檔格式時(shí),可將播放文件發(fā)送至非純文本播放器 132進(jìn)行在線播放。在本發(fā)明的優(yōu)選實(shí)施例中,非純文本播放器132優(yōu)選為flash播放器。當(dāng)在將為純文本格式文檔的播放文件發(fā)送至純文本播放器131進(jìn)行在線播放時(shí), 在線文檔閱讀裝置可利用播放器設(shè)置模塊803對(duì)純文本格式文檔進(jìn)行預(yù)加載、尺寸調(diào)整、 編輯設(shè)置、符號(hào)過(guò)濾、目錄顯示以及無(wú)限下拉設(shè)置等一系列設(shè)置,以充分利用純文本格式文 檔格式小、占用空間不大、便于傳輸以及顯示清晰等優(yōu)點(diǎn),并且用戶可對(duì)文檔進(jìn)行編輯,進(jìn) 一步提升用戶體驗(yàn)。另外,在對(duì)非純文本格式文檔進(jìn)行在線播放時(shí),瀏覽器130可為用戶呈現(xiàn)出縮略 圖或目錄,用戶可在瀏覽器130點(diǎn)擊縮略圖或目錄,縮略圖或目錄所對(duì)應(yīng)的非純文本格式 文檔即可成為當(dāng)前頁(yè)面呈現(xiàn)于瀏覽器。而當(dāng)在對(duì)純文本格式文檔進(jìn)行在線播放時(shí),瀏覽器130可為用戶呈現(xiàn)出目錄,用 戶可在瀏覽器130點(diǎn)擊目錄,目錄所對(duì)應(yīng)的非純文本格式文檔即可成為當(dāng)前頁(yè)面呈現(xiàn)于瀏 覽器130ο請(qǐng)參見(jiàn)圖18,圖18是根據(jù)本發(fā)明第十二實(shí)施例的文檔共享平臺(tái)與在線文檔閱讀裝置組合使用的示意框圖。如圖18所示,本發(fā)明的第十二實(shí)施例與前述的第十一實(shí)施例的區(qū)別在于,在本實(shí) 施例中,進(jìn)一步可將播放文件獲取模塊801和播放文件判斷模塊802整合到文檔共享平臺(tái) 中,而在瀏覽器130只嵌入安裝有播放器設(shè)置模塊803,使得播放文件獲取以及播放文件判 斷等步驟可直接在文檔共享平臺(tái)中執(zhí)行,從而降低瀏覽器130的負(fù)載。并請(qǐng)進(jìn)一步參見(jiàn)圖19,圖19是根據(jù)本發(fā)明第十三實(shí)施例的文檔共享平臺(tái)與在線 文檔閱讀裝置組合使用的示意框圖。如圖19所示,本發(fā)明的第十三實(shí)施例進(jìn)一步對(duì)前述第十二實(shí)施例進(jìn)行具體化設(shè) 置,在本實(shí)施例中,播放文件獲取模塊801和播放文件判斷模塊802整合設(shè)置于文檔共享平 臺(tái)120,具體而言,播放文件獲取模塊801可相應(yīng)于用戶請(qǐng)求從數(shù)據(jù)庫(kù)105中獲取用戶所需 的純文本格式或非純文本格式文檔作為播放文件,利用播放文件判斷模塊802對(duì)播放文件 進(jìn)行格式判斷,并且將判斷結(jié)果及播放文件通過(guò)收發(fā)模塊108發(fā)送至播放器設(shè)置模塊803。
值得注意的是,在本實(shí)施例中,播放文件獲取模塊801和播放文件判斷模塊802與 播放器設(shè)置模塊803之間設(shè)置有收發(fā)模塊108,通過(guò)收發(fā)模塊108來(lái)實(shí)現(xiàn)播放文件獲取模塊 801和播放文件判斷模塊802與播放器設(shè)置模塊803之間的文件傳輸。最后請(qǐng)參見(jiàn)圖20,其中,圖20為根據(jù)本發(fā)明第十四實(shí)施例的在線文檔閱讀裝置結(jié) 合在線應(yīng)用系統(tǒng)向用戶提供在線電子書(shū)搜索服務(wù)的示意框圖。用戶可通過(guò)在線應(yīng)用系統(tǒng)在 搜索引擎上搜索需要的在線應(yīng)用,在線應(yīng)用可包括在線游戲、在線殺毒、在線即時(shí)通信以 及在線電子書(shū)等,其中,本實(shí)施例將在線電子書(shū)搜索服務(wù)與本發(fā)明的在線文檔閱讀裝置相 結(jié)合使用。如圖20所示,在線應(yīng)用系統(tǒng)包括搜索引擎模塊1402、應(yīng)用運(yùn)行環(huán)境模塊1407、應(yīng) 用個(gè)性化定制服務(wù)模塊1403以及數(shù)據(jù)存儲(chǔ)服務(wù)模塊1408。另外,瀏覽器中可嵌入安裝有本發(fā)明所揭示的包括播放文件獲取模塊801、播放文 件判斷模塊802以及播放器設(shè)置模塊803的在線文檔閱讀裝置。當(dāng)用戶希望通過(guò)在線應(yīng)用系統(tǒng)獲得在線電子書(shū)時(shí),用戶可通過(guò)瀏覽器在搜索引擎 的搜索框內(nèi)輸入書(shū)名或其他信息,并點(diǎn)擊搜索按鈕。瀏覽器會(huì)發(fā)送該查詢請(qǐng)求1420到在線 應(yīng)用系統(tǒng)的搜索引擎模塊1402。搜索引擎模塊1402根據(jù)查詢請(qǐng)求1420在索引庫(kù)內(nèi)進(jìn)行 匹配搜索,獲取與查詢請(qǐng)求1420相匹配的多個(gè)在線電子書(shū),以形成搜索結(jié)果,并將搜索結(jié) 果頁(yè)面的代碼發(fā)送給瀏覽器,由瀏覽器運(yùn)行形成搜索結(jié)果頁(yè)面1421。用戶在搜索結(jié)果頁(yè)面 1421上點(diǎn)擊所需要的在線電子書(shū),瀏覽器發(fā)送相應(yīng)的用戶請(qǐng)求到應(yīng)用運(yùn)行環(huán)境模塊1407。 應(yīng)用運(yùn)行環(huán)境模塊1407則發(fā)送在線電子書(shū)對(duì)應(yīng)的畫(huà)布頁(yè)面代碼至用戶瀏覽器,形成畫(huà)布 頁(yè)面1410。畫(huà)布頁(yè)面1410發(fā)送應(yīng)用請(qǐng)求到應(yīng)用運(yùn)行環(huán)境模塊1407,由應(yīng)用運(yùn)行環(huán)境模塊 1407直接發(fā)送在線文檔閱讀器的界面代碼及閱讀器代碼至用戶瀏覽器,形成嵌入于畫(huà)布頁(yè) 面1410的嵌入頁(yè)面1406。隨后,畫(huà)布頁(yè)面1410或嵌入頁(yè)面1406向第三方應(yīng)用服務(wù)器1409 發(fā)送數(shù)據(jù)請(qǐng)求,獲得相應(yīng)的在線電子書(shū)內(nèi)容,并在線文檔閱讀器進(jìn)行解析后呈現(xiàn)給用戶。其中,在畫(huà)布頁(yè)面1410或嵌入頁(yè)面1406向第三方應(yīng)用服務(wù)器發(fā)送數(shù)據(jù)請(qǐng)求以獲 得相應(yīng)的在線電子書(shū)內(nèi)容的步驟中,由于包括播放文件獲取模塊801、播放文件判斷模塊 802以及播放器設(shè)置模塊803的在線文檔閱讀裝置嵌入到瀏覽器中,因此,相應(yīng)的在線電子 書(shū)可被發(fā)送至嵌入到瀏覽器中的在線文檔閱讀裝置,在線文檔閱讀裝置的播放文件獲取模塊801可獲取到播放文件(即前述的相應(yīng)的在線電子書(shū)內(nèi)容),并利用播放文件判斷模塊 802判斷該播放文件的格式,在判斷到該播放文件格式為純文本格式文檔格式時(shí),可將播放 文件發(fā)送至純文本播放器131進(jìn)行在線播放,而在判斷到該播放文件格式為非純文本格式 文檔格式時(shí),可將播放文件發(fā)送至非純文本播放器132進(jìn)行在線播放。并且,如上所述,在將為純文本格式文檔的播放文件發(fā)送至純文本播放器131進(jìn) 行在線播放時(shí)及在當(dāng)播放文件判斷模塊802在判斷到電子書(shū)格式為純文本格式文檔格式 時(shí),在線文檔閱讀裝置可利用播放器設(shè)置模塊803對(duì)純文本格式文檔進(jìn)行預(yù)加載、尺寸調(diào) 整、編輯設(shè)置、符號(hào)過(guò)濾、目錄顯示以及無(wú)限下拉設(shè)置等一系列設(shè)置,以充分利用純文本格 式文檔格式小、占用空間不大、便于傳輸以及顯示清晰等優(yōu)點(diǎn),同時(shí)用戶可對(duì)顯示文檔進(jìn)行 編輯,進(jìn)而提升了用戶體驗(yàn)。值得注意的是,本發(fā)明所提及的非純文本格式文檔包括doc文檔、docx文檔、ppt 文檔、PPtx文檔、XSl文檔、xslx文檔、Pdf文檔、VSd文檔、rtf文檔、pps文檔、wps文檔、 et文檔、dps文檔或pot文檔。另外,純文本格式文檔包括txt文檔。另外,本發(fā)明所采用的文件傳輸方式可采用各種現(xiàn)有的傳輸協(xié)議進(jìn)行文件傳輸, 本發(fā)明對(duì)此并不作限制。通過(guò)上述所提供的技術(shù)方案,本發(fā)明提供了一種文檔共享平臺(tái)及文檔共享方法, 其可以充分利用純文本格式文檔相傳輸量小、字體清晰等優(yōu)點(diǎn),并進(jìn)一步提升了用戶的閱 讀體驗(yàn)。以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精 神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明保護(hù)的范圍之內(nèi)。
權(quán)利要求
1.一種文檔共享平臺(tái)的文檔處理方法,其特征在于,包括a.接收用戶上傳文檔;b.對(duì)所述用戶上傳文檔進(jìn)行格式判斷;c.在判斷到所述用戶上傳文檔為純文本格式文檔時(shí),存儲(chǔ)所述純文本格式文檔,在判 斷到所述用戶上傳文檔為非純文本格式文檔時(shí),將所述非純文本格式文檔轉(zhuǎn)換為預(yù)定格式 文檔,并存儲(chǔ)所述預(yù)定格式文檔。
2.根據(jù)權(quán)利要求1所述的文檔處理方法,其特征在于,所述文檔處理方法進(jìn)一步包括 步驟d 將所述純文本格式文檔作為播放文件發(fā)送至瀏覽器,并由純文本播放器進(jìn)行在線 播放。
3.根據(jù)權(quán)利要求2所述的文檔處理方法,其特征在于,所述步驟d進(jìn)一步包括從所述 純文本格式文檔抽取純文本信息,在所述純文本信息與所述純文本格式文檔之間建立索引 關(guān)系。
4.根據(jù)權(quán)利要求3所述的文檔處理方法,其特征在于,所述步驟d進(jìn)一步包括將所述 純文本信息發(fā)送至瀏覽器作為檢索索引以供用戶瀏覽點(diǎn)擊。
5.根據(jù)權(quán)利要求1所述的文檔處理方法,其特征在于,所述步驟c進(jìn)一步包括對(duì)所述 純文本格式文檔進(jìn)行文字編碼格式轉(zhuǎn)換,并存儲(chǔ)轉(zhuǎn)換后的純文本格式文檔。
6.根據(jù)權(quán)利要求1所述的文檔處理方法,其特征在于,所述步驟b進(jìn)一步包括對(duì)所述 用戶上傳文檔進(jìn)行加密判斷,在判斷到所述用戶上傳文檔為加密文檔時(shí),對(duì)所述用戶上傳 文檔進(jìn)行解密處理。
7.根據(jù)權(quán)利要求1所述的文檔處理方法,其特征在于,所述步驟b進(jìn)一步包括判斷所 述用戶上傳文檔是否為已存儲(chǔ)文檔,若為已存儲(chǔ)文檔,則退出。
8.根據(jù)權(quán)利要求1所述的文檔處理方法,其特征在于,所述預(yù)定格式文檔為swf或 html格式文檔,所述文檔處理方法進(jìn)一步包括步驟d 將所述swf或html格式文檔作為播 放文件發(fā)送至瀏覽器,并由flash播放器進(jìn)行在線播放。
9.根據(jù)權(quán)利要求8所述的文檔處理方法,其特征在于,所述步驟c進(jìn)一步包括在判斷 到所述用戶上傳文檔為非純文本格式文檔時(shí),先將所述非純文本格式文檔轉(zhuǎn)換為中間格式 文檔,再將所述中間格式文檔轉(zhuǎn)換為所述SWf或html格式文檔。
10.根據(jù)權(quán)利要求9所述的文檔處理方法,其特征在于,所述中間格式文檔為pdf文檔。
11.根據(jù)權(quán)利要求10所述的文檔處理方法,其特征在于,所述步驟c進(jìn)一步包括對(duì)所 述Pdf格式文檔進(jìn)行截圖處理以獲取截圖,在所述截圖與所述swf或html格式文檔之間建 立索引關(guān)系。
12.根據(jù)權(quán)利要求11所述的文檔處理方法,其特征在于,所述步驟d進(jìn)一步包括將所 述截圖發(fā)送至所述瀏覽器作為檢索索引以供用戶瀏覽點(diǎn)擊。
13.根據(jù)權(quán)利要求10所述的文檔處理方法,其特征在于,所述步驟c進(jìn)一步包括從所 述Pdf格式文檔抽取純文本信息,在所述純文本信息與所述swf或html格式文檔之間建立 索引關(guān)系。
14.根據(jù)權(quán)利要求13所述的文檔處理方法,其特征在于,所述步驟d進(jìn)一步包括將所 述純文本信息發(fā)送至瀏覽器作為檢索索引以供用戶瀏覽點(diǎn)擊。
15.根據(jù)權(quán)利要求1所述的文檔處理方法,其特征在于,所述非純文本格式文檔包括doc文檔、docx文檔、ppt文檔、pptx文檔、xsl文檔、xslx文檔、pdf文檔、vsd文檔、rtf文 檔、pps文檔、wps文檔、et文檔、dps文檔或pot文檔。
16.根據(jù)權(quán)利要求1所述的文檔處理方法,其特征在于,所述純文本格式文檔包括txt 文檔。
17. 一種文檔共享平臺(tái),其特征在于,包括文檔接收模塊,用于接收用戶上傳文檔;文檔處理模塊,包括格式判斷模塊、格式轉(zhuǎn)換模塊以及數(shù)據(jù)庫(kù),所述格式判斷模塊用 于對(duì)所述用戶上傳文檔進(jìn)行格式判斷,在判斷到所述用戶上傳文檔為純文本格式文檔時(shí), 存儲(chǔ)所述純文本格式文檔至所述數(shù)據(jù)庫(kù),在判斷到所述用戶上傳文檔為非純文本格式文檔 時(shí),所述格式轉(zhuǎn)換模塊將所述非純文本格式文檔轉(zhuǎn)換為預(yù)定格式文檔,并存儲(chǔ)所述預(yù)定格 式文檔至所述數(shù)據(jù)庫(kù)。
18.根據(jù)權(quán)利要求17所述的文檔處理平臺(tái),其特征在于,所述文檔處理模塊進(jìn)一步包 括收發(fā)模塊,所述收發(fā)模塊用于將所述純文本格式文檔作為播放文件發(fā)送至瀏覽器,并由 純文本播放器進(jìn)行在線播放。
19.根據(jù)權(quán)利要求18所述的文檔處理平臺(tái),其特征在于,所述文檔處理模塊進(jìn)一步包 括純文本信息抽取模塊,所述純文本信息抽取模塊用于從所述純文本格式文檔抽取純文本 信息,在所述純文本信息與所述純文本格式文檔之間建立索引關(guān)系。
20.根據(jù)權(quán)利要求19所述的文檔處理平臺(tái),其特征在于,所述收發(fā)模塊進(jìn)一步用于將 所述純文本信息發(fā)送至瀏覽器作為檢索索引以供用戶瀏覽點(diǎn)擊。
21.根據(jù)權(quán)利要求17所述的文檔處理平臺(tái),其特征在于,所述格式轉(zhuǎn)換模塊進(jìn)一步用 于對(duì)所述純文本格式文檔進(jìn)行文字編碼格式轉(zhuǎn)換,并存儲(chǔ)轉(zhuǎn)換后的純文本格式文檔。
22.根據(jù)權(quán)利要求17所述的文檔處理平臺(tái),其特征在于,所述文檔處理模塊進(jìn)一步包 括解密模塊,所述解密模塊用于對(duì)所述用戶上傳文檔進(jìn)行加密判斷,在判斷到所述用戶上 傳文檔為加密文檔時(shí),對(duì)所述用戶上傳文檔進(jìn)行解密處理。
23.根據(jù)權(quán)利要求17所述的文檔處理平臺(tái),其特征在于,所述文檔處理模塊進(jìn)一步包 括存儲(chǔ)判斷模塊,所述存儲(chǔ)判斷模塊用于判斷所述用戶上傳文檔是否為已存儲(chǔ)文檔,若為 已存儲(chǔ)文檔,則不處理所述用戶上傳文檔。
24.根據(jù)權(quán)利要求17所述的文檔處理平臺(tái),其特征在于,所述預(yù)定格式文檔為swf或 html格式文檔,所述收發(fā)模塊進(jìn)一步將所述swf或html格式文檔作為播放文件發(fā)送至瀏覽 器,并由flash播放器進(jìn)行在線播放。
25.根據(jù)權(quán)利要求24所述的文檔處理平臺(tái),其特征在于,在所述格式判斷模塊判斷到 所述用戶上傳文檔為非純文本格式文檔時(shí),所述格式轉(zhuǎn)換模塊先將所述非純文本格式文檔 轉(zhuǎn)換為中間格式文檔,再將所述中間格式文檔轉(zhuǎn)換為所述swf或html格式文檔。
26.根據(jù)權(quán)利要求25所述的文檔處理平臺(tái),其特征在于,所述中間格式文檔為pdf文檔。
27.根據(jù)權(quán)利要求26所述的文檔處理平臺(tái),其特征在于,所述文檔處理模塊進(jìn)一步包 括截圖模塊,所述截圖模塊對(duì)所述Pdf格式文檔進(jìn)行截圖處理以獲取截圖,在所述截圖與 所述SWf或html格式文檔之間建立索引關(guān)系。
28.根據(jù)權(quán)利要求27所述的文檔處理平臺(tái),其特征在于,所述收發(fā)模塊進(jìn)一步用于將所述截圖發(fā)送至所述瀏覽器作為檢索索引以供用戶瀏覽點(diǎn)擊。
29.根據(jù)權(quán)利要求26所述的文檔處理平臺(tái),其特征在于,所述文檔處理模塊進(jìn)一步包 括純文本信息抽取模塊,所述純文本信息抽取模塊用于從所述Pdf格式文檔抽取純文本信 息以獲取純文本信息,在所述純文本信息與所述swf或html格式文檔之間建立索引關(guān)系。
30.根據(jù)權(quán)利要求29所述的文檔處理平臺(tái),其特征在于,所述收發(fā)模塊進(jìn)一步用于將 所述純文本信息發(fā)送至瀏覽器作為檢索索引以供用戶瀏覽點(diǎn)擊。
31.根據(jù)權(quán)利要求17所述的文檔處理平臺(tái),其特征在于,所述非純文本格式文檔包括 doc文檔、docx文檔、ppt文檔、pptx文檔、xsl文檔、xslx文檔、pdf文檔、vsd文檔、rtf文 檔、pps文檔、wps文檔、et文檔、dps文檔或pot文檔。
32.根據(jù)權(quán)利要求17所述的文檔處理平臺(tái),其特征在于,所述純文本格式文檔包括txt 文檔。
全文摘要
本發(fā)明提供了一種文檔共享平臺(tái)及文檔處理方法,該方法包括接收用戶上傳文檔;對(duì)用戶上傳文檔進(jìn)行格式判斷;在判斷到用戶上傳文檔為純文本格式文檔時(shí),存儲(chǔ)純文本格式文檔,在判斷到用戶上傳文檔為非純文本格式文檔時(shí),將非純文本格式文檔轉(zhuǎn)換預(yù)定格式文檔,并存儲(chǔ)預(yù)定格式文檔。通過(guò)上述方式,可以充分利用純文本格式文檔相傳輸量小、字體清晰等優(yōu)點(diǎn),并且可提升用戶的閱讀體驗(yàn)。
文檔編號(hào)G06F17/30GK102004779SQ20101055510
公開(kāi)日2011年4月6日 申請(qǐng)日期2010年11月19日 優(yōu)先權(quán)日2010年11月19日
發(fā)明者孫鶴飛, 陳昌兵 申請(qǐng)人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司