專利名稱:文件轉(zhuǎn)換系統(tǒng)與方法
技術(shù)領(lǐng)域:
本發(fā)明是關(guān)于一種文件格式轉(zhuǎn)換技術(shù),特別是一種可自動(dòng)將Word格式文件轉(zhuǎn)換為可延伸性標(biāo)示語言格式文件的技術(shù)。
背景技術(shù):
隨著信息時(shí)代的到來,不同的企業(yè)、用戶之間所需要進(jìn)行信息的交流頻率越來越多,但是不同的企業(yè)、不同的用戶之間由于使用習(xí)慣和軟件的不同,造成文件的格式不一,從而在進(jìn)行文件交換時(shí)造成不便。
現(xiàn)有技術(shù)中已有一些關(guān)于文件格式的轉(zhuǎn)換方法,如中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局于2000年12月6日公開的公開號(hào)為CN 1275752A的名稱為“網(wǎng)際網(wǎng)絡(luò)上數(shù)據(jù)庫(kù)的自動(dòng)轉(zhuǎn)換存儲(chǔ)的方法與系統(tǒng)”的專利申請(qǐng)案,該申請(qǐng)案揭露了一種可以將網(wǎng)際網(wǎng)絡(luò)用戶上傳的文件轉(zhuǎn)換為數(shù)據(jù)庫(kù)規(guī)定格式的文件進(jìn)行存儲(chǔ)的方法。該方法將用戶上傳的文件進(jìn)行檢查與解析,然后重新排序組成固定格式的文件。該方法雖然可以進(jìn)行文件格式的轉(zhuǎn)換,但是只能轉(zhuǎn)換為該數(shù)據(jù)庫(kù)所規(guī)定的格式,局限性較大,而且還將用戶的文件重新拆分,不能保持文件的一致性與完整性。
再如中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局于2001年9月26日公開的公開號(hào)為CN1314634A的名稱為“文件轉(zhuǎn)換方法、文件轉(zhuǎn)換器、以及文件顯示系統(tǒng)”的專利申請(qǐng)案,該申請(qǐng)案涉及一種文件轉(zhuǎn)換方法,該文件轉(zhuǎn)換方法首先從由多個(gè)數(shù)據(jù)段組成的一個(gè)文件中提取部分?jǐn)?shù)據(jù),然后將該部分?jǐn)?shù)據(jù)顯示在一個(gè)有限顯示能力的裝置上進(jìn)行顯示。該申請(qǐng)案的不足在于其只能在一個(gè)能力有限的顯示裝置上顯示部分?jǐn)?shù)據(jù),不能顯示完整的數(shù)據(jù),且只能應(yīng)用在網(wǎng)際網(wǎng)絡(luò)瀏覽器上的超文本鏈接標(biāo)示語言(Hypertext Markup Language,HTML)上,而不能將文本格式文件轉(zhuǎn)換為XML格式的文件,局限性較大,。
再一例子如中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局于2003年3月19日公開的公開號(hào)為CN 1403950A的名稱為“電子文件自動(dòng)轉(zhuǎn)換發(fā)送的系統(tǒng)與方法”的專利申請(qǐng)案,該申請(qǐng)案揭露一種電子文件的轉(zhuǎn)換方法,其可以將文件的編碼信息進(jìn)行轉(zhuǎn)換,例如將簡(jiǎn)體中文轉(zhuǎn)換為繁體中文,或者將繁體中文轉(zhuǎn)換為簡(jiǎn)體中文。該專利申請(qǐng)案的不足在于其只是進(jìn)行文字編碼的轉(zhuǎn)換,而不能將文本格式文件轉(zhuǎn)換為XML格式的文件。
最后一個(gè)例子如中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局于1998年4月15日公開的公開號(hào)為CN 1178948A的名稱為“文件格式轉(zhuǎn)換方法”的專利申請(qǐng)案,該申請(qǐng)案所揭露的技術(shù)可將個(gè)人計(jì)算機(jī)(Personal Computer,PC)或筆記型計(jì)算機(jī)(Notebook Personal Computer)上的文件資源轉(zhuǎn)換為一種可被袖珍型個(gè)人計(jì)算機(jī)如CD機(jī)可讀取的格式。該專利申請(qǐng)案所揭露技術(shù)的不足同樣在于不能將文本格式文件轉(zhuǎn)換為XML格式的文件。
但是,在某些場(chǎng)合需要提交一種固定格式的文件,在這種情況下,用戶往往需要重新進(jìn)行文件的重新錄入與編輯,從而浪費(fèi)用戶時(shí)間,造成不必要的工作量。
發(fā)明內(nèi)容本發(fā)明的要目的在于提供一種文件轉(zhuǎn)換方法,其能將用戶編輯過的Word格式的文件轉(zhuǎn)換為XML格式的文件,滿足用戶的不同需要。
本發(fā)明提供一種文件轉(zhuǎn)換系統(tǒng),該文件轉(zhuǎn)換系統(tǒng)包括多個(gè)客戶端計(jì)算機(jī),一網(wǎng)絡(luò)、一應(yīng)用程序服務(wù)器、一文件接收服務(wù)器及一數(shù)據(jù)庫(kù)。每一客戶端計(jì)算機(jī)均提供一圖形用戶接口,用于進(jìn)行文件編輯,當(dāng)需要進(jìn)行文件編輯時(shí),客戶端計(jì)算機(jī)發(fā)出一文件傳輸請(qǐng)求。數(shù)據(jù)庫(kù)中存儲(chǔ)有各種格式的文件,包括Word格式的文件,同時(shí),在該數(shù)據(jù)庫(kù)中亦存儲(chǔ)有文件的摘要信息。應(yīng)用程序服務(wù)器用于接收客戶端計(jì)算機(jī)發(fā)送的文件傳輸請(qǐng)求,傳輸對(duì)應(yīng)文件,執(zhí)行文件格式檢查,分析文件內(nèi)容,并進(jìn)行格式轉(zhuǎn)換,執(zhí)行文件合并作業(yè)。應(yīng)用程序服務(wù)器包括一傳輸請(qǐng)求接收模塊,用于接收客戶端計(jì)算機(jī)發(fā)出的文件傳輸請(qǐng)求;一文件獲取模塊,用于依據(jù)文件傳輸請(qǐng)求從數(shù)據(jù)庫(kù)中獲取對(duì)應(yīng)的文件;一文件檢查模塊,用于對(duì)獲取的文件格式進(jìn)行檢查,包括文件格式的識(shí)別和檢查,判斷該文件的格式是否為Word格式;一文件分析模塊,用于對(duì)獲取的文件內(nèi)容進(jìn)行分析,從而得到該文件不同的段落,例如摘要段落、正文段落、詳細(xì)描述段落等;一格式轉(zhuǎn)換模塊,用于將Word格式的文件轉(zhuǎn)換為XML格式的文件,該格式轉(zhuǎn)換模塊通過一后臺(tái)運(yùn)行的程序執(zhí)行文件格式轉(zhuǎn)換,該后臺(tái)運(yùn)行程序由Visual Basic程序編寫語言編寫;一文件合并模塊,用于將轉(zhuǎn)換后的XML格式文件與Word文件的附加圖檔合并,構(gòu)成一個(gè)完整的XML文件。文件接收服務(wù)器用于接收從應(yīng)用程序服務(wù)器傳輸?shù)奈募?,該文件為?jīng)過格式轉(zhuǎn)換后的XML格式文件。
本發(fā)明還提供一種文件轉(zhuǎn)換方法,其能將用戶編輯過的Word格式的文件轉(zhuǎn)換為XML格式的文件,該文件轉(zhuǎn)換方法包括如下步驟發(fā)出文件傳輸請(qǐng)求;獲得對(duì)應(yīng)文件;檢查文件格式,判斷該文件的格式是否為Word格式;若經(jīng)過判斷得出該文件為Word格式文件,則將輸入文件轉(zhuǎn)換為XML格式文件;合并該可延伸性標(biāo)示語言文件與圖檔;返回完整的XML格式文件。若判斷得出該文件格式為其它非Word格式的文件,則直接結(jié)束操作流程。
通過本發(fā)明提供的文件轉(zhuǎn)換系統(tǒng)與方法,可實(shí)現(xiàn)將用戶的Word格式文件轉(zhuǎn)換為XML格式的文件。
圖1是本發(fā)明文件轉(zhuǎn)換系統(tǒng)的實(shí)施環(huán)境圖。
圖2是本發(fā)明文件轉(zhuǎn)換系統(tǒng)應(yīng)用程序服務(wù)器的功能模塊圖。
圖3是本發(fā)明文件轉(zhuǎn)換系統(tǒng)的數(shù)據(jù)庫(kù)中摘要信息表示意圖。
圖4是本發(fā)明文件轉(zhuǎn)換系統(tǒng)與方法的文件轉(zhuǎn)換與合并流程圖。
具體實(shí)施方式參閱圖1所示,是本發(fā)明文件轉(zhuǎn)換系統(tǒng)的實(shí)施環(huán)境圖。該文件轉(zhuǎn)換系統(tǒng)包括多個(gè)客戶端計(jì)算機(jī)10,一網(wǎng)絡(luò)11、一應(yīng)用程序服務(wù)器12、一數(shù)據(jù)庫(kù)13及一文件接收服務(wù)器14。每一客戶端計(jì)算機(jī)10均提供一圖形用戶接口(圖中未示出),用于進(jìn)行文件編輯,當(dāng)需要進(jìn)行文件編輯時(shí),客戶端計(jì)算機(jī)發(fā)出一文件傳輸請(qǐng)求(圖中未示出),該文件傳輸請(qǐng)求被傳輸?shù)綉?yīng)用程序服務(wù)器12。數(shù)據(jù)庫(kù)13中存儲(chǔ)有各種格式的文件,包括Word格式的文件,同時(shí),在該數(shù)據(jù)庫(kù)13中亦存儲(chǔ)有該文件的摘要信息。應(yīng)用程序服務(wù)器12用于接收客戶端計(jì)算機(jī)發(fā)送的文件傳輸請(qǐng)求,執(zhí)行文件格式轉(zhuǎn)換,該應(yīng)用程序服務(wù)器12位于文件發(fā)送方。文件接收服務(wù)器14用于接收從應(yīng)用程序服務(wù)器12傳輸?shù)奈募撐募榻?jīng)過格式轉(zhuǎn)換后的XML格式文件,該文件接收服務(wù)器14位于文件接收方。
參閱圖2所示,是本發(fā)明文件轉(zhuǎn)換系統(tǒng)應(yīng)用程序服務(wù)器的功能模塊圖。該應(yīng)用程序服務(wù)器12為文件格式轉(zhuǎn)換的控制中心,其接收從客戶端計(jì)算機(jī)10傳輸?shù)奈募鬏斦?qǐng)求,該應(yīng)用程序服務(wù)器12包括一傳輸請(qǐng)求接收模塊121、一文件獲取模塊122、一文件檢查模塊123、一文件分析模塊124、一格式轉(zhuǎn)換模塊125及一文件合并模塊126。傳輸請(qǐng)求接收模塊121用于接收客戶端計(jì)算機(jī)10傳輸?shù)奈募鬏斦?qǐng)求。文件獲取模塊122用于依據(jù)文件傳輸請(qǐng)求從數(shù)據(jù)庫(kù)13中獲得對(duì)應(yīng)的文件。
文件檢查模塊123用于對(duì)數(shù)據(jù)庫(kù)13中儲(chǔ)存的文件格式進(jìn)行檢查,包括文件格式的識(shí)別和檢查,判斷該文件是否為Word格式的文件。文件分析模塊124用于對(duì)獲得的文件內(nèi)容進(jìn)行分析,從而得到該文件不同的段落,例如摘要段落、正文段落、詳細(xì)描述段落等。格式轉(zhuǎn)換模塊125用于執(zhí)行文件格式轉(zhuǎn)換,將Word格式的文件轉(zhuǎn)換為XML格式的文件,該格式轉(zhuǎn)換模塊通過一后臺(tái)運(yùn)行的程序執(zhí)行文件格式轉(zhuǎn)換,該后臺(tái)運(yùn)行程序由Visual Basic程序編寫語言編寫。
文件合并模塊126用于將轉(zhuǎn)換后的XML格式文件與Word文件的附加圖檔合并,構(gòu)成一個(gè)完整的XML文件,該附加圖檔為Word文件內(nèi)附加的圖檔,該圖檔的格式可為標(biāo)簽圖像文件格式(Tagged Image File,TIF)、標(biāo)記圖像文件格式(Tagged Image File Format,TIFF)位圖文件(BitMap,BMP)、圖像交換格式(Graphics lnterchange Format,GIF)、聯(lián)合圖形圖像專家組(Joint Photo Graphic Experts Group,JPEG)等格式。
參閱圖3所示,是本發(fā)明文件轉(zhuǎn)換系統(tǒng)的數(shù)據(jù)庫(kù)中摘要信息表示意圖。該摘要信息為數(shù)據(jù)庫(kù)13中非結(jié)構(gòu)化資料的摘要信息300,該摘要信息300包括資料編號(hào)301、資料標(biāo)題302、資料位置303、資料目錄304及轉(zhuǎn)換日期305。資料編號(hào)301為一資料標(biāo)示編號(hào),用于應(yīng)用程序服務(wù)器12識(shí)別文件之用,該資料編號(hào)為順序編號(hào),且在數(shù)據(jù)庫(kù)13中有序排列。資料標(biāo)題302為各種非結(jié)構(gòu)化資料的標(biāo)題,包括文件標(biāo)題、圖像標(biāo)題、聲音標(biāo)題及影像標(biāo)題。資料位置303用于記錄數(shù)據(jù)庫(kù)13中不同的非結(jié)構(gòu)化資料的存儲(chǔ)位置,該存儲(chǔ)位置表明了某項(xiàng)數(shù)據(jù)的詳細(xì)儲(chǔ)存位置,例如文件123.doc的數(shù)據(jù)位置為C\Winnt\System32\123.doc。資料目錄304記錄某項(xiàng)資料的儲(chǔ)存目錄,轉(zhuǎn)換日期305記錄Word格式文件轉(zhuǎn)換為XML格式文件的轉(zhuǎn)換日期。
參閱圖4所示,是本發(fā)明文件轉(zhuǎn)換系統(tǒng)與方法的文件轉(zhuǎn)換與合并流程圖。首先,傳輸請(qǐng)求接收模塊121接收客戶端計(jì)算機(jī)10發(fā)出的文件傳輸請(qǐng)求(步驟S40);接著由文件獲取模塊122透過網(wǎng)絡(luò)11從數(shù)據(jù)庫(kù)13獲取對(duì)應(yīng)的文件(步驟S41),文件檢查模塊123對(duì)上述所獲得的文件執(zhí)行格式識(shí)別與檢查(步驟S42);判斷該文件格式是否為Word格式(步驟S43);若經(jīng)過檢查,判斷該文件格式為非Word格式文件,則直接結(jié)束轉(zhuǎn)換流程。若經(jīng)過檢查,判斷該文件確為Word文件,則由文件分析模塊124執(zhí)行文件內(nèi)容識(shí)別,從而得到該文件的不同段落,例如摘要段落、正文段落、詳細(xì)描述段落等,接著由格式轉(zhuǎn)換模塊125將該文件從Word格式轉(zhuǎn)換為XML格式(步驟S44)。上述的格式轉(zhuǎn)換模塊125執(zhí)行包括如下步驟首先,由格式轉(zhuǎn)換模塊125根據(jù)上述的分析結(jié)果設(shè)定XML文件中對(duì)應(yīng)段落,將該Word文件中每一資料標(biāo)題下對(duì)應(yīng)段落文字復(fù)制并粘貼到XML格式文件中對(duì)應(yīng)的資料標(biāo)題段落下,完成文件格式轉(zhuǎn)換,上述步驟S44中文件格式轉(zhuǎn)換在一后臺(tái)運(yùn)行程序的控制下完成,該后臺(tái)運(yùn)行程序用Visual Basic語言編寫。接著由文件合并模塊126將轉(zhuǎn)換后的XML格式文件與Word文件中的圖像進(jìn)行合并,以構(gòu)成一個(gè)完整的XML文件(步驟S45),最后返回該XML文件到客戶端計(jì)算機(jī)10(步驟S46),流程結(jié)束。
權(quán)利要求
1.一種文件轉(zhuǎn)換系統(tǒng),該文件轉(zhuǎn)換系統(tǒng)可將Word格式文件轉(zhuǎn)換為可延伸性標(biāo)示語言格式文件,其特征在于,包括多個(gè)客戶端計(jì)算機(jī),用于發(fā)出文件傳輸請(qǐng)求;一數(shù)據(jù)庫(kù),其中存儲(chǔ)不同格式的文件;一應(yīng)用程序服務(wù)器,包括一傳輸請(qǐng)求接收模塊,用于接收客戶端計(jì)算機(jī)發(fā)送的文件傳輸請(qǐng)求;一文件獲取模塊,用于根據(jù)文件傳輸請(qǐng)求獲得所需傳輸?shù)奈募灰晃募z查模塊,用于對(duì)上述所獲得的文件進(jìn)行文件格式的識(shí)別和檢查;一文件分析模塊,用于對(duì)經(jīng)過文件格式檢查后的文件內(nèi)容進(jìn)行分析,獲得該文件不同的段落;一格式轉(zhuǎn)換模塊,用于將經(jīng)過文件內(nèi)容分析后的Word格式文件轉(zhuǎn)換為可延伸性標(biāo)示語言格式的文件;一文件合并模塊,用于將轉(zhuǎn)換后的可延伸性標(biāo)示語言格式文件與Word格式文件中的圖檔合并,構(gòu)成一個(gè)完整的可延伸性標(biāo)示語言格式文件;一文件接收服務(wù)器,用于接收從應(yīng)用程序服務(wù)器傳輸?shù)目裳由煨詷?biāo)示語言格式文件。
2.如權(quán)利要求1所述的文件轉(zhuǎn)換系統(tǒng),其特征在于,其中的數(shù)據(jù)庫(kù)中存儲(chǔ)的不同格式文件包括Word格式的文件。
3.如權(quán)利要求1所述的文件轉(zhuǎn)換系統(tǒng),其特征在于,其中的格式轉(zhuǎn)換模塊在一后臺(tái)運(yùn)行程序的控制下完成格式轉(zhuǎn)換,該后臺(tái)運(yùn)行程序用Visual Basic語言編寫。
4.一種文件轉(zhuǎn)換方法,該文件轉(zhuǎn)換方法可將Word格式文件轉(zhuǎn)換為可延伸性標(biāo)示語言格式文件,其特征在于,包括以下步驟發(fā)出文件傳輸請(qǐng)求;獲取對(duì)應(yīng)文件;檢查文件格式,判斷該文件的格式是否為Word格式;若判斷得出該文件確實(shí)為Word格式文件,則將輸入文件轉(zhuǎn)換為可延伸性標(biāo)示語言格式文件,合并該可延伸性標(biāo)示語言格式文件與圖檔,返回完整的可延伸性標(biāo)示語言格式文件;若判斷得出該文件格式為其它非Word格式的文件,則直接結(jié)束操作流程。
5.如權(quán)利要求4所述的文件轉(zhuǎn)換方法,其特征在于,其中的圖檔為轉(zhuǎn)換的Word文件中所包含的圖檔。
6.如權(quán)利要求4所述的文件轉(zhuǎn)換方法,其特征在于,其中的文件轉(zhuǎn)換操作包括以下步驟根據(jù)文件分析模塊對(duì)所獲取文件的分析結(jié)果設(shè)定可延伸性標(biāo)示語言格式文件中對(duì)應(yīng)的段落;將該文件中不同資料標(biāo)題下對(duì)應(yīng)段落文字復(fù)制并粘貼到可延伸性標(biāo)示語言格式文件中對(duì)應(yīng)的資料標(biāo)題段落下,完成文件格式轉(zhuǎn)換。
全文摘要
本發(fā)明提供一種文件轉(zhuǎn)換系統(tǒng)與方法。該文件轉(zhuǎn)換系統(tǒng)包括多個(gè)客戶端計(jì)算機(jī)、一應(yīng)用程序服務(wù)器、一文件接收服務(wù)器及一數(shù)據(jù)庫(kù)。該文件轉(zhuǎn)換方法包括以下步驟發(fā)出文件傳輸請(qǐng)求;獲取對(duì)應(yīng)文件;檢查和判斷文件格式;將輸入文件轉(zhuǎn)換為可延伸性標(biāo)示語言格式文件;合并該可延伸性標(biāo)示語言格式文件與圖檔;返回完整的可延伸性標(biāo)示語言格式文件。通過本發(fā)明提供的文件轉(zhuǎn)換系統(tǒng)及方法,可將Word格式文件轉(zhuǎn)換為可延伸性標(biāo)示語言格式文件,提高用戶工作效率。
文檔編號(hào)G06F17/27GK1627288SQ20031011258
公開日2005年6月15日 申請(qǐng)日期2003年12月10日 優(yōu)先權(quán)日2003年12月10日
發(fā)明者李忠一, 林海洪, 羅寶勝 申請(qǐng)人:鴻富錦精密工業(yè)(深圳)有限公司, 鴻海精密工業(yè)股份有限公司