檢查文檔樣式的方法及系統(tǒng)的制作方法
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種檢查文檔樣式的方法及系統(tǒng),該方法包括:建立標(biāo)準(zhǔn)文檔樣式模板及樣式描述文件;將文檔導(dǎo)入所述標(biāo)準(zhǔn)文檔樣式模板;根據(jù)所述樣式描述文件提取所述文檔中的自定義樣式列表以及與所述標(biāo)準(zhǔn)文檔樣式模板中的樣式相同的文字格式或段落格式;根據(jù)自定義樣式和格式搜索所述文檔中自定義樣式和格式的文本,并將所述文本轉(zhuǎn)換為模板樣式。利用本發(fā)明,可以在文檔校對(duì)的過(guò)程中快速地對(duì)文本進(jìn)行規(guī)范性校對(duì),降低校對(duì)人員的工作強(qiáng)度,提高出版效率,保證文檔質(zhì)量。
【專(zhuān)利說(shuō)明】檢查文檔樣式的方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及出版【技術(shù)領(lǐng)域】,具體涉及一種檢查文檔樣式的方法及系統(tǒng)。
【背景技術(shù)】
[0002]在圖書(shū)或文件印刷之前,需要對(duì)文檔的格式進(jìn)行校對(duì)。在校對(duì)過(guò)程中,常常面臨的問(wèn)題是校對(duì)員需要逐段逐句核對(duì)文本的樣式,最終規(guī)范化文檔,保證成品質(zhì)量。
[0003]傳統(tǒng)的文檔校對(duì)方法,往往需要大量人工參與,工作效率低,且浪費(fèi)大量人力。
【發(fā)明內(nèi)容】
[0004]本發(fā)明提供一種檢查文檔樣式的方法及系統(tǒng),以提高檢查效率,保證文檔質(zhì)量。
[0005]為此,本發(fā)明提供如下技術(shù)方案:
[0006]一種檢查文檔樣式的方法,包括:
[0007]建立標(biāo)準(zhǔn)文檔樣式模板及樣式描述文件;
[0008]將文檔導(dǎo)入所述標(biāo)準(zhǔn)文檔樣式模板;
[0009]根據(jù)所述樣式描述文件提取所述文檔中的自定義樣式列表以及與所述標(biāo)準(zhǔn)文檔樣式模板中的樣式相同的文字格式或段落格式;
[0010]根據(jù)自定義樣式和格式搜索所述文檔中自定義樣式和格式的文本,并將所述文本轉(zhuǎn)換為模板樣式。
[0011]優(yōu)選地,所述樣式描述文件包括:文檔類(lèi)型及屬性;所述屬性包括:文字屬性和段落屬性。包括字體,字號(hào),顏色,加粗,傾斜,行距,縮進(jìn)等文字屬性。
[0012]優(yōu)選地,所述樣式描述文件為xml格式文件。
[0013]優(yōu)選地,所述方法還包括:
[0014]通過(guò)修改編輯內(nèi)置樣式或新建樣式的方式定義所述標(biāo)準(zhǔn)文檔樣式模板的樣式。
[0015]優(yōu)選地,所述將文檔導(dǎo)入所述標(biāo)準(zhǔn)文檔樣式模板包括:
[0016]通過(guò)代碼方式將所述文檔的內(nèi)容拷貝到所述標(biāo)準(zhǔn)文檔樣式模板中;或者
[0017]通過(guò)代碼將模板附加到該文檔上。
[0018]優(yōu)選地,所述根據(jù)所述樣式描述文件提取所述文檔中的自定義樣式列表以及與所述標(biāo)準(zhǔn)文檔樣式模板中的樣式相同的文字格式或段落格式包括:
[0019]根據(jù)所述文檔格式設(shè)定匹配模板樣式的條件;
[0020]根據(jù)所述條件將所述文檔的使用樣式與所述標(biāo)準(zhǔn)文檔樣式的樣式進(jìn)行對(duì)比,提取所述文檔中的自定義樣式列表以及與所述標(biāo)準(zhǔn)文檔樣式模板中的樣式相同的文字格式或段落格式。
[0021]優(yōu)選地,所述條件包括文字屬性及段落屬性中的一種或多種屬性。
[0022]一種檢查文檔樣式的系統(tǒng),包括:
[0023]模板建立單元,用于建立標(biāo)準(zhǔn)文檔樣式模板及樣式描述文件,
[0024]導(dǎo)入單元,用于將文檔導(dǎo)入所述標(biāo)準(zhǔn)文檔樣式模板;
[0025]提取單元,用于根據(jù)所述樣式描述文件提取所述文檔中的自定義樣式列表以及與所述標(biāo)準(zhǔn)文檔樣式模板中的樣式相同的文字格式或段落格式;
[0026]搜索轉(zhuǎn)換單元,用于根據(jù)自定義樣式和格式搜索所述文檔中自定義樣式和格式的文本,并將所述文本轉(zhuǎn)換為模板樣式。
[0027]優(yōu)選地,所述系統(tǒng)還包括:
[0028]設(shè)置單元,用于通過(guò)修改編輯內(nèi)置樣式或新建樣式的方式定義所述標(biāo)準(zhǔn)文檔樣式模板的樣式。
[0029]優(yōu)選地,所述導(dǎo)入單元,具體用于通過(guò)代碼方式將所述文檔的內(nèi)容拷貝到所述標(biāo)準(zhǔn)文檔樣式模板中;或者通過(guò)代碼將模板附加到該文檔上。
[0030]優(yōu)選地,所述提取單元包括:
[0031]條件設(shè)定子單元,用于根據(jù)所述文檔格式設(shè)定匹配模板樣式的條件;
[0032]提取子單元,用于根據(jù)所述條件將所述文檔的使用樣式與所述標(biāo)準(zhǔn)文檔樣式的樣式進(jìn)行對(duì)比,提取所述文檔中的自定義樣式列表以及與所述標(biāo)準(zhǔn)文檔樣式模板中的樣式相同的文字格式或段落格式。
[0033]本發(fā)明實(shí)施例提供的檢查文檔樣式的方法及系統(tǒng),通過(guò)預(yù)先建立標(biāo)準(zhǔn)文檔樣式模板,將文檔與模板樣式進(jìn)行對(duì)比后,批量替換,極大地降低了人為干預(yù)的成本,自動(dòng)完成批量轉(zhuǎn)換,提高了文檔校對(duì)的效率。本發(fā)明實(shí)施例的方法及系統(tǒng),能夠滿(mǎn)足在文檔校對(duì)的過(guò)程中快速地對(duì)文本規(guī)范性校對(duì),從而降低了校對(duì)人員的工作強(qiáng)度,提高了出版效率。相對(duì)于傳統(tǒng)的校對(duì)方法,時(shí)間短、效率高,準(zhǔn)確性提高。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0034]為了更清楚地說(shuō)明本申請(qǐng)實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明中記載的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,還可以根據(jù)這些附圖獲得其他的附圖。
[0035]圖1是本發(fā)明實(shí)施例檢查文檔樣式的方法的流程圖;
[0036]圖2是本發(fā)明實(shí)施例中定義模板樣式的一種界面示意圖;
[0037]圖3是本發(fā)明實(shí)施例檢查文檔樣式的系統(tǒng)的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0038]為了使本【技術(shù)領(lǐng)域】的人員更好地理解本發(fā)明實(shí)施例的方案,下面結(jié)合附圖和實(shí)施方式對(duì)本發(fā)明實(shí)施例作進(jìn)一步的詳細(xì)說(shuō)明。
[0039]如圖1所示,是本發(fā)明實(shí)施例檢查文檔樣式的方法的流程圖,包括以下步驟:
[0040]步驟101,預(yù)先建立標(biāo)準(zhǔn)文檔樣式模板及樣式描述文件。
[0041]以O(shè)penXMl的Word文檔為例,可以以一個(gè)標(biāo)準(zhǔn)的word文檔作為模板,并通過(guò)修改編輯內(nèi)置樣式或新建樣式的方式來(lái)定義模板樣式,在樣式定義中,包含文字字體,字號(hào),力口粗,傾斜,段落縮進(jìn),段前距,段后距等屬性。所述樣式描述文件可以是xml格式文件,具體可以包括:文檔類(lèi)型及屬性;所述屬性包括:文字屬性和段落屬性。包括字體,字號(hào),顏色,加粗,傾斜,行距,縮進(jìn)等文字屬性。例如,在word文檔中的一種定義模板樣式的界面如圖2所示。
[0042]步驟102,將文檔導(dǎo)入所述標(biāo)準(zhǔn)文檔樣式模板。
[0043]以word文檔為例,文檔導(dǎo)入模板的方式有兩種,一種是通過(guò)代碼或人工的方式直接將文檔內(nèi)容拷貝到模板文件之中,另一種方式可通過(guò)代碼將模板附加到該文檔上。
[0044]步驟103,根據(jù)所述樣式描述文件提取所述文檔中的自定義樣式列表以及與所述標(biāo)準(zhǔn)文檔樣式模板中的樣式相同的文字格式或段落格式。
[0045]可以從當(dāng)前文檔版面內(nèi)容中提取該文檔所使用的所有樣式,通過(guò)與模板中定義的樣式作對(duì)比,提取出文件中模板不存在的自定義樣式。
[0046]具體地,通過(guò)將文檔的使用樣式與預(yù)置的模板樣式做對(duì)比,提取文檔中自定義樣式。識(shí)別模板樣式屬性,通過(guò)選擇字體,字號(hào),顏色,加粗,傾斜,行距,縮進(jìn)等文字屬性及段落屬性中的一種或多種進(jìn)行條件匹配。例如,文本中一段文本使用了同模板樣式“標(biāo)題1”同樣的字體字號(hào),通過(guò)人工很難觀察兩種屬性在界面上不同點(diǎn),但只要通過(guò)檢查模板樣式“標(biāo)題1 ”,同時(shí)匹配檢查條件“字體,字號(hào)”,就能快速地將整篇文檔應(yīng)用了與“標(biāo)題1”相同的字體字號(hào)的文字檢查出來(lái),并批量轉(zhuǎn)換成“標(biāo)題1”,從而完成文檔的快速規(guī)范化。
[0047]提取已使用自定義樣式列表以及與模板樣式相同文字格式或段落格式并進(jìn)行與模板樣式的轉(zhuǎn)換。例如,文檔a與模板擁有相同的樣式“標(biāo)題1”,但兩篇文檔各自所定義的屬性不一致,此時(shí)將文檔內(nèi)容a導(dǎo)入到模板時(shí)會(huì)進(jìn)行樣式的自動(dòng)匹配,文檔a中應(yīng)用了樣式“標(biāo)題1”的文字會(huì)強(qiáng)制轉(zhuǎn)換為模板的樣式。
[0048]在本發(fā)明實(shí)施例中,同時(shí)還支持模糊匹配,導(dǎo)入時(shí)如果模板沒(méi)有樣式“標(biāo)題1”,則會(huì)遍歷模板中的所有樣式,并逐一核對(duì)與當(dāng)前文檔“樣式1”的屬性,選擇屬性相似度最高的樣式進(jìn)行自動(dòng)匹配。這樣,當(dāng)文檔校對(duì)時(shí),能夠降低大量人工干預(yù),提高文檔的校對(duì)效率。
[0049]步驟104,根據(jù)自定義樣式和格式搜索所述文檔中自定義樣式和格式的文本,并將所述文本轉(zhuǎn)換為模板樣式。
[0050]將非模板樣式的文本轉(zhuǎn)換為模板樣式的文本。在實(shí)際應(yīng)用中,可以采用智能轉(zhuǎn)換或人工轉(zhuǎn)換方式,具體地,可以根據(jù)樣式名稱(chēng),或者樣式屬性的相識(shí)度進(jìn)行自動(dòng)匹配,完成轉(zhuǎn)換。人工轉(zhuǎn)換通過(guò)人為干涉,指定匹配規(guī)則后自動(dòng)進(jìn)行樣式轉(zhuǎn)換。
[0051]所述相識(shí)度可以根據(jù)業(yè)務(wù)需要定義,比如字體、字號(hào)相同就可以進(jìn)行轉(zhuǎn)換。
[0052]現(xiàn)有技術(shù)對(duì)文檔樣式的檢查是通過(guò)人工校對(duì)文字及段落的格式、樣式,由于工作量大,在校對(duì)的過(guò)程中很容易出現(xiàn)紕漏,往往需要進(jìn)行多次校對(duì),這樣在整個(gè)文檔的校對(duì)中往往需要耗費(fèi)大量時(shí)間及人力才能保證文檔的準(zhǔn)確性。
[0053]而本發(fā)明實(shí)施例的方法中,通過(guò)預(yù)先建立標(biāo)準(zhǔn)文檔樣式模板,將文檔與模板樣式進(jìn)行對(duì)比后,批量替換,極大地降低了人為干預(yù)的成本,自動(dòng)完成批量轉(zhuǎn)換,提高了文檔校對(duì)的效率。
[0054]本發(fā)明實(shí)施例的方法,能夠滿(mǎn)足在文檔校對(duì)的過(guò)程中快速地對(duì)文本規(guī)范性校對(duì),從而降低了校對(duì)人員的工作強(qiáng)度,提高了出版效率。相對(duì)于傳統(tǒng)的校對(duì)方法,時(shí)間短、效率高,準(zhǔn)確性提高。
[0055]相應(yīng)地,本發(fā)明實(shí)施例還提供了一種檢查文檔樣式的系統(tǒng),如圖3所示,是該系統(tǒng)的一種結(jié)構(gòu)示意圖。
[0056]在該實(shí)施例中,所述系統(tǒng)包括:
[0057]模板建立單元301,用于建立標(biāo)準(zhǔn)文檔樣式模板及樣式描述文件。
[0058]導(dǎo)入單元302,用于將文檔導(dǎo)入所述標(biāo)準(zhǔn)文檔樣式模板。
[0059]提取單元303,用于根據(jù)所述樣式描述文件提取所述文檔中的自定義樣式列表以及與所述標(biāo)準(zhǔn)文檔樣式模板中的樣式相同的文字格式或段落格式。
[0060]搜索轉(zhuǎn)換單元304,用于根據(jù)自定義樣式和格式搜索所述文檔中自定義樣式和格式的文本,并將所述文本轉(zhuǎn)換為模板樣式。
[0061]具體地,搜索轉(zhuǎn)換單元304可以從文檔版面內(nèi)容中提取該文檔所使用的所有樣式,通過(guò)與標(biāo)準(zhǔn)文檔樣式模板中定義的樣式作對(duì)比,從而提取出文檔中標(biāo)準(zhǔn)文檔樣式模板不存在的自定義樣式。同樣,通過(guò)對(duì)文檔版面內(nèi)容文字的格式與標(biāo)準(zhǔn)文檔樣式模板中定義樣式的文字格式進(jìn)行比較,從而提取出未使用標(biāo)準(zhǔn)文檔樣式模板定義的樣式但使用了與模板樣式相同文字或段落格式的文檔文本。然后,將應(yīng)用了非模板樣式或格式的文本轉(zhuǎn)換為模板樣式。
[0062]需要說(shuō)明的是,上述導(dǎo)入單元302具體可以通過(guò)代碼方式將所述文檔的內(nèi)容拷貝到所述標(biāo)準(zhǔn)文檔樣式模板中;或者通過(guò)代碼將模板附加到該文檔上。
[0063]上述提取單元303的一種具體實(shí)現(xiàn)方式包括:條件設(shè)定子單元和提取子單元(未圖示)。其中:
[0064]條件設(shè)定子單元,用于根據(jù)所述文檔格式設(shè)定匹配模板樣式的條件;所述條件可以是字體,字號(hào),顏色,加粗,傾斜,行距,縮進(jìn)等文字屬性及段落屬性中的一種或多種條件。
[0065]提取子單元,用于根據(jù)所述條件將所述文檔的使用樣式與所述標(biāo)準(zhǔn)文檔樣式的樣式進(jìn)行對(duì)比,提取所述文檔中的自定義樣式列表以及與所述標(biāo)準(zhǔn)文檔樣式模板中的樣式相同的文字格式或段落格式。
[0066]本發(fā)明實(shí)施例的系統(tǒng)中,通過(guò)預(yù)先建立標(biāo)準(zhǔn)文檔樣式模板,將文檔與模板樣式進(jìn)行對(duì)比后,批量替換,極大地降低了人為干預(yù)的成本,自動(dòng)完成批量轉(zhuǎn)換,提高了文檔校對(duì)的效率。
[0067]本發(fā)明實(shí)施例的系統(tǒng),能夠滿(mǎn)足在文檔校對(duì)的過(guò)程中快速地對(duì)文本規(guī)范性校對(duì),從而降低了校對(duì)人員的工作強(qiáng)度,提高了出版效率。相對(duì)于傳統(tǒng)的校對(duì)方法,時(shí)間短、效率高,準(zhǔn)確性提高。
[0068]為了進(jìn)一步方便用戶(hù)的使用,使用戶(hù)可以根據(jù)文檔實(shí)際排版需要自定義標(biāo)準(zhǔn)文檔樣式模板的樣式,在本發(fā)明系統(tǒng)的另一實(shí)施例中,所述系統(tǒng)還可包括:設(shè)置單元(未圖示),用于通過(guò)修改編輯內(nèi)置樣式或新建樣式的方式定義所述標(biāo)準(zhǔn)文檔樣式模板的樣式。
[0069]利用本發(fā)明實(shí)施例檢查文檔樣式的方法及系統(tǒng),提高了文檔的格式及樣式校對(duì)效率,校對(duì)過(guò)程中,無(wú)需逐行逐段核對(duì),可以批量實(shí)現(xiàn)文檔的規(guī)范化。
[0070]本說(shuō)明書(shū)中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,各個(gè)實(shí)施例之間相同相似的部分互相參見(jiàn)即可,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處。尤其,對(duì)于系統(tǒng)實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述得比較簡(jiǎn)單,相關(guān)之處參見(jiàn)方法實(shí)施例的部分說(shuō)明即可。以上所描述的系統(tǒng)實(shí)施例僅僅是示意性的,其中所述作為分離部件說(shuō)明的單元可以是或者也可以不是物理上分開(kāi)的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部模塊來(lái)實(shí)現(xiàn)本實(shí)施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動(dòng)的情況下,即可以理解并實(shí)施。
[0071]以上對(duì)本發(fā)明實(shí)施例進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了【具體實(shí)施方式】對(duì)本發(fā)明進(jìn)行了闡述,以上實(shí)施例的說(shuō)明只是用于幫助理解本發(fā)明的方法及設(shè)備;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在【具體實(shí)施方式】及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說(shuō)明書(shū)內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。
【權(quán)利要求】
1.一種檢查文檔樣式的方法,其特征在于,包括: 建立標(biāo)準(zhǔn)文檔樣式模板及樣式描述文件; 將文檔導(dǎo)入所述標(biāo)準(zhǔn)文檔樣式模板; 根據(jù)所述樣式描述文件提取所述文檔中的自定義樣式列表以及與所述標(biāo)準(zhǔn)文檔樣式模板中的樣式相同的文字格式或段落格式; 根據(jù)自定義樣式和格式搜索所述文檔中自定義樣式和格式的文本,并將所述文本轉(zhuǎn)換為模板樣式。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述樣式描述文件包括:文檔類(lèi)型及屬性;所述屬性包括:文字屬性和段落屬性。包括字體,字號(hào),顏色,加粗,傾斜,行距,縮進(jìn)等文字屬性。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述樣式描述文件為xml格式文件。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括: 通過(guò)修改編輯內(nèi)置樣式或新建樣式的方式定義所述標(biāo)準(zhǔn)文檔樣式模板的樣式。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將文檔導(dǎo)入所述標(biāo)準(zhǔn)文檔樣式模板包括: 通過(guò)代碼方式將所述文檔的內(nèi)容拷貝到所述標(biāo)準(zhǔn)文檔樣式模板中;或者 通過(guò)代碼將模板附加到該文檔上。
6.根據(jù)權(quán)利要求1至5任一項(xiàng)所述的方法,其特征在于,所述根據(jù)所述樣式描述文件提取所述文檔中的自定義樣式列表以及與所述標(biāo)準(zhǔn)文檔樣式模板中的樣式相同的文字格式或段落格式包括: 根據(jù)所述文檔格式設(shè)定匹配模板樣式的條件; 根據(jù)所述條件將所述文檔的使用樣式與所述標(biāo)準(zhǔn)文檔樣式的樣式進(jìn)行對(duì)比,提取所述文檔中的自定義樣式列表以及與所述標(biāo)準(zhǔn)文檔樣式模板中的樣式相同的文字格式或段落格式。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述條件包括文字屬性及段落屬性中的一種或多種屬性。
8.—種檢查文檔樣式的系統(tǒng),其特征在于,包括: 模板建立單元,用于建立標(biāo)準(zhǔn)文檔樣式模板及樣式描述文件, 導(dǎo)入單元,用于將文檔導(dǎo)入所述標(biāo)準(zhǔn)文檔樣式模板; 提取單元,用于根據(jù)所述樣式描述文件提取所述文檔中的自定義樣式列表以及與所述標(biāo)準(zhǔn)文檔樣式模板中的樣式相同的文字格式或段落格式; 搜索轉(zhuǎn)換單元,用于根據(jù)自定義樣式和格式搜索所述文檔中自定義樣式和格式的文本,并將所述文本轉(zhuǎn)換為模板樣式。
9.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括: 設(shè)置單元,用于通過(guò)修改編輯內(nèi)置樣式或新建樣式的方式定義所述標(biāo)準(zhǔn)文檔樣式模板的樣式。
10.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于, 所述導(dǎo)入單元,具體用于通過(guò)代碼方式將所述文檔的內(nèi)容拷貝到所述標(biāo)準(zhǔn)文檔樣式模板中;或者通過(guò)代碼將模板附加到該文檔上。
11.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于,所述提取單元包括: 條件設(shè)定子單元,用于根據(jù)所述文檔格式設(shè)定匹配模板樣式的條件; 提取子單元,用于根據(jù)所述條件將所述文檔的使用樣式與所述標(biāo)準(zhǔn)文檔樣式的樣式進(jìn)行對(duì)比,提取所述文檔中的自定義樣式列表以及與所述標(biāo)準(zhǔn)文檔樣式模板中的樣式相同的文字格式或段落格式。
【文檔編號(hào)】G06F17/21GK104346319SQ201310337497
【公開(kāi)日】2015年2月11日 申請(qǐng)日期:2013年8月5日 優(yōu)先權(quán)日:2013年8月5日
【發(fā)明者】楊勇 申請(qǐng)人:北大方正集團(tuán)有限公司, 方正信息產(chǎn)業(yè)控股有限公司, 北京北大方正電子有限公司