本發(fā)明屬于pdf解析,具體地說,是涉及一種在pdf轉(zhuǎn)word過程中處理圖片環(huán)繞模式和環(huán)繞邊距的方法、裝置及介質(zhì)。
背景技術(shù):
1、處理pdf文件至word文檔時,由于pdf和word在文件結(jié)構(gòu)和內(nèi)容表達(dá)上的差別,尤其是含有圖片的pdf文檔,圖片的環(huán)繞方式及環(huán)繞邊距對轉(zhuǎn)換過程產(chǎn)生挑戰(zhàn),而現(xiàn)有技術(shù)中,未有在pdf轉(zhuǎn)word過程中處理圖片環(huán)繞模式和環(huán)繞邊距的技術(shù)先例。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于提供一種在pdf轉(zhuǎn)word過程中處理圖片環(huán)繞模式和環(huán)繞邊距的方法,以解決現(xiàn)有技術(shù)所存在的技術(shù)問題。
2、為了實(shí)現(xiàn)上述目的,本發(fā)明采取的技術(shù)方案如下:
3、一種在pdf轉(zhuǎn)word過程中處理圖片環(huán)繞模式和環(huán)繞邊距的方法,包括以下步驟:
4、步驟1:使用apache的開源pdfbox框架,對包含圖片和文字的pdf文件進(jìn)行解析;;
5、步驟2:遍歷解析得到的所有圖片信息,在每次遍歷中獲取當(dāng)前處理的圖片的四個角坐標(biāo)點(diǎn);
6、步驟3:根據(jù)所述四個角坐標(biāo)點(diǎn),獲取與當(dāng)前處理的圖片上方、下方、左方、右方和相交的元素列表;
7、步驟4:對圖片的環(huán)繞方式進(jìn)行識別和設(shè)置:
8、(41)如果相交的元素列表不為空,則將圖片設(shè)置為懸浮于文字上方環(huán)繞模式;
9、(42)如果圖片上方和下方存在元素而左右方不存在,將圖片設(shè)置為上下環(huán)繞模式,并計算上下的環(huán)繞邊距,將計算得到的環(huán)繞邊距設(shè)置到圖片對象中;
10、(43)如果圖片左方或右方存在元素,根據(jù)元素是否在同一行進(jìn)行判斷:如果是同一行,則將圖片設(shè)置為嵌入式環(huán)繞;如果不是同一行,將圖片設(shè)置為四周環(huán)繞,并計算環(huán)繞邊距,將計算得到的環(huán)繞邊距設(shè)置到圖片對象中;
11、步驟s5:保存設(shè)置好環(huán)繞方式和環(huán)繞邊距的圖片;
12、步驟s6:重復(fù)執(zhí)行步驟3~步驟5,直至所有圖片處理完畢。
13、優(yōu)選的,所述(42)中計算上下的環(huán)繞邊距的方法如下:(421)獲取到當(dāng)前圖片最小y坐標(biāo)值y1與圖片上方元素集合中最大y值y2,計算圖片的上環(huán)繞邊距:|y1-y2|即為上環(huán)繞邊距;(422)獲取到當(dāng)前圖片最大y坐標(biāo)值y1與圖片下方元素集合中最小y值y2,計算圖片的下環(huán)繞邊距:|y2-y1|即為下環(huán)繞邊距。
14、優(yōu)選的,所述(43)中計算環(huán)繞邊距的方法如下:(431)獲取到當(dāng)前圖片最小y坐標(biāo)值y1與圖片上方元素集合中最大y值y2,計算圖片的上環(huán)繞邊距:|y1-y2|即為上環(huán)繞邊距;(432)獲取到當(dāng)前圖片最大y坐標(biāo)值y1與圖片下方元素集合中最小y值y2,計算圖片的下環(huán)繞邊距:|y2-y1|即為下環(huán)繞邊距;(433)獲取到當(dāng)前圖片最小x坐標(biāo)值x1與圖片左側(cè)元素集合中最大x值x2,計算圖片的左環(huán)繞邊距:|x1-x2|即為左環(huán)繞邊距;(434)獲取到當(dāng)前圖片最大x坐標(biāo)值x1與圖片右側(cè)元素集合中最小x值x2,計算圖片的下環(huán)繞邊距:|x2-x1|即為右環(huán)繞邊距。
15、為了實(shí)現(xiàn)上述目的,本發(fā)明還提供了一種計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)程序,所述計算機(jī)程序被處理器執(zhí)行,以實(shí)現(xiàn)所述的在pdf轉(zhuǎn)word過程中處理圖片環(huán)繞模式和環(huán)繞邊距的方法。
16、為了實(shí)現(xiàn)上述目的,本發(fā)明還提供了一種在pdf轉(zhuǎn)word過程中處理圖片環(huán)繞模式和環(huán)繞邊距的裝置,包括:處理器和存儲器;所述存儲器用于存儲計算機(jī)程序;所述處理器與所述存儲器相連,用于執(zhí)行所述存儲器存儲的計算機(jī)程序,以使得所述在pdf轉(zhuǎn)word過程中處理圖片環(huán)繞模式和環(huán)繞邊距的裝置執(zhí)行所述的在pdf轉(zhuǎn)word過程中處理圖片環(huán)繞模式和環(huán)繞邊距的方法。
17、與現(xiàn)有技術(shù)相比,本發(fā)明具備以下有益效果:
18、本發(fā)明通過處理圖片的環(huán)繞方式和計算環(huán)繞邊距,在pdf轉(zhuǎn)為word的過程中能大致保持原文檔的布局和格式,實(shí)現(xiàn)了準(zhǔn)確的格式映射;本發(fā)明不僅處理了上下環(huán)繞和四周環(huán)繞的情況,還針對圖片嵌入行間和圖片懸浮于文字上方的模式進(jìn)行了處理,使其能更全面地應(yīng)對各種環(huán)繞模式的需求;本發(fā)明靈活和全面的處理方式極大地提升了處理效果和用戶體驗(yàn)。
1.一種在pdf轉(zhuǎn)word過程中處理圖片環(huán)繞模式和環(huán)繞邊距的方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的在pdf轉(zhuǎn)word過程中處理圖片環(huán)繞模式和環(huán)繞邊距的方法,其特征在于,所述(42)中計算上下的環(huán)繞邊距的方法如下:(421)獲取到當(dāng)前圖片最小y坐標(biāo)值y1與圖片上方元素集合中最大y值y2,計算圖片的上環(huán)繞邊距:|y1-y2|即為上環(huán)繞邊距;(422)獲取到當(dāng)前圖片最大y坐標(biāo)值y1與圖片下方元素集合中最小y值y2,計算圖片的下環(huán)繞邊距:|y2-y1|即為下環(huán)繞邊距。
3.根據(jù)權(quán)利要求2所述的在pdf轉(zhuǎn)word過程中處理圖片環(huán)繞模式和環(huán)繞邊距的方法,其特征在于,所述(43)中計算環(huán)繞邊距的方法如下:(431)獲取到當(dāng)前圖片最小y坐標(biāo)值y1與圖片上方元素集合中最大y值y2,計算圖片的上環(huán)繞邊距:|y1-y2|即為上環(huán)繞邊距;(432)獲取到當(dāng)前圖片最大y坐標(biāo)值y1與圖片下方元素集合中最小y值y2,計算圖片的下環(huán)繞邊距:|y2-y1|即為下環(huán)繞邊距;(433)獲取到當(dāng)前圖片最小x坐標(biāo)值x1與圖片左側(cè)元素集合中最大x值x2,計算圖片的左環(huán)繞邊距:|x1-x2|即為左環(huán)繞邊距;(434)獲取到當(dāng)前圖片最大x坐標(biāo)值x1與圖片右側(cè)元素集合中最小x值x2,計算圖片的下環(huán)繞邊距:|x2-x1|即為右環(huán)繞邊距。
4.一種計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)程序,其特征在于,所述計算機(jī)程序被處理器執(zhí)行,以實(shí)現(xiàn)如權(quán)利要求1~3中任一項(xiàng)所述的在pdf轉(zhuǎn)word過程中處理圖片環(huán)繞模式和環(huán)繞邊距的方法。
5.一種在pdf轉(zhuǎn)word過程中處理圖片環(huán)繞模式和環(huán)繞邊距的裝置,其特征在于,包括:處理器和存儲器;所述存儲器用于存儲計算機(jī)程序;所述處理器與所述存儲器相連,用于執(zhí)行所述存儲器存儲的計算機(jī)程序,以使得所述在pdf轉(zhuǎn)word過程中處理圖片環(huán)繞模式和環(huán)繞邊距的裝置執(zhí)行如權(quán)利要求1~3中任一項(xiàng)所述的在pdf轉(zhuǎn)word過程中處理圖片環(huán)繞模式和環(huán)繞邊距的方法。