本發(fā)明涉及圖像處理,具體涉及一種圖像傾斜校正方法、裝置、電子設備及存儲介質(zhì)。
背景技術:
1、從復雜文檔中提取特定信息在許多商務活動中尤為重要,例如金融領域中定損照片的信息提取工作。由于商務文檔和模板種類繁多,例如合同、發(fā)票、報告或新聞文章等,因此這是一個關鍵且復雜的過程。
2、在目前文本圖像的文檔信息抽取(document?i?nformat?i?on?extract?i?on,d?ie)過程中,圖像的傾斜可能會影響抽取的難易程度和準確率,圖像的傾斜會影響上下文的坐標關系而減弱上下文關系、且不利于如ocr等算法最大發(fā)揮效果。
3、目前,有不少基于深度學習的算法可以實現(xiàn)大角度的文本圖像傾斜校正(如90°、180°),但對小角度的傾斜(15°以內(nèi))無能為力。
技術實現(xiàn)思路
1、本發(fā)明的目的在于克服上述技術不足,提供一種圖像傾斜校正方法、裝置、電子設備及存儲介質(zhì),解決現(xiàn)有技術中無法對小角度傾斜的圖像進行傾斜校正的技術問題。
2、為達到上述技術目的,本發(fā)明采取了以下技術方案:
3、第一方面,本發(fā)明提供了一種圖像傾斜校正方法,包括如下步驟:
4、獲取待校正圖像,對所述待校正圖像進行預處理,以得到去除陰影圖像;
5、在預設范圍內(nèi),對所述去除陰影圖像進行若干次旋轉(zhuǎn),并計算出每次旋轉(zhuǎn)后所述去除陰影圖像在水平投影上的方差;
6、對計算出的若干個方差進行比較,以得到比較結果;
7、基于所述比較結果,對所述待校正圖像或去除陰影圖像進行旋轉(zhuǎn),以完成對所述待校正圖像的傾斜校正。
8、在一些實施例中,所述獲取待校正圖像,對所述待校正圖像進行預處理,以得到去除陰影圖像,包括:
9、獲取待校正圖像,對所述待校正圖像進行rgb通道分離,以得到r通道圖像、g通道圖像和b通道圖像;
10、分別對所述r通道圖像、g通道圖像和b通道圖像依次進行膨脹操作處理、中值濾波處理、絕對差分處理;
11、對處理后的r通道圖像、g通道圖像和b通道圖像進行合并,以得到所述去除陰影圖像。
12、在一些實施例中,所述去除陰影圖像在水平投影上的方差的計算方法為:
13、獲取所述去除陰影圖像的各行的水平投影值,其中,所述去除陰影圖像為m行n列的圖像;
14、計算出各行的水平投影值的平均值;
15、基于所述平均值以及各行的水平投影值,計算出所述去除陰影圖像在水平投影上的方差。
16、在一些實施例中,所述去除陰影圖像在水平投影上的方差的計算公式為:
17、
18、其中,var為所述去除陰影圖像在水平投影上的方差,x?i為所述去除陰影圖像的第i行的水平投影值,μ為各行的水平投影值的平均值,k為所述去除陰影圖像的第k行。
19、在一些實施例中,所述預設范圍為-20°~20°。
20、在一些實施例中,所述基于所述比較結果,對所述待校正圖像或去除陰影圖像進行旋轉(zhuǎn),以完成對所述待校正圖像的傾斜校正,包括:
21、基于比較結果,獲取方差最大時所述去除陰影圖像的旋轉(zhuǎn)角度;
22、基于所述方差最大是所述去除陰影圖像的旋轉(zhuǎn)角度,對所述待校正圖像或去除陰影圖像進行旋轉(zhuǎn),以完成對所述待校正圖像的傾斜校正。
23、在一些實施例中,所述圖像傾斜校正方法還包括:
24、當通過對所述去除陰影圖像進行旋轉(zhuǎn)來實現(xiàn)待校正圖像的傾斜校正時,對傾斜校正后的圖像進行圖像增強處理。
25、第二方面,本發(fā)明還提供一種圖像傾斜校正裝置,包括:
26、預處理模塊,用于獲取待校正圖像,對所述待校正圖像進行預處理,以得到去除陰影圖像;
27、方差計算模塊,用于在預設范圍內(nèi),對所述去除陰影圖像進行若干次旋轉(zhuǎn),并計算出每次旋轉(zhuǎn)后所述去除陰影圖像在水平投影上的方差;
28、比較模塊,用于對計算出的若干個方差進行比較,以得到比較結果;
29、校正模塊,用于基于所述比較結果,對所述待校正圖像或去除陰影圖像進行旋轉(zhuǎn),以完成對所述待校正圖像的傾斜校正。
30、第三方面,本發(fā)明還提供一種電子設備,包括:處理器和存儲器;
31、所述存儲器上存儲有可被所述處理器執(zhí)行的計算機程序;
32、所述處理器執(zhí)行所述計算機程序時實現(xiàn)如上所述的圖像傾斜校正方法中的步驟。
33、第四方面,本發(fā)明還提供一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)存儲有一個或者多個程序,所述一個或者多個程序可被一個或者多個處理器執(zhí)行,以實現(xiàn)如上所述的圖像傾斜校正方法中的步驟。
34、與現(xiàn)有技術相比,本發(fā)明提供的圖像傾斜校正方法、裝置、電子設備及存儲介質(zhì),首先獲取待校正圖像,對所述待校正圖像進行預處理,以得到去除陰影圖像;然后在預設范圍內(nèi),對所述去除陰影圖像進行若干次旋轉(zhuǎn),并計算出每次旋轉(zhuǎn)后所述去除陰影圖像在水平投影上的方差;之后對計算出的若干個方差進行比較,以得到比較結果;最后基于所述比較結果,對所述待校正圖像或去除陰影圖像進行旋轉(zhuǎn),以完成對所述待校正圖像的傾斜校正。本發(fā)明通過對圖像進行預處理,并通過計算水平投影上的方差,可以迅速準確地旋轉(zhuǎn)具有小角度的文本圖像到水平,為后續(xù)文本圖像檢測識別以及信息抽取打下了扎實精準的基礎。
1.一種圖像傾斜校正方法,其特征在于,包括如下步驟:
2.根據(jù)權利要求1所述的圖像傾斜校正方法,其特征在于,所述獲取待校正圖像,對所述待校正圖像進行預處理,以得到去除陰影圖像,包括:
3.根據(jù)權利要求1所述的圖像傾斜校正方法,其特征在于,所述去除陰影圖像在水平投影上的方差的計算方法為:
4.根據(jù)權利要求3所述的圖像傾斜校正方法,其特征在于,所述去除陰影圖像在水平投影上的方差的計算公式為:
5.根據(jù)權利要求1所述的圖像傾斜校正方法,其特征在于,所述預設范圍為-20°~20°。
6.根據(jù)權利要求1所述的圖像傾斜校正方法,其特征在于,所述基于所述比較結果,對所述待校正圖像或去除陰影圖像進行旋轉(zhuǎn),以完成對所述待校正圖像的傾斜校正,包括:
7.根據(jù)權利要求1所述的圖像傾斜校正方法,其特征在于,還包括:
8.一種圖像傾斜校正裝置,其特征在于,包括:
9.一種電子設備,其特征在于,包括:處理器和存儲器;
10.一種計算機可讀存儲介質(zhì),其特征在于,包括:處理器和存儲器;