本技術涉及電子發(fā)票驗證,尤其是涉及一種電子發(fā)票查驗方法、裝置、終端及存儲介質。
背景技術:
1、隨著電子商務和數字化辦公的普及,電子發(fā)票已經成為日常商業(yè)交易中的重要憑證。因此,如何快速、批量地驗證發(fā)票及其版式文件的真?zhèn)纬蔀槠髽I(yè)和財務機構面臨的重要問題。然而,傳統(tǒng)的人工查驗方式只能單張發(fā)票逐一驗證,不僅效率低下,且易出錯,難以滿足現(xiàn)代財務管理的快速響應要求。另外,雖然市場上已存在部分電子發(fā)票查驗工具,但大多依賴于單一識別模式(如僅通過二維碼掃描或ocr文字識別),且當批量查驗電子發(fā)票時,通常只能處理單一類型的發(fā)票,難以應對復雜多變的發(fā)票格式,容易出現(xiàn)誤檢的問題。此外,偽造電子發(fā)票的手段也越來越復雜,單一模式的查驗手段已經難以應對潛在的偽造手段。
2、因此,亟需一種能夠高效、準確地批量查驗電子發(fā)票及版式文件真?zhèn)蔚募夹g解決方案。
技術實現(xiàn)思路
1、為了能夠高效、準確地批量查驗電子發(fā)票及版式文件,本技術提供了一種電子發(fā)票查驗方法、裝置、終端及存儲介質,通過多模態(tài)識別和預設的多種發(fā)票文件模版對電子發(fā)票及版式文件實現(xiàn)準確、細致的查驗。
2、第一方面,本技術提供一種電子發(fā)票查驗方法,采用如下的技術方案:
3、獲取待查驗的電子發(fā)票的發(fā)票文件并對所述發(fā)票文件進行預處理,得到所述發(fā)票文件所對應的發(fā)票圖片;
4、逐一對所述發(fā)票圖片進行多模態(tài)識別并分別得到每張所述發(fā)票圖片的識別結果,所述識別結果包括發(fā)票版式信息和發(fā)票數據信息;
5、依據所述發(fā)票數據信息從第三方平臺獲取所述電子發(fā)票的實際發(fā)票數據,結合所述實際發(fā)票數據對所述電子發(fā)票進行初次真?zhèn)涡则炞C;
6、當所述初次真?zhèn)涡则炞C通過后,依據所述發(fā)票版式信息和預存的發(fā)票模版對所述電子發(fā)票進行二次真?zhèn)涡则炞C;
7、當所述二次真?zhèn)涡则炞C通過后,輸出所述電子發(fā)票的驗證結果。
8、通過采用上述的技術方案,通過多模態(tài)識別技術識別出電子發(fā)票上的所有發(fā)票數據信息和發(fā)票版式信息,依次依據上述信息進行兩次的真?zhèn)涡则炞C,使得電子發(fā)票的識別結果擁有雙層保障,更加準確,同時使用預存的發(fā)票模版進行匹配的方式能夠支持多種模版的電子發(fā)票的查驗,更加具有實用性。
9、優(yōu)選地,所述獲取待查驗的電子發(fā)票的發(fā)票文件并對所述發(fā)票文件進行預處理,得到所述發(fā)票文件所對應的發(fā)票圖片,具體包括如下步驟:
10、獲取全部待查驗的電子發(fā)票的發(fā)票文件,所述發(fā)票文件的上傳方式為批量上傳,對全部所述發(fā)票文件進行預處理,所述預處理包括解壓處理和格式轉換;
11、當上傳的所述發(fā)票文件為壓縮包時,對所述壓縮包進行解壓,對解壓后得到的所述發(fā)票文件統(tǒng)一進行所述格式轉換,得到每個所述發(fā)票文件對應的所述電子發(fā)票的發(fā)票圖片。
12、通過采用上述的技術方案,將上傳的發(fā)票文件進行統(tǒng)一的格式轉換,使所有文件變成統(tǒng)一的圖片格式,方便后續(xù)的識別和處理。
13、優(yōu)選地,所述逐一對所述發(fā)票圖片進行多模態(tài)識別并分別得到每張所述發(fā)票圖片的識別結果,所述識別結果包括發(fā)票版式信息和發(fā)票數據信息,具體包括如下步驟:
14、對轉換后得到的所述發(fā)票圖片進行多模態(tài)識別,所述多模態(tài)識別包括圖像識別和文字識別;所述圖像識別包括二維碼識別和票面圖案識別,通過所述二維碼識別得到所述電子發(fā)票的編碼信息,所述編碼信息包括發(fā)票號碼和發(fā)票代碼,通過所述票面圖案識別得到所述電子發(fā)票上的全部版式元素以及所述版式元素的特征信息;通過ocr技術進行所述文字識別,提取所述電子發(fā)票中的文字信息,所述文字信息包括發(fā)票類型;
15、將所述編碼信息和所述文字信息匯總成發(fā)票數據信息,將所述版式元素和所述特征信息匯總成發(fā)票版式信息通過采用上述的技術方案,詳細說明了多模態(tài)識別的內容,通過多模態(tài)的識別能夠對電子發(fā)票上所有存在的信息進行識別,為后續(xù)的電子發(fā)票查驗提供了數據基礎。
16、優(yōu)選地,所述依據所述發(fā)票數據信息從第三方平臺獲取所述電子發(fā)票的實際發(fā)票數據,結合所述實際發(fā)票數據對所述電子發(fā)票進行初次真?zhèn)涡则炞C,具體包括如下步驟:
17、建立與第三方平臺之間的通信,依據所述發(fā)票數據信息中的所述發(fā)票號碼和所述發(fā)票代碼構造查詢語句并提交給所述第三方平臺的數據庫,接收所述第三方平臺返回的與所述發(fā)票號碼、所述發(fā)票代碼相對應的實際發(fā)票數據;
18、當所述實際發(fā)票數據不為空時,將所述實際發(fā)票數據與所述發(fā)票數據信息進行比對得到比對結果,當所述比對結果一致時,所述電子發(fā)票的初次真?zhèn)涡则炞C通過,所述發(fā)票數據信息為真,當所述比對結果不一致時,所述初次真?zhèn)涡则炞C不通過,認定所述電子發(fā)票為假;
19、當所述實際發(fā)票數據為空時,所述初次真?zhèn)涡则炞C不通過,認定所述電子發(fā)票為假。
20、通過采用上述的技術方案,連接第三方的平臺對識別到的發(fā)票數據信息的真?zhèn)涡赃M行查驗,同時也是對電子發(fā)票的初次真?zhèn)涡则炞C,當無法查詢到數據時可直接判定電子發(fā)票為假,當能夠查詢到數據時對二者的一致性進行比對,能夠判定電子發(fā)票的發(fā)票數據信息的真實性。
21、優(yōu)選地,所述當所述初次真?zhèn)涡则炞C通過后,依據所述發(fā)票版式信息和預存的發(fā)票模版對所述電子發(fā)票進行二次真?zhèn)涡则炞C,具體包括如下步驟:
22、若所述發(fā)票數據信息為真,依據所述發(fā)票類型獲取預先存儲的發(fā)票模版,從所述發(fā)票模版中提取期望發(fā)票版式信息,依據所述發(fā)票版式信息與所述期望發(fā)票版式信息進行模板匹配,從而判斷所述發(fā)票文件的真?zhèn)涡裕瞿0迤ヅ浒ㄎ恢闷ヅ?、尺寸匹配以及間距匹配;
23、所述模板匹配包括以所述版式元素為索引,從所述特征信息中提取與所述版式元素相對應的實際特征、從所述期望發(fā)票版式信息中提取與所述版式元素相對應的期望特征,依據所述實際特征和所述期望特征分別計算各個所述版式元素的位置差異度、尺寸差異度以及間距差異度。
24、通過采用上述的技術方案,對識別到的發(fā)票版式信息的真?zhèn)涡赃M行驗證,即是對電子發(fā)票的二次真?zhèn)涡则炞C,將發(fā)票版式信息和發(fā)票模版中提取到的期望發(fā)票版式信息進行匹配,計算每個版式元素的各種特征的差異度,分別計算多種特征的差異度能夠使得匹配更加地精準,提高匹配精確度。
25、優(yōu)選地,在所述依據所述實際特征和所述期望特征分別計算各個所述版式元素的位置差異度、尺寸差異度以及間距差異度之后,還包括如下步驟:
26、為各個所述版式元素的所述位置差異度、所述尺寸差異度以及所述間距差異度分別設置第一權重系數,并結合所述第一權重系數計算每個所述版式元素的版式元素差異度;
27、為各個所述版式元素分別設置第二權重系數,并依據所述第二權重系數和所述版式元素差異度計算所述發(fā)票文件的綜合差異度;
28、當所述綜合差異度不超過預設的差異度閾值時,所述電子發(fā)票的二次真?zhèn)涡则炞C通過,所述發(fā)票文件為真,否則所述二次真?zhèn)涡则炞C不通過。
29、通過采用上述的技術方案,通過設置兩種權重系數能夠保證差異度的最終計算結果更加地全面和穩(wěn)定,降低計算出錯的概率,使得最終差異度的計算更加具有可信度。
30、優(yōu)選地,所述當所述二次真?zhèn)涡则炞C通過后,輸出所述電子發(fā)票的驗證結果,具體包括如下步驟:
31、當所述二次真?zhèn)涡则炞C通過后,認定所述電子發(fā)票為真,輸出驗證通過的結果;
32、當所述二次真?zhèn)涡则炞C不通過時,根據所述初次真?zhèn)涡则炞C的結果、所述版式元素差異度以及所述綜合差異度生成驗證報告并輸出。
33、通過采用上述的技術方案,當二次真?zhèn)涡则炞C不通過時將驗證過程的相關數據進行輸出生成報告,方便工作人員通過報告迅速獲知不通過的原因,提升處理效率。
34、第二方面,本技術提供一種電子發(fā)票查驗裝置,采用如下的技術方案:
35、一種電子發(fā)票查驗裝置,包括如下模塊:
36、發(fā)票處理模塊,用于獲取待查驗的電子發(fā)票的發(fā)票文件并對所述發(fā)票文件進行預處理,得到所述發(fā)票文件所對應的發(fā)票圖片;
37、發(fā)票識別模塊,用于逐一對所述發(fā)票圖片進行多模態(tài)識別并分別得到每張所述發(fā)票圖片的識別結果,所述識別結果包括發(fā)票版式信息和發(fā)票數據信息;
38、初次真?zhèn)涡则炞C模塊,用于依據所述發(fā)票數據信息從第三方平臺獲取所述電子發(fā)票的實際發(fā)票數據,結合所述實際發(fā)票數據對所述電子發(fā)票進行初次真?zhèn)涡则炞C;
39、二次真?zhèn)涡则炞C模塊,用于當所述初次真?zhèn)涡则炞C通過后,依據所述發(fā)票版式信息和預存的發(fā)票模版對所述電子發(fā)票進行二次真?zhèn)涡则炞C;
40、驗證結果輸出模塊,用于當所述二次真?zhèn)涡则炞C通過后,輸出所述電子發(fā)票的驗證結果。
41、通過采用上述的技術方案,搭建出了一套電子發(fā)票的批量查驗體系,為電子發(fā)票文件的真?zhèn)涡则炞C提供了必要的軟件技術支撐,實現(xiàn)了全面且準確的批量電子發(fā)票的查驗,為批量查驗多種類型的電子發(fā)票提供了有力的支持。
42、第三方面,本技術提供了一種智能終端,采用如下的技術方案:
43、一種智能終端,包括存儲器和處理器,所述存儲器中存儲有至少一條指令、至少一段程序、代碼集或指令集,所述至少一條指令、至少一段程序、代碼集或指令集由所述處理器加載并執(zhí)行以實現(xiàn)如前文所述的電子發(fā)票查驗方法。
44、第四方面,本技術提供了一種計算機可讀存儲介質,采用如下的技術方案:
45、一種計算機可讀存儲介質,所述可讀存儲介質中存儲有至少一條指令、至少一段程序、代碼集或指令集,所述至少一條指令、至少一段程序、代碼集或指令集由處理器加載并執(zhí)行以實現(xiàn)如前文所述的電子發(fā)票查驗方法。
46、綜上所述,本技術至少具有如下有益效果:
47、1.本技術通過集成多種驗證方式,對發(fā)票及版式文件進行全面、細致的查驗,不僅能夠驗證電子發(fā)票上的數據的真實性,還能比對發(fā)票文件與預設標準模版的差異,使得電子發(fā)票的識別結果擁有雙層保障,更加準確,同時預存了多種類型的發(fā)票模版,能夠支持多種類型的電子發(fā)票的查驗,使本方法更加具有實用性。