一種文字識別與自動化審核方法和系統(tǒng)與流程

文檔序號：40280488發(fā)布日期：2024-12-11 13:19閱讀：來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)>一種文字識別與自動化審核方法和系統(tǒng)與流程

技術(shù)特征：

1.一種文字識別與自動化審核方法，其特征在于，所述方法包括：

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述半結(jié)構(gòu)化文本數(shù)據(jù)包括表格文檔數(shù)據(jù)，所述非結(jié)構(gòu)化文本數(shù)據(jù)包括圖片文檔數(shù)據(jù)和文本文檔數(shù)據(jù)。

3.根據(jù)權(quán)利要求2所述的方法，其特征在于，根據(jù)所述待審核文檔數(shù)據(jù)內(nèi)容獲取對應(yīng)ocr引擎，包括：

4.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述規(guī)則抽取包括以下步驟：

5.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述模型抽取包括以下步驟：

6.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述通過對比所述目標(biāo)文檔數(shù)據(jù)與預(yù)先搭建的目標(biāo)結(jié)構(gòu)化文本數(shù)據(jù)，確定所述目標(biāo)文檔數(shù)據(jù)是否合規(guī)，包括以下步驟：

7.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述根據(jù)所述待審核文檔數(shù)據(jù)的復(fù)雜度，實時更新所述目標(biāo)文檔數(shù)據(jù)的置信度閾值，包括：

8.根據(jù)權(quán)利要求7所述的方法，其特征在于，所述置信度閾值調(diào)整方法包括以下步驟：

9.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述方法還包括：將ocr識別的結(jié)果與知識圖譜中的實體、關(guān)系和屬性進(jìn)行匹配和驗證，基于上下文語義理解進(jìn)行驗證；

10.一種文字識別與自動化審核系統(tǒng)，其特征在于，包括：

技術(shù)總結(jié)
本申請公開了一種文字識別與自動化審核方法和系統(tǒng)，通過獲取包括半結(jié)構(gòu)化和非結(jié)構(gòu)化在內(nèi)的所有待審核文檔數(shù)據(jù)，確保審核過程的全面性，利用OCR技術(shù)準(zhǔn)確識別文檔內(nèi)容，將其轉(zhuǎn)化為可操作的結(jié)構(gòu)化數(shù)據(jù)，通過規(guī)則抽取和模型抽取兩種方式，選取文檔中的關(guān)鍵信息，提升了信息處理的效率和準(zhǔn)確性，與預(yù)先搭建的目標(biāo)結(jié)構(gòu)化文本數(shù)據(jù)進(jìn)行對比，自動化地完成合規(guī)性檢查，確保審核結(jié)果的合規(guī)性，根據(jù)文檔的復(fù)雜度實時更新置信度閾值，適應(yīng)不同復(fù)雜度的文檔數(shù)據(jù)，自動化的審核流程顯著提高了審核效率，在處理大量文檔數(shù)據(jù)時，能夠節(jié)省大量時間和人力資源，輸出審核結(jié)果以及對應(yīng)置信率，使用戶能夠看到文檔解析的具體結(jié)果，提高了審核的可靠性和用戶的信任度。

技術(shù)研發(fā)人員：王開向,王涌,陳琛,王開志,龔峰平,彭超,李奇奇
受保護(hù)的技術(shù)使用者：北京至臻云智能科技有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/10

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁1 2

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種文字識別與自動化審核方法和系統(tǒng)與流程