1.一種文字識別與自動化審核方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述半結(jié)構(gòu)化文本數(shù)據(jù)包括表格文檔數(shù)據(jù),所述非結(jié)構(gòu)化文本數(shù)據(jù)包括圖片文檔數(shù)據(jù)和文本文檔數(shù)據(jù)。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,根據(jù)所述待審核文檔數(shù)據(jù)內(nèi)容獲取對應(yīng)ocr引擎,包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述規(guī)則抽取包括以下步驟:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述模型抽取包括以下步驟:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過對比所述目標(biāo)文檔數(shù)據(jù)與預(yù)先搭建的目標(biāo)結(jié)構(gòu)化文本數(shù)據(jù),確定所述目標(biāo)文檔數(shù)據(jù)是否合規(guī),包括以下步驟:
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述待審核文檔數(shù)據(jù)的復(fù)雜度,實時更新所述目標(biāo)文檔數(shù)據(jù)的置信度閾值,包括:
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述置信度閾值調(diào)整方法包括以下步驟:
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:將ocr識別的結(jié)果與知識圖譜中的實體、關(guān)系和屬性進(jìn)行匹配和驗證,基于上下文語義理解進(jìn)行驗證;
10.一種文字識別與自動化審核系統(tǒng),其特征在于,包括: