圖文信息識(shí)別方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)與流程

文檔序號(hào)：40277560發(fā)布日期：2024-12-11 13:12閱讀：15來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

圖文信息識(shí)別方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)與流程

本發(fā)明涉及人工智能及金融科技領(lǐng)域，具體涉及一種圖文信息識(shí)別方法、裝置、計(jì)算機(jī)設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。

背景技術(shù)：

1、目前，隨著計(jì)算機(jī)技術(shù)的發(fā)展，越來(lái)越多的技術(shù)應(yīng)用在金融領(lǐng)域，傳統(tǒng)金融業(yè)正在逐步向金融科技(fintech)轉(zhuǎn)變，圖文信息識(shí)別技術(shù)也不例外，例如，在金融機(jī)構(gòu)(如銀行)的合規(guī)審查場(chǎng)景中，金融機(jī)構(gòu)經(jīng)常需要審查大量的文檔，如合同、貸款文件、保險(xiǎn)單、財(cái)務(wù)報(bào)表、身份證明等，這些文檔通常包含豐富的文本信息和圖像內(nèi)容(如簽名、印章、公司標(biāo)志等)，通過(guò)圖文信息識(shí)別技術(shù)，金融機(jī)構(gòu)可以實(shí)現(xiàn)合規(guī)審查的自動(dòng)化和智能化，提高業(yè)務(wù)效率和客戶滿意度，同時(shí)降低運(yùn)營(yíng)成本和合規(guī)風(fēng)險(xiǎn)。但由于金融行業(yè)的安全性、實(shí)時(shí)性等要求，也對(duì)圖文信息識(shí)別技術(shù)提出了更高的要求。

2、同時(shí)，當(dāng)前隨著社交媒體的爆炸性增長(zhǎng)，信息傳播的速度和廣度達(dá)到了前所未有的水平。然而，這一現(xiàn)象的陰暗面是虛假新聞的迅速擴(kuò)散，虛假新聞不僅擾亂了人們的生活，引起了公眾恐慌，還影響了輿論，操縱了公眾關(guān)注點(diǎn)，破壞了社交媒體平臺(tái)的信譽(yù)。在當(dāng)前的數(shù)字媒體環(huán)境中，信息的碎片化使得未經(jīng)控制的虛假信息得以迅速傳播。虛假新聞的傳播速度、范圍、深度和廣度都遠(yuǎn)遠(yuǎn)超過(guò)了真實(shí)新聞，這主要是因?yàn)橹e言往往更具吸引力，且易于在社交媒體上引起共鳴。尤其是融合了圖像和文本的多模態(tài)虛假新聞，因其吸引人的圖像內(nèi)容，比純文本新聞更容易吸引觀眾的注意力，從而更難以被識(shí)別和遏制。目前，現(xiàn)有的虛假新聞檢測(cè)方法主要集中在文本分析上，但隨著融合了圖像和文本的多模態(tài)虛假新聞的增加，這些方法的有效性受到了限制，使得虛假檢測(cè)與分類(lèi)變得更加困難。

3、綜上所述，如何提供一種圖文信息識(shí)別方法、裝置、計(jì)算機(jī)設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，可實(shí)現(xiàn)對(duì)于目標(biāo)圖文信息的準(zhǔn)確分類(lèi)與識(shí)別，是目前本領(lǐng)域技術(shù)人員亟待解決的問(wèn)題。

技術(shù)實(shí)現(xiàn)思路

1、鑒于上述現(xiàn)有技術(shù)的不足之處，本發(fā)明的目的在于提供一種圖文信息識(shí)別方法、裝置、計(jì)算機(jī)設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，旨在解決如何可實(shí)現(xiàn)對(duì)于目標(biāo)圖文信息的準(zhǔn)確分類(lèi)與識(shí)別的問(wèn)題。

2、為了達(dá)到上述目的，本發(fā)明采取了以下技術(shù)方案：

3、第一方面，本發(fā)明提供了一種圖文信息識(shí)別方法，其中，包括：

4、獲取目標(biāo)圖文信息，并對(duì)所述目標(biāo)圖文信息進(jìn)行信息提取，得到其中的文本內(nèi)容和圖像內(nèi)容；

5、將所述文本內(nèi)容輸入nlp模型中，生成所述目標(biāo)圖文信息的文本特征向量；

6、將所述圖像內(nèi)容輸入cv模型中，生成所述目標(biāo)圖文信息的圖像特征向量；

7、基于交叉注意力機(jī)制，對(duì)所述文本特征向量與所述圖像特征向量執(zhí)行交叉注意力操作，生成所述目標(biāo)圖文信息的融合特征向量；

8、基于所述融合特征向量，利用分類(lèi)器生成所述目標(biāo)圖文信息的信息識(shí)別結(jié)果。

9、第二方面，本發(fā)明提供了一種圖文信息識(shí)別裝置，其中，包括：

10、信息提取模塊，用于獲取目標(biāo)圖文信息，并對(duì)所述目標(biāo)圖文信息進(jìn)行信息提取，得到其中的文本內(nèi)容和圖像內(nèi)容；

11、文本內(nèi)容輸入模塊，用于將所述文本內(nèi)容輸入nlp模型中，生成所述目標(biāo)圖文信息的文本特征向量；

12、圖像內(nèi)容輸入模塊，用于將所述圖像內(nèi)容輸入cv模型中，生成所述目標(biāo)圖文信息的圖像特征向量；

13、操作執(zhí)行模塊，用于基于交叉注意力機(jī)制，對(duì)所述文本特征向量與所述圖像特征向量執(zhí)行交叉注意力操作，生成所述目標(biāo)圖文信息的融合特征向量；

14、結(jié)果生成模塊，用于基于所述融合特征向量，利用分類(lèi)器生成所述目標(biāo)圖文信息的信息識(shí)別結(jié)果。

15、第三方面，本發(fā)明提供了一種計(jì)算機(jī)設(shè)備，包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器中并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序，其中，所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如上所述的圖文信息識(shí)別方法。

16、第四方面，本發(fā)明提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序，其中，所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上所述的圖文信息識(shí)別方法。

17、相較于現(xiàn)有技術(shù)，本發(fā)明提供了一種圖文信息識(shí)別方法、裝置、計(jì)算機(jī)設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，其中，通過(guò)獲取目標(biāo)圖文信息，并對(duì)所述目標(biāo)圖文信息進(jìn)行信息提取，得到其中的文本內(nèi)容和圖像內(nèi)容；將所述文本內(nèi)容輸入nlp模型中，生成所述目標(biāo)圖文信息的文本特征向量；將所述圖像內(nèi)容輸入cv模型中，生成所述目標(biāo)圖文信息的圖像特征向量；基于交叉注意力機(jī)制，對(duì)所述文本特征向量與所述圖像特征向量執(zhí)行交叉注意力操作，生成所述目標(biāo)圖文信息的融合特征向量；基于所述融合特征向量，利用分類(lèi)器生成所述目標(biāo)圖文信息的信息識(shí)別結(jié)果；從而本發(fā)明可實(shí)現(xiàn)對(duì)于目標(biāo)圖文信息的準(zhǔn)確分類(lèi)與識(shí)別。

技術(shù)特征：

1.一種圖文信息識(shí)別方法，其特征在于，包括：

2.根據(jù)權(quán)利要求1所述的圖文信息識(shí)別方法，其特征在于，所述獲取目標(biāo)圖文信息，并對(duì)所述目標(biāo)圖文信息進(jìn)行信息提取，得到其中的文本內(nèi)容和圖像內(nèi)容，包括：

3.根據(jù)權(quán)利要求1所述的圖文信息識(shí)別方法，其特征在于，所述將所述文本內(nèi)容輸入nlp模型中，生成所述目標(biāo)圖文信息的文本特征向量，包括：

4.根據(jù)權(quán)利要求1所述的圖文信息識(shí)別方法，其特征在于，所述將所述圖像內(nèi)容輸入cv模型中，生成所述目標(biāo)圖文信息的圖像特征向量，包括：

5.根據(jù)權(quán)利要求1所述的圖文信息識(shí)別方法，其特征在于，所述基于交叉注意力機(jī)制，對(duì)所述文本特征向量與所述圖像特征向量執(zhí)行交叉注意力操作，生成所述目標(biāo)圖文信息的融合特征向量，包括：

6.根據(jù)權(quán)利要求5所述的圖文信息識(shí)別方法，其特征在于，所述對(duì)所述文本特征向量與所述圖像特征向量執(zhí)行調(diào)整操作，以確保兩者在格式與維度上一致，包括：

7.根據(jù)權(quán)利要求1-6任一項(xiàng)所述的圖文信息識(shí)別方法，其特征在于，所述基于所述融合特征向量，利用分類(lèi)器生成所述目標(biāo)圖文信息的信息識(shí)別結(jié)果，包括：

8.一種圖文信息識(shí)別裝置，其特征在于，包括：

9.一種計(jì)算機(jī)設(shè)備，包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器中并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序，其特征在于，所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1-7任一項(xiàng)所述的圖文信息識(shí)別方法。

10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序，其特征在于，所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-7任一項(xiàng)所述的圖文信息識(shí)別方法。

技術(shù)總結(jié)
本發(fā)明公開(kāi)了圖文信息識(shí)別方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)，涉及人工智能技術(shù)領(lǐng)域及金融科技領(lǐng)域，其中，通過(guò)獲取目標(biāo)圖文信息，并對(duì)所述目標(biāo)圖文信息進(jìn)行信息提取，得到其中的文本內(nèi)容和圖像內(nèi)容；將所述文本內(nèi)容輸入NLP模型中，生成所述目標(biāo)圖文信息的文本特征向量；將所述圖像內(nèi)容輸入CV模型中，生成所述目標(biāo)圖文信息的圖像特征向量；基于交叉注意力機(jī)制，對(duì)所述文本特征向量與所述圖像特征向量執(zhí)行交叉注意力操作，生成所述目標(biāo)圖文信息的融合特征向量；基于所述融合特征向量，利用分類(lèi)器生成所述目標(biāo)圖文信息的信息識(shí)別結(jié)果；從而本發(fā)明可實(shí)現(xiàn)對(duì)于目標(biāo)圖文信息的準(zhǔn)確分類(lèi)與識(shí)別。

技術(shù)研發(fā)人員：唐小初,謝亮晶,舒暢,陳又新
受保護(hù)的技術(shù)使用者：平安科技（深圳）有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/10

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：唐小初,謝亮晶,舒暢,陳又新
技術(shù)所有人：平安科技（深圳）有限公司
我是此專(zhuān)利的發(fā)明人

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

圖文信息識(shí)別方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)與流程

圖文信息識(shí)別方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)與流程