本申請(qǐng)實(shí)施例涉及圖像處理領(lǐng)域,具體而言,涉及一種文本生成方法及電子設(shè)備、存儲(chǔ)介質(zhì)、程序產(chǎn)品。
背景技術(shù):
1、目前,隨著人工智能的發(fā)展,衍生出來(lái)對(duì)文檔信息進(jìn)行問(wèn)答的需求,文檔中會(huì)包括圖表。當(dāng)用戶對(duì)圖表中的信息進(jìn)行問(wèn)答時(shí),就需要將圖表識(shí)別為結(jié)構(gòu)化的文本。但相關(guān)技術(shù)中對(duì)圖表的識(shí)別并不能描述出圖表與文字之間的關(guān)聯(lián)關(guān)系,導(dǎo)致無(wú)法準(zhǔn)確的識(shí)別圖表中的內(nèi)容。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供了一種文本生成方法及電子設(shè)備、存儲(chǔ)介質(zhì)、程序產(chǎn)品,以至少解決相關(guān)技術(shù)中無(wú)法準(zhǔn)確的識(shí)別圖表中的文本的技術(shù)問(wèn)題。
2、根據(jù)本發(fā)明的一個(gè)方面,提供了一種文本生成方法,包括:確定待處理圖表圖像的第一圖像特征,上述第一圖像特征包括上述待處理圖表圖像中目標(biāo)文字的文字特征;確定上述待處理圖表圖像的第二圖像特征,上述第二圖像特征包括上述待處理圖表圖像中目標(biāo)圖形的圖形特征;基于上述第一圖像特征和上述第二圖像特征生成目標(biāo)文本,上述目標(biāo)文本用于描述上述目標(biāo)圖形和上述目標(biāo)文字之間的對(duì)應(yīng)關(guān)系。
3、根據(jù)本發(fā)明的另一方面,提供了一種文本生成裝置,包括:第一確定模塊,用于確定待處理圖表圖像的第一圖像特征,上述第一圖像特征包括上述待處理圖表圖像中目標(biāo)文字的文字特征;第二確定模塊,用于確定上述待處理圖表圖像的第二圖像特征,上述第二圖像特征包括上述待處理圖表圖像中目標(biāo)圖形的圖形特征;第一生成模塊,用于基于上述第一圖像特征和上述第二圖像特征生成目標(biāo)文本,上述目標(biāo)文本用于描述上述目標(biāo)圖形和上述目標(biāo)文字之間的對(duì)應(yīng)關(guān)系。
4、根據(jù)本申請(qǐng)的又一個(gè)實(shí)施例,還提供了一種電子設(shè)備,包括存儲(chǔ)器和處理器,上述存儲(chǔ)器中存儲(chǔ)有計(jì)算機(jī)程序,上述處理器被設(shè)置為運(yùn)行上述計(jì)算機(jī)程序以執(zhí)行上述任一項(xiàng)方法實(shí)施例中的步驟。
5、根據(jù)本申請(qǐng)的又一個(gè)實(shí)施例,還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),上述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)程序,其中,上述計(jì)算機(jī)程序被設(shè)置為運(yùn)行時(shí)執(zhí)行上述任一項(xiàng)方法實(shí)施例中的步驟。
6、根據(jù)本申請(qǐng)的又一個(gè)實(shí)施例,還提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,上述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述任一項(xiàng)方法實(shí)施例中的步驟。
7、通過(guò)本申請(qǐng),通過(guò)提取待處理圖表圖像中目標(biāo)文字的文字特征和目標(biāo)圖形的圖形特征,可以更全面地理解待處理圖表圖像中的內(nèi)容,從而提高識(shí)別的準(zhǔn)確性,將圖表內(nèi)容轉(zhuǎn)換為易于操作和應(yīng)用的文本格式,為進(jìn)一步的數(shù)據(jù)分析和應(yīng)用提供了便利。因此,可以解決相關(guān)技術(shù)中無(wú)法準(zhǔn)確的識(shí)別圖表中的文本的技術(shù)問(wèn)題,達(dá)到準(zhǔn)確的識(shí)別圖表中的文本的效果。
1.一種文本生成方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定所述待處理圖表圖像的第一圖像特征,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對(duì)n個(gè)所述文本塊執(zhí)行文字編碼操作得到文字編碼特征,并根據(jù)所述文字編碼特征確定所述目標(biāo)文字的文字類型,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述識(shí)別n個(gè)所述文本塊中包含的所述目標(biāo)文字,并按照預(yù)設(shè)順序拼接n個(gè)所述文本塊中的目標(biāo)文字,得到拼接文本,包括:
5.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對(duì)n個(gè)所述文本塊在所述待處理圖表圖像中的坐標(biāo)執(zhí)行坐標(biāo)編碼操作,得到所述目標(biāo)文字的坐標(biāo)特征,包括:
6.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述確定n個(gè)所述文本塊的尺寸,并對(duì)n個(gè)所述文本塊的尺寸執(zhí)行尺寸編碼操作,得到所述目標(biāo)文字的尺寸特征,包括:
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于所述第一圖像特征和第二圖像特征生成目標(biāo)文本,包括:
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,合并所述第一圖像特征和所述第二圖像特征,得到目標(biāo)圖像特征,包括:
9.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述從目標(biāo)詞表中查找與所述目標(biāo)編碼匹配的文字,得到所述目標(biāo)文本之前,所述方法還包括:
10.一種電子設(shè)備,包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)所述權(quán)利要求1至9任一項(xiàng)中所述的方法的步驟。
11.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)程序,其中,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)所述權(quán)利要求1至9任一項(xiàng)中所述的方法的步驟。
12.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至9任一項(xiàng)中所述的方法的步驟。