本申請(qǐng)涉及圖像編解碼,尤其涉及一種預(yù)測(cè)值確定方法、編碼設(shè)備、解碼設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、圖像壓縮是計(jì)算機(jī)視覺(jué)和圖像處理的基本任務(wù)之一。有損圖像壓縮技術(shù)的發(fā)展給各個(gè)領(lǐng)域帶來(lái)了好處,圖像壓縮技術(shù)可以大大降低圖像存儲(chǔ)和圖像傳輸?shù)臄?shù)據(jù)量,但是在重建圖像后得到的圖像質(zhì)量可能會(huì)略有下降。近年來(lái),深度神經(jīng)網(wǎng)絡(luò)在各種任務(wù)中取得了巨大的成功,基于深度神經(jīng)網(wǎng)絡(luò)的圖像壓縮已經(jīng)開(kāi)始超越傳統(tǒng)的圖像壓縮技術(shù)。jpeg?ai是聯(lián)合圖像專家小組(jpeg)創(chuàng)建的一個(gè)基于學(xué)習(xí)的圖像編碼標(biāo)準(zhǔn)。jpeg?ai驗(yàn)證模型針對(duì)人眼視覺(jué)與傳統(tǒng)的圖像編碼相比,在相同的主觀質(zhì)量下,獲得了更低的碼率。
2、jpeg?ai驗(yàn)證模型的上下文模型網(wǎng)絡(luò)中,為了實(shí)現(xiàn)并行處理采用卷積核計(jì)算當(dāng)前像素的元素的上下文特征,在計(jì)算當(dāng)前像素的元素的上下文特征時(shí),只關(guān)注當(dāng)前像素的左上方的元素,沒(méi)有關(guān)注到當(dāng)前像素周圍的其他元素,并沒(méi)有利用到當(dāng)前像素的右下方的其他元素,因此得到的上下文特征的準(zhǔn)確性較低。
技術(shù)實(shí)現(xiàn)思路
1、為了解決上述技術(shù)問(wèn)題或者至少部分地解決上述技術(shù)問(wèn)題,本申請(qǐng)?zhí)峁┝艘环N預(yù)測(cè)值確定方法、編碼設(shè)備、解碼設(shè)備及存儲(chǔ)介質(zhì)。
2、為了實(shí)現(xiàn)上述目的,本申請(qǐng)一些實(shí)施例提供的技術(shù)方案如下:
3、第一方面,提供一種預(yù)測(cè)值確定方法,包括:
4、對(duì)輸入潛在張量對(duì)應(yīng)的潛在空間中的第三像素位置進(jìn)行置零操作,以得到第一潛在張量;
5、通過(guò)第一掩膜卷積核對(duì)所述第一潛在張量進(jìn)行卷積運(yùn)算,以得到對(duì)應(yīng)于第三像素位置的第一上下文特征;
6、對(duì)輸入潛在張量對(duì)應(yīng)的潛在空間中第二像素位置、第三像素位置進(jìn)行置零操作,以得到第二潛在張量;
7、通過(guò)第二掩膜卷積核對(duì)所述第二潛在張量進(jìn)行卷積運(yùn)算,以得到對(duì)應(yīng)于第二像素位置的第二上下文特征;
8、將第一上下文特征、第二上下文特征和目標(biāo)潛在張量進(jìn)行熵概率推導(dǎo),以得到輸入潛在張量中所有像素位置對(duì)應(yīng)的預(yù)測(cè)值;
9、其中,所述潛在空間中,每個(gè)2×2的塊左上角對(duì)應(yīng)第一像素位置、每個(gè)2×2的塊右下角對(duì)應(yīng)所述第二像素位置、每個(gè)2×2的塊右上角和左下角對(duì)應(yīng)所述第三像素位置。
10、第二方面,提供一種預(yù)測(cè)值確定方法,包括:
11、對(duì)目標(biāo)潛在張量進(jìn)行卷積處理,以計(jì)算所述目標(biāo)潛在張量的潛在空間中第一像素位置對(duì)應(yīng)的預(yù)測(cè)值,所述目標(biāo)潛在張量為對(duì)第一碼流進(jìn)行熵解碼和超先驗(yàn)解碼處理后得到的潛在張量;
12、將第一殘差張量與所述第一像素位置對(duì)應(yīng)的預(yù)測(cè)值相加,以獲取第二潛在張量,所述第一殘差張量為目標(biāo)殘差張量中所述第一像素位置對(duì)應(yīng)的殘差張量,所述目標(biāo)殘差張量為對(duì)第二碼流進(jìn)行熵解碼和逆增益處理后得到的殘差張量;
13、通過(guò)第二掩膜卷積核對(duì)第二潛在張量進(jìn)行卷積運(yùn)算,以得到對(duì)應(yīng)于第二像素位置的第二上下文特征;
14、將所述第二上下文特征和所述目標(biāo)潛在張量經(jīng)過(guò)熵概率推導(dǎo),可以得到對(duì)應(yīng)于兩個(gè)像素位置的預(yù)測(cè)值;
15、將第二殘差張量與兩個(gè)像素位置的預(yù)測(cè)值相加,以獲取第一潛在張量,所述第二殘差張量為所述目標(biāo)殘差張量中所述第一像素位置和所述第二像素位置對(duì)應(yīng)的殘差張量;
16、通過(guò)第一掩膜卷積核對(duì)第一潛在張量進(jìn)行卷積運(yùn)算,以得到對(duì)應(yīng)于第三像素位置的第一上下文特征;
17、將所述第一上下文特征、所述第二上下文特征和所述目標(biāo)潛在張量經(jīng)過(guò)熵概率推導(dǎo),以得到對(duì)應(yīng)于所有像素位置的預(yù)測(cè)值;
18、其中,所述潛在空間中,每個(gè)2×2的塊左上角對(duì)應(yīng)所述第一像素位置、每個(gè)2×2的塊右下角對(duì)應(yīng)所述第二像素位置、每個(gè)2×2的塊右上角和左下角對(duì)應(yīng)所述第三像素位置。
19、第三方面,提供一種編碼設(shè)備,包括:處理器、存儲(chǔ)器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面或其任意一種可選的實(shí)施方式所述的所述預(yù)測(cè)值確定方法。
20、第四方面,提供一種解碼設(shè)備,包括:處理器、存儲(chǔ)器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如第二方面或其任意一種可選的實(shí)施方式所述的預(yù)測(cè)值確定方法。
21、第五方面,提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),包括:所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)以下至少一種方法::
22、第一方面或其任意一種可選的實(shí)施方式所述的預(yù)測(cè)值確定方法;
23、第二方面或其任意一種可選的實(shí)施方式所述的預(yù)測(cè)值確定方法。
24、第六方面,提供一種計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品中存儲(chǔ)計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)以下至少一種方法:
25、第一方面或其任意一種可選的實(shí)施方式所述的預(yù)測(cè)值確定方法;
26、第二方面或其任意一種可選的實(shí)施方式所述的預(yù)測(cè)值確定方法。
27、本申請(qǐng)?zhí)峁┑念A(yù)測(cè)值確定方法,在編碼器中計(jì)算上下文模型網(wǎng)絡(luò)的輸入潛在張量對(duì)應(yīng)的預(yù)測(cè)值時(shí),對(duì)于輸入潛在張量中第一像素位置不計(jì)算上下文特征,針對(duì)輸入潛在張量中第二像素位置和第三像素位置的上下文特征,并基于第二像素位置和第三像素位置的上下文特征,以及目標(biāo)潛在張量,計(jì)算潛在空間的預(yù)測(cè)值。該計(jì)算輸入潛在張量所對(duì)應(yīng)的預(yù)測(cè)值的過(guò)程中,由于無(wú)需計(jì)算第一像素位置對(duì)應(yīng)的上下文特征,因此提高了計(jì)算潛在空間的預(yù)測(cè)值的效率。上述計(jì)算輸入潛在張量所對(duì)應(yīng)的預(yù)測(cè)值的方式,在計(jì)算第二像素位置和第三像素位置的上下文特征時(shí),不僅可以利用到當(dāng)前像素的左上方的元素,還可以利用到當(dāng)前像素的右下方的元素,從而可以提高計(jì)算的上下文特征的準(zhǔn)確性。
28、在解碼器中獲取輸出潛在張量時(shí),由于無(wú)需計(jì)算第一像素位置對(duì)應(yīng)的上下文特征,因此提高了計(jì)算潛在空間的預(yù)測(cè)值的效率。上述獲取輸出潛在張量時(shí),在計(jì)算第二像素位置和第三像素位置的上下文特征時(shí),不僅可以利用到當(dāng)前像素的左上方的元素,還可以利用到當(dāng)前像素的右下方的元素,從而可以提高計(jì)算的上下文特征的準(zhǔn)確性。
1.一種預(yù)測(cè)值確定方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述第一掩膜卷積核的尺寸為5×5,所述第二掩膜卷積核的尺寸為3×3。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將第一上下文特征、第二上下文特征和目標(biāo)潛在張量進(jìn)行熵概率推導(dǎo),以得到輸入潛在張量中所有像素位置對(duì)應(yīng)的預(yù)測(cè)值,包括:
4.一種預(yù)測(cè)值確定方法,其特征在于,包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述將所述第一上下文特征、所述第二上下文特征和所述目標(biāo)潛在張量經(jīng)過(guò)熵概率推導(dǎo),可以得到對(duì)應(yīng)于所有像素位置的預(yù)測(cè)值之后,所述方法還包括:
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述第一掩膜卷積核的尺寸為5×5,所述第二掩膜卷積核的尺寸為3×3。
7.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述將所述第一上下文特征、所述第二上下文特征和所述目標(biāo)潛在張量經(jīng)過(guò)熵概率推導(dǎo),以得到對(duì)應(yīng)于所有像素位置的預(yù)測(cè)值,包括:
8.一種編碼設(shè)備,其特征在于,包括:處理器、存儲(chǔ)器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至3任一項(xiàng)所述的所述預(yù)測(cè)值確定方法。
9.一種解碼設(shè)備,其特征在于,包括:處理器、存儲(chǔ)器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求4至7任一項(xiàng)所述的所述預(yù)測(cè)值確定方法。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,包括:所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至3任一項(xiàng)所述的所述預(yù)測(cè)值確定方法,或者,如權(quán)利要求4至7任一項(xiàng)所述的所述預(yù)測(cè)值確定方法。