預(yù)測(cè)值確定方法、編碼設(shè)備、解碼設(shè)備及存儲(chǔ)介質(zhì)與流程

文檔序號(hào)：40280151發(fā)布日期：2024-12-11 13:18閱讀：32來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

預(yù)測(cè)值確定方法、編碼設(shè)備、解碼設(shè)備及存儲(chǔ)介質(zhì)與流程

本申請(qǐng)涉及圖像編解碼，尤其涉及一種預(yù)測(cè)值確定方法、編碼設(shè)備、解碼設(shè)備及存儲(chǔ)介質(zhì)。

背景技術(shù)：

1、圖像壓縮是計(jì)算機(jī)視覺(jué)和圖像處理的基本任務(wù)之一。有損圖像壓縮技術(shù)的發(fā)展給各個(gè)領(lǐng)域帶來(lái)了好處，圖像壓縮技術(shù)可以大大降低圖像存儲(chǔ)和圖像傳輸?shù)臄?shù)據(jù)量，但是在重建圖像后得到的圖像質(zhì)量可能會(huì)略有下降。近年來(lái)，深度神經(jīng)網(wǎng)絡(luò)在各種任務(wù)中取得了巨大的成功，基于深度神經(jīng)網(wǎng)絡(luò)的圖像壓縮已經(jīng)開(kāi)始超越傳統(tǒng)的圖像壓縮技術(shù)。jpeg?ai是聯(lián)合圖像專家小組(jpeg)創(chuàng)建的一個(gè)基于學(xué)習(xí)的圖像編碼標(biāo)準(zhǔn)。jpeg?ai驗(yàn)證模型針對(duì)人眼視覺(jué)與傳統(tǒng)的圖像編碼相比，在相同的主觀質(zhì)量下，獲得了更低的碼率。

2、jpeg?ai驗(yàn)證模型的上下文模型網(wǎng)絡(luò)中，為了實(shí)現(xiàn)并行處理采用卷積核計(jì)算當(dāng)前像素的元素的上下文特征，在計(jì)算當(dāng)前像素的元素的上下文特征時(shí)，只關(guān)注當(dāng)前像素的左上方的元素，沒(méi)有關(guān)注到當(dāng)前像素周圍的其他元素，并沒(méi)有利用到當(dāng)前像素的右下方的其他元素，因此得到的上下文特征的準(zhǔn)確性較低。

技術(shù)實(shí)現(xiàn)思路

1、為了解決上述技術(shù)問(wèn)題或者至少部分地解決上述技術(shù)問(wèn)題，本申請(qǐng)?zhí)峁┝艘环N預(yù)測(cè)值確定方法、編碼設(shè)備、解碼設(shè)備及存儲(chǔ)介質(zhì)。

2、為了實(shí)現(xiàn)上述目的，本申請(qǐng)一些實(shí)施例提供的技術(shù)方案如下：

3、第一方面，提供一種預(yù)測(cè)值確定方法，包括：

4、對(duì)輸入潛在張量對(duì)應(yīng)的潛在空間中的第三像素位置進(jìn)行置零操作，以得到第一潛在張量；

5、通過(guò)第一掩膜卷積核對(duì)所述第一潛在張量進(jìn)行卷積運(yùn)算，以得到對(duì)應(yīng)于第三像素位置的第一上下文特征；

6、對(duì)輸入潛在張量對(duì)應(yīng)的潛在空間中第二像素位置、第三像素位置進(jìn)行置零操作，以得到第二潛在張量；

7、通過(guò)第二掩膜卷積核對(duì)所述第二潛在張量進(jìn)行卷積運(yùn)算，以得到對(duì)應(yīng)于第二像素位置的第二上下文特征；

8、將第一上下文特征、第二上下文特征和目標(biāo)潛在張量進(jìn)行熵概率推導(dǎo)，以得到輸入潛在張量中所有像素位置對(duì)應(yīng)的預(yù)測(cè)值；

9、其中，所述潛在空間中，每個(gè)2×2的塊左上角對(duì)應(yīng)第一像素位置、每個(gè)2×2的塊右下角對(duì)應(yīng)所述第二像素位置、每個(gè)2×2的塊右上角和左下角對(duì)應(yīng)所述第三像素位置。

10、第二方面，提供一種預(yù)測(cè)值確定方法，包括：

11、對(duì)目標(biāo)潛在張量進(jìn)行卷積處理，以計(jì)算所述目標(biāo)潛在張量的潛在空間中第一像素位置對(duì)應(yīng)的預(yù)測(cè)值，所述目標(biāo)潛在張量為對(duì)第一碼流進(jìn)行熵解碼和超先驗(yàn)解碼處理后得到的潛在張量；

12、將第一殘差張量與所述第一像素位置對(duì)應(yīng)的預(yù)測(cè)值相加，以獲取第二潛在張量，所述第一殘差張量為目標(biāo)殘差張量中所述第一像素位置對(duì)應(yīng)的殘差張量，所述目標(biāo)殘差張量為對(duì)第二碼流進(jìn)行熵解碼和逆增益處理后得到的殘差張量；

13、通過(guò)第二掩膜卷積核對(duì)第二潛在張量進(jìn)行卷積運(yùn)算，以得到對(duì)應(yīng)于第二像素位置的第二上下文特征；

14、將所述第二上下文特征和所述目標(biāo)潛在張量經(jīng)過(guò)熵概率推導(dǎo)，可以得到對(duì)應(yīng)于兩個(gè)像素位置的預(yù)測(cè)值；

15、將第二殘差張量與兩個(gè)像素位置的預(yù)測(cè)值相加，以獲取第一潛在張量，所述第二殘差張量為所述目標(biāo)殘差張量中所述第一像素位置和所述第二像素位置對(duì)應(yīng)的殘差張量；

16、通過(guò)第一掩膜卷積核對(duì)第一潛在張量進(jìn)行卷積運(yùn)算，以得到對(duì)應(yīng)于第三像素位置的第一上下文特征；

17、將所述第一上下文特征、所述第二上下文特征和所述目標(biāo)潛在張量經(jīng)過(guò)熵概率推導(dǎo)，以得到對(duì)應(yīng)于所有像素位置的預(yù)測(cè)值；

18、其中，所述潛在空間中，每個(gè)2×2的塊左上角對(duì)應(yīng)所述第一像素位置、每個(gè)2×2的塊右下角對(duì)應(yīng)所述第二像素位置、每個(gè)2×2的塊右上角和左下角對(duì)應(yīng)所述第三像素位置。

19、第三方面，提供一種編碼設(shè)備，包括：處理器、存儲(chǔ)器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序，所述計(jì)算機(jī)程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面或其任意一種可選的實(shí)施方式所述的所述預(yù)測(cè)值確定方法。

20、第四方面，提供一種解碼設(shè)備，包括：處理器、存儲(chǔ)器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序，所述計(jì)算機(jī)程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如第二方面或其任意一種可選的實(shí)施方式所述的預(yù)測(cè)值確定方法。

21、第五方面，提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，包括：所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)計(jì)算機(jī)程序，所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)以下至少一種方法：：

22、第一方面或其任意一種可選的實(shí)施方式所述的預(yù)測(cè)值確定方法；

23、第二方面或其任意一種可選的實(shí)施方式所述的預(yù)測(cè)值確定方法。

24、第六方面，提供一種計(jì)算機(jī)程序產(chǎn)品，所述計(jì)算機(jī)程序產(chǎn)品中存儲(chǔ)計(jì)算機(jī)程序，所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)以下至少一種方法：

25、第一方面或其任意一種可選的實(shí)施方式所述的預(yù)測(cè)值確定方法；

26、第二方面或其任意一種可選的實(shí)施方式所述的預(yù)測(cè)值確定方法。

27、本申請(qǐng)?zhí)峁┑念A(yù)測(cè)值確定方法，在編碼器中計(jì)算上下文模型網(wǎng)絡(luò)的輸入潛在張量對(duì)應(yīng)的預(yù)測(cè)值時(shí)，對(duì)于輸入潛在張量中第一像素位置不計(jì)算上下文特征，針對(duì)輸入潛在張量中第二像素位置和第三像素位置的上下文特征，并基于第二像素位置和第三像素位置的上下文特征，以及目標(biāo)潛在張量，計(jì)算潛在空間的預(yù)測(cè)值。該計(jì)算輸入潛在張量所對(duì)應(yīng)的預(yù)測(cè)值的過(guò)程中，由于無(wú)需計(jì)算第一像素位置對(duì)應(yīng)的上下文特征，因此提高了計(jì)算潛在空間的預(yù)測(cè)值的效率。上述計(jì)算輸入潛在張量所對(duì)應(yīng)的預(yù)測(cè)值的方式，在計(jì)算第二像素位置和第三像素位置的上下文特征時(shí)，不僅可以利用到當(dāng)前像素的左上方的元素，還可以利用到當(dāng)前像素的右下方的元素，從而可以提高計(jì)算的上下文特征的準(zhǔn)確性。

28、在解碼器中獲取輸出潛在張量時(shí)，由于無(wú)需計(jì)算第一像素位置對(duì)應(yīng)的上下文特征，因此提高了計(jì)算潛在空間的預(yù)測(cè)值的效率。上述獲取輸出潛在張量時(shí)，在計(jì)算第二像素位置和第三像素位置的上下文特征時(shí)，不僅可以利用到當(dāng)前像素的左上方的元素，還可以利用到當(dāng)前像素的右下方的元素，從而可以提高計(jì)算的上下文特征的準(zhǔn)確性。

技術(shù)特征：

1.一種預(yù)測(cè)值確定方法，其特征在于，包括：

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述第一掩膜卷積核的尺寸為5×5，所述第二掩膜卷積核的尺寸為3×3。

3.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述將第一上下文特征、第二上下文特征和目標(biāo)潛在張量進(jìn)行熵概率推導(dǎo)，以得到輸入潛在張量中所有像素位置對(duì)應(yīng)的預(yù)測(cè)值，包括：

4.一種預(yù)測(cè)值確定方法，其特征在于，包括：

5.根據(jù)權(quán)利要求4所述的方法，其特征在于，所述將所述第一上下文特征、所述第二上下文特征和所述目標(biāo)潛在張量經(jīng)過(guò)熵概率推導(dǎo)，可以得到對(duì)應(yīng)于所有像素位置的預(yù)測(cè)值之后，所述方法還包括：

6.根據(jù)權(quán)利要求4所述的方法，其特征在于，所述第一掩膜卷積核的尺寸為5×5，所述第二掩膜卷積核的尺寸為3×3。

7.根據(jù)權(quán)利要求4所述的方法，其特征在于，所述將所述第一上下文特征、所述第二上下文特征和所述目標(biāo)潛在張量經(jīng)過(guò)熵概率推導(dǎo)，以得到對(duì)應(yīng)于所有像素位置的預(yù)測(cè)值，包括：

8.一種編碼設(shè)備，其特征在于，包括：處理器、存儲(chǔ)器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序，所述計(jì)算機(jī)程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至3任一項(xiàng)所述的所述預(yù)測(cè)值確定方法。

9.一種解碼設(shè)備，其特征在于，包括：處理器、存儲(chǔ)器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序，所述計(jì)算機(jī)程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求4至7任一項(xiàng)所述的所述預(yù)測(cè)值確定方法。

10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，其特征在于，包括：所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)計(jì)算機(jī)程序，所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至3任一項(xiàng)所述的所述預(yù)測(cè)值確定方法，或者，如權(quán)利要求4至7任一項(xiàng)所述的所述預(yù)測(cè)值確定方法。

技術(shù)總結(jié)
本申請(qǐng)涉及一種預(yù)測(cè)值確定方法、編碼設(shè)備、解碼設(shè)備及存儲(chǔ)介質(zhì)。包括：對(duì)輸入潛在張量對(duì)應(yīng)的潛在空間中的第三像素位置進(jìn)行置零操作，以得到第一潛在張量；通過(guò)第一掩膜卷積核對(duì)第一潛在張量進(jìn)行卷積運(yùn)算，以得到對(duì)應(yīng)于第三像素位置的第一上下文特征；對(duì)輸入潛在張量對(duì)應(yīng)的潛在空間中第二像素位置、第三像素位置進(jìn)行置零操作，以得到第二潛在張量；通過(guò)第二掩膜卷積核對(duì)第二潛在張量進(jìn)行卷積運(yùn)算，以得到對(duì)應(yīng)于第二像素位置的第二上下文特征；將第一上下文特征、第二上下文特征和目標(biāo)潛在張量進(jìn)行熵概率推導(dǎo)，以得到輸入潛在張量中所有像素位置對(duì)應(yīng)的預(yù)測(cè)值。

技術(shù)研發(fā)人員：王瑾,施云惠,王鵬權(quán),李斌,邢芳,王之奎
受保護(hù)的技術(shù)使用者：海信視像科技股份有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/10

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：王瑾,施云惠,王鵬權(quán),李斌,邢芳,王之奎
技術(shù)所有人：海信視像科技股份有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開(kāi)發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開(kāi)發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

預(yù)測(cè)值確定方法、編碼設(shè)備、解碼設(shè)備及存儲(chǔ)介質(zhì)與流程

預(yù)測(cè)值確定方法、編碼設(shè)備、解碼設(shè)備及存儲(chǔ)介質(zhì)與流程