本申請一些實施例涉及圖像編解碼。更具體地講,涉及一種圖像編碼方法及裝置。
背景技術(shù):
1、目前,圖像/圖像編碼算法普遍是針對人類視覺系統(tǒng)進(jìn)行優(yōu)化,適于人類觀看應(yīng)用,但對于其它應(yīng)用場景,如現(xiàn)在非常常見的圖像處理和機(jī)器視覺應(yīng)用,則沒有進(jìn)行優(yōu)化。對于這些應(yīng)用,往往需要先將圖像完全解碼得到重建圖像/圖像,然后才能將重建圖像/圖像作為這些應(yīng)用的輸入。這一過程復(fù)雜耗時,同時解碼后的有損圖像也往往會對機(jī)器視覺任務(wù)的準(zhǔn)確性產(chǎn)生負(fù)面影響。在保持圖像主觀質(zhì)量不變的情況下減少碼率,同提供一種適合直接作為機(jī)器視覺輸入數(shù)據(jù)的表示已成為一個亟待解決的問題,因此高效的機(jī)器圖像編碼(video?coding?for?machines,vcm)已經(jīng)成為學(xué)術(shù)界和工業(yè)界的一個重要課題。vcm技術(shù)致力于在一定程度上連接圖像/圖像壓縮和特征壓縮這兩個獨立的研究方向,同時盡可能聯(lián)合優(yōu)化高準(zhǔn)確度的機(jī)器視覺任務(wù)和高保真度的人眼視覺重構(gòu)?;诖?,動態(tài)圖像專家組(moving?picture?expert?group,mpeg)成立了一個名為vcm的小組,以研究vcm技術(shù)標(biāo)準(zhǔn)化的需求。jpeg?ai是聯(lián)合圖像專家組(joint?photographic?experts?group,jpeg)創(chuàng)建的一個基于機(jī)器學(xué)習(xí)的可拓展圖像編碼標(biāo)準(zhǔn)。jpeg?ai針對人眼視覺與傳統(tǒng)的圖像編碼相比,在相同的主觀質(zhì)量下,獲得了更低的碼率。同時,jpeg?ai的模型也提出vcm相應(yīng)的需求。
2、基于機(jī)器學(xué)習(xí)的可拓展圖像編碼器中,需要通過上下文網(wǎng)絡(luò)分別預(yù)測增強層潛在特征的上下文特征和基礎(chǔ)層潛在特征的上下文特征。目前,相關(guān)技術(shù)普遍是基于增強層量化潛在特征和基礎(chǔ)層量化潛在特征分別來預(yù)測增強層上下文特征和基礎(chǔ)層上下文特征的,未能充分利用增強層量化潛在特征與基礎(chǔ)層量化潛在特征之間的關(guān)聯(lián)關(guān)系。因此基于機(jī)器學(xué)習(xí)的可拓展圖像編碼器的性能還有待進(jìn)一步提升。
技術(shù)實現(xiàn)思路
1、本申請示例性的實施方式提供一種圖像編碼方法及裝置,用于提升基于機(jī)器學(xué)習(xí)的可拓展圖像編碼器的編碼性能以及機(jī)器視覺性能。
2、本申請一些實施例提供技術(shù)方案如下:
3、第一方面,本申請一些實施例提供了一種圖像編碼方法,包括:
4、獲取目標(biāo)圖像的潛在特征;
5、根據(jù)所述潛在特征獲取基礎(chǔ)層重建潛在特征和增強層重建潛在特征;
6、基于預(yù)設(shè)量化參數(shù)對所述潛在特征進(jìn)行量化處理,以獲取量化潛在特征;
7、根據(jù)所述量化潛在特征獲取基礎(chǔ)層量化潛在特征和增強層量化潛在特征;
8、根據(jù)所述增強層重建潛在特征和已完成編碼的增強層量化潛在特征,獲取增強層上下文特征;
9、根據(jù)所述增強層上下文特征對所述增強層量化潛在特征的一下元素進(jìn)行編碼;
10、根據(jù)所述增強層量化潛在特征、所述基礎(chǔ)層重建潛在特征和已完成編碼的基礎(chǔ)層量化潛在特征,獲取基礎(chǔ)層上下文特征;
11、根據(jù)所述基礎(chǔ)層上下文特征對所述基礎(chǔ)層量化潛在特征的一下元素進(jìn)行編碼;
12、根據(jù)所述增強層量化潛在特征的編碼數(shù)據(jù)和所述基礎(chǔ)層量化潛在特征的編碼數(shù)據(jù)生成所述目標(biāo)圖像的編碼數(shù)據(jù)。
13、第二方面,本申請一些實施例提供了一種圖像編碼裝置,包括:
14、存儲器,被配置為存儲計算機(jī)程序;
15、處理器,被配置為用于在調(diào)用計算機(jī)程序時,使得所述圖像編碼裝置實現(xiàn)第一方面所述的圖像編碼方法。
16、第三方面,本申請一些實施例提供了一種計算機(jī)可讀存儲介質(zhì),所述計算機(jī)可讀存儲介質(zhì)上存儲有計算機(jī)程序,當(dāng)所述計算機(jī)程序被計算設(shè)備執(zhí)行時,使得所述計算設(shè)備實現(xiàn)第一方面所述的圖像編碼方法。
17、第四方面,本申請一些實施例提供了一種計算機(jī)程序產(chǎn)品,當(dāng)所述計算機(jī)程序產(chǎn)品在計算機(jī)上運行時,使得所述計算機(jī)實現(xiàn)第一方面所述圖像編碼方法。
18、由以上技術(shù)方案可知,本申請實施例提供的圖像編碼方法在對目標(biāo)圖像進(jìn)行編碼時,首先獲取目標(biāo)圖像的潛在特征,然后根據(jù)所述潛在特征獲取基礎(chǔ)層重建潛在特征和增強層重建潛在特征,基于預(yù)設(shè)量化參數(shù)對所述潛在特征進(jìn)行量化處理,以獲取量化潛在特征,根據(jù)所述量化潛在特征獲取基礎(chǔ)層量化潛在特征和增強層量化潛在特征,再根據(jù)所述增強層重建潛在特征和已完成編碼的增強層量化潛在特征,獲取增強層上下文特征,以及根據(jù)所述增強層上下文特征對所述增強層量化潛在特征的一下元素進(jìn)行編碼,根據(jù)所述增強層量化潛在特征、所述基礎(chǔ)層重建潛在特征和已完成編碼的基礎(chǔ)層量化潛在特征,獲取基礎(chǔ)層上下文特征;根據(jù)所述基礎(chǔ)層上下文特征對所述基礎(chǔ)層量化潛在特征的一下元素進(jìn)行編碼,最后根據(jù)所述增強層量化潛在特征的編碼數(shù)據(jù)和所述基礎(chǔ)層量化潛在特征的編碼數(shù)據(jù)生成所述目標(biāo)圖像的編碼數(shù)據(jù)。由于本申請實施例在預(yù)測基礎(chǔ)層上下文特征時不但使用了基礎(chǔ)層重建潛在特征和已完成編碼的基礎(chǔ)層量化潛在特征,而且還使用了增強層量化潛在特征,因此本申請實施例可以更加充分的利用增強層量化潛在特征與基礎(chǔ)層量化潛在特征之間的關(guān)聯(lián)關(guān)系,進(jìn)而更加準(zhǔn)確的預(yù)測基礎(chǔ)層上下文特征,因此本申請實施例可以提升基于機(jī)器學(xué)習(xí)的可拓展圖像編碼器的編碼性能以及機(jī)器視覺性能。
1.一種圖像編碼方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述增強層重建潛在特征和已完成編碼的增強層量化潛在特征,獲取增強層上下文特征,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述增強層量化潛在特征、所述基礎(chǔ)層重建潛在特征和已完成編碼的基礎(chǔ)層量化潛在特征,獲取基礎(chǔ)層上下文特征,包括:
4.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,所述通道上下文模塊包括:依次串接的第一卷積層、第一激活函數(shù)層、第二卷積層、第二激活函數(shù)層以及第三卷積層。
5.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,所述熵參數(shù)模塊由于多個串接的卷積層組成。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述潛在特征獲取基礎(chǔ)層重建潛在特征和增強層重建潛在特征,包括:
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述潛在特征獲取基礎(chǔ)層重建潛在特征和增強層重建潛在特征,包括:
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述量化潛在特征獲取基礎(chǔ)層量化潛在特征和增強層量化潛在特征,包括:
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述基于通道注意力機(jī)制對所述量化潛在特征進(jìn)行處理,以獲取通道注意力掩碼,包括:
10.一種圖像編碼裝置,其特征在于,包括: