適應(yīng)于目標(biāo)檢測的高效圖像數(shù)據(jù)智能增強(qiáng)轉(zhuǎn)碼方法、系統(tǒng)

文檔序號：40396361發(fā)布日期：2024-12-20 12:19閱讀：4來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明屬于圖像處理，尤其涉及適應(yīng)于目標(biāo)檢測的高效圖像數(shù)據(jù)智能增強(qiáng)轉(zhuǎn)碼方法、系統(tǒng)。

背景技術(shù)：

1、在大數(shù)據(jù)時(shí)代背景下，深度學(xué)習(xí)模型，尤其是目標(biāo)檢測模型，需要處理的數(shù)據(jù)量和復(fù)雜性顯著增加。yolo（you?only?look?once）等目標(biāo)檢測模型在實(shí)時(shí)檢測任務(wù)中表現(xiàn)出色，但它們對數(shù)據(jù)集的依賴性很強(qiáng)。為了提高模型的泛化能力和性能，數(shù)據(jù)增強(qiáng)成為了一個(gè)關(guān)鍵步驟。然而，數(shù)據(jù)增強(qiáng)后的注釋更新是一個(gè)技術(shù)挑戰(zhàn)，尤其是在大規(guī)模數(shù)據(jù)集上。數(shù)據(jù)增強(qiáng)不僅能夠擴(kuò)展數(shù)據(jù)集，還能提高模型的泛化能力。在現(xiàn)有的技術(shù)中，主要通過隨機(jī)剪裁、隨機(jī)翻轉(zhuǎn)、隨機(jī)旋轉(zhuǎn)、顏色處理和隨機(jī)縮放等方式對圖像進(jìn)行數(shù)據(jù)增強(qiáng)。在大數(shù)據(jù)時(shí)代，數(shù)據(jù)的規(guī)模和多樣性不斷增加，這要求目標(biāo)檢測模型能夠處理更大規(guī)模的數(shù)據(jù)集。同時(shí)，數(shù)據(jù)增強(qiáng)和注釋更新的自動(dòng)化、效率和準(zhǔn)確性變得更加重要。

2、目前，主流的數(shù)據(jù)增強(qiáng)庫如pytorch和tensorflow提供了豐富的圖像增強(qiáng)功能，但在注釋更新方面的支持卻相對有限。這意味著在對圖像進(jìn)行增強(qiáng)后，開發(fā)者需要手動(dòng)更新注釋，這不僅耗時(shí)且容易出錯(cuò)。為了應(yīng)對這一挑戰(zhàn)，一些工具和庫如albumentations開始引入注釋自動(dòng)更新功能，然而，這些方法在處理大規(guī)模數(shù)據(jù)集時(shí)表現(xiàn)不佳，速度成為制約其實(shí)際應(yīng)用的關(guān)鍵因素。

3、通過上述分析，現(xiàn)有技術(shù)存在的問題及缺陷為：在大數(shù)據(jù)時(shí)代，處理和分析海量數(shù)據(jù)集成為了一個(gè)迫切的需求。傳統(tǒng)的數(shù)據(jù)處理方法往往面臨著性能瓶頸，無法有效地應(yīng)對數(shù)據(jù)量的急劇增加。第一手動(dòng)更新注釋的過程非常繁瑣，對于大規(guī)模數(shù)據(jù)集來說幾乎是不可行的。尤其是在處理數(shù)千萬甚至數(shù)億張圖像時(shí)，手動(dòng)標(biāo)注和更新注釋的工作量巨大，效率低下，極大地限制了數(shù)據(jù)增強(qiáng)技術(shù)的應(yīng)用范圍。

4、即使一些工具如python的albumentations庫提供了注釋自動(dòng)更新功能，其處理速度也難以滿足實(shí)際需求。以處理一萬張圖像為例，雖然這一數(shù)量在小規(guī)模數(shù)據(jù)集上表現(xiàn)尚可，但在面對更大規(guī)模的數(shù)據(jù)集時(shí)，其速度顯得捉襟見肘。這主要是由于現(xiàn)有方法在設(shè)計(jì)和實(shí)現(xiàn)上未能充分優(yōu)化計(jì)算效率，導(dǎo)致在處理高維度數(shù)據(jù)和復(fù)雜操作時(shí)出現(xiàn)性能瓶頸。

技術(shù)實(shí)現(xiàn)思路

1、為克服相關(guān)技術(shù)中存在的問題，本發(fā)明公開實(shí)施例提供了適應(yīng)于目標(biāo)檢測的高效圖像數(shù)據(jù)智能增強(qiáng)轉(zhuǎn)碼方法、系統(tǒng)。本發(fā)明的目的是提供一種高效且能夠自動(dòng)更新圖像增強(qiáng)數(shù)據(jù)集注釋的技術(shù)，并能夠?qū)崿F(xiàn)目標(biāo)檢測領(lǐng)域中常用的三種注釋格式（xml，json，txt）之間的相互轉(zhuǎn)換，這種技術(shù)極大的縮短了增強(qiáng)數(shù)據(jù)所用的時(shí)間。通過這種技術(shù)，用戶可以節(jié)約大量的算力和時(shí)間成本，能夠更有效地進(jìn)行數(shù)據(jù)集的維護(hù)和擴(kuò)展，提高圖像處理和目標(biāo)檢測算法的訓(xùn)練效率和準(zhǔn)確性。同時(shí)，此系統(tǒng)支持注釋格式的多格式靈活轉(zhuǎn)換，極大地提升了其應(yīng)用的通用性和便捷性。

2、所述技術(shù)方案如下：適應(yīng)于目標(biāo)檢測的高效圖像數(shù)據(jù)智能增強(qiáng)轉(zhuǎn)碼方法，將所有隨機(jī)剪裁、隨機(jī)翻轉(zhuǎn)、隨機(jī)旋轉(zhuǎn)操作的結(jié)果記錄在一個(gè)中央化的文本文件中，在大規(guī)模圖像數(shù)據(jù)處理中，用于提高圖像數(shù)據(jù)增強(qiáng)的效率和速度；該方法具體包括以下步驟：

3、s1，對原始數(shù)據(jù)集利用隨機(jī)旋轉(zhuǎn)、隨機(jī)翻轉(zhuǎn)、隨機(jī)剪裁、顏色處理、隨機(jī)縮放五種數(shù)據(jù)增強(qiáng)的方式進(jìn)行圖像增強(qiáng)，獲取相對應(yīng)的增強(qiáng)數(shù)據(jù)集；所述相對應(yīng)的增強(qiáng)數(shù)據(jù)集包括隨機(jī)旋轉(zhuǎn)增強(qiáng)數(shù)據(jù)集、隨機(jī)翻轉(zhuǎn)增強(qiáng)數(shù)據(jù)集、隨機(jī)剪裁增強(qiáng)數(shù)據(jù)集、顏色處理增強(qiáng)數(shù)據(jù)集、隨機(jī)縮放增強(qiáng)數(shù)據(jù)集；

4、s2，將獲得的隨機(jī)旋轉(zhuǎn)增強(qiáng)數(shù)據(jù)集、隨機(jī)翻轉(zhuǎn)增強(qiáng)數(shù)據(jù)集、隨機(jī)剪裁增強(qiáng)數(shù)據(jù)集導(dǎo)出，同時(shí)結(jié)合創(chuàng)建的圖像數(shù)據(jù)集注釋格式轉(zhuǎn)換程序轉(zhuǎn)換的txt注釋文件，分別相應(yīng)記錄到隨機(jī)剪裁記錄.txt文件、隨機(jī)翻轉(zhuǎn)記錄.txt文件以及隨機(jī)旋轉(zhuǎn)記錄.txt文件；

5、s3，將隨機(jī)剪裁記錄.txt文件、隨機(jī)翻轉(zhuǎn)記錄.txt文件以及隨機(jī)旋轉(zhuǎn)記錄.txt文件分別進(jìn)行圖像注釋更新，獲得相對應(yīng)的新注釋集。

6、在步驟s1中，對顏色處理增強(qiáng)數(shù)據(jù)集、隨機(jī)縮放增強(qiáng)數(shù)據(jù)集沿用原圖像進(jìn)行注釋。

7、在步驟s2中，創(chuàng)建的圖像數(shù)據(jù)集注釋格式轉(zhuǎn)換程序包括xml2txt、json2txt；

8、該圖像數(shù)據(jù)集注釋格式轉(zhuǎn)換程序?qū)膒ascal?voc格式的xml注釋文件中提取目標(biāo)檢測的邊界框信息，并將xml注釋文件轉(zhuǎn)換為yolo格式的txt注釋文件。

9、在步驟s3中，隨機(jī)剪裁記錄.txt文件進(jìn)行圖像注釋更新，獲得新注釋集包括：

10、剪裁后圖像的寬高分別為，計(jì)算公式為：

11、；

12、；

13、式中，為剪裁后圖像右下角的坐標(biāo)，為剪裁后圖像左上角的坐標(biāo)，為剪裁后圖像右下角的坐標(biāo)，為剪裁后圖像左上角的坐標(biāo)；

14、以剪裁后圖像的左上角為原點(diǎn)，新邊界框的坐標(biāo)發(fā)生偏移，為新邊界框中心點(diǎn)的坐標(biāo)，為新邊界框的寬高，計(jì)算公式為：

15、；

16、；

17、；

18、；

19、式中，為新邊界框左上角的坐標(biāo)，為新邊界框左上角的坐標(biāo)，為新邊界框右下角的坐標(biāo)，為新邊界框右下角的坐標(biāo)；

20、得到新邊界框的后，進(jìn)行比例縮放，得到剪裁后圖像的注釋。

21、得到剪裁后圖像的注釋計(jì)算公式為：

22、；

23、；

24、；

25、；

26、式中，為剪裁后圖像的寬，為剪裁后圖像的高。

27、在步驟s3中，隨機(jī)翻轉(zhuǎn)記錄.txt文件進(jìn)行圖像注釋更新，獲得新注釋集包括：

28、記錄對應(yīng)的原始注釋為，其中，為類別，為邊界框中心點(diǎn)的橫坐標(biāo)，為邊界框中心點(diǎn)的縱坐標(biāo)，為邊界框的寬，為邊界框的高；

29、為邊界框相對于原圖像的比例大小，以左上角為原點(diǎn)，更新后的注釋為。

30、在步驟s3中，隨機(jī)旋轉(zhuǎn)記錄.txt文件進(jìn)行圖像注釋更新，獲得新注釋集包括：

31、若隨機(jī)旋轉(zhuǎn)記錄.txt文件的第一條記錄為，其中，為文件名，為旋轉(zhuǎn)角度，為原始圖像的寬，為原始圖像的高；

32、如果圖像旋轉(zhuǎn)的角度為逆時(shí)針，則更新逆時(shí)針旋轉(zhuǎn)后圖像注釋的計(jì)算，其中，，，分別為旋轉(zhuǎn)后圖像的寬、高，表達(dá)式為：

33、；

34、；

35、；

36、；

37、；

38、；

39、；

40、；

41、式中，分別為逆時(shí)針旋轉(zhuǎn)圖像中的各邊長；

42、根據(jù)公式（17）、公式（18），求得新標(biāo)注框的寬高后，依照公式（7）-公式（10）對新標(biāo)注框的寬高及中心的坐標(biāo)進(jìn)行比例縮放，最后更新逆時(shí)針旋轉(zhuǎn)后圖像的注釋。

43、如果圖像旋轉(zhuǎn)的角度為順時(shí)針，則更新順時(shí)針旋轉(zhuǎn)后圖像注釋的計(jì)算，其中，為旋轉(zhuǎn)角的絕對值，順時(shí)針旋轉(zhuǎn)的角度為負(fù)數(shù)，逆時(shí)針旋轉(zhuǎn)的角度為正數(shù)，；

44、；

45、。

46、其中，分別為順時(shí)針旋轉(zhuǎn)圖像中的各邊長。

47、本發(fā)明的另一目的在于提供一種適應(yīng)于目標(biāo)檢測的高效圖像數(shù)據(jù)智能增強(qiáng)轉(zhuǎn)碼系統(tǒng)，該系統(tǒng)實(shí)施所述適應(yīng)于目標(biāo)檢測的高效圖像數(shù)據(jù)智能增強(qiáng)轉(zhuǎn)碼方法，該系統(tǒng)包括：

48、圖像增強(qiáng)模塊，用于對原始數(shù)據(jù)集利用隨機(jī)旋轉(zhuǎn)、隨機(jī)翻轉(zhuǎn)、隨機(jī)剪裁、顏色處理、隨機(jī)縮放五種數(shù)據(jù)增強(qiáng)的方式進(jìn)行圖像增強(qiáng)，獲取相對應(yīng)的增強(qiáng)數(shù)據(jù)集；所述相對應(yīng)的增強(qiáng)數(shù)據(jù)集包括隨機(jī)旋轉(zhuǎn)增強(qiáng)數(shù)據(jù)集、隨機(jī)翻轉(zhuǎn)增強(qiáng)數(shù)據(jù)集、隨機(jī)剪裁增強(qiáng)數(shù)據(jù)集、顏色處理增強(qiáng)數(shù)據(jù)集、隨機(jī)縮放增強(qiáng)數(shù)據(jù)集；

49、記錄.txt文件獲取模塊，用于將獲得的隨機(jī)旋轉(zhuǎn)增強(qiáng)數(shù)據(jù)集、隨機(jī)翻轉(zhuǎn)增強(qiáng)數(shù)據(jù)集、隨機(jī)剪裁增強(qiáng)數(shù)據(jù)集導(dǎo)出，同時(shí)結(jié)合創(chuàng)建的圖像數(shù)據(jù)集注釋格式轉(zhuǎn)換程序轉(zhuǎn)換的txt注釋文件，分別相應(yīng)記錄到隨機(jī)剪裁記錄.txt文件、隨機(jī)翻轉(zhuǎn)記錄.txt文件以及隨機(jī)旋轉(zhuǎn)記錄.txt文件；

50、新注釋集獲得模塊，用于將隨機(jī)剪裁記錄.txt文件、隨機(jī)翻轉(zhuǎn)記錄.txt文件以及隨機(jī)旋轉(zhuǎn)記錄.txt文件分別進(jìn)行圖像注釋更新，獲得相對應(yīng)的新注釋集。

51、進(jìn)一步，該系統(tǒng)搭載在計(jì)算機(jī)可讀存儲介質(zhì)，所述計(jì)算機(jī)可讀存儲介質(zhì)存儲有計(jì)算機(jī)程序，所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)可實(shí)現(xiàn)上述所述適應(yīng)于目標(biāo)檢測的高效圖像數(shù)據(jù)智能增強(qiáng)轉(zhuǎn)碼系統(tǒng)中的功能。

52、結(jié)合上述的所有技術(shù)方案，本發(fā)明所具備的有益效果為：本發(fā)明通過引進(jìn)批量化處理技術(shù)，在速度和通用性上具有顯著的優(yōu)勢，極大地提升了數(shù)據(jù)處理的能力。特別是在深度學(xué)習(xí)和目標(biāo)檢測領(lǐng)域，本發(fā)明的自動(dòng)更新注釋功能顯著提高了數(shù)據(jù)注釋的效率和準(zhǔn)確性，這對于訓(xùn)練高精度的模型非常關(guān)鍵。自動(dòng)更新注釋減少了人工干預(yù)的需要，加速了數(shù)據(jù)準(zhǔn)備過程，使得模型能夠更快地學(xué)習(xí)和適應(yīng)新數(shù)據(jù)。在同樣的硬件環(huán)境下，本發(fā)明為了提高方法的通用性，不僅支持常見的txt格式注釋，還開發(fā)了三種注釋格式（xml、txt、json）之間的相互轉(zhuǎn)換功能。這使得該方法可以廣泛應(yīng)用于各種不同格式的數(shù)據(jù)集，極大地方便了開發(fā)者在不同項(xiàng)目中的使用。

53、本發(fā)明不僅解決了大規(guī)模數(shù)據(jù)集處理的性能瓶頸問題，還為深度學(xué)習(xí)目標(biāo)檢測的實(shí)際應(yīng)用提供了有力的技術(shù)支持。這對于那些需要實(shí)時(shí)或近實(shí)時(shí)數(shù)據(jù)分析和決策支持的大數(shù)據(jù)應(yīng)用場景尤其重要，如視頻監(jiān)控、自動(dòng)駕駛車輛系統(tǒng)、醫(yī)療影像分析等，都將從中受益。這樣的技術(shù)進(jìn)步正是大數(shù)據(jù)時(shí)代所需的創(chuàng)新之舉，可使得數(shù)據(jù)分析和處理更為高效、準(zhǔn)確和實(shí)時(shí)。

54、本發(fā)明實(shí)現(xiàn)了圖像增強(qiáng)數(shù)據(jù)集注釋的高效自動(dòng)化管理，顯著提高了目標(biāo)檢測和圖像處理領(lǐng)域數(shù)據(jù)準(zhǔn)備的效率，并為提高模型訓(xùn)練的速度與準(zhǔn)確性提供了基礎(chǔ)工作，可以使企業(yè)和研究機(jī)構(gòu)在ai視覺模型的開發(fā)與實(shí)施方面獲得競爭優(yōu)勢。此技術(shù)的商業(yè)化將推動(dòng)智能圖像分析技術(shù)的廣泛應(yīng)用，例如在無人駕駛、安防監(jiān)控、醫(yī)療影像分析等多個(gè)領(lǐng)域。

55、在自動(dòng)更新圖像數(shù)據(jù)集注釋及減少磁盤i/o操作方面，目前現(xiàn)有的圖像處理工具或系統(tǒng)未能提供一個(gè)既高效又能節(jié)省系統(tǒng)資源的完整解決方案。此外，本發(fā)明提供的多注釋格式靈活轉(zhuǎn)換功能，也解決了現(xiàn)有技術(shù)中存在的格式依賴性問題，增加了系統(tǒng)的適用性和靈活性。

56、本發(fā)明成功地解決了大規(guī)模圖像數(shù)據(jù)處理時(shí)效率低下和資源消耗大的問題。這是圖像處理和目標(biāo)檢測研究領(lǐng)域長期存在的挑戰(zhàn)，尤其是在處理高清晰度和大容量的圖像數(shù)據(jù)時(shí)。本發(fā)明克服了傳統(tǒng)圖像數(shù)據(jù)處理中存在的技術(shù)偏見，即認(rèn)為高效的圖像數(shù)據(jù)集管理和注釋必須依賴人工操作或者低效的單一注釋格式處理。通過自動(dòng)更新和多注釋格式靈活轉(zhuǎn)換的技術(shù)方案，有效地解決了這一技術(shù)偏見，突破了傳統(tǒng)方法的局限性。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：包興先,李江昊,金晰然,王茂潔,吳微,郝穎奎
技術(shù)所有人：中國石油大學(xué)（華東）
我是此專利的發(fā)明人

上一篇：一種邊坡防護(hù)結(jié)構(gòu)
上一篇：一種帶有自粘功能PETG復(fù)合片材的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

適應(yīng)于目標(biāo)檢測的高效圖像數(shù)據(jù)智能增強(qiáng)轉(zhuǎn)碼方法、系統(tǒng)

適應(yīng)于目標(biāo)檢測的高效圖像數(shù)據(jù)智能增強(qiáng)轉(zhuǎn)碼方法、系統(tǒng)