本技術涉及圖像處理,具體而言,涉及一種信息提取模型訓練方法、對象信息提取方法、裝置及系統(tǒng)。
背景技術:
1、在一些智能化的系統(tǒng)中,需要進行線性或帶狀物的識別。例如,在棉田的智能化管理場景中,需要識別出棉行,從而利用識別出的棉行進行出苗率統(tǒng)計、雜草識別、作業(yè)導航等。又例如,在無人機飛行控制場景中,需要識別電線、電線桿等線性或帶狀障礙物,以根據(jù)識別到的電線、電線桿等進行避障。
2、現(xiàn)有技術中,可以通過訓練神經(jīng)網(wǎng)絡模型,將待識別區(qū)域的圖像輸入神經(jīng)網(wǎng)絡模型,由神經(jīng)網(wǎng)絡模型識別并輸出圖像中的線性或帶狀物的位置。
3、但是,現(xiàn)有技術的方法存在運算復雜度過高、適用性較差的問題。
技術實現(xiàn)思路
1、本技術的目的在于,針對上述現(xiàn)有技術中的不足,提供一種信息提取模型訓練方法、對象信息提取方法、裝置及系統(tǒng),以解決現(xiàn)有技術中運算復雜度過高、適用性較差的問題。
2、為實現(xiàn)上述目的,本技術實施例采用的技術方案如下:
3、第一方面,本技術提供一種信息提取模型訓練方法,包括:
4、利用訓練樣本集對初始提取模型進行迭代訓練,直至滿足預設迭代停止條件;其中,所述訓練樣本集包括由直線檢測結果表征的學習樣本、以及基于所述直線檢測結果進行標注得到的標簽信息;所述學習樣本通過對原始圖像進行霍夫直線檢測得到,所述原始圖像包括線型或帶型的目標對象;所述標簽信息用于表征所述目標對象在所述原始圖像中的真實位置;
5、在所述初始提取模型滿足預設迭代停止條件時,將當前的初始提取模型確定為信息提取模型。
6、作為一種可能的實現(xiàn)方式,所述利用訓練樣本集對初始提取模型進行迭代訓練,包括:
7、向當前初始提取模型輸入學習樣本,以得到當前初始提取模型基于學習樣本輸出的當前預測結果;
8、根據(jù)當前預測結果、當前標簽信息和預設的樣本權重構建得到當前損失函數(shù);
9、利用當前損失函數(shù)對當前初始提取模型進行反向傳播,以更新當前初始提取模型的模型參數(shù)。
10、作為一種可能的實現(xiàn)方式,所述根據(jù)當前預測結果、當前標簽信息和預設的樣本權重構建得到當前損失函數(shù),包括:
11、確定當前標簽信息與當前預測結果的交并比;
12、以所述樣本權重作為影響因子,確定當前標簽信息與當前預測結果的交叉熵;
13、基于所述交并比和所述交叉熵,構建得到當前損失函數(shù)。
14、作為一種可能的實現(xiàn)方式,所述訓練樣本集通過以下步驟獲?。?/p>
15、獲取多張原始圖像;
16、對所述多張原始圖像分別進行圖像變換,得到多張變換后圖像,變換后圖像為原始圖像的二值化圖像或者掩膜圖像;
17、對所述多張變換后圖像分別進行霍夫直線檢測,得到多個直線檢測結果,并將所述多個直線檢測結果作為所述學習樣本;其中,所述直線檢測結果包括多行元素,各元素分別對應所述原始圖像中的一條直線,各元素的位置分別用于表征對應的一條直線在原始圖像中的位置,各元素的元素值用于表征所述直線的可靠程度;
18、根據(jù)所述多行元素的元素值,確定用于表征目標對象在原始圖像中的真實位置的關鍵結果信息,并將所述關鍵結果信息作為所述標簽信息。
19、作為一種可能的實現(xiàn)方式,所述根據(jù)所述多行元素的元素值,確定用于表征目標對象在原始圖像中的真實位置的關鍵結果信息,包括:
20、根據(jù)所述多行元素的元素值,確定多個關鍵因子信息,所述關鍵因子信息包括:空隙密度以及條帶元素平均值;
21、根據(jù)所述多個關鍵因子信息,確定所述關鍵結果信息。
22、作為一種可能的實現(xiàn)方式,所述多行元素存儲于二維數(shù)組中,各元素在所述二維數(shù)組中的位置分別用于表征對應的一條直線在原始圖像中的位置,各元素在所述二維數(shù)組中的元素值用于指示霍夫空間中經(jīng)過所述二維數(shù)組中的位置所對應的點的直線數(shù)量;
23、所述根據(jù)所述多行元素的元素值,確定多個關鍵因子信息,包括:
24、根據(jù)所述二維數(shù)組各行中的元素的元素值,確定各行中的條帶元素和非條帶元素;
25、分別計算各行中非條帶元素的數(shù)量與各行中條帶元素和非條帶元素的數(shù)量總和的比值,得到各行的空隙密度;
26、分別計算各行中條帶元素的元素值的平均值,得到各行的條帶元素平均值。
27、作為一種可能的實現(xiàn)方式,所述根據(jù)所述多個關鍵因子信息,確定所述關鍵結果信息,包括:
28、分別計算各行的空隙密度和條帶元素平均值的乘積,得到各行的表征程度值;
29、將表征程度值最大的行的各元素,作為所述關鍵結果信息。
30、作為一種可能的實現(xiàn)方式,確定所述關鍵結果信息之后,所述方法還包括:
31、根據(jù)所述關鍵結果信息所在行中的各元素的元素值,得到至少一個連續(xù)元素序列;
32、根據(jù)所述連續(xù)元素序列中的各元素的元素值,進行閾值選取,得到所述連續(xù)元素序列的初始去噪閾值;
33、基于所述初始去噪閾值、或基于所述初始去噪閾值與預設系數(shù),對所述連續(xù)元素序列中的元素進行過濾處理,以得到去噪后的關鍵結果信息。
34、作為一種可能的實現(xiàn)方式,所述對所述多張變換后圖像分別進行霍夫直線檢測,得到多個直線檢測結果,包括:
35、以各所述變換后圖像的中心點作為極坐標系原點,對所述變換后圖像進行霍夫直線檢測,得到所述直線檢測結果。
36、作為一種可能的實現(xiàn)方式,所述初始提取模型中,存在至少一空洞卷積層;和/或,所述初始提取模型中,最后一層的初始化卷積參數(shù)為預設值。
37、作為一種可能的實現(xiàn)方式,所述初始提取模型中最后一層的卷積參數(shù)包括偏置和權重,所述偏置的初始值為負數(shù),所述權重的初始值為0。
38、作為一種可能的實現(xiàn)方式,所述原始圖像包括如下任意一種:包含作物行的圖像、電線桿圖像、電線圖像;
39、所述信息提取模型對包含目標對象的原始圖像進行處理得到的識別結果包括:目標對象在原始圖像中的位置信息。
40、第二方面,本技術提供一種對象信息提取方法,包括:
41、對待識別圖像進行圖像變換,得到變換后圖像,所述變換后圖像為所述待識別圖像的二值化圖像或者掩膜圖像;
42、對所述變換后圖像進行霍夫直線檢測,得到直線檢測結果;
43、將所述直線檢測結果輸入預先訓練得到的信息提取模型中,得到所述待識別圖像中的目標對象信息;所述目標對象信息包括:目標對象在所述待識別圖像中的位置信息,其中,所述信息提取模型基于上述第一方面所述的方法訓練得到。
44、第三方面,本技術提供一種信息提取模型訓練裝置,包括:
45、訓練模塊,用于利用訓練樣本集對初始提取模型進行迭代訓練,直至滿足預設迭代停止條件;其中,所述訓練樣本集包括由直線檢測結果表征的學習樣本、以及基于所述直線檢測結果進行標注得到的標簽信息;所述學習樣本通過對原始圖像進行霍夫直線檢測得到,所述原始圖像包括線型或帶型的目標對象;所述標簽信息用于表征所述目標對象在所述原始圖像中的真實位置;
46、確定模塊,用于在所述初始提取模型滿足預設迭代停止條件時,將當前的初始提取模型確定為信息提取模型。
47、作為一種可能的實現(xiàn)方式,所述訓練模塊具體用于:
48、向當前初始提取模型輸入學習樣本,以得到當前初始提取模型基于學習樣本輸出的當前預測結果;
49、根據(jù)當前預測結果、當前標簽信息和預設的樣本權重構建得到當前損失函數(shù);
50、利用當前損失函數(shù)對當前初始提取模型進行反向傳播,以更新當前初始提取模型的模型參數(shù)。
51、作為一種可能的實現(xiàn)方式,所述訓練模塊具體用于:
52、確定當前標簽信息與當前預測結果的交并比;
53、以所述樣本權重作為影響因子,確定當前標簽信息與當前預測結果的交叉熵;
54、基于所述交并比和所述交叉熵,構建得到當前損失函數(shù)。
55、作為一種可能的實現(xiàn)方式,所述訓練模塊還用于:
56、獲取多張原始圖像;
57、對所述多張原始圖像分別進行圖像變換,得到多張變換后圖像,變換后圖像為原始圖像的二值化圖像或者掩膜圖像;
58、對所述多張變換后圖像分別進行霍夫直線檢測,得到多個直線檢測結果,并將所述多個直線檢測結果作為所述學習樣本;其中,所述直線檢測結果包括多行元素,各元素分別對應所述原始圖像中的一條直線,各元素的位置分別用于表征對應的一條直線在原始圖像中的位置,各元素的元素值用于表征所述直線的可靠程度;
59、根據(jù)所述多行元素的元素值,確定用于表征目標對象在原始圖像中的真實位置的關鍵結果信息,并將所述關鍵結果信息作為所述標簽信息。
60、作為一種可能的實現(xiàn)方式,所述訓練模塊具體用于:
61、根據(jù)所述多行元素的元素值,確定多個關鍵因子信息,所述關鍵因子信息包括:空隙密度以及條帶元素平均值;
62、根據(jù)所述多個關鍵因子信息,確定所述關鍵結果信息。
63、作為一種可能的實現(xiàn)方式,所述多行元素存儲于二維數(shù)組中,各元素在所述二維數(shù)組中的位置分別用于表征對應的一條直線在原始圖像中的位置,各元素在所述二維數(shù)組中的元素值用于指示霍夫空間中經(jīng)過所述二維數(shù)組中的位置所對應的點的直線數(shù)量;
64、所述訓練模塊具體用于:
65、根據(jù)所述二維數(shù)組各行中的元素的元素值,確定各行中的條帶元素和非條帶元素;
66、分別計算各行中非條帶元素的數(shù)量與各行中條帶元素和非條帶元素的數(shù)量總和的比值,得到各行的空隙密度;
67、分別計算各行中條帶元素的元素值的平均值,得到各行的條帶元素平均值。
68、作為一種可能的實現(xiàn)方式,所述訓練模塊具體用于:
69、分別計算各行的空隙密度和條帶元素平均值的乘積,得到各行的表征程度值;
70、將表征程度值最大的行的各元素,作為所述關鍵結果信息。
71、作為一種可能的實現(xiàn)方式,訓練模塊具體用于:
72、根據(jù)所述關鍵結果信息所在行中的各元素的元素值,得到至少一個連續(xù)元素序列;
73、根據(jù)所述連續(xù)元素序列中的各元素的元素值,進行閾值選取,得到所述連續(xù)元素序列的初始去噪閾值;
74、基于所述初始去噪閾值、或基于所述初始去噪閾值與預設系數(shù),對所述連續(xù)元素序列中的元素進行過濾處理,以得到去噪后的關鍵結果信息。
75、作為一種可能的實現(xiàn)方式,所述訓練模塊具體用于:
76、以各所述變換后圖像的中心點作為極坐標系原點,對所述變換后圖像進行霍夫直線檢測,得到所述直線檢測結果。
77、作為一種可能的實現(xiàn)方式,所述初始提取模型中,存在至少一空洞卷積層;和/或,所述初始提取模型中,最后一層的初始化卷積參數(shù)為預設值。
78、作為一種可能的實現(xiàn)方式,所述初始提取模型中最后一層的卷積參數(shù)包括偏置和權重,所述偏置的初始值為負數(shù),所述權重的初始值為0。
79、作為一種可能的實現(xiàn)方式,所述原始圖像包括如下任意一種:包含作物行的圖像、電線桿圖像、電線圖像;
80、所述信息提取模型對包含目標對象的原始圖像進行處理得到的識別結果包括:目標對象在原始圖像中的位置信息。
81、第四方面,本技術提供一種對象信息提取裝置,包括:
82、變換模塊,用于對待識別圖像進行圖像變換,得到變換后圖像,所述變換后圖像為所述待識別圖像的二值化圖像或者掩膜圖像;
83、檢測模塊,用于對所述變換后圖像進行霍夫直線檢測,得到直線檢測結果;
84、提取模塊,用于將所述直線檢測結果輸入預先訓練得到的信息提取模型中,得到所述待識別圖像中的目標對象信息;所述目標對象信息包括:目標對象在所述待識別圖像中的位置信息,其中,所述信息提取模型基于上述第一方面所述的方法訓練得到。
85、第五方面,本技術提供一種智慧農(nóng)業(yè)系統(tǒng),包括:
86、獲取裝置,用于獲取原始圖像;
87、處理裝置,用于根據(jù)權利要求第二方面所述的對象信息提取方法對所述獲取裝置獲得的原始圖像進行處理,以得到所述原始圖像中的目標對象信息;
88、圖形界面裝置,用于根據(jù)所述目標對象信息生成對應的原始對象的展示信息。
89、第六方面,本技術提供一種電子設備,包括:處理器和存儲器,所述存儲器存儲有所述處理器可執(zhí)行的機器可讀指令,當電子設備運行時,所述處理器執(zhí)行所述機器可讀指令,以執(zhí)行時執(zhí)行如上述第一方面所述的信息提取模型訓練方法的步驟或者上述第二方面所述的對象信息提取方法的步驟。
90、第七方面,本技術提供一種計算機可讀存儲介質,該計算機可讀存儲介質上存儲有計算機程序,該計算機程序被處理器運行時執(zhí)行如上述第一方面所述的信息提取模型訓練方法的步驟或者上述第二方面所述的對象信息提取方法的步驟。
91、本技術所提供的信息提取模型訓練方法、對象信息提取方法、裝置及系統(tǒng),在初始提取模型的迭代訓練過程中,將原始圖像的直線檢測結果作為訓練樣本,將對直線檢測結果進行標注所得到的能夠表征目標對象真實位置的信息標簽信息,使得初始提取模型能夠學習得到對直線所組成的平行條帶的位置的識別能力。由于相比于現(xiàn)有技術中對線性或帶狀物本身的特征的學習,本實施例聚焦于對直線所形成的平行條帶的特征的學習,顯然,平行條帶的特征的復雜度更低,因此,可以使得初始提取模型的網(wǎng)絡結構和網(wǎng)絡參數(shù)的復雜度更低,同時,所需要使用的訓練樣本也更少,因此,可以極大降低運算的復雜度。另外,初始提取模型僅需要學習對直線所組成的平行條帶的位置的識別能力,而無需關注平行條帶的對象的類型,因此,可以適用于任何線性或帶狀物的識別,因此,可以極大提升方法的適用性。
92、另外,在進行信息提取時,將直線檢測結果輸入信息提取模型后,可以得到目標對象在待識別圖像中的位置信息,由于信息提取模型具有識別平行條帶的能力,平行條帶的特征相比對象本身的特征的復雜度低,因此,能夠降低運算的復雜度并且極大提升適用性。