一種基于匹配的車輛顏色識別方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種基于匹配的車輛顏色識別方法,包括:對每張訓(xùn)練圖像隨機取圖像塊,對每個圖像塊進行采樣,獲得采樣點,計算每個采樣點的顏色特征向量,構(gòu)建圖像塊的顏色特征向量表示,利用k-means聚類計算編碼本,利用空間金字塔模型給圖像特征加上空間信息,再用SVM訓(xùn)練分類器,識別的時候,計算待識別圖像的空間金字塔特征向量,利用分類器對待識別圖像的空間金字塔特征向量進行分類,輸出待識別圖像中車輛顏色的識別結(jié)果。本發(fā)明還公開了相應(yīng)的基于匹配的車輛顏色識別系統(tǒng)。本發(fā)明方法可以在各種復(fù)雜環(huán)境下都給出準確度高的顏色判斷,本方法無需對不同圖像質(zhì)量進行各種圖像預(yù)處理,且本發(fā)明識別方法魯棒性強,識別準確率高。
【專利說明】—種基于匹配的車輛顏色識別方法和系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于計算機視覺【技術(shù)領(lǐng)域】,更具體地,涉及基于一種基于匹配的車輛顏色識別方法和系統(tǒng)。
【背景技術(shù)】
[0002]在過去的十幾年里,由于經(jīng)濟的迅速發(fā)展,各個城市的車輛數(shù)目極大的膨脹,原來依靠人眼對車輛信息的識別越來越不現(xiàn)實。因此,通過計算機視覺技術(shù)自動的提取車輛的信息,對輔助車輛的監(jiān)控有很大的意義。在車輛的各種信息,包括車牌,車輛類型等,車輛的顏色是一種非常直觀而且重要的屬性。車輛的顏色識別,是對在監(jiān)控系統(tǒng)圖片中的車輛,依照人眼判斷的標準,給出車輛顏色的判斷。在卡口、高速公路、城市道路等場景中,車輛顏色能夠給套牌車判斷,違反交通規(guī)則的車輛監(jiān)控,追蹤逃犯等應(yīng)用提供重要的線索。
[0003]然而,現(xiàn)有的車輛顏色識別方法中有兩大缺點:第一是對各種氣候?qū)蚀_性影響大,第二是不同時間段的識別結(jié)果有很大差距。
【發(fā)明內(nèi)容】
[0004]針對現(xiàn)有技術(shù)的缺陷,本發(fā)明的目的在于提供一種基于匹配的車輛顏色識別方法與系統(tǒng),能夠?qū)囕v的顏色進行自動識別,該方法的魯棒性強,并且識別準確率高。
[0005]為實現(xiàn)上述目的,按照本發(fā)明的一個方面,提供了一種基于匹配的車輛顏色識別方法,該方法運用支持向量機以及空間金字塔模型,實現(xiàn)車輛顏色的自動識別,包括以下步驟:
[0006](I)利用訓(xùn)練圖像集合訓(xùn)練用于對圖像塊特征向量進行編碼的編碼本:
[0007](1.1)對訓(xùn)練圖像集合中的每張訓(xùn)練圖像隨機取圖像塊。
[0008]具體為:首先將圖像進行尺度變換變成640像素*480像素大小,然后在圖像上隨機采集大小為16*16的圖像塊;
[0009](1.2)對每個圖像塊進行采樣,獲得采樣點。
[0010]具體為:16*16的圖像塊中分別在長寬上以平均間隔采樣4個點,得到共16個采樣點;
[0011](1.3)計算每個采樣點的顏色特征向量。
[0012]具體為:對每個采樣點計算:RGB分量,HSV分量,YCbCr分量,Lab分量,YUV分量,拼接成一個15維向量,即為該采樣點顏色特征向量;
[0013](1.4)將每個圖像塊中的所有采樣點的顏色特征向量拼接成圖像塊的特征向量。
[0014]具體為:將16個采樣點的15維向量拼接成一個240維向量,即為圖像塊顏色特征
向量。;
[0015](1.5)對每張訓(xùn)練圖像中所得的所有圖像塊的特征向量進行k-means聚類;
[0016](1.6)將所述聚類的結(jié)果作為編碼本;
[0017]聚類得到N個聚類中心,N即為編碼本中字的數(shù)量,對應(yīng)向量就是編碼本中的字;[0018](2)訓(xùn)練分類器:
[0019](2.1)對訓(xùn)練圖像集合中的每張訓(xùn)練圖像采集圖像塊。
[0020]具體為:對訓(xùn)練圖像集合中的每張訓(xùn)練圖像,首先將圖像進行尺度變換變成640像素*480像素大小,然后按照8個像素為步長,采集大小為16*16的圖像塊;
[0021](2.2)按照步驟(1.2)-(1.4)求取每個圖像塊的特征向量;
[0022](2.3)用步驟(I)中得到的編碼本對圖像塊特征向量進行編碼;
[0023](2.4)利用空間金字塔模型(Spatial Pyramid Matching)計算每張訓(xùn)練圖像的空間金字塔特征向量;
[0024](2.4.1)在原訓(xùn)練圖像上將所有采樣點根據(jù)編碼本進行直方圖統(tǒng)計,每個字典各為一類進行統(tǒng)計,得到屬于該類的采樣點數(shù)目,從而得到一個N維的向量,N為編碼本中字的數(shù)量。
[0025](2.4.2)將原訓(xùn)練圖像分成2*2共4個分塊,針對每個分塊重復(fù)(2.4.1)的計算過程,最后得到4個N維的向量。
[0026](2.4.3)將原訓(xùn)練圖像分成4*4共16個分塊,針對每個分塊重復(fù)(2.4.1)的計算過程,最后得到16個N維的向量。
[0027](2.4.4)將上述步驟得到的特征向量拼接起來,得到一個21XN維向量,這個向量就是該圖片的空間金字塔表示。
[0028](2.5)利用所有訓(xùn)練圖像的金字塔特征向量訓(xùn)練支持向量機分類器。
[0029]具體為:訓(xùn)練一個直方圖交叉核(histogram intersection)的SVM分類器作為最終的分類器;
[0030](3)識別待識別圖像中車輛的顏色:
[0031](3.1)按照步驟(2.1)-(2.4)計算待識別圖像的空間金字塔特征向量;
[0032](3.2)利用步驟(2)中訓(xùn)練得到的支持向量機分類器,對待識別圖像的空間金字塔特征向量進行分類,輸出待識別圖像中車輛顏色的識別結(jié)果。
[0033]按照本發(fā)明的另一方面,還提供了一種基于匹配的車輛顏色識別系統(tǒng),所述系統(tǒng)包括編碼本生成模塊,分類器訓(xùn)練模塊以及待識別圖像識別模塊,其中:
[0034]所述編碼本生成模塊,用于利用訓(xùn)練圖像集合訓(xùn)練用于對圖像塊特征向量進行編碼的編碼本,具體包括:
[0035]圖像塊獲取模塊,用于對訓(xùn)練圖像集合中的每張訓(xùn)練圖像隨機取圖像塊;
[0036]圖像塊采樣模塊,用于對每個圖像塊進行采樣,獲得采樣點;
[0037]顏色特征向量計算模塊,用于計算每個采樣點的顏色特征向量;
[0038]圖像塊特征向量計算模塊,用于將每個圖像塊中的所有采樣點的顏色特征向量拼接成圖像塊的特征向量;
[0039]編碼本生成模塊,用于對每張訓(xùn)練圖像中所得的所有圖像塊的特征向量進行k-means聚類,將所述聚類的結(jié)果作為編碼本;
[0040]所述分類器訓(xùn)練模塊,用于訓(xùn)練分類器,具體包括:
[0041]圖像塊采集模塊,用于對訓(xùn)練圖像集合中的每張訓(xùn)練圖像采集圖像塊;
[0042]圖像塊特征向量計算模塊,用于求取每個圖像塊的特征向量;
[0043]圖像塊特征向量編碼模塊,用于利用編碼本對圖像塊特征向量進行編碼;[0044]金字塔特征向量生成模塊,用于利用空間金字塔模型計算每張訓(xùn)練圖像的空間金字塔特征向量;
[0045]支持向量機分類器訓(xùn)練模塊,用于利用所有訓(xùn)練圖像的空間金字塔特征向量訓(xùn)練支持向量機分類器;
[0046]所述待識別圖像識別塊,用于識別待識別圖像中車輛的顏色,具體包括:
[0047]空間金字塔特征向量計算模塊,用于計算待識別圖像的空間金字塔特征向量;
[0048]待識別圖像識別子模塊,用于利用支持向量機分類器,對待識別圖像的空間金字塔特征向量進行分類,輸出待識別圖像中車輛顏色的識別結(jié)果。
[0049]通過本發(fā)明所構(gòu)思的以上技術(shù)方案,與現(xiàn)有技術(shù)相比,本發(fā)明具有以下的有益效果:
[0050]1、物體顏色容易受光照、灰塵以及空氣質(zhì)量等因素的影響而變得不容易辨認,現(xiàn)有的識別算法無法適應(yīng)外界環(huán)境的變化在各種復(fù)雜場景都提供高的辨識度;為克服這些影響,本發(fā)明首先把圖像轉(zhuǎn)換成不同的顏色空間,例如HSV,YCbCr, Lab, YUV ;在這些顏色空間中,原本的顏色三通道被轉(zhuǎn)換成光照和顏色分量;由于兩種分量不相關(guān),其中從顏色分量中提取的特征具有光照不敏感的特性;
[0051]2、在實際情況中,只有一部分的車身區(qū)域能夠用來識別車輛顏色,例如引擎蓋等;其他方法都需要首先顯性的提取有代表性的區(qū)域,然后在這些區(qū)域上提取顏色特征進行識別;本發(fā)明方法直接對不同顏色的車輛圖片進行建模,通過學(xué)習(xí)的方法自動選擇有代表性的區(qū)域;為了能夠間接的選擇有代表性的區(qū)域,圖像被分割為1*1,2*2,4*4的圖像金字塔;整個圖像的特征由每個子區(qū)域的特征拼接起來;由于子區(qū)域特征的拼接順序,整個圖像的特征包含有一定的空間位置信息;訓(xùn)練之后得到的模型,實際上就是每個子區(qū)域的權(quán)重,按照權(quán)重大小,本方法就能間接的選擇出有代表性的區(qū)域;因此本發(fā)明方法不需要進行區(qū)域提取的步驟,而是直接輸入整張車輛圖片就行識別。
【專利附圖】
【附圖說明】
[0052]圖1是本發(fā)明基于匹配的車輛顏色識別方法的流程圖;
[0053]圖2是本發(fā)明中利用空間金字塔模型對圖像進行空間金字塔計算的原理圖。
【具體實施方式】
[0054]為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及實施例,對本發(fā)明進行進一步詳細說明。應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0055]以下首先就本發(fā)明的技術(shù)術(shù)語進行解釋和說明:
[0056]訓(xùn)練圖像:用于訓(xùn)練方法模型的輸入圖像,在本方法中指的是用于訓(xùn)練模型需要的各種不同顏色種類的車輛圖像。
[0057]顏色特征:是指在不同顏色空間上的空間各個分量值的向量,包括RGB空間,HSV空間,YCbCr空間,Lab空間以及YUV空間。由于每個顏色空間都有自己的特點,因此對于圖像顏色特性的表達各有側(cè)重,為了得到全面的顏色特征,我們?nèi)诤隙鄠€顏色空間進行向量拼接,最終得到顏色特征。[0058]K-means算法:是最為經(jīng)典的基于劃分的聚類方法,是十大經(jīng)典數(shù)據(jù)挖掘算法之一。K-means算法的基本思想是:以空間中k個點為中心進行聚類,對最靠近他們的對象歸類。通過迭代的方法,逐次更新各聚類中心的值,直至得到最好的聚類結(jié)果。
[0059]編碼本:是對圖像進行編碼的依據(jù),編碼本中的各個元素是在樣本集合上進行K-means算法得到的若干個聚類中心。
[0060]空間金字塔模型:即SPM(Spatial Pyramid Matching)是一種經(jīng)典的匹配算法,該算法重在能夠提取上下文信息,在保證全局特征不丟失的情況下,能夠同時獲取豐富的局部特征。
[0061]支持向量機:SVM(Support Vector Machine)是 Corinna Cortes 和 Vapnik 等于1995年首先提出的分類算法,它在解決小樣本、非線性及高維模式識別中表現(xiàn)出許多特有的優(yōu)勢,SVM的關(guān)鍵在于核函數(shù)。低維空間向量集通常難于劃分,解決的方法是將它們映射到高維空間。但這個辦法帶來的困難就是計算復(fù)雜度的增加,而核函數(shù)正好巧妙地解決了這個問題。也就是說,只要選用適當(dāng)?shù)暮撕瘮?shù),就可以得到高維空間的分類函數(shù)。
[0062]如圖1所示,本發(fā)明運用支持向量機的基于空間金字塔模型的顏色識別方法包括以下步驟:
[0063](I)利用訓(xùn) 練圖像集合訓(xùn)練用于對圖像塊特征向量進行編碼的編碼本:
[0064](1.1)對訓(xùn)練圖像集合中的每張訓(xùn)練圖像隨機取圖像塊。
[0065]具體為:首先將圖像進行尺度變換變成640像素*480像素大小,然后在圖像上隨機選擇16*16的圖像塊;
[0066](1.2)對每個圖像塊進行采樣,獲得采樣點。
[0067]具體為:16*16的圖像塊中分別在長寬上以平均間隔采樣4個點,得到共16個采樣點;
[0068](1.3)計算每個采樣點的顏色特征向量。
[0069]步驟具體為:對每個采樣點計算:RGB分量,HSV分量,YCbCr分量,Lab分量,YUV分量,拼接成一個15維向量,即為該采樣點顏色特征向量。
[0070]設(shè)RGB 分量為[R, G, B],HSV 分量為[H, S,V],YCbCr 分量為[Y, Cb, Cr],Lab 分量為[L, a, b],YUV 分量[Y, U, V]則該點顏色特征向量為:[R, G, B, H, S,V, Y, Cb, Cr, L, a, b, Y, U, V]
這樣一個15維向量。
[0071](1.4)將每個圖像塊中的所有采樣點的顏色特征向量拼接成圖像塊的特征向量。
[0072]具體為:將16個采樣點的15維向量拼接成一個240維向量,即為圖像塊顏色特征
向量
[0073]步驟具體為:將16個采樣點的15維向量拼接成一個240維向量V1 = [R1, G1, B1,H1, S1, V1, Y1, Cb1, Cr1, L1, a1; ^,Y1, U1, V1,...,
Ri6,G16j B16j H16j S16j V16j Y16j Cb16, Cr16, Ll6,ai6) b16,
Y16, U16, V16],即為圖像塊顏色特征向量;
[0074](1.5)對每張訓(xùn)練圖像中所得的所有圖像塊的特征向量進行k-means聚類;
[0075](1.6)將所述聚類的結(jié)果作為編碼本,聚類得到N個聚類中心,N即為編碼本中字的數(shù)量,對應(yīng)向量就是編碼本中的字;
[0076](2)訓(xùn)練分類器:
[0077](2.1)對訓(xùn)練圖像集合中的每張訓(xùn)練圖像采集圖像塊。[0078]具體做法為:以圖像某個頂點為起始點,每隔八個像素取一個16*16的圖像塊,可以理解成一個16*16的取景框,每次平移8像素,框中的即為一個圖像塊,直到整個圖像都覆蓋到。例如對于640像素*480像素,可以得到一共4800個圖像塊;
[0079](2.2)按照步驟(1.2)-(1.4)求取每個圖像塊的特征向量,得到所有圖像塊的特
征{Vl,V2>...V240(J ;
[0080](2.3)用步驟(I)中得到的編碼本對圖像塊特征向量進行編碼;
[0081](2.4)利用空間金字塔模型(Spatial Pyramid Matching)計算每張訓(xùn)練圖像的空間金字塔特征向量;
[0082](2.4.1)參照圖2,計算空間金字塔的第一步,是在原訓(xùn)練圖像上將所有采樣點根據(jù)編碼字典進行直方圖統(tǒng)計,每個字典各為一類進行統(tǒng)計,得到屬于該類的采樣點數(shù)目,從而得到一個N維的向量[叫,n2,...,nN],N為編碼本中字的數(shù)量。
[0083](2.4.2)將原訓(xùn)練圖像分成2*2共4個分塊,針對每個分塊重復(fù)(2.4.1)的計算過程,最后得到4個N維的向量[n’ i,η’ 2,...,η’ 4Ν]。
[0084](2.4.3)將原訓(xùn)練圖像分成4*4共16個分塊,針對每個分塊重復(fù)(2.4.1)的計算過程,最后得到16個N維的向量[n’ ’ i,η’ ’ 2,...,η’ ’ 16Ν]。
[0085](2.4.4)將上述步驟得到的特征向量拼接起來,得到一個21ΧΝ維向量,這個向量就是該圖片的空間金字塔表示 Di1, η2,...,nN, n' 1; n/ 2,..., n/ 4N,n" 2,...,n" 16
N] o
[0086](2.5)利用所有訓(xùn)練圖像的金字塔特征向量訓(xùn)練SVM分類器。
[0087]步驟具體為:訓(xùn)練一個直方圖交叉核(histogram intersection)的SVM分類器作為最終的分類器。此處可以利用封裝好的已有SVM庫函數(shù)視為一個黑箱子,輸入所有訓(xùn)練圖像的金字塔特征向量,輸出為一個能夠判斷車輛顏色的SVM分類器;
[0088](3)識別待識別圖像中車輛的顏色:
[0089](3.1)按照步驟(2.1)-(2.4)計算待識別圖像的空間金字塔特征向量;
[0090](3.2)步驟具體為:利用步驟(2)中訓(xùn)練得到的支持向量機分類器,對待識別圖像的空間金字塔特征向量進行分類,輸出待識別圖像中車輛顏色的識別結(jié)果。例如一號代表紅色,則紅色的車返回結(jié)果為I。
[0091]進一步地,本發(fā)明還提供了一種基于匹配的車輛顏色識別系統(tǒng),所述系統(tǒng)包括編碼本生成模塊,分類器訓(xùn)練模塊以及待識別圖像識別模塊,其中:
[0092]所述編碼本生成模塊,用于利用訓(xùn)練圖像集合訓(xùn)練用于對圖像塊特征向量進行編碼的編碼本,具體包括:
[0093]圖像塊獲取模塊,用于對訓(xùn)練圖像集合中的每張訓(xùn)練圖像隨機取圖像塊;
[0094]圖像塊采樣模塊,用于對每個圖像塊進行采樣,獲得采樣點;
[0095]顏色特征向量計算模塊,用于計算每個采樣點的顏色特征向量;
[0096]圖像塊特征向量計算模塊,用于將每個圖像塊中的所有采樣點的顏色特征向量拼接成圖像塊的特征向量;
[0097]編碼本生成模塊,用于對每張訓(xùn)練圖像中所得的所有圖像塊的特征向量進行k-means聚類,將所述聚類的結(jié)果作為編碼本;
[0098]所述分類器訓(xùn)練模塊,用于訓(xùn)練分類器,具體包括:[0099]圖像塊采集模塊,用于對訓(xùn)練圖像集合中的每張訓(xùn)練圖像采集圖像塊;
[0100]圖像塊特征向量計算模塊,用于求取每個圖像塊的特征向量;
[0101]圖像塊特征向量編碼模塊,用于利用編碼本對圖像塊特征向量進行編碼;
[0102]金字塔特征向量生成模塊,用于利用空間金字塔模型計算每張訓(xùn)練圖像的空間金字塔特征向量;
[0103]支持向量機分類器訓(xùn)練模塊,用于利用所有訓(xùn)練圖像的空間金字塔特征向量訓(xùn)練支持向量機分類器;
[0104]所述待識別圖像識別模塊,用于識別待識別圖像中車輛的顏色,具體包括:
[0105]空間金字塔特征向量計算模塊,用于計算待識別圖像的空間金字塔特征向量;
[0106]待識別圖像識別子模塊,用于利用支持向量機分類器,對待識別圖像的空間金字塔特征向量進行分類,輸出待識別圖像中車輛顏色的識別結(jié)果。
[0107]需要說明的是,本發(fā)明實施例中對圖像進行尺度變換、選取的圖像塊的大小、采樣點的采樣方式的具體數(shù)值均可以根據(jù)實際需要來確定,本發(fā)明實施例中所用的數(shù)值并不限定本發(fā)明的保護范圍。
[0108]本領(lǐng)域的技術(shù)人員容易理解,以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。
【權(quán)利要求】
1.一種基于匹配的車輛顏色識別方法,其特征在于,所述方法包括以下步驟: (1)利用訓(xùn)練圖像集合訓(xùn)練用于對圖像塊特征向量進行編碼的編碼本: (1.1)對訓(xùn)練圖像集合中的每張訓(xùn)練圖像隨機取圖像塊; (1.2)對每個圖像塊進行采樣,獲得采樣點; (1.3)計算每個采樣點的顏色特征向量; (1.4)將每個圖像塊中的所有采樣點的顏色特征向量拼接成圖像塊的特征向量; (1.5)對每張訓(xùn)練圖像中所得的所有圖像塊的特征向量進行k-means聚類; (1.6)將所述聚類的結(jié)果作為編碼本; (2)訓(xùn)練分類器: (2.1)對訓(xùn)練圖像集合中的每張訓(xùn)練圖像采集圖像塊;
(2.2)按照步驟(1.2)-(1.4)求取每個圖像塊的特征向量; (2.3)用步驟(1)中得到的編碼本對圖像塊特征向量進行編碼; (2.4)利用空間金字塔模型計算每張訓(xùn)練圖像的空間金字塔特征向量; (2.5)利用所有訓(xùn)練圖像的金字塔特征向量訓(xùn)練支持向量機分類器; (3)識別待識別圖像中車輛的顏色: (3.1)按照步驟(2.1)-(2.4)計算待識別圖像的空間金字塔特征向量; (3.2)利用步驟(2)中訓(xùn)練得到的支持向量機分類器,對待識別圖像的空間金字塔特征向量進行分類,輸出待識別圖像中車輛顏色的識別結(jié)果。
2.根據(jù)權(quán)利要求1所述的車輛顏色識別方法,其特征在于,所述步驟(1.1)具體為:首先將圖像進行尺度變換變成640像素*480像素大小,然后在圖像上隨機采集大小為16*16的圖像塊。
3.根據(jù)權(quán)利要求2所述的車輛顏色識別方法,其特征在于,所述步驟(1.2)具體為:16*16的圖像塊中分別在長寬上以平均間隔采樣4個點,得到共16個采樣點。
4.根據(jù)權(quán)利要求1至3任一項所述的車輛顏色識別方法,其特征在于,所述步驟(1.3)具體為:對每個采樣點計算=RGB分量,HSV分量,YCbCr分量,Lab分量,YUV分量,并將這5個顏色分量拼接成一個15維向量,即為該采樣點的顏色特征向量。
5.根據(jù)權(quán)利要求3或4所述的車輛顏色識別方法,其特征在于,所述步驟(1.4)具體為:將16個采樣點的15維向量拼接成一個240維向量,即為圖像塊的顏色特征向量。
6.根據(jù)權(quán)利要求1至5任一項所述的車輛顏色識別方法,其特征在于,所述步驟(2.1)具體為:對訓(xùn)練圖像集合中的每張訓(xùn)練圖像,首先將訓(xùn)練圖像進行尺度變換變成640像素*480像素大小,然后以8個像素為步長,采集大小為16*16的圖像塊。
7.根據(jù)權(quán)利要求1至6任一項所述的車輛顏色識別方法,其特征在于,所述步驟(2.4)包括以下子步驟: (2.4.1)在原訓(xùn)練圖像上將所有采樣點根據(jù)編碼本進行直方圖統(tǒng)計,每個字典各為一類進行統(tǒng)計,得到屬于該類的采樣點數(shù)目,從而得到一個N維的向量,N為編碼本中字的數(shù)量。 (2.4.2)將原訓(xùn)練圖像分成2*2共4個分塊,針對每個分塊重復(fù)(2.4.1)的計算過程,最后得到4個N維的向量。 (2.4.3)將原訓(xùn)練圖像分成4*4共16個分塊,針對每個分塊重復(fù)(2.4.1)的計算過程,最后得到16個N維的向量。 (2.4.4)將上述4個步驟得到的特征向量拼接起來,得到一個21 XN維向量,這個向量就是該訓(xùn)練圖像空間金字塔特征向量。
8.根據(jù)權(quán)利要求1至7任一項所述的車輛顏色識別方法,其特征在于,所述步驟(2.5)具體為:訓(xùn)練一個直方圖交叉核(histogram intersection)的支持向量機分類器。
9.一種基于匹配的車輛顏色識別系統(tǒng),其特征在于,所述系統(tǒng)包括編碼本生成模塊,分類器訓(xùn)練模塊以及待識別圖像識別模塊,其中: 所述編碼本生成模塊,用于利用訓(xùn)練圖像集合訓(xùn)練用于對圖像塊特征向量進行編碼的編碼本,具體包括: 圖像塊獲取模塊,用于對訓(xùn)練圖像集合中的每張訓(xùn)練圖像隨機取圖像塊; 圖像塊采樣模塊,用于對每個圖像塊進行采樣,獲得采樣點; 顏色特征向量計算模塊,用于計算每個采樣點的顏色特征向量; 圖像塊特征向量計算模塊,用于將每個圖像塊中的所有采樣點的顏色特征向量拼接成圖像塊的特征向量; 編碼本生成模塊,用于對每張訓(xùn)練圖像中所得的所有圖像塊的特征向量進行k-means聚類,將所述聚類的結(jié)果作為編碼本; 所述分類器訓(xùn)練模塊,用于訓(xùn)練分類器,具體包括: 圖像塊采集模塊,用于對訓(xùn)練圖像集合中的每張訓(xùn)練圖像采集圖像塊; 圖像塊特征向量計算模塊,用于求取每個圖像塊的特征向量; 圖像塊特征向量編碼模塊,用于利用編碼本對圖像塊特征向量進行編碼; 金字塔特征向量生成模塊,用于利用空間金字塔模型計算每張訓(xùn)練圖像的空間金字塔特征向量; 支持向量機分類器訓(xùn)練模塊,用于利用所有訓(xùn)練圖像的空間金字塔特征向量訓(xùn)練支持向量機分類器; 所述待識別圖像識別模塊,用于識別待識別圖像中車輛的顏色,具體包括: 空間金字塔特征向量計算模塊,用于計算待識別圖像的空間金字塔特征向量; 待識別圖像識別子模塊,用于利用支持向量機分類器,對待識別圖像的空間金字塔特征向量進行分類,輸出待識別圖像中車輛顏色的識別結(jié)果。
【文檔編號】G06K9/46GK103996041SQ201410205581
【公開日】2014年8月20日 申請日期:2014年5月15日 優(yōu)先權(quán)日:2014年5月15日
【發(fā)明者】陳瑞軍, 白翔, 陳攀, 王興剛, 肖可偉 申請人:武漢睿智視訊科技有限公司