本發(fā)明涉及一種手寫(xiě)電氣元器件符號(hào)與標(biāo)準(zhǔn)電氣元器件符號(hào)的匹配識(shí)別方法,屬于圖像識(shí)別以及電氣自動(dòng)化的技術(shù)領(lǐng)域。
技術(shù)背景
電力工程圖紙是電氣工程人員進(jìn)行后期的生產(chǎn)制造的重要依據(jù),同時(shí)也是電子設(shè)計(jì)人員進(jìn)行信息交互的媒介。傳統(tǒng)的電力工程圖紙主要依靠手畫(huà)完成設(shè)計(jì)任務(wù),當(dāng)設(shè)計(jì)人員對(duì)設(shè)計(jì)錯(cuò)誤進(jìn)行修改的時(shí)候會(huì)帶來(lái)非常大的工作量,造成了電力工程圖設(shè)計(jì)效率低,周期長(zhǎng)的問(wèn)題,同時(shí)不能利用現(xiàn)有圖紙的信息,在一定程度上也造成了資源浪費(fèi)。近年來(lái),隨著計(jì)算機(jī)技術(shù)的發(fā)展,CAD技術(shù)的出現(xiàn)在一定程度上緩解了電力工程圖設(shè)計(jì)效率低周期長(zhǎng)的問(wèn)題,巧妙地利用計(jì)算機(jī)幫助設(shè)計(jì)人員完成設(shè)計(jì)計(jì)算分析等繁重的工作。
隨著CAD技術(shù)的推廣應(yīng)用,如何將現(xiàn)有圖紙信息快速準(zhǔn)確的輸入到計(jì)算機(jī),實(shí)現(xiàn)CAD的智能化是現(xiàn)在CAD領(lǐng)域研究的重點(diǎn),CAD技術(shù)雖然在一定程度上減輕了設(shè)計(jì)人員計(jì)算分析的工作,但是CAD主要采用人機(jī)交互式的方式,前期仍然需要耗費(fèi)大量的人力將圖紙信息輸入到計(jì)算機(jī)當(dāng)中,對(duì)原有的圖紙進(jìn)行再次繪制,這在一定程度上造成了圖紙資源的浪費(fèi),工作效率低等問(wèn)題。針對(duì)這一問(wèn)題電力工程圖的自動(dòng)識(shí)別技術(shù)就應(yīng)運(yùn)而生。電力工程圖自動(dòng)識(shí)別的基礎(chǔ)是實(shí)現(xiàn)電氣元器件符號(hào)的自動(dòng)識(shí)別,但是傳統(tǒng)的電氣元器件符號(hào)識(shí)別沒(méi)有考慮將同一電氣元器件符號(hào)的AutoCAD標(biāo)準(zhǔn)電氣元器件符號(hào)和手寫(xiě)電氣元器件符號(hào)構(gòu)建合理聯(lián)系,在一定程度上造成了識(shí)別率低的問(wèn)題。
技術(shù)實(shí)現(xiàn)要素:
針對(duì)現(xiàn)有技術(shù)的不足,本發(fā)明提供一種手寫(xiě)電氣元器件符號(hào)與標(biāo)準(zhǔn)電氣元器件符號(hào)的匹配識(shí)別方法。
本發(fā)明概述:
一種手寫(xiě)電氣元器件符號(hào)與標(biāo)準(zhǔn)電氣元器件符號(hào)的匹配識(shí)別方法,包括,首先對(duì)手寫(xiě)電氣元器件符號(hào)與標(biāo)準(zhǔn)電氣元器件符號(hào)進(jìn)行歸一化特征處理,通過(guò)自適應(yīng)字典耦合投影將標(biāo)準(zhǔn)電氣元器件符號(hào)與手寫(xiě)電氣元器件符號(hào)兩種特征聯(lián)系起來(lái),并映射到統(tǒng)一的判別子空間中,利用字典學(xué)習(xí)建立分類模型,以提高手寫(xiě)電氣元器件符號(hào)的識(shí)別精度。
本發(fā)明的技術(shù)方案如下:
一種手寫(xiě)電氣元器件符號(hào)與標(biāo)準(zhǔn)電氣元器件符號(hào)的匹配識(shí)別方法,包括字典學(xué)習(xí)階段和測(cè)試階段;
所述字典學(xué)習(xí)階段包括如下步驟:
1)將手寫(xiě)電氣元器件符號(hào)和標(biāo)準(zhǔn)電氣元器件符號(hào)進(jìn)行特征提取,并對(duì)特征進(jìn)行歸一化處理;
2)對(duì)手寫(xiě)電氣元器件符號(hào)與標(biāo)準(zhǔn)電氣元器件符號(hào)進(jìn)行投影,獲取公共子空間;
3)在公共子空間上學(xué)習(xí)一個(gè)自適應(yīng)字典及其對(duì)應(yīng)的稀疏系數(shù):使在公共子空間中具有最小的重構(gòu)誤差,并且使來(lái)自不同域的相同類的樣本的稀疏系數(shù)具有對(duì)應(yīng)的線性關(guān)系;所述來(lái)自不同域的相同類的樣本是指:例如,手寫(xiě)電氣元器件符號(hào)中的電流表和標(biāo)準(zhǔn)電氣元器件符號(hào)中的電流表就是屬于相同類的樣本;
所述測(cè)試階段包括如下步驟:
4)對(duì)于給定待測(cè)手寫(xiě)電氣元器件符號(hào)按照步驟1)相同的方法進(jìn)行歸一化特征提?。?/p>
5)經(jīng)步驟4)處理后的手寫(xiě)電氣元器件符號(hào),利用字典學(xué)習(xí)階段得到的投影矩陣U進(jìn)行投影,得到在公共子空間的特征表示;
6)利用步驟3),得到自適應(yīng)字典,進(jìn)而得到作為準(zhǔn)則的最小重構(gòu)誤差,從而得到待測(cè)手寫(xiě)電氣元器件符號(hào)的稀疏系數(shù);
7)對(duì)于步驟6)得到的稀疏系數(shù)進(jìn)行線性變換,得到手寫(xiě)電氣元器件符號(hào)對(duì)應(yīng)的標(biāo)準(zhǔn)電氣元器件符號(hào)的稀疏系數(shù);
8)通過(guò)基于歐氏距離的最小距離分類器對(duì)手寫(xiě)電氣元器件符號(hào)進(jìn)行分類識(shí)別,得到手寫(xiě)電氣元器件符號(hào)對(duì)應(yīng)的標(biāo)準(zhǔn)電氣元器件符號(hào)。
根據(jù)本發(fā)明優(yōu)選的,在步驟1)中,所述特征提取、歸一化處理的方法是:采用Sift、Hu不變矩、Gabor或HoG特征表示方法表示單個(gè)電氣元器件符號(hào)的特征,并通過(guò)加權(quán)的方式對(duì)特征進(jìn)行融合,得到:
手寫(xiě)電氣元器件符號(hào)的歸一化特征樣本:其中d2代表的是單個(gè)手寫(xiě)電氣元器件符號(hào)的特征維數(shù),N2代表的是手寫(xiě)電氣元器件符號(hào)的總個(gè)數(shù);
標(biāo)準(zhǔn)電氣元器件符號(hào)的歸一化特征樣本:其中d1代表的是單個(gè)標(biāo)準(zhǔn)電氣元器件符號(hào)的特征維數(shù),N1代表的是標(biāo)準(zhǔn)電氣元器件符號(hào)的總個(gè)數(shù)。
根據(jù)本發(fā)明優(yōu)選的,所述步驟2)、3)的具體過(guò)程如下:
首先,學(xué)習(xí)一個(gè)包含k原子的自適應(yīng)字典D∈Rn×k和標(biāo)準(zhǔn)電氣元器件符號(hào)的投影矩陣以及手寫(xiě)電氣元器件符號(hào)的投影矩陣其中n代表標(biāo)準(zhǔn)電氣元器件符號(hào)與手寫(xiě)電氣元器件符號(hào)在公共子空間的特征維數(shù),將標(biāo)準(zhǔn)電氣元器件符號(hào)的歸一化特征樣本X與手寫(xiě)電氣元器件符號(hào)的歸一化特征樣本Y映射到公共子空間中,保證在公共子空間中具有最小的重構(gòu)誤差:最小化下列成本函數(shù)
在公式(1)中,分別代表標(biāo)準(zhǔn)電氣元器件符號(hào)的歸一化特征樣本X和手寫(xiě)電氣元器件符號(hào)的歸一化特征樣本Y對(duì)應(yīng)字典D的稀疏系數(shù),若直接對(duì)公式(1)求解最小值,我們會(huì)得到平凡解,U1和U2會(huì)變?yōu)?陣,為了避免這種情況,可以得到有意義的解:在公式(1)的基礎(chǔ)上加入一項(xiàng)正則項(xiàng)UiUiT=I(i∈1,2),保證投影矩陣是正交歸一的。
來(lái)自不同域的相同類的樣本,它們對(duì)應(yīng)的稀疏系數(shù)具有對(duì)應(yīng)的線性映射關(guān)系f(·),即U1=PU2,P為線性映射關(guān)系,在公共子空間中,保證對(duì)應(yīng)的投影系數(shù)有最小的誤差,基于上述要求:最小化下列成本函數(shù):
綜上所述,得到最終的目標(biāo)函數(shù):
根據(jù)本發(fā)明優(yōu)選的,采用迭代求解的方法對(duì)公式(3)進(jìn)行求解,將上述問(wèn)題轉(zhuǎn)換為四個(gè)子問(wèn)題,包括稀疏系數(shù)求解,字典更新,投影更新以及線性映射更新。
根據(jù)本發(fā)明優(yōu)選的,所述稀疏系數(shù)求解,包括:
a.對(duì)線性映射關(guān)系P以及字典D進(jìn)行初始化:將線性映射關(guān)系P初始化為單位矩陣,字典D選用n×k的隨機(jī)矩陣,得到求解稀疏系數(shù)ZX,ZY的目標(biāo)函數(shù):
公式(4)是一個(gè)Lasso求解問(wèn)題,許多L1范數(shù)優(yōu)化算法可以有效的解決,例如LARS,F(xiàn)ISTA等。
根據(jù)本發(fā)明優(yōu)選的,所述對(duì)字典進(jìn)行更新,包括:固定稀疏系數(shù)ZX,ZY,字典更新依據(jù)下列公式:
由公式(5)可以看出這是一個(gè)二次約束二次規(guī)劃問(wèn)題,采用拉格朗日乘子法對(duì)字典D進(jìn)行求解。
根據(jù)本發(fā)明優(yōu)選的,所述對(duì)線性映射進(jìn)行更新,包括:固定稀疏系數(shù)ZX,ZY,字典D以及投影矩陣U1,U2,得到最終的優(yōu)化目標(biāo)函數(shù):
公式(6)是一個(gè)譜回歸問(wèn)題,直接得到的P最優(yōu)解為:
P=ZYZXT(ZXZXT+(λ/γp)·I)-1 (7)。
根據(jù)本發(fā)明優(yōu)選的,所述對(duì)線性投影進(jìn)行更新,包括:固定稀疏系數(shù)ZX,ZY,字典D以及線性映射關(guān)系P,得到最終的優(yōu)化目標(biāo)函數(shù):
采用拉格朗日乘子法對(duì)線性投影進(jìn)行求解,得到U1,U2的最優(yōu)解為:
其中ηX,ηY表示的是拉格朗日算子。
根據(jù)本發(fā)明優(yōu)選的,步驟8)中通過(guò)基于歐氏距離的最小距離分類器進(jìn)行分類識(shí)別,包括步驟如下:
給定標(biāo)準(zhǔn)電氣元器件符號(hào)給定手寫(xiě)電氣元器件符號(hào)樣本利用字典學(xué)習(xí)階段得到的投影矩陣,將標(biāo)準(zhǔn)電氣元器件符號(hào)樣本XG與手寫(xiě)電氣元器件符號(hào)樣本YP投影到公共子空間中,Xg=U1XG,Yp=U2YP,利用學(xué)習(xí)的字典D計(jì)算得到手寫(xiě)電氣元器件符號(hào)樣本對(duì)應(yīng)的稀疏系數(shù):
那么,手寫(xiě)電氣元器件符號(hào)樣本用以下公式進(jìn)行分類:
本發(fā)明的有益效果是:
本發(fā)明提供的是一種手寫(xiě)電氣元器件符號(hào)與標(biāo)準(zhǔn)電氣元器件符號(hào)的匹配識(shí)別方法,相比于已有的電氣元器件符號(hào)識(shí)別方法,對(duì)電氣元器件符號(hào)特征提取和表示是擬采用Sift、Hu不變矩、Gabor和HoG等特征表示方法表示單個(gè)電氣元器件符號(hào)的特征,并通過(guò)加權(quán)的方式對(duì)特征進(jìn)行融合組成具有魯棒性的新特征;現(xiàn)有的對(duì)電氣元器件識(shí)別采用的方法多為模板匹配,所采用的分類器也僅僅嘗試了神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)方法,本專利是通過(guò)字典學(xué)習(xí)建立分類模型,從而來(lái)提高整個(gè)系統(tǒng)的分類性能。
附圖說(shuō)明
圖1本發(fā)明中所述字典學(xué)習(xí)階段的流程圖;
圖2本發(fā)明中所述測(cè)試階段的流程圖;
圖3本發(fā)明中所涉及的標(biāo)準(zhǔn)電氣元器件符號(hào)圖;
圖4本發(fā)明中所涉及的手寫(xiě)電氣元器件符號(hào)圖。
具體實(shí)施方式
下面結(jié)合實(shí)施例和說(shuō)明書(shū)附圖對(duì)本發(fā)明做詳細(xì)的說(shuō)明,但不限于此。
如圖1-4所示。
實(shí)施例1、
一種手寫(xiě)電氣元器件符號(hào)與標(biāo)準(zhǔn)電氣元器件符號(hào)的匹配識(shí)別方法,包括字典學(xué)習(xí)階段和測(cè)試階段;
所述字典學(xué)習(xí)階段包括如下步驟:
1)將手寫(xiě)電氣元器件符號(hào)和標(biāo)準(zhǔn)電氣元器件符號(hào)進(jìn)行特征提取,并對(duì)特征進(jìn)行歸一化處理;
2)對(duì)手寫(xiě)電氣元器件符號(hào)與標(biāo)準(zhǔn)電氣元器件符號(hào)進(jìn)行投影,獲取公共子空間;
3)在公共子空間上學(xué)習(xí)一個(gè)自適應(yīng)字典及其對(duì)應(yīng)的稀疏系數(shù):使在公共子空間中具有最小的重構(gòu)誤差,并且使來(lái)自不同域的相同類的樣本的稀疏系數(shù)具有對(duì)應(yīng)的線性關(guān)系;
所述測(cè)試階段包括如下步驟:
4)對(duì)于給定待測(cè)手寫(xiě)電氣元器件符號(hào)按照步驟1)相同的方法進(jìn)行歸一化特征提??;
5)經(jīng)步驟4)處理后的手寫(xiě)電氣元器件符號(hào),利用字典學(xué)習(xí)階段得到的投影矩陣U進(jìn)行投影,得到在公共子空間的特征表示;
6)利用步驟3),得到自適應(yīng)字典,進(jìn)而得到作為準(zhǔn)則的最小重構(gòu)誤差,從而得到待測(cè)手寫(xiě)電氣元器件符號(hào)的稀疏系數(shù);
7)對(duì)于步驟6)得到的稀疏系數(shù)進(jìn)行線性變換,得到手寫(xiě)電氣元器件符號(hào)對(duì)應(yīng)的標(biāo)準(zhǔn)電氣元器件符號(hào)的稀疏系數(shù);
8)通過(guò)基于歐氏距離的最小距離分類器對(duì)手寫(xiě)電氣元器件符號(hào)進(jìn)行分類識(shí)別,得到手寫(xiě)電氣元器件符號(hào)對(duì)應(yīng)的標(biāo)準(zhǔn)電氣元器件符號(hào)。
實(shí)施例2、
如實(shí)施例1所述的一種手寫(xiě)電氣元器件符號(hào)與標(biāo)準(zhǔn)電氣元器件符號(hào)的匹配識(shí)別方法,其區(qū)別在于,在步驟1)中,所述特征提取、歸一化處理的方法是:采用Sift、Hu不變矩、Gabor或HoG特征表示方法表示單個(gè)電氣元器件符號(hào)的特征,并通過(guò)加權(quán)的方式對(duì)特征進(jìn)行融合,得到:
手寫(xiě)電氣元器件符號(hào)的歸一化特征樣本:其中d2代表的是單個(gè)手寫(xiě)電氣元器件符號(hào)的特征維數(shù),N2代表的是手寫(xiě)電氣元器件符號(hào)的總個(gè)數(shù);
標(biāo)準(zhǔn)電氣元器件符號(hào)的歸一化特征樣本:其中d1代表的是單個(gè)標(biāo)準(zhǔn)電氣元器件符號(hào)的特征維數(shù),N1代表的是標(biāo)準(zhǔn)電氣元器件符號(hào)的總個(gè)數(shù)。
所述步驟2)、3)的具體過(guò)程如下:
首先,學(xué)習(xí)一個(gè)包含k原子的自適應(yīng)字典D∈Rn×k和標(biāo)準(zhǔn)電氣元器件符號(hào)的投影矩陣以及手寫(xiě)電氣元器件符號(hào)的投影矩陣其中n代表標(biāo)準(zhǔn)電氣元器件符號(hào)與手寫(xiě)電氣元器件符號(hào)在公共子空間的特征維數(shù),將標(biāo)準(zhǔn)電氣元器件符號(hào)的歸一化特征樣本X與手寫(xiě)電氣元器件符號(hào)的歸一化特征樣本Y映射到公共子空間中,保證在公共子空間中具有最小的重構(gòu)誤差:最小化下列成本函數(shù)
在公式(1)中,分別代表標(biāo)準(zhǔn)電氣元器件符號(hào)的歸一化特征樣本X和手寫(xiě)電氣元器件符號(hào)的歸一化特征樣本Y對(duì)應(yīng)字典D的稀疏系數(shù),在公式(1)的基礎(chǔ)上加入一項(xiàng)正則項(xiàng)UiUiT=I(i∈1,2),保證投影矩陣是正交歸一的。
來(lái)自不同域的相同類的樣本,它們對(duì)應(yīng)的稀疏系數(shù)具有對(duì)應(yīng)的線性映射關(guān)系f(·),即U1=PU2,P為線性映射關(guān)系,在公共子空間中,保證對(duì)應(yīng)的投影系數(shù)有最小的誤差,基于上述要求:最小化下列成本函數(shù):
綜上所述,得到最終的目標(biāo)函數(shù):
采用迭代求解的方法對(duì)公式(3)進(jìn)行求解,包括稀疏系數(shù)求解,字典更新,投影更新以及線性映射更新。
所述稀疏系數(shù)求解,包括:
a.對(duì)線性映射關(guān)系P以及字典D進(jìn)行初始化:將線性映射關(guān)系P初始化為單位矩陣,字典D選用n×k的隨機(jī)矩陣,得到求解稀疏系數(shù)ZX,ZY的目標(biāo)函數(shù):
公式(4)是一個(gè)Lasso求解問(wèn)題,許多L1范數(shù)優(yōu)化算法可以有效的解決,例如LARS,F(xiàn)ISTA等。
所述對(duì)字典進(jìn)行更新,包括:固定稀疏系數(shù)ZX,ZY,字典更新依據(jù)下列公式:
由公式(5)可以看出這是一個(gè)二次約束二次規(guī)劃問(wèn)題,采用拉格朗日乘子法對(duì)字典D進(jìn)行求解。
所述對(duì)線性映射進(jìn)行更新,包括:固定稀疏系數(shù)ZX,ZY,字典D以及投影矩陣U1,U2,得到最終的優(yōu)化目標(biāo)函數(shù):
公式(6)是一個(gè)譜回歸問(wèn)題,直接得到P的最優(yōu)解為:
P=ZYZXT(ZXZXT+(λ/γp)·I)-1 (7)。
所述對(duì)線性投影進(jìn)行更新,包括:固定稀疏系數(shù)ZX,ZY,字典D以及線性映射關(guān)系P,得到最終的優(yōu)化目標(biāo)函數(shù):
采用拉格朗日乘子法對(duì)線性投影進(jìn)行求解,得到U1,U2的最優(yōu)解為:
其中ηX,ηY表示的是拉格朗日算子。
實(shí)施例3、
如實(shí)施例1、2所述的一種手寫(xiě)電氣元器件符號(hào)與標(biāo)準(zhǔn)電氣元器件符號(hào)的匹配識(shí)別方法,其區(qū)別在于,步驟8)中通過(guò)基于歐氏距離的最小距離分類器進(jìn)行分類識(shí)別,包括步驟如下:
給定標(biāo)準(zhǔn)電氣元器件符號(hào)給定手寫(xiě)電氣元器件符號(hào)樣本利用字典學(xué)習(xí)階段得到的投影矩陣,將標(biāo)準(zhǔn)電氣元器件符號(hào)樣本XG與手寫(xiě)電氣元器件符號(hào)樣本YP投影到公共子空間中,Xg=U1XG,Yp=U2YP,利用學(xué)習(xí)的字典D計(jì)算得到手寫(xiě)電氣元器件符號(hào)樣本對(duì)應(yīng)的稀疏系數(shù):
那么,手寫(xiě)電氣元器件符號(hào)樣本用以下公式進(jìn)行分類: