有價(jià)文件識(shí)別裝置自修正識(shí)別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及有價(jià)文件識(shí)別技術(shù)領(lǐng)域,尤其涉及有價(jià)文件識(shí)別裝置自修正識(shí)別方 法。
【背景技術(shù)】
[0002] 清分機(jī)、ATM、VTM、自動(dòng)售賣機(jī)、自動(dòng)售票機(jī)等貨幣或票據(jù)的智能處理裝置,其核心 模塊是有價(jià)文件識(shí)別模塊。有價(jià)文件的識(shí)別性能是衡量有價(jià)識(shí)別裝置的核心指標(biāo),在大規(guī) 模產(chǎn)品應(yīng)用過程中該指標(biāo)受以下兩個(gè)因素影響:
[0003] 1)、使用環(huán)境影響。溫度、濕度等環(huán)境的變化,影響精密傳感器信號(hào),從而影響有價(jià) 文件的識(shí)別精確度。
[0004] 2)、有價(jià)文件本身差異性影響。各地有價(jià)文件存在較大差異,例如城市地區(qū)鈔票質(zhì) 量普遍較好,農(nóng)村地區(qū)鈔票質(zhì)量較差,同一套識(shí)別標(biāo)準(zhǔn)無法很好適應(yīng)。
[0005] 針對(duì)以上問題,目前業(yè)內(nèi)普遍的解決方法分別是:
[0006] 1)、準(zhǔn)備足夠多的有價(jià)文件樣本,一般要求每個(gè)類別1千個(gè)樣本以上,選取5臺(tái)以 上設(shè)備,且針對(duì)各種溫度、濕度變化環(huán)境,分別采集樣本信號(hào)。目的是收集盡可能多類別和 數(shù)量的樣本信號(hào)用于識(shí)別軟件訓(xùn)練,使得識(shí)別性能盡可能適應(yīng)各種不同環(huán)境。
[0007] 2)、針對(duì)不同地區(qū)的樣本差異性,采用不同的識(shí)別軟件。即根據(jù)實(shí)際需求定制化各 種不同的識(shí)別軟件版本。
[0008] 然而,現(xiàn)有的有價(jià)文件識(shí)別方法需要耗費(fèi)大量的資源,當(dāng)使用環(huán)境變化時(shí)又得重 新制定應(yīng)對(duì)方案,無法保證長期穩(wěn)定的使用效果,既增加了服務(wù)商的服務(wù)成本又影響了市 場效益。
【發(fā)明內(nèi)容】
[0009] 本發(fā)明實(shí)施例提供了一種有價(jià)文件識(shí)別裝置自修正識(shí)別方法,能夠解決現(xiàn)有的有 價(jià)文件識(shí)別方法需要耗費(fèi)大量資源,當(dāng)使用環(huán)境變化時(shí)又得重新制定應(yīng)對(duì)方案,無法保證 長期穩(wěn)定的使用效果的問題。
[0010] 本發(fā)明實(shí)施例提供的一種有價(jià)文件識(shí)別裝置自修正識(shí)別方法,包括:
[0011] 提取有價(jià)文件的特征M ;
[0012] 判斷所述特征M是否落入預(yù)設(shè)的任意類別i的判別庫內(nèi),若是,則根據(jù)特征質(zhì)心O1 和特征M獲得類別i的替代質(zhì)心(V ;
[0013] 通過替代質(zhì)心O1'替代類別i的特征質(zhì)心(^更新類別i的所述判別庫;
[0014] 所述判別庫依據(jù)類別i的特征質(zhì)心O1預(yù)先構(gòu)建;
[0015] 所述特征質(zhì)心Oi由類別i的所屬特征計(jì)算得到。
[0016] 可選地,所述提取有價(jià)文件的特征M之前還包括:
[0017] 提取有價(jià)文件的η個(gè)類別的特征,每個(gè)所述類別包括一個(gè)以上的特征,η大于1 ;
[0018] 根據(jù)任意類別i的所屬特征計(jì)算類別i的特征質(zhì)心O1;
[0019] 根據(jù)所述特征質(zhì)心仏獲取類別i的相對(duì)判別平面組,所述類別i的相對(duì)判別平面 組由類別i相對(duì)于其它n-1個(gè)類別的相對(duì)判別平面組成,任意類別i相對(duì)于任意類別Tl的 相對(duì)判別平面I in滿足:相對(duì)判別平面Iin垂直于類別i的特征質(zhì)心O1與類別η的特征質(zhì) 心O n的連線,將類別i和類別η的有價(jià)文件分割在平面的兩邊,且類別i的有價(jià)文件全部 位于相對(duì)判別平面Iin的正方向上,類別η的有價(jià)文件全部位于相對(duì)判別平面I in的負(fù)方 向上,且類別i的有價(jià)文件到相對(duì)判別平面距離最小值小于類別η的有價(jià)文件到相 對(duì)判別平面I in的距離最小值,其中,i不等于η ;
[0020] 以半徑民構(gòu)建類別i的判別球,所述半徑R i由特征質(zhì)心〇 i和類別i的相對(duì)判別 平面組確定;
[0021] 將類別i的相對(duì)判別平面組和類別i的所述判別球的相交區(qū)域確定為類別i的判 別庫。
[0022] 可選地,相對(duì)判別平面Iin的表達(dá)式為:
[0023]
[0024] X為有價(jià)文件特征的空間向量,Win為相對(duì)判別平面I ιη的法向量,din為相對(duì)判別 平面截距。
[0025] 可詵地,所沭半徑的表汰式為:
[0026]
[0027] 共T,ε i乃失別1盼守彳止階L·、U i到失別i的相對(duì)判別平面組的距離最小值,X i 為類別i的特征質(zhì)心O1到類別i全部有價(jià)文件的距離最大值。
[0028] 可選地,所述替代質(zhì)心O1'的表達(dá)式為:
[0029] O1, = (I-Y)O1+γ M
[0030] 其中,更新系數(shù)γ小于1且大于0。
[0031] 可選地,根據(jù)任意類別i的所屬特征計(jì)算類別i的特征質(zhì)心仏具體包括:
[0032] 獲取類別i的所屬特征;
[0033] 計(jì)算類別i的所屬特征的算術(shù)平均數(shù)作為特征質(zhì)心Oi。
[0034] 可選地,
[0035]
[0036]
[0037] 其中,N1為類別i的有價(jià)文件的數(shù)量,〇 lk為類別i的特征質(zhì)心0 i的第k個(gè)特征值, Mu表示類別i中的第j個(gè)特征,η為有價(jià)文件特征數(shù)量。
[0038] 可選地,判斷所述特征M是否落入預(yù)設(shè)的任意類別i的判別庫內(nèi)具體包括:
[0039] 判斷特征M是否同時(shí)滿足以下兩個(gè)表達(dá)式:
[0042] 其M
封正M到特征質(zhì)心O1的距離。
[0043] 可選地,在通過替代質(zhì)心O1'替代類別i的特征質(zhì)心仏更新類別i的所述判別庫 之前還包括:
[0044] 判斷替代質(zhì)心O1'是否滿足預(yù)設(shè)的修正條件,若是,則執(zhí)行通過替代質(zhì)心O 1'替代 類別i的特征質(zhì)心(^更新類別i的所述判別庫的步驟,若否,則不更新所述判別庫。
[0045] 可選地,判斷替代質(zhì)心(V是否滿足預(yù)設(shè)的修正條件具體包括:
[0046] 判斷替代質(zhì)心(V到所述相對(duì)判別平面Iin的距離S ιη是否滿足:
[0047]
[0048] 其中,Δ ιη為相對(duì)判別平_ 1 ^到相對(duì)判別平面1 ^的距離,I ηι為類別η相對(duì)于 類別i的相對(duì)判別平面。
[0049] 從以上技術(shù)方案可以看出,本發(fā)明實(shí)施例具有以下優(yōu)點(diǎn):
[0050] 本發(fā)明實(shí)施例中,通過建立具有自修正能力的判別庫,當(dāng)任意一有價(jià)文件M進(jìn)入 識(shí)別裝置時(shí),用計(jì)算得到的替代質(zhì)心進(jìn)行替代實(shí)現(xiàn)自修正,針對(duì)不同環(huán)境變化及不同區(qū)域 有價(jià)文件的差異性,都能取得較好的識(shí)別效果,當(dāng)使用環(huán)境變化時(shí)無需重新制定應(yīng)對(duì)方案, 可以保證長期穩(wěn)定的使用效果,節(jié)省成本和資源。
【附圖說明】
[0051] 圖1是本發(fā)明有價(jià)文件判別庫建立流程示意圖;
[0052] 圖2是本發(fā)明有價(jià)文件判別庫自修正流程示意圖;
[0053] 圖3是本發(fā)明相對(duì)判別平面組示意圖;
[0054] 圖4是本發(fā)明相對(duì)判別平面對(duì)稱性示意圖。
【具體實(shí)施方式】
[0055] 本發(fā)明實(shí)施例提供了一種有價(jià)文件識(shí)別裝置自修正識(shí)別方法,用于解決現(xiàn)有的有 價(jià)文件識(shí)別方法需要耗費(fèi)大量資源,當(dāng)使用環(huán)境變化時(shí)又得重新制定應(yīng)對(duì)方案,無法保證 長期穩(wěn)定的使用效果的問題。
[0056] 為使得本發(fā)明的發(fā)明目的、特征、優(yōu)點(diǎn)能夠更加的明顯和易懂,下面將結(jié)合本發(fā)明 實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,下面所描述 的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而非全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域 普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其它實(shí)施例,都屬于本發(fā)明保護(hù) 的范圍。
[0057] 本方案首先構(gòu)造一個(gè)有價(jià)文件判別庫,建庫流程如圖1;然后在識(shí)別的過程中,有 價(jià)文件判別庫根據(jù)新增有價(jià)文件進(jìn)行自我修正,最終達(dá)到理想效果,修正流程如圖2。
[0058] 表1是本發(fā)明數(shù)學(xué)符號(hào)代碼含義匯總表,如下表所不:
[0059]
[0060] LuuoI」
[0062] 首先,需要說明的是,本發(fā)明實(shí)施例中,有價(jià)文件的特征是表征有價(jià)文件的一組向 量,有價(jià)文件開發(fā)樣本是構(gòu)建初始判別庫的一批有價(jià)文件。
[0063] 本方案提供有價(jià)文件判別庫建立具體實(shí)施過程如下:
[0064] Sl :提取多維有價(jià)文件特征。有價(jià)文件特征提取根據(jù)應(yīng)用場景不同略有差異,總體 上要求:同一類有價(jià)文件提取的特征是相近的,不同類的有價(jià)文件特征是有明顯區(qū)別的。本 方案對(duì)有價(jià)文件特征的具體數(shù)量沒有嚴(yán)格要求,一般要求幾十個(gè)至幾百個(gè)。所有有價(jià)文件 的特征組合構(gòu)成一個(gè)超高維的特征空間。對(duì)于有價(jià)文件多維特征的提取方式本方案提供了 下述兩個(gè)具體實(shí)施例,有價(jià)文件的提取方式不局限于本方案實(shí)施例。
[0065] Sl-I :具體實(shí)施例一?;谟袃r(jià)文件彩色圖像信號(hào),將圖像劃分成若干等分,將有 價(jià)文件劃分成80等分(10*8),劃分后分別求RGB三個(gè)有色分量的平均灰度值作為特征值, 總計(jì) 80*3 = 24〇個(gè)特征值,即得到一個(gè)240個(gè)元素的特征。不同的鈔票有不同的特征,所 有有價(jià)文件特征構(gòu)成一個(gè)240維的特征空間。
[0066] S1-2 :具體實(shí)施例二。提取多種不同信號(hào)的有價(jià)文件特征信息,包括:紫外光學(xué)特 征信息、紅外光學(xué)特征信息、熒光特征信息、磁性特征信息、白光圖像特征信息、紅外圖像特 征信息、紫外圖像特征信息、磁圖像特征信息、尺寸大小特征信息、厚度信號(hào)特征信息?;?上述十大類不同信號(hào)特征,分別提取特征,每一類別可提取一個(gè)或多個(gè)特征,例如尺寸特征 信息可包括有價(jià)文件的長度特征及寬度特征兩個(gè)特征,磁性特征信息可以提取有價(jià)文件安 全線的磁性編碼特征,熒光特征信息可提取有價(jià)文件的熒光反應(yīng)特征。一般情況下,十個(gè)大 類可提取上百個(gè)特征。特征數(shù)量多一些或是少一些都是允許的,也可以只選取十大類中的 某幾類特征,或者選取十個(gè)大類之外的其它類別的特征,對(duì)于本發(fā)明方案都是適應(yīng)的。
[0067] 特征提取的好壞會(huì)影響到識(shí)別效果以及自修正的速度,但基于本方案下述自修正 方法都是能夠?qū)崿F(xiàn)有價(jià)文件判別庫的自修正。<