国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于圖像識(shí)別和K近鄰的測(cè)評(píng)表識(shí)別方法與流程

      文檔序號(hào):12468563閱讀:470來源:國知局
      一種基于圖像識(shí)別和K近鄰的測(cè)評(píng)表識(shí)別方法與流程

      本發(fā)明屬于圖像處理和數(shù)據(jù)挖掘領(lǐng)域,特別涉及一種基于圖像識(shí)別和K近鄰的測(cè)評(píng)表識(shí)別方法。



      背景技術(shù):

      黨的十六屆四中全會(huì)提出了“抓緊制定體現(xiàn)科學(xué)發(fā)展觀和正確政績(jī)觀要求的干部實(shí)績(jī)考核評(píng)價(jià)標(biāo)準(zhǔn)”的要求。為了做好領(lǐng)導(dǎo)干部的考核和評(píng)價(jià),各單位需要結(jié)合實(shí)際情況設(shè)定考評(píng)內(nèi)容、指標(biāo),科學(xué)設(shè)置實(shí)現(xiàn)的途徑、方法,以及正確運(yùn)用考評(píng)結(jié)果,從而產(chǎn)生不同種類的測(cè)評(píng)表和統(tǒng)計(jì)分析方法。因此,迫切需要一個(gè)完善和高效的考核方法對(duì)各種測(cè)評(píng)內(nèi)容進(jìn)行識(shí)別,對(duì)測(cè)評(píng)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。

      目前,考核測(cè)評(píng)實(shí)施主要有以下四種方法:(1)手工考核方法。由參評(píng)人員在紙質(zhì)測(cè)評(píng)表中進(jìn)行打分,考核組織人員收集測(cè)評(píng)表,再由組織人員進(jìn)行人工統(tǒng)計(jì),得出被考核人員的得分。手工考核方法需要進(jìn)行人工統(tǒng)計(jì),如果參評(píng)人員、被考核對(duì)象以及考核內(nèi)容多,則工作量巨大,效率低,同時(shí)容易出錯(cuò);(2)半自動(dòng)化考核方法。由參評(píng)人員在測(cè)評(píng)表上打分,然后組織專門人員錄入到表格處理軟件(如Office、WPS等)或者其他信息系統(tǒng)來進(jìn)行相應(yīng)的處理。半自動(dòng)化的方法相比較于手工考核方式,再后期的統(tǒng)計(jì)匯總可以提高效率。但是,由于需要人工參與錄入,與手工考核方式存在同樣的問題。(3)采用在線考核方法。建立基于網(wǎng)絡(luò)的考核系統(tǒng),參評(píng)人員登錄系統(tǒng)進(jìn)行打分,然后由系統(tǒng)自動(dòng)進(jìn)行匯總和統(tǒng)計(jì),得出考核結(jié)果。該方法效率高,但是存在的主要問題是,無法唯一區(qū)分不同參評(píng)人員以及參評(píng)人員匿名的問題;同時(shí)由于缺乏票根,無法公開驗(yàn)票,其可信度受到質(zhì)疑,并且其安全性和可靠性問題一直未能很好地解決。(4)基于圖像識(shí)別考核方法。由參評(píng)人員在如圖1中特定的紙質(zhì)測(cè)評(píng)表上打分,然后利用高速掃描儀等設(shè)備得到紙質(zhì)測(cè)評(píng)表的掃描圖像,采用圖像識(shí)別算法從這些圖像中快速識(shí)別參評(píng)人員的填寫信息,并使用數(shù)據(jù)庫技術(shù)對(duì)測(cè)評(píng)數(shù)據(jù)進(jìn)行存儲(chǔ)和管理,快速完成對(duì)測(cè)評(píng)數(shù)據(jù)的統(tǒng)計(jì)、分析和報(bào)表生成。

      其中,基于圖像識(shí)別的考核方法主要有基于OMR和基于OCR兩種方式。(1)基于OMR(Optical Mark Recognition)技術(shù)。OMR一般采用光電管閱讀技術(shù),通過在測(cè)評(píng)表的不同固定位置涂標(biāo)記來表示對(duì)被考核對(duì)象的同意或不同意,讓測(cè)評(píng)表通過專用的采集設(shè)備,由發(fā)光管發(fā)出的光照射到“涂點(diǎn)”上,然后由光敏管接收來自“涂點(diǎn)”位置的反射光。因?yàn)橥坑袠?biāo)記的地方反光弱,未涂標(biāo)記的地方反光強(qiáng),不同強(qiáng)度的光信號(hào)代表有無標(biāo)記兩種狀態(tài)。通過光電變換原理,對(duì)填涂在測(cè)評(píng)表上的內(nèi)容進(jìn)行高速采集,然后進(jìn)入計(jì)算機(jī)處理。目前,使用OMR技術(shù)主要存在如下問題:

      測(cè)評(píng)表紙張和印刷質(zhì)量要求太高,限制太多。有些單位在不同的考核中,需要提前設(shè)計(jì)好測(cè)評(píng)表,提交專門的公司進(jìn)行印制,成本較高;

      對(duì)參評(píng)人員涂寫要求太高,限制太多。如需要使用專用鉛筆涂滿長方條,不得涂出長方條外,整張測(cè)評(píng)表涂寫要深淺一致等;

      折痕、墨點(diǎn)、污物等都可能產(chǎn)生誤識(shí)別現(xiàn)象;

      由于上述三點(diǎn)限制,致使考核過程可能存在錯(cuò)誤,致使統(tǒng)計(jì)存在誤差;

      專用的識(shí)別設(shè)備機(jī)械傳動(dòng)機(jī)構(gòu)復(fù)雜,使用壽命短,成本較高。

      (2)基于OCR(Optical Character Recognition)技術(shù)的字符識(shí)別,如對(duì)汽車牌照數(shù)字的識(shí)別。OCR首先將要識(shí)別的測(cè)評(píng)表掃描進(jìn)計(jì)算機(jī),然后進(jìn)行圖像的預(yù)處理,通過圖像的灰度化、二值化以及歸一化,再抽取字符圖像特征進(jìn)行識(shí)別,轉(zhuǎn)變?yōu)橛?jì)算機(jī)能夠識(shí)別的字符信息。OCR和OMR技術(shù)不同之處是所用紙張的質(zhì)量、印刷技術(shù)要求不高,降低了運(yùn)行成本。

      基于OCR技術(shù)的考核測(cè)評(píng)實(shí)現(xiàn)方法一般流程包括:

      (1)設(shè)計(jì)測(cè)評(píng)表。按照考核的需要,確定考核對(duì)象、考核指標(biāo)(如勤、廉、德、能、績(jī))以及考核等級(jí)(如優(yōu)、良、中、差)等內(nèi)容,然后設(shè)計(jì)測(cè)評(píng)表,一般測(cè)評(píng)表為二維表,如圖1。

      (2)發(fā)放考核測(cè)評(píng)表,參評(píng)人員進(jìn)行填寫打分。按照要求在填寫欄中打√、×或○。

      (3)回收測(cè)評(píng)表,通過高速掃描設(shè)備或者CCD攝像頭將紙質(zhì)測(cè)評(píng)表轉(zhuǎn)換為內(nèi)存中的掃描圖像。

      (4)掃描圖像預(yù)處理。通常對(duì)掃描的圖像進(jìn)行灰度化,二值化以及傾斜矯正等處理。

      (5)定位填表區(qū)域。定位填表區(qū)域通常包括兩種思路:一是在設(shè)計(jì)時(shí),固定好每個(gè)填表區(qū)域相對(duì)于表格左右或上下的相對(duì)距離并存儲(chǔ),在掃描圖像中,根據(jù)該相對(duì)距離計(jì)算每個(gè)填表區(qū)域的位置,該方法對(duì)設(shè)計(jì)時(shí)的操作要求較高。二是對(duì)圖像進(jìn)行搜索,搜索到某個(gè)特殊的位置,并以該位置為起始點(diǎn)進(jìn)行其他關(guān)系確定的位置進(jìn)行搜索。比如搜索左下角的交叉點(diǎn),并以該點(diǎn)為起始點(diǎn),向上搜索各條橫向直線,向右搜索各條豎線的位置。橫向和豎向直線之間的交叉區(qū)域就是填表區(qū)域。搜索時(shí)發(fā)現(xiàn)并確定表的傾斜角度,進(jìn)行傾斜矯正。

      (6)識(shí)別填表區(qū)域符號(hào)。填表區(qū)域符號(hào)的識(shí)別包括兩種,一是僅僅識(shí)別是否填寫了內(nèi)容,該方法直接通過計(jì)算填表區(qū)域內(nèi)黑色象素所占比例,高于一定閾值,則認(rèn)為填寫了內(nèi)容,但是不能識(shí)別內(nèi)容的具體形式,比如是√、×或○等。二是識(shí)別填表區(qū)域內(nèi)具體的符號(hào)類別,提取填表區(qū)域,對(duì)填表區(qū)域進(jìn)行歸一化(比如歸一化到N×M大小的矩形圖像),提取圖像的特征,利用已經(jīng)訓(xùn)練的分類模型進(jìn)行符號(hào)識(shí)別;對(duì)不能識(shí)別的符號(hào),提取到前臺(tái)讓用戶人工識(shí)別,并反饋到樣本庫中,下次考核前重新訓(xùn)練分類模型,以提高識(shí)別準(zhǔn)確率。

      本發(fā)明提出隨機(jī)選項(xiàng)設(shè)置以及圖像識(shí)別的考核測(cè)評(píng)表識(shí)別方法,在創(chuàng)建測(cè)評(píng)表時(shí),對(duì)考核對(duì)象、考核指標(biāo)以及考核內(nèi)容均進(jìn)行隨機(jī)設(shè)置,各測(cè)評(píng)表之間內(nèi)容相同,但顯示順序不同,避免相鄰參評(píng)人之間互相影響;提取符號(hào)圖像的橫向交叉特征和縱向交叉特征,提出K近鄰方法進(jìn)行符號(hào)識(shí)別方法,識(shí)別準(zhǔn)確率高。



      技術(shù)實(shí)現(xiàn)要素:

      發(fā)明目的:針對(duì)現(xiàn)有技術(shù)中存在的問題,本發(fā)明提供一種能夠提高單位對(duì)員工或領(lǐng)導(dǎo)干部考核的效率,降低人力資源管理成本的基于圖像識(shí)別和K近鄰的測(cè)評(píng)表識(shí)別方法。

      技術(shù)方案:為解決上述技術(shù)問題,本發(fā)明提供一種基于圖像識(shí)別和K近鄰的測(cè)評(píng)表識(shí)別方法,包括如下步驟:

      步驟一:設(shè)計(jì)測(cè)評(píng)表。測(cè)評(píng)表中的主要元素包括考核對(duì)象、考核指標(biāo)和考核等級(jí),其中考核對(duì)象、考核指標(biāo)和考核等級(jí)的顯示位置每張測(cè)評(píng)表都不同;

      步驟二:測(cè)評(píng)表打印以及現(xiàn)場(chǎng)測(cè)評(píng)。將生成的測(cè)評(píng)表批量打印,發(fā)放給參評(píng)人員,通過特殊符號(hào)例如畫√、×或○等符號(hào)表達(dá)參評(píng)人員的意見;

      步驟三:測(cè)評(píng)表掃描入庫。利用高速掃描儀對(duì)回收的測(cè)評(píng)表進(jìn)行批量掃描入庫,掃描的同時(shí)進(jìn)行灰度化處理,同時(shí)利用掃描儀進(jìn)行邊緣處理,去掉掃描時(shí)產(chǎn)生的黑邊;

      步驟四:圖像預(yù)處理。圖像預(yù)處理包括圖像的二值化處理和傾斜矯正處理;

      步驟五:條形碼和填表區(qū)域提取,在對(duì)圖像傾斜矯正后,判斷條形碼以及填表區(qū)域的具體位置并進(jìn)行信息提??;

      步驟六:條形碼識(shí)別。借助已有開源的條形碼和二維碼識(shí)別包進(jìn)行條形碼圖像的識(shí)別,根據(jù)識(shí)別出的唯一碼自動(dòng)到外存中檢索關(guān)聯(lián)的測(cè)評(píng)表顯示順序信息,并關(guān)聯(lián)到測(cè)評(píng)表圖像,與后面識(shí)別出的測(cè)評(píng)表填表區(qū)域的內(nèi)容結(jié)合,獲得考核對(duì)象、考核指標(biāo)的填寫情況;

      步驟七:填表區(qū)域識(shí)別。通過判斷是否填寫符號(hào)、對(duì)圖像進(jìn)行膨脹和細(xì)化處理、進(jìn)行符號(hào)重定位、圖像歸一化以及基于K近鄰的符號(hào)識(shí)別,來對(duì)填表區(qū)域進(jìn)行整體識(shí)別。

      其中,步驟一中測(cè)評(píng)表具體設(shè)計(jì)步驟如下:

      步驟1.1:設(shè)計(jì)測(cè)評(píng)表整體結(jié)構(gòu)。將測(cè)評(píng)表分為考核對(duì)象區(qū)域、考核指標(biāo)區(qū)域、考核等級(jí)區(qū)域、填表區(qū)域、條形碼區(qū)域、頂部虛線區(qū)域和右邊虛線區(qū)域;

      步驟1.2:在頂部虛線區(qū)域內(nèi)設(shè)置頂部虛線,在右邊虛線區(qū)域內(nèi)設(shè)置右邊虛線。頂部虛線的每段對(duì)應(yīng)下方的填表區(qū)域,即線段寬度和橫向起止位置與下方的填表區(qū)域的寬度以及橫向起止位置相同,設(shè)置虛線的粗細(xì),以便掃描后,在圖像預(yù)處理時(shí),能夠通過設(shè)置一個(gè)閾值過濾掉噪聲,同時(shí)不影響虛線的處理;右邊虛線第一段從第一個(gè)考核對(duì)象的第一個(gè)考核等級(jí)開始,然后間隔設(shè)置;右邊虛線的每段對(duì)應(yīng)左邊的填表區(qū)域,即線段高度和縱向起止位置與左邊的填表區(qū)域的高度以及縱向起止位置相同,設(shè)置虛線的粗細(xì),以便掃描后,在圖像預(yù)處理時(shí),能夠通過設(shè)置一個(gè)閾值過濾掉噪聲,同時(shí)不影響虛線的處理,右邊虛線中每段結(jié)束位置和下一段開始之間的空白也對(duì)應(yīng)左邊的填表區(qū)域;

      步驟1.3:隨機(jī)確定考核對(duì)象、考核項(xiàng)以及考核等級(jí)順序。隨機(jī)打亂考核對(duì)象、考核項(xiàng)以及考核等級(jí)順序,對(duì)填充到測(cè)評(píng)表中的考核對(duì)象、考核指標(biāo)以及考核等級(jí)區(qū)域分別創(chuàng)建唯一碼;

      步驟1.4:信息寫入庫。將寫到測(cè)評(píng)表中的考核對(duì)象、考核指標(biāo)以及考核等級(jí)的順序信息與唯一碼通過輔助存儲(chǔ)進(jìn)行存儲(chǔ);

      步驟1.5:生成條形碼圖像。對(duì)唯一碼進(jìn)行編碼生成條形碼圖像;

      步驟1.6:設(shè)置測(cè)評(píng)表元素。將打亂后的考核對(duì)象、考核指標(biāo)、考核等級(jí)以及生成的條形碼圖像設(shè)置到對(duì)應(yīng)區(qū)域;

      步驟1.7:判斷是否生成足夠數(shù)量的測(cè)評(píng)表,如果不夠,則繼續(xù)轉(zhuǎn)步驟1.3,如果生成足夠數(shù)量的測(cè)評(píng)表則工作結(jié)束。

      其中,步驟四中圖像二值化處理的具體步驟為:采用全局閾值二值化方法OSTU算法進(jìn)行二值化處理,其中圖像二值化是指通過選取某一閾值將一幅灰度圖像轉(zhuǎn)換為只包含有0和255的高對(duì)比度黑白二值圖像。

      其中,步驟四中圖像傾斜矯正處理即為采用頂部虛線和右邊虛線分別進(jìn)行直線擬合確定傾斜角,然后進(jìn)行傾斜矯正,具體步驟如下:

      步驟4.1:提取頂部虛線區(qū)域。根據(jù)設(shè)計(jì)時(shí)確定的頂部虛線區(qū)域占測(cè)評(píng)表高度比例,在掃描圖像中提取相應(yīng)的頂部區(qū)域圖像imgTseg;

      步驟4.2:搜索虛線段起止橫坐標(biāo)。逐列檢測(cè)圖像imgTseg縱向黑像素點(diǎn),設(shè)置閾值w1,如果存在至少w1個(gè)連續(xù)黑像素點(diǎn),則將該列標(biāo)記為1,若不存在w1個(gè)連續(xù)黑像素點(diǎn),則該列標(biāo)記為0,其中閾值w1小于掃描圖像中線段縱向像素?cái)?shù),建議取線段縱向像素?cái)?shù)的三分之二;從左向右搜索0、1串,各段連續(xù)1的部分的下標(biāo)位置即為對(duì)應(yīng)線段的橫向起止坐標(biāo),處理過程中,需要剔除長度過短的線段;

      步驟4.3:計(jì)算虛線段中點(diǎn)位置。根據(jù)各線段的橫向坐標(biāo),計(jì)算線段中點(diǎn)的橫向坐標(biāo),在圖像imgTseg中固定橫坐標(biāo),從上到下進(jìn)行縱向搜索,遇到w1個(gè)連續(xù)黑像素點(diǎn)時(shí)停止搜索,搜索到的第w1個(gè)黑像素點(diǎn)的縱坐標(biāo)作為中點(diǎn)的縱坐標(biāo),此時(shí)確定了線段中點(diǎn)的橫縱坐標(biāo),對(duì)所有線段采用該方法確定中點(diǎn)坐標(biāo);

      步驟4.4:利用中點(diǎn)擬合直線,確定傾斜角度。利用所有線段中點(diǎn)坐標(biāo)擬合直線,通過該直線的斜率確定圖像的傾斜角度A1。

      步驟4.5:利用縱向虛線確定圖像的傾斜角度A2。采用與確定傾斜角度A1相同的方法,利用縱向虛線再次確定圖像的傾斜角度A2。

      步驟4.6:計(jì)算A1、A2的均值作為圖像的傾斜角度。

      其中,步驟五中對(duì)條形碼和填表區(qū)域提取的具體步驟為:在對(duì)圖像傾斜矯正后,重新按照設(shè)計(jì)時(shí)確定的比例提取右邊和頂部的虛線區(qū)域,并采用和傾斜矯正處理中相同的方法確定頂部線段的橫坐標(biāo)起止位置,右邊豎直方向線段的縱軸坐標(biāo)起止位置;其中橫向線段和縱向線段交叉的區(qū)域即為填表區(qū)域,同時(shí)各豎向線段中間空白區(qū)域與橫向線段交叉也為填表區(qū)域;條形碼區(qū)域由豎直方向最后一個(gè)線段與頂部若干線段的交叉確定。

      其中,步驟七中填表區(qū)域識(shí)別的具體步驟為:

      7.1:首先判斷是否填寫符號(hào)。根據(jù)填表區(qū)域圖像中黑像素點(diǎn)占的比率,判斷該區(qū)域是否填寫了符號(hào);如果黑像素點(diǎn)比率低于設(shè)定的閾值p,則認(rèn)為沒有填寫符號(hào),結(jié)束識(shí)別;如果高于設(shè)定的閾值p,則進(jìn)行進(jìn)一步的處理和識(shí)別;

      計(jì)算樣本庫中手寫樣本符號(hào)像素點(diǎn)在填表區(qū)域中所占比例的均值,閾值p取該均值的五分之一。

      7.2:圖像膨脹和細(xì)化。對(duì)填表區(qū)域圖像進(jìn)行膨脹和細(xì)化處理,得到細(xì)化后的圖片。

      7.3:符號(hào)重定位。逐列檢測(cè)填表區(qū)域縱向黑像素點(diǎn),如果縱坐標(biāo)上無黑像素點(diǎn),則該列記做0,有則記做1。設(shè)置閾值w2,w2取填表區(qū)域?qū)挾鹊氖种?,從左右分別向中心搜索,遇到w2個(gè)連續(xù)1時(shí),認(rèn)為到達(dá)符號(hào)的橫向左右邊界,即逐行檢測(cè)填表區(qū)域圖像橫向黑像素點(diǎn),如果橫坐標(biāo)上無黑像素點(diǎn),則該行記做0,有則記做1;從上下分別向中心搜索,遇到w2個(gè)1連續(xù)時(shí),認(rèn)為到達(dá)符號(hào)的縱向左右邊界;

      7.4:圖像歸一化。將步驟7.3中提取的圖像歸一化為N×M的固定大小圖像,所有的符號(hào)圖像都固定大小;

      7.5:基于K近鄰的符號(hào)識(shí)別。圖片經(jīng)過歸一化處理后,首先提取字符特征,對(duì)字符進(jìn)行分類判別,經(jīng)過訓(xùn)練和識(shí)別兩個(gè)階段,最后識(shí)別出字符。

      其中,所述步驟7.5中測(cè)評(píng)表符號(hào)識(shí)別流程具體步驟如下:

      步驟7.5.1:提取樣本特征。在進(jìn)行模式匹配前,需要選擇樣本,并對(duì)樣本提取特征,其中提取特征為符號(hào)的橫向和縱向交叉特征;通過從樣本圖像庫中提取樣本特征后形成樣本特征庫;

      其中橫向交叉特征,即為橫向掃描符號(hào)圖像,某一行遇到的最左邊的黑色像素和最右邊黑色像素之間的距離是該行的橫向交叉特征,每個(gè)圖像提取后得到的橫向交叉特征為N維的向量;

      其中縱向交叉特征,即為縱向掃描符號(hào)圖像,某一列遇到的最上邊的黑色像素和最下邊黑色像素之間的距離是該列的縱向交叉特征,每個(gè)圖像提取后得到的縱向交叉特征為M維的向量;

      步驟7.5.2:提取填表區(qū)域的符號(hào)特征。通過從填表區(qū)域的符號(hào)圖像中提取橫向和縱向交叉特征形成待識(shí)別符號(hào)特征;

      步驟7.5.3:采用K近鄰算法確定填表區(qū)域的符號(hào)類別。將待識(shí)別符號(hào)橫向交叉特征到樣本橫向特征庫的特征中進(jìn)行基于DTW距離的K近鄰搜索;將待識(shí)別符號(hào)縱向交叉特征到樣本縱向特征庫的特征中進(jìn)行基于DTW距離的K近鄰搜索,在2*K個(gè)近鄰中,樣本數(shù)最多的樣本類別作為填表區(qū)域圖像符號(hào)的類別。

      與現(xiàn)有技術(shù)相比,本發(fā)明的優(yōu)點(diǎn)在于:

      提出考核對(duì)象、考核指標(biāo)以及考核等級(jí)隨機(jī)設(shè)置,使得相鄰參評(píng)人之間在填表時(shí)互相不干擾;增加頂部和右邊的標(biāo)志線,不會(huì)占用考核測(cè)評(píng)表過多空間,可以提高傾斜矯正準(zhǔn)確率,提高填表區(qū)域分割的準(zhǔn)確率;增加唯一碼作為測(cè)評(píng)表標(biāo)識(shí),并創(chuàng)建唯一碼對(duì)應(yīng)的一維條形圖像,在掃描入庫時(shí),通過自動(dòng)識(shí)別條形碼識(shí)別出測(cè)評(píng)表的唯一標(biāo)識(shí),建立考核測(cè)評(píng)表與外存中考核測(cè)評(píng)表結(jié)構(gòu)信息之間的關(guān)聯(lián),該唯一碼可以避免考核測(cè)評(píng)表重復(fù)掃描入庫;基于DTW距離和K近鄰進(jìn)行符號(hào)識(shí)別,可以實(shí)現(xiàn)高效和準(zhǔn)確的填表區(qū)域的識(shí)別?;趫D像識(shí)別和K近鄰的考核測(cè)評(píng)表識(shí)別方法已經(jīng)在實(shí)際中進(jìn)行應(yīng)用,符號(hào)識(shí)別率達(dá)到98%,大大提高單位進(jìn)行考核的工作效率。

      附圖說明

      圖1為背景技術(shù)中普通考核測(cè)評(píng)表樣表;

      圖2為本發(fā)明設(shè)計(jì)的考核測(cè)評(píng)樣表;

      圖3為基于圖像識(shí)別和K近鄰搜索的測(cè)評(píng)表識(shí)別流程圖;

      圖4為圖3中設(shè)計(jì)測(cè)評(píng)表的流程圖;

      圖5為圖4中所設(shè)計(jì)的測(cè)評(píng)表的各區(qū)域標(biāo)示圖;

      圖6為圖1中圖像預(yù)處理中關(guān)于處理頂部虛線確定圖像傾斜角的流程圖;

      圖7為實(shí)施例中搜素頂部虛擬線段橫向起止位置示意圖;

      圖8為實(shí)施例中基于頂部虛擬線段確定傾斜角度示意圖;

      圖9為實(shí)施例中測(cè)評(píng)表?xiàng)l形碼和填表區(qū)域提取示意圖;

      圖10為實(shí)施例中填表區(qū)域符號(hào)重定位圖;

      圖11為圖1中符號(hào)識(shí)別的流程圖;

      圖12為實(shí)施例中√、×和○橫向交叉特征;

      圖13為實(shí)施例中手寫符號(hào)樣本示意圖;

      圖14為實(shí)施例中√、×和○縱向交叉特征;

      圖16為實(shí)施例中√手寫符號(hào)各種變形的橫向交叉特征圖;

      圖17為實(shí)施例中DTW距離的匹配示意圖。

      具體實(shí)施方式

      下面結(jié)合附圖和具體實(shí)施方式,進(jìn)一步闡明本發(fā)明。

      本發(fā)明提出的一種基于圖像識(shí)別和K近鄰的測(cè)評(píng)表識(shí)別方法,通過設(shè)計(jì)測(cè)評(píng)表,考核對(duì)象、考核指標(biāo)以及考核等級(jí)隨機(jī)設(shè)置,每張測(cè)評(píng)表之間整體結(jié)構(gòu)相同,但是考核對(duì)象、考核指標(biāo)以及考核等級(jí)的顯示順序不同,這樣相鄰填表人之間在填表時(shí)互相不干擾。各項(xiàng)顯示順序等測(cè)評(píng)結(jié)構(gòu)信息保存到外部存儲(chǔ)(如關(guān)系型數(shù)據(jù)庫等),并創(chuàng)建唯一碼作為標(biāo)識(shí),以該唯一碼作為編碼內(nèi)容生成一維條形碼圖像,顯示到測(cè)評(píng)表固定區(qū)域,以建立測(cè)評(píng)表與測(cè)評(píng)結(jié)構(gòu)信息的關(guān)聯(lián)。測(cè)評(píng)表頂部和右部的設(shè)置虛線段,用于填表區(qū)域和條形碼圖像定位以及傾斜矯正。測(cè)評(píng)表掃描入庫后,利用虛線段進(jìn)行直線擬合,確定傾斜角度,實(shí)現(xiàn)傾斜矯正,通過頂部和右邊虛線段交叉定位填表區(qū)域和條形碼圖像。利用開源軟件進(jìn)行條形碼圖像解析。填表區(qū)域的識(shí)別,首先將填表區(qū)域歸一化為N×M的矩形圖像,區(qū)域黑色像素占比超過閾值時(shí),進(jìn)行符號(hào)識(shí)別,否則認(rèn)為沒有填寫符號(hào);進(jìn)行符號(hào)識(shí)別時(shí),提取歸一化后矩形圖像的橫向和縱向交叉直線特征,利用基于DTW距離的K近鄰進(jìn)行符號(hào)識(shí)別,判斷填寫內(nèi)容。

      本發(fā)明針對(duì)測(cè)評(píng)考核問題,用圖像識(shí)別的方式進(jìn)行測(cè)評(píng)表識(shí)別,實(shí)現(xiàn)對(duì)員工或干部進(jìn)行高效的測(cè)評(píng)考核,降低人力資源成本。設(shè)計(jì)測(cè)評(píng)表時(shí),對(duì)考核測(cè)評(píng)表中的考核對(duì)象、考核指標(biāo)以及考核等級(jí)等內(nèi)容進(jìn)行打亂顯示,每張考核測(cè)評(píng)表的基本結(jié)構(gòu)相同,但是各項(xiàng)顯示順序都不同,避免相鄰參評(píng)人之間互相影響;考核測(cè)評(píng)表中的結(jié)構(gòu)信息存儲(chǔ)在外部存儲(chǔ)中(如關(guān)系數(shù)據(jù)庫等),并建立唯一碼作為標(biāo)識(shí),對(duì)該唯一碼進(jìn)行生成條形碼圖像并設(shè)置到測(cè)評(píng)表中,建立測(cè)評(píng)表與測(cè)評(píng)結(jié)構(gòu)信息的關(guān)聯(lián)。在測(cè)評(píng)表頂部和右邊設(shè)置定位虛線,通過虛線中點(diǎn)進(jìn)行直線擬合實(shí)現(xiàn)傾斜矯正,利用條形碼圖像和填表區(qū)域的定位;通過測(cè)評(píng)表中一維編碼內(nèi)容的自動(dòng)圖像識(shí)別,實(shí)現(xiàn)與外存中測(cè)評(píng)表結(jié)構(gòu)信息的自動(dòng)關(guān)聯(lián);通過虛線中點(diǎn)的擬合直線進(jìn)行傾斜矯正;提取填表區(qū)域的橫縱向直線交叉特征,通過基于DTW距離的K近鄰搜索進(jìn)行填表區(qū)域內(nèi)容的識(shí)別。實(shí)施過程包括:測(cè)評(píng)表設(shè)計(jì)、測(cè)評(píng)表打印以及現(xiàn)場(chǎng)測(cè)評(píng)、測(cè)評(píng)表掃描入庫、圖像預(yù)處理、條形碼和填表區(qū)域提取、條形碼識(shí)別以及符號(hào)識(shí)別。如圖3所示為基于圖像識(shí)別和K近鄰搜索的考核測(cè)評(píng)表識(shí)別流程圖,各步驟處理如下:

      步驟110:設(shè)計(jì)測(cè)評(píng)表。測(cè)評(píng)表中的主要元素包括考核對(duì)象、考核指標(biāo)以及考核等級(jí)。測(cè)評(píng)表設(shè)計(jì)流程如圖4所示。下面詳細(xì)介紹測(cè)評(píng)表設(shè)計(jì)流程。

      步驟111:設(shè)計(jì)測(cè)評(píng)表整體結(jié)構(gòu)。根據(jù)考核對(duì)象、考核指標(biāo)以及考核等級(jí)的個(gè)數(shù),設(shè)計(jì)整體測(cè)評(píng)表結(jié)構(gòu),測(cè)評(píng)表的整體為一個(gè)二維表結(jié)構(gòu),如圖5??己藢?duì)象區(qū)域、考核指標(biāo)區(qū)域、考核等級(jí)區(qū)域、填表區(qū)域、條形碼區(qū)域、頂部虛線區(qū)域以及右邊虛線區(qū)域全部留空,記錄頂部虛線區(qū)域占測(cè)評(píng)表高度的比例,記錄右邊虛線區(qū)域占測(cè)評(píng)表寬度比例。最后一行條形碼區(qū)域的高度等于1.5倍填表區(qū)域的高度,或者其他的固定關(guān)系。條形碼區(qū)域的寬度可以選擇兩個(gè)考核指標(biāo)所占的寬度,或者其他的寬度,只要能夠讓條形碼圖像正確顯示,以及方便通過頂部和右邊虛線段交叉確定位置即可。

      步驟112:設(shè)置頂部和右邊虛線。根據(jù)設(shè)計(jì)的測(cè)評(píng)表的中間的表格結(jié)構(gòu),設(shè)置頂部和右邊的虛線。頂部虛線的每段對(duì)應(yīng)下方的填表區(qū)域,即線段寬度和橫向起止位置與下方的填表區(qū)域的寬度以及橫向起止位置相同,設(shè)置虛線的適當(dāng)粗細(xì)(一般設(shè)置成其他普通線的4倍粗),以便掃描后,在圖像預(yù)處理時(shí),能夠通過設(shè)置一個(gè)閾值過濾掉噪聲,同時(shí)不影響虛線的處理。右邊虛線第一段從第一個(gè)考核對(duì)象的第一個(gè)考核等級(jí)開始,然后間隔設(shè)置。右邊虛線的每段對(duì)應(yīng)左邊的填表區(qū)域,即線段高度和縱向起止位置與左邊的填表區(qū)域的高度以及縱向起止位置相同,設(shè)置與橫向虛線相同粗細(xì),以便掃描后,在圖像預(yù)處理時(shí),能夠通過閾值過濾掉噪聲,同時(shí)不影響虛線的處理。右邊虛線中每段結(jié)束位置和下一段開始之間的空白也對(duì)應(yīng)左邊的填表區(qū)域。

      步驟113:隨機(jī)確定考核對(duì)象、考核項(xiàng)以及考核等級(jí)順序。隨機(jī)打亂考核對(duì)象、考核項(xiàng)以及考核等級(jí)順序,填充到測(cè)評(píng)表中的考核對(duì)象,考核指標(biāo)以及考核等級(jí)區(qū)域,創(chuàng)建唯一碼。唯一碼需要與后面采用的一維條形碼的格式匹配,即唯一碼需要能夠采用系統(tǒng)使用的條形碼進(jìn)行編碼生成圖像。常見的條形碼有EN13、EN8、UPCE、CODE128等,不同的條形碼的碼值格式以及取值范圍都不同。

      步驟114:信息寫入庫。將顯示到測(cè)評(píng)表中的考核對(duì)象、考核指標(biāo)以及考核等級(jí)的順序信息存入外部存儲(chǔ),并將唯一碼作為主鍵。

      步驟115:生成條形碼圖像。對(duì)唯一碼進(jìn)行編碼生成條形碼圖像,可以使用各種開源的軟件包,如zXing等。

      步驟116:設(shè)置測(cè)評(píng)表元素。將打亂后的考核對(duì)象、考核指標(biāo)、考核等級(jí)以及生成的條形碼圖像設(shè)置到測(cè)評(píng)表相應(yīng)區(qū)域。

      步驟117:是否結(jié)束生成測(cè)評(píng)表。判斷是否生成足夠數(shù)量的測(cè)評(píng)表,如果不夠,則繼續(xù)轉(zhuǎn)步驟113。

      步驟120:測(cè)評(píng)表打印以及現(xiàn)場(chǎng)測(cè)評(píng)。將生成的測(cè)評(píng)表批量打印,發(fā)放給參評(píng)人員,進(jìn)行填寫。該步驟由考核組織方實(shí)施。

      步驟130:測(cè)評(píng)表掃描。利用高速掃描儀對(duì)回收的測(cè)評(píng)表進(jìn)行批量掃描入庫,一般掃描時(shí),通過掃描儀的參數(shù)控制選擇將圖像掃描成黑白圖像,即掃描的同時(shí)進(jìn)行灰度化處理,同時(shí)利用掃描儀進(jìn)行邊緣處理,去掉掃描時(shí)產(chǎn)生的黑邊。

      步驟140:圖像預(yù)處理。圖像預(yù)處理包括圖像的二值化處理以及傾斜矯正等處理。

      (1)二值化處理?;叶葓D像二值化是指通過選取某一閾值將一幅灰度圖像轉(zhuǎn)換為只包含有0和255的高對(duì)比度黑白二值圖像。由于測(cè)評(píng)表的灰度圖像相對(duì)比較簡(jiǎn)單,因此采用全局閾值二值化方法OSTU算法進(jìn)行二值化處理。

      (2)傾斜矯正。掃描的圖像可能會(huì)出現(xiàn)傾斜的情況,因此必須先進(jìn)行傾斜矯正,然后才能提取相應(yīng)的填表區(qū)域和條形碼圖像進(jìn)行識(shí)別。本發(fā)明采用頂部虛線和右邊虛線分別進(jìn)行直線擬合確定傾斜角,然后進(jìn)行傾斜矯正。通過頂部虛線確定傾斜角度的流程如圖6所示,下面詳細(xì)介紹流程。

      步驟141:提取頂部虛線區(qū)域。根據(jù)設(shè)計(jì)時(shí)確定的頂部虛線區(qū)域占測(cè)評(píng)表高度比例,在掃描圖像中提取相應(yīng)的頂部區(qū)域圖像imgTseg。

      步驟142:搜索虛線段起止橫坐標(biāo)。逐列檢測(cè)圖像imgTseg縱向黑像素點(diǎn),如果存在w1個(gè)連續(xù)黑像素點(diǎn),則將該列標(biāo)記為1,若不存在w1個(gè)連續(xù)黑像素點(diǎn),則該列標(biāo)記為0,如圖7。

      設(shè)置閾值w1是為了過濾可能的噪聲數(shù)據(jù),w1取值小于掃描圖像中線段高度像素?cái)?shù)h,一般設(shè)置為2*h/3,。從左向右搜索0、1串,各段連續(xù)1的部分的下標(biāo)位置即為對(duì)應(yīng)線段的橫向起止坐標(biāo)。如圖7中,第1根線段的橫坐標(biāo)起止位置分別為5、10,第2根線段的橫坐標(biāo)起止位置分別為16、22。處理過程中,需要首先剔除長度過短的線段,有可能是噪聲數(shù)據(jù),比如參評(píng)人無意中在頂部畫了一條豎線。

      步驟143:計(jì)算虛線段中點(diǎn)位置。根據(jù)各線段的橫向坐標(biāo),計(jì)算線段中點(diǎn)的橫向坐標(biāo),在圖像imgTseg中固定該橫坐標(biāo),從上到下進(jìn)行縱向搜索,遇到w1個(gè)連續(xù)黑像素點(diǎn)時(shí)停止搜索,搜索到的第w1個(gè)黑像素點(diǎn)的縱坐標(biāo)作為中點(diǎn)的縱坐標(biāo),此時(shí)確定了線段中點(diǎn)的橫縱坐標(biāo)。對(duì)所有線段采用該方法確定中點(diǎn)坐標(biāo)。

      步驟144:利用中點(diǎn)擬合直線,確定傾斜角度。利用所有線段中點(diǎn)坐標(biāo)擬合直線,通過該直線的斜率確定圖像的傾斜角度A1,如圖8所示,圖中黑線段中間的白點(diǎn)(為了便于顯示做了處理,實(shí)際上應(yīng)該是黑像素點(diǎn))是各線段中點(diǎn)。采用各線段中點(diǎn)坐標(biāo),通過線性回歸擬合直線,該直線的傾斜角度即為圖像的傾斜角度。

      對(duì)右邊虛線段的處理與頂部虛線段處理類似。提取右邊虛線段區(qū)域圖像imgRseg,逐行檢測(cè)圖像橫向黑像素點(diǎn),如果存在w1個(gè)連續(xù)黑像素點(diǎn),則將該行標(biāo)記為1,若不存在w1個(gè)連續(xù)黑像素點(diǎn),則該行標(biāo)記為0。從上到下搜索0、1串,各段連續(xù)1的部分的下標(biāo)位置即為對(duì)應(yīng)線段的縱向起止坐標(biāo)。處理過程中,需要剔除長度過短的線段,有可能是噪聲數(shù)據(jù),比如參評(píng)人無意中在右邊畫了一條橫線。根據(jù)線段端點(diǎn)的橫坐標(biāo)計(jì)算線段中點(diǎn)橫坐標(biāo),固定橫坐標(biāo),向左搜索中點(diǎn)的橫坐標(biāo)。利用所有線段中點(diǎn)擬合直線,確定圖像傾斜角度A2。圖像的傾斜角度為兩個(gè)方向上確定的角度的均值(A1+A2)/2,根據(jù)傾斜角度對(duì)圖像進(jìn)行旋轉(zhuǎn)。

      步驟150:條形碼和填表區(qū)域提取。在對(duì)圖像傾斜矯正后,重新提取右邊和頂部的虛線區(qū)域,并采用和傾斜矯正處理中相同的方法確定頂部線段的橫坐標(biāo)起止位置,右邊豎直方向線段的縱軸坐標(biāo)起止位置。橫向線段和縱向線段交叉的區(qū)域即為填表區(qū)域(如C),同時(shí)各豎向線段中間空白區(qū)域與橫向線段交叉也為填表區(qū)域(如D)。條形碼區(qū)域E由豎直方向最后一個(gè)線段與頂部若干線段的交叉確定,具體涉及的頂部線段的數(shù)量由具體考核時(shí)考核項(xiàng)的個(gè)數(shù)以及寬度決定。當(dāng)考核對(duì)象數(shù)量×考核等級(jí)數(shù)量為偶數(shù)時(shí),條形碼右邊沒有虛線段,需要根據(jù)設(shè)計(jì)測(cè)評(píng)表時(shí)確定的條形碼區(qū)域高度與填表區(qū)域高度之間的關(guān)系,從最后一個(gè)縱向線段向下延伸。為了避免邊線的影響,提取的填表區(qū)域圖像比實(shí)際交叉區(qū)域上下左右各縮小一個(gè)設(shè)定的值r,比如2個(gè)像素。如,假設(shè)橫向線段的起止橫坐標(biāo)為x1、x2,縱向線段的起止縱坐標(biāo)為y1、y2,則實(shí)際提取的填表區(qū)域左上角和右下角在測(cè)評(píng)表圖像中的坐標(biāo)分別為(x1+r,y1+r)和(x2-r,y2-r)。

      步驟160:條形碼識(shí)別??梢越柚延虚_源的條形碼圖像識(shí)別包(如zXing等)進(jìn)行條形碼圖像識(shí)別,識(shí)別出測(cè)評(píng)表的唯一碼,根據(jù)唯一碼自動(dòng)到外存中檢索關(guān)聯(lián)的測(cè)評(píng)表顯示順序信息,與后面識(shí)別出的測(cè)評(píng)表填表區(qū)域的內(nèi)容結(jié)合,獲得考核對(duì)象、考核指標(biāo)的填寫情況。

      步驟170:填表區(qū)域識(shí)別。填表區(qū)域識(shí)別包括:判斷是否填寫符號(hào)、圖像膨脹和細(xì)化、符號(hào)重定位、圖像歸一化、基于K近鄰的符號(hào)識(shí)別。下面以√為例介紹處理過程,其他符號(hào)類似。

      (1)判斷是否填寫符號(hào)。根據(jù)填表區(qū)域圖像中黑像素點(diǎn)占的比率,判斷該區(qū)域是否填寫了符號(hào)。如果黑像素點(diǎn)比率低于設(shè)定的閾值,則認(rèn)為沒有填寫符號(hào),結(jié)束識(shí)別;如果高于設(shè)定的閾值,則進(jìn)行進(jìn)一步的處理和識(shí)別。

      計(jì)算樣本庫中的手寫樣本符號(hào)黑像素點(diǎn)在填寫區(qū)域內(nèi)所占比率的均值,

      (2)圖像膨脹和細(xì)化。對(duì)填表區(qū)域圖像進(jìn)行膨脹和細(xì)化處理,得到細(xì)化后的圖片,可以借助OpenCV等開源軟件包實(shí)現(xiàn)。

      (3)符號(hào)重定位。實(shí)際填寫的符號(hào)大小可能小于提取到的填表區(qū)域圖像,為了提高識(shí)別的準(zhǔn)確率,需要去掉上下左右空白區(qū)域。逐列檢測(cè)填表區(qū)域縱向黑像素點(diǎn),如果縱坐標(biāo)上無黑像素點(diǎn),則該列記做0,有則記做1。從左右分別向中心搜索,遇到w2個(gè)連續(xù)1時(shí),認(rèn)為到達(dá)符號(hào)的橫向左右邊界。類似,逐行檢測(cè)填表區(qū)域圖像橫向黑像素點(diǎn),如果橫坐標(biāo)上無黑像素點(diǎn),則該行記做0,有則記做1。從上下分別向中心搜索,遇到w2個(gè)連續(xù)1時(shí),認(rèn)為到達(dá)符號(hào)的縱向左右邊界,采用w2個(gè)連續(xù)1是為了避免某些噪聲點(diǎn)的影響。

      (4)圖像歸一化。將(3)中提取的圖像歸一化為N×M的固定大小圖像,所有的符號(hào)圖像都固定大小,這樣便于進(jìn)行提取特征和比較。

      (5)基于K近鄰進(jìn)行符號(hào)識(shí)別。圖片經(jīng)過歸一化處理后,提取字符特征,對(duì)字符進(jìn)行分類判別,經(jīng)過訓(xùn)練和識(shí)別兩個(gè)階段,最后識(shí)別出字符。訓(xùn)練階段,考核組織機(jī)構(gòu)采集本單位員工的手寫√、×和○為樣本,經(jīng)過人工篩選建立樣本庫,抽取樣本庫中符號(hào)的字符特征,以便對(duì)待識(shí)別字符進(jìn)行分類和識(shí)別。識(shí)別階段,將待識(shí)別符號(hào)特征與訓(xùn)練階段終所建立的標(biāo)準(zhǔn)樣本特征比較,檢索k個(gè)最相似的樣本,前k個(gè)樣本中類別數(shù)最多的類別為該手寫符號(hào)所屬的類別。識(shí)別流程如圖11所示。

      步驟171:提取樣本特征。在進(jìn)行模式匹配前,需要選擇樣本,并對(duì)樣本提取特征。參評(píng)人填寫的√、×和○等符號(hào),千變?nèi)f化,為準(zhǔn)確識(shí)別這些符號(hào),需要進(jìn)行字符結(jié)構(gòu)特征提取,提取最能體現(xiàn)該字符特點(diǎn)和字符間差異的結(jié)構(gòu)特征,本發(fā)明提取符號(hào)的橫向和縱向交叉特征。

      (1)橫向交叉特征。橫向掃描符號(hào)圖像,某一行遇到的最左邊的黑色像素和最右邊黑色像素之間的距離是該行的橫向交叉特征。每個(gè)圖像提取后得到的橫向交叉特征為N維的向量。√、×和○三個(gè)符號(hào)橫向交叉特征具有較大的區(qū)別,標(biāo)準(zhǔn)情況下,√符號(hào)先是大量的0,然后突然調(diào)到最高,接著逐漸下降到0;×符號(hào)圖像的橫向交叉特征先是最高,然后逐漸下降,直到0,然后逐漸升高;○符號(hào)的圖像橫向交叉特征首先從0逐漸升高(可能會(huì)維持一段平行的高位),然后逐漸下降到0。如果把這些N維向量作為一維曲線繪制,大概的形態(tài)如圖12。

      其中,符號(hào)×一般可能出現(xiàn)兩種情況,圖12(2)是非常標(biāo)準(zhǔn)的情況,但是實(shí)際上書寫時(shí),兩個(gè)筆畫不能一樣長,如圖13(1),則出現(xiàn)圖12(3)的橫向交叉特征。

      符號(hào)○一般可能會(huì)出現(xiàn)三種情況,完全標(biāo)準(zhǔn)的情況下如圖12(3)橫向交叉特征,如圖13(2)的手寫○符號(hào)則可能出現(xiàn)類似圖12(4)的橫向交叉特征。有些○符號(hào)在書寫時(shí),可能沒有完全閉合,如圖13(3),則可能出現(xiàn)類似圖12(5)的橫向交叉特征。實(shí)際識(shí)別過程中提取到的橫向交叉特征,一般是以上幾種標(biāo)準(zhǔn)的特征基礎(chǔ)上,增加了各種噪聲而成的。

      (2)縱向交叉特征??v向掃描符號(hào)圖像,某一列遇到的最上邊的黑色像素和最下邊黑色像素之間的距離是該列的縱向交叉特征。每個(gè)圖像提取后得到的縱向交叉特征為M維的向量。√、×和○三個(gè)符號(hào)縱向交叉特征具有較大的區(qū)別,標(biāo)準(zhǔn)情況下,√符號(hào)圖像的縱向交叉特征基本上是大量的0;×符號(hào)圖像的縱向交叉特征先是很高,然后逐漸下降,直到0,然后再逐漸升高;○符號(hào)的圖像縱向交叉特征首先從0逐漸升高(可能會(huì)維持一段平行的高位),然后再逐漸下降到0。如果把這些M維向量作為一維曲線繪制,大概的形態(tài)如圖14。

      其中,符號(hào)√一般可能出現(xiàn)兩種情況,圖14(1)是非常標(biāo)準(zhǔn)的情況,但是實(shí)際上書寫時(shí),常常如圖13(4),則出現(xiàn)圖14(2)的縱向交叉特征。符號(hào)×和○的縱向交叉特征與橫向交叉特征類似。實(shí)際識(shí)別過程中提取到的縱向交叉特征,一般是以上幾種標(biāo)準(zhǔn)的特征基礎(chǔ)上,增加了各種噪聲而成的。

      步驟172:提取符號(hào)特征。提取填表區(qū)域中符號(hào)圖像的橫向和縱向交叉特征。

      步驟173:基于DTW距離的K近鄰搜索。分別到樣本橫向交叉特征庫和樣本縱向交叉特征庫中進(jìn)行K近鄰搜索,在2*K個(gè)近鄰中,樣本數(shù)最多的樣本的類別作為矩形圖像符號(hào)的類別。一般K取3??梢圆扇?shù)據(jù)挖掘中相似性搜索的任何K近鄰搜索方法進(jìn)行搜索。

      相似度量采用DTW(Dynamic TimeWrapping:動(dòng)態(tài)時(shí)間彎曲)距離,DTW距離對(duì)兩個(gè)待計(jì)算的特征向量,從整體上采用動(dòng)態(tài)規(guī)劃的方式求解得到一個(gè)全局的最小距離。DTW距離首先在語音識(shí)別領(lǐng)域被使用,可以解決同樣一個(gè)發(fā)音,但是持續(xù)時(shí)間不同時(shí)的相似度量問題?!獭ⅰ梁汀鹑齻€(gè)手寫符號(hào)結(jié)構(gòu)相對(duì)比較簡(jiǎn)單,但是也可能出現(xiàn)各種拐點(diǎn)偏移的情況,比如,針對(duì)√符號(hào),有可能有如圖15的各種書寫。

      對(duì)應(yīng)著三種寫法的橫向交叉特征顯示成一維曲線,可能如圖16??梢钥闯?,雖然各段的持續(xù)長度不同,但是這些都應(yīng)該認(rèn)為是√符號(hào)的橫向特征。利用DTW距離進(jìn)行相似距離計(jì)算時(shí),圖16(1)與圖16(2)特征之間的距離計(jì)算會(huì)采用如圖17所示的逐點(diǎn)匹配方式計(jì)算。

      以上所述僅為本發(fā)明的實(shí)施例子而已,并不用于限制本發(fā)明。凡在本發(fā)明的原則之內(nèi),所作的等同替換,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。本發(fā)明未作詳細(xì)闡述的內(nèi)容屬于本專業(yè)領(lǐng)域技術(shù)人員公知的已有技術(shù)。

      當(dāng)前第1頁1 2 3 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1