国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于字符串核的手繪草圖識別方法

      文檔序號:6425695閱讀:257來源:國知局
      專利名稱:基于字符串核的手繪草圖識別方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及基于核方法的手繪草圖識別。
      背景技術(shù)
      本發(fā)明所涉及的背景技術(shù)包括以下三個方面一、手繪草圖識別手繪草圖識別是將筆式交互獲取的模糊的草圖表達(dá)映射至精確的圖形表達(dá),即從人機(jī)交互過程中不斷增長的草圖信息中挖掘草圖形狀約束,在領(lǐng)會用戶本來意圖的基礎(chǔ)上,把自由的、不規(guī)則的草圖識別成為規(guī)則的、精確的幾何形狀。目前主要存在三種方式的圖形識別方法,即基于筆劃表示的方法;基于直線、弧、 曲線等圖元表示的方法;基于幾何特征的圖形識別方法。1、基于比劃的表示方法通常情況下,草圖識別系統(tǒng)通過筆式交互方式獲取的草圖表現(xiàn)為若干由用戶在落筆與提筆間的取樣點(diǎn)序列構(gòu)成的筆劃。筆劃是圖形重要的構(gòu)成信息。早期的系統(tǒng)視筆劃為符號,賦予它特定的含義,將筆劃的識別等同于圖形的識別。單筆劃識別中,較為經(jīng)典的是 Rubine方法,該方法簡單有效,但它要求用戶必須以固定模式的筆劃來勾勒圖形,而且圖形構(gòu)成比較簡單。2、基于圖元的表示方法基于圖元表示將圖形表示為直線、弧、曲線等圖元在一定空間關(guān)系下的組合?;趫D元的方法通常包含分割、擬合、規(guī)整、識別等步驟。用戶繪制的草圖可以自動拆分成圖元及其關(guān)系,圖形模板的訓(xùn)練不需要用戶干預(yù),模板庫容易擴(kuò)展,適應(yīng)性強(qiáng)。但不可避免地訓(xùn)練模板以及對圖形測試所有己定義的屬性增加了系統(tǒng)開銷。3、基于幾何特征的識別基于幾何特征的方法直接將圖形當(dāng)成識別單元,直接提取草圖的幾何特征用于分類。通常它要以一定的方式先分割好不同的圖形幾何特征的抽取實(shí)質(zhì)上是將筆劃信息降維,但由于圖形的復(fù)雜性,很難以固定維數(shù)的幾何特征保留筆劃的完整信息,部分信息在降維過程中丟失了。因此,幾何特征的方法識別的精確性不高一些視覺不相似的圖形的幾何特征表示可能相近。二、字符串核(Sting Kernel)核方法表示一組相關(guān)的機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘算法。核方法的關(guān)鍵組成部分是核函數(shù),核函數(shù)可以度量輸入數(shù)據(jù)的相似性?;谶@些核函數(shù),可以通過支持向量機(jī)(SVM)完成分類、回歸等任務(wù)。字符串核可處理輸入數(shù)據(jù)類型為字符串的數(shù)據(jù),通過字符串核函數(shù)度量兩個輸入字符串的相似性。字符串核可分為多種,例如譜-類似的,計(jì)算兩個輸入字符串的公共子串的字符串核,基于比對的字符串核,由概率模型獲得的字符串核。
      字符串核已應(yīng)用于蛋白質(zhì)同源檢測、文本分類等領(lǐng)域。三、支持向量機(jī)(SupportVector Machine, SVM) 支持向量機(jī)(Support Vector Machine, SVM)是著名的基于核方法的系統(tǒng)。支持向量機(jī)(support vector machine, SVM)借助于最優(yōu)化方法解決機(jī)器學(xué)習(xí)問題的新工具。它由Vapnik及其合作者發(fā)明,在1992年計(jì)算機(jī)學(xué)習(xí)理論的會議上介紹進(jìn)入機(jī)器學(xué)習(xí)領(lǐng)域,之后受到了廣泛的關(guān)注。近年來在其理論研究和算法實(shí)現(xiàn)方面都取得了突破性進(jìn)展,并成為克服“維數(shù)災(zāi)難”和“過學(xué)習(xí)”等傳統(tǒng)困難的有力手段。SVM的理論體系涵蓋的對象極為廣泛,如對偶表示、特征空間、學(xué)習(xí)理論、優(yōu)化理論和算法等。SVM在文本分類、 手寫識別、圖像分類、生物信息學(xué)等領(lǐng)域中獲得了比較好的應(yīng)用。該算法在集合L變?yōu)榭?,或者λ足夠小的時候停止。

      發(fā)明內(nèi)容
      基于上述現(xiàn)有技術(shù),本發(fā)明提出了一種基于字符串核的手繪草圖識別方法,結(jié)合手繪草圖識別、字符串核、支持向量機(jī)這三項(xiàng)已有技術(shù),實(shí)現(xiàn)一種能夠持續(xù)訓(xùn)練/積累的新的手繪草圖識別方法。本發(fā)明提出了一種基于字符串核的手繪草圖識別方法,該方法包括以下步驟步驟一,將手繪草圖映射為特征字符串,對輸入的手繪草圖進(jìn)行等距離采樣,采樣距離閾值根據(jù)經(jīng)驗(yàn)選擇5像素,并且限定采樣的時間閾值內(nèi)(0.7秒)連續(xù)采樣一個草圖; 將采樣的手繪草圖映射成特征字符串,還包括以下步驟取一正整數(shù)η;計(jì)算采樣到的手繪草圖的外接矩形,并將草圖的外接矩形均分為η2 份;每一個分割后獲得的小矩形都可以使用二維坐標(biāo)X,y來表示,其中1<X,并且 x,y e N;當(dāng)且僅當(dāng)一個小矩形的中心點(diǎn)落在了手繪草圖圍成的區(qū)域內(nèi)時,我們認(rèn)為該小矩形被填充了 ;將一個手繪草圖映射成了一個長度為η2的特征字符串;步驟二,通過支持向量機(jī)基于字符串核對作為訓(xùn)練樣本的采樣草圖進(jìn)行訓(xùn)練,獲得分類器,使用格搜索進(jìn)行參數(shù)調(diào)優(yōu),選擇最佳的懲罰因子C,gama, η ;字符串核通過兩個字符串間的編輯距離來度量這兩個字符串的相似度;所述編輯距離為字符串一變換為字符串二所用的最少字符操作數(shù);步驟三,通過訓(xùn)練得到的分類器對待識別的草圖進(jìn)行分類和識別,將模糊、不規(guī)則的手繪草圖映射為精確的幾何形狀。所述字符操作包括刪除字符一 ;(2)插入字符二 ;(3)將一個字符改為另一個字符的操作。所述最佳的懲罰因子C,gama, η的取值分別為5個像素,9個字符,0. 01秒。所述映射過程的計(jì)算公式如下首先,定義函數(shù)f :Ν2 — {0,1,2,Λ,η}
      “、fx若(X,y)對應(yīng)的小矩形被填充 /(x^) = |o其他其次,計(jì)算特征字符串的過程如下
      Initialize :x = 1,y = 1,η = k,眾 e0 +,s=〃 “;For (χ = 1 ;x ^ η ;χ++)For (y = 1 ;y ^ η ;y++){Int tmp = f (χ, y);S = strcat (S, tmp);}Output S ;至此就將一個手繪草圖映射成了一個長度為η2的特征字符串。與現(xiàn)有技術(shù)相比,本發(fā)明的一種基于字符串核的草圖識別方法,該方法與草圖的位置,大小,繪制方式無關(guān),允許用戶按照自己習(xí)慣的方式進(jìn)行草圖繪制?;谧址说牟輬D識別方法識別準(zhǔn)確率較高,且實(shí)現(xiàn)簡單。


      圖1為手繪三角形的特征字符串映射(η = 5)示意圖;圖2為實(shí)驗(yàn)圖形集示意圖;圖3為手繪草圖及其識別結(jié)果圖;圖4為本發(fā)明的基于字符串核的手繪草圖識別方法的整體流程圖。
      具體實(shí)施例方式首先基于區(qū)域填充的思想將手繪草圖映射為特征字符串,其次通過支持向量機(jī) (Support Vector Machine, SVM)基于字符串核(String Kernelho)對訓(xùn)練樣本進(jìn)行訓(xùn)練, 獲得分類器,然后通過訓(xùn)練得到的分類器對待識別的草圖進(jìn)行分類和識別,將模糊,不規(guī)則的手繪草圖映射為精確的幾何形狀。本發(fā)明的系統(tǒng)運(yùn)行于visual C++6. 0環(huán)境下,基于Iibsvm軟件包,使用C++語言開發(fā)的。首先,在visual C++6.0中建立一個單文檔視圖的工程;將添加了字符串核 (String Kernel)的Iibsvm軟件包移植到建立的工程中,編寫特征字符串映射模塊的代碼。準(zhǔn)備訓(xùn)練數(shù)據(jù)采集了 1150個樣本,其中1000個樣本作為訓(xùn)練數(shù)據(jù),150個作為測試數(shù)據(jù),并將草圖映射為特征字符串,將獲得的特征字符串寫入文件中保存。訓(xùn)練分類器使用特征字符串訓(xùn)練分類器,并使用格搜索的方式進(jìn)行參數(shù)調(diào)節(jié),即懲罰因子C,gama, η調(diào)節(jié)。詳細(xì)描述如下一、作為本發(fā)明輸入的手繪草圖采樣&識別在該步驟中需要做的是,將采樣到的待識別手繪草圖映射為特征字符串,使用訓(xùn)練得到的分類器對其進(jìn)行分類,從而完成手繪草圖的識別。1)預(yù)處理對輸入的手繪草圖進(jìn)行等距離采樣,采樣距離閾值根據(jù)經(jīng)驗(yàn)選擇5像素,并且限定采樣的時間閾值內(nèi)(0.7秒)連續(xù)采樣一個草圖,對輸入比劃的順序和方向無要求,即若用戶落筆與上一次提筆之間的時間間隔大于0.7秒,則系統(tǒng)認(rèn)為用戶的上一個草圖輸入結(jié)束,并開始繪制一個新的草圖。作為像素點(diǎn)重采樣的間隙,該變量取值根據(jù)經(jīng)驗(yàn)獲得。將采樣的手繪草圖映射成特征字符串,包括以下步驟首先取一正整數(shù)η ;計(jì)算采樣到的手繪草圖的外接矩形,并將草圖的外接矩形均分為η2份。每一個分割后獲得的小矩形都可以使用二維坐標(biāo)(X,y)來表示,其中1 < X,y < η并且X,y e N。 當(dāng)且僅當(dāng)一個小矩形的中心點(diǎn)落在了手繪草圖圍成的區(qū)域內(nèi)時,我們認(rèn)為該小矩形被填充了。如圖1所示的手繪三角形的特征字符串映射(n = 5Pixel)示意圖(陰影部分表示為被填充)。圖中手繪三角形映射的特征字符串S = 0100002222033004400050000o映射過程的計(jì)算公式如下首先,定義函數(shù)
      權(quán)利要求
      1.一種基于字符串核的手繪草圖識別方法,該方法包括以下步驟步驟一,將手繪草圖映射為特征字符串,對輸入的手繪草圖進(jìn)行等距離采樣,采樣距離閾值根據(jù)經(jīng)驗(yàn)選擇5像素,并且限定采樣的時間閾值內(nèi)(0.7秒)連續(xù)采樣一個草圖;將采樣的手繪草圖映射成特征字符串,還包括以下步驟取一正整數(shù)η ;計(jì)算采樣到的手繪草圖的外接矩形,并將草圖的外接矩形均分為η2份; 每一個分割后獲得的小矩形都可以使用二維坐標(biāo)χ,y來表示,其中1 < χ,y < η并且χ, y e N;當(dāng)且僅當(dāng)一個小矩形的中心點(diǎn)落在了手繪草圖圍成的區(qū)域內(nèi)時,我們認(rèn)為該小矩形被填充了 ;將一個手繪草圖映射成了一個長度為η2的特征字符串;步驟二,通過支持向量機(jī)基于字符串核對作為訓(xùn)練樣本的采樣草圖進(jìn)行訓(xùn)練,獲得分類器,使用格搜索進(jìn)行參數(shù)調(diào)優(yōu),選擇最佳的參數(shù)C,gama,并使用獲得的C,gama及步驟一中選定的正整數(shù)η對整個訓(xùn)練集進(jìn)行訓(xùn)練,獲取支持向量機(jī)模型;字符串核通過兩個字符串間的編輯距離來度量這兩個字符串的相似度;所述編輯距離為字符串一變換為字符串二所用的最少字符操作數(shù);步驟三,通過訓(xùn)練得到的分類器對待識別的草圖進(jìn)行分類和識別,將模糊、不規(guī)則的手繪草圖映射為精確的幾何形狀。
      2.如權(quán)利要求1所述的基于字符串核的手繪草圖識別方法,其特征在于,所述字符操作包括刪除字符一;(2)插入字符二;(3)將一個字符改為另一個字符的操作。
      3.如權(quán)利要求1所述的基于字符串核的手繪草圖識別方法,其特征在于,所述最佳的懲罰因子C,gama, η的取值分別為5個像素,9個字符,0. 01秒。
      4.如權(quán)利要求1所述的基于字符串核的手繪草圖識別方法,其特征在于,所述映射過程的計(jì)算公式如下首先,定義函數(shù) f :N2 — {0,1,2, Λ, η}“、fx若(x,y)對應(yīng)的小矩形被填充 /(x^) = |o其他其次,計(jì)算特征字符串的過程如下Initialize :x = l,y = l,n = k,眾 e0 +,s =〃 “; For (χ = 1 ;x ^ η ;χ++)For (y = 1 ;y 彡 η ;y++){Int tmp = f (χ, y); S = strcat(S, tmp);ιOutput S ;至此將一個手繪草圖映射成了一個長度為η2的特征字符串。
      全文摘要
      本發(fā)明公開了一種基于支持向量機(jī)的核矩陣近似方法,該方法包括以下步驟首先基于區(qū)域填充的思想將手繪草圖映射為特征字符串,其次通過支持向量機(jī)(Support Vector Machine,SVM)基于字符串核(String Kernelho)對訓(xùn)練樣本進(jìn)行訓(xùn)練,獲得分類器,然后通過訓(xùn)練得到的分類器對待識別的草圖進(jìn)行分類和識別,將模糊,不規(guī)則的手繪草圖映射為精確的幾何形狀。與現(xiàn)有技術(shù)相比,本發(fā)明的方法與草圖的位置,大小,繪制方式無關(guān),允許用戶按照自己習(xí)慣的方式進(jìn)行草圖繪制?;谧址说牟輬D識別方法識別準(zhǔn)確率較高,且實(shí)現(xiàn)簡單。
      文檔編號G06K9/20GK102184395SQ20111015185
      公開日2011年9月14日 申請日期2011年6月8日 優(yōu)先權(quán)日2011年6月8日
      發(fā)明者廖士中, 段孟華 申請人:天津大學(xué)
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1