国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種識(shí)別手寫文本行語言類別的方法及裝置的制作方法

      文檔序號(hào):6357354閱讀:114來源:國知局
      專利名稱:一種識(shí)別手寫文本行語言類別的方法及裝置的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明屬于輸入法技術(shù)領(lǐng)域,涉及一種識(shí)別手寫文本行語言類別的方法,特別是涉及一種識(shí)別手寫文本行語言類別的方法及裝置。
      背景技術(shù)
      隨著移動(dòng)終端和觸控技術(shù)的發(fā)展,手寫技術(shù)以其方便、快速的優(yōu)勢(shì)得到了更加廣泛的應(yīng)用。對(duì)手寫文本的識(shí)別也逐步從單個(gè)字符的識(shí)別發(fā)展到文本行的識(shí)別,中文和英文兩種語言類別的文本行識(shí)別是目前應(yīng)用最多的?,F(xiàn)有的大部分手寫文本行識(shí)別技術(shù)中,通過在一個(gè)終端上加載不同的識(shí)別語言包來實(shí)現(xiàn)特定語言的手寫文本行輸入,該方法無法在同一個(gè)終端上識(shí)別多種語言的手寫文本行,當(dāng)需要識(shí)別其他語言的手寫文本行時(shí),需要首先卸載當(dāng)前識(shí)別語言包,然后,再安裝另一種識(shí)別語言包,使用起來非常不方便。一種改進(jìn)的手寫文本行識(shí)別技術(shù)的應(yīng)用是同時(shí)加載多個(gè)識(shí)別語言包,進(jìn)行手寫文本行識(shí)別之前,首先指定手寫文本行的語言類別,在用戶完成文本行的輸入后,只能按照指定的語言類別對(duì)輸入的文本行進(jìn)行識(shí)別。這種應(yīng)用,要求使用者在每次輸入不同語言類別的文本行之前,首先設(shè)置識(shí)別的文本行的語言類別,用戶使用起來也非常不方便,也影響輸入的速度。

      發(fā)明內(nèi)容
      本發(fā)明的目的在于提供一種識(shí)別手寫文本行語言類別的方法及裝置,能夠自動(dòng)識(shí)別手寫文本行語言類別,在進(jìn)行手寫文本行識(shí)別之前,不需要用戶手動(dòng)設(shè)置手寫文本行的識(shí)別范圍,方便用戶進(jìn)行多語言的文本行輸入,也提高了輸入的速度。本發(fā)明提供了如下方案
      一種識(shí)別手寫文本行語言類別的方法,包括 獲取手寫文本行,將手寫文本行分割成多個(gè)筆劃幾何塊;
      分別提取每個(gè)筆劃幾何塊的特征,根據(jù)提取的特征計(jì)算所述筆劃幾何塊的預(yù)設(shè)語言可
      信度;
      根據(jù)獲得的多個(gè)筆劃幾何塊的預(yù)設(shè)語言可信度,識(shí)別所述手寫文本行的語言類別。優(yōu)選的,所述將手寫文本行分割成多個(gè)筆劃幾何塊,包括從手寫文本行的筆跡數(shù)據(jù)中提取所有筆劃,并將每個(gè)筆劃初始化為相應(yīng)的筆劃塊;通過合并水平投影重疊的筆劃塊,將多個(gè)筆劃塊合并成至少一個(gè)筆劃幾何塊。所述筆跡數(shù)據(jù)包括構(gòu)成筆劃的筆跡點(diǎn)坐標(biāo)和筆劃結(jié)束標(biāo)志,所述筆劃幾何塊包括至少一個(gè)筆劃。優(yōu)選的,所述合并水平投影重疊的筆劃塊,將多個(gè)筆劃塊分割成至少一個(gè)筆劃幾何塊,包括
      51、依序取兩個(gè)相鄰的筆劃塊;
      52、判斷所述兩個(gè)相鄰的筆劃塊的水平投影是否重疊,如果重疊,將所述兩個(gè)相鄰的筆劃塊合并為合并筆劃塊;53、依序取與所述合并筆劃塊相鄰的筆劃塊,并判斷所述合并筆劃塊和該相鄰的筆劃塊的水平投影是否重疊,如果重疊,將所述合并筆劃塊和該相鄰的筆劃塊合并為另一合并筆劃塊,重復(fù)S3 ;否則,所述合并筆劃塊形成一個(gè)筆劃幾何塊,轉(zhuǎn)至Sl ;
      54、 重復(fù)步驟S3,直至所有筆劃塊合并完成;
      其中,所述合并筆劃塊包括至少兩個(gè)筆劃的筆劃塊。所述相鄰筆劃塊指按筆劃書寫順序相鄰的筆劃塊。優(yōu)選的,在所述合并筆劃塊和與其相鄰的筆劃塊的筆劃四周分別沿水平方向和垂直方向繪制線條形成一個(gè)四邊形區(qū)域,該四邊形區(qū)域包括上邊框、下邊框、左邊框和右邊框;
      其中,所述上邊框通過筆劃塊中的筆劃筆跡點(diǎn)中位于最頂側(cè)的筆跡點(diǎn)沿水平方向繪制線條形成,所述下邊框通過沿筆劃塊中的筆劃筆跡點(diǎn)中位于最底側(cè)的筆跡點(diǎn)沿水平方向繪制線條形成,所述左邊框通過沿筆劃塊中的筆劃筆跡點(diǎn)中位于最左側(cè)的筆跡點(diǎn)沿垂直方向繪制線條形成,所述右邊框通過沿筆劃塊中的筆劃筆跡點(diǎn)中位于最右側(cè)的筆跡點(diǎn)沿垂直方向繪制線條形成。其中,所述兩個(gè)相鄰的筆劃塊包括第一筆劃塊和第二筆劃塊;
      判斷兩個(gè)相鄰的筆劃塊的水平投影是否重疊時(shí),若第一筆劃塊的左邊框在第二筆劃塊的右邊框的左側(cè)且第一筆劃塊的右邊框在第二筆劃塊的左邊框的右側(cè),則該兩個(gè)筆劃塊的
      水平投影重疊。優(yōu)選的,所述預(yù)設(shè)語言包括中文、日文和韓文,所述筆劃幾何塊的特征包括預(yù)設(shè)語言字符識(shí)別可信度、高寬比、筆跡點(diǎn)密度和筆劃數(shù)。優(yōu)選的,所述第,個(gè)筆劃幾何塊的預(yù)設(shè)語言可信度m)通過公式 -p(馬)= 咚計(jì)算得到,其中,所述0表示第k個(gè)特征的權(quán)重,滿足條件1 = £賤, 所述& (馬)表示筆劃幾何塊ι的第k個(gè)特征的特征值。優(yōu)選的,所述根據(jù)獲得的多個(gè)筆劃幾何塊的預(yù)設(shè)語言可信度,識(shí)別所述手寫文本行的語言類別,包括根據(jù)多個(gè)筆劃幾何塊的預(yù)設(shè)語言可信度,獲得該手寫文本行的預(yù)設(shè)語言可信度;根據(jù)手寫文本行的預(yù)設(shè)語言可信度識(shí)別所述手寫文本行的語言類別。優(yōu)選的,通過公式P該)=m嚴(yán){汽4)}獲得手寫文本行的預(yù)設(shè)語言可信度尸侈),
      為變量,代表筆劃幾何塊的范圍,!>D(馬)}表示手寫文本行經(jīng)分割獲得的所有筆劃幾何塊。 手寫文本行經(jīng)分割獲得的所有筆劃幾何塊的預(yù)設(shè)語言可信度的最大值即為該手寫文本行的預(yù)設(shè)語言可信度,所述P(爲(wèi))為第i個(gè)筆劃幾何塊的預(yù)設(shè)語言可信度,為大于等于0,且小于等于1的數(shù)。一種識(shí)別手寫文本行語言類別的裝置,包括
      筆劃幾何塊分割單元,用于獲取手寫文本行,將手寫文本行分割成多個(gè)筆劃幾何塊; 筆劃幾何塊識(shí)別單元,用于分別提取每個(gè)筆劃幾何塊的特征,根據(jù)提取的特征計(jì)算所述筆劃幾何塊的預(yù)設(shè)語言可信度;
      文本行識(shí)別單元,用于根據(jù)獲得的多個(gè)筆劃幾何塊的預(yù)設(shè)語言可信度,識(shí)別所述手寫文本行語言類別。 所述筆劃幾何塊分割單元進(jìn)一步包括
      筆劃提取子單元,用于從手寫文本行的筆跡數(shù)據(jù)中提取多個(gè)筆劃塊,并將每個(gè)筆劃初始化為相應(yīng)的筆劃塊,所述筆跡數(shù)據(jù)包括構(gòu)成筆劃的筆跡點(diǎn)坐標(biāo)和筆劃結(jié)束標(biāo)志。筆劃塊合并子單元,用于通過合并水平投影重疊的筆劃塊,將多個(gè)筆劃塊合并成至少一個(gè)筆劃幾何塊,包括
      51、依序取兩個(gè)相鄰的筆劃塊;
      52、判斷所述兩個(gè)相鄰的筆劃塊的水平投影是否重疊,如果重疊,將所述兩個(gè)相鄰的筆劃塊合并為合并筆劃塊;
      53、依序取與所述合并筆劃塊相鄰的筆劃塊,并判斷所述合并筆劃塊和該相鄰的筆劃塊的水平投影是否重疊,如果重疊,將所述合并筆劃塊和該相鄰的筆劃塊合并為另一合并筆劃塊,重復(fù)S3 ;否則,所述合并筆劃塊形成一個(gè)筆劃幾何塊,轉(zhuǎn)至Sl ;
      54、重復(fù)步驟S3,直至所有筆劃塊合并完成;
      其中,所述合并筆劃塊包括至少兩個(gè)筆劃的筆劃塊。所述相鄰筆劃塊指按筆劃書寫順序相鄰的筆劃塊。優(yōu)選的,在所述合并筆劃塊和與其相鄰的筆劃塊的筆劃四周分別沿水平方向和垂直方向繪制線條形成一個(gè)四邊形區(qū)域,該四邊形區(qū)域包括上邊框、下邊框、左邊框和右邊框;
      其中,所述上邊框通過筆劃塊中的筆劃筆跡點(diǎn)中位于最頂側(cè)的筆跡點(diǎn)沿水平方向繪制線條形成,所述下邊框通過沿筆劃塊中的筆劃筆跡點(diǎn)中位于最底側(cè)的筆跡點(diǎn)沿水平方向繪制線條形成,所述左邊框通過沿筆劃塊中的筆劃筆跡點(diǎn)中位于最左側(cè)的筆跡點(diǎn)沿垂直方向繪制線條形成,所述右邊框通過沿筆劃塊中的筆劃筆跡點(diǎn)中位于最右側(cè)的筆跡點(diǎn)沿垂直方向繪制線條形成。其中,所述兩個(gè)相鄰的筆劃塊包括第一筆劃塊和第二筆劃塊;
      判斷兩個(gè)相鄰的筆劃塊的水平投影是否重疊時(shí),若第一筆劃塊的左邊框在第二筆劃塊的右邊框的左側(cè)且第一筆劃塊的右邊框在第二筆劃塊的左邊框的右側(cè),則該兩個(gè)筆劃塊的
      水平投影重疊。根據(jù)本發(fā)明提供的具體實(shí)施例,本發(fā)明具有以下技術(shù)效果
      本發(fā)明實(shí)施例通過先將手寫文本行分割成多個(gè)筆劃幾何塊;然后分別提取每個(gè)筆劃幾何塊的特征,根據(jù)提取的特征計(jì)算所述筆劃幾何塊的預(yù)設(shè)語言可信度;最后根據(jù)該手寫文本行中所有筆劃幾何塊的預(yù)設(shè)語言可信度,識(shí)別該手寫文本行的語言類別,使得用戶在進(jìn)行多語言的手寫文本行輸入時(shí),不必要預(yù)先指定手寫文本行的語言類別,方便了用戶進(jìn)行手寫文本輸入,同時(shí)有效地提高了手寫輸入的速度。


      為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例的部分附圖,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
      圖1是本發(fā)明實(shí)施例提供的方法的流程圖; 圖2是本發(fā)明實(shí)施例手寫中文文本行示意圖;圖3是本發(fā)明實(shí)施例手寫英文文本行示意圖4是本發(fā)明實(shí)施例手寫中文文本行中的筆劃形成筆劃塊的示意圖; 圖5是本發(fā)明實(shí)施例圖2所示的手寫中文文本行分割成筆劃幾何塊的示意圖; 圖6是圖3所示的手寫英文文本行分割成筆劃幾何塊的示意圖; 圖7是圖5所示的筆劃幾何塊對(duì)應(yīng)的中文可信度示意圖; 圖8是圖6所示的筆劃幾何塊對(duì)應(yīng)的中文可信度示意圖; 圖9是本發(fā)明實(shí)施例提供的裝置的示意圖。
      具體實(shí)施例方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。本發(fā)明的方法適用于任何二維坐標(biāo)系,本實(shí)施例中僅以常見的如圖4所示的坐標(biāo)系為例。參見圖1,本發(fā)明實(shí)施例提供的識(shí)別手寫文本行語言類別的方法包括以下步驟 SlOl 獲取手寫文本行,將手寫文本行分割成多個(gè)筆劃幾何塊;
      在手寫識(shí)別技術(shù)中,可以通過手寫板或平板電腦等任何支持手寫輸入功能的設(shè)備獲得手寫文本行,如何獲得手寫文本行的筆跡數(shù)據(jù)已經(jīng)為本領(lǐng)域的技術(shù)人員所熟知,在此不再贅述。手寫文本行的筆跡數(shù)據(jù)由多個(gè)筆劃的筆跡數(shù)據(jù)和文本行結(jié)束標(biāo)志組成, 每個(gè)筆劃的筆跡數(shù)據(jù)又包括構(gòu)成筆劃的筆跡點(diǎn)坐標(biāo)和筆劃結(jié)束標(biāo)志。本實(shí)施例中假設(shè)文本行結(jié)束標(biāo)志為(_1,_1),筆劃結(jié)束標(biāo)志為(_1,0),手寫文本行的筆跡數(shù)據(jù)表示為 {(Xn, Yn),(Xi2, Yi2),…,(-1,0),…,(xnl, ynl),(xn2, yn2),…,(_1,0),(-1,-1)},其中 η 為大于1的正整數(shù),以上筆跡數(shù)據(jù)表示手寫文本行由η個(gè)筆劃組成,(xnl, ynl)為第η個(gè)筆劃的第一個(gè)筆跡點(diǎn)的坐標(biāo)。在本步驟中,手寫輸入如圖2和圖3所示的文本行,當(dāng)然也可以輸入日文文本行、 英文文本行、韓文文本行、俄文文本行等,本實(shí)施例僅以中文文本行和英文文本行為例。首先從手寫文本行的筆跡數(shù)據(jù)中提取所有筆劃,并將每個(gè)筆劃初始化為一個(gè)相應(yīng)的筆劃塊。 此處的每個(gè)筆劃塊中包含一個(gè)筆劃。如圖4所示,通過在筆劃四周分別沿水平方向和垂直方向繪制線條形成一個(gè)四邊形區(qū)域,該四邊形區(qū)域包括上邊框、下邊框、左邊框和右邊框。 所述上邊框、下邊框、左邊框和右邊框叫做筆劃塊的邊框,根據(jù)構(gòu)成筆劃塊的筆劃筆跡點(diǎn)的坐標(biāo)數(shù)據(jù)得到。在如圖4所示的坐標(biāo)系中,各邊框通過以下方式獲得上邊框通過沿筆劃塊中的筆劃筆跡點(diǎn)中位于最頂側(cè)(縱坐標(biāo)最大)的筆跡點(diǎn)沿水平方向繪制線條形成;下邊框通過沿筆劃塊中的筆劃筆跡點(diǎn)中位于最底側(cè)(縱坐標(biāo)最小)的筆跡點(diǎn)沿水平方向繪制線條形成;左邊框通過沿筆劃塊中的筆劃筆跡點(diǎn)中位于最左側(cè)(橫坐標(biāo)最小)的筆跡點(diǎn)沿垂直方向繪制線條形成;右邊框通過沿筆劃塊中的筆劃筆跡點(diǎn)中位于最右側(cè)(橫坐標(biāo)最大)的筆跡點(diǎn)沿垂直方向繪制線條形成。以圖2中的手寫文本行為例,按照上述方法獲得的前六個(gè)筆劃對(duì)應(yīng)的筆劃塊,如圖4所示,分別為=Vlvb3AAAo同理可分別獲得圖2和圖3所示的手寫文本行中的所有筆劃塊\ (1 ( i <n,其中η為手寫文本行中全部筆劃數(shù))。然后,通過合并水平投影重疊的筆劃塊,將多個(gè)筆劃塊合并成至少一個(gè)筆劃幾何塊。水平投影指水平方向的一條線段,通過在筆劃塊的右邊框在水平方向的投影點(diǎn)和左邊框在水平方向上的投影點(diǎn)之間連接線段得到,也可以通過筆劃塊包括的筆劃的所有筆跡點(diǎn)
      分別向水平方向投影得到。上述步驟中獲得的筆劃塊&是由所有字符的筆劃組成的。根
      據(jù)多數(shù)人的書寫習(xí)慣,通常在手寫輸入文本行的過程中字符之間在水平方向上的投影是沒有重疊的,而同一個(gè)字符內(nèi)的筆劃在水平方向上的投影是有重疊的,通過判斷筆劃塊在水平方向上的投影是否有重疊部分,將水平投影重疊的筆劃塊合并成一個(gè)包括至少兩個(gè)筆劃的合并筆劃塊,將水平投影與其他筆劃塊的水平投影沒有重疊的筆劃塊作為一個(gè)筆劃幾何塊,可以將多個(gè)筆劃塊合并成至少一個(gè)筆劃幾何塊,一個(gè)筆劃幾何塊中包括一個(gè)或多個(gè)筆劃,經(jīng)合并獲得的筆劃幾何塊代表一個(gè)獨(dú)立字符的可能性非常大。經(jīng)合并獲得的筆劃幾何塊中的筆劃同樣可以確定一個(gè)四邊形區(qū)域,該四邊形區(qū)域包括上邊框、下邊框、左邊框和右邊框。所述上邊框、下邊框、左邊框和右邊框叫做筆劃幾何塊的邊框,根據(jù)構(gòu)成筆劃幾何塊的筆劃筆跡點(diǎn)的坐標(biāo)數(shù)據(jù)得到。筆劃幾何塊的邊框形成方法與筆劃塊的形成方法相同,各邊框通過以下方式獲得上邊框通過沿筆劃幾何塊中的筆劃筆跡點(diǎn)中位于最頂側(cè)(縱坐標(biāo)最大)的筆跡點(diǎn)沿水平方向繪制線條形成;下邊框通過沿筆劃幾何塊中的筆劃筆跡點(diǎn)中位于最底側(cè)(縱坐標(biāo)最小)的筆跡點(diǎn)沿水平方向繪制線條形成;左邊框通過沿筆劃幾何塊中的筆劃筆跡點(diǎn)中位于最左側(cè)(橫坐標(biāo)最小)的筆跡點(diǎn)沿垂直方向繪制線條形成;右邊框通過沿筆劃幾何塊中的筆劃筆跡點(diǎn)中位于最右側(cè)(橫坐標(biāo)最大) 的筆跡點(diǎn)沿垂直方向繪制線條形成。當(dāng)然,如果字符之間有連接,可能將多個(gè)字符分割到一個(gè)筆劃幾何塊中。合并水平投影重疊的筆劃塊時(shí),首先需要獲得兩個(gè)相鄰的筆劃塊,分別設(shè)為第一筆劃塊和第二筆劃塊,在判斷兩個(gè)相鄰的筆劃塊的水平投影重疊是否重疊時(shí),若第一筆劃塊的左邊框在第二筆劃塊的右邊框的左側(cè)且第一筆劃塊的右邊框在第二筆劃塊的左邊框的右側(cè),則該兩個(gè)筆劃塊的水平投影重疊。具體實(shí)施時(shí),分為以下步驟 Si、依序取兩個(gè)相鄰的筆劃塊;
      按照筆劃將文本行進(jìn)行切分后,得到對(duì)應(yīng)于每個(gè)筆劃的筆劃塊,所述筆劃塊按照筆劃的書寫順序排列。依序取兩個(gè)相鄰的筆劃塊,包括第一筆劃塊為”和第二筆劃塊為&+1。S2、判斷所述兩個(gè)相鄰的筆劃塊的水平投影是否重疊,如果重疊,將所述兩個(gè)相鄰的筆劃塊合并為合并筆劃塊;
      如果第一筆劃塊的左邊框在第二筆劃塊I1的右邊框的左側(cè)且第一筆劃塊4的右邊
      框在第二筆劃塊‘t的左邊框的右側(cè),則該兩個(gè)筆劃塊的水平投影重疊,將這兩個(gè)筆劃塊合并為一個(gè)合并筆劃塊4,所述合并筆劃塊包括至少兩個(gè)筆劃。否則,第一筆劃塊形成一 個(gè)筆劃幾何塊4 ,其中m為大于等于1的正整數(shù)。S3、依序取與所述 合并筆劃塊相鄰的筆劃塊,并判斷所述合并筆劃塊和該相鄰的筆劃塊的水平投影是否重疊,如果重疊,將所述合并筆劃塊和該相鄰的筆劃塊合并為另一合并筆劃塊,重復(fù)S3 ;否則,所述合并筆劃塊形成一個(gè)筆劃幾何塊,轉(zhuǎn)至Sl ;
      取與合并筆劃塊4中的筆劃相鄰的下一筆劃對(duì)應(yīng)的筆劃塊‘2,如果合并筆劃塊‘的左邊框在筆劃塊‘2的右邊框的左側(cè)且合并筆劃塊&的右邊框在筆劃塊的左邊框的右側(cè),則該兩個(gè)筆劃塊的水平投影重疊,將這兩個(gè)筆劃塊合并為另一合并筆劃塊4”轉(zhuǎn)至步驟S4 ;否則,將當(dāng)前獲得的合并筆劃塊‘作為一個(gè)筆劃幾何塊瓦,其中m為大于等于1的
      正整數(shù),轉(zhuǎn)至步驟Si,以筆劃幾何塊4中的筆劃為參考,依序取下兩個(gè)相鄰的筆劃對(duì)應(yīng)的
      筆劃塊,繼續(xù)合并剩余的筆劃塊。S4、重復(fù)步驟S3,直至所有筆劃塊合并完成;
      重復(fù)步驟S3,取與合并筆劃塊中的筆劃相鄰的下一筆劃對(duì)應(yīng)的筆劃塊,進(jìn)一步合并剩余的筆劃塊。依此類推,直到所有的筆劃塊合并完成,最后即得到多個(gè)筆劃幾何塊 Bm。圖2、圖3所示的手寫文本行的分割結(jié)果分別如圖5和圖6所示。圖2的手寫文本行經(jīng)過合并獲得的9個(gè)筆劃幾何塊島、島、…、B”如圖5所示;圖3的手寫文本行經(jīng)過
      合并獲得的7個(gè)筆劃幾何塊馬、B2.....兵,如圖6所示。S102:分別提取每個(gè)筆劃幾何塊的特征,根據(jù)提取的特征計(jì)算所述筆劃幾何塊的
      預(yù)設(shè)語言可信度;
      本發(fā)明中的預(yù)設(shè)語言可以是任何方塊文字語言,包括中文、日文、韓文等;本發(fā)明的方法適用于識(shí)別任何方塊文字語言和西文文字語言的手寫文本行的語言類別,如手寫中文文本行和英文文本行、手寫韓文文本行和英文文本行、手寫日文文本行和俄文文本行。對(duì)不同的方塊文字語言文本行進(jìn)行識(shí)別時(shí)需要使用該語言的單字符識(shí)別核心。本例中以手寫中文文本行和英文文本行為例對(duì)本方法進(jìn)行說明,其中,預(yù)設(shè)語言為中文,預(yù)設(shè)語言可信度為中文可信度。所述中文可信度是根據(jù)筆劃幾何塊的特征計(jì)算得到的值,指筆劃幾何塊是中文幾何塊的可能性,其取值為大于等于0且小于等于1的數(shù)。中文可信度為1說明筆劃幾何塊為中文筆劃幾何塊,中文可信度為0說明筆劃幾何塊為英文筆劃幾何塊。筆劃幾何塊的特征有很多,本方法提取的筆劃幾何塊的特征包括預(yù)設(shè)語言字符識(shí)別可信度、高寬比、筆跡點(diǎn)密度和筆劃數(shù)。當(dāng)需要識(shí)別中、英文手寫文本行的語言類別時(shí), 所述預(yù)設(shè)語言字符識(shí)別可信度為中文字符識(shí)別可信度。其中,中文字符識(shí)別可信度是指中文單字符識(shí)別核心識(shí)別該字符或筆劃塊或筆劃幾何塊的識(shí)別結(jié)果候選字符為中文的可能性,其取值為大于等于0且小于等于1的數(shù)。根據(jù)手寫文本行的所有筆劃幾何塊的特征,可以獲得手寫文本行語言類別。中文字符識(shí)別可信度為1說明識(shí)別結(jié)果候選字符為中文,中文字符識(shí)別可信度為0說明識(shí)別結(jié)果候選字符為英文。筆劃幾何塊的一個(gè)特征是筆劃幾何塊的中文字符識(shí)別可信度,其獲得步驟為首先將筆劃幾何塊做為一個(gè)字符,構(gòu)成該筆劃塊的筆劃做為字符的筆劃,采用中文字符識(shí)別技術(shù)識(shí)別所述筆劃幾何塊,獲得每個(gè)筆劃幾何塊的識(shí)別結(jié)果,所述識(shí)別結(jié)果包括多個(gè)識(shí)別身份候選字符及每個(gè)身份候選字符的中文字符識(shí)別可信度,所述識(shí)別身份候選字符按照其對(duì)應(yīng)的中文字符識(shí)別可信度降序排列;然后分別遍歷每個(gè)筆劃幾何塊的識(shí)別結(jié)果中的識(shí)別身份候選字符,找到第一個(gè)中文字符(即中文字符識(shí)別可信度最大的字符),其對(duì)應(yīng)的中文字符識(shí)別可信度即為該幾何塊的中文字符識(shí)別可信度,如果沒有找到中文字符,該筆劃幾何塊的中文字符識(shí)別可信度為O。通過上述
      步驟,得到m個(gè)筆劃幾何塊U、…、Bvi,將中文字符識(shí)別可信度作為該筆劃幾何塊的第一個(gè)特征:涊)。筆劃幾何塊的第二個(gè)特征是筆劃幾何塊的高寬比。根據(jù)中文字符和英文字符的字形特點(diǎn),確定筆劃幾何塊的高寬比為筆劃幾何塊的又一個(gè)特征,筆劃幾何塊的高寬比通過下述方法獲得
      令筆劃幾何塊的高度為H,寬度為W,筆劃幾何塊高寬比=H/W。其中,筆劃幾何塊的高度H= I (Yl- y2) |,所述71和%分別是筆劃幾何塊上邊框在垂直方向(即縱軸上)的投影點(diǎn)的縱坐標(biāo)和筆劃幾何塊下邊框在垂直方向(即縱軸上)的投影點(diǎn)的縱坐標(biāo)。筆劃幾何塊的寬度W= I (xr x2) I,所述X1和X2分別是筆劃幾何塊左邊框在水平方向(即橫軸上)的投影點(diǎn)的橫坐標(biāo)和筆劃幾何塊右邊框在水平方向(即橫軸上)的投影點(diǎn)的橫坐標(biāo)。將筆劃幾何塊高寬比H/W作為筆劃幾何塊的第二個(gè)特征X2(A);
      筆劃幾何塊的第三個(gè)特征巧(馬)是筆劃幾何塊的筆跡點(diǎn)密度。筆劃幾何塊中的筆跡點(diǎn)
      的數(shù)目是已知的,可以從手寫文本行的筆跡數(shù)據(jù)中獲得。如果筆劃幾何塊中的筆跡點(diǎn)的數(shù)目是D,則筆劃幾何塊的筆跡點(diǎn)密度P=D/ (HXW)。筆劃幾何塊的第四個(gè)特征&(爲(wèi))是筆劃幾何塊中的筆劃數(shù),可以通過計(jì)算手寫文本行的筆跡數(shù)據(jù)中的筆劃結(jié)束標(biāo)志獲得。通過以上所述方法提取到的筆劃幾何塊的特征后,根據(jù)所述筆劃幾何塊的特征計(jì)算所述筆劃幾何塊的中文可信度即是對(duì)手寫文本行進(jìn)行語言類別進(jìn)行判斷。對(duì)于筆劃幾何塊巧,其四個(gè)特征為
      權(quán)利要求
      1.一種識(shí)別手寫文本行語言類別的方法,其特征在于,包括獲取手寫文本行,將手寫文本行分割成多個(gè)筆劃幾何塊;分別提取每個(gè)筆劃幾何塊的特征,根據(jù)提取的特征計(jì)算所述筆劃幾何塊的預(yù)設(shè)語言可信度;根據(jù)獲得的多個(gè)筆劃幾何塊的預(yù)設(shè)語言可信度,識(shí)別所述手寫文本行的語言類別。
      2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將手寫文本行分割成多個(gè)筆劃幾何塊,包括從手寫文本行的筆跡數(shù)據(jù)中提取所有筆劃,并將每個(gè)筆劃初始化為相應(yīng)的筆劃塊;通過合并水平投影重疊的筆劃塊,將多個(gè)筆劃塊合并成至少一個(gè)筆劃幾何塊;其中,所述筆跡數(shù)據(jù)包括手寫文本行中構(gòu)成筆劃的筆跡點(diǎn)坐標(biāo)和筆劃結(jié)束標(biāo)志,所述筆劃幾何塊包括至少一個(gè)筆劃。
      3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述通過合并水平投影重疊的筆劃塊,將多個(gè)筆劃塊合并成至少一個(gè)筆劃幾何塊,包括S1、依序取兩個(gè)相鄰的筆劃塊;S2、判斷所述兩個(gè)相鄰的筆劃塊的水平投影是否重疊,如果重疊,將所述兩個(gè)相鄰的筆劃塊合并為合并筆劃塊;S3、依序取與所述合并筆劃塊相鄰的筆劃塊,并判斷所述合并筆劃塊和該相鄰的筆劃塊的水平投影是否重疊,如果重疊,將所述合并筆劃塊和該相鄰的筆劃塊合并為另一合并筆劃塊,重復(fù)S3 ;否則,所述合并筆劃塊形成一個(gè)筆劃幾何塊,轉(zhuǎn)至Sl ;S4、重復(fù)步驟S3,直至所有筆劃塊合并完成;其中,所述合并筆劃塊為包括至少兩個(gè)筆劃的筆劃塊。
      4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述相鄰筆劃塊指筆劃書寫順序相鄰的筆劃塊。
      5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述步驟S3還包括在所述合并筆劃塊和與其相鄰的筆劃塊的筆劃四周分別沿水平方向和垂直方向繪制線條形成一個(gè)四邊形區(qū)域,該四邊形區(qū)域包括上邊框、下邊框、左邊框和右邊框;其中,所述上邊框通過筆劃塊中的筆劃筆跡點(diǎn)中位于最頂側(cè)的筆跡點(diǎn)沿水平方向繪制線條形成,所述下邊框通過沿筆劃塊中的筆劃筆跡點(diǎn)中位于最底側(cè)的筆跡點(diǎn)沿水平方向繪制線條形成,所述左邊框通過沿筆劃塊中的筆劃筆跡點(diǎn)中位于最左側(cè)的筆跡點(diǎn)沿垂直方向繪制線條形成,所述右邊框通過沿筆劃塊中的筆劃筆跡點(diǎn)中位于最右側(cè)的筆跡點(diǎn)沿垂直方向繪制線條形成。
      6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述兩個(gè)相鄰的筆劃塊包括第一筆劃塊和第二筆劃塊;判斷兩個(gè)相鄰的筆劃塊的水平投影是否重疊時(shí),若第一筆劃塊的左邊框在第二筆劃塊的右邊框的左側(cè)且第一筆劃塊的右邊框在第二筆劃塊的左邊框的右側(cè),則該兩個(gè)筆劃塊的水平投影重疊。
      7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述筆劃幾何塊的特征包括預(yù)設(shè)語言字符識(shí)別可信度、高寬比、筆跡點(diǎn)密度和筆劃數(shù)。
      8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述第i個(gè)筆劃幾何塊的預(yù)設(shè)語言可信度P(B' i)通過公
      9.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)獲得的多個(gè)筆劃幾何塊的預(yù)設(shè)語言可信度,識(shí)別所述手寫文本行的語言類別,包括根據(jù)多個(gè)筆劃幾何塊的預(yù)設(shè)語言可信度,獲得該手寫文本行的預(yù)設(shè)語言可信度;根據(jù)手寫文本行的預(yù)設(shè)語言可信度識(shí)別所述手寫文本行的語言類別。
      10.根據(jù)權(quán)利要求9所述的方法,其特征在于,手寫文本行經(jīng)分割獲得的所有筆劃幾何塊的預(yù)設(shè)語言可信度的最大值即為該手寫文本行的預(yù)設(shè)語言可信度。
      11.根據(jù)權(quán)利要求10所述的方法,其特征在于,所述預(yù)設(shè)語言包括中文、日文和韓文。
      12.—種識(shí)別手寫文本行語言類別的裝置,包括筆劃幾何塊分割單元,用于獲取手寫文本行,將手寫文本行分割成多個(gè)筆劃幾何塊; 筆劃幾何塊識(shí)別單元,用于分別提取每個(gè)筆劃幾何塊的特征,根據(jù)提取的特征計(jì)算所述筆劃幾何塊的預(yù)設(shè)語言可信度;文本行識(shí)別單元,用于根據(jù)獲得的多個(gè)筆劃幾何塊的預(yù)設(shè)語言可信度,識(shí)別所述手寫文本行語言類別。
      13.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述筆劃幾何塊分割單元還包括筆劃提取子單元,用于從手寫文本行的筆跡數(shù)據(jù)中獲得多個(gè)筆劃塊,所述筆跡數(shù)據(jù)包括構(gòu)成筆劃的筆跡點(diǎn)坐標(biāo)和筆劃結(jié)束標(biāo)志;筆劃塊合并子單元,用于通過合并水平投影重疊的筆劃塊,將多個(gè)筆劃塊合并成至少一個(gè)筆劃幾何塊。
      全文摘要
      本發(fā)明公開了一種識(shí)別手寫文本行語言類別的方法及裝置,屬于輸入法技術(shù)領(lǐng)域。該方法包括將手寫文本行分割成多個(gè)筆劃幾何塊;分別提取每個(gè)筆劃幾何塊的特征,根據(jù)提取的特征計(jì)算所述筆劃幾何塊的預(yù)設(shè)語言可信度;根據(jù)獲得的多個(gè)筆劃幾何塊的預(yù)設(shè)語言可信度,識(shí)別所述手寫文本行的語言類別。本發(fā)明通過先將手寫文本行分割成多個(gè)筆劃幾何塊,然后分別計(jì)算每個(gè)筆劃幾何塊的預(yù)設(shè)語言可信度,最后根據(jù)該手寫文本行中所有筆劃幾何塊的預(yù)設(shè)語言可信度,識(shí)別該手寫文本行的語言類別,使得用戶在進(jìn)行多語言的手寫文本行輸入時(shí),不必要預(yù)先指定手寫文本行的語言類別,方便了用戶進(jìn)行手寫文本輸入,同時(shí)有效地提高了手寫輸入的速度。
      文檔編號(hào)G06K9/72GK102156889SQ201110080818
      公開日2011年8月17日 申請(qǐng)日期2011年3月31日 優(yōu)先權(quán)日2011年3月31日
      發(fā)明者郭育生 申請(qǐng)人:漢王科技股份有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1