文檔制作支援裝置、方法及程序的制作方法
【專利摘要】本發(fā)明涉及文檔制作支援裝置、方法及程序,能夠高效地對(duì)用戶的文檔制作進(jìn)行支援。本實(shí)施方式的文檔制作支援裝置包括判定部、檢索部和提示部。判定部,基于包含對(duì)處理對(duì)象的文字列即對(duì)象文字列進(jìn)行文字識(shí)別后的文字識(shí)別結(jié)果、和示出該對(duì)象文字列出現(xiàn)在文檔中哪個(gè)位置的位置信息的特征量,對(duì)包含該對(duì)象文字列的文檔的種類即文檔種類進(jìn)行判定。檢索部,在滿足用于對(duì)與所述對(duì)象文字列關(guān)聯(lián)的關(guān)聯(lián)文字列進(jìn)行檢索的檢索條件的情況下,從根據(jù)所述文檔種類來設(shè)定優(yōu)先度的作為該關(guān)聯(lián)文字列的檢索基礎(chǔ)的數(shù)據(jù)庫中,檢索該關(guān)聯(lián)文字列,按照基于所述優(yōu)先度的評(píng)分從高到低的順序得到該關(guān)聯(lián)文字列;以及提示部,其按照基于所述優(yōu)先度的評(píng)分從高到低的順序提示所述關(guān)聯(lián)文字列。
【專利說明】文檔制作支援裝置、方法及程序
【技術(shù)領(lǐng)域】
[0001]本發(fā)明的實(shí)施方式涉及文檔制作支援裝置、方法及程序。
【背景技術(shù)】
[0002]近年來,硬件和軟件的計(jì)算機(jī)環(huán)境在飛躍性提高。尤其是隨著小型終端的普及及其性能的提高,以往由于處理性能、存儲(chǔ)容量的不足等不能實(shí)現(xiàn)的平板式的手寫終端、模擬紙和鉛筆的操作性的軟件正在普及。
[0003]隨著手寫終端和關(guān)于手寫的軟件的增加,不僅將手寫信息作為圖像進(jìn)行保存,將手寫信息作為電子文本進(jìn)行識(shí)別的手寫文字識(shí)別技術(shù)也在普及。通過保存將手寫信息作為電子文本進(jìn)行識(shí)別的結(jié)果,能夠活用于檢索和再利用中。另外,通過與網(wǎng)絡(luò)環(huán)境連接將制作好的文檔公開,或者與他人共享的方法也在普遍普及。
[0004]【現(xiàn)有技術(shù)文獻(xiàn)】
[0005]【專利文獻(xiàn)】
[0006]【專利文獻(xiàn)I】
[0007]日本特開2004-133565號(hào)公報(bào)
[0008]【專利文獻(xiàn)2】
[0009]日本特開平9-91293號(hào)公報(bào)
【發(fā)明內(nèi)容】
[0010]【發(fā)明要解決的技術(shù)問題】
[0011]在手寫文檔制作時(shí),與通常利用鍵盤的電子文本制作不同,用戶能夠使用筆或手寫筆等以自由的筆記進(jìn)行輸入。因此,有可能即使用戶輸入錯(cuò)記的單詞或模糊程度高的關(guān)鍵詞或句子,由于利用假名漢字轉(zhuǎn)換功能的候補(bǔ)制約等不起作用,而使得用戶自己沒有注意到錯(cuò)誤。進(jìn)一步地,也有可能存在用戶以省略的形式輸入了文字列的情況下,用戶自己日后再看時(shí)內(nèi)容想不起來、或共享文檔時(shí)等他人不能了解內(nèi)容的情況。
[0012]另外,手寫文字識(shí)別與一般地鉛字OCR (optical character reader光字符識(shí)別)等相比,文字識(shí)別的精度不夠。因此,在檢索對(duì)手寫信息進(jìn)行文字識(shí)別后的電子文本的情況下,由于文字識(shí)別錯(cuò)誤,會(huì)產(chǎn)生不能檢索用戶想寫的文檔,或者電子文本不能正確分類的狀況。
[0013]存在通過譬如網(wǎng)絡(luò)的多數(shù)票來修正這樣的文字識(shí)別錯(cuò)誤的方法,對(duì)于一般的關(guān)鍵詞能夠?qū)崿F(xiàn)錯(cuò)誤的修正。但是,考慮到個(gè)人的手寫筆記等的用途的情況下,網(wǎng)絡(luò)的命中件數(shù)并不一定能夠有效起到作用。即,關(guān)于假設(shè)為個(gè)人筆記的單詞或省略語,不能說網(wǎng)絡(luò)的命中件數(shù)多的單詞就是確切的候補(bǔ),進(jìn)一步地,關(guān)于像文檔被共享這樣的、團(tuán)隊(duì)或崗位內(nèi)的獨(dú)自用語或?qū)I(yè)用語的插值或修正,也不能提示確切的候補(bǔ)。進(jìn)一步地,通過多數(shù)票來修正的手法中,對(duì)于前后同現(xiàn)的復(fù)合單詞或句子、在文檔內(nèi)分開的位置出現(xiàn)的單詞或句子,也不能提示確切的候補(bǔ)。
[0014]本發(fā)明是為了解決上述問題而提出的,其目的在于,提供能夠高效地支援用戶的文檔制作的文檔制作支援裝置、方法和程序。
[0015]【解決問題的技術(shù)手段】
[0016]本實(shí)施方式涉及的文檔制作支援裝置包括:判定部基于包含對(duì)處理對(duì)象的文字列即對(duì)象文字列進(jìn)行文字識(shí)別后的文字識(shí)別結(jié)果、和示出該對(duì)象文字列出現(xiàn)在文檔中哪個(gè)位置的位置信息的特征量,對(duì)包含該對(duì)象文字列的文檔的種類即文檔種類進(jìn)行判定。檢索部在滿足用于對(duì)與所述對(duì)象文字列關(guān)聯(lián)的關(guān)聯(lián)文字列進(jìn)行檢索的檢索條件的情況下,從根據(jù)所述文檔種類來設(shè)定優(yōu)先度的成為該關(guān)聯(lián)文字列的檢索基礎(chǔ)的數(shù)據(jù)庫中,檢索該關(guān)聯(lián)文字列,按照基于所述優(yōu)先度的評(píng)分從高到低的順序得到該關(guān)聯(lián)文字列。提示部按照基于所述優(yōu)先度的評(píng)分從高到低的順序提示所述關(guān)聯(lián)文字列。
【專利附圖】
【附圖說明】
[0017]圖1是示出本實(shí)施方式的文檔制作支援裝置的框圖。
[0018]圖2是示出文檔制作支援裝置的動(dòng)作的流程圖。
[0019]圖3是示出由特征提取部判定的檢索條件的一例的圖。
[0020]圖4是示出文檔種類的生成處理的流程圖。
[0021]圖5是示出種類判定部的種類判定處理的流程圖。
[0022]圖6是示出對(duì)應(yīng)表生成處理的流程圖。
[0023]圖7是示出候補(bǔ)檢索部的檢索處理的流程圖。
[0024]圖8是示出候補(bǔ)檢索部的評(píng)分算出處理的具體例的圖。
[0025]圖9是示出顯示于提示部的用戶界面的一例的圖。
[0026]圖10是示出與文字識(shí)別精度對(duì)應(yīng)的用戶界面的一例的圖。
[0027]圖11是示出文字列的調(diào)整大小處理的圖。
【具體實(shí)施方式】
[0028]以下,參照附圖對(duì)本實(shí)施方式涉及的文檔制作支援裝置、方法和程序進(jìn)行詳細(xì)說明。另外,在以下的實(shí)施方式中,賦予同一的參照符號(hào)的部分作為進(jìn)行同樣動(dòng)作的部分,對(duì)于重復(fù)的說明進(jìn)行了適當(dāng)?shù)厥÷浴?br>
[0029]對(duì)于本實(shí)施方式涉及的文檔制作支援裝置,參照?qǐng)D1的框圖進(jìn)行說明。
[0030]本實(shí)施方式涉及的文檔制作支援裝置100包括:特征提取部101、種類判定部102、候補(bǔ)檢索部103、候補(bǔ)選擇部104、轉(zhuǎn)換部105、提示部106、文檔種類數(shù)據(jù)庫107(以下、稱為文檔種類DB107)、同現(xiàn)句數(shù)據(jù)庫108 (以下、稱為同現(xiàn)句DB108)、用戶輸入歷史記錄數(shù)據(jù)庫109(以下、稱為用戶輸入歷史記錄DB109)、同現(xiàn)語詞典數(shù)據(jù)庫110(以下、同現(xiàn)語詞典DB110)、群共有詞典數(shù)據(jù)庫111(以下、稱為群共有詞典DB111)和字體數(shù)據(jù)庫112 (以下、稱為字體DBl 12)。
[0031] 特征提取部101從外部接收文檔,將對(duì)文檔中作為處理對(duì)象的對(duì)象文字列進(jìn)行了文字識(shí)別處理的文字識(shí)別結(jié)果、和顯示對(duì)象文字列出現(xiàn)在文檔中的哪個(gè)位置的位置信息,作為包含對(duì)象文字列的文檔的特征量進(jìn)行提取。位置信息只要取得例如有關(guān)文檔中的對(duì)象文字列的位置、以及包含對(duì)象文字列的行和段的塊的位置的信息即可。
[0032]另外,在特征提取部101接收的文檔是用戶的手寫筆劃的情況下,特征提取部101對(duì)手寫筆劃進(jìn)行手寫文字識(shí)別處理。然后,特征提取部101將各個(gè)手寫筆劃的集合即對(duì)象文字列的文字識(shí)別結(jié)果和位置信息,作為包含對(duì)象文字列的文檔的特征量進(jìn)行提取。另外,對(duì)于文字識(shí)別處理,只要進(jìn)行一般的文字識(shí)別處理即可,因此這里將其說明省略。
[0033]另外,特征提取部101判定是否滿足用于對(duì)對(duì)象文字列檢索關(guān)聯(lián)文字列的條件即檢索條件。關(guān)聯(lián)文字列顯示與對(duì)象文字列有關(guān)的修正候補(bǔ)的文字列或者插值候補(bǔ)的文字列。特征提取部101判定為滿足檢索條件的情況下,將特征量發(fā)送到種類判定部102。關(guān)于檢索條件將參照?qǐng)D2和圖3在后文敘述。
[0034]種類判定部102接收來自特征提取部101的特征量,參照后述的文檔種類DB107,基于特征量判定包含對(duì)象文字列的文檔的種類即文檔種類。文檔種類列舉有例如日記、書信、論文這樣一般的文檔、會(huì)議筆記、社內(nèi)筆記、購物清單等這樣個(gè)人的文檔。
[0035]候補(bǔ)檢索部103從種類判定部102接收特征量和文檔種類。候補(bǔ)檢索部103從作為檢索基礎(chǔ)的后述的同現(xiàn)句DB108、用戶輸入歷史記錄DB109、同現(xiàn)語詞典DBllO和群共有詞典DB111,基于根據(jù)文檔種類設(shè)定的數(shù)據(jù)庫的優(yōu)先度,對(duì)與對(duì)象文字列關(guān)聯(lián)的文字列進(jìn)行檢索,按照基于優(yōu)先度的評(píng)分從高到低的順序得到一個(gè)以上的關(guān)聯(lián)文字列。
[0036]候補(bǔ)選擇部104從候補(bǔ)檢索部103接收一個(gè)以上的關(guān)聯(lián)文字列。候補(bǔ)選擇部104按照來自用戶的指示選擇關(guān)聯(lián)文字列從而得到選擇文字列。
[0037]轉(zhuǎn)換部105從候補(bǔ)選擇部104接收選擇文字列,將選擇文字列的字體轉(zhuǎn)換為儲(chǔ)存在后述的字體DB112中的字體。另外,指定顯示選擇文字列和對(duì)象文字列的區(qū)域,并且在以現(xiàn)在的字體大小來顯示選擇文字列和對(duì)象文字列時(shí)超出區(qū)域外的情況下,對(duì)選擇文字列和對(duì)象文字列的字體大小進(jìn)行調(diào)整使其收容在區(qū)域內(nèi)。
[0038]提示部106從候補(bǔ)檢索部103接收對(duì)象文字列和關(guān)聯(lián)文字列,將對(duì)象文字列和關(guān)聯(lián)文字列提示于顯示器等。此時(shí),將關(guān)聯(lián)文字列按照基于優(yōu)先度的評(píng)分從高到低的順序提示。另外,提示部106按照來自用戶的指示得到了選擇文字列的情況下,從轉(zhuǎn)換部105接收字體被轉(zhuǎn)換了的選擇文字列、或者字體被轉(zhuǎn)換且字體大小被調(diào)整了的選擇文字列和對(duì)象文字列,并對(duì)對(duì)象文字列和選擇文字列進(jìn)行提示。
[0039]文檔種類DB107按照各文檔種類對(duì)應(yīng)儲(chǔ)存文檔種類的識(shí)別子(ID)和基準(zhǔn)特征量。基準(zhǔn)特征量是作為用于確定文檔種類的基準(zhǔn)的特征量。關(guān)于基準(zhǔn)特征量將參照?qǐng)D5在后文敘述。
[0040]同現(xiàn)句DB108將web文檔等作為語料庫,通過一般的新語和未知語將與同現(xiàn)語的組合分別對(duì)應(yīng)儲(chǔ)存。
[0041]用戶輸入歷史記錄DB109根據(jù)用戶輸入了的關(guān)鍵詞和句子的歷史記錄來儲(chǔ)存同現(xiàn)語的組合。
[0042]同現(xiàn)語詞典DBllO儲(chǔ)存一般的同現(xiàn)語、俗語、季語的對(duì)應(yīng)、依存分析、語法制約等。
[0043]群共有詞典DBlll儲(chǔ)存用于特定的群或成員之間的、在用戶所屬的群共同使用的特有的單詞、記號(hào)等。
[0044]字體DB112儲(chǔ)存基于用戶的手寫筆劃的字體、和一般的鉛字的字體作為字體信肩、O
[0045]接著,參照?qǐng)D2的流程圖對(duì)文檔制作支援裝置100的動(dòng)作進(jìn)行說明。
[0046]另外,在圖2的實(shí)例中,示出接收來自用戶的手寫筆劃進(jìn)行處理的實(shí)例,對(duì)于由鍵盤輸入等產(chǎn)生的鉛字文字列構(gòu)成的文檔也進(jìn)行同樣的處理。
[0047]在步驟S201中,特征提取部101取得用戶輸入了的手寫筆劃。對(duì)于手寫筆劃進(jìn)行手寫文字識(shí)別處理,在作為提取結(jié)果得到文本文字列的情況下,取得文本文字列。
[0048]在步驟S202中,特征提取部101提取對(duì)手寫筆劃進(jìn)行文字識(shí)別后的文字識(shí)別結(jié)果和位置信息,得到包含對(duì)象文字列的文檔的特征量。
[0049]在步驟S203中,特征提取部101判定是否滿足檢索條件。檢索條件在本實(shí)施方式中可以設(shè)定為例如,用戶輸入特定的動(dòng)作、輸入特定的文字列、從取得手寫筆劃開始沒有來自用戶的輸入的狀態(tài)經(jīng)過一定期間,滿足任一種條件即滿足檢索條件。滿足檢索條件的情況下,進(jìn)入到步驟S204,不滿足檢索條件的情況下,返回到步驟S201,繼續(xù)手寫筆劃的取得。
[0050]在步驟S204中,種類判定部102對(duì)包含對(duì)象文字列的文檔進(jìn)行種類判定處理,判定文檔種類。對(duì)于種類判定處理,將參照?qǐng)D4和圖5在后文敘述。
[0051]在步驟S205中,候補(bǔ)檢索部103基于文檔種類的判定結(jié)果,從根據(jù)包含對(duì)象文字列的文檔的文檔種類而設(shè)定了優(yōu)先度的數(shù)據(jù)庫中,檢索與對(duì)象文字列有關(guān)的文字列,按照基于優(yōu)先度的評(píng)分從高到低的順序得到關(guān)聯(lián)文字列。關(guān)于候補(bǔ)檢索部103的檢索處理,將參照?qǐng)D6和圖7在后文敘述。
[0052]在步驟S206中,提示部106提示對(duì)象文字列和一個(gè)以上的關(guān)聯(lián)文字列。
[0053]在步驟S207中,候補(bǔ)選擇部104基于來自用戶的指示,從一個(gè)以上的關(guān)聯(lián)文字列中選擇文字列,得到選擇文字列。
[0054]在步驟S208中,轉(zhuǎn)換部105參照字體DB112,將選擇文字列轉(zhuǎn)換為用戶的手寫字體。由此,可以實(shí)現(xiàn)通過手寫筆劃表現(xiàn)的對(duì)象文字列、和被插入的選擇文字列的文檔中的整體性。
[0055]在步驟S209中,轉(zhuǎn)換部105在作為插入目的地的指定區(qū)域,插入字體被轉(zhuǎn)換了的選擇文字列時(shí),判定文字列是否沒有超出指定區(qū)域外。文字列超出指定區(qū)域外時(shí)進(jìn)入到步驟S210,文字列沒有超出區(qū)域外、即文字列收容在區(qū)域內(nèi)時(shí),進(jìn)入步驟S211。
[0056]在步驟S210中,轉(zhuǎn)換部105調(diào)整對(duì)象文字列和選擇文字列的字體大小,以將其收容在指定區(qū)域內(nèi)。
[0057]在步驟S211中,提示部106將對(duì)象文字列和選擇文字列插入到文檔的指定區(qū)域。至此結(jié)束本實(shí)施方式的文檔制作支援裝置的動(dòng)作。
[0058]另外,對(duì)于在步驟S204中的文檔種類的判定,通過參照制作文檔的應(yīng)用軟件的種類等,就預(yù)先了解用戶制作的文檔的文檔種類時(shí),也可以僅對(duì)文檔種類進(jìn)行一次判定。這種情況下,對(duì)文檔種類進(jìn)行了一次判定之后,不再進(jìn)行步驟S204的處理,在步驟S203的處理之后進(jìn)行步驟S205的處理即可。另外,在步驟S208中,示出了將選擇文字列變更為手寫字體的情況,但并不限定于此,也可以轉(zhuǎn)換為一般的鉛字字體。由此,能夠容易地把握對(duì)對(duì)象文字列進(jìn)行插值的位置。
[0059]接著,參照?qǐng)D3對(duì)由特征提取部101進(jìn)行判定的檢索條件的一例進(jìn)行說明。
[0060]圖3的(a)示出在沒有來自用戶的筆劃輸入的狀態(tài)經(jīng)過了一定時(shí)間的情況下,滿足檢索條件的實(shí)例。經(jīng)過了一定時(shí)間的情況是指:例如系統(tǒng)預(yù)先設(shè)定的時(shí)間、或者用戶設(shè)定的3s(秒)或1s(秒)這樣的時(shí)間,在此期間沒有筆劃、其他操作等來自用戶的輸入的情況。該時(shí)間可以是固定値,也可以是取得用戶寫入文字列的速度、顯示從輸入某個(gè)文字列開始到輸入下一個(gè)文字列為止的時(shí)間的用戶停頓的傾向,然后動(dòng)態(tài)確定提示候補(bǔ)所需的確切的停頓時(shí)長(zhǎng)。
[0061]圖3的(b)示出在特定的文字列被輸入的情況下,滿足檢索條件的實(shí)例。存在特定的文字列輸入的情況是指:作為句子斷句的句號(hào)和逗號(hào)、終端的括弧等的記號(hào)被寫入的情況。另外,也可以對(duì)文本識(shí)別結(jié)果應(yīng)用語態(tài)分析,在得到的詞類中出現(xiàn)了固有名詞、用言等特定的類型的情況下,滿足檢索條件。
[0062]如圖3的(a)和圖3的(b)所示,將經(jīng)過了一定時(shí)間的情況或者輸入特定的文字列的情況作為檢索條件的話,能夠在用戶自己沒有發(fā)現(xiàn)錯(cuò)誤的情況下提示關(guān)聯(lián)文字列。
[0063]圖3的(C)示出取得了來自用戶的動(dòng)作作為模糊部分的指定的情況下,滿足檢索條件的實(shí)例。例如,可以在對(duì)象文字列的前后想起作為插值候補(bǔ)的文字列的位置,在涂劃填寫、多次連續(xù)輕敲、對(duì)大致的范圍反復(fù)畫出下劃線等的動(dòng)作被輸入的情況下,滿足檢索條件。如圖3的(C)所示的動(dòng)作是指:表現(xiàn)為在用戶知道關(guān)于對(duì)象文字列存在某個(gè)其他的同現(xiàn)語,但是想不出是哪一個(gè)或者模糊記得的情況下的動(dòng)作。因此,這樣的動(dòng)作被輸入時(shí),可以提不關(guān)聯(lián)文字列。
[0064]圖3的⑷和圖3的(e)是將部分指定的實(shí)例這樣的用戶的動(dòng)作輸入作為檢索條件的情況。例如,為了進(jìn)行輸出的指定,考慮有通過劃圈來填寫相當(dāng)于文字列的數(shù)量的空白、或者用圓圈圈上展開關(guān)聯(lián)的關(guān)鍵詞的對(duì)象文字列來進(jìn)行標(biāo)記的輸入例。用戶的動(dòng)作或標(biāo)記并不限定于此,只要能夠解釋為筆劃或者動(dòng)作、且作為檢索處理的觸發(fā)器是系統(tǒng)能夠解釋的動(dòng)作,也可以包含用戶定義的動(dòng)作的任意形式。
[0065]接著,參照?qǐng)D4的流程圖對(duì)預(yù)先儲(chǔ)存在文檔種類DB107的文檔種類的生成處理進(jìn)行說明。圖4所示的處理是在對(duì)象文字列被輸入之前,用于預(yù)先設(shè)定文檔種類的預(yù)備處理。
[0066]在步驟S401中,對(duì)儲(chǔ)存在文檔種類DB107的文檔種類進(jìn)行定義。例如,可以將筆記、日記、購物清單、論文這樣的分類作為文檔種類,文檔種類的定義可以是用戶設(shè)定,也可以是預(yù)先準(zhǔn)備多種文檔種類。
[0067]在步驟S402中,收集作為與文檔種類對(duì)應(yīng)的例文的文檔即基準(zhǔn)文檔。例如,根據(jù)筆記、日記、論文這樣的文檔種類,準(zhǔn)備用戶實(shí)際的筆記、日記、論文即可。另外,基準(zhǔn)文檔的收集并不限于用戶所具有的數(shù)據(jù),也可以將文檔種類的名稱作為關(guān)鍵詞在web進(jìn)行檢索,收集合適的文檔作為基準(zhǔn)文檔。
[0068]在步驟S403中,特征提取部101提取基準(zhǔn)文檔的特征量即基準(zhǔn)特征量?;鶞?zhǔn)特征量采取與上述的特征提取部101的特征量提取處理同樣的處理進(jìn)行提取即可。基準(zhǔn)特征量包含例如是否出現(xiàn)基準(zhǔn)文檔的單詞或復(fù)合語、詞類文字列、數(shù)量表達(dá)等、以及他們出現(xiàn)的位置作為特征量向量。
[0069]在步驟S404中,種類判定部102將基準(zhǔn)文檔的基準(zhǔn)特征量和文檔種類對(duì)應(yīng)儲(chǔ)存。另外,也可以使基準(zhǔn)特征量和文檔種類作為教師數(shù)據(jù)進(jìn)行學(xué)習(xí)。另外,對(duì)前段的手寫筆劃的結(jié)果應(yīng)用手寫文字識(shí)別處理得到的文本提取結(jié)果,種類判定部102應(yīng)用語態(tài)分析,也取得詞類信息、依存分析結(jié)果。這里,即使對(duì)于輸入不是采用筆的筆劃信息、而是在通過鍵盤等輸入的文本文字列的情況,也能夠進(jìn)行與手寫文字識(shí)別的結(jié)果得到的文本文字列同樣的處理。關(guān)于學(xué)習(xí),作為能夠辨別特征量的手段,可以使用在自然言語處理所采用的SVM(Support Vector Machine:支持向量機(jī))、CRF(Condit1nal Random Fields:條件隨機(jī)場(chǎng))、ANN (Artificial Neural Network:人工神經(jīng)網(wǎng)絡(luò))等一般的辨別器。
[0070]在步驟S405中,特征提取部101將基準(zhǔn)特征量和文檔種類的對(duì)應(yīng)關(guān)系學(xué)習(xí)的學(xué)習(xí)結(jié)果即模型儲(chǔ)存到文檔種類DB107中。以上,完成文檔種類的生成處理。
[0071]接著,參照?qǐng)D5的流程圖對(duì)種類判定部102的種類判定處理進(jìn)行說明。
[0072]在步驟S501中,從文檔種類DB107讀取基準(zhǔn)特征量。
[0073]在步驟S502中,對(duì)從包含對(duì)象文字列的文檔中提取出的特征量、與儲(chǔ)存在文檔種類DB107中的各個(gè)文檔種類的基準(zhǔn)特征量,分別進(jìn)行比較并計(jì)算出相似度。
[0074]在步驟S503中,將基準(zhǔn)特征量中、包含對(duì)象文字列的文檔的特征量與基準(zhǔn)特征量的相似度最高的基準(zhǔn)特征量所對(duì)應(yīng)的種類,判定作為包含對(duì)象文字列的文檔的文檔種類。以上結(jié)束種類判定處理。
[0075]接著,參照?qǐng)D6的流程圖,對(duì)在種類判定部102中預(yù)先生成的對(duì)應(yīng)表生成處理進(jìn)行說明。圖6所示的處理是在對(duì)象文字列被輸入之前,用于預(yù)先設(shè)定與文檔種類對(duì)應(yīng)的數(shù)據(jù)庫的優(yōu)先度的預(yù)備處理。
[0076]在步驟S601中,從文檔種類DB107中取得文檔種類和基準(zhǔn)特征量。
[0077]在步驟S602中,從能夠參照的數(shù)據(jù)庫中取得列表。能夠參照的數(shù)據(jù)庫是從系統(tǒng)能夠訪問(讀入)的數(shù)據(jù)庫。本實(shí)施方式中,設(shè)定有同現(xiàn)句DB108、用戶輸入歷史記錄DB109、同現(xiàn)語詞典DB110、群共有詞典DBlll的數(shù)據(jù)庫。這些能夠利用的數(shù)據(jù)庫在設(shè)定時(shí)探索,或者明示地將儲(chǔ)存位置和數(shù)據(jù)庫的特征作為列表賦予系統(tǒng),從而能夠取得列表。
[0078]在步驟S603中,基于列表對(duì)各數(shù)據(jù)庫和各文檔種類的相似度進(jìn)行比較。作為一個(gè)實(shí)例,通過將與各文檔種類對(duì)應(yīng)的基準(zhǔn)特征量的高頻用語的集合假定為代表各文檔種類的“文檔”,能夠生成文檔向量。因此,在文檔種類的文檔向量、與將儲(chǔ)存在各數(shù)據(jù)庫中的單詞作為向量的文檔向量之間,通過計(jì)算例如余弦相似度能夠比較相似度。
[0079]在步驟S604中,基于文檔種類和數(shù)據(jù)庫之間的相似度,生成并保持按照相似度的從高到低的順序提取了數(shù)據(jù)庫的相似對(duì)應(yīng)表。即、相似度越高優(yōu)先度設(shè)定得越高。相似對(duì)應(yīng)表例如像表1那樣,能夠了解根據(jù)文檔種類應(yīng)該優(yōu)先檢索的數(shù)據(jù)庫即可。
[0080]【表1】
[0081]定義1:文檔種類“私人筆記”或者“購物清單”
[0082]-----------------------------------
[0083]參照優(yōu)先度1:同現(xiàn)句DB
[0084]參照優(yōu)先度2:用戶輸入歷史記錄DB
[0085]參照優(yōu)先度3:同現(xiàn)語詞典DB
[0086]-----------------------------------
[0087]定義2:文檔種類“一般文檔”或“會(huì)議筆記”
[0088]-----------------------------------
[0089]參照優(yōu)先度1:同現(xiàn)句DB
[0090]參照優(yōu)先度2:同現(xiàn)語詞典DB
[0091]參照優(yōu)先度3:同現(xiàn)語詞典DB
[0092]-----------------------------------
[0093]另外,對(duì)于某個(gè)文檔種類使用特定的數(shù)據(jù)庫這種對(duì)應(yīng)關(guān)系的附加也可以通過人手來制作。另外,由于確定了文檔種類即可以確定作為檢索基礎(chǔ)的數(shù)據(jù)庫,因此通過圖6所示的對(duì)應(yīng)表生成處理得到的對(duì)應(yīng)表并不是每次檢索處理都是必要的。因此,可以是參照預(yù)先輸出完成的,只要是通過來自服務(wù)器的配信等,成為系統(tǒng)能夠讀入的狀態(tài)即可。
[0094]通過這樣根據(jù)文檔種類來設(shè)定作為檢索基礎(chǔ)的數(shù)據(jù)庫的優(yōu)先度,能夠根據(jù)文檔檢索確切的關(guān)聯(lián)文字列。例如,如果是購物清單,則包含在以前用戶購入的商品中的可能性較高,因此,可以將用戶輸入歷史記錄DB的優(yōu)先度設(shè)定得較高,如果是會(huì)議筆記,則包含群內(nèi)的專業(yè)用語的可能性較高,因此,可以將群共有詞典的優(yōu)先度設(shè)定得較高。
[0095]接著,參照?qǐng)D7的流程圖對(duì)候補(bǔ)檢索部103的檢索處理進(jìn)行說明。
[0096]在步驟S701中,讀入文檔種類和數(shù)據(jù)庫的相似對(duì)應(yīng)表。
[0097]在步驟S702中,從種類判定部102取得作為檢索語句的對(duì)象文字列。
[0098]在步驟S703中,基于相似對(duì)應(yīng)表,按照優(yōu)先度的高的順序選擇數(shù)據(jù)庫。
[0099]在步驟S704中,從在步驟S703中選擇出的數(shù)據(jù)庫中,將對(duì)象文字列作為檢索語句進(jìn)行檢索,如果在數(shù)據(jù)庫的中存在作為對(duì)象文字列的修正候補(bǔ)的文字列、進(jìn)一步包含關(guān)鍵詞的同現(xiàn)語、作為其他書寫變化的文字列,則取得這些文字列作為關(guān)聯(lián)文字列。進(jìn)一步地,對(duì)于取得到的關(guān)聯(lián)文字列,計(jì)算出考慮到數(shù)據(jù)庫間的優(yōu)先度的評(píng)分。
[0100]在步驟S705中,判定是否對(duì)作為檢索對(duì)象的數(shù)據(jù)庫全部進(jìn)行檢查。在對(duì)作為檢索對(duì)象的數(shù)據(jù)庫全部進(jìn)行了檢查的情況下,進(jìn)入步驟S706,沒有對(duì)數(shù)據(jù)庫全部進(jìn)行檢查的情況下,即仍然存在沒有檢查的數(shù)據(jù)庫的話,返回到步驟S703,重復(fù)同樣的處理。
[0101]在步驟S706中,按照計(jì)算出的評(píng)分對(duì)關(guān)聯(lián)文字列重新排列。以上,結(jié)束候補(bǔ)檢索部103的檢索處理。
[0102]接著,參照?qǐng)D8對(duì)候補(bǔ)檢索部103的評(píng)分算出處理的具體實(shí)例進(jìn)行說明。
[0103]圖8的實(shí)例中,假設(shè)作為文檔中的對(duì)象文字列取得“^ (doubutsu(動(dòng)物))”。作為檢索對(duì)象文字列的數(shù)據(jù)庫,示出準(zhǔn)備如下三種數(shù)據(jù)庫的實(shí)例:關(guān)于同音異字轉(zhuǎn)換的數(shù)據(jù)庫A,根據(jù)一般文檔的統(tǒng)計(jì)量記載有同時(shí)出現(xiàn)頻率的同現(xiàn)句數(shù)據(jù)庫B,根據(jù)用戶或群間的輸入歷史記錄,計(jì)算相鄰的單詞的同現(xiàn)信息并進(jìn)行存儲(chǔ)的用戶輸入歷史記錄數(shù)據(jù)庫C0
[0104] 不考慮數(shù)據(jù)庫間的優(yōu)先度的情況下,與對(duì)象文字列) ^ ^ (doubutsu(動(dòng)物))”關(guān)聯(lián)的關(guān)聯(lián)文字列的評(píng)分如圖8的(a)所示,按照在各數(shù)據(jù)庫內(nèi)的評(píng)分從高到低的順序排序。各數(shù)據(jù)庫內(nèi)的評(píng)分是預(yù)先計(jì)算出將同現(xiàn)頻率歸一化的頻率。圖8(a)的實(shí)例中,從三個(gè)數(shù)據(jù)庫按照評(píng)分高的順序取得關(guān)聯(lián)文字列的話,則是數(shù)據(jù)庫A “動(dòng)物(動(dòng)物)0.8”、數(shù)據(jù)庫C “動(dòng)物亡b (動(dòng)物們)0.6”、數(shù)據(jù)庫B “動(dòng)物O森(動(dòng)物的森林)0.5”、數(shù)據(jù)庫B “動(dòng)物占^ (動(dòng)物占卜)0.4”。
[0105]這里,參照相似對(duì)應(yīng)表,在各個(gè)評(píng)分上乘以基于文檔種類的各數(shù)據(jù)庫的權(quán)重值。這里,數(shù)據(jù)庫A設(shè)定為“0.1”、數(shù)據(jù)庫B設(shè)定為“0.6”和數(shù)據(jù)庫C設(shè)定為“0.3”。各關(guān)聯(lián)文字列的評(píng)分乘以數(shù)據(jù)庫間的權(quán)重后的結(jié)果構(gòu)成圖8的(b)的表格。
[0106]在圖8的(b)所示的表格中,關(guān)聯(lián)文字列801、原來的評(píng)分802、權(quán)重值803和更新后評(píng)分804分別相互對(duì)應(yīng)。
[0107]關(guān)聯(lián)文字列801是從詞典中提取的與對(duì)象文字列關(guān)聯(lián)的文字列。
[0108]原來的評(píng)分802是在關(guān)聯(lián)文字列所屬的各自數(shù)據(jù)庫內(nèi)的相似度的評(píng)分。
[0109]權(quán)重值803是根據(jù)數(shù)據(jù)庫間的優(yōu)先度確定的權(quán)重值。
[0110]更新后評(píng)分804是基于原來的評(píng)分802和權(quán)重值803的更新后的評(píng)分,與儲(chǔ)存有關(guān)聯(lián)文字列的數(shù)據(jù)庫名共同示出。
[0111]考慮數(shù)據(jù)庫間的優(yōu)先度的話,例如,儲(chǔ)存于數(shù)據(jù)庫A的關(guān)聯(lián)文字列“動(dòng)物(動(dòng)物)
0.8”在數(shù)據(jù)庫A的權(quán)重值803為“0.1”,因此,更新后評(píng)分804為0.8X0.1=0.08。同樣地,儲(chǔ)存于數(shù)據(jù)庫B的關(guān)聯(lián)文字列“動(dòng)物O森(動(dòng)物的森林)0.5”在數(shù)據(jù)庫B的權(quán)重值803為“0.6”,因此,更新后評(píng)分804為0.5X0.6=0.30。
[0112]與儲(chǔ)存于數(shù)據(jù)庫B的關(guān)聯(lián)文字列“動(dòng)物O森(動(dòng)物的森林)”相比,儲(chǔ)存于數(shù)據(jù)庫A的“動(dòng)物(動(dòng)物)”的原來的評(píng)分高。但是,數(shù)據(jù)庫B比數(shù)據(jù)庫A的優(yōu)先度高,因此,相比于其他的關(guān)聯(lián)文字列,儲(chǔ)存于數(shù)據(jù)庫B的“動(dòng)物^森(動(dòng)物的森林)”的評(píng)分也變高。通過這樣考慮數(shù)據(jù)庫間的優(yōu)先度,能夠向用戶提示與處理對(duì)象的文檔的種類對(duì)應(yīng)的確切的文字列。
[0113]接著,參照?qǐng)D9對(duì)顯示于提示部的用戶界面的一例進(jìn)行說明。
[0114]圖9的(a)示出包含對(duì)象文字列的文檔的文檔種類為購物清單的情況,圖9的(b)示出包含對(duì)象文字列的文檔的文檔種類為一般文檔的情況。
[0115]圖9的(a)的實(shí)例中,如表1所示,文檔種類為購物清單時(shí)的數(shù)據(jù)庫的優(yōu)先度按照同現(xiàn)句DB、用戶輸入歷史記錄DB、同現(xiàn)語詞典DB的順序,因此,作為分別與對(duì)象文字列901 “^ O里(動(dòng)物之家)”相對(duì)的同現(xiàn)語,基于評(píng)分提示有關(guān)聯(lián)文字列902 “ ? A 二^ (來啊)” “杉^ T J:(過來啊)” “ m的(大家的)”。
[0116]另外,在圖9的(b)的實(shí)例中,雖然是同一關(guān)鍵詞,但文檔種類不同,作為文檔種類為一般文檔的情況下的候補(bǔ),與^ ^ (來啊)” “橫浜(橫濱)” “海浜公園(海濱公園)” “絶滅危懼(瀕臨滅絕)”等一起,作為對(duì)象文字列中的“ S ^ (doubutsu(動(dòng)物”的轉(zhuǎn)換候補(bǔ)的“動(dòng)物(動(dòng)物)”作為關(guān)聯(lián)文字列902被提示。
[0117]用戶用筆輕敲或者勾選用戶想要的關(guān)聯(lián)文字列等來進(jìn)行確定,從而對(duì)這些候補(bǔ)來選擇關(guān)聯(lián)文字列,能夠確定選擇文字列。
[0118]接著,參照?qǐng)D10對(duì)與文字識(shí)別精度對(duì)應(yīng)的用戶界面的輸出例進(jìn)行說明。
[0119]圖10的(a)是(doubutsu (動(dòng)物))”這樣的手寫筆劃被正確文字識(shí)別為“匕3 。(doubutsu(動(dòng)物))”的情況下的結(jié)果,出現(xiàn)與圖9的(b)所示的文檔種類為一般文檔時(shí)同樣的候補(bǔ)。
[0120]另一方面,在圖10的(b)中,示出了在將“ S(doubutsu(動(dòng)物))”的文字識(shí)別結(jié)果為“ S 6 ^ (dorabutsu) ”,文字識(shí)別結(jié)果為錯(cuò)誤情況下的實(shí)例。
[0121]由于“ e 6 ^ (dorabutsu) ”不能從詞典中查出,因此判定為誤識(shí)別,但并不能直接向用戶明示為誤識(shí)別。這種情況下,拓展為作為文字列與(dorabutsu)”距離較近的“ t O (doubutsu) ”或其他的識(shí)別候補(bǔ)“ t h (doraputsu) ”等詞匯,將這些文字列作為關(guān)聯(lián)文字列來保持信息,對(duì)于檢索等也可以與包含這些候補(bǔ)的單詞進(jìn)行匹配。
[0122]另外,也可以通過用戶在對(duì)象文字列“ ^ ) O里(動(dòng)物之家)”的顯示區(qū)域下劃線,在滿足檢索條件的情況下,提示識(shí)別結(jié)果“ ^ 6 9 (dorabutsu) ”,促使用戶修正和確認(rèn)。
[0123]接著,參照?qǐng)D11對(duì)轉(zhuǎn)換部105中的文字列的大小調(diào)整處理進(jìn)行說明。
[0124]作為選擇文字列的插入目的地的指定區(qū)域(文本區(qū)域),有時(shí)存在長(zhǎng)、高、周邊的圖形、線條、邏輯結(jié)構(gòu)的制約。在圖11的(a)中,示出了記載在表的內(nèi)部(單元格)中的文字列被插值插入的實(shí)例。對(duì)象文字列1101 “匕)O里(動(dòng)物之家)”這樣用戶的筆劃是考慮了單元格1102的字體大小而書寫的大小的文字,但是直接插入關(guān)聯(lián)文字列1103“ P 二々(去吧)”的情況下,文字列會(huì)超出單元格。因此,用戶在確定關(guān)聯(lián)文字列1103 “1、二々
(去吧)”、并且進(jìn)一步書寫的) O里(動(dòng)物之家)”寫完的時(shí)候,整體變更一個(gè)句子1104O里(去動(dòng)物之家吧)”的字體大小,縮小句子1104來進(jìn)行插入,使其收容在文檔的單元格1102的內(nèi)部。
[0125]在圖11的(b)中示出在圖形1105的內(nèi)部記載文字列的實(shí)例。關(guān)于圖11的(b)也是一樣,不是在確定關(guān)聯(lián)文字列1103時(shí)就立即插入關(guān)聯(lián)文字列1103,而是要等待圖形內(nèi)部的句子1104書寫完畢,在句子1104寫完的時(shí)候,縮小句子1104整體的文字大小。
[0126]另外,對(duì)文字列調(diào)整大小并不限定于此,也可以不變更文字列的大小而是變更單元格或者圖形的大小。另外,在字體大小被變更了的情況下,也可以變更文字的顏色用以能夠容易把握變更位置。
[0127]這樣,考慮到用戶的手寫習(xí)慣、原記號(hào)等的特征筆劃,能夠強(qiáng)制由系統(tǒng)修正文字識(shí)別錯(cuò)誤等,用戶能夠自然進(jìn)行書寫。另外,在文檔中與對(duì)象文字列間隔距離地同現(xiàn)的詞語也能夠作為關(guān)聯(lián)文字列來進(jìn)行提示。例如,文檔種類是書信的話,作為問候語的開頭的敬啟者、末尾的敬啟這樣的文檔中間隔距離的單詞設(shè)置,也能夠作為關(guān)聯(lián)文字列提示給用戶。進(jìn)一步地,在與手寫筆劃關(guān)聯(lián)的單詞的檢索等中也能夠利用。
[0128]根據(jù)以上所示的本實(shí)施方式涉及的文檔制作支援裝置,對(duì)于假設(shè)存在用戶寫入錯(cuò)誤或者文字列模糊的文字列,通過對(duì)根據(jù)文檔的種類而參照的數(shù)據(jù)庫進(jìn)行變更,能夠提示基于文檔的內(nèi)容的確切的候補(bǔ)。另外,在插入選擇文字列時(shí),通過變更用戶的手寫字體地向文檔中插入、或變更文字列的字體大小地插入用以收容在指定區(qū)域內(nèi),用戶能夠僅通過選擇作業(yè),將所要的文字列插入到文檔中,能夠高效地支援用戶的文檔制作。
[0129]在上述實(shí)施方式的中所示的處理順序所示的指示能夠基于軟件程序執(zhí)行。通過通用的計(jì)算機(jī)系統(tǒng)預(yù)先存儲(chǔ)該程序,讀入該程序,也能夠得到與上述的文檔制作支援裝置同樣的效果。上述實(shí)施方式所記載的指示,作為使計(jì)算機(jī)能夠執(zhí)行的程序,記錄在磁盤(軟盤、硬盤等)、光盤(CD-ROM、CD-R、CD-RW、DVD-ROM、DVD±R、DVD 土 RW、藍(lán)光(注冊(cè)商標(biāo))光盤等)、半導(dǎo)體存儲(chǔ)器、或者與其類似的記錄介質(zhì)中。只要是計(jì)算機(jī)或者嵌入式系統(tǒng)能夠讀取的記錄介質(zhì),其存儲(chǔ)形式可以是任意形態(tài)。計(jì)算機(jī)只要從該記錄介質(zhì)中讀入程序,基于該程序使CPU執(zhí)行記錄在程序中的指示,就可以實(shí)現(xiàn)與上述實(shí)施方式的文檔制作支援裝置同樣的動(dòng)作。當(dāng)然,計(jì)算機(jī)取得或讀入程序時(shí)也可以通過網(wǎng)絡(luò)進(jìn)行取得或讀入。
[0130]另外,也可以基于從記錄介質(zhì)安裝到計(jì)算機(jī)或嵌入式系統(tǒng)上的程序的指示,由在計(jì)算機(jī)上運(yùn)行的os(操作系統(tǒng))、數(shù)據(jù)庫管理軟件、網(wǎng)絡(luò)等的m中間件)等來執(zhí)行用于實(shí)現(xiàn)本實(shí)施方式的各處理的一部分。
[0131]進(jìn)一步地,本實(shí)施方式的記錄介質(zhì)并不限于獨(dú)立于計(jì)算機(jī)或嵌入式系統(tǒng)的介質(zhì),也包括下載并存儲(chǔ)或暫時(shí)存儲(chǔ)了由LAN或網(wǎng)絡(luò)等傳輸?shù)某绦虻挠涗浗橘|(zhì)。
[0132]另外,記錄介質(zhì)并不限定為一個(gè),從多個(gè)介質(zhì)來執(zhí)行本實(shí)施方式的處理的情況也包含在本實(shí)施方式的記錄介質(zhì)中,介質(zhì)的構(gòu)成可以任意。
[0133]另外,本實(shí)施方式的計(jì)算機(jī)或者嵌入式系統(tǒng)是用于基于存儲(chǔ)在記錄介質(zhì)中的程序來執(zhí)行本實(shí)施方式的各處理的,可以是由計(jì)算機(jī),微型計(jì)算機(jī)等的一個(gè)組成的裝置,或者是多個(gè)裝置被網(wǎng)絡(luò)連接的系統(tǒng)等中的任意構(gòu)成。
[0134]另外,本實(shí)施方式的計(jì)算機(jī)并不限于個(gè)人電腦,也包括包含于信息處理設(shè)備中的運(yùn)算處理裝置、微型計(jì)算機(jī)等,能夠通過程序來實(shí)現(xiàn)本實(shí)施方式的功能的設(shè)備、裝置的統(tǒng)稱。
[0135]雖然說明了本發(fā)明的幾個(gè)實(shí)施方式,但這些的實(shí)施方式是作為例子而提出的,并非意圖限定發(fā)明的范圍。這些新的實(shí)施方式能夠以其它各樣方式來實(shí)施,在不脫離發(fā)明的主旨的范圍內(nèi),各能夠進(jìn)行種省略、置換、變更。這些實(shí)施方式或該變形包含在發(fā)明的范圍或主旨中,并且包含在權(quán)利要求書中記載的發(fā)明及其均等的范圍中。
[0136]【符號(hào)說明】
[0137]100…文檔制作支援裝置、101…特征提取部、102…種類判定部、103…候補(bǔ)檢索部、104…候補(bǔ)選擇部、105…轉(zhuǎn)換部、106…提示部、107…文檔種類數(shù)據(jù)庫(DB)、108…同現(xiàn)句數(shù)據(jù)庫(DB)、109…用戶輸入歷史記錄數(shù)據(jù)庫(DB)、110…同現(xiàn)語詞典數(shù)據(jù)庫(DB)、11L...群共有詞典數(shù)據(jù)庫(DB)、112…字體數(shù)據(jù)庫(DB)、 801…關(guān)聯(lián)文字列、802…原來的評(píng)分、803…權(quán)重值、804…更新后評(píng)分、901、1101…對(duì)象文字列、902,1103…關(guān)聯(lián)文字列、1102...單元格、1104...句子、1105...圖形。
【權(quán)利要求】
1.一種文檔制作支援裝置,其特征在于,包括: 判定部,其基于包含對(duì)處理對(duì)象的文字列即對(duì)象文字列進(jìn)行文字識(shí)別后的文字識(shí)別結(jié)果、和示出該對(duì)象文字列出現(xiàn)在文檔中哪個(gè)位置的位置信息的特征量,對(duì)包含該對(duì)象文字列的文檔的種類即文檔種類進(jìn)行判定; 檢索部,其在滿足用于對(duì)與所述對(duì)象文字列關(guān)聯(lián)的關(guān)聯(lián)文字列進(jìn)行檢索的檢索條件的情況下,從根據(jù)所述文檔種類來設(shè)定優(yōu)先度的成為該關(guān)聯(lián)文字列的檢索基礎(chǔ)的數(shù)據(jù)庫中,檢索該關(guān)聯(lián)文字列,按照基于所述優(yōu)先度的評(píng)分從高到低的順序得到該關(guān)聯(lián)文字列;以及 提示部,其按照基于所述優(yōu)先度的評(píng)分從高到低的順序提示所述關(guān)聯(lián)文字列。
2.如權(quán)利要求1所述的文檔制作支援裝置,其特征在于, 還包括提取部,其在所述對(duì)象文字列是手寫筆劃的情況下,將對(duì)該手寫筆劃進(jìn)行文字識(shí)別后的文字識(shí)別結(jié)果和由該手寫筆劃所表現(xiàn)的文字列的位置信息,作為所述特征量進(jìn)行提取。
3.如權(quán)利要求1或2所述的文檔制作支援裝置,其特征在于, 還包括轉(zhuǎn)換部,其在將按照來自用戶的指示而選擇的關(guān)聯(lián)文字列即選擇文字列插入到所述文檔中的指定區(qū)域的情況下,對(duì)所述對(duì)象文字列和所述選擇文字列的字體大小進(jìn)行變更后再插入,以便收容在該指定區(qū)域內(nèi)。
4.如權(quán)利要求3 所述的文檔制作支援裝置,其特征在于, 所述轉(zhuǎn)換部將所述選擇文字列轉(zhuǎn)換為所述用戶的手寫字體并插入所述文檔中。
5.如權(quán)利要求1~4中的任意一項(xiàng)所述的文檔制作支援裝置,其特征在于, 所述檢索部通過滿足如下任意一種檢索條件來判定滿足所述檢索條件,所述檢索條件是:預(yù)先設(shè)定的文字列和詞類的出現(xiàn)類型是否作為所述文字識(shí)別結(jié)果被識(shí)別、對(duì)于所述對(duì)象文字列的動(dòng)作是否通過用戶的手寫筆劃被輸入、取得該手寫筆劃后沒有來自用戶的輸入的狀態(tài)是否經(jīng)過了第一期間。
6.如權(quán)利要求1~5中的任意一項(xiàng)所述的文檔制作支援裝置,其特征在于, 所述一個(gè)以上的數(shù)據(jù)庫包括:基于在多個(gè)用戶間共有的文檔中出現(xiàn)的文字列生成的數(shù)據(jù)庫。
7.如權(quán)利要求1~5中的任意一項(xiàng)所述的文檔制作支援裝置,其特征在于, 所述提示部根據(jù)所述文字識(shí)別結(jié)果變更提示的關(guān)聯(lián)文字列。
8.一種文檔制作支援方法,其特征在于,包括如下步驟: 基于包含對(duì)處理對(duì)象的文字列即對(duì)象文字列進(jìn)行文字識(shí)別后的文字識(shí)別結(jié)果、和示出該對(duì)象文字列出現(xiàn)在文檔中哪個(gè)位置的位置信息的特征量,對(duì)包含該對(duì)象文字列的文檔的種類即文檔種類進(jìn)行判定; 在滿足用于對(duì)與所述對(duì)象文字列關(guān)聯(lián)的關(guān)聯(lián)文字列進(jìn)行檢索的檢索條件的情況下,從根據(jù)所述文檔種類來設(shè)定優(yōu)先度的成為該關(guān)聯(lián)文字列的檢索基礎(chǔ)的數(shù)據(jù)庫中,檢索該關(guān)聯(lián)文字列,按照基于所述優(yōu)先度的評(píng)分從高到低的順序得到該關(guān)聯(lián)文字列; 按照基于所述優(yōu)先度的評(píng)分從高到低的順序提示所述關(guān)聯(lián)文字列。
9.一種文檔制作支援程序,其特征在于,用于使計(jì)算機(jī)作為如下單元起到作用: 判定單元,其基于包含對(duì)處理對(duì)象的文字列即對(duì)象文字列進(jìn)行文字識(shí)別后的文字識(shí)別結(jié)果、和示出該對(duì)象文字列出現(xiàn)在文檔中哪個(gè)位置的位置信息的特征量,對(duì)包含該對(duì)象文字列的文檔的種類即文檔種類進(jìn)行判定; 檢索單元,其在滿足用于對(duì)與所述對(duì)象文字列關(guān)聯(lián)的關(guān)聯(lián)文字列進(jìn)行檢索的檢索條件的情況下,從根據(jù)所述文檔種類來設(shè)定優(yōu)先度的成為該關(guān)聯(lián)文字列的檢索基礎(chǔ)的數(shù)據(jù)庫中,檢索該關(guān)聯(lián)文字列,按照基于所述優(yōu)先度的評(píng)分從高到低的順序得到該關(guān)聯(lián)文字列;以及 提示單元,其按照基 于所述優(yōu)先度的評(píng)分從高到低的順序提示所述關(guān)聯(lián)文字列。
【文檔編號(hào)】G06K9/46GK104077346SQ201410092798
【公開日】2014年10月1日 申請(qǐng)日期:2014年3月13日 優(yōu)先權(quán)日:2013年3月21日
【發(fā)明者】布目光生, 鈴木優(yōu), 岡本昌之, 長(zhǎng)健太 申請(qǐng)人:株式會(huì)社東芝