專利名稱:信息處理裝置、信息處理方法及軟件產(chǎn)品的制作方法
發(fā)明領域本發(fā)明涉及一種信息處理裝置,如移動蜂窩電話、PHS(個人手持電話系統(tǒng))、PDA(個人數(shù)字助理)、便攜式或手持個人電腦及其他同類產(chǎn)品。
背景技術:
公開號為2002-252691的日本專利披露了一種能夠使用OCR(光字符識別)功能輸入地址、電話號碼和URL(統(tǒng)一資源地址)等打印信息的移動電話終端。公開號為5-274346的日本專利披露了一種具有字符識別部件的電子詞典,該電子詞典能夠識別打印的字符串,并將該字符串的翻譯結果顯示在一個顯示部件上。
通常情況下,一個電子詞典的存儲容量是有限的,所以,如果用戶想知道關于所識別的字符的更詳細信息,該用戶還需要其他電子詞典或普通紙質詞典,以在該詞典中重新查找該字符。
因此,有必要提供一種改進的信息處理裝置。
發(fā)明內容
為滿足上述需求,本發(fā)明提供了一種信息處理裝置,該信息處理裝置包括一個照相機,其輸出圖片信息;一個存儲器,其存儲關于至少一個的一個或多個字符的字符串的簡明信息;以及一個數(shù)據(jù)通信接口,用于經(jīng)由網(wǎng)絡進行通信。該信息處理裝置包括一個CPU,其識別照相機輸出的圖片信息中包含的一個或多個字符的字符串,并顯示識別結果和關于該所識別字符串的簡明信息,作為對用戶發(fā)出的字符識別請求的響應。當用戶請求該被識別的一個或多個字符的字符串的詳細信息時,該CPU還控制數(shù)據(jù)通信接口與服務器進行通信,并顯示該數(shù)據(jù)通信接口接收的信息。
附圖簡述
圖1是一個信息處理裝置的配置的結構框圖;圖2所示為詞典數(shù)據(jù)內容的一個實例;圖3所示為詞典數(shù)據(jù)內容的另一個實例;圖4是描述一個信息處理裝置工作過程的流程圖;圖5所示為顯示屏幕圖像的實例;圖6所示為顯示屏幕圖像的實例;圖7所示為一個歷史表的實例;圖8是描述一個歷史表創(chuàng)建過程的流程圖;圖9所示為顯示屏幕圖像的實例;圖10是描述下載字形數(shù)據(jù)的過程的流程圖;圖11所示為出現(xiàn)在字形數(shù)據(jù)下載過程中的顯示屏幕圖像的實例;圖12所示為一個信息處理裝置訪問詞典提供商的實例;圖13是一個訪問Web站點的過程的流程圖;圖14所示為一個信息處理裝置的外觀;圖15是在該信息處理裝置中執(zhí)行的一個過程的流程圖;圖16所示為顯示屏幕圖像的實例;圖17所示為顯示屏幕圖像的實例;圖18所示為顯示屏幕圖像的實例;圖19所示為搜索確切定義的系統(tǒng)的實例;圖20所示為一個同現(xiàn)關系數(shù)據(jù)庫的實例;圖21是在信息處理裝置中執(zhí)行的一個過程的流程圖;
圖22是在服務器中執(zhí)行的一個過程的流程圖;圖23是關于一個識別對象單詞和同現(xiàn)單詞的位置關系的說明圖;圖24所示為信息處理裝置和服務器執(zhí)行的一系列示例性的操作;圖25所示為顯示屏幕圖像的實例。
發(fā)明詳述下面將結合附圖,描述一種信息處理裝置,如蜂窩電話、PHS、PDA、便攜式或手持個人電腦。在附圖中,相同的參考數(shù)字表示相同的部件。
圖1是一個信息處理裝置的配置的結構框圖,該信息處理裝置具有圖像識別(OCR)功能。后面將描述使用圖像識別功能來識別打印在紙張上的單詞或其他類型的單詞,并將該單詞的定義顯示在顯示屏上的情況。
輸入單元101包括一個具有多個按鍵的鍵盤,這些按鍵包括一個快門按鈕、一個電源按鈕和多個數(shù)字按鍵。用戶使用該輸入單元101輸入信息,如電話號碼、電子郵件地址、電源開/關命令以及請求照相機103拍攝照片的圖像拍攝命令等。輸入單元101還可以包括一個觸摸敏感的面板,使得用戶能夠用筆或他/她的手指觸摸顯示屏,從而輸入信息或指示。輸入單元101還可以包括一個語音識別單元,從而采用基于語音識別的輸入方法。
中央處理單元(CPU)102通過執(zhí)行存儲器104中存儲的程序,控制該信息處理裝置的各個部件。照相機103將對象為人、風景或字符的光圖像轉化為符合如YUV標準的圖片信息,并通過圖片接口110將該圖片信息傳送到CPU102。這里,符合YUV標準的圖片信息指的是包含亮度信號(Y)、亮度信號和紅色分量的差值(U)以及亮度信號和藍色分量的差值(V)的信息。但是,由照相機103轉化的圖片信息不限于符合YUV標準的圖片信息,也可以是符合任何其他標準的信息,只要CPU102能夠處理該圖片信息即可。在本實例中,照相機103置于信息處理裝置之內。本發(fā)明不限于該實例。照相機也可以通過圖片接口110附著在信息處理裝置之外。
CPU102將符合YUV標準的圖片信息轉換為符合RGB(紅綠藍)標準的圖片信息,并將轉換后的圖片信息傳輸?shù)斤@示屏107或類似部件上。用戶在監(jiān)視顯示屏107上顯示的圖片的同時,可以選擇他/她所要生成的圖象的對象或主體,并使用快門按鈕或類似部件進行拍攝。在按下快門按鈕的時候,從照相機103發(fā)送的圖片信息被保存到存儲器104中。存儲器104可以是只讀存儲器(ROM)或隨機讀取存儲器(RAM)。圖像數(shù)據(jù)、語音數(shù)據(jù)及CPU102執(zhí)行的軟件,都存儲在存儲器104中。
圖片識別存儲器105中存儲了CPU102執(zhí)行OCR功能的軟件程序。OCR功能可用于識別一張圖片內的一個或多個字符,如文字、標記、符號、標志、數(shù)字、標識信息及其他。標識信息可以是一個主頁地址、一個電子郵件地址、一個郵政地址、一個電話號碼或地圖信息。標識信息不限于上述實例,它可以是用于標識一個實體的任何信息。
一個或多個字符的字符串的識別包括如下步驟從照相機103拍攝的圖片中標識出包含一個或多個字符的字符串的區(qū)域;將包含字符的部分的圖像數(shù)據(jù)分割成預定的部分;將這些部分中的各數(shù)據(jù)轉換成一個參數(shù)值;并根據(jù)該參數(shù)值,確定各個部分中包含的信息。
以識別一張圖片中的字符“abc”為例進行說明。首先,識別出圖片中包含字符“abc”的區(qū)域;然后,將包含字符“abc”的部分的圖像數(shù)據(jù)分割成包含字符“a”、“b”、“c”的部分;再將包含“a”、“b”、“c”的部分的數(shù)據(jù)轉換成相應的參數(shù)值。預定參數(shù)值的確定方式如下一個字符被視為縱向段、橫向段和傾斜段的組合;字符的白色部分用0表示;字符的黑色部分用1表示。對于每個部分,從字形數(shù)據(jù)中包含的字符中選擇與參數(shù)值最相似的字符。該字形數(shù)據(jù)是將每個參數(shù)值與對應于該參數(shù)值的一個字符如一個字母數(shù)字字符相關聯(lián)的數(shù)據(jù)。該字形數(shù)據(jù)可以預先存儲在存儲器104中,也可以由用戶下載或安裝。
在本實例中,圖片識別存儲器105是專用于存儲圖片處理軟件的存儲器。也可以選擇將圖片處理軟件嵌入到CPU102或存儲器104中,為CPU102提供OCR功能。通過將圖片處理軟件嵌入到CPU102或存儲器104中,可以減少部件的數(shù)目,而且制造成本和其他類似成本也會降低。
在本實例中,為了減小電路規(guī)模,OCR功能由CPU102執(zhí)行。但是,本發(fā)明的配置并不限于此例,例如,也可以使用專用處理器實現(xiàn)OCR功能。
在顯示屏107上顯示照相機103生成的圖像或CPU102識別出的一個或多個字符的字符串。此外,顯示屏107上也可以顯示工作狀態(tài),如電源狀態(tài)、電波強度、電池剩余功率量、服務器連接狀態(tài)、未讀郵件列表等,顯示屏107上還可以顯示電話號碼、電子郵件地址或電子郵件所要傳輸?shù)奈臋n。除此之外,顯示屏107上還可以顯示動畫和靜態(tài)圖像、呼叫終止時主叫方的電話號碼、以郵件方式終止的文檔、互聯(lián)網(wǎng)上的Web頁面等等。但是,信息(如標識信息)所要傳輸?shù)哪康牡夭幌抻陲@示屏107,該信息的表現(xiàn)形式也可以是擴音器廣播出的話音。數(shù)據(jù)通信接口108經(jīng)由網(wǎng)絡,與信息提供商的一臺服務器或主計算機或其他數(shù)據(jù)設備進行通信。數(shù)據(jù)通信接口108可以是一個MODEM、一塊網(wǎng)卡或其他類似設備。
搜索單元109是一個處理器,它參考存儲在存儲器104中的詞典數(shù)據(jù)106,搜索對應于由CPU102識別出的一個或多個字符的字符串的信息。
圖2所示為詞典數(shù)據(jù)106的一個實例。列201中記錄的是單詞,列202中記錄的是記錄在列201中的單詞的簡明定義,列203中記錄的是記載有與記錄在列201中的單詞有關的信息片斷(如單詞用法舉例等詳細信息的片斷)的主頁URL。在本實例中,詞典數(shù)據(jù)106是英-英詞典的數(shù)據(jù)。存儲器104可以存儲多個詞典數(shù)據(jù)庫,如英-日詞典、英-法詞典、英-德詞典、科技詞典、體育詞典。當選擇英-日詞典并識別一個英語單詞時,就從列202中取出日文翻譯顯示給用戶。
如圖3所示,列203中的各個URL的部分都可以記錄。在本實例中,由于http//www.ooo.com是共同使用的,所以,該公共部分就被記錄在公共URL部分204的域中。列206中記錄的是特有URL部分,如“a”或“abacus”,都是被作為特有URL部分記錄的。此外,通過組合公共URL部分204和特有URL部分206來創(chuàng)建包含詳細信息的主頁URL的方法,記錄在URL創(chuàng)建方法205的域中。當如上所述記錄URL時,可以減小詞典數(shù)據(jù)106的數(shù)據(jù)規(guī)模。如果列206中記錄的信息與列201中記錄的單詞相同,就可以省略列206,這樣,進一步減小詞典數(shù)據(jù)的數(shù)據(jù)規(guī)模。此外,詞典數(shù)據(jù)106中記錄的數(shù)據(jù)不限于單詞定義和/或翻譯數(shù)據(jù),也可以是與科技或體育相關的專門術語。
在本實例中,搜索單元109也可以采用專用于詞典數(shù)據(jù)搜索的處理器。但是,本發(fā)明不僅僅限于該實例,為了減小電路規(guī)模,也可以由CPU102執(zhí)行搜索功能。
在下面所要描述的情況下,有兩種圖像拍攝模式,即一種是普通圖像拍攝模式,這種模式拍攝人和景物的普通靜態(tài)圖片或動態(tài)圖片或普通照相機的其他類似功能;另一種就是拍攝照片的識別模式。當用戶選擇兩種模式之一時,一個模式確定標志就被存儲在存儲器104中,CPU102檢查該模式確定標志以確定所選擇的圖像拍攝模式。該模式確定標志是存儲在存儲器104中的軟件程序所描述的一個變量,該變量被設置成一個能區(qū)分識別模式和普通圖像拍攝模式的值。根據(jù)此變量,CPU102可以在識別模式和普通圖像拍攝模式之間進行切換。
下面將結合圖4中的流程圖描述當選擇識別模式時所要執(zhí)行的過程的一個實例。當用戶按下輸入單元101中的快門按鈕時,CPU102指示照相機103拍攝照片(步驟S401)。通過CPU102將照相機103產(chǎn)生(轉化)的圖片信息保存到存儲器104中(步驟S402)。
CPU102讀取存儲器104中存儲的圖片信息,并識別包含在該圖片信息中的一個或多個字符的字符串,例如,一本書中包含的單詞“recognition”。CPU102將識別結果保存在存儲器104中(步驟S403)。
搜索單元109讀取識別結果,從存儲器104中存儲的詞典數(shù)據(jù)106的列201中記錄的單詞中搜索一個符合的單詞(步驟S404)。如果找到一個與該被識別的一個或多個字符的字符串正確匹配的單詞(步驟S405),則將與該單詞相關的列202中的簡明信息顯示在顯示屏107上(步驟S406)。
下面將描述一種優(yōu)選的搜索方法。首先,搜索一個完全符合的單詞。如果沒有找到該完全符合的單詞,再搜索只存在一個字母不同而其他字母符合的單詞。采用該方法時,即使CPU102對一張紙上的一個或多個字符的字符串識別錯誤,也可以找到與該字符串最相似的單詞。這樣,就可以節(jié)省反復生成圖像和執(zhí)行字符串識別的工作,可以給用戶帶來很大的方便。
此外,如果沒有找到只存在一個字符差異的單詞,就搜索存在兩個字符差異或存在三個字符差異的單詞,即,可以搜索的單詞中差異的字符數(shù)是逐漸遞增的。這樣,即使在識別率很低的情況下,也仍然能找到正確的單詞。
CPU102判斷用戶是否通過輸入單元101請求了詳細的翻譯信息(步驟S407)。如果發(fā)出了這樣的請求,CPU102讀取由搜索單元109在步驟S404中檢索到的單詞的相關URL,并將一個指示信號傳送到數(shù)據(jù)通信接口108,使其訪問該URL(步驟S408)。顯示屏107顯示經(jīng)由數(shù)據(jù)通信接口108接收到的信息,如主頁內容或其他類似信息。如果沒有找到正確的單詞(步驟S405),通過顯示屏107向用戶發(fā)出一條通知消息,告訴用戶沒有找到合適的單詞(步驟S410)。然后,該過程結束。
如上所述,當用戶不僅想得到簡明信息,而且還想得到詳細信息時,就需要顯示記載詳細信息的主頁或其他類似物。這樣,用戶就可以在不必查詞典的情況下獲知一個單詞的詳細信息。該功能將是很方便用戶的。
一個信息處理裝置可能不具有大容量的存儲器,即,信息處理裝置上可能只存儲了很少量的必須信息,如簡明定義或典型翻譯。當用戶需要詳細信息時,他可以通過網(wǎng)絡從信息提供商的服務器處獲取信息。因此,本實例中采用的方法是非常有效的。
在本實例中,可以根據(jù)需要,向用戶提供簡明信息和詳細信息。但是,本發(fā)明并不僅僅限于該實例,也可以分別從存儲器和通過網(wǎng)絡提供兩種不同類型的信息,如,第一信息和第二信息。
圖5所示為顯示屏幕圖像的一些實例。順便指出一點,各個屏幕圖像下方的指示菜單中的指示對應于輸入單元101中的相應按鍵。當用戶按下一個按鍵或其他類似部件時,菜單的特征或類似指示所提供的顯示屏幕圖像就出現(xiàn)在顯示屏107上。每一次切換顯示屏幕圖像時,都可以使用按鍵來執(zhí)行與各個顯示屏幕圖像下方的指示所對應的特征。所以,可以根據(jù)顯示的指示所對應的特征,對按鍵進行命名。例如,對應于菜單特征的按鍵可以被命名為菜單鍵,對應于返回特征的按鍵可以被命名為返回鍵??梢愿鶕?jù)指示的顯示位置,如右下方和左下方,將與指示相關的特征分配給按鍵。可以選擇,把這些功能全部分配給同一個按鍵。
屏幕圖像501是屏幕圖像的一個實例,用戶通過該屏幕圖像定義圖片識別的范圍。例如,用戶將出現(xiàn)在顯示屏107中間的一個標記(如“+”、“?”、“?”或其他類似標記)置于字符串附近的位置。此時,顯示屏107起取景器的作用。否則的話,用戶可操縱輸入單元101,移動顯示屏上的一個光標,去指定識別范圍。此外,用戶也能夠選擇多種用于確定識別對象的方法中的任何方法。對于動畫而言,要生成構成動畫的若干靜態(tài)圖像表現(xiàn)幀,從而使得這些幀可以連續(xù)饋入。通過一個可連續(xù)饋入幀的幀饋入屏幕圖像,可以指定識別對象。
可以使用點線或類似物圈定一個識別對象,從而區(qū)分該識別對象。也可以選擇顯示識別對象的放大圖象或縮小圖象。例如,原先用一個像素的橫向和一個像素的縱向顯示的字符,放大后,就用兩個像素的橫向和兩個像素的縱向顯示。此外,圖像編輯單元可以將識別對象的包含一個或多個字符的字符串的圖象部分的顏色,改變?yōu)楹诎谆蜃睾稚?。否則,加亮該圖象部分,然后進行顯示。本發(fā)明不限于以上區(qū)分識別對象的方法,只要能清晰地標識出一個圖像中包含的識別對象的任何方法都可采用。
例如,可以按下識別模式按鈕,以從等待屏幕圖像切換到屏幕圖像501?;蛘?,在等待屏幕圖像中指定菜單屏幕圖像,并且按下該菜單屏幕圖像中包含的一個按鈕,從而顯示屏幕圖像501。如果利用所顯示的屏幕圖像501,按動該屏幕圖像下方的“識別”按鈕,就會從屏幕圖像501切換到屏幕圖像502。
當用戶按下快門按鈕或“識別”按鈕時,顯示屏107顯示屏幕圖像502。屏幕圖像502用于通告用戶正在執(zhí)行識別過程。當識別過程終止的時候,屏幕圖像502被切換到屏幕圖像503。
顯示屏107上出現(xiàn)的屏幕圖像503包含CPU102執(zhí)行的識別結果以及與該識別結果相關的一條簡明信息。為了區(qū)分識別對象,例如用黑色顯示識別對象之外的圖象部分。
如果用戶想得知該單詞的意思及其詳細用法,用戶可以按下屏幕圖像503左下方的對應于詳細表示的按鈕。這樣,屏幕圖像503被切換到了屏幕圖像504。屏幕圖像504指示數(shù)據(jù)通信接口108正在將此信息處理裝置連接列203中記錄的一個URL。當該信息處理裝置被連接到列203中記錄的URL時,從屏幕圖像504切換到屏幕圖像505。屏幕圖像505給出了詳細信息,如URL定位的主頁內容。
通過使用上述信息顯示方法,在用戶得到簡明信息之后,執(zhí)行簡單的操作,就能獲悉單詞的詳細信息及其他類似信息。這對用戶是友好的。
此外,在本實例中,一個URL用于查找詳細信息。但本發(fā)明并不限于此。例如,列203中可以存儲很多URL,當請求詳細信息時,可以選擇這些URL中的任意一個。這種情況下,用戶可以選擇多個信息源中的任意一個,去獲知單詞的詳細信息或其他類似信息。這對于用戶來說是很方便。
此外,在本實例中,使用了URL或類似信息作為查找詳細信息的信息。但本發(fā)明并不限于這種形式。只要能夠獲取單詞的詳細信息或其他類似信息,任何形式都是可以的。
通過使用URL或其他類似信息獲取的詳細信息被存儲在存儲器104中。這種情況下,對簡明翻譯和詳細翻譯做出區(qū)分來存儲。如果用戶再次請求同一單詞的詳細信息,則從存儲器104中讀取詳細信息并顯示。這樣,由于不需訪問互聯(lián)網(wǎng)或其他類似設備,所以可以快速地顯示詳細信息。這樣就可以節(jié)省時間。此外,即使移動蜂窩電話處于可進行通信的區(qū)域之外,也可以獲取詳細信息。
此外,也可以使用其他裝置(如存儲了詳細信息的個人電腦或存儲設備)獲取詳細信息。這種情況下,詞典數(shù)據(jù)106中的列206中記錄從其他裝置讀取詳細信息所需的連接信息,該連接信息可以是,例如其他裝置的標識,如為包含有詳細信息的文件指定的IP地址、路徑名或者文件名,或存儲了詳細信息的其他裝置所包含的存儲器中的一個地址。
例如,當用戶需要一個或多個字符的字符串的詳細信息時,他使用圖5(3)的實例中的顯示屏幕圖像發(fā)出一個詳細信息請求。接收到該請求信息的CPU102通過數(shù)據(jù)通信接口108,將存儲在存儲器104中與字符串相關的連接信息發(fā)送給其他裝置,如PC;PC根據(jù)該連接信息將詳細信息發(fā)送給信息處理裝置,該詳細信息存儲于該裝置的存儲器中或外部存儲器中;信息處理裝置在顯示屏107上顯示該詳細信息。可以使用電纜線或無線電波來鏈接該信息處理裝置和其他裝置。如果使用電纜線鏈接其他裝置,即便該信息處理裝置位于可以通信的區(qū)域之外,也能獲取到詳細信息。這對用戶是友好的。此外,也可以從存儲詳細信息的存儲媒介處獲取詳細信息。這種情況下,信息處理裝置中需要包含用于從存儲媒介中讀取信息的存儲媒介讀取器,并執(zhí)行與前述相同的過程。
此外,用戶可以自己創(chuàng)建或編輯詳細信息。這種情況下,顯示屏107上顯示一個設置屏幕圖像,用戶可通過它創(chuàng)建或編輯(增加或刪除)詳細信息。所輸入的信息被記錄在詞典數(shù)據(jù)的列203中。也可以創(chuàng)建或編輯一個用戶獨有的原始詞典。此外,創(chuàng)建的原始詞典也可用于獲取一個單詞的詳細信息??梢詮念A定的詳細信息中增加或刪除信息。這樣,用戶友好度得到了進一步的提高。
在本實例中,當需要簡明信息時,就要使用存儲器104中存儲的信息。即使獲得簡明信息之后,也可以使用存儲在其他裝置或存儲媒介中的信息以及從互聯(lián)網(wǎng)接收的信息。
下面將說明存儲器104存儲了多個詞典數(shù)據(jù)時信息處理裝置的操作過程。
存儲器104中存儲了多個詞典數(shù)據(jù),如英-英詞典、英-日詞典、德-日詞典,以及一個詞典標志。
詞典標志用于指定CPU102所使用的詞典數(shù)據(jù)項。例如,詞典標志是存儲在存儲器104中的軟件程序中包含的一個變量。根據(jù)用戶在輸入單元101上執(zhí)行的操作,詞典標志的值是可變的。這樣,用戶可以獲取一個單詞的任何或多種語言翻譯,這對用戶是友好的。
圖6所示為當用戶選擇詞典時顯示屏107上出現(xiàn)的顯示屏幕圖像的實例。當照相機103在識別模式下被激活時,就顯示屏幕圖像601。為了激活照相機103,可以按動該信息處理裝置側面的一個開關。或者,從等待屏幕圖像切換到菜單屏幕圖像,再多次按動按鈕。在屏幕圖像601中,按動該屏幕圖像右下方出現(xiàn)的菜單對應的按鈕,然后,從屏幕圖像601切換到屏幕圖像602。
屏幕圖像602用于從一個菜單中選擇菜單項。如果使用輸入單元101選擇菜單項“(1)選擇一個詞典”,就從屏幕圖像602切換到屏幕圖像603。如果使用輸入單元101選擇菜單項“(3)ΔΔΔ日-英詞典”,就從屏幕圖像603切換到屏幕圖像604。
屏幕圖像604通知用戶,“ΔΔΔ日-英詞典”已被選擇為要使用的詞典。此時,如果按動檢查對應的按鈕,就從屏幕圖像604切換到屏幕圖像601。如果該信息處理裝置有多個詞典數(shù)據(jù)項,用戶就可以獲得多種語言的信息,這對用戶是友好的。
假設英-日詞典被指定為要使用的詞典數(shù)據(jù),如果識別出一個德文單詞,則無法找到符合的單詞。如果沒有在指定的詞典中尋找到符合的單詞,則CPU102就將詞典數(shù)據(jù)從英-日詞典自動切換為其他的詞典數(shù)據(jù)。如果在第二個詞典數(shù)據(jù)中未找到符合的單詞,CPU切換到第三或第四詞典數(shù)據(jù)。這種情況下,用戶減輕了選擇詞典數(shù)據(jù)的負擔,于是就實現(xiàn)了一個用戶友好的詞典功能。
下面參考圖10的流程圖,詳細描述從互聯(lián)網(wǎng)下載字形數(shù)據(jù)的過程。例如,圖片識別存儲器105中只存儲了用于識別字母數(shù)字字符的軟件程序,用戶無法使用OCR功能識別其他字符,如中文字符或阿拉伯語字符。為了解決此問題,信息處理裝置經(jīng)由數(shù)據(jù)通信接口108,通過網(wǎng)絡與信息提供商的一臺服務器或主計算機進行通信,從而下載包含字形數(shù)據(jù)的軟件程序。
首先,收到下載字形數(shù)據(jù)表指示的CPU102通過數(shù)據(jù)通信接口108訪問互聯(lián)網(wǎng)上的一個Web站點,該Web站點存放著字形數(shù)據(jù)(步驟S1001)。該Web站點上的一張Web頁面顯示出來時,用戶按動輸入單元101中的一個按鈕,來指示下載字形數(shù)據(jù)(步驟S1002)。于是,CPU102通過數(shù)據(jù)通信接口從該Web站點下載字形數(shù)據(jù)(步驟S1003)。CPU102將該下載的字形數(shù)據(jù)增加到圖片識別存儲器中的字形數(shù)據(jù)表中(步驟S1004)。
圖11所示為一些屏幕圖像的實例,通過這些屏幕圖像,信息處理裝置被連接到可下載字形數(shù)據(jù)的Web站點。
屏幕圖像1101給出了互聯(lián)網(wǎng)上一個Web站點上保存的Web頁面,可從該Web站點下載字形數(shù)據(jù)。例如,選擇“阿拉伯”時,從屏幕圖像1101切換到屏幕圖像1102。屏幕圖像1102顯示的是用戶希望下載阿拉伯字形數(shù)據(jù)時的用戶確認信息,如果選擇“Yes”,就從屏幕圖像1102切換到屏幕圖像1103。屏幕圖像1103表示正在下載阿拉伯字形。下載結束之后,從屏幕圖像1103切換到屏幕圖像1104。屏幕圖像1104表明,阿拉伯字形已經(jīng)被下載。類似地,用戶也可以下載表示其他任意外語字形的詞典數(shù)據(jù)。
如上所述,由于可以下載多種語言的字形數(shù)據(jù)項和詞典,所以,信息處理裝置就可以識別多種語言的字符,并獲取相關信息,如多種語言的翻譯,這有助于改善用戶友好度。
如果欲識別的字符沒有包含在圖片識別存儲器105存儲的字形數(shù)據(jù)項中的時候,用戶收到一條通知消息,告知該字符無法被識別。同時,顯示屏107上會顯示一個屏幕圖像,提示用戶下載字形數(shù)據(jù)和詞典數(shù)據(jù)。所以,即使圖片識別存儲器105或存儲器104中既沒有存儲字形數(shù)據(jù)也沒有存儲詞典數(shù)據(jù),也可以識別一個字符,并顯示相關信息。因此,改善了用戶友好度。
可以選擇,不將詞典數(shù)據(jù)下載到信息處理裝置上,而是瀏覽互聯(lián)網(wǎng)上的詞典。互聯(lián)網(wǎng)上很多Web站點都提供記載有詞典數(shù)據(jù)的主頁。當請求相關信息時,可以進入Web站點的只可由注冊用戶瀏覽的Web頁面。這種情況下,用戶每一次請求相關信息時,都要輸入他/她的用戶ID和密碼。這樣就不太方便了。所以,可以將用戶ID和密碼記錄在存儲器104中。圖12所示為這種情況的示意圖,其中,信息處理裝置使用存儲器104中存儲的用戶ID和密碼,訪問包含詞典的Web站點。在本實例中,不同的用戶ID和密碼對應于不同的詞典數(shù)據(jù)。
圖13是使用詞典數(shù)據(jù)訪問包含詳細信息的Web站點的過程的流程圖。
在步驟S1301中,信息處理裝置獲取用戶ID和密碼,以訪問受限的Web站點。用戶ID和密碼可以通過數(shù)據(jù)通信接口108下載,從存儲媒體安裝,或使用輸入單元101輸入。用戶ID和密碼存儲在存儲器104中,例如,用戶ID和密碼寫在詞典數(shù)據(jù)106的一個頭部中。
進行一個或多個字符的字符串識別(步驟S1302)。從存儲器中讀取簡明信息并顯示(步驟S1303)。
如果CPU102接收到一個請求顯示詳細信息的信號(步驟S1304),CPU102就從存儲器104中讀取出用戶ID和密碼。在步驟S1306中,CPU102經(jīng)由數(shù)據(jù)通信接口108,將一個訪問信號、用戶ID和密碼發(fā)送到服務器。服務器接收到該訪問信號、用戶ID和密碼之后,對用戶進行身份認證。如果認證成功,則將詳細信息發(fā)送給該信息處理裝置。
在步驟S1307中,信息處理裝置經(jīng)由數(shù)據(jù)通信接口108接收詳細信息。在步驟S1308中,顯示屏107顯示該信息。
如上所述,用戶ID和密碼存放在存儲器104中,并可被發(fā)送到服務器。所以,用戶每次請求訪問受限Web站點時,就不必輸入ID和密碼了。這對用戶是友好的。
接下來,將描述一個存儲關于字符識別的歷史信息的實例。由于人的存儲容量是有限的,所以,人們可能會經(jīng)常忘記一個單詞的定義或相似情況,而一次又一次地查找其定義。在這種情況下,重復查找字符定義,既消耗時間,又消耗人力。
下面分別說明創(chuàng)建歷史信息的過程和使用歷史信息的過程。
首先描述創(chuàng)建歷史信息的過程。圖7所示為一個歷史表的實例,該歷史表作為歷史信息存儲在存儲器104中。如圖7所示,搜索單元109檢索的單詞及檢索這些單詞的時間點被作為歷史進行記錄。
列701中記錄的是在詞典數(shù)據(jù)列201中記錄的單詞,這些單詞的字符已經(jīng)被識別出。列702中記錄的是識別次數(shù),識別次數(shù)是各個單詞被識別時所用的次數(shù)。列703中記錄的是各個單詞被識別的時間點中最新的時間點。列704中記錄的是請求次數(shù),請求次數(shù)是請求各個單詞詳細定義所用的詳細信息請求的次數(shù)。列705中記錄的是請求各個單詞詳細定義的最新時間點。
圖8是描述字符識別執(zhí)行完畢之后創(chuàng)建如圖7所示的歷史表的過程的流程圖。步驟S406和S407對應于圖4中的步驟S406和S407,步驟S801至S804被插入到步驟S406和S407之間。
在步驟S406中,顯示詞典數(shù)據(jù)106中包含的識別字符的簡明信息,即典型翻譯或簡單翻譯。判定存儲器104是否已將識別字符(如一個單詞)作為歷史信息存儲(步驟S801)。如果包含該單詞,就執(zhí)行步驟S802。在步驟S802中,CPU102更新或增加相關的識別次數(shù),識別次數(shù)作為歷史信息存儲在列702中,該次數(shù)是該單詞已被識別的次數(shù)。在步驟S803中,將CPU102到達步驟S803的時間點記錄為最新識別時間點,在列703中,就是歷史信息。
如果在步驟S801中判定該單詞沒有作為歷史信息被存儲,執(zhí)行步驟S804。該單詞和最新識別時間點作為歷史信息被另外記錄。流程到達步驟S804的時間點,被作為最新識別時間點記錄在列703中。經(jīng)過以上過程,歷史表根據(jù)識別產(chǎn)生的歷史信息被更新。優(yōu)選為,將歷史信息與存儲器104中存儲的詞典數(shù)據(jù)關聯(lián)存放,這樣就可以使用歷史信息檢索一個單詞的意思或其他類似信息。例如,可以將歷史信息記錄在詞典數(shù)據(jù)的一部分(如頭部)中。
例如,如果請求次數(shù)大于2,則將通過互聯(lián)網(wǎng)下載的詳細信息存儲到詞典數(shù)據(jù)106中。如果請求的最新時間點是在大于六個月之前,CPU102進行控制以刪除詞典數(shù)據(jù)106中存儲的詳細信息。接著,我們描述使用已創(chuàng)建的歷史信息的過程。圖9所示為使用歷史信息顯示單詞定義的過程中所顯示的屏幕圖像的實例。
當顯示屏幕圖像901時,用戶可以按動該屏幕圖像右下方出現(xiàn)的菜單對應的按鈕。這樣,從屏幕圖像901切換到屏幕圖像902。在屏幕圖像902中可以選擇任何菜單。在這種情況下,如果選擇菜單項“(5)歷史表”,就從屏幕圖像902切換到屏幕圖像903。屏幕圖像903顯示一張歷史表。列出單詞、單詞已被識別的識別次數(shù)以及請求該單詞的相關詳細信息的請求次數(shù)。如果選擇顯示的單詞中的一個,如“recognition”,就從屏幕圖像903切換到屏幕圖像904。
屏幕圖像904顯示了“recognition”的詳細信息。在本實例中,“recognition”的詳細定義的請求次數(shù)是0。所以,通過互聯(lián)網(wǎng)獲取詳細信息。如果選擇“abalone”,就可以從詞典數(shù)據(jù)106中讀取詳細信息,因為“abalone”的詳細定義的請求次數(shù)是3。
在這種情況下,如果按下檢查對應的按鈕,就從屏幕圖像904切換到了屏幕圖像905。與屏幕圖像903一樣,屏幕圖像905顯示的是歷史表。雖然在屏幕圖像903中,“recognition”已被請求的請求次數(shù)是0,但在屏幕圖像905中,該請求次數(shù)被加1。
用戶可以隨時隨地檢查已經(jīng)識別一次的單詞的意思,而不必重新對該單詞進行識別。根據(jù)本實例,當用戶反復查找某個單詞時,他就可以在不訪問互聯(lián)網(wǎng)的情況下獲取詳細信息。這一點有助于改進用戶友好度。
當顯示圖9中所示的屏幕圖像時,用戶可以很容易地得知識別次數(shù)和請求次數(shù)。此外,用戶多次查找過的單詞被可見地標識。如果識別次數(shù)和請求次數(shù)按降序排列,用戶就可以標識出那些不容易記住的單詞。這樣,就可以鼓勵用戶有意識地記憶這些單詞。這對用戶是很友好的。
此外,簡明信息和詳細信息可以作為歷史信息相互獨立地存儲在存儲器104中。當用戶使用歷史信息時,如果用戶既可以選擇簡明信息也可以選擇詳細信息,則用戶友好度將得到進一步的改善。需要指出的是,歷史信息并不限于圖7中所顯示的內容。任何信息,只要跟歷史有關,都可以作為歷史信息。
此外,CPU執(zhí)行識別操作之后,用戶可以獲悉歷史信息是否是可用的。例如,當顯示識別結果時,顯示屏107上也可以顯示“歷史信息可用”的通知或其他類似消息。歷史信息可用或不可用的通知消息不限于顯示字符、圖標或標號,也可以是從擴音器和其它類似設備中廣播出的聲音。根據(jù)此通知,用戶可得知她/他以前檢查過同樣的單詞,并且可以去檢查歷史信息。這對用戶是友好的。
此外,該信息處理裝置還可以包括一個通過全球定位系統(tǒng)(GPS)或類似技術實現(xiàn)的位置信息獲取單元。位置信息獲取單元所獲取的位置信息被作為歷史信息存儲在存儲器104中。這種情況下,可以方便地檢查單詞已被識別的地點。當用戶再次訪問其名字已被作為歷史信息記錄的地點時,他就可以得知這一事實,以及在這一地點識別的單詞以及該單詞的意思。
圖14是一個信息處理裝置的外觀示意圖。該信息處理裝置可以通過鉸鏈1403折疊起來,這樣,包含顯示屏107的殼體200和包含輸入單元101的殼體300就會互相貼合。軸1403包括一個可以旋轉的照相機。
CPU102檢測該移動蜂窩電話處于如圖14(1)所示的翻開狀態(tài)還是如圖14(2)所示的疊合狀態(tài)。例如,該信息處理裝置可以在殼體200中集成一個磁體,在殼體300中集成一個霍爾效應部件。CPU102根據(jù)該霍爾效應部件提供的電壓電平,檢測該移動蜂窩電話是處于翻開狀態(tài)還是疊合狀態(tài),該磁體施加在該霍爾效應部件上的一個磁場。用于檢測的裝置不限于此例,也可以使用基于凸面體部件和凹面體部件嚙合的感應器作為折疊檢測單元。
除了信息處理裝置翻開時經(jīng)常使用的顯示屏107,該信息處理裝置還包括一個子顯示屏1407,當該信息處理裝置折疊起來(疊合)的時候,可以看到該子顯示屏。
普通圖像拍攝按鈕1401和識別圖像拍攝按鈕1402位于殼體300的側面。
當按下普通圖像拍攝按鈕1401時,照相機103生成拍攝對象的一張圖象,生成的圖象被保存在存儲器104中,并在必要的時候顯示。當按下識別圖像拍攝按鈕1402時,照相機103生成識別對象的圖象。CPU102識別字符之后,就將識別結果顯示在顯示屏107和/或子顯示屏1407上。
如上所述,由于包括專用于識別模式的按鈕,和普通的圖像拍攝按鈕,所以用戶可以很方便地選擇任一模式,這對用戶很友好。此外,當兩個按鈕位于殼體300的側面時,如圖14所示,不管該信息處理裝置是翻開的還是疊合的,這兩個按鈕都可以相同的方式被使用。這一點改善了用戶友好度。此外,如圖14(2)所示,由于操作鍵1408a和1408b位于殼體300的側面的位置,所以,即使信息處理裝置處于疊合狀態(tài),用戶也可以操作該信息處理裝置。這樣提高了用戶友好度。
需要指出的是,普通圖像拍攝按鈕1401和識別圖像拍攝按鈕1402優(yōu)選為由不同的按鈕實現(xiàn)。但是,也可以用同一個按鈕實現(xiàn)普通圖像拍攝按鈕1401和識別圖像拍攝按鈕1402。如果用同一個按鈕實現(xiàn)普通圖像拍攝按鈕1401和識別圖像拍攝按鈕1402,則必須區(qū)分操作此按鈕進行照相和操作此按鈕進行識別的方式。例如,可以根據(jù)按鈕被按下的時間間隔或按鈕被按動的次數(shù),在普通圖像拍攝模式和識別模式之間進行切換。此外,當普通圖像拍攝按鈕和識別圖像拍攝按鈕使用同一個按鈕時,可以節(jié)省空間,而且信息處理裝置可以設計地很緊湊??梢酝ㄟ^附著在移動蜂窩電話100上的任何一個傳感器實現(xiàn)普通圖像拍攝按鈕1401和識別圖像拍攝按鈕1402,只要用戶能操縱這兩個按鈕即可。
雖然已經(jīng)描述了普通圖像拍攝按鈕1401和識別圖像拍攝按鈕1402都位于殼體的側面,但本發(fā)明并不限于這種結構。只要信息處理裝置在疊合的時候按扭處于用戶可以操作的位置即可,例如,按鈕可以位于信息處理裝置的背面。在這種情況下,信息處理裝置的背面指的是與顯示屏107所處的信息處理裝置的一面相對的一面,并且,在信息處理裝置折疊(疊合)的時候能夠看到該面。
下面將結合圖15中的流程圖,描述當信息處理裝置處于疊合狀態(tài)時執(zhí)行圖片識別功能的示例性的過程。
首先,在步驟S1501中,信息處理裝置等待用戶使用輸入單元101中包含的按鍵進行輸入。當CPU102檢測到一個表示請求激活照相機的按鍵輸入時(步驟S1502),CPU102判斷該信息處理裝置處于翻開狀態(tài)還是疊合狀態(tài)(步驟S1503)。
如果信息處理裝置處于疊合狀態(tài),CPU102在子顯示屏1407上控制圖像的顯示(步驟S1504)。在本描述中,省略了信息處理裝置處于翻開狀態(tài)時在步驟S1503中執(zhí)行的過程。
當用戶按下快門按鈕時,指示拍攝圖象的信號被傳輸?shù)紺PU102(步驟S1505)。CPU102就將照相機103生成(轉化)的對象的圖片信息保存在存儲器104中(步驟S1506)。
CPU102執(zhí)行圖片識別操作,圖片信息中包含的字符被識別,識別結果被保存在存儲器104中(步驟S1507)。搜索單元109讀取識別結果,并從存儲在存儲器104中的詞典數(shù)據(jù)06中的列201中搜索一個符合的單詞。識別結果及其簡明信息顯示在子顯示屏1407上(步驟S1508)。
如果CPU102檢測到該信息處理裝置處于翻開狀態(tài)(步驟S1509),執(zhí)行步驟S1510。CPU102讀取從詞典數(shù)據(jù)中檢索出的單詞的相關URL,并通過數(shù)據(jù)通信接口108發(fā)送一個指示信號(步驟S1510),利用該指示信號連接到該URL。在步驟S1511中,CPU102通過數(shù)據(jù)通信接口108讀取該URL所保存的主頁的內容,并將該主頁的內容顯示在顯示屏107上。
圖16是一些屏幕圖像的實例。如果用戶將該信息處理裝置從疊合狀態(tài)(信息處理裝置處于疊合狀態(tài))改變?yōu)榉_狀態(tài)(信息處理裝置不處于疊合狀態(tài)),則用戶不必進行任何鍵盤操作,就可以將通過數(shù)據(jù)通信接口108接收的詳細信息顯示在顯示屏107上。在屏幕圖像1601至1603中,包含在屏幕圖像左下方的“菜單”指示對應于按鈕1408a,而包含在屏幕圖像右下方的“識別”指示對應于按鈕1408b。例如,當“菜單”出現(xiàn)在屏幕圖像的左下方時,我們稱按鈕1408a為“菜單”按鈕。
屏幕圖像1601是識別模式下子顯示屏1407上顯示的屏幕圖像的實例。如果作為“識別”按鈕的按鈕1408b被按下,就會從屏幕圖像1601切換到屏幕圖像1602。
屏幕圖像1602表明,“Recognition”已被選擇為識別對象。該屏幕圖像中除“Recognition”之外的部分變成了黑色,以高亮“Recognition”。此外,由于將屏幕圖像中字符之外的部分變成了黑色,可以防止識別模式被誤用的情況,如隱性成像。如果按下作為“確定”按鈕的按鈕1408b,就從屏幕圖像1602切換到屏幕圖像1603。
屏幕1603給出了識別結果以及識別出的字符串的簡明信息。
如果在這種狀態(tài)下移動蜂窩電話是翻開的,屏幕圖像1604就出現(xiàn)在顯示屏107上。屏幕圖像1604是表示識別出的字符串的詳細信息的屏幕圖像的一個實例,。
如上所述,該信息處理裝置處于疊合狀態(tài)時也可以識別字符串。這樣就節(jié)省了每次進行字符識別時打開該信息處理裝置的工作,并可以更方便地進行字符識別。此外,當用戶希望獲悉詳細信息時,如果用戶打開信息處理裝置,即使不操縱輸入單元101,顯示屏107上也會顯示詳細信息。這一點對用戶來說是很友好的。
下面將說明一個編輯識別結果的實例。例如,CPU102對一張紙上寫的“Recognition”進行字符識別。如果識別結果為“Reconifiom”,可以對該結果進行編輯。
圖17是在編輯識別結果過程中顯示的屏幕圖像的實例。
屏幕圖像1701是顯示屏107上顯示的屏幕圖像的一個實例。在本實例中,CPU102將一個或多個字符的字符串“Recognition”錯誤地識別為“Reconifiom”。搜索單元109從詞典數(shù)據(jù)106中搜索一個與“Reconifiom”最相似的單詞,于是就將“reconfirm”作為搜索結果顯示出來。這里,如果按下菜單按鈕,就從屏幕圖像1701切換到屏幕圖像1702。
屏幕圖像1702顯示出一個菜單。這里,如果選擇菜單項“(1)編輯結果”,并按下確定按鈕,就從屏幕圖像1702切換到屏幕圖像1703。屏幕圖像1703是幫助編輯識別結果的屏幕圖象。識別結果顯示的域1705中顯示出一個光標1706。光標1706用于選擇欲被編輯的字符所處的位置。通過使用輸入單元101,可以對字符進行編輯。在本實例中,刪除“m”,并輸入“g”和“n”。如果在此狀態(tài)下按下搜索按鈕,搜索單元109就會從詞典數(shù)據(jù)106中搜索符合的單詞。然后,將符合的單詞顯示在搜索結果域中。屏幕圖像1704就是表示搜索結果的屏幕圖像的一個實例。
如上所述,當識別結果不正確時,CPU102無需執(zhí)行字符識別。例如,當一張包含一個或多個字符的字符串的報紙很破爛時,即使多次執(zhí)行字符識別,CPU也可能錯誤地識別字符串。這種情況下,用戶會反復使用OCR功能。按照本實例,用戶可以在不重復執(zhí)行OCR功能的情況下更正識別結果。這對于用戶是很友好的。
在前面的例子中,當按下搜索按鈕時,搜索單元109從詞典數(shù)據(jù)106中搜索一個與識別結果最接近的單詞。可以選擇,當增加或刪除一個字符時,搜索單元109可以搜索最接近的單詞。這種情況下,用戶想顯示搜索結果時不必每次都按下搜索按鈕。當識別結果中包括多個被錯誤識別的字符時,用戶可以在不對所有被錯誤識別的字符進行編輯的情況下獲取正確的單詞。這一點對用戶是很友好的。
下面描述將識別結果和/或與該結果有關的信息發(fā)送到其他裝置的示例性的過程。識別結果顯示之后,用戶操作輸入單元101,以調用郵件功能(例如,按下一個郵件運行按鍵)。接收到輸入信號的CPU102調用存儲器104中駐留的郵件軟件,并在顯示屏107或顯示屏1407上顯示郵件創(chuàng)建屏幕圖像。與此同時,CPU102將識別結果和/或相關的信息自動插入到郵件創(chuàng)建屏幕圖像的文本域中。
此外,用戶可以從存儲器中存儲的所有信息中選擇地址信息(如名字、電話號碼或郵件地址),并將所選擇的地址信息插入到接收方的地址域中。
如上所述,通過執(zhí)行一個簡單的操作,用戶就可以發(fā)送識別結果。從而改善了用戶友好度。此外,如果標題名(如“OCR結果”)可被自動插入到標題域中,就可以進一步節(jié)省數(shù)據(jù)輸入的負擔,這將進一步改善用戶友好度。
此外,如果識別出一個郵件地址,該地址會被作為地址自動插入到郵件創(chuàng)建屏幕圖像的地址域中。優(yōu)選為,在CPU102中包括編輯功能,因為用戶可能希望將郵件地址插入到文本域中。這種編輯功能將結合圖18進行說明。
屏幕圖像(1)表示識別圖像及識別結果。如果按下菜單按鈕,就從屏幕圖像(1)切換到屏幕圖像(2)。屏幕圖像(2)幫助用戶選擇使用識別結果“yamazaki@xxx.jp”的場合。當選擇菜單項“(2)創(chuàng)建郵件”時,就從屏幕圖像(2)切換到屏幕圖像(3)。屏幕圖像(3)讓用戶選擇將識別結果插入到郵件創(chuàng)建屏幕圖像的哪個域中。如果選擇“(3)文本”,就從屏幕圖像(3)切換到郵件創(chuàng)建屏幕圖像,即屏幕圖像(4),在該屏幕圖像中,識別結果被分配到郵件文本中。
如上所述,用戶可以選擇將識別結果插入到郵件中的哪個部分。所以,表示識別結果的屏幕圖像被顯示之后,如果進行了幾次輸入,屏幕圖像就被切換到郵件創(chuàng)建屏幕圖像,其中,可以將識別結果插入到文本域中。從而改善了用戶友好度。
此外,當表示菜單的屏幕圖像(2)被顯示的時候,可以根據(jù)作為識別結果的字符串的類型確定光標位置。也就是說,如果識別結果中包含“@”,CPU102就會將識別結果視為一個郵件地址。如果識別結果中包含“http”,CPU102就會將識別結果視為一個URL。如果識別結果被視為郵件地址,當顯示屏幕圖像(2)時,光標定位在菜單項的“(2)創(chuàng)建郵件”上;如果識別結果被視為一個URL,光標定位在菜單項的“(1)互聯(lián)網(wǎng)”上。如果在顯示屏107上如此顯示光標,就可以節(jié)省在屏幕圖像(2)中選擇菜單項的工作,從而進一步改善用戶友好度。
此外,當識別結果被視為一個郵件地址時,如果用戶希望將此郵件地址注冊到地址本中,用戶可以通過屏幕圖像(2)選擇菜單項“(4)注冊到地址本中”。即使在這種情況下,也可以選擇將作為識別結果的郵件地址插入到地址本的哪個域中,從而提供與前述相同的優(yōu)點。
郵件軟件提供的郵件創(chuàng)建屏幕圖像被認為是包括地址域、標題域和文本域。本發(fā)明不限于郵件創(chuàng)建屏幕圖像的這種結構。即便還包括任何其他域,如果在其中自動插入相關信息,也會節(jié)省輸入的工作。這對于用戶是很友好的。
此外,識別結果(如,一個URL)被描述為會被自動插入到郵件創(chuàng)建屏幕圖像中的任何域中。用戶可以選擇使用輸入單元101自行輸入一個注釋或其他文字。在這種情況下,當將識別結果傳送給被叫方的時候,用戶不僅可以發(fā)送識別結果,而且還可以發(fā)送關于該結果的注釋或其他文字。此時,如果使用預存在存儲器104中的任意固定形式的語句或象形圖,將進一步改善用戶友好度。
本發(fā)明不限于用戶希望知道單詞意思及其詳細用法的情況。例如,也可以提供關于各個領域專用術語的信息,如體育、電影、歷史、餐飲、科技、恐龍、動植物、娛樂等。這在種情況下,可以增加可用術語信息的種類,從而改善用戶友好度。當可用信息量很大的時候,如果用戶閱讀雜志或者報紙、或散步時對某個單詞感興趣,并希望獲知該單詞的詳細信息,用戶就可以立即獲取該單詞的意思。這對用戶來說是相當友好的。
此外,當用戶希望獲知關于“恐龍”的詳細信息時,如果他獲取到關于植物“恐龍”的詳細信息,用戶就會很不滿意。當請求詳細信息時,在顯示屏107上會顯示一條消息,例如,“你希望獲知哪種類型的詳細信息”。如果通過一個屏幕圖像或其他類似物,讓用戶選擇各種類型中的任何類型,將會進一步改善用戶友好度。
下面將描述一個使用單詞間的同現(xiàn)關系獲知識別出的單詞的確切意思的實例?!巴F(xiàn)”指的是多個單詞同時出現(xiàn)于同一文檔中。通常情況下,一個單詞會有多個意思。如果將詞典中定義的多個意思按照原樣全部顯示出來,用戶必須閱讀上下文并思考識別出的單詞在這種上下文環(huán)境中的意思。如果這個單詞被理解錯誤,包含該單詞的句子就會被理解錯誤。本實例試圖解決此問題。圖19所示為用于搜索確切定義的系統(tǒng)的實例。
服務器1900包括一個服務器CPU1902;一個同現(xiàn)關系數(shù)據(jù)庫1903;一個服務器存儲器1904;一個服務器圖片識別存儲器1905;服務器詞典數(shù)據(jù)1906;一個服務器數(shù)據(jù)通信接口1908;一個服務器搜索單元1909;以及一個用戶注冊數(shù)據(jù)庫1910。
服務器數(shù)據(jù)通信接口1908執(zhí)行通信功能,從而使得服務器1900能夠通過數(shù)據(jù)網(wǎng)絡(如互聯(lián)網(wǎng))與其他服務器進行通信。服務器CPU1902根據(jù)服務器存儲器1904中存儲的程序來起作用,并響應于通過服務器數(shù)據(jù)通信接口1908發(fā)送的信號,控制服務器中的相應部件。
同現(xiàn)關系數(shù)據(jù)庫中包含表示同現(xiàn)關系的數(shù)據(jù)。如圖20所示,同現(xiàn)關系數(shù)據(jù)庫包括單詞、單詞的定義、同現(xiàn)單詞以及每個單詞的定義與同現(xiàn)單詞組合使用的百分比。參考圖20,其中一個單詞是“character”,“character”的定義將會是“字符”和“人”。
同現(xiàn)關系數(shù)據(jù)庫1903中存放著與多個單詞相關的數(shù)據(jù)項,以及各個單詞的定義以及各個定義與同現(xiàn)單詞組合使用的概率。
如果識別出的單詞與其他單詞同時出現(xiàn),就可以使用同現(xiàn)關系數(shù)據(jù)庫1903去比較單詞定義與各個同現(xiàn)單詞組合使用的概率。然后,找到所識別單詞的最確切定義。例如,如果“character”和單詞“recognition”同時出現(xiàn),在組合中使用定義“字符”的百分比是0.95,此外,在組合中使用定義“人”的百分比只有0.05。在這種情況下,將在組合中使用的百分比高的“字符”作為“character”的定義。通過數(shù)據(jù)通信接口接收的數(shù)據(jù)和服務器1900要處理的其他數(shù)據(jù)存儲在服務器存儲器1904中。服務器圖片識別存儲器1905中存儲了一個軟件程序,該軟件程序中的OCR功能將由服務器CPU1902執(zhí)行。
存儲器104中存儲的服務器詞典數(shù)據(jù)1906包括多個字符,如單詞、該單詞的相關信息(如記載有該單詞各種定義、用法和實例的各主頁URL)以及關于該單詞的圖片或聲音。
服務器搜索單元1909根據(jù)一個單詞及同現(xiàn)單詞,參考同現(xiàn)關系數(shù)據(jù)庫1903,并選擇出該單詞的確切定義。
用戶注冊數(shù)據(jù)庫1901中包含用戶ID和密碼,根據(jù)該用戶ID和密碼,用戶可被認證為允許訪問服務器1900的用戶。
接下來,結合圖21中的流程圖描述該系統(tǒng)中移動蜂窩電話要執(zhí)行的過程。
在步驟S2101中,像取景器一樣,顯示屏107顯示照相機103輸出的圖象。當CPU102檢測到快門按鈕被按下的時候(步驟S2102),照相機103輸出圖片信息(步驟S2103)。CPU102執(zhí)行圖片識別操作(步驟S2104)。在步驟S2105中,對識別位置和識別單詞進行采樣,識別位置就是字符的位置,亦即照相機103生成的圖片信息中的識別對象,而識別單詞就是搜索單元109在步驟S2105中執(zhí)行檢索的搜索結果。
然后,經(jīng)由輸入單元101向CPU102發(fā)送一個指示訪問服務器1900的訪問信號。CPU102依次經(jīng)由數(shù)據(jù)通信接口108將該訪問信號發(fā)送給一個預定的服務器(步驟S2107)。
然后,接收到該訪問信號的服務器1900發(fā)送一個輸入請求信號,利用該輸入請求信號請求輸入用戶ID及與該用戶ID相關的密碼。當信息處理裝置100收到該請求信號時(步驟S2108),CPU102在顯示屏107上顯示輸入屏幕圖像,通過該圖像輸入用戶ID和密碼。通過輸入屏幕圖像輸入用戶ID和密碼之后,將其發(fā)送到服務器1900(步驟S2109)。這里,用戶輸入的用戶ID和密碼用于用戶身份認證。但是,本發(fā)明不限于此種認證方式,只要可以實現(xiàn)用戶認證即可。例如,聲波紋、指紋、虹膜都可用于認證。
CPU102檢驗從服務器接收到的信號指示認證成功或失敗(步驟S2110)。如果該信號指示認證失敗,在顯示屏107上重新顯示輸入屏幕圖像。如果該信號指示認證成功,則將照相機103生成的圖像、識別位置及識別單詞發(fā)送到服務器1900(步驟S2111)。
此后,當CPU102從服務器1900接收到識別單詞的確切定義時,CPU102在顯示屏107上顯示該確切定義(步驟S2112和S2113)。
下面將參考圖22的流程圖描述本系統(tǒng)中服務器1900執(zhí)行的過程。
當服務器1900接收到來自信息處理裝置100的訪問信號時(步驟S2201),服務器請求信息處理裝置輸入用戶ID和密碼(步驟S2201)。當接收到來自信息處理裝置100的用戶ID和密碼時(步驟S2202),服務器CPU1902參考用戶注冊數(shù)據(jù)1910。如果接收到的用戶ID和密碼與用戶注冊數(shù)據(jù)1910中包含的一個用戶ID和密碼匹配,服務器CPU1902就通過服務器數(shù)據(jù)通信接口1908告知信息處理裝置100該用戶已經(jīng)通過認證(步驟S2204)。然后,接收來自信息處理裝置100的圖像、識別位置和識別單詞(步驟S2205)。
此后,服務器CPU1902識別接收圖像中包含的字符。圖23所示為接收圖像的實例。在識別過程中,服務器CPU1902對圖像中包含的所有單詞進行采樣,標識出識別位置。采樣區(qū)域的邊框剪裁的單詞不被視為識別對象。
如圖23中圖像的實例所示,包括單詞2301的帶陰影的單詞不被視為識別對象。那些未被采樣區(qū)域的邊框剪裁的其他單詞會被識別,如單詞2303“The”。服務器搜索單元1909從服務器詞典數(shù)據(jù)1906中搜索與識別單詞相符合或最接近的單詞(步驟S2206)。
然后,計算識別對象單詞的同現(xiàn)單詞的數(shù)目n(步驟S2207),根據(jù)從信息處理裝置接收到的識別位置和識別單詞,標識出識別對象單詞。在步驟S2208中,如果同現(xiàn)單詞的數(shù)目大于或等于1,則判斷同現(xiàn)關系數(shù)據(jù)庫1903中是否包含該識別對象單詞(步驟S2209)。如果包含該識別對象單詞,則判斷同現(xiàn)關系數(shù)據(jù)庫1903的列2004中是否包含與同現(xiàn)單詞相符合的單詞(步驟S2210)。
如果同現(xiàn)關系數(shù)據(jù)庫1903中包含與同現(xiàn)單詞相符合的單詞,則確定識別對象單詞的最確切定義(步驟S2211)。
在確定過程中,計算識別對象單詞的各個定義與同現(xiàn)關系數(shù)據(jù)庫1903中包含的同現(xiàn)單詞組合使用的概率。例如,假設識別對象單詞為“character”,而同現(xiàn)單詞是“string”和“recognition”。在這種情況下,如果“string”與“character”同時出現(xiàn),則定義“字符”與“string”組合使用的百分比為0.90,如果“recognition”與“character”同時出現(xiàn),則定義“字符”與“recognition”組合使用的百分比是0.95。這兩個百分比之和為1.85。此外,定義“人”與“string”和“recognition”分別組合使用的概率之和為0.08。使該和最大的那個定義將被采納為最確切的定義。在這種情況下,確切定義是通過累加百分比確定的。但本發(fā)明不限于該方法,也可以選擇通過乘、除或減的組合來確定確切定義。最后,將確切定義發(fā)送給信息處理裝置(步驟S2212)。
如果在步驟S2208中判斷同現(xiàn)單詞的數(shù)目為0,則執(zhí)行步驟S2213。從服務器詞典數(shù)據(jù)1906中檢索一條典型定義,然后在步驟S22 14中將其發(fā)送給該信息處理裝置。
此外,如果在步驟S2209中判斷識別對象單詞未包含在同現(xiàn)關系數(shù)據(jù)庫1903中,或者,如果在步驟S2210中判斷與同現(xiàn)單詞符合的單詞沒有包含在同現(xiàn)單詞數(shù)據(jù)庫1903中,則執(zhí)行步驟S2213。將典型定義發(fā)送給該信息處理裝置。
根據(jù)前面的過程,在步驟S2211中確定了確切定義??梢赃x擇確定多個定義,如,計算出一個單詞與同現(xiàn)單詞組合使用的百分比之和的六個最大值。該數(shù)據(jù)被稱為定義顯示順序數(shù)據(jù)。圖25(1)所示為“character”的未排序的定義,而圖25(2)所示為根據(jù)意思確切程度的排序定義。
這些定義以定義顯示順序數(shù)據(jù)的形式被發(fā)送到該信息處理裝置。CPU102根據(jù)定義顯示順序數(shù)據(jù)將這些定義顯示在顯示屏107上。
然后,用戶就可以獲悉識別對象單詞的定義,并且,用戶還可以很容易地獲知識別對象單詞在特定的上下文中可能具有的定義。這一點對用戶是很友好的。
此外,服務器1900選擇的確切定義也可能是不正確的。即使在這種情況下,也會按順序列出該確切定義和其他定義,如圖25所示,這會極大地幫助用戶根據(jù)上下文去判斷一個單詞的定義。
圖24是該信息處理裝置和服務器所執(zhí)行的處理順序的實例。如圖中所示,CPU102進行字符識別(步驟S2401),并對表示識別對象單詞的數(shù)據(jù)和表示識別對象單詞位置的數(shù)據(jù)進行采樣(步驟S2402)。然后,用戶使用輸入單元101來指示獲取識別對象單詞的詳細信息。CPU102發(fā)送一個訪問信號,利用該訪問信號將信息處理裝置連接到服務器(步驟S2403)。
響應于該訪問信號,服務器向信息處理裝置發(fā)送一個用戶ID/密碼請求信號,請求用戶ID和密碼(步驟S2404和S2405)。響應于該用戶ID/密碼請求信號,CPU102進行控制從而將用戶通過輸入屏幕圖像或其他類似物輸入的用戶ID和密碼經(jīng)數(shù)據(jù)通信接口108發(fā)送給服務器(步驟S2406)。
然后,服務器檢查接收的用戶ID和密碼,以判斷該用戶是否為授權的注冊用戶。如果判斷結果顯示該用戶為授權的注冊用戶(有效的),則服務器1900發(fā)送表示認證成功的數(shù)據(jù)。如果用戶被視為未授權用戶(無效的),服務器發(fā)送表示認證失敗的數(shù)據(jù)(步驟S2407到S2409)。這里,我們假設認證是有效的。
接收到認證成功消息的信息處理裝置向服務器發(fā)送生成的圖像、以及該圖像中所包含的識別對象單詞和該識別對象單詞的位置(步驟S2410和S2411)。
如前所述,接收到該圖像、識別對象單詞和該識別對象單詞的位置的服務器標識該圖像中包含的識別對象單詞(步驟S2413)。對識別對象單詞的同現(xiàn)單詞進行采樣(步驟S2412至S2414)。然后,參考服務器中的同現(xiàn)關系數(shù)據(jù)庫,從而將表示該識別對象單詞確切定義的數(shù)據(jù)發(fā)送到信息處理裝置(步驟S2415和S2416)。
信息處理裝置在顯示屏107上顯示該確切定義(步驟S2417和S2418)。
然后,用戶就可以獲知與上下文匹配的某個單詞的確切定義,該功能對用戶是很友好的。此外,服務器的吞吐量和存儲容量通常都大于信息處理裝置,服務器的存儲器中存儲了同現(xiàn)關系數(shù)據(jù)庫,所以需要通過使用該數(shù)據(jù)庫確定最優(yōu)翻譯。這樣,就減輕或減少了移動蜂窩電話的處理量負荷及其必須提供的存儲容量。因此,在吞吐量和存儲容量方面實現(xiàn)了系統(tǒng)均衡。但是,本發(fā)明不限于該實例,信息處理裝置也可以具有同現(xiàn)關系數(shù)據(jù)庫,并在不連接服務器的情況下搜索確切定義。
此外,如果使用前述的處理信息的服務器提供確切定義服務或其他服務,每個月都可以得到穩(wěn)定的收入。從經(jīng)濟角度考慮,這是實際可行的。
此外,即使不免費或低價向用戶提供該服務,也可以跟廣告代理訂立合同,從而以廣告費作為收入。在這種情況下,服務器可以在確切定義之后增加廣告信息,并將該確切定義發(fā)送給信息處理裝置,信息處理裝置將確切定義和廣告信息一起顯示。與此同時,服務器也發(fā)送位置數(shù)據(jù),以使廣告信息和確切定義在顯示時不會出現(xiàn)重疊現(xiàn)象。信息處理裝置根據(jù)位置數(shù)據(jù)顯示廣告和確切定義。所以,用戶看到的確切定義和廣告信息不會重疊或共存。
需要指出的是,用于實現(xiàn)前述實例功能的軟件不必預先存儲到信息處理裝置的存儲器中。而是用戶在購買信息處理裝置之后,通過使用互聯(lián)網(wǎng)或記錄媒介在信息處理裝置上安裝軟件。在這種情況下,不需要重新購買另一個信息處理裝置。由于可以在已購買的信息處理裝置中增添新功能,從而節(jié)省開支。
這里所說的“記錄媒介”一詞指的是實現(xiàn)該處理所采用的任何媒介。這樣的媒介可以有多種多樣的形式,包括但不僅限于非揮發(fā)性媒介、揮發(fā)性媒介和傳輸媒介。例如,非揮發(fā)性媒介包括光纖或磁盤;揮發(fā)性媒介包括動態(tài)存儲器;傳輸媒介包括同軸電纜、銅線、光纖以及在這些物理鏈路中傳輸?shù)碾娦盘?、電磁信號或光信號等。傳輸媒介的形式也可以是在無線頻率和紅外無線數(shù)據(jù)通信中產(chǎn)生的電信號或電磁信號、聲波或光波。機器可讀取得媒介一般包括軟盤、移動盤、硬盤、磁盤、磁帶及其它磁體媒介、CD-ROM、DVD及其它光媒介、RAM、PROM、EPROM、FLASH-EPROM及其他存儲芯片或磁頭,以及傳輸數(shù)據(jù)或指令的載波。
此外,本發(fā)明不限于以上實例,所披露的原理和創(chuàng)新特性包含很多種技術。此外,上述實例也被包括在內。
權利要求
1.一種信息處理裝置,包括一個照相機,其輸出圖片信息;一個存儲器,其存儲與至少一個的一個或多個字符的字符串相關的簡明信息;一個數(shù)據(jù)通信接口,用于經(jīng)由網(wǎng)絡進行通信;以及一個CPU,其識別由該照相機輸出的圖片信息中包含的一個或多個字符的字符串,并響應于用戶的字符識別請求,顯示識別結果及與該被識別的字符串相關的簡明信息,以及當用戶請求與該被識別的字符串相關的詳細信息時,控制該數(shù)據(jù)通信接口經(jīng)由網(wǎng)絡進行通信,并顯示由該數(shù)據(jù)通信接口接收的附加信息。
2.如權利要求
1所述的信息處理裝置,其中,該存儲器存儲用于經(jīng)由網(wǎng)絡通信的訪問信息,并且當用戶請求詳細信息時,根據(jù)存儲在該存儲器中的訪問信息,該數(shù)據(jù)通信接口經(jīng)由網(wǎng)絡進行通信。
3.如權利要求
1所述的信息處理裝置,其中,用戶通過操作一個快門按鈕請求該字符識別。
4.如權利要求
2所述的信息處理裝置,其中,所述訪問信息包含一個主頁地址。
5.如權利要求
2所述的信息處理裝置,其中,所述訪問信息包含用于經(jīng)由網(wǎng)絡通信的ID或密碼。
6.如權利要求
1所述的信息處理裝置,還包括一個圖片識別存儲器,其存儲用于CPU在圖片識別中的比較的字形。
7.如權利要求
6所述的信息處理裝置,其中,該圖片識別存儲器存儲由該數(shù)據(jù)通信接口接收的字形。
8.如權利要求
1所述的信息處理裝置,其中,該存儲器存儲包括識別執(zhí)行次數(shù)、用戶請求詳細信息的次數(shù)及識別或請求詳細信息的最新時間點中的至少一個的歷史數(shù)據(jù)。
9.如權利要求
1所述的信息處理裝置,其中,當用戶請求詳細信息的次數(shù)達到一個預定值時,該存儲器存儲由該數(shù)據(jù)通信接口接收的詳細信息。
10.如權利要求
9所述的信息處理裝置,其中,當用戶請求詳細信息的最新時間點是在預定時間之前時,該存儲器刪除所述詳細信息。
11.如權利要求
1所述的信息處理裝置,其中,所述CPU包括郵件發(fā)送功能,以通過該數(shù)據(jù)通信接口將郵件發(fā)送給另一設備,并在識別結果顯示后當用戶輸入郵件發(fā)送功能的激活請求時,控制該數(shù)據(jù)通信接口發(fā)送包含識別結果或簡明信息的郵件。
12.如權利要求
1所述的信息處理裝置,其中,所述附加信息與該被識別的字符串有關。
13.如權利要求
1所述的信息處理裝置,其中,所述附加信息是關于被識別的字符串的詳細信息。
14.如權利要求
13所述的信息處理裝置,其中,所述被識別的字符串是一個單詞,而所述詳細信息則是包含該單詞定義的詞典數(shù)據(jù)。
15.如權利要求
14所述的信息處理裝置,其中,所述詞典數(shù)據(jù)中包含該單詞的用法。
16.如權利要求
1所述的信息處理裝置,其中,所述被識別的字符串是一個單詞,所述簡明信息是該單詞的簡明定義,所述附加信息是該單詞的詳細定義。
17.一種信息處理裝置,包括一個圖片接口,其向該信息處理裝置輸入圖片信息;一個存儲器,其存儲關于至少一個的一個或多個字符的字符串的第一信息;一個數(shù)據(jù)通信接口,用于經(jīng)由網(wǎng)絡進行通信;一個CPU,其識別該圖片接口輸入的圖片信息中包含的一個或多個字符的字符串,并響應于用戶的字符識別請求,顯示識別結果及關于該被識別的字符串的第一信息,以及當用戶請求關于該被識別的字符串的更多信息時,控制該數(shù)據(jù)通信接口經(jīng)由網(wǎng)絡進行通信,并且顯示由該數(shù)據(jù)通信接口接收的第二信息。
18.一種包括第一殼體和第二殼體、并且能被折疊使得第一殼體和第二殼體相互貼合的信息處理裝置,包括一個圖片接口,其向該信息處理裝置輸入圖片信息;一個存儲器,其存儲與至少一個的一個或多個字符的字符串相關的信息;一個數(shù)據(jù)通信接口,用于經(jīng)由網(wǎng)絡進行通信;第一顯示屏,當該信息處理裝置處于未被折疊的翻開狀態(tài)時,該第一顯示屏位于可見的位置;第二顯示屏,當該信息處理裝置處于被折疊的疊合狀態(tài)時,該第二顯示屏位于可見的位置;一個CPU,其識別該圖片接口輸入的圖片信息中包含的一個或多個字符的字符串,并響應于疊合狀態(tài)下的用戶的字符識別請求,在該第二顯示屏上顯示識別結果及與該被識別的字符串相關的信息,以及當用戶將該信息處理裝置從疊合狀態(tài)改變?yōu)榉_狀態(tài)時,控制該數(shù)據(jù)通信接口經(jīng)由網(wǎng)絡進行通信,并在該第一顯示屏上顯示由該數(shù)據(jù)通信接口接收的附加信息。
19.如權利要求
18所述的信息處理裝置,還包括一個輸出圖片信息的照相機,其中由該照相機輸出的圖片信息被輸入到該圖片接口。
20.一種信息處理方法,包括以下步驟存儲關于至少一個的一個或多個字符的字符串的第一信息;響應于用戶的字符識別請求,識別所接收圖片信息中包含的一個或多個字符的字符串;顯示識別結果及關于該被識別的字符串的第一信息;當用戶請求關于該被識別的字符串的更多信息時,經(jīng)由網(wǎng)絡進行通信,以獲取第二信息;顯示經(jīng)由網(wǎng)絡接收的該第二信息。
21.如權利要求
20所述的信息處理方法,其中,所述第一信息是關于被識別的字符串的簡明信息,所述第二信息是關于被識別的字符串的詳細信息。
22.一種用于控制包括第一殼體和第二殼體、并能夠折疊使得第一殼體和第二殼體相互貼合的信息處理裝置的方法,包括以下步驟存儲關于至少一個的一個或多個字符的字符串的第一信息;如果該信息處理裝置處于疊合狀態(tài),則響應于用戶的字符識別請求,識別所接收圖片信息中包含的一個或多個字符的字符串;在當該信息處理裝置處于被折疊的疊合狀態(tài)時處于可見位置的第二顯示屏上顯示識別結果及關于該被識別的一個或多個字符的字符串的第一信息;當用戶將該信息處理裝置從疊合狀態(tài)改變?yōu)樾畔⑻幚硌b置未被折疊的翻開狀態(tài)時,經(jīng)由網(wǎng)絡進行通信,以獲取第二信息;以及在當該信息處理裝置處于翻開狀態(tài)時處于可見位置的第一顯示屏上顯示經(jīng)由數(shù)據(jù)通信接口接收的第二信息。
23.一種包含可執(zhí)行程序代碼的軟件產(chǎn)品,其中,執(zhí)行程序代碼可使一信息處理裝置執(zhí)行一系列步驟,這些步驟包括存儲關于至少一個的一個或多個字符的字符串的第一信息;響應于用戶的字符識別請求,識別所接收圖片信息中包含的一個或多個字符的字符串;顯示識別結果及關于該被識別的一個或多個字符的字符串的第一信息;當用戶請求關于該被識別的一個或多個字符的字符串的更多信息時,經(jīng)由網(wǎng)絡進行通信,以獲取第二信息;顯示經(jīng)由網(wǎng)絡接收的該第二信息。
24.一種包含可執(zhí)行程序代碼的軟件產(chǎn)品,其中,執(zhí)行程序代碼會使一信息處理裝置執(zhí)行一系列步驟,其中,該信息處理裝置包括第一殼體和第二殼體,并能夠折疊起來使得該第一個殼體和該第二殼體相互貼合,這一系列步驟包括存儲關于至少一個的一個或多個字符的字符串的第一信息;如果該信息處理裝置被折疊,則響應于用戶的字符識別請求,識別所接收圖片信息中包含的一個或多個字符的字符串;在當該信息處理裝置處于被折疊的疊合狀態(tài)下處于可見位置的第二顯示屏上顯示識別結果及與該被識別的一個或多個字符的字符串相關的信息;當用戶將該信息處理裝置從疊合狀態(tài)改變?yōu)樵撔畔⑻幚硌b置未被折疊的翻開狀態(tài)時,經(jīng)由網(wǎng)絡進行通信,以獲取附加信息;在當該信息處理裝置處于翻開狀態(tài)時處于可見位置的第一顯示屏上顯示經(jīng)由數(shù)據(jù)通信接口接收的該附加信息。
25.一種包括一個信息處理裝置和一個服務器的信息處理系統(tǒng),該信息處理裝置包括一個圖片接口,其將圖片信息輸入到該信息處理裝置;第一數(shù)據(jù)通信接口,用于與服務器進行通信;第一CPU,其響應于用戶的字符識別請求,識別通過該圖片接口輸入的該圖片信息中所包含的單詞,當用戶請求與該被識別的單詞相關的信息時,該第一CPU控制該第一數(shù)據(jù)通信接口,向該服務器發(fā)送包括該被識別的單詞及該被識別的單詞的一個同現(xiàn)單詞的數(shù)據(jù),以及顯示由該第一數(shù)據(jù)通信接口接收的信息;該服務器包括第二數(shù)據(jù)通信接口,用于與該信息處理裝置進行通信;一個存儲器,其存儲多個與單詞和同現(xiàn)單詞相關的信息;第二CPU,其根據(jù)由該信息處理裝置發(fā)送的數(shù)據(jù),從該存儲器中讀取至少一項信息,并控制該第二數(shù)據(jù)通信接口將該信息發(fā)送到該信息處理裝置并顯示。
專利摘要
一種信息處理裝置,包括一個照相機,用于輸出圖片信息;一個存儲器,用于存儲至少一個的一個或多個字符的字符串的相關簡明信息;一個數(shù)據(jù)通信接口,用于經(jīng)由網(wǎng)絡進行通信。該信息處理裝置還包括一個CPU,用于識別該照相機輸出的圖片信息中包含的一個或多個字符的字符串;響應于用戶的字符識別請求,顯示識別結果及被識別的一個或多個字符的字符串的相關簡明信息;當用戶請求該識別一個或多個字符的字符串的相關詳細信息時,控制該數(shù)據(jù)通信接口經(jīng)由網(wǎng)絡進行通信;顯示該數(shù)據(jù)通信接口接收的信息。
文檔編號G06F13/00GKCN1578348SQ200410063519
公開日2005年2月9日 申請日期2004年7月9日
發(fā)明者山崎正裕, 桑本英樹, 岡野祐三 申請人:株式會社日立制作所導出引文BiBTeX, EndNote, RefMan