專利名稱:嵌入式掌上外文輔助解讀器及其使用方法和用途的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種信息技術(shù)領(lǐng)域,具體涉及一種嵌入式掌上外文輔助解讀器。
背景技術(shù):
隨著以"和平和發(fā)展"為主題的國際合作的進一步發(fā)展,經(jīng)濟全球化時代的 到來,以及信息技術(shù)、尤其互聯(lián)網(wǎng)技術(shù)的不斷提檔升級,各國和地區(qū)之間在政治、 經(jīng)濟、文化、教育、軍事、科技、教育等領(lǐng)域間的合作日益頻繁、交往愈加密切。 每時每刻都有大量的外文原文資料或信息需要快速處理并做出反應(yīng), 一般傳統(tǒng)的 方法是靠專業(yè)翻譯等人工手段完成,真正的信息需求者受專業(yè)知識和外語能力(一 方面掌握的語種有限,另一方面掌握的程度有限)的限制很難獨立完成。因此, 在信息處理方面,普遍存在依賴性強、速度慢、效率低、信息處理量有限等問題, 語言障礙成為國際間合作的攔路虎,信息處理的現(xiàn)代化亟待解決。1946年,世界上出現(xiàn)第一臺電子計算機,從那時起,科學家們就試圖利用計算機手段代替人完成語言信息處理任務(wù),提高處理速度和效率。因此,以機器翻譯、人機對話系統(tǒng)、信息自動查詢系統(tǒng)、文本自動摘要系統(tǒng)等研究工作開始起步并得以長足的發(fā)展,當然由于認識上的偏誤,機器翻譯等研究工作也曾一度陷入低谷,但是,科學工作者們從未停止這一領(lǐng)域的執(zhí)著探索,近年來,計算機科學技術(shù)和互聯(lián)網(wǎng)技術(shù)又有突破性進展,語言信息處理領(lǐng)域也取得很多成果,如語音識別與合成、文字識別技術(shù)、文本格式的相互轉(zhuǎn)換、語言形態(tài)分析、語言信息搜尋等技術(shù)趨于成熟;句法分析技術(shù)、語義分析技術(shù)等也不斷完善。應(yīng)該承認,到目前為止機器翻譯技術(shù)雖有發(fā)展,但實用化程度還遠遠不夠,有的資料翻譯過來后可讀性很差,此外,翻譯的對象必須是電子文檔,所以對電腦和其它相應(yīng)設(shè)備的依賴性都很大。當今全球信息化大潮呈現(xiàn)如下趨勢信息存儲的數(shù)字化、信息處理的自動化、信息傳輸?shù)木W(wǎng)絡(luò)化、信息應(yīng)用的自動化、信息技術(shù)的集成化、信息系統(tǒng)的移動化 (便捷化)等。語言是信息的主要載體,因此,語言信息處理技術(shù)的快速發(fā)展成 為舉世關(guān)注的焦點和熱點,是某個國家和地區(qū)綜合國力的重要標志。袖珍靈巧、攜帶方便、實用便捷的語言處理器更是成為消費者青睞的對象。我們認為,從本質(zhì)上說,人類的所有活動都可歸為信息處理,不論是讀寫、 思考、規(guī)劃,還是純粹的各種現(xiàn)實活動,因為,計算機能模擬人類的各種物理活 動和智能活動,而計算機工作原理的本質(zhì)正是數(shù)據(jù)信息處理。可見,外文閱讀理 解作為典型的語言信息處理過程完全可以像計算機信息處理一樣分解為若干離散性的步^^o局部任務(wù),我們可以把盡可能多的步驟和局部任務(wù)指派給一種信息系統(tǒng)去完成,基于此,我們集成現(xiàn)有的軟硬件成熟技術(shù),設(shè)計開發(fā)一種移動掌上 型外文文本輔助解讀器,以適應(yīng)信息技術(shù)集成化、便捷化、移動化、實用化需要。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種通過外文文本自動采集、文本自動識別、文本詞形 的自動還原、自動詞典査詢、語音自動標注、詞義自動標注等處理過程的實現(xiàn), 能夠快速便捷地從各種文本載體上(紙質(zhì)載體和電腦載體上)獲取相關(guān)信息并做 出相應(yīng)決策和判斷的嵌入式掌上外文文本輔助解讀器。上述的目的通過以下的技術(shù)方案實現(xiàn)一種嵌入式掌上外文輔助解讀器,其組成包括外殼,所述的外殼上鑲嵌有 用于數(shù)據(jù)采集的高精度掃描探頭或USB接口 ,所述的高精度掃描探頭或USB接 口與外殼內(nèi)的小型掌上電腦主機連接,所述的小型掌上電腦主機與用于顯示分析 結(jié)果的多點陣顯示器連接,所述的小型掌上電腦主機用于對通過高精度掃描探頭或USB接口所采集的數(shù)據(jù)進行解讀。上述的嵌入式掌上外文輔助解讀器,所述的小型掌上電腦主機包括CPU,os。上述的嵌入式掌上外文輔助解讀器的使用方法,a) 將通過高精度掃描探頭或USB接口所采集的數(shù)據(jù)保存在小型掌上電腦的存 儲器中;b) 將儲存器中的數(shù)據(jù)進行用OCR識別器和文檔轉(zhuǎn)換器數(shù)據(jù)識別;c) 對上一步中通過文檔存儲器對OCR識別器和文檔轉(zhuǎn)換器轉(zhuǎn)換后的文本進行保 存和校驗;d) 用形態(tài)分析器、句法分析器和機器詞典對上一步的文本進行分析;e) 用信息標注器將上一步的形態(tài)分析器、句法分析器和機器詞典的分析結(jié)果 以標注在構(gòu)句塊的下方。上述的嵌入式掌上外文輔助解讀器的用途,所述的嵌入式掌上外文輔助解讀 器用作俄一漢輔助解讀器、漢一俄輔助解讀器、英一漢輔助解讀器、漢一英輔助 解讀器、英一俄輔助解讀器、俄一英輔助解讀器。這^^技術(shù)方案有以下有益效果1. 本發(fā)明產(chǎn)品為涉及外文閱讀理解和信息獲取的各領(lǐng)域群體_一外事人員、 商貿(mào)人員、國外旅游人員、借鑒外文資料的科研人員、專業(yè)翻譯、提高外語水平 的各層次學生提供得心應(yīng)手的輔助工具。2. 本發(fā)明產(chǎn)品具有文本采集功能,通過嵌入的掃描探頭實現(xiàn)紙質(zhì)版本外文文本髙精確度采集。3. 本發(fā)明產(chǎn)品具有文本存儲功能,把通過USb串口把從電腦下載的文本數(shù)據(jù) 或通過l)描述中采集到的數(shù)據(jù)保存在存儲器中。4. 本發(fā)明產(chǎn)品具有小型掌上電腦,能實現(xiàn)文本轉(zhuǎn)換功能,通過嵌入在解讀器中的文本轉(zhuǎn)換器把存儲器中的文本轉(zhuǎn)換成特定格式的文本。本產(chǎn)品還能夠通過其 信息標注器進行文本語音自動標注,如漢語,英語等,對文本中的詞形進行語音 的自動標注。本產(chǎn)品具有文本詞形自動還原功能,對文本中的詞形進行自動還原, 成為同詞典中詞頭一樣的原始詞。本產(chǎn)品具有文本詞法信息自動標注功能,可根據(jù)需要對文本中的詞形進行詞法信息自動標注。本產(chǎn)品具有文本語義自動標注功 能,對文本中的詞標注某一特定語言對應(yīng)意義的對等詞。本產(chǎn)品解讀結(jié)果顯示調(diào)整自動存儲功能,把原文和標注的結(jié)果顯示在嵌入的M示器上。本產(chǎn)品還具有fe讀結(jié)果顯示調(diào)整自動存儲功能,解讀的結(jié)果可調(diào)整和修改,并把結(jié)果存儲起來。 本產(chǎn)品具有其它輔助功能,包括語言選項功能,格式字體調(diào)整功能,語音合成功 能、記事本功能等。5. 本發(fā)明產(chǎn)品嵌入式掌上外文輔助解讀器是發(fā)明人根據(jù)當今信息化社會的 發(fā)展趨勢和現(xiàn)實需要,在充分研究現(xiàn)有成熟的實用化硬件和較完善的軟件實現(xiàn)技 術(shù)的基礎(chǔ)上,首次提出開發(fā)一種嵌入式掌上外文輔助解讀系統(tǒng),并提出建造這種 系統(tǒng)的軟硬件技術(shù)構(gòu)成、實現(xiàn)策略和集成方法。該系統(tǒng)能實現(xiàn)對紙質(zhì)版文檔或電 子版文檔進行自動采集、轉(zhuǎn)換、詞形還原、語言信息自動標注,尤其是可實現(xiàn)某 一特定語言的詞義對等物的標注,從而為使用者在不受設(shè)備、時間、地點、所學 語種和語言程度掌握不夠的局限,迅速理解外文的意思,獲取到相關(guān)信息,及時做出反應(yīng)和決策。同時,長期使用這種設(shè)備還可不斷提高外語水平。系統(tǒng)具有移 動性強、攜帶方便、便捷靈巧,實用性強等特點。6.本發(fā)明產(chǎn)品嵌入式掌上外文輔助解讀器可以不斷擴展、逐步升級。
圖l是本產(chǎn)品的結(jié)構(gòu)示意圖。圖2是本發(fā)明的剖視圖。圖3是本發(fā)明產(chǎn)品的工作流程圖。圖4是本發(fā)明產(chǎn)品的電路結(jié)構(gòu)框圖(虛框內(nèi)為帶有獨立操作系統(tǒng)的PDA主機)。本發(fā)明的
具體實施例方式
實施例l:一種嵌入式掌上外文輔助解讀器,其組成包括外殼,所述的外殼上鑲嵌有用于數(shù)據(jù)采集的高精度掃描探頭或USB接口 ,所述的高精度掃描探頭或USB接 口與外殼內(nèi)的PDA(小型掌上電腦)主機連接,所述的PDA(小型掌上電腦)主機與 用于顯示分析結(jié)果的多點陣顯示器連接,所述的PDA主機用于對通過高精度掃 描探頭或USB接口所采集的數(shù)據(jù)進行解讀,所述的PDA主機執(zhí)行如下步驟a) 將通過高精度掃描探頭或USB接口所采集的數(shù)據(jù)保存在存儲器中;b) 將儲存器中的數(shù)據(jù)進行用OCR識別器和文檔轉(zhuǎn)換器數(shù)據(jù)識別;c) 對上一步中通過文檔存儲器對OCR識別器和文檔轉(zhuǎn)換器轉(zhuǎn)換后的文本進行保 存和校驗;d) 用形態(tài)分析器、句法分析器和機器詞典對上一步的文本進行分析;e) 用信息標注器將上一步的形態(tài)分析器、句法分析器和機器詞典的分析結(jié)果 以標注在構(gòu)句塊的下方。所述的PDA主機包括CPU, OS。本發(fā)明產(chǎn)品嵌入式掌上外文輔助解讀器的工作過程為1) 進行數(shù)據(jù)采集,其有兩種途徑 一是對于紙質(zhì)文檔而言,需要用高精度 廣角攝像頭的支持,完成掃描存儲的操作;二是對于電子版材料而言,需要USB 電腦接口的支持,完成下載存儲的操作;2) 數(shù)據(jù)識別,指用OCR識別器和文檔轉(zhuǎn)換器,把通過高精度廣角攝像頭掃描存儲的圖形文件或用USB接口下在的其它格式的文件轉(zhuǎn)換為特定格式的文件;3) 文本存儲,對2)步操作的結(jié)果發(fā)送到文檔存儲器保存;4) 文本校驗,對3)部存儲的文檔進行拼寫檢查,消除錯誤;5) 文本分析,包括規(guī)范化處理、文本詞法自動分析、文本句法自動分析、詞典查詢等操作,對4)部的文本實現(xiàn)文本語句的自動識別和理解;6) 信息標注,把5)步的分析結(jié)果以標注在構(gòu)句塊的下方;7) 輸出顯示,用預(yù)設(shè)的文字(大小、字體)和顏色把6)步分析的結(jié)果顯示在屏幕上。實施例3:實施例1或2所述的嵌入式掌上外文輔助解讀器的用途,所述的嵌入式掌上外文輔助解讀器分為俄一漢輔助解讀器、漢一俄輔助解讀器、英一漢輔助解讀器、 漢一英輔助解讀器、英—俄輔助解讀器、俄一英輔助解讀器。
權(quán)利要求
1. 一種嵌入式掌上外文輔助解讀器,其組成包括外殼,其特征是所述的外殼上鑲嵌有用于數(shù)據(jù)采集的高精度掃描探頭或USB接口,所述的高精度掃描探頭或USB接口與外殼內(nèi)的小型掌上電腦主機連接,所述的小型掌上電腦主機與用于顯示分析結(jié)果的多點陣顯示器連接,所述的小型掌上電腦主機用于對通過高精度掃描探頭或USB接口所采集的數(shù)據(jù)進行解讀。
2. 根據(jù)權(quán)利要求1所述的嵌入式掌上外文輔助解讀器,其特征是所述的小型 掌上電腦主機包括CPU, OS。
3. —種權(quán)利要求1或2所述的嵌入式掌上外文輔助解讀器的使用方法,其特 征是a) 將通過高精度掃描探頭或USB接口所采集的數(shù)據(jù)保存在小型掌上電腦的存 儲器中;b) 將儲存器中的數(shù)據(jù)進行用OCR識別器和文檔轉(zhuǎn)換器數(shù)據(jù)識別;c) 對上一步中通過文檔存儲器對OCR識別器和文檔轉(zhuǎn)換器轉(zhuǎn)換后的文本進行保 存和校驗;d) 用形態(tài)分析器、句法分析器和機器詞典對上一步的文本進行分析;e) 用信息標注器將上一步的形態(tài)分析器、句法分析器和機器詞典的分析結(jié)果 以標注在構(gòu)句塊的下方。
4. 一種權(quán)利要求1或2所述的嵌入式掌上外文輔助解讀器的用途,所述的嵌 入式掌上外文輔助解讀器用作俄一漢輔助解讀器、漢一俄輔助解讀器、英—漢輔 助解讀器、漢一英輔助解讀器、英—俄輔助解讀器、俄一英輔助解讀器。
全文摘要
嵌入式掌上外文輔助解讀器及其使用方法和用途,語言信息處理技術(shù)的快速發(fā)展成為舉世關(guān)注的焦點和熱點,本發(fā)明其組成包括外殼(1),所述的外殼上鑲嵌有用于數(shù)據(jù)采集的高精度掃描探頭(2)或USB接口(3),所述的高精度掃描探頭(2)或USB接口(3)與外殼(1)內(nèi)的PDA主機(4)連接,所述的PDA主機與用于顯示分析結(jié)果的多點陣顯示器(5)連接,所述的PDA主機用于對通過高精度掃描探頭或USB接口所采集的數(shù)據(jù)進行解讀。本發(fā)明適用于信息技術(shù)領(lǐng)域。
文檔編號G06F17/28GK101231635SQ20071007169
公開日2008年7月30日 申請日期2007年1月26日 優(yōu)先權(quán)日2007年1月26日
發(fā)明者傅興尚, 王麗娟 申請人:黑龍江大學