国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      字符顯示系統(tǒng)的制作方法

      文檔序號:6655871閱讀:92來源:國知局

      專利名稱::字符顯示系統(tǒng)的制作方法
      技術(shù)領(lǐng)域
      :本發(fā)明涉及一種用于產(chǎn)生用來顯示表意字符的顯示尤其是用于指示由表意字符構(gòu)成的詞或短語的界限的顯示的系統(tǒng)和方法。本發(fā)明還涉及一種用于產(chǎn)生用來提供由表意字符構(gòu)成的詞或者短語的相關(guān)信息的顯示的系統(tǒng)和方法。
      背景技術(shù)
      :漢語可能比其它語言更加難學(xué),比如印歐語系的語言。一方面,一個(gè)人在學(xué)習(xí)大量的漢字之后才能夠閱讀一段漢字。不同的繁體漢字約有50,000個(gè)以上,其中常用的大約有5,000到8,000個(gè)。在這5,000到8,000個(gè)漢字當(dāng)中,每天都要使用的有將近3,000個(gè)。漢字是表意字符,每個(gè)字都可以表示至少一種含義。而印歐語系的語言中所利用的只是一小組標(biāo)準(zhǔn)的表示讀音的符號或字符,其中這組符號或字符定義字母表,并且每個(gè)單詞都是由表示讀音的字符的唯一組合構(gòu)成,其具有特定的含義。另一方面可能要?dú)w因于漢語中對詞的定義的不同方式。在印歐語系的語言中,因?yàn)橄噜弳卧~是通過空格或者小間隙來分隔的,所以單詞開始和結(jié)束的邊界非常明顯。相反地,漢字中詞的邊界卻很模糊,因?yàn)樵~與詞之間沒有自然的界定(比如空格或者間隙),并且漢字典型的書寫方式是一個(gè)挨著一個(gè),沒有任何指示表明哪里是詞的開始或結(jié)束。但是,標(biāo)點(diǎn)符號可以幫助界定詞的邊界。能夠閱讀漢字的人可以很容易地解析或解釋一串漢字并識別相關(guān)的詞。然而,要想獲得這項(xiàng)技能,必須經(jīng)過對漢語字詞的認(rèn)知能力的正規(guī)訓(xùn)練,將這項(xiàng)技能教授給一個(gè)不熟悉漢語或者漢字詞匯量有限的人是非常困難的。語言學(xué)習(xí)工具典型地包括文本閱讀器,它帶有與字典文庫相鏈接的增強(qiáng)顯示。這種顯示可以幫助學(xué)生識別串中的各個(gè)詞,并且當(dāng)詞被選中時(shí)(例如點(diǎn)擊這個(gè)詞),還可以顯示出這個(gè)詞的含義。由于在漢語中識別詞邊界的復(fù)雜性,要提供一種類似的識別漢語詞的學(xué)習(xí)工具就更加困難了。在一串漢字中識別詞的邊界是一項(xiàng)復(fù)雜的工作,因?yàn)闈h語中的詞可能由一個(gè)或多個(gè)漢字組成。這樣,確定單個(gè)漢字是否本身應(yīng)被視作詞,或者它是否應(yīng)與相鄰的字組合以構(gòu)成詞,就需要考慮這個(gè)字在句子中使用時(shí)的上下文(如考慮與這個(gè)字相鄰的字)。更復(fù)雜的是一個(gè)漢字可能有多于一個(gè)含義。例如,把特定的字和其它字或詞放在一起的時(shí)候,這個(gè)字的含義就可能會被限定或者改變。字的正確含義將再次取決于這個(gè)字在句子中使用時(shí)的上下文。組成一個(gè)詞的一組字有可能部分或者完全與組成另一個(gè)詞的另一組字交疊。因此,單純地通過求助于包含多個(gè)漢字的詞中每個(gè)字的單獨(dú)含義來確定該詞的含義是困難且復(fù)雜的。在作為示例的漢字的上下文中所述的上述問題以及類似的問題也會在其它基于表意字符的語言中發(fā)生(如日語和韓語)。因此,期望提供一種能夠解決上述問題的方法和系統(tǒng)或者至少提供一種有用的替換方案。
      發(fā)明內(nèi)容根據(jù)本發(fā)明,提供了一種用于為用戶界面產(chǎn)生顯示數(shù)據(jù)的方法,所述方法包括(i)接收包括表意字符的輸入字符串;(ii)從所述輸入字符串中選擇表意字符;(iii)產(chǎn)生從所述選擇的字符開始的第一詞或短語,所述第一詞或短語對應(yīng)于所述輸入字符串中與字典中的詞或短語相對應(yīng)的最大連續(xù)表意字符;(iv)針對所述第一詞或短語中的每個(gè)字符,基于所述輸入字符串中從所述第一詞或短語中的字符開始的多個(gè)連續(xù)表意字符而產(chǎn)生附加詞或短語,每個(gè)所述的附加詞或短語都對應(yīng)于所述字典中的詞或短語;以及(v)在所述用戶界面上產(chǎn)生用于顯示所述輸入字符串中的連續(xù)字符組的所述顯示數(shù)據(jù),所述組包括所述第一詞或短語以及所述附加詞或短語中的所有字符,所述組基于所述附加詞或短語相對于所述第一詞或短語的位置被顯示。本發(fā)明還提供一種用于執(zhí)行上述方法的系統(tǒng)。本發(fā)明還提供一種用于執(zhí)行上述方法的包含計(jì)算機(jī)可執(zhí)行代碼的計(jì)算機(jī)程序產(chǎn)品。本發(fā)明還提供一種用于為用戶界面產(chǎn)生顯示數(shù)據(jù)的系統(tǒng),包括(i)用于接收包括表意字符的輸入字符串的裝置;(ii)用于從所述輸入字符串中選擇表意字符的裝置;(iii)用于存儲字典的存儲器;(iv)詞產(chǎn)生器,用于產(chǎn)生從所述選擇的字符開始的第一詞或短語,所述第一詞或短語對應(yīng)于所述輸入字符串中與字典中的詞或短語相對應(yīng)的最大連續(xù)表意字符;并且針對所述第一詞或短語中的每個(gè)字符,產(chǎn)生從所述第一詞或短語中的字符開始的附加詞或短語,每個(gè)所述附加詞或短語基于所述輸入字符串中的多個(gè)連續(xù)表意字符而產(chǎn)生,并且每個(gè)所述附加詞或短語對應(yīng)于所述字典中的詞或短語;以及(v)用于在所述用戶界面上產(chǎn)生用于顯示所述輸入字符串中的連續(xù)字符組的所述顯示數(shù)據(jù)的裝置,所述組包括所述第一詞或短語以及所述附加詞或短語中的所有字符,其中所述字符組的顯示基于所述附加詞或短語相對于所述第一詞或短語的位置。下面將參考附圖,僅作為示例描述本發(fā)明的優(yōu)選實(shí)施例,其中圖1為顯示系統(tǒng)的框圖,其還示出了字符處理系統(tǒng)的各模塊;圖2為示出用于處理從字符輸入模塊接收的輸入字符串以便顯示的步驟的流程圖;圖3為示出用于確定從選定字符開始的、可使用輸入字符串中的連續(xù)字符形成的最長詞的步驟的流程圖;圖4為示出用于利用字符字典和變體字典將漢字轉(zhuǎn)換為繁體漢字的步驟的流程圖;圖5為示出用于利用變體字典將漢字強(qiáng)行轉(zhuǎn)換為其繁體變體的步驟的流程圖;圖6為示出用于利用最長詞中的每個(gè)字產(chǎn)生詞列表然后確定該最長詞是否有歧義的步驟的流程圖;圖7為示出用于從最長詞中的根字開始并使用輸入字符串中該根字后面連續(xù)的字產(chǎn)生詞列表的步驟的流程圖;圖8為示出用于處理從字符輸入模塊接收到的輸入字符串從而顯示與輸入字符串中識別的詞相關(guān)聯(lián)的描述性數(shù)據(jù)的步驟的流程圖;圖9為示出用于產(chǎn)生包含在最長詞內(nèi)的詞的列表的步驟的流程圖;圖10為示出用于查詢、檢索并顯示與包含字或復(fù)合詞的列表中的每個(gè)條目相對應(yīng)的、來自字符字典、復(fù)合字典和/或變體字典的數(shù)據(jù)值的步驟的流程圖;圖11為示出用于利用從包含一個(gè)或多個(gè)拼音音節(jié)的輸入字符串獲得的拼音音節(jié)產(chǎn)生條目列表的步驟的流程圖,其中每個(gè)條目對應(yīng)于單個(gè)字或復(fù)合詞;圖12為示出用于利用從輸入字符串獲得的關(guān)鍵詞產(chǎn)生條目列表的步驟的流程圖,其中每個(gè)條目對應(yīng)于單個(gè)字或復(fù)合詞;圖13為示出用于利用從輸入字符串獲得的字產(chǎn)生條目列表的步驟的流程圖,其中每個(gè)條目對應(yīng)于單個(gè)字或復(fù)合詞;圖14為終止符的圖;圖15為標(biāo)點(diǎn)符號的圖;圖16為以漢語書寫的多字符詞;圖17為以漢語書寫的多字符詞;以及圖18為多個(gè)以漢語書寫的單字符詞。具體實(shí)施例方式作為示例在處理漢字的上下文中描述優(yōu)選實(shí)施例,并且應(yīng)當(dāng)理解這些優(yōu)選實(shí)施例可以用于處理其它語言(如日語或者韓語)中的表意字符。如圖1所示,處理系統(tǒng)100包括字符輸入模塊102,字符處理模塊104和顯示模塊106。字符輸入模塊102接收來自用戶的漢字輸入字符串。舉例來說,字符輸入模塊102為用戶產(chǎn)生用戶界面(例如,以用于接收一個(gè)或多個(gè)字符輸入的輸入窗口或文本框的形式)以輸入字符串,并且用戶界面可以從字符輸入設(shè)備(如鍵盤、鼠標(biāo)或者字符輸入板,例如PenPowerCrystal觸摸式中文書寫板&lt;http://www.penpower.com.tw/&gt;)或者軟件輸入法(例如Microsoft的全球輸入法編輯器,從http://www.microsoft.com/windows/ie/downloads/recommended/ime/default.mspx可以獲得該軟件)接收輸入字符串。字符輸入模塊102將輸入字符串轉(zhuǎn)發(fā)至字符處理模塊104。字符處理模塊104處理輸入字符串,并將結(jié)果(即由字符處理模塊104產(chǎn)生的顯示數(shù)據(jù))發(fā)送給顯示模塊106以便顯示(例如,通過更新由字符處理模塊104產(chǎn)生的用戶界面)。顯示數(shù)據(jù)表示要被顯示的一個(gè)或多個(gè)字符,也表示每個(gè)要被顯示的字符的顯示準(zhǔn)則。如圖1所示,字符處理模塊104包括斷詞(tokenisation)模塊108、分析模塊110、查詢模塊112和存儲器114。存儲器114包括任何形式的計(jì)算機(jī)可讀存儲介質(zhì)(如硬盤,光盤或者磁帶,隨機(jī)存取存儲器(RAM)和/或只讀存儲器(ROM))。存儲器114還包含復(fù)合字典116、字符字典118以及變體字典120。如圖1所示,字符處理模塊104中的斷詞模塊108接收來自字符輸入模塊104的輸入字符串,并通過參考字符字典116、復(fù)合字典118以及變體字典120,來確定使用輸入字符串中從特定字符位置(或光標(biāo)位置)開始的一個(gè)或多個(gè)連續(xù)字符所能形成的最長的詞。如果光標(biāo)位置處的字符是分隔符,斷詞模塊108就將該分隔符傳遞給顯示模塊106以便顯示。分隔符可以是文件結(jié)束(EOF)符、換行符、終止符或者標(biāo)點(diǎn)符號。終止符定義句子的結(jié)束,并且例如包括圖14所示的字符。終止符包括特定于具體語言、用來定義句子結(jié)束的字符,比如圖14中的字符1402相當(dāng)于漢語中的句號。標(biāo)點(diǎn)符號是沒有任何含義的符號或者字符,并且不是終止符、EOF符或者換行符。標(biāo)點(diǎn)符號包括圖15所示的符號,UnicodeStandard(4.0.0版本)的第6章“WritingSystemsandPunctuation”中進(jìn)一步描述了這些符號(從&lt;http://www.unicode.org/versions/unicode4.0.0/ch06.pdf&gt;中可以獲得),其內(nèi)容通過引用結(jié)合在本文中。所有未定義為分隔符的字符被稱作非分隔符。如果斷詞模塊108確定最長的詞是單個(gè)字,則斷詞模塊108將包括要被顯示的字符的顯示數(shù)據(jù)傳給顯示模塊106以便顯示。如果最長的詞包含兩個(gè)或更多個(gè)字,則對于該最長詞中的每一個(gè)字,斷詞模塊108使用最長詞中的每一個(gè)字作為起始字(即根字),產(chǎn)生包含一個(gè)或多個(gè)復(fù)合詞(即具有兩個(gè)或更多個(gè)字的詞)的列表。每個(gè)復(fù)合詞都對應(yīng)于字符字典116、復(fù)合字典118以及變體字典120中的字或詞。列表中的每個(gè)復(fù)合詞都以作為最長詞中的字的根字開始,而且每個(gè)復(fù)合詞都是使用輸入字符串中跟隨并包含該根字的連續(xù)字符來構(gòu)成。將這個(gè)包含一個(gè)或多個(gè)復(fù)合詞的列表傳給分析模塊110,分析模塊110根據(jù)列表中的復(fù)合詞確定該最長詞是否由于完全包含列表中的其它復(fù)合詞或者與其相交疊而有歧義。如果是,分析模塊110產(chǎn)生包括該最長詞的顯示數(shù)據(jù),并將其傳給顯示模塊106以便顯示。如果該最長詞完全包含列表中的一個(gè)復(fù)合詞,顯示模塊106按照顯示數(shù)據(jù)中為最長詞中的字符定義的顯示準(zhǔn)則顯示該最長詞(例如,指示它有歧義)。如果該最長詞與列表中的一個(gè)復(fù)合詞交疊但沒有完全包含該詞,顯示模塊106按照顯示數(shù)據(jù)中為最長詞中的字符定義的不同顯示準(zhǔn)則顯示該最長詞(例如,指示不同的歧義形式)。如果該最長詞被確定為沒有歧義,則分析模塊110將包含最長詞的顯示數(shù)據(jù)傳給顯示模塊106以便根據(jù)顯示數(shù)據(jù)中定義的又一不同顯示準(zhǔn)則顯示為無歧義詞。顯示準(zhǔn)則是指定義用來顯示一組一個(gè)或多個(gè)字的一個(gè)或多個(gè)視覺特征的一個(gè)或多個(gè)條件。可以用作顯示準(zhǔn)則的條件包括用特定的字體類型、字體顏色和字體風(fēng)格(包括粗體、斜體和下劃線)顯示一組字,對于單個(gè)或一組字采用有色背景(即高亮),或者結(jié)合其他獨(dú)特圖形標(biāo)識手段顯示單個(gè)或一組字(例如,在框中顯示字符),或者一個(gè)或多個(gè)上述條件的任意組合。查詢模塊112處理由斷詞模塊108生成的詞的列表,并從字符字典116、復(fù)合字典118以及變體字典120的數(shù)據(jù)字段中檢索與包含在最長詞中的每個(gè)復(fù)合詞相關(guān)聯(lián)的數(shù)據(jù)值。然后,將所檢索的數(shù)據(jù)值傳給顯示模塊106以便顯示。處理系統(tǒng)100中的模塊可以在軟件中實(shí)施并在運(yùn)行諸如Windows或Unix等標(biāo)準(zhǔn)操作系統(tǒng)的標(biāo)準(zhǔn)計(jì)算機(jī)(例如由IBM公司&lt;http://www.ibm.com&gt;提供的計(jì)算機(jī))上執(zhí)行。本領(lǐng)域的技術(shù)人員可以理解由這些組件執(zhí)行的處理至少可以部分地由專用硬件電路執(zhí)行,例如專用集成電路(ASICs)或者現(xiàn)場可編程門陣列(FPGA)。由處理模塊110執(zhí)行的處理可以作為獨(dú)立的應(yīng)用,或者作為與標(biāo)準(zhǔn)操作系統(tǒng)如MicrosoftWindows操作系統(tǒng)的任何版本(&lt;http://www.microsoft.com/windows/&gt;)的默認(rèn)輸入和顯示組件交互的插入式軟件組件來實(shí)施。字符字典116關(guān)聯(lián)代表特定表意字符(如繁體漢字)的標(biāo)識符。字符字典116中的每個(gè)字都與一個(gè)包括一個(gè)或多個(gè)對象的列表相關(guān)聯(lián),每個(gè)對象都包含一個(gè)或多個(gè)值。這些值可以對應(yīng)于讀音數(shù)據(jù)、音頻數(shù)據(jù)和/或定義數(shù)據(jù)。讀音數(shù)據(jù)代表特定字的發(fā)音表示(如拼音)。音頻數(shù)據(jù)代表相應(yīng)字的音頻表示。優(yōu)選地,音頻表示包括存儲在存儲器114中的音頻文件(或者指向這種文件的、包括路徑和/或文件名的指針)。音頻文件中的數(shù)據(jù)可以表示模擬的或者數(shù)字化的音頻信號,該信號在以后可以被再現(xiàn)為聲音波形,以向用戶說明該字的發(fā)音。定義數(shù)據(jù)代表對應(yīng)于特定字的一個(gè)或多個(gè)含義(例如,該字被翻譯為另一種語言后的含義,如英語)的定義(例如,字符串的形式)。每個(gè)表意字符都有含義,因此它本身即可被看作詞。字符字典116可以作為存儲在存儲器114中的哈希映射來實(shí)施,它將標(biāo)識符(例如,字符的Unicode字符碼)與包含一個(gè)或多個(gè)對象的列表相關(guān)聯(lián)。Unicode標(biāo)準(zhǔn)(可從&lt;http://www.unicode.org/&gt;獲得)是一種對字符進(jìn)行編碼的標(biāo)準(zhǔn),其中為任何語言中的每個(gè)字符、符號或字母分配一個(gè)唯一的十六進(jìn)制數(shù)值標(biāo)識符,其被稱為Unicode字符碼。在一個(gè)優(yōu)選的實(shí)施例中,僅僅使用與繁體漢字對應(yīng)的Unicode字符碼(如在CJK統(tǒng)一表意文字標(biāo)準(zhǔn)(范圍4E00-9FAF)中所定義,可從&lt;http://www.unicode.org/charts/PDF/U4E00.pdf>獲得)來標(biāo)識XML字符數(shù)據(jù)文件和字符字典116中的字符。在其它優(yōu)選的實(shí)施例中,可以使用與其它語言中的表意字符對應(yīng)的Unicode字符碼(例如,可從&lt;http://www.unicode.org/charts&gt;獲得其它表意字符的Unicode字符碼定義)。字符字典116也可以作為關(guān)系數(shù)據(jù)庫中的一個(gè)或多個(gè)表,或者作為將唯一標(biāo)識符與一個(gè)或多個(gè)值相關(guān)聯(lián)的多維數(shù)組來實(shí)施(例如,其中該一個(gè)或多個(gè)表或陣列中的每個(gè)元素將唯一Unicode字符碼與包含一個(gè)或多個(gè)列表元素的列表相關(guān)聯(lián))。對應(yīng)于字符字典116的哈希映射可以利用包含在存儲于存儲器114中的一個(gè)或多個(gè)結(jié)構(gòu)化數(shù)據(jù)文件中(例如,可擴(kuò)展標(biāo)記語言(XML)文件)的數(shù)據(jù)生成。如下所示,列表1是對應(yīng)于來自XML字符數(shù)據(jù)文件的單字符條目(或圖示符)的數(shù)據(jù)片段示例。該XML字符數(shù)據(jù)文件包含對應(yīng)于一個(gè)或多個(gè)字符的數(shù)據(jù)條目,每個(gè)條目都用來產(chǎn)生字符字典116中的一個(gè)條目。每一個(gè)字的數(shù)據(jù)都存儲在標(biāo)簽&lt;glyph&gt;和&lt;/glyph&gt;之間。每個(gè)條目都由每個(gè)字符的唯一Unicode字符碼標(biāo)識,該唯一Unicode字符碼存儲在標(biāo)簽&lt;unicode&gt;和&lt;/unicode&gt;之間。在標(biāo)簽&lt;kDefinifion&gt;和&lt;/kDefinition&gt;之間,XML字符數(shù)據(jù)文件以字符串的形式存儲了字的定義。該定義可以是該字表示為采用任何語言(包括漢語)表達(dá)的字的含義。XML字符數(shù)據(jù)文件還在標(biāo)簽&lt;pinyin&gt;和&lt;/pinyin&gt;之間為每個(gè)字存儲了讀音表示(如拼音)。漢字的讀音表示可以用稱為拼音的羅馬字母描述。每個(gè)表意字符可以對應(yīng)于一個(gè)或多個(gè)拼音音節(jié),而每個(gè)音節(jié)由聲音部分和音調(diào)部分構(gòu)成。每個(gè)字的拼音音節(jié)可以用文本部分(對應(yīng)于聲音部分)和音調(diào)標(biāo)識符(標(biāo)識音調(diào)部分)的組合來表示。文本部分是特定漢字發(fā)音的羅馬字母表示,而音調(diào)標(biāo)識符代表該漢字的發(fā)音音調(diào)。優(yōu)選地,每個(gè)漢字的書面讀音表示都是基于漢語普通話(或官方語言)。相應(yīng)地,音調(diào)標(biāo)識符優(yōu)選地為從1到5之間的數(shù)值標(biāo)識符,分別對應(yīng)于為普通話拼音定義的5個(gè)標(biāo)準(zhǔn)音調(diào)。例如,數(shù)字“1”代表與高平音高對應(yīng)的第一個(gè)音調(diào)。數(shù)字“2”代表與上升音高對應(yīng)的第二個(gè)音調(diào)。數(shù)字“3”代表與先降后升音高對應(yīng)的第三個(gè)音調(diào)。數(shù)字“4”代表與下降音高對應(yīng)的第四個(gè)音調(diào)。并且類似地,數(shù)字“5”代表與不發(fā)聲(或輕聲)對應(yīng)的第五個(gè)音調(diào)。這樣,在列表1所示的拼音表示中,被標(biāo)識為Unicode字符碼“53e3”的漢字,其普通話拼音表示為“kou3”,這指示了該漢字的讀音為“kou”,音調(diào)為三聲。然而,單個(gè)書面漢字在不同的中國方言中可能有不同的發(fā)音。每個(gè)漢字將有對應(yīng)于特定口語方言的不同書面讀音表示。所以,舉例來說,存儲在字符字典116中的每個(gè)漢字的書面讀音表示可以是基于另一種漢語方言的拼音表示(如,基于廣東話拼音)。通常,優(yōu)選的是字符字典116中所有字的書面讀音表示始終如一地與常見單個(gè)方言的拼音表示相關(guān)聯(lián)。在本發(fā)明的其它實(shí)施例中,每個(gè)字都可以單獨(dú)地與一個(gè)或多個(gè)不同的拼音表示相關(guān)聯(lián),以對應(yīng)于不同方言中的發(fā)音。在這種情況下,優(yōu)選的是字符字典116中的每個(gè)字始終如一地與對應(yīng)于同一組不同方言的同一組不同拼音表示相關(guān)聯(lián)。下面是描述如何提取存儲在XML字符數(shù)據(jù)文件中的對應(yīng)于漢字的數(shù)據(jù)以及使用該數(shù)據(jù)產(chǎn)生字符字典116中的條目的示例。用Unicode字符碼“53e3”標(biāo)識列表1所示的字。當(dāng)例如采用任何傳統(tǒng)的解析技術(shù)來解析XML字符數(shù)據(jù)文件時(shí),從XML字符數(shù)據(jù)文件中的每個(gè)條目提取Unicode字符碼,以形成字符字典116中的對應(yīng)條目的鍵。該鍵唯一地標(biāo)識對應(yīng)于字符字典116中的字的哈希映射中的特定條目。例如,可以通過將每個(gè)鍵與包含一個(gè)或多個(gè)對象的列表相關(guān)聯(lián)來生成對應(yīng)于字符字典116的哈希映射,其中,每個(gè)對象都與定義數(shù)據(jù)(如翻譯字符串)、代表該字讀音表示的讀音數(shù)據(jù)相關(guān)聯(lián)(如拼音),和/或代表該字的音頻數(shù)據(jù)(如音頻信號或音頻文件)相關(guān)聯(lián)。如下所述,列表2為與來自XML字符數(shù)據(jù)文件的單字符條目相對應(yīng)的片段的示例,其中同一字(用Unicode字符碼“4f9b”標(biāo)識)可以以不同的音調(diào)發(fā)音(即“gong1”和“gong4”),并且不同的含義與每個(gè)發(fā)音相關(guān)聯(lián)。在這種情況下,與字符字典116對應(yīng)的哈希映射中以“4f9b”標(biāo)識的條目就是包含兩個(gè)對象的列表。第一個(gè)對象包含與“gong1”對應(yīng)的讀音數(shù)據(jù)和定義數(shù)據(jù)(即,分別為拼音音節(jié)“gong1”和翻譯字符串“supply;provide;”)。第二個(gè)對象包含與“gong4”對應(yīng)的發(fā)音數(shù)據(jù)和定義數(shù)據(jù)(即,分別為拼音音節(jié)“gong4”和翻譯字符串“l(fā)ay(offerings);confess;ownup;”)。復(fù)合字典118關(guān)聯(lián)表示復(fù)合詞或短語的標(biāo)識符。一個(gè)詞包括單個(gè)字(如存儲在字符字典116中)或者兩個(gè)或更多個(gè)字的組合(如存儲在復(fù)合字典118中)。一個(gè)短語包括多于兩個(gè)字的組合,其僅僅存儲在復(fù)合字典118中。復(fù)合字典118中的詞/短語的標(biāo)識符可以與包含一個(gè)或多個(gè)對象的列表相關(guān)聯(lián),其中每個(gè)對象都包含一個(gè)或多個(gè)值。這些值可以對應(yīng)于該詞/短語的讀音數(shù)據(jù)、音頻數(shù)據(jù)和/或定義數(shù)據(jù)。優(yōu)選地,復(fù)合字典118中的每個(gè)詞/短語的字都是繁體漢字。對于復(fù)合字典118中的每個(gè)詞/短語,讀音數(shù)據(jù)代表該復(fù)合詞的讀音表示(如拼音)。音頻數(shù)據(jù)代表相應(yīng)詞/短語的音頻表示,例如以存儲在存儲器114中的音頻文件(或者指向這樣一個(gè)文件的、包括路徑和/或文件名的指針)的形式。舉例來說,音頻文件中的數(shù)據(jù)代表模擬的或數(shù)字化的音頻信號,該信號在以后可以被再現(xiàn)為聲音波形,以向用戶說明該詞/短語的發(fā)音。定義數(shù)據(jù)代表對應(yīng)于該詞/短語的含義(例如,該復(fù)合詞被翻譯為另一種語言以后的含義,如英語)的定義(例如,以字符串的形式)。復(fù)合字典118可以作為存儲在存儲器114中的哈希映射來實(shí)施,它將標(biāo)識符(例如,對應(yīng)于詞/短語中每個(gè)字的Unicode字符碼的唯一組合,唯一標(biāo)識作為復(fù)合詞的詞/短語)與包含一個(gè)或多個(gè)對象的列表相關(guān)聯(lián),每個(gè)對象都包含一個(gè)或多個(gè)值。可選地,復(fù)合字典118也可以作為關(guān)系數(shù)據(jù)庫中的一個(gè)或多個(gè)表,或者作為多維數(shù)組(如上所述)來實(shí)施,其各自將使用Unicode字符碼的組合形成的唯一標(biāo)識符與對象列表相關(guān)聯(lián),其中每個(gè)對象包含一個(gè)或多個(gè)值。復(fù)合字典118可以采用與其它語言中的表意字符對應(yīng)的Unicode字符碼來標(biāo)識另一種語言中的詞/短語。其它表意字符的Unicode字符碼定義可從&lt;http://www.unicode.org/charts/&gt;獲得。對應(yīng)于復(fù)合字典118的哈希映射可以利用存儲于存儲器114中的一個(gè)或多個(gè)結(jié)構(gòu)化數(shù)據(jù)文件(例如,可擴(kuò)展標(biāo)記語言(XML)文件)中所包含的數(shù)據(jù)生成。如下所示,列表3是對應(yīng)于來自XML復(fù)合詞數(shù)據(jù)文件的復(fù)合詞條目的數(shù)據(jù)片段的示例。該XML復(fù)合詞數(shù)據(jù)文件包含對應(yīng)于一個(gè)或多個(gè)復(fù)合詞的數(shù)據(jù)條目,每一個(gè)數(shù)據(jù)條目都用來產(chǎn)生復(fù)合字典118中的一個(gè)條目。每個(gè)復(fù)合詞的數(shù)據(jù)都存儲在標(biāo)簽&lt;compound&gt;和&lt;/compound&gt;之間。每個(gè)復(fù)合詞包括至少兩個(gè)字,對復(fù)合詞中的每個(gè)字都定義一個(gè)&lt;tuple&gt;標(biāo)簽。&lt;tuple&gt;標(biāo)簽可以包括復(fù)合詞中每個(gè)字的標(biāo)識符(如多個(gè)Unicode字符碼)和讀音表示(如拼音)。字的順序是重要的。舉例來說,參考列表3和圖17,由Unicode字符碼“660e”標(biāo)識的字對應(yīng)于圖17中的字1072,而由Unicode字符碼“5929”標(biāo)識的字對應(yīng)于圖17中的字1074。字1072和字1074按照這個(gè)順序(即字1072放在字1074之前)組成了一個(gè)含義為“tomorrow”的漢語詞匯。如果這兩個(gè)字按照不同的方式排列,那么它們就不具有相同的含義。字的順序按照它們的出現(xiàn)順序存儲在XML復(fù)合詞數(shù)據(jù)文件中,于是在這個(gè)例子中,字1072(標(biāo)識為“660e”)的字符數(shù)據(jù)在字1074(標(biāo)識為“5929”)的字符數(shù)據(jù)之前出現(xiàn)。該復(fù)合詞的英文含義(即,復(fù)合詞的翻譯字符串形式的定義數(shù)據(jù))定義在標(biāo)簽&lt;english&gt;與&lt;/english&gt;之間。然而,應(yīng)當(dāng)理解,翻譯字符串可以是采用任何書面語言表達(dá)的該復(fù)合詞的含義。還可以為對應(yīng)于特定復(fù)合詞的其它數(shù)據(jù)定義另外的標(biāo)簽,例如,與該復(fù)合詞的音頻表示相對應(yīng)地定義音頻文件的路徑和文件名、或者指向此文件的指針的標(biāo)簽。下面的示例描述如何從XML復(fù)合詞數(shù)據(jù)文件中的條目提取對應(yīng)于復(fù)合詞的數(shù)據(jù)以及使用該數(shù)據(jù)產(chǎn)生復(fù)合字典118中的條目。列表3所示的復(fù)合詞條目包括兩個(gè)字(對應(yīng)于圖17中的字1072和1074),這兩個(gè)字分別由Unicode字符碼“660e”和“5929”標(biāo)識。當(dāng)例如采用任何傳統(tǒng)解析技術(shù)解析XML復(fù)合詞數(shù)據(jù)文件時(shí),提取該條目中的每個(gè)字的Unicode字符碼并按照它們出現(xiàn)的順序?qū)⑵浯釉谝黄?,以形成?fù)合字典118中的鍵。在列表3所示的示例中,串接列表3所示的復(fù)合詞條目中的每個(gè)字的Unicode字符碼,以形成字符串“660e5929”,其用作復(fù)合字典118中的對應(yīng)條目的鍵。該鍵唯一標(biāo)識對應(yīng)于復(fù)合字典118中的復(fù)合詞的哈希映射中的特定條目。例如,對應(yīng)于復(fù)合字典118的哈希映射可以將每個(gè)鍵與包含一個(gè)或多個(gè)對象的列表相關(guān)聯(lián),其中,每個(gè)對象都與定義數(shù)據(jù)(如對應(yīng)于該復(fù)合詞的含義的翻譯字符串)、代表該復(fù)合詞的讀音表示的讀音數(shù)據(jù)(如拼音),和/或代表該復(fù)合詞的音頻數(shù)據(jù)(如音頻信號或音頻文件)相關(guān)聯(lián)??梢酝ㄟ^將復(fù)合詞中每個(gè)字的拼音音節(jié)串接在一起來形成存儲在哈希映射中、與該復(fù)合詞對應(yīng)的拼音表示,而每個(gè)串接的拼音音節(jié)之間可以有一個(gè)空格。例如,如圖17所示,由字1702和1704組成的復(fù)合詞由串接的Unicode字符碼鍵“660e5929”標(biāo)識,并且其相應(yīng)的讀音表示為“ming2tian1”。優(yōu)選地,僅使用與繁體漢字對應(yīng)的Unicode字符碼(如在CJK統(tǒng)一表意文字標(biāo)準(zhǔn)(范圍4E00-9FAF)中所定義的,可從&lt;http://www.unicode.org/charts/PDF/U4E00.pdf&gt;獲得)來標(biāo)識字符字典116和復(fù)合字典118中的字,這些Unicode字符碼分別位于相應(yīng)的XML字符數(shù)據(jù)文件和XML復(fù)合詞數(shù)據(jù)文件中。變體字典120對于每個(gè)繁體和簡體漢字包括一個(gè)條目(如在CJK統(tǒng)一表意文字標(biāo)準(zhǔn)(范圍4E00-9FAF)中所定義的),并且將這些漢字中的每個(gè)與包含一個(gè)或多個(gè)對象的列表相關(guān)聯(lián),每個(gè)對象包含一個(gè)或多個(gè)值。這些值可以對應(yīng)于包含一個(gè)或多個(gè)相應(yīng)繁體變體字、相應(yīng)簡體變體字的列表,或包含一個(gè)或多個(gè)相應(yīng)語義變體字的列表。參考列表4說明一個(gè)示例,其示出與包含在XML變體數(shù)據(jù)文件中的不同字符條目相對應(yīng)的三個(gè)數(shù)據(jù)片斷。XML變體數(shù)據(jù)文件中的每個(gè)條目都對應(yīng)于一個(gè)字,該字由其Unicode字符碼標(biāo)識并存儲在標(biāo)簽&lt;unicode&gt;與&lt;/unicode&gt;之間。例如,參考圖18,采用Unicode字符碼“9452”標(biāo)識的繁體漢字(被示出為圖18中的字1806)也可以寫成對應(yīng)于Unicode字符碼“9274”的簡體漢字(被示出為圖18中的字1808)。這樣,在列表4所示的示例中,由“9274”標(biāo)識的字(即圖18中的字1808)就被定義為由“9452”標(biāo)識的字的簡體變體(即圖18中的字1806)。此外,簡體變體“9274”存儲在由Unicode字符碼“9452”標(biāo)識的字符條目下面的標(biāo)簽&lt;kSimplifiedVariant&gt;與&lt;/kSimplifiedVariant&gt;之間。作為另外的示例,盡管用Unicode字符碼“9452”標(biāo)識的繁體漢字(即圖18中的字1806)與另一個(gè)對應(yīng)于Unicode字符碼“9451”的繁體漢字(即圖18中的字1810)的寫法不同,它們的含義卻相似。所以,標(biāo)識為“9451”的字(即圖18中的字1810)是標(biāo)識為“9452”的字的語義變體(即圖18中的字1806)。如列表4所示,語義變體“9451”(即圖18中的字1810)存儲在標(biāo)識為Unicode字符碼“9452”的字符(即圖18中的字1806)條目下面的標(biāo)簽&lt;kSemanticVariant&gt;與&lt;/kSemanticVariant&gt;之間。類似地,簡體漢字也可以寫成特定的繁體漢字。例如,采用Unicode字符碼“9274”標(biāo)識的字(即圖18中的字1808)可以對應(yīng)于與Unicode字符碼“9451”對應(yīng)的繁體漢字(即圖18中的字1810)或與Unicode字符碼“9452”對應(yīng)的繁體漢字(即圖18中的字1806)。優(yōu)選地,當(dāng)特定條目與多于一個(gè)繁體變體字相關(guān)聯(lián)時(shí),這些繁體變體字中的每個(gè)將根據(jù)普及程度排序。當(dāng)例如采用任何傳統(tǒng)解析技術(shù)解析XML變體數(shù)據(jù)文件時(shí),提取標(biāo)識XML變體文件中的每個(gè)條目的Unicode字符碼,以形成變體字典120中的相應(yīng)條目的鍵。該鍵唯一標(biāo)識對應(yīng)于變體字典120中的字的哈希映射中的特定條目。舉例來說,對應(yīng)于變體字典120的哈希映射可以將每個(gè)鍵與包含一個(gè)或多個(gè)對象的列表相關(guān)聯(lián),其中,每個(gè)對象都有包含一個(gè)或多個(gè)繁體變體字、簡體變體字的列表,和/或包含一個(gè)或多個(gè)語義變體字的列表。圖2中的流程圖示出用于處理從字符輸入模塊102接收的輸入字符串以便顯示的處理200。處理200處理輸入字符串來識別詞(包括復(fù)合詞和短語),并根據(jù)那些詞是無歧義的還是有歧義的(例如,由于完全包含另一個(gè)詞或者與其交疊),產(chǎn)生用來顯示那些詞的顯示數(shù)據(jù)。除了方框202中所示的步驟在顯示模塊106中執(zhí)行以外,處理200在斷詞模塊108中執(zhí)行。處理200從步驟204開始,設(shè)置全局變量max_char來定義輸入字符串中用于搜索的連續(xù)字符的最大數(shù)目,以便確定這些連續(xù)字符是否對應(yīng)于一個(gè)復(fù)合詞,完全包含該復(fù)合詞或者與之交疊。變量max-char的值可以在7到15之間,但是優(yōu)選地,max-char的值設(shè)為10。在步驟206,從字符輸入模塊102獲取輸入字符串。然后,在步驟208,要求用戶確定起始字符位置(或光標(biāo)位置)作為輸入字符串中的復(fù)合詞搜索起始字符。在步驟210,選擇光標(biāo)位置處的字符作為選定字符。在步驟212,分析選定字符,判定其是否為分隔符。如果該選定字符是分隔符,則該處理在步驟214繼續(xù),其中判定該選定字符是否為EOF符。如果步驟214判定該選定字符為EOF符,則該處理結(jié)束。否則,步驟214前進(jìn)到步驟216,顯示該選定字符。例如,步驟216可以產(chǎn)生用來在標(biāo)準(zhǔn)的白色背景下顯示該字符的顯示數(shù)據(jù)。在步驟218,推進(jìn)光標(biāo)位置至輸入字符串中的下一個(gè)字符。然后,在步驟210,選擇新光標(biāo)位置處的字符作為新的選定字符,并且如前所述,處理200繼續(xù)處理新光標(biāo)位置處的字符。然而,如果在步驟212判定該選定字符不是分隔符,則該處理前進(jìn)到步驟220,調(diào)用處理300來確定可以利用從選定字符開始并包括選定字符的輸入字符串中的連續(xù)字符形成的最長詞。如果在步驟220確定的該最長詞的字長度大于或等于2(即該最長詞包含2個(gè)或更多個(gè)字),則該處理前進(jìn)到步驟224,利用處理600來處理該最長詞的歧義性。否則,步驟222前進(jìn)到步驟216,產(chǎn)生用于顯示該最長詞的顯示數(shù)據(jù)。在步驟224處理了該最長詞的歧義性之后,步驟226判定輸入字符串中的所有字都經(jīng)過處理。如果是,該處理結(jié)束。否則,在步驟228,推進(jìn)光標(biāo)至輸入字符串中緊跟在該最長詞后面的字符,并且將在步驟210選擇該新光標(biāo)位置處的字符為新的選定字符。圖3中的流程圖示出用于確定可以利用從選定字符開始并包括選定字符的輸入字符串中的連續(xù)字形成的最長詞的處理300。處理300在斷詞模塊108中執(zhí)行。處理300從步驟302開始,將用于存儲新字符的變量new_char初始定義為在處理200的步驟210中的光標(biāo)位置處選定的字符。在步驟304,表示對應(yīng)于最長詞的字符組中第一個(gè)可能字符的變量start_char也被定義為在處理200的步驟210中的光標(biāo)位置處選定的字符。在步驟306,將用于查詢鍵的變量CT_Key和FCT_Key復(fù)位為null或空字符串。步驟306前進(jìn)到步驟308,判定定義為new_char的字符是否為EOF符或終止符。如果是,步驟308前進(jìn)到步驟310,執(zhí)行在處理200中的步驟222繼續(xù)。否則,步驟308前進(jìn)到步驟312,判定定義為new_char的字符是否為換行符。如果是,則在步驟314,將輸入字符串中緊跟在該換行符后面的字符定義為新字符new_char,并且步驟314前進(jìn)到步驟308。否則,步驟312前進(jìn)到步驟316,其中將變量temp_string定義為輸入字符串中從定義為start_char的字符開始直到且包括當(dāng)前定義為new_char的字符的所有字符。在步驟318,使用處理400將定義為new_char的字符轉(zhuǎn)換為繁體漢字,并將結(jié)果保存在變量new_charT中。然后,在步驟320,將定義為new_charT的繁體漢字添加至現(xiàn)有的定義為CT_Key的查詢鍵中,并將更新后的結(jié)果保存為變量CT_Key。在步驟322,使用處理500將定義為new_char的字符強(qiáng)行轉(zhuǎn)換為繁體漢字,并將結(jié)果保存在變量new_charFT中。然后,在步驟324,將定義為new_charFT的繁體漢字添加至現(xiàn)有的定義為FCT_Key的查詢鍵中,并將更新結(jié)果保存為變量FCT_Key。在步驟326和328,分別嘗試使用CT_Key和FCT_Key各自的Unicode表示在復(fù)合字典118中查詢匹配的條目。兩個(gè)鍵中每一個(gè)的Unicode表示可分別通過那些鍵中每個(gè)字符的Unicode字符碼按照這些字符在每個(gè)鍵中出現(xiàn)的順序串接而成。然后,步驟330判定是否在復(fù)合字典118中找到CT_Key或FCT_Key的Unicode表示。如果是,在步驟332將定義為temp_string的字符串定義為最長詞。否則,在步驟334判定temp_string的字符長度(即包含在定義為temp_string的字符串中的字符數(shù))是否超過變量max_char所定義的最大搜索字符數(shù)。如果在步驟334判定temp_string中的字符數(shù)小于或等于定義為max_char的最大搜索字符數(shù),則在步驟336將輸入字符串中緊跟在temp_string最后字符后面的下一個(gè)字符定義為新字符new_char。否則,該處理前進(jìn)到步驟310,在調(diào)用執(zhí)行處理300的處理中調(diào)用執(zhí)行處理300之后的點(diǎn)(例如,在處理200中的步驟222,或者在處理800中的步驟802)恢復(fù)執(zhí)行。圖4的流程圖示出用于利用字符字典116和變體字典120將任何漢字轉(zhuǎn)換為繁體漢字的處理400。處理400在斷詞模塊108中執(zhí)行。處理400從步驟402開始,其中將要被轉(zhuǎn)換為繁體漢字的字符定義為變量input_char。在步驟404,判定字符字典116中是否存在定義為input_char的字符所對應(yīng)的Unicode字符碼。在字符字典116只包含由繁體漢字的Unicode字符碼標(biāo)識的條目的情況下,如果字符字典中找到input_char的Unicode表示,那么這個(gè)字就一定是繁體漢字。所以,如果在步驟404在字符字典116中找到相應(yīng)的條目,則在步驟406,將定義為input_char的字返回至調(diào)用執(zhí)行處理400的處理,并且在調(diào)用執(zhí)行處理400之后的點(diǎn)(例如,在處理300中的步驟320,或在處理700中的步驟716)恢復(fù)執(zhí)行。否則,步驟404前進(jìn)到步驟408,判定是否可以在變體字典120中找到定義為input_char的字符所對應(yīng)的Unicode字符碼,并且如果是,判定input_char的條目是否也有相應(yīng)的繁體變體字。如果是,步驟408前進(jìn)到步驟410,將變體字典120中與定義為input_char的字對應(yīng)的繁體變體字返回至調(diào)用執(zhí)行處理400的處理,并且在調(diào)用執(zhí)行處理400之后的點(diǎn)恢復(fù)執(zhí)行(例如,在處理300中的步驟320,或在處理700中的步驟716)。否則,步驟408前進(jìn)到步驟406。圖5的流程圖示出用于利用變體字典120將漢字強(qiáng)行轉(zhuǎn)換為其繁體變體的處理500。處理500在斷詞模塊108中執(zhí)行。處理500從步驟502開始,其中將要被轉(zhuǎn)換為繁體漢字的字定義為變量in_char。在步驟504,判定是否可以在變體字典120中找到定義為in_char的字符所對應(yīng)的Unicode字符碼,并且如果是,則判定in_char的條目是否具有對應(yīng)的繁體變體字。如果是,步驟504前進(jìn)到步驟506,將變體字典120中與定義為in_char的字對應(yīng)的繁體變體字返回至調(diào)用執(zhí)行處理500的處理,并且在調(diào)用執(zhí)行處理500之后的點(diǎn)繼續(xù)執(zhí)行(例如,在處理300中的步驟324或處理700中的步驟720)。否則,步驟504前進(jìn)到步驟408,將定義為in_char的字返回至調(diào)用執(zhí)行處理500的處理,并且在調(diào)用執(zhí)行處理500之后的點(diǎn)繼續(xù)執(zhí)行(例如,在處理300中的步驟324,或處理700中的步驟720)。有些漢字可能是繁體漢字,但是同一個(gè)漢字也可能是另一個(gè)繁體漢字的簡體字。例如,參考圖18,字1802(對應(yīng)于Unicode字符碼“51e0”)本身是意為“asmalltable”的繁體漢字。然而,對于如圖18所示的繁體漢字1804(對應(yīng)于Unicode字符碼“5e7e”),其簡化字也是同一個(gè)字,其含義為“howmany;several;afew;some”。處理400的作用是,如果要被轉(zhuǎn)換的原始字(即定義為input_char的字)本身是繁體漢字,則處理400將返回該原始字。然而,處理500的作用是,如果要被轉(zhuǎn)換的原始字(即定義為in_char的字)是有繁體變體的字,則無論定義為in_char的字是否為繁體字,處理500都將總是返回相應(yīng)的繁體變體字。圖6的流程圖示出用于使用最長詞中的每個(gè)字作為起始字產(chǎn)生詞列表然后根據(jù)該詞列表判定該最長詞是否有歧義的處理600。該詞列表包含復(fù)合詞,同樣也包括短語。方框602中所示的步驟在分析模塊110中執(zhí)行,而方框604中所示的步驟在顯示模塊106中執(zhí)行。處理600中的其余步驟在斷詞模塊108中執(zhí)行。處理600從步驟606開始,其中將最長詞中的第一個(gè)字定義為變量LW_first。在步驟608,將最長詞中最后字的字符位置定義為變量LW_last。LW_last表示該最長詞中最后字相對于第一個(gè)字的字符偏移量。在步驟610,選擇根字用作起始字,以便產(chǎn)生以該字開始的詞的列表。在步驟610,將代表根字的變量LW_root初始定義為最長詞中的第一個(gè)字。然后,在步驟612中判定定義為LW_root的字是否為分隔符。如果是,步驟612前進(jìn)到步驟614,在處理200的步驟226恢復(fù)執(zhí)行。否則,步驟612前進(jìn)到步驟616,利用處理700產(chǎn)生復(fù)合詞列表,其中列表中的每個(gè)復(fù)合詞都從定義為LW_root的字開始,并且該列表中的每個(gè)復(fù)合詞都由輸入字符串中跟隨且包括定義為LW_root的字符的連續(xù)字符組成。所形成的每個(gè)復(fù)合詞都存儲在由句柄list標(biāo)識的列表中。在產(chǎn)生了詞列表之后,步驟618判定是否最長詞中的所有字都經(jīng)過處理(即,是否最長詞中的每個(gè)字都被定義為LW_root以生成以該字開始的詞的列表)。如果否,步驟618前進(jìn)到步驟610,選擇輸入字符串中緊跟在當(dāng)前定義為LW_root的字后面的下一個(gè)字為新根字,然后更新變量LW_root以引用該新根字。否則,步驟618前進(jìn)到步驟620。由于該詞列表(標(biāo)識為list)中定義的詞總是包含最長詞,因此在步驟620,從該詞列表中將該最長詞移除。在步驟622,判定詞列表是否為空。如果是,這指示不能由從該最長詞的每個(gè)字開始的連續(xù)字符的組合形成另外的詞(除該最長詞之外)。也就是說,空列表表示該最長詞是無歧義的,因?yàn)樗鼪]有完全包含另一個(gè)詞,或者與另一個(gè)詞交疊。所以,如果詞列表為空,步驟622前進(jìn)到步驟624,將該最長詞顯示為無歧義。例如,在步驟624,產(chǎn)生單個(gè)無歧義復(fù)合詞中的所有字,以便根據(jù)這樣的顯示準(zhǔn)則來顯示,即按照交替順序的兩種背景色中的一種高亮顯示該復(fù)合詞(即在有色背景上顯示該復(fù)合詞),使得采用一種背景色高亮顯示一個(gè)復(fù)合詞,而采用另一種背景色高亮顯示隨后的復(fù)合詞。步驟624可采用第一種背景色(如灰色)高亮顯示第一個(gè)無歧義復(fù)合詞,而采用第二種背景色(如藍(lán)色)高亮顯示下一個(gè)無歧義復(fù)合詞。然后,將采用第一種背景色(如灰色)高亮顯示再下一個(gè)復(fù)合詞,以此類推,使得以交替的順序應(yīng)用這些背景色。步驟624繼續(xù)到步驟614,在處理200中的步驟226恢復(fù)執(zhí)行。如果在步驟622判定詞列表不為空,則步驟622前進(jìn)到步驟626,處理詞列表中的每個(gè)詞以識別定義為list的列表中的一個(gè)復(fù)合詞,該復(fù)合詞的最后字與定義為LW_first的字之間的字符偏移量最大。在步驟628,判定在步驟626確定的復(fù)合詞的最后字的字符偏移量是否大于定義為LW_last的字(即最長詞中的最后字)的字符偏移量。如果步驟628判定LW_last的字符偏移量未被超過,則最長詞因此完全包含其它復(fù)合詞,并且步驟628前進(jìn)到步驟630,以產(chǎn)生用于將當(dāng)前最長詞顯示為由于包含內(nèi)部復(fù)合詞而有歧義的顯示數(shù)據(jù)。舉例來說,步驟630可能產(chǎn)生用于按照顯示準(zhǔn)則顯示最長詞中的所有字(例如,在特定背景色如淺綠色上顯示這些字)的顯示數(shù)據(jù)。步驟630繼續(xù)到步驟614,在處理200中的步驟226恢復(fù)執(zhí)行。否則,由于該最長詞與另一個(gè)詞相交疊,其中該另一個(gè)詞超出當(dāng)前最長詞的最后字,因此步驟628前進(jìn)到步驟632。在步驟632,將該最長詞重新定義成包括輸入字符串中從LW_first(即最長詞的第一個(gè)字)開始直到且包括具有最大最后字符偏移量的詞(在步驟626確定)的最后字的所有字。步驟634產(chǎn)生這樣的顯示數(shù)據(jù),其用于將更新后的最長詞顯示為由于包含交疊復(fù)合詞而有歧義。舉例來說,在步驟634,產(chǎn)生更新后的最長詞中的所有字以便根據(jù)顯示準(zhǔn)則來顯示(例如,在特定的背景色如淺橙色上顯示這些字)。步驟634繼續(xù)到步驟608,用更新后的最長詞的新最后字的字符位置更新變量LW_last。然后,在步驟610,選擇緊跟在最長詞(在其被更新以前)后面的字作為下一個(gè)根字,并將其定義為LW_root。圖7的流程圖示出處理700,其用于從最長詞中的特定根字開始并且使用輸入字符串中跟隨該根字的連續(xù)字產(chǎn)生詞列表。處理700在斷詞模塊108中執(zhí)行。該處理從步驟702開始,其中來自處理600的根字初始地被用作產(chǎn)生一個(gè)或多個(gè)復(fù)合詞的第一個(gè)字,因此將其定義為變量next_char。在步驟703,將查詢鍵的變量CT_WKey和FCT_WKey復(fù)位為null或空字符串。在步驟704,判定定義為next_char的字是否為EOF符或終止符。如果是,步驟704前進(jìn)到步驟706,在調(diào)用執(zhí)行處理700的處理中調(diào)用執(zhí)行處理700之后的點(diǎn)(例如,在處理600中的步驟618或處理900中的步驟618)恢復(fù)執(zhí)行。否則,步驟704前進(jìn)到步驟708,其中判定定義為next_char的字是否為換行符。如果是,在步驟710,將輸入字符串中緊跟在該換行符后面的字定義為下一個(gè)字next_char,并且步驟710前進(jìn)到步驟704。否則,步驟708前進(jìn)到步驟712,其中將變量tmp_string定義為包括輸入字符串中從定義為LW_first的字開始直到且包括當(dāng)前定義為next_char的字的所有字。在步驟714,利用處理400將定義為next_char的字轉(zhuǎn)換為繁體漢字,并將結(jié)果保存在變量next_charT中。然后,在步驟716,將定義為next_charT的繁體漢字字添加至定義為CT_WKey的現(xiàn)有查詢鍵中,并將更新后的結(jié)果保存為變量CT_WKey。在步驟718,利用處理500將定義為next_char的字強(qiáng)行轉(zhuǎn)換為繁體漢字,并將結(jié)果保存在變量new_charFT中。然后,在步驟720,將定義為new_charFT的繁體漢字添加至定義為FCT_WKey的現(xiàn)有查詢鍵中,并將更新結(jié)果保存為變量FCT_WKey。在步驟722和724,分別嘗試使用CT_WKey和FCT_WKey各自的Unicode表示在復(fù)合字典118中查詢匹配的條目。這兩個(gè)鍵中每個(gè)鍵的Unicode表示可以分別由這些鍵中每個(gè)字符的Unicode字符碼按照這些字符在每個(gè)鍵中出現(xiàn)的順序串接而成。然后,在步驟726判定是否可以在復(fù)合字典118中找到CT_WKey或者FCT_WKey的Unicode表示。如果是,在步驟728,將定義為tmp_string的字符串添加至定義為list的詞列表中。否則,在步驟730判定tmp_string的字符長度(即定義為tmp_string的字符串所包含的字符數(shù))是否超過由變量max_char定義的最大搜索字符數(shù)。如果在步驟730判定tmp_string中的字符數(shù)小于或等于由max_char定義的最大搜索字符數(shù),則在步驟732將輸入字符串中緊跟在tmp_string的最后字后面的下一個(gè)字定義為下一字next_char。否則,由步驟730進(jìn)入步驟706。圖8的流程圖示出處理800,其用于處理從字符輸入模塊102接收的輸入字符串,以便顯示字典(如116、118和/或120)中與在輸入字符串中識別的詞或短語相關(guān)聯(lián)的描述性數(shù)據(jù)。處理800處理輸入字符串,以識別以輸入字符串中的特定字開始的復(fù)合詞(包括短語),然后檢索最長詞以及包含在該最長詞中的每個(gè)詞的描述性數(shù)據(jù)。處理800是處理200的一種變形,圖2和圖8中相同的標(biāo)號表示相同的步驟。但是,處理800沒有僅僅在處理200中存在的對應(yīng)步驟216或步驟222。處理800在斷詞模塊108中執(zhí)行。處理800從步驟204開始,并且以與上面關(guān)于處理200所述相同的方式執(zhí)行。然而,處理800中的步驟220前進(jìn)到新步驟802,其中調(diào)用處理900來檢索并顯示在字符字典116、復(fù)合字典118和/或變體字典120中定義的與最長詞相關(guān)聯(lián)的數(shù)據(jù)值。另外,在步驟802之后,該處理則前進(jìn)到步驟226。圖9的流程圖示出用于產(chǎn)生詞列表的處理900,其中這些詞包含在最長詞內(nèi)。處理900的步驟在斷詞模塊108中執(zhí)行。處理900從步驟902開始,其中將最長詞中的第一個(gè)字定義為變量Lookup_LW_first。在步驟904,選擇根字,其用作生成以該根字開始的復(fù)合詞的列表的起始點(diǎn)。在步驟904,將代表根字的變量Lookup_LW_root初始定義為最長詞的第一個(gè)字。然后,在步驟906判定定義為Lookup_LW_root的字是否為分隔符。如果是,步驟906前進(jìn)到步驟914,其中在處理800的步驟226恢復(fù)執(zhí)行。否則,步驟906前進(jìn)到步驟908,其中利用處理700產(chǎn)生包含一個(gè)或多個(gè)復(fù)合詞的列表,該列表中的每個(gè)復(fù)合詞都以定義為Lookup_LW_root的字開始,并且每個(gè)復(fù)合詞都由輸入字符串中跟隨且包括定義為Lookup_LW_root的字的連續(xù)字組成。所形成的每個(gè)復(fù)合詞都存儲在由句柄lookup_list標(biāo)識的列表中。生成了詞列表后,步驟910判定是否最長詞中的所有字都經(jīng)過處理(即,是否最長詞中的每個(gè)字都被定義為Lookup_LW_root以生成包含以該字開始的詞的列表)。如果否,步驟910前進(jìn)到步驟904,其中選擇輸入字符串中緊跟在當(dāng)前定義為Lookup_LW_root的字后面的下一個(gè)字為新的根字,并且更新變量Lookup_LW_root來引用該新的根字。否則,步驟910前進(jìn)到步驟912,其中利用處理1000來處理復(fù)合詞的lookup_list,這是通過查詢并檢索(從字符字典116、復(fù)合字典118和/或變體字典120)與lookup_list中的每個(gè)條目對應(yīng)的數(shù)據(jù),以及產(chǎn)生用于顯示檢索到的數(shù)據(jù)的顯示數(shù)據(jù)。然后,步驟912前進(jìn)到步驟914。圖10的流程圖示出處理1000,其用于從字符字典116、復(fù)合字典118和/或變體字典120中查詢并檢索與列表中的每個(gè)條目對應(yīng)的數(shù)據(jù),其中該列表包含一個(gè)或多個(gè)單獨(dú)字和/或一個(gè)或多個(gè)復(fù)合詞或短語。除了步驟1020在顯示模塊106中執(zhí)行以外,處理1000的步驟在查詢模塊112中執(zhí)行。處理1000從步驟1002開始,其中將變量input_list定義為用于訪問待處理的表(包括一個(gè)或多個(gè)條目,每個(gè)條目對應(yīng)于單獨(dú)的字或復(fù)合詞)的臨時(shí)句柄。舉例來說,input_list可以是指向現(xiàn)有列表(如由處理700、1100、1200或1300產(chǎn)生的表)的指針。在步驟1004,從input_list中選擇單個(gè)對應(yīng)于字或復(fù)合詞的條目,然后將其存儲在變量lookup_Key中。步驟1006利用lookup_Key的內(nèi)容在字符字典116中查詢與lookup_Key對應(yīng)的條目。在步驟1006,利用lookup_Key中單個(gè)字的Unicode字符碼表示、或者lookup_Key中每個(gè)字的Unicode字符碼(按照它們在lookup_Key中出現(xiàn)的順序串接)查詢字符字典116。如果在字符字典116中沒有找到任何條目,則步驟1006前進(jìn)到步驟1010。否則,步驟1006前進(jìn)到步驟1008,其中檢索字符字典116中與由lookup_Key標(biāo)識的字符條目相關(guān)聯(lián)的數(shù)據(jù)值(即,通過查詢包含在與字符字典116相對應(yīng)的一個(gè)或多個(gè)對象中的值)??梢詮淖址值?16中檢索的數(shù)據(jù)值包括與所標(biāo)識的字符條目相對應(yīng)的字的Unicode字符碼、代表與所標(biāo)識的字符條目相對應(yīng)的的一個(gè)或多個(gè)讀音表示的讀音數(shù)據(jù)(如拼音)、代表與所標(biāo)識的字符條目相對應(yīng)的字的音頻表示的音頻數(shù)據(jù)和/或代表與所標(biāo)識的字符條目相對應(yīng)的一個(gè)或多個(gè)翻譯字符串的定義數(shù)據(jù)。還可以檢索在字符字典116中定義的其它數(shù)據(jù)值。步驟1008前進(jìn)到步驟1010。在步驟1010,利用存放在lookup_Key中的單個(gè)字或復(fù)合詞在變體字典120中查詢由lookup_Key標(biāo)識的對應(yīng)條目。步驟1010利用lookup_Key中單個(gè)字的Unicode字符碼表示、或者lookup_Key中每個(gè)字的Unicode字符碼(按照它們在lookup_Key中出現(xiàn)的順序串接)查詢變體字典120。如果在變體字典120中沒有找到任何條目,則步驟1010前進(jìn)到步驟1014。否則,步驟1010前進(jìn)到步驟1012,其中檢索變體字典120中與由lookup_Key標(biāo)識的條目相關(guān)聯(lián)的數(shù)據(jù)值(即,通過查詢包含在與變體字典120中的條目相對應(yīng)的一個(gè)或多個(gè)對象中的值)。可以從變體字典120中檢索的數(shù)據(jù)值包括與特定字符條目相對應(yīng)的簡體變體字、一個(gè)或多個(gè)繁體變體字、和/或一個(gè)或多個(gè)語義變體字。還可以檢索在變體字典120中定義的其他數(shù)據(jù)值。步驟1012前進(jìn)到步驟1014。在步驟1014,利用存儲在lookup_Key中的單個(gè)字或復(fù)合詞在復(fù)合字典118中查詢由lookup_Key標(biāo)識的對應(yīng)條目。步驟1014利用lookup_Key中單個(gè)字的Unicode字符碼表示、或者lookup_Key中每個(gè)字的Unicode字符碼(按照它們在lookup_Key中出現(xiàn)的順序串接)查詢復(fù)合字典118。如果在復(fù)合字典118中沒有找到任何條目,則步驟1014前進(jìn)到步驟1018。否則,步驟1014前進(jìn)到步驟1016,其中檢索復(fù)合字典118中與由lookup_Key標(biāo)識的條目相關(guān)聯(lián)的數(shù)據(jù)值(即,通過查詢包含在與復(fù)合字典118中的復(fù)合詞條目相對應(yīng)的一個(gè)或多個(gè)對象中的值)??梢詮膹?fù)合字典118中檢索的數(shù)據(jù)值包括識別所標(biāo)識的復(fù)合詞條目的Unicode字符碼的唯一組合、代表與所標(biāo)識的復(fù)合詞條目相對應(yīng)的讀音表示的讀音數(shù)據(jù)(如拼音)、代表與所標(biāo)識的復(fù)合詞條目相對應(yīng)的復(fù)合詞的音頻表示的音頻數(shù)據(jù)和/或代表與所標(biāo)識的復(fù)合詞條目相對應(yīng)的翻譯字符串的定義數(shù)據(jù)。還可以檢索在復(fù)合字典118中定義的其它數(shù)據(jù)。步驟1016前進(jìn)到步驟1018。步驟1018為顯示模塊106產(chǎn)生顯示數(shù)據(jù),以顯示與lookup_Key對應(yīng)的所有檢索到的數(shù)據(jù)值(如Unicode字符碼、讀音數(shù)據(jù)、音頻數(shù)據(jù)、定義數(shù)據(jù)、簡體變體字、繁體變體字和/或語義變體字)。步驟1020判定是否input_list中的每個(gè)詞都已經(jīng)過處理(即用作lookup_Key)。如果否,則步驟1020前進(jìn)到步驟1004,其中選擇input_list中的下一個(gè)條目,并將其定義為lookup_Key的新值,并且根據(jù)如上所述的處理1000中的步驟處理該lookup_Key的新值。否則,步驟1020前進(jìn)到步驟1022,其中在調(diào)用執(zhí)行處理1000調(diào)用的處理中恢復(fù)執(zhí)行。圖11的流程圖示出處理1100,其用于利用從包含一個(gè)或多個(gè)拼音音節(jié)的輸入字符串得到的拼音音節(jié)產(chǎn)生條目列表,其中每個(gè)條目對應(yīng)于單個(gè)字或復(fù)合詞。除了步驟1108和1110在查詢模塊112中執(zhí)行并且步驟1114部分地在查詢模塊112和顯示模塊106中執(zhí)行以外,處理1100中的其它步驟都在斷詞模塊108中執(zhí)行。處理1100從步驟1102開始,其中從用戶獲取拼音音節(jié)的輸入字符串。例如,用戶可以將一個(gè)或多個(gè)拼音音節(jié)輸入到字符輸入模塊102的輸入域中。如前所述,拼音音節(jié)至少有文本部分(表示該音節(jié)的聲音或發(fā)音),并且優(yōu)選地,還有與該文本部分對應(yīng)的音調(diào)部分。例如,所輸入的拼音音節(jié)可以為“kou3”,其中“kou”對應(yīng)于文本部分,而“3”為對應(yīng)于音調(diào)部分的數(shù)字標(biāo)識符。優(yōu)選地,拼音音節(jié)以“text#”的格式輸入,其中單詞“text”表示該音節(jié)的文本部分,符號“#”代表一個(gè)用于標(biāo)識音調(diào)部分的整數(shù)。更優(yōu)選地,如果只輸入拼音音節(jié)的文本部分而沒有相應(yīng)的音調(diào),則在下述查詢處理中將假定針對能夠與用戶輸入的文本部分形成的每一種音調(diào)組合進(jìn)行獨(dú)立的搜索。所采用的拼音可以是標(biāo)準(zhǔn)的普通話拼音。但是,應(yīng)當(dāng)理解,本發(fā)明也可以與字的其它拼音或其他讀音表示形式一起工作。在步驟1104,解析拼音音節(jié)的輸入字符串,從而識別輸入字符串中的每一個(gè)拼音音節(jié),以及對應(yīng)于每一個(gè)音節(jié)的文本部分和音調(diào)部分。舉例來說,典型地,輸入拼音音節(jié)時(shí)每個(gè)音節(jié)之間都會有一個(gè)空格,所以步驟1104的解析可能涉及到基于字符串中空格符的位置斷開拼音音節(jié)的輸入字符串。步驟1106判定輸入字符串是否只包含一個(gè)拼音音節(jié)(即輸入字符串中的拼音對應(yīng)于單個(gè)字還是復(fù)合詞或短語)。如果輸入字符串只包含一個(gè)拼音音節(jié),則步驟1106前進(jìn)到步驟1108,其中在字符字典116中搜索每個(gè)條目的拼音數(shù)據(jù)字段的值,并且僅檢索具有與所輸入的拼音音節(jié)對應(yīng)的拼音數(shù)據(jù)字段的字(如Unicode字符碼)。在步驟1112,將所檢索的字添加到通過句柄pinyin_list引用的列表中。否則,如果步驟1106判定輸入字符串包含多于一個(gè)拼音音節(jié),那么該輸入字符串一定對應(yīng)于復(fù)合詞或短語,步驟1106前進(jìn)到步驟1110。在步驟1110,搜索復(fù)合字典118中的每個(gè)條目,以僅檢索那些具有拼音表示(由對應(yīng)于按照輸入順序的每個(gè)輸入拼音音節(jié)的串接組合形成)的復(fù)合詞(包括短語)。如果復(fù)合字典118中復(fù)合詞(或短語)的拼音表示完全包含按照輸入順序的每個(gè)輸入拼音音節(jié),那么在步驟1110也檢索該復(fù)合詞。在步驟1112,將所檢索的復(fù)合詞添加到通過句柄pinyin_list引用的列表中。然后,步驟1112前進(jìn)到步驟1114,其中使用處理1000以利用字符字典116和/或復(fù)合字典118中定義的數(shù)據(jù)值,查詢、檢索并顯示與pinyin_list中的每個(gè)條目相關(guān)聯(lián)的數(shù)據(jù)值。步驟1114之后,處理1100結(jié)束。圖12的流程圖示出處理1200,其用于利用從輸入字符串得到的關(guān)鍵詞生成條目列表,其中每個(gè)條目對應(yīng)于單個(gè)字或復(fù)合詞。除了步驟1206在查詢模塊112中執(zhí)行并且步驟1210部分地在查詢模塊112和顯示模塊106中執(zhí)行以外,處理1200中的其它步驟都在斷詞模塊108中執(zhí)行。處理1200從步驟1202開始,其中從用戶獲得關(guān)鍵詞的輸入字符串。例如,用戶可將一個(gè)或多個(gè)關(guān)鍵詞輸入到字符輸入模塊102的輸入域中。通常,關(guān)鍵詞指的是用戶認(rèn)為與其試圖檢索的字或復(fù)合詞的含義相關(guān)的任何詞。在步驟1204,解析輸入字符串,從而在輸入字符串中識別一個(gè)或多個(gè)關(guān)鍵詞中的每一個(gè)。在步驟1206,搜索定義數(shù)據(jù)(例如,與字符字典116和/或復(fù)合字典118中的每個(gè)條目相關(guān)聯(lián)的翻譯字符串),并且只有當(dāng)對應(yīng)翻譯字符串至少包含輸入關(guān)鍵詞中的至少一些時(shí),才(從字典116或118中)檢索字或復(fù)合詞。在步驟1208,將所檢索的字和/或關(guān)鍵詞添加至由句柄keyword_list引用的列表中。然后,在步驟1210,使用處理1000以利用字符字典116和/或復(fù)合字典118中定義的數(shù)據(jù)值,查詢、檢索并顯示與keyword_list中的每個(gè)條目相關(guān)聯(lián)的數(shù)據(jù)值。在步驟1210之后,處理1200結(jié)束。圖13的流程圖示出處理1300,其用于利用從輸入字符串中得到的字,生成條目列表,其中每個(gè)條目對應(yīng)于單個(gè)字或復(fù)合詞。在處理1300中,除了步驟1308、1310、1314和1316在查詢模塊112中執(zhí)行,并且步驟1318部分地在查詢模塊112和顯示模塊106中執(zhí)行以外,其它步驟都在斷詞模塊108中執(zhí)行。處理1300從步驟1302開始,其中從用戶獲得漢字的輸入字符串。例如,用戶可將一個(gè)或多個(gè)漢字輸入到字符輸入模塊102的輸入域中。在這一階段,用戶輸入的字可以既可以是繁體漢字也可以是簡體漢字。在步驟1304,解析輸入字符串,從而在輸入字符串中識別一個(gè)或多個(gè)字中的每一個(gè)(例如通過確定作為輸入字符串而輸入的每個(gè)字的Unicode字符碼)。步驟1306判定輸入字符串是否只包含一個(gè)字。如果輸入字符串只包含一個(gè)字,則步驟1306前進(jìn)到步驟1308,其中利用處理400和處理500中的任意一個(gè)或兩個(gè),將該字轉(zhuǎn)換為繁體漢字。在步驟1310,利用從處理400或處理500返回的字所對應(yīng)的Unicode字符碼查詢字符字典116中的每一個(gè)條目。如果字符字典116中的一個(gè)條目與該輸入字的Unicode字符碼匹配,則在步驟1310,將該輸入字添加至由句柄character_list標(biāo)識的列表中。否則,如果步驟1306確定該輸入字符串包含多于一個(gè)字,則將輸入字符串中的字作為復(fù)合詞看待,并且步驟1306前進(jìn)到步驟1314。在步驟1314,利用處理400和處理500中的任何一個(gè)或兩個(gè),將輸入字符串中的每一個(gè)字轉(zhuǎn)換為繁體漢字。在步驟1316,利用輸入字符串中每一個(gè)輸入字的Unicode字符碼,其中這些Unicode字符碼按照輸入字符串中的其輸入順序而串接起來,形成一個(gè)鍵。該鍵用來在復(fù)合字典118中查詢匹配的條目。如果未找到匹配的條目,則在步驟1316,將輸入字符串中的復(fù)合詞添加到由句柄character_list標(biāo)識的列表中。在步驟1310或步驟1316之后,該處理前進(jìn)到步驟1318,其中使用處理1000以利用字符字典116和/或復(fù)合字典118中定義的數(shù)據(jù)值,查詢、檢索并顯示與pinyin_list中的每個(gè)條目相關(guān)聯(lián)的數(shù)據(jù)值。在步驟1318之后,處理1300結(jié)束。將字轉(zhuǎn)換為繁體漢字的步驟只是本發(fā)明的一些適用于漢字處理的優(yōu)選實(shí)施例中的可選特性。應(yīng)當(dāng)理解,如果字典條目包括由繁體漢字及其相應(yīng)的簡體漢字的Unicode字符碼標(biāo)識的條目,則不需要那些步驟。列表1&lt;xmlversion="1.0"encoding="UTF-8"&gt;&lt;allGlyphs&gt;…&lt;glyph&gt;&lt;unicode&gt;53e3&lt;/unicode&gt;&lt;pinyin&gt;kou3&lt;/pinyin&gt;&lt;kDefinition&gt;mouth;opening;entrance;cut;hole;theedgeofaknife;&lt;/kDefinition&gt;&lt;/glyph&gt;…&lt;/allGlyphs&gt;列表2&lt;/xmlversion="1.0"encoding="UTF-8"&gt;&lt;allGlyphs&gt;…&lt;glyph&gt;&lt;unicode&gt;4f9b&lt;/unicode&gt;&lt;pinyin&gt;gong1&lt;/pinyin&gt;&lt;kDefinition&gt;supply;provide;&lt;/kDefinition&gt;&lt;pinyin&gt;gong4&lt;/pinyin&gt;&lt;kDefinition&gt;lay(offerings);confess;ownup;&lt;/kDefinition&gt;&lt;/glyph&gt;…&lt;/allGlyphs&gt;列表3&lt;xmlversion="1.0"encoding="UTF-8"&gt;&lt;allCompounds&gt;…&lt;compound&gt;&lt;tuplepinyin="ming2"unicode="660e"/&gt;&lt;tuplepinyin="tian1"unicode="5929"/&gt;&lt;english&gt;tomorrow&lt;/english&gt;&lt;/compound&gt;…&lt;/allCompounds&gt;列表4&lt;xmlversion="1.0"encoding="UTF-8"&gt;&lt;allGlyphs&gt;…&lt;glyph&gt;&lt;unicode&gt;9452&lt;/unicode&gt;&lt;kSimplifiedVariant&gt;9274&lt;/kSinplifiedVariant&gt;&lt;kSemantlcVariant&gt;9451&lt;/kSermanticVariant&gt;&lt;/glyph&gt;…&lt;glyph&gt;&lt;unicode&gt;9274&lt;/unicode&gt;&lt;tradVariant&gt;94529451&lt;/tradVariant&gt;&lt;/glyph&gt;…&lt;glyph&gt;&lt;unicode&gt;9451&lt;/unicode&gt;&lt;kSimplifiedVariant&gt;9274&lt;/kSimplifiedVariant&gt;&lt;kSemanticVariant&gt;9452&lt;/kSernanticVariant&gt;&lt;/glyph&gt;…&lt;/allGlyphs&gt;權(quán)利要求1.一種用于為用戶界面產(chǎn)生顯示數(shù)據(jù)的方法,所述方法包括(i)接收包括表意字符的輸入字符串;(ii)從所述輸入字符串中選擇表意字符;(iii)產(chǎn)生從所述選擇的字符開始的第一詞或短語,所述第一詞或短語對應(yīng)于所述輸入字符串中與字典中的詞或短語相對應(yīng)的最大連續(xù)表意字符;(iv)針對所述第一詞或短語中的每個(gè)字符,基于所述輸入字符串中從所述第一詞或短語中的字符開始的多個(gè)連續(xù)表意字符而產(chǎn)生附加詞或短語,每個(gè)所述附加詞或短語對應(yīng)于所述字典中的詞或短語;以及(v)在所述用戶界面上產(chǎn)生用于顯示所述輸入字符串中的連續(xù)字符組的所述顯示數(shù)據(jù),所述組包括所述第一詞或短語以及所述附加詞或短語中的所有字符,所述組基于所述附加詞或短語相對于所述第一詞或短語的位置被顯示。2.如權(quán)利要求1所述的方法,其中,所述表意字符為漢字。3.如權(quán)利要求1所述的方法,其中,所述顯示數(shù)據(jù)表示根據(jù)所述附加詞或短語相對于所述第一詞或短語的位置按照不同的顯示準(zhǔn)則在所述用戶界面上顯示的所述字符組。4.如權(quán)利要求3所述的方法,其中,如果所述第一詞或短語不包括所述附加詞或短語中的任何字符,則所述顯示數(shù)據(jù)表示按照第一顯示準(zhǔn)則在所述用戶界面上顯示的所述字符組。5.如權(quán)利要求4所述的方法,其中,如果所述第一詞或短語包括所述附加詞或短語中的所有字符,則所述顯示數(shù)據(jù)表示按照第二顯示準(zhǔn)則在所述用戶界面上顯示的所述字符組。6.如權(quán)利要求5所述的方法,其中,如果所述第一詞或短語包括所述附加詞或短語中至少一些但并全部的字符,則所述顯示數(shù)據(jù)表示按照第三顯示準(zhǔn)則在所述用戶界面上顯示的所述字符組。7.如權(quán)利要求3到6中的任一項(xiàng)所述的方法,其中,所述顯示準(zhǔn)則定義所述字符組的一個(gè)或多個(gè)視覺特性,包括所述字符組的字體尺寸和/或字體類型;所述字符組的風(fēng)格,包括將所述字符組定義成以粗體、斜體和/或帶下劃線顯示;和/或所述字符組的顯示背景,包括有色背景。8.如權(quán)利要求2所述的方法,其中,將所述第一詞或短語中的所述字符轉(zhuǎn)換為繁體漢字,以便確定所述第一詞或短語是否對應(yīng)于所述字典中的詞或短語。9.如權(quán)利要求2所述的方法,其中,將所述附加詞或短語中的所述字轉(zhuǎn)換為繁體漢字,以便針對每個(gè)附加詞或短語,確定所述附加詞或短語中的一個(gè)是否對應(yīng)于所述字典中的詞或短語。10.如權(quán)利要求1所述的方法,包括根據(jù)所述顯示數(shù)據(jù)在所述用戶界面上顯示所述連續(xù)字符組。11.如權(quán)利要求1所述的方法,所述方法還包括(vi)從所述字典中檢索與所述第一詞或短語相關(guān)聯(lián)的字典數(shù)據(jù),所述字典數(shù)據(jù)包括定義數(shù)據(jù)、音頻數(shù)據(jù)和/或讀音數(shù)據(jù);(vii)產(chǎn)生用于在所述用戶界面上顯示的附加顯示數(shù)據(jù),所述附加顯示數(shù)據(jù)包括基于所述字典數(shù)據(jù)的所述第一詞或短語的至少一種表示。12.如權(quán)利要求11所述的方法,包括基于所述附加顯示數(shù)據(jù)在所述用戶界面上顯示所述第一詞或短語的所述至少一種表示。13.如權(quán)利要求11所述的方法,其中,所述附加顯示數(shù)據(jù)表示用于描述所述第一詞或短語的文本,基于從所述字典數(shù)據(jù)中獲得的所述定義數(shù)據(jù);用于表示所述第一詞或短語的音頻信號,基于從所述字典數(shù)據(jù)中獲得的所述音頻數(shù)據(jù);和/或所述第一詞或短語的讀音表示,所述讀音表示包括拼音,基于從所述字典數(shù)據(jù)中獲得的所述讀音數(shù)據(jù)。14.如權(quán)利要求11所述的方法,所述方法還包括(vi)(a)檢索與所述附加詞或短語中的一個(gè)相關(guān)聯(lián)的附加字典數(shù)據(jù),所述附加字典數(shù)據(jù)包括定義數(shù)據(jù)、音頻和/或讀音數(shù)據(jù);(vii)(a)產(chǎn)生用于在所述用戶界面上顯示的所述附加顯示數(shù)據(jù),所述附加顯示數(shù)據(jù)進(jìn)一步包括基于所述附加字典數(shù)據(jù)的所述附加詞或短語的至少一種表示。15.如權(quán)利要求14所述的方法,包括基于所述附加顯示數(shù)據(jù)在所述用戶界面上顯示所述附加詞或短語的所述至少一種表示。16.如權(quán)利要求14所述的方法,其中,所述附加顯示數(shù)據(jù)表示用于描述所述附加詞或短語的文本,基于從所述附加字典數(shù)據(jù)中獲得的所述定義數(shù)據(jù);用于表示所述附加詞或短語的音頻信號,基于從所述附加字典數(shù)據(jù)中獲得的所述音頻數(shù)據(jù);和/或所述附加詞或短語的讀音表示,所述讀音表示包括拼音,基于從所述附加字典數(shù)據(jù)中獲得的所述讀音數(shù)據(jù)。17.一種用于執(zhí)行如權(quán)利要求1到16所述的方法的系統(tǒng)。18.一種計(jì)算機(jī)可讀存儲介質(zhì),包含用于執(zhí)行如權(quán)利要求1到16所述的方法的計(jì)算機(jī)可執(zhí)行代碼。19.一種用于為用戶界面產(chǎn)生顯示數(shù)據(jù)的系統(tǒng),包括(i)用于接收包括表意字符的輸入字符串的裝置;(ii)用于從所述輸入字符串中選擇表意字符的裝置;(iii)用于存儲字典的存儲器;(iv)詞產(chǎn)生器,用于產(chǎn)生從所述選擇的字符開始的第一詞或短語,所述第一詞或短語對應(yīng)于所述輸入字符串中與所述字典中的詞或短語相對應(yīng)的最大連續(xù)表意字符;并且針對所述第一詞或短語中的每個(gè)字符,產(chǎn)生從所述第一詞或短語中的字符開始的附加詞或短語,每個(gè)所述附加詞或短語基于所述輸入字符串中的多個(gè)連續(xù)表意字符而產(chǎn)生,并且每個(gè)所述附加詞或短語對應(yīng)于所述字典中的詞或短語;以及(v)用于在所述用戶界面上產(chǎn)生用于顯示所述輸入字符串中的連續(xù)字符組的所述顯示數(shù)據(jù)的裝置,所述組包括所述第一詞或短語以及所述附加詞或短語中的所有字符,其中所述字符組的顯示基于所述附加詞或短語相對于所述第一詞或短語的位置。20.如權(quán)利要求19所述的系統(tǒng),其中,所述用于產(chǎn)生所述顯示數(shù)據(jù)的裝置產(chǎn)生這樣的顯示數(shù)據(jù),其用于根據(jù)所述附加詞或短語相對于所述第一詞或短語的位置,按照不同的顯示準(zhǔn)則在所述用戶界面上顯示所述字符組。21.如權(quán)利要求19所述的系統(tǒng),包括用于根據(jù)所述顯示數(shù)據(jù)顯示所述連續(xù)字符組的所述用戶界面。22.如權(quán)利要求19所述的系統(tǒng),還包括(vi)用于從所述字典中檢索與所述第一詞或短語相關(guān)聯(lián)的字典數(shù)據(jù)的裝置,所述字典數(shù)據(jù)包括定義數(shù)據(jù)、音頻數(shù)據(jù)和/或讀音數(shù)據(jù);并且其中所述用于產(chǎn)生所述顯示數(shù)據(jù)的裝置包括用于產(chǎn)生附加顯示數(shù)據(jù)的裝置,所述附加顯示數(shù)據(jù)包括用于在所述用戶界面上顯示的、基于所述字典數(shù)據(jù)的所述第一詞或短語的至少一種表示。23.如權(quán)利要求22所述的系統(tǒng),包括用于基于所述附加顯示數(shù)據(jù)而顯示所述第一詞或短語的所述至少一種表示的所述用戶界面。24.如權(quán)利要求22所述的系統(tǒng),其中,所述附加顯示數(shù)據(jù)表示用于描述所述第一詞或短語的文本,基于從所述字典數(shù)據(jù)中獲得的所述定義數(shù)據(jù);用于表示所述第一詞或短語的音頻信號,基于從所述字典數(shù)據(jù)中獲得的所述音頻數(shù)據(jù);和/或所述第一詞或短語的讀音表示,所述讀音表示包括拼音,基于從所述字典數(shù)據(jù)中獲得的所述讀音數(shù)據(jù)。25.如權(quán)利要求22所述的系統(tǒng),還包括(vii)用于檢索與所述附加詞或短語之一相關(guān)聯(lián)的附加字典數(shù)據(jù)的裝置,所述附加字典數(shù)據(jù)包括定義數(shù)據(jù)、音頻數(shù)據(jù)和/或讀音數(shù)據(jù);其中所述用于產(chǎn)生所述附加字典數(shù)據(jù)的裝置產(chǎn)生所述附加字典數(shù)據(jù),所述附加字典數(shù)據(jù)進(jìn)一步包括用于在所述用戶界面上顯示的、基于所述附加字典數(shù)據(jù)的所述附加詞或短語的至少一種表示。26.如權(quán)利要求25所述的系統(tǒng),包括用于基于所述附加字典數(shù)據(jù)顯示所述附加詞或短語的所述至少一種表示的所述用戶界面。27.如權(quán)利要求25所述的系統(tǒng),其中,所述附加字典數(shù)據(jù)表示用于描述所述附加詞或短語的文本,基于從所述附加字典數(shù)據(jù)中獲得的所述定義數(shù)據(jù);用于表示所述附加詞或短語的音頻信號,基于從所述附加字典數(shù)據(jù)中獲得的所述音頻數(shù)據(jù);和/或所述附加詞或短語的讀音表示,所述讀音表示包括拼音,基于從所述附加字典數(shù)據(jù)中獲得的所述讀音數(shù)據(jù)。全文摘要一種用于為用戶界面產(chǎn)生顯示數(shù)據(jù)的方法和系統(tǒng),包括(i)接收包括表意字符的輸入字符串;(ii)從所述輸入字符串中選擇表意字符;(iii)產(chǎn)生從所述選擇的字符開始的第一詞或短語,所述第一詞或短語對應(yīng)于所述輸入字符串中與字典中的詞或短語相對應(yīng)的最大連續(xù)表意字符;(iv)針對所述第一詞或短語中的每個(gè)字符,基于所述輸入字符串中從所述第一詞或短語的字符開始的多個(gè)連續(xù)表意字符產(chǎn)生附加詞或短語,每個(gè)所述附加詞或短語對應(yīng)于所述字典中的詞或短語;并且(v)在所述用戶界面上產(chǎn)生用于顯示所述輸入字符串中的連續(xù)字符組的所述顯示數(shù)據(jù),所述組包括所述第一詞或短語以及所述附加詞或短語中的所有字符,所述組基于所述附加詞或短語相對于所述第一詞或短語的位置被顯示。文檔編號G06F17/20GK1993692SQ200580016531公開日2007年7月4日申請日期2005年5月20日優(yōu)先權(quán)日2004年5月24日發(fā)明者邁爾斯·帕特里克·哈丁申請人:紫熊貓有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1