專(zhuān)利名稱(chēng):輸入系統(tǒng)語(yǔ)意分析數(shù)據(jù)散列存儲(chǔ)和分析方法
技術(shù)領(lǐng)域:
本發(fā)明涉及人機(jī)交互領(lǐng)域,尤其涉及一種輸入系統(tǒng)語(yǔ)意分析數(shù)據(jù)散列存儲(chǔ)和分析方法。
背景技術(shù):
傳統(tǒng)的輸入系統(tǒng),尤其是指移動(dòng)終端中由輸入法軟件所構(gòu)成的系統(tǒng),運(yùn)用多種輸入法規(guī)則對(duì)用戶(hù)的按鍵操作進(jìn)行構(gòu)詞,構(gòu)詞后相關(guān)的字符串供給其它軟件進(jìn)行相應(yīng)處理。世界上因?yàn)檎Z(yǔ)種的差異,出現(xiàn)多種文字(語(yǔ)言),相應(yīng)也就具有多種輸入規(guī)則,甚至同一種文字(語(yǔ)言)也會(huì)有多種不同的輸入規(guī)則,例如中文輸入法中,公知的,包括五筆、拼音、鄭碼、自然碼、區(qū)位碼等多種輸入規(guī)則均可用于構(gòu)造漢字字詞。
針對(duì)移動(dòng)終端體積較小的特殊性,多采用九宮格鍵盤(pán),并通過(guò)“1-9”等按鍵分布多個(gè)構(gòu)成輸入規(guī)則基本碼元,如英文輸入法將其26個(gè)字母分布在“1-9”按鍵中,中文拼音輸入法以與英文輸入法按鍵分布相同的方案采用26個(gè)英文字母作為其拼音字母、中文五筆輸入法以與英文輸入法按鍵分布相同的方案采用25個(gè)英文字母作為其字根分布方案等。在這種情況下,運(yùn)用輸入規(guī)則進(jìn)行構(gòu)詞基本上已成為本領(lǐng)域內(nèi)普通技術(shù)人員熟知的技術(shù),而如何在體積較小的移動(dòng)終端中進(jìn)一步挖掘其應(yīng)用潛力卻始終是本領(lǐng)域探索的重點(diǎn)。
由于國(guó)際上通用英文鍵盤(pán),故按鍵產(chǎn)生的碼元一般也以英文字母予以表征,碼元由此作為構(gòu)成目標(biāo)字詞的基本單位使用。傳統(tǒng)的輸入系統(tǒng)中的輸入規(guī)則,都只負(fù)責(zé)完成從按鍵碼元(如a,b,s,e,n,t等鍵)到字符或者字詞(如連續(xù)按下組成單詞“absent”)的對(duì)應(yīng)關(guān)系,故其存儲(chǔ)系統(tǒng)中,也只存儲(chǔ)按鍵的碼元組合與相應(yīng)字詞之間的映射關(guān)系。因此,傳統(tǒng)的輸入系統(tǒng)與操作系統(tǒng)上附載的其它軟件、數(shù)據(jù)等功能性對(duì)象在使用上是相互獨(dú)立的,無(wú)法從語(yǔ)意上對(duì)用戶(hù)輸入進(jìn)行解析并做出相應(yīng)的響應(yīng),因而一般用戶(hù)輸入只局限于文字編輯,而不涉及功能性對(duì)象的操作。
一種例外的情況是預(yù)先賦予某些按鍵或按鍵組合與某功能對(duì)象之間以特定的對(duì)應(yīng)關(guān)系,使兩者唯一性對(duì)應(yīng),這樣,在人機(jī)交互的過(guò)程中,用戶(hù)可以通過(guò)某些特定功能按鍵啟動(dòng)某程序。這種情況多表現(xiàn)在個(gè)人計(jì)算機(jī)上,如其功能區(qū)F1鍵用于打開(kāi)系統(tǒng)“幫助”文件;也見(jiàn)于某些手機(jī)的預(yù)設(shè)按鍵上,如其某個(gè)按鍵可以用于運(yùn)行攝像機(jī)程序等。
無(wú)論如何,即使是以上的這些例外,也都無(wú)法對(duì)用戶(hù)輸入的內(nèi)容本身進(jìn)行語(yǔ)意分析,以實(shí)現(xiàn)“理解”用戶(hù)的操作意向的目的。移動(dòng)終端鍵盤(pán)(包括硬鍵盤(pán)和軟鍵盤(pán))上的按鍵被分為相互獨(dú)立性較強(qiáng)的兩部分,一為用于編輯文字部分,如“1-9”、回車(chē)鍵、翻頁(yè)鍵等;另一為功能操作部分,如指向“word.exe”程序的預(yù)設(shè)專(zhuān)用按鍵或按鍵組合。但是編輯文字部分的按鍵與功能操作部分的按鍵之間不存在必然的聯(lián)系。因而,按照這種情況,將用戶(hù)的按鍵操作與其意圖所指向的功能性對(duì)象在鍵盤(pán)上一一對(duì)應(yīng)將變得不切實(shí)際,因?yàn)椴僮飨到y(tǒng)上功能性對(duì)象多不勝數(shù),無(wú)法在較小的鍵盤(pán)區(qū)域中分布等量數(shù)額的按鍵。
從用戶(hù)的思維習(xí)慣出發(fā),便會(huì)對(duì)輸入系統(tǒng)的智能化有相應(yīng)的要求,例如,當(dāng)用戶(hù)輸入“音樂(lè)”時(shí),可能希望能得到與“音樂(lè)”相關(guān)的一些信息,包括機(jī)載音樂(lè)列表、機(jī)載音樂(lè)播放器、音樂(lè)下載地址、音樂(lè)在線搜索網(wǎng)址等,單純地依靠傳統(tǒng)的輸入系統(tǒng),顯然無(wú)法滿(mǎn)足用戶(hù)的這種需求。
由此可見(jiàn),目前公知的輸入系統(tǒng)中,不具有分析用戶(hù)輸入的詞組的語(yǔ)義和意向的基本能力,無(wú)法實(shí)現(xiàn)更高智能化層次的人機(jī)交互功能。要實(shí)現(xiàn)對(duì)用戶(hù)輸入的詞組的語(yǔ)義和意向進(jìn)行分析,則需運(yùn)用模糊思維,構(gòu)建用戶(hù)可能輸入的若干詞組與該些詞組所蘊(yùn)涵的語(yǔ)義,及該語(yǔ)義所表征的用戶(hù)意向之間的對(duì)應(yīng)關(guān)系,形成滿(mǎn)足用戶(hù)一般思維活動(dòng)所需的基礎(chǔ)性的語(yǔ)意分析數(shù)據(jù),融合于輸入系統(tǒng)中,然后再由機(jī)器利用此一語(yǔ)意分析數(shù)據(jù)對(duì)用戶(hù)輸入詞組的語(yǔ)意進(jìn)行具體分析,最終能實(shí)現(xiàn)對(duì)用戶(hù)輸入的及時(shí)響應(yīng),讓用戶(hù)達(dá)到所想即所得(Thinking To Thing)的目的。
以上即為本申請(qǐng)人提出本發(fā)明之前的技術(shù)演進(jìn)思路。
但是,難題不限于以上宏觀描述,眾所周知的,模糊思維所構(gòu)造出的語(yǔ)意分析數(shù)據(jù)具有復(fù)雜的映射關(guān)系,而傳統(tǒng)的輸入系統(tǒng)的碼元(由輸入規(guī)則所定義的用于構(gòu)造字詞的每一基本按鍵輸入,如a,b,c,d,e......等)組合與字詞之間的映射關(guān)系則相對(duì)簡(jiǎn)單,如何使語(yǔ)意分析數(shù)據(jù)很好地融入輸入系統(tǒng),從而實(shí)現(xiàn)訪問(wèn)時(shí)的高效性,是本申請(qǐng)人一直努力的方向。
發(fā)明內(nèi)容
本發(fā)明的首要目的是提供一種輸入系統(tǒng)語(yǔ)意分析數(shù)據(jù)散列存儲(chǔ)方法,建立用戶(hù)輸入信息與其輸入信息所蘊(yùn)涵的語(yǔ)義和意向所指功能對(duì)象之間對(duì)應(yīng)關(guān)系的基礎(chǔ)數(shù)據(jù)支持,完成輸入系統(tǒng)向更高智能化人機(jī)交互能力發(fā)展的基礎(chǔ)性準(zhǔn)備。
本發(fā)明的次要目的是為前一目的的散列存儲(chǔ)方法提供一種相應(yīng)的分析方法,為該散列存儲(chǔ)方法所生成的基礎(chǔ)數(shù)據(jù)提供相應(yīng)的訪問(wèn)支持,以增強(qiáng)前一目的的可行性。
為了實(shí)現(xiàn)上述目的,本發(fā)明采用如下解決方案 本發(fā)明的輸入系統(tǒng)語(yǔ)意分析數(shù)據(jù)散列存儲(chǔ)方法,包括如下步驟1)預(yù)設(shè)一按鍵映射表,以建立各按鍵中碼元與數(shù)字之間的映射關(guān)系;2)建立第一信息與第二信息之間存在映射關(guān)系的數(shù)據(jù)集合并賦予其中每一記錄以關(guān)鍵值;3)分配若干存儲(chǔ)區(qū)域,每一存儲(chǔ)區(qū)域用于對(duì)應(yīng)存儲(chǔ)一個(gè)關(guān)鍵值列表;4)分析數(shù)據(jù)集合中各記錄的第一信息的碼元,按照按鍵映射表的映射關(guān)系,將該第一信息轉(zhuǎn)換為數(shù)字串,按預(yù)設(shè)的拆分規(guī)則將數(shù)字串轉(zhuǎn)換為指向多個(gè)存儲(chǔ)區(qū)域的對(duì)應(yīng)個(gè)數(shù)的指針?lè)?)將已被完成指針?lè)D(zhuǎn)換的相應(yīng)記錄的關(guān)鍵值存入該些指針?lè)赶虻拇鎯?chǔ)區(qū)域的關(guān)鍵值列表中。
為處理沖突,本方法還包括一沖突處理的步驟,即當(dāng)關(guān)鍵值列表中具有兩個(gè)或兩個(gè)以上的關(guān)鍵值時(shí),按關(guān)鍵值大小進(jìn)行排序。這樣,當(dāng)需在關(guān)鍵值列表中檢索時(shí),可以采用二分查找法進(jìn)行快速查找。
所述關(guān)鍵值列表采用線性結(jié)構(gòu)進(jìn)行存儲(chǔ),更具體的,該線性結(jié)構(gòu)為鏈表或數(shù)組。這些形式便于實(shí)現(xiàn)。
實(shí)際上,該數(shù)據(jù)集合的具體存儲(chǔ)形式不受限制,具有高度的靈活性。考慮到編輯時(shí)的便利性,所述步驟2)的數(shù)據(jù)集合以電子表格、數(shù)據(jù)表、文本文件中任意一種形式進(jìn)行存儲(chǔ)。這些文件格式由于其使用廣泛而更能突出通用性。
更具體的,所述第一信息為起標(biāo)示作用的字符串,所述第二信息為能被解析的與某功能性對(duì)象相關(guān)聯(lián)的標(biāo)識(shí)值。
步驟2)的數(shù)據(jù)集合中,對(duì)于第一信息完全相同的兩條以上的記錄,賦予該些記錄以相同的關(guān)鍵值。由此,便于通過(guò)第一信息和關(guān)鍵值共同定義同一分類(lèi),繼而可通過(guò)第二信息表征具體不同的內(nèi)容,實(shí)現(xiàn)對(duì)數(shù)據(jù)集合中的各個(gè)記錄進(jìn)行歸類(lèi)匯總的作用。
考慮到在編程時(shí)采用邏輯地址進(jìn)行內(nèi)存管理的需要,所有所述存儲(chǔ)區(qū)域由指向其自身的指針共同形成一指針表。所述存儲(chǔ)區(qū)域個(gè)數(shù)為1000個(gè),以三位十進(jìn)制數(shù)對(duì)各存儲(chǔ)區(qū)域進(jìn)行指針標(biāo)識(shí)。
所述步驟4)的所述拆分規(guī)則為將該數(shù)字串自最高位起,取前三位,并逐一退位,連續(xù)取前三位直至取得最低位時(shí)止,所得若干個(gè)三位數(shù)字段即構(gòu)成屬于該數(shù)字串的多個(gè)相應(yīng)指針?lè)?,每一指針?lè)c指針表中的一指針相對(duì)應(yīng)。當(dāng)數(shù)字串不足三位時(shí),在其后補(bǔ)0構(gòu)成最低三位數(shù)字段,在其后補(bǔ)9構(gòu)成最高三位數(shù)字段,由最低數(shù)字段至最高數(shù)字段之間的多個(gè)數(shù)字段共同構(gòu)成屬于該數(shù)字串的多個(gè)相應(yīng)指針?lè)?br>
作為另一實(shí)施例,前述產(chǎn)生的每一指針?lè)部赏ㄟ^(guò)直接指向一所述存儲(chǔ)區(qū)域的物理地址,從而實(shí)現(xiàn)對(duì)關(guān)鍵值列表的尋址操作,此時(shí),存儲(chǔ)區(qū)域大小及關(guān)鍵值列表大小最好是可預(yù)知的。
考慮到需要對(duì)用戶(hù)輸入做出快速響應(yīng),所述存儲(chǔ)區(qū)域?qū)儆趦?nèi)存空間的一部分,所述關(guān)鍵值列表常駐內(nèi)存,這樣,用戶(hù)在任意時(shí)刻的任意輸入均會(huì)被快速響應(yīng),增強(qiáng)本發(fā)明的高效性。
本發(fā)明的輸入系統(tǒng)語(yǔ)意分析數(shù)據(jù)分析方法,在引用前述散列存儲(chǔ)方法的基礎(chǔ)上,對(duì)用戶(hù)在當(dāng)前輸入過(guò)程中已輸入的碼元組合執(zhí)行后續(xù)步驟1)按照一預(yù)設(shè)的按鍵映射表的映射關(guān)系將該碼元組合轉(zhuǎn)換為數(shù)字串;2)將該數(shù)字串按照預(yù)設(shè)的拆分規(guī)則轉(zhuǎn)換為多個(gè)指針?lè)?,每個(gè)指針?lè)赶蛞粋€(gè)獨(dú)立的存儲(chǔ)區(qū)域,每個(gè)存儲(chǔ)區(qū)域預(yù)存有由多個(gè)關(guān)鍵值構(gòu)成的關(guān)鍵值列表;3)根據(jù)指針?lè)闹赶?,讀取多個(gè)相應(yīng)存儲(chǔ)區(qū)域中的關(guān)鍵值列表,對(duì)多個(gè)關(guān)鍵值列表求交集,獲取該交集運(yùn)算所求得的公共的關(guān)鍵值;4)以該些關(guān)鍵值在預(yù)存的數(shù)據(jù)集合中檢索具有相同關(guān)鍵值的匹配記錄,顯示該些記錄給用戶(hù)選擇,解析并執(zhí)行用戶(hù)選中的記錄的第二信息。
同理,所述步驟2)的拆分規(guī)則為將該數(shù)字串自最高位起,取前三位,并逐一退位,連續(xù)取前三位直至取得最低位時(shí)止,所得若干個(gè)三位數(shù)字段即構(gòu)成屬于該數(shù)字串的多個(gè)相應(yīng)指針?lè)恳恢羔樂(lè)c一存儲(chǔ)區(qū)域的邏輯或物理地址相對(duì)應(yīng)。所述步驟2)的拆分規(guī)則中,當(dāng)數(shù)字串不足三位時(shí),在其后以0補(bǔ)位構(gòu)成最低三位數(shù)字段,在其后以9補(bǔ)位構(gòu)成最高三位數(shù)字段,由最低數(shù)字段至最高數(shù)字段之間的多個(gè)數(shù)字段共同構(gòu)成屬于該數(shù)字串的多個(gè)相應(yīng)指針?lè)?br>
為提交系統(tǒng)響應(yīng)效率,步驟3)在求交集運(yùn)算過(guò)程中,查找與第一個(gè)關(guān)鍵值列表是否存在與第二個(gè)關(guān)鍵值列表相同的關(guān)鍵值時(shí),以第一個(gè)關(guān)鍵值列表中的關(guān)鍵值為基準(zhǔn),采用二分查找法與第二個(gè)關(guān)鍵值列表中的關(guān)鍵值相比較。
所述步驟4)具體包括如下步驟4.1、以該些關(guān)鍵值在預(yù)存的數(shù)據(jù)集合中檢索具有相同關(guān)鍵值的記錄;4.2、將用戶(hù)當(dāng)前已輸入的碼元組合按照輸入規(guī)則構(gòu)造目標(biāo)字詞,檢驗(yàn)該些記錄的第一信息是否包含該目標(biāo)字詞,將包含該目標(biāo)字詞的所有匹配記錄輸出顯示以供用戶(hù)選擇;4.3、解析用戶(hù)選中的記錄的第二信息,獲得相關(guān)聯(lián)的功能性對(duì)象;4.4、執(zhí)行該第二信息所關(guān)聯(lián)的功能性對(duì)象。
作為一種簡(jiǎn)化的方案,所述步驟4)中,所有匹配記錄中,僅第一信息被格式化以形成單級(jí)菜單列表后輸出給用戶(hù)顯示。作為一種效果更明晰的方案,所有匹配記錄中,具有相同第一信息和關(guān)鍵值的記錄采用其第一信息用于格式化以形成共同的一級(jí)菜單項(xiàng),對(duì)屬于同一級(jí)菜單項(xiàng)的各記錄,通過(guò)格式化其各自的第二信息形成該一級(jí)菜單項(xiàng)的二級(jí)菜單項(xiàng),將所有匹配記錄格式化形成多級(jí)菜單后輸出給用戶(hù)顯示。
與現(xiàn)有技術(shù)相比較,本發(fā)明至少具有如下有益效果 1、本發(fā)明為人機(jī)交互系統(tǒng)提供了語(yǔ)意分析數(shù)據(jù)的原始信息支持,通過(guò)將用戶(hù)可能輸入的信息作為第一信息,將第一信息所包含的語(yǔ)義和意向相關(guān)的功能性對(duì)象及其參數(shù)以某種形式與第一信息相關(guān)聯(lián),形成數(shù)據(jù)集合的記錄,在人類(lèi)思維邏輯上,每條記錄即蘊(yùn)涵了一種解析關(guān)系,即將第一信息解析到第二信息的關(guān)系,而在計(jì)算機(jī)應(yīng)用邏輯上,其存儲(chǔ)形式自由多樣,甚至可由用戶(hù)自行編輯,并可由語(yǔ)意分析系統(tǒng)對(duì)各記錄進(jìn)行分析,為語(yǔ)意分析過(guò)得提供了原始信息支持; 2、在建立原始信息支持的基礎(chǔ)上,本發(fā)明進(jìn)而建立了相應(yīng)的存儲(chǔ)和索引架構(gòu),通過(guò)利用多個(gè)關(guān)鍵值列表存儲(chǔ)多個(gè)關(guān)鍵值,又進(jìn)一步管理指向各個(gè)關(guān)鍵值列表所在存儲(chǔ)區(qū)域的指針(邏輯或物理的),通過(guò)將數(shù)據(jù)集合中的第一信息進(jìn)行轉(zhuǎn)換和折疊形成多個(gè)指針?lè)?,從而使?shù)據(jù)集合中各記錄的第一信息與某些相應(yīng)的關(guān)鍵值列表之間建立交叉、散列的對(duì)應(yīng)存儲(chǔ)關(guān)系,使得用戶(hù)的模糊輸入可以在這種索引架構(gòu)下被多義模糊解釋?zhuān)ㄟ^(guò)這種模糊解釋的結(jié)果可以引導(dǎo)用戶(hù)思維的清晰化,最終這致所想即所得的效果; 3、從功能的角度考慮,本發(fā)明使得多個(gè)功能性對(duì)象與輸入系統(tǒng)完美的結(jié)合,用戶(hù)只需在系統(tǒng)鍵盤(pán)中輸入相關(guān)概念,即可動(dòng)態(tài)地顯示系統(tǒng)對(duì)其語(yǔ)意的分析結(jié)果供用戶(hù)選擇,用戶(hù)只需面對(duì)一個(gè)輸入系統(tǒng),而不必通過(guò)復(fù)雜的多級(jí)菜單操作進(jìn)行對(duì)功能性對(duì)象的調(diào)用,不再需要準(zhǔn)確記住每個(gè)目標(biāo)功能性對(duì)象所在的各級(jí)菜單,不再需要繁瑣地多次操作鍵盤(pán)......由此種種,改變了傳統(tǒng)的人機(jī)交互習(xí)慣,將人機(jī)交互導(dǎo)向一個(gè)新的思維; 4、用本發(fā)明的方向所實(shí)現(xiàn)的輸入系統(tǒng),由于其所采用的存儲(chǔ)和分析方法依賴(lài)于各存儲(chǔ)區(qū)域所共同形成的索引架構(gòu),而這種架構(gòu)具有占用空間小、查找速度快等特點(diǎn),特別是1000個(gè)存儲(chǔ)區(qū)域的限定,尤其與當(dāng)前主流內(nèi)存產(chǎn)品的空間利用相匹配,因而,可以將索引架構(gòu)所涉及各種數(shù)據(jù)限定在內(nèi)存而非硬盤(pán)等慢速存儲(chǔ)器中,在不影響整機(jī)正常速度和效率的情況下,可以實(shí)現(xiàn)了快速響應(yīng)用戶(hù)輸入的功能。
本發(fā)明的有益效果遠(yuǎn)不止于上述羅列諸要點(diǎn),限于篇幅而不加贅述。需要進(jìn)一步強(qiáng)調(diào)的是其它任何因本發(fā)明所想即所得的技術(shù)方案的實(shí)現(xiàn)而引起的技術(shù)變革,以及以這種變革所引起的有益效果,雖未在此明文記載,均是屬于本領(lǐng)域內(nèi)普通技術(shù)人員和商業(yè)領(lǐng)域人員可以推知的。
下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明進(jìn)行具體說(shuō)明
圖1為本發(fā)明所稱(chēng)的按鍵映射表的原理示意圖; 圖2為本發(fā)明所稱(chēng)數(shù)據(jù)集合所引用的用戶(hù)輸入關(guān)鍵詞與功能性對(duì)象之間的映射關(guān)系的示意圖,表現(xiàn)在數(shù)據(jù)集合中,該些關(guān)鍵詞與第一信息相對(duì)應(yīng),而功能性對(duì)象與第二信息相對(duì)應(yīng); 圖3為本發(fā)明存儲(chǔ)方法所形成的索引架構(gòu)的邏輯結(jié)構(gòu)示意圖,其中,示出一指針表和多個(gè)關(guān)鍵值列表。
具體實(shí)施例方式 本發(fā)明輸入系統(tǒng)語(yǔ)意分析數(shù)據(jù)散列存儲(chǔ)方法,依賴(lài)于一按鍵映射表和一數(shù)據(jù)集合。
請(qǐng)參閱圖1,圖1中救出了1至9共9個(gè)按鍵,其中按鍵“1”-“9”中分別跟英文字母a-z和數(shù)字1-9建立映射關(guān)系,如鍵“2”上的2,a,b,c;鍵“3”上的對(duì)應(yīng)3,d,e,f,按圖1所示以此類(lèi)推。由于目前公知的輸入規(guī)則基本延伸自計(jì)算機(jī)系統(tǒng),故26個(gè)英文字母中至少有一部分被用于某種輸入規(guī)則中作為其基本碼元進(jìn)行構(gòu)詞。例如,字詞“畫(huà)皮”,其拼音為“huapi”,以全拼輸入規(guī)則為例,則需要逐個(gè)輸入碼元“h”,“u”,“a”,“p”,“i”,由此,可以逐一在圖1中找出其映射數(shù)字串為“48274”。對(duì)于其它輸入規(guī)則也同理如五筆輸入規(guī)則,構(gòu)成“畫(huà)皮”兩字的碼元為“g”,“l(fā)”,“h”,“c”,對(duì)應(yīng)的映射數(shù)字串則為“4542”;再如純英文輸入規(guī)則,單詞“paper”對(duì)應(yīng)的映射數(shù)字串便為“72737”。
由此可知,無(wú)論運(yùn)用何種輸入規(guī)則,均可將其基本碼元序列按照?qǐng)D1所示映射關(guān)系轉(zhuǎn)換為相應(yīng)的數(shù)字串。因此,在應(yīng)用本發(fā)明的存儲(chǔ)方法時(shí),同一字詞可能會(huì)被兩種不同的輸入規(guī)則解析為兩個(gè)完全不同的數(shù)字串進(jìn)行存儲(chǔ),例如前述的“畫(huà)皮”一詞,既可以運(yùn)用拼音輸入規(guī)則轉(zhuǎn)換為“48274”,又可以運(yùn)用五筆輸入規(guī)則轉(zhuǎn)換為“4542”,這種情況無(wú)疑可以增強(qiáng)本發(fā)明的存儲(chǔ)方法和分析方法的模糊思維處理能力,但是,用數(shù)字串多義性表達(dá)同一字詞,也容易導(dǎo)致在輸入同一串碼元序列時(shí)分析到的結(jié)果重復(fù)率高企,從而用戶(hù)最終可能需要在一大堆重復(fù)選項(xiàng)中選擇目標(biāo)功能性對(duì)象,造成較大的不便,因此,在應(yīng)用本發(fā)明存儲(chǔ)方法和分析方法時(shí),最好將輸入規(guī)則約束為同一種輸入規(guī)則,本發(fā)明后述的描述中將約定為以拼音輸入規(guī)則為準(zhǔn)。
所述的數(shù)據(jù)集合,請(qǐng)參閱圖2所示的邏輯結(jié)構(gòu)示意圖。其包括多條記錄(表現(xiàn)在數(shù)據(jù)庫(kù)中可稱(chēng)之為行),每個(gè)記錄至少包括第一信息、關(guān)鍵值、第二信息等屬性(表現(xiàn)在數(shù)據(jù)庫(kù)中也可描述為域和列)。其中,第一信息具有一定的標(biāo)示作用,故可為標(biāo)示字符串,關(guān)鍵值為預(yù)先賦予的一個(gè)對(duì)機(jī)器而言具有索引意義的數(shù)值,第二信息則表現(xiàn)為具有一定格式的表達(dá)式。雖然本實(shí)施例中為便于理解,使用數(shù)據(jù)庫(kù)的方式對(duì)數(shù)據(jù)集合進(jìn)行描述,但是,本領(lǐng)域普通技術(shù)人員應(yīng)當(dāng)知曉,數(shù)據(jù)集合的文件格式不限于各種類(lèi)型的數(shù)據(jù)庫(kù),而應(yīng)擴(kuò)展到包括電子表格、文本文件以及廣義數(shù)據(jù)表等任意形式,只要一個(gè)文件中存在若干可被本發(fā)明的存儲(chǔ)和分析方法所識(shí)別的多條記錄,即應(yīng)將其理解為本發(fā)明的數(shù)據(jù)集合。
例如,設(shè)數(shù)據(jù)集合中存在記錄“音樂(lè),#123,自動(dòng)播放歌曲|c:\play.exe all”,其中的“,”號(hào)表示分隔不同的域,由此,“音樂(lè)”即為一標(biāo)示字符串,屬于域第一信息的內(nèi)容,“#123”屬于關(guān)鍵值,為建立該數(shù)據(jù)集合時(shí)所分配的一個(gè)數(shù)值,符號(hào)“#”在此只起識(shí)別作用,而“自動(dòng)播放歌曲|c:\play.exe all”,作為一個(gè)表達(dá)式,則屬于域第二信息的內(nèi)容,其中“|”號(hào)起到分隔參數(shù)的作用,即“自動(dòng)播放歌曲”在此可作為一個(gè)細(xì)目對(duì)后續(xù)“c:\play.exe”進(jìn)行進(jìn)一步的描述,“c:\play.exe”本身作為一個(gè)功能性對(duì)象的鏈接使用,而“all”則為其參數(shù),為功能性對(duì)象“play.exe”所識(shí)別,意指自動(dòng)播放當(dāng)前播放列表中的所有音樂(lè),如此,在邏輯上,屬于第一信息的標(biāo)示字符串即與屬于第二信息的表達(dá)式建立了一定的映射關(guān)系,成為數(shù)據(jù)集合中的一條記錄。由于該記錄已賦予關(guān)鍵值“#123”,故只需在數(shù)據(jù)集合中檢索關(guān)鍵值為“#123”的記錄,即可檢索到該條記錄。
第二信息作為一種表達(dá)式,其具體的描述方式可以靈活實(shí)現(xiàn),只要本發(fā)明的存儲(chǔ)方法和分析方法之間存在相同的解析該表達(dá)式的協(xié)議,并且該第二信息的設(shè)計(jì)遵循這種協(xié)議即可。例如,圖2中,“自動(dòng)播放歌曲|c:\play.exeall”中功能性對(duì)象是一個(gè)可執(zhí)行程序,程序可通過(guò)識(shí)別其路徑的方式予以識(shí)別,而“在線搜索歌曲|search.guobi.com”中,通過(guò)分析其中的功能性對(duì)象search.guobi.com,可判斷其為一網(wǎng)址,進(jìn)而程序可自動(dòng)調(diào)用瀏覽器訪問(wèn)該網(wǎng)址。又如,對(duì)于“國(guó)筆沐足中心地圖|c:\ftmap.jpg”,首先通過(guò)表征功能性對(duì)象的字符串“c:\ftmap.jpg”進(jìn)行路徑的判斷,知其為一本地文件,進(jìn)而判斷其文件類(lèi)型,知其為JPG格式文件,而后,程序進(jìn)一步通過(guò)注冊(cè)表之類(lèi)的操作系統(tǒng)關(guān)聯(lián)數(shù)據(jù)檢索到相應(yīng)的看圖程序,即可通過(guò)調(diào)用該看圖程序打開(kāi)此本地圖片文件。再如,設(shè)存在一條記錄的第二信息為“NULL”,由于“NULL”為本發(fā)明存儲(chǔ)方法和分析方法的保留字,被約定為不做任何操作,故當(dāng)該分析方法解析第二信息時(shí),便不再進(jìn)行下一步操作。諸如此類(lèi),均顯示第二信息實(shí)質(zhì)上為一表達(dá)式,該表達(dá)式中既可進(jìn)一步包含字符串說(shuō)明,還可包含其它命令、文件路徑、參數(shù)、保留字等等信息,具體的設(shè)置,在于本發(fā)明的存儲(chǔ)方法和分析方法所共同遵守的協(xié)議,只要保持前后應(yīng)用的協(xié)議的一致性,即可實(shí)現(xiàn)此類(lèi)功能。
由圖2也可以看出,第一信息所包含的標(biāo)示字符串主要起標(biāo)識(shí)作用,可以是人為賦予的標(biāo)識(shí)第二信息所包含表達(dá)式的意義,以便于將第一信息進(jìn)行輸出以方便用戶(hù)理解。在后述描述的本發(fā)明的數(shù)據(jù)集合的另一種實(shí)施例中,第一信息也將可被用于作為用戶(hù)選擇菜單的一級(jí)菜單名稱(chēng),以便于對(duì)數(shù)據(jù)集合中多條記錄進(jìn)行歸類(lèi)管理。第一信息所包含的標(biāo)示字符串,盡管如圖2所示靈活多樣,但卻均被應(yīng)用為檢索的依據(jù),具體而言,在本發(fā)明的存儲(chǔ)方法中,是以該第一信息為依據(jù)建立索引架構(gòu)的,而在本發(fā)明的分析方法中,則同樣需要通過(guò)將用戶(hù)輸入的字詞與找到的相應(yīng)記錄的第一信息進(jìn)行比較以便濾除冗余信息。
同理,第二信息中所具有的作為細(xì)目的字符串如圖2所示“自動(dòng)播放歌曲”、“在線搜索歌曲”、......“國(guó)筆沐足中心地圖”等,也可被用做檢索的依據(jù)——在本發(fā)明的存儲(chǔ)方法中作為建立索引架構(gòu)的依據(jù),而在本發(fā)明的分析方法中作為濾除冗余信息的依據(jù)??梢钥闯觯诙畔⒅凶鳛榧?xì)目使用的字符串在這種意義上與第一信息的標(biāo)示意義是相同的,具體的應(yīng)用,將取決于編程時(shí)是否同時(shí)以第一信息和第二信息作為檢索依據(jù)而定。依據(jù)此一原理,進(jìn)一步還可以將第二信息所包含的細(xì)目部分分離出來(lái),作為數(shù)據(jù)集合的一個(gè)獨(dú)立的域(或列)使用。此外,還可賦予每條記錄以另外的域(或列)以標(biāo)示第二信息中功能性對(duì)象的其它屬性,例如可以設(shè)置一個(gè)獨(dú)立的域用于標(biāo)示功能性對(duì)象為網(wǎng)址時(shí)的網(wǎng)頁(yè)類(lèi)型HTTP還是WAP。本領(lǐng)域內(nèi)普通技術(shù)人員均應(yīng)知曉此類(lèi)變通。
在語(yǔ)意上,所述功能性對(duì)象對(duì)應(yīng)的第一信息或第二信息的細(xì)目包括與功能性對(duì)象在功能、用途、名稱(chēng)方面相關(guān)的字、詞、句。例如,可以是功能性對(duì)象的名稱(chēng);也可以是功能性對(duì)象名稱(chēng)的上位詞義的字、詞、句,或上位詞義相關(guān)的字、詞、句;也可以是功能性對(duì)象名稱(chēng)的下位詞義或同位詞義的字、詞、句,或下位詞義、同位詞義的相關(guān)的字、詞、句;也可以是位于同一語(yǔ)意場(chǎng)中的其它關(guān)鍵詞。
在管理邏輯上,數(shù)據(jù)集合本身存在分類(lèi)管理和多級(jí)關(guān)聯(lián)特性。如圖2中,第一信息“我要聽(tīng)音樂(lè)”、“唱歌”、“很無(wú)聊”等詞均被賦予關(guān)鍵值“#123”,因此,在本發(fā)明的分析方法用上述第一信息進(jìn)行檢索時(shí),將檢索到關(guān)鍵值為“#123”的所有記錄。而這些第一信息在數(shù)據(jù)集合中在使用同一關(guān)鍵值的情況下,還可分別被與兩個(gè)第二信息建立映射,如關(guān)鍵值為“#123”的記錄分別與“自動(dòng)播放歌曲|c:\play.exe all”、“在線搜索歌曲|search.guobi.com”對(duì)應(yīng),這樣,便可構(gòu)成3*2共6條記錄,以此類(lèi)推,可以構(gòu)建更為復(fù)雜的映射關(guān)系是不言而喻的。而這種復(fù)雜的映射關(guān)系以記錄的形式出現(xiàn),將更便于程序人員進(jìn)行程序設(shè)計(jì),更重要的,通過(guò)關(guān)鍵字實(shí)現(xiàn)了第一信息和第二信息的歸類(lèi),再通過(guò)編程進(jìn)行合理的信息組合,這樣的效果與人類(lèi)思維邏輯相當(dāng)契合。
為了更進(jìn)一步說(shuō)明本發(fā)明所稱(chēng)的數(shù)據(jù)集合的實(shí)用性,出具下表,其揭示手機(jī)應(yīng)用上的一個(gè)實(shí)施,作為本發(fā)明的數(shù)據(jù)集合的另一實(shí)施例,其將一些可能的第一信息和第二信息建立了關(guān)聯(lián),用第一信息作為類(lèi)別名稱(chēng),而用第二信息的細(xì)目進(jìn)行功能性對(duì)象的標(biāo)識(shí),與前述實(shí)施例相結(jié)合,應(yīng)可讓讀者加深對(duì)本發(fā)明數(shù)據(jù)集合此一概念的理解
表1 上述表1中按照服務(wù)類(lèi)型分包括有音樂(lè)、圖片、彩鈴、火車(chē)票預(yù)定、機(jī)票預(yù)訂、訂票、城市公交、訂餐、訂房、閱讀、博彩等,這些字符作為第一信息使用,按照每個(gè)服務(wù)類(lèi)別,還包括多種服務(wù),由此便得出多種第二信息的表達(dá)式(在程序設(shè)計(jì)時(shí)靈活表達(dá))。按照每個(gè)服務(wù)類(lèi)別,以一定的語(yǔ)意功能為核心聚類(lèi)成不同的細(xì)目群,每個(gè)細(xì)目群對(duì)應(yīng)有一個(gè)或多個(gè)關(guān)鍵詞,例如訂房所處的服務(wù)類(lèi)別的細(xì)目群包括關(guān)鍵詞有酒店、賓館、飯店、住店、訂房、住宿。每個(gè)細(xì)目群對(duì)應(yīng)服務(wù)類(lèi)型映射有一個(gè)或多個(gè)功能性對(duì)象,例如機(jī)票預(yù)訂所處的細(xì)目群對(duì)應(yīng)的功能性對(duì)象有12580、南航、國(guó)航、春秋航空、攜程、百度搜索。而每一個(gè)服務(wù)類(lèi)別(第一信息),卻都使用相同的關(guān)鍵值。
功能性對(duì)象是預(yù)存在機(jī)器上的軟件或命令集合,故而,只要數(shù)據(jù)集合中存在相應(yīng)功能性對(duì)象的表達(dá)式(包含在記錄中),便可通過(guò)程序?qū)ζ溥M(jìn)行識(shí)別。而在構(gòu)造了上述的數(shù)據(jù)集合后,需要進(jìn)一步建立相應(yīng)的索引架構(gòu)以便實(shí)現(xiàn)本發(fā)明的存儲(chǔ)方法。
本發(fā)明的存儲(chǔ)方法采用公知的數(shù)據(jù)結(jié)構(gòu)實(shí)現(xiàn)方法,向操作系統(tǒng)申請(qǐng)若干存儲(chǔ)區(qū)域,這些存儲(chǔ)區(qū)域既可以是在物理上連續(xù)的,也可以是邏輯上連續(xù)但物理上分散的。前者可以采用物理尋址的方式予以編程實(shí)現(xiàn),后者可以采用諸如計(jì)算機(jī)程序語(yǔ)言所定義的指針尋址予以實(shí)現(xiàn)。當(dāng)然,其本質(zhì)上都是物理尋址實(shí)現(xiàn)的,而本發(fā)明所稱(chēng)的尋址方式的不同則主要是相對(duì)使用高級(jí)程序語(yǔ)言進(jìn)行設(shè)計(jì)而言。為便于理解,本發(fā)明的存儲(chǔ)方法和分析方法的主要實(shí)施例將以邏輯尋址進(jìn)行描述。
請(qǐng)參閱圖3,當(dāng)本發(fā)明的存儲(chǔ)方法向系統(tǒng)申請(qǐng)得若干存儲(chǔ)區(qū)域后,先形成一個(gè)用于對(duì)各個(gè)存儲(chǔ)區(qū)域進(jìn)行管理的指針表,指針表中存儲(chǔ)各個(gè)存儲(chǔ)區(qū)域的邏輯的指針?lè)?、起始物理地址的指針和最大容量等屬性,故可通過(guò)訪問(wèn)該指針表對(duì)各個(gè)存儲(chǔ)區(qū)域進(jìn)行定位。每個(gè)存儲(chǔ)區(qū)域用于存儲(chǔ)一個(gè)關(guān)鍵值列表,關(guān)鍵值列表中的關(guān)鍵值來(lái)自于前述數(shù)據(jù)集合中的關(guān)鍵值屬性(即數(shù)據(jù)表中的域或列),表現(xiàn)在程序設(shè)計(jì)時(shí),典型的,采用線性鏈表對(duì)各個(gè)關(guān)鍵值進(jìn)行存儲(chǔ),當(dāng)然,也可采用數(shù)組之類(lèi)的方式進(jìn)行關(guān)鍵值的存儲(chǔ)。所述存儲(chǔ)區(qū)域的指針?lè)?,是為了便于編程時(shí)進(jìn)行標(biāo)識(shí)而設(shè)置的,例如,可以在編程時(shí)采用一個(gè)數(shù)組形成指針表進(jìn)行管理,數(shù)組的下標(biāo)便與指針表所指的各個(gè)存儲(chǔ)區(qū)域的起始物理地址指針建立了對(duì)應(yīng)關(guān)系,其下標(biāo)也就直接作為指針?lè)褂?,因此,本發(fā)明所稱(chēng)的指針?lè)沁壿嬌系母拍?,是配合利用高?jí)程序語(yǔ)言進(jìn)行編程而進(jìn)行的描述,也是為了便于程序設(shè)計(jì)時(shí)更容易實(shí)現(xiàn)。因此,本發(fā)明中,給出一個(gè)指針?lè)秶鸀?00-999共一千個(gè)存儲(chǔ)區(qū)域,采用三位十進(jìn)制數(shù)進(jìn)行表述,這樣便可實(shí)現(xiàn)對(duì)1000個(gè)關(guān)鍵值列表進(jìn)行管理。根據(jù)目前的硬件設(shè)備的實(shí)際情況而言,該數(shù)值是一個(gè)較為理想的限定,能充分發(fā)揮硬件的潛力,既保證訪問(wèn)速度又保證存儲(chǔ)空間的有效利用。具體而言,本發(fā)明的存儲(chǔ)方法所建立的索引架構(gòu),為了提高訪問(wèn)(運(yùn)用分析方法)時(shí)的響應(yīng)速度,宜被存儲(chǔ)在系統(tǒng)內(nèi)存而非硬盤(pán)之類(lèi)的其它慢速存儲(chǔ)設(shè)備中,使其常駐內(nèi)存,而考慮到過(guò)大的內(nèi)存占用將影響整個(gè)系統(tǒng)的運(yùn)行效率,則其空間占用程度必須被適度限制,故而采用該數(shù)值,這樣的原則符合“空間換時(shí)間”的思維,故能綜合發(fā)揮整機(jī)效能。但該數(shù)值不應(yīng)理解為對(duì)本發(fā)明的限定,隨著科學(xué)技術(shù)的發(fā)展,內(nèi)存、中央處理器等設(shè)備的處理能力不斷提高時(shí),則該數(shù)值將不再受于此限。
在本發(fā)明的另一實(shí)施例中,存儲(chǔ)區(qū)域的管理是采用物理尋址的方式進(jìn)行的,這樣便可不必專(zhuān)門(mén)建立指針表,而直接采用使用其物理地址進(jìn)行訪問(wèn)即可,若干個(gè)存儲(chǔ)區(qū)域均具有起始物理地址,找到其起始物理地址即找到關(guān)鍵值列表的地址,即可直接進(jìn)行關(guān)鍵值列表的訪問(wèn),這種方式適用于低級(jí)語(yǔ)言程序設(shè)計(jì),不推薦使用,本領(lǐng)域普通技術(shù)人員參閱本發(fā)明關(guān)于高級(jí)程序設(shè)計(jì)的描述后自然能采用低級(jí)編程語(yǔ)言加以實(shí)現(xiàn),故而不予詳述。
圖3中用方框表示關(guān)鍵值列表,其中的多個(gè)關(guān)鍵值以逗號(hào)的方式區(qū)分,如前所述,其在內(nèi)存中可以用線性結(jié)構(gòu)如鏈表、數(shù)組等形式予以實(shí)現(xiàn),但也可以采用文本文件的方式予以實(shí)現(xiàn),其中采用如圖3所示的逗號(hào)或其它諸如制表符、空格等方式對(duì)多個(gè)關(guān)鍵值進(jìn)行分隔,只要在程序設(shè)計(jì)時(shí)予以識(shí)別即可。故當(dāng)關(guān)鍵值列表采用文本文件或其它文件的方式實(shí)現(xiàn)時(shí),存儲(chǔ)區(qū)域的指針表實(shí)際上也起到了文件目錄管理單元的作用,但由于本發(fā)明認(rèn)為較佳的實(shí)施例是以采用占用內(nèi)存的存儲(chǔ)區(qū)域?yàn)榛A(chǔ)進(jìn)行的,故后面的描述仍然以?xún)?nèi)存管理的方式為準(zhǔn)。
同一關(guān)鍵值列表中,采用從大到小或從小到大的方式進(jìn)行排序?qū)⒂欣谠趹?yīng)用本發(fā)明分析方法時(shí)采用二分查找法進(jìn)行快速檢索。如圖3中與指針?lè)?27”相對(duì)應(yīng)的關(guān)鍵值列表中,關(guān)鍵值是從小到大進(jìn)行排列的。
關(guān)鍵值列表的生成,是應(yīng)用本發(fā)明存儲(chǔ)方法實(shí)現(xiàn)的。其生成過(guò)程如下 首先,運(yùn)用輸入規(guī)則(本實(shí)施例以拼音輸入法為準(zhǔn))分析數(shù)據(jù)集合中的每一條記錄的第一信息的碼元(采用前述數(shù)據(jù)集合的第二實(shí)施例的情況下,因第二信息中存在起標(biāo)示作用的細(xì)目時(shí),還可以進(jìn)一步分析該細(xì)目的碼元),因?yàn)槊恳惠斎胍?guī)則本身具有文字與碼元之間的對(duì)應(yīng)關(guān)系,故可利用輸入規(guī)則本身實(shí)現(xiàn)對(duì)已有字符串的碼元的轉(zhuǎn)換,例如,設(shè)有一條記錄中的第一信息為“畫(huà)皮”一詞,根據(jù)輸入規(guī)則,可以查找到其對(duì)應(yīng)的碼元序列為“huapi”。
然后,查找前述的按鍵映射表從該表中可以確定碼元序列“huapi”所對(duì)應(yīng)的數(shù)字串為“48274”。
繼而,需要對(duì)已獲得的數(shù)字串“48274”進(jìn)行折疊截取形成復(fù)式索引。具體而言,對(duì)應(yīng)于前述存儲(chǔ)區(qū)域中指針?lè)匀皇M(jìn)制數(shù)進(jìn)行描述的情況,存在一個(gè)拆分規(guī)則首先,自最高位起,截取該數(shù)字串前三個(gè)數(shù)字成為第一數(shù)字段“482”,該數(shù)字段直接作為指針表的指針?lè)褂?如對(duì)應(yīng)前述數(shù)組管理的方式作為數(shù)組下標(biāo)),然后退一位,繼續(xù)取前三個(gè)數(shù)字構(gòu)成第二數(shù)字段“827”,以此類(lèi)推(不管剩余多少數(shù)字),直至取得最后一個(gè)數(shù)字為止,形成最后一個(gè)也是第三數(shù)字段“274”,共形成三個(gè)數(shù)字段,意味著存在三個(gè)指針?lè)?,由此完成從?shù)字串至指針?lè)霓D(zhuǎn)換。對(duì)于數(shù)字串不足三位的情況,則采用將不足位全覆蓋的方式實(shí)現(xiàn),如,對(duì)于數(shù)字串“48”,由于缺少一個(gè)位,故在其末位補(bǔ)“0”形成“480”,再在其末位補(bǔ)“9”形成“489”,然后以“480”至“489”范圍內(nèi)的數(shù)值作為其指針?lè)?。同理,如果只有一個(gè)位“4”,則其擁有的相應(yīng)指針?lè)麨椤?00”至“499”之間的指針?lè)?梢钥闯?,指針?lè)奈粩?shù)決定了存儲(chǔ)區(qū)域的個(gè)數(shù),或者說(shuō)存儲(chǔ)區(qū)域的個(gè)數(shù)決定指針?lè)奈粩?shù),指針?lè)M(jìn)一步又決定了本步驟中對(duì)數(shù)字串每一次進(jìn)行截取的位數(shù),而每一次截取的位數(shù)相應(yīng)也決定了一個(gè)有限位數(shù)字串的指針?lè)麄€(gè)數(shù),所有這些關(guān)聯(lián),最終將在下一步驟中影響到索引架構(gòu)的索引關(guān)系。同樣的拆分規(guī)則既然在本發(fā)明的存儲(chǔ)方法中被應(yīng)用,當(dāng)然也會(huì)在后述的分析方法中被相應(yīng)采用。
最后,每完成數(shù)據(jù)集合中的一條記錄的第一信息到指針?lè)霓D(zhuǎn)換,即需要調(diào)該條記錄的關(guān)鍵值,如,設(shè)與“畫(huà)皮”相關(guān)的記錄表達(dá)為“畫(huà)皮,#00158,電影《畫(huà)皮》|c:\video\畫(huà)皮.rmvb”。其中,“#00158”為其關(guān)鍵值,第一信息“畫(huà)皮”已被轉(zhuǎn)換為“482”、“827”、“274”共三個(gè)指針?lè)?,找到三個(gè)指針?lè)鶎?duì)應(yīng)的三個(gè)存儲(chǔ)區(qū)域,從而獲得其關(guān)鍵值列表,將關(guān)鍵值“#00158”存儲(chǔ)于找到的三個(gè)關(guān)鍵值列表中,即完成對(duì)數(shù)據(jù)集合中相應(yīng)的記錄的索引構(gòu)建。
另外,不同的第一信息經(jīng)過(guò)轉(zhuǎn)換后有可能具有一個(gè)或多個(gè)相同的指針?lè)?,例如,設(shè)數(shù)據(jù)集合中還存在另一記錄以如下的方式表達(dá)“畫(huà)冊(cè),#20355,相冊(cè)程序|c:\windows\pisca.exe”,由于“畫(huà)冊(cè)”按所述拆分規(guī)則轉(zhuǎn)換后得到“482”、“822”、“223”共3個(gè)指針?lè)?,這種情況下,指針?lè)麨椤?82”的存儲(chǔ)區(qū)域中的關(guān)鍵值列表由于之前已存入關(guān)鍵值“#00158”,如果再直接存入關(guān)鍵值“#20355”則會(huì)替換掉既有的關(guān)鍵值“#00158”,因而,在這種指針?lè)貜?fù)的情況下,需要建立一種沖突處理機(jī)制,如前所述,只需將關(guān)鍵值列表中的各關(guān)鍵值按照從小到大或從大到小進(jìn)行排序,以線性結(jié)構(gòu)進(jìn)行存儲(chǔ)即可。相應(yīng)的,在運(yùn)用本發(fā)明的分析方法時(shí),需要通過(guò)一系列的運(yùn)算去理解該沖突處理機(jī)制以獲得準(zhǔn)確的數(shù)據(jù),詳見(jiàn)后述。
對(duì)數(shù)據(jù)集合中的每一條記錄均執(zhí)行上述的步驟,則可形成從指針表到存儲(chǔ)區(qū)域到關(guān)鍵值列表再到數(shù)據(jù)集合的索引架構(gòu),該索引架構(gòu)也便形成了完整的語(yǔ)意分析數(shù)據(jù)。此其中,數(shù)據(jù)集合并未被全部存儲(chǔ)到關(guān)鍵值列表中,而是以數(shù)據(jù)集合中的關(guān)鍵值存儲(chǔ)于相應(yīng)關(guān)鍵值列表中,故而僅起到索引的作用,編程時(shí),便可通過(guò)在關(guān)鍵值列表找到關(guān)鍵值,再以該關(guān)鍵值檢索數(shù)據(jù)集合中的相應(yīng)記錄實(shí)現(xiàn)對(duì)數(shù)據(jù)集合中記錄的檢索。
業(yè)內(nèi)人士可以看出,本發(fā)明的存儲(chǔ)方法所建立的索引架構(gòu)參考自哈希表,但卻不同于哈希表,其核心之處是運(yùn)用了復(fù)式存儲(chǔ),是區(qū)別于傳統(tǒng)哈希表的關(guān)鍵,也即,對(duì)于同一第一信息的標(biāo)示字符串如“畫(huà)皮”,將其由碼元序列轉(zhuǎn)換而的數(shù)字串轉(zhuǎn)換為多個(gè)指針,再分別將“畫(huà)皮”所在記錄的關(guān)鍵值作為索引值予以存儲(chǔ)在多個(gè)關(guān)鍵值列表中而非單個(gè)的關(guān)鍵值列表中,這樣的設(shè)計(jì),盡管占用了更多的存儲(chǔ)空間,但卻結(jié)合了輸入規(guī)則本身的已有資源,運(yùn)用了人工智能,拓展了本發(fā)明的智能化程度,使用戶(hù)即使是通過(guò)模糊輸入的方式也可以快速查找到其需要的目標(biāo)。
通過(guò)上述本發(fā)明的散列存儲(chǔ)方法所構(gòu)建的索引架構(gòu),已經(jīng)完成了語(yǔ)意分析數(shù)據(jù),只要在程序設(shè)計(jì)時(shí)遵循對(duì)該散列存儲(chǔ)方法的解讀,即可非常靈活地實(shí)現(xiàn)本發(fā)明的分析方法,以便基于這些語(yǔ)意分析數(shù)據(jù)對(duì)用戶(hù)所輸入的數(shù)據(jù)進(jìn)行語(yǔ)意分析。
本發(fā)明的分析方法在原理上與該存儲(chǔ)方法相對(duì)應(yīng),其響應(yīng)于用戶(hù)的每一個(gè)碼元的輸入,迅即形成供用戶(hù)選擇的功能性對(duì)象的列表,在用戶(hù)選擇目標(biāo)功能性對(duì)象后,最終響應(yīng)于用戶(hù)的選擇而執(zhí)行相應(yīng)的功能性對(duì)象。由于其受限于存儲(chǔ)方法中索引架構(gòu)的具體實(shí)現(xiàn),故以下將以該存儲(chǔ)方法的一個(gè)簡(jiǎn)易的實(shí)施例說(shuō)明其所包括的步驟 步驟一、用戶(hù)依據(jù)自己的實(shí)際需要查找信息,先從一終端設(shè)備如手機(jī)上輸入其用于表達(dá)原意的詞語(yǔ),由于本發(fā)明的存儲(chǔ)方法以拼音輸入規(guī)則為描述的基礎(chǔ),故在本分析方法中沿用此一基礎(chǔ),用戶(hù)需要運(yùn)用拼音輸入規(guī)則輸入其需要表達(dá)的字詞,例如,用戶(hù)通過(guò)輸入“huapi”碼元序列以選取“畫(huà)皮”一詞。
步驟二、用戶(hù)形成“畫(huà)皮”一詞的過(guò)程中,各個(gè)碼元是依次輸入的,故每一個(gè)碼元的輸入將形成一個(gè)新的碼元序列,由“h”到“hu”......最后到“huapi”,在這個(gè)過(guò)程中,實(shí)際也等效于輸入了九宮格鍵盤(pán)上的“48274”按鍵,而該按鍵按照輸入規(guī)則除了可以形成“huapi”對(duì)應(yīng)于詞組“畫(huà)皮”之外,還能形成“huaqi”對(duì)應(yīng)于詞組“花期”,不管如何,現(xiàn)有的輸入法均能在碼元的逐個(gè)輸入后依據(jù)當(dāng)前的碼元序列即時(shí)動(dòng)態(tài)造詞,如對(duì)應(yīng)地,從“呵”到“胡”......最后到“畫(huà)皮”。對(duì)于存在多義構(gòu)詞的情況,由于用戶(hù)輸入最終通過(guò)按鍵映射表進(jìn)行轉(zhuǎn)換,故暫不考慮其所構(gòu)造的詞組的語(yǔ)義。本發(fā)明的分析方法充分運(yùn)用此一特點(diǎn),也是依照各個(gè)碼元被輸入后即時(shí)進(jìn)行如下步驟的操作(以下的步驟將假設(shè)最后一個(gè)拼音字母“i”已被輸入) 步驟1、將用戶(hù)已輸入的當(dāng)前的碼元序列(又稱(chēng)碼元組合)“huapi”依照按鍵映射表轉(zhuǎn)換為數(shù)字串“48274”,注意到此一轉(zhuǎn)換將導(dǎo)致不管是“畫(huà)皮”還是“花期”,均能得到同樣的轉(zhuǎn)換結(jié)果,本發(fā)明的分析方法是以字詞被映射后的數(shù)字串進(jìn)行的,故若“畫(huà)皮”與“花期”兩詞均在數(shù)據(jù)集合中存在對(duì)應(yīng)記錄,則兩者最終均會(huì)被本分析方法顯示,可見(jiàn),當(dāng)用戶(hù)通過(guò)鍵盤(pán)輸入?yún)⑴c本分析方法時(shí),既有的輸入規(guī)則所產(chǎn)生的輸入多義性實(shí)際上并不影響本分析方法的實(shí)施; 步驟2、運(yùn)用與本發(fā)明的存儲(chǔ)方法完全相同的拆分規(guī)則,先將數(shù)字串“48274”折疊截取為“482”、“827”、“274”三個(gè)數(shù)字段,該三個(gè)數(shù)字段直接作為索引架構(gòu)中存儲(chǔ)區(qū)域的指針?lè)褂?,具體可與前述相對(duì)應(yīng)表現(xiàn)為數(shù)組下標(biāo)參與運(yùn)算,然后,如圖3所示,通過(guò)指針表(可表現(xiàn)為數(shù)組)找到“482”、“827”、“274”三個(gè)存儲(chǔ)區(qū)域的關(guān)鍵值列表; 步驟3、由于指針?lè)颜业较嚓P(guān)的關(guān)鍵值列表,且關(guān)鍵值列表內(nèi)各關(guān)鍵值已經(jīng)由本發(fā)明的存儲(chǔ)方法完成排序,故可運(yùn)用二分查找法對(duì)關(guān)鍵值列表進(jìn)行交集操作,即將其中一個(gè)關(guān)鍵值列表找出,用另一關(guān)鍵值列表的各個(gè)關(guān)鍵值逐一運(yùn)用二分查找法在前一關(guān)鍵值列表中檢索相同項(xiàng),若找到則表明該兩個(gè)關(guān)鍵值列表存在交集,以此方法類(lèi)推包含再一關(guān)鍵值列表參與運(yùn)算,最終便可得到交集結(jié)果,獲得三個(gè)關(guān)鍵值列表中公共的關(guān)鍵值,對(duì)照?qǐng)D3,可知,“482”、“827”、“274”三個(gè)指針?lè)傅娜齻€(gè)關(guān)鍵值列表中,其交集運(yùn)算的結(jié)果將找到公共的關(guān)鍵值“#00158”,假設(shè)前述詞組“花期”也在數(shù)據(jù)集合中存在相應(yīng)的記錄,且其關(guān)鍵值已被存儲(chǔ)在索引架構(gòu)中,則此時(shí)可能同時(shí)在前述三個(gè)關(guān)鍵值列表中求得關(guān)于“花期”一詞的交集,如圖3中“#00168”,這時(shí),系統(tǒng)中便形成兩個(gè)公共關(guān)鍵值; 步驟4、由于前一步驟已經(jīng)檢索出關(guān)鍵值“#00158”和“#00168”,兩個(gè)關(guān)鍵值在數(shù)據(jù)集合中均有對(duì)應(yīng)記錄,本分析方法進(jìn)而在數(shù)據(jù)集合中檢索具有相應(yīng)關(guān)鍵值的記錄,參閱表1最后兩行,假設(shè)在一個(gè)簡(jiǎn)易的實(shí)施例中,將表1中第一列(該表所稱(chēng)第一信息)與第二列(該表所稱(chēng)第二信息的細(xì)目)共同作為第一信息,將表1中第三列(該表所稱(chēng)功能說(shuō)明)、第四列(該表所稱(chēng)功能對(duì)象)及第五列(該表所稱(chēng)屬性)共同作為第二信息,檢索出記錄的表達(dá)式如下 1、“影視畫(huà)皮,#00158,電影《畫(huà)皮》|c:\video\畫(huà)皮.rmvb”; 2、“商貿(mào)花期,#00168,廣州花市|www.gzflower.com HTTP”; 本分析方法進(jìn)而將這些檢索結(jié)果顯示給用戶(hù)選擇,在顯示給用戶(hù)選擇之前,先將已檢索到的記錄進(jìn)行格式化,如僅使用其中的第一信息形成單級(jí)菜單輸出給用戶(hù)進(jìn)行選擇,形如 1、影視-畫(huà)皮 2、商貿(mào)-花期 在用戶(hù)選擇其中之一后,如選擇第1項(xiàng),本分析方法獲得其選擇的目標(biāo)對(duì)象為關(guān)鍵值“#00158”的記錄,進(jìn)而解析其第二信息“電影《畫(huà)皮》|c:\video\畫(huà)皮.rmvb”,去除其中的細(xì)目信息“電影《畫(huà)皮》”,直接調(diào)用播放器程序播放“c:\video\畫(huà)皮.rmvb”文件,由于操作系統(tǒng)中一般已設(shè)置各種后綴的文件與某種相應(yīng)程序的關(guān)聯(lián),故本分析方法只需執(zhí)行一個(gè)打開(kāi)文件“c:\video\畫(huà)皮.rmvb”的命令即可,在此,“c:\video\畫(huà)皮.rmvb”作為一個(gè)功能性對(duì)象已經(jīng)被執(zhí)行,其與用戶(hù)原始表達(dá)的意思吻合。
另一種對(duì)已檢索到的記錄進(jìn)行格式化的方式中,設(shè)完全按照表1的方式設(shè)計(jì)數(shù)據(jù)集合,得出的記錄形如 1、“影視,#00158,畫(huà)皮|電影《畫(huà)皮》|c:\video\畫(huà)皮.rmvb”; 2、“商貿(mào),#00168,花期|廣州花市|www.gzflower.com HTTP”; 本分析方法在格式化該兩條記錄時(shí),可以采取如下的設(shè)計(jì)多級(jí)菜單 1、影視 1.1、畫(huà)皮——電影《畫(huà)皮》 2、商貿(mào) 2.1、花期——廣州花市 可以看出,在上述的多級(jí)菜單上,數(shù)據(jù)集合的第一信息被作為一級(jí)菜單(主菜單)顯示,而第二信息中的細(xì)目則被作為第二級(jí)菜單(子菜單)顯示,如果這時(shí)從數(shù)據(jù)集合中還找到一個(gè)記錄,如 3、“影視,#00158,畫(huà)皮|訂電影票|www.piao.com WAP” 則進(jìn)一步的,上述菜單“影視”的主菜單下無(wú)疑將增加如下子菜單項(xiàng) 1.2、畫(huà)皮——訂電影票 可見(jiàn),經(jīng)格式化后的菜單,將檢索到的若干功能性對(duì)象形象化地進(jìn)行展示,方便用戶(hù)理解,從而可快速的定位用戶(hù)需要的相關(guān)信息,只在數(shù)據(jù)集合中的第一信息與第二信息的對(duì)應(yīng)關(guān)系合理,即可為用戶(hù)提供高度智能的分析效果。
需要注意的是,不管第一信息與第二信息之間的起標(biāo)示作用的字詞間如何靈活結(jié)合,本發(fā)明的功能性對(duì)象的表達(dá)自始至終是在第二信息中進(jìn)行的,因此,無(wú)論從核心上看,本發(fā)明的數(shù)據(jù)集合中,功能性對(duì)象與關(guān)鍵值之間的對(duì)應(yīng)關(guān)系對(duì)機(jī)器而言是非常重要的,直接影響到機(jī)器所調(diào)用的功能性對(duì)象是否正確。
本分析方法中,標(biāo)示字符串分散存儲(chǔ)后,再將其復(fù)原會(huì)產(chǎn)生一些冗余的信息,如關(guān)鍵值“#8548”的指針?lè)€可以組成“426426426”這樣的一個(gè)數(shù)字串,當(dāng)用戶(hù)輸入“426426426”時(shí),也可以找到關(guān)鍵值“#8548”,但這顯然與“#8548”原代表的意義不相符,所以作為一種嚴(yán)謹(jǐn)?shù)牟呗裕?jīng)過(guò)檢驗(yàn),去除不相符的關(guān)鍵值,才能輸出。校驗(yàn)的方法是在上述步驟4找出關(guān)鍵值相對(duì)應(yīng)的數(shù)據(jù)集合的記錄之后未進(jìn)行格式化顯示之前,將用戶(hù)當(dāng)前已輸入的碼元組合按照輸入規(guī)則構(gòu)造目標(biāo)字詞,如用戶(hù)輸入的“huapi”或“huaqi”構(gòu)造出的字詞為“畫(huà)皮”或“花期”,檢驗(yàn)已檢索到的記錄的第一信息是否相匹配,具體為逐一檢驗(yàn)每條記錄中的第一信息是否包含“畫(huà)皮”或“花期”,如若有其中之一被包含,則視為該條記錄與用戶(hù)的原意相匹配,從而可以確定該記錄可被用于后續(xù)步驟進(jìn)行顯示。當(dāng)然,如果用戶(hù)確定無(wú)疑地選中了“畫(huà)皮”一詞,則僅需比較所找到的第一信息中是否包含“畫(huà)皮”一詞即可。
由上述對(duì)本發(fā)明的存儲(chǔ)方法和分析方法所進(jìn)行的多種實(shí)施例的詳細(xì)分析可以知曉,該存儲(chǔ)方法與分析方法具有一定的對(duì)應(yīng)關(guān)系,后者受前者的制約,前者決定一個(gè)索引架構(gòu),而后者則需要根據(jù)此一索引架構(gòu)靈活編程予以實(shí)現(xiàn)。前者所定義的尋址方式、數(shù)據(jù)集合中記錄的表達(dá)方式以及所限定的輸入規(guī)則都會(huì)影響到后者的程序設(shè)計(jì),因此,該存儲(chǔ)方法為本發(fā)明的核心,而該分析方法則為其派生。
對(duì)本發(fā)明的描述,為便于理解,主要是基于手機(jī)之類(lèi)的終端設(shè)備進(jìn)行的,在其他實(shí)施例中,本發(fā)明的各種方法還可以應(yīng)用于手機(jī)以外的電子設(shè)備,例如個(gè)人計(jì)算機(jī)和其它使用軟硬鍵盤(pán)的設(shè)備等,只要建立鍵盤(pán)映射表和數(shù)據(jù)集合和以此為基礎(chǔ)的索引架構(gòu),即可通過(guò)編程實(shí)現(xiàn)本發(fā)明所稱(chēng)的各種方法。以上所述,本技術(shù)領(lǐng)域的技術(shù)人員完全可以根據(jù)本發(fā)明的各個(gè)實(shí)施例來(lái)實(shí)現(xiàn),由于篇幅有限,恕不贅述。
從上述實(shí)施例可以清楚看出,本發(fā)明的存儲(chǔ)方法和分析方法為智能設(shè)備的人機(jī)交互提供了語(yǔ)意分析數(shù)據(jù)基礎(chǔ),業(yè)內(nèi)人士可以據(jù)此提升智能設(shè)備的智能化程度,導(dǎo)向用戶(hù)操作意圖。對(duì)于任意操作系統(tǒng),不需要設(shè)置多級(jí)菜單來(lái)存儲(chǔ)功能性對(duì)象,均可通過(guò)用戶(hù)的即時(shí)文字表達(dá)快速檢索到相應(yīng)的功能性對(duì)象,并在用戶(hù)確定目標(biāo)后予以執(zhí)行。用戶(hù)由此不用記住每個(gè)功能性對(duì)象所處的具體存儲(chǔ)位置,且不需一步一步地查找打開(kāi)各級(jí)菜單來(lái)調(diào)用目標(biāo)功能對(duì)象。
以上所揭露的僅為本發(fā)明的較佳實(shí)施例,不得以此來(lái)限定本發(fā)明之權(quán)利范圍,因此依本發(fā)明申請(qǐng)專(zhuān)利范圍所作的等同變化,仍屬本發(fā)明所涵蓋的范圍。
權(quán)利要求
1.一種輸入系統(tǒng)語(yǔ)意分析數(shù)據(jù)散列存儲(chǔ)方法,其特征在于,該方法包括如下步驟
1)預(yù)設(shè)一按鍵映射表,以建立各按鍵中碼元與數(shù)字之間的映射關(guān)系;
2)建立第一信息與第二信息之間存在映射關(guān)系的數(shù)據(jù)集合并賦予其中每一記錄以關(guān)鍵值;
3)分配若干存儲(chǔ)區(qū)域,每一存儲(chǔ)區(qū)域用于對(duì)應(yīng)存儲(chǔ)一個(gè)關(guān)鍵值列表;
4)分析數(shù)據(jù)集合中各記錄的第一信息的碼元,按照按鍵映射表的映射關(guān)系,將該第一信息轉(zhuǎn)換為數(shù)字串,按預(yù)設(shè)的拆分規(guī)則將數(shù)字串轉(zhuǎn)換為指向多個(gè)存儲(chǔ)區(qū)域的對(duì)應(yīng)個(gè)數(shù)的指針?lè)?br>
5)將已被完成指針?lè)D(zhuǎn)換的相應(yīng)記錄的關(guān)鍵值存入該些指針?lè)赶虻拇鎯?chǔ)區(qū)域的關(guān)鍵值列表中。
2.根據(jù)權(quán)利要求1所述的輸入系統(tǒng)語(yǔ)意分析數(shù)據(jù)散列存儲(chǔ)方法,其特征在于,包括一沖突處理的步驟,當(dāng)關(guān)鍵值列表中具有兩個(gè)或兩個(gè)以上的關(guān)鍵值時(shí),按關(guān)鍵值大小進(jìn)行排序。
3.根據(jù)權(quán)利要求1所述的輸入系統(tǒng)語(yǔ)意分析數(shù)據(jù)散列存儲(chǔ)方法,其特征在于,所述關(guān)鍵值列表采用線性結(jié)構(gòu)進(jìn)行存儲(chǔ)。
4.根據(jù)權(quán)利要求1所述的輸入系統(tǒng)語(yǔ)意分析數(shù)據(jù)散列存儲(chǔ)方法,其特征在于,所述關(guān)鍵值列表所采用的線性結(jié)構(gòu)為鏈表或數(shù)組。
5.根據(jù)權(quán)利要求1所述的輸入系統(tǒng)語(yǔ)意分析數(shù)據(jù)散列存儲(chǔ)方法,其特征在于,所述步驟2)的數(shù)據(jù)集合以電子表格、數(shù)據(jù)表、文本文件中任意一種形式進(jìn)行存儲(chǔ)。
6.根據(jù)權(quán)利要求1所述的輸入系統(tǒng)語(yǔ)意分析數(shù)據(jù)散列存儲(chǔ)方法,其特征在于,所述第一信息為起標(biāo)示作用的字符串,所述第二信息為能被解析的與某功能性對(duì)象相關(guān)聯(lián)的標(biāo)識(shí)值。
7.根據(jù)權(quán)利要求1所述的輸入系統(tǒng)語(yǔ)意分析數(shù)據(jù)散列存儲(chǔ)方法,其特征在于,步驟2)的數(shù)據(jù)集合中,對(duì)于第一信息完全相同的兩條以上的記錄,賦予該些記錄以相同的關(guān)鍵值。
8.根據(jù)權(quán)利要求1至7中任意一項(xiàng)所述的輸入系統(tǒng)語(yǔ)意分析數(shù)據(jù)散列存儲(chǔ)方法,其特征在于,所有所述存儲(chǔ)區(qū)域由指向其自身的指針共同形成一指針表。
9.根據(jù)權(quán)利要求8所述的輸入系統(tǒng)語(yǔ)意分析數(shù)據(jù)散列存儲(chǔ)方法,其特征在于,所述存儲(chǔ)區(qū)域個(gè)數(shù)為1000個(gè),以三位十進(jìn)制數(shù)對(duì)各存儲(chǔ)區(qū)域進(jìn)行指針標(biāo)識(shí)。
10.根據(jù)權(quán)利要求9所述的輸入系統(tǒng)語(yǔ)意分析數(shù)據(jù)散列存儲(chǔ)方法,其特征在于,所述步驟4)的所述拆分規(guī)則為將該數(shù)字串自最高位起,取前三位,并逐一退位,連續(xù)取前三位直至取得最低位時(shí)止,所得若干個(gè)三位數(shù)字段即構(gòu)成屬于該數(shù)字串的多個(gè)相應(yīng)指針?lè)恳恢羔樂(lè)c指針表中的一指針相對(duì)應(yīng)。
11.根據(jù)權(quán)利要求10所述的輸入系統(tǒng)語(yǔ)意分析數(shù)據(jù)散列存儲(chǔ)方法,其特征在于,所述步驟4)中的所述拆分規(guī)則中,當(dāng)數(shù)字串不足三位時(shí),在其后補(bǔ)0構(gòu)成最低三位數(shù)字段,在其后補(bǔ)9構(gòu)成最高三位數(shù)字段,由最低數(shù)字段至最高數(shù)字段之間的多個(gè)數(shù)字段共同構(gòu)成屬于該數(shù)字串的多個(gè)相應(yīng)指針?lè)?br>
12.根據(jù)權(quán)利要求1至7中任意一項(xiàng)所述的輸入系統(tǒng)語(yǔ)意分析數(shù)據(jù)散列存儲(chǔ)方法,其特征在于,所述步驟4)中,其產(chǎn)生的每一指針?lè)苯又赶蛞凰龃鎯?chǔ)區(qū)域的物理地址。
13.根據(jù)權(quán)利要求1至7中任意一項(xiàng)所述的輸入系統(tǒng)語(yǔ)意分析數(shù)據(jù)散列存儲(chǔ)方法,其特征在于,所述存儲(chǔ)區(qū)域?qū)儆趦?nèi)存空間的一部分,所述關(guān)鍵值列表常駐內(nèi)存。
14.一種輸入系統(tǒng)語(yǔ)意分析數(shù)據(jù)分析方法,在引用權(quán)利要求11所述的散列存儲(chǔ)方法的基礎(chǔ)上,其特征在于,其對(duì)用戶(hù)在當(dāng)前輸入過(guò)程中已輸入的碼元組合執(zhí)行后續(xù)步驟
1)按照一預(yù)設(shè)的按鍵映射表的映射關(guān)系將該碼元組合轉(zhuǎn)換為數(shù)字串;
2)將該數(shù)字串按照預(yù)設(shè)的拆分規(guī)則轉(zhuǎn)換為多個(gè)指針?lè)?,每個(gè)指針?lè)赶蛞粋€(gè)獨(dú)立的存儲(chǔ)區(qū)域,每個(gè)存儲(chǔ)區(qū)域預(yù)存有由多個(gè)關(guān)鍵值構(gòu)成的關(guān)鍵值列表;
3)根據(jù)指針?lè)闹赶颍x取多個(gè)相應(yīng)存儲(chǔ)區(qū)域中的關(guān)鍵值列表,對(duì)多個(gè)關(guān)鍵值列表求交集,獲取該交集運(yùn)算所求得的公共的關(guān)鍵值;
4)以該些關(guān)鍵值在預(yù)存的數(shù)據(jù)集合中檢索具有相同關(guān)鍵值的匹配記錄,顯示該些記錄給用戶(hù)選擇,解析并執(zhí)行用戶(hù)選中的記錄的第二信息。
15.根據(jù)權(quán)利要求14所述的輸入系統(tǒng)語(yǔ)意分析數(shù)據(jù)分析方法,其特征在于,所述步驟4)具體包括如下步驟
4.1、以該些關(guān)鍵值在預(yù)存的數(shù)據(jù)集合中檢索具有相同關(guān)鍵值的記錄;
4.2、將用戶(hù)當(dāng)前已輸入的碼元組合按照輸入規(guī)則構(gòu)造目標(biāo)字詞,檢驗(yàn)該些記錄的第一信息是否包含該目標(biāo)字詞,將包含該目標(biāo)字詞的所有匹配記錄輸出顯示以供用戶(hù)選擇;
4.3、解析用戶(hù)選中的記錄的第二信息,獲得相關(guān)聯(lián)的功能性對(duì)象;
4.4、執(zhí)行該第二信息所關(guān)聯(lián)的功能性對(duì)象。
16.根據(jù)權(quán)利要求14所述的輸入系統(tǒng)語(yǔ)意分析數(shù)據(jù)分析方法,其特征在于,所述步驟2)的拆分規(guī)則為將該數(shù)字串自最高位起,取前三位,并逐一退位,連續(xù)取前三位直至取得最低位時(shí)止,所得若干個(gè)三位數(shù)字段即構(gòu)成屬于該數(shù)字串的多個(gè)相應(yīng)指針?lè)?,每一指針?lè)c一存儲(chǔ)區(qū)域的邏輯或物理地址相對(duì)應(yīng)。
17.根據(jù)權(quán)利要求16所述的輸入系統(tǒng)語(yǔ)意分析數(shù)據(jù)分析方法,其特征在于,所述步驟2)的拆分規(guī)則中,當(dāng)數(shù)字串不足三位時(shí),在其后以0補(bǔ)位構(gòu)成最低三位數(shù)字段,在其后以9補(bǔ)位構(gòu)成最高三位數(shù)字段,由最低數(shù)字段至最高數(shù)字段之間的多個(gè)數(shù)字段共同構(gòu)成屬于該數(shù)字串的多個(gè)相應(yīng)指針?lè)?br>
18.根據(jù)權(quán)利要求14至17中任意一項(xiàng)所述的輸入系統(tǒng)語(yǔ)意分析數(shù)據(jù)分析方法,其特征在于,所述步驟4)中,所有匹配記錄中,僅第一信息被格式化以形成單級(jí)菜單列表后輸出給用戶(hù)顯示。
19.根據(jù)權(quán)利要求14至17中任意一項(xiàng)所述的輸入系統(tǒng)語(yǔ)意分析數(shù)據(jù)分析方法,其特征在于,所有匹配記錄中,具有相同第一信息和關(guān)鍵值的記錄采用其第一信息用于格式化以形成共同的一級(jí)菜單項(xiàng),對(duì)屬于同一級(jí)菜單項(xiàng)的各記錄,通過(guò)格式化其各自的第二信息形成該一級(jí)菜單項(xiàng)的二級(jí)菜單項(xiàng),將所有匹配記錄格式化形成多級(jí)菜單后輸出給用戶(hù)顯示。
20.根據(jù)權(quán)利要求14至17中任意一項(xiàng)所述的輸入系統(tǒng)語(yǔ)意分析數(shù)據(jù)分析方法,其特征在于,步驟3)在求交集運(yùn)算過(guò)程中,查找與第一個(gè)關(guān)鍵值列表是否存在與第二個(gè)關(guān)鍵值列表相同的關(guān)鍵值時(shí),以第一個(gè)關(guān)鍵值列表中的關(guān)鍵值為基準(zhǔn),采用二分查找法與第二個(gè)關(guān)鍵值列表中的關(guān)鍵值相比較。
全文摘要
本發(fā)明提供了輸入系統(tǒng)語(yǔ)意分析數(shù)據(jù)散列存儲(chǔ)方法,該方法包括如下步驟1)預(yù)設(shè)一按鍵映射表,以建立各按鍵中碼元與數(shù)字之間的映射關(guān)系;2)建立第一信息與第二信息之間存在映射關(guān)系的數(shù)據(jù)集合并賦予每一記錄以關(guān)鍵值;3)分配若干存儲(chǔ)區(qū)域,每一存儲(chǔ)區(qū)域?qū)?yīng)存儲(chǔ)一個(gè)關(guān)鍵值列表;4)分析數(shù)據(jù)集合中記錄的第一信息的碼元,按照按鍵映射表的映射關(guān)系,將該第一信息轉(zhuǎn)換為數(shù)字串,按預(yù)設(shè)的拆分規(guī)則將數(shù)字串轉(zhuǎn)換為指向多個(gè)存儲(chǔ)區(qū)域的對(duì)應(yīng)個(gè)數(shù)的指針?lè)?)將已被完成指針?lè)D(zhuǎn)換的相應(yīng)記錄的關(guān)鍵值存入該些指針?lè)赶虻拇鎯?chǔ)區(qū)域的關(guān)鍵值列表中。此外,本發(fā)明還提供了一種相應(yīng)的分析方法。本發(fā)明為人機(jī)交互系統(tǒng)提升智能化程度提供了必要的基礎(chǔ)。
文檔編號(hào)G06F3/023GK101770291SQ201010004239
公開(kāi)日2010年7月7日 申請(qǐng)日期2010年1月12日 優(yōu)先權(quán)日2010年1月12日
發(fā)明者高精鍊 申請(qǐng)人:廣東國(guó)筆科技股份有限公司