專利名稱:終端短信息搜索方法及其裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及無線終端纟支術(shù)4頁(yè)域,具體而言,涉及一種終端短信 息搜索方法及其裝置。
背景技術(shù):
短信息目前,諸如手機(jī)等的移動(dòng)終端設(shè)備都支持短信息存儲(chǔ)功 能短信息,有的還提供了搜索功能,但是隨著短信息存儲(chǔ)量的增加, 也提高了短信息搜索功能實(shí)現(xiàn)的難度。通常情況下,在移動(dòng)終端內(nèi), 短信息的排序方式是基于時(shí)間排列的,用戶如果需要查找歷史短信 息,則往往需要從信息隊(duì)列的兩端逐個(gè)查看,查找效率較低。另一 方面,很多移動(dòng)終端能夠支持超過一千個(gè)漢字的短信息,如果需要在這類短信息中搜索某些關(guān)#:詞,采用手動(dòng)方式查找實(shí)現(xiàn)難度較大。相關(guān)技術(shù)中已經(jīng)有一些短信息搜索的方法,例如,在標(biāo)題為《一 種查找手機(jī)短信的方法》的中國(guó)專利申請(qǐng)中,提供了如下方法將 手機(jī)存儲(chǔ)器中的信息讀取到手機(jī)內(nèi)存后查找用戶所需短信;然后搜 索引擎根據(jù)用戶輸入查詢條件對(duì)所有短信息進(jìn)行搜索,搜索到滿足 查詢條件的短信息,獲取滿足查詢條件的短信內(nèi)容的記錄號(hào)并將這 些短信息內(nèi)容保存在一緩存文件中。該方法在查找的過程中查找信 息量比較大,查找操作過程比較復(fù)雜,而且對(duì)于檢索的模糊信息無 法進(jìn)行搜索。包括上述方法在內(nèi)的目前所采用的短信息搜索方法在^f吏用上至少存在如下問題1、大容量信息存在的情況下,由于采用信息匹配 方式,造成4臾索效率4交^f氐;2、對(duì)于信息的協(xié)i義部分和用戶凄欠據(jù)部分 無法提取和分別處理,用戶實(shí)際搜索過程的信息定位困難;3、僅支 持關(guān)鍵字搜索,不支持非匹配搜索,檢索的模糊信息無法進(jìn)行搜索, 影響了用戶搜索的使用效果。發(fā)明內(nèi)容針對(duì)相關(guān)技術(shù)中存在的大容量信息搜索效率低、搜索過程的信 息定位困難、模糊信息無法進(jìn)行搜索的問題而提出本發(fā)明,為此, 本發(fā)明的主要目的在于提供一種改進(jìn)的終端短信息搜索方案,以解 決上述問題中的至少之一。為了實(shí)現(xiàn)上述目的,才艮據(jù)本發(fā)明的一個(gè)方面,才是供了一種終端 短信息4臾索方法。根據(jù)本發(fā)明的終端短信息搜索方法包括對(duì)短信息進(jìn)行解析,構(gòu)建索引數(shù)據(jù)庫(kù);接收輸入的搜索內(nèi)容,并根據(jù)搜索內(nèi)容在索引數(shù)據(jù)庫(kù)中搜索相應(yīng)的短信息。優(yōu)選地,對(duì)短信息進(jìn)行解析,構(gòu)建索引數(shù)據(jù)庫(kù)還包括對(duì)短信 息數(shù)據(jù)進(jìn)行解析和處理,得到文本內(nèi)容;對(duì)文本內(nèi)容進(jìn)行分詞得到 分詞數(shù)據(jù),并基于分詞數(shù)據(jù)建立索引;將分詞數(shù)據(jù)和索引存儲(chǔ)到索 引數(shù)據(jù)庫(kù)。優(yōu)選地,上述短信息凄史據(jù)還包括短信息協(xié)i義頭和用戶^:據(jù),對(duì) 短信息協(xié)i義頭和用戶凄t據(jù)進(jìn)4亍解析和處理還包4舌對(duì)用戶凝:據(jù)進(jìn)4亍 解碼;對(duì)解碼后的用戶數(shù)據(jù)進(jìn)行內(nèi)容分析,其中,內(nèi)容分析包括 對(duì)不同類型的用戶數(shù)據(jù)的字段和內(nèi)容分別進(jìn)行標(biāo)識(shí)。優(yōu)選地,存儲(chǔ)到索引數(shù)據(jù)庫(kù)還包括將建立的索引寫入索引文 件,并將索引文件存儲(chǔ)到索引數(shù)據(jù)庫(kù)。優(yōu)選地,對(duì)短信息協(xié)_漢頭進(jìn)4亍處理還包4舌過濾4卓短信息中用 于控制短信息網(wǎng)絡(luò)傳輸?shù)臄?shù)據(jù)。優(yōu)選地,根據(jù)搜索內(nèi)容在索引數(shù)據(jù)庫(kù)中搜索相應(yīng)的短信息還包 括對(duì)搜索內(nèi)容進(jìn)行處理,并根據(jù)處理后的搜索內(nèi)容在索引數(shù)據(jù)庫(kù) 中搜索相應(yīng)的短信息,其中,處理包括對(duì)搜索內(nèi)容進(jìn)行分詞處理。優(yōu)選地,上述方法還包括采用設(shè)置合并因子的方式對(duì)索引數(shù) 據(jù)庫(kù)進(jìn)4f更新。為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的另一方面,提供了一種終端 短信息搜索裝置。根據(jù)本發(fā)明的終端短信息搜索方法還包括解析模塊,用于對(duì) 短信息進(jìn)行解析得到解析數(shù)據(jù);索引數(shù)據(jù)庫(kù),用于保存解析數(shù)據(jù); 接收模塊,用于接收檢索關(guān)鍵詞;檢索模塊,用于根據(jù)檢索關(guān)鍵詞 從索引數(shù)據(jù)庫(kù)中進(jìn)行4企索。優(yōu)選地,上述解析;漠塊還包括解析子才莫塊,對(duì)用戶數(shù)據(jù)進(jìn)行 解碼;以及對(duì)解碼后的用戶數(shù)據(jù)進(jìn)行內(nèi)容分析,其中,內(nèi)容分析為 對(duì)不同類型的用戶數(shù)據(jù)進(jìn)行字段和內(nèi)容分別標(biāo)識(shí),才艮據(jù)用戶數(shù)據(jù)的 不同來定義不同的類型。分詞模塊,從文本內(nèi)容提取短信息協(xié)議頭 和用戶凄t據(jù)以及建立索引。優(yōu)選地,上述解析才莫塊還包括過濾子才莫塊,用于/人解析數(shù)據(jù) 中過濾掉用于控制短信息網(wǎng)絡(luò)傳輸?shù)臄?shù)據(jù)。通過本發(fā)明,采用對(duì)短信息進(jìn)行解析,構(gòu)建索引數(shù)據(jù)庫(kù);接收 輸入的搜索內(nèi)容,并根據(jù)搜索內(nèi)容在索引數(shù)據(jù)庫(kù)中搜索相應(yīng)的短信 息的方法及其裝置,解決了大容量信息搜索效率低、搜索過程的信 息定位困難、模糊信息無法進(jìn)行搜索的問題,進(jìn)而達(dá)到了對(duì)移動(dòng)終 端保存的短信息進(jìn)行快速搜索,根據(jù)用戶輸入的信息,快速返回用 戶需要的目標(biāo)短信和用戶凝:據(jù)的效果。
此處所說明的附圖用來提供對(duì)本發(fā)明的進(jìn)一步理解,構(gòu)成本申 請(qǐng)的一部分,本發(fā)明的示意性實(shí)施例及其i兌明用于解釋本發(fā)明,并 不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中圖1是根據(jù)本發(fā)明實(shí)施例的終端短信息搜索方法的流程圖。圖2是根據(jù)本發(fā)明實(shí)施例的本發(fā)明解析器處理信息功能流程圖;圖3是根據(jù)本發(fā)明實(shí)施例的分詞器處理流程圖; 圖4是根據(jù)本發(fā)明實(shí)施例的用戶搜索功能流程圖; 圖5是根據(jù)本發(fā)明實(shí)施例的索引數(shù)據(jù)庫(kù)更新流程圖。 圖6是根據(jù)本發(fā)明實(shí)施例的終端短信息搜索裝置的結(jié)構(gòu)框圖。
具體實(shí)施方式
功能扭克述考慮到相關(guān)技術(shù)中大容量信息搜索效率低、搜索過程的信息定 位困難、模糊信息無法進(jìn)行搜索的問題,本發(fā)明實(shí)施例提供了一種中,在終端i殳置一索引凝:據(jù)庫(kù),通過用戶輸入的搜索關(guān)鍵詞在索引數(shù)據(jù)庫(kù)中進(jìn)行搜索,相比于現(xiàn)有技 術(shù),可以纟是高纟臾索的效率。優(yōu)選地,為了實(shí)現(xiàn)本發(fā)明的短信息搜索方法,可以在終端上設(shè) 置功能4建或者菜單,用戶通過編輯沖醫(yī)輸入搜索關(guān)鍵詞,以啟動(dòng)查詢 過程,終端內(nèi)部的搜索程序在搜索索引數(shù)據(jù)庫(kù)完成搜索后,得到結(jié) 果短信息列表,用戶可以選擇列表中的具體信息,以查看其具體內(nèi)六谷。需要i兌明的是,在不沖突的情況下,本申i青中的實(shí)施例及實(shí)施 例中的特4正可以相互組合。下面將參考附圖并結(jié)合實(shí)施例來詳細(xì)i兌 明本發(fā)明。方法實(shí)施例才艮據(jù)本發(fā)明的實(shí)施例,提供了一種終端短信息4臾索方法。下面 將結(jié)合實(shí)例和附圖對(duì)本發(fā)明實(shí)施例的實(shí)現(xiàn)過程進(jìn)行詳細(xì)描述。圖1是才艮據(jù)本發(fā)明實(shí)施例的終端短信息4臾索方法的流程圖。如圖1所示,該終端短信息搜索方法包括步驟S101至步驟S102,下 面將參照附圖來詳細(xì)描述該方法步驟SIOI,對(duì)短信息進(jìn)行解析,構(gòu)建索引數(shù)據(jù)庫(kù)形成索引數(shù)據(jù) 庫(kù),優(yōu)選地,該解析可以是終端對(duì)短信息進(jìn)行解碼和分析,該步驟 可以通過解析器來實(shí)現(xiàn);步驟S102,接收輸入的搜索內(nèi)容,并根據(jù)所述搜索內(nèi)容在所述 索引數(shù)據(jù)庫(kù)中搜索相應(yīng)的短信息。圖2是才艮據(jù)本發(fā)明實(shí)施例的解析器處理的功能流程圖,該流程 主要對(duì)用戶的短信息數(shù)據(jù)進(jìn)行解析和處理,如圖2所示,具體操作 如下述的步驟S201至步驟S204:步驟S201 ,終端接收到新信息或者用戶在本地保存信息到終端 內(nèi)存以后,解析器通過讀取文本的方式打開內(nèi)存中的信息協(xié)議數(shù)據(jù) 單元(Protocol Data Unit,簡(jiǎn)一爾為PDU )文4牛;步驟S202,通過預(yù)處理對(duì)信息PDU進(jìn)行解碼,從PDU文件頭 開始,逐行處理數(shù)據(jù),判斷短信息的數(shù)據(jù)是否屬于用戶數(shù)據(jù),如果 屬于用戶數(shù)據(jù)則提交解碼器進(jìn)行解碼,否則直接丟棄而不進(jìn)行解碼;步驟S203 ,解析器按照短信息協(xié)議解析用戶數(shù)據(jù)部分的內(nèi)容, 包括信息的基本字段和擴(kuò)展字段。短信息的號(hào)碼段采用的編碼方式 是二進(jìn)制編碼的十進(jìn)制(Binary Coded Decimal,簡(jiǎn)稱為BCD)碼, 經(jīng)過解析后轉(zhuǎn)換成正常的號(hào)碼,英文的短信息一般是壓縮方式編碼, 而中文信息使用的是Unicode碼(萬國(guó)碼),解析器通過判斷信息的 類型和編碼方式進(jìn);f亍解碼,解碼后的凄t據(jù)進(jìn);f亍內(nèi)容分析;步驟S204,內(nèi)容分析的過程主要用于對(duì)不同類型的數(shù)據(jù)的字段 和內(nèi)容分別進(jìn)行標(biāo)識(shí),才艮據(jù)凄t據(jù)的特點(diǎn)定義不同的類型。如用戶號(hào) 碼標(biāo)識(shí)為類型1,信息的時(shí)間戳標(biāo)識(shí)為類型2等,優(yōu)選地,標(biāo)識(shí)好 的文本數(shù)據(jù)組合后轉(zhuǎn)發(fā)給分詞器進(jìn)行處理。圖3是根據(jù)本發(fā)明實(shí)施例的分詞器處理的流程圖,如圖3所示, 該處理流程包括如下的步驟S301至步驟S302:步驟S301,分詞器接收到解析器處理完成的數(shù)據(jù)后,首先進(jìn)行 預(yù)處理操作。根據(jù)文本數(shù)據(jù)中的不同類型判斷是否需要進(jìn)行分詞。 在分詞器中已經(jīng)預(yù)定義了規(guī)則,分詞器根據(jù)預(yù)定義的規(guī)則判斷字段 是否需要進(jìn)行分詞。如果需要分詞則將數(shù)據(jù)發(fā)給分詞器進(jìn)行分詞,否則直接提交到索51數(shù)據(jù)庫(kù)中處理。定義電話號(hào)碼和時(shí)間不參與分 詞,分詞器解析數(shù)據(jù)過程中如果判斷數(shù)據(jù)字段等于用戶號(hào)碼或者短 信息時(shí)間戳,則將這部分?jǐn)?shù)據(jù)直接發(fā)給索引數(shù)據(jù)庫(kù)保存。索引數(shù)據(jù)庫(kù)定義的參考格式包括如下的字段內(nèi)容Field.Number,用于保存 用戶的號(hào)石馬;Field.Time,用于^f呆存4言息的時(shí)間戳;Field.Subject, 切分詞索引并存儲(chǔ),保存主題及標(biāo)題等信息;Field.Unlndexed,用 于不索引,只存儲(chǔ)的內(nèi)容,如保存文件路徑;Field.Text,切分詞索 引并存儲(chǔ),保存用戶數(shù)據(jù)內(nèi)容。除基礎(chǔ)字段外,還可根據(jù)搜索的需 要定義補(bǔ)充字段,如不用于返回顯示,但需要進(jìn)行檢索關(guān)鍵詞的信 息說明信息等;步驟S302,分詞器將需要分詞處理的數(shù)據(jù)進(jìn)行拆分,對(duì)于英文 數(shù)據(jù),直接根據(jù)空格進(jìn)行分詞。對(duì)于中文信息,因?yàn)橹形淖址g 沒有間隔,因此需要將語(yǔ)句中使用自動(dòng)切分算法,將單詞按照2元 語(yǔ)法方式切分出來,比如"我去銀行了"。分詞處理為"我去去銀 銀行行了"。這樣切分的好處是不需要建立專門的字典表,實(shí)現(xiàn)比 較簡(jiǎn)單?;?元切分后的索引一般大小和源文件差不多,而對(duì)于 英文,索引文件一般只有原文件的40%左右。圖4是根據(jù)本發(fā)明實(shí)施例的用戶搜索功能的實(shí)現(xiàn)流程圖。如圖 4所示,該用戶搜索功能流程包括如下的步驟S401至步驟S404:步驟S401,用戶通過終端菜單豐餘入查詢的內(nèi)容,3口移動(dòng)終端號(hào) 碼,詞語(yǔ)或者時(shí)間;步驟S402,根據(jù)用戶輸入信息的類型進(jìn)行判斷,是否需要進(jìn)行 分詞處理。如果需要分詞則由分詞器進(jìn)行分詞處理,否則直接提交 索引數(shù)據(jù)庫(kù)進(jìn)行查詢。比如,用戶輸入了連續(xù)的號(hào)碼"13311232123", 分詞預(yù)處理過程根據(jù)分詞規(guī)則判斷輸入內(nèi)容為手機(jī)號(hào)碼,不需要參與分詞,直4妾提交查詢。分詞器分詞的算法仍然按照2元語(yǔ)法方式 進(jìn)行分詞,逐詞進(jìn)4于處理;步驟S403,經(jīng)過分詞處理的數(shù)據(jù)或者不需要分詞的數(shù)據(jù),提交 索引數(shù)據(jù)庫(kù)進(jìn)行查詢,搜索完成后,將結(jié)果集合按照出現(xiàn)的次數(shù);步驟S404,得到索引數(shù)據(jù)庫(kù)返回的結(jié)果集后,通過結(jié)果集中的 信息標(biāo)識(shí)碼(Identification,簡(jiǎn)稱為ID),獲取到相關(guān)的短信息并將 信息與搜索相關(guān)的內(nèi)容以列表的方式顯示給用戶,用戶可以選擇相 應(yīng)的短信息進(jìn)4于全文查看。圖5是根據(jù)本發(fā)明實(shí)施例的索引數(shù)據(jù)庫(kù)更新流程圖。該索引數(shù) 據(jù)庫(kù)更新流程是為了減少索引數(shù)據(jù)庫(kù)輸入/輸出(input/output,簡(jiǎn)稱 為I/O)更新的頻率,通過在生成臨時(shí)索引文件,減少4交大文件更 專斤的時(shí)間和凌丈率如圖5所示,該索引數(shù)據(jù)庫(kù)更新流程包括如下的步驟S501至 步驟S502:步驟S501,索引數(shù)據(jù)庫(kù)建立完成后,當(dāng)檢測(cè)到用戶信息數(shù)據(jù)發(fā) 生了變更,如接收到了新的短信息或者用戶修改了本地信息的內(nèi)容, 更新索引任務(wù)檢查當(dāng)前臨時(shí)索引信息的數(shù)量是否等于合并因子。當(dāng)小于合并因子的情況下,由解析器和分詞器處理流程創(chuàng)建新的索引 并保存本地的臨時(shí)索引中;步驟S502,如果信息的數(shù)目達(dá)到了合并因子上限,則將生成的 臨時(shí)索引更新到本地索引庫(kù)中,更新過程通過文件操作方式實(shí)現(xiàn), 文件操作完成后需要關(guān)閉索引文件。裝置實(shí)施例根據(jù)本發(fā)明的實(shí)施例,提供了 一種終端短信息搜索裝置。圖6是4艮據(jù)本發(fā)明實(shí)施例的終端短信息:溲索裝置的結(jié)構(gòu)框圖。 如圖6中所示,該裝置包括解析模塊2、索引數(shù)據(jù)庫(kù)4、接收模塊 6和檢索模塊8。下面對(duì)上述結(jié)構(gòu)進(jìn)行描述解析模塊2,用于對(duì)短信息進(jìn)行解析并輸出文本內(nèi)容以及從文 本內(nèi)容提取短信息協(xié)議頭和用戶凄史據(jù)以及建立索引;索引凄史據(jù)庫(kù)4, 用于保存短信息協(xié)議頭、用戶數(shù)據(jù)以及索引信息;接收^f莫塊6,用 于接收用戶輸入的檢索關(guān)鍵詞200;檢索模塊8,用于根據(jù)檢索關(guān)鍵 詞200從索引數(shù)據(jù)庫(kù)4中進(jìn)行4全索。下面描述才艮據(jù)本發(fā)明實(shí)施例的終端短信息搜索裝置的各結(jié)構(gòu)連 接關(guān)系解析模塊2,位于終端20內(nèi),終端20接收到新信息或者 用戶在本地保存信息到終端后,解析模塊2用于對(duì)短信息100進(jìn)行 解析并輸出文本內(nèi)容以及從文本內(nèi)容提取短信息協(xié)議頭和用戶數(shù)據(jù) 以及建立索引;索引數(shù)據(jù)庫(kù)4,連接至解析模塊2,用于保存短信息 協(xié)議頭、用戶數(shù)據(jù)以及索引信息;接收模塊6,用于接收用戶輸入 的檢索關(guān)鍵詞200;檢索模塊8,連接至索引數(shù)據(jù)庫(kù)4和接收模塊6, 用于根據(jù)檢索關(guān)鍵詞200從索引數(shù)據(jù)庫(kù)4中進(jìn)行檢索。優(yōu)選地,解析才莫塊還可以包括解析子才莫塊22 (可以對(duì)應(yīng)于方 法實(shí)施例中的解析器),對(duì)用戶數(shù)據(jù)進(jìn)行解碼;以及對(duì)解碼后的用戶 數(shù)據(jù)進(jìn)行內(nèi)容分析,其中,內(nèi)容分析為對(duì)不同類型的用戶數(shù)據(jù)進(jìn)行 字段和內(nèi)容分別標(biāo)識(shí),根據(jù)用戶數(shù)據(jù)的不同來定義不同的類型。分 詞模塊24 (可以對(duì)應(yīng)于方法實(shí)施例中的分詞器),從文本內(nèi)容提取 短信息協(xié)議頭和用戶凄史據(jù)以及建立索引。優(yōu)選地,在解析模塊2中還包括過濾子模塊26,過濾掉短信 息協(xié)議頭中用于控制短信息網(wǎng)絡(luò)傳輸?shù)臄?shù)據(jù)。下面將參照?qǐng)D6來描述解析模塊2中各子模塊之間的連接關(guān)系 解析子才莫塊22,對(duì)短信息100進(jìn)行解碼和內(nèi)容分析;分詞才莫塊24, 連接至解析子模塊22,用于對(duì)解析后的數(shù)據(jù)進(jìn)行分詞;過濾子模塊 26,連接至解析子模塊22和分詞模塊24,用于過濾掉短信息協(xié)議 頭中用于控制短信息網(wǎng)絡(luò)傳輸?shù)臄?shù)據(jù)。從以上的描述中可以看出,本發(fā)明實(shí)現(xiàn)了對(duì)移動(dòng)終端保存的短 信息進(jìn)行快速搜索,根據(jù)用戶輸入的信息,快速返回用戶需要的目 標(biāo)短信和用戶凄欠據(jù)的效果。以上所述〗又為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明, 對(duì)于本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在 本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等, 均應(yīng)包含在本發(fā)明的4呆護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種終端短信息搜索方法,其特征在于,包括對(duì)短信息進(jìn)行解析,構(gòu)建索引數(shù)據(jù)庫(kù);接收輸入的搜索內(nèi)容,并根據(jù)所述搜索內(nèi)容在所述索引數(shù)據(jù)庫(kù)中搜索相應(yīng)的短信息。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)短信息進(jìn)行 解析,構(gòu)建索引數(shù)據(jù)庫(kù)包括對(duì)短信息數(shù)據(jù)進(jìn)行解析和處理,得到文本內(nèi)容;對(duì)所述文本內(nèi)容進(jìn)行分詞得到分詞數(shù)據(jù),并基于所述分詞 數(shù)據(jù)建立索引;將所述分詞數(shù)據(jù)和所述索引存儲(chǔ)到所述索引數(shù)據(jù)庫(kù)。
3. 根據(jù)權(quán)利要求2所述的方法,所述短信息數(shù)據(jù)包括短信息協(xié)議 頭和用戶數(shù)據(jù),其特征在于,對(duì)所述短信息協(xié)議頭和所述用戶 數(shù)據(jù)進(jìn)行解析和處理包括對(duì)所述用戶凄t據(jù)進(jìn)4亍解碼;對(duì)解碼后的所述用戶數(shù)據(jù)進(jìn)行內(nèi)容分析,其中,所述內(nèi)容 分析包括對(duì)不同類型的用戶翁:據(jù)的字革殳和內(nèi)容分別進(jìn)4亍標(biāo) 識(shí)。
4. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述存儲(chǔ)到所述索 引數(shù)據(jù)庫(kù)包括將建立的所述索引寫入索引文件,并將所述索 《I文件存儲(chǔ)到所述索引數(shù)據(jù)庫(kù)。
5. 根據(jù)權(quán)利要求3所述的方法,其特征在于,對(duì)所述短信息協(xié)議 頭進(jìn)行處理包括過濾掉所述短信息中用于控制短信息網(wǎng)絡(luò)傳 輸?shù)臄?shù)據(jù)。
6. 根據(jù)權(quán)利要求1所述的方法,其特征在于,才艮據(jù)所述搜索內(nèi)容 在所述索引數(shù)據(jù)庫(kù)中搜索相應(yīng)的短信息還包括對(duì)所述搜索內(nèi)容進(jìn)行處理,并根據(jù)處理后的搜索內(nèi)容在所 述索引數(shù)據(jù)庫(kù)中搜索相應(yīng)的短信息,其中,所述處理包括對(duì) 所述搜索內(nèi)容進(jìn)4亍分詞處理。
7. 才艮據(jù)權(quán)利要求1-6中4壬一項(xiàng)所述的方法,其特征在于,所述方 法還包括采用設(shè)置合并因子的方式對(duì)所述索《1數(shù)據(jù)庫(kù)進(jìn)行更新。
8. —種終端短信息搜索裝置,其特征在于,包括解析模塊,用于對(duì)短信息進(jìn)行解析得到解析數(shù)據(jù); 索引數(shù)據(jù)庫(kù),用于保存所述解析數(shù)據(jù);接收模塊,用于接收檢索關(guān)鍵詞;檢索模塊,用于根據(jù)所述檢索關(guān)鍵詞從所述索引數(shù)據(jù)庫(kù)中 進(jìn)行檢索。
9. 根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述解析模塊包括解析子才莫塊,對(duì)所述用戶數(shù)據(jù)進(jìn)行解碼;以及對(duì)解碼后的 所述用戶數(shù)據(jù)進(jìn)行內(nèi)容分析,其中,所述內(nèi)容分析為對(duì)不同類 型的用戶數(shù)據(jù)進(jìn)行字段和內(nèi)容分別標(biāo)識(shí),根據(jù)所述用戶數(shù)據(jù)的 不同來定義不同的類型;分詞才莫塊,從所述文本內(nèi)容提取短信息協(xié)議頭和用戶數(shù)據(jù) 以及建立索引。
10. 根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述解析模塊還包 括過濾子模塊,用于從所述解析數(shù)據(jù)中過濾掉用于控制所述 短信息網(wǎng)絡(luò)傳輸?shù)臄?shù)據(jù)。
全文摘要
本發(fā)明公開了一種終端短信息搜索方法及其裝置,該方法包括對(duì)短信息進(jìn)行解析,構(gòu)建索引數(shù)據(jù)庫(kù);接收輸入的搜索內(nèi)容,并根據(jù)搜索內(nèi)容在索引數(shù)據(jù)庫(kù)中搜索相應(yīng)的短信息。通過本發(fā)明解決了大容量信息搜索效率低、搜索過程的信息定位困難、模糊信息無法進(jìn)行搜索的問題,進(jìn)而達(dá)到了對(duì)移動(dòng)終端保存的短信息進(jìn)行快速搜索,根據(jù)用戶輸入的信息,快速返回用戶需要的目標(biāo)短信和用戶數(shù)據(jù)的效果。
文檔編號(hào)G06F17/30GK101600023SQ200910151538
公開日2009年12月9日 申請(qǐng)日期2009年6月30日 優(yōu)先權(quán)日2009年6月30日
發(fā)明者劉長(zhǎng)山, 石小雨 申請(qǐng)人:中興通訊股份有限公司