国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種短信智能刪除模塊的制作方法

      文檔序號:7771186閱讀:165來源:國知局
      一種短信智能刪除模塊的制作方法
      【專利摘要】本發(fā)明公開了一種短信智能刪除模塊,目的在于通過對短信的內(nèi)容進(jìn)行關(guān)鍵信息的提取后,來斷定短信是否為垃圾短信,根據(jù)判斷結(jié)果對短信進(jìn)行處理。包括短信特征詞提取、關(guān)鍵字標(biāo)注、短信內(nèi)容判斷和短信處理四個步驟。短信處理分為短信保留和短信刪除兩種方式。實(shí)現(xiàn)上述短信特征詞的提取需要建立詞典,好的詞典是中文分詞準(zhǔn)確率的保障。
      【專利說明】一種短信智能刪除模塊
      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及短信智能刪除領(lǐng)域,更具體的講是一種通過對短信的內(nèi)容進(jìn)行關(guān)鍵信息的提取后,來斷定短信是否為垃圾短信,根據(jù)判斷結(jié)果對短信進(jìn)行處理的模塊。
      [0002]
      【背景技術(shù)】
      [0003]短信short message service,簡稱SMS是用戶通過手機(jī)或其他電信終端直接發(fā)送或接收的文字或數(shù)字信息,用戶每次能接收和發(fā)送短信的字符數(shù),是160個英文或數(shù)字字符,或者70個中文字符。1992年,當(dāng)世界上第一條短信在英國沃爾豐的GSM網(wǎng)絡(luò)上通過PC向移動電話發(fā)送成功的時候,誰也不會想到,當(dāng)初這項(xiàng)由電信運(yùn)營商為解決手機(jī)話費(fèi)過高而推出的低廉文本信息的服務(wù),這個看似非常小孩玩意的一個通訊交流的東西,竟會在多年后對人們的經(jīng)濟(jì)文化生活,甚至對政治都產(chǎn)生了如此大的影響。
      [0004]1992年,世界上第一條短信在英國沃達(dá)豐的網(wǎng)絡(luò)上通過電腦向手機(jī)發(fā)送成功,從而宣布手機(jī)短信誕生。至于中國的第一條短信誕生于何時何地已無從知曉,但據(jù)考證,中國的移動通信網(wǎng)絡(luò)早在1994年就具備了短信功能,只是那時有手機(jī)的人根本不需要它罷了。隨著手機(jī)的日益普及,從1998年開始,移動、聯(lián)通先后大范圍拓展短信業(yè)務(wù):2000年,中國手機(jī)短信息量突破10億條;2001年,達(dá)到189億條;2004年,數(shù)字飛漲到900億條。于是短信理所應(yīng)當(dāng)?shù)爻蔀榱说谖宸N傳播工具,“信生活”的提法也因此誕生;于是從1998年至今,七年的時間里,不管你愿意與否,短信已逐漸走入我們的生活,成為生活的一部分,我們的生活也因短信而改變著。
      [0005]據(jù)工信部最新公布統(tǒng)計(jì)數(shù)據(jù)顯示,2012年,全國移動短信發(fā)送量達(dá)到8973.1億條,同比增長僅2.1%,增幅為四年最低。兩項(xiàng)數(shù)據(jù)對比可以發(fā)現(xiàn),我國手機(jī)用戶增速遠(yuǎn)大于短信業(yè)務(wù),我國2012年短信均發(fā)送量實(shí)際下滑了 9%左右。
      [0006]工信部數(shù)據(jù)顯示,2012年我國移動電話用戶達(dá)到11億戶,其中短信業(yè)務(wù)用戶達(dá)到
      7.6億戶,滲透率為68.8%,手機(jī)網(wǎng)民用戶約為4.2億,滲透率為38.2%。另一方面,在我國11億手機(jī)用戶中,騰訊微信用戶超過3億戶,滲透率為27.3%。而在中國每10個手機(jī)網(wǎng)民中,就有超過7個為微信用戶。
      [0007]電信行業(yè)研究咨詢機(jī)構(gòu)歐文咨詢公司之前也曾發(fā)布公告稱,隨著大量智能手機(jī)用戶轉(zhuǎn)而使用免費(fèi)短信應(yīng)用軟件,至2012年底,全球電信運(yùn)營商將因此損失230億美元短信收入。
      [0008]隨著信息的不斷發(fā)展,各種各類的短信如臘月的大雪一樣漫天紛舞,手機(jī)已經(jīng)脫離了那個純凈、安靜的世界;無論是手機(jī)傳統(tǒng)的短信還是各種社交應(yīng)用如:微信,陌陌等,各種垃圾短信不期而至。
      [0009]何為垃圾短息,垃圾短信,就是凡用戶沒有定制過的包含有廣告、欺騙、色情、詛咒等違法內(nèi)容以及短時間內(nèi)連續(xù)發(fā)送同樣內(nèi)容,影響用戶的正常使用、工作和生活的任何信息均為垃圾短信。[0010]那么短信的智能攔截、刪除就成為了各個通訊界、專家研究的熱點(diǎn)。
      [0011]
      【發(fā)明內(nèi)容】

      [0012]本發(fā)明公開了一種短信智能刪除模塊,目的在于通過對短信的內(nèi)容進(jìn)行關(guān)鍵信息的提取后,來斷定短信是否為垃圾短信,根據(jù)判斷結(jié)果對短信進(jìn)行處理。
      [0013]本發(fā)明是采取以下技術(shù)方案實(shí)現(xiàn)的:一種短信智能刪除模塊,包括短信特征詞提取、關(guān)鍵字標(biāo)注、短信內(nèi)容判斷和短信處理四個步驟。短信處理分為短信保留和短信刪除兩種方式。
      [0014]本發(fā)明的實(shí)現(xiàn)還包括以下的技術(shù)方案:
      上述短信特征詞提取將涉及到中文文本信息提取與中文分詞算法,本發(fā)明將采取正向最大匹配算法對關(guān)鍵字進(jìn)行提取。
      [0015]實(shí)現(xiàn)上述短信特征詞的提取需要建立詞典,好的詞典是中文分詞準(zhǔn)確率的保障。
      [0016]正向最大匹配算法:從左到右將待分詞文本中的幾個連續(xù)字符與詞表匹配,如果匹配上,則切分出一個詞。但這里有一個問題:要做到最大匹配,并不是第一次匹配到就可以切分的。我們來舉個例子:
      待分詞文本content [] = {〃中〃,〃華〃,〃民〃,〃族〃,〃從〃,〃此〃,〃站〃,〃起〃,〃來",〃了 ","。"}
      詞表:dict[] = {〃中華〃,〃中華民族〃,〃從此〃,〃站起來〃}
      (I)從content [I]開始,當(dāng)掃描到content [2]的時候,發(fā)現(xiàn)〃中華〃已經(jīng)在詞表dict[]中了。但還不能切分出來,因?yàn)槲覀儾恢篮竺娴脑~語能不能組成更長的詞(最大匹配)。
      [0017](2)繼續(xù)掃描content [3],發(fā)現(xiàn)〃中華民〃并不是diet []中的詞。但是我們還不能確定是否前面找到的〃中華〃已經(jīng)是最大的詞了。因?yàn)椤ㄖ腥A民〃是dict[2]的前綴。
      [0018](3)掃描content [4],發(fā)現(xiàn)〃中華民族〃是diet []中的詞。繼續(xù)掃描下去。
      [0019](4)當(dāng)掃描content[5]的時候,發(fā)現(xiàn)〃中華民族從〃并不是詞表中的詞,也不是詞的前綴。因此可以切分出前面最大的詞一〃中華民族"。
      [0020]本發(fā)明的優(yōu)點(diǎn)和有益效果,具體體現(xiàn)在以下幾個方面:
      1.本發(fā)明在一定程度上改進(jìn)對于垃圾短信的刪除是一種改進(jìn),在不斷對垃圾短信進(jìn)行處理的過程中自動完善垃圾短信詞庫,保持對于垃圾短信的判斷準(zhǔn)確率不斷增加,對于模塊的強(qiáng)大性有著至關(guān)重要的作用。
      [0021]2.接下來可以對于某些特定信息,比如某些人、某些單位的信息進(jìn)行定時刪除,這樣可以降低手機(jī)信息的存儲量。
      [0022]3.同時也提高實(shí)現(xiàn)信息查找的效率,不用在浩瀚的手機(jī)信息中翻來翻去的尋找某
      一條信息。
      [0023]
      【專利附圖】

      【附圖說明】
      [0024]圖1是本發(fā)明的執(zhí)行步驟示意圖;圖2是自動建立詞典的流程圖。
      【具體實(shí)施方式】
      [0025]以下結(jié)合說明書附圖1對本發(fā)明的實(shí)施做進(jìn)一步詳述:
      一種短信智能刪除模塊,包括短信特征詞提取、關(guān)鍵字標(biāo)注、短信內(nèi)容判斷和短信處理四個步驟。短信處理分為短信保留和短信刪除兩種方式。
      [0026]上述短信特征詞提取將涉及到中文文本信息提取與中文分詞算法,本發(fā)明將采取正向最大匹配算法對關(guān)鍵字進(jìn)行提取。
      [0027]正向最大匹配算法:從左到右將待分詞文本中的幾個連續(xù)字符與詞表匹配,如果匹配上,則切分出一個詞。但這里有一個問題:要做到最大匹配,并不是第一次匹配到就可以切分的。我們來舉個例子:
      待分詞文本content [] = {〃中〃,〃華〃,〃民〃,〃族〃,〃從〃,〃此〃,〃站〃,〃起〃,〃來",〃了 ","。"}
      詞表:dict[] = {〃中華〃,〃中華民族〃,〃從此〃,〃站起來〃}
      (I)從content[l]開始,當(dāng)掃描到content [2]的時候,發(fā)現(xiàn)〃中華〃已經(jīng)在詞表dict[]中了。但還不能切分出來,因?yàn)槲覀儾恢篮竺娴脑~語能不能組成更長的詞(最大匹配)。
      [0028](2)繼續(xù)掃描content [3],發(fā)現(xiàn)〃中`華民〃并不是diet []中的詞。但是我們還不能確定是否前面找到的〃中華〃已經(jīng)是最大的詞了。因?yàn)椤ㄖ腥A民〃是dict[2]的前綴。
      [0029](3)掃描content [4],發(fā)現(xiàn)〃中華民族〃是dict[]中的詞。繼續(xù)掃描下去。
      [0030](4)當(dāng)掃描content[5]的時候,發(fā)現(xiàn)〃中華民族從〃并不是詞表中的詞,也不是詞的前綴。因此可以切分出前面最大的詞一〃中華民族"。
      [0031]以下結(jié)合說明書附圖2對字典的建立做進(jìn)一步詳述:
      好的詞典是中文分詞準(zhǔn)確率的保障,那么如何構(gòu)建詞典,第一要對目前比較流行的垃圾短信進(jìn)行收集,對其特征詞進(jìn)行相應(yīng)人工提取,構(gòu)建一個信息量較全的詞典,比如說流行的垃圾短信有:“開發(fā)票”、“辦證”、“sim卡克隆”等;第二,對這些詞的存儲結(jié)構(gòu)進(jìn)行整理,按照英文字母順序進(jìn)行短語的存儲,每個字母索引下的詞按照由長到短進(jìn)行存儲,這樣將有益于最大匹配實(shí)現(xiàn)。
      [0032]字典建立的程序?qū)崿F(xiàn):
      /林
      *構(gòu)建內(nèi)存詞典的Trie樹結(jié)點(diǎn) V
      public class TrieNode {
      /**結(jié)點(diǎn)關(guān)鍵字,其值為中文詞中的一個字*/
      public char key= (char)O;
      /**如果該字在詞語的末尾,則bound=true*/
      public boolean bound=false;
      /**指向下一個結(jié)點(diǎn)的指針結(jié)構(gòu),用來存放當(dāng)前字在詞中的下一個字的位置*/
      public HashMap〈Character,TrieNode> childs = newHashMap<Character, TrieNode>();
      public TrieNode(){

      }
      public TrieNode(char k){
      this.key=k;

      }
      }
      利用本發(fā)明所述的技術(shù)方案,或本領(lǐng)域的技術(shù)人員在本發(fā)明技術(shù)方案的啟發(fā)下,設(shè)計(jì)出類似的技術(shù)方案,而達(dá)到上述技術(shù)效果的,均是落入本發(fā)明的保護(hù)范圍。
      【權(quán)利要求】
      1.一種短信智能刪除模塊,其特征在于:包括短信特征詞提取、關(guān)鍵字標(biāo)注、短信內(nèi)容判斷和短信處理四個步驟,實(shí)現(xiàn)上述短信特征詞的提取需要建立詞典,上述短信處理步驟分為短信保留和短信刪除兩種方式。
      2.根據(jù)權(quán)利要求1所述的一種短信智能刪除模塊,其特征在于:所述短信特征詞提取步驟米取正向最大匹配算法。
      3.根據(jù)權(quán)利要求1所述的一種短信智能刪除模塊,其特征在于:所述短信處理步驟分為短信保留和短信刪除兩種方式。
      【文檔編號】H04W88/02GK103888921SQ201310433559
      【公開日】2014年6月25日 申請日期:2013年9月21日 優(yōu)先權(quán)日:2013年9月21日
      【發(fā)明者】牛曉芳 申請人:天津思博科科技發(fā)展有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1