一種移動(dòng)終端及其有效過(guò)濾垃圾信息的方法和裝置制造方法
【專利摘要】本發(fā)明公開了一種移動(dòng)終端及其有效過(guò)濾垃圾信息的方法和裝置,屬于移動(dòng)終端【技術(shù)領(lǐng)域】。該有效過(guò)濾垃圾信息的方法包括:接收到消息時(shí),獲取接收到消息的消息內(nèi)容;將消息內(nèi)容中的文字轉(zhuǎn)換成拼音;通過(guò)輸入法詞庫(kù)對(duì)轉(zhuǎn)換成的拼音進(jìn)行語(yǔ)義分析;根據(jù)語(yǔ)義分析的結(jié)果,判斷消息內(nèi)容是否為垃圾消息,若是,則過(guò)濾消息內(nèi)容。本發(fā)明通過(guò)將接收到的消息內(nèi)容轉(zhuǎn)換成拼音,再根據(jù)拼音的語(yǔ)義判斷接收到的消息是否為垃圾消息,能夠有效過(guò)濾垃圾消息。
【專利說(shuō)明】一種移動(dòng)終端及其有效過(guò)濾垃圾信息的方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及移動(dòng)終端【技術(shù)領(lǐng)域】,具體涉及一種移動(dòng)終端及其有效過(guò)濾垃圾信息的方法和裝置。
【背景技術(shù)】
[0002]隨著智能移動(dòng)終端的廣泛普及,移動(dòng)互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,移動(dòng)終端中的即時(shí)工具經(jīng)常會(huì)收發(fā)大量的信息。人們?cè)谙硎苄畔⒗顺彼鶐?lái)的便利同時(shí),也需要忍受大量垃圾信息的騷擾,給用戶帶來(lái)困擾。
[0003]針對(duì)這種狀況,很多移動(dòng)終端安全軟件應(yīng)運(yùn)而生,以過(guò)濾垃圾信息,給用戶清凈的移動(dòng)終端使用環(huán)境。常見的過(guò)濾方法包括:根據(jù)手機(jī)號(hào)碼過(guò)濾,未知聯(lián)系人信息過(guò)濾;黑名單過(guò)濾;預(yù)置內(nèi)容的過(guò)濾;一定時(shí)間預(yù)置內(nèi)接收同一個(gè)號(hào)碼發(fā)送的信息條數(shù)等。
[0004]雖然目前的安全軟件可以攔截大多數(shù)垃圾信息,但垃圾制造者也在不斷的改進(jìn)垃圾信息的表達(dá)方式。比如:為了防止關(guān)鍵詞的屏蔽,通過(guò)將關(guān)鍵詞通過(guò)一些特殊字符隔開;對(duì)于表達(dá)的內(nèi)容通過(guò)同音字、諧音字表達(dá)。有的垃圾推送者甚至將上述多種方法的組合,導(dǎo)致安全軟件無(wú)法有效攔截垃圾信息,從而給用戶帶來(lái)煩惱。
【發(fā)明內(nèi)容】
[0005]本發(fā)明提供一種移動(dòng)終端及其有效過(guò)濾垃圾信息的方法和裝置,以達(dá)到有效過(guò)濾垃圾信息的目的,克服上述現(xiàn)有安全軟件無(wú)法識(shí)別到垃圾關(guān)鍵字的缺陷。
[0006]本發(fā)明解決上述技術(shù)問(wèn)題的技術(shù)方案如下。
[0007]根據(jù)本發(fā)明的一個(gè)方面,提供的一種有效過(guò)濾垃圾信息的方法,該方法包括:接收到消息時(shí),獲取接收到消息的消息內(nèi)容;將消息內(nèi)容中的文字轉(zhuǎn)換成拼音,并獲取轉(zhuǎn)換后的消息內(nèi)容所包含的全部拼音;通過(guò)輸入法詞庫(kù)對(duì)轉(zhuǎn)換成的拼音進(jìn)行語(yǔ)義分析;根據(jù)語(yǔ)義分析的結(jié)果,判斷消息內(nèi)容是否為垃圾消息,若是,則過(guò)濾消息內(nèi)容。
[0008]優(yōu)選地,針對(duì)上述通過(guò)輸入法詞庫(kù)對(duì)轉(zhuǎn)換成的拼音進(jìn)行語(yǔ)義分析,該方法還包括:根據(jù)輸入法詞庫(kù),將獲取到的拼音翻譯成所有可能的中文語(yǔ)句;對(duì)每一種翻譯后的語(yǔ)句進(jìn)行分詞,獲取所有語(yǔ)句分詞后的所有詞匯;以所有可能的語(yǔ)句的數(shù)量為基數(shù),計(jì)算每個(gè)詞匯出現(xiàn)的頻率;根據(jù)預(yù)設(shè)的垃圾關(guān)鍵字的權(quán)重,獲取每個(gè)詞匯的權(quán)重,若預(yù)設(shè)的垃圾關(guān)鍵字中沒有對(duì)應(yīng)的詞匯,則將該詞匯的權(quán)重記為零;結(jié)合每個(gè)詞匯出現(xiàn)的頻率以及該詞匯權(quán)重,計(jì)算消息內(nèi)容的垃圾相似度。
[0009]優(yōu)選地,針對(duì)上述根據(jù)語(yǔ)義分析的結(jié)果,判斷消息內(nèi)容是否為垃圾消息,該方法還包括:當(dāng)計(jì)算的垃圾相似度的值超過(guò)預(yù)設(shè)的閾值時(shí),判斷消息內(nèi)容為垃圾消息。
[0010]優(yōu)選地,在上述通過(guò)輸入法詞庫(kù)對(duì)轉(zhuǎn)換成的拼音進(jìn)行語(yǔ)義分析的步驟之前,該方法還包括:提取消息內(nèi)容中所包含的預(yù)設(shè)的字符;剔除提取到的字符。
[0011]優(yōu)選地,在上述將消息內(nèi)容中的文字轉(zhuǎn)換成拼音的步驟之前,該方法還包括:判斷消息內(nèi)容中的文字是否包含有預(yù)設(shè)的字段,若是,則判斷消息內(nèi)容為垃圾消息。
[0012]優(yōu)選地,上述消息內(nèi)容包括郵件消息、短息消息、應(yīng)用程序接收到的消息。
[0013]根據(jù)本發(fā)明的另一個(gè)方面,提供的一種有效過(guò)濾垃圾信息的裝置,該裝置包括:消息內(nèi)容獲取模塊,用于接收到消息時(shí),獲取接收到消息的消息內(nèi)容;拼音轉(zhuǎn)換模塊,用于將消息內(nèi)容中的文字轉(zhuǎn)換成拼音,并獲取轉(zhuǎn)換后的消息內(nèi)容所包含的全部拼音;語(yǔ)義分析模塊,用于通過(guò)輸入法詞庫(kù)對(duì)轉(zhuǎn)換成的拼音進(jìn)行語(yǔ)義分析;第一判斷模塊,用于根據(jù)語(yǔ)義分析的結(jié)果,判斷消息內(nèi)容是否為垃圾消息,若是,則過(guò)濾消息內(nèi)容。
[0014]優(yōu)選地,該有效過(guò)濾垃圾信息的裝置還包括:翻譯模塊,用于根據(jù)輸入法詞庫(kù),將獲取到的拼音翻譯成所有可能的中文語(yǔ)句;分詞模塊,用于對(duì)每一種翻譯后的語(yǔ)句進(jìn)行分詞,獲取所有語(yǔ)句分詞后的所有詞匯;頻率計(jì)算模塊,用于以所有可能的語(yǔ)句的數(shù)量為基數(shù),計(jì)算每個(gè)詞匯出現(xiàn)的頻率;權(quán)重獲取模塊,用于根據(jù)預(yù)設(shè)的垃圾關(guān)鍵字的權(quán)重,獲取每個(gè)詞匯的權(quán)重,若預(yù)設(shè)的垃圾關(guān)鍵字中沒有對(duì)應(yīng)的詞匯,則將該詞匯的權(quán)重記為零;垃圾相似度計(jì)算模塊,用于結(jié)合每個(gè)詞匯出現(xiàn)的頻率以及該詞匯權(quán)重,計(jì)算消息內(nèi)容的垃圾相似度;第二判斷模塊,用于當(dāng)計(jì)算的垃圾相似度的值超過(guò)預(yù)設(shè)的閾值時(shí),判斷消息內(nèi)容為垃圾消息。
[0015]優(yōu)選地,該有效過(guò)濾垃圾信息的裝置還包括:字符提取模塊,用于提取消息內(nèi)容中所包含的預(yù)設(shè)的字符;字符剔除模塊,用于剔除提取到的字符。
[0016]根據(jù)本發(fā)明的又一個(gè)方面,提供的一種移動(dòng)終端,該移動(dòng)終端包括上述一種有效過(guò)濾垃圾信息的裝置。
[0017]本發(fā)明提供了一種移動(dòng)終端及其有效過(guò)濾垃圾信息的方法和裝置,將消息內(nèi)容中的特殊字符剔除,并將接收到的消息內(nèi)容轉(zhuǎn)換成拼音,再根據(jù)拼音的語(yǔ)義判斷接收到的消息是否為垃圾消息,使得垃圾推送者通過(guò)將消息內(nèi)容中的某些文字編輯成拼音或在消息內(nèi)容中插入特殊字符的方式躲避被檢測(cè)到垃圾關(guān)鍵字的意圖無(wú)所遁形,給用戶一個(gè)清凈的使用環(huán)境。
【專利附圖】
【附圖說(shuō)明】
[0018]圖1為根據(jù)本發(fā)明的一個(gè)實(shí)施例的有效過(guò)濾垃圾信息的方法的流程圖;
[0019]圖2為根據(jù)本發(fā)明的一個(gè)實(shí)施例的語(yǔ)義分析方法的流程圖;
[0020]圖3為根據(jù)本發(fā)明的一個(gè)實(shí)施例的剔除特殊字符的方法的流程圖;
[0021]圖4為根據(jù)本發(fā)明的一個(gè)實(shí)施例的有效過(guò)濾垃圾信息的裝置的示范性結(jié)構(gòu)框圖;
[0022]圖5為根據(jù)本發(fā)明的一個(gè)實(shí)施例的語(yǔ)義分析模塊的示范性結(jié)構(gòu)框圖;
[0023]圖6為根據(jù)本發(fā)明的一個(gè)實(shí)施例的移動(dòng)終端的示范性結(jié)構(gòu)框圖。
【具體實(shí)施方式】
[0024]以下結(jié)合附圖對(duì)本發(fā)明的原理和特征進(jìn)行描述,所舉實(shí)例只用于解釋本發(fā)明,并非用于限定本發(fā)明的范圍。
[0025]實(shí)施例一
[0026]圖1為根據(jù)本發(fā)明的一個(gè)實(shí)施例的有效過(guò)濾垃圾信息的方法的流程圖,下面結(jié)合圖1來(lái)描述根據(jù)本發(fā)明的一個(gè)實(shí)施例的有效過(guò)濾垃圾信息的方法,如圖1所示,為了避免垃圾消息推送者將消息中的部分文字編輯成拼音以逃避垃圾關(guān)鍵字的識(shí)別,該方法包括以下步驟:
[0027]S10、接收到消息時(shí),獲取接收到的消息的消息內(nèi)容;
[0028]S20、將消息內(nèi)容中的文字轉(zhuǎn)換成拼音,并獲取轉(zhuǎn)換后的消息內(nèi)容所包含的全部拼曰;
[0029]S30、通過(guò)輸入法詞庫(kù)對(duì)轉(zhuǎn)換成的拼音進(jìn)行語(yǔ)義分析;
[0030]S40、根據(jù)語(yǔ)義分析的結(jié)果,判斷消息內(nèi)容是否為垃圾消息,若是,則過(guò)濾消息內(nèi)容,否則,正常(常規(guī))顯示消息內(nèi)容。
[0031]其中,在上述步驟S20之前,該有效過(guò)濾垃圾信息的方法還包括初步過(guò)濾,具體的,該初步過(guò)濾的方法為:
[0032]判斷消息內(nèi)容中的文字是否包含有預(yù)設(shè)的字段,若是,則判斷消息內(nèi)容為垃圾消息。該預(yù)設(shè)的字段包括但不限于:中獎(jiǎng)、折扣、禮包等。
[0033]如果在初步過(guò)濾階段就能識(shí)別接收到的消息為垃圾消息,就沒有必要進(jìn)行后續(xù)的拼音轉(zhuǎn)換以及語(yǔ)義識(shí)別動(dòng)作,節(jié)約程序。
[0034]作為可選的,上述初步過(guò)濾的方法還可以包括:
[0035]檢測(cè)發(fā)來(lái)消息的號(hào)碼是否為預(yù)設(shè)的黑名單號(hào)碼,若是,則過(guò)濾所述接收到的消息。
[0036]其中,上述消息內(nèi)容包括但不限于郵件消息、短息消息、應(yīng)用程序接收到的消息。該應(yīng)用程序例如微信、QQ等即時(shí)聊天工具。
[0037]作為可選的,該有效過(guò)濾垃圾信息的方法還可以包括:
[0038]獲取接收到消息的消息內(nèi)容時(shí),檢測(cè)垃圾信息攔截功能是否開啟,若是,則進(jìn)入步驟S20,并執(zhí)行后續(xù)的步驟,若否,則退出。
[0039]實(shí)施例二
[0040]圖2為根據(jù)本發(fā)明的一個(gè)實(shí)施例的語(yǔ)義分析方法的流程圖,如圖2所示,本發(fā)明在包括上述步驟S10、步驟S20外,上述步驟S30具體包括:
[0041]S31、根據(jù)輸入法詞庫(kù),將獲取到的拼音翻譯成所有可能的中文語(yǔ)句;
[0042]S32、對(duì)每一種翻譯后的語(yǔ)句進(jìn)行分詞,獲取所有語(yǔ)句分詞后的所有詞匯;
[0043]S33、以所有可能的語(yǔ)句的數(shù)量為基數(shù),計(jì)算每個(gè)詞匯出現(xiàn)的頻率;
[0044]S34、根據(jù)預(yù)設(shè)的垃圾關(guān)鍵字的權(quán)重,獲取每個(gè)詞匯的權(quán)重,若預(yù)設(shè)的垃圾關(guān)鍵字中沒有對(duì)應(yīng)的詞匯,則將該詞匯的權(quán)重記為零;
[0045]S35、結(jié)合每個(gè)詞匯出現(xiàn)的頻率以及該詞匯權(quán)重,計(jì)算消息內(nèi)容的垃圾相似度。
[0046]對(duì)應(yīng)的,上述步驟S40具體為步驟S41,其中:
[0047]步驟S41、當(dāng)計(jì)算的垃圾相似度的值超過(guò)預(yù)設(shè)的閾值時(shí),判斷消息內(nèi)容為垃圾消息,過(guò)濾消息內(nèi)容,否則,正常顯示消息內(nèi)容。
[0048]其中,上述結(jié)合每個(gè)詞匯出現(xiàn)的頻率以及該詞匯權(quán)重,計(jì)算消息內(nèi)容的垃圾相似度,可以理解的是將垃圾關(guān)鍵字的權(quán)重與該詞匯出現(xiàn)的頻率同時(shí)納入判斷垃圾消息的條件,計(jì)算消息內(nèi)容的垃圾相似度可以采用乘法來(lái)計(jì)算,即將權(quán)重乘以對(duì)應(yīng)詞匯出現(xiàn)的頻率作為垃圾相似度的值。當(dāng)垃圾關(guān)鍵詞有多個(gè)時(shí),可以采用以下計(jì)算方法:
[0049]X = a1b1+a2b2+a3b3+""" +anbn
[0050]X表示最終垃圾相似度的值,an表示第η個(gè)關(guān)鍵字出現(xiàn)的頻率,bn表示第η個(gè)關(guān)鍵字的權(quán)重,η為自然數(shù)。根據(jù)本發(fā)明的一個(gè)示例的關(guān)于an的計(jì)算方法為:
[0051]an = m/M
[0052]m表示第n個(gè)關(guān)鍵字(詞匯)出現(xiàn)的總的次數(shù),M表示可能翻譯成的語(yǔ)句的數(shù)量。
[0053]實(shí)施例三
[0054]圖3為根據(jù)本發(fā)明的一個(gè)實(shí)施例的剔除特殊字符的方法的流程圖,如圖3所示,為了避免由于垃圾推送者編輯消息時(shí)插入特殊字符導(dǎo)致垃圾關(guān)鍵字識(shí)別不出來(lái),本發(fā)明在包括上述步驟S10、步驟S20、步驟S30、步驟S40外(步驟S40在圖3中未示出),還包括:
[0055]S51、提取消息內(nèi)容中所包含的預(yù)設(shè)的字符;
[0056]S52、剔除提取到的字符。
[0057]作為可選的,上述步驟S51、S52可以如圖所示在步驟SlO和步驟S20之間,也可以將步驟S51、S52置于步驟S20和步驟S30之間。
[0058]其中,上述預(yù)設(shè)的字符包括但不限于空格、“等特殊字符。
[0059]實(shí)施例四
[0060]圖4為根據(jù)本發(fā)明的一個(gè)實(shí)施例的有效過(guò)濾垃圾信息的裝置的示范性結(jié)構(gòu)框圖,下面根據(jù)圖4來(lái)描述有效過(guò)濾垃圾信息的裝置100,如圖4所示,該裝置包括:
[0061]消息內(nèi)容獲取模塊10,用于接收到消息時(shí),獲取接收到消息的消息內(nèi)容;
[0062]拼音轉(zhuǎn)換模塊20,用于將消息內(nèi)容中的文字轉(zhuǎn)換成拼音,并獲取轉(zhuǎn)換后的消息內(nèi)容所包含的全部拼音;
[0063]語(yǔ)義分析模塊30,用于通過(guò)輸入法詞庫(kù)對(duì)轉(zhuǎn)換成的拼音進(jìn)行語(yǔ)義分析;
[0064]第一判斷模塊40,用于根據(jù)語(yǔ)義分析的結(jié)果,判斷消息內(nèi)容是否為垃圾消息,若是,則過(guò)濾消息內(nèi)容,否則,正常顯示消息內(nèi)容。
[0065]其中,為了避免由于插入特殊字符導(dǎo)致垃圾關(guān)鍵字識(shí)別不出來(lái),該有效過(guò)濾垃圾信息的裝置100還包括:
[0066]字符提取模塊51,用于提取消息內(nèi)容中所包含的預(yù)設(shè)的字符;
[0067]字符剔除模塊52,用于剔除提取到的字符。
[0068]其中,上述預(yù)設(shè)的字符包括但不限于空格、“等特殊字符。
[0069]實(shí)施例五
[0070]圖5為根據(jù)本發(fā)明的一個(gè)實(shí)施例的語(yǔ)義分析模塊的示范性結(jié)構(gòu)框圖,如圖5所示,上述語(yǔ)義分析模塊30具體包括:
[0071]翻譯模塊31,用于根據(jù)輸入法詞庫(kù),將獲取到的拼音翻譯成所有可能的中文語(yǔ)句;
[0072]分詞模塊32,用于對(duì)每一種翻譯后的語(yǔ)句進(jìn)行分詞,獲取所有語(yǔ)句分詞后的所有詞匯;
[0073]頻率計(jì)算模塊33,用于以所有可能的語(yǔ)句的數(shù)量為基數(shù),計(jì)算每個(gè)詞匯出現(xiàn)的頻率;
[0074]權(quán)重獲取模塊34,用于根據(jù)預(yù)設(shè)的垃圾關(guān)鍵字的權(quán)重,獲取每個(gè)詞匯的權(quán)重,若預(yù)設(shè)的垃圾關(guān)鍵字中沒有對(duì)應(yīng)的詞匯,則將該詞匯的權(quán)重記為零;
[0075]垃圾相似度計(jì)算模塊35,用于結(jié)合每個(gè)詞匯出現(xiàn)的頻率以及該詞匯權(quán)重,計(jì)算消息內(nèi)容的垃圾相似度。
[0076]對(duì)應(yīng)的,上述第一判斷模塊40具體包括第二判斷模塊41,該第二判斷模塊41用于當(dāng)計(jì)算的垃圾相似度的值超過(guò)預(yù)設(shè)的閾值時(shí),判斷消息內(nèi)容為垃圾消息。
[0077]實(shí)施例六
[0078]圖6為根據(jù)本發(fā)明的一個(gè)實(shí)施例的移動(dòng)終端的示范性結(jié)構(gòu)框圖,如圖6所示的移動(dòng)終端11,該移動(dòng)終端11包括上述的有效過(guò)濾垃圾信息的裝置100。
[0079]本發(fā)明通過(guò)將消息內(nèi)容中的特殊字符剔除,并將接收到的消息內(nèi)容轉(zhuǎn)換成拼音,再根據(jù)拼音的語(yǔ)義判斷接收到的消息是否為垃圾消息,使得垃圾推送者通過(guò)將消息內(nèi)容中的某些文字編輯成拼音或在消息內(nèi)容中插入特殊字符的方式躲避被檢測(cè)到垃圾關(guān)鍵字的意圖無(wú)所遁形,給用戶一個(gè)清凈的使用環(huán)境。
[0080]以上所述僅為本發(fā)明的較佳實(shí)施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種有效過(guò)濾垃圾信息的方法,其特征在于,所述方法包括: 接收到消息時(shí),獲取接收到消息的消息內(nèi)容; 將所述消息內(nèi)容中的文字轉(zhuǎn)換成拼音; 通過(guò)輸入法詞庫(kù)對(duì)轉(zhuǎn)換成的拼音進(jìn)行語(yǔ)義分析; 根據(jù)語(yǔ)義分析的結(jié)果,判斷所述消息內(nèi)容是否為垃圾消息,若是,則過(guò)濾所述消息內(nèi)容。
2.根據(jù)權(quán)利要求1所述的有效過(guò)濾垃圾信息的方法,其特征在于,針對(duì)所述通過(guò)輸入法詞庫(kù)對(duì)所述轉(zhuǎn)換成的拼音進(jìn)行語(yǔ)義分析,所述方法還包括: 根據(jù)輸入法詞庫(kù),將所述獲取到的拼音翻譯成所有可能的中文語(yǔ)句; 對(duì)每一種翻譯后的語(yǔ)句進(jìn)行分詞,獲取所述所有語(yǔ)句分詞后的所有詞匯; 以所述所有可能的語(yǔ)句的數(shù)量為基數(shù),計(jì)算所述每個(gè)詞匯出現(xiàn)的頻率; 根據(jù)預(yù)設(shè)的垃圾關(guān)鍵字的權(quán)重,獲取所述每個(gè)詞匯的權(quán)重; 結(jié)合所述每個(gè)詞匯出現(xiàn)的頻率以及該詞匯權(quán)重,計(jì)算所述消息內(nèi)容的垃圾相似度。
3.根據(jù)權(quán)利要求2所述的有效過(guò)濾垃圾信息的方法,其特征在于,針對(duì)所述根據(jù)語(yǔ)義分析的結(jié)果,判斷所述消息內(nèi)容是否為垃圾消息,所述方法還包括: 當(dāng)所述計(jì)算的垃圾相似度的值超過(guò)預(yù)設(shè)的閾值時(shí),判斷所述消息內(nèi)容為垃圾消息。
4.根據(jù)權(quán)利要求1所述的有效過(guò)濾垃圾信息的方法,其特征在于,在所述通過(guò)輸入法詞庫(kù)對(duì)所述轉(zhuǎn)換成的拼音進(jìn)行語(yǔ)義分析的步驟之前,所述方法還包括: 提取所述消息內(nèi)容中所包含的預(yù)設(shè)的字符; 剔除所述提取到的字符。
5.根據(jù)權(quán)利要求1所述的有效過(guò)濾垃圾信息的方法,其特征在于,在所述將所述消息內(nèi)容中的文字轉(zhuǎn)換成拼音的步驟之前,所述方法還包括: 判斷所述消息內(nèi)容中的文字是否包含有預(yù)設(shè)的字段,若是,則判斷所述消息內(nèi)容為垃圾消息。
6.根據(jù)權(quán)利要求1所述的有效過(guò)濾垃圾信息的方法,其特征在于,所述消息內(nèi)容包括郵件消息、短息消息、應(yīng)用程序接收到的消息。
7.一種有效過(guò)濾垃圾信息的裝置,其特征在于,所述裝置包括: 消息內(nèi)容獲取模塊,用于接收到消息時(shí),獲取接收到消息的消息內(nèi)容; 拼音轉(zhuǎn)換模塊,用于將所述消息內(nèi)容中的文字轉(zhuǎn)換成拼音,并獲取轉(zhuǎn)換后的消息內(nèi)容所包含的全部拼音; 語(yǔ)義分析模塊,用于通過(guò)輸入法詞庫(kù)對(duì)所述轉(zhuǎn)換成的拼音進(jìn)行語(yǔ)義分析; 第一判斷模塊,用于根據(jù)語(yǔ)義分析的結(jié)果,判斷所述消息內(nèi)容是否為垃圾消息,若是,則過(guò)濾所述消息內(nèi)容。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述裝置還包括: 翻譯模塊,用于根據(jù)輸入法詞庫(kù),將所述獲取到的拼音翻譯成所有可能的中文語(yǔ)句; 分詞模塊,用于對(duì)每一種翻譯后的語(yǔ)句進(jìn)行分詞,獲取所述所有語(yǔ)句分詞后的所有詞匯; 頻率計(jì)算模塊,用于以所述所有可能的語(yǔ)句的數(shù)量為基數(shù),計(jì)算所述每個(gè)詞匯出現(xiàn)的頻率; 權(quán)重獲取模塊,用于根據(jù)預(yù)設(shè)的垃圾關(guān)鍵字的權(quán)重,獲取所述每個(gè)詞匯的權(quán)重; 垃圾相似度計(jì)算模塊,用于結(jié)合所述每個(gè)詞匯出現(xiàn)的頻率以及該詞匯權(quán)重,計(jì)算所述消息內(nèi)容的垃圾相似度; 第二判斷模塊,用于當(dāng)所述計(jì)算的垃圾相似度的值超過(guò)預(yù)設(shè)的閾值時(shí),判斷所述消息內(nèi)容為垃圾消息。
9.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述裝置還包括: 字符提取模塊,用于提取所述消息內(nèi)容中所包含的預(yù)設(shè)的字符; 字符剔除模塊,用于剔除所述提取到的字符。
10.一種移動(dòng)終端,其特征在于,所述移動(dòng)終端包括上述權(quán)利要求7?9任一項(xiàng)所述的>j-U ρ?α裝直。
【文檔編號(hào)】G06F17/27GK104268203SQ201410489999
【公開日】2015年1月7日 申請(qǐng)日期:2014年9月23日 優(yōu)先權(quán)日:2014年9月23日
【發(fā)明者】王賢偉 申請(qǐng)人:深圳市中興移動(dòng)通信有限公司