国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      垃圾信息處理方法及裝置的制造方法

      文檔序號:8267238閱讀:550來源:國知局
      垃圾信息處理方法及裝置的制造方法
      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及通信領(lǐng)域,具體而言,涉及一種垃圾信息處理方法及裝置。
      【背景技術(shù)】
      [0002]短消息業(yè)務(wù)是基于移動通訊網(wǎng)絡(luò)的簡短文本信息收發(fā)方式。消息由短信服務(wù)中心(Short Message Service Center,簡稱為SMSC)負(fù)責(zé)接收、轉(zhuǎn)存和發(fā)送。該業(yè)務(wù)廣泛應(yīng)用于所有移動通信網(wǎng)絡(luò):全球移動通信(Global system for Mobile Communicat1n,簡稱為GSM)、碼分多址(Code Divis1n Multiple Access,簡稱為CDMA)、個(gè)人便攜式電話系統(tǒng)(Personal Handyphone System,簡稱為PHS),以及寬帶碼分多址接入(WidebandCode Divis1n Multiple Access,簡稱為 WCDMA)、CDMA2000、時(shí)分同步碼分多址接入(TimeDivis1n-Synchronous Code Divis1n Multiple Access,簡稱為 TD-SCDMA)等 3G 網(wǎng)絡(luò),發(fā)展迅速,并有著更廣的發(fā)展前景,已經(jīng)日益成為手機(jī)用戶應(yīng)用最頻繁的業(yè)務(wù)之一。而不少商家亦越來越青睞這一便捷、低廉的廣告途徑。然而這也帶來了新的問題:如何更高效地過濾垃圾短消息。
      [0003]在申請?zhí)枮?CN200510086930,發(fā)明名稱為“一種短消息業(yè)務(wù)系統(tǒng)及其實(shí)現(xiàn)短消息過濾的方法”的專利文件中提出,在短消息中心設(shè)置過濾垃圾短信條件,對滿足條件的消息進(jìn)行鑒權(quán),并根據(jù)鑒權(quán)結(jié)果控制短信的下發(fā)。能實(shí)現(xiàn)對垃圾短信的實(shí)時(shí)監(jiān)控、實(shí)時(shí)過濾。
      [0004]另外,在相關(guān)技術(shù)中垃圾短信監(jiān)控策略主要采用流量門限規(guī)則、內(nèi)容關(guān)鍵字匹配規(guī)則、目的號碼連續(xù)性、消息投送狀態(tài)等進(jìn)行垃圾短信監(jiān)控?;谝?guī)則的監(jiān)控,很容易被垃圾發(fā)送者識別并化解,但是,目前垃圾短信發(fā)送趨向于團(tuán)伙性、單號碼低頻性、內(nèi)容多變性,即成百上千號碼參與一種垃圾短信發(fā)送,每個(gè)號碼僅發(fā)送少量的消息,并且發(fā)送的內(nèi)容多變,傳統(tǒng)的基于流量門限、內(nèi)容關(guān)鍵字匹配、目的號碼聯(lián)系特征等難以有效識別這些垃圾短消息,通常只能攔截其中一部分垃圾短信,難以將整個(gè)團(tuán)伙識別并攔截。
      [0005]因此,在相關(guān)技術(shù)中存在無法對整個(gè)團(tuán)伙垃圾攔截的問題。

      【發(fā)明內(nèi)容】

      [0006]本發(fā)明提供了一種垃圾信息處理方法及裝置,以至少解決相關(guān)技術(shù)中存在的無法對整個(gè)團(tuán)伙垃圾攔截的問題。
      [0007]根據(jù)本發(fā)明的一個(gè)方面,提供了一種垃圾信息處理方法,包括:獲取垃圾信息種子;以所述垃圾信息種子為起點(diǎn),以預(yù)定的話單文件集為爬蟲處理體,采用以信息內(nèi)容爬垃圾信息主叫號碼,以垃圾信息主叫號碼爬信息內(nèi)容的方式進(jìn)行迭代爬行處理;確定與所述垃圾信息種子有直接或間接蟲網(wǎng)關(guān)系的信息主叫號碼為垃圾信息號碼,和/或,確定與所述垃圾信息種子有直接或間接蟲網(wǎng)關(guān)系的信息為垃圾信息。
      [0008]優(yōu)選地,獲取所述垃圾信息種子包括以下至少之一:由垃圾信息監(jiān)控系統(tǒng)監(jiān)控到的垃圾信息提供所述垃圾信息種子;由短消息中心獲取信息話單文件中的信息提供所述垃圾信息種子;由用戶投訴的垃圾信息提供所述垃圾信息種子。
      [0009]優(yōu)選地,確定與所述垃圾信息種子有直接或間接蟲網(wǎng)關(guān)系的所述信息主叫號碼為所述垃圾信息號碼包括:將與所述垃圾信息種子有直接或間接蟲網(wǎng)關(guān)系的信息主叫號碼劃分為垃圾信息主叫號碼團(tuán)伙集;依據(jù)所述垃圾信息主叫號碼團(tuán)伙集判定與所述垃圾信息種子有直接或間接蟲網(wǎng)關(guān)系的所述信息主叫號碼為所述垃圾信息號碼。
      [0010]優(yōu)選地,依據(jù)所述垃圾信息主叫號碼團(tuán)伙集判定與所述垃圾信息種子有直接或間接蟲網(wǎng)關(guān)系的所述信息主叫號碼為所述垃圾信息號碼包括:對所述垃圾信息主叫號碼團(tuán)伙集中的號碼進(jìn)行排序;獲取排序后的預(yù)定間隔內(nèi)的連續(xù)號碼數(shù);判斷所述連續(xù)號碼數(shù)是否超過第一預(yù)定閾值;在判斷結(jié)果為是的情況下,確定信息主叫號碼為所述垃圾信息號碼。
      [0011]優(yōu)選地,確定與所述垃圾信息種子有直接或間接蟲網(wǎng)關(guān)系的所述信息為所述垃圾信息包括:將與所述垃圾信息種子有直接或間接蟲網(wǎng)關(guān)系的所述信息劃分為垃圾信息內(nèi)容團(tuán)伙集;依據(jù)所述垃圾信息內(nèi)容團(tuán)伙集判定與所述垃圾信息種子有直接或間接蟲網(wǎng)關(guān)系的所述信息為所述垃圾信息。
      [0012]優(yōu)選地,通過以下方式至少之一依據(jù)所述垃圾信息內(nèi)容團(tuán)伙集判定與所述垃圾信息種子有直接或間接蟲網(wǎng)關(guān)系的所述信息為所述垃圾信息包括:通過判斷所述垃圾信息內(nèi)容團(tuán)伙集中所述信息與所述垃圾信息種子間公共字符個(gè)數(shù)與消息最大長度的比的方式來獲得所述信息與所述垃圾信息種子的相似性值,在相似性值超過第二預(yù)定閾值的情況下,確定所述信息為所述垃圾信息;判斷所述垃圾信息內(nèi)容團(tuán)伙集中與所述垃圾信息種子有直接或間接蟲網(wǎng)關(guān)系的所述信息的發(fā)送條數(shù),在發(fā)送條數(shù)超過第三預(yù)定閾值的情況下,確定所述信息為所述垃圾信息;判斷所述垃圾信息內(nèi)容團(tuán)伙集中與所述垃圾信息種子有直接或間接蟲網(wǎng)關(guān)系的所述信息的參與主叫號碼數(shù),在所述參與主叫號碼數(shù)超過第四預(yù)定閾值的情況下,確定所述信息為所述垃圾信息。
      [0013]根據(jù)本發(fā)明的另一方面,提供了一種垃圾信息處理裝置,包括:獲取模塊,用于獲取垃圾信息種子;處理模塊,用于以所述垃圾信息種子為起點(diǎn),以預(yù)定的話單文件集為爬蟲處理體,采用以信息內(nèi)容爬垃圾信息主叫號碼,以垃圾信息主叫號碼爬信息內(nèi)容的方式進(jìn)行迭代爬行處理;第一確定模塊,用于確定與所述垃圾信息種子有直接或間接蟲網(wǎng)關(guān)系的信息主叫號碼為垃圾信息號碼;和/或,第二確定模塊,用于確定與所述垃圾信息種子有直接或間接蟲網(wǎng)關(guān)系的信息為垃圾信息。
      [0014]優(yōu)選地,所述獲取模塊包括以下至少之一:第一提供單元,用于由垃圾信息監(jiān)控系統(tǒng)監(jiān)控到的垃圾信息提供所述垃圾信息種子;第二提供單元,用于由短消息中心獲取信息話單文件中的信息提供所述垃圾信息種子;第三提供單元,用于由用戶投訴的垃圾信息提供所述垃圾信息種子。
      [0015]優(yōu)選地,所述第一確定模塊包括:第一切分單元,用于將與所述垃圾信息種子有直接或間接蟲網(wǎng)關(guān)系的信息主叫號碼劃分為垃圾信息主叫號碼團(tuán)伙集;第一判定單元,用于依據(jù)所述垃圾信息主叫號碼團(tuán)伙集判定與所述垃圾信息種子有直接或間接蟲網(wǎng)關(guān)系的所述信息主叫號碼為所述垃圾信息號碼。
      [0016]優(yōu)選地,所述第一判定單元包括:排序子單元,用于對所述垃圾信息主叫號碼團(tuán)伙集中的號碼進(jìn)行排序;獲取子單元,用于獲取排序后的預(yù)定間隔內(nèi)的連續(xù)號碼數(shù);判斷子單元,用于判斷所述連續(xù)號碼數(shù)是否超過第一預(yù)定閾值;第一確定子單元,用于在判斷結(jié)果為是的情況下,確定信息主叫號碼為所述垃圾信息號碼。
      [0017]優(yōu)選地,所述第二確定模塊包括:第二切分單元,用于將與所述垃圾信息種子有直接或間接蟲網(wǎng)關(guān)系的所述信息劃分為垃圾信息內(nèi)容團(tuán)伙集;第二判定單元,用于依據(jù)所述垃圾信息內(nèi)容團(tuán)伙集判定與所述垃圾信息種子有直接或間接蟲網(wǎng)關(guān)系的所述信息為所述垃圾信息。
      [0018]優(yōu)選地,所述第二判定單元包括以下至少之一:第二確定子單元,用于通過判斷所述垃圾信息內(nèi)容團(tuán)伙集中所述信息與所述垃圾信息種子間公共字符個(gè)數(shù)與消息最大長度的比的方式來獲得所述信息與所述垃圾信息種子的相似性值,在相似性值超過第二預(yù)定閾值的情況下,確定所述信息為所述垃圾信息;第三確定子單元,用于判斷所述垃圾信息內(nèi)容團(tuán)伙集中與所述垃圾信息種子有直接或間接蟲網(wǎng)關(guān)系的所述信息的發(fā)送條數(shù),在發(fā)送條數(shù)超過第三預(yù)定閾值的情況下,確定所述信息為所述垃圾信息;第四確定子單元,用于判斷所述垃圾信息內(nèi)容團(tuán)伙集中與所述垃圾信息種子有直接或間接蟲網(wǎng)關(guān)系的所述信息的參與主叫號碼數(shù),在所述參與主叫號碼數(shù)超過第四預(yù)定閾值的情況下,確定所述信息為所述垃圾信息。
      [0019]通過本發(fā)明,采用獲取垃圾信息種子;以所述垃圾信息種子為起點(diǎn),以預(yù)定的話單文件集為爬蟲處理體,采用以信息內(nèi)容爬垃圾信息主叫號碼,以垃圾信息主叫號碼爬信息內(nèi)容的方式進(jìn)行迭代爬行處理;確定與所述垃圾信息種子有直接或間接蟲網(wǎng)關(guān)系的信息主叫號碼為垃圾信息號碼,和/或,確定與所述垃圾信息種子有直接或間接蟲網(wǎng)關(guān)系的信息為垃圾信息,解決了相關(guān)技術(shù)中存在無法對整個(gè)團(tuán)伙垃圾攔截的問題,進(jìn)而達(dá)到了能夠?qū)鹘刑柎a團(tuán)伙以及垃圾內(nèi)容團(tuán)伙進(jìn)行有效識別,大幅提升垃圾信息治理的效果。
      【附圖說明】
      [0020]此處所說明的附圖用來提供對本發(fā)明的進(jìn)一步理解,構(gòu)成本申請的一部分,本發(fā)明的示意性實(shí)施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當(dāng)限定。在附圖中:
      [0021]圖1是根據(jù)本發(fā)明實(shí)施例的垃圾信息處理方法的流程圖;
      [0022]圖2是根據(jù)本發(fā)明實(shí)施例的垃圾信息處理裝置的結(jié)構(gòu)框圖;
      [0023]圖3是根據(jù)本發(fā)明實(shí)施例的垃圾信息處理裝置中獲取模塊22的優(yōu)選結(jié)構(gòu)框圖;
      [0024]圖4是根據(jù)本發(fā)明實(shí)施例的垃圾信息處理裝置中第一確定模塊26的優(yōu)選結(jié)構(gòu)框圖;
      [0025]圖5是根據(jù)本發(fā)明實(shí)施例的垃圾信息處理裝置中第一確定模塊26
      當(dāng)前第1頁1 2 3 4 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1