專利名稱:一種短消息監(jiān)控方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信領(lǐng)域,尤其涉及一種短消息監(jiān)控方法及裝置。
背景技術(shù):
目前,在短消息系統(tǒng)中傳播的海量短消息中存在相當比例的垃圾短消息,涵蓋各種促銷甚至惡意短消息,給用戶造成困擾的同時,也對短消息系統(tǒng)的運營形成了挑戰(zhàn)?,F(xiàn)有技術(shù)中可以利用短消息監(jiān)控系統(tǒng)對垃圾短消息進行監(jiān)控,盡可能地識別、屏蔽短消息系統(tǒng)中的垃圾短消息發(fā)送者,減少垃圾短消息的危害,而監(jiān)控規(guī)則是短消息監(jiān)控系統(tǒng)設(shè)計的關(guān)鍵。短消息系統(tǒng)中存在各種各樣的垃圾短消息發(fā)送者,設(shè)計良好的監(jiān)控系統(tǒng), 需要針對不同類型垃圾短消息發(fā)送者的典型特征制定相應的多種垃圾短消息監(jiān)控規(guī)則。許多垃圾短消息中包含連續(xù)數(shù)字數(shù)列(即一連串數(shù)字信息),例如,營銷類短消息通常包含聯(lián)系電話,包含銀行賬號用以詐騙用戶匯款的短消息也很常見,這種垃圾短消息可以稱為連續(xù)數(shù)字數(shù)列類型的垃圾短消息。目前已有的短消息監(jiān)控系統(tǒng)缺乏對包含連續(xù)數(shù)字數(shù)列的垃圾短消息的有針對性的監(jiān)控規(guī)則。而在現(xiàn)有的短消息監(jiān)控規(guī)則中,流量規(guī)則與關(guān)鍵字規(guī)則是兩種主要的通用監(jiān)控規(guī)則。前者基于垃圾短消息發(fā)送者短時間高頻度發(fā)送短消息的特征,后者基于一些預先配置的在垃圾短消息中經(jīng)常出現(xiàn)的關(guān)鍵字或關(guān)鍵字組合來識別垃圾短消息。對于前述包含連續(xù)數(shù)字數(shù)列類型的垃圾短消息,流量規(guī)則難以量化頻度指標,而關(guān)鍵字規(guī)則難以預先準確設(shè)定通用的關(guān)鍵字,因而兩者都難以全面、精準地識別包含連續(xù)數(shù)字數(shù)列的垃圾短消息,也就無法識別、屏蔽短消息系統(tǒng)中包含連續(xù)數(shù)字數(shù)列的垃圾短消息發(fā)送者。
發(fā)明內(nèi)容
本發(fā)明實施例提供一種短消息監(jiān)控方法及裝置,用于解決現(xiàn)有技術(shù)無法全面、精確地識別連續(xù)數(shù)字數(shù)列類型的垃圾短消息,以及難以識別、屏蔽短消息系統(tǒng)中連續(xù)數(shù)字數(shù)列類型的垃圾短消息發(fā)送者的問題。一種短消息監(jiān)控方法,該方法包括確定發(fā)送短消息中包含的連續(xù)數(shù)字數(shù)列的長度達到門限值的短消息的發(fā)送者;確定監(jiān)控周期時長內(nèi),該發(fā)送者發(fā)送的短消息總數(shù)量達到設(shè)定值時,確定在所述監(jiān)控周期時長內(nèi),該發(fā)送者發(fā)送的短消息中包含的連續(xù)數(shù)字數(shù)列的長度達到門限值的短消息數(shù)量與該發(fā)送者發(fā)送的短消息總數(shù)量的比率,是否達到設(shè)定閾值;若達到設(shè)定閾值,則將該發(fā)送者確定為垃圾短消息發(fā)送者。一種短消息監(jiān)控裝置,該裝置包括第一確定模塊,用于確定發(fā)送短消息中包含的連續(xù)數(shù)字數(shù)列的長度達到門限值的短消息的發(fā)送者;第二確定模塊,用于確定監(jiān)控周期時長內(nèi),該發(fā)送者發(fā)送的短消息總數(shù)量達到設(shè)定值;
第三確定模塊,用于確定在所述監(jiān)控周期時長內(nèi),該發(fā)送者發(fā)送的短消息中包含的連續(xù)數(shù)字數(shù)列的長度達到門限值的短消息數(shù)量與該發(fā)送者發(fā)送的短消息總數(shù)量的比率, 是否達到設(shè)定閾值,若達到設(shè)定閾值,則將該發(fā)送者確定為垃圾短消息發(fā)送者。根據(jù)本發(fā)明實施例提供的方案,針對包含連續(xù)數(shù)字數(shù)列的短消息,首先從中確定包含超過一定長度的數(shù)字信息的短消息的發(fā)送者,然后在該發(fā)送者在監(jiān)控周期時長內(nèi)發(fā)送的短消息總數(shù)量達到設(shè)定值時,繼續(xù)確定在監(jiān)控周期時長該發(fā)送者發(fā)送的包含超過一定長度的數(shù)字信息的短消息的數(shù)量與該發(fā)送者發(fā)送的短消息的總數(shù)量是否達到設(shè)定的比率,若達到,則確定該發(fā)送者為垃圾短消息發(fā)送者,從而在全面、精確地識別連續(xù)數(shù)字數(shù)列類型的垃圾短消息的基礎(chǔ)上,可以對發(fā)送連續(xù)數(shù)字數(shù)列類型的垃圾短消息發(fā)送者進行識別和屏蔽,提高對垃圾短消息發(fā)送者的識別和屏蔽精度。
圖1為本發(fā)明實施例一提供的一種短消息監(jiān)控方法的步驟流程圖;圖2為本發(fā)明實施例二提供的一種短消息監(jiān)控方法的步驟流程圖;圖3為本發(fā)明實施例三提供的一種短消息監(jiān)控裝置的結(jié)構(gòu)示意圖。
具體實施例方式針對現(xiàn)有技術(shù)中無法精確、全面地識別連續(xù)數(shù)字數(shù)列類型的垃圾短消息,也難以識別、屏蔽短消息系統(tǒng)中連續(xù)數(shù)字數(shù)列類型的垃圾短消息發(fā)送者,本發(fā)明實施例提供一種綜合考慮短消息頻度與短消息內(nèi)容的短消息監(jiān)控解決方案,主要思想為持續(xù)跟蹤分析短消息系統(tǒng)中的所有短消息,若發(fā)現(xiàn)某發(fā)送者以較高的頻度和比率發(fā)送包含連續(xù)數(shù)字數(shù)列的短消息,則將該發(fā)送者作為垃圾短消息發(fā)送者輸出。下面結(jié)合說明書附圖和各實施例對本發(fā)明技術(shù)方案進行說明。實施例一、本發(fā)明實施例一提供一種短消息監(jiān)控方法,該方法的步驟流程如圖1所示,具體包括步驟101、確定發(fā)送包含連續(xù)數(shù)字數(shù)列長度達到門限值的短消息的發(fā)送者。在采集到短消息后,可以從采集到的短消息提取短消息內(nèi)容、主叫號碼等信息,根據(jù)短消息內(nèi)容來判斷該短消息是否為垃圾短消息,并可以根據(jù)主叫號碼確定該短消息的發(fā)送者。在本步驟中,具體的,可以掃描短消息內(nèi)容,確定短消息內(nèi)容中是否包含連續(xù)數(shù)字數(shù)列若包括,可以確定該短消息內(nèi)容中包含的每個連續(xù)數(shù)字數(shù)列的長度,該連續(xù)數(shù)字數(shù)列的長度是指,一串連續(xù)的數(shù)字序列的位數(shù),如138123789的連續(xù)數(shù)字數(shù)列的長度為9,9789458717的連續(xù)數(shù)字數(shù)列的長度為10。并從該短消息內(nèi)容中包含的每個連續(xù)數(shù)字數(shù)列的長度中,確定最大長度,將最大長度達到門限值的短消息確定為包含的連續(xù)數(shù)字數(shù)列長度達到門限值的短消息,如,若一條短消息中同時包括連續(xù)數(shù)字數(shù)列138123789和 9789458717,則該短消息對應的連續(xù)數(shù)字數(shù)列的最大長度為10,若所述門限值為8,則可以確定該短消息為包含的連續(xù)數(shù)字數(shù)列最大長度(10)達到門限值(8)的短消息;
若不包括,確定該短消息內(nèi)容中包含的連續(xù)數(shù)字數(shù)列的最大長度為0。由于所述門限值為正整數(shù),因此,該短消息必然不是包含的連續(xù)數(shù)字數(shù)列長度達到門限值的短消息。為了避免將正常攜帶的連續(xù)數(shù)字數(shù)列的短消息誤識別為垃圾短消息,可以設(shè)定所述門限值為8,即僅識別長度達到8個數(shù)字的序列,以減小監(jiān)控誤差。在確定出包含的連續(xù)數(shù)字數(shù)列長度達到門限值的短消息后,可以對應地確定該短消息的發(fā)送者。步驟102、確定監(jiān)控周期時長內(nèi),該發(fā)送者發(fā)送的短消息總數(shù)量達到設(shè)定值。在確定出發(fā)送了包含的連續(xù)數(shù)字數(shù)列長度達到門限值的短消息的發(fā)送者之后,可以確定該發(fā)送者在監(jiān)控周期時長內(nèi)發(fā)送的短消息總數(shù)量是否達到設(shè)定值,若達到,則判斷該發(fā)送者有可能為垃圾短消息發(fā)送者。所述監(jiān)控周期時長的起止時間可以任意設(shè)定,特殊的,監(jiān)控周期時長的起始時間可以設(shè)定為確定該發(fā)送者發(fā)送包含連續(xù)數(shù)字數(shù)列長度達到門限值的短消息的時刻,從而避免在包含連續(xù)數(shù)字數(shù)列的垃圾短消息為階段性發(fā)送時,對垃圾短消息發(fā)送者的漏檢。步驟103、確定垃圾短消息發(fā)送者。本步驟具體包括將所述監(jiān)控周期時長內(nèi),發(fā)送的包含的連續(xù)數(shù)字數(shù)列長度達到門限值的短消息的數(shù)量與發(fā)送的短消息總數(shù)量的比率達到設(shè)定閾值的發(fā)送者確定為垃圾短消息發(fā)送者。步驟104、保存監(jiān)控結(jié)果。本步驟包括,將確定該發(fā)送者為垃圾短消息發(fā)送者的監(jiān)控結(jié)果發(fā)送至數(shù)據(jù)庫保存,以便于后續(xù)對該發(fā)送者進行屏蔽、攔截等處理。為了保證監(jiān)控結(jié)果的準確性,本發(fā)明實施例提供的方法還可以進一步包括步驟105、對監(jiān)控結(jié)果進行人工審核仲裁。本步驟具體包括,將該發(fā)送者在所述監(jiān)控周期時長內(nèi)發(fā)送的全部短消息發(fā)送至數(shù)據(jù)庫保存,根據(jù)所述全部短消息對所述監(jiān)控結(jié)果進行人工審核仲裁。下面通過一個具體的實例對本發(fā)明實施例一的方案進行詳細說明。該具體的實例提供的短消息監(jiān)控規(guī)則可以包括以下屬性連續(xù)數(shù)字數(shù)列最大長度(MaxContiNumLen)、 監(jiān)控周期時長(MonitorPeriod)、短消息總數(shù)量設(shè)定值(TotalThred)、包含的連續(xù)數(shù)字數(shù)列最大長度達到門限值的短消息的數(shù)量與發(fā)送的短消息總數(shù)量的比率閾值 (ContiNumProportionThred)。實施例二、本發(fā)明實施例二提供一種短消息監(jiān)控方法,該方法的步驟流程如圖2所示,具體包括步驟201、采集短消息,并從中提取主叫號碼、短消息內(nèi)容等信息。所述主叫號碼可以用CallerISDN來標識。步驟202、對主叫用戶在監(jiān)控周期時長內(nèi)所發(fā)送的短消息總條數(shù)進行計數(shù)。所述主叫用戶是指步驟201中提取出的主叫號碼對應的用戶。在本步驟中,統(tǒng)計該用戶在監(jiān)控周期時長(MonitorPeriod)內(nèi)所發(fā)送的短消息總條數(shù)。具體的,可以通過設(shè)定第一計數(shù)器來實現(xiàn)計數(shù),其初始值可以為0,在監(jiān)控周期時長內(nèi),每確定主叫用戶發(fā)送一條短消息,則該第一計數(shù)器加1。
5
步驟203、掃描短消息內(nèi)容,獲取短消息中包含的連續(xù)數(shù)字數(shù)列的最大長度。若短消息內(nèi)容中不包含任何連續(xù)數(shù)字數(shù)列,則最大長度為0。所述最大長度可以用MaxContiNumLen來標識。步驟204、判定短消息內(nèi)容中是否包含達到限定長度的連續(xù)數(shù)字數(shù)列。在本步驟中,可以判斷該短消息包含的連續(xù)數(shù)字數(shù)列的最大長度是否達到設(shè)定的門限值要求,即判斷MaxContiNumLen是否達到設(shè)定門限值,若是,則執(zhí)行步驟205,否則,執(zhí)行步驟206。步驟205、在監(jiān)控周期時長內(nèi),對主叫用戶發(fā)送的包含達到限定長度的連續(xù)數(shù)字數(shù)列的短消息條數(shù)進行計數(shù)。具體的,可以通過設(shè)定第二計數(shù)器來實現(xiàn),其初始值可以為0,在監(jiān)控周期時長內(nèi), 每確定主叫用戶發(fā)送一條包含達到限定長度的連續(xù)數(shù)字數(shù)列的短消息,則該第二計數(shù)器加 1。步驟206、在監(jiān)控周期時長內(nèi),判定主叫用戶發(fā)送的短消息總條數(shù)是否達到設(shè)定值。在本步驟中,判斷主叫用戶發(fā)送的短消息總條數(shù)是否達到設(shè)定的短消息總數(shù)量設(shè)定值(TotalThred),若達到,則執(zhí)行步驟207,否則,監(jiān)控流程結(jié)束。步驟207、在監(jiān)控周期時長內(nèi),確定主叫用戶發(fā)送的包含連續(xù)數(shù)字數(shù)列的短消息條數(shù)占短消息總條數(shù)的比率??梢酝ㄟ^讀取第二計數(shù)器的數(shù)值來獲得在監(jiān)控周期時長內(nèi),主叫用戶發(fā)送的包含連續(xù)數(shù)字數(shù)列的短消息條數(shù),通過讀取第一計數(shù)器的數(shù)值來獲得在監(jiān)控周期時長內(nèi),主叫用戶發(fā)送的短消息總條數(shù)。在本步驟中,可以判斷確定出的比率是否達到設(shè)定的包含的連續(xù)數(shù)字數(shù)列最大長度達到門限值的短消息的數(shù)量與發(fā)送的短消息總數(shù)量的比率閾值 (ContiNumProportionThred),若達到,則執(zhí)行步驟208,否則,監(jiān)控流程結(jié)束。步驟208、輸出監(jiān)控結(jié)果。確定該主叫用戶為垃圾短消息發(fā)送者,并將該監(jiān)控結(jié)果輸出,以便于后續(xù)根據(jù)該監(jiān)控結(jié)果,對該主叫用戶進行相應的識別、屏蔽等處理。根據(jù)本發(fā)明實施例一和實施例二提供的方案,將包含的連續(xù)數(shù)字數(shù)列長度達到門限值的短消息確定為垃圾短消息,無需通過設(shè)定具體的關(guān)鍵字來確定連續(xù)數(shù)字數(shù)列類型的垃圾短消息,避免了關(guān)鍵字規(guī)則中難以預先準確設(shè)定通用關(guān)鍵字的問題,同時在確定在監(jiān)控周期時長內(nèi),發(fā)送者發(fā)送的短消息總數(shù)量達到設(shè)定值的基礎(chǔ)上,通過進一步確定在監(jiān)控周期時長內(nèi),該發(fā)送者發(fā)送的連續(xù)數(shù)字數(shù)列類型的垃圾短消息與該發(fā)送者發(fā)送的短消息總數(shù)量的比率是否達到設(shè)定的閾值來確定該發(fā)送者是否為垃圾短消息發(fā)送者,避免單純流量規(guī)則難以量化流量門限值的缺點,從而解決了本發(fā)明提出的技術(shù)問題。實施例三、本發(fā)明實施例三提供一種短消息監(jiān)控裝置,該裝置的結(jié)構(gòu)示意如圖3所示,具體包括第一確定模塊11用于確定發(fā)送短消息中包含的連續(xù)數(shù)字數(shù)列的長度達到門限值的短消息的發(fā)送者;第二確定模塊12用于確定監(jiān)控周期時長內(nèi),該發(fā)送者發(fā)送的短消息總數(shù)量達到設(shè)定值;第三確定模塊13用于確定在所述監(jiān)控周期時長內(nèi),該發(fā)送者發(fā)送的短消息中包含的連續(xù)數(shù)字數(shù)列的長度達到門限值的短消息數(shù)量與該發(fā)送者發(fā)送的短消息總數(shù)量的比率,是否達到設(shè)定閾值,若達到設(shè)定閾值,則將該發(fā)送者確定為垃圾短消息發(fā)送者。第一確定模塊11具體用于針對每一短消息,掃描該短消息的內(nèi)容,確定該短消息的內(nèi)容中包含有連續(xù)數(shù)字數(shù)列,并確定該短消息的內(nèi)容中包含的每個連續(xù)數(shù)字數(shù)列的長度及該長度中的最大長度,若確定的最大長度達到門限值,則將該短消息確定為包含的連續(xù)數(shù)字數(shù)列的長度達到門限值的短消息。第一確定模塊11具體用于掃描短消息內(nèi)容,在短消息內(nèi)容中不包含連續(xù)數(shù)字數(shù)列時,確定該短消息內(nèi)容中包含的連續(xù)數(shù)字數(shù)列的長度為0。所述裝置還包括發(fā)送模塊14 發(fā)送模塊14用于將確定該發(fā)送者為垃圾短消息發(fā)送者的監(jiān)控結(jié)果發(fā)送至數(shù)據(jù)庫保存。所述發(fā)送模塊14還用于將該發(fā)送者在所述監(jiān)控周期時長內(nèi)發(fā)送的全部短消息發(fā)送至數(shù)據(jù)庫保存。顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。
權(quán)利要求
1.一種短消息監(jiān)控方法,其特征在于,該方法包括確定發(fā)送短消息中包含的連續(xù)數(shù)字數(shù)列的長度達到門限值的短消息的發(fā)送者; 確定監(jiān)控周期時長內(nèi),該發(fā)送者發(fā)送的短消息總數(shù)量達到設(shè)定值時,確定在所述監(jiān)控周期時長內(nèi),該發(fā)送者發(fā)送的短消息中包含的連續(xù)數(shù)字數(shù)列的長度達到門限值的短消息數(shù)量與該發(fā)送者發(fā)送的短消息總數(shù)量的比率,是否達到設(shè)定閾值; 若達到設(shè)定閾值,則將該發(fā)送者確定為垃圾短消息發(fā)送者。
2.如權(quán)利要求1所述的方法,其特征在于,所述監(jiān)控周期時長是指起始時間和結(jié)束時間均任意設(shè)定的一段時間;或者所述監(jiān)控周期時長是指在確定該發(fā)送者發(fā)送了包含連續(xù)數(shù)字數(shù)列的短消息,且該連續(xù)數(shù)字數(shù)列的長度達到門限值時刻起的一段時間。
3.如權(quán)利要求1所述的方法,其特征在于,確定包含的連續(xù)數(shù)字數(shù)列的長度達到門限值的短消息,具體包括針對每一短消息,掃描該短消息的內(nèi)容,確定該短消息的內(nèi)容中包含有連續(xù)數(shù)字數(shù)列;確定該短消息的內(nèi)容中包含的每個連續(xù)數(shù)字數(shù)列的長度,確定最大長度; 若確定的最大長度達到門限值,則將該短消息確定為包含的連續(xù)數(shù)字數(shù)列的長度達到門限值的短消息。
4.如權(quán)利要求1 3任一所述的方法,其特征在于,確定垃圾短消息發(fā)送者之后,所述方法還包括將確定該發(fā)送者為垃圾短消息發(fā)送者的監(jiān)控結(jié)果發(fā)送至數(shù)據(jù)庫保存。
5.如權(quán)利要求4所述的方法,其特征在于,確定垃圾短消息發(fā)送者之后,所述方法還包括將該發(fā)送者在所述監(jiān)控周期時長內(nèi)發(fā)送的全部短消息發(fā)送至數(shù)據(jù)庫保存。
6.一種短消息監(jiān)控裝置,其特征在于,該裝置包括第一確定模塊,用于確定發(fā)送短消息中包含的連續(xù)數(shù)字數(shù)列的長度達到門限值的短消息的發(fā)送者;第二確定模塊,用于確定監(jiān)控周期時長內(nèi),該發(fā)送者發(fā)送的短消息總數(shù)量達到設(shè)定值;第三確定模塊,用于確定在所述監(jiān)控周期時長內(nèi),該發(fā)送者發(fā)送的短消息中包含的連續(xù)數(shù)字數(shù)列的長度達到門限值的短消息數(shù)量與該發(fā)送者發(fā)送的短消息總數(shù)量的比率,是否達到設(shè)定閾值,若達到設(shè)定閾值,則將該發(fā)送者確定為垃圾短消息發(fā)送者。
7.如權(quán)利要求6所述的裝置,其特征在于,第一確定模塊,具體用于針對每一短消息, 掃描該短消息的內(nèi)容,確定該短消息的內(nèi)容中包含有連續(xù)數(shù)字數(shù)列,并確定該短消息的內(nèi)容中包含的每個連續(xù)數(shù)字數(shù)列的長度及該長度中的最大長度,若確定的最大長度達到門限值,則將該短消息確定為包含的連續(xù)數(shù)字數(shù)列的長度達到門限值的短消息。
8.如權(quán)利要求6或7所述的裝置,其特征在于,所述裝置還包括發(fā)送模塊,用于將確定該發(fā)送者為垃圾短消息發(fā)送者的監(jiān)控結(jié)果發(fā)送至數(shù)據(jù)庫保存。
9.如權(quán)利要求8所述的裝置,其特征在于,所述發(fā)送模塊,還用于將該發(fā)送者在所述監(jiān)控周期時長內(nèi)發(fā)送的全部短消息發(fā)送至數(shù)據(jù)庫保存。
全文摘要
本發(fā)明實施例提供一種短消息監(jiān)控方法及裝置,包括針對包含連續(xù)數(shù)字數(shù)列的短消息,首先從中確定包含超過一定長度的數(shù)字信息的短消息的發(fā)送者,然后在該發(fā)送者在監(jiān)控周期時長內(nèi)發(fā)送的短消息總數(shù)量達到設(shè)定值時,繼續(xù)確定在監(jiān)控周期時長該發(fā)送者發(fā)送的包含超過一定長度的數(shù)字信息的短消息的數(shù)量與該發(fā)送者發(fā)送的短消息的總數(shù)量是否達到設(shè)定的比率,若達到,則確定該發(fā)送者為垃圾短消息發(fā)送者,從而在全面、精確地識別連續(xù)數(shù)字數(shù)列類型的垃圾短消息的基礎(chǔ)上,可以對發(fā)送連續(xù)數(shù)字數(shù)列類型的垃圾短消息發(fā)送者進行識別和屏蔽,提高對垃圾短消息發(fā)送者的識別和屏蔽精度。
文檔編號H04W12/12GK102421074SQ20111021054
公開日2012年4月18日 申請日期2011年7月26日 優(yōu)先權(quán)日2011年7月26日
發(fā)明者馮會彬 申請人:中興通訊股份有限公司