一種實現(xiàn)騷擾電話監(jiān)控策略優(yōu)化的方法和裝置的制造方法
【技術領域】
[0001]本發(fā)明涉及通信安全領域,具體涉及一種實現(xiàn)騷擾電話監(jiān)控策略優(yōu)化的方法和裝置。
【背景技術】
[0002]隨著移動通信服務的不斷拓展,利用移動通信網(wǎng)絡撥打騷擾電話的現(xiàn)象隨之大量出現(xiàn),成為用戶投訴和形成對通信網(wǎng)絡沖擊的重要原因之一。騷擾電話源于不法用戶對移動客戶大范圍撥打,短時間振鈴后掛機,等客戶回撥時呼轉(zhuǎn)到音信臺或錄音電話,形成騷擾和欺詐。
[0003]目前運營商治理騷擾電話的技術手段主要是建立騷擾電話監(jiān)控系統(tǒng),系統(tǒng)包含數(shù)據(jù)收集模塊、策略管理模塊、自動取證模塊和人工審核模塊。該系統(tǒng)收集各省信令監(jiān)測平臺的數(shù)據(jù),采取基于主叫頻次的監(jiān)控策略判別出疑似騷擾電話,然后經(jīng)過自動取證模塊,進一步的篩選認證,最后通過人工審核判別出騷擾電話。
[0004]現(xiàn)有的技術缺陷主要是基于主叫頻次、離散度、主叫接通率這三個因子閾值門限進行疑似騷擾電話的篩選,三個因子通常獨立生效,其實三個因子的組合對于疑似騷擾電話的篩選更為準確,但是三個因子的閥值如何選取沒有有效的辦法,因此導致策略的好壞無從評價,騷擾電話的疑似確認比(上報疑似號碼總量/確認騷擾號碼量)比較高,大大浪費了人工審核的工作。
【發(fā)明內(nèi)容】
[0005]本發(fā)明實施例的目的在于提供一種實現(xiàn)騷擾電話監(jiān)控策略優(yōu)化的方法和裝置,優(yōu)化騷擾電話的篩選策略,以提高騷擾電話的篩選效率。
[0006]為了達到上述目的,本發(fā)明實施例提供了一種實現(xiàn)騷擾電話監(jiān)控策略優(yōu)化的方法,包括:
[0007]獲取包含有已確認的騷擾電話號碼和非騷擾電話號碼的數(shù)據(jù)樣本,所述數(shù)據(jù)樣本還包括所有電話號碼的多個特征因子,所述多個特征因子包括呼叫頻次、呼叫離散度、接通率;對所述數(shù)據(jù)樣本多次執(zhí)行特征閾值確定流程,并在每執(zhí)行一次特征閾值確定流程后,基于當前所確定的特征閾值,執(zhí)行疑似騷擾電話號碼的篩選流程,根據(jù)篩選出的疑似騷擾電話號碼與數(shù)據(jù)樣本中騷擾電話號碼的接近程度,調(diào)整各個特征因子對應的篩選比例,直至滿足預定條件,并得到滿足預定條件時各個特征因子對應的特征閾值,各個特征因子對應的篩選比例具有一初始值;
[0008]其中,所述特征閾值確定流程包括:
[0009]按照預定篩選條件,依次遍歷呼叫頻次、呼叫離散度、接通率這三個特征因子,在每個特征因子的遍歷過程中,確定當前特征因子對應的特征閾值,該特征閾值使得第一電話號碼數(shù)量與第二電話號碼數(shù)量的比值等于當前特征因子對應的篩選比例,其中,第一電話號碼數(shù)量是指當前數(shù)據(jù)樣本中的騷擾電話號碼數(shù)量,第二電話號碼數(shù)量是指當前數(shù)據(jù)樣本中當前特征因子與所述特征閾值之間滿足預定篩選條件的電話號碼數(shù)量;所述當前數(shù)據(jù)樣本初始為所述數(shù)據(jù)樣本,并在每遍歷一個特征因子后,從當前數(shù)據(jù)樣本中刪除滿足所述預定篩選條件的電話號碼,以更新當前數(shù)據(jù)樣本;
[0010]其中,疑似騷擾電話號碼的篩選流程包括:
[0011]按照預定篩選條件,依次遍歷呼叫頻次、呼叫離散度和接通率這三個特征因子,篩選出疑似騷擾電話號碼。
[0012]其中,得到滿足預定條件時各個特征因子對應的特征閾值的步驟后,所述方法還包括:
[0013]根據(jù)得到的特征閾值,對實際需要篩選的電話號碼執(zhí)行所述疑似騷擾電話號碼的篩選流程,篩選出疑似騷擾電話號碼。
[0014]其中,獲取包含有已確認的騷擾電話號碼、非騷擾電話號碼和所有電話號碼的特征因子的數(shù)據(jù)樣本的步驟包括:
[0015]獲取已經(jīng)審核確認的多個騷擾電話號碼和多個非騷擾電話號碼;
[0016]從通信網(wǎng)絡中提取所述多個騷擾電話號碼和所述多個非騷擾電話號碼對應的信令數(shù)據(jù),對所述信令數(shù)據(jù)進行統(tǒng)計分析,得到所述多個騷擾電話號碼和所述多個非騷擾電話號碼的特征因子;
[0017]對所述騷擾電話號碼、非騷擾電話號碼和特征因子進行合并,獲得包含已確認的騷擾電話號碼、非騷擾電話號碼和多個特征因子的數(shù)據(jù)樣本。
[0018]其中,所述各個特征因子與特征閾值的所述預定篩選條件包括:
[0019]呼叫頻次大于等于呼叫頻次對應的特征閾值;
[0020]呼叫離散度大于等于呼叫離散度對應的特征閾值;
[0021]接通率小于等于接通率對應的特征閾值。
[0022]其中,所述滿足預定條件為:執(zhí)行所述疑似騷擾電話號碼的篩選流程達到預定次數(shù)或者篩選出的疑似騷擾電話號碼與數(shù)據(jù)樣本中騷擾電話號碼的接近程度滿足預設程度值。
[0023]其中,所述接近程度包括:疑似騷擾電話號碼中的騷擾電話號碼的數(shù)量與數(shù)據(jù)樣本中騷擾電話號碼的數(shù)量之間的第一接近程度,和/或,疑似騷擾電話號碼中的騷擾電話號碼的數(shù)量與疑似騷擾電話號碼的數(shù)量之間的第二接近程度。
[0024]其中,在所述接近程度包括所述第一接近程度和第二接近程度時,所述第一接近程度用疑似騷擾電話號碼中的騷擾電話號碼的數(shù)量與數(shù)據(jù)樣本中騷擾電話號碼的數(shù)量的第一比值表示,所述第二接近程度用疑似騷擾電話號碼中的騷擾電話號碼的數(shù)量與疑似騷擾電話號碼的數(shù)量的第二比值表示,所述調(diào)整各個特征因子對應的篩選比例包括:
[0025]若第一比值的預設期望值與第一比值的實際值的差值,小于第二比值的預設期望值與第二比值的實際值的差值,則調(diào)大各個特征因子對應的篩選比例;
[0026]若第一比值的預設期望值與第一比值的實際值的差值,大于第二比值的預設期望值與第二比值的實際值的差值,則調(diào)小各個特征因子對應的篩選比例。
[0027]本發(fā)明的實施例還提供了一種實現(xiàn)騷擾電話監(jiān)控策略優(yōu)化的裝置,包括:
[0028]獲取模塊,用于獲取包含有已確認的騷擾電話號碼和非騷擾電話號碼的數(shù)據(jù)樣本,所述數(shù)據(jù)樣本還包括所有電話號碼的多個特征因子,所述多個特征因子包括呼叫頻次、呼叫離散度、接通率;第一篩選模塊,用于對所述數(shù)據(jù)樣本多次執(zhí)行特征閾值確定流程,并在每執(zhí)行一次特征閾值確定流程后,基于當前所確定的特征閾值,執(zhí)行疑似騷擾電話號碼的篩選流程,根據(jù)篩選出的疑似騷擾電話號碼與數(shù)據(jù)樣本中騷擾電話號碼的接近程度,調(diào)整各個特征因子對應的篩選比例,直至滿足預定條件,并得到滿足預定條件時各個特征因子對應的特征閾值,各個特征因子對應的篩選比例具有一初始值;
[0029]其中,所述特征閾值確定流程包括:
[0030]按照預定篩選條件,依次遍歷呼叫頻次、呼叫離散度、接通率這三個特征因子,在每個特征因子的遍歷過程中,確定當前特征因子對應的特征閾值,該特征閾值使得第一電話號碼數(shù)量與第二電話號碼數(shù)量的比值等于當前特征因子對應的篩選比例,其中,第一電話號碼數(shù)量是指當前數(shù)據(jù)樣本中的騷擾電話號碼數(shù)量,第二電話號碼數(shù)量是指當前數(shù)據(jù)樣本中當前特征因子與所述特征閾值之間滿足預定篩選條件的電話號碼數(shù)量;所述當前數(shù)據(jù)樣本初始為所述數(shù)據(jù)樣本,并在每遍歷一個特征因子后,從當前數(shù)據(jù)樣本中刪除滿足所述預定篩選條件的電話號碼,以更新當前數(shù)據(jù)樣本;
[0031]其中,疑似騷擾電話號碼的篩選流程包括:
[0032]按照預定篩選條件,依次遍歷呼叫頻次、呼叫離散度和接通率這三個特征因子,篩選出疑似騷擾電話號碼。
[0033]其中,所述裝置還包括:
[0034]第二篩選模塊,用于根據(jù)得到的特征閾值,對實際需要篩選的電話號碼執(zhí)行所述疑似騷擾電話號碼的篩選流程,篩選出疑似騷擾電話號碼。
[0035]其中,獲取模塊包括:
[0036]獲取子模塊,用于獲取已經(jīng)審核確認的多個騷擾電話號碼和多個非騷擾電話號碼;
[0037]提取分析子模塊,用于從通信網(wǎng)絡中提取所述多個騷擾電話號碼和所述多個非騷擾電話號碼對應的信令數(shù)據(jù),對所述信令數(shù)據(jù)進行統(tǒng)計分析,得到所述多個騷擾電話號碼和所述多個非騷擾電話號碼的特征因子;
[0038]合并子模塊,用于對所述騷擾電話號碼、非騷擾電話號碼和特征因子進行合并,