本發(fā)明屬于通信技術領域,具體涉及一種騷擾號碼分類方法、裝置和系統(tǒng)。
背景技術:
近年來,以運營商網絡為載體進行的各種類型的騷擾號碼愈演愈烈,嚴重影響了運營商的品牌形象、造成運營商和用戶的大量經濟損失。其中,騷擾號碼由于類型較多(如中介代理、廣告推銷、貸款理財等),一般的分類方法難以對騷擾號碼的具體類型進行準確分類,因此,對用戶的提醒價值不高。
目前,針對騷擾號碼的治理主要有三種手段。第一種為眾標眾享;第二種為反向驗證;第三種為欺詐號碼舉報。
對于第一種方案來說,由互聯網廠商提供,其準確率不高,且易引發(fā)用戶投訴;對于第二種方案來說,由運營商提供,其可發(fā)現虛假主叫,但現網部署的成本很高;對于第三種方案,由用戶提供,但用戶提供的數量少,應用周期長。
雖然,這些騷擾號碼給大多數用戶造成了困擾,但也有少部分用戶存在對應需求,因此,如何能夠對騷擾號碼進行分類,以供用戶選擇性的接聽與其需求對應的騷擾號碼,成為本領域亟待解決的問題。
技術實現要素:
本發(fā)明旨在至少解決現有技術中存在的技術問題之一,提出了一種能夠對騷擾號碼進行識別,并將騷擾號碼進行分組以供運營商平臺根據分組對騷擾號碼進行分類的騷擾號碼分類方法、裝置和系統(tǒng)。
解決本發(fā)明技術問題所采用的技術方案是一種騷擾號碼分類方法,包括:
根據獲取的每個電話號碼的語音詳單,生成每個電話號碼的通信指標;
根據所述通信指標,判斷所述電話號碼是否為騷擾號碼;
若判斷出所述電話號碼為騷擾號碼時,根據每個騷擾號碼對應的通信指標對所述騷擾號碼進行合并生成電話集合,以供運營商平臺根據所述電話集合對所述騷擾號碼進行分類。
其中,所述語音詳單包括:主叫次數、被叫次數、被叫的不同號碼數量、每次主叫時長和每次被叫時長;
所述通信指標包括:主叫次數占比、主叫總時長、被叫不重復率、被叫次數占比、被叫總時長和平均通話時長;
所述根據獲取的每個電話號碼的語音詳單,生成每個電話號碼的通信指標包括:
將所述主叫次數除以主叫次數和被叫次數的總數生成所述主叫次數占比;
將所述被叫次數除以主叫次數和被叫次數的總數生成所述被叫次數占比;
將所述被叫的不同號碼數量除以所述主叫次數生成所述被叫不重復率;
將所述每次主叫時長相加生成所述主叫總時長;
將所述每次被叫時長相加生成所述被叫總時長;
將所述主叫總時長與所述被叫總時長的和除以主叫次數和被叫次數的和生成所述通話平均時長。
其中,所述根據所述通信指標,判斷所述電話號碼是否為騷擾號碼包括:
根據每個電話號碼的所述通信指標,計算出每個通信指標的平均值;
將每個電話號碼的每個所述通信指標分別與對應的通信指標的平均值進行比較,判斷所述電話號碼是否為騷擾號碼。
其中,所述通信指標包括:主叫次數占比、主叫總時長、被叫不重復率、被叫次數占比、被叫總時長和平均通話時長;
所述根據每個電話號碼的所述通信指標,計算出每個通信指標的平均值包括:
將每個電話號碼的主叫次數占比相加除以電話號碼的數量生成主叫次數占比平均值;
將每個電話號碼的主叫總時長相加除以電話號碼的數量生成主叫總時長平均值;
將每個電話號碼的被叫不重復率相加除以電話號碼的數量生成被叫不重復率平均值;
將每個電話號碼的被叫次數占比相加除以電話號碼的數量生成被叫次數占比平均值;
將每個電話號碼的被叫總時長相加除以電話號碼的數量生成被叫總時長平均值;
將每個電話號碼的平均通話時長相加除以電話號碼的數量生成平均通話時長平均值;
所述將每個電話號碼的每個所述通信指標分別與對應的通信指標的平均值進行比較包括:
將所述電話號碼的主叫次數占比與主叫次數占比平均值進行比較,將所述電話號碼的主叫總時長與主叫總時長平均值進行比較,將所述電話號碼的被叫不重復率與被叫不重復率平均值進行比較,將所述電話號碼的被叫次數占比與被叫次數占比平均值進行比較,將所述電話號碼的被叫總時長與被叫總時長平均值進行比較,將所述電話號碼的平均通話時長與平均通話時長平均值進行比較;
所述判斷所述電話號碼是否為騷擾號碼包括:
若比較出所述電話號碼的主叫次數占比、被叫不重復率和主叫總時長均大于對應的平均值,且被叫次數占比、被叫總時長和平均通話時長均小于對應的平均值,判斷出所述電話號碼為騷擾號碼。
其中,所述根據每個騷擾號碼對應的通信指標對所述騷擾號碼進行合并生成電話集合包括:
統(tǒng)計每個基站下的每個時間段和每個號段的騷擾號碼的數量;
將位于同一基站下的同一時間段且同一號段內的騷擾號碼集成一個電話組;
將所述通信指標位于同一區(qū)間內的電話組進行合并,生成電話集合。
作為另一技術方案,本發(fā)明還提供一種騷擾號碼分類裝置,包括:
獲取模塊,用于根據獲取的每個電話號碼的語音詳單,生成每個電話號碼的通信指標;
判斷模塊,用于根據所述通信指標,判斷所述電話號碼是否為騷擾號碼;
生成模塊,用于若判斷出所述電話號碼為騷擾號碼時,根據每個騷擾號碼對應的通信指標對所述騷擾號碼進行合并生成電話集合,以供運營商平臺根據所述電話集合對所述騷擾號碼進行分類。
其中,所述語音詳單包括:主叫次數、被叫次數、被叫的不同號碼數量、每次主叫時長和每次被叫時長;
所述通信指標包括:主叫次數占比、主叫總時長、被叫不重復率、被叫次數占比、被叫總時長和平均通話時長;
所述獲取模塊具體用于:
將所述主叫次數除以主叫次數和被叫次數的總數生成所述主叫次數占比;
將所述被叫次數除以主叫次數和被叫次數的總數生成所述被叫次數占比;
將所述被叫的不同號碼數量除以所述主叫次數生成所述被叫不重復率;
將所述每次主叫時長相加生成所述主叫總時長;
將所述每次被叫時長相加生成所述被叫總時長;
將所述主叫總時長與所述被叫總時長的和除以主叫次數和被叫次數的和生成所述通話平均時長。
其中,所述判斷模塊包括:
計算模塊,用于根據每個電話號碼的所述通信指標,計算出每個通信指標的平均值;
比較模塊,用于將每個電話號碼的每個所述通信指標分別與對應的通信指標的平均值進行比較,判斷所述電話號碼是否為騷擾號碼。
其中,所述通信指標包括:主叫次數占比、主叫總時長、被叫不重復率、被叫次數占比、被叫總時長和平均通話時長;
所述計算模塊具體用于將每個電話號碼的主叫次數占比相加除以電話號碼的數量生成主叫次數占比平均值;將每個電話號碼的主叫總時長相加除以電話號碼的數量生成主叫總時長平均值;將每個電話號碼的被叫不重復率相加除以電話號碼的數量生成被叫不重復率平均值;將每個電話號碼的被叫次數占比相加除以電話號碼的數量生成被叫次數占比平均值;將每個電話號碼的被叫總時長相加除以電話號碼的數量生成被叫總時長平均值;將每個電話號碼的平均通話時長相加除以電話號碼的數量生成平均通話時長平均值;
所述比較模塊具體用于將所述電話號碼的主叫次數占比與主叫次數占比平均值進行比較,將所述電話號碼的主叫總時長與主叫總時長平均值進行比較,將所述電話號碼的被叫不重復率與被叫不重復率平均值進行比較,將所述電話號碼的被叫次數占比與被叫次數占比平均值進行比較,將所述電話號碼的被叫總時長與被叫總時長平均值進行比較,將所述電話號碼的平均通話時長與平均通話時長平均值進行比較;
所述判斷模塊還包括:子判斷模塊;
子判斷模塊,用于若比較出所述電話號碼的主叫次數占比、被叫不重復率和主叫總時長均大于對應的平均值,且被叫次數占比、被叫總時長和平均通話時長均小于對應的平均值,判斷出所述電話號碼為騷擾號碼。
其中,所述生成模塊包括:
統(tǒng)計模塊,用于統(tǒng)計每個基站下的每個時間段和每個號段的騷擾號碼的數量;
所述集成模塊,用于將位于同一基站下的同一時間段且同一號段內的騷擾號碼集成一個電話組;
所述子生成模塊,用于將所述通信指標位于同一區(qū)間內的電話組進行合并,生成電話集合。
作為另一技術方案,本發(fā)明還提供一種騷擾號碼分類系統(tǒng),包括運營商平臺和上述任意一項所述的騷擾號碼分類裝置;
所述運營商平臺根據電話集合對騷擾號碼進行分類。
本發(fā)明的騷擾號碼分類方法、裝置和系統(tǒng)中,該騷擾號碼分類方法包括:根據獲取的每個電話號碼的語音詳單,生成每個電話號碼的通信指標;根據通信指標,判斷電話號碼是否為騷擾號碼;若判斷出電話號碼為騷擾號碼時,根據每個騷擾號碼對應的通信指標對騷擾號碼進行合并生成電話集合,運營商平臺可以根據電話集合對該電話集合中的騷擾號碼進行撥測或實際調查,以確定該電話集合中的騷擾號碼對應的類別,即完成對騷擾號碼的分類
附圖說明
圖1為本發(fā)明的實施例1的騷擾號碼分類方法的流程示意圖;
圖2為本發(fā)明的實施例2的騷擾號碼分類裝置的結構示意圖;
圖3為本發(fā)明的實施例3的騷擾號碼分類系統(tǒng)的結構示意圖;
其中,附圖標記為:1、獲取模塊;2、判斷模塊;21、計算模塊;22、比較模塊;23、子判斷模塊;3、生成模塊;31、統(tǒng)計模塊;32、集成模塊;33、子生成模塊;10、運營商平臺;20、騷擾號碼分類裝置。
具體實施方式
為使本領域技術人員更好地理解本發(fā)明的技術方案,下面結合附圖和具體實施方式對本發(fā)明作進一步詳細描述。
實施例1:
請參照圖1,本實施例提供一種騷擾號碼分類方法,包括:
步驟101,根據獲取的每個電話號碼的語音詳單,生成每個電話號碼的通信指標。
其中,語音詳單包括:主叫次數、被叫次數、被叫的不同號碼數量、每次主叫時長和每次被叫時長。
當然,語音詳單所包含的內容并不局限于此,還可以包括通話開始時間、通話結束時間等,在此不再贅述。
其中,通信指標包括:主叫次數占比、主叫總時長、被叫不重復率、被叫次數占比、被叫總時長和平均通話時長。
步驟101具體包括:
將主叫次數除以主叫次數和被叫次數的總數生成主叫次數占比,即,主叫次數占比=主叫次數÷(主叫次數+被叫次數)。
將被叫次數除以主叫次數和被叫次數的總數生成被叫次數占比即,被叫次數占比=主叫次數÷(主叫次數+被叫次數)。
將被叫的不同號碼數量除以主叫次數生成被叫不重復率,即,被叫不重復率=被叫的不同號碼數量÷主叫次數。換句話數,被叫不重復率即為由該騷擾號碼打出的電話中,有多少被叫的號碼是不重復的。
將每次主叫時長相加生成主叫總時長,即主叫總時長=∑每次主叫時長。
將每次被叫時長相加生成被叫總時長,即被叫總時長=∑每次被叫時長。
將主叫總時長與被叫總時長的和除以主叫次數和被叫次數的和生成通話平均時長,即通話平均時長=(主叫總時長+被叫總時長)÷(主叫次數+被叫次數)。
需要說明的是,上述的主叫是指通過騷擾號碼打出的電話,被叫是指通過該騷擾號碼接聽的電話;上述通信指標的生成順序并不限定,可以是同時生成的,也可以是按照一定的順序生成的,在此不再贅述。
步驟102,根據通信指標,判斷電話號碼是否為騷擾號碼。
步驟102具體包括:
步驟1021,根據每個電話號碼的通信指標,計算出每個通信指標的平均值。
具體地,將每個電話號碼的主叫次數占比相加除以電話號碼的數量生成主叫次數占比平均值;將每個電話號碼的主叫總時長相加除以電話號碼的數量生成主叫總時長平均值;將每個電話號碼的被叫不重復率相加除以電話號碼的數量生成被叫不重復率平均值;將每個電話號碼的被叫次數占比相加除以電話號碼的數量生成被叫次數占比平均值;將每個電話號碼的被叫總時長相加除以電話號碼的數量生成被叫總時長平均值;將每個電話號碼的平均通話時長相加除以電話號碼的數量生成平均通話時長平均值。
需要說明的是,在計算通信指標的平均值時,電話號碼的數量是指在全網范圍內的所有電話號碼,即求出每個通信指標在全網中的平均值。
步驟1022,將每個電話號碼的每個通信指標分別與對應的通信指標的平均值進行比較,判斷電話號碼是否為騷擾號碼。
具體地,將電話號碼的主叫次數占比與主叫次數占比平均值進行比較,將電話號碼的主叫總時長與主叫總時長平均值進行比較,將電話號碼的被叫不重復率與被叫不重復率平均值進行比較,將電話號碼的被叫次數占比與被叫次數占比平均值進行比較,將電話號碼的被叫總時長與被叫總時長平均值進行比較,將電話號碼的平均通話時長與平均通話時長平均值進行比較。
步驟103,若判斷出電話號碼為騷擾號碼時,根據每個騷擾號碼對應的通信指標對騷擾號碼進行合并生成電話集合,以供運營商平臺根據電話集合對騷擾號碼進行分類。
步驟103具體包括:
步驟1031,判斷出電話號碼為騷擾號碼。
具體地,若比較出電話號碼的主叫次數占比、被叫不重復率和主叫總時長均大于對應的平均值,且被叫次數占比、被叫總時長和平均通話時長均小于對應的平均值,判斷出電話號碼為騷擾號碼。
也就是說,只有同時滿足電話號碼的主叫次數占比、被叫不重復率和主叫總時長均大于對應的平均值,且被叫次數占比、被叫總時長和平均通話時長均小于對應的平均值的電話號碼才被確認為是騷擾號碼,之所以如此設置,是為了提高確認騷擾號碼的準確率,避免發(fā)生誤判,從而給用戶帶來不必要的麻煩。
步驟1032,統(tǒng)計每個基站下的每個時間段和每個號段的騷擾號碼的數量。
可以理解的是,每一時間段可按小時區(qū)分,一個自然日有24個時間段,0點0分0秒至0點59分59秒為時間段1(timeslot1),依此類推;每一號段可以按號碼的后兩位進行劃分,如移動電話號碼10000000001至10000000099為號碼段1(numslot1),依此類推。當然,每個時間段和每個號段的劃分并不局限于此,在此不再贅述。
例如,統(tǒng)計在基站lac1下,語音詳單生成在0點0分0秒至0點59分59秒內的、移動電話號碼為10000000001至10000000099范圍內的騷擾號碼的數量。
步驟1033,將位于同一基站下的同一時間段且同一號段內的騷擾號碼集成一個電話組。
即,將步驟1032中獲得的每個基站下的每個時間段和每個號段的騷擾號碼集成一個電話組,可以理解的是,每個電話組中的騷擾號碼的數量至少為一個。
之所以如此設置,是由于一般來說,一個公司對其業(yè)務進行電話擴散時,多個撥打電話的操作人員是同時工作的,因此,這些操作人員撥打電話的時間段應該相同,同時,公司一般會直接申請一定數量的電話號碼,通常這些號碼是連續(xù)的,即位于同一號段內,因此,統(tǒng)計某一基站下每個時間段和每個號段的騷擾號碼,可以直接將同一公司的騷擾號碼歸為一組。
步驟1034,將通信指標位于同一區(qū)間內的電話組進行合并,生成電話集合,以供運營商平臺根據電話集合對騷擾號碼進行分類。
需要說明的是,位于同一區(qū)間內的電話組是指具有相似的通信指標的電話組,例如,在同一基站下,有n組電話組,其中,有n組電話組的被叫次數占比位于45%~50%之間,則將這n組進行合并,生成電話集合。當然,區(qū)間的劃分可根據實際情況進行設定,而且,在對電話組進行合并時,所采用的通信指標的數量可根據實際情況進行設定,在此不再贅述。
在對電話組進行合并生成電話集合之后,運營商平臺可根據電話集合對該電話集合中的騷擾號碼進行撥測或實際調查,以確定該電話集合中的騷擾號碼對應的類別,即完成對騷擾號碼的分類。
本實施例的騷擾號碼分類方法,包括:根據獲取的每個電話號碼的語音詳單,生成每個電話號碼的通信指標;根據通信指標,判斷電話號碼是否為騷擾號碼;若判斷出電話號碼為騷擾號碼時,根據每個騷擾號碼對應的通信指標對騷擾號碼進行合并生成電話集合,運營商平臺可以根據電話集合對該電話集合中的騷擾號碼進行撥測或實際調查,以確定該電話集合中的騷擾號碼對應的類別,即完成對騷擾號碼的分類。
實施例2:
請參照圖2,本實施例提供一種騷擾號碼分類裝置,包括:獲取模塊1、判斷模塊2和生成模塊3。
獲取模塊1用于根據獲取的每個電話號碼的語音詳單,生成每個電話號碼的通信指標。
判斷模塊2用于根據通信指標,判斷電話號碼是否為騷擾號碼。
生成模塊3用于若判斷出電話號碼為騷擾號碼時,根據每個騷擾號碼對應的通信指標對騷擾號碼進行合并生成電話集合,以供運營商平臺根據電話集合對騷擾號碼進行分類。
其中,語音詳單包括:主叫次數、被叫次數、被叫的不同號碼數量、每次主叫時長和每次被叫時長。
其中,通信指標包括:主叫次數占比、主叫總時長、被叫不重復率、被叫次數占比、被叫總時長和平均通話時長。
獲取模塊1具體用于:將主叫次數除以主叫次數和被叫次數的總數生成主叫次數占比;將被叫次數除以主叫次數和被叫次數的總數生成被叫次數占比;將被叫的不同號碼數量除以主叫次數生成被叫不重復率;將每次主叫時長相加生成主叫總時長;將每次被叫時長相加生成被叫總時長;將主叫總時長與被叫總時長的和除以主叫次數和被叫次數的和生成通話平均時長。
其中,判斷模塊2包括:計算模塊21、比較模塊22和子判斷模塊23。
計算模塊21用于根據每個電話號碼的通信指標,計算出每個通信指標的平均值。
計算模塊21具體用于將每個電話號碼的主叫次數占比相加除以電話號碼的數量生成主叫次數占比平均值;將每個電話號碼的主叫總時長相加除以電話號碼的數量生成主叫總時長平均值;將每個電話號碼的被叫不重復率相加除以電話號碼的數量生成被叫不重復率平均值;將每個電話號碼的被叫次數占比相加除以電話號碼的數量生成被叫次數占比平均值;將每個電話號碼的被叫總時長相加除以電話號碼的數量生成被叫總時長平均值;將每個電話號碼的平均通話時長相加除以電話號碼的數量生成平均通話時長平均值。
比較模塊22用于將每個電話號碼的每個通信指標分別與對應的通信指標的平均值進行比較,判斷電話號碼是否為騷擾號碼。
比較模塊22具體用于將電話號碼的主叫次數占比與主叫次數占比平均值進行比較,將電話號碼的主叫總時長與主叫總時長平均值進行比較,將電話號碼的被叫不重復率與被叫不重復率平均值進行比較,將電話號碼的被叫次數占比與被叫次數占比平均值進行比較,將電話號碼的被叫總時長與被叫總時長平均值進行比較,將電話號碼的平均通話時長與平均通話時長平均值進行比較。
子判斷模塊23用于若比較出電話號碼的主叫次數占比、被叫不重復率和主叫總時長均大于對應的平均值,且被叫次數占比、被叫總時長和平均通話時長均小于對應的平均值,判斷出電話號碼為騷擾號碼。
其中,生成模塊3包括:統(tǒng)計模塊31、集成模塊32和子生成模塊33。
統(tǒng)計模塊31用于統(tǒng)計每個基站下的每個時間段和每個號段的騷擾號碼的數量。
集成模塊32用于將位于同一基站下的同一時間段且同一號段內的騷擾號碼集成一個電話組。
子生成模塊33用于將通信指標位于同一區(qū)間內的電話組進行合并,生成電話集合。
本實施例的騷擾號碼分類裝置,用于實現實施例1的騷擾號碼分類方法,詳細描述可參照實施例1的騷擾號碼分類方法,在此不再贅述。
本實施例的騷擾號碼分類裝置,用于實現實施例1的騷擾號碼分類方法,若判斷出電話號碼為騷擾號碼時,根據每個騷擾號碼對應的通信指標對騷擾號碼進行合并生成電話集合,以供商平臺根據電話集合對該電話集合中的騷擾號碼進行撥測或實際調查,以確定該電話集合中的騷擾號碼對應的類別,即完成對騷擾號碼的分類。
實施例3:
請參照圖3,本實施例提供一種騷擾號碼分類系統(tǒng),包括運營商平臺10和實施例2的騷擾號碼分類裝置20。
運營商平臺10根據電話集合對騷擾號碼進行分類。
本實施例的騷擾號碼分類系統(tǒng),包括實施例2的騷擾號碼分類裝置,詳細描述可參照實施例2的騷擾號碼分類裝置,在此不再贅述。
本實施例的騷擾號碼分類系統(tǒng),包括實施例2的騷擾號碼分類裝置,可供平臺根據電話集合對該電話集合中的騷擾號碼進行撥測或實際調查,以確定該電話集合中的騷擾號碼對應的類別,即完成對騷擾號碼的分類。
可以理解的是,以上實施方式僅僅是為了說明本發(fā)明的原理而采用的示例性實施方式,然而本發(fā)明并不局限于此。對于本領域內的普通技術人員而言,在不脫離本發(fā)明的精神和實質的情況下,可以做出各種變型和改進,這些變型和改進也視為本發(fā)明的保護范圍。