本發(fā)明涉及計(jì)算機(jī),尤其涉及一種識(shí)別一人多卡用戶的方法及裝置。
背景技術(shù):
1、同一個(gè)人在相同或者不同通信運(yùn)營(yíng)商下辦理多個(gè)卡號(hào)即為一人多卡,傳統(tǒng)識(shí)別一人多卡的方法主要有基于交往圈的識(shí)別和基于位置數(shù)據(jù)的識(shí)別,雖然傳統(tǒng)方法能夠識(shí)別一人多卡,但是存在識(shí)別不準(zhǔn)確的問題。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明所要解決的技術(shù)問題是:本發(fā)明提供一種識(shí)別一人多卡用戶的方法及裝置,提高識(shí)別的準(zhǔn)確性。
2、為了解決上述技術(shù)問題,本發(fā)明采用的技術(shù)方案為:
3、第一方面,本發(fā)明提供一種識(shí)別一人多卡用戶的方法,包括:
4、根據(jù)預(yù)設(shè)的指紋變量獲取用戶號(hào)碼的指紋數(shù)據(jù),所述指紋數(shù)據(jù)包括運(yùn)營(yíng)商屬性、交往圈數(shù)據(jù)和位置數(shù)據(jù);
5、根據(jù)所述運(yùn)營(yíng)商屬性獲取所述指紋變量的分析時(shí)間窗口,根據(jù)預(yù)設(shè)構(gòu)建規(guī)則將所述分析時(shí)間窗口下的指紋數(shù)據(jù)進(jìn)行組合,得到不同運(yùn)營(yíng)商屬性對(duì)應(yīng)的用戶號(hào)碼的唯一指紋信息,將所有用戶號(hào)碼的唯一指紋信息進(jìn)行匯總,得到指紋數(shù)據(jù)庫;
6、將所述指紋數(shù)據(jù)庫中的唯一指紋信息依次進(jìn)行兩兩比對(duì),計(jì)算重合度,根據(jù)所述重合度得到一人多卡用戶。
7、本發(fā)明的有益效果在于:通過獲取用戶號(hào)碼的運(yùn)營(yíng)商屬性、交往圈數(shù)據(jù)和位置數(shù)據(jù)構(gòu)建用戶號(hào)碼的唯一指紋信息,使得用戶號(hào)碼的指紋信息在空間上進(jìn)行多維度綜合考慮,同時(shí),還從時(shí)間上根據(jù)運(yùn)營(yíng)商屬性獲取指紋變量的分析時(shí)間窗口,將分析時(shí)間窗口下的指紋數(shù)據(jù)進(jìn)行組合構(gòu)建出不同運(yùn)營(yíng)商屬性對(duì)應(yīng)的用戶號(hào)碼的唯一指紋信息,在構(gòu)建唯一指紋信息時(shí)是根據(jù)指紋數(shù)據(jù)進(jìn)行構(gòu)建,指紋數(shù)據(jù)的全面性保證了所構(gòu)建的唯一指紋信息的完整性,且用戶號(hào)碼在不同運(yùn)營(yíng)商屬性下有對(duì)應(yīng)的唯一指紋信息,提高唯一指紋信息的準(zhǔn)確性,從而保證在將唯一指紋信息依次進(jìn)行兩兩比對(duì)時(shí)得到的重合度的準(zhǔn)確性,即,提高一人多卡用戶識(shí)別的準(zhǔn)確性。
8、可選地,所述根據(jù)所述運(yùn)營(yíng)商屬性獲取所述指紋變量的分析時(shí)間窗口,根據(jù)預(yù)設(shè)構(gòu)建規(guī)則將所述分析時(shí)間窗口下的指紋數(shù)據(jù)進(jìn)行組合,得到不同運(yùn)營(yíng)商屬性對(duì)應(yīng)的用戶號(hào)碼的唯一指紋信息包括:
9、當(dāng)所述運(yùn)營(yíng)商屬性為自身時(shí),所述指紋數(shù)據(jù)包括用戶開戶證件號(hào)碼、終端數(shù)據(jù)和內(nèi)容偏好數(shù)據(jù),從所述交往圈數(shù)據(jù)中獲取第一預(yù)設(shè)時(shí)間段內(nèi)的第一交往號(hào)碼、省內(nèi)異地號(hào)碼、省外號(hào)碼、第一家庭號(hào)碼和第一同事號(hào)碼,從所述終端數(shù)據(jù)中獲取第二預(yù)設(shè)時(shí)間段內(nèi)的歷史終端數(shù)據(jù)和第三預(yù)設(shè)時(shí)間段內(nèi)的常用終端數(shù)據(jù),從所述位置數(shù)據(jù)中獲取第一工作地基站、第一居住地基站、第一交往圈位置、第四預(yù)設(shè)時(shí)間段內(nèi)的漫游位置和第五預(yù)設(shè)時(shí)間段內(nèi)的信令軌跡,從所述內(nèi)容偏好數(shù)據(jù)中獲取第六預(yù)設(shè)時(shí)間段內(nèi)的app使用偏好數(shù)據(jù)和流量?jī)?nèi)容偏好數(shù)據(jù);
10、將用戶開戶證件號(hào)碼、第一交往號(hào)碼、省內(nèi)異地號(hào)碼、省外號(hào)碼、第一家庭號(hào)碼、第一同事號(hào)碼、歷史終端數(shù)據(jù)、常用終端數(shù)據(jù)、第一工作地基站、第一居住地基站、第一交往圈位置、漫游位置、信令軌跡、app使用偏好數(shù)據(jù)和流量?jī)?nèi)容偏好數(shù)據(jù)進(jìn)行組合,得到運(yùn)營(yíng)商屬性為自身時(shí)用戶號(hào)碼的唯一指紋信息;
11、當(dāng)所述運(yùn)營(yíng)商屬性為競(jìng)爭(zhēng)對(duì)手時(shí),從所述交往圈數(shù)據(jù)中獲取第七預(yù)設(shè)時(shí)間段內(nèi)的第二交往號(hào)碼、第二家庭號(hào)碼和第二同事號(hào)碼,從所述位置數(shù)據(jù)中獲取第二工作地基站、第二居住地基站和第二交往圈位置,將第二交往號(hào)碼、第二家庭號(hào)碼、第二同事號(hào)碼、第二工作地基站、第二居住地基站和第二交往圈位置進(jìn)行組合,得到運(yùn)營(yíng)商屬性為競(jìng)爭(zhēng)對(duì)手時(shí)用戶號(hào)碼的唯一指紋信息。
12、根據(jù)上述描述可知,將運(yùn)營(yíng)商屬性劃分為自身和競(jìng)爭(zhēng)對(duì)手,以此根據(jù)不同的運(yùn)營(yíng)商屬性采用不同的方法構(gòu)建用戶號(hào)碼的唯一指紋信息,保證所構(gòu)建的唯一指紋信息的合理性與多樣性,且當(dāng)運(yùn)營(yíng)商屬性為自身時(shí),將用戶開戶證件號(hào)碼、終端數(shù)據(jù)以及內(nèi)容偏好數(shù)據(jù)考慮在內(nèi),提高唯一指紋信息的準(zhǔn)確性和全面性。
13、可選地,所述從所述交往圈數(shù)據(jù)中獲取第一預(yù)設(shè)時(shí)間段內(nèi)的第一交往號(hào)碼包括:
14、從所述交往圈數(shù)據(jù)中獲取第一預(yù)設(shè)時(shí)間段內(nèi)的排名前n位的所有第一交往號(hào)碼和夜間通話排名前m位的所有第一交往號(hào)碼,并根據(jù)篩選規(guī)則從所述交往圈數(shù)據(jù)中篩選出穩(wěn)定交往的所有第一交往號(hào)碼;
15、所述從所述交往圈數(shù)據(jù)中獲取第七預(yù)設(shè)時(shí)間段內(nèi)的第二交往號(hào)碼包括:
16、從所述交往圈數(shù)據(jù)中獲取第七預(yù)設(shè)時(shí)間段內(nèi)的排名前1位的首位第二交往號(hào)碼、排名前q位的所有第二交往號(hào)碼和夜間通話排名前p位的所有第二交往號(hào)碼,并根據(jù)篩選規(guī)則從所述交往圈數(shù)據(jù)中篩選出穩(wěn)定交往的所有第二交往號(hào)碼;
17、所述篩選規(guī)則為在第八預(yù)設(shè)時(shí)間段內(nèi)聯(lián)系的時(shí)間不低于第一閾值。
18、根據(jù)上述描述可知,運(yùn)營(yíng)商屬性不同時(shí),從交往圈數(shù)據(jù)中獲取交往號(hào)碼的規(guī)則有所不同,保證所獲取的交往號(hào)碼的合理性,同時(shí)獲取規(guī)則的多樣性也提高了各自所獲取的交往號(hào)碼的準(zhǔn)確性和完整性。
19、可選地,所述唯一指紋信息隨著所述指紋數(shù)據(jù)的變化而動(dòng)態(tài)更新。
20、根據(jù)上述描述可知,唯一指紋信息并非一成不變,隨著指紋數(shù)據(jù)的變化唯一指紋信息也會(huì)動(dòng)態(tài)更新,從而保證唯一指紋信息的實(shí)時(shí)性。
21、可選地,所述將所述指紋數(shù)據(jù)庫中的唯一指紋信息依次進(jìn)行兩兩比對(duì),計(jì)算重合度,根據(jù)所述重合度得到一人多卡用戶包括:
22、按照所述運(yùn)營(yíng)商屬性的類型將所述指紋數(shù)據(jù)庫中的唯一指紋信息進(jìn)行分類,得到分類后的唯一指紋信息;
23、將分類后的唯一指紋信息進(jìn)行交叉組合形成d種不同類型比對(duì)場(chǎng)景,在每一種不同類型比對(duì)場(chǎng)景和每一種相同類型比對(duì)場(chǎng)景下分別將所述指紋數(shù)據(jù)庫中的唯一指紋信息依次進(jìn)行兩兩比對(duì),計(jì)算重合度,根據(jù)所述重合度得到一人多卡用戶。
24、根據(jù)上述描述可知,在進(jìn)行一人多卡用戶識(shí)別時(shí),不僅將相同運(yùn)營(yíng)商屬性下的唯一指紋信息進(jìn)行比對(duì),還將按照運(yùn)營(yíng)商屬性的類型分類后的唯一指紋信息進(jìn)行交叉組合形成d種不同類型的比對(duì)場(chǎng)景,在每一種不同類型比對(duì)場(chǎng)景和每一種相同類型比對(duì)場(chǎng)景下進(jìn)行一人多卡用戶識(shí)別,多元化的比對(duì)場(chǎng)景,提高一人多卡用戶識(shí)別的全面性和準(zhǔn)確性。
25、可選地,所述在每一種不同類型比對(duì)場(chǎng)景和每一種相同類型比對(duì)場(chǎng)景下分別將所述指紋數(shù)據(jù)庫中的唯一指紋信息依次進(jìn)行兩兩比對(duì),計(jì)算重合度,根據(jù)所述重合度得到一人多卡用戶包括:
26、在計(jì)算所述重合度時(shí),根據(jù)所述指紋變量的類型采用對(duì)應(yīng)的方法進(jìn)行計(jì)算,當(dāng)所述指紋變量的類型為屬性類時(shí),采用精準(zhǔn)對(duì)比的方法計(jì)算重合度,當(dāng)所述指紋變量的類型為序列類時(shí),采用重疊度對(duì)比方法計(jì)算重合度,當(dāng)所述指紋變量的類型為位置類時(shí),采用距離對(duì)比方法計(jì)算重合度;
27、在相同類型比對(duì)場(chǎng)景下,采用第一轉(zhuǎn)化規(guī)則將所述重合度轉(zhuǎn)化為重合分?jǐn)?shù)值,在不同類型比對(duì)場(chǎng)景下,采用第二轉(zhuǎn)化規(guī)則將所述重合度轉(zhuǎn)化為重合分?jǐn)?shù)值,根據(jù)所述重合分?jǐn)?shù)值得到一人多卡用戶。
28、根據(jù)上述描述可知,將唯一指紋信息進(jìn)行兩兩比對(duì)計(jì)算重合度時(shí),根據(jù)指紋變量的類型采用多元化的計(jì)算方式,打破單一化的計(jì)算方式,提高重合度計(jì)算的適應(yīng)性和準(zhǔn)確性,且相同比對(duì)場(chǎng)景和不同比對(duì)場(chǎng)景將重合度轉(zhuǎn)化為重合分?jǐn)?shù)值的轉(zhuǎn)化規(guī)則也有所不同,保證轉(zhuǎn)化的合理性,進(jìn)而保證一人多卡用戶識(shí)別的準(zhǔn)確性。
29、可選地,所述當(dāng)所述指紋變量的類型為序列類時(shí),采用重疊度對(duì)比方法計(jì)算重合度包括:
30、當(dāng)所述序列類為交往圈數(shù)據(jù)時(shí),在相同類型比對(duì)場(chǎng)景下,直接將交往圈數(shù)據(jù)進(jìn)行重疊度計(jì)算,將所計(jì)算出的第一重疊度作為重合度,在不同類型比對(duì)場(chǎng)景下,若所述運(yùn)營(yíng)商屬性分別為自身與競(jìng)爭(zhēng)對(duì)手時(shí),根據(jù)第一重合規(guī)則從所述運(yùn)營(yíng)商戶為自身和所述運(yùn)營(yíng)商屬性為競(jìng)爭(zhēng)對(duì)手的用戶號(hào)碼中篩選出候選號(hào)碼,再采用重疊度比對(duì)方法計(jì)算所述候選號(hào)碼對(duì)應(yīng)的唯一指紋信息之間的第二重疊度,將所述第二重疊度作為重合度,若所述運(yùn)營(yíng)商屬性均為競(jìng)爭(zhēng)對(duì)手時(shí),根據(jù)第二重合規(guī)則從所述運(yùn)營(yíng)商屬性為競(jìng)爭(zhēng)對(duì)手的用戶號(hào)碼中篩選出疑似號(hào)碼,再采用重疊比對(duì)方法計(jì)算所述疑似號(hào)碼對(duì)應(yīng)的唯一指紋信息之間的第三重疊度,將所述第三重疊度作為重合度。
31、根據(jù)上述描述可知,在計(jì)算交往圈數(shù)據(jù)的重合度時(shí),不僅相同類型比對(duì)場(chǎng)景和不同類型比對(duì)場(chǎng)景的計(jì)算方式有所不同,且對(duì)不同類型比對(duì)場(chǎng)景進(jìn)一步進(jìn)行劃分為自身與競(jìng)爭(zhēng)對(duì)手之間的比對(duì),以及競(jìng)爭(zhēng)對(duì)手之間的比對(duì),采用多元的重合規(guī)則篩選出候選號(hào)碼和疑似號(hào)碼,再采用重疊比對(duì)方法計(jì)算候選號(hào)碼對(duì)應(yīng)的唯一指紋信息之間的第二重疊度,以及疑似號(hào)碼對(duì)應(yīng)的唯一指紋信息之間對(duì)應(yīng)的第三重疊度,提高計(jì)算效率的同時(shí)提高所計(jì)算出的重合度的準(zhǔn)確性。
32、可選地,所述根據(jù)所述重合分?jǐn)?shù)值得到一人多卡用戶包括:
33、在相同類型比對(duì)場(chǎng)景下,若所述重合分?jǐn)?shù)值超過第一分?jǐn)?shù)閾值,且超過第一分?jǐn)?shù)閾值對(duì)應(yīng)的兩個(gè)唯一指紋信息的用戶號(hào)碼均為綜合卡,則兩個(gè)唯一指紋信息的用戶號(hào)碼為同一用戶,得到一人多卡用戶,所述綜合卡為語音卡和流量卡;
34、或,在相同類型比對(duì)場(chǎng)景下,若所述重合分?jǐn)?shù)值超過第二分?jǐn)?shù)閾值,且超過第二分?jǐn)?shù)閾值對(duì)應(yīng)的兩個(gè)唯一指紋信息的用戶號(hào)碼分別為語音卡和流量卡,則兩個(gè)唯一指紋信息的用戶號(hào)碼為同一用戶,得到一人多卡用戶;
35、在不同類型比對(duì)場(chǎng)景下,若所述重合分?jǐn)?shù)值超過第三分?jǐn)?shù)閾值,則兩個(gè)唯一指紋信息的用戶號(hào)碼為同一用戶,得到一人多卡用戶。
36、根據(jù)上述描述可知,面對(duì)相同類型比對(duì)場(chǎng)景,并非單純根據(jù)重合分?jǐn)?shù)值得到一人多卡用戶,而是將重合分?jǐn)?shù)值與用戶號(hào)碼是否為綜合卡進(jìn)行考慮,進(jìn)一步劃分兩種判斷情況,提高相同類型比對(duì)場(chǎng)景下一人多卡用戶識(shí)別的準(zhǔn)確性。
37、可選地,所述根據(jù)所述重合度得到一人多卡用戶還包括:
38、獲取所有用戶的卡的使用量,根據(jù)所述使用量對(duì)卡進(jìn)行檔次劃分,得到對(duì)應(yīng)的檔次信息;
39、計(jì)算同一個(gè)用戶的每一張卡的使用量在所有卡的使用量中的使用占比,將所述使用占比作為用戶的網(wǎng)齡貢獻(xiàn)度,計(jì)算預(yù)設(shè)周期內(nèi)同一個(gè)用戶的每一張卡的消費(fèi)金額、通話分鐘數(shù)和數(shù)據(jù)流量值;
40、通過層次分析法從所述檔次信息、所述網(wǎng)齡貢獻(xiàn)度、所述消費(fèi)金額、所述通話分鐘數(shù)和所述數(shù)據(jù)流量值建立多維度評(píng)價(jià)指標(biāo),計(jì)算出每一個(gè)用戶對(duì)應(yīng)的每一張卡的重要性得分,根據(jù)所述重要性得分篩選出重要性得分最高的卡,若存在多張重要性得分最高的卡,則,按照所述消費(fèi)金額或所述通話分鐘數(shù)或所述數(shù)據(jù)流量值進(jìn)行降序排序,得到降序排序后的卡,將位于首位的重要性得分最高的卡作為主卡,若不存在多張重要性得分最高的卡,則,將直接將重要性得分最高的卡作為主卡。
41、根據(jù)上述描述可知,識(shí)別出一人多可用戶后還會(huì)進(jìn)行主卡識(shí)別,在進(jìn)行主卡識(shí)別時(shí)是通過層次分析法從檔次信息、網(wǎng)齡貢獻(xiàn)度、消費(fèi)金額、通話分鐘數(shù)和數(shù)據(jù)流量值建立多維度評(píng)價(jià)指標(biāo),以此計(jì)算出每一張卡的重要性得分進(jìn)行主卡識(shí)別,提高主卡識(shí)別的準(zhǔn)確性。
42、第二方面,本發(fā)明提供一種識(shí)別一人多卡用戶的裝置,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)第一方面所述的一種識(shí)別一人多卡用戶的方法。
43、其中,第二方面所提供的一種識(shí)別一人多卡用戶的裝置所對(duì)應(yīng)的技術(shù)效果參照第一方面所提供的一種識(shí)別一人多卡用戶的方法的相關(guān)描述。