本技術(shù)涉及大數(shù)據(jù),尤其涉及一種家庭成員識(shí)別方法、裝置、設(shè)備、存儲(chǔ)介質(zhì)以及產(chǎn)品。
背景技術(shù):
1、隨著四大電信運(yùn)營(yíng)商的快速發(fā)展,個(gè)人業(yè)務(wù)及家庭業(yè)務(wù)均接近飽和,進(jìn)入存量市場(chǎng)階段。面對(duì)現(xiàn)狀,發(fā)展融合業(yè)務(wù)是尋求新業(yè)務(wù)增長(zhǎng)點(diǎn)的必然方向,而家庭成員關(guān)系的識(shí)別是融合家庭業(yè)務(wù)和個(gè)人業(yè)務(wù)的重要紐帶,是個(gè)人家庭融合業(yè)務(wù)運(yùn)營(yíng)的重要數(shù)據(jù)基礎(chǔ)。
2、現(xiàn)有的家庭成員識(shí)別方案大多依賴(lài)話(huà)務(wù)數(shù)據(jù)進(jìn)行識(shí)別,無(wú)法識(shí)別出異網(wǎng)家庭成員。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)的主要目的在于提供一種家庭成員識(shí)別方法、裝置、設(shè)備、存儲(chǔ)介質(zhì)以及產(chǎn)品,旨在解決現(xiàn)有方案存在的無(wú)法識(shí)別異網(wǎng)家庭成員的技術(shù)問(wèn)題。
2、為實(shí)現(xiàn)上述目的,本技術(shù)提出一種家庭成員識(shí)別方法,所述的方法包括:
3、獲取采集得到的用戶(hù)號(hào)碼的通信數(shù)據(jù);所述通信數(shù)據(jù)包括所述用戶(hù)號(hào)碼在經(jīng)過(guò)各個(gè)網(wǎng)關(guān)時(shí)分別產(chǎn)生的流量數(shù)據(jù);
4、對(duì)所述流量數(shù)據(jù)進(jìn)行分析,得到上網(wǎng)行為分類(lèi)結(jié)果,并基于所述上網(wǎng)行為分類(lèi)結(jié)果確定所述流量數(shù)據(jù)是否滿(mǎn)足預(yù)設(shè)家居類(lèi)別條件;
5、確定同一網(wǎng)關(guān)中對(duì)應(yīng)的流量數(shù)據(jù)滿(mǎn)足預(yù)設(shè)家居類(lèi)別條件的用戶(hù)號(hào)碼所對(duì)應(yīng)的用戶(hù)為同一家庭圈中的成員。
6、在一實(shí)施例中,所述上網(wǎng)行為分類(lèi)結(jié)果包括不同類(lèi)別上網(wǎng)行為的占比,所述對(duì)所述流量數(shù)據(jù)進(jìn)行分析,得到上網(wǎng)行為分類(lèi)結(jié)果,并基于所述上網(wǎng)行為分類(lèi)結(jié)果確定所述流量數(shù)據(jù)是否滿(mǎn)足預(yù)設(shè)家居類(lèi)別條件的步驟包括:
7、將所述流量數(shù)據(jù)輸入到預(yù)先訓(xùn)練的流量分類(lèi)模型中,得到不同類(lèi)別上網(wǎng)行為的占比;
8、基于所述不同類(lèi)別上網(wǎng)行為的占比,確定所述流量數(shù)據(jù)是否滿(mǎn)足預(yù)設(shè)家居類(lèi)別條件。
9、在一實(shí)施例中,所述基于所述不同類(lèi)別上網(wǎng)行為的占比,確定所述流量數(shù)據(jù)是否滿(mǎn)足預(yù)設(shè)家居類(lèi)別條件的步驟包括:
10、基于所述不同類(lèi)別上網(wǎng)行為的占比和預(yù)先確定的不同類(lèi)別上網(wǎng)行為的權(quán)值,確定上網(wǎng)行為分?jǐn)?shù);
11、基于所述上網(wǎng)行為分?jǐn)?shù)與預(yù)設(shè)閾值的比較結(jié)果,確定所述流量數(shù)據(jù)是否滿(mǎn)足預(yù)設(shè)家居類(lèi)別條件。
12、在一實(shí)施例中,所述通信數(shù)據(jù)還包括所述用戶(hù)號(hào)碼對(duì)應(yīng)的用戶(hù)信息、信令數(shù)據(jù)和位置信息,所述的方法在獲取采集得到的用戶(hù)號(hào)碼的通信數(shù)據(jù)的步驟之后還包括:
13、基于各個(gè)所述用戶(hù)號(hào)碼對(duì)應(yīng)的用戶(hù)信息、信令數(shù)據(jù)和位置信息,構(gòu)建各個(gè)所述用戶(hù)號(hào)碼的第一多維度特征;
14、通過(guò)各個(gè)所述用戶(hù)號(hào)碼的第一多維度特征識(shí)別出存在家庭潛在關(guān)系的多個(gè)號(hào)碼。
15、在一實(shí)施例中,所述位置信息包括常駐位置數(shù)據(jù)集,所述通過(guò)各個(gè)所述用戶(hù)號(hào)碼的第一多維度特征識(shí)別出存在家庭潛在關(guān)系的多個(gè)用戶(hù)號(hào)碼的步驟之前還包括:
16、計(jì)算各個(gè)所述用戶(hù)號(hào)碼之間的常駐位置數(shù)據(jù)集的相似度,得到各個(gè)所述用戶(hù)號(hào)碼之間的常駐位置相似度;
17、所述通過(guò)各個(gè)所述用戶(hù)號(hào)碼的第一多維度特征識(shí)別出存在家庭潛在關(guān)系的多個(gè)用戶(hù)號(hào)碼的步驟包括:
18、基于各個(gè)所述用戶(hù)號(hào)碼的第一多維度特征和各個(gè)所述用戶(hù)號(hào)碼之間的常駐位置相似度,構(gòu)建號(hào)碼對(duì)的第二多維度特征;所述號(hào)碼對(duì)為兩個(gè)不同的用戶(hù)號(hào)碼;
19、將所述號(hào)碼對(duì)的第二多維度特征輸入到預(yù)先訓(xùn)練的交往圈識(shí)別模型中,確定所述號(hào)碼對(duì)之間是否存在家庭潛在關(guān)系。
20、在一實(shí)施例中,所述計(jì)算各個(gè)所述用戶(hù)號(hào)碼之間的常駐位置數(shù)據(jù)集的相似度,得到各個(gè)所述用戶(hù)號(hào)碼之間的常駐位置相似度的步驟包括:
21、基于預(yù)設(shè)核函數(shù)將各個(gè)所述用戶(hù)號(hào)碼的常駐位置數(shù)據(jù)集映射到預(yù)設(shè)內(nèi)積空間中,得到各個(gè)所述用戶(hù)號(hào)碼對(duì)應(yīng)映射到的數(shù)據(jù)點(diǎn);
22、在所述內(nèi)積空間中計(jì)算各個(gè)所述用戶(hù)號(hào)碼對(duì)應(yīng)映射到的數(shù)據(jù)點(diǎn)之間的內(nèi)積,得到各個(gè)所述用戶(hù)號(hào)碼之間的常駐位置相似度。
23、在一實(shí)施例中,所述的方法在通過(guò)各個(gè)所述用戶(hù)號(hào)碼的第一多維度特征識(shí)別出存在家庭潛在關(guān)系的多個(gè)用戶(hù)號(hào)碼的步驟之后還包括:
24、將同一網(wǎng)關(guān)中對(duì)應(yīng)的流量數(shù)據(jù)滿(mǎn)足預(yù)設(shè)家居類(lèi)別條件的用戶(hù)號(hào)碼進(jìn)行聚類(lèi),得到第一初始家庭圈;
25、將存在家庭潛在關(guān)系的多個(gè)用戶(hù)號(hào)碼進(jìn)行聚類(lèi),得到第二初始家庭圈;
26、融合所述第一初始家庭圈和所述第二初始家庭圈,得到融合家庭圈。
27、在一實(shí)施例中,所述融合所述第一初始家庭圈和所述第二初始家庭圈,得到融合家庭圈的步驟包括:
28、將所述第一初始家庭圈和所述第二初始家庭圈中的用戶(hù)號(hào)碼進(jìn)行合并,得到候選家庭圈;
29、在所述候選家庭圈中選取種子號(hào)碼以及與所述種子號(hào)碼對(duì)應(yīng)的配對(duì)號(hào)碼,并確定所述種子號(hào)碼與所述配對(duì)號(hào)碼之間的家庭緊密度,基于所述家庭緊密度將對(duì)應(yīng)的配對(duì)號(hào)碼加入到所述種子號(hào)碼的家庭圈中,得到所述融合家庭圈;其中,所述種子號(hào)碼和所述配對(duì)號(hào)碼均為所述融合家庭圈中的用戶(hù)號(hào)碼。
30、在一實(shí)施例中,所述在所述候選家庭圈中選取種子號(hào)碼以及與所述種子號(hào)碼對(duì)應(yīng)的配對(duì)號(hào)碼,并確定所述種子號(hào)碼與所述配對(duì)號(hào)碼之間的家庭緊密度,基于所述家庭緊密度將對(duì)應(yīng)的配對(duì)號(hào)碼加入到所述種子號(hào)碼的家庭圈中,得到所述融合家庭圈的步驟包括:
31、在所述候選家庭圈中選取出初始迭代次數(shù)對(duì)應(yīng)的種子號(hào)碼,并初始化所述種子號(hào)碼的待擴(kuò)充家庭圈;
32、對(duì)所述種子號(hào)碼的待擴(kuò)充家庭圈進(jìn)行多次迭代處理,每次迭代處理包括:在所述候選家庭圈中選取與所述種子號(hào)碼對(duì)應(yīng)的各個(gè)配對(duì)號(hào)碼,并按照預(yù)設(shè)關(guān)鍵特征提取規(guī)則對(duì)所述種子號(hào)碼的通信數(shù)據(jù)以及各個(gè)所述配對(duì)號(hào)碼的通信數(shù)據(jù)進(jìn)行處理,得到所述種子號(hào)碼分別與各個(gè)所述配對(duì)號(hào)碼之間的關(guān)鍵特征;基于所述種子號(hào)碼分別與各個(gè)所述配對(duì)號(hào)碼之間的關(guān)鍵特征,確定所述種子號(hào)碼分別與各個(gè)所述配對(duì)號(hào)碼之間的家庭緊密度;將家庭緊密度大于預(yù)設(shè)緊密度閾值的配對(duì)號(hào)碼加入到所述種子號(hào)碼的待擴(kuò)充家庭圈中,以及選取加入到所述待擴(kuò)充家庭圈的配對(duì)號(hào)碼作為下一次迭代次數(shù)對(duì)應(yīng)的種子號(hào)碼;
33、在檢測(cè)到所述種子號(hào)碼的待擴(kuò)充家庭圈中的號(hào)碼成員數(shù)量大于或等于預(yù)設(shè)限制閾值時(shí),停止迭代處理,并確定停止迭代處理時(shí)的種子號(hào)碼的待擴(kuò)充家庭圈,基于所述停止迭代處理時(shí)的種子號(hào)碼的待擴(kuò)充家庭圈確定所述融合家庭圈。
34、在一實(shí)施例中,所述的方法在融合所述第一初始家庭圈和所述第二初始家庭圈,得到融合家庭圈的步驟之后還包括:
35、按照預(yù)設(shè)的統(tǒng)計(jì)特征提取規(guī)則對(duì)所述融合家庭圈中的所述用戶(hù)號(hào)碼的通信數(shù)據(jù)進(jìn)行特征提取,得到多個(gè)統(tǒng)計(jì)特征;
36、對(duì)所述多個(gè)統(tǒng)計(jì)特征進(jìn)行加權(quán)求和運(yùn)算,得到分值;
37、基于所述分值所屬的區(qū)間,確定所述用戶(hù)號(hào)碼對(duì)應(yīng)的用戶(hù)在家庭中的角色。
38、在一實(shí)施例中,所述通信數(shù)據(jù)還包括所述用戶(hù)號(hào)碼的業(yè)務(wù)信息,所述的方法在獲取采集得到的用戶(hù)號(hào)碼的通信數(shù)據(jù)的步驟之后還包括:
39、基于各個(gè)所述號(hào)碼的業(yè)務(wù)信息,確定各個(gè)所述號(hào)碼的業(yè)務(wù)特征;
40、基于各個(gè)所述號(hào)碼的業(yè)務(wù)特征,通過(guò)預(yù)設(shè)業(yè)務(wù)規(guī)則識(shí)別出存在家庭潛在關(guān)系的多個(gè)號(hào)碼,得到第三初始家庭圈;
41、所述的方法在確定同一網(wǎng)關(guān)中對(duì)應(yīng)的流量數(shù)據(jù)滿(mǎn)足預(yù)設(shè)家居類(lèi)別條件的用戶(hù)號(hào)碼所對(duì)應(yīng)的用戶(hù)為同一家庭圈中的成員的步驟之后還包括:
42、將同一網(wǎng)關(guān)中對(duì)應(yīng)的流量數(shù)據(jù)滿(mǎn)足預(yù)設(shè)家居類(lèi)別條件的用戶(hù)號(hào)碼進(jìn)行聚類(lèi),得到第一初始家庭圈;
43、融合所述第一初始家庭圈和所述第三初始家庭圈,得到融合家庭圈。
44、在一實(shí)施例中,所述融合所述第一初始家庭圈和所述第三初始家庭圈,得到融合家庭圈的步驟包括:
45、將所述第一初始家庭圈和所述第三初始家庭圈中的對(duì)應(yīng)號(hào)碼進(jìn)行合并,得到候選家庭圈;
46、在所述候選家庭圈中選取種子號(hào)碼以及與所述種子號(hào)碼對(duì)應(yīng)的配對(duì)號(hào)碼,并確定所述種子號(hào)碼與所述配對(duì)號(hào)碼之間的家庭緊密度,基于所述家庭緊密度將對(duì)應(yīng)的配對(duì)號(hào)碼加入到所述種子號(hào)碼的家庭圈中,得到所述融合家庭圈其中,所述種子號(hào)碼和所述配對(duì)號(hào)碼均為所述融合家庭圈中的用戶(hù)號(hào)碼。
47、此外,為實(shí)現(xiàn)上述目的,本技術(shù)還提出一種家庭成員識(shí)別裝置,所述家庭成員識(shí)別裝置包括:
48、數(shù)據(jù)獲取模塊,用于獲取采集得到的用戶(hù)號(hào)碼的通信數(shù)據(jù);所述通信數(shù)據(jù)包括所述用戶(hù)號(hào)碼在經(jīng)過(guò)各個(gè)網(wǎng)關(guān)時(shí)分別產(chǎn)生的流量數(shù)據(jù);
49、分類(lèi)模塊,用于對(duì)所述流量數(shù)據(jù)進(jìn)行分析,得到上網(wǎng)行為分類(lèi)結(jié)果,并基于所述上網(wǎng)行為分類(lèi)結(jié)果確定所述流量數(shù)據(jù)是否滿(mǎn)足預(yù)設(shè)家居類(lèi)別條件;
50、確定模塊,用于確定同一網(wǎng)關(guān)中對(duì)應(yīng)的流量數(shù)據(jù)滿(mǎn)足預(yù)設(shè)家居類(lèi)別條件的用戶(hù)號(hào)碼所對(duì)應(yīng)的用戶(hù)為同一家庭圈中的成員。
51、此外,為實(shí)現(xiàn)上述目的,本技術(shù)還提出一種家庭成員識(shí)別設(shè)備,所述設(shè)備包括:存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序配置為實(shí)現(xiàn)如上文所述的家庭成員識(shí)別方法的步驟。
52、此外,為實(shí)現(xiàn)上述目的,本技術(shù)還提出一種存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)為計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上文所述的家庭成員識(shí)別方法的步驟。
53、此外,為實(shí)現(xiàn)上述目的,本技術(shù)還提供一種計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上文所述的家庭成員識(shí)別方法的步驟。
54、本技術(shù)提出的家庭成員識(shí)別方法、裝置、設(shè)備、存儲(chǔ)介質(zhì)以及產(chǎn)品,通過(guò)獲取采集得到的用戶(hù)號(hào)碼的通信數(shù)據(jù);通信數(shù)據(jù)包括用戶(hù)號(hào)碼在經(jīng)過(guò)各個(gè)網(wǎng)關(guān)時(shí)分別產(chǎn)生的流量數(shù)據(jù);對(duì)流量數(shù)據(jù)進(jìn)行分析,得到上網(wǎng)行為分類(lèi)結(jié)果,并基于上網(wǎng)行為分類(lèi)結(jié)果確定流量數(shù)據(jù)是否滿(mǎn)足預(yù)設(shè)家居類(lèi)別條件;確定同一網(wǎng)關(guān)中對(duì)應(yīng)的流量數(shù)據(jù)滿(mǎn)足預(yù)設(shè)家居類(lèi)別條件的用戶(hù)號(hào)碼所對(duì)應(yīng)的用戶(hù)為同一家庭圈中的成員。通過(guò)網(wǎng)關(guān)流量數(shù)據(jù)進(jìn)行家庭成員關(guān)系的識(shí)別,由于異網(wǎng)用戶(hù)設(shè)備會(huì)連接到本網(wǎng)網(wǎng)關(guān)進(jìn)行無(wú)線(xiàn)上網(wǎng),因此網(wǎng)關(guān)所采集到的流量數(shù)據(jù)不僅包含有本網(wǎng)用戶(hù)的流量數(shù)據(jù),還包含有異網(wǎng)用戶(hù)流量數(shù)據(jù),由此可以克服單一運(yùn)營(yíng)商無(wú)法直接獲取異網(wǎng)用戶(hù)的位置信息進(jìn)而導(dǎo)致無(wú)法識(shí)別異網(wǎng)家庭成員的缺陷,提高了家庭成員識(shí)別的準(zhǔn)確性。