一種大數(shù)據(jù)分析方法及其裝置的制造方法
【專利摘要】本發(fā)明實(shí)施例公開了一種大數(shù)據(jù)分析方法,包括:基于輸入的第一組數(shù)據(jù)和第二組數(shù)據(jù),獲取滿足預(yù)設(shè)條件的至少兩個(gè)特征信息;所述第一組數(shù)據(jù)和第二組數(shù)據(jù)均為第一通信網(wǎng)絡(luò)中的數(shù)據(jù);所述第一組數(shù)據(jù)滿足第一預(yù)設(shè)規(guī)則;所述第二組數(shù)據(jù)滿足第二預(yù)設(shè)規(guī)則;依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和第二組數(shù)據(jù)進(jìn)行分析,確定出第一類規(guī)則和第二類規(guī)則;依據(jù)所述第一類規(guī)則和第二類規(guī)則,在輸入的第三組數(shù)據(jù)中確定出滿足所述第一預(yù)設(shè)規(guī)則的目標(biāo)數(shù)據(jù);所述第三組數(shù)據(jù)為除所述第一通信網(wǎng)絡(luò)以外的其他通信網(wǎng)絡(luò)中的數(shù)據(jù)。本發(fā)明實(shí)施例還公開了一種大數(shù)據(jù)分析裝置。
【專利說明】
一種大數(shù)據(jù)分析方法及其裝置
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及通信技術(shù),尤其涉及一種大數(shù)據(jù)分析方法及其裝置。
【背景技術(shù)】
[0002]隨著第四代移動(dòng)通信技術(shù)(4G,the4 Generat1n mobile communicat1ntechnology)的商用,各大運(yùn)營(yíng)商競(jìng)爭(zhēng)益發(fā)激烈;異網(wǎng)高價(jià)值用戶的回流工作和4G終端的滲透工作對(duì)于移動(dòng)運(yùn)營(yíng)商的發(fā)展起著重要作用;所以異網(wǎng)高價(jià)值用戶的識(shí)別顯得至關(guān)重要。
[0003]目前業(yè)界已有對(duì)用戶行為進(jìn)行分析并建模以確定用戶屬性的方法,但是,現(xiàn)有方法中,普遍側(cè)重于統(tǒng)計(jì)異網(wǎng)用戶的數(shù)量,并不側(cè)重于異網(wǎng)用戶的識(shí)別,以及異網(wǎng)用戶的終端類型的識(shí)別。
【發(fā)明內(nèi)容】
[0004]為解決現(xiàn)有存在的技術(shù)問題,本發(fā)明實(shí)施例提供了一種大數(shù)據(jù)分析方法及其裝置,能夠依據(jù)本網(wǎng)數(shù)據(jù)規(guī)則,在異網(wǎng)數(shù)據(jù)中確定出滿足預(yù)設(shè)規(guī)則的目標(biāo)數(shù)據(jù)。
[0005]本發(fā)明實(shí)施例的技術(shù)方案是這樣實(shí)現(xiàn)的:本發(fā)明實(shí)施例提供了一種大數(shù)據(jù)分析方法,所述方法包括:
[0006]基于輸入的第一組數(shù)據(jù)和第二組數(shù)據(jù),獲取滿足預(yù)設(shè)條件的至少兩個(gè)特征信息;所述第一組數(shù)據(jù)和第二組數(shù)據(jù)均為第一通信網(wǎng)絡(luò)中的數(shù)據(jù);所述第一組數(shù)據(jù)滿足第一預(yù)設(shè)規(guī)則;所述第二組數(shù)據(jù)滿足第二預(yù)設(shè)規(guī)則;
[0007]依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和第二組數(shù)據(jù)進(jìn)行分析,確定出第一類規(guī)則和第二類規(guī)則;
[0008]依據(jù)所述第一類規(guī)則和第二類規(guī)則,在輸入的第三組數(shù)據(jù)中確定出滿足所述第一預(yù)設(shè)規(guī)則的目標(biāo)數(shù)據(jù);所述第三組數(shù)據(jù)為除所述第一通信網(wǎng)絡(luò)以外的其他通信網(wǎng)絡(luò)中的數(shù)據(jù)。
[0009]上述方案中,所述依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和第二組數(shù)據(jù)進(jìn)行分析,確定出第一類規(guī)則和第二類規(guī)則,包括:
[0010]采用邏輯回歸算法,依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和所述第二組數(shù)據(jù)進(jìn)行分析,確定出第一類規(guī)則;
[0011]采用決策樹算法,依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和所述第二組數(shù)據(jù)進(jìn)行分析,確定出第二類規(guī)則。
[0012]上述方案中,所述采用決策樹算法,依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和所述第二組數(shù)據(jù)進(jìn)行分析,確定出第二類規(guī)則,包括:
[0013]采用決策樹算法,依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和所述第二組數(shù)據(jù)進(jìn)行分析,確定出N個(gè)規(guī)則;所述N為大于等于2的正整數(shù);
[0014]在所述N個(gè)規(guī)則中,確定出滿足第三預(yù)設(shè)規(guī)則的第二類規(guī)則。
[0015]上述方案中,所述依據(jù)所述第一類規(guī)則和第二類規(guī)則,在輸入的第三組數(shù)據(jù)中確定出滿足所述第一預(yù)設(shè)規(guī)則的目標(biāo)數(shù)據(jù),包括:
[0016]分別依據(jù)所述第一類規(guī)則和第二類規(guī)則,對(duì)輸入的第三組數(shù)據(jù)進(jìn)行分析,得到第一疑似目標(biāo)數(shù)據(jù)和第二疑似目標(biāo)數(shù)據(jù);
[0017]基于所述第一疑似目標(biāo)數(shù)據(jù)和第二疑似目標(biāo)數(shù)據(jù)確定出滿足所述第一預(yù)設(shè)規(guī)則的目標(biāo)數(shù)據(jù)。
[0018]上述方案中,所述第二類規(guī)則包括:第一類子規(guī)則;所述第一類子規(guī)則滿足所述第一預(yù)設(shè)規(guī)則;
[0019]對(duì)應(yīng)地,所述分別依據(jù)所述第一類規(guī)則和第二類規(guī)則,對(duì)輸入的第三組數(shù)據(jù)進(jìn)行分析,得到第一疑似目標(biāo)數(shù)據(jù)和第二疑似目標(biāo)數(shù)據(jù),包括:
[0020]依據(jù)所述第一類規(guī)則,對(duì)輸入的第三組數(shù)據(jù)進(jìn)行分析,得到第一疑似目標(biāo)數(shù)據(jù);[0021 ] 依據(jù)所述第一類子規(guī)則,對(duì)輸入的第三組數(shù)據(jù)進(jìn)行分析,得到第二疑似目標(biāo)數(shù)據(jù)。
[0022]上述方案中,所述第二類規(guī)則還包括:第二類子規(guī)則;所述第二類子規(guī)則滿足第二預(yù)設(shè)規(guī)則;所述方法還包括:
[0023]依據(jù)所述第二類子規(guī)則,對(duì)所述第一疑似目標(biāo)數(shù)據(jù)和所述第二疑似目標(biāo)數(shù)據(jù)進(jìn)行分析,得到疑似非目標(biāo)數(shù)據(jù);
[0024]對(duì)應(yīng)地,所述基于所述第一疑似目標(biāo)數(shù)據(jù)和第二疑似目標(biāo)數(shù)據(jù)確定出目標(biāo)數(shù)據(jù),包括:
[0025]基于所述第一疑似目標(biāo)數(shù)據(jù)、第二疑似目標(biāo)數(shù)據(jù)和疑似非目標(biāo)數(shù)據(jù),確定出目標(biāo)數(shù)據(jù)。
[0026]本發(fā)明實(shí)施例還提供了一種大數(shù)據(jù)分析裝置,所述裝置包括:
[0027]獲取單元,用于基于輸入的第一組數(shù)據(jù)和第二組數(shù)據(jù),獲取滿足預(yù)設(shè)條件的至少兩個(gè)特征信息;所述第一組數(shù)據(jù)和第二組數(shù)據(jù)均為第一通信網(wǎng)絡(luò)中的數(shù)據(jù);所述第一組數(shù)據(jù)滿足第一預(yù)設(shè)規(guī)則;所述第二組數(shù)據(jù)滿足第二預(yù)設(shè)規(guī)則;
[0028]分析單元,用于依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和第二組數(shù)據(jù)進(jìn)行分析,確定出第一類規(guī)則和第二類規(guī)則;
[0029]確定單元,用于依據(jù)所述第一類規(guī)則和第二類規(guī)則,在輸入的第三組數(shù)據(jù)中確定出滿足所述第一預(yù)設(shè)規(guī)則的目標(biāo)數(shù)據(jù);所述第三組數(shù)據(jù)為除所述第一通信網(wǎng)絡(luò)以外的其他通信網(wǎng)絡(luò)中的數(shù)據(jù)。
[0030]上述方案中,所述分析單元包括:
[0031]第一分析子單元,用于采用邏輯回歸算法,依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和所述第二組數(shù)據(jù)進(jìn)行分析,確定出第一類規(guī)則;
[0032]第二分析子單元,用于采用決策樹算法,依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和所述第二組數(shù)據(jù)進(jìn)行分析,確定出第二類規(guī)則。
[0033]上述方案中,所述第二分析子單元,還用于采用決策樹算法,依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和所述第二組數(shù)據(jù)進(jìn)行分析,確定出N個(gè)規(guī)則;所述N為大于等于2的正整數(shù);
[0034]還用于在所述N個(gè)規(guī)則中,確定出滿足第三預(yù)設(shè)規(guī)則的第二類規(guī)則。
[0035]上述方案中,所述確定單元,包括:
[0036]第一確定子單元,用于分別依據(jù)所述第一類規(guī)則和第二類規(guī)則,對(duì)輸入的第三組數(shù)據(jù)進(jìn)行分析,得到第一疑似目標(biāo)數(shù)據(jù)和第二疑似目標(biāo)數(shù)據(jù);
[0037]第二確定子單元,用于基于所述第一疑似目標(biāo)數(shù)據(jù)和第二疑似目標(biāo)數(shù)據(jù)確定出滿足所述第一預(yù)設(shè)規(guī)則的目標(biāo)數(shù)據(jù)。
[0038]上述方案中,所述第二類規(guī)則包括:第一類子規(guī)則;所述第一類子規(guī)則滿足所述第一預(yù)設(shè)規(guī)則;對(duì)應(yīng)地,
[0039]所述第一確定子單元,還用于依據(jù)所述第一類規(guī)則,對(duì)輸入的第三組數(shù)據(jù)進(jìn)行分析,得到第一疑似目標(biāo)數(shù)據(jù);
[0040]還用于依據(jù)所述第一類子規(guī)則,對(duì)輸入的第三組數(shù)據(jù)進(jìn)行分析,得到第二疑似目標(biāo)數(shù)據(jù)。
[0041]上述方案中,所述第二類規(guī)則還包括:第二類子規(guī)則;所述第二類子規(guī)則滿足第二預(yù)設(shè)規(guī)則;
[0042]所述第一確定子單元,還用于依據(jù)所述第二類子規(guī)則,對(duì)所述第一疑似目標(biāo)數(shù)據(jù)和所述第二疑似目標(biāo)數(shù)據(jù)進(jìn)行分析,得到疑似非目標(biāo)數(shù)據(jù);
[0043]對(duì)應(yīng)地,所述第二確定子單元,還用于基于所述第一疑似目標(biāo)數(shù)據(jù)、第二疑似目標(biāo)數(shù)據(jù)和疑似非目標(biāo)數(shù)據(jù),確定出目標(biāo)數(shù)據(jù)。
[0044]本發(fā)明實(shí)施例所提供的大數(shù)據(jù)分析方法及其裝置,能夠在第一通信網(wǎng)絡(luò)的第一組數(shù)據(jù)和第二組數(shù)據(jù)中確定出至少兩個(gè)特征信息,并采用兩種不同算法,基于所述至少兩個(gè)特征信息確定出針對(duì)于不同算法的第一類規(guī)則和第二類規(guī)則,如此,通過所述第一類規(guī)則和第二類規(guī)則,對(duì)除所述第一通信網(wǎng)絡(luò)以外的其他通信網(wǎng)絡(luò)中的第三組數(shù)據(jù)進(jìn)行分析,以在所述第三組數(shù)據(jù)中確定出滿足預(yù)設(shè)規(guī)則的目標(biāo)數(shù)據(jù),因此,本發(fā)明實(shí)施例能夠?qū)崿F(xiàn)依據(jù)本網(wǎng)數(shù)據(jù)規(guī)則,在異網(wǎng)數(shù)據(jù)中確定出滿足預(yù)設(shè)規(guī)則的目標(biāo)數(shù)據(jù)的目的。
【附圖說明】
[0045]圖1為本發(fā)明實(shí)施例大數(shù)據(jù)分析方法的實(shí)現(xiàn)流程示意圖;
[0046]圖2為本發(fā)明實(shí)施例大數(shù)據(jù)分析裝置的具體結(jié)構(gòu)示意圖;
[0047]圖3為本發(fā)明實(shí)施例分析單元的具體結(jié)構(gòu)示意圖;
[0048]圖4為本發(fā)明實(shí)施例確定單元的具體結(jié)構(gòu)示意圖;
[0049]圖5為本發(fā)明實(shí)施例大數(shù)據(jù)分析方法的具體實(shí)現(xiàn)的流程示意圖。
【具體實(shí)施方式】
[0050]為了能夠更加詳盡地了解本發(fā)明的特點(diǎn)與技術(shù)內(nèi)容,下面結(jié)合附圖對(duì)本發(fā)明的實(shí)現(xiàn)進(jìn)行詳細(xì)闡述,所附附圖僅供參考說明之用,并非用來限定本發(fā)明。
[0051]實(shí)施例一
[0052]圖1為本發(fā)明實(shí)施例大數(shù)據(jù)分析方法的實(shí)現(xiàn)流程示意圖;如圖1所示,所述方法包括:
[0053]步驟101:基于輸入的第一組數(shù)據(jù)和第二組數(shù)據(jù),獲取滿足預(yù)設(shè)條件的至少兩個(gè)特征信息;所述第一組數(shù)據(jù)和第二組數(shù)據(jù)均為第一通信網(wǎng)絡(luò)中的數(shù)據(jù);所述第一組數(shù)據(jù)滿足第一預(yù)設(shè)規(guī)則;所述第二組數(shù)據(jù)滿足第二預(yù)設(shè)規(guī)則;
[0054]本實(shí)施例中,所述第一預(yù)設(shè)規(guī)則可以為在第一通信網(wǎng)絡(luò)中數(shù)據(jù)對(duì)應(yīng)的用戶的通信設(shè)備類型屬于第一類型的規(guī)則;所述第二預(yù)設(shè)規(guī)則可以為在第一通信網(wǎng)絡(luò)中數(shù)據(jù)對(duì)應(yīng)的用戶的通信設(shè)備類型不屬于第一類型的規(guī)則;如此,在所述第一通信網(wǎng)絡(luò)中,所述第一組數(shù)據(jù)所對(duì)應(yīng)的通信設(shè)備類型均為第一類型;所述第二組數(shù)據(jù)對(duì)應(yīng)的通信設(shè)備類型均不為第一類型;由于不同通信設(shè)備類型所對(duì)應(yīng)的數(shù)據(jù)的特征規(guī)則不同,因此,通過對(duì)第一組數(shù)據(jù)和第二組數(shù)據(jù)各自的特征規(guī)則進(jìn)行分析,能夠確定出滿足預(yù)設(shè)條件的M個(gè)特征信息;基于所述M個(gè)特征信息對(duì)數(shù)據(jù)進(jìn)行分析,能夠估算出數(shù)據(jù)對(duì)應(yīng)的通信設(shè)備類型等特征;基于上述過程,本發(fā)明實(shí)施例能夠依據(jù)所述第一通信網(wǎng)絡(luò)中的特征信息,從異網(wǎng)的大量數(shù)據(jù)中確定出通信設(shè)備類型屬于第一類型的數(shù)據(jù),為大數(shù)據(jù)分析奠定基礎(chǔ);這里,所述M為大于等于2的正整數(shù)。
[0055]本實(shí)施例中,所述特征信息具體為符合預(yù)設(shè)條件的關(guān)鍵變量指標(biāo),采用不同的算法,通過關(guān)鍵變量指標(biāo)對(duì)第一通信網(wǎng)絡(luò)中的大數(shù)據(jù)進(jìn)行分析,也即對(duì)第一組數(shù)據(jù)和第二組數(shù)據(jù)進(jìn)行分析,如此,為在第一通信網(wǎng)絡(luò)的大數(shù)據(jù)中確定出規(guī)則奠定基礎(chǔ)。
[0056]本實(shí)施例中,所述預(yù)設(shè)條件包括但不限于:大于等于第一用戶數(shù)量的條件、通信對(duì)象的通信設(shè)備類型為第一類型的條件等。
[0057]步驟102:依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和第二組數(shù)據(jù)進(jìn)行分析,確定出第一類規(guī)則和第二類規(guī)則;
[0058]本實(shí)施例中,依據(jù)第一通信網(wǎng)絡(luò)中確定出的至少兩個(gè)特征信息,采用不同算法,對(duì)所述第一組數(shù)據(jù)和第二組數(shù)據(jù)進(jìn)行分析,進(jìn)而確定出基于所述第一通信網(wǎng)絡(luò)的第一類規(guī)則和第二類規(guī)則。
[0059]在實(shí)際應(yīng)用中,對(duì)大數(shù)據(jù)進(jìn)行數(shù)據(jù)分析時(shí),通常選用不同的算法,如此,以提高分析結(jié)果的準(zhǔn)確性;因此,本實(shí)施例也選用兩種不同的算法對(duì)輸入的第一組數(shù)據(jù)和第二組數(shù)據(jù)進(jìn)行分析。
[0060]上述方案中,所述依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和第二組數(shù)據(jù)進(jìn)行分析,確定出第一類規(guī)則和第二類規(guī)則,包括:
[0061]采用邏輯回歸算法,依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和所述第二組數(shù)據(jù)進(jìn)行分析,確定出第一類規(guī)則;
[0062]采用決策樹算法,依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和所述第二組數(shù)據(jù)進(jìn)行分析,確定出第二類規(guī)則。
[0063]上述方案中,所述采用決策樹算法,依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和所述第二組數(shù)據(jù)進(jìn)行分析,確定出第二類規(guī)則,包括:
[0064]采用決策樹算法,依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和所述第二組數(shù)據(jù)進(jìn)行分析,確定出N個(gè)規(guī)則;所述N為大于等于2的正整數(shù);
[0065]在所述N個(gè)規(guī)則中,確定出滿足第三預(yù)設(shè)規(guī)則的第二類規(guī)則。
[0066]本實(shí)施例中,由于步驟101中確定出的特征信息的個(gè)數(shù)不同,使得采用決策樹算法確定出的規(guī)則的個(gè)數(shù)不同,即N不同;因此,N的取值受限于所述特征信息的個(gè)數(shù)。
[0067]本實(shí)施例中,所述第二類規(guī)則為一統(tǒng)稱,是所述N個(gè)規(guī)則中、所有滿足第三預(yù)設(shè)規(guī)則的規(guī)則統(tǒng)稱,因此,并未指一特定規(guī)則。
[0068]步驟103:依據(jù)所述第一類規(guī)則和第二類規(guī)則,在輸入的第三組數(shù)據(jù)中確定出滿足所述第一預(yù)設(shè)規(guī)則的目標(biāo)數(shù)據(jù);所述第三組數(shù)據(jù)為除所述第一通信網(wǎng)絡(luò)以外的其他通信網(wǎng)絡(luò)中的數(shù)據(jù)。
[0069]本實(shí)施例中,能夠通過在第一通信網(wǎng)絡(luò)中確定出的第一類規(guī)則和第二類規(guī)則,在除所述第一通信網(wǎng)絡(luò)之外的其他通信網(wǎng)絡(luò)中的大量數(shù)據(jù)中、確定出滿足第一預(yù)設(shè)規(guī)則的目標(biāo)數(shù)據(jù),即在其他通信網(wǎng)絡(luò)的數(shù)據(jù)中,確定出用戶的通信設(shè)備類型屬于第一類型的目標(biāo)數(shù)據(jù),如此,實(shí)現(xiàn)基于本網(wǎng)中數(shù)據(jù)規(guī)則,在異網(wǎng)數(shù)據(jù)中確定出滿足預(yù)設(shè)規(guī)則的目標(biāo)數(shù)據(jù)的目的。
[0070]上述方案中,所述依據(jù)所述第一類規(guī)則和第二類規(guī)則,在輸入的第三組數(shù)據(jù)中確定出滿足所述第一預(yù)設(shè)規(guī)則的目標(biāo)數(shù)據(jù),包括:
[0071]分別依據(jù)所述第一類規(guī)則和第二類規(guī)則,對(duì)輸入的第三組數(shù)據(jù)進(jìn)行分析,得到第一疑似目標(biāo)數(shù)據(jù)和第二疑似目標(biāo)數(shù)據(jù);
[0072]基于所述第一疑似目標(biāo)數(shù)據(jù)和第二疑似目標(biāo)數(shù)據(jù)確定出滿足所述第一預(yù)設(shè)規(guī)則的目標(biāo)數(shù)據(jù)。
[0073]本實(shí)施例中,所述第一疑似目標(biāo)數(shù)據(jù)為與第一類規(guī)則對(duì)應(yīng)的數(shù)據(jù),即通過第一類規(guī)則,在除所述第一通信網(wǎng)絡(luò)之外的其他通信網(wǎng)絡(luò)中確定出的滿足第一預(yù)設(shè)規(guī)則的疑似目標(biāo)數(shù)據(jù);所述第二疑似目標(biāo)數(shù)據(jù)為與第二類規(guī)則對(duì)應(yīng)的數(shù)據(jù),即通過第二類規(guī)則,在除所述第一通信網(wǎng)絡(luò)之外的其他通信網(wǎng)絡(luò)中確定出的滿足第一預(yù)設(shè)規(guī)則的疑似目標(biāo)數(shù)據(jù)。
[0074]上述方案中,所述第二類規(guī)則包括:第一類子規(guī)則;所述第一類子規(guī)則滿足所述第一預(yù)設(shè)規(guī)則;
[0075]對(duì)應(yīng)地,所述分別依據(jù)所述第一類規(guī)則和第二類規(guī)則,對(duì)輸入的第三組數(shù)據(jù)進(jìn)行分析,得到第一疑似目標(biāo)數(shù)據(jù)和第二疑似目標(biāo)數(shù)據(jù),包括:
[0076]依據(jù)所述第一類規(guī)則,對(duì)輸入的第三組數(shù)據(jù)進(jìn)行分析,得到第一疑似目標(biāo)數(shù)據(jù);
[0077]依據(jù)所述第一類子規(guī)則,對(duì)輸入的第三組數(shù)據(jù)進(jìn)行分析,得到第二疑似目標(biāo)數(shù)據(jù)。
[0078]本實(shí)施例中,由于所述第二類規(guī)則為采用決策樹算法確定出的規(guī)則,因此,通過第二類規(guī)則能夠確定出滿足第一預(yù)設(shè)規(guī)則的第二疑似目標(biāo)數(shù)據(jù),和滿足第二預(yù)設(shè)規(guī)則的疑似非目標(biāo)數(shù)據(jù);即,所述第二類規(guī)則包括:第一類子規(guī)則和第二類子規(guī)則;通過所述第一類子規(guī)則,能夠確定出滿足第一預(yù)設(shè)規(guī)則的第二疑似目標(biāo)數(shù)據(jù);通過所述第二類子規(guī)則,能夠確定出滿足第二預(yù)設(shè)規(guī)則的疑似非目標(biāo)數(shù)據(jù);因此,本實(shí)施例還需要從第一疑似目標(biāo)數(shù)據(jù)和第二疑似目標(biāo)數(shù)據(jù)中剔除疑似非目標(biāo)數(shù)據(jù),以確定出最終目標(biāo)數(shù)據(jù)。
[0079]本實(shí)施例中,所述第一類子規(guī)則為滿足第一預(yù)設(shè)規(guī)則的規(guī)則;所述第二類子規(guī)則為不滿足所述第一預(yù)設(shè)規(guī)則的規(guī)則;也即為滿足所述第二預(yù)設(shè)規(guī)則的規(guī)則;當(dāng)所述第二類子規(guī)則為不滿足所述第一預(yù)設(shè)規(guī)則的規(guī)則時(shí),所述疑似非目標(biāo)數(shù)據(jù)為一類干擾數(shù)據(jù);因此,所述疑似非目標(biāo)數(shù)據(jù)也可以稱為干擾數(shù)據(jù)。
[0080]上述方案中,所述第二類規(guī)則還包括:第二類子規(guī)則;所述第二類子規(guī)則滿足第二預(yù)設(shè)規(guī)則;所述方法還包括:
[0081 ] 依據(jù)所述第二類子規(guī)則,對(duì)所述第一疑似目標(biāo)數(shù)據(jù)和所述第二疑似目標(biāo)數(shù)據(jù)進(jìn)行分析,得到疑似非目標(biāo)數(shù)據(jù);
[0082]對(duì)應(yīng)地,所述基于所述第一疑似目標(biāo)數(shù)據(jù)和第二疑似目標(biāo)數(shù)據(jù)確定出目標(biāo)數(shù)據(jù),包括:
[0083]基于所述第一疑似目標(biāo)數(shù)據(jù)、第二疑似目標(biāo)數(shù)據(jù)和疑似非目標(biāo)數(shù)據(jù),確定出目標(biāo)數(shù)據(jù)。
[0084]為實(shí)現(xiàn)上述方法,本發(fā)明實(shí)施例還提供了一種大數(shù)據(jù)分析裝置,如圖2所示,所述裝置包括:
[0085]獲取單元21,用于基于輸入的第一組數(shù)據(jù)和第二組數(shù)據(jù),獲取滿足預(yù)設(shè)條件的至少兩個(gè)特征信息;所述第一組數(shù)據(jù)和第二組數(shù)據(jù)均為第一通信網(wǎng)絡(luò)中的數(shù)據(jù);所述第一組數(shù)據(jù)滿足第一預(yù)設(shè)規(guī)則;所述第二組數(shù)據(jù)滿足第二預(yù)設(shè)規(guī)則;
[0086]分析單元22,用于依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和第二組數(shù)據(jù)進(jìn)行分析,確定出第一類規(guī)則和第二類規(guī)則;
[0087]確定單元23,用于依據(jù)所述第一類規(guī)則和第二類規(guī)則,在輸入的第三組數(shù)據(jù)中確定出滿足所述第一預(yù)設(shè)規(guī)則的目標(biāo)數(shù)據(jù);所述第三組數(shù)據(jù)為除所述第一通信網(wǎng)絡(luò)以外的其他通信網(wǎng)絡(luò)中的數(shù)據(jù)。
[0088]上述方案中,如圖3所示,所述分析單元22包括:
[0089]第一分析子單元221,用于采用邏輯回歸算法,依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和所述第二組數(shù)據(jù)進(jìn)行分析,確定出第一類規(guī)則;
[0090]第二分析子單元222,用于采用決策樹算法,依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和所述第二組數(shù)據(jù)進(jìn)行分析,確定出第二類規(guī)則。
[0091]上述方案中,所述第二分析子單元222,還用于采用決策樹算法,依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和所述第二組數(shù)據(jù)進(jìn)行分析,確定出N個(gè)規(guī)則;所述N為大于等于2的正整數(shù);
[0092]還用于在所述N個(gè)規(guī)則中,確定出滿足第三預(yù)設(shè)規(guī)則的第二類規(guī)則。
[0093]上述方案中,如圖4所示,所述確定單元23,包括:
[0094]第一確定子單元231,用于分別依據(jù)所述第一類規(guī)則和第二類規(guī)則,對(duì)輸入的第三組數(shù)據(jù)進(jìn)行分析,得到第一疑似目標(biāo)數(shù)據(jù)和第二疑似目標(biāo)數(shù)據(jù);
[0095]第二確定子單元232,用于基于所述第一疑似目標(biāo)數(shù)據(jù)和第二疑似目標(biāo)數(shù)據(jù)確定出滿足所述第一預(yù)設(shè)規(guī)則的目標(biāo)數(shù)據(jù)。
[0096]上述方案中,所述第二類規(guī)則包括:第一類子規(guī)則;所述第一類子規(guī)則滿足所述第一預(yù)設(shè)規(guī)則;對(duì)應(yīng)地,
[0097]所述第一確定子單元231,還用于依據(jù)所述第一類規(guī)則,對(duì)輸入的第三組數(shù)據(jù)進(jìn)行分析,得到第一疑似目標(biāo)數(shù)據(jù);
[0098]還用于依據(jù)所述第一類子規(guī)則,對(duì)輸入的第三組數(shù)據(jù)進(jìn)行分析,得到第二疑似目標(biāo)數(shù)據(jù)。
[0099]上述方案中,所述第二類規(guī)則還包括:第二類子規(guī)則;所述第二類子規(guī)則滿足第二預(yù)設(shè)規(guī)則;
[0100]所述第一確定子單元231,還用于依據(jù)所述第二類子規(guī)則,所述第一疑似目標(biāo)數(shù)據(jù)和所述第二疑似目標(biāo)數(shù)據(jù)進(jìn)行分析,得到疑似非目標(biāo)數(shù)據(jù);
[0101]對(duì)應(yīng)地,所述第二確定子單元232,還用于基于所述第一疑似目標(biāo)數(shù)據(jù)、第二疑似目標(biāo)數(shù)據(jù)和疑似非目標(biāo)數(shù)據(jù),確定出目標(biāo)數(shù)據(jù)。
[0102]所述獲取單元21、分析單元22及確定單元23均可以運(yùn)行于計(jì)算機(jī)上,可由位于計(jì)算機(jī)上的中央處理器(CPU)、或微處理器(MPU)、或數(shù)字信號(hào)處理器(DSP)、或可編程門陣列(FPGA)實(shí)現(xiàn)。
[0103]實(shí)施例二
[0104]第一軟件,例如頂ESSAGE軟件是指第一類型終端內(nèi)置的用戶間發(fā)送短信的軟件,該軟件可以使短信直接從GPRS端發(fā)送,節(jié)省了使用第一類型終端的用戶的短信費(fèi)用;因此,使用第一軟件的第一類型終端用戶可能會(huì)大大減少短信的使用量,形成了短信黑洞現(xiàn)象,本實(shí)施例正是基于上述短信黑洞現(xiàn)象,在異網(wǎng)中確定出終端類型為第一類型的用戶。
[0105]本實(shí)施例主要利用現(xiàn)有經(jīng)分系統(tǒng)的通信數(shù)據(jù),分析本網(wǎng)使用第一軟件的第一類型終端用戶的交往行為、以及其交往圈的人群的特點(diǎn),識(shí)別出異網(wǎng)具備上述交往行為、以及其交往圈人群符合上述特點(diǎn)的數(shù)據(jù),也即用戶,以最終在異網(wǎng)中確定出終端類型為第一類型的用戶,以助力于運(yùn)營(yíng)商的異網(wǎng)高價(jià)值客戶的回流工作及營(yíng)銷策略。
[0106]具體地,本實(shí)施例主要以用戶交往圈模型為基礎(chǔ),通過分析本網(wǎng)第一類型終端中使用第一軟件的客戶語(yǔ)音交往圈和短信交往圈等習(xí)慣特征,在異網(wǎng)大量用戶中,分析出第一類型終端用戶的用戶群,進(jìn)而分析出異網(wǎng)某一用戶是否為第一類型終端用戶的概率,以為運(yùn)營(yíng)商提供具有參考價(jià)值的數(shù)據(jù)信息。
[0107]圖5為本發(fā)明實(shí)施例大數(shù)據(jù)分析方法的具體實(shí)現(xiàn)的流程示意圖;在進(jìn)行大數(shù)據(jù)分析之前,需要確定出第一組數(shù)據(jù)和第二組數(shù)據(jù);具體地,在第一通信網(wǎng)絡(luò)中確定出具有第一數(shù)據(jù)量的第一組數(shù)據(jù)、以及具有第一數(shù)據(jù)量的第二組數(shù)據(jù);其中,所述第一組數(shù)據(jù)中各數(shù)據(jù)對(duì)應(yīng)的用戶設(shè)備類型為第一類型;所述第二組數(shù)據(jù)對(duì)應(yīng)的用戶設(shè)備類型為非第一類型;如圖5所示,所述方法包括:
[0108]步驟501:在第一組數(shù)據(jù)和第二組數(shù)據(jù)中,結(jié)合第一組數(shù)據(jù)和第二組數(shù)據(jù)各自對(duì)應(yīng)的用戶的交往圈的特征規(guī)則、交往圈中語(yǔ)音和短信的特征規(guī)則、交往對(duì)象是否使用第一類型終端的特征規(guī)則等選取出M個(gè)特征信息;其中,M為大于等于2的正整數(shù);
[0109]這里,所述特征信息也稱為關(guān)鍵變量指標(biāo)。
[0110]步驟502:采用邏輯回歸算法,依據(jù)所述M個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和第二組數(shù)據(jù)進(jìn)行分析,模擬出滿足第一預(yù)設(shè)規(guī)則的第一類規(guī)則;
[0111]這里,所述第一類規(guī)則可以為邏輯回歸公式;所述第一預(yù)設(shè)規(guī)則為用戶終端類型為第一類型的規(guī)則。
[0112]本實(shí)施例中,所述對(duì)所述第一組數(shù)據(jù)和第二組數(shù)據(jù)進(jìn)行分析,模擬出滿足第一預(yù)設(shè)規(guī)則的第一類規(guī)則,包括:
[0113]基于所述M個(gè)特征信息,采用邏輯回歸算法,對(duì)所述第一組數(shù)據(jù)和第二組數(shù)據(jù)進(jìn)行分析,模擬出滿足第一預(yù)設(shè)規(guī)則的第一類規(guī)則。
[0114]步驟503:確定第三組數(shù)據(jù),依據(jù)所述第一類規(guī)則,計(jì)算所述第三組數(shù)據(jù)中的各數(shù)據(jù)的概率,以確定出第一疑似目標(biāo)數(shù)據(jù);所述第三組數(shù)據(jù)為與所述第一通信網(wǎng)絡(luò)中的用戶進(jìn)行通信的、其他通信網(wǎng)絡(luò)中的用戶所對(duì)應(yīng)的數(shù)據(jù);
[0115]這里,所述依據(jù)所述第一類規(guī)則,計(jì)算所述第三組數(shù)據(jù)中的各數(shù)據(jù)的概率,以確定出第一疑似目標(biāo)數(shù)據(jù),進(jìn)一步包括:
[0116]依據(jù)所述第一類規(guī)則,計(jì)算所述第三組數(shù)據(jù)中的各數(shù)據(jù)的概率;
[0117]依據(jù)數(shù)據(jù)業(yè)務(wù)需求、邏輯回歸算法的邏輯回歸等級(jí)對(duì)應(yīng)的預(yù)設(shè)用戶數(shù),在所述第三組數(shù)據(jù)中的各數(shù)據(jù)對(duì)應(yīng)的概率中,確定出概率大于等于預(yù)設(shè)閾值的數(shù)據(jù),并將概率大于等于預(yù)設(shè)閾值的數(shù)據(jù)作為第一疑似目標(biāo)數(shù)據(jù)。
[0118]步驟504:采用C5決策樹算法,依據(jù)所述M個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和所述第二組數(shù)據(jù)進(jìn)行分析,確定出ml個(gè)規(guī)則A和m2個(gè)規(guī)則B ;
[0119]步驟505:根據(jù)規(guī)則A和規(guī)則B對(duì)應(yīng)的用戶數(shù)和置信度,對(duì)規(guī)則A和規(guī)則B進(jìn)行篩選,以在所述規(guī)則A中確定出第一類子規(guī)則,在所述規(guī)則B中確定第二類子規(guī)則;
[0120]這里,所述第一類子規(guī)則滿足所述第一預(yù)設(shè)規(guī)則;所述第二類子規(guī)則滿足所述第二預(yù)設(shè)規(guī)則;所述ml、m2為大于等于I的正整數(shù)。
[0121]具體地,當(dāng)?shù)谝唤M數(shù)據(jù)和第二組數(shù)據(jù)的用戶數(shù)均為1W時(shí),從規(guī)則A中篩選出置信度大于85%、用戶數(shù)大于2W的規(guī)則,確定為第一類子規(guī)則;從規(guī)則B中篩選出置信度大于90%、用戶數(shù)大于1.8W的規(guī)則,確定為第二類子規(guī)則;
[0122]本實(shí)施例中,所述第一類子規(guī)則和第二類子規(guī)則均歸屬于第二類規(guī)則。
[0123]步驟506:依據(jù)所述第一類子規(guī)則,對(duì)所述第三組數(shù)據(jù)進(jìn)行分析,確定出第二疑似目標(biāo)數(shù)據(jù);
[0124]步驟507:確定所述第一疑似目標(biāo)數(shù)據(jù)和第二疑似目標(biāo)數(shù)據(jù)的交集數(shù)據(jù),作為第三疑似目標(biāo)數(shù)據(jù);
[0125]步驟508:剔除所述第三疑似目標(biāo)數(shù)據(jù)中符合第二類子規(guī)則的數(shù)據(jù),將剩余第三疑似目標(biāo)數(shù)據(jù)作為目標(biāo)數(shù)據(jù)。
[0126]本發(fā)明實(shí)施例,能夠在第一通信網(wǎng)絡(luò)中的第一組數(shù)據(jù)和第二組數(shù)據(jù)中確定出關(guān)鍵變量指標(biāo),即特征信息;并分別采用邏輯回歸算法和決策樹算法對(duì)所述第一組數(shù)據(jù)和第二組數(shù)據(jù)進(jìn)行分析,確定出與所述邏輯回歸算法對(duì)應(yīng)的第一類規(guī)則,和與所述決策樹算法對(duì)應(yīng)的第二類規(guī)則;其中,所述第二類規(guī)則包括第一類子規(guī)則和第二類子規(guī)則;隨后,分別依據(jù)所述第一類規(guī)則和第一類子規(guī)則對(duì)異網(wǎng)中的第三組數(shù)據(jù)進(jìn)行分析,確定出第一疑似目標(biāo)數(shù)據(jù)和第二疑似目標(biāo)數(shù)據(jù);由于所述第一類規(guī)則滿足第一預(yù)設(shè)規(guī)則;所述第一類子規(guī)則也滿足所述第一預(yù)設(shè)規(guī)則;而第二類子規(guī)則滿足所述第二預(yù)設(shè)規(guī)則,因此,取所述第一疑似目標(biāo)數(shù)據(jù)和第二疑似目標(biāo)數(shù)據(jù)的交集確定出第三疑似目標(biāo)數(shù)據(jù)后,在所述第三疑似目標(biāo)數(shù)據(jù)中剔除滿足第二類子規(guī)則的數(shù)據(jù),即在所述第三疑似目標(biāo)數(shù)據(jù)中剔除疑似非目標(biāo)數(shù)據(jù)以最終得到目標(biāo)數(shù)據(jù),所述目標(biāo)數(shù)據(jù)即為依據(jù)本網(wǎng)數(shù)據(jù)規(guī)則,在異網(wǎng)數(shù)據(jù)中確定出滿足第一預(yù)設(shè)規(guī)則的目標(biāo)數(shù)據(jù)。
[0127]本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、系統(tǒng)、或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用硬件實(shí)施例、軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本發(fā)明可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器和光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
[0128]本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。
[0129]這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。
[0130]這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。
[0131]以上所述僅是本發(fā)明實(shí)施例的實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明實(shí)施例原理的前提下,還可以作出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也應(yīng)視為本發(fā)明實(shí)施例的保護(hù)范圍。
【主權(quán)項(xiàng)】
1.一種大數(shù)據(jù)分析方法,其特征在于,所述方法包括: 基于輸入的第一組數(shù)據(jù)和第二組數(shù)據(jù),獲取滿足預(yù)設(shè)條件的至少兩個(gè)特征信息;所述第一組數(shù)據(jù)和第二組數(shù)據(jù)均為第一通信網(wǎng)絡(luò)中的數(shù)據(jù);所述第一組數(shù)據(jù)滿足第一預(yù)設(shè)規(guī)則;所述第二組數(shù)據(jù)滿足第二預(yù)設(shè)規(guī)則; 依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和第二組數(shù)據(jù)進(jìn)行分析,確定出第一類規(guī)則和第二類規(guī)則; 依據(jù)所述第一類規(guī)則和第二類規(guī)則,在輸入的第三組數(shù)據(jù)中確定出滿足所述第一預(yù)設(shè)規(guī)則的目標(biāo)數(shù)據(jù);所述第三組數(shù)據(jù)為除所述第一通信網(wǎng)絡(luò)以外的其他通信網(wǎng)絡(luò)中的數(shù)據(jù)。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和第二組數(shù)據(jù)進(jìn)行分析,確定出第一類規(guī)則和第二類規(guī)則,包括: 采用邏輯回歸算法,依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和所述第二組數(shù)據(jù)進(jìn)行分析,確定出第一類規(guī)則; 采用決策樹算法,依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和所述第二組數(shù)據(jù)進(jìn)行分析,確定出第二類規(guī)則。3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述采用決策樹算法,依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和所述第二組數(shù)據(jù)進(jìn)行分析,確定出第二類規(guī)則,包括: 采用決策樹算法,依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和所述第二組數(shù)據(jù)進(jìn)行分析,確定出N個(gè)規(guī)則;所述N為大于等于2的正整數(shù); 在所述N個(gè)規(guī)則中,確定出滿足第三預(yù)設(shè)規(guī)則的第二類規(guī)則。4.根據(jù)權(quán)利要求1或3任一項(xiàng)所述的方法,其特征在于,所述依據(jù)所述第一類規(guī)則和第二類規(guī)則,在輸入的第三組數(shù)據(jù)中確定出滿足所述第一預(yù)設(shè)規(guī)則的目標(biāo)數(shù)據(jù),包括: 分別依據(jù)所述第一類規(guī)則和第二類規(guī)則,對(duì)輸入的第三組數(shù)據(jù)進(jìn)行分析,得到第一疑似目標(biāo)數(shù)據(jù)和第二疑似目標(biāo)數(shù)據(jù); 基于所述第一疑似目標(biāo)數(shù)據(jù)和第二疑似目標(biāo)數(shù)據(jù)確定出滿足所述第一預(yù)設(shè)規(guī)則的目標(biāo)數(shù)據(jù)。5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述第二類規(guī)則包括:第一類子規(guī)則;所述第一類子規(guī)則滿足所述第一預(yù)設(shè)規(guī)則; 對(duì)應(yīng)地,所述分別依據(jù)所述第一類規(guī)則和第二類規(guī)則,對(duì)輸入的第三組數(shù)據(jù)進(jìn)行分析,得到第一疑似目標(biāo)數(shù)據(jù)和第二疑似目標(biāo)數(shù)據(jù),包括: 依據(jù)所述第一類規(guī)則,對(duì)輸入的第三組數(shù)據(jù)進(jìn)行分析,得到第一疑似目標(biāo)數(shù)據(jù); 依據(jù)所述第一類子規(guī)則,對(duì)輸入的第三組數(shù)據(jù)進(jìn)行分析,得到第二疑似目標(biāo)數(shù)據(jù)。6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述第二類規(guī)則還包括:第二類子規(guī)則;所述第二類子規(guī)則滿足第二預(yù)設(shè)規(guī)則;所述方法還包括: 依據(jù)所述第二類子規(guī)則,對(duì)所述第一疑似目標(biāo)數(shù)據(jù)和所述第二疑似目標(biāo)數(shù)據(jù)進(jìn)行分析,得到疑似非目標(biāo)數(shù)據(jù); 對(duì)應(yīng)地,所述基于所述第一疑似目標(biāo)數(shù)據(jù)和第二疑似目標(biāo)數(shù)據(jù)確定出目標(biāo)數(shù)據(jù),包括: 基于所述第一疑似目標(biāo)數(shù)據(jù)、第二疑似目標(biāo)數(shù)據(jù)和疑似非目標(biāo)數(shù)據(jù),確定出目標(biāo)數(shù)據(jù)。7.一種大數(shù)據(jù)分析裝置,其特征在于,所述裝置包括: 獲取單元,用于基于輸入的第一組數(shù)據(jù)和第二組數(shù)據(jù),獲取滿足預(yù)設(shè)條件的至少兩個(gè)特征信息;所述第一組數(shù)據(jù)和第二組數(shù)據(jù)均為第一通信網(wǎng)絡(luò)中的數(shù)據(jù);所述第一組數(shù)據(jù)滿足第一預(yù)設(shè)規(guī)則;所述第二組數(shù)據(jù)滿足第二預(yù)設(shè)規(guī)則; 分析單元,用于依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和第二組數(shù)據(jù)進(jìn)行分析,確定出第一類規(guī)則和第二類規(guī)則; 確定單元,用于依據(jù)所述第一類規(guī)則和第二類規(guī)則,在輸入的第三組數(shù)據(jù)中確定出滿足所述第一預(yù)設(shè)規(guī)則的目標(biāo)數(shù)據(jù);所述第三組數(shù)據(jù)為除所述第一通信網(wǎng)絡(luò)以外的其他通信網(wǎng)絡(luò)中的數(shù)據(jù)。8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述分析單元包括: 第一分析子單元,用于采用邏輯回歸算法,依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和所述第二組數(shù)據(jù)進(jìn)行分析,確定出第一類規(guī)則; 第二分析子單元,用于采用決策樹算法,依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和所述第二組數(shù)據(jù)進(jìn)行分析,確定出第二類規(guī)則。9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述第二分析子單元,還用于采用決策樹算法,依據(jù)所述至少兩個(gè)特征信息,對(duì)所述第一組數(shù)據(jù)和所述第二組數(shù)據(jù)進(jìn)行分析,確定出N個(gè)規(guī)則;所述N為大于等于2的正整數(shù); 還用于在所述N個(gè)規(guī)則中,確定出滿足第三預(yù)設(shè)規(guī)則的第二類規(guī)則。10.根據(jù)權(quán)利要求7至9任一項(xiàng)所述的裝置,其特征在于,所述確定單元,包括: 第一確定子單元,用于分別依據(jù)所述第一類規(guī)則和第二類規(guī)則,對(duì)輸入的第三組數(shù)據(jù)進(jìn)行分析,得到第一疑似目標(biāo)數(shù)據(jù)和第二疑似目標(biāo)數(shù)據(jù); 第二確定子單元,用于基于所述第一疑似目標(biāo)數(shù)據(jù)和第二疑似目標(biāo)數(shù)據(jù)確定出滿足所述第一預(yù)設(shè)規(guī)則的目標(biāo)數(shù)據(jù)。11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述第二類規(guī)則包括:第一類子規(guī)則;所述第一類子規(guī)則滿足所述第一預(yù)設(shè)規(guī)則;對(duì)應(yīng)地, 所述第一確定子單元,還用于依據(jù)所述第一類規(guī)則,對(duì)輸入的第三組數(shù)據(jù)進(jìn)行分析,得到第一疑似目標(biāo)數(shù)據(jù); 還用于依據(jù)所述第一類子規(guī)則,對(duì)輸入的第三組數(shù)據(jù)進(jìn)行分析,得到第二疑似目標(biāo)數(shù)據(jù)。12.根據(jù)權(quán)利要求11所述的方法,其特征在于,所述第二類規(guī)則還包括:第二類子規(guī)則;所述第二類子規(guī)則滿足第二預(yù)設(shè)規(guī)則; 所述第一確定子單元,還用于依據(jù)所述第二類子規(guī)則,對(duì)所述第一疑似目標(biāo)數(shù)據(jù)和所述第二疑似目標(biāo)數(shù)據(jù)進(jìn)行分析,得到疑似非目標(biāo)數(shù)據(jù); 對(duì)應(yīng)地,所述第二確定子單元,還用于基于所述第一疑似目標(biāo)數(shù)據(jù)、第二疑似目標(biāo)數(shù)據(jù)和疑似非目標(biāo)數(shù)據(jù),確定出目標(biāo)數(shù)據(jù)。
【文檔編號(hào)】G06F17/30GK105824811SQ201510001942
【公開日】2016年8月3日
【申請(qǐng)日】2015年1月4日
【發(fā)明人】黃慶榮, 謝志崇, 魏建榮, 彭家華, 鄭志歡, 林恪, 陳鈺鋮
【申請(qǐng)人】中國(guó)移動(dòng)通信集團(tuán)福建有限公司