国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種人員潛在關(guān)系分析方法和裝置與流程

      文檔序號(hào):12271335閱讀:501來源:國(guó)知局
      一種人員潛在關(guān)系分析方法和裝置與流程

      本發(fā)明涉及通信領(lǐng)域,具體涉及一種人員潛在關(guān)系分析方法和裝置。



      背景技術(shù):

      隨著計(jì)算機(jī)技術(shù)和互聯(lián)網(wǎng)的高速發(fā)展,計(jì)算機(jī)應(yīng)用越來越普及,其規(guī)模,范圍和深度也在不斷的擴(kuò)大。尤其是近幾十年來隨著數(shù)據(jù)庫(kù)技術(shù)的不斷成熟和數(shù)據(jù)庫(kù)管理系統(tǒng)的廣泛應(yīng)用,以及數(shù)據(jù)庫(kù)采集技術(shù)的發(fā)展,人們利用計(jì)算機(jī)技術(shù)收集和累積的數(shù)據(jù)也在極力增加,并且這些數(shù)據(jù)每天都在以指數(shù)級(jí)增長(zhǎng)。這些海量數(shù)據(jù)背后隱藏著很多重要信息,人們希望能夠?qū)ζ溥M(jìn)行高層次的分析,以便更好的利用這些數(shù)據(jù),因此針對(duì)這種海量數(shù)據(jù)的數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生,不同的數(shù)據(jù)挖掘算法可以產(chǎn)生不同的分析數(shù)據(jù)結(jié)果,對(duì)于人員關(guān)系的分析,現(xiàn)在有如下幾種方案:

      方案一:基于通信記錄的海量數(shù)據(jù)分析,通過在數(shù)據(jù)中挖掘出潛在的,不為人所知的,人與人之間的通信及交互模式,例如通話時(shí)間,通話時(shí)長(zhǎng)和通話人職業(yè)等之間的關(guān)系模式,給進(jìn)一步分析人與人之間關(guān)系提供決策支持。該方案的缺點(diǎn)在于:分析數(shù)據(jù)主體單一,只能依靠單一的通話記錄獲取通話相關(guān)的人員關(guān)系分析;關(guān)系模型不具備通用性,無法靈活接入其他的分析數(shù)據(jù),擴(kuò)展性不強(qiáng)。只能基于已知的存在交互的數(shù)據(jù)進(jìn)行分析,很難分析出潛在的,不存在通話數(shù)據(jù)的人員關(guān)系。

      方案二:基于社交網(wǎng)絡(luò)海量數(shù)據(jù)的人員關(guān)系分析,通過識(shí)別目標(biāo)人員的社交互動(dòng)方式;統(tǒng)計(jì)與目標(biāo)人員的社交互動(dòng)種類;統(tǒng)計(jì)每種社交方式的互動(dòng)次數(shù);根據(jù)人際關(guān)系熱度算法計(jì)算人際關(guān)系熱度積分;根據(jù)人際關(guān)系熱度積分繪制人 際關(guān)系熱譜圖。從而分析得出人員關(guān)系親密程度。該方案的缺點(diǎn)在于:只能通過單一的社交網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行分析,模型不適用于其他類型的行為軌跡數(shù)據(jù)。只能基于已知的存在人員社交互動(dòng)的數(shù)據(jù)進(jìn)行分析,很難分析出潛在的,不存在直接社交互動(dòng)數(shù)據(jù)的人員關(guān)系。

      方案三:基于人物照片的數(shù)據(jù)分析,輸入為一個(gè)照相簿,基于人臉識(shí)別技術(shù),識(shí)別出該相簿里每一張照片中的人臉區(qū)塊,以區(qū)分出每一張照片中的人。進(jìn)一步地,該方法根據(jù)上述相簿里包含某個(gè)人的照片,計(jì)算該人與照片中其他人之間的距離,從而計(jì)算出該人與該其他人之間的人脈關(guān)系。該方案的缺點(diǎn)在于:分析數(shù)據(jù)不具備通用性,且對(duì)于數(shù)據(jù)的要求較高。需要引入人臉識(shí)別技術(shù),提高了人員關(guān)系分析的技術(shù)難度。只對(duì)于出現(xiàn)在同一個(gè)相簿里的人進(jìn)行分析,具有局限性。



      技術(shù)實(shí)現(xiàn)要素:

      本發(fā)明要解決的主要技術(shù)問題是,提供一種人員潛在關(guān)系分析方法和裝置,解決現(xiàn)有中對(duì)人員潛在關(guān)系分析分析主體數(shù)據(jù)源比較單一,擴(kuò)展性不強(qiáng)以及只能依據(jù)已知的關(guān)系人員進(jìn)行分析的問題。

      為解決上述問題,本發(fā)明提供一種人員潛在關(guān)系分析方法,包括:

      獲取各人員的多種行為軌跡數(shù)據(jù);

      確定目標(biāo)人員,并獲取所述目標(biāo)人員的多種行為軌跡數(shù)據(jù)中的至少兩種行為軌跡數(shù)據(jù)作為目標(biāo)行為軌跡數(shù)據(jù);

      根據(jù)所述目標(biāo)行為軌跡數(shù)據(jù)與其他人員對(duì)應(yīng)的行為軌跡分析得到所述目標(biāo)人員的潛在關(guān)系人員。

      在本發(fā)明的一種實(shí)施例中,所述行為軌跡數(shù)據(jù)包括行程類型軌跡數(shù)據(jù)、娛 樂類型軌跡數(shù)據(jù)和通信類型軌跡數(shù)據(jù)。

      在本發(fā)明的一種實(shí)施例中,所述獲取各人員的多種行為軌跡數(shù)據(jù)之前還包括:采集各人員的各種行為軌跡數(shù)據(jù),存入大數(shù)據(jù)平臺(tái);所述獲取各人員的多種行為軌跡數(shù)據(jù)包括:從所述大數(shù)據(jù)平臺(tái)提取各人員的多種行為軌跡數(shù)據(jù)。

      在本發(fā)明的一種實(shí)施例中,所述采集各人員的各種行為軌跡數(shù)據(jù)包括:建立各類型軌跡數(shù)據(jù)對(duì)應(yīng)的特征屬性的提取模型,獲取數(shù)據(jù)源,根據(jù)所述提取模型從所述數(shù)據(jù)源中提取特征屬性;各類型軌跡數(shù)據(jù)對(duì)應(yīng)的特征屬性包括:行程類型軌跡數(shù)據(jù)對(duì)應(yīng)的特征屬性包括行程時(shí)間和行程標(biāo)識(shí);娛樂類型軌跡數(shù)據(jù)對(duì)應(yīng)的特征屬性包括娛樂時(shí)間和地址標(biāo)識(shí);通信類型軌跡數(shù)據(jù)對(duì)應(yīng)的特征數(shù)據(jù)包括通信標(biāo)識(shí)和通信時(shí)間。

      在本發(fā)明的一種實(shí)施例中,在根據(jù)所述目標(biāo)行為軌跡數(shù)據(jù)與其他人員對(duì)應(yīng)的行為軌跡進(jìn)行分析之前還包括:將每個(gè)人的多種行為軌跡數(shù)據(jù)進(jìn)行梳理合并,并按照預(yù)設(shè)排序規(guī)則進(jìn)行排序。

      在本發(fā)明的一種實(shí)施例中,將每個(gè)人的多種行為軌跡數(shù)據(jù)進(jìn)行梳理合并包括:根據(jù)預(yù)設(shè)分析條件對(duì)每個(gè)人的多種行為軌跡數(shù)據(jù)進(jìn)行篩選,將每個(gè)人滿足預(yù)設(shè)分析條件的多種行為軌跡數(shù)據(jù)進(jìn)行梳理合。

      在本發(fā)明的一種實(shí)施例中,所述根據(jù)所述目標(biāo)行為軌跡數(shù)據(jù)與其他人員對(duì)應(yīng)的行為軌跡分析得到所述目標(biāo)人員的潛在關(guān)系人員包括:將所述目標(biāo)行為軌跡數(shù)據(jù)和其他人員對(duì)應(yīng)的行為軌跡分析按照相似度算法進(jìn)行比對(duì),得到各行為相似度對(duì)應(yīng)的權(quán)重值,當(dāng)至少一個(gè)權(quán)重值滿足預(yù)設(shè)潛在條件時(shí),確定對(duì)應(yīng)的人員為所述目標(biāo)人員的潛在關(guān)系人員。

      為解決上述問題,本發(fā)明還提供一種人員潛在關(guān)系分析裝置,包括數(shù)據(jù)獲取模塊、目標(biāo)確定模塊和關(guān)系分析模塊:

      所述數(shù)據(jù)獲取模塊用于獲取各人員的多種行為軌跡數(shù)據(jù);

      所述目標(biāo)確定模塊用于確定目標(biāo)人員,并獲取所述目標(biāo)人員的多種行為軌跡數(shù)據(jù)中的至少兩種行為軌跡數(shù)據(jù)作為目標(biāo)行為軌跡數(shù)據(jù);

      所述關(guān)系分析模塊用于根據(jù)所述目標(biāo)行為軌跡數(shù)據(jù)與其他人員對(duì)應(yīng)的行為軌跡分析得到所述目標(biāo)人員的潛在關(guān)系人員。

      在本發(fā)明的一種實(shí)施例中,所述行為軌跡數(shù)據(jù)包括行程類型軌跡數(shù)據(jù)、娛樂類型軌跡數(shù)據(jù)和通信類型軌跡數(shù)據(jù)。

      在本發(fā)明的一種實(shí)施例中,還包括數(shù)據(jù)采集模塊,所述數(shù)據(jù)采集模塊用于在獲取各人員的多種行為軌跡數(shù)據(jù)之前,采集各人員的各種行為軌跡數(shù)據(jù),存入大數(shù)據(jù)平臺(tái);所述數(shù)據(jù)獲取模塊還用于從所述大數(shù)據(jù)平臺(tái)提取各人員的多種行為軌跡數(shù)據(jù)。

      在本發(fā)明的一種實(shí)施例中,所述數(shù)據(jù)采集模塊還用于建立各類型軌跡數(shù)據(jù)對(duì)應(yīng)的特征屬性的提取模型,獲取數(shù)據(jù)源,根據(jù)所述提取模型從所述數(shù)據(jù)源中提取特征屬性;各類型軌跡數(shù)據(jù)對(duì)應(yīng)的特征屬性包括:行程類型軌跡數(shù)據(jù)對(duì)應(yīng)的特征屬性包括行程時(shí)間和行程標(biāo)識(shí);娛樂類型軌跡數(shù)據(jù)對(duì)應(yīng)的特征屬性包括娛樂時(shí)間和地址標(biāo)識(shí);通信類型軌跡數(shù)據(jù)對(duì)應(yīng)的特征數(shù)據(jù)包括通信標(biāo)識(shí)和通信時(shí)間。

      在本發(fā)明的一種實(shí)施例中,所述關(guān)系分析模塊還用于將所述目標(biāo)行為軌跡數(shù)據(jù)和其他人員對(duì)應(yīng)的行為軌跡分析按照相似度算法進(jìn)行比對(duì),得到各行為相似度對(duì)應(yīng)的權(quán)重值,當(dāng)至少一個(gè)權(quán)重值滿足預(yù)設(shè)潛在條件時(shí),確定對(duì)應(yīng)的人員為所述目標(biāo)人員的潛在關(guān)系人員。

      本發(fā)明的有益效果是:

      本發(fā)明提供的人員潛在關(guān)系分析方法和裝置,先獲取各人員的多種行為軌 跡數(shù)據(jù);然后確定目標(biāo)人員,并獲取目標(biāo)人員的多種行為軌跡數(shù)據(jù)中的至少兩種行為軌跡數(shù)據(jù)作為目標(biāo)行為軌跡數(shù)據(jù);最后根據(jù)目標(biāo)行為軌跡數(shù)據(jù)與其他人員對(duì)應(yīng)的行為軌跡分析得到目標(biāo)人員的潛在關(guān)系人員。與現(xiàn)有技術(shù)相比,通過至少兩種行為軌跡數(shù)據(jù)進(jìn)行潛在關(guān)系的分析,數(shù)據(jù)多樣化,具有很好的擴(kuò)展性,是通過各種行為軌跡數(shù)據(jù)進(jìn)行分析,并不僅基于已知的人員交互數(shù)據(jù)進(jìn)行分析,能夠更加全面的得到目標(biāo)人員的潛在關(guān)系人員。

      附圖說明

      圖1為本發(fā)明實(shí)施例一提供的人員潛在關(guān)系分析方法流程圖;

      圖2-1為本發(fā)明實(shí)施例一提供的人員潛在關(guān)系分析方法流程圖;

      圖2-2為本發(fā)明實(shí)施例二提供的人員潛在關(guān)系分析方法流程圖;

      圖2-3為本發(fā)明實(shí)施例二提供的人員潛在關(guān)系分析方法中的權(quán)重設(shè)置表一;

      圖2-4為本發(fā)明實(shí)施例二提供的人員潛在關(guān)系分析方法中的權(quán)重設(shè)置表二;

      圖3為本發(fā)明實(shí)施例三提供的人員潛在關(guān)系分析方法中的權(quán)重設(shè)置表三;

      圖4-1為本發(fā)明實(shí)施例四提供的人員潛在關(guān)系分析裝置結(jié)構(gòu)示意圖一;

      圖4-2為本發(fā)明實(shí)施例四提供的人員潛在關(guān)系分析裝置結(jié)構(gòu)示意圖二。

      具體實(shí)施方式

      為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。

      實(shí)施例一:

      本申請(qǐng)實(shí)施例的人員潛在關(guān)系分析方法,如圖1所示,該方法包括:

      S101:獲取各人員的多種行為軌跡數(shù)據(jù);

      在該步驟中,這里的行為軌跡數(shù)據(jù)具體是指各人員具體干做了什么事,這里的兩種行為軌跡數(shù)據(jù)是指做不同類型的事。例如行為軌跡數(shù)據(jù)可以是交通數(shù)據(jù),可以是住宿數(shù)據(jù),可以是通話數(shù)據(jù),也可以社交數(shù)據(jù)和娛樂數(shù)據(jù)等,應(yīng)該理解為只要是做某件事所產(chǎn)生的記錄數(shù)據(jù)能夠體現(xiàn)該人員具體干了什么的數(shù)據(jù)都包含在內(nèi)。由于獲取的數(shù)據(jù)來源比較廣泛以及獲取的量比較大,彼此之間也比較雜,為了便于后續(xù)進(jìn)行分析,可以對(duì)獲取的數(shù)據(jù)進(jìn)行整理,即可以根據(jù)各人員的標(biāo)識(shí)對(duì)其對(duì)應(yīng)的軌跡數(shù)據(jù)進(jìn)行歸類梳理。

      S102:確定目標(biāo)人員,并獲取目標(biāo)人員的多種行為軌跡數(shù)據(jù)中的至少兩種行為軌跡數(shù)據(jù)作為目標(biāo)行為軌跡數(shù)據(jù);

      在該步驟中,目標(biāo)人員是指要對(duì)誰的潛在關(guān)系進(jìn)行的分析的人員。也就說需要的確定目標(biāo)人員具體做的什么事,通過這些具體事產(chǎn)生的行為軌跡數(shù)據(jù)去找與之有關(guān)聯(lián)的行為數(shù)據(jù)。具體的,從總?cè)藛T中確定待分析人員,也即目標(biāo)人員,以及從獲取的中行為軌跡數(shù)據(jù)中提取該目標(biāo)人的多種行為軌跡數(shù)據(jù),從這些多種行為軌跡數(shù)據(jù)中選擇確定至少兩種待分析的行為軌跡數(shù)據(jù)作為目標(biāo)行為軌跡數(shù)據(jù)。

      S103:根據(jù)目標(biāo)行為軌跡數(shù)據(jù)與其他人員對(duì)應(yīng)的行為軌跡分析得到目標(biāo)人員的潛在關(guān)系人員。

      在該步驟中,在確定目標(biāo)人員具體做了什么事,即目標(biāo)人員的至少兩種行為軌跡數(shù)據(jù),通過數(shù)據(jù)去與其他人員的行為軌跡數(shù)據(jù)進(jìn)行即統(tǒng)計(jì)結(jié)果進(jìn)行分析,如果彼此之間的軌跡數(shù)據(jù)相似性大,很顯然彼此存在關(guān)系的可能性就比較大。

      進(jìn)一步,為了合理快速的進(jìn)行數(shù)據(jù)處理,會(huì)對(duì)各種行為數(shù)據(jù)進(jìn)行分類型,即行為軌跡數(shù)據(jù)包括行程類型軌跡數(shù)據(jù)、娛樂類型軌跡數(shù)據(jù)和通信類型軌跡數(shù)據(jù),這里的行程類型軌跡數(shù)據(jù)包括交通類的軌跡數(shù)據(jù)和數(shù)據(jù)類的軌跡數(shù)據(jù)等;娛樂類型軌跡數(shù)據(jù)包括上網(wǎng)類的軌跡數(shù)據(jù)、打球類的軌跡數(shù)據(jù)和唱歌類的娛樂數(shù)據(jù)等;通信類型軌跡數(shù)據(jù)包括電話類的軌跡數(shù)據(jù)和社交類的軌跡數(shù)據(jù)等。

      為了降低數(shù)據(jù)的處理,行為軌跡數(shù)據(jù)包括行為對(duì)應(yīng)的行為特征屬性信息。這里的行為特征屬性信息是指能夠體現(xiàn)人員具體做了什么事一些特征屬性的數(shù)據(jù)。具體的獲取各人員的多種行為軌跡數(shù)據(jù)之前還包括:采集各人員的各種行為軌跡數(shù)據(jù),存入大數(shù)據(jù)平臺(tái);獲取各人員的多種行為軌跡數(shù)據(jù)包括:從大數(shù)據(jù)平臺(tái)提取各人員的多種行為軌跡數(shù)據(jù)。具體的通過各個(gè)數(shù)行為軌跡數(shù)據(jù)記錄平臺(tái)進(jìn)行數(shù)據(jù)源獲取,這里的數(shù)據(jù)源是指能夠體現(xiàn)人員各種行為的數(shù)據(jù);具體可以借助網(wǎng)絡(luò)進(jìn)行傳輸,將各種行為軌跡數(shù)據(jù)匯集起來進(jìn)行存儲(chǔ),便于后期的統(tǒng)計(jì)分析。例如從鐵路火車乘客數(shù)據(jù)系統(tǒng),航班乘客數(shù)據(jù)系統(tǒng),酒店入住數(shù)據(jù)系統(tǒng),網(wǎng)吧上網(wǎng)數(shù)據(jù)系統(tǒng)等去獲取行為軌跡數(shù)據(jù)。這里包含且不限于上述幾個(gè)數(shù)據(jù)存儲(chǔ)系統(tǒng)。

      具體的,采集各人員的各種行為軌跡數(shù)據(jù)包括:建立各類型軌跡數(shù)據(jù)對(duì)應(yīng)的特征屬性的提取模型,獲取數(shù)據(jù)源,根據(jù)提取模型從數(shù)據(jù)源中提取特征屬性;各類型軌跡數(shù)據(jù)對(duì)應(yīng)的特征屬性包括:行程類型軌跡數(shù)據(jù)對(duì)應(yīng)的特征屬性包括行程時(shí)間和行程標(biāo)識(shí);娛樂類型軌跡數(shù)據(jù)對(duì)應(yīng)的特征屬性包括娛樂時(shí)間和地址標(biāo)識(shí);通信類型軌跡數(shù)據(jù)對(duì)應(yīng)的特征數(shù)據(jù)包括通信標(biāo)識(shí)和通信時(shí)間。例如行為軌跡數(shù)據(jù)是交通數(shù)據(jù),那么具體的可以飛機(jī)乘坐數(shù)據(jù)、火車乘坐數(shù)據(jù)和汽車乘坐數(shù)據(jù)等,其的行為特征屬性可以是起點(diǎn)站、終點(diǎn)站、出發(fā)時(shí)間和到達(dá)時(shí)間等信息;行為軌跡數(shù)據(jù)是住宿數(shù)據(jù),那么具體的可以賓館住宿數(shù)據(jù)、旅館住宿數(shù) 據(jù)和農(nóng)家樂住宿數(shù)據(jù)等,其的行為特征屬性可以是入住時(shí)間、離開時(shí)間、入住地點(diǎn)和房號(hào)等信息;行為軌跡數(shù)據(jù)是通話數(shù)據(jù),那么其的行為特征屬性可以是開始通話時(shí)間,結(jié)束通話時(shí)間,通話次數(shù),通話號(hào)碼等信息;行為軌跡數(shù)據(jù)是社交數(shù)據(jù),那么其的行為特征屬性可以是社交軟件類別,聊天開始時(shí)間,聊天結(jié)束時(shí)間和聊天次數(shù)等信息;行為軌跡數(shù)據(jù)是娛樂數(shù)據(jù),那么具體可以上網(wǎng)、打球和玩游戲等,行為軌跡數(shù)據(jù)是娛樂開始時(shí)間、娛樂結(jié)束時(shí)間、娛樂地點(diǎn)和娛樂次數(shù)等信息。

      進(jìn)一步,在根據(jù)目標(biāo)行為軌跡數(shù)據(jù)與其他人員對(duì)應(yīng)的行為軌跡進(jìn)行分析之前還包括:將每個(gè)人的多種行為軌跡數(shù)據(jù)進(jìn)行梳理合并,并按照預(yù)設(shè)排序規(guī)則進(jìn)行排序。具體的將每個(gè)人的多種行為軌跡數(shù)據(jù)進(jìn)行梳理合并包括:根據(jù)預(yù)設(shè)分析條件對(duì)每個(gè)人的多種行為軌跡數(shù)據(jù)進(jìn)行篩選,將每個(gè)人滿足預(yù)設(shè)分析條件的多種行為軌跡數(shù)據(jù)進(jìn)行梳理合。具體的預(yù)設(shè)規(guī)則可以根據(jù)個(gè)人身份識(shí)別信息進(jìn)行時(shí)間排序等。具體的預(yù)設(shè)分析條件可以是分析周期和分析執(zhí)行周期等,即對(duì)那段時(shí)間段內(nèi)的行為軌跡數(shù)據(jù)進(jìn)行分析,以及多久進(jìn)行分析等。

      在上述步驟S103中,為了便于分析統(tǒng)計(jì),是根據(jù)不同類型的行為軌跡數(shù)據(jù),分析建模,將其相同類型的數(shù)據(jù)特征歸納形成固定的行為模型,不同數(shù)據(jù)源系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)和對(duì)應(yīng)的行為模型進(jìn)行映射,將數(shù)據(jù)源中的數(shù)據(jù)結(jié)構(gòu)抽取為具有統(tǒng)一格式的行為模型表。即根據(jù)目標(biāo)行為軌跡數(shù)據(jù)與其他人員對(duì)應(yīng)的行為軌跡分析得到目標(biāo)人員的潛在關(guān)系人員包括:將目標(biāo)行為軌跡數(shù)據(jù)和其他人員對(duì)應(yīng)的行為軌跡分析按照相似度算法進(jìn)行比對(duì),得到各行為相似度對(duì)應(yīng)的權(quán)重值,當(dāng)至少一個(gè)權(quán)重值滿足預(yù)設(shè)潛在條件時(shí),確定對(duì)應(yīng)的人員為目標(biāo)人員的潛在關(guān)系人員。這里的預(yù)設(shè)潛在條件可以根據(jù)多個(gè)行為軌跡的和滿足預(yù)設(shè)權(quán)重和閾值時(shí)就為潛在關(guān)系人員,也可是單個(gè)行為軌跡的權(quán)重滿足預(yù)設(shè)單個(gè)權(quán)重閾值,也 可以需要多個(gè)行為的權(quán)重都滿足預(yù)設(shè)平均權(quán)重閾值等,具體情況可以具體設(shè)置。

      實(shí)施例二:

      本申請(qǐng)實(shí)施例的人員潛在關(guān)系分析方法,如圖2-1所示,該方法包括:

      步驟S201:采集各種行為軌跡相關(guān)的數(shù)據(jù)源;

      在該步驟中,數(shù)據(jù)源可以是鐵路火車乘客數(shù)據(jù),航班乘客數(shù)據(jù),酒店入住數(shù)據(jù),網(wǎng)吧上網(wǎng)數(shù)據(jù)等;具體的數(shù)據(jù)源從相關(guān)的數(shù)據(jù)源系統(tǒng),即外部接入的行為軌跡數(shù)據(jù)存儲(chǔ)系統(tǒng),例如鐵路火車乘客數(shù)據(jù)系統(tǒng),航班乘客數(shù)據(jù)系統(tǒng),酒店入住數(shù)據(jù)系統(tǒng),網(wǎng)吧上網(wǎng)數(shù)據(jù)系統(tǒng)等

      步驟S202:傳輸采集的數(shù)據(jù);

      在該步驟中,該實(shí)施例中的數(shù)據(jù)都為行為軌跡數(shù)據(jù),采集其他接入數(shù)據(jù)源系統(tǒng)數(shù)據(jù)的網(wǎng)絡(luò)傳輸;

      步驟S203:采集各種數(shù)據(jù)源系統(tǒng)中的數(shù)據(jù),即將各人員的各行為軌跡數(shù)據(jù)匯集起來;

      在該步驟中,是根據(jù)不同類型的行為軌跡數(shù)據(jù),分析建模,將其相同類型的數(shù)據(jù)特征歸納形成固定的行為特征屬性模型,不同數(shù)據(jù)源系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)和對(duì)應(yīng)的行為特征屬性模型進(jìn)行映射,將數(shù)據(jù)源中的數(shù)據(jù)結(jié)構(gòu)抽取為具有統(tǒng)一格式的行為特征屬性模型表;根據(jù)行為特征屬性模型和數(shù)據(jù)源數(shù)據(jù)之間的映射關(guān)系,對(duì)數(shù)據(jù)源中的數(shù)據(jù)進(jìn)行清洗,轉(zhuǎn)換,入庫(kù),存儲(chǔ)到大數(shù)據(jù)平臺(tái)。

      步驟S204:綜合分析數(shù)據(jù)采集模塊采集到的各種行為軌跡數(shù)據(jù),產(chǎn)生潛在的關(guān)系人列表和關(guān)系人權(quán)重;

      在該步驟中,要設(shè)置需要分析的人員關(guān)系相關(guān)參數(shù),包括需要分析人員的主鍵(身份證)信息,分析周期,分析執(zhí)行周期,關(guān)系算法權(quán)重,關(guān)系人權(quán)重 閥值等;根據(jù)輸入的被分析關(guān)系人的信息,和分析周期,執(zhí)行分析任務(wù),在分析周期內(nèi)的數(shù)據(jù)中查找被分析人潛在的關(guān)系人和其關(guān)系權(quán)重,并且控制啟停,查看分析任務(wù)的執(zhí)行情況,執(zhí)行進(jìn)度,和狀態(tài)等,以及算法作為可調(diào)度的任務(wù),由任務(wù)管理模塊進(jìn)行監(jiān)控和調(diào)度。具體的關(guān)系人分析算法,使用MapReduce(映射歸約)算法實(shí)現(xiàn),執(zhí)行了兩步MapReduce(映射歸約),第一步首先將所有的數(shù)據(jù)以人員身份證信息作為主鍵,進(jìn)行一次Map(映射),將每個(gè)人的信息全部以身份證信息作為key(鍵),以行為軌跡數(shù)據(jù)作為value(值),進(jìn)行梳理合并,并且按照時(shí)間排序,將輸入的被分析人信息梳理出作為對(duì)照項(xiàng)。第二步,將所有人的行為軌跡和被分析人行為軌跡按照時(shí)間順序逐條分析,計(jì)算權(quán)重值。將權(quán)重超過設(shè)置閥值的數(shù)據(jù)輸出。

      步驟S205:將分析的結(jié)果用于用戶展示,或者作為基礎(chǔ)數(shù)據(jù)提供給其他系統(tǒng)進(jìn)行進(jìn)一步的人員關(guān)系分析。

      在該步驟中,將分析結(jié)果在關(guān)系型數(shù)據(jù)庫(kù)進(jìn)行存儲(chǔ),以供后續(xù)的用戶業(yè)務(wù)使用。以及將分析的結(jié)果用于用戶展示,或者作為基礎(chǔ)數(shù)據(jù)提供給其他系統(tǒng)進(jìn)行進(jìn)一步的分析。

      值得注意的是,本實(shí)例中的被分析人員即分析主體,也即目標(biāo)人員,分析結(jié)果即該分析主體潛在的關(guān)系人;分析周期即分析數(shù)據(jù)的時(shí)間范圍,該參數(shù)可以作用于時(shí)間維度分區(qū)的分析處理;分析執(zhí)行周期,是設(shè)定周期性分析的時(shí)間間隔;關(guān)系算法權(quán)重即對(duì)于不同類型的數(shù)據(jù)關(guān)系緊密度權(quán)重的設(shè)定,可以使用參考值,也可以按照經(jīng)驗(yàn)設(shè)置。具體如圖2-2、2-3和2-4所示,其中,2-2是為交通類型的權(quán)重值設(shè)定,2-3是為住宿類型的權(quán)重值設(shè)定,2-4是為娛樂(上網(wǎng)為例)類型的權(quán)重值設(shè)定。

      實(shí)施例三:

      本申請(qǐng)實(shí)施例的人員潛在關(guān)系分析方法,如圖3所示,該方法包括:

      步驟S301:根據(jù)行為軌跡數(shù)據(jù)結(jié)構(gòu)進(jìn)行建模,按照行為軌跡數(shù)據(jù)類型抽取其行為特征屬性,生成行為特征屬性表,定義不同行為軌跡數(shù)據(jù)結(jié)構(gòu)和行為特征屬性模型之間字段映射關(guān)系;

      步驟S302:按照行為特征屬性表在大數(shù)據(jù)平臺(tái)建表,根據(jù)不同數(shù)據(jù)源數(shù)據(jù)結(jié)構(gòu)和行為特征屬性表字段之間的映射關(guān)系,對(duì)數(shù)據(jù)源數(shù)據(jù)進(jìn)行采集,清洗,入庫(kù);

      步驟S303:設(shè)置任務(wù)相關(guān)屬性,被分析人員的主鍵(身份證)信息,分析周期,分析執(zhí)行周期,關(guān)系算法權(quán)重,關(guān)系人權(quán)重閥值等;

      步驟S304:按照設(shè)置的屬性進(jìn)行關(guān)系人的分析,輸出被分析人潛在的關(guān)系人和其對(duì)應(yīng)的關(guān)系權(quán)重,以及行為軌跡信息;

      步驟S305:將分析結(jié)果存儲(chǔ)到關(guān)系型數(shù)據(jù)庫(kù)中,重新將其轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù);

      步驟S306:從分析結(jié)果存儲(chǔ)模塊中查詢對(duì)應(yīng)的關(guān)系人分析結(jié)果用于用戶界面展示,或者提供給其他系統(tǒng)作為基礎(chǔ)數(shù)據(jù)進(jìn)行進(jìn)一步的分析。

      采用本發(fā)明所述方法,與現(xiàn)有技術(shù)相比:解決了主體分析數(shù)據(jù)類型單一的問題,基于多種不同類型海量行為軌跡數(shù)據(jù)進(jìn)行分析。解決了必須使用存在直接交互(通話,合影,網(wǎng)絡(luò)互動(dòng))的數(shù)據(jù)源分析的局限性。能夠分析出不存在直接或者間接社交接觸的潛在關(guān)系人。模型可以基于多種不同類型的行為軌跡數(shù)據(jù)分析,后續(xù)也可引申到其他領(lǐng)域,擴(kuò)展性好。

      實(shí)施例四:

      本實(shí)例提供的一種人員潛在關(guān)系分析裝置400,如圖4-1所示,包括數(shù)據(jù)獲取模塊401、目標(biāo)確定模塊402和關(guān)系分析模塊403:

      數(shù)據(jù)獲取模塊401用于獲取各人員的多種行為軌跡數(shù)據(jù);

      目標(biāo)確定模塊402用于確定目標(biāo)人員,并獲取目標(biāo)人員的多種行為軌跡數(shù)據(jù)中的至少兩種行為軌跡數(shù)據(jù)作為目標(biāo)行為軌跡數(shù)據(jù);

      關(guān)系分析模塊403用于根據(jù)目標(biāo)行為軌跡數(shù)據(jù)與其他人員對(duì)應(yīng)的行為軌跡分析得到目標(biāo)人員的潛在關(guān)系人員。

      具體的,行為軌跡數(shù)據(jù)包括行程類型軌跡數(shù)據(jù)、娛樂類型軌跡數(shù)據(jù)和通信類型軌跡數(shù)據(jù)。

      本實(shí)例還提供的一種人員潛在關(guān)系分析裝置400,如圖4-2所示,還包括數(shù)據(jù)采集模塊404,數(shù)據(jù)采集模塊用于404在獲取各人員的多種行為軌跡數(shù)據(jù)之前,采集各人員的各種行為軌跡數(shù)據(jù),存入大數(shù)據(jù)平臺(tái);數(shù)據(jù)獲取模塊401還用于從大數(shù)據(jù)平臺(tái)提取各人員的多種行為軌跡數(shù)據(jù)。

      具體的,數(shù)據(jù)采集模塊404還用于建立各類型軌跡數(shù)據(jù)對(duì)應(yīng)的特征屬性的提取模型,獲取數(shù)據(jù)源,根據(jù)提取模型從數(shù)據(jù)源中提取特征屬性;各類型軌跡數(shù)據(jù)對(duì)應(yīng)的特征屬性包括:行程類型軌跡數(shù)據(jù)對(duì)應(yīng)的特征屬性包括行程時(shí)間和行程標(biāo)識(shí);娛樂類型軌跡數(shù)據(jù)對(duì)應(yīng)的特征屬性包括娛樂時(shí)間和地址標(biāo)識(shí);通信類型軌跡數(shù)據(jù)對(duì)應(yīng)的特征數(shù)據(jù)包括通信標(biāo)識(shí)和通信時(shí)間。

      具體的,關(guān)系分析模塊403還用于將目標(biāo)行為軌跡數(shù)據(jù)和其他人員對(duì)應(yīng)的行為軌跡分析按照相似度算法進(jìn)行比對(duì),得到各行為相似度對(duì)應(yīng)的權(quán)重值,當(dāng)至少一個(gè)權(quán)重值滿足預(yù)設(shè)潛在條件時(shí),確定對(duì)應(yīng)的人員為目標(biāo)人員的潛在關(guān)系人員。

      本領(lǐng)域普通技術(shù)人員可以理解上述方法中的全部或部分步驟可通過程序來 指令相關(guān)硬件完成,上述程序可以存儲(chǔ)于計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,如只讀存儲(chǔ)器、磁盤或光盤等??蛇x地,上述實(shí)施例的全部或部分步驟也可以使用一個(gè)或多個(gè)集成電路來實(shí)現(xiàn)。相應(yīng)地,上述實(shí)施例中的各模塊/單元可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的形式實(shí)現(xiàn)。本發(fā)明不限制于任何特定形式的硬件和軟件的結(jié)合。

      以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案而非限制,僅僅參照較佳實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)說明。本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解,可以對(duì)本發(fā)明的技術(shù)方案進(jìn)行修改或者等同替換,而不脫離本發(fā)明技術(shù)方案的精神和范圍,均應(yīng)涵蓋在本發(fā)明的權(quán)利要求范圍當(dāng)中。

      當(dāng)前第1頁1 2 3 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1