一種數(shù)據(jù)處理方法及裝置的制造方法
【專利摘要】本發(fā)明實施例提供一種數(shù)據(jù)處理方法及裝置,其中的方法可包括:獲取待處理的社交行為數(shù)據(jù)流;對所述社交行為數(shù)據(jù)流進行預處理,將所述社交行為數(shù)據(jù)流從數(shù)據(jù)空間轉換為低維特征空間向量;將所述低維特征空間向量輸入至多層級的受限玻爾茲曼機RBM棧進行計算處理,以完成對所述社交行為數(shù)據(jù)流中隱含特征的提取。采用本發(fā)明實施例可通過多層級的RBM棧自動提取出社交行為數(shù)據(jù)流中抽象的隱含特征,提高效率,減小研發(fā)成本。
【專利說明】
一種數(shù)據(jù)處理方法及裝置
技術領域
[0001 ]本發(fā)明涉及通信技術領域,具體涉及一種數(shù)據(jù)處理方法及裝置。
【背景技術】
[0002] 在很多場景下,都需要通過建模來對數(shù)據(jù)進行分類或者預測,而建模技術有一個 重要特點,就是需要提取大量樣本數(shù)據(jù)的特征,而數(shù)學模型主要是負責分類或預測。在模型 的運用不出差錯的前提下,所提取的特征的好壞就成為整個系統(tǒng)性能的瓶頸,因此,通常一 個開發(fā)團隊中更多的人力是投入到發(fā)掘更好的特征上去。
[0003] 傳統(tǒng)的特征提取方法通常是人工設定特征類型并選取特征,這就需要扎實的先驗 知識,而人在特定階段的認知能力是有限的,得到的特征容易片面或者無法構建深層潛在 的特征;針對社交行為數(shù)據(jù)規(guī)模大,維度豐富的問題,現(xiàn)有的方法已經(jīng)不能夠滿足提取有效 特征的任務,因此,人工設計樣本特征不是一個可擴展的途徑。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明實施例提供一種數(shù)據(jù)處理方法及裝置,可通過多層級的RBM( Restricted Boltzmann Machines,受限玻爾茲曼機)棧自動提取出社交行為數(shù)據(jù)流中抽象的隱含特征, 提高效率,減小研發(fā)成本。
[0005] 本發(fā)明第一方面提供一種數(shù)據(jù)處理方法,包括:
[0006] 獲取待處理的社交行為數(shù)據(jù)流;
[0007] 對所述社交行為數(shù)據(jù)流進行預處理,將所述社交行為數(shù)據(jù)流從數(shù)據(jù)空間轉換為低 維特征空間向量;
[0008] 將所述低維特征空間向量輸入至多層級的受限玻爾茲曼機RBM棧進行計算處理, 以完成對所述社交行為數(shù)據(jù)流中隱含特征的提取。
[0009 ]本發(fā)明第二方面提供一種數(shù)據(jù)處理裝置,包括:
[0010] 獲取模塊,用于獲取待處理的社交行為數(shù)據(jù)流;
[0011] 預處理模塊,用于對所述社交行為數(shù)據(jù)流進行預處理,將所述社交行為數(shù)據(jù)流從 數(shù)據(jù)空間轉換為低維特征空間向量;
[0012] 計算模塊,用于將所述低維特征空間向量輸入至多層級的受限玻爾茲曼機RBM棧 進行計算處理,以完成對所述社交行為數(shù)據(jù)流中隱含特征的提取。
[0013] 實施本發(fā)明實施例,具有如下有益效果:
[0014] 本發(fā)明實施例,獲取待處理的社交行為數(shù)據(jù)流,對該社交行為數(shù)據(jù)流進行預處理, 將社交行為數(shù)據(jù)流從數(shù)據(jù)空間轉換為低維特征空間向量,將該低維特征空間向量輸入至多 層級的RBM棧進行計算處理,以完成對社交行為數(shù)據(jù)流中隱含特征的提取,這種方式通過預 處理將社交行為數(shù)據(jù)流轉換為RBM可以識別的低維特征空間向量,并進一步通過RBM自動提 取社交行為數(shù)據(jù)流中抽象的隱含特征,提高效率,減小研發(fā)成本。
【附圖說明】
[0015] 為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn) 有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以 根據(jù)這些附圖獲得其他的附圖。
[0016] 圖1為本發(fā)明實施例提供的一種數(shù)據(jù)處理方法的流程圖;
[0017] 圖2為本發(fā)明實施例提供的一種特征自編碼裝置圖;
[0018]圖3為本發(fā)明實施例提供的一種預處理裝置圖;
[0019] 圖4為本發(fā)明實施例提供的一種輸出矩陣格式示意圖;
[0020] 圖5為本發(fā)明實施例提供的一種單個RBM結構示意圖;
[0021 ]圖6為本發(fā)明實施例提供的一種RBM枝的結構不意圖;
[0022]圖7為本發(fā)明實施例提供的一種數(shù)據(jù)處理裝置的結構示意圖;
[0023]圖8為本發(fā)明實施例提供的一種預處理模塊的結構示意圖。
【具體實施方式】
[0024]下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完 整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;?本發(fā)明中的實施例,本領域普通技術人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他 實施例,都屬于本發(fā)明保護的范圍。
[0025] 下面將結合附圖1-附圖6,對本發(fā)明實施例提供的數(shù)據(jù)處理方法進行詳細介紹。
[0026] 請參照圖1,為本發(fā)明實施例提供的一種數(shù)據(jù)處理方法的流程圖;該方法可包括以 下步驟S100-步驟S102。
[0027] S100,獲取待處理的社交行為數(shù)據(jù)流;
[0028] 本發(fā)明實施例中,社交行為數(shù)據(jù)流為流式數(shù)據(jù),該數(shù)據(jù)流為系統(tǒng)采集的各個用戶 在各種客戶端上進行的社交行為數(shù)據(jù),比如,各個用戶在網(wǎng)絡應用進行的分享行為、加入興 趣愛好群組行為以及互動行為等行為數(shù)據(jù),和/或各個用戶利用各種支付應用進行的支付 行為數(shù)據(jù),以及各個用戶在各種購物應用進行的購物行為數(shù)據(jù)等等,本發(fā)明對此不作限定。 各種社交行為數(shù)據(jù)根據(jù)行為發(fā)生時間構成數(shù)據(jù)流。
[0029] 需要說明的是,該社交行為數(shù)據(jù)流中包括多個類型的社交行為數(shù)據(jù),可以根據(jù)社 交行為數(shù)據(jù)的功能進行類型劃分,例如,社交行為數(shù)據(jù)流可以包括互動類型的社交行為數(shù) 據(jù),支付類型的社交行為數(shù)據(jù),游戲類型的社交行為數(shù)據(jù)等等。
[0030] S101,對所述社交行為數(shù)據(jù)流進行預處理,將所述社交行為數(shù)據(jù)流從數(shù)據(jù)空間轉 換為低維特征空間向量;
[0031] 本發(fā)明實施例中,將該社交行為數(shù)據(jù)流進行預處理,從而獲得該社交行為數(shù)據(jù)流 的低維特征空間向量,RBM只能夠識別低維特征空間向量,無法識別原始數(shù)據(jù),因此需要進 行該轉換,可選的,該低維特征空間向量包括但不限于社交行為數(shù)據(jù)發(fā)生的次數(shù)、天數(shù)等 等。
[0032] 可選的,在對社交行為數(shù)據(jù)流從數(shù)據(jù)空間轉換為低維特征空間向量之前,還包括 以下步驟S10;
[0033] S10,將所述社交行為數(shù)據(jù)流進行分類處理,獲得所述多個類型的社交行為數(shù)據(jù) 流;
[0034] 具體的,社交行為數(shù)據(jù)流中包括多個類型的社交行為數(shù)據(jù),各個類型的社交行為 數(shù)據(jù)之間根據(jù)時間交叉排列,形成數(shù)據(jù)流,該社交行為數(shù)據(jù)流中各個社交行為數(shù)據(jù)均標識 有產(chǎn)生該社交行為數(shù)據(jù)的應用標識以及該社交行為數(shù)據(jù)的內(nèi)容,系統(tǒng)根據(jù)產(chǎn)生該社交行為 數(shù)據(jù)應用標識以及社交行為數(shù)據(jù)的內(nèi)容,可以將該社交行為數(shù)據(jù)進行類型的劃分處理,比 如,某個網(wǎng)絡應用產(chǎn)生的社交行為數(shù)據(jù)為用戶發(fā)送評論的行為,則將該社交行為數(shù)據(jù)確定 為互動類型的社交行為數(shù)據(jù)。需要說明的是,將屬于某一個類型的所有社交行為數(shù)據(jù)按照 發(fā)生時間排列,可以形成該類型的社交行為數(shù)據(jù)流。
[0035] 進一步可選的,將該社交行為數(shù)據(jù)流進行預處理可以包括以下步驟S11;
[0036] S11,將所述多個類型的社交行為數(shù)據(jù)流中每個類型的社交行為數(shù)據(jù)流進行預處 理,獲得歸一化矩陣,以實現(xiàn)將所述社交行為數(shù)據(jù)流從數(shù)據(jù)空間轉換為低維特征空間向量;
[0037] 具體的,將待處理的社交行為數(shù)據(jù)流中多個類型的社交行為數(shù)據(jù)流中每個類型的 社交行為數(shù)據(jù)流進行預處理,獲得歸一化矩陣,該歸一化矩陣即是低維特征空間向量,可選 的,該歸一化矩陣中包括該多個類型社交行為數(shù)據(jù)中每個類型社交行為數(shù)據(jù)的歸一化統(tǒng)計 量,該預處理過程可以包括對每個類型的社交行為數(shù)據(jù)流進行統(tǒng)計處理以及歸一化處理。 [0038]如圖3所示,數(shù)據(jù)預處理模塊由若干子模塊組成,如圖所示;數(shù)據(jù)預處理模塊輸入 為社交行為的流式數(shù)據(jù),輸出為經(jīng)過變換的歸一化矩陣M;數(shù)據(jù)預處理模塊包含觀測裝置子 模塊、歸一化裝置子模塊以及重構子模塊。
[0039] 可選的,將該多個類型的社交行為數(shù)據(jù)流中每個類型的社交行為數(shù)據(jù)流進行預處 理可以包括以下步驟:
[0040] 步驟一,針對每個類型的所述社交行為數(shù)據(jù)流,采用第一觀測函數(shù),對所述社交行 為數(shù)據(jù)流進行第一觀測處理,獲得該類型社交行為數(shù)據(jù)對應的第一觀測值,所述第一觀測 函數(shù)為該類型社交行為數(shù)據(jù)的統(tǒng)計函數(shù)。
[0041] 具體的,針對每個類型的社交行為數(shù)據(jù)流,采用第一觀測函數(shù)對社交行為數(shù)據(jù)流 進行第一觀測處理,需要說明的是,一個類型的社交行為數(shù)據(jù)流采用一種第一觀測函數(shù)進 行處理,如圖3所示,社交行為數(shù)據(jù)流進入預處理模塊,進行分類處理后,一個類型的社交行 為數(shù)據(jù)流對應一個第一觀測函數(shù)f,如圖所示,第一觀測函數(shù)的個數(shù)存在η個,分別是f^fs、 ?ν··?·η。一個類型的社交行為數(shù)據(jù)流進行第一觀測處理后,可以獲得該類型社交行為數(shù)據(jù)對 應的第一觀測值,即是第一觀測函數(shù)f輸出的為對社交行為數(shù)據(jù)流進行處理后的第一觀測 值。
[0042] 如圖3所示,觀測裝置子模塊F包含一組觀測函數(shù)(心3233,一匕)^支持縱向擴 展,其中f n為對流式數(shù)據(jù)在特定功能點(特定類型社交行為數(shù)據(jù))的觀測函數(shù),fn輸出值為觀 測點的觀測值,包含但不限于特定類型社交行為的次數(shù)、天數(shù)等觀測值。
[0043]可選的,第一觀測函數(shù)為統(tǒng)計函數(shù),第一觀測值為經(jīng)過統(tǒng)計函數(shù)處理后的統(tǒng)計量, 每個類型的第一觀測函數(shù)可以不同,某個類型的社交行為數(shù)據(jù)流經(jīng)過第一觀測函數(shù)處理后 得到的第一觀測值即是該類型社交行為數(shù)據(jù)的統(tǒng)計量。
[0044]步驟二,針對每個類型的所述社交行為的第一觀測值,采用第二觀測函數(shù),對所述 社交行為數(shù)據(jù)的第一觀測值進行第二觀測處理,獲得該類型社交行為數(shù)據(jù)對應的第二觀測 值,所述第二觀測函數(shù)為該類型社交行為數(shù)據(jù)的歸一化函數(shù)。
[0045] 具體的,針對每個類型的社交行為數(shù)據(jù)的第一觀測值,可以進一步采用第二觀測 函數(shù),對該類型的社交行為數(shù)據(jù)的統(tǒng)計量進行第二觀測處理,獲得該類型社交行為數(shù)據(jù)對 應的第二觀測值。一個類型的社交行為數(shù)據(jù)對應一種第二觀測函數(shù),如圖3所示,一個類型 的社交行為數(shù)據(jù)流通過一種第一觀測函數(shù)處理之后,獲得該類型社交行為數(shù)據(jù)的第一觀測 值,再將該類型社交行為數(shù)據(jù)的第一觀測值輸入一種第二觀測函數(shù),得到該類型社交行為 數(shù)據(jù)的第二觀測值,即是一個類型的社交行為數(shù)據(jù)流輸入處理后,得到一種第二觀測值。
[0046] 可選的,該第二觀測函數(shù)可以是該類型社交行為數(shù)據(jù)的歸一化函數(shù),第二觀測值 為該類型社交行為數(shù)據(jù)的歸一化統(tǒng)計量。
[0047] 如圖3所示,歸一化裝置子模塊F'包含一組觀測函數(shù)出',5',6',~匕')^'支持 縱向擴展,其中f n '為特定觀測點歸一化函數(shù),接收觀測裝置F輸出的第一觀測值,輸出歸一 化后的第二觀測值;f'η與f n的轉換關系如下所示:
[0049] 步驟三,將所述多個類型中每個類型社交行為數(shù)據(jù)的第二觀測值重構形成歸一化 矩陣。
[0050] 具體的,將該多個類型中每個類型社交行為數(shù)據(jù)的第二觀測值形成歸一化矩陣, 如圖3所示,所有類型的社交行為數(shù)據(jù)經(jīng)過第一觀測函數(shù)以及第二觀測函數(shù)處理后,輸入重 構子模塊進行歸一化矩陣的形成,最后輸出歸一化矩陣M。
[0051] 進一步可選的,所述將所述多個類型中每個類型社交行為數(shù)據(jù)的第二觀測值重構 形成歸一化矩陣,包括:
[0052]以所述多個類型的類型數(shù)量為矩陣的列,將所述多個類型中每個類型社交行為數(shù) 據(jù)的第二觀測值重構形成歸一化矩陣。
[0053]具體的,在將多個類型中每個類型的社交行為數(shù)據(jù)的第二觀測值重構形成歸一化 矩陣,形成方式可以有多種,以下以兩種可選的實施方式作為舉例說明:
[0054] 作為一種可選的實施方式,以所述多個類型的類型數(shù)量為矩陣的列,以所述不同 采集周期的周期數(shù)量為矩陣的行,將所述多個類型中每個類型社交行為數(shù)據(jù)的第二觀測值 重構形成歸一化矩陣。
[0055] 或者,作為另一種可選的實施方式,以所述多個類型的類型數(shù)量為矩陣的列,形成 所述不同采集周期的周期數(shù)量個數(shù)的歸一化矩陣,一種采集周期中所述多個類型的每個類 型社交行為數(shù)據(jù)的第二觀測值重構形成一個歸一化矩陣。
[0056] 具體的,如圖3所示,重構子模塊接收到歸一化裝置F'輸出歸一化后的η個第二觀 測值,將這些第二觀測值按照觀測函數(shù)的編號,序列化成一個η維向量,將此η維向量轉換為 歸一化矩陣。
[0057]重構模塊在生成歸一化矩陣時通常采用以下方式,若社交行為數(shù)據(jù)流中包含多個 不同采集周期采集的社交行為數(shù)據(jù),將社交行為數(shù)據(jù)流按照一定周期(例如秒、分、時、日、 周、月等)采集到的多組不同時間維度的歸一化統(tǒng)計量序列化向量;圖4給出了一種輸出的 歸一化矩陣的格式,行表示不同采集周期維度,列表示不同的類型,即是該歸一化矩陣的行 數(shù)為不同采集周期的數(shù)量,例如第一行為以周為采集周期采集的數(shù)據(jù)形成的η維向量,第二 行為以月為采集周期采集的數(shù)據(jù)形成的η維向量,第三行為以周為采集周期采集的數(shù)據(jù)形 成的η維向量,每一行都有η列,每一列代表一個類型。
[0058]可選的,也可以將不同采集周期的數(shù)據(jù)重構到多個不同的矩陣中,如以天為采集 周期的向量序列化到一個歸一化矩陣中,以月為采集周期的向量序列化到另外一個歸一化 矩陣中。
[0059] S102,將所述低維特征空間向量輸入至多層級的受限玻爾茲曼機RBM棧進行計算 處理,以完成對所述社交行為數(shù)據(jù)流中隱含特征的提取。
[0060] 可選的,所述將所述低維特征空間向量輸入至多層級的受限玻爾茲曼機RBM進行 計算處理,包括:
[0061] 每次向所述多層級的RBM棧輸入所述歸一化矩陣的一行元素,一個元素對應一個 輸入端;
[0062] 通過串聯(lián)的所述多個RBM逐層對所述歸一化矩陣進行計算處理,以提取所述社交 行為數(shù)據(jù)流中的隱含特征。
[0063]本發(fā)明實施例中,隱含特征可以包括社交行為數(shù)據(jù)流中隱含的規(guī)律,該規(guī)律能夠 反映社交行為數(shù)據(jù)的本質,通過提取該隱含特征可以更加有利于數(shù)據(jù)建模的準確性。
[0064] 本發(fā)明實施例中,所述多層級的RBM棧由多個RBM串聯(lián)構成。如圖6所示,RBM棧由多 個(RBM1、RBM2、RBM3、RBM4 · · · RBMn)串聯(lián)構成。
[0065]數(shù)據(jù)預處理模塊將原始數(shù)據(jù)轉換到RBM可以識別的低維特征空間;該多層級的RBM 棧接收數(shù)據(jù)預處理模塊輸出的低維特征空間向量,圖5展示了單個RBM的結構。RBM是一類具 有兩層結構、對稱連接且無自反饋的隨機神經(jīng)網(wǎng)絡模型,層間全連接,層內(nèi)無連接。每次向 所述多層級的RBM棧輸入歸一化矩陣的一行元素,其中一行元素中的一個元素對應一個輸 入端,如圖5所示的i 1~in;通過串聯(lián)的所述多個RBM逐層對所述歸一化矩陣的每一行元素進 行計算處理,以提取所述社交行為數(shù)據(jù)流中的隱含特征,即是歸一化矩陣的每一行元素均 會經(jīng)過該多層級的RBM棧逐層處理。
[0066]本發(fā)明實施例將基于深度學習層次組件的特征變量表達方法應用多層堆疊的RBM 棧,將社交行為數(shù)據(jù)轉化為深度學習網(wǎng)絡可以識別的數(shù)據(jù)序列,利用特征編碼器(上述的預 處理模塊和多層級的RBM棧)將社交行為數(shù)據(jù)從數(shù)據(jù)空間映射至特征空間,自動地發(fā)現(xiàn)隱藏 在數(shù)據(jù)中的模式和規(guī)律,提取抽象的隱含特征,自動完成特征表達的任務。
[0067]深度學習是機器學習研究中的一個新的領域,其動機在于建立、模擬人腦進行分 析學習的神經(jīng)網(wǎng)絡,它模仿人腦的機制來解釋數(shù)據(jù),例如圖像,聲音和文本。深度學習是無 監(jiān)督學習的一種。深度學習的概念源于人工神經(jīng)網(wǎng)絡的研究。含多隱層的多層感知器就是 一種深度學習結構。
[0068]深度學習通過組合低層特征形成更加抽象的高層表示屬性類別或特征,以發(fā)現(xiàn)數(shù) 據(jù)的分布式特征表示。大數(shù)據(jù)中蘊含的寶貴價值成為人們處理大數(shù)據(jù)的驅動力,利用大數(shù) 據(jù)技術可以搜集更多的數(shù)據(jù)維度來加強弱相關數(shù)據(jù)的描述能力。深度學習通過構建具有很 多隱層的機器學習模型和海量的訓練數(shù)據(jù),來學習更有用的特征,從而最終提升分類或預 測的準確性。即通過"深度模型"的手段,來實現(xiàn)"特征學習"是目的。
[0069] RBM是構建深度學習模型的基礎組件;基于RBM組成的網(wǎng)絡采用無監(jiān)督學習的方 法,最大可能的擬合輸入數(shù)據(jù)。通過逐層特征變換,將樣本在原空間的特征表示變換到一個 新特征空間,從而使分類或預測更加容易。與人工構造特征的方法相比,利用深度學習層次 組件來學習大數(shù)據(jù)特征,更能夠刻畫數(shù)據(jù)的豐富內(nèi)在信息。
[0070] 本發(fā)明實施例基于對比散度的快速學習算法訓練各層RBM;其訓練過程如下:第一 步充分訓練第一個RBM,固定第一個RBM的權重和偏移量;第二步使用其隱性神經(jīng)元的狀態(tài), 作為第二個RBM的輸入向量;第三步充分訓練第二個RBM后,將第二個RBM堆疊在第一個RBM 的上方;如圖6所示,由若干個RBM堆疊而成的RMB棧輸出經(jīng)過無監(jiān)督學習得到隱含特征。 [0071]本發(fā)明實施例,獲取待處理的社交行為數(shù)據(jù)流,對該社交行為數(shù)據(jù)流進行預處理, 將社交行為數(shù)據(jù)流從數(shù)據(jù)空間轉換為低維特征空間向量,將該低維特征空間向量輸入至多 層級的RBM棧進行計算處理,以完成對社交行為數(shù)據(jù)流中隱含特征的提取,這種方式通過預 處理將社交行為數(shù)據(jù)流轉換為RBM可以識別的低維特征空間向量,并進一步通過RBM自動提 取社交行為數(shù)據(jù)流中抽象的隱含特征,提高效率,減小研發(fā)成本。
[0072] 實現(xiàn)本發(fā)明技術方案的特征自編碼器如圖2所示,特征自編碼器主要包含數(shù)據(jù)預 處理器和多層級的RBM棧組成;預處理器主要包含預處理模塊,預處理模塊用于對社交行為 數(shù)據(jù)流進行預處理,具體結構可以采用圖3所示的結構。RBM棧由若干堆疊的RBM組成;主要 采用深度學習算法對預處理器輸出的數(shù)據(jù)進行計算,得到社交行為數(shù)據(jù)流的隱含特征,該 隱含特征用于數(shù)據(jù)建模使用。
[0073] 下面將結合附圖7-附圖8,對本發(fā)明實施例提供的一種數(shù)據(jù)處理裝置進行詳細介 紹。
[0074]請參照圖7,為本發(fā)明實施例提供的一種數(shù)據(jù)處理裝置的結構示意圖,如圖所示, 該數(shù)據(jù)處理裝置包括獲取模塊100、預處理模塊101以及計算模塊102。
[0075]獲取模塊100,用于獲取待處理的社交行為數(shù)據(jù)流。
[0076]本發(fā)明實施例中,社交行為數(shù)據(jù)流為流式數(shù)據(jù),該數(shù)據(jù)流為系統(tǒng)采集的各個用戶 在各種客戶端上進行的社交行為數(shù)據(jù),比如,各個用戶在網(wǎng)絡應用進行的分享行為、加入興 趣愛好群組行為以及互動行為等行為數(shù)據(jù),和/或各個用戶利用各種支付應用進行的支付 行為數(shù)據(jù),以及各個用戶在各種購物應用進行的購物行為數(shù)據(jù)等等,本發(fā)明對此不作限定。 各種社交行為數(shù)據(jù)根據(jù)行為發(fā)生時間構成數(shù)據(jù)流。
[0077]需要說明的是,該社交行為數(shù)據(jù)流中包括多個類型的社交行為數(shù)據(jù),可以根據(jù)社 交行為數(shù)據(jù)的功能進行類型劃分,例如,社交行為數(shù)據(jù)流可以包括互動類型的社交行為數(shù) 據(jù),支付類型的社交行為數(shù)據(jù),游戲類型的社交行為數(shù)據(jù)等等。
[0078]預處理模塊101,用于對所述社交行為數(shù)據(jù)流進行預處理,將所述社交行為數(shù)據(jù)流 從數(shù)據(jù)空間轉換為低維特征空間向量。
[0079] 本發(fā)明實施例中,將該社交行為數(shù)據(jù)流進行預處理,從而獲得該社交行為數(shù)據(jù)流 的低維特征空間向量,RBM只能夠識別低維特征空間向量,無法識別原始數(shù)據(jù),因此需要進 行該轉換,可選的,該低維特征空間向量包括但不限于社交行為數(shù)據(jù)發(fā)生的次數(shù)、天數(shù)等 等。
[0080] 可選的,本發(fā)明實施例的數(shù)據(jù)處理裝置還包括分類模塊103。
[0081] 分類模塊103,用于將所述社交行為數(shù)據(jù)流進行分類處理,獲得多個類型的社交行 為數(shù)據(jù)流。
[0082] 具體的,社交行為數(shù)據(jù)流中包括多個類型的社交行為數(shù)據(jù),各個類型的社交行為 數(shù)據(jù)之間根據(jù)時間交叉排列,形成數(shù)據(jù)流,該社交行為數(shù)據(jù)流中各個社交行為數(shù)據(jù)均標識 有產(chǎn)生該社交行為數(shù)據(jù)的應用標識以及該社交行為數(shù)據(jù)的內(nèi)容,系統(tǒng)根據(jù)產(chǎn)生該社交行為 數(shù)據(jù)應用標識以及社交行為數(shù)據(jù)的內(nèi)容,可以將該社交行為數(shù)據(jù)進行類型的劃分處理,比 如,某個網(wǎng)絡用產(chǎn)生的社交行為數(shù)據(jù)為用戶發(fā)送評論的行為,則將該社交行為數(shù)據(jù)確定為 互動類型的社交行為數(shù)據(jù)。需要說明的是,將屬于某一個類型的所有社交行為數(shù)據(jù)按照發(fā) 生時間排列,可以形成該類型的社交行為數(shù)據(jù)流。
[0083] 所述預處理模塊101具體用于將所述多個類型的社交行為數(shù)據(jù)流中每個類型的社 交行為數(shù)據(jù)流進行預處理,獲得歸一化矩陣,以實現(xiàn)將所述社交行為數(shù)據(jù)流從數(shù)據(jù)空間轉 換為低維特征空間向量。
[0084] 具體的,將待處理的社交行為數(shù)據(jù)流中多個類型的社交行為數(shù)據(jù)流中每個類型的 社交行為數(shù)據(jù)流進行預處理,獲得歸一化矩陣,可選的,該歸一化矩陣中包括該多個類型社 交行為數(shù)據(jù)中每個類型社交行為數(shù)據(jù)的歸一化統(tǒng)計量,該預處理過程可以包括對每個類型 的社交行為數(shù)據(jù)流進行統(tǒng)計處理以及歸一化處理。
[0085]如圖3所示,數(shù)據(jù)預處理模塊由若干子模塊組成,如圖所示;數(shù)據(jù)預處理裝置輸入 為社交行為的流式數(shù)據(jù),輸出為經(jīng)過變換的歸一化矩陣;數(shù)據(jù)預處理模塊包含觀測裝置子 模塊、歸一化裝置子模塊以及重構子模塊。
[0086] 進一步可選的,如圖8所示,預處理模塊101可以包括觀測裝置子模塊1010、歸一化 裝置子模塊1 〇 11以及重構子模塊1 〇 12。
[0087] 觀測裝置子模塊1010,用于針對每個類型的所述社交行為數(shù)據(jù)流,采用第一觀測 函數(shù),對所述社交行為數(shù)據(jù)流進行第一觀測處理,獲得該類型社交行為數(shù)據(jù)對應的第一觀 測值,所述第一觀測函數(shù)為該類型社交行為數(shù)據(jù)的統(tǒng)計函數(shù)。
[0088] 具體的,針對每個類型的社交行為數(shù)據(jù)流,采用第一觀測函數(shù)對社交行為數(shù)據(jù)流 進行第一觀測處理,需要說明的是,一個類型的社交行為數(shù)據(jù)流采用一種第一觀測函數(shù)進 行處理,如圖3所示,社交行為數(shù)據(jù)流進入預處理模塊,進行分類處理后,一個類型的社交行 為數(shù)據(jù)流對應一個第一觀測函數(shù)f,如圖所示,第一觀測函數(shù)的個數(shù)存在η個,分別是f^fs、 ?ν··?·η。一個類型的社交行為數(shù)據(jù)流進行第一觀測處理后,可以獲得該類型社交行為數(shù)據(jù)對 應的第一觀測值,即是第一觀測函數(shù)f輸出的為對社交行為數(shù)據(jù)流進行處理后的第一觀測 值。
[0089] 如圖3所示,觀測裝置子模塊F包含一組觀測函數(shù)(心3233,一匕)^支持縱向擴 展,其中f n為對流式數(shù)據(jù)在特定功能點(特定類型社交行為數(shù)據(jù))的觀測函數(shù),fn輸出值為觀 測點的觀測值,包含但不限于特定類型社交行為的次數(shù)、天數(shù)等觀測值。
[0090] 可選的,第一觀測函數(shù)為統(tǒng)計函數(shù),第一觀測值為經(jīng)過統(tǒng)計函數(shù)處理后的統(tǒng)計量, 每個類型的第一觀測函數(shù)可以不同,某個類型的社交行為數(shù)據(jù)流經(jīng)過第一觀測函數(shù)處理后 得到的第一觀測值即是該類型社交行為數(shù)據(jù)的統(tǒng)計量。
[0091] 第二處理子單元10111,用于針對每個類型的所述社交行為數(shù)據(jù)的第一觀測值,采 用第二觀測函數(shù),對所述社交行為數(shù)據(jù)的第一觀測值進行第二觀測處理,獲得該類型社交 行為數(shù)據(jù)對應的第二觀測值,所述第二觀測函數(shù)為該類型社交行為數(shù)據(jù)的歸一化函數(shù);
[0092] 具體的,針對每個類型的社交行為數(shù)據(jù)的第一觀測值,可以進一步采用第二觀測 函數(shù),對該類型的社交行為數(shù)據(jù)的統(tǒng)計量進行第二觀測處理,獲得該類型社交行為數(shù)據(jù)對 應的第二觀測值。一個類型的社交行為數(shù)據(jù)對應一種第二觀測函數(shù),如圖3所示,一個類型 的社交行為數(shù)據(jù)流通過一種第一觀測函數(shù)處理之后,獲得該類型社交行為數(shù)據(jù)的第一觀測 值,再將該類型社交行為數(shù)據(jù)的第一觀測值輸入一種第二觀測函數(shù),得到該類型社交行為 數(shù)據(jù)的第二觀測值,即是一個類型的社交行為數(shù)據(jù)流輸入處理后,得到一種第二觀測值。
[0093] 可選的,該第二觀測函數(shù)可以是該類型社交行為數(shù)據(jù)的歸一化函數(shù),第二觀測值 為該類型社交行為數(shù)據(jù)的歸一化統(tǒng)計量。
[0094] 如圖3所示,歸一化裝置子模塊F '包含一組觀測函數(shù)(f i ',f 2 ',f 3 ',…fn '),F(xiàn) '支持 縱向擴展,其中f n '為特定觀測點歸一化函數(shù),接收觀測裝置F輸出的第一觀測值,輸出歸一 化后的第二觀測值;fn '與fn的轉換關系如下所示:
[0096]重構子模塊1012,用于將所述多個類型中每個類型社交行為數(shù)據(jù)的第二觀測值重 構形成歸一化矩陣。
[0097]具體的,將該多個類型中每個類型社交行為數(shù)據(jù)的第二觀測值重構形成歸一化矩 陣,如圖3所示,所有類型的社交行為數(shù)據(jù)經(jīng)過第一觀測函數(shù)以及第二觀測函數(shù)處理后,輸 入重構子模塊進行歸一化矩陣的形成,最后輸出歸一化矩陣M。
[0098]所述重構子模塊1012具體用于以所述多個類型的類型數(shù)量為矩陣的列,將所述多 個類型中每個類型社交行為數(shù)據(jù)的第二觀測值重構形成歸一化矩陣。
[0099] 以所述多個類型的類型數(shù)量為矩陣的列,將所述多個類型中每個類型社交行為數(shù) 據(jù)的第二觀測值重構形成歸一化矩陣。
[0100] 具體的,在將多個類型中每個類型的社交行為數(shù)據(jù)的第二觀測值重構形成歸一化 矩陣,形成方式可以有多種,以下以兩種可選的實施方式作為舉例說明:
[0101 ]作為一種可選的實施方式,以所述多個類型的類型數(shù)量為矩陣的列,以所述不同 采集周期的周期數(shù)量為矩陣的行,將所述多個類型中每個類型社交行為數(shù)據(jù)的第二觀測值 重構形成歸一化矩陣;或者,
[0102] 作為另一種可選的實施方式,以所述多個類型的類型數(shù)量為矩陣的列,形成所述 不同采集周期的周期數(shù)量個數(shù)的歸一化矩陣,一種采集周期中所述多個類型的每個類型社 交行為數(shù)據(jù)的第二觀測值重構形成一個歸一化矩陣。
[0103] 具體的,如圖3所示,重構子模塊接收到歸一化裝置F'輸出歸一化后的η個第二觀 測值,將這些第二觀測值按照觀測函數(shù)的編號,序列化成一個η維向量,將此η維向量轉換為 歸一化矩陣。
[0104] 重構模塊在生成歸一化矩陣時通常采用以下方式,若社交行為數(shù)據(jù)流中包含多個 不同采集周期采集的社交行為數(shù)據(jù),將社交行為數(shù)據(jù)流按照一定周期(例如秒、分、時、日、 周、月等)采集到的多組不同時間維度的歸一化統(tǒng)計量序列化向量;圖4給出了一種輸出的 歸一化矩陣的格式,行表示不同采集周期維度,列表示不同的類型,即是該歸一化矩陣的行 數(shù)為不同采集周期的數(shù)量,例如第一行為以周為采集周期采集的數(shù)據(jù)形成的η維向量,第二 行為以月為采集周期采集的數(shù)據(jù)形成的η維向量,第三行為以周為采集周期采集的數(shù)據(jù)形 成的η維向量,每一行都有η列,每一列代表一個類型。
[0105] 可選的,也可以將不同采集周期的數(shù)據(jù)重構到多個不同的矩陣中,如以天為采集 周期的向量序列化到一個歸一化矩陣中,以月為采集周期的向量序列化到另外一個歸一化 矩陣中。
[0106] 計算模塊102具體用于所述低維特征空間向量輸入至多層級的受限玻爾茲曼機 RBM進行計算處理,以完成對所述社交行為數(shù)據(jù)流中隱含特征的提取。
[0107] 可選的,所述將所述低維特征空間向量輸入至多層級的受限玻爾茲曼機RBM棧進 行計算處理,包括:
[0108] 每次向所述多層級的RBM棧輸入所述歸一化矩陣的一行元素,一個元素對應一個 輸入端;
[0109] 通過串聯(lián)的所述多個RBM逐層對所述歸一化矩陣進行計算處理,以提取所述社交 行為數(shù)據(jù)流中的隱含特征。
[0110] 本發(fā)明實施例中,隱含特征可以包括社交行為數(shù)據(jù)流中隱含的規(guī)律,該規(guī)律能夠 反映社交行為數(shù)據(jù)的本質,通過提取該隱含特征可以更加有利于數(shù)據(jù)建模的準確性。
[0111] 本發(fā)明實施例中,所述多層級的受限玻爾茲曼機(Restricted Boltzmann Mach ine s,RBM)棧由多個RBM串聯(lián)構成。如圖6所示,RBM棧由多個(RBM 1、RBM2、RBM3、 RBM4. . .RBMn)串聯(lián)構成。
[0112]數(shù)據(jù)預處理模塊將原始數(shù)據(jù)轉換到RBM可以識別的低維特征空間;該多層級的RBM 棧接收數(shù)據(jù)預處理模塊輸出的低維特征空間向量,圖5展示了單個RBM的結構。RBM是一類具 有兩層結構、對稱連接且無自反饋的隨機神經(jīng)網(wǎng)絡模型,層間全連接,層內(nèi)無連接。每次向 所述多層級的RBM棧輸入歸一化矩陣的一行元素,其中一行元素中的一個元素對應一個輸 入端,如圖5所示的i 1~in;通過串聯(lián)的所述多個RBM逐層對所述歸一化矩陣的每一行元素進 行計算處理,以提取所述社交行為數(shù)據(jù)流中的隱含特征,即是歸一化矩陣的每一行元素均 會經(jīng)過該多層級RBM棧逐層處理。
[0113]本發(fā)明實施例將基于深度學習層次組件的特征變量表達方法應用多層堆疊的 RBM,將社交行為數(shù)據(jù)轉化為深度學習網(wǎng)絡可以識別的數(shù)據(jù)序列,利用特征編碼器(上述的 預處理模塊和多層級的RBM棧)將社交行為數(shù)據(jù)從數(shù)據(jù)空間映射至特征空間,自動地發(fā)現(xiàn)隱 藏在數(shù)據(jù)中的模式和規(guī)律,提取抽象的隱含特征,自動完成特征表達的任務。
[0114]深度學習是機器學習研究中的一個新的領域,其動機在于建立、模擬人腦進行分 析學習的神經(jīng)網(wǎng)絡,它模仿人腦的機制來解釋數(shù)據(jù),例如圖像,聲音和文本。深度學習是無 監(jiān)督學習的一種。深度學習的概念源于人工神經(jīng)網(wǎng)絡的研究。含多隱層的多層感知器就是 一種深度學習結構。
[0115] 深度學習通過組合低層特征形成更加抽象的高層表示屬性類別或特征,以發(fā)現(xiàn)數(shù) 據(jù)的分布式特征表示。大數(shù)據(jù)中蘊含的寶貴價值成為人們處理大數(shù)據(jù)的驅動力,利用大數(shù) 據(jù)技術可以搜集更多的數(shù)據(jù)維度來加強弱相關數(shù)據(jù)的描述能力。深度學習通過構建具有很 多隱層的機器學習模型和海量的訓練數(shù)據(jù),來學習更有用的特征,從而最終提升分類或預 測的準確性。即通過"深度模型"的手段,來實現(xiàn)"特征學習"是目的。
[0116] RBM是構建深度學習模型的基礎組件;基于RBM組成的網(wǎng)絡采用無監(jiān)督學習的方 法,最大可能的擬合輸入數(shù)據(jù)。通過逐層特征變換,將樣本在原空間的特征表示變換到一個 新特征空間,從而使分類或預測更加容易。與人工構造特征的方法相比,利用深度學習層次 組件來學習大數(shù)據(jù)特征,更能夠刻畫數(shù)據(jù)的豐富內(nèi)在信息。
[0117]本發(fā)明實施例基于對比散度的快速學習算法訓練各層RBM;其訓練過程如下:第一 步充分訓練第一個RBM,固定第一個RBM的權重和偏移量;第二步使用其隱性神經(jīng)元的狀態(tài), 作為第二個RBM的輸入向量;第三步充分訓練第二個RBM后,將第二個RBM堆疊在第一個RBM 的上方;如圖6所示,由若干個RBM堆疊而成的RMB棧輸出經(jīng)過無監(jiān)督學習得到隱含特征。 [0118]本發(fā)明實施例,獲取待處理的社交行為數(shù)據(jù)流,對該社交行為數(shù)據(jù)流進行預處理, 將社交行為數(shù)據(jù)流從數(shù)據(jù)空間轉換為低維特征空間向量,將該低維特征空間向量輸入至多 層級的RBM棧進行計算處理,以完成對社交行為數(shù)據(jù)流中隱含特征的提取,這種方式通過預 處理將社交行為數(shù)據(jù)流轉換為RBM可以識別的低維特征空間向量,并進一步通過RBM自動提 取社交行為數(shù)據(jù)流中抽象的隱含特征,提高效率,減小研發(fā)成本。
[0119] 本領域普通技術人員可以理解實現(xiàn)上述實施例方法中的全部或部分流程,是可以 通過計算機程序來指令相關的硬件來完成,所述的程序可存儲于一計算機可讀取存儲介質 中,附圖7-附圖8所示數(shù)據(jù)處理裝置對應的程序可存儲在設備的可讀存儲介質內(nèi),并被該設 備中的至少一個處理器執(zhí)行,以實現(xiàn)上述數(shù)據(jù)處理方法,該方法包括圖1中方法實施例所述 的流程。其中,所述的存儲介質可為磁碟、光盤、只讀存儲記憶體(Read-Only Memory,ROM) 或隨機存儲記憶體(Random Access Memory,RAM)等。
[0120] 以上所揭露的僅為本發(fā)明較佳實施例而已,當然不能以此來限定本發(fā)明之權利范 圍,因此依本發(fā)明權利要求所作的等同變化,仍屬本發(fā)明所涵蓋的范圍。
【主權項】
1. 一種數(shù)據(jù)處理方法,其特征在于,包括: 獲取待處理的社交行為數(shù)據(jù)流; 對所述社交行為數(shù)據(jù)流進行預處理,將所述社交行為數(shù)據(jù)流從數(shù)據(jù)空間轉換為低維特 征空間向量; 將所述低維特征空間向量輸入至多層級的受限玻爾茲曼機RBM棧進行計算處理,以完 成對所述社交行為數(shù)據(jù)流中隱含特征的提取。2. 如權利要求1所述的方法,其特征在于,所述對所述社交行為數(shù)據(jù)流進行預處理,將 所述社交行為數(shù)據(jù)流從數(shù)據(jù)空間轉換為低維特征空間向量之前還包括: 將所述社交行為數(shù)據(jù)流進行分類處理,獲得多個類型的社交行為數(shù)據(jù)流; 所述對所述社交行為數(shù)據(jù)流進行預處理,將所述社交行為數(shù)據(jù)流從數(shù)據(jù)空間轉換為低 維特征空間向量,包括: 將所述多個類型的社交行為數(shù)據(jù)流中每個類型的社交行為數(shù)據(jù)流進行預處理,獲得歸 一化矩陣,以實現(xiàn)將所述社交行為數(shù)據(jù)流從數(shù)據(jù)空間轉換為低維特征空間向量。3. 如權利要求2所述的方法,其特征在于,所述將所述多個類型的社交行為數(shù)據(jù)流中每 個類型的社交行為數(shù)據(jù)流進行預處理,獲得歸一化矩陣,包括: 針對每個類型的所述社交行為數(shù)據(jù)流,采用第一觀測函數(shù),對所述社交行為數(shù)據(jù)流進 行第一觀測處理,獲得該類型社交行為數(shù)據(jù)對應的第一觀測值,所述第一觀測函數(shù)為該類 型社交行為數(shù)據(jù)的統(tǒng)計函數(shù); 針對每個類型的所述社交行為數(shù)據(jù)的所述第一觀測值,采用第二觀測函數(shù),對所述社 交行為數(shù)據(jù)的所述第一觀測值進行第二觀測處理,獲得該類型社交行為數(shù)據(jù)對應的第二觀 測值,所述第二觀測函數(shù)為該類型社交行為數(shù)據(jù)的歸一化函數(shù); 將所述多個類型中每個類型社交行為數(shù)據(jù)的第二觀測值進行重構形成歸一化矩陣。4. 如權利要求3所述的方法,其特征在于,所述將所述多個類型中每個類型社交行為數(shù) 據(jù)的第二觀測值進行重構形成歸一化矩陣,包括: 以所述多個類型的類型數(shù)量為矩陣的列,將所述多個類型中每個類型社交行為數(shù)據(jù)的 第二觀測值重構形成歸一化矩陣。5. 如權利要求4所述的方法,其特征在于,若所述社交行為數(shù)據(jù)流中包含多個不同采集 周期采集的社交行為數(shù)據(jù); 所述以所述多個類型的類型數(shù)量為矩陣的列,將所述多個類型中每個類型社交行為數(shù) 據(jù)的第二觀測值重構形成歸一化矩陣,包括: 以所述多個類型的類型數(shù)量為矩陣的列,以所述不同采集周期的周期數(shù)量為矩陣的 行,將所述多個類型中每個類型社交行為數(shù)據(jù)的第二觀測值重構形成歸一化矩陣;或者, 以所述多個類型的類型數(shù)量為矩陣的列,形成所述不同采集周期的周期數(shù)量個數(shù)的歸 一化矩陣,一種采集周期中所述多個類型的每個類型社交行為數(shù)據(jù)的第二觀測值重構形成 一個歸一化矩陣。6. 如權利要求4或5所述的方法,其特征在于,所述多層級的RBM棧包括多個RBM串聯(lián)構 成; 所述將所述低維特征空間向量輸入至多層級的受限玻爾茲曼機RBM棧進行計算處理, 包括: 每次向所述多層級的RBM棧輸入所述歸一化矩陣的一行元素,一個元素對應一個輸入 端; 通過串聯(lián)的所述多個RBM逐層對所述歸一化矩陣進行計算處理,以提取所述社交行為 數(shù)據(jù)流中的隱含特征。7. -種數(shù)據(jù)處理裝置,其特征在于,包括: 獲取模塊,用于獲取待處理的社交行為數(shù)據(jù)流; 預處理模塊,用于對所述社交行為數(shù)據(jù)流進行預處理,將所述社交行為數(shù)據(jù)流從數(shù)據(jù) 空間轉換為低維特征空間向量; 計算模塊,用于將所述低維特征空間向量輸入至多層級的受限玻爾茲曼機RBM棧進行 計算處理,以完成對所述社交行為數(shù)據(jù)流中隱含特征的提取。8. 如權利要求7所述的裝置,其特征在于,所述裝置還包括: 分類模塊,用于將所述社交行為數(shù)據(jù)流進行分類處理,獲得多個類型的社交行為數(shù)據(jù) 流; 所述預處理模塊具體用于將所述多個類型的社交行為數(shù)據(jù)流中每個類型的社交行為 數(shù)據(jù)流進行預處理,獲得歸一化矩陣,以實現(xiàn)將所述社交行為數(shù)據(jù)流從數(shù)據(jù)空間轉換為低 維特征空間向量。9. 如權利要求8所述的裝置,其特征在于,所述預處理模塊包括: 觀測裝置子模塊,用于針對每個類型的所述社交行為數(shù)據(jù)流,采用第一觀測函數(shù),對所 述社交行為數(shù)據(jù)流進行第一觀測處理,獲得該類型社交行為數(shù)據(jù)對應的第一觀測值,所述 第一觀測函數(shù)為該類型社交行為數(shù)據(jù)的統(tǒng)計函數(shù); 歸一化裝置子模塊,用于針對每個類型的所述社交行為數(shù)據(jù)的所述第一觀測值,采用 第二觀測函數(shù),對所述社交行為數(shù)據(jù)的所述第一觀測值進行第二觀測處理,獲得該類型社 交行為數(shù)據(jù)對應的第二觀測值,所述第二觀測函數(shù)為該類型社交行為數(shù)據(jù)的歸一化函數(shù); 重構子模塊,用于將所述多個類型中每個類型社交行為數(shù)據(jù)的第二觀測值重構形成歸 一化矩陣。10. 如權利要求9所述的裝置,其特征在于,所述重構子模塊具體用于以所述多個類型 的類型數(shù)量為矩陣的列,將所述多個類型中每個類型社交行為數(shù)據(jù)的第二觀測值重構形成 歸一化矩陣。11. 如權利要求10所述的裝置,其特征在于,若所述社交行為數(shù)據(jù)流中包含多個不同采 集周期采集的社交行為數(shù)據(jù); 所述重構子模塊具體用于以所述多個類型的類型數(shù)量為矩陣的列,以所述不同采集周 期的周期數(shù)量為矩陣的行,將所述多個類型中每個類型社交行為數(shù)據(jù)的第二觀測值重構形 成歸一化矩陣;或者, 以所述多個類型的類型數(shù)量為矩陣的列,形成所述不同采集周期的周期數(shù)量個數(shù)的歸 一化矩陣,一種采集周期中所述多個類型的每個類型社交行為數(shù)據(jù)的第二觀測值重構形成 一個歸一化矩陣。12. 如權利要求10或11所述的裝置,其特征在于,所述多層級的RBM棧包括多個RBM串聯(lián) 構成; 所述計算模塊具體用于每次向所述多層級的RBM棧輸入所述歸一化矩陣的一行元素, 一個元素對應一個輸入端; 通過串聯(lián)的所述多個RBM逐層對所述歸一化矩陣進行計算處理,以提取所述社交行為 數(shù)據(jù)流中的隱含特征。
【文檔編號】G06K9/62GK106096638SQ201610394934
【公開日】2016年11月9日
【申請日】2016年6月3日 公開號201610394934.7, CN 106096638 A, CN 106096638A, CN 201610394934, CN-A-106096638, CN106096638 A, CN106096638A, CN201610394934, CN201610394934.7
【發(fā)明人】段培, 陳謙, 劉志斌
【申請人】騰訊科技(深圳)有限公司