国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于社交媒體數(shù)據(jù)的目標(biāo)特征提取方法及裝置與流程

      文檔序號:40383189發(fā)布日期:2024-12-20 12:05閱讀:6來源:國知局
      基于社交媒體數(shù)據(jù)的目標(biāo)特征提取方法及裝置與流程

      本發(fā)明涉及數(shù)據(jù)處理,尤其涉及一種基于社交媒體數(shù)據(jù)的目標(biāo)特征提取方法、裝置及電子設(shè)備。


      背景技術(shù):

      1、多平臺社交媒體數(shù)據(jù)是指從多個不同的社交媒體平臺上收集的數(shù)據(jù)。這些數(shù)據(jù)可以包括用戶生成的內(nèi)容、用戶行為數(shù)據(jù)、互動數(shù)據(jù)等,通常用于分析用戶行為、市場趨勢、品牌聲譽、內(nèi)容傳播效果等方面。多平臺社交媒體數(shù)據(jù)的收集和分析對于企業(yè)和研究人員來說是非常有價值的,因為它提供了更全面的視角來理解目標(biāo)受眾和數(shù)據(jù)變化動態(tài)。

      2、現(xiàn)有技術(shù)在社交媒體數(shù)據(jù)特征提取的實現(xiàn)過程中,存在如下問題:

      3、1.數(shù)據(jù)來源單一:傳統(tǒng)的目標(biāo)特征影響力評估主要依賴市場調(diào)研和消費者調(diào)查,缺乏對社交媒體數(shù)據(jù)的綜合分析,無法反映目標(biāo)特征在社交媒體上的真實表現(xiàn)。

      4、2.分析維度有限:現(xiàn)有方法通常只關(guān)注特定的指標(biāo)(如目標(biāo)特征提及量或正面評價),忽視了用戶互動、情感傾向和社交網(wǎng)絡(luò)傳播等多維度因素。

      5、3.實時性差:大多數(shù)目標(biāo)特征影響力評估方法周期較長,難以實時反映目標(biāo)特征影響力的動態(tài)變化,無法為目標(biāo)特征管理提供及時有效的決策支持。

      6、4.缺乏自動化處理:現(xiàn)有的評估方法多依賴人工處理,缺乏自動化的數(shù)據(jù)采集、分析和報告生成機制,效率較低且易受主觀因素影響。

      7、上述問題成為需要解決的技術(shù)問題。


      技術(shù)實現(xiàn)思路

      1、有鑒于此,本發(fā)明實施例提供了一種基于社交媒體數(shù)據(jù)的目標(biāo)特征提取方法、裝置及電子設(shè)備,至少部分解決現(xiàn)有技術(shù)中存在的問題。

      2、第一方面,本發(fā)明實施例提供了一種基于社交媒體數(shù)據(jù)的目標(biāo)特征提取方法,包括:

      3、從n個社交媒體平臺m={m1,m2,…mn}上實時采集用戶生成的社交媒體數(shù)據(jù),對采集到的社交媒體數(shù)據(jù)進行清洗、格式化和情感分析,得到預(yù)處理數(shù)據(jù)d={d1,d2,…dn};

      4、通過特征計算函數(shù)gf對所述預(yù)處理數(shù)據(jù)d中的特征進行計算,得到特征數(shù)據(jù)集合kt={tn,eq,ud,tf},tn表示目標(biāo)特征的出現(xiàn)次數(shù),eq表示情感傾向,ud表示用戶互動量,tf表示傳播范圍;

      5、通過權(quán)重計算函數(shù)gs對n個社交媒體平臺m={m1,m2,…mn}上的歷史數(shù)據(jù)進行計算,得到平臺權(quán)重向量km=[km1,km2,…kmn];

      6、通過漂移計算函數(shù)gp對目標(biāo)特征在n個社交媒體平臺的歷史數(shù)據(jù)進行漂移特征計算,得到漂移權(quán)重向量kp=[kp1,kp2,…kpn];

      7、基于所述特征數(shù)據(jù)集合kt、平臺權(quán)重向量km以及漂移權(quán)重向量kp,計算所述目標(biāo)特征的評估值。

      8、根據(jù)本發(fā)明實施例的一種具體實現(xiàn)方式,所述從n個社交媒體平臺m={m1,m2,…mn}上實時采集用戶生成的社交媒體數(shù)據(jù),對采集到的社交媒體數(shù)據(jù)進行清洗、格式化和情感分析,得到預(yù)處理數(shù)據(jù)d,包括:

      9、獲取需要進行數(shù)據(jù)采集社交媒體平臺的api訪問權(quán)限;

      10、定義數(shù)據(jù)采集所對應(yīng)的關(guān)鍵詞、話題標(biāo)簽以及賬戶名稱,以便從選定的社交媒體平臺上獲取社交媒體數(shù)據(jù)。

      11、根據(jù)本發(fā)明實施例的一種具體實現(xiàn)方式,所述從n個社交媒體平臺m={m1,m2,…mn}上實時采集用戶生成的社交媒體數(shù)據(jù),對采集到的社交媒體數(shù)據(jù)進行清洗、格式化和情感分析,得到預(yù)處理數(shù)據(jù)d,還包括:

      12、將社交媒體數(shù)據(jù)中不同來源的數(shù)據(jù)調(diào)整為一致的格式,對于存在缺失值的字段進行默認(rèn)值填充;

      13、對社交媒體中的數(shù)據(jù)屬性進行歸一化處理,使得數(shù)值范圍保持一致;

      14、設(shè)置情感分析算法,對社交媒體數(shù)據(jù)中的每條文本內(nèi)容進行情感分析,得到正面、負(fù)面或中立的情感評分,形成最終的預(yù)處理數(shù)據(jù)d。

      15、根據(jù)本發(fā)明實施例的一種具體實現(xiàn)方式,所述通過特征計算函數(shù)gf對所述預(yù)處理數(shù)據(jù)d中的特征進行計算,得到特征數(shù)據(jù)集合kt={tn,eq,ud,tf},包括:

      16、計算目標(biāo)特征在預(yù)處理數(shù)據(jù)d中出現(xiàn)的總次數(shù)tn:

      17、

      18、n是數(shù)據(jù)集中樣本的總數(shù),di是第i個樣本,是指示函數(shù),如果di個樣本中包含目標(biāo)特征,則值為1,否則為0;

      19、設(shè)置情感得分函數(shù),它返回計算數(shù)值表示單個樣本di的情感得分eq:

      20、

      21、計算用戶互動量ud:

      22、

      23、表示第i個樣本的互動數(shù)量;

      24、計算傳播范圍tf:

      25、

      26、表示第i個樣本覆蓋的用戶數(shù)量。

      27、根據(jù)本發(fā)明實施例的一種具體實現(xiàn)方式,所述通過權(quán)重計算函數(shù)gs對n個社交媒體平臺m={m1,m2,…mn}上的歷史數(shù)據(jù)進行計算,得到平臺權(quán)重向量km=[km1,km2,…kmn],包括:

      28、對歷史數(shù)據(jù)設(shè)置多個評價指標(biāo)x,評價指標(biāo)x對應(yīng)評價值,i表示第i個平臺,j表示評價指標(biāo)x的第j個指標(biāo);

      29、計算評價值對應(yīng)的轉(zhuǎn)化值:

      30、

      31、和分別是所有平臺在第j個指標(biāo)上的最小值和最大值;

      32、為每個指標(biāo)分配一個權(quán)重系數(shù),對于每個平臺mi,計算其綜合得分si:

      33、

      34、將每個平臺的綜合得分si歸一化,得到平臺權(quán)重kmi:

      35、。

      36、根據(jù)本發(fā)明實施例的一種具體實現(xiàn)方式,所述通過漂移計算函數(shù)gp對目標(biāo)特征在n個社交媒體平臺的歷史數(shù)據(jù)進行漂移特征計算,得到漂移權(quán)重向量kp=[kp1,kp2,…kpn],包括:

      37、獲取兩個時間點t1和t2上的數(shù)據(jù),對于每個特征f和每個平臺mi,定義漂移值為:

      38、

      39、表示在時間t平臺上特征f的值;

      40、對于每個平臺mi,計算其綜合漂移得分pi:

      41、

      42、wf為權(quán)重系數(shù);

      43、將每個平臺的綜合漂移得分pi進行量化,得到漂移權(quán)重kpi:

      44、。

      45、根據(jù)本發(fā)明實施例的一種具體實現(xiàn)方式,所述基于所述特征數(shù)據(jù)集合kt、平臺權(quán)重向量km以及漂移權(quán)重向量kp,計算所述目標(biāo)特征的評估值,包括:

      46、對于每個平臺mi,定義加權(quán)特征數(shù)據(jù):

      47、

      48、其中是特征數(shù)據(jù)集合kt中的第j個特征在平臺mi上的值,是該特征數(shù)據(jù)的時間距離當(dāng)前時間的天數(shù),α是時間衰減因子,0<α<1;

      49、設(shè)定特征交互系數(shù)矩陣i,特征交互系數(shù)矩陣i為4×4矩陣,表示特征p和特征q之間的交互系數(shù),加權(quán)后的特征數(shù)據(jù)為:

      50、。

      51、根據(jù)本發(fā)明實施例的一種具體實現(xiàn)方式,所述基于所述特征數(shù)據(jù)集合kt、平臺權(quán)重向量km以及漂移權(quán)重向量kp,計算所述目標(biāo)特征的評估值,還包括:

      52、對于每個平臺mi,計算其綜合特征得分si:

      53、

      54、將所有平臺的綜合特征得分相加,得到目標(biāo)特征的評估值e:

      55、。

      56、第二方面,本發(fā)明實施例提供了一種基于社交媒體數(shù)據(jù)的目標(biāo)特征提取裝置,包括:

      57、采集模塊,從n個社交媒體平臺m={m1,m2,…mn}上實時采集用戶生成的社交媒體數(shù)據(jù),對采集到的社交媒體數(shù)據(jù)進行清洗、格式化和情感分析,得到預(yù)處理數(shù)據(jù)d={d1,d2,…dn};

      58、特征模塊,通過特征計算函數(shù)gf對所述預(yù)處理數(shù)據(jù)d中的特征進行計算,得到特征數(shù)據(jù)集合kt={tn,eq,ud,tf},tn表示目標(biāo)特征的出現(xiàn)次數(shù),eq表示情感傾向,ud表示用戶互動量,tf表示傳播范圍;

      59、權(quán)重模塊,通過權(quán)重計算函數(shù)gs對n個社交媒體平臺m={m1,m2,…mn}上的歷史數(shù)據(jù)進行計算,得到平臺權(quán)重向量km=[km1,km2,…kmn];

      60、漂移模塊,通過漂移計算函數(shù)gp對目標(biāo)特征在n個社交媒體平臺的歷史數(shù)據(jù)進行漂移特征計算,得到漂移權(quán)重向量kp=[kp1,kp2,…kpn];

      61、計算模塊,基于所述特征數(shù)據(jù)集合kt、平臺權(quán)重向量km以及漂移權(quán)重向量kp,計算所述目標(biāo)特征的評估值。

      62、第三方面,本發(fā)明實施例還提供了一種電子設(shè)備,該電子設(shè)備包括:

      63、至少一個處理器;以及,

      64、與該至少一個處理器通信連接的存儲器;其中,

      65、該存儲器存儲有可被該至少一個處理器執(zhí)行的指令,該指令被該至少一個處理器執(zhí)行,以使該至少一個處理器能夠執(zhí)行前述任第一方面或第一方面的任一實現(xiàn)方式中的基于社交媒體數(shù)據(jù)的目標(biāo)特征提取方法。

      66、第四方面,本發(fā)明實施例還提供了一種非暫態(tài)計算機可讀存儲介質(zhì),該非暫態(tài)計算機可讀存儲介質(zhì)存儲計算機指令,該計算機指令用于使該計算機執(zhí)行前述第一方面或第一方面的任一實現(xiàn)方式中的基于社交媒體數(shù)據(jù)的目標(biāo)特征提取方法。

      67、第五方面,本發(fā)明實施例還提供了一種計算機程序產(chǎn)品,該計算機程序產(chǎn)品包括存儲在非暫態(tài)計算機可讀存儲介質(zhì)上的計算程序,該計算機程序包括程序指令,當(dāng)該程序指令被計算機執(zhí)行時,使該計算機執(zhí)行前述第一方面或第一方面的任一實現(xiàn)方式中的基于社交媒體數(shù)據(jù)的目標(biāo)特征提取方法。

      68、本發(fā)明實施例中的基于社交媒體數(shù)據(jù)的目標(biāo)特征提取方案,包括:從n個社交媒體平臺m={m1,m2,…mn}上實時采集用戶生成的社交媒體數(shù)據(jù),對采集到的社交媒體數(shù)據(jù)進行清洗、格式化和情感分析,得到預(yù)處理數(shù)據(jù)d={d1,d2,…dn};通過特征計算函數(shù)gf對所述預(yù)處理數(shù)據(jù)d中的特征進行計算,得到特征數(shù)據(jù)集合kt={tn,eq,ud,tf},tn表示目標(biāo)特征的出現(xiàn)次數(shù),eq表示情感傾向,ud表示用戶互動量,tf表示傳播范圍;通過權(quán)重計算函數(shù)gs對n個社交媒體平臺m={m1,m2,…mn}上的歷史數(shù)據(jù)進行計算,得到平臺權(quán)重向量km=[km1,km2,…kmn];通過漂移計算函數(shù)gp對目標(biāo)特征在n個社交媒體平臺的歷史數(shù)據(jù)進行漂移特征計算,得到漂移權(quán)重向量kp=[kp1,kp2,…kpn];基于所述特征數(shù)據(jù)集合kt、平臺權(quán)重向量km以及漂移權(quán)重向量kp,計算所述目標(biāo)特征的評估值。本發(fā)明具有如下有益效果:

      69、a多維度分析:本算法綜合了目標(biāo)特征(例如,品牌特征)提及量、情感傾向、用戶互動量和傳播范圍等多維度指標(biāo),提供了全面的目標(biāo)特征影響力評估,能夠更精準(zhǔn)地反映目標(biāo)特征在社交媒體上的實際表現(xiàn)。

      70、b實時性強:通過實時數(shù)據(jù)采集和處理,算法能夠動態(tài)反映目標(biāo)特征影響力的變化,為用戶提供及時的決策支持,幫助目標(biāo)特征在競爭中保持敏捷性。

      71、c高準(zhǔn)確性:通過優(yōu)化的權(quán)重分配和機器學(xué)習(xí)算法,算法能夠根據(jù)目標(biāo)特征的行業(yè)特點和市場表現(xiàn)進行精細(xì)化調(diào)整,確保目標(biāo)特征影響力預(yù)估的準(zhǔn)確性和可靠性。

      72、d自動化處理:本算法實現(xiàn)了從數(shù)據(jù)采集、處理、分析到報告生成的全流程自動化,極大提高了工作效率,減少了人工干預(yù)的誤差,適應(yīng)大規(guī)模數(shù)據(jù)的處理需求。

      73、e可視化展示:通過直觀的可視化工具,幫助用戶快速理解分析結(jié)果,提升目標(biāo)特征管理的科學(xué)性和精細(xì)度,同時支持定制化報告輸出,滿足不同層級用戶的需求。

      當(dāng)前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1