国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于用戶行為的加權(quán)軌跡數(shù)據(jù)集構(gòu)建方法

      文檔序號:9304635閱讀:214來源:國知局
      一種基于用戶行為的加權(quán)軌跡數(shù)據(jù)集構(gòu)建方法
      【技術(shù)領(lǐng)域】
      [0001] 本發(fā)明涉及的是一種數(shù)據(jù)集構(gòu)建方法,具體涉及的是一種基于用戶行為的加權(quán)軌 跡數(shù)據(jù)集構(gòu)建方法。
      【背景技術(shù)】
      [0002] 隨著電子商務的快速發(fā)展和普及,電商平臺成為現(xiàn)代產(chǎn)品生產(chǎn)方與采購方的重要 媒介,越來越多的企業(yè)用戶將產(chǎn)品信息(諸如產(chǎn)品名稱、描述、關(guān)鍵詞等信息)通過電商平 臺進行發(fā)布展示,采購用戶通過電商平臺提供的查詢接口,查找感興趣的產(chǎn)品。在這一過程 中,采購者希望快速、準確地搜索到與所輸入查詢信息最為相關(guān)的產(chǎn)品;而產(chǎn)品發(fā)布者希望 自己的產(chǎn)品能以較高的概率被采購者關(guān)注。兩類需求的實現(xiàn)依賴于產(chǎn)品發(fā)布者在平臺上所 標注的產(chǎn)品名稱及關(guān)鍵詞與采購者查詢時所輸入的檢索詞具有良好的匹配度,然而不同的 采購者在利用電商平臺查詢目標產(chǎn)品時,往往有不同的習慣(包括檢索詞的組織形式、描 述方式等),采購者搜索行為的這種多樣性使得產(chǎn)品信息發(fā)布者固化的產(chǎn)品描述信息難以 滿足需求,可能出現(xiàn)產(chǎn)品關(guān)鍵詞等描述信息不當導致的匹配度降低。
      [0003]大數(shù)據(jù)時代的來臨,各行業(yè)的分析人員開始關(guān)注各類業(yè)務數(shù)據(jù)對業(yè)務活動可能有 的促進作用,電子商務平臺業(yè)務數(shù)據(jù)的持續(xù)積累,平臺中存儲了大量用戶查詢相關(guān)信息,諸 如用戶查詢主題、感興趣的查詢主題詞、打開的鏈接頁面,在各個頁面的停留時間等,這些 信息蘊含著查詢用戶的搜索行為模式,若能對這些數(shù)據(jù)處理,構(gòu)建體現(xiàn)搜索用戶查詢內(nèi)容 與頁面訪問關(guān)聯(lián)性的加權(quán)軌跡數(shù)據(jù)集,然后對加權(quán)軌跡數(shù)據(jù)集進行挖掘分析,提取出各領(lǐng) 域查詢者的搜索行為模式,將能為用戶發(fā)布產(chǎn)品信息提供輔助決策信息,幫助用戶合理地 制定廣品名稱及關(guān)鍵詞等彳目息,提尚其廣品的受關(guān)注度,提尚交易率,實現(xiàn)電子商務平臺服 務的個性化和定制化,提升服務質(zhì)量。
      [0004] 加權(quán)軌跡數(shù)據(jù)集作為后續(xù)數(shù)據(jù)挖掘的數(shù)據(jù)源,因此構(gòu)建加權(quán)軌跡數(shù)據(jù)集的方法直 接影響到數(shù)據(jù)挖掘的質(zhì)量,構(gòu)建時需要緊緊聯(lián)系體現(xiàn)用戶搜索關(guān)鍵詞與打開頁面的產(chǎn)品關(guān) 鍵詞之間關(guān)聯(lián)性強弱這一準則。用戶在平臺上的搜索等訪問操作等產(chǎn)生的日志信息具有數(shù) 據(jù)量大、模式復雜等特點,需要結(jié)合挖掘搜索行為模式這一挖掘主題,確定目標數(shù)據(jù)源的范 圍與組成,進一步提取相關(guān)數(shù)據(jù)進行預處理集成為挖掘數(shù)據(jù)集。

      【發(fā)明內(nèi)容】

      [0005] 本發(fā)明目的是,針對目前利用電商平臺日志信息挖掘用戶搜索行為模式過程中構(gòu) 建軌跡數(shù)據(jù)集方面存在的不足,提供一種基于用戶行為的、主客觀相結(jié)合的構(gòu)建加權(quán)軌跡 數(shù)據(jù)集方法。
      [0006] 為了實現(xiàn)上述目的,本發(fā)明是通過如下的技術(shù)方案來實現(xiàn):基于用戶行為的加權(quán) 軌跡數(shù)據(jù)集構(gòu)建方法,包括以下步驟:
      [0007] (1)根據(jù)電商網(wǎng)站平臺訪問日志數(shù)據(jù)中包含的產(chǎn)品信息、用戶訪問信息、商品交 易信息,結(jié)合產(chǎn)品發(fā)布方所發(fā)布的產(chǎn)品類別(包括但不限于電子類、機械類等),分別生成 對應各產(chǎn)品類別的訪問記錄數(shù)據(jù)集,訪問記錄數(shù)據(jù)集的數(shù)據(jù)模式如下,訪問記錄數(shù)據(jù)集visited-id,search-word,product_id,prod-keyword,visit_time,visit_seq,browse_ time,enquiry,分別表示訪問記錄標志符、查詢用戶輸入的檢索關(guān)鍵詞、產(chǎn)品標志符、產(chǎn)品 的描述關(guān)鍵詞組、訪問時間、訪問者在一次會話打開一系列頁面過程中打開該頁面的次序, 查詢者打開某產(chǎn)品頁面后在該頁面的停留時間,是否聯(lián)系產(chǎn)品發(fā)布者;
      [0008] (2)根據(jù)用戶瀏覽網(wǎng)站商品信息頁面產(chǎn)生的停留時間、同次會話中點擊網(wǎng)頁次序、 是否交易特征屬性,生成訪問記錄數(shù)據(jù)集中每條訪問記錄的權(quán)值,得到加權(quán)訪問記錄集, 其模式如下:加權(quán)訪問記錄數(shù)據(jù)visited_id,search_word,product_id,prod_keyword, visit_time,weight;
      [0009] 其中,weight表示查詢者用關(guān)鍵詞search_word查找目標商品時,對商品號為 product_id的商品對應頁面表現(xiàn)出的興趣度,計算方法為:
      [0010]
      [0011]其中a+b+c= 1,且0〈a,b,c〈l,分別對應分析者對visit_seq,browse_time以及enquiry屬性的重視程度。
      [0012]
      visit_seqmax與visit_seqmin分別為訪問記錄 數(shù)據(jù)表中visit_seq屬性取值的最大值和最小值,vSf;q為某條訪問記錄在visit_seq屬性上 的值。
      [0013]
      browse_timemax與browse_timemin分另lj 為訪問記錄數(shù)據(jù)表中browse_time屬性取值的最大值和最小值,vtinre為某條訪問記錄在browse_time屬性上的值。
      [0014]
      分enquiry屬性為True對應查詢者聯(lián)系該記錄所描述 商品的發(fā)布方;
      [0015] (3)對加權(quán)訪問記錄集,按商品標識符id進行分組,在每個商品對應分組記錄中, 選取權(quán)值最大的k個記錄,提取這k個記錄的搜索關(guān)鍵字,生成該商品的搜索關(guān)鍵詞組, 由商品關(guān)鍵詞、搜索關(guān)鍵詞組、商品描述關(guān)鍵詞組成該商品的訪問軌跡,軌跡數(shù)據(jù)集模式為 product_id,search_wordlJsearch_word2J......,search-wordk,prod-keyword;
      [0016] (4)用這k條記錄的平均權(quán)值作為該商品對應訪問軌跡的權(quán)值,生成該商品的加 權(quán)軌跡,構(gòu)建電商平臺所展示商品的加權(quán)軌跡數(shù)據(jù)集。加權(quán)軌跡數(shù)據(jù)集的模式如下:
      [0017] 加權(quán)軌跡數(shù)據(jù)集product_id,searcl^wordi,search_word2,......,search_ wordk,prod_keyword,weight。
      [0018] 本發(fā)明的有益效果:本發(fā)明結(jié)合電商平臺大量用戶通過平臺所提供檢索接口輸入 關(guān)鍵詞查找目標商品過程生成的大量訪問日志信息,提出基于用戶行為的軌跡數(shù)據(jù)集構(gòu)建 方法。從大量零散繁雜的用戶訪問信息中提取出包含用戶訪問行為模式的關(guān)鍵信息,組成 軌跡數(shù)據(jù)集,可供后續(xù)挖掘分析使用。本發(fā)明所生成加權(quán)軌跡數(shù)據(jù)集,能夠作為挖掘數(shù)據(jù)源 供電商平臺進行基于用戶交易模式的用戶搜索關(guān)鍵詞與商品描述關(guān)鍵詞關(guān)聯(lián)制約關(guān)系挖 掘。本發(fā)明所提出軌跡數(shù)據(jù)集構(gòu)建方法具有軌跡數(shù)據(jù)集規(guī)模與訪問記錄規(guī)模無關(guān)的優(yōu)點, 由于將對每件商品的所有訪問信息提煉為一條軌跡數(shù)據(jù)記錄,因此軌跡數(shù)據(jù)集的規(guī)模上限 為點上平臺所展示的商品數(shù)量,與查詢者訪問次數(shù)無關(guān),從而保證軌跡數(shù)據(jù)集作為后續(xù)挖 掘數(shù)據(jù)源具有規(guī)模有限的優(yōu)點,為后續(xù)挖掘分析過程挖掘結(jié)果有效性和挖掘的高效性提供 保障。
      【附圖說明】
      [0019] 圖1為本發(fā)明處理流程圖。
      【具體實施方式】
      [0020] 為使本發(fā)明實現(xiàn)的技術(shù)手段、創(chuàng)作特征、達成目的與功效易于明白了解,下面結(jié)合 具體實施例和說明書附圖,進
      當前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1