国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      獲取推薦數(shù)據(jù)的方法和裝置與流程

      文檔序號:12720249閱讀:309來源:國知局
      獲取推薦數(shù)據(jù)的方法和裝置與流程
      本發(fā)明涉及數(shù)據(jù)分析領(lǐng)域,具體而言,涉及一種獲取推薦數(shù)據(jù)的方法和裝置。
      背景技術(shù)
      :現(xiàn)在的大多數(shù)網(wǎng)站,例如視頻網(wǎng)站、電商網(wǎng)站、金融網(wǎng)站等,都會有用戶推薦的模塊,用于向用戶推薦用戶可能感興趣的數(shù)據(jù)內(nèi)容。目前,推薦算法大致有:基于內(nèi)容、基于協(xié)同過濾、基于關(guān)聯(lián)規(guī)則、基于效用、基于知識的推薦算法?;趦?nèi)容的數(shù)據(jù)推薦方法的理論,理論依據(jù)主要來自于信息檢索和信息過濾,所謂的基于內(nèi)容的推薦方法就是根據(jù)用戶過去的瀏覽記錄來向用戶推薦用戶沒有接觸過的推薦項?;趨f(xié)同過濾的推薦算法理論上可以推薦世界上的任何一種東西,包括圖片、音樂等。協(xié)同過濾算法主要是通過對未評分項進行評分,從而得到預測數(shù)據(jù)?;陉P(guān)聯(lián)規(guī)則的推薦(AssociationRule-basedRecommendation)是以關(guān)聯(lián)規(guī)則為基礎(chǔ),把已購商品作為規(guī)則頭,規(guī)則體為推薦對象。關(guān)聯(lián)規(guī)則挖掘可以發(fā)現(xiàn)不同商品在銷售過程中的相關(guān)性,在零售業(yè)中已經(jīng)得到了成功的應(yīng)用?;谛в玫耐扑](Utility-basedRecommendation)是建立在對用戶使用項目的效用情況上計算的,其核心問題是怎么樣為每一個用戶去創(chuàng)建一個效用函數(shù),因此,用戶資料模型很大程度上是由系統(tǒng)所采用的效用函數(shù)決定的?;谥R的推薦(Knowledge-basedRecommendation)在某種程度是可以看成是一種推理(Inference)技術(shù),它不是建立在用戶需要和偏好基礎(chǔ)上推薦的?;谥R的方法因它們所用的功能知識不同而有明顯區(qū)別。效用知識(FunctionalKnowledge)是一種關(guān)于一個項目如何滿足某一特定用戶的知識,因此能解釋需要和推薦的關(guān)系,所以用戶資料可以是任何能支持推理的知識結(jié)構(gòu),它可以是用戶已經(jīng)規(guī)范化的查詢,也可以是一個更詳細的用戶需要的表示。但是,向用戶推薦數(shù)據(jù)不是一個簡單的工作,因為用戶的興趣是千奇百怪的,通常情況下,利用上述算法,計算機無法很準確地捕捉用戶的興趣點,只能通過用戶的標簽或者用戶經(jīng)常瀏覽的節(jié)目記錄來進行整合數(shù)據(jù),并向用戶推薦數(shù)據(jù)。通過上述方法得到的推薦數(shù)據(jù),是比較基礎(chǔ)但又笨拙的方法,沒有去深入挖掘用戶的潛在興趣,不能準確的得到目標用戶的推薦數(shù)據(jù)。針對上述無法準確得到推薦數(shù)據(jù)的問題,目前尚未提出有效的解決方案。技術(shù)實現(xiàn)要素:本發(fā)明實施例提供了一種獲取推薦數(shù)據(jù)的方法和裝置,以至少解決無法準確得到推薦數(shù)據(jù)的技術(shù)問題。根據(jù)本發(fā)明實施例的一個方面,提供了一種獲取推薦數(shù)據(jù)的方法,包括:根據(jù)目標對象的操作數(shù)據(jù)從數(shù)據(jù)庫中篩選得到待選數(shù)據(jù)集,其中,數(shù)據(jù)庫中的每一條數(shù)據(jù)至少包括如下參數(shù):數(shù)據(jù)標識和用戶偏好;利用遺傳算法對待選數(shù)據(jù)集的數(shù)據(jù)進行處理得到目標數(shù)據(jù)集;當目標數(shù)據(jù)集中的數(shù)據(jù)的適應(yīng)度之和達到第一預設(shè)閾值時,根據(jù)目標數(shù)據(jù)集的數(shù)據(jù)確定目標對象的推薦數(shù)據(jù)。進一步地,根據(jù)目標對象的操作數(shù)據(jù)從數(shù)據(jù)庫中篩選得到待選數(shù)據(jù)集包括:通過數(shù)據(jù)庫中的每一條數(shù)據(jù)的數(shù)據(jù)標識和用戶偏好,計算得到數(shù)據(jù)庫中的任意兩條數(shù)據(jù)的數(shù)據(jù)關(guān)聯(lián)度;根據(jù)目標對象的操作數(shù)據(jù)以及數(shù)據(jù)關(guān)聯(lián)度生成待選數(shù)據(jù)集。進一步地,通過如下第一公式計算得到數(shù)據(jù)庫中的任意兩條數(shù)據(jù)的數(shù)據(jù)關(guān)聯(lián)度其中,i,j為自然數(shù),N(i)為喜歡節(jié)目i的用戶數(shù),N(j)為喜歡節(jié)目j的用戶數(shù)。進一步地,通過如下第二公式生成待選數(shù)據(jù)集Pij:其中,u為自然數(shù),N(u)為目標對象喜歡的節(jié)目的集合,Rui為常數(shù),表示目標對象對節(jié)目i的興趣程度。進一步地,利用遺傳算法對待選數(shù)據(jù)集的數(shù)據(jù)進行處理得到目標數(shù)據(jù)集包括:對待選數(shù)據(jù)集中數(shù)據(jù)進行編碼操作,以無符號二進制數(shù)來表示待選數(shù)據(jù)集中數(shù)據(jù),其中,無符號二進制數(shù)中任一個數(shù)字為數(shù)據(jù)的一個基因;通過對無符號二進制數(shù)來表示的待選數(shù)據(jù)集中數(shù)據(jù)進行遺傳運算,得到目標數(shù)據(jù)集,其中,遺傳運算包括以下運算中的至少一項或者多項:選擇運算、交叉運算、變異運算。進一步地,通過對無符號二進制數(shù)來表示的待選數(shù)據(jù)集中數(shù)據(jù)進行遺傳運算,得到目標數(shù)據(jù)集包括:計算待選數(shù)據(jù)集中數(shù)據(jù)的適應(yīng)度,通過適應(yīng)度來確定數(shù)據(jù)的遺傳概率,其中,遺傳概率用于確定數(shù)據(jù)被選中進行遺傳運算的次數(shù);將選定的待選數(shù)據(jù)集中的數(shù)據(jù)進行交叉運算,得到第一子目標數(shù)據(jù)集,其中,交叉運算為將待選數(shù)據(jù)集中的被選中的數(shù)據(jù)進行隨機配對,通過隨機選擇數(shù)據(jù)的至少一個基因進行交換;對第一子目標數(shù)據(jù)集的數(shù)據(jù)進行變異運算,得到目標數(shù)據(jù)集,其中,變異運算為隨機確定第一子目標數(shù)據(jù)集中數(shù)據(jù)的基因變異位置,對基因變異位置的基因值進行基因值取反操作。根據(jù)本發(fā)明實施例的另一方面,還提供了一種獲取推薦數(shù)據(jù)的裝置,其特征在于,包括:選擇模塊,用于根據(jù)目標對象的操作數(shù)據(jù)從數(shù)據(jù)庫中篩選得到待選數(shù)據(jù)集,其中,數(shù)據(jù)庫中的每一條數(shù)據(jù)至少包括如下參數(shù):數(shù)據(jù)標識和用戶偏好;算法模塊,用于利用遺傳算法對待選數(shù)據(jù)集的數(shù)據(jù)進行處理得到目標數(shù)據(jù)集;確定模塊,用于當目標數(shù)據(jù)集中的數(shù)據(jù)的適應(yīng)度之和達到第一預設(shè)閾值時,根據(jù)目標數(shù)據(jù)集的數(shù)據(jù)確定目標對象的推薦數(shù)據(jù)。進一步地,選擇模塊包括:計算子模塊,用于通過數(shù)據(jù)庫中的每一條數(shù)據(jù)的數(shù)據(jù)標識和用戶偏好,計算得到數(shù)據(jù)庫中的任意兩條數(shù)據(jù)的數(shù)據(jù)關(guān)聯(lián)度;生成子模塊,用于根據(jù)目標對象的操作數(shù)據(jù)以及數(shù)據(jù)關(guān)聯(lián)度生成待選數(shù)據(jù)集。進一步地,算法模塊包括:編碼子模塊,用于對待選數(shù)據(jù)集中數(shù)據(jù)進行編碼操作,以無符號二進制數(shù)來表示待選數(shù)據(jù)集中數(shù)據(jù),其中,無符號二進制數(shù)中任一個數(shù)字為數(shù)據(jù)的一個基因;算法子模塊,用于通過對無符號二進制數(shù)來表示的待選數(shù)據(jù)集中數(shù)據(jù)進行遺傳運算,得到目標數(shù)據(jù)集,其中,遺傳運算包括以下運算中的至少一項或者多項:選擇運算、交叉運算、變異運算。進一步地,算法子模塊包括:選擇運算單元,用于計算待選數(shù)據(jù)集中數(shù)據(jù)的適應(yīng)度,通過適應(yīng)度來確定數(shù)據(jù)的遺傳概率,其中,遺傳概率用于確定數(shù)據(jù)被選中進行遺傳運算的次數(shù);交叉運算單元,用于將選定的待選數(shù)據(jù)集中的數(shù)據(jù)進行交叉運算,得到第一子目標數(shù)據(jù)集,其中,交叉運算為將待選數(shù)據(jù)集中的被選中的數(shù)據(jù)進行隨機配對,通過隨機選擇數(shù)據(jù)的至少一個基因進行交換;變異運算單元,用于對第一子目標數(shù)據(jù)集的數(shù)據(jù)進行變異運算,得到目標數(shù)據(jù)集,其中,變異運算為隨機確定第一子目標數(shù)據(jù)集中數(shù)據(jù)的基因變異位置,對基因變異位置的基因值進行基因值取反操作。在本發(fā)明實施例中,通過采用根據(jù)目標對象的操作數(shù)據(jù)從數(shù)據(jù)庫中篩選得到待選數(shù)據(jù)集,其中,數(shù)據(jù)庫中的每一條數(shù)據(jù)至少包括如下參數(shù):數(shù)據(jù)標識和用戶偏好;利用遺傳算法對待選數(shù)據(jù)集的數(shù)據(jù)進行處理得到目標數(shù)據(jù)集;當目標數(shù)據(jù)集中的數(shù)據(jù)的適應(yīng)度之和達到第一預設(shè)閾值時,根據(jù)目標數(shù)據(jù)集的數(shù)據(jù)確定目標對象的推薦數(shù)據(jù),達到了準確獲取推薦數(shù)據(jù),并且可以對提供推薦數(shù)據(jù)進行自我學習及優(yōu)化的目的,進而解決了無法準確得到推薦數(shù)據(jù)的技術(shù)問題。附圖說明此處所說明的附圖用來提供對本發(fā)明的進一步理解,構(gòu)成本申請的一部分,本發(fā)明的示意性實施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當限定。在附圖中:圖1是根據(jù)本發(fā)明實施例一的一種可選的獲取推薦數(shù)據(jù)的方法的流程圖;圖2是根據(jù)本發(fā)明實施例二的一種可選的獲取推薦數(shù)據(jù)的裝置的示意圖。具體實施方式為了使本
      技術(shù)領(lǐng)域
      的人員更好地理解本發(fā)明方案,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分的實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都應(yīng)當屬于本發(fā)明保護的范圍。需要說明的是,本發(fā)明的說明書和權(quán)利要求書及上述附圖中的術(shù)語“第一”、“第二”等是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當情況下可以互換,以便這里描述的本發(fā)明的實施例能夠以除了在這里圖示或描述的那些以外的順序?qū)嵤?。此外,術(shù)語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。實施例一本發(fā)明實施例提供了一種獲取推薦數(shù)據(jù)的方法。圖1是根據(jù)本發(fā)明實施例一的一種可選的獲取推薦數(shù)據(jù)的方法的流程圖。如圖1所示,該方法包括:步驟S102,根據(jù)目標對象的操作數(shù)據(jù)從數(shù)據(jù)庫中篩選得到待選數(shù)據(jù)集,其中,數(shù)據(jù)庫中的每一條數(shù)據(jù)至少包括如下參數(shù):數(shù)據(jù)標識和用戶偏好。具體地,目標對象可以是視頻網(wǎng)站、購物網(wǎng)站等平臺的使用者,操作數(shù)據(jù)可以是目標對象的對某條數(shù)據(jù)或者某些數(shù)據(jù)的瀏覽、播放等形成的數(shù)據(jù)。數(shù)據(jù)庫中可以包括多條數(shù)據(jù),以視頻網(wǎng)站為例,數(shù)據(jù)庫中包括該視頻網(wǎng)站中全部的視頻節(jié)目,其中,每一個視頻節(jié)目可以為該數(shù)據(jù)庫中的數(shù)據(jù)庫中的一條數(shù)據(jù),并且,每一條數(shù)據(jù)都攜帶有數(shù)據(jù)參數(shù),數(shù)據(jù)參數(shù)包括數(shù)據(jù)標識、以及用戶對該條數(shù)據(jù)的用戶偏好。需要說明的是,用戶偏好可以是喜歡該視頻節(jié)目的用戶,例如,用戶偏好可以是點擊播放過該視頻節(jié)目的用戶的集合。步驟S104,利用遺傳算法對待選數(shù)據(jù)集的數(shù)據(jù)進行處理得到目標數(shù)據(jù)集。具體地,遺傳算法可以包括選擇運算、交叉運算、變異運算,可以對待選數(shù)據(jù)集中的數(shù)據(jù)進行上述的運算,可以獲取到新的數(shù)據(jù)群體,可以將新的數(shù)據(jù)群體確定為目標數(shù)據(jù)集。需要說明的是,將遺傳算法應(yīng)用到獲取推薦數(shù)據(jù)的過程中,可以使推薦數(shù)據(jù)不斷的優(yōu)化,為用戶提供更加合適的推薦結(jié)果,可以有效的提高獲取推薦數(shù)據(jù)的效率。步驟S106,當目標數(shù)據(jù)集中的數(shù)據(jù)的適應(yīng)度之和達到第一預設(shè)閾值時,根據(jù)目標數(shù)據(jù)集的數(shù)據(jù)確定目標對象的推薦數(shù)據(jù)。具體地,第一預設(shè)閾值可以是預先設(shè)置的,例如10。在上述步驟S106中,可以通過適應(yīng)度函數(shù),計算目標數(shù)據(jù)集中每一條數(shù)據(jù)的適應(yīng)度,對目標數(shù)據(jù)集中每一條數(shù)據(jù)的適應(yīng)度進行求和運算,可以得到該目標數(shù)據(jù)集的適應(yīng)度之和。當該目標數(shù)據(jù)集的適應(yīng)度之和大于等于第一預設(shè)閾值時,可以將該目標數(shù)據(jù)集中的數(shù)據(jù)確定為目標對象的推薦數(shù)據(jù)?;蛘撸斣撃繕藬?shù)據(jù)集的適應(yīng)度之和大于等于第一預設(shè)閾值時,可以對目標數(shù)據(jù)集中的數(shù)據(jù)按照適應(yīng)度的大小進行排序,選擇適應(yīng)度值高的一部分作為該目標對象的推薦數(shù)據(jù)。本發(fā)明實施例中,通過上述步驟S102至步驟S106,根據(jù)目標對象的操作數(shù)據(jù)從數(shù)據(jù)庫中篩選得到待選數(shù)據(jù)集,其中,數(shù)據(jù)庫中的每一條數(shù)據(jù)至少包括如下參數(shù):數(shù)據(jù)標識和用戶偏好;利用遺傳算法對待選數(shù)據(jù)集的數(shù)據(jù)進行處理得到目標數(shù)據(jù)集;當目標數(shù)據(jù)集中的數(shù)據(jù)的適應(yīng)度之和達到第一預設(shè)閾值時,根據(jù)目標數(shù)據(jù)集的數(shù)據(jù)確定目標對象的推薦數(shù)據(jù)的方法,解決了無法準確得到推薦數(shù)據(jù)的問題。可選地,步驟S102,根據(jù)目標對象的操作數(shù)據(jù)從數(shù)據(jù)庫中篩選得到待選數(shù)據(jù)集可以包括:步驟S1021,通過數(shù)據(jù)庫中的每一條數(shù)據(jù)的數(shù)據(jù)標識和用戶偏好,計算得到數(shù)據(jù)庫中的任意兩條數(shù)據(jù)的數(shù)據(jù)關(guān)聯(lián)度。步驟S1023,根據(jù)目標對象的操作數(shù)據(jù)以及數(shù)據(jù)關(guān)聯(lián)度生成待選數(shù)據(jù)集。具體地,以視頻網(wǎng)站為例,用戶偏好可以是喜歡某一視頻節(jié)目的用戶的名稱。例如,喜歡節(jié)目1的用戶包括a、b、c,即,節(jié)目1的用戶偏好為a、b、c,喜歡節(jié)目2的用戶包括b、d、e,即,節(jié)目2的用戶偏好為b、d、e,則,節(jié)目1與節(jié)目2的數(shù)據(jù)關(guān)聯(lián)度為1/3。需要說明的是,數(shù)據(jù)關(guān)聯(lián)度可以是節(jié)目的相似度??蛇x地,通過如下第一公式計算得到數(shù)據(jù)庫中的任意兩條數(shù)據(jù)的數(shù)據(jù)關(guān)聯(lián)度Wij:其中,i,j為自然數(shù),N(i)為喜歡節(jié)目i的用戶數(shù),N(j)為喜歡節(jié)目j的用戶數(shù)。具體地,N(i)∩N(j)可以表示同時喜歡節(jié)目i和節(jié)目j的用戶數(shù)??蛇x地,通過如下第二公式生成待選數(shù)據(jù)集Pij:其中,u為自然數(shù),N(u)為目標對象喜歡的節(jié)目的集合,Rui為常數(shù),表示目標對象對節(jié)目i的興趣程度。具體地,Rui可以是通過用戶評分或者節(jié)目的播放次數(shù)進行統(tǒng)計得來。與目標對象歷史上感興趣的節(jié)目越相似的節(jié)目,越有可能在目標對象的待選數(shù)據(jù)集中獲得比較高的排名??蛇x地,步驟S104,利用遺傳算法對待選數(shù)據(jù)集的數(shù)據(jù)進行處理得到目標數(shù)據(jù)集可以包括:步驟S1041,對待選數(shù)據(jù)集中數(shù)據(jù)進行編碼操作,以無符號二進制數(shù)來表示待選數(shù)據(jù)集中數(shù)據(jù),其中,無符號二進制數(shù)中任一個數(shù)字為數(shù)據(jù)的一個基因。具體地,遺傳算法的運算對象是表示個體的符號串,所以必須把節(jié)目i和節(jié)目j編碼為一種符號串。節(jié)目推薦系統(tǒng)中,可以使用i和j的節(jié)目號的無符號二進制整數(shù)來表示。需要說明的是,假設(shè)節(jié)目庫中只有20個節(jié)目,用戶喜歡的節(jié)目有4個,因而節(jié)目i的編號可以取0-3,用2位無符號二進制整數(shù)來表示,除去用戶喜歡的節(jié)目有16個,所以節(jié)目j的編號可以取0-15之間的整數(shù),用4位無符號二進制整數(shù)來表示,將它們連接在一起所組成的6位無符號二進制數(shù)就形成了個體的基因型,表示一個可行解。例如,基因型X=011110所對應(yīng)的表現(xiàn)型是:x=[1,14]。個體的表現(xiàn)型x和基因型X之間可通過編碼和解碼程序相互轉(zhuǎn)換。還需要說明的是,遺傳算法是對群體進行的進化操作,需要給其淮備一些表示起始搜索點的初始群體數(shù)據(jù)。在上述舉例中,群體規(guī)模的大小取為4,即群體由4個個體組成,每個個體可通過隨機方法產(chǎn)生。如:100111,001000,011110,011101。步驟S1043,通過對無符號二進制數(shù)來表示的待選數(shù)據(jù)集中數(shù)據(jù)進行遺傳運算,得到目標數(shù)據(jù)集,其中,遺傳運算包括以下運算中的至少一項或者多項:選擇運算、交叉運算、變異運算。可選地,步驟S1043,通過對無符號二進制數(shù)來表示的待選數(shù)據(jù)集中數(shù)據(jù)進行遺傳運算,得到目標數(shù)據(jù)集可以包括:步驟S10431,計算待選數(shù)據(jù)集中數(shù)據(jù)的適應(yīng)度,通過適應(yīng)度來確定數(shù)據(jù)的遺傳概率,其中,遺傳概率用于確定數(shù)據(jù)被選中進行遺傳運算的次數(shù)。具體地,在遺傳算法中可以以個體適應(yīng)度的大小來評定各個個體的優(yōu)劣程度,從而決定其遺傳機會的大小。其中,個體適應(yīng)度即待選數(shù)據(jù)集中每一條數(shù)據(jù)的適應(yīng)度。在本申請實施例中第二公式總?cè)》秦撝?,并且是以求最大值為?yōu)化目標,所以可直接利用第二公式的函數(shù)值作為某一個體的適應(yīng)度。需要說明的是,在遺傳算法中,可以將待選數(shù)據(jù)集中適應(yīng)度較高的個體(即數(shù)據(jù))按某種規(guī)則或模型遺傳到下一代數(shù)據(jù)集中。也就是說,適應(yīng)度較高的個體可以有更多的機會遺傳到下一代群體中。以一種具體的應(yīng)用場景為例,先根據(jù)第二公式計算出待選數(shù)據(jù)集中每一條數(shù)據(jù)的適應(yīng)度的總和F:其次計算出每一條數(shù)據(jù)的適應(yīng)度的大小fi/F(i=1,2,…,M),該適應(yīng)度可以為每一條數(shù)據(jù)被遺傳到下一代群體中的概率。每個概率值組成一個區(qū)域,可知全部概率值之和為1,最后再產(chǎn)生一個0到1之間的隨機數(shù),依據(jù)該隨機數(shù)出現(xiàn)在上述哪一個概率區(qū)域內(nèi)來確定每一條數(shù)據(jù)被選中的次數(shù)。例如,假設(shè)節(jié)目i的感興趣程度,R0=1,R1=2,R2=3,R3=2.5,Wij從相似度表格中獲取。步驟S10433,將選定的待選數(shù)據(jù)集中的數(shù)據(jù)進行交叉運算,得到第一子目標數(shù)據(jù)集,其中,交叉運算為將待選數(shù)據(jù)集中的被選中的數(shù)據(jù)進行隨機配對,通過隨機選擇數(shù)據(jù)的至少一個基因進行交換。具體地,交叉運算是遺傳算法中產(chǎn)生新個體的主要操作過程,它以某一概率相互交換某兩個數(shù)據(jù)之間的部分染色體。在一種具體的應(yīng)用場景中,可以先對選定的待選數(shù)據(jù)集中的數(shù)據(jù)進行隨機配對;其次隨機設(shè)置交叉點位置;最后再相互交換配對染色體之間的部分基因。步驟S10435,對第一子目標數(shù)據(jù)集的數(shù)據(jù)進行變異運算,得到目標數(shù)據(jù)集,其中,變異運算為隨機確定第一子目標數(shù)據(jù)集中數(shù)據(jù)的基因變異位置,對基因變異位置的基因值進行基因值取反操作。具體地,變異運算是對某一個數(shù)據(jù)的某一個或某一些基因座上的基因值按某一較小的概率進行改變,它也是產(chǎn)生新數(shù)據(jù)的一種操作方法。在一種具體的應(yīng)用場景中,首先確定出各個數(shù)據(jù)的基因變異位置,下表所示為隨機產(chǎn)生的變異點位置,其中的數(shù)字表示變異點設(shè)置在該基因座處;然后依照某一概率將變異點的原有基因值取反。個體編號交叉結(jié)果變異點變異結(jié)果子代群體p(1)11011102111110111110200101030000100000103010111601011001011040111001111100111100通過上述步驟S10431至步驟S10435,可以有效的改進目標數(shù)據(jù)集中的數(shù)據(jù)的適應(yīng)度。在一種具體應(yīng)用場景下,通過對待選數(shù)據(jù)集中數(shù)據(jù)進行選擇運算、交叉運算以及變異運算之后,可以得到如下目標數(shù)據(jù)集。個體編號目標數(shù)據(jù)集ij適應(yīng)度值占總數(shù)比11111103140.3*2.5=2.80.552000010020.5*1=0.50.103010110160.4*2=0.80.1641111003120.4*2.5=10.20總和5.11從上表中可以看出,經(jīng)過一次遺傳算法運算后,群體的適應(yīng)度的最大值得到了改進。實施例二根據(jù)本發(fā)明實施例,還提供了一種獲取推薦數(shù)據(jù)的裝置的實施例,圖2是根據(jù)本發(fā)明實施例二的一種可選的獲取推薦數(shù)據(jù)的裝置的示意圖,如圖2所示,該裝置包括:選擇模塊40,用于根據(jù)目標對象的操作數(shù)據(jù)從數(shù)據(jù)庫中篩選得到待選數(shù)據(jù)集,其中,數(shù)據(jù)庫中的每一條數(shù)據(jù)至少包括如下參數(shù):數(shù)據(jù)標識和用戶偏好。具體地,目標對象可以是視頻網(wǎng)站、購物網(wǎng)站等平臺的使用者,操作數(shù)據(jù)可以是目標對象的對某條數(shù)據(jù)或者某些數(shù)據(jù)的瀏覽、播放等形成的數(shù)據(jù)。數(shù)據(jù)庫中可以包括多條數(shù)據(jù),以視頻網(wǎng)站為例,數(shù)據(jù)庫中包括該視頻網(wǎng)站中全部的視頻節(jié)目,其中,每一個視頻節(jié)目可以為該數(shù)據(jù)庫中的數(shù)據(jù)庫中的一條數(shù)據(jù),并且,每一條數(shù)據(jù)都攜帶有數(shù)據(jù)參數(shù),數(shù)據(jù)參數(shù)包括數(shù)據(jù)標識、以及用戶對該條數(shù)據(jù)的用戶偏好。需要說明的是,用戶偏好可以是喜歡該視頻節(jié)目的用戶,例如,用戶偏好可以是點擊播放過該視頻節(jié)目的用戶的集合。算法模塊42,用于利用遺傳算法對待選數(shù)據(jù)集的數(shù)據(jù)進行處理得到目標數(shù)據(jù)集。具體地,遺傳算法可以包括選擇運算、交叉運算、變異運算,可以對待選數(shù)據(jù)集中的數(shù)據(jù)進行上述的運算,可以獲取到新的數(shù)據(jù)群體,可以將新的數(shù)據(jù)群體確定為目標數(shù)據(jù)集。需要說明的是,將遺傳算法應(yīng)用到獲取推薦數(shù)據(jù)的過程中,可以使推薦數(shù)據(jù)不斷的優(yōu)化,為用戶提供更加合適的推薦結(jié)果,可以有效的提高獲取推薦數(shù)據(jù)的效率。確定模塊44,用于當目標數(shù)據(jù)集中的數(shù)據(jù)的適應(yīng)度之和達到第一預設(shè)閾值時,根據(jù)目標數(shù)據(jù)集的數(shù)據(jù)確定目標對象的推薦數(shù)據(jù)。具體地,第一預設(shè)閾值可以是預先設(shè)置的,例如10。在上述確定模塊44中,可以通過適應(yīng)度函數(shù),計算目標數(shù)據(jù)集中每一條數(shù)據(jù)的適應(yīng)度,對目標數(shù)據(jù)集中每一條數(shù)據(jù)的適應(yīng)度進行求和運算,可以得到該目標數(shù)據(jù)集的適應(yīng)度之和。當該目標數(shù)據(jù)集的適應(yīng)度之和大于等于第一預設(shè)閾值時,可以將該目標數(shù)據(jù)集中的數(shù)據(jù)確定為目標對象的推薦數(shù)據(jù)?;蛘?,當該目標數(shù)據(jù)集的適應(yīng)度之和大于等于第一預設(shè)閾值時,可以對目標數(shù)據(jù)集中的數(shù)據(jù)按照適應(yīng)度的大小進行排序,選擇適應(yīng)度值高的一部分作為該目標對象的推薦數(shù)據(jù)。在本申請實施例中,通過上述選擇模塊40,用于根據(jù)目標對象的操作數(shù)據(jù)從數(shù)據(jù)庫中篩選得到待選數(shù)據(jù)集,其中,數(shù)據(jù)庫中的每一條數(shù)據(jù)至少包括如下參數(shù):數(shù)據(jù)標識和用戶偏好;算法模塊42,用于利用遺傳算法對待選數(shù)據(jù)集的數(shù)據(jù)進行處理得到目標數(shù)據(jù)集;確定模塊44,用于當目標數(shù)據(jù)集中的數(shù)據(jù)的適應(yīng)度之和達到第一預設(shè)閾值時,根據(jù)目標數(shù)據(jù)集的數(shù)據(jù)確定目標對象的推薦數(shù)據(jù)的方式,解決了無法準確得到推薦數(shù)據(jù)的問題??蛇x地,選擇模塊40包括:計算子模塊,用于通過數(shù)據(jù)庫中的每一條數(shù)據(jù)的數(shù)據(jù)標識和用戶偏好,計算得到數(shù)據(jù)庫中的任意兩條數(shù)據(jù)的數(shù)據(jù)關(guān)聯(lián)度。生成子模塊,用于根據(jù)目標對象的操作數(shù)據(jù)以及數(shù)據(jù)關(guān)聯(lián)度生成待選數(shù)據(jù)集。具體地,以視頻網(wǎng)站為例,用戶偏好可以是喜歡某一視頻節(jié)目的用戶的名稱。例如,喜歡節(jié)目1的用戶包括a、b、c,即,節(jié)目1的用戶偏好為a、b、c,喜歡節(jié)目2的用戶包括b、d、e,即,節(jié)目2的用戶偏好為b、d、e,則,節(jié)目1與節(jié)目2的數(shù)據(jù)關(guān)聯(lián)度為1/3。需要說明的是,數(shù)據(jù)關(guān)聯(lián)度可以是節(jié)目的相似度??蛇x地,算法模塊42包括。可選地,通過如下第一公式計算得到數(shù)據(jù)庫中的任意兩條數(shù)據(jù)的數(shù)據(jù)關(guān)聯(lián)度Wij:其中,i,j為自然數(shù),N(i)為喜歡節(jié)目i的用戶數(shù),N(j)為喜歡節(jié)目j的用戶數(shù)。N(i)∩N(j)可以表示同時喜歡節(jié)目i和節(jié)目j的用戶數(shù)??蛇x地,通過如下第二公式生成待選數(shù)據(jù)集Pij:其中,u為自然數(shù),N(u)為目標對象喜歡的節(jié)目的集合,Rui為常數(shù),表示目標對象對節(jié)目i的興趣程度。Rui可以是通過用戶評分或者節(jié)目的播放次數(shù)進行統(tǒng)計得來。與目標對象歷史上感興趣的節(jié)目越相似的節(jié)目,越有可能在目標對象的待選數(shù)據(jù)集中獲得比較高的排名??蛇x地,算法模塊42可以包括:編碼子模塊,用于對待選數(shù)據(jù)集中數(shù)據(jù)進行編碼操作,以無符號二進制數(shù)來表示待選數(shù)據(jù)集中數(shù)據(jù),其中,無符號二進制數(shù)中任一個數(shù)字為數(shù)據(jù)的一個基因。具體地,遺傳算法的運算對象是表示個體的符號串,所以必須把節(jié)目i和節(jié)目j編碼為一種符號串。節(jié)目推薦系統(tǒng)中,可以使用i和j的節(jié)目號的無符號二進制整數(shù)來表示。需要說明的是,假設(shè)節(jié)目庫中只有20個節(jié)目,用戶喜歡的節(jié)目有4個,因而節(jié)目i的編號可以取0-3,用2位無符號二進制整數(shù)來表示,除去用戶喜歡的節(jié)目有16個,所以節(jié)目j的編號可以取0-15之間的整數(shù),用4位無符號二進制整數(shù)來表示,將它們連接在一起所組成的6位無符號二進制數(shù)就形成了個體的基因型,表示一個可行解。例如,基因型X=011110所對應(yīng)的表現(xiàn)型是:x=[1,14]。個體的表現(xiàn)型x和基因型X之間可通過編碼和解碼程序相互轉(zhuǎn)換。還需要說明的是,遺傳算法是對群體進行的進化操作,需要給其淮備一些表示起始搜索點的初始群體數(shù)據(jù)。在上述舉例中,群體規(guī)模的大小取為4,即群體由4個個體組成,每個個體可通過隨機方法產(chǎn)生。如:100111,001000,011110,011101。算法子模塊,用于通過對無符號二進制數(shù)來表示的待選數(shù)據(jù)集中數(shù)據(jù)進行遺傳運算,得到目標數(shù)據(jù)集,其中,遺傳運算包括以下運算中的至少一項或者多項:選擇運算、交叉運算、變異運算??蛇x地,算法子模塊可以包括:選擇運算單元,用于計算待選數(shù)據(jù)集中數(shù)據(jù)的適應(yīng)度,通過適應(yīng)度來確定數(shù)據(jù)的遺傳概率,其中,遺傳概率用于確定數(shù)據(jù)被選中進行遺傳運算的次數(shù)。具體地,在遺傳算法中可以以個體適應(yīng)度的大小來評定各個個體的優(yōu)劣程度,從而決定其遺傳機會的大小。其中,個體適應(yīng)度即待選數(shù)據(jù)集中每一條數(shù)據(jù)的適應(yīng)度。在本申請實施例中第二公式總?cè)》秦撝?,并且是以求最大值為?yōu)化目標,所以可直接利用第二公式的函數(shù)值作為某一個體的適應(yīng)度。需要說明的是,在遺傳算法中,可以將待選數(shù)據(jù)集中適應(yīng)度較高的個體(即數(shù)據(jù))按某種規(guī)則或模型遺傳到下一代數(shù)據(jù)集中。也就是說,適應(yīng)度較高的個體可以有更多的機會遺傳到下一代群體中。以一種具體的應(yīng)用場景為例,先根據(jù)第二公式計算出待選數(shù)據(jù)集中每一條數(shù)據(jù)的適應(yīng)度的總和F:其次計算出每一條數(shù)據(jù)的適應(yīng)度的大小fi/F(i=1,2,…,M),該適應(yīng)度可以為每一條數(shù)據(jù)被遺傳到下一代群體中的概率。每個概率值組成一個區(qū)域,可知全部概率值之和為1,最后再產(chǎn)生一個0到1之間的隨機數(shù),依據(jù)該隨機數(shù)出現(xiàn)在上述哪一個概率區(qū)域內(nèi)來確定每一條數(shù)據(jù)被選中的次數(shù)。例如,假設(shè)節(jié)目i的感興趣程度,R0=1,R1=2,R2=3,R3=2.5,Wij從相似度表格中獲取。交叉運算單元,用于將選定的待選數(shù)據(jù)集中的數(shù)據(jù)進行交叉運算,得到第一子目標數(shù)據(jù)集,其中,交叉運算為將待選數(shù)據(jù)集中的被選中的數(shù)據(jù)進行隨機配對,通過隨機選擇數(shù)據(jù)的至少一個基因進行交換。具體地,交叉運算是遺傳算法中產(chǎn)生新個體的主要操作過程,它以某一概率相互交換某兩個數(shù)據(jù)之間的部分染色體。在一種具體的應(yīng)用場景中,可以先對選定的待選數(shù)據(jù)集中的數(shù)據(jù)進行隨機配對;其次隨機設(shè)置交叉點位置;最后再相互交換配對染色體之間的部分基因。變異運算單元,用于對第一子目標數(shù)據(jù)集的數(shù)據(jù)進行變異運算,得到目標數(shù)據(jù)集,其中,變異運算為隨機確定第一子目標數(shù)據(jù)集中數(shù)據(jù)的基因變異位置,對基因變異位置的基因值進行基因值取反操作。具體地,變異運算是對某一個數(shù)據(jù)的某一個或某一些基因座上的基因值按某一較小的概率進行改變,它也是產(chǎn)生新數(shù)據(jù)的一種操作方法。在一種具體的應(yīng)用場景中,首先確定出各個數(shù)據(jù)的基因變異位置,下表所示為隨機產(chǎn)生的變異點位置,其中的數(shù)字表示變異點設(shè)置在該基因座處;然后依照某一概率將變異點的原有基因值取反。個體編號交叉結(jié)果變異點變異結(jié)果子代群體p(1)11011102111110111110200101030000100000103010111601011001011040111001111100111100在一種具體應(yīng)用場景下,通過對待選數(shù)據(jù)集中數(shù)據(jù)進行選擇運算、交叉運算以及變異運算之后,可以得到如下目標數(shù)據(jù)集。個體編號目標數(shù)據(jù)集ij適應(yīng)度值占總數(shù)比11111103140.3*2.5=2.80.552000010020.5*1=0.50.103010110160.4*2=0.80.1641111003120.4*2.5=10.20總和5.11從上表中可以看出,經(jīng)過一次遺傳算法運算后,群體的適應(yīng)度的最大值得到了改進。上述本發(fā)明實施例序號僅僅為了描述,不代表實施例的優(yōu)劣。在本發(fā)明的上述實施例中,對各個實施例的描述都各有側(cè)重,某個實施例中沒有詳述的部分,可以參見其他實施例的相關(guān)描述。在本申請所提供的幾個實施例中,應(yīng)該理解到,所揭露的技術(shù)內(nèi)容,可通過其它的方式實現(xiàn)。其中,以上所描述的裝置實施例僅僅是示意性的,例如所述單元的劃分,可以為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,單元或模塊的間接耦合或通信連接,可以是電性或其它的形式。所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用軟件功能單元的形式實現(xiàn)。所述集成的單元如果以軟件功能單元的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可以存儲在一個計算機可讀取存儲介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機設(shè)備(可為個人計算機、服務(wù)器或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:U盤、只讀存儲器(ROM,Read-OnlyMemory)、隨機存取存儲器(RAM,RandomAccessMemory)、移動硬盤、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。以上所述僅是本發(fā)明的優(yōu)選實施方式,應(yīng)當指出,對于本
      技術(shù)領(lǐng)域
      的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應(yīng)視為本發(fā)明的保護范圍。當前第1頁1 2 3 
      當前第1頁1 2 3 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1