国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于領(lǐng)域?qū)<业耐扑]系統(tǒng)的制作方法

      文檔序號:6336925閱讀:442來源:國知局
      專利名稱:一種基于領(lǐng)域?qū)<业耐扑]系統(tǒng)的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及網(wǎng)絡(luò)服務(wù)領(lǐng)域,更具體地說,涉及一種基于領(lǐng)域?qū)<业耐扑]系統(tǒng)。
      背景技術(shù)
      現(xiàn)在很多推薦系統(tǒng)都采用了協(xié)同過濾算法,或者內(nèi)容過濾算法。協(xié)同過濾算法是通過挖掘用戶和項目間的隱含關(guān)系,向用戶推薦其可能感興趣的項目。內(nèi)容過濾算法是給定條件,基于項目自身相關(guān)屬性,把符合條件的項目過濾出來。這兩種算法都有自己各自的優(yōu)缺點協(xié)同過濾算法會有數(shù)據(jù)稀疏、冷啟動、擴展性差、新商品無法被推薦、新用戶無法得到推薦商品的問題;基于內(nèi)容的過濾由于沒有挖掘使用項目與項目之間、項目和用戶之間的各種關(guān)系,所以無法挖掘用戶潛在興趣點,整體的推薦效果不如協(xié)同過濾。有些推薦系統(tǒng)通過綜合使用內(nèi)容和協(xié)同過濾來克服當個算法的缺點,提高推薦系統(tǒng)的精準度。使用協(xié)同過濾算法基本思想是找出相似的用戶或相似的項目,通過相似用戶之間產(chǎn)生推薦或者把相似項目推薦給用戶。由于原始數(shù)據(jù)中會包含大量噪點數(shù)據(jù),對推薦系統(tǒng)產(chǎn)生不可預(yù)知的影響。為了解決噪點數(shù)據(jù)問題,需要現(xiàn)對原始數(shù)據(jù)進行預(yù)處理。

      發(fā)明內(nèi)容
      本發(fā)明要解決的技術(shù)問題在于,針對現(xiàn)有推薦系統(tǒng)的上述推薦精確度不高的缺陷,提供一種基于領(lǐng)域?qū)<业耐扑]系統(tǒng)。本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是構(gòu)造一種基于領(lǐng)域?qū)<业耐扑]系統(tǒng),在原始數(shù)據(jù)中挖掘出專家用戶,然后查找與當前用戶相似度最高的專家用戶,從而為當前用戶提供該專家用戶的相關(guān)項目作為推進項目結(jié)果集。本發(fā)明提供了一種基于領(lǐng)域?qū)<业耐扑]系統(tǒng),包括分布式數(shù)據(jù)庫模塊,用于保存項目數(shù)據(jù)、用戶數(shù)據(jù)和用戶行為歷史數(shù)據(jù);數(shù)據(jù)挖掘模塊,用于根據(jù)所述項目數(shù)據(jù)、用戶數(shù)據(jù)和用戶行為歷史數(shù)據(jù)挖掘用戶對項目好壞評分、用戶感興趣和潛在興趣的領(lǐng)域以及專家用戶數(shù)據(jù);挖掘結(jié)果數(shù)據(jù)庫模塊,用于保存所述用戶對項目好壞評分、用戶感興趣和潛在興趣的領(lǐng)域以及專家用戶數(shù)據(jù);基于領(lǐng)域評分推薦模塊,用于獲取用戶對項目好壞評分、用戶感興趣和潛在興趣的領(lǐng)域以及專家用戶數(shù)據(jù),計算獲取臨近專家列表,產(chǎn)生臨近專家推薦結(jié)果集;對外接口服務(wù)層模塊,采用網(wǎng)絡(luò)服務(wù)方式為外接訪問提供接口,接收用戶輸入的數(shù)據(jù)以及將臨近專家推薦結(jié)果集返回給用戶;數(shù)據(jù)寫入模塊,用于將用戶輸入的項目數(shù)據(jù)、用戶數(shù)據(jù)和用戶行為歷史數(shù)據(jù)寫入分布式數(shù)據(jù)庫模塊。在本發(fā)明所述的基于領(lǐng)域?qū)<业耐扑]系統(tǒng)中,所述推薦系統(tǒng)還包括上下文無關(guān)評分推薦模塊;所述數(shù)據(jù)挖掘模塊還根據(jù)所述項目數(shù)據(jù)、用戶數(shù)據(jù)和用戶行為歷史數(shù)據(jù)挖掘相似項目結(jié)果集和關(guān)聯(lián)項目結(jié)果集;所述上下文無關(guān)評分推薦模塊用于基于相似項目結(jié)果集、關(guān)聯(lián)項目結(jié)果集,采用基于內(nèi)容過濾的方法為用戶當前行為提供相關(guān)和相似產(chǎn)品的推薦結(jié)果集;所述對外接口服務(wù)層模塊還根據(jù)不同時間場合的需要,選擇調(diào)用接口,從而將臨近專家推薦結(jié)果集或者相關(guān)和相似產(chǎn)品的推薦結(jié)果集返回給用戶。在本發(fā)明所述的基于領(lǐng)域?qū)<业耐扑]系統(tǒng)中,所述數(shù)據(jù)挖掘模塊通過用戶行為歷史數(shù)據(jù)中用戶直接標注的感興趣領(lǐng)域確定用戶感興趣的領(lǐng)域,根據(jù)用戶行為歷史數(shù)據(jù)中用戶的位置、性別、身份、職業(yè)和受教育情況,用戶搜索時關(guān)鍵字,以及用戶點擊、查看和購買項目記錄進行綜合統(tǒng)計分析及語義分析處理得用戶潛在興趣的領(lǐng)域。在本發(fā)明所述的基于領(lǐng)域?qū)<业耐扑]系統(tǒng)中,所述數(shù)據(jù)挖掘模塊根據(jù)所述用戶行為歷史數(shù)據(jù)計算所有用戶在各領(lǐng)域內(nèi)的參與度、影響力和評分偏差,篩選出高于預(yù)設(shè)的參與度、影響力和評分偏差的用戶為專家用戶,保存為該領(lǐng)域的專家用戶數(shù)據(jù)。在本發(fā)明所述的基于領(lǐng)域?qū)<业耐扑]系統(tǒng)中,所述數(shù)據(jù)挖掘模塊還綜合用戶設(shè)置或?qū)氲膶<矣脩糍Y料,保存為專家用戶數(shù)據(jù)。在本發(fā)明所述的基于領(lǐng)域?qū)<业耐扑]系統(tǒng)中,所述基于領(lǐng)域評分推薦模塊,在用戶感興趣和潛在興趣的領(lǐng)域內(nèi),利用用戶對項目好壞評分數(shù)據(jù)采用皮爾遜相關(guān)性來計算用戶與專家用戶的評分相似度,獲取臨近專家列表。在本發(fā)明所述的基于領(lǐng)域?qū)<业耐扑]系統(tǒng)中,所述數(shù)據(jù)挖掘模塊采用余弦相似性、修正的余弦相似性和皮爾遜相關(guān)性計算項目相似度,產(chǎn)生相似項目結(jié)果集。在本發(fā)明所述的基于領(lǐng)域?qū)<业耐扑]系統(tǒng)中,所述數(shù)據(jù)挖掘模塊采用增量式挖掘方法,計算所有關(guān)聯(lián)項目對出現(xiàn)的次數(shù),找出出現(xiàn)次數(shù)最多的預(yù)設(shè)數(shù)量對,作為關(guān)聯(lián)項目結(jié)果集。在本發(fā)明所述的基于領(lǐng)域?qū)<业耐扑]系統(tǒng)中,所述分布式數(shù)據(jù)庫模塊按照相關(guān)領(lǐng)域自然分類,以項目類別樹的方式將各個項目數(shù)據(jù)作為節(jié)點存儲。在本發(fā)明所述的基于領(lǐng)域?qū)<业耐扑]系統(tǒng)中,所述上下文無關(guān)評分推薦模塊還基于用戶對項目好壞評分,對為用戶當前行為提供的相關(guān)和相似產(chǎn)品的推薦結(jié)果集進行項目的排序。實施本發(fā)明的基于領(lǐng)域?qū)<业耐扑]系統(tǒng),具有以下有益效果本發(fā)明通過在分布式數(shù)據(jù)庫中挖掘出專家用戶,然后查找與當前用戶相似度較高的專家用戶,從而為當前用戶提供該專家用戶的相關(guān)項目作為推進項目結(jié)果集,本發(fā)明采用領(lǐng)域?qū)<业耐扑]方式,具有權(quán)威性,有效地提供了推薦的精確度。且本發(fā)明可以組合常規(guī)推薦方式成為混合推薦系統(tǒng),從而根據(jù)不同的場合為用戶提供更加準確的推薦結(jié)果。


      下面將結(jié)合附圖及實施例對本發(fā)明作進一步說明,附圖中圖1為根據(jù)本發(fā)明的第一實施例中基于領(lǐng)域?qū)<业耐扑]系統(tǒng)的模塊示意圖;圖2為根據(jù)本發(fā)明的第二實施例中基于領(lǐng)域?qū)<业耐扑]系統(tǒng)的模塊示意圖;圖3為根據(jù)本發(fā)明的基于領(lǐng)域?qū)<业耐扑]系統(tǒng)生成的項目類別樹示意圖;圖如為傳統(tǒng)的基于用戶的推薦系統(tǒng)挖掘關(guān)系示意圖4b為根據(jù)本發(fā)明的基于領(lǐng)域?qū)<业耐扑]系統(tǒng)的挖掘關(guān)系示意圖;圖5為根據(jù)本發(fā)明的對外接口服務(wù)層模塊的工作過程示意圖。
      具體實施例方式為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及實施例,對本發(fā)明進行進一步詳細說明。在實際生活中,相對普通人來說,專家總是某一個領(lǐng)域內(nèi)部比較重要的人士。所以與某專家領(lǐng)域相關(guān)的,專家說的話一般份量是比較重的,更容易讓人信服。在電子商務(wù)領(lǐng)域,如果專家說某項產(chǎn)品非常好,那么該產(chǎn)品是好產(chǎn)品的可能性也就很大,用戶購買的欲望也會隨之增加。而且人們總是充滿好奇心的,人們也想指導自己所處領(lǐng)域的專家們做了些事情,他們經(jīng)常購買了哪些商品,例如讀什么書、看什么電影等。所以在推薦系統(tǒng)中,如果能夠找出其中的專家用戶,這樣對于系統(tǒng)推薦將會產(chǎn)生莫大的幫助。因此,可以根據(jù)專家用戶的項目數(shù)據(jù)向用戶推薦商品。本發(fā)明用于電子商務(wù)領(lǐng)域的商務(wù)推薦,組合采用多種推薦技術(shù),發(fā)揮各種推薦技術(shù)的長處,進行推薦結(jié)果的比較優(yōu)化,不斷改善推薦服務(wù)過程,提高了系統(tǒng)的適用性。該系統(tǒng)采取分布式的、松耦合的、模塊化的系統(tǒng)結(jié)構(gòu),提供一個對外的web服務(wù)接口,可以獨立出來運行,同時為多個電子商務(wù)網(wǎng)站提供推薦服務(wù)。請參閱圖1,為根據(jù)本發(fā)明的第一實施例中基于領(lǐng)域?qū)<业耐扑]系統(tǒng)的模塊示意圖。如圖1所示,本發(fā)明第一實施例提供的推薦系統(tǒng)100,至少包括分布式數(shù)據(jù)庫模塊102、 數(shù)據(jù)挖掘模塊104、挖掘結(jié)果數(shù)據(jù)庫模塊106、基于領(lǐng)域評分推薦模塊108、對外接口服務(wù)層模塊110和數(shù)據(jù)寫入模塊112。分布式數(shù)據(jù)庫模塊102,用于保存項目數(shù)據(jù)、用戶數(shù)據(jù)和用戶行為歷史數(shù)據(jù)。保存項目數(shù)據(jù)、用戶數(shù)據(jù)、用戶行為歷史數(shù)據(jù)。因此,分布式數(shù)據(jù)庫模塊102設(shè)有分類項目數(shù)據(jù)庫102-1、用戶數(shù)據(jù)庫102-2和用戶行為歷史數(shù)據(jù)庫102-3。數(shù)據(jù)挖掘模塊104用于根據(jù)所述項目數(shù)據(jù)、用戶數(shù)據(jù)和用戶行為歷史數(shù)據(jù)挖掘用戶對項目好壞評分、用戶感興趣和潛在興趣的領(lǐng)域以及專家用戶數(shù)據(jù)。數(shù)據(jù)挖掘模塊104 通過用戶行為歷史數(shù)據(jù)中用戶直接標注的感興趣領(lǐng)域確定用戶感興趣的領(lǐng)域,根據(jù)用戶行為歷史數(shù)據(jù)中用戶的位置、性別、身份、職業(yè)和受教育情況,用戶搜索時關(guān)鍵字,以及用戶點擊、查看和購買項目記錄進行綜合統(tǒng)計分析及語義分析處理得用戶潛在興趣的領(lǐng)域。數(shù)據(jù)挖掘模塊104根據(jù)所述用戶行為歷史數(shù)據(jù)計算所有用戶在各領(lǐng)域內(nèi)的參與度、影響力和評分偏差,篩選出高于預(yù)設(shè)的參與度、影響力和評分偏差的用戶為專家用戶,保存為該領(lǐng)域的專家用戶數(shù)據(jù)。挖掘結(jié)果數(shù)據(jù)庫模塊106用于保存所述用戶對項目好壞評分、用戶感興趣和潛在興趣的領(lǐng)域以及專家用戶數(shù)據(jù)?;陬I(lǐng)域評分推薦模塊108用于獲取用戶對項目好壞評分、用戶感興趣和潛在興趣的領(lǐng)域以及專家用戶數(shù)據(jù),計算獲取臨近專家列表,產(chǎn)生臨近專家推薦結(jié)果集。對外接口服務(wù)層模塊110采用網(wǎng)絡(luò)服務(wù)方式為外接訪問提供接口,接收用戶輸入的數(shù)據(jù)以及將臨近專家推薦結(jié)果集返回給用戶。數(shù)據(jù)寫入模塊112用于將用戶輸入的項目數(shù)據(jù)、用戶數(shù)據(jù)和用戶行為歷史數(shù)據(jù)寫入分布式數(shù)據(jù)庫模塊。請參閱圖2,為根據(jù)本發(fā)明的第二實施例中基于領(lǐng)域?qū)<业耐扑]系統(tǒng)的模塊示意圖。如圖2所示,本發(fā)明第二實施例提供的推薦系統(tǒng)200與第一實施例中推薦系統(tǒng)100的功能和結(jié)構(gòu)類似,區(qū)別僅在于增設(shè)了上下文無關(guān)評分推薦模塊214。數(shù)據(jù)挖掘模塊204還根據(jù)所述項目數(shù)據(jù)、用戶數(shù)據(jù)和用戶行為歷史數(shù)據(jù)挖掘相似項目結(jié)果集和關(guān)聯(lián)項目結(jié)果集。上下文無關(guān)評分推薦模塊214用于基于相似項目結(jié)果集、關(guān)聯(lián)項目結(jié)果集,采用基于內(nèi)容過濾的方法為用戶當前行為提供相關(guān)和相似產(chǎn)品的推薦結(jié)果集。對外接口服務(wù)層模塊210還根據(jù)不同時間場合的需要,選擇調(diào)用接口,從而將臨近專家推薦結(jié)果集或者相關(guān)和相似產(chǎn)品的推薦結(jié)果集返回給用戶。下面參照第二實施例對本發(fā)明的各個模塊的功能進行具體說明。1、分布式數(shù)據(jù)庫模塊分布式數(shù)據(jù)庫模塊202用于保存項目數(shù)據(jù)、用戶數(shù)據(jù)、用戶行為歷史數(shù)據(jù)。相應(yīng)地,分布式數(shù)據(jù)庫模塊202中設(shè)有分類項目數(shù)據(jù)庫202-1、用戶數(shù)據(jù)庫202-2和用戶行為歷史數(shù)據(jù)庫202-3。其中,分類項目數(shù)據(jù)庫202-1保存的項目數(shù)據(jù)包括關(guān)于該項目自身的相關(guān)屬性(假設(shè)項目為書本,那么項目數(shù)據(jù)就可以包含ISBN、作者、出版社、出版年份、類別、摘要等)。項目是按照相關(guān)領(lǐng)域自然分類存儲的,這樣便會生成一顆項目類別樹CT(Catal0g Tree)。請參照圖3,為根據(jù)本發(fā)明的基于領(lǐng)域?qū)<业耐扑]系統(tǒng)生成的項目類別樹示意圖。 網(wǎng)站商品為項目,項目可以按照相關(guān)領(lǐng)域自然分類,例如圖3中,分為電影和圖書,而圖書進一步分成計算機科學、生物、哲學和化學等。計算機科學又分為數(shù)據(jù)挖掘、人工智能、語義網(wǎng)、多媒體等。各類別之間并不是完全排斥,即一種商品可以同時屬于多個類別(例如,一本書可以是數(shù)據(jù)挖掘類別的,同時還可以是人工智能類別的)。用戶數(shù)據(jù)保存用戶的個人相關(guān)隱私信息,例如姓名、性另I」、職業(yè)、興趣、愛好等。用戶行為歷史數(shù)據(jù)包括用戶在瀏覽器上瀏覽相關(guān)服務(wù)網(wǎng)站的所有行為數(shù)據(jù),例如點擊查看過的項目、搜索過的關(guān)鍵字、購買過的商品、想購買的商品、商品評分、反饋意見寸。2、數(shù)據(jù)挖掘模塊數(shù)據(jù)挖掘模塊204是本系統(tǒng)的核心模塊,挖掘項目和項目、用戶和用戶、項目和用戶之間的關(guān)系,根據(jù)相應(yīng)規(guī)則挖掘出一般用戶領(lǐng)域特征、領(lǐng)域?qū)<矣脩艉蚑OP-N關(guān)聯(lián)項目, 利用用戶歷史行為數(shù)據(jù)挖掘用戶的興趣、愛好。數(shù)據(jù)挖掘模塊主要包括以下幾個方面1)計算項目相似度項目相似計算主要有余弦相似性、修正的余弦相似性和皮爾遜相關(guān)性,產(chǎn)生相似項目結(jié)果集。2)挖掘TOP-N關(guān)聯(lián)項目采取一種增量式挖掘方法,計算所有項目對(A,B)出現(xiàn)的次數(shù)Count (A, B),找出 Count (A, B)出現(xiàn)次數(shù)最多的前N對,作為關(guān)聯(lián)項目結(jié)果集。3)用戶背景、行為歷史數(shù)據(jù)的挖掘用戶背景和行為歷史數(shù)據(jù)的挖掘主要是為了挖掘所在領(lǐng)域以及潛在的感興趣的領(lǐng)域。數(shù)據(jù)挖掘模塊可以通過用戶行為歷史數(shù)據(jù)中用戶直接標注的感興趣領(lǐng)域確定用戶感興趣的領(lǐng)域,還可以根據(jù)用戶行為歷史數(shù)據(jù)中用戶的位置、性別、身份、職業(yè)和受教育情況, 用戶搜索時關(guān)鍵字,以及用戶點擊、查看和購買項目記錄進行綜合統(tǒng)計分析及語義分析處理得用戶潛在興趣的領(lǐng)域。4)挖掘?qū)<矣脩羧鐖D如和圖4b所示,傳統(tǒng)的基于用戶的推薦(圖4a)是直接挖掘用戶和所有項目的關(guān)系,而基于領(lǐng)域?qū)<矣脩舻耐扑]系統(tǒng)(圖4b)則優(yōu)化了傳統(tǒng)用戶和項目間的關(guān)系,挖掘了專家、領(lǐng)域和項目之間的相互關(guān)系。專家用戶與領(lǐng)域相關(guān),不同的領(lǐng)域需要采取不同的策略。為了挖掘?qū)<矣脩?,我們可以利用用戶背景、用戶評論、用戶參與活躍程度等信息。一個用戶可以是多個領(lǐng)域的專家。項目數(shù)據(jù)按照自然類別存儲,那么可以把每一個子類別當作一個領(lǐng)域,施加不同的策略模式,在各個子領(lǐng)域采取挖掘各自專家用戶。由于有些子領(lǐng)域的劃分可能比較細,這樣需要合并子領(lǐng)域的專家。下面對基于領(lǐng)域分類的專家用戶的挖掘方法進行描述挖掘?qū)<抑辽儆袃煞N方法一種是通過人工的直接指定、導入一定量的專家數(shù)據(jù) (這些數(shù)據(jù)可以是現(xiàn)存的,已經(jīng)被某些網(wǎng)站、服務(wù)所使用的),還有可能就是系統(tǒng)通過人工篩選,直接指定某用戶為專家用戶;另一種就是通過數(shù)據(jù)挖掘的方法。由于專家的挖掘方法一般是與領(lǐng)域相關(guān)的,不同的領(lǐng)域應(yīng)該會有自己所適應(yīng)的挖掘算法。一般說來,所有領(lǐng)域的專家應(yīng)有以下幾個共同的特點1.、專家的參與度比較高, 關(guān)鍵的一點是專家對項目的評分會比一般用戶多得多;2、專家的影響力比一般用戶要大得多,即專家會受到更多的關(guān)注;3、專家對于項目的評分比一般用戶的評分可信度更高,即專家的評分更能反映項目實際好壞程度。在此,本系統(tǒng)以網(wǎng)上賣書為例,描述一種基于領(lǐng)域分類的專家用戶的挖掘方法。如圖3所示,對于一般的網(wǎng)絡(luò)商品,可以自然歸類成一課繼承的類別樹CT。在一顆類別樹中, 會存在多個葉子節(jié)點CL。如果把一個葉子節(jié)點領(lǐng)域,那么我們只需計算出各葉子節(jié)點內(nèi)的專家用戶。我們假設(shè)領(lǐng)域D(i)是對應(yīng)類別樹的一個節(jié)點i。U表示所有用戶的集合,M表
      示用戶個數(shù)。I⑴表示領(lǐng)域D(i)內(nèi)所有項目的集合,I (i,j)表示領(lǐng)域D(i)內(nèi)的第j個項目。1.計算所有用戶在D(i)內(nèi)的參與度P,本模型用P(i,j)表示領(lǐng)域i內(nèi)用戶j的
      參與度。P(i,j)=用戶在領(lǐng)域D(i)內(nèi)的評論總數(shù);2.計算所有用戶在D(i)內(nèi)的影響力E,E(i,j)表示領(lǐng)域i內(nèi)用戶j的影響力。E(i,j)=贊成用戶評論的回復(fù)數(shù)-反對用戶評論的回復(fù)數(shù)*0. 9;3.計算所有用戶評分與平均評分的偏差R,R(i,j)表示領(lǐng)域i內(nèi)用戶j評分同平均評分的偏差。計算出所有用戶在領(lǐng)域D (i)的參與度、影響力和評分偏差之后,便可設(shè)置專家用戶最低參與度、最低影響力的、和最大評分偏差的閥值,篩選出高于預(yù)設(shè)的參與度、影響力和評分偏差的用戶為專家用戶,保存為該領(lǐng)域的專家用戶數(shù)據(jù)。3、挖掘結(jié)果數(shù)據(jù)庫模塊
      挖掘結(jié)果數(shù)據(jù)庫模塊206用于保存挖掘結(jié)果。挖掘結(jié)果是指關(guān)聯(lián)的項目、相似的項目、用戶對項目好壞評分、專家用戶數(shù)據(jù)、用戶感興趣和潛在興趣的領(lǐng)域。這些數(shù)據(jù)保存在關(guān)系型的數(shù)據(jù)庫中,以方便讀取。在此,用戶對項目好壞評分、專家用戶數(shù)據(jù)、用戶感興趣和潛在興趣的領(lǐng)域可以保存在興趣專家數(shù)據(jù)庫206-1中,而關(guān)聯(lián)的項目和相似的項目可以保存在相似關(guān)聯(lián)數(shù)據(jù)庫206-2中。具體的挖掘過程參考數(shù)據(jù)挖掘模塊。4、基于領(lǐng)域評分推薦模塊基于領(lǐng)域評分推薦模塊208結(jié)合用戶對項目好壞評分、用戶感興趣和潛在興趣的領(lǐng)域以及專家用戶數(shù)據(jù),其中包括用戶背景知識、用戶歷史行為知識和領(lǐng)域知識進行推薦。
      如用戶給項目的評分、項目被查看次數(shù)和被購買次數(shù)、用戶領(lǐng)域內(nèi)近似專家感興趣的項目。本系統(tǒng)采用皮爾遜相關(guān)性來計算某個用戶U與專家用戶EU的相似性,定義用戶i、 j的相似度為
      權(quán)利要求
      1.一種基于領(lǐng)域?qū)<业耐扑]系統(tǒng),其特征在于,包括分布式數(shù)據(jù)庫模塊,用于保存項目數(shù)據(jù)、用戶數(shù)據(jù)和用戶行為歷史數(shù)據(jù); 數(shù)據(jù)挖掘模塊,用于根據(jù)所述項目數(shù)據(jù)、用戶數(shù)據(jù)和用戶行為歷史數(shù)據(jù)挖掘用戶對項目好壞評分、用戶感興趣和潛在興趣的領(lǐng)域以及專家用戶數(shù)據(jù);挖掘結(jié)果數(shù)據(jù)庫模塊,用于保存所述用戶對項目好壞評分、用戶感興趣和潛在興趣的領(lǐng)域以及專家用戶數(shù)據(jù);基于領(lǐng)域評分推薦模塊,用于獲取用戶對項目好壞評分、用戶感興趣和潛在興趣的領(lǐng)域以及專家用戶數(shù)據(jù),計算獲取臨近專家列表,產(chǎn)生臨近專家推薦結(jié)果集;對外接口服務(wù)層模塊,采用網(wǎng)絡(luò)服務(wù)方式為外接訪問提供接口,接收用戶輸入的數(shù)據(jù)以及將臨近專家推薦結(jié)果集返回給用戶;數(shù)據(jù)寫入模塊,用于將用戶輸入的項目數(shù)據(jù)、用戶數(shù)據(jù)和用戶行為歷史數(shù)據(jù)寫入分布式數(shù)據(jù)庫模塊。
      2.根據(jù)權(quán)利要求1所述的基于領(lǐng)域?qū)<业耐扑]系統(tǒng),其特征在于,所述推薦系統(tǒng)還包括上下文無關(guān)評分推薦模塊;所述數(shù)據(jù)挖掘模塊還根據(jù)所述項目數(shù)據(jù)、用戶數(shù)據(jù)和用戶行為歷史數(shù)據(jù)挖掘相似項目結(jié)果集和關(guān)聯(lián)項目結(jié)果集;所述上下文無關(guān)評分推薦模塊用于基于相似項目結(jié)果集、關(guān)聯(lián)項目結(jié)果集,采用基于內(nèi)容過濾的方法為用戶當前行為提供相關(guān)和相似產(chǎn)品的推薦結(jié)果集;所述對外接口服務(wù)層模塊還根據(jù)不同時間場合的需要,選擇調(diào)用接口,從而將臨近專家推薦結(jié)果集或者相關(guān)和相似產(chǎn)品的推薦結(jié)果集返回給用戶。
      3.根據(jù)權(quán)利要求1或2所述的基于領(lǐng)域?qū)<业耐扑]系統(tǒng),其特征在于,所述數(shù)據(jù)挖掘模塊通過用戶行為歷史數(shù)據(jù)中用戶直接標注的感興趣領(lǐng)域確定用戶感興趣的領(lǐng)域,根據(jù)用戶行為歷史數(shù)據(jù)中用戶的位置、性別、身份、職業(yè)和受教育情況,用戶搜索時關(guān)鍵字,以及用戶點擊、查看和購買項目記錄進行綜合統(tǒng)計分析及語義分析處理得用戶潛在興趣的領(lǐng)域。
      4.根據(jù)權(quán)利要求1或2所述的基于領(lǐng)域?qū)<业耐扑]系統(tǒng),其特征在于,所述數(shù)據(jù)挖掘模塊根據(jù)所述用戶行為歷史數(shù)據(jù)計算所有用戶在各領(lǐng)域內(nèi)的參與度、影響力和評分偏差,篩選出高于預(yù)設(shè)的參與度、影響力和評分偏差的用戶為專家用戶,保存為該領(lǐng)域的專家用戶數(shù)據(jù)。
      5.根據(jù)權(quán)利要求4所述的基于領(lǐng)域?qū)<业耐扑]系統(tǒng),其特征在于,所述數(shù)據(jù)挖掘模塊還綜合用戶設(shè)置或?qū)氲膶<矣脩糍Y料,保存為專家用戶數(shù)據(jù)。
      6.根據(jù)權(quán)利要求1或2所述的基于領(lǐng)域?qū)<业耐扑]系統(tǒng),其特征在于,所述基于領(lǐng)域評分推薦模塊,在用戶感興趣和潛在興趣的領(lǐng)域內(nèi),利用用戶對項目好壞評分數(shù)據(jù)采用皮爾遜相關(guān)性來計算用戶與專家用戶的評分相似度,獲取臨近專家列表。
      7.根據(jù)權(quán)利要求2所述的基于領(lǐng)域?qū)<业耐扑]系統(tǒng),其特征在于,所述數(shù)據(jù)挖掘模塊采用余弦相似性、修正的余弦相似性和皮爾遜相關(guān)性計算項目相似度,產(chǎn)生相似項目結(jié)果集。
      8.根據(jù)權(quán)利要求2所述的基于領(lǐng)域?qū)<业耐扑]系統(tǒng),其特征在于,所述數(shù)據(jù)挖掘模塊采用增量式挖掘方法,計算所有關(guān)聯(lián)項目對出現(xiàn)的次數(shù),找出出現(xiàn)次數(shù)最多的預(yù)設(shè)數(shù)量對, 作為關(guān)聯(lián)項目結(jié)果集。
      9.根據(jù)權(quán)利要求2所述的基于領(lǐng)域?qū)<业耐扑]系統(tǒng),其特征在于,所述分布式數(shù)據(jù)庫模塊按照相關(guān)領(lǐng)域自然分類,以項目類別樹的方式將各個項目數(shù)據(jù)作為節(jié)點存儲。
      10.根據(jù)權(quán)利要求2所述的基于領(lǐng)域?qū)<业耐扑]系統(tǒng),其特征在于,所述上下文無關(guān)評分推薦模塊還基于用戶對項目好壞評分,對為用戶當前行為提供的相關(guān)和相似產(chǎn)品的推薦結(jié)果集進行項目的排序。
      全文摘要
      本發(fā)明涉及一種基于領(lǐng)域?qū)<业耐扑]系統(tǒng),包括分布式數(shù)據(jù)庫模塊、數(shù)據(jù)挖掘模塊、挖掘結(jié)果數(shù)據(jù)庫模塊、基于領(lǐng)域評分推薦模塊、對外接口服務(wù)層模塊和數(shù)據(jù)寫入模塊;該推薦系統(tǒng)根據(jù)項目數(shù)據(jù)、用戶數(shù)據(jù)和用戶行為歷史數(shù)據(jù)挖掘用戶對項目好壞評分、用戶感興趣和潛在興趣的領(lǐng)域以及專家用戶數(shù)據(jù),并計算獲取當前用戶的臨近專家列表,產(chǎn)生臨近專家推薦結(jié)果集返回給用戶。本發(fā)明采用領(lǐng)域?qū)<业耐扑]方式,具有權(quán)威性,有效地提供了推薦的精確度,且可以與常規(guī)推薦方式組成混合推薦系統(tǒng)使用,從而根據(jù)不同的場合為用戶提供更加準確的推薦結(jié)果。
      文檔編號G06F17/30GK102479202SQ20101056166
      公開日2012年5月30日 申請日期2010年11月26日 優(yōu)先權(quán)日2010年11月26日
      發(fā)明者張進軍, 鐘小武 申請人:卓望數(shù)碼技術(shù)(深圳)有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1