本發(fā)明涉及數(shù)據(jù)分析技術(shù)領(lǐng)域,具體涉及一種基于大數(shù)據(jù)和數(shù)據(jù)挖掘的個(gè)性化訂單推薦方法。
背景技術(shù):
現(xiàn)在社會(huì)每天都會(huì)產(chǎn)生海量的信息。面對(duì)這么多信息好多人都不知道什么信息是自己需要的。
隨著煙草行業(yè)電子商務(wù)的發(fā)展,積累了大量的用戶數(shù)據(jù)和行為數(shù)據(jù),如何有效的利用這些數(shù)據(jù)提高用戶的體驗(yàn)和煙草企業(yè)的經(jīng)濟(jì)效益,改變傳統(tǒng)的零售戶訂貨方式。
數(shù)據(jù)挖掘技術(shù)是近年來(lái)計(jì)算機(jī)技術(shù)發(fā)展的熱點(diǎn)之一。通過(guò)對(duì)歷史積累的大量數(shù)據(jù)的有效挖掘,可以發(fā)現(xiàn)隱藏的規(guī)律或模式,為決策提供支持,而這些規(guī)律或模式是不能夠依靠簡(jiǎn)單的數(shù)據(jù)查詢得到,或者是不能在可接受的時(shí)間內(nèi)得到。這些規(guī)律或模式可以進(jìn)一步在專業(yè)人員的識(shí)別下成為知識(shí)。數(shù)據(jù)挖掘面對(duì)的任務(wù)是復(fù)雜的,通常包括分類、預(yù)測(cè)、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)和聚類分析等。
Web數(shù)據(jù)挖掘建立在對(duì)大量的網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行分析的基礎(chǔ)上,采用相應(yīng)的數(shù)據(jù)挖掘算法,在具體的應(yīng)用模型上進(jìn)行數(shù)據(jù)的提取、數(shù)據(jù)篩選、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)挖掘和模式分析,最后做出歸納性的推理、預(yù)測(cè)客戶的個(gè)性化行為以及用戶習(xí)慣,從而幫助進(jìn)行決策和管理,減少?zèng)Q策的風(fēng)險(xiǎn)。
Web數(shù)據(jù)挖掘涉及多個(gè)領(lǐng)域,除數(shù)據(jù)挖掘外,還涉及計(jì)算機(jī)網(wǎng)絡(luò)、數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)儲(chǔ)、人工智能、信息檢索、可視化、自然語(yǔ)言理解等技術(shù)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明要解決的技術(shù)問(wèn)題是:本發(fā)明提供一種基于大數(shù)據(jù)和數(shù)據(jù)挖掘的個(gè)性化訂單推薦方法,通過(guò)對(duì)用戶數(shù)據(jù)和行為的挖掘,讓零售戶能夠快速找到合適自己銷售的卷煙,讓煙草企業(yè)能夠?qū)⒕頍熗扑]給適合的零售戶。
本發(fā)明所采用的技術(shù)方案為:
一種基于大數(shù)據(jù)和數(shù)據(jù)挖掘的個(gè)性化訂單推薦方法,所述方法通過(guò)計(jì)算用戶之間的相似度,找到與用戶有相似經(jīng)營(yíng)特征的用戶,基于用戶的相似度向用戶推薦相似用戶購(gòu)買的商品,提高推薦的準(zhǔn)確性。
所述方法中相似用戶生成過(guò)程如下:
對(duì)一個(gè)用戶,找到與該用戶有相似經(jīng)營(yíng)特征的用戶,并且把這組用戶購(gòu)買過(guò)的商品作為候選的推薦商品,一個(gè)用戶包含一組購(gòu)買歷史,即用戶購(gòu)買過(guò)的商品和數(shù)量,使用用戶的購(gòu)買數(shù)量向量來(lái)標(biāo)識(shí)用戶,使用Pearson關(guān)聯(lián)度量公式計(jì)算兩兩用戶向量之間的相似度sim(x,y):
其中:Pxy表示用戶x,y共同購(gòu)過(guò)的一組商品;
對(duì)一個(gè)用戶,選擇與其相似度由高到低排名前N個(gè)用戶作為相似用戶。
所述方法中預(yù)測(cè)商品評(píng)分過(guò)程如下:
對(duì)一個(gè)用戶,根據(jù)相似用戶購(gòu)買商品的數(shù)量,預(yù)測(cè)該用戶候選商品的可能性,并根據(jù)下述公式計(jì)算一組相似用戶候選商品的加權(quán)和:
ru,p=k∑u′∈U sim(u,u′)×ru′,p
其中k表示歸一化因子;
最后通過(guò)使用概率模型建模,計(jì)算用戶喜愛(ài)某件候選商品的概率。
本發(fā)明的有益效果為:
本發(fā)明通過(guò)對(duì)用戶數(shù)據(jù)和行為的挖掘,讓零售戶能夠快速找到合適自己銷售的卷煙,讓煙草企業(yè)能夠?qū)⒕頍熗扑]給適合的零售戶,在幫助煙草企業(yè)推銷商品,增大經(jīng)濟(jì)收益的同時(shí),也節(jié)省了用戶挑選商品的時(shí)間和精力。
具體實(shí)施方式
下面根據(jù)具體實(shí)施方式對(duì)本發(fā)明進(jìn)一步說(shuō)明:
實(shí)施例1:
一種基于大數(shù)據(jù)和數(shù)據(jù)挖掘的個(gè)性化訂單推薦方法,所述方法通過(guò)計(jì)算用戶之間的相似度,找到與用戶有相似經(jīng)營(yíng)特征的用戶,基于用戶的相似度向用戶推薦相似用戶購(gòu)買的商品,提高推薦的準(zhǔn)確性。
實(shí)施例2
在實(shí)施例1的基礎(chǔ)上,本實(shí)施例所述方法中相似用戶生成過(guò)程如下:
對(duì)一個(gè)用戶,找到與該用戶有相似經(jīng)營(yíng)特征的用戶,并且把這組用戶購(gòu)買過(guò)的商品作為候選的推薦商品,一個(gè)用戶包含一組購(gòu)買歷史,即用戶購(gòu)買過(guò)的商品和數(shù)量,使用用戶的購(gòu)買數(shù)量向量來(lái)標(biāo)識(shí)用戶,使用Pearson關(guān)聯(lián)度量公式計(jì)算兩兩用戶向量之間的相似度sim(x,y):
其中:Pxy表示用戶x,y共同購(gòu)過(guò)的一組商品;
對(duì)一個(gè)用戶,選擇與其相似度由高到低排名前N個(gè)用戶作為相似用戶。
實(shí)施例3
在實(shí)施例2的基礎(chǔ)上,本實(shí)施例所述方法中預(yù)測(cè)商品評(píng)分過(guò)程如下:
對(duì)一個(gè)用戶,根據(jù)相似用戶購(gòu)買商品的數(shù)量,預(yù)測(cè)該用戶候選商品的可能性,并根據(jù)下述公式計(jì)算一組相似用戶候選商品的加權(quán)和:
ru,p=k∑u′∈U sim(u,u′)×ru′,p
其中k表示歸一化因子;
所述方法通過(guò)使用概率模型建模,計(jì)算用戶喜愛(ài)某件候選商品的概率。
實(shí)施方式僅用于說(shuō)明本發(fā)明,而并非對(duì)本發(fā)明的限制,有關(guān)技術(shù)領(lǐng)域的普通技術(shù)人員,在不脫離本發(fā)明的精神和范圍的情況下,還可以做出各種變化和變型,因此所有等同的技術(shù)方案也屬于本發(fā)明的范疇,本發(fā)明的專利保護(hù)范圍應(yīng)由權(quán)利要求限定。