客戶流失預(yù)測方法以及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及人工智能領(lǐng)域,尤其涉及一種客戶流失預(yù)測方法以及裝置。
【背景技術(shù)】
[0002]隨著網(wǎng)絡(luò)游戲行業(yè)的迅速發(fā)展,各個游戲研發(fā)商和發(fā)行商競爭激烈,游戲玩家容易流失,帶來游戲研發(fā)商和發(fā)行商經(jīng)濟(jì)上的損失,挫傷游戲研發(fā)商和發(fā)行商的開發(fā)網(wǎng)絡(luò)游戲的積極性,長此以往,會造成文化產(chǎn)業(yè)的損失。所以,游戲玩家流失的預(yù)警對于游戲研發(fā)商和發(fā)行商來說十分重要。
[0003]但是,在現(xiàn)有技術(shù)下,只能通過人工篩選的方法來尋找可能會流失的游戲玩家。人工篩選的一個缺點(diǎn)是效率低,由于人工篩選的效率低,所以經(jīng)常在錯失預(yù)警的最佳時(shí)間后才尋找到準(zhǔn)備流失的游戲玩家(下面簡稱準(zhǔn)流失玩家),此時(shí),對準(zhǔn)流失玩家的挽留工作難度會急劇變大。甚至,最嚴(yán)重的是,在游戲玩家徹底流失而不再登錄游戲平臺后,才尋找到已經(jīng)流失的游戲玩家,此時(shí),已無法再聯(lián)系游戲玩家進(jìn)行挽留工作,導(dǎo)致?lián)p失無法挽回。人工篩選的另一個缺點(diǎn)是準(zhǔn)確性差,由于人工篩選時(shí)只能通過單一的篩選規(guī)則進(jìn)行篩選,所以經(jīng)常會出現(xiàn)誤判。例如,人工篩選規(guī)則通常定義為最近一周內(nèi)的充值次數(shù)小于2次且充值金額小于1000元的游戲玩家被預(yù)測為準(zhǔn)流失玩家,但是,對于上升期的玩家,盡管充值次數(shù)不多,金額也小于1000元,卻不應(yīng)該被認(rèn)為為準(zhǔn)流失玩家,對于高級游戲玩家,盡管充值次數(shù)大于兩次或者充值金額大于1000元,也極有可能是準(zhǔn)流失玩家等等。對非準(zhǔn)流失玩家的誤判而實(shí)施挽留工作會造成資源的浪費(fèi),而對事實(shí)為準(zhǔn)流失玩家的誤判而沒有實(shí)施挽留工作會導(dǎo)致?lián)p失無法挽回。
【發(fā)明內(nèi)容】
[0004]本發(fā)明實(shí)施例所要解決的技術(shù)問題在于,提供一種客戶流失預(yù)測方法以及裝置,能夠快速、準(zhǔn)確地預(yù)測具有流失傾向的客戶。
[0005]本發(fā)明提供了一種客戶流失預(yù)測方法,包括如下步驟:根據(jù)采集到的客戶的歷史數(shù)據(jù)對所述客戶進(jìn)行分組以獲得多個對應(yīng)預(yù)測模型的客戶類型;建立多個預(yù)測模型,其中,不同的客戶類型對應(yīng)不同的預(yù)測模型;通過流失規(guī)則從同一客戶類型的客戶中識別出流失客戶和未知客戶以獲得訓(xùn)練樣本,其中,不同的客戶類型對應(yīng)不同的流失規(guī)則;使用所述訓(xùn)練樣本對對應(yīng)的預(yù)測模型進(jìn)行訓(xùn)練;根據(jù)所述未知客戶的現(xiàn)時(shí)數(shù)據(jù)以及對應(yīng)的預(yù)測模型預(yù)測所述未知客戶是否有流失傾向。
[0006]可選地,所述客戶的歷史數(shù)據(jù)包括所述客戶的基礎(chǔ)信息以及所述客戶的行為信息,所述客戶的基礎(chǔ)信息包括年齡、性別、注冊地、等級、客戶端登陸狀況中的任意一種或者多種的組合,所述客戶的行為信息包括登陸信息、充值信息、消費(fèi)信息、事件信息中的任意一種或者多種的組合。
[0007]可選地,所述登陸信息包括統(tǒng)計(jì)日前i天登陸游戲大廳的次數(shù)、登陸游戲大廳的天數(shù)、登陸游戲大廳的時(shí)長、登陸游戲大廳的趨勢、登陸游戲的次數(shù)、登陸游戲的天數(shù)、登陸游戲的時(shí)長、登陸游戲的趨勢中的任意一種或者多種的組合;所述充值信息包括統(tǒng)計(jì)日前i天游戲大廳的充值的次數(shù)、游戲大廳的充值的天數(shù)、游戲大廳的充值的金額、游戲大廳的充值的趨勢、游戲的充值的次數(shù)、游戲的充值的天數(shù)、游戲的充值的金額、游戲的充值的趨勢中的任意一種或者多種的組合;所述消費(fèi)信息包括統(tǒng)計(jì)日前i天游戲大廳的消費(fèi)的次數(shù)、游戲大廳的消費(fèi)的天數(shù)、游戲大廳的消費(fèi)的金額、游戲大廳的消費(fèi)的趨勢、游戲的消費(fèi)的次數(shù)、游戲的消費(fèi)的天數(shù)、游戲的消費(fèi)的金額、游戲的消費(fèi)的趨勢中的任意一種或者多種的組合;所述事件信息包括統(tǒng)計(jì)日前i天客戶參與的游戲總類數(shù)量、客戶參與的游戲風(fēng)格占比,客戶參與的游戲題材占比、過關(guān)失敗次數(shù)、使用道具數(shù)、游戲風(fēng)格、游戲題材中的任意一種或者多種的組合,其中,i為大于零的正整數(shù)。
[0008]可選地,根據(jù)采集到的客戶的歷史數(shù)據(jù)對所述客戶進(jìn)行分類以獲得多個客戶類型具體為:根據(jù)采集到的客戶的歷史數(shù)據(jù)并通過聚類算法對所述客戶進(jìn)行分類以獲得多個客戶類型。
[0009]可選地,所述聚類算法為k-means聚類算法、K-Medoids聚類算法、PCA聚類算法、DBSCAN聚類算法中的任意一種。
[0010]可選地,所述預(yù)測模型為支持向量機(jī)分類器、樸素貝葉斯分類器、決策樹分類器、人工神經(jīng)網(wǎng)絡(luò)中的任意一種。
[0011]可選地,根據(jù)所述未知客戶的現(xiàn)時(shí)數(shù)據(jù)以及對應(yīng)的預(yù)測模型預(yù)測所述未知客戶是否有流失傾向之后還包括:對需求文本進(jìn)行中文分詞,并對中文分詞后的單詞進(jìn)行統(tǒng)計(jì)以獲得高頻詞以獲得客戶的需求類別,其中,所述需求文本為客服人員對預(yù)測為有流失傾向的未知客戶進(jìn)行采訪記錄得到的反饋文本;根據(jù)所述需求類別的關(guān)鍵詞對所述需求文本進(jìn)行匹配,以獲得所述需求類別對應(yīng)的所述需求文本的數(shù)量,其中,所述關(guān)鍵詞為所述需求類別對應(yīng)的高頻詞或者高頻詞的同義詞。
[0012]可選地,根據(jù)所述未知客戶的現(xiàn)時(shí)數(shù)據(jù)以及對應(yīng)的預(yù)測模型預(yù)測所述未知客戶是否有流失傾向之后還包括:對預(yù)測為有流失傾向的未知客戶的登陸信息、充值信息、消費(fèi)信息中的任意一種或者多種的組合進(jìn)行跟蹤。
[0013]本發(fā)明還提供了一種客戶流失預(yù)測裝置,包括:分組模塊,用于根據(jù)采集到的客戶的歷史數(shù)據(jù)對所述客戶進(jìn)行分組以獲得多個客戶類型;建模模塊,用于建立多個預(yù)測模型,其中,不同的客戶類型對應(yīng)不同的預(yù)測模型;識別模塊,用于通過流失規(guī)則從同一客戶類型的客戶中識別出流失客戶和未知客戶以獲得對應(yīng)預(yù)測模型的訓(xùn)練樣本,其中,不同的客戶類型對應(yīng)不同的流失規(guī)則;訓(xùn)練模塊,用于使用所述訓(xùn)練樣本對對應(yīng)的預(yù)測模型進(jìn)行訓(xùn)練;預(yù)測模塊,用于根據(jù)所述未知客戶的現(xiàn)時(shí)數(shù)據(jù)以及對應(yīng)的預(yù)測模型預(yù)測所述未知客戶是否有流失傾向。
[0014]可選地,所述客戶的歷史數(shù)據(jù)包括所述客戶的基礎(chǔ)信息以及所述客戶的行為信息,所述客戶的基礎(chǔ)信息包括年齡、性別、注冊地、等級、客戶端登陸狀況中的任意一種或者多種的組合,所述客戶的行為信息包括登陸信息、充值信息、消費(fèi)信息、事件信息中的任意一種或者多種的組合。
[0015]可選地,所述登陸信息包括統(tǒng)計(jì)日前i天登陸游戲大廳的次數(shù)、登陸游戲大廳的天數(shù)、登陸游戲大廳的時(shí)長、登陸游戲大廳的趨勢、登陸游戲的次數(shù)、登陸游戲的天數(shù)、登陸游戲的時(shí)長、登陸游戲的趨勢中的任意一種或者多種的組合;所述充值信息包括統(tǒng)計(jì)日前i天游戲大廳的充值的次數(shù)、游戲大廳的充值的天數(shù)、游戲大廳的充值的金額、游戲大廳的充值的趨勢、游戲的充值的次數(shù)、游戲的充值的天數(shù)、游戲的充值的金額、游戲的充值的趨勢中的任意一種或者多種的組合;所述消費(fèi)信息包括統(tǒng)計(jì)日前i天游戲大廳的消費(fèi)的次數(shù)、游戲大廳的消費(fèi)的天數(shù)、游戲大廳的消費(fèi)的金額、游戲大廳的消費(fèi)的趨勢、游戲的消費(fèi)的次數(shù)、游戲的消費(fèi)的天數(shù)、游戲的消費(fèi)的金額、游戲的消費(fèi)的趨勢中的任意一種或者多種的組合;所述事件信息包括統(tǒng)計(jì)日前i天客戶參與的游戲總類數(shù)量、客戶參與的游戲風(fēng)格占比,客戶參與的游戲題材占比、過關(guān)失敗次數(shù)、使用道具數(shù)、游戲風(fēng)格、游戲題材中的任意一種或者多種的組合,其中,i為大于零的正整數(shù)。
[0016]可選地,所述分組模塊還用于根據(jù)采集到的客戶的數(shù)據(jù)并通過聚類算法對所述客戶進(jìn)行分類以獲得多個客戶類型。
[0017]可選地,所述聚類算法為k-means聚類算法、K-Medoids聚類算法、PCA聚類算法、DBSCAN聚類算法中的任意一種。
[0018]可選地,所述預(yù)測模型為支持向量機(jī)分類器、樸素貝葉斯分類器、決策樹分類器、人工神經(jīng)網(wǎng)絡(luò)中的任意一種。
[0019]可選地,所述裝置還包括:分詞模塊、統(tǒng)計(jì)模塊以及匹配模塊,所述分詞模塊用于對需求文本進(jìn)行中文分詞,其中,所述需求文本為客服人員對預(yù)測為有流失傾向的未知客戶進(jìn)行采訪記錄得到的反饋文本;所述統(tǒng)計(jì)模塊用于對中文分詞后的單詞進(jìn)行統(tǒng)計(jì)得到高頻詞以獲得客戶的需求類別;所述匹配模塊用于根據(jù)所述需求類別的關(guān)鍵詞對所述需求文本進(jìn)行匹配,以獲得所述需求類別對應(yīng)的所述需求文本的數(shù)量,其中,所述關(guān)鍵詞為所述需求類別對應(yīng)的高頻詞或者高頻詞的同義詞。
[0020]可選地,所述裝置還包括跟蹤模塊,所述跟蹤模塊用于對預(yù)測為有流失傾向的未知客戶的登陸信息、充值信息、消費(fèi)信息中的任意一種或者多種的組合進(jìn)行跟蹤。
[0021]通過實(shí)施本發(fā)明實(shí)施例,能夠通過計(jì)算機(jī)來完成采集客戶的數(shù)據(jù)、建立預(yù)測模塊、對預(yù)測模型進(jìn)行訓(xùn)練以及根據(jù)預(yù)測模型進(jìn)行預(yù)測等工作,比人工逐個進(jìn)行篩選的速度快,效率高。而且,本發(fā)明對不同的客戶進(jìn)行了分組,針對每種客戶類型的客戶建立屬于自己的預(yù)測模型進(jìn)行預(yù)測,比起人工對所有的客戶采用單一的規(guī)則進(jìn)行預(yù)測來說,提高了預(yù)測的準(zhǔn)確性。
【附圖說明】
[0022]為了更