基于電子郵件獲取用戶畫像數(shù)據(jù)的方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及用戶畫像領(lǐng)域,特別是一種基于電子郵件獲取用戶畫像數(shù)據(jù)的方法。
【背景技術(shù)】
[0002]在互聯(lián)網(wǎng)逐漸步入大數(shù)據(jù)時(shí)代后,不可避免的為企業(yè)及消費(fèi)者行為帶來(lái)一系列改變與重塑。其中最大的變化莫過于,消費(fèi)者的一切行為在企業(yè)面前似乎都將是“可視化”的。隨著大數(shù)據(jù)技術(shù)的深入研究與應(yīng)用,企業(yè)的專注點(diǎn)日益聚焦于怎樣利用大數(shù)據(jù)來(lái)為精準(zhǔn)營(yíng)銷服務(wù),進(jìn)而深入挖掘潛在的商業(yè)價(jià)值。于是,“用戶畫像”的概念也就應(yīng)運(yùn)而生。
[0003]用戶畫像,即用戶信息標(biāo)簽化,就是企業(yè)通過收集與分析消費(fèi)者社會(huì)屬性、生活習(xí)慣、消費(fèi)行為等主要信息的數(shù)據(jù)之后,完美地抽象出一個(gè)用戶的商業(yè)全貌,可以看作是企業(yè)應(yīng)用大數(shù)據(jù)技術(shù)的基本方式。用戶畫像為企業(yè)提供了足夠的信息基礎(chǔ),能夠幫助企業(yè)快速找到精準(zhǔn)用戶群體以及用戶需求等更為廣泛的反饋信息。
[0004]用戶畫像的焦點(diǎn)工作就是為用戶打標(biāo)簽,而一個(gè)標(biāo)簽通常是人為規(guī)定的高度精煉的特征標(biāo)識(shí),如年齡、性別、地域、用戶偏好等,最后將用戶的所有標(biāo)簽綜合來(lái)看,基本就可以勾勒出該用戶的立體“畫像”了。
[0005]就目前來(lái)看,用戶畫像的大部分基礎(chǔ)數(shù)據(jù)來(lái)源很零散,彼此關(guān)系不緊密,對(duì)最終導(dǎo)出的用戶標(biāo)簽缺乏針對(duì)性,因此推導(dǎo)歸納出的用戶畫像的準(zhǔn)確度較低,效果不夠理想。
【發(fā)明內(nèi)容】
[0006]針對(duì)上述現(xiàn)有技術(shù)中存在的用戶畫像的準(zhǔn)確度較低的問題,本發(fā)明的目的在于提供一種基于電子郵件獲取用戶畫像數(shù)據(jù)的方法及其系統(tǒng),能夠提高用戶畫像的準(zhǔn)確度。
[0007]—種基于電子郵件獲取用戶畫像數(shù)據(jù)的方法,包括以下步驟:
[0008]獲取電子郵件中的用戶標(biāo)簽關(guān)鍵詞;
[0009]獲取用戶標(biāo)簽庫(kù)中與所述用戶標(biāo)簽關(guān)鍵詞對(duì)應(yīng)的用戶標(biāo)簽,以及與所述用戶標(biāo)簽對(duì)應(yīng)的權(quán)重;
[0010]獲取電子郵件反垃圾系統(tǒng)中的垃圾郵件判據(jù),根據(jù)所述垃圾郵件判據(jù),對(duì)所述電子郵件進(jìn)行垃圾郵件判定,其中,所述垃圾郵件判據(jù)包括所述用戶標(biāo)簽、以及標(biāo)簽權(quán)重的垃圾郵件判據(jù);
[0011]根據(jù)垃圾郵件判定結(jié)果對(duì)所述用戶標(biāo)簽對(duì)應(yīng)的權(quán)重進(jìn)行修正。
[0012]本發(fā)明還包括一種基于電子郵件獲取用戶畫像數(shù)據(jù)的系統(tǒng),包括:
[0013]關(guān)鍵詞獲取模塊,用于獲取電子郵件中的用戶標(biāo)簽關(guān)鍵詞;
[0014]用戶標(biāo)簽獲取模塊,用于獲取用戶標(biāo)簽庫(kù)中與所述用戶標(biāo)簽關(guān)鍵詞對(duì)應(yīng)的用戶標(biāo)簽,以及與所述用戶標(biāo)簽對(duì)應(yīng)的權(quán)重;
[0015]垃圾郵件判定模塊,用于獲取電子郵件反垃圾系統(tǒng)中的垃圾郵件判據(jù),根據(jù)所述垃圾郵件判據(jù),對(duì)所述電子郵件進(jìn)行垃圾郵件判定,其中,所述垃圾郵件判據(jù)包括所述用戶標(biāo)簽、以及標(biāo)簽權(quán)重的垃圾郵件判據(jù);
[0016]權(quán)重修正模塊,用于根據(jù)垃圾郵件判定結(jié)果對(duì)所述用戶標(biāo)簽對(duì)應(yīng)的權(quán)重進(jìn)行修正。
[0017]本發(fā)明的基于電子郵件獲取用戶畫像數(shù)據(jù)的方法及其系統(tǒng),先獲取電子郵件中的用戶標(biāo)簽關(guān)鍵詞、用戶標(biāo)簽庫(kù)中與所述用戶標(biāo)簽關(guān)鍵詞對(duì)應(yīng)的用戶標(biāo)簽、以及所述用戶標(biāo)簽的權(quán)重,再利用電子郵件反垃圾系統(tǒng)對(duì)所述電子郵件進(jìn)行垃圾郵件判定,最后根據(jù)垃圾郵件判定結(jié)果對(duì)所述用戶標(biāo)簽對(duì)應(yīng)的權(quán)重進(jìn)行修正。由于電子郵件通信形式比較正式、嚴(yán)謹(jǐn),從電子郵件內(nèi)容獲取的用戶標(biāo)簽關(guān)鍵詞、及其相關(guān)信息能更準(zhǔn)確的反映人的屬性特點(diǎn),因此,收集到的用戶畫像基礎(chǔ)數(shù)據(jù)來(lái)源集中、關(guān)系緊密,對(duì)最終導(dǎo)出的用戶標(biāo)簽具有明顯的針對(duì)性,從而提高用戶畫像的準(zhǔn)確度。
【附圖說明】
[0018]圖1為一個(gè)實(shí)施例的基于電子郵件獲取用戶畫像數(shù)據(jù)的方法的流程示意圖;
[0019]圖2為一個(gè)實(shí)施例的基于電子郵件獲取用戶畫像數(shù)據(jù)的系統(tǒng)的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0020]為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步地詳細(xì)描述。
[0021]請(qǐng)參閱圖1中一個(gè)實(shí)施例的基于電子郵件獲取用戶畫像數(shù)據(jù)的方法流程示意圖。
[0022]—種基于電子郵件獲取用戶畫像數(shù)據(jù)的方法,包括以下步驟:
[0023]S102,獲取電子郵件中的用戶標(biāo)簽關(guān)鍵詞。
[0024]通過該步驟,從電子郵件中獲取用戶標(biāo)簽關(guān)鍵詞,由于電子郵件通信形式比較正式、嚴(yán)謹(jǐn),從電子郵件內(nèi)容獲取的用戶標(biāo)簽關(guān)鍵詞、及其相關(guān)信息能更準(zhǔn)確的反映人的屬性特點(diǎn),因此,收集到的用戶畫像基礎(chǔ)數(shù)據(jù)來(lái)源集中、關(guān)系緊密,從而提高用戶畫像基礎(chǔ)數(shù)據(jù)的緊密性。
[0025]在其中一個(gè)實(shí)施例中,所述獲取電子郵件中的用戶標(biāo)簽關(guān)鍵詞的步驟包括:
[0026]獲取電子郵件中的內(nèi)容,將所述電子郵件中的內(nèi)容與預(yù)設(shè)的用戶標(biāo)簽關(guān)鍵詞進(jìn)行匹配;
[0027]獲取符合匹配結(jié)果的電子郵件內(nèi)容中的詞語(yǔ),即為電子郵件中的用戶標(biāo)簽關(guān)鍵
Τ.κ| ο
[0028]通過該實(shí)施例,使得獲取的用戶標(biāo)簽關(guān)鍵詞更符合預(yù)設(shè)的用戶標(biāo)簽的描述,進(jìn)一步提高用戶畫像基礎(chǔ)數(shù)據(jù)的緊密性。
[0029]S104,獲取用戶標(biāo)簽庫(kù)中與所述用戶標(biāo)簽關(guān)鍵詞對(duì)應(yīng)的用戶標(biāo)簽,以及與所述用戶標(biāo)簽對(duì)應(yīng)的標(biāo)簽權(quán)重。
[0030]通過該步驟,為后面的垃圾郵件判定步驟提供基礎(chǔ)數(shù)據(jù),從而提高垃圾郵件判定的準(zhǔn)確性。
[0031]S106,獲取電子郵件反垃圾系統(tǒng)中的垃圾郵件判據(jù),根據(jù)所述垃圾郵件判據(jù),對(duì)所述電子郵件進(jìn)行垃圾郵件判定,其中,所述垃圾郵件判據(jù)包括所述用戶標(biāo)簽、以及標(biāo)簽權(quán)重的垃圾郵件判據(jù)。
[0032]通過所述用戶標(biāo)簽、以及標(biāo)簽權(quán)重的垃圾郵件判據(jù),對(duì)所述電子郵件進(jìn)行垃圾郵件判定,一方面可以降低垃圾郵件的誤判率,從而提高垃圾郵件判定的準(zhǔn)確率;另一方面提高了電子郵件反垃圾判定的優(yōu)先級(jí),減少了系統(tǒng)后續(xù)的判定步驟,從而節(jié)約了系統(tǒng)資源。
[0033]在其中一個(gè)實(shí)施例中,所述對(duì)電子郵件進(jìn)行垃圾郵件判定的步驟包括:
[0034]將所述用戶標(biāo)簽關(guān)鍵詞添加到電子郵件標(biāo)頭;
[0035]利用電子郵件反垃圾系統(tǒng)對(duì)電子郵件標(biāo)頭中的內(nèi)容進(jìn)行垃圾郵件判定。
[0036]通過該實(shí)施例,提高了對(duì)電子郵件進(jìn)行垃圾郵件判定的便利性,從而節(jié)省系統(tǒng)資源。
[0037]S108,根據(jù)垃圾郵件判定結(jié)果對(duì)所述用戶標(biāo)簽對(duì)應(yīng)的權(quán)重進(jìn)行修正。
[0038]該步驟根據(jù)垃圾郵件判定結(jié)果對(duì)所述用戶標(biāo)簽對(duì)應(yīng)的權(quán)重進(jìn)行修正,從而提高用戶畫像的準(zhǔn)確度。
[0039]在其中一個(gè)實(shí)施例中,所述根據(jù)垃圾郵件判定結(jié)果對(duì)所述用戶標(biāo)簽對(duì)應(yīng)的權(quán)重進(jìn)行修正的步驟包括:
[0040]根據(jù)所述垃圾郵件判定結(jié)果,若被判定為垃圾郵件,則對(duì)所述用戶標(biāo)簽的權(quán)重進(jìn)行減權(quán)修正,否則,對(duì)所述用戶標(biāo)簽的權(quán)重進(jìn)行加權(quán)修正。
[0041]被判定為垃圾郵件的電子郵件,對(duì)其對(duì)應(yīng)用戶標(biāo)簽的標(biāo)簽權(quán)重進(jìn)行減權(quán)修正;被判定為非垃圾郵件的電子郵件,對(duì)其對(duì)應(yīng)用戶標(biāo)簽的標(biāo)簽權(quán)重進(jìn)行加權(quán)修正,使得到的用戶標(biāo)簽權(quán)重更加準(zhǔn)確,從而提高用戶畫像的準(zhǔn)確度。
[0042]結(jié)合上述實(shí)施例,通過先獲取電子郵件中的用戶標(biāo)簽關(guān)鍵詞、用戶標(biāo)簽庫(kù)中與所述用戶標(biāo)簽關(guān)鍵詞對(duì)應(yīng)的用戶標(biāo)簽、以及所述用戶標(biāo)簽的權(quán)重,再利用電子郵件反垃圾系統(tǒng)對(duì)所述電子郵件進(jìn)行垃圾郵件判定,最后根據(jù)垃圾郵件判定結(jié)果對(duì)所述用戶標(biāo)簽對(duì)應(yīng)的權(quán)重進(jìn)行修正。由于電子郵件通信形式比較正式、嚴(yán)謹(jǐn),從電子郵件內(nèi)容獲取的用戶標(biāo)簽關(guān)鍵詞、及其相關(guān)信息能更準(zhǔn)確的反映人的屬性特點(diǎn),因此,收集到的用戶畫像基礎(chǔ)數(shù)據(jù)來(lái)源集中、關(guān)系緊密,對(duì)最終導(dǎo)出的用戶標(biāo)簽具有明顯的針對(duì)性,從而提高用戶畫像的準(zhǔn)確度。
[0043]在其中一個(gè)實(shí)施例中,所述基于電子郵件獲取用戶畫像數(shù)據(jù)的方法還包括:
[0044]獲取用戶標(biāo)簽庫(kù)中用戶標(biāo)簽的歷史數(shù)據(jù);
[0045]統(tǒng)計(jì)所述歷史數(shù)據(jù),根據(jù)統(tǒng)計(jì)結(jié)果判定歷史數(shù)據(jù)等級(jí);
[0046]根據(jù)所述歷史數(shù)據(jù)等級(jí)、及其對(duì)應(yīng)的預(yù)設(shè)等級(jí)權(quán)重對(duì)用戶標(biāo)簽的權(quán)重進(jìn)行修正。
[0047]通過該實(shí)施例,進(jìn)一步提高用戶標(biāo)簽權(quán)重的準(zhǔn)確性,從而進(jìn)一步提高用戶畫像的準(zhǔn)確度。
[0048]在其中一個(gè)實(shí)施例中,所述用戶標(biāo)簽的歷史數(shù)據(jù)包括用戶標(biāo)簽的歷史關(guān)鍵詞、關(guān)鍵詞加權(quán)次數(shù)、關(guān)鍵詞減權(quán)次數(shù)、郵件發(fā)送頻率、郵件攔截頻率、垃圾郵件歷史判定結(jié)果。
[0049]通過上述歷史數(shù)據(jù),使得收集到的用戶畫像基礎(chǔ)數(shù)據(jù)來(lái)源更集中、關(guān)系更緊密,對(duì)最終導(dǎo)出的用戶標(biāo)簽更具針對(duì)性。
[0050]本發(fā)明還提供一種基于電子郵件獲取用戶畫像數(shù)據(jù)的系統(tǒng),如圖2所示,包括:[0051 ] 關(guān)鍵詞獲取模塊202,用于獲取電子郵件中的用戶標(biāo)簽關(guān)鍵詞。
[0052]所述關(guān)鍵詞獲取模塊202,從電子郵件中獲取用戶標(biāo)簽關(guān)鍵詞,由于電子郵件通信形式比較正式、嚴(yán)謹(jǐn),從電子郵件內(nèi)容獲取的用戶標(biāo)簽關(guān)鍵詞、及其相關(guān)信息能更準(zhǔn)確的反映人的屬性特點(diǎn),因此,收集到的用戶畫像基礎(chǔ)數(shù)據(jù)來(lái)源集中、關(guān)系緊密,從而提高用戶畫像基礎(chǔ)數(shù)據(jù)的緊密性。
[0053]用戶標(biāo)簽獲取模塊204,用于獲取用戶標(biāo)簽庫(kù)中與所述用戶標(biāo)簽關(guān)鍵詞對(duì)應(yīng)的用戶標(biāo)簽,以及與所述用戶標(biāo)簽對(duì)應(yīng)的權(quán)重。