一種移動社會網(wǎng)絡(luò)的好友推薦方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于數(shù)據(jù)挖掘與用戶行為分析技術(shù)領(lǐng)域,具體設(shè)及一種移動社會網(wǎng)絡(luò)的好 友推薦方法的設(shè)計。
【背景技術(shù)】
[0002] 移動社會網(wǎng)絡(luò)是由多個具有相似興趣或共同點的用戶通過移動電話或平板電腦 等移動終端互連的社會網(wǎng)絡(luò)。移動社會網(wǎng)絡(luò)結(jié)合了社會網(wǎng)絡(luò)和移動通信網(wǎng)絡(luò),兼有社會網(wǎng) 絡(luò)的社會性和移動通信網(wǎng)絡(luò)的移動性,是一個設(shè)及用戶社會關(guān)系的移動通信系統(tǒng)。移動性 是移動社會網(wǎng)絡(luò)服務(wù)和傳統(tǒng)社會網(wǎng)絡(luò)服務(wù)的主要區(qū)別,社會關(guān)系用不同的社會網(wǎng)絡(luò)指標定 義,該些指標為網(wǎng)絡(luò)的相關(guān)性和社會關(guān)系提供了新的視角。它創(chuàng)造了一種全新的社交方式, 使虛擬社交和現(xiàn)實社交更為接近,是虛擬世界和現(xiàn)實世界的橋梁。
[0003] 準確判別人群中的社團或聚類對于優(yōu)化移動社會網(wǎng)絡(luò)服務(wù)等個性化內(nèi)容推薦服 務(wù)具有重大意義,根據(jù)人群的劃分結(jié)果,可準確向目標用戶推薦同類型人群成為其好友候 選人。
[0004] 移動社會網(wǎng)絡(luò)中現(xiàn)有推薦好友的方法一般可W分為基于內(nèi)容的好友推薦方法和 基于協(xié)同過濾的好友推薦方法兩大類型。
[0005] 基于內(nèi)容的好友推薦方法根據(jù)用戶的基本信息,包括興趣愛好、教育背景、工作和 地域信息等內(nèi)容,向目標用戶推薦基本信息與之相似的其它用戶成為其好友候選人,由于 該種方法可W很直觀的反映用戶基本信息的匹配度,在早期社會網(wǎng)絡(luò)的好友推薦中,曾被 廣泛應(yīng)用,但由于內(nèi)容分析的限制、匹配內(nèi)容過于機械化W及用戶基本信息不全等問題,該 方法存在較大的局限性,其推薦結(jié)果并不十分令用戶滿意。
[0006] 基于協(xié)同過濾的技術(shù)在數(shù)據(jù)挖掘領(lǐng)域已經(jīng)有不少的應(yīng)用,該種方法也被引入到了 移動社會網(wǎng)絡(luò)的好友推薦中。該方法的基本思想是利用和當前用戶有相同興趣愛好的其他 用戶對候選信息的觀點W判斷該信息對當前用戶的價值,并作為評價標準,決定是否向當 前用戶推薦目標信息。最常見就是化iend-of-Friend方法,即基于"好友的好友"的推薦 方法。該一類型的方法雖然不依賴事物的內(nèi)容,但需要用戶表現(xiàn)出對其喜好的程度,因此其 在推薦結(jié)果的表現(xiàn)上,也差強人意。
【發(fā)明內(nèi)容】
[0007] 本發(fā)明的目的是為了解決移動社會網(wǎng)絡(luò)中現(xiàn)有推薦好友的方法的推薦結(jié)果無法 令用戶滿意的問題,提出了一種移動社會網(wǎng)絡(luò)的好友推薦方法。
[000引本發(fā)明的技術(shù)方案為;一種移動社會網(wǎng)絡(luò)的好友推薦方法,包括W下步驟:
[0009]S1、導(dǎo)入用戶地理位置日志文件,計算任意兩個用戶之間的離散地理位置相似 度;
[0010] S2、導(dǎo)入用戶在線時間日志文件,計算任意兩個用戶之間的在線時間相似度;
[0011] S3、導(dǎo)入用戶興趣標簽日志文件,計算任意兩個用戶之間的興趣相似度;
[0012] S4、根據(jù)離散地理位置相似度、在線時間相似度w及興趣相似度計算任意兩個用 戶之間的差異距離;
[0013] S5、選定目標用戶,根據(jù)目標用戶跟其他用戶的差異距離向目標用戶推薦好友候 選人。
[0014] 進一步地,步驟S1中用戶地理位置日志由用戶ID與用戶活動的基站序號列表組 成。
[0015] 進一步地,步驟S1包括W下分步驟:
[0016] S11、導(dǎo)入任意兩個用戶活動的基站序號列表,計算兩用戶在各個基站出現(xiàn)的概 率,形成概率向量;
[0017] S12、計算兩用戶在某個基站共同出現(xiàn)的概率;
[001引 S13、將兩用戶在所有基站處共同出現(xiàn)的概率相加,并除W步驟S11形成的概率向 量的范數(shù)的乘積,得到一個歸一化指標,即為該兩用戶的離散地理位置相似度。
[0019] 進一步地,步驟S2中用戶在線時間日志由用戶ID與用戶在線時間段序號列表組 成。
[0020] 進一步地,步驟S2包括W下分步驟:
[0021] S21、導(dǎo)入任意兩個用戶的在線時間段序號列表,計算兩用戶在各個時間段在線的 概率,形成概率向量;
[0022] S22、計算兩用戶在某個時間段共同在線的概率;
[0023]S23、將兩用戶所有在線時間段的共同在線的概率相加,并除W步驟S21形成的概 率向量的范數(shù)的乘積,得到一個歸一化指標,即為該兩用戶的在線時間相似度。
[0024] 進一步地,步驟S3中用戶興趣標簽日志由用戶ID與興趣標簽序號列表組成。
[0025] 進一步地,步驟S3包括W下分步驟:
[0026] S31、導(dǎo)入任意兩個用戶的興趣標簽序號列表,計算兩用戶擁有各個興趣標簽的概 率,形成概率向量;
[0027]S32、計算兩用戶共同擁有某個興趣標簽的概率;
[002引 S33、將兩用戶對所有興趣標簽的共同擁有概率相加,并除W步驟S31形成的概率 向量的范數(shù)的乘積,得到一個歸一化指標,即為該兩用戶的興趣相似度。
[0029] 進一步地,步驟S4中任意兩個用戶之間的差異距離為該兩用戶間的離散地理位 置相似度、在線時間相似度和興趣相似度的一定權(quán)重的方差之和的開根號。
[0030] 進一步地,步驟S5具體為:
[0031] 選定目標用戶,將目標用戶與其他各個用戶的差異距離按照從小到大的規(guī)律進行 排序,形成由小到大的差異距離序列,選取序列中前5%~10%的用戶作為推薦用戶,將其 推薦給目標用戶作為好友候選人。
[0032] 本發(fā)明的有益效果是:本發(fā)明根據(jù)離散地理位置相似度、在線時間相似度和興趣 相似度,從多個維度上計算移動社會網(wǎng)絡(luò)用戶之間的差異距離,并根據(jù)差異距離劃分同類 型人群,可準確向目標用戶推薦與之在空間、時間、興趣上相似性較高的其它用戶成為其好 友候選人,可應(yīng)用于好友推薦系統(tǒng),向目標用戶推送個性化好友推薦內(nèi)容。
【附圖說明】
[0033] 圖1為本發(fā)明提供的一種移動社會網(wǎng)絡(luò)的好友推薦方法流程圖。
【具體實施方式】
[0034] 下面結(jié)合附圖對本發(fā)明的實施例作進一步的說明。
[0035] 本發(fā)明提供了一種移動社會網(wǎng)絡(luò)的好友推薦方法,如圖1所示,包括W下步驟:
[0036] S1、導(dǎo)入用戶地理位置日志文件,計算任意兩個用戶之間的離散地理位置相似度。
[0037] 其中,用戶地理位置日志由用戶ID與用戶活動的基站序號列表組成。設(shè)給定總用 戶數(shù)為n,用戶活動區(qū)域由m個基站完全覆蓋,則任意兩個用戶i,j之間的離散地理位置相 似度(用Iw表示)表示為兩者所有共同位置的余弦相似性指標,如公式(1)所示:
[00%] (1)
[0039] 式中P表示基站序列集合,N表示用戶序列集合,和P分別表示用戶i和用 戶j在基站1出現(xiàn)的概率,Pi=[Pi,l,Pi,2, . ..,PiJ和叫=[PW,PW,. . .,P細]分別表示 用戶i和用戶j出現(xiàn)在各個基站的概率,I|PilI和MPj.ll分別表示Pi和Pj.的范數(shù),本發(fā)明 實施例中為2范數(shù)。
[0040] 步驟S1包括W下分步驟:
[0041] S11、導(dǎo)入任意兩個用戶(用戶i和用戶j)活動的基站序號列表,計算兩用戶在各 個基站出現(xiàn)的概率,形成概率向量Pi= [Pi,l,Pi,2,...,Pi,m],Pj= [Pj,l,Pj,2,...,Pj,m];
[0042]S12、利用計算得到用戶i和用戶j在基站1共同出現(xiàn)的概率(此處共同 出現(xiàn)的概率僅指兩個用戶都曾去過基站1的概率,而不是指兩個用戶同時在基站1出現(xiàn)的 概率);
[0043] S13、將兩用戶在所有基站處共同出現(xiàn)的概率相加,并除WPi和PJ的范數(shù)的乘積 (優(yōu)選2范數(shù)),得到一個歸一化指標,即為用戶i和用戶j的離散地理位置相似度。
[0044] S2、導(dǎo)入用戶在線時間日志文件,計算任意兩個用戶之間的在線時間相似度。
[0045] 其中,用戶在線時間日志由用戶ID與用戶在線時間段序號列表組成。設(shè)給定總用 戶數(shù)為n,用戶在線時間由y個時間段完全覆蓋,則任意兩個用戶i,j之間的在線時間相似 度(用tw表示)表示為兩者所有共同在線時間段的余弦相似性指標,如公式(2)所示:
[0046] (2)
[0047] 式中T表示時間段序列集合,N表示用戶序列集合,Pi,濟P j,u分別表示用戶i和 用戶j在時間段U在線的概率,Pi=[P1,1,Pi,2, . . .,Pi,y]和