專利名稱:社區(qū)服務(wù)器系統(tǒng)和用于社區(qū)服務(wù)器系統(tǒng)的活動(dòng)記錄方法
技術(shù)領(lǐng)域:
本發(fā)明涉及允許多個(gè)用戶通過諸如社會(huì)聯(lián)網(wǎng)服務(wù)(SNS )的網(wǎng)絡(luò), 利用他們自己的客戶計(jì)算機(jī)登錄服務(wù)器系統(tǒng),以便在系統(tǒng)上相互通信 的聯(lián)才幾社區(qū)系統(tǒng)。
背景技術(shù):
隨著Web2.0技術(shù)進(jìn)入市場,許多因特網(wǎng)用戶已經(jīng)參加了諸如在 CGM (顧客生成媒體)或社會(huì)聯(lián)網(wǎng)服務(wù)(SNS)中發(fā)表博客(聯(lián)機(jī)日 記)、讀新聞文章和搜索新產(chǎn)品信息的各種活動(dòng)。
因此,已經(jīng)進(jìn)行了從這樣的活動(dòng)日志中提取每個(gè)用戶的興趣點(diǎn)和 關(guān)注點(diǎn)以便將它們用于營銷和其它商業(yè)活動(dòng)的幾種嘗試。
例如,已
公開日本專利申請第2007-241753號公開了一種系統(tǒng), 服務(wù)器保存本體模式作為個(gè)人本體的模式,其中,概念性地分層個(gè)人 興趣信息,個(gè)人本體提取設(shè)備提取本體模式的根類的直系類或?qū)嵗?為個(gè)人本體,意外信息提取設(shè)備提取包括在個(gè)人本體中但不包括在相 似度等于或大于預(yù)定值的其它個(gè)人本體中的類或?qū)嵗鳛橐馔庑畔ⅲ?以及意外信息展示設(shè)備向不具有提取的意外信息的用戶提供由意外信 息提取設(shè)備提取的意外信息。
轉(zhuǎn)讓給本申請人的日本專利申請第2007-110559號的說明書公開 了一種技術(shù),用于系統(tǒng)地將興趣標(biāo)記"犯罪者"、"受害者"和"受益者" 的任何一個(gè)賦予相應(yīng)的公司、個(gè)人、產(chǎn)品和在文章中提到的其它實(shí)體, 以便抑制隨著文章出現(xiàn)使文章的讀者感到不愉快的廣告。然后,控制 廣告選擇機(jī)構(gòu),以避免與被賦予興趣標(biāo)記的實(shí)體相關(guān)聯(lián)的廣告。用于 這個(gè)目的的廣告選擇機(jī)構(gòu)可以計(jì)算文章與廣告之間的親密度或相關(guān)度作為數(shù)值。因此,可以通過減小親密度的數(shù)值來抑制廣告。最好隨時(shí) 間逐漸減小抑制度??梢哉J(rèn)為,這種公開技術(shù)是試圖建立訪問網(wǎng)頁的 用戶的心理狀況的系統(tǒng)模型的例子之一 。
尤其,已
公開日本專利申請第2007-241753號的技術(shù)從用戶寫的 文本中提取用戶的興趣,以及描述在日本專利申請第2007-110559號 的說明書中的技術(shù)從用戶讀的文本中提取用戶的興趣。由于聯(lián)機(jī)社區(qū) 中的用戶參加各種類型的行動(dòng)和活動(dòng),所以需要能夠處理多種類型的 聯(lián)才幾活動(dòng)的統(tǒng)一纟支術(shù)。
已
公開日本專利申請第2005-327105號涉及一種用于找出適當(dāng)社 區(qū)的聯(lián)機(jī)社區(qū)分析裝置。這個(gè)聯(lián)機(jī)社區(qū)分析裝置具有用于從預(yù)定郵件 服務(wù)器獲取包括用于至少標(biāo)識(shí)出局郵件的發(fā)件人的發(fā)件人標(biāo)識(shí)符和用 于標(biāo)識(shí)出局郵件的收件人的收件人標(biāo)識(shí)符的信息的獲取部分、用于根 據(jù)獲取部分所獲取的信息來計(jì)算代表發(fā)件人和收件人共同的興趣度的 興趣度共同性的共同度分析部分、以及根據(jù)興趣共同度分析部分所確 定的興趣共同度來分析電子郵件用戶所形成的社區(qū)的分析部分。分析 部分利用興趣度矩陣來計(jì)算社區(qū)之間的相關(guān)度,以便分析電子郵件用 戶所形成的社區(qū)。
已
公開日本專利申請第2005-327105號指出了一種利用矩陣來計(jì) 算社區(qū)之間的相關(guān)度的有用技術(shù)。但是,這種技術(shù)只用于分析出局郵 件,而不是以綜合方式來處理多種活動(dòng)的技術(shù)。
兩個(gè)活動(dòng)矩陣Ak和A,的相減可以通過如下所示的方程定義。這 里,矩陣的絕對值像上述那樣定義。在計(jì)算如下方程之前,進(jìn)行對準(zhǔn)關(guān)鍵字標(biāo)記的處理。換句話說,進(jìn)行將集合Ak和A,的總和取作關(guān)鍵 字標(biāo)記的算術(shù)運(yùn)算。然后,在根據(jù)關(guān)鍵字標(biāo)記結(jié)果來擴(kuò)充行Ak和Ap 即,在以前未出現(xiàn)的關(guān)鍵字的行中都輸入零之后,計(jì)算如下方程 [方程3]
AkeAi =
A
k
Ak| +
|Ak| + |AjAl
ii —— hi ' i乂m
這些活動(dòng)矩陣的相減可被用于確定用戶之間、用戶與社區(qū)之間、 或社區(qū)之間的相減。應(yīng)該注意到,右側(cè)的最外面絕對值意味著矩陣的 元素被簡單地轉(zhuǎn)變成正值,它不同于像上述那樣定義的矩陣的絕對值。
圖12示出了兩個(gè)活動(dòng)矩陣A和B相減的例子。從這個(gè)例子可明 顯看出,活動(dòng)矩陣A、 B的相減是作為適當(dāng)歸一化值獲得的。 [兩個(gè)活動(dòng)矩陣的相乘
這里,作為活動(dòng)矩陣的相乘,考慮三種類型,即,活動(dòng)關(guān)鍵字相 關(guān)性、活動(dòng)相關(guān)性、和關(guān)鍵字相關(guān)性。在所有這些計(jì)算中,都在計(jì)算 之前進(jìn)行排列關(guān)鍵字標(biāo)記的處理。換句話說,進(jìn)行將集合Ak和A,的 總和取作關(guān)鍵字標(biāo)記的算術(shù)運(yùn)算。然后,在根據(jù)關(guān)鍵字標(biāo)記結(jié)果來擴(kuò) 充行Ak和A,,即,在以前未出現(xiàn)的關(guān)鍵字的行中都輸入零之后,計(jì) 算如下方程。
關(guān)鍵字相關(guān)性通過如下方程定義
廣=AA ^八kwordact八l
它的特定計(jì)算如下 [方程5
0
c.. u丄l
1J
(4 4i =
0)
2 min(《ajj)
l
( 否則 )這種計(jì)算輸出顯示在兩個(gè)活動(dòng)矩陣中的興趣和活動(dòng)的重疊。這使 得提取在興趣和活動(dòng)兩方面都相互關(guān)聯(lián)的項(xiàng)。
這里,aku和a、分別是矩陣Ak、 A,的ij分量。 圖13示出了計(jì)算兩個(gè)活動(dòng)矩陣A、 B之間的活動(dòng)關(guān)鍵字相關(guān)性 的例子。
活動(dòng)相關(guān)性定義在如下所示的方程中。這里,AT是轉(zhuǎn)置矩陣。 這里,算術(shù)運(yùn)算是正規(guī)矩陣的相乘。如果活動(dòng)矩陣是mxn矩陣,則結(jié) 果是nxn矩陣。
A act B 二 ATB
這種計(jì)算輸出顯示在兩個(gè)活動(dòng)矩陣中的活動(dòng)的重疊。這可以讓人 知道什么類型的活動(dòng)使用了公共關(guān)鍵字。
圖14示出了計(jì)算兩個(gè)活動(dòng)矩陣A、 B的關(guān)鍵字相關(guān)性的例子。 關(guān)鍵字相關(guān)性通過如下所示的方程定義。BT是轉(zhuǎn)置矩陣。這里,
算術(shù)運(yùn)算是正規(guī)矩陣的相乘。如果活動(dòng)矩陣是mxn矩陣,則結(jié)果是
mxm矩陣。 [方程7]
這種計(jì)算輸出顯示在兩個(gè)活動(dòng)矩陣中的關(guān)鍵字的重疊。這可以讓 人知道什么類型的關(guān)鍵字參與了公共活動(dòng)。
圖15示出了計(jì)算兩個(gè)活動(dòng)矩陣A、 B之間的活動(dòng)相關(guān)性的例子。 [活動(dòng)矩陣的退化
活動(dòng)矩陣的退化包括行方向上的退化和列方向上的退化。行方向 上的退化可被稱為感興趣關(guān)鍵字列表并通過如下方程給出 Vword—AWact o
其中,A是活動(dòng)矩陣,Wact是活動(dòng)加權(quán)向量,以及WaJ是其轉(zhuǎn) 置向量。Waet的維數(shù)等于活動(dòng)的種數(shù),以及它的分量原則上取0到1 之間的值。這些值是這樣決定的,將較大的值(權(quán)重)給予重要的活動(dòng)。例如,將比讀博客大的權(quán)重給予發(fā)表博客。因此,可以獲得與個(gè) 人或社區(qū)相關(guān)的加權(quán)關(guān)鍵字列。
圖16示出了活動(dòng)矩陣A在行方向上退化的例子,即,確定感興 趣關(guān)鍵字列表的例子。
列方向上的退化可被稱為活動(dòng)模式列表并通過如下方程給出
Vac「Wword A。
其中,A是活動(dòng)矩陣,Ww。rd是關(guān)鍵字加權(quán)向量,以及W,/是 它的轉(zhuǎn)置向量。Ww。rd的維數(shù)等于提取的關(guān)鍵字的數(shù)量,以及它的分 量原則上取0到l之間的值。這些值是這樣決定的,將較大的值(權(quán) 重)給予特別引人注目的關(guān)鍵字。
圖17示出了活動(dòng)矩陣A在列方向上退化的例子,即,確定活動(dòng)
模式列表的例子。
下面描述一些典型應(yīng)用以幫助人們理解本發(fā)明。 [應(yīng)用1
假設(shè)用戶想在社區(qū)系統(tǒng)中查找與他或她的興趣接近的社區(qū)。為了 達(dá)到這樣的目的,社區(qū)系統(tǒng)進(jìn)行算術(shù)運(yùn)算,以確定用戶的活動(dòng)矩陣與
存儲(chǔ)在硬盤驅(qū)動(dòng)器310中的現(xiàn)有社區(qū)系統(tǒng)的活動(dòng)矩陣之間的關(guān)鍵字相 關(guān)性。在獲得的關(guān)鍵字相關(guān)性矩陣當(dāng)中,社區(qū)系統(tǒng)通過適當(dāng)GUI (圖 形用戶界面),只向相關(guān)用戶呈現(xiàn)具有等于或大于預(yù)定值的分量的關(guān) 鍵字。其結(jié)果是,用戶可以查找到特征在于用戶過去不感興趣但將來 想?yún)⑴c的關(guān)鍵字的社區(qū)。應(yīng)用2
假設(shè)社區(qū)系統(tǒng)因遭到垃圾郵件攻擊而受損。但是,顯而易見的方 式使得難以識(shí)別誰是整個(gè)系統(tǒng)中的垃圾郵件發(fā)送者。因此,系統(tǒng)管理 者利用本發(fā)明的功能為每個(gè)用戶獲取活動(dòng)矩陣在列方向上的退化,以 創(chuàng)建活動(dòng)模式列表。從而,可以假定具有在博客上只出現(xiàn)非所需數(shù)量 評論的活動(dòng)模式列表的用戶為潛在垃圾郵件發(fā)送者。
[應(yīng)用3
社區(qū)系統(tǒng)中的主要收入來源之一是廣告收入。但是,傳統(tǒng)方式使
20得難以確定在社區(qū)中哪種廣告是有效的。但是,按照本實(shí)施例,生成 個(gè)人活動(dòng)矩陣,并且據(jù)此可以進(jìn)一步生成社區(qū)活動(dòng)矩陣。然后,可以 生成社區(qū)在行方向上的退化,即,感興趣關(guān)鍵字列表,以便獲得加權(quán) 關(guān)鍵字列表。因此,可以使用現(xiàn)有關(guān)鍵字相關(guān)廣告方案將有效廣告顯 示在社區(qū)的屏幕上。
應(yīng)該注意到,像如本實(shí)施例所示的矩陣相加、相減、和相乘那樣 的算術(shù)運(yùn)算僅僅是實(shí)現(xiàn)本發(fā)明的例示性例子,本發(fā)明不局限于這些特 定方程。例如,如果相加和相減運(yùn)算包括實(shí)際矩陣的相加和相減以及 在適當(dāng)范圍內(nèi)歸一化作為運(yùn)算結(jié)果生成的值的運(yùn)算,則可以選擇任何 算法。
權(quán)利要求
1. 一種社區(qū)服務(wù)器系統(tǒng),多個(gè)用戶通過他們自己的客戶計(jì)算機(jī)與所述社區(qū)服務(wù)器系統(tǒng)連接以讀取或?qū)懳臋n等以便能夠通信,該系統(tǒng)包含能夠從系統(tǒng)中讀取數(shù)據(jù)或?qū)?shù)據(jù)寫入系統(tǒng)中的存儲(chǔ)設(shè)備;與每個(gè)用戶ID和活動(dòng)內(nèi)容一起將每次個(gè)體用戶活動(dòng)及其活動(dòng)相關(guān)文檔存儲(chǔ)在存儲(chǔ)設(shè)備中作為日志的裝置;以及根據(jù)日志來分析在個(gè)體用戶的每次活動(dòng)中讀取或?qū)懭氲奈臋n,以便為每次個(gè)體用戶活動(dòng)確定來自文檔的關(guān)鍵字和它們的出現(xiàn)頻率,以便將它們寫入存儲(chǔ)設(shè)備中的裝置。
2. 按照權(quán)利要求1所述的系統(tǒng),其中,以在第一方向上標(biāo)記關(guān)鍵字以及在與第一方向垂直的第二方向上標(biāo)記活動(dòng)的方式,將在每次數(shù)據(jù),并且將每個(gè)關(guān)鍵字的出現(xiàn)頻率存儲(chǔ)在這些標(biāo)記所指示的交點(diǎn)上。
3. 按照權(quán)利要求1所述的系統(tǒng),其中,所述活動(dòng)包括在社區(qū)服務(wù)器內(nèi)發(fā)表博客、讀博客、寫消息、以及讀消息。
4. 按照權(quán)利要求1所述的系統(tǒng),進(jìn)一步包含用于將關(guān)鍵字的出現(xiàn)頻率除以與活動(dòng)相關(guān)聯(lián)的文檔的數(shù)量的裝置。
5. 按照權(quán)利要求2所述的系統(tǒng),進(jìn)一步包含用于計(jì)算社區(qū)中的用戶的矩陣數(shù)據(jù)之和,以便獲取與社區(qū)中的用戶相關(guān)聯(lián)的矩陣數(shù)據(jù)的裝置。
6. 按照權(quán)利要求5所述的系統(tǒng),進(jìn)一步包含用于計(jì)算社區(qū)的矩陣數(shù)據(jù)與特定用戶的矩陣數(shù)據(jù)之間的差值的裝置。
7. 按照權(quán)利要求2所述的系統(tǒng),進(jìn)一步包含用于將矩陣數(shù)據(jù)乘以退化參數(shù)的裝置、和用于將新計(jì)算的矩陣數(shù)據(jù)與乘以退化參數(shù)的矩陣數(shù)據(jù)相加的裝置。
8. —種用于社區(qū)服務(wù)器系統(tǒng)的活動(dòng)記錄方法,多個(gè)用戶通過他們自己的客戶計(jì)算機(jī)與社區(qū)服務(wù)器系統(tǒng)連接,以讀或?qū)懳臋n以便能夠通信,該方法包含與用戶ID和活動(dòng)內(nèi)容一起將每次個(gè)體用戶活動(dòng)和與活動(dòng)相關(guān)聯(lián) 的文檔存儲(chǔ)在社區(qū)服務(wù)器系統(tǒng)的存儲(chǔ)設(shè)備中作為日志的步驟;和:字和它的出現(xiàn)頻率以便將它們寫入存儲(chǔ)設(shè)備中的步驟。
9.按照權(quán)利要求8所述的方法,其中,以在第一方向上標(biāo)記關(guān) :字以及在與第一方向垂直的第二方向上標(biāo)記活動(dòng)的方式,將在每次數(shù)據(jù),并且將每個(gè)關(guān)鍵字的出現(xiàn)頻率存儲(chǔ)在所述標(biāo)記指示的交點(diǎn)上。
10. 按照權(quán)利要求8所述的方法,其中,所述活動(dòng)包括在社區(qū)服 務(wù)器內(nèi)發(fā)表博客、讀博客、寫消息、和讀消息。
11. 按照權(quán)利要求8所述的方法,進(jìn)一步包含通過將關(guān)鍵字的出現(xiàn)頻率除以活動(dòng)相關(guān)文檔的數(shù)量來進(jìn)行歸一化的步驟。
12. 按照權(quán)利要求9所述的方法,進(jìn)一步包含計(jì)算社區(qū)中的用戶的矩陣數(shù)據(jù)之和以便獲取與社區(qū)中的用戶相關(guān)聯(lián)的矩陣數(shù)據(jù)的步驟。
13. 按照權(quán)利要求12所述的方法,進(jìn)一步包含計(jì)算社區(qū)的矩陣 數(shù)據(jù)與特定用戶的矩陣數(shù)據(jù)之間的差值的步驟。
14. 按照權(quán)利要求9所述的方法,進(jìn)一步包含將矩陣數(shù)據(jù)乘以退 化參數(shù)的步驟、以及將新計(jì)算的矩陣數(shù)據(jù)與乘以退化參數(shù)的矩陣數(shù)據(jù) 相加的步驟。
全文摘要
本發(fā)明提供了一種社區(qū)服務(wù)器系統(tǒng)和用于社區(qū)服務(wù)器系統(tǒng)的活動(dòng)記錄方法。與用在活動(dòng)中的文本信息一起存儲(chǔ)單個(gè)用戶或多個(gè)聯(lián)機(jī)用戶的活動(dòng),以創(chuàng)建用于喜好提取和匹配的數(shù)據(jù)??梢詮幕顒?dòng)和喜好的兩種觀點(diǎn)或從它們的集成觀點(diǎn),進(jìn)行過去通過將用戶信息投影成一維信息所進(jìn)行的活動(dòng)/喜好分析,從而能夠通過更多信息量進(jìn)行活動(dòng)/喜好分析。為了與文本信息一起存儲(chǔ)用戶活動(dòng),將保存的數(shù)據(jù)格式稱為活動(dòng)矩陣。活動(dòng)矩陣的數(shù)據(jù)保存在社區(qū)服務(wù)器中的硬盤驅(qū)動(dòng)器中?;顒?dòng)矩陣是由用戶活動(dòng)和從與活動(dòng)一起使用的文本中提取的關(guān)鍵字構(gòu)成的矩陣,每個(gè)元素根據(jù)從與活動(dòng)一起使用的文本中提取并在某個(gè)時(shí)段內(nèi)存儲(chǔ)的關(guān)鍵字的出現(xiàn)頻率取值。
文檔編號G06Q50/00GK101470754SQ200810178618
公開日2009年7月1日 申請日期2008年11月21日 優(yōu)先權(quán)日2007年12月27日
發(fā)明者R·H·魯?shù)? 安藤史郎, 村上明子, 水田秀行, 西山莉紗 申請人:國際商業(yè)機(jī)器公司