的數(shù)據(jù)。在 一些實施例中,聯(lián)合分析模塊118可包括變換模塊112或服務器布局模塊114的功能性,這 將允許聯(lián)合分析模塊118生成其自己的結(jié)果(其被轉(zhuǎn)移到呈現(xiàn)模塊116)。但是,沿著516, 聯(lián)合分析模塊118可使服務器布局模塊114再次被使用。在一些實施例中,聯(lián)合分析模塊 118或服務器布局模塊114可直接(參見線條512)通過OSN數(shù)據(jù)(502A-102N)來調(diào)用。這 在一些實施例中可使用如圖1所示的計算裝置106的用戶信息存儲位置110所存儲的OSN 數(shù)據(jù)(502A-102N)進行。
[0029] 回到圖1,計算裝置106的信息獲取模塊108獲取150與多個用戶102A-102N有關(guān) 的信息以及一個或多個網(wǎng)絡103A-103N的用戶關(guān)系104。在實施例中,網(wǎng)絡103A-103N是 0SN。在實施例中,這個所獲取信息包括來自OSN的用戶簡檔集合以及其他用戶(各用戶在 網(wǎng)絡上與其具有關(guān)系(g卩,各用戶的"好友"或者所連接用戶的另外某個名稱))的列表。在 本發(fā)明的實施例中,所獲取信息保持在計算裝置106的用戶信息存儲位置110中。
[0030] 在本發(fā)明的實施例中,變換模塊112嘗試從各用戶(例如102A)的用戶簡檔來推 斷地理位置。許多用戶向網(wǎng)絡顯式登記其當前位置,而許多用戶輸入其出生位置,以及又一 些用戶輸入揭示用戶地理位置的聯(lián)系。有趣的是,用戶位置重要的非平凡部分通過智能電 話應用采取經(jīng)度和煒度形式自動輸入。在實施例中,變換模塊112首先從抓取的數(shù)據(jù)中檢 索關(guān)于位置的所有可能提示。變換模塊112然后可預處理抓取的數(shù)據(jù)以校正排字錯誤,消 除歧義,并且將具有多個表示的任何相同位置組合為一個(例如,"Californaia"、"CA"和 "Cal. ")。在實施例中,變換模塊112然后使用地理編碼數(shù)據(jù)庫(計算裝置106的內(nèi)部或外 部)或者地理編碼API(包括但不限于諸如Google地理編碼API或Yahoo!地圖web附圖 地理編碼API)將用戶位置字符串轉(zhuǎn)化為煒度-經(jīng)度坐標。
[0031] 在實施例中,所獲取信息的推斷地理坐標由變換模塊112變換為用戶圖126,其具 有多個節(jié)點136以及連接那些節(jié)點的一部分的多個邊138。在實施例中,各節(jié)點136的位置 基于用戶的推斷地理坐標,以及邊138存在于任何兩個節(jié)點136 (其表示在一個或多個OSN 上具有連接的用戶(基于所獲取的用戶關(guān)系104數(shù)據(jù)))之間。
[0032] 在實施例中,等待時間圖在任一對用戶之間構(gòu)成。雖然在一個實施例中,各等待 時間值是對所有用戶所收集的往返延遲。但是,在許多實施例中,由于對大規(guī)模的終端主 機的受限訪問,計算假設直接鏈路等待時間,以使用推斷地理位置來近似計算兩個用戶之 間的等待時間。因此,在實施例中,兩個用戶之間的等待時間是那些用戶之間的假設直接 鏈路(例如光、金屬)的傳輸?shù)却龝r間。在實施例中,位置被看作點,并且使用眾所周知的 Vincenty公式(其用來計算點之間的測地距)來聚類為區(qū)域。(除了使用電路交換的網(wǎng)絡 之外,地理距離與最小網(wǎng)絡延遲完全相互關(guān)連。這種方法比來自蹤跡路由的現(xiàn)有鏈路等待 時間更為魯棒,這類等待時間能夠受到網(wǎng)絡排隊和未知不對稱反向路徑延遲污染。) 在實施例中,將每個單獨用戶表示為用戶圖126中的一個節(jié)點136產(chǎn)生極龐大的圖。此 外,在物理上相互接近的用戶將共享相似網(wǎng)絡拓撲性質(zhì)。因此,在本發(fā)明的實施例中,將用 戶聚合成群組,以形成聚合用戶圖128。在實施例中,相互位于煒度和經(jīng)度的范圍之內(nèi)(例 如,在煒度和經(jīng)度的2度之內(nèi))的用戶作為一個聚合節(jié)點139群組在一起。這種聚合具有 遠比基于城市或者甚至郵政編碼來執(zhí)行群組要精細的粒度。相應地,在實施例中,節(jié)點權(quán)重 141基于節(jié)點139所表示的群組中的用戶的數(shù)量來指配給各節(jié)點(例如139)。在圖1的所 示示例中,左上聚合節(jié)點139包含'3'的節(jié)點權(quán)重141,因為存在來自原始用戶圖126的三 個節(jié)點,其位于相互之間的特定距離之內(nèi),并且因而聚合在一起。在實施例中,將邊權(quán)重137 指配給邊,其表示兩個連接群組之間的關(guān)系(例如朋友連接)的總數(shù)。這些權(quán)重在圖1中 使用粗線條(用于較重比較權(quán)重)或細線條(用于較輕/較小比較權(quán)重)來表示,但是在 本發(fā)明的實施例中,權(quán)重是整數(shù)、實數(shù)、二元值等。
[0033] 在聚合用戶圖128由變換模塊112構(gòu)成之后,服務器布局模塊114利用聚合用戶 圖128、使用多種布局算法來確定推薦地理服務器位置124。雖然在一個實施例中,最終目 標是同時使用戶-服務器等待時間以及用戶間通信的等待時間最小化,但是以下描述提供 用于確定推薦地理服務器位置124的三種獨立算法,其可更適合于基于所涉及約束和偏好 的某些應用:一種用于使用戶-服務器等待時間最小化的算法702, 一種用于使用戶間通信 的等待時間最小化的算法704,以及一種優(yōu)化兩者的算法706。
[0034] 圖7示出按照本發(fā)明的一個實施例的這三種服務器布局算法。在實施例中,服務 器布局模塊114配置成利用用于主要使用戶-服務器等待時間最小化的算法702。在實施 例中,算法702基于k-means或k-medoids聚類算法,但是具有若干增強。下面再現(xiàn)算法 702 :
總之,服務器布局模塊114開始于作為質(zhì)心的k元素。在實施例中,k的值由用戶來選 擇成表示推薦地理服務器位置124(其是用戶尋求的)的數(shù)量。通過所選擇的質(zhì)心,服務 器布局模塊114迭代地選擇新質(zhì)心,以使同一群組中的樣本到群組的質(zhì)心之間的距離最小 化。給定聚類的質(zhì)心Ci,屬于這個聚類的所有點%在步驟2中采用中心Ci來計算。在步驟 3,服務器布局模塊114按照Xj的新群組重新計算各聚類P新中心C'。這個算法的復雜 度為OfckA),其中k是聚類的最終數(shù)量,n是總數(shù)據(jù)點,以及A是迭代次數(shù)。
[0035] 在實施例中,值A通過k以及基于現(xiàn)實條件的初始集合的仔細選擇顯著減小。注 意,服務器布局模塊114不是盲目地簡單應用典型k-means或k-medoids樣式聚類解決方 案,而是按照問題上下文仔細選擇初始集合。在實施例中,服務器布局模塊114開始流行 OSN的已知數(shù)據(jù)中心位置的選擇,并且使用它們作為算法的初始候選(S卩,質(zhì)心),這有效地 減少聚類的迭代次數(shù)。另外,在實施例中,對于每個k,服務器布局模塊114始終將k-1實驗 中選擇的服務器集合包含在初始集合中。其余部分基于用戶群體的排序來選擇。此外,在 實施例中,算法考慮樣本密度信息(例如權(quán)重),而不是將各數(shù)據(jù)點當作相等的。
[0036] 在實施例中,服務器布局模塊114配置成利用用于主要使用戶間通信的等待時間 (或者平均等待時間)最小化的算法704。直觀地,如果圖的邊表示頂點之間的關(guān)系,則目 標是取得聚類中的許多邊以及聚類之間的幾個邊。但是,如果成本函數(shù)設置為聚類間邊的 數(shù)量,則使其最小化的問題是細微的,即,揀選包含單個聚類的聚類。因此,除了最小割要求 之外,算法704還要求分區(qū)需要盡可能平衡。平衡性質(zhì)還能夠幫助提供平衡負荷和最佳資 源利用。例如,如果一個最佳位置用來服務于所有用戶,則可易于造成帶寬瓶頸。在以下描 述中,術(shù)語"割"、"聚類邊"和"站點間業(yè)務"可互換地使用。
[0037] 在實施例中,算法704基于具有修改的最小割聚類算法。下面再現(xiàn)算法704 :
給定初始對分,服務器布局模塊114進行搜索以查找節(jié)點對交換序列,其引起割大小
這個過程,直至沒有進一步增益能夠通過改變?nèi)魏喂?jié)點對來得到。注意,算法704的目標仍 然是k聚類的劃分。線條9-10分別進一步劃分兩個初始聚類CJPC2。但是,其目標相應 地減小到k-1和k-2。
[0038] 在實施例中,服務器布局模塊114配置成利用用于使用戶-服務器等待時間和用 戶間通信的等待時間最小化的算法,其是用于使用戶-服務器等待時間最小化的算法702 以及用于使用戶間通信的等待時間最小化的算法704的擴展。下面再現(xiàn)算法706 :
在實施例中,服務器布局模塊114使用用于使用戶-服務器等待時間最小化的算法702 來初始化分區(qū),并且然后迭代地切換節(jié)點以減少割,與用于使用戶間通信的等待時間最小 化的算法704相似。在實施例中,為了防止在交換過程期間引起大用戶-服務器等待時間, 如果將要執(zhí)行移動,則服務器布局模塊114在質(zhì)心與新節(jié)點之間施加最大等待時間約束。 雖然在一些實施例中,算法706可用局部最優(yōu)解而不是全局最優(yōu)解來完成,給定問題的NP 硬性質(zhì),算法遠比基于其他整數(shù)編程的解更有效率和可縮放。
[0039] 回到圖1,服務器布局模塊114示為配置成利用用于使用戶-服務器等待時間和用 戶間通信的等待時間最小化的算法706,其在實施例中包括兩個子算法,各執(zhí)行與算法702 和704相似的操作。相應地,服務器布局模塊114包括從執(zhí)行第一子算法130所得到的兩個 第一聚類,其示出通過嘗試使用戶-服務器等待時間時間最小化的算法所生成的兩個潛在 聚類(和質(zhì)心134A)。然后,服務器布局模塊114執(zhí)行第二子算法,并且作為結(jié)果生成另外 兩個聚類132。如上所述,在實施例中,這個過程需要檢查來自不同聚類的節(jié)點對135,并且 當且僅當割大小減小并且各交換節(jié)點離新聚類的質(zhì)心(例如134B)的距離處于最大等待時 間約束距離之內(nèi)時才交換這些節(jié)點。相應地,聚類132的這個第二集合示為具有第一交換 節(jié)點'A' 131A和第二交換節(jié)點'B' 131B,其揭示交換發(fā)生,因為割大小減小并且各節(jié)點處于 離質(zhì)心(例如134B)的最大等待時間約束距離之內(nèi)。在實施例中,來自第二子算法132的 聚類的這些第二集合的各質(zhì)心(例如134B)表示推薦地理服務器位置124。在一些實施例 中,在由服務器布局模塊114完成算法706時,呈現(xiàn)模塊116利用(一個或多個)端口 120 來使推薦地理服務器位置124被呈現(xiàn)給用戶,但是在其他實施例中,呈現(xiàn)模塊116利用顯示 端口 122在顯示裝置上向用戶顯示推薦地理服務器位置124。在一些實施例中,顯示端口 122是用來經(jīng)過有線或無線接口向用戶傳送可視信息的計算裝置106的物理接口。
[0040] 在本發(fā)明的一些實施例中,計算裝置106包括聯(lián)合分析模塊118。如所示,聯(lián)合分 析模塊118與服務器布局模塊114和呈現(xiàn)模塊116進行交互;但是,在其他實施例(未示 出)中,聯(lián)合分析模塊118與其他模塊使用,并且按照與所示的不同順序來使用。
[0041] 聯(lián)合分析模塊118允許計算裝置106在確定推薦地理服務器位置124時附加地利 用來