一種基于隱語義概率模型的個性化服務(wù)推薦系統(tǒng)及方法
【專利摘要】本發(fā)明涉及一種基于隱語義概率模型的個性化服務(wù)推薦系統(tǒng)及方法,屬于服務(wù)計算【技術(shù)領(lǐng)域】,包括以下步驟:確定用于評價一系列功能相似服務(wù)的性能優(yōu)劣的QoS指標(biāo)體系;建立用戶、用戶指標(biāo)偏好以及服務(wù)情境三者之間的隱語義概率模型;收集系統(tǒng)內(nèi)不同用戶在不同的服務(wù)情境下使用不同功能的服務(wù)時通過與系統(tǒng)交互提供的指標(biāo)偏好信息,并存入歷史經(jīng)驗數(shù)據(jù)庫;用已收集的數(shù)據(jù)訓(xùn)練隱語義概率模型的參數(shù);當(dāng)用戶不熟悉某種服務(wù)情境,但需要在該服務(wù)情景下調(diào)用特定功能服務(wù)時,利用已訓(xùn)練的隱語義概率模型對該用戶的指標(biāo)偏好進(jìn)行預(yù)測;根據(jù)預(yù)測出的用戶個性化的QoS指標(biāo)偏好,對候選服務(wù)進(jìn)行綜合篩選,從中選出最貼近該用戶需求的服務(wù),從而實現(xiàn)個性化服務(wù)推薦。
【專利說明】一種基于隱語義概率模型的個性化服務(wù)推薦系統(tǒng)及方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于服務(wù)計算【技術(shù)領(lǐng)域】,具體涉及一種基于隱語義概率模型的個性化服務(wù)推薦系統(tǒng)及方法。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,服務(wù)計算技術(shù)得到了廣泛應(yīng)用,Web服務(wù)就是這樣一種分布運(yùn)行于Internet之上、支持不同平臺之間互操作的松耦合軟件系統(tǒng),它主要通過“發(fā)布-查找-綁定”的模式允許服務(wù)使用者和提供者之間形成松散的綁定關(guān)系,這為服務(wù)的使用奠定了基礎(chǔ)。但web服務(wù)的使用者和提供者相分離的特性,增加了服務(wù)使用者理解服務(wù)的難度,同時隨著Internet上運(yùn)行的web服務(wù)數(shù)量不斷增多,服務(wù)使用者需要從眾多功能相似的服務(wù)中選出最符合自身需求的一個或一組服務(wù),這對大多數(shù)缺乏專業(yè)知識的服務(wù)使用者來說無疑是一項繁重的任務(wù),所以發(fā)展有效的服務(wù)推薦技術(shù)是服務(wù)選擇的必然需求。
[0003]經(jīng)過對現(xiàn)有技術(shù)的檢索發(fā)現(xiàn),中國專利申請?zhí)?00710162463.8,記載了一種自適應(yīng)服務(wù)推薦設(shè)備,該裝置主要包括:語義分析裝置、服務(wù)選擇裝置、服務(wù)推薦裝置;語義分析裝置用于對用戶的查詢進(jìn)行語義上的分析;服務(wù)選擇裝置用于找出與語義分析后的查詢對應(yīng)的選擇的服務(wù),并根據(jù)選擇的服務(wù)更新服務(wù)相關(guān)數(shù)據(jù)庫;最后服務(wù)推薦裝置用于利用獲取的選擇的服務(wù)來查找服務(wù)相關(guān)數(shù)據(jù)庫以向用戶推薦相關(guān)服務(wù)。
[0004]進(jìn)一步檢索發(fā)現(xiàn),中國專利申請?zhí)?00910236492.3,記載了一種個性化服務(wù)推薦系統(tǒng)和方法,該方法主要包括:用戶信息收集器監(jiān)控在終端進(jìn)行的各種操作信息,并進(jìn)行預(yù)處理后存入用戶信息數(shù)據(jù)庫,若用戶信息數(shù)據(jù)庫方法更新,則啟動用戶行為分析器進(jìn)行分析;用戶行為分析器掃描用戶信息數(shù)據(jù)庫,提取新的用戶信息并計入資源信息數(shù)據(jù)庫,計算新的推薦策略并記入推薦策略數(shù)據(jù)庫;上下文感知處理器感知用戶的當(dāng)前上下文,輸出當(dāng)前的上下文描述信息,啟動個性化推薦處理器;個性化推薦處理器接收來自上下文感知處理器的消息后,獲得當(dāng)前上下文信息,通過檢索推薦策略數(shù)據(jù)庫,獲得匹配的左右推薦策略,并按照左右推薦策略通過檢索資源信息數(shù)據(jù)庫,匹配合適的資源信息,實時生成個性化推薦服務(wù)。
[0005]進(jìn)一步檢索發(fā)現(xiàn),中國專利申請?zhí)?0121014234.2記錄了一種基于上下文感知和用戶偏好的空間信息服務(wù)匹配方法,在用戶的服務(wù)請求和候選空間信息服務(wù)的功能性匹配和非功能性匹配的基礎(chǔ)上,考慮上下文敏感的用戶偏好,計算出用戶服務(wù)需求與智能空間中的各候選空間信息服務(wù)的匹配度,然后依據(jù)匹配度將候選空間信息服務(wù)推薦給用戶;雖然用戶可能具有固定的或者重復(fù)的偏好,但這些偏好不是在任何時候都相關(guān),該發(fā)明基于上下文感知和用戶偏好的空間信息服務(wù)匹配方法從上下文的角度對用戶偏好進(jìn)行精簡,剔除與用戶無關(guān)的用戶偏好;該發(fā)明從功能匹配和非功能匹配兩個方面進(jìn)行匹配度計算,提高空間信息服務(wù)匹配的準(zhǔn)確率。
[0006]進(jìn)一步檢索發(fā)現(xiàn),中國專利申請?zhí)?01210253884.2記錄了一種用于Web服務(wù)推薦的個性化搜索方法,包括以下步驟:步驟1,預(yù)處理WSDL文檔:通過去除停用詞和提取詞干兩個預(yù)處理步驟,形成詞袋;步驟2,抽取用戶興趣:使用改進(jìn)的TF-1DF公式計算詞袋中的每一個詞的權(quán)重,并乘以該詞的時間衰減因子,得到新的權(quán)重;選擇權(quán)重由大至小前k個詞作為用戶的興趣詞,以及每個詞的對應(yīng)權(quán)重,組成k維的用戶興趣向量;步驟3,計算興趣相似度:設(shè)定相似度閾值,超過閾值的用戶入選為目標(biāo)用戶的鄰居用戶;步驟4,排序服務(wù)檢索結(jié)果,根據(jù)鄰居用戶的相似度及其選擇服務(wù)的次數(shù)計算服務(wù)的推薦預(yù)測值,并將檢索結(jié)果按照推薦預(yù)測值降序排列,從而得到個性化搜索結(jié)果。
[0007]上述的方法都涉及了個性化的服務(wù)推薦,但很少針對Web服務(wù)的非功能屬性篩選服務(wù)以滿足用戶的個性化需求,服務(wù)的非功能屬性往往是服務(wù)性能的主要體現(xiàn),所以如何利用服務(wù)的非功能屬性客觀地評價服務(wù)的性能同時又能滿足不同用戶的個性化需求是服務(wù)推薦需要解決的問題。
【發(fā)明內(nèi)容】
[0008]本發(fā)明技術(shù)解決問題:針對現(xiàn)有技術(shù)存在的不足,提供一種基于隱語義概率模型的個性化服務(wù)推薦系統(tǒng)及方法,旨在為用戶在不熟悉的服務(wù)情境下提供指標(biāo)偏好預(yù)測,從而完成基于多維QoS指標(biāo)的服務(wù)綜合排序,為用戶提供個性化的服務(wù)推薦結(jié)果。
[0009]本發(fā)明的技術(shù)解決方案:一種個性化服務(wù)推薦中基于隱語義概率模型的用戶指標(biāo)偏好預(yù)測方法,具體步驟如下:
[0010]步驟1、確定評價服務(wù)性能優(yōu)劣的服務(wù)QoS指標(biāo)體系
[0011 ] 所述的服務(wù)QoS指標(biāo)體系是指整個Web服務(wù)系統(tǒng)統(tǒng)一采用的用于評價一系列功能相似服務(wù)性能優(yōu)劣所用QoS指標(biāo)的集合,不同的系統(tǒng)可以根據(jù)需要選取適當(dāng)?shù)腝oS指標(biāo)組成自己的QoS指標(biāo)體系用于評價服務(wù)的性能優(yōu)劣;
[0012]步驟2、建立用戶、用戶指標(biāo)偏好以及服務(wù)情境三者之間的隱語義概率模型
[0013]所述的用戶指標(biāo)偏好是指用戶對步驟I中所述服務(wù)QoS指標(biāo)體系中各個QoS指標(biāo)的偏好程度,對每個QoS指標(biāo)的偏好程度值介于O到I之間,并且對各個QoS指標(biāo)的偏好值總和為I ;所述的服務(wù)情境是指在何種場景下使用何種功能的服務(wù),每一個服務(wù)情境e用三元組(WDWhW3)表示,其中W1表示服務(wù)完成的與業(yè)務(wù)無關(guān)的基本功能,如視頻功能、導(dǎo)航功能等,W2表示用戶使用該功能的服務(wù)完成的具體業(yè)務(wù)活動,如學(xué)術(shù)會議、軍事導(dǎo)航等,W3表示用戶調(diào)用服務(wù)的終端設(shè)備,如手機(jī)、PC機(jī)等;所述的用戶、用戶指標(biāo)偏好、服務(wù)情境三者之間的隱語義概率模型是指單個用戶以不同的概率依賴不同的用戶隱類而存在,單則服務(wù)情境以不同的概率依賴不同的服務(wù)情境隱類存在,指標(biāo)偏好同時以不同的概率同時依賴不同的用戶隱類和服務(wù)情境隱類存在的概率模型,模型的圖像化表示如7所示。
[0014]所述的用戶隱類是指非人為事先確定的而是從歷史經(jīng)驗數(shù)據(jù)中學(xué)習(xí)得到的用戶聚簇;所述的服務(wù)情境隱類是指非人為事先確定的而是從歷史經(jīng)驗數(shù)據(jù)中學(xué)習(xí)得到的服務(wù)情境聚簇;
[0015]步驟3、收集不同用戶在不同的服務(wù)情境下使用不同功能服務(wù)時自主提供的指標(biāo)偏好信息,作為歷史經(jīng)驗數(shù)據(jù)存入數(shù)據(jù)庫,為訓(xùn)練步驟2中建立的隱語義概率模型的參數(shù)作準(zhǔn)備,存儲格式為(用戶,服務(wù)情境、指標(biāo)偏好)三元組;
[0016]步驟4、用EM算法及已收集的歷史經(jīng)驗數(shù)據(jù)訓(xùn)練隱語義概率模型的參數(shù)[0017]所述的隱語義概率模型的參數(shù)是指所有用戶隱類的先驗概率P(Ui) ( )、服務(wù)情境隱類取,E2,, EjI先驗概率P (Ej) ( 隱類Ui的情況下單個用戶u出現(xiàn)的條件概率P (UlUi) (l^i^ I)、給定一個服務(wù)情境隱類Ej的情況下單則服務(wù)情境e出現(xiàn)的條件概率P (e I Ej) (I ^ j ^ J)、給定用戶隱類Ui和服務(wù)情境隱類Ej的情況下用戶指標(biāo)偏好向量r出現(xiàn)的概率P(I^Ej) ( 其中I,J分別表示用戶隱類和服務(wù)情境隱類的總個數(shù),i,j分別表示用戶隱類和服務(wù)情境隱類的編號;
[0018]步驟5、獲得用戶需要服務(wù)推薦的請求,包括個人信息、服務(wù)推薦所依賴的服務(wù)情境;
[0019]步驟6、用已訓(xùn)練的隱語義概率模型預(yù)測指定用戶在特定服務(wù)情境下的未知指標(biāo)偏好;
[0020]步驟7、根據(jù)預(yù)測出的用戶個性化的QoS指標(biāo)偏好,對候選服務(wù)進(jìn)行綜合篩選,從而選出最貼近該用戶需求的服務(wù),將推薦結(jié)果返回給用戶。
[0021]所述步驟3中收集歷史經(jīng)驗數(shù)據(jù)的過程如下:
[0022](I)用戶在其熟悉的服務(wù)情境下調(diào)用熟悉的web服務(wù)時可以直接與系統(tǒng)交互,使用層次分析法給出自己給出對各個指標(biāo)偏好的兩兩比較結(jié)果,建立比較矩陣;
【權(quán)利要求】
1.一種基于隱語義概率模型的個性化服務(wù)推薦系統(tǒng),其特征在于包括: 歷史信息收集模塊:收集不同用戶在不同服務(wù)情境下通過層次分析法自主提供的指標(biāo)偏好比較矩陣,檢查該矩陣滿足一致性約束后,計算該矩陣最大特征值對應(yīng)的特征向量,歸一化后得出不同用戶在不同服務(wù)情境下的指標(biāo)偏好,并將用戶,服務(wù)情境、指標(biāo)偏好以三元組形式存入數(shù)據(jù)庫,為隱語義概率模型參數(shù)訓(xùn)練模塊提供歷史訓(xùn)練數(shù)據(jù); 隱語義概率模型參數(shù)訓(xùn)練模塊:從數(shù)據(jù)庫中獲取歷史信息收集模塊收集的用戶,服務(wù)情境、指標(biāo)偏好三元組作為訓(xùn)練樣本,根據(jù)事先設(shè)定的隱語義概率模型參數(shù)初值,利用EM算法在訓(xùn)練數(shù)據(jù)上迭代訓(xùn)練模型參數(shù),直至模型參數(shù)收斂,保存所得訓(xùn)練參數(shù),提供給個性化指標(biāo)偏好預(yù)測模塊; 用戶服務(wù)推薦請求模塊:該模塊獲取用戶登錄是提供的個性資料信息及用戶登錄后錄入的需要進(jìn)行服務(wù)推薦的服務(wù)情境信息,最后將這兩項信息提供給個性化指標(biāo)偏好預(yù)測模塊; 個性化指標(biāo)偏好預(yù)測模塊:獲取用戶服務(wù)推薦請求模塊提供的用戶個人信息和服務(wù)情境信息,結(jié)合隱語義概率模型參數(shù)訓(xùn)練模塊提供的已經(jīng)訓(xùn)練好的模型參數(shù),預(yù)測該用戶在該服務(wù)情境下的指標(biāo)偏好,并將預(yù)測的指標(biāo)偏好提供過個性化服務(wù)推薦模塊; 個性化服務(wù)推薦模塊:接收來自個性化指標(biāo)偏好模塊的用戶指標(biāo)偏好,及來自用戶服務(wù)推薦請求模塊的服務(wù)情境信息,獲取適用于該服務(wù)情境的所有功能相似的服務(wù),及服務(wù)各維度的QoS指標(biāo)值,與用戶個性化的指標(biāo)偏好作點積,給出服務(wù)的綜合排序,作為推薦列表返回給用戶,用戶根據(jù)推薦的結(jié)果選擇自己感興趣的項目進(jìn)行關(guān)注。
2.根據(jù)權(quán)利要求1所述的基于隱語義概率模型的個性化服務(wù)推薦系統(tǒng),其特征在于:所述隱語義概率模型參數(shù)訓(xùn)練 模塊實現(xiàn)過程: (1)從數(shù)據(jù)庫中獲取歷史信息收集模塊存入的用戶、服務(wù)情境、指標(biāo)偏好三元組,作為歷史訓(xùn)練數(shù)據(jù); (2)人工設(shè)置用戶隱類和服務(wù)情境隱類的個數(shù),以及模型的參數(shù)初值,包括用戶隱類和服務(wù)情境隱類的先驗概率,單個用戶在給定不同用戶隱類時的條件概率,單則服務(wù)情境在給定不同服務(wù)情境隱類時的條件概率,以及各個指標(biāo)偏好在給定不同用戶隱類和不同服務(wù)情境隱類時的正態(tài)分布均值和方差; (3)用EM算法,結(jié)合歷史訓(xùn)練數(shù)據(jù),對模型參數(shù)進(jìn)行迭代訓(xùn)練,直至收斂,保存模型參數(shù),提供給個性化指標(biāo)偏好預(yù)測模塊。
3.一種基于隱語義概率模型的個性化服務(wù)推薦方法,其特征在于實現(xiàn)步驟如下: 步驟1、確定評價服務(wù)性能優(yōu)劣的服務(wù)QoS指標(biāo)體系 所述的服務(wù)QoS指標(biāo)體系是指整個Web服務(wù)系統(tǒng)統(tǒng)一采用的用于評價一系列功能相似服務(wù)性能優(yōu)劣所用QoS指標(biāo)的集合,不同的系統(tǒng)可以根據(jù)需要選取適當(dāng)?shù)腝oS指標(biāo)組成自己的QoS指標(biāo)體系用于評價服務(wù)的性能優(yōu)劣; 步驟2、建立用戶、用戶指標(biāo)偏好以及服務(wù)情境三者之間的隱語義概率模型 所述的用戶指標(biāo)偏好是指用戶對步驟I中所述服務(wù)QoS指標(biāo)體系中各個QoS指標(biāo)的偏好程度,對每個QoS指標(biāo)的偏好程度值介于O到I之間,并且對各個QoS指標(biāo)的偏好值總和為I ;所述的服務(wù)情境是指在何種場景下使用何種功能的服務(wù),每一個服務(wù)情境e用三元組(W1, W2, W3)表示,其中W1表示服務(wù)完成的與業(yè)務(wù)無關(guān)的基本功能,如視頻功能、導(dǎo)航功能等,W2表示用戶使用該功能的服務(wù)完成的具體業(yè)務(wù)活動,W3表示用戶調(diào)用服務(wù)的終端設(shè)備; 所述的用戶、用戶指標(biāo)偏好、服務(wù)情境三者之間的隱語義概率模型是指單個用戶以不同的概率依賴不同的用戶隱類而存在,單則服務(wù)情境以不同的概率依賴不同的服務(wù)情境隱類存在,指標(biāo)偏好同時以不同的概率同時依賴不同的用戶隱類和服務(wù)情境隱類存在的概率模型, 所述的用戶隱類是指非人為事先確定的而是從歷史經(jīng)驗數(shù)據(jù)中學(xué)習(xí)得到的用戶聚簇;所述的服務(wù)情境隱類是指非人為事先確定的而是從歷史經(jīng)驗數(shù)據(jù)中學(xué)習(xí)得到的服務(wù)情境聚簇; 步驟3、收集不同用戶在不同的服務(wù)情境下使用不同功能服務(wù)時自主提供的指標(biāo)偏好信息,作為歷史經(jīng)驗數(shù)據(jù)存入數(shù)據(jù)庫,為訓(xùn)練步驟2中建立的隱語義概率模型的參數(shù)作準(zhǔn)備,存儲格式為用戶,服務(wù)情境、指標(biāo)偏好三元組; 步驟4、用EM算法及已收集的歷史經(jīng)驗數(shù)據(jù)訓(xùn)練隱語義概率模型的參數(shù) 所述的隱語義概率模型的參數(shù)是指所有用戶隱類的先驗概率P(Ui)(I≤i≤I)、服務(wù)情境隱類取,E2,, EjI先驗概率P(Ej) (I≤j≤J)、給定一個用戶隱類仏的情況下單個用戶u出現(xiàn)的條件概率P (UlUi) (l≤i≤ I)、給定一個服務(wù)情境隱類Ej的情況下單則服務(wù)情境e出現(xiàn)的條件概率P (e I Ej) (I ≤ j ≤ J)、給定用戶隱類Ui和服務(wù)情境隱類Ej的情況下用戶指標(biāo)偏好向量r出現(xiàn)的概率P(IHUpEj) (I≤i≤I,I≤j≤J);其中I,J分別表示用戶隱類和服務(wù)情境隱類的總個數(shù),i,j分別表示用戶隱類和服務(wù)情境隱類的編號; 步驟5、獲得用戶需要服務(wù)推薦的請求,包括個人信息、服務(wù)推薦所依賴的服務(wù)情境; 步驟6、用已訓(xùn)練的隱語義概率模型預(yù)測指定用戶在特定服務(wù)情境下的未知指標(biāo)偏好; 步驟7、根據(jù)預(yù)測出的用戶個性化的QoS指標(biāo)偏好,對候選服務(wù)進(jìn)行綜合篩選,從而選出最貼近該用戶需求的服務(wù),將推薦結(jié)果返回給用戶。
4.根據(jù)權(quán)利要求3所述的基于隱語義概率模型的個性化服務(wù)推薦方法,其特征在于:所述步驟3中收集歷史經(jīng)驗數(shù)據(jù)的過程如下: (1)用戶在其熟悉的服務(wù)情境下調(diào)用熟悉的web服務(wù)時,直接與系統(tǒng)交互,使用層次分析法給出自己給出對各個指標(biāo)偏好的兩兩比較結(jié)果,建立比較矩陣;
5.根據(jù)權(quán)利要求3所述的基于隱語義概率模型的個性化服務(wù)推薦方法,其特征在于:所述步驟4中隱語義概率模型的參數(shù)訓(xùn)練過程如下, (I)從數(shù)據(jù)庫中取出所有的用戶、服務(wù)情境、指標(biāo)偏好三元組作為訓(xùn)練數(shù)據(jù),是用戶在其熟悉的服務(wù)情境下利用層次分析法給出的個性化指標(biāo)偏好權(quán)值,每個三元組(U,e, r)表示用戶u在服務(wù)情境e下對服務(wù)的各個QoS指標(biāo)的偏好權(quán)重為r,r是一個K維向量(r1; r2,..., rK),為簡單起見,假設(shè)權(quán)重向量r的每一維相互獨(dú)立并且服從正態(tài)分布,則聯(lián)合概率P (u,e,r)用下面兩個公式表示,
6.根據(jù)權(quán)利要求3所述的基于隱語義概率模型的個性化服務(wù)推薦方法,其特征在于:步驟6中利用已訓(xùn)練的隱語義概率模型預(yù)測用戶指標(biāo)偏好的實現(xiàn)方式如下: (1)用戶Ut登陸服務(wù)推薦系統(tǒng),提供需要進(jìn)行服務(wù)推薦的服務(wù)情境一; (2)推薦系統(tǒng)獲取用戶的個人數(shù)據(jù)及其提供的服務(wù)情境信息,用下面的公式對該用戶在該服務(wù)情境下的各個QoS指標(biāo)偏好進(jìn)行獨(dú)立預(yù)測:
7.根據(jù)權(quán)利要求3所述的基于隱語義概率模型的個性化服務(wù)推薦方法,其特征在于:步驟7中根據(jù)預(yù)測出的用戶個性化的QoS指標(biāo)偏好,對候選服務(wù)進(jìn)行篩選的過程如下:用戶Ut在服務(wù)情境J下已得到多個功能相似的候選服務(wù),假設(shè)每個服務(wù)的各QoS指標(biāo)上的性能可有其他方法得到,記為(qi,q2,...,qK),每一個服務(wù)的總得分采用R^r\-ql+r\-q2 +...+ fK _ ^表示,最后根據(jù)各個服務(wù)的總得分給出服務(wù)的排序,作為服務(wù)推薦的依據(jù)。
【文檔編號】G06F17/30GK103473291SQ201310392446
【公開日】2013年12月25日 申請日期:2013年9月2日 優(yōu)先權(quán)日:2013年9月2日
【發(fā)明者】彭啟民, 胡堰, 胡曉惠 申請人:中國科學(xué)院軟件研究所