国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      實現(xiàn)定制隱私保護的個性化信息檢索系統(tǒng)的方法

      文檔序號:6357979閱讀:197來源:國知局
      專利名稱:實現(xiàn)定制隱私保護的個性化信息檢索系統(tǒng)的方法
      技術領域
      本發(fā)明涉及個性化信息檢索系統(tǒng)、敏感數(shù)據(jù)隱藏與隱私保護方法,特別是涉及一種實現(xiàn)定制隱私保護的個性化信息檢索系統(tǒng)的方法。
      背景技術
      信息檢索技術和隱私保護技術是計算機領域中研究最為長遠、應用最為廣泛的兩個技術。一直以來,這兩項技術在發(fā)展過程中彼此基本相互獨立。信息檢索技術及以此為基礎的個性化信息檢索,用于各類海量數(shù)據(jù)的維護與查詢,主要研究數(shù)據(jù)特征提取、索引維護、查詢結果排序與評價方法。隱私保護技術主要應用于數(shù)據(jù)采集與發(fā)布領域,研究開放環(huán)境下對個體敏感數(shù)據(jù)的隱藏模型和代價評估方法。隨著互聯(lián)網(wǎng)技術的發(fā)展和Web資源的日漸豐富,特別是強調(diào)“以人為本”的Web2. 0 網(wǎng)絡概念的興起,越來越多的互聯(lián)網(wǎng)信息檢索應用通過分析用戶行為、學習用戶偏好以優(yōu)化檢索機制,提供個性化信息檢索服務。然而,由于在此過程中,系統(tǒng)需要搜集和分析大量的用戶個人信息,任何對此類信息的不當使用和發(fā)布都會導致嚴重的隱私泄露。該問題已經(jīng)成為個性化信息檢索系統(tǒng)被廣泛應用的最大障礙。因此,業(yè)界迫切需要一個完善的信息檢索解決方案,在提供高效、符合用戶需要的檢索結果的同時,保障用戶的個人信息不被侵犯和濫用。但由于信息檢索系統(tǒng)中隱私保護相關研究剛剛起步,目前尚未產(chǎn)生一個成熟完備的支持隱私保護的個性化信息檢索方案。目前如Google、Yahoo等成熟的信息檢索服務供應商對于其個性化產(chǎn)品的隱私保護,主要采用安全訪問協(xié)議,保護數(shù)據(jù)不被攻擊者截獲。但這種方法只能保護數(shù)據(jù)傳輸信道的安全,不能防止服務器終端對用戶隱私的侵犯。而在研究領域,目前成果主要采用在發(fā)送用戶請求前,在客戶端對于用戶信息進行泛化處理,來限制服務提供商對于用戶準確信息的掌握,同時保證服務質(zhì)量。一方面這一方法沒有充分利用不同用戶對于隱私保護的特殊需求,隱私保護方法不能與用戶隱私需求相匹配;另一方面該方法缺乏對不同檢索請求特性的分析,難以在檢索質(zhì)量和隱私保護之間進行有效的權衡。由于信息檢索系統(tǒng)與隱私保護系統(tǒng)在各自的領域都已經(jīng)經(jīng)歷長久的發(fā)展,積累了眾多成熟的技術。因此要實現(xiàn)支持隱私保護的個性化信息檢索系統(tǒng),應該在當前成熟的個性化信息檢索解決方案中,最大限度地引入在數(shù)據(jù)采集與發(fā)布領域中豐富的隱私保護技術。此外,系統(tǒng)應根據(jù)用戶的隱私需求和檢索請求的特性,支持隱私保護方法的可定制,在檢索質(zhì)量和隱私保護之間進行有效的權衡。

      發(fā)明內(nèi)容
      為了克服背景技術中現(xiàn)有方法沒有充分利用不同用戶對于隱私保護的特殊需求, 隱私保護方法不能與用戶隱私需求相匹配;而且缺乏對不同檢索請求特性的分析,造成難以在檢索質(zhì)量和隱私保護之間進行有效的權衡問題。本發(fā)明的目的在于提供一種實現(xiàn)定制隱私保護的個性化信息檢索系統(tǒng)的方法。
      本發(fā)明解決其技術問題采用的技術方案是,該方法的步驟如下
      步驟1)設計定制隱私保護的個性化信息檢索系統(tǒng)的系統(tǒng)架構,并根據(jù)該系統(tǒng)架構選擇相應的隱私保護模型;
      步驟2)實現(xiàn)步驟1)中隱私保護模型所需的多級語義粒度的用戶模型,用于描述用戶偏好,并在用戶模型基礎上定制用戶隱私,分析攻擊者模型和定義隱私保護目標;
      步驟3)開發(fā)支持隱私保護的個性化信息檢索系統(tǒng)的通用框架,根據(jù)用戶的隱私需求, 使用數(shù)據(jù)泛化技術對用戶模型進行定制泛化;
      步驟4)基于用戶模型開發(fā)分別用于預測量化當前用戶模型用于個性化檢索的查詢質(zhì)量指標和隱私風險指標,將該兩個指標融合為綜合性能指標;同時開發(fā)用于預測量化特定檢索歧義程度的指標,以實現(xiàn)用戶模型泛化的自適應調(diào)節(jié);
      步驟5)開發(fā)用戶模型泛化方法,針對特定信息檢索請求的特性,依據(jù)步驟4)開發(fā)的三個指標,生成泛化用戶模型,并使用該泛化用戶模型進行個性化信息檢索。所述步驟1)中設計的系統(tǒng)架構,用于分析該系統(tǒng)所使用的應用場景;在該應用場景中,用戶不信任除自己之外的任何實體,因此隱私保護機制需要作為一個信息檢索代理在客戶端引入;該代理對用戶模型在本地進行語義泛化后,才將其分享給服務器用于個性化信息檢索;因此,該系統(tǒng)架構的設計方法如下
      a)每當用戶提交一個信息檢索請求,代理根據(jù)用戶定制的隱私需求和該檢索請求的內(nèi)容特性,將完整的用戶模型泛化成相應的實例;
      b)檢索代理將用戶提交的信息檢索請求和相應的用戶模型泛化實例,一并發(fā)送給服務器,用于個性化信息檢索;
      c)服務器根據(jù)查詢代理分享的用戶模型泛化實例,對信息檢索請求的結果進行個性化重排,并將結果發(fā)送回查詢代理;
      d)查詢代理對于取得的查詢結果,使用本地完整的用戶模型進一步優(yōu)化,并將查詢結果呈現(xiàn)給用戶。所述步驟1)選取的隱私保護模型,需要與其系統(tǒng)架構相適應,由于系統(tǒng)架構要求對用戶模型的隱私保護支持語義泛化,選取多粒度語義泛化模型;
      所述步驟2)用戶模型選用應滿足以下條件支持在多個語義粒度上描述用戶偏好,以適應步驟1)中選取的選取多粒度語義泛化模型;且需要依據(jù)公用的語義分類法構建,使用戶模型易于擴展;
      所述步驟2)中的定制用戶隱私,包括a)隱私內(nèi)容和b)隱私權重;所述系統(tǒng)在用戶定制的隱私需求基礎上,對用戶模型進行最優(yōu)泛化;
      所述步驟2)中的攻擊者模型分析工作包含如下二個任務
      a)分析攻擊者所掌握的先驗背景知識和所使用的攻擊方式;
      b)針對a)分析的先驗背景知識和攻擊方式,確立隱私保護的目標。所述步驟3)中開發(fā)的支持隱私保護的個性化信息檢索系統(tǒng)的通用框架,包含如下步驟
      1)在系統(tǒng)初始化階段
      a)分析用戶原始數(shù)據(jù),依據(jù)公用的語義分類法構建層級用戶模型;
      b)用戶自行在構建好的層級用戶模型中,定制隱私需求,包括隱私語義內(nèi)容和相應的隱私權重;
      2)在系統(tǒng)初始化完畢后,每當用戶提交檢索請求
      a)根據(jù)檢索請求的內(nèi)容,在層級用戶模型中設置相關語義內(nèi)容和相應的相關度權重;
      b)在框架步驟1)b)和2) a)基礎上,通過預測性質(zhì)指標,開發(fā)對用戶模型進行近似最優(yōu)泛化的方法;該方法輸出用于個性化信息檢索的最終用戶模型。所述步驟4)中基于用戶模型開發(fā)的查詢質(zhì)量指標和隱私風險指標分別用于完成如下任務
      a)根據(jù)層級用戶模型中集成的面向特定檢索請求的相關度信息來預測分享器對于個性化信息檢索的效用;
      b)根據(jù)層級用戶模型中集成的用戶定制的隱私需求來預測分享其所導致的隱私風
      險;
      所述步驟4)中的綜合性能指標,通過查詢質(zhì)量指標和隱私風險指標加權融合生成,并通過相應參數(shù)對兩者權重進行調(diào)節(jié);該綜合指標作為步驟5)中的用戶模型泛化方法優(yōu)化的最終指標。所述步驟4)中基于用戶模型開發(fā)的查詢質(zhì)量指標和隱私風險指標被開發(fā)為預測指標,即不需要采集用戶對于信息檢索結果排序的反饋信息,保證步驟5)中的用戶模型泛化方法能夠在客戶端本地執(zhí)行。所述步驟4)中開發(fā)的用于預測量化特定檢索歧義程度的指標,負責在步驟5)的數(shù)據(jù)模型泛化方法執(zhí)行前,預測特定檢索是否需要通過個性化來提高檢索質(zhì)量;如果檢索請求為非歧義請求,則直接執(zhí)行非個性化檢索,杜絕用戶信息分享。所述步驟5)中開發(fā)的用戶模型泛化方法為近似最優(yōu)泛化方法;由于泛化方法搜索空間龐大,將其設計為基于代價的迭代方法,依據(jù)步驟4)中開發(fā)的綜合性能指標,在每個迭代過程中,搜索能最大化綜合性能指標的泛化結果,直至迭代終止。所述步驟5)中開發(fā)的用戶模型泛化方法,根據(jù)兩個不同的應用需要設計
      a)優(yōu)化步驟4)中開發(fā)的綜合性能指標;
      b)由用戶指定隱私風險指標上界,系統(tǒng)負責在用戶隱私風險上界下,最大化查詢質(zhì)量指標。本發(fā)明具有的有益效果是
      本發(fā)明在個性化信息檢索系統(tǒng)中引入隱私保護的方法,充分利用不同用戶對于隱私保護的特殊需求,保證隱私保護結果與用戶隱私需求相匹配;而且通過開發(fā)查詢質(zhì)量指標和隱私風險指標,分析特定檢索特性,權衡檢索質(zhì)量和隱私保護。


      圖1是本發(fā)明實施步驟流程圖。圖2是本發(fā)明的系統(tǒng)架構圖。圖3是層級用戶模型示例圖。圖4是攻擊者模型圖。圖5是本發(fā)明的通用框架圖。
      具體實施例方式現(xiàn)結合具體實施和示例對本發(fā)明的技術方案作進一步說明。如圖1所示,本發(fā)明方法的步驟如下
      步驟1)設計定制隱私保護的個性化信息檢索系統(tǒng)的系統(tǒng)架構,并根據(jù)該系統(tǒng)架構選擇相應的隱私保護模型;
      步驟2)實現(xiàn)步驟1)中隱私保護模型所需的多級語義粒度的用戶模型,用于描述用戶偏好,并在用戶模型基礎上定制用戶隱私,分析攻擊者模型和定義隱私保護目標;
      步驟3)開發(fā)支持隱私保護的個性化信息檢索系統(tǒng)的通用框架,根據(jù)用戶的隱私需求, 使用數(shù)據(jù)泛化技術對用戶模型進行定制泛化;
      步驟4)基于用戶模型開發(fā)分別用于預測量化當前用戶模型用于個性化檢索的查詢質(zhì)量指標和隱私風險指標,將該兩個指標融合為綜合性能指標;同時開發(fā)用于預測量化特定檢索歧義程度的指標,以實現(xiàn)用戶模型泛化的自適應調(diào)節(jié);
      步驟5)開發(fā)用戶模型泛化方法,針對特定信息檢索請求的特性,依據(jù)步驟4)開發(fā)的三個指標,生成泛化用戶模型,并使用該泛化用戶模型進行個性化信息檢索。如圖2所示,所述步驟1)中設計的系統(tǒng)架構,用于分析該系統(tǒng)所使用的應用場景; 在該應用場景中,用戶不信任除自己之外的任何實體,因此隱私保護機制需要作為一個信息檢索代理在客戶端引入;該代理對用戶模型在本地進行語義泛化后,才將其分享給服務器用于個性化信息檢索;因此,該系統(tǒng)架構的設計方法如下
      a)每當用戶提交一個信息檢索請求,代理根據(jù)用戶定制的隱私需求和該檢索請求的內(nèi)容特性,將完整的用戶模型泛化成相應的實例;
      b)檢索代理將用戶提交的信息檢索請求和相應的用戶模型泛化實例,一并發(fā)送給服務器,用于個性化信息檢索;
      c)服務器根據(jù)查詢代理分享的用戶模型泛化實例,對信息檢索請求的結果進行個性化重排,并將結果發(fā)送回查詢代理;
      d)查詢代理對于取得的查詢結果,使用本地完整的用戶模型進一步優(yōu)化,并將查詢結果呈現(xiàn)給用戶。所述步驟1)選取的隱私保護模型,需要與其系統(tǒng)架構相適應,由于系統(tǒng)架構要求對用戶模型的隱私保護支持語義泛化,選取多粒度語義泛化模型;
      所述步驟2)用戶模型選用應滿足以下條件支持在多個語義粒度上描述用戶偏好,以適應步驟1)中選用的用戶模型應滿足以下條件支持在多個語義粒度上描述用戶偏好,以適應步驟1)中選取的本發(fā)明選取多粒度語義泛化模型;且需要依據(jù)一個公用的語義分類法構建,使用戶模型易于擴展?,F(xiàn)有大多數(shù)層級(樹狀)用戶模型都滿足這一需求,如DMOZ 分類法、W0RDNET分類法、Yahoo目錄分類法。如圖3所示,本發(fā)明使用DMOZ分類法來構建層級用戶模型;層級結構用戶模型便于在多個語義粒度上描述用戶偏好,自頂向下,語義粒度逐層細化。通過截取完整用戶模型的“同根子樹”,可以實現(xiàn)對用戶模型的語義泛化,如圖3中虛線所示;此外,層級用戶模型中上級語義節(jié)點和下級語義節(jié)點之間存在“傳遞率”信息,這對于實現(xiàn)步驟4)的衡量指標
      非常重要;
      所述步驟2)中的定制用戶隱私,包括a)隱私內(nèi)容和b)隱私權重;所述系統(tǒng)在用戶定制的隱私需求基礎上,對用戶模型進行最優(yōu)泛化;本發(fā)明將用戶隱私需求建模為用戶模型中的隱私語義節(jié)點集合,且每個隱私語義節(jié)點標注有隱私權重。以圖3的用戶模型為例,用戶的隱私需求為{Web隱私,Perl,自由泳,老鷹樂隊,口琴,成人}。所述步驟2)中的攻擊者模型分析工作包含如下二個任務
      a)分析攻擊者所掌握的先驗背景知識和所使用的攻擊方式;本發(fā)明的攻擊者主要采用 “竊聽”的攻擊方式。攻擊者模型,如圖4所示,為攻擊用戶隱私,攻擊者首先通過中間人攻擊或入侵搜索引擎服務器,截獲用戶和服務器之間的所有通訊。之后,每當用戶發(fā)起一個檢索請求,攻擊者都會截獲到其提交的請求內(nèi)容和相應的泛化用戶模型?;谒孬@內(nèi)容,攻擊者嘗試重構出原始的用戶模型,并以分類法作為背景只是,猜測用戶定制的隱私需求。需要注意的是,這里的竊聽攻擊者在下面兩方面是受限的
      i)知識受限。攻擊者所能獲取的一切背景知識都應只局限于公共分類法
      ii)記憶受限。該約束表明攻擊者不能針對同一被攻擊對象,長期存儲從多次查詢中截獲的信息以進行分析。也就是說,攻擊者的竊聽過程必須局限在被攻擊對象的單次檢索過程中。b)針對a)分析的先驗背景知識和攻擊方式,確立隱私保護的目標;
      本發(fā)明的個性化檢索系統(tǒng)的隱私泄漏可以被簡化為用戶定制的隱私內(nèi)容的暴露,隱私風險大小通過攻擊者在獲知被攻擊目標提交的查詢和相應的泛化用戶模型的基礎上推測出其敏感語義節(jié)點的可能性來衡量。因此個性化搜索引擎的隱私保護目標實質(zhì)上是對該概率的最小化過程。如圖5所示,所述步驟3)中開發(fā)的支持隱私保護的個性化信息檢索系統(tǒng)的通用框架,包含如下步驟
      1)在系統(tǒng)初始化階段
      a)分析用戶原始數(shù)據(jù),依據(jù)公用的語義分類法構建層級用戶模型;該步驟是框架中一個可替換的模塊;本文使用DMOZ分類法來構建用戶模型,但任何其他層級用戶模型的構建方法都可以用于實現(xiàn)該模塊;但是由于該泛化框架的整體性能非常依賴選取的分類法庫的質(zhì)量,基于現(xiàn)成的定義完備的概念分類構造模型的方法更適合該泛化框架。b)用戶自行在構建好的層級用戶模型中,定制隱私需求,包括隱私語義內(nèi)容和相應的隱私權重;該步驟同時以一種自底向上的方式地順序計算和標注層級用戶模型中的每個語義節(jié)點的敏感權重。2)在系統(tǒng)初始化完畢后,每當用戶提交檢索請求
      a)根據(jù)檢索請求的內(nèi)容,在層級用戶模型中設置相關語義內(nèi)容和相應的相關度權重;
      b)在框架步驟1)b)和2) a)基礎上,通過預測性質(zhì)指標,開發(fā)對用戶模型進行近似最優(yōu)泛化的方法;該方法輸出用于個性化信息檢索的最終用戶模型。所述步驟4)中基于用戶模型開發(fā)的查詢質(zhì)量指標和隱私風險指標分別用于完成如下任務
      a)根據(jù)層級用戶模型中集成的面向特定檢索請求的相關度信息來預測分享器對于個性化信息檢索的效用;本發(fā)明將該指標定義為泛化用戶模型對于消除相應檢索請求的歧義性能力,即
      檢索功用=檢索請求q與泛化模型中q的相關語義內(nèi)容的KL距離b)根據(jù)層級用戶模型中集成的用戶定制的隱私需求來預測分享其所導致的隱私風險; 本發(fā)明將隱私指標定義為
      隱私風險=Max (泛化用戶模型各個節(jié)點隱私權重)
      所述步驟4)中的綜合性能指標,通過查詢質(zhì)量指標和隱私風險指標加權融合生成,并通過相應參數(shù)對兩者權重進行調(diào)節(jié);該綜合指標作為步驟5)中的用戶模型泛化方法優(yōu)化的最終指標;本發(fā)明將該綜合指標定義如下 綜合指標=檢索功用一 P X隱私風險
      其中P是一個檢索功用-隱私風險的轉化參數(shù)。通過調(diào)節(jié)P的取值,我們可以找到不同版本的用戶模型泛化示例。選擇較小的P,會使得泛化方法的結果同時具備高可用性和高風險性;而選擇較大的P會產(chǎn)生個性化服務質(zhì)量預期較低的泛化實例,但是同時的隱私泄漏風險也較低。所述步驟4)中基于用戶模型開發(fā)的查詢質(zhì)量指標和隱私風險指標被開發(fā)為預測指標,即不需要采集用戶對于信息檢索結果排序的反饋信息,保證步驟5)中的用戶模型泛化方法能夠在客戶端本地執(zhí)行。所述步驟4)中開發(fā)的用于預測量化特定檢索歧義程度的指標,負責在步驟5)的數(shù)據(jù)模型泛化方法執(zhí)行前,預測特定檢索是否需要通過個性化來提高檢索質(zhì)量;如果檢索請求為非歧義請求,則直接執(zhí)行非個性化檢索,杜絕用戶信息分享;本發(fā)明采用與定義檢索公用預測指標相似的方法定義該指標,只需驗證特定檢索請求和整個語義分類中的歧義性集合,即
      檢索請求歧義性=檢索請求q與語義分類法中所有相關語義內(nèi)容的KL距離所述步驟5)中開發(fā)的用戶模型泛化方法為近似最優(yōu)泛化方法;由于泛化方法搜索空間龐大,將其設計為基于代價的迭代方法,依據(jù)步驟4)中開發(fā)的綜合性能指標,在每個迭代過程中,搜索能最大化綜合性能指標的泛化結果,直至迭代終止。所述步驟5)中開發(fā)的用戶模型泛化方法,根據(jù)兩個不同的應用需要設計
      a)優(yōu)化步驟4)中開發(fā)的綜合性能指標;該方法主要用戶設置好綜合指標傳遞參數(shù)P 后,由系統(tǒng)自行調(diào)節(jié)泛化性能的場景,具體步驟如下;
      i)計算檢索請求q的歧義性,若低于某一閾值,則直接發(fā)送請求,否則繼續(xù)執(zhí)行;
      ii)通過框架步驟2)a)中取得的相關語義信息,對原始用戶模型進行剪枝
      iii)以用戶模型被泛化為僅剩根節(jié)點為終止條件,開啟迭代每次選擇一個泛化方法, 是的輸出的結果能最大化綜合指標。使用專門變量記錄在迭代過程中出現(xiàn)的綜合指標最優(yōu)的中間結果;
      iv)輸出最優(yōu)泛化實例;
      b)由用戶指定隱私風險指標上界,系統(tǒng)負責在用戶隱私風險上界下,最大化查詢質(zhì)量指標;具體步驟如下
      i)計算檢索請求q的歧義性,若低于某一閾值,則直接發(fā)送請求,否則繼續(xù)執(zhí)行;
      ii)通過框架步驟2)a)中取得的相關語義信息,對原始用戶模型進行剪枝
      iii)以用戶模型被泛化為僅剩根節(jié)點為終止條件,開啟迭代每次選擇一個泛化方法, 如果該方法輸出的結果不符合用戶制定的隱私風險上界,則忽略;否則,選取能夠最大檢索功用指標的中間結果,并保存下來;iv)輸出最優(yōu)泛化實例。
      權利要求
      1.一種實現(xiàn)定制隱私保護的個性化信息檢索系統(tǒng)的方法,其特征在于該方法的步驟如下步驟1)設計定制隱私保護的個性化信息檢索系統(tǒng)的系統(tǒng)架構,并根據(jù)該系統(tǒng)架構選擇相應的隱私保護模型;步驟2)實現(xiàn)步驟1)中隱私保護模型所需的多級語義粒度的用戶模型,用于描述用戶偏好,并在用戶模型基礎上定制用戶隱私,分析攻擊者模型和定義隱私保護目標;步驟3)開發(fā)支持隱私保護的個性化信息檢索系統(tǒng)的通用框架,根據(jù)用戶的隱私需求, 使用數(shù)據(jù)泛化技術對用戶模型進行定制泛化;步驟4)基于用戶模型開發(fā)分別用于預測量化當前用戶模型用于個性化檢索的查詢質(zhì)量指標和隱私風險指標,將該兩個指標融合為綜合性能指標;同時開發(fā)用于預測量化特定檢索歧義程度的指標,以實現(xiàn)用戶模型泛化的自適應調(diào)節(jié);步驟5)開發(fā)用戶模型泛化方法,針對特定信息檢索請求的特性,依據(jù)步驟4)開發(fā)的三個指標,生成泛化用戶模型,并使用該泛化用戶模型進行個性化信息檢索。
      2.根據(jù)權利要求1中所述的一種實現(xiàn)定制隱私保護的個性化信息檢索系統(tǒng)的方法,其特征在于所述步驟1)中設計的系統(tǒng)架構,用于分析該系統(tǒng)所使用的應用場景;在該應用場景中,用戶不信任除自己之外的任何實體,因此隱私保護機制需要作為一個信息檢索代理在客戶端引入;該代理對用戶模型在本地進行語義泛化后,才將其分享給服務器用于個性化信息檢索;因此,該系統(tǒng)架構的設計方法如下a)每當用戶提交一個信息檢索請求,代理根據(jù)用戶定制的隱私需求和該檢索請求的內(nèi)容特性,將完整的用戶模型泛化成相應的實例;b)檢索代理將用戶提交的信息檢索請求和相應的用戶模型泛化實例,一并發(fā)送給服務器,用于個性化信息檢索;c)服務器根據(jù)查詢代理分享的用戶模型泛化實例,對信息檢索請求的結果進行個性化重排,并將結果發(fā)送回查詢代理;d)查詢代理對于取得的查詢結果,使用本地完整的用戶模型進一步優(yōu)化,并將查詢結果呈現(xiàn)給用戶。
      3.根據(jù)權利要求1中所述的一種實現(xiàn)定制隱私保護的個性化信息檢索系統(tǒng)的方法,其特征在于所述步驟1)選取的隱私保護模型,需要與其系統(tǒng)架構相適應,由于系統(tǒng)架構要求對用戶模型的隱私保護支持語義泛化,選取多粒度語義泛化模型。
      4.根據(jù)權利要求1中所述的一種實現(xiàn)定制隱私保護的個性化信息檢索系統(tǒng)的方法,其特征在于所述步驟2)用戶模型選用應滿足以下條件支持在多個語義粒度上描述用戶偏好,以適應步驟1)中選取的選取多粒度語義泛化模型;且需要依據(jù)公用的語義分類法構建,使用戶模型易于擴展;所述步驟2)中的定制用戶隱私,包括a)隱私內(nèi)容和b)隱私權重;所述系統(tǒng)在用戶定制的隱私需求基礎上,對用戶模型進行最優(yōu)泛化;所述步驟2)中的攻擊者模型分析工作包含如下二個任務a)分析攻擊者所掌握的先驗背景知識和所使用的攻擊方式;b)針對a)分析的先驗背景知識和攻擊方式,確立隱私保護的目標。
      5.根據(jù)權利要求1中所述的一種實現(xiàn)定制隱私保護的個性化信息檢索系統(tǒng)的方法,其特征在于所述步驟3)中開發(fā)的支持隱私保護的個性化信息檢索系統(tǒng)的通用框架,包含如下步驟5.1)在系統(tǒng)初始化階段a)分析用戶原始數(shù)據(jù),依據(jù)公用的語義分類法構建層級用戶模型;b)用戶自行在構建好的層級用戶模型中,定制隱私需求,包括隱私語義內(nèi)容和相應的隱私權重;5.2)在系統(tǒng)初始化完畢后,每當用戶提交檢索請求a)根據(jù)檢索請求的內(nèi)容,在層級用戶模型中設置相關語義內(nèi)容和相應的相關度權重;b)在框架步驟5.1) b)和5. 2) a)基礎上,通過預測性質(zhì)指標,開發(fā)對用戶模型進行近似最優(yōu)泛化的方法;該方法輸出用于個性化信息檢索的最終用戶模型。
      6.根據(jù)權利要求1中所述的一種實現(xiàn)定制隱私保護的個性化信息檢索系統(tǒng)的方法,其特征在于所述步驟4)中基于用戶模型開發(fā)的查詢質(zhì)量指標和隱私風險指標分別用于完成如下任務a)根據(jù)層級用戶模型中集成的面向特定檢索請求的相關度信息來預測分享器對于個性化信息檢索的效用;b)根據(jù)層級用戶模型中集成的用戶定制的隱私需求來預測分享其所導致的隱私風險;所述步驟4)中的綜合性能指標,通過查詢質(zhì)量指標和隱私風險指標加權融合生成,并通過相應參數(shù)對兩者權重進行調(diào)節(jié);該綜合指標作為步驟5)中的用戶模型泛化方法優(yōu)化的最終指標。
      7.根據(jù)權利要求1中所述的一種實現(xiàn)定制隱私保護的個性化信息檢索系統(tǒng)的方法,其特征在于所述步驟4)中基于用戶模型開發(fā)的查詢質(zhì)量指標和隱私風險指標被開發(fā)為預測指標,即不需要采集用戶對于信息檢索結果排序的反饋信息,保證步驟5)中的用戶模型泛化方法能夠在客戶端本地執(zhí)行。
      8.根據(jù)權利要求1中所述的一種支持可定制隱私保護的個性化信息檢索系統(tǒng)的實現(xiàn)方法,其特征在于所述步驟4)中開發(fā)的用于預測量化特定檢索歧義程度的指標,負責在步驟5)的數(shù)據(jù)模型泛化方法執(zhí)行前,預測特定檢索是否需要通過個性化來提高檢索質(zhì)量; 如果檢索請求為非歧義請求,則直接執(zhí)行非個性化檢索,杜絕用戶信息分享。
      9.根據(jù)權利要求1中所述的一種實現(xiàn)定制隱私保護的個性化信息檢索系統(tǒng)的方法,其特征在于所述步驟5)中開發(fā)的用戶模型泛化方法為近似最優(yōu)泛化方法;由于泛化方法搜索空間龐大,將其設計為基于代價的迭代方法,依據(jù)步驟4)中開發(fā)的綜合性能指標,在每個迭代過程中,搜索能最大化綜合性能指標的泛化結果,直至迭代終止。
      10.根據(jù)權利要求1中所述的一種實現(xiàn)定制隱私保護的個性化信息檢索系統(tǒng)的方法, 其特征在于所述步驟5)中開發(fā)的用戶模型泛化方法,根據(jù)兩個不同的應用需要設計a)優(yōu)化步驟4)中開發(fā)的綜合性能指標;b)由用戶指定隱私風險指標上界,系統(tǒng)負責在用戶隱私風險上界下,最大化查詢質(zhì)量指標。
      全文摘要
      本發(fā)明公開了一種實現(xiàn)定制隱私保護的個性化信息檢索系統(tǒng)的方法。通過分析基于用戶模型的個性化信息檢索系統(tǒng)的系統(tǒng)架構,利用多粒度語義泛化模型,在現(xiàn)有的個性化信息檢索系統(tǒng)基礎上提供完備的隱私保護解決方案。本發(fā)明定義了用戶模型的表現(xiàn)形式、攻擊者背景知識和攻擊方式以及隱私保護目標,進而提出一個適用于支持隱私保護的個性化信息檢索系統(tǒng)的通用框架。本發(fā)明在個性化信息檢索系統(tǒng)中引入隱私保護的方法,充分利用不同用戶對于隱私保護的特殊需求,保證隱私保護結果與用戶隱私需求相匹配;而且通過開發(fā)查詢質(zhì)量指標和隱私風險指標,分析特定檢索特性,權衡檢索質(zhì)量和隱私保護。
      文檔編號G06F17/30GK102163230SQ20111009255
      公開日2011年8月24日 申請日期2011年4月13日 優(yōu)先權日2011年4月13日
      發(fā)明者壽黎但, 柏壑, 胡天磊, 陳剛, 陳珂 申請人:浙江大學
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1