專利名稱:用于推薦內(nèi)容的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于推薦內(nèi)容的方法和系統(tǒng),更具體地講,涉及一種用于使用用戶的配置文件分級(jí)內(nèi)容和向用戶推薦最高等級(jí)的內(nèi)容的方法和系統(tǒng)。
背景技術(shù):
隨著數(shù)字TV的出現(xiàn),對(duì)于用戶享受空前多樣化的多媒體內(nèi)容已經(jīng)成為可能。和大量的可獲得的信息一起,對(duì)于用戶及時(shí)地找到相關(guān)內(nèi)容所在的位置已經(jīng)成為日益增加的挑戰(zhàn)。因?yàn)榇_定由服務(wù)提供者提供的內(nèi)容的可用性對(duì)于端用戶的信息的需求是否相關(guān),所以已經(jīng)出現(xiàn)了大量的信息系統(tǒng)和應(yīng)用用于內(nèi)容用戶化(content customization)。作為那些出現(xiàn)的應(yīng)用之一,推薦技術(shù)(recommendation technology)以集中系統(tǒng),例如基于互聯(lián)網(wǎng)的個(gè)人電子節(jié)目指南(EPG)服務(wù),或者分布式環(huán)境,例如數(shù)字TV和機(jī)頂盒的形式被實(shí)施。
對(duì)內(nèi)容推薦技術(shù)已經(jīng)做出的大量的研究和努力,并且已經(jīng)提出了各種各樣的技術(shù)。大多數(shù)現(xiàn)有的系統(tǒng)依賴于包括用戶配置(user profiling)、內(nèi)容分級(jí)(content rating)活動(dòng)等的幾種方法。
為了基于可根據(jù)用戶的可改變的興趣和愛好隨著時(shí)間而逐漸改變的用戶偏愛數(shù)據(jù)創(chuàng)建配置文件的目的用戶配置被采用。傳統(tǒng)的用戶特征方法采用由內(nèi)容用戶提供的明確反饋或明確偏愛項(xiàng),或者暗示地觀察用戶對(duì)該內(nèi)容行為的特征。為了設(shè)置明確的偏愛項(xiàng),用戶需要輸入對(duì)應(yīng)于各種領(lǐng)域的詳細(xì)的用戶偏愛的項(xiàng)值,其是耗時(shí)的工作并且需要精心的努力,降低了系統(tǒng)效率。相反地,隱式偏愛項(xiàng)的提取消除用戶不得不直接限定偏愛項(xiàng)的麻煩。換句話說,用戶沒必要輸入關(guān)于感興趣的類型、最喜歡的電影男演員或女演員、他們的年齡等的信息。這種隱式配置允許連續(xù)監(jiān)控而不需用戶干預(yù),從而長時(shí)間連續(xù)提供關(guān)于用戶偏愛的信息。
然而,已知的系統(tǒng)提出由于它們分析用戶行為的一些有限的方面的問題。例如,經(jīng)??紤]到僅僅對(duì)播放特定的內(nèi)容的選擇或用戶調(diào)整的信道。改進(jìn)的系統(tǒng)僅僅使用用戶的行為的暫時(shí)特征,例如播放時(shí)間作為用于發(fā)現(xiàn)用戶的偏愛的材料。這里,播放時(shí)間可與實(shí)際觀看時(shí)間不同。當(dāng)觀察的行為以這種方式在范圍上受到限制時(shí),用戶配置文件(user profile)的質(zhì)量降低。因此,為了測(cè)量用戶偏愛,需要具有更復(fù)雜結(jié)構(gòu)的模型,即,各種參數(shù)。
同時(shí),執(zhí)行內(nèi)容分級(jí)處理以測(cè)量用戶對(duì)特定內(nèi)容滿意的可能性。不像用戶配置,這種方法向用戶提供常常被稱為自定義電子節(jié)目指南的高等級(jí)內(nèi)容的有限列表。不像在用戶配置文件模塊中的系統(tǒng),現(xiàn)有的系統(tǒng)通過關(guān)鍵字或基于關(guān)聯(lián)的關(guān)聯(lián)性測(cè)量來對(duì)內(nèi)容的優(yōu)先級(jí)分級(jí)。盡管基于關(guān)鍵字的方法對(duì)于文本過濾是有效的,但其被應(yīng)用于視聽內(nèi)容可能不夠有用,因?yàn)槠洳荒芨接袕V泛的和全文的描述。
基于關(guān)聯(lián)的方法基于預(yù)定義的內(nèi)容類型等級(jí)結(jié)構(gòu)(例如,戲劇、新聞、體育、音樂等)的存在。當(dāng)內(nèi)容的類型與用戶配置文件不匹配時(shí),這種方法被用于測(cè)量內(nèi)容適當(dāng)性的程度。在傳統(tǒng)的基于關(guān)聯(lián)的方法中,內(nèi)容之間的關(guān)聯(lián)性使用深度或路徑長度來測(cè)量。在前面的情況下,通過測(cè)量相對(duì)于在內(nèi)容類型等級(jí)結(jié)構(gòu)中共同的最高類型節(jié)點(diǎn)的每一深度來將兩種不同類型的內(nèi)容彼此比較。在后面的情況下,計(jì)數(shù)語義網(wǎng)絡(luò)中節(jié)點(diǎn)之間的鏈接數(shù)目?;谏疃鹊姆椒ê雎詫⒔?jīng)歷關(guān)聯(lián)性的測(cè)量的節(jié)點(diǎn)之間的實(shí)際距離,而基于路徑長度的方法不考慮節(jié)點(diǎn)的深度,即,它們的普遍性的程度。另外,因?yàn)榇嬖跓o限的可獲得的根據(jù)不同的規(guī)則構(gòu)成的內(nèi)容類型等級(jí)結(jié)構(gòu),所以需要能被容易地應(yīng)用到不同構(gòu)成等級(jí)結(jié)構(gòu)的用于更靈活地測(cè)量關(guān)聯(lián)性的方法。
發(fā)明內(nèi)容
本發(fā)明提供一種更精細(xì)的用于測(cè)量用戶的偏愛的模型,一種跨過很多種等級(jí)結(jié)構(gòu)更靈活地測(cè)量內(nèi)容之間的關(guān)聯(lián)性的模型,和一種用于使用該模型向用戶推薦內(nèi)容的方法和系統(tǒng)。
根據(jù)本發(fā)明的一方面,提供一種用于推薦內(nèi)容的方法,包括基于用戶對(duì)內(nèi)容的反應(yīng)根據(jù)預(yù)定的模型創(chuàng)建用戶配置文件;從一個(gè)或多個(gè)數(shù)據(jù)源獲得內(nèi)容特征;和基于該用戶配置文件和內(nèi)容特征根據(jù)預(yù)定的處理來創(chuàng)建推薦內(nèi)容的列表。
創(chuàng)建用戶配置文件可包括限定特定內(nèi)容的內(nèi)容領(lǐng)域和對(duì)每一內(nèi)容領(lǐng)域的觀察用戶行為;將不同的加權(quán)應(yīng)用到每一用戶的行為;和根據(jù)預(yù)定的方法對(duì)相關(guān)內(nèi)容計(jì)算內(nèi)容分級(jí)。這里,內(nèi)容分級(jí)R如下計(jì)算R=Σi=1nWiT]]>其中,W是每一行為的加權(quán),n是在特定內(nèi)容中觀察的行為的數(shù)目,和T是運(yùn)行內(nèi)容項(xiàng)的時(shí)間的長度。
在獲得內(nèi)容特征中,一個(gè)或多個(gè)數(shù)據(jù)源包含先進(jìn)電視系統(tǒng)委員會(huì)(ATSC)節(jié)目與系統(tǒng)信息協(xié)議(PSIP)元數(shù)據(jù)和TV隨時(shí)元數(shù)據(jù)中的至少一個(gè)。
創(chuàng)建推薦內(nèi)容列表可包括根據(jù)預(yù)定的計(jì)算方法使用從用戶配置文件和內(nèi)容元數(shù)據(jù)獲得的內(nèi)容分級(jí)對(duì)預(yù)定等級(jí)分類結(jié)構(gòu)中的每一實(shí)體計(jì)算內(nèi)容分級(jí),和創(chuàng)建包含具有超出預(yù)定值的分級(jí)的內(nèi)容的推薦列表。這里,計(jì)算方法用于基于從用戶配置文件和內(nèi)容元數(shù)據(jù)獲得的內(nèi)容分級(jí)獲得每一實(shí)體的 其中,N表示在給定的等級(jí)結(jié)構(gòu)中的水平的總數(shù),n表示在全部等級(jí)結(jié)構(gòu)中的父母種類的水平,和m表示從父母種類到孩子種類的深度,并且使用通過該計(jì)算獲得的關(guān)聯(lián)值獲得對(duì)每一實(shí)體的內(nèi)容分級(jí)。
根據(jù)本發(fā)明的另一方面,提供一種用于推薦內(nèi)容的系統(tǒng),包括用戶配置文件模塊,基于用戶對(duì)內(nèi)容的反應(yīng)根據(jù)預(yù)定的模型創(chuàng)建用戶配置文件;數(shù)字電視模塊,從一個(gè)或多個(gè)數(shù)據(jù)源獲得內(nèi)容元數(shù)據(jù);和內(nèi)容分級(jí)模塊,基于從用戶配置文件模塊和數(shù)字電視模塊接收的用戶配置文件和內(nèi)容元數(shù)據(jù)創(chuàng)建推薦內(nèi)容列表。
最好,用戶配置文件模塊包括定義內(nèi)容領(lǐng)域并對(duì)每一內(nèi)容領(lǐng)域觀察用戶的行為的一個(gè)或多個(gè)配置器;和用戶配置文件管理單元,將不同的加權(quán)應(yīng)用到由一個(gè)或多個(gè)配置器觀察的用戶的每個(gè)行為并根據(jù)預(yù)定的方法對(duì)相關(guān)的內(nèi)容計(jì)算內(nèi)容分級(jí)。
用戶配置文件管理單元最好通過下式計(jì)算內(nèi)容分級(jí)RR=Σi=1nWiT]]>其中,W是每一行為的加權(quán),n是在特定內(nèi)容中觀察的行為的數(shù)目,和T是在運(yùn)行內(nèi)容項(xiàng)的時(shí)間長度。
數(shù)字電視模塊可包括一個(gè)或多個(gè)包含用于處理先進(jìn)電視系統(tǒng)委員會(huì)(ATSC)PSIP元數(shù)據(jù)的節(jié)目與系統(tǒng)信息協(xié)議(PSIP)處理機(jī)和用于處理TV隨時(shí)元數(shù)據(jù)的TV隨時(shí)元數(shù)據(jù)處理機(jī)中的至少一個(gè)的數(shù)據(jù)源。
內(nèi)容分級(jí)模塊可包括關(guān)鍵字代理和分類器代理中的至少一個(gè),關(guān)鍵字代理,通過計(jì)算對(duì)每一用戶和內(nèi)容的用戶配置文件數(shù)據(jù)和內(nèi)容描述元數(shù)據(jù)之間的相關(guān)系數(shù)來執(zhí)行內(nèi)容分級(jí);和分類器代理,基于包括類型、語言、和信道的各個(gè)種類,來執(zhí)行內(nèi)容分級(jí)。最好,分類器代理使用下面的方程式基于從用戶配置文件和內(nèi)容元數(shù)據(jù)獲得的內(nèi)容分級(jí)來計(jì)算每一實(shí)體的關(guān)聯(lián)值 其中,N表示在給定等級(jí)結(jié)構(gòu)中的水平的總數(shù),n表示在全部等級(jí)結(jié)構(gòu)中的父母種類的水平,和m表示從父母種類到孩子種類的深度,其中,通過使用計(jì)算獲得的關(guān)聯(lián)值獲得對(duì)每一實(shí)體的內(nèi)容分級(jí)。
通過下面結(jié)合附圖對(duì)其示例性實(shí)施例進(jìn)行詳細(xì)的描述,本發(fā)明的上述和其他特征和優(yōu)點(diǎn)將會(huì)變得更加清楚,其中圖1是顯示根據(jù)本發(fā)明的實(shí)施例的內(nèi)容推薦系統(tǒng)的配置的方框圖圖2是表示根據(jù)本發(fā)明的實(shí)施例的推薦內(nèi)容的方法的流程圖;圖3是表示圖2中表示的用戶配置文件處理的流程圖;圖4是表示圖2中表示的提取內(nèi)容元數(shù)據(jù)的處理的流程圖;圖5是表示圖2中顯示的內(nèi)容分級(jí)處理的流程圖;和圖6表示TV隨時(shí)類型的等級(jí)分類作為內(nèi)容分類的例子。
具體實(shí)施例方式
現(xiàn)在,將詳細(xì)描述本發(fā)明的示例性實(shí)施例。
圖1是表示根據(jù)本發(fā)明的實(shí)施例的內(nèi)容推薦系統(tǒng)的配置的方框圖。參照?qǐng)D1,內(nèi)容推薦系統(tǒng)主要包括用戶配置文件模塊100和內(nèi)容分級(jí)模塊200。
為了更準(zhǔn)確地、靈活地創(chuàng)建用戶配置文件,用戶配置文件模塊100可包括多個(gè)配置器(profiler)。如圖1所示,用戶配置文件模塊100包括隱式配置器(implicit profiler)110、顯式配置器(explicit profiler)120、和固定配置器(stereotype profiler)130。首先,隱式配置器110分析用戶的觀看習(xí)慣以便本發(fā)明的系統(tǒng)能動(dòng)態(tài)地適應(yīng)用戶興趣的變化。顯式配置器120允許用戶通過數(shù)字電視(DTV)的用戶界面10明確地設(shè)置用戶偏愛項(xiàng)。固定配置器130提供為用戶的利益已經(jīng)輸入的多套固定的偏愛的項(xiàng)。選擇其中多套固定偏愛項(xiàng)的一套能免除用戶在包含偏愛列表的空白表格中輸入的麻煩。因此,用戶能通過選擇多套固定信息的一套來設(shè)置偏愛項(xiàng)值,在該固定信息中用于偏愛項(xiàng)的各個(gè)參數(shù)值已被預(yù)設(shè)而不是一次一個(gè)地手工輸入所有的偏愛項(xiàng)。用戶配置文件管理單元150將由各個(gè)配置器110、120、和130提供的大量的數(shù)據(jù)合并入用戶配置文件。為每一用戶創(chuàng)建的用戶配置文件數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫400中。
內(nèi)容分級(jí)模塊200通過內(nèi)容分級(jí)來為用戶創(chuàng)建推薦內(nèi)容列表,并包括多個(gè)代理210和220以及內(nèi)容分級(jí)管理單元250。在圖1的示例性實(shí)施例中,內(nèi)容分級(jí)模塊200包括兩個(gè)代理,即關(guān)鍵字代理210和分類器代理220。內(nèi)容分級(jí)管理單元250執(zhí)行兩個(gè)主要功能。
首先,內(nèi)容分級(jí)管理單元250提取并存儲(chǔ)對(duì)于推薦功能是足夠的合并的內(nèi)容描述數(shù)據(jù)的子集。在這種情況下,原始數(shù)據(jù)通過DTV模塊300提供。DTV模塊300包括節(jié)目與系統(tǒng)信息協(xié)議(PSIP)處理機(jī)310、和TV隨機(jī)元數(shù)據(jù)處理機(jī)320。當(dāng)PSIP處理機(jī)310通過DTV調(diào)諧器來接收適應(yīng)的先進(jìn)電視系統(tǒng)委員會(huì)(ATSC)陸地DTV節(jié)目,TV隨時(shí)元數(shù)據(jù)(TV-Anytime metadata)處理機(jī)320經(jīng)有線或無線互聯(lián)網(wǎng)來接收適應(yīng)ATSC的內(nèi)容。這里,DTV模塊300可包括兩個(gè)或更多的處理機(jī)。內(nèi)容分級(jí)管理單元250(通過提取內(nèi)容推薦信息)處理從DTV模塊300接收的原始內(nèi)容元數(shù)據(jù)并在數(shù)據(jù)庫400中存儲(chǔ)已處理的內(nèi)容元數(shù)據(jù)。
其次,內(nèi)容分級(jí)管理單元250基于用戶配置文件數(shù)據(jù)和內(nèi)容元數(shù)據(jù)來為用戶創(chuàng)建推薦列表。為此,內(nèi)容分級(jí)管理單元250提供一個(gè)或多個(gè)使用用戶配置文件數(shù)據(jù)和元數(shù)據(jù)執(zhí)行內(nèi)容分級(jí)的代理,并合并從一個(gè)或多個(gè)代理接收的內(nèi)容分級(jí)。為了合并內(nèi)容分級(jí),內(nèi)容分級(jí)管理單元250可計(jì)算由用戶配置文件數(shù)據(jù)計(jì)算的值和由內(nèi)容元數(shù)據(jù)計(jì)算的值的算術(shù)或幾何平均值。在前面的情況下,來自用戶配置文件數(shù)據(jù)和內(nèi)容元數(shù)據(jù)的值,幾乎被平等地處理(包含“或”的概念),而在后面的情況下,當(dāng)用戶配置文件數(shù)據(jù)和內(nèi)容元數(shù)據(jù)之間存在共同的東西時(shí),內(nèi)容被指定為高等級(jí)(包含“和”的概念)。
另一方面,內(nèi)容分級(jí)管理單元250可測(cè)量用戶配置文件數(shù)據(jù)和內(nèi)容元數(shù)據(jù)之間的相關(guān)性。在這種情況下,高等級(jí)可被指定為具有較高相關(guān)度的內(nèi)容。同時(shí),僅由用戶配置文件數(shù)據(jù)確定用于從內(nèi)容元數(shù)據(jù)獲得的內(nèi)容列表的推薦列表。然而,以上的方法應(yīng)被認(rèn)為僅描述性意義而非為了限制的目的。
在示例性的實(shí)施例中,用于內(nèi)容分級(jí)的代理是關(guān)鍵字代理210和分類器代理220。關(guān)鍵字代理210分析例如ATSC PSIP或TV-Anytime元數(shù)據(jù)字母松散的形成或組成的內(nèi)容描述。關(guān)鍵字代理210通過計(jì)算用于每一用戶和內(nèi)容的用戶配置文件數(shù)據(jù)和內(nèi)容描述元數(shù)據(jù)之間的相關(guān)系數(shù)來執(zhí)行內(nèi)容分級(jí)。分類器代理220基于包括類型、語言、和信道的各個(gè)種類來執(zhí)行內(nèi)容分級(jí)。最后,分類器代理220應(yīng)被設(shè)計(jì)以便處理等級(jí)分類。
本發(fā)明的內(nèi)容推薦系統(tǒng)最好被實(shí)現(xiàn)為當(dāng)事件發(fā)生時(shí)可操作,以減少計(jì)算負(fù)擔(dān)。更具體地講,每一用戶通過用戶界面10操作合適的配置器。每一配置器評(píng)估用戶的偏愛節(jié)目并允許用戶配置文件管理單元150當(dāng)重大的改變發(fā)生時(shí)操作。DTV模塊300或用戶配置文件管理單元150允許內(nèi)容分級(jí)管理單元250當(dāng)內(nèi)容描述數(shù)據(jù)被更新或用戶偏愛項(xiàng)改變時(shí)操作。內(nèi)容分級(jí)管理單元250命令一個(gè)或多個(gè)合適的代理以獲得內(nèi)容分級(jí)值并使用從該代理接收的內(nèi)容分級(jí)值以為每一用戶創(chuàng)建推薦列表。
圖2是表示根據(jù)本發(fā)明的實(shí)施例的推薦內(nèi)容的處理的流程圖。參照?qǐng)D2,在步驟S100和S200中處理同時(shí)執(zhí)行用戶配置和內(nèi)容元數(shù)據(jù)提取以提供用于內(nèi)容推薦的信息。在步驟S300中,基于在步驟S100中通過用戶配置構(gòu)造的用戶配置文件和步驟S200中通過內(nèi)容元數(shù)據(jù)提取處理獲得的內(nèi)容元數(shù)據(jù)由關(guān)鍵字代理或分類器代理執(zhí)行內(nèi)容分級(jí)。高分級(jí)內(nèi)容被推薦給用戶?,F(xiàn)在,分別參照?qǐng)D3、4、和5對(duì)步驟S100、S200、和S300中的用戶配置、內(nèi)容元數(shù)據(jù)提取、和內(nèi)容分級(jí)處理進(jìn)行詳細(xì)描述。
圖3是表示圖2中顯示的用戶配置文件處理的流程圖,其中,通過實(shí)例來描述隱式用戶配置文件處理。形成用戶配置文件的處理包括基于通過觀察用戶的行為(步驟S110)獲得的數(shù)據(jù)對(duì)由用戶實(shí)施的內(nèi)容執(zhí)行分級(jí)(步驟S120),和創(chuàng)建用戶配置文件(步驟S130)。
首先,在步驟S110中,觀察用戶的行為。跟蹤用戶的行為為提取隱式的偏愛節(jié)目提供基礎(chǔ)。表1表示結(jié)合DTV內(nèi)容的用戶的行為的二維模型的例子。
在步驟S120中,對(duì)觀察的用戶的行為執(zhí)行分級(jí)(內(nèi)容實(shí)施)。每一可觀察的行為最好與適當(dāng)?shù)臋?quán)重因數(shù)相乘。例如,用于播放操作的權(quán)重因數(shù)與播<表1>結(jié)合DTV內(nèi)容的可觀察的用戶的行為
放時(shí)間成比例。當(dāng)例如倒帶和重復(fù)播放的操作增加內(nèi)容分級(jí)時(shí),刪除或跳操作減小相同。隱式的內(nèi)容分級(jí)R定義為RΣi=1nWiT---(1)]]>其中,W是對(duì)每一行為的加權(quán),n是在特定內(nèi)容中觀察的行為的數(shù)目,和T是運(yùn)行內(nèi)容項(xiàng)的時(shí)間的長度。加權(quán)W的總和被時(shí)間T除,因?yàn)閷?duì)每個(gè)內(nèi)容比較每單位時(shí)間觀察的用戶的行為是合理的。
然后,用戶配置文件在步驟S130中創(chuàng)建。關(guān)聯(lián)特定用戶和內(nèi)容的隱式配置文件能通過上面的處理構(gòu)造,而顯式配置文件可由用戶手工輸入用于相關(guān)內(nèi)容的偏愛值或特定類屬(class category)例如類型的值來創(chuàng)建。固定配置文件可由用戶選擇多個(gè)預(yù)設(shè)的配置文件的一個(gè)來創(chuàng)建,免除用戶手工輸入顯式配置文件信息的麻煩。
圖4是表示圖2中的內(nèi)容元數(shù)據(jù)提取處理的流程圖。在步驟S210中,接收內(nèi)容元數(shù)據(jù)用于提取。內(nèi)容元數(shù)據(jù)可通過各種媒體來接收。例如,TV隨時(shí)內(nèi)容描述元數(shù)據(jù)可經(jīng)由IP網(wǎng)絡(luò),例如互聯(lián)網(wǎng)來獲得,或PSIP事件信息表格可通過DTV調(diào)諧器來接收。接收到的數(shù)據(jù)在步驟S220中經(jīng)歷分析并被處理為合適的格式。
圖5是表示圖2中的內(nèi)容分級(jí)處理的流程圖。首先,用戶配置文件和分析過的元數(shù)據(jù)在步驟S310中被接收,然后經(jīng)歷適當(dāng)?shù)姆旨?jí)處理,例如基于關(guān)鍵字的分級(jí)(步驟S320)和基于分類的分級(jí)(步驟S330)。在步驟S340中分別在步驟S320和S330中執(zhí)行的基于關(guān)鍵字的分級(jí)和基于分類的分級(jí)的結(jié)果被合并,以創(chuàng)建基于其為用戶創(chuàng)建推薦列表的合并的內(nèi)容分級(jí)。
基于關(guān)鍵字的分級(jí)最好基于類屬,例如類型或男演員/女演員來執(zhí)行。例如,當(dāng)存在頻繁的對(duì)于戲劇類型的關(guān)鍵字搜索時(shí),戲劇類型的分級(jí)增加。類似的,當(dāng)存在許多對(duì)于特定男演員或女演員的搜索時(shí),其中出現(xiàn)該男演員或女演員的電影或戲劇的分級(jí)相應(yīng)地增加。
對(duì)基于分類的分級(jí),用戶配置文件包含用于幾個(gè)類屬的偏愛項(xiàng)的值。分類可根據(jù)類型、信道、語言、或其他來進(jìn)行?;诜诸惖姆旨?jí)被用于基于種類的內(nèi)容推薦。圖6表示TV隨時(shí)類型的等級(jí)分類作為內(nèi)容分類的實(shí)例。在圖6中,記實(shí)(Non-Fiction)類型被分為體育和藝術(shù) & 媒體子類型。體育子類型被分為冬季體育和被進(jìn)一步分類為槌球、足球、和棒球的團(tuán)體體育。
為了創(chuàng)建推薦列表,使用深度或路徑長度測(cè)量每一種類實(shí)體之間的關(guān)聯(lián)性?;谏疃鹊年P(guān)聯(lián)性測(cè)量方法被用于基于距離等級(jí)結(jié)構(gòu)中共同的父母實(shí)體的深度比較兩個(gè)實(shí)體。
在圖6中,足球和棒球的父母實(shí)體是團(tuán)體體育且它們距離父母實(shí)體的深度是1,而棒球和溜冰的父母實(shí)體是體育且它們距離父母實(shí)體的深度是2。然后考慮與溜冰相比足球與棒球的關(guān)聯(lián)更近。換句話說,與溜冰相比,足球更可能被推薦給表示對(duì)棒球有很高偏愛的用戶。根據(jù)傳統(tǒng)的最為具體的共同抽象(Most Specific Common Abstraction)(MSCA)方法,棒球與槌球和足球的關(guān)聯(lián)是最近的。然而,確定喜歡棒球的用戶也對(duì)槌球有偏愛被認(rèn)為是不合理的。
使用路徑長度的關(guān)聯(lián)性的方法包括計(jì)數(shù)在語義網(wǎng)絡(luò)結(jié)構(gòu)中的實(shí)體之間的鏈接(距離)的數(shù)目。即,當(dāng)兩個(gè)實(shí)體在語義上相似時(shí),它們之間鏈接數(shù)目減少,而當(dāng)它們?cè)谡Z義上不同時(shí),鏈接數(shù)目增加。然而,基于深度和路徑的關(guān)聯(lián)性測(cè)量值根據(jù)分類的程度來敏感地改變。例如,這些方法可能具有的問題在于與位于分類不是較細(xì)的部分,例如藝術(shù)&媒體相比,位于分類較細(xì)的部分,例如體育中的實(shí)體被認(rèn)為與彼此的關(guān)聯(lián)較不密切。即,棒球和溜冰的深度是2,而美術(shù)和音樂的深度是1。為了克服這個(gè)問題,根據(jù)分類的程度來給定不同的深度或路徑長度。對(duì)于基于深度的關(guān)聯(lián)性測(cè)量,等級(jí)結(jié)構(gòu)中深度和分類的程度應(yīng)一起考慮。本發(fā)明提出其中區(qū)別的程度用于關(guān)聯(lián)性測(cè)量的關(guān)聯(lián)性測(cè)量模型。關(guān)聯(lián)性測(cè)量能根據(jù)以下的基本原理來執(zhí)行1、種類分類越具體,實(shí)體之間的關(guān)聯(lián)性越大。
2、兩個(gè)實(shí)體之間的水平上的差別越大,其間的關(guān)聯(lián)性越小。
3、未分級(jí)的內(nèi)容的關(guān)聯(lián)值和兄弟之間的關(guān)聯(lián)值是0。
在用于基于上面的基本原理計(jì)算關(guān)聯(lián)值的示例性方法中,關(guān)聯(lián)值定義如下 其中,N表示在給定等級(jí)結(jié)構(gòu)中的水平的總數(shù),n表示在全部等級(jí)結(jié)構(gòu)中的父母種類的水平,和m表示從父母種類到孩子種類的深度。
當(dāng)使用方程式(2)計(jì)算關(guān)聯(lián)性程度時(shí),更細(xì)分類的種類之間的關(guān)聯(lián)性程度是高的,而不太細(xì)分類的種類之間的關(guān)聯(lián)性程度是低的。例如,因?yàn)樽闱蚝烷城蚴切值芊N類,所以兄弟的關(guān)聯(lián)值是0。如果用戶對(duì)團(tuán)體體育定義偏愛值,則足球的關(guān)聯(lián)值約為0.7,因?yàn)閳F(tuán)體體育是具有水平3(n=3)的種類,到足球的深度為1(m=1),和全部結(jié)構(gòu)具有水平4(N=4)。通過將這些值代入方程式(2),能得到約為0.7的關(guān)聯(lián)值。如果在戶配置文件中對(duì)團(tuán)體體育的偏愛值R為5,則足球的偏愛值為3.5。類似地,體育和團(tuán)體體育的關(guān)聯(lián)值是0.47,而藝術(shù)&媒體和音樂的關(guān)聯(lián)值是0.6。盡管在所有的情況下深度m為1,但是關(guān)聯(lián)值是不同的。與在不太細(xì)分類的種類中的較高或較低水平的關(guān)聯(lián)值相比,在更細(xì)分類的種類中的較高或較低水平的關(guān)聯(lián)值更高。同時(shí),體育和棒球的關(guān)聯(lián)值是0.44,其比體育和團(tuán)體體育的關(guān)聯(lián)值低。這意味隨著深度的增加關(guān)聯(lián)值降低。
同樣,基于路徑長度的關(guān)聯(lián)性測(cè)量可以與基于深度的關(guān)聯(lián)性測(cè)量同樣的方式來執(zhí)行。換句話說,分類的程度越高,即,種類分類越具體,分隔在與彼此遠(yuǎn)離鏈接的實(shí)體的關(guān)聯(lián)值越大,反之亦然。
關(guān)聯(lián)值被用于在等級(jí)分類結(jié)構(gòu)中對(duì)每一實(shí)體計(jì)算內(nèi)容分級(jí)。搜集具有超出偏愛值的分級(jí)的內(nèi)容以創(chuàng)建推薦列表。
根據(jù)本發(fā)明,提供了用于分級(jí)用戶的偏愛項(xiàng)的復(fù)雜模型,因此,使用戶能夠得到與他/她所喜歡的相似的內(nèi)容的推薦。另外,與傳統(tǒng)的方法或系統(tǒng)相比,本發(fā)明提供更復(fù)雜的用于推薦的內(nèi)容分級(jí)。另外,根據(jù)本發(fā)明,來自內(nèi)容提供者的推薦基于用戶的行為從推薦中被單獨(dú)地分級(jí),因此使對(duì)用戶的推薦程度多樣化。
盡管本發(fā)明是參照其優(yōu)選實(shí)施例來來具體描述的,但本領(lǐng)域的普通技術(shù)人員應(yīng)該理解,在不脫離由所附權(quán)利要求限定的本發(fā)明的精神和范圍的情況下,可以對(duì)其進(jìn)行多種形式和細(xì)節(jié)的修改。盡管本發(fā)明的內(nèi)容推薦系統(tǒng)是用戶可以在其上觀看內(nèi)容的DTV,但本發(fā)明不受其限制。例如,內(nèi)容推薦系統(tǒng)可從DTV分別提供。因此,應(yīng)該理解以上描述的實(shí)施例僅僅以示例性為目的,不應(yīng)解釋為對(duì)本發(fā)明的限制。本發(fā)明的范圍通過所附權(quán)利要求而獲得,而不是通過前述的描述,并且所有落于權(quán)利要求范圍內(nèi)的變化和等同物規(guī)定包含其中。
權(quán)利要求
1.一種用于推薦內(nèi)容的方法,包括基于用戶對(duì)內(nèi)容的反應(yīng)根據(jù)預(yù)定的模型創(chuàng)建用戶配置文件;從一個(gè)或多個(gè)數(shù)據(jù)源獲得內(nèi)容特征;和基于用戶配置文件和內(nèi)容特征根據(jù)預(yù)定處理創(chuàng)建推薦的內(nèi)容的列表。
2.如權(quán)利要求1所述的方法,其中,創(chuàng)建用戶配置文件包括對(duì)特定內(nèi)容限定內(nèi)容領(lǐng)域并對(duì)每一內(nèi)容領(lǐng)域觀察用戶的行為;將不同的加權(quán)應(yīng)用到每一用戶行為;和根據(jù)預(yù)定的方法對(duì)相關(guān)內(nèi)容計(jì)算內(nèi)容分級(jí)。
3.如權(quán)利要求2所述的方法,其中,內(nèi)容分級(jí)R是R=Σi=1nWiT]]>其中,W是對(duì)每一行為的加權(quán),n是在特定內(nèi)容中觀察的行為的數(shù)目,和T是在運(yùn)行內(nèi)容項(xiàng)的時(shí)間的長度。
4.如權(quán)利要求1所述的方法,其中,在獲得內(nèi)容特征中,一個(gè)或多個(gè)數(shù)據(jù)源包含先進(jìn)電視系統(tǒng)委員會(huì)(ATSC)節(jié)目與系統(tǒng)信息協(xié)議(PSIP)元數(shù)據(jù)和TV隨時(shí)元數(shù)據(jù)中的至少一個(gè)。
5.如權(quán)利要求1所述的方法,其中,創(chuàng)建推薦內(nèi)容列表包括根據(jù)預(yù)定的計(jì)算方法使用從用戶配置文件和內(nèi)容特征獲得的內(nèi)容分級(jí)對(duì)預(yù)定的等級(jí)分類結(jié)構(gòu)中的每一實(shí)體計(jì)算內(nèi)容分級(jí),和創(chuàng)建包含具有超出預(yù)定值的分級(jí)的內(nèi)容的推薦內(nèi)容的列表。
6.如權(quán)利要求5所述的方法,其中,預(yù)定計(jì)算方法被用于基于從用戶配置文件和內(nèi)容特定獲得的內(nèi)容分級(jí)獲得每一實(shí)體的關(guān)聯(lián)值=nmN+N]]>其中,N表示在給定等級(jí)結(jié)構(gòu)中的水平的總數(shù),n表示在全部等級(jí)結(jié)構(gòu)中的父母種類的水平,和m表示從父母種類到孩子種類的深度,并且使用獲得的關(guān)聯(lián)值獲得對(duì)每一實(shí)體的內(nèi)容分級(jí)。
7.一種用于推薦內(nèi)容的系統(tǒng),包括用戶配置文件模塊,基于用戶的對(duì)內(nèi)容的反應(yīng)根據(jù)預(yù)定的模型創(chuàng)建用戶配置文件;數(shù)字電視模塊,從一個(gè)或多個(gè)數(shù)據(jù)源獲得內(nèi)容元數(shù)據(jù);和內(nèi)容分級(jí)模塊,基于從用戶配置文件模塊和數(shù)字電視模塊接收的用戶配置文件和內(nèi)容元數(shù)據(jù)創(chuàng)建推薦內(nèi)容列表。
8.如權(quán)利要求7所述的系統(tǒng),其中,用戶配置文件模塊包括至少一個(gè)配置器,限定內(nèi)容領(lǐng)域并對(duì)每一內(nèi)容領(lǐng)域觀察用戶行為;和用戶配置文件管理單元,將不同的加權(quán)應(yīng)用到由至少一個(gè)配置器觀察的用戶的每個(gè)行為并根據(jù)預(yù)定的方法對(duì)相關(guān)的內(nèi)容計(jì)算內(nèi)容分級(jí)。
9.如權(quán)利要求8所述的系統(tǒng),其中,用戶配置文件管理單元通過下式計(jì)算內(nèi)容分級(jí)RR=Σi=1nWiT]]>其中,W是對(duì)每一行為的加權(quán),n是在特定內(nèi)容中觀察的行為的數(shù)目,和T是運(yùn)行內(nèi)容節(jié)目的時(shí)間長度。
10.如權(quán)利要求7所述的系統(tǒng),其中,數(shù)字電視模塊包括至少一個(gè)包含用于處理先進(jìn)電視系統(tǒng)委員會(huì)(ATSC)PSIP元數(shù)據(jù)的節(jié)目與系統(tǒng)信息協(xié)議(PSIP)處理機(jī)和用于處理TV隨時(shí)元數(shù)據(jù)的TV隨時(shí)元數(shù)據(jù)處理機(jī)的至少一個(gè)的數(shù)據(jù)源。
11.如權(quán)利要求7所述的系統(tǒng),其中,內(nèi)容分級(jí)模塊包括關(guān)鍵字代理和分類器代理的至少一個(gè),關(guān)鍵字代理通過計(jì)算對(duì)每一用戶和內(nèi)容的用戶配置文件數(shù)據(jù)和內(nèi)容元數(shù)據(jù)之間的相關(guān)系數(shù)來執(zhí)行內(nèi)容分級(jí),分類器代理基于包括類型、語言、和信道的各個(gè)種類來執(zhí)行內(nèi)容分級(jí)。
12.如權(quán)利要求11所述的系統(tǒng),其中,分類器代理基于從用戶配置文件和內(nèi)容元數(shù)據(jù)獲得的內(nèi)容分級(jí)來計(jì)算每一實(shí)體的關(guān)聯(lián)值,由此 其中,N表示在給定等級(jí)結(jié)構(gòu)中的水平的總數(shù),n表示在全部等級(jí)結(jié)構(gòu)中的父母種類的水平,和m表示從父母種類到孩子種類的深度,并且使用獲得的關(guān)聯(lián)值獲得對(duì)每一實(shí)體的內(nèi)容分級(jí)。
全文摘要
提供了用于推薦內(nèi)容的一種方法和系統(tǒng)。該方法和系統(tǒng)使用戶能夠得到與他/她所喜歡的相似的內(nèi)容的推薦。用于推薦內(nèi)容的方法包括基于用戶對(duì)內(nèi)容的反應(yīng)根據(jù)預(yù)定的模型創(chuàng)建用戶配置文件;從一個(gè)或多個(gè)數(shù)據(jù)源獲得內(nèi)容特征;和基于用戶配置文件和內(nèi)容特征根據(jù)預(yù)定處理創(chuàng)建推薦內(nèi)容的列表。用于推薦內(nèi)容的系統(tǒng)包括用戶配置文件模塊,基于用戶對(duì)內(nèi)容的反應(yīng)根據(jù)預(yù)定的模型創(chuàng)建用戶配置文件;數(shù)字電視模塊,從一個(gè)或多個(gè)數(shù)據(jù)源獲得內(nèi)容元數(shù)據(jù);和內(nèi)容分級(jí)模塊,基于從用戶配置文件模塊和數(shù)字電視模塊接收的用戶配置文件和內(nèi)容元數(shù)據(jù)創(chuàng)建推薦內(nèi)容列表。用戶可獲得與他/她所喜歡的相似的內(nèi)容的推薦。
文檔編號(hào)H04N7/173GK1592404SQ200410056999
公開日2005年3月9日 申請(qǐng)日期2004年8月26日 優(yōu)先權(quán)日2003年8月28日
發(fā)明者申孝燮 申請(qǐng)人:三星電子株式會(huì)社