自動(dòng)推薦內(nèi)容的制作方法
【專(zhuān)利摘要】提供通過(guò)預(yù)測(cè)推薦每個(gè)視頻將滿足一定目標(biāo)的程度來(lái)選擇哪些視頻被推薦給用戶的技術(shù)。為了預(yù)測(cè),訓(xùn)練機(jī)器學(xué)習(xí)引擎既被提供協(xié)作過(guò)濾參數(shù)值,又被提供基于內(nèi)容的過(guò)濾參數(shù)值。在視頻到視頻推薦的情況下,協(xié)作過(guò)濾參數(shù)值可以基于視頻對(duì),該視頻對(duì)包括用戶已經(jīng)對(duì)其表現(xiàn)出興趣的視頻。機(jī)器學(xué)習(xí)引擎產(chǎn)生對(duì)每個(gè)視頻的機(jī)器-學(xué)習(xí)分?jǐn)?shù)。機(jī)器學(xué)習(xí)分?jǐn)?shù)被用作選擇哪些視頻推薦給特定用戶的基礎(chǔ)。
【專(zhuān)利說(shuō)明】自動(dòng)推薦內(nèi)容
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及自動(dòng)推薦,更具體地,涉及一種用來(lái)向用戶自動(dòng)推薦內(nèi)容的系統(tǒng)。
【背景技術(shù)】
[0002]已經(jīng)日益常見(jiàn)的是,將諸如視頻資產(chǎn)之類(lèi)的內(nèi)容在網(wǎng)絡(luò)上傳送給用戶。電影、電視劇、家庭視頻、做法視頻、及音樂(lè)視頻僅僅是視頻資產(chǎn)的類(lèi)型的少量例子,這些視頻資產(chǎn)當(dāng)前在互聯(lián)網(wǎng)、電話網(wǎng)絡(luò)、內(nèi)部網(wǎng)絡(luò)、有線連接等上提供。在網(wǎng)絡(luò)上已經(jīng)得到的視頻資產(chǎn)可在整個(gè)視頻資產(chǎn)已經(jīng)下載之后或者隨著視頻資產(chǎn)正在傳送(傳輸)而播放。
[0003]鑒于適于消費(fèi)的視頻資產(chǎn)過(guò)多,已經(jīng)日益重要的是幫助用戶識(shí)別最可能使他們感興趣的那些視頻資產(chǎn)。例如,關(guān)于向用戶推薦用戶高度感興趣的十部視頻的系統(tǒng),比關(guān)于僅僅提供在百萬(wàn)較小興趣視頻中搜索這相同十部視頻的工具的系統(tǒng),用戶將具有好得多的體驗(yàn)。
[0004]各種手段已經(jīng)用來(lái)向用戶推薦視頻資產(chǎn),這些手段各自具有一定缺陷。例如,一種“趨勢(shì)”手段是保持跟蹤哪些視頻資產(chǎn)由整體的用戶人口最多地消費(fèi),并且將那些消費(fèi)最多的視頻資產(chǎn)推薦給所有用戶。另一種趨勢(shì)手段是保持跟蹤那些視頻在整個(gè)用戶人口中當(dāng)前正經(jīng)歷一波興趣,并且將這些視頻推薦給所有用戶。這些“一只鞋子適合所有人”的趨勢(shì)手段,對(duì)于具有與平均用戶相對(duì)應(yīng)的興趣的用戶還可以,但不是對(duì)于所有用戶都適用。
[0005]“視頻到視頻(video-to-video) ”手段是向每個(gè)用戶推薦與該用戶剛剛消費(fèi)的視頻資產(chǎn)共同具有某些內(nèi)容的視頻資產(chǎn)。例如,在用戶已經(jīng)消費(fèi)電影X之后,可以向用戶呈現(xiàn):與電影X呈相同種類(lèi)的、具有與電影X相同的主要演員的、具有與電影X相同的導(dǎo)演的、來(lái)自與電影X相同的時(shí)期的等等的電影的推薦。“視頻到視頻”手段當(dāng)用戶具有狹窄范圍的興趣時(shí)還可以,但當(dāng)用戶對(duì)于特定類(lèi)型的視頻已經(jīng)變得滿足并且用戶現(xiàn)在想消費(fèi)不同的視頻時(shí),不太適用。
[0006]用來(lái)推薦視頻資產(chǎn)的“用戶到視頻(user-to-video) ”手段涉及相對(duì)于時(shí)間監(jiān)視用戶的資產(chǎn)消費(fèi)行為?;谟脩舻囊曨l消費(fèi)歷史,可以得出用戶的一般興趣。這些得出興趣然后可以用來(lái)識(shí)別用戶可能感興趣的其它視頻,這些其它視頻可以作為推薦而供給。用戶到視頻手段可以適用,只要用戶的消費(fèi)歷史準(zhǔn)確地反映用戶的當(dāng)前興趣。然而,如果用戶不具有充足的歷史,或者用戶當(dāng)前感興趣的是與用戶過(guò)去消費(fèi)的視頻不同的某些視頻,則基于用戶到視頻的推薦就不是特別有用。
[0007]本文中描述的手段是可實(shí)現(xiàn)的手段,但不一定是以前已經(jīng)想到或?qū)崿F(xiàn)的手段。因此,除非另外指示,否則不應(yīng)該假定:本文中描述的手段的任一種僅僅因?yàn)樗鼈冊(cè)诒静糠种斜幻枋龆醋鳜F(xiàn)有技術(shù)。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0008]在附圖中:
[0009]圖1是根據(jù)本發(fā)明實(shí)施例的方塊圖,該方塊圖表明機(jī)器學(xué)習(xí)引擎如何可以用來(lái)預(yù)測(cè)對(duì)于視頻的興趣分?jǐn)?shù);
[0010]圖2是根據(jù)本發(fā)明實(shí)施例的方塊圖,該方塊圖表明各種類(lèi)型的元數(shù)據(jù),這些元數(shù)據(jù)可以由推薦系統(tǒng)保持;
[0011]圖3是根據(jù)本發(fā)明實(shí)施例的方塊圖,該方塊圖表明對(duì)于模型調(diào)諧參數(shù)的不同值,多個(gè)分?jǐn)?shù)如何可以供給到機(jī)器學(xué)習(xí)引擎中;
[0012]圖4是根據(jù)本發(fā)明實(shí)施例的方塊圖,該方塊圖表明產(chǎn)生多個(gè)不同分?jǐn)?shù)分量、和基于目的而組合分量分?jǐn)?shù);及
[0013]圖5是根據(jù)本發(fā)明實(shí)施例的計(jì)算機(jī)系統(tǒng)的方塊圖,該計(jì)算機(jī)系統(tǒng)可以用來(lái)實(shí)施視頻推薦系統(tǒng)。
【具體實(shí)施方式】
[0014]如下描述中,為了解釋的目的,敘述多個(gè)具體細(xì)節(jié),以便提供本發(fā)明的徹底理解。然而,顯然,可以實(shí)踐本發(fā)明而不用這些具體細(xì)節(jié)。其它情況下,熟知結(jié)構(gòu)和裝置以方塊圖形式表示,以便避免不必要地使本發(fā)明模糊。
[0015]一般概要
[0016]提供向用戶推薦視頻資產(chǎn)的技術(shù),其中對(duì)于每個(gè)候選視頻預(yù)測(cè)向用戶推薦該候選視頻可能滿足目的的程度。在所述目的是用戶約定的情況下,預(yù)測(cè)可以指示用戶可能對(duì)該候選視頻感興趣的程度。根據(jù)本發(fā)明的一個(gè)方面,訓(xùn)練機(jī)器學(xué)習(xí)引擎既供給有協(xié)作過(guò)濾(collaborative filtering, CF)參數(shù)值,又供給有基于內(nèi)容的過(guò)濾(content-basedfiltering, CBF)參數(shù)值?;谳斎?yún)?shù)值,機(jī)器學(xué)習(xí)引擎產(chǎn)生機(jī)器-學(xué)習(xí)分?jǐn)?shù)(“ML分?jǐn)?shù)”),該機(jī)器-學(xué)習(xí)分?jǐn)?shù)反映向用戶推薦特定視頻將滿足特定目的的程度。在所述目的是滿足用戶的觀看興趣的情況下,ML分?jǐn)?shù)是特定用戶可能對(duì)觀看視頻多么感興趣的預(yù)測(cè)。
[0017]為了解釋說(shuō)明,對(duì)其產(chǎn)生ML分?jǐn)?shù)的用戶這里稱作“目標(biāo)用戶”,并且對(duì)其產(chǎn)生ML分?jǐn)?shù)的視頻這里稱作“目標(biāo)視頻”。在一個(gè)實(shí)施例中,對(duì)于在一組候選視頻中的每個(gè)視頻產(chǎn)生的ML分?jǐn)?shù),作為從候選視頻中選擇哪些視頻推薦給目標(biāo)用戶的基礎(chǔ)。
[0018]當(dāng)產(chǎn)生ML分?jǐn)?shù)時(shí),每個(gè)輸入?yún)?shù)影響ML分?jǐn)?shù)的程度可能變化。例如,最近添加到收集庫(kù)中的視頻可能不具有顯著量的消費(fèi)歷史。因此,與消費(fèi)歷史有關(guān)的參數(shù)對(duì)于ML分?jǐn)?shù)具有比視頻本身的特征(例如,長(zhǎng)度、題材、標(biāo)簽)更小的影響。另一方面,對(duì)于具有長(zhǎng)消費(fèi)歷史的視頻,與消費(fèi)歷史有關(guān)的參數(shù)對(duì)于ML分?jǐn)?shù)可能具有較顯著的影響。一個(gè)實(shí)施例中,機(jī)器學(xué)習(xí)引擎產(chǎn)生ML分?jǐn)?shù)以及哪些特征對(duì)ML分?jǐn)?shù)具有最大肯定影響的指示?;谶@種信息,關(guān)于每種視頻推薦,可以向用戶提供為什么正將該特定視頻推薦給他們的解釋。
[0019]視頻到視頻推薦
[0020]視頻到視頻推薦是指基于用戶對(duì)特定視頻的興趣的指示的視頻推薦。例如,如果用戶已經(jīng)觀看、瀏覽、或高度評(píng)價(jià)特定視頻,則可以假定:用戶對(duì)該特定視頻有興趣?;谠撆d趣,推薦系統(tǒng)可以向用戶推薦其它視頻。為了說(shuō)明,用戶已經(jīng)指示對(duì)其感興趣的視頻這里稱作“比較”視頻。
[0021]使用機(jī)器學(xué)習(xí)將協(xié)作過(guò)濾與基于內(nèi)容的過(guò)濾相結(jié)合
[0022]參照?qǐng)D1,它表明使用訓(xùn)練機(jī)器學(xué)習(xí)引擎102來(lái)產(chǎn)生候選視頻資產(chǎn)的ML分?jǐn)?shù)150的系統(tǒng)。機(jī)器學(xué)習(xí)引擎102基于輸入饋送106產(chǎn)生ML分?jǐn)?shù)150,該輸入饋送106特定于用戶/視頻組合。輸入饋送106包括幾種類(lèi)型的輸入?yún)?shù)。在表明的實(shí)施例中,輸入饋送106包括協(xié)作過(guò)濾(CF)輸入108、基于內(nèi)容的過(guò)濾(CBF)輸入110、以及其它輸入112。這些輸入的每一種將在以后更詳細(xì)地描述。
[0023]協(xié)作過(guò)濾(CF)輸入
[0024]協(xié)作過(guò)濾輸入108是與用戶觀點(diǎn)或行為有關(guān)的任何輸入。協(xié)作過(guò)濾基于如下假定:關(guān)于一種東西具有類(lèi)似觀點(diǎn)的兩個(gè)人關(guān)于另一種東西可能具有類(lèi)似觀點(diǎn)。在預(yù)測(cè)用戶對(duì)視頻資產(chǎn)的興趣的情形中,協(xié)作過(guò)濾假定:如果目標(biāo)用戶已經(jīng)與另一個(gè)用戶喜歡觀看相同視頻的幾個(gè),那么目標(biāo)用戶可能喜歡觀看其它用戶喜歡了的、但目標(biāo)用戶還未看過(guò)的視頻。
[0025]關(guān)于用戶的觀點(diǎn)的信息可以按各種方式得到或得出。例如,用戶感興趣的視頻類(lèi)型隱含地反映在用戶的視頻觀看歷史中。因而,協(xié)作過(guò)濾輸入108可以包括關(guān)于目標(biāo)用戶的視頻觀看歷史、與目標(biāo)用戶類(lèi)似的用戶的觀看歷史、及/或整個(gè)觀眾人群的觀看歷史的數(shù)據(jù)。
[0026]假定具有類(lèi)似人口統(tǒng)計(jì)特性的用戶將具有類(lèi)似視頻觀看興趣,協(xié)作過(guò)濾輸入108也可以包括人口統(tǒng)計(jì)信息。這樣的人口統(tǒng)計(jì)信息可以包括例如用戶的年齡、性別、地理位置、收入階層等等。協(xié)作過(guò)濾輸入108也可以包括用戶通過(guò)例如填寫(xiě)視頻愛(ài)好調(diào)查或評(píng)價(jià)以前觀看視頻而已經(jīng)清晰識(shí)別的興趣。
[0027]在視頻到視頻推薦的情形中,CF輸入108可以明確地指示用戶行為,因?yàn)樗c比較視頻/目標(biāo)視頻對(duì)(“視頻對(duì)”)有關(guān)。下文詳細(xì)地描述對(duì)于視頻對(duì)可以保持的各種類(lèi)型的CF度量的例子。
[0028]在圖1中表明的實(shí)施例中,機(jī)器學(xué)習(xí)引擎102既被提供原始CF特征120,又被提供由CF分析器118基于原始CF特征產(chǎn)生的CF分?jǐn)?shù)124。CF分?jǐn)?shù)是由CF分析器118對(duì)將目標(biāo)視頻提供給用戶將滿足目的的程度的預(yù)測(cè),該CF分析器118實(shí)施協(xié)作過(guò)濾算法。為了說(shuō)明清楚,將假定:所述目的是滿足目標(biāo)觀眾的觀看興趣。然而,如下文將更詳細(xì)描述的那樣,所述目標(biāo)目的可以是除滿足觀眾的興趣之外的某些東西,或者可以是滿足觀眾的興趣和一個(gè)或多個(gè)其它目的的組合。
[0029]如圖1顯而易見(jiàn)的,代之以簡(jiǎn)單地將CF分?jǐn)?shù)124用作目標(biāo)用戶對(duì)目標(biāo)視頻的興趣的預(yù)測(cè),CF分?jǐn)?shù)124僅是饋送到機(jī)器學(xué)習(xí)引擎102中以產(chǎn)生ML分?jǐn)?shù)150的幾個(gè)輸入之一。終究,機(jī)器學(xué)習(xí)引擎102確定CF分?jǐn)?shù)124在產(chǎn)生ML分?jǐn)?shù)150時(shí)應(yīng)該加權(quán)多重,該ML分?jǐn)?shù)150被用作選擇要推薦那些視頻的基礎(chǔ)。
[0030]基于內(nèi)容的過(guò)濾(CBF)輸入
[0031]基于內(nèi)容的過(guò)濾輸入110是與目標(biāo)視頻的內(nèi)容與其它視頻的內(nèi)容多么類(lèi)似有關(guān)的任何輸入。為了說(shuō)明清楚,將描述產(chǎn)生視頻到視頻推薦的實(shí)施例。因而,基于內(nèi)容的過(guò)濾輸入聚焦在視頻對(duì)之間的相似性,該視頻對(duì)包括目標(biāo)視頻和比較視頻。然而,在可選擇實(shí)施例中,基于內(nèi)容的過(guò)濾輸入110可以包括用于任何數(shù)量的其它視頻(如目標(biāo)用戶最近觀看、瀏覽、或評(píng)價(jià)的視頻組)的特征信息。
[0032]如以上提到的那樣,比較視頻典型地是目標(biāo)用戶已經(jīng)指示對(duì)其的興趣的視頻。例如,比較視頻可以是目標(biāo)用戶最近觀看的、或?qū)ζ淠繕?biāo)用戶最近給出高度評(píng)價(jià)的視頻。
[0033]類(lèi)似于協(xié)作過(guò)濾輸入108,基于內(nèi)容的過(guò)濾輸入110也包括從原始輸入得出的分?jǐn)?shù)。具體地,基于內(nèi)容的過(guò)濾輸入I1包括原始CBF特征126、和CBF分?jǐn)?shù)130,該CBF分?jǐn)?shù)130由CBF分析器128基于原始CBF特征126而產(chǎn)生。原始CBF特征126可以包括與目標(biāo)視頻和比較視頻有關(guān)的任何數(shù)量的特征。例如,原始CBF特征126可以包括諸如標(biāo)題、題材、持續(xù)時(shí)間、演員、關(guān)鍵字、標(biāo)簽等等之類(lèi)的特征。
[0034]CBF分?jǐn)?shù)130是目標(biāo)視頻與比較視頻多么相似的估計(jì)。推定地,CBF分?jǐn)?shù)130越高,在目標(biāo)視頻與比較視頻之間的相似性越大。盡管一些系統(tǒng)使用CBF分?jǐn)?shù)作為用來(lái)選擇待推薦的視頻的唯一基礎(chǔ),但在圖1中表明的實(shí)施例中,CBF分?jǐn)?shù)130僅僅是饋送到機(jī)器學(xué)習(xí)引擎102的多個(gè)輸入?yún)?shù)之一。在得出ML分?jǐn)?shù)150時(shí),給予CBF分?jǐn)?shù)130的實(shí)際權(quán)重將基于到機(jī)器學(xué)習(xí)引擎102的其它輸入和訓(xùn)練組(借助于該訓(xùn)練組,訓(xùn)練機(jī)器學(xué)習(xí)引擎102)而變化。
[0035]到機(jī)器學(xué)習(xí)引擎的其它輸入
[0036]其它輸入112的類(lèi)型和性質(zhì)實(shí)際上沒(méi)有限制,這些其它輸入112可以饋送到機(jī)器學(xué)習(xí)引擎102,以提高M(jìn)L分?jǐn)?shù)150的準(zhǔn)確度。例如,其它輸入可以包括每天要給予推薦的時(shí)間、每周要給予推薦的周幾、目標(biāo)用戶的連接速度等。
[0037]機(jī)器學(xué)習(xí)(ML)分?jǐn)?shù)
[0038]基于協(xié)作過(guò)濾輸入108、基于內(nèi)容的過(guò)濾輸入110及任何數(shù)量的其它輸入112,機(jī)器學(xué)習(xí)引擎102產(chǎn)生ML分?jǐn)?shù)150。ML分?jǐn)?shù)150的值是將目標(biāo)視頻提供給用戶將多好地滿足特定目的或目的組的預(yù)測(cè)。在所述目的是用戶約定的實(shí)施例中,ML分?jǐn)?shù)150是目標(biāo)用戶將對(duì)觀看目標(biāo)視頻具有多大興趣的預(yù)測(cè)。
[0039]對(duì)于在一組候選視頻中的每個(gè)視頻,重復(fù)產(chǎn)生ML分?jǐn)?shù)的過(guò)程。基于它們的相應(yīng)ML分?jǐn)?shù),將目標(biāo)用戶可能對(duì)其具有最大興趣的候選視頻選擇成呈現(xiàn)給目標(biāo)用戶作為推薦視頻。
[0040]按圖1表明的方式將協(xié)作過(guò)濾(CF)與基于內(nèi)容的過(guò)濾(CBF)相組合,可享有每種技術(shù)的優(yōu)勢(shì)。具體地說(shuō),將由CF/CBF分析器產(chǎn)生的判斷、與來(lái)自CF/CBF的原始特征一起直接暴露于機(jī)器學(xué)習(xí)引擎102。使機(jī)器學(xué)習(xí)引擎102接觸到原始特征可以提供幾個(gè)好處。
[0041]首先,將原始特征與CF/CBF分?jǐn)?shù)一起提供給ML系統(tǒng),允許ML系統(tǒng)分別基于來(lái)自CF和CBF的信號(hào)強(qiáng)度而組合分?jǐn)?shù)。就是說(shuō),給予CF/CBF分?jǐn)?shù)的相對(duì)權(quán)重將基于饋送到ML系統(tǒng)的其它輸入逐個(gè)迭代而變化。例如,對(duì)于不具有足夠行為數(shù)據(jù)的新電影,CF的信號(hào)強(qiáng)度很弱。因此,ML系統(tǒng)當(dāng)產(chǎn)生ML分?jǐn)?shù)時(shí)將把較小權(quán)重給予CF分?jǐn)?shù)。因此,在ML分?jǐn)?shù)中強(qiáng)調(diào)基于內(nèi)容的特征。隨著視頻由更多人觀看,行為數(shù)據(jù)將增加,當(dāng)產(chǎn)生ML分?jǐn)?shù)時(shí),由ML系統(tǒng)給予CF分?jǐn)?shù)的權(quán)重也將增加。
[0042]第二,暴露原始CBF特征允許ML系統(tǒng)基于歷史CF和CBF學(xué)習(xí)全體而有效地解決新內(nèi)容問(wèn)題。例如,ML系統(tǒng)可學(xué)習(xí)到,共享諸如‘a(chǎn)’、‘the’之類(lèi)的關(guān)鍵字的視頻不一定相關(guān),而共孚諸如‘football’、‘49ers’之類(lèi)的關(guān)鍵字的其它視頻可能指不較強(qiáng)關(guān)系。因此,當(dāng)產(chǎn)生ML分?jǐn)?shù)時(shí),弱的非特定字所導(dǎo)致的很高的CBF分?jǐn)?shù)被機(jī)器學(xué)習(xí)引擎102給予較小權(quán)重;當(dāng)產(chǎn)生ML分?jǐn)?shù)時(shí),高度特定字所導(dǎo)致而很高的CBF分?jǐn)?shù)被ML系統(tǒng)給予較大權(quán)重。
[0043]可解釋的推薦
[0044]根據(jù)一個(gè)實(shí)施例,除向目標(biāo)用戶呈現(xiàn)一組一個(gè)或多個(gè)推薦視頻之外,推薦系統(tǒng)也向該用戶呈現(xiàn)關(guān)于為什么視頻的每個(gè)正被推薦的信息。具體地,在一個(gè)實(shí)施例中,機(jī)器學(xué)習(xí)引擎102提供輸出152,該輸出152指示最肯定地影響每個(gè)ML分?jǐn)?shù)150的特征。例如,輸出152可以指示,目標(biāo)視頻因?yàn)镃F分?jǐn)?shù)124很高,并且基于其它輸入,CF分?jǐn)?shù)124在ML分?jǐn)?shù)150的產(chǎn)生中被重重地加權(quán),而接收了高M(jìn)L分?jǐn)?shù)150。另一方面,用于目標(biāo)視頻的輸出152可以指示,CBF分?jǐn)?shù)很高,并且基于其它輸入,CBF分?jǐn)?shù)在ML分?jǐn)?shù)150的產(chǎn)生中被重重地加權(quán)。這些僅是對(duì)于視頻的ML分?jǐn)?shù)可具有強(qiáng)烈肯定影響的特征類(lèi)型的兩個(gè)例子。
[0045]基于由輸出152指示的、最肯定地影響ML分?jǐn)?shù)150的特征,推薦系統(tǒng)可以選擇對(duì)于為什么將對(duì)應(yīng)視頻推薦給了目標(biāo)用戶(即,為什么ML分?jǐn)?shù)150高得足以證明推薦目標(biāo)視頻是正確的)的“解釋”。例如:
[0046].如果CBF分?jǐn)?shù)130很高,并且由機(jī)器學(xué)習(xí)引擎102重重地加權(quán),那么可以向用戶呈現(xiàn)解釋“這個(gè)視頻類(lèi)似于X”(其中,X是比較視頻)。
[0047]?如果CF分?jǐn)?shù)124很高,并且由機(jī)器學(xué)習(xí)引擎102重重地加權(quán),那么可以向用戶呈現(xiàn)解釋“X的觀眾常常觀看這個(gè)視頻”(其中,X是比較視頻)。
[0048].如果其它輸入112指示目標(biāo)視頻在整個(gè)觀眾人群中是最多觀看視頻之一,并且這個(gè)特征對(duì)于ML分?jǐn)?shù)150具有顯著影響,那么可以向用戶呈現(xiàn)解釋:“這個(gè)視頻在所有用戶中是最多觀看視頻之一”。
[0049].如果其它輸入112指示目標(biāo)視頻當(dāng)前經(jīng)歷興趣提升,并且這個(gè)特征對(duì)于ML分?jǐn)?shù)150具有顯著影響,那么可以向用戶呈現(xiàn)解釋“這個(gè)視頻當(dāng)前正經(jīng)歷顯著的興趣爆發(fā)”。
[0050]這些僅是可能向用戶呈現(xiàn)的實(shí)際非限制數(shù)量的解釋的例子,以向用戶解釋為什么正推薦目標(biāo)視頻。盡管這些例子是非常一般的,但實(shí)際解釋可能是非常具體的。例如,除指示“這個(gè)視頻類(lèi)似于X”之外,解釋可以列舉與X類(lèi)似的視頻的各個(gè)方面(例如,題材、演員、主題、標(biāo)簽、持續(xù)時(shí)間、音樂(lè)分?jǐn)?shù)等)。
[0051]對(duì)于推薦系統(tǒng)的度量
[0052]如以上提到的那樣,協(xié)作過(guò)濾輸入108可以包括關(guān)于視頻消費(fèi)者的觀看行為的信息。觀看行為反映在原始CF特征120中,這些原始CF特征120既饋送到CF分析器118,又饋送到機(jī)器學(xué)習(xí)引擎102。為了得到CF特征,推薦系統(tǒng)可以處理來(lái)自播放器日志(具有豐富的行為信息)的用戶-中心度量,以最終產(chǎn)生視頻對(duì)-中心度量,這些視頻對(duì)-中心度量可包括在到機(jī)器學(xué)習(xí)引擎102的輸入饋送106中。
[0053]參照?qǐng)D2,它是根據(jù)本發(fā)明實(shí)施例的方塊圖,方塊圖表明可以由推薦系統(tǒng)保持的各種類(lèi)型的度量。度量可以包括用戶-中心度量240、視頻-中心度量242、及視頻對(duì)-中心度量244。
[0054]用戶-中心度量
[0055]就用戶-中心度量240而論,推薦系統(tǒng)為每個(gè)用戶保持用戶日志。用戶的用戶日志指示哪些視頻用戶已經(jīng)觀看、或表現(xiàn)出興趣。圖2表明三個(gè)用戶日志250、252及254。
[0056]根據(jù)一個(gè)實(shí)施例,除列出用戶已經(jīng)表現(xiàn)出興趣的視頻之外,用戶日志也指示由用戶動(dòng)作指示的興趣量、和指示何時(shí)表現(xiàn)出興趣的時(shí)間戳。根據(jù)一個(gè)實(shí)施例,用戶對(duì)視頻表現(xiàn)出的興趣量由“強(qiáng)度”值代表,該“強(qiáng)度”值與視頻列表一起存儲(chǔ)在用戶日志中。
[0057]強(qiáng)度值可以由各種因素確定,如用戶與視頻具有的相互作用的類(lèi)型而確定。例如,觀看了視頻的用戶比僅僅瀏覽視頻的用戶對(duì)視頻表現(xiàn)出更大興趣。每種類(lèi)型的相互作用內(nèi),強(qiáng)度值可能受其它因素影響。例如,給視頻五星評(píng)價(jià)的用戶比給視頻三星評(píng)價(jià)的用戶對(duì)視頻具有更強(qiáng)烈的興趣。作為另一個(gè)例子,觀看整個(gè)視頻的用戶比僅僅觀看視頻的第一半的用戶具有更強(qiáng)烈的興趣。因而,“已觀看視頻的百分比”可以是確定用戶的興趣強(qiáng)度的因素。作為又一個(gè)例子,重復(fù)地觀看視頻的用戶比觀看視頻一次的用戶具有更強(qiáng)烈的興趣。
[0058]視頻-中心度量
[0059]推薦系統(tǒng)處理用戶日志,并且對(duì)于為每個(gè)視頻保持的視頻-中心度量242進(jìn)行對(duì)應(yīng)更新。在圖2表明的實(shí)施例中,推薦系統(tǒng)保持用于三個(gè)視頻202、204及206的信息。對(duì)于每個(gè)視頻,由推薦系統(tǒng)保持的信息包括用戶清單,這些用戶已經(jīng)表現(xiàn)出對(duì)于視頻的興趣。視頻202、204及206的“感興趣用戶清單”分別表明為清單222、224及226。在一個(gè)實(shí)施例中,這些清單包括條目、時(shí)間戳、及強(qiáng)度值,這些條目的每一個(gè)識(shí)別用戶,這些強(qiáng)度值指示在由時(shí)間戳指示的時(shí)間、用戶對(duì)視頻表現(xiàn)出多么強(qiáng)烈的興趣。
[0060]除感興趣用戶清單222、224及226之外,為視頻的每一個(gè)保持視頻元數(shù)據(jù)。為每個(gè)視頻保持的視頻元數(shù)據(jù)可以包括關(guān)于視頻的任何數(shù)量和類(lèi)型的信息,如持續(xù)時(shí)間、創(chuàng)建日期、標(biāo)簽、標(biāo)題、關(guān)鍵字、語(yǔ)言等。常常是,用于給定視頻的初始視頻元數(shù)據(jù)由視頻的生產(chǎn)者提供(例如,標(biāo)題、演員、語(yǔ)言),或者從視頻本身得出(例如,持續(xù)時(shí)間、編碼格式)。然而,在一些出版環(huán)境中,用于視頻的元數(shù)據(jù)可能相對(duì)于時(shí)間而變化或增加。例如,隨著更多用戶觀看視頻,用戶標(biāo)簽可以添加到視頻上。作為另一個(gè)例子,視頻的觀看數(shù)量和評(píng)價(jià)可能隨著用戶觀看和評(píng)價(jià)視頻而正連續(xù)地變化。在圖2表明的實(shí)施例中,用于視頻202、204及206的元數(shù)據(jù)分別表明為視頻元數(shù)據(jù)232、234及236。
[0061]視頻對(duì)-中心度量
[0062]視頻對(duì)-中心度量244是與一對(duì)視頻有關(guān)的度量。例如,圖2表明對(duì)于視頻對(duì)202和204的度量、對(duì)于視頻對(duì)202和206的度量、及對(duì)于視頻對(duì)204和206的度量。在圖2表明的實(shí)施例中,對(duì)于每個(gè)視頻對(duì),度量包括CF度量和CBF度量。
[0063]一般地,對(duì)于視頻對(duì)的CF度量是用來(lái)預(yù)測(cè)觀看該對(duì)中的一個(gè)視頻的用戶也將觀看該對(duì)中的另一個(gè)視頻的可能性的度量。因而,CF度量262是用來(lái)預(yù)測(cè)觀看視頻202和204之一的用戶也將觀看視頻202和204的另一個(gè)的可能性的度量。類(lèi)似地,CF度量264是用來(lái)預(yù)測(cè)觀看視頻202和206之一的用戶也將觀看視頻202和206的另一個(gè)的可能性的度量。最后,CF度量266是用來(lái)預(yù)測(cè)觀看視頻204和206之一的用戶也將觀看視頻204和206的另一個(gè)的可能性的度量。
[0064]一個(gè)實(shí)施例中,對(duì)于每個(gè)視頻對(duì)的CF度量至少包括:
[0065].所有用戶對(duì)于在視頻對(duì)中的每個(gè)視頻花費(fèi)的總時(shí)間
[0066].各個(gè)用戶對(duì)于視頻對(duì)花費(fèi)的最小時(shí)間之和
[0067]?對(duì)于觀看了該對(duì)中的兩個(gè)視頻的用戶,在觀看兩個(gè)視頻之間過(guò)去了多長(zhǎng)時(shí)間
[0068].用戶的分布(將視頻由一個(gè)人觀看100次與視頻由100個(gè)不同的人各自觀看一次進(jìn)行區(qū)分)
[0069].觀看視頻對(duì)的每個(gè)用戶觀看的視頻的分布(指示觀看這個(gè)視頻的用戶是否往往會(huì)觀看多個(gè)視頻、或少量視頻)
[0070].該對(duì)的每個(gè)視頻如何相對(duì)于其它視頻而“可發(fā)現(xiàn)”(例如,將例如頻繁地出現(xiàn)在相同頁(yè)或列表上的視頻與很少出現(xiàn)在相同頁(yè)或列表上的視頻區(qū)分開(kāi))。
[0071]對(duì)于視頻對(duì)的CF度量可以從為該對(duì)中的每個(gè)視頻保持的感興趣用戶清單得出。例如,所有用戶對(duì)于在202/204視頻對(duì)中的每個(gè)視頻花費(fèi)的總時(shí)間可以基于在清單222和224中的信息而確定。類(lèi)似地,CF度量264可以從清單222和226得出。同樣,CF度量266可以從清單224和226得出。
[0072]當(dāng)視頻對(duì)中的視頻之一是目標(biāo)視頻,并且視頻對(duì)中的另一個(gè)視頻是比較視頻時(shí),對(duì)于視頻對(duì)的CF度量可以被包括在用來(lái)產(chǎn)生ML分?jǐn)?shù)的原始CF特征120中。具體地,為了確定將視頻X推薦給特定用戶將實(shí)現(xiàn)目的的程度,其中該特定用戶已經(jīng)表現(xiàn)出對(duì)于視頻Y的興趣,對(duì)于視頻X/Y對(duì)的CF度量可以既饋送到CF分析器118,又饋送到機(jī)器學(xué)習(xí)引擎102。CF分析器118可能基于這些CF度量產(chǎn)生CF分?jǐn)?shù)124。CF分?jǐn)?shù)124可能饋送到機(jī)器學(xué)習(xí)引擎102,并且機(jī)器學(xué)習(xí)引擎102可能至少部分地基于這些CF度量確定將多大權(quán)重給予CF分?jǐn)?shù)124。
[0073]除CF度量之外,對(duì)于每個(gè)視頻對(duì)的視頻對(duì)-中心度量包括CBF度量。視頻對(duì)的CBF度量是一般指示在視頻對(duì)中的視頻的內(nèi)容是多么相似的度量。例如,視頻對(duì)的CBF度量可以指示視頻共同有多少標(biāo)簽、視頻共有哪些元數(shù)據(jù)(例如,演員、導(dǎo)演、關(guān)鍵字)等。在圖2表明的實(shí)施例中,用于視頻對(duì)202/204、202/206及204/206的CBF元數(shù)據(jù)分別表示成CBF度量 272、274 及 276。
[0074]根據(jù)一個(gè)實(shí)施例,當(dāng)視頻對(duì)中的視頻之一是目標(biāo)視頻,并且視頻對(duì)中的另一個(gè)視頻是比較視頻時(shí),對(duì)于視頻對(duì)的CBF度量可以被包括在用來(lái)產(chǎn)生ML分?jǐn)?shù)的原始CBF特征126中。具體地,為了確定視頻X與用戶已經(jīng)表現(xiàn)出對(duì)其的興趣的視頻Y相似的程度,對(duì)于視頻X/Y對(duì)的CBF度量可以既饋送到CBF分析器128,又饋送到機(jī)器學(xué)習(xí)引擎102。CBF分析器128可能基于這些CBF度量產(chǎn)生CBF分?jǐn)?shù)130。CBF分?jǐn)?shù)130可能饋送到機(jī)器學(xué)習(xí)引擎102,并且機(jī)器學(xué)習(xí)引擎102可能至少部分地基于這些CBF度量確定將多大權(quán)重給予CBF分?jǐn)?shù)130。
[0075]行為數(shù)據(jù)的增量更新
[0076]對(duì)于盡可能準(zhǔn)確的ML分?jǐn)?shù)150,用來(lái)產(chǎn)生ML分?jǐn)?shù)150的原始CF特征120應(yīng)該盡可能是當(dāng)前的。然而,視頻觀看人群越大,越難以保證用于全部候選視頻的原始CF特征120
保持一直是新的。
[0077]例如,假定視頻收集庫(kù)具有百萬(wàn)個(gè)視頻資產(chǎn),在任何給定時(shí)間,數(shù)萬(wàn)觀眾正在觀看視頻。這些條件下,觀看行為信息的量可能是巨大的。更新行為數(shù)據(jù)的一種手段可能是實(shí)時(shí)地收集用戶-中心度量,并且在每個(gè)周末,對(duì)于視頻-中心度量242、和然后對(duì)于視頻對(duì)-中心度量244進(jìn)行批量更新。然而,這樣一種手段可能導(dǎo)致由推薦系統(tǒng)使用比較陳舊的視頻-中心度量242和視頻對(duì)-中心度量244。
[0078]為了避免由推薦系統(tǒng)使用陳舊視頻-中心度量242和視頻對(duì)-中心度量244,提供技術(shù)來(lái)增量地保持視頻-中心度量242和視頻對(duì)-中心度量。根據(jù)一個(gè)實(shí)施例,推薦系統(tǒng)增量地將新用戶行為數(shù)據(jù)折合到用戶歷史中,該用戶歷史按元組(tuple)形式(用戶、視頻、強(qiáng)度)概括全部歷史觀看行為。另外,推薦系統(tǒng)將新信息與舊信息區(qū)分開(kāi),并且只更新具有新用戶活動(dòng)的視頻對(duì)的視頻對(duì)-中心度量244。
[0079]具體地,在一個(gè)實(shí)施例中,對(duì)于特定視頻的視頻-中心CF度量?jī)H響應(yīng)對(duì)于特定視頻的新興趣表達(dá)而更新。類(lèi)似地,對(duì)于特定視頻對(duì)的視頻對(duì)-中心度量,僅響應(yīng)對(duì)于屬于視頻對(duì)的至少一個(gè)視頻的新興趣表達(dá)而更新。因?yàn)槎鄠€(gè)視頻經(jīng)歷長(zhǎng)時(shí)段,這些長(zhǎng)時(shí)段期間沒(méi)有用戶表達(dá)興趣,所以減少需要重新計(jì)算的視頻-中心度量的百分比,由此降低為實(shí)時(shí)地保持視頻-中心度量242和視頻對(duì)-中心度量244 —直為新所需要的處理。
[0080]視頻元數(shù)據(jù)的增量更新
[0081]類(lèi)似于CF度量,重要的是,每個(gè)視頻的以及視頻對(duì)的CBF度量保持一直是新的,因?yàn)檫@些度量對(duì)ML分?jǐn)?shù)具有影響,這些ML分?jǐn)?shù)用作選擇待推薦的視頻。為了按有效方式保持CBF度量一直是新的,推薦系統(tǒng)使用的基于內(nèi)容的管線也增量地保持。例如,在一個(gè)實(shí)施例中,吸收到推薦系統(tǒng)中的新視頻和關(guān)于視頻的元數(shù)據(jù)一旦可得,視頻就立即成為可推薦的。
[0082]在一個(gè)實(shí)施例中,實(shí)施基于內(nèi)容的管線,從而只有當(dāng)新視頻和現(xiàn)有視頻共享共同元數(shù)據(jù)時(shí),才將新視頻與新視頻和現(xiàn)有視頻比較。在一個(gè)實(shí)施例中,推薦保持(特征名稱、特征值)對(duì)于(時(shí)間戳、視頻、視頻元數(shù)據(jù))映射。這樣的實(shí)施例中,基于內(nèi)容的管線可以包括如下邏輯步驟:
[0083].產(chǎn)生(特征名稱、特征值)對(duì)于(時(shí)間戳、視頻、視頻元數(shù)據(jù))映射,并且將新視頻折合到全局表中
[0084].對(duì)包含相同(特征名稱、特征值)的視頻進(jìn)行分組
[0085].為每組產(chǎn)生視頻對(duì)。
[0086]?聚集視頻對(duì)。為每個(gè)對(duì)計(jì)算成對(duì)距離。
[0087]當(dāng)視頻對(duì)中的視頻之一是目標(biāo)視頻,并且視頻對(duì)中的另一個(gè)視頻是比較視頻時(shí),這個(gè)成對(duì)距離可以是饋送到機(jī)器學(xué)習(xí)引擎102的CBF分?jǐn)?shù)。因?yàn)樾阅茉?,推薦系統(tǒng)可以檢查時(shí)間戳,并且將新視頻與新視頻、和新視頻與舊視頻(但不是舊視頻與舊視頻)相比較。
[0088]在一個(gè)實(shí)施例中,關(guān)于目標(biāo)視頻饋送到機(jī)器學(xué)習(xí)引擎102的原始CBF特征126反映對(duì)于該目標(biāo)視頻的當(dāng)前視頻-中心度量242、和對(duì)于包括該視頻和比較視頻的視頻對(duì)的當(dāng)前CBF度量。這在與任何給定視頻相關(guān)聯(lián)的視頻元數(shù)據(jù)可相對(duì)于時(shí)間顯著變化(例如,將新標(biāo)簽添加到視頻上)的環(huán)境中特別重要。
[0089]如以上提到的那樣,在一個(gè)實(shí)施例中,當(dāng)視頻對(duì)中的第二視頻添加到收集庫(kù)上時(shí),對(duì)于該視頻對(duì)的CBF度量被創(chuàng)建,并且僅響應(yīng)在視頻對(duì)中的任一視頻的視頻元數(shù)據(jù)的變化才更新。例如,假定在將視頻204添加到收集庫(kù)上時(shí),視頻202在視頻收集庫(kù)中存在。響應(yīng)視頻204添加到收集庫(kù)上,基于對(duì)于視頻202的視頻元數(shù)據(jù)232和對(duì)于視頻204的視頻元數(shù)據(jù)234,可以初始創(chuàng)建對(duì)于視頻對(duì)202/204的CBF度量272。
[0090]一旦產(chǎn)生,CBF度量272就保持不變,直到對(duì)于視頻202或視頻204的視頻元數(shù)據(jù)被改變。這樣一種變化(例如,標(biāo)簽被添加到視頻對(duì)中的視頻之一)觸發(fā)對(duì)于對(duì)的CBF度量272的重新計(jì)算。由于每個(gè)視頻可能屬于多個(gè)視頻對(duì),所以對(duì)一個(gè)視頻的視頻元數(shù)據(jù)的更新可能觸發(fā)對(duì)于多個(gè)視頻對(duì)的CBF度量的重新計(jì)算。例如,對(duì)于視頻202的視頻元數(shù)據(jù)232的更新可能觸發(fā)視頻對(duì)202/204的CBF度量272的重新計(jì)算、和視頻對(duì)202/206的CBF度量274的重新計(jì)算。
[0091]重新計(jì)算視頻對(duì)的分?jǐn)?shù)
[0092]盡管在圖2未表明,每個(gè)視頻對(duì)的視頻對(duì)-中心度量244也可以包括預(yù)先計(jì)算CF分?jǐn)?shù)和預(yù)先計(jì)算CBF分?jǐn)?shù)。具體地,代之以在需要視頻推薦時(shí)產(chǎn)生對(duì)于視頻對(duì)的CF和CBF分?jǐn)?shù),這些分?jǐn)?shù)可以在更新底層視頻對(duì)度量時(shí)預(yù)先計(jì)算。因此,需要視頻推薦時(shí),預(yù)先計(jì)算分?jǐn)?shù)可以簡(jiǎn)單地從存儲(chǔ)中讀出,并且饋送到機(jī)器學(xué)習(xí)引擎102。在推薦(詢問(wèn))時(shí)和在電影信息更新時(shí)進(jìn)行這種計(jì)算之間存在權(quán)衡。一般指導(dǎo)原理是利用它們的相對(duì)頻率、以及如何盡可能不頻繁地進(jìn)行計(jì)算。
[0093]例如,視頻對(duì)202/204的CF分?jǐn)?shù)124基于CF度量262。CF度量262響應(yīng)用戶對(duì)視頻202或視頻204的興趣的指示而更新。響應(yīng)用戶興趣的指示,可以更新CF度量262,并且通過(guò)將更新的CF度量262饋送到CF分析器118中,可以對(duì)于視頻對(duì)202/204產(chǎn)生CF分?jǐn)?shù)124。當(dāng)使用機(jī)器學(xué)習(xí)引擎102基于視頻對(duì)202/204產(chǎn)生ML分?jǐn)?shù)150時(shí),這個(gè)預(yù)先計(jì)算CF分?jǐn)?shù)然后可以簡(jiǎn)單地讀取,而不是重新計(jì)算。
[0094]類(lèi)似地,視頻對(duì)202/204的CBF分?jǐn)?shù)130基于CBF度量272。CBF度量272響應(yīng)對(duì)于對(duì)視頻202或視頻204的視頻元數(shù)據(jù)的更新而更新。響應(yīng)這樣的元數(shù)據(jù)更新,可以更新CBF度量272,并且通過(guò)將更新的CBF度量272饋送到CBF分析器128中,可以對(duì)于視頻對(duì)202/204產(chǎn)生CBF分?jǐn)?shù)130。當(dāng)使用機(jī)器學(xué)習(xí)引擎102基于視頻對(duì)202/204產(chǎn)生ML分?jǐn)?shù)150時(shí),這個(gè)預(yù)先計(jì)算CBF分?jǐn)?shù)130然后可以簡(jiǎn)單地讀取,而不是重新計(jì)算。
[0095]選擇對(duì)其保持度量的視頻對(duì)
[0096]理論上,對(duì)于收集庫(kù)中的每?jī)蓚€(gè)視頻組合可以保持視頻對(duì)-中心度量244。對(duì)于收集庫(kù)中的每個(gè)可能視頻對(duì),保持視頻對(duì)-中心度量可能導(dǎo)致NX (N-1)不同組的視頻對(duì)-中心度量,其中N是收集庫(kù)中的視頻數(shù)量。盡管對(duì)于小收集庫(kù)容易實(shí)現(xiàn)保持多組的視頻對(duì)-中心度量,但它對(duì)于極大收集庫(kù)是不切實(shí)際的。
[0097]因此,根據(jù)實(shí)施例,在認(rèn)為視頻與給定視頻足夠相似之前,視頻必須通過(guò)與給定視頻的“配對(duì)試驗(yàn)”,以證明對(duì)于視頻和給定視頻的視頻對(duì)保持視頻對(duì)-中心度量是正確的。相對(duì)于特定視頻通過(guò)配對(duì)試驗(yàn)的視頻這里稱作對(duì)于該特定視頻的“配對(duì)視頻組”。因而,在一個(gè)實(shí)施例中,對(duì)于任何給定視頻對(duì)(視頻X/視頻Y),如果且只有如果Y在視頻X的配對(duì)視頻組中,才保持視頻對(duì)-中心度量244。
[0098]配對(duì)試驗(yàn)例如可以是,視頻必須共享如下特性的任一個(gè):題材、演員、導(dǎo)演。這僅是實(shí)際上非限制類(lèi)型的配對(duì)試驗(yàn)的一個(gè)例子,這些配對(duì)試驗(yàn)可以用來(lái)確定對(duì)于特定視頻對(duì)是否保持視頻對(duì)-中心度量。配對(duì)試驗(yàn)越嚴(yán)格,對(duì)其保持視頻對(duì)-中心度量244的視頻對(duì)越少,因此保持視頻對(duì)-中心度量244的開(kāi)銷(xiāo)越低。
[0099]然而,如果配對(duì)試驗(yàn)太嚴(yán)格,那么推薦系統(tǒng)可能不能進(jìn)行有用的一些推薦。例如,如果視頻X不在視頻Y的配對(duì)視頻組中,那么當(dāng)視頻Y是比較視頻,即使視頻Y的大多數(shù)觀眾實(shí)際上可能喜歡觀看視頻X,視頻X也不可能由推薦系統(tǒng)推薦。
[0100]配對(duì)試驗(yàn)可以是任意復(fù)雜的。例如,試驗(yàn)可以具有諸如如下之類(lèi)的規(guī)則:
[0101]?如果視頻X具有N或更好的評(píng)價(jià),那么自動(dòng)地認(rèn)為視頻X滿足與全部視頻有關(guān)的配對(duì)試驗(yàn)。
[0102].如果視頻X具有小于N次觀看、但大于M次觀看的評(píng)價(jià),那么認(rèn)為視頻X滿足與共有如下之一的視頻有關(guān)的配對(duì)試驗(yàn):題材、演員、導(dǎo)演。
[0103]?如果視頻X具有小于M次觀看,那么認(rèn)為視頻X滿足與相同題材的視頻有關(guān)的配對(duì)試驗(yàn)。
[0104]這些規(guī)則中,視頻的評(píng)價(jià)確定那些通過(guò)配對(duì)試驗(yàn)所必須滿足的條件。然而,在可選擇配對(duì)試驗(yàn)中,用于配對(duì)的作用條件可以基于其它因素而變化。
[0105]代之以使用配對(duì)試驗(yàn)來(lái)確定是否存儲(chǔ)對(duì)于視頻對(duì)的任何視頻對(duì)-中心度量,配對(duì)試驗(yàn)可以用來(lái)確定對(duì)于視頻對(duì)是否應(yīng)該保持特定類(lèi)型的視頻對(duì)-中心度量。例如,對(duì)于在收集庫(kù)中的所有視頻對(duì)可以保持CF度量,而僅對(duì)于通過(guò)配對(duì)試驗(yàn)的視頻對(duì)保持CBF度量??蛇x擇地,對(duì)于在收集庫(kù)中的所有視頻對(duì)可以保持CBF度量,而僅對(duì)于通過(guò)配對(duì)試驗(yàn)的視頻對(duì)保持CF度量。
[0106]在又一個(gè)實(shí)施例中,對(duì)于每種類(lèi)型的視頻對(duì)-中心度量可以有不同的配對(duì)試驗(yàn)。例如,如果視頻對(duì)中的兩個(gè)視頻都具有超過(guò)一定閾值的評(píng)價(jià),則推薦系統(tǒng)可以存儲(chǔ)對(duì)于視頻對(duì)的CF度量。同時(shí),如果視頻對(duì)共有至少一個(gè)顯著特征(例如,試樣、演員、導(dǎo)演),則推薦系統(tǒng)可以存儲(chǔ)對(duì)于視頻對(duì)的CBF度量。在這樣的實(shí)施例中,對(duì)于一些視頻對(duì)的視頻對(duì)-中心度量244可以既包括CF度量,又包括CBF度量,對(duì)于其它視頻對(duì),可以只有CF度量或CBF度量,而不是兩者。
[0107]基于配對(duì)視頻組的視頻到視頻推薦
[0108]根據(jù)一個(gè)實(shí)施例,當(dāng)給定視頻到視頻推薦時(shí),推薦系統(tǒng)只對(duì)于用戶對(duì)其已經(jīng)表達(dá)興趣的視頻的配對(duì)視頻組中的視頻產(chǎn)生ML分?jǐn)?shù)。例如,假定用戶剛剛結(jié)束觀看視頻X。為了推薦用戶觀看的下個(gè)視頻,機(jī)器學(xué)習(xí)引擎102對(duì)于視頻X的配對(duì)視頻組中的每個(gè)視頻,產(chǎn)生ML分?jǐn)?shù)150。
[0109]這個(gè)例子中,視頻X的配對(duì)視頻組中的每個(gè)視頻的原始CF特征120可能包括對(duì)于視頻對(duì)的CF度量,該視頻對(duì)包括該視頻和視頻X。這些原始CF特征120可能饋送到CF分析器118,以產(chǎn)生CF分?jǐn)?shù)124,該CF分?jǐn)?shù)124預(yù)測(cè)視頻X的觀眾可能對(duì)觀看目標(biāo)視頻有多大興趣。
[0110]類(lèi)似地,原始CBF特征126可能包括對(duì)于視頻對(duì)的CF度量,該視頻對(duì)包括該視頻和視頻X。這些原始CBF特征126可能饋送到CBF分析器128,以產(chǎn)生CBF分?jǐn)?shù)130,該CBF分?jǐn)?shù)130預(yù)測(cè)視頻X與目標(biāo)視頻多么相似。
[0111]如在圖1表明的那樣,原始特征120和126和其它輸入112、與分?jǐn)?shù)124和130 —起饋送到機(jī)器學(xué)習(xí)引擎102,以使機(jī)器學(xué)習(xí)引擎102能夠確定將多大權(quán)重給予分?jǐn)?shù)124和130的每一個(gè)。基于確定權(quán)重,機(jī)器學(xué)習(xí)引擎102對(duì)于目標(biāo)視頻產(chǎn)生ML分?jǐn)?shù)150。
[0112]在對(duì)視頻X的配對(duì)視頻組中的所有視頻重復(fù)這個(gè)過(guò)程之后,對(duì)于該視頻產(chǎn)生的ML分?jǐn)?shù)被用作確定要推薦視頻中的哪個(gè)的基礎(chǔ)。
[0113]衰減因數(shù)
[0114]一般地,用戶的最近動(dòng)作比由用戶在較遠(yuǎn)過(guò)去采取的動(dòng)作更多地指示用戶的當(dāng)前興趣。因此,產(chǎn)生CF分?jǐn)?shù)124時(shí),CF分析器118可以應(yīng)用“衰減”因數(shù),該“衰減”因數(shù)基于行為多近發(fā)生而調(diào)整給予用戶行為度量的權(quán)重。
[0115]例如,為了產(chǎn)生CF分?jǐn)?shù)124的目的,CF分析器118可以將指示用戶觀看視頻對(duì)的兩個(gè)視頻的數(shù)據(jù),在用戶觀看兩個(gè)視頻之后立即給予100%權(quán)重,一周后給予80%權(quán)重,兩周后給予60%權(quán)重。用戶行為的遠(yuǎn)近可以由用戶日志中捕獲的時(shí)間戳確定。
[0116]衰減因數(shù)越高,給予較舊行為的權(quán)重越低。相反,衰減因數(shù)越低,給予較舊行為的權(quán)重越高。高衰減因數(shù)的例子可能例如將100%權(quán)重給予當(dāng)前行為,將10%權(quán)重給予一周舊的行為,對(duì)于多于兩周舊的行為不給予權(quán)重。
[0117]改變CF分析器118使用的衰減因數(shù)影響由CF分析器118產(chǎn)生的CF分?jǐn)?shù)124。例如,假定多個(gè)用戶在兩周前已經(jīng)觀看了特定視頻對(duì),但少量用戶在上周觀看了同一視頻對(duì)。這些條件下,高衰減因數(shù)的使用可能導(dǎo)致低CF分?jǐn)?shù)124,因?yàn)楹苄?quán)重可能給予較舊觀看信息。另一方面,低衰減因數(shù)的使用可能導(dǎo)致高CF分?jǐn)?shù)124,因?yàn)榕f使用信息可能具有對(duì)于CF分?jǐn)?shù)124的顯著影響。
[0118]不幸地,沒(méi)有所有情形下都產(chǎn)生最佳結(jié)果的衰減因數(shù)。例如,對(duì)于來(lái)自高觀看視頻的發(fā)行者的視頻使用高衰減因數(shù)可能產(chǎn)生CF分?jǐn)?shù)124,這些CF分?jǐn)?shù)124準(zhǔn)確地預(yù)測(cè)觀看在視頻對(duì)中的一個(gè)視頻的用戶是否可能對(duì)觀看在視頻對(duì)中的另一個(gè)視頻感興趣。高衰減因數(shù)的使用可能對(duì)這樣類(lèi)型的視頻是最佳的,因?yàn)樽罱^看活動(dòng)的量足以產(chǎn)生準(zhǔn)確預(yù)測(cè)。因此,舊行為數(shù)據(jù)可相應(yīng)地打折。
[0119]另一方面,對(duì)于其視頻較不頻繁地被觀看的發(fā)行者的視頻,使用低衰減因數(shù)可能產(chǎn)生更準(zhǔn)確的CF分?jǐn)?shù)124。這樣的情況下使用低衰減因數(shù)可能需要保證,CF分?jǐn)?shù)124基于有用的足夠行為數(shù)據(jù)。因而,在這個(gè)例子中,獨(dú)立于衰減因數(shù)的輸入?yún)?shù)(視頻發(fā)行者)可以將如下指示給予機(jī)器學(xué)習(xí)引擎102:哪種衰減因數(shù)可能更適當(dāng)?shù)赜迷谌魏谓o定情形下。
[0120]代之以試圖推測(cè)哪種衰減因數(shù)對(duì)于每個(gè)視頻對(duì)可能產(chǎn)生最準(zhǔn)確CF分?jǐn)?shù)124,提供這樣的實(shí)施例,對(duì)每個(gè)視頻對(duì)將多個(gè)CF分?jǐn)?shù)饋送到機(jī)器學(xué)習(xí)引擎102中,其中每個(gè)CF分?jǐn)?shù)通過(guò)使用不同的衰減因數(shù)而產(chǎn)生。這樣的實(shí)施例表明在圖3。
[0121]參照?qǐng)D3,它表明推薦系統(tǒng),該推薦系統(tǒng)中,機(jī)器學(xué)習(xí)引擎102被提供CF輸入308,這些CF輸入308包括三個(gè)不同CF分?jǐn)?shù)324、326、328。CF分?jǐn)?shù)324、326及328基于相同的原始CF特征120,但通過(guò)使用三個(gè)不同的衰減因數(shù)314、316及318而產(chǎn)生?;谠谳斎腽佀?06中的其它特征(如視頻生產(chǎn)者),機(jī)器學(xué)習(xí)引擎102確定CF分?jǐn)?shù)的哪個(gè)應(yīng)該對(duì)ML分?jǐn)?shù)150具有較大影響。
[0122]例如,如果原始CBF特征126指示在視頻對(duì)中的視頻是關(guān)于來(lái)自特定發(fā)行者的高度觀看當(dāng)前新聞事件,則機(jī)器學(xué)習(xí)引擎102可以將較大權(quán)重給予CF分?jǐn)?shù),該CF分?jǐn)?shù)基于高衰減因數(shù)。另一方面,如果原始CBF特征126指示在視頻對(duì)中的視頻是來(lái)自另一個(gè)發(fā)行者的很少看到的經(jīng)典電影,則機(jī)器學(xué)習(xí)引擎102可以將較大權(quán)重給予CF分?jǐn)?shù),該CF分?jǐn)?shù)基于低衰減因數(shù)。
[0123]盡管在圖3表明的實(shí)施例中,使用三個(gè)不同的衰減因數(shù),但使用的衰減因數(shù)的實(shí)際數(shù)量可以隨實(shí)施變化。例如,一個(gè)實(shí)施例對(duì)于任何給定視頻對(duì)可以產(chǎn)生二十個(gè)CF分?jǐn)?shù),其中,二十個(gè)CF分?jǐn)?shù)的每一個(gè)基于不同的衰減因數(shù)。如將在下面更詳細(xì)解釋的那樣,這種技術(shù)不限于衰減因數(shù),也可以供任何數(shù)量的其它參數(shù)使用。
[0124]機(jī)率-比值截止
[0125]當(dāng)模型用來(lái)產(chǎn)生預(yù)測(cè)時(shí),模型使用基于假設(shè)的某些“模型調(diào)諧參數(shù)”。以上討論的衰減因數(shù)是這樣一種模型調(diào)諧參數(shù)的例子。例如,使用衰減因數(shù)的模型-該衰減因數(shù)將給予動(dòng)作的權(quán)重在一周之后減小50%,假定過(guò)去動(dòng)作預(yù)測(cè)未來(lái)動(dòng)作的能力在一周之后下降50%。
[0126]衰減因數(shù)僅是模型調(diào)諧參數(shù)的一個(gè)例子,這些模型調(diào)諧參數(shù)可以由模型使用,這些模型在CF和CBF分析器中實(shí)施。除衰減因數(shù)之外,由CF分析器采用的模型可以例如使用機(jī)率-比值截止閾值(odds-rat1 cut-off threshold),來(lái)減小當(dāng)預(yù)測(cè)兩個(gè)視頻是否實(shí)際上彼此有關(guān)時(shí),由高度流行視頻引起的虛假-肯定(false-positives)的數(shù)量。
[0127]機(jī)率-比值截止可以用來(lái)解決如下問(wèn)題:極流行視頻可能由如此多的用戶觀看,從而這些用戶觀看除極流行視頻之外的一些其它視頻的事實(shí),并不是其它視頻與極流行視頻有關(guān)的準(zhǔn)確指示。為了避免預(yù)測(cè)極流行視頻與它們對(duì)其無(wú)關(guān)的其它視頻有關(guān),由CF分析器118使用的模型可以通過(guò)計(jì)算兩個(gè)視頻獨(dú)立同現(xiàn)在用戶觀看日志中的機(jī)率(而非依賴地同時(shí)出現(xiàn)),確定兩個(gè)視頻是否有關(guān)。如果兩個(gè)視頻獨(dú)立同現(xiàn)的機(jī)率大于由模型使用的機(jī)率-比值截止(例如,50% ),那么假定:兩個(gè)視頻實(shí)際上不是彼此有關(guān)的。
[0128]如關(guān)于衰減因數(shù)那樣,模型使用的機(jī)率-比值截止(a)影響預(yù)測(cè),和(b)所基于的假設(shè)不可能始終保持真實(shí)。例如,一些情況下,兩個(gè)視頻,即使統(tǒng)計(jì)學(xué)指示有55%的機(jī)會(huì)它們獨(dú)立同現(xiàn)在用戶日志中,也可能是高度相關(guān)的。這種情形下,使用60%機(jī)率-比值截止,可能已經(jīng)使模型預(yù)測(cè)到所述視頻事實(shí)上是相關(guān)的。
[0129]另一方面,兩個(gè)視頻,即使統(tǒng)計(jì)學(xué)指示有45%的機(jī)會(huì)它們獨(dú)立同現(xiàn)在用戶日志中,也可能是不相關(guān)的。這種情形下,使用40%機(jī)率-比值截止可能已經(jīng)使模型預(yù)測(cè)到視頻不相關(guān)。
[0130]標(biāo)準(zhǔn)化因數(shù)
[0131]標(biāo)準(zhǔn)化因數(shù)是可以由一些模型使用的模型調(diào)諧參數(shù)的另一個(gè)例子。標(biāo)準(zhǔn)化因數(shù)一般試圖基于用戶的整體觀看行為將分?jǐn)?shù)標(biāo)準(zhǔn)化。例如,用戶A和B都觀看了視頻對(duì)(vl、v2)50分鐘。然而,用戶A只觀看了視頻vl和v2,而用戶B觀看了數(shù)百個(gè)其它視頻。用戶B具有關(guān)于視頻對(duì)的較分散注意力。對(duì)于視頻vl和v2的相關(guān)度來(lái)自用戶A的贊同應(yīng)該比來(lái)自用戶B的贊同重要。這與Web頁(yè)排序中使用的PageRank是相同精神,這里,給予引出鏈路的權(quán)重部分取決于每個(gè)網(wǎng)頁(yè)可能具有的引出鏈路的數(shù)量。
[0132]使用不同模型調(diào)諧參數(shù)的并行計(jì)算
[0133]因?yàn)槟P蛯?duì)于模型調(diào)諧參數(shù)(例如,衰減因數(shù)、標(biāo)準(zhǔn)化因數(shù)、機(jī)率-比值截止等)使用的值所基于的假設(shè)并不是對(duì)于所有情形都真實(shí),所以提供這樣實(shí)施例,將不同模型調(diào)諧參數(shù)值組合的分?jǐn)?shù)并行地饋送到機(jī)器學(xué)習(xí)引擎102。
[0134]例如,圖3表明將三個(gè)CF分?jǐn)?shù)324、326、328并行地饋送到機(jī)器學(xué)習(xí)引擎102,這三個(gè)CF分?jǐn)?shù)324、326、328的每一個(gè)與不同的衰減因數(shù)值相關(guān)聯(lián)??蛇x擇實(shí)施例中,對(duì)于幾個(gè)(衰減因數(shù)、標(biāo)準(zhǔn)化因數(shù)、機(jī)率-比值截止)值組合的每一個(gè)可產(chǎn)生一個(gè)CF分?jǐn)?shù)。例如,實(shí)施例可以使用對(duì)于衰減因數(shù)(X、Y、Z)的三個(gè)不同值、和兩個(gè)不同機(jī)率-比值截止閾值(A、B)。這樣的實(shí)施例中,機(jī)器學(xué)習(xí)引擎102可并行地被提供六個(gè)CF分?jǐn)?shù),對(duì)于模型調(diào)諧參數(shù)值組合(X、A)、(X、B)、(Y、A)、(Y、B)、(Z、A)、(Z、B)的每種一個(gè)。
[0135]盡管這個(gè)例子中使用衰減因數(shù)和機(jī)率-比值截止閾值的模型調(diào)諧參數(shù),但對(duì)于任何類(lèi)型和數(shù)量的模型調(diào)諧參數(shù),可以使用相同的并行-分?jǐn)?shù)-產(chǎn)生技術(shù)。例如,特定CF分析器可以使用這樣模型,該模型采用四個(gè)不同的模型調(diào)諧參數(shù)。對(duì)于每個(gè)模型調(diào)諧參數(shù),可能有待試驗(yàn)的三個(gè)可行值。這樣的實(shí)施例中,有模型調(diào)諧參數(shù)值的81種不同組合。因而,可以將81個(gè)CF分?jǐn)?shù)(對(duì)于每種模型調(diào)諧參數(shù)值組合一個(gè))并行地饋送到機(jī)器學(xué)習(xí)引擎102中。
[0136]如關(guān)于以上給出的衰減因數(shù)例子那樣,在產(chǎn)生ML分?jǐn)?shù)時(shí),給予CF分?jǐn)?shù)的每一個(gè)的權(quán)重至少部分地基于由機(jī)器學(xué)習(xí)引擎102接收的其它輸入。如在圖3指示的那樣,這些其它輸入包括原始CF特征120、原始CBF特征126、CBF分?jǐn)?shù)130及任何數(shù)量的其它輸入112。
[0137]靈活的對(duì)象函數(shù)
[0138]當(dāng)用在視頻到視頻推薦的情形時(shí),機(jī)器學(xué)習(xí)引擎102產(chǎn)生ML分?jǐn)?shù),這些ML分?jǐn)?shù)預(yù)測(cè)用戶給定他/她已經(jīng)觀看視頻A(比較視頻)而將觀看視頻B(目標(biāo)視頻)的概率。實(shí)際中,有發(fā)行者想優(yōu)化實(shí)現(xiàn)的多個(gè)目標(biāo)。目標(biāo)的例子包括但不限于:
[0139].增加總電影觀看時(shí)間
[0140].增加每個(gè)用戶觀看的視頻數(shù)量
[0141].增加用戶花在觀看每個(gè)(推薦)視頻上的總分鐘
[0142]?增加來(lái)自每次視頻觀看的廣告收入
[0143].增大影響范圍
[0144]?增加每部電影的收入
[0145]為了解決這種挑戰(zhàn),提供這樣實(shí)施例,其中預(yù)測(cè)被初始地反映在幾個(gè)不同的子分量中。分量可以包括例如:
[0146].P(B|A)-用戶給定他/她觀看了 A而可能喜歡觀看B的概率
[0147].R(B) -來(lái)自B的每次觀看的期望收入(*未來(lái)工作)
[0148].P (ad I U,B)-觀看B的用戶u將點(diǎn)擊廣告的概率
[0149]使用機(jī)器學(xué)習(xí)引擎產(chǎn)生這些分量的每一個(gè)的分?jǐn)?shù)之后,分量分?jǐn)?shù)然后可以基于特定組的目標(biāo)而組合,以產(chǎn)生合成ML分?jǐn)?shù),該合成ML分?jǐn)?shù)用作選擇要推薦哪些候選視頻的基礎(chǔ)。
[0150]圖4是機(jī)器學(xué)習(xí)引擎402的方塊圖,該機(jī)器學(xué)習(xí)引擎402已經(jīng)訓(xùn)練成產(chǎn)生ML分量分?jǐn)?shù)404、406及408,這些ML分量分?jǐn)?shù)404、406及408由基于目標(biāo)的分量組合器410組合,以基于規(guī)定目標(biāo)430產(chǎn)生合成ML分?jǐn)?shù)440。這個(gè)例子中,ML分量分?jǐn)?shù)404、406及408可以與以上描述的目標(biāo)函數(shù)P (B|A)、R (B)、及P (ad I U,B)相對(duì)應(yīng)。當(dāng)產(chǎn)生合成ML分?jǐn)?shù)440時(shí),由基于目標(biāo)的分量組合器410給予各個(gè)分量分?jǐn)?shù)的權(quán)重是基于饋送到基于目標(biāo)的分量組合器410的目標(biāo)信息430。
[0151]例如,假定目標(biāo)430指示用戶約定顯著地比收入重要,并且收入稍微比廣告重要。基于這樣的目標(biāo)信息430,基于目標(biāo)的組合器410可以將分量分?jǐn)?shù)404、406及408分別按
0.6,0.25 及 0.15 加權(quán)。
[0152]盡管機(jī)器學(xué)習(xí)引擎402表明成單個(gè)引擎,機(jī)器學(xué)習(xí)引擎402可以實(shí)施成三個(gè)不同引擎,這三個(gè)不同引擎的每一個(gè)訓(xùn)練成產(chǎn)生不同的ML分量分?jǐn)?shù)。分量分?jǐn)?shù)的實(shí)際數(shù)量、和基于目標(biāo)的分量組合器410當(dāng)產(chǎn)生合成ML分?jǐn)?shù)440時(shí)如何將權(quán)重賦予這些分?jǐn)?shù),可以隨實(shí)施而變化。例如,單個(gè)推薦系統(tǒng)可以產(chǎn)生數(shù)十個(gè)ML分量分?jǐn)?shù),這些ML分量分?jǐn)?shù)的每一個(gè)反映基于不同目標(biāo)函數(shù)的預(yù)測(cè)?;谀繕?biāo)的分量組合器410可以基于目標(biāo)信息430按各種方式組合這些ML分量分?jǐn)?shù)。
[0153]在一個(gè)實(shí)施例中,基于目標(biāo)的分量組合器410被提供多組目標(biāo),并因此產(chǎn)生多個(gè)合成ML分?jǐn)?shù)。這樣的實(shí)施例中,每個(gè)視頻對(duì)組合可能具有多個(gè)合成ML分?jǐn)?shù),并且為確定是否推薦視頻而使用的實(shí)際ML分?jǐn)?shù)可能基于給出推薦時(shí)有效的目標(biāo)。
[0154]在分量分?jǐn)?shù)之間交替
[0155]為了給出滿足某組目的的推薦,可以將分量分?jǐn)?shù)組合成合成ML分?jǐn)?shù)440,該合成ML分?jǐn)?shù)440用作確定要推薦哪些候選視頻的基礎(chǔ)。在可選擇實(shí)施例中,不產(chǎn)生合成ML分?jǐn)?shù)440。代之以,當(dāng)給出推薦時(shí),推薦系統(tǒng)在分量分?jǐn)?shù)中的哪些要用作基礎(chǔ)之間交替,所述基礎(chǔ)用來(lái)確定待推薦的視頻。
[0156]例如,代之以通過(guò)將ML分量分?jǐn)?shù)404、406及408分別給予0.6、0.25及0.15的權(quán)重而產(chǎn)生合成ML分?jǐn)?shù)440,推薦系統(tǒng)可以在60%的時(shí)間給出基于ML分量分?jǐn)?shù)404的、在25%的時(shí)間給出基于ML分量分?jǐn)?shù)406、及在15%的時(shí)間給出基于ML分量分?jǐn)?shù)408的推薦。如關(guān)于產(chǎn)生合成ML分?jǐn)?shù)440的實(shí)施例那樣,在ML分量分?jǐn)?shù)之間交替的實(shí)施例基于正給出推薦時(shí)有效的目標(biāo)這樣做。
[0157]根據(jù)一個(gè)實(shí)施例,在ML分量分?jǐn)?shù)之間交替的模式不必是均勻的。例如,推薦系統(tǒng)可以在用戶-中心基礎(chǔ)上進(jìn)行交替,其中初始向用戶提供基于ML分量分?jǐn)?shù)的推薦,該ML分量分?jǐn)?shù)預(yù)測(cè)用戶約定。只有在向用戶已經(jīng)呈現(xiàn)幾個(gè)推薦之后,這幾個(gè)推薦聚焦在用戶約定上,推薦系統(tǒng)才可能開(kāi)始提供基于其它目標(biāo)函數(shù)(如收入最大化)的一些推薦。如果當(dāng)呈現(xiàn)收入最大化推薦時(shí)的用戶行為指示,用戶約定已經(jīng)降落在特定閾值下面,則推薦系統(tǒng)可以切換回提供基本上或僅基于與用戶約定有關(guān)的分量分?jǐn)?shù)的推薦。
[0158]有限度探查
[0159]根據(jù)一個(gè)實(shí)施例,隨著向用戶推薦視頻,捕獲用戶行為,并且該用戶行為用來(lái)更新由推薦系統(tǒng)使用的元數(shù)據(jù),如以上描述的那樣。然而,只要向用戶始終呈現(xiàn)“最佳”視頻推薦(例如,具有最高M(jìn)L分?jǐn)?shù)的視頻),就不能收集關(guān)于用戶如何對(duì)“非最佳”推薦反應(yīng)的行為數(shù)據(jù)。在不收集關(guān)于對(duì)非最佳推薦的用戶反應(yīng)的信息的情況下,當(dāng)未被推薦的視頻應(yīng)該被推薦時(shí),推薦系統(tǒng)將難以校正自身。
[0160]例如,假定視頻A對(duì)于視頻B的觀眾可能是很有興趣的。然而,在沒(méi)有對(duì)于視頻A的任何觀看歷史的情況下,機(jī)器學(xué)習(xí)引擎102對(duì)于視頻對(duì)A和B產(chǎn)生低ML分?jǐn)?shù)。由于低ML分?jǐn)?shù),視頻A可能不推薦給視頻B的觀眾,所以視頻B的很少觀眾可能觀看視頻A。因此,對(duì)于視頻對(duì)A和B的ML分?jǐn)?shù)可能保持很低。
[0161]為了避免這樣的問(wèn)題,定期地將非最佳推薦呈現(xiàn)給用戶,對(duì)于非最佳推薦可以收集行為數(shù)據(jù)。呈現(xiàn)非最佳推薦稱作“探查”,因?yàn)樗蛴脩舫尸F(xiàn)在視頻組外的推薦,該視頻組通??赡芟蛴脩舫尸F(xiàn)。然而,太多探查、或在錯(cuò)誤情況下的探查可能將用戶體驗(yàn)降級(jí)到不可接受的程度。
[0162]因此,根據(jù)一個(gè)實(shí)施例,推薦系統(tǒng)對(duì)探查施加約束條件。具體地,探查按如下方式進(jìn)行:有限度探查對(duì)視頻推薦目標(biāo)具有的不利影響。例如,推薦系統(tǒng)可以定期地將視頻的選擇隨機(jī)化以推薦給用戶。然而,可以約束隨機(jī)選擇,其中從進(jìn)行隨機(jī)選擇的池中排除那些不利影響預(yù)計(jì)在一定閾值以上的任何視頻。
[0163]例如,在探查期間,進(jìn)行隨機(jī)選擇的視頻池可能只包括這樣的視頻,這些視頻相對(duì)于比較視頻具有高于某一閾值X的CF分?jǐn)?shù)、或高于某一閾值Y的CBF分?jǐn)?shù)、或高于某一閾值Z的ML分?jǐn)?shù)。置于視頻選擇池上的專(zhuān)門(mén)約束規(guī)則可能是任意復(fù)雜的。例如,如果(對(duì)于任何衰減因數(shù)的CF分?jǐn)?shù)>X)或者(ML分量分?jǐn)?shù)的任一個(gè)>Y)并且(合成ML分?jǐn)?shù)>Ζ),則視頻可能具有進(jìn)入選擇池的資格。
[0164]根據(jù)一個(gè)實(shí)施例,多臂老虎機(jī)(mult1-armed bandit)技術(shù)由視頻推薦用來(lái)學(xué)習(xí)在探查選擇過(guò)程中的每個(gè)變量對(duì)當(dāng)前目標(biāo)的實(shí)現(xiàn)具有的影響,并且調(diào)整預(yù)測(cè)具有最小不利影響的變量。例如,關(guān)于ε -貪婪策略(epsilon-greedy strategy),對(duì)于嘗試的比例1- ε選擇由ML系統(tǒng)(最好杠桿)推薦的視頻,并且對(duì)于比例ε選擇(以均勻概率)屬于其它池(高于某一閾值的隨機(jī)、趨勢(shì)CBF分?jǐn)?shù))的視頻。典型參數(shù)值可能是ε =0.1,但這可依據(jù)環(huán)境和偏好大大地變化。
[0165]運(yùn)行時(shí)間性能增強(qiáng)
[0166]當(dāng)使用這里描述的技術(shù)提供視頻推薦時(shí),可以使用各種運(yùn)行時(shí)間性能增強(qiáng)。例如,一些實(shí)施例當(dāng)將用戶點(diǎn)擊數(shù)據(jù)(非常小)與特征(比較龐大)聯(lián)合以產(chǎn)生到機(jī)器學(xué)習(xí)系統(tǒng)的訓(xùn)練輸入時(shí),可以使用bloom過(guò)濾器。具體地,在一個(gè)實(shí)施例中,使用用戶點(diǎn)擊數(shù)據(jù)建立bloom過(guò)濾器,并且過(guò)濾器用來(lái)濾除全部不相關(guān)的CF和CBF特征,這些不相關(guān)的CF和CBF特征沒(méi)有與它們相關(guān)聯(lián)的點(diǎn)擊數(shù)據(jù)。這對(duì)于諸如hadoop之類(lèi)的數(shù)據(jù)處理系統(tǒng)特別有用,在這些數(shù)據(jù)處理系統(tǒng)中,對(duì)于各種表不建立索引。
[0167]視頻推薦系統(tǒng)可以使用的另一種運(yùn)行時(shí)間增強(qiáng)涉及非對(duì)稱聯(lián)合。具體地,當(dāng)聯(lián)合CBF特征和CF特征時(shí),非對(duì)稱聯(lián)合可以利用如下事實(shí):對(duì)于新內(nèi)容,存在有限的行為數(shù)據(jù)。在一個(gè)實(shí)施例中,將特征依據(jù)它們產(chǎn)生的時(shí)間組織在不同的存儲(chǔ)桶中。推薦系統(tǒng)只將CBF特征與在最后幾個(gè)小時(shí)產(chǎn)生的CF特征相聯(lián)合。這顯著地減小為機(jī)器學(xué)習(xí)系統(tǒng)產(chǎn)生訓(xùn)練和試驗(yàn)數(shù)據(jù)所需要的時(shí)間。
[0168]硬件概要
[0169]根據(jù)一個(gè)實(shí)施例,這里描述的技術(shù)由一個(gè)或多個(gè)專(zhuān)用計(jì)算裝置實(shí)施。專(zhuān)用計(jì)算裝置可以硬-連線以執(zhí)行各技術(shù);或者可以包括數(shù)字電子裝置,如一個(gè)或多個(gè)應(yīng)用程序-專(zhuān)門(mén)集成電路(ASIC)或現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA),這些數(shù)字電子裝置不變地編程以執(zhí)行各技術(shù);或者可以包括一個(gè)或多個(gè)通用硬件處理器,這些通用硬件處理器編程成,按照在固件、存儲(chǔ)器、其它存儲(chǔ)裝置、或組合中的程序指令執(zhí)行各技術(shù)。這樣的專(zhuān)用計(jì)算裝置也可以將定制硬-連線邏輯裝置、ASIC或FPGA與定制編程組合以完成各技術(shù)。專(zhuān)用計(jì)算裝置可以是臺(tái)式計(jì)算機(jī)系統(tǒng)、可攜帶計(jì)算機(jī)系統(tǒng)、手持裝置、聯(lián)網(wǎng)裝置或任何其它裝置,該其它裝置包括硬-連線和/或程序邏輯裝置以實(shí)施各技術(shù)。
[0170]例如,圖5是方塊圖,方塊圖表明計(jì)算機(jī)系統(tǒng)500,在該計(jì)算機(jī)系統(tǒng)500上可以實(shí)施本發(fā)明的實(shí)施例。計(jì)算機(jī)系統(tǒng)500包括用來(lái)通信信息的總線502或其它通信機(jī)構(gòu)、和硬件處理器504,該硬件處理器504與總線502相聯(lián)接用來(lái)處理信息。硬件處理器504可以是例如通用微處理器。
[0171]計(jì)算機(jī)系統(tǒng)500也包括主存儲(chǔ)器506,如隨機(jī)存取存儲(chǔ)器(RAM)或其它動(dòng)態(tài)存儲(chǔ)裝置,該主存儲(chǔ)器506聯(lián)接到總線502上,用來(lái)存儲(chǔ)信息和待由處理器504執(zhí)行的指令。主存儲(chǔ)器506也可以在待由處理器504執(zhí)行的指令的執(zhí)行期間,用來(lái)存儲(chǔ)臨時(shí)變量或其它中間信息。這樣的指令當(dāng)存儲(chǔ)在對(duì)于處理器504可訪問(wèn)的非暫時(shí)存儲(chǔ)介質(zhì)中時(shí)使計(jì)算機(jī)系統(tǒng)500變成專(zhuān)用機(jī)器,該專(zhuān)用機(jī)器定制成,執(zhí)行在指令中規(guī)定的操作。
[0172]計(jì)算機(jī)系統(tǒng)500還包括只讀存儲(chǔ)器(ROM) 508或其它靜態(tài)存儲(chǔ)裝置,該只讀存儲(chǔ)器(ROM) 508或其它靜態(tài)存儲(chǔ)裝置聯(lián)接到總線502上,用來(lái)存儲(chǔ)用于處理器504的靜態(tài)信息和指令。提供諸如磁盤(pán)或光盤(pán)之類(lèi)的存儲(chǔ)裝置510,并且聯(lián)接到總線502上用來(lái)存儲(chǔ)信息和指令。
[0173]計(jì)算機(jī)系統(tǒng)500可以經(jīng)總線502聯(lián)接到顯示器512上,如聯(lián)接到陰極射線管(CRT)上,用來(lái)向計(jì)算機(jī)用戶顯示信息。包括字母數(shù)字和其它鍵的輸入裝置514聯(lián)接到總線502上,用來(lái)將信息和命令選擇通信到處理器504。另一種類(lèi)型的用戶輸入裝置是光標(biāo)控制裝置516,如鼠標(biāo)、跟蹤球、或光標(biāo)方向鍵,用來(lái)將方向信息和命令選擇通信到處理器504,并且用來(lái)控制在顯示器512上的光標(biāo)運(yùn)動(dòng)。這種輸入裝置典型地在兩根軸-第一軸(例如X)和第二軸(例如y),中具有兩個(gè)自由度,這允許裝置指定在平面中的位置。
[0174]計(jì)算機(jī)系統(tǒng)500可以使用定制硬-連線邏輯裝置、一個(gè)或多個(gè)ASIC或FPGA、固件及/或程序邏輯裝置實(shí)施這里描述的技術(shù),該程序邏輯裝置與計(jì)算機(jī)系統(tǒng)相組合使計(jì)算機(jī)系統(tǒng)500是或?qū)⑵渚幊虨閷?zhuān)用機(jī)器。根據(jù)一個(gè)實(shí)施例,這里的技術(shù)由計(jì)算機(jī)系統(tǒng)500響應(yīng)處理器504而執(zhí)行,該處理器504執(zhí)行在主存儲(chǔ)器506中包含的一個(gè)或多個(gè)指令的一個(gè)或多個(gè)序列。這樣的指令可以從另一種存儲(chǔ)介質(zhì),如存儲(chǔ)裝置510,讀取到主存儲(chǔ)器506中。在主存儲(chǔ)器506中包含的指令序列的執(zhí)行使處理器504執(zhí)行在這里描述的過(guò)程步驟。在可選擇實(shí)施例中,硬-連線電路可以用來(lái)代替軟件指令或者與它們組合。
[0175]這里所使用的術(shù)語(yǔ)“存儲(chǔ)介質(zhì)”是指任何非暫時(shí)介質(zhì),這些非暫時(shí)介質(zhì)存儲(chǔ)數(shù)據(jù)和/或指令,這些數(shù)據(jù)和/或指令使機(jī)器按特定方式操作。這樣的存儲(chǔ)介質(zhì)可以包括非易失介質(zhì)和/或易失介質(zhì)。非易失介質(zhì)包括例如光盤(pán)或磁盤(pán),如存儲(chǔ)裝置510。易失介質(zhì)包括動(dòng)態(tài)存儲(chǔ)器,如主存儲(chǔ)器506。普通形式的存儲(chǔ)介質(zhì)包括例如軟盤(pán)、柔性盤(pán)、硬盤(pán)、固態(tài)驅(qū)動(dòng)器、磁帶、或任何其它磁性數(shù)據(jù)存儲(chǔ)介質(zhì)、CD-ROM、任何其它光學(xué)數(shù)據(jù)存儲(chǔ)介質(zhì)、具有孔的模式的任何物理介質(zhì)、RAM、PROM、及EPROM、FLASH-EPROM、NVRAM、任何其它存儲(chǔ)器芯片或盒。
[0176]存儲(chǔ)介質(zhì)與傳輸介質(zhì)不同,但可以與傳輸介質(zhì)一起使用。傳輸介質(zhì)參與在存儲(chǔ)介質(zhì)之間傳送信息。例如,傳輸介質(zhì)包括同軸電纜、銅導(dǎo)線及光學(xué)纖維,包括導(dǎo)線,這些導(dǎo)線包括總線502。傳輸介質(zhì)也可采取聲波或光波的形式,如在無(wú)線電波和紅外數(shù)據(jù)通信期間產(chǎn)生的那些波。
[0177]為了執(zhí)行將一個(gè)或多個(gè)指令的一個(gè)或多個(gè)序列傳送到處理器504時(shí),可能涉及各種形式的介質(zhì)。例如,指令可能初始攜帶在遠(yuǎn)程計(jì)算機(jī)的磁盤(pán)或固態(tài)驅(qū)動(dòng)器上。遠(yuǎn)程計(jì)算機(jī)可將指令加載到其動(dòng)態(tài)存儲(chǔ)器中,并且使用調(diào)制解調(diào)器在電話線上發(fā)送指令。計(jì)算機(jī)系統(tǒng)500的本地調(diào)制解調(diào)器可在電話線上接收數(shù)據(jù),并且使用紅外收發(fā)器將數(shù)據(jù)轉(zhuǎn)化成紅外信號(hào)。紅外檢測(cè)器可接收在紅外信號(hào)中攜帶的數(shù)據(jù),并且適當(dāng)電路可將數(shù)據(jù)放置在總線502上??偩€502將數(shù)據(jù)傳送到主存儲(chǔ)器506,處理器504從該主存儲(chǔ)器506中檢索指令并且執(zhí)行指令。主存儲(chǔ)器506接收的指令可以在由處理器504的執(zhí)行之前或之后選擇性地存儲(chǔ)在存儲(chǔ)裝置510上。
[0178]計(jì)算機(jī)系統(tǒng)500也包括聯(lián)接到總線502上的通信接口 518。通信接口 518提供聯(lián)接到網(wǎng)絡(luò)鏈路520上的雙向數(shù)據(jù)通信,該網(wǎng)絡(luò)鏈路520連接到本地網(wǎng)絡(luò)522上。例如,通信接口 518可以是集成服務(wù)數(shù)字網(wǎng)絡(luò)(ISDN)卡、有線調(diào)制解調(diào)器、衛(wèi)星調(diào)制解調(diào)器、或?qū)?shù)據(jù)通信連接提供給對(duì)應(yīng)類(lèi)型的電話線的調(diào)制解調(diào)器。作為另一個(gè)例子,通信接口 518可以是將數(shù)據(jù)通信連接提供給兼容LAN的局域網(wǎng)(LAN)卡。也可以實(shí)施無(wú)線鏈路。在任何這樣的實(shí)施中,通信接口 518發(fā)送和接收電信號(hào)、電磁信號(hào)或光學(xué)信號(hào),這些信號(hào)攜帶數(shù)字?jǐn)?shù)據(jù)流,這些數(shù)字?jǐn)?shù)據(jù)流代表各種類(lèi)型的信息。
[0179]網(wǎng)絡(luò)鏈路520典型地提供通過(guò)一個(gè)或多個(gè)網(wǎng)絡(luò)到其它數(shù)據(jù)裝置的數(shù)據(jù)通信。例如,網(wǎng)絡(luò)鏈路520可以提供通過(guò)本地網(wǎng)絡(luò)522到主計(jì)算機(jī)524、或到數(shù)據(jù)設(shè)備的連接,該數(shù)據(jù)設(shè)備由互聯(lián)網(wǎng)服務(wù)提供商(ISP)526操作。ISP 526又提供通過(guò)全世界包數(shù)據(jù)通信網(wǎng)絡(luò)的數(shù)據(jù)通信服務(wù),該全世界包數(shù)據(jù)通信網(wǎng)絡(luò)現(xiàn)在通常稱作“互聯(lián)網(wǎng)”528。本地網(wǎng)絡(luò)522和互聯(lián)網(wǎng)528兩者都使用攜帶數(shù)字?jǐn)?shù)據(jù)流的電信號(hào)、電磁信號(hào)或光學(xué)信號(hào)。通過(guò)網(wǎng)絡(luò)的信號(hào)和在網(wǎng)絡(luò)鏈路520上并通過(guò)通信接口 518的信號(hào)是傳輸介質(zhì)的示范形式,這些信號(hào)將數(shù)字?jǐn)?shù)據(jù)傳送到計(jì)算機(jī)系統(tǒng)500并且從其傳送數(shù)字?jǐn)?shù)據(jù)。
[0180]計(jì)算機(jī)系統(tǒng)500可通過(guò)網(wǎng)絡(luò)(一個(gè)或多個(gè))、網(wǎng)絡(luò)鏈路520及通信接口 518發(fā)送消息和接收數(shù)據(jù),包括程序代碼。在互聯(lián)網(wǎng)例子中,服務(wù)器530可能通過(guò)互聯(lián)網(wǎng)528、ISP 526、本地網(wǎng)絡(luò)522及通信接口 518傳輸對(duì)于應(yīng)用程序的要求代碼。
[0181]接收代碼隨著它被接收、和/或存儲(chǔ)在存儲(chǔ)裝置510、或用于以后執(zhí)行的其它非易失存儲(chǔ)裝置中,可以由處理器504執(zhí)行。
[0182]以上說(shuō)明書(shū)中,參照隨實(shí)施可能變化的多個(gè)具體細(xì)節(jié),已經(jīng)描述了本發(fā)明的實(shí)施例。說(shuō)明書(shū)和附圖相應(yīng)地要按說(shuō)明性而不是限制性意義對(duì)待。本發(fā)明的范圍、和由本 申請(qǐng)人:打算是本發(fā)明的范圍的內(nèi)容的唯一和排它指示是權(quán)利要求組的文字和等效范圍,該范圍從本申請(qǐng)按這樣的權(quán)利要求發(fā)布的具體形式而發(fā)布,包括任何以后校正。
【權(quán)利要求】
1.一種方法,包括: 對(duì)于一組候選視頻中的每個(gè)視頻,通過(guò)將輸入饋送提供到機(jī)器學(xué)習(xí)引擎,產(chǎn)生多個(gè)機(jī)器學(xué)習(xí)(ML)分?jǐn)?shù); 其中對(duì)于候選視頻組中的一個(gè)特定視頻的輸入饋送至少包括: 一個(gè)或多個(gè)原始的協(xié)作過(guò)濾特征; 協(xié)作過(guò)濾分?jǐn)?shù),它基于所述一個(gè)或多個(gè)原始的協(xié)作過(guò)濾特征而產(chǎn)生; 一個(gè)或多個(gè)原始的基于內(nèi)容的過(guò)濾特征;及 基于內(nèi)容的過(guò)濾分?jǐn)?shù),它基于所述一個(gè)或多個(gè)原始的基于內(nèi)容的過(guò)濾特征而產(chǎn)生;當(dāng)產(chǎn)生對(duì)于所述特定視頻的ML分?jǐn)?shù)時(shí),機(jī)器學(xué)習(xí)引擎至少部分地基于所述一個(gè)或多個(gè)原始的協(xié)作過(guò)濾特征和所述一個(gè)或多個(gè)原始的基于內(nèi)容的過(guò)濾特征,來(lái)確定給予所述協(xié)作過(guò)濾分?jǐn)?shù)和所述基于內(nèi)容的過(guò)濾分?jǐn)?shù)的權(quán)重; 至少部分地基于ML分?jǐn)?shù),從候選視頻組中選擇一個(gè)或多個(gè)視頻以推薦給特定用戶; 其中所述方法由一個(gè)或多個(gè)計(jì)算裝置執(zhí)行。
2.根據(jù)權(quán)利要求1所述的方法,其中: 對(duì)于特定視頻的輸入饋送包括:用于視頻對(duì)的視頻對(duì)-中心度量,所述視頻對(duì)包括所述特定視頻和比較視頻; 所述一個(gè)或多個(gè)原始的協(xié)作過(guò)濾特征包括:用于所述視頻對(duì)的協(xié)作過(guò)濾度量;及 所述一個(gè)或多個(gè)原始的基于內(nèi)容的過(guò)濾特征包括:用于所述視頻對(duì)的基于內(nèi)容的過(guò)濾度量。
3.根據(jù)權(quán)利要求2所述的方法,其中所述視頻對(duì)的協(xié)作過(guò)濾度量?jī)H響應(yīng)于檢測(cè)到關(guān)于所述視頻對(duì)中的一個(gè)或多個(gè)視頻的用戶興趣的新指示而更新。
4.根據(jù)權(quán)利要求2所述的方法,其中所述視頻對(duì)的基于內(nèi)容的過(guò)濾度量?jī)H響應(yīng)于檢測(cè)到關(guān)于所述視頻對(duì)中的一個(gè)或多個(gè)視頻的視頻元數(shù)據(jù)的新變化而更新。
5.根據(jù)權(quán)利要求2所述的方法,其中: 視頻對(duì)的視頻對(duì)-中心度量包括:特定組的度量;并且 如果且僅如果所述視頻對(duì)滿足特定配對(duì)試驗(yàn),才為所述視頻對(duì)保持所述特定組的度量。
6.根據(jù)權(quán)利要求5所述的方法,其中所述特定組的度量包括:視頻對(duì)-中心度量的全部。
7.根據(jù)權(quán)利要求5所述的方法,其中所述特定組的度量?jī)H包括如下的一個(gè): 所述視頻對(duì)的協(xié)作過(guò)濾度量;和 所述視頻對(duì)的基于內(nèi)容的過(guò)濾度量。
8.根據(jù)權(quán)利要求7所述的方法,還包括使用與所述配對(duì)試驗(yàn)不同的第二配對(duì)試驗(yàn),來(lái)確定是否為所述視頻對(duì)保持如下的另一個(gè): 所述視頻對(duì)的協(xié)作過(guò)濾度量;和 所述視頻對(duì)的基于內(nèi)容的過(guò)濾度量。
9.根據(jù)權(quán)利要求1所述的方法,其中: 對(duì)于所述特定視頻的輸入饋送包括多個(gè)協(xié)作過(guò)濾分?jǐn)?shù);并且 所述多個(gè)協(xié)作過(guò)濾分?jǐn)?shù)的每個(gè)協(xié)作過(guò)濾分?jǐn)?shù)是基于相同的原始的協(xié)作過(guò)濾特征,但所述多個(gè)協(xié)作過(guò)濾分?jǐn)?shù)具有彼此不同的衰減因數(shù)。
10.根據(jù)權(quán)利要求1所述的方法,其中: 對(duì)于所述特定視頻產(chǎn)生的ML分?jǐn)?shù)是機(jī)器學(xué)習(xí)引擎為所述特定視頻產(chǎn)生的多個(gè)分量分?jǐn)?shù)之一;并且 所述方法還包括,基于目標(biāo)信息來(lái)組合多個(gè)分量分?jǐn)?shù),以對(duì)于所述特定視頻產(chǎn)生合成ML分?jǐn)?shù)。
11.根據(jù)權(quán)利要求1所述的方法,其中: 對(duì)于所述特定視頻產(chǎn)生的ML分?jǐn)?shù)是機(jī)器學(xué)習(xí)引擎為所述特定視頻產(chǎn)生的多個(gè)分量分?jǐn)?shù)之一;并且 所述方法還包括,交替使用所述多個(gè)分量分?jǐn)?shù)的某些分量分?jǐn)?shù),這些分量分?jǐn)?shù)被用作選擇哪些視頻要推薦給特定用戶的基礎(chǔ)。
12.—種方法,包括: 對(duì)于一組候選視頻中的每個(gè)視頻,通過(guò)將對(duì)應(yīng)輸入饋送提供到機(jī)器學(xué)習(xí)引擎,產(chǎn)生多個(gè)機(jī)器學(xué)習(xí)(ML)分?jǐn)?shù); 其中與所述候選視頻組中的一個(gè)特定視頻相對(duì)應(yīng)的輸入饋送包括多個(gè)參數(shù)值; 至少部分地基于ML分?jǐn)?shù),從所述候選視頻組中選擇一個(gè)或多個(gè)視頻以推薦給特定用戶; 其中為所述特定用戶的推薦而選擇的所述一個(gè)或多個(gè)視頻包括所述特定視頻; 對(duì)于所述特定視頻,基于機(jī)器學(xué)習(xí)引擎產(chǎn)生所述特定視頻的ML分?jǐn)?shù)時(shí)如何加權(quán)多個(gè)參數(shù)值,從多個(gè)可能推薦原因中確定推薦原因; 與所述特定視頻的推薦相關(guān)聯(lián)地,把關(guān)于所述推薦原因的說(shuō)明呈現(xiàn)給所述特定用戶; 其中所述方法由一個(gè)或多個(gè)計(jì)算裝置執(zhí)行。
13.—種方法,包括: 對(duì)于一組候選視頻中的每個(gè)視頻,通過(guò)將對(duì)應(yīng)輸入饋送提供到機(jī)器學(xué)習(xí)引擎,產(chǎn)生多個(gè)機(jī)器學(xué)習(xí)(ML)分?jǐn)?shù); 其中與所述候選視頻組中的一個(gè)特定視頻相對(duì)應(yīng)的輸入饋送包括多個(gè)參數(shù)值; 其中所述多個(gè)參數(shù)值包括第一組參數(shù)值和第二組參數(shù)值; 其中基于采用特定模型調(diào)諧參數(shù)的模型,來(lái)產(chǎn)生所述第一組參數(shù)值; 其中對(duì)關(guān)于所述特定模型調(diào)諧參數(shù)的多個(gè)模型調(diào)諧參數(shù)值的每個(gè)模型調(diào)諧參數(shù)值,所述第一組參數(shù)值包括至少一個(gè)參數(shù)值,該至少一個(gè)參數(shù)值是基于所述模型調(diào)諧參數(shù)值;其中所述第二組參數(shù)值包括獨(dú)立于所述模型調(diào)諧參數(shù)的一個(gè)或多個(gè)參數(shù)值; 其中,當(dāng)產(chǎn)生所述特定視頻的ML分?jǐn)?shù)時(shí),機(jī)器學(xué)習(xí)引擎至少部分地基于所述第二組參數(shù)值中的參數(shù)值,確定將多大權(quán)重給予所述第一組參數(shù)值中的每個(gè)參數(shù)值;及 至少部分地基于ML分?jǐn)?shù),從所述候選視頻組中選擇一個(gè)或多個(gè)視頻以推薦給特定用戶; 其中所述方法由一個(gè)或多個(gè)計(jì)算裝置執(zhí)行。
14.根據(jù)權(quán)利要求13所述的方法,其中所述特定模型調(diào)諧參數(shù)是由所述模型使用的衰減因數(shù)。
15.根據(jù)權(quán)利要求13所述的方法,其中所述特定模型調(diào)諧參數(shù)是由所述模型使用的機(jī)率-比值截止。
16.根據(jù)權(quán)利要求13所述的方法,其中所述特定模型調(diào)諧參數(shù)是由所述模型使用的標(biāo)準(zhǔn)化因數(shù)。
17.根據(jù)權(quán)利要求13所述的方法,其中: 所述模型使用多個(gè)模型調(diào)諧參數(shù);并且 在第一組參數(shù)值中的每個(gè)參數(shù)值是基于所述多個(gè)模型調(diào)諧參數(shù)中的模型調(diào)諧參數(shù)值的不同組合。
18.根據(jù)權(quán)利要求1所述的方法,還包括: 基于行為數(shù)據(jù)建立bloom過(guò)濾器,該行為數(shù)據(jù)指示用戶最近與之互動(dòng)的視頻;和 通過(guò)使用bloom過(guò)濾器,濾除與用戶最近與之互動(dòng)的所述視頻不相關(guān)的協(xié)作過(guò)濾特征和基于內(nèi)容的過(guò)濾特征,以產(chǎn)生用于機(jī)器學(xué)習(xí)系統(tǒng)的訓(xùn)練輸入。
19.根據(jù)權(quán)利要求1所述的方法,還包括進(jìn)行基于內(nèi)容的過(guò)濾特征與協(xié)作過(guò)濾特征的非對(duì)稱聯(lián)合,從而僅將基于內(nèi)容的過(guò)濾特征與在一個(gè)閾值時(shí)間段內(nèi)產(chǎn)生的協(xié)作過(guò)濾特征相聯(lián)合。
20.根據(jù)權(quán)利要求1所述的方法,還包括:通過(guò)至少部分地基于ML分?jǐn)?shù)將候選視頻組合到池中,以及使用多臂老虎機(jī)技術(shù)從池中選擇待推薦的視頻,來(lái)進(jìn)行有限度的探查。
21.根據(jù)權(quán)利要求20所述的方法,其中所述多臂老虎機(jī)技術(shù)涉及epsilon-貪婪策略。
22.—種或多種非暫態(tài)計(jì)算機(jī)可讀介質(zhì),存儲(chǔ)指令,這些指令當(dāng)由一個(gè)或多個(gè)處理器執(zhí)行時(shí),引起權(quán)利要求1-21任一項(xiàng)所述的方法的執(zhí)行。
23.—種系統(tǒng),包括一個(gè)或多個(gè)計(jì)算裝置,該一個(gè)或多個(gè)計(jì)算裝置配置成,引起在權(quán)利要求1-21任一項(xiàng)中敘述的方法的執(zhí)行。
【文檔編號(hào)】H04N21/45GK104247441SQ201380017911
【公開(kāi)日】2014年12月24日 申請(qǐng)日期:2013年2月21日 優(yōu)先權(quán)日:2012年2月21日
【發(fā)明者】徐智晨, S·阿布厄海伽, 黃磊, N·霍弗恩 申請(qǐng)人:歐亞拉股份有限公司