推薦視頻資源的方法及系統(tǒng)的制作方法
【專(zhuān)利摘要】本發(fā)明提供了一種推薦視頻資源的方法及系統(tǒng),包括:收集各用戶(hù)觀(guān)看視頻過(guò)程中的歷史記錄;對(duì)收集到的各用戶(hù)的歷史記錄進(jìn)行統(tǒng)計(jì),根據(jù)所述觀(guān)看視頻的時(shí)間信息計(jì)算每一用戶(hù)在各時(shí)段內(nèi)觀(guān)看視頻的觀(guān)看數(shù)量占比或觀(guān)看時(shí)長(zhǎng)占比,并將該用戶(hù)歸入數(shù)量占比或時(shí)長(zhǎng)占比大于組閾值的特定時(shí)段所對(duì)應(yīng)的用戶(hù)組,生成各特定時(shí)段對(duì)應(yīng)包括典型用戶(hù)的用戶(hù)組;分別獲取各特定時(shí)段的用戶(hù)組內(nèi)典型用戶(hù)在其他維度上的數(shù)據(jù)特征,確定各特定時(shí)段的用戶(hù)在其他維度上的組特征;如果是,則將該用戶(hù)加入該特定時(shí)段的用戶(hù)組;根據(jù)各用戶(hù)組所對(duì)應(yīng)的特定時(shí)段信息,向用戶(hù)組內(nèi)的用戶(hù)推薦對(duì)應(yīng)的視頻資源。通過(guò)本發(fā)明,在用戶(hù)觀(guān)看視頻時(shí)可以有針對(duì)性的進(jìn)行內(nèi)容推薦,提高推薦效果。
【專(zhuān)利說(shuō)明】推薦視頻資源的方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及智能電視【技術(shù)領(lǐng)域】,特別是涉及推薦視頻資源的方法及系統(tǒng)。
【背景技術(shù)】
[0002]隨著手機(jī)和平板電腦的大面積智能化,智能電視也正逐步進(jìn)入我們的生活。智能電視像智能手機(jī)一樣,具有全開(kāi)放式平臺(tái),搭載了操作系統(tǒng),可以由用戶(hù)自行安裝和卸載軟件、游戲等程序,這類(lèi)程序可能是智能電視生產(chǎn)商提供的,還可能是第三方服務(wù)商提供的,通過(guò)此類(lèi)程序可以不斷對(duì)智能電視的功能進(jìn)行擴(kuò)充。另外,還可以通過(guò)網(wǎng)線(xiàn)、無(wú)線(xiàn)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)上網(wǎng)沖浪等。即,真正的智能電視能從網(wǎng)絡(luò)、AV設(shè)備、PC等多種渠道獲得節(jié)目?jī)?nèi)容,通過(guò)簡(jiǎn)單易用的整合式操作界面,簡(jiǎn)易操作即可將消費(fèi)者最需要的內(nèi)容在大屏幕上清晰地展現(xiàn)。
[0003]目前,用戶(hù)從智能電視獲取資源的方式一般只有兩種。一種是最傳統(tǒng)的方式,也即用戶(hù)自己通過(guò)智能電視界面中提供的各種訪(fǎng)問(wèn)入口,主動(dòng)選擇信息源之后進(jìn)行點(diǎn)擊觀(guān)看。例如,用戶(hù)可以選擇觀(guān)看傳統(tǒng)的電視信號(hào)源,或者智能電視服務(wù)器提供的輪播頻道中的節(jié)目,等等。另一種是服務(wù)器向用戶(hù)推送一些推薦信息,例如將最近的熱門(mén)視頻推送給用戶(hù),用戶(hù)進(jìn)行被動(dòng)的接收。
[0004]通過(guò)向用戶(hù)推送一些視頻的方式,使得用戶(hù)可以通過(guò)智能電視獲得更豐富的信息。但是,現(xiàn)有技術(shù)在進(jìn)行視頻信息的推送時(shí),主要考慮的是視頻的熱門(mén)程度等信息,推送給用戶(hù)之后,多數(shù)用戶(hù)可能對(duì)其并不感興趣,進(jìn)而被用戶(hù)忽略,浪費(fèi)了推送過(guò)程所耗費(fèi)的系統(tǒng)及網(wǎng)絡(luò)資源。
[0005]因此,迫切需要本領(lǐng)域技術(shù)人員解決的技術(shù)問(wèn)題就在于,在向用戶(hù)推送視頻信息的過(guò)程中,如何使得推薦的有效性得到提高。
【發(fā)明內(nèi)容】
[0006]針對(duì)現(xiàn)有技術(shù)中存在的缺陷,本發(fā)明提供一種推薦視頻資源的方法及系統(tǒng)。
[0007]—種推薦視頻資源的方法,包括:收集各用戶(hù)觀(guān)看視頻過(guò)程中的歷史記錄;所述歷史記錄包括觀(guān)看視頻的時(shí)間信息,以及至少一種其他維度上的數(shù)據(jù);對(duì)收集到的各用戶(hù)的歷史記錄進(jìn)行統(tǒng)計(jì),根據(jù)所述觀(guān)看視頻的時(shí)間信息計(jì)算每一用戶(hù)在各時(shí)段內(nèi)觀(guān)看視頻的觀(guān)看數(shù)量占比或觀(guān)看時(shí)長(zhǎng)占比,并將該用戶(hù)歸入數(shù)量占比或時(shí)長(zhǎng)占比大于組閾值的特定時(shí)段所對(duì)應(yīng)的用戶(hù)組,該用戶(hù)定義為典型用戶(hù),生成各特定時(shí)段對(duì)應(yīng)的包括典型用戶(hù)的用戶(hù)組;分別獲取各特定時(shí)段的用戶(hù)組內(nèi)典型用戶(hù)在其他維度上的數(shù)據(jù)特征,確定各特定時(shí)段的用戶(hù)在其他維度上的組特征;判斷典型用戶(hù)外的其他用戶(hù)在其他維度上的數(shù)據(jù)特征,是否滿(mǎn)足某特定時(shí)段組的組特征,如果是,則將該用戶(hù)加入該特定時(shí)段的用戶(hù)組;根據(jù)各用戶(hù)組所對(duì)應(yīng)的特定時(shí)段信息,向用戶(hù)組內(nèi)的用戶(hù)推薦對(duì)應(yīng)的視頻資源。
[0008]可選地,所述至少一種其他維度上的數(shù)據(jù)包括,用戶(hù)觀(guān)看視頻的名稱(chēng)、用戶(hù)進(jìn)行搜索的記錄和搜索內(nèi)容、和用戶(hù)對(duì)推薦類(lèi)的消息的點(diǎn)擊記錄。[0009]可選地,所述收集各用戶(hù)觀(guān)看視頻過(guò)程中的歷史記錄包括:當(dāng)用戶(hù)觀(guān)看視頻的時(shí)長(zhǎng)大于第一下限值時(shí),記錄其歷史記錄。
[0010]可選地,所述組閾值包括數(shù)量占比組閾值或時(shí)長(zhǎng)占比組閾值。
[0011]可選地,計(jì)算典型用戶(hù)外的其他用戶(hù)各觀(guān)看時(shí)段的數(shù)量占比,判斷該數(shù)量占比是否大于等于對(duì)應(yīng)組的數(shù)量占比組閾值,若大于等于對(duì)應(yīng)的數(shù)量占比組閾值則將其劃入該組;若小于各分組的數(shù)量占比組閾值,則獲得該用戶(hù)在其他維度上的數(shù)據(jù)特征。
[0012]可選地,計(jì)算典型用戶(hù)外的其他用戶(hù)各觀(guān)看時(shí)段的時(shí)長(zhǎng)占比,判斷該時(shí)長(zhǎng)占比是否大于等于對(duì)應(yīng)組的時(shí)長(zhǎng)占比組閾值,若大于等于對(duì)應(yīng)的時(shí)長(zhǎng)占比組閾值則將其劃入該組;若小于各分組的時(shí)長(zhǎng)占比組閾值,則獲得該用戶(hù)在其他維度上的數(shù)據(jù)特征。
[0013]可選地,對(duì)于歷史記錄條數(shù)大于第二下限值的用戶(hù)進(jìn)行統(tǒng)計(jì)分組,對(duì)于分組后的用戶(hù)在每增加一定條數(shù)的記錄后重新對(duì)該用戶(hù)進(jìn)行統(tǒng)計(jì)分組。
[0014]一種推薦視頻資源的系統(tǒng),包括:歷史記錄獲取模塊,用于收集各用戶(hù)觀(guān)看視頻過(guò)程中的歷史記錄;所述歷史記錄包括觀(guān)看視頻的時(shí)間信息,以及至少一種其他維度上的數(shù)據(jù);典型用戶(hù)選取劃分模塊,用于對(duì)收集到的各用戶(hù)的歷史記錄進(jìn)行統(tǒng)計(jì),根據(jù)所述觀(guān)看視頻的時(shí)間信息計(jì)算每一用戶(hù)在各時(shí)段內(nèi)觀(guān)看視頻的觀(guān)看數(shù)量占比或觀(guān)看時(shí)長(zhǎng)占比,并將該用戶(hù)歸入數(shù)量占比或時(shí)長(zhǎng)占比大于組閾值的特定時(shí)段所對(duì)應(yīng)的用戶(hù)組,該用戶(hù)定義為典型用戶(hù),生成各特定時(shí)段對(duì)應(yīng)包括典型用戶(hù)的用戶(hù)組;模型訓(xùn)練模塊,用于分別獲取各特定時(shí)段的用戶(hù)組內(nèi)典型用戶(hù)在其他維度上的數(shù)據(jù)特征,確定各特定時(shí)段的用戶(hù)在其他維度上的組特征;用戶(hù)分組模塊,用于判斷典型用戶(hù)外的其他用戶(hù)在其他維度上的數(shù)據(jù)特征,是否滿(mǎn)足某特定時(shí)段組的組特征,如果是,則將該用戶(hù)加入該特定時(shí)段的用戶(hù)組;視頻推薦模塊,用于根據(jù)各用戶(hù)組所對(duì)應(yīng)的特定時(shí)段信息,向用戶(hù)組內(nèi)的用戶(hù)推薦對(duì)應(yīng)的視頻資源。
[0015]可選地,所述至少一種其他維度上的數(shù)據(jù)包括,用戶(hù)觀(guān)看視頻的名稱(chēng)、用戶(hù)進(jìn)行搜索的記錄和搜索內(nèi)容、和用戶(hù)對(duì)推薦類(lèi)的消息的點(diǎn)擊次數(shù)。
[0016]可選地,所述組閾值包括數(shù)量占比組閾值或時(shí)長(zhǎng)占比組閾值。
[0017]可選地,第一判斷模塊,用于計(jì)算典型用戶(hù)外的其他用戶(hù)各觀(guān)看時(shí)段的數(shù)量占比,判斷該數(shù)量占比是否大于等于對(duì)應(yīng)組的數(shù)量占比組閾值,若大于等于對(duì)應(yīng)的數(shù)量占比組閾值則將其劃入該組;若小于各分組的數(shù)量占比組閾值,則觸發(fā)所述用戶(hù)分組模塊執(zhí)行判斷在其他維度上的數(shù)據(jù)特征的操作;
或者第二判斷模塊,用于計(jì)算典型用戶(hù)外的其他用戶(hù)各觀(guān)看時(shí)段的時(shí)長(zhǎng)占比,判斷該時(shí)長(zhǎng)占比是否大于等于對(duì)應(yīng)組的時(shí)長(zhǎng)占比組閾值,若大于等于對(duì)應(yīng)的時(shí)長(zhǎng)占比組閾值則將其劃入該組;若小于各分組的時(shí)長(zhǎng)占比組閾值,則觸發(fā)所述用戶(hù)分組模塊執(zhí)行判斷在其他維度上的數(shù)據(jù)特征的操作。
[0018]與現(xiàn)有技術(shù)相比,上述技術(shù)方案具有以下優(yōu)點(diǎn)或有益效果:通過(guò)統(tǒng)計(jì)用戶(hù)觀(guān)看視頻的歷史數(shù)據(jù),可以判定該用戶(hù)屬于何種觀(guān)影時(shí)段類(lèi)型,通過(guò)統(tǒng)計(jì)用戶(hù)數(shù)據(jù)在不同角度上的數(shù)據(jù)分布,能夠較為準(zhǔn)確的實(shí)現(xiàn)對(duì)用戶(hù)所屬時(shí)段類(lèi)別的分組,這樣在用戶(hù)觀(guān)看視頻時(shí)就可以有針對(duì)性的進(jìn)行內(nèi)容推薦,提高了推薦效果。
[0019]【專(zhuān)利附圖】
【附圖說(shuō)明】
通過(guò)閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:
圖1是本發(fā)明實(shí)施例提供的視頻推薦方法流程圖。
[0020]圖2是本發(fā)明實(shí)施例提供的視頻推薦系統(tǒng)示意圖。
【具體實(shí)施方式】
[0021]下面結(jié)合附圖,進(jìn)一步闡述本發(fā)明。應(yīng)理解,這些實(shí)施例僅用于說(shuō)明本發(fā)明而不用于限制本發(fā)明的范圍。此外應(yīng)理解,在閱讀了本發(fā)明講授的內(nèi)容之后,本領(lǐng)域技術(shù)人員可以對(duì)本發(fā)明作各種改動(dòng)或修改,這些等價(jià)形式同樣落于本申請(qǐng)所附權(quán)利要求書(shū)所限定的范圍。
[0022]本發(fā)明的智能電視系統(tǒng)包括客戶(hù)端和服務(wù)器,用戶(hù)通過(guò)客戶(hù)端登陸特定賬號(hào)后可以訪(fǎng)問(wèn)服務(wù)器上的各種視頻資源,客戶(hù)端可以是運(yùn)行在智能電視終端的應(yīng)用程序,通過(guò)終端設(shè)備用戶(hù)可以收看服務(wù)器上的視頻資源。服務(wù)器保存有各賬號(hào)的觀(guān)看歷史記錄,通過(guò)對(duì)觀(guān)看歷史記錄的分析向不同用戶(hù)推薦其感興趣的視頻資源。下面通過(guò)具體的實(shí)施例對(duì)本發(fā)明做進(jìn)一步介紹。
[0023]實(shí)施例1
如圖1所示,本發(fā)明實(shí)施例首先提供一種推薦視頻資源的方法。在視頻觀(guān)看過(guò)程中由于每個(gè)人的觀(guān)看習(xí)慣、個(gè)人喜好不同,例如,有些用戶(hù)習(xí)慣在早上觀(guān)看、有些用戶(hù)習(xí)慣在中午觀(guān)看,有些用戶(hù)習(xí)慣晚上觀(guān)看等等,即用戶(hù)習(xí)慣的觀(guān)看時(shí)段不同,本發(fā)明實(shí)施例會(huì)記錄與這些觀(guān)看習(xí)慣相關(guān)的用戶(hù)的一些觀(guān)看記錄,收集到的觀(guān)看記錄可以稱(chēng)為歷史記錄,歷史記錄可以是由客戶(hù)端進(jìn)行收集,然后上傳到服務(wù)器,這樣,服務(wù)器就可以獲取到各個(gè)客戶(hù)端的歷史觀(guān)看記錄。其中,客戶(hù)端可以采用實(shí)時(shí)上傳的方式,或者采用定期上傳(例如,每周上傳一次),或者定量上傳(例如,每記錄IOM的數(shù)據(jù)上傳一次),等等。歷史記錄中包括各用戶(hù)觀(guān)看視頻的時(shí)間信息,時(shí)間信息包括用戶(hù)觀(guān)看視頻的時(shí)段、各時(shí)段內(nèi)觀(guān)看視頻的時(shí)長(zhǎng)等。通過(guò)對(duì)歷史記錄的統(tǒng)計(jì)可以發(fā)現(xiàn),各用戶(hù)習(xí)慣的觀(guān)看時(shí)段和在各時(shí)段內(nèi)的觀(guān)看時(shí)長(zhǎng)是不同的,某些用戶(hù)的歷史觀(guān)看記錄中能夠明顯的體現(xiàn)出用戶(hù)在某一時(shí)段觀(guān)看視頻的數(shù)量占比或時(shí)長(zhǎng)占比顯著高于其他時(shí)段,這些用戶(hù)可以被稱(chēng)為典型用戶(hù),可以據(jù)此將典型用戶(hù)劃分到不同時(shí)段的用戶(hù)組中。
[0024]用戶(hù)組可以分為早上觀(guān)影組(對(duì)應(yīng)時(shí)段可以為6:00-8:00)、中午觀(guān)影組(對(duì)應(yīng)時(shí)段可以為11:00-14:00)、晚上觀(guān)影組(對(duì)應(yīng)時(shí)段可以為18:00-23:00)等。當(dāng)然對(duì)于用戶(hù)的分組并非局限于此,還可以對(duì)用戶(hù)進(jìn)行更多的分組,例如將6:00-9:00時(shí)段觀(guān)看的用戶(hù)組稱(chēng)為早上觀(guān)影組,9:00-11:00時(shí)段觀(guān)看的用戶(hù)組稱(chēng)為上午觀(guān)影組,11:00-14:00時(shí)段觀(guān)看的用戶(hù)組稱(chēng)為中午觀(guān)影組,14:00-18:00時(shí)段觀(guān)看的用戶(hù)組稱(chēng)為下午觀(guān)影組,18 =00-23:00時(shí)段觀(guān)看的用戶(hù)組稱(chēng)為晚上觀(guān)影組,23:00-6:00時(shí)段觀(guān)看的用戶(hù)組稱(chēng)為午夜觀(guān)影組。具體各分組所屬的時(shí)段、分組的類(lèi)型可以動(dòng)態(tài)調(diào)整,以上舉例并非意在限制對(duì)用戶(hù)組的劃分。
[0025]除典型用戶(hù)外的其他用戶(hù)的歷史記錄中可能無(wú)法直接從觀(guān)看時(shí)段的數(shù)量占比或時(shí)長(zhǎng)占比方面體現(xiàn)出某一用戶(hù)組的顯著性,此時(shí),如何確定這些用戶(hù)所屬的用戶(hù)組,則成為重點(diǎn)需要解決的問(wèn)題。下面具體介紹用戶(hù)劃分的過(guò)程。
[0026]SlOl:收集各用戶(hù)觀(guān)看視頻過(guò)程中的歷史記錄;所述歷史記錄包括觀(guān)看視頻的時(shí)間信息,以及至少一種其他維度上的數(shù)據(jù); 為了能對(duì)眾多用戶(hù)進(jìn)行劃分,首先需要記錄用戶(hù)的觀(guān)看歷史記錄。具體實(shí)現(xiàn)時(shí),用戶(hù)可以輸入預(yù)先獲得的賬號(hào)信息,服務(wù)器可以接收賬號(hào)信息,判斷賬號(hào)信息的合法性,當(dāng)賬號(hào)信息合法時(shí)收集該賬號(hào)所對(duì)應(yīng)的包括用戶(hù)觀(guān)看視頻的觀(guān)看時(shí)段和觀(guān)看時(shí)長(zhǎng)的歷史記錄。其中,具體實(shí)現(xiàn)時(shí),用戶(hù)可以通過(guò)掃描二維碼,輸入用戶(hù)ID、密碼,等方式登陸服務(wù)器。關(guān)于用戶(hù)的觀(guān)看歷史記錄,可以是由客戶(hù)端進(jìn)行收集,然后上傳到服務(wù)器,這樣,服務(wù)器就可以獲取到各個(gè)客戶(hù)端的歷史觀(guān)看記錄。其中,客戶(hù)端可以采用實(shí)時(shí)上傳的方式,或者采用定期上傳(例如,每周上傳一次),或者定量上傳(例如,每記錄IOM的數(shù)據(jù)上傳一次),等等。
[0027]其中,除觀(guān)看時(shí)間信息外,歷史記錄還可以包括用戶(hù)觀(guān)看的視頻類(lèi)型(用于統(tǒng)計(jì)用戶(hù)觀(guān)看類(lèi)型的分布)、視頻名稱(chēng)(用于統(tǒng)計(jì)用戶(hù)觀(guān)看同一視頻的次數(shù))、用戶(hù)進(jìn)行搜索的記錄和搜索內(nèi)容(用于統(tǒng)計(jì)用戶(hù)進(jìn)行搜索的次數(shù)和搜索的類(lèi)型分布)、用戶(hù)使用應(yīng)用的記錄和應(yīng)用的類(lèi)型(用于統(tǒng)計(jì)用戶(hù)使用應(yīng)用的次數(shù)和應(yīng)用的類(lèi)型分布)、用戶(hù)對(duì)推薦類(lèi)的消息的點(diǎn)擊記錄(用于統(tǒng)計(jì)用戶(hù)對(duì)推薦消息的點(diǎn)擊次數(shù)和比例)等。
[0028]服務(wù)器可以根據(jù)用戶(hù)觀(guān)看視頻的時(shí)長(zhǎng)來(lái)來(lái)判斷是否需要記錄該次觀(guān)看行為,具體而言可以是:服務(wù)器以分為單位記錄用戶(hù)觀(guān)看時(shí)間,當(dāng)用戶(hù)在某視頻停留時(shí)間低于閾值時(shí),例如I分鐘,則此次行為無(wú)效,不予記錄。這樣既減小了數(shù)據(jù)記錄量,記錄的內(nèi)容也更準(zhǔn)確。
[0029]服務(wù)器接收到各用戶(hù)觀(guān)看歷史記錄后,首先可以對(duì)數(shù)據(jù)進(jìn)行歸一化處理,刪除重復(fù)數(shù)據(jù)。然后就可以根據(jù)處理完后的歷史記錄,計(jì)算用戶(hù)各時(shí)段觀(guān)看視頻的數(shù)量占比或各時(shí)段觀(guān)看視頻的觀(guān)看時(shí)長(zhǎng)占比。例如,歷史記錄中存在100條觀(guān)看記錄,在這100條觀(guān)看記錄中用戶(hù)觀(guān)看時(shí)段為早上的記錄是60條,用戶(hù)觀(guān)看時(shí)段為晚上的記錄是10條等等,則計(jì)算得到用戶(hù)觀(guān)看時(shí)段中早上觀(guān)看視頻的數(shù)量占比為60%,晚上觀(guān)看視頻的數(shù)量占比為10%等。再比如,歷史記錄中用戶(hù)總的觀(guān)看時(shí)長(zhǎng)為100小時(shí),在這100小時(shí)中用戶(hù)觀(guān)看時(shí)段為早上的時(shí)長(zhǎng)是70小時(shí),用戶(hù)觀(guān)看時(shí)段為晚上的時(shí)長(zhǎng)是15小時(shí)等等,則計(jì)算得到用戶(hù)觀(guān)看時(shí)段中早上觀(guān)看視頻的時(shí)長(zhǎng)占比為70%,晚上觀(guān)看視頻的時(shí)長(zhǎng)占比為15%等。
[0030]S102:對(duì)收集到的各用戶(hù)的歷史記錄進(jìn)行統(tǒng)計(jì),根據(jù)所述觀(guān)看視頻的時(shí)間信息計(jì)算每一用戶(hù)在各時(shí)段內(nèi)觀(guān)看視頻的觀(guān)看數(shù)量占比或觀(guān)看時(shí)長(zhǎng)占比,并將該用戶(hù)歸入數(shù)量占比或時(shí)長(zhǎng)占比大于組閾值的特定時(shí)段所對(duì)應(yīng)的用戶(hù)組,該用戶(hù)定義為典型用戶(hù),生成各特定時(shí)段對(duì)應(yīng)包括典型用戶(hù)的用戶(hù)組;
在已存在歷史記錄的用戶(hù)中,一些用戶(hù)具有明顯的分類(lèi)特征,如某些用戶(hù)早上觀(guān)看視頻的數(shù)量占比大于60%,某些用戶(hù)午夜觀(guān)看視頻的數(shù)量占比大于50%,某些用戶(hù)中午觀(guān)看視頻的時(shí)長(zhǎng)占比大于65%等等,則這些用戶(hù)可以對(duì)應(yīng)的分入早上觀(guān)影組、午夜觀(guān)影組、中午觀(guān)影組等。而另一些用戶(hù)不具有明顯特征,例如有些用戶(hù)的歷史記錄不完整,其中可能存在缺失的數(shù)據(jù),例如,有些視頻的類(lèi)型難以劃分,則系統(tǒng)就無(wú)法獲得這次觀(guān)看歷史記錄中的視頻類(lèi)型的記錄,或者觀(guān)看過(guò)程中網(wǎng)絡(luò)中斷導(dǎo)致無(wú)法獲得觀(guān)看時(shí)長(zhǎng)等等情況,再比如一些用戶(hù)各視頻時(shí)段的數(shù)量占比或時(shí)長(zhǎng)占比基本相同,比如對(duì)一些用戶(hù)而言,早上觀(guān)看視頻的數(shù)量占比為30%、中午觀(guān)看視頻的數(shù)量占比為31%、晚上觀(guān)看視頻的數(shù)量占比為28%等,對(duì)于這些用戶(hù)難以向其推薦視頻。
[0031]為了解決這一問(wèn)題,本發(fā)明選取一部分具有明顯分類(lèi)特征的用戶(hù)進(jìn)行組劃分,確定觀(guān)看特定類(lèi)型視頻的數(shù)量占比大于組閾值的典型用戶(hù),為下文的模型訓(xùn)練做準(zhǔn)備。例如選取1000個(gè)用戶(hù),這1000個(gè)用戶(hù)各觀(guān)看視頻時(shí)段的數(shù)量占比或時(shí)長(zhǎng)占比均大于對(duì)應(yīng)的組閾值,以數(shù)量占比為例,1000個(gè)用戶(hù)中其早上觀(guān)看視頻的數(shù)量占比大于60%的用戶(hù)為100個(gè),則這100個(gè)用戶(hù)可以劃入早上觀(guān)影組,這里數(shù)值60%稱(chēng)為組閾值,把與數(shù)量占比相對(duì)應(yīng)的組閾值稱(chēng)為數(shù)量占比組閾值;再例如時(shí)長(zhǎng)占比,1000個(gè)用戶(hù)中其晚上觀(guān)看視頻的時(shí)長(zhǎng)占比大于70%的用戶(hù)為200個(gè),則這200個(gè)用戶(hù)可以劃入晚上觀(guān)影組,這里數(shù)值70%稱(chēng)為組閾值,把與時(shí)長(zhǎng)占比相對(duì)應(yīng)的組閾值稱(chēng)為時(shí)長(zhǎng)占比組閾值。不同組的組閾值既可以相同也可以不同,其組閾值可以動(dòng)態(tài)調(diào)整。
[0032]S103:分別獲取各視頻時(shí)段的用戶(hù)組內(nèi)典型用戶(hù)在其他維度上的數(shù)據(jù)特征,確定各視頻時(shí)段的用戶(hù)在其他維度上的組特征;
在完成對(duì)典型用戶(hù)分組后,進(jìn)行模型訓(xùn)練,獲取對(duì)應(yīng)分組內(nèi)各典型用戶(hù)在其他維度上的數(shù)據(jù)特征。下面以早上觀(guān)影組為例對(duì)其進(jìn)行說(shuō)明,如1000個(gè)典型用戶(hù)中屬于早上觀(guān)影組的用戶(hù)為100人,這100人早上觀(guān)看視頻的數(shù)量占比大于60%,除了數(shù)量占比大于60%這一數(shù)據(jù)特征為,該組還存在一些其他維度上的數(shù)據(jù)特征,如此類(lèi)用戶(hù)平均觀(guān)影時(shí)間大于30分鐘,且經(jīng)常觀(guān)看新聞?lì)惞?jié)目,對(duì)天氣類(lèi)推薦消息的點(diǎn)擊比例平均大于70%,在該例中用戶(hù)平均觀(guān)影時(shí)間、觀(guān)看節(jié)目類(lèi)型、對(duì)天氣類(lèi)推薦消息的點(diǎn)擊比例被稱(chēng)為其他維度上的數(shù)據(jù),這些數(shù)據(jù)特征也可以被稱(chēng)為早上觀(guān)影組在其他維度上的組特征。
[0033]再比如1000個(gè)用戶(hù)中屬于晚上觀(guān)影組的用戶(hù)為200人,這200人晚上觀(guān)看視頻的數(shù)量占比大于70%,除了數(shù)量占比大于70%這一數(shù)據(jù)特征外,該組還存在一些其他維度上的數(shù)據(jù)特征,如此類(lèi)用戶(hù)觀(guān)看同一視頻的次數(shù)大于10次,搜索內(nèi)容的類(lèi)型分布中電影類(lèi)占比大于40%,用戶(hù)經(jīng)常觀(guān)看體育類(lèi)節(jié)目等,在該例中用戶(hù)觀(guān)看同一視頻的次數(shù)、搜索內(nèi)容的類(lèi)型分布、用戶(hù)經(jīng)常觀(guān)看體育類(lèi)節(jié)目被稱(chēng)為其他維度上的數(shù)據(jù)。
[0034]通過(guò)這種模型訓(xùn)練可以獲得各組用戶(hù)在其他維度上的數(shù)據(jù)特征,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)明了,在收集到的歷史觀(guān)看記錄中,任何不同于各觀(guān)看時(shí)段的數(shù)量占比或各觀(guān)看時(shí)段的時(shí)長(zhǎng)占比的數(shù)據(jù),均可稱(chēng)為其他維度上的數(shù)據(jù),本發(fā)明實(shí)施例并非意在限制其他維度上的數(shù)據(jù)所包含的內(nèi)容。
[0035]S104:判斷典型用戶(hù)外的其他用戶(hù)在其他維度上的數(shù)據(jù)特征,是否滿(mǎn)足某觀(guān)看視頻時(shí)段的組特征,如果是,則將該用戶(hù)加入該觀(guān)看時(shí)段所對(duì)應(yīng)的組;
獲得其他維度上的數(shù)據(jù)特征之后,可以用這些數(shù)據(jù)特征對(duì)典型用戶(hù)之外的其他用戶(hù)進(jìn)行分組。相當(dāng)于利用訓(xùn)練出的模型,對(duì)用戶(hù)進(jìn)行分類(lèi)。具體而言可以是首先判斷所獲取的歷史記錄中關(guān)于其各視頻觀(guān)看時(shí)段的記錄是否完整,若記錄完整,則對(duì)其計(jì)算數(shù)量占比或時(shí)長(zhǎng)占比,判斷數(shù)量占比或時(shí)長(zhǎng)占比是否大于對(duì)應(yīng)組的組閾值,若大于組閾值則將其劃入該組。在判斷歷史記錄是否完整時(shí),可以設(shè)置一下限值,對(duì)于缺失數(shù)據(jù)大于下限值的用戶(hù)才進(jìn)一步進(jìn)行其他維度上的判斷,例如對(duì)于缺失記錄大于10%的用戶(hù)才進(jìn)行進(jìn)一步進(jìn)行其他維度上的判斷,這一下限值可以動(dòng)態(tài)調(diào)整。
[0036]若記錄不完整或其占比小于各分組的組閾值,則獲得該用戶(hù)其他維度上的數(shù)據(jù)特征,判斷其是否滿(mǎn)足某特定類(lèi)型中通過(guò)模型訓(xùn)練統(tǒng)計(jì)出的其他維度上的數(shù)據(jù)特征,滿(mǎn)足則將其分入該組,若判斷后發(fā)現(xiàn)不存在于該用戶(hù)對(duì)應(yīng)的分組,即該用戶(hù)不能劃入任何一個(gè)類(lèi)型的組,則將該用戶(hù)分組未分組用戶(hù)。
[0037]例如對(duì)于某一用戶(hù),歷史記錄中存在500條記錄,則系統(tǒng)首先判斷這500歷史記錄是否完整,若記錄完整,則對(duì)其計(jì)算數(shù)量占比,若這500條記錄中有400條為早上觀(guān)看的記錄,則早上觀(guān)看的數(shù)量占比為80%,其大于早上觀(guān)影組的數(shù)量占比組閾值60%,那么將其劃入早上觀(guān)影組;若這500條記錄中有100條為早上觀(guān)看的記錄、100條為中午觀(guān)看的記錄、100條為晚上觀(guān)看的記錄、100條為午夜觀(guān)看的記錄,則計(jì)算得到各時(shí)段觀(guān)看的數(shù)量占比均為20%,各時(shí)段的數(shù)量占比均小于對(duì)應(yīng)組的數(shù)量占比組閾值,或者500歷史記錄中關(guān)于其觀(guān)看視頻類(lèi)型的記錄是不完整,則判斷該用戶(hù)的至少一種其他維度上的數(shù)據(jù)是否滿(mǎn)足某特定類(lèi)型中統(tǒng)計(jì)出所述特征,如判斷用戶(hù)平均觀(guān)影時(shí)間是否大于30分鐘,是否經(jīng)常觀(guān)看新聞?lì)惞?jié)目,對(duì)天氣類(lèi)推薦消息的點(diǎn)擊比例是否大于70%,若滿(mǎn)足這些條件,則將該用戶(hù)劃入早上觀(guān)影組;若判斷后發(fā)現(xiàn)不存在與該用戶(hù)對(duì)應(yīng)的分組,即該用戶(hù)不能劃入任何一個(gè)時(shí)段的組,則將該用戶(hù)分組至未分組用戶(hù)。
[0038]以上是根據(jù)數(shù)量占比來(lái)劃分用戶(hù)組,也可以利用時(shí)長(zhǎng)占比來(lái)進(jìn)行劃分,例如用戶(hù)總的觀(guān)看時(shí)長(zhǎng)為500小時(shí),其中晚上觀(guān)看的時(shí)長(zhǎng)為400小時(shí),則晚上觀(guān)看的時(shí)長(zhǎng)占比為80%,其大于晚上觀(guān)影組的時(shí)長(zhǎng)占比組閾值65%,那么將其劃入晚上觀(guān)影組;若這500小時(shí)中150小時(shí)為早上觀(guān)看的記錄、150小時(shí)為中午觀(guān)看的記錄、100小時(shí)為晚上觀(guān)看的記錄、100小時(shí)為午夜觀(guān)看的記錄,則計(jì)算得到早上觀(guān)看的時(shí)長(zhǎng)占比和中午觀(guān)看的時(shí)長(zhǎng)占比為30%,晚上觀(guān)看的時(shí)長(zhǎng)占比、午夜觀(guān)看的時(shí)長(zhǎng)占比為20%,各時(shí)段觀(guān)看的時(shí)長(zhǎng)占比均小于對(duì)應(yīng)組的時(shí)長(zhǎng)占比組閾值,則判斷該用戶(hù)的至少一種其他維度上的數(shù)據(jù)是否滿(mǎn)足某特定類(lèi)型中統(tǒng)計(jì)出所述特征,如判斷用戶(hù)觀(guān)看同一視頻的次數(shù)是否大于10次,搜索內(nèi)容的類(lèi)型分布中電影類(lèi)占比是否大于40%,用戶(hù)是否經(jīng)常觀(guān)看體育類(lèi)節(jié)目等,若滿(mǎn)足這些條件,則將該用戶(hù)劃入晚上觀(guān)影組;若判斷后發(fā)現(xiàn)不存在與該用戶(hù)對(duì)應(yīng)的分組,即該用戶(hù)不能劃入任何一個(gè)時(shí)段的組,則將該用戶(hù)分組至未分組用戶(hù)。
[0039]應(yīng)當(dāng)理解,本發(fā)明的同一用戶(hù)可以分組不同的組,例如對(duì)于同一用戶(hù),其他維度上的數(shù)據(jù)可能同時(shí)滿(mǎn)足多個(gè)對(duì)應(yīng)分組模型中統(tǒng)計(jì)出所述其他維度上的數(shù)據(jù)特征,則將該用戶(hù)同時(shí)分入這兩個(gè)組。
[0040]本發(fā)明中,隨著用戶(hù)觀(guān)看時(shí)間的增加,其歷史記錄的信息越來(lái)越豐富,為了更加準(zhǔn)確的實(shí)現(xiàn)對(duì)用戶(hù)的分組,系統(tǒng)只對(duì)于用戶(hù)的歷史記錄條數(shù)大于下限值的用戶(hù)進(jìn)行統(tǒng)計(jì)分組,這一下限值例如可以是10條。分組后系統(tǒng)可以在每增加一定條數(shù)的記錄后重新對(duì)用戶(hù)進(jìn)行統(tǒng)計(jì)分組,例如記錄條數(shù)新增10條之后,系統(tǒng)會(huì)對(duì)原有記錄和新增的這10條記錄重新進(jìn)行統(tǒng)計(jì)分組。
[0041]S105:根據(jù)各用戶(hù)組所對(duì)應(yīng)的特定時(shí)段信息,向用戶(hù)組內(nèi)的用戶(hù)推薦對(duì)應(yīng)的視頻資源。
[0042]對(duì)用戶(hù)分組完成后,用戶(hù)通過(guò)賬號(hào)登陸系統(tǒng)后,就可以將歷史記錄與用戶(hù)賬號(hào)進(jìn)行關(guān)聯(lián),分析用戶(hù)的觀(guān)看習(xí)慣比如習(xí)慣早上觀(guān)看,習(xí)慣中午觀(guān)看等等,根據(jù)各用戶(hù)對(duì)應(yīng)的組信息,對(duì)于不同觀(guān)影時(shí)段組在相應(yīng)的時(shí)段推薦相應(yīng)的視頻。例如服務(wù)器記錄的某一賬號(hào)屬于早上觀(guān)影組,則當(dāng)用戶(hù)通過(guò)該賬號(hào)登陸后,系統(tǒng)自動(dòng)向其推薦新聞?lì)愐曨l;更有意義的是推薦的視頻可以是廣告,例如,對(duì)于同一廣告信息,對(duì)于早上觀(guān)影組,服務(wù)器將該廣告信息選擇在早上播出,對(duì)于中午觀(guān)影組,服務(wù)器將該廣告信息選擇在中午播出,對(duì)于晚上觀(guān)影組則選擇在晚上播出,這樣廣告的播放時(shí)長(zhǎng)沒(méi)有變化,針對(duì)不同的用戶(hù)組調(diào)整了廣告的投放時(shí)間,能夠使得該廣告獲得最大的效益。
[0043]當(dāng)用戶(hù)沒(méi)有通過(guò)賬號(hào)登陸或者用戶(hù)為新注冊(cè)用戶(hù)或者用戶(hù)屬于未分組用戶(hù)組,則系統(tǒng)可以根據(jù)他當(dāng)前所觀(guān)看的視頻類(lèi)型,向其推薦該類(lèi)型的其他視頻,這樣方便用戶(hù)觀(guān)看同類(lèi)視頻,或進(jìn)行隨機(jī)推薦。
[0044]實(shí)施例2
如圖2所示,本發(fā)明實(shí)施例還提供一種推薦視頻資源的系統(tǒng)。
[0045]歷史記錄獲取模塊201,用于收集各用戶(hù)觀(guān)看視頻過(guò)程中的歷史記錄;所述歷史記錄包括觀(guān)看視頻的時(shí)間信息,以及至少一種其他維度上的數(shù)據(jù);
典型用戶(hù)選取劃分模塊202,用于對(duì)收集到的各用戶(hù)的歷史記錄進(jìn)行統(tǒng)計(jì),根據(jù)所述觀(guān)看視頻的時(shí)間信息計(jì)算每一用戶(hù)在各時(shí)段內(nèi)觀(guān)看視頻的觀(guān)看數(shù)量占比或觀(guān)看時(shí)長(zhǎng)占比,并將該用戶(hù)歸入數(shù)量占比或時(shí)長(zhǎng)占比大于組閾值的特定時(shí)段所對(duì)應(yīng)的用戶(hù)組,該用戶(hù)定義為典型用戶(hù),生成各特定時(shí)段對(duì)應(yīng)包括典型用戶(hù)的用戶(hù)組;
模型訓(xùn)練模塊203,用于分別獲取各視頻時(shí)段的用戶(hù)組內(nèi)典型用戶(hù)在其他維度上的數(shù)據(jù)特征,確定各視頻時(shí)段的用戶(hù)在其他維度上的組特征;
用戶(hù)分組模塊204,用于判斷典型用戶(hù)外的其他用戶(hù)在其他維度上的數(shù)據(jù)特征,是否滿(mǎn)足某觀(guān)看視頻時(shí)段的組特征,如果是,則將該用戶(hù)加入該觀(guān)看時(shí)段所對(duì)應(yīng)的組;
視頻推薦模塊205,用于根據(jù)各用戶(hù)組所對(duì)應(yīng)的特定時(shí)段信息,向用戶(hù)組內(nèi)的用戶(hù)推薦對(duì)應(yīng)的視頻資源。其中,所述至少一種其他維度上的數(shù)據(jù)包括,用戶(hù)觀(guān)看視頻的名稱(chēng)、用戶(hù)進(jìn)行搜索的記錄和搜索內(nèi)容、和用戶(hù)對(duì)推薦類(lèi)的消息的點(diǎn)擊次數(shù)。
[0046]具體實(shí)現(xiàn)時(shí),所述歷史記錄獲取模塊具體可以用于:當(dāng)用戶(hù)觀(guān)看視頻的時(shí)長(zhǎng)大于第一下限值時(shí),記錄其歷史記錄。
[0047]其中,所述組閾值包括數(shù)量占比組閾值和時(shí)長(zhǎng)占比組閾值。
[0048]為了降低計(jì)算量,該系統(tǒng)還可以包括:
第一判斷模塊,用于計(jì)算典型用戶(hù)外的其他用戶(hù)各觀(guān)看時(shí)段的數(shù)量占比,判斷該數(shù)量占比是否大于等于對(duì)應(yīng)組的數(shù)量占比組閾值,若大于等于對(duì)應(yīng)的數(shù)量占比組閾值則將其劃入該組;若小于各分組的數(shù)量占比組閾值,則觸發(fā)所述用戶(hù)分組模塊執(zhí)行判斷在其他維度上的數(shù)據(jù)特征的操作。
[0049]或者,在另一種情況下,該系統(tǒng)還可以包括:
第二判斷模塊,用于計(jì)算典型用戶(hù)外的其他用戶(hù)各觀(guān)看時(shí)段的時(shí)長(zhǎng)占比,判斷該時(shí)長(zhǎng)占比是否大于等于對(duì)應(yīng)組的時(shí)長(zhǎng)占比組閾值,若大于等于對(duì)應(yīng)的時(shí)長(zhǎng)占比組閾值則將其劃入該組;若小于各分組的時(shí)長(zhǎng)占比組閾值,則觸發(fā)所述用戶(hù)分組模塊執(zhí)行判斷在其他維度上的數(shù)據(jù)特征的操作。
[0050]另外,該系統(tǒng)還可以包括:
重新分組模塊,用于對(duì)于歷史記錄條數(shù)大于第二下限值的用戶(hù)進(jìn)行統(tǒng)計(jì)分組,對(duì)于分組后的用戶(hù)在每增加一定條數(shù)的記錄后重新對(duì)該用戶(hù)進(jìn)行統(tǒng)計(jì)分組。
[0051]對(duì)于前述的各裝置實(shí)施例,為了簡(jiǎn)單描述,故將其都表述為一系列的單元/模塊組合,但是本領(lǐng)域的技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的單元組合/模塊的限制,因?yàn)楦鶕?jù)本發(fā)明,某些單元/模塊可以采用其他單元/模塊執(zhí)行;其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,上述裝置實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的單元并不一定是本發(fā)明所必須的。
[0052]本說(shuō)明書(shū)中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似的部分互相參見(jiàn)即可。對(duì)于系統(tǒng)實(shí)施例而言,由于其與方法實(shí)施例基本相似,所以描述的比較簡(jiǎn)單,相關(guān)之處參見(jiàn)方法實(shí)施例的部分說(shuō)明即可。
[0053]以上對(duì)本發(fā)明所提供的推薦視頻資源的方法及系統(tǒng),進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說(shuō)明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在【具體實(shí)施方式】及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說(shuō)明書(shū)內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。
【權(quán)利要求】
1.一種推薦視頻資源的方法,其特征在于,包括: 收集各用戶(hù)觀(guān)看視頻過(guò)程中的歷史記錄;所述歷史記錄包括觀(guān)看視頻的時(shí)間信息,以及至少一種其他維度上的數(shù)據(jù); 對(duì)收集到的各用戶(hù)的歷史記錄進(jìn)行統(tǒng)計(jì),根據(jù)所述觀(guān)看視頻的時(shí)間信息計(jì)算每一用戶(hù)在各時(shí)段內(nèi)觀(guān)看視頻的觀(guān)看數(shù)量占比或觀(guān)看時(shí)長(zhǎng)占比,并將該用戶(hù)歸入數(shù)量占比或時(shí)長(zhǎng)占比大于組閾值的特定時(shí)段所對(duì)應(yīng)的用戶(hù)組,該用戶(hù)定義為典型用戶(hù),生成各特定時(shí)段對(duì)應(yīng)的包括典型用戶(hù)的用戶(hù)組; 分別獲取各特定時(shí)段的用戶(hù)組內(nèi)典型用戶(hù)在其他維度上的數(shù)據(jù)特征,確定各特定時(shí)段的用戶(hù)在其他維度上的組特征; 判斷典型用戶(hù)外的其他用戶(hù)在其他維度上的數(shù)據(jù)特征,是否滿(mǎn)足某特定時(shí)段組的組特征,如果是,則將該用戶(hù)加入該特定時(shí)段的用戶(hù)組; 根據(jù)各用戶(hù)組所對(duì)應(yīng)的特定時(shí)段信息,向用戶(hù)組內(nèi)的用戶(hù)推薦對(duì)應(yīng)的視頻資源。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于:所述至少一種其他維度上的數(shù)據(jù)包括,用戶(hù)觀(guān)看視頻的名稱(chēng)、用戶(hù)進(jìn)行搜索的記錄和搜索內(nèi)容、和用戶(hù)對(duì)推薦類(lèi)的消息的點(diǎn)擊記錄。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于:所述收集各用戶(hù)觀(guān)看視頻過(guò)程中的歷史記錄包括:當(dāng)用戶(hù)觀(guān)看視頻的時(shí)長(zhǎng)大于第一下限值時(shí),記錄其歷史記錄。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于:所述組閾值包括數(shù)量占比組閾值或時(shí)長(zhǎng)占比組閾值。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,還包括: 計(jì)算典型用戶(hù)外的其他用戶(hù)`各觀(guān)看時(shí)段的數(shù)量占比,判斷該數(shù)量占比是否大于等于對(duì)應(yīng)組的數(shù)量占比組閾值,若大于等于對(duì)應(yīng)的數(shù)量占比組閾值則將其劃入該組;若小于各分組的數(shù)量占比組閾值,則獲得該用戶(hù)在其他維度上的數(shù)據(jù)特征。
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,還包括: 計(jì)算典型用戶(hù)外的其他用戶(hù)各觀(guān)看時(shí)段的時(shí)長(zhǎng)占比,判斷該時(shí)長(zhǎng)占比是否大于等于對(duì)應(yīng)組的時(shí)長(zhǎng)占比組閾值,若大于等于對(duì)應(yīng)的時(shí)長(zhǎng)占比組閾值則將其劃入該組;若小于各分組的時(shí)長(zhǎng)占比組閾值,則獲得該用戶(hù)在其他維度上的數(shù)據(jù)特征。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于還包括:對(duì)于歷史記錄條數(shù)大于第二下限值的用戶(hù)進(jìn)行統(tǒng)計(jì)分組,對(duì)于分組后的用戶(hù)在每增加一定條數(shù)的記錄后重新對(duì)該用戶(hù)進(jìn)行統(tǒng)計(jì)分組。
8.一種推薦視頻資源的系統(tǒng),其特征在于,包括: 歷史記錄獲取模塊,用于收集各用戶(hù)觀(guān)看視頻過(guò)程中的歷史記錄;所述歷史記錄包括觀(guān)看視頻的時(shí)間信息,以及至少一種其他維度上的數(shù)據(jù); 典型用戶(hù)選取劃分模塊,用于對(duì)收集到的各用戶(hù)的歷史記錄進(jìn)行統(tǒng)計(jì),根據(jù)所述觀(guān)看視頻的時(shí)間信息計(jì)算每一用戶(hù)在各時(shí)段內(nèi)觀(guān)看視頻的觀(guān)看數(shù)量占比或觀(guān)看時(shí)長(zhǎng)占比,并將該用戶(hù)歸入數(shù)量占比或時(shí)長(zhǎng)占比大于組閾值的特定時(shí)段所對(duì)應(yīng)的用戶(hù)組,該用戶(hù)定義為典型用戶(hù),生成各特定時(shí)段對(duì)應(yīng)包括典型用戶(hù)的用戶(hù)組; 模型訓(xùn)練模塊,用于分別獲取各特定時(shí)段的用戶(hù)組內(nèi)典型用戶(hù)在其他維度上的數(shù)據(jù)特征,確定各特定時(shí)段的用戶(hù)在其他維度上的組特征; 用戶(hù)分組模塊,用于判斷典型用戶(hù)外的其他用戶(hù)在其他維度上的數(shù)據(jù)特征,是否滿(mǎn)足某特定時(shí)段組的組特征,如果是,則將該用戶(hù)加入該特定時(shí)段的用戶(hù)組; 視頻推薦模塊,用于根據(jù)各用戶(hù)組所對(duì)應(yīng)的特定時(shí)段信息,向用戶(hù)組內(nèi)的用戶(hù)推薦對(duì)應(yīng)的視頻資源。
9.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于:所述至少一種其他維度上的數(shù)據(jù)包括,用戶(hù)觀(guān)看視頻的名稱(chēng)、用戶(hù)進(jìn)行搜索的記錄和搜索內(nèi)容、和用戶(hù)對(duì)推薦類(lèi)的消息的點(diǎn)擊次數(shù)。
10.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于:所述組閾值包括數(shù)量占比組閾值或時(shí)長(zhǎng)占比組閾值。
11.根據(jù)權(quán)利要求10所述的系統(tǒng),其特征在于,還包括: 第一判斷模塊,用于計(jì)算典型用戶(hù)外的其他用戶(hù)各觀(guān)看時(shí)段的數(shù)量占比,判斷該數(shù)量占比是否大于等于對(duì)應(yīng)組的數(shù)量占比組閾值,若大于等于對(duì)應(yīng)的數(shù)量占比組閾值則將其劃入該組;若小于各分組的數(shù)量占比組閾值,則觸發(fā)所述用戶(hù)分組模塊執(zhí)行判斷在其他維度上的數(shù)據(jù)特征的操作; 或者第二判斷模塊,用于計(jì)算典型用戶(hù)外的其他用戶(hù)各觀(guān)看時(shí)段的時(shí)長(zhǎng)占比,判斷該時(shí)長(zhǎng)占比是否大于等于對(duì)應(yīng)組的時(shí)長(zhǎng)占比組閾值,若大于等于對(duì)應(yīng)的時(shí)長(zhǎng)占比組閾值則將其劃入該組;若小于各分組的時(shí)長(zhǎng)占比組閾值,則觸發(fā)所述用戶(hù)分組模塊執(zhí)行判斷在其他維度上的數(shù)據(jù)特征的操作。
【文檔編號(hào)】H04N21/466GK103686236SQ201310578254
【公開(kāi)日】2014年3月26日 申請(qǐng)日期:2013年11月19日 優(yōu)先權(quán)日:2013年11月19日
【發(fā)明者】杜書(shū)印, 閆磊 申請(qǐng)人:樂(lè)視致新電子科技(天津)有限公司