專利名稱:交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及網(wǎng)絡(luò)協(xié)議電視技術(shù)領(lǐng)域,尤其涉及ー種交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送方法和裝置。
背景技術(shù):
IPTV即交互式網(wǎng)絡(luò)協(xié)議電視,是ー種利用寬帶有線電視網(wǎng),集互聯(lián)網(wǎng)、多媒體、通訊等多種技術(shù)于一體;向家庭用戶提供包括數(shù)字電視在內(nèi)的多種交互式服務(wù)的技木。它能夠很好地適應(yīng)當(dāng)今網(wǎng)絡(luò)飛速發(fā)展的趨勢,充分有效地利用網(wǎng)絡(luò)資源。IPTV的主要優(yōu)點(diǎn)表現(xiàn)在用戶可有極為廣泛的自由度選擇寬帶IP網(wǎng)上各網(wǎng)站提供的視頻內(nèi)容,并實(shí)現(xiàn)媒體提供者和媒體消費(fèi)者的實(shí)質(zhì)性互動。
以合適的方式為用戶提供適合用戶個(gè)性化需求與興趣的合適的內(nèi)容。然而傳統(tǒng)的個(gè)性化推送算法技術(shù)應(yīng)用于IPTV的推送時(shí)會遇到一些問題,如傳統(tǒng)的推送算法是基于單個(gè)用戶行為分析的;而IPTV的行為對象是以家庭為單位的,常是多個(gè)個(gè)體行為的。傳統(tǒng)的推送算法推送的內(nèi)容往往是ー種類型的,如電子商務(wù)推送的就是商品,用戶在不同商品上表現(xiàn)出的行為特征并無顯著差異。然而,IPTV推送的內(nèi)容是多種類型的,有電影,有電視劇;而且即使都是電視內(nèi)容,綜藝內(nèi)容、故事片、體育賽事等,或者最新上線的與往期的電視劇,用戶表現(xiàn)出來的行為都是有明顯差異性的。
發(fā)明內(nèi)容
本發(fā)明的目的在于提出ー種交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送方法和裝置,能顯著提升IPTV推送的精準(zhǔn)性,提升用戶體驗(yàn),井能提升推送系統(tǒng)的響應(yīng)實(shí)時(shí)性。為達(dá)此目的,本發(fā)明采用以下技術(shù)方案ー種交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送方法,包括以下步驟A、采集用戶行為日志數(shù)據(jù),進(jìn)行分時(shí)特征識別,建立內(nèi)容之間的行為相關(guān)性;B、對具備分時(shí)特征的用戶進(jìn)行分時(shí)特征匹配推送;C、采集不具備分時(shí)特征用戶的用戶屬性數(shù)據(jù),進(jìn)行群體特征識別;D、依據(jù)用戶群體特征進(jìn)行群體特征匹配推送;E、采集內(nèi)容播放列表數(shù)據(jù),提取內(nèi)容播放的關(guān)鍵信息;F、對內(nèi)容播放的關(guān)鍵信息與分時(shí)特征和/或群體特征進(jìn)行匹配,將匹配后的內(nèi)容播放列表進(jìn)行推送;G、采集內(nèi)容關(guān)鍵信息以及首次上映時(shí)間信息;H、若當(dāng)前播放內(nèi)容的首次上映時(shí)間信息早于系統(tǒng)當(dāng)前時(shí)間信息,根據(jù)內(nèi)容之間的行為相關(guān)性,推送與所述當(dāng)前播放內(nèi)容具備行為相關(guān)性的內(nèi)容;I、若當(dāng)前播放內(nèi)容的首次上映時(shí)間信息晚于或等于系統(tǒng)當(dāng)前時(shí)間信息,根據(jù)所述內(nèi)容關(guān)鍵信息計(jì)算內(nèi)容之間的匹配度,生成內(nèi)容匹配列表進(jìn)行推送。
ー種交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送方法,包括以下步驟A、采集用戶行為日志數(shù)據(jù),進(jìn)行分時(shí)特征識別;B、對具備分時(shí)特征的用戶進(jìn)行分時(shí)特征匹配推送;C、采集不具備分時(shí)特征用戶的用戶屬性數(shù)據(jù),進(jìn)行群體特征識別;D、依據(jù)用戶群體特征進(jìn)行群體特征匹配推送。ー種交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送方法,包括以下步驟
A、采集用戶行為日志數(shù)據(jù),進(jìn)行分時(shí)特征識別;B、采集不具備分時(shí)特征用戶的用戶屬性數(shù)據(jù),進(jìn)行群體特征識別;C、采集內(nèi)容播放列表數(shù)據(jù),提取內(nèi)容播放的關(guān)鍵信息;D、對內(nèi)容播放的關(guān)鍵信息與分時(shí)特征和/或群體特征進(jìn)行匹配,將匹配后的內(nèi)容播放列表進(jìn)行推送。ー種交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送方法,包括以下步驟A、采集用戶行為日志數(shù)據(jù),建立內(nèi)容之間的行為相關(guān)性;B、采集內(nèi)容關(guān)鍵信息以及首次上映時(shí)間信息;C、若當(dāng)前播放內(nèi)容的首次上映時(shí)間信息早于系統(tǒng)當(dāng)前時(shí)間信息,根據(jù)內(nèi)容之間的行為相關(guān)性,推送與所述當(dāng)前播放內(nèi)容具備行為相關(guān)性的內(nèi)容;D、若當(dāng)前播放內(nèi)容的首次上映時(shí)間信息晚于或等于系統(tǒng)當(dāng)前時(shí)間信息,根據(jù)所述內(nèi)容關(guān)鍵信息計(jì)算內(nèi)容之間的匹配度,生成內(nèi)容匹配列表進(jìn)行推送。所述分時(shí)特征識別,包括根據(jù)用戶行為日志數(shù)據(jù)統(tǒng)計(jì)用戶在一天中各時(shí)間段觀看各個(gè)類目內(nèi)容的時(shí)間長度,得到在每ー個(gè)時(shí)間段觀看時(shí)間最長的偏好類目,再統(tǒng)計(jì)每天同一時(shí)間段的偏好類目的重合度,當(dāng)所述重合度大于預(yù)設(shè)閾值時(shí),將所述用戶的ID、時(shí)間段和偏好類目作為用戶的分時(shí)特征。所述群體特征識別,包括根據(jù)用戶屬性數(shù)據(jù)將具有相同偏好類目的用戶劃入ー個(gè)群體,將所述用戶的ID和偏好類目作為用戶的群體特征。所述內(nèi)容播放的關(guān)鍵信息,包括從所述內(nèi)容播放列表數(shù)據(jù)中通過分詞處理提取的播放時(shí)間、內(nèi)容類目和名稱。所述內(nèi)容之間的行為相關(guān)性,是指通過用戶行為日志數(shù)據(jù)中的內(nèi)容訪問記錄,在用戶先后訪問的相鄰內(nèi)容之間建立的相關(guān)性。所述采集內(nèi)容關(guān)鍵信息,包括通過對內(nèi)容名稱、內(nèi)容介紹的文本分詞、識別高頻詞、建立關(guān)鍵詞庫、提取內(nèi)容名稱及內(nèi)容介紹的信息標(biāo)簽使得內(nèi)容信息結(jié)構(gòu)化;再通過文本矢量的夾角余弦算法,計(jì)算出內(nèi)容之間的匹配度。ー種交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送裝置,包括分時(shí)特征識別模塊、分時(shí)特征匹配模塊、群體特征識別模塊、群體特征匹配模塊、實(shí)時(shí)播放信息提取模塊、實(shí)時(shí)播放信息匹配模塊、內(nèi)容信息采集模塊、行為匹配模塊和內(nèi)容匹配模塊,其中,分時(shí)特征識別模塊,用于采集用戶行為日志數(shù)據(jù),進(jìn)行分時(shí)特征識別,建立內(nèi)容之間的行為相關(guān)性;分時(shí)特征匹配模塊,用于對具備分時(shí)特征的用戶進(jìn)行分時(shí)特征匹配推送;群體特征識別模塊,用于采集不具備分時(shí)特征用戶的用戶屬性數(shù)據(jù),進(jìn)行群體特征識別;
群體特征匹配模塊,用于依據(jù)用戶群體特征進(jìn)行群體特征匹配推送;實(shí)時(shí)播放信息提取模塊,用于采集內(nèi)容播放列表數(shù)據(jù),提取內(nèi)容播放的關(guān)鍵信息;實(shí)時(shí)播放信息匹配模塊,用于對內(nèi)容播放的關(guān)鍵信息與分時(shí)特征和/或群體特征進(jìn)行匹配,將匹配后的內(nèi)容播放列表進(jìn)行推送;內(nèi)容信息采集模塊,用于采集內(nèi)容關(guān)鍵信息以及首次上映時(shí)間信息;行為匹配模塊,用于當(dāng)前播放內(nèi)容的首次上映時(shí)間信息早于系統(tǒng)當(dāng)前時(shí)間信息時(shí),根據(jù)內(nèi)容之間的行為相關(guān)性,推送與所述當(dāng)前播放內(nèi)容具備行為相關(guān)性的內(nèi)容;內(nèi)容匹配模塊,用于當(dāng)前播放內(nèi)容的首次上映時(shí)間信息晚于或等于系統(tǒng)當(dāng)前時(shí)間信息,根據(jù)所述內(nèi)容關(guān)鍵信息計(jì)算內(nèi)容之間的匹配度,生成內(nèi)容匹配列表進(jìn)行推送。 ー種交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送裝置,包括分時(shí)特征識別模塊、分時(shí)特征匹配模塊、群體特征識別模塊、群體特征匹配模塊,其中,分時(shí)特征識別模塊,用于采集用戶行為日志數(shù)據(jù),進(jìn)行分時(shí)特征識別;分時(shí)特征匹配模塊,用于對具備分時(shí)特征的用戶進(jìn)行分時(shí)特征匹配推送;群體特征識別模塊,用于采集不具備分時(shí)特征用戶的用戶屬性數(shù)據(jù),進(jìn)行群體特征識別;群體特征匹配模塊,用于依據(jù)用戶群體特征進(jìn)行群體特征匹配推送。ー種交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送裝置,包括分時(shí)特征識別模塊,群體特征識別模塊,實(shí)時(shí)播放信息提取模塊,實(shí)時(shí)播放信息匹配模塊,其中,分時(shí)特征識別模塊,用于采集用戶行為日志數(shù)據(jù),進(jìn)行分時(shí)特征識別;群體特征識別模塊,用于采集不具備分時(shí)特征用戶的用戶屬性數(shù)據(jù),進(jìn)行群體特征識別;實(shí)時(shí)播放信息提取模塊,用于采集內(nèi)容播放列表數(shù)據(jù),提取內(nèi)容播放的關(guān)鍵信息;實(shí)時(shí)播放信息匹配模塊,用于對內(nèi)容播放的關(guān)鍵信息與分時(shí)特征和/或群體特征進(jìn)行匹配,將匹配后的內(nèi)容播放列表進(jìn)行推送。ー種交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送裝置,包括分時(shí)特征識別模塊,內(nèi)容信息采集模塊,行為匹配模塊,內(nèi)容匹配模塊,其中,分時(shí)特征識別模塊,用于采集用戶行為日志數(shù)據(jù),建立內(nèi)容之間的行為相關(guān)性;內(nèi)容信息采集模塊,用于采集內(nèi)容關(guān)鍵信息以及首次上映時(shí)間信息;行為匹配模塊,用于當(dāng)前播放內(nèi)容的首次上映時(shí)間信息早于系統(tǒng)當(dāng)前時(shí)間信息時(shí),根據(jù)內(nèi)容之間的行為相關(guān)性,推送與所述當(dāng)前播放內(nèi)容具備行為相關(guān)性的內(nèi)容;內(nèi)容匹配模塊,用于當(dāng)前播放內(nèi)容的首次上映時(shí)間信息晚于或等于系統(tǒng)當(dāng)前時(shí)間信息,根據(jù)所述內(nèi)容關(guān)鍵信息計(jì)算內(nèi)容之間的匹配度,生成內(nèi)容匹配列表進(jìn)行推送。所述分時(shí)特征識別模塊,根據(jù)用戶行為日志數(shù)據(jù)統(tǒng)計(jì)用戶在一天中各時(shí)間段觀看各個(gè)類目內(nèi)容的時(shí)間長度,得到在每ー個(gè)時(shí)間段觀看時(shí)間最長的偏好類目,再統(tǒng)計(jì)每天同一時(shí)間段的偏好類目的重合度,當(dāng)所述重合度大于預(yù)設(shè)閾值時(shí),將所述用戶的ID、時(shí)間段和偏好類目作為用戶的分時(shí)特征。所述群體特征識別模塊,根據(jù)用戶屬性數(shù)據(jù)將具有相同偏好類目的用戶劃入ー個(gè)群體,將所述用戶的ID和偏好類目作為用戶的群體特征。所述內(nèi)容播放的關(guān)鍵信息,包括從所述內(nèi)容播放列表數(shù)據(jù)中通過分詞處理提取的播放時(shí)間、內(nèi)容類目和名稱。所述內(nèi)容之間的行為相關(guān)性,是指通過用戶行為日志數(shù)據(jù)中的內(nèi)容訪問記錄,在用戶先后訪問的相鄰內(nèi)容之間建立的相關(guān)性。所述內(nèi)容信息采集模塊,通過對內(nèi)容名稱、內(nèi)容介紹的文本分詞、識別高頻詞、建立關(guān)鍵詞庫、提取內(nèi)容名稱及內(nèi)容介紹的信息標(biāo)簽使得內(nèi)容信息結(jié)構(gòu)化;再通過文本矢量的夾角余弦算法,計(jì)算出內(nèi)容之間的匹配度。采用本發(fā)明的技術(shù)方案,能顯著提升IPTV推送的精準(zhǔn)性,提升用戶體驗(yàn),并能提升推送系統(tǒng)的響應(yīng)實(shí)時(shí)性,極大地減少用戶頻繁捜索、查找內(nèi) 容的動作。
圖I是本發(fā)明具體實(shí)施方式
I提供的交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送方法的流程示意圖。圖2是本發(fā)明具體實(shí)施方式
I提供的交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送裝置的結(jié)構(gòu)示意圖。圖3是本發(fā)明具體實(shí)施方式
2提供的交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送方法的流程示意圖。圖4是本發(fā)明具體實(shí)施方式
2提供的交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送裝置的結(jié)構(gòu)示意圖。圖5是本發(fā)明具體實(shí)施方式
3提供的交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送方法的流程示意圖。圖6是本發(fā)明具體實(shí)施方式
3提供的交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送裝置的結(jié)構(gòu)示意圖。
具體實(shí)施例方式下面結(jié)合附圖并通過具體實(shí)施方式
來進(jìn)ー步說明本發(fā)明的技術(shù)方案。圖I是本發(fā)明具體實(shí)施方式
I提供的交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送方法的流程示意圖。該方法用于交互式網(wǎng)絡(luò)協(xié)議電視首頁的內(nèi)容推送,如圖I所示,該方法包括以下步驟步驟S101,采集用戶行為日志數(shù)據(jù),進(jìn)行分時(shí)特征識別。將用戶行為數(shù)據(jù)導(dǎo)入算法數(shù)據(jù)庫,IPTV系統(tǒng)會采集用戶行為日志數(shù)據(jù),如用戶歷史訪問的內(nèi)容、訪問次數(shù)、訪問時(shí)間段、訪問時(shí)間長度等數(shù)據(jù)。這些數(shù)據(jù)能幫助我們對用戶進(jìn)行深入的分析。所述分時(shí)特征識別,包括根據(jù)用戶行為日志數(shù)據(jù)統(tǒng)計(jì)用戶在一天中各時(shí)間段觀看各個(gè)類目內(nèi)容的時(shí)間長度,得到在每ー個(gè)時(shí)間段觀看時(shí)間最長的偏好類目,再統(tǒng)計(jì)每天同一時(shí)間段的偏好類目的重合度,當(dāng)所述重合度大于預(yù)設(shè)閾值時(shí),將所述用戶的ID、時(shí)間段和偏好類目作為用戶的分時(shí)特征。例如,我們將時(shí)間段分為工作日5 :30-17 :30、17 :30-20 :00、20 :00_22 :30、22 30-5 :30、節(jié)假日等這5類值,分別統(tǒng)計(jì)每ー個(gè)用戶在各時(shí)間段觀看各個(gè)類目電視的時(shí)間長度,得到在每ー個(gè)時(shí)間段觀看時(shí)間最長的類目,稱為這ー時(shí)段的偏好類目。如果每天同一時(shí)間段的偏好類目有極大的重合度,比如重合度> 70%,即ー個(gè)月30天內(nèi)有21天在同一時(shí)段偏好的內(nèi)容類目相同,則稱這一用戶有分時(shí)特征。步驟S102,對具備分時(shí)特征的用戶進(jìn)行分時(shí)特征匹配推送。對于有分時(shí)特性的用戶,我們以“用戶ID,時(shí)間段,偏好類目/關(guān)鍵詞”來標(biāo)識該用戶在某一時(shí)間段感興趣的內(nèi)容類目及內(nèi)容關(guān)鍵詞,在IPTV首頁推送時(shí),在相應(yīng)的時(shí)間段即可向用戶推送偏好類目或偏好關(guān)鍵詞相匹配的最新內(nèi)容。步驟S103,采集不具備分時(shí)特征用戶的用戶屬性數(shù)據(jù),進(jìn)行群體特征識別。對于沒有分時(shí)偏好的用戶,需要基于群體偏好的算法進(jìn)行首頁內(nèi)容的推送。將用戶屬性數(shù)據(jù)導(dǎo)入算法數(shù)據(jù)庫,用戶在購買IPTV服務(wù)時(shí)會填寫一些個(gè)人信息,如性別、年齡、居住地址等。這些信息數(shù)據(jù)能幫助我們對用戶群進(jìn)行細(xì)分。 基于用戶屬性數(shù)據(jù)以及用戶行為日志數(shù)據(jù),我們可以對用戶進(jìn)行細(xì)分。由于以上采集的行為數(shù)據(jù),往往反映的是ー個(gè)家庭的觀看行為。因此,基于以上數(shù)據(jù)對用戶的細(xì)分,實(shí)際上是對以家庭為單位的用戶細(xì)分。當(dāng)然,這里面也可能包括ー些家庭只有一個(gè)用戶成員。首先,我們將用戶細(xì)分依據(jù)的字段離散化,所述字段包括性別男,女;年齡取年齡段25歲以下,26-35,36-45,46-55,56-65,65 歲以上;地址粒度只要細(xì)到小區(qū);偏好類目取訪問時(shí)間最長的三類內(nèi)容的類目名稱;平均每天觀看內(nèi)容的小時(shí)數(shù)取整數(shù);平均每個(gè)月觀看內(nèi)容的天數(shù)?;谝陨献侄螖?shù)據(jù)的值的組合就可以將用戶細(xì)分成不同的群體。對每個(gè)細(xì)分群體,我們可用“用戶群ID,偏好類目/關(guān)鍵詞”來標(biāo)識該細(xì)分群體的興趣偏好特性,即所述群體特征。步驟S104,依據(jù)用戶群體特征進(jìn)行群體特征匹配推送。我們認(rèn)為落到同一細(xì)分群體的用戶具有相同的群體特征,就可以將同一群體內(nèi)其它用戶當(dāng)前關(guān)注較多的內(nèi)容向群體內(nèi)的用戶推送。相應(yīng)的,本發(fā)明具體實(shí)施方式
I提供了ー種交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送裝置,如圖2所示,該裝置包括分時(shí)特征識別模塊201、分時(shí)特征匹配模塊202、群體特征識別模塊203、群體特征匹配模塊204,其中,分時(shí)特征識別模塊201,用于采集用戶行為日志數(shù)據(jù),進(jìn)行分時(shí)特征識別;分時(shí)特征匹配模塊202,用于對具備分時(shí)特征的用戶進(jìn)行分時(shí)特征匹配推送;群體特征識別模塊203,用于采集不具備分時(shí)特征用戶的用戶屬性數(shù)據(jù),進(jìn)行群體特征識別;群體特征匹配模塊204,用于依據(jù)用戶群體特征進(jìn)行群體特征匹配推送。所述分時(shí)特征識別模塊201,根據(jù)用戶行為日志數(shù)據(jù)統(tǒng)計(jì)用戶在一天中各時(shí)間段觀看各個(gè)類目內(nèi)容的時(shí)間長度,得到在每ー個(gè)時(shí)間段觀看時(shí)間最長的偏好類目,再統(tǒng)計(jì)每天同一時(shí)間段的偏好類目的重合度,當(dāng)所述重合度大于預(yù)設(shè)閾值時(shí),將所述用戶的ID、時(shí)間段和偏好類目作為用戶的分時(shí)特征。所述群體特征識別模塊203,根據(jù)用戶屬性數(shù)據(jù)將具有相同偏好類目的用戶劃入ー個(gè)群體,將所述用戶的ID和偏好類目作為用戶的群體特征。圖3是本發(fā)明具體實(shí)施方式
2提供的交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送方法的流程示意圖。該方法用于交互式網(wǎng)絡(luò)協(xié)議電視內(nèi)容播放過程中的實(shí)時(shí)推送,主要實(shí)現(xiàn)對當(dāng)前正在播放或下一時(shí)間段即將播放的內(nèi)容的實(shí)時(shí)推送。用戶在觀看當(dāng)前內(nèi)容時(shí),經(jīng)常會反復(fù)切換頻道,目的在于找到當(dāng)前在播放的內(nèi)容中自己最感興趣的內(nèi)容,內(nèi)容實(shí)時(shí)推送能從當(dāng)前在播放的全部內(nèi)容中根據(jù)用戶分時(shí)特征或群體特征篩選出用戶最可能感興趣的內(nèi)容推送給用戶,減去用戶反復(fù)切換頻道搜尋的麻煩。如圖3所示,該方法包括以下步驟步驟S301,與具體實(shí)施方式
I中 步驟SlOl相同。步驟S302,與具體實(shí)施方式
I中步驟S103相同。步驟S303,采集內(nèi)容播放列表數(shù)據(jù),提取內(nèi)容播放的關(guān)鍵信息。內(nèi)容播放列表文本文件實(shí)時(shí)采集傳入,對當(dāng)前正在播放及計(jì)劃播放的內(nèi)容列表可直接通過文本文件方式采集獲得,不需要加載進(jìn)數(shù)據(jù)庫,以縮短文件傳送處理時(shí)間。內(nèi)容列表中包括電視頻道、播放時(shí)間、播放內(nèi)容類別、內(nèi)容名稱等。在具體實(shí)際實(shí)施吋,由于電視內(nèi)容的播放計(jì)劃一般會提前制訂,因此也可每天采集傳送一次當(dāng)天的電視內(nèi)容播放列表。對輸入的內(nèi)容播放列表文本,直接進(jìn)行實(shí)時(shí)分詞處理,提取出內(nèi)容播放的關(guān)鍵信息,包括從所述內(nèi)容播放列表數(shù)據(jù)中通過分詞處理提取的播放時(shí)間、內(nèi)容類目和名稱。步驟S304,對內(nèi)容播放的關(guān)鍵信息與分時(shí)特征和/或群體特征進(jìn)行匹配,將匹配后的內(nèi)容播放列表進(jìn)行推送。通過與當(dāng)前時(shí)間,以及當(dāng)前正在播放的內(nèi)容的類目/關(guān)鍵詞進(jìn)行匹配,可以過濾出與用戶分時(shí)特征或群體特征相匹配的當(dāng)前正在播放或下一時(shí)段即將播放的全部內(nèi)容。在當(dāng)前內(nèi)容的播放過程中,展示以上匹配的當(dāng)前正在播放或下一時(shí)段即將播放的與用戶分時(shí)特征或群體特征最相符的內(nèi)容列表,方便用戶快速定位感興趣的電視內(nèi)容,不用人工在各頻道間反復(fù)挑選。相應(yīng)的,本發(fā)明具體實(shí)施方式
2提供了 ー種交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送裝置,如圖4所示,該裝置包括分時(shí)特征識別模塊401,群體特征識別模塊402,實(shí)時(shí)播放信息提取模塊403,實(shí)時(shí)播放信息匹配模塊404,其中,分時(shí)特征識別模塊401,與具體實(shí)施方式
I中的分時(shí)特征識別模塊201相同。群體特征識別模塊402,與具體實(shí)施方式
I中的群體特征識別模塊202相同。實(shí)時(shí)播放信息提取模塊403,用于采集內(nèi)容播放列表數(shù)據(jù),提取內(nèi)容播放的關(guān)鍵信息;實(shí)時(shí)播放信息匹配模塊404,用于對內(nèi)容播放的關(guān)鍵信息與分時(shí)特征和/或群體特征進(jìn)行匹配,將匹配后的內(nèi)容播放列表進(jìn)行推送。所述內(nèi)容播放的關(guān)鍵信息,包括從所述內(nèi)容播放列表數(shù)據(jù)中通過分詞處理提取的播放時(shí)間、內(nèi)容類目和名稱。圖5是本發(fā)明具體實(shí)施方式
3提供的交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送方法的流程示意圖。該方法用于交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容介紹頁面或播放完ー個(gè)內(nèi)容的終止頁面進(jìn)行內(nèi)容推送,在內(nèi)容介紹頁面推送與當(dāng)前內(nèi)容匹配相似的內(nèi)容,幫助用戶發(fā)現(xiàn)更多感興趣的同類內(nèi)容;在劇終頁面,推送其它用戶在看完該內(nèi)容前后還看過的其它內(nèi)容,幫助用戶便利的繼續(xù)獲得感興趣的內(nèi)容進(jìn)行觀看,從而不用返回菜單再去尋找。如圖5所示,該方法包括以下步驟步驟S501,采集用戶行為日志數(shù)據(jù),建立內(nèi)容之間的行為相關(guān)性。所述內(nèi)容之間的行為相關(guān)性,是指通過用戶行為日志數(shù)據(jù)中的內(nèi)容訪問記錄,在用戶先后訪問的相鄰內(nèi)容之間建立的相關(guān)性。通過用戶訪問記錄中的行為關(guān)系建立內(nèi)容之間的行為相關(guān)性。常用協(xié)同過濾的算法得到內(nèi)容之間的行為相關(guān)性。比如,多個(gè)用戶(達(dá)到一定預(yù)設(shè)數(shù)量的用戶)在觀看了 A內(nèi)容前后也觀看了 B內(nèi)容,則認(rèn)為A、B內(nèi)容之間具有行為相關(guān)性。步驟S502,采集內(nèi)容關(guān)鍵信息以及首次上映時(shí)間信息。所述采集內(nèi)容關(guān)鍵信息,包括通過對內(nèi)容名稱、內(nèi)容介紹的文本分詞、識別高頻詞、建立關(guān)鍵詞庫、提取內(nèi)容名稱及內(nèi)容介紹的信息標(biāo)簽使得內(nèi)容信息結(jié)構(gòu)化;再通過文本矢量的夾角余弦算法,計(jì)算出內(nèi)容之間的匹配度。 步驟S503,若當(dāng)前播放內(nèi)容的首次上映時(shí)間信息早于系統(tǒng)當(dāng)前時(shí)間信息,根據(jù)內(nèi)容之間的行為相關(guān)性,推送與所述當(dāng)前播放內(nèi)容具備行為相關(guān)性的內(nèi)容。如在A、B內(nèi)容之間具有所述行為相關(guān)性,這樣當(dāng)用戶看完A內(nèi)容后,則可以向其推送B內(nèi)容。步驟S504,若當(dāng)前播放內(nèi)容的首次上映時(shí)間信息晚于或等于系統(tǒng)當(dāng)前時(shí)間信息,根據(jù)所述內(nèi)容關(guān)鍵信息計(jì)算內(nèi)容之間的匹配度,生成內(nèi)容匹配列表進(jìn)行推送。利用步驟S502中解析出的內(nèi)容的信息字段及信息標(biāo)簽,通過文本相似性比較算法,常用的是文本矢量的夾角余弦算法,可以計(jì)算出與各內(nèi)容匹配相似的其它的內(nèi)容,并可以計(jì)算內(nèi)容之間的匹配度。我們按匹配度從高到低進(jìn)行排序,得到最匹配相似的內(nèi)容列表,進(jìn)行內(nèi)容匹配推送。相應(yīng)的,本發(fā)明具體實(shí)施方式
3提供了ー種交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送裝置,如圖6所示,該裝置包括分時(shí)特征識別模塊601,內(nèi)容信息采集模塊602,行為匹配模塊603和內(nèi)容匹配模塊604,其中分時(shí)特征識別模塊601,用于采集用戶行為日志數(shù)據(jù),建立內(nèi)容之間的行為相關(guān)性;內(nèi)容信息采集模塊602,用于采集內(nèi)容關(guān)鍵信息以及首次上映時(shí)間信息;行為匹配模塊603,用于當(dāng)前播放內(nèi)容的首次上映時(shí)間信息早于系統(tǒng)當(dāng)前時(shí)間信息時(shí),根據(jù)內(nèi)容之間的行為相關(guān)性,推送與所述當(dāng)前播放內(nèi)容具備行為相關(guān)性的內(nèi)容;內(nèi)容匹配模塊604,用于當(dāng)前播放內(nèi)容的首次上映時(shí)間信息晚于或等于系統(tǒng)當(dāng)前時(shí)間信息,根據(jù)所述內(nèi)容關(guān)鍵信息計(jì)算內(nèi)容之間的匹配度,生成內(nèi)容匹配列表進(jìn)行推送。所述內(nèi)容之間的行為相關(guān)性,是指通過用戶行為日志數(shù)據(jù)中的內(nèi)容訪問記錄,在用戶先后訪問的相鄰內(nèi)容之間建立的相關(guān)性。所述內(nèi)容信息采集模塊602,通過對內(nèi)容名稱、內(nèi)容介紹的文本分詞、識別高頻詞、建立關(guān)鍵詞庫、提取內(nèi)容名稱及內(nèi)容介紹的信息標(biāo)簽使得內(nèi)容信息結(jié)構(gòu)化;再通過文本矢量的夾角,余弦算法,計(jì)算出內(nèi)容之間的匹配度。另外需要說明的是,以上三種具體實(shí)施方式
提供的交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送方法,可共同應(yīng)用于同一網(wǎng)絡(luò)協(xié)議電視系統(tǒng)之中,即在該網(wǎng)絡(luò)協(xié)議電視系統(tǒng)的首頁上、內(nèi)容播放的過程中以及在播放內(nèi)容開始或結(jié)束的頁面中都可以進(jìn)行內(nèi)容推送,該系統(tǒng)同時(shí)具備首頁推送功能、內(nèi)容播放過程中的實(shí)時(shí)內(nèi)容推送功能和內(nèi)容播放開始或結(jié)束時(shí)的匹配內(nèi)容推送功能。相應(yīng)的,運(yùn)行該交互式網(wǎng)絡(luò)協(xié)議電視系統(tǒng)的推送裝置也同時(shí)具備實(shí)現(xiàn)上述三種推送方法的功能模塊。采用本發(fā)明的技術(shù)方案,能顯著提升IPTV推送的精準(zhǔn)性,提升用戶體驗(yàn),并能提升推送系統(tǒng)的響應(yīng)實(shí)時(shí)性,極大地減少用戶頻繁捜索、查找內(nèi)容的動作。 以上所述,僅為本發(fā)明較佳的具體實(shí)施方式
,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉該技術(shù)的人在本發(fā)明所揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)該以權(quán)利要求的保護(hù)范圍為準(zhǔn)。
權(quán)利要求
1. ー種交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送方法,其特征在于,包括以下步驟 A、采集用戶行為日志數(shù)據(jù),進(jìn)行分時(shí)特征識別,建立內(nèi)容之間的行為相關(guān)性; B、對具備分時(shí)特征的用戶進(jìn)行分時(shí)特征匹配推送; C、采集不具備分時(shí)特征用戶的用戶屬性數(shù)據(jù),進(jìn)行群體特征識別; D、依據(jù)用戶群體特征進(jìn)行群體特征匹配推送; E、采集內(nèi)容播放列表數(shù)據(jù),提取內(nèi)容播放的關(guān)鍵信息; F、對內(nèi)容播放的關(guān)鍵信息與分時(shí)特征和/或群體特征進(jìn)行匹配,將匹配后的內(nèi)容播放列表進(jìn)行推送; G、采集內(nèi)容關(guān)鍵信息以及首次上映時(shí)間信息; H、若當(dāng)前播放內(nèi)容的首次上映時(shí)間信息早于系統(tǒng)當(dāng)前時(shí)間信息,根據(jù)內(nèi)容之間的行為相關(guān)性,推送與所述當(dāng)前播放內(nèi)容具備行為相關(guān)性的內(nèi)容; I、若當(dāng)前播放內(nèi)容的首次上映時(shí)間信息晚于或等于系統(tǒng)當(dāng)前時(shí)間信息,根據(jù)所述內(nèi)容關(guān)鍵信息計(jì)算內(nèi)容之間的匹配度,生成內(nèi)容匹配列表進(jìn)行推送。
2.ー種交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送方法,其特征在于,包括以下步驟 A、采集用戶行為日志數(shù)據(jù),進(jìn)行分時(shí)特征識別; B、對具備分時(shí)特征的用戶進(jìn)行分時(shí)特征匹配推送; C、采集不具備分時(shí)特征用戶的用戶屬性數(shù)據(jù),進(jìn)行群體特征識別; D、依據(jù)用戶群體特征進(jìn)行群體特征匹配推送。
3.ー種交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送方法,其特征在于,包括以下步驟 A、采集用戶行為日志數(shù)據(jù),進(jìn)行分時(shí)特征識別; B、采集不具備分時(shí)特征用戶的用戶屬性數(shù)據(jù),進(jìn)行群體特征識別; C、采集內(nèi)容播放列表數(shù)據(jù),提取內(nèi)容播放的關(guān)鍵信息; D、對內(nèi)容播放的關(guān)鍵信息與分時(shí)特征和/或群體特征進(jìn)行匹配,將匹配后的內(nèi)容播放列表進(jìn)行推送。
4.ー種交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送方法,其特征在于,包括以下步驟 A、采集用戶行為日志數(shù)據(jù),建立內(nèi)容之間的行為相關(guān)性; B、采集內(nèi)容關(guān)鍵信息以及首次上映時(shí)間信息; C、若當(dāng)前播放內(nèi)容的首次上映時(shí)間信息早于系統(tǒng)當(dāng)前時(shí)間信息,根據(jù)內(nèi)容之間的行為相關(guān)性,推送與所述當(dāng)前播放內(nèi)容具備行為相關(guān)性的內(nèi)容; D、若當(dāng)前播放內(nèi)容的首次上映時(shí)間信息晚于或等于系統(tǒng)當(dāng)前時(shí)間信息,根據(jù)所述內(nèi)容關(guān)鍵信息計(jì)算內(nèi)容之間的匹配度,生成內(nèi)容匹配列表進(jìn)行推送。
5.根據(jù)權(quán)利要求1-3任一所述的交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送方法,其特征在干,所述分時(shí)特征識別,包括根據(jù)用戶行為日志數(shù)據(jù)統(tǒng)計(jì)用戶在一天中各時(shí)間段觀看各個(gè)類目內(nèi)容的時(shí)間長度,得到在每ー個(gè)時(shí)間段觀看時(shí)間最長的偏好類目,再統(tǒng)計(jì)每天同一時(shí)間段的偏好類目的重合度,當(dāng)所述重合度大于預(yù)設(shè)閾值時(shí),將所述用戶的ID、時(shí)間段和偏好類目作為用戶的分時(shí)特征。
6.根據(jù)權(quán)利要求5所述的交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送方法,其特征在于,所述群體特征識別,包括根據(jù)用戶屬性數(shù)據(jù)將具有相同偏好類目的用戶劃入ー個(gè)群體,將所述用戶的ID和偏好類目作為用戶的群體特征。
7.根據(jù)權(quán)利要求I或3所述的交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送方法,其特征在于,所述內(nèi)容播放的關(guān)鍵信息,包括從所述內(nèi)容播放列表數(shù)據(jù)中通過分詞處理提取的播放時(shí)間、內(nèi)容類目和名稱。
8.根據(jù)權(quán)利要求I或4所述的交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送方法,其特征在于,所述內(nèi)容之間的行為相關(guān)性,是指通過用戶行為日志數(shù)據(jù)中的內(nèi)容訪問記錄,在用戶先后訪問的相鄰內(nèi)容之間建立的相關(guān)性。
9.根據(jù)權(quán)利要求I或4所述的交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送方法,其特征在于,所述采集內(nèi)容關(guān)鍵信息,包括通過對內(nèi)容名稱、內(nèi)容介紹的文本分詞、識別高頻詞、建立關(guān)鍵詞庫、提取內(nèi)容名稱及內(nèi)容介紹的信息標(biāo)簽使得內(nèi)容信息結(jié)構(gòu)化;再通過文本矢量的夾角余弦算法,計(jì)算出內(nèi)容之間的匹配度。
10.ー種交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送裝置,其特征在于,包括分時(shí)特征識別模塊、分時(shí)特征匹配模塊、群體特征識別模塊、群體特征匹配模塊、實(shí)時(shí)播放信息提取模塊、實(shí)時(shí)播放信息匹配模塊、內(nèi)容信息采集模塊、行為匹配模塊和內(nèi)容匹配模塊,其中, 分時(shí)特征識別模塊,用于采集用戶行為日志數(shù)據(jù),進(jìn)行分時(shí)特征識別,建立內(nèi)容之間的行為相關(guān)性; 分時(shí)特征匹配模塊,用于對具備分時(shí)特征的用戶進(jìn)行分時(shí)特征匹配推送; 群體特征識別模塊,用于采集不具備分時(shí)特征用戶的用戶屬性數(shù)據(jù),進(jìn)行群體特征識別; 群體特征匹配模塊,用于依據(jù)用戶群體特征進(jìn)行群體特征匹配推送; 實(shí)時(shí)播放信息提取模塊,用于采集內(nèi)容播放列表數(shù)據(jù),提取內(nèi)容播放的關(guān)鍵信息;實(shí)時(shí)播放信息匹配模塊,用于對內(nèi)容播放的關(guān)鍵信息與分時(shí)特征和/或群體特征進(jìn)行匹配,將匹配后的內(nèi)容播放列表進(jìn)行推送; 內(nèi)容信息采集模塊,用于采集內(nèi)容關(guān)鍵信息以及首次上映時(shí)間信息; 行為匹配模塊,用于當(dāng)前播放內(nèi)容的首次上映時(shí)間信息早于系統(tǒng)當(dāng)前時(shí)間信息時(shí),根據(jù)內(nèi)容之間的行為相關(guān)性,推送與所述當(dāng)前播放內(nèi)容具備行為相關(guān)性的內(nèi)容; 內(nèi)容匹配模塊,用于當(dāng)前播放內(nèi)容的首次上映時(shí)間信息晚于或等于系統(tǒng)當(dāng)前時(shí)間信息,根據(jù)所述內(nèi)容關(guān)鍵信息計(jì)算內(nèi)容之間的匹配度,生成內(nèi)容匹配列表進(jìn)行推送。
全文摘要
本發(fā)明公開了一種交互式網(wǎng)絡(luò)協(xié)議電視的內(nèi)容推送方法和裝置,包括在首頁進(jìn)行推送的方法、在內(nèi)容播放過程中的進(jìn)行實(shí)時(shí)推送的方法和在內(nèi)容播放開始或結(jié)束時(shí)對匹配內(nèi)容進(jìn)行推送的方法以及相應(yīng)裝置。本發(fā)明能顯著提升交互式網(wǎng)絡(luò)協(xié)議電視內(nèi)容推送的精準(zhǔn)性,提升用戶體驗(yàn),并能提升推送系統(tǒng)的響應(yīng)實(shí)時(shí)性,極大地減少用戶頻繁搜索、查找內(nèi)容的動作。
文檔編號H04N21/262GK102695086SQ20121018005
公開日2012年9月26日 申請日期2012年5月30日 優(yōu)先權(quán)日2012年5月30日
發(fā)明者何勇, 張旭, 楊志雄, 蘇寧軍 申請人:杭州遙指科技有限公司