推廣信息的處理方法及裝置制造方法
【專利摘要】本發(fā)明提供一種推廣信息的處理方法及裝置。本發(fā)明實(shí)施例通過獲取多媒體文件的字幕內(nèi)容,進(jìn)而根據(jù)所述字幕內(nèi)容,獲得與所述字幕內(nèi)容匹配的候選推廣信息,以作為目標(biāo)推廣信息,使得能夠在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送,由于目標(biāo)推廣信息為與多媒體文件的字幕內(nèi)容匹配的推廣信息,因此,在所述多媒體文件的播放過程中進(jìn)行所述目標(biāo)推廣信息的推送,會(huì)引起視頻文件的觀看者的興趣以對(duì)推廣信息進(jìn)行進(jìn)一步操作行為,例如,點(diǎn)擊、注冊(cè)和購買等操作行為,能夠保證推廣信息的精準(zhǔn)推送,從而提高了推廣信息的轉(zhuǎn)化率。
【專利說明】推廣信息的處理方法及裝置
【【技術(shù)領(lǐng)域】】
[0001]本發(fā)明涉及推送技術(shù),尤其涉及一種推廣信息的處理方法及裝置。
【【背景技術(shù)】】
[0002]近年來,隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,逐漸興起了推廣信息的推送服務(wù),例如,廣告推送、游戲推送或應(yīng)用推送等。在播放多媒體文件的過程中,例如,接收開始播放的指令之后,或者接收暫停播放或停止播放的指令之后,等,可以隨機(jī)向用戶推送推廣信息。
[0003]然而,由于推廣信息是隨機(jī)推送的,從而導(dǎo)致了推廣信息的轉(zhuǎn)化率的降低。
【
【發(fā)明內(nèi)容】
】
[0004]本發(fā)明的多個(gè)方面提供一種推廣信息的處理方法及裝置,用以提高推廣信息的轉(zhuǎn)化率。
[0005]本發(fā)明的一方面,提供一種推廣信息的處理方法,包括:
[0006]獲取多媒體文件的字幕內(nèi)容;
[0007]根據(jù)所述字幕內(nèi)容,獲得與所述字幕內(nèi)容匹配的候選推廣信息,以作為目標(biāo)推廣信息,以供在所述多媒體文 件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送。
[0008]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述根據(jù)所述字幕內(nèi)容,獲得與所述字幕內(nèi)容匹配的候選推廣信息,以作為目標(biāo)推廣信息,以供在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送,包括:
[0009]對(duì)所述字幕內(nèi)容進(jìn)行特征提取,以獲得第一特征信息;
[0010]對(duì)待推送的至少一個(gè)候選推廣信息的文本信息進(jìn)行特征提取,以獲得至少一個(gè)第二特征信息;
[0011]根據(jù)所述第一特征信息和所述至少一個(gè)第二特征信息,選擇至少一個(gè)候選推廣信息,以作為所述目標(biāo)推廣信息,以供在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送。
[0012]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述根據(jù)所述第一特征信息和所述至少一個(gè)第二特征信息,選擇至少一個(gè)候選推廣信息,以作為所述目標(biāo)推廣信息,包括:
[0013]計(jì)算所述第一特征信息與所述至少一個(gè)第二特征信息中每個(gè)第二特征信息之間的距離;
[0014]選擇最小的至少一個(gè)距離所對(duì)應(yīng)的第二特征信息所屬的至少一個(gè)候選推廣信息,以作為所述目標(biāo)推廣信息;或者選擇小于或等于預(yù)先配置的距離閾值的距離所對(duì)應(yīng)的第二特征信息所屬的至少一個(gè)候選推廣信息,以作為所述目標(biāo)推廣信息。
[0015]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述對(duì)所述字幕內(nèi)容進(jìn)行特征提取,以獲得第一特征信息,包括:
[0016]利用LDA算法,對(duì)所述字幕內(nèi)容進(jìn)行特征提取,以獲得所述第一特征信息。[0017]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述對(duì)待推送的至少一個(gè)候選推廣信息的文本信息進(jìn)行特征提取,以獲得至少一個(gè)第二特征信息,包括:
[0018]利用LDA算法,對(duì)待推送的至少一個(gè)候選推廣信息的文本信息進(jìn)行特征提取,以獲得所述至少一個(gè)第二特征信息。
[0019]本發(fā)明的另一方面,提供一種推廣信息的處理裝置,包括:
[0020]獲取單元,用于獲取多媒體文件的字幕內(nèi)容;
[0021]匹配單元,用于根據(jù)所述字幕內(nèi)容,獲得與所述字幕內(nèi)容匹配的候選推廣信息,以作為目標(biāo)推廣信息,以供在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送。
[0022]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述匹配單元,具體用于
[0023]對(duì)所述字幕內(nèi)容進(jìn)行特征提取,以獲得第一特征信息;
[0024]對(duì)待推送的至少一個(gè)候選推廣信息的文本信息進(jìn)行特征提取,以獲得至少一個(gè)第二特征信息;以及
[0025]根據(jù)所述第一特征信息和所述至少一個(gè)第二特征信息,選擇至少一個(gè)候選推廣信息,以作為所述目標(biāo)推廣信息,以供在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送。
[0026]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述匹配單元,具體用于
[0027]計(jì)算所述第一特征信息與所述至少一個(gè)第二特征信息中每個(gè)第二特征信息之間的距離;以及
[0028]選擇最小的至少一個(gè)距離所對(duì)應(yīng)的第二特征信息所屬的至少一個(gè)候選推廣信息,以作為所述目標(biāo)推廣信息;或者選擇小于或等于預(yù)先配置的距離閾值的距離所對(duì)應(yīng)的第二特征信息所屬的至少一個(gè)候選推廣信息,以作為所述目標(biāo)推廣信息。
[0029]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述匹配單元,具體用于
[0030]利用LDA算法,對(duì)所述字幕內(nèi)容進(jìn)行特征提取,以獲得所述第一特征信息。
[0031]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述匹配單元,具體用于
[0032]利用LDA算法,對(duì)待推送的至少一個(gè)候選推廣信息的文本信息進(jìn)行特征提取,以獲得所述至少一個(gè)第二特征信息。
[0033]由上述技術(shù)方案可知,本發(fā)明實(shí)施例通過獲取多媒體文件的字幕內(nèi)容,進(jìn)而根據(jù)所述字幕內(nèi)容,獲得與所述字幕內(nèi)容匹配的候選推廣信息,以作為目標(biāo)推廣信息,使得能夠在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送,由于目標(biāo)推廣信息為與多媒體文件的字幕內(nèi)容匹配的推廣信息,因此,在所述多媒體文件的播放過程中進(jìn)行所述目標(biāo)推廣信息的推送,會(huì)引起視頻文件的觀看者的興趣以對(duì)推廣信息進(jìn)行進(jìn)一步操作行為,例如,點(diǎn)擊、注冊(cè)和購買等操作行為,能夠保證推廣信息的精準(zhǔn)推送,從而提高了推廣信息的轉(zhuǎn)化率。
[0034]另外,采用本發(fā)明提供的技術(shù)方案,由于目標(biāo)推廣信息為與多媒體文件的字幕內(nèi)容匹配的推廣信息,因此,在所述多媒體文件的播放過程中進(jìn)行所述目標(biāo)推廣信息的推送,會(huì)符合視頻文件的觀看者的情緒波動(dòng),能夠有效提高推廣信息的滿意度和相關(guān)性。
[0035]另外,采用本發(fā)明提供的技術(shù)方案,無需人工參與,即能實(shí)現(xiàn)推廣信息的自動(dòng)推送,因此,能夠有效提高推廣信息的推送成本。
【【專利附圖】
【附圖說明】】
[0036]為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0037]圖1為本發(fā)明一實(shí)施例提供的推廣信息的處理方法的流程示意圖;
[0038]圖2為本發(fā)明另一實(shí)施例提供的推廣信息的處理裝置的結(jié)構(gòu)示意圖。
【【具體實(shí)施方式】】
[0039]為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞 動(dòng)前提下所獲得的全部其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0040]需要說明的是,本發(fā)明實(shí)施例中所涉及的終端可以包括但不限于手機(jī)、個(gè)人數(shù)字助理(Personal Digital Assistant, PDA)、無線手持裝置、無線上網(wǎng)本、個(gè)人電腦(Personal Computer, PC)、便攜電腦、MP3播放器、MP4播放器等。
[0041 ] 另外,本文中術(shù)語“和/或”,僅僅是一種描述關(guān)聯(lián)對(duì)象的關(guān)聯(lián)關(guān)系,表示可以存在三種關(guān)系,例如,A和/或B,可以表示:單獨(dú)存在A,同時(shí)存在A和B,單獨(dú)存在B這三種情況。另外,本文中字符“/”,一般表示前后關(guān)聯(lián)對(duì)象是一種“或”的關(guān)系。
[0042]圖1為本發(fā)明一實(shí)施例提供的推廣信息的處理方法的流程示意圖,如圖1所示。
[0043]101、獲取多媒體文件的字幕內(nèi)容。
[0044]其中,多媒體文件可以包括但不限于音頻文件和視頻文件中的至少一項(xiàng),本實(shí)施例對(duì)此不進(jìn)行特別限定。
[0045]102、根據(jù)所述字幕內(nèi)容,獲得與所述字幕內(nèi)容匹配的候選推廣信息,以作為目標(biāo)推廣信息,以供在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送。
[0046]需要說明的是,101和102的執(zhí)行主體可以是推送裝置,可以位于本地的應(yīng)用中,或者還可以位于網(wǎng)絡(luò)側(cè)的服務(wù)器中,或者也可以部分功能位于應(yīng)用中,部分功能位于服務(wù)器中,本實(shí)施例對(duì)此不進(jìn)行限定。
[0047]可以理解的是,所述應(yīng)用可以是終端上所安裝的應(yīng)用程序,或者還可以是終端上所安裝的瀏覽器的一個(gè)網(wǎng)頁,只要能夠?qū)崿F(xiàn)推廣信息的匹配,以提供推廣信息的客觀存在形式都可以,本實(shí)施例對(duì)此不進(jìn)行特別限定。
[0048]這樣,通過獲取多媒體文件的字幕內(nèi)容,進(jìn)而根據(jù)所述字幕內(nèi)容,獲得與所述字幕內(nèi)容匹配的候選推廣信息,以作為目標(biāo)推廣信息,使得能夠在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送,由于目標(biāo)推廣信息為與多媒體文件的字幕內(nèi)容匹配的推廣信息,因此,在所述多媒體文件的播放過程中進(jìn)行所述目標(biāo)推廣信息的推送,會(huì)引起視頻文件的觀看者的興趣以對(duì)推廣信息進(jìn)行進(jìn)一步操作行為,例如,點(diǎn)擊、注冊(cè)和購買等操作行為,能夠保證推廣信息的精準(zhǔn)推送,從而提高了推廣信息的轉(zhuǎn)化率。
[0049]可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,在101中,推送裝置具體可以獲取多媒體文件在指定時(shí)間范圍之內(nèi)的內(nèi)幕信息,或者還可以獲取多媒體文件在全部時(shí)間范圍之內(nèi)的內(nèi)幕信息,本實(shí)施例對(duì)此不進(jìn)行特別限定。
[0050]一般來說,多媒體文件的字幕內(nèi)容可以存儲(chǔ)在字幕文件中,該字幕文件中包含字幕時(shí)間和字幕內(nèi)容,例如,字幕文件可以包含如下內(nèi)容:
[0051]00:00:36, 136 ^ 00:00:36, 731
[0052]What must it be like not to be crippled by fear and self-loathing ?;
[0053]其中,“00:00:36,136—00:00:36,731”為字幕時(shí)間,“What must it be like notto be crippled by fear and self-loathing ?,,為字幕內(nèi)容。
[0054]具體地,推送裝置具體可以對(duì)字幕文件進(jìn)行規(guī)格化處理,以提取出該字幕文件中所包含的字幕內(nèi)容。
[0055]還有些時(shí)候,多媒體文件的字幕內(nèi)容并不是單獨(dú)存儲(chǔ)在字幕文件中,而其就是多媒體文件的內(nèi)容的一部分。那么,所述推送裝置還可以進(jìn)一步利用現(xiàn)有技術(shù)中的字幕提取技術(shù),從多媒體文件中提取出字幕內(nèi)容。其中,字幕提取技術(shù)的詳細(xì)描述可以參見現(xiàn)有技術(shù)中的相關(guān)內(nèi)容,此處不再贅述。
[0056]可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,在102中,推送裝置具體可以對(duì)所述字幕內(nèi)容進(jìn)行特征提取,以獲得第一特征信息,以及對(duì)待推送的至少一個(gè)候選推廣信息的文本信息進(jìn)行特征提取,以獲得至少一個(gè)第二特征信息。然后,所述推送裝置則可以根據(jù)所述第一特征信息和所述至少一個(gè)第二特征信息,選擇至少一個(gè)候選推廣信息,以作為所述目標(biāo)推廣信息,以供在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送。
[0057]這樣,通過對(duì)多媒體文件的字幕內(nèi)容的挖掘,進(jìn)而匹配出對(duì)應(yīng)的候選推廣信息,以作為目標(biāo)推廣信息,使得能夠在多媒體文件的播放過程中進(jìn)行推送,能夠有效保證推廣信息的精準(zhǔn)推送,從而提高了推廣信息的轉(zhuǎn)化率。
[0058]具體地,所述推 送裝置具體可以計(jì)算所述第一特征信息與所述至少一個(gè)第二特征信息中每個(gè)第二特征信息之間的距離。
[0059]然后,所述推送裝置則可以選擇最小的至少一個(gè)距離所對(duì)應(yīng)的第二特征信息所屬的至少一個(gè)候選推廣信息,以作為所述目標(biāo)推廣信息。例如,可以按照距離從小到大的順序,對(duì)至少一個(gè)候選推廣信息進(jìn)行排序,排序結(jié)果中排名靠前的一個(gè)或多個(gè)候選推廣信息就是“最小的至少一個(gè)距離所對(duì)應(yīng)的第二特征信息所屬的至少一個(gè)候選推廣信息”。
[0060]或者,所述推送裝置還可以選擇小于或等于預(yù)先配置的距離閾值的距離所對(duì)應(yīng)的第二特征信息所屬的至少一個(gè)候選推廣信息,以作為所述目標(biāo)推廣信息,本實(shí)施例對(duì)此不進(jìn)行特別限定。
[0061]其中,所述候選推廣信息的文本信息,可以為候選推廣信息的屬性信息,可以包括但不限于類型;領(lǐng)域;關(guān)鍵詞;標(biāo)簽;以及描述中的至少一項(xiàng),本實(shí)施例對(duì)此不進(jìn)行特別限定。
[0062]具體地,推送裝置可以采用現(xiàn)有技術(shù)中的任一特征提取算法,對(duì)所述字幕內(nèi)容或候選推廣信息的文本信息進(jìn)行特征提取,本實(shí)施例對(duì)此不進(jìn)行特別限定。
[0063]例如,推送裝置可以利用主題模型(Latent Dirichlet Allocation,LDA)算法,對(duì)所述字幕內(nèi)容進(jìn)行特征提取,以獲得所述第一特征信息即特征向量A(al,a2, a3,……,an);以及利用LDA算法,對(duì)待推送的至少一個(gè)候選推廣信息的文本信息進(jìn)行特征提取,以獲得所述至少一個(gè)第二特征信息即特征向量B (bl,b2,b3,……,bn)。進(jìn)而,所述推送裝置則可
以計(jì)算特征向量A (al,a2,a3,......,an)與特征向量B (bl,b2,b3,......,bn)之間的距離。
其中,LDA算法的詳細(xì)描述可以參見現(xiàn)有技術(shù)中的相關(guān)內(nèi)容,此處不再贅述。
[0064]本實(shí)施例中,通過獲取多媒體文件的字幕內(nèi)容,進(jìn)而根據(jù)所述字幕內(nèi)容,獲得與所述字幕內(nèi)容匹配的候選推廣信息,以作為目標(biāo)推廣信息,使得能夠在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送,由于目標(biāo)推廣信息為與多媒體文件的字幕內(nèi)容匹配的推廣信息,因此,在所述多媒體文件的播放過程中進(jìn)行所述目標(biāo)推廣信息的推送,會(huì)引起視頻文件的觀看者的興趣以對(duì)推廣信息進(jìn)行進(jìn)一步操作行為,例如,點(diǎn)擊、注冊(cè)和購買等操作行為,能夠保證推廣信息的精準(zhǔn)推送,從而提高了推廣信息的轉(zhuǎn)化率。
[0065]另外,采用本發(fā)明提供的技術(shù)方案,由于目標(biāo)推廣信息為與多媒體文件的字幕內(nèi)容匹配的推廣信息,因此,在所述多媒體文件的播放過程中進(jìn)行所述目標(biāo)推廣信息的推送,會(huì)符合視頻文件的觀看者的情緒波動(dòng),能夠有效提高推廣信息的滿意度和相關(guān)性。
[0066]另外,采用本發(fā)明提供的技術(shù)方案,無需人工參與,即能實(shí)現(xiàn)推廣信息的自動(dòng)推送,因此,能夠有效提高推廣信息的推送成本。
[0067]另外,采用本發(fā)明提供的技術(shù)方案,無需人工參與,即能實(shí)現(xiàn)推廣信息的自動(dòng)推送,操作簡單,因此,能夠有效提高推廣信息的推送效率。
[0068]需要說明的是,對(duì)于前述的各方法實(shí)施例,為了簡單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本發(fā)明,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作和模塊并不一定是本發(fā)明所必須的。
[0069]在上述實(shí)施例中,對(duì)各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒有詳述的部分,可以參見其他實(shí)施例的相關(guān)描述。
[0070]圖2為本發(fā)明另一實(shí)施例提供的推廣信息的處理裝置的結(jié)構(gòu)示意圖,如圖2所示。本實(shí)施例的推廣信息的處理裝置可以包括獲取單元21和匹配單元22。其中,
[0071]獲取單元21,用于獲取多媒體文件的字幕內(nèi)容。
[0072]其中,多媒體文件可以包括但不限于音頻文件和視頻文件中的至少一項(xiàng),本實(shí)施例對(duì)此不進(jìn)行特別限定。
[0073]匹配單元22,用于根據(jù)所述字幕內(nèi)容,獲得與所述字幕內(nèi)容匹配的候選推廣信息,以作為目標(biāo)推廣信息,以供在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送。
[0074]需要說明的 是,本實(shí)施例所提供的推廣信息的處理裝置可以是一推送裝置,可以位于本地的應(yīng)用中,或者還可以位于網(wǎng)絡(luò)側(cè)的服務(wù)器中,或者也可以部分功能位于應(yīng)用中,部分功能位于服務(wù)器中,本實(shí)施例對(duì)此不進(jìn)行限定。
[0075]可以理解的是,所述應(yīng)用可以是終端上所安裝的應(yīng)用程序,或者還可以是終端上所安裝的瀏覽器的一個(gè)網(wǎng)頁,只要能夠?qū)崿F(xiàn)推廣信息的匹配,以提供推廣信息的客觀存在形式都可以,本實(shí)施例對(duì)此不進(jìn)行特別限定。
[0076]這樣,通過獲取單元獲取多媒體文件的字幕內(nèi)容,進(jìn)而由匹配單元根據(jù)所述字幕內(nèi)容,獲得與所述字幕內(nèi)容匹配的候選推廣信息,以作為目標(biāo)推廣信息,使得能夠在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送,由于目標(biāo)推廣信息為與多媒體文件的字幕內(nèi)容匹配的推廣信息,因此,在所述多媒體文件的播放過程中進(jìn)行所述目標(biāo)推廣信息的推送,會(huì)引起視頻文件的觀看者的興趣以對(duì)推廣信息進(jìn)行進(jìn)一步操作行為,例如,點(diǎn)擊、注冊(cè)和購買等操作行為,能夠保證推廣信息的精準(zhǔn)推送,從而提高了推廣信息的轉(zhuǎn)化率。
[0077]可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,所述獲取單元21,具體可以獲取多媒體文件在指定時(shí)間范圍之內(nèi)的內(nèi)幕信息,或者還可以獲取多媒體文件在全部時(shí)間范圍之內(nèi)的內(nèi)幕信息,本實(shí)施例對(duì)此不進(jìn)行特別限定。
[0078]一般來說,多媒體文件的字幕內(nèi)容可以存儲(chǔ)在字幕文件中,該字幕文件中包含字幕時(shí)間和字幕內(nèi)容,例如,字幕文件可以包含如下內(nèi)容:
[0079]00:00:36,136 — 00:00:36,731
[0080]What must it be like not to be crippled by fear and self-loathing ?;
[0081]其中,“00:00:36,136—00:00:36,731”為字幕時(shí)間,“What must it be like notto be crippled by fear and self-loathing ?,,為字幕內(nèi)容。
[0082]具體地,所述獲取單元21具體可以對(duì)字幕文件進(jìn)行規(guī)格化處理,以提取出該字幕文件中所包含的字幕內(nèi)容。
[0083]還有些時(shí)候,多媒體文件的字幕內(nèi)容并不是單獨(dú)存儲(chǔ)在字幕文件中,而其就是多媒體文件的內(nèi)容的一部分。那么,所述獲取單元21還可以進(jìn)一步利用現(xiàn)有技術(shù)中的字幕提取技術(shù),從多媒體文件中提取出字幕內(nèi)容。其中,字幕提取技術(shù)的詳細(xì)描述可以參見現(xiàn)有技術(shù)中的相關(guān)內(nèi)容,此處不再贅述。
[0084]可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,所述匹配單元22,具體可以用于對(duì)所述字幕內(nèi)容進(jìn)行特征提取,以獲得第一特征信息;對(duì)待推送的至少一個(gè)候選推廣信息的文本信息進(jìn)行特征提取,以獲得至少一個(gè)第二特征信息;以及根據(jù)所述第一特征信息和所述至少一個(gè)第二特征信息,選擇至少一個(gè)候選推廣信息,以作為所述目標(biāo)推廣信息,以供在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送。
[0085]這樣,通過對(duì)多媒體文件的字幕內(nèi)容的挖掘,進(jìn)而匹配出對(duì)應(yīng)的候選推廣信息,以作為目標(biāo)推廣信息,使得能夠在多媒體文件的播放過程中進(jìn)行推送,能夠有效保證推廣信息的精準(zhǔn)推送,從而提高了推廣信息的轉(zhuǎn)化率。
[0086]具體地,所述匹配單元22,具體可以用于計(jì)算所述第一特征信息與所述至少一個(gè)第二特征信息中每個(gè)第二特征信息之間的距離;以及選擇最小的至少一個(gè)距離所對(duì)應(yīng)的第二特征信息所屬的至少一個(gè)候選推廣信息,以作為所述目標(biāo)推廣信息。例如,可以按照距離從小到大的順序,對(duì)至少一個(gè)候選推廣信息進(jìn)行排序,排序結(jié)果中排名靠前的一個(gè)或多個(gè)候選推廣信息就是“最小的至少一個(gè)距離所對(duì)應(yīng)的第二特征信息所屬的至少一個(gè)候選推廣信息”。
[0087] 具體地,所述匹配單元22,具體可以用于計(jì)算所述第一特征信息與所述至少一個(gè)第二特征信息中每個(gè)第二特征信息之間的距離;以及選擇小于或等于預(yù)先配置的距離閾值的距離所對(duì)應(yīng)的第二特征信息所屬的至少一個(gè)候選推廣信息,以作為所述目標(biāo)推廣信息。
[0088]其中,所述候選推廣信息的文本信息,可以為候選推廣信息的屬性信息,可以包括但不限于類型;領(lǐng)域;關(guān)鍵詞;標(biāo)簽;以及描述中的至少一項(xiàng),本實(shí)施例對(duì)此不進(jìn)行特別限定。
[0089]具體地,所述匹配單元2 2可以采用現(xiàn)有技術(shù)中的任一特征提取算法,對(duì)所述字幕內(nèi)容或候選推廣信息的文本信息進(jìn)行特征提取,本實(shí)施例對(duì)此不進(jìn)行特別限定。
[0090]例如,所述匹配單元22可以利用LDA算法,對(duì)所述字幕內(nèi)容進(jìn)行特征提取,以獲得所述第一特征信息即特征向量A (al,a2,a3,……,an);以及利用LDA算法,對(duì)待推送的至少一個(gè)候選推廣信息的文本信息進(jìn)行特征提取,以獲得所述至少一個(gè)第二特征信息即特征
向量B (bl,b2,b3,......,bn)。進(jìn)而,貝U可以計(jì)算特征向量A (al,a2,a3,......,an)與特征
向量B (bl,b2,b3,……,bn)之間的距離。其中,LDA算法的詳細(xì)描述可以參見現(xiàn)有技術(shù)中的相關(guān)內(nèi)容,此處不再贅述。
[0091]本實(shí)施例中,通過獲取單元獲取多媒體文件的字幕內(nèi)容,進(jìn)而由匹配單元根據(jù)所述字幕內(nèi)容,獲得與所述字幕內(nèi)容匹配的候選推廣信息,以作為目標(biāo)推廣信息,使得能夠在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送,由于目標(biāo)推廣信息為與多媒體文件的字幕內(nèi)容匹配的推廣信息,因此,在所述多媒體文件的播放過程中進(jìn)行所述目標(biāo)推廣信息的推送,會(huì)引起視頻文件的觀看者的興趣以對(duì)推廣信息進(jìn)行進(jìn)一步操作行為,例如,點(diǎn)擊、注冊(cè)和購買等操作行為,能夠保證推廣信息的精準(zhǔn)推送,從而提高了推廣信息的轉(zhuǎn)化率。
[0092]另外,采用本發(fā)明提供的技術(shù)方案,由于目標(biāo)推廣信息為與多媒體文件的字幕內(nèi)容匹配的推廣信息,因此,在所述多媒體文件的播放過程中進(jìn)行所述目標(biāo)推廣信息的推送,會(huì)符合視頻文件的觀看者的情緒波動(dòng),能夠有效提高推廣信息的滿意度和相關(guān)性。
[0093]另外,采用本發(fā)明提供的技術(shù)方案,無需人工參與,即能實(shí)現(xiàn)推廣信息的自動(dòng)推送,因此,能夠有效提高推廣信息的推送成本。
[0094]另外,采用本發(fā)明提供的技術(shù)方案,無需人工參與,即能實(shí)現(xiàn)推廣信息的自動(dòng)推送,操作簡單,因此,能夠有效提高推廣信息的推送效率。
[0095]所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,上述描述的系統(tǒng),裝置和單元的具體工作過程,可以參考前述方法實(shí)施例中的對(duì)應(yīng)過程,在此不再贅述。
[0096]在本發(fā)明所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的系統(tǒng),裝置和方法,可以通過其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機(jī)械或其它的形式。
[0097]所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目的。[0098]另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用硬件加軟件功能單元的形式實(shí)現(xiàn)。
[0099]上述以軟件功能單元的形式實(shí)現(xiàn)的集成的單元,可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。上述軟件功能單元存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)裝置(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)裝置等)或處理器(processor)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤、移動(dòng)硬盤、只讀存儲(chǔ)器(Read-Only Memory, ROM)、隨機(jī)存取存儲(chǔ)器(Random Access Memory, RAM)、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
[0100]最后應(yīng)說明的是:以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍。
【權(quán)利要求】
1.一種推廣信息的處理方法,其特征在于,包括: 獲取多媒體文件的字幕內(nèi)容; 根據(jù)所述字幕內(nèi)容,獲得與所述字幕內(nèi)容匹配的候選推廣信息,以作為目標(biāo)推廣信息,以供在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述字幕內(nèi)容,獲得與所述字幕內(nèi)容匹配的候選推廣信息,以作為目標(biāo)推廣信息,以供在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送,包括: 對(duì)所述字幕內(nèi)容進(jìn)行 特征提取,以獲得第一特征信息; 對(duì)待推送的至少一個(gè)候選推廣信息的文本信息進(jìn)行特征提取,以獲得至少一個(gè)第二特征信息; 根據(jù)所述第一特征信息和所述至少一個(gè)第二特征信息,選擇至少一個(gè)候選推廣信息,以作為所述目標(biāo)推廣信息,以供在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述第一特征信息和所述至少一個(gè)第二特征信息,選擇至少一個(gè)候選推廣信息,以作為所述目標(biāo)推廣信息,包括: 計(jì)算所述第一特征信息與所述至少一個(gè)第二特征信息中每個(gè)第二特征信息之間的距離; 選擇最小的至少一個(gè)距離所對(duì)應(yīng)的第二特征信息所屬的至少一個(gè)候選推廣信息,以作為所述目標(biāo)推廣信息;或者選擇小于或等于預(yù)先配置的距離閾值的距離所對(duì)應(yīng)的第二特征信息所屬的至少一個(gè)候選推廣信息,以作為所述目標(biāo)推廣信息。
4.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,所述對(duì)所述字幕內(nèi)容進(jìn)行特征提取,以獲得第一特征信息,包括: 利用LDA算法,對(duì)所述字幕內(nèi)容進(jìn)行特征提取,以獲得所述第一特征信息。
5.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,所述對(duì)待推送的至少一個(gè)候選推廣信息的文本信息進(jìn)行特征提取,以獲得至少一個(gè)第二特征信息,包括: 利用LDA算法,對(duì)待推送的至少一個(gè)候選推廣信息的文本信息進(jìn)行特征提取,以獲得所述至少一個(gè)第二特征信息。
6.一種推廣信息的處理裝置,其特征在于,包括: 獲取單元,用于獲取多媒體文件的字幕內(nèi)容; 匹配單元,用于根據(jù)所述字幕內(nèi)容,獲得與所述字幕內(nèi)容匹配的候選推廣信息,以作為目標(biāo)推廣信息,以供在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述匹配單元,具體用于 對(duì)所述字幕內(nèi)容進(jìn)行特征提取,以獲得第一特征信息; 對(duì)待推送的至少一個(gè)候選推廣信息的文本信息進(jìn)行特征提取,以獲得至少一個(gè)第二特征信息;以及 根據(jù)所述第一特征信息和所述至少一個(gè)第二特征信息,選擇至少一個(gè)候選推廣信息,以作為所述目標(biāo)推廣信息,以供在所述多媒體文件的播放過程中,進(jìn)行所述目標(biāo)推廣信息的推送。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述匹配單元,具體用于計(jì)算所述第一特征信息與所述至少一個(gè)第二特征信息中每個(gè)第二特征信息之間的距離;以及 選擇最小的至少一個(gè)距離所對(duì)應(yīng)的第二特征信息所屬的至少一個(gè)候選推廣信息,以作為所述目標(biāo)推廣信息;或者選擇小于或等于預(yù)先配置的距離閾值的距離所對(duì)應(yīng)的第二特征信息所屬的至少一個(gè)候選推廣信息,以作為所述目標(biāo)推廣信息。
9.根據(jù)權(quán)利要求7或8所述的裝置,其特征在于,所述匹配單元,具體用于 利用LDA算法,對(duì)所述字幕內(nèi)容進(jìn)行特征提取,以獲得所述第一特征信息。
10.根據(jù)權(quán)利要求7或8所述的裝置,其特征在于,所述匹配單元,具體用于 利用LDA算法,對(duì)待推送的至少一個(gè)候選推廣信息的文本信息進(jìn)行特征提取,以獲得所述至少一個(gè)第 二特征信息。
【文檔編號(hào)】G06Q30/02GK103971268SQ201410148989
【公開日】2014年8月6日 申請(qǐng)日期:2014年4月14日 優(yōu)先權(quán)日:2014年4月14日
【發(fā)明者】由清圳 申請(qǐng)人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司