本申請涉及計算機技術領域,具體涉及互聯網技術領域,尤其涉及用于推送信息的方法和裝置。
背景技術:
信息推送,又稱為“網絡廣播”,通常是通過一定的技術標準或協(xié)議,在互聯網上通過推送用戶需要的信息來減少信息過載的一項技術。信息推送技術通過主動推送信息給用戶,可以減少用戶在網絡上搜索所花的時間。
然而,現有的信息推送方式通常是在用戶當前播放的多媒體信息中上直接加載各種推送多媒體信息,這些推送多媒體信息與用戶當前播放的多媒體信息的內容有明顯的差異,從而導致信息推送缺乏針對性。
技術實現要素:
本申請的目的在于提出一種改進的用于推送信息的方法和裝置,來解決以上背景技術部分提到的技術問題。
第一方面,本申請實施例提供了一種用于推送信息的方法,該方法包括:獲取用戶當前播放的多媒體信息的關鍵信息,其中,關鍵信息用于描述多媒體信息的內容;提取關鍵信息的關鍵詞集合;將關鍵詞集合導入預先訓練的多媒體信息分類模型進行分類得到多媒體信息所屬的類別,其中,多媒體信息分類模型用于表征與多媒體信息相對應關鍵詞集合和多媒體信息所屬的類別的對應關系;從預先存儲的待推送多媒體信息集合中選取出與多媒體信息所屬的類別相匹配的待推送多媒體信息作為目標待推送多媒體信息;將目標待推送多媒體信息插入多媒體信息中,并推送給用戶。
在一些實施例中,該方法還包括建立多媒體信息分類模型的步驟,建立多媒體信息分類模型的步驟包括:獲取樣本多媒體信息集合和樣本多媒體信息集合中的每一個樣本多媒體信息所屬的類別;對于樣本多媒體信息集合中的每一個樣本多媒體信息,獲取樣本多媒體信息的樣本關鍵信息,提取樣本關鍵信息的樣本關鍵詞集合;利用人工神經網絡,基于與樣本多媒體信息集合中的每一個樣本多媒體信息相對應的樣本關鍵詞集合和樣本多媒體信息集合中的每一個樣本多媒體信息所屬的類別,訓練得到多媒體信息分類模型。
在一些實施例中,獲取樣本多媒體信息的樣本關鍵信息,包括:獲取樣本多媒體信息的樣本描述信息作為第一樣本關鍵信息;從樣本多媒體信息中提取樣本關鍵信息作為第二樣本關鍵信息;將第一樣本關鍵信息和第二樣本關鍵信息合并,生成樣本多媒體信息的樣本關鍵信息。
在一些實施例中,從樣本多媒體信息中提取樣本關鍵信息作為第二樣本關鍵信息,包括:對樣本多媒體信息進行語音識別,獲取與樣本多媒體信息相匹配的文字信息作為第二樣本關鍵信息。
在一些實施例中,從樣本多媒體信息中提取樣本關鍵信息作為第二樣本關鍵信息,包括:將樣本多媒體信息劃分成第一預設數目個樣本多媒體信息片段;從所劃分出的樣本多媒體信息片段中選取出第二預設數目個樣本多媒體信息片段;對所選取出的樣本多媒體信息片段進行語音識別,獲取與所選取出的樣本多媒體信息片段相匹配的文字信息作為第二樣本關鍵信息。
在一些實施例中,提取樣本關鍵信息的樣本關鍵詞集合,包括:基于循環(huán)神經網絡的分詞技術,對樣本關鍵信息進行分詞,獲取樣本關鍵信息的樣本關鍵詞集合。
第二方面,本申請實施例提供了一種用于推送信息的裝置,該裝置包括:獲取單元,配置用于獲取用戶當前播放的多媒體信息的關鍵信息,其中,關鍵信息用于描述多媒體信息的內容;提取單元,配置用于提取關鍵信息的關鍵詞集合;分類單元,配置用于將關鍵詞集合導入預先訓練的多媒體信息分類模型進行分類得到多媒體信息所屬的類別,其中,多媒體信息分類模型用于表征與多媒體信息相對應關鍵詞集合和多媒體信息所屬的類別的對應關系;選取單元,配置用于從預先存儲的待推送多媒體信息集合中選取出與多媒體信息所屬的類別相匹配的待推送多媒體信息作為目標待推送多媒體信息;插入單元,配置用于將目標待推送多媒體信息插入多媒體信息中,并推送給用戶。
在一些實施例中,該裝置還包括:多媒體信息分類模型建立單元,配置用于建立多媒體信息分類模型,包括:獲取子單元,配置用于獲取樣本多媒體信息集合和樣本多媒體信息集合中的每一個樣本多媒體信息所屬的類別;提取子單元,配置用于對于樣本多媒體信息集合中的每一個樣本多媒體信息,獲取樣本多媒體信息的樣本關鍵信息,提取樣本關鍵信息的樣本關鍵詞集合;訓練子單元,配置用于利用人工神經網絡,基于與樣本多媒體信息集合中的每一個樣本多媒體信息相對應的樣本關鍵詞集合和樣本多媒體信息集合中的每一個樣本多媒體信息所屬的類別,訓練得到多媒體信息分類模型。
在一些實施例中,提取子單元包括:獲取模塊,配置用于獲取樣本多媒體信息的樣本描述信息作為第一樣本關鍵信息;提取模塊,配置用于從樣本多媒體信息中提取樣本關鍵信息作為第二樣本關鍵信息;合并模塊,配置用于將第一樣本關鍵信息和第二樣本關鍵信息合并,生成樣本多媒體信息的樣本關鍵信息。
在一些實施例中,提取模塊進一步配置用于:對樣本多媒體信息進行語音識別,獲取與樣本多媒體信息相匹配的文字信息作為第二樣本關鍵信息。
在一些實施例中,提取模塊進一步配置用于:將樣本多媒體信息劃分成第一預設數目個樣本多媒體信息片段;從所劃分出的樣本多媒體信息片段中選取出第二預設數目個樣本多媒體信息片段;對所選取出的樣本多媒體信息片段進行語音識別,獲取與所選取出的樣本多媒體信息片段相匹配的文字信息作為第二樣本關鍵信息。
在一些實施例中,提取子單元還包括:分詞模塊,配置用于基于循環(huán)神經網絡的分詞技術,對樣本關鍵信息進行分詞,獲取樣本關鍵信息的樣本關鍵詞集合。
第三方面,本申請實施例提供了一種服務器,該服務器包括:一個或多個處理器;存儲裝置,用于存儲一個或多個程序,當一個或多個程序被一個或多個處理器執(zhí)行,使得一個或多個處理器實現如第一方面中任一實現方式描述的方法。
第四方面,本申請實施例提供了一種計算機可讀存儲介質,其上存儲有計算機程序,該計算機程序被處理器執(zhí)行時實現如第一方面中任一實現方式描述的方法。
本申請實施例提供的用于推送信息的方法和裝置,通過提取用戶當前播放的多媒體信息的關鍵信息的關鍵詞集合;而后將所提取出的關鍵詞集合導入預先訓練的多媒體信息分類模型進行分類,得到該多媒體信息所屬的類別;最后從預先存儲的待推送多媒體信息集合中,選取出與該多媒體信息所屬的類別相匹配的待推送多媒體信息作為目標待推送多媒體信息,并將其插入該多媒體信息中推送給用戶。通過多媒體信息分類模型對與多媒體信息相對應的關鍵詞集合進行分類,得到該多媒體信息所屬的類別,從而可以選取出與該多媒體信息的類別相匹配的待推送多媒體信息推送給用戶,實現了富于針對性的信息推送。
附圖說明
通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本申請的其它特征、目的和優(yōu)點將會變得更明顯:
圖1是本申請實施例可以應用于其中的示例性系統(tǒng)架構圖;
圖2是根據本申請的用于推送信息的方法的一個實施例的流程圖;
圖3是根據本申請實施例的用于推送信息的方法的一個應用場景的時序圖;
圖4是根據本申請的建立多媒體信息分類模型的方法的一個實施例的流程圖;
圖5是對圖4的流程圖中的獲取樣本多媒體信息的樣本關鍵信息的步驟的分解流程圖;
圖6是對圖5的流程圖中的從樣本多媒體信息中提取樣本關鍵信息作為第二樣本關鍵信息的步驟的分解流程圖;
圖7是根據本申請的用于推送信息的裝置的一個實施例的結構示意圖;
圖8是適于用來實現本申請實施例的服務器的計算機系統(tǒng)的結構示意圖。
具體實施方式
下面結合附圖和實施例對本申請作進一步的詳細說明。可以理解的是,此處所描述的具體實施例僅僅用于解釋相關發(fā)明,而非對該發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與有關發(fā)明相關的部分。
需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。下面將參考附圖并結合實施例來詳細說明本申請。
圖1示出了可以應用本申請的用于推送信息的方法或用于推送信息的裝置的實施例的示例性系統(tǒng)架構100。
如圖1所示,系統(tǒng)架構100可以包括終端設備101、102、103,網絡104和服務器105。網絡104用以在終端設備101、102、103和服務器105之間提供通信鏈路的介質。網絡104可以包括各種連接類型,例如有線、無線通信鏈路或者光纖電纜等等。
用戶110可以使用終端設備101、102、103通過網絡104與服務器105交互,以接收或發(fā)送消息等。終端設備101、102、103上可以安裝有各種通訊客戶端應用,例如視頻類應用、音樂類應用、網頁瀏覽器應用、搜索類應用等等。
終端設備101、102、103可以是支持多媒體信息播放的各種電子設備,包括但不限于智能手機、平板電腦、電子書閱讀器、mp3(movingpictureexpertsgroupaudiolayeriii,動態(tài)影像專家壓縮標準音頻層面3)播放器、mp4(movingpictureexpertsgroupaudiolayeriv,動態(tài)影像專家壓縮標準音頻層面4)播放器、膝上型便攜計算機和臺式計算機等等。
服務器105可以是提供各種服務的服務器,例如對終端設備101、102、103上播放的多媒體信息提供支持的后臺多媒體服務器。后臺多媒體服務器可以對終端設備101、102、103上播放的多媒體信息進行分析等處理并將處理結果(例如插入待推送多媒體信息的多媒體信息)反饋給終端設備101、102、103。
需要說明的是,本申請實施例所提供的用于推送信息的方法一般由服務器105執(zhí)行,相應地,用于推送信息的裝置一般設置于服務器105中。
應該理解,圖1中的終端設備、網絡和服務器的數目僅僅是示意性的。根據實現需要,可以具有任意數目的終端設備、網絡和服務器。
繼續(xù)參考圖2,示出了根據本申請的用于推送信息的方法的一個實施例的流程200。該用于推送信息的方法,包括以下步驟:
步驟201,獲取用戶當前播放的多媒體信息的關鍵信息。
在本實施例中,用于推送信息的方法運行于其上的電子設備(例如圖1所示的服務器105)可以獲取用戶的客戶端(例如圖1所示的終端設備101、102、103)上當前播放的多媒體信息的關鍵信息。其中,多媒體信息可以是視頻信息或音頻信息。關鍵信息可以用于描述多媒體信息的內容,包括但不限于多媒體信息的標題、類型、內容簡介或內容詳介等。
通常,電子設備可以持續(xù)監(jiān)測用戶在客戶端上的操作。當電子設備監(jiān)測到用戶對一段多媒體信息的播放按鍵操作時,電子設備確定用戶當前正在播放該多媒體信息,并獲取該多媒體信息的關鍵信息。其中,多媒體信息的播放按鍵可以包括但不限于實體播放按鍵、虛擬播放按鍵等等。
需要說明的是,電子設備可以從本地、用戶的客戶端或與其通信連接的其他服務器獲取多媒體信息的關鍵信息,本實施例對多媒體信息的關鍵信息的具體存儲位置不進行限定。
步驟202,提取關鍵信息的關鍵詞集合。
在本實施例中,基于步驟201中獲取到的關鍵信息,電子設備可以對關鍵信息進行內容分析,從而提取出該關鍵信息的關鍵詞集合。其中,關鍵詞集合可以包括至少一個關鍵詞。
在本實施例的一些可選的實現方式中,電子設備對關鍵信息的內容分析方式可以是統(tǒng)計分析方式。作為示例,電子設備可以對關鍵信息的內容中存在的各個詞語的出現頻率進行統(tǒng)計和排序,之后再選取出現頻率排序靠前的一個或多個詞語生成關鍵詞集合。
在本實施例的一些可選的實現方式中,電子設備對關鍵信息的內容分析方式可以是語義分析方式。作為示例,電子設備可以對關鍵信息的內容進行全切分方法等處理,把內容分割成詞;之后對所得到的詞進行重要性計算(例如采用tf-idf(termfrequency-inversedocumentfrequency,詞頻-逆向文件頻率方法));最后基于重要性計算的結果選取關鍵詞集合。
在本實施例的一些可選的實現方式中,電子設備對關鍵信息的內容分析方式可以是基于rnn(recurrentneuralnetwork,循環(huán)神經網絡)的分詞方式。作為示例,電子設備可以采用預先訓練的keras模型將關鍵信息的內容劃分成詞語序列以生成關鍵詞集合。其中,keras是一個高度模塊化的深度學習框架,使用python(一種面向對象的解釋型計算機程序設計語言)編寫,封裝了大量的函數接口,可支持cpu(centralprocessingunit,中央處理器)和gpu(graphicsprocessingunit,圖形處理器)訓練。keras提供了一系列模塊,包括但不限于optimizers(優(yōu)化函數模塊)、objectives(目標函數模塊)、activations(激活函數模塊)、layers(網絡層模塊)等等。在進行keras模型訓練時,只需調用相應的模塊就可以完成模型搭建。需要說明的是,訓練keras模型的方法是目前廣泛研究和應用的公知技術,在此不再贅述。
步驟203,將關鍵詞集合導入預先訓練的多媒體信息分類模型進行分類得到多媒體信息所屬的類別。
在本實施例中,基于步驟202中提取出的關鍵詞集合,電子設備可以將關鍵詞集合導入預先訓練的多媒體信息分類模型,多媒體信息分類模型會按照預先訓練好的對應關系,為關鍵詞集合找到與其對應的類別,并將該類別作為多媒體信息所屬的類別。其中,多媒體信息分類模型可以用于表征與多媒體信息相對應關鍵詞集合和多媒體信息所屬的類別的對應關系。
在本實施例中,電子設備可以首先將關鍵詞集合導入預先訓練的多媒體信息分類模型得到包含匹配度的至少一個類別。其中,匹配度可以用于表征根據關鍵詞集合確定多媒體信息所屬的類別的準確性,匹配度可以用多種形式表示,包括但不限于百分比形式或數值大小的形式等。然后按匹配度結果,從至少一個類別中選取出類別作為多媒體信息的類別。例如,電子設備可以選取出匹配度最高的類別作為多媒體信息所屬的類別。
在本實施例中,電子設備可以通過各種方式建立多媒體信息分類模型。作為示例,對于樣本多媒體信息集合中的每一個樣本多媒體信息,首先可以通過人工識別方式得到與該樣本多媒體信息相對應的樣本關鍵詞集合和該樣本多媒體信息所屬的類別;然后電子設備可以利用人工神經網絡,基于與樣本多媒體信息集合中的每一個樣本多媒體信息相對應的樣本關鍵詞集合和樣本多媒體信息集合中的每一個樣本多媒體信息所屬的類別,訓練得到多媒體信息分類模型。
步驟204,從預先存儲的待推送多媒體信息集合中選取出與多媒體信息所屬的類別相匹配的待推送多媒體信息作為目標待推送多媒體信息。
在本實施例中,基于步驟203中得到的多媒體信息所屬的類別,電子設備可以從預先存儲的待推送多媒體信息集合中選取出與多媒體信息所屬的類別相匹配的待推送多媒體信息作為目標待推送多媒體信息。其中,待推送多媒體信息集合中的每一個待推送多媒體信息都有其所屬的類別。目標待推送多媒體信息可以是待推送多媒體信息集合中與該多媒體信息所屬的類別相同或相近的待推送多媒體信息。
在本實施例的一些可選的實現方式中,若待推送多媒體信息集合中存在多條與該多媒體信息所屬的類別相匹配的待推送多媒體信息,電子設備可以從中隨機選取出預定數目條待推送多媒體信息作為目標待推送信息。
在本實施例的一些可選的實現方式中,若待推送多媒體信息集合中存在多條與該多媒體信息所屬的類別相匹配的待推送多媒體信息,電子設備可以按照預先為待推送多媒體信息集合中的每一條待推送多媒體信息設定的優(yōu)先級從中選取出預定數目條待推送多媒體信息作為目標待推送信息。
需要說明的是,待推送多媒體信息集合中的每一個待推送多媒體信息所屬的類別可以是通過人工識別方式得到的,也可以是通過預先訓練的多媒體信息分類模型得到的,本實施例中對此不進行具體的限定。
步驟205,將目標待推送多媒體信息插入多媒體信息中,并推送給用戶。
在本實施例中,基于步驟204中選取出的目標待推送多媒體信息,電子設備可以將目標待推送多媒體信息插入多媒體信息中,以實現在用戶播放多媒體信息期間,目標待推送多媒體信息也可以呈現給用戶。
需要說明的是,目標待推送多媒體信息可以插入在多媒體信息的開始部位,也可以插入在多媒體信息的結束部位,還可以插入在多媒體信息的中間部位,本實施例對目標待推送多媒體信息在多媒體信息中的具體插入位置不進行限定。
繼續(xù)參見圖3,圖3是根據本申請實施例的用于推送信息的方法的一個應用場景的時序300。在圖3的應用場景中,如301所示,服務器監(jiān)測到客戶端當前正在播放紀錄片a;如302所示,服務器從客戶端獲取記錄片a的關鍵信息,例如,該關鍵信息為:“抗美援朝戰(zhàn)爭開始以后,全體中國人民上下齊心開展了一場聲勢浩大的抗美援朝后方支前運動,表現出空前的愛國熱情”;如303所示,服務器提取關鍵信息的關鍵詞集合,例如,該關鍵詞集合為:“抗美援朝、戰(zhàn)爭、中國人民、抗美援朝后方支前運動、愛國熱情”;如304所示,服務器將關鍵詞集合導入預先訓練的多媒體信息分類模型進行分類得到紀錄片a所屬的類別,例如,紀錄片a所屬的類別為“戰(zhàn)爭”類別;如305所示,服務器從預先存儲的待推送多媒體信息集合中選取出待推送多媒體視頻b,其中,待推送多媒體視頻b與紀錄片a所屬的類別相匹配,例如,待推送多媒體視頻b可以是反對戰(zhàn)爭的公益廣告;如306所示,服務器將待推送多媒體視頻b插入到記錄片a的片尾處;如307所示,服務器將插入待推送多媒體視頻b的記錄片a發(fā)送至用戶的客戶端,當用戶的客戶端上的記錄片a播放結束后就會播放待推送多媒體視頻b。
本申請實施例提供的用于推送信息的方法通過提取用戶當前播放的多媒體信息的關鍵信息的關鍵詞集合;而后將所提取出的關鍵詞集合導入預先訓練的多媒體信息分類模型進行分類得到該多媒體信息所屬的類別;最后從預先存儲的待推送多媒體信息集合中選取出與該多媒體信息所屬的類別相匹配的待推送多媒體信息作為目標待推送多媒體信息,并將其插入該多媒體信息中推送給用戶。通過多媒體信息分類模型對與多媒體信息相對應的關鍵詞集合進行分類得到該多媒體信息所屬的類別,從而可以選取出與該多媒體信息的類別相匹配的待推送多媒體信息推送給用戶,實現了富于針對性的信息推送。
進一步參考圖4,其示出了根據本申請的建立多媒體信息分類模型的方法的一個實施例的流程400。該流程400包括以下步驟:
步驟401,獲取樣本多媒體信息集合和樣本多媒體信息集合中的每一個樣本多媒體信息所屬的類別。
在本實施例中,電子設備(例如圖1所示的服務器105)可以從本地或者與其通信連接的其他服務器獲取樣本多媒體信息集合和樣本多媒體信息集合中的每一個樣本多媒體信息所屬的類別。
需要說明的是,樣本多媒體信息集合中的每一個樣本多媒體信息所屬的類別可以是通過人工識別方式得到的,也可以是通過其他多媒體信息分類模型得到的,本實施例中對此不進行具體的限定。
步驟402,對于樣本多媒體信息集合中的每一個樣本多媒體信息,獲取樣本多媒體信息的樣本關鍵信息,提取樣本關鍵信息的樣本關鍵詞集合。
在本實施例中,基于步驟401中獲取到的樣本多媒體信息集合中的每一個樣本多媒體信息,電子設備可以首先獲取該樣本多媒體信息的樣本關鍵信息;然后對該樣本關鍵信息進行內容分析,從而提取出該樣本關鍵信息的樣本關鍵詞集合。其中,樣本關鍵信息可以用于描述該樣本多媒體信息的內容。
在本實施例的一些可選的實現方式中,電子設備對該樣本關鍵信息的內容分析方式可以是統(tǒng)計分析方式。作為示例,電子設備可以對該樣本關鍵信息的內容中存在的各個詞語的出現頻率進行統(tǒng)計和排序,之后再選取出現頻率排序靠前的一個或多個詞語生成樣本關鍵詞集合。
在本實施例的一些可選的實現方式中,電子設備對該樣本關鍵信息的內容分析方式可以是語義分析方式。作為示例,電子設備可以對該樣本關鍵信息的內容進行全切分方法等處理,把內容分割成詞;之后對所得到的詞進行重要性計算(例如采用tf-idf);最后基于重要性計算的結果選取樣本關鍵詞集合。
在本實施例的一些可選的實現方式中,電子設備對該樣本關鍵信息的內容分析方式可以是基于rnn的分詞方式。具體地,電子設備可以基于rnn的分詞技術,對該樣本關鍵信息進行分詞,獲取該樣本關鍵信息的樣本關鍵詞集合。作為示例,電子設備可以采用預先訓練的keras模型將該樣本關鍵信息的內容劃分成詞語序列以生成樣本關鍵詞集合。
步驟403,利用人工神經網絡,基于與樣本多媒體信息集合中的每一個樣本多媒體信息相對應的樣本關鍵詞集合和樣本多媒體信息集合中的每一個樣本多媒體信息所屬的類別,訓練得到多媒體信息分類模型。
在本實施例中,基于步驟402中提取出的與樣本多媒體信息集合中的每一個樣本多媒體信息相對應的樣本關鍵詞集合,以及基于步驟401中獲取到的樣本多媒體信息集合中的每一個樣本多媒體信息所屬的類別,電子設備可以利用人工神經網絡,通過與樣本多媒體信息集合中的每一個樣本多媒體信息相對應的樣本關鍵詞集合和樣本多媒體信息集合中的每一個樣本多媒體信息所屬的類別對多媒體信息分類模型進行訓練,得到能夠建立與樣本多媒體信息集合中的每一個樣本多媒體信息相對應的樣本關鍵詞集合和樣本多媒體信息集合中的每一個樣本多媒體信息所屬的類別之間準確對應關系的訓練后的多媒體信息分類模型。
本申請實施例提供的建立多媒體信息分類模型的方法通過與樣本多媒體信息集合中的每一個樣本多媒體信息相對應的樣本關鍵詞集合和樣本多媒體信息集合中的每一個樣本多媒體信息所屬的類別對多媒體信息分類模型進行訓練,從而使建立的多媒體信息分類模型能夠準確地表征與多媒體信息相對應關鍵詞集合和多媒體信息所屬的類別的對應關系。
進一步參考圖5,其是對圖4的流程圖中的獲取樣本多媒體信息的樣本關鍵信息的步驟的分解流程500。該流程500包括以下步驟:
步驟501,獲取樣本多媒體信息的樣本描述信息作為第一樣本關鍵信息。
在本實施例中,電子設備(如圖1中所示的服務器105)可以獲取樣本多媒體信息的樣本描述信息作為第一樣本關鍵信息。其中,樣本描述信息可以包括但不限于以下至少一項:標題、類型和內容簡介等等。
步驟502,從樣本多媒體信息中提取樣本關鍵信息作為第二樣本關鍵信息。
在本實施例中,電子設備可以從樣本多媒體信息中提取樣本關鍵信息作為第二樣本關鍵信息。作為示例,若樣本多媒體信息是視頻信息,電子設備可以首先提取樣本多媒體信息中的音頻信息,并對所提取的音頻信息進行語音識別以獲取樣本關鍵信息;然后提取樣本多媒體中的圖像信息,并對所提取的圖像信息進行圖像識別以獲取樣本關鍵信息;然后將所獲取到的樣本關鍵信息進行合并以生成第二樣本關鍵信息。
在本實施例的一些可選的實現方式中,電子設備可以對樣本多媒體信息進行語音識別,獲取與樣本多媒體信息相匹配的文字信息作為第二樣本關鍵信息。具體地,若樣本多媒體信息是音頻信息,電子設備可以直接對樣本多媒體信息進行語音識別以獲取第二樣本關鍵信息。若樣本多媒體信息是視頻信息,電子設備可以首先提取樣本多媒體信息中的音頻信息,然后對所提取的音頻信息進行語音識別以獲取第二樣本關鍵信息。
步驟503,將第一樣本關鍵信息和第二樣本關鍵信息合并,生成樣本多媒體信息的樣本關鍵信息。
在本實施例中,基于步驟501中獲取到的第一樣本關鍵信息和步驟502中獲取到的第二樣本關鍵信息,電子設備可以將第一樣本關鍵信息和第二樣本關鍵信息合并,以生成樣本多媒體信息的樣本關鍵信息。
需要說明的是,本實施例中第一樣本關鍵信息和第二樣本關鍵信息的合并方式可以是直接合并,也可以是去除第一樣本關鍵信息和第二樣本關鍵信息中的重復樣本關鍵信息后再合并,本實施例對具體的合并方式不進行限定。
本申請實施例提供的獲取樣本多媒體信息的樣本關鍵信息的方法通過獲取第一樣本關鍵信息和第二樣本關鍵信息以生成樣本關鍵信息,從而使生成的樣本關鍵信息可以全面的描述樣本多媒體信息的內容。
進一步參考圖6,其是對圖5的流程圖中的從樣本多媒體信息中提取樣本關鍵信息作為第二樣本關鍵信息的步驟的分解流程600。該流程600包括以下步驟:
步驟601,將樣本多媒體信息劃分成第一預設數目個樣本多媒體信息片段。
在本實施例中,電子設備(如圖1中所示的服務器105)可以將樣本多媒體信息劃分成第一預設數目個樣本多媒體信息片段。其中,每個樣本多媒體信息片段的大小可以相同也可以不同。作為示例,若樣本多媒體信息是視頻信息,且樣本多媒體信息的時長為60min,則電子設備可以將樣本多媒體信息劃分成12個5min時長的樣本多媒體信息片段。
步驟602,從所劃分出的樣本多媒體信息片段中選取出第二預設數目個樣本多媒體信息片段。
在本實施例中,基于步驟601中劃分出的樣本多媒體信息片段,電子設備可以從中選取出第二預設數目個樣本多媒體信息片段。其中,選取方式可以是隨機選取,也可以是基于預設方法進行選取。作為示例,對于被劃分成12個5min時長的樣本多媒體信息片段,電子設備可以每隔3個樣本多媒體信息片段選取出一個樣本多媒體信息片段。
步驟603,對所選取出的樣本多媒體信息片段進行語音識別,獲取與所選取出的樣本多媒體信息片段相匹配的文字信息作為第二樣本關鍵信息。
在本實施例中,基于步驟602中選取出的樣本多媒體信息片段,電子設備可以對所選取出的樣本多媒體信息片段進行語音識別,獲取與所選取出的樣本多媒體信息片段相匹配的文字信息作為第二樣本關鍵信息。
本申請實施例提供的提取第二樣本關鍵信息的方法通過將樣本多媒體信息劃分成若干個樣本多媒體信息片段;然后從中選取出部分樣本多媒體信息片段;最后對選取出的部分樣本多媒體信息片段進行語音識別,從而減小了語音識別的工作量。
進一步參考圖7,作為對上述各圖所示方法的實現,本申請?zhí)峁┝艘环N用于推送信息的裝置的一個實施例,該裝置實施例與圖2所示的方法實施例相對應,該裝置具體可以應用于各種電子設備中。
如圖7所示,本實施例所示的用于推送信息的裝置700包括:獲取單元701、提取單元702、分類單元703、選取單元704和插入單元705。其中,獲取單元701,配置用于獲取用戶當前播放的多媒體信息的關鍵信息,其中,關鍵信息用于描述多媒體信息的內容;提取單元702,配置用于提取關鍵信息的關鍵詞集合;分類單元703,配置用于將關鍵詞集合導入預先訓練的多媒體信息分類模型進行分類得到多媒體信息所屬的類別,其中,多媒體信息分類模型用于表征與多媒體信息相對應關鍵詞集合和多媒體信息所屬的類別的對應關系;選取單元704,配置用于從預先存儲的待推送多媒體信息集合中選取出與多媒體信息所屬的類別相匹配的待推送多媒體信息作為目標待推送多媒體信息;插入單元705,配置用于將目標待推送多媒體信息插入多媒體信息中,并推送給用戶。
在本實施例中,用于推送信息的裝置700中:獲取單元701、提取單元702、分類單元703、選取單元704和插入單元705的具體處理及其所帶來的技術效果可分別參考圖2對應實施例中的步驟201、步驟202、步驟203、步驟204和步驟205的相關說明,在此不再贅述。
在本實施例的一些可選的實現方式中,用于推送信息的裝置700還包括:多媒體信息分類模型建立單元(圖中未示出),配置用于建立多媒體信息分類模型,包括:獲取子單元(圖中未示出),配置用于獲取樣本多媒體信息集合和樣本多媒體信息集合中的每一個樣本多媒體信息所屬的類別;提取子單元(圖中未示出),配置用于對于樣本多媒體信息集合中的每一個樣本多媒體信息,獲取樣本多媒體信息的樣本關鍵信息,提取樣本關鍵信息的樣本關鍵詞集合;訓練子單元(圖中未示出),配置用于利用人工神經網絡,基于與樣本多媒體信息集合中的每一個樣本多媒體信息相對應的樣本關鍵詞集合和樣本多媒體信息集合中的每一個樣本多媒體信息所屬的類別,訓練得到多媒體信息分類模型。
在本實施例的一些可選的實現方式中,提取子單元(圖中未示出)包括:獲取模塊(圖中未示出),配置用于獲取樣本多媒體信息的樣本描述信息作為第一樣本關鍵信息;提取模塊(圖中未示出),配置用于從樣本多媒體信息中提取樣本關鍵信息作為第二樣本關鍵信息;合并模塊(圖中未示出),配置用于將第一樣本關鍵信息和第二樣本關鍵信息合并,生成樣本多媒體信息的樣本關鍵信息。
在本實施例的一些可選的實現方式中,提取模塊(圖中未示出)進一步配置用于:對樣本多媒體信息進行語音識別,獲取與樣本多媒體信息相匹配的文字信息作為第二樣本關鍵信息。
在本實施例的一些可選的實現方式中,提取模塊(圖中未示出)進一步配置用于:將樣本多媒體信息劃分成第一預設數目個樣本多媒體信息片段;從所劃分出的樣本多媒體信息片段中選取出第二預設數目個樣本多媒體信息片段;對所選取出的樣本多媒體信息片段進行語音識別,獲取與所選取出的樣本多媒體信息片段相匹配的文字信息作為第二樣本關鍵信息。
在本實施例的一些可選的實現方式中,提取子單元(圖中未示出)還包括:分詞模塊(圖中未示出),配置用于基于循環(huán)神經網絡的分詞技術,對樣本關鍵信息進行分詞,獲取樣本關鍵信息的樣本關鍵詞集合。
下面參考圖8,其示出了適于用來實現本申請實施例的服務器的計算機系統(tǒng)800的結構示意圖。圖8示出的服務器僅僅是一個示例,不應對本申請實施例的功能和使用范圍帶來任何限制。
如圖8所示,計算機系統(tǒng)800包括中央處理單元(cpu)801,其可以根據存儲在只讀存儲器(rom)802中的程序或者從存儲部分808加載到隨機訪問存儲器(ram)803中的程序而執(zhí)行各種適當的動作和處理。在ram803中,還存儲有系統(tǒng)800操作所需的各種程序和數據。cpu801、rom802以及ram803通過總線804彼此相連。輸入/輸出(i/o)接口805也連接至總線804。
以下部件連接至i/o接口805:包括鍵盤、鼠標等的輸入部分806;包括諸如陰極射線管(crt)、液晶顯示器(lcd)等以及揚聲器等的輸出部分807;包括硬盤等的存儲部分808;以及包括諸如lan卡、調制解調器等的網絡接口卡的通信部分809。通信部分809經由諸如因特網的網絡執(zhí)行通信處理。驅動器810也根據需要連接至i/o接口805??刹鹦督橘|811,諸如磁盤、光盤、磁光盤、半導體存儲器等等,根據需要安裝在驅動器810上,以便于從其上讀出的計算機程序根據需要被安裝入存儲部分808。
特別地,根據本公開的實施例,上文參考流程圖描述的過程可以被實現為計算機軟件程序。例如,本公開的實施例包括一種計算機程序產品,其包括承載在計算機可讀介質上的計算機程序,該計算機程序包含用于執(zhí)行流程圖所示的方法的程序代碼。在這樣的實施例中,該計算機程序可以通過通信部分809從網絡上被下載和安裝,和/或從可拆卸介質811被安裝。在該計算機程序被中央處理單元(cpu)801執(zhí)行時,執(zhí)行本申請的方法中限定的上述功能。
需要說明的是,本申請上述的計算機可讀介質可以是計算機可讀信號介質或者計算機可讀存儲介質或者是上述兩者的任意組合。計算機可讀存儲介質例如可以是——但不限于——電、磁、光、電磁、紅外線、或半導體的系統(tǒng)、裝置或器件,或者任意以上的組合。計算機可讀存儲介質的更具體的例子可以包括但不限于:具有一個或多個導線的電連接、便攜式計算機磁盤、硬盤、隨機訪問存儲器(ram)、只讀存儲器(rom)、可擦式可編程只讀存儲器(eprom或閃存)、光纖、便攜式緊湊磁盤只讀存儲器(cd-rom)、光存儲器件、磁存儲器件、或者上述的任意合適的組合。在本申請中,計算機可讀存儲介質可以是任何包含或存儲程序的有形介質,該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結合使用。而在本申請中,計算機可讀的信號介質可以包括在基帶中或者作為載波一部分傳播的數據信號,其中承載了計算機可讀的程序代碼。這種傳播的數據信號可以采用多種形式,包括但不限于電磁信號、光信號或上述的任意合適的組合。計算機可讀的信號介質還可以是計算機可讀存儲介質以外的任何計算機可讀介質,該計算機可讀介質可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結合使用的程序。計算機可讀介質上包含的程序代碼可以用任何適當的介質傳輸,包括但不限于:無線、電線、光纜、rf等等,或者上述的任意合適的組合。
附圖中的流程圖和框圖,圖示了按照本申請各種實施例的系統(tǒng)、方法和計算機程序產品的可能實現的體系架構、功能和操作。在這點上,流程圖或框圖中的每個方框可以代表一個模塊、程序段、或代碼的一部分,該模塊、程序段、或代碼的一部分包含一個或多個用于實現規(guī)定的邏輯功能的可執(zhí)行指令。也應當注意,在有些作為替換的實現中,方框中所標注的功能也可以以不同于附圖中所標注的順序發(fā)生。例如,兩個接連地表示的方框實際上可以基本并行地執(zhí)行,它們有時也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或操作的專用的基于硬件的系統(tǒng)來實現,或者可以用專用硬件與計算機指令的組合來實現。
描述于本申請實施例中所涉及到的單元可以通過軟件的方式實現,也可以通過硬件的方式來實現。所描述的單元也可以設置在處理器中,例如,可以描述為:一種處理器包括獲取單元、提取單元、分類單元、選取單元和插入單元。其中,這些單元的名稱在某種情況下并不構成對該單元本身的限定,例如,獲取單元還可以被描述為“獲取用戶當前播放的多媒體信息的關鍵信息的單元”。
作為另一方面,本申請還提供了一種計算機可讀介質,該計算機可讀介質可以是上述實施例中描述的服務器中所包含的;也可以是單獨存在,而未裝配入該服務器中。上述計算機可讀介質承載有一個或者多個程序,當上述一個或者多個程序被該服務器執(zhí)行時,使得該服務器:獲取用戶當前播放的多媒體信息的關鍵信息,其中,關鍵信息用于描述多媒體信息的內容;提取關鍵信息的關鍵詞集合;將關鍵詞集合導入預先訓練的多媒體信息分類模型進行分類得到多媒體信息所屬的類別,其中,多媒體信息分類模型用于表征與多媒體信息相對應關鍵詞集合和多媒體信息所屬的類別的對應關系;從預先存儲的待推送多媒體信息集合中選取出與多媒體信息所屬的類別相匹配的待推送多媒體信息作為目標待推送多媒體信息;將目標待推送多媒體信息插入多媒體信息中,并推送給用戶。
以上描述僅為本申請的較佳實施例以及對所運用技術原理的說明。本領域技術人員應當理解,本申請中所涉及的發(fā)明范圍,并不限于上述技術特征的特定組合而成的技術方案,同時也應涵蓋在不脫離上述發(fā)明構思的情況下,由上述技術特征或其等同特征進行任意組合而形成的其它技術方案。例如上述特征與本申請中公開的(但不限于)具有類似功能的技術特征進行互相替換而形成的技術方案。