基于文本的網(wǎng)頁內(nèi)容生成視頻摘要的方法、裝置及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及視頻生成領(lǐng)域,具體而言,涉及基于文本的網(wǎng)頁內(nèi)容生成視頻摘要的方法、裝置及系統(tǒng)。
【背景技術(shù)】
[0002]新聞網(wǎng)站,指以經(jīng)營新聞業(yè)務為主要生存手段的網(wǎng)站。包括國家大型新聞門戶,商業(yè)門戶,地方新聞門戶,還有各種行業(yè)門戶網(wǎng)站也充當了該行業(yè)的新聞網(wǎng)站。
[0003]現(xiàn)有的新聞網(wǎng)站,新聞展示一般基于文字及圖片來描述。目前用戶通過越來越多的途徑,例如手機、平板電腦、電視等,來獲取新聞的內(nèi)容。現(xiàn)有的新聞類應用從新聞網(wǎng)站獲取新聞的也多以文字圖片為主。
[0004]現(xiàn)有的新聞網(wǎng)站上新聞的缺點是在內(nèi)容快速消費時代,用戶閱讀文字的時間成本相對提高,不利于新聞網(wǎng)站用文字向用戶展示新聞。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的在于提供一種基于文本的網(wǎng)頁內(nèi)容生成視頻摘要的方法、裝置及系統(tǒng),用生成視頻摘要的方式向用戶展示網(wǎng)頁上的新聞,以節(jié)省用戶閱讀新聞網(wǎng)頁上新聞的時間成本。
[0006]第一方面,本發(fā)明實施例提供了一種文本的網(wǎng)頁內(nèi)容生成視頻摘要的方法,包括:提取目標新聞網(wǎng)頁文本內(nèi)容的文本摘要;解析所述文本摘要,得到所述文本摘要中的關(guān)鍵詞;對所述關(guān)鍵詞進行語義分析,得到所述關(guān)鍵詞本體語義;基于所述關(guān)鍵詞本體語義,從互聯(lián)網(wǎng)絡中檢索對應的圖片或視頻,形成背景圖,形成背景圖;基于所述關(guān)鍵詞本體語義,從預先設立的語法數(shù)據(jù)庫中獲取與所述關(guān)鍵詞對應的動畫模板;將所述文本摘要轉(zhuǎn)化為音頻數(shù)據(jù);按照預設渲染規(guī)則,將所述背景圖、所述動畫模板及所述音頻數(shù)據(jù)合成渲染為視頻文件。
[0007]結(jié)合第一方面,本發(fā)明實施例提供了第一方面的第一種可能的實施方式,其中,所述提取目標新聞網(wǎng)頁文本內(nèi)容的文本摘要包括:基于網(wǎng)頁鏈接,獲取新聞網(wǎng)頁;去除所述新聞網(wǎng)頁中的附加信息,其中所述附加信息包括以下一種或多種:廣告、圖片、視頻、框架及圖表;提取去除所屬附加信息后的所述新聞網(wǎng)頁的文本內(nèi)容;從所述文本內(nèi)容中摘取重點語句組成所述文本摘要。
[0008]結(jié)合第一方面,本發(fā)明實施例提供了第一方面的第二種可能的實施方式,其中,所述從所述文本內(nèi)容中摘取重點語句組成所述文本摘要,包括:依次計算所述文本內(nèi)容中每兩句語句之間的相似性;根據(jù)所述相似性的計算結(jié)果,對所述文本內(nèi)容中的語句分類;按照所述分類的結(jié)果,從每類語句中分別提取語句進行組合,得到候選摘要;從所述候選摘要中選取與預設文本摘要長度差值最小的候選摘要作為所述新聞網(wǎng)頁的摘要文本,其中所述預設文本摘要長度根據(jù)待生成的視頻長度和預先設定的文本摘要朗讀速度確定。
[0009]結(jié)合第一方面,本發(fā)明實施例提供了第一方面的第三種可能的實施方式,其中,所述依次計算所述文本內(nèi)容中每兩句語句之間的相似性,包括:計算當前兩句語句中共有詞語的數(shù)量之和;將所述數(shù)量之和除以當前兩句語句的長度平均值,得到當前兩句語句的相似性;依照獲取當前兩句語句的相似性的方法計算所述文本內(nèi)容中每兩句語句之間的相似性。
[0010]結(jié)合第一方面,本發(fā)明實施例提供了第一方面的第四種可能的實施方式,其中,所述解析所述文本摘要,得到所述文本摘要中的關(guān)鍵詞,包括:對所述文本摘要進行分詞;將所述分詞后得到的詞語與所述語法數(shù)據(jù)庫中的詞語模板進行比對,確定分詞后得到的詞語的詞性;根據(jù)所述詞性的判斷結(jié)果,從分詞后的詞語中選取名詞及數(shù)詞作為所述文本摘要的關(guān)鍵詞。
[0011]結(jié)合第一方面,本發(fā)明實施例提供了第一方面的第五種可能的實施方式,其中,所述對所述關(guān)鍵詞進行語義分析,得到所述關(guān)鍵詞本體語義,包括:在所述語法數(shù)據(jù)庫中檢索所述關(guān)鍵詞,獲取與所述關(guān)鍵詞相關(guān)的所有本體描述;利用網(wǎng)絡本體語言OWL從所述關(guān)鍵詞的所有本體描述中確定出當前語境下的關(guān)鍵詞本體語義。
[0012]結(jié)合第一方面,本發(fā)明實施例提供了第一方面的第六種可能的實施方式,其中,所述按照預設渲染規(guī)則,將所述背景圖、所述動畫模板及所述音頻數(shù)據(jù)合成渲染為視頻文件,包括:設定所述音頻數(shù)據(jù)中所述關(guān)鍵詞、與所述關(guān)鍵詞對應的背景圖及動畫模板的映射關(guān)系;按照所述映射關(guān)系,對所述背景圖、所述動畫模板及所述音頻數(shù)據(jù)進行合成渲染。
[0013]第二方面,本發(fā)明實施例還提供了一種基于文本的網(wǎng)頁內(nèi)容生成視頻摘要的裝置,包括:提取模塊,用于提取目標新聞網(wǎng)頁文本內(nèi)容的文本摘要;關(guān)鍵詞獲取模塊,用于解析所述文本摘要,得到所述文本摘要中的關(guān)鍵詞;語義分析模塊,用于對所述關(guān)鍵詞進行語義分析,得到所述關(guān)鍵詞本體語義;背景圖形成模塊,用于基于所述關(guān)鍵詞本體語義,從互聯(lián)網(wǎng)絡中檢索對應的圖片或視頻,形成背景圖;動畫模板獲取模塊,用于基于所述關(guān)鍵詞本體語義,從預設的語法數(shù)據(jù)庫中獲取與所述關(guān)鍵詞對應的動畫模板;音頻轉(zhuǎn)換模塊,用于將所述文本摘要轉(zhuǎn)化為音頻數(shù)據(jù);視頻合成模塊,用于按照預設渲染規(guī)則,將所述背景圖、所述動畫模板及所述音頻數(shù)據(jù)合成渲染為視頻文件。
[0014]結(jié)合第二方面,本發(fā)明實施例提供了第二方面的第一種可能的實施方式,其中,所述關(guān)鍵詞獲取模塊,包括:分詞單元,用于對所述文本摘要進行分詞;詞性確定單元,用于將所述分詞后得到的詞語與所述語法數(shù)據(jù)庫中的詞語模板進行比對,確定分詞后得到的詞語的詞性;關(guān)鍵詞選取單元,用于根據(jù)所述詞性的判斷結(jié)果,從分詞后的詞語中選取名詞及數(shù)詞作為所述文本摘要的關(guān)鍵詞。
[0015]第三方面,本發(fā)明實施例還提供了一種基于文本的網(wǎng)頁內(nèi)容生成視頻摘要的系統(tǒng),包括:用戶端及與用戶端通過互聯(lián)網(wǎng)連接的新聞服務器端;所述新聞服務器端包括如第二方面和第二方面第一種可能的實施方式所述的基于文本的網(wǎng)頁內(nèi)容生成視頻摘要的
目.ο
[0016]本發(fā)明實施例提供的基于文本的網(wǎng)頁內(nèi)容生成視頻摘要的方法、裝置及系統(tǒng),能夠基于目標新聞網(wǎng)頁文本內(nèi)容生成視頻摘要,并將視頻摘要在目標新聞網(wǎng)頁上展示出來。用戶在瀏覽相應新聞網(wǎng)頁時,可以通過觀看視頻摘要的方式獲取新聞信息,相比現(xiàn)有新聞網(wǎng)站通過圖片和文字展示新聞的方式,能節(jié)省用戶閱讀新聞網(wǎng)頁上新聞的時間成本。
[0017]為使本發(fā)明的上述目的、特征和優(yōu)點能更明顯易懂,下文特舉較佳實施例,并配合所附附圖,作詳細說明如下。
【附圖說明】
[0018]為了更清楚地說明本發(fā)明實施例的技術(shù)方案,下面將對實施例中所需要使用的附圖作簡單地介紹,應當理解,以下附圖僅示出了本發(fā)明的某些實施例,因此不應被看作是對范圍的限定,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他相關(guān)的附圖。
[0019]圖1示出了本發(fā)明實施例1所提供的基于文本的網(wǎng)頁內(nèi)容生成視頻摘要的方法流程不意圖;
[0020]圖2示出了本發(fā)明實施例2所提供的基于文本的網(wǎng)頁內(nèi)容生成視頻摘要的方法流程不意圖;
[0021]圖3示出了本發(fā)明實施例3所提供的基于文本的網(wǎng)頁內(nèi)容生成視頻摘要的方法流程不意圖;
[0022]圖4示出了本發(fā)明實施例4所提供的基于文本的網(wǎng)頁內(nèi)容生成視頻摘要的方法流程不意圖;
[0023]圖5示出了本發(fā)明實施例5所提供的基于文本的網(wǎng)頁內(nèi)容生成成視頻摘要的方法流程示意圖;
[0024]圖6示出了本發(fā)明實施例6所提供的基于文本的網(wǎng)頁內(nèi)容生成視頻摘要的裝置的結(jié)構(gòu)意圖;
[0025]圖7示出了本發(fā)明實施例7所提供的基于文本的網(wǎng)頁內(nèi)容生成視頻摘要的裝置中關(guān)鍵詞獲取模塊的結(jié)構(gòu)示意圖;
[0026]圖8示出了本發(fā)明實施例8所提供的基于文本的網(wǎng)頁內(nèi)容生成視頻摘要的系統(tǒng)連接示意圖。
[0027]主要元件符號說明:
[0028]21、提取模塊;22、關(guān)鍵詞獲取模塊;23、語義分析模塊;24、背景圖形成模塊;25、動畫模板獲取模塊;26、音頻轉(zhuǎn)換模塊;27、視頻合成模塊;22a、分詞單元;22b、詞性確定單元;22c、關(guān)鍵詞選取單元;31、用戶端;32、新聞服務器端。
【具體實施方式】
[0029]下面將結(jié)合本發(fā)明實施例中附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。通常在此處附圖中描述和示出的本發(fā)明實施例的組件可以以各種不同的配置來布置和設計。因此,以下對在附圖中提供的本發(fā)明的實施例的詳細描述并非旨在限制要求保護的本發(fā)明的范圍,而是僅僅表示本發(fā)明的選定實施例?;诒景l(fā)明的實施例,本領(lǐng)域技術(shù)人員在沒有做出創(chuàng)造性勞動的前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0030]實施例1:
[0031]本實施例1提供了一種基于文本的網(wǎng)頁內(nèi)容生成視頻摘要的方法,其流程示意圖為圖1,主要處理步驟包括:
[0032]步驟SlOl:提取目標新聞網(wǎng)頁文本內(nèi)容的文本摘要。
[0033]新聞信息的文本可能不夠簡潔,用戶需要較多的時間成本獲取網(wǎng)頁上的新聞信息,通過提取新聞網(wǎng)頁文本內(nèi)容的文本摘要能夠以較為簡潔且相對完整的向用戶介紹新聞信息。
[0034]