一種視頻專輯的關鍵詞設置方法及裝置的制造方法
【技術領域】
[0001]本發(fā)明涉及互聯(lián)網技術領域,特別涉及一種視頻專輯的關鍵詞設置方法及裝置。
【背景技術】
[0002]經過近幾年的互聯(lián)網技術的飛速發(fā)展,互聯(lián)網的業(yè)務不斷增加,人們基于互聯(lián)網可以接觸到各種各樣的信息,網絡也成為人們日常工作和生活中不可或缺的一部分。比如,用戶可以利用互聯(lián)網收發(fā)工作郵件、進行視頻會議等;或者,利用互聯(lián)網瀏覽新聞、聽音樂、購物、訂餐、觀看視頻等。隨著互聯(lián)網的不斷發(fā)展進步,基于互聯(lián)網所產生的視頻信息的數(shù)據(jù)量也越來越大。用戶所需要管理的視頻文件也越來越多,用戶在管理大量的視頻文件時,通常將具備某些共同特征的視頻文件放在一起,成為一個對應的視頻組合,比如,將上述具備某些共同特征的視頻組合稱為視頻專輯等。
[0003]為了快速、便捷地找到對應的視頻專輯,通常需要為視頻專輯定義對應的關鍵詞;目前,對包含多個視頻文件的視頻專輯進行關鍵詞的設置時,通常是由用戶按照視頻文件的用途、類型或者內容等一定的標準或者設置規(guī)則,對視頻專輯進行人為設置關鍵詞。若有大量的視頻專輯需要設置對應的關鍵詞,則增加用戶工作量的同時,也會浪費用戶大量的寶貴時間,因此,如何根據(jù)該視頻專輯所包含的各視頻文件的文件名稱和各視頻分別對應的關鍵詞,對視頻專輯自動設置關鍵詞成為目前亟待解決的問題之一。
【發(fā)明內容】
[0004]本發(fā)明實施例提供一種視頻專輯的關鍵詞設置方法及裝置,用以根據(jù)該視頻專輯中所包含的各視頻文件的文件名稱和文件關鍵詞,為該視頻專輯自動設置關鍵詞,實現(xiàn)視頻專輯關鍵詞的自動設置。
[0005]本發(fā)明實施例提供一種視頻專輯的關鍵詞設置方法,包括:
[0006]獲取視頻專輯中所包含的所有視頻文件的文件名稱和各視頻文件分別對應的文件關鍵詞;
[0007]根據(jù)獲取的所述視頻專輯中的所述文件名稱和文件關鍵詞,提取所述文件名稱和文件關鍵詞中能夠反映相應視頻文件主要含義的核心詞;
[0008]將提取出的所述核心詞設置為所述視頻專輯的關鍵詞。
[0009]在一個實施例中,所述根據(jù)獲取的所述視頻專輯中的所述文件名稱和文件關鍵詞,提取所述文件名稱和文件關鍵詞中能夠反映相應視頻文件主要含義的核心詞,包括:
[0010]遍歷視頻專輯中的視頻文件,獲取所述視頻專輯中所包含的所有視頻文件的文件名稱和每個視頻文件分別對應的文件關鍵詞;
[0011]對獲取的所述視頻文件的所有文件名稱和文件關鍵詞進行分詞,得到各視頻文件對應的分詞結果;
[0012]按照詞性,從分詞后得到的分詞結果中,篩選出能夠反映相應視頻文件主要含義的實義詞;
[0013]調用預先配置的預設詞庫,從篩選出的所述實義詞中挑選出專有名詞,并將挑選出的所述專有名詞作為能夠反映相應視頻文件主要含義的核心詞。
[0014]在一個實施例中,所述根據(jù)獲取的所述視頻專輯中的所述文件名稱和文件關鍵詞,提取所述文件名稱和文件關鍵詞中能夠反映相應視頻文件主要含義的核心詞,包括:
[0015]對獲取的所述視頻專輯中的所述文件名稱和文件關鍵詞進行聚類,找出權重最大的類別;
[0016]將權重最大的類別中的詞作為所述視頻專輯的核心詞;
[0017]或者:
[0018]計算獲取的所述視頻文件的所有文件名稱和文件關鍵詞對應的出現(xiàn)頻率,并提取所述出現(xiàn)頻率最高的一個或多個高頻詞;
[0019]將提取出的所述高頻詞作為所述視頻專輯的核心詞。
[0020]在一個實施例中,所述將提取出的所述核心詞設置為所述視頻專輯的關鍵詞,包括:
[0021]獲取所述視頻專輯所在的視頻分類;
[0022]將所述視頻分類和每一個視頻文件對應的核心詞共同設置為所述視頻專輯的關鍵詞。
[0023]在一個實施例中,所述將提取出的所述核心詞設置為所述視頻專輯的關鍵詞,包括:
[0024]判斷提取出的所有核心詞的字符長度之和是否大于預設的長度閾值;
[0025]若不大于預設的長度閾值,則將提取出的所有核心詞設置為所述視頻專輯的關鍵詞;
[0026]若大于預設的長度閾值,則根據(jù)預設的長度閾值,按照從后往前的順序,從提取出的所有核心詞中逐個刪除核心詞,直至剩余核心詞的字符長度之和不大于預設的長度閾值為止,將刪除后剩余的核心詞設置為所述視頻專輯的關鍵詞。
[0027]對應于上述實施例提供的一種視頻專輯的關鍵詞設置方法,本發(fā)明實施例還提供了一種視頻專輯的關鍵詞設置裝置,包括:
[0028]獲取模塊,用于獲取視頻專輯中所包含的所有視頻文件的文件名稱和各視頻文件分別對應的文件關鍵詞;
[0029]提取模塊,用于根據(jù)獲取的所述視頻專輯中的所述文件名稱和文件關鍵詞,提取所述文件名稱和文件關鍵詞中能夠反映相應視頻文件主要含義的核心詞;
[0030]設置模塊,用于將提取出的所述核心詞設置為所述視頻專輯的關鍵詞。
[0031 ] 在一個實施例中,所述提取模塊包括:
[0032]遍歷單元,用于遍歷視頻專輯中的視頻文件,獲取所述視頻專輯中所包含的所有視頻文件的文件名稱和每個視頻文件分別對應的文件關鍵詞;
[0033]分詞單元,用于對獲取的所述視頻文件的所有文件名稱和文件關鍵詞進行分詞,得到各視頻文件對應的分詞結果;
[0034]篩選單元,用于按照詞性,從分詞后得到的分詞結果中,篩選出能夠反映相應視頻文件主要含義的實義詞;
[0035]挑選單元,用于調用預先配置的預設詞庫,從篩選出的所述實義詞中挑選出專有名詞,并將挑選出的所述專有名詞作為能夠反映相應視頻文件主要含義的核心詞。
[0036]在一個實施例中,所述提取模塊包括:
[0037]聚類單元,用于對獲取的所述視頻專輯中的所述文件名稱和文件關鍵詞進行聚類,找出權重最大的類別;
[0038]第一設定單元,用于將權重最大的類別中的詞作為所述視頻專輯的核心詞;
[0039]或者,所述提取模塊包括:
[0040]計算單元,用于計算獲取的所述視頻文件的所有文件名稱和文件關鍵詞對應的出現(xiàn)頻率,并提取所述出現(xiàn)頻率最高的一個或多個高頻詞;
[0041]第二設定單元,用于將提取出的所述高頻詞作為所述視頻專輯的核心詞。
[0042]在一個實施例中,所述設置模塊包括:
[0043]獲取單元,用于獲取所述視頻專輯所在的視頻分類;
[0044]設置單元,用于將所述視頻分類和每一個視頻文件對應的核心詞共同設置為所述視頻專輯的關鍵詞。
[0045]在一個實施例中,所述設置模塊包括:
[0046]判斷單元,用于判斷提取出的所有核心詞的字符長度之和是否大于預設的長度閾值;
[0047]設定單元,用于當所述判斷單元判斷出所述字符長度不大于預設的長度閾值時,將提取出的所有核心詞設置為所述視頻專輯的關鍵詞;
[0048]刪除單元,用于當所述判斷單元判斷出所述字符長度大于預設的長度閾值時,根據(jù)預設的長度閾值,按照從后往前的順序,從提取出的所有核心詞中逐個刪除核心詞,直至剩余核心詞的字符長度之和不大于預設的長度閾值為止,將刪除后剩余的核心詞設置為所述視頻專輯的關鍵詞。
[0049]以上實施例所描述的一種視頻專輯的關鍵詞設置方法及裝置可以達到如下有益效果:
[0050]通過獲取視頻專輯中所包含的所有視頻文件的文件名稱和各視頻文件分別對應的文件關鍵