国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種音頻分類方法及裝置制造方法

      文檔序號:2826145閱讀:294來源:國知局
      一種音頻分類方法及裝置制造方法
      【專利摘要】本發(fā)明實施例提供一種音頻分類方法及裝置,其中的方法可包括:對待分類的音頻文件進行Pitch檢測,獲得所述音頻文件的Pitch序列;根據(jù)所述Pitch序列,查找所述音頻文件的主音;根據(jù)所述音頻文件的主音,對所述音頻文件進行調式檢測以確定所述音頻文件的類別。本發(fā)明可降低音頻文件的分類成本,提高分類效率,提升智能性。
      【專利說明】一種音頻分類方法及裝置

      【技術領域】
      [0001] 本發(fā)明涉及互聯(lián)網【技術領域】,具體涉及音頻處理【技術領域】,尤其一種音頻文件分 類方法及裝置。

      【背景技術】
      [0002] 調式(Mode)指若干高低不同的樂音,圍繞某一有穩(wěn)定感的中心音,按照一定音程 關系組織在一起,成為一個有機的體系,該體系即稱為調式,該中心音即稱為主音。音頻文 件可以根據(jù)調式劃分為大調式類別和小調式類別,通常,大調式類別的音頻文件色彩明亮、 歡快激進;小調式類別的音頻文件柔和暗淡。目前,傳統(tǒng)的對音頻文件的分類通常為人工方 式,即需要人工收聽音頻文件的內容,以確定音頻文件的類別;此種分類方式的人力資源成 本較高、分類效率較低、智能性較低。


      【發(fā)明內容】

      [0003] 本發(fā)明實施例提供一種音頻分類方法及裝置,可降低音頻文件的分類成本,提高 分類效率,提升智能性。
      [0004] 本發(fā)明第一方面提供一種音頻分類方法,可包括:
      [0005] 對待分類的音頻文件進行Pitch (音高)檢測,獲得所述音頻文件的Pitch序列;
      [0006] 根據(jù)所述Pitch序列,查找所述音頻文件的主音;
      [0007] 根據(jù)所述音頻文件的主音,對所述音頻文件進行調式檢測以確定所述音頻文件的 類別。
      [0008] 本發(fā)明第二方面提供一種音頻分類裝置,可包括:
      [0009] 音高檢測模塊,用于對待分類的音頻文件進行Pitch檢測,獲得所述音頻文件的 Pitch序列;
      [0010] 主音查找模塊,用于根據(jù)所述Pitch序列,查找所述音頻文件的主音;
      [0011] 分類模塊,用于根據(jù)所述音頻文件的主音,對所述音頻文件進行調式檢測以確定 所述音頻文件的類別。
      [0012] 實施本發(fā)明實施例,具有如下有益效果:
      [0013] 本發(fā)明實施例可通過對待分類的音頻文件進行音高檢測、查找主音以及調式檢 測,自動進行音頻文件的類別確定,避免了人工方式所帶來的資源耗費,降低了音頻文件的 分類成本,有效地提高了分類效率,提升了智能性。

      【專利附圖】

      【附圖說明】
      [0014] 為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn) 有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以 根據(jù)這些附圖獲得其他的附圖。
      [0015] 圖1為本發(fā)明實施例提供的一種音頻分類方法的流程圖;
      [0016] 圖2為圖1所示的步驟S101的具體流程圖;
      [0017] 圖3為圖1所示的步驟S102的具體流程圖;
      [0018] 圖4為圖1所示的步驟S103的具體流程圖;
      [0019]圖5為本發(fā)明實施例提供的一種音頻分類裝置的結構示意圖;
      [0020] 圖6為圖5所示的音高檢測模塊的實施例的結構示意圖;
      [0021] 圖7為圖6所示的預處理單元的實施例的結構示意圖;
      [0022] 圖8為圖5所示的主音查找模塊的實施例的結構示意圖;
      [0023] 圖9為圖5所示的分類模塊的實施例的結構示意圖;
      [0024] 圖10為圖9所示的分類單元的實施例的結構示意圖。

      【具體實施方式】
      [0025] 下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完 整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;?本發(fā)明中的實施例,本領域普通技術人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他 實施例,都屬于本發(fā)明保護的范圍。
      [0026] 本發(fā)明實施例中,音頻文件可以包括但不限于:歌曲、歌曲片段、清唱歌曲、清唱歌 曲片段、音樂、音樂片段、演奏樂、演奏樂片段等文件。本發(fā)明實施例的音頻分類方案可以應 用于互聯(lián)網領域的多個場景中,例如:可以應用于對互聯(lián)網音頻庫中的音頻文件添加智能 標簽的場景;或者,可以應用于對互聯(lián)網音頻庫中的音頻文件進行歸類管理的場景;或者, 可以應用于對未知的音頻文件進行分類的場景;或者,可應用于音頻文件的分類搜索,以提 升搜索的效率和匹配度的場景;或者,可應用于基于類別進行音頻文件的推薦的場景,等 等。
      [0027] 下面將結合附圖1-附圖4,對本發(fā)明實施例提供的音頻文分類方法進行詳細介 紹。需要說明的是,附圖1-附圖4所示的音頻分類方法可以由本發(fā)明實施例提供的音頻分 類裝置所執(zhí)行,該音頻分類裝置可運行于終端設備或服務器中,其中,終端設備可包括但不 限于:PC (Personal Computer,個人計算機)、PAD (平板電腦)、手機、智能手機、筆記本電腦 等設備。
      [0028] 請參見圖1,為本發(fā)明實施例提供的一種音頻分類方法的流程圖;該方法可包括 以下步驟S101-步驟S103。
      [0029] S101,對待分類的音頻文件進行Pitch檢測,獲得所述音頻文件的Pitch序列。
      [0030] 其中,Pitch (音高)指各種不同高低的聲音,即音的高度,音的基本特征的一種。 一個音頻文件可以表示為多幀音頻幀信號組成的一個幀序列。本步驟中,對待分類的音頻 文件進行Pitch檢測,可以為對該音頻文件的每一幀音頻幀信號進行Pitch檢測,獲得該音 頻文件的每一巾貞音頻巾貞信號的Pitch值,從而構建該音頻文件的Pitch序列。
      [0031] S102,根據(jù)所述Pitch序列,查找所述音頻文件的主音。
      [0032] 音頻文件均包含調式,調式指若干高低不同的樂音,圍繞某一有穩(wěn)定感的中心音, 按照一定音程關系組織在一起,成為一個有機的體系,該體系即稱為調式,該中心音即稱為 主音(Key)。Key屬于音頻文件的調式中的核心音,調式中的其他音或圍繞著Key,或支撐著 Key,或靠近Key。本步驟中,可基于音頻文件的Pitch序列,查找該音頻文件的Key。
      [0033] S103,根據(jù)所述音頻文件的主音,對所述音頻文件進行調式檢測以確定所述音頻 文件的類別。
      [0034] 由于Key屬于音頻文件的調式中的核心音,調式中的其他音或圍繞著Key,或支撐 著Key,或靠近Key。本步驟中,基于音頻文件的Key可對該音頻文件進行調式檢測,確定音 頻文件的調式,從而確定音頻文件的類別。其中,音頻文件的調式可以包括大調式或小調 式,音頻文件的類別可以包括大調式類別和小調式類別。通常,大調式類別的音頻文件色彩 明亮、歡快激進;小調式類別的音頻文件柔和暗淡。
      [0035] 下面將結合附圖2-附圖4,對圖1所示的音頻分類方法中的各步驟進行詳細介紹。
      [0036] 請參見圖2,為圖1所示的步驟S101的具體流程圖;該步驟S101可包括以下步驟 sll01-sll04。
      [0037] sllOl,對所述音頻文件的每一幀音頻幀信號進行預處理。
      [0038] 本發(fā)明實施例中,設定所述音頻文件包含Μ幀音頻幀信號,Μ為正整數(shù),則該音頻 文件包含的任一巾貞音頻巾貞信號可表不為Xi (η),其中,i表不所述音頻文件中該巾貞音頻巾貞信 號的順序,i為正整數(shù)且i = 1,2,... Μ ;n為正整數(shù)且η = 0, 1,2, N-1,其中N為該幀音頻幀 信號的長度,即Ν為該幀音頻幀信號的采樣點數(shù)。本步驟對Xi (η)的預處理過程可包括以 下Α-Β兩個步驟:
      [0039] Α、將所述音頻文件的每一巾貞音頻巾貞信號進行加窗處理。
      [0040] 步驟Α可采用矩形窗函數(shù)據(jù)ω (η)對\ (η)進行加窗處理,加窗處理后的每一幀 音頻幀信號可表示為如下公式(1):
      [0041] Xj ω (η) = ω (η) (η) (1)
      [0042] Β、對所述加窗處理后的每一幀音頻幀信號進行帶通濾波處理。
      [0043] 步驟Β中,采用bpf (η)表示帶通濾波器,該帶通濾波器的下截止頻率可表示為wl, 上截止頻率可表示為wh。對加窗處理后的每一幀音頻幀信號 Xic〇 (n)進行帶通濾波處理后, 可得到如下公式(2):
      [0044] χ^ω (n) = Xj ω (η) · bpf (η) (2)
      [0045] 上述公式(2)中," ?"表示卷積操作;優(yōu)選地,wl可設置為50,wh可設置為1500。
      [0046] S1102,對所述預處理后的每一幀音頻幀信號進行自相關計算,獲得所述音頻文件 的每一幀音頻幀信號的自相關函數(shù)。

      【權利要求】
      1. 一種音頻分類方法,其特征在于,包括: 對待分類的音頻文件進行音高Pitch檢測,獲得所述音頻文件的Pitch序列; 根據(jù)所述Pitch序列,查找所述音頻文件的主音; 根據(jù)所述音頻文件的主音,對所述音頻文件進行調式檢測以確定所述音頻文件的類 別。
      2. 如權利要求1所述的方法,其特征在于,所述對待分類的音頻文件進行Pitch檢測, 獲得所述音頻文件的Pitch序列,包括: 對所述音頻文件的每一幀音頻幀信號進行預處理; 對所述預處理后的每一幀音頻幀信號進行自相關計算,獲得所述音頻文件的每一幀音 頻幀信號的自相關函數(shù); 根據(jù)所述音頻文件的每一幀音頻幀信號的自相關函數(shù),計算所述音頻文件的每一幀音 頻幀信號的Pitch值; 按照所述音頻文件中各幀音頻幀信號的順序對所述音頻文件的每一幀音頻幀信號的 Pitch值進行排列,構建所述音頻文件的Pitch序列。
      3. 如權利要求2所述的方法,其特征在于,所述對所述音頻文件的每一幀音頻幀信號 進行預處理,包括: 將所述音頻文件的每一幀音頻幀信號進行加窗處理; 對所述加窗處理后的每一幀音頻幀信號進行帶通濾波處理。
      4. 如權利要求1-3任一項所述的方法,其特征在于,所述根據(jù)所述Pitch序列,查找所 述音頻文件的主音,包括: 將所述Pitch序列轉換為樂器數(shù)字接口 MIDI序列; 根據(jù)所述MIDI序列包含的樂器數(shù)字以及每個樂器數(shù)字的出現(xiàn)頻率,生成統(tǒng)計序列; 將所述統(tǒng)計序列中的出現(xiàn)頻率最大的樂器數(shù)字,確定為所述音頻文件的主音。
      5. 如權利要求4所述的方法,其特征在于,所述根據(jù)所述音頻文件的主音,對所述音頻 文件進行調式檢測以確定所述音頻文件的類別,包括: 根據(jù)大調式音階特征,設置第一矩陣; 根據(jù)小調式音階特征,設置第二矩陣; 采用所述音頻文件的主音、所述統(tǒng)計序列和所述第一矩陣,計算所述音頻文件的第一 調式特征值; 采用所述音頻文件的主音、所述統(tǒng)計序列和所述第二矩陣,計算所述音頻文件的第二 調式特征值; 根據(jù)所述音頻文件的第一調式特征值與所述音頻文件的第二調式特征值,確定所述音 頻文件的類別。
      6. 如權利要求5所述的方法,其特征在于,所述根據(jù)所述音頻文件的第一調式特征值 與所述音頻文件的第二調式特征值,確定所述音頻文件的類別,包括: 判斷所述音頻文件的第一調式特征值是否大于或等于所述音頻文件的第二調式特征 值; 如果判斷結果為是,則確定所述音頻文件的類別為大調式類別; 如果判斷結果為否,則確定所述音頻文件的類別為小調式類別。
      7. -種音頻分類裝置,其特征在于,包括: 音高檢測模塊,用于對待分類的音頻文件進行音高Pitch檢測,獲得所述音頻文件的 Pitch序列; 主音查找模塊,用于根據(jù)所述Pitch序列,查找所述音頻文件的主音; 分類模塊,用于根據(jù)所述音頻文件的主音,對所述音頻文件進行調式檢測以確定所述 音頻文件的類別。
      8. 如權利要求7所述的裝置,其特征在于,所述音高檢測模塊包括: 預處理單元,用于對所述音頻文件的每一幀音頻幀信號進行預處理; 自相關計算單元,用于對所述預處理后的每一幀音頻幀信號進行自相關計算,獲得所 述音頻文件的每一幀音頻幀信號的自相關函數(shù); 音高計算單元,用于根據(jù)所述音頻文件的每一幀音頻幀信號的自相關函數(shù),計算所述 音頻文件的每一幀音頻幀信號的Pitch值; 序列構建單元,用于按照所述音頻文件中各幀音頻幀信號的順序對所述音頻文件的每 一幀音頻幀信號的Pitch值進行排列,構建所述音頻文件的Pitch序列。
      9. 如權利要求8所述的裝置,其特征在于,所述預處理單元包括: 加窗處理子單元,用于將所述音頻文件的每一幀音頻幀信號進行加窗處理; 濾波處理子單元,用于對所述加窗處理后的每一幀音頻幀信號進行帶通濾波處理。
      10. 如權利要求7-9任一項所述的裝置,其特征在于,所述主音查找模塊包括: 轉換單元,用于將所述Pitch序列轉換為樂器數(shù)字接口 MIDI序列; 統(tǒng)計序列生成單元,用于根據(jù)所述MIDI序列包含的樂器數(shù)字以及每個樂器數(shù)字的出 現(xiàn)頻率,生成統(tǒng)計序列; 主音確定單元,用于將所述統(tǒng)計序列中的出現(xiàn)頻率最大的樂器數(shù)字,確定為所述音頻 文件的主音。
      11. 如權利要求10所述的裝置,其特征在于,所述分類模塊包括: 第一設置單元,用于根據(jù)大調式音階特征,設置第一矩陣; 第二設置單元,用于根據(jù)小調式音階特征,設置第二矩陣; 第一特征計算單元,用于采用所述音頻文件的主音、所述統(tǒng)計序列和所述第一矩陣,計 算所述音頻文件的第一調式特征值; 第二特征計算單元,用于采用所述音頻文件的主音、所述統(tǒng)計序列和所述第二矩陣,計 算所述音頻文件的第二調式特征值; 分類單元,用于根據(jù)所述音頻文件的第一調式特征值與所述音頻文件的第二調式特征 值,確定所述音頻文件的類別。
      12. 如權利要求11所述的裝置,其特征在于,所述分類單元包括: 判斷子單元,用于判斷所述音頻文件的第一調式特征值是否大于或等于所述音頻文件 的第二調式特征值; 類別確定子單元,用于如果判斷結果為是,則確定所述音頻文件的類別為大調式類別; 或者,用于如果判斷結果為否,則確定所述音頻文件的類別為小調式類別。
      【文檔編號】G10L15/08GK104091594SQ201310358878
      【公開日】2014年10月8日 申請日期:2013年8月16日 優(yōu)先權日:2013年8月16日
      【發(fā)明者】趙偉峰 申請人:騰訊科技(深圳)有限公司
      網友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1