国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種音頻文件的節(jié)奏感強(qiáng)度獲取方法及裝置制造方法

      文檔序號:2827853閱讀:212來源:國知局
      一種音頻文件的節(jié)奏感強(qiáng)度獲取方法及裝置制造方法
      【專利摘要】本發(fā)明提供了一種音頻文件的節(jié)奏感強(qiáng)度獲取方法及裝置,該方法包括:獲取音頻文件中的所有幀在設(shè)定頻段的第一頻譜能量之和以及獲取設(shè)定頻段的頻譜能量均值;獲取音頻文件中的所有幀的總頻譜能量;獲取第一頻譜能量之和與總頻譜能量的比值,得到所述音頻文件的頻譜能量比;根據(jù)頻譜能量均值與頻譜能量比獲取所述音頻文件的節(jié)奏感強(qiáng)度值。本發(fā)明實(shí)施例通過獲得設(shè)定頻段的頻譜能量均值和音頻文件的頻譜能量比,然后根據(jù)頻譜能量均值與頻譜能量比獲取所述音頻文件的節(jié)奏感強(qiáng)度值,實(shí)現(xiàn)對歌曲的節(jié)奏感強(qiáng)度進(jìn)行量化,為用戶通過節(jié)奏感強(qiáng)度選歌提供依據(jù)。
      【專利說明】一種音頻文件的節(jié)奏感強(qiáng)度獲取方法及裝置

      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及音頻處理【技術(shù)領(lǐng)域】,尤其涉及一種音頻文件的節(jié)奏感強(qiáng)度獲取方法及
      >J-U ρ?α裝直。

      【背景技術(shù)】
      [0002]隨著互聯(lián)網(wǎng)的發(fā)展,互聯(lián)網(wǎng)提供的歌曲的數(shù)量越來越多,動(dòng)輒幾百萬,甚至上千萬。而隨著用戶對音樂的需求不斷的提高,用戶從互聯(lián)網(wǎng)上獲取歌曲的方式也有所變化,從最初用戶通過互聯(lián)網(wǎng)主動(dòng)找歌,到現(xiàn)在音樂網(wǎng)站主動(dòng)向用戶推薦歌曲,用戶對音樂網(wǎng)站提出的要求越來越高。
      [0003]音樂網(wǎng)站通過歌曲的曲風(fēng)、流派等信息,或者通過文本挖掘的方式,為用戶推薦歌曲,例如,通過用戶的標(biāo)注信息、歌單以及用戶評論信息等,挖掘出歌曲的節(jié)奏信息,為用戶提供曲風(fēng)類似的歌曲。由于互聯(lián)網(wǎng)上,很多歌曲的曲風(fēng)、流派等信息不全,因而通過曲風(fēng)、流派只能對用戶提供較為粗放的選歌方式,通過文本挖掘的方式,不能準(zhǔn)確地對歌曲的節(jié)奏感強(qiáng)度進(jìn)行量化,從而使得文本挖掘的方式應(yīng)用面受限。


      【發(fā)明內(nèi)容】

      [0004]本發(fā)明實(shí)施例提供一種音頻文件的節(jié)奏感強(qiáng)度獲取方法及裝置,通過對歌曲的節(jié)奏感強(qiáng)度進(jìn)行量化,為用戶通過節(jié)奏感強(qiáng)度選歌提供依據(jù)。
      [0005]為達(dá)到上述目的,本發(fā)明的實(shí)施例采用如下技術(shù)方案:
      [0006]一種音頻文件的節(jié)奏感強(qiáng)度獲取方法,該方法包括:
      [0007]獲取音頻文件中的所有幀在設(shè)定頻段的第一頻譜能量之和以及獲取設(shè)定頻段的頻譜能量均值;
      [0008]獲取音頻文件中的所有幀的總頻譜能量;
      [0009]獲取第一頻譜能量之和與總頻譜能量的比值,得到所述音頻文件的頻譜能量比;
      [0010]根據(jù)頻譜能量均值與頻譜能量比獲取所述音頻文件的節(jié)奏感強(qiáng)度值。
      [0011]一種音頻文件的節(jié)奏感強(qiáng)度獲取裝置,該裝置包括:
      [0012]第一獲取模塊,用于獲取音頻文件中的所有幀在設(shè)定頻段的第一頻譜能量之和以及獲取設(shè)定頻段的頻譜能量均值;
      [0013]第二獲取模塊,用于獲取音頻文件中的所有幀的總頻譜能量;
      [0014]第三獲取模塊,用于獲取第一頻譜能量之和與總頻譜能量的比值,得到音頻文件的頻譜能量比;
      [0015]第四獲取模塊,用于根據(jù)頻譜能量均值與頻譜能量比獲取音頻文件的節(jié)奏感強(qiáng)度值。
      [0016]本發(fā)明實(shí)施例提供的音頻文件的節(jié)奏感強(qiáng)度獲取方法及裝置,通過獲得設(shè)定頻段的頻譜能量均值和音頻文件的頻譜能量比,然后根據(jù)頻譜能量均值與頻譜能量比獲取所述音頻文件的節(jié)奏感強(qiáng)度值,實(shí)現(xiàn)對歌曲的節(jié)奏感強(qiáng)度進(jìn)行量化,為用戶通過節(jié)奏感強(qiáng)度選歌提供依據(jù)。

      【專利附圖】

      【附圖說明】
      [0017]圖1為本發(fā)明實(shí)施例一提供的音頻文件的節(jié)奏感強(qiáng)度獲取方法的流程示意圖。
      [0018]圖2為本發(fā)明實(shí)施例二提供的音頻文件的節(jié)奏感強(qiáng)度獲取方法的流程示意圖。
      [0019]圖3為圖2所示實(shí)施例中步驟230具體實(shí)現(xiàn)的一個(gè)流程示意圖。
      [0020]圖4為圖3所示實(shí)施例中經(jīng)過步驟231處理后的頻譜能量示意圖。
      [0021]圖5為圖3所示實(shí)施例中經(jīng)過步驟232處理后的頻譜能量示意圖。
      [0022]圖6為本發(fā)明實(shí)施例三提供的音頻文件的節(jié)奏感強(qiáng)度獲取裝置的結(jié)構(gòu)示意圖。
      [0023]圖7為本發(fā)明實(shí)施例四提供的音頻文件的節(jié)奏感強(qiáng)度獲取裝置的結(jié)構(gòu)示意圖。

      【具體實(shí)施方式】
      [0024]下面結(jié)合附圖對本發(fā)明實(shí)施例提供的音頻文件的節(jié)奏感強(qiáng)度獲取方法及裝置進(jìn)行詳細(xì)描述。
      [0025]很多歌曲聽起來具有明顯的節(jié)奏感,一般是通過鼓聲或者其它節(jié)奏樂器來表現(xiàn)的。而具有節(jié)奏感的歌曲,其節(jié)奏感強(qiáng)度也是不一樣的,例如,搖滾類歌曲具有很強(qiáng)的節(jié)奏感,而抒情歌曲的節(jié)奏感稍弱,還有的歌曲沒有鼓聲作為點(diǎn)綴,更有的歌曲幾乎沒有節(jié)奏感。本發(fā)明實(shí)施例通過對歌曲的節(jié)奏感強(qiáng)度進(jìn)行檢測,將檢測結(jié)果作為一個(gè)明確的描述節(jié)奏強(qiáng)度的數(shù)值,從而滿足用戶檢索歌曲的泛需求。
      [0026]本發(fā)明實(shí)施例通過對歌曲的音頻進(jìn)行分析,能夠得到該歌曲的節(jié)奏感強(qiáng)度信息,從而使得用戶通過本發(fā)明實(shí)施例提供的節(jié)奏感強(qiáng)度檢索適合跳舞的歌曲。本發(fā)明實(shí)施例還可用于為用戶推薦某一類的歌曲,還可以根據(jù)用戶收藏的歌曲向用戶推薦用戶喜歡的歌曲,從而實(shí)現(xiàn)了用戶檢索歌曲的泛需求、場景分類、用戶的個(gè)性化推薦等。
      [0027]實(shí)施例一:
      [0028]圖1為本發(fā)明實(shí)施例一提供的音頻文件的節(jié)奏感強(qiáng)度獲取方法的流程示意圖,如圖1所示,本發(fā)明實(shí)施例的音頻文件的節(jié)奏感強(qiáng)度獲取方法包括如下步驟:
      [0029]步驟110,獲取音頻文件中的所有幀在設(shè)定頻段的第一頻譜能量之和以及獲取設(shè)定頻段的頻譜能量均值。
      [0030]步驟120,獲取音頻文件中的所有幀的總頻譜能量。
      [0031]步驟130,獲取第一頻譜能量之和與總頻譜能量的比值,得到音頻文件的頻譜能量比。
      [0032]步驟140,根據(jù)頻譜能量均值與頻譜能量比獲取音頻文件的節(jié)奏感強(qiáng)度值。
      [0033]在步驟110中,獲取音頻文件中的所有幀在設(shè)定頻段的第一頻譜能量之和以及獲取設(shè)定頻段的頻譜能量均值的具體處理可以為:首先對音頻文件進(jìn)行解碼,以及重采樣,重采樣可直接采用國內(nèi)音樂的標(biāo)準(zhǔn)頻率44100Hz,之后對重采樣的音頻進(jìn)行分幀(可設(shè)置幀長為2048,幀間隔為256),然后進(jìn)行漢寧窗處理,去除漢寧窗的邊界影響,再對分幀后的音頻進(jìn)行快速傅立葉變換,得到每幀音頻數(shù)據(jù)的頻譜,然后根據(jù)每幀音頻數(shù)據(jù)的頻譜計(jì)算所有幀在設(shè)定頻段的第一頻譜能量之和以及設(shè)定頻段的頻譜能量均值。其中,設(shè)定頻段的頻率范圍可以為50-150HZ,該頻段屬于語音頻譜的低頻范圍。
      [0034]在步驟120中,先獲得每幀音頻數(shù)據(jù)的頻譜,然后獲取音頻文件中的所有幀的總頻譜能量。其中,獲得每幀音頻數(shù)據(jù)的頻譜可參考步驟110中相關(guān)的描述,在此不再對其進(jìn)行詳細(xì)描述。
      [0035]需要說明的是,本發(fā)明實(shí)施例對步驟110與步驟120的執(zhí)行順序不做限制,步驟110和步驟120的執(zhí)行順序可以互換,可以不分先后。
      [0036]本發(fā)明實(shí)施例提供的音頻文件的節(jié)奏感強(qiáng)度獲取方法,通過獲得設(shè)定頻段的頻譜能量均值和音頻文件的頻譜能量比,然后根據(jù)頻譜能量均值與頻譜能量比獲取音頻文件的節(jié)奏感強(qiáng)度值,實(shí)現(xiàn)對歌曲的節(jié)奏感強(qiáng)度進(jìn)行量化,為用戶通過節(jié)奏感強(qiáng)度選歌提供依據(jù)。
      [0037]實(shí)施例二:
      [0038]圖2為本發(fā)明實(shí)施例二提供的音頻文件的節(jié)奏感強(qiáng)度獲取方法的流程示意圖,如圖2所示,本發(fā)明實(shí)施例的音頻文件的節(jié)奏感強(qiáng)度獲取方法包括如下步驟:
      [0039]步驟210,獲取音頻文件中的每一幀在設(shè)定頻段的頻譜能量。
      [0040]步驟220,通過音頻文件中的所有幀對應(yīng)的頻譜能量獲取設(shè)定頻段的頻譜能量的變化曲線。
      [0041]步驟230,通過變化曲線獲取設(shè)定頻段的頻譜能量均值。
      [0042]步驟240,獲取音頻文件中的所有幀在設(shè)定頻段的第一頻譜能量之和。
      [0043]步驟250,獲取音頻文件中的所有幀的總頻譜能量。
      [0044]步驟260,獲取第一頻譜能量之和與總頻譜能量的比值,得到音頻文件的頻譜能量比。
      [0045]步驟270,根據(jù)頻譜能量均值與頻譜能量比獲取音頻文件的節(jié)奏感強(qiáng)度值。
      [0046]本發(fā)明實(shí)施例中,設(shè)定頻段的頻率范圍可以為50-150HZ。
      [0047]在步驟210中,獲取音頻文件中的每一幀在設(shè)定頻段的頻譜能量的具體處理步驟可以為:先獲得每幀音頻數(shù)據(jù)的頻譜,然后獲取音頻文件中的每一幀在設(shè)定頻段的頻譜能量。其中,獲得每幀音頻數(shù)據(jù)的頻譜可參考實(shí)施例一的步驟110中相關(guān)的描述,在此不再進(jìn)行詳細(xì)描述。
      [0048]在步驟220中,將步驟210中獲取的每一幀在設(shè)定頻段的頻譜能量連接起來,可以得到一個(gè)向量,該向量描述的就是所述設(shè)定頻段的頻譜能量的變化曲線。例如:從音頻文件中的第一幀得到了設(shè)定頻段的頻譜能量ei,從第二幀得到了設(shè)定頻段的頻譜能量e2,…,從第η幀得到了設(shè)定頻段的頻譜能量%,綜合起來就得到:e1、e2、…、en#向量,從而獲得設(shè)定頻段的頻譜能量的變化曲線。
      [0049]在步驟230中,在得到設(shè)定頻段的頻譜能量的變化曲線之后,需要提取出該設(shè)定頻段的周期性的能量信息,并且該設(shè)定頻段內(nèi)不同頻率的周期能量信息累加起來,例如,一首歌曲帶有兩種節(jié)奏感的樂器,存在兩個(gè)周期性的信息,該周期性的信息可能存在一個(gè)區(qū)間之內(nèi),在一個(gè)區(qū)間之內(nèi)可能是大致周期性的,或者,在節(jié)拍打得有偏差的情況下,會(huì)導(dǎo)致在下一段與當(dāng)前段的信號發(fā)生偏移,此時(shí)音頻不是完全吻合的周期性信號。本發(fā)明實(shí)施例通過步驟230獲取設(shè)定頻段的頻譜能量均值,從而將上述情形考慮在內(nèi),使得獲取到的節(jié)奏感強(qiáng)度更精確,具體步驟可如圖3所示。
      [0050]在步驟240中,先獲得每幀音頻數(shù)據(jù)的頻譜,然后獲取音頻文件中的所有幀在設(shè)定頻段的第一頻譜能量之和。其中,獲得每幀音頻數(shù)據(jù)的頻譜可參考實(shí)施例一的步驟110中相關(guān)的描述,在此不再對其進(jìn)行詳細(xì)描述。需要說明的是,步驟240也可以在步驟210-230之間的任一步驟前執(zhí)行。
      [0051]在步驟250中,先獲得每幀音頻數(shù)據(jù)的頻譜,然后獲取音頻文件中的所有幀的總頻譜能量。其中,獲得每幀音頻數(shù)據(jù)的頻譜可參考實(shí)施例一的步驟110中相關(guān)的描述,在此不再對其進(jìn)行詳細(xì)描述。需要說明的是,步驟250也可以在步驟210-240之間的任一步驟前執(zhí)行。
      [0052]在步驟270中,根據(jù)頻譜能量均值與頻譜能量比獲取音頻文件的節(jié)奏感強(qiáng)度值的處理可以具體為:獲取頻譜能量均值與頻譜能量的乘積,乘積為音頻文件的節(jié)奏感強(qiáng)度值。
      [0053]圖3為步驟230的具體實(shí)現(xiàn)的一個(gè)流程示意圖。參照圖3,步驟230的具體實(shí)現(xiàn)可以包括如下步驟:
      [0054]步驟231,將變化曲線進(jìn)行傅立葉變換,計(jì)算傅立葉變換之后的第二頻譜能量。
      [0055]步驟232,對第二頻譜能量進(jìn)行傅立葉反變換,計(jì)算傅立葉反變換后的第三頻譜能量。
      [0056]步驟233,計(jì)算第三頻譜能量的均值,得到設(shè)定頻段的頻譜能量均值。
      [0057]以一個(gè)節(jié)奏感比較強(qiáng)的音頻文件的處理為示例,圖4為節(jié)奏感比較強(qiáng)的音頻經(jīng)過本實(shí)施例的步驟231處理后的頻譜能量示意圖,圖5為音頻經(jīng)過本實(shí)施例的步驟232處理后的頻譜能量示意圖。在圖4和圖5中,橫坐標(biāo)表示時(shí)間,具體時(shí)間與前述的分幀有關(guān),也即與音頻文件的時(shí)長有關(guān)系,縱坐標(biāo)表示采樣量化后的編碼,既可以用功率表示單位,還可以通過取對數(shù)的方式以db為單位,db表示1logx,從圖4可以看出,其第二頻譜能量(specenergy I)值比較大,隱約可見,其中具有周期性的信息。從圖5可以看出,第三頻譜能量(spec energy 2)的值較大,而且具有明顯的周期性,并且其分布非常緊密,通過步驟233中計(jì)算第三頻譜能量的均值時(shí),得到的頻譜能量值非常大,該頻譜能量值是本發(fā)明實(shí)施例在獲取節(jié)奏感輕度時(shí)所需要的,可以用來描述節(jié)奏感強(qiáng)度較大的一個(gè)分量。
      [0058]實(shí)施例三:
      [0059]圖6為本發(fā)明實(shí)施例三提供的音頻文件的節(jié)奏感強(qiáng)度獲取裝置的結(jié)構(gòu)示意圖,如圖6所示,本發(fā)明實(shí)施例的音頻文件的節(jié)奏感強(qiáng)度獲取裝置包括:
      [0060]第一獲取模塊610,用于獲取音頻文件中的所有幀在設(shè)定頻段的第一頻譜能量之和以及獲取設(shè)定頻段的頻譜能量均值。
      [0061]第二獲取模塊620,用于獲取音頻文件中的所有幀的總頻譜能量。
      [0062]第三獲取模塊630,用于獲取第一頻譜能量之和與總頻譜能量的比值,得到音頻文件的頻譜能量比。
      [0063]第四獲取模塊640,用于根據(jù)頻譜能量均值與頻譜能量比獲取音頻文件的節(jié)奏感強(qiáng)度值。
      [0064]第一獲取模塊610可以首先對音頻文件進(jìn)行解碼,以及重采樣,重采樣可直接采用國內(nèi)音樂的標(biāo)準(zhǔn)頻率44100Hz,之后對重采樣的音頻進(jìn)行分幀(可設(shè)置幀長為2048,幀間隔為256),然后進(jìn)行漢寧窗處理,去除邊界影響,再進(jìn)行快速傅立葉變換,得到每幀音頻數(shù)據(jù)的頻譜,然后計(jì)算所有幀在設(shè)定頻段的第一頻譜能量之和以及所述設(shè)定頻段的頻譜能量均值。其中,所述設(shè)定頻段的頻率范圍可以為50-150HZ。
      [0065]第二獲取模塊620先獲得每幀音頻數(shù)據(jù)的頻譜,然后獲取所述音頻文件中的所有幀的總頻譜能量。其中,第二獲取模塊620獲得每幀音頻數(shù)據(jù)的頻譜可參考第一獲取模塊610獲得每幀音頻數(shù)據(jù)的頻譜的處理,在此不再進(jìn)行詳細(xì)描述。
      [0066]本發(fā)明實(shí)施例提供的音頻文件的節(jié)奏感強(qiáng)度獲取裝置,通過第一獲取模塊610、第二獲取模塊620以及第三獲取模塊630獲得設(shè)定頻段的頻譜能量均值和音頻文件的頻譜能量比,然后通過第四獲取模塊640根據(jù)所述頻譜能量均值與頻譜能量比獲取音頻文件的節(jié)奏感強(qiáng)度值,實(shí)現(xiàn)對歌曲的節(jié)奏感強(qiáng)度進(jìn)行量化,為用戶通過節(jié)奏感強(qiáng)度選歌提供依據(jù)。
      [0067]實(shí)施例四:
      [0068]圖7為本發(fā)明實(shí)施例四提供的音頻文件的節(jié)奏感強(qiáng)度獲取裝置的結(jié)構(gòu)示意圖,如圖7所示,本發(fā)明實(shí)施例的音頻文件的節(jié)奏感強(qiáng)度獲取裝置包括:
      [0069]第一獲取模塊610,用于獲取音頻文件中的所有幀在設(shè)定頻段的第一頻譜能量之和以及獲取設(shè)定頻段的頻譜能量均值。
      [0070]第二獲取模塊620,用于獲取音頻文件中的所有幀的總頻譜能量。
      [0071]第三獲取模塊630,用于獲取第一頻譜能量之和與總頻譜能量的比值,得到音頻文件的頻譜能量比。
      [0072]第四獲取模塊640,用于根據(jù)頻譜能量均值與頻譜能量比獲取音頻文件的節(jié)奏感強(qiáng)度值。
      [0073]進(jìn)一步地,第一獲取模塊610可以包括以下幾個(gè)單元:
      [0074]第一獲取單元611,用于獲取音頻文件中的每一幀在設(shè)定頻段的頻譜能量。
      [0075]第二獲取單元612,用于通過音頻文件中的所有幀對應(yīng)的頻譜能量獲取設(shè)定頻段的頻譜能量的變化曲線。
      [0076]第三獲取單元613,用于通過變化曲線獲取所述設(shè)定頻段的頻譜能量均值。
      [0077]更進(jìn)一步地,所述第三獲取單元613可以包括以下幾個(gè)單元:
      [0078]第一計(jì)算子單元6131,用于將所述變化曲線進(jìn)行傅立葉變換,計(jì)算所述傅立葉變換之后的第二頻譜能量。
      [0079]第二計(jì)算子單元6132,用于對所述第二頻譜能量進(jìn)行傅立葉反變換,計(jì)算所述傅立葉反變換后的第三頻譜能量。
      [0080]第三計(jì)算子單元6133,用于計(jì)算所述第三頻譜能量的均值,得到所述設(shè)定頻段的頻譜能量均值。
      [0081]通過上述對第一獲取模塊610及第三獲取單元613的進(jìn)一步的補(bǔ)充所產(chǎn)生的有益技術(shù)效果可參考實(shí)施例二中步驟230中所述的有益技術(shù)效果,在此不再贅述。
      [0082]進(jìn)一步地,第四獲取模塊640可以包括:
      [0083]第四獲取單元641,用于獲取所述頻譜能量均值與所述頻譜能量的乘積,所述乘積為所述音頻文件的節(jié)奏感強(qiáng)度值。
      [0084]綜上所述,本發(fā)明實(shí)施例提供的音頻文件的節(jié)奏感強(qiáng)度獲取方法及裝置,通過獲得設(shè)定頻段的頻譜能量均值和音頻文件的頻譜能量比,然后根據(jù)頻譜能量均值與頻譜能量比獲取音頻文件的節(jié)奏感強(qiáng)度值,實(shí)現(xiàn)對歌曲的節(jié)奏感強(qiáng)度進(jìn)行量化,為用戶通過節(jié)奏感強(qiáng)度選歌提供依據(jù)。
      [0085]為了證明本發(fā)明實(shí)施例的有效性,通過近2000首歌,從其中按照曲風(fēng)、流派等分布抽取了 100首歌進(jìn)行主觀評測,通過本發(fā)明實(shí)施例的技術(shù)方案獲取到的節(jié)奏感強(qiáng)度值有80 %左右的歌曲是準(zhǔn)確的,大概20 %的歌曲有較小程度的偏差;因此,本發(fā)明實(shí)施例完全能夠描述節(jié)奏感強(qiáng)度,并在工業(yè)界使用。
      [0086]以上所述,僅為本發(fā)明的【具體實(shí)施方式】,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本【技術(shù)領(lǐng)域】的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以所述權(quán)利要求的保護(hù)范圍為準(zhǔn)。
      【權(quán)利要求】
      1.一種音頻文件的節(jié)奏感強(qiáng)度獲取方法,其特征在于,所述方法包括: 獲取所述音頻文件中的所有幀在設(shè)定頻段的第一頻譜能量之和以及獲取所述設(shè)定頻段的頻譜能量均值; 獲取所述音頻文件中的所有幀的總頻譜能量; 獲取所述第一頻譜能量之和與所述總頻譜能量的比值,得到所述音頻文件的頻譜能量比; 根據(jù)所述頻譜能量均值與所述頻譜能量比獲取所述音頻文件的節(jié)奏感強(qiáng)度值。
      2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述設(shè)定頻段的頻率范圍為50-150HZ。
      3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取所述設(shè)定頻段的頻譜能量均值的步驟包括: 獲取所述音頻文件中的每一幀在所述設(shè)定頻段的頻譜能量; 通過所述音頻文件中的所有幀對應(yīng)的頻譜能量獲取所述設(shè)定頻段的頻譜能量的變化曲線; 通過所述變化曲線獲取所述設(shè)定頻段的頻譜能量均值。
      4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述通過所述變化曲線獲取所述設(shè)定頻段的頻譜能量均值的步驟包括: 將所述變化曲線進(jìn)行傅立葉變換,計(jì)算所述傅立葉變換之后的第二頻譜能量; 對所述第二頻譜能量進(jìn)行傅立葉反變換,計(jì)算所述傅立葉反變換后的第三頻譜能量; 計(jì)算所述第三頻譜能量的均值,得到所述設(shè)定頻段的頻譜能量均值。
      5.根據(jù)權(quán)利要求1-4任一所述的方法,其特征在于,所述根據(jù)所述頻譜能量均值與所述頻譜能量比獲取所述音頻文件的節(jié)奏感強(qiáng)度值的步驟包括: 獲取所述頻譜能量均值與所述頻譜能量的乘積,所述乘積為所述音頻文件的節(jié)奏感強(qiáng)度值。
      6.一種音頻文件的節(jié)奏感強(qiáng)度獲取裝置,其特征在于,所述裝置包括: 第一獲取模塊,用于獲取所述音頻文件中的所有幀在設(shè)定頻段的第一頻譜能量之和以及獲取所述設(shè)定頻段的頻譜能量均值; 第二獲取模塊,用于獲取所述音頻文件中的所有幀的總頻譜能量; 第三獲取模塊,用于獲取所述第一頻譜能量之和與所述總頻譜能量的比值,得到所述音頻文件的頻譜能量比; 第四獲取模塊,用于根據(jù)所述頻譜能量均值與所述頻譜能量比獲取所述音頻文件的節(jié)奏感強(qiáng)度值。
      7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述設(shè)定頻段的頻率范圍為50-150HZ。
      8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述第一獲取模塊包括: 第一獲取單元,用于獲取所述音頻文件中的每一幀在所述設(shè)定頻段的頻譜能量; 第二獲取單元,用于通過所述音頻文件中的所有幀對應(yīng)的頻譜能量獲取所述設(shè)定頻段的頻譜能量的變化曲線; 第三獲取單元,用于通過所述變化曲線獲取所述設(shè)定頻段的頻譜能量均值。
      9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述第三獲取單元包括: 第一計(jì)算子單元,用于將所述變化曲線進(jìn)行傅立葉變換,計(jì)算所述傅立葉變換之后的第二頻譜能量; 第二計(jì)算子單元,用于對所述第二頻譜能量進(jìn)行傅立葉反變換,計(jì)算所述傅立葉反變換后的第三頻譜能量; 第三計(jì)算子單元,用于計(jì)算所述第三頻譜能量的均值,得到所述設(shè)定頻段的頻譜能量均值。
      10.根據(jù)權(quán)利要求6-9任一所述的裝置,其特征在于,所述第四獲取模塊包括: 第四獲取單元,用于獲取所述頻譜能量均值與所述頻譜能量的乘積,所述乘積為所述音頻文件的節(jié)奏感強(qiáng)度值。
      【文檔編號】G10L25/51GK104299621SQ201410524778
      【公開日】2015年1月21日 申請日期:2014年10月8日 優(yōu)先權(quán)日:2014年10月8日
      【發(fā)明者】王徽蓉 申請人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
      1