1.一種音頻的音階分析方法,其特征在于,包括:
提取音頻中單字的音頻;
將每個(gè)所述單字的音頻由時(shí)域轉(zhuǎn)換為頻域;
獲取所述頻域中特征頻率;
根據(jù)所述特征頻率所處頻率區(qū)間:第一頻率區(qū)間、第二頻率區(qū)間、第三頻率區(qū)間、第四頻率區(qū)間、第五頻率區(qū)間,判斷每個(gè)所述單字的音頻所屬音階:上宮、上商、上角、上徵、上羽。
2.根據(jù)權(quán)利要求1所述的方法,在所述提取音頻中單字的音頻之前包括:采集測(cè)試的音頻;對(duì)所述測(cè)試音頻預(yù)處理。
3.根據(jù)權(quán)利要求2所述的方法,其中,對(duì)所述測(cè)試音頻預(yù)處理包括:對(duì)所述音頻進(jìn)行端點(diǎn)檢測(cè)去除空錄音和去噪。
4.根據(jù)權(quán)利要求1所述的方法,所述獲取所述頻域中特征頻率包括:
設(shè)置頻率的最小步長(zhǎng),獲取頻率為最小步長(zhǎng)到兩倍最小步長(zhǎng)之間的第一共振峰頻率;
當(dāng)?shù)谝还舱穹孱l率f0位于最小步長(zhǎng)到二分之三倍最小步長(zhǎng)之間時(shí),在頻率為兩倍最小步長(zhǎng)到三倍最小步長(zhǎng)之間獲得第二共振峰頻率f1;
當(dāng)?shù)谝还舱穹孱l率f0不位于最小步長(zhǎng)到二分之三倍最小步長(zhǎng)之間時(shí),在頻率為三倍最小步長(zhǎng)到四倍最小步長(zhǎng)之間獲得第二共振峰頻率f1。
5.根據(jù)權(quán)利要求4所述的方法,所述在頻率為兩倍最小步長(zhǎng)到三倍最小步長(zhǎng)之間獲得第二共振峰頻率f1之后包括:
當(dāng)?shù)诙舱穹孱l率f1位于兩倍最小步長(zhǎng)到二分之五倍最小步長(zhǎng)之間時(shí),在頻率為四倍最小步長(zhǎng)到五倍最小步長(zhǎng)之間獲得第三共振峰頻率f2;
當(dāng)?shù)诙舱穹孱l率f1位于二分之五倍最小步長(zhǎng)到三倍最小步長(zhǎng)之間時(shí),在頻率為五倍最小步長(zhǎng)到六倍最小步長(zhǎng)之間獲得第三共振峰頻率f2。
6.根據(jù)權(quán)利要求4所述的方法,在頻率為三倍最小步長(zhǎng)到四倍最小步長(zhǎng)之間獲得第二共振峰頻率f1之后包括:
當(dāng)?shù)诙舱穹孱l率f1位于三倍最小步長(zhǎng)到二分之七倍最小步長(zhǎng)之間時(shí),在頻率為六倍最小步長(zhǎng)到七倍最小步長(zhǎng)之間獲得第三共振峰頻率f2;
當(dāng)?shù)诙舱穹孱l率f1位于二分之七倍最小步長(zhǎng)到四倍最小步長(zhǎng)之間時(shí),在頻率為七倍最小步長(zhǎng)到八倍最小步長(zhǎng)之間獲得第三共振峰頻率f2。
7.根據(jù)權(quán)利要求5或6所述的方法,其中,所述第一頻率區(qū)間:261.6~293.7,第二頻率區(qū)間:293.7~329.6,第三頻率區(qū)間:329.6~392.0,第四頻率區(qū)間:392.0~440.0,第五頻率區(qū)間:440.0~523.2;其中,
當(dāng)所述第三共振峰頻率f2位于所述第一頻率區(qū)間:261.6~293.7,所述單字的音頻屬于上宮;
當(dāng)所述第三共振峰頻率f2位于所述第二頻率區(qū)間:293.7~329.6,所述單字的音頻屬于上商;
當(dāng)所述第三共振峰頻率f2位于所述第三頻率區(qū)間:329.6~392.0,所述單字的音頻屬于上角;
當(dāng)所述第三共振峰頻率f2位于所述第四頻率區(qū)間:392.0~440.0,所述單字的音頻屬于上徵;
當(dāng)所述第三共振峰頻率f2位于所述第五頻率區(qū)間:440.0~523.2,所述單字的音頻屬于上羽。
8.根據(jù)權(quán)利要求1所述的方法,其中,在判斷每個(gè)所述單字的音頻屬于上宮、上商、上角、上徵或上羽之后包括:
計(jì)算所述音頻中所述上宮、上商、上角、上徵或上羽出現(xiàn)的權(quán)重,選取權(quán)重最大的音階作為所述音頻的音階。
9.一種音頻的音階分析系統(tǒng),其特征在于,包括:
單字的音頻提取單元,提取音頻中單字的音頻;
時(shí)頻轉(zhuǎn)換單元,將每個(gè)所述單字的音頻由時(shí)域轉(zhuǎn)換為頻域;
特征頻率提取單元,獲取所述頻域中特征頻率;
音階劃分單元,根據(jù)所述特征頻率所處頻率區(qū)間:第一頻率區(qū)間、第二頻率區(qū)間、第三頻率區(qū)間、第四頻率區(qū)間、第五頻率區(qū)間,判斷每個(gè)所述單字的音頻所屬音階:上宮、上商、上角、上徵、上羽。
10.根據(jù)權(quán)利要求9所述的系統(tǒng),還包括:音頻采集單元,采集測(cè)試的音頻。
11.根據(jù)權(quán)利要求10所述的系統(tǒng),還包括:預(yù)處理單元,對(duì)所述音頻進(jìn)行端點(diǎn)檢測(cè)去空錄音和去噪。
12.根據(jù)權(quán)利要求9所述的系統(tǒng),其中,所述特征頻率提取單元包括:
第一共振峰頻率f0提取單元,設(shè)置頻率的最小步長(zhǎng),獲取頻率為最小步長(zhǎng)到兩倍最小步長(zhǎng)之間的第一共振峰頻率f0;
第二共振峰頻率f1提取單元,當(dāng)?shù)谝还舱穹孱l率f0位于最小步長(zhǎng)到二分之三倍最小步長(zhǎng)之間時(shí),在頻率為兩倍最小步長(zhǎng)到三倍最小步長(zhǎng)之間獲得第二共振峰頻率f1;當(dāng)?shù)谝还舱穹孱l率f0不位于最小步長(zhǎng)到二分之三倍最小步長(zhǎng)之間時(shí),在頻率為三倍最小步長(zhǎng)到四倍最小步長(zhǎng)之間獲得第二共振峰頻率f1;
第三共振峰頻率f2提取單元,當(dāng)?shù)诙舱穹孱l率f1位于兩倍最小步長(zhǎng)到二分之五倍最小步長(zhǎng)之間時(shí),在頻率為四倍最小步長(zhǎng)到五倍最小步長(zhǎng)之間獲得第三共振峰頻率f2;當(dāng)?shù)诙舱穹孱l率f1位于二分之五倍最小步長(zhǎng)到三倍最小步長(zhǎng)之間時(shí),在頻率為五倍最小步長(zhǎng)到六倍最小步長(zhǎng)之間獲得第三共振峰頻率f2;當(dāng)?shù)诙舱穹孱l率f1位于三倍最小步長(zhǎng)到二分之七倍最小步長(zhǎng)之間時(shí),在頻率為六倍最小步長(zhǎng)到七倍最小步長(zhǎng)之間獲得第三共振峰頻率f2;當(dāng)?shù)诙舱穹孱l率f1位于二分之七倍最小步長(zhǎng)到四倍最小步長(zhǎng)之間時(shí),在頻率為七倍最小步長(zhǎng)到八倍最小步長(zhǎng)之間獲得第三共振峰頻率f2。
13.根據(jù)權(quán)利要求12所述的系統(tǒng),其中,所述第一頻率區(qū)間:261.6~293.7,第二頻率區(qū)間:293.7~329.6,第三頻率區(qū)間:329.6~392.0,第四頻率區(qū)間:392.0~440.0,第五頻率區(qū)間:440.0~523.2;其中,
當(dāng)所述第三共振峰頻率f2位于所述第一頻率區(qū)間:261.6~293.7,所述單字的音頻屬于上宮;
當(dāng)所述第三共振峰頻率f2位于所述第二頻率區(qū)間:293.7~329.6,所述單字的音頻屬于上商;
當(dāng)所述第三共振峰頻率f2位于所述第三頻率區(qū)間:329.6~392.0,所述單字的音頻屬于上角;
當(dāng)所述第三共振峰頻率f2位于所述第四頻率區(qū)間:392.0~440.0,所述單字的音頻屬于上徵;
當(dāng)所述第三共振峰頻率f2位于所述第五頻率區(qū)間:440.0~523.2,所述單字的音頻屬于上羽。
14.根據(jù)權(quán)利要求9所述的系統(tǒng),還包括:輸出單元,計(jì)算所述音頻中所述上宮、上商、上角、上徵或上羽出現(xiàn)的權(quán)重,選取權(quán)重最大的音階作為所述音頻的音階輸出。