專利名稱:一種手機音頻文件的情緒化處理和播放方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種情緒化處理技術(shù),尤其是涉及一種手機音頻文件的情緒化 處理和播放方法。
背景技術(shù):
現(xiàn)有音樂播放器,包括手機,其一般提供歌曲分類列表只能基于音樂所屬 流派,歌手名稱,專輯名稱等信息進行分類管理。智能播放器可以使用基于歌 曲內(nèi)容分析分類技術(shù),以便用戶可以方便選擇自己喜歡聽歌曲。例如基于音樂 內(nèi)容的情緒分類,用戶可以根據(jù)需要選擇溫柔、歡樂、憂傷或憤怒的歌曲。
因此,如何將音頻文件在手機中進行情緒化播放是目前手機所面臨的一個 問題。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題在于提供一種手機音頻文件情緒化處理和播 放方法,可以在手機上進行音頻文件的情緒化播放。
為了實現(xiàn)上述目的,本發(fā)明提供了一種手機音頻文件情緒化處理和播放方 法,其特點在于,包括如下步驟
步驟l,確定用戶的現(xiàn)場聽覺需求;
步驟2,根據(jù)用戶的現(xiàn)場聽覺需求,利用一音頻處理軟件對一輸入音頻文 件進行情緒化處理,得到一處理后音頻文件;
步驟3,歸納該處理后的音頻文件的提取特征信息,根據(jù)該提取特征信息 將該處理后的音頻文件進行歸類,并分類存儲到手機中,同時在手機上生成一 目錄索引庫;
步驟4,用戶通過該目錄索引庫進行音頻選擇,選擇相應(yīng)的音頻文件進行 播放。
優(yōu)選地,所述的手機音頻文件情緒化處理和播放方法還包括步驟重復(fù)上
述步驟1 3,對多個輸入音頻文件進行情緒化處理和分類存儲。
優(yōu)選地,所述的手機音頻文件情緒化處理和播放方法在步驟4中,用戶在
選擇相應(yīng)的音頻文件之后,還包括歩驟利用手機內(nèi)的風(fēng)格化處理軟件對所選 擇的音頻文件進行風(fēng)格化處理,增加相應(yīng)的風(fēng)格化音效后再進行播放。
優(yōu)選地,所述的手機音頻文件情緒化處理和播放方法在步驟2中,所述的 情緒化處理包括
步驟21,分析該輸入音頻文件在某時刻產(chǎn)生的頻率點的數(shù)量、力度及頻 率,確定節(jié)奏復(fù)雜度和歌曲速度范圍;
步驟22,按照音樂和聲理論,計算整首音樂的音強差及相似音強之間的 時間值,確定歌曲的速度和節(jié)奏;并按照頻率對音頻文件影響計算頻率點的變 化時間,確定歌曲的情緒;
步驟23,根據(jù)所確定的歌曲的速度和節(jié)奏、情緒,生成該處理后音頻文件。
優(yōu)選地,所述的手機音頻文件情緒化處理和播放方法在步驟3中,進行歸 類的步驟包括
步驟31,使用訓(xùn)練樣本訓(xùn)練一參考模式庫,該參考模式庫包括各種情緒 化特征的參考模式;
步驟32,對該處理后的音頻文件進行分析,提取其中能區(qū)別情感的特征 參數(shù);
步驟33,將所提取的特征參數(shù)同參考模式進行匹配比較,得到分類結(jié)果。 優(yōu)選地,所述的手機音頻文件情緒化處理和播放方法所述步驟33進一步 包括
步驟331,根據(jù)提取的強度特征進行分類,強度弱的歸屬分類I,強度強 的歸屬分類II;
步驟332,分別在分類I、 II中,再根據(jù)音色和節(jié)奏進行分類。 優(yōu)選地,所述的手機音頻文件情緒化處理和播放方法中,所述強度特征采 用信號能量在頻域的分布參數(shù);所述音色特征采用描述信號頻譜形狀和頻譜對 比度參數(shù);所述節(jié)奏特征采用節(jié)奏強度、節(jié)奏規(guī)則度和節(jié)拍參數(shù)。
優(yōu)選地,所述的手機音頻文件情緒化處理和播放方法中,在生成該處理后 音頻文件之前還包括步驟24,將該音頻文件進行風(fēng)格化處理,將情緒化處
理和風(fēng)格化處理后的音頻文件整合成該處理后的音頻文件。
根據(jù)本發(fā)明,可以將音頻文件進行情緒化處理后在手機上進行情緒化播
放,使播放音樂更加具有主動性,大大提高了欣賞的靈活性。
以下結(jié)合附圖和具體實施例對本發(fā)明進行詳細描述,但不作為對本發(fā)明的限定。
圖1為本發(fā)明一較佳的手機音頻文件情緒化處理及播放方法的流程圖; 圖2為本發(fā)明另一較佳的手機音頻文件情緒化處理及播放方法的流程圖; 圖3為本發(fā)明的分類方法流程圖;以及 圖4為本發(fā)明的模式識別方法流程圖。
具體實施例方式
如圖1所示,本發(fā)明的手機音頻文件情緒化處理和播放方法包括以下步
驟
步驟l,確定用戶的現(xiàn)場聽覺需求;
步驟2,根據(jù)用戶的現(xiàn)場聽覺需求,利用一音頻處理軟件對一輸入音頻文 件進行情緒化處理,得到一處理后音頻文件;
步驟3,歸納該處理后的音頻文件的提取特征信息,根據(jù)該提取特征信息 將該處理后的音頻文件進行歸類,并分類存儲到手機中,同時在手機上生成一 目錄索引庫;
步驟4,用戶通過該目錄索引庫進行音頻選擇,選擇相應(yīng)的音頻文件進行 播放。
其中,在步驟1中,確定用戶的現(xiàn)場聽覺需求包括風(fēng)格(如搖滾,抒情, 布魯斯等)、設(shè)定速度范圍、節(jié)奏復(fù)雜度、頻率響應(yīng)范圍及速度范圍,及音強 值的設(shè)定等。
結(jié)合圖2,本發(fā)明的手機音頻文件情緒化處理和播放方法在步驟4中,用 戶在選擇相應(yīng)的音頻文件之后,還可以包括步驟利用手機內(nèi)的風(fēng)格化處理軟 件對所選擇的音頻文件進行風(fēng)格化處理,增加相應(yīng)的風(fēng)格化音效后再進行播 放。
在本發(fā)明的一個實施例中,可以重復(fù)上述步驟1 3,對多個輸入音頻文件 進行情緒化處理和分類存儲,如此即可以在手機內(nèi)產(chǎn)生一目錄索引庫,其由不 同分類的文件庫構(gòu)成,每一類別的文件庫下存儲多個同類的音頻文件。
在本發(fā)明的一個實施例中,在步驟2中,可以采用現(xiàn)有的音頻處理軟件, 例如CoolEdit,對輸入音頻文件的情緒化處理,其可包括如下步驟
步驟21,分析該輸入音頻文件在某時刻產(chǎn)生的頻率點的數(shù)量、力度及頻 率,確定節(jié)奏復(fù)雜度和歌曲速度范圍;
步驟22,按照音樂和聲理論,計算整首音樂的音強差及相似音強之間的 時間值,確定歌曲的速度和節(jié)奏;并按照頻率對音頻文件影響計算頻率點的變 化時間,確定歌曲的情緒;
步驟23,根據(jù)所確定的歌曲的速度和節(jié)奏、情緒,生成該處理后音頻文件。
在本發(fā)明一較佳的實施例中,在分析音頻文件的各頻率點之間的時間差及 力度、響度信息后,歸類提取特征參數(shù)(建立模式庫),然后利用音頻處理軟 件給某一段頻率上的力度和響度進行適當(dāng)?shù)奶幚恚黾踊蛘咚p,并可加上所 需各種混響(大廳,演奏廳等)效果,從而來達到所期望的情緒化效果,即生 成該處理后的音頻文件。
優(yōu)選地,本發(fā)明在步驟3中,對處理后的音頻文件進行歸類的步驟包括
步驟31,使用訓(xùn)練樣本訓(xùn)練一參考模式庫,該參考模式庫包括各種情緒 化特征的參考模式;
步驟32,對該處理后的音頻文件進行分析,提取其中能區(qū)別情感的特征 參數(shù);
步驟33,將所提取的特征參數(shù)同參考模式進行匹配比較,得到分類結(jié)果。 如圖3所示,本發(fā)明提供一種以模式識別為基礎(chǔ)的分類系統(tǒng)框架,本發(fā)明 可以采用這種分類系統(tǒng)框架來進行歸類。其中,在訓(xùn)練階段使用訓(xùn)練樣本訓(xùn)練 參考模式庫(識別模型),通常可采用HMM、 GMM等統(tǒng)計概率模型,建立 不同類別的參考模式;在特征提取階段通過對音樂信號進行分析,提取一些能 區(qū)別情感的一些特征參數(shù);在模式匹配階段,將待分類的特征參數(shù)同參考模式 進行匹配比較,以得到分類結(jié)果。
上面過程,對一般模式識別應(yīng)用,如語音識別等,都基本類似。具體到音
樂的情感分類,由于情感是一個主觀的概念,很難有明確的客觀特征參數(shù)來描 述,因此通常會選取多個特征參數(shù),通過一種分層框架來實現(xiàn)。
本發(fā)明在所述步驟33中,即采用如圖4所示的分層框架來進行模式識別,
其包括
步驟331,根據(jù)提取的強度(Intensity)特征進行分類,強度弱的歸屬分 類I,強度強的歸屬分類II;
步驟332,分別在分類I、 II中,再根據(jù)音色(timbre)和節(jié)奏(rhythm)
進行分類。
例如,圖4中選取四個特征參數(shù)^ 、 A2 、 l-A、 1-A2,其中V 1 —A, 分別代表分類I中音色和節(jié)奏的權(quán)值,^、 1-義2分別代表分類11中音色和節(jié)奏 的權(quán)值。對于分類I,音色要比節(jié)奏好區(qū)分,因此權(quán)值A(chǔ)^0.5;對于分類II, 節(jié)奏要比音色好區(qū)分,因此權(quán)值^<0.5。
在具體音樂信號特征提取時,強度特征采用信號能量在頻域的分布參數(shù);
音色特征采用描述信號頻譜形狀和頻譜對比度參數(shù);節(jié)奏特征采用節(jié)奏強度, 節(jié)奏規(guī)則度和節(jié)拍等參數(shù)。
關(guān)于上述分類的具體實現(xiàn)方法,可以參考論文Lie Lu, Dan Liu, and Hong-Jiang Zhang, "Automatic Mood Detection and Tracking of Music Audio Signals" , IEEE TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING, VOL. 14, NO. 1, JANUARY 2006。(呂列、劉丹和張洪江
"自動情緒探測和音樂音頻信號跟蹤"——電氣和電子工程師協(xié)會會報音 頻、語音和語言處理VOL. 14,NO. 1, JANUARY 2006)
在將所有音頻文件都經(jīng)過情緒化處理后,可以將處理后的音頻文件通過上 述分類方法分類存儲到手機上,同時生成一目錄索引庫,當(dāng)用戶希望進行情緒 化播放時,可進入手機的音頻風(fēng)格選擇模式,自動搜索設(shè)備中的音頻文件或手 動選擇存放的目錄進行播放,從而可以欣賞到情緒化的音頻文件。
在本發(fā)明中,在選擇播放的音頻文件后,還可以利用手機上自帶的風(fēng)格化 處理軟件,將音頻文件加入風(fēng)格化音效后進行播放,例如,增加聲音反射時間 計算,模仿大廳等各種特效,使播放音樂更加具有主動性,大大提高的了欣賞 的靈活性。當(dāng)然,本發(fā)明也可以在進行情緒化處理過程中,將音頻文件進行風(fēng) 格化處理后再進行分類存儲,這些并不作為對本發(fā)明的限制。
當(dāng)然,本發(fā)明還可有其他多種實施例,在不背離本發(fā)明精神及其實質(zhì)的情 況下,熟悉本領(lǐng)域的技術(shù)人員當(dāng)可根據(jù)本發(fā)明作出各種相應(yīng)的改變和變型,但 這些相應(yīng)的改變和變形都應(yīng)屬于本發(fā)明所附的權(quán)利要求的保護范圍。
權(quán)利要求
1.一種手機音頻文件情緒化處理和播放方法,其特征在于,包括如下步驟步驟1,確定用戶的現(xiàn)場聽覺需求;步驟2,根據(jù)用戶的現(xiàn)場聽覺需求,利用一音頻處理軟件對一輸入音頻文件進行情緒化處理,得到一處理后音頻文件;步驟3,歸納該處理后的音頻文件的提取特征信息,根據(jù)該提取特征信息將該處理后的音頻文件進行歸類,并分類存儲到手機中,同時在手機上生成一目錄索引庫;步驟4,用戶通過該目錄索引庫進行音頻選擇,選擇相應(yīng)的音頻文件進行播放。
2、 根據(jù)權(quán)利要求1所述的手機音頻文件情緒化處理和播放方法,其特征 在于,還包括步驟-重復(fù)上述步驟"3,對多個輸入音頻文件進行情緒化處理和分類存儲。
3、 根據(jù)權(quán)利要求1或2所述的手機音頻文件情緒化處理和播放方法,其 特征在于,在步驟4中,用戶在選擇相應(yīng)的音頻文件之后,還包括步驟利用手機內(nèi)的風(fēng)格化處理軟件對所選擇的音頻文件進行風(fēng)格化處理,增 加相應(yīng)的風(fēng)格化音效后再進行播放。
4、 根據(jù)權(quán)利要求1所述的手機音頻文件情緒化處理和播放方法,其特征 在于,在步驟2中,所述的情緒化處理包括步驟21,分析該輸入音頻文件在某時刻產(chǎn)生的頻率點的數(shù)量、力度及頻 率,確定節(jié)奏復(fù)雜度和歌曲速度范圍;步驟22,按照音樂和聲理論,計算整首音樂的音強差及相似音強之間的 時間值,確定歌曲的速度和節(jié)奏;并按照頻率對音頻文件影響計算頻率點的 變化時間,確定歌曲的情緒;步驟23,根據(jù)所確定的歌曲的速度和節(jié)奏、情緒,生成該處理后音頻文件。
5、 根據(jù)權(quán)利要求4所述的手機音頻文件情緒化處理和播放方法,其特征 在于,在步驟3中,進行歸類的步驟包括步驟31,使用訓(xùn)練樣本訓(xùn)練一參考模式庫,該參考模式庫包括各種情緒 化特征的參考模式;步驟32,對該處理后的音頻文件進行分析,提取其中能區(qū)別情感的特征 參數(shù);步驟33,將所提取的特征參數(shù)同參考模式進行匹配比較,得到分類結(jié)果。
6、 根據(jù)權(quán)利要求5所述的手機音頻文件情緒化處理和播放方法,其特征 在于,所述步驟33進一步包括步驟331,根據(jù)提取的強度特征進行分類,強度弱的歸屬分類I,強度強 的歸屬分類II;步驟332,分別在分類I、 II中,再根據(jù)音色和節(jié)奏進行分類。
7、 根據(jù)權(quán)利要求6所述的手機音頻文件情緒化處理和播放方法,其特征 在于,所述強度特征采用信號能量在頻域的分布參數(shù);所述音色特征采用描 述信號頻譜形狀和頻譜對比度參數(shù);所述節(jié)奏特征采用節(jié)奏強度、節(jié)奏規(guī)則 度和節(jié)拍參數(shù)。
8、 根據(jù)權(quán)利要求4所述的手機音頻文件情緒化處理和播放方法,其特征 在于,在生成該處理后音頻文件之前還包括步驟24,將該音頻文件進行風(fēng)格化處理,將情緒化處理和風(fēng)格化處理后 的音頻文件整合成該處理后的音頻文件。
全文摘要
本發(fā)明涉及一種手機音頻文件情緒化處理和播放方法,包括如下步驟步驟1,確定用戶的現(xiàn)場聽覺需求;步驟2,根據(jù)用戶的現(xiàn)場聽覺需求,利用一音頻處理軟件對一輸入音頻文件進行情緒化處理,得到一處理后音頻文件;步驟3,歸納該處理后的音頻文件的提取特征信息,根據(jù)該提取特征信息將該處理后的音頻文件進行歸類,并分類存儲到手機中,同時在手機上生成一目錄索引庫;步驟4,用戶通過該目錄索引庫進行音頻選擇,選擇相應(yīng)的音頻文件進行播放。
文檔編號H04M1/21GK101370216SQ20081022409
公開日2009年2月18日 申請日期2008年10月15日 優(yōu)先權(quán)日2008年10月15日
發(fā)明者儲信鵬, 呂博學(xué) 申請人:北京中星微電子有限公司