音頻的混音方法和裝置制造方法

文檔序號(hào)：2827436閱讀：303來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

音頻的混音方法和裝置制造方法
【專利摘要】本發(fā)明公開了一種音頻的混音方法和裝置。所述音頻的混音方法包括：通過瀏覽器端的音頻處理應(yīng)用程序接口加載音頻文件，其中，所述瀏覽器端的音頻處理應(yīng)用程序接口是嵌入在頁(yè)面代碼中的用于音頻處理的應(yīng)用程序接口；通過瀏覽器端的音頻處理應(yīng)用程序接口解析所述音頻文件的聲道信息，根據(jù)所述聲道信息從加載的所述音頻文件中提取伴奏音；通過瀏覽器端的音頻采集接口獲取用戶的演唱音；通過瀏覽器端的音頻處理應(yīng)用程序接口將所述伴奏音和演唱音進(jìn)行混音處理，以生成混音文件，通過所述瀏覽器端的音頻輸出接口輸出。本發(fā)明實(shí)施例提供的音頻的混音方法和裝置使得用戶只要訪問網(wǎng)頁(yè)就能使用KTV點(diǎn)唱的功能，提高了音樂混音處理的便捷性，簡(jiǎn)化了操作。
【專利說明】音頻的混音方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及音頻數(shù)據(jù)處理技術(shù)，尤其涉及音頻的混音方法和裝置。
【背景技術(shù)】
[0002]在音頻技術(shù)得到廣泛應(yīng)用的今天，越來越多的用戶愿意通過自己的個(gè)人電腦或者移動(dòng)終端對(duì)歌曲進(jìn)行點(diǎn)唱，將伴奏音與自己的演唱音進(jìn)行混音輸出，從而實(shí)現(xiàn)KTV中的點(diǎn)唱效果。
[0003]目前實(shí)現(xiàn)KTV點(diǎn)唱效果的技術(shù)一般有兩個(gè)環(huán)節(jié)，一是獲取伴奏音，另一是將伴奏音與演唱音進(jìn)行混音處理。獲取伴奏音的方式可以是直接得到某歌曲的伴奏音，但并非所有歌曲都有伴奏音，所以還可以在終端設(shè)備中安裝專用的音樂處理軟件，人工手動(dòng)對(duì)音頻文件進(jìn)行加工，生成伴奏音；或者也可以由將音頻文件提供至服務(wù)器端進(jìn)行音頻源解析，通過算法處理生成伴奏音。
[0004]但是，上述現(xiàn)有技術(shù)，若由服務(wù)器端進(jìn)行操作，則需要占用網(wǎng)絡(luò)傳輸資源，也需要專門的服務(wù)器提供服務(wù)才可實(shí)現(xiàn)。若由終端設(shè)置的音樂處理軟件來實(shí)現(xiàn)，則一方面需要單獨(dú)安裝專用軟件，另一方面還需要用戶了解音頻處理技巧才能進(jìn)行軟件操作，所以操作不便。

【發(fā)明內(nèi)容】

[0005]有鑒于此，本發(fā)明提出一種音頻的混音方法和裝置，以提高音樂混音處理的便捷性，簡(jiǎn)化操作。
[0006]第一方面，本發(fā)明實(shí)施例提供了一種音頻的混音方法，所述方法包括:
[0007]通過瀏覽器端的音頻處理應(yīng)用程序接口加載音頻文件，其中，所述瀏覽器端的音頻處理應(yīng)用程序接口是嵌入在頁(yè)面代碼中的用于音頻處理的應(yīng)用程序接口；
[0008]通過瀏覽器端的音頻處理應(yīng)用程序接口解析所述音頻文件的聲道信息，根據(jù)所述聲道信息從加載的所述音頻文件中提取伴奏音；
[0009]通過瀏覽器端的音頻采集接口獲取用戶的演唱音；
[0010]通過瀏覽器端的音頻處理應(yīng)用程序接口將所述伴奏音和演唱音進(jìn)行混音處理，以生成混音文件，通過所述瀏覽器端的音頻輸出接口輸出。
[0011]第二方面，本發(fā)明實(shí)施例提供了一種音頻的混音裝置，所述裝置包括:
[0012]音頻文件加載模塊，用于通過瀏覽器端的音頻處理應(yīng)用程序接口加載音頻文件，其中，所述瀏覽器端的音頻處理應(yīng)用程序接口是嵌入在頁(yè)面代碼中的用于音頻處理的應(yīng)用程序接口；
[0013]伴奏音提取模塊，用于通過瀏覽器端的音頻處理應(yīng)用程序接口解析所述音頻文件的聲道信息，根據(jù)所述聲道信息從加載的所述音頻文件中提取伴奏音；
[0014]演唱音獲取模塊，用于通過瀏覽器端的音頻采集接口獲取用戶的演唱音；
[0015]混音處理模塊，用于通過瀏覽器端的音頻處理應(yīng)用程序接口將所述伴奏音和演唱音進(jìn)行混音處理，以生成混音文件，通過所述瀏覽器端的音頻輸出接口輸出。
[0016]本發(fā)明實(shí)施例提供的音頻的混音方法和裝置，通過瀏覽器的音頻處理功能，利用音頻文件的聲道信息提取伴奏音，再通過瀏覽器的音頻采集接口獲取用戶的演唱音，最后將所述伴奏音和演唱音進(jìn)行混音處理以生成混音文件，完全依靠嵌入在Web頁(yè)面中的代碼實(shí)現(xiàn)了 KTV中的點(diǎn)唱效果，且無(wú)需服務(wù)器端進(jìn)行處理，也無(wú)需用戶基于復(fù)雜的專業(yè)知識(shí)進(jìn)行復(fù)雜的伴奏音提取處理，從而提高了音樂混音處理的便捷性，簡(jiǎn)化了操作。
【專利附圖】

【附圖說明】
[0017]通過閱讀參照以下附圖所作的對(duì)非限制性實(shí)施例所作的詳細(xì)描述，本發(fā)明的其它特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯:
[0018]圖1是本發(fā)明第一實(shí)施例提供的音頻的混音方法的流程圖；
[0019]圖2是本發(fā)明第一實(shí)施例提供的音頻的混音方法的信號(hào)流示意圖；
[0020]圖3是本發(fā)明第二實(shí)施例提供的音頻的混音方法中伴奏音提取的流程圖；
[0021]圖4是本發(fā)明第三實(shí)施例提供的音頻的混音方法的流程圖；
[0022]圖5是本發(fā)明第四實(shí)施例提供的音頻的混音方法的流程圖；
[0023]圖6是本發(fā)明第五實(shí)施例提供的音頻的混音裝置的結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0024]下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說明?？梢岳斫獾氖?，此處所描述的具體實(shí)施例僅用于解釋本發(fā)明，而非對(duì)本發(fā)明的限定。另外還需要說明的是，為了便于描述，附圖中僅示出了與本發(fā)明相關(guān)的部分而非全部?jī)?nèi)容。
[0025]圖1及圖2示出了本發(fā)明的第一實(shí)施例。
[0026]圖1是本發(fā)明第一實(shí)施例提供的音頻的混音方法的流程圖。該方法可以由音頻的混音裝置來執(zhí)行，該裝置可以采用軟件實(shí)現(xiàn)，集成在瀏覽器中實(shí)現(xiàn)。參見圖1，所述音頻的混音方法包括:
[0027]S110，通過瀏覽器端的音頻處理應(yīng)用程序處理應(yīng)用程序接口加載音頻文件，其中，所述瀏覽器端的音頻處理應(yīng)用程序接口是嵌入在頁(yè)面代碼中的用于音頻處理的應(yīng)用程序接口。
[0028]在本實(shí)施例中，實(shí)施所述音頻的混音方法的可以是一臺(tái)客戶端計(jì)算機(jī)。所述客戶端計(jì)算機(jī)可以是連接至因特網(wǎng)的個(gè)人電腦或者工作站，也可以是其他連接至因特網(wǎng)的計(jì)算設(shè)備。并且，該客戶端計(jì)算機(jī)安裝有網(wǎng)頁(yè)瀏覽器，能夠通過其上安裝的網(wǎng)頁(yè)瀏覽器瀏覽因特網(wǎng)的網(wǎng)頁(yè)。所述網(wǎng)頁(yè)瀏覽器可以是微軟公司的IE瀏覽器，也可以是谷歌公司的Chrome瀏覽器，還可以是網(wǎng)景公司的網(wǎng)景瀏覽器等任意瀏覽器。
[0029]音頻的混音方法可以由客戶端腳本語(yǔ)言代碼，例如Javascript代碼來實(shí)現(xiàn)。該客戶端腳本語(yǔ)言代碼可以配置于瀏覽器本地，也可以由用戶在瀏覽器的地址欄輸入設(shè)定的網(wǎng)絡(luò)地址，或者點(diǎn)擊鏈接到設(shè)定網(wǎng)絡(luò)地址的網(wǎng)頁(yè)鏈接后，瀏覽器訪問實(shí)施所述音頻的混音方法的網(wǎng)頁(yè)，獲取客戶端腳本語(yǔ)言代碼。在客戶端腳本語(yǔ)言代碼中可調(diào)用瀏覽器端的音頻處理應(yīng)用程序接口，以實(shí)現(xiàn)音頻的混音處理。其中，所述瀏覽器端的音頻處理應(yīng)用程序接口是嵌入在頁(yè)面代碼中的用于音頻處理的應(yīng)用程序接口。示例的，所述瀏覽器端的音頻處理應(yīng)用程序接口是Web Audio應(yīng)用程序接口。
[0030]通過瀏覽器端的音頻處理應(yīng)用程序接口加載音頻文件。其中，所述音頻文件可以是客戶端計(jì)算機(jī)本地存儲(chǔ)的音頻文件，也可以是存儲(chǔ)在服務(wù)端，需要所述客戶端計(jì)算機(jī)從服務(wù)端下載的音頻文件。
[0031]S120，通過瀏覽器端的音頻處理應(yīng)用程序接口解析所述音頻文件的聲道信息，根據(jù)所述聲道信息從加載的所述音頻文件中提取伴奏音。
[0032]由于音頻文件包括單聲道音頻文件和多聲道音頻文件。因此，在從所述音頻文件中提取伴奏音之前，需要對(duì)加載的音頻文件進(jìn)行解析，并根據(jù)解析得到的聲道信息而從所述音頻文件中提取伴奏音。
[0033]示例的，如果所述音頻文件是雙聲道音頻文件，客戶端計(jì)算機(jī)可以通過對(duì)所述音頻文件的左聲道信息和右聲道信息的解析從加載的所述音頻文件中提取伴奏音。
[0034]S130，通過瀏覽器端的音頻處理應(yīng)用程序采集接口獲取用戶的演唱音。
[0035]從音頻文件中提取伴奏音后，客戶端計(jì)算機(jī)通過瀏覽器端的音頻采集接口獲取用戶的演唱音。所述瀏覽器端的音頻采集接口是客戶端計(jì)算機(jī)上的一種物理接口，可以用來對(duì)用戶輸入的音頻進(jìn)行采集。示例的，所述瀏覽器端的音頻采集接口可以是客戶端計(jì)算機(jī)的麥克風(fēng)接口。在通過瀏覽器端的音頻采集接口獲取用戶的演唱音時(shí)，瀏覽器端的音頻采集接口會(huì)自動(dòng)對(duì)用戶的演唱音進(jìn)行數(shù)字化，因此客戶端計(jì)算機(jī)通過瀏覽器端的音頻采集接口獲取到的用戶的演唱音是數(shù)字信號(hào)形式的演唱音。
[0036]S140，通過瀏覽器端的音頻處理應(yīng)用程序接口將所述伴奏音和演唱音進(jìn)行混音處理，以生成混音文件，通過所述瀏覽器端的音頻輸出接口輸出。
[0037]客戶端計(jì)算機(jī)在提取伴奏音并獲取用戶的演唱音之后，將所述伴奏音與用戶的演唱音進(jìn)行混音?？蛻舳擞?jì)算機(jī)對(duì)伴奏音和演唱音的混音就是將伴奏音的音頻數(shù)據(jù)與演唱音的音頻數(shù)據(jù)進(jìn)行疊加的過程?？蛻舳擞?jì)算機(jī)在將伴奏音的音頻數(shù)據(jù)與演唱音的音頻數(shù)據(jù)進(jìn)行疊加時(shí)，可以選擇以單聲道的方式對(duì)伴奏音的音頻數(shù)據(jù)和演唱音的音頻數(shù)據(jù)進(jìn)行疊加，也可以選擇以多聲道的方式對(duì)伴奏音的音頻數(shù)據(jù)和演唱音的音頻數(shù)據(jù)進(jìn)行疊加。
[0038]將伴奏音的音頻數(shù)據(jù)和演唱音的音頻數(shù)據(jù)進(jìn)行疊加后，可以根據(jù)疊加后的音頻數(shù)據(jù)生成音頻文件。生成的音頻文件可以是wav格式的音頻文件，也可以是mp3格式的音頻文件，還可以是rm格式的音頻文件。
[0039]所述瀏覽器端的音頻輸出接口是客戶端計(jì)算機(jī)的一種物理接口，可以用來輸出音頻。示例的，所述瀏覽器端的音頻輸出接口可以是客戶端計(jì)算機(jī)的揚(yáng)聲器接口。
[0040]圖2是本發(fā)明第一實(shí)施例提供的音頻的混音方法的信號(hào)流示意圖。參見圖2，客戶端計(jì)算機(jī)首先通過瀏覽器端的音頻處理應(yīng)用程序接口加載音頻文件，然后由音頻處理應(yīng)用程序接口從音頻文件中去掉人聲得到伴奏音的音頻，再通過瀏覽器端的音頻采集接口獲取用戶的演唱音，最后由音頻處理應(yīng)用程序接口將提取的伴奏音與用戶的演唱音進(jìn)行混音。
[0041]本實(shí)施例通過利用瀏覽器端的音頻處理應(yīng)用程序接口加載音頻文件，從加載的音頻文件中提取伴奏音，再獲取用戶的演唱音，最后將伴奏音和演唱音進(jìn)行混音處理，實(shí)現(xiàn)了將演唱音和伴奏音的混音處理，提高了音樂混音處理的便捷性，簡(jiǎn)化了操作。
[0042]圖3示出了本發(fā)明的第二實(shí)施例。
[0043]圖3是本發(fā)明第二實(shí)施例提供的音頻的混音方法中伴奏音提取的流程圖。所述音頻的混音方法以本發(fā)明的第一實(shí)施例為基礎(chǔ)，進(jìn)一步的，解析所述音頻文件的聲道信息，根據(jù)所述聲道信息從加載的所述音頻文件中提取伴奏音包括:
[0044]S121，解析所述音頻文件的聲道信息，獲取所述音頻文件的左聲道音頻數(shù)據(jù)和右聲道音頻數(shù)據(jù)。
[0045]在本實(shí)施例中，所述音頻文件是具有雙聲道的音頻文件。在加載了所述音頻文件后，對(duì)所述音頻文件的聲道信息進(jìn)行解析，并獲取所述音頻文件的左聲道音頻數(shù)據(jù)和右聲道音頻數(shù)據(jù)。
[0046]S122，如果左聲道音頻數(shù)據(jù)與右聲道音頻數(shù)據(jù)相同，則使用濾波算法對(duì)所述左聲道音頻數(shù)據(jù)或右聲道音頻數(shù)據(jù)進(jìn)行濾波，以提取伴奏音。
[0047]當(dāng)左聲道音頻數(shù)據(jù)與右聲道音頻數(shù)據(jù)完全相同時(shí)，沒有辦法根據(jù)左聲道音頻數(shù)據(jù)與右聲道音頻數(shù)據(jù)之間的差異而區(qū)分出原唱的演唱音的音頻。因此，只能根據(jù)人演唱時(shí)的音頻數(shù)據(jù)自身的特點(diǎn)從音頻中區(qū)分原唱的演唱音和伴奏音。
[0048]一般情況下，人演唱的聲音的頻率在IOOHz到300Hz之間，因此，可以構(gòu)建截止頻率為IOOHz和300Hz的帶陷濾波器，將音頻文件上頻率在IOOHz與300Hz之間的信號(hào)濾除，并將經(jīng)帶陷濾波器過濾后的音頻作為伴奏音的音頻。
[0049]具體的，可以通過瀏覽器端的音頻處理應(yīng)用程序接口構(gòu)建軟件的帶陷濾波器，以對(duì)音頻文件進(jìn)行帶陷濾波，提取所述音頻文件的伴奏音。
[0050]S123，如果左聲道音頻數(shù)據(jù)與右聲道音頻數(shù)據(jù)不同，則獲取左聲道音頻數(shù)據(jù)與右聲道音頻數(shù)據(jù)的差異值，且根據(jù)所述差異值提取伴奏音。
[0051]當(dāng)左聲道音頻數(shù)據(jù)與右聲道音頻數(shù)據(jù)不同時(shí)，左聲道音頻數(shù)據(jù)與右聲道音頻數(shù)據(jù)的差值一般是伴奏音的音頻數(shù)據(jù)。因此，可以通過計(jì)算左聲道音頻數(shù)據(jù)與右聲道音頻數(shù)據(jù)的差值提取伴奏音。為提取的音頻數(shù)據(jù)是伴奏音，可以進(jìn)一步通過頻率檢測(cè)來確定。通常人演唱的聲音的頻率在IOOHz到300Hz之間。因此，將左聲道音頻數(shù)據(jù)與右聲道音頻數(shù)據(jù)作差，并從包含演唱音的音頻數(shù)據(jù)中去除掉上一步作差得到的結(jié)果數(shù)據(jù)，就可以獲得伴奏音的音頻數(shù)據(jù)。
[0052]本實(shí)施例通過獲取音頻文件的左聲道音頻數(shù)據(jù)以及右聲道音頻數(shù)據(jù)，在左聲道音頻數(shù)據(jù)與右聲道音頻數(shù)據(jù)相同時(shí)使用濾波算法提取伴奏音，而在左聲道音頻數(shù)據(jù)與右聲道音頻數(shù)據(jù)不同時(shí)利用左右聲道之間的差異提取伴奏音，實(shí)現(xiàn)根據(jù)不同的音頻文件采用不同的方式從音頻文件中提取伴奏音。
[0053]圖4示出了本發(fā)明的第三實(shí)施例。
[0054]圖4是本發(fā)明第三實(shí)施例提供的音頻的混音方法的流程圖。所述音頻的混音方法以本發(fā)明的第一實(shí)施例為基礎(chǔ)，進(jìn)一步的，在解析所述音頻文件的聲道信息，根據(jù)所述聲道信息從加載的所述音頻文件中提取伴奏音之前，還包括:去除所述音頻文件的中頻頻率，以得到包括高頻和低頻的音頻數(shù)據(jù)作為立體聲補(bǔ)償后的音頻文件。具體的，參見圖4，所述音頻的混音方法包括:
[0055]S410，通過瀏覽器端的音頻處理應(yīng)用程序接口加載音頻文件，其中，所述瀏覽器端的音頻處理應(yīng)用程序接口是嵌入在頁(yè)面代碼中的用于音頻處理的應(yīng)用程序接口。
[0056]S420，去除所述音頻文件的中頻頻率，以得到包括高頻和低頻的音頻數(shù)據(jù)作為立體聲補(bǔ)償后的音頻文件。[0057]為了避免在從所述音頻文件中提取原唱的演唱音時(shí)會(huì)對(duì)伴奏音造成損失，在提取伴奏音之前，通過去除所述音頻文件的中頻頻率，來對(duì)音頻文件預(yù)先進(jìn)行補(bǔ)償。使用經(jīng)過補(bǔ)償后的音頻文件來提取伴奏音，得到的伴奏音不會(huì)因?yàn)樘崛∵^程而在低頻和高頻數(shù)據(jù)部分造成數(shù)據(jù)損失。需要說明的是，中頻頻率是頻率范圍在IOOHz到300Hz之間的頻率；低頻頻率是頻率范圍低于IOOHz的頻率；高頻頻率是頻率范圍高于300Hz的頻率。
[0058]S430，通過瀏覽器端的音頻處理應(yīng)用程序接口解析所述音頻文件的聲道信息，根據(jù)所述聲道信息從加載的所述音頻文件中提取伴奏音。
[0059]S440，通過瀏覽器端的音頻采集接口獲取用戶的演唱音。
[0060]S450，通過瀏覽器端的音頻處理應(yīng)用程序接口將所述伴奏音和演唱音進(jìn)行混音處理，以生成混音文件，通過所述瀏覽器端的音頻輸出接口輸出。
[0061]本實(shí)施例通過在從音頻文件中提取伴奏音之前，去除音頻文件的中頻頻率，利用得到高頻和低頻的音頻數(shù)據(jù)對(duì)原始的音頻文件進(jìn)行立體聲補(bǔ)償，使得加載的音頻文件的伴奏音具有立體聲效果，提升了用戶使用KTV點(diǎn)唱功能時(shí)的聽覺感受。
[0062]圖5示出了本發(fā)明的第四實(shí)施例。
[0063]圖5是本發(fā)明第四實(shí)施例提供的音頻的混音方法的流程圖。所述音頻的混音方法以本發(fā)明的第一實(shí)施例為基礎(chǔ)，進(jìn)一步的，在將所述伴奏音和演唱音進(jìn)行混音處理之前，還包括:基于設(shè)定的音頻場(chǎng)景規(guī)則對(duì)所述演唱音進(jìn)行預(yù)處理。具體的，參見圖5，所述音頻的混音方法包括:
[0064]S510，通過瀏覽器端的音頻處理應(yīng)用程序接口加載音頻文件，其中，所述瀏覽器端的音頻處理應(yīng)用程序接口是嵌入在頁(yè)面代碼中的用于音頻處理的應(yīng)用程序接口。
[0065]S520，通過瀏覽器端的音頻處理應(yīng)用程序接口解析所述音頻文件的聲道信息，根據(jù)所述聲道信息從加載的所述音頻文件中提取伴奏音。
[0066]S530，通過瀏覽器端的音頻采集接口獲取用戶的演唱音。
[0067]S540，基于設(shè)定的音頻場(chǎng)景規(guī)則對(duì)所述演唱音進(jìn)行預(yù)處理。
[0068]為了對(duì)用戶的演唱音進(jìn)行美化，在獲取用戶的演唱音之后，基于設(shè)定的音頻場(chǎng)景規(guī)則對(duì)所述演唱音進(jìn)行預(yù)處理。對(duì)演唱音進(jìn)行預(yù)處理后，用戶的演唱音就具備了根據(jù)設(shè)定的音頻場(chǎng)景規(guī)則而產(chǎn)生的音效。具體的，經(jīng)過對(duì)演唱音的預(yù)處理以后，用戶的演唱音可能具有的音效包括:教堂音效、音樂廳音效、洞穴音效、隧道音效、門廳音效以及森林音效。
[0069]S550，通過瀏覽器端的音頻處理應(yīng)用程序接口將所述伴奏音和演唱音進(jìn)行混音處理，以生成混音文件，通過所述瀏覽器端的音頻輸出接口輸出。
[0070]本實(shí)施例通過在將所述伴奏音和演唱音進(jìn)行混音處理之前，基于設(shè)定的音頻場(chǎng)景規(guī)則對(duì)所述演唱音進(jìn)行預(yù)處理，降低了對(duì)伴奏音提取過程中對(duì)伴奏音的損耗，提升了用戶使用KTV點(diǎn)唱功能時(shí)的聽覺感受。
[0071]圖6示出了本發(fā)明的第五實(shí)施例。
[0072]圖6是本發(fā)明第五實(shí)施例提供的音頻的混音裝置的結(jié)構(gòu)圖。參見圖6，所述音頻的混音裝置包括:音頻文件加載模塊610、伴奏音提取模塊630、演唱音獲取模塊640以及混音處理模塊660。
[0073]所述音頻文件加載模塊610用于通過瀏覽器端的音頻處理應(yīng)用程序接口加載音頻文件，其中，所述瀏覽器端的音頻處理應(yīng)用程序接口是嵌入在頁(yè)面代碼中的用于音頻處理的應(yīng)用程序接口。
[0074]所述伴奏音提取模塊630用于通過瀏覽器端的音頻處理應(yīng)用程序接口解析所述音頻文件的聲道信息，根據(jù)所述聲道信息從加載的所述音頻文件中提取伴奏音。
[0075]所述演唱音獲取模塊640用于通過瀏覽器端的音頻采集接口獲取用戶的演唱音。
[0076]所述混音處理模塊660用于通過瀏覽器端的音頻處理應(yīng)用程序接口將所述伴奏音和演唱音進(jìn)行混音處理，以生成混音文件，通過所述瀏覽器端的音頻輸出接口輸出。
[0077]優(yōu)選的，所述伴奏音提取模塊630包括:聲道信息解析單元631、濾波單元632以及差異提取單元633。
[0078]所述聲道信息解析單元631用于解析所述音頻文件的聲道信息，獲取所述音頻文件的左聲道音頻數(shù)據(jù)和右聲道音頻數(shù)據(jù)。
[0079]所述濾波單元632用于在左聲道音頻數(shù)據(jù)與右聲道音頻數(shù)據(jù)相同時(shí)，使用濾波算法對(duì)所述左聲道音頻數(shù)據(jù)或右聲道音頻數(shù)據(jù)進(jìn)行濾波，以提取伴奏音。
[0080]所述差異提取單元633用于在左聲道音頻數(shù)據(jù)與右聲道音頻數(shù)據(jù)不同時(shí)，獲取左聲道音頻數(shù)據(jù)與右聲道音頻數(shù)據(jù)的差異值，且根據(jù)所述差異值提取伴奏音。
[0081]優(yōu)選的，所述音頻的混音裝置還包括:立體聲補(bǔ)償模塊620。
[0082]所述立體聲補(bǔ)償模塊620用于在通過瀏覽器端的音頻處理應(yīng)用程序接口解析所述音頻文件的聲道信息，根據(jù)所述聲道信息從加載的所述音頻文件中提取伴奏音之前，去除所述音頻文件的中頻頻率，以得到包括高頻和低頻的音頻數(shù)據(jù)作為立體聲補(bǔ)償后的音頻文件。
[0083]優(yōu)選的，所述音頻的混音裝置還包括:演唱音預(yù)處理模塊650。
[0084]所述演唱音預(yù)處理模塊650用于在通過瀏覽器端的音頻處理應(yīng)用程序接口將所述伴奏音和演唱音進(jìn)行混音處理之前，基于設(shè)定的音頻場(chǎng)景規(guī)則對(duì)所述演唱音進(jìn)行預(yù)處理。
[0085]優(yōu)選的，所述瀏覽器端的音頻處理應(yīng)用程序接口包括Web Audio接口。
[0086]本實(shí)施例通過加載音頻文件，從加載的音頻文件中提取伴奏音，再獲取用戶的演唱首，最后將伴奏首和演唱首進(jìn)行混首處理，實(shí)現(xiàn)了將演唱首和伴奏首的混首處理，提聞了音樂混音處理的便捷性，簡(jiǎn)化了操作。
[0087]上述本發(fā)明實(shí)施例序號(hào)僅僅為了描述，不代表實(shí)施例的優(yōu)劣。
[0088]本領(lǐng)域普通技術(shù)人員應(yīng)該明白，上述的本發(fā)明的各模塊或各步驟可以用通用的計(jì)算裝置來實(shí)現(xiàn)，它們可以集中在單個(gè)計(jì)算裝置上，或者分布在多個(gè)計(jì)算裝置所組成的網(wǎng)絡(luò)上，可選地，他們可以用計(jì)算機(jī)裝置可執(zhí)行的程序代碼來實(shí)現(xiàn)，從而可以將它們存儲(chǔ)在存儲(chǔ)裝置中由計(jì)算裝置來執(zhí)行，或者將它們分別制作成各個(gè)集成電路模塊，或者將它們中的多個(gè)模塊或步驟制作成單個(gè)集成電路模塊來實(shí)現(xiàn)。這樣，本發(fā)明不限制于任何特定的硬件和軟件的結(jié)合。
[0089]本說明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述，每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處，各個(gè)實(shí)施例之間的相同或相似的部分互相參見即可。
[0090]最后，還需要說明的是，在本文中，諸如第一和第二等之類的關(guān)系屬于僅僅用來將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或者操作區(qū)分開來，而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。[0091]以上所述僅為本發(fā)明的優(yōu)選實(shí)施例，并不用于限制本發(fā)明，對(duì)于本領(lǐng)域技術(shù)人員而言，本發(fā)明可以有各種改動(dòng)和變化。凡在本發(fā)明的精神和原理之內(nèi)所作的任何修改、等同替換、改進(jìn)等，均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種音頻的混音方法，其特征在于，包括: 通過瀏覽器端的音頻處理應(yīng)用程序接口加載音頻文件，其中，所述瀏覽器端的音頻處理應(yīng)用程序接口是嵌入在頁(yè)面代碼中的用于音頻處理的應(yīng)用程序接口；通過瀏覽器端的音頻處理應(yīng)用程序接口解析所述音頻文件的聲道信息，根據(jù)所述聲道信息從加載的所述音頻文件中提取伴奏音；通過瀏覽器端的音頻采集接口獲取用戶的演唱音；通過瀏覽器端的音頻處理應(yīng)用程序接口將所述伴奏音和演唱音進(jìn)行混音處理，以生成混音文件，通過所述瀏覽器端的音頻輸出接口輸出。
2.根據(jù)權(quán)利要求1所述的方法，其特征在于，通過瀏覽器端的音頻處理應(yīng)用程序接口解析所述音頻文件的聲道信息，根據(jù)所述聲道信息從加載的所述音頻文件中提取伴奏音包括: 解析所述音頻文件的聲道信息，獲取所述音頻文件的左聲道音頻數(shù)據(jù)和右聲道音頻數(shù)據(jù)；如果左聲道音頻數(shù)據(jù)與右聲道音頻數(shù)據(jù)相同，則使用濾波算法對(duì)所述左聲道音頻數(shù)據(jù)或右聲道音頻數(shù)據(jù)進(jìn)行濾波，以提取伴奏音；如果左聲道音頻數(shù)據(jù)與右聲道音頻數(shù)據(jù)不同，則獲取左聲道音頻數(shù)據(jù)與右聲道音頻數(shù)據(jù)的差異值，且根據(jù)所述差異值提取伴奏音。
3.根據(jù)權(quán)利要求1所述的方法，其特征在于，在解析所述音頻文件的聲道信息，根據(jù)所述聲道信息從加載的所述音頻文件中提取伴奏音之前，還包括: 去除所述音頻文件的中頻頻率，以得到包括高頻和低頻的音頻數(shù)據(jù)作為立體聲補(bǔ)償后的音頻文件。
4.根據(jù)權(quán)利要求1所述的方法，其特征在于，在將所述伴奏音和演唱音進(jìn)行混音處理之前，還包括: 基于設(shè)定的音頻場(chǎng)景規(guī)則對(duì)所述演唱音進(jìn)行預(yù)處理。
5.根據(jù)權(quán)利要求1至4任一所述的方法，其特征在于，所述瀏覽器端的音頻處理應(yīng)用程序接口包括Web Audio接口。
6.一種音頻的混音裝置，其特征在于，包括: 音頻文件加載模塊，用于通過瀏覽器端的音頻處理應(yīng)用程序接口加載音頻文件，其中，所述瀏覽器端的音頻處理應(yīng)用程序接口是嵌入在頁(yè)面代碼中的用于音頻處理的應(yīng)用程序接口；伴奏音提取模塊，用于通過瀏覽器端的音頻處理應(yīng)用程序接口解析所述音頻文件的聲道信息，根據(jù)所述聲道信息從加載的所述音頻文件中提取伴奏音；演唱音獲取模塊，用于通過瀏覽器端的音頻采集接口獲取用戶的演唱音；混音處理模塊，用于通過瀏覽器端的音頻處理應(yīng)用程序接口將所述伴奏音和演唱音進(jìn)行混音處理，以生成混音文件，通過所述瀏覽器端的音頻輸出接口輸出。
7.根據(jù)權(quán)利要求6所述的裝置，其特征在于，所述伴奏音提取模塊包括: 聲道信息解析單元，用于解析所述音頻文件的聲道信息，獲取所述音頻文件的左聲道音頻數(shù)據(jù)和右聲道音頻數(shù)據(jù)；濾波單元，用于在左聲道音頻數(shù)據(jù)與右聲道音頻數(shù)據(jù)相同時(shí)，使用濾波算法對(duì)所述左聲道音頻數(shù)據(jù)或右聲道音頻數(shù)據(jù)進(jìn)行濾波，以提取伴奏音；差異提取單元，用于在左聲道音頻數(shù)據(jù)與右聲道音頻數(shù)據(jù)不同時(shí)，獲取左聲道音頻數(shù)據(jù)與右聲道音頻數(shù)據(jù)的差異值，且根據(jù)所述差異值提取伴奏音。
8.根據(jù)權(quán)利要求6所述的裝置，其特征在于，還包括: 立體聲補(bǔ)償模塊，用于在解析所述音頻文件的聲道信息，根據(jù)所述聲道信息從加載的所述音頻文件中提取伴奏音之前，去除所述音頻文件的中頻頻率，以得到包括高頻和低頻的音頻數(shù)據(jù)作為立體聲補(bǔ)償后的音頻文件。
9.根據(jù)權(quán)利要求6所述的裝置，其特征在于，還包括: 演唱音預(yù)處理模塊，用于在將所述伴奏音和演唱音進(jìn)行混音處理之前，基于設(shè)定的音頻場(chǎng)景規(guī)則對(duì)所述演唱音進(jìn)行預(yù)處理。
10.根據(jù)權(quán)利要求6至9任一所述的裝置，其特征在于，所述瀏覽器端的音頻處理應(yīng)用程序接口包括Web Audio接口。
【文檔編號(hào)】G10L19/00GK103903625SQ201410155853
【公開日】2014年7月2日申請(qǐng)日期:2014年4月17日優(yōu)先權(quán)日:2014年4月17日
【發(fā)明者】高潔璇申請(qǐng)人:百度在線網(wǎng)絡(luò)技術(shù)（北京）有限公司

完整全部詳細(xì)技術(shù)資料下載