国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種音頻測評方法及裝置制造方法

      文檔序號:2827670閱讀:224來源:國知局
      一種音頻測評方法及裝置制造方法
      【專利摘要】本發(fā)明實施例提供一種音頻測評方法及裝置,其中的方法可包括:獲取待測評的演唱單句在目標(biāo)音頻文件中的順序以及所述演唱單句的待測特征序列;根據(jù)所述演唱單句在所述目標(biāo)音頻文件中的順序,在源音頻文件中定位參考單句,并獲取所述參考單句的參考特征序列;對所述參考特征序列和所述待測特征序列進行相關(guān)運算,獲得相關(guān)系數(shù)序列;根據(jù)所述相關(guān)系數(shù)序列,確定所述演唱單句的測評分數(shù)。本發(fā)明能夠?qū)δ繕?biāo)音頻文件包含的演唱單句進行測評,滿足對音頻文件的應(yīng)用需求,提升音頻文件的應(yīng)用智能性。
      【專利說明】一種音頻測評方法及裝置

      【技術(shù)領(lǐng)域】
      [0001] 本發(fā)明涉及互聯(lián)網(wǎng)【技術(shù)領(lǐng)域】,具體涉及音頻處理【技術(shù)領(lǐng)域】,尤其涉及一種音頻測 評方法及裝置。

      【背景技術(shù)】
      [0002] 隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,互聯(lián)網(wǎng)音頻庫中收錄了大量的諸如歌曲、歌曲片段等音 頻文件,關(guān)于互聯(lián)網(wǎng)音頻的應(yīng)用也日漸增多,例如:KTV(Karaoke Television,卡拉0K)系 統(tǒng)、K歌系統(tǒng)等等。在應(yīng)用音頻文件的過程中,大部分用戶希望在音頻演繹過程中實時獲知 演繹水準(zhǔn),例如:用戶在演唱某歌曲時,希望獲得歌曲各句的測評分數(shù),以了解每句的演唱 情況,等等,因此,如何對諸如歌曲等音頻文件中的音頻單句進行測評成為一個亟待解決的 技術(shù)問題。


      【發(fā)明內(nèi)容】

      [0003] 本發(fā)明實施例提供一種音頻測評方法及裝置,能夠?qū)δ繕?biāo)音頻文件包含的演唱單 句進行測評,滿足對音頻文件的應(yīng)用需求,提升音頻文件的應(yīng)用智能性。
      [0004] 本發(fā)明實施例第一方面提供一種音頻測評方法,可包括:
      [0005] 獲取待測評的演唱單句在目標(biāo)音頻文件中的順序以及所述演唱單句的待測特征 序列;
      [0006] 根據(jù)所述演唱單句在所述目標(biāo)音頻文件中的順序,在源音頻文件中定位參考單 句,并獲取所述參考單句的參考特征序列;
      [0007] 對所述參考特征序列和所述待測特征序列進行相關(guān)運算,獲得相關(guān)系數(shù)序列;
      [0008] 根據(jù)所述相關(guān)系數(shù)序列,確定所述演唱單句的測評分數(shù)。
      [0009] 本發(fā)明實施例第二方面提供一種音頻測評裝置,可包括:
      [0010] 待測獲取模塊,用于獲取待測評的演唱單句在目標(biāo)音頻文件中的順序以及所述演 唱單句的待測特征序列;
      [0011] 參考獲取模塊,用于根據(jù)所述演唱單句在所述目標(biāo)音頻文件中的順序,在源音頻 文件中定位參考單句,并獲取所述參考單句的參考特征序列;
      [0012] 相關(guān)運算模塊,用于對所述參考特征序列和所述待測特征序列進行相關(guān)運算,獲 得相關(guān)系數(shù)序列;
      [0013] 測評模塊,用于根據(jù)所述相關(guān)系數(shù)序列,確定所述演唱單句的測評分數(shù)。
      [0014] 實施本發(fā)明實施例,具有如下有益效果:
      [0015] 本發(fā)明實施例中,可獲取目標(biāo)音頻文件中待測評的演唱單句的待測特征序列,以 及獲取源音頻文件中的參考單句的參考特征序列,通過對待測特征序列和參考特征序列的 相關(guān)運算獲得相關(guān)系數(shù)序列,基于該相關(guān)系數(shù)序列實現(xiàn)了對目標(biāo)首頻文件的演唱單句的測 評,既滿足了用戶對于音頻文件的應(yīng)用過程中的實際需求,又提升了音頻文件的應(yīng)用智能 性。

      【專利附圖】

      【附圖說明】
      [0016] 為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以 根據(jù)這些附圖獲得其他的附圖。
      [0017] 圖1為本發(fā)明實施例提供的一種音頻測評方法的流程圖;
      [0018] 圖2為圖1所示的步驟S103的一個實施例的流程圖;
      [0019] 圖3為圖1所示的步驟S104的一個實施例的流程圖;
      [0020] 圖4為圖1所示的步驟S104的另一個實施例的流程圖;
      [0021] 圖5為本發(fā)明實施例提供的一種音頻測評裝置的結(jié)構(gòu)示意圖;
      [0022] 圖6為圖5所不的相關(guān)運算|旲塊的實施例的結(jié)構(gòu)不意圖;
      [0023] 圖7為圖5所示的測評模塊的一個實施例的結(jié)構(gòu)示意圖;
      [0024] 圖8為圖5所示的測評模塊的另一個實施例的結(jié)構(gòu)示意圖。

      【具體實施方式】
      [0025] 下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完 整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于 本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他 實施例,都屬于本發(fā)明保護的范圍。
      [0026] 本發(fā)明實施例中,音頻文件可以包括但不限于:歌曲、歌曲片段等文件。源音頻文 件指可用于作為音頻測評的參考基準(zhǔn)的文件,例如:原唱歌曲,或者從原唱歌曲中截取的歌 曲片段等等;目標(biāo)音頻文件指需要進行音頻測評的文件,例如:用戶針對原唱歌曲重新演 唱的歌曲,或者從用戶重新演唱的歌曲中截取的歌曲片段等等。
      [0027] 本發(fā)明實施例中,一個音頻文件可由至少一個音頻單句順序排列而成,該至少一 個音頻單句的集合描述了音頻文件中需要進行演唱的部分。以歌曲A為例,歌曲A的描述 可表示如下:
      [0028] [661,860]aaaaaaaa
      [0029] [1541,320]bbbbbbbb
      [0030] [1871,245]cccccccc
      [0031] ......
      [0032] 上述歌曲A的描述中,諸如 一個音頻單句,各音頻單句之前的" □"用于描述對應(yīng)的音頻單句的時間屬性,其單位時間 通常為ms,例如:上述[661,860]用于描述音頻單句"aaaaaaaa"的時間屬性,其中的"661" 表示音頻單句"aaaaaaaa"的開始時間,"860"表示音頻單句"aaaaaaaa"的持續(xù)時間,假 設(shè)歌曲A共5分鐘,音頻單句"aaaaaaaa"則從第661ms開始演唱,持續(xù)860ms結(jié)束演唱。 按照開始時間的先后順序,可確定音頻文件包含的各音頻單句的順序,例如:根據(jù)上述歌 曲A的描述,音頻單句"aaaaaaaa"為第一個音頻單句,其在歌曲A中的順序為1 ;音頻單句 "bbbbbbbb"為第二個音頻單句,其在歌曲A中的順序為2 ;以此類推。可以理解的是,每個 音頻單句開始之前或結(jié)束之后還可包含無需進行演唱的部分,例如:上述歌曲A的0-661ms 時間段則為無需進行演唱的部分,該部分可包含前奏信息。
      [0033] 本發(fā)明實施例中,所述源音頻文件由至少一個音頻單句順序排列而成,該音頻單 句可稱為演唱單句。所述目標(biāo)音頻文件由至少一個音頻單句順序排列而成,該音頻單句可 稱為演唱單句。除特別說明外,本發(fā)明后續(xù)各實施例中,所述參考單句特指從所述源音頻文 件中定位的參考單句,所述演唱單句特指所述目標(biāo)音頻文件中待測評的演唱單句。
      [0034] 下面將結(jié)合圖1-圖4,對本發(fā)明實施例提供的音頻測評方法進行詳細介紹。
      [0035] 請參見圖1,為本發(fā)明實施例提供的一種音頻測評方法的流程圖;該方法可包括 以下步驟S101-步驟S104。
      [0036] S101,獲取待測評的演唱單句在目標(biāo)音頻文件中的順序以及所述演唱單句的待測 特征序列。
      [0037] 音符又叫note,指用于記錄不同長短的音的進行的符號,可包括全音符、二分音 符、四分音符、八分音符等等種類。一個音頻單句可以表示為多個音頻幀組成的一個幀序 列,每個音頻幀均攜帶音符,各個音符按照各個音頻幀在該音頻單句中的時間先后順序構(gòu) 成該音頻單句的旋律。音高又叫Pitch,指音的高度。一個音頻單句可以表示為多個音頻幀 組成的一個幀序列,每個音頻幀均攜帶音高,各個音高按照各個音頻幀在該音頻單句中的 時間先后順序構(gòu)成該音頻單句的旋律。綜上,音頻單句的音符序列或音高序列均可反映該 音頻單句的旋律特征。
      [0038] 本發(fā)明實施例中,優(yōu)選地,待測評的演唱單句可以為當(dāng)前演唱單句,此時音頻測評 過程即可為實時音頻測評過程。其中,當(dāng)前演唱單句指所述目標(biāo)音頻文件中當(dāng)前正在播 放的時間所對應(yīng)的演唱單句。目標(biāo)音頻文件為歌曲A,以上述歌曲A的描述為例:假設(shè)歌 曲A共5分鐘,當(dāng)前正在播放的時間為1895ms,根據(jù)歌曲A的描述,1895ms屬于音頻單句 "CCCCCCCC"的時間屬性所描述的時間段內(nèi),由此可確定音頻單句"CCCCCCCC"為當(dāng)前演唱單 句,進一步,可確定音頻單句"CCCCCCCC"為待測評的演唱單句,所述待測評的演唱單句在目 標(biāo)音頻文件中的順序為3。
      [0039] 本步驟中,可獲取該待測評的演唱單句的待測特征序列,所述待測特征序列為所 述待測評的演唱單句的音符序列或音高序列。優(yōu)選地,在所述待測評的演唱單句演唱結(jié)束 后,獲取該待測評的演唱單句的待測特征序列。
      [0040] S102,根據(jù)所述演唱單句在所述目標(biāo)音頻文件中的順序,在源音頻文件中定位參 考單句,并獲取所述參考單句的參考特征序列。
      [0041] 所述源音頻文件可以由至少一個參考單句順序排列而成。本步驟中,所定位的參 考單句在所述源音頻文件中的順序與所述待測評的演唱單句在所述目標(biāo)音頻文件中的順 序相同。按照本實施例的上述例子,若以歌曲A為目標(biāo)音頻文件,則歌曲A在出版發(fā)行時的 原唱歌曲B為源音頻文件,所述待測評的演唱單句的順序為3,則歌曲B所定位的參考單句 的順序也為3,即從歌曲B中選取第3個參考單句作為所述待測評的演唱單句的測評基準(zhǔn)。 [0042] 在本發(fā)明實施例的一種可行的實施方式中,所述待測特征序列為所述演唱單句的 音符序列,所述參考特征序列為所述參考單句的音符序列。在本發(fā)明實施例的另一種可行 的實施方式中,所述待測特征序列為所述演唱單句的音高序列,所參考特征序列為所述參 考單句的首1?序列。
      [0043] S103,對所述參考特征序列和所述待測特征序列進行相關(guān)運算,獲得相關(guān)系數(shù)序 列。
      [0044] 由于所述參考特征序列可用于表征源音頻文件中所定位的參考單句的旋律特征, 所述待測特征序列可用于表征目標(biāo)音頻文件中待測評的演唱單句的旋律特征,本步驟可對 所述參考特征序列和所述待測特征序列之間的相關(guān)運算,獲得相關(guān)系數(shù)序列。
      [0045] S104,根據(jù)所述相關(guān)系數(shù)序列,確定所述演唱單句的測評分數(shù)。
      [0046] 本步驟中,所述待測評的演唱單句的測評分數(shù)越高,表明所述待測評的演唱單句 的演唱效果越好,其越接近所定位的參考單句的演唱效果。反之,所述待測評的演唱單句的 測評分數(shù)越低,表明所述待測評的演唱單句的演唱效果越差,其越偏離所定位的參考單句 的演唱效果。
      [0047] 本發(fā)明實施例中,可獲取目標(biāo)音頻文件中待測評的演唱單句的待測特征序列,以 及獲取源音頻文件中的參考單句的參考特征序列,通過對待測特征序列和參考特征序列的 相關(guān)運算獲得相關(guān)系數(shù)序列,基于該相關(guān)系數(shù)序列實現(xiàn)了對目標(biāo)首頻文件的演唱單句的測 評,既滿足了用戶對于音頻文件的應(yīng)用過程中的實際需求,又提升了音頻文件的應(yīng)用智能 性。
      [0048] 下面將結(jié)合附圖2-附圖4,對附圖1所示的音頻測評方法中的各步驟進行詳細介 紹。需要說明的是,后續(xù)圖2-圖4所示實施例中,設(shè)定所定位的參考單句包括N個音頻幀, 所述參考特征序列可表示為P(i);其中,i為整數(shù),且〇彡i彡N-1。具體地,若所述參考 特征序列為所述參考單句的音符序列,則P(〇)表示所定位的參考單句中的第一個音頻幀 的音符,P(l)表示所定位的參考單句中的第二個音頻幀的音符,以此類推,P(N-l)表示所 定位的參考單句中的第N個音頻幀的音符。若所述待測特征序列為所述演唱單句的音高序 列,則P(〇)表示所定位的參考單句中的第一個音頻巾貞的音高,P(l)表示所定位的參考單句 中的第二個音頻幀的音符,以此類推,P(N-l)表示所定位的參考單句中的第N個音頻幀的 音符。
      [0049] 設(shè)定待測評的演唱單句包括N個音頻幀,所述待測特征序列可表示為s (i),其中, i為整數(shù),且0彡i彡N-ι。具體地,若所述待測特征序列為所述演唱單句的音符序列,則 s(〇)表示所述待測評的演唱單句中的第一個音頻幀的音符,s(l)表示所述待測評的演唱 單句中的第二個音頻幀的音符,以此類推,s(N-l)表示所述待測評的演唱單句中的第N個 音頻幀的音符。若所述待測特征序列為所述演唱單句的音高序列,則s(0)表示所述待測評 的演唱單句中的第一個音頻幀的音高,s(l)表示所述待測評的演唱單句中的第二個音頻幀 的音高,以此類推,s(N-l)表示所述待測評的演唱單句中的第N個音頻幀的音高。
      [0050] 請參見圖2,為圖1所示的步驟S103的一個實施例的流程圖;該步驟S103可包括 以下步驟slOOl-步驟sl004。
      [0051] S1001,分別計算所述參考特征序列的均值及所述待測特征序列的均值。
      [0052] 本步驟中,可采用下述公式(1)分別計算所述參考特征序列p(i)的均值以及所述 待測特征序列s(i)的均值,該公式(1)如下:
      [0053] MP = mean (p (i))
      [0054] MS = mean (s (i)) (1)
      [0055] 上述公式⑴中,MP表示所述參考特征序列p (i)的均值,MS表示所述參考特征序 列P(i)的均值,mean()為求均值操作。
      [0056] S1002,采用所述參考特征序列的均值,對所述參考特征序列進行規(guī)整處理,采用 所述待測特征序列的均值,對所述待測特征序列進行規(guī)整處理。
      [0057] 規(guī)整處理的目的在于:將所述參考特征序列和所述待測特征序列調(diào)整至同一基 準(zhǔn),以消除所述參考特征序列與所述待測特征序列由于均值求取標(biāo)準(zhǔn)不一致所帶來的計算 偏差影響。
      [0058] 本步驟中,可采用公式(2)對所述參考特征序列進行規(guī)整處理,該公式(2)可表示 如下:
      [0059] p2 (i) = p (i) -MP (2)
      [0060] 上述公式(2)中,p2 (i)表示規(guī)整處理后得到的參考特征序列。
      [0061] 本步驟中,可采用公式(3)對所述待測特征序列進行規(guī)整處理,該公式(3)可表示 如下:
      [0062] s2 (i) = s (i) -MS (3)
      [0063] 上述公式(3)中,s2(i)表示規(guī)整處理后得到的待測特征序列。
      [0064] S1003,采用預(yù)設(shè)削波閾值,將規(guī)整處理后的所述參考特征序列轉(zhuǎn)換為參考數(shù)值序 列,將規(guī)整處理后的所述待測特征序列轉(zhuǎn)換為待測數(shù)值序列。
      [0065] 其中,所述預(yù)設(shè)削波閾值可根據(jù)實際需要進行設(shè)定,優(yōu)選地,所述削波閾值可采用 公式(4)進行設(shè)定,該公式(4)可表示如下:
      [0066] Th_xue = max (max (abs (p2 (i)), max (abs (s2 (i))) (4)
      [0067] 上述公式⑷中,Th_xue表示所述預(yù)設(shè)的削波閾值,max()為最大值求取操作, abs ()為絕對值求取操作。
      [0068] 本步驟中,可采用公式(5)將規(guī)整處理后的所述參考特征序列轉(zhuǎn)換為參考數(shù)值序 列,該公式(5)可表示如下:
      [0069]

      【權(quán)利要求】
      1. 一種音頻測評方法,其特征在于,包括: 獲取待測評的演唱單句在目標(biāo)音頻文件中的順序以及所述演唱單句的待測特征序 列; 根據(jù)所述演唱單句在所述目標(biāo)音頻文件中的順序,在源音頻文件中定位參考單句,并 獲取所述參考單句的參考特征序列; 對所述參考特征序列和所述待測特征序列進行相關(guān)運算,獲得相關(guān)系數(shù)序列; 根據(jù)所述相關(guān)系數(shù)序列,確定所述演唱單句的測評分數(shù)。
      2. 如權(quán)利要求1所述的方法,其特征在于,所述待測特征序列為所述演唱單句的音符 序列,所述參考特征序列為所述參考單句的音符序列;或者, 所述待測特征序列為所述演唱單句的音高序列,所參考特征序列為所述參考單句的音 1?序列。
      3. 如權(quán)利要求1所述的方法,其特征在于,所述對所述參考特征序列和所述待測特征 序列進行相關(guān)運算,獲得相關(guān)系數(shù)序列,包括: 分別計算所述參考特征序列的均值及所述待測特征序列的均值; 采用所述參考特征序列的均值,對所述參考特征序列進行規(guī)整處理,采用所述待測特 征序列的均值,對所述待測特征序列進行規(guī)整處理; 采用預(yù)設(shè)削波閾值,將規(guī)整處理后的所述參考特征序列轉(zhuǎn)換為參考數(shù)值序列,將規(guī)整 處理后的所述待測特征序列轉(zhuǎn)換為待測數(shù)值序列; 采用互相關(guān)函數(shù)對所述參考數(shù)值序列和所述待測數(shù)值序列進行相關(guān)運算,獲得相關(guān)系 數(shù)序列。
      4. 如權(quán)利要求1-3任一項所述的方法,其特征在于,所述根據(jù)所述相關(guān)系數(shù)序列,確定 所述演唱單句的測評分數(shù),包括: 計算所述相關(guān)系數(shù)序列的最大值; 將所述相關(guān)系數(shù)序列的最大值,確定為所述演唱單句的測評分數(shù)。
      5. 如權(quán)利要求1-3任一項所述的方法,其特征在于,所述根據(jù)所述相關(guān)系數(shù)序列,確定 所述演唱單句的測評分數(shù),包括: 計算所述相關(guān)系數(shù)序列的最大值; 將所述相關(guān)系數(shù)序列的最大值映射至預(yù)設(shè)分數(shù)區(qū)間,獲得所述相關(guān)系數(shù)序列的最大值 的映射值; 將所述映射值確定為所述演唱單句的測評分數(shù)。
      6. -種音頻測評裝置,其特征在于,包括: 待測獲取模塊,用于獲取待測評的演唱單句在目標(biāo)音頻文件中的順序以及所述演唱單 句的待測特征序列; 參考獲取模塊,用于根據(jù)所述演唱單句在所述目標(biāo)音頻文件中的順序,在源音頻文件 中定位參考單句,并獲取所述參考單句的參考特征序列; 相關(guān)運算模塊,用于對所述參考特征序列和所述待測特征序列進行相關(guān)運算,獲得相 關(guān)系數(shù)序列; 測評模塊,用于根據(jù)所述相關(guān)系數(shù)序列,確定所述演唱單句的測評分數(shù)。
      7. 如權(quán)利要求6所述的裝置,其特征在于,所述待測特征序列為所述演唱單句的音符 序列,所述參考特征序列為所述參考單句的音符序列;或者, 所述待測特征序列為所述演唱單句的音高序列,所參考特征序列為所述參考單句的音 1?序列。
      8. 如權(quán)利要求6所述的裝置,其特征在于,所述相關(guān)運算模塊包括: 均值計算單元,用于分別計算所述參考特征序列的均值及所述待測特征序列的均值; 規(guī)整處理單元,用于采用所述參考特征序列的均值,對所述參考特征序列進行規(guī)整處 理,采用所述待測特征序列的均值,對所述待測特征序列進行規(guī)整處理; 序列轉(zhuǎn)換單元,用于采用預(yù)設(shè)削波閾值,將規(guī)整處理后的所述參考特征序列轉(zhuǎn)換為參 考數(shù)值序列,將規(guī)整處理后的所述待測特征序列轉(zhuǎn)換為待測數(shù)值序列; 相關(guān)運算單元,用于采用互相關(guān)函數(shù)對所述參考數(shù)值序列和所述待測數(shù)值序列進行相 關(guān)運算,獲得相關(guān)系數(shù)序列。
      9. 如權(quán)利要求6-8任一項所述的裝置,其特征在于,所述測評模塊包括: 第一計算單元,用于計算所述相關(guān)系數(shù)序列的最大值; 第一測評單元,用于將所述相關(guān)系數(shù)序列的最大值,確定為所述演唱單句的測評分數(shù)。
      10. 如權(quán)利要求6-8任一項所述的裝置,其特征在于,所述測評模塊包括: 第二計算單元,用于計算所述相關(guān)系數(shù)序列的最大值; 映射單元,用于將所述相關(guān)系數(shù)序列的最大值映射至預(yù)設(shè)分數(shù)區(qū)間,獲得所述相關(guān)系 數(shù)序列的最大值的映射值; 第二測評單元,用于將所述映射值確定為所述演唱單句的測評分數(shù)。
      【文檔編號】G10L25/69GK104157296SQ201410362595
      【公開日】2014年11月19日 申請日期:2014年7月28日 優(yōu)先權(quán)日:2014年7月28日
      【發(fā)明者】趙偉峰 申請人:騰訊科技(深圳)有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1