語音數(shù)據(jù)的處理方法和裝置的制造方法

文檔序號：10536380閱讀：235來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

語音數(shù)據(jù)的處理方法和裝置的制造方法
【專利摘要】本發(fā)明實施例提供一種語音數(shù)據(jù)的處理方法和裝置。所述處理方法包括：獲取待處理的語音數(shù)據(jù)；從所述待處理的語音數(shù)據(jù)中提取相應(yīng)的聲學(xué)特征信息；根據(jù)所述聲學(xué)特征信息查找預(yù)先存儲的基準(zhǔn)聲學(xué)特征曲譜表，獲取所述待處理的語音數(shù)據(jù)對應(yīng)的曲譜。采用本發(fā)明實施例，可以快速獲取語音數(shù)據(jù)的曲譜，增強曲譜的傳播性，提高用戶體驗。
【專利說明】
語音數(shù)據(jù)的處理方法和裝置
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及計算機技術(shù)，尤其涉及一種語音數(shù)據(jù)的處理方法和裝置。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)的普及和音頻視頻技術(shù)的提升，人們的日常娛樂生活越來越豐富，例如可以到KTV唱歌，或者通過視頻直播的方式為在線用戶唱歌等。
[0003]音樂會讓人賞心悅目，可以陶冶人的情操，因此很多人喜歡音樂。音樂中并不單單包括歌詞還包括曲譜，曲譜是準(zhǔn)確記錄音樂的載體，它是記錄音樂音高或者節(jié)奏的各種書面符號的有規(guī)律的組合。曲譜是音樂的重要組成部分。
[0004]然而，沒有學(xué)過音樂的人只知道歌詞，而并不知道曲譜，而且也無法識別曲譜，并且用戶頭腦里偶爾閃過的新奇音樂想法也很快會被遺忘，這樣，人們只能通過錄音設(shè)備將自己的幾句音調(diào)錄下來，而這種方式的傳播性并不強，用戶體驗也較差。

【發(fā)明內(nèi)容】

[0005]本發(fā)明的目的在于，提供一種對語音數(shù)據(jù)進行譜曲的方法以及實現(xiàn)該方法的裝置，基于從待處理的語音數(shù)據(jù)中獲取的聲學(xué)特征信息，獲取待處理的語音數(shù)據(jù)對應(yīng)的曲譜，從而可以快速獲取語音數(shù)據(jù)的曲譜，增強曲譜的傳播性，提高用戶體驗。
[0006]根據(jù)本發(fā)明的一方面，提供一種語音數(shù)據(jù)的處理方法。所述處理方法包括，獲取待處理的語音數(shù)據(jù);從所述待處理的語音數(shù)據(jù)中獲取相應(yīng)的聲學(xué)特征信息;根據(jù)所述聲學(xué)特征信息查找預(yù)先存儲的基準(zhǔn)聲學(xué)特征曲譜表，獲取所述待處理的語音數(shù)據(jù)對應(yīng)的曲譜。
[0007]優(yōu)選地，所述根據(jù)所述聲學(xué)特征信息查找預(yù)先存儲的基準(zhǔn)聲學(xué)特征曲譜表，獲取所述待處理的語音數(shù)據(jù)對應(yīng)的曲譜的處理包括:根據(jù)所述聲學(xué)特征信息查找所述預(yù)先存儲的基準(zhǔn)聲學(xué)特征曲譜表中所在的基準(zhǔn)聲學(xué)特征信息范圍值;將查找到的基準(zhǔn)聲學(xué)特征信息范圍值對應(yīng)的曲譜作為所述待處理的語音數(shù)據(jù)對應(yīng)的曲譜。
[0008]優(yōu)選地，所述處理方法還包括:輸出所述待處理的語音數(shù)據(jù)和獲取的曲譜。
[0009]優(yōu)選地，所述從所述待處理的語音數(shù)據(jù)中獲取相應(yīng)的聲學(xué)特征信息的處理包括:根據(jù)所述待處理的語音數(shù)據(jù)的采樣時間，將所述待處理的語音數(shù)據(jù)分割成多個預(yù)設(shè)時長的數(shù)據(jù)段，從任一數(shù)據(jù)段中獲取相應(yīng)的聲學(xué)特征信息。
[0010]優(yōu)選地，所述基準(zhǔn)聲學(xué)特征曲譜表中包括音階、音調(diào)、半音階、半音調(diào)和/或長音。
[0011]根據(jù)本發(fā)明的另一方面，提供一種語音數(shù)據(jù)的處理裝置。所述處理裝置包括:語音數(shù)據(jù)獲取模塊，用于獲取待處理的語音數(shù)據(jù);聲學(xué)特征獲取模塊，用于從所述語音數(shù)據(jù)獲取模塊獲取的待處理的語音數(shù)據(jù)中獲取相應(yīng)的聲學(xué)特征信息；曲譜獲取模塊，用于根據(jù)所述聲學(xué)特征獲取模塊獲取的聲學(xué)特征信息查找預(yù)先存儲的基準(zhǔn)聲學(xué)特征曲譜表，獲取所述待處理的語音數(shù)據(jù)對應(yīng)的曲譜。
[0012]優(yōu)選地，所述曲譜獲取模塊包括:信息查找單元，用于根據(jù)所述聲學(xué)特征獲取模塊獲取的聲學(xué)特征信息查找所述預(yù)先存儲的基準(zhǔn)聲學(xué)特征曲譜表中所在的基準(zhǔn)聲學(xué)特征信息范圍值；曲譜獲取單元，用于將所述信息查找單元查找到的基準(zhǔn)聲學(xué)特征信息范圍值對應(yīng)的曲譜作為所述待處理的語音數(shù)據(jù)對應(yīng)的曲譜。
[0013]優(yōu)選地，所述處理裝置還包括:曲譜輸出模塊，用于輸出所述待處理的語音數(shù)據(jù)和獲取的曲譜。
[0014]優(yōu)選地，所述聲學(xué)特征獲取模塊用于:根據(jù)所述語音數(shù)據(jù)獲取模塊獲取的待處理的語音數(shù)據(jù)的采樣時間，將所述待處理的語音數(shù)據(jù)分割成多個預(yù)設(shè)時長的數(shù)據(jù)段，從任一數(shù)據(jù)段中提取相應(yīng)的聲學(xué)特征信息。
[0015]優(yōu)選地，所述基準(zhǔn)聲學(xué)特征曲譜表中包括音階、音調(diào)、半音階、半音調(diào)和/或長音。
[0016]根據(jù)本發(fā)明實施例提供的語音數(shù)據(jù)的處理方法和裝置，通過從獲取的待處理的語音數(shù)據(jù)中獲取相應(yīng)的聲學(xué)特征信息，并根據(jù)所述聲學(xué)特征信息查找預(yù)先存儲的基準(zhǔn)聲學(xué)特征曲譜表，獲取所述待處理的語音數(shù)據(jù)對應(yīng)的曲譜，從而可以快速獲取語音數(shù)據(jù)的曲譜，增強曲譜的傳播性，提高用戶體驗。
【附圖說明】
[0017]圖1是示出根據(jù)本發(fā)明實施例一的語音數(shù)據(jù)的處理方法的流程圖；
[0018]圖2是示出語音數(shù)據(jù)處理的應(yīng)用程序的首頁的顯示界面的示例性示意圖；
[0019]圖3是示出根據(jù)本發(fā)明實施例二的語音數(shù)據(jù)的處理方法的流程圖；
[0020]圖4是示出包含曲譜的語音數(shù)據(jù)處理的應(yīng)用程序的首頁的顯示界面的示例性示意圖；
[0021]圖5是示出根據(jù)本發(fā)明實施例三的語音數(shù)據(jù)的處理裝置的一種邏輯框圖；
[0022]圖6是示出根據(jù)本發(fā)明實施例三的語音數(shù)據(jù)的處理裝置的另一種邏輯框圖；
[0023]圖7是示出根據(jù)本發(fā)明實施例三的語音數(shù)據(jù)的處理裝置的又一種邏輯框圖。
【具體實施方式】
[0024]本方案的發(fā)明構(gòu)思是，提供一種對語音數(shù)據(jù)進行譜曲的技術(shù)方案，該技術(shù)方案可應(yīng)用于錄音棚、在線視頻直播等語音數(shù)據(jù)處理場景中，通過從獲取的待處理的語音數(shù)據(jù)中獲取相應(yīng)的聲學(xué)特征信息，并根據(jù)所述聲學(xué)特征信息查找預(yù)先存儲的基準(zhǔn)聲學(xué)特征曲譜表，獲取所述待處理的語音數(shù)據(jù)對應(yīng)的曲譜，從而可以快速獲取語音數(shù)據(jù)的曲譜，增強曲譜的傳播性，提高用戶體驗。
[0025]下面結(jié)合附圖詳細描述本發(fā)明的示例性實施例。
[0026]實施例一
[0027]圖1是示出根據(jù)本發(fā)明實施例一的語音數(shù)據(jù)的處理方法的流程圖。通過包括如圖5所示的處理裝置的計算機系統(tǒng)執(zhí)行所述處理方法。
[0028]參照圖1，在步驟S110，獲取待處理的語音數(shù)據(jù)。
[0029]終端設(shè)備中可安裝有語音數(shù)據(jù)處理的應(yīng)用程序，當(dāng)用戶需要對自己或其他用戶演唱的歌曲或曲調(diào)進行譜曲時，可點擊該應(yīng)用程序的快捷方式圖標(biāo)，終端設(shè)備啟動該應(yīng)用程序，并顯示該應(yīng)用程序的首頁，如圖2所示，該首頁中可包括話筒圖標(biāo)、語音輸入框、輸出框和幫助圖標(biāo)等，其中，話筒圖標(biāo)可包括激活狀態(tài)和未激活狀態(tài)，例如，當(dāng)用戶點擊該話筒圖標(biāo)時，終端設(shè)備啟動話筒，并通過話筒采集用戶輸入的語音數(shù)據(jù)，此時，話筒圖標(biāo)處于激活狀態(tài);如果用戶在預(yù)定時長內(nèi)未輸入語音數(shù)據(jù)，則終端設(shè)備可關(guān)閉話筒，此時，話筒圖標(biāo)處于未激活狀態(tài);語音輸入框可用于顯示用戶輸入的語音數(shù)據(jù)的圖標(biāo)，或該語音數(shù)據(jù)的文本等，以便用戶確定終端設(shè)備采集的語音數(shù)據(jù)是否準(zhǔn)確;輸出框可用于輸出對該語音數(shù)據(jù)處理后得到的數(shù)據(jù)等。終端設(shè)備顯示該應(yīng)用程序的首頁后，可啟動話筒，此時，話筒圖標(biāo)處于激活狀態(tài)，然后，用戶可將終端設(shè)備的話筒朝向演唱歌曲或曲調(diào)的用戶，終端設(shè)備可通過話筒采集用戶輸入的語音數(shù)據(jù)(即待處理的語音數(shù)據(jù))。該首頁中還可包括確定按鍵，當(dāng)用戶輸入完成后可點擊確定按鍵，終端設(shè)備獲取話筒采集的待處理的語音數(shù)據(jù)，或者，可以預(yù)先設(shè)置接收時長閾值，當(dāng)用戶停止輸入后的時長達到接收時長閾值時，可以將用戶停止輸入之前輸入的語音數(shù)據(jù)確定為待處理的語音數(shù)據(jù)。
[0030]需要說明的是，如果用戶的聲音過小，終端設(shè)備無法接收到語音數(shù)據(jù)，則終端設(shè)備可發(fā)出語音數(shù)據(jù)接收失敗的提示信號，以提示用戶重新輸入。
[0031 ]在步驟S120，從所述待處理的語音數(shù)據(jù)中獲取相應(yīng)的聲學(xué)特征信息。
[0032]具體地，終端設(shè)備可以對待處理的語音數(shù)據(jù)進行預(yù)處理，例如，對該語音數(shù)據(jù)進行如采樣(采樣頻率可以為1KHz或16KHz等)、反混疊濾波、去除聲門激勵和噪聲影響等處理，然后，可以對處理后的語音數(shù)據(jù)進行特征提取，其中，特征提取的作用是從語音數(shù)據(jù)的波形中提取一組或多組能夠描述語音數(shù)據(jù)中聲學(xué)屬性特征的參數(shù)，如平均能量、過零數(shù)、共振峰、倒譜、線性預(yù)測系數(shù)等，以便進行后續(xù)的語音訓(xùn)練和聲學(xué)特征信息的獲取，而且該參數(shù)的選擇直接關(guān)系著語音數(shù)據(jù)中聲學(xué)特征信息的準(zhǔn)確率的高低。通過對該語音數(shù)據(jù)的上述參數(shù)的分析，可得到該語音數(shù)據(jù)的聲學(xué)特征信息，如音調(diào)信息、音色信息、響度信息和/或音階信息等。
[0033]在步驟S130，根據(jù)所述聲學(xué)特征信息查找預(yù)先存儲的基準(zhǔn)聲學(xué)特征曲譜表，獲取所述待處理的語音數(shù)據(jù)對應(yīng)的曲譜。
[0034]具體地，終端設(shè)備中可以預(yù)先存儲有基準(zhǔn)聲學(xué)特征曲譜表，該基準(zhǔn)聲學(xué)特征曲譜表中可包括多個基準(zhǔn)聲學(xué)特征信息，該基準(zhǔn)聲學(xué)特征曲譜表可以是通過對上述處理得到的語音數(shù)據(jù)進行大量訓(xùn)練得到的，也可以是由通用的標(biāo)準(zhǔn)聲學(xué)特征信息構(gòu)成。終端設(shè)備可以將基準(zhǔn)聲學(xué)特征曲譜表中的每一個基準(zhǔn)聲學(xué)特征信息與該聲學(xué)特征信息進行對比，并計算得到該聲學(xué)特征信息與每個基準(zhǔn)聲學(xué)特征信息的匹配度，可將匹配度最高的第一基準(zhǔn)聲學(xué)特征信息確定為該語音數(shù)據(jù)對應(yīng)的聲學(xué)特征信息，終端設(shè)備可對得到的第一基準(zhǔn)聲學(xué)特征信息進行分析，并基于第一基準(zhǔn)聲學(xué)特征信息中的音調(diào)信息、音色信息、響度信息和/或音階信息等信息設(shè)置相應(yīng)的曲譜，從而得到該語音數(shù)據(jù)對應(yīng)的曲譜。
[0035]本發(fā)明實施例提供的語音數(shù)據(jù)的處理方法，通過從獲取的待處理的語音數(shù)據(jù)中獲取相應(yīng)的聲學(xué)特征信息，并根據(jù)所述聲學(xué)特征信息查找預(yù)先存儲的基準(zhǔn)聲學(xué)特征曲譜表，獲取所述待處理的語音數(shù)據(jù)對應(yīng)的曲譜，從而可以快速獲取語音數(shù)據(jù)的曲譜，增強曲譜的傳播性，提高用戶體驗。
[0036]實施例二
[0037]圖3是示出根據(jù)本發(fā)明實施例二的語音數(shù)據(jù)的處理方法的流程圖，所述實施例可視為圖1的又一種具體的實現(xiàn)方案。
[0038]參照圖3，在步驟S310，獲取待處理的語音數(shù)據(jù)。
[0039]其中，上述步驟S310的步驟內(nèi)容與上述實施例一中的步驟SllO的步驟內(nèi)容相同，在此不再贅述。
[0040]在步驟S320，根據(jù)所述待處理的語音數(shù)據(jù)的采樣時間，將所述待處理的語音數(shù)據(jù)分割成多個預(yù)設(shè)時長的數(shù)據(jù)段，從任一數(shù)據(jù)段中獲取相應(yīng)的聲學(xué)特征信息。
[0041]具體地，由于語音數(shù)據(jù)對應(yīng)的語音信號通?？煽醋鳛槎虝r平穩(wěn)的信號，例如可以認為在該語音數(shù)據(jù)的相鄰采樣時間之間(如10-20ms)的語音信號為短時平穩(wěn)的信號，其頻譜特性和某些物理特征參量可近似地看作是不變的，這樣就可以采用平穩(wěn)過程的分析處理方法，對待處理的語音數(shù)據(jù)進行處理，具體可以為:可將待處理的語音數(shù)據(jù)根據(jù)采樣時間分隔成多個預(yù)設(shè)時長(如10-20ms)的數(shù)據(jù)段，可以對每一個數(shù)據(jù)段進行端點檢測，其中，端點檢測就是指從包含語音的一段數(shù)據(jù)中確定出語音的起始點和結(jié)束點。然后，可以對每一個數(shù)據(jù)段進行特征提取，從每一個數(shù)據(jù)段中提取一組或多組能夠描述相應(yīng)數(shù)據(jù)段中聲學(xué)屬性特征的參數(shù)，通過對每一個數(shù)據(jù)段的上述參數(shù)的分析，可得到每一個數(shù)據(jù)段的聲學(xué)特征信息。
[0042]在步驟S330，根據(jù)所述聲學(xué)特征信息查找所述預(yù)先存儲的基準(zhǔn)聲學(xué)特征曲譜表中所在的基準(zhǔn)聲學(xué)特征信息范圍值。
[0043]其中，所述基準(zhǔn)聲學(xué)特征曲譜表中包括音階、音調(diào)、半音階、半音調(diào)和/或長音。
[0044]具體地，終端設(shè)備中可以預(yù)先存儲有基準(zhǔn)聲學(xué)特征曲譜表，該基準(zhǔn)聲學(xué)特征曲譜表中可包括音階、音調(diào)、半音階、半音調(diào)和/或長音等多個基準(zhǔn)聲學(xué)特征信息，可根據(jù)預(yù)定的劃分標(biāo)準(zhǔn)分別為音階、音調(diào)、半音階、半音調(diào)和/或長音等劃分不同的識別范圍，并設(shè)置相應(yīng)的范圍值，該基準(zhǔn)聲學(xué)特征曲譜表可以是通過對語音數(shù)據(jù)進行大量訓(xùn)練而得到，也可以使用通用的標(biāo)準(zhǔn)聲學(xué)特征信息組成?？筛鶕?jù)預(yù)定標(biāo)準(zhǔn)為每一個數(shù)據(jù)段的聲學(xué)特征信息設(shè)置特征值，針對該語音數(shù)據(jù)中的某一個數(shù)據(jù)段的聲學(xué)特征信息，終端設(shè)備可以將基準(zhǔn)聲學(xué)特征曲譜表中的每一個基準(zhǔn)聲學(xué)特征信息與該數(shù)據(jù)段的聲學(xué)特征信息進行對比，在基準(zhǔn)聲學(xué)特征曲譜表中查找到該數(shù)據(jù)段的聲學(xué)特征信息的特征值所在的基準(zhǔn)聲學(xué)特征信息范圍值。通過上述方式可以對該語音數(shù)據(jù)中的其他數(shù)據(jù)段執(zhí)行上述處理，分別基準(zhǔn)聲學(xué)特征曲譜表中查找到每個數(shù)據(jù)段的聲學(xué)特征信息的特征值所在的基準(zhǔn)聲學(xué)特征信息范圍值。
[0045]在步驟S340，將查找到的基準(zhǔn)聲學(xué)特征信息范圍值對應(yīng)的曲譜作為所述待處理的語音數(shù)據(jù)對應(yīng)的曲譜。
[0046]具體地，并計算得到該數(shù)據(jù)段的聲學(xué)特征信息與每個基準(zhǔn)聲學(xué)特征信息的匹配度，可將匹配度最高的第一基準(zhǔn)聲學(xué)特征信息確定為該數(shù)據(jù)段對應(yīng)的聲學(xué)特征信息，終端設(shè)備可對查找到的每個基準(zhǔn)聲學(xué)特征信息范圍值對應(yīng)的基準(zhǔn)聲學(xué)特征信息進行分析，并基于相應(yīng)的基準(zhǔn)聲學(xué)特征信息中的音階、音調(diào)、半音階、半音調(diào)和/或長音等信息設(shè)置相應(yīng)的曲譜，從而得到相應(yīng)數(shù)據(jù)段對應(yīng)的曲譜，通過上述方式可以對該語音數(shù)據(jù)中的其他數(shù)據(jù)段執(zhí)行上述處理，分別得到每個數(shù)據(jù)段對應(yīng)的曲譜，然后，可根據(jù)每個數(shù)據(jù)段對應(yīng)的開始點和結(jié)束點確定數(shù)據(jù)段在該語音數(shù)據(jù)中的位置，可按照各數(shù)據(jù)段的位置對相應(yīng)的曲譜進行排序，得到該語音數(shù)據(jù)對應(yīng)的曲譜。
[0047]另外，對語音數(shù)據(jù)進行譜曲的處理除可通過上述方式外，還可以通過其它多種方式實現(xiàn)，例如，可以通過語音譜曲模型，對語音數(shù)據(jù)進行譜曲，在對語音數(shù)據(jù)進行譜曲之前，可以對上述語音譜曲模型進行訓(xùn)練，技術(shù)人員可以通過多種途徑獲取多種語音數(shù)據(jù)，例如，技術(shù)人員在開發(fā)語音譜曲機制之前，可以從多種渠道(如向用戶購買等)獲取語音數(shù)據(jù)，然后，使用得到的語音數(shù)據(jù)對語音譜曲模型進行訓(xùn)練，具體的，可以設(shè)置有多個語音譜曲模型的參數(shù)，在獲取到語音數(shù)據(jù)后，提取語音數(shù)據(jù)中的相關(guān)參數(shù)，并根據(jù)該相關(guān)參數(shù)得到語音數(shù)據(jù)的聲學(xué)特征信息，然后，可以對每一幀語音數(shù)據(jù)進行狀態(tài)標(biāo)注，具體地，可以設(shè)置神經(jīng)網(wǎng)絡(luò)模型，可以將語音數(shù)據(jù)劃分成三層，則可以使用上下文的聲學(xué)特征的神經(jīng)網(wǎng)絡(luò)模型，在該語音數(shù)據(jù)中提取出頭層、中間層和尾層的聲學(xué)特征信息，可以將三層的聲學(xué)特征信息作為一個樣本特征空間，并基于該樣本特征空間得到其對應(yīng)的聲學(xué)特征信息，可以將中間層對應(yīng)的聲學(xué)特征信息作為一個標(biāo)記?？梢允褂萌斯ど窠?jīng)網(wǎng)絡(luò)拓撲結(jié)構(gòu)作為語音識別模型的核心，在人工神經(jīng)網(wǎng)絡(luò)拓撲結(jié)構(gòu)中可以包括三層，如輸入層、隱含層和輸出層，首先，可以對人工神經(jīng)網(wǎng)絡(luò)進行初始化，此時，其中的每兩個神經(jīng)元直接的網(wǎng)絡(luò)連接權(quán)重被初始化為一個很小的隨機數(shù)(例如-1.0?1.0)，同時每個神經(jīng)元有一個偏置，被初始化為一個隨機數(shù)，根據(jù)輸入的語音數(shù)據(jù)的網(wǎng)絡(luò)輸入層，通過計算得到每個神經(jīng)元的輸出，其中每個神經(jīng)元的計算方法相同，可以是由其輸入的線性組合得到，最終在輸出層得到實際輸出，即對應(yīng)的曲譜，可以通過與預(yù)期輸出結(jié)果比較得到每個輸出單元的誤差，得到的誤差需要從輸出層向輸入層傳播，前面一層單元的誤差可以通過和它連接的后面一層的所有單元的誤差計算所得，同時可以對網(wǎng)絡(luò)權(quán)重和神經(jīng)元偏置進行調(diào)整。對于每個語音數(shù)據(jù)，如果最終的輸出誤差小于預(yù)設(shè)的可以接受的范圍或者預(yù)設(shè)的迭代次數(shù)閾值，則對下一個語音數(shù)據(jù)繼續(xù)進行上述處理，這樣，進行不斷訓(xùn)練，得到語音譜曲模型。終端設(shè)備獲取到待處理的語音數(shù)據(jù)后，可以將該語音數(shù)據(jù)輸入到上述語音識別模型中進行語音譜曲，得到語音譜曲結(jié)果。
[0048]在步驟S350，輸出所述待處理的語音數(shù)據(jù)和獲取的曲譜。
[0049]具體地，如圖4所示，終端設(shè)備可在該語音數(shù)據(jù)處理的應(yīng)用程序的首頁中的輸出框的預(yù)設(shè)位置顯示待處理的語音數(shù)據(jù)的文本和獲取的曲譜，圖4中“XXXX”表示語音數(shù)據(jù)的文本，“a a a...”表示曲譜。
[0050]需要說明的是，待處理的語音數(shù)據(jù)的文本和獲取的曲譜可以對應(yīng)顯示，如文本中的第一個字符對應(yīng)曲譜中的第一個曲符，文本中的第二個字符對應(yīng)曲譜中的第二個和第三個曲符等。
[0051]另外，該語音數(shù)據(jù)處理的應(yīng)用程序的首頁中還可包括播放曲譜的按鍵，當(dāng)用戶需要收聽該曲譜時，可點擊該按鍵，終端設(shè)備播放該曲譜。為了提高用戶體驗，在播放曲譜時，還可以播放用戶輸入的待處理的語音數(shù)據(jù)，這樣，用戶可通過終端設(shè)備的播放，了解語音數(shù)據(jù)和曲譜之間的匹配程度。
[0052]本發(fā)明實施例提供的語音數(shù)據(jù)的處理方法，一方面，通過從獲取的待處理的語音數(shù)據(jù)分割成多個預(yù)設(shè)時長的數(shù)據(jù)段，從任一數(shù)據(jù)段中獲取相應(yīng)的聲學(xué)特征信息，并根據(jù)所述聲學(xué)特征信息查找預(yù)先存儲的基準(zhǔn)聲學(xué)特征曲譜表，獲取所述待處理的語音數(shù)據(jù)對應(yīng)的曲譜，從而可快速獲取語音數(shù)據(jù)的曲譜，增強曲譜的傳播性，提高用戶體驗;另一方面，通過將待處理的語音數(shù)據(jù)和獲取的曲譜輸出顯示，并可通過播放該曲譜，使得用戶可以了解語音數(shù)據(jù)和曲譜之間的匹配程度，提高用戶體驗。
[0053]實施例三
[0054]基于相同的技術(shù)構(gòu)思，圖5是示出根據(jù)本發(fā)明實施例三的語音數(shù)據(jù)的處理裝置的邏輯框圖。參照圖5，所述處理裝置包括語音數(shù)據(jù)獲取模塊510、聲學(xué)特征獲取模塊520和曲譜獲取模塊530，其中，語音數(shù)據(jù)獲取模塊510與聲學(xué)特征獲取模塊520相連接，聲學(xué)特征獲取模塊520與曲譜獲取模塊530相連接。
[0055]語音數(shù)據(jù)獲取模塊510用于獲取待處理的語音數(shù)據(jù)。
[0056]聲學(xué)特征獲取模塊520用于從語音數(shù)據(jù)獲取模塊510獲取的待處理的語音數(shù)據(jù)中獲取相應(yīng)的聲學(xué)特征信息。
[0057]曲譜獲取模塊530用于根據(jù)聲學(xué)特征獲取模塊520獲取的聲學(xué)特征信息查找預(yù)先存儲的基準(zhǔn)聲學(xué)特征曲譜表，獲取所述待處理的語音數(shù)據(jù)對應(yīng)的曲譜。
[0058]本發(fā)明實施例提供的語音數(shù)據(jù)的處理裝置，通過從獲取的待處理的語音數(shù)據(jù)中獲取相應(yīng)的聲學(xué)特征信息，并根據(jù)所述聲學(xué)特征信息查找預(yù)先存儲的基準(zhǔn)聲學(xué)特征曲譜表，獲取所述待處理的語音數(shù)據(jù)對應(yīng)的曲譜，從而可快速獲取語音數(shù)據(jù)的曲譜，增強曲譜的傳播性，提尚用戶體驗。
[0059]進一步地，在圖5所示實施例的基礎(chǔ)上，如圖6所示的曲譜獲取模塊530包括:信息查找單元531，用于根據(jù)聲學(xué)特征獲取模塊520獲取的聲學(xué)特征信息查找所述預(yù)先存儲的基準(zhǔn)聲學(xué)特征曲譜表中所在的基準(zhǔn)聲學(xué)特征信息范圍值；曲譜獲取單元532，用于將信息查找單元531查找到的基準(zhǔn)聲學(xué)特征信息范圍值對應(yīng)的曲譜作為所述待處理的語音數(shù)據(jù)對應(yīng)的曲■!並
_ I曰O
[0060]進一步地，在圖6所示實施例的基礎(chǔ)上，如圖7所示的處理裝置還包括:曲譜輸出模塊540，用于輸出所述待處理的語音數(shù)據(jù)和獲取的曲譜。
[0061 ]優(yōu)選地，聲學(xué)特征獲取模塊520用于根據(jù)語音數(shù)據(jù)獲取模塊510獲取的待處理的語音數(shù)據(jù)的采樣時間，將所述待處理的語音數(shù)據(jù)分割成多個預(yù)設(shè)時長的數(shù)據(jù)段，從任一數(shù)據(jù)段中提取相應(yīng)的聲學(xué)特征信息。
[0062]優(yōu)選地，所述基準(zhǔn)聲學(xué)特征曲譜表中包括音階、音調(diào)、半音階、半音調(diào)和/或長音。
[0063]進一步地，本發(fā)明實施例提供的語音數(shù)據(jù)的處理裝置，一方面，通過從獲取的待處理的語音數(shù)據(jù)分割成多個預(yù)設(shè)時長的數(shù)據(jù)段，從任一數(shù)據(jù)段中獲取相應(yīng)的聲學(xué)特征信息，并根據(jù)所述聲學(xué)特征信息查找預(yù)先存儲的基準(zhǔn)聲學(xué)特征曲譜表，獲取所述待處理的語音數(shù)據(jù)對應(yīng)的曲譜，從而可快速獲取語音數(shù)據(jù)的曲譜，增強曲譜的傳播性，提高用戶體驗；另一方面，通過將待處理的語音數(shù)據(jù)和獲取的曲譜輸出顯示，并可通過播放該曲譜，使得用戶可以了解語音數(shù)據(jù)和曲譜之間的匹配程度，提高用戶體驗。
[0064]需要指出，根據(jù)實施的需要，可將本申請中描述的各個步驟/部件拆分為更多步驟/部件，也可將兩個或多個步驟/部件或者步驟/部件的部分操作組合成新的步驟/部件，以實現(xiàn)本發(fā)明的目的。
[0065]上述根據(jù)本發(fā)明的方法可在硬件、固件中實現(xiàn)，或者被實現(xiàn)為可存儲在記錄介質(zhì)(諸如CD R0M、RAM、軟盤、硬盤或磁光盤)中的軟件或計算機代碼，或者被實現(xiàn)通過網(wǎng)絡(luò)下載的原始存儲在遠程記錄介質(zhì)或非暫時機器可讀介質(zhì)中并將被存儲在本地記錄介質(zhì)中的計算機代碼，從而在此描述的方法可被存儲在使用通用計算機、專用處理器或者可編程或?qū)Ｓ糜布?諸如ASIC或FPGA)的記錄介質(zhì)上的這樣的軟件處理?？梢岳斫?，計算機、處理器、微處理器控制器或可編程硬件包括可存儲或接收軟件或計算機代碼的存儲組件(例如，RAM、ROM、閃存等)，當(dāng)所述軟件或計算機代碼被計算機、處理器或硬件訪問且執(zhí)行時，實現(xiàn)在此描述的處理方法。此外，當(dāng)通用計算機訪問用于實現(xiàn)在此示出的處理的代碼時，代碼的執(zhí)行將通用計算機轉(zhuǎn)換為用于執(zhí)行在此示出的處理的專用計算機。
[0066]以上所述，僅為本發(fā)明的【具體實施方式】，但本發(fā)明的保護范圍并不局限于此，任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi)，可輕易想到變化或替換，都應(yīng)涵蓋在本發(fā)明的保護范圍之內(nèi)。因此，本發(fā)明的保護范圍應(yīng)以所述權(quán)利要求的保護范圍為準(zhǔn)。
【主權(quán)項】
1.一種語音數(shù)據(jù)的處理方法，其特征在于，所述處理方法包括: 獲取待處理的語音數(shù)據(jù)；從所述待處理的語音數(shù)據(jù)中獲取相應(yīng)的聲學(xué)特征信息；根據(jù)所述聲學(xué)特征信息查找預(yù)先存儲的基準(zhǔn)聲學(xué)特征曲譜表，獲取所述待處理的語音數(shù)據(jù)對應(yīng)的曲譜。2.根據(jù)權(quán)利要求1所述的處理方法，其特征在于，所述根據(jù)所述聲學(xué)特征信息查找預(yù)先存儲的基準(zhǔn)聲學(xué)特征曲譜表，獲取所述待處理的語音數(shù)據(jù)對應(yīng)的曲譜的處理包括: 根據(jù)所述聲學(xué)特征信息查找所述預(yù)先存儲的基準(zhǔn)聲學(xué)特征曲譜表中所在的基準(zhǔn)聲學(xué)特征信息范圍值；將查找到的基準(zhǔn)聲學(xué)特征信息范圍值對應(yīng)的曲譜作為所述待處理的語音數(shù)據(jù)對應(yīng)的曲■!並_ I曰。3.根據(jù)權(quán)利要求2所述的處理方法，其特征在于，所述處理方法還包括: 輸出所述待處理的語音數(shù)據(jù)和獲取的曲譜。4.根據(jù)權(quán)利要求1所述的處理方法，其特征在于，所述從所述待處理的語音數(shù)據(jù)中獲取相應(yīng)的聲學(xué)特征信息的處理包括: 根據(jù)所述待處理的語音數(shù)據(jù)的采樣時間，將所述待處理的語音數(shù)據(jù)分割成多個預(yù)設(shè)時長的數(shù)據(jù)段，從任一數(shù)據(jù)段中獲取相應(yīng)的聲學(xué)特征信息。5.根據(jù)權(quán)利要求1所述的處理方法，其特征在于，所述基準(zhǔn)聲學(xué)特征曲譜表中包括音階、音調(diào)、半音階、半音調(diào)和/或長音。6.一種語音數(shù)據(jù)的處理裝置，其特征在于，所述處理裝置包括: 語音數(shù)據(jù)獲取模塊，用于獲取待處理的語音數(shù)據(jù)；聲學(xué)特征獲取模塊，用于從所述語音數(shù)據(jù)獲取模塊獲取的待處理的語音數(shù)據(jù)中獲取相應(yīng)的聲學(xué)特征信息；曲譜獲取模塊，用于根據(jù)所述聲學(xué)特征獲取模塊獲取的聲學(xué)特征信息查找預(yù)先存儲的基準(zhǔn)聲學(xué)特征曲譜表，獲取所述待處理的語音數(shù)據(jù)對應(yīng)的曲譜。7.根據(jù)權(quán)利要求6所述的處理裝置，其特征在于，所述曲譜獲取模塊包括: 信息查找單元，用于根據(jù)所述聲學(xué)特征獲取模塊獲取的聲學(xué)特征信息查找所述預(yù)先存儲的基準(zhǔn)聲學(xué)特征曲譜表中所在的基準(zhǔn)聲學(xué)特征信息范圍值；曲譜獲取單元，用于將所述信息查找單元查找到的基準(zhǔn)聲學(xué)特征信息范圍值對應(yīng)的曲譜作為所述待處理的語音數(shù)據(jù)對應(yīng)的曲譜。8.根據(jù)權(quán)利要求7所述的處理裝置，其特征在于，所述處理裝置還包括: 曲譜輸出模塊，用于輸出所述待處理的語音數(shù)據(jù)和獲取的曲譜。9.根據(jù)權(quán)利要求6所述的處理裝置，其特征在于，所述聲學(xué)特征獲取模塊用于: 根據(jù)所述語音數(shù)據(jù)獲取模塊獲取的待處理的語音數(shù)據(jù)的采樣時間，將所述待處理的語音數(shù)據(jù)分割成多個預(yù)設(shè)時長的數(shù)據(jù)段，從任一數(shù)據(jù)段中提取相應(yīng)的聲學(xué)特征信息。10.根據(jù)權(quán)利要求6所述的處理裝置，其特征在于，所述基準(zhǔn)聲學(xué)特征曲譜表中包括音階、音調(diào)、半音階、半音調(diào)和/或長音。
【文檔編號】G10L15/02GK105895079SQ201510926346
【公開日】2016年8月24日
【申請日】2015年12月14日
【發(fā)明人】劉方宇
【申請人】樂視網(wǎng)信息技術(shù)（北京）股份有限公司

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：劉方宇;
技術(shù)所有人：樂視網(wǎng)信息技術(shù)（北京）股份有限公司;
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

語音數(shù)據(jù)處理相關(guān)技術(shù)

數(shù)據(jù)處理方法相關(guān)技術(shù)

數(shù)據(jù)預(yù)處理方法相關(guān)技術(shù)

正交實驗數(shù)據(jù)處理方法相關(guān)技術(shù)

大數(shù)據(jù)處理方法相關(guān)技術(shù)

數(shù)據(jù)無量綱化處理方法相關(guān)技術(shù)

數(shù)據(jù)歸一化處理方法相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

語音數(shù)據(jù)的處理方法和裝置的制造方法