国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      分析音頻文件的語音特征的方法和裝置的制造方法

      文檔序號(hào):8382008閱讀:459來源:國知局
      分析音頻文件的語音特征的方法和裝置的制造方法
      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及音頻分析和處理,更具體而言,涉及分析音頻文件的語音特征的方法和裝置。
      【背景技術(shù)】
      [0002]現(xiàn)有技術(shù)中已經(jīng)提出多種方法來分析各類應(yīng)用對(duì)象。例如,搜索引擎可以捕獲網(wǎng)站內(nèi)容,并通過提取關(guān)鍵詞等方式分析網(wǎng)站內(nèi)容,還可以根據(jù)關(guān)鍵詞或其他分析結(jié)果為網(wǎng)站打上標(biāo)簽。一些圖片處理工具可以對(duì)圖片進(jìn)行分析,例如比對(duì)兩個(gè)圖片的相似性,進(jìn)而進(jìn)行模糊匹配等。然而,對(duì)于音頻文件,特別是主要包含語音內(nèi)容的音頻文件,現(xiàn)有技術(shù)并沒有有效的方法對(duì)其進(jìn)行內(nèi)容和特征的分析。而另一方面,在許多情況下,希望獲得關(guān)于音頻文件的特征信息,從而可以對(duì)音頻文件進(jìn)行分類、匹配、推薦等進(jìn)一步操作。
      [0003]在一個(gè)典型例子中,外語學(xué)習(xí)者獲得了一些外語內(nèi)容的音頻文件,以期進(jìn)行聽力練習(xí)。然而,由于現(xiàn)有技術(shù)并沒有有效的音頻分析方法,學(xué)習(xí)者只能根據(jù)音頻文件的標(biāo)題、來源(來源于新聞播報(bào)、電影片段或是專用聽力材料)等信息來選擇音頻文件,并且只能在聽過該音頻文件之后才能判斷所選擇的音頻文件是否符合自己的聽力水平。這顯然浪費(fèi)了大量的時(shí)間和精力。
      [0004]在另一例子中,提供音頻文件的資料庫期望對(duì)音頻文件進(jìn)行分類或分級(jí),以便于進(jìn)行管理或向用戶推薦音頻文件。然而,在無法對(duì)音頻文件進(jìn)行有效分析的情況下,資料庫只能根據(jù)該音頻文件的文件大小、作者等屬性信息進(jìn)行分類,無法基于更加本質(zhì)的與音頻有關(guān)的特征進(jìn)行分類。
      [0005]因此,希望提出新的方案,能夠有效地對(duì)音頻文件的語音特征進(jìn)行分析。

      【發(fā)明內(nèi)容】

      [0006]考慮到現(xiàn)有技術(shù)中的不足,本發(fā)明提出一種方案,旨在對(duì)音頻文件的語音特征進(jìn)行分析。
      [0007]根據(jù)本發(fā)明的一個(gè)方面,提供了一種分析音頻文件的語音特征的方法,包括:采用多種聲學(xué)模型對(duì)所述音頻文件中的語音內(nèi)容進(jìn)行語音識(shí)別,以獲得多個(gè)識(shí)別結(jié)果;對(duì)比所述多個(gè)識(shí)別結(jié)果以獲得對(duì)比結(jié)果;基于對(duì)比結(jié)果確定所述音頻文件的語音聲學(xué)特征。
      [0008]根據(jù)本發(fā)明另一方面,提供了一種為用戶推薦音頻文件的方法,包括:確定用戶適合的語音特征;獲取多個(gè)音頻文件各自的語音特征,所述多個(gè)音頻文件各自的語音特征通過利用前述方面的方法對(duì)所述多個(gè)音頻文件進(jìn)行分析而確定;將語音特征與所述用戶適合的語音特征相匹配的音頻文件推薦給所述用戶。
      [0009]根據(jù)本發(fā)明另一方面,提供了一種用于分析音頻文件的語音特征的裝置,包括:語音識(shí)別單元,配置為采用多種聲學(xué)模型對(duì)所述音頻文件中的語音內(nèi)容進(jìn)行語音識(shí)別,以獲得多個(gè)識(shí)別結(jié)果;結(jié)果對(duì)比單元,配置為對(duì)比所述多個(gè)識(shí)別結(jié)果以獲得對(duì)比結(jié)果;聲學(xué)特征確定單元,配置為基于對(duì)比結(jié)果確定所述音頻文件的語音聲學(xué)特征。
      [0010]根據(jù)本發(fā)明又一方面,提供了一種為用戶推薦音頻文件的裝置,包括:用戶特征確定單元,配置為確定用戶適合的語音特征;文件特征獲取單元,配置為獲取多個(gè)音頻文件各自的語音特征,所述多個(gè)音頻文件各自的語音特征通過利用前述方面的裝置對(duì)所述多個(gè)音頻文件進(jìn)行分析而確定;匹配單元,配置為將語音特征與所述用戶適合的語音特征相匹配的音頻文件推薦給所述用戶。
      [0011]利用本發(fā)明實(shí)施例的方法和裝置,可以對(duì)音頻文件進(jìn)行語音分析,從而為用戶提供關(guān)于音頻文件中語音內(nèi)容特點(diǎn)的信息?;谶@樣的信息,還可以為用戶推薦適合用戶水平的音頻文件。
      【附圖說明】
      [0012]通過結(jié)合附圖對(duì)本公開示例性實(shí)施方式進(jìn)行更詳細(xì)的描述,本公開的上述以及其它目的、特征和優(yōu)勢(shì)將變得更加明顯,其中,在本公開示例性實(shí)施方式中,相同的參考標(biāo)號(hào)通常代表相同部件。
      [0013]圖1示出了適于用來實(shí)現(xiàn)本發(fā)明實(shí)施方式的示例性計(jì)算機(jī)系統(tǒng)/服務(wù)器12的框圖;
      [0014]圖2示出根據(jù)一個(gè)實(shí)施例的分析音頻文件的方法的流程圖;
      [0015]圖3A和3B不出根據(jù)本發(fā)明實(shí)施例的標(biāo)記首頻文件的例子;
      [0016]圖4示出根據(jù)一個(gè)實(shí)施例的推薦音頻文件的方法的流程圖;
      [0017]圖5示出根據(jù)本發(fā)明一個(gè)實(shí)施例的分析音頻文件的語音特征的裝置的示意框圖;以及
      [0018]圖6示出根據(jù)本發(fā)明一個(gè)實(shí)施例的推薦音頻文件的裝置的示意框圖。
      【具體實(shí)施方式】
      [0019]下面將參照附圖更詳細(xì)地描述本公開的優(yōu)選實(shí)施方式。雖然附圖中顯示了本公開的優(yōu)選實(shí)施方式,然而應(yīng)該理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施方式所限制。相反,提供這些實(shí)施方式是為了使本公開更加透徹和完整,并且能夠?qū)⒈竟_的范圍完整地傳達(dá)給本領(lǐng)域的技術(shù)人員。
      [0020]所屬技術(shù)領(lǐng)域的技術(shù)人員知道,本發(fā)明可以實(shí)現(xiàn)為系統(tǒng)、方法或計(jì)算機(jī)程序產(chǎn)品。因此,本公開可以具體實(shí)現(xiàn)為以下形式,即:可以是完全的硬件、也可以是完全的軟件(包括固件、駐留軟件、微代碼等),還可以是硬件和軟件結(jié)合的形式,本文一般稱為“電路”、“模塊”或“系統(tǒng)”。此外,在一些實(shí)施例中,本發(fā)明還可以實(shí)現(xiàn)為在一個(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)中的計(jì)算機(jī)程序產(chǎn)品的形式,該計(jì)算機(jī)可讀介質(zhì)中包含計(jì)算機(jī)可讀的程序代碼。
      [0021]可以采用一個(gè)或多個(gè)計(jì)算機(jī)可讀的介質(zhì)的任意組合。計(jì)算機(jī)可讀介質(zhì)可以是計(jì)算機(jī)可讀信號(hào)介質(zhì)或者計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)例如可以是一但不限于——電、磁、光、電磁、紅外線、或半導(dǎo)體的系統(tǒng)、裝置或器件,或者任意以上的組合。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的更具體的例子(非窮舉的列表)包括:具有一個(gè)或多個(gè)導(dǎo)線的電連接、便攜式計(jì)算機(jī)磁盤、硬盤、隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、可擦式可編程只讀存儲(chǔ)器(EPR0M或閃存)、光纖、便攜式緊湊磁盤只讀存儲(chǔ)器(CD-ROM)、光存儲(chǔ)器件、磁存儲(chǔ)器件、或者上述的任意合適的組合。在本文件中,計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是任何包含或存儲(chǔ)程序的有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。
      [0022]計(jì)算機(jī)可讀的信號(hào)介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號(hào),其中承載了計(jì)算機(jī)可讀的程序代碼。這種傳播的數(shù)據(jù)信號(hào)可以采用多種形式,包括——但不限于——電磁信號(hào)、光信號(hào)或上述的任意合適的組合。計(jì)算機(jī)可讀的信號(hào)介質(zhì)還可以是計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)以外的任何計(jì)算機(jī)可讀介質(zhì),該計(jì)算機(jī)可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。
      [0023]計(jì)算機(jī)可讀介質(zhì)上包含的程序代碼可以用任何適當(dāng)?shù)慕橘|(zhì)傳輸,包括一但不限于一無線、電線、光纜、RF等等,或者上述的任意合適的組合。
      [0024]可以以一種或多種程序設(shè)計(jì)語言或其組合來編寫用于執(zhí)行本發(fā)明操作的計(jì)算機(jī)程序代碼,所述程序設(shè)計(jì)語言包括面向?qū)ο蟮某绦蛟O(shè)計(jì)語言一諸如Java、Smalltalk、C++,還包括常規(guī)的過程式程序設(shè)計(jì)語言一諸如”C”語言或類似的程序設(shè)計(jì)語言。程序代碼可以完全地在用戶計(jì)算機(jī)上執(zhí)行、部分地在用戶計(jì)算機(jī)上執(zhí)行、作為一個(gè)獨(dú)立的軟件包執(zhí)行、部分在用戶計(jì)算機(jī)上部分在遠(yuǎn)程計(jì)算機(jī)上執(zhí)行、或者完全在遠(yuǎn)程計(jì)算機(jī)或服務(wù)器上執(zhí)行。在涉及遠(yuǎn)程計(jì)算機(jī)的情形中,遠(yuǎn)程計(jì)算機(jī)可以通過任意種類的網(wǎng)絡(luò)一包括局域網(wǎng)(LAN)或廣域網(wǎng)(WAN)—連接到用戶計(jì)算機(jī),或者,可以連接到外部計(jì)算機(jī)(例如利用因特網(wǎng)服務(wù)提供商來通過因特網(wǎng)連接)。
      [0025]下面將參照本發(fā)明實(shí)施例的方法、裝置(系統(tǒng))和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或框圖描述本發(fā)明。應(yīng)當(dāng)理解,流程圖和/或框圖的每個(gè)方框以及流程圖和/或框圖中各方框的組合,都可以由計(jì)算機(jī)程序指令實(shí)現(xiàn)。這些計(jì)算機(jī)程序指令可以提供給通用計(jì)算機(jī)、專用計(jì)算機(jī)或其它可編程數(shù)據(jù)處理裝置的處理器,從而生產(chǎn)出一種機(jī)器,這些計(jì)算機(jī)程序指令通過計(jì)算機(jī)或其它可編程數(shù)據(jù)處理裝置執(zhí)行,產(chǎn)生了實(shí)現(xiàn)流程圖和/或框圖中的方框中規(guī)定的功能/操作的裝置。
      [0026]也可以把這些計(jì)算機(jī)程序指令存儲(chǔ)在能使得計(jì)算機(jī)或其它可編程數(shù)據(jù)處理裝置以特定方式工作的計(jì)算機(jī)可讀介質(zhì)中,這樣,存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)中的指令就產(chǎn)生出一個(gè)包括實(shí)現(xiàn)流程圖和/或框圖中的方框中規(guī)定的功能/操作的指令裝置(instruct1nmeans)的制造品(manufacture)。
      當(dāng)前第1頁1 2 3 4 5 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1