国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種音頻批量分割方法及裝置與流程

      文檔序號(hào):11097829閱讀:830來(lái)源:國(guó)知局
      一種音頻批量分割方法及裝置與制造工藝

      本發(fā)明屬于計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種音頻批量分割方法及裝置。



      背景技術(shù):

      目前根據(jù)錄音文本的內(nèi)容錄制對(duì)應(yīng)的音頻后,需要進(jìn)行后期音頻處理,將錄音文本的內(nèi)容分割成多個(gè)對(duì)應(yīng)的小音頻段,現(xiàn)有的音頻分割方法是:把音頻導(dǎo)入Audition音頻處理軟件中,通過(guò)人工一邊看錄音文本,一邊聽錄音后的音頻,同時(shí)將每小段加上標(biāo)識(shí),之后導(dǎo)出標(biāo)記有標(biāo)識(shí)的小音頻段,從而完成音頻拆分,該方法依賴人工進(jìn)行分割,需要花費(fèi)大量的時(shí)間,從而增加人力成本,另外,通過(guò)人工去邊看錄音文本邊標(biāo)記,需要一直集中注意力,否則出錯(cuò)率很高,后期還需要人工進(jìn)行校正,保證正確率,效率極低。



      技術(shù)實(shí)現(xiàn)要素:

      本發(fā)明的目的在于提供一種音頻批量分割方法及裝置,旨在解決現(xiàn)有技術(shù)中需要依賴人工對(duì)音頻進(jìn)行分割,導(dǎo)致人力成本過(guò)高、分割效率較低以及出錯(cuò)率較高的問(wèn)題。

      一方面,本發(fā)明提供了一種音頻批量分割方法,所述方法包括下述步驟:

      獲取錄音文本以及錄音后的音頻,將所述音頻進(jìn)行語(yǔ)音識(shí)別,得到對(duì)應(yīng)的待匹配文本;

      將所述待匹配文本與所述錄音文本進(jìn)行匹配;

      根據(jù)預(yù)設(shè)匹配度,從所述音頻中分割出對(duì)應(yīng)的小音頻段。

      另一方面,本發(fā)明提供了一種音頻批量分割裝置,所述裝置包括:

      待匹配文本識(shí)別單元,用于獲取錄音文本以及錄音后的音頻,將所述音頻進(jìn)行語(yǔ)音識(shí)別,得到對(duì)應(yīng)的待匹配文本;

      文本匹配單元,用于將所述待匹配文本與所述錄音文本進(jìn)行匹配;以及

      小音頻分割單元,用于根據(jù)預(yù)設(shè)匹配度,從所述音頻中分割出對(duì)應(yīng)的小音頻段。

      在本發(fā)明實(shí)施例中,將錄音后的音頻通過(guò)語(yǔ)音識(shí)別得到待匹配文本,將待匹配文本與錄音文本進(jìn)行匹配后,從音頻中分割出對(duì)應(yīng)的小音頻段,通過(guò)語(yǔ)音識(shí)別與文本匹配,實(shí)現(xiàn)將錄音的音頻,按錄音文本的要求,直接批量分割成多個(gè)小音頻段,無(wú)需逐個(gè)一一加標(biāo)識(shí)再導(dǎo)出分割小音頻段,從而提高拆分效率,節(jié)約人力成本以及降低出錯(cuò)率。

      附圖說(shuō)明

      圖1是本發(fā)明實(shí)施例一提供的音頻批量分割方法的實(shí)現(xiàn)流程圖;以及

      圖2是本發(fā)明實(shí)施例二提供的音頻批量分割裝置的結(jié)構(gòu)示意圖。

      具體實(shí)施方式

      為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。

      以下結(jié)合具體實(shí)施例對(duì)本發(fā)明的具體實(shí)現(xiàn)進(jìn)行詳細(xì)描述:

      實(shí)施例一:

      圖1示出了本發(fā)明實(shí)施例一提供的音頻批量分割方法的實(shí)現(xiàn)流程圖,為了便于說(shuō)明,僅示出了與本發(fā)明實(shí)施例相關(guān)的部分,詳述如下:

      在步驟S101中,獲取錄音文本以及錄音后的音頻,將音頻進(jìn)行語(yǔ)音識(shí)別,得到對(duì)應(yīng)的待匹配文本。

      在本發(fā)明實(shí)施例中,根據(jù)已有的錄音文本進(jìn)行錄音,得到錄音后的音頻,錄音之后需要對(duì)該音頻進(jìn)行處理,通過(guò)語(yǔ)音識(shí)別技術(shù)得到識(shí)別后的待匹配文本,該待匹配文本是對(duì)應(yīng)該音頻識(shí)別出的文本數(shù)據(jù)。

      進(jìn)一步地,根據(jù)說(shuō)話的時(shí)間間隔,將音頻分割為臨時(shí)音頻段;

      將臨時(shí)音頻段進(jìn)行語(yǔ)音識(shí)別,得到對(duì)應(yīng)的待匹配文本。

      具體地,為了降低數(shù)據(jù)處理量,可以通過(guò)預(yù)處理將音頻根據(jù)說(shuō)話的時(shí)間間隔進(jìn)行臨時(shí)分割,得到臨時(shí)音頻段,然后對(duì)該臨時(shí)音頻段進(jìn)行語(yǔ)音識(shí)別,得到對(duì)應(yīng)的待匹配文本。

      在步驟S102中,將待匹配文本與錄音文本進(jìn)行匹配。

      在本發(fā)明實(shí)施例中,通過(guò)對(duì)音頻進(jìn)行語(yǔ)音識(shí)別得到待匹配文本,將待匹配文本與錄音文本進(jìn)行匹配。

      進(jìn)一步地,獲取待匹配文本的字符串;

      將待匹配文本的字符串與錄音文本的字符串進(jìn)行逐字符匹配。

      具體地,獲取待匹配文本的字符串,通過(guò)將待匹配文本的字符串與錄音文本的字符串進(jìn)行逐字符匹配,有效地保證了匹配的精確度,同時(shí)提高匹配效率。

      在步驟S103中,根據(jù)預(yù)設(shè)匹配度,從音頻中分割出對(duì)應(yīng)的小音頻段。

      在本發(fā)明實(shí)施例中,將待匹配文本與錄音文本進(jìn)行匹配,根據(jù)預(yù)設(shè)匹配度,從音頻中分割出對(duì)應(yīng)的小音頻段,該小音頻段包括對(duì)應(yīng)字、詞、短語(yǔ)和\或句子的音頻。

      進(jìn)一步地,當(dāng)待匹配文本與錄音文本的匹配度大于預(yù)設(shè)匹配度時(shí),從音頻中分割出對(duì)應(yīng)的小音頻段。

      具體地,當(dāng)待匹配文本與錄音文本的匹配度為全完匹配時(shí),從音頻中分割出對(duì)應(yīng)的小音頻段,還可以通過(guò)預(yù)設(shè)匹配度,將大于預(yù)設(shè)匹配度的待匹配文本所對(duì)應(yīng)的音頻中分割出對(duì)應(yīng)的小音頻段。根據(jù)實(shí)際經(jīng)驗(yàn),可以將預(yù)設(shè)匹配度設(shè)定為60%-80%。

      又進(jìn)一步地,當(dāng)待匹配文本與錄音文本的匹配度小于預(yù)設(shè)匹配度時(shí),從錄音文本中提取出未匹配到的文本。

      具體地,將待匹配文本與錄音文本進(jìn)行匹配,當(dāng)待匹配文本與錄音文本的匹配度小于預(yù)設(shè)匹配度時(shí),從錄音文本中提取出未匹配到的文本,以便于后期再次對(duì)該未匹配到的文本,進(jìn)一步進(jìn)行處理。

      在本發(fā)明實(shí)施例中,將錄音后的音頻通過(guò)語(yǔ)音識(shí)別得到待匹配文本,將待匹配文本與錄音文本進(jìn)行匹配后,從音頻中分割出對(duì)應(yīng)的小音頻段,通過(guò)語(yǔ)音識(shí)別與文本匹配,實(shí)現(xiàn)將錄音的音頻,按錄音文本的要求,直接批量分割成多個(gè)小音頻段,無(wú)需逐個(gè)一一加標(biāo)識(shí)再導(dǎo)出分割小音頻段,從而提高拆分效率,節(jié)約人力成本以及降低出錯(cuò)率。

      本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分步驟是可以通過(guò)程序來(lái)指令相關(guān)的硬件來(lái)完成,所述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,所述的存儲(chǔ)介質(zhì),如ROM/RAM、磁盤、光盤等。

      實(shí)施例二:

      圖2示出了本發(fā)明實(shí)施例二提供的音頻批量分割裝置的結(jié)構(gòu)示意圖,為了便于說(shuō)明,僅示出了與本發(fā)明實(shí)施例相關(guān)的部分。在本發(fā)明實(shí)施例中,音頻批量分割裝置包括:待匹配文本識(shí)別單元21、文本匹配單元22以及小音頻分割單元23,其中:

      待匹配文本識(shí)別單元21,用于獲取錄音文本以及錄音后的音頻,將音頻進(jìn)行語(yǔ)音識(shí)別,得到對(duì)應(yīng)的待匹配文本。

      在本發(fā)明實(shí)施例中,根據(jù)已有的錄音文本進(jìn)行錄音,得到錄音后的音頻,錄音之后需要對(duì)該音頻進(jìn)行處理,通過(guò)語(yǔ)音識(shí)別技術(shù)得到識(shí)別后的待匹配文本,該待匹配文本是對(duì)應(yīng)該音頻識(shí)別出的文本數(shù)據(jù)。

      進(jìn)一步地,該待匹配文本識(shí)別單元21包括:臨時(shí)分割單元211以及待匹配文本識(shí)別子單元212,其中:

      臨時(shí)分割單元211,用于根據(jù)說(shuō)話的時(shí)間間隔,將音頻分割為臨時(shí)音頻段;以及

      待匹配文本識(shí)別子單元212,用于將臨時(shí)音頻段進(jìn)行語(yǔ)音識(shí)別,得到對(duì)應(yīng)的待匹配文本。

      具體地,為了降低數(shù)據(jù)處理量,可以通過(guò)預(yù)處理將音頻根據(jù)說(shuō)話的時(shí)間間隔進(jìn)行臨時(shí)分割,得到臨時(shí)音頻段,然后對(duì)該臨時(shí)音頻段進(jìn)行語(yǔ)音識(shí)別,得到對(duì)應(yīng)的待匹配文本。

      文本匹配單元22,用于將待匹配文本與錄音文本進(jìn)行匹配。

      在本發(fā)明實(shí)施例中,通過(guò)對(duì)音頻進(jìn)行語(yǔ)音識(shí)別得到待匹配文本,將待匹配文本與錄音文本進(jìn)行匹配。

      進(jìn)一步地,該文本匹配單元22包括:字符串單元221以及文本匹配子單元222,其中:

      字符串單元221,用于獲取待匹配文本的字符串;以及

      文本匹配子單元222,用于將待匹配文本的字符串與錄音文本的字符串進(jìn)行逐字符匹配。

      具體地,獲取待匹配文本的字符串,通過(guò)將待匹配文本的字符串與錄音文本的字符串進(jìn)行逐字符匹配,有效地保證了匹配的精確度,同時(shí)提高匹配效率。

      小音頻分割單元23,用于根據(jù)預(yù)設(shè)匹配度,從音頻中分割出對(duì)應(yīng)的小音頻段。

      在本發(fā)明實(shí)施例中,將待匹配文本與錄音文本進(jìn)行匹配,根據(jù)預(yù)設(shè)匹配度,從音頻中分割出對(duì)應(yīng)的小音頻段,該小音頻段包括對(duì)應(yīng)字、詞、短語(yǔ)和\或句子的音頻。

      進(jìn)一步地,該小音頻分割單元23,包括:

      分割子單元231,用于當(dāng)待匹配文本與錄音文本的匹配度大于預(yù)設(shè)匹配度時(shí),從音頻中分割出對(duì)應(yīng)的小音頻段,該小音頻段包括對(duì)應(yīng)字、詞、短語(yǔ)和\或句子的音頻。

      具體地,當(dāng)待匹配文本與錄音文本的匹配度為全完匹配時(shí),從音頻中分割出對(duì)應(yīng)的小音頻段,還可以通過(guò)預(yù)設(shè)匹配度,將大于預(yù)設(shè)匹配度的待匹配文本所對(duì)應(yīng)的音頻中分割出對(duì)應(yīng)的小音頻段。根據(jù)實(shí)際經(jīng)驗(yàn),可以將預(yù)設(shè)匹配度設(shè)定為60%-80%。

      又進(jìn)一步地,該小音頻分割單元23,還包括:

      提取單元232,用于當(dāng)待匹配文本與錄音文本的匹配度小于預(yù)設(shè)匹配度時(shí),從錄音文本中提取出未匹配到的文本。

      具體地,將待匹配文本與錄音文本進(jìn)行匹配,當(dāng)待匹配文本與錄音文本的匹配度小于預(yù)設(shè)匹配度時(shí),從錄音文本中提取出未匹配到的文本,以便于后期再次對(duì)該未匹配到的文本,進(jìn)一步進(jìn)行處理。

      在本發(fā)明實(shí)施例中,將錄音后的音頻通過(guò)語(yǔ)音識(shí)別得到待匹配文本,將待匹配文本與錄音文本進(jìn)行匹配后,從音頻中分割出對(duì)應(yīng)的小音頻段,通過(guò)語(yǔ)音識(shí)別與文本匹配,實(shí)現(xiàn)將錄音的音頻,按錄音文本的要求,直接批量分割成多個(gè)小音頻段,無(wú)需逐個(gè)一一加標(biāo)識(shí)再導(dǎo)出分割小音頻段,從而提高拆分效率,節(jié)約人力成本以及降低出錯(cuò)率。

      在本發(fā)明實(shí)施例中,音頻批量分割裝置的各單元可由相應(yīng)的硬件或軟件單元實(shí)現(xiàn),各單元可以為獨(dú)立的軟、硬件單元,也可以集成為一個(gè)軟、硬件單元,在此不用以限制本發(fā)明。該裝置各單元的實(shí)施方式具體可參考前述實(shí)施例一的描述,在此不再贅述。

      以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。

      當(dāng)前第1頁(yè)1 2 3 
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1