国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于語音通信的錄音方法以及錄音系統(tǒng)、通信終端的制作方法

      文檔序號:2835977閱讀:251來源:國知局
      專利名稱:基于語音通信的錄音方法以及錄音系統(tǒng)、通信終端的制作方法
      技術領域
      本發(fā)明涉及語音通信技術領域,特別涉及基于語音通信的錄音方法以及錄音系統(tǒng)、通信終端。
      背景技術
      基于語音通信的錄音系統(tǒng)是一種能同時進行多路電話實時錄音及語音播放的設備,是計算機技術與語音技術的結合。由于采用了先進的數(shù)碼錄音技術,配以功能強大、可靠的軟件,并借助大容量計算機硬盤作為存儲介質,完全突破了傳統(tǒng)的電話錄音概念。通過該錄音系統(tǒng)可實現(xiàn)自動記錄主叫號碼和被叫號碼,同時對多路語音通道錄音或監(jiān)聽,自動備份,以及靈活的錄音查詢方式。同時,該錄音系統(tǒng)可以按客戶需求自動對硬盤進行維護, 從而保證系統(tǒng)的不間斷、穩(wěn)定工作。參考圖1所示的是現(xiàn)有的基于語音通信的錄音系統(tǒng)的結構示意圖。如圖1所示, 所述錄音系統(tǒng)10包括語音解碼器101、語音混合器102以及語音編碼器103。根據(jù)圖1所示的錄音系統(tǒng)10,通常采用的錄音方法是首先將未解碼的(即編碼的)下行語音數(shù)據(jù)經(jīng)過所述語音解碼器101進行解碼,生成解碼后的下行語音數(shù)據(jù);然后,將解碼后的下行語音數(shù)據(jù)和未編碼的上行語音數(shù)據(jù)通過所述語音混合器102混音以后,再經(jīng)過所述語音編碼器 103進行編碼,以生成編碼的錄音語音數(shù)據(jù)文件。現(xiàn)有的錄音方法的缺陷是在對上行語音數(shù)據(jù)進行編碼之外需要引入一個新的語音編碼流程(語音編碼器103)??紤]到語音編碼特別是高質量的語音編碼(例如AMR-NB 編碼和AMR-WB編碼)可能有較高的計算復雜度,這種錄音方法會給語音通信系統(tǒng),特別是低端的移動語音通信設備帶來計算資源和功耗壓力。更多的關于語音通信的錄音方法以及錄音系統(tǒng)可以參考公開號為US2006173563A1的美國專利申請文件錄音通信系統(tǒng)和方法(Sound recordingcommunication system and method),同樣沒有角軍決上述問題。

      發(fā)明內容
      本發(fā)明解決的問題是減少語音通信的錄音系統(tǒng)中語音編碼過程,從而降低錄音流程的計算復雜度。為解決上述問題,本發(fā)明實施例提供一種基于語音通信的錄音方法,包括獲取來自通信終端之間通話過程中的語音數(shù)據(jù)段;對所述語音數(shù)據(jù)段進行語音檢測,以判斷所述語音數(shù)據(jù)段中是否包含語音信息;基于包含語音信息的語音數(shù)據(jù)段形成錄音數(shù)據(jù)??蛇x地,所述語音數(shù)據(jù)段包括至少一幀語音數(shù)據(jù)??蛇x地,所述語音數(shù)據(jù)段包括上行語音數(shù)據(jù)段和下行語音數(shù)據(jù)段。可選地,所述對所述語音數(shù)據(jù)段進行語音檢測包括對已編碼的或未編碼的上行語音數(shù)據(jù)段進行語音檢測;對已解碼的或未解碼的下行語音數(shù)據(jù)段進行語音檢測??蛇x地,所述基于包含語音信息的語音數(shù)據(jù)段形成錄音數(shù)據(jù)包括
      4
      若只有下行語音數(shù)據(jù)段包含語音信息,則將未解碼的該下行語音數(shù)據(jù)段作為錄音數(shù)據(jù);若只有上行語音數(shù)據(jù)段包含語音信息,則將已編碼的該上行語音數(shù)據(jù)段作為錄音數(shù)據(jù);若上行語音數(shù)據(jù)段和對應的下行語音數(shù)據(jù)段都包含語音信息,則將已解碼的該下行語音數(shù)據(jù)段和未編碼的該上行語音數(shù)據(jù)段進行語音混合和語音編碼后的結果作為錄音數(shù)據(jù)??蛇x地,還包括若上行語音數(shù)據(jù)段和下行語音數(shù)據(jù)段都不包含語音信息,則將已編碼的該上行語音數(shù)據(jù)段或者未解碼的該下行語音數(shù)據(jù)段作為錄音數(shù)據(jù);或者設置靜音數(shù)據(jù)作為錄音數(shù)據(jù)??蛇x地,所述通信終端包括移動終端和/或固話終端。本發(fā)明實施例還提供了一種錄音系統(tǒng),所述錄音系統(tǒng)適于對語音數(shù)據(jù)進行錄音, 包括獲取單元,用于獲取來自通信終端之間通話過程中的語音數(shù)據(jù)段;檢測單元,用于對所述獲取單元獲取到的所述語音數(shù)據(jù)段進行語音檢測,以判斷所述語音數(shù)據(jù)段中是否包含語音信息;處理單元,用于根據(jù)所述檢測單元檢測到的包含語音信息的語音數(shù)據(jù)段形成錄音數(shù)據(jù)??蛇x地,所述語音數(shù)據(jù)段包括至少一幀語音數(shù)據(jù)。可選地,所述語音數(shù)據(jù)段包括上行語音數(shù)據(jù)段和下行語音數(shù)據(jù)段。可選地,所述檢測單元包括第一檢測單元和第二檢測單元;其中,所述第一檢測單元用于對已編碼的或未編碼的上行語音數(shù)據(jù)段進行語音檢測;所述第二檢測單元用于對已解碼的或未解碼的下行語音數(shù)據(jù)段進行語音檢測??蛇x地,所述處理單元用于若只有下行語音數(shù)據(jù)段包含語音信息,則將未解碼的該下行語音數(shù)據(jù)段作為錄音數(shù)據(jù);若只有上行語音數(shù)據(jù)段包含語音信息,則將已編碼的該上行語音數(shù)據(jù)段作為錄音數(shù)據(jù);若上行語音數(shù)據(jù)段和對應的下行語音數(shù)據(jù)段都包含語音信息,則將已解碼的該下行語音數(shù)據(jù)段和未編碼的該上行語音數(shù)據(jù)段進行語音混合和語音編碼后的結果作為錄音數(shù)據(jù)。可選地,所述處理單元還用于若上行語音數(shù)據(jù)段和下行語音數(shù)據(jù)段都不包含語音信息,則將已編碼的該上行語音數(shù)據(jù)段或者未解碼的該下行語音數(shù)據(jù)段作為錄音數(shù)據(jù); 或者設置靜音數(shù)據(jù)作為錄音數(shù)據(jù)。本發(fā)明實施例還提供一種包括上述錄音系統(tǒng)的通信終端??蛇x地,所述通信終端包括移動終端和/或固話終端。與現(xiàn)有技術相比,本發(fā)明技術方案具有以下有益效果對獲取到的來自通信終端之間通話過程中的語音數(shù)據(jù)段進行語音檢測判斷是否包含語音信息,然后基于包含語音信息的語音數(shù)據(jù)段形成錄音數(shù)據(jù)。這樣就不需要對所有獲取到的語音數(shù)據(jù)都進行語音混合、再經(jīng)過語音編碼后形成錄音數(shù)據(jù),從而減少了錄音過程中的語音編碼過程,降低了錄音系統(tǒng)的計算復雜度。
      具體實施例中,在同一時間段內分別對相應的上行語音數(shù)據(jù)段和下行語音數(shù)據(jù)段進行語音檢測。針對不同的語音編碼格式,有些編碼的語音數(shù)據(jù)段會包含語音檢測所需的信息,此時對已編碼的上行語音數(shù)據(jù)段和未解碼的下行語音數(shù)據(jù)段中獲取語音檢測所需的信息并進行語音檢測;有些編碼的語音數(shù)據(jù)段不包含語音檢測所需的信息,此時則需要從未編碼的上行語音數(shù)據(jù)段和已解碼的下行語音數(shù)據(jù)段中獲取語音檢測所需的信息并進行語音檢測。根據(jù)檢測結果,分為如下情形1)若只有下行語音數(shù)據(jù)段包含語音信息,則將未解碼的該下行語音數(shù)據(jù)段作為錄音數(shù)據(jù);2)若只有上行語音數(shù)據(jù)段包含語音信息,則將已編碼的該上行語音數(shù)據(jù)段作為錄音數(shù)據(jù);3)若上行語音數(shù)據(jù)段和對應的下行語音數(shù)據(jù)段都包含語音信息,則將已解碼的該下行語音數(shù)據(jù)段和未編碼的該上行語音數(shù)據(jù)段進行語音混合和語音編碼后的結果作為錄音數(shù)據(jù);4)若上行語音數(shù)據(jù)段和下行語音數(shù)據(jù)段都不包含語音信息,則將已編碼的該上行語音數(shù)據(jù)段或者未解碼的該下行語音數(shù)據(jù)段作為錄音數(shù)據(jù);或者設置靜音數(shù)據(jù)作為錄音數(shù)據(jù)。本技術方案基于包含語音信息的語音數(shù)據(jù)段形成錄音數(shù)據(jù),同時盡可能地利用已編碼的上行語音數(shù)據(jù)段和未解碼的下行語音數(shù)據(jù)段形成錄音數(shù)據(jù),從而降低了錄音系統(tǒng)的編碼過程,減少了錄音系統(tǒng)的計算復雜度。


      圖1是現(xiàn)有技術的基于語音通信的錄音系統(tǒng)的結構示意圖;圖2是本發(fā)明的一種基于語音通信的錄音方法的具體實施方式
      的流程示意圖;圖3是本發(fā)明的一種基于語音通信的錄音方法的具體實施例的流程示意圖;圖4是本發(fā)明的一種錄音系統(tǒng)的具體實施例的結構示意圖。
      具體實施例方式發(fā)明人發(fā)現(xiàn)在現(xiàn)有的基于語音通信的錄音系統(tǒng)中,在對上行語音數(shù)據(jù)進行編碼之外需要引入一個新的語音編碼流程??紤]到語音編碼特別是高質量的語音編碼(例如 AMR-NB編碼和AMR-WB編碼)可能有較高的計算復雜度,這種錄音方法會給語音通信系統(tǒng), 特別是低端的移動語音通信設備帶來計算資源和功耗壓力。針對上述問題,發(fā)明人經(jīng)過研究,提供了一種基于語音通信的錄音方法以及錄音系統(tǒng),其中所述錄音系統(tǒng)對獲取到的來自通信終端之間通話過程中的語音數(shù)據(jù)段進行語音檢測判斷是否包含語音信息,然后基于包含語音信息的語音數(shù)據(jù)段形成錄音數(shù)據(jù)。這樣就不需要對所有獲取到的語音數(shù)據(jù)都進行語音混合、再經(jīng)過語音編碼后形成錄音數(shù)據(jù),從而減少了錄音過程中的語音編碼過程,降低了錄音系統(tǒng)的計算復雜度。為使本發(fā)明的上述目的、特征和優(yōu)點能夠更為明顯易懂,下面結合附圖對本發(fā)明的具體實施方式
      做詳細的說明。參考圖2是本發(fā)明的一種基于語音通信的錄音方法的具體實施方式
      的流程示意圖。如圖2所示,所述基于語音通信的錄音方法包括步驟Sl 獲取來自通信終端之間通話過程中的語音數(shù)據(jù)段。具體地,所述語音數(shù)據(jù)段是指在通話過程中某一時間段內通信終端之間傳輸?shù)恼Z音數(shù)據(jù)。在本實施例中,語音數(shù)據(jù)是以幀結構形式進行傳輸?shù)模鄳?,獲取所述語音數(shù)據(jù)段的方式可以是以每一幀為單位時間獲取語音數(shù)據(jù),這樣所述語音數(shù)據(jù)段中包含一幀語音數(shù)據(jù);也可以是以連續(xù)多幀(2個或2個以上)為單位時間獲取語音數(shù)據(jù),這樣所述語音數(shù)據(jù)段中包含多幀語音數(shù)據(jù)。但在實際應用中,并不限于上述獲取語音數(shù)據(jù)段的方式。進一步地,所述語音數(shù)據(jù)段包括上行語音數(shù)據(jù)段和下行語音數(shù)據(jù)段。其中所述上行語音數(shù)據(jù)段是指從通信終端發(fā)出的語音數(shù)據(jù)中獲取到的語音數(shù)據(jù)段,所述下行語音數(shù)據(jù)段是指從通信終端接收到的語音數(shù)據(jù)中獲取到的語音數(shù)據(jù)段。在本實施例中,所述上行語音數(shù)據(jù)和下行語音數(shù)據(jù)采用同一種語音編解碼算法或者標準,相應地,錄音系統(tǒng)也采用與之相匹配的算法或者標準進行錄音。本實施例中,所述通信終端包括移動終端和/或固話終端,所述移動終端可以是手機,所述固話終端即固定電話(座機),在實際應用中,所述通信終端還可以是其他具有通訊功能的設備。本步驟所述的獲取過程可以是獲取至少一幀對應的上行語音數(shù)據(jù)和下行語音數(shù)據(jù),例如,第一幀上行語音數(shù)據(jù)和第一幀下行語音數(shù)據(jù);也可以是在預定時間段內分別獲取這一預定時間段內的上行語音數(shù)據(jù)和下行語音數(shù)據(jù),作為獲取到的上行語音數(shù)據(jù)段和下行語音數(shù)據(jù)段。具體地說,例如,在第1秒到第10秒這段時間內分別獲取上行語音數(shù)據(jù)和下行語音數(shù)據(jù),形成這10秒內的上行語音數(shù)據(jù)段和下行語音數(shù)據(jù)段。步驟S2 對所述語音數(shù)據(jù)段進行語音檢測,以判斷所述語音數(shù)據(jù)段中是否包含語首{曰息。具體地,在本步驟中,所述對所述語音數(shù)據(jù)段進行語音檢測包括對已編碼的或未編碼的上行語音數(shù)據(jù)段進行語音檢測;對已解碼的或未解碼的下行語音數(shù)據(jù)段進行語音檢測。其中所述上行語音數(shù)據(jù)段和下行語音數(shù)據(jù)段是在同一時間段內相對應的上行語音數(shù)據(jù)和下行語音數(shù)據(jù)。本領域技術人員理解,在錄音系統(tǒng)中,對于不同的語音編碼格式(例如 AMR-NB編碼、AMR-WB編碼等),有些編碼的語音數(shù)據(jù)段會包含有標識位,所述標識位用于指示該語音數(shù)據(jù)段中含有語音檢測所需的信息,那么,在這種情況下,可以從已編碼的上行語音數(shù)據(jù)段和未解碼的下行語音數(shù)據(jù)段中獲取語音檢測所需的信息并進行語音檢測;而有些編碼的語音數(shù)據(jù)段則不包含所述標識位,那么,在這種情況下,則需要從未編碼的上行語音數(shù)據(jù)段和已解碼的下行語音數(shù)據(jù)段中獲取語音檢測所需的信息并進行語音檢測。本步驟中,所述語音檢測方法是將獲取到的語音數(shù)據(jù)段消除噪聲后,通過分析獲取到的語音,檢測所需信息的數(shù)學特征或參量等過程,將所述語音數(shù)據(jù)段分類為包含語音信息的語音數(shù)據(jù)段和不包含語音信息的語音數(shù)據(jù)段。其中,常用的數(shù)學特征或參量包括頻域上的峰值和坡度(Spectrum Peak andSlope Analysis),相關系數(shù)(Correlation Coefficients),信噪比(Signal and NoiseRatio)等。例如,當頻域上的峰值和坡度大于設定閾值時,則認為所述語音數(shù)據(jù)段為包含語音信息的語音數(shù)據(jù)段;反之,所述語音數(shù)據(jù)段則為不包含語音信息的語音數(shù)據(jù)段。需要說明的是,上述語音檢測方法對所述上行語音數(shù)據(jù)段和下行語音數(shù)據(jù)段都適用,并且檢測過程也相同,在此不再分別描述。但在實際應用中, 所述語音檢測方法并不局限于上述實施例,本領域技術人員還可以利用其它可行的語音檢測方法對語音數(shù)據(jù)段進行語音檢測,在此不作贅述。步驟S3 基于包含語音信息的語音數(shù)據(jù)段形成錄音數(shù)據(jù)。具體地,基于所述步驟S2的檢測結果,本步驟包括如下幾種具體情況,結合參考圖3所示的基于語音通信的錄音方法的具體實施例的流程示意圖,如圖3所示,分別對所述
      7上行語音數(shù)據(jù)段和下行語音數(shù)據(jù)段進行語音檢測(步驟S21和S22,相當于步驟S2的語音檢測過程),根據(jù)語音檢測的結果進行錄音判決(步驟S23,相當于步驟S2的判斷所述語音數(shù)據(jù)段中是否包含語音信息),所述錄音判決包括如下幾種情況,則執(zhí)行相應的步驟情況(1)在同一時間段內,對應的上行語音數(shù)據(jù)段和下行語音數(shù)據(jù)段中,若只有所述下行語音數(shù)據(jù)中含有語音信息,則執(zhí)行步驟S31,將未解碼的下行語音數(shù)據(jù)段作為錄音數(shù)據(jù)。需要說明的是,無論上述步驟S2檢測時是對所述未解碼的下行語音數(shù)據(jù)段進行檢測的還是對所述已解碼的下行語音數(shù)據(jù)段進行檢測的,通常在錄音系統(tǒng)中都會保存所述未解碼的下行語音數(shù)據(jù),因此這里只需要直接將未解碼的下行語音數(shù)據(jù)段將作為這一時間段內的錄音數(shù)據(jù)復制加到錄音文件中。情況(2)在同一時間段內,對應的上行語音數(shù)據(jù)段和下行語音數(shù)據(jù)段中,若只有所述上行語音數(shù)據(jù)段中含有語音信息,則執(zhí)行步驟S32,將已編碼的上行語音數(shù)據(jù)段作為錄音數(shù)據(jù)。需要說明的是,相類似地,無論上述步驟S2檢測時是對所述已編碼的上行語音數(shù)據(jù)段進行檢測的還是對所述未編碼的上行語音數(shù)據(jù)段進行語音檢測的,通常在錄音系統(tǒng)中都會保存所述已編碼的上行語音數(shù)據(jù),因此這里只需要直接將已編碼的上行語音數(shù)據(jù)段將作為這一時間段內的錄音數(shù)據(jù)復制加到錄音文件中。情況(3)在同一時間段內,對應的上行語音數(shù)據(jù)段和下行語音數(shù)據(jù)段中,若所述上行語音數(shù)據(jù)段和下行語音數(shù)據(jù)段中都含有語音信息時,則執(zhí)行步驟S331語音混合和步驟S332語音編碼。需要說明的是,相類似地,無論上述步驟S2是對已解碼的所述下行語音數(shù)據(jù)段和未編碼的所述上行語音數(shù)據(jù)段進行檢測的,還是對未解碼的所述下行語音數(shù)據(jù)段和已編碼的上行語音數(shù)據(jù)段進行檢測的,通常在錄音系統(tǒng)中都會保存所述已解碼的所述下行語音數(shù)據(jù)段和未編碼的所述上行語音數(shù)據(jù)段,因此這里也只需要將已解碼的該下行語音數(shù)據(jù)段和未編碼的該上行語音數(shù)據(jù)段進行語音混合和語音編碼后的結果作為錄音數(shù)據(jù),而該錄音數(shù)據(jù)將作為這一時間段內的錄音數(shù)據(jù)復制加到錄音文件中。情況(4)在同一時間段內,對應的上行語音數(shù)據(jù)段和下行語音數(shù)據(jù)段中,若所述上行語音數(shù)據(jù)段和下行語音數(shù)據(jù)段中都不含有語音信息時,則執(zhí)行步驟S34,任意選擇一種語音數(shù)據(jù)段作為錄音數(shù)據(jù)或者將靜音數(shù)據(jù)作為錄音數(shù)據(jù)。需要說明的是,相類似地,無論上述步驟S2是對已解碼的所述下行語音數(shù)據(jù)段和未編碼的所述上行語音數(shù)據(jù)段進行檢測的,還是對所述已編碼的上行語音數(shù)據(jù)段和未解碼的下行語音數(shù)據(jù)段進行檢測的,通常在錄音系統(tǒng)中都會保存所述已編碼的上行語音數(shù)據(jù)段和未解碼的下行語音數(shù)據(jù)段,因此這里也只需要任意選擇其中一種語音數(shù)據(jù)段作為錄音數(shù)據(jù),同樣該錄音數(shù)據(jù)將作為這一時間段內的錄音數(shù)據(jù)復制加到錄音文件中。這里之所以在所述上行語音數(shù)據(jù)段和下行語音數(shù)據(jù)段中都不含有語音信息時,仍需要將其中一種語音數(shù)據(jù)段作為錄音數(shù)據(jù)是因為所形成的錄音數(shù)據(jù)將放入錄音文件中,為了保證錄音文件中錄音數(shù)據(jù)的連續(xù)性和完整性,即在每個時間段內都有錄音數(shù)據(jù)。需要說明的是,當所述錄音文件的格式支持靜音時,也可以將該時間段內的錄音數(shù)據(jù)設置為靜音數(shù)據(jù),所述設置靜音數(shù)據(jù)的過程為本領域技術人員公知技術,在此不作贅述。需要說明的是,在本實施例中,需要將基于所述步驟S3形成的各個時間段的錄音數(shù)據(jù)按時間先后順序排列后放入錄音文件中,而通常由于錄音文件的語音編碼格式或標準只支持一路語音數(shù)據(jù)段的記錄,即在同一時間段內不支持多個語音數(shù)據(jù)段(如上行和下行)同時錄音。因此,本實施例中,針對上述情況(1)、情況⑵和情況(4),由于在同一時間段內只需要將已編碼的上行語音數(shù)據(jù)段和未解碼的下行語音數(shù)據(jù)段中的一種語音數(shù)據(jù)段作為錄音數(shù)據(jù)復制加到錄音文件中,因此適于錄音文件的語音編碼格式或標準。而針對上述情況(3),當所述上行語音數(shù)據(jù)段和下行語音數(shù)據(jù)段中都含有語音信息時,由于在同一時間段需要上行和下行兩個語音數(shù)據(jù)段,這樣不適于錄音文件的語音編碼格式或標準,因此本實施例中將通過混音器將所述已解碼的下行語音數(shù)據(jù)段以及所述未編碼的上行語音數(shù)據(jù)段進行語音混合,然后再對經(jīng)過混音后的語音數(shù)據(jù)段進行語音編碼形成錄音數(shù)據(jù)。本發(fā)明實施例還提供了一種錄音系統(tǒng),所述錄音系統(tǒng)適于對語音數(shù)據(jù)進行錄音。 如圖4所示的是本發(fā)明的一種錄音系統(tǒng)的具體實施例的結構示意圖。參考圖4,所述錄音系統(tǒng)20包括獲取單元201、檢測單元202以及處理單元203。 其中,所述檢測單元202還包括第一檢測單元2021和第二檢測單元2022,分別適于檢測上行語音數(shù)據(jù)段和下行語音數(shù)據(jù)段。具體地,所述獲取單元201用于獲取來自通信終端之間通話過程中的語音數(shù)據(jù)段。所述語音數(shù)據(jù)段是指在通話過程中某一時間段內通信終端之間傳輸?shù)恼Z音數(shù)據(jù)。在本實施例中,語音數(shù)據(jù)是以幀結構形式進行傳輸?shù)模霁@取單元201可以是以每一幀為單位時間獲取語音數(shù)據(jù),這樣所述語音數(shù)據(jù)段中包含一幀語音數(shù)據(jù);也可以是以連續(xù)多幀(2 個或2個以上)為單位時間獲取語音數(shù)據(jù),這樣所述語音數(shù)據(jù)段中包含多幀語音數(shù)據(jù)。但在實際應用中,并不限于上述獲取語音數(shù)據(jù)段的方式。進一步地,所述語音數(shù)據(jù)段包括上行語音數(shù)據(jù)段和下行語音數(shù)據(jù)段。其中所述上行語音數(shù)據(jù)段是指從通信終端發(fā)出的語音數(shù)據(jù)中獲取到的語音數(shù)據(jù)段,所述下行語音數(shù)據(jù)段是指從通信終端接收到的語音數(shù)據(jù)中獲取到的語音數(shù)據(jù)段。在本實施例中,所述上行語音數(shù)據(jù)和下行語音數(shù)據(jù)采用同一種語音編解碼算法或者標準,相應地,錄音系統(tǒng)也采用與之相匹配的算法或者標準進行錄音。本實施例中,所述通信終端包括移動終端和/或固話終端,所述移動終端可以是手機,所述固話終端即固定電話(座機),在實際應用中,所述通信終端還可以是其他具有通訊功能的設備。所述檢測單元202用于對所述獲取單元201獲取到的所述語音數(shù)據(jù)段進行語音檢測,以判斷所述語音數(shù)據(jù)段中是否包含語音信息。在具體實施例中,所述檢測單元202包括第一檢測單元2021,用于對已編碼的或未編碼的上行語音數(shù)據(jù)段進行語音檢測;以及第二檢測單元2022,用于對所述已解碼的或未解碼的下行語音數(shù)據(jù)進行語音檢測。其中所述上行語音數(shù)據(jù)段和下行語音數(shù)據(jù)段是在同一時間段內相對應的上行語音數(shù)據(jù)和下行語音數(shù)據(jù)。所述處理單元203用于根據(jù)所述檢測單元202檢測到包含語音信息的語音數(shù)據(jù)段形成錄音數(shù)據(jù)。在具體實施例中,所述處理單元203根據(jù)所述檢測單元202不同的檢測結果,包括如下四種處理過程1)若只有下行語音數(shù)據(jù)段包含語音信息,則將未解碼的該下行語音數(shù)據(jù)段作為錄音數(shù)據(jù);2)若只有上行語音數(shù)據(jù)段包含語音信息,則將已編碼的該上行語音數(shù)據(jù)段作為錄音數(shù)據(jù);3)若上行語音數(shù)據(jù)段和對應的下行語音數(shù)據(jù)段都包含語音信息,則將已解碼的該下行語音數(shù)據(jù)段和未編碼的該上行語音數(shù)據(jù)段進行語音混合和語音編碼后的結果作為錄音數(shù)據(jù);4)若上行語音數(shù)據(jù)段和下行語音數(shù)據(jù)段都不包含語音信息,則將已編碼的該上行語音數(shù)據(jù)段或者未解碼的該下行語音數(shù)據(jù)段作為錄音數(shù)據(jù);或者設置靜音數(shù)據(jù)作為錄音數(shù)據(jù)。上述四種處理過程的具體實施例可以參考前述步驟S3的描述,在此不再贅述。本發(fā)明實施例還提供了一種通信終端,所述通信終端包括如圖4所述的錄音系統(tǒng) 20,所述錄音系統(tǒng)20通常設置在所述通信終端的內部,當所述通信終端與其他通信終端進行通話過程中,所述錄音系統(tǒng)20可以獲取通話過程中的語音數(shù)據(jù)段,并根據(jù)本技術方案的錄音方法形成錄音數(shù)據(jù),其中,上行語音數(shù)據(jù)段為該通信終端發(fā)送的語音數(shù)據(jù),下行語音數(shù)據(jù)段為該通信終端從其他通信終端接收到的語音數(shù)據(jù)。綜上,本技術方案對獲取到的來自通信終端之間通話過程中的語音數(shù)據(jù)段進行語音檢測判斷是否包含語音信息,然后基于包含語音信息的語音數(shù)據(jù)段形成錄音數(shù)據(jù)。這樣就不需要對所有獲取到的語音數(shù)據(jù)都進行語音混合、再經(jīng)過語音編碼后形成錄音數(shù)據(jù),從而減少了錄音過程中的語音編碼過程,降低了錄音系統(tǒng)的計算復雜度。本發(fā)明雖然已以較佳實施例公開如上,但其并不是用來限定本發(fā)明,任何本領域技術人員在不脫離本發(fā)明的精神和范圍內,都可以利用上述揭示的方法和技術內容對本發(fā)明技術方案做出可能的變動和修改,因此,凡是未脫離本發(fā)明技術方案的內容,依據(jù)本發(fā)明的技術實質對以上實施例所作的任何簡單修改、等同變化及修飾,均屬于本發(fā)明技術方案的保護范圍。
      權利要求
      1.一種基于語音通信的錄音方法,其特征在于,包括 獲取來自通信終端之間通話過程中的語音數(shù)據(jù)段;對所述語音數(shù)據(jù)段進行語音檢測,以判斷所述語音數(shù)據(jù)段中是否包含語音信息; 基于包含語音信息的語音數(shù)據(jù)段形成錄音數(shù)據(jù)。
      2.根據(jù)權利要求1所述的基于語音通信的錄音方法,其特征在于,所述語音數(shù)據(jù)段包括至少一幀語音數(shù)據(jù)。
      3.根據(jù)權利要求1所述的基于語音通信的錄音方法,其特征在于,所述語音數(shù)據(jù)段包括上行語音數(shù)據(jù)段和下行語音數(shù)據(jù)段。
      4.根據(jù)權利要求3所述的基于語音通信的錄音方法,其特征在于,所述對所述語音數(shù)據(jù)段進行語音檢測包括對已編碼的或未編碼的上行語音數(shù)據(jù)段進行語音檢測;對已解碼的或未解碼的下行語音數(shù)據(jù)段進行語音檢測。
      5.根據(jù)權利要求4所述的基于語音通信的錄音方法,其特征在于,所述基于包含語音信息的語音數(shù)據(jù)段形成錄音數(shù)據(jù)包括若只有下行語音數(shù)據(jù)段包含語音信息,則將未解碼的該下行語音數(shù)據(jù)段作為錄音數(shù)據(jù);若只有上行語音數(shù)據(jù)段包含語音信息,則將已編碼的該上行語音數(shù)據(jù)段作為錄音數(shù)據(jù);若上行語音數(shù)據(jù)段和對應的下行語音數(shù)據(jù)段都包含語音信息,則將已解碼的該下行語音數(shù)據(jù)段和未編碼的該上行語音數(shù)據(jù)段進行語音混合和語音編碼后的結果作為錄音數(shù)據(jù)。
      6 根據(jù)權利要求5所述的基于語音通信的錄音方法,其特征在于,還包括若上行語音數(shù)據(jù)段和下行語音數(shù)據(jù)段都不包含語音信息,則將已編碼的該上行語音數(shù)據(jù)段或者未解碼的該下行語音數(shù)據(jù)段作為錄音數(shù)據(jù);或者設置靜音數(shù)據(jù)作為錄音數(shù)據(jù)。
      7.根據(jù)權利要求1所述的基于語音通信的錄音方法,其特征在于,所述通信終端包括移動終端和/或固話終端。
      8.一種錄音系統(tǒng),所述錄音系統(tǒng)適于對語音數(shù)據(jù)進行錄音,其特征在于,包括 獲取單元,用于獲取來自通信終端之間通話過程中的語音數(shù)據(jù)段;檢測單元,用于對所述獲取單元獲取到的所述語音數(shù)據(jù)段進行語音檢測,以判斷所述語音數(shù)據(jù)段中是否包含語音信息;處理單元,用于根據(jù)所述檢測單元檢測到的包含語音信息的語音數(shù)據(jù)段形成錄音數(shù)據(jù)。
      9.根據(jù)權利要求8所述的錄音系統(tǒng),其特征在于,所述語音數(shù)據(jù)段包括至少一幀語音數(shù)據(jù)。
      10.根據(jù)權利要求8所述的錄音系統(tǒng),其特征在于,所述語音數(shù)據(jù)段包括上行語音數(shù)據(jù)段和下行語音數(shù)據(jù)段。
      11.根據(jù)權利要求10所述的錄音系統(tǒng),其特征在于,所述檢測單元包括第一檢測單元和第二檢測單元;其中,所述第一檢測單元用于對已編碼的或未編碼的上行語音數(shù)據(jù)段進行語音檢測;所述第二檢測單元用于對已解碼的或未解碼的下行語音數(shù)據(jù)段進行語音檢測。
      12.根據(jù)權利要求11所述的錄音系統(tǒng),其特征在于,所述處理單元用于若只有下行語音數(shù)據(jù)段包含語音信息,則將未解碼的該下行語音數(shù)據(jù)段作為錄音數(shù)據(jù);若只有上行語音數(shù)據(jù)段包含語音信息,則將已編碼的該上行語音數(shù)據(jù)段作為錄音數(shù)據(jù);若上行語音數(shù)據(jù)段和對應的下行語音數(shù)據(jù)段都包含語音信息,則將已解碼的該下行語音數(shù)據(jù)段和未編碼的該上行語音數(shù)據(jù)段進行語音混合和語音編碼后的結果作為錄音數(shù)據(jù)。
      13.根據(jù)權利要求12所述的錄音系統(tǒng),其特征在于,所述處理單元還用于若上行語音數(shù)據(jù)段和下行語音數(shù)據(jù)段都不包含語音信息,則將已編碼的該上行語音數(shù)據(jù)段或者未解碼的該下行語音數(shù)據(jù)段作為錄音數(shù)據(jù);或者設置靜音數(shù)據(jù)作為錄音數(shù)據(jù)。
      14.一種通信終端,其特征在于,包括權利要求8至13任一項所述的錄音系統(tǒng)。
      15.根據(jù)權利要求14所述的通信終端,其特征在于,所述通信終端包括移動終端和/或固話終端。
      全文摘要
      一種基于語音通信的錄音方法以及錄音系統(tǒng)、通信終端,其中所述基于語音通信的錄音方法包括獲取來自通信終端之間通話過程中的語音數(shù)據(jù)段;對所述語音數(shù)據(jù)段進行語音檢測,以判斷所述語音數(shù)據(jù)段中是否包含語音信息;基于包含語音信息的語音數(shù)據(jù)段形成錄音數(shù)據(jù)。本技術方案減少語音通信的錄音系統(tǒng)中語音編碼過程,從而降低錄音流程的計算復雜度。
      文檔編號G10L19/00GK102523329SQ20111034210
      公開日2012年6月27日 申請日期2011年11月2日 優(yōu)先權日2011年11月2日
      發(fā)明者吳晟, 張本好, 徐晶明, 李曇, 林福輝, 韓大晗 申請人:展訊通信(上海)有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1