本發(fā)明實施例屬于終端領(lǐng)域,尤其涉及一種語音數(shù)據(jù)的錄音方法及裝置。
背景技術(shù):
目前,學生手機、點讀機、家教機等終端制作的語音數(shù)據(jù)都需要特定錄音人員根據(jù)所給出的稿件(即文本)進行語音錄制,錄制好的語音數(shù)據(jù)再傳回公司進行人工聽音、修音、測試,以查找錄制的語音數(shù)據(jù)是否存在錯誤,若存在錯誤,公司再安排錄音人員重新錄音。
故,有必要提出一種新的方法,以解決上述技術(shù)問題。
技術(shù)實現(xiàn)要素:
本發(fā)明實施例提供了一種語音數(shù)據(jù)的錄音方法及裝置,旨在解決現(xiàn)有的方法中,需要人工聽音、修音、測試,以查找錄制的語音數(shù)據(jù)是否存在錯誤,從而導(dǎo)致錄音效率過低的問題。
本發(fā)明實施例的第一方面,提供了一種語音數(shù)據(jù)的錄音方法,所述方法包括:
錄制錄音人員根據(jù)第一文本得到的第一語音數(shù)據(jù);
識別所述第一語音數(shù)據(jù),得到第二文本;
將所述第一文本和所述第二文本比較,并標識所述第一文本和所述第二文本不同的文本信息;
錄制包括所述第一文本和所述第二文本不同的文本信息的第二語音數(shù)據(jù);
將所述第二語音數(shù)據(jù)替換所述第一語音數(shù)據(jù)中對應(yīng)的語音數(shù)據(jù),得到最終的語音數(shù)據(jù)。
本發(fā)明實施例的第二方面,提供了一種語音數(shù)據(jù)的錄音裝置,所述裝置包括:
第一語音數(shù)據(jù)錄制單元,用于錄制錄音人員根據(jù)第一文本得到的第一語音數(shù)據(jù);
第一語音數(shù)據(jù)識別單元,用于識別所述第一語音數(shù)據(jù),得到第二文本;
文本比較單元,用于將所述第一文本和所述第二文本比較,并標識所述第一文本和所述第二文本不同的文本信息;
第二語音數(shù)據(jù)錄制單元,用于錄制包括所述第一文本和所述第二文本不同的文本信息的第二語音數(shù)據(jù);
語音數(shù)據(jù)替換單元,用于將所述第二語音數(shù)據(jù)替換所述第一語音數(shù)據(jù)中對應(yīng)的語音數(shù)據(jù),得到最終的語音數(shù)據(jù)。
在本發(fā)明實施例中,由于無需通過人工聽音、修音、測試來查找錄制的語音數(shù)據(jù)是否存在錯誤,因此,簡化了操作步驟,提高了錄音效率。
附圖說明
圖1是本發(fā)明第一實施例提供的一種語音數(shù)據(jù)的錄音方法的流程圖;
圖2是本發(fā)明第二實施例提供的一種語音數(shù)據(jù)的錄音裝置的結(jié)構(gòu)圖。
具體實施方式
為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及實施例,對本發(fā)明進行進一步詳細說明。應(yīng)當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
本發(fā)明第一實施例中,錄制錄音人員根據(jù)第一文本得到的第一語音數(shù)據(jù),識別所述第一語音數(shù)據(jù),得到第二文本,將所述第一文本和所述第二文本比較,并標識所述第一文本和所述第二文本不同的文本信息,錄制包括所述第一文本和所述第二文本不同的文本信息的第二語音數(shù)據(jù),將所述第二語音數(shù)據(jù)替換所述第一語音數(shù)據(jù)中對應(yīng)的語音數(shù)據(jù),得到最終的語音數(shù)據(jù)。
為了說明本發(fā)明所述的技術(shù)方案,下面通過具體實施例來進行說明。
實施例一:
圖1示出了本發(fā)明第一實施例提供的一種語音數(shù)據(jù)的錄音方法的流程圖,詳述如下:
步驟S11,錄制錄音人員根據(jù)第一文本得到的第一語音數(shù)據(jù)。
具體地,錄音人員根據(jù)第一文本的內(nèi)容發(fā)出對應(yīng)的語音,終端錄制該語音,得到對應(yīng)的第一語音數(shù)據(jù)。
步驟S12,識別所述第一語音數(shù)據(jù),得到第二文本。
雖然第一語音數(shù)據(jù)是錄音人員對照給出的第一文本進行錄制,但是仍不能保證錄制的第一語音數(shù)據(jù)是百分之百與第一文本匹配的,因此,需要再通過語音識別算法識別第一語音數(shù)據(jù),得到第二文本。
步驟S13,將所述第一文本和所述第二文本比較,并標識所述第一文本和所述第二文本不同的文本信息。
可選地,為了便于用戶快速查看到兩個文本不同的文本信息,所述步驟S13包括:
A1、將所述第一文本和所述第二文本比較,確定所述第一文本和所述第二文本不同的文本信息。
A2、在所述第一文本上以鮮艷顏色標識確定的文本信息和/或在所述第二文本上以鮮艷顏色標識確定的文本信息。
上述鮮艷顏色是指,與顯示第一文本(或第二文本)的文本信息的顏色不同且鮮艷的顏色,例如,假設(shè)顯示第一文本的文本信息的顏色為黑色,若在第一文本上以鮮艷顏色標識確定的文本信息,則以紅色或黃色或藍色等鮮艷顏色顯示確定的所述第一文本和所述第二文本不同的文本信息。
可選地,為了便于用戶快速查看到兩個文本不同的文本信息,所述步驟S13包括:
B1、將所述第一文本和所述第二文本比較,確定所述第一文本和所述第二文本不同的文本信息。
B2、在所述第一文本上以指定符號或指定字體標識確定的文本信息和/或在所述第二文本上以指定符號或指定字體標識確定的文本信息。
其中,指定符號包括星號(如“※”),三角形、矩形等符號。在指定符號為星號時,在確定的所述第一文本和所述第二文本不同的文本信息的同一行批注“※”,以標識所述第一文本和所述第二文本不同的文本信息。
其中,指定字體包括宋體、楷體等。為了便于標識,顯示所述第一文本和所述第二文本不同的文本信息的字體與顯示所述第一文本和所述第二文本相同的文本信息的字體不同。為了進一步區(qū)分,顯示所述第一文本和所述第二文本不同的文本信息的字號也與顯示所述第一文本和所述第二文本相同的文本信息的字號不同。
步驟S14,錄制包括所述第一文本和所述第二文本不同的文本信息的第二語音數(shù)據(jù)。
可選地,為了保證同一句語音數(shù)據(jù)的聲音信息(如語速、語調(diào)等)相同,則所述步驟S14具體包括:
C1、判斷所述第一文本和所述第二文本不同的文本信息是否為整句的文本信息。具體地,判斷所述第一文本和所述第二文本不同的文本信息的前面和后面是否包括其他文本信息,且與包括的該其他文本信息之間是否包括標點符號,若包括標點符號,則判定為非整句的文本信息,否則,判定為整句的文本信息。或者,通過判斷所述第一文本和所述第二文本不同的文本信息的前面和后面是否包括其他文本信息,且與包括的該其他文本信息的語義是否相同,若相同,判定為整句的文本信息,否則,判定為非整句的文本信息。
C2、在所述第一文本和所述第二文本不同的文本信息為整句的文本信息,錄制所述第一文本和所述第二文本不同的文本信息的第二語音數(shù)據(jù)。
C3、在所述第一文本和所述第二文本不同的文本信息不為整句的文本信息,錄制包括所述第一文本和所述第二文本不同的文本信息所在的整句的文本信息的第二語音數(shù)據(jù)。
上述C1~C3中,由于錄制的第二語音數(shù)據(jù)為整句的文本信息,因此,使得整句的文本信息對應(yīng)的第二語音數(shù)據(jù)在語速、語調(diào)上保持一致,便于提高用戶的滿意度。
可選地,在錄制包括所述第一文本和所述第二文本不同的文本信息的第二語音數(shù)據(jù)后,確定該第二語音數(shù)據(jù)的聲音信息(如語速、語調(diào)、聲音頻率等),獲取第一語音數(shù)據(jù)的聲音信息,再將第二語音數(shù)據(jù)的聲音信息與第一語音數(shù)據(jù)的聲音信息比較,并在第二語音數(shù)據(jù)的聲音信息與第一語音數(shù)據(jù)的聲音信息的差大于預(yù)設(shè)的閾值時,發(fā)出重錄制第二語音數(shù)據(jù)的提示。
步驟S15,將所述第二語音數(shù)據(jù)替換所述第一語音數(shù)據(jù)中對應(yīng)的語音數(shù)據(jù),得到最終的語音數(shù)據(jù)。
可選地,為了能夠準確替換第一語音數(shù)據(jù)中對應(yīng)的語音數(shù)據(jù),則在執(zhí)行所述步驟S13時,包括:
確定包括標識的文本信息對應(yīng)的時間軸信息。其中,時間軸信息包括標識的文本信息的開始和結(jié)束的時間信息。需要指出的是,所述包括標識的文本信息對應(yīng)的時間軸信息包括2種情況,1種是只為標識的文本信息的開始和結(jié)束的時間信息,另1種是標識的文本信息所在的整句的開始和結(jié)束的時間信息。
對應(yīng)地,所述步驟S15具體包括:
將所述第二語音數(shù)據(jù)替換所述第一語音數(shù)據(jù)中與所述時間軸信息對應(yīng)的語音數(shù)據(jù),得到最終的語音數(shù)據(jù)。
本發(fā)明第一實施例中,錄制錄音人員根據(jù)第一文本得到的第一語音數(shù)據(jù),識別所述第一語音數(shù)據(jù),得到第二文本,將所述第一文本和所述第二文本比較,并標識所述第一文本和所述第二文本不同的文本信息,錄制包括所述第一文本和所述第二文本不同的文本信息的第二語音數(shù)據(jù),將所述第二語音數(shù)據(jù)替換所述第一語音數(shù)據(jù)中對應(yīng)的語音數(shù)據(jù),得到最終的語音數(shù)據(jù)。由于無需通過人工聽音、修音、測試來查找錄制的語音數(shù)據(jù)是否存在錯誤,因此,簡化了操作步驟,提高了錄音效率。
應(yīng)理解,在本發(fā)明實施例中,上述各過程的序號的大小并不意味著執(zhí)行順序的先后,各過程的執(zhí)行順序應(yīng)以其功能和內(nèi)在邏輯確定,而不應(yīng)對本發(fā)明實施例的實施過程構(gòu)成任何限定。
實施例二:
圖2示出了本發(fā)明第二實施例提供的一種語音數(shù)據(jù)的錄音裝置的結(jié)構(gòu)圖,該語音數(shù)據(jù)的錄音裝置可應(yīng)用于各種終端中,該終端可以包括經(jīng)無線接入網(wǎng)RAN與一個或多個核心網(wǎng)進行通信的用戶設(shè)備,該用戶設(shè)備可以是移動電話(或稱為“蜂窩”電話)、具有移動設(shè)備的計算機等,例如,用戶設(shè)備還可以是便攜式、袖珍式、手持式、計算機內(nèi)置的或者車載的移動裝置,它們與無線接入網(wǎng)交換語音和/或數(shù)據(jù)。又例如,該移動設(shè)備可以包括智能手機、平板電腦、個人數(shù)字助理PDA、銷售終端POS或車載電腦等。為了便于說明,僅示出了與本發(fā)明實施例相關(guān)的部分。
該語音數(shù)據(jù)的錄音裝置包括:第一語音數(shù)據(jù)錄制單元21、第一語音數(shù)據(jù)識別單元22、文本比較單元23、第二語音數(shù)據(jù)錄制單元24、語音數(shù)據(jù)替換單元25。其中:
第一語音數(shù)據(jù)錄制單元21,用于錄制錄音人員根據(jù)第一文本得到的第一語音數(shù)據(jù)。
第一語音數(shù)據(jù)識別單元22,用于識別所述第一語音數(shù)據(jù),得到第二文本。
文本比較單元23,用于將所述第一文本和所述第二文本比較,并標識所述第一文本和所述第二文本不同的文本信息。
可選地,為了便于用戶快速查看到兩個文本不同的文本信息,所述文本比較單元23包括:
第一不同的文本信息確定模塊,用于將所述第一文本和所述第二文本比較,確定所述第一文本和所述第二文本不同的文本信息。
顏色標識模塊,用于在所述第一文本上以鮮艷顏色標識確定的文本信息和/或在所述第二文本上以鮮艷顏色標識確定的文本信息。上述鮮艷顏色是指,與顯示第一文本(或第二文本)的文本信息的顏色不同且鮮艷的顏色。
可選地,為了便于用戶快速查看到兩個文本不同的文本信息,所述文本比較單元23包括:
第二不同的文本信息確定模塊,用于將所述第一文本和所述第二文本比較,確定所述第一文本和所述第二文本不同的文本信息。
指定符號標識模塊,用于在所述第一文本上以指定符號或指定字體標識確定的文本信息和/或在所述第二文本上以指定符號或指定字體標識確定的文本信息。其中,指定符號包括星號(如“※”),三角形、矩形等符號。在指定符號為星號時,在確定的所述第一文本和所述第二文本不同的文本信息的同一行批注“※”,以標識所述第一文本和所述第二文本不同的文本信息。
其中,指定字體包括宋體、楷體等。為了便于標識,顯示所述第一文本和所述第二文本不同的文本信息的字體與顯示所述第一文本和所述第二文本相同的文本信息的字體不同。為了進一步區(qū)分,顯示所述第一文本和所述第二文本不同的文本信息的字號也與顯示所述第一文本和所述第二文本相同的文本信息的字號不同。
第二語音數(shù)據(jù)錄制單元24,用于錄制包括所述第一文本和所述第二文本不同的文本信息的第二語音數(shù)據(jù)。
可選地,為了保證同一句語音數(shù)據(jù)的聲音信息(如語速、語調(diào)等)相同,所述第二語音數(shù)據(jù)錄制單元24包括:
整句的文本信息判斷模塊,用于判斷所述第一文本和所述第二文本不同的文本信息是否為整句的文本信息。具體地,判斷所述第一文本和所述第二文本不同的文本信息的前面和后面是否包括其他文本信息,且與包括的該其他文本信息之間是否包括標點符號,若包括標點符號,則判定為非整句的文本信息,否則,判定為整句的文本信息?;蛘?,通過判斷所述第一文本和所述第二文本不同的文本信息的前面和后面是否包括其他文本信息,且與包括的該其他文本信息的語義是否相同,若相同,判定為整句的文本信息,否則,判定為非整句的文本信息。
整句的文本信息處理模塊,用于在所述第一文本和所述第二文本不同的文本信息為整句的文本信息,錄制所述第一文本和所述第二文本不同的文本信息的第二語音數(shù)據(jù)。
非整句的文本信息處理模塊,用于在所述第一文本和所述第二文本不同的文本信息不為整句的文本信息,錄制包括所述第一文本和所述第二文本不同的文本信息所在的整句的文本信息的第二語音數(shù)據(jù)。
可選地,該語音數(shù)據(jù)的錄音裝置包括:
提示單元,用于確定第二語音數(shù)據(jù)的聲音信息(如語速、語調(diào)、聲音頻率等),獲取第一語音數(shù)據(jù)的聲音信息,再將第二語音數(shù)據(jù)的聲音信息與第一語音數(shù)據(jù)的聲音信息比較,并在第二語音數(shù)據(jù)的聲音信息與第一語音數(shù)據(jù)的聲音信息的差大于預(yù)設(shè)的閾值時,發(fā)出重錄制第二語音數(shù)據(jù)的提示。
語音數(shù)據(jù)替換單元25,用于將所述第二語音數(shù)據(jù)替換所述第一語音數(shù)據(jù)中對應(yīng)的語音數(shù)據(jù),得到最終的語音數(shù)據(jù)。
可選地,為了能夠準確替換第一語音數(shù)據(jù)中對應(yīng)的語音數(shù)據(jù),該語音數(shù)據(jù)的錄音裝置包括:
時間軸信息確定單元,用于確定包括標識的文本信息對應(yīng)的時間軸信息。其中,時間軸信息包括標識的文本信息的開始和結(jié)束的時間信息。需要指出的是,所述包括標識的文本信息對應(yīng)的時間軸信息包括2種情況,1種是只為標識的文本信息的開始和結(jié)束的時間信息,另1種是標識的文本信息所在的整句的開始和結(jié)束的時間信息。
對應(yīng)地,所述語音數(shù)據(jù)替換單元具體包括:
將所述第二語音數(shù)據(jù)替換所述第一語音數(shù)據(jù)中與所述時間軸信息對應(yīng)的語音數(shù)據(jù),得到最終的語音數(shù)據(jù)。
本發(fā)明第二實施例中,由于無需通過人工聽音、修音、測試來查找錄制的語音數(shù)據(jù)是否存在錯誤,因此,簡化了操作步驟,提高了錄音效率。
本領(lǐng)域普通技術(shù)人員可以意識到,結(jié)合本文中所公開的實施例描述的各示例的單元及算法步驟,能夠以電子硬件、或者計算機軟件和電子硬件的結(jié)合來實現(xiàn)。這些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計約束條件。專業(yè)技術(shù)人員可以對每個特定的應(yīng)用來使用不同方法來實現(xiàn)所描述的功能,但是這種實現(xiàn)不應(yīng)認為超出本發(fā)明的范圍。
所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,上述描述的系統(tǒng)、裝置和單元的具體工作過程,可以參考前述方法實施例中的對應(yīng)過程,在此不再贅述。
在本申請所提供的幾個實施例中,應(yīng)該理解到,所揭露的系統(tǒng)、裝置和方法,可以通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機械或其它的形式。
所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。
另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。
所述功能如果以軟件功能單元的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可以存儲在一個計算機可讀取存儲介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分或者該技術(shù)方案的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機,服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:U盤、移動硬盤、只讀存儲器(ROM,Read-Only Memory)、隨機存取存儲器(RAM,Random Access Memory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
以上所述,僅為本發(fā)明的具體實施方式,但本發(fā)明的保護范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應(yīng)所述以權(quán)利要求的保護范圍為準。