国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種移動終端及語音到文本的轉(zhuǎn)換方法與流程

      文檔序號:12279220閱讀:243來源:國知局
      一種移動終端及語音到文本的轉(zhuǎn)換方法與流程

      本發(fā)明涉及移動通信技術(shù),尤其涉及一種移動終端及語音到文本的轉(zhuǎn)換方法。



      背景技術(shù):

      隨著信息時代的迅速發(fā)展,信息輸入/輸出功能的重要性在電子設(shè)備中已經(jīng)被逐漸加強。人們可通過手機或錄音筆(或其他具有錄音功能的設(shè)備)進行錄音,方便記錄信息。伴隨語音識別技術(shù)的發(fā)展,智能移動終端已經(jīng)能夠?qū)崿F(xiàn)將語音文件轉(zhuǎn)換為文本文件進行顯示的功能,用戶在使用具有語音文件轉(zhuǎn)換文本文件進行顯示的功能的智能移動終端時,不僅可以記錄實時的語音信息,還可以將語音文件直接轉(zhuǎn)換為文本文件并進行顯示,從而使用戶無需再進行一邊回放語音文件一邊記錄錄音內(nèi)容的繁瑣工作,使用戶更加快捷方便地記錄語音信息。

      在實現(xiàn)本發(fā)明的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)中至少存在如下問題:

      在現(xiàn)有技術(shù)中,雖然已經(jīng)實現(xiàn)了將語音文件轉(zhuǎn)換成文本文件進行顯示的功能,但是,在使用現(xiàn)有技術(shù)將語音文件轉(zhuǎn)換為文本文件時,如果語音文件中同時存在多個人物的語音,采用現(xiàn)有的語音文件到文本文件的轉(zhuǎn)換方法,無法在同時存在的多個人物的語音中區(qū)分出不同人物的語音,從而無法將全部語音信息中的同時存在的多個人物語音轉(zhuǎn)換為各個人物對應(yīng)的文本信息。



      技術(shù)實現(xiàn)要素:

      有鑒于此,本發(fā)明實施例提供了一種移動終端及語音到文本的轉(zhuǎn)換方法,在同時存在的多個人物的語音時,能夠?qū)崿F(xiàn)將全部語音信息中的同時存在的多個人物語音轉(zhuǎn)換為各個人物對應(yīng)的文本信息,從而可以方便用戶操作,提升用戶體驗。

      本發(fā)明實施例的技術(shù)方案是這樣實現(xiàn)的:

      本發(fā)明實施例提供了一種移動終端,所述移動終端包括:

      接收單元,用于接收同時存在的多個人物的語音信息,并將所述語音信息發(fā)送給提取單元;

      所述提取單元,用于在全部語音信息中提取至少N個聲紋特征,并將所述聲紋特征發(fā)送給轉(zhuǎn)換單元;其中,N為大于等于2的自然數(shù);

      所述轉(zhuǎn)換單元,用于根據(jù)N個聲紋特征將全部語音信息轉(zhuǎn)換為不同人物對應(yīng)的文本信息。

      可選地,所述提取單元用于采用多個采樣周期在全部語音信息中提取至少N個聲紋特征;或者,采用多個采樣頻率在全部語音信息中提取至少N個聲紋特征。

      可選地,所述轉(zhuǎn)換單元包括:

      匹配子單元,用于將N個聲紋特征分別與預(yù)先存儲的聲紋特征進行匹配,并將匹配結(jié)果發(fā)送給轉(zhuǎn)換子單元;

      轉(zhuǎn)換子單元,用于根據(jù)所述匹配結(jié)果將全部語音信息轉(zhuǎn)換為各個人物對應(yīng)的文本信息。

      可選地,所述轉(zhuǎn)換子單元用于判斷各個聲紋特征是否與至少一個預(yù)先存儲的聲紋特征匹配成功;若匹配成功,將各個聲紋特征轉(zhuǎn)換為各個人物對應(yīng)的文本信息。

      可選地,所述匹配子單元用于將N個聲紋特征分別與預(yù)先存儲的多種格式的聲紋特征進行匹配;或者,將N個聲紋特征分別與預(yù)先存儲的多個聲道的聲紋特征進行匹配。

      本發(fā)明實施例還提供了一種語音到文本的轉(zhuǎn)換方法,所述方法包括:

      接收同時存在的多個人物的語音信息;

      在全部語音信息中提取至少N個聲紋特征;其中,N為大于等于2的自然數(shù);

      根據(jù)N個聲紋特征將全部語音信息轉(zhuǎn)換為不同人物對應(yīng)的文本信息。

      可選地,所述在全部語音信息中提取至少N個聲紋特征,包括:

      采用多個采樣周期在全部語音信息中提取至少N個聲紋特征;

      或者,采用多個采樣頻率在全部語音信息中提取至少N個聲紋特征。

      可選地,所述根據(jù)N個聲紋特征將全部語音信息轉(zhuǎn)換為不同人物對應(yīng)的文本信息,包括:

      將N個聲紋特征分別與預(yù)先存儲的聲紋特征進行匹配;

      根據(jù)匹配結(jié)果將全部語音信息轉(zhuǎn)換為各個人物對應(yīng)的文本信息。

      可選地,所述根據(jù)匹配結(jié)果將全部語音信息轉(zhuǎn)換為各個人物對應(yīng)的文本信息,包括:

      判斷各個聲紋特征是否與至少一個預(yù)先存儲的聲紋特征匹配成功;

      若匹配成功,將各個聲紋特征轉(zhuǎn)換為各個人物對應(yīng)的文本信息。

      可選地,所述將N個聲紋特征分別與預(yù)先存儲的聲紋特征進行匹配,包括:

      將N個聲紋特征分別與預(yù)先存儲的多種格式的聲紋特征進行匹配;

      或者,將N個聲紋特征分別與預(yù)先存儲的多個聲道的聲紋特征進行匹配。

      由此可見,本發(fā)明實施例的技術(shù)方案中,移動終端接收同時存在的多個人物的語音信息后,在全部語音信息中提取至少N個聲紋特征,其中,N為大于等于2的自然數(shù),然后根據(jù)N個聲紋特征將全部語音信息轉(zhuǎn)換為不同人物對應(yīng)的文本信息。也就是說,在本發(fā)明提出的技術(shù)方案中,在同時存在的多個人物的語音時,移動終端能夠?qū)崿F(xiàn)將全部語音信息中的同時存在的多個人物語音轉(zhuǎn)換為各個人物對應(yīng)的文本信息。而不是像現(xiàn)有技術(shù)中,無法將全部語音信息中的同時存在的多個人物語音轉(zhuǎn)換為各個人物對應(yīng)的文本信息。由此可見,和現(xiàn)有技術(shù)相比,本發(fā)明實施例提出的移動終端及語音到文本的轉(zhuǎn)換方法,能夠?qū)崿F(xiàn)將全部語音信息中的同時存在的多個人物語音轉(zhuǎn)換為各個人物對應(yīng)的文本信息,從而可以方便用戶使用,提升用戶體驗;并且,實現(xiàn)起來簡單方便,便于普及,適用范圍更廣。

      附圖說明

      圖1為實現(xiàn)本發(fā)明各個實施例的一個可選的移動終端100的硬件結(jié)構(gòu)示意圖;

      圖2為如圖1所示的移動終端100的無線通信系統(tǒng)示意圖;

      圖3為本發(fā)明實施例一提供的移動終端的組成結(jié)構(gòu)示意圖;

      圖4為本發(fā)明實施例二提供的移動終端的組成結(jié)構(gòu)示意圖;

      圖5為本發(fā)明實施例中語音到文本的轉(zhuǎn)換方法的實現(xiàn)流程示意圖;

      圖6為本發(fā)明實施例中根據(jù)N個聲紋特征將語音轉(zhuǎn)換為文本的實現(xiàn)流程示意圖。

      具體實施方式

      應(yīng)當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明的技術(shù)方案,并不用于限定本發(fā)明的保護范圍。

      現(xiàn)在將參考附圖描述實現(xiàn)本發(fā)明各個實施例的移動終端。在后續(xù)的描述中,使用用于表示元件的諸如“模塊”、“部件”或“單元”的后綴僅為了有利于本發(fā)明的說明,其本身并沒有特定的意義。因此,“模塊”與“部件”可以混合地使用。

      移動終端可以以各種形式來實施。例如,本發(fā)明中描述的終端可以包括諸如移動電話、智能電話、筆記本電腦、數(shù)字廣播接收器、個人數(shù)字助理(PDA)、平板電腦(PAD)、便攜式多媒體播放器(PMP)、導(dǎo)航裝置等的移動終端。

      圖1為實現(xiàn)本發(fā)明各個實施例的移動終端100的硬件結(jié)構(gòu)示意,如圖1所示,移動終端100可以包括:無線通信單元110、用戶輸入單元120、感測單元130、輸出單元140、存儲器150、接口單元160、控制器170和電源單元180等。圖1示出了具有各種組件的移動終端100,但是應(yīng)理解的是,并不要求實施所有示出的組件。可以替代地實施更多或更少的組件。將在下面詳細描述移動終端100的元件。

      無線通信單元110通常包括一個或多個組件,其允許移動終端100與無線通信系統(tǒng)或網(wǎng)絡(luò)之間的無線電通信。例如,無線通信單元110可以包括:移動通信模塊111、無線互聯(lián)網(wǎng)模塊112和短程通信模塊113中的至少一個。

      移動通信模塊111將無線電信號發(fā)送到基站(例如,接入點、節(jié)點B等)、外部終端以及服務(wù)器中的至少一個和/或從其接收無線電信號。這樣的無線電信號可以包括語音通話信號、視頻通話信號、或者根據(jù)文本和/或多媒體消息發(fā)送和/或接收的各種類型的數(shù)據(jù)。

      無線互聯(lián)網(wǎng)模塊112支持移動終端100的無線互聯(lián)網(wǎng)接入。無線互聯(lián)網(wǎng)模塊112可以內(nèi)部或外部地耦接到終端。無線互聯(lián)網(wǎng)模塊112所涉及的無線互聯(lián)網(wǎng)接入技術(shù)可以包括無線局域網(wǎng)(WLAN)、無線相容性認證(Wi-Fi)、無線寬帶(Wibro)、全球微波互聯(lián)接入(Wimax)、高速下行鏈路分組接入(HSDPA)等。

      短程通信模塊113是用于支持短程通信的模塊。短程通信技術(shù)的一些示例包括藍牙TM、射頻識別(RFID)、紅外數(shù)據(jù)協(xié)會(IrDA)、超寬帶(UWB)、紫蜂TM等。

      用戶輸入單元120可以根據(jù)用戶輸入的命令生成鍵輸入數(shù)據(jù)以控制移動終端100的各種操作。用戶輸入單元120允許用戶輸入各種類型的信息,并且可以包括鍵盤、鍋仔片、觸摸板(例如,檢測由于被接觸而導(dǎo)致的電阻、壓力、電容等的變化的觸敏組件)、滾輪、搖桿等。特別地,當觸摸板以層的形式疊加在顯示單元141上時,可以形成觸摸屏。

      感測單元130檢測移動終端100的當前狀態(tài),(例如,移動終端100的打開或關(guān)閉狀態(tài))、移動終端100的位置、用戶對于移動終端100的接觸(即,觸摸輸入)的有無、移動終端100的取向、移動終端100的加速或減速移動和方向等,并且生成用于控制移動終端100的操作的命令或信號。例如,當移動終端100實施為滑動型移動電話時,感測單元130可以感測該滑動型電話是打開還是關(guān)閉。另外,感測單元130能夠檢測電源單元180是否提供電力或者接口單元160是否與外部裝置耦接。

      接口單元160用作至少一個外部裝置與移動終端100連接可以通過的接口。例如,外部裝置可以包括有線或無線頭戴式耳機端口、外部電源(或電池充電器)端口、有線或無線數(shù)據(jù)端口、存儲卡端口(典型示例是通用串行總線USB端口)、用于連接具有識別模塊的裝置的端口、音頻輸入/輸出(I/O)端口、視頻I/O端口、耳機端口等。

      接口單元160可以用于接收來自外部裝置的輸入(例如,數(shù)據(jù)信息、電力等)并且將接收到的輸入傳輸?shù)揭苿咏K端100內(nèi)的一個或多個元件或者可以用于在移動終端100和外部裝置之間傳輸數(shù)據(jù)。

      另外,當移動終端100與外部底座連接時,接口單元160可以用作允許通過其將電力從底座提供到移動終端100的路徑或者可以用作允許從底座輸入的各種命令信號通過其傳輸?shù)揭苿咏K端100的路徑。從底座輸入的各種命令信號或電力可以用作用于識別移動終端100是否準確地安裝在底座上的信號。

      輸出單元140被構(gòu)造為以視覺、音頻和/或觸覺方式提供輸出信號(例如,音頻信號、視頻信號、警報信號、振動信號等)。輸出單元140可以包括顯示單元141和音頻輸出模塊142等。

      顯示單元141可以顯示在移動終端100中處理的信息。例如,當移動終端100處于電話通話模式時,顯示單元141可以顯示與通話或其它通信(例如,文本消息收發(fā)、多媒體文件下載等)相關(guān)的用戶界面(UI)或圖形用戶界面(GUI)。當移動終端100處于視頻通話模式或者圖像捕獲模式時,顯示單元141可以顯示捕獲的圖像和/或接收的圖像、示出視頻或圖像以及相關(guān)功能的UI或GUI等。

      同時,當顯示單元141和觸摸板以層的形式彼此疊加以形成觸摸屏?xí)r,顯示單元141可以用作輸入裝置和輸出裝置。顯示單元141可以包括液晶顯示器(LCD)、薄膜晶體管LCD(TFT-LCD)、有機發(fā)光二極管(OLED)顯示器、柔性顯示器、三維(3D)顯示器等中的至少一種。這些顯示器中的一些可以被構(gòu)造為透明狀以允許用戶從外部觀看,這可以稱為透明顯示器,典型的透明顯示器可以例如為TOLED(透明有機發(fā)光二極管)顯示器等。根據(jù)特定想要的實施方式,移動終端100可以包括兩個或更多顯示單元(或其它顯示裝置),例如,移動終端100可以包括外部顯示單元(未示出)和內(nèi)部顯示單元(未示出)。觸摸屏可用于檢測觸摸輸入壓力以及觸摸輸入位置和觸摸輸入面積。

      音頻輸出模塊142可以在移動終端100處于呼叫信號接收模式、通話模式、記錄模式、語音識別模式、廣播接收模式等模式下時,將無線通信單元110接收的或者在存儲器150中存儲的音頻數(shù)據(jù)轉(zhuǎn)換音頻信號并且輸出為聲音。而且,音頻輸出模塊142可以提供與移動終端100執(zhí)行的特定功能相關(guān)的音頻輸出(例如,呼叫信號接收聲音、消息接收聲音等)。音頻輸出模塊142可以包括揚聲器、蜂鳴器等。

      存儲器150可以存儲由控制器170執(zhí)行的處理和控制操作的軟件程序等,或者可以暫時地存儲已經(jīng)輸出或?qū)⒁敵龅臄?shù)據(jù)(例如,電話簿、消息、靜態(tài)圖像、視頻等)。而且,存儲器150可以存儲關(guān)于當觸摸施加到觸摸屏?xí)r輸出的各種方式的振動和音頻信號的數(shù)據(jù)。

      存儲器150可以包括至少一種類型的存儲介質(zhì),所述存儲介質(zhì)包括閃存、硬盤、多媒體卡、卡型存儲器(例如,SD或DX存儲器等)、隨機訪問存儲器(RAM)、靜態(tài)隨機訪問存儲器(SRAM)、只讀存儲器(ROM)、電可擦除可編程只讀存儲器(EEPROM)、可編程只讀存儲器(PROM)、磁性存儲器、磁盤、光盤等。而且,移動終端100可以與通過網(wǎng)絡(luò)連接執(zhí)行存儲器150的存儲功能的網(wǎng)絡(luò)存儲裝置協(xié)作。

      控制器170通??刂埔苿咏K端100的總體操作。例如,控制器170執(zhí)行與語音通話、數(shù)據(jù)通信、視頻通話等相關(guān)的控制和處理。另外,控制器170可以包括用于再現(xiàn)或回放多媒體數(shù)據(jù)的多媒體模塊171,多媒體模塊171可以構(gòu)造在控制器170內(nèi),或者可以構(gòu)造為與控制器170分離??刂破?70可以執(zhí)行模式識別處理,以將在觸摸屏上執(zhí)行的手寫輸入或者圖片繪制輸入識別為字符或圖像。

      電源單元180在控制器170的控制下接收外部電力或內(nèi)部電力并且提供操作各元件和組件所需的適當?shù)碾娏Α?/p>

      這里描述的各種實施方式可以以使用例如計算機軟件、硬件或其任何組合的計算機可讀介質(zhì)來實施。對于硬件實施,這里描述的實施方式可以通過使用特定用途集成電路(ASIC)、數(shù)字信號處理器(DSP)、數(shù)字信號處理裝置(DSPD)、可編程邏輯裝置(PLD)、現(xiàn)場可編程門陣列(FPGA)、處理器、控制器、微控制器、微處理器、被設(shè)計為執(zhí)行這里描述的功能的電子單元中的至少一種來實施,在一些情況下,這樣的實施方式可以在控制器170中實施。對于軟件實施,諸如過程或功能的實施方式可以與允許執(zhí)行至少一種功能或操作的單獨的軟件模塊來實施。軟件代碼可以由以任何適當?shù)木幊陶Z言編寫的軟件應(yīng)用程序(或程序)來實施,軟件代碼可以存儲在存儲器150中并且由控制器170執(zhí)行。

      至此,已經(jīng)按照其功能描述了移動終端100。下面,為了簡要起見,將描述諸如折疊型、直板型、擺動型、滑動型移動終端100等的各種類型的移動終端100中的滑動型移動終端100作為示例。因此,本發(fā)明能夠應(yīng)用于任何類型的移動終端100,并且不限于滑動型移動終端100。

      如圖1中所示的移動終端100可以被構(gòu)造為利用經(jīng)由幀或分組發(fā)送數(shù)據(jù)的諸如有線和無線通信系統(tǒng)以及基于衛(wèi)星的通信系統(tǒng)來操作。

      現(xiàn)在將參考圖2描述其中根據(jù)本發(fā)明的移動終端100能夠操作的通信系統(tǒng)。

      這樣的通信系統(tǒng)可以使用不同的空中接口和/或物理層。例如,由通信系統(tǒng)使用的空中接口包括例如頻分多址(FDMA)、時分多址(TDMA)、碼分多址(CDMA)和通用移動通信系統(tǒng)(UMTS)(特別地,長期演進(LTE))、全球移動通信系統(tǒng)(GSM)等。作為非限制性示例,下面的描述涉及CDMA通信系統(tǒng),但是這樣的教導(dǎo)同樣適用于其它類型的系統(tǒng)。

      參考圖2,CDMA無線通信系統(tǒng)可以包括多個移動終端100、多個基站(BS)270、基站控制器(BSC)275和移動交換中心(MSC)280。MSC280被構(gòu)造為與公共電話交換網(wǎng)絡(luò)(PSTN)290形成接口。MSC280還被構(gòu)造為與可以經(jīng)由回程線路耦接到基站270的BSC275形成接口?;爻叹€路可以根據(jù)若干己知的接口中的任一種來構(gòu)造,所述接口包括例如E1/T1、ATM、IP、PPP、幀中繼、HDSL、ADSL或xDSL。將理解的是,如圖2中所示的系統(tǒng)可以包括多個

      每個BS270可以服務(wù)一個或多個分區(qū)(或區(qū)域),由多向天線或指向特定方向的天線覆蓋的每個分區(qū)放射狀地遠離BS270?;蛘?,每個分區(qū)可以由用于分集接收的兩個或更多天線覆蓋。每個BS270可以被構(gòu)造為支持多個頻率分配,并且每個頻率分配具有特定頻譜(例如,1.25MHz,5MHz等)。

      分區(qū)與頻率分配的交叉可以被稱為CDMA信道。BS270也可以被稱為基站收發(fā)器子系統(tǒng)(BTS)或者其它等效術(shù)語。在這樣的情況下,術(shù)語“基站”可以用于籠統(tǒng)地表示單個BSC275和至少一個BS270?;疽部梢员环Q為“蜂窩站”。或者,特定BS270的各分區(qū)可以被稱為多個蜂窩站。

      作為無線通信系統(tǒng)的一個典型操作,BS270接收來自各種移動終端100的反向鏈路信號。移動終端100通常參與通話、消息收發(fā)和其它類型的通信。特定BS270接收的每個反向鏈路信號被在特定BS270內(nèi)進行處理。獲得的數(shù)據(jù)被轉(zhuǎn)發(fā)給相關(guān)的BSC275。BSC提供通話資源分配和包括BS270之間的軟切換過程的協(xié)調(diào)的移動管理功能。BSC275還將接收到的數(shù)據(jù)路由到MSC280,其提供用于與PSTN290形成接口的額外的路由服務(wù)。類似地,PSTN290與MSC280形成接口,MSC與BSC275形成接口,并且BSC275相應(yīng)地控制BS270以將正向鏈路信號發(fā)送到移動終端100。

      移動終端中無線通信單元110的移動通信模塊112基于移動終端內(nèi)置的接入移動通信網(wǎng)絡(luò)(如2G/3G/4G等移動通信網(wǎng)絡(luò))的必要數(shù)據(jù)(包括用戶識別信息和鑒權(quán)信息)接入移動通信網(wǎng)絡(luò)為移動終端用戶的網(wǎng)頁瀏覽、網(wǎng)絡(luò)多媒體播放等業(yè)務(wù)傳輸移動通信數(shù)據(jù)(包括上行的移動通信數(shù)據(jù)和下行的移動通信數(shù)據(jù))。

      無線通信單元110的無線互聯(lián)網(wǎng)模塊113通過運行無線熱點的相關(guān)協(xié)議功能而實現(xiàn)無線熱點的功能,無線熱點支持多個移動終端(移動終端之外的任意移動終端)接入,通過復(fù)用移動通信模塊112與移動通信網(wǎng)絡(luò)之間的移動通信連接為移動終端用戶的網(wǎng)頁瀏覽、網(wǎng)絡(luò)多媒體播放等業(yè)務(wù)傳輸移動通信數(shù)據(jù)(包括上行的移動通信數(shù)據(jù)和下行的移動通信數(shù)據(jù)),由于移動終端實質(zhì)上是復(fù)用移動終端與通信網(wǎng)絡(luò)之間的移動通信連接傳輸移動通信數(shù)據(jù)的,因此移動終端消耗的移動通信數(shù)據(jù)的流量由通信網(wǎng)絡(luò)側(cè)的計費實體計入移動終端的通信資費,從而消耗移動終端簽約使用的通信資費中包括的移動通信數(shù)據(jù)的數(shù)據(jù)流量。

      基于上述移動終端100硬件結(jié)構(gòu)以及通信系統(tǒng),提出本發(fā)明方法各個實施例。

      圖3為本發(fā)明實施例一提供的移動終端的組成結(jié)構(gòu)示意圖,如圖3所示,本發(fā)明實施例一提供的移動終端可以包括:接收單元301、提取單元302和轉(zhuǎn)換單元303。結(jié)合上述實現(xiàn)本發(fā)明各個實施例的移動終端100的硬件結(jié)構(gòu)示意圖以及實現(xiàn)本發(fā)明各個實施例的移動終端100的無線通信系統(tǒng)示意圖可知,本發(fā)明實施例提供的移動終端中的接收單元301、提取單元302和轉(zhuǎn)換單元303都可以以程序代碼的形式由移動終端中的處理器執(zhí)行相應(yīng)功能來實現(xiàn);當然也可通過具體的邏輯電路實現(xiàn);在具體實施例的過程中,處理器可以為中央處理器(CPU)、微處理器(MPU)、數(shù)字信號處理器(DSP)或現(xiàn)場可編程門陣列(FPGA)等。

      本發(fā)明實施例一提出的移動終端包括:接收單元301、提取單元302和轉(zhuǎn)換單元303。其中,接收單元301可以接收同時存在的多個人物的語音信息,并將所述語音信息發(fā)送給提取單元302;然后提取單元302在全部語音信息中提取至少N個聲紋特征,并將所述聲紋特征發(fā)送給轉(zhuǎn)換單元303;其中,N為大于等于2的自然數(shù);最后轉(zhuǎn)換單元303可以根據(jù)N個聲紋特征將全部語音信息轉(zhuǎn)換為不同人物對應(yīng)的文本信息。

      接收單元301,用于接收同時存在的多個人物的語音信息,并將所述語音信息發(fā)送給提取單元302。

      在本發(fā)明的具體實施例中,接收單元301可以接收同時存在的多個人物的語音信息,其中,接收單元301可以通過多種方法接收語音信息,既可以通過現(xiàn)場錄制的方法接收語音信息,也可以通過解析已有的語音文件接收語音信息。例如,在會議現(xiàn)場,接收單元301可以對會議討論中的多個人物的語音進行錄制從而接收同時存在的多個人物的語音信息;或者,接收單元301可以通過解析同時存在多個人物語音信息的MP3格式的語音文件從而接收同時存在的多個人物的語音信息。

      提取單元302,用于在全部語音信息中提取至少N個聲紋特征,并將所述聲紋特征發(fā)送給轉(zhuǎn)換單元303。其中,N為大于等于2的自然數(shù)。

      在本發(fā)明的具體實施例中,提取單元302獲得接收單元301發(fā)送的語音信息后,可以在全部語音信息中提取至少N個聲紋特征,其中,N為大于等于2的自然數(shù)。其中,提取單元302可以通過多種方法對全部語音信息中的多個聲紋特征進行提取。進一步的,提取單元302可以采用多個采樣周期在全部語音信息中提取至少N個聲紋特征;或者,提取單元302也可以采用多個采樣頻率在全部語音信息中提取至少N個聲紋特征。

      轉(zhuǎn)換單元303,用于根據(jù)N個聲紋特征將全部語音信息轉(zhuǎn)換為不同人物對應(yīng)的文本信息。

      在本發(fā)明的具體實施例中,轉(zhuǎn)換單元303在接收到提取單元302發(fā)送的N個不同聲紋特征后,分別將N個聲紋特征與預(yù)先存儲的聲紋特征進行匹配,然后根據(jù)匹配結(jié)果將全部語音信息轉(zhuǎn)換為不同人物對應(yīng)的文本信息。其中,預(yù)先存儲的聲紋特征與預(yù)先設(shè)定的人物存在對應(yīng)的關(guān)系,表1為本發(fā)明實施例中預(yù)存聲紋特征與預(yù)設(shè)人物的對應(yīng)關(guān)系表,如表1所示,對于不同的預(yù)先存儲的聲紋特征,都存在相對應(yīng)的預(yù)先設(shè)定的人物。例如,當提取的聲紋特征與預(yù)存聲紋特征1的匹配結(jié)果為匹配成功時,通過查詢預(yù)存聲紋特征與預(yù)設(shè)人物的對應(yīng)關(guān)系表可以確定預(yù)存聲紋特征1與預(yù)設(shè)人物1的對應(yīng)關(guān)系,因此可以確定所述提取的聲紋特征與預(yù)設(shè)人物1相對應(yīng),轉(zhuǎn)換單元303可以將所述提取的聲紋特征轉(zhuǎn)換為與預(yù)設(shè)人物1對應(yīng)的文本信息。

      表1

      圖4為本發(fā)明實施例二提供的移動終端的組成結(jié)構(gòu)示意圖,如圖4所示,轉(zhuǎn)換單元303可以包括:匹配子單元3031和轉(zhuǎn)換子單元3032。

      匹配子單元3031,用于將N個聲紋特征分別與預(yù)先存儲的聲紋特征進行匹配,并將匹配結(jié)果發(fā)送給轉(zhuǎn)換子單元3032。

      在本發(fā)明的具體實施例中,匹配子單元將提取單元302提取的一個聲紋特征與預(yù)先存儲的聲紋特征進行匹配,從而獲得一個提取的聲紋特征與預(yù)先存儲的聲紋特征的匹配結(jié)果,重復(fù)上述操作直到獲得全部語音信息中N個提取的聲紋特征與預(yù)先存儲的聲紋特征的匹配結(jié)果。進一步的,匹配子單元3031可以將N個聲紋特征分別與預(yù)先存儲的多種格式的聲紋特征進行匹配;或者,匹配子單元3031也可以將N個聲紋特征分別與預(yù)先存儲的多個聲道的聲紋特征進行匹配。

      轉(zhuǎn)換子單元3032,用于根據(jù)所述匹配結(jié)果將全部語音信息轉(zhuǎn)換為各個人物對應(yīng)的文本信息。

      在本發(fā)明的具體實施例中,轉(zhuǎn)換子單元3032可以根據(jù)N個提取的聲紋特征與預(yù)先存儲的聲紋特征的匹配結(jié)果將全部語音信息轉(zhuǎn)換為各個人物對應(yīng)的文本信息。進一步的,轉(zhuǎn)換子單元3032可以判斷一個提取的聲紋特征是否與至少一個預(yù)先存儲的聲紋特征匹配成功,如果匹配成功,則可以通過查詢上述表1獲得預(yù)存聲紋信息與預(yù)設(shè)人物的對應(yīng)關(guān)系,從而可以確定所述提取的聲紋信息與預(yù)設(shè)人物的對應(yīng)關(guān)系,并將所述提取的聲紋信息轉(zhuǎn)換為所述預(yù)設(shè)人物對應(yīng)的文本信息。例如,當提取的聲紋特征與預(yù)存聲紋特征2的匹配結(jié)果為匹配成功時,通過查詢預(yù)存聲紋特征與預(yù)設(shè)人物的對應(yīng)關(guān)系表可以確定預(yù)存聲紋特征2與預(yù)設(shè)人物2的對應(yīng)關(guān)系,因此可以確定所述提取的聲紋特征與預(yù)設(shè)人物2相對應(yīng),轉(zhuǎn)換子單元3032可以將所述提取的聲紋特征轉(zhuǎn)換為與預(yù)設(shè)人物2對應(yīng)的文本信息。

      本發(fā)明實施例提供的接收單元301、提取單元302和轉(zhuǎn)換單元303都可以以程序代碼的形式由移動終端中的處理器執(zhí)行相應(yīng)功能來實現(xiàn);當然也可通過具體的邏輯電路實現(xiàn);在具體實施例的過程中,處理器可以為中央處理器(CPU)、微處理器(MPU)、數(shù)字信號處理器(DSP)或現(xiàn)場可編程門陣列(FPGA)等。

      本發(fā)明實施例提出的移動終端,移動終端接收同時存在的多個人物的語音信息后,在全部語音信息中提取至少N個聲紋特征,其中,N為大于等于2的自然數(shù),然后根據(jù)N個聲紋特征將全部語音信息轉(zhuǎn)換為不同人物對應(yīng)的文本信息。也就是說,在本發(fā)明提出的技術(shù)方案中,在同時存在的多個人物的語音時,移動終端能夠?qū)崿F(xiàn)將全部語音信息中的同時存在的多個人物語音轉(zhuǎn)換為各個人物對應(yīng)的文本信息。而不是像現(xiàn)有技術(shù)中,無法將全部語音信息中的同時存在的多個人物語音轉(zhuǎn)換為各個人物對應(yīng)的文本信息。由此可見,和現(xiàn)有技術(shù)相比,本發(fā)明實施例提出的移動終端及語音到文本的轉(zhuǎn)換方法,能夠?qū)崿F(xiàn)將全部語音信息中的同時存在的多個人物語音轉(zhuǎn)換為各個人物對應(yīng)的文本信息,從而可以方便用戶使用,提升用戶體驗;并且,實現(xiàn)起來簡單方便,便于普及,適用范圍更廣。

      圖5為本發(fā)明實施例中語音到文本的轉(zhuǎn)換方法的實現(xiàn)流程示意圖,如圖5所示,語音到文本的轉(zhuǎn)換方法可以包括以下步驟:

      步驟501、接收同時存在的多個人物的語音信息。

      在本發(fā)明的具體實施例中,移動終端可以接收同時存在的多個人物的語音信息,其中,移動終端可以通過多種方法接收語音信息,既可以通過現(xiàn)場錄制的方法接收語音信息,也可以通過解析已有的語音文件接收語音信息。例如,在會議現(xiàn)場,移動終端可以對會議討論中的多個人物的語音進行錄制從而接收同時存在的多個人物的語音信息;或者,移動終端可以通過解析同時存在多個人物語音信息的MP3格式的語音文件從而接收同時存在的多個人物的語音信息。

      步驟502、在全部語音信息中提取至少N個聲紋特征;其中,N為大于等于2的自然數(shù);

      在本發(fā)明的具體實施例中,移動終端在接收同時存在的多個人物的語音信息后,可以在全部語音信息中提取至少N個聲紋特征,其中,N為大于等于2的自然數(shù)。其中,移動終端可以通過多種方法對全部語音信息中的多個聲紋特征進行提取。進一步的,移動終端可以采用多個采樣周期在全部語音信息中提取至少N個聲紋特征;或者,移動終端也可以采用多個采樣頻率在全部語音信息中提取至少N個聲紋特征。

      步驟503、根據(jù)N個聲紋特征將全部語音信息轉(zhuǎn)換為不同人物對應(yīng)的文本信息。

      在本發(fā)明的具體實施例中,移動終端在提取到N個不同聲紋特征后,分別將N個聲紋特征與預(yù)先存儲的聲紋特征進行匹配,然后根據(jù)匹配結(jié)果將全部語音信息轉(zhuǎn)換為不同人物對應(yīng)的文本信息。其中,預(yù)先存儲的聲紋特征與預(yù)先設(shè)定的人物存在對應(yīng)的關(guān)系,如上述表1所示,對于不同的預(yù)先存儲的聲紋特征,都存在相對應(yīng)的預(yù)先設(shè)定的人物。例如,當提取的聲紋特征與預(yù)存聲紋特征1的匹配結(jié)果為匹配成功時,通過查詢預(yù)存聲紋特征與預(yù)設(shè)人物的對應(yīng)關(guān)系表可以確定預(yù)存聲紋特征1與預(yù)設(shè)人物1的對應(yīng)關(guān)系,因此可以確定所述提取的聲紋特征與預(yù)設(shè)人物1相對應(yīng),移動終端可以將所述提取的聲紋特征轉(zhuǎn)換為與預(yù)設(shè)人物1對應(yīng)的文本信息。

      圖6為本發(fā)明實施例中根據(jù)N個聲紋特征將語音轉(zhuǎn)換為文本的實現(xiàn)流程示意圖,如圖6所示,根據(jù)N個聲紋特征將全部語音信息轉(zhuǎn)換為不同人物對應(yīng)的文本信息以下步驟:

      步驟503a、將N個聲紋特征分別與預(yù)先存儲的聲紋特征進行匹配。

      在本發(fā)明的具體實施例中,移動終端將提取的一個聲紋特征與預(yù)先存儲的聲紋特征進行匹配,從而獲得一個提取的聲紋特征與預(yù)先存儲的聲紋特征的匹配結(jié)果,重復(fù)上述操作直到獲得全部語音信息中N個提取的聲紋特征與預(yù)先存儲的聲紋特征的匹配結(jié)果。進一步的,移動終端可以將N個聲紋特征分別與預(yù)先存儲的多種格式的聲紋特征進行匹配;或者,移動終端也可以將N個聲紋特征分別與預(yù)先存儲的多個聲道的聲紋特征進行匹配。

      步驟503b、根據(jù)所述匹配結(jié)果將全部語音信息轉(zhuǎn)換為各個人物對應(yīng)的文本信息。

      在本發(fā)明的具體實施例中,移動終端可以根據(jù)N個提取的聲紋特征與預(yù)先存儲的聲紋特征的匹配結(jié)果將全部語音信息轉(zhuǎn)換為各個人物對應(yīng)的文本信息。進一步的,移動終端可以判斷一個提取的聲紋特征是否與至少一個預(yù)先存儲的聲紋特征匹配成功,如果匹配成功,則可以通過查詢上述表1獲得預(yù)存聲紋信息與預(yù)設(shè)人物的對應(yīng)關(guān)系,從而可以確定所述提取的聲紋信息與預(yù)設(shè)人物的對應(yīng)關(guān)系,并將所述提取的聲紋信息轉(zhuǎn)換為所述預(yù)設(shè)人物對應(yīng)的文本信息。例如,當提取的聲紋特征與預(yù)存聲紋特征2的匹配結(jié)果為匹配成功時,通過查詢預(yù)存聲紋特征與預(yù)設(shè)人物的對應(yīng)關(guān)系表可以確定預(yù)存聲紋特征2與預(yù)設(shè)人物2的對應(yīng)關(guān)系,因此可以確定所述提取的聲紋特征與預(yù)設(shè)人物2相對應(yīng),移動終端可以將所述提取的聲紋特征轉(zhuǎn)換為與預(yù)設(shè)人物2對應(yīng)的文本信息。

      根據(jù)上述的描述可知,通過上述的步驟503a~503b,移動終端在將N個聲紋特征分別與預(yù)先存儲的聲紋特征進行匹配之后,可以根據(jù)匹配結(jié)果將全部語音信息轉(zhuǎn)換為各個人物對應(yīng)的文本信息,從而能夠快速準確地根據(jù)N個聲紋特征將全部語音信息轉(zhuǎn)換為不同人物對應(yīng)的文本信息,方便用戶操作,提升用戶體驗。

      本發(fā)明實施例提出的語音到文本的轉(zhuǎn)換方法,移動終端接收同時存在的多個人物的語音信息后,在全部語音信息中提取至少N個聲紋特征,其中,N為大于等于2的自然數(shù),然后根據(jù)N個聲紋特征將全部語音信息轉(zhuǎn)換為不同人物對應(yīng)的文本信息。也就是說,在本發(fā)明提出的技術(shù)方案中,在同時存在的多個人物的語音時,移動終端能夠?qū)崿F(xiàn)將全部語音信息中的同時存在的多個人物語音轉(zhuǎn)換為各個人物對應(yīng)的文本信息。而不是像現(xiàn)有技術(shù)中,無法將全部語音信息中的同時存在的多個人物語音轉(zhuǎn)換為各個人物對應(yīng)的文本信息。由此可見,和現(xiàn)有技術(shù)相比,本發(fā)明實施例提出的移動終端及語音到文本的轉(zhuǎn)換方法,能夠?qū)崿F(xiàn)將全部語音信息中的同時存在的多個人物語音轉(zhuǎn)換為各個人物對應(yīng)的文本信息,從而可以方便用戶使用,提升用戶體驗;并且,實現(xiàn)起來簡單方便,便于普及,適用范圍更廣。

      應(yīng)理解,說明書通篇中提到的“一個實施例”或“一實施例”意味著與實施例有關(guān)的特定特征、結(jié)構(gòu)或特性包括在本發(fā)明的至少一個實施例中。因此,在整個說明書各處出現(xiàn)的“在一個實施例中”或“在一實施例中”未必一定指相同的實施例。此外,這些特定的特征、結(jié)構(gòu)或特性可以任意適合的方式結(jié)合在一個或多個實施例中。應(yīng)理解,在本發(fā)明的各種實施例中,上述各過程的序號的大小并不意味著執(zhí)行順序的先后,各過程的執(zhí)行順序應(yīng)以其功能和內(nèi)在邏輯確定,而不應(yīng)對本發(fā)明實施例的實施過程構(gòu)成任何限定。上述本發(fā)明實施例序號僅僅為了描述,不代表實施例的優(yōu)劣。

      需要說明的是,在本文中,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者裝置不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者裝置所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括該要素的過程、方法、物品或者裝置中還存在另外的相同要素。

      在本申請所提供的幾個實施例中,應(yīng)該理解到,所揭露的設(shè)備和方法,可以通過其它的方式實現(xiàn)。以上所描述的設(shè)備實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,如:多個單元或組件可以結(jié)合,或可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另外,所顯示或討論的各組成部分相互之間的耦合、或直接耦合、或通信連接可以是通過一些接口,設(shè)備或單元的間接耦合或通信連接,可以是電性的、機械的或其它形式的。

      上述作為分離部件說明的單元可以是、或也可以不是物理上分開的,作為單元顯示的部件可以是、或也可以不是物理單元;既可以位于一個地方,也可以分布到多個網(wǎng)絡(luò)單元上;可以根據(jù)實際的需要選擇其中的部分或全部單元來實現(xiàn)本實施例方案的目的。

      另外,在本發(fā)明各實施例中的各功能單元可以全部集成在一個處理單元中,也可以是各單元分別單獨作為一個單元,也可以兩個或兩個以上單元集成在一個單元中;上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用硬件加軟件功能單元的形式實現(xiàn)。

      本領(lǐng)域普通技術(shù)人員可以理解:實現(xiàn)上述方法實施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成,前述的程序可以存儲于計算機可讀取存儲介質(zhì)中,該程序在執(zhí)行時,執(zhí)行包括上述方法實施例的步驟;而前述的存儲介質(zhì)包括:移動存儲設(shè)備、只讀存儲器(Read Only Memory,ROM)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。

      或者,本發(fā)明上述集成的單元如果以軟件功能模塊的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,也可以存儲在一個計算機可讀取存儲介質(zhì)中。基于這樣的理解,本發(fā)明實施例的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機、服務(wù)器、或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分。而前述的存儲介質(zhì)包括:移動存儲設(shè)備、ROM、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。

      以上所述,僅為本發(fā)明的具體實施方式,但本發(fā)明的保護范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應(yīng)以所述權(quán)利要求的保護范圍為準。

      當前第1頁1 2 3 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1