国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種聲音信息的轉(zhuǎn)換方法、裝置及設(shè)備與流程

      文檔序號(hào):12907178閱讀:532來源:國知局
      一種聲音信息的轉(zhuǎn)換方法、裝置及設(shè)備與流程

      本發(fā)明涉及語音識(shí)別轉(zhuǎn)換領(lǐng)域,尤其涉及一種聲音信息的轉(zhuǎn)換方法、裝置及設(shè)備。



      背景技術(shù):

      隨著電子技術(shù)以及網(wǎng)絡(luò)通訊技術(shù)的進(jìn)步與普及,人們溝通、交流的方式也越來越豐富多樣,從語音通話、短信到即時(shí)通信應(yīng)用的短消息,再到視頻通話、語音消息等,種種新興的通信方式不斷更新迭代。并且,對(duì)于不同的通信方式也有著各自適用的應(yīng)用場(chǎng)景,比如,對(duì)于需要及時(shí)交流的事情,往往需要通過電話或?qū)崟r(shí)的視頻進(jìn)行通信,而對(duì)于普通的問候、聊天等事情,人們則習(xí)慣使用即時(shí)端消息或語音消息。

      在語音消息的場(chǎng)景中,對(duì)于消息發(fā)送者可以省去復(fù)雜、繁瑣的信息錄入步驟,而對(duì)于消息的接收者則與文字消息的查看沒有明顯區(qū)別。但是在有些場(chǎng)合下接收者不方便收聽發(fā)送者的語音信息,從而給接收者查詢消息內(nèi)容帶來不便。在不方便收聽的場(chǎng)合下,接收者可以選擇放棄查詢?cè)撜Z音消息,但若想獲取語音信息,則需要通過其他操作轉(zhuǎn)變消息的查詢方式,比如,通過接入耳機(jī)收聽消息,或者將該語音消息轉(zhuǎn)換成文字消息后再進(jìn)行查詢。而對(duì)于執(zhí)行將語音消息轉(zhuǎn)換成文字消息的操作,則需要接收者逐一選中待轉(zhuǎn)換的語音消息后,再執(zhí)行相應(yīng)的轉(zhuǎn)化操作,其操作繁瑣,嚴(yán)重影響了用戶獲取消息內(nèi)容的使用體驗(yàn)。



      技術(shù)實(shí)現(xiàn)要素:

      有鑒于此,本發(fā)明提供一種聲音信息的轉(zhuǎn)換方法、裝置及設(shè)備,主要目的在于將用戶接收的語音消息有條件地自動(dòng)轉(zhuǎn)換為文字消息。

      為達(dá)到上述目的,本發(fā)明主要提供如下技術(shù)方案:

      一方面,本發(fā)明提供了一種聲音信息的轉(zhuǎn)換方法,應(yīng)用于第一電子設(shè)備,該方法包括:

      接收用戶操作,所述用戶操作用于指示所述第一電子設(shè)備呈現(xiàn)第一消息,所述第一消息的內(nèi)容中包含音頻格式的第一聲音內(nèi)容;

      判斷所述第一消息的呈現(xiàn)方式,獲得判斷結(jié)果;

      若所述判斷結(jié)果為第一判斷結(jié)果,則音頻輸出模塊輸出所述第一聲音內(nèi)容;

      若所述判斷結(jié)果為第二判斷結(jié)果,則將所述第一聲音內(nèi)容轉(zhuǎn)化為非音頻格式,控制圖像顯示模塊輸出所述非音頻格式的所述第一聲音內(nèi)容。

      優(yōu)選的,判斷所述第一消息的呈現(xiàn)方式包括:

      判斷用戶當(dāng)前是否便于處理音頻格式的文件消息。

      優(yōu)選的,所述判斷用戶當(dāng)前是否便于處理音頻格式的文件消息包括:

      獲取日程信息,根據(jù)所述日程信息判斷當(dāng)前時(shí)間是否處于特定時(shí)間段內(nèi)。

      優(yōu)選的,將所述第一聲音內(nèi)容轉(zhuǎn)化為非音頻格式包括:

      當(dāng)所述第一聲音內(nèi)容為語音信息時(shí),識(shí)別所述語音信息;

      利用語音數(shù)據(jù)庫將所述語音信息轉(zhuǎn)換為預(yù)置的文字信息。

      優(yōu)選的,將所述第一聲音內(nèi)容轉(zhuǎn)化為非音頻格式包括:

      當(dāng)所述第一聲音內(nèi)容為擬聲信息時(shí),確定所述擬聲信息的發(fā)聲源;

      將所述擬聲信息轉(zhuǎn)換為文字呈現(xiàn)的發(fā)生源。

      優(yōu)選的,將所述第一聲音內(nèi)容轉(zhuǎn)化為非音頻格式包括:

      當(dāng)所述第一聲音內(nèi)容為音樂時(shí),確定所述音樂對(duì)應(yīng)的標(biāo)識(shí)信息,所述標(biāo)識(shí)信息包括曲目名稱、作者、音樂風(fēng)格的至少之一;

      將所述標(biāo)識(shí)信息轉(zhuǎn)換為文字呈現(xiàn)的標(biāo)識(shí)信息。

      優(yōu)選的,所述控制圖像顯示模塊輸出所述非音頻格式的所述第一聲音內(nèi)容包括:

      顯示所述第一聲音內(nèi)容對(duì)應(yīng)的文字信息,以及標(biāo)記在所述文字信息上的轉(zhuǎn)換標(biāo)簽,所述轉(zhuǎn)換標(biāo)簽用于根據(jù)用戶操作控制音頻輸出模塊輸出所述第一聲音內(nèi)容。

      另一方面,本發(fā)明還提供了一種聲音信息的轉(zhuǎn)換裝置,應(yīng)用于第一電子設(shè)備,該裝置包括:處理器,顯示屏以及聲音輸出模塊;

      其中,所述處理器,用于接收用戶操作,所述用戶操作用于指示所述第一電子設(shè)備呈現(xiàn)第一消息,所述第一消息的內(nèi)容中包含音頻格式的第一聲音內(nèi)容;

      判斷所述第一消息的呈現(xiàn)方式,獲得判斷結(jié)果;

      當(dāng)所述處理器的判斷結(jié)果為第一判斷結(jié)果時(shí),控制所述聲音輸出模塊輸出所述第一聲音內(nèi)容;

      當(dāng)所述處理器的判斷結(jié)果為第二判斷結(jié)果時(shí),將所述第一聲音內(nèi)容轉(zhuǎn)化為非音頻格式,控制所述顯示屏輸出所述非音頻格式的所述第一聲音內(nèi)容。

      優(yōu)選的,所述處理器還用于,判斷用戶當(dāng)前是否便于處理音頻格式的文件消息。

      優(yōu)選的,所述處理器在判斷用戶當(dāng)前是否便于處理音頻格式的文件消息時(shí),還包括:

      獲取日程信息,根據(jù)所述日程信息判斷當(dāng)前時(shí)間是否處于特定時(shí)間段內(nèi)。

      優(yōu)選的,所述處理器將所述第一聲音內(nèi)容轉(zhuǎn)化為非音頻格式包括:

      當(dāng)所述第一聲音內(nèi)容為語音信息時(shí),識(shí)別所述語音信息;

      利用語音數(shù)據(jù)庫將所述語音信息轉(zhuǎn)換為預(yù)置的文字信息。

      優(yōu)選的,所述處理器將所述第一聲音內(nèi)容轉(zhuǎn)化為非音頻格式包括:

      當(dāng)所述第一聲音內(nèi)容為擬聲信息時(shí),確定所述擬聲信息的發(fā)聲源;

      將所述擬聲信息轉(zhuǎn)換為文字呈現(xiàn)的發(fā)生源。

      優(yōu)選的,所述處理器將所述第一聲音內(nèi)容轉(zhuǎn)化為非音頻格式包括:

      當(dāng)所述第一聲音內(nèi)容為音樂時(shí),確定所述音樂對(duì)應(yīng)的標(biāo)識(shí)信息,所述標(biāo)識(shí)信息包括曲目名稱、作者、音樂風(fēng)格的至少之一;

      將所述標(biāo)識(shí)信息轉(zhuǎn)換為文字呈現(xiàn)的標(biāo)識(shí)信息。

      優(yōu)選的,所述處理器控制顯示屏輸出所述非音頻格式的所述第一聲音內(nèi)容包括:

      向所述顯示屏輸出所述第一聲音內(nèi)容對(duì)應(yīng)的文字信息,以及標(biāo)記在所述文字信息上的轉(zhuǎn)換標(biāo)簽,所述轉(zhuǎn)換標(biāo)簽用于根據(jù)用戶操作控制音頻輸出模塊輸出所述第一聲音內(nèi)容,以便所述顯示屏向用戶展示對(duì)應(yīng)的文字信息。

      另一方面,本發(fā)明還提供了一種聲音信息的轉(zhuǎn)換設(shè)備,該設(shè)備中設(shè)置有上述任一的聲音信息的轉(zhuǎn)換裝置。

      依據(jù)上述本發(fā)明所提出的一種聲音信息的轉(zhuǎn)換方法、裝置及設(shè)備,能夠?qū)⒂脩艚邮盏降暮幸纛l信息的消息根據(jù)預(yù)置的轉(zhuǎn)換模式進(jìn)行判斷,將能夠直接輸出聲音的消息通過音頻輸出模塊輸出聲音內(nèi)容,將不能直接輸出聲音的消息則通過顯示屏以文字內(nèi)容展示給用戶,以便用戶在任意場(chǎng)合下都能夠方便、快捷的查詢到該消息的內(nèi)容,避免用戶由于不方便收聽語音信息而錯(cuò)過重要的信息。

      附圖說明

      通過閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:

      圖1示出了本發(fā)明實(shí)施例提出的一種聲音信息的轉(zhuǎn)換方法的流程圖;

      圖2示出了本發(fā)明實(shí)施例提出的另一種聲音信息的轉(zhuǎn)換方法的流程圖;

      圖3示出了本發(fā)明實(shí)施例提出的另一種聲音信息的轉(zhuǎn)換方法的流程圖;

      圖4示出了本發(fā)明實(shí)施例提出的另一種聲音信息的轉(zhuǎn)換方法的流程圖;

      圖5示出了本發(fā)明實(shí)施例提出的語音轉(zhuǎn)換模式設(shè)置界面示意圖;

      圖6示出了本發(fā)明實(shí)施例提出的語音信息轉(zhuǎn)換文字信息的顯示界面示意圖;

      圖7示出了本發(fā)明實(shí)施例提出的一種聲音信息的轉(zhuǎn)換裝置的組成框圖。

      具體實(shí)施方式

      下面將參照附圖更詳細(xì)地描述本發(fā)明的示例性實(shí)施例。雖然附圖中顯示了本發(fā)明的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本發(fā)明而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本發(fā)明,并且能夠?qū)⒈景l(fā)明的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。

      本發(fā)明實(shí)施例提供了一種聲音信息的轉(zhuǎn)換方法,應(yīng)用于第一電子設(shè)備,如圖1所示,該方法是對(duì)音頻信息轉(zhuǎn)換為文字信息在應(yīng)用上的具體優(yōu)化及改進(jìn),使得用戶能夠在需要的場(chǎng)合下實(shí)現(xiàn)將音頻信息自動(dòng)轉(zhuǎn)換為文字信息再進(jìn)行查詢,以便及時(shí)、快速獲取信息內(nèi)容。本方法實(shí)施例的具體步驟包括:

      101、接收用戶操作。

      本發(fā)明實(shí)施例中,用戶為第一電子設(shè)備的使用用戶,當(dāng)?shù)谝浑娮釉O(shè)備接收到包含音頻格式的第一聲音內(nèi)容的第一消息時(shí),第一電子設(shè)備將根據(jù)用戶操作確定是否呈現(xiàn)該第一消息,其中第一電子設(shè)備呈現(xiàn)第一消息的方式可以是通過顯示屏顯示該第一消息,也可以是具體顯示第一消息的內(nèi)容,即通過文字形式展現(xiàn)第一消息中的第一聲音內(nèi)容,還可以是通過音頻輸出模塊以聲音形式直接輸出該第一聲音內(nèi)容。

      在實(shí)際應(yīng)用中,上述的包含音頻格式的第一聲音內(nèi)容的第一消息可以是語音消息,也可以是視頻消息,而第一消息中的第一聲音內(nèi)容則不限定為人的語音,或者是自然界的聲音,如動(dòng)物叫聲、流水聲等,亦或者是音樂等。其中,對(duì)于在即時(shí)通訊軟件的應(yīng)用場(chǎng)景下,比如微信、skype等,第一消息是指用戶接收或發(fā)送的消息,而用戶操作是指打開一個(gè)會(huì)話,進(jìn)入會(huì)話內(nèi)容的呈現(xiàn)界面,或者是如朋友圈、微博、twitte等應(yīng)用中,直接呈現(xiàn)內(nèi)容流的應(yīng)用界面中,即在所打開的會(huì)話頁面中展現(xiàn)第一消息,該第一消息可以是聲音消息,也可以是文字或圖像消息。

      102、判斷第一消息的呈現(xiàn)方式,獲得判斷結(jié)果。

      由于第一電子設(shè)備對(duì)第一消息具有多種的呈現(xiàn)方式,因此,在接收到用戶操作后,第一電子設(shè)備將根據(jù)預(yù)置的判斷規(guī)則確定一種呈現(xiàn)方式。該判斷規(guī)則一般是由用戶預(yù)先設(shè)置的,針對(duì)在具體應(yīng)用場(chǎng)景下使用哪一種呈現(xiàn)方式向用戶展示第一消息。

      在本發(fā)明實(shí)施例中,所得到的判斷結(jié)果包括兩種,當(dāng)為第一判斷結(jié)果時(shí),執(zhí)行步驟103,即控制圖像顯示模塊輸出第一消息標(biāo)識(shí),以使音頻輸出模塊輸出第一聲音內(nèi)容;當(dāng)為第二判斷結(jié)果時(shí),執(zhí)行步驟104,即將第一聲音內(nèi)容轉(zhuǎn)化為非音頻格式,控制圖像顯示模塊輸出該非音頻格式的第一聲音內(nèi)容。

      103、控制圖像顯示模塊輸出第一消息標(biāo)識(shí),以使音頻輸出模塊輸出第一聲音內(nèi)容。

      其中,與本步驟對(duì)應(yīng)的第一判斷結(jié)果是用戶在當(dāng)前應(yīng)用場(chǎng)景下能夠通過聲音的方式讀取該第一消息中的聲音內(nèi)容,具體在應(yīng)用的會(huì)話中,是通過圖像顯示模塊在會(huì)話界面中顯示第一消息標(biāo)識(shí)。針對(duì)該第一消息標(biāo)識(shí),第一電子設(shè)備可以通過用戶點(diǎn)擊操作來播放第一消息中的聲音內(nèi)容,也可以自動(dòng)對(duì)第一消息中的聲音內(nèi)容進(jìn)行播放,輸出聲音。此時(shí),第一電子設(shè)備將通過音頻輸出模塊將第一消息中的第一聲音內(nèi)容以聲音的形式播放給當(dāng)前用戶,對(duì)于播放的具體形式則取決于該第一電子設(shè)備所具有的硬件設(shè)備,比如,當(dāng)?shù)谝浑娮釉O(shè)備中自帶揚(yáng)聲器時(shí),則通過該揚(yáng)聲器進(jìn)行播放,當(dāng)?shù)谝浑娮釉O(shè)備中沒有揚(yáng)聲器,而帶有耳機(jī)接口或者是無線耳機(jī)連接模塊時(shí),則將音頻信息通過用戶的耳機(jī)進(jìn)行播放;當(dāng)?shù)谝浑娮釉O(shè)備同時(shí)具有上述的音頻輸出方式時(shí),在輸出音頻時(shí)則可以根據(jù)用戶自定義的優(yōu)先級(jí)確定一種音頻輸出方式。

      104、將第一聲音內(nèi)容轉(zhuǎn)化為非音頻格式,控制圖像顯示模塊輸出該非音頻格式的第一聲音內(nèi)容。

      與本步驟對(duì)應(yīng)的第二判斷結(jié)果則是用戶在當(dāng)前的應(yīng)用場(chǎng)景下需要通過第一電子設(shè)備的顯示設(shè)備展示第一消息,一般是通過屏幕來顯示該第一消息,而對(duì)于該消息中的第一聲音內(nèi)容則需要通過格式轉(zhuǎn)換將其以非音頻格式的內(nèi)容顯示在屏幕上,其中,非音頻格式的內(nèi)容不限于文字、圖像等信息。

      基于上述的實(shí)施例,在實(shí)際應(yīng)用場(chǎng)景中較多的是應(yīng)用于將第一電子設(shè)備接收到的語音信息轉(zhuǎn)換為文字信息的情況,即上述實(shí)施例中的第一消息為語音消息,對(duì)此,通過下面的處理方式來確定是否將語音信息轉(zhuǎn)換為文字信息,或者是向用戶播放該語音信息,具體如圖2所示,包括:

      201、在接收語音信息時(shí),判斷該語音消息的呈現(xiàn)方式。

      其中,判斷的具體規(guī)則可以抽象為不同的語音轉(zhuǎn)換模式,通過語音轉(zhuǎn)換模式的啟動(dòng)判斷來確定第一消息的具體呈現(xiàn)方式,該語音轉(zhuǎn)換模式可以是由用戶自定義設(shè)置的,用戶可根據(jù)實(shí)際需要,在終端設(shè)備上同時(shí)設(shè)置多個(gè)不同的語音轉(zhuǎn)換模式,用以在不同的應(yīng)用場(chǎng)景中實(shí)現(xiàn)對(duì)所接收的語音信息轉(zhuǎn)換為文字信息。

      本步驟是在接收到語音信息的同時(shí),查詢所設(shè)置的語音轉(zhuǎn)換模式是否啟動(dòng),啟動(dòng)則執(zhí)行步驟202,否則,執(zhí)行步驟203。其中,在判斷語音轉(zhuǎn)換模式是否啟動(dòng)時(shí),主要是根據(jù)在語音轉(zhuǎn)換模式設(shè)置時(shí)所設(shè)置的啟動(dòng)條件,該啟動(dòng)條件與所接收的語音信息中的轉(zhuǎn)換條件信息相對(duì)應(yīng),通過獲取語音信息中的轉(zhuǎn)換條件信息與啟動(dòng)條件進(jìn)行匹配,符合啟動(dòng)條件則啟動(dòng)對(duì)應(yīng)的語音轉(zhuǎn)換模式,反之,則不啟動(dòng)對(duì)應(yīng)的語音轉(zhuǎn)換模式。具體在本發(fā)明實(shí)施例中,所設(shè)置的語音轉(zhuǎn)換模式的啟動(dòng)條件一般為其對(duì)應(yīng)的轉(zhuǎn)換條件信息的一個(gè)浮動(dòng)區(qū)間或變換范圍,或者是特定的多個(gè)轉(zhuǎn)換條件信息的集合,通過獲取所接收聲音信息的轉(zhuǎn)換條件信息,與所對(duì)應(yīng)的語音轉(zhuǎn)換模式的啟動(dòng)條件進(jìn)行匹配,以此來判斷該語音轉(zhuǎn)換模式是否啟動(dòng)。

      對(duì)于該轉(zhuǎn)換條件信息的具體內(nèi)容由語音轉(zhuǎn)換模式確定,不同的語音轉(zhuǎn)換模式將對(duì)應(yīng)于不同的轉(zhuǎn)換條件信息,而該轉(zhuǎn)換條件信息一般為語音信息的相關(guān)屬性信息,例如,可以是語音信息的接收時(shí)間信息,根據(jù)接收的時(shí)間點(diǎn)來確定是否將該語音信息轉(zhuǎn)換為文字信息;或者是語音信息的來源信息,也就是該語音信息的發(fā)送用戶,根據(jù)發(fā)送用戶來確定是否將該語音信息轉(zhuǎn)換為文字信息。可見,該轉(zhuǎn)換條件信息應(yīng)具有能夠區(qū)別于其他語音信息的特征。

      對(duì)于判斷語音轉(zhuǎn)換模式是否啟動(dòng)的過程,由于所設(shè)置的語音轉(zhuǎn)換模式可以為一個(gè),也可以是多個(gè),并且不同的語音轉(zhuǎn)換模式對(duì)應(yīng)于不同的轉(zhuǎn)換條件信息,因此,在設(shè)置有多個(gè)語音轉(zhuǎn)換模式時(shí),一般會(huì)根據(jù)語音信息獲取到多個(gè)轉(zhuǎn)換條件信息,此時(shí),在判斷時(shí),將使用所獲取的轉(zhuǎn)換條件信息逐一的與其所對(duì)應(yīng)的語音轉(zhuǎn)換模式進(jìn)行匹配,一旦存在有匹配成功的轉(zhuǎn)換條件信息時(shí),將不再匹配后續(xù)未匹配的轉(zhuǎn)換條件信息,直接執(zhí)行步驟202。而當(dāng)所有的轉(zhuǎn)換條件信息都未能匹配成功時(shí),則無需對(duì)該語音信息進(jìn)行轉(zhuǎn)換,可直接向用戶提示當(dāng)前存在有待查詢的語音信息,并在設(shè)備中顯示該語音信息以供用戶查詢。例如,用戶設(shè)置有兩個(gè)語音轉(zhuǎn)換模式,一個(gè)為時(shí)間段模式,可應(yīng)用于如會(huì)議、出差等場(chǎng)景下,另一個(gè)是聯(lián)系人群組模式,主要應(yīng)用于用戶自定義設(shè)置部分的重要聯(lián)系,將其發(fā)送的語音主動(dòng)轉(zhuǎn)化為文字的場(chǎng)景下,針對(duì)這兩種不同的模式,時(shí)間段模式所對(duì)應(yīng)的轉(zhuǎn)換條件信息為接收到語音信息時(shí)的時(shí)間信息,而聯(lián)系人群組模式所對(duì)應(yīng)的轉(zhuǎn)換條件信息則為語音信息的發(fā)送者信息,為此,當(dāng)接收到一條語音信息時(shí),將獲取該語音信息對(duì)應(yīng)的時(shí)間信息和發(fā)送者信息,再逐一判斷是否符合啟動(dòng)對(duì)應(yīng)語音轉(zhuǎn)換模式,即判斷該時(shí)間信息是否在時(shí)間段模式所設(shè)置的時(shí)間段內(nèi),或者判斷發(fā)送者信息是否為聯(lián)系人群組模式中所設(shè)置的聯(lián)系人。

      202、若判斷結(jié)果為第二判斷結(jié)果,則將語音信息轉(zhuǎn)換為文字信息,并顯示該文字信息。

      其中,第二判斷結(jié)果為步驟201中的判斷語音轉(zhuǎn)換模式被啟動(dòng),此時(shí),將自動(dòng)將所接收的語音信息轉(zhuǎn)換為文字信息,并控制圖像顯示模塊顯示該文字信息。其中,在執(zhí)行轉(zhuǎn)換操作時(shí),優(yōu)先在本地進(jìn)行轉(zhuǎn)換操作,一般的,將語音轉(zhuǎn)換為文字需要對(duì)語音進(jìn)行識(shí)別,而對(duì)于語音則存在許多不同的種類,如不同國家的語言(中文、英語、法語等),或者不同地區(qū)的方言(普通話、廣東話、四川話等等),不同的語言其發(fā)音也不同,而要加以識(shí)別則需要利用相應(yīng)的語音數(shù)據(jù)庫來實(shí)現(xiàn),而對(duì)于在設(shè)備中安裝的應(yīng)用程序而言其受限于程序自身的大小,以及設(shè)備的存儲(chǔ)、處理資源等因素,只能設(shè)置較為常用的語音數(shù)據(jù)庫在設(shè)備本地。因此,對(duì)于語音的識(shí)別有時(shí)會(huì)出現(xiàn)在本地?zé)o法正確地加以識(shí)別,甚至是無法識(shí)別轉(zhuǎn)換的問題。對(duì)此,在本地?zé)o法進(jìn)行識(shí)別時(shí),本發(fā)明實(shí)施例還可以將該語音信息上傳至服務(wù)器并進(jìn)行識(shí)別轉(zhuǎn)換,將最優(yōu)的轉(zhuǎn)換結(jié)果反饋給該設(shè)備。

      而對(duì)于在本地進(jìn)行轉(zhuǎn)換操作,且本地中還設(shè)置有多個(gè)語音數(shù)據(jù)庫的情況,本發(fā)明實(shí)施例優(yōu)先根據(jù)設(shè)備操作系統(tǒng)的語言選擇語音數(shù)據(jù)庫用以轉(zhuǎn)換操作的語音數(shù)據(jù)庫,例如,當(dāng)智能手機(jī)的操作系統(tǒng)為中文時(shí),則優(yōu)先選擇中文語音數(shù)據(jù)庫,而當(dāng)為英文時(shí),則優(yōu)先選擇英語語音數(shù)據(jù)庫執(zhí)行轉(zhuǎn)換操作。進(jìn)一步的,對(duì)于具有多個(gè)方言語音數(shù)據(jù)庫的,則可以對(duì)不同的語音數(shù)據(jù)庫設(shè)置優(yōu)先級(jí),根據(jù)優(yōu)先級(jí)確定使用的語音數(shù)據(jù)庫,例如,對(duì)于中文的操作系統(tǒng),普通話的語音數(shù)據(jù)庫為高優(yōu)先級(jí),而其他方言的語音數(shù)據(jù)庫為低優(yōu)先級(jí),當(dāng)然,該優(yōu)先級(jí)的設(shè)置可以由用戶自定義設(shè)置,比如該用戶為四川人,其語音信息多為四川話,則可以由該用戶將四川話的語音數(shù)據(jù)庫設(shè)置為高優(yōu)先級(jí)。此外,還可以通過獲取設(shè)備的位置信息來自動(dòng)調(diào)整語音數(shù)據(jù)的優(yōu)先級(jí)設(shè)置。

      最終,由圖像顯示模塊將轉(zhuǎn)換后的文字信息顯示到設(shè)備的顯示屏中,以提示用戶及時(shí)查看,而在顯示該文字信息時(shí),本發(fā)明實(shí)施例則不限定在顯示文字信息的同時(shí)是否一同顯示原始的語音信息。但為了將轉(zhuǎn)換得到的文字信息與其他普通的文字信息加以區(qū)分,可以對(duì)該文字信息加以區(qū)別顯示,對(duì)此本發(fā)明實(shí)施例不限定該區(qū)別顯示的具體方式,既可以是在所顯示的文字信息上標(biāo)注標(biāo)簽,也可以是在一個(gè)新的界面下單獨(dú)顯示轉(zhuǎn)化后的文字信息。

      203、若判斷結(jié)果為第一判斷結(jié)果,則顯示語音信息的標(biāo)識(shí)。

      其中,第一判斷結(jié)果為步驟201中的判斷語音轉(zhuǎn)換模式未被啟動(dòng),此時(shí),不對(duì)所接收的語音信息執(zhí)行轉(zhuǎn)換操作,而是直接顯示該語音信息的標(biāo)識(shí),可以根據(jù)用戶的進(jìn)一步查詢操作利用設(shè)備中的音頻輸出模塊輸出該語音信息,也可以在顯示該標(biāo)識(shí)的同時(shí),直接通過音頻輸出模塊輸出該語音信息的聲音內(nèi)容。

      結(jié)合上述的實(shí)現(xiàn)方式可以看出,本發(fā)明實(shí)施例所采用的聲音信息的轉(zhuǎn)換方法,能夠?qū)⒂脩艚邮盏降暮幸纛l信息的消息根據(jù)預(yù)置的轉(zhuǎn)換模式進(jìn)行判斷,將能夠直接輸出聲音的消息通過音頻輸出模塊輸出聲音內(nèi)容,將不能直接輸出聲音的消息則通過顯示屏以文字內(nèi)容展示給用戶,以便用戶在任意場(chǎng)合下都能夠方便、快捷的查詢到該消息的內(nèi)容,避免用戶由于不方便收聽語音信息而錯(cuò)過重要的信息。特別是在語音信息的應(yīng)用場(chǎng)景下,通過設(shè)置語音信息的語音轉(zhuǎn)換模式來實(shí)現(xiàn)在不同的特定場(chǎng)景下自動(dòng)將語音信息轉(zhuǎn)化為文字信息,并將文字信息進(jìn)行顯示,以方便用戶能夠及時(shí)獲取信息的內(nèi)容。而對(duì)于轉(zhuǎn)換的具體過程,通過對(duì)語音數(shù)據(jù)的優(yōu)化排列也可以更加快速和準(zhǔn)確地將語音信息轉(zhuǎn)換為文字信息,從而提高用戶獲取信息內(nèi)容的準(zhǔn)確性,提升用戶的使用體驗(yàn)。

      為了更加詳細(xì)地說明本發(fā)明提出的一種聲音信息的轉(zhuǎn)換方法,特別是針對(duì)圖1所述實(shí)施例的實(shí)現(xiàn)方式將通過下面的實(shí)施例來具體說明在特殊應(yīng)用場(chǎng)景下使用該方法所能達(dá)到的效果,具體步驟如圖3所示,包括:

      301、接收用戶操作。

      本步驟具體的執(zhí)行過程與步驟101相同,因此,該內(nèi)容在此不再贅述,可參考步驟101的描述。

      302、獲取用戶設(shè)置的日程信息。

      根據(jù)用戶的操作,第一電子設(shè)備要確定出第一消息的播放方式,即通過屏幕展示或者是通過聲音向用戶展示。對(duì)此,第一電子設(shè)備需要判斷用戶當(dāng)前是否便于處理音頻格式的文件消息,其中,是否便于處理的判斷需要根據(jù)用戶預(yù)先設(shè)置的具體條件進(jìn)行判斷,在本發(fā)明實(shí)施例中,用戶通過在日程表中設(shè)置特定時(shí)間段的方式確定用戶當(dāng)前是否便于處理音頻格式的文件消息。

      具體的,用戶在第一電子設(shè)備的日程表中選擇一段時(shí)間段,比如,一天中9點(diǎn)至17點(diǎn),或者是一周的周一至周五等等,通過指定特定的時(shí)間段來定義在這些時(shí)間段內(nèi),用戶是否便于處理音頻格式的文件消息,一般情況下,這些指定的時(shí)間段為用戶不方便處理音頻格式的文件消息的時(shí)間段,因此,在用戶設(shè)置特定時(shí)間段時(shí),同時(shí)會(huì)給這些時(shí)間段標(biāo)記一個(gè)標(biāo)簽,用于確定該時(shí)間段內(nèi)需要將第一消息內(nèi)容轉(zhuǎn)化非音頻格式內(nèi)容,比如,在定義的時(shí)間段9點(diǎn)至11點(diǎn)中加入一個(gè)標(biāo)簽為會(huì)議,標(biāo)記在該時(shí)間段內(nèi)用戶處于開會(huì)中,不便于收聽音頻消息,在比如在定義的時(shí)間段18點(diǎn)至19點(diǎn)中加入一個(gè)標(biāo)簽為開車,標(biāo)記在該時(shí)間段內(nèi)用戶處于外出開車中,也不便于收聽音頻消息。當(dāng)然,該標(biāo)簽是由用戶自定義設(shè)置的,用戶可隨時(shí)進(jìn)行更改或重定義具體內(nèi)容。

      303、根據(jù)日程信息判斷當(dāng)前時(shí)間是否處于特定時(shí)間段內(nèi)。

      根據(jù)步驟302獲取的日程信息,第一電子設(shè)備將根據(jù)接收用戶操作的時(shí)間判斷該時(shí)間是否落在日程表中設(shè)定的特定時(shí)間段內(nèi),若沒有落在特定的時(shí)間段內(nèi),則說明此時(shí)用戶可以接收聲音信息,那么此時(shí)將通過第一電子設(shè)備的揚(yáng)聲器或耳機(jī)直接輸出第一消息中的第一聲音內(nèi)容。而當(dāng)前時(shí)間落在了特定時(shí)間段內(nèi)時(shí),則說明此時(shí)用戶不方便接收聲音信息,此時(shí)需要執(zhí)行步驟304,將第一聲音內(nèi)容進(jìn)行轉(zhuǎn)換操作。

      304、將第一聲音內(nèi)容轉(zhuǎn)化為非音頻格式。

      本步驟中列舉了對(duì)于不同形式的聲音內(nèi)容將轉(zhuǎn)化為文字信息的幾種不同方式,具體為:

      第一種,當(dāng)?shù)谝宦曇魞?nèi)容為擬聲信息時(shí),即第一消息中的第一聲音內(nèi)容是由自然界的物體發(fā)出的聲音,比如動(dòng)物的叫聲,雨水、雷生等自然界的擬聲聲音,此時(shí),設(shè)備將針對(duì)該聲音進(jìn)行識(shí)別,重點(diǎn)匹配出能夠發(fā)出該聲音的物體,即發(fā)聲源,如具體的動(dòng)物名稱等。若存在多個(gè)發(fā)聲源時(shí),則選擇一個(gè)最符合的發(fā)聲源物體,并將該物體的名稱以文字的形式進(jìn)行展示,從而完成將聲音信息轉(zhuǎn)化為文字的目的。

      第二種,當(dāng)?shù)谝宦曇魞?nèi)容為音樂時(shí),此時(shí),設(shè)備將識(shí)別該音樂所對(duì)應(yīng)的曲目名稱、音樂作者、音樂風(fēng)格等標(biāo)識(shí)信息,若能夠識(shí)別出該音樂所對(duì)應(yīng)的標(biāo)識(shí)信息,則將該標(biāo)識(shí)信息以文字信息的形式加以展示,而若無法識(shí)別,則告知用戶該聲音內(nèi)容為一段無法識(shí)別的音樂。

      第三種,當(dāng)?shù)谝宦曇魞?nèi)容為語音信息時(shí),此時(shí)設(shè)備將識(shí)別該語音信息,并利用語音數(shù)據(jù)庫將該語音信息轉(zhuǎn)換為預(yù)置的文字信息,其中,預(yù)置的文字信息可以是根據(jù)設(shè)備中用戶的具體設(shè)置輸出對(duì)應(yīng)的文字,比如,輸出的可以中文或英文,也可以是文字或拼音等等,具體轉(zhuǎn)換的操作可參考上述實(shí)施例的步驟202中的內(nèi)容,而針對(duì)語音信息的轉(zhuǎn)換操作也將通過后面的實(shí)施例進(jìn)行具體說明。

      以上三種情況基本涵蓋了所有音頻信息的形式,而對(duì)于如何區(qū)分以上三種聲音,則可以由用戶設(shè)置的順序逐一對(duì)第一聲音內(nèi)容進(jìn)行匹配,一般的,對(duì)聲音的識(shí)別是通過對(duì)聲音的音域、音頻等指標(biāo)進(jìn)行判斷,人類的語音、自然聲以及音樂都具有不同的聲音特征,據(jù)此,可以先通過這些特征對(duì)第一聲音內(nèi)容進(jìn)行分類,即判斷其所屬的上述類別,在確定后再進(jìn)一步根據(jù)上述的方式進(jìn)行轉(zhuǎn)換,并最終以文字的形式加以呈現(xiàn)。

      305、控制圖像顯示模塊輸出非音頻格式的第一聲音內(nèi)容。

      根據(jù)步驟304所轉(zhuǎn)換得到的文字信息,即非音頻格式的第一聲音內(nèi)容。設(shè)備將該文字信息通過顯示模塊輸出展示。

      在輸出展示該文字信息的同時(shí),該設(shè)備會(huì)在該文字信息上標(biāo)記一個(gè)轉(zhuǎn)換標(biāo)簽,用于說明該文字信息是通過轉(zhuǎn)換操作而得到的,并且,該轉(zhuǎn)換標(biāo)簽還具有跳轉(zhuǎn)連接功能,也就是用戶通過觸發(fā)給轉(zhuǎn)換標(biāo)簽可以將原始的第一聲音內(nèi)容通過設(shè)備的音頻輸出模塊以聲音的形式輸出,該功能的主要目的是當(dāng)用戶在看到轉(zhuǎn)換后的文字信息后,如果沒有看明白或者存在疑問時(shí),可以通過該轉(zhuǎn)換標(biāo)識(shí)直接調(diào)取原始的音頻信息進(jìn)行收聽以確認(rèn)第一消息的內(nèi)容。

      基于以上實(shí)施例的內(nèi)容,本發(fā)明實(shí)施例還具體提供了一種聲音信息的轉(zhuǎn)換方法,用于對(duì)上述圖2所示的方式進(jìn)行具體說明,即在所接收的第一消息為語音信息時(shí),第一電子設(shè)備將根據(jù)用戶設(shè)置的語音轉(zhuǎn)換模式中所確定的判斷條件確定該語音信息的具體呈現(xiàn)方式,具體如圖4所示,其具體步驟為:

      401、確定語音轉(zhuǎn)換模式以及用于判斷該語音轉(zhuǎn)換模式是否啟動(dòng)所對(duì)應(yīng)的轉(zhuǎn)換條件信息。

      其中,轉(zhuǎn)換條件信息是與所接收到的語音信息相關(guān)聯(lián)的信息,即對(duì)于不同的語音信息,所獲取的轉(zhuǎn)換條件信息是不同的,而該轉(zhuǎn)換條件信息則用于判斷是否觸發(fā)將該語音信息轉(zhuǎn)換為文字信息的操作,即判斷是否啟動(dòng)所對(duì)應(yīng)的語音轉(zhuǎn)換模式。也就是說,在設(shè)置有語音轉(zhuǎn)換模式后,對(duì)于所接收到的語音信息將逐一地判斷該語音信息所對(duì)應(yīng)的轉(zhuǎn)換條件信息是否能夠啟動(dòng)對(duì)應(yīng)的語音轉(zhuǎn)換模式。

      在本發(fā)明實(shí)施例中,語音轉(zhuǎn)換模式的設(shè)置是由用戶自定義設(shè)置的。為此,用戶可通過應(yīng)用中提供的設(shè)置界面來定義語音轉(zhuǎn)換模式,如圖3所示,在該設(shè)置界面中,為用戶提供有多種的場(chǎng)景設(shè)置,例如,會(huì)議模式、聯(lián)系人分組模式等,通過用戶的選擇,在確定了應(yīng)用的場(chǎng)景后,該設(shè)置界面將向用戶提供基于所選模式對(duì)應(yīng)的具體啟動(dòng)條件,例如,當(dāng)用戶選擇會(huì)議模式后,用戶將可以進(jìn)一步的確定會(huì)議的具體時(shí)間段,以便在該時(shí)間段內(nèi)將語音信息轉(zhuǎn)換為文字信息,而該時(shí)間段不限定時(shí)間的間隔,也就是說,用戶可以設(shè)置某一日中的一個(gè)或多個(gè)時(shí)間段,也可以設(shè)置多日中的一個(gè)或多個(gè)或多時(shí)間段,具體的,可以通過調(diào)用系統(tǒng)中的日程表,由用戶在日程表中指定具體的會(huì)議時(shí)間,即設(shè)定將語音信息轉(zhuǎn)換為文字信息的轉(zhuǎn)換時(shí)間或轉(zhuǎn)換時(shí)間段;而當(dāng)用戶選擇聯(lián)系人分組模式時(shí),用戶將可以進(jìn)一步的選擇具體的聯(lián)系人,將選中聯(lián)系人所發(fā)送的語音信息轉(zhuǎn)換為文字信息,具體的,可以通過調(diào)用該應(yīng)用中的通訊錄,由于用戶在該通訊錄中選擇至少一個(gè)聯(lián)系人生成轉(zhuǎn)換聯(lián)系人群組。此外,還可以將兩者加以結(jié)合,組成混合模式,在不同的時(shí)間段確定不同的轉(zhuǎn)換聯(lián)系人群組。

      而對(duì)于圖5中所示出的界面,可以是在多個(gè)界面中實(shí)現(xiàn)用戶的操作,即先讓用戶確定模式,在根據(jù)模式確定進(jìn)一步的啟動(dòng)條件。但也可以一同設(shè)置在同一界面中,通過操作權(quán)限的設(shè)置來確定用戶可選擇設(shè)置的部分內(nèi)容。具體方式在本發(fā)明實(shí)施例中不做具體限定。需要說明的是,該設(shè)置需要預(yù)先設(shè)置,在生效后執(zhí)行相應(yīng)的轉(zhuǎn)換操作。并且,該設(shè)置也可以實(shí)時(shí)修改調(diào)整。通過對(duì)語音轉(zhuǎn)換模式的設(shè)置,同時(shí)確定了不同語音轉(zhuǎn)換模式所對(duì)應(yīng)的轉(zhuǎn)換條件信息,如此,在后續(xù)執(zhí)行接收到語音信息時(shí),系統(tǒng)就可以根據(jù)所設(shè)置的語音轉(zhuǎn)換模式來獲取該語音信息所關(guān)聯(lián)的轉(zhuǎn)換條件信息。

      402、根據(jù)所接收的語音信息以及用戶的操作提取對(duì)應(yīng)的轉(zhuǎn)換條件信息。

      根據(jù)步驟401中的具體設(shè)置,當(dāng)接收到語音信息,同時(shí),接收到用戶在第一電子設(shè)備上選擇查看該語音信息的操作時(shí),將根據(jù)所設(shè)置的具體內(nèi)容獲取該語音信息相關(guān)聯(lián)轉(zhuǎn)換條件信息,例如,對(duì)應(yīng)上述步驟中的例子,當(dāng)設(shè)置的為會(huì)議模式時(shí),將獲取接收到語音信息的時(shí)間信息作為轉(zhuǎn)換條件信息;而當(dāng)設(shè)置的為聯(lián)系人分組模式時(shí),將獲取語音信息的發(fā)送來源,即發(fā)送聯(lián)系人,將該聯(lián)系人信息作為轉(zhuǎn)換條件信息;而當(dāng)設(shè)置的為混合模式時(shí),則需要獲取該語音信息對(duì)應(yīng)的接收時(shí)間信息和發(fā)送聯(lián)系人信息,將兩者結(jié)合生成對(duì)應(yīng)的轉(zhuǎn)換條件信息。

      403、利用轉(zhuǎn)換條件信息判斷語音轉(zhuǎn)換模式是否啟動(dòng)。

      本步驟是將步驟402中獲取的轉(zhuǎn)換條件信息與步驟401中用戶設(shè)置的語音轉(zhuǎn)換模式中的啟動(dòng)條件進(jìn)行匹配,判斷轉(zhuǎn)換條件信息是否符合語音轉(zhuǎn)換模式中的啟動(dòng)條件,若符合,則執(zhí)行步驟404,若不符合,則執(zhí)行步驟405。對(duì)應(yīng)本發(fā)明實(shí)施例中上述步驟中的例子,當(dāng)設(shè)置的為會(huì)議模式時(shí),在所提取的語音接收時(shí)間信息中提取時(shí)間點(diǎn),再判斷該時(shí)間點(diǎn)是否落在設(shè)置的會(huì)議時(shí)間段中,若在,則確定該語音信息需要進(jìn)行轉(zhuǎn)換,即會(huì)議模式已啟動(dòng),反之則不對(duì)該語音信息進(jìn)行轉(zhuǎn)換處理;當(dāng)設(shè)置的為聯(lián)系人分組模式時(shí),則提取該語音信息的聯(lián)系人信息的聯(lián)系人,再判斷該聯(lián)系人是否在所設(shè)置的聯(lián)系人群組中,若在,則確定該語音信息需要進(jìn)行轉(zhuǎn)換,反之則不對(duì)該語音信息進(jìn)行轉(zhuǎn)換處理;而當(dāng)設(shè)置的為混合模式時(shí),則需要提取該語音信息中的接收時(shí)間點(diǎn)和發(fā)送聯(lián)系人,先判斷接火速時(shí)間點(diǎn)是否落在了設(shè)置的時(shí)間段中,若在則進(jìn)一步判斷發(fā)送聯(lián)系人是否為該時(shí)間段中所設(shè)置的聯(lián)系人群組中的聯(lián)系人,若是,則確定該語音信息需要進(jìn)行轉(zhuǎn)換,否則將不對(duì)該語音信息進(jìn)行轉(zhuǎn)換處理。

      對(duì)于設(shè)置有多種模式的情況,則逐一判斷各個(gè)轉(zhuǎn)換條件信息,若存在符合對(duì)應(yīng)的語音轉(zhuǎn)換模式時(shí),就將該語音信息轉(zhuǎn)換為文字信息。

      404、若語音轉(zhuǎn)換模式啟動(dòng),則將語音信息轉(zhuǎn)換為文字信息,并顯示該文字信息。

      根據(jù)步驟403的判斷,當(dāng)轉(zhuǎn)換條件信息與語音轉(zhuǎn)換模式相匹配時(shí),將執(zhí)行對(duì)該聲音信息的轉(zhuǎn)換操作,本發(fā)明實(shí)施例中對(duì)于將語音信息轉(zhuǎn)換為文字信息的具體步驟不做具體限定,具體可參考上述實(shí)施例中在步驟203中的實(shí)施方式。

      而對(duì)于顯示轉(zhuǎn)換得到的文字信息時(shí),本發(fā)明實(shí)施例中提供兩種不同的顯示方式:

      一種是同時(shí)顯示語音信息與轉(zhuǎn)換后對(duì)應(yīng)的文字信息,即在完成對(duì)聲音信息的轉(zhuǎn)換后,同時(shí)顯示語音信息與轉(zhuǎn)換后的文字信息,并在這兩個(gè)信息中標(biāo)記相互轉(zhuǎn)換的標(biāo)識(shí)信息,或者是將兩個(gè)信息綁定為一組信息,如圖6中所示的顯示方式,其中,a中是在界面中對(duì)語音信息與文字信息標(biāo)注標(biāo)識(shí)信息,b中是將語音信息與文字信息綁定為一組信息在單獨(dú)界面中顯示。從而在用戶查看消息時(shí),能夠清楚的區(qū)分出哪些文字信息是經(jīng)過轉(zhuǎn)換操作得到的,并且還可以快速識(shí)別出轉(zhuǎn)換后的文字信息所對(duì)應(yīng)的語音信息是哪一條,以便于在轉(zhuǎn)換的文字信息轉(zhuǎn)換不準(zhǔn)確時(shí),用戶能夠快速找到對(duì)應(yīng)的原始語音信息進(jìn)行查詢。

      另一種是僅顯示轉(zhuǎn)換后的文字信息,同樣,為了與其他普通的文字信息加以區(qū)別,還可以在轉(zhuǎn)換后的文字信息上標(biāo)注其由語音信息轉(zhuǎn)換而來的標(biāo)識(shí)信息。進(jìn)一步的,由于不顯示原始的語音信息,若用戶在查看轉(zhuǎn)換后的文字信息后還需要再次查詢?cè)嫉恼Z音信息時(shí),可以在所顯示的文字信息上設(shè)置顯示該文字信息對(duì)應(yīng)語音信息的標(biāo)簽,該標(biāo)簽具有觸發(fā)操作的功能,可以通過觸發(fā)該標(biāo)簽實(shí)現(xiàn)顯示該文字信息對(duì)應(yīng)的語音信息,也可以獎(jiǎng)該標(biāo)簽與文字信息自身進(jìn)行合并,使得用戶通過觸發(fā)該文字信息就可以進(jìn)一步地顯示該文字信息所對(duì)應(yīng)的原始語音信息,也就是說,在該顯示方式下,文字信息或者標(biāo)記在轉(zhuǎn)換后的文字信息上的標(biāo)簽被設(shè)置為顯示原始語音信息的觸發(fā)條件,使得用戶在看到轉(zhuǎn)換后的文字信息時(shí)無需再查找對(duì)應(yīng)的語音信息,僅需要一步操作便可實(shí)現(xiàn)對(duì)原始語音信息的調(diào)取查詢,這樣不僅提高了用戶使用的便捷性,更提升了應(yīng)用于用戶操作的互動(dòng)性,大幅提高的應(yīng)用的操作體驗(yàn)。

      405、若語音轉(zhuǎn)換模式未啟動(dòng),則顯示語音信息。

      本步驟在語音轉(zhuǎn)換模式未啟動(dòng),而直接顯示了接收的語音信息之后,設(shè)備還能夠根據(jù)用戶針對(duì)該語音信息的操作,將該語音信息轉(zhuǎn)換為文字信息,而用戶的操作就是將語音信息轉(zhuǎn)換為文字信息的觸發(fā)指令。而對(duì)于該觸發(fā)指令也不限定是在該語音信息的具體狀態(tài),即用戶是否已經(jīng)查詢過該語音信息,或者是未查詢?cè)撜Z音信息。

      通過本發(fā)明實(shí)施例中的實(shí)現(xiàn)方式,用戶可以通過設(shè)置界面針對(duì)不同的應(yīng)用場(chǎng)景設(shè)置多種不同的語音轉(zhuǎn)換模式,并且根據(jù)所接收到的語音信息中對(duì)應(yīng)的轉(zhuǎn)換條件信息判斷是否存在啟動(dòng)的語音轉(zhuǎn)換模式,使得用戶在不方便收聽語音信息的場(chǎng)景下能夠直接獲取該語音信息轉(zhuǎn)換后的文字信息,并且在顯示轉(zhuǎn)換后的文字信息時(shí),也提供了多種的顯示方式供用戶選擇,以使得用戶能夠根據(jù)自身的喜好或閱讀方式選擇適合的顯示方式,提升用戶的使用體驗(yàn)。對(duì)于不在語音轉(zhuǎn)換模式范圍內(nèi)的語音信息,同樣向用戶提供了將其轉(zhuǎn)換為文字信息的實(shí)現(xiàn)方式,這對(duì)于不習(xí)慣收聽或無法收聽語音信息的用戶則提供了以文字信息的查詢方式,提供了更多的信息查詢途徑。

      進(jìn)一步的,作為對(duì)上述方法的實(shí)現(xiàn),本發(fā)明實(shí)施例提供了一種聲音信息的轉(zhuǎn)換裝置,該裝置實(shí)施例與前述方法實(shí)施例對(duì)應(yīng),為便于閱讀,本裝置實(shí)施例不再對(duì)前述方法實(shí)施例中的細(xì)節(jié)內(nèi)容進(jìn)行逐一贅述,但應(yīng)當(dāng)明確,本實(shí)施例中的裝置能夠?qū)?yīng)實(shí)現(xiàn)前述方法實(shí)施例中的全部內(nèi)容。該裝置用于智能設(shè)備中,具體如圖7所示,該裝置包括:處理器51,顯示屏52以及聲音輸出模塊53,所述聲音輸出模塊包括揚(yáng)聲器531以及耳機(jī)接口532;

      其中,所述處理器51,用于接收用戶操作,所述用戶操作用于指示所述第一電子設(shè)備呈現(xiàn)第一消息,所述第一消息的內(nèi)容中包含音頻格式的第一聲音內(nèi)容;

      判斷所述第一消息的呈現(xiàn)方式,獲得判斷結(jié)果;

      當(dāng)所述處理器51的判斷結(jié)果為第一判斷結(jié)果時(shí),控制所述聲音輸出模塊53輸出所述第一聲音內(nèi)容;

      當(dāng)所述處理器51的判斷結(jié)果為第二判斷結(jié)果時(shí),將所述第一聲音內(nèi)容轉(zhuǎn)化為非音頻格式,控制所述顯示屏52輸出所述非音頻格式的所述第一聲音內(nèi)容。

      進(jìn)一步的,所述處理器51還用于,判斷用戶當(dāng)前是否便于處理音頻格式的文件消息。

      進(jìn)一步的,所述處理器51在判斷用戶當(dāng)前是否便于處理音頻格式的文件消息時(shí),還包括:

      獲取日程信息,根據(jù)所述日程信息判斷當(dāng)前時(shí)間是否處于特定時(shí)間段內(nèi)。

      進(jìn)一步的,所述處理器51將所述第一聲音內(nèi)容轉(zhuǎn)化為非音頻格式包括:

      當(dāng)所述第一聲音內(nèi)容為語音信息時(shí),識(shí)別所述語音信息;

      利用語音數(shù)據(jù)庫將所述語音信息轉(zhuǎn)換為預(yù)置的文字信息。

      進(jìn)一步的,所述處理器51將所述第一聲音內(nèi)容轉(zhuǎn)化為非音頻格式包括:

      當(dāng)所述第一聲音內(nèi)容為擬聲信息時(shí),確定所述擬聲信息的發(fā)聲源;

      將所述擬聲信息轉(zhuǎn)換為文字呈現(xiàn)的發(fā)生源。

      進(jìn)一步的,所述處理器51將所述第一聲音內(nèi)容轉(zhuǎn)化為非音頻格式包括:

      當(dāng)所述第一聲音內(nèi)容為音樂時(shí),確定所述音樂對(duì)應(yīng)的標(biāo)識(shí)信息,所述標(biāo)識(shí)信息包括曲目名稱、作者、音樂風(fēng)格;

      將所述標(biāo)識(shí)信息轉(zhuǎn)換為文字呈現(xiàn)的標(biāo)識(shí)信息。

      進(jìn)一步的,所述處理器51控制顯示屏輸出所述非音頻格式的所述第一聲音內(nèi)容包括:

      向所述顯示屏52輸出所述第一聲音內(nèi)容對(duì)應(yīng)的文字信息,以及標(biāo)記在所述文字信息上的轉(zhuǎn)換標(biāo)簽,所述轉(zhuǎn)換標(biāo)簽用于根據(jù)用戶操作控制音頻輸出模塊輸出所述第一聲音內(nèi)容,以便所述顯示屏向用戶展示對(duì)應(yīng)的文字信息。

      進(jìn)一步的,本發(fā)明實(shí)施例提供了一種聲音信息的轉(zhuǎn)換設(shè)備,該設(shè)備中設(shè)置有上述的聲音信息的轉(zhuǎn)換裝置,其包括但不限于智能手機(jī)、pad等。

      綜上所述,本發(fā)明實(shí)施例所采用的聲音信息的轉(zhuǎn)換方法、裝置及設(shè)備,是在用戶根據(jù)應(yīng)用場(chǎng)景的需要設(shè)置的多種不同的語音轉(zhuǎn)換模式下,獲取所接收的語音信息中與語音轉(zhuǎn)換模式相對(duì)應(yīng)的轉(zhuǎn)換條件信息,當(dāng)通過該轉(zhuǎn)換條件信息確定語音轉(zhuǎn)換模式啟動(dòng)時(shí)自動(dòng)執(zhí)行聲音信息的轉(zhuǎn)換操作,得到對(duì)應(yīng)的文字信息,使得用戶在不方便收聽語音信息時(shí)可以及時(shí)、快速地查看該語音信息中的內(nèi)容,提升了用戶使用語音信息轉(zhuǎn)換功能的便捷性。并且對(duì)于轉(zhuǎn)換后的文字信息在設(shè)備上的具體顯示,本發(fā)明實(shí)施例也通過多種具體的顯示方式實(shí)現(xiàn)了用戶在查看消息時(shí)可以方便、清楚的查詢到轉(zhuǎn)換后的文字信息以及對(duì)應(yīng)的原始語音信息,進(jìn)一步的簡化用戶查詢語音信息的操作步驟,提升用戶操作的使用體驗(yàn)。此外,對(duì)語音信息進(jìn)行轉(zhuǎn)化時(shí),通過采用本地轉(zhuǎn)換或服務(wù)器轉(zhuǎn)換的方式還進(jìn)一步的提高了語音信息轉(zhuǎn)化為文字信息的準(zhǔn)確率,而對(duì)于不在語音轉(zhuǎn)換模式范圍內(nèi)的語音信息,也向用戶提供了轉(zhuǎn)換為文字信息的實(shí)現(xiàn)方式,使得用戶可以通過更多途徑查詢語音信息。

      所述聲音信息的轉(zhuǎn)換裝置包括處理器和存儲(chǔ)器,由處理器執(zhí)行存儲(chǔ)在存儲(chǔ)器中的上述程序單元來實(shí)現(xiàn)相應(yīng)的功能。

      處理器中包含內(nèi)核,由內(nèi)核去存儲(chǔ)器中調(diào)取相應(yīng)的程序單元。內(nèi)核可以設(shè)置一個(gè)或以上,通過調(diào)整內(nèi)核參數(shù)來實(shí)現(xiàn)將用戶接收的語音消息在符合預(yù)置的條件下自動(dòng)的轉(zhuǎn)換為文字消息。

      存儲(chǔ)器可能包括計(jì)算機(jī)可讀介質(zhì)中的非永久性存儲(chǔ)器,隨機(jī)存取存儲(chǔ)器(ram)和/或非易失性內(nèi)存等形式,如只讀存儲(chǔ)器(rom)或閃存(flashram),存儲(chǔ)器包括至少一個(gè)存儲(chǔ)芯片。

      本申請(qǐng)還提供了一種計(jì)算機(jī)程序產(chǎn)品,當(dāng)在數(shù)據(jù)處理設(shè)備上執(zhí)行時(shí),適于執(zhí)行初始化有如下方法步驟的程序代碼:接收用戶操作,所述用戶操作用于指示所述第一電子設(shè)備呈現(xiàn)第一消息,所述第一消息的內(nèi)容中包含音頻格式的第一聲音內(nèi)容;判斷所述第一消息的呈現(xiàn)方式,獲得判斷結(jié)果;若所述判斷結(jié)果為第一判斷結(jié)果,則控制圖像顯示模塊輸出第一消息標(biāo)識(shí),以使音頻輸出模塊輸出所述第一聲音內(nèi)容;若所述判斷結(jié)果為第二判斷結(jié)果,則將所述第一聲音內(nèi)容轉(zhuǎn)化為非音頻格式,控制圖像顯示模塊輸出所述非音頻格式的所述第一聲音內(nèi)容。

      本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本申請(qǐng)的實(shí)施例可提供為方法、系統(tǒng)、或計(jì)算機(jī)程序產(chǎn)品。因此,本申請(qǐng)可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本申請(qǐng)可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器、cd-rom、光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。

      本申請(qǐng)是參照根據(jù)本申請(qǐng)實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合。可提供這些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。

      這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。

      這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。

      在一個(gè)典型的配置中,計(jì)算設(shè)備包括一個(gè)或多個(gè)處理器(cpu)、輸入/輸出接口、網(wǎng)絡(luò)接口和內(nèi)存。

      存儲(chǔ)器可能包括計(jì)算機(jī)可讀介質(zhì)中的非永久性存儲(chǔ)器,隨機(jī)存取存儲(chǔ)器(ram)和/或非易失性內(nèi)存等形式,如只讀存儲(chǔ)器(rom)或閃存(flashram)。存儲(chǔ)器是計(jì)算機(jī)可讀介質(zhì)的示例。

      計(jì)算機(jī)可讀介質(zhì)包括永久性和非永久性、可移動(dòng)和非可移動(dòng)媒體可以由任何方法或技術(shù)來實(shí)現(xiàn)信息存儲(chǔ)。信息可以是計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序的模塊或其他數(shù)據(jù)。計(jì)算機(jī)的存儲(chǔ)介質(zhì)的例子包括,但不限于相變內(nèi)存(pram)、靜態(tài)隨機(jī)存取存儲(chǔ)器(sram)、動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(dram)、其他類型的隨機(jī)存取存儲(chǔ)器(ram)、只讀存儲(chǔ)器(rom)、電可擦除可編程只讀存儲(chǔ)器(eeprom)、快閃記憶體或其他內(nèi)存技術(shù)、只讀光盤只讀存儲(chǔ)器(cd-rom)、數(shù)字多功能光盤(dvd)或其他光學(xué)存儲(chǔ)、磁盒式磁帶,磁帶磁磁盤存儲(chǔ)或其他磁性存儲(chǔ)設(shè)備或任何其他非傳輸介質(zhì),可用于存儲(chǔ)可以被計(jì)算設(shè)備訪問的信息。按照本文中的界定,計(jì)算機(jī)可讀介質(zhì)不包括暫存電腦可讀媒體(transitorymedia),如調(diào)制的數(shù)據(jù)信號(hào)和載波。

      還需要說明的是,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、商品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、商品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個(gè)……”限定的要素,并不排除在包括要素的過程、方法、商品或者設(shè)備中還存在另外的相同要素。

      本領(lǐng)域技術(shù)人員應(yīng)明白,本申請(qǐng)的實(shí)施例可提供為方法、系統(tǒng)或計(jì)算機(jī)程序產(chǎn)品。因此,本申請(qǐng)可采用完全硬件實(shí)施例、完全軟件實(shí)施例或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本申請(qǐng)可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器、cd-rom、光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。

      以上僅為本申請(qǐng)的實(shí)施例而已,并不用于限制本申請(qǐng)。對(duì)于本領(lǐng)域技術(shù)人員來說,本申請(qǐng)可以有各種更改和變化。凡在本申請(qǐng)的精神和原理之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本申請(qǐng)的權(quán)利要求范圍之內(nèi)。

      當(dāng)前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1