用于共享調(diào)適語(yǔ)音簡(jiǎn)檔的方法和系統(tǒng)的制作方法
【專利說(shuō)明】用于共享調(diào)適語(yǔ)音簡(jiǎn)檔的方法和系統(tǒng)
[0001] 相關(guān)申請(qǐng)的交叉引用
[0002] 本申請(qǐng)要求于2013年4月29日提交的美國(guó)專利申請(qǐng)第13/872,401號(hào)和于2013 年2月20日提交的美國(guó)臨時(shí)申請(qǐng)第61/767,235號(hào)的優(yōu)先權(quán),通過(guò)引用將其全部公開內(nèi)容 結(jié)合于此。
【背景技術(shù)】
[0003] 諸如個(gè)人計(jì)算機(jī)、膝上型計(jì)算機(jī)、平板計(jì)算機(jī)、蜂窩電話之類的計(jì)算系統(tǒng)以及許多 其他類型的計(jì)算系統(tǒng)在現(xiàn)代生活的許多方面中正越來(lái)越普遍。隨著計(jì)算機(jī)變得日益增多地 與用戶的日常生活結(jié)合,用戶用來(lái)與計(jì)算設(shè)備交互的用戶界面的方便性、高效性和直觀性 變得日益重要。
[0004] 具體來(lái)說(shuō),"云計(jì)算"是指經(jīng)由計(jì)算機(jī)網(wǎng)絡(luò)提供計(jì)算資源。在傳統(tǒng)的計(jì)算模型中, 數(shù)據(jù)和軟件兩者都被完全包含在用戶的計(jì)算機(jī)中。然而,在云計(jì)算中,用戶的計(jì)算機(jī)可包含 相對(duì)較少的軟件或者數(shù)據(jù)(例如,可能最小限度的操作系統(tǒng)和web瀏覽器),并且可用作用 于發(fā)生在計(jì)算機(jī)網(wǎng)絡(luò)上的過(guò)程的顯示終端。為云計(jì)算服務(wù)(或者甚至現(xiàn)有云服務(wù)的聚集) 而提供的常見(jiàn)縮寫是"云"。
[0005] 云計(jì)算被稱為"客戶端-服務(wù)器計(jì)算",然而,在一般的云計(jì)算與客戶端-服務(wù)器計(jì) 算之間可存在區(qū)別。例如,客戶端-服務(wù)器計(jì)算可包括在資源或者服務(wù)的提供者(例如,月艮 務(wù)器)與服務(wù)請(qǐng)求者(例如,客戶端)之間分割任務(wù)或者工作負(fù)載的分布式應(yīng)用結(jié)構(gòu)???戶端-服務(wù)器計(jì)算一般涉及服務(wù)器與客戶端之間的一對(duì)一關(guān)系,而云計(jì)算包括通用客戶端 可訪問(wèn)的通用服務(wù)(例如,可能不要求一對(duì)一關(guān)系或者連接)。因此,云計(jì)算一般包括客戶 端-服務(wù)器計(jì)算,以及額外的服務(wù)和功能。
[0006] 云計(jì)算可通過(guò)在用戶的計(jì)算機(jī)上使用更簡(jiǎn)單硬件、而該計(jì)算機(jī)訪問(wèn)計(jì)算資源的巨 大網(wǎng)絡(luò)(例如,處理器、硬盤等等)來(lái)使用戶免于某些硬件和軟件的安裝和維護(hù)任務(wù)。對(duì)資 源的共享對(duì)于個(gè)人來(lái)說(shuō)可降低成本。因此,任何連接到云的計(jì)算機(jī)可連接到同一個(gè)計(jì)算能 力、應(yīng)用和文件的池。用戶可存儲(chǔ)和訪問(wèn)諸如音樂(lè)、圖片、視頻和書簽之類的個(gè)人文件,或者 玩游戲,或者使用遠(yuǎn)程服務(wù)器上的生產(chǎn)型應(yīng)用而非物理地?cái)y帶諸如DVD或者USB閃存驅(qū)動(dòng) 之類的存儲(chǔ)介質(zhì)。
[0007] 此外,云計(jì)算還可使得用戶能夠與其(一個(gè)或多個(gè))計(jì)算設(shè)備也連接到云的其他 用戶共享個(gè)人文件。作為示例,最初只有一個(gè)用戶可訪問(wèn)特定文件或者文件組。用戶可授 權(quán)(例如,經(jīng)由文件系統(tǒng)許可)另外的用戶或者用戶組以使其有相同的(或者限制的)對(duì) 特定文件或文件組的訪問(wèn)權(quán)限。其他(一個(gè)或多個(gè))用戶則可依據(jù)原始用戶給他們的許可 來(lái)查看、編輯和/或共享該特定文件或者文件組。
【發(fā)明內(nèi)容】
[0008] 在一個(gè)方面中,描述了一種方法。該方法可包括在計(jì)算系統(tǒng)處接收一個(gè)或多 個(gè)話音樣本(speech sample),并且一個(gè)或多個(gè)話音樣本包括多個(gè)口說(shuō)話語(yǔ)(spoken utterance)。該方法還可包括在計(jì)算系統(tǒng)處確定與多個(gè)口說(shuō)話語(yǔ)的語(yǔ)者相關(guān)聯(lián)的語(yǔ)音簡(jiǎn)檔 (voice profile),并且語(yǔ)音簡(jiǎn)檔包括基于針對(duì)一個(gè)或多個(gè)話音樣本的話音模型的個(gè)性化 的語(yǔ)者的調(diào)適語(yǔ)音(adapted voice)。更進(jìn)一步地,該方法可包括在計(jì)算系統(tǒng)處接收與所確 定的語(yǔ)音簡(jiǎn)檔相關(guān)聯(lián)的授權(quán)簡(jiǎn)檔,并且授權(quán)簡(jiǎn)檔包括與一個(gè)或多個(gè)相應(yīng)的用戶相關(guān)聯(lián)的一 個(gè)或多個(gè)用戶標(biāo)識(shí)符。再進(jìn)一步地,該方法可包括,至少部分基于授權(quán)簡(jiǎn)檔,計(jì)算系統(tǒng)向與 一個(gè)或多個(gè)相應(yīng)的用戶相關(guān)聯(lián)的至少一個(gè)計(jì)算設(shè)備提供語(yǔ)音簡(jiǎn)檔。
[0009] 在另一方面中,描述了一種計(jì)算機(jī)可讀介質(zhì),其上存儲(chǔ)有可由計(jì)算系統(tǒng)運(yùn)行以使 得該計(jì)算系統(tǒng)執(zhí)行功能的指令。所述功能可包括接收包括多個(gè)口說(shuō)話語(yǔ)的一個(gè)或多個(gè)話音 樣本。所述功能還可包括確定與多個(gè)口說(shuō)話語(yǔ)的語(yǔ)者相關(guān)聯(lián)的語(yǔ)音簡(jiǎn)檔,并且語(yǔ)音簡(jiǎn)檔包 括基于針對(duì)一個(gè)或多個(gè)話音樣本的話音模型的個(gè)性化的語(yǔ)者的調(diào)適語(yǔ)音。更進(jìn)一步地,所 述功能可包括接收與所確定的語(yǔ)音簡(jiǎn)檔相關(guān)聯(lián)的授權(quán)簡(jiǎn)檔,并且授權(quán)簡(jiǎn)檔包括與一個(gè)或多 個(gè)相應(yīng)的用戶相關(guān)聯(lián)的一個(gè)或多個(gè)用戶標(biāo)識(shí)符。再進(jìn)一步地,所述功能可包括,至少部分基 于授權(quán)簡(jiǎn)檔,向與一個(gè)或多個(gè)相應(yīng)的用戶相關(guān)聯(lián)的至少一個(gè)計(jì)算設(shè)備提供語(yǔ)音簡(jiǎn)檔。
[0010] 在又一個(gè)方面中,描述了一種系統(tǒng)。該系統(tǒng)可包括至少一個(gè)處理器。該系統(tǒng)還可 包括數(shù)據(jù)存儲(chǔ)裝置,該數(shù)據(jù)存儲(chǔ)裝置包括可由至少一個(gè)處理器運(yùn)行以使得系統(tǒng)執(zhí)行功能的 指令。所述功能可包括接收一個(gè)或多個(gè)話音樣本,并且一個(gè)或多個(gè)話音樣本包括多個(gè)口說(shuō) 話語(yǔ)。所述功能還可包括確定與多個(gè)口說(shuō)話語(yǔ)的語(yǔ)者相關(guān)聯(lián)的語(yǔ)音簡(jiǎn)檔,并且語(yǔ)音簡(jiǎn)檔包 括基于針對(duì)一個(gè)或多個(gè)話音樣本的話音模型的個(gè)性化的語(yǔ)者的調(diào)適語(yǔ)音。更進(jìn)一步地,所 述功能可包括接收與所確定的語(yǔ)音簡(jiǎn)檔相關(guān)聯(lián)的授權(quán)簡(jiǎn)檔,并且授權(quán)簡(jiǎn)檔包括與一個(gè)或多 個(gè)相應(yīng)的用戶相關(guān)聯(lián)的一個(gè)或多個(gè)用戶標(biāo)識(shí)符。再進(jìn)一步地,所述功能可包括,至少部分基 于授權(quán)簡(jiǎn)檔,向與一個(gè)或多個(gè)相應(yīng)的用戶相關(guān)聯(lián)的至少一個(gè)計(jì)算設(shè)備提供語(yǔ)音簡(jiǎn)檔。
[0011] 在又一個(gè)方面中,可提供一種系統(tǒng),其包括用于接收一個(gè)或多個(gè)話音樣本的裝置, 并且一個(gè)或多個(gè)話音樣本包括多個(gè)口說(shuō)話語(yǔ)。所述系統(tǒng)還可包括用于確定與多個(gè)口說(shuō)話語(yǔ) 的語(yǔ)者相關(guān)聯(lián)的語(yǔ)音簡(jiǎn)檔的裝置,并且語(yǔ)音簡(jiǎn)檔包括基于針對(duì)一個(gè)或多個(gè)話音樣本的話音 模型的個(gè)性化的語(yǔ)者的調(diào)適語(yǔ)音。更進(jìn)一步地,所述系統(tǒng)可包括用于接收與所確定的語(yǔ)音 簡(jiǎn)檔相關(guān)聯(lián)的授權(quán)簡(jiǎn)檔的裝置,并且授權(quán)簡(jiǎn)檔包括與一個(gè)或多個(gè)相應(yīng)的用戶相關(guān)聯(lián)的一個(gè) 或多個(gè)用戶標(biāo)識(shí)符。再進(jìn)一步地,所述系統(tǒng)可包括,用于至少部分基于授權(quán)簡(jiǎn)檔,向與一個(gè) 或多個(gè)相應(yīng)的用戶相關(guān)聯(lián)的至少一個(gè)計(jì)算設(shè)備提供語(yǔ)音簡(jiǎn)檔的裝置。
[0012] 本領(lǐng)域普通技術(shù)人員通過(guò)閱讀一下酌情參照附圖的詳細(xì)描述將清楚這些和其他 方面、優(yōu)點(diǎn)和替換方案。
【附圖說(shuō)明】
[0013] 圖1圖示了其中可實(shí)現(xiàn)示例方法的基于云的計(jì)算的示例系統(tǒng)。
[0014] 圖2圖示了示例計(jì)算設(shè)備的示意圖。
[0015] 圖3圖示了示例客戶端設(shè)備的示意圖。
[0016] 圖4圖示了示例方法的流程圖。
[0017] 圖5圖示了依照示例方法的示例系統(tǒng)。
[0018] 圖6A-6B圖示了被配置成依照示例方法執(zhí)行功能的示例客戶端設(shè)備。
【具體實(shí)施方式】
[0019] 在下列詳細(xì)描述中,參考形成該詳細(xì)描述的一部分的附圖。在圖中,類似的符號(hào)通 常標(biāo)識(shí)類似的組件,除非上下文另外規(guī)定。在詳細(xì)描述、圖以及權(quán)利要求書中描述的說(shuō)明性 實(shí)施例并不意圖進(jìn)行限制。其他實(shí)施例可被利用,并且其他改變可被作出,而不脫離本文提 出的主題的范圍。將容易理解,如本文一般描述的以及在圖中圖示的本公開的各方面可按 多種不同的配置來(lái)布置、替代、組合、分離和設(shè)計(jì),所有這些在本文中都被明確地設(shè)想到了。
[0020] 特別地,下列詳細(xì)描述可在一些示例中公開可利用云計(jì)算的用于共享調(diào)適語(yǔ)音簡(jiǎn) 檔的系統(tǒng)和方法。在一個(gè)方面中,包括至少一個(gè)計(jì)算設(shè)備和至少一個(gè)客戶端或者移動(dòng)設(shè)備 的系統(tǒng)可被配置成執(zhí)行本文所述的方法。該計(jì)算系統(tǒng)可包括被配置成依照本方法來(lái)執(zhí)行功 能的一個(gè)或多個(gè)基于云的計(jì)算設(shè)備。客戶端或者(一個(gè)或多個(gè))移動(dòng)設(shè)備可包括一個(gè)或多 個(gè)移動(dòng)計(jì)算設(shè)備,諸如智能電話、平板計(jì)算機(jī)、膝上型計(jì)算機(jī)等等。(一個(gè)或多個(gè))客戶端設(shè) 備還可包括一個(gè)或多個(gè)非移動(dòng)計(jì)算設(shè)備。
[0021] 然而,"計(jì)算系統(tǒng)"、"計(jì)算設(shè)備"、"移動(dòng)設(shè)備"和"客戶端設(shè)備"可被配置成執(zhí)行的 功能可額外地或者可替換地由其他設(shè)備執(zhí)行。例如,這樣的設(shè)備可包括被配置成運(yùn)行軟件 應(yīng)用(例如,互聯(lián)網(wǎng)瀏覽器)內(nèi)的具備語(yǔ)音能力的應(yīng)用的臺(tái)式計(jì)算機(jī)。另外,這樣的設(shè)備 可包括可穿戴設(shè)備,諸如手表或眼鏡;機(jī)器人設(shè)備,諸如具有機(jī)電能力的計(jì)算設(shè)備;或者裝 置,諸如電視,其被配置成接收語(yǔ)音輸入(例如,經(jīng)由耦合到設(shè)備/裝置的麥克風(fēng)),產(chǎn)生語(yǔ) 音輸出,和/或運(yùn)行基于語(yǔ)音的應(yīng)用,諸如從文本到語(yǔ)音(text-to_speech,TTS)合成應(yīng)用。
[0022] -般而言,盡管"計(jì)算系統(tǒng)"、"計(jì)算設(shè)備"、"移動(dòng)設(shè)備"和"客戶端設(shè)備"在本文中作 為示例被提及和描述,但是應(yīng)當(dāng)理解,本文所述的系統(tǒng)和方法還可利用包括但不限于前述 計(jì)算設(shè)備的各種類型的計(jì)算設(shè)備來(lái)實(shí)現(xiàn)。例如,如本文所述的"計(jì)算系統(tǒng)"所執(zhí)行的功能可 由一個(gè)計(jì)算設(shè)備或者多個(gè)計(jì)算設(shè)備來(lái)執(zhí)行。另外,如本文所述的"計(jì)算設(shè)備"所執(zhí)行的功能 可額外地或者可替換地由移動(dòng)計(jì)算設(shè)備、服務(wù)器、可穿戴計(jì)算設(shè)備、計(jì)算裝置等等來(lái)執(zhí)行。 作為另一示例,如本文所述的"移動(dòng)設(shè)備"或"客戶端設(shè)備"所執(zhí)行的功能可額外地或者可 替換地由臺(tái)式計(jì)算機(jī)、可穿戴計(jì)算設(shè)備、計(jì)算裝置或者其他計(jì)算設(shè)備,包括移動(dòng)設(shè)備和非移 動(dòng)設(shè)備兩者來(lái)執(zhí)行。另外,本文所述的功能可由本文所述的一個(gè)設(shè)備或者任意設(shè)備的組合 來(lái)執(zhí)行。
[0023] 示例方法可包括接收一個(gè)或多個(gè)話音樣本。話音樣本可表示一個(gè)或多個(gè)口頭輸 入,包括多個(gè)口說(shuō)話語(yǔ)。例如,可提示(例如,通過(guò)移動(dòng)設(shè)備上的應(yīng)用)移動(dòng)設(shè)備的用戶記 錄話音樣本,并且話音樣本可被以本地方式存儲(chǔ)在移動(dòng)設(shè)備中和/或被提供給另外的計(jì)算 設(shè)備,諸如服務(wù)器或者云。額外地,該方法可包括確定語(yǔ)音簡(jiǎn)檔。語(yǔ)音簡(jiǎn)檔可與口說(shuō)話語(yǔ)的 語(yǔ)者相關(guān)聯(lián),諸如與利用其記錄話音樣本的移動(dòng)設(shè)備或者其他設(shè)備的用戶相關(guān)聯(lián)。另外, 語(yǔ)音簡(jiǎn)檔可包括語(yǔ)者的調(diào)適語(yǔ)音。在一些實(shí)例中,話音樣本可由計(jì)算設(shè)備編譯以生成類屬 (generic)話音模型。話音模型然后可通過(guò)計(jì)算設(shè)備或者諸如語(yǔ)者調(diào)適服務(wù)器(speaker adaptation server)那樣的其他設(shè)備個(gè)性化,以便生成語(yǔ)者的調(diào)適語(yǔ)音。話音模型的個(gè)性 化可基于給定語(yǔ)者的語(yǔ)音的獨(dú)有特性(例如,頻率、節(jié)拍、口音等等)。
[0024] 該方法還可包括接收與所確定的語(yǔ)音簡(jiǎn)檔相關(guān)聯(lián)的授權(quán)簡(jiǎn)檔。授權(quán)簡(jiǎn)檔可包括與 一個(gè)或多個(gè)相應(yīng)的用戶相關(guān)聯(lián)的一個(gè)或多個(gè)用戶標(biāo)識(shí)符。例如,所確定的語(yǔ)音簡(jiǎn)檔最初可 與話音樣本的語(yǔ)者(例如,語(yǔ)音簡(jiǎn)檔的"擁有者")相關(guān)聯(lián)。另外,語(yǔ)者/用戶可提供與一個(gè) 或多個(gè)其他用戶相關(guān)聯(lián)的用戶標(biāo)識(shí)符以便授權(quán)一個(gè)或多個(gè)其他用戶訪問(wèn)語(yǔ)音簡(jiǎn)檔(例如, 共享語(yǔ)音簡(jiǎn)檔)。因而,該方法還可包括向與一個(gè)或多個(gè)其他用戶相關(guān)聯(lián)的至少一個(gè)客戶端 設(shè)備提供語(yǔ)音簡(jiǎn)檔。例如,用戶A可創(chuàng)建語(yǔ)音簡(jiǎn)檔,在語(yǔ)音簡(jiǎn)檔的授權(quán)簡(jiǎn)檔中指定用戶B,從 而與用戶B共享語(yǔ)音簡(jiǎn)檔。通過(guò)與用戶B共享語(yǔ)音簡(jiǎn)檔,語(yǔ)音簡(jiǎn)檔可由用戶A的移動(dòng)設(shè)備 或者由另外的計(jì)算設(shè)備(例如,經(jīng)由基于云的計(jì)算系統(tǒng))提供給與用戶B相關(guān)聯(lián)的一個(gè)或 多個(gè)計(jì)算設(shè)備。作為類似的示例,用戶A的語(yǔ)音簡(jiǎn)檔可被存儲(chǔ)在云中,并且只要用戶B被授 權(quán)訪問(wèn)該語(yǔ)音簡(jiǎn)檔,則用戶B就可訪問(wèn)(例如,下載)該語(yǔ)音簡(jiǎn)檔。應(yīng)當(dāng)理解,本文所提及 的"(一個(gè)或多個(gè))客戶端設(shè)備"可包括前述計(jì)算設(shè)備中的一個(gè)或多個(gè),諸如移動(dòng)電話、個(gè)人 計(jì)算機(jī)等等