音頻處理方法及裝置的制造方法
【專利摘要】本發(fā)明是關(guān)于一種音頻處理方法及裝置,其中,所述方法包括:接收用戶對終端設(shè)備輸入的語音信息;根據(jù)接收到的所述語音信息確定所述用戶與所述終端設(shè)備之間的當(dāng)前距離;根據(jù)所述當(dāng)前距離確定對應(yīng)的混響參數(shù);當(dāng)所述終端設(shè)備的TTS播放引擎播放與所述語音信息對應(yīng)的TTS音頻文件時,使用所述混響參數(shù)對所述TTS音頻文件進行混響效果處理。通過該技術(shù)方案,接收用戶對終端設(shè)備輸入的語音信息,并根據(jù)該語音信息確定用戶與終端設(shè)備之間的距離,從而根據(jù)該距離確定對應(yīng)的混響參數(shù),通過確定的混響參數(shù)對根據(jù)語音信息反饋的TTS音頻文件進行處理,從而使得播放的TTS文件具有最有的播放效果,提升TTS的收聽體驗。
【專利說明】
音頻處理方法及裝置
技術(shù)領(lǐng)域
[0001 ]本發(fā)明設(shè)及音頻處理技術(shù)領(lǐng)域,尤其設(shè)及一種音頻處理方法及裝置。
【背景技術(shù)】
[0002] TTS是Text To Speech的縮寫,即"從文本到語音",是人機對話的一部分,讓機器 能夠說話。
[0003] 它是同時運用語言學(xué)和屯、理學(xué)的杰出之作,在內(nèi)置忍片的支持之下,通過神經(jīng)網(wǎng) 絡(luò)的設(shè)計,把文字智能地轉(zhuǎn)化為自然語音流。TTS技術(shù)對文本文件進行實時轉(zhuǎn)換,轉(zhuǎn)換時間 之短可W秒計算。在其特有智能語音控制器作用下,文本輸出的語音音律流楊,使得聽者在 聽取信息時感覺自然,毫無機器語音輸出的冷漠與生澀感。TTS語音合成技術(shù)即將覆蓋國標(biāo) 一、二級漢字,具有英文接口,自動識別中、英文,支持中英文混讀。所有聲音采用真人普通 話為標(biāo)準(zhǔn)發(fā)音,實現(xiàn)了 120-150個漢字/秒的快速語音合成,朗讀速度達3-4個漢字/秒,使用 戶可W聽到清晰悅耳的音質(zhì)和連貫流楊的語調(diào)。
[0004] TTS是語音合成應(yīng)用的一種,它將儲存于電腦中的文件,如幫助文件或者網(wǎng)頁,轉(zhuǎn) 換成自然語音輸出。TTS不僅能幫助有視覺障礙的人閱讀計算機上的信息,更能增加文本文 檔的可讀性?,F(xiàn)在的TTS應(yīng)用包括語音驅(qū)動的郵件W及聲音敏感系統(tǒng),并常與聲音識別程序 一起使用。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明實施例提供一種音頻處理方法及裝置,用W實現(xiàn)優(yōu)化TTS的播放效果,提升 TTS的收聽體驗。
[0006] 根據(jù)本發(fā)明實施例的第一方面,提供一種音頻處理方法,包括:
[0007] 接收用戶對終端設(shè)備輸入的語音信息;
[000引根據(jù)接收到的所述語音信息確定所述用戶與所述終端設(shè)備之間的當(dāng)前距離;
[0009] 根據(jù)所述當(dāng)前距離確定對應(yīng)的混響參數(shù);
[0010] 當(dāng)所述終端設(shè)備的TTS播放引擎播放與所述語音信息對應(yīng)的TTS音頻文件時,使用 所述混響參數(shù)對所述TTS音頻文件進行混響效果處理。
[0011] 在該實施例中,接收用戶對終端設(shè)備輸入的語音信息,并根據(jù)該語音信息確定用 戶與終端設(shè)備之間的距離,從而根據(jù)該距離確定對應(yīng)的混響參數(shù),通過確定的混響參數(shù)對 根據(jù)語音信息反饋的TTS音頻文件進行處理,從而使得播放的TTS文件具有最有的播放效 果,提升TTS的收聽體驗。
[0012] 在一個實施例中,所述混響參數(shù)至少包括空間面積。
[001引在該實施例中,混響參數(shù)可W包括空間面積,空間面積的大小決定了混響效果的 大小,例如,用戶在室內(nèi)和用戶在山谷里,那么混響效果是截然不同的。而用戶與終端設(shè)備 之間的距離和混響參數(shù)之間可W成正比關(guān)系,如用戶與終端設(shè)備之間的距離越近,則混響 參數(shù)可W越小,即空間面積越小,從而使得語音信息的TTS反饋音包含較小的混響效果,反 之,用戶與終端設(shè)備之間的距離越遠,則混響參數(shù)可W越大,即空間面積越大,從而使得語 音信息的TTS反饋音包含較大的混響效果。
[0014] 在一個實施例中,所述使用所述混響參數(shù)對所述TTS音頻文件進行混響效果處理, 包括:
[0015] 當(dāng)所述TTS播放引擎播放所述TTS音頻文件時,實時獲取當(dāng)前播放的音頻流;
[0016] 使用所述混響參數(shù)對所述當(dāng)前播放的音頻流進行混響效果處理,W得到混響處理 后的首頻流。
[0017] 在該實施例中,在使用混響參數(shù)對TTS音頻文件進行混響效果處理時,可W采用如 下處理方式:在TTS播放引擎播放TTS音頻文件的過程中,實時獲取當(dāng)前播放的TTS音頻流, 并實時使用混響參數(shù)對該TTS音頻流進行混響效果處理,運樣,不是獲取整個TTS音頻文件, 全部進行混響效果處理后輸出,而是實時進行處理,既保證了處理效果,又保證了處理的實 時性,提升用戶的使用體驗。
[0018] 在一個實施例中,所述根據(jù)所述當(dāng)前距離確定對應(yīng)的混響參數(shù),包括:
[0019] 確定當(dāng)前距離所屬的目標(biāo)距離范圍;
[0020] 根據(jù)預(yù)設(shè)距離范圍與預(yù)設(shè)混響參數(shù)之間的對應(yīng)關(guān)系,確定與所述目標(biāo)距離范圍對 應(yīng)的混響參數(shù)。
[0021] 在該實施例中,可W設(shè)置多個目標(biāo)距離范圍,W及與每個距離范圍對應(yīng)的預(yù)設(shè)混 響參數(shù),從而根據(jù)兩者之間的對應(yīng)關(guān)系,確定用戶與終端設(shè)備之間的當(dāng)前距離屬于的目標(biāo) 距離范圍,進而確定目標(biāo)距離范圍對應(yīng)的混響參數(shù)。
[0022] 在一個實施例中,所述方法還包括:
[0023] 接收輸入的設(shè)置命令;
[0024] 根據(jù)所述設(shè)置命令設(shè)置多個預(yù)設(shè)距離范圍,W及與每個預(yù)設(shè)距離范圍對應(yīng)的預(yù)設(shè) 混響參數(shù)。
[0025] 在該實施例中,用戶或者廠商可W設(shè)置多個目標(biāo)距離范圍,W及與每個距離范圍 對應(yīng)的預(yù)設(shè)混響參數(shù),從而根據(jù)兩者之間的對應(yīng)關(guān)系,確定用戶與終端設(shè)備之間的當(dāng)前距 離屬于的目標(biāo)距離范圍,進而確定目標(biāo)距離范圍對應(yīng)的混響參數(shù)。
[0026] 根據(jù)本發(fā)明實施例的第二方面,提供一種音頻處理裝置,包括:
[0027] 接收模塊,用于接收用戶對終端設(shè)備輸入的語音信息;
[0028] 第一確定模塊,用于根據(jù)接收到的所述語音信息確定所述用戶與所述終端設(shè)備之 間的當(dāng)前距離;
[0029] 第二確定模塊,用于根據(jù)所述當(dāng)前距離確定對應(yīng)的混響參數(shù);
[0030] 處理模塊,用于當(dāng)所述終端設(shè)備的TTS播放引擎播放與所述語音信息對應(yīng)的TTS音 頻文件時,使用所述混響參數(shù)對所述TTS音頻文件進行混響效果處理。
[0031 ]在一個實施例中,所述混響參數(shù)至少包括空間面積。
[0032] 在一個實施例中,所述處理模塊包括:
[0033] 獲取子模塊,用于當(dāng)所述TTS播放引擎播放所述TTS音頻文件時,實時獲取當(dāng)前播 放的音頻流;
[0034] 處理子模塊,用于使用所述混響參數(shù)對所述當(dāng)前播放的音頻流進行混響效果處 理,W得到混響處理后的音頻流。
[0035] 在一個實施例中,所述第二確定模塊包括:
[0036] 第一確定子模塊,用于確定當(dāng)前距離所屬的目標(biāo)距離范圍;
[0037] 第二確定子模塊,用于根據(jù)預(yù)設(shè)距離范圍與預(yù)設(shè)混響參數(shù)之間的對應(yīng)關(guān)系,確定 與所述目標(biāo)距離范圍對應(yīng)的混響參數(shù)。
[0038] 在一個實施例中,所述裝置還包括:
[0039] 接收模塊,用于接收輸入的設(shè)置命令;
[0040] 設(shè)置模塊,用于根據(jù)所述設(shè)置命令設(shè)置多個預(yù)設(shè)距離范圍,W及與每個預(yù)設(shè)距離 范圍對應(yīng)的預(yù)設(shè)混響參數(shù)。
[0041] 應(yīng)當(dāng)理解的是,W上的一般描述和后文的細節(jié)描述僅是示例性和解釋性的,并不 能限制本發(fā)明。
[0042] 本發(fā)明的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變 得顯而易見,或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點可通過在所寫的說明 書、權(quán)利要求書、W及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。
[0043] 下面通過附圖和實施例,對本發(fā)明的技術(shù)方案做進一步的詳細描述。
【附圖說明】
[0044] 此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本發(fā)明的實施 例,并與說明書一起用于解釋本發(fā)明的原理。
[0045] 圖1是根據(jù)一示例性實施例示出的音頻處理方法的流程圖。
[0046] 圖2是根據(jù)一示例性實施例示出的音頻處理方法中步驟S104的流程圖。
[0047] 圖3是根據(jù)一示例性實施例示出的音頻處理方法中步驟S103的流程圖。
[0048] 圖4是根據(jù)一示例性實施例示出的另一種音頻處理方法的流程圖。
[0049] 圖5是根據(jù)一示例性實施例示出的一種音頻處理裝置的框圖。
[0050] 圖6是根據(jù)一示例性實施例示出的一種音頻處理裝置中處理模塊的框圖。
[0051] 圖7是根據(jù)一示例性實施例示出的一種音頻處理裝置中第二確定模塊的框圖。
[0052] 圖8是根據(jù)一示例性實施例示出的另一種音頻處理裝置的框圖。
[0053] 圖9是根據(jù)一示例性實施例示出的另一種音頻處理裝置的工作流程圖。
【具體實施方式】
[0054] 運里將詳細地對示例性實施例進行說明,其示例表示在附圖中。下面的描述設(shè)及 附圖時,除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。W下示例性實施例 中所描述的實施方式并不代表與本發(fā)明相一致的所有實施方式。相反,它們僅是與如所附 權(quán)利要求書中所詳述的、本發(fā)明的一些方面相一致的裝置和方法的例子。
[0055] 圖1是根據(jù)一示例性實施例示出的音頻處理方法的流程圖。該音頻處理方法應(yīng)用 于終端設(shè)備中,該終端設(shè)備可W是移動電話,計算機,數(shù)字廣播終端,消息收發(fā)設(shè)備,游戲控 制臺,平板設(shè)備,醫(yī)療設(shè)備,健身設(shè)備,個人數(shù)字助理等任一具有音頻處理功能的設(shè)備。如圖 1所示,該方法包括步驟Sl Ol-Sl 04:
[0056] 在步驟SlOl中,接收用戶對終端設(shè)備輸入的語音信息;
[0057] 在步驟S102中,根據(jù)接收到的所述語音信息確定所述用戶與所述終端設(shè)備之間的 當(dāng)前距離;
[0058] 終端設(shè)備根據(jù)接收到的語音信息的音量等參數(shù),可W確定出該語音信息的傳送距 離,即用戶與終端設(shè)備之間的距離。
[0059] 在步驟S103中,根據(jù)所述當(dāng)前距離確定對應(yīng)的混響參數(shù);
[0060] 可W預(yù)先設(shè)置不同的距離對應(yīng)的不同的混響參數(shù),從而根據(jù)當(dāng)前距離確定當(dāng)前的 混響參數(shù)。
[0061] 在步驟S104中,當(dāng)所述終端設(shè)備的TTS播放引擎播放與所述語音信息對應(yīng)的TTS音 頻文件時,使用所述混響參數(shù)對所述TTS音頻文件進行混響效果處理。
[0062] 終端設(shè)備收到用戶的語音信息后,并反饋給用戶與語音信息對應(yīng)的TTS音頻文件, 如用戶輸入的語音信息為"幫我查找XX城市的地圖",則對應(yīng)的TTS音頻文件可W是"已查找 到XX城市的地圖,請查看"等。
[0063] 在該實施例中,接收用戶對終端設(shè)備輸入的語音信息,并根據(jù)該語音信息確定用 戶與終端設(shè)備之間的距離,從而根據(jù)該距離確定對應(yīng)的混響參數(shù),通過確定的混響參數(shù)對 根據(jù)語音信息反饋的TTS音頻文件進行處理,從而使得播放的TTS文件具有最有的播放效 果,提升TTS的收聽體驗。
[0064] 在一個實施例中,所述混響參數(shù)至少包括空間面積。
[0065] 在該實施例中,混響參數(shù)可W包括空間面積,空間面積的大小決定了混響效果的 大小,例如,用戶在室內(nèi)和用戶在山谷里,那么混響效果是截然不同的。而用戶與終端設(shè)備 之間的距離和混響參數(shù)之間可W成正比關(guān)系,如用戶與終端設(shè)備之間的距離越近,則混響 參數(shù)可W越小,即空間面積越小,從而使得語音信息的TTS反饋音包含較小的混響效果,反 之,用戶與終端設(shè)備之間的距離越遠,則混響參數(shù)可W越大,即空間面積越大,從而使得語 音信息的TTS反饋音包含較大的混響效果。
[0066] 圖2是根據(jù)一示例性實施例示出的音頻處理方法中步驟S104的流程圖。
[0067] 如圖2所示,在一個實施例中,上述步驟S104包括步驟S201-S202:
[0068] 在步驟S201中,當(dāng)所述TTS播放引擎播放所述TTS音頻文件時,實時獲取當(dāng)前播放 的音頻流;TTS音頻文件播放時,是W音頻流的形式播放的。
[0069] 在步驟S202中,使用所述混響參數(shù)對所述當(dāng)前播放的音頻流進行混響效果處理, W得到混響處理后的音頻流。
[0070] 在該實施例中,在使用混響參數(shù)對TTS音頻文件進行混響效果處理時,可W采用如 下處理方式:在TTS播放引擎播放TTS音頻文件的過程中,實時獲取當(dāng)前播放的TTS音頻流, 并實時使用混響參數(shù)對該TTS音頻流進行混響效果處理,運樣,不是獲取整個TTS音頻文件, 全部進行混響效果處理后輸出,而是實時進行處理,既保證了處理效果,又保證了處理的實 時性,提升用戶的使用體驗。
[0071] 圖3是根據(jù)一示例性實施例示出的音頻處理方法中步驟S103的流程圖。
[0072] 如圖3所示,在一個實施例中,上述步驟S103包括步驟S301-S302:
[0073] 在步驟S301中,確定當(dāng)前距離所屬的目標(biāo)距離范圍;可W設(shè)置多個距離范圍,如0- 1米為一個距離范圍,1-3米為一個距離范圍,3-5米為一個距離范圍,5-10米為一個距離范 圍,10米W上為一個距離范圍。則如果當(dāng)前距離為4米,則確定其目標(biāo)距離范圍為3-5米。
[0074] 在步驟S302中,根據(jù)預(yù)設(shè)距離范圍與預(yù)設(shè)混響參數(shù)之間的對應(yīng)關(guān)系,確定與所述 目標(biāo)距離范圍對應(yīng)的混響參數(shù)。
[0075] 在該實施例中,可W設(shè)置多個目標(biāo)距離范圍,W及與每個距離范圍對應(yīng)的預(yù)設(shè)混 響參數(shù),從而根據(jù)兩者之間的對應(yīng)關(guān)系,確定用戶與終端設(shè)備之間的當(dāng)前距離屬于的目標(biāo) 距離范圍,進而確定目標(biāo)距離范圍對應(yīng)的混響參數(shù)。
[0076] 圖4是根據(jù)一示例性實施例示出的另一種音頻處理方法的流程圖。
[0077] 如圖4所示,在一個實施例中,上述方法還包括步驟S401-S402:
[0078] 在步驟S401中,接收輸入的設(shè)置命令;
[0079] 在步驟S402中,根據(jù)所述設(shè)置命令設(shè)置多個預(yù)設(shè)距離范圍,W及與每個預(yù)設(shè)距離 范圍對應(yīng)的預(yù)設(shè)混響參數(shù)。
[0080] 在該實施例中,用戶或者廠商可W設(shè)置多個目標(biāo)距離范圍,W及與每個距離范圍 對應(yīng)的預(yù)設(shè)混響參數(shù),從而根據(jù)兩者之間的對應(yīng)關(guān)系,確定用戶與終端設(shè)備之間的當(dāng)前距 離屬于的目標(biāo)距離范圍,進而確定目標(biāo)距離范圍對應(yīng)的混響參數(shù)。
[0081] 舉例來說,混響參數(shù)通過距離來表征,為提高TTS音頻文件的收聽體驗,可設(shè)置距 離越遠,混響參數(shù)越大,該例中混響參數(shù)和距離范圍的對應(yīng)關(guān)系如表1所示。
[0082] 表 1
[0083]
[0084] 下述為本發(fā)明裝置實施例,可W用于執(zhí)行本發(fā)明方法實施例。
[0085] 圖5是根據(jù)一示例性實施例示出的一種音頻處理裝置的框圖,該裝置可W通過軟 件、硬件或者兩者的結(jié)合實現(xiàn)成為終端設(shè)備的部分或者全部。如圖5所示,該音頻處理裝置 包括:
[0086] 接收模塊51,用于接收用戶對終端設(shè)備輸入的語音信息;
[0087] 第一確定模塊52,用于根據(jù)接收到的所述語音信息確定所述用戶與所述終端設(shè)備 之間的當(dāng)前距離;
[0088] 第二確定模塊53,用于根據(jù)所述當(dāng)前距離確定對應(yīng)的混響參數(shù);
[0089] 處理模塊54,用于當(dāng)所述終端設(shè)備的TTS播放引擎播放與所述語音信息對應(yīng)的TTS 音頻文件時,使用所述混響參數(shù)對所述TTS音頻文件進行混響效果處理。
[0090] 在該實施例中,接收用戶對終端設(shè)備輸入的語音信息,并根據(jù)該語音信息確定用 戶與終端設(shè)備之間的距離,從而根據(jù)該距離確定對應(yīng)的混響參數(shù),通過確定的混響參數(shù)對 根據(jù)語音信息反饋的TTS音頻文件進行處理,從而使得播放的TTS文件具有最有的播放效 果,提升TTS的收聽體驗。
[0091 ]在一個實施例中,所述混響參數(shù)至少包括空間面積。
[0092]在該實施例中,混響參數(shù)可W包括空間面積,空間面積的大小決定了混響效果的 大小,例如,用戶在室內(nèi)和用戶在山谷里,那么混響效果是截然不同的。而用戶與終端設(shè)備 之間的距離和混響參數(shù)之間可W成正比關(guān)系,如用戶與終端設(shè)備之間的距離越近,則混響 參數(shù)可W越小,即空間面積越小,從而使得語音信息的TTS反饋音包含較小的混響效果,反 之,用戶與終端設(shè)備之間的距離越遠,則混響參數(shù)可W越大,即空間面積越大,從而使得語 音信息的TTS反饋音包含較大的混響效果。
[0093] 圖6是根據(jù)一示例性實施例示出的一種音頻處理裝置中處理模塊的框圖。
[0094] 如圖6所示,在一個實施例中,所述處理模塊54包括:
[00%]獲取子模塊61,用于當(dāng)所述TTS播放引擎播放所述TTS音頻文件時,實時獲取當(dāng)前 播放的音頻流;
[0096] 處理子模塊62,用于使用所述混響參數(shù)對所述當(dāng)前播放的音頻流進行混響效果處 理,W得到混響處理后的音頻流。
[0097] 在該實施例中,在使用混響參數(shù)對TTS音頻文件進行混響效果處理時,可W采用如 下處理方式:在TTS播放引擎播放TTS音頻文件的過程中,實時獲取當(dāng)前播放的TTS音頻流, 并實時使用混響參數(shù)對該TTS音頻流進行混響效果處理,運樣,不是獲取整個TTS音頻文件, 全部進行混響效果處理后輸出,而是實時進行處理,既保證了處理效果,又保證了處理的實 時性,提升用戶的使用體驗。
[0098] 圖7是根據(jù)一示例性實施例示出的一種音頻處理裝置中第二確定模塊的框圖。
[0099] 如圖7所示,在一個實施例中,所述第二確定模塊53包括:
[0100] 第一確定子模塊71,用于確定當(dāng)前距離所屬的目標(biāo)距離范圍;
[0101] 第二確定子模塊72,用于根據(jù)預(yù)設(shè)距離范圍與預(yù)設(shè)混響參數(shù)之間的對應(yīng)關(guān)系,確 定與所述目標(biāo)距離范圍對應(yīng)的混響參數(shù)。
[0102] 在該實施例中,可W設(shè)置多個目標(biāo)距離范圍,W及與每個距離范圍對應(yīng)的預(yù)設(shè)混 響參數(shù),從而根據(jù)兩者之間的對應(yīng)關(guān)系,確定用戶與終端設(shè)備之間的當(dāng)前距離屬于的目標(biāo) 距離范圍,進而確定目標(biāo)距離范圍對應(yīng)的混響參數(shù)。
[0103] 圖8是根據(jù)一示例性實施例示出的另一種音頻處理裝置的框圖。
[0104] 如圖8所示,在一個實施例中,上述裝置還包括:
[0105] 接收模塊81,用于接收輸入的設(shè)置命令;
[0106] 設(shè)置模塊82,用于根據(jù)所述設(shè)置命令設(shè)置多個預(yù)設(shè)距離范圍,W及與每個預(yù)設(shè)距 離范圍對應(yīng)的預(yù)設(shè)混響參數(shù)。
[0107] 在該實施例中,用戶或者廠商可W設(shè)置多個目標(biāo)距離范圍,W及與每個距離范圍 對應(yīng)的預(yù)設(shè)混響參數(shù),從而根據(jù)兩者之間的對應(yīng)關(guān)系,確定用戶與終端設(shè)備之間的當(dāng)前距 離屬于的目標(biāo)距離范圍,進而確定目標(biāo)距離范圍對應(yīng)的混響參數(shù)。
[0108] 下面W-個具體流程圖詳細說明本發(fā)明的技術(shù)方案。
[0109] 如圖9所示,接收用戶對終端設(shè)備輸入的語音信息,并由第一確定模塊91根據(jù)該語 音信息確定用戶與終端設(shè)備之間的距離,從而根據(jù)該距離確定對應(yīng)的混響參數(shù),處理模塊 92通過確定的混響參數(shù)對終端設(shè)備的TTS播放引擎播放的與語音信息對應(yīng)的TTS音頻文件 進行處理,從而使得播放的TTS文件具有最有的播放效果,提升TTS的收聽體驗。
[0110] 其中,第一確定模塊和TTS播放引擎的處理過程是并行的,從而保證處理速度。
[0111] 本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實施例可提供為方法、系統(tǒng)、或計算機程序 產(chǎn)品。因此,本發(fā)明可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方面的實 施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機可用程序代碼的計算機 可用存儲介質(zhì)(包括但不限于磁盤存儲器和光學(xué)存儲器等)上實施的計算機程序產(chǎn)品的形 式。
[0112] 本發(fā)明是參照根據(jù)本發(fā)明實施例的方法、設(shè)備(系統(tǒng))、和計算機程序產(chǎn)品的流程 圖和/或方框圖來描述的。應(yīng)理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流 程和/或方框、W及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻\些計算機程序 指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理設(shè)備的處理器W產(chǎn) 生一個機器,使得通過計算機或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實 現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
[0113] 運些計算機程序指令也可存儲在能引導(dǎo)計算機或其他可編程數(shù)據(jù)處理設(shè)備W特 定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指 令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或 多個方框中指定的功能。
[0114] 運些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計 算機或其他可編程設(shè)備上執(zhí)行一系列操作步驟W產(chǎn)生計算機實現(xiàn)的處理,從而在計算機或 其他可編程設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一 個方框或多個方框中指定的功能的步驟。
[0115] 顯然,本領(lǐng)域的技術(shù)人員可W對本發(fā)明進行各種改動和變型而不脫離本發(fā)明的精 神和范圍。運樣,倘若本發(fā)明的運些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍 之內(nèi),則本發(fā)明也意圖包含運些改動和變型在內(nèi)。
【主權(quán)項】
1. 一種音頻處理方法,其特征在于,包括: 接收用戶對終端設(shè)備輸入的語音信息; 根據(jù)接收到的所述語音信息確定所述用戶與所述終端設(shè)備之間的當(dāng)前距離; 根據(jù)所述當(dāng)前距離確定對應(yīng)的混響參數(shù); 當(dāng)所述終端設(shè)備的TTS播放引擎播放與所述語音信息對應(yīng)的TTS音頻文件時,使用所述 混響參數(shù)對所述TTS音頻文件進行混響效果處理。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述混響參數(shù)至少包括空間面積。3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述使用所述混響參數(shù)對所述TTS音頻文 件進行混響效果處理,包括: 當(dāng)所述TTS播放引擎播放所述TTS音頻文件時,實時獲取當(dāng)前播放的音頻流; 使用所述混響參數(shù)對所述當(dāng)前播放的音頻流進行混響效果處理,以得到混響處理后的 音頻流。4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述當(dāng)前距離確定對應(yīng)的混響參 數(shù),包括: 確定當(dāng)前距離所屬的目標(biāo)距離范圍; 根據(jù)預(yù)設(shè)距離范圍與預(yù)設(shè)混響參數(shù)之間的對應(yīng)關(guān)系,確定與所述目標(biāo)距離范圍對應(yīng)的 混響參數(shù)。5. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括: 接收輸入的設(shè)置命令; 根據(jù)所述設(shè)置命令設(shè)置多個預(yù)設(shè)距離范圍,以及與每個預(yù)設(shè)距離范圍對應(yīng)的預(yù)設(shè)混響 參數(shù)。6. -種音頻處理裝置,其特征在于,包括: 接收模塊,用于接收用戶對終端設(shè)備輸入的語音信息; 第一確定模塊,用于根據(jù)接收到的所述語音信息確定所述用戶與所述終端設(shè)備之間的 當(dāng)前距離; 第二確定模塊,用于根據(jù)所述當(dāng)前距離確定對應(yīng)的混響參數(shù); 處理模塊,用于當(dāng)所述終端設(shè)備的TTS播放引擎播放與所述語音信息對應(yīng)的TTS音頻文 件時,使用所述混響參數(shù)對所述TTS音頻文件進行混響效果處理。7. 根據(jù)權(quán)利要6所述的裝置,其特征在于,所述混響參數(shù)至少包括空間面積。8. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述處理模塊包括: 獲取子模塊,用于當(dāng)所述TTS播放引擎播放所述TTS音頻文件時,實時獲取當(dāng)前播放的 音頻流; 處理子模塊,用于使用所述混響參數(shù)對所述當(dāng)前播放的音頻流進行混響效果處理,以 得到混響處理后的音頻流。9. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述第二確定模塊包括: 第一確定子模塊,用于確定當(dāng)前距離所屬的目標(biāo)距離范圍; 第二確定子模塊,用于根據(jù)預(yù)設(shè)距離范圍與預(yù)設(shè)混響參數(shù)之間的對應(yīng)關(guān)系,確定與所 述目標(biāo)距離范圍對應(yīng)的混響參數(shù)。10. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述裝置還包括: 接收模塊,用于接收輸入的設(shè)置命令; 設(shè)置模塊,用于根據(jù)所述設(shè)置命令設(shè)置多個預(yù)設(shè)距離范圍,以及與每個預(yù)設(shè)距離范圍 對應(yīng)的預(yù)設(shè)混響參數(shù)。
【文檔編號】G10L15/22GK105957528SQ201610415341
【公開日】2016年9月21日
【申請日】2016年6月13日
【發(fā)明人】周海
【申請人】北京云知聲信息技術(shù)有限公司