音頻處理方法及裝置的制造方法

文檔序號：10595523閱讀：457來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

音頻處理方法及裝置的制造方法
【專利摘要】本發(fā)明是關(guān)于一種音頻處理方法及裝置，其中，所述方法包括：接收用戶對終端設(shè)備輸入的語音信息；根據(jù)接收到的所述語音信息確定所述用戶與所述終端設(shè)備之間的當(dāng)前距離；根據(jù)所述當(dāng)前距離確定對應(yīng)的混響參數(shù)；當(dāng)所述終端設(shè)備的TTS播放引擎播放與所述語音信息對應(yīng)的TTS音頻文件時，使用所述混響參數(shù)對所述TTS音頻文件進行混響效果處理。通過該技術(shù)方案，接收用戶對終端設(shè)備輸入的語音信息，并根據(jù)該語音信息確定用戶與終端設(shè)備之間的距離，從而根據(jù)該距離確定對應(yīng)的混響參數(shù)，通過確定的混響參數(shù)對根據(jù)語音信息反饋的TTS音頻文件進行處理，從而使得播放的TTS文件具有最有的播放效果，提升TTS的收聽體驗。
【專利說明】
音頻處理方法及裝置
技術(shù)領(lǐng)域
[0001 ]本發(fā)明設(shè)及音頻處理技術(shù)領(lǐng)域，尤其設(shè)及一種音頻處理方法及裝置。
【背景技術(shù)】
[0002] TTS是Text To Speech的縮寫，即"從文本到語音"，是人機對話的一部分，讓機器能夠說話。
[0003] 它是同時運用語言學(xué)和屯、理學(xué)的杰出之作，在內(nèi)置忍片的支持之下，通過神經(jīng)網(wǎng) 絡(luò)的設(shè)計，把文字智能地轉(zhuǎn)化為自然語音流。TTS技術(shù)對文本文件進行實時轉(zhuǎn)換，轉(zhuǎn)換時間之短可W秒計算。在其特有智能語音控制器作用下，文本輸出的語音音律流楊，使得聽者在聽取信息時感覺自然，毫無機器語音輸出的冷漠與生澀感。TTS語音合成技術(shù)即將覆蓋國標(biāo) 一、二級漢字，具有英文接口，自動識別中、英文，支持中英文混讀。所有聲音采用真人普通話為標(biāo)準(zhǔn)發(fā)音，實現(xiàn)了 120-150個漢字/秒的快速語音合成，朗讀速度達3-4個漢字/秒，使用戶可W聽到清晰悅耳的音質(zhì)和連貫流楊的語調(diào)。
[0004] TTS是語音合成應(yīng)用的一種，它將儲存于電腦中的文件，如幫助文件或者網(wǎng)頁，轉(zhuǎn) 換成自然語音輸出。TTS不僅能幫助有視覺障礙的人閱讀計算機上的信息，更能增加文本文檔的可讀性?，F(xiàn)在的TTS應(yīng)用包括語音驅(qū)動的郵件W及聲音敏感系統(tǒng)，并常與聲音識別程序一起使用。

【發(fā)明內(nèi)容】

[0005] 本發(fā)明實施例提供一種音頻處理方法及裝置，用W實現(xiàn)優(yōu)化TTS的播放效果，提升 TTS的收聽體驗。
[0006] 根據(jù)本發(fā)明實施例的第一方面，提供一種音頻處理方法，包括：
[0007] 接收用戶對終端設(shè)備輸入的語音信息；
[000引根據(jù)接收到的所述語音信息確定所述用戶與所述終端設(shè)備之間的當(dāng)前距離；
[0009] 根據(jù)所述當(dāng)前距離確定對應(yīng)的混響參數(shù)；
[0010] 當(dāng)所述終端設(shè)備的TTS播放引擎播放與所述語音信息對應(yīng)的TTS音頻文件時，使用所述混響參數(shù)對所述TTS音頻文件進行混響效果處理。
[0011] 在該實施例中，接收用戶對終端設(shè)備輸入的語音信息，并根據(jù)該語音信息確定用戶與終端設(shè)備之間的距離，從而根據(jù)該距離確定對應(yīng)的混響參數(shù)，通過確定的混響參數(shù)對根據(jù)語音信息反饋的TTS音頻文件進行處理，從而使得播放的TTS文件具有最有的播放效果，提升TTS的收聽體驗。
[0012] 在一個實施例中，所述混響參數(shù)至少包括空間面積。
[001引在該實施例中，混響參數(shù)可W包括空間面積，空間面積的大小決定了混響效果的大小，例如，用戶在室內(nèi)和用戶在山谷里，那么混響效果是截然不同的。而用戶與終端設(shè)備之間的距離和混響參數(shù)之間可W成正比關(guān)系，如用戶與終端設(shè)備之間的距離越近，則混響參數(shù)可W越小，即空間面積越小，從而使得語音信息的TTS反饋音包含較小的混響效果，反之，用戶與終端設(shè)備之間的距離越遠，則混響參數(shù)可W越大，即空間面積越大，從而使得語音信息的TTS反饋音包含較大的混響效果。
[0014] 在一個實施例中，所述使用所述混響參數(shù)對所述TTS音頻文件進行混響效果處理，包括：
[0015] 當(dāng)所述TTS播放引擎播放所述TTS音頻文件時，實時獲取當(dāng)前播放的音頻流；
[0016] 使用所述混響參數(shù)對所述當(dāng)前播放的音頻流進行混響效果處理，W得到混響處理后的首頻流。
[0017] 在該實施例中，在使用混響參數(shù)對TTS音頻文件進行混響效果處理時，可W采用如下處理方式:在TTS播放引擎播放TTS音頻文件的過程中，實時獲取當(dāng)前播放的TTS音頻流，并實時使用混響參數(shù)對該TTS音頻流進行混響效果處理，運樣，不是獲取整個TTS音頻文件，全部進行混響效果處理后輸出，而是實時進行處理，既保證了處理效果，又保證了處理的實時性，提升用戶的使用體驗。
[0018] 在一個實施例中，所述根據(jù)所述當(dāng)前距離確定對應(yīng)的混響參數(shù)，包括：
[0019] 確定當(dāng)前距離所屬的目標(biāo)距離范圍；
[0020] 根據(jù)預(yù)設(shè)距離范圍與預(yù)設(shè)混響參數(shù)之間的對應(yīng)關(guān)系，確定與所述目標(biāo)距離范圍對應(yīng)的混響參數(shù)。
[0021] 在該實施例中，可W設(shè)置多個目標(biāo)距離范圍，W及與每個距離范圍對應(yīng)的預(yù)設(shè)混響參數(shù)，從而根據(jù)兩者之間的對應(yīng)關(guān)系，確定用戶與終端設(shè)備之間的當(dāng)前距離屬于的目標(biāo) 距離范圍，進而確定目標(biāo)距離范圍對應(yīng)的混響參數(shù)。
[0022] 在一個實施例中，所述方法還包括：
[0023] 接收輸入的設(shè)置命令；
[0024] 根據(jù)所述設(shè)置命令設(shè)置多個預(yù)設(shè)距離范圍，W及與每個預(yù)設(shè)距離范圍對應(yīng)的預(yù)設(shè) 混響參數(shù)。
[0025] 在該實施例中，用戶或者廠商可W設(shè)置多個目標(biāo)距離范圍，W及與每個距離范圍對應(yīng)的預(yù)設(shè)混響參數(shù)，從而根據(jù)兩者之間的對應(yīng)關(guān)系，確定用戶與終端設(shè)備之間的當(dāng)前距離屬于的目標(biāo)距離范圍，進而確定目標(biāo)距離范圍對應(yīng)的混響參數(shù)。
[0026] 根據(jù)本發(fā)明實施例的第二方面，提供一種音頻處理裝置，包括：
[0027] 接收模塊，用于接收用戶對終端設(shè)備輸入的語音信息；
[0028] 第一確定模塊，用于根據(jù)接收到的所述語音信息確定所述用戶與所述終端設(shè)備之間的當(dāng)前距離；
[0029] 第二確定模塊，用于根據(jù)所述當(dāng)前距離確定對應(yīng)的混響參數(shù)；
[0030] 處理模塊，用于當(dāng)所述終端設(shè)備的TTS播放引擎播放與所述語音信息對應(yīng)的TTS音頻文件時，使用所述混響參數(shù)對所述TTS音頻文件進行混響效果處理。
[0031 ]在一個實施例中，所述混響參數(shù)至少包括空間面積。
[0032] 在一個實施例中，所述處理模塊包括：
[0033] 獲取子模塊，用于當(dāng)所述TTS播放引擎播放所述TTS音頻文件時，實時獲取當(dāng)前播放的音頻流；
[0034] 處理子模塊，用于使用所述混響參數(shù)對所述當(dāng)前播放的音頻流進行混響效果處理，W得到混響處理后的音頻流。
[0035] 在一個實施例中，所述第二確定模塊包括：
[0036] 第一確定子模塊，用于確定當(dāng)前距離所屬的目標(biāo)距離范圍；
[0037] 第二確定子模塊，用于根據(jù)預(yù)設(shè)距離范圍與預(yù)設(shè)混響參數(shù)之間的對應(yīng)關(guān)系，確定與所述目標(biāo)距離范圍對應(yīng)的混響參數(shù)。
[0038] 在一個實施例中，所述裝置還包括：
[0039] 接收模塊，用于接收輸入的設(shè)置命令；
[0040] 設(shè)置模塊，用于根據(jù)所述設(shè)置命令設(shè)置多個預(yù)設(shè)距離范圍，W及與每個預(yù)設(shè)距離范圍對應(yīng)的預(yù)設(shè)混響參數(shù)。
[0041] 應(yīng)當(dāng)理解的是，W上的一般描述和后文的細節(jié)描述僅是示例性和解釋性的，并不能限制本發(fā)明。
[0042] 本發(fā)明的其它特征和優(yōu)點將在隨后的說明書中闡述，并且，部分地從說明書中變得顯而易見，或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點可通過在所寫的說明書、權(quán)利要求書、W及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。
[0043] 下面通過附圖和實施例，對本發(fā)明的技術(shù)方案做進一步的詳細描述。
【附圖說明】
[0044] 此處的附圖被并入說明書中并構(gòu)成本說明書的一部分，示出了符合本發(fā)明的實施例，并與說明書一起用于解釋本發(fā)明的原理。
[0045] 圖1是根據(jù)一示例性實施例示出的音頻處理方法的流程圖。
[0046] 圖2是根據(jù)一示例性實施例示出的音頻處理方法中步驟S104的流程圖。
[0047] 圖3是根據(jù)一示例性實施例示出的音頻處理方法中步驟S103的流程圖。
[0048] 圖4是根據(jù)一示例性實施例示出的另一種音頻處理方法的流程圖。
[0049] 圖5是根據(jù)一示例性實施例示出的一種音頻處理裝置的框圖。
[0050] 圖6是根據(jù)一示例性實施例示出的一種音頻處理裝置中處理模塊的框圖。
[0051] 圖7是根據(jù)一示例性實施例示出的一種音頻處理裝置中第二確定模塊的框圖。
[0052] 圖8是根據(jù)一示例性實施例示出的另一種音頻處理裝置的框圖。
[0053] 圖9是根據(jù)一示例性實施例示出的另一種音頻處理裝置的工作流程圖。
【具體實施方式】
[0054] 運里將詳細地對示例性實施例進行說明，其示例表示在附圖中。下面的描述設(shè)及附圖時，除非另有表示，不同附圖中的相同數(shù)字表示相同或相似的要素。W下示例性實施例中所描述的實施方式并不代表與本發(fā)明相一致的所有實施方式。相反，它們僅是與如所附權(quán)利要求書中所詳述的、本發(fā)明的一些方面相一致的裝置和方法的例子。
[0055] 圖1是根據(jù)一示例性實施例示出的音頻處理方法的流程圖。該音頻處理方法應(yīng)用于終端設(shè)備中，該終端設(shè)備可W是移動電話，計算機，數(shù)字廣播終端，消息收發(fā)設(shè)備，游戲控制臺，平板設(shè)備，醫(yī)療設(shè)備，健身設(shè)備，個人數(shù)字助理等任一具有音頻處理功能的設(shè)備。如圖 1所示，該方法包括步驟Sl Ol-Sl 04:
[0056] 在步驟SlOl中，接收用戶對終端設(shè)備輸入的語音信息；
[0057] 在步驟S102中，根據(jù)接收到的所述語音信息確定所述用戶與所述終端設(shè)備之間的當(dāng)前距離；
[0058] 終端設(shè)備根據(jù)接收到的語音信息的音量等參數(shù)，可W確定出該語音信息的傳送距離，即用戶與終端設(shè)備之間的距離。
[0059] 在步驟S103中，根據(jù)所述當(dāng)前距離確定對應(yīng)的混響參數(shù)；
[0060] 可W預(yù)先設(shè)置不同的距離對應(yīng)的不同的混響參數(shù)，從而根據(jù)當(dāng)前距離確定當(dāng)前的混響參數(shù)。
[0061] 在步驟S104中，當(dāng)所述終端設(shè)備的TTS播放引擎播放與所述語音信息對應(yīng)的TTS音頻文件時，使用所述混響參數(shù)對所述TTS音頻文件進行混響效果處理。
[0062] 終端設(shè)備收到用戶的語音信息后，并反饋給用戶與語音信息對應(yīng)的TTS音頻文件，如用戶輸入的語音信息為"幫我查找XX城市的地圖"，則對應(yīng)的TTS音頻文件可W是"已查找到XX城市的地圖，請查看"等。
[0063] 在該實施例中，接收用戶對終端設(shè)備輸入的語音信息，并根據(jù)該語音信息確定用戶與終端設(shè)備之間的距離，從而根據(jù)該距離確定對應(yīng)的混響參數(shù)，通過確定的混響參數(shù)對根據(jù)語音信息反饋的TTS音頻文件進行處理，從而使得播放的TTS文件具有最有的播放效果，提升TTS的收聽體驗。
[0064] 在一個實施例中，所述混響參數(shù)至少包括空間面積。
[0065] 在該實施例中，混響參數(shù)可W包括空間面積，空間面積的大小決定了混響效果的大小，例如，用戶在室內(nèi)和用戶在山谷里，那么混響效果是截然不同的。而用戶與終端設(shè)備之間的距離和混響參數(shù)之間可W成正比關(guān)系，如用戶與終端設(shè)備之間的距離越近，則混響參數(shù)可W越小，即空間面積越小，從而使得語音信息的TTS反饋音包含較小的混響效果，反之，用戶與終端設(shè)備之間的距離越遠，則混響參數(shù)可W越大，即空間面積越大，從而使得語音信息的TTS反饋音包含較大的混響效果。
[0066] 圖2是根據(jù)一示例性實施例示出的音頻處理方法中步驟S104的流程圖。
[0067] 如圖2所示，在一個實施例中，上述步驟S104包括步驟S201-S202:
[0068] 在步驟S201中，當(dāng)所述TTS播放引擎播放所述TTS音頻文件時，實時獲取當(dāng)前播放的音頻流;TTS音頻文件播放時，是W音頻流的形式播放的。
[0069] 在步驟S202中，使用所述混響參數(shù)對所述當(dāng)前播放的音頻流進行混響效果處理， W得到混響處理后的音頻流。
[0070] 在該實施例中，在使用混響參數(shù)對TTS音頻文件進行混響效果處理時，可W采用如下處理方式:在TTS播放引擎播放TTS音頻文件的過程中，實時獲取當(dāng)前播放的TTS音頻流，并實時使用混響參數(shù)對該TTS音頻流進行混響效果處理，運樣，不是獲取整個TTS音頻文件，全部進行混響效果處理后輸出，而是實時進行處理，既保證了處理效果，又保證了處理的實時性，提升用戶的使用體驗。
[0071] 圖3是根據(jù)一示例性實施例示出的音頻處理方法中步驟S103的流程圖。
[0072] 如圖3所示，在一個實施例中，上述步驟S103包括步驟S301-S302:
[0073] 在步驟S301中，確定當(dāng)前距離所屬的目標(biāo)距離范圍；可W設(shè)置多個距離范圍，如0- 1米為一個距離范圍，1-3米為一個距離范圍，3-5米為一個距離范圍，5-10米為一個距離范圍，10米W上為一個距離范圍。則如果當(dāng)前距離為4米，則確定其目標(biāo)距離范圍為3-5米。
[0074] 在步驟S302中，根據(jù)預(yù)設(shè)距離范圍與預(yù)設(shè)混響參數(shù)之間的對應(yīng)關(guān)系，確定與所述目標(biāo)距離范圍對應(yīng)的混響參數(shù)。
[0075] 在該實施例中，可W設(shè)置多個目標(biāo)距離范圍，W及與每個距離范圍對應(yīng)的預(yù)設(shè)混響參數(shù)，從而根據(jù)兩者之間的對應(yīng)關(guān)系，確定用戶與終端設(shè)備之間的當(dāng)前距離屬于的目標(biāo) 距離范圍，進而確定目標(biāo)距離范圍對應(yīng)的混響參數(shù)。
[0076] 圖4是根據(jù)一示例性實施例示出的另一種音頻處理方法的流程圖。
[0077] 如圖4所示，在一個實施例中，上述方法還包括步驟S401-S402:
[0078] 在步驟S401中，接收輸入的設(shè)置命令；
[0079] 在步驟S402中，根據(jù)所述設(shè)置命令設(shè)置多個預(yù)設(shè)距離范圍，W及與每個預(yù)設(shè)距離范圍對應(yīng)的預(yù)設(shè)混響參數(shù)。
[0080] 在該實施例中，用戶或者廠商可W設(shè)置多個目標(biāo)距離范圍，W及與每個距離范圍對應(yīng)的預(yù)設(shè)混響參數(shù)，從而根據(jù)兩者之間的對應(yīng)關(guān)系，確定用戶與終端設(shè)備之間的當(dāng)前距離屬于的目標(biāo)距離范圍，進而確定目標(biāo)距離范圍對應(yīng)的混響參數(shù)。
[0081] 舉例來說，混響參數(shù)通過距離來表征，為提高TTS音頻文件的收聽體驗，可設(shè)置距離越遠，混響參數(shù)越大，該例中混響參數(shù)和距離范圍的對應(yīng)關(guān)系如表1所示。
[0082] 表 1
[0083]
[0084] 下述為本發(fā)明裝置實施例，可W用于執(zhí)行本發(fā)明方法實施例。
[0085] 圖5是根據(jù)一示例性實施例示出的一種音頻處理裝置的框圖，該裝置可W通過軟件、硬件或者兩者的結(jié)合實現(xiàn)成為終端設(shè)備的部分或者全部。如圖5所示，該音頻處理裝置包括：
[0086] 接收模塊51，用于接收用戶對終端設(shè)備輸入的語音信息；
[0087] 第一確定模塊52,用于根據(jù)接收到的所述語音信息確定所述用戶與所述終端設(shè)備之間的當(dāng)前距離；
[0088] 第二確定模塊53,用于根據(jù)所述當(dāng)前距離確定對應(yīng)的混響參數(shù)；
[0089] 處理模塊54,用于當(dāng)所述終端設(shè)備的TTS播放引擎播放與所述語音信息對應(yīng)的TTS 音頻文件時，使用所述混響參數(shù)對所述TTS音頻文件進行混響效果處理。
[0090] 在該實施例中，接收用戶對終端設(shè)備輸入的語音信息，并根據(jù)該語音信息確定用戶與終端設(shè)備之間的距離，從而根據(jù)該距離確定對應(yīng)的混響參數(shù)，通過確定的混響參數(shù)對根據(jù)語音信息反饋的TTS音頻文件進行處理，從而使得播放的TTS文件具有最有的播放效果，提升TTS的收聽體驗。
[0091 ]在一個實施例中，所述混響參數(shù)至少包括空間面積。
[0092]在該實施例中，混響參數(shù)可W包括空間面積，空間面積的大小決定了混響效果的大小，例如，用戶在室內(nèi)和用戶在山谷里，那么混響效果是截然不同的。而用戶與終端設(shè)備之間的距離和混響參數(shù)之間可W成正比關(guān)系，如用戶與終端設(shè)備之間的距離越近，則混響參數(shù)可W越小，即空間面積越小，從而使得語音信息的TTS反饋音包含較小的混響效果，反之，用戶與終端設(shè)備之間的距離越遠，則混響參數(shù)可W越大，即空間面積越大，從而使得語音信息的TTS反饋音包含較大的混響效果。
[0093] 圖6是根據(jù)一示例性實施例示出的一種音頻處理裝置中處理模塊的框圖。
[0094] 如圖6所示，在一個實施例中，所述處理模塊54包括：
[00%]獲取子模塊61，用于當(dāng)所述TTS播放引擎播放所述TTS音頻文件時，實時獲取當(dāng)前播放的音頻流；
[0096] 處理子模塊62,用于使用所述混響參數(shù)對所述當(dāng)前播放的音頻流進行混響效果處理，W得到混響處理后的音頻流。
[0097] 在該實施例中，在使用混響參數(shù)對TTS音頻文件進行混響效果處理時，可W采用如下處理方式:在TTS播放引擎播放TTS音頻文件的過程中，實時獲取當(dāng)前播放的TTS音頻流，并實時使用混響參數(shù)對該TTS音頻流進行混響效果處理，運樣，不是獲取整個TTS音頻文件，全部進行混響效果處理后輸出，而是實時進行處理，既保證了處理效果，又保證了處理的實時性，提升用戶的使用體驗。
[0098] 圖7是根據(jù)一示例性實施例示出的一種音頻處理裝置中第二確定模塊的框圖。
[0099] 如圖7所示，在一個實施例中，所述第二確定模塊53包括：
[0100] 第一確定子模塊71，用于確定當(dāng)前距離所屬的目標(biāo)距離范圍；
[0101] 第二確定子模塊72,用于根據(jù)預(yù)設(shè)距離范圍與預(yù)設(shè)混響參數(shù)之間的對應(yīng)關(guān)系，確定與所述目標(biāo)距離范圍對應(yīng)的混響參數(shù)。
[0102] 在該實施例中，可W設(shè)置多個目標(biāo)距離范圍，W及與每個距離范圍對應(yīng)的預(yù)設(shè)混響參數(shù)，從而根據(jù)兩者之間的對應(yīng)關(guān)系，確定用戶與終端設(shè)備之間的當(dāng)前距離屬于的目標(biāo) 距離范圍，進而確定目標(biāo)距離范圍對應(yīng)的混響參數(shù)。
[0103] 圖8是根據(jù)一示例性實施例示出的另一種音頻處理裝置的框圖。
[0104] 如圖8所示，在一個實施例中，上述裝置還包括：
[0105] 接收模塊81，用于接收輸入的設(shè)置命令；
[0106] 設(shè)置模塊82,用于根據(jù)所述設(shè)置命令設(shè)置多個預(yù)設(shè)距離范圍，W及與每個預(yù)設(shè)距離范圍對應(yīng)的預(yù)設(shè)混響參數(shù)。
[0107] 在該實施例中，用戶或者廠商可W設(shè)置多個目標(biāo)距離范圍，W及與每個距離范圍對應(yīng)的預(yù)設(shè)混響參數(shù)，從而根據(jù)兩者之間的對應(yīng)關(guān)系，確定用戶與終端設(shè)備之間的當(dāng)前距離屬于的目標(biāo)距離范圍，進而確定目標(biāo)距離范圍對應(yīng)的混響參數(shù)。
[0108] 下面W-個具體流程圖詳細說明本發(fā)明的技術(shù)方案。
[0109] 如圖9所示，接收用戶對終端設(shè)備輸入的語音信息，并由第一確定模塊91根據(jù)該語音信息確定用戶與終端設(shè)備之間的距離，從而根據(jù)該距離確定對應(yīng)的混響參數(shù)，處理模塊 92通過確定的混響參數(shù)對終端設(shè)備的TTS播放引擎播放的與語音信息對應(yīng)的TTS音頻文件進行處理，從而使得播放的TTS文件具有最有的播放效果，提升TTS的收聽體驗。
[0110] 其中，第一確定模塊和TTS播放引擎的處理過程是并行的，從而保證處理速度。
[0111] 本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白，本發(fā)明的實施例可提供為方法、系統(tǒng)、或計算機程序產(chǎn)品。因此，本發(fā)明可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且，本發(fā)明可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(zhì)（包括但不限于磁盤存儲器和光學(xué)存儲器等）上實施的計算機程序產(chǎn)品的形式。
[0112] 本發(fā)明是參照根據(jù)本發(fā)明實施例的方法、設(shè)備（系統(tǒng)）、和計算機程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、W及流程圖和/或方框圖中的流程和/或方框的結(jié)合?？商峁┻\些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理設(shè)備的處理器W產(chǎn) 生一個機器，使得通過計算機或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
[0113] 運些計算機程序指令也可存儲在能引導(dǎo)計算機或其他可編程數(shù)據(jù)處理設(shè)備W特定方式工作的計算機可讀存儲器中，使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品，該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
[0114] 運些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理設(shè)備上，使得在計算機或其他可編程設(shè)備上執(zhí)行一系列操作步驟W產(chǎn)生計算機實現(xiàn)的處理，從而在計算機或其他可編程設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
[0115] 顯然，本領(lǐng)域的技術(shù)人員可W對本發(fā)明進行各種改動和變型而不脫離本發(fā)明的精神和范圍。運樣，倘若本發(fā)明的運些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi)，則本發(fā)明也意圖包含運些改動和變型在內(nèi)。
【主權(quán)項】
1. 一種音頻處理方法，其特征在于，包括：接收用戶對終端設(shè)備輸入的語音信息；根據(jù)接收到的所述語音信息確定所述用戶與所述終端設(shè)備之間的當(dāng)前距離；根據(jù)所述當(dāng)前距離確定對應(yīng)的混響參數(shù)；當(dāng)所述終端設(shè)備的TTS播放引擎播放與所述語音信息對應(yīng)的TTS音頻文件時，使用所述混響參數(shù)對所述TTS音頻文件進行混響效果處理。2. 根據(jù)權(quán)利要求1所述的方法，其特征在于，所述混響參數(shù)至少包括空間面積。3. 根據(jù)權(quán)利要求1所述的方法，其特征在于，所述使用所述混響參數(shù)對所述TTS音頻文件進行混響效果處理，包括：當(dāng)所述TTS播放引擎播放所述TTS音頻文件時，實時獲取當(dāng)前播放的音頻流；使用所述混響參數(shù)對所述當(dāng)前播放的音頻流進行混響效果處理，以得到混響處理后的音頻流。4. 根據(jù)權(quán)利要求1所述的方法，其特征在于，所述根據(jù)所述當(dāng)前距離確定對應(yīng)的混響參數(shù)，包括：確定當(dāng)前距離所屬的目標(biāo)距離范圍；根據(jù)預(yù)設(shè)距離范圍與預(yù)設(shè)混響參數(shù)之間的對應(yīng)關(guān)系，確定與所述目標(biāo)距離范圍對應(yīng)的混響參數(shù)。5. 根據(jù)權(quán)利要求1所述的方法，其特征在于，所述方法還包括：接收輸入的設(shè)置命令；根據(jù)所述設(shè)置命令設(shè)置多個預(yù)設(shè)距離范圍，以及與每個預(yù)設(shè)距離范圍對應(yīng)的預(yù)設(shè)混響參數(shù)。6. -種音頻處理裝置，其特征在于，包括：接收模塊，用于接收用戶對終端設(shè)備輸入的語音信息；第一確定模塊，用于根據(jù)接收到的所述語音信息確定所述用戶與所述終端設(shè)備之間的當(dāng)前距離；第二確定模塊，用于根據(jù)所述當(dāng)前距離確定對應(yīng)的混響參數(shù)；處理模塊，用于當(dāng)所述終端設(shè)備的TTS播放引擎播放與所述語音信息對應(yīng)的TTS音頻文件時，使用所述混響參數(shù)對所述TTS音頻文件進行混響效果處理。7. 根據(jù)權(quán)利要6所述的裝置，其特征在于，所述混響參數(shù)至少包括空間面積。8. 根據(jù)權(quán)利要求6所述的裝置，其特征在于，所述處理模塊包括：獲取子模塊，用于當(dāng)所述TTS播放引擎播放所述TTS音頻文件時，實時獲取當(dāng)前播放的音頻流；處理子模塊，用于使用所述混響參數(shù)對所述當(dāng)前播放的音頻流進行混響效果處理，以得到混響處理后的音頻流。9. 根據(jù)權(quán)利要求6所述的裝置，其特征在于，所述第二確定模塊包括：第一確定子模塊，用于確定當(dāng)前距離所屬的目標(biāo)距離范圍；第二確定子模塊，用于根據(jù)預(yù)設(shè)距離范圍與預(yù)設(shè)混響參數(shù)之間的對應(yīng)關(guān)系，確定與所述目標(biāo)距離范圍對應(yīng)的混響參數(shù)。10. 根據(jù)權(quán)利要求6所述的裝置，其特征在于，所述裝置還包括：接收模塊，用于接收輸入的設(shè)置命令；設(shè)置模塊，用于根據(jù)所述設(shè)置命令設(shè)置多個預(yù)設(shè)距離范圍，以及與每個預(yù)設(shè)距離范圍對應(yīng)的預(yù)設(shè)混響參數(shù)。
【文檔編號】G10L15/22GK105957528SQ201610415341
【公開日】2016年9月21日
【申請日】2016年6月13日
【發(fā)明人】周海
【申請人】北京云知聲信息技術(shù)有限公司

完整全部詳細技術(shù)資料下載