空間音頻裝置的制造方法

文檔序號：9476595閱讀：392來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

空間音頻裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本申請涉及用于空間音頻信號處理的裝置。本發(fā)明進(jìn)一步涉及但不限于用于移動設(shè)備內(nèi)的空間音頻信號處理的裝置。
【背景技術(shù)】
[0002] 空間音頻信號正被更頻繁地用于產(chǎn)生更身臨其境的音頻體驗(yàn)。立體聲或多通道記錄可從記錄或捕獲裝置傳遞給收聽裝置，并使用合適的多通道輸出（諸如多通道揚(yáng)聲器布置）和具有虛擬環(huán)繞處理的一對立體聲頭戴式受話器或頭戴式耳機(jī)來進(jìn)行重放。
[0003] 應(yīng)當(dāng)理解，在不久的將來，諸如移動電話這樣的移動裝置將有可能具有多于兩個擴(kuò)音器。這提供了記錄真實(shí)的多通道音頻的可能。通過先進(jìn)的信號處理，進(jìn)一步有可能的是：通過確定諸如關(guān)聯(lián)于音頻源的方向這樣的參數(shù)和基于其方向?qū)λ鲆纛l源進(jìn)行處理，對從特定或所需方向來自擴(kuò)音器的音頻信號進(jìn)行波束成形或定向處理。

【發(fā)明內(nèi)容】

[0004] 本申請的各個方面因而提供了一種空間音頻捕獲和處理，由此可以對收聽方位或視頻和音頻捕獲方位差別進(jìn)行補(bǔ)償。
[0005] 根據(jù)第一方面，提供了一種用于分離音頻源的方法，其包括：接收至少兩個音頻信號；將所述至少兩個音頻信號變換為所述至少兩個信號的頻域表示；根據(jù)所述至少兩個音頻信號的頻域表示生成觀察空間協(xié)方差矩陣；生成包括至少一個波束成形器內(nèi)核的空間協(xié) 方差矩陣模型；生成音頻對象的線性量值（magnitude)模型；將所述空間協(xié)方差矩陣模型和所述線性量值模型進(jìn)行合并；確定至少一個合并參數(shù)，使得用于合并的所述至少一個參數(shù)嘗試優(yōu)化所述合并；以及基于所述至少一個合并參數(shù)對所述音頻對象進(jìn)行聚類以產(chǎn)生分離的音頻源。
[0006] 接收所述至少兩個音頻信號可以包括以下中的至少一個：從擴(kuò)音器生成所述音頻信號，其中，所述擴(kuò)音器從至少一個音頻源接收聲波；以及從存儲器接收所述音頻信號，所述音頻信號描述了來自至少一個音頻源的聲波。
[0007] 將所述至少兩個音頻信號變換為所述至少兩個信號的頻域表示可以包括：對所述至少兩個音頻信號實(shí)施時間到頻率變換。
[0008] 根據(jù)所述至少兩個音頻信號的頻域表示生成觀察空間協(xié)方差矩陣可以包括：根據(jù) 所述兩個頻域表示的自協(xié)方差生成觀察空間協(xié)方差矩陣。
[0009] 所述方法可以進(jìn)一步包括：通過生成對擴(kuò)音器陣列周圍的空間場所進(jìn)行采樣的一組查看方向在頻域中的時間延遲，生成至少一個波束成形器內(nèi)核。
[0010] 生成至少一個波束成形器內(nèi)核可以包括：生成對所述擴(kuò)音器陣列周圍的空間場所進(jìn)行采樣的一組查看方向在頻域中的所述時間延遲的自協(xié)方差。
[0011] 生成音頻對象的線性模型可以包括：對音頻對象量值實(shí)施非負(fù)矩陣因式分解。
[0012] 對音頻對象量值實(shí)施非負(fù)矩陣因式分解可以包括：利用均勻分布在零和一之間的隨機(jī)值對線性模型參數(shù)Zk。、tlk和V k]進(jìn)行初始化。
[0013] 將空間協(xié)方差矩陣模型和所述線性量值模型進(jìn)行合并可以包括：將所述空間協(xié)方差矩陣模型乘以由所述線性模型表示的量值包絡(luò)。
[0014] 確定至少一個合并參數(shù)可以包括：確定空間協(xié)方差模型參數(shù)，以便最小化所述觀察空間協(xié)方差矩陣與所述空間協(xié)方差模型之間的差別。
[0015] 確定所述空間協(xié)方差模型參數(shù)可以包括：基于復(fù)值非負(fù)矩陣因式分解實(shí)施迭代式優(yōu)化，從而使得表示所述至少一個音頻對象的線性量值模型的參數(shù)被迭代地更新，直到所述線性量值模型參數(shù)在各個更新之間不顯著改變，或者處理了所定義數(shù)量的迭代為止。
[0016] 基于所述復(fù)值非負(fù)因式分解實(shí)施所述迭代式優(yōu)化可以包括：根據(jù)復(fù)數(shù)非負(fù)矩陣因式分解的優(yōu)化框架更新線性模型參數(shù)zk。、tlk和v k];以及更新所述空間協(xié)方差矩陣模型量值。
[0017] 更新所述空間協(xié)方差矩陣模型量值可以包括：更新所述至少兩個音頻信號的估計(jì) 量的相對量值差別。
[0018] 基于所述至少一個合并模型參數(shù)對所述音頻對象進(jìn)行聚類以產(chǎn)生分離的音頻源可以包括：根據(jù)所述至少一個音頻對象和根據(jù)所估計(jì)的線性量值模型參數(shù)生成至少一個音頻源。
[0019] 所述方法可以進(jìn)一步包括：基于與所述至少一個音頻源相關(guān)聯(lián)的所述至少一個合并模型參數(shù)，合成至少一個音頻信號。
[0020] 根據(jù)第二方面，提供了一種裝置，其包括：用于接收至少兩個音頻信號的構(gòu)件；用于將所述至少兩個音頻信號變換為所述至少兩個信號的頻域表示的構(gòu)件；用于根據(jù)所述至少兩個音頻信號的頻域表示生成觀察空間協(xié)方差矩陣的構(gòu)件；用于生成包括至少一個波束成形器內(nèi)核的空間協(xié)方差矩陣模型的構(gòu)件；用于生成音頻對象的線性量值模型的構(gòu)件；用于將所述空間協(xié)方差矩陣模型和所述線性量值模型進(jìn)行合并的構(gòu)件；用于確定至少一個合并參數(shù)，從而使得用于所述合并的所述至少一個參數(shù)嘗試優(yōu)化所述合并的構(gòu)件；以及用于基于所述至少一個合并參數(shù)對所述音頻對象進(jìn)行聚類以產(chǎn)生分離的音頻源的構(gòu)件。
[0021] 用于接收所述至少兩個音頻信號的構(gòu)件可以包括以下中的至少一個：從擴(kuò)音器生成所述音頻信號，其中，所述擴(kuò)音器從至少一個音頻源接收聲波；以及從存儲器接收所述音頻信號，所述音頻信號描述了來自至少一個音頻源的聲波。
[0022] 用于將所述至少兩個音頻信號變換為所述至少兩個信號的頻域表示的構(gòu)件可以包括：用于對所述至少兩個音頻信號實(shí)施時間到頻率變換的構(gòu)件。
[0023] 用于根據(jù)所述至少兩個音頻信號的頻域表示生成所述觀察空間協(xié)方差矩陣的構(gòu) 件可以包括：根據(jù)所述兩個頻域表示的自協(xié)方差生成觀察空間協(xié)方差矩陣。
[0024] 所述裝置可以進(jìn)一步包括：用于通過生成對所述擴(kuò)音器陣列周圍的空間場所進(jìn)行采樣的一組查看方向在頻域中的時間延遲，生成至少一個波束成形器內(nèi)核的構(gòu)件。
[0025] 用于生成至少一個波束成形器內(nèi)核的構(gòu)件可以包括：生成對所述擴(kuò)音器矩陣周圍的空間場所進(jìn)行采樣的一組查看方向在頻域中的時間延遲的自協(xié)方差。
[0026] 用于生成音頻對象的線性模型的構(gòu)件可以包括：對音頻對象量值實(shí)施非負(fù)矩陣因式分解。
[0027] 用于對音頻對象量值實(shí)施非負(fù)矩陣因式分解的構(gòu)件可以包括：用于利用均勻分布在零和一之間的隨機(jī)值對線性模型參數(shù)zkc]、4和V k]進(jìn)行初始化的構(gòu)件。
[0028] 用于對空間協(xié)方差矩陣和所述線性量值模型進(jìn)行合并的構(gòu)件可以包括：用于將所述空間協(xié)方差矩陣模型乘以由所述線性模型表示的量值包絡(luò)的構(gòu)件。
[0029] 用于確定至少一個合并參數(shù)的構(gòu)件可以包括：確定空間協(xié)方差模型參數(shù)，以便最小化所述觀察空間協(xié)方差矩陣和所述空間協(xié)方差模型之間的差別。
[0030] 用于確定所述空間協(xié)方差模型參數(shù)的構(gòu)件可以包括：基于復(fù)值非負(fù)矩陣因式分解實(shí)施迭代式優(yōu)化，從而使得表示所述至少一個音頻對象的所述線性量值模型的參數(shù)被迭代地更新，直到所述線性量值模型參數(shù)在各個更新之間不顯著改變，或者處理了所定義數(shù)量的迭代為止。
[0031] 用于基于復(fù)值非負(fù)因式分解實(shí)施所述迭代式優(yōu)化的構(gòu)件可以包括：用于根據(jù)復(fù)數(shù) 非負(fù)矩陣因式分解的優(yōu)化框架更新線性模型參數(shù)zkc]、hJPVk,的構(gòu)件；以及用于更新所述空間協(xié)方差矩陣模型量值的構(gòu)件。
[0032] 用于更新所述空間協(xié)方差矩陣模型量值的構(gòu)件可以包括：用于更新所述至少兩個音頻信號的估計(jì)量的相對量值差別的構(gòu)件。
[0033] 用于基于所述至少一個合并模型參數(shù)對所述音頻對象進(jìn)行聚類以產(chǎn)生分離的音頻源的構(gòu)件可以包括：用于根據(jù)所述至少一個音頻對象和根據(jù)所估計(jì)的線性量值模型參數(shù) 生成至少一個音頻源的構(gòu)件。
[0034] 所述裝置可以進(jìn)一步包括：用于基于與所述至少一個音頻源相關(guān)聯(lián)的所述至少一個合并模型參數(shù)來合成至少一個音頻信號的構(gòu)件。
[0035] 根據(jù)第三方面，提供了一種裝置，其包括：至少一個處理器以及包括用于一個或多個程序的計(jì)算機(jī)代碼的至少一個存儲器，所述至少一個存儲器和所述計(jì)算機(jī)代碼被配置為與所述至少一個處理器一起促使所述裝置至少：接收至少兩個音頻信號；將所述至少兩個音頻信號變換為所述至少兩個信號的頻域表示；根據(jù)所述至少兩個音頻信號的頻域表示生成觀察空間協(xié)方差矩陣；生成包括至少一個波束成形器內(nèi)核的空間協(xié)方差矩陣模型；生成音頻對象的線性量值模型；將所述空間協(xié)方差矩陣模型和所述線性量值模型進(jìn)行合并；確定至少一個合并參數(shù)，從而使得用于所述合并的所述至少一個參數(shù)嘗試優(yōu)化所述合并；以及基于所述至少一個合并參數(shù)對所述音頻對象進(jìn)行聚類以產(chǎn)生分離的音頻源。
[0036] 接收所述至少兩個音頻信號可以促使所述裝置執(zhí)行以下中的至少一個：接收從擴(kuò) 音器生成的所述音頻信號，其中，所述擴(kuò)音器從至少一個音頻源接收聲波；以及從存儲器接收所述音頻信號，所述音頻信號描述了來自至少一個音頻源的聲波。
[0037] 將所述至少兩個音頻信號變換為所述至少兩個信號的頻域表示可以促使所述裝置對所述至少兩個音頻信號實(shí)施時間到頻率變換。
[0038] 根據(jù)所述至少兩個音頻信號的頻域表示生成所述觀察空間協(xié)方差矩陣可以促使所述裝置：根據(jù)所述兩個頻域表示的自協(xié)方差生成觀察空間協(xié)方差矩陣。
[0039] 可以進(jìn)一步促使所述裝置：通過生成對所述擴(kuò)音器陣列周圍的空間場所進(jìn)行采樣的一組查看方向在頻域中的時間延遲，生成至少一個波束成形器內(nèi)核。
[0040] 生成至少一個波束成形器內(nèi)核可以促使所述裝置：生成對所述擴(kuò)音器陣列周圍的空間場所進(jìn)行采樣的一組查看方向在頻域中的時間延遲的自協(xié)方差。
[0041] 生成音頻對象的線性模型可以促使所述裝置：對音頻對象量值實(shí)施非負(fù)矩陣因式分解。
[0042] 對音頻對象量值實(shí)施非負(fù)矩陣因式分解可以促使所述裝置：利用均勻分布在零和一之間的隨機(jī)值對線性模型參數(shù)zkc]、4和v k]進(jìn)行初始化。
[0043] 將空間協(xié)方差矩陣模型和所述線性量值模型進(jìn)行合并可以促使所述裝置：將所述空間協(xié)方差矩陣模型乘以由所述線性模型表示的量值包絡(luò)。
[0044] 確定至少一個合并參數(shù)可以促使所述裝置：確定空間協(xié)方差模型參數(shù)，以便最小化所述觀察空間協(xié)方差矩陣和所述空間協(xié)方差模型之間的差別。
[0045] 確定所述空間協(xié)方差模型參數(shù)可以促使所述裝置：基于復(fù)值非負(fù)矩陣因式分解實(shí)施迭代式優(yōu)化，從而使得表示所述至少一個音頻對象的線性量值模型的參數(shù)被迭代地更新，直到所述線性量值模型參數(shù)在各個更新之間不顯著改變，或者處理了所定義數(shù)量的迭代為止。
[0046] 基于復(fù)值非負(fù)因式分解實(shí)施所述迭代式優(yōu)化可以促使所述裝置：根據(jù)復(fù)數(shù)非負(fù)矩陣因式分解更新線性模型參數(shù)zk。、tlk和v k];以及更新所述空間協(xié)方差矩陣模型量值。
[0047] 更新所述空間協(xié)方差矩陣模型量值可以促使所述裝置：更新所述至少兩個音頻信號的估計(jì)量的相對量值差別。
[0048] 基于所述至少一個合并模型參數(shù)對所述音頻對象進(jìn)行聚類以產(chǎn)生分離的音頻源可以促使所述裝置：根據(jù)所述至少一個音頻對象和根據(jù)所估計(jì)的線性量值模型生成至少一個音頻源。
[0049] 可以進(jìn)一步促使所述裝置：基于與所述至少一個音頻源相關(guān)聯(lián)的所述至少一個合并模型參數(shù)，合成至少一個音頻信號。
[0050] 根據(jù)第四方面，提供了一種裝置，其包括：輸入端，其被配置為接收至少兩個音頻信號；頻域變換器，其被配置為將所述至少兩個音頻信號變換為所述至少兩個信號的頻域表示；空間協(xié)方差處理器，其被配置為根據(jù)所述至少兩個音頻信號的頻域表示生成觀察空間協(xié)方差矩陣；波束成形器，其被配置為生成包括至少一個波束成形器內(nèi)核的空間協(xié)方差矩陣模型；矩陣因式分解器，其被配置為生成音頻對象的線性量值模型；將所述空間協(xié)方差矩陣模型和所述線性量值模型進(jìn)行合并；以及進(jìn)一步被配置為確定至少一個合并參數(shù)，從而使得用于所述合并的所述至少一個參數(shù)嘗試優(yōu)化所述合并；以及分離器，其被配置為基于所述至少一個合并參數(shù)對所述音頻對象進(jìn)行聚類，以產(chǎn)生分離的音頻源。
[0051] 所述輸入端可以包括以下中的至少一個：至少一個擴(kuò)音器輸入端，其被配置為接收從擴(kuò)音器生成的所述音頻信號，其中，所述擴(kuò)音器從至少一個音頻源接收聲波；以及至少一個存儲器輸入端，其被配置為從存儲器接收所述音頻信號，所述音頻信號描述了來自至少一個音頻源的聲波。
[0052] 所述頻域變換器可被配置為：對所述至少兩個音頻信號實(shí)施時間到頻率變換。
[0053] 所述空間協(xié)方差處理器可被配置為：根據(jù)所述兩個頻域表示的自協(xié)方差生成觀察空間協(xié)方差矩陣。
[0054] 所述波束成形器可被配置為：通過生成對所述擴(kuò)音器陣列周圍的空間場所進(jìn)行采樣的一組查看方向在頻域中的時間延遲，生成至少一個波束成形器內(nèi)核。
[0055] 所述波束成形器可被配置為：生成對所述擴(kuò)音器陣列周圍的空間場所進(jìn)行采樣的一組查看方向在頻域中的所述時間延遲的自協(xié)方差。
[0056] 所述矩陣因式分解器可被配置為：對音頻對象量值實(shí)施非負(fù)矩陣因式分解。
[0057] 所述矩陣因式分解器可被配置

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3 4 5 6

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：M·維勒爾莫;M·塔米;J·尼庫恩;T·維爾塔寧;
技術(shù)所有人：諾基亞技術(shù)有限公司;
我是此專利的發(fā)明人

上一篇：骨傳導(dǎo)裝置和多感官大腦整合方法
上一篇：揚(yáng)聲器裝置的制造方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計(jì) 2.汽車檢測系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

重新裝載音頻裝置相關(guān)技術(shù)

不停重新裝載音頻裝置相關(guān)技術(shù)

大空間智能滅火裝置相關(guān)技術(shù)

空間環(huán)境地面模擬裝置相關(guān)技術(shù)

空間裝置相關(guān)技術(shù)

空間裝置藝術(shù)相關(guān)技術(shù)

亞空間物質(zhì)傳送裝置相關(guān)技術(shù)

大空間滅火裝置相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

空間音頻裝置的制造方法