本申請涉及聲源成像,具體而言,涉及一種聲源成像計算方法、系統(tǒng)、電子設備、存儲介質及計算機程序產品。
背景技術:
1、目前聲學成像技術將聲音信號轉換成圖像信號使空間聲源的分布可視化。通過麥克風陣列采集多通道音頻數(shù)據,并對指定頻率下的上述音頻數(shù)據,通過波束形成延時求和算法計算出麥克風陣列所在平面上的聲源分布信息,并該聲源分布信息與實景圖像融合。在融合后的圖像上確定聲源的空間位置和產生來源。
2、聲源成像技術已廣泛應用于交通運輸、噪聲檢測、工業(yè)異常檢測等多個領域。聲源成像技術能夠直觀、準確地反映聲源的位置和強度,為噪聲控制、故障診斷等方面提供相關技術支持。
3、發(fā)明人發(fā)現(xiàn),常規(guī)的波束形成延時求和算法直接對采集的音頻數(shù)據進行延遲求和處理,利用波束形成和時間差反演出聲源分布,并輸出圖像式結果。由于多通道麥克風陣列會產生自噪聲,導致聲源識別的精確度下降。同時,波束形成延時求和算法中存在大量矩陣卷積運算,傳統(tǒng)的中央處理器架構主要執(zhí)行串行計算,導致計算速度較慢、處理時間較長等問題,并且無法滿足實時性要求。
技術實現(xiàn)思路
1、本申請?zhí)峁┝艘环N聲源成像計算方法、系統(tǒng)、電子設備和存儲介質,用于解決傳統(tǒng)的中央處理器串行計算時間長、計算模型復雜以及難以滿足實時性需求等問題。
2、根據本申請的一方面,本申請?zhí)峁┝艘环N方法,該方法包括:對獲取的音頻數(shù)據進行預處理,以獲得掃描頻率范圍內的中心頻率,其中,音頻數(shù)據是通過麥克風陣列采集的。在視頻收集裝置的可視范圍內劃分聲強網格。確定麥克風陣列到聲強網格的歐式距離矩陣和陣列導向矢量。根據陣列導向矢量和互譜矩陣獲得輸出功率譜矩陣。通過對聲強網格進行著色獲得熱力圖。
3、根據本申請一些實施例,在上述對獲取的音頻數(shù)據進行預處理,以獲得掃描頻率范圍內的中心頻率的步驟之前,該方法還包括:將視頻收集裝置設置在麥克風陣列中心,以麥克風陣列中心為原點建立空間直角坐標系。
4、根據本申請一些實施例,上述對獲取的音頻數(shù)據進行預處理,以獲得掃描頻率范圍內的中心頻率的步驟可以包括:將獲取的音頻數(shù)據按照預設的幀長分幀,得到分幀音頻數(shù)據;將分幀音頻數(shù)據的每一幀與預設的窗函數(shù)相乘,獲得加窗音頻數(shù)據;通過離散傅里葉變換將加窗音頻數(shù)據轉換為頻域音頻數(shù)據;在掃描頻率范圍內掃描頻域音頻數(shù)據的幅值,獲得中心頻率。
5、根據本申請一些實施例,上述在視頻收集裝置的可視范圍內劃分聲強網格的步驟可以包括:在麥克風陣列預設方向上選取一個與麥克風陣列平面平行的矩形區(qū)域;將矩形區(qū)域劃分成預設數(shù)量的網格點,以得到聲強網格。
6、根據本申請一些實施例,上述確定麥克風陣列到聲強網格的歐式距離矩陣和陣列導向矢量的步驟可以包括:根據歐式距離公式計算麥克風陣元和網格點之間的歐式距離,以生成歐式距離矩陣;根據歐式距離矩陣和波數(shù)矩陣,通過cuda架構模型并行計算,第一頻率范圍內每個頻率點下的陣列導向矢量。
7、根據本申請一些實施例,將預處理后的頻域音頻數(shù)據通過cuda架構模型并行處理,基于波束形成延時求和算法確定互譜矩陣。
8、根據本申請一些實施例,上述根據陣列導向矢量和互譜矩陣獲得輸出功率譜矩陣的步驟可以包括:根據陣列導向矢量和互譜矩陣,通過cuda架構模型并行計算每個網格點的輸出功率生成輸出功率譜矩陣。
9、根據本申請一些實施例,上述通過對聲強網格進行著色獲得熱力圖的步驟可以包括:將聲強網格的每個網格點按照輸出功率譜矩陣的輸出功率大小著色,以生成熱力圖。
10、根據本申請一些實施例,對獲取的視頻數(shù)據與熱力圖疊加處理,獲得實時的視頻流;其中,視頻數(shù)據通過視頻收集裝置采集。
11、根據本申請的一方面,本申請還提供了一種系統(tǒng),該系統(tǒng)包括數(shù)據采集模塊、數(shù)據處理模塊、矩陣計算模塊和圖像處理模塊。數(shù)據采集模塊基于視頻收集裝置和麥克風陣列,數(shù)據采集模塊同時且實時采集視頻數(shù)據和音頻數(shù)據。數(shù)據處理模塊用于對獲取的音頻數(shù)據進行預處理;在視頻收集裝置的可視范圍內劃分聲強網格。矩陣計算模塊用于確定麥克風陣列到聲強網格的歐式距離矩陣和陣列導向矢量,根據陣列導向矢量和互譜矩陣獲得輸出功率譜矩陣。圖像處理模塊用于通過對聲強網格進行著色獲得熱力圖。
12、根據本申請的一方面,還提供一種電子設備,包括:一個或多個處理器;存儲裝置,用于存儲一個或多個程序;當一個或多個程序被一個或多個處理器執(zhí)行,使得一個或多個處理器,能夠實現(xiàn)如上文所述的聲源成像高速計算方法。
13、根據本申請的一方面,還提供一種非易失性計算機可讀存儲介質,其上存儲有計算機程序,該計算機程序被處理器執(zhí)行時能夠實現(xiàn)如上文所述的聲源成像高速計算方法。
14、根據本申請的一方面,還提供一種計算機程序產品,包括:存儲在計算機可讀存儲介質上的計算機程序;計算機程序包括程序指令,當程序指令被計算機執(zhí)行時,使計算機執(zhí)行如上文所述的聲源成像高速計算方法。
15、與現(xiàn)有技術相比,本發(fā)明具有以下有益效果:
16、本申請通過gpu(graphics?processing?unit,圖形處理器)基于cuda(computeunified?device?architecture,統(tǒng)一計算設備架構)實現(xiàn)對音頻數(shù)據的并行處理和提高聲源成像的處理速度和準確性。
1.一種聲源成像計算方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,在所述對獲取的所述音頻數(shù)據進行預處理,以獲得掃描頻率范圍內的中心頻率之前,所述方法還包括:
3.根據權利要求1所述的方法,其特征在于,所述對獲取的所述音頻數(shù)據進行預處理,以獲得掃描頻率范圍內的中心頻率包括:
4.根據權利要求1所述的方法,其特征在于,所述在所述視頻收集裝置的可視范圍內劃分聲強網格包括:
5.根據權利要求4所述的方法,其特征在于,所述確定所述麥克風陣列到所述聲強網格的歐式距離矩陣和陣列導向矢量包括:
6.根據權利要求3所述的方法,其特征在于,將預處理后的所述頻域音頻數(shù)據通過所述cuda架構模型并行處理,基于波束形成延時求和算法確定所述互譜矩陣。
7.根據權利要求6所述的方法,其特征在于,所述根據所述陣列導向矢量和互譜矩陣獲得輸出功率譜矩陣包括:
8.根據權利要求4所述的方法,其特征在于,所述通過對所述聲強網格進行著色獲得熱力圖包括:
9.根據權利要求8所述的方法,其特征在于,對獲取的所述視頻數(shù)據與所述熱力圖疊加處理,獲得實時的視頻流;其中,所述視頻數(shù)據通過所述視頻收集裝置采集。
10.一種聲源成像計算系統(tǒng),其特征在于,所述系統(tǒng)包括:
11.一種電子設備,其特征在于,包括:
12.一種非易失性計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權利要求1-9任一所述的聲源成像計算方法。
13.一種計算機程序產品,其特征在于,包括存儲在計算機可讀存儲介質上的計算機程序,所述計算機程序包括程序指令,當所述程序指令被計算機執(zhí)行時,使所述計算機執(zhí)行如權利要求1-9中任一所述的聲源成像計算方法。