智能語音分離器的制造方法
【技術(shù)領(lǐng)域】
[0001]本實用新型涉及語音信號分離領(lǐng)域,尤其涉及一種用于在多種音源混合的情況下,在背景源下,分離出自己感興趣的語音信號的語音分離設(shè)備。
【背景技術(shù)】
[0002]目前市面上的語音分離器如ADSL都是基于物理隔離,即基于傳統(tǒng)語音電話線路上共線傳輸寬帶數(shù)字信號,利用線路上傳輸語音信號的頻率信息高低差來進(jìn)行分離,應(yīng)用范圍受限,語音信息單一,對復(fù)雜的語音信號無法處理。
【實用新型內(nèi)容】
[0003]針對現(xiàn)有語音分離器應(yīng)用背景單一、分離語音流受限的缺點,申請人經(jīng)過研宄改進(jìn),提供一種可以在復(fù)雜的混合語音中有效地選取并分離出自己感興趣的聲音流的智能語音分離器。
[0004]本實用新型的技術(shù)方案如下:
[0005]一種智能語音分離器,包括聲源采集模塊、語音輸出模塊、音頻轉(zhuǎn)換模塊、語音分離及再合成模塊、單片機(jī)模塊、SRAM、FlashROM、快捷控制器及液晶顯示終端;所述聲源采集模塊經(jīng)音頻轉(zhuǎn)換模塊連接在語音分離及再合成模塊的語音信號輸入端,所述語音輸出模塊經(jīng)音頻轉(zhuǎn)換模塊連接在語音分離及再合成模塊的語音信號輸出端,所述單片機(jī)模塊與語音分離及再合成模塊相連接,所述SRAM和FlashROM分別連接在語音分離及再合成模塊上,所述快捷控制器和液晶顯示終端分別連接在單片機(jī)模塊上。
[0006]其中,所述聲源采集模塊為麥克風(fēng)點陣采集器,所述語音輸出模塊為集成電路LC2093,所述音頻轉(zhuǎn)換模塊為集成電路TLC320Ad50,所述語音分離及再合成模塊為集成電路TMS320VC5402,所述單片機(jī)模塊為89C52單片機(jī)。
[0007]本實用新型的有益技術(shù)效果是:
[0008]1、本實用新型的終端聲源采集提供多種方式采集語音信號,可以通過麥克風(fēng)陣列對聲音進(jìn)行采集并自動存儲,也可以直接用USB接口直接傳輸現(xiàn)有的語音信息;分離后的語音信息通過LC2093播放器輸出。
[0009]2、本實用新型語音分離合成的核心部件是TMS320VC5402,有對應(yīng)的存儲區(qū),存放數(shù)據(jù)段和代碼段,代碼是基于現(xiàn)有的聽覺場景的神經(jīng)網(wǎng)絡(luò)振蕩器的快速算法而成,速度快,穩(wěn)定性好。
[0010]3、本實用新型語音分離后的多個語音流,提供交互式控制和管理,可以通過快捷控制器和液晶控制終端進(jìn)行試交互控制語音信息的I/o過程。
[0011]4、本實用新型體積小,便于攜帶,可廣泛應(yīng)用于刑偵等領(lǐng)域。
[0012]本實用新型的優(yōu)點將在下面【具體實施方式】部分的描述中給出,部分將從下面的描述中變得明顯,或通過本實用新型的實踐了解到。
【附圖說明】
[0013]圖1是本實用新型一個實施例的電路結(jié)構(gòu)框圖。
【具體實施方式】
[0014]下面結(jié)合附圖對本實用新型的【具體實施方式】做進(jìn)一步說明。
[0015]如圖1所示,本實用新型主要由聲源采集模塊1、語音輸出模塊2,音頻轉(zhuǎn)換模塊3、語音分離及再合成模塊4、單片機(jī)模塊5組成,并輔以SRAM 6,FlashROM 7、快捷控制器8及液晶顯示終端9。
[0016]聲源采集模塊I以及語音輸出模塊2作為I/O模塊。其中,聲源采集模塊I在本實施例中采用麥克風(fēng)點陣采集器,通過麥克風(fēng)點陣序列來采集語音信號,對采集到的信號實時截斷以及自動保存;語音輸出模塊2在本實施例中采用LC2093播放器,實時播放分離后的語音信息流。
[0017]音頻轉(zhuǎn)換模塊3在本實施例中采用TLC320Ad50,在數(shù)據(jù)采集系統(tǒng)中實現(xiàn)語音信號的A/D轉(zhuǎn)換,為下一步信號數(shù)據(jù)的分離做輸入準(zhǔn)備;同時也實現(xiàn)語音信號的D/A轉(zhuǎn)換,為合成后的信號數(shù)據(jù)做下一步的輸出準(zhǔn)備。
[0018]語音分離及再合成模塊4在本實施例中采用TMS320VC5402。TMS320VC5402輔以SRAM 6、FlashROM 7結(jié)構(gòu),SRAM 6用來存放數(shù)據(jù),F(xiàn)lashROM 7用來存放神經(jīng)網(wǎng)絡(luò)振蕩器語音處理程序。神經(jīng)網(wǎng)絡(luò)振蕩器語音處理程序為現(xiàn)有技術(shù),可參見Wang.D.L and Brown.G.J,Separat1n of speech from interfering sounds based on oscillatory correlat1n.1EEEo該程序首先通過耳蝸濾波器對信號進(jìn)行處理,將聲音信號分配到不同的頻帶中去,形成聲音能量的時-頻分布,濾波器組所覆蓋的頻率范圍從80Hz直到500Hz ;通過雙層振蕩器對分離后的時頻信號進(jìn)行歸類,分為不同的語音流;再通過合成模塊從時一頻域重建語音,使用Ga_atone濾波器對語音分塊組合,最后清晰地從終端輸出平臺獲得混合語音的分離結(jié)果。
[0019]快捷控制器8和液晶顯示終端9由單片機(jī)模塊5控制,單片機(jī)模塊5在本實施例中采用89C52,89C52把快捷控制器8或液晶顯示終端9的鍵盤操作轉(zhuǎn)換為控制信號再傳送給語音分離及再合成模塊4,控制系統(tǒng)的分離和合成工作。
[0020]液晶顯示終端9具有較好的人機(jī)界面,對整個操作提供一個較好的操作平臺,對采集的信號可以實時截斷保存,同時具有語音分離、合成以及回放等操作。
[0021]附帶一提,從事本領(lǐng)域者能根據(jù)產(chǎn)品性能要求及成本考慮的不同自行決定所采用的具體的電路元器件的型號,形成所需之產(chǎn)品,本發(fā)明并不限制所述電路元器件的型號即為上述實施例中的各型號。
[0022]本實用新型根據(jù)前端錄音設(shè)備采集到的語音信息,通過周期調(diào)制、頻率過濾以及首尾截斷來識別分離語音流,最后輸出多個獨立的語音信息流??梢栽诙喾N聲源混合的情況下,分離出多個語音流,追蹤感興趣的有意義的信息,具有穩(wěn)定性好,體積小、便于攜帶、耗電省等特點,可以應(yīng)用在刑偵、語音識別、語音人機(jī)界面等領(lǐng)域。
[0023]以上所述的僅是本實用新型的優(yōu)選實施方式,本實用新型不限于以上實施例??梢岳斫?,本領(lǐng)域技術(shù)人員在不脫離本實用新型的基本構(gòu)思的前提下直接導(dǎo)出或聯(lián)想到的其他改進(jìn)和變化,均應(yīng)認(rèn)為包含在本實用新型的保護(hù)范圍之內(nèi)。
【主權(quán)項】
1.一種智能語音分離器,其特征在于:包括聲源采集模塊(I)、語音輸出模塊(2)、音頻轉(zhuǎn)換模塊(3)、語音分離及再合成模塊(4)、單片機(jī)模塊(5)、SRAM(6)、FlashR0M(7)、快捷控制器(8)及液晶顯示終端(9);所述聲源采集模塊(I)經(jīng)音頻轉(zhuǎn)換模塊(3)連接在語音分離及再合成模塊(4)的語音信號輸入端,所述語音輸出模塊(2)經(jīng)音頻轉(zhuǎn)換模塊(3)連接在語音分離及再合成模塊(4)的語音信號輸出端,所述單片機(jī)模塊(5)與語音分離及再合成模塊(4)相連接,所述SRAM(6)和FlashROM(7)分別連接在語音分離及再合成模塊(4)上,所述快捷控制器(8)和液晶顯示終端(9)分別連接在單片機(jī)模塊(5)上。
2.根據(jù)權(quán)利要求1所述的智能語音分離器,其特征在于:其中,所述聲源采集模塊(I)為麥克風(fēng)點陣采集器。
3.根據(jù)權(quán)利要求1所述的智能語音分離器,其特征在于:其中,所述語音輸出模塊(2)為集成電路LC2093。
4.根據(jù)權(quán)利要求1所述的智能語音分離器,其特征在于:其中,所述音頻轉(zhuǎn)換模塊(3)為集成電路TLC320Ad50。
5.根據(jù)權(quán)利要求1所述的智能語音分離器,其特征在于:其中,所述語音分離及再合成模塊(4)為集成電路TMS320VC5402。
6.根據(jù)權(quán)利要求1所述的智能語音分離器,其特征在于:其中,所述單片機(jī)模塊(5)為89C52單片機(jī)。
【專利摘要】本實用新型公開一種智能語音分離器,包括聲源采集模塊、語音輸出模塊、音頻轉(zhuǎn)換模塊、語音分離及再合成模塊、單片機(jī)模塊、SRAM、FlashROM、快捷控制器及液晶顯示終端;聲源采集模塊經(jīng)音頻轉(zhuǎn)換模塊連接在語音分離及再合成模塊的信號輸入端,語音輸出模塊經(jīng)音頻轉(zhuǎn)換模塊連接在語音分離及再合成模塊的信號輸出端,單片機(jī)模塊與語音分離及再合成模塊相連接,SRAM和FlashROM分別連接在語音分離及再合成模塊上,快捷控制器和液晶顯示終端分別連接在單片機(jī)模塊上。本實用新型可以在多種聲源混合的情況下,分離出多個語音流,追蹤感興趣的有意義的信息,具有穩(wěn)定性好,體積小、便于攜帶、耗電省等特點,可以應(yīng)用在刑偵、語音識別、語音人機(jī)界面等領(lǐng)域。
【IPC分類】G10L21-0272
【公開號】CN204303343
【申請?zhí)枴緾N201420842341
【發(fā)明人】王想實
【申請人】無錫職業(yè)技術(shù)學(xué)院
【公開日】2015年4月29日
【申請日】2014年12月25日