音頻識別方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及智能電視技術(shù)領(lǐng)域,尤其涉及一種音頻識別方法及裝置。
【背景技術(shù)】
[0002]隨著智能電視語音識別技術(shù)的高速發(fā)展,用戶在家由傳統(tǒng)的到處找遙控器發(fā)展到現(xiàn)在不用遙控器,直接用嘴告訴電視,用戶喜歡看的影視、連續(xù)劇綜藝節(jié)目等。雖然該種方式比較方便,然而該方式在語音識別環(huán)節(jié)的語音傳送過程中,可能出現(xiàn)PCM(Pulse CodeModulat1n,脈沖編碼調(diào)制)碼流數(shù)據(jù)的丟失,從而造成語音識別的準確度差。例如,小敏拿著自己的無線網(wǎng)的手機對電視說“想看劉德華電影”,在無線網(wǎng)手機麥克風(fēng)將PCM碼流數(shù)據(jù)傳送到TV端,TV端因為傳送過程受到無線網(wǎng)多輻射干擾,集成電路片間總線干擾等因素,造成傳送的PCM碼流數(shù)據(jù)出現(xiàn)丟失,將丟失“影(0X1100,0X1000,丟失數(shù)據(jù))”的碼流數(shù)據(jù)上傳到云端,識別出想看劉德華電字串,在TV上顯示出劉德華電,此時,就造成小敏的困惑,因為劉德華有電影,劉德華有電視劇等等。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的主要目的在于提供一種音頻識別方法及裝置,旨在解決語音傳送過程中,出現(xiàn)PCM碼流數(shù)據(jù)的丟失,從而造成語音識別的準確度差的問題。
[0004]為實現(xiàn)上述目的,本發(fā)明提供的一種音頻識別方法,所述音頻識別方法包括:
[0005]獲取音頻緩存區(qū)中存儲的音頻數(shù)據(jù),其中,終端在接收到音頻數(shù)據(jù)時,將接收到的音頻數(shù)據(jù)存儲至所述音頻緩存區(qū)中;
[0006]獲取所述音頻數(shù)據(jù)的第一特征信息以及終端當(dāng)前顯示界面中各個字符的第二特征信息;
[0007]確定當(dāng)前顯示界面的各個字符中所述第二特征信息與所述第一特征信息匹配的字符;
[0008]將確定的所述字符作為與所述音頻數(shù)據(jù)匹配的字符。
[0009]可選地,所述獲取所述音頻數(shù)據(jù)的第一特征信息的步驟包括:
[0010]確定所述音頻數(shù)據(jù)的碼流中的最大碼值以及最小碼值;
[0011]獲取所述音頻數(shù)據(jù)的碼流中出現(xiàn)最大碼值的數(shù)據(jù)時刻以及出現(xiàn)最小碼值的數(shù)據(jù)時刻之間的碼值;
[0012]根據(jù)獲取到的所述碼值計算所述音頻數(shù)據(jù)的第一特征信息。
[0013]可選地,所述根據(jù)獲取到的所述碼值計算所述音頻數(shù)據(jù)的第一特征信息的步驟包括:
[0014]對所獲取到的所述碼值進行求和得到所述音頻數(shù)據(jù)的校驗值;
[0015]按照預(yù)設(shè)的左移算法對所述校驗值進行左移處理,以得到所述音頻數(shù)據(jù)的第一特征信息。
[0016]可選地,獲取終端當(dāng)前顯示界面中各個字符的第二特征信息的步驟包括:
[0017]獲取終端當(dāng)前顯示界面中所述各個字符在預(yù)設(shè)的字符文件中重復(fù)出現(xiàn)的比例;
[0018]判斷所述各個字符重復(fù)出現(xiàn)的比例是否大于第一預(yù)設(shè)比例;
[0019]若是,則按照各個字符重復(fù)出現(xiàn)的比例依次從云端獲取各個字符對應(yīng)的第二特征
?目息。
[0020]可選地,所述獲取音頻緩存區(qū)中存儲的音頻數(shù)據(jù)的步驟之前,所述音頻識別方法還包括:
[0021]確定所述音頻緩存區(qū)中存儲的音頻數(shù)據(jù)中碼值大于1的音頻數(shù)據(jù)的個數(shù)以及所述音頻數(shù)據(jù)的第二預(yù)設(shè)比例所對應(yīng)的音頻數(shù)據(jù)的個數(shù);
[0022]判斷音頻數(shù)據(jù)中碼值大于1的音頻數(shù)據(jù)的個數(shù)是否大于所述音頻數(shù)據(jù)的第二預(yù)設(shè)比例所對應(yīng)的音頻數(shù)據(jù)的個數(shù);
[0023]若是,則執(zhí)行獲取音頻緩存區(qū)中存儲的音頻數(shù)據(jù)的步驟。
[0024]此外,為實現(xiàn)上述目的,本發(fā)明還提供一種音頻識別裝置,所述音頻識別裝置包括:
[0025]第一獲取模塊,用于獲取音頻緩存區(qū)中存儲的音頻數(shù)據(jù),其中,終端在接收到音頻數(shù)據(jù)時,將接收到的音頻數(shù)據(jù)存儲至所述音頻緩存區(qū)中;
[0026]第二獲取模塊,用于獲取所述音頻數(shù)據(jù)的第一特征信息以及終端當(dāng)前顯示界面中各個字符的第二特征信息;
[0027]確定模塊,用于確定當(dāng)前顯示界面的各個字符中所述第二特征信息與所述第一特征信息匹配的字符。
[0028]匹配模塊,用于將確定的所述字符作為與所述音頻數(shù)據(jù)匹配的字符。
[0029]可選地,所述第二獲取模塊包括:
[0030]確定單元,用于確定所述音頻數(shù)據(jù)的碼流中的最大碼值以及最小碼值;
[0031]獲取單元,用于獲取所述音頻數(shù)據(jù)的碼流中出現(xiàn)最大碼值的數(shù)據(jù)時刻以及出現(xiàn)最小碼值的數(shù)據(jù)時刻之間的碼值;
[0032]計算單元,用于根據(jù)獲取到的所述碼值計算所述音頻數(shù)據(jù)的第一特征信息。
[0033]可選地,所述計算單元包括:
[0034]求和子單元,用于對所獲取到的所述碼值進行求和得到所述音頻數(shù)據(jù)的校驗值;
[0035]處理子單元,用于按照預(yù)設(shè)的左移算法對所述校驗值進行左移處理,以得到所述音頻數(shù)據(jù)的第一特征信息。
[0036]可選地,所述第二獲取模塊還包括:
[0037]所述獲取單元,還用于獲取終端當(dāng)前顯示界面中所述各個字符在預(yù)設(shè)的字符文件中重復(fù)出現(xiàn)的比例;
[0038]判斷單元,用于判斷所述各個字符重復(fù)出現(xiàn)的比例是否大于第一預(yù)設(shè)比例;
[0039]所述獲取單元,還用于若所述各個字符重復(fù)出現(xiàn)的比例大于第一預(yù)設(shè)比例,則按照各個字符重復(fù)出現(xiàn)的比例依次從云端獲取各個字符對應(yīng)的第二特征信息。
[0040]可選地,所述音頻識別裝置還包括:
[0041]所述確定模塊,還用于確定所述音頻緩存區(qū)中存儲的音頻數(shù)據(jù)中碼值大于1的音頻數(shù)據(jù)的個數(shù)以及所述音頻數(shù)據(jù)的第二預(yù)設(shè)比例所對應(yīng)的音頻數(shù)據(jù)的個數(shù);
[0042]判斷模塊,用于判斷音頻數(shù)據(jù)中碼值大于1的音頻數(shù)據(jù)的個數(shù)是否大于所述音頻數(shù)據(jù)的第二預(yù)設(shè)比例所對應(yīng)的音頻數(shù)據(jù)的個數(shù);
[0043]所述第一獲取模塊,還用于若音頻數(shù)據(jù)中碼值大于1的音頻數(shù)據(jù)的個數(shù)大于所述音頻數(shù)據(jù)的第二預(yù)設(shè)比例所對應(yīng)的音頻數(shù)據(jù)的個數(shù),則獲取音頻緩存區(qū)中存儲的音頻數(shù)據(jù)。
[0044]本發(fā)明通過獲取音頻數(shù)據(jù)的特征信息,并將所述音頻數(shù)據(jù)的特征信息與從云端獲取的終端當(dāng)前顯示界面的各個字符數(shù)據(jù)對應(yīng)的特征信息進行匹配,使得即使音頻數(shù)據(jù)存在丟失的情況,也能根據(jù)所述音頻數(shù)據(jù)的特征信息與所述各個字符數(shù)據(jù)對應(yīng)的特征信息進行匹配,從而識別出所述音頻數(shù)據(jù)對應(yīng)的字符,提高了語音識別準確度。
【附圖說明】
[0045]圖1為本發(fā)明音頻識別方法的第一實施例的流程示意圖;
[0046]圖2為圖1中所述獲取所述音頻數(shù)據(jù)的第一特征信息的細化流程示意圖;
[0047]圖3為圖2中根據(jù)獲取到的所述碼值計算所述音頻數(shù)據(jù)的第一特征信息的細化流程不意圖;
[0048]圖4為圖1中獲取終端當(dāng)前顯示界面中各個字符的第二特征信息的細化流程示意圖;
[0049]圖5為本發(fā)明音頻識別方法的第二實施例的流程示意圖;
[0050]圖6為本發(fā)明音頻識別裝置的第一實施例的功能模塊示意圖;
[0051 ]圖7為圖6中第二獲取模塊的細化功能模塊示意圖;
[0052]圖8為本發(fā)明音頻識別裝置的第二實施例的功能模塊示意圖。
[0053]本發(fā)明目的的實現(xiàn)、功能特點及優(yōu)點將結(jié)合實施例,參照附圖做進一步說明。
【具體實施方式】
[0054]應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0055]基于上述問題,本發(fā)明提供一種音頻識別方法。
[0056]參照圖1,圖1為本發(fā)明音頻識別方法的第一實施例的流程示意圖。
[0057]在本實施例中,所述音頻識別方法包括:
[0058]步驟S10,獲取音頻緩存區(qū)中存儲的音頻數(shù)據(jù),其中,終端在接收到音頻數(shù)據(jù)時,將接收到的音頻數(shù)據(jù)存儲至所述音頻緩存區(qū)中;
[0059]在本實施例中,所述終端可為智能電視,以下以智能電視為例進行說明。智能電視偵測到語音PCM碼流輸入時,將接收到的語音PCM碼流(音頻數(shù)據(jù))存儲至音頻緩存區(qū)中,然后實時或定時檢測所述音頻緩存區(qū)是否存在音頻數(shù)據(jù),并在檢測到所述音頻緩存區(qū)存在音頻數(shù)據(jù)后,獲取所述音頻緩存區(qū)中的音頻數(shù)據(jù)。例如,獲取到所述音頻緩存區(qū)的第一存儲單元存儲的數(shù)據(jù)為0x50,S卩APCM_Data(xl) =0x50;獲取到所述音頻緩存區(qū)的第二存儲單元存儲的數(shù)據(jù)為0x40,即 APCM_Data(x2) =0x40。
[0060]步驟S20,獲取所述音頻數(shù)據(jù)的第一特征信息以及終端當(dāng)前顯示界面中各個字符的第二特征信息;
[0061]當(dāng)智能電視獲取到音頻緩存區(qū)中存儲的音頻數(shù)據(jù)后,對所述音頻數(shù)據(jù)進行求和及移位處理,從而得到所述音頻數(shù)據(jù)的第一特征信息,例如,經(jīng)過對所述音頻數(shù)據(jù)求和及移位處理后,得到所述音頻數(shù)據(jù)的第一的特征信息為OxOAOO。在本實施例中,所述音頻數(shù)據(jù)為智能電視的控制指令對應(yīng)的語音PCM碼流數(shù)據(jù),包括人名、一些特定的名詞對應(yīng)的語音PCM碼流數(shù)據(jù)等。所述第一特征信息為所述音頻數(shù)據(jù)的校驗數(shù)據(jù),該檢驗數(shù)據(jù)是唯一的,即每個音頻數(shù)據(jù)的校驗數(shù)據(jù)唯一代表一個音頻數(shù)據(jù)。
[0062]在獲取到所述音頻數(shù)據(jù)的第一特征信息后,獲取終端當(dāng)前顯示界