本發(fā)明涉及音頻處理技術(shù)領(lǐng)域,特別涉及一種音頻識(shí)別方法及裝置。
背景技術(shù):
隨著網(wǎng)絡(luò)應(yīng)用技術(shù)的不斷發(fā)展,音樂(lè)播放類應(yīng)用的功能也越來(lái)越豐富,哼唱識(shí)別就是其中一種新興的功能。
在現(xiàn)有的哼唱識(shí)別系統(tǒng)中,用戶在終端中啟動(dòng)音樂(lè)播放類應(yīng)用的哼唱識(shí)別功能,并對(duì)著終端的麥克風(fēng)哼唱一段音樂(lè),之后,終端提取出這段哼唱語(yǔ)音的音高序列,再將這些音高序列發(fā)送到服務(wù)器,由服務(wù)器將該音高序列與歌曲庫(kù)中存儲(chǔ)的歌曲的音高序列作對(duì)比,找出歌曲庫(kù)中與這一段音高序列最匹配的歌曲,最后將查找結(jié)果返回給終端。
在實(shí)現(xiàn)本發(fā)明的過(guò)程中,申請(qǐng)人發(fā)現(xiàn)現(xiàn)有技術(shù)存在如下問(wèn)題:
用戶通過(guò)哼唱識(shí)別歌曲時(shí),可能只記得一小段旋律,而這一小段旋律并不能滿足現(xiàn)有的哼唱識(shí)別功能的最低長(zhǎng)度要求,因此需要用戶再多哼唱幾段,而多哼唱的幾段準(zhǔn)確性通常不高,導(dǎo)致哼唱識(shí)別的準(zhǔn)確性較低。
技術(shù)實(shí)現(xiàn)要素:
為了解決現(xiàn)有技術(shù)中哼唱識(shí)別的準(zhǔn)確性較低的問(wèn)題,本發(fā)明實(shí)施例提供了一種音頻識(shí)別方法及裝置,技術(shù)方案如下:
第一方面,提供了一種音頻識(shí)別方法,所述方法包括:
獲取待識(shí)別音頻的原始音高序列,所述原始音高序列用于指示所述待識(shí)別音頻在各個(gè)時(shí)間點(diǎn)上的頻率;
將所述原始音高序列切分成多個(gè)音高子序列;
對(duì)所述原始音高序列和所述多個(gè)音高子序列分別進(jìn)行識(shí)別;
將對(duì)所述原始音高序列和所述多個(gè)音高子序列分別進(jìn)行識(shí)別所獲得的識(shí)別結(jié)果進(jìn)行合并,獲得對(duì)所述待識(shí)別音頻的識(shí)別結(jié)果。
第二方面,提供了一種音頻識(shí)別裝置,所述裝置包括:
序列獲取模塊,用于獲取待識(shí)別音頻的原始音高序列,所述原始音高序列用于指示所述待識(shí)別音頻在各個(gè)時(shí)間點(diǎn)上的頻率;
切分模塊,用于將所述原始音高序列切分成多個(gè)音高子序列;
識(shí)別模塊,用于對(duì)所述原始音高序列和所述多個(gè)音高子序列分別進(jìn)行識(shí)別;
合并模塊,用于將對(duì)所述原始音高序列和所述多個(gè)音高子序列分別進(jìn)行識(shí)別所獲得的識(shí)別結(jié)果進(jìn)行合并,獲得對(duì)所述待識(shí)別音頻的識(shí)別結(jié)果。
本發(fā)明實(shí)施例提供的技術(shù)方案可以包括以下有益效果:
通過(guò)將待識(shí)別音頻的原始音高序列切分成多個(gè)音高子序列,對(duì)該原始音高序列和該多個(gè)音高子序列分別進(jìn)行識(shí)別,并將對(duì)該原始音高序列和該多個(gè)音高子序列分別進(jìn)行識(shí)別所獲得的識(shí)別結(jié)果進(jìn)行合并,獲得對(duì)該待識(shí)別音頻的識(shí)別結(jié)果,將一個(gè)長(zhǎng)音高序列切分成多個(gè)短音高序列,并對(duì)長(zhǎng)音高序列和多個(gè)短音高序列分別進(jìn)行識(shí)別,并將識(shí)別結(jié)果進(jìn)行整合,從而達(dá)到提高哼唱識(shí)別的準(zhǔn)確性的效果。
應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本發(fā)明。
附圖說(shuō)明
此處的附圖被并入說(shuō)明書中并構(gòu)成本說(shuō)明書的一部分,示出了符合本發(fā)明的實(shí)施例,并與說(shuō)明書一起用于解釋本發(fā)明的原理。
圖1是本發(fā)明各個(gè)實(shí)施例涉及的一種實(shí)施環(huán)境的示意圖;
圖2是根據(jù)一示例性實(shí)施例示出的一種音頻識(shí)別方法的流程圖;
圖3是根據(jù)另一示例性實(shí)施例示出的一種音頻識(shí)別方法的流程圖;
圖4是根據(jù)一示例性實(shí)施例示出的一種音高序列切分方法的流程圖;
圖5是根據(jù)一示例性實(shí)施例示出的一種音頻識(shí)別裝置的框圖;
圖6是根據(jù)另一示例性實(shí)施例示出的一種音頻識(shí)別裝置的框圖;
圖7是根據(jù)一示例性實(shí)施例示出的一種服務(wù)器的結(jié)構(gòu)示意圖;
圖8是根據(jù)一示例性實(shí)施例示出的一種終端的結(jié)構(gòu)示意圖。
具體實(shí)施方式
這里將詳細(xì)地對(duì)示例性實(shí)施例進(jìn)行說(shuō)明,其示例表示在附圖中。下面的描述涉及附圖時(shí),除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實(shí)施例中所描述的實(shí)施方式并不代表與本發(fā)明相一致的所有實(shí)施方式。相反,它們僅是與如所附權(quán)利要求書中所詳述的、本發(fā)明的一些方面相一致的裝置和方法的例子。
圖1是本發(fā)明各個(gè)實(shí)施例涉及的一種實(shí)施環(huán)境的示意圖。如圖1所示,該實(shí)施環(huán)境包括:終端110以及服務(wù)器120。
終端110可以是智能手機(jī)、平板電腦、膝上型便攜計(jì)算機(jī)以及個(gè)人計(jì)算機(jī)等等。
服務(wù)器120可以是獨(dú)立的一個(gè)服務(wù)器,或者,服務(wù)器120也可以是由分別實(shí)現(xiàn)不同功能的多個(gè)服務(wù)器所組成的服務(wù)器集群,或者,服務(wù)器120也可以是一個(gè)云計(jì)算中心。
終端110和服務(wù)器120之間通過(guò)有線或者無(wú)線網(wǎng)絡(luò)連接并進(jìn)行數(shù)據(jù)交互。
圖2是根據(jù)一示例性實(shí)施例示出的一種音頻識(shí)別方法的流程圖,該方法可以實(shí)現(xiàn)在上述圖1所示的實(shí)施環(huán)境中。如圖2所示,該音頻識(shí)別方法可以包括如下幾個(gè)步驟:
步驟201,獲取待識(shí)別音頻的原始音高序列,該原始音高序列用于指示該待識(shí)別音頻在各個(gè)時(shí)間點(diǎn)上的頻率。
步驟202,將該原始音高序列切分成多個(gè)音高子序列。
步驟203,對(duì)該原始音高序列和該多個(gè)音高子序列分別進(jìn)行識(shí)別。
步驟204,將對(duì)該原始音高序列和該多個(gè)音高子序列分別進(jìn)行識(shí)別所獲得的識(shí)別結(jié)果進(jìn)行合并,獲得對(duì)該待識(shí)別音頻的識(shí)別結(jié)果。
綜上所述,本發(fā)明實(shí)施例提供的一種音頻識(shí)別方法,將待識(shí)別音頻的原始音高序列切分成多個(gè)音高子序列,對(duì)該原始音高序列和該多個(gè)音高子序列分別進(jìn)行識(shí)別,并將對(duì)該原始音高序列和該多個(gè)音高子序列分別進(jìn)行識(shí)別所獲得的識(shí)別結(jié)果進(jìn)行合并,獲得對(duì)該待識(shí)別音頻的識(shí)別結(jié)果,通過(guò)將一個(gè)長(zhǎng)音高序列切分成多個(gè)短音高序列,并對(duì)長(zhǎng)音高序列和多個(gè)短音高序列分別進(jìn)行識(shí)別,并將識(shí)別結(jié)果進(jìn)行整合,從而達(dá)到提高哼唱識(shí)別的準(zhǔn)確性的效果。
圖3是根據(jù)另一示例性實(shí)施例示出的一種音頻識(shí)別方法的流程圖,該方法可以實(shí)現(xiàn)在上述圖1所示的實(shí)施環(huán)境中。如圖3所示,該音頻識(shí)別方法可以包括如下幾個(gè)步驟:
步驟301,獲取待識(shí)別音頻的原始音高序列,該原始音高序列用于指示該待識(shí)別音頻在各個(gè)時(shí)間點(diǎn)上的頻率。
其中,該待識(shí)別音頻可以是上述圖1所示實(shí)施環(huán)境中的終端通過(guò)其內(nèi)置或外接的音頻采集單元(比如麥克風(fēng))采集到的音頻。比如,以終端為智能手機(jī)為例,用戶打開智能手機(jī)中的音樂(lè)播放類應(yīng)用app,啟動(dòng)哼唱識(shí)別功能后,對(duì)著智能手機(jī)的麥克風(fēng)哼唱一段音頻,智能手機(jī)的麥克風(fēng)將采集到的音頻獲取為該待識(shí)別音頻。
對(duì)該待識(shí)別音頻中各個(gè)播放時(shí)間點(diǎn)上的音高依次進(jìn)行提取,即可以獲得原始音高序列,其中,音高即音的高度,是聲音的基本特征之一,音高是由振動(dòng)頻率決定的,且兩者成正比關(guān)系。
步驟302,將該原始音高序列切分成多個(gè)音高子序列。
原始音高序列中音高數(shù)值為0表示用戶錄制該待識(shí)別音頻時(shí),在該0值音高對(duì)應(yīng)的時(shí)間點(diǎn)上有一個(gè)停頓,且連續(xù)的0值音高越多,說(shuō)明用戶停頓的時(shí)間越長(zhǎng)。因此,本發(fā)明實(shí)施例所示的方案可以根據(jù)原始音高序列中數(shù)值為0的音高所在的位置對(duì)原始音高序列進(jìn)行切分。
步驟303,對(duì)該原始音高序列和該多個(gè)音高子序列分別進(jìn)行識(shí)別。
在本發(fā)明實(shí)施例所示的方法中,為了降低匹配計(jì)算的復(fù)雜度,可以先通過(guò)第一匹配算法,將該原始音高序列與預(yù)先設(shè)置的各個(gè)序列樣本進(jìn)行匹配,確定與該原始音頻序列之間的匹配值最高的n個(gè)序列樣本,再通過(guò)第二匹配算法,將該原始音高序列和該多個(gè)音高子序列分別與該n個(gè)序列樣本進(jìn)行匹配。
或者,也可以將原始音高序列和音高子序列分別通過(guò)第一匹配算法和第二匹配算法與預(yù)先設(shè)置的各個(gè)序列樣本進(jìn)行匹配,即通過(guò)第一匹配算法,對(duì)原始音高序列和多個(gè)音高子序列中的任一序列,將該序列與預(yù)先設(shè)置的各個(gè)序列樣本進(jìn)行匹配,確定與該序列之間的匹配值最高的n個(gè)序列樣本,再通過(guò)第二匹配算法,對(duì)原始音高序列和多個(gè)音高子序列中的任一序列,將該序列與n個(gè)序列樣本進(jìn)行匹配。
其中,第一匹配算法的精度比第二匹配算法的精度低,比如,第一匹配算法可以是emd(empiricalmodedecomposition,經(jīng)驗(yàn)?zāi)B(tài)分解)算法、linearscale(線性標(biāo)度)算法等,第二匹配算法可以是dtw(dynamictimewarping,動(dòng)態(tài)時(shí)間歸整)算法。在進(jìn)行匹配時(shí),可以通過(guò)第一匹配算法,將原始音高序列與預(yù)先存儲(chǔ)的各個(gè)序列樣本進(jìn)行匹配度計(jì)算,快速確定出與原始音高序列之間的匹配度最高的n個(gè)序列樣本,再通過(guò)第二匹配算法,計(jì)算原始音高序列和多個(gè)音高子序列分別與該n個(gè)序列樣本之間的匹配度。或者,也可以通過(guò)第一匹配算法和第二匹配算法,將原始音高序列和多個(gè)音高子序列分別單獨(dú)與預(yù)先存儲(chǔ)的各個(gè)序列樣本進(jìn)行匹配。在本發(fā)明實(shí)施例中,可以預(yù)先存儲(chǔ)若干音頻(比如歌曲),上述每個(gè)序列樣本是其中一個(gè)音頻的音高序列。
需要說(shuō)明的是,在上述步驟302和步驟303中,將該原始音高序列切分成多個(gè)音高子序列的執(zhí)行時(shí)刻可以在步驟303之前,也可以在步驟303的執(zhí)行過(guò)程中。比如,可以先將原始音高序列切分為多個(gè)音高子序列,然后再通過(guò)第一匹配算法,將該原始音高序列與預(yù)先設(shè)置的各個(gè)序列樣本進(jìn)行匹配,最后再通過(guò)第二匹配算法,將該原始音高序列和該多個(gè)音高子序列分別與該n個(gè)序列樣本進(jìn)行匹配?;蛘撸部梢韵韧ㄟ^(guò)第一匹配算法,將該原始音高序列與預(yù)先設(shè)置的各個(gè)序列樣本進(jìn)行匹配,然后再將原始音高序列切分為多個(gè)音高子序列,最后通過(guò)第二匹配算法,將該原始音高序列和該多個(gè)音高子序列分別與該n個(gè)序列樣本進(jìn)行匹配。
步驟304,對(duì)該原始音高序列和該多個(gè)音高子序列中每一個(gè)序列,根據(jù)該序列對(duì)應(yīng)的識(shí)別結(jié)果中包含的n個(gè)序列樣本各自與該序列之間的匹配度對(duì)該n個(gè)序列樣本進(jìn)行評(píng)分,該序列樣本與該序列之間的匹配度與該序列樣本的評(píng)分成正比例關(guān)系。
其中,對(duì)于該原始音高序列和該多個(gè)音高子序列中每一個(gè)序列,該序列對(duì)應(yīng)的識(shí)別結(jié)果中包含n個(gè)序列樣本以及該n個(gè)序列樣本各自與該序列之間的匹配度,n為大于或者等于1的整數(shù)。
對(duì)于原始音高序列和多個(gè)音高子序列中每一個(gè)序列,該序列對(duì)應(yīng)的n個(gè)序列樣本中,與該序列匹配度越高的序列樣本,其評(píng)分也越高。
步驟305,將該原始音高序列和該多個(gè)音高子序列各自對(duì)應(yīng)的識(shí)別結(jié)果中的序列樣本按照對(duì)應(yīng)的評(píng)分進(jìn)行排列。
步驟306,根據(jù)排列結(jié)果獲得對(duì)該待識(shí)別音頻的識(shí)別結(jié)果。
將該原始音高序列和該多個(gè)音高子序列各自對(duì)應(yīng)的識(shí)別結(jié)果中,總評(píng)分最高的n個(gè)序列樣本對(duì)應(yīng)的音頻為該待識(shí)別音頻的識(shí)別結(jié)果,并將識(shí)別結(jié)果中的音頻的名稱等基本信息推送給用戶。
在本發(fā)明實(shí)施例中,原始音高序列和多個(gè)音高子序列中的每一個(gè)序列各自可以匹配出n個(gè)匹配度較高的序列樣本,對(duì)于這n個(gè)序列樣本,可以按照匹配度從高到低的順序進(jìn)行排列,并采用倒排索引累加的方法進(jìn)行排名賦值,排名越高,賦值越高,再將原始音高序列和多個(gè)音高子序列各自的識(shí)別結(jié)果中涉及的所有樣本序列按照總評(píng)分從大到小的順序進(jìn)行排列,取排列結(jié)果的前n個(gè)樣本序列對(duì)應(yīng)的音頻為識(shí)別結(jié)果。比如,請(qǐng)參考表1:
表1
在表1中,原始音高序列和多個(gè)音高子序列各自的識(shí)別結(jié)果中分別包含5個(gè)序列樣本,涉及的序列樣本有樣本1~樣本8,其中,樣本1的總評(píng)分為1+1+1/2+1=3.5,樣本2為1/2+1/4+1+1/2=2.25、樣本3為1/3+1/2+1/5≈1.03、樣本4為0.25、樣本5為1/5+1/3+1/4≈0.78、樣本6為1/5+1/3≈0.53、樣本7為1/5+1/3≈0.53、樣本8為0.25,因此,各個(gè)序列樣本按照總評(píng)分從大到小的順序?yàn)椋簶颖?、樣本2、樣本3、樣本5、樣本6、樣本7、樣本4以及樣本8,取總評(píng)分最高的前5個(gè)樣本序列,即樣本1、樣本2、樣本3、樣本5和樣本6對(duì)應(yīng)的音頻為最終的識(shí)別結(jié)果并推送給用戶。
或者,本發(fā)明實(shí)施例所示的方案中,也可以在表1的基礎(chǔ)上結(jié)合原始音高序列和多個(gè)音高子序列與各自識(shí)別結(jié)果中的樣本序列的匹配度來(lái)進(jìn)行積分計(jì)算,比如,采用倒排索引累加的方法進(jìn)行排名賦值后,將各個(gè)樣本序列的排名賦值與其對(duì)應(yīng)的匹配值的乘積作為該樣本序列的積分,比如,請(qǐng)參考表2:
表2
在表2中,原始音高序列和多個(gè)音高子序列各自的識(shí)別結(jié)果中分別包含5個(gè)序列樣本,涉及的序列樣本有樣本1~樣本8,其中,樣本1的總評(píng)分為2.32,樣本2為1.0925、樣本3為0.81、樣本4為0.2075、樣本5為0.5967、樣本6為0.426、樣本7為0.4167、樣本8為0.1775,因此,各個(gè)序列樣本按照總評(píng)分從大到小的順序?yàn)椋簶颖?、樣本2、樣本3、樣本5、樣本6、樣本7、樣本4以及樣本8,取總評(píng)分最高的前5個(gè)樣本序列,即樣本1、樣本2、樣本3、樣本5和樣本6對(duì)應(yīng)的音頻為最終的識(shí)別結(jié)果并推送給用戶。
或者,本發(fā)明實(shí)施例所示的方案中,也可以在表2的基礎(chǔ)上結(jié)合原始音高序列和多個(gè)音高子序列各自的序列長(zhǎng)度進(jìn)行積分計(jì)算,比如,采用倒排索引累加的方法進(jìn)行排名賦值后,將各個(gè)樣本序列的排名賦值、其對(duì)應(yīng)的匹配值以及其對(duì)應(yīng)的原始音高序列或音高子序列的長(zhǎng)度乘積作為該樣本序列的積分。
需要說(shuō)明的是,上述各個(gè)步驟可以全部由圖1所示實(shí)施環(huán)境中的終端110來(lái)執(zhí)行,比如,以該終端110為智能手機(jī)中為例,該智能手機(jī)中安裝有音樂(lè)播放類app,該音樂(lè)播放類app具有哼唱識(shí)別功能,用戶啟動(dòng)該哼唱識(shí)別功能后,對(duì)著智能手機(jī)的麥克風(fēng)哼唱一段音頻,智能手機(jī)按照上述步驟301至步驟306所示的方法對(duì)該段音頻進(jìn)行音高序列提取、切分以及匹配的處理,最終向用戶展示與用戶哼唱的音頻最匹配的幾首歌曲。
或者,上述各個(gè)步驟可以全部由圖1所示實(shí)施環(huán)境中的服務(wù)器120來(lái)執(zhí)行,比如,以終端110為安裝有音樂(lè)播放類app的智能手機(jī),服務(wù)器120為該音樂(lè)播放類app對(duì)應(yīng)的服務(wù)器為例,用戶啟動(dòng)該音樂(lè)播放類app的哼唱識(shí)別功能后,對(duì)著智能手機(jī)的麥克風(fēng)哼唱一段音頻,智能手機(jī)將采集到的音頻發(fā)送給服務(wù)器, 服務(wù)器按照上述步驟301至步驟306所示的方法對(duì)該段音頻進(jìn)行音高序列提取、切分以及匹配的處理,最終向智能手機(jī)返回與用戶哼唱的音頻最匹配的幾首歌曲,由智能手機(jī)向用戶展示。
或者,上述各個(gè)步驟也可以部分由圖1所示實(shí)施環(huán)境中的終端110來(lái)執(zhí)行,其余部分由服務(wù)器120來(lái)執(zhí)行,比如,以終端110為安裝有音樂(lè)播放類app的智能手機(jī),服務(wù)器120為該音樂(lè)播放類app對(duì)應(yīng)的服務(wù)器為例,用戶啟動(dòng)該音樂(lè)播放類app的哼唱識(shí)別功能后,對(duì)著智能手機(jī)的麥克風(fēng)哼唱一段音頻,智能手機(jī)按照步驟301和步驟302所示的方法對(duì)該段音頻進(jìn)行音高序列提取和切分,并將獲得的原始音高序列和各個(gè)音高子序列發(fā)送給服務(wù)器,服務(wù)器按照步驟303至步驟306所示的方法進(jìn)行匹配識(shí)別,最終向智能手機(jī)返回與用戶哼唱的音頻最匹配的幾首歌曲,由智能手機(jī)向用戶展示。
綜上所述,本發(fā)明實(shí)施例提供的一種音頻識(shí)別方法,將待識(shí)別音頻的原始音高序列切分成多個(gè)音高子序列,對(duì)該原始音高序列和該多個(gè)音高子序列分別進(jìn)行識(shí)別,并將對(duì)該原始音高序列和該多個(gè)音高子序列分別進(jìn)行識(shí)別所獲得的識(shí)別結(jié)果進(jìn)行合并,獲得對(duì)該待識(shí)別音頻的識(shí)別結(jié)果,通過(guò)將一個(gè)長(zhǎng)音高序列切分成多個(gè)短音高序列,并對(duì)長(zhǎng)音高序列和多個(gè)短音高序列分別進(jìn)行識(shí)別,并將識(shí)別結(jié)果進(jìn)行整合,從而達(dá)到提高哼唱識(shí)別的準(zhǔn)確性的效果。
在上述圖3對(duì)應(yīng)的實(shí)施例步驟302中,在將該原始音高序列切分成多個(gè)音高子序列時(shí),可以按照連續(xù)的0值音高的長(zhǎng)度從高到低的順序選擇切分點(diǎn),請(qǐng)參考圖4,其是根據(jù)一示例性實(shí)施例示出的一種音高序列切分方法的流程圖,如圖4所示,該音頻識(shí)別方法可以包括如下幾個(gè)步驟:
步驟302a,確定該原始音高序列中包含的各個(gè)靜音序列,該靜音序列是音高數(shù)值為0的序列。
比如,假設(shè)獲取到的某一待識(shí)別音頻的原始音高序列為:
{7.58,7.58,7.58,7.58,7.50,7.50,7.50,7.50,0,0,0,0,0,7.33,7.33,0,0,7.33,7.33,0,0,0,0,7.17,0,7.17,7.17,7.17,7.17,7.17}(這是一個(gè)簡(jiǎn)化的例子,在實(shí)際應(yīng)用中,非靜音段的長(zhǎng)度一般較長(zhǎng),通常長(zhǎng)度為20個(gè)音高值以上),上述原始音高序列中共有四個(gè)靜音序列,可分別標(biāo)記為z1,z2,z3,z4,其長(zhǎng)度分別為5,2,4,1。
步驟302b,根據(jù)該各個(gè)靜音序列的長(zhǎng)度,將該各個(gè)靜音序列中的至少一個(gè)靜音序列在該原始音高序列中的位置確定為切分位置。
由于靜音序列的長(zhǎng)度越長(zhǎng),表示用戶在錄制待識(shí)別音頻時(shí),在該靜音序列處的停頓時(shí)間越長(zhǎng),該靜音序列兩側(cè)的兩段音高序列所對(duì)應(yīng)的音頻是獨(dú)立的兩段音頻的概率也越大,反之,則兩段音高序列所對(duì)應(yīng)的音頻是獨(dú)立的兩段音頻的概率越小。因此,為了提高序列切分的準(zhǔn)確性,提高后續(xù)的識(shí)別效果,在本發(fā)明實(shí)施例中,可以按照靜音序列的長(zhǎng)度從大到小的順序進(jìn)行切分,即優(yōu)先在靜音序列長(zhǎng)的位置進(jìn)行切分。
具體的,在確定切分位置時(shí),可以判斷該各個(gè)靜音序列的數(shù)量是否大于m,m為大于或者等于1的整數(shù);若判斷結(jié)果為各個(gè)靜音序列的數(shù)量不大于m,則將該各個(gè)靜音序列在該原始音高序列中的位置確定為該切分位置;若判斷結(jié)果為該各個(gè)靜音序列的數(shù)量大于m,則將該各個(gè)靜音序列中長(zhǎng)度最長(zhǎng)的k個(gè)靜音序列在該原始音高序列中的位置確定為該切分位置。其中,k小于或者等于m,且k為正整數(shù),m和k的數(shù)值可以預(yù)先設(shè)置為一個(gè)固定值,或者,也可以自動(dòng)根據(jù)原始音頻序列的長(zhǎng)度進(jìn)行設(shè)置;或者,該m和k的數(shù)值也可以由用戶自行設(shè)置。
比如,上述靜音序列的數(shù)量為4,若m的數(shù)值為4或5,此時(shí)靜音序列的數(shù)量不大于m,則可以將上述全部的4個(gè)靜音序列z1、z2、z3和z4在原始音高序列中的位置確定為切分位置;若m的數(shù)值為3,k為2,此時(shí)靜音序列的數(shù)量大于m,則可以將上述4個(gè)靜音序列中最長(zhǎng)的兩個(gè)靜音序列z1和z3在原始音高序列中的位置確定為切分位置。
或者,在確定切分位置時(shí),也可以將該各個(gè)靜音序列中長(zhǎng)度大于預(yù)設(shè)長(zhǎng)度閾值的靜音序列在該原始音高序列中的位置確定為該切分位置。比如,預(yù)設(shè)長(zhǎng)度閾值為3,則將上述靜音序列z1、z2、z3和z4中,長(zhǎng)度大于3的靜音序列,即靜音序列z1和z3在原始音高序列中的位置確定為切分位置。
步驟302c,根據(jù)確定的該切分位置對(duì)該原始音高序列進(jìn)行切分,獲得該多個(gè)音高子序列。
需要說(shuō)明的是,在本發(fā)明實(shí)施例中,在根據(jù)確定的該切分位置對(duì)該原始音高序列進(jìn)行切分時(shí),可以將切分位置處的靜音序列從切分出的音頻子序列中剔除。
以上述步驟302a下的原始音頻序列為例,假如確定出靜音序列z1在原始音高序列中的位置確定為切分位置,則上例可按z1為界拆分成兩段{7.58,7.58,7.58,7.58,7.50,7.50,7.50,7.50}和{7.33,7.33,0,0,7.33,7.33,0,0,0,0,7.17,0,7.17,7.17,7.17,7.17,7.17};如若確定出靜音序列z1和z3在原始音高序列中的位置確定為切分位置,則上例可以拆分成三段,分別為{7.58,7.58,7.58,7.58,7.50,7.50,7.50,7.50}、{7.33,7.33,0,0,7.33,7.33}、{7.17,0,7.17,7.17,7.17,7.17,7.17}。拆分的同時(shí),也丟掉作為分界的靜音序列段。
綜上所述,本發(fā)明實(shí)施例提供的一種音高序列切分方法,確定該原始音高序列中包含的各個(gè)靜音序列,根據(jù)該各個(gè)靜音序列的長(zhǎng)度,將該各個(gè)靜音序列中的至少一個(gè)靜音序列在該原始音高序列中的位置確定為切分位置,并根據(jù)確定的該切分位置對(duì)該原始音高序列進(jìn)行切分,即優(yōu)先在靜音序列長(zhǎng)的位置進(jìn)行切分,達(dá)到提高序列切分的準(zhǔn)確性,提高后續(xù)的識(shí)別效果的目的。
請(qǐng)參考圖5,其示出了本發(fā)明一個(gè)實(shí)施例提供的音頻識(shí)別裝置的結(jié)構(gòu)方框圖。該音頻識(shí)別裝置可以通過(guò)硬件或者軟硬結(jié)合的方式實(shí)現(xiàn),比如,該音頻識(shí)別裝置可以是上述圖1所示實(shí)施環(huán)境中的服務(wù)器120,或者是該服務(wù)器120的一部分。該音頻識(shí)別裝置可以包括:
序列獲取模塊501,用于獲取待識(shí)別音頻的原始音高序列,所述原始音高序列用于指示所述待識(shí)別音頻在各個(gè)時(shí)間點(diǎn)上的頻率;
切分模塊502,用于將所述原始音高序列切分成多個(gè)音高子序列;
識(shí)別模塊503,用于對(duì)所述原始音高序列和所述多個(gè)音高子序列分別進(jìn)行識(shí)別;
合并模塊504,用于將對(duì)所述原始音高序列和所述多個(gè)音高子序列分別進(jìn)行識(shí)別所獲得的識(shí)別結(jié)果進(jìn)行合并,獲得對(duì)所述待識(shí)別音頻的識(shí)別結(jié)果。
綜上所述,本發(fā)明實(shí)施例提供的一種音頻識(shí)別裝置,將待識(shí)別音頻的原始音高序列切分成多個(gè)音高子序列,對(duì)該原始音高序列和該多個(gè)音高子序列分別進(jìn)行識(shí)別,并將對(duì)該原始音高序列和該多個(gè)音高子序列分別進(jìn)行識(shí)別所獲得的識(shí)別結(jié)果進(jìn)行合并,獲得對(duì)該待識(shí)別音頻的識(shí)別結(jié)果,通過(guò)將一個(gè)長(zhǎng)音高序列切分成多個(gè)短音高序列,并對(duì)長(zhǎng)音高序列和多個(gè)短音高序列分別進(jìn)行識(shí)別,并 將識(shí)別結(jié)果進(jìn)行整合,從而達(dá)到提高哼唱識(shí)別的準(zhǔn)確性的效果。
請(qǐng)參考圖6,其示出了本發(fā)明另一實(shí)施例提供的音頻識(shí)別裝置的結(jié)構(gòu)方框圖。該音頻識(shí)別裝置可以通過(guò)硬件或者軟硬結(jié)合的方式實(shí)現(xiàn),比如,該音頻識(shí)別裝置可以是上述圖1所示實(shí)施環(huán)境中的服務(wù)器120,或者是該服務(wù)器120的一部分。該音頻識(shí)別裝置可以包括:
序列獲取模塊501,用于獲取待識(shí)別音頻的原始音高序列,所述原始音高序列用于指示所述待識(shí)別音頻在各個(gè)時(shí)間點(diǎn)上的頻率;
切分模塊502,用于將所述原始音高序列切分成多個(gè)音高子序列;
識(shí)別模塊503,用于對(duì)所述原始音高序列和所述多個(gè)音高子序列分別進(jìn)行識(shí)別;
合并模塊504,用于將對(duì)所述原始音高序列和所述多個(gè)音高子序列分別進(jìn)行識(shí)別所獲得的識(shí)別結(jié)果進(jìn)行合并,獲得對(duì)所述待識(shí)別音頻的識(shí)別結(jié)果。
可選的,所述切分模塊502,包括:
序列確定單元502a,用于確定所述原始音高序列中包含的各個(gè)靜音序列,所述靜音序列是音高數(shù)值為0的序列;
位置確定單元502b,用于根據(jù)所述各個(gè)靜音序列的長(zhǎng)度,將所述各個(gè)靜音序列中的至少一個(gè)靜音序列在所述原始音高序列中的位置確定為切分位置;
切分單元502c,用于根據(jù)確定的所述切分位置對(duì)所述原始音高序列進(jìn)行切分,獲得所述多個(gè)音高子序列。
可選的,所述位置確定單元502b,包括:
判斷子單元502b1,用于判斷所述各個(gè)靜音序列的數(shù)量是否大于m,m為大于或者等于1的整數(shù);
第一確定子單元502b2,用于若判斷結(jié)果為所述各個(gè)靜音序列的數(shù)量不大于m,則將所述各個(gè)靜音序列在所述原始音高序列中的位置確定為所述切分位置;
第二確定子單元502b3,用于若判斷結(jié)果為所述各個(gè)靜音序列的數(shù)量大于m,則將所述各個(gè)靜音序列中長(zhǎng)度最長(zhǎng)的k個(gè)靜音序列在所述原始音高序列中的位置確定為所述切分位置,k小于等于m,k為正整數(shù)。
可選的,所述位置確定單元502b,包括:
第三確定子單元502b4,用于將所述各個(gè)靜音序列中長(zhǎng)度大于預(yù)設(shè)長(zhǎng)度閾值 的靜音序列在所述原始音高序列中的位置確定為所述切分位置。
可選的,對(duì)于所述原始音高序列和所述多個(gè)音高子序列中每一個(gè)序列,所述序列對(duì)應(yīng)的識(shí)別結(jié)果中包含n個(gè)序列樣本以及所述n個(gè)序列樣本各自與所述序列之間的匹配度,n為大于或者等于1的整數(shù);所述合并模塊504,包括:
評(píng)分單元504a,用于對(duì)所述原始音高序列和所述多個(gè)音高子序列中每一個(gè)序列,根據(jù)所述序列對(duì)應(yīng)的識(shí)別結(jié)果中包含的所述n個(gè)序列樣本各自與所述序列之間的匹配度對(duì)所述n個(gè)序列樣本進(jìn)行評(píng)分,所述序列樣本與所述序列之間的匹配度與所述序列樣本的評(píng)分成正比例關(guān)系;
排序單元504b,用于將所述原始音高序列和所述多個(gè)音高子序列各自對(duì)應(yīng)的識(shí)別結(jié)果中的序列樣本按照對(duì)應(yīng)的評(píng)分進(jìn)行排列;
獲得單元504c,用于根據(jù)排列結(jié)果獲得對(duì)所述待識(shí)別音頻的識(shí)別結(jié)果。
可選的,所述獲得單元504c,用于將所述原始音高序列和所述多個(gè)音高子序列各自對(duì)應(yīng)的識(shí)別結(jié)果中,總評(píng)分最高的n個(gè)序列樣本對(duì)應(yīng)的音頻獲得為所述待識(shí)別音頻的識(shí)別結(jié)果。
可選的,所述識(shí)別模塊503,包括:
第一匹配單元503a,用于通過(guò)第一匹配算法,將所述原始音高序列與預(yù)先設(shè)置的各個(gè)序列樣本進(jìn)行匹配,確定與所述原始音頻序列之間的匹配值最高的n個(gè)序列樣本,n為大于或者等于1的整數(shù);
第二匹配單元503b,用于通過(guò)第二匹配算法,將所述原始音高序列和所述多個(gè)音高子序列分別與所述n個(gè)序列樣本進(jìn)行匹配。
可選的,所述識(shí)別模塊503,包括:
第三匹配單元503c,用于通過(guò)第一匹配算法,對(duì)所述原始音高序列和所述多個(gè)音高子序列中的任一序列,將所述序列與預(yù)先設(shè)置的各個(gè)序列樣本進(jìn)行匹配,確定與所述序列之間的匹配值最高的n個(gè)序列樣本,n為大于或者等于1的整數(shù);
第四匹配單元503d,用于通過(guò)第二匹配算法,對(duì)所述原始音高序列和所述多個(gè)音高子序列中的任一序列,將所述序列與所述n個(gè)序列樣本進(jìn)行匹配。
綜上所述,本發(fā)明實(shí)施例提供的一種音頻識(shí)別裝置,將待識(shí)別音頻的原始音高序列切分成多個(gè)音高子序列,對(duì)該原始音高序列和該多個(gè)音高子序列分別進(jìn)行識(shí)別,并將對(duì)該原始音高序列和該多個(gè)音高子序列分別進(jìn)行識(shí)別所獲得的 識(shí)別結(jié)果進(jìn)行合并,獲得對(duì)該待識(shí)別音頻的識(shí)別結(jié)果,通過(guò)將一個(gè)長(zhǎng)音高序列切分成多個(gè)短音高序列,并對(duì)長(zhǎng)音高序列和多個(gè)短音高序列分別進(jìn)行識(shí)別,并將識(shí)別結(jié)果進(jìn)行整合,從而達(dá)到提高哼唱識(shí)別的準(zhǔn)確性的效果。
此外,本發(fā)明實(shí)施例提供的一種音頻識(shí)別裝置,在對(duì)原始音高序列進(jìn)行切分時(shí),確定該原始音高序列中包含的各個(gè)靜音序列,根據(jù)該各個(gè)靜音序列的長(zhǎng)度,將該各個(gè)靜音序列中的至少一個(gè)靜音序列在該原始音高序列中的位置確定為切分位置,并根據(jù)確定的該切分位置對(duì)該原始音高序列進(jìn)行切分,即優(yōu)先在靜音序列長(zhǎng)的位置進(jìn)行切分,達(dá)到提高序列切分的準(zhǔn)確性,提高后續(xù)的識(shí)別效果的目的。
圖7是根據(jù)一示例性實(shí)施例示出的一種服務(wù)器700的結(jié)構(gòu)示意圖。例如,服務(wù)器700可以是圖1所示實(shí)施環(huán)境中的服務(wù)器120。參照?qǐng)D7,服務(wù)器700包括處理組件722,其進(jìn)一步包括一個(gè)或多個(gè)處理器,以及由存儲(chǔ)器732所代表的存儲(chǔ)器資源,用于存儲(chǔ)可由處理部件722執(zhí)行的指令,例如應(yīng)用程序。存儲(chǔ)器732中存儲(chǔ)的應(yīng)用程序可以包括一個(gè)或一個(gè)以上的每一個(gè)對(duì)應(yīng)于一組指令的模塊。此外,處理組件722被配置為執(zhí)行指令,以執(zhí)行上述圖2至圖4任一方法的全部或者部分步驟。
服務(wù)器700還可以包括一個(gè)電源組件726被配置為執(zhí)行服務(wù)器700的電源管理,一個(gè)有線或無(wú)線網(wǎng)絡(luò)接口750被配置為將服務(wù)器700連接到網(wǎng)絡(luò),和一個(gè)輸入輸出(i/o)接口758。服務(wù)器700可以操作基于存儲(chǔ)在存儲(chǔ)器732的操作系統(tǒng),例如windowsservertm,macosxtm,unixtm,linuxtm,freebsdtm或類似。
圖8是根據(jù)一示例性實(shí)施例示出的一種終端800的結(jié)構(gòu)示意圖,該終端800可以是圖1所示實(shí)施環(huán)境中的終端110。本發(fā)明實(shí)施例中的終端800可以包括一個(gè)或多個(gè)如下組成部分:用于執(zhí)行計(jì)算機(jī)程序指令以完成各種流程和方法的處理器,用于信息和存儲(chǔ)程序指令隨機(jī)接入存儲(chǔ)器(ram)和只讀存儲(chǔ)器(rom),用于存儲(chǔ)數(shù)據(jù)和信息的存儲(chǔ)器,i/o設(shè)備,界面,天線等。具體來(lái)講:
終端800可以包括rf(radiofrequency,射頻)電路810、存儲(chǔ)器820、輸入單元830、顯示單元840、傳感器850、音頻電路860、wifi(wirelessfidelity, 無(wú)線保真)模塊870、處理器880、電源882、攝像頭890等部件。本領(lǐng)域技術(shù)人員可以理解,圖8中示出的終端結(jié)構(gòu)并不構(gòu)成對(duì)終端的限定,可以包括比圖示更多或更少的部件,或者組合某些部件,或者不同的部件布置。
下面結(jié)合圖8對(duì)終端800的各個(gè)構(gòu)成部件進(jìn)行具體的介紹:
rf電路810可用于收發(fā)信息或通話過(guò)程中,信號(hào)的接收和發(fā)送,特別地,將基站的下行信息接收后,給處理器880處理;另外,將設(shè)計(jì)上行的數(shù)據(jù)發(fā)送給基站。通常,rf電路包括但不限于天線、至少一個(gè)放大器、收發(fā)信機(jī)、耦合器、lna(lownoiseamplifier,低噪聲放大器)、雙工器等。此外,rf電路810還可以通過(guò)無(wú)線通信與網(wǎng)絡(luò)和其他設(shè)備通信。所述無(wú)線通信可以使用任一通信標(biāo)準(zhǔn)或協(xié)議,包括但不限于gsm(globalsystemofmobilecommunication,全球移動(dòng)通訊系統(tǒng))、gprs(generalpacketradioservice,通用分組無(wú)線服務(wù))、cdma(codedivisionmultipleaccess,碼分多址)、wcdma(widebandcodedivisionmultipleaccess,寬帶碼分多址)、lte(longtermevolution,長(zhǎng)期演進(jìn))、電子郵件、sms(shortmessagingservice,短消息服務(wù))等。
存儲(chǔ)器820可用于存儲(chǔ)軟件程序以及模塊,處理器880通過(guò)運(yùn)行存儲(chǔ)在存儲(chǔ)器820的軟件程序以及模塊,從而執(zhí)行終端800的各種功能應(yīng)用以及數(shù)據(jù)處理。存儲(chǔ)器820可主要包括存儲(chǔ)程序區(qū)和存儲(chǔ)數(shù)據(jù)區(qū),其中,存儲(chǔ)程序區(qū)可存儲(chǔ)操作系統(tǒng)、至少一個(gè)功能所需的應(yīng)用程序(比如聲音播放功能、圖像播放功能等)等;存儲(chǔ)數(shù)據(jù)區(qū)可存儲(chǔ)根據(jù)終端800的使用所創(chuàng)建的數(shù)據(jù)(比如音頻數(shù)據(jù)、電話本等)等。此外,存儲(chǔ)器820可以包括高速隨機(jī)存取存儲(chǔ)器,還可以包括非易失性存儲(chǔ)器,例如至少一個(gè)磁盤存儲(chǔ)器件、閃存器件、或其他易失性固態(tài)存儲(chǔ)器件。
輸入單元830可用于接收輸入的數(shù)字或字符信息,以及產(chǎn)生與終端800的用戶設(shè)置以及功能控制有關(guān)的鍵信號(hào)輸入。具體地,輸入單元830可包括觸控面板831以及其他輸入設(shè)備832。觸控面板831,也稱為觸摸屏,可收集用戶在其上或附近的觸摸操作(比如用戶使用手指、觸筆等任何適合的物體或附件在觸控面板831上或在觸控面板831附近的操作),并根據(jù)預(yù)先設(shè)定的程式驅(qū)動(dòng)相應(yīng)的連接裝置??蛇x的,觸控面板831可包括觸摸檢測(cè)裝置和觸摸控制器兩個(gè)部分。其中,觸摸檢測(cè)裝置檢測(cè)用戶的觸摸方位,并檢測(cè)觸摸操作帶來(lái)的信號(hào),將信號(hào)傳送給觸摸控制器;觸摸控制器從觸摸檢測(cè)裝置上接收觸摸信息,并將 它轉(zhuǎn)換成觸點(diǎn)坐標(biāo),再送給處理器880,并能接收處理器880發(fā)來(lái)的命令并加以執(zhí)行。此外,可以采用電阻式、電容式、紅外線以及表面聲波等多種類型實(shí)現(xiàn)觸控面板831。除了觸控面板831,輸入單元830還可以包括其他輸入設(shè)備832。具體地,其他輸入設(shè)備832可以包括但不限于物理鍵盤、功能鍵(比如音量控制按鍵、開關(guān)按鍵等)、軌跡球、鼠標(biāo)、操作桿等中的一種或多種。
顯示單元840可用于顯示由用戶輸入的信息或提供給用戶的信息以及終端800的各種菜單。顯示單元840可包括顯示面板841,可選的,可以采用lcd(liquidcrystaldisplay,液晶顯示器)、oled(organiclight-emittingdiode,有機(jī)發(fā)光二極管)等形式來(lái)配置顯示面板841。進(jìn)一步的,觸控面板831可覆蓋顯示面板841,當(dāng)觸控面板831檢測(cè)到在其上或附近的觸摸操作后,傳送給處理器880以確定觸摸事件的類型,隨后處理器880根據(jù)觸摸事件的類型在顯示面板841上提供相應(yīng)的視覺(jué)輸出。雖然在圖8中,觸控面板831與顯示面板841是作為兩個(gè)獨(dú)立的部件來(lái)實(shí)現(xiàn)終端800的輸入和輸入功能,但是在某些實(shí)施例中,可以將觸控面板831與顯示面板841集成而實(shí)現(xiàn)終端800的輸入和輸出功能。
終端800還可包括至少一種傳感器850,比如陀螺儀傳感器、磁感應(yīng)傳感器、光傳感器、運(yùn)動(dòng)傳感器以及其他傳感器。具體地,光傳感器可包括環(huán)境光傳感器及接近傳感器,其中,環(huán)境光傳感器可根據(jù)環(huán)境光線的明暗來(lái)調(diào)節(jié)顯示面板841的亮度,接近傳感器可在終端800移動(dòng)到耳邊時(shí),關(guān)閉顯示面板841和/或背光。作為運(yùn)動(dòng)傳感器的一種,加速度傳感器可檢測(cè)各個(gè)方向上(一般為三軸)加速度的大小,靜止時(shí)可檢測(cè)出重力的大小及方向,可用于識(shí)別終端姿態(tài)的應(yīng)用(比如橫豎屏切換、相關(guān)游戲、磁力計(jì)姿態(tài)校準(zhǔn))、振動(dòng)識(shí)別相關(guān)功能(比如計(jì)步器、敲擊)等;至于終端800還可配置的氣壓計(jì)、濕度計(jì)、溫度計(jì)、紅外線傳感器等其他傳感器,在此不再贅述。
音頻電路860、揚(yáng)聲器881,傳聲器862可提供用戶與終端800之間的音頻接口。音頻電路860可將接收到的音頻數(shù)據(jù)轉(zhuǎn)換后的電信號(hào),傳輸?shù)綋P(yáng)聲器861,由揚(yáng)聲器861轉(zhuǎn)換為聲音信號(hào)輸出;另一方面,傳聲器862將收集的聲音信號(hào)轉(zhuǎn)換為電信號(hào),由音頻電路860接收后轉(zhuǎn)換為音頻數(shù)據(jù),再將音頻數(shù)據(jù)輸出處理器880處理后,經(jīng)rf電路810以發(fā)送給比如另一終端,或者將音頻數(shù)據(jù)輸出至存儲(chǔ)器820以便進(jìn)一步處理。
wifi屬于短距離無(wú)線傳輸技術(shù),終端800通過(guò)wifi模塊870可以幫助用戶收發(fā)電子郵件、瀏覽網(wǎng)頁(yè)和訪問(wèn)流式媒體等,它為用戶提供了無(wú)線的寬帶互聯(lián)網(wǎng)訪問(wèn)。雖然圖8示出了wifi模塊870,但是可以理解的是,其并不屬于終端800的必須構(gòu)成,完全可以根據(jù)需要在不改變公開的本質(zhì)的范圍內(nèi)而省略。
處理器880是終端800的控制中心,利用各種接口和線路連接整個(gè)終端的各個(gè)部分,通過(guò)運(yùn)行或執(zhí)行存儲(chǔ)在存儲(chǔ)器820內(nèi)的軟件程序和/或模塊,以及調(diào)用存儲(chǔ)在存儲(chǔ)器820內(nèi)的數(shù)據(jù),執(zhí)行終端800的各種功能和處理數(shù)據(jù),從而對(duì)終端進(jìn)行整體監(jiān)控??蛇x的,處理器880可包括一個(gè)或多個(gè)處理單元;優(yōu)選的,處理器880可集成應(yīng)用處理器和調(diào)制解調(diào)處理器,其中,應(yīng)用處理器主要處理操作系統(tǒng)、用戶界面和應(yīng)用程序等,調(diào)制解調(diào)處理器主要處理無(wú)線通信??梢岳斫獾氖牵鲜稣{(diào)制解調(diào)處理器也可以不集成到處理器880中。
終端800還包括給各個(gè)部件供電的電源882(比如電池),優(yōu)選的,電源可以通過(guò)電源管理系統(tǒng)與處理器880邏輯相連,從而通過(guò)電源管理系統(tǒng)實(shí)現(xiàn)管理充電、放電、以及功耗管理等功能。
攝像頭890一般由鏡頭、圖像傳感器、接口、數(shù)字信號(hào)處理器、cpu、顯示屏幕等組成。其中,鏡頭固定在圖像傳感器的上方,可以通過(guò)手動(dòng)調(diào)節(jié)鏡頭來(lái)改變聚焦;圖像傳感器相當(dāng)于傳統(tǒng)相機(jī)的“膠卷”,是攝像頭采集圖像的心臟;接口用于把攝像頭利用排線、板對(duì)板連接器、彈簧式連接方式與終端主板連接,將采集的圖像發(fā)送給所述存儲(chǔ)器820;數(shù)字信號(hào)處理器通過(guò)數(shù)學(xué)運(yùn)算對(duì)采集的圖像進(jìn)行處理,將采集的模擬圖像轉(zhuǎn)換為數(shù)字圖像并通過(guò)接口發(fā)送給存儲(chǔ)器820。
盡管未示出,終端800還可以包括藍(lán)牙模塊等,在此不再贅述。
終端800除了包括一個(gè)或者多個(gè)處理器880,還包括有存儲(chǔ)器,以及一個(gè)或者多個(gè)模塊,其中一個(gè)或者多個(gè)模塊存儲(chǔ)于存儲(chǔ)器中,并被配置成由一個(gè)或者多個(gè)處理器執(zhí)行,以實(shí)現(xiàn)上述圖2至圖4任一所示方法的全部或者部分步驟。
本領(lǐng)域技術(shù)人員在考慮說(shuō)明書及實(shí)踐這里公開的發(fā)明后,將容易想到本發(fā)明的其它實(shí)施方案。本申請(qǐng)旨在涵蓋本發(fā)明的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本發(fā)明的一般性原理并包括本發(fā)明未公開的本技術(shù)領(lǐng)域中的公知常識(shí)或慣用技術(shù)手段。說(shuō)明書和實(shí)施例僅被視為示例性的,本發(fā)明的真正范圍和精神由下面的權(quán)利要求指出。
應(yīng)當(dāng)理解的是,本發(fā)明并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進(jìn)行各種修改和改變。本發(fā)明的范圍僅由所附的權(quán)利要求來(lái)限制。