一種圖像識(shí)別方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及圖像識(shí)別領(lǐng)域,尤其涉及一種圖像識(shí)別方法和裝置。
【背景技術(shù)】
[0002]卷積神經(jīng)網(wǎng)絡(luò)(Convolut1n Neural Network, CNN)近年來(lái)在圖像識(shí)別應(yīng)用領(lǐng)域取得了非常突出的成就。因此業(yè)界對(duì)CNN算法的優(yōu)化和高效率實(shí)現(xiàn)開(kāi)始關(guān)注并重視,且很多公司都開(kāi)始投入了 CNN優(yōu)化算法的研究。但目前CNN算法在進(jìn)行圖像識(shí)別時(shí)計(jì)算量都很大。
【發(fā)明內(nèi)容】
[0003]本發(fā)明實(shí)施例提供了一種圖像識(shí)別方法和裝置,可以減少圖像識(shí)別時(shí)的計(jì)算量。
[0004]第一方面,本發(fā)明實(shí)施例提供一種圖像識(shí)別方法,包括:
[0005]獲取對(duì)輸入的圖像進(jìn)行小波變換后的空間和尺度結(jié)構(gòu)分布規(guī)律的小波變換數(shù)據(jù);
[0006]對(duì)所述小波變換數(shù)據(jù)進(jìn)行特征處理運(yùn)算,獲得特征平面數(shù)據(jù);
[0007]使用全連接網(wǎng)絡(luò)對(duì)所述特征平面數(shù)據(jù)進(jìn)行分類識(shí)別,獲得所述圖像的識(shí)別結(jié)果。
[0008]該實(shí)現(xiàn)方式中,由于采用小波變換對(duì)輸入的圖像做變換,而小波變換會(huì)保留圖像的空間特征,同時(shí)大幅度減少有效數(shù)據(jù)量,從而本實(shí)現(xiàn)方式可以降低圖像識(shí)別時(shí)的計(jì)算量。
[0009]第一方面的第一種可能的實(shí)現(xiàn)方式中,上述方法還可以包括:
[0010]使用預(yù)先獲取的概率密度分布函數(shù)對(duì)所述小波變換數(shù)據(jù)進(jìn)行數(shù)據(jù)采樣,獲取所述小波變換數(shù)據(jù)的部分?jǐn)?shù)據(jù);
[0011 ] 上述對(duì)所述小波變換數(shù)據(jù)進(jìn)行特征處理運(yùn)算,獲得特征平面數(shù)據(jù),包括:
[0012]對(duì)所述部分?jǐn)?shù)據(jù)進(jìn)行特征處理運(yùn)算,獲得特征平面數(shù)據(jù)。
[0013]該實(shí)現(xiàn)方式中由對(duì)小波變換數(shù)據(jù)進(jìn)行采樣,這樣可以進(jìn)一步降低了有效輸入數(shù)據(jù)量,從而進(jìn)一步降低了計(jì)算量。
[0014]結(jié)合第一方面或者第一方面的第一種可能的實(shí)現(xiàn)方式,在第一方面的第一種可能的實(shí)現(xiàn)方式中,上述獲取對(duì)輸入的圖像進(jìn)行小波變換后的空間和尺度結(jié)構(gòu)分布規(guī)律的小波變換數(shù)據(jù),可以包括:
[0015]使用第一卷積運(yùn)算模板、第二卷積運(yùn)算模板、第三卷積運(yùn)算模板和第四卷積運(yùn)算模板對(duì)第i減1階第一變換圖像進(jìn)行卷積運(yùn)算,獲得第i階第一變換圖像、第i階第二變換圖像、第i階第三變換圖像和第i階第四變換圖像,其中,第0階第一變換圖像為所述輸入的圖像,所述i的初始值為1 ;
[0016]將所述第i階第一變換圖像、第i階第二變換圖像、第i階第三變換圖像和第i階第四變換圖像按照特定順序排放;
[0017]將所述i加1,并重復(fù)執(zhí)行所述使用第一卷積運(yùn)算模板、第二卷積運(yùn)算模板、第三卷積運(yùn)算模板和第四卷積運(yùn)算模板對(duì)第i減1階第一變換圖像進(jìn)行卷積運(yùn)算的步驟,直到所述第i階第一變換圖像的分辨率為預(yù)設(shè)分辨率;
[0018]將計(jì)算獲得的所有變換圖像中像素點(diǎn)的像素值小于預(yù)設(shè)門(mén)限的像素點(diǎn)置零。
[0019]該實(shí)施方式可以將像素值小于預(yù)設(shè)門(mén)限的像素點(diǎn)置零,這樣可以進(jìn)一步減少有效數(shù)據(jù)量,以減少計(jì)算量。
[0020]結(jié)合第一方面或者第一方面的第一種可能的實(shí)現(xiàn)方式或者第一方面的第二種可能的實(shí)現(xiàn)方式,在第一方面的第三種可能的實(shí)現(xiàn)方式中,上述對(duì)所述小波變換數(shù)據(jù)進(jìn)行特征處理運(yùn)算,獲得特征平面數(shù)據(jù),可以包括:
[0021]按照預(yù)設(shè)順序依次對(duì)所述小波變換數(shù)據(jù)包括的數(shù)據(jù)進(jìn)行卷積運(yùn)算或者全連接運(yùn)算,獲取特征平面數(shù)據(jù)。
[0022]結(jié)合第一方面或者第一方面的第一種可能的實(shí)現(xiàn)方式或者第一方面的第二種可能的實(shí)現(xiàn)方式,在第一方面的第四種可能的實(shí)現(xiàn)方式中,上述對(duì)所述小波變換數(shù)據(jù)進(jìn)行特征處理運(yùn)算,獲得特征平面數(shù)據(jù),包括:
[0023]根據(jù)所述小波變換數(shù)據(jù)的空間結(jié)構(gòu)分布規(guī)律使用相同的特征參數(shù)對(duì)所述小波變換數(shù)據(jù)進(jìn)行特征處理運(yùn)算,獲得特征平面數(shù)據(jù)。
[0024]該實(shí)施方式中,由于在進(jìn)行特征處理運(yùn)算時(shí)使用相同的特征參數(shù),從而可以大大減少特征參數(shù)的數(shù)據(jù)量以及相應(yīng)的計(jì)算量。
[0025]結(jié)合第一方面或者第一方面的第一種可能的實(shí)現(xiàn)方式,在第一方面的第四種可能的實(shí)現(xiàn)方式中,所述獲取對(duì)輸入的圖像進(jìn)行小波變換后的空間和尺度結(jié)構(gòu)分布規(guī)律的小波變換數(shù)據(jù),包括:
[0026]獲取經(jīng)過(guò)小波變換、量化和編碼的壓縮圖像,對(duì)所述壓縮圖像進(jìn)行編碼和量化的逆運(yùn)算,獲得對(duì)所述壓縮圖像的原始圖像進(jìn)行小波變換后的空間和尺度結(jié)構(gòu)分布規(guī)律的小波變換數(shù)據(jù)。
[0027]該實(shí)施方式中,只需要對(duì)壓縮圖像進(jìn)行編碼和量化的逆運(yùn)算就可以獲取到小波變換數(shù)據(jù),從而可以避免小波變換過(guò)程產(chǎn)生的計(jì)算量,從而可以減少圖像識(shí)別的整體計(jì)算量。
[0028]第二方面,本發(fā)明實(shí)施例提供一種圖像識(shí)別裝置,該圖像識(shí)別裝置被配置實(shí)現(xiàn)上述方法的功能,由硬件/軟件實(shí)現(xiàn),其硬件/軟件包括與上述功能相應(yīng)的單元。
[0029]第三方面,本發(fā)明實(shí)施例提供一種圖像識(shí)別裝置,包括:處理器、網(wǎng)絡(luò)接口、存儲(chǔ)器和通信總線,其中,所述通信總線用于實(shí)現(xiàn)所述處理器、網(wǎng)絡(luò)接口和存儲(chǔ)器之間連接通信,所述處理器執(zhí)行所述存儲(chǔ)器中存儲(chǔ)的程序用于實(shí)現(xiàn)上述方法。
【附圖說(shuō)明】
[0030]為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0031]圖1是本發(fā)明實(shí)施例提供的一種圖像識(shí)別方法的流程示意圖;
[0032]圖2是本發(fā)明實(shí)施例提供的另一種圖像識(shí)別方法的流程示意圖;
[0033]圖3是本發(fā)明實(shí)施例提供的一種小波變換的示意圖;
[0034]圖4是本發(fā)明實(shí)施例提供的一種特征處理運(yùn)算的示意圖;
[0035]圖5是本發(fā)明實(shí)施例提供的一種概率密度分布的示意圖;
[0036]圖6是本發(fā)明實(shí)施例提供的一種圖像識(shí)別裝置結(jié)構(gòu)示意圖;
[0037]圖7是本發(fā)明實(shí)施例提供的另一種圖像識(shí)別裝置的結(jié)構(gòu)示意圖;
[0038]圖8是本發(fā)明實(shí)施例提供的另一種圖像識(shí)別裝置的結(jié)構(gòu)示意圖;
[0039]圖9是本發(fā)明實(shí)施例提供的另一種圖像識(shí)別裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0040]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0041]本發(fā)明實(shí)施例提供的圖像識(shí)別方法可應(yīng)用于CNN,或者可以理解為本發(fā)明實(shí)施例提供的圖像識(shí)別方法為CNN中的一種圖像識(shí)別方法。
[0042]請(qǐng)參閱圖1,圖1是本發(fā)明實(shí)施例提供的一種圖像識(shí)別方法的流程示意圖,如圖1所示,包括以下步驟:
[0043]101、獲取對(duì)輸入的圖像進(jìn)行小波變換后的空間和尺度結(jié)構(gòu)分布規(guī)律的小波變換數(shù)據(jù)。
[0044]上述輸入的圖像可以是靜態(tài)圖像或者動(dòng)態(tài)圖像,這里的輸入可以理解為相對(duì)于本方法的輸入。例如:由終端設(shè)備實(shí)現(xiàn)上述方法,那么,這里的輸入可以理解為終端設(shè)備通過(guò)圖像傳感器采集的圖像,或者終端設(shè)備通過(guò)互聯(lián)網(wǎng)獲取的圖像,或者終端設(shè)備從本地讀取的圖像等,對(duì)此不作限定。
[0045]另外,上述獲取空間和尺度結(jié)構(gòu)分布規(guī)律的小波變換數(shù)據(jù)可以理解為,獲取空間結(jié)構(gòu)與輸入的圖像的空間結(jié)構(gòu)相同或者保留了特定的空間關(guān)系,且為多尺度結(jié)構(gòu)的小波變換數(shù)據(jù)。例如:對(duì)輸入的圖像進(jìn)行小波變換,以獲取上述空間和尺度結(jié)構(gòu)分布規(guī)律的小波變換數(shù)據(jù)。因?yàn)樾〔ㄗ儞Q既維持了合理的原始圖像空間關(guān)系,又建立了圖像數(shù)據(jù)的多尺度結(jié)構(gòu),因此是一種最有效率的面向圖像識(shí)別的數(shù)據(jù)表現(xiàn)方式。在經(jīng)過(guò)小波變換后,有效信息數(shù)據(jù)通常體現(xiàn)出非常稀疏的特點(diǎn),這反映了數(shù)據(jù)信息的本質(zhì),因此有效降低了信息處理的計(jì)舁里。
[0046]或者步驟101可以包括:
[0047]獲取經(jīng)過(guò)小波變換、量化和編碼的壓縮圖像,對(duì)所述壓縮圖像進(jìn)行編碼和量化的逆運(yùn)算,獲得對(duì)所述壓縮圖像的原始圖像進(jìn)行小波變換后的空間和尺度結(jié)構(gòu)分布規(guī)律的小波變換數(shù)據(jù)。
[0048]該實(shí)施方式中,上述壓縮圖像可以是將上述原始圖像進(jìn)行小波變換、量化和編碼獲得的壓縮的圖像,即該實(shí)施方式中可以實(shí)現(xiàn)將壓縮圖像作為輸入的圖像。由于輸入的圖像已經(jīng)經(jīng)過(guò)小波變換,那么,該實(shí)施方式中只需要對(duì)壓縮圖像進(jìn)行編碼和量化的逆運(yùn)算就可以獲得上述小波變換數(shù)據(jù),本領(lǐng)域技術(shù)人員都知道小波變換的計(jì)算量是要遠(yuǎn)遠(yuǎn)大于編碼和量化的逆運(yùn)算的計(jì)算量的,從而該實(shí)施方式中可以減少圖像識(shí)別的計(jì)算量。
[0049]102、對(duì)所述小波變換數(shù)據(jù)進(jìn)行特征處理運(yùn)算,獲得特征平面數(shù)據(jù)。
[0050]這里的特征處理運(yùn)算可以是卷積運(yùn)算或者全連接運(yùn)算等。另外,這里的特征平面數(shù)據(jù)就是經(jīng)過(guò)上述小波變換數(shù)據(jù)經(jīng)過(guò)上述特征處理運(yùn)算所獲取的數(shù)據(jù)。
[0051