圖像識(shí)別方法及裝置的制造方法【專(zhuān)利說(shuō)明】【
技術(shù)領(lǐng)域:
】[0001]本發(fā)明涉及圖像處理技術(shù),尤其涉及一種圖像識(shí)別方法及裝置?!尽?br>背景技術(shù):
】】[0002]隨著科技的發(fā)展,人們對(duì)圖像有著越來(lái)越多的應(yīng)用需求,這就需要對(duì)原始獲取的圖像中的指定物體進(jìn)行一些識(shí)別處理。在實(shí)際場(chǎng)景中,拍攝圖像的場(chǎng)景情況比較復(fù)雜。例如,場(chǎng)景中包含多個(gè)物體,使得指定物體難以多個(gè)物體中分辨出來(lái),或者,再例如,背景顏色與指定物體顏色非常接近,使得指定物體難以從背景中區(qū)分出來(lái),等等。通常,需要借助人工操作,選定指定物體,例如,利用鼠標(biāo)在電腦屏幕或者用手指在手機(jī)觸摸屏上進(jìn)行框選、點(diǎn)選或涂抹等方式,選定指定物體。[0003]然而,由于需要借助人工操作來(lái)選定圖像中的指定物體,操作復(fù)雜,且容易出錯(cuò),從而導(dǎo)致了圖像識(shí)別的效率和可靠性的降低。【【
發(fā)明內(nèi)容】】[0004]本發(fā)明的多個(gè)方面提供一種圖像識(shí)別方法及裝置,用以提高圖像識(shí)別的效率和可靠性。[0005]本發(fā)明的一方面,提供一種圖像識(shí)別方法,包括:[0006]獲取待識(shí)別圖像,所述待識(shí)別圖像中包括指定實(shí)物框;[0007]獲得所述指定實(shí)物框所對(duì)應(yīng)的物體;[0008]對(duì)所述物體進(jìn)行圖像識(shí)別處理。[0009]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述指定實(shí)物框的形狀包括規(guī)則形狀或不規(guī)則形狀。[0010]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述獲得所述指定實(shí)物框所對(duì)應(yīng)的物體之前,還包括:[0011]根據(jù)特定特征,識(shí)別所述指定實(shí)物框。[0012]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述特定特征包括下列特征中的至少一項(xiàng):[0013]特定顏色;[0014]特定紋理;以及[0015]特定標(biāo)記。[0016]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述獲得所述指定實(shí)物框所對(duì)應(yīng)的物體,包括:[0017]獲得所述指定實(shí)物框的位置;[0018]根據(jù)所述指定實(shí)物框的位置,對(duì)所述待識(shí)別圖像進(jìn)行分割處理,以獲得所述指定實(shí)物框所對(duì)應(yīng)的物體。[0019]本發(fā)明的另一方面,提供一種圖像識(shí)別裝置,包括:[0020]獲取單元,用于獲取待識(shí)別圖像,所述待識(shí)別圖像中包括指定實(shí)物框;[0021]分析單元,用于獲得所述指定實(shí)物框所對(duì)應(yīng)的物體;[0022]處理單元,用于對(duì)所述物體進(jìn)行圖像識(shí)別處理。[0023]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述指定實(shí)物框的形狀包括規(guī)則形狀或不規(guī)則形狀。[0024]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述分析單元,還用于[0025]根據(jù)特定特征,識(shí)別所述指定實(shí)物框。[0026]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述特定特征包括下列特征中的至少一項(xiàng):[0027]特定顏色;[0028]特定紋理;以及[0029]特定標(biāo)記。[0030]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述分析單元,具體用于[0031]獲得所述指定實(shí)物框的位置;以及[0032]根據(jù)所述指定實(shí)物框的位置,對(duì)所述待識(shí)別圖像進(jìn)行分割處理,以獲得所述指定實(shí)物框所對(duì)應(yīng)的物體。[0033]由上述技術(shù)方案可知,本發(fā)明實(shí)施例通過(guò)獲取待識(shí)別圖像,所述待識(shí)別圖像中包括指定實(shí)物框,進(jìn)而獲得所述指定實(shí)物框所對(duì)應(yīng)的物體,使得能夠?qū)λ鑫矬w進(jìn)行圖像識(shí)別處理,無(wú)需人工參與,操作簡(jiǎn)單,而且正確率高,從而提高了圖像識(shí)別的效率和可靠性。[0034]另外,采用本發(fā)明所提供的技術(shù)方案,一旦獲取待識(shí)別圖像,即能夠自動(dòng)實(shí)現(xiàn)待識(shí)別圖像的識(shí)別處理,能夠有效提高圖像識(shí)別的效率,而且能夠有效提高圖像識(shí)別的自動(dòng)化程度?!尽靖綀D說(shuō)明】】[0035]為了更清楚地說(shuō)明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。[0036]圖1為本發(fā)明一實(shí)施例提供的圖像識(shí)別方法的流程示意圖;[0037]圖2為本發(fā)明另一實(shí)施例提供的圖像識(shí)別裝置的結(jié)構(gòu)示意圖;[0038]圖3A為圖1所對(duì)應(yīng)的實(shí)施例中指定實(shí)物框的示意圖;[0039]圖3B為圖1所對(duì)應(yīng)的實(shí)施例中指定實(shí)物框所包圍的物體的示意圖?!尽揪唧w實(shí)施方式】】[0040]為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的全部其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。[0041]需要說(shuō)明的是,本發(fā)明實(shí)施例中所涉及的終端可以包括但不限于手機(jī)、個(gè)人數(shù)字助理(PersonalDigitalAssistant,PDA)、無(wú)線手持設(shè)備、平板電腦(TabletComputer)、個(gè)人電腦(PersonalComputer,PC)、MP3播放器、MP4播放器、可穿戴設(shè)備(例如,智能眼鏡、智能手表、智能手環(huán)等)等。[0042]另外,本文中術(shù)語(yǔ)“和/或”,僅僅是一種描述關(guān)聯(lián)對(duì)象的關(guān)聯(lián)關(guān)系,表示可以存在三種關(guān)系,例如,六和/或B,可以表示:單獨(dú)存在A,同時(shí)存在A和B,單獨(dú)存在B這三種情況。另夕卜,本文中字符,一般表示前后關(guān)聯(lián)對(duì)象是一種“或”的關(guān)系。[0043]圖1為本發(fā)明一實(shí)施例提供的圖像識(shí)別方法的流程示意圖,如圖1所示。[0044]101、獲取待識(shí)別圖像,所述待識(shí)別圖像中包括指定實(shí)物框。[0045]所謂的圖像,是指采用一定的圖像格式,將圖像數(shù)據(jù)即圖像的像素按照一定的方式進(jìn)行存儲(chǔ),所形成的文件,又可以稱(chēng)為圖像文件。[0046]其中,圖像的圖像格式即圖像存儲(chǔ)的格式,可以包括但不限于位圖(Bitmap,BMP)格式、可移植網(wǎng)絡(luò)圖像格式(PortableNetworkGraphicFormat,PNG)、聯(lián)合圖像專(zhuān)家組(JointPhotographicExpertsGroup,JPEG)格式、可交換圖像文件格式(ExchangeableImageFileFormat,EXIF),本實(shí)施例對(duì)此不進(jìn)行特別限定。[0047]102、獲得所述指定實(shí)物框所對(duì)應(yīng)的物體。[0048]所謂的指定實(shí)物框,其形狀可以為規(guī)則形狀,例如,圓形,如圖3A所示、半圓形或長(zhǎng)方形等,或者還可以為不規(guī)則形狀,例如,曲線形或折線形等,本實(shí)施例對(duì)此不進(jìn)行特別限定。[0049]所謂的指定實(shí)物框所對(duì)應(yīng)的物體,可以是指封閉形狀/非封閉形狀的所述指定實(shí)物框所包圍的物體,如圖3B所示,或者還可以封閉形狀/非封閉形狀的所述指定實(shí)物框所覆蓋的物體,或者還可以為條狀的所述指定實(shí)物框所指向的物體,本實(shí)施例對(duì)此不進(jìn)行特別限定。[0050]103、對(duì)所述物體進(jìn)行圖像識(shí)別處理。[0051]需要說(shuō)明的是,101?103的執(zhí)行主體可以為位于本地終端的應(yīng)用,或者還可以為設(shè)置在位于本地終端的應(yīng)用中的插件或軟件開(kāi)發(fā)工具包(SoftwareDevelopmentKit,SDK)等功能單元,或者還可以為位于網(wǎng)絡(luò)側(cè)服務(wù)器中的處理引擎,或者還可以為位于網(wǎng)絡(luò)側(cè)的分布式系統(tǒng),本實(shí)施例對(duì)此不進(jìn)行特別限定。[0052]可以理解的是,所述應(yīng)用可以是安裝在終端上的本地程序(nativeApp),或者還可以是終端上的瀏覽器的一個(gè)網(wǎng)頁(yè)程序(webApp),本實(shí)施例對(duì)此不進(jìn)行特別限定。[0053]這樣,通過(guò)獲取待識(shí)別圖像,所述待識(shí)別圖像中包括指定實(shí)物框,進(jìn)而獲得所述指定實(shí)物框所對(duì)應(yīng)的物體,使得能夠?qū)λ鑫矬w進(jìn)行圖像識(shí)別處理,無(wú)需人工參與,操作簡(jiǎn)單,而且正確率高,從而提高了圖像識(shí)別的效率和可靠性。[0054]本發(fā)明中,所述待識(shí)別圖像可以為利用圖像傳感器,所采集的。其中,所述圖像傳感器可以為電荷親合元件(ChargeCoupledDevice,CCD)傳感器,或者還可以為金屬氧化物半導(dǎo)體元件(ComplementaryMetal-OxideSemiconductor,CMOS)傳感器,本實(shí)施例對(duì)此不進(jìn)行特別限定。[0055]可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,在102之前,還可以進(jìn)一步根據(jù)特定特征,識(shí)別所述指定實(shí)物框。[0056]通常情況下,在實(shí)際場(chǎng)景中,指定實(shí)物框所采用的特定顏色會(huì)與背景顏色有較大差異,根據(jù)當(dāng)前第1頁(yè)1 2