本發(fā)明涉及視頻監(jiān)控技術領域,具體涉及一種視頻處理方法、裝置及存儲介質(zhì)。
背景技術:
隨著經(jīng)濟、社會、文化的快速發(fā)展,國內(nèi)外影響力的與日俱增,越來越多外來人口流向城市,這些人口增加在加快城市化進程的同時,也為城市管理帶來更大的挑戰(zhàn),雖然,視頻監(jiān)控對城市安全提供了技術支持,目前來看,攝像頭已經(jīng)在城市中布局開來,攝像頭可對城市的安全進行有效監(jiān)控,以及為相關機構的安保提供有效幫助。生活中,對目標人物進行蹲點作為一種常用辦案手段,需要浪費大量時間和精力,因此,如何利用攝像頭對目標人物進行蹲點的問題亟待解決。
技術實現(xiàn)要素:
本發(fā)明實施例提供了一種視頻處理方法及裝置,可提升對目標進行蹲點的效率。
本發(fā)明實施例第一方面提供了一種視頻處理方法,包括:
獲取由指定攝像頭拍攝的第一視頻;
獲取用戶輸入的查詢時間范圍以及待查詢對象的目標人臉圖像;
根據(jù)所述查詢時間范圍對所述第一視頻進行截取操作,得到第二視頻;
根據(jù)所述目標人臉圖像對所述第二視頻進行搜索,得到所述待查詢對象的n個人臉圖像,以及與所述待查詢對象相關的m個人臉圖像,所述n、所述m均為正整數(shù)。
結合本發(fā)明實施例第一方面,在第一方面的第一種可能實施方式中,所述查詢時間范圍包含起點時間和結束時間,所述根據(jù)所述查詢時間范圍對所述第一視頻進行截取操作,包括:
根據(jù)所述起點時間和所述結束時間對所述第一視頻進行定位,得到第三視頻;
對所述第三視頻同時進行正序人臉檢測和反序人臉檢測;
確定所述正序人臉檢測出現(xiàn)的第一關鍵幀的第一時刻和所述反序人臉檢測出現(xiàn)的第二關鍵幀的第二時刻,其中,所述第一關鍵幀、所述第二關鍵幀均為首次出現(xiàn)人臉圖像滿足預設角度范圍的視頻圖像;
將所述第一時刻與所述第二時刻之間的視頻作為所述第二視頻。
如此,上述本實施例,由于查詢時間范圍是一個指定范圍,并非那么精準地讓起始幀和結束幀均包含滿足預設角度的人臉圖像,因而,可對查詢時間范圍的視頻采用正序人臉檢測和反序人臉檢測,從而,快速找到查詢時間范圍內(nèi)包含符合預設角度的人臉圖像的第一幀和最后一幀,進而,獲取其對應的時刻,并獲取對應的時刻對應的視頻,如此,可減少后期人臉識別的工作量。
結合本發(fā)明實施例第一方面或第一方面的第一種可能實施方式中,在第一方面的第三種可能實施方式中,所述根據(jù)所述目標人臉圖像對所述第二視頻進行搜索,得到所述待查詢對象的n個人臉圖像,以及與所述待查詢對象相關的m個人臉圖像,包括:
將所述第二視頻中每一幀視頻圖像進行人臉分割,得到p個人臉圖像;
將所述目標人臉圖像與所述p個人臉圖像進行匹配,得到所述待查詢對象的n個人臉圖像,以及p-n人臉圖像,所述p為大于所述n的整數(shù);
分別計算所述p-n人臉圖像中每一人臉圖像與所述n個人臉圖像之間的最短時間差,得到所述p-n個最短時間差值;
從所述p-n個最短時間差值中選取小于第一預設閾值的最短時間差值,得到所述m個最短時間差值,獲取其對應的人臉圖像,得到與所述待查詢對象相關的m個人臉圖像。
如此,上述本實施例,由于第二視頻中每一幀圖像包含的人臉圖像數(shù)目不一樣,有可能包含1個或者多個,當然,也可能是0個,如此,對每一幀圖像進行圖像分割,可得到一部分待查詢對象的目標人臉圖像,當然,也有其他的人臉圖像,每一人臉圖像均可對應一個時間點,如此,可分別計算不是待查詢對象的人臉圖像對應的時間點與每一待查詢對象的人臉圖像對應的時間點之間的最短時間差,例如,待查詢對象的人臉圖像對應的時間點為t1,t2,非待查詢對象的人臉圖像的時間點為t3,則可得到t1-t3和t2-t3,時間差可能是正數(shù)也可能是負數(shù),只取得到的值作為時間差值,忽略正、負號。如此,可選取其最小值作為最短時間差值,如此,通過上述方式,由于圖像分割,可得到視頻中盡可能多的人臉圖像,因而,可盡可能全面地得到與待查詢對象的人臉圖像相關的人臉圖像,有利于全面分析可能與待查詢對象相關的其他人物。例如,該方法用于蹲點中,可全面分析出可能與嫌疑人相關聯(lián)的同伙。
結合本發(fā)明實施例第一方面的第二種可能實施方式中,在第一方面的第四種可能實施方式中,所述將所述目標人臉圖像與所述p個人臉圖像進行匹配,包括:
對所述p個人臉圖像進行圖像質(zhì)量評價,得到所述p個圖像質(zhì)量評價值;
從所述p個圖像質(zhì)量評價值中選取大于第二預設閾值的圖像質(zhì)量評價值對應的q個人臉圖像,所述q為小于或等于所述p且大于所述n的正整數(shù);
將所述目標人臉圖像與所述q個人臉圖像進行匹配。
如此,上述本實施例,可利用對每一人臉圖像進行圖像質(zhì)量評價的方式,篩選出圖像質(zhì)量較好的圖像,進而,再在這些圖像中尋找與目標人臉圖像匹配的圖像的話,可大大縮減搜索時間,畢竟需要匹配的圖像少了,提升了人臉是被效率。
結合本發(fā)明實施例第一方面或第一方面的第一種可能實施方式中,在第一方面的第五種可能實施方式中,在所述根據(jù)所述目標人臉圖像對所述第二視頻進行搜索,得到所述待查詢對象的n個人臉圖像,以及與所述待查詢對象相關的m個人臉圖像之后,所述方法還包括:
對所述m個人臉圖像進行行為分析,得到符合預設行為的x個人臉圖像,所述x為小于或等于所述m的正整數(shù)。
如此,上述本實施例,可通過行為分析進行排除,盡可能縮小與待查詢對象相關的對象,有利用為用戶提供盡可能精準數(shù)據(jù),例如,對于攝像頭而言,也有可能捕捉到無關的行人,采用上述方式,則可以在一定程度排除行人。
本發(fā)明實施例第二方面提供了一種視頻處理裝置,包括:
獲取單元,用于獲取由指定攝像頭拍攝的第一視頻;
所述獲取單元,還具體用于:
獲取用戶輸入的查詢時間范圍以及待查詢對象的目標人臉圖像;
截取單元,用于根據(jù)所述查詢時間范圍對所述第一視頻進行截取操作,得到第二視頻;
搜索單元,用于根據(jù)所述目標人臉圖像對所述第二視頻進行搜索,得到所述待查詢對象的n個人臉圖像,以及與所述待查詢對象相關的m個人臉圖像,所述n、所述m均為正整數(shù)。
結合本發(fā)明實施例第二方面,在第二方面的第一種可能實施方式中,所述查詢時間范圍包含起點時間和結束時間,
所述截取單元包括:
定位模塊,用于根據(jù)所述起點時間和所述結束時間對所述第一視頻進行定位,得到第三視頻;
檢測模塊,用于對所述第三視頻同時進行正序人臉檢測和反序人臉檢測;
確定模塊,用于確定所述正序人臉檢測出現(xiàn)的第一關鍵幀的第一時刻和所述反序人臉檢測出現(xiàn)的第二關鍵幀的第二時刻,其中,所述第一關鍵幀、所述第二關鍵幀均為首次出現(xiàn)人臉圖像滿足預設角度范圍的視頻圖像;
所述確定模塊,還具體用于
將所述第一時刻與所述第二時刻之間的視頻作為所述第二視頻。
結合本發(fā)明實施例第二方面或第二方面的第一種可能實施方式中,在第二方面的第二種可能實施方式中,所述搜索單元包括:
分割模塊,用于將所述第二視頻中每一幀視頻圖像進行人臉分割,得到p個人臉圖像;
第一匹配模塊,用于將所述目標人臉圖像與所述p個人臉圖像進行匹配,得到所述待查詢對象的n個人臉圖像,以及p-n人臉圖像,所述p為大于所述n的整數(shù);
計算模塊,用于分別計算所述p-n人臉圖像中每一人臉圖像與所述n個人臉圖像之間的最短時間差,得到所述p-n個最短時間差值;
第一選取模塊,用于從所述p-n個最短時間差值中選取小于第一預設閾值的最短時間差值,得到所述m個最短時間差值,獲取其對應的人臉圖像,得到與所述待查詢對象相關的m個人臉圖像。
結合本發(fā)明實施例第二方面的第二種可能實施方式中,在第二方面的第三種可能實施方式中,所述第一匹配模塊包括:
評價模塊,用于對所述p個人臉圖像進行圖像質(zhì)量評價,得到所述p個圖像質(zhì)量評價值;
第二選取模塊,用于從所述p個圖像質(zhì)量評價值中選取大于第二預設閾值的圖像質(zhì)量評價值對應的q個人臉圖像,所述q為小于或等于所述p且大于所述n的正整數(shù);
第二匹配模塊,用于將所述目標人臉圖像與所述q個人臉圖像進行匹配。
結合本發(fā)明實施例第二方面或第二方面的第一種可能實施方式中,在第二方面的第四種可能實施方式中,所述裝置還包括:
分析單元,用于在所述搜索單元根據(jù)所述目標人臉圖像對所述第二視頻進行搜索,得到所述待查詢對象的n個人臉圖像,以及與所述待查詢對象相關的m個人臉圖像之后,對所述m個人臉圖像進行行為分析,得到符合預設行為的x個人臉圖像,所述x為小于或等于所述m的正整數(shù)。
實施本發(fā)明實施例,具有如下有益效果:
可以看出,通過本發(fā)明實施例,獲取由指定攝像頭拍攝的第一視頻,獲取用戶輸入的查詢時間范圍以及待查詢對象的目標人臉圖像,根據(jù)查詢時間范圍對所述第一視頻進行截取操作,得到第二視頻,根據(jù)目標人臉圖像對第二視頻進行搜索,得到待查詢對象的n個人臉圖像,以及與待查詢對象相關的m個人臉圖像,n、m均為正整數(shù)。如此,可獲取指定攝像頭的第一視頻,進而,獲取需要查詢的時間范圍以及目標人臉圖像,依據(jù)該時間范圍,截取第一視頻的部分視頻,可縮小人臉識別的工作量,另外,還可以在該部分視頻中查找出與目標人臉圖像匹配的人臉圖像以及相關的人臉圖像,相對于現(xiàn)有技術中,需要用戶一幀一幀查看視頻,并通過人為分析實現(xiàn)蹲點的方式而言,上述本實施例,則利用計算機強大的處理功能快速找到目標人物以及與該目標人物相關的同伙。
附圖說明
為了更清楚地說明本發(fā)明實施例中的技術方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明實施例提供的一種視頻處理方法的第一實施例流程示意圖;
圖2是本發(fā)明實施例提供的一種視頻處理方法的第二實施例流程示意圖;
圖3a是本發(fā)明實施例提供的一種視頻處理裝置的第一實施例結構示意圖;
圖3b是本發(fā)明實施例提供的圖3a所描述的視頻處理裝置的截取單元的結構示意圖;
圖3c是本發(fā)明實施例提供的圖3a所描述的視頻處理裝置的搜索單元的結構示意圖;
圖3d是本發(fā)明實施例提供的圖3c所描述的視頻處理裝置的第一匹配模塊的結構示意圖;
圖3e是本發(fā)明實施例提供的圖3a所描述的視頻處理裝置的又一結構示意圖;
圖4是本發(fā)明實施例提供的一種視頻處理裝置的第二實施例結構示意圖。
具體實施方式
下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領域普通技術人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
本發(fā)明的說明書和權利要求書及所述附圖中的術語“第一”、“第二”、“第三”和“第四”等是用于區(qū)別不同對象,而不是用于描述特定順序。此外,術語“包括”和“具有”以及它們?nèi)魏巫冃危鈭D在于覆蓋不排他的包含。例如包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設備沒有限定于已列出的步驟或單元,而是可選地還包括沒有列出的步驟或單元,或可選地還包括對于這些過程、方法、產(chǎn)品或設備固有的其它步驟或單元。
在本文中提及“實施例”意味著,結合實施例描述的特定特征、結構或特性可以包含在本發(fā)明的至少一個實施例中。在說明書中的各個位置展示該短語并不一定均是指相同的實施例,也不是與其它實施例互斥的獨立的或備選的實施例。本領域技術人員顯式地和隱式地理解的是,本文所描述的實施例可以與其它實施例相結合。
本發(fā)明實施例所描述視頻處理裝置可以包括智能手機(如android手機、ios手機、windowsphone手機等)、平板電腦、掌上電腦、筆記本電腦、移動互聯(lián)網(wǎng)設備(mid,mobileinternetdevices)或穿戴式設備等,上述僅是舉例,而非窮舉,包含但不限于上述裝置,當然,上述視頻處理裝置還可以為服務器。
需要說明的是,本發(fā)明實施例中的視頻處理裝置可與多個攝像頭連接,每一攝像頭均可用于抓拍視頻圖像,每一攝像頭均可有一個與之對應的位置標記,或者,可有一個與之對應的編號。通常情況下,攝像頭可設置在公共場所,例如,學校、博物館、十字路口、步行街、寫字樓、車庫、機場、醫(yī)院、地鐵站、車站、公交站臺、超市、酒店、娛樂場所等等。攝像頭在拍攝到視頻圖像后,可將該視頻圖像保存到視頻處理裝置所在系統(tǒng)的存儲器。存儲器中可存儲有多個圖像庫,每一圖像庫可包含同一人的不同視頻圖像,當然,每一圖像庫還可以用于存儲一個區(qū)域的視頻圖像或者某個指定攝像頭拍攝的視頻圖像。
進一步可選地,本發(fā)明實施例中,攝像頭拍攝的每一幀視頻圖像均對應一個屬性信息,屬性信息為以下至少一種:視頻圖像的拍攝時間、視頻圖像的位置、視頻圖像的屬性參數(shù)(格式、大小、分辨率等)、視頻圖像的編號和視頻圖像中的人物特征屬性。上述視頻圖像中的人物特征屬性可包括但不僅限于:視頻圖像中的人物個數(shù)、人物位置、人物角度、年齡、圖像質(zhì)量等等。
進一步需要說明的是,每一攝像頭采集的視頻圖像通常為動態(tài)人臉圖像,因而,本發(fā)明實施例中可以對人臉圖像的角度信息進行規(guī)劃,上述角度信息可包括但不僅限于:水平轉動角度、俯仰角或者傾斜度。例如,可定義動態(tài)人臉圖像數(shù)據(jù)要求兩眼間距不小于30像素,建議60像素以上。水平轉動角度不超過±30°、俯仰角不超過±20°、傾斜角不超過±45°。建議水平轉動角度不超過±15°、俯仰角不超過±10°、傾斜角不超過±15°。例如,還可對人臉圖像是否被其他物體遮擋進行篩選,通常情況下,飾物不應遮擋臉部主要區(qū)域,飾物如深色墨鏡、口罩和夸張首飾等,當然,也有可能攝像頭上面布滿灰塵,導致人臉圖像被遮擋。本發(fā)明實施例中的視頻圖像的圖片格式可包括但不僅限于:bmp,jpeg,jpeg2000,png等等,其大小可以在10-30kb之間,每一視頻圖像還可以對應一個拍攝時間、以及拍攝該視頻圖像的攝像頭統(tǒng)一編號、與人臉圖像對應的全景大圖的鏈接等信息(人臉圖像和全局圖片建立特點對應性關系文件)。
請參閱圖1,為本發(fā)明實施例提供的一種視頻處理方法的第一實施例流程示意圖。本實施例中所描述的視頻處理方法,包括以下步驟:
101、獲取由指定攝像頭拍攝的第一視頻。
其中,指定攝像頭可由用戶指定,或者,系統(tǒng)默認。上述第一視頻可為由指定攝像頭拍攝的一段時間內(nèi)的視頻。
102、獲取用戶輸入的查詢時間范圍以及待查詢對象的目標人臉圖像。
其中,查詢時間范圍可由用戶自行輸入,例如,2017年4月20號8:00-2017年4月20號20:00。上述待查詢對象為用戶需要查詢的對象,可獲取該待查詢對象的目標人臉圖像。
103、根據(jù)所述查詢時間范圍對所述第一視頻進行截取操作,得到第二視頻。
其中,可根據(jù)查詢時間范圍截取第一視頻的部分視頻,作為第二視頻,可減少后續(xù)人臉識別的工作量。
可選地,上述步驟103中,所述查詢時間范圍包含起點時間和結束時間,根據(jù)所述查詢時間范圍對所述第一視頻進行截取操作,可包括如下步驟:
31)、根據(jù)所述起點時間和所述結束時間對所述第一視頻進行定位,得到第三視頻;
32)、對所述第三視頻同時進行正序人臉檢測和反序人臉檢測;
33)、確定所述正序人臉檢測出現(xiàn)的第一關鍵幀的第一時刻和所述反序人臉檢測出現(xiàn)的第二關鍵幀的第二時刻,其中,所述第一關鍵幀、所述第二關鍵幀均為首次出現(xiàn)人臉圖像滿足預設角度的視頻圖像;
34)、將所述第一時刻與所述第二時刻之間的視頻作為所述第二視頻。
其中,查詢時間范圍可包含起點時間和結束時間,因而,可將起點時間和結束時間映射到第一視頻中,以得到在第一視頻中處于起點時間與結束時間之間的這段視頻,即第三視頻,可對第三視頻同時進行正序人臉檢測和反序人臉檢測,其中,正序人臉檢測為沿著時間軸正向方向進行人臉檢測,即以起點時間開始的視頻圖像幀為起點,當出現(xiàn)第一個人臉圖像且該人臉圖像的角度滿足預設角度范圍,則該第一個人臉圖像對應的圖像幀作為第一關鍵幀,其對應的時刻作為第一時刻。反序人臉檢測為沿著時間軸反向方向進行人臉檢測,即以結束時間開始的視頻圖像幀為起點,當出現(xiàn)第一個人臉圖像且該人臉圖像的角度滿足預設角度范圍,則該第一個人臉圖像對應的圖像幀作為第二關鍵幀,其對應的時刻作為第二時刻,上述預設角度范圍可由用戶自行設置或者系統(tǒng)默認。進而,可將第一時刻與第二時刻之間的視頻作為第二視頻。由于查詢時間范圍是一個指定范圍,并非那么精準地讓起始幀和結束幀均包含滿足預設角度的人臉圖像,因而,可對查詢時間范圍的視頻采用正序人臉檢測和反序人臉檢測,從而,快速找到查詢時間范圍內(nèi)包含符合預設角度的人臉圖像的第一幀和最后一幀,進而,獲取其對應的時刻,獲取對應的時刻對應的視頻,如此,可減少后期人臉識別的工作量。
104、根據(jù)所述目標人臉圖像對所述第二視頻進行搜索,得到所述待查詢對象的n個人臉圖像,以及與所述待查詢對象相關的m個人臉圖像,所述n、所述m均為正整數(shù)。
其中,可根據(jù)目標人臉圖像對第二視頻進行搜索,進而,可得到與目標人臉圖像匹配的n個人臉圖像,以及與待查詢對象相關的m個人臉圖像。
可選地,上述步驟104中,根據(jù)所述目標人臉圖像對所述第二視頻進行搜索,得到所述待查詢對象的n個人臉圖像,以及與所述待查詢對象相關的m個人臉圖像,可包括如下步驟:
41)、將所述第二視頻中每一幀視頻圖像進行人臉分割,得到p個人臉圖像;
42)、將所述目標人臉圖像與所述p個人臉圖像進行匹配,得到所述待查詢對象的n個人臉圖像,以及p-n人臉圖像,所述p為大于所述n的整數(shù);
43)、分別計算所述p-n人臉圖像中每一人臉圖像與所述n個人臉圖像之間的最短時間差,得到所述p-n個最短時間差值;
44)、從所述p-n個最短時間差值中選取小于第一預設閾值的最短時間差值,得到所述m個最短時間差值,獲取其對應的人臉圖像,得到與所述待查詢對象相關的m個人臉圖像。
其中,上述第一預設閾值可由用戶自行設置或者系統(tǒng)默認,第一預設閾值的存在是為了縮小搜索范圍,由經(jīng)驗可知,當搜索某個人的時候,出現(xiàn)與其相關的同伙的話,該嫌疑人與同伙之間出現(xiàn)的時間點間隔較短,當然,也有可能第一預設閾值需要設置較大,例如,嫌疑人將物品放在某個地方,用于等待同伙來取,這種情況,第一預設閾值可設置較大,以免第一預設閾值較小,在處理過程中,將嫌疑人的同伙排除了,第一預設閾值的具體設置依據(jù)實際情況而定??刹捎脠D像分割算法對第二視頻中每一幀視頻圖像進行人臉分割,得到p個人臉圖像,將目標人臉圖像與p個人臉圖像進行匹配,得到待查詢對象的n個人臉圖像,以及p-n人臉圖像,p為大于n的整數(shù),可分別計算p-n人臉圖像中每一人臉圖像與n個人臉圖像之間的最短時間差,得到p-n個最短時間差值,選取小于第一預設閾值的最短時間差值,得到m個最短時間差值,進而,可獲取該m個最短時間差值對應的人臉圖像,得到了與待查詢對象相關的m個人臉圖像。如此,由于第二視頻中每一幀圖像包含的人臉圖像數(shù)目不一樣,有可能包含1個或者多個,當然,也可能是0個,如此,對每一幀圖像進行圖像分割,可得到一部分待查詢對象的目標人臉圖像,當然,也有其他的人臉圖像,每一人臉圖像均可對應一個時間點,如此,可分別計算不是待查詢對象的人臉圖像對應的時間點與每一待查詢對象的人臉圖像對應的時間點之間的最短時間差,例如,待查詢對象的人臉圖像對應的時間點為t1,t2,非待查詢對象的人臉圖像的時間點為t3,則可得到t1-t3和t2-t3,時間差可能是正數(shù)也可能是負數(shù),只取得到的值作為時間差值,忽略正、負號。如此,可選取其最小值作為最短時間差值,如此,通過上述方式,由于圖像分割,可得到視頻中盡可能多的人臉圖像,因而,可盡可能全面地得到與待查詢對象的人臉圖像相關的人臉圖像,有利于全面分析可能與待查詢對象相關的其他人物。例如,該方法用于蹲點中,可全面分析出可能與嫌疑人相關聯(lián)的同伙。
進一步可選地,上述步驟42中,將所述目標人臉圖像與所述p個人臉圖像進行匹配,可包括如下步驟:
441)、對所述p個人臉圖像進行圖像質(zhì)量評價,得到所述p個圖像質(zhì)量評價值;
442)、從所述p個圖像質(zhì)量評價值中選取大于第二預設閾值的圖像質(zhì)量評價值對應的q個人臉圖像,所述q為小于或等于所述p且大于所述n的正整數(shù);
443)、將所述目標人臉圖像與所述q個人臉圖像進行匹配。
其中,上述第二預設閾值可由用戶自行設置或者系統(tǒng)默認。上述本發(fā)明實施例,可對p個人臉圖像進行篩選,淘汰一些圖像質(zhì)量較差的人臉圖像,以減少圖像匹配的工作量。如此,可利用對每一人臉圖像進行圖像質(zhì)量評價的方式,篩選出圖像質(zhì)量較好的圖像,進而,再在這些圖像中尋找與目標人臉圖像匹配的圖像的話,可大大縮減搜索時間,畢竟需要匹配的圖像少了,提升了人臉是被效率。
可選地,在步驟441中,對p個人臉圖像進行圖像質(zhì)量評價,可采用如下方式:可采用至少一個圖像質(zhì)量評價指標分別對圖像進行圖像質(zhì)量評價,得到圖像質(zhì)量評價值,其中,圖像質(zhì)量評價指標可包括但不僅限于:平均灰度、均方差、熵、邊緣保持度、信噪比等等??啥x為得到的圖像質(zhì)量評價值越大,則圖像質(zhì)量越好。
需要說明的是,由于采用單一評價指標對圖像質(zhì)量進行評價時,具有一定的局限性,因此,可采用多個圖像質(zhì)量評價指標對圖像質(zhì)量進行評價,當然,對圖像質(zhì)量進行評價時,并非圖像質(zhì)量評價指標越多越好,因為圖像質(zhì)量評價指標越多,圖像質(zhì)量評價過程的計算復雜度越高,也不見得圖像質(zhì)量評價效果越好,因此,在對圖像質(zhì)量評價要求較高的情況下,可采用2~10個圖像質(zhì)量評價指標對圖像質(zhì)量進行評價。具體地,選取圖像質(zhì)量評價指標的個數(shù)及哪個指標,依據(jù)具體實現(xiàn)情況而定。當然,也得結合具體地場景選取圖像質(zhì)量評價指標,在暗環(huán)境下進行圖像質(zhì)量評價和亮環(huán)境下進行圖像質(zhì)量評價選取的圖像質(zhì)量指標可不一樣。
可選地,在對圖像質(zhì)量評價精度要求不高的情況下,可用一個圖像質(zhì)量評價指標進行評價,例如,以熵對人臉圖像進行圖像質(zhì)量評價值,可認為熵越大,則說明圖像質(zhì)量越好,相反地,熵越小,則說明圖像質(zhì)量越差。
可選地,在對圖像質(zhì)量評價精度要求較高的情況下,可以采用多個圖像質(zhì)量評價指標對人臉圖像進行評價,在多個圖像質(zhì)量評價指標對人臉圖像進行圖像質(zhì)量評價時,可設置該多個圖像質(zhì)量評價指標中每一圖像質(zhì)量評價指標的權重,可得到多個圖像質(zhì)量評價值,根據(jù)該多個圖像質(zhì)量評價值及其對應的權重可得到最終的圖像質(zhì)量評價值,例如,三個圖像質(zhì)量評價指標分別為:a指標、b指標和c指標,a的權重為a1,b的權重為a2,c的權重為a3,采用a、b和c對某一圖像進行圖像質(zhì)量評價時,a對應的圖像質(zhì)量評價值為b1,b對應的圖像質(zhì)量評價值為b2,c對應的圖像質(zhì)量評價值為b3,那么,最后的圖像質(zhì)量評價值=a1b1+a2b2+a3b3。通常情況下,圖像質(zhì)量評價值越大,說明圖像質(zhì)量越好。
可以看出,通過本發(fā)明實施例,獲取由指定攝像頭拍攝的第一視頻,獲取用戶輸入的查詢時間范圍以及待查詢對象的目標人臉圖像,根據(jù)查詢時間范圍對所述第一視頻進行截取操作,得到第二視頻,根據(jù)目標人臉圖像對第二視頻進行搜索,得到待查詢對象的n個人臉圖像,以及與待查詢對象相關的m個人臉圖像,n、m均為正整數(shù)。如此,可獲取指定攝像頭的第一視頻,進而,獲取需要查詢的時間范圍以及目標人臉圖像,依據(jù)該時間范圍,截取第一視頻的部分視頻,可縮小人臉識別的工作量,另外,還可以在該部分視頻中查找出與目標人臉圖像匹配的人臉圖像以及相關的人臉圖像,相對于現(xiàn)有技術中,需要用戶一幀一幀查看視頻,并通過人為分析實現(xiàn)蹲點的方式而言,上述本實施例,則利用計算機強大的處理功能快速找到目標人物以及與該目標人物相關的同伙。例如,在民警蹲點方面,本實施例可快速找到嫌疑人以及與之相關的同伙,提高了民警的偵查效率。
與上述一致地,請參閱圖2,為本發(fā)明實施例提供的一種視頻處理方法的第二實施例流程示意圖。本實施例中所描述的視頻處理方法,包括以下步驟:
201、獲取由指定攝像頭拍攝的第一視頻。
202、獲取用戶輸入的查詢時間范圍以及待查詢對象的目標人臉圖像。
203、根據(jù)所述查詢時間范圍對所述第一視頻進行截取操作,得到第二視頻。
204、根據(jù)所述目標人臉圖像對所述第二視頻進行搜索,得到所述待查詢對象的n個人臉圖像,以及與所述待查詢對象相關的m個人臉圖像,所述n、所述m均為正整數(shù)。
其中,上述步驟201-步驟204所描述的視頻處理方法可參考圖1所描述的視頻處理方法的對應步驟。
205、對所述m個人臉圖像進行行為分析,得到符合預設行為的x個人臉圖像,所述x為小于或等于所述m的正整數(shù)。
其中,上述預設行為可為以下至少一種:低頭、打架、打電話、表情猥瑣、交頭接耳、親密行為等等。在具體實現(xiàn)中,視頻處理裝置可從第二視頻中獲取m個人臉圖像對應的a個視頻圖像幀,對該a個視頻圖像幀中每一視頻圖像幀進行行為分析,得到符合上述預設行為的b個視頻圖像幀,其中,a與b均為正整數(shù),且b小于a,進而,將m個人臉圖像與該b個視頻圖像進行匹配,得到x個人臉圖像。如此,可通過行為分析進行排除,盡可能縮小與待查詢對象相關的對象,有利用為用戶提供盡可能精準數(shù)據(jù),例如,對于攝像頭而言,也有可能捕捉到無關的行人,采用上述方式,則可以在一定程度排除行人。
可以看出,通過本發(fā)明實施例,獲取由指定攝像頭拍攝的第一視頻,獲取用戶輸入的查詢時間范圍以及待查詢對象的目標人臉圖像,根據(jù)查詢時間范圍對所述第一視頻進行截取操作,得到第二視頻,根據(jù)目標人臉圖像對第二視頻進行搜索,得到待查詢對象的n個人臉圖像,以及與待查詢對象相關的m個人臉圖像,n、m均為正整數(shù),進而,對m個人臉圖像進行行為分析,得到符合預設行為的x個人臉圖像,x為小于或等于m的正整數(shù)。如此,可獲取指定攝像頭的第一視頻,進而,獲取需要查詢的時間范圍以及目標人臉圖像,依據(jù)該時間范圍,截取第一視頻的部分視頻,可縮小人臉識別的工作量,另外,還可以在該部分視頻中查找出與目標人臉圖像匹配的人臉圖像以及相關的人臉圖像,當然,在搜索相關的人臉圖像方面,采用了行為識別方式,可降低誤識別概率,為用戶提供盡可能精準的數(shù)據(jù),相對于現(xiàn)有技術中,需要用戶一幀一幀查看視頻,并通過人為分析實現(xiàn)蹲點的方式而言,上述本實施例,則利用計算機強大的處理功能快速找到目標人物以及與該目標人物相關的同伙。例如,在民警蹲點方面,本實施例可快速找到嫌疑人以及與之相關的同伙,提高了民警的偵查效率。
與上述一致地,以下為實施上述視頻處理方法的裝置,具體如下:
請參閱圖3a,為本發(fā)明實施例提供的一種視頻處理裝置的第一實施例結構示意圖。本實施例中所描述的視頻處理裝置,包括:獲取單元301、截取單元302和搜索單元303,具體如下:
獲取單元301,用于獲取由指定攝像頭拍攝的第一視頻;
所述獲取單元301,還具體用于:
獲取用戶輸入的查詢時間范圍以及待查詢對象的目標人臉圖像;
截取單元302,用于根據(jù)所述查詢時間范圍對所述第一視頻進行截取操作,得到第二視頻;
搜索單元303,用于根據(jù)所述目標人臉圖像對所述第二視頻進行搜索,得到所述待查詢對象的n個人臉圖像,以及與所述待查詢對象相關的m個人臉圖像,所述n、所述m均為正整數(shù)。
其中,上述獲取單元301可用于實現(xiàn)上述步驟101、102所描述的方法,截取單元302可用于實現(xiàn)上述步驟103所描述的方法,上述搜索單元303可用于實現(xiàn)上述步驟104所描述的方法,以下如此類推。
可選地,所述查詢時間范圍包含起點時間和結束時間,如圖3b,圖3b為圖3a所描述的視頻處理裝置的截取單元302的具體細化結構,所述截取單元302可包括:定位模塊3021、檢測模塊3022和確定模塊3023,具體如下:
定位模塊3021,用于根據(jù)所述起點時間和所述結束時間對所述第一視頻進行定位,得到第三視頻;
檢測模塊3022,用于對所述第三視頻同時進行正序人臉檢測和反序人臉檢測;
確定模塊3023,用于確定所述正序人臉檢測出現(xiàn)的第一關鍵幀的第一時刻和所述反序人臉檢測出現(xiàn)的第二關鍵幀的第二時刻,其中,所述第一關鍵幀、所述第二關鍵幀均為首次出現(xiàn)人臉圖像滿足預設角度范圍的視頻圖像;
所述確定模塊3023,還具體用于
將所述第一時刻與所述第二時刻之間的視頻作為所述第二視頻。
可選地,如圖3c,圖3c為圖3a所描述的視頻處理裝置的搜索單元303的具體細化結構,所述搜索單元303可包括:分割模塊3031、第一匹配模塊3032、計算模塊3033和第一選取模塊3034,具體如下:
分割模塊3031,用于將所述第二視頻中每一幀視頻圖像進行人臉分割,得到p個人臉圖像;
第一匹配模塊3032,用于將所述目標人臉圖像與所述p個人臉圖像進行匹配,得到所述待查詢對象的n個人臉圖像,以及p-n人臉圖像,所述p為大于所述n的整數(shù);
計算模塊3033,用于分別計算所述p-n人臉圖像中每一人臉圖像與所述n個人臉圖像之間的最短時間差,得到所述p-n個最短時間差值;
第一選取模塊3034,用于從所述p-n個最短時間差值中選取小于第一預設閾值的最短時間差值,得到所述m個最短時間差值,獲取其對應的人臉圖像,得到與所述待查詢對象相關的m個人臉圖像。
可選地,如圖3d,圖3d為圖3c所描述搜索單元303的第一匹配模塊3032具體細化結構,所述第一匹配模塊3032可包括:評價模塊401、第二選取模塊402和第二匹配模塊403,具體如下:
評價模塊401,用于對所述p個人臉圖像進行圖像質(zhì)量評價,得到所述p個圖像質(zhì)量評價值;
第二選取模塊402,用于從所述p個圖像質(zhì)量評價值中選取大于第二預設閾值的圖像質(zhì)量評價值對應的q個人臉圖像,所述q為小于或等于所述p且大于所述n的正整數(shù);
第二匹配模塊403,用于將所述目標人臉圖像與所述q個人臉圖像進行匹配。
可選地,如圖3d,圖3d為圖3a所描述的視頻處理裝置的又一變型結構,其與圖3a相比較,還可包括:分析單元304,具體如下:
分析單元304,用于在所述搜索單元303根據(jù)所述目標人臉圖像對所述第二視頻進行搜索,得到所述待查詢對象的n個人臉圖像,以及與所述待查詢對象相關的m個人臉圖像之后,對所述m個人臉圖像進行行為分析,得到符合預設行為的x個人臉圖像,所述x為小于或等于所述m的正整數(shù)。
可以看出,通過本發(fā)明實施例所提供的視頻處理裝置,獲取由指定攝像頭拍攝的第一視頻,獲取用戶輸入的查詢時間范圍以及待查詢對象的目標人臉圖像,根據(jù)查詢時間范圍對所述第一視頻進行截取操作,得到第二視頻,根據(jù)目標人臉圖像對第二視頻進行搜索,得到待查詢對象的n個人臉圖像,以及與待查詢對象相關的m個人臉圖像,n、m均為正整數(shù)。如此,可獲取指定攝像頭的第一視頻,進而,獲取需要查詢的時間范圍以及目標人臉圖像,依據(jù)該時間范圍,截取第一視頻的部分視頻,可縮小人臉識別的工作量,另外,還可以在該部分視頻中查找出與目標人臉圖像匹配的人臉圖像以及相關的人臉圖像,相對于現(xiàn)有技術中,需要用戶一幀一幀查看視頻,并通過人為分析實現(xiàn)蹲點的方式而言,上述本實施例,則利用計算機強大的處理功能快速找到目標人物以及與該目標人物相關的同伙。例如,在民警蹲點方面,本實施例可快速找到嫌疑人以及與之相關的同伙,提高了民警的偵查效率。
可以理解的是,本實施例的視頻處理裝置的各程序模塊的功能可根據(jù)上述方法實施例中的方法具體實現(xiàn),其具體實現(xiàn)過程可以參照上述方法實施例的相關描述,此處不再贅述。
與上述一致地,請參閱圖4,為本發(fā)明實施例提供的一種視頻處理裝置的第二實施例結構示意圖。本實施例中所描述的視頻處理裝置,包括:至少一個輸入設備1000;至少一個輸出設備2000;至少一個處理器3000,例如cpu;和存儲器4000,上述輸入設備1000、輸出設備2000、處理器3000和存儲器4000通過總線5000連接。
其中,上述輸入設備1000具體可為觸控面板、物理按鍵或者鼠標。
上述輸出設備2000具體可為顯示屏。
上述存儲器4000可以是高速ram存儲器,也可為非易失存儲器(non-volatilememory),例如磁盤存儲器。上述存儲器4000用于存儲一組程序代碼,上述輸入設備1000、輸出設備2000和處理器3000用于調(diào)用存儲器4000中存儲的程序代碼,執(zhí)行如下操作:
上述處理器3000,用于:
獲取由指定攝像頭拍攝的第一視頻;
獲取用戶輸入的查詢時間范圍以及待查詢對象的目標人臉圖像;
根據(jù)所述查詢時間范圍對所述第一視頻進行截取操作,得到第二視頻;
根據(jù)所述目標人臉圖像對所述第二視頻進行搜索,得到所述待查詢對象的n個人臉圖像,以及與所述待查詢對象相關的m個人臉圖像,所述n、所述m均為正整數(shù)。
可選地,所述查詢時間范圍包含起點時間和結束時間,上述處理器3000根據(jù)所述查詢時間范圍對所述第一視頻進行截取操作,包括:
根據(jù)所述起點時間和所述結束時間對所述第一視頻進行定位,得到第三視頻;
對所述第三視頻同時進行正序人臉檢測和反序人臉檢測;
確定所述正序人臉檢測出現(xiàn)的第一關鍵幀的第一時刻和所述反序人臉檢測出現(xiàn)的第二關鍵幀的第二時刻,其中,所述第一關鍵幀、所述第二關鍵幀均為首次出現(xiàn)人臉圖像滿足預設角度范圍的視頻圖像;
將所述第一時刻與所述第二時刻之間的視頻作為所述第二視頻。
可選地,上述處理器3000,根據(jù)所述目標人臉圖像對所述第二視頻進行搜索,得到所述待查詢對象的n個人臉圖像,以及與所述待查詢對象相關的m個人臉圖像,包括:
將所述第二視頻中每一幀視頻圖像進行人臉分割,得到p個人臉圖像;
將所述目標人臉圖像與所述p個人臉圖像進行匹配,得到所述待查詢對象的n個人臉圖像,以及p-n人臉圖像,所述p為大于所述n的整數(shù);
分別計算所述p-n人臉圖像中每一人臉圖像與所述n個人臉圖像之間的最短時間差,得到所述p-n個最短時間差值;
從所述p-n個最短時間差值中選取小于第一預設閾值的最短時間差值,得到所述m個最短時間差值,獲取其對應的人臉圖像,得到與所述待查詢對象相關的m個人臉圖像。
可選地,上述處理器3000將所述目標人臉圖像與所述p個人臉圖像進行匹配,包括:
對所述p個人臉圖像進行圖像質(zhì)量評價,得到所述p個圖像質(zhì)量評價值;
從所述p個圖像質(zhì)量評價值中選取大于第二預設閾值的圖像質(zhì)量評價值對應的q個人臉圖像,所述q為小于或等于所述p且大于所述n的正整數(shù);
將所述目標人臉圖像與所述q個人臉圖像進行匹配。
可選地,上述處理器3000,在所述根據(jù)所述目標人臉圖像對所述第二視頻進行搜索,得到所述待查詢對象的n個人臉圖像,以及與所述待查詢對象相關的m個人臉圖像之后,還具體用于:
對所述m個人臉圖像進行行為分析,得到符合預設行為的x個人臉圖像,所述x為小于或等于所述m的正整數(shù)。
本發(fā)明實施例還提供一種計算機存儲介質(zhì),其中,該計算機存儲介質(zhì)可存儲有程序,該程序執(zhí)行時包括上述方法實施例中記載的任何一種視頻處理方法的部分或全部步驟。
盡管在此結合各實施例對本發(fā)明進行了描述,然而,在實施所要求保護的本發(fā)明過程中,本領域技術人員通過查看所述附圖、公開內(nèi)容、以及所附權利要求書,可理解并實現(xiàn)所述公開實施例的其他變化。在權利要求中,“包括”(comprising)一詞不排除其他組成部分或步驟,“一”或“一個”不排除多個的情況。單個處理器或其他單元可以實現(xiàn)權利要求中列舉的若干項功能。相互不同的從屬權利要求中記載了某些措施,但這并不表示這些措施不能組合起來產(chǎn)生良好的效果。
本領域技術人員應明白,本發(fā)明的實施例可提供為方法、裝置(設備)、或計算機程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實施例、完全軟件實施例、或結合軟件和硬件方面的實施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(zhì)(包括但不限于磁盤存儲器、cd-rom、光學存儲器等)上實施的計算機程序產(chǎn)品的形式。計算機程序存儲/分布在合適的介質(zhì)中,與其它硬件一起提供或作為硬件的一部分,也可以采用其他分布形式,如通過internet或其它有線或無線電信系統(tǒng)。
本發(fā)明是參照本發(fā)明實施例的方法、裝置(設備)和計算機程序產(chǎn)品的流程圖和/或方框圖來描述的。應理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合。可提供這些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理設備的處理器以產(chǎn)生一個機器,使得通過計算機或其他可編程數(shù)據(jù)處理設備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
這些計算機程序指令也可存儲在能引導計算機或其他可編程數(shù)據(jù)處理設備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理設備上,使得在計算機或其他可編程設備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理,從而在計算機或其他可編程設備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
盡管結合具體特征及其實施例對本發(fā)明進行了描述,顯而易見的,在不脫離本發(fā)明的精神和范圍的情況下,可對其進行各種修改和組合。相應地,本說明書和附圖僅僅是所附權利要求所界定的本發(fā)明的示例性說明,且視為已覆蓋本發(fā)明范圍內(nèi)的任意和所有修改、變化、組合或等同物。顯然,本領域的技術人員可以對本發(fā)明進行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權利要求及其等同技術的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。