基于圖像識別的攝像機圖像定位系統(tǒng)及其方法
【專利摘要】本發(fā)明公開了一種基于圖像識別的攝像機圖像定位系統(tǒng),包括,攝像模塊拍攝現(xiàn)場的第一視頻,并將第一視頻通過網(wǎng)絡(luò)交換模塊傳輸給緩存模塊;緩存模塊暫存第一視頻,其中第一視頻由X幀第一視頻畫面組成,每幀第一視頻畫面的大小為M*N;處理模塊從緩存模塊中接收第一視頻畫面,實時地從每幀第一視頻畫面中截取包括目標物體在內(nèi)的大小為m*n的第二視頻畫面,并將截取的每幀第二視頻畫面形成連續(xù)的第二視頻,其中,M>m、N>n,且在形成的第二視頻中目標物體的運動方向與第一視頻中目標物體的運動方向一致;存儲模塊存儲第二視頻。本發(fā)明還公開了一種基于圖像識別的攝像機圖像定位方法。本發(fā)明解決了現(xiàn)有技術(shù)中存在的視頻畫面不流暢的問題。
【專利說明】
基于圖像識別的攝像機圖像定位系統(tǒng)及其方法
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及圖像處理技術(shù)領(lǐng)域,更具體地,涉及一種基于圖像識別的攝像機圖像定位系統(tǒng)及其方法。
【背景技術(shù)】
[0002]目前,不管是精品課錄制還是在電視會議錄制,以及演播室的節(jié)目錄制,都會在拍攝現(xiàn)場設(shè)置相應的攝像機,攝像機拍攝整個現(xiàn)場的視頻畫面,對攝像機拍攝的視頻畫面進行處理,處理的方法為:在原始的視頻畫面中截取包括人在內(nèi)的小的視頻畫面,視頻畫面中的人是來回走動的,當人走到小的視頻畫面的邊界時,再從原始的視頻畫面中截取包括人在內(nèi)的小的視頻畫面,利用這種方法處理的視頻畫面雖然解決了視頻畫面跟蹤問題,但是視頻畫面不流暢,給人的感覺是視頻畫面中的人從視頻畫面的邊界一下子就跨越到了視頻畫面的中間位置,視頻畫面是一頓一頓的,處理后的視頻畫面的效果不好。
【發(fā)明內(nèi)容】
[0003]有鑒于此,本發(fā)明的主要目的在于提供一種基于圖像識別的攝像機圖像定位系統(tǒng)及其方法,能夠解決現(xiàn)有技術(shù)中存在的視頻畫面不連續(xù)、效果不好問題。
[0004]為達到上述目的,本發(fā)明的技術(shù)方案是這樣實現(xiàn)的:
[0005]—方面,本發(fā)明提供了一種基于圖像識別的攝像機圖像定位系統(tǒng),包括,攝像模塊、網(wǎng)絡(luò)交換模塊、緩存模塊、處理模塊和存儲模塊,其中,攝像模塊,固定在拍攝現(xiàn)場,用于拍攝現(xiàn)場的第一視頻,并將第一視頻通過網(wǎng)絡(luò)交換模塊傳輸給緩存模塊;緩存模塊,分別與網(wǎng)絡(luò)交換模塊以及處理模塊相連,用于暫存第一視頻,其中第一視頻由X幀第一視頻畫面組成,每幀第一視頻畫面的大小為M*N ;處理模塊,分別與緩存模塊以及存儲模塊相連,包括接收單元和截取單元,其中,接收單元,用于從緩存模塊中接收第一視頻畫面;截取單元,用于實時地從每幀第一視頻畫面中截取包括目標物體在內(nèi)的大小為m*n的第二視頻畫面,并將截取的每幀第二視頻畫面形成連續(xù)的第二視頻,其中,M>m、N>n,且在形成的第二視頻中目標物體的運動方向與第一視頻中目標物體的運動方向是一致的;存儲模塊,與處理模塊相連,用于存儲第二視頻。
[0006]優(yōu)選地,處理模塊還包括判斷單元,用于基于對接收單元接收到的相鄰兩幀的第一視頻畫面進行對比,來判斷第一視頻中目標物體的運動方向。
[0007]優(yōu)選地,處理模塊還包括編碼單元,用于當相鄰兩幀的第一視頻畫面沒有發(fā)生變化時,丟掉其中一幀第一視頻畫面。
[0008]另一方面,本發(fā)明還提供了一種基于圖像識別的攝像機圖像定位方法,包括:拍攝模塊拍攝現(xiàn)場的第一視頻,并將第一視頻通過網(wǎng)絡(luò)交換模塊傳輸給緩存模塊,其中,拍攝模塊固定在拍攝現(xiàn)場;緩存模塊暫存第一視頻,其中第一視頻由X幀第一視頻畫面組成,每幀第一視頻畫面的大小為M*N ;處理模塊從緩存模塊中接收第一視頻畫面,實時地從每幀第一視頻畫面中截取包括目標物體在內(nèi)的大小為m*n的第二視頻畫面,并將截取的每幀第二視頻畫面形成連續(xù)的第二視頻,其中,M>m、N>n,且在形成的第二視頻中目標物體的運動方向與第一視頻中目標物體的運動方向是一致的;存儲模塊存儲第二視頻。
[0009]優(yōu)選地,在實時地從每幀第一視頻畫面中截取包括目標物體在內(nèi)的大小為m*n的第二視頻畫面之前,該方法還包括:基于對接收到的相鄰兩幀的第一視頻畫面進行對比,來判斷第一視頻中目標物體的運動方向。
[0010]優(yōu)選地,在實時地從每幀第一視頻畫面中截取包括目標物體在內(nèi)的大小為m*n的第二視頻畫面之前,該方法還包括:當相鄰兩幀的第一視頻畫面沒有發(fā)生變化時,丟掉其中一幀第一視頻畫面。
[0011]本發(fā)明的技術(shù)效果:
[0012]本發(fā)明由于系統(tǒng)設(shè)置了緩存模塊以及處理模塊,將攝像模塊拍攝的視頻畫面先進行緩存,處理模塊從緩存模塊中接收緩存之后的視頻畫面進行截取處理,最后形成的視頻連續(xù)流暢,給人的感覺是攝像模塊跟著目標物體的移動而移動的,而不是目標物體從視頻畫面的邊界一下子就跨越到了視頻畫面的中間位置,解決了現(xiàn)有技術(shù)中畫面不流暢,畫面反應遲鈍、跳躍等問題。
【附圖說明】
[0013]此處所說明的附圖用來提供對本發(fā)明的進一步理解,構(gòu)成本申請的一部分,本發(fā)明的示意性實施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當限定。在附圖中:
[0014]圖1示出了根據(jù)本發(fā)明實施例一的基于圖像識別的攝像機圖像定位系統(tǒng)的結(jié)構(gòu)示意圖;
[0015]圖2示出了根據(jù)本發(fā)明實施例二的基于圖像識別的攝像機圖像定位系統(tǒng)的結(jié)構(gòu)示意圖;
[0016]圖3示出了根據(jù)本發(fā)明實施例三的基于圖像識別的攝像機圖像定位系統(tǒng)的結(jié)構(gòu)示意圖;
[0017]圖4示出了根據(jù)本發(fā)明實施例四的基于圖像識別的攝像機圖像定位方法的流程圖。
【具體實施方式】
[0018]下面將參考附圖并結(jié)合實施例,來詳細說明本發(fā)明。
[0019]實施例一
[0020]圖1示出了根據(jù)本發(fā)明實施例一的基于圖像識別的攝像機圖像定位系統(tǒng)的結(jié)構(gòu)示意圖;如圖1所示,該系統(tǒng)包括:攝像模塊10、網(wǎng)絡(luò)交換模塊20、緩存模塊30、處理模塊40和存儲模塊50,其中,
[0021]攝像模塊10,固定在拍攝現(xiàn)場,用于拍攝現(xiàn)場的第一視頻,并將第一視頻通過網(wǎng)絡(luò)交換模塊20傳輸給緩存模塊30 ;
[0022]緩存模塊30,分別與網(wǎng)絡(luò)交換模塊20以及處理模塊40相連,用于暫存第一視頻,其中第一視頻由X幀第一視頻畫面組成,每幀第一視頻畫面的大小為M*N ;
[0023]處理模塊40,分別與緩存模塊30以及存儲模塊50相連,包括接收單元402和截取單元404,其中,
[0024]接收單元402,用于從緩存模塊30中接收第一視頻畫面;
[0025]截取單元404,用于實時地從每幀第一視頻畫面中截取包括目標物體在內(nèi)的大小為m*n的第二視頻畫面,并將截取的每幀第二視頻畫面形成連續(xù)的第二視頻,其中,M>m、N>n,且在形成的第二視頻中目標物體的運動方向與第一視頻中目標物體的運動方向是一致的;
[0026]例如,在教室里錄制精品課,固定一臺攝像模塊來拍攝整個講臺,此時,上述所說的目標物體為老師,拍攝老師的整個講課過程(拍的是老師和講臺的一個大全景),拍攝的視頻為第一視頻,該第一視頻中的每幀視頻畫面為第一視頻畫面,假設(shè)第一視頻畫面為高清視頻畫面1920*1080 (相當于M*N),拍攝的第一視頻暫存于緩存模塊,處理模塊將從緩存模塊中接收已經(jīng)拍攝好的第一視頻畫面,并實時地從每幀第一視頻畫面中截取包括老師在內(nèi)的大小為720*576 (相當于m*n)的標清第二視頻畫面,并將截取的每幀第二視頻畫面形成連續(xù)的第二視頻,此時,處理模塊截取視頻畫面的條件是,在形成的第二視頻中老師的運動方向與第一視頻中老師的運動方向是一致的,假設(shè)老師在講臺上是從左向右走的(第一視頻中老師的運動方向是從左向右),而處理后形成的第二視頻中老師的運動方向也是從左向右的。處理后播出的視頻畫面給人的感覺是攝像模塊跟著老師的移動而移動的,視頻畫面流暢,解決了現(xiàn)有技術(shù)中畫面不流暢,畫面效果不好的問題。
[0027]同樣,在同一教室中,再固定安裝一臺攝像模塊來拍攝整個教室里所有的學生,此時,上述所說的目標物體為每個學生,假設(shè)某個學生站立起來回答老師的問題,該學生站起來的動作是由下到上的,此時,處理模塊截取形成的第二視頻中學生的運動方向是由下到上的,將學生站起來的動作形成連續(xù)的第二視頻。
[0028]如果想得到高清的視頻畫面,就需要在拍攝現(xiàn)場設(shè)置一臺分辨率更高的攝像模塊。
[0029]存儲模塊50,與處理模塊40相連,用于存儲第二視頻。
[0030]該系統(tǒng)也可以應用在電視會議錄制、演播室的節(jié)目錄制以及廣播電視等領(lǐng)域。
[0031]本發(fā)明的實施例中由于系統(tǒng)設(shè)置了緩存模塊以及處理模塊,將攝像模塊拍攝的視頻畫面先進行緩存,處理模塊從緩存模塊中接收緩存之后的視頻畫面進行截取處理,最后形成的視頻連續(xù)流暢,給人的感覺是攝像模塊跟著目標物體的移動而移動的,而不是目標物體從視頻畫面的邊界一下子就跨越到了視頻畫面的中間位置,解決了現(xiàn)有技術(shù)中畫面不流暢,畫面反應遲鈍、跳躍等問題。
[0032]實施例二
[0033]圖2示出了根據(jù)本發(fā)明實施例二的基于圖像識別的攝像機圖像定位系統(tǒng)的結(jié)構(gòu)示意圖,如圖2所示,處理模塊40還包括判斷單元406,用于基于對接收單元接收到的相鄰兩幀的第一視頻畫面進行對比,來判斷第一視頻中目標物體的運動方向。
[0034]例如,對第x-1幀的第一視頻畫面中的老師的位置與第X幀的第一視頻畫面中的老師的位置進行對比,若第x-1幀的第一視頻畫面中的老師的位置相對于第X幀的第一視頻畫面中的老師的位置靠左側(cè),則判斷老師的運動方向為從左向右。
[0035]其中,緩存模塊的存儲量越大,給處理模塊處理視頻畫面的時間越多,處理后的視頻畫面就越流暢,效果更好。
[0036]實施例三
[0037]圖3示出了根據(jù)本發(fā)明實施例三的基于圖像識別的攝像機圖像定位系統(tǒng)的結(jié)構(gòu)示意圖,如圖3所示,處理模塊40還包括編碼單元408,用于當相鄰兩幀的第一視頻畫面沒有發(fā)生變化時,丟掉其中一幀第一視頻畫面。
[0038]例如,當?shù)趚-1幀第一視頻畫面與第X幀第一視頻畫面沒有發(fā)生變化時,S卩,可以認為老師在講臺上沒有走動也可以認為沒有學生走到講臺上出現(xiàn)在第一視頻畫面中,只要是第一視頻畫面沒有發(fā)生變化,編碼單元將丟掉其中一幀(x-1幀或X幀)第一視頻畫面,這樣后續(xù)形成的第二視頻將節(jié)約了好多存儲空間,大大節(jié)省了存儲成本。
[0039]實施例四
[0040]圖4示出了根據(jù)本發(fā)明實施例四的基于圖像識別的攝像機圖像定位方法的流程圖,如圖4所示,該方法包括:
[0041]步驟S401,拍攝模塊拍攝現(xiàn)場的第一視頻,并將第一視頻通過網(wǎng)絡(luò)交換模塊傳輸給緩存模塊,其中,拍攝模塊固定在拍攝現(xiàn)場;
[0042]步驟S402,緩存模塊暫存第一視頻,其中第一視頻由X幀第一視頻畫面組成,每幀第一視頻畫面的大小為M*N ;
[0043]步驟S403,處理模塊從緩存模塊中接收第一視頻畫面,實時地從每幀第一視頻畫面中截取包括目標物體在內(nèi)的大小為m*n的第二視頻畫面,并將截取的每幀第二視頻畫面形成連續(xù)的第二視頻,其中,M>m、N>n,且在形成的第二視頻中目標物體的運動方向與第一視頻中目標物體的運動方向是一致的;
[0044]例如,在教室里錄制精品課,固定一臺攝像模塊來拍攝整個講臺,此時,上述所說的目標物體為老師,拍攝老師的整個講課過程(拍的是老師和講臺的一個大全景),拍攝的視頻為第一視頻,該第一視頻中的每幀視頻畫面為第一視頻畫面,假設(shè)第一視頻畫面為高清視頻畫面1920*1080 (相當于M*N),拍攝的第一視頻暫存于緩存模塊,處理模塊將從緩存模塊中接收已經(jīng)拍攝好的第一視頻畫面,并實時地從每幀第一視頻畫面中截取包括老師在內(nèi)的大小為720*576 (相當于m*n)的標清第二視頻畫面,并將截取的每幀第二視頻畫面形成連續(xù)的第二視頻,此時,處理模塊截取視頻畫面的條件是,在形成的第二視頻中老師的運動方向與第一視頻中老師的運動方向是一致的,假設(shè)老師在講臺上是從左向右走的(第一視頻中老師的運動方向是從左向右),而處理后形成的第二視頻中老師的運動方向也是從左向右的。處理后播出的視頻畫面給人的感覺是攝像模塊跟著老師的移動而移動的,視頻畫面流暢,解決了現(xiàn)有技術(shù)中畫面不流暢,畫面反應遲鈍、跳躍等問題。
[0045]同樣,在同一教室中,再固定安裝一臺攝像模塊來拍攝整個教室里所有的學生,此時,上述所說的目標物體為每個學生,假設(shè)某個學生站立起來回答老師的問題,該學生站起來的動作是由下到上的,此時,處理模塊截取形成的第二視頻中學生的運動方向是由下到上的,將學生站起來的動作形成連續(xù)的第二視頻。
[0046]其中,在實時地從每幀第一視頻畫面中截取包括目標物體在內(nèi)的大小為m*n的第二視頻畫面之前,該方法還包括:基于對接收到的相鄰兩幀的第一視頻畫面進行對比,來判斷第一視頻中目標物體的運動方向。
[0047]例如,對第x-1幀的第一視頻畫面中的老師的位置與第X幀的第一視頻畫面中的老師的位置進行對比,若第x-1幀的第一視頻畫面中的老師的位置相對于第X幀的第一視頻畫面中的老師的位置靠左側(cè),則判斷老師的運動方向為從左向右。
[0048]其中,緩存模塊的存儲量越大,給處理模塊處理視頻畫面的時間越多,處理后的視頻畫面就越流暢,效果更好。
[0049]其中,在實時地從每幀第一視頻畫面中截取包括目標物體在內(nèi)的大小為m*n的第二視頻畫面之前,該方法還包括:當相鄰兩幀的第一視頻畫面沒有發(fā)生變化時,丟掉其中一幀第一視頻畫面。
[0050]例如,當?shù)趚-1幀第一視頻畫面與第X幀第一視頻畫面沒有發(fā)生變化時,S卩,可以認為老師在講臺上沒有走動也可以認為沒有學生走到講臺上出現(xiàn)在第一視頻畫面中,只要是第一視頻畫面沒有發(fā)生變化,編碼單元將丟掉其中一幀(x-1幀或X幀)第一視頻畫面,這樣后續(xù)形成的第二視頻將節(jié)約了好多存儲空間,大大節(jié)省了存儲成本。
[0051]如果想得到高清的視頻畫面,就需要在拍攝現(xiàn)場設(shè)置一臺分辨率更高的攝像模塊。
[0052]步驟S404,存儲模塊存儲第二視頻。
[0053]該方法也可以應用在電視會議錄制、演播室的節(jié)目錄制以及廣播電視等領(lǐng)域。
[0054]本發(fā)明的實施例中先將攝像模塊拍攝的視頻畫面進行緩存,處理模塊從緩存模塊中接收緩存之后的視頻畫面進行截取處理,最后形成的視頻連續(xù)流暢,給人的感覺是攝像模塊跟著目標物體的移動而移動的,而不是目標物體從視頻畫面的邊界一下子就跨越到了視頻畫面的中間位置,解決了現(xiàn)有技術(shù)中畫面不流暢,畫面反應遲鈍、跳躍等問題;同時,當相鄰兩幀的第一視頻畫面沒有發(fā)生變化時,處理模塊將其中一幀第一視頻畫面丟掉,這樣后續(xù)形成的第二視頻將節(jié)約了好多存儲空間,大大節(jié)省了存儲成本。
[0055]本發(fā)明的上述實施例由于設(shè)置了緩存模塊以及處理模塊,將攝像模塊拍攝的視頻畫面先進行緩存,處理模塊從緩存模塊中接收緩存之后的視頻畫面進行截取處理,最后形成的視頻連續(xù)流暢,給人的感覺是攝像模塊跟著目標物體的移動而移動的,而不是目標物體從視頻畫面的邊界一下子就跨越到了視頻畫面的中間位置,解決了現(xiàn)有技術(shù)中畫面不流暢,畫面反應遲鈍、跳躍等問題;同時,當相鄰兩幀的第一視頻畫面沒有發(fā)生變化時,處理模塊將其中一幀第一視頻畫面丟掉,這樣后續(xù)形成的第二視頻將節(jié)約了好多存儲空間,大大節(jié)省了存儲成本。
[0056]顯然,本領(lǐng)域的技術(shù)人員應該明白,上述的本發(fā)明的各模塊或各步驟可以用通用的計算裝置來實現(xiàn),它們可以集中在單個的計算裝置上,或者分布在多個計算裝置所組成的網(wǎng)絡(luò)上,可選地,它們可以用計算裝置可執(zhí)行的程序代碼來實現(xiàn),從而,可以將它們存儲在存儲裝置中由計算裝置來執(zhí)行,或者將它們分別制作成各個集成電路模塊,或者將它們中的多個模塊或步驟制作成單個集成電路模塊來實現(xiàn)。這樣,本發(fā)明不限制于任何特定的硬件和軟件結(jié)合。
[0057]以上所述僅為本發(fā)明的優(yōu)選實施例而已,并不用于限制本發(fā)明,對于本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內(nèi)。
【主權(quán)項】
1.一種基于圖像識別的攝像機圖像定位系統(tǒng),其特征在于,包括:攝像模塊、網(wǎng)絡(luò)交換模塊、緩存模塊、處理模塊和存儲模塊,其中, 所述攝像模塊,固定在拍攝現(xiàn)場,用于拍攝現(xiàn)場的第一視頻,并將所述第一視頻通過所述網(wǎng)絡(luò)交換模塊傳輸給所述緩存模塊; 所述緩存模塊,分別與所述網(wǎng)絡(luò)交換模塊以及所述處理模塊相連,用于暫存所述第一視頻,其中所述第一視頻由X幀第一視頻畫面組成,每幀所述第一視頻畫面的大小為M*N ; 所述處理模塊,分別與所述緩存模塊以及所述存儲模塊相連,包括接收單元和截取單元,其中, 所述接收單元,用于從所述緩存模塊中接收所述第一視頻畫面; 所述截取單元,用于實時地從每幀所述第一視頻畫面中截取包括目標物體在內(nèi)的大小為m*n的第二視頻畫面,并將截取的每幀所述第二視頻畫面形成連續(xù)的第二視頻,其中,M>m、N>n,且在形成的所述第二視頻中目標物體的運動方向與所述第一視頻中目標物體的運動方向是一致的; 所述存儲模塊,與所述處理模塊相連,用于存儲所述第二視頻。2.根據(jù)權(quán)利要求1所述的基于圖像識別的攝像機圖像定位系統(tǒng),其特征在于,所述處理模塊還包括判斷單元,用于基于對所述接收單元接收到的相鄰兩幀的所述第一視頻畫面進行對比,來判斷所述第一視頻中目標物體的運動方向。3.根據(jù)權(quán)利要求1所述的基于圖像識別的攝像機圖像定位系統(tǒng),其特征在于,所述處理模塊還包括編碼單元,用于當相鄰兩幀的所述第一視頻畫面沒有發(fā)生變化時,丟掉其中一幀所述第一視頻畫面。4.一種基于圖像識別的攝像機圖像定位方法,其特征在于,包括: 拍攝模塊拍攝現(xiàn)場的第一視頻,并將所述第一視頻通過網(wǎng)絡(luò)交換模塊傳輸給緩存模塊,其中,所述拍攝模塊固定在拍攝現(xiàn)場; 所述緩存模塊暫存所述第一視頻,其中所述第一視頻由X幀第一視頻畫面組成,每幀所述第一視頻畫面的大小為M*N ; 處理模塊從所述緩存模塊中接收所述第一視頻畫面,實時地從每幀所述第一視頻畫面中截取包括目標物體在內(nèi)的大小為m*n的第二視頻畫面,并將截取的每幀所述第二視頻畫面形成連續(xù)的第二視頻,其中,M>m、N>n,且在形成的所述第二視頻中目標物體的運動方向與所述第一視頻中目標物體的運動方向是一致的; 存儲模塊存儲所述第二視頻。5.根據(jù)權(quán)利要求4所述的基于圖像識別的攝像機圖像定位方法,其特征在于,在實時地從每幀所述第一視頻畫面中截取包括目標物體在內(nèi)的大小為m*n的第二視頻畫面之前,該方法還包括:基于對接收到的相鄰兩幀的所述第一視頻畫面進行對比,來判斷所述第一視頻中目標物體的運動方向。6.根據(jù)權(quán)利要求4所述的基于圖像識別的攝像機圖像定位方法,其特征在于,在實時地從每幀所述第一視頻畫面中截取包括目標物體在內(nèi)的大小為m*n的第二視頻畫面之前,該方法還包括:當相鄰兩幀的所述第一視頻畫面沒有發(fā)生變化時,丟掉其中一幀所述第一視頻畫面。
【文檔編號】H04N7/18GK106034216SQ201510103269
【公開日】2016年10月19日
【申請日】2015年3月10日
【發(fā)明人】張斌, 李曉寧, 許紅昆
【申請人】北京同步科技有限公司