[0041] 步驟109 :取出與%落入同意散列桶中的敏感視頻幀特征向量,并計(jì)算其中的各 敏感視頻幀特征向量和的歐式距離,判斷相互之間的相似的度,并確定匹配的敏感視頻 特征向量。
[0042] 取出哈希表gl的第一個(gè)散列桶中的i; 1和@5并分別計(jì)算與的歐式距離,判斷相 互之間的相似度,并確定Vl為與匹配的(相似的)敏感視頻幀可證向量,直到得到足夠 多的相似的敏感視頻幀特征向量,或與全部敏感視頻幀特征向量比較完畢。
[0043] 其中步驟102中為了保證LSH算法的性能,這里需要考慮倆個(gè)重要參數(shù)--哈希 表g的個(gè)數(shù)L和哈希表中LSH函數(shù)h (.)的個(gè)數(shù)k。L和k的取值會(huì)直接影響到該算法的性 能。考慮一下性能指標(biāo):索引建立時(shí)間:0(nLkt),其中t為計(jì)算每個(gè)h(.)所需的時(shí)間,空 間:0(nL) +保存數(shù)據(jù)點(diǎn)所需的空間,查詢(xún)時(shí)間:0(L(kt+dnP/)),應(yīng)保證L和k具有如下的關(guān) 系:
[0045] 其中Pl為如前所述LSH函數(shù)中所給定的概率。
[0046] 本實(shí)施例中也可以采用如多維索引就技術(shù)如:gridfile、k-d-B樹(shù)、四叉樹(shù)、hB樹(shù)、 R樹(shù)及其變種R+樹(shù)和R*樹(shù)等,這些都是基于空間或基于數(shù)據(jù)分布的劃分方法,通過(guò)上述發(fā) 放生成視頻指紋庫(kù)中各敏感視頻幀特征向量的索引,具有不同索引號(hào)(如1-10000)的敏感 視頻幀特征向量,分布在內(nèi)容尋址網(wǎng)絡(luò)中的10個(gè)服務(wù)器中保存,每個(gè)服務(wù)器在內(nèi)容尋址網(wǎng) 絡(luò)中都具有對(duì)應(yīng)的笛卡爾坐標(biāo)。在基于內(nèi)容的視頻檢索時(shí),其中3#服務(wù)器的獲取模塊獲 取待檢測(cè)視頻幀的特征向量后,3#服務(wù)器的查找模塊根據(jù)待比較敏感視頻幀向量的索引號(hào) 1000,以及預(yù)定義的轉(zhuǎn)換規(guī)則,從10個(gè)服務(wù)器的笛卡爾坐標(biāo)中查找到對(duì)應(yīng)保存的待比較敏 感視頻幀特征向量的服務(wù)器的笛卡爾坐標(biāo)為(〇,〇) ;3#服務(wù)器的發(fā)送模塊根據(jù)查找到笛卡 爾坐標(biāo)(〇,〇),將待檢測(cè)視頻幀的特征向量發(fā)送給2#服務(wù)器(笛卡爾坐標(biāo)為(0,0))的檢索 模塊;
[0047] 2#服務(wù)器的檢索模塊判斷待檢測(cè)視頻幀的特征向量和待比較敏感視頻幀的特征 向量的相似度。
[0048] 本發(fā)明提供的第二實(shí)施例是一種基于美容的視頻檢索系統(tǒng),其結(jié)構(gòu)如圖3所示, 包括:
[0049] 視頻指紋庫(kù)201 :用于保存具有索引號(hào)的敏感視頻幀的特征向量,所述視頻指紋 庫(kù),均勻分布在內(nèi)容尋址網(wǎng)絡(luò)笛卡爾坐標(biāo)空間結(jié)點(diǎn)上的多個(gè)服務(wù)器中;
[0050] 獲取模塊202 :用于獲取待檢測(cè)視頻幀的特征向量;
[0051] 查找模塊203:用于根據(jù)視頻指紋庫(kù)中待比較敏感視頻幀的特征向量的索引號(hào), 以及預(yù)定義的轉(zhuǎn)換規(guī)則,從各個(gè)服務(wù)器的笛卡爾坐標(biāo)中查找到對(duì)應(yīng)保存有待比較敏感視 頻幀的特征向量的服務(wù)器的笛卡爾坐標(biāo);
[0052] 發(fā)送模塊204 :用于根據(jù)查找到的笛卡爾坐標(biāo),將待檢測(cè)視頻幀的特征向量發(fā)送 給對(duì)應(yīng)服務(wù)器的檢索模塊;
[0053] 檢索模塊205 :用于判斷待檢索視頻幀的特征向量和待比較敏感視頻幀的特征向 量的相似度,并確定匹配的敏感視頻幀的特征向量。
[0054] 進(jìn)一步,各服務(wù)器的視頻指紋庫(kù)201包括哈希表2011 :用于保存敏感視頻
[0055] 幀的特征向量,所述哈希表的編號(hào)作為敏感視頻幀特征向量的索引號(hào);
[0056] 所述系統(tǒng)還包括:
[0057] 二次散列模塊206 :用于使用LSH算法對(duì)保存在各服務(wù)器哈希表中的各敏感視頻 幀特征向量進(jìn)行散列,在對(duì)所得結(jié)果進(jìn)行二次散列,得到多個(gè)散列桶;
[0058] 哈希表2011包括多個(gè)散列桶20111 :用于哈希表中的敏感視頻幀特征向量進(jìn)行兩 次散列后,保存進(jìn)行兩次散列后的敏感視頻幀特征向量;
[0059] 檢索子模塊2051 :用于將待檢測(cè)視頻幀的特征向量進(jìn)行兩次散列,得到待檢測(cè)視 頻幀的特征向量映射到的對(duì)應(yīng)的散列桶;
[0060] 判斷待檢測(cè)視頻幀的特征向量和對(duì)應(yīng)散列桶中待比較敏感視頻幀特征向量的相 似度。
[0061] 進(jìn)一步,二次散列模塊206 :還用于L個(gè)哈希函數(shù)g(.)將各敏感視頻幀特征向量 映射V映射到保存在各服務(wù)器上的L歌哈希表gj后,通過(guò)k個(gè)LSH函數(shù)hi (.)對(duì)哈希表gj 中的各敏感視頻幀特征向量F進(jìn)行散列,即gj = [hi (j), . . .,hk(j)] (j = 1,2, . . .,L), hi(.) £!1(卜1,2,...,1〇,!1為1^!1函數(shù)族。
[0062] 進(jìn)一步,檢索模塊205 :還用于通過(guò)計(jì)算待檢測(cè)視頻幀的特征向量和待比較敏感 視頻幀特征向量的歐氏距離來(lái)判斷相互之間相似度。
[0063] 顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變形而不脫離本發(fā)明的精 神和范圍。這樣,倘若本發(fā)明的這些修改和變型是與本發(fā)明權(quán)利要求及其等統(tǒng)計(jì)數(shù)范圍之 內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。
【主權(quán)項(xiàng)】
1. 一種基于內(nèi)容的視頻檢索數(shù)學(xué)模型建立方法,其特征在于,在內(nèi)容尋址網(wǎng)絡(luò)笛卡爾 坐標(biāo)空間中的結(jié)點(diǎn)上設(shè)有多個(gè)服務(wù)器,該方法包括: 獲取模塊獲取待檢測(cè)視頻幀的特征向量; 查找模塊根據(jù)視頻指紋庫(kù)中待比較敏感視頻幀特征向量的索引號(hào),以及預(yù)定義的轉(zhuǎn)換 規(guī)則,從內(nèi)容尋址網(wǎng)絡(luò)中各服務(wù)器的笛卡爾坐標(biāo)中查找到對(duì)應(yīng)保存有待比較敏感視頻幀特 征向量的服務(wù)器的笛卡爾坐標(biāo); 發(fā)送模塊根據(jù)查找的笛卡爾坐標(biāo),將待檢測(cè)視頻幀的特征向量發(fā)送給對(duì)應(yīng)服務(wù)器的檢 索模塊; 檢索模塊判斷待檢測(cè)視頻幀的特征向量和待比較敏感視頻幀特征向量的相似度,并確 定匹配的敏感視頻特征向量。2. 如權(quán)利要求1所述的方法,其特征在于,查找到對(duì)應(yīng)笛卡爾坐標(biāo)步驟前還包括: 使用局部敏感哈希表LSH算法對(duì)保存在各服務(wù)器哈希表中的各敏感視頻幀特征向量 進(jìn)行散列,得到多個(gè)散列桶,將各敏感視頻幀特征向量映射到各散列桶中,同時(shí)將各哈希表 的編號(hào)作為敏感視頻幀特征向量的索引號(hào); 發(fā)送待檢測(cè)視頻幀的特征向量給對(duì)應(yīng)服務(wù)器的檢索模塊步驟后海包括: 將待檢測(cè)視頻幀的特征向量進(jìn)行兩次散列,得到待檢測(cè)視頻幀的特征向量映射到的對(duì) 應(yīng)的散列桶; 判斷特征向量相似度的步驟具體為: 判斷待檢測(cè)視頻幀的特征向量和對(duì)應(yīng)散列桶中待比較敏感視頻幀特征向量的相似度。3. 如權(quán)利要求2所述的方法,其特征在于,使用LSH算法對(duì)保存在各服務(wù)器哈希表中的 各敏感視頻幀特征向量進(jìn)行散列具體為: 用L個(gè)哈希函數(shù)g(.)將各敏感視頻幀特征向量?映射到保存在各服務(wù)器上的L個(gè)哈希 表gj中;通過(guò)Κ個(gè)LSH函數(shù)hi(.)對(duì)哈希表gj中的各敏感視頻特征向量!;進(jìn)行散列,即gj =[hi(j),· ·,hk(j) ](j= 1,2, · · ·,L),hi(·)eH(i= 1,2, · ·k),Η為L(zhǎng)SH函數(shù)族。4. 如權(quán)利要求3所述的方法,氣特征在于,使用LSH算法對(duì)保存在各服務(wù)器哈希表中 的各敏感視頻幀特征向量進(jìn)行散列,哈希表的個(gè)數(shù)L和個(gè)哈希表中LSH函數(shù)hi(.)的個(gè)數(shù)K具有如下關(guān)系:Ζ=?或Z= 在LSH算法的LSH函數(shù)組H= {hl,...,hm}中,其中 的2個(gè)敏感視頻幀特征向量vlv2之間的預(yù)定義的距離,P1為預(yù)定義的概率值。5. 如權(quán)利要求3所述的方法,氣特征在于,LSH函數(shù)為 滿(mǎn)足正態(tài)分布(高斯分布),w為任意實(shí)數(shù),b為[0,w]之間的任意實(shí)數(shù)。6. 如權(quán)利要求2所述的方法,其特征在于比較特征向量相似度的步驟具體為: 通過(guò)計(jì)算待檢測(cè)視頻幀的特征向量和對(duì)應(yīng)散列桶中待比較敏感視頻幀特征向量的歐 式距離來(lái)判斷相互之間的相似度。7.-種基于內(nèi)容的視頻檢索系統(tǒng),其特征在于,包括: 視頻指紋庫(kù):用于保存具有索引號(hào)的敏感視頻幀特征向量,所述視頻指紋庫(kù),均勻分布 在內(nèi)容尋址網(wǎng)絡(luò)笛卡爾坐標(biāo)空間結(jié)點(diǎn)上的多個(gè)服務(wù)器中; 獲取模塊:用于獲取待檢測(cè)視頻幀的特征向量; 查找模塊:用于根據(jù)視頻指紋庫(kù)中待比較敏感視頻幀特征向量的索引號(hào),以及預(yù)定義 的轉(zhuǎn)換規(guī)則,從各服務(wù)器的笛卡爾坐標(biāo)中查找到對(duì)應(yīng)保存有待比較敏感視頻幀特征向量的 服務(wù)器的笛卡爾坐標(biāo); 發(fā)送模塊:用于根據(jù)查找到的笛卡爾坐標(biāo),將待檢測(cè)視頻幀的特征向量發(fā)送給對(duì)應(yīng)服 務(wù)器的檢索模塊; 檢索模塊:用于判斷待檢測(cè)視頻幀的特征向量的相似度,并確定匹配的敏感視頻特征 向量。8. 如權(quán)利要求7所述的系統(tǒng),其特征在于。 各服務(wù)器的視頻指紋庫(kù)包括哈希表:用于保存敏感視頻幀特征向量,所述哈希表的編 號(hào)作為敏感視頻幀特征向量的索引號(hào); 所述系統(tǒng)還包括; 二次散列模塊:用于使用LSH算法對(duì)保存在各服務(wù)器哈希表中的各敏感視頻幀特征向 量進(jìn)行散列,再對(duì)所得結(jié)果進(jìn)行二次散列,得到多個(gè)散列桶; 哈希表包括多個(gè)數(shù)列桶:用于哈希表中的各敏感視頻幀特征向量進(jìn)行兩次散列后保存 進(jìn)行兩次散列后的敏感視頻幀特征向量; 所述檢索模塊還包括: 檢索子模塊:用于將待檢測(cè)視頻幀的特征向量進(jìn)行兩次散列,得到待檢測(cè)視頻幀的特 征向量映射到的對(duì)應(yīng)散列桶; 判斷待檢測(cè)視頻幀的特征向量和對(duì)應(yīng)散列桶中待比較敏感視頻幀特征向量的相似度。9. 如權(quán)利要求8所述的系統(tǒng),其特征在于 二次散列模塊:還用于用L個(gè)哈希函數(shù)g(.)將各敏感視頻幀特征向量映射到保存在各 服務(wù)器上的L個(gè)哈希表gj后,通過(guò)K個(gè)LSH函數(shù)hi(.)對(duì)哈希表gj中的各敏感視頻幀特 征向量?進(jìn)行散列,即gj=[hi(j),· · ·,hk(j)](j= 1,2. · ·,L),hi(·)eH(i= 1,2, · · k),H為L(zhǎng)SH函數(shù)族。10. 如權(quán)利要求7所述的系統(tǒng),其特征在于: 檢索模塊:還用于通過(guò)計(jì)算待檢測(cè)視頻幀的特征向量和待比較敏感視頻幀特征向量的 歐式距離來(lái)判斷相互之間相似度。
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種基于內(nèi)容的視頻檢索數(shù)學(xué)模型建立方法,為了解決基于內(nèi)容的視頻檢索的效率較低的問(wèn)題,本發(fā)明公開(kāi)的方法包括:獲取待檢測(cè)視頻幀的特征向量;根據(jù)視頻指紋庫(kù)中待比較敏感視頻幀特征向量的索引號(hào),以及預(yù)定義的轉(zhuǎn)換規(guī)則,查找到對(duì)應(yīng)的笛卡爾坐標(biāo);根據(jù)查找到的笛卡爾坐標(biāo),將待檢測(cè)視頻幀的特征向量發(fā)送給對(duì)應(yīng)服務(wù)器的檢索模塊;檢索模塊判斷待檢測(cè)視頻幀的特征向量和待比較敏感視頻幀特征向量的相似度,由于應(yīng)用內(nèi)容尋址網(wǎng)絡(luò)對(duì)視頻指紋庫(kù)進(jìn)行合理組織,建立索引,獲取待檢測(cè)視頻實(shí)例后,采用某種檢索算法從指紋庫(kù)中查找最匹配的敏感視頻特征向量,使得視頻檢索的效率得到提高。
【IPC分類(lèi)】G06F17/30
【公開(kāi)號(hào)】CN105302833
【申請(qǐng)?zhí)枴緾N201410359465
【發(fā)明人】武建文
【申請(qǐng)人】上海極譽(yù)實(shí)業(yè)有限公司
【公開(kāi)日】2016年2月3日
【申請(qǐng)日】2014年7月24日