圖片檢索方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及圖像處理領(lǐng)域,特別涉及一種圖片檢索方法和裝置。
【背景技術(shù)】
[0002] 為了滿足用戶的視覺(jué)需求,目前的很多信息都是圖片格式的。計(jì)算機(jī)可以識(shí)別出 圖片的視覺(jué)信息,如圖片的顏色、形狀、灰度分布等,當(dāng)用戶發(fā)起了圖片檢索指令時(shí),計(jì)算機(jī) 可以根據(jù)圖片的視覺(jué)信息進(jìn)行圖片檢索,如根據(jù)圖片的視覺(jué)信息,學(xué)習(xí)圖片的低層特征,再 將學(xué)習(xí)到的多個(gè)低層特征組合成高層特征,通過(guò)對(duì)每個(gè)已有圖片的高層特征進(jìn)行匹配,檢 索出與用戶指定的圖片相似的圖片。
[0003] 在實(shí)現(xiàn)本發(fā)明的過(guò)程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)存在以下問(wèn)題:根據(jù)圖片的視覺(jué)信 息進(jìn)行圖片檢索時(shí),僅能從視覺(jué)上對(duì)圖片進(jìn)行區(qū)分,檢索精確度低,無(wú)法滿足用戶的檢索需 求。
【發(fā)明內(nèi)容】
[0004] 為了解決現(xiàn)有技術(shù)的問(wèn)題,本發(fā)明實(shí)施例提供了一種圖片檢索方法和裝置。所述 技術(shù)方案如下:
[0005] 第一方面,提供了一種圖片檢索方法,所述方法包括:
[0006] 獲取每個(gè)種子圖片的特征向量,所述特征向量由神經(jīng)網(wǎng)絡(luò)中提取的種子圖片的多 層特征組成;
[0007] 根據(jù)每個(gè)種子圖片的特征向量,生成每個(gè)種子圖片的至少一個(gè)視覺(jué)單詞,所述至 少一個(gè)視覺(jué)單詞用于表示每個(gè)種子圖片的語(yǔ)義;
[0008] 根據(jù)每個(gè)種子圖片的特征向量和至少一個(gè)視覺(jué)單詞,獲取每個(gè)視覺(jué)單詞的至少一 個(gè)種子圖片和至少一個(gè)特征向量;
[0009] 基于每個(gè)視覺(jué)單詞的至少一個(gè)種子圖片和至少一個(gè)特征向量進(jìn)行圖片檢索。
[0010] 第二方面,提供了一種圖片檢索裝置,所述裝置包括:
[0011] 特征向量獲取模塊,用于獲取每個(gè)種子圖片的特征向量,所述特征向量由神經(jīng)網(wǎng) 絡(luò)中提取的種子圖片的多層特征組成;
[0012] 視覺(jué)單詞生成模塊,用于根據(jù)每個(gè)種子圖片的特征向量,生成每個(gè)種子圖片的至 少一個(gè)視覺(jué)單詞,所述至少一個(gè)視覺(jué)單詞用于表示每個(gè)種子圖片的語(yǔ)義;
[0013] 視覺(jué)單詞索引模塊,用于根據(jù)每個(gè)種子圖片的特征向量和至少一個(gè)視覺(jué)單詞,獲 取每個(gè)視覺(jué)單詞的至少一個(gè)種子圖片和至少一個(gè)特征向量;
[0014] 圖片檢索模塊,用于基于每個(gè)視覺(jué)單詞的至少一個(gè)種子圖片和至少一個(gè)特征向量 進(jìn)行圖片檢索。
[0015] 本發(fā)明實(shí)施例提供的技術(shù)方案帶來(lái)的有益效果是:
[0016] 本發(fā)明實(shí)施例提供的方法和裝置,通過(guò)將種子圖片看作視覺(jué)單詞的集合,獲取種 子圖片的特征向量,該特征向量由神經(jīng)網(wǎng)絡(luò)中提取的種子圖片的多層特征組成,根據(jù)特征 向量生成至少一個(gè)視覺(jué)單詞,該至少一個(gè)視覺(jué)單詞用于表示種子圖片的語(yǔ)義,基于視覺(jué)單 詞進(jìn)行圖片檢索時(shí),提高了檢索精確度,能夠滿足用戶的檢索需求。
【附圖說(shuō)明】
[0017] 為了更清楚地說(shuō)明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使 用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于 本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他 的附圖。
[0018] 圖1是本發(fā)明實(shí)施例提供的一種圖片檢索方法的流程圖;
[0019] 圖2是本發(fā)明實(shí)施例提供的一種圖片檢索方法的流程圖;
[0020] 圖3是本發(fā)明實(shí)施例提供的一種圖片檢索裝置結(jié)構(gòu)示意圖;
[0021] 圖4是本發(fā)明實(shí)施例提供的一種服務(wù)器的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0022] 下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā) 明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施 例,都屬于本發(fā)明保護(hù)的范圍。
[0023] 圖1是本發(fā)明實(shí)施例提供的一種圖片檢索方法的流程圖,參見圖1,該方法包括:
[0024] 101、獲取每個(gè)種子圖片的特征向量,該特征向量由神經(jīng)網(wǎng)絡(luò)中提取的種子圖片的 多層特征組成。
[0025] 102、根據(jù)每個(gè)種子圖片的特征向量,生成每個(gè)種子圖片的至少一個(gè)視覺(jué)單詞,該 至少一個(gè)視覺(jué)單詞用于表示每個(gè)種子圖片的語(yǔ)義。
[0026] 103、根據(jù)每個(gè)種子圖片的特征向量和至少一個(gè)視覺(jué)單詞,獲取每個(gè)視覺(jué)單詞的至 少一個(gè)種子圖片和至少一個(gè)特征向量。
[0027] 104、基于每個(gè)視覺(jué)單詞的至少一個(gè)種子圖片和至少一個(gè)特征向量進(jìn)行圖片檢索。
[0028] 本發(fā)明實(shí)施例提供的方法,通過(guò)將種子圖片看作視覺(jué)單詞的集合,獲取種子圖片 的特征向量,該特征向量由神經(jīng)網(wǎng)絡(luò)中提取的種子圖片的多層特征組成,根據(jù)特征向量生 成至少一個(gè)視覺(jué)單詞,該至少一個(gè)視覺(jué)單詞用于表示種子圖片的語(yǔ)義,基于視覺(jué)單詞進(jìn)行 圖片檢索時(shí),提高了檢索精確度,能夠滿足用戶的檢索需求。
[0029] 可選地,該基于每個(gè)視覺(jué)單詞的至少一個(gè)種子圖片和至少一個(gè)特征向量進(jìn)行圖片 檢索包括:
[0030] 對(duì)于待檢索的指定圖片,獲取該指定圖片的特征向量,作為第一特征向量,根據(jù)該 第一特征向量,生成至少一個(gè)指定視覺(jué)單詞;
[0031] 基于每個(gè)視覺(jué)單詞的至少一個(gè)特征向量,確定該至少一個(gè)指定視覺(jué)單詞的至少一 個(gè)特征向量,作為第二特征向量;
[0032] 計(jì)算該指定特征向量與該至少一個(gè)第二特征向量之間的相似度;
[0033] 按照相似度從大到小的順序,從該至少一個(gè)第二特征向量中,提取至少一個(gè)特征 向量,作為第三特征向量;
[0034] 獲取該至少一個(gè)第三特征向量對(duì)應(yīng)的至少一個(gè)種子圖片,作為該指定圖片的相似 圖片。
[0035] 可選地,該方法還包括:
[0036] 當(dāng)獲取到指定圖片的至少一個(gè)相似圖片時(shí),根據(jù)該指定圖片與該至少一個(gè)相似圖 片之間的相似度以及該至少一個(gè)相似圖片的語(yǔ)義,獲取該指定圖片的語(yǔ)義。
[0037] 可選地,該根據(jù)該指定圖片與該至少一個(gè)相似圖片之間的相似度以及該至少一個(gè) 相似圖片的語(yǔ)義,獲取該指定圖片的語(yǔ)義包括:
[0038] 對(duì)于每個(gè)相似圖片,獲取該相似圖片的至少一個(gè)語(yǔ)義單詞和該至少一個(gè)語(yǔ)義單詞 的第一權(quán)重;
[0039] 獲取該指定圖片與該相似圖片之間的相似度;
[0040] 對(duì)于該相似圖片的每個(gè)語(yǔ)義單詞,計(jì)算該相似度與該語(yǔ)義單詞的第一權(quán)重的乘 積,作為該語(yǔ)義單詞的第二權(quán)重;
[0041] 按照第二權(quán)重從大到小的順序,從該至少一個(gè)相似圖片的至少一個(gè)語(yǔ)義單詞中, 提取至少一個(gè)語(yǔ)義單詞,作為該指定圖片的語(yǔ)義單詞。
[0042] 可選地,該獲取該相似圖片的至少一個(gè)語(yǔ)義單詞和該至少一個(gè)語(yǔ)義單詞的第一權(quán) 重包括:
[0043] 獲取該相似圖片的至少一個(gè)文字描述塊,為該至少一個(gè)文字描述塊分配權(quán)重;
[0044] 根據(jù)文字描述塊中的每個(gè)單詞的出現(xiàn)次數(shù)和該至少一個(gè)文字描述塊的數(shù)目,計(jì)算 每個(gè)單詞的逆向頻率,該逆向頻率用于表示單詞對(duì)該相似圖片的重要程度;
[0045] 對(duì)于每個(gè)文字描述塊,計(jì)算該文字描述塊中每個(gè)單詞的逆向頻率與該文字描述塊 的權(quán)重的乘積,作為每個(gè)單詞的第一權(quán)重;
[0046] 按照第一權(quán)重從大到小的順序,從該至少一個(gè)文字描述塊中的每個(gè)單詞中,提取 至少一個(gè)單詞,作為該相似圖片的至少一個(gè)語(yǔ)義單詞;
[0047] 確定該至少一個(gè)語(yǔ)義單詞的第一權(quán)重。
[0048] 上述所有可選技術(shù)方案,可以采用任意結(jié)合形成本發(fā)明的可選實(shí)施例,在此不再 --贅述。
[0049] 圖2是本發(fā)明實(shí)施例提供的一種圖片檢索方法的流程圖。該發(fā)明實(shí)施例的執(zhí)行主 體為服務(wù)器,參見圖2,該方法包括:
[0050] 201、該服務(wù)器獲取每個(gè)種子圖片的特征向量。
[0051] 其中,該特征向量由神經(jīng)網(wǎng)絡(luò)中提取的種子圖片的多層特征組成。在神經(jīng)網(wǎng)絡(luò)中, 將種子圖片輸入該神經(jīng)網(wǎng)絡(luò)的最低層,在每一層提取一個(gè)特征,并依次傳輸至下一層,即上 一層提取的特征為下一層的輸入。整個(gè)神經(jīng)網(wǎng)