專利名稱:基于多圖像文本的圖像檢索及顯示方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種圖像檢索及顯示方法,尤其涉及一種基于多圖像文本的圖像檢索及顯示方法。
背景技術(shù):
圖像能夠表達豐富的蘊意,又容易被人識別和接受,因此,圖像在現(xiàn)代生活中的應(yīng)用非常廣泛。例如一些公司、網(wǎng)站的標識等多采用圖像形式來表現(xiàn)。由于圖像不同于文本,需要靠人們各自的理解來說明其蘊意,因此圖像檢索比起文本的查詢和匹配要困難得多。特別是在各種圖像較多的文本文件中,在文本的海量圖像中查找出用戶感興趣的圖像,是非常困難的。即使文件支持自動搜索功能,查找到匹配的圖像并將其顯示到用戶輸出端,也是需要耗費大量的資源的。特別是當檢索對象是網(wǎng)頁文本時,被搜索文本需要面對的可能是海量用戶,服務(wù)器要針對不同的用戶檢索需求而傳送不同的查詢結(jié)果,而圖像數(shù)據(jù)一般又都比較大,這必然導(dǎo)致網(wǎng)絡(luò)的阻塞。
而目前,為在有限的空間內(nèi)增加信息容量及吸引網(wǎng)友眼球,各式網(wǎng)站的網(wǎng)頁中存在很多圖像信息。互聯(lián)網(wǎng)上存在各式各樣的圖像,有時用戶需要收集一些自己最感興趣的、具有代表性的圖像以供自己使用。但隨著網(wǎng)上圖像信息的急劇膨脹,檢索相應(yīng)的圖像并顯示到各用戶端,對于處理能力有限的服務(wù)器來講,耗費了大量的處理資源。用戶較多時,很可能導(dǎo)致數(shù)據(jù)阻塞。
用戶通過瀏覽器訪問web頁面時,要求在其中存在的大量圖像中查找自己感興趣的,并在web頁面里僅凸顯自己感興趣的一個或者多個圖像,同時隱藏其他與檢索圖像無關(guān)的顯示數(shù)據(jù)。目前廣泛使用的方法是首先進行圖像檢索,根據(jù)用戶檢索結(jié)果顯示的需要,重新生成一張僅包括用戶檢索結(jié)果的web頁面,傳輸?shù)接脩魹g覽器端。目前采用方法的缺點是非常明顯的需要重新生成新的web頁面及圖像,并進行相應(yīng)傳輸,這必然導(dǎo)致處理器負擔(dān)的增加,總體上延遲了在瀏覽器端的顯示,造成用戶體驗低下。檢索用戶較多時,將導(dǎo)致網(wǎng)絡(luò)的阻塞。
發(fā)明內(nèi)容
針對上述現(xiàn)有的圖像檢索及顯示方法中所存在的問題和不足,本發(fā)明的目的是提供一種明顯改善圖像檢索后傳輸顯示效果的基于多圖像文本的檢索圖像顯示方法。
本發(fā)明是這樣實現(xiàn)的一種基于多圖像文本的圖像檢索及顯示方法,包括以下步驟(1)根據(jù)所述圖像文本中存儲的圖像信息建立圖像、圖像顯示區(qū)域、所述圖像文本顯示區(qū)域及其匹配信息的對應(yīng)關(guān)系庫;(2)根據(jù)所述圖像文本顯示的圖像信息,利用輸入的查詢條件在所述關(guān)系庫中進行匹配操作,若匹配成功,則返回匹配信息對應(yīng)的圖像顯示區(qū)域、所述圖像文本的顯示區(qū)域信息;(3)根據(jù)所述圖像文本的顯示區(qū)域信息生成至少遮蓋掉該圖像文本顯示區(qū)域的覆蓋層;(4)根據(jù)所述圖像的顯示區(qū)域,將該圖像的邊界信息對應(yīng)于所述覆蓋層的區(qū)域設(shè)置為透明。
其中,所述步驟(1)中建立圖像及其匹配信息關(guān)系庫的具體步驟為A、為所述圖像文本中存儲的所有圖像建立標識信息;B、建立所述標識信息與其對應(yīng)的圖像位置及區(qū)域的信息的對應(yīng)關(guān)系庫。
所述圖像文本為網(wǎng)頁頁面。
利用本發(fā)明在對圖像進行檢索時,當檢索到匹配圖像并輸出該檢索圖像時,不需要重新生成圖像文本對象,也無需再對原圖片進行處理,而是通過將不需要顯示的原圖層遮蓋起來,僅顯示檢索圖像所在區(qū)域。特別是檢索對象是web頁面時,利用本發(fā)明顯示檢索結(jié)果,不但節(jié)約了對圖片本身的處理過程,還節(jié)約了web應(yīng)用中重新傳輸圖片數(shù)據(jù)的過程,加快了圖片局部定位顯示的過程。本發(fā)明可高效顯示一張圖片上的指定區(qū)域,節(jié)約了新圖片生成過程和新圖片數(shù)據(jù)傳輸過程,當原圖較大時,能明顯節(jié)約服務(wù)器的處理資源、減少用戶整體的等待時間,從而能顯著提高web用戶體驗,具有較強的實用意義。
圖1是本發(fā)明的圖像檢索及顯示流程示意圖;
圖2是網(wǎng)站頁面圖片顯示示意圖。
具體實施例方式
以下結(jié)合附圖,對本發(fā)明進行詳細描述。
本發(fā)明是針對在包含有海量圖像的文本對象中進行圖像搜索并顯示而提出的。以下以比較有代表性的web頁面為對象詳細介紹本發(fā)明,本領(lǐng)域技術(shù)人員應(yīng)當理解,本發(fā)明并不限于web頁面文本的應(yīng)用。
本發(fā)明實施時,首先需要對web頁面文本中包括的各單獨圖像建立檢索匹配信息。本發(fā)明可采用關(guān)鍵字檢索方式。首先為web頁面文本中包括的所有圖像建立標識信息,這些標識信息均為文字信息,以方便用戶的輸入。這些關(guān)鍵字的標識信息包括圖像所有可能的名稱、蘊意、屬性、大小、網(wǎng)站地址、網(wǎng)站域名、網(wǎng)站關(guān)鍵詞、網(wǎng)站簡介等所有可以標識圖像特征的文字信息。為圖像建立匹配信息數(shù)據(jù)庫,建立圖像顯示信息與圖像的關(guān)鍵字標識信息的對應(yīng)關(guān)系。在web頁面文本中設(shè)置坐標系統(tǒng),例如網(wǎng)格、坐標等可用于確定圖像位置及顯示區(qū)域的系統(tǒng),利用坐標系統(tǒng)完成對web頁面文本中包括的各單獨圖像的定位,并確定各圖像的顯示區(qū)域、web頁面文本的整個顯示區(qū)域,并將該確定的顯示區(qū)域、web頁面文本的整個顯示區(qū)域與圖像的關(guān)鍵字標識信息進行綁定。
如圖1所示,本發(fā)明的具體流程如下步驟1為流程開始步驟;在步驟2,當web用戶需要在包括有海量的web頁面上檢索自己感興趣的圖像時,輸入相應(yīng)的搜索匹配信息;在步驟3,用戶的瀏覽器把此次檢索請求發(fā)送到web服務(wù)器,web服務(wù)器將檢索請求再轉(zhuǎn)交到存儲圖片信息的數(shù)據(jù)庫,進行匹配信息匹配,若有匹配信息,則進入步驟4;否則返回檢索不成功信息,進入步驟6;在步驟4,輸出匹配信息對應(yīng)的檢索圖像的位置信息、web頁面的顯示區(qū)域信息和檢索圖像顯示區(qū)域(一塊或者多塊)信息;在步驟5,web用戶端的瀏覽器接收到web服務(wù)器返回的位置及顯示區(qū)域信息后,根據(jù)本發(fā)明的坐標系統(tǒng)動態(tài)創(chuàng)建一個和原web頁面顯示區(qū)域大小一致(或者大于web頁面顯示區(qū)域),且具有非透明背景色的層(以下稱覆蓋層)遮蓋原圖層,從而隱藏掉整個原web頁面。根據(jù)web服務(wù)器返回的檢索圖像顯示區(qū)域,設(shè)置那些檢索圖像顯示區(qū)域的背景色為透明色,從而顯示出下方的原圖片相對應(yīng)的區(qū)域——這些區(qū)域正是web用戶檢索的結(jié)果相關(guān)的區(qū)域。當web用戶繼續(xù)下一次檢索時,將先清除掉覆蓋層,然后重復(fù)上述的檢索和顯示過程。
步驟6,流程結(jié)束。
本發(fā)明圖像區(qū)域信息生成步驟為1、根據(jù)所述圖像的邊界坐標信息,確定所述圖像的最大橫坐標值、最小橫坐標值、最大縱坐標值和最小縱坐標值;2、根據(jù)上述坐標值確定矩形區(qū)域,并根據(jù)該矩形區(qū)域確定一個大于或等于該區(qū)域的圖像顯示區(qū)域;3、將上述步驟2確定的圖像顯示區(qū)域信息與所述標識信息綁定。
本發(fā)明圖像區(qū)域信息生成步驟還可以為1、在所述圖像中確定一個坐標點,并計算出該坐標點距所述圖像的邊界的最大距離,以該坐標點為圓心、最大距離為半徑確定圓形區(qū)域;2、根據(jù)圓形區(qū)域確定一個大于或等于該區(qū)域的圖像顯示區(qū)域;3、將上述步驟2確定的圖像顯示區(qū)域信息與所述標識信息綁定。
下面以萬網(wǎng)網(wǎng)格頁面(http://g.www.com.cn)為例,闡明本發(fā)明的具體應(yīng)用過程。
萬網(wǎng)網(wǎng)格是一個集中展示萬網(wǎng)聯(lián)盟會員網(wǎng)站logo、圖標的頁面,將眾多會員網(wǎng)站的logo(一種圖片標識)統(tǒng)一展示在一張完整頁面上。具體可參見上述網(wǎng)址顯示內(nèi)容,如圖2所示,具體可參見頁面http://g.www.com.cn。因為整張web頁面面積龐大,里面的網(wǎng)站log(web頁面包括的圖像)非常多,用戶用肉眼找到自己感興趣的相關(guān)網(wǎng)站的logo,顯得非常困難。這時,可通過輸入檢索自己比較感興趣的匹配信息,如用戶僅僅對是域名標識的圖像感興趣,即可輸入“域名”來搜索圖像,啟用本發(fā)明的方法后,顯示檢索結(jié)果的頁面的過程耗時不到0.05s,避免了服務(wù)器的資源損耗、幾乎不需要用戶等待。
為使本領(lǐng)域技術(shù)人員更好地理解本發(fā)明。仍以上面的網(wǎng)格為例具體說明如何實施在指定的一張包括了海量圖像信息的Web頁面上快速顯示搜索結(jié)果的。
首先需要建立圖片區(qū)域和標識信息(關(guān)鍵字)的映射關(guān)系數(shù)據(jù),具體步驟如前述。
上述指定的web頁面從邏輯上可分解為很多獨立的圖像區(qū)域——這里的獨立指把該區(qū)域分離出來,視覺上看是一個小圖片或者圖標,能獨立表達出某種信息,并不依賴于其他區(qū)域,這就是本發(fā)明所稱的圖像,每個圖像在web頁面上占據(jù)一個確定的區(qū)域,同時每個圖像在相應(yīng)的數(shù)據(jù)庫中都有對應(yīng)的關(guān)鍵字標識信息。這些關(guān)鍵字標識信息和圖像的對應(yīng)關(guān)系,儲存在Web服務(wù)器端的數(shù)據(jù)庫中的一張映射表里。
在數(shù)據(jù)庫中儲存的圖像到相關(guān)信息的映射關(guān)系大致可表示為“坐標x,坐標y,寬,高,網(wǎng)址,介紹,其他信息”,其中坐標x,坐標y,寬,高這四個數(shù)據(jù)定義了每個圖像在整張web頁面圖上的所在區(qū)域。
當用戶輸入搜索詞時,Web頁面利用Javascript的AJAX技術(shù)實現(xiàn)異步后臺提交(這里異步提交意義為,客戶端的web頁面不刷新或者頁面網(wǎng)址不變,搜索詞由javascript的xhttp組件提交到服務(wù)器端)。
Web服務(wù)器端的數(shù)據(jù)庫會根據(jù)輸入的關(guān)鍵字標識信息,找出該關(guān)鍵字標識信息對應(yīng)的圖像位置信息、Web頁面顯示區(qū)域信息和圖像顯示區(qū)域信息。
服務(wù)器將找到的上述位置及顯示區(qū)域信息加上javascript指令,用字符串形式傳回到客戶端,由客戶端的javascript的fnWhenDone函數(shù)負責(zé)接收,而此函數(shù)調(diào)用javascript自身的eval函數(shù),讓客戶端的瀏覽器執(zhí)行服務(wù)端返回的javascript指令。
這些javascript指令完成的操作分為兩步。首先調(diào)用javascript自身的createElement方法,動態(tài)創(chuàng)建一個與web頁面圖片顯示區(qū)域一樣大小的div浮動覆蓋層,并設(shè)置其在web頁面上的坐標,使其位置浮在到web頁面圖片正上方達到遮蓋掉原顯示區(qū)域的效果。遮蓋區(qū)域等于或大于原web頁面圖片顯示區(qū)域。
然后設(shè)置該div浮動層的css屬性FILTER為mask(color=#efefff),設(shè)置這個屬性后,該div浮動層會有一個特性,div里面的子元素(childElement)所在的區(qū)域(檢索圖像顯示區(qū)域)都會透明,失去遮蓋效果。本發(fā)明將利用這個特性,繼續(xù)動態(tài)創(chuàng)建createElement該div浮動層的子元素,并把這些子元素根據(jù)前面服務(wù)端返回的坐標數(shù)據(jù),設(shè)置其css屬性的位置屬性,包括left、top、width、height等信息,定位到不需要遮蓋的位置上方。檢索圖像的顯示區(qū)域數(shù)目與檢索圖像數(shù)目一一對應(yīng)。最后完成顯示。本發(fā)明原頁面本身并沒有發(fā)生變化,也沒有任何新頁面圖片的傳輸,節(jié)約了圖片數(shù)據(jù)重新傳輸過程,防止網(wǎng)絡(luò)擁塞,并且高效地完成了圖片搜索顯示過程,對于提高網(wǎng)站的用戶體驗非常有意義。
當然,本發(fā)明還可有其他多種實施例,在不背離本發(fā)明精神及其實質(zhì)的情況下,本領(lǐng)域技術(shù)人員當可根據(jù)本發(fā)明作出各種相應(yīng)的改變和變形,但這些相應(yīng)的改變和變形都應(yīng)屬于本發(fā)明所附的權(quán)利要求的保護范圍。
權(quán)利要求
1.一種基于多圖像文本的圖像檢索及顯示方法,其特征在于,該方法包括以下步驟(1)根據(jù)所述圖像文本中存儲的圖像信息建立圖像、圖像顯示區(qū)域、所述圖像文本顯示區(qū)域及其匹配信息的對應(yīng)關(guān)系庫;(2)根據(jù)所述圖像文本顯示的圖像信息,利用輸入的查詢條件在所述關(guān)系庫中進行匹配操作,若匹配成功,則返回匹配信息對應(yīng)的圖像顯示區(qū)域、所述圖像文本的顯示區(qū)域信息;(3)根據(jù)所述圖像文本的顯示區(qū)域信息生成至少遮蓋掉該圖像文本顯示區(qū)域的覆蓋層;(4)根據(jù)所述圖像的顯示區(qū)域,將該圖像的邊界信息對應(yīng)于所述覆蓋層的區(qū)域設(shè)置為透明。
2.根據(jù)權(quán)利要求1所述的基于多圖像文本的檢索圖像顯示方法,其特征在于,所述步驟(1)中建立圖像及其匹配信息關(guān)系庫的具體步驟為A、為所述圖像文本中存儲的所有圖像建立標識信息;B、建立所述標識信息與其對應(yīng)的圖像位置及區(qū)域的信息的對應(yīng)關(guān)系庫。
3.根據(jù)權(quán)利要求2所述的基于多圖像文本的檢索圖像顯示方法,其特征在于,所述步驟B中的圖像區(qū)域信息生成步驟為a、根據(jù)所述圖像的邊界坐標信息,確定所述圖像的最大橫坐標值、最小橫坐標值、最大縱坐標值和最小縱坐標值;b、根據(jù)上述坐標值確定矩形區(qū)域,并根據(jù)該矩形區(qū)域確定一個大于或等于該區(qū)域的圖像顯示區(qū)域;c、將步驟b確定的圖像顯示區(qū)域信息與所述標識信息綁定。
4.根據(jù)權(quán)利要求2所述的基于多圖像文本的檢索圖像顯示方法,其特征在于,所述步驟B中的圖像區(qū)域信息生成步驟為a、在所述圖像中確定一個坐標點,并計算出該坐標點距所述圖像的邊界的最大距離,以該坐標點為圓心、最大距離為半徑確定圓形區(qū)域;b、根據(jù)所述圓形區(qū)域確定一個大于或等于該區(qū)域的圖像顯示區(qū)域;c、將步驟b確定的圖像顯示區(qū)域信息與所述標識信息綁定。
5.根據(jù)權(quán)利要求1所述的基于多圖像文本的檢索圖像顯示方法,其特征在于,所述圖像標識信息包括圖像名稱、圖像屬性、標識名稱或標識地址。
6.根據(jù)權(quán)利要求1所述的基于多圖像文本的檢索圖像顯示方法,其特征在于,所述圖像文本為網(wǎng)頁頁面。
全文摘要
本發(fā)明公開了一種基于多圖像文本的圖像檢索及顯示方法,為解決現(xiàn)有圖像檢索顯示效率低而提出,本發(fā)明包括步驟根據(jù)圖像文本中存儲的圖像信息建立圖像及其匹配信息的對應(yīng)關(guān)系庫;根據(jù)圖像文本顯示的圖像信息,輸入查詢條件,并利用該查詢條件在關(guān)系庫中進行匹配操作,若匹配成功,則返回匹配信息對應(yīng)的圖像的邊界信息、圖像文本的顯示區(qū)域信息;根據(jù)檢索圖像的邊界信息確定僅包括檢索圖像的顯示區(qū)域,生成可覆蓋除檢索圖像顯示區(qū)域外的圖像文本的顯示區(qū)域的覆蓋層;將覆蓋層輸出至顯示端,僅顯示檢索圖像。本發(fā)明可高效顯示一張圖片上的指定區(qū)域,節(jié)約了新圖片生成過程和新圖片數(shù)據(jù)傳輸過程,節(jié)約了處理資源。
文檔編號G06F17/30GK1851713SQ20061008304
公開日2006年10月25日 申請日期2006年5月29日 優(yōu)先權(quán)日2006年5月29日
發(fā)明者阮戈, 范春瑩 申請人:北京萬網(wǎng)志成科技有限公司