專利名稱:信息存儲(chǔ)與檢索的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息檢索裝置與方法。
背景技術(shù):
有多種已建立用于通過根據(jù)關(guān)鍵詞搜索來定位信息(例如,文檔、圖像、電子郵件、專利、互聯(lián)網(wǎng)內(nèi)容、或媒體內(nèi)容諸如音頻/視頻內(nèi)容)的系統(tǒng)。例子包括互聯(lián)網(wǎng)搜索“引擎”,諸如由“Google”TM或“Yahoo”TM提供的搜索引擎,其中通過關(guān)鍵詞進(jìn)行的搜索產(chǎn)生了由該搜索引擎以感覺相關(guān)順序排列的結(jié)果列表。
然而,在包含大量?jī)?nèi)容的系統(tǒng)中(通常稱為大量?jī)?nèi)容集合),很難制定有效的搜索查詢以給出搜索“命中”的簡(jiǎn)短列表。例如,在準(zhǔn)備本申請(qǐng)時(shí),以關(guān)鍵詞“大量文檔集合”進(jìn)行Google搜索,命中243000個(gè)。如果之后重復(fù)搜索,則這個(gè)命中數(shù)還有望增加,因?yàn)橥ㄟ^互聯(lián)網(wǎng)存儲(chǔ)的內(nèi)容量一般隨時(shí)間增加。查看這種命中列表可能相當(dāng)耗時(shí)。
通常,大量?jī)?nèi)容集合沒有被很好利用的一些原因是·用戶不知道存在相關(guān)內(nèi)容;·用戶知道存在相關(guān)內(nèi)容,但不知道它在哪;·用戶知道存在內(nèi)容,但不知道它是相關(guān)的;·用戶知道存在相關(guān)內(nèi)容以及如何找到它,但找到該內(nèi)容要花很長(zhǎng)時(shí)間。
文章“大量文檔集合的自組織”(“Self Organisation of a MassiveDocument Collection”,Kohonen et al,IEEE Transactions on NeuralNetworks,Vol 11,No.3,May 2000,P574-585)公開了一種使用所謂“自組織映射”(SOM)的技術(shù)。其利用了所謂無人監(jiān)管的自學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)算法,其中表示各文檔特性的“特征向量”映射到SOM的節(jié)點(diǎn)上。
在Kohonen等人的文章中,第一步是預(yù)處理文檔文本,并隨后從各預(yù)處理的文檔中導(dǎo)出特征向量。在一種形式中,這可以是顯示單詞的各大型詞典出現(xiàn)頻率的直方圖。直方圖內(nèi)的各數(shù)據(jù)值(即,各個(gè)詞典單詞的各出現(xiàn)頻率)變成n值向量的值,其中n是詞典中候選單詞的總數(shù)(在這篇文章描述的實(shí)例中是43222)??蓪?duì)n向量值進(jìn)行加權(quán),或許強(qiáng)調(diào)特定單詞的增強(qiáng)的相關(guān)性或改進(jìn)的分化。
隨后,n值向量被映射到基本小于n的較小維數(shù)向量上(即,具有數(shù)值為m(在該篇文章中為500)的向量)。這是通過將該向量與由隨機(jī)數(shù)陣列形成的(n×m)“投影矩陣”相乘來實(shí)現(xiàn)的。這種技術(shù)已經(jīng)顯示出可以生成較小維數(shù)的向量,其中任意兩個(gè)減小維數(shù)的向量都具有許多與兩個(gè)各輸入向量相同的向量點(diǎn)積。在文章“通過隨機(jī)映射的維數(shù)縮減用于聚類的快速相似性計(jì)算”(“DimensionalityReduction by Random MappingFast Similarity Computation forClustering”,Kaski,Proc IJCNN,P413-418,1998)中描述了這個(gè)向量映射過程。
通過將各向量與“模型”(另一向量)相乘的過程,減小維數(shù)的向量隨后被映射到SOM上的節(jié)點(diǎn)(也稱為神經(jīng)元)上。這些模型通過學(xué)習(xí)過程產(chǎn)生,該學(xué)習(xí)過程通過相互相似性將它們自動(dòng)排序在SOM上,這通常表示為節(jié)點(diǎn)的二維柵格。這是一個(gè)不平凡的過程,對(duì)于只在700萬文檔以下的文檔數(shù)據(jù)庫(kù),Kohonen等人在內(nèi)存為800MB的6個(gè)處理器的計(jì)算機(jī)上花了6周的時(shí)間。最后,顯示形成SOM的節(jié)點(diǎn)柵格,用戶可放大映射區(qū)域并選擇節(jié)點(diǎn),這使用戶界面可提供到包含鏈接到那個(gè)節(jié)點(diǎn)的文檔的網(wǎng)頁(yè)的鏈接。
發(fā)明內(nèi)容
本發(fā)明的各方面和特征在所附權(quán)利要求書中定義。
根據(jù)本發(fā)明的一方面,提供了一種用于搜索信息項(xiàng)集合并顯示搜索結(jié)果的信息檢索裝置,所述信息項(xiàng)各具有表征信息特征集合。所述裝置包括搜索處理器,所述搜索處理器可操作用于根據(jù)用戶定義的表征信息特征來搜索信息項(xiàng),并標(biāo)識(shí)具有與那個(gè)用戶定義的表征信息特征相對(duì)應(yīng)的表征信息特征的信息項(xiàng)。映射處理器可操作用于生成表示來自在搜索中標(biāo)識(shí)的信息項(xiàng)集合的信息項(xiàng)映射的數(shù)據(jù)。所述映射根據(jù)信息項(xiàng)的相互相似性相對(duì)于陣列中的位置提供標(biāo)識(shí)的信息項(xiàng),相似信息項(xiàng)映射到陣列內(nèi)的相似位置。所述裝置包括用于顯示至少某些標(biāo)識(shí)項(xiàng)的表示的圖形用戶界面,還包括用于選擇標(biāo)識(shí)信息項(xiàng)的用戶控制。搜索處理器可操作用于精煉(refine)搜索,以標(biāo)識(shí)與選擇的信息項(xiàng)有關(guān)的信息項(xiàng)。同樣,給用戶提供了這樣的便利通過相對(duì)于如在相互相似的陣列內(nèi)的位置所顯示的項(xiàng)來標(biāo)識(shí)期望的信息項(xiàng),來精煉搜索。結(jié)合相對(duì)于可向用戶顯示的陣列中位置的信息項(xiàng)的排列,提供了搜索并精煉搜索結(jié)果的便利。此外,便于信息項(xiàng)的導(dǎo)航,當(dāng)信息項(xiàng)的量很大時(shí),這特別有利。
本發(fā)明解決了一個(gè)定義搜索信息項(xiàng)的搜索查詢并精煉信息項(xiàng)搜索的技術(shù)問題,這對(duì)于搜索導(dǎo)航大量數(shù)據(jù)特別有利。
表征信息特征可包括描述信息項(xiàng)內(nèi)容或?qū)傩缘脑獢?shù)據(jù)、視頻圖像或音頻信號(hào)或音頻元數(shù)據(jù)、或這些類型表征信息特征的組合。同樣,為了精煉信息項(xiàng)的搜索,用戶控制可操作用于根據(jù)與標(biāo)識(shí)項(xiàng)相關(guān)聯(lián)的元數(shù)據(jù)、視頻圖像或音頻元數(shù)據(jù)來選擇所標(biāo)識(shí)的信息項(xiàng)。
搜索處理器可操作用于搜索包括相同和/或相似元數(shù)據(jù)、相同和/或相似視頻圖像、或相同和/或相似音頻元數(shù)據(jù)的信息項(xiàng)的信息項(xiàng)集合。例如,搜索處理器可比較從與選擇的信息項(xiàng)相關(guān)聯(lián)的元數(shù)據(jù)中形成的特征向量,以找到最靠近這個(gè)特征向量的陣列中的位置。隨后,搜索處理器可操作用于搜索有關(guān)與用戶選擇的標(biāo)識(shí)信息項(xiàng)相關(guān)聯(lián)的元數(shù)據(jù)的信息項(xiàng)集合。搜索處理器標(biāo)識(shí)來自所述集合的信息項(xiàng),所述信息項(xiàng)在來自最靠近所述特征向量的陣列中的位置的陣列內(nèi)的預(yù)定數(shù)量位置內(nèi)。
用戶控制可操作用于給用戶提供選擇多個(gè)標(biāo)識(shí)信息項(xiàng)的便利,并根據(jù)布爾邏輯指定標(biāo)識(shí)項(xiàng)之間的搜索關(guān)系。結(jié)果,可根據(jù)用戶指定的布爾算子來組合多個(gè)表征特征以形成搜索查詢。同樣,可針對(duì)用戶感興趣的信息項(xiàng)來進(jìn)行更多關(guān)注的搜索。
根據(jù)本發(fā)明的另一方面,提供了圖形用戶界面,它包括用于從信息項(xiàng)集合中選擇信息項(xiàng)的場(chǎng)的行。根據(jù)與各行相關(guān)聯(lián)的表征信息特征的不同類型,各行定義形成搜索查詢的搜索條件。如果在每行提供了多個(gè)信息特征,則通過布爾算子指定搜索條件。相應(yīng)地,用戶可根據(jù)在界面的不同行中選擇的信息項(xiàng)來指定搜索查詢。
本發(fā)明的其它各方面和特征在所附權(quán)利要求書中定義。
現(xiàn)在將參考附圖僅通過示例的方式來描述本發(fā)明的實(shí)施例,附圖中圖1示意性地示出了信息存儲(chǔ)與檢索系統(tǒng);圖2是顯示自組織映射(SOM)生成的示意性流程圖;圖3a和3b示意性地示出了項(xiàng)頻率直方圖;圖4a示意性地示出了原始特征向量;圖4b示意性地示出了減小的特征向量;圖5示意性地示出了SOM;圖6示意性地示出了抖動(dòng)(dither)過程;圖7-9示意性地示出了提供用戶界面以訪問由SOM表示的信息的顯示屏;圖10提供了根據(jù)本發(fā)明實(shí)施例的信息檢索裝置的示意性框圖;圖11提供了表示生成在搜索中標(biāo)識(shí)的信息項(xiàng)的分層配置過程的部分流程圖的說明性表示;圖12提供了提供用于顯示圖11所示不同層次級(jí)的兩個(gè)區(qū)域的屏幕的示意性表示;圖13提供了示例信息項(xiàng)的三種表征信息特征的說明性表示;圖14提供了根據(jù)本發(fā)明范例性實(shí)施例用于形成搜索查詢的圖形用戶界面的示意性說明;圖15提供了根據(jù)布爾“AND”運(yùn)算形成合成特征向量的示意性說明;圖16示出了根據(jù)布爾“OR”算子的兩個(gè)特征向量的組合以及根據(jù)布爾“NOT”算子的第三特征向量;圖17示意性地示出了根據(jù)圖16的布爾算子和特征向量來顯示搜索結(jié)果的標(biāo)識(shí)信息項(xiàng)的一部分二維映射;圖18(a)和18(b)提供了提供形成搜索查詢的兩個(gè)視頻圖像的色彩直方圖的兩個(gè)實(shí)例的條形圖,以及圖18(c)提供了通過組合圖18(a)和18(b)的色彩直方圖而產(chǎn)生的示意性條形圖。
具體實(shí)施例方式
圖1是基于通用計(jì)算機(jī)10的信息存儲(chǔ)和檢索系統(tǒng)的示意圖,該計(jì)算機(jī)10具有處理器單元20,該處理器單元20包括程序和數(shù)據(jù)的盤存儲(chǔ)器30、連接到網(wǎng)絡(luò)50(諸如以太網(wǎng)或互聯(lián)網(wǎng))的網(wǎng)絡(luò)接口卡40、諸如陰極射線管設(shè)備60的顯示設(shè)備、鍵盤70以及諸如鼠標(biāo)80的用戶輸入設(shè)備。該系統(tǒng)在程序控制下工作,程序存儲(chǔ)在盤存儲(chǔ)器30上,并例如通過在網(wǎng)絡(luò)50、移動(dòng)盤(未示出)或盤存儲(chǔ)器30上預(yù)先安裝來提供。
存儲(chǔ)系統(tǒng)工作在兩種通用工作模式下。在第一種模式下,信息項(xiàng)集合(例如文本信息項(xiàng))安裝在盤存儲(chǔ)器30上或通過網(wǎng)絡(luò)50連接的網(wǎng)絡(luò)盤驅(qū)動(dòng)器上,并對(duì)其進(jìn)行分類和索引,準(zhǔn)備搜索操作。第二種工作模式是對(duì)索引并分類的數(shù)據(jù)進(jìn)行實(shí)際搜索。
這些實(shí)施例可應(yīng)用于許多類型的信息項(xiàng)。適當(dāng)類型信息的非窮盡列表包括專利、視頻材料、電子郵件、演示、互聯(lián)網(wǎng)內(nèi)容、廣播內(nèi)容、商業(yè)報(bào)告、音頻材料、圖形和剪輯圖、照片等、或這些信息的任意組合或混合。在本描述中將參照文本信息項(xiàng)。文本信息項(xiàng)可與非文本項(xiàng)相關(guān)聯(lián),或鏈接到非文本項(xiàng)。因此,例如音頻和/或視頻材料可與定義文本項(xiàng)中那個(gè)材料的文本信息項(xiàng)的“元數(shù)據(jù)”相關(guān)聯(lián)。
信息項(xiàng)以常規(guī)方式加載在盤存儲(chǔ)器30上。它們最好存儲(chǔ)為允許更容易檢索并索引信息項(xiàng)的一部分?jǐn)?shù)據(jù)庫(kù)結(jié)構(gòu),但這不是必需的。一旦信息以及項(xiàng)如此存儲(chǔ)了,就執(zhí)行圖2中示意性示出的配置它們搜索的過程。
要理解到,索引的信息項(xiàng)不必存儲(chǔ)在本地盤驅(qū)動(dòng)器30上。信息項(xiàng)可存儲(chǔ)在通過網(wǎng)絡(luò)50連接到系統(tǒng)10的遠(yuǎn)程驅(qū)動(dòng)器上。作為一種備選方案,可以分布式方式存儲(chǔ)信息,例如經(jīng)過互聯(lián)網(wǎng)的各種網(wǎng)站。如果信息存儲(chǔ)在不同互聯(lián)網(wǎng)或網(wǎng)絡(luò)站點(diǎn)上,則信息存儲(chǔ)的第二級(jí)可用于本地存儲(chǔ)一個(gè)到遠(yuǎn)程信息的鏈接(例如通用資源標(biāo)識(shí)符URI),可能具有相關(guān)簡(jiǎn)介、摘要或與那個(gè)鏈接相關(guān)聯(lián)的元數(shù)據(jù)。因此,雖然為了下面的技術(shù)描述,可將遠(yuǎn)程保存的信息、或摘要/簡(jiǎn)介/元數(shù)據(jù)、或鏈接/URI認(rèn)為是“信息項(xiàng)”,但除用戶選擇的相關(guān)鏈接(例如來自下面要描述的結(jié)果列表260)之外,不會(huì)訪問遠(yuǎn)程保存的信息。
換言之,“信息項(xiàng)”的形式定義是導(dǎo)出并處理(參見下文)特征向量以提供到SOM映射的項(xiàng)。結(jié)果列表260(參見下文)中所示的數(shù)據(jù)可以是用戶尋找的實(shí)際信息項(xiàng)(如果是本地保存并足夠短便于顯示),或者可以是表示和/或針對(duì)諸如一個(gè)或多個(gè)元數(shù)據(jù)、URI、摘要、關(guān)鍵詞集合、代表性關(guān)鍵印記(stamp)圖像等的信息項(xiàng)的數(shù)據(jù)。在通常(盡管不總是)包括列出表示信息項(xiàng)集合數(shù)據(jù)的操作“列表”中,這是固有的。表示信息項(xiàng)的數(shù)據(jù)可包括不同類型的信息。各信息項(xiàng)的信息類型和表示各類型的數(shù)據(jù)被稱為表征信息特征。
在另一實(shí)例中,信息項(xiàng)可通過聯(lián)網(wǎng)的工作組(諸如研究組或合法公司)存儲(chǔ)?;旌戏椒砂ㄒ恍┍镜卮鎯?chǔ)的信息項(xiàng)、和/或一些通過局域網(wǎng)存儲(chǔ)的信息項(xiàng)、和/或一些通過廣域網(wǎng)存儲(chǔ)的信息項(xiàng)。在這種情況下,該系統(tǒng)在定位例如由大型跨國(guó)研究和開發(fā)組織中的其他人從事的相似工作中是有用的,相似研究工作傾向于映射到SOM(參見下文)中的相似輸出節(jié)點(diǎn)上?;蛘?,如果策劃新的電視節(jié)目,則本技術(shù)可用于通過找出具有相似內(nèi)容的先前節(jié)目來檢查其獨(dú)創(chuàng)性。
還要理解到,圖1的系統(tǒng)10只是可以使用索引信息項(xiàng)的可能系統(tǒng)的一個(gè)示例。雖然設(shè)想初始(索引)階段可由相當(dāng)強(qiáng)大的計(jì)算機(jī)來執(zhí)行,最可能是非便攜式計(jì)算機(jī),但后面的訪問信息階段可在便攜式機(jī)器上執(zhí)行,諸如“個(gè)人數(shù)字助理”(帶有顯示器和用戶輸入設(shè)備的數(shù)據(jù)處理設(shè)備的術(shù)語,該設(shè)備通常適合單手)、諸如膝上型電腦的便攜式計(jì)算機(jī)、或甚至是諸如移動(dòng)電話、視頻編輯裝置或攝像機(jī)的設(shè)備。通常,實(shí)際上任何具有顯示器的設(shè)備都可用于操作的信息訪問階段。
這些過程并不局限于特定數(shù)量的信息項(xiàng)。
現(xiàn)在參照?qǐng)D2-6來描述生成信息項(xiàng)的自組織映射(SOM)表示的過程。圖2是說明SOM映射過程之前的所謂“特征提取”過程的示意性流程圖。
數(shù)據(jù)提取是將原始數(shù)據(jù)轉(zhuǎn)換為抽象表示的過程。隨后,這些抽象表示可用于諸如模式分類、聚類和識(shí)別的過程。在此過程中,生成所謂的“特征向量”,其是文檔內(nèi)所用項(xiàng)頻率的抽象表示。
通過創(chuàng)建特征向量來形成可視化的過程包括·創(chuàng)建項(xiàng)的“文檔數(shù)據(jù)庫(kù)詞典”;·基于“文檔數(shù)據(jù)庫(kù)詞典”創(chuàng)建各個(gè)文檔的“項(xiàng)頻率直方圖”;·使用隨機(jī)映射來減小“項(xiàng)頻率直方圖”的維數(shù);·創(chuàng)建信息空間的2維可視化。
更詳細(xì)地考慮這些步驟,依次打開各文檔(信息項(xiàng))100。在步驟110,從文檔中去掉所有“無用詞”。無用詞是在預(yù)先準(zhǔn)備列表上極其常用的單詞,諸如“a”、“the”、“however”、“about”、“and”和“the”。因?yàn)檫@些單詞極其常用,因此它們可能在所有足夠長(zhǎng)的文檔中平均出現(xiàn)的頻率差不多。由于這個(gè)原因,所以在試圖表征特定文檔內(nèi)容時(shí)它們的用途很小,并因此應(yīng)該去掉。
去掉無用詞之后,在步驟120對(duì)剩下的單詞進(jìn)行詞干化(stem),包括找出單詞的變形的共同詞干。例如,單詞“thrower”、“throws”和“throwing”的共同詞干是“throw”。
保留在文檔中(排除了“無用”詞)出現(xiàn)的詞干化單詞的“詞典”。當(dāng)遇到一個(gè)新詞時(shí),將其加到詞典中,并還記錄該詞已在整個(gè)文檔集合(信息項(xiàng)集合)中出現(xiàn)次數(shù)的運(yùn)行計(jì)數(shù)(running count)。
結(jié)果是在集合中的所有文檔中所用的項(xiàng)列表,以及那些項(xiàng)出現(xiàn)的頻率。不理會(huì)出現(xiàn)頻率太高或太低的單詞,也就是說將它們從詞典中去掉,并且不參與下面的分析。頻率太低的單詞可能是拼錯(cuò)、編造、或與文檔集合表示的領(lǐng)域不相關(guān)的詞。出現(xiàn)頻率太高的單詞不適于辨別集合內(nèi)的文檔。例如,在與廣播相關(guān)的文檔測(cè)試集合中大約所有文檔的三分之一中都使用了項(xiàng)“News”,而單詞“football”在該測(cè)試集合中只有大約2%的文檔使用。因此可以假定“football”是比“News”更好的表征文檔內(nèi)容的項(xiàng)。相反,單詞“fottball”(“football”的錯(cuò)拼)在整個(gè)文檔集合中只出現(xiàn)一次,因此由于出現(xiàn)頻率太低而被丟棄。這種單詞可定義為那些具有出現(xiàn)頻率比小于平均出現(xiàn)頻率的兩個(gè)標(biāo)準(zhǔn)偏差低的單詞,或是出現(xiàn)頻率比大于平均出現(xiàn)頻率的兩個(gè)標(biāo)準(zhǔn)偏差高的單詞。
隨后,在步驟130生成特征向量。
為了做到這一點(diǎn),為集合中的每個(gè)文檔生成項(xiàng)頻率直方圖。通過對(duì)單詞在各個(gè)文檔內(nèi)的詞典(屬于那個(gè)文檔集合)中出現(xiàn)的次數(shù)進(jìn)行計(jì)數(shù),來構(gòu)造項(xiàng)頻率直方圖。詞典中的大多數(shù)項(xiàng)不會(huì)出現(xiàn)在單一文檔中,因此這些項(xiàng)的頻率為零。圖3a和3b示出了兩個(gè)不同文檔項(xiàng)頻率直方圖的示意性示例。
從這個(gè)實(shí)例可以看出直方圖是如何表征文檔內(nèi)容的。通過觀察這些實(shí)例看到,文檔1中項(xiàng)“MPEG”和“視頻”的出現(xiàn)次數(shù)比文檔2多,文檔2中項(xiàng)“元數(shù)據(jù)”的出現(xiàn)次數(shù)較多。直方圖中的許多條目都為零,這是因?yàn)樵谖臋n中沒出現(xiàn)對(duì)應(yīng)的詞。
在一個(gè)真實(shí)例子中,實(shí)際項(xiàng)頻率直方圖具有的項(xiàng)的數(shù)量遠(yuǎn)大于該例中的數(shù)量。通常情況下,給直方圖超過50000的維數(shù),直方圖可描繪超過50000個(gè)不同項(xiàng)的頻率。如果直方圖要用于構(gòu)建SOM信息空間,則這個(gè)直方圖的維數(shù)需要大大減小。
項(xiàng)頻率直方圖中的每個(gè)條目都被用來表示那個(gè)文檔特征向量中的相應(yīng)值。這個(gè)過程的結(jié)果是一個(gè)(50000×1)向量,它包含由詞典為文檔集合中各文檔指定的所有項(xiàng)頻率。由于大部分值通常為零,其它大部分詞通常為非常小的數(shù)(例如1),所以該向量可稱為“稀疏向量”。
在步驟140減小特征向量的大小,并因此減小項(xiàng)頻率直方圖的維數(shù)。為減小直方圖維數(shù)的過程提出了兩種方法。
i)隨機(jī)映射—一種將直方圖與隨機(jī)數(shù)矩陣相乘的技術(shù)。這是一個(gè)計(jì)算上很便宜的過程。
ii)隱性語義索引—一種通過尋找文檔中同時(shí)出現(xiàn)的概率很高的項(xiàng)的組合來減小直方圖維數(shù)的技術(shù)。隨后,這些詞的組合可被減小為單一參數(shù)。這是一個(gè)計(jì)算上很昂貴的過程。
在本實(shí)施例中,所選擇的用于減小項(xiàng)頻率直方圖維數(shù)的方法是“隨機(jī)映射”,上面提到的Kaski文章中對(duì)這種方法進(jìn)行了詳細(xì)描述。隨機(jī)映射通過將直方圖與隨機(jī)數(shù)矩陣相乘而成功地減小了直方圖的維數(shù)。
如上所述,“原始”特征向量(圖4a中示意性地示出了)一般是大小在50000個(gè)值范圍內(nèi)的稀疏向量。這可減小到大約200個(gè)(參見示意圖4b),并仍保持了特征向量的相對(duì)正交特征,即,它的關(guān)系,諸如與其它同樣處理的特征向量的相對(duì)角(向量點(diǎn)積)。因?yàn)楸M管特定維數(shù)的正交向量的數(shù)量有限,但幾乎正交的向量的數(shù)量很大,所以該方法有效。
事實(shí)上,隨著向量維數(shù)的增加,任何給定的隨機(jī)生成的向量集合幾乎都彼此正交。這種性質(zhì)意味著將保持與隨機(jī)數(shù)矩陣相乘的向量的相對(duì)方向。這可通過在隨機(jī)映射之前和之后通過查看其點(diǎn)積來示出向量的相似性而進(jìn)行論證。
可用實(shí)驗(yàn)的方法示出,通過將稀疏向量從50000個(gè)值減小到200個(gè)值來保持其相對(duì)相似性。然而,這個(gè)映射并不完善,但對(duì)于以簡(jiǎn)潔方式表征文檔內(nèi)容而言足夠了。
一旦為文檔集合生成了特征向量,從而定義了集合的信息空間,就在步驟150將它們投入二維SOM中以創(chuàng)建語義映射。下面部分說明通過使用Kohonen自組織映射對(duì)特征向量進(jìn)行聚類來映射到2D的過程。還參考了圖5。
Kohonen自組織映射用于聚類并組織為各文檔生成的特征向量。
自組織映射包括顯示為二維平面185的節(jié)點(diǎn)的二維陣列或柵格中的輸入節(jié)點(diǎn)170和輸出節(jié)點(diǎn)180。輸入節(jié)點(diǎn)與用于訓(xùn)練映射的特征向量中的值一樣多。映射上的每個(gè)輸出節(jié)點(diǎn)由加權(quán)連接190(一個(gè)連接一個(gè)加權(quán))連接到輸入節(jié)點(diǎn)。
開始,每個(gè)這些加權(quán)都設(shè)為隨機(jī)值,并隨后通過迭代過程“訓(xùn)練”加權(quán)。通過將每個(gè)特征向量呈現(xiàn)到映射的輸入節(jié)點(diǎn)來訓(xùn)練該映射。通過計(jì)算輸入向量和與各輸出節(jié)點(diǎn)相關(guān)聯(lián)的加權(quán)之間的歐氏距離來計(jì)算“最靠近的”輸出節(jié)點(diǎn)。
由輸入向量和與那個(gè)節(jié)點(diǎn)相關(guān)聯(lián)的加權(quán)之間的最小歐氏距離所標(biāo)識(shí)的最靠近的節(jié)點(diǎn)被指定為“勝利者”,并通過稍微改變加權(quán)值來訓(xùn)練這個(gè)節(jié)點(diǎn)的加權(quán),以使它們向“更靠近”輸入向量的方向移動(dòng)。除了獲勝節(jié)點(diǎn)之外,還訓(xùn)練獲勝節(jié)點(diǎn)鄰域內(nèi)的節(jié)點(diǎn),并稍微向更靠近輸入向量的方向移動(dòng)。
這不只是訓(xùn)練單個(gè)節(jié)點(diǎn)加權(quán)的過程,而且是訓(xùn)練映射上節(jié)點(diǎn)區(qū)域加權(quán)的過程,其允許一旦映射被訓(xùn)練了就保持節(jié)點(diǎn)2D映射中的輸入空間的大量拓?fù)洹?br>
一旦訓(xùn)練了映射,各文檔就被呈現(xiàn)到該映射上,以查看對(duì)于那個(gè)文檔哪個(gè)輸出節(jié)點(diǎn)最靠近輸入特征向量。加權(quán)等于特征向量是不太可能的,并且特征向量與映射上其最靠近的節(jié)點(diǎn)間的歐氏距離被稱為它的“量化誤差”。
通過將各文檔的特征向量呈現(xiàn)到該映射上,來查看它在哪產(chǎn)生各文檔的x、y映射位置。當(dāng)這些x、y位置與文檔ID一起放進(jìn)查找表時(shí),可用來對(duì)文檔間的關(guān)系進(jìn)行可視化。
最后,在步驟160加入抖動(dòng)分量,下面參照?qǐng)D6描述該步驟。
用上述過程的潛在問題是兩個(gè)相同或基本相同的信息項(xiàng)可映射到SOM節(jié)點(diǎn)陣列中的同一節(jié)點(diǎn)。這沒有引起處理數(shù)據(jù)方面的困難,但對(duì)顯示屏上數(shù)據(jù)的可視化(下面將描述)沒有幫助。特別是,當(dāng)在顯示屏上可視化數(shù)據(jù)時(shí),已經(jīng)認(rèn)識(shí)到,對(duì)于在特定節(jié)點(diǎn)處的單個(gè)項(xiàng)上可辨別的多個(gè)非常相似的項(xiàng)而言,這是有用的。因此,將“抖動(dòng)”分量加到各信息項(xiàng)映射的節(jié)點(diǎn)位置上。抖動(dòng)分量是節(jié)點(diǎn)間隔的±1/2的隨機(jī)增加。因此,參照?qǐng)D6,映射過程選擇輸出節(jié)點(diǎn)200的信息項(xiàng)具有添加的抖動(dòng)分量,以便它實(shí)際上可映射到圖6上由虛線界定的區(qū)域210內(nèi)的節(jié)點(diǎn)200周圍的任何映射位置。
因此,可認(rèn)為信息項(xiàng)映射到了圖6平面上的位置,在節(jié)點(diǎn)位置而不是SOM過程的“輸出節(jié)點(diǎn)”。
在任何時(shí)候,通過上面概述的步驟(即步驟110-140)并隨后將結(jié)果減小的特征向量應(yīng)用到“預(yù)訓(xùn)練”的SOM模型上,即,由映射的自組織準(zhǔn)備產(chǎn)生的SOM模型集合,可將新的信息項(xiàng)添加到SOM上。因此,對(duì)于新添加的信息項(xiàng),映射一般不被“再訓(xùn)練”;代替步驟150和160用于所有未修改的SOM模型。為再訓(xùn)練SOM每次添加新信息項(xiàng)是計(jì)算上很昂貴的,并且對(duì)用戶也不友好,用戶可能已習(xí)慣于映射中通常訪問的信息項(xiàng)的相對(duì)位置。
然而,有可能達(dá)到再訓(xùn)練過程是適當(dāng)?shù)倪@一點(diǎn)。例如,如果自從首次生成SOM時(shí)新項(xiàng)(可能是新聞的新項(xiàng)或新的技術(shù)領(lǐng)域)就已經(jīng)進(jìn)入了詞典,則它們不可能非常好地映射到輸出節(jié)點(diǎn)的現(xiàn)有集合。在將新近接收的信息項(xiàng)映射到現(xiàn)有SOM的過程中,這可被檢測(cè)為在檢測(cè)的所謂“量化誤差”中的一個(gè)增加。在本實(shí)施例中,將量化誤差與閾值誤差量相比較。如果它大于閾值量,則(a)使用所有其原始信息項(xiàng)和自從其創(chuàng)建所添加的任何項(xiàng),來自動(dòng)再訓(xùn)練SOM;或者(b)使用戶在方便的時(shí)候開始再訓(xùn)練過程。再訓(xùn)練過程使用所有相關(guān)信息項(xiàng)的特征向量,并全部再次應(yīng)用步驟150和160。
圖7示意性地示出了顯示屏60上的顯示。該顯示示出了搜索查詢250、結(jié)果列表260以及SOM顯示區(qū)270。
在操作中,最初顯示區(qū)270是空白的。用戶在查詢區(qū)250輸入關(guān)鍵詞搜索查詢。隨后,用戶例如通過按鍵盤70上的回車或通過使用鼠標(biāo)80選擇屏幕“按鈕”來啟動(dòng)搜索,以開始搜索。隨后,使用標(biāo)準(zhǔn)關(guān)鍵詞搜索技術(shù),將搜索查詢區(qū)250中的關(guān)鍵詞與數(shù)據(jù)庫(kù)中的信息項(xiàng)相比較。這生成結(jié)果列表,各結(jié)果顯示為列表區(qū)260中的各個(gè)條目280。于是顯示區(qū)270顯示與各結(jié)果項(xiàng)相對(duì)應(yīng)的顯示點(diǎn)。
因?yàn)樯蒘OM表示的分類過程傾向于在SOM中將相互相似的信息項(xiàng)集中在一起,所以搜索查詢結(jié)果通常傾向于歸入諸如聚類290的聚類中。在此要注意的是,區(qū)域270上的各點(diǎn)對(duì)應(yīng)于與結(jié)果列表260中的一個(gè)結(jié)果相關(guān)聯(lián)的SOM中的各條目;并且在區(qū)域270中顯示的點(diǎn)的位置對(duì)應(yīng)于節(jié)點(diǎn)陣列內(nèi)那些節(jié)點(diǎn)的陣列位置。
圖8示意性地示出了一種減少“命中”(結(jié)果列表中的結(jié)果)數(shù)的技術(shù)。用戶周鼠標(biāo)80在區(qū)域270中顯示的顯示點(diǎn)集合的周圍拖出一個(gè)邊界,在本實(shí)例中是矩形框300。在結(jié)果列表區(qū)260中,只顯示了與邊界300內(nèi)的點(diǎn)相對(duì)應(yīng)那些結(jié)果。如果這些結(jié)果證明是不感興趣的,則用戶可拖出包含不同顯示點(diǎn)集合的另一邊界。
要注意的是,對(duì)于在邊界300內(nèi)顯示的顯示點(diǎn)并滿足單詞搜索區(qū)250中搜索標(biāo)準(zhǔn)的那些結(jié)果,結(jié)果區(qū)260顯示了列表?xiàng)l目。邊界300可包含與在節(jié)點(diǎn)陣列中填充的節(jié)點(diǎn)相對(duì)應(yīng)的其它顯示位置,但如果這些不滿足搜索標(biāo)準(zhǔn),則不會(huì)顯示它們,并因此不會(huì)形成在列表260中顯示的一部分結(jié)果子集。
圖9示出了本發(fā)明的實(shí)施例。參照?qǐng)D9,步驟920,當(dāng)生成自組織映射SOM時(shí),它沒有標(biāo)簽(不象Kohonen的SOM)。用戶需要標(biāo)簽以給出研究映射的導(dǎo)引。在本發(fā)明的實(shí)施例中,自動(dòng)生成標(biāo)簽以匹配用戶的特殊要求。用戶生成如參照?qǐng)D7和/或圖8描述的搜索結(jié)果列表。根據(jù)結(jié)果自動(dòng)動(dòng)態(tài)地生成標(biāo)簽,并將其用于標(biāo)記區(qū)域270中顯示點(diǎn)的聚類。
交叉-聚類關(guān)聯(lián)/輔助關(guān)鍵詞搜索現(xiàn)在將參照?qǐng)D10、11和12來描述本發(fā)明的示范性實(shí)施例。
在圖10中,包含信息項(xiàng)數(shù)據(jù)庫(kù)的數(shù)據(jù)中心庫(kù)400通過數(shù)據(jù)通信網(wǎng)絡(luò)410連接到搜索處理器404和映射處理器412。映射處理器連接到用戶控制414和顯示處理器416。圖形用戶界面418接收顯示處理器416的輸出,該圖形用戶界面418對(duì)接到顯示器420。顯示處理器416可操作用于處理來自映射處理器的數(shù)據(jù),用于在顯示屏上顯示。
數(shù)據(jù)中心庫(kù)400可單獨(dú)定位到映射處理器412。相應(yīng)地,搜索處理器可從數(shù)據(jù)中心庫(kù)400、映射處理器412和圖10所示用于顯示信息的那些部分來單獨(dú)定位,其中那些部分是指顯示處理器416、圖形用戶界面418和顯示器420。備選地,映射處理器412、搜索處理器404以及顯示處理器416可以在通用計(jì)算機(jī)(諸如圖1所示的)上運(yùn)行的軟件模塊的形式來實(shí)現(xiàn)。然而,要理解到,映射處理器、搜索處理器和顯示處理器可分別產(chǎn)生和定位。
結(jié)合圖7、8和9中的說明,圖10所示的實(shí)施例基本操作為圖1所示的存儲(chǔ)及檢索數(shù)據(jù)處理器。圖7、8和9提供了如何相對(duì)于搜索查詢來搜索信息項(xiàng)以及如何顯示搜索結(jié)果的示例說明。相應(yīng)地,圖10所示的實(shí)施例配置為接收搜索查詢,例如來自用戶控制414的關(guān)鍵詞。響應(yīng)該關(guān)鍵詞,搜索處理器404處理該搜索,以結(jié)合映射處理器來標(biāo)識(shí)對(duì)應(yīng)于標(biāo)識(shí)為搜索結(jié)果的信息項(xiàng)的陣列中的x、y位置集合。例如,對(duì)于40×40的節(jié)點(diǎn)陣列,在方形二維陣列中有1600個(gè)位置。如上所述,搜索處理器根據(jù)搜索查詢來搜索信息項(xiàng)。通過搜索處理器的搜索產(chǎn)生由搜索處理器標(biāo)識(shí)為對(duì)應(yīng)于搜索查詢的信息項(xiàng)的x、y位置集合。映射處理器412接收搜索結(jié)果的x、y位置。
在備選實(shí)施例中,搜索處理器404可配置為搜索信息項(xiàng)并生成搜索結(jié)果,該搜索結(jié)果標(biāo)識(shí)與搜索查詢相對(duì)應(yīng)的信息項(xiàng)。隨后,映射處理器412可接收表示標(biāo)識(shí)對(duì)應(yīng)于搜索查詢的信息項(xiàng)的搜索結(jié)果的數(shù)據(jù)。隨后,映射處理器生成與標(biāo)識(shí)的信息項(xiàng)相對(duì)應(yīng)的陣列中位置的x、y坐標(biāo)。
映射處理器412可操作用于通過實(shí)施k-均值聚類算法來標(biāo)識(shí)在第一全級(jí)的信息項(xiàng)聚類。k-均值聚類算法標(biāo)識(shí)聚類以及陣列內(nèi)該聚類的位置。在標(biāo)題為“用于模式識(shí)別的神經(jīng)網(wǎng)絡(luò)”(“Neural Networksfor Pattern Recognition”,by Christopher M.Bishop,pp187-188,OxfordUniversity Press)的書中公開了k-均值聚類算法。在如下網(wǎng)址中公開了k-均值聚類算法的更多公開http//cne.gmu.edu/modules/dau/stat/clustgalgs/clust5_bdy.html。
如圖11所示,關(guān)鍵詞“表演”的搜索結(jié)果可標(biāo)識(shí)與以單詞“表演”作為其元數(shù)據(jù)一部分的信息項(xiàng)相對(duì)應(yīng)的陣列中的位置。因此,在陣列上執(zhí)行k-均值聚類算法的結(jié)果標(biāo)識(shí)了例如“知識(shí)競(jìng)賽”、“游戲”和“DIY”的三個(gè)聚類。信息項(xiàng)的這些聚類形成第一層次級(jí)h_level1。顯示處理器416接收來自映射處理器412與第一層次級(jí)h_level1的信息項(xiàng)聚類相對(duì)應(yīng)的數(shù)據(jù)。顯示處理器416處理數(shù)據(jù)的第一層次級(jí),以便提供表示這個(gè)第一層次級(jí)h_level1的二維顯示的數(shù)據(jù)。顯示處理器416產(chǎn)生的數(shù)據(jù)饋送到圖形用戶界面418,用于在如圖12所示的顯示屏420上的第一區(qū)430中顯示。
在一些實(shí)施例中,可通過映射處理器412執(zhí)行進(jìn)一步操作,以使用k-均值算法來精煉聚類的標(biāo)識(shí)。進(jìn)一步操作被稱為“k-均值聚類與修剪”。已知的k-均值聚類過程標(biāo)識(shí)在表示相似信息項(xiàng)的搜索結(jié)果中標(biāo)識(shí)的信息項(xiàng)的陣列位置組合。隨后執(zhí)行進(jìn)一步修剪過程,該進(jìn)一步修剪過程確定結(jié)果項(xiàng)x、y位置的相鄰子聚類是否為同一主聚類的一部分。如果兩個(gè)子聚類的中心之間的距離小于閾值,則這兩個(gè)子聚類被認(rèn)為是同一主聚類的一部分。用已知方法反復(fù)地執(zhí)行修剪,直到聚類穩(wěn)定。
映射處理器412操作執(zhí)行對(duì)在第一層次級(jí)h_level1標(biāo)識(shí)的信息項(xiàng)的各聚類的進(jìn)一步分析。為了向用戶提供單獨(dú)檢查信息項(xiàng)聚類并標(biāo)識(shí)那些信息項(xiàng)內(nèi)其它聚類的便利,映射處理器412形成另一層次級(jí)。相應(yīng)地,對(duì)于信息項(xiàng)的各聚類,對(duì)那個(gè)聚類執(zhí)行k-均值聚類算法,以標(biāo)識(shí)信息項(xiàng)的那個(gè)第一層次級(jí)內(nèi)的其它聚類。因此,例如如圖11所示,如果在“知識(shí)競(jìng)賽”聚類上執(zhí)行k-均值算法,則在第二層次級(jí)h_level2標(biāo)識(shí)其它三個(gè)聚類。
如對(duì)于第一層次級(jí)所說明的,根據(jù)關(guān)鍵詞標(biāo)記各聚類。通過找出最通用的詞來標(biāo)識(shí)關(guān)鍵詞,最通用的詞是指聚類中每個(gè)信息項(xiàng)都存在與那個(gè)信息項(xiàng)相關(guān)聯(lián)的元數(shù)據(jù)。因此,例如在第一層次級(jí)中,通過詞“知識(shí)競(jìng)賽”、“游戲”和“DIY”標(biāo)識(shí)了三個(gè)聚類。
以標(biāo)記第一層次級(jí)h_level1聚類的相應(yīng)方式,對(duì)第二層次級(jí)h_level2中的各聚類標(biāo)識(shí)關(guān)鍵詞。相應(yīng)地,三個(gè)聚類被標(biāo)記為“主持人”、“淘汰(wipeout)”以及“對(duì)手參與(enemy within)”。這三個(gè)聚類每個(gè)都包括知識(shí)競(jìng)賽表演的不同片段。
這是可以理解的,可進(jìn)行進(jìn)一步重復(fù)分析各聚類。這是通過在第二層次級(jí)h_leve12標(biāo)識(shí)的各聚類上執(zhí)行k-均值算法來實(shí)現(xiàn)。如圖11所示,使用k-均值聚類算法來進(jìn)一步分析“淘汰”信息聚類。然而,在第三層次級(jí)h_level3,只顯示了單個(gè)信息項(xiàng),并因此如圖11所示,第三層次級(jí)h_level3標(biāo)識(shí)了“淘汰”的各個(gè)片段。
因此,映射處理器412可操作用于標(biāo)識(shí)在不同層次級(jí)信息項(xiàng)的聚類。表示各層次級(jí)的數(shù)據(jù)被饋送到顯示處理器416。相應(yīng)地,結(jié)合圖形用戶界面418,第二區(qū)可被顯示在例如與第二層次級(jí)h_level2相對(duì)應(yīng)的顯示器420上。因此,使用縮放控制用戶可放大在第一層次級(jí)h_level1中顯示的聚類。使用用戶控制414可操作縮放控制。相應(yīng)地,放大特定的聚類可對(duì)顯示信息項(xiàng)的第二層次級(jí)h_level2有影響?;蛘?,用戶控制414可用于選擇第一區(qū)內(nèi)的“當(dāng)前視圖”區(qū)域。相應(yīng)地,相對(duì)于在第一顯示中所示的第一層次級(jí)h_level1標(biāo)識(shí)的“知識(shí)競(jìng)賽”聚類內(nèi)所標(biāo)識(shí)的聚類來說明第二顯示。
本發(fā)明實(shí)施例提供的另一優(yōu)點(diǎn)是在顯示器的第二或后續(xù)區(qū)域中顯示的第二或后續(xù)級(jí)的配置可設(shè)置有其它聚類的指示符。該指示符可將用戶指向與在較低層次級(jí)觀察到的聚類相關(guān)聯(lián)的關(guān)鍵詞的備選聚類。因而,在第二顯示區(qū)440內(nèi)的較低層次級(jí)示出的聚類將有正查看聚類的備選聚類。例如,在圖12中,在第一顯示區(qū)430中,第一層次級(jí)示出了三個(gè)聚類“知識(shí)競(jìng)賽”、“游戲”和“DIY”。由于縮放控制用于在“知識(shí)競(jìng)賽”聚類進(jìn)行放大,于是第二顯示區(qū)440提供了“知識(shí)競(jìng)賽”聚類內(nèi)的聚類顯示,它們是“主持人”、“對(duì)手參與”和“淘汰”。然而,“知識(shí)競(jìng)賽”聚類的備選關(guān)鍵詞是如在第一區(qū)所示的“DIY”、“恐怖”和“游戲”。相應(yīng)地,提供箭頭444、446和448,以將用戶指向與在第二顯示區(qū)中顯示的“知識(shí)競(jìng)賽”聚類同一層次級(jí)的信息項(xiàng)聚類。相應(yīng)地,如果用戶隨后想查看來自第一層次級(jí)的不同聚類以顯示第二層次級(jí)中的聚類,則用戶可用箭頭導(dǎo)航到第一層次級(jí)內(nèi)的備選聚類。此外,有利的是,用出現(xiàn)在第一層次級(jí)中聚類的關(guān)鍵詞標(biāo)簽來標(biāo)記箭頭。在其它實(shí)施例中,為了向用戶提供聚類中相對(duì)項(xiàng)的數(shù)量的說明,于是在與方向指示箭頭相關(guān)的關(guān)鍵詞旁顯示這個(gè)數(shù)量。當(dāng)鼠標(biāo)指針MP通過或定位在指示箭頭上時(shí),用戶控制與顯示器可配置為指示這個(gè)數(shù)量。
一些實(shí)施例的其它有利特征是提供了附加關(guān)鍵詞列表,即,與第一級(jí)聚類內(nèi)的第二級(jí)聚類相關(guān)的關(guān)鍵詞。如圖12所示,對(duì)于提供“恐怖”的其它第一級(jí)聚類的聚類,當(dāng)鼠標(biāo)指針MP定位在與“恐怖”相關(guān)的箭頭上時(shí),于是生成與那個(gè)第一級(jí)聚類“恐怖”內(nèi)的第二級(jí)聚類相對(duì)應(yīng)的附加詞。結(jié)果,在不必查看第二顯示區(qū)440內(nèi)的那些聚類的情況下,向用戶提供了與第一級(jí)聚類相關(guān)的信息項(xiàng)內(nèi)容的非常有效的說明。如圖12所示,顯示區(qū)還可包括通常如450所示的控制圖標(biāo),其用于在第一顯示區(qū)430中出現(xiàn)的信息項(xiàng)周圍查看并導(dǎo)航。
多模式精煉搜索現(xiàn)在將參照?qǐng)D10并結(jié)合圖13-17來描述本發(fā)明的另一示范性實(shí)施例。圖13提供了表征信息特征類型的說明性表示,其以與信息項(xiàng)相關(guān)聯(lián)的方式存儲(chǔ)。例如,信息項(xiàng)可以是來自電視節(jié)目的一段音頻/視頻數(shù)據(jù)。在該實(shí)例中,節(jié)目提供了足球賽的最精彩部分。相應(yīng)地,數(shù)據(jù)項(xiàng)包括視頻數(shù)據(jù)460和音頻數(shù)據(jù)。與音頻數(shù)據(jù)有關(guān)的是在框462中示出的音頻元數(shù)據(jù)。音頻元數(shù)據(jù)描述與視頻數(shù)據(jù)相關(guān)的音頻信號(hào)的內(nèi)容和類型。對(duì)于本示例,音頻數(shù)據(jù)包括“音樂”、“評(píng)論”、“嘈雜聲”,但也可包括指示音頻信號(hào)類型的一個(gè)或多個(gè)其它類型的元數(shù)據(jù)。除視頻數(shù)據(jù)和音頻數(shù)據(jù)外,信息項(xiàng)還可包括描述視頻和音頻數(shù)據(jù)內(nèi)容或?qū)傩缘钠渌獢?shù)據(jù)。對(duì)于本示例,元數(shù)據(jù)在框464內(nèi)說明了,并顯示為包括視頻節(jié)目?jī)?nèi)容的描述。是包含在這個(gè)元數(shù)據(jù)中的詞用于構(gòu)建生成SOM的特性向量。然而,在本發(fā)明的其它實(shí)施例中,可相對(duì)于是音頻元數(shù)據(jù)462或在視頻數(shù)據(jù)上的音頻數(shù)據(jù),來搜索包含在數(shù)據(jù)中心庫(kù)400中的信息項(xiàng)集合。為此,可從視頻數(shù)據(jù)460的幀中生成代表性關(guān)鍵印記。
通過形成視頻數(shù)據(jù)各幀的色彩直方圖,來生成代表性關(guān)鍵印記RKS。對(duì)所有或選擇的視頻幀的色彩直方圖進(jìn)行組合,并隨后進(jìn)行標(biāo)準(zhǔn)化,以產(chǎn)生合成的色彩直方圖,其以如圖13中的條形圖466的代表性形式進(jìn)行說明。隨后將合成的色彩直方圖與各視頻幀的色彩直方圖相比較。通過對(duì)各視頻幀色彩直方圖的各列與合成直方圖的對(duì)應(yīng)列的距離求和,來確定各幀色彩直方圖與合成色彩直方圖之間的距離。選擇相對(duì)于合成色彩直方圖具有最小距離的色彩直方圖的代表性關(guān)鍵印記RKS。對(duì)于描述足球賽的節(jié)目,則相應(yīng)產(chǎn)生的代表性關(guān)鍵印記最可能是一部分足球場(chǎng)的視頻圖像,通過圖13所示的代表性關(guān)鍵印記RKS對(duì)其進(jìn)行說明。
在其它實(shí)施例中,可通過如下任一方法從視頻幀中生成各信息項(xiàng)的RKS·用戶可選擇認(rèn)為是與信息項(xiàng)的整個(gè)內(nèi)容相對(duì)應(yīng)的最具代表性幀的幀。這個(gè)方法可提供改進(jìn)的可靠性,因?yàn)橛脩舸_保選擇了主觀上代表信息項(xiàng)的視頻幀。然而,這種方法較費(fèi)時(shí)。
·用戶可選擇信息項(xiàng)內(nèi)的第一幀或隨機(jī)幀。對(duì)于選擇適當(dāng)?shù)腞KS,這是可靠性較低的方法。
·設(shè)想基于圖像幀內(nèi)容來處理視頻幀并選擇RKS的其它方法。
本發(fā)明的實(shí)施例可提供基于選擇的表征信息特征來產(chǎn)生精煉搜索的便利。在一個(gè)實(shí)施例中,搜索處理器142可操作用于根據(jù)元數(shù)據(jù)、視頻圖像或音頻數(shù)據(jù)的項(xiàng)來搜索在第一次搜索中標(biāo)識(shí)的那些信息項(xiàng)。在備選實(shí)施例中,可只在元數(shù)據(jù)、或只在視頻數(shù)據(jù)、或只在音頻數(shù)據(jù)、或其中的任意組合上進(jìn)行搜索。為了便于搜索查詢的形成,圖10所示的顯示設(shè)備420可包括由圖14所示的圖形用戶界面418所提供的另一圖形顯示。
在圖14中,顯示區(qū)472內(nèi)的第一行470向用戶提供了基于元數(shù)據(jù)選擇查詢信息的便利。相應(yīng)地,如果來自信息項(xiàng)的圖像代表性關(guān)鍵印記放在這行的窗口內(nèi),則將與這個(gè)信息項(xiàng)(如圖13所示的)相關(guān)的元數(shù)據(jù)添加到搜索查詢中。因此,可將來自不同信息項(xiàng)的一個(gè)或多個(gè)代表性關(guān)鍵印記引入到類型元數(shù)據(jù)的表征信息特征的搜索查詢中。相應(yīng)地,引入用戶已經(jīng)選擇的第二行474視頻幀,以形成一部分搜索查詢。例如,用戶可瀏覽視頻數(shù)據(jù)的特定項(xiàng),并選擇感興趣的幀。用戶隨后可將這個(gè)圖像幀放在行474,以形成一部分搜索查詢。用戶可引入一個(gè)或多個(gè)視頻幀。
用戶還可根據(jù)信息項(xiàng)內(nèi)的音頻數(shù)據(jù)來選擇要搜索的那個(gè)信息項(xiàng)。相應(yīng)地,顯示區(qū)內(nèi)的第三行476向用戶提供了這樣的便利引入那個(gè)信息項(xiàng)的代表性圖像,以標(biāo)識(shí)在音頻數(shù)據(jù)行內(nèi)搜索查詢要包含與搜索查詢內(nèi)的那個(gè)信息項(xiàng)相對(duì)應(yīng)的音頻數(shù)據(jù)。
除了根據(jù)表征信息特征的類型來選擇要搜索的信息項(xiàng)之外,本發(fā)明的實(shí)施例還提供了根據(jù)選擇的信息項(xiàng)之間的布爾算子進(jìn)行搜索的便利。如圖14所示,要根據(jù)如在前兩列478、480之間所示的“AND”算子來搜索已經(jīng)對(duì)于元數(shù)據(jù)搜索而選擇的信息項(xiàng)。然而,在搜索查詢中第一元數(shù)據(jù)與第一視頻圖像項(xiàng)之間的搜索查詢由“OR”算子連接。要對(duì)于視頻圖像數(shù)據(jù)搜索的兩個(gè)項(xiàng)由“AND”算子連接。要根據(jù)音頻數(shù)據(jù)搜索的信息項(xiàng)還要根據(jù)“NOT”算子在搜索查詢中搜索。
已經(jīng)建立了搜索查詢,搜索處理器404可操作用于根據(jù)從用戶作的選擇而構(gòu)建的、并在圖14中說明的搜索查詢來搜索從關(guān)鍵詞搜索中標(biāo)識(shí)的信息項(xiàng)。搜索處理器根據(jù)選擇的表征信息特征類型來不同地搜索信息項(xiàng),這將在下面段落中解釋。
對(duì)于搜索表征信息特征(諸如元數(shù)據(jù))的實(shí)例,然后對(duì)于任意信息項(xiàng),從元數(shù)據(jù)生成的那個(gè)信息項(xiàng)的特征向量可用于標(biāo)識(shí)與那個(gè)特征向量相對(duì)應(yīng)的二維陣列中的點(diǎn)。相應(yīng)地,陣列中那個(gè)所標(biāo)識(shí)位置的預(yù)定距離內(nèi)的信息項(xiàng)可作為搜索查詢的結(jié)果返回。然而,如果已經(jīng)在元數(shù)據(jù)搜索行內(nèi)選擇了多個(gè)信息項(xiàng),則必須以根據(jù)選擇的布爾算子來搜索這兩個(gè)項(xiàng)的方式構(gòu)建搜索查詢。
對(duì)于“AND”布爾算子的實(shí)例,則組合各信息項(xiàng)的特征向量,以形成如圖15所示的合成特征向量。為此,將與元數(shù)據(jù)內(nèi)每個(gè)詞相關(guān)聯(lián)的值加到一起,并進(jìn)行標(biāo)準(zhǔn)化,以產(chǎn)生合成特征向量。因此如圖15所示,將與用戶選擇的元數(shù)據(jù)相關(guān)聯(lián)的兩個(gè)特征向量A、B組合在一起形成特征向量C,其中用戶選擇的元數(shù)據(jù)具有在元數(shù)據(jù)搜索查詢行470的行470和列478到480中所示的其代表性關(guān)鍵印記。隨后,搜索處理器可得到特征向量C,并將其與SOM相比較。標(biāo)識(shí)了與合成特征向量C相對(duì)應(yīng)的陣列中的最靠近的位置,將來自陣列中那個(gè)標(biāo)識(shí)位置的陣列內(nèi)的預(yù)定數(shù)量位置內(nèi)的信息項(xiàng)作為搜索查詢結(jié)果返回。
對(duì)于相應(yīng)元數(shù)據(jù)搜索的布爾“OR”算子的實(shí)例,則對(duì)于第一特征向量A和第二特征B,標(biāo)識(shí)那些特征向量在陣列中的相應(yīng)位置。同樣,搜索查詢結(jié)果要返回陣列中每個(gè)那些標(biāo)識(shí)點(diǎn)的預(yù)定數(shù)量位置內(nèi)的所有信息項(xiàng)。這在圖16和17中說明了。在圖17中,在二維陣列中標(biāo)識(shí)與特征向量A相對(duì)應(yīng)并與特征向量B相應(yīng)的位置。如圖17所示,隨后可將陣列中在A與B陣列位置的預(yù)定半徑內(nèi)的位置作為如搜索查詢結(jié)果所標(biāo)識(shí)的返回。然而,如果在搜索查詢中標(biāo)識(shí)了另一特征向量C,并對(duì)這個(gè)另一特征向量指定了“NOT”布爾算子,則再次標(biāo)識(shí)對(duì)應(yīng)于特征向量C的陣列中的位置。相應(yīng)地,可再次標(biāo)識(shí)從C的陣列位置的預(yù)定半徑內(nèi)的信息項(xiàng)。然而,作為“NOT”算子的結(jié)果,從搜索結(jié)果中排除在特征向量C以及A和B的陣列位置的半徑之間標(biāo)識(shí)的任何相互包含的陣列位置。因此,搜索處理器配置為返回與從A或B但不是C產(chǎn)生的陣列中的位置相對(duì)應(yīng)的信息項(xiàng)。
對(duì)于與作為搜索的表征特征的視頻圖像數(shù)據(jù)相對(duì)應(yīng)的搜索查詢中的第二行,則搜索處理器可操作用于搜索與用戶選擇的視頻圖像相對(duì)應(yīng)的代表性關(guān)鍵印記的視頻數(shù)據(jù)。為此,將與用戶選擇的視頻圖像相關(guān)聯(lián)的色彩直方圖和與信息項(xiàng)相關(guān)聯(lián)的各代表性關(guān)鍵印記的色彩直方圖相比較。計(jì)算各信息項(xiàng)的代表性關(guān)鍵印記的色彩直方圖與用戶指定視頻圖像的色彩直方圖之間的距離。這是通過計(jì)算表示那個(gè)圖像的色彩分量的各列之間的距離并對(duì)各列的這些距離求和來實(shí)現(xiàn)的。標(biāo)識(shí)與在用戶選擇的視頻圖像的色彩直方圖和對(duì)應(yīng)于陣列位置的代表性關(guān)鍵印記的色彩直方圖之間具有最短距離的信息項(xiàng)相對(duì)應(yīng)的那個(gè)陣列位置。查詢結(jié)果將再次返回具有來自標(biāo)識(shí)陣列位置的預(yù)定數(shù)量位置內(nèi)的陣列位置的信息項(xiàng)。
對(duì)于布爾算子的情況,則可通過將布爾“AND”算子選擇并指定的兩個(gè)圖像的色彩直方圖相組合而再次形成色彩直方圖。圖18示出了形成合成色彩直方圖的過程。通過對(duì)色彩直方圖各列中的值取平均來組合圖14所示的顯示區(qū)內(nèi)的視頻圖像搜索查詢行的行474和列478、480中提供的第一和第二用戶選擇的圖像的色彩直方圖。從而,組合了圖18a和18b所示的兩個(gè)色彩直方圖,形成在圖18c中形成的色彩直方圖。相對(duì)于要搜索的信息項(xiàng)的代表性關(guān)鍵印記來搜索的是這個(gè)色彩直方圖。
對(duì)于音頻數(shù)據(jù)的例子,則搜索處理器可從與選擇的信息項(xiàng)相關(guān)聯(lián)的音頻元數(shù)據(jù)中形成特征向量。例如,音頻元數(shù)據(jù)可標(biāo)識(shí)存在于音頻信號(hào)、語音數(shù)據(jù)中的諧波,或在由音頻元數(shù)據(jù)表示的音頻信號(hào)內(nèi)是否存在音樂。此外,元數(shù)據(jù)可標(biāo)識(shí)在音頻信號(hào)上是否存在特定的講演者,例如托尼·布萊爾或特別評(píng)論員諸如約翰·莫特森。相應(yīng)地,可從選擇的音頻數(shù)據(jù)中再次生成特征向量,其中該選擇的音頻數(shù)據(jù)可相對(duì)于特別與音頻數(shù)據(jù)相關(guān)的其它特征向量來搜索。以上面說明的相應(yīng)方法,布爾算子可用于組合多個(gè)音頻元數(shù)據(jù)類型的搜索。對(duì)于“AND”算子的實(shí)例,可組合音頻元數(shù)據(jù)項(xiàng),以產(chǎn)生合成的元數(shù)據(jù)項(xiàng)。搜索具有最靠近這個(gè)合成項(xiàng)的特征向量的相應(yīng)信息項(xiàng)將標(biāo)識(shí)一個(gè)信息項(xiàng)。當(dāng)指定“OR”算子時(shí),搜索處理器可隨后恢復(fù)在兩個(gè)元數(shù)據(jù)項(xiàng)的陣列內(nèi)的預(yù)定數(shù)量位置內(nèi)的信息項(xiàng)。再者,“NOT”布爾算子將用來從搜索查詢的結(jié)果中排除具有匹配音頻數(shù)據(jù)的返回的信息項(xiàng)。
已經(jīng)提供了精煉從標(biāo)識(shí)的信息項(xiàng)中的搜索的本發(fā)明的實(shí)施例。然而要理解到,在其它實(shí)施例中,可以提供由圖14所示的顯示而形成的搜索查詢以及該搜索查詢相對(duì)于元數(shù)據(jù)、視頻圖像數(shù)據(jù)和音頻數(shù)據(jù)的應(yīng)用,以搜索數(shù)據(jù)中心庫(kù)400內(nèi)的整個(gè)信息集合。
在不脫離本發(fā)明范圍的前提下,可對(duì)上述實(shí)施例進(jìn)行各種修改。本發(fā)明的各方面和特征在所附權(quán)利要求書中定義。
權(quán)利要求
1.一種用于搜索信息項(xiàng)集合并顯示搜索結(jié)果的信息檢索裝置,所述信息項(xiàng)各具有表征信息特征集合,所述裝置包括搜索處理器,可操作用于根據(jù)用戶定義的表征信息特征搜索所述信息項(xiàng),并標(biāo)識(shí)具有與那個(gè)用戶定義的表征信息特征相對(duì)應(yīng)的表征信息特征的信息項(xiàng);映射處理器,可操作用于生成表示來自在所述搜索中標(biāo)識(shí)的信息項(xiàng)集合的信息項(xiàng)映射的數(shù)據(jù),所述映射根據(jù)所述信息項(xiàng)的相互相似性相對(duì)于陣列中的位置提供標(biāo)識(shí)的信息項(xiàng),相似信息項(xiàng)映射到所述陣列中的相似位置;圖形用戶界面,用于顯示至少某些所述標(biāo)識(shí)的信息項(xiàng)的表示;以及用戶控制,用于選擇標(biāo)識(shí)的信息項(xiàng),其中所述搜索處理器可操作用于精煉所述搜索以標(biāo)識(shí)有關(guān)選擇的信息項(xiàng)的信息項(xiàng)。
2.如權(quán)利要求1所述的信息檢索系統(tǒng),其中所述表征信息特征包括描述所述信息項(xiàng)內(nèi)容或?qū)傩缘脑獢?shù)據(jù)。
3.如權(quán)利要求1或2所述的信息檢索系統(tǒng),其中所述用戶控制可操作用于根據(jù)與所述標(biāo)識(shí)項(xiàng)相關(guān)聯(lián)的元數(shù)據(jù)來選擇所述標(biāo)識(shí)的信息項(xiàng),并且所述搜索處理器可操作用于搜索包含相同和/或相似元數(shù)據(jù)的信息項(xiàng)的信息項(xiàng)集合。
4.如上述權(quán)利要求中任一項(xiàng)所述的信息檢索裝置,其中所述搜索處理器可操作用于通過標(biāo)識(shí)來自在來自所述用戶標(biāo)識(shí)的信息項(xiàng)的陣列內(nèi)的預(yù)定數(shù)量位置內(nèi)的集合的信息項(xiàng)來搜索與所述用戶選擇的標(biāo)識(shí)的信息項(xiàng)有關(guān)的信息項(xiàng)集合。
5.如上述權(quán)利要求中任一項(xiàng)所述的信息檢索裝置,其中所述用戶控制可操作用于向用戶提供了選擇多個(gè)標(biāo)識(shí)信息項(xiàng)的便利,并根據(jù)布爾邏輯指定所述標(biāo)識(shí)項(xiàng)之間的搜索關(guān)系。
6.如權(quán)利要求5所述的信息檢索裝置,其中如果布爾算子是“OR”,則所述搜索處理器可操作用于標(biāo)識(shí)來自由各所述用戶選擇的元數(shù)據(jù)項(xiàng)標(biāo)識(shí)的各陣列位置的預(yù)定數(shù)量陣列位置內(nèi)的信息項(xiàng);或者,如果布爾算子是“AND”,則所述搜索處理器可操作用于組合與各所述用戶選擇的信息項(xiàng)相對(duì)應(yīng)的元數(shù)據(jù),并指定來自由組合的元數(shù)據(jù)所標(biāo)識(shí)的陣列位置的預(yù)定數(shù)量陣列位置內(nèi)的信息項(xiàng);或者,如果布爾算子是“NOT”,則所述搜索處理器可操作用于從由所述用戶選擇的元數(shù)據(jù)項(xiàng)標(biāo)識(shí)的陣列位置中排除預(yù)定數(shù)量陣列位置內(nèi)的信息項(xiàng)。
7.如上述權(quán)利要求中任一項(xiàng)所述的信息檢索裝置,其中所述表征信息特征包括表示視頻圖像的數(shù)據(jù),并且所述用戶控制提供了選擇與信息項(xiàng)相關(guān)聯(lián)的視頻幀的便利,所述搜索處理器可操作用于通過將選擇的視頻圖像幀和與各圖像項(xiàng)相關(guān)聯(lián)的代表性圖像幀相比較來搜索所述信息項(xiàng)。
8.如權(quán)利要求7所述的信息檢索裝置,其中根據(jù)與信息項(xiàng)相關(guān)聯(lián)的圖像視頻幀的平均色彩信息內(nèi)容從與所述信息項(xiàng)相關(guān)聯(lián)的視頻圖像幀中選擇所述代表性圖像幀。
9.如權(quán)利要求7或8所述的信息檢索裝置,其中所述搜索處理器可操作用于通過標(biāo)識(shí)具有帶有相同和/或相似色彩信息的代表性視頻圖像的信息項(xiàng)來搜索與選擇的代表性視頻圖像幀有關(guān)的信息項(xiàng)。
10.如權(quán)利要求7、8或9所述的信息檢索裝置,其中所述用戶控制可操作用于向用戶提供了從標(biāo)識(shí)的信息項(xiàng)中選擇多個(gè)視頻圖像幀以形成搜索查詢的便利,并根據(jù)布爾邏輯算子指定選擇的視頻幀之間的搜索關(guān)系。
11.如權(quán)利要求10所述的信息檢索裝置,其中如果布爾算子是“OR”,則所述搜索處理器可操作用于用在各所述用戶選擇的圖像幀的預(yù)定距離內(nèi)的色彩直方圖來標(biāo)識(shí)具有代表性圖像幀的信息項(xiàng);或者,如果布爾算子是“AND”,則所述搜索處理器可操作用于組合各所述用戶選擇的信息項(xiàng)的色彩直方圖,并用組合的色彩直方圖的預(yù)定距離內(nèi)的色彩直方圖來標(biāo)識(shí)具有代表性圖像幀的信息項(xiàng);或者,如果布爾算子是“NOT”,則所述搜索處理器可操作用于用所述用戶選擇的視頻圖像幀的預(yù)定距離內(nèi)的色彩直方圖來排除具有代表性視頻圖像幀的信息項(xiàng)。
12.如上述權(quán)利要求中任一項(xiàng)所述的信息檢索裝置,其中所述表征信息特征包括表示音頻信號(hào)的數(shù)據(jù),并且所述用戶控制提供了這樣的便利根據(jù)描述所述音頻信號(hào)內(nèi)容或?qū)傩缘囊纛l數(shù)據(jù)或音頻元數(shù)據(jù)中的至少一種,來選擇信息項(xiàng)以形成搜索查詢。
13.如權(quán)利要求12所述的信息檢索裝置,其中所述搜索處理器可操作用于通過標(biāo)識(shí)具有相同和/或相似音頻數(shù)據(jù)的信息項(xiàng)來搜索與選擇的音頻數(shù)據(jù)有關(guān)的信息項(xiàng)。
14.如權(quán)利要求12或13所述的信息檢索裝置,其中所述用戶控制可操作用于向用戶提供了從標(biāo)識(shí)的信息項(xiàng)中選擇多個(gè)音頻數(shù)據(jù)以形成搜索查詢的便利,并根據(jù)布爾邏輯算子指定所述選擇的音頻數(shù)據(jù)之間的搜索關(guān)系。
15.如權(quán)利要求14所述的信息檢索裝置,其中如果布爾算子是“OR”,則所述搜索處理器可操作用于標(biāo)識(shí)來自由特征向量所標(biāo)識(shí)的各陣列位置的預(yù)定數(shù)量陣列位置內(nèi)的信息項(xiàng),其中所述特征向量從與各選擇的信息項(xiàng)相關(guān)聯(lián)的音頻元數(shù)據(jù)形成的;或者,如果布爾算子是“AND”,則所述搜索處理器可操作用于組合與各所述用戶選擇的信息項(xiàng)相對(duì)應(yīng)的所述音頻元數(shù)據(jù),并標(biāo)識(shí)來自由與組合的音頻元數(shù)據(jù)相對(duì)應(yīng)的特征向量所標(biāo)識(shí)的陣列位置的預(yù)定數(shù)量陣列位置內(nèi)的信息項(xiàng);或者,如果布爾算子是“NOT”,則所述搜索處理器可操作用于從由與所述用戶選擇的信息項(xiàng)相關(guān)聯(lián)的特征向量所標(biāo)識(shí)的陣列位置中排除預(yù)定數(shù)量陣列位置內(nèi)的信息項(xiàng)。
16.一種搜索信息項(xiàng)集合并顯示搜索結(jié)果的方法,所述信息項(xiàng)各具有表征信息特征集合,所述方法包括根據(jù)用戶定義的表征信息特征來搜索所述信息項(xiàng);生成表示來自在所述搜索中標(biāo)識(shí)的信息項(xiàng)集合的信息項(xiàng)映射的數(shù)據(jù),所述映射根據(jù)所述信息項(xiàng)的相互相似性相對(duì)于陣列中的位置提供所述標(biāo)識(shí)的信息項(xiàng),相似信息項(xiàng)映射到所述陣列中的相似位置;標(biāo)識(shí)具有與所述用戶定義的信息特征相對(duì)應(yīng)的表征信息特征的信息項(xiàng)在所述陣列中的位置;顯示至少某些所述標(biāo)識(shí)項(xiàng)的表示;選擇標(biāo)識(shí)的信息項(xiàng);精煉所述搜索,以標(biāo)識(shí)與所述選擇的信息項(xiàng)有關(guān)的信息項(xiàng)。
17.如權(quán)利要求16所述的搜索方法,其中所述表征信息特征包括描述所述信息項(xiàng)內(nèi)容或?qū)傩缘脑獢?shù)據(jù)。
18.如權(quán)利要求16或17所述的搜索方法,其中選擇所述標(biāo)識(shí)的信息項(xiàng)包括根據(jù)與所述標(biāo)識(shí)項(xiàng)相關(guān)聯(lián)的元數(shù)據(jù)來選擇所述標(biāo)識(shí)的信息項(xiàng);以及搜索包含相同和/或相似元數(shù)據(jù)的信息項(xiàng)的信息項(xiàng)集合。
19.如權(quán)利要求18所述的搜索方法,其中搜索所述標(biāo)識(shí)的信息項(xiàng)包括通過標(biāo)識(shí)來自在來自對(duì)應(yīng)于所述用戶選擇的元數(shù)據(jù)的所述用戶標(biāo)識(shí)的信息項(xiàng)的預(yù)定數(shù)量位置內(nèi)的集合的信息項(xiàng),來選擇有關(guān)與所述用戶選擇的信息項(xiàng)相關(guān)聯(lián)的元數(shù)據(jù)的信息項(xiàng)集合。
20.如權(quán)利要求16-19中任一項(xiàng)所述的搜索方法,其中選擇所述標(biāo)識(shí)的信息項(xiàng)包括向用戶提供選擇多個(gè)標(biāo)識(shí)的信息項(xiàng)的便利;以及根據(jù)布爾邏輯指定所述標(biāo)識(shí)項(xiàng)之間的搜索關(guān)系。
21.如權(quán)利要求20所述的搜索方法,其中搜索所述標(biāo)識(shí)的信息項(xiàng)包括如果布爾算子是“OR”,則標(biāo)識(shí)來自由各所述用戶選擇的元數(shù)據(jù)項(xiàng)標(biāo)識(shí)的陣列位置的預(yù)定數(shù)量陣列位置內(nèi)的信息項(xiàng);或者,如果布爾算子是“AND”,則組合與各所述用戶選擇的信息項(xiàng)相對(duì)應(yīng)的元數(shù)據(jù),并標(biāo)識(shí)來自由各所述用戶選擇的元數(shù)據(jù)項(xiàng)所標(biāo)識(shí)的陣列位置的預(yù)定數(shù)量陣列位置內(nèi)的信息項(xiàng);或者,如果布爾算子是“NOT”,則從由所述用戶選擇的元數(shù)據(jù)項(xiàng)標(biāo)識(shí)的陣列位置中排除預(yù)定數(shù)量陣列位置內(nèi)的信息項(xiàng)。
22.如權(quán)利要求16-22中任一項(xiàng)所述的搜索方法,其中所述表征信息特征包括表示視頻圖像的數(shù)據(jù),并且選擇所述標(biāo)識(shí)的信息項(xiàng)包括提供根據(jù)來自與各所述信息項(xiàng)相關(guān)聯(lián)的視頻圖像的代表性圖像幀來選擇信息項(xiàng)的便利;以及通過標(biāo)識(shí)具有帶有相同和/相似色彩信息的代表性視頻圖像的信息項(xiàng),來搜索與選擇的代表性視頻圖像幀有關(guān)的信息項(xiàng)。
23.如權(quán)利要求16-22中任一項(xiàng)所述的搜索方法,其中所述表征信息特征包括表示音頻信號(hào)的數(shù)據(jù),并且選擇所述標(biāo)識(shí)的信息項(xiàng)包括提供根據(jù)描述所述音頻信號(hào)內(nèi)容或?qū)傩缘囊纛l數(shù)據(jù)或音頻元數(shù)據(jù)中的至少一種來選擇信息項(xiàng)的便利;以及通過標(biāo)識(shí)具有相同和/或相似音頻數(shù)據(jù)的信息項(xiàng),來搜索與所述選擇的音頻數(shù)據(jù)有關(guān)的信息項(xiàng)。
24.一種用于指定搜索信息項(xiàng)集合的搜索查詢的圖形用戶界面,所述信息項(xiàng)各具有表征信息特征集合,所述界面包括場(chǎng)的行,各場(chǎng)提供從所述信息項(xiàng)集合中選擇信息項(xiàng)的便利,各行根據(jù)與該行相關(guān)聯(lián)的表征信息特征的不同類型來定義形成搜索查詢的搜索條件。
25.如權(quán)利要求24所述的圖形用戶界面,其中可為每行選擇多個(gè)信息項(xiàng),并且如果在每行提供多個(gè)信息特征,則根據(jù)用戶指定的布爾算子來組合所述搜索查詢的條件。
26.如權(quán)利要求24或25所述的圖形用戶界面,其中所述表征信息特征是元數(shù)據(jù)、視頻圖像和音頻元數(shù)據(jù)中的至少一種。
27.一種信息檢索裝置,基本上如在上文參考附圖所描述的。
28.一種信息檢索方法,基本上如在上文參考所述附圖描述的。
29.計(jì)算機(jī)軟件,具有用于執(zhí)行如權(quán)利要求16-23中任一項(xiàng)所述的方法的程序代碼。
30.一種提供媒體,用于提供如權(quán)利要求29所述的程序代碼。
31.如權(quán)利要求30所述的媒體,所述媒體是存儲(chǔ)媒體。
32.如權(quán)利要求31所述的媒體,所述媒體是傳輸媒體。
全文摘要
一種用于搜索信息項(xiàng)集合并顯示搜索結(jié)果的信息檢索裝置,該信息項(xiàng)各具有表征信息特征的集合。該裝置包括搜索處理器,該搜索處理器可操作用于根據(jù)用戶定義的表征信息特征來搜索信息項(xiàng),并標(biāo)識(shí)具有與那個(gè)用戶定義的表征信息特征相對(duì)應(yīng)的表征信息特征的信息項(xiàng)。映射處理器可操作用于生成表示來自在搜索中標(biāo)識(shí)的信息項(xiàng)集合的信息項(xiàng)映射的數(shù)據(jù)。該映射根據(jù)信息項(xiàng)的相互相似性相對(duì)于陣列中的位置提供標(biāo)識(shí)的信息項(xiàng),相似信息項(xiàng)映射到陣列中的相似位置。該裝置包括用于顯示至少某些標(biāo)識(shí)項(xiàng)的表示的圖形用戶界面,以及用于選擇標(biāo)識(shí)信息項(xiàng)的用戶控制。搜索處理器可操作用于精煉搜索,以標(biāo)識(shí)與選擇的信息項(xiàng)相關(guān)的信息項(xiàng)。同樣,給用戶提供了這樣的便利通過相對(duì)于如在相互相似的陣列內(nèi)的位置顯示的項(xiàng)而標(biāo)識(shí)期望的信息項(xiàng)來精煉搜索。由此,搜索與導(dǎo)航大量數(shù)據(jù)變得更加容易了。
文檔編號(hào)G06F17/30GK1717685SQ200380104487
公開日2006年1月4日 申請(qǐng)日期2003年11月4日 優(yōu)先權(quán)日2002年11月27日
發(fā)明者D·W·特雷佩斯, J·R·托爾普 申請(qǐng)人:索尼英國(guó)有限公司