專(zhuān)利名稱:信息分類(lèi)裝置以及信息檢索裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及將大量的信息按其內(nèi)容或?qū)傩苑诸?lèi)到多個(gè)類(lèi)別的信息 分類(lèi)裝置,以及基于被分類(lèi)的類(lèi)別來(lái)檢索信息的信息檢索裝置。
背景技術(shù):
近些年,隨著信息的多樣化以及記憶媒介的大容量化,個(gè)人管理 的信息的數(shù)量變得龐大的情況也不少,因此能夠?qū)⒋罅康男畔⒒谄?內(nèi)容有效地進(jìn)行檢索的信息檢索裝置變得越來(lái)越重要。在信息檢索裝 置中有各種各樣的用于確定用戶欲進(jìn)行檢索的信息的方式。以往,一 般采用的方式有指定用于檢索的關(guān)鍵字的"關(guān)鍵字指定方式"、對(duì)以 一覽顯示信息時(shí)的模式進(jìn)行指定的"排序模式指定方式"、從一覽選擇 顯示信息的內(nèi)容的類(lèi)別的"類(lèi)別選擇方式"。
關(guān)鍵字指定方式是對(duì)用戶欲檢索的信息本身所包含的短語(yǔ)、或作 為標(biāo)記被附加于欲檢索的信息(檢索目標(biāo)信息)的短語(yǔ),即估計(jì)并輸 入關(guān)鍵字的方式。此時(shí),若輸入的關(guān)鍵字比較恰當(dāng),則能夠非??焖?地得到目的信息。但是,有這樣的情況,目卩因?yàn)橥ǔjP(guān)鍵字有好幾 種說(shuō)法,所以對(duì)照不出來(lái),或即使對(duì)照出來(lái)了,但是符合的信息的量 太大而導(dǎo)致在細(xì)査上花費(fèi)時(shí)間。也就是說(shuō),估計(jì)恰當(dāng)?shù)年P(guān)鍵字是困難 的,用戶不得不使用試湊法,因此未必就能夠進(jìn)行有效的檢索。
并且,以一覽顯示信息時(shí)選擇排序模式的排序模式指定方式是 用戶通過(guò)從信息作成時(shí)間順序或標(biāo)題的五十音圖順序等幾種預(yù)備的排 序模式中任意地選擇排序模式,從而對(duì)信息一覽表中的信息進(jìn)行排序。 該排序模式指定方式,若一覽表所包含的信息變多,則在任何一個(gè)排 序模式中都不會(huì)出現(xiàn)在前位的信息也變多,因此不能進(jìn)行有效的檢索
的情況也變多。
對(duì)此,作為即使在想不起恰當(dāng)?shù)年P(guān)鍵字的情況下也能夠檢索大量 的信息的方式,有下述的方式,S卩將信息分類(lèi)到基于內(nèi)容的意義的 距離整理成為分層結(jié)構(gòu)的類(lèi)別群,通過(guò)用戶逐層選擇類(lèi)別來(lái)縮小信息 的范圍的"類(lèi)別選擇方式"。該類(lèi)別選擇方式,根據(jù)用戶所有的信息或 指定為檢索對(duì)象范圍的信息,能夠有效地進(jìn)行檢索的類(lèi)別構(gòu)成不同。 因此,提出的方案是按用戶所有的信息或指定為檢索對(duì)象范圍的信 息,自動(dòng)地構(gòu)成類(lèi)別分層結(jié)構(gòu)的技術(shù)方案(例如,參照專(zhuān)利文獻(xiàn)l、 2 以及3)。
在上述專(zhuān)利文獻(xiàn)1中提出的方案是通過(guò)對(duì)預(yù)先準(zhǔn)備的構(gòu)成分層 結(jié)構(gòu)的類(lèi)別分別設(shè)定重要度,并僅選擇重要度大的類(lèi)別,從而在有限 的畫(huà)面內(nèi)提示適合用戶的類(lèi)別的方案。并且,在專(zhuān)利文獻(xiàn)2中提出的 方案是對(duì)于從文本抽出的關(guān)鍵字基于其意義關(guān)系進(jìn)行分群
(clustering),從而生成顯示主題的類(lèi)別,并以用戶能夠?qū)ζ溥M(jìn)行選 擇的分層圖的形式來(lái)提示的方案。
而在這些類(lèi)別的分層結(jié)構(gòu)的自動(dòng)構(gòu)成技術(shù)中,所生成的類(lèi)別的大 小(該類(lèi)別所包含的信息的數(shù)量)有大的偏差,分類(lèi)結(jié)果的一覽性變
差。為此,課題是從類(lèi)別內(nèi)找出檢索目標(biāo)的信息、或?yàn)榱丝s小信息
的范圍而選擇類(lèi)別,所需要的操作量或勞力增大。也就是說(shuō),若類(lèi)別 過(guò)大,則即使選擇該類(lèi)別來(lái)縮小了信息的范圍,但是在其下面仍包含 大量的信息,因此找到檢索目標(biāo)的信息比較困難。相反,若類(lèi)別過(guò)小,
則問(wèn)題是為了將所有的信息各自分類(lèi)到某一個(gè)類(lèi)別需要大量的類(lèi)別, 因此選擇類(lèi)別其本身就很困難。對(duì)于該課題,在專(zhuān)利文獻(xiàn)3中提出的 方案是基于信息的意義的距離來(lái)生成類(lèi)別的分層結(jié)構(gòu)之后,基于各 類(lèi)別的大小等計(jì)算分?jǐn)?shù),決定分?jǐn)?shù)總計(jì)最大的層,從該層采用所定數(shù) 量的、分?jǐn)?shù)大的類(lèi)別,以減小向用戶提示的類(lèi)別的大小的偏差的方法。 以往的類(lèi)別分層結(jié)構(gòu)自動(dòng)生成技術(shù)中,以基于類(lèi)別之間的意義的 距離來(lái)構(gòu)成的分層結(jié)構(gòu)為基礎(chǔ),因此同一層內(nèi)向用戶提示的類(lèi)別的抽
象度、即類(lèi)別所指示的概念的范圍一致。在上述構(gòu)成的分類(lèi)結(jié)構(gòu)中, 對(duì)于圖書(shū)館或商品目錄等為了滿足眾人的要求而廣泛收集的信息,可 期待類(lèi)別的抽象度和類(lèi)別的大小之間具有一定程度的相關(guān)性。因此, 可考慮通過(guò)類(lèi)別的抽象度保持一致,以充分減小類(lèi)別的大小的偏差。
然而,對(duì)于基于用戶的嗜好或興趣來(lái)收集的信息,需要考慮因用 戶的嗜好或興趣而產(chǎn)生的信息的偏差。也就是說(shuō),越是用戶具有強(qiáng)烈 的嗜好或興趣的領(lǐng)域,所收集的信息也越多,因此若要保持類(lèi)別的抽 象度一致,則容納用戶具有強(qiáng)烈的嗜好或興趣的領(lǐng)域的信息的類(lèi)別比 容納除此以外的信息的類(lèi)別大出太多。以下,對(duì)此進(jìn)行詳細(xì)的說(shuō)明。
圖1是示出使用戶選擇類(lèi)別時(shí)的用戶界面的例子的圖。在此,設(shè)
想用戶對(duì)足球具有強(qiáng)烈的興趣的情況。首先,如圖l(A)所示,"地面波 電影"、"BS (broadcasting satellite:廣播衛(wèi)星)電影"、"電視劇"、
"體育"等體裁與屬于各體裁的節(jié)目數(shù)"5"、 "24"、 "12"、 "37" — 起被提示。在此狀態(tài)下,若用戶選擇"體育",則如圖1(B)所示,屬于 體育的輔體裁"棒球"、"足球"、"高爾夫球"等被提示。在此,屬于
"足球"的節(jié)目的數(shù)量為30,而屬于"棒球"的節(jié)目的數(shù)量為1,屬 于"高爾夫球"的節(jié)目數(shù)量為0。也就是說(shuō),容納用戶具有強(qiáng)烈的嗜好 或興趣的領(lǐng)域的信息的類(lèi)別比容納除此以外的信息的類(lèi)別大出太多。
根據(jù)上述內(nèi)容顯而易見(jiàn),以往的使類(lèi)別的抽象度一致的類(lèi)別分層 結(jié)構(gòu)自動(dòng)生成技術(shù),不能避免因用戶的嗜好或興趣的強(qiáng)弱而致的信息 集中在特定的類(lèi)別的情況,在檢索時(shí)不能充分地縮小信息的范圍。為 此,存在的課題是不得不從大量的信息中尋找檢索目標(biāo)的信息,或 為了縮小信息的范圍而不得不選擇大量的類(lèi)別,因此不能進(jìn)行高速有 效的檢索。
專(zhuān)利文獻(xiàn)l:日本國(guó)特開(kāi)平09—297770號(hào)公報(bào) 專(zhuān)利文獻(xiàn)2:日本國(guó)特表2001 — 513242號(hào)公報(bào) 專(zhuān)利文獻(xiàn)3:日本國(guó)特開(kāi)2005-63157號(hào)公報(bào)
發(fā)明內(nèi)容
本發(fā)明鑒于上述課題,目的在于提供即使在基于用戶的嗜好或興
趣來(lái)收集了龐大的信息的情況下,也能夠高速地檢索用戶所要的信息
的信息檢索裝置,以及能夠?qū)π畔⑦M(jìn)行有效的分類(lèi)以能夠進(jìn)行高速的
檢索的信息分類(lèi)裝置等。
為了解決上述課題,本發(fā)明所涉及的信息分類(lèi)裝置,對(duì)信息進(jìn)行
分類(lèi),具有信息記憶單元,記錄信息;信息抽出單元,抽出所述信
息記憶單元所記錄的信息的內(nèi)容或?qū)傩?;至少一個(gè)分類(lèi)項(xiàng)目生成單元,
基于所述信息抽出單元所抽出的信息的內(nèi)容或?qū)傩?,生成多個(gè)分類(lèi)項(xiàng)
目;類(lèi)別生成單元,通過(guò)組合一個(gè)以上的所述分類(lèi)項(xiàng)目生成單元所生
成的分類(lèi)項(xiàng)目,從而生成類(lèi)別;類(lèi)別組合覆蓋量計(jì)測(cè)單元,針對(duì)組合
了所定數(shù)量的、所述類(lèi)別生成單元所生成的類(lèi)別的類(lèi)別組合,計(jì)測(cè)類(lèi)
別組合覆蓋量,所述類(lèi)別組合覆蓋量是屬于構(gòu)成該類(lèi)別組合的類(lèi)別中 的至少一個(gè)類(lèi)別的信息的總數(shù);類(lèi)別尺寸計(jì)測(cè)單元,計(jì)測(cè)所述類(lèi)別生
成單元所生成的類(lèi)別的尺寸;類(lèi)別組合探索單元,在所述類(lèi)別組合覆 蓋量計(jì)測(cè)單元所計(jì)測(cè)的類(lèi)別組合覆蓋量與所述信息記憶單元所記錄的 信息的總數(shù)相一致的類(lèi)別組合中,探索所述類(lèi)別尺寸計(jì)測(cè)單元所計(jì)測(cè) 的類(lèi)別的尺寸的平方和為最小的類(lèi)別組合;以及類(lèi)別保持單元,保持 所述類(lèi)別組合探索單元所探索到的類(lèi)別組合。據(jù)此,即使在基于用戶 的嗜好或興趣收集了龐大的信息的情況下,也能生成類(lèi)別之間尺寸的 偏差或所屬于的信息的重復(fù)較少的分類(lèi),其結(jié)果,能夠進(jìn)行將用戶找 到設(shè)定為檢索目標(biāo)的信息為止的操作量(具體而言,從類(lèi)別一覽中選 擇類(lèi)別,并從屬于所選擇的類(lèi)別的信息的一覽中找出并選擇檢索目標(biāo) 信息所用的操作量)抑制到最少的高速的檢索。
在此,也可以是,所述類(lèi)別尺寸計(jì)測(cè)單元,以屬于所述類(lèi)別的信 息的數(shù)量作為所述類(lèi)別的尺寸。據(jù)此,能夠使屬于各類(lèi)別的信息的數(shù) 量均等。
并且,也可以是,所述類(lèi)別尺寸計(jì)測(cè)單元,以依照屬于所述類(lèi)別 的信息的重要度的數(shù)值的和作為所述類(lèi)別的尺寸。據(jù)此,在將信息被
視聽(tīng)的概率采用為所述重要度的情況下,能夠使信息被視聽(tīng)的概率在 類(lèi)別之間均等。
并且,也可以是,所述類(lèi)別生成單元,通過(guò)得出兩個(gè)以上的分類(lèi) 項(xiàng)目的并集,從而生成所述類(lèi)別。據(jù)此,能夠生成容納用戶不具有強(qiáng) 烈的嗜好或興趣的信息的、抽象度高的、大幅匯集的類(lèi)別。
并且,也可以是,所述分類(lèi)項(xiàng)目生成單元,將所屬于的信息的內(nèi) 容或?qū)傩跃哂泄餐纳衔桓拍畹姆诸?lèi)項(xiàng)目彼此匯集而構(gòu)成上位概念共 有組,所述類(lèi)別生成單元,僅限于屬于同一個(gè)所述上位概念共有組的 分類(lèi)項(xiàng)目彼此組合來(lái)生成所述類(lèi)別。據(jù)此,能夠生成容納用戶不具有 強(qiáng)烈的嗜好或興趣的信息的、抽象度高的、大幅匯集的類(lèi)別。
并且,也可以是,所述分類(lèi)項(xiàng)目生成單元,以分層結(jié)構(gòu)構(gòu)成所述 上位概念共有組。據(jù)此,即使在生成抽象度高的、大幅匯集的類(lèi)別的 情況下,也能夠?qū)υ擃?lèi)別進(jìn)行細(xì)分化。
并且,也可以是,所述類(lèi)別生成單元,通過(guò)得出兩個(gè)以上的分類(lèi) 項(xiàng)目的交集,從而生成所述類(lèi)別。據(jù)此,能夠生成容納用戶具有強(qiáng)烈 的嗜好或興趣的信息的、抽象度低的、細(xì)分化的類(lèi)別。
并且,也可以是,所述信息抽出單元,進(jìn)一步,在所述類(lèi)別保持 單元所保持的類(lèi)別組合中存在所屬于的信息超過(guò)所定數(shù)量的類(lèi)別的情 況下,從所述信息記憶單元中僅抽出屬于該類(lèi)別的信息的內(nèi)容或?qū)傩浴?據(jù)此,在所屬于的信息超過(guò)所定數(shù)量的大的類(lèi)別存在的情況下,能夠 將該類(lèi)別細(xì)分化為所定的大小。
并且,也可以是,所述類(lèi)別探索單元,除了組合了所定數(shù)量的、 所述類(lèi)別生成單元所生成的類(lèi)別的類(lèi)別組合之外,還探索以不屬于其 他任何類(lèi)別的全部信息所屬于的"其他"類(lèi)別來(lái)替換該組合中的一個(gè) 類(lèi)別的組合。據(jù)此,能夠向用戶提示"其他"類(lèi)別這一單純且易懂的 類(lèi)別。
并且,也可以是,所述類(lèi)別組合探索單元具有候補(bǔ)類(lèi)別生成部, 從所述類(lèi)別生成單元所生成的類(lèi)別中,探索所述類(lèi)別尺寸計(jì)測(cè)單元所 計(jì)測(cè)的類(lèi)別尺寸在所定的范圍內(nèi)的類(lèi)別,從而生成候補(bǔ)類(lèi)別。據(jù)此, 能夠僅將類(lèi)別尺寸在所定范圍內(nèi)的類(lèi)別設(shè)定為候補(bǔ)類(lèi)別。
并且,也可以是,所述類(lèi)別組合探索單元,還具有候補(bǔ)類(lèi)別組 生成部,針對(duì)所述候補(bǔ)類(lèi)別生成部所生成的候補(bǔ)類(lèi)別,將屬于該候補(bǔ)
類(lèi)別的信息的構(gòu)成相似的類(lèi)別彼此進(jìn)行分組化,從而生成候補(bǔ)類(lèi)別組;
以及候補(bǔ)類(lèi)別組選擇部,選擇所定數(shù)量的、所述候補(bǔ)類(lèi)別組生成部所 生成的候補(bǔ)類(lèi)別組,從而生成候補(bǔ)類(lèi)別組組合,選擇并使所述類(lèi)別保 持單元保持一個(gè)候補(bǔ)類(lèi)別組組合,所述候補(bǔ)類(lèi)別組組合是所述類(lèi)別組 合覆蓋量計(jì)測(cè)單元所計(jì)測(cè)的類(lèi)別信息覆蓋量與所述信息記憶單元所記 錄的信息的總數(shù)相一致的候補(bǔ)類(lèi)別組組合。據(jù)此,能夠?qū)崿F(xiàn)維持類(lèi)別 的大小偏差小的分類(lèi)結(jié)構(gòu),且能夠高速有效地實(shí)現(xiàn)將向用戶提示的類(lèi) 別部分性地與其他類(lèi)別進(jìn)行替換。
并且,也可以是,所述候補(bǔ)類(lèi)別組選擇部,在不存在所述類(lèi)別組 合覆蓋量計(jì)測(cè)單元所計(jì)測(cè)的類(lèi)別組合覆蓋量與所述信息記憶單元所記 錄的信息的總數(shù)相一致的候補(bǔ)類(lèi)別組組合的情況下,選擇所述類(lèi)別組 合覆蓋量為最大的候補(bǔ)類(lèi)別組組合,并生成"其他"類(lèi)別,所述"其 他"類(lèi)別是使所述信息記憶單元所記錄的信息中的、不屬于任何候補(bǔ) 類(lèi)別組的信息所屬于的類(lèi)別,并使所述類(lèi)別保持單元追加保持所述"其 他"類(lèi)別。據(jù)此,能夠向用戶提示"其他"類(lèi)別這一單純且易懂的類(lèi) 別。
并且,也可以是,所述類(lèi)別生成單元,通過(guò)組合不超過(guò)所定數(shù)量 的分類(lèi)項(xiàng)目,從而生成類(lèi)別。據(jù)此,生成復(fù)雜的類(lèi)別,因此,用戶對(duì) 于向用戶提示的類(lèi)別組合的一部分不滿意的情況下,能夠向用戶提示 將該一部分替換為使用戶滿意的類(lèi)別的其他的類(lèi)別組合。
本發(fā)明所涉及的信息檢索裝置,對(duì)信息進(jìn)行檢索,具有信息記 憶單元,記錄信息;信息抽出單元,抽出所述信息記憶單元所記錄的 信息的內(nèi)容或?qū)傩?;至少一個(gè)分類(lèi)項(xiàng)目生成單元,基于所述信息抽出 單元所抽出的信息的內(nèi)容或?qū)傩?,生成多個(gè)分類(lèi)項(xiàng)目;類(lèi)別生成單元, 通過(guò)組合一個(gè)以上的所述分類(lèi)項(xiàng)目生成單元所生成的分類(lèi)項(xiàng)目,從而
生成類(lèi)別;類(lèi)別組合覆蓋量計(jì)測(cè)單元,針對(duì)組合了所定數(shù)量的所述類(lèi) 別生成單元所生成的類(lèi)別的類(lèi)別組合,計(jì)測(cè)類(lèi)別組合覆蓋量,所述類(lèi) 別組合覆蓋量是屬于構(gòu)成該類(lèi)別組合的類(lèi)別中的至少一個(gè)類(lèi)別的信息 的總數(shù);類(lèi)別尺寸計(jì)測(cè)單元,計(jì)測(cè)所述類(lèi)別生成單元所生成的類(lèi)別的 尺寸;類(lèi)別組合探索單元,在所述類(lèi)別組合覆蓋量計(jì)測(cè)單元所計(jì)測(cè)的 類(lèi)別組合覆蓋量與所述信息記憶單元所記錄的信息的總數(shù)相一致的類(lèi) 別組合中,探索所述類(lèi)別尺寸計(jì)測(cè)單元所計(jì)測(cè)的類(lèi)別的尺寸的平方和 為最小的類(lèi)別組合;類(lèi)別保持單元,保持所述類(lèi)別組合探索單元所探 索到的類(lèi)別組合;輸入單元,從用戶接受類(lèi)別的指示;顯示內(nèi)容配置 單元,進(jìn)行配置,以便能夠向用戶提示所述類(lèi)別保持單元所保持的類(lèi) 別組合、以及信息的一方或雙方的一覽,所述信息是屬于通過(guò)所述輸 入單元從用戶接受的類(lèi)別的信息;以及類(lèi)別顯示單元,向用戶提示所 述顯示內(nèi)容配置單元所配置的類(lèi)別組合、以及信息的一方或雙方的一 覽。據(jù)此,即使在基于用戶的嗜好或興趣收集了龐大的信息的情況下, 能夠高速地檢索用戶所要的信息。
另外,本發(fā)明不僅能夠作為裝置或系統(tǒng)來(lái)實(shí)現(xiàn),而且也能夠作為 以所述裝置的具有特征的構(gòu)成要素作為步驟的方法來(lái)實(shí)現(xiàn)。而且,不 言而喻,能夠作為用于使計(jì)算機(jī)執(zhí)行這些步驟的程序來(lái)實(shí)現(xiàn)。并且, 當(dāng)然本發(fā)明的技術(shù)范圍包括包含這樣的程序的軟件產(chǎn)品。
根據(jù)本發(fā)明所涉及的信息分類(lèi)裝置或信息檢索裝置,即使在基于 用戶的嗜好或興趣收集了龐大的信息的情況下,也能夠不受類(lèi)別間的 抽象度的差異的影響,而靈活地將信息分類(lèi)到各層由類(lèi)別間的尺寸的 偏差或所屬于的信息的重復(fù)較少的所定數(shù)量的類(lèi)別構(gòu)成的分層結(jié)構(gòu), 從而將找到用戶設(shè)定為檢索目標(biāo)的信息為止的操作量抑制到最少以能 夠進(jìn)行高速的檢索。
圖l(A)、圖l(B)是示出根據(jù)以往的技術(shù)使用戶選擇類(lèi)別時(shí)的用戶
界面的例子的圖。
圖2是示出實(shí)施例1的信息檢索裝置的使用狀態(tài)的圖。
圖3是示出本發(fā)明的概要的圖。
圖4是概念性地示出本發(fā)明的類(lèi)別生成處理的圖。
圖5是示出實(shí)施例1的信息檢索裝置的功能構(gòu)成的方框圖。
圖6是示出實(shí)施例1的分類(lèi)項(xiàng)目生成方法的具體例子的圖。
圖7是示出實(shí)施例1的類(lèi)別生成部以及類(lèi)別組合探索部的更詳細(xì)
的功能構(gòu)成的方框圖。
圖8是示出由實(shí)施例1的類(lèi)別組合探索部執(zhí)行的處理的流程的流程圖。
圖9是示出由實(shí)施例1的由類(lèi)別生成部執(zhí)行的處理的一個(gè)例子的圖。
圖IO(A)、圖IO(B)是示出實(shí)施例1的使用戶選擇類(lèi)別時(shí)的用戶界 面的例子的圖。
圖11是示出實(shí)施例1的由類(lèi)別生成部執(zhí)行的處理的一個(gè)例子的圖。
圖12是示出實(shí)施例2的信息檢索裝置的功能構(gòu)成的方框圖。 圖13是示出實(shí)施例2的由候補(bǔ)類(lèi)別生成部執(zhí)行的處理的流程的流 程圖。
圖14是示出實(shí)施例2的由候補(bǔ)類(lèi)別組生成部執(zhí)行的處理的流程的 流程圖。
圖15是示出實(shí)施例2的由候補(bǔ)類(lèi)別組選擇部執(zhí)行的處理的流程的 流程圖。
圖16(A) 16(C)是示出實(shí)施例2的變更代表類(lèi)別時(shí)的用戶界面的 例子的圖。 符號(hào)說(shuō)明
10信息記憶部
11信息抽出部
121 12N分類(lèi)項(xiàng)目生成部 13類(lèi)別生成部 14類(lèi)別組合探索部 14 a類(lèi)別組合保持部 14b組合評(píng)價(jià)部 14c最佳類(lèi)別組合保持部 15類(lèi)別尺寸計(jì)測(cè)部 16類(lèi)別組合覆蓋量計(jì)測(cè)部 17類(lèi)別保持部 18顯示內(nèi)容配置部 19類(lèi)別顯示部 20輸入部 100信息檢索裝置 141候補(bǔ)類(lèi)別生成部 142候補(bǔ)類(lèi)別組生成部 143候補(bǔ)類(lèi)別組選擇部 200信息檢索裝置
具體實(shí)施例方式
以下,參照
本發(fā)明所涉及的實(shí)施例。另外,對(duì)于本發(fā)明 利用以下的實(shí)施例以及附圖來(lái)進(jìn)行說(shuō)明,但是這是以舉例為目的,意 圖并不在于將本發(fā)明局限于這些。 (實(shí)施例1)
圖2是示出本實(shí)施例的信息檢索裝置100的使用狀態(tài)的圖。如該 圖所示,本實(shí)施例的信息檢索裝置100能夠作為DVD記錄器來(lái)實(shí)現(xiàn)。 設(shè)定基于用戶的嗜好或興趣收集的信息(例如,運(yùn)動(dòng)圖像數(shù)據(jù)、靜止 圖像數(shù)據(jù)、文本數(shù)據(jù)、樂(lè)曲數(shù)據(jù)、聲音數(shù)據(jù)等)被蓄積在DVD記錄器 中。被蓄積在DVD記錄器中的信息能夠輸出到電視機(jī)300或外部揚(yáng) 聲器400。
圖3是示出本發(fā)明的概要的圖。本發(fā)明有關(guān)類(lèi)別選擇方式的技術(shù), 是使找到目的節(jié)目為止的操作量最少化的技術(shù)。例如,如圖3所示, 存在300個(gè)節(jié)目的情況下,將該300個(gè)節(jié)目按每個(gè)類(lèi)別為50個(gè)節(jié)目 分類(lèi)到6個(gè)類(lèi)別,再將屬于各類(lèi)別的50個(gè)節(jié)目按每個(gè)輔類(lèi)別為10個(gè) 節(jié)目分類(lèi)到5個(gè)輔類(lèi)別。據(jù)此,僅憑選擇2次類(lèi)別就能夠?qū)⒎秶s小 到10個(gè)節(jié)目。在此,重要的是保證類(lèi)別易懂。例如,在將300個(gè)節(jié)目 按每個(gè)類(lèi)別為50個(gè)節(jié)目分類(lèi)到6個(gè)類(lèi)別的情況下,對(duì)于用戶各類(lèi)別也 必須是有意義的類(lèi)別(能夠理解的類(lèi)別)。在此,第一層的類(lèi)別為"足 球/國(guó)外"、"足球/國(guó)內(nèi)"、"足球/高中"、"有關(guān)醫(yī)療"、"綜藝(variety) /閑談(talk)"、"其他"這六個(gè),這些都是有意義的易懂的類(lèi)別。
圖4是概念性地示出生成類(lèi)別的處理的圖。如該圖所示,在本發(fā) 明,使用預(yù)先整理的分類(lèi)項(xiàng)目來(lái)生成類(lèi)別。分類(lèi)項(xiàng)目是指,按共同的 特征匯集的節(jié)目的集合。詳細(xì)情況在下面敘述,若采用兄弟分類(lèi)項(xiàng)目 的并集,則能夠生成大的類(lèi)別,而若采用分類(lèi)項(xiàng)目的交集,則能夠生 成小的類(lèi)別。其結(jié)果,能夠生成節(jié)目數(shù)均等的6個(gè)類(lèi)別。
圖5是示出本實(shí)施例的信息檢索裝置100的功能構(gòu)成的方框圖。 在圖5,信息檢索裝置100是將需要的操作量抑制到最少以能夠進(jìn)行 高速檢索的信息檢索裝置,其包括信息記憶部IO、信息抽出部ll、 分類(lèi)項(xiàng)目生成部121 12N、類(lèi)別生成部13、類(lèi)別組合探索部14、類(lèi) 別尺寸計(jì)測(cè)部15、類(lèi)別組合覆蓋量計(jì)測(cè)部16、類(lèi)別保持部17、顯示 內(nèi)容配置部18、類(lèi)別顯示部19、以及輸入部20。
信息記憶部10是本發(fā)明所涉及的信息記錄單元的一個(gè)例子。也就 是說(shuō),信息記憶部10是各種記錄媒介(例如,硬盤(pán)裝置、閃存、可裝 卸媒介等),其蓄積各種信息(例如,運(yùn)動(dòng)圖像數(shù)據(jù)、靜止圖像數(shù)據(jù)、 文本數(shù)據(jù)、樂(lè)曲數(shù)據(jù)、聲音數(shù)據(jù)等)。以下以信息的種類(lèi)為樂(lè)曲數(shù)據(jù)的 情況為例進(jìn)行說(shuō)明。另外,本發(fā)明不僅適用于僅存在單一的種類(lèi)的信 息的情況,而且也能夠適用于混有多個(gè)種類(lèi)的信息的情況。
信息抽出部11是本發(fā)明所涉及的信息抽出單元的一個(gè)例子。也就
是說(shuō),信息抽出部11從蓄積在信息記憶部10的樂(lè)曲數(shù)據(jù)中,抽出檢
索對(duì)象范圍的樂(lè)曲數(shù)據(jù),該檢索對(duì)象范圍的樂(lè)曲數(shù)據(jù)包含成為檢索目
標(biāo)的樂(lè)曲數(shù)據(jù),并向分類(lèi)項(xiàng)目生成部121 121N輸出。此時(shí),也可以 不是抽出屬于該組的所有的樂(lè)曲數(shù)據(jù),而是僅抽出各樂(lè)曲數(shù)據(jù)的內(nèi)容 或?qū)傩?例如,樂(lè)曲數(shù)據(jù)的標(biāo)題、體裁、演奏者名、作詞者名、或作 曲者名等),并向分類(lèi)項(xiàng)目生成部121 12N輸出。另外,屬性數(shù)據(jù), 能夠從例如樂(lè)曲數(shù)據(jù)的屬性信息數(shù)據(jù)庫(kù)CDDB (Copact Disc Data Base:光盤(pán)數(shù)據(jù)庫(kù))中抽出。
分類(lèi)項(xiàng)目生成部121 12N是本發(fā)明所涉及的分類(lèi)項(xiàng)目生成單元 的一個(gè)例子。也就是說(shuō),分類(lèi)項(xiàng)目生成部121 12N分別基于不同的 觀點(diǎn)(例如,樂(lè)曲數(shù)據(jù)的標(biāo)題、體裁、歌手名、作詞者名、或作曲者 名等),將從信息抽出部11輸入的樂(lè)曲數(shù)據(jù)分類(lèi)到多個(gè)分類(lèi)項(xiàng)目。在 此,允許樂(lè)曲數(shù)據(jù)在分類(lèi)項(xiàng)目間互相重復(fù)。也就是說(shuō),設(shè)定一個(gè)樂(lè)曲 數(shù)據(jù)可以同時(shí)屬于兩個(gè)以上的分類(lèi)項(xiàng)目。
圖6是示出分類(lèi)項(xiàng)目生成方法的具體例子的圖。信息抽出部11抽 出各樂(lè)曲數(shù)據(jù)的屬性數(shù)據(jù)111。各樂(lè)曲的屬性數(shù)據(jù)被附加數(shù)據(jù)ID。如 上所述,作為屬性數(shù)據(jù)的種類(lèi),有標(biāo)題、體裁、演奏者名、作詞者名、 作曲者名、地區(qū)、時(shí)期等。在各屬性數(shù)據(jù)111中,不必所有的種類(lèi)都 存在值,但是至少要有一個(gè)種類(lèi)存在值。由信息抽出部ll抽出的屬性 數(shù)據(jù)111被送到分類(lèi)項(xiàng)目生成部121 12N。各分類(lèi)項(xiàng)目生成部121 12N讀入各樂(lè)曲數(shù)據(jù)的屬性數(shù)據(jù)111,生成恰當(dāng)?shù)姆诸?lèi)項(xiàng)目。在圖6 的情況下,分類(lèi)項(xiàng)目生成部121針對(duì)屬性"體裁"生成分類(lèi)項(xiàng)目。具 體而言,數(shù)據(jù)ID "000001"的樂(lè)曲數(shù)據(jù)的屬性"體裁"為"古典", 因此,如1211所示,生成分類(lèi)項(xiàng)目"古典",并在屬于該分類(lèi)項(xiàng)目的 數(shù)據(jù)表中追加數(shù)據(jù)ID "000001"。分類(lèi)項(xiàng)目生成部122針對(duì)屬性"地 區(qū)"生成分類(lèi)項(xiàng)目。具體而言,數(shù)據(jù)ID "000001"的樂(lè)曲數(shù)據(jù)的屬性 "地區(qū)"為"歐洲",因此,如1221所示,生成分類(lèi)項(xiàng)目"歐洲",并 在屬于該分類(lèi)項(xiàng)目的數(shù)據(jù)表中追加數(shù)據(jù)ID "000001"。
由分類(lèi)項(xiàng)目生成部121 12N生成的分類(lèi)項(xiàng)目被輸出到類(lèi)別生成 部13。類(lèi)別生成部13是本發(fā)明所涉及的類(lèi)別生成單元的一個(gè)例子。 也就是說(shuō),類(lèi)別生成部13通過(guò)選擇一個(gè)分類(lèi)項(xiàng)目、或通過(guò)組合多個(gè)分 類(lèi)項(xiàng)目來(lái)生成各種各樣的類(lèi)別,并將所生成的類(lèi)別向類(lèi)別組合探索部 14輸出。
類(lèi)別組合探索部14是本發(fā)明所涉及的類(lèi)別組合探索單元的一個(gè)例 子。也就是說(shuō),類(lèi)別組合探索部14在使由信息抽出部11抽出的所有 的樂(lè)曲數(shù)據(jù)各自分屬某一個(gè)類(lèi)別的情況下,在預(yù)先規(guī)定的所定數(shù)量(以 下設(shè)定為C個(gè))的類(lèi)別組合中,探索類(lèi)別的大小最為均等的組合。在 此,類(lèi)別的大小(即類(lèi)別尺寸)是指,屬于該類(lèi)別的樂(lè)曲數(shù)據(jù)的數(shù)量。
接著,使用圖7以及圖8對(duì)類(lèi)別組合探索部14生成C個(gè)類(lèi)別的 處理進(jìn)行說(shuō)明。圖7是示出類(lèi)別生成部13以及類(lèi)別組合探索部14的 更詳細(xì)的功能構(gòu)成的方框圖。并且,圖8是示出類(lèi)別組合探索部14的 處理流程的流程圖。
首先初始化類(lèi)別生成部(1) (C)(步驟301)。具體而言,將索引 "i"初始化為"1",該索引"i"示出在應(yīng)該生成的C個(gè)類(lèi)別中正在 調(diào)查的是第幾個(gè)類(lèi)別。類(lèi)別生成部13順序生成組合作為第1 第C個(gè) 類(lèi)別的候補(bǔ),該組合由分類(lèi)項(xiàng)目生成部121 12N輸出的一個(gè)以上M 個(gè)以下的分類(lèi)項(xiàng)目構(gòu)成。在此,設(shè)定在類(lèi)別生成部(i)對(duì)分類(lèi)項(xiàng)目進(jìn) 行組合的處理中,例如如圖9所示,通過(guò)得出共同屬于兩個(gè)以上的分 類(lèi)項(xiàng)目的樂(lè)曲數(shù)據(jù)的集合(對(duì)此稱為"交集"),從而作成比單獨(dú)的分 類(lèi)項(xiàng)目所屬于的樂(lè)曲數(shù)據(jù)少的類(lèi)別。其構(gòu)成也可以是不得出交集, 而是通過(guò)得出屬于兩個(gè)以上的分類(lèi)項(xiàng)目中的任一個(gè)分類(lèi)項(xiàng)目的樂(lè)曲數(shù) 據(jù)的集合(對(duì)此稱為"并集"),從而作成比單獨(dú)的分類(lèi)項(xiàng)目所屬于的 樂(lè)曲數(shù)據(jù)多的類(lèi)別。
然后,調(diào)查類(lèi)別生成部(i)是否到達(dá)終端(步驟302),若未到達(dá)終 端,則從類(lèi)別生成部(i)獲得下一個(gè)分類(lèi)項(xiàng)目的組合,并將其容納在類(lèi) 別組合保持部14a的第i個(gè)位置(步驟S303)。而且,調(diào)查索引i是否
到達(dá)第C個(gè)(步驟S304),若未到達(dá),則將索引i加大l(步驟S305), 重新回到步驟S302。
在上述步驟S304若判斷為索引i到達(dá)第C個(gè)(步驟S304的"是"), 則類(lèi)別組合保持部14a中集齊了一套類(lèi)別組合數(shù)量為C個(gè)的類(lèi)別組 合。
然后,組合評(píng)價(jià)部14b向類(lèi)別組合覆蓋量計(jì)測(cè)部16輸出在類(lèi)別組 合保持部14a保持的類(lèi)別組合,使其計(jì)測(cè)屬于任一個(gè)類(lèi)別的樂(lè)曲數(shù)據(jù) 的總數(shù)(S306)。并且,調(diào)查其總數(shù)是否與由信息抽出部ll抽出的指 定為檢索對(duì)象范圍的樂(lè)曲數(shù)據(jù)的總數(shù)一致(也就是說(shuō),在類(lèi)別組合保 持部14a保持的類(lèi)別組合是否覆蓋指定為檢索對(duì)象范圍的所有的樂(lè)曲 數(shù)據(jù))(S307)。在不一致的情況下,視為不恰當(dāng),將在類(lèi)別組合保持 部14a保持的類(lèi)別組合進(jìn)行廢棄,回到步驟S302調(diào)查下一個(gè)類(lèi)別組 合。另夕卜,在S307,雖然設(shè)定為調(diào)査是否與由信息抽出部ll抽出的 指定為檢索對(duì)象范圍的樂(lè)曲數(shù)據(jù)的總數(shù)一致,但是也可以是調(diào)查是否 與在信息記憶部IO記錄的樂(lè)曲數(shù)據(jù)的總數(shù)一致。
在上述步驟S307判斷為在類(lèi)別組合保持部14a保持的類(lèi)別組合 覆蓋了指定為檢索對(duì)象范圍的所有的樂(lè)曲數(shù)據(jù)的情況下(S307的 "是"),組合評(píng)價(jià)部14b使類(lèi)別尺寸計(jì)測(cè)部15分別計(jì)測(cè)構(gòu)成在類(lèi)別組 合保持部14a保持的類(lèi)別組合的各類(lèi)別的類(lèi)別尺寸,并計(jì)算其平方和 (S308)。并且,調(diào)查在步驟S308計(jì)算的類(lèi)別尺寸的平方和相對(duì)于已 調(diào)查的其他類(lèi)別組合其平方和是否為最小(S309)。其為最小的情況下, 將在類(lèi)別組合保持部14a保持的類(lèi)別組合保持在最佳類(lèi)別組合保持部 14c (S310)。
在上述步驟S302類(lèi)別生成部(i)到達(dá)終端的情況下,調(diào)査索引i是 否指第一個(gè)類(lèi)別(S311),若是指第一個(gè)類(lèi)別,則視為所有的類(lèi)別組合 調(diào)查完畢,結(jié)束工作。若不是指第一個(gè),則對(duì)類(lèi)別生成部(i)進(jìn)行初始 化,指示從第一個(gè)類(lèi)別開(kāi)始重新輸出(S312),為了替換第(i-l)個(gè) 類(lèi)別作成下一個(gè)類(lèi)別組合,因此使索引i減小l (S313),并回到步驟
302。
在結(jié)束了以上的處理的時(shí)刻,類(lèi)別組合探索部14向類(lèi)別保持部 17輸出在最佳類(lèi)別組合保持部14c保持的類(lèi)別組合并使類(lèi)別保持部17 對(duì)其進(jìn)行保持。屬于構(gòu)成在此保持的類(lèi)別組合的各類(lèi)別的樂(lè)曲數(shù)據(jù)的 數(shù)量比所定數(shù)量多的情況下,類(lèi)別保持部17指示信息抽出部11,使 屬于各類(lèi)別的樂(lè)曲數(shù)據(jù)成為新的檢索對(duì)象范圍。之后,通過(guò)重復(fù)上述 處理,從而在類(lèi)別保持部17容納將各類(lèi)別更加細(xì)分化的類(lèi)別組合。據(jù) 此,在類(lèi)別保持部17保持各層分別由C個(gè)類(lèi)別來(lái)構(gòu)成的分層結(jié)構(gòu)。
另外,不必每次用戶開(kāi)始檢索都執(zhí)行這種類(lèi)別分層結(jié)構(gòu)生成處理。 例如,也可以是,生成了一次分層結(jié)構(gòu)后,僅在信息記憶部10記憶的 樂(lè)曲數(shù)據(jù)發(fā)生了一定數(shù)以上的變更(對(duì)樂(lè)曲數(shù)據(jù)進(jìn)行追加、刪除、屬 性變更)時(shí),才執(zhí)行。并且,也可以是,在不能檢知在信息記憶部10 記憶的樂(lè)曲數(shù)據(jù)發(fā)生了變更的情況下,生成分層結(jié)構(gòu)之后,每隔一段 時(shí)間執(zhí)行。
其次,顯示內(nèi)容配置部18是本發(fā)明所涉及的顯示內(nèi)容配置單元的 一個(gè)例子。也就是說(shuō),顯示內(nèi)容配置部18進(jìn)行配置,以能夠從保持在 類(lèi)別保持部17的類(lèi)別組合中讀出并一覽最上層的C個(gè)類(lèi)別。類(lèi)別顯示 部19是本發(fā)明所涉及的類(lèi)別顯示單元的一個(gè)例子。也就是說(shuō),類(lèi)別顯 示部19顯示被配置的C個(gè)類(lèi)別,使用戶能夠選擇該C個(gè)類(lèi)別中的至 少一個(gè)類(lèi)別。
圖IO(A)是示出類(lèi)別組合的配置的例子的圖。在圖IO(A),示出在 類(lèi)別保持部17保持的類(lèi)別組合為"Classic" "JazznEnr叩e"等, 且作為用戶選擇的類(lèi)別"Classic"被反色顯示的情況。如此這般,若 輸入部20從用戶接受選擇類(lèi)別變更指示,則顯示內(nèi)容配置部18基于 該選擇類(lèi)別變更指示來(lái)變更類(lèi)別。
另外,如圖IO(A)所示,不僅是類(lèi)別組合,屬于當(dāng)前被選擇的類(lèi)別 "Classic"的樂(lè)曲數(shù)據(jù)"1st Symphony" "17th Piano Quartet" (此時(shí),第7首 第50首未被顯示)也可以以一覽的形式來(lái)顯示。據(jù)
此,用戶易于理解所選擇的類(lèi)別的內(nèi)容。而且,也可以是,與類(lèi)別的
名稱一同顯示屬于該類(lèi)別的樂(lè)曲數(shù)據(jù)的數(shù)量。例如,圖IO(A)的 "Classic(50)"示出屬于"Classic"的樂(lè)曲數(shù)據(jù)的數(shù)量為50首。據(jù) 此,用戶易于掌握通過(guò)選擇該類(lèi)別能夠?qū)?lè)曲數(shù)據(jù)的范圍縮小到何種 程度。
然后,顯示內(nèi)容配置部18基于輸入部20從用戶接受的類(lèi)別細(xì)分 化指示,從類(lèi)別保持部17獲得對(duì)當(dāng)前被選擇的類(lèi)別進(jìn)行了細(xì)分化的下 層的類(lèi)別組合。然后,顯示內(nèi)容配置部18將所獲得的下層的類(lèi)別組合 配置為用戶能夠一覽,并將所配置的類(lèi)別組合顯示在類(lèi)別顯示部19, 來(lái)向用戶提示。據(jù)此,用戶能夠分層選擇類(lèi)別,迅速地將范圍縮小到 少數(shù)的樂(lè)曲數(shù)據(jù)。
圖IO(B)是示出顯示內(nèi)容配置部18的類(lèi)別組合的配置的例子的 圖。在圖IO(B),示出類(lèi)別保持部17新保持的類(lèi)別組合為"Opera" "others"、且用戶選擇的類(lèi)別"Symphony"被反色顯示的情況。并 且,與圖IO(A)相同,屬于被選擇的類(lèi)別"Symphony"的樂(lè)曲數(shù)據(jù)"lst Symphony" "6th Symphony"被并行配置。
另外,如圖10(B)所示,也可以并行配置細(xì)分化前的(上層的)的 類(lèi)別組合"Classic" "Jazz門(mén)Eur叩e"。據(jù)此,因?yàn)檫x擇履歷一目 了然,所以用戶易于進(jìn)行對(duì)上層類(lèi)別的重新選擇等類(lèi)別探索工作。
根據(jù)此構(gòu)成,即使蓄積在信息記憶部11的樂(lè)曲數(shù)據(jù)是基于用戶的 嗜好或興趣來(lái)收集的樂(lè)曲數(shù)據(jù),也可將其分類(lèi)整理到由各層的類(lèi)別的 大小最接近于均等的類(lèi)別來(lái)構(gòu)成的分層結(jié)構(gòu)。為此,能夠?qū)崿F(xiàn)這樣一
種信息檢索裝置能夠使用戶找到設(shè)定為檢索目標(biāo)的樂(lè)曲數(shù)據(jù)為止的、
作為選擇項(xiàng)被提示的類(lèi)別或樂(lè)曲數(shù)據(jù)的數(shù)量的期待值最小化,以能夠 使用戶高速地檢索檢索目標(biāo)的樂(lè)曲數(shù)據(jù)。
另外,雖然在上述說(shuō)明中,類(lèi)別尺寸計(jì)測(cè)部15在計(jì)測(cè)類(lèi)別的大小 時(shí),使用了屬于該類(lèi)別的樂(lè)曲數(shù)據(jù)的數(shù)量,但是也可以使用按照屬于 該類(lèi)別的信息的重要度的數(shù)值的和。例如,在各樂(lè)曲數(shù)據(jù)成為檢索目
標(biāo)的概率不一致且能夠估計(jì)該概率分布的情況下,也可以使用各樂(lè)曲 數(shù)據(jù)成為檢索目標(biāo)的概率的估計(jì)值在該類(lèi)別內(nèi)的累積值。此時(shí),能夠 以更少的選擇項(xiàng)數(shù)來(lái)檢索容易檢索的樂(lè)曲數(shù)據(jù)。
而且,在上述的說(shuō)明中,雖然設(shè)定類(lèi)別生成部13的類(lèi)別生成部 (1) (C)對(duì)由分類(lèi)項(xiàng)目生成部121 12N生成的分類(lèi)項(xiàng)目能夠任意地 進(jìn)行組合,但是本發(fā)明并不局限于此。例如,如圖11所示,以下述方 式構(gòu)成對(duì)于由分類(lèi)項(xiàng)目生成部121 12N生成的分類(lèi)項(xiàng)目,以屬于 該分類(lèi)項(xiàng)目的樂(lè)曲數(shù)據(jù)的內(nèi)容或?qū)傩跃哂泄餐纳衔桓拍畹姆诸?lèi)項(xiàng)目 彼此來(lái)構(gòu)成上位概念共有組,并分層化,各自形成一個(gè)樹(shù)形結(jié)構(gòu)。而 且,在類(lèi)別生成部(1) (C)對(duì)分類(lèi)項(xiàng)目進(jìn)行組合的情況下,可得出以樹(shù) 形結(jié)構(gòu)構(gòu)成具有共同的父節(jié)點(diǎn)的分類(lèi)項(xiàng)目彼此的并集,即共有上位概 念的分類(lèi)項(xiàng)目彼此(例如,在圖11共有共同的父節(jié)點(diǎn)即分類(lèi)項(xiàng)目
"Jazz"的分類(lèi)項(xiàng)目"Swingjazz" 分類(lèi)項(xiàng)目"SmoothJazz"等) 的并集。據(jù)此,能夠?qū)︻?lèi)別生成部(1) (C)生成的類(lèi)別進(jìn)行限定,使其 成為互有關(guān)聯(lián)的分類(lèi)項(xiàng)目的上位概念,能夠使類(lèi)別組合探索部14生成 的類(lèi)別容易被用戶理解。
而且,雖然在上述的說(shuō)明中,設(shè)定組合評(píng)價(jià)部14b對(duì)由從類(lèi)別生 成部13獲得的C個(gè)類(lèi)別構(gòu)成的類(lèi)別組合進(jìn)行評(píng)價(jià),但是本發(fā)明并不局 限于此。例如,也可以是,對(duì)于將構(gòu)成各類(lèi)別組合的類(lèi)別中的一個(gè)類(lèi) 別,例如,將在類(lèi)別保持部14a被第C個(gè)容納的類(lèi)別,以"其他"類(lèi) 別來(lái)進(jìn)行替換而致的類(lèi)別組合,同樣由組合評(píng)價(jià)部14進(jìn)行評(píng)價(jià),所述
"其他"類(lèi)別是不屬于余下的(C一l)個(gè)類(lèi)別的任何一個(gè)類(lèi)別的樂(lè)曲 數(shù)據(jù)所屬于的類(lèi)別。據(jù)此,即使萬(wàn)一存在不屬于任何一個(gè)分類(lèi)項(xiàng)目的 樂(lè)曲數(shù)據(jù),其至少也會(huì)屬于"其他"類(lèi)別。由此,除了變得能夠更確 實(shí)地找到恰當(dāng)?shù)念?lèi)別組合之外,還會(huì)有組合了非常多的分類(lèi)項(xiàng)目的復(fù) 雜的類(lèi)別被"其他"類(lèi)別替換,因此能夠使類(lèi)別組合更單純更易于理 解。
而且,如圖8的流程圖所示,雖然在類(lèi)別組合探索部14的類(lèi)別組
合探索處理使用了對(duì)能夠進(jìn)行探索的所有的類(lèi)別組合進(jìn)行探索的全探 索運(yùn)算規(guī)則,但是本發(fā)明并不局限于此。例如,也可以是,在覆蓋檢 索對(duì)象范圍的所有的信息這一制約下,作為對(duì)使類(lèi)別尺寸的平方和最 小化的類(lèi)別組合進(jìn)行探索這一組合最恰當(dāng)化問(wèn)題來(lái)掌握,并進(jìn)行探索 處理。此時(shí),也可以是,利用例如"西川工L一、三宮信夫、茨木俊
秀著'巖波講座情報(bào)科學(xué)19最適化'巖波書(shū)店1982年"所記載的 分支界限法或近似解法等眾所周知的運(yùn)算規(guī)則,來(lái)進(jìn)行類(lèi)別組合探索 處理的高速化。 (實(shí)施例2)
圖12是示出實(shí)施例2的信息檢索裝置200的功能構(gòu)成的方框圖。 在圖12,對(duì)于與上述實(shí)施例1的圖5具有相同的功能的構(gòu)成要素使用 相同的符號(hào),對(duì)其省略說(shuō)明。并且,作為進(jìn)行處理的信息的一個(gè)例子, 與實(shí)施例1相同以樂(lè)曲數(shù)據(jù)為例進(jìn)行說(shuō)明。
信息檢索裝置200是實(shí)現(xiàn)維持類(lèi)別的大小偏差小的分類(lèi)結(jié)構(gòu),并 高速有效地將向用戶提示的類(lèi)別部分性地與其他類(lèi)別進(jìn)行替換的裝 置,其包括信息記憶部IO、信息抽出部ll、分類(lèi)項(xiàng)目生成部121 12N、類(lèi)別生成部13、候補(bǔ)類(lèi)別生成部141、候補(bǔ)類(lèi)別組生成部142、 候補(bǔ)類(lèi)別組選擇部143、類(lèi)別尺寸計(jì)測(cè)部15、類(lèi)別組合覆蓋量計(jì)測(cè)部 16、類(lèi)別保持部17、顯示內(nèi)容配置部18、類(lèi)別顯示部19、以及輸入 部20。
與所述實(shí)施例1相同,類(lèi)別生成部13通過(guò)對(duì)由分類(lèi)項(xiàng)目生成部 121 12N生成的分類(lèi)項(xiàng)目進(jìn)行組合來(lái)生成類(lèi)別。在此,候補(bǔ)類(lèi)別生成 部141順序讀入由類(lèi)別生成部13生成的類(lèi)別,選出滿足可成為最終向 用戶提示的類(lèi)別的條件的類(lèi)別,并作為候補(bǔ)類(lèi)別輸出。"可成為最終向 用戶提示的類(lèi)別的條件"是指,所屬于的樂(lè)曲數(shù)據(jù)的總數(shù)在規(guī)定的范 圍內(nèi),并且成為基礎(chǔ)的分類(lèi)項(xiàng)目的數(shù)量在所定的數(shù)量以下。通過(guò)將所 屬于的樂(lè)曲數(shù)據(jù)的總數(shù)限定在規(guī)定的范圍內(nèi),使類(lèi)別間的所屬于的樂(lè) 曲數(shù)的偏差在一定程度以下。最好是,將該規(guī)定的范圍設(shè)定為包含由
信息抽出部ll抽出的成為檢索對(duì)象的信息的總數(shù)除以所生成的類(lèi)別數(shù)
c所得的數(shù)。
另外,作為所屬于的樂(lè)曲數(shù)據(jù)的總數(shù)的計(jì)算方法,如在整個(gè)處理 中統(tǒng)一得出屬于被組合的各分類(lèi)項(xiàng)目的樂(lè)曲數(shù)據(jù)的并集或交集中的任 意一個(gè),就能夠使類(lèi)別更易于被用戶理解。
圖13是示出由候補(bǔ)類(lèi)別生成部141執(zhí)行的處理的流程的流程圖。 以下,使用圖13說(shuō)明候補(bǔ)類(lèi)別生成部141的候補(bǔ)類(lèi)別生成處理。
首先,由類(lèi)別生成部13輸入類(lèi)別(S801)。
之后,從被輸入的類(lèi)別中,選擇對(duì)預(yù)先設(shè)定的可組合的上限個(gè)數(shù) 以下的分類(lèi)項(xiàng)目進(jìn)行組合而生成的類(lèi)別(S802)。例如,若可組合的分 類(lèi)項(xiàng)目為"3個(gè)"以下,則可考慮對(duì)l個(gè)、2個(gè)、或3個(gè)分類(lèi)項(xiàng)目進(jìn)行 組合。另外,若使類(lèi)別生成部13僅生成不超過(guò)可組合的分類(lèi)項(xiàng)目數(shù)的 類(lèi)別,則步驟S802可省略。
然后,計(jì)算在步驟S802選擇的類(lèi)別所包含的樂(lè)曲數(shù)據(jù)的總數(shù) (S803),判斷樂(lè)曲數(shù)據(jù)的總數(shù)是否在預(yù)先被設(shè)定的范圍內(nèi)(S804)。 若該類(lèi)別所包含的樂(lè)曲數(shù)據(jù)的總數(shù)在預(yù)先被設(shè)定的范圍內(nèi),則進(jìn)入步 驟S805,若不然則進(jìn)入步驟S806。
在步驟S805將該類(lèi)別作為一個(gè)候補(bǔ)類(lèi)別進(jìn)行輸出,并進(jìn)入步驟 S806。在步驟S806判斷被輸入的類(lèi)別的探索是否全部結(jié)束。在探索 全部結(jié)束的情況下(S806的"是"),結(jié)束候補(bǔ)類(lèi)別生成處理。在探索 未全部結(jié)束的情況下(S806的"否"),回到步驟S802,重復(fù)處理。
最后,在步驟S807,通過(guò)一連串的處理而生成的所有的候補(bǔ)類(lèi)別 作為候補(bǔ)類(lèi)別群來(lái)被輸出,結(jié)束處理。
若由所述候補(bǔ)類(lèi)別生成部141生成的候補(bǔ)類(lèi)別群被輸入,則候補(bǔ) 類(lèi)別組生成部142輸出以屬于各候補(bǔ)類(lèi)別的樂(lè)曲數(shù)據(jù)的類(lèi)似度為基礎(chǔ) 進(jìn)行分組化的候補(bǔ)類(lèi)別組群。
圖14是示出由候補(bǔ)類(lèi)別組生成部142執(zhí)行的處理的流程的流程 圖。以下,使用圖14對(duì)候補(bǔ)類(lèi)別組生成部142的候補(bǔ)類(lèi)別組生成處理 進(jìn)行說(shuō)明。
首先,候補(bǔ)類(lèi)別群被輸入,并被設(shè)定為i-l、 j=l (S901)。
在步驟S902,在當(dāng)前階段,若候補(bǔ)類(lèi)別組一個(gè)都不存在,則進(jìn)入 步驟S905,若存在一個(gè)以上,則進(jìn)入步驟S903。
在步驟S903,計(jì)算候補(bǔ)類(lèi)別(i)和候補(bǔ)類(lèi)別組(j)之間的信息構(gòu)成類(lèi) 似度。信息構(gòu)成類(lèi)似度是指,屬于候補(bǔ)類(lèi)別(i)的樂(lè)曲數(shù)據(jù)與屬于候補(bǔ) 類(lèi)別組(j)的樂(lè)曲數(shù)據(jù)相一致的樂(lè)曲數(shù)據(jù)的數(shù)量除以屬于候補(bǔ)類(lèi)別(i)的 樂(lè)曲數(shù)據(jù)的數(shù)量所得的值。
在步驟S904,若在此計(jì)算出的信息構(gòu)成類(lèi)似度在一定程度以上, 則進(jìn)入步驟S905,若不然則j加l,并進(jìn)入步驟S906。
在步驟S905,在候補(bǔ)類(lèi)別組G)的成員中追加候補(bǔ)類(lèi)別(i),在屬于 候補(bǔ)類(lèi)別組(j)的樂(lè)曲數(shù)據(jù)中加入屬于候補(bǔ)類(lèi)別(i)的樂(lè)曲數(shù)據(jù),設(shè)定 j=l, i加l,并進(jìn)入步驟S908。
在步驟S906,判斷j是否比候補(bǔ)類(lèi)別組數(shù)大,若大則進(jìn)入步驟 S907,若不然則進(jìn)入步驟S903。在步驟S907,生成新的候補(bǔ)類(lèi)別組, 在該新生成的候補(bǔ)類(lèi)別組的成員中追加候補(bǔ)類(lèi)別(i),并在屬于新生成 的候補(bǔ)類(lèi)別組的樂(lè)曲數(shù)據(jù)中加入屬于候補(bǔ)類(lèi)別(i)的樂(lè)曲數(shù)據(jù),i加1, 并進(jìn)入步驟S908。
在步驟S908,判斷i是否比候補(bǔ)類(lèi)別數(shù)大,若大則進(jìn)入步驟S909, 若不然則進(jìn)入步驟S903。在步驟S909,將通過(guò)一連串的處理而生成 的所有的候補(bǔ)類(lèi)別組作為候補(bǔ)類(lèi)別組群來(lái)輸出,結(jié)束處理。
若由候補(bǔ)類(lèi)別組生成部142生成的候補(bǔ)類(lèi)別組群被輸入,則候補(bǔ) 類(lèi)別組選擇部143選擇覆蓋樂(lè)曲數(shù)據(jù)的數(shù)為最大的候補(bǔ)類(lèi)別組的組 合,并從所選擇的各候補(bǔ)類(lèi)別組中選擇可成為代表的各候補(bǔ)類(lèi)別,并 將該組合作為類(lèi)別來(lái)輸出。
圖15是示出由候補(bǔ)類(lèi)別組選擇部143執(zhí)行的處理的流程的流程 圖。以下,使用圖15說(shuō)明候補(bǔ)類(lèi)別組選擇部143的候補(bǔ)類(lèi)別組選擇處 理。
首先,候補(bǔ)類(lèi)別組群被輸入(SIOOI)。
然后,從被輸入的候補(bǔ)類(lèi)別組群選擇比所定的數(shù)小1的個(gè)數(shù)以下
的候補(bǔ)類(lèi)別組(S廳)。
在步驟Sl003,計(jì)算被選擇的候補(bǔ)類(lèi)別組的組合的評(píng)價(jià)值。在此 評(píng)價(jià)值是屬于被選擇的候補(bǔ)類(lèi)別組的樂(lè)曲數(shù)據(jù)的除去重復(fù)部分之后的 總數(shù)。在步驟Sl004,判斷在當(dāng)前的處理計(jì)算出的評(píng)價(jià)值。若在當(dāng)前 的處理計(jì)算出的評(píng)價(jià)值是在到當(dāng)前為止的處理計(jì)算出的評(píng)價(jià)值中最大 的,則進(jìn)入步驟S1005,若不然則進(jìn)入步驟Sl006。
在歩驟Sl005,作為候補(bǔ)解保持被選擇的候補(bǔ)類(lèi)別組的組合。在 步驟S1006,判斷候補(bǔ)類(lèi)別組的組合的探索是否全部結(jié)束,若全部結(jié) 束則進(jìn)入步驟S1007,若不然則進(jìn)入步驟Sl002,重新開(kāi)始到此為止 未進(jìn)行探索的其他組合的探索。
在步驟Sl007,從作為候補(bǔ)解保持的候補(bǔ)類(lèi)別組的組合所包含的 各候補(bǔ)類(lèi)別組中,選擇成為代表的候補(bǔ)類(lèi)別。最后在步驟Sl008,輸 出配套的代表類(lèi)別的表和各代表類(lèi)別所屬的候補(bǔ)類(lèi)別組,結(jié)束處理。
作為成為代表的候補(bǔ)類(lèi)別的選擇方法,有例如將各候補(bǔ)類(lèi)別組具 備的候補(bǔ)類(lèi)別的表的最前頭、或其后的特定的順次容納的候補(bǔ)類(lèi)別作 為代表類(lèi)別的方法。并且,有利用以下運(yùn)算規(guī)則的方法。
首先,計(jì)算屬于欲選擇代表類(lèi)別的候補(bǔ)類(lèi)別組的所有的樂(lè)曲數(shù)據(jù), 包含在幾個(gè)候補(bǔ)類(lèi)別中,所述候補(bǔ)類(lèi)別是屬于該候補(bǔ)類(lèi)別組的候補(bǔ)類(lèi) 別。然后,以以下公式計(jì)算候補(bǔ)類(lèi)別組包含的第k個(gè)候補(bǔ)類(lèi)別的評(píng)價(jià) 值E (k)。數(shù)1
E(k) = SS(k, i) - n(i)
在此,S (k,i)是示出第k個(gè)候補(bǔ)類(lèi)別是否包含第i個(gè)樂(lè)曲數(shù)據(jù)的 值,若包含則代入"1",若不包含則代入"0"。 n (i)是包含第i個(gè)樂(lè) 曲數(shù)據(jù)的候補(bǔ)類(lèi)別數(shù)。設(shè)定使該評(píng)價(jià)值E (k)為最大的候補(bǔ)類(lèi)別作為
代表類(lèi)別。根據(jù)該方法,能夠選擇該候補(bǔ)類(lèi)別組中的最為一般的候補(bǔ) 類(lèi)別。
然后,由候補(bǔ)類(lèi)別組選擇部143輸出的配套的候補(bǔ)類(lèi)別組和代表 類(lèi)別表被輸入類(lèi)別保持部17,并在類(lèi)別保持部17被保持。并且,在 此,將配套的代表類(lèi)別未能覆蓋的樂(lè)曲數(shù)據(jù)的集合作為"其他"類(lèi)別 來(lái)生成一個(gè)類(lèi)別,并進(jìn)行保持。
如圖16(A)所示,顯示內(nèi)容配置部18將代表類(lèi)別的表顯示在顯示 裝置,但是,存在用戶從在此顯示的代表類(lèi)別難于判斷各自包含的樂(lè) 曲數(shù)據(jù)的內(nèi)容的情況。此時(shí),用戶能夠在輸入部20進(jìn)行用于變更代表 類(lèi)別的輸入。
若用戶在輸入部20輸入了變更代表類(lèi)別的指令,則針對(duì)欲變更的 代表類(lèi)別的替換候補(bǔ)的表被顯示。例如,在圖16(A)欲變更"Classic" 的情況下,在選擇"Classic"的狀態(tài)下,指示"變更"。則如圖16(B) 所示,顯示"Classic"的替換候補(bǔ)的表。在此顯示的替換候補(bǔ)表是, 所述類(lèi)別保持部17保持的配套的候補(bǔ)類(lèi)別組中的、與欲替換的代表類(lèi) 別屬于相同的候補(bǔ)類(lèi)別組的候補(bǔ)類(lèi)別。用戶通過(guò)從該表中對(duì)判斷為適 合代表類(lèi)別的候補(bǔ)類(lèi)別進(jìn)行選擇并確定,從而能夠以所選擇的候補(bǔ)類(lèi) 別替換原來(lái)的代表類(lèi)別。例如,如圖16(B)所示,欲將代表類(lèi)別 "Classic"變更為其替換候補(bǔ)"Beethoven"的情況下,選擇 "Beethoven"并指示"確定"。據(jù)此,如圖16(C)所示,"Classic" 被替換為"Beethoven"。
若替換代表類(lèi)別,則替換前的代表類(lèi)別和替換后的代表類(lèi)別有可 能屬于類(lèi)別的樂(lè)曲數(shù)據(jù)之間出現(xiàn)差異。在不出現(xiàn)差異的情況下,就那 樣替換,在出現(xiàn)差異的情況下,進(jìn)行下述處理。
首先,在全部的屬于替換前的代表類(lèi)別的樂(lè)曲數(shù)據(jù)包含于替換后 的代表類(lèi)別的情況下,則為屬于替換后的代表類(lèi)別的樂(lè)曲數(shù)據(jù)多。其 差分的樂(lè)曲數(shù)據(jù)中若有屬于"其他"類(lèi)別的樂(lè)曲數(shù)據(jù),則從"其他" 類(lèi)別刪除該樂(lè)曲數(shù)據(jù),并替換代表類(lèi)別。
然后,在全部的屬于替換后的代表類(lèi)別的樂(lè)曲數(shù)據(jù)包含于替換前 的代表類(lèi)別的情況下,則為屬于替換前的代表類(lèi)別的樂(lè)曲數(shù)據(jù)多。對(duì) 于其差分的樂(lè)曲數(shù)據(jù)中的、除了替換前的類(lèi)別以外不屬于任何其他類(lèi) 別的樂(lè)曲數(shù)據(jù),追加入"其他"類(lèi)別中,并替換代表類(lèi)別。
根據(jù)此構(gòu)成,候補(bǔ)類(lèi)別生成部141對(duì)可能成為類(lèi)別的全部的組合 進(jìn)行探索。并且,候補(bǔ)類(lèi)別組生成部142對(duì)所屬于的樂(lè)曲數(shù)據(jù)的構(gòu)成 類(lèi)似的候補(bǔ)類(lèi)別進(jìn)行分組化并進(jìn)行保持。據(jù)此,能夠?qū)崿F(xiàn)維持類(lèi)別的 大小偏差小的分類(lèi)結(jié)構(gòu),且高速有效地將向用戶提示的類(lèi)別部分性地 與其他類(lèi)別進(jìn)行替換。
本發(fā)明所涉及的信息分類(lèi)裝置、以及信息檢索裝置,其特點(diǎn)是, 即使在基于用戶的嗜好或興趣來(lái)收集了信息的情況下,也進(jìn)行類(lèi)別的 大小偏差小的分類(lèi),并且作為以下裝置有用,即,不僅是對(duì)于以電子 分發(fā)購(gòu)入的樂(lè)曲數(shù)據(jù)或在數(shù)字音頻播放器容納的樂(lè)曲數(shù)據(jù),而且對(duì)于 以錄像機(jī)等錄像的運(yùn)動(dòng)圖像數(shù)據(jù)或以數(shù)字照像機(jī)等攝影的照片等靜止 圖像數(shù)據(jù)等,對(duì)于基于用戶的嗜好或興趣大量蓄積的AV內(nèi)容等信息, 進(jìn)行分類(lèi)的信息分類(lèi)裝置、以及從這些信息檢索所要的信息的信息檢 索裝置有用。并且,若其為基于用戶的嗜好或興趣收集的信息,則也 能夠應(yīng)用于對(duì)AV內(nèi)容以外的文本或電子郵件等所進(jìn)行的分類(lèi)或檢索。
權(quán)利要求
1、一種信息分類(lèi)裝置,對(duì)信息進(jìn)行分類(lèi),其特征在于,具有信息記憶單元,記錄信息;信息抽出單元,抽出所述信息記憶單元所記錄的信息的內(nèi)容或?qū)傩裕恢辽僖粋€(gè)分類(lèi)項(xiàng)目生成單元,基于所述信息抽出單元所抽出的信息的內(nèi)容或?qū)傩裕啥鄠€(gè)分類(lèi)項(xiàng)目;類(lèi)別生成單元,通過(guò)組合一個(gè)以上的所述分類(lèi)項(xiàng)目生成單元所生成的分類(lèi)項(xiàng)目,從而生成類(lèi)別;類(lèi)別組合覆蓋量計(jì)測(cè)單元,針對(duì)組合了所定數(shù)量的、所述類(lèi)別生成單元所生成的類(lèi)別的類(lèi)別組合,計(jì)測(cè)類(lèi)別組合覆蓋量,所述類(lèi)別組合覆蓋量是屬于構(gòu)成該類(lèi)別組合的類(lèi)別中的至少一個(gè)類(lèi)別的信息的總數(shù);類(lèi)別尺寸計(jì)測(cè)單元,計(jì)測(cè)所述類(lèi)別生成單元所生成的類(lèi)別的尺寸;類(lèi)別組合探索單元,在所述類(lèi)別組合覆蓋量計(jì)測(cè)單元所計(jì)測(cè)的類(lèi)別組合覆蓋量與所述信息記憶單元所記錄的信息的總數(shù)相一致的類(lèi)別組合中,探索所述類(lèi)別尺寸計(jì)測(cè)單元所計(jì)測(cè)的類(lèi)別的尺寸的平方和為最小的類(lèi)別組合;以及類(lèi)別保持單元,保持所述類(lèi)別組合探索單元所探索到的類(lèi)別組合。
2、 如權(quán)利要求1所述的信息分類(lèi)裝置,其特征在于, 所述類(lèi)別尺寸計(jì)測(cè)單元,以屬于所述類(lèi)別的信息的數(shù)量作為所述類(lèi)別的尺寸。
3、 如權(quán)利要求1所述的信息分類(lèi)裝置,其特征在于, 所述類(lèi)別尺寸計(jì)測(cè)單元,以依照屬于所述類(lèi)別的信息的重要度的數(shù)值的和作為所述類(lèi)別的尺寸。
4、 如權(quán)利要求l所述的信息分類(lèi)裝置,其特征在于, 所述類(lèi)別生成單元,通過(guò)得出兩個(gè)以上的分類(lèi)項(xiàng)目的并集,從而 生成所述類(lèi)別。
5、 如權(quán)利要求4所述的信息分類(lèi)裝置,其特征在于, 所述分類(lèi)項(xiàng)目生成單元,將所屬于的信息的內(nèi)容或?qū)傩跃哂泄餐纳衔桓拍畹姆诸?lèi)項(xiàng)目彼此匯集而構(gòu)成上位概念共有組,所述類(lèi)別生成單元,僅限于屬于同一個(gè)所述上位概念共有組的分 類(lèi)項(xiàng)目彼此組合來(lái)生成所述類(lèi)別。
6、 如權(quán)利要求5所述的信息分類(lèi)裝置,其特征在于, 所述分類(lèi)項(xiàng)目生成單元,以分層結(jié)構(gòu)構(gòu)成所述上位概念共有組。
7、 如權(quán)利要求l所述的信息分類(lèi)裝置,其特征在于, 所述類(lèi)別生成單元,通過(guò)得出兩個(gè)以上的分類(lèi)項(xiàng)目的交集,從而生成所述類(lèi)別。
8、 如權(quán)利要求1所述的信息分類(lèi)裝置,其特征在于, 所述信息抽出單元,進(jìn)一步,在所述類(lèi)別保持單元所保持的類(lèi)別組合中存在所屬于的信息超過(guò)所定數(shù)量的類(lèi)別的情況下,從所述信息 記憶單元中僅抽出屬于該類(lèi)別的信息的內(nèi)容或?qū)傩浴?br>
9、 如權(quán)利要求l所述的信息分類(lèi)裝置,其特征在于, 所述類(lèi)別探索單元,除了組合了所定數(shù)量的、所述類(lèi)別生成單元所生成的類(lèi)別的類(lèi)別組合之外,還探索以不屬于其他任何類(lèi)別的全部 信息所屬于的"其他"類(lèi)別來(lái)替換該組合中的一個(gè)類(lèi)別的組合。
10、 如權(quán)利要求l所述的信息分類(lèi)裝置,其特征在于, 所述類(lèi)別組合探索單元具有候補(bǔ)類(lèi)別生成部,從所述類(lèi)別生成單元所生成的類(lèi)別中,探索所述類(lèi)別尺寸計(jì)測(cè)單元所計(jì)測(cè)的類(lèi)別尺寸在 所定的范圍內(nèi)的類(lèi)別,從而生成候補(bǔ)類(lèi)別。
11、 如權(quán)利要求10所述的信息分類(lèi)裝置,其特征在于, 所述類(lèi)別組合探索單元,還具有-候補(bǔ)類(lèi)別組生成部,針對(duì)所述候補(bǔ)類(lèi)別生成部所生成的候補(bǔ)類(lèi)別, 將屬于該候補(bǔ)類(lèi)別的信息的構(gòu)成相似的類(lèi)別彼此進(jìn)行分組化,從而生 成候補(bǔ)類(lèi)別組;以及候補(bǔ)類(lèi)別組選擇部,選擇所定數(shù)量的、所述候補(bǔ)類(lèi)別組生成部所 生成的候補(bǔ)類(lèi)別組,從而生成候補(bǔ)類(lèi)別組組合,選擇并使所述類(lèi)別保 持單元保持一個(gè)候補(bǔ)類(lèi)別組組合,所述候補(bǔ)類(lèi)別組組合是所述類(lèi)別組 合覆蓋量計(jì)測(cè)單元所計(jì)測(cè)的類(lèi)別信息覆蓋量與所述信息記憶單元所記 錄的信息的總數(shù)相一致的候補(bǔ)類(lèi)別組組合。
12、 如權(quán)利要求ll所述的信息分類(lèi)裝置,其特征在于, 所述候補(bǔ)類(lèi)別組選擇部,在不存在所述類(lèi)別組合覆蓋量計(jì)測(cè)單元所計(jì)測(cè)的類(lèi)別組合覆蓋量與所述信息記憶單元所記錄的信息的總數(shù)相 一致的候補(bǔ)類(lèi)別組組合的情況下,選擇所述類(lèi)別組合覆蓋量為最大的 候補(bǔ)類(lèi)別組組合,并生成"其他"類(lèi)別,所述"其他"類(lèi)別是使所述 信息記憶單元所記錄的信息中的、不屬于任何候補(bǔ)類(lèi)別組的信息所屬 于的類(lèi)別,并使所述類(lèi)別保持單元追加保持所述"其他"類(lèi)別。
13、 如權(quán)利要求ll所述的信息分類(lèi)裝置,其特征在于, 所述類(lèi)別生成單元,通過(guò)組合不超過(guò)所定數(shù)量的分類(lèi)項(xiàng)目,從而生成類(lèi)別。
14、 一種信息檢索裝置,對(duì)信息進(jìn)行檢索,其特征在于,具有 信息記憶單元,記錄信息;信息抽出單元,抽出所述信息記憶單元所記錄的信息的內(nèi)容或?qū)傩裕恢辽僖粋€(gè)分類(lèi)項(xiàng)目生成單元,基于所述信息抽出單元所抽出的信 息的內(nèi)容或?qū)傩?,生成多個(gè)分類(lèi)項(xiàng)目;類(lèi)別生成單元,通過(guò)組合一個(gè)以上的所述分類(lèi)項(xiàng)目生成單元所生 成的分類(lèi)項(xiàng)目,從而生成類(lèi)別;類(lèi)別組合覆蓋量計(jì)測(cè)單元,針對(duì)組合了所定數(shù)量的所述類(lèi)別生成 單元所生成的類(lèi)別的類(lèi)別組合,計(jì)測(cè)類(lèi)別組合覆蓋量,所述類(lèi)別組合 覆蓋量是屬于構(gòu)成該類(lèi)別組合的類(lèi)別中的至少一個(gè)類(lèi)別的信息的總 數(shù); 類(lèi)別尺寸計(jì)測(cè)單元,計(jì)測(cè)所述類(lèi)別生成單元所生成的類(lèi)別的尺寸;類(lèi)別組合探索單元,在所述類(lèi)別組合覆蓋量計(jì)測(cè)單元所計(jì)測(cè)的類(lèi) 別組合覆蓋量與所述信息記憶單元所記錄的信息的總數(shù)相一致的類(lèi)別 組合中,探索所述類(lèi)別尺寸計(jì)測(cè)單元所計(jì)測(cè)的類(lèi)別的尺寸的平方和為 最小的類(lèi)別組合;類(lèi)別保持單元,保持所述類(lèi)別組合探索單元所探索到的類(lèi)別組合;輸入單元,從用戶接受類(lèi)別的指示;顯示內(nèi)容配置單元,進(jìn)行配置,以便能夠向用戶提示所述類(lèi)別保 持單元所保持的類(lèi)別組合、以及信息的一方或雙方的一覽,所述信息 是屬于通過(guò)所述輸入單元從用戶接受的類(lèi)別的信息;以及類(lèi)別顯示單元,向用戶提示所述顯示內(nèi)容配置單元所配置的類(lèi)別 組合、以及信息的一方或雙方的一覽。
15、 一種信息分類(lèi)方法,對(duì)信息進(jìn)行分類(lèi),其特征在于,包括信息抽出步驟,抽出信息記憶單元所記錄的信息的內(nèi)容或?qū)傩?;至少一個(gè)分類(lèi)項(xiàng)目生成步驟,基于在所述信息抽出步驟抽出的信 息的內(nèi)容或?qū)傩?,生成多個(gè)分類(lèi)項(xiàng)目;類(lèi)別生成步驟,通過(guò)組合一個(gè)以上的在所述分類(lèi)項(xiàng)目生成步驟生 成的分類(lèi)項(xiàng)目,從而生成類(lèi)別;類(lèi)別組合覆蓋量計(jì)測(cè)步驟,針對(duì)組合了所定數(shù)量的、在所述類(lèi)別 生成步驟生成的類(lèi)別的類(lèi)別組合,計(jì)測(cè)類(lèi)別組合覆蓋量,所述類(lèi)別組 合覆蓋量是屬于構(gòu)成該類(lèi)別組合的類(lèi)別中的至少一個(gè)類(lèi)別的信息的總 數(shù);類(lèi)別尺寸計(jì)測(cè)步驟,計(jì)測(cè)在所述類(lèi)別生成步驟生成的類(lèi)別的尺寸; 類(lèi)別組合探索步驟,在所述類(lèi)別組合覆蓋量計(jì)測(cè)步驟計(jì)測(cè)的類(lèi)別 組合覆蓋量與在所述信息記憶單元所記錄的信息的總數(shù)相一致的類(lèi)別 組合中,探索在所述類(lèi)別尺寸計(jì)測(cè)步驟計(jì)測(cè)的類(lèi)別的尺寸的平方和為 最小的類(lèi)別組合;以及類(lèi)別保持步驟,使類(lèi)別保持單元保持在所述類(lèi)別組合探索步驟探索到的類(lèi)別組合。
16、 如權(quán)利要求15所述的信息分類(lèi)方法,其特征在于, 所述類(lèi)別組合探索步驟包括候補(bǔ)類(lèi)別生成步驟,從在所述類(lèi)別生成步驟生成的類(lèi)別中,探索在所述類(lèi)別尺寸計(jì)測(cè)步驟計(jì)測(cè)的類(lèi)別尺寸 在所定的范圍內(nèi)的類(lèi)別,從而生成候補(bǔ)類(lèi)別。
17、 如權(quán)利要求16所述的信息分類(lèi)方法,其特征在于, 所述類(lèi)別組合探索步驟,還包括-候補(bǔ)類(lèi)別組生成步驟,針對(duì)在所述候補(bǔ)類(lèi)別生成步驟生成的候補(bǔ) 類(lèi)別,將屬于該候補(bǔ)類(lèi)別的信息的構(gòu)成相似的類(lèi)別彼此進(jìn)行分組化, 從而生成候補(bǔ)類(lèi)別組;以及候補(bǔ)類(lèi)別組選擇步驟,選擇在所述候補(bǔ)類(lèi)別組生成步驟生成的所 定數(shù)量的候補(bǔ)類(lèi)別組,從而生成候補(bǔ)類(lèi)別組組合,選擇并使所述類(lèi)別 生成單元保持一個(gè)候補(bǔ)類(lèi)別組組合,所述候補(bǔ)類(lèi)別組組合是在所述類(lèi) 別組合覆蓋量計(jì)測(cè)步驟計(jì)測(cè)的類(lèi)別信息覆蓋量與在所述信息記憶單元 所記錄的信息的總數(shù)相一致的候補(bǔ)類(lèi)別組組合。
18、 一種程序,用于對(duì)信息進(jìn)行分類(lèi),其特征在于,使計(jì)算機(jī)執(zhí) 行以下步驟信息抽出步驟,抽出信息記憶單元所記錄的信息的內(nèi)容或?qū)傩?;至少一個(gè)分類(lèi)項(xiàng)目生成步驟,基于在所述信息抽出步驟抽出的信 息的內(nèi)容或?qū)傩?,生成多個(gè)分類(lèi)項(xiàng)目;類(lèi)別生成步驟,通過(guò)組合一個(gè)以上的在所述分類(lèi)項(xiàng)目生成步驟生 成的分類(lèi)項(xiàng)目,從而生成類(lèi)別;類(lèi)別組合覆蓋量計(jì)測(cè)步驟,針對(duì)組合了所定數(shù)量的、在所述類(lèi)別 生成步驟生成的類(lèi)別的類(lèi)別組合,計(jì)測(cè)類(lèi)別組合覆蓋量,所述類(lèi)別組 合覆蓋量是屬于構(gòu)成該類(lèi)別組合的類(lèi)別中的至少一個(gè)類(lèi)別的信息的總 數(shù);類(lèi)別尺寸計(jì)測(cè)步驟,計(jì)測(cè)在所述類(lèi)別生成步驟生成的類(lèi)別的尺寸; 類(lèi)別組合探索步驟,在所述類(lèi)別組合覆蓋量計(jì)測(cè)步驟計(jì)測(cè)的類(lèi)別組合覆蓋量與在所述信息記憶單元所記錄的信息的總數(shù)相一致的類(lèi)別 組合中,探索在所述類(lèi)別尺寸計(jì)測(cè)步驟計(jì)測(cè)的類(lèi)別的尺寸的平方和為最小的類(lèi)別組合;以及類(lèi)別保持步驟,使類(lèi)別保持單元保持在所述類(lèi)別組合探索步驟探 索到的類(lèi)別組合。
19、 如權(quán)利要求18所述的程序,其特征在于, 所述類(lèi)別組合探索步驟包括候補(bǔ)類(lèi)別生成步驟,從在所述類(lèi)別生成步驟生成的類(lèi)別中,探索在所述類(lèi)別尺寸計(jì)測(cè)步驟計(jì)測(cè)的類(lèi)別尺寸 在所定的范圍內(nèi)的類(lèi)別,從而生成候補(bǔ)類(lèi)別。
20、 如權(quán)利要求19所述的程序,其特征在于, 所述類(lèi)別組合探索步驟,還包括候補(bǔ)類(lèi)別組生成步驟,針對(duì)在所述候補(bǔ)類(lèi)別生成步驟生成的候補(bǔ) 類(lèi)別,將屬于該候補(bǔ)類(lèi)別的信息的構(gòu)成相似的類(lèi)別彼此進(jìn)行分組化, 從而生成候補(bǔ)類(lèi)別組;以及候補(bǔ)類(lèi)別組選擇步驟,選擇在所述候補(bǔ)類(lèi)別組生成步驟生成的所 定數(shù)量的候補(bǔ)類(lèi)別組,從而生成候補(bǔ)類(lèi)別組組合,選擇并使所述類(lèi)別 保持單元保持一個(gè)候補(bǔ)類(lèi)別組組合,所述候補(bǔ)類(lèi)別組組合是在所述類(lèi) 別組合覆蓋量計(jì)測(cè)步驟計(jì)測(cè)的類(lèi)別信息覆蓋量與在所述信息記憶單元 所記錄的信息的總數(shù)相一致的候補(bǔ)類(lèi)別組組合。
全文摘要
本發(fā)明提供即使在基于用戶的嗜好或興趣收集了信息的情況下,也能夠高速地檢索用戶所要的信息的信息檢索裝置等。分類(lèi)項(xiàng)目生成部(121)~(12N)分別基于不同的分類(lèi)觀點(diǎn)(信息的內(nèi)容或?qū)傩?,將信息分類(lèi)到多個(gè)分類(lèi)項(xiàng)目,并在類(lèi)別生成部(13)組合所述分類(lèi)項(xiàng)目,從而生成各種各樣的類(lèi)別。在類(lèi)別組合探索部(14)按所定數(shù)量組合所述類(lèi)別,從而生成所屬于的信息數(shù)量最接近于均等的類(lèi)別組合。以該類(lèi)別組合來(lái)縮小信息的范圍,將用戶找到設(shè)定為檢索目標(biāo)的信息為止的操作量(具體而言,選擇類(lèi)別、在類(lèi)別內(nèi)尋找設(shè)定為檢索目標(biāo)的信息為止所用的操作量)抑制到最少,因此能夠進(jìn)行更高速的檢索。
文檔編號(hào)G06F17/30GK101379492SQ200780004388
公開(kāi)日2009年3月4日 申請(qǐng)日期2007年1月31日 優(yōu)先權(quán)日2006年2月1日
發(fā)明者前田茂則, 西森崇 申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社