国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      信息處理裝置、信息處理方法以及程序的制作方法

      文檔序號(hào):6424737閱讀:219來(lái)源:國(guó)知局
      專利名稱:信息處理裝置、信息處理方法以及程序的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及信息處理裝置、信息處理方法和程序,特別是涉及將具有在特征量空間中表示的特征量的數(shù)據(jù)分類成預(yù)定數(shù)目的類別中的任一個(gè)的信息處理裝置、信息處理方法和程序。
      背景技術(shù)
      在機(jī)器學(xué)習(xí)的領(lǐng)域,有一個(gè)稱作“分類”的問(wèn)題。該問(wèn)題在對(duì)數(shù)據(jù)被分類成的預(yù)定數(shù)目的類別進(jìn)行定義的情況下,表現(xiàn)出這樣的問(wèn)題基于數(shù)據(jù)的特征量來(lái)預(yù)測(cè)數(shù)據(jù)分別被分類成哪個(gè)類別。例如,在以圖像數(shù)據(jù)為對(duì)象的機(jī)器學(xué)習(xí)中,以如下方式處置分類的問(wèn)題 對(duì)包含特定物體的圖像數(shù)據(jù)被分類成的類別進(jìn)行定義,并基于圖像數(shù)據(jù)的特征量來(lái)預(yù)測(cè)在各圖像數(shù)據(jù)中包含哪個(gè)物體。在分類中存在通過(guò)根據(jù)學(xué)習(xí)數(shù)據(jù)創(chuàng)建分類器(classifier)來(lái)進(jìn)行分類的所謂有監(jiān)管分類;以及在沒(méi)有學(xué)習(xí)數(shù)據(jù)的狀態(tài)下進(jìn)行分類的所謂無(wú)監(jiān)管分類。作為有監(jiān)管分類, 已知例如支持向量機(jī)(SVM)等。另外,作為無(wú)監(jiān)管分類,已知例如聚類分析。此處,在有監(jiān)管分類中,由于從已被分類成類別的數(shù)據(jù)中學(xué)習(xí)分類的標(biāo)準(zhǔn),并通過(guò)反映該標(biāo)準(zhǔn)來(lái)對(duì)數(shù)據(jù)進(jìn)行分類,因而分類的精度高。然而,在有監(jiān)管分類中,難以將數(shù)據(jù)分類成數(shù)據(jù)未被分類成的類別。這是因?yàn)閺臄?shù)據(jù)未被分類成的類別中難以獲取用于學(xué)習(xí)分類成類別的標(biāo)準(zhǔn)的學(xué)習(xí)數(shù)據(jù)。另一方面,在無(wú)監(jiān)管分類中,可將數(shù)據(jù)分類成數(shù)據(jù)未被分類成的類別。然而,由于無(wú)監(jiān)管分類不使用學(xué)習(xí)數(shù)據(jù),因而與有監(jiān)管分類相比分類的精度低。特別是在對(duì)具有高維度特征量的數(shù)據(jù)進(jìn)行無(wú)監(jiān)管分類時(shí),由于稱作維度詛咒(curse of dimensionality)的現(xiàn)象,即數(shù)據(jù)維度的升高導(dǎo)致一般化誤差停止增強(qiáng),分類的精度進(jìn)一步降低。因此,當(dāng)對(duì)具有高維度特征量的數(shù)據(jù)進(jìn)行無(wú)監(jiān)管分類時(shí),可能存在這樣的情形使用主成分分析(PCA Principal Component Analysis)或獨(dú)立成分分析(ICA Independent Component Analysis)等算法來(lái)進(jìn)行維度壓縮并由此降低特征量的維度。在這樣的分類中,開(kāi)發(fā)了用于提高預(yù)測(cè)精度的技術(shù)。例如,在文獻(xiàn)Thomas G.Dietterich and Ghulum Bakiri,"Solving Multiclass Learning Problems via Error-Correcting Output Codes,,,Journal of Artificial Intelligence Research, 1995年,第2卷,第沈3-觀6頁(yè)中,記載了一種利用了糾錯(cuò)輸出碼(ECOC)的分類技術(shù), 糾錯(cuò)輸出碼通過(guò)使用冗余準(zhǔn)備的分類器對(duì)各個(gè)分類器的錯(cuò)誤進(jìn)行糾正。另外,在文獻(xiàn)Gabriella Csurka等人的"Visual Categorization with Bags of Keypoints,,,Proc· of ECCV Workshop on Statistical Learning in Computer Vision,2004年,第 59-74 頁(yè)中, 記載了一種在圖像數(shù)據(jù)中使用基于局部模式分布的、稱作“Bag-of-keypoints”的特征量的分類技術(shù)。

      發(fā)明內(nèi)容
      然而,使用在文獻(xiàn)Thomas G. Dietterich and Ghulum Bakiri, "SolvingMulticlass Learning Problems via Error-Correcting Output Codes", Journal of Artificial Intelligence Research, 1995 年,第 2 卷,第 263-286 頁(yè)中記載的 ECOC 的前提是可準(zhǔn)備用于生成分類器的學(xué)習(xí)數(shù)據(jù)。因而,為了將數(shù)據(jù)分類成沒(méi)有學(xué)習(xí)數(shù)據(jù)的類別,仍需要使用過(guò)去的無(wú)監(jiān)管分類的技術(shù),且難以提高包含沒(méi)有學(xué)習(xí)數(shù)據(jù)的類別的分類的精度。另外,在Gabriella Csurka 等人的 “Visual Categorization with Bagsof Keypoints,,,Proc. of ECCV Workshop on Statistical Learning in Computer Vision, 2004年,第59-74頁(yè)中記載的“Bag-of-keypoints”是在高維度稀疏特征量空間中表示的特征量。因而,當(dāng)將“Bag-of-keypoints”照原樣用于無(wú)監(jiān)管分類時(shí),它受維度詛咒的影響很大且分類的精度降低。另外,當(dāng)試圖對(duì)“Bag-of-keypoints”特征量使用PCA或ICA等算法進(jìn)行維度壓縮時(shí),存在因受數(shù)據(jù)分散或失效值的影響而僅留下無(wú)意義的成分的風(fēng)險(xiǎn)。 也即,難以進(jìn)行適合于分類的維度壓縮。結(jié)果,盡管已開(kāi)發(fā)了在Thomas G. Dietterich和 Ghulum Bakiri,"Solving Multiclass Learning Problems via Error-Correcting Output Codes,,,Journal of Artificial Intelligence Research,1995 年,第 2 卷,第洸3_286 頁(yè)
      禾口Gabriella Csurka等人的“Visual Categorization with Bags of Keypoints",Proc. of ECCV Workshop on Statistical Learning in Computer Vision, 2004年,第 59-74頁(yè)] 中記載的技術(shù),但是仍存在如下問(wèn)題使用那些技術(shù)難以提高包含沒(méi)有學(xué)習(xí)數(shù)據(jù)的類別的分類的精度。有鑒于此,希望提供一種能夠提高包含沒(méi)有學(xué)習(xí)數(shù)據(jù)的類別的分類的精度的、新穎且改良的信息處理裝置、信息處理方法和程序。根據(jù)本發(fā)明的一個(gè)實(shí)施例,提供了一種信息處理裝置,所述信息處理裝置包括數(shù)據(jù)池生成部,所述數(shù)據(jù)池生成部生成這樣的未知數(shù)據(jù)池在包含在數(shù)據(jù)群中并具有在特征量空間中表示的特征量的數(shù)據(jù)當(dāng)中,所述未知數(shù)據(jù)池包含應(yīng)被分類成的類別未知的未知數(shù)據(jù);學(xué)習(xí)樣本收集部,所述學(xué)習(xí)樣本收集部執(zhí)行以下處理從所述未知數(shù)據(jù)池中隨機(jī)地提取一個(gè)中心數(shù)據(jù);提取在所述特征量空間中具有位于所述中心數(shù)據(jù)在所述特征量空間中的特征量附近的特征量的鄰近數(shù)據(jù),其中以所述鄰近數(shù)據(jù)在所述特征量空間中的所述特征量距所述中心數(shù)據(jù)在所述特征量空間中的所述特征量的距離的升序來(lái)提取所述鄰近數(shù)據(jù),直到所述鄰近數(shù)據(jù)的數(shù)目成為預(yù)定數(shù)目為止;并收集多個(gè)學(xué)習(xí)樣本,每個(gè)學(xué)習(xí)樣本包含已被提取的所述中心數(shù)據(jù)和所述鄰近數(shù)據(jù);分類器生成部,所述分類器生成部通過(guò)使用已被收集到的所述多個(gè)學(xué)習(xí)樣本來(lái)生成多個(gè)分類器;輸出特征量獲取部,對(duì)于所述數(shù)據(jù)群中所包含的每個(gè)所述數(shù)據(jù),所述輸出特征量獲取部將通過(guò)將所述數(shù)據(jù)輸入到所述多個(gè)分類器中以識(shí)別所述數(shù)據(jù)而獲得的多個(gè)輸出值作為在與所述特征量空間不同的輸出特征量空間中表示的輸出特征量而與所述數(shù)據(jù)相關(guān)聯(lián);以及類別分類部,所述類別分類部基于所述輸出特征量將所述數(shù)據(jù)群中所包含的每個(gè)所述未知數(shù)據(jù)分類成預(yù)定數(shù)目的所述類別中的任一個(gè)。憑借這種配置,有可能通過(guò)使用通過(guò)在特征量空間中的學(xué)習(xí)而生成的、具有適合于分類的表達(dá)的輸出特征量來(lái)對(duì)未知數(shù)據(jù)進(jìn)行分類,并提高分類的精度。此外,有可能將高維度特征量的維度降低為與分類器的數(shù)目相等的數(shù),并進(jìn)一步提高分類的精度。所述數(shù)據(jù)池生成部可進(jìn)一步生成這樣的已知數(shù)據(jù)池在所述數(shù)據(jù)群中所包含的所述數(shù)據(jù)當(dāng)中,所述已知數(shù)據(jù)池包含被分類成的所述類別已知的已知數(shù)據(jù);且所述已知數(shù)據(jù)池具有所述已知數(shù)據(jù)被分類成的所述類別的標(biāo)簽。所述學(xué)習(xí)樣本收集部可進(jìn)一步從具有同一個(gè)所述標(biāo)簽的所述已知數(shù)據(jù)池中隨機(jī)地提取預(yù)定數(shù)目的所述數(shù)據(jù),并可收集包含所提取的所述數(shù)據(jù)的學(xué)習(xí)樣本。所述學(xué)習(xí)樣本收集部可依據(jù)所述已知數(shù)據(jù)被分類成的所述類別的數(shù)目與所述已知數(shù)據(jù)未被分類成的所述類別的數(shù)目的比率,來(lái)確定由從所述未知數(shù)據(jù)中提取的數(shù)據(jù)形成的學(xué)習(xí)樣本的數(shù)目與由從所述已知數(shù)據(jù)中提取的數(shù)據(jù)形成的學(xué)習(xí)樣本的數(shù)目的比率。所述信息處理裝置可進(jìn)一步包括維度壓縮部,所述維度壓縮部對(duì)所述輸出特征量進(jìn)行維度壓縮。所述類別分類部可基于由所述維度壓縮部進(jìn)行了維度壓縮的所述輸出特征量來(lái)對(duì)所述數(shù)據(jù)進(jìn)行分類。另外,根據(jù)本發(fā)明的另一個(gè)實(shí)施例,提供了一種信息處理方法,所述信息處理方法包括以下步驟生成這樣的未知數(shù)據(jù)池在包含在數(shù)據(jù)群中并具有在特征量空間中表示的特征量的數(shù)據(jù)當(dāng)中,所述未知數(shù)據(jù)池包含應(yīng)被分類成的類別未知的未知數(shù)據(jù);從所述未知數(shù)據(jù)池中隨機(jī)地提取一個(gè)中心數(shù)據(jù);提取在所述特征量空間中具有位于所述中心數(shù)據(jù)在所述特征量空間中的特征量附近的特征量的鄰近數(shù)據(jù),其中以所述鄰近數(shù)據(jù)在所述特征量空間中的所述特征量距所述中心數(shù)據(jù)在所述特征量空間中的所述特征量的距離的升序來(lái)提取所述鄰近數(shù)據(jù),直到所述鄰近數(shù)據(jù)的數(shù)目成為預(yù)定數(shù)目為止;并收集多個(gè)學(xué)習(xí)樣本,每個(gè)學(xué)習(xí)樣本包含已被提取的所述中心數(shù)據(jù)和所述鄰近數(shù)據(jù);通過(guò)使用已被收集到的所述多個(gè)學(xué)習(xí)樣本來(lái)生成多個(gè)分類器;對(duì)于所述數(shù)據(jù)群中所包含的每個(gè)所述數(shù)據(jù),將通過(guò)將所述數(shù)據(jù)輸入到所述多個(gè)分類器并識(shí)別所述數(shù)據(jù)而獲得的多個(gè)輸出值作為在與所述特征量空間不同的輸出特征量空間中表示的輸出特征量而與所述數(shù)據(jù)相關(guān)聯(lián);以及基于所述輸出特征量將所述數(shù)據(jù)群中所包含的每個(gè)所述未知數(shù)據(jù)分類成預(yù)定數(shù)目的所述類別中的任一個(gè)。另外,根據(jù)本發(fā)明的另一個(gè)實(shí)施例,提供了一種使得計(jì)算機(jī)執(zhí)行以下處理的程序生成這樣的未知數(shù)據(jù)池在包含在數(shù)據(jù)群中并具有在特征量空間中表示的特征量的數(shù)據(jù)當(dāng)中,所述未知數(shù)據(jù)池包含應(yīng)被分類成的類別未知的未知數(shù)據(jù);從所述未知數(shù)據(jù)池中隨機(jī)地提取一個(gè)中心數(shù)據(jù);提取在所述特征量空間中具有位于所述中心數(shù)據(jù)在所述特征量空間中的特征量附近的特征量的鄰近數(shù)據(jù),其中以所述鄰近數(shù)據(jù)在所述特征量空間中的所述特征量距所述中心數(shù)據(jù)在所述特征量空間中的所述特征量的距離的升序來(lái)提取所述鄰近數(shù)據(jù),直到所述鄰近數(shù)據(jù)的數(shù)目成為預(yù)定數(shù)目為止;并收集多個(gè)學(xué)習(xí)樣本,每個(gè)學(xué)習(xí)樣本包含已被提取的所述中心數(shù)據(jù)和所述鄰近數(shù)據(jù);通過(guò)使用已被收集到的所述多個(gè)學(xué)習(xí)樣本來(lái)生成多個(gè)分類器;對(duì)于所述數(shù)據(jù)群中所包含的每個(gè)所述數(shù)據(jù),將通過(guò)將所述數(shù)據(jù)輸入到所述多個(gè)分類器并識(shí)別所述數(shù)據(jù)而獲得的多個(gè)輸出值作為在與所述特征量空間不同的輸出特征量空間中表示的輸出特征量而與所述數(shù)據(jù)相關(guān)聯(lián);以及基于所述輸出特征量將所述數(shù)據(jù)群中所包含的每個(gè)所述未知數(shù)據(jù)分類成預(yù)定數(shù)目的所述類別中的任一個(gè)。根據(jù)上面說(shuō)明的本發(fā)明的實(shí)施例,有可能提高包含沒(méi)有學(xué)習(xí)數(shù)據(jù)的類別的分類的精度。


      圖1是示出根據(jù)本發(fā)明的實(shí)施例的信息處理裝置的功能配置的框圖;圖2是說(shuō)明根據(jù)該實(shí)施例的數(shù)據(jù)群的圖;圖3是說(shuō)明根據(jù)該實(shí)施例的未知數(shù)據(jù)在特征量空間中的特征量的圖;圖4是逐類別地說(shuō)明根據(jù)該實(shí)施例的未知數(shù)據(jù)在特征量空間中的特征量的圖;圖5是示出根據(jù)該實(shí)施例的一系列處理程序的流程圖;圖6是示出根據(jù)該實(shí)施例的生成數(shù)據(jù)池的處理的圖;圖7是示出根據(jù)該實(shí)施例的收集學(xué)習(xí)樣本的處理的圖;圖8是示出根據(jù)該實(shí)施例的生成分類器的處理的圖;圖9是示出根據(jù)該實(shí)施例的由分類器進(jìn)行的已知數(shù)據(jù)的分類的圖;圖10是示出根據(jù)該實(shí)施例的由分類器進(jìn)行的未知數(shù)據(jù)的分類的圖;圖11是示出根據(jù)該實(shí)施例的獲取輸出特征量的處理的圖;圖12是說(shuō)明根據(jù)該實(shí)施例的未知數(shù)據(jù)在輸出特征量空間中的輸出特征量的圖;圖13是逐類別地說(shuō)明根據(jù)該實(shí)施例的未知數(shù)據(jù)在輸出特征量空間中的輸出特征量的圖;圖14是說(shuō)明在本發(fā)明的實(shí)施例的變形例中意圖要處理的數(shù)據(jù)的配置的圖。
      具體實(shí)施例方式下面參照附圖詳細(xì)說(shuō)明本發(fā)明的優(yōu)選實(shí)施例。注意,在本說(shuō)明書(shū)和附圖中,將具有實(shí)質(zhì)上相同的功能和結(jié)構(gòu)的結(jié)構(gòu)元件標(biāo)以相同的附圖標(biāo)記,并省略這些結(jié)構(gòu)元件的重復(fù)說(shuō)明。注意,說(shuō)明將按以下順序進(jìn)行。1.本發(fā)明的實(shí)施例1-1.信息處理裝置的配置1-2.分類處理2.變形例3.總結(jié)<1.本發(fā)明的實(shí)施例〉(1-1.信息處理裝置的配置)首先,參照?qǐng)D1說(shuō)明根據(jù)本發(fā)明的實(shí)施例的信息處理裝置的配置。圖1是示出根據(jù)本發(fā)明的實(shí)施例的信息處理裝置100的功能配置的框圖。參照?qǐng)D 1,信息處理裝置100包括數(shù)據(jù)池生成部110、學(xué)習(xí)樣本收集部120、分類器生成部130、輸出特征量獲取部140、維度壓縮部150、類別分類部160和存儲(chǔ)部170。注意,如后面說(shuō)明的那樣,信息處理裝置100可具有不包含維度壓縮部150的配置。在信息處理裝置100的上述功能結(jié)構(gòu)元件中,數(shù)據(jù)池生成部110、學(xué)習(xí)樣本收集部 120、分類器生成部130、輸出特征量獲取部140、維度壓縮部150和類別分類部160可利用包含例如集成電路的電路配置以硬件來(lái)實(shí)施,或是通過(guò)由CPU(中央處理單元)執(zhí)行存儲(chǔ)在構(gòu)成存儲(chǔ)部170的存儲(chǔ)裝置或可移動(dòng)存儲(chǔ)介質(zhì)中的程序、以軟件來(lái)實(shí)施。在存儲(chǔ)部170中, 按需要組合地實(shí)施有ROM(只讀存儲(chǔ)器)和RAM(隨機(jī)存取存儲(chǔ)器)等存儲(chǔ)裝置、以及光盤、 磁盤和半導(dǎo)體存儲(chǔ)器等可移動(dòng)存儲(chǔ)介質(zhì)。信息處理裝置100將存儲(chǔ)在存儲(chǔ)部170中的數(shù)據(jù)群中所包含的數(shù)據(jù)分類成預(yù)定數(shù)目的類別中的任一個(gè)。此處,每個(gè)數(shù)據(jù)具有表示數(shù)據(jù)的特征的特征量。特征量被表示在特征量空間中。例如,特征量是多維度向量,特征量空間是特征量的向量被表示于的向量空間。 在數(shù)據(jù)群中,包含應(yīng)被分類成的類別未知的未知數(shù)據(jù)。在數(shù)據(jù)群中,還可包含應(yīng)被分類成的類別已知的已知數(shù)據(jù)。另外,類別都是已基于某種標(biāo)準(zhǔn)將數(shù)據(jù)分類成的集合,并且具有用于將類別彼此區(qū)分的標(biāo)簽。數(shù)據(jù)池生成部110生成包含數(shù)據(jù)群中所包含的數(shù)據(jù)的數(shù)據(jù)池。具體地,數(shù)據(jù)池生成部110生成包含未知數(shù)據(jù)的未知數(shù)據(jù)池和包含已知數(shù)據(jù)的已知數(shù)據(jù)池。此處,未知數(shù)據(jù)池是包含全部未知數(shù)據(jù)的單個(gè)數(shù)據(jù)池。另一方面,已知數(shù)據(jù)池具有與類別的標(biāo)簽相同的標(biāo)簽,且該已知數(shù)據(jù)池中包含被分類成該類別的已知數(shù)據(jù)。注意,在數(shù)據(jù)群中沒(méi)有已知數(shù)據(jù)的情況下,數(shù)據(jù)池生成部110僅生成未知數(shù)據(jù)池。學(xué)習(xí)樣本收集部120從數(shù)據(jù)池生成部110所生成的數(shù)據(jù)池中提取預(yù)定數(shù)目的數(shù)據(jù)作為學(xué)習(xí)樣本,并收集多個(gè)學(xué)習(xí)樣本。從未知數(shù)據(jù)池中,通過(guò)隨機(jī)采樣和最鄰近搜索來(lái)收集學(xué)習(xí)樣本。具體地,學(xué)習(xí)樣本收集部120從未知數(shù)據(jù)池中隨機(jī)地提取一個(gè)數(shù)據(jù),并設(shè)該數(shù)據(jù)是中心數(shù)據(jù)。接著,學(xué)習(xí)樣本收集部120提取在特征量空間中具有位于中心數(shù)據(jù)在特征量空間中的特征量附近的特征量的鄰近數(shù)據(jù),其中以鄰近數(shù)據(jù)在特征量空間中的特征量距中心數(shù)據(jù)在特征量空間中的特征量的距離的升序來(lái)提取鄰近數(shù)據(jù),直到鄰近數(shù)據(jù)的數(shù)目成為預(yù)定數(shù)目為止。將這樣提取的中心數(shù)據(jù)和鄰近數(shù)據(jù)設(shè)定為學(xué)習(xí)樣本。另一方面,從已知數(shù)據(jù)池中,根據(jù)數(shù)據(jù)池的標(biāo)簽來(lái)收集學(xué)習(xí)樣本。具體地,學(xué)習(xí)樣本收集部120從具有同一個(gè)標(biāo)簽的已知數(shù)據(jù)池中隨機(jī)地提取預(yù)定數(shù)目的數(shù)據(jù),并將這樣提取的數(shù)據(jù)設(shè)定為學(xué)習(xí)樣本。分類器生成部130通過(guò)使用學(xué)習(xí)樣本收集部120所收集到的多個(gè)學(xué)習(xí)樣本來(lái)生成多個(gè)分類器。分類器針對(duì)輸入數(shù)據(jù)輸出用于區(qū)分某個(gè)分類與其它分類的值,比如距識(shí)別超平面的距離或概率。作為分類器,可使用區(qū)分兩個(gè)分類的二類別分類器。注意,待由分類器生成部130所生成的分類器來(lái)識(shí)別的對(duì)象將在后面說(shuō)明。輸出特征量獲取部140將數(shù)據(jù)群中所包含的數(shù)據(jù)輸入到由分類器生成部130所生成的多個(gè)分類器中。此外,輸出特征量獲取部140還獲取由于將數(shù)據(jù)輸入到多個(gè)分類器中并識(shí)別該數(shù)據(jù)而獲得的多個(gè)輸出值,并將所獲得的輸出值作為輸出特征量而與數(shù)據(jù)相關(guān)聯(lián)。此處,輸出特征量是在與數(shù)據(jù)原來(lái)具有的特征量的特征量空間不同的輸出特征量空間中表示的特征量。例如,輸出特征量是具有與分類器數(shù)目相等的維度的向量,而輸出特征量空間是輸出特征量的向量被表示于的向量空間。由于輸出特征量是通過(guò)在原始特征量空間中的學(xué)習(xí)而生成的,因而輸出特征量具有適合于分類的表達(dá)。另外,通過(guò)設(shè)定待由分類器生成部130生成的分類器的數(shù)目,可將輸出特征量的維度設(shè)定成低于數(shù)據(jù)原來(lái)具有的特征量的維度。在已被輸出特征量獲取部140獲取并且已與數(shù)據(jù)相關(guān)聯(lián)的輸出特征量將被進(jìn)一步降低維度的情況下,提供維度壓縮部150。維度壓縮部150通過(guò)使用例如PCA 或ICA等算法對(duì)輸出特征量進(jìn)行維度壓縮。此處,例如假設(shè)數(shù)據(jù)原來(lái)具有的特征量是 “Bag-of-keypoints”特征量。由于“Bag-of-keypoints”特征量是在高維度稀疏特征量空間中表示的特征量,因而當(dāng)試圖以原樣狀態(tài)進(jìn)行維度壓縮處理時(shí),存在因受數(shù)據(jù)分散或失效值的影響而僅留下無(wú)意義的成分的風(fēng)險(xiǎn)。也即,存在“Bag-of-keypoints”特征量以不適合于分類的形式被降低維度的風(fēng)險(xiǎn)。另一方面,由于輸出特征量如上所述那樣包括從分類器獲得的輸出值,因而可不受到數(shù)據(jù)分散或失效值的直接影響而進(jìn)行維度壓縮處理。類別分類部160基于輸出特征量將數(shù)據(jù)群中所包含的未知數(shù)據(jù)分類成預(yù)定數(shù)目的類別中的任一個(gè)。此處,對(duì)于未知數(shù)據(jù)的分類,可使用例如聚類分析等無(wú)監(jiān)管分類的技術(shù)。由于輸出特征量是通過(guò)在原始特征量空間中的學(xué)習(xí)而生成的,因而輸出特征量具有適合于分類的表達(dá)。因此,類別分類部160中的無(wú)監(jiān)管分類的精度與使用原始特征量的無(wú)監(jiān)管分類相比可得以提高。此外,如上所述,在輸出特征量的維度低于數(shù)據(jù)原來(lái)具有的特征量的維度的情況下,類別分類部160中的無(wú)監(jiān)管分類的精度可進(jìn)一步提高。另外,在數(shù)據(jù)群中包含已知數(shù)據(jù)的情況下,輸出特征量包括根據(jù)已知數(shù)據(jù)的學(xué)習(xí)樣本生成的、從分類器獲得的輸出值。在這種情況下,實(shí)際分類的重要特征反映在輸出特征量上,由此,類別分類部160 中的有監(jiān)管分類的精度可進(jìn)一步提高。存儲(chǔ)部170存儲(chǔ)了信息處理裝置100中的處理所必需的數(shù)據(jù)。例如,在存儲(chǔ)部170 中,存儲(chǔ)有在信息處理裝置100中成為分類對(duì)象的數(shù)據(jù)群。另外,在存儲(chǔ)部170中,還可暫時(shí)地存儲(chǔ)有在信息處理裝置100的各部中進(jìn)行的處理中生成的數(shù)據(jù)。此外,在以軟件實(shí)施信息處理裝置100的各功能的情況下,存儲(chǔ)部170可暫時(shí)或永久地存儲(chǔ)可通過(guò)被CPU執(zhí)行來(lái)實(shí)現(xiàn)各自功能的程序。信息處理裝置100除了以上說(shuō)明的結(jié)構(gòu)元件以外,還可按需要包括諸如用于輸入/輸出包含數(shù)據(jù)群和分類結(jié)果的信息的USB (通用串行總線)或LAN(局域網(wǎng))等通信接口 ;以及用于在執(zhí)行處理時(shí)等獲取用戶的指令的鍵盤或鼠標(biāo)器等輸入裝置的結(jié)構(gòu)元件(未圖示)。(1-2.分類處理)(成為對(duì)象的數(shù)據(jù))接下來(lái),參照?qǐng)D2 4說(shuō)明根據(jù)本發(fā)明的實(shí)施例的成為分類處理的對(duì)象的數(shù)據(jù)。注意,下面作為一例而說(shuō)明這樣的情況成為分類對(duì)象的數(shù)據(jù)是包含某種物體的圖像數(shù)據(jù),而數(shù)據(jù)被分類成的類別是圖像中所包含的物體。然而,只要數(shù)據(jù)具有特征量,本發(fā)明的實(shí)施例就還可應(yīng)用于圖像數(shù)據(jù)以外的數(shù)據(jù),例如聲音數(shù)據(jù)或運(yùn)動(dòng)圖像數(shù)據(jù)。另外,下面作為一例而說(shuō)明這樣的情況數(shù)據(jù)所具有的特征量是“Bag-of-keypoints”特征量。然而,只要特征量被表示在特征量空間中,本發(fā)明的實(shí)施例就還可應(yīng)用于任何其它特征量。特別地,在數(shù)據(jù)所具有的特征量的維度高的情況下,可獲得比應(yīng)用本發(fā)明的實(shí)施例的情況更有利的效果。圖2是說(shuō)明根據(jù)本發(fā)明的實(shí)施例的數(shù)據(jù)群G的圖。參照?qǐng)D2,數(shù)據(jù)群G包含已知數(shù)據(jù)和未知數(shù)據(jù)。注意,如上所述,數(shù)據(jù)群G不一定包含已知數(shù)據(jù)。在圖示的例子中,已知數(shù)據(jù)被分類成分別具有標(biāo)簽“相機(jī)”、“豹”和“手表”的類別。例如,被分類成具有標(biāo)簽“相機(jī)”的類別的數(shù)據(jù)在圖中被表達(dá)為相機(jī)1、相機(jī)2、...等等。通過(guò)某種方法知道這些數(shù)據(jù)是各自包含相機(jī)的圖像數(shù)據(jù)。同樣地,被分類成具有標(biāo)簽“豹”的類別的數(shù)據(jù)被表達(dá)為豹1、豹2、...等等,而被分類成具有標(biāo)簽“手表”的類別的數(shù)據(jù)被表達(dá)為手表1、手表2、...等等。在圖示的例子中,未知數(shù)據(jù)表示未被分類成上述三個(gè)類別中的任一個(gè)的數(shù)據(jù)。未知數(shù)據(jù)在圖中被表達(dá)為未知1、未知2、未知3、...等等。雖然未知數(shù)據(jù)在該時(shí)刻未被分類成類別,但卻基于某種標(biāo)準(zhǔn)而被決定要分類成“盆景”、“杯子”、“筆記本電腦”、“渡船”、“熊貓”和“向日葵”這六個(gè)類別中的任一個(gè)。因此,附圖的例子中所示的數(shù)據(jù)群G中所包含的數(shù)據(jù)被分類成包括已知的三個(gè)類別在內(nèi)的共9個(gè)類別中的任一個(gè)。包含已知數(shù)據(jù)和未知數(shù)據(jù)的數(shù)據(jù)群G的數(shù)據(jù)具有特征量。此處,例如在已知數(shù)據(jù)中,在被分類成具有“相機(jī)”標(biāo)簽的類別的數(shù)據(jù)的特征量上,反映了包含相機(jī)的圖像的特征。 同樣地,在被分類成具有“豹”標(biāo)簽的類別的數(shù)據(jù)的特征量上,反映了包含豹的圖像的特征。 另外,在被分類成具有“手表”標(biāo)簽的類別的數(shù)據(jù)的特征量上,反映了包含手表的圖像的特征。另一方面,對(duì)于未知數(shù)據(jù)被分類成的“盆景”、“杯子”、“筆記本電腦”、“渡船”、“熊貓”和 “向日葵”這六個(gè)類別,不知道被分類成各類別的數(shù)據(jù)具有什么樣的特征量?jī)A向。此處,該未知數(shù)據(jù)的特征量將參照?qǐng)D3和4作進(jìn)一步說(shuō)明。圖3是說(shuō)明根據(jù)本發(fā)明的實(shí)施例的未知數(shù)據(jù)在特征量空間Sl中的特征量的圖。圖 4是逐類別地說(shuō)明根據(jù)本發(fā)明的實(shí)施例的未知數(shù)據(jù)在特征量空間Sl中的特征量的圖。參照?qǐng)D3,示出了數(shù)據(jù)群G中所包含的未知數(shù)據(jù)的特征量被表示于的特征量空間Si。參照?qǐng)D 4,示出了對(duì)被分類成“盆景”、“杯子”、“筆記本電腦”、“渡船”、“熊貓”和“向日葵”這六個(gè)類別的未知數(shù)據(jù)各自的特征量進(jìn)行表示的特征量空間Sla Slf。注意,在圖3和4中,使用 Sammon映射將各特征量投影到二維中。如圖3和4所示,被分類成各類別的未知數(shù)據(jù)的各特征量對(duì)于每個(gè)類別以某種程度的傾向分布在特征量空間Sl中。然而,例如,在特征量空間Sle中表示的“熊貓”類別和在特征量空間Slf中表示的“向日葵”類別以它們的大多數(shù)部分交疊的方式顯示在特征量空間Sl中。因而,在精度低的分類中,難以將未知數(shù)據(jù)精確地分類成那些類別。此處,由于未知數(shù)據(jù)所具有的特征量是作為高維度特征量的“Bag-of-keypoints”特征量,因而在使用未知數(shù)據(jù)的特征量來(lái)進(jìn)行聚類分析等無(wú)監(jiān)管分類的情況下,因上述維度詛咒的影響而使分類的精度降低,且變得難以將未知數(shù)據(jù)精確地分類成各類別。在這種數(shù)據(jù)的情況下,根據(jù)本發(fā)明的實(shí)施例的數(shù)據(jù)分類處理尤其獲得有利的效果。下面說(shuō)明數(shù)據(jù)分類處理的各步驟的處理。(數(shù)據(jù)池生成處理)接下來(lái),參照?qǐng)D5 13說(shuō)明根據(jù)本發(fā)明的實(shí)施例的分類的一系列處理程序。圖5 是示出根據(jù)本發(fā)明的實(shí)施例的一系列處理程序的流程圖。下面,參照?qǐng)D5所示的流程圖并在必要時(shí)還參照其它附圖來(lái)說(shuō)明在信息處理裝置100中進(jìn)行的分類處理。參照?qǐng)D5,首先,數(shù)據(jù)池生成部110生成包含數(shù)據(jù)群G中的數(shù)據(jù)的數(shù)據(jù)池(步驟 S101)o此處,生成數(shù)據(jù)池的處理將參照?qǐng)D6來(lái)說(shuō)明。圖6是示出根據(jù)本發(fā)明的實(shí)施例的生成數(shù)據(jù)池P的處理的圖。參照?qǐng)D6,生成這樣的未知數(shù)據(jù)池Pu 在數(shù)據(jù)群G中所包含的數(shù)據(jù)當(dāng)中,未知數(shù)據(jù)池Pu包含應(yīng)被分類成的類別未知的未知數(shù)據(jù)。在附圖所示的例子中,包含向日葵的圖像數(shù)據(jù)、包含杯子的圖像數(shù)據(jù)和包含盆景的圖像數(shù)據(jù)作為未知數(shù)據(jù)而被包含在未知數(shù)據(jù)池Pu中。盡管在附圖所示的例子中存在一個(gè)未知數(shù)據(jù)池Pu,但也可生成多個(gè)未知數(shù)據(jù)池Pu。此外,在數(shù)據(jù)群G中存在應(yīng)被分類成的類別已知的已知數(shù)據(jù)的情況下,生成包含已知數(shù)據(jù)的已知數(shù)據(jù)池Pk。已知數(shù)據(jù)池Pk具有其中所包含的已知數(shù)據(jù)被分類成的類別的標(biāo)簽。在附圖所示的例子中,生成了包含被分類成具有“相機(jī)”標(biāo)簽的類別的已知數(shù)據(jù)的已知數(shù)據(jù)池Pkl (其標(biāo)簽為“相機(jī)”)、包含被分類成具有“豹”標(biāo)簽的類別的已知數(shù)據(jù)的已知數(shù)據(jù)池Pk2 (其標(biāo)簽為“豹”)和包含被分類成具有“手表”標(biāo)簽的類別的已知數(shù)據(jù)的已知數(shù)據(jù)池Pk3 (其標(biāo)簽為“手表”)。(學(xué)習(xí)樣本的收集處理)再次參照?qǐng)D5,隨后,學(xué)習(xí)樣本收集部120收集數(shù)據(jù)池中所包含的數(shù)據(jù)作為學(xué)習(xí)樣本(步驟S103)。此處,收集學(xué)習(xí)樣本的處理將參照?qǐng)D7來(lái)說(shuō)明。圖7是示出根據(jù)本發(fā)明的實(shí)施例的收集學(xué)習(xí)樣本L的處理的圖。參照?qǐng)D7,從未知數(shù)據(jù)池Pu中收集學(xué)習(xí)樣ILn,并從已知數(shù)據(jù)池Pkl中收集學(xué)習(xí)樣本Lp學(xué)習(xí)樣本收集可通過(guò)重復(fù)以下處理來(lái)進(jìn)行提取任一數(shù)據(jù)池中所包含的預(yù)定數(shù)目的數(shù)據(jù),該預(yù)定數(shù)目足以在隨后的處理中生成分類器;并將所提取的預(yù)定數(shù)目的數(shù)據(jù)設(shè)定為一個(gè)學(xué)習(xí)樣本L。來(lái)自未知數(shù)據(jù)池Pu的學(xué)習(xí)樣本Ln是通過(guò)限制特征量空間Sl中的距離而收集到的。首先,從未知數(shù)據(jù)池Pu中隨機(jī)地提取一個(gè)中心數(shù)據(jù)。該中心數(shù)據(jù)可從未知數(shù)據(jù)池Pu中的任何地方提取。接著,提取相對(duì)于中心數(shù)據(jù)的鄰近數(shù)據(jù)。此處,鄰近數(shù)據(jù)在特征量空間Sl 中具有位于中心數(shù)據(jù)在特征量空間Si中的特征量附近的特征量。以鄰近數(shù)據(jù)在特征量空間Si中的特征量距中心數(shù)據(jù)在特征量空間Sl中的特征量的距離的升序來(lái)提取鄰近數(shù)據(jù), 直到包括中心數(shù)據(jù)在內(nèi)的所提取的數(shù)據(jù)的數(shù)目成為預(yù)定數(shù)目為止。對(duì)于鄰近數(shù)據(jù)的提取, 可使用最鄰近搜索的算法。盡管通過(guò)這種處理從未知數(shù)據(jù)池Pu中收集到的學(xué)習(xí)樣本Ln中所包含的一群數(shù)據(jù)在特征量空間Sl中的位置是隨機(jī)的,但卻具有這樣的特征各數(shù)據(jù)在特征量空間Sl中彼此位置鄰近。另一方面,來(lái)自已知數(shù)據(jù)池Pkl的學(xué)習(xí)樣本L1是通過(guò)限制數(shù)據(jù)池的標(biāo)簽而收集到的。此處,從已知數(shù)據(jù)池Pkl中僅隨機(jī)地提取預(yù)定數(shù)目的數(shù)據(jù)。從已知數(shù)據(jù)池Pkl中收集到的學(xué)習(xí)樣本L1中所包含的一群數(shù)據(jù)僅由已知數(shù)據(jù)池Pkl中所包含的數(shù)據(jù)構(gòu)成,而已知數(shù)據(jù)池Pk2或Pk3等其它數(shù)據(jù)池或未知數(shù)據(jù)池Pu中所包含的數(shù)據(jù)則不被包括。在數(shù)據(jù)群G中存在已知數(shù)據(jù)的情況下,由從未知數(shù)據(jù)池Pu中提取的數(shù)據(jù)形成的學(xué)習(xí)樣本L的數(shù)目與由從已知數(shù)據(jù)池Pk中提取的數(shù)據(jù)形成的學(xué)習(xí)樣本L的數(shù)目的比率可依據(jù)已知數(shù)據(jù)被分類成的類別的數(shù)目與已知數(shù)據(jù)未被分類成的類別的數(shù)目的比率來(lái)確定。對(duì)附圖中所示的例子的情況將作具體的說(shuō)明。在附圖中所示的例子中,預(yù)定數(shù)目的類別的數(shù)目是九個(gè),且其中三個(gè)類別(“相機(jī)”、“豹”和“手表”)是已知數(shù)據(jù)被分類成的類別,其它六個(gè)類別(“盆景”、“杯子”、“筆記本電腦”、“渡船”、“熊貓”和“向日葵”)是已知數(shù)據(jù)未被分類成的類別。在這種情況下,學(xué)習(xí)樣本L被收集的比例是從已知數(shù)據(jù)池Pkl收集一個(gè)、從已知數(shù)據(jù)池Pk2收集一個(gè)、從已知數(shù)據(jù)池Pk3收集一個(gè)、并從未知數(shù)據(jù)池Pu收集六個(gè)。也即,在從已知數(shù)據(jù)池Pkl收集10個(gè)學(xué)習(xí)樣本L的情況下,還從已知數(shù)據(jù)池Pk2收集10個(gè)學(xué)習(xí)樣本 L、還從已知數(shù)據(jù)池Pk3收集10個(gè)學(xué)習(xí)樣本L、并從未知數(shù)據(jù)池Pu收集60個(gè)學(xué)習(xí)樣本L。通過(guò)在隨后的步驟中使用這樣收集到的學(xué)習(xí)樣本L來(lái)生成分類器,可生成與所有類別都無(wú)偏倚地相容的多個(gè)分類器,并可無(wú)偏倚地提高各類別的分類精度。(分類器生成處理)再次參照?qǐng)D5,隨后,分類器生成部130根據(jù)已被收集到的多個(gè)學(xué)習(xí)樣本L來(lái)生成多個(gè)分類器(步驟S105)。此處,生成分類器的處理將參照?qǐng)D8 10來(lái)說(shuō)明。圖8是示出根據(jù)本發(fā)明的實(shí)施例的生成分類器D的處理的圖。參照?qǐng)D8,使用學(xué)習(xí)樣本L1和學(xué)習(xí)樣本L2生成分類器D1,使用學(xué)習(xí)樣本L3和學(xué)習(xí)樣本L4生成分類器D2,同樣地,直到使用學(xué)習(xí)樣本Lim和學(xué)習(xí)樣本Ln生成分類器Dn為止,共計(jì)生成η個(gè)分類器。此處,作為分類器D的一例,使用了二類別分類器(一對(duì)一分類器)。二類別分類器針對(duì)輸入數(shù)據(jù)輸出用于將該數(shù)據(jù)分成兩個(gè)分類的實(shí)數(shù)值,例如距識(shí)別超平面的距離或概率。為了生成這種二類別分類器,可使用諸如SVM的有監(jiān)管分類的算法。在步驟S103中,由學(xué)習(xí)樣本收集部120收集用于生成分類器D的多個(gè)學(xué)習(xí)樣本L。希望分類器生成部130無(wú)偏倚地使用多個(gè)學(xué)習(xí)樣本L并生成多個(gè)分類器D。在上例中,成為分類器D的識(shí)別對(duì)象的兩個(gè)分類是由據(jù)以生成分類器D的兩個(gè)學(xué)習(xí)樣本所給予的。例如,假設(shè)從已知數(shù)據(jù)池Pkl中收集學(xué)習(xí)樣IL1并從已知數(shù)據(jù)池Pk2中收集學(xué)習(xí)樣本L2。在這種情況下,分類器D1將已知數(shù)據(jù)池Pkl中所包含的數(shù)據(jù)和已知數(shù)據(jù)池 Pk2中所包含的數(shù)據(jù)設(shè)定為兩個(gè)分類,識(shí)別輸入數(shù)據(jù)并輸出用于將該數(shù)據(jù)分成這兩個(gè)分類的值。也即,分類器D1區(qū)分被分類成具有“相機(jī)”標(biāo)簽的類別的已知數(shù)據(jù)與被分類成具有“豹” 標(biāo)簽的類別的已知數(shù)據(jù)。另外,在另一例中,假設(shè)從未知數(shù)據(jù)池Pu中收集學(xué)習(xí)樣本Lim并還從未知數(shù)據(jù)池Pu 中收集學(xué)習(xí)樣本Ln。在這種情況下,在未知數(shù)據(jù)池Pu中所包含的未知數(shù)據(jù)當(dāng)中,分類器Dn 將在特征量空間Sl中某處彼此靠近的一群未知數(shù)據(jù)和在特征量空間Sl中上述群的位置以外的某處彼此靠近的一群未知數(shù)據(jù)設(shè)定為兩個(gè)分類,并輸出用于將輸入數(shù)據(jù)分成這兩個(gè)分類的值。也即,分類器仏區(qū)分以下兩種未知數(shù)據(jù)盡管在該時(shí)刻未被分類成類別、但卻被認(rèn)為由于被表示在特征量空間Sl中而彼此具有某種相似性的未知數(shù)據(jù);盡管同樣在該時(shí)刻未被分類成類別、但卻被認(rèn)為由于被表示在特征量空間Sl中而彼此具有上述未知數(shù)據(jù)之間的相似性以外的某種相似性的未知數(shù)據(jù)。這種分類器D的工作將參照?qǐng)D9和10進(jìn)一步說(shuō)明。 圖9是示出根據(jù)本發(fā)明的實(shí)施例的由分類器D進(jìn)行的已知數(shù)據(jù)的分類的圖。參照?qǐng)D9,分類器Da是通過(guò)將被分類成具有“盆景”標(biāo)簽的類別的預(yù)定數(shù)目的已知數(shù)據(jù)用作學(xué)習(xí)樣本、并且將被分類成具有“豹”標(biāo)簽的類別的預(yù)定數(shù)目的已知數(shù)據(jù)用作學(xué)習(xí)樣本而生成的。因而,被分類成具有“盆景”標(biāo)簽的類別的數(shù)據(jù)的某種特征點(diǎn)以及被分類成具有“豹”標(biāo)簽的類別的數(shù)據(jù)的某種特征點(diǎn)被反映在分類器Da中。因此,分類器Da區(qū)別被分類成具有 “盆景”標(biāo)簽的類別的數(shù)據(jù)與被分類成具有“豹”標(biāo)簽的類別的數(shù)據(jù)。例如,在被分類成具有 “盆景”標(biāo)簽的類別的已知數(shù)據(jù)被輸入的情況下,分類器Da輸出表明輸入數(shù)據(jù)被分類成“盆景”的值。另外,在未被分類成具有“盆景”標(biāo)簽或“豹”標(biāo)簽的類別中的任一個(gè)的未知數(shù)據(jù)被輸入的情況下,分類器Da輸出表明輸入數(shù)據(jù)距“盆景”和“豹”中的哪一個(gè)更近、以及輸入數(shù)據(jù)距“盆景”或“豹”有多近的值。 圖10是示出根據(jù)本發(fā)明的實(shí)施例的由分類器D進(jìn)行的未知數(shù)據(jù)的分類的圖。參照?qǐng)D10,分類器Db是通過(guò)將位于特征量空間Sl中某個(gè)位置附近的預(yù)定數(shù)目的未知數(shù)據(jù)(在附圖所示的例子中是向日葵、熊貓等)用作學(xué)習(xí)樣本、并且將位于特征量空間Sl中另一位置附近的預(yù)定數(shù)目的未知數(shù)據(jù)(在附圖所示的例子中是相機(jī)、杯子等)用作學(xué)習(xí)樣本而生成的。因而,位于特征量空間Sl中某位置附近的數(shù)據(jù)的某種特征點(diǎn)以及位于特征量空間Sl 中另一位置附近的數(shù)據(jù)的某種特征點(diǎn)被反映在分類器Db上。因此,分類器Db區(qū)分位于特征量空間Sl中某點(diǎn)附近的數(shù)據(jù)與位于特征量空間Sl中另一點(diǎn)附近的數(shù)據(jù)。例如,在特征量空間Sl中位于與圖中左側(cè)的組中所包含的向日葵和熊貓等數(shù)據(jù)的位置靠近的位置處的數(shù)據(jù)被輸入的情況下,分類器Db輸出表明輸入數(shù)據(jù)靠近圖中左側(cè)的組的值。這樣,分類器D針對(duì)在特征量空間Sl中表示的輸入數(shù)據(jù)而輸出用于對(duì)要基于某種標(biāo)準(zhǔn)將數(shù)據(jù)分類成的兩個(gè)分類進(jìn)行區(qū)分的值。在圖9所示的例子中,分類器Da基于輸入數(shù)據(jù)距類別“盆景”和“豹”中的哪一個(gè)更近這一標(biāo)準(zhǔn)對(duì)輸入數(shù)據(jù)進(jìn)行分類。也即,來(lái)自分類器Da的輸出值是表明輸入數(shù)據(jù)距“盆景”和“豹”中的哪一個(gè)更近的實(shí)數(shù)值。另一方面,在圖10所示的例子中,分類器Db基于輸入數(shù)據(jù)距兩個(gè)群的未知數(shù)據(jù)各自所位于的特征量空間Sl中的位置中的哪一個(gè)更近這一標(biāo)準(zhǔn)對(duì)輸入數(shù)據(jù)進(jìn)行分類。也即,來(lái)自分類器Db的輸出值是表明輸入數(shù)據(jù)距在特征量空間Sl中在各群內(nèi)具有某種相似性的數(shù)據(jù)的兩個(gè)群中的哪一個(gè)更近的實(shí)數(shù)值。(輸出特征量獲取處理)再次參照?qǐng)D5,隨后,輸出特征量獲取部140通過(guò)將數(shù)據(jù)群G中的數(shù)據(jù)輸入到多個(gè)分類器D中的每一個(gè)中并識(shí)別該數(shù)據(jù)來(lái)獲取輸出特征量(步驟S107)。此處,獲取輸出特征量的處理將參照?qǐng)D11 13來(lái)說(shuō)明。圖11是示出根據(jù)本發(fā)明的實(shí)施例的獲取輸出特征量V。ut的處理的圖。參照?qǐng)D11,
      輸出特征量v。ut包括作為元素的η個(gè)輸出值R1、R2.....to。輸出值R1、R2.....Rn是由于
      將數(shù)據(jù)群G中所包含的一個(gè)數(shù)據(jù)輸入到分類器生成部130所生成的η個(gè)分類器Dl、D2.....
      Dn中的每一個(gè)中并識(shí)別該數(shù)據(jù)而輸出的。輸出特征量獲取部140對(duì)于數(shù)據(jù)群G中所包含的每個(gè)數(shù)據(jù),獲取輸出特征量V。ut并將輸出特征量V。ut與該數(shù)據(jù)相關(guān)聯(lián)。輸出特征量V。ut是具有與分類器D的數(shù)目相等的維度的向量。因而,通過(guò)設(shè)定分類器生成部130所生成的分類器D的數(shù)目,可設(shè)定輸出特征量V。ut的維度。因此,例如,在數(shù)據(jù)所具有的原始特征量是作為高維度特征量的“Bag-of-keypoints”特征量的情況下,通過(guò)將分類器D的數(shù)目設(shè)定成小于特征量的維度,能以比原始維度低的維度獲取輸出特征量V。ut。因此,在未知數(shù)據(jù)的聚類分析等無(wú)監(jiān)管分類中,可抑制精度降低。此處,進(jìn)一步說(shuō)明作為輸出特征量V。ut的元素的輸出值R。例如,輸出特征量V。ut 包括分類器Dl的輸出值R1。如參照?qǐng)D8所說(shuō)明的那樣,分類器Dl是通過(guò)使用從具有“相機(jī)”標(biāo)簽的已知數(shù)據(jù)池Pkl中提取的學(xué)習(xí)樣本L1和從具有“豹”標(biāo)簽的已知數(shù)據(jù)池Pk2中提取的學(xué)習(xí)樣本L2而生成的二類別分類器。因而,分類器Dl的輸出值Rl是表明輸入數(shù)據(jù)距相機(jī)和豹中的哪一個(gè)更近的實(shí)數(shù)值。另外,輸出特征量V。ut包括分類器Dn的輸出值to。如參照?qǐng)D8所說(shuō)明的那樣,分類器Dn是通過(guò)使用包含在未知數(shù)據(jù)中并且包括在特征量空間Sl中某處彼此靠近的一群未知數(shù)據(jù)的學(xué)習(xí)樣本LN_i、以及同樣包含在未知數(shù)據(jù)池Pu中并且包括在特征量空間Sl中上述群的位置以外的某處彼此靠近的一群未知數(shù)據(jù)的學(xué)習(xí)樣本Ln而生成的二類別分類器。因而,分類器Dn的輸出值to是表明輸入數(shù)據(jù)距在特征量空間Sl中在各群內(nèi)具有某種相似性的數(shù)據(jù)的兩個(gè)群中的哪一個(gè)更近的實(shí)數(shù)值。這樣,輸出特征量V-將表明數(shù)據(jù)距在各群內(nèi)具有某種相似性的數(shù)據(jù)的兩個(gè)群中的哪一個(gè)更近的輸出值R設(shè)定為元素。此處,在通過(guò)包含從未知數(shù)據(jù)中提取的學(xué)習(xí)樣本L 而生成的分類器D中,某種相似性是在特征量空間Sl中表示數(shù)據(jù)的情況下特征量空間Sl 中的距離的遠(yuǎn)近。最初從未知數(shù)據(jù)中提取的學(xué)習(xí)樣本的數(shù)據(jù)是從未知數(shù)據(jù)當(dāng)中隨機(jī)地提取的。因而,當(dāng)從未知數(shù)據(jù)中提取的學(xué)習(xí)樣本L的數(shù)目足夠大時(shí),通過(guò)包含從未知數(shù)據(jù)中提取的學(xué)習(xí)樣本L而生成的多個(gè)分類器D的多個(gè)輸出值R可在某種程度上全面地反映未知數(shù)據(jù)在特征量空間Sl中的分布。另外,在通過(guò)包含從已知數(shù)據(jù)中提取的學(xué)習(xí)樣本L而生成的分類器D中,某種相似性是已知數(shù)據(jù)被分類成的類別所具有的給定標(biāo)簽。注意,如上所述,在本發(fā)明的實(shí)施例中, 已知數(shù)據(jù)不一定存在。然而,在已知數(shù)據(jù)存在的情況下,有可能比如像“數(shù)據(jù)距相機(jī)和豹中的哪一個(gè)更近”那樣、從已知數(shù)據(jù)中取出在實(shí)際分類中基于重要特征而分類的結(jié)果,并將該結(jié)果包含在輸出特征量v。ut中作為輸出值R。由此,在已知數(shù)據(jù)和未知數(shù)據(jù)混在一起的情況下,能以比僅以未知數(shù)據(jù)為對(duì)象的無(wú)監(jiān)管分類的情況更高的精度來(lái)進(jìn)行未知數(shù)據(jù)的分類。圖12是說(shuō)明根據(jù)本發(fā)明的實(shí)施例的未知數(shù)據(jù)在輸出特征量空間S2中的輸出特征量v。ut的圖。圖13是逐類別地說(shuō)明根據(jù)本發(fā)明的實(shí)施例的未知數(shù)據(jù)在輸出特征量空間S2 中的輸出特征量V。ut的圖。參照?qǐng)D12,示出了數(shù)據(jù)群G中所包含的未知數(shù)據(jù)的輸出特征量 V。ut被表示于的輸出特征量空間S2。參照?qǐng)D13,示出了對(duì)被分類成“盆景”、“杯子”、“筆記本電腦”、“渡船”、“熊貓”和“向日葵”這六個(gè)類別的未知數(shù)據(jù)各自的輸出特征量V。ut進(jìn)行表示的輸出特征量空間Sb S2f。注意,在圖12和13中,使用Sammon映射將各輸出特征量 Vout投影到二維中。如圖12和13所示,在輸出特征量空間S2中,與特征量空間Sl相比,各類別的輸出特征量v。ut以更偏倚的方式分布。例如,參照輸出特征量空間Sk和輸出特征量空間S2f, 在特征量空間Sl中以它們的大多數(shù)部分交疊的方式顯示的“熊貓”類別和“向日葵”類別各自在不同方向上以偏倚的方式分布。這樣,輸出特征量空間S2是與特征量空間Sl不同的特征量空間。因此,在輸出特征量空間S2中分布的各數(shù)據(jù)的輸出特征量V。ut可以以與在特征量空間Sl中分布的各數(shù)據(jù)的特征量不同的傾向來(lái)分布。(輸出特征量維度壓縮處理)再次參照?qǐng)D5,隨后,維度壓縮部150對(duì)輸出特征量V。ut進(jìn)行維度壓縮(步驟 S109)。該步驟是根據(jù)需要執(zhí)行的。也即,步驟S109是在進(jìn)一步降低在步驟S107中生成的輸出特征量V。ut的維度的情況下執(zhí)行的。例如,為了將未知數(shù)據(jù)在特征量空間Sl中的分布全面地反映在輸出值R上,在將在步驟S105中生成的分類器D的數(shù)目設(shè)定得大的情況下, 輸出特征量V。ut的維度變高。在這種情況下,通過(guò)在步驟S109中對(duì)輸出特征量V。ut進(jìn)行維度壓縮,可在未知數(shù)據(jù)的聚類分析等無(wú)監(jiān)管分類中抑制精度的降低。對(duì)于步驟S109中的維度壓縮,可使用例如PCA、ICA或多維度縮放(MDS)等算法。 此處,作為輸出特征量V。ut的元素的分類器D的輸出值R是用于將數(shù)據(jù)分成兩個(gè)分類的實(shí)數(shù)值,例如距識(shí)別超平面的距離或概率。因而,即使當(dāng)PCA、ICA或MDS等算法被用于輸出特征量V。ut的維度壓縮時(shí),該維度壓縮也很難可能被數(shù)據(jù)所具有的原始特征量中所包含的失
      14效值、數(shù)據(jù)分散等所影響。另外,此處,在數(shù)據(jù)群G中存在已知數(shù)據(jù)的情況下,當(dāng)要受到維度壓縮的輸出特征量V。ut中包含了通過(guò)包含已知數(shù)據(jù)而生成的分類器D的輸出值R時(shí),可通過(guò)在實(shí)際分類中捕捉重要特征來(lái)進(jìn)行維度壓縮。(基于輸出特征量的數(shù)據(jù)分類處理)隨后,類別分類部160基于各數(shù)據(jù)的輸出特征量V。ut對(duì)數(shù)據(jù)群G中所包含的未知數(shù)據(jù)進(jìn)行分類(步驟sill)。對(duì)于未知數(shù)據(jù)的分類,盡管可使用聚類分析等無(wú)監(jiān)管分類的技術(shù),但分類的精度比過(guò)去提高。這是因?yàn)槭褂昧送ㄟ^(guò)在原始特征量空間Sl中的學(xué)習(xí)而生成的、具有適合于分類的表達(dá)的輸出特征量v。ut。另外,還因?yàn)閿?shù)據(jù)所具有的多維度特征量被轉(zhuǎn)換成被降低維度為與分類器D的數(shù)目相等的數(shù)的輸出特征量V。ut,從而由所謂維度詛咒造成的分類的精度降低可得以抑制。此外,在步驟S109中對(duì)輸出特征量V。ut進(jìn)行維度壓縮的情況下,可進(jìn)一步降低輸出特征量V。ut的維度,并可進(jìn)一步提高分類的精度。再者,在數(shù)據(jù)群G中存在已知數(shù)據(jù)的情況下,可將實(shí)際分類中的重要特征反映在用于生成輸出特征量 Vout的學(xué)習(xí)上以及維度壓縮中,并可進(jìn)一步提高分類的精度。<2.變形例 >接下來(lái),參照?qǐng)D14說(shuō)明本發(fā)明的實(shí)施例的變形例。注意,下面要說(shuō)明的、成為對(duì)象的數(shù)據(jù)的配置以外的功能配置與上面說(shuō)明的本發(fā)明的實(shí)施例幾乎相同,因而省略其詳細(xì)說(shuō)明。圖14是說(shuō)明在本發(fā)明的實(shí)施例的變形例中意圖要處理的數(shù)據(jù)的配置的圖。參照?qǐng)D14,意圖要處理的數(shù)據(jù)包括由陰影部分表示的已知數(shù)據(jù)和由其余部分表示的未知數(shù)據(jù)。 此處,已知數(shù)據(jù)被分類成三個(gè)類別(具有“相機(jī)”標(biāo)簽的類別、具有“豹”標(biāo)簽的類別和具有“手表”標(biāo)簽的類別)中的任一個(gè)。在未知數(shù)據(jù)中,除了被分類成上述三個(gè)類別以外的類別的數(shù)據(jù)以外,還包含本應(yīng)被分類成上述三個(gè)類別之一但在該時(shí)刻被設(shè)定為未知數(shù)據(jù)的數(shù)據(jù)。也即,在該變形例中,未知數(shù)據(jù)可被分類成“相機(jī)”、“豹”、“手表”、“盆景”、“杯子”、“筆記本電腦”、“渡船”、“熊貓”和“向日葵”這九個(gè)類別中的任一個(gè)。在這種情況下,還從應(yīng)被分類成已知數(shù)據(jù)被分類成的類別(“相機(jī)”、“豹”和“手表”)的未知數(shù)據(jù)、以與其它未知數(shù)據(jù)相同的方式收集學(xué)習(xí)樣本L。也即,從這些未知數(shù)據(jù)收集到的學(xué)習(xí)樣本L是通過(guò)限制距離而收集到的。另外,來(lái)自已知數(shù)據(jù)的學(xué)習(xí)樣本是從被辨認(rèn)為已知數(shù)據(jù)的數(shù)據(jù)(圖中的陰影部分)收集到的。這樣,本發(fā)明的實(shí)施例也可應(yīng)用于包括應(yīng)進(jìn)一步被分類成已知數(shù)據(jù)被分類成的類別的未知數(shù)據(jù)在內(nèi)的數(shù)據(jù)的分類的處理。<3.總結(jié)〉在上面說(shuō)明的本發(fā)明的實(shí)施例中,通過(guò)使用與數(shù)據(jù)的特征量不同的輸出特征量 Vout,將數(shù)據(jù)群G中所包含的未知數(shù)據(jù)分類成預(yù)定數(shù)目的類別中的任一個(gè)。此處,輸出特征量 V。ut包含通過(guò)使用通過(guò)限制各數(shù)據(jù)在數(shù)據(jù)特征量被表示于的特征量空間Sl中的特征量的距離而提取的多個(gè)學(xué)習(xí)樣本L而生成的多個(gè)分類器D的輸出值R。憑借這種配置,有可能通過(guò)使用通過(guò)在特征量空間Sl中的學(xué)習(xí)而生成的、具有適合于分類的表達(dá)的輸出特征量V。ut 來(lái)對(duì)未知數(shù)據(jù)進(jìn)行分類,并提高分類的精度。另外,還有可能將高維度特征量的維度降低為與分類器D的數(shù)目相等的數(shù),并進(jìn)一步提高分類的精度。另外,在本發(fā)明的實(shí)施例中,在數(shù)據(jù)群G中包含應(yīng)被分類成的類別已知的已知數(shù)據(jù)的情況下,可以按如下方式來(lái)配置還通過(guò)限制被分類成的類別的標(biāo)簽而從已知數(shù)據(jù)收集學(xué)習(xí)樣本L。憑借這種配置,有可能生成反映實(shí)際分類中的重要特征的分類器D從而使用包含從分類器D輸出的輸出值R的輸出特征量V。ut來(lái)進(jìn)行分類,并進(jìn)一步提高分類的精度。另外,在本發(fā)明的實(shí)施例中,在數(shù)據(jù)群G中存在應(yīng)被分類成的類別已知的已知數(shù)據(jù)的情況下,可以按如下方式來(lái)配置依據(jù)在預(yù)定數(shù)目的類別當(dāng)中已知數(shù)據(jù)被分類成的類別的數(shù)目與已知數(shù)據(jù)未被分類成的類別的數(shù)目的比率,來(lái)確定從未知數(shù)據(jù)收集到的學(xué)習(xí)樣本L與從已知數(shù)據(jù)收集到的學(xué)習(xí)樣本L的比率。憑借這種配置,有可能使用包含根據(jù)無(wú)偏倚地收集到的學(xué)習(xí)樣本L生成的分類器D的輸出值R的輸出特征量V。ut來(lái)進(jìn)行各類別的分類,并無(wú)偏倚地提高各類別的分類精度。另外,在本發(fā)明的實(shí)施例中,可以按對(duì)輸出特征量V。ut進(jìn)一步進(jìn)行維度壓縮這一方式來(lái)配置。憑借這種配置,即使當(dāng)分類器D的數(shù)目被設(shè)定得大時(shí)也有可能將用于分類的輸出特征量V。ut的維度保持為低,并實(shí)現(xiàn)特征量空間Sl中的足夠?qū)W習(xí),同時(shí)兼顧分類的精度。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解取決于設(shè)計(jì)需求和其它因素,可以進(jìn)行各種修改、組合、子組合和變更,只要它們落入所附權(quán)利要求或其等價(jià)物的范圍以內(nèi)。例如,在上述實(shí)施例中,將圖像數(shù)據(jù)用作成為分類對(duì)象的數(shù)據(jù),但本發(fā)明的實(shí)施例不限于此例。例如,聲音數(shù)據(jù)、運(yùn)動(dòng)圖像數(shù)據(jù)或文本數(shù)據(jù)等一切具有特征量的數(shù)據(jù)都可以是適用本發(fā)明的實(shí)施例的分類對(duì)象。另外,在上述實(shí)施例中,作為成為分類對(duì)象的數(shù)據(jù)的一例的圖像數(shù)據(jù)所具有的特征量是“Bag-of-keypoints”特征量,但本發(fā)明的實(shí)施例不限于此例。例如,特征量也可以是SIFT特征量等其它特征量。另外,在上述實(shí)施例中,將二類別分類器用作分類器,但本發(fā)明的實(shí)施例不限于此例。例如,也可使用一對(duì)其余分類器等其它種類的分類器。本申請(qǐng)包含與在2010年5月27日向日本專利局提交的日本在先申請(qǐng)JP 2010-121272中所公開(kāi)的主題相關(guān)的主題,通過(guò)引用將該申請(qǐng)的全部?jī)?nèi)容合并于此。
      權(quán)利要求
      1.一種信息處理裝置,包括數(shù)據(jù)池生成部,所述數(shù)據(jù)池生成部生成這樣的未知數(shù)據(jù)池在包含在數(shù)據(jù)群中并具有在特征量空間中表示的特征量的數(shù)據(jù)當(dāng)中,所述未知數(shù)據(jù)池包含應(yīng)被分類成的類別未知的未知數(shù)據(jù);學(xué)習(xí)樣本收集部,所述學(xué)習(xí)樣本收集部執(zhí)行以下處理從所述未知數(shù)據(jù)池中隨機(jī)地提取一個(gè)中心數(shù)據(jù);提取在所述特征量空間中具有位于所述中心數(shù)據(jù)在所述特征量空間中的特征量附近的特征量的鄰近數(shù)據(jù),其中以所述鄰近數(shù)據(jù)在所述特征量空間中的所述特征量距所述中心數(shù)據(jù)在所述特征量空間中的所述特征量的距離的升序來(lái)提取所述鄰近數(shù)據(jù),直到所述鄰近數(shù)據(jù)的數(shù)目成為預(yù)定數(shù)目為止;并收集多個(gè)學(xué)習(xí)樣本,每個(gè)學(xué)習(xí)樣本包含已被提取的所述中心數(shù)據(jù)和所述鄰近數(shù)據(jù);分類器生成部,所述分類器生成部通過(guò)使用已被收集到的所述多個(gè)學(xué)習(xí)樣本來(lái)生成多個(gè)分類器;輸出特征量獲取部,對(duì)于所述數(shù)據(jù)群中所包含的每個(gè)所述數(shù)據(jù),所述輸出特征量獲取部將通過(guò)將所述數(shù)據(jù)輸入到所述多個(gè)分類器中以識(shí)別所述數(shù)據(jù)而獲得的多個(gè)輸出值作為在與所述特征量空間不同的輸出特征量空間中表示的輸出特征量而與所述數(shù)據(jù)相關(guān)聯(lián);以及類別分類部,所述類別分類部基于所述輸出特征量將所述數(shù)據(jù)群中所包含的每個(gè)所述未知數(shù)據(jù)分類成預(yù)定數(shù)目的所述類別中的任一個(gè)。
      2.根據(jù)權(quán)利要求1所述的信息處理裝置,其中,所述數(shù)據(jù)池生成部進(jìn)一步生成這樣的已知數(shù)據(jù)池在所述數(shù)據(jù)群中所包含的所述數(shù)據(jù)當(dāng)中,所述已知數(shù)據(jù)池包含應(yīng)被分類成的所述類別已知的已知數(shù)據(jù);且所述已知數(shù)據(jù)池具有所述已知數(shù)據(jù)被分類成的所述類別的標(biāo)簽,并且其中,所述學(xué)習(xí)樣本收集部進(jìn)一步從具有同一個(gè)所述標(biāo)簽的所述已知數(shù)據(jù)池中隨機(jī)地提取預(yù)定數(shù)目的所述數(shù)據(jù),并收集包含所提取的所述數(shù)據(jù)的學(xué)習(xí)樣本。
      3.根據(jù)權(quán)利要求2所述的信息處理裝置,其中,所述學(xué)習(xí)樣本收集部依據(jù)所述已知數(shù)據(jù)被分類成的所述類別的數(shù)目與所述已知數(shù)據(jù)未被分類成的所述類別的數(shù)目的比率,來(lái)確定由從所述未知數(shù)據(jù)中提取的數(shù)據(jù)形成的學(xué)習(xí)樣本的數(shù)目與由從所述已知數(shù)據(jù)中提取的數(shù)據(jù)形成的學(xué)習(xí)樣本的數(shù)目的比率。
      4.根據(jù)權(quán)利要求1所述的信息處理裝置,進(jìn)一步包括維度壓縮部,所述維度壓縮部對(duì)所述輸出特征量進(jìn)行維度壓縮,其中,所述類別分類部基于由所述維度壓縮部進(jìn)行了維度壓縮的所述輸出特征量來(lái)對(duì)所述數(shù)據(jù)進(jìn)行分類。
      5.一種信息處理方法,包括以下步驟生成這樣的未知數(shù)據(jù)池在包含在數(shù)據(jù)群中并具有在特征量空間中表示的特征量的數(shù)據(jù)當(dāng)中,所述未知數(shù)據(jù)池包含應(yīng)被分類成的類別未知的未知數(shù)據(jù);從所述未知數(shù)據(jù)池中隨機(jī)地提取一個(gè)中心數(shù)據(jù);提取在所述特征量空間中具有位于所述中心數(shù)據(jù)在所述特征量空間中的特征量附近的特征量的鄰近數(shù)據(jù),其中以所述鄰近數(shù)據(jù)在所述特征量空間中的所述特征量距所述中心數(shù)據(jù)在所述特征量空間中的所述特征量的距離的升序來(lái)提取所述鄰近數(shù)據(jù),直到所述鄰近數(shù)據(jù)的數(shù)目成為預(yù)定數(shù)目為止;并收集多個(gè)學(xué)習(xí)樣本,每個(gè)學(xué)習(xí)樣本包含已被提取的所述中心數(shù)據(jù)和所述鄰近數(shù)據(jù); 通過(guò)使用已被收集到的所述多個(gè)學(xué)習(xí)樣本來(lái)生成多個(gè)分類器; 對(duì)于所述數(shù)據(jù)群中所包含的每個(gè)所述數(shù)據(jù),將通過(guò)將所述數(shù)據(jù)輸入到所述多個(gè)分類器中以識(shí)別所述數(shù)據(jù)而獲得的多個(gè)輸出值作為在與所述特征量空間不同的輸出特征量空間中表示的輸出特征量而與所述數(shù)據(jù)相關(guān)聯(lián);以及基于所述輸出特征量將所述數(shù)據(jù)群中所包含的每個(gè)所述未知數(shù)據(jù)分類成預(yù)定數(shù)目的所述類別中的任一個(gè)。
      6. 一種使得計(jì)算機(jī)執(zhí)行以下處理的程序生成這樣的未知數(shù)據(jù)池在包含在數(shù)據(jù)群中并具有在特征量空間中表示的特征量的數(shù)據(jù)當(dāng)中,所述未知數(shù)據(jù)池包含應(yīng)被分類成的類別未知的未知數(shù)據(jù);從所述未知數(shù)據(jù)池中隨機(jī)地提取一個(gè)中心數(shù)據(jù);提取在所述特征量空間中具有位于所述中心數(shù)據(jù)在所述特征量空間中的特征量附近的特征量的鄰近數(shù)據(jù),其中以所述鄰近數(shù)據(jù)在所述特征量空間中的所述特征量距所述中心數(shù)據(jù)在所述特征量空間中的所述特征量的距離的升序來(lái)提取所述鄰近數(shù)據(jù),直到所述鄰近數(shù)據(jù)的數(shù)目成為預(yù)定數(shù)目為止;并收集多個(gè)學(xué)習(xí)樣本,每個(gè)學(xué)習(xí)樣本包含已被提取的所述中心數(shù)據(jù)和所述鄰近數(shù)據(jù); 通過(guò)使用已被收集到的所述多個(gè)學(xué)習(xí)樣本來(lái)生成多個(gè)分類器; 對(duì)于所述數(shù)據(jù)群中所包含的每個(gè)所述數(shù)據(jù),將通過(guò)將所述數(shù)據(jù)輸入到所述多個(gè)分類器中以識(shí)別所述數(shù)據(jù)而獲得的多個(gè)輸出值作為在與所述特征量空間不同的輸出特征量空間中表示的輸出特征量而與所述數(shù)據(jù)相關(guān)聯(lián);以及基于所述輸出特征量將所述數(shù)據(jù)群中所包含的每個(gè)所述未知數(shù)據(jù)分類成預(yù)定數(shù)目的所述類別中的任一個(gè)。
      全文摘要
      提供了一種信息處理裝置、信息處理方法和程序。所述信息處理裝置包括數(shù)據(jù)池生成部,其生成未知數(shù)據(jù)池;學(xué)習(xí)樣本收集部,其從所述未知數(shù)據(jù)池中隨機(jī)地收集多個(gè)學(xué)習(xí)樣本;分類器生成部,其使用所述學(xué)習(xí)樣本來(lái)生成多個(gè)分類器;輸出特征量獲取部,其對(duì)于每個(gè)所述數(shù)據(jù),將通過(guò)將所述數(shù)據(jù)輸入到所述多個(gè)分類器中以識(shí)別所述數(shù)據(jù)而獲得的多個(gè)輸出值作為在與所述特征量空間不同的輸出特征量空間中表示的輸出特征量而與所述數(shù)據(jù)相關(guān)聯(lián);以及類別分類部,其基于所述輸出特征量將每個(gè)所述數(shù)據(jù)分類成預(yù)定數(shù)目的所述類別中的任一個(gè)。
      文檔編號(hào)G06F15/18GK102262645SQ201110135729
      公開(kāi)日2011年11月30日 申請(qǐng)日期2011年5月20日 優(yōu)先權(quán)日2010年5月27日
      發(fā)明者巖井嘉昭, 本間俊一, 蘆原隆之 申請(qǐng)人:索尼公司
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1