国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于多示例學(xué)習(xí)的檢索方法及系統(tǒng)的制作方法

      文檔序號(hào):6426939閱讀:183來(lái)源:國(guó)知局
      專利名稱:一種基于多示例學(xué)習(xí)的檢索方法及系統(tǒng)的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明一般地涉及圖像處理技術(shù)領(lǐng)域,尤其是一種基于多示例學(xué)習(xí)的檢索方法及系統(tǒng)。
      背景技術(shù)
      隨著數(shù)字圖像數(shù)目的急劇增長(zhǎng),需要研究開發(fā)快速有效的圖像檢索技術(shù)。該技術(shù)可以應(yīng)用于人們生活的很多方面,比如數(shù)字照片管理、在線購(gòu)物、遠(yuǎn)程教育等等。關(guān)于圖像檢索技術(shù),主要包括基于文本的圖像檢索技術(shù),以及基于內(nèi)容的圖像檢索技術(shù)。其中,與基于文本的圖像檢索技術(shù)不同,基于內(nèi)容的圖像檢索不是基于對(duì)圖像的文字描述來(lái)建立索引,而是自動(dòng)提取每幅圖像的視覺內(nèi)容特征,例如色彩、紋理、形狀等,進(jìn)而 基于視覺內(nèi)容特征進(jìn)行索引。進(jìn)行檢索時(shí),用戶可以通過(guò)選擇具有代表性的一幅或多幅例子圖像來(lái)構(gòu)造查詢,然后由檢索系統(tǒng)查找與例子圖像在視覺內(nèi)容特征上相似的圖像。由于區(qū)域特征更加符合人類的視覺感知,并且基于區(qū)域特征進(jìn)行檢索的技術(shù)通??梢垣@得更加令人滿意的檢索性能,因此基于區(qū)域特征的圖像檢索成為基于內(nèi)容的圖像檢索中重要的手段。所謂基于區(qū)域特征進(jìn)行檢索,就是通過(guò)圖像分割技術(shù)提取圖像中有意義的區(qū)域,然后針對(duì)每個(gè)區(qū)域使用局部特征來(lái)描述,綜合各區(qū)域特征得到圖像的特征描述,基于這些特征設(shè)計(jì)檢索算法完成檢索。多示例學(xué)習(xí)就是一種已經(jīng)被成功地應(yīng)用于基于區(qū)域的圖像檢索的有效算法。在基于多示例學(xué)習(xí)的圖像檢索中,每幅圖像被看作一個(gè)包,而圖像中的每個(gè)區(qū)域則被看作一個(gè)示例。數(shù)據(jù)集由一些具有類別標(biāo)記的包組成,每個(gè)包中包含若干個(gè)沒有類別標(biāo)記的示例。多示例學(xué)習(xí)的基本出發(fā)點(diǎn)是如果一個(gè)包中至少包含一個(gè)正的示例,那么這個(gè)包就被標(biāo)記為正訓(xùn)練包;反之,如果一個(gè)包中全部是負(fù)的示例,那么這個(gè)包就被標(biāo)記為負(fù)訓(xùn)練包。對(duì)于負(fù)訓(xùn)練包而言,其中包含的示例一定是負(fù)的。但是對(duì)于正訓(xùn)練包而言,其中既包含正的示例也包含負(fù)的示例,而且系統(tǒng)不知道究竟哪些示例是正的,哪些示例是負(fù)的。因此,在多示例學(xué)習(xí)中,最重要的問(wèn)題就是如何利用正訓(xùn)練包中的示例提供的信息進(jìn)行檢索?,F(xiàn)有技術(shù)中的算法通常使用優(yōu)化的方法,試圖選出正訓(xùn)練包中包含的正示例,這種方法至少具有以下不足需要事先確定選出的示例數(shù)目,比如限制每個(gè)正訓(xùn)練包中只能選出一個(gè)正的示例,那么也只有一個(gè)示例參與最終的檢索,但實(shí)際上正訓(xùn)練包中往往包含不止一個(gè)正的示例,只利用其中一個(gè)示例進(jìn)行檢索,會(huì)導(dǎo)致正訓(xùn)練包中的示例提供的信息無(wú)法得到充分的利用,限制檢索的性能。

      發(fā)明內(nèi)容
      有鑒于此,本發(fā)明實(shí)施例提供了一種基于多示例學(xué)習(xí)的檢索方法及系統(tǒng),能夠使得正訓(xùn)練包中的示例提供的信息得到更為充分的利用,提高檢索性能。根據(jù)本發(fā)明實(shí)施例的一個(gè)方面,提供一種基于多不例學(xué)習(xí)的檢索方法,包括獲取訓(xùn)練包以及訓(xùn)練包中的訓(xùn)練示例,所述訓(xùn)練包中包括正訓(xùn)練包;為所述正訓(xùn)練包中的每一個(gè)訓(xùn)練示例生成權(quán)值,該權(quán)值的絕對(duì)大小代表相應(yīng)的訓(xùn)練示例能夠反映用戶查詢語(yǔ)義的程度;針對(duì)訓(xùn)練包以及測(cè)試包中的所有示例,利用所述正訓(xùn)練包中各訓(xùn)練示例的權(quán)值,得到各個(gè)測(cè)試示例的排序分值;根據(jù)測(cè)試包中各個(gè)測(cè)試示例的排序分值,確定各個(gè)測(cè)試包的排序分值,并根據(jù)所述測(cè)試包的排序分值確定檢索結(jié)果。根據(jù)本發(fā)明實(shí)施例的另一個(gè)方面,提供一種基于多不例學(xué)習(xí)的檢索系統(tǒng),包括獲取單元,配置為獲取訓(xùn)練包以及訓(xùn)練包中的訓(xùn)練示例,所述訓(xùn)練包中包括正訓(xùn)練包;訓(xùn)練示例權(quán)值生成單元,配置為為所述正訓(xùn)練包中的每一個(gè)訓(xùn)練示例生成權(quán)值,該權(quán)值的絕對(duì)大小代表相應(yīng)的訓(xùn)練示例能夠反映用戶查詢語(yǔ)義的程度;測(cè)試示例排序分值獲取單元,配置為針對(duì)訓(xùn)練包以及測(cè)試包中的所有示例,利用所述正訓(xùn)練包中各訓(xùn)練示例的權(quán)值,得到各個(gè)測(cè)試示例的排序分值;檢索結(jié)果確定單元,配置為根據(jù)測(cè)試包中各個(gè)測(cè)試示例的排序分值,確定各個(gè)測(cè)試包的排序分值,并根據(jù)所述測(cè)試包的排序分值確定檢索結(jié)果。另外,根據(jù)本發(fā)明的另一方面,還提供了一種存儲(chǔ)介質(zhì)。所述存儲(chǔ)介質(zhì)包括機(jī)器可讀的程序代碼,當(dāng)在信息處理設(shè)備上執(zhí)行所述程序代碼時(shí),所述程序代碼使得所述信息處 理設(shè)備執(zhí)行根據(jù)本發(fā)明的上述基于多示例學(xué)習(xí)的檢索方法。此外,根據(jù)本發(fā)明的再一方面,還提供了一種程序產(chǎn)品。所述程序產(chǎn)品包括機(jī)器可執(zhí)行的指令,當(dāng)在信息處理設(shè)備上執(zhí)行所述指令時(shí),所述指令使得所述信息處理設(shè)備執(zhí)行根據(jù)本發(fā)明的上述基于多示例學(xué)習(xí)的檢索方法。根據(jù)本發(fā)明實(shí)施例的上述方法,在進(jìn)行圖像檢索的過(guò)程中,可以為正訓(xùn)練包中的每一個(gè)訓(xùn)練示例生成權(quán)值,該權(quán)值的絕對(duì)大小代表相應(yīng)的訓(xùn)練示例能夠反映用戶查詢語(yǔ)義的程度,這樣,在最后計(jì)算測(cè)試包中各測(cè)試示例的排序分值時(shí),對(duì)于正訓(xùn)練包中的訓(xùn)練示例,就可以使用各自的權(quán)值作為其初始標(biāo)簽,最終再根據(jù)各個(gè)測(cè)試實(shí)例的排序分值得到測(cè)試包的排序分值,并給出檢索結(jié)果??梢?,在本發(fā)明實(shí)施例中,并沒有試圖從正訓(xùn)練包中選出有限數(shù)目的正示例,而是為正訓(xùn)練包中的各個(gè)示例計(jì)算出各自的權(quán)值,通過(guò)該權(quán)重的絕對(duì)大小反映出各個(gè)示例與用戶查詢語(yǔ)義之間的契合度,這樣,再根據(jù)各個(gè)正訓(xùn)練包中各個(gè)示例的權(quán)值,得到測(cè)試包中各個(gè)測(cè)試示例的排序分值。這樣,使得正訓(xùn)練包中各個(gè)訓(xùn)練示例提供的信息得到了充分地利用,便于提高檢索的性能。在下面的說(shuō)明書部分中給出本發(fā)明實(shí)施例的其他方面,其中,詳細(xì)說(shuō)明用于充分地公開本發(fā)明實(shí)施例的優(yōu)選實(shí)施例,而不對(duì)其施加限定。


      下面結(jié)合具體的實(shí)施例,并參照附圖,對(duì)本發(fā)明實(shí)施例的上述和其它目的和優(yōu)點(diǎn)做進(jìn)一步的描述。在附圖中,相同的或?qū)?yīng)的技術(shù)特征或部件將采用相同或?qū)?yīng)的附圖標(biāo)記來(lái)表示。圖I是示出作為本發(fā)明實(shí)施例提供的方法的流程圖;圖2是示出作為本發(fā)明實(shí)施例提供的另一方法的流程圖;圖3是示出作為本發(fā)明實(shí)施例提供的第一裝置的示意圖;圖4是示出作為本發(fā)明實(shí)施例提供的第二裝置的示意圖;圖5是示出作為本發(fā)明實(shí)施例提供的第三裝置的示意圖6是示出作為本發(fā)明實(shí)施例提供的第四裝置的示意圖;和圖7是示出作為本發(fā)明的實(shí)施例中所采用的信息處理設(shè)備的個(gè)人計(jì)算機(jī)的示例性結(jié)構(gòu)的框圖。
      具體實(shí)施例方式下面參照附圖來(lái)說(shuō)明本發(fā)明實(shí)施例。為了便于理解,下面首先對(duì)本發(fā)明實(shí)施例中涉及的一些概念(包括訓(xùn)練包、訓(xùn)練示例、正訓(xùn)練包、負(fù)訓(xùn)練包、正示例、負(fù)示例、測(cè)試包、測(cè)試示例)進(jìn)行介紹。首先,在基于多示例學(xué)習(xí)的框架中,每幅圖像被看作是一個(gè)包,圖像中的每個(gè)區(qū)域則被看作是一個(gè)示例。其中,作為檢索種子的例子圖像被分割成多個(gè)區(qū)域之后,每個(gè)區(qū)域就稱為一個(gè)訓(xùn)練示例,一個(gè)例子圖像中的所有訓(xùn)練示例組成一個(gè)訓(xùn)練包。換言之,一個(gè)例子圖 像對(duì)應(yīng)一個(gè)訓(xùn)練包,一個(gè)訓(xùn)練包中包含多個(gè)訓(xùn)練示例。其中,訓(xùn)練示例包括正示例和負(fù)示例,正示例是指能夠反映出用戶查詢語(yǔ)義的示例,負(fù)示例是指不能反映用戶查詢語(yǔ)義的示例。訓(xùn)練包可以分為正訓(xùn)練包和負(fù)訓(xùn)練包,正訓(xùn)練包是指至少包含一個(gè)正示例的包,負(fù)訓(xùn)練包中包含的示例全部為負(fù)示例。例如,用戶想要檢索的是帶有老虎的圖片,則給出的例子圖像可能也是一幅帶有老虎的圖片,但是該圖片中可能還包括一些背景,例如樹木、草地等等,也就是說(shuō),該例子圖像中只有部分區(qū)域是真正顯示的老虎,還有部分區(qū)域顯示的是樹木、草地等等。這樣,對(duì)該例子圖像進(jìn)行區(qū)域分割時(shí),可能就會(huì)使得某些區(qū)域上帶有老虎的圖案,而有些區(qū)域可能僅僅是樹木、草地等等。而由于用戶查詢語(yǔ)義應(yīng)該是搜索帶有老虎的圖片,因此,對(duì)于該例子圖像,帶有老虎圖案的區(qū)域?qū)?yīng)的示例應(yīng)該是正示例,而帶有樹木、草地等的區(qū)域?qū)?yīng)的示例就應(yīng)該是負(fù)示例;而對(duì)于該例子圖像對(duì)應(yīng)的訓(xùn)練包而言,由于既包括正示例又包括負(fù)示例,因此,該訓(xùn)練包是一個(gè)正訓(xùn)練包,該例子圖像也可以稱為正例圖像。如果用戶想要檢索的仍然是帶有老虎的圖片,但給出的例子圖像中包含的全部都是樹木、草地等圖案,則該例子圖像分割出的所有示例都是不能反映出用戶查詢語(yǔ)義,因此,都屬于負(fù)示例,相應(yīng)的,該例子圖像對(duì)應(yīng)的訓(xùn)練包也是負(fù)訓(xùn)練包,該例子圖像也可以稱為負(fù)例圖像。例子圖像可以是由用戶在檢索開始時(shí)提供的,也可以是在檢索的過(guò)程中在檢索系統(tǒng)的提示下用戶選擇的;例子圖像可以有多個(gè),并且既可以提供正例圖像,又可以提供負(fù)例圖像,同時(shí)用戶會(huì)告知系統(tǒng)哪些是正例圖像,哪些是負(fù)例圖像。相應(yīng)的,檢索系統(tǒng)在對(duì)例子圖像進(jìn)行區(qū)域分割之后,也能夠知曉哪些訓(xùn)練包是正訓(xùn)練包,哪些訓(xùn)練包是負(fù)訓(xùn)練包。但是,對(duì)于系統(tǒng)而言,在剛剛得到正訓(xùn)練包中的示例時(shí),并不知道正訓(xùn)練包中哪些是正示例,哪些是負(fù)示例,只有通過(guò)分析操作,才能獲知示例級(jí)別的信息。也正是因此,才將例子圖像稱為訓(xùn)練圖像,也即,為了進(jìn)行圖像檢索,首先需要基于例子圖像中的示例進(jìn)行訓(xùn)練,從中獲取可用的信息,進(jìn)而才能完成后續(xù)的檢索操作。對(duì)于檢索系統(tǒng)而言,相當(dāng)于是從圖像數(shù)據(jù)庫(kù)中選出符合用戶查詢語(yǔ)義的圖像,其中,圖像數(shù)據(jù)庫(kù)中包含了各種各樣的圖像,這些圖像就是測(cè)試圖像,在基于多示例的圖像檢索中,對(duì)于測(cè)試圖像也需要進(jìn)行區(qū)域分割,分割出的區(qū)域稱為測(cè)試示例,相應(yīng)的,一個(gè)測(cè)試圖像中的各個(gè)測(cè)試示例組成一個(gè)測(cè)試包。下面對(duì)本發(fā)明實(shí)施例提供的圖像檢索方法進(jìn)行詳細(xì)地介紹。
      參見圖1,本發(fā)明實(shí)施例提供的基于多示例學(xué)習(xí)的檢索方法包括以下步驟 SlOl 獲取訓(xùn)練包以及訓(xùn)練包中的訓(xùn)練示例,所述訓(xùn)練包中包括正訓(xùn)練包。如前文所述,訓(xùn)練包可以是由用戶提供的,例如,用戶在開始進(jìn)行圖像檢索時(shí),可以選擇一幅或多幅圖像作為例子圖像,檢索系統(tǒng)對(duì)這些例子圖像進(jìn)行區(qū)域分割,每個(gè)區(qū)域?qū)?yīng)一個(gè)訓(xùn)練包,一幅例子圖像對(duì)應(yīng)一個(gè)訓(xùn)練包。在本發(fā)明實(shí)施例中,訓(xùn)練包中至少包含正訓(xùn)練包,當(dāng)然,為了得到更好的檢索結(jié)果,訓(xùn)練包中除了正訓(xùn)練包以外,還可以包含負(fù)訓(xùn)練包,也就是說(shuō)用戶在提供例子圖像時(shí)除了正例圖像以外,還可以提供負(fù)例圖像。S102 :為所述正訓(xùn)練包中的每一個(gè)訓(xùn)練示例生成權(quán)值,該權(quán)值的絕對(duì)大小代表相應(yīng)的訓(xùn)練示例能夠反映用戶查詢語(yǔ)義的程度。在本發(fā)明實(shí)施例中,并不是從正訓(xùn)練包中選擇出有限個(gè)數(shù)的正示例,而是為正訓(xùn)練包中每個(gè)訓(xùn)練示例生成一個(gè)權(quán)值,該權(quán)值用于代表相應(yīng)的訓(xùn)練示例能夠反映用戶查詢語(yǔ)義的程度。需要說(shuō)明的是,在本發(fā)明實(shí)施例中,該權(quán)值的絕對(duì)大小就能夠代表上述能夠反映用戶查詢語(yǔ)義的程度。也就是說(shuō),如果正訓(xùn)練包中的某示例確實(shí)是正示例,則為其生成的權(quán) 值大于負(fù)示例的權(quán)值,并且其權(quán)值本身是一個(gè)正的值。S103 :針對(duì)訓(xùn)練包以及測(cè)試包中的所有示例,利用所述正訓(xùn)練包中各訓(xùn)練示例的權(quán)值,得到各個(gè)測(cè)試示例的排序分值。在針對(duì)正訓(xùn)練包中的訓(xùn)練示例得到各自的權(quán)值之后,就可以針對(duì)訓(xùn)練包及測(cè)試包中的所有示例,根據(jù)所有示例之間的相似度以及所述正訓(xùn)練包中各訓(xùn)練示例的權(quán)值,得到各個(gè)測(cè)試示例的排序分值。也即,正訓(xùn)練包中各個(gè)示例的權(quán)值,會(huì)應(yīng)用到為測(cè)試包中的測(cè)試示例計(jì)算排序分值的過(guò)程中。換言之,通常的檢索方法就是從正訓(xùn)練包中獲取一些信息,然后應(yīng)用這些信息,從測(cè)試包中檢索出與反映用戶查詢語(yǔ)義的包。這些信息例如是示例的排序分值。在傳統(tǒng)方法中,排序分值是一個(gè)相對(duì)的值,并不能直接反映示例符合用戶查詢語(yǔ)義的程度。而在本發(fā)明實(shí)施例中,用正訓(xùn)練包中各個(gè)示例的權(quán)值取代了所述排序分值,從而能夠直接反映示例符合用戶查詢語(yǔ)義的程度。S104 :根據(jù)測(cè)試包中各個(gè)測(cè)試示例的排序分值,確定各個(gè)測(cè)試包的排序分值,并根據(jù)所述測(cè)試包的排序分值確定檢索結(jié)果。在得到各個(gè)測(cè)試示例的排序分值之后,就可以根據(jù)測(cè)試示例的排序分值,確定出測(cè)試包的排序分值。例如,對(duì)于某測(cè)試包而言,可以將其中的各個(gè)測(cè)試示例的排序分值取均值,作為該測(cè)試示例的排序分值。當(dāng)然,由于一個(gè)測(cè)試包中通常可能只有一個(gè)或少數(shù)幾個(gè)示例是正示例,因此,如果采用前述取平均值的方法來(lái)獲取測(cè)試包的排序分值,則可能會(huì)使得測(cè)試包的排序分值偏低。為了提高測(cè)試包的排序分值的合理性,也可以取該測(cè)試包中各個(gè)測(cè)試示例的排序分值的最大值,作為該測(cè)試示例的排序分值。而在得到各個(gè)測(cè)試包的排序分值之后,就可以據(jù)此為用戶提供檢索結(jié)果了。例如,可以將排序分值排名靠前的前預(yù)置數(shù)目個(gè)測(cè)試包對(duì)應(yīng)的圖像反饋給用戶,或者,按照排序分值對(duì)各個(gè)測(cè)試包進(jìn)行排序,然后按照該順序?qū)y(cè)試包對(duì)應(yīng)的圖像提供給用戶,等等??傊?,在進(jìn)行圖像檢索的過(guò)程中,可以為正訓(xùn)練包中的每一個(gè)訓(xùn)練示例生成權(quán)值,該權(quán)值的絕對(duì)大小代表相應(yīng)的訓(xùn)練示例能夠反映用戶查詢語(yǔ)義的程度,這樣,在最后計(jì)算測(cè)試包中各測(cè)試示例的排序分值時(shí),對(duì)于正訓(xùn)練包中的訓(xùn)練示例,就可以使用各自的權(quán)值作為其初始標(biāo)簽,最終再根據(jù)各個(gè)測(cè)試實(shí)例的排序分值得到測(cè)試包的排序分值,并給出檢索結(jié)果??梢?,在本發(fā)明實(shí)施例中,并沒有試圖從正訓(xùn)練包中選出有限數(shù)目的正示例,而是為正訓(xùn)練包中的各個(gè)示例計(jì)算出各自的權(quán)值,通過(guò)該權(quán)重的絕對(duì)大小反映出各個(gè)示例與用戶查詢語(yǔ)義之間的契合度,這樣,再根據(jù)各個(gè)正訓(xùn)練包中各個(gè)示例的權(quán)值,得到測(cè)試包中各個(gè)測(cè)試示例的排序分值。這樣,使得正訓(xùn)練包中各個(gè)訓(xùn)練示例提供的信息得到了充分地利用,便于提高檢索的性能。具體實(shí)現(xiàn)時(shí),為正訓(xùn)練包中的各個(gè)訓(xùn)練示例生成前述權(quán)值的方法可以有多種,下面對(duì)其中一種實(shí)現(xiàn)方式進(jìn)行詳細(xì)地介紹。參見圖2,可以包括以下步驟S201 :獲知正訓(xùn)練包中的訓(xùn)練示例初始權(quán)值。其中,關(guān)于正訓(xùn)練包中訓(xùn)練示例的初始權(quán)值,可以預(yù)先設(shè)置在配置文件中,這樣,就可以通過(guò)讀取配置文件的方式,使得系統(tǒng)能夠獲知該初始權(quán)值。例如,可以統(tǒng)一設(shè)置為10(當(dāng)然也可以是其他的值,但通常為正值)。 S202 :獲取訓(xùn)練包以及訓(xùn)練包中的訓(xùn)練示例,并根據(jù)訓(xùn)練示例之間的相似度,采用基于圖的算法進(jìn)行學(xué)習(xí),得到各個(gè)訓(xùn)練示例的排序分值。獲取到訓(xùn)練包及訓(xùn)練示例之后,可以采用基于圖的算法進(jìn)行學(xué)習(xí),得到各個(gè)訓(xùn)練示例的排序分值。其中,學(xué)習(xí)的過(guò)程中主要是依據(jù)訓(xùn)練示例之間的相似度進(jìn)行基于圖的學(xué)習(xí)。這里需要說(shuō)明的是,基于圖的算法進(jìn)行學(xué)習(xí),以便得到每個(gè)訓(xùn)練示例的排序分值的過(guò)程屬于已有技術(shù),并不屬于本發(fā)明的重點(diǎn),因此,這里僅進(jìn)行簡(jiǎn)單地介紹。可以通過(guò)以下方式進(jìn)行基于圖的學(xué)習(xí)首先,構(gòu)建一張帶權(quán)圖,圖中的節(jié)點(diǎn)對(duì)應(yīng)訓(xùn)練包中的所有訓(xùn)練示例,也就是說(shuō),假設(shè)共有兩個(gè)訓(xùn)練包,每個(gè)訓(xùn)練包中有5個(gè)訓(xùn)練示例,則構(gòu)建的圖中共有10個(gè)節(jié)點(diǎn);圖中的邊的權(quán)值反映其連接的兩個(gè)節(jié)點(diǎn)之間的相似度。然后采用某種基于圖的算法進(jìn)行學(xué)習(xí),算法結(jié)束時(shí),每個(gè)訓(xùn)練示例就可以對(duì)應(yīng)一個(gè)排序分值。其中,在計(jì)算節(jié)點(diǎn)之間的相似度時(shí),可以是分別從各個(gè)訓(xùn)練示例中提取視覺特征(通常是向量的形式),然后采用向量計(jì)算的方法計(jì)算兩兩之間的距離,距離越小,則相似度越高,反之,距離越大,則相似度越低。當(dāng)然,在實(shí)際應(yīng)用中,除了提取視覺特征以外,還可以通過(guò)其他途徑獲取到關(guān)于各個(gè)訓(xùn)練示例的特征,例如描述信息等等,也可以將這些信息加入到計(jì)算訓(xùn)練示例之間的相似度的過(guò)程中。需要說(shuō)明的是,以上所述構(gòu)建一張帶權(quán)圖是一種形象的說(shuō)法,對(duì)于計(jì)算機(jī)系統(tǒng)而言,該帶權(quán)圖對(duì)應(yīng)的數(shù)據(jù)是一個(gè)nXn的矩陣S,其中,η為訓(xùn)練示例總數(shù)。也就是說(shuō),在前述例子中,如果共有10個(gè)訓(xùn)練示例,則該矩陣共有10行10列,其中第i行第j列的元素Sij就對(duì)應(yīng)第i個(gè)訓(xùn)練示例與第j個(gè)訓(xùn)練示例之間的相似度。此外,還可以對(duì)該矩陣進(jìn)行基于行的歸一化處理。關(guān)于基于圖的算法,可以有多種具體的實(shí)現(xiàn)方式,例如,在其中一種實(shí)施方式下,可以通過(guò)以下方式進(jìn)行首先為所有訓(xùn)練示例設(shè)置初始標(biāo)簽;例如,如果訓(xùn)練包全部為正訓(xùn)練包,則所有訓(xùn)練示例的初始標(biāo)簽都可以設(shè)為I ;如果訓(xùn)練包中既有正訓(xùn)練包也有負(fù)訓(xùn)練包,則可以將正訓(xùn)練包中所有訓(xùn)練示例的初始標(biāo)簽設(shè)為1,負(fù)訓(xùn)練包中所有訓(xùn)練示例的初始標(biāo)簽都設(shè)為-I;然后將初始標(biāo)簽在之前構(gòu)建的帶權(quán)圖上進(jìn)行傳播直至達(dá)到一個(gè)全局穩(wěn)定的狀態(tài),最終即可得到每個(gè)訓(xùn)練示例的排序分值。對(duì)于計(jì)算機(jī)系統(tǒng)而言,以上將標(biāo)簽在帶權(quán)圖上進(jìn)行傳播的過(guò)程,可以通過(guò)以下迭代公式來(lái)完成f (t+1) = a Sf (t) + (I- α ) y(I)其中,S為前述構(gòu)建的圖對(duì)應(yīng)的歸一化矩陣;y為各個(gè)訓(xùn)練示例的初始標(biāo)簽組成的標(biāo)簽向量,例如,假設(shè)訓(xùn)練包中有一個(gè)正訓(xùn)練包和一個(gè)負(fù)訓(xùn)練包,每個(gè)訓(xùn)練包中有5個(gè)示例,則 Y 可以為(I,I,I,I,1,_1,-1,-1,-1,-I)τ ; α (O < α < I)為線性組合系數(shù);f (t)也是一個(gè)向量,其中的元素?cái)?shù)目與訓(xùn)練示例的數(shù)目相同,各個(gè)元素對(duì)應(yīng)著第t次迭代之后各個(gè)訓(xùn)練示例對(duì)應(yīng)的標(biāo)簽的值;例如,f(l)就代表一次迭代之后各個(gè)訓(xùn)練示例的標(biāo)簽組成的向量,在初始狀態(tài)下,f (O)可以取任意值,在一種具體實(shí)施方式
      下,f (O)可以與y相等。也就是說(shuō),利用公式(I)就可以進(jìn)行多次迭代,當(dāng)?shù)^(guò)程收斂時(shí),就對(duì)應(yīng)著前述在帶權(quán)圖上傳播時(shí)達(dá)到了全局穩(wěn)定的狀態(tài),然后取出對(duì)應(yīng)的f(t),根據(jù)其中的各個(gè)元素的值即可得到各個(gè)訓(xùn)練示例的排序分值。其中,在具體實(shí)現(xiàn)時(shí),可以通過(guò)以下方式判斷迭代過(guò)程是否收斂判斷f(t)與f(t-l)是否很接近(可以計(jì)算兩者之間的距離,并與一閾值進(jìn)行比較),如果是,則收斂,結(jié)束迭代過(guò)程即可。當(dāng)然,還可以通過(guò)預(yù)設(shè)迭代次數(shù)等方式來(lái)實(shí)現(xiàn),這里不再贅述。其中,之所以采用前述公式(I)進(jìn)行迭代,是因?yàn)樾枰獙?duì)以下待優(yōu)化函數(shù)進(jìn)行優(yōu)化
      權(quán)利要求
      1.一種基于多不例學(xué)習(xí)的檢索方法,包括獲取訓(xùn)練包以及訓(xùn)練包中的訓(xùn)練示例,所述訓(xùn)練包中包括正訓(xùn)練包;為所述正訓(xùn)練包中的姆ー個(gè)訓(xùn)練示例生成權(quán)值,該權(quán)值的絕對(duì)大小代表相應(yīng)的訓(xùn)練示例能夠反映用戶查詢語(yǔ)義的程度;針對(duì)訓(xùn)練包以及測(cè)試包中的所有示例,利用所述正訓(xùn)練包中各訓(xùn)練示例的權(quán)值,得到各個(gè)測(cè)試示例的排序分值;根據(jù)測(cè)試包中各個(gè)測(cè)試示例的排序分值,確定各個(gè)測(cè)試包的排序分值,并根據(jù)所述測(cè)試包的排序分值確定檢索結(jié)果。
      2.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述為所述正訓(xùn)練包中的每ー個(gè)訓(xùn)練示例生成權(quán)值包括獲知正訓(xùn)練包中的訓(xùn)練示例初始權(quán)值;根據(jù)訓(xùn)練示例之間的相似度,采用基于圖的算法進(jìn)行學(xué)習(xí),得到各個(gè)訓(xùn)練示例的排序分值;確定訓(xùn)練包中的各個(gè)訓(xùn)練示例的正近鄰示例集合,針對(duì)各個(gè)訓(xùn)練示例,根據(jù)正近鄰示例集合中各訓(xùn)練示例的排序分值,改變正近鄰示例集合中訓(xùn)練示例的權(quán)值,以得到正訓(xùn)練包中各個(gè)訓(xùn)練示例的最終權(quán)值;其中,所述訓(xùn)練示例的正近鄰示例集合由正訓(xùn)練包中與該訓(xùn)練示例具有預(yù)置相似關(guān)系的訓(xùn)練示例組成。
      3.根據(jù)權(quán)利要求2所述的方法,所述訓(xùn)練包中還包括負(fù)訓(xùn)練包,所述針對(duì)各個(gè)訓(xùn)練示例,根據(jù)正近鄰示例集合中訓(xùn)練示例的排序分值,改變正近鄰示例集合中訓(xùn)練示例的權(quán)值包括針對(duì)正訓(xùn)練包中的各個(gè)訓(xùn)練示例,根據(jù)正近鄰示例集合中訓(xùn)練示例的排序分值,增大正近鄰示例集合中訓(xùn)練示例的權(quán)值;針對(duì)負(fù)訓(xùn)練包中的各個(gè)訓(xùn)練示例,根據(jù)正近鄰示例集合中訓(xùn)練示例的排序分值,減小正近鄰示例集合中訓(xùn)練示例的權(quán)值。
      4.根據(jù)權(quán)利要求2所述的方法,所述確定訓(xùn)練包中的各個(gè)訓(xùn)練示例的正近鄰示例集合包括根據(jù)在基于圖的算法進(jìn)行學(xué)習(xí)的過(guò)程中構(gòu)建的帶權(quán)圖中各節(jié)點(diǎn)的一次或多次傳遞關(guān)系,確定訓(xùn)練包中的各個(gè)訓(xùn)練示例的正近鄰示例集合;所述帶權(quán)圖中的節(jié)點(diǎn)對(duì)應(yīng)于訓(xùn)練包中的所有訓(xùn)練示例,帶權(quán)圖的邊的權(quán)值對(duì)應(yīng)于其連接的兩個(gè)節(jié)點(diǎn)之間的相似度。
      5.根據(jù)權(quán)利要求I所述的方法,所述針對(duì)訓(xùn)練包以及測(cè)試包中的所有示例,根據(jù)所有示例之間的相似度以及所述正訓(xùn)練包中各訓(xùn)練示例的權(quán)值,得到測(cè)試示例的排序分值包括針對(duì)訓(xùn)練包以及測(cè)試包中的所有示例,根據(jù)所有示例之間的相似度,采用基于圖的算法進(jìn)行學(xué)習(xí),得到各個(gè)測(cè)試示例的排序分值;其中,正訓(xùn)練包中各個(gè)訓(xùn)練示例的初始標(biāo)簽由各自的權(quán)重確定。
      6.一種基于多不例學(xué)習(xí)的檢索系統(tǒng),包括獲取單元,配置為獲取訓(xùn)練包以及訓(xùn)練包中的訓(xùn)練示例,所述訓(xùn)練包中包括正訓(xùn)練包;訓(xùn)練示例權(quán)值生成単元,配置為為所述正訓(xùn)練包中的姆ー個(gè)訓(xùn)練示例生成權(quán)值,該權(quán)值的絕對(duì)大小代表相應(yīng)的訓(xùn)練示例能夠反映用戶查詢語(yǔ)義的程度;測(cè)試示例排序分值獲取単元,配置為針對(duì)訓(xùn)練包以及測(cè)試包中的所有示例,利用所述正訓(xùn)練包中各訓(xùn)練示例的權(quán)值,得到各個(gè)測(cè)試示例的排序分值;檢索結(jié)果確定単元,配置為根據(jù)測(cè)試包中各個(gè)測(cè)試示例的排序分值,確定各個(gè)測(cè)試包的排序分值,井根據(jù)所述測(cè)試包的排序分值確定檢索結(jié)果。
      7.根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述訓(xùn)練示例權(quán)值生成単元包括初始權(quán)值獲知子單元,配置為獲知正訓(xùn)練包中的訓(xùn)練示例初始權(quán)值;訓(xùn)練示例排序分值獲取子単元,配置為根據(jù)訓(xùn)練示例之間的相似度,采用基于圖的算法進(jìn)行學(xué)習(xí),得到各個(gè)訓(xùn)練示例的排序分值;權(quán)值修改子單元,配置為確定訓(xùn)練包中的各個(gè)訓(xùn)練示例的正近鄰示例集合,針對(duì)各個(gè)訓(xùn)練示例,根據(jù)正近鄰示例集合中各訓(xùn)練示例的排序分值,改變正近鄰示例集合中訓(xùn)練示例的權(quán)值,以得到正訓(xùn)練包中各個(gè)訓(xùn)練示例的最終權(quán)值;其中,所述訓(xùn)練示例的正近鄰示例集合由正訓(xùn)練包中與該訓(xùn)練示例具有預(yù)置相似關(guān)系的訓(xùn)練示例組成。
      8.根據(jù)權(quán)利要求7所述的系統(tǒng),所述訓(xùn)練包中還包括負(fù)訓(xùn)練包,所述權(quán)值修改子単元包括權(quán)值增大子單元,配置為針對(duì)正訓(xùn)練包中的各個(gè)訓(xùn)練示例,根據(jù)正近鄰示例集合中訓(xùn)練示例的排序分值,增大正近鄰示例集合中訓(xùn)練示例的權(quán)值;權(quán)值減小子単元,配置為針對(duì)負(fù)訓(xùn)練包中的各個(gè)訓(xùn)練示例,根據(jù)正近鄰示例集合中訓(xùn)練示例的排序分值,減小正近鄰示例集合中訓(xùn)練示例的權(quán)值。
      9.根據(jù)權(quán)利要求7所述的系統(tǒng),所述權(quán)值修改子単元包括正近鄰示例集合確定子単元,配置為根據(jù)在基于圖的算法進(jìn)行學(xué)習(xí)的過(guò)程中構(gòu)建的帶權(quán)圖中各節(jié)點(diǎn)的一次或多次傳遞關(guān)系,確定訓(xùn)練包中的各個(gè)訓(xùn)練示例的正近鄰示例集合;所述帶權(quán)圖中的節(jié)點(diǎn)對(duì)應(yīng)于訓(xùn)練包中的所有訓(xùn)練示例,帶權(quán)圖的邊的權(quán)值對(duì)應(yīng)于其連接的兩個(gè)節(jié)點(diǎn)之間的相似度;修改子單元,配置為針對(duì)各個(gè)訓(xùn)練示例,根據(jù)正近鄰示例集合中各訓(xùn)練示例的排序分值,改變正近鄰示例集合中訓(xùn)練示例的權(quán)值,以得到正訓(xùn)練包中各個(gè)訓(xùn)練示例的最終權(quán)值。
      10.根據(jù)權(quán)利要求6所述的系統(tǒng),所述測(cè)試示例排序分值獲取単元具體配置為,針對(duì)訓(xùn)練包以及測(cè)試包中的所有示例,根據(jù)所有示例之間的相似度,采用基于圖的算法進(jìn)行學(xué)習(xí),得到各個(gè)測(cè)試示例的排序分值;其中,正訓(xùn)練包中各個(gè)訓(xùn)練示例的初始標(biāo)簽由各自的權(quán)重確定。
      全文摘要
      本發(fā)明實(shí)施例公開了一種基于多示例學(xué)習(xí)的檢索方法及系統(tǒng),其中,所述方法包括獲取訓(xùn)練包以及訓(xùn)練包中的訓(xùn)練示例,所述訓(xùn)練包中包括正訓(xùn)練包;為所述正訓(xùn)練包中的每一個(gè)訓(xùn)練示例生成權(quán)值,該權(quán)值的絕對(duì)大小代表相應(yīng)的訓(xùn)練示例能夠反映用戶查詢語(yǔ)義的程度;針對(duì)訓(xùn)練包以及測(cè)試包中的所有示例,利用所述正訓(xùn)練包中各訓(xùn)練示例的權(quán)值,得到各個(gè)測(cè)試示例的排序分值;根據(jù)測(cè)試包中各個(gè)測(cè)試示例的排序分值,確定各個(gè)測(cè)試包的排序分值,并根據(jù)所述測(cè)試包的排序分值確定檢索結(jié)果。通過(guò)本發(fā)明,能夠使得正訓(xùn)練包中的示例提供的信息得到更為充分的利用,提高檢索性能。
      文檔編號(hào)G06F17/30GK102831129SQ20111017193
      公開日2012年12月19日 申請(qǐng)日期2011年6月16日 優(yōu)先權(quán)日2011年6月16日
      發(fā)明者李斐, 劉汝杰, 于浩, 石原正樹, 上原祐介 申請(qǐng)人:富士通株式會(huì)社
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1