借助于并行檢測和跟蹤和/或分組特征運(yùn)動移位跟蹤的人臉識別的制作方法
【技術(shù)領(lǐng)域】
[0001] 本公開內(nèi)容涉及數(shù)據(jù)處理的領(lǐng)域,尤其涉及與包括但不限于并行檢測和跟蹤和/ 或分組特征運(yùn)動移位跟蹤的人臉識別相關(guān)聯(lián)的裝置、方法和存儲介質(zhì)。
[0002] 背景
[0003] 在此提供的背景描述用于一般地呈現(xiàn)本公開內(nèi)容的上下文的目的。除非本文另外 指出,否則本節(jié)中所描述的材料不是本申請中的權(quán)利要求的現(xiàn)有技術(shù),且不被承認(rèn)為通過 包含在本節(jié)中而成為現(xiàn)有技術(shù)。
[0004] 通用微處理器、圖形處理器和相關(guān)技術(shù)的進(jìn)步已經(jīng)允許計算機(jī)視覺的進(jìn)一步發(fā) 展。現(xiàn)在,多種應(yīng)用涉及通常包括人臉跟蹤的人臉識別。大多數(shù)現(xiàn)有的人臉跟蹤器使用全 局方法來跟蹤人臉。全局方法通常使用統(tǒng)計分類技術(shù)來預(yù)測ROI區(qū)域,以便判斷人臉是否 出現(xiàn)在這一 ROI區(qū)域中。它常常包含"上次檢測"一 "預(yù)測更大的ROI區(qū)域"一"當(dāng)前檢 測"的步驟。它使得進(jìn)行人臉跟蹤高度依賴于人臉檢測。因?yàn)檫@種依賴性,現(xiàn)有技術(shù)的全局 方法具有至少兩個缺點(diǎn)。第一缺點(diǎn)是,在人臉旋轉(zhuǎn)或部分遮擋時,跟蹤由于檢測失效而常常 失敗。另一缺點(diǎn)是相互依賴性阻止了現(xiàn)有技術(shù)方法利用來自并行和/或多核處理的性能提 升。
[0005] 附圖簡述
[0006] 結(jié)合附圖,通過下列詳細(xì)描述將容易地理解各實(shí)施例。為了促進(jìn)本描述,類似的標(biāo) 號表示類似的結(jié)構(gòu)元素。在附圖的各圖中作為示例而非限制闡釋各實(shí)施例。
[0007] 圖1闡釋根據(jù)各種實(shí)施例與用于人臉跟蹤的本公開內(nèi)容的教導(dǎo)合并的示例計算 裝置的概覽。
[0008] 圖2闡釋根據(jù)各種實(shí)施例的并行人臉檢測和跟蹤。
[0009] 圖3闡釋根據(jù)各種實(shí)施例人臉位于其中的圖像幀的關(guān)注區(qū)域的特征。
[0010] 圖4闡釋根據(jù)各種實(shí)施例使用無向圖分組特征,且確定組的中心。
[0011] 圖5-7闡釋根據(jù)各種實(shí)施例確定一組的優(yōu)勢速度。
[0012] 圖8-10闡釋根據(jù)各種實(shí)施例消除漂移特征和再次會聚一組的特征。
[0013] 圖11-12闡釋根據(jù)各種實(shí)施例基于作為一組的特征的運(yùn)動移位跟蹤特征的示例 過程。
[0014] 圖13闡釋根據(jù)各種實(shí)施例適用于實(shí)踐本公開內(nèi)容的示例計算環(huán)境。
[0015] 圖14闡釋根據(jù)各種實(shí)施例帶有被配置為允許裝置實(shí)踐各種的各方面本公開內(nèi)容 的指令的示例存儲介質(zhì)。
[0016] 詳細(xì)描述
[0017] 在此公開的與人臉識別相關(guān)聯(lián)的裝置、方法和存儲介質(zhì)。在各實(shí)施例中,用于識別 人臉的方法可以包括通過計算設(shè)備的第一線程檢測多個圖像幀中散布的已選擇圖像幀中 人臉的存在。在檢測到多個圖像幀的已選擇圖像幀中的第一幀中存在人臉時,第一線程請 求通過計算設(shè)備的第二線程跟蹤該人臉,第二線程由計算設(shè)備與第一線程并行操作。作為 響應(yīng),可以由第二線程為第一線程跟蹤該人臉。
[0018] 在各實(shí)施例中,第二線程可以使用基于分組局部特征的人臉跟蹤器。該方法可以 包括由計算設(shè)備檢測多個圖像幀中的一個中人臉的存在。在檢測到多個圖像幀中的一個中 存在人臉時,至少部分地基于在人臉?biāo)幍年P(guān)注區(qū)域中的一組N個特征的組運(yùn)動移位跟蹤 人臉。
[0019] 在各實(shí)施例中,一種裝置,例如智能電話或計算平板,可以包括一個或多個處理器 以及具有人臉檢測功能和人臉跟蹤功能的存儲介質(zhì),該人臉檢測功能和人臉跟蹤功能被配 置為引起該裝置響應(yīng)于由一個或多個處理器操作而執(zhí)行任何上述的方法和它們的變種。在 各實(shí)施例中,至少一種存儲介質(zhì)可以包括指令,所述指令被配置為引起裝置響應(yīng)于由裝置 執(zhí)行而執(zhí)行任何上述的方法和它們的變種。因此,在跟蹤移動/旋轉(zhuǎn)的人臉時,這樣的裝置 可以具有尚的響應(yīng)靈敏度。
[0020] 在下面的詳細(xì)描述中,對附圖進(jìn)行引用,附圖形成詳細(xì)描述的一部分,其中,類似 的標(biāo)號始終表示類似的部分,且附圖中作為闡釋示出可以實(shí)踐的實(shí)施例。應(yīng)理解,在不偏離 本公開內(nèi)容的范圍的前提下,可以利用其他實(shí)施例且可以做出結(jié)構(gòu)或邏輯改變。因此,下 列詳細(xì)描述不應(yīng)以限制意義來理解,且各實(shí)施例的范圍由所附權(quán)利要求界定和它們的等效 物。
[0021] 又可以以最有助于理解所要求保護(hù)的本主題的方式把各種操作描述為多個分離 的動作或操作。然而,描述的次序不應(yīng)被解釋成暗示這些操作必然是依賴于次序的。尤其, 這些操作可以不按呈現(xiàn)的次序來執(zhí)行??梢园磁c所描述的實(shí)施例不同的次序來執(zhí)行所描述 的操作。可以執(zhí)行各種附加的操作和/或在附加的實(shí)施例中可以省略所描述的操作。
[0022] 出于本公開內(nèi)容的目的,短語"A和/或B"意味著⑷、⑶或(A和B)。出于本 公開內(nèi)容的目的,短語"A、B和/或C"意味著(A)、(B)、(C)、(A和B)、(A和C)、(B和C)或 (A、B 和 C) 〇
[0023] 本描述可以使用短語"在一種實(shí)施例中"或"在各實(shí)施例中",這些術(shù)語都可以指相 同或不同的實(shí)施例中的一個或多個。此外,本公開內(nèi)容的各實(shí)施例所使用的術(shù)語"包括"、 "包含"、"具有"等等是同義詞。
[0024] 如下文所使用的,包括權(quán)利要求,術(shù)語"模塊"可以是指是以下的部分或包括以下: 執(zhí)行一個或多個軟件或固件程序、組合邏輯電路和/或提供所描述的功能的其他合適的組 件的專用集成電路(ASIC)、電子電路、處理器(共享、專用或組)和/或存儲器(共享、專 用或組)。術(shù)語"隱藏式字幕(closed caption)"包括傳統(tǒng)的隱藏式字幕和/或?qū)Π鬃帜?(subtitle)〇
[0025] 現(xiàn)在參見圖1,示出根據(jù)各種實(shí)施例與用于人臉跟蹤的本公開內(nèi)容的教導(dǎo)合并的 示例計算裝置的概覽。正如所闡釋的,在各實(shí)施例中,計算裝置100可以包括處理器和存儲 器裝置102以及外圍設(shè)備104,如所示出的,它們經(jīng)由耦合106彼此耦合。處理器和存儲器 裝置102可以被配置為主控并執(zhí)行操作系統(tǒng)和服務(wù)114以及應(yīng)用112,而外圍設(shè)備104可以 例如包括被配置為捕捉或接收多個圖像幀的圖像捕捉或接收設(shè)備142。圖像捕捉設(shè)備的示 例可以是攝像機(jī),而圖像接收設(shè)備的示例可以是通信接口,該通信接口被配置為把處理器 和存儲器裝置102耦合到提供圖像幀的流的遠(yuǎn)程圖像源(未示出)。
[0026] 在各實(shí)施例中,應(yīng)用112可以在操作系統(tǒng)和服務(wù)114的控制下執(zhí)行和/或利用操 作系統(tǒng)和服務(wù)114的服務(wù)。操作系統(tǒng)和服務(wù)114所提供的服務(wù)可以包括人臉識別服務(wù)122, 人臉識別服務(wù)122可以包括但不限于人臉檢測功能132和人臉跟蹤功能134。可以把所捕 捉的或流傳播的圖像幀提供給應(yīng)用112,應(yīng)用112又可以調(diào)用人臉識別服務(wù)122的服務(wù)以便 識別和/或跟蹤圖像幀中的一個或多個人臉。下面將更詳細(xì)地描述人臉識別服務(wù)122,尤其 是人臉檢測功能132和人臉跟蹤功能134。
[0027] 處理器和存儲器裝置102預(yù)期表示寬范圍的處理器和存儲器設(shè)備,包括但不限于 被設(shè)計為用于移動計算的裝置。例如而非限制,處理器可以是本領(lǐng)域中已知的多種單核或 多核通用或?qū)S锰幚砥髦械娜魏我环N。可以使用一個或多個通用或?qū)S锰幚砥?。專用處?器的示例可以包括但不限于圖形處理器。存儲器可以是本領(lǐng)域中已知的多種易失性和/或 非易失性存儲器中的任何一種,包括但不限于動態(tài)隨機(jī)存取存儲器(DRAM)、閃速存儲器等 等。類似地,可以使用一個或多個存儲器單元。
[0028] 如先前所描述的,外圍設(shè)備104可以包括圖像捕捉設(shè)備,例如相機(jī)或通信接口。在 相機(jī)的情況下,它可以是本領(lǐng)域中已知的寬范圍的照相機(jī)中的任何一種。在通信接口的情 況下,它同樣可以是被配置為把耦合處理器和存儲器裝置102耦合到個域網(wǎng)、局域網(wǎng)和/或 廣域網(wǎng)的寬范圍的有線和/或無線通信接口中的任何一種。有線通信接口的示例可以包括 以太網(wǎng)聯(lián)網(wǎng)接口。無線通信接口的示例可以包括支持WiFi、3G/4G無線通信的接口。局域 網(wǎng)和/或廣域網(wǎng)可以包括私有和/或公共網(wǎng)絡(luò),例如因特網(wǎng)。
[0029] 進(jìn)一步,外圍設(shè)備104可以包括其他組件,例如存儲設(shè)備。存儲設(shè)備可以是多種 光、磁或固態(tài)存儲設(shè)備中的任何一種。外圍設(shè)備104也可以包括輸入和輸出設(shè)備。輸入設(shè) 備可以包括鍵盤或其他光標(biāo)控制和/或手勢識別設(shè)備。輸出設(shè)備可以包括顯示設(shè)備。顯示 設(shè)備可以是本領(lǐng)域中已知的多種顯示設(shè)備中的任何一種,包括但不限于觸摸屏顯示器,觸 摸屏顯示器也可以充當(dāng)輸入設(shè)備。更進(jìn)一步,計算裝置100可以包括全球定位系統(tǒng)(GPS) 支持和各種傳感器。
[0030] 處理器和存儲器裝置102和外圍設(shè)備104中的一些可以一起位于相同的平臺上且 借助于耦合106相互耦合,耦合106例如是系統(tǒng)總線。處理器和存儲器裝置102和其他外 圍設(shè)備104可相互遠(yuǎn)程定位,且借助于耦合106相互耦合,耦合106例如是通信鏈路。艮P, 處理器和存儲器裝置102單獨(dú)地或者與外圍設(shè)備104聯(lián)合,可以形成單個計算設(shè)備,例如智 能電話、計算平板、超極本、膝上型、臺式、服務(wù)器、機(jī)頂盒、游戲控制臺、媒體播放器、電子閱 讀器等等。
[0031] 仍然參見圖1,在