本發(fā)明涉及機器人,尤其涉及一種具有人臉識別功能的機器人和人臉識別方法。
背景技術(shù):
隨著人類城市化進程的推進,人們的工作節(jié)奏不斷加快,人口老齡化和空巢老人的出現(xiàn),對于寵物陪伴的需求與日俱增。但是真實的寵物照料護理非常費時,而且需要一定的活動空間,對于居住面積不大的家庭是個難題。
最近幾年,機器人正朝著智能化方向發(fā)展,開始具有感覺和感知等功能。因此能夠與人交流的家庭陪伴型機器人逐漸成為可能。
目前家庭陪伴型機器人能夠與人類進行簡單的互動,例如動作的模仿和聲音的模仿,但是其互動行為與真實的寵物相比還相去甚遠。其中一個重要的缺失是,家庭陪伴型機器人不具備人臉識別功能,因此無法與家庭成員進行個性化的互動。
技術(shù)實現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是提供一種具有人臉識別功能的機器人和人臉識別方法,可以實現(xiàn)機器人尤其是家庭陪伴型機器人對人臉的識別。
本發(fā)明為解決上述技術(shù)問題而采用的技術(shù)方案是一種具有人臉識別功能的機器人,其與外部的服務器配合,包括圖像采集單元、圖像識別單元、通信單元以及控制器。圖像采集單元用于捕捉一個以上的外部場景圖像。圖像識別單元用于從一個以上的外部場景圖像中獲取具備識別特征點的人臉圖像。通信單元用于與外部的服務器進行通信??刂破鬟B接該圖像采集單元和該通信單元,用于將具備識別特征點的人臉圖像通過該通信單元傳輸至外部的服務器進行人臉識別并接收外部的服務器回傳的人臉識別結(jié)果,根據(jù)該人臉識別結(jié)果啟動對 應的互動模式。
在本發(fā)明的一實施例中,該控制器響應于人臉識別啟動指令而開啟該圖像采集單元。
在本發(fā)明的一實施例中,該人臉識別啟動指令包含在語音信號中,該機器人還包括語音信號采集單元、連接該語音信號采集單元和該控制器的語音信號識別單元,該語音信號采集單元用于采集外部輸入的語音信號,該語音信號識別單元用于識別該語音信號中的人臉識別啟動指令。
在本發(fā)明的一實施例中,該人臉識別啟動指令包含在觸摸信號中,該機器人還包括觸摸信號檢測單元、連接該觸摸信號檢測單元和該控制器的觸摸信號識別單元,該觸摸信號檢測單元用于檢測觸摸動作以產(chǎn)生該觸摸信號,該觸摸信號識別單元用于識別該觸摸信號中的人臉識別啟動指令。
在本發(fā)明的一實施例中,該人臉識別啟動指令包含在無線信號中,該機器人還包括無線信號通訊單元、連接該無線信號通訊單元和該控制器的無線信號識別單元,該無線信號通訊單元用于接收外部傳輸?shù)臒o線信號,該無線信號識別單元用于識別該無線信號中的人臉識別啟動指令。
在本發(fā)明的一實施例中,該控制器在選定多個圖像中存在具備識別特征點的人臉圖像之后還排除不具有識別特征點的人臉圖像。
在本發(fā)明的一實施例中,該控制器用于載入與該人臉識別結(jié)果關(guān)聯(lián)的特征資料庫,該互動模式包含在該特征資料庫中。
在本發(fā)明的一實施例中,該互動模式由以下參數(shù)至少其中之一定義:配合度、親密度、以及智能度,其中該配合度表征機器人對個體的指令的配合程度,該親密度表征機器人與個體接觸的親密程度,該智能度表征機器人的智能等級。
在本發(fā)明的一實施例中,該通信單元將該具備識別特征點的人臉圖像傳輸至外部的服務器的方式包括以下其中之一:通過無線局域網(wǎng)傳輸該人臉圖像到一本地服務器;通過接入互聯(lián)網(wǎng)的無線局域網(wǎng)傳輸該人臉圖像到一云端服務器;通過移動互聯(lián)網(wǎng)傳輸該人臉圖像到一云端服務器。
本發(fā)明還提出一種人臉識別方法,包括以下步驟:捕捉一個以上的外部場景圖像;從一個以上的外部場景圖像中獲取具備識別特征點的人臉圖像;將具備識別特征點的人臉圖像傳輸至外部的服務器以供該服務器進行人臉識別;并接 收該服務器回傳的人臉識別結(jié)果;以及根據(jù)該人臉識別結(jié)果啟動對應的互動模式。
在本發(fā)明的一實施例中,上述方法還包括以下步驟:響應于人臉識別啟動指令,開啟捕捉一個以上的外部場景圖像。
在本發(fā)明的一實施例中,該人臉識別啟動指令包含在語音信號中,所述響應于人臉識別啟動指令為:采集外部輸入的語音信號,識別該語音信號中的人臉識別啟動指令并進行響應。
在本發(fā)明的一實施例中,該人臉識別啟動指令包含在觸摸信號中,所述響應于人臉識別啟動指令為:檢測觸摸動作以產(chǎn)生該觸摸信號,識別該觸摸信號中的人臉識別啟動指令并進行響應。
在本發(fā)明的一實施例中,該人臉識別啟動指令包含在無線信號中,所述響應于人臉識別啟動指令為:接收外部傳輸?shù)臒o線信號,識別該無線信號中的人臉識別啟動指令并進行響應。
在本發(fā)明的一實施例中,從一個以上的外部場景圖像中獲取具備識別特征點的人臉圖像的步驟包括:a.判斷一外部場景圖像是否包含具備識別特征點的人臉圖像;b.如果該外部場景圖像包含具備識別特征點的人臉圖像,則進入步驟d,否則進入步驟c;c.繼續(xù)捕捉外部場景圖像,并返回步驟a;d.獲取該人臉圖像。
在本發(fā)明的一實施例中,根據(jù)該人臉識別結(jié)果啟動對應的互動模式之前還包括:載入與該人臉識別結(jié)果關(guān)聯(lián)的特征資料庫,該互動模式包含在該特征資料庫中。
在本發(fā)明的一實施例中,該互動模式由以下參數(shù)的至少其中之一定義:配合度、親密度、以及智能度,其中該配合度表征機器人對個體的指令的配合程度,該親密度表征機器人與個體接觸的親密程度,該智能度表征機器人的智能等級。
在本發(fā)明的一實施例中,將該具備識別特征點的人臉圖像從該機器人傳輸?shù)酵獠康姆掌鞯牟襟E包括以下其中之一:通過無線局域網(wǎng)傳輸該人臉圖像到一本地服務器;通過接入互聯(lián)網(wǎng)的無線局域網(wǎng)傳輸該人臉圖像到一云端服務器;通過移動互聯(lián)網(wǎng)傳輸該人臉圖像到一云端服務器。
本發(fā)明由于采用以上技術(shù)方案,使之與現(xiàn)有技術(shù)相比,通過人臉識別算法獲得人臉識別結(jié)果,可以針對不同個體作出不同互動模式,從而實現(xiàn)了互動模式的個性化。本發(fā)明的人臉識別的部分工作都不依賴機器人的資源進行,可以使得機器人的硬件配置和成本降低,而且提高了人臉識別的效率。
附圖說明
為讓本發(fā)明的上述目的、特征和優(yōu)點能更明顯易懂,以下結(jié)合附圖對本發(fā)明的具體實施方式作詳細說明,其中:
圖1示出本發(fā)明一實施例的具有人臉識別功能的機器人的系統(tǒng)框圖;
圖2示出本發(fā)明另一實施例的具有人臉識別功能的機器人的系統(tǒng)框圖;
圖3示出本發(fā)明一實施例的人臉識別方法流程圖。
具體實施方式
本發(fā)明的實施例描述機器人的人臉識別方法和系統(tǒng),該方法和系統(tǒng)尤其適用于家庭陪伴型機器人。當然可以理解,該方法和系統(tǒng)也可適用于其它具有高交互需求的機器人,例如商業(yè)服務機器人。在本發(fā)明的實施例中,將人臉識別與機器人的互動模式關(guān)聯(lián)。根據(jù)識別出的不同個體,賦予機器人不同的互動模式,從而實現(xiàn)個性化的互動。
圖1示出本發(fā)明一實施例的具有人臉識別功能的機器人的系統(tǒng)框圖。參考圖1所示,本實施例的機器人100包括圖像采集單元101、圖像識別單元102、通信單元103、執(zhí)行單元104以及控制器105。圖像采集單元101用于捕捉一個以上的外部場景圖像,其實例是攝像頭。圖像采集單元101可以連續(xù)采集圖像,也可以間隔一定時間采集一幀或幾幀圖像,視具體場合而定。圖像識別單元102連接圖像采集單元101,其用于從一個以上的外部場景圖像中獲取具備識別特征點的人臉圖像。通信單元103配置為與一服務器200進行通信,以實現(xiàn)機器人的對外通信功能??刂破?05連接圖像采集單元101、通信單元103以及執(zhí)行單元104,用于控制機器人的整體運作。例如控制器105可根據(jù)需要命令例如圖像采集單元101的各個輸入設備捕捉外部信息,或者命令例如執(zhí)行單元104的設備執(zhí)行相應動作。
在人臉識別的工作流程中,控制器105配置為執(zhí)行如下步驟:將具備識別特征點的人臉圖像通過通信單元103傳輸至外部的服務器200進行人臉識別;接收外部的服務器回傳的人臉識別結(jié)果;根據(jù)人臉識別結(jié)果啟動對應的互動模式。除此之外,控制器105還可配置為對人臉圖像進行初步的處理。
本實施例的一個特點是,人臉識別的大部分工作并不利用機器人的內(nèi)部資源完成,而是依靠外部的服務器。機器人100對捕捉的外部場景圖像所進行的處理步驟是初步處理,旨在從中選定存在人臉的人臉圖像,然后將這些人臉圖像以及人臉識別請求發(fā)送給服務器200,請求執(zhí)行人臉識別。服務器200配備了執(zhí)行人臉識別算法的程序,可以響應于人臉識別請求,對圖像進行特征點分析,并與人臉庫進行比對,獲得人臉識別信息。在此,服務器200中的人臉識別算法可以使用已知的算法,在此不再詳細展開。
圖2示出本發(fā)明另一實施例的具有人臉識別功能的機器人的系統(tǒng)框圖。參考圖2所示,本實施例的機器人100包括圖像采集單元101、圖像識別單元102、通信單元103、執(zhí)行單元104以及控制器107。圖像采集單元101用于捕捉一個以上的外部場景圖像,其實例是攝像頭。圖像采集單元101可以連續(xù)采集圖像,也可以間隔一定時間采集一幀或幾幀圖像,視具體場合而定。圖像識別單元102連接圖像采集單元101,其用于從一個以上的外部場景圖像中獲取具備識別特征點的人臉圖像。語音信號采集單元106配置為采集語音信號,主要是人聲信號。語音信號中包含了機器人感興趣的各種指令。例如招呼機器人的指令、令機器人完成跑、跳等動作的指令。語音信號采集單元106的實例是麥克風。語音信號識別單元107連接語音信號采集單元106和控制器105,配置為識別語音信號中的指令。通信單元103配置為與一服務器200進行通信,以實現(xiàn)機器人的對外通信功能??刂破?05連接圖像采集單元101、語音信號采集單元106、語音信號識別單元107、通信單元103以及執(zhí)行單元104,用于控制機器人的整體運作。例如控制器105可根據(jù)需要命令例如圖像采集單元101、語音信號采集單元106的各個輸入設備捕捉外部信息,或者命令例如執(zhí)行單元104的設備執(zhí)行相應動作。
在人臉識別的工作流程中,控制器105配置為執(zhí)行如下步驟:將具備識別特征點的人臉圖像通過通信單元103傳輸至外部的服務器200進行人臉識別; 接收外部的服務器回傳的人臉識別結(jié)果;根據(jù)人臉識別結(jié)果啟動對應的互動模式。除此之外,控制器105還可配置為對人臉圖像進行初步的處理。
機器人可常規(guī)地處于待機或休眠狀態(tài),等待使用者的啟動(例如人聲呼喚)。在一個實例中,語音信號采集單元106采集語音信號,語音信號識別單元106可以識別語音信號中的人臉識別啟動指令并傳輸給控制器105,控制器105響應于這一啟動指令,據(jù)此開啟圖像采集單元101開始工作。當然可以理解,控制器105可以在其它狀況下開啟圖像采集單元101。例如控制器105響應于使用者的開關(guān)按鈕開啟圖像采集單元101。
本實施例的一個特點是,人臉識別的大部分工作并不利用機器人的內(nèi)部資源完成,而是依靠外部的服務器。機器人100對捕捉的外部場景圖像所進行的處理步驟是初步處理,旨在從中選定存在人臉的人臉圖像,然后將這些人臉圖像以及人臉識別請求發(fā)送給服務器200,請求執(zhí)行人臉識別。服務器200配備了執(zhí)行人臉識別算法的程序,可以響應于人臉識別請求,對圖像進行特征點分析,并與人臉庫進行比對,獲得人臉識別信息。在此,服務器200中的人臉識別算法可以使用已知的算法,在此不再詳細展開。
在圖像識別單元102中,還可以判斷一外部場景圖像是否包含具備識別特征點的人臉圖像,如果有則獲取該人臉圖像,如果沒有則通知圖像采集單元101繼續(xù)捕捉外部場景圖像。
通信單元103可以使用多種方式來傳輸人臉圖像給服務器200。例如通信單元103可通過無線局域網(wǎng)傳輸人臉圖像到本地服務器。本地服務器的例子是設于家庭或者其它小型場所中的個人計算機或者工作站,其上運行人臉識別軟件。人臉識別軟件中可預先建立家庭成員的人臉庫,供比對識別。通信單元105還可通過接入互聯(lián)網(wǎng)的無線局域網(wǎng)傳輸人臉圖像到云端服務器。云端服務器可預先獲得并建立家庭成員的人臉庫,供比對識別。作為替代,通信單元103還可通過移動互聯(lián)網(wǎng)傳輸人臉圖像到云端服務器。在商業(yè)服務機器人典型地使用云端服務器以存儲足夠容量的人臉庫及提供足夠強大的處理資源。
在上述的例子中,人臉識別啟動指令是包含在語音信號中。在替代例子中,人臉識別啟動指令也可以包含在觸摸信號或者無線信號中。例如機器人包括觸摸信號檢測單元、連接該觸摸信號檢測單元和該控制器的觸摸信號識別單元, 該觸摸信號檢測單元用于檢測觸摸動作以產(chǎn)生該觸摸信號,該觸摸信號識別單元用于識別該觸摸信號中的人臉識別啟動指令;或者機器人包括無線信號通訊單元、連接該無線信號通訊單元和該控制器的無線信號識別單元,該無線信號通訊單元用于接收外部傳輸?shù)臒o線信號,該無線信號識別單元用于識別該無線信號中的人臉識別啟動指令。
執(zhí)行單元104可包括行走機構(gòu)、肢體動作機構(gòu)、表情控制機構(gòu)以及揚聲器等。執(zhí)行單元104將按照控制器105指定的各種不同互動模式與個人展開互動。可以用不同的維度來定義互動模式,例如配合度、親密度、以及智能度。配合度表征機器人對個體的指令的配合程度。機器人可以對個體的一些指令給出積極配合,而對另一些指令不做出配合。親密度表征機器人與個體接觸的親密程度,例如距離遠近、友好動作(例如擁抱)/表情(例如笑臉)、不友好動作/表情的有無和/或頻率等。智能度表征機器人的智能等級,例如記憶、運算、比較、判斷、學習和邏輯推理等技能的多少。通過配合度、親密度、以及智能度的配合,可以定義各種各樣個性化的互動模式。這些互動模式還可隨著機器人與個體的長期互動過程不斷修正和演化,以體現(xiàn)互動的成果。
上述的互動模式的各個維度都可以通過執(zhí)行單元104的行走機構(gòu)、肢體動作機構(gòu)、表情控制機構(gòu)以及揚聲器,或者其它可用的機構(gòu)體現(xiàn)。例如親密度中的距離遠近可通過行走機構(gòu)執(zhí)行,友好/不友好動作可通過肢體動作機構(gòu)執(zhí)行,友好/不友好表情可通過表情控制機構(gòu)執(zhí)行。而機器人與人之間的語音互動可通過語音信號采集單元和揚聲器執(zhí)行。
當然可以理解,在不同的場合,互動模式的定義方式可以做出調(diào)整,例如在商業(yè)服務型機器人中,不同的互動模式可以反映機器人對不同個體的偏好、性格等方面的認知。無論在哪一種場合中,都可以建立不同的特征資料庫,這些特征資料庫可以與人臉識別結(jié)果(例如人臉識別結(jié)果指向的個體)關(guān)聯(lián),并在特征資料庫中包含互動模式。控制器105可在人臉識別后載入特征資料庫,從而啟動其中包含的互動模式。
圖3示出本發(fā)明一實施例的人臉識別方法流程圖。該方法可以在圖1、圖2所示的系統(tǒng)中執(zhí)行,也可以在其它系統(tǒng)中執(zhí)行。參考圖3所示,本實施例的一種機器人的人臉識別方法,包括以下步驟:
在步驟301,捕捉一個以上的外部場景圖像;
在步驟302,從一個以上的外部場景圖像中獲取具備識別特征點的人臉圖像;
在步驟303,將具備識別特征點的人臉圖像傳輸至外部的服務器以供該服務器進行人臉識別;
在步驟304,接收從服務器回傳的人臉識別結(jié)果;
在步驟305,根據(jù)人臉識別結(jié)果啟動對應的互動模式。
在步驟302中,從一個以上的外部場景圖像中獲取具備識別特征點的人臉圖像的步驟包括:a.判斷一外部場景圖像是否包含具備識別特征點的人臉圖像;b.如果該外部場景圖像包含具備識別特征點的人臉圖像,則進入步驟d,否則進入步驟c;c.繼續(xù)捕捉外部場景圖像,并返回步驟a;d.獲取該人臉圖像。
在步驟305之前,可以載入與該人臉識別結(jié)果關(guān)聯(lián)的特征資料庫,該特征資料庫中包含上述互動模式。
本發(fā)明上述實施例的具有人臉識別功能的機器人和人臉識別方法,通過搭載在機器人上的圖像采集設備在場景中捕捉到圖像,然后在本地做基本的人臉分析處理,找出人臉圖像后上傳到服務器,在服務器利用人臉識別算法對上傳的人臉進行特征點分析,與人臉庫進行比對,獲得人臉識別結(jié)果。最后將人臉識別結(jié)果從服務器回傳到機器人,可以針對不同個體作出不同互動模式,從而實現(xiàn)了互動模式的個性化。本發(fā)明的人臉識別的部分工作都不依賴機器人的資源進行,可以使得機器人的硬件配置和成本降低,而且提高了人臉識別的效率。
雖然本發(fā)明已參照當前的具體實施例來描述,但是本技術(shù)領(lǐng)域中的普通技術(shù)人員應當認識到,以上的實施例僅是用來說明本發(fā)明,在沒有脫離本發(fā)明精神的情況下還可作出各種等效的變化或替換,因此,只要在本發(fā)明的實質(zhì)精神范圍內(nèi)對上述實施例的變化、變型都將落在本申請的權(quán)利要求書的范圍內(nèi)。