專(zhuān)利名稱(chēng):機(jī)器人設(shè)備、控制機(jī)器人設(shè)備動(dòng)作的方法、以及外力檢測(cè)設(shè)備和方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及機(jī)器人設(shè)備、控制機(jī)器人設(shè)備動(dòng)作的方法、和外力檢測(cè)設(shè)備和方法。
背景技術(shù):
一般來(lái)說(shuō),知識(shí)獲取或語(yǔ)言獲取主要以視頻信息和音頻信息的關(guān)聯(lián)存儲(chǔ)為基礎(chǔ)。
“從自然音頻-視頻輸入學(xué)習(xí)字詞”(由Deb Roy和Alex Pentland所著)(以下將稱(chēng)作文獻(xiàn)1)公開(kāi)了從輸入語(yǔ)音和輸入圖像學(xué)習(xí)語(yǔ)言的教義。文獻(xiàn)1中的學(xué)習(xí)方法被概述如下。
將圖像信號(hào)和語(yǔ)音信號(hào)(聲音信號(hào))相互同時(shí)或按不同時(shí)間供應(yīng)給學(xué)習(xí)系統(tǒng)。在文獻(xiàn)1中,這種相互同時(shí)或按不同時(shí)間供應(yīng)的一對(duì)圖像和語(yǔ)音的事件被稱(chēng)作“AV事件”。
當(dāng)圖像信號(hào)和語(yǔ)音信號(hào)如此供應(yīng)時(shí),進(jìn)行圖像處理,以便通過(guò)圖像處理從圖像信號(hào)中檢測(cè)顏色和形狀,同時(shí)進(jìn)行語(yǔ)音處理,以便依據(jù)語(yǔ)音信號(hào)檢測(cè)遞歸神經(jīng)網(wǎng)絡(luò)并進(jìn)行語(yǔ)音信號(hào)的音素分析。具體地說(shuō),根據(jù)圖像特征空間中的特征將輸入圖像歸類(lèi)到每個(gè)類(lèi)別(特殊圖像識(shí)別類(lèi)別或圖像識(shí)別類(lèi)別)。同時(shí),根據(jù)聲音特征空間中的特征將輸入語(yǔ)音歸類(lèi)到每個(gè)類(lèi)別(特殊聲音識(shí)別類(lèi)別或聲音識(shí)別類(lèi)別)。該特征空間由
圖1所示的多個(gè)元素組成。例如,對(duì)于圖像信號(hào),特征空間由元素是色差信號(hào)和亮度信號(hào)的二維或三維空間組成。由于輸入圖像具有這樣一個(gè)特征空間中的元素的預(yù)定映象,因此可以根據(jù)該元素映象識(shí)別顏色。在該特征空間中,考慮到識(shí)別顏色的距離,進(jìn)行分類(lèi)。
對(duì)于例如聲音的識(shí)別,利用了連續(xù)識(shí)別HMM(隱含的馬爾可夫模型)方法。連續(xù)識(shí)別HMM方法(下面簡(jiǎn)稱(chēng)為“HMM”)允許語(yǔ)音信號(hào)按音素序列被識(shí)別。此外,上述的遞歸神經(jīng)網(wǎng)絡(luò)是通過(guò)其將信號(hào)反饋到輸入層側(cè)的一種神經(jīng)網(wǎng)絡(luò)。
根據(jù)涉及同時(shí)發(fā)生的相關(guān)(相關(guān)學(xué)習(xí)),將已歸類(lèi)的音素與用于學(xué)習(xí)目的的圖像處理所分類(lèi)的刺激物(圖像)進(jìn)行相關(guān)。也就是,獲得表示為一個(gè)圖像的事物的名稱(chēng)和說(shuō)明,作為學(xué)習(xí)結(jié)果。
如圖2所示,在上述學(xué)習(xí)中,根據(jù)每一個(gè)基于圖像信息形成的圖像類(lèi)別鑒別(識(shí)別)輸入圖像,該圖像類(lèi)別包括“紅色物”、“藍(lán)色物”、…;同時(shí)根據(jù)每一個(gè)依據(jù)聲音信息形成的類(lèi)別鑒別(識(shí)別)輸入語(yǔ)音,該聲音類(lèi)別包括所發(fā)出的“紅色”、“藍(lán)色”、“黃色”、…。
然后,通過(guò)相關(guān)學(xué)習(xí)將上述分類(lèi)的圖像和語(yǔ)音進(jìn)行相關(guān)處理,因而,當(dāng)“紅色物”作為輸入圖像被供應(yīng)時(shí),圖2中的學(xué)習(xí)系統(tǒng)200可以輸出“紅色”的音素序列(發(fā)出聲音),作為相關(guān)學(xué)習(xí)的結(jié)果。
最近,已經(jīng)提出了一種可以響應(yīng)周?chē)h(huán)境(外部因素)和內(nèi)部狀態(tài)(諸如情緒或本能的內(nèi)部因素)自主地進(jìn)行舉止的機(jī)器人設(shè)備。這種機(jī)器人設(shè)備(下面稱(chēng)之為“機(jī)器人”)被設(shè)計(jì)成與人類(lèi)或環(huán)境進(jìn)行交互作用。例如,人們已經(jīng)提出了所謂的寵物機(jī)器人和類(lèi)似物,每個(gè)具有類(lèi)似動(dòng)物的外形和類(lèi)似動(dòng)物的舉止。
例如,這樣一種機(jī)器人所具有的學(xué)習(xí)各種信息的能力導(dǎo)致其娛樂(lè)性能的改善。特別是,學(xué)習(xí)動(dòng)作或舉止的能力將增加與機(jī)器人玩耍的樂(lè)趣。
上述應(yīng)用于被設(shè)計(jì)成可控制動(dòng)作的機(jī)器人的學(xué)習(xí)方法(如文獻(xiàn)1所述)遇到了以下問(wèn)題。
首先,上述學(xué)習(xí)方法不適合設(shè)置以對(duì)機(jī)器人行動(dòng)進(jìn)行控制。
如文獻(xiàn)1所述,如果響應(yīng)輸入信號(hào)建立一個(gè)被存儲(chǔ)字或輸入信號(hào)被判斷為一個(gè)新信號(hào),則將建立發(fā)聲方式并輸出適當(dāng)?shù)囊羲匦蛄小H欢?,?dāng)機(jī)器人與人類(lèi)或環(huán)境進(jìn)行交互時(shí),不需要發(fā)出輸入的信號(hào),而是需要響應(yīng)該輸入進(jìn)行適當(dāng)?shù)男袆?dòng)。
此外,當(dāng)根據(jù)圖像特征空間和聲音特征空間中的距離進(jìn)行分類(lèi)時(shí),所獲得的圖像和語(yǔ)音將是圖像和聲音特征空間中彼此接近的信息。然而,在某些情況下,機(jī)器人需要響應(yīng)圖像和語(yǔ)音進(jìn)行不同動(dòng)作。在這種情況下,必須為合適的動(dòng)作做出分類(lèi)。然而,傳統(tǒng)的方法不能適應(yīng)這種需求。
傳統(tǒng)的知識(shí)或語(yǔ)言獲取系統(tǒng)主要包括以下部件(1)分類(lèi)圖像信號(hào)和生成新類(lèi)別的裝置;(2)分類(lèi)聲頻信號(hào)和生成新類(lèi)別的裝置;(3)將項(xiàng)(1)和項(xiàng)(2)彼此進(jìn)行相關(guān)或者相互關(guān)聯(lián)地學(xué)習(xí)圖像和聲音的裝置。
當(dāng)然,某些傳統(tǒng)的知識(shí)或語(yǔ)言獲取系統(tǒng)使用不同于上述功能的部件。但是上述三個(gè)功能是這種系統(tǒng)的基本功能。
上述項(xiàng)(1)和(2)中的分類(lèi)包括特征空間中的映象,用預(yù)見(jiàn)知識(shí)進(jìn)行有效信號(hào)的參數(shù)辨別,使用概率分類(lèi)等。
一般來(lái)說(shuō),圖像例如可以通過(guò)以下兩種方式來(lái)識(shí)別控制用于每種顏色,比如顏色空間中的紅、藍(lán)、綠和黃色的顏色模板的閾值;或者,根據(jù)現(xiàn)有顏色存儲(chǔ)區(qū)域與特征空間中的輸入顏色之間的距離,為出現(xiàn)的顏色刺激確定每種顏色的概率。例如,對(duì)于已經(jīng)分類(lèi)為圖1所示特征空間中的一個(gè)特征的區(qū)域,依據(jù)輸入圖像的特征所確定的區(qū)域到現(xiàn)存特征區(qū)域的距離,確定分類(lèi)的概率。此外,神經(jīng)網(wǎng)絡(luò)的方法可以有效用于此目的。
另一方面,為了學(xué)習(xí)語(yǔ)音,將通過(guò)音素檢測(cè)由HMM供應(yīng)的音素序列與所存儲(chǔ)的音素序列進(jìn)行相互比較,并且根據(jù)比較結(jié)果按概率識(shí)別一個(gè)字。
按上述項(xiàng)(1)和項(xiàng)(2)生成新類(lèi)別的裝置包括估算一個(gè)輸入信號(hào),以確定它是否屬于現(xiàn)存類(lèi)別。當(dāng)確定輸入信號(hào)屬于現(xiàn)存類(lèi)別時(shí),認(rèn)為它屬于該類(lèi)別并被反饋到分類(lèi)方法。另一方面,如果判斷該輸入信號(hào)不屬于任何類(lèi)別,則生成一個(gè)新類(lèi)別并進(jìn)行學(xué)習(xí),用于根據(jù)輸入的刺激進(jìn)行分類(lèi)。
新類(lèi)別按下列方式生成。例如,如果判斷一個(gè)圖像類(lèi)別不屬于任何現(xiàn)存類(lèi)別(圖像A的類(lèi)別,圖像B的類(lèi)別,…),則劃分現(xiàn)存類(lèi)別(例如,圖像A的類(lèi)別)以生成圖3A所示的新圖像類(lèi)別。如果判斷一個(gè)聲音類(lèi)別不屬于任何現(xiàn)存類(lèi)別(聲音α類(lèi)別,聲音β類(lèi)別,…),則劃分現(xiàn)存類(lèi)別(例如,聲音β類(lèi)別),以生成圖3B所示的新聲音類(lèi)別。
此外,項(xiàng)(3)中的圖像和聲音的關(guān)聯(lián)包括關(guān)聯(lián)存儲(chǔ)器或類(lèi)似物。
用于圖像的辨別類(lèi)別被稱(chēng)作矢量(以下,將稱(chēng)之為“圖像識(shí)別矢量”)IC[i](i=0,1,…NIC-1),用于聲音的辨別類(lèi)別被稱(chēng)作矢量(以下,將稱(chēng)之為“聲音識(shí)別矢量”)SC[j](j=0,1,…NSC-1)。對(duì)于所呈現(xiàn)的圖像信號(hào)和聲音信號(hào)(為學(xué)習(xí)而供應(yīng)),分別將每個(gè)識(shí)別類(lèi)別的概率或估算結(jié)果設(shè)置給矢量值。
在一個(gè)自檢索關(guān)聯(lián)存儲(chǔ)器(self-recalling associative memory)中,將圖像識(shí)別矢量IC和聲音識(shí)別矢量SC構(gòu)成由下列等式(1)和(2)給定的單個(gè)矢量CV[n]=IC[n](0≤n<NIC)…………………………………(1)
CV[n]=SC[n-NIC](0≤n<NSC)……………………………(2)需要說(shuō)明的是,在自檢索關(guān)聯(lián)存儲(chǔ)器領(lǐng)域,由Hopfield提出的所謂的Hopfield網(wǎng)絡(luò)是眾所周知的。
上述矢量被變換成將在下面說(shuō)明的單個(gè)矢量。假定矢量CV是列矢量,則通過(guò)將下式(3)給出的矩陣delta W增加到當(dāng)前存儲(chǔ)的矩陣W中構(gòu)成自檢索關(guān)聯(lián)存儲(chǔ)器。
delta_W=CV×trans(CV) …………………………………(3)因而,可以將一個(gè)圖像刺激(輸入圖像)當(dāng)作一個(gè)類(lèi)別,并且將作為語(yǔ)音識(shí)別結(jié)果的一個(gè)字(例如,HMM的類(lèi)別)與該類(lèi)別相關(guān)聯(lián)。通過(guò)呈現(xiàn)一個(gè)新圖像(例如,紅色物)和輸入語(yǔ)音“紅色”,使每個(gè)圖像和聲音類(lèi)別按圖像刺激物的紅色來(lái)描述,以便具有刺激物的適當(dāng)尺寸或特征空間的距離,同樣,每個(gè)類(lèi)別對(duì)語(yǔ)音“紅色”的音素序列的適當(dāng)范圍起作用。這些類(lèi)別被處理為上述等式中的相關(guān)矩陣并且被隨機(jī)地平均,使圖像和語(yǔ)音類(lèi)別關(guān)于同樣刺激物具有高位值,即,它們之間具有高相關(guān)。因而,當(dāng)紅色圖像被呈現(xiàn)時(shí),存儲(chǔ)與紅色圖像關(guān)聯(lián)的HMM類(lèi)別“紅色(發(fā)出的聲音)”。
另一方面,“Perceptually Grounded Meaning Creation”(by Luc Steels,ICMAS,Kyoto,1996)(以下將稱(chēng)作“文獻(xiàn)2”)公開(kāi)了一種通過(guò)稱(chēng)之為“辨別游戲”的試驗(yàn)的意圖獲取。下面概述該辨別游戲。
“辨別游戲”系統(tǒng)包括多個(gè)不限于上述圖像和聲音的傳感器通道和特征檢測(cè)器。一個(gè)稱(chēng)作“代理(agent)”(比如,軟件)的事物借助特征檢測(cè)器,嘗試區(qū)別新近呈現(xiàn)的對(duì)象與另一個(gè)對(duì)象(已經(jīng)被識(shí)別的對(duì)象),即,根據(jù)特征區(qū)別諸多對(duì)象。如果沒(méi)有可以區(qū)別諸多對(duì)象的特征,則建立對(duì)應(yīng)于新近呈現(xiàn)的對(duì)象的新特征檢測(cè)器。如果一個(gè)對(duì)象沒(méi)有可區(qū)別另一個(gè)對(duì)象的特征,即,當(dāng)對(duì)應(yīng)的特征檢測(cè)器不能用于該對(duì)象時(shí),則判斷該代理贏得該辨別游戲。如果一個(gè)對(duì)象具有對(duì)應(yīng)的特征檢測(cè)器,則判定該代理是游戲的獲勝者。
然后,整個(gè)系統(tǒng)根據(jù)“自然選擇論者”的原理進(jìn)行工作。也就是,贏得游戲的對(duì)象具有較高的生存概率,而輸?shù)粲螒虻膶?duì)象將建立新的特征檢測(cè)器。然而,該新的特征檢測(cè)器將在下一個(gè)游戲中使用,并且不知道該檢測(cè)器是否將提供一個(gè)正確結(jié)果。因而,能夠更好進(jìn)行區(qū)別的代理將生存。
該辨別游戲已經(jīng)在上文中概述。換言之,這種辨別游戲可以被看作經(jīng)自然選擇建立更好的特征檢測(cè)器的方法。
此外,“自適應(yīng)語(yǔ)言的自發(fā)自組織”(by Luc Steels,Muggleton,S.(ed),1996,Machine,Intelligence 15)(下面稱(chēng)作“文獻(xiàn)3”)給出通過(guò)“語(yǔ)言游戲”方法的語(yǔ)言生成。該“語(yǔ)言游戲”包括以下三個(gè)步驟第一步傳播(聲音)。
第二步創(chuàng)建。在此步驟中,代理建立一個(gè)新字,并且將它與一個(gè)新特征關(guān)聯(lián)。
第三步自組織。在此步驟中,系統(tǒng)通過(guò)分類(lèi)和選擇進(jìn)行自組織。
更具體地說(shuō),該語(yǔ)言游戲包括用于所謂的圖像處理的第一步驟;用于與語(yǔ)言處理相聯(lián)系的字(然而,實(shí)際上,不識(shí)別語(yǔ)音,而是輸入所謂的字符)的第二步驟;和將第一步驟(步驟1)中獲得的圖像與字相關(guān)聯(lián)的第三步驟。前述的辨別游戲沒(méi)有相當(dāng)于第二步驟的部分,它僅適用于現(xiàn)存特征空間中造成的區(qū)別。
此外,“Language Acquisition with A Conceptual Structure-Based SpeechInput from Perceptual Information”(Iwasaki和Tamura,索尼計(jì)算機(jī)科學(xué)實(shí)驗(yàn)室)(以下稱(chēng)作文獻(xiàn)4)公開(kāi)了使用用于語(yǔ)音識(shí)別的HMM的語(yǔ)法和典型圖案(圓、三角或其它形狀,紅、藍(lán)和其它顏色)的獲取,其中,在用于圖像識(shí)別的計(jì)算機(jī)的監(jiān)視器上彩色顯示圖像。
在文獻(xiàn)4中,用戶(hù)同時(shí)對(duì)圖4所示的監(jiān)視器210上的圖案(對(duì)象)點(diǎn)擊指點(diǎn)器或鼠標(biāo)(用指示的指點(diǎn)器212),和發(fā)出“紅色圓形物”或類(lèi)似的聲音。在文獻(xiàn)3的語(yǔ)言游戲中,用于彩色圖像的辨別游戲理論和HMM語(yǔ)音識(shí)別被用來(lái)按概率實(shí)現(xiàn)第一至第三步驟。
對(duì)于新類(lèi)別的生成,實(shí)行一個(gè)預(yù)定的檢驗(yàn)方法。在文獻(xiàn)4公開(kāi)的方法中,當(dāng)判別應(yīng)當(dāng)通過(guò)使用用于語(yǔ)音識(shí)別的HMM的檢驗(yàn)生成一個(gè)新類(lèi)別時(shí),細(xì)分HMM以生成新類(lèi)別。
此外,通過(guò)指點(diǎn)指針和點(diǎn)擊鼠標(biāo)選擇的圖案211(第一對(duì)象(Obj1))被移動(dòng)到如圖4箭頭所指示的第二對(duì)象(Obj2),同時(shí),供應(yīng)發(fā)出的語(yǔ)音“攀登”,以識(shí)別在監(jiān)視器210上形成的圖案的運(yùn)動(dòng)。如此識(shí)別的運(yùn)動(dòng)通過(guò)HMM分類(lèi)。
如上所述,各種用于知識(shí)或語(yǔ)言獲取的技術(shù)已經(jīng)被提出。然而,這些技術(shù)在以下的涉及機(jī)器人的動(dòng)作獲取(動(dòng)作學(xué)習(xí))方面是不利的。
(1)輸入信號(hào)的特征空間中的距離和輸入信號(hào)的類(lèi)別歸屬的估價(jià);(2)動(dòng)作的創(chuàng)建和估價(jià);
(3)機(jī)器人與用戶(hù)之間的目標(biāo)對(duì)象的共享。所謂的目標(biāo)對(duì)象共享。
解決上述問(wèn)題(1)是困難的,因?yàn)閷?duì)輸入圖像信號(hào)的類(lèi)別歸屬的估價(jià)僅受到圖像信號(hào)、同一時(shí)間供應(yīng)的聲音信號(hào)的影響,或者受到基于這兩個(gè)信號(hào)檢索的存儲(chǔ)信息的影響。需要說(shuō)明的是,類(lèi)別歸屬估價(jià)是用于輸入信號(hào)屬于那個(gè)類(lèi)別的類(lèi)別索引。
假定已經(jīng)輸入的一個(gè)圖像信號(hào)被認(rèn)為在特征空間上非常接近現(xiàn)存類(lèi)別中的圖像信號(hào)。在此情況下,如圖5A所示,類(lèi)別A和類(lèi)別B在圖像特征空間中彼此接近。然而,假定如此輸入的圖像信號(hào)用來(lái)生成新類(lèi)別。
另一方面,如果在這些條件下判斷已經(jīng)輸入一個(gè)語(yǔ)音信號(hào),作為相應(yīng)于該圖像信號(hào)的對(duì)象的其它信息,并且該輸入的語(yǔ)音信號(hào)距現(xiàn)存類(lèi)別非常遠(yuǎn),則將為該對(duì)象生成用于語(yǔ)音信號(hào)的一個(gè)新類(lèi)別。所以,假定例如,如圖5B所示,聲音α的類(lèi)別(相應(yīng)于圖像A類(lèi)別的聲音類(lèi)別)和聲音β的類(lèi)別(相應(yīng)于圖像B類(lèi)別的聲音類(lèi)別)在聲音特征空間中被不同地映象,所以可以設(shè)置閾值S2。
因此,如果根據(jù)特征空間作出的聲音的類(lèi)別歸屬估價(jià)可以反映圖像的類(lèi)別歸屬估價(jià),則能夠生成用于該圖像的新類(lèi)別。例如,通過(guò)反映聲音特征空間中類(lèi)別歸屬估價(jià),可以在彼此接近的圖像A和B的類(lèi)別之間設(shè)置閾值S1,以區(qū)別如圖5A所示的類(lèi)別。也就是,通過(guò)參考任何其它類(lèi)別歸屬估價(jià),可以更適當(dāng)?shù)貙?shí)現(xiàn)一個(gè)類(lèi)別的歸屬。
然而,若圖像信號(hào)或語(yǔ)音信號(hào)的類(lèi)別彼此非常接近,則上述情況不足以生成圖像或語(yǔ)音的新類(lèi)別。這意味著當(dāng)圖像類(lèi)別或聲音類(lèi)別在它們的相應(yīng)特征空間中彼此接近時(shí),如圖6A和圖6B所示,不可能區(qū)別它們,盡管從第三特征空間來(lái)看它們具有相當(dāng)不同的特征。第三特征空間可以表現(xiàn)出動(dòng)作特征。
所以,本發(fā)明的目的是克服現(xiàn)有技術(shù)的上述缺點(diǎn),該目的是通過(guò)提供一種適合于適當(dāng)?shù)貐^(qū)別其相應(yīng)特征空間中的對(duì)象的機(jī)器人設(shè)備和控制該機(jī)器人設(shè)備的動(dòng)作的方法來(lái)實(shí)現(xiàn)的。
當(dāng)被判斷屬于新類(lèi)別的信號(hào)供應(yīng)給機(jī)器人設(shè)備時(shí),上述問(wèn)題(2)在于生成機(jī)器人設(shè)備的新動(dòng)作以及估價(jià)該新動(dòng)作。
對(duì)于傳統(tǒng)技術(shù),語(yǔ)言創(chuàng)建的估價(jià)相當(dāng)于所生成的動(dòng)作的估價(jià)。對(duì)于文獻(xiàn)3公開(kāi)的技術(shù),生成任意的音素序列。它將是包含在輸入信號(hào),可能是圖像信號(hào)中的對(duì)象的名稱(chēng)或類(lèi)似物。然而,將不生成產(chǎn)生動(dòng)作的任意運(yùn)動(dòng)系列。
例如,即使生成了具有四個(gè)腿(具有例如3個(gè)自由度)的機(jī)器人設(shè)備的各關(guān)節(jié)角的任意系列,機(jī)器人設(shè)備也不會(huì)進(jìn)行任何有意義的運(yùn)動(dòng)。當(dāng)生成語(yǔ)言時(shí),語(yǔ)言的音素序列將僅僅是對(duì)象名稱(chēng)。然而,如何估價(jià)所生成的動(dòng)作好或不好將成為一個(gè)問(wèn)題。
此外,本發(fā)明的具有克服現(xiàn)有技術(shù)的上述缺點(diǎn)的另一個(gè)目的,該目的是通過(guò)提供適合于生成輸入的適當(dāng)動(dòng)作的機(jī)器人設(shè)備和控制該機(jī)器人設(shè)備的的動(dòng)作的方法實(shí)現(xiàn)的。
上述問(wèn)題(3)是所謂的目標(biāo)對(duì)象共享(共享的關(guān)注)。造成該問(wèn)題的原因是機(jī)器人設(shè)備感知的信息非常不穩(wěn)定。例如,當(dāng)用戶(hù)或訓(xùn)練者在不對(duì)著機(jī)器人設(shè)備的圖像信號(hào)輸入單元(例如CCD攝像機(jī))的方向上,試著通過(guò)手持橙色球和發(fā)出“橙色球”聲音來(lái)教導(dǎo)機(jī)器人設(shè)備時(shí),如果機(jī)器人設(shè)備視野內(nèi)的一個(gè)對(duì)象是粉紅色盒,則機(jī)器人設(shè)備將“粉紅色盒”與語(yǔ)音“橙色球”相聯(lián)系。
在文獻(xiàn)4中,通過(guò)把指針指向圖案211和點(diǎn)擊鼠標(biāo),將監(jiān)視器210上的圖案211指定為目標(biāo)對(duì)象。然而,實(shí)際上沒(méi)有指點(diǎn)或指定這種目標(biāo)對(duì)象的任何裝置。甚至在文獻(xiàn)2和3公開(kāi)的理論被應(yīng)用于機(jī)器人設(shè)備的情況下,機(jī)器人設(shè)備的訓(xùn)練者或用戶(hù)將隨意選擇他或她視野內(nèi)的某些事物的一個(gè)、并根據(jù)他的記憶發(fā)出所選擇事物的名稱(chēng),使機(jī)器人設(shè)備注意到作為機(jī)器人設(shè)備將識(shí)別的目標(biāo)對(duì)象的所選擇的事物。然而,實(shí)際上這不是機(jī)器人設(shè)備可以識(shí)別目標(biāo)對(duì)象的任何學(xué)習(xí)。
此外,本發(fā)明具有克服現(xiàn)有技術(shù)的上述缺點(diǎn)的另一個(gè)目的,該目的是通過(guò)提供適合共享一個(gè)目標(biāo)對(duì)象(關(guān)注共享)以恰當(dāng)?shù)刈R(shí)別目標(biāo)對(duì)象的機(jī)器人設(shè)備和控制該機(jī)器人設(shè)備的動(dòng)作的方法實(shí)現(xiàn)的。
傳統(tǒng)的機(jī)器人設(shè)備通過(guò)設(shè)置在頭部的觸摸傳感器或類(lèi)似物檢測(cè)施加到頭部或其它部位的外力,由此與用戶(hù)進(jìn)行交互。然而,該交互將受到所設(shè)置的傳感器的數(shù)量和設(shè)置的位置的限制。
本發(fā)明的公開(kāi)所以,本發(fā)明的一個(gè)目的是克服現(xiàn)有技術(shù)上述缺點(diǎn),該目的通過(guò)提供一種機(jī)器人、外力檢測(cè)器和一種檢測(cè)外力的方法來(lái)實(shí)現(xiàn),能夠確保與用戶(hù)的觸摸(外力)交互作用中的更高自由度。
本發(fā)明的另一個(gè)目的是提供一種能夠適當(dāng)?shù)刈R(shí)別其特征空間中的每個(gè)對(duì)象的機(jī)器人設(shè)備和控制該機(jī)器人設(shè)備動(dòng)作的方法。
本發(fā)明的另一個(gè)目的是提供一種能夠響應(yīng)輸入生成適當(dāng)動(dòng)作的機(jī)器人設(shè)備和控制該機(jī)器人設(shè)備動(dòng)作的方法。
本發(fā)明的另一個(gè)目的是提供一種能夠共享目標(biāo)對(duì)象(關(guān)注共享)以恰當(dāng)識(shí)別目標(biāo)對(duì)象的機(jī)器人設(shè)備和控制該機(jī)器人設(shè)備動(dòng)作的方法。
本發(fā)明的另一個(gè)目的是提供一種機(jī)器人、外力檢測(cè)器和檢測(cè)外力的方法,能夠確保與用戶(hù)的觸摸(外力)交互作用中的更高自由度。
上述目的可以通過(guò)提供一種機(jī)器人設(shè)備來(lái)實(shí)現(xiàn),該機(jī)器人設(shè)備包括用于檢測(cè)觸摸的裝置;用于檢測(cè)在觸摸檢測(cè)裝置的觸摸檢測(cè)的同時(shí)或恰好之前或之后供應(yīng)的信息的裝置;存儲(chǔ)裝置,用于相關(guān)聯(lián)地存儲(chǔ)相應(yīng)于觸摸檢測(cè)所作出的動(dòng)作和輸入信息檢測(cè)裝置所檢測(cè)的輸入信息;和檢索動(dòng)作的裝置,用于根據(jù)新近獲取的信息從存儲(chǔ)裝置的信息中檢索動(dòng)作,以控制機(jī)器人設(shè)備進(jìn)行動(dòng)作。
在上述機(jī)器人設(shè)備中,輸入信息檢測(cè)裝置檢測(cè)恰好在觸摸檢測(cè)裝置的觸摸檢測(cè)之前或者之后供應(yīng)的信息,將響應(yīng)觸摸作出的動(dòng)作和輸入信息檢測(cè)裝置檢測(cè)的輸入信息相互關(guān)聯(lián)地存儲(chǔ)到存儲(chǔ)裝置中,并且動(dòng)作控制裝置根據(jù)新近獲取的輸入信息從存儲(chǔ)裝置的信息中檢索動(dòng)作,以控制機(jī)器人設(shè)備進(jìn)行動(dòng)作。
因而,在上述機(jī)器人設(shè)備中,相互關(guān)聯(lián)地存儲(chǔ)輸入信息和當(dāng)該輸入信息被檢測(cè)時(shí)作出的動(dòng)作,以及當(dāng)再次供應(yīng)與該輸入信息相同的信息時(shí),再現(xiàn)相應(yīng)動(dòng)作。
此外,上述目的可以通過(guò)提供一種控制機(jī)器人設(shè)備動(dòng)作的方法來(lái)實(shí)現(xiàn),該方法包括以下步驟檢測(cè)對(duì)機(jī)器人設(shè)備所作出的觸摸;檢測(cè)在觸摸檢測(cè)步驟的觸摸檢測(cè)的同時(shí)或恰好之前或之后供應(yīng)的信息;將響應(yīng)觸摸檢測(cè)步驟中的觸摸檢測(cè)所作出的動(dòng)作和輸入信息檢測(cè)步驟中檢測(cè)的輸入信息相互關(guān)聯(lián)地存入一個(gè)存儲(chǔ)裝置中;和根據(jù)新近獲取的信息從存儲(chǔ)裝置的信息中檢索動(dòng)作,以控制機(jī)器人進(jìn)行動(dòng)作。
在上述機(jī)器人設(shè)備動(dòng)作控制方法中,輸入信息和該輸入信息被檢測(cè)時(shí)作出的動(dòng)作被相互關(guān)聯(lián)地存儲(chǔ),并且當(dāng)再次供應(yīng)與該輸入信息相同的信息時(shí),再現(xiàn)相應(yīng)動(dòng)作。
此外,上述目的可以通過(guò)提供一種機(jī)器人設(shè)備來(lái)實(shí)現(xiàn),該機(jī)器人設(shè)備包括檢測(cè)輸入信息的裝置;存儲(chǔ)裝置,用于存儲(chǔ)由輸入信息檢測(cè)裝置檢測(cè)的輸入信息和動(dòng)作結(jié)果信息,該動(dòng)作結(jié)果信息表現(xiàn)出相應(yīng)于輸入信息檢測(cè)裝置檢測(cè)的輸入信息所作出的動(dòng)作結(jié)果;和識(shí)別動(dòng)作結(jié)果信息的裝置,用于根據(jù)新近供應(yīng)的輸入信息識(shí)別存儲(chǔ)裝置中的動(dòng)作結(jié)果信息,以控制機(jī)器人設(shè)備根據(jù)動(dòng)作結(jié)果信息進(jìn)行動(dòng)作。
在上述機(jī)器人設(shè)備中,表現(xiàn)出相應(yīng)于由輸入信息檢測(cè)裝置檢測(cè)的輸入信息所作出的動(dòng)作的結(jié)果的動(dòng)作結(jié)果信息和輸入信息被相互關(guān)聯(lián)地存儲(chǔ),并且根據(jù)新近供應(yīng)的輸入信息識(shí)別存儲(chǔ)裝置中的動(dòng)作結(jié)果信息,以控制機(jī)器人設(shè)備根據(jù)動(dòng)作結(jié)果信息進(jìn)行動(dòng)作。
因而,在上述機(jī)器人設(shè)備中,輸入信息和表現(xiàn)出相應(yīng)于輸入信息而作出的動(dòng)作的動(dòng)作結(jié)果信息被相互關(guān)聯(lián)地存儲(chǔ),并且當(dāng)再次供應(yīng)同樣的信息時(shí),根據(jù)相應(yīng)于輸入信息的動(dòng)作結(jié)果信息檢索過(guò)去的動(dòng)作,以控制機(jī)器人設(shè)備進(jìn)行適當(dāng)動(dòng)作。
此外,上述目的可以通過(guò)提供一種控制機(jī)器人設(shè)備動(dòng)作的方法來(lái)實(shí)現(xiàn),該方法包括以下步驟將動(dòng)作結(jié)果信息和輸入信息相互關(guān)聯(lián)地存儲(chǔ)到一個(gè)存儲(chǔ)裝置中,該動(dòng)作結(jié)果信息表現(xiàn)出相應(yīng)于輸入信息檢測(cè)裝置檢測(cè)的輸入信息而作出的動(dòng)作結(jié)果;和根據(jù)新近供應(yīng)的輸入信息識(shí)別存儲(chǔ)裝置中的動(dòng)作結(jié)果信息,以根據(jù)動(dòng)作結(jié)果信息控制機(jī)器人設(shè)備進(jìn)行動(dòng)作。
借助上述的機(jī)器人設(shè)備動(dòng)作控制方法,機(jī)器人設(shè)備相互關(guān)聯(lián)地存儲(chǔ)輸入信息和表現(xiàn)出根據(jù)輸入信息作出的動(dòng)作結(jié)果的動(dòng)作結(jié)果信息,并且當(dāng)相同的輸入信息再次供應(yīng)時(shí),根據(jù)與輸入信息相對(duì)應(yīng)的動(dòng)作結(jié)果信息檢索過(guò)去的動(dòng)作,以控制機(jī)器人設(shè)備做適當(dāng)?shù)膭?dòng)作。
此外,上述目的可以通過(guò)提供一種機(jī)器人設(shè)備來(lái)實(shí)現(xiàn),該機(jī)器人設(shè)備包括檢測(cè)輸入信息的裝置;特征檢測(cè)裝置,用于檢測(cè)由輸入信息檢測(cè)裝置檢測(cè)的輸入信息的特征;根據(jù)所檢測(cè)的特征對(duì)輸入信息進(jìn)行分類(lèi)的裝置;根據(jù)輸入信息控制機(jī)器人設(shè)備做動(dòng)作的裝置;和改變分類(lèi)的裝置,用于根據(jù)動(dòng)作結(jié)果信息改變已經(jīng)使機(jī)器人設(shè)備作出動(dòng)作的輸入信息的分類(lèi),該動(dòng)作結(jié)果信息表現(xiàn)出機(jī)器人設(shè)備在動(dòng)作控制裝置的控制下作出的動(dòng)作結(jié)果。
在上述機(jī)器人設(shè)備中,輸入信息檢測(cè)裝置檢測(cè)的輸入信息的特征由特征檢測(cè)裝置檢測(cè),輸入信息根據(jù)檢測(cè)的特征進(jìn)行分類(lèi),機(jī)器人設(shè)備由動(dòng)作控制裝置控制以根據(jù)輸入信息的分類(lèi)進(jìn)行動(dòng)作,以及根據(jù)表現(xiàn)出機(jī)器人設(shè)備在動(dòng)作控制裝置的控制下作出的動(dòng)作結(jié)果的動(dòng)作結(jié)果信息改變已經(jīng)使機(jī)器人設(shè)備動(dòng)作的輸入信息的分類(lèi)。
因而上述的機(jī)器人設(shè)備相應(yīng)于輸入信息的分類(lèi)進(jìn)行動(dòng)作,并且根據(jù)動(dòng)作結(jié)果改變分類(lèi)。
此外,上述目的可以通過(guò)提供一種控制機(jī)器人設(shè)備動(dòng)作的方法來(lái)實(shí)現(xiàn),該方法包括以下步驟檢測(cè)由輸入信息檢測(cè)裝置檢測(cè)的輸入信息的特征;根據(jù)特征檢測(cè)步驟中檢測(cè)的特征對(duì)輸入信息分類(lèi);根據(jù)信息分類(lèi)步驟中作出的輸入信息的分類(lèi)控制機(jī)器人設(shè)備進(jìn)行動(dòng)作;和根據(jù)動(dòng)作結(jié)果信息改變已經(jīng)使機(jī)器人設(shè)備作出動(dòng)作的輸入信息的分類(lèi),該動(dòng)作結(jié)果信息表現(xiàn)出在動(dòng)作控制步驟控制下機(jī)器人設(shè)備作出的動(dòng)作結(jié)果。
借助上述的機(jī)器人設(shè)備動(dòng)作控制方法,控制機(jī)器人設(shè)備相應(yīng)于輸入信息的分類(lèi)進(jìn)行動(dòng)作,并且根據(jù)動(dòng)作結(jié)果改變分類(lèi)。
此外,上述目的可以通過(guò)提供一種機(jī)器人設(shè)備來(lái)實(shí)現(xiàn),該機(jī)器人設(shè)備包括用于識(shí)別目標(biāo)對(duì)象的裝置;勇于存儲(chǔ)有關(guān)由目標(biāo)對(duì)象識(shí)別裝置識(shí)別的目標(biāo)對(duì)象的信息的裝置;和控制裝置,根據(jù)新近檢測(cè)的對(duì)象的信息和存儲(chǔ)在存儲(chǔ)裝置中有關(guān)目標(biāo)對(duì)象的信息控制機(jī)器人設(shè)備進(jìn)行動(dòng)作。
上述機(jī)器人設(shè)備將目標(biāo)對(duì)象識(shí)別裝置識(shí)別的目標(biāo)對(duì)象的信息存儲(chǔ)到存儲(chǔ)裝置中,并且動(dòng)作控制裝置控制機(jī)器人設(shè)備根據(jù)新近檢測(cè)的對(duì)象的信息和存儲(chǔ)在存儲(chǔ)裝置中的目標(biāo)對(duì)象的信息進(jìn)行動(dòng)作。
由此,上述機(jī)器人設(shè)備存儲(chǔ)目標(biāo)對(duì)象,并且當(dāng)相同對(duì)象的信息被再次供應(yīng)時(shí),機(jī)器人設(shè)備進(jìn)行預(yù)定的動(dòng)作。
此外,上述目的可以通過(guò)提供一種控制機(jī)器人設(shè)備動(dòng)作的方法來(lái)實(shí)現(xiàn),該方法包括以下步驟識(shí)別目標(biāo)對(duì)象;將目標(biāo)對(duì)象識(shí)別步驟中識(shí)別的目標(biāo)對(duì)象的信息存儲(chǔ)到存儲(chǔ)裝置中;和根據(jù)新近檢測(cè)的對(duì)象的信息和存儲(chǔ)裝置中存儲(chǔ)的目標(biāo)對(duì)象的信息,控制機(jī)器人設(shè)備進(jìn)行動(dòng)作。
借助上述機(jī)器人設(shè)備動(dòng)作控制方法,機(jī)器人設(shè)備存儲(chǔ)目標(biāo)對(duì)象,并且當(dāng)相同對(duì)象的信息被再次供應(yīng)時(shí),機(jī)器人設(shè)備進(jìn)行預(yù)定動(dòng)作。
此外,上目的可以通過(guò)提供一種機(jī)器人設(shè)備來(lái)實(shí)現(xiàn),該機(jī)器人設(shè)備包括諸多運(yùn)動(dòng)部件;移動(dòng)運(yùn)動(dòng)部件的諸多關(guān)節(jié);檢測(cè)裝置,用于檢測(cè)經(jīng)運(yùn)動(dòng)部件被施加了外力的關(guān)節(jié)的狀態(tài);和學(xué)習(xí)裝置,相互關(guān)聯(lián)地學(xué)習(xí)檢測(cè)裝置檢測(cè)的關(guān)節(jié)狀態(tài)和外力。
在上述機(jī)器人設(shè)備中,經(jīng)運(yùn)動(dòng)部件被施加了外力的關(guān)節(jié)的狀態(tài)可以由檢測(cè)裝置檢測(cè),并且學(xué)習(xí)裝置相互關(guān)聯(lián)地學(xué)習(xí)由檢測(cè)裝置檢測(cè)的關(guān)節(jié)狀態(tài)和外力。也就是,機(jī)器人設(shè)備學(xué)習(xí)與相應(yīng)于作用于運(yùn)動(dòng)部件的外力而變化的關(guān)節(jié)狀態(tài)目關(guān)聯(lián)的外力。
此外,上述目的可以通過(guò)提供一種外力檢測(cè)器來(lái)實(shí)現(xiàn),該檢測(cè)器包括檢測(cè)用于移動(dòng)運(yùn)動(dòng)部件的關(guān)節(jié)的狀態(tài)的裝置;和檢測(cè)外力的裝置,用于根據(jù)關(guān)節(jié)狀態(tài)檢測(cè)裝置檢測(cè)的關(guān)節(jié)狀態(tài),檢測(cè)作用于運(yùn)動(dòng)部件的外力。
在上述外力檢測(cè)裝置中,移動(dòng)運(yùn)動(dòng)部件的關(guān)節(jié)的狀態(tài)由關(guān)節(jié)狀態(tài)檢測(cè)裝置檢測(cè),并且根據(jù)關(guān)節(jié)狀態(tài)檢測(cè)裝置檢測(cè)的關(guān)節(jié)狀態(tài)檢測(cè)作用于運(yùn)動(dòng)部件的外力。即,外力檢測(cè)器根據(jù)移動(dòng)該運(yùn)動(dòng)部件的關(guān)節(jié)狀態(tài),檢測(cè)作用于運(yùn)動(dòng)部件的外力。
此外,上述目的可以通過(guò)提供一種檢測(cè)外力的方法來(lái)實(shí)現(xiàn),該方法包括以下步驟檢測(cè)用于移動(dòng)運(yùn)動(dòng)部件的關(guān)節(jié)的狀態(tài);根據(jù)所檢測(cè)的關(guān)節(jié)狀態(tài)檢測(cè)作用于該運(yùn)動(dòng)部件的外力;和根據(jù)移動(dòng)該運(yùn)動(dòng)部件的關(guān)節(jié)的狀態(tài)檢測(cè)作用于該運(yùn)動(dòng)部件的外力。
附圖簡(jiǎn)要說(shuō)明圖1示出用于檢測(cè)輸入信號(hào)的特征的特征空間;圖2是學(xué)習(xí)系統(tǒng)的方框圖,包括圖像和聲音信息的識(shí)別類(lèi)別;圖3A和圖3B解釋新識(shí)別類(lèi)別的生成;圖4借助來(lái)自知覺(jué)信息的基于概念結(jié)構(gòu)的語(yǔ)音解釋語(yǔ)言獲取(如Iwahashi等人的文獻(xiàn)4);圖5A和圖5B解釋圖像特征空間與聲音特征空間的關(guān)系;圖6A至圖6C解釋圖像特征空間、聲音特征空間和第三特征空間之間的關(guān)系;圖7是本發(fā)明的機(jī)器人設(shè)備的示意圖;圖8是圖7中機(jī)器人設(shè)備的電路配置的方框圖;圖9是圖7中機(jī)器人設(shè)備的軟件配置的方框圖;圖10是圖7中機(jī)器人設(shè)備的軟件配置的中間件層(middleware layer)的方框圖;圖11是圖7中機(jī)器人設(shè)備的軟件配置的應(yīng)用層的方框圖;圖12是圖11中應(yīng)用層的動(dòng)作模型庫(kù)的方框圖;圖13解釋有限概率自動(dòng)機(jī),是用于確定機(jī)器人設(shè)備動(dòng)作的信息;圖14示出在有限概率自動(dòng)機(jī)的每個(gè)節(jié)點(diǎn)中準(zhǔn)備的狀態(tài)轉(zhuǎn)換表;圖15是本發(fā)明的圖7中機(jī)器人設(shè)備的一部分方框圖;圖16A和圖16B解釋對(duì)機(jī)器人設(shè)備移動(dòng)的教導(dǎo);圖17A和圖17B示出教導(dǎo)機(jī)器人設(shè)備移動(dòng)的辨別單元;圖18是用于學(xué)習(xí)移動(dòng)的辨別器的方框圖;圖19是移動(dòng)學(xué)習(xí)中使用的脈沖寬度的特征曲線,示出機(jī)器人設(shè)備處于立位時(shí)的脈沖寬度;圖20是移動(dòng)學(xué)習(xí)中使用的脈沖寬度的特征曲線,示出在其背部向前推處于立位的機(jī)器人設(shè)備時(shí)的脈沖寬度;圖21是移動(dòng)學(xué)習(xí)中使用的脈沖寬度的特征曲線,示出在其背部向后推處于立位的機(jī)器人設(shè)備時(shí)的脈沖寬度;圖22是移動(dòng)學(xué)習(xí)中使用的脈沖寬度的特征曲線,示出在其頸部向上推處于立位的機(jī)器人設(shè)備時(shí)的脈沖寬度;圖23是移動(dòng)學(xué)習(xí)中使用的脈沖寬度的特征曲線,示出在其背部向下推處于立位的機(jī)器人設(shè)備時(shí)的脈沖寬度;圖24是移動(dòng)學(xué)習(xí)中使用的脈沖寬度的特征曲線,示出在其頸部向上推處于坐位的機(jī)器人設(shè)備時(shí)的脈沖寬度;圖25是移動(dòng)學(xué)習(xí)中使用的脈沖寬度的特征曲線,示出在其頸部向下推處于坐位的機(jī)器人設(shè)備時(shí)的脈沖寬度;圖26是機(jī)器人裝置的愉快/不愉快判斷單元的方框圖;圖27解釋一種神經(jīng)網(wǎng)絡(luò);圖28是用于學(xué)習(xí)外力的本發(fā)明機(jī)器人設(shè)備的配置的方框圖;圖29示出三層反向傳播的神經(jīng)網(wǎng)絡(luò);圖30示出三層反向傳播神經(jīng)網(wǎng)絡(luò)的每一層中的神經(jīng)元的系統(tǒng);圖31是S形函數(shù)的特征曲線;圖32是學(xué)習(xí)次數(shù)與平均誤差之間關(guān)系的特征曲線;圖33是機(jī)器人設(shè)備中語(yǔ)音識(shí)別單元的詳細(xì)方框圖;圖34是機(jī)器人設(shè)備中關(guān)聯(lián)存儲(chǔ)器/檢索存儲(chǔ)器和動(dòng)作生成器的方框圖;圖35是機(jī)器人設(shè)備中使用的關(guān)聯(lián)存儲(chǔ)器/檢索存儲(chǔ)器的方框圖;圖36是機(jī)器人設(shè)備中傳感器數(shù)據(jù)處理器的詳細(xì)方框圖;圖37A至圖37E解釋通過(guò)手指的指示用于目標(biāo)對(duì)象識(shí)別的共享學(xué)習(xí);圖38是關(guān)聯(lián)存儲(chǔ)器系統(tǒng)的示意方框圖;圖39顯示圖38的關(guān)聯(lián)存儲(chǔ)器中使用的兩層分層型的競(jìng)爭(zhēng)學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的一個(gè)例子;圖40顯示由輸入圖案激活的輸入神經(jīng)元與未激活的神經(jīng)元以及競(jìng)爭(zhēng)層內(nèi)的神經(jīng)元之間的關(guān)系變化的實(shí)例,這種變化是由信號(hào)出現(xiàn)時(shí)間造成的;圖41顯示用來(lái)檢驗(yàn)機(jī)器人設(shè)備的動(dòng)作決定操作的分層動(dòng)作決定系統(tǒng)的內(nèi)容樹(shù);圖42顯示在第一操作檢驗(yàn)中包含在本能中的Hunger(饑餓)和Sleepy(困倦)的時(shí)間變化;圖43顯示在第一操作檢驗(yàn)中包含在情緒中的Activity(活躍)、Pleasantness(愉快)和Certainty(確定)的時(shí)間變化;圖44顯示在第一操作檢驗(yàn)中作為動(dòng)機(jī)的吃(Eat)和睡(Sleep)的時(shí)間變化;圖45顯示在第二操作檢驗(yàn)中本能的時(shí)間變化;圖46顯示在第二操作檢驗(yàn)中情緒的時(shí)間變化;圖47顯示在第二操作檢驗(yàn)中釋放機(jī)構(gòu)(release mechanism,RM)的時(shí)間變化。
實(shí)現(xiàn)本發(fā)明的最佳模式下面將結(jié)合附圖詳細(xì)說(shuō)明實(shí)現(xiàn)本發(fā)明的最佳模式。最佳模式涉及一種相應(yīng)于周?chē)h(huán)境(外部因素)或內(nèi)部狀態(tài)(內(nèi)部因素)自主地進(jìn)行舉止的自主機(jī)器人設(shè)備。
首先將說(shuō)明機(jī)器人設(shè)備的結(jié)構(gòu),然后詳細(xì)說(shuō)明本發(fā)明在機(jī)器人設(shè)備中的應(yīng)用。
(1)本發(fā)明的機(jī)器人設(shè)備的結(jié)構(gòu)如圖7所示,機(jī)器人設(shè)備(下面將簡(jiǎn)稱(chēng)為“機(jī)器人”)總的用標(biāo)號(hào)1表示。該機(jī)器人是一個(gè)取“狗”的外形的寵物機(jī)器人。如圖所示,機(jī)器人1包括身體單元2;分別連接到身體單元2的左前部和右前部以及左后部和右后部的腿部單元3A至3D;和分別連接到身體單元2的前部和尾部的頭部單元4和尾部單元5。
如圖8所示,身體單元2內(nèi)設(shè)有CPU(中央處理單元)10、DRAM(動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器)11、快速ROM(只讀存儲(chǔ)器)12、PC(個(gè)人計(jì)算機(jī))卡接口電路13和信號(hào)處理單元14,它們經(jīng)內(nèi)部總線15彼此連接,以形成一個(gè)控制器16;此外,還還設(shè)有向機(jī)器人1提供電源的電池17。身體單元2內(nèi)還設(shè)有角速度傳感器18和加速度傳感器19,以檢測(cè)機(jī)器人1的方位和加速度等。
頭部單元4內(nèi)設(shè)有分別在各自位置的攝取機(jī)器人1周?chē)h(huán)境的CCD(電荷耦合器件)攝像機(jī)20;觸摸傳感器21,檢測(cè)作為諸如用戶(hù)的“輕拍”或“擊打”物理動(dòng)作給予機(jī)器人1的壓力;距離傳感器22,測(cè)量到存在于機(jī)器人1前面的對(duì)象的距離;采集外部聲音的麥克風(fēng)23;輸出聲音,比如吠聲的揚(yáng)聲器24;如機(jī)器人1的“眼睛”的LED(發(fā)光二極管)(未示出)等。
此外,在腿部單元3A至3D的關(guān)節(jié)、腿部單元3A至3D與身體單元2之間的鉸鏈軸、頭部單元4與身體單元2之間的鉸鏈軸以及尾巴5A與尾部單元5之間的鉸鏈軸內(nèi)分別設(shè)有傳動(dòng)器251至25n和電位計(jì)261至26n。每個(gè)關(guān)節(jié)和鉸鏈軸中使用的傳動(dòng)器和電位計(jì)的數(shù)量取決于傳動(dòng)器和電位計(jì)的自由度。例如,傳動(dòng)器251至25n的每一個(gè)使用伺服電動(dòng)機(jī)。當(dāng)驅(qū)動(dòng)伺服電動(dòng)機(jī)時(shí),控制腿部單元3A至3D變換目標(biāo)姿態(tài)或進(jìn)行運(yùn)動(dòng)。
角速度傳感器18、加速度傳感器19、觸摸傳感器21、距離傳感器22、麥克風(fēng)23、揚(yáng)聲器24、LED、傳動(dòng)器251至25n和電位計(jì)261至26n的每一個(gè)經(jīng)過(guò)集線器271至27n相應(yīng)的一個(gè)連接到控制器16的信號(hào)處理電路14,CCD攝像機(jī)20和電池17直接連接信號(hào)處理電路14。
需要說(shuō)明的是,來(lái)自角速度傳感器18、加速度傳感器19和電位計(jì)261至26n的信號(hào)在下面將要說(shuō)明的運(yùn)動(dòng)(動(dòng)作)學(xué)習(xí)中使用。
信號(hào)處理電路14順序地獲取從上述傳感器的每一個(gè)所供應(yīng)的數(shù)據(jù)(下面將稱(chēng)之為“傳感器數(shù)據(jù)”)、圖像數(shù)據(jù)和語(yǔ)音數(shù)據(jù),并且經(jīng)內(nèi)部總線15將它們存儲(chǔ)到DRAM 11中。此外,信號(hào)處理電路14順序地獲取從電池17供應(yīng)的數(shù)據(jù)并指示電池17中的剩余電勢(shì),并把它們的每一個(gè)存儲(chǔ)到DRAM 11中。
根據(jù)存儲(chǔ)在DRAM 11中的傳感器數(shù)據(jù)、圖像數(shù)據(jù)、語(yǔ)音數(shù)據(jù)和剩余電池電勢(shì)數(shù)據(jù)的每一個(gè),CPU 10將控制機(jī)器人1的動(dòng)作。
實(shí)際上,當(dāng)電源最初供應(yīng)給機(jī)器人1時(shí),CPU10經(jīng)PC卡接口電路13或者直接地從身體單元2的PC卡槽(未示出)中設(shè)置的存儲(chǔ)卡28或者快速ROM12中讀出控制程序,并且將它存入DRAM 11中。
此外,CPU 10根據(jù)上述從信號(hào)處理電路14順序存儲(chǔ)到DRAM 11中的傳感器數(shù)據(jù)、圖像數(shù)據(jù)、剩余電池電勢(shì)數(shù)據(jù),確定機(jī)器人1的內(nèi)部狀態(tài)、機(jī)器人1的周?chē)h(huán)境、用戶(hù)的指令或動(dòng)作的存在等。
此外,CPU10根據(jù)確定的結(jié)果和DRAM 11中存儲(chǔ)的控制程序決定下一步動(dòng)作,并且根據(jù)確定的結(jié)果驅(qū)動(dòng)用于下一步動(dòng)作的傳動(dòng)器251至25n中所必需的傳動(dòng)器,從而使頭部單元4搖頭或點(diǎn)頭,搖擺尾部單元5的尾巴5A或者驅(qū)動(dòng)腿部單元3A至3D行走。
此時(shí),CPU 10根據(jù)需要生成語(yǔ)音數(shù)據(jù),并且經(jīng)信號(hào)處理電路14將語(yǔ)音信號(hào)供應(yīng)給揚(yáng)聲器24,從而輸出依據(jù)語(yǔ)音信號(hào)建立的聲音或語(yǔ)音、接通或斷開(kāi)或閃爍LED。
由此,機(jī)器人1相應(yīng)于其內(nèi)部狀態(tài)或周?chē)h(huán)境或用戶(hù)的指令或動(dòng)作,自主地進(jìn)行舉止。
(2)控制程序的軟件結(jié)構(gòu)機(jī)器人1的上述控制程序具有圖9所示的軟件結(jié)構(gòu)。如圖所示,設(shè)備驅(qū)動(dòng)器層30位于控制程序的最下層,并且由包括多個(gè)設(shè)備驅(qū)動(dòng)器的設(shè)備驅(qū)動(dòng)器集31組成。在此情況下,每個(gè)設(shè)備驅(qū)動(dòng)器是允許直接訪問(wèn)CCD攝像機(jī)20(參見(jiàn)圖8)和在計(jì)算機(jī)中使用的諸如定時(shí)器之類(lèi)的普通硬件的對(duì)象,并且借助適當(dāng)?shù)挠布袛噙M(jìn)行工作。
如圖9所示,機(jī)器人服務(wù)器對(duì)象32也位于設(shè)備驅(qū)動(dòng)器層30的最底層。該對(duì)象32例如包括包含軟件組的虛擬機(jī)器人33,該軟件組提供用于訪問(wèn)諸如上述各種傳感器、傳動(dòng)器251至25n等的硬件的接口;電源管理器34,包含管理電源切換等的軟件組;設(shè)備驅(qū)動(dòng)器管理器35,包括管理其它各種設(shè)備驅(qū)動(dòng)器的軟件組;和被設(shè)計(jì)的機(jī)器人36,包含管理機(jī)器人1的機(jī)構(gòu)的軟件組。
在此還提供包括對(duì)象管理器38和服務(wù)管理器39的管理器對(duì)象37。對(duì)象管理器38是一個(gè)軟件組,分別管理包含在機(jī)器人服務(wù)器對(duì)象32、中間件層40和應(yīng)用層41中的每個(gè)軟件組的啟動(dòng)和終止。服務(wù)管理器39是一個(gè)軟件組,根據(jù)存儲(chǔ)卡28中存儲(chǔ)的關(guān)聯(lián)文件所規(guī)定的對(duì)象之間關(guān)系的信息,管理對(duì)象之間的關(guān)聯(lián)(參見(jiàn)圖8)。
中間件層40位于機(jī)器人服務(wù)器對(duì)象32的上面,包括提供諸如圖像處理、語(yǔ)音處理等機(jī)器人的基本功能的軟件組。應(yīng)用層41位于中間件層40的上面,包括根據(jù)由中間件層40所含有的每個(gè)軟件組實(shí)行處理的結(jié)果來(lái)決定機(jī)器人1的動(dòng)作的軟件組。
圖10詳細(xì)地示出中間件層40和應(yīng)用層41的軟件結(jié)構(gòu)。
如圖10所示,中間件層40包括識(shí)別系統(tǒng)60,包括分別用于噪聲檢測(cè)、溫度檢測(cè)、亮度檢測(cè)、音節(jié)(scale)檢測(cè)、距離檢測(cè)、姿態(tài)檢測(cè)、觸摸檢測(cè)、運(yùn)動(dòng)檢測(cè)和顏色識(shí)別的信號(hào)處理模塊50至58、以及輸入語(yǔ)義轉(zhuǎn)換器模塊59;和輸出系統(tǒng)69,包括輸出語(yǔ)義轉(zhuǎn)換器模塊68和分別用于姿態(tài)管理、跟蹤、運(yùn)動(dòng)再現(xiàn)、行走、翻轉(zhuǎn)恢復(fù)、點(diǎn)亮LED和語(yǔ)音再現(xiàn)的信號(hào)處理模塊61至67。
識(shí)別系統(tǒng)60中的信號(hào)處理模塊50至58獲取由機(jī)器人服務(wù)器對(duì)象32中的虛擬機(jī)器人33從DRAM 11讀出的傳感器數(shù)據(jù)、圖像數(shù)據(jù)和語(yǔ)音數(shù)據(jù)中適當(dāng)?shù)臄?shù)據(jù),按預(yù)定方式處理該數(shù)據(jù),并把該數(shù)據(jù)處理結(jié)果供應(yīng)給輸入語(yǔ)義轉(zhuǎn)換器模塊59。在該實(shí)例中,虛擬機(jī)器人33被構(gòu)成為在預(yù)定通信規(guī)則下傳遞或轉(zhuǎn)換信號(hào)的功能塊。
根據(jù)信號(hào)處理模塊50至58供應(yīng)的數(shù)據(jù)處理結(jié)果,輸入語(yǔ)義轉(zhuǎn)換器模塊59識(shí)別機(jī)器人1的內(nèi)部狀態(tài)和周?chē)h(huán)境,比如“噪聲”、“熱”、“亮度”、“檢測(cè)到球”、“檢測(cè)到翻轉(zhuǎn)”、“輕拍”、“擊打”、“聽(tīng)到音節(jié)”、“檢測(cè)到運(yùn)動(dòng)對(duì)象”或“檢測(cè)到障礙物”、以及來(lái)自用戶(hù)的指令或動(dòng)作,并且把識(shí)別結(jié)構(gòu)輸出給應(yīng)用層41(參見(jiàn)圖8)。
如圖11所示,應(yīng)用層41由五個(gè)模塊組成,包括動(dòng)作模型庫(kù)70、動(dòng)作切換模塊71、學(xué)習(xí)模塊72、情緒模塊73和本能模塊74。
如圖12所示,動(dòng)作模型庫(kù)70內(nèi)設(shè)有獨(dú)立動(dòng)作模塊701至70n,它們分別對(duì)應(yīng)于某些預(yù)選條件項(xiàng)目,比如“電池電勢(shì)已經(jīng)變低”、“用于翻轉(zhuǎn)的恢復(fù)”、“用于繞過(guò)障礙物”、“用于表達(dá)情緒”、“已經(jīng)檢測(cè)到球”等。
例如,當(dāng)這些動(dòng)作模塊701至70n被供應(yīng)輸入語(yǔ)義轉(zhuǎn)換器模塊59的識(shí)別結(jié)果時(shí),或者當(dāng)這些模塊被供應(yīng)最終識(shí)別結(jié)果之后已經(jīng)經(jīng)過(guò)預(yù)定時(shí)間時(shí),這些模塊根據(jù)需要參考情緒模塊73所保存的適當(dāng)?shù)那榫w參數(shù)值和本能模塊74所保存的適當(dāng)?shù)挠麉?shù)值決定機(jī)器人1進(jìn)行的下一步動(dòng)作(下面將作進(jìn)一步說(shuō)明),并且將決定結(jié)果輸出給動(dòng)作切換模塊71。
需要說(shuō)明的是,在本發(fā)明的該實(shí)施例中,動(dòng)作模塊701至70n作為決定后續(xù)動(dòng)作的裝置,采用所謂的“有限概率自動(dòng)機(jī)”算法,分別根據(jù)為弧線ARC1至ARCn設(shè)置的轉(zhuǎn)換概率P1至Pn,推測(cè)決定圖13所示的節(jié)點(diǎn)(狀態(tài))NODE0至NODEn的哪個(gè)節(jié)點(diǎn)轉(zhuǎn)換,以及該節(jié)點(diǎn)轉(zhuǎn)換到這些節(jié)點(diǎn)的哪一個(gè)其它節(jié)點(diǎn),其中這些弧線提供節(jié)點(diǎn)NODE0至NODEn之間的連接。
具體地說(shuō),動(dòng)作模型701至70n的每一個(gè)具有如圖14所示的狀態(tài)轉(zhuǎn)換表80,它分別對(duì)應(yīng)于包含在動(dòng)作模型701至70n內(nèi)的節(jié)點(diǎn)NODE0至NODEn的每一個(gè)。
也就是說(shuō),在狀態(tài)轉(zhuǎn)換表80中,作為NODE0至NODEn之間的轉(zhuǎn)換條件得到的輸入事件(識(shí)別結(jié)果)按優(yōu)先順序輸入到由“輸入事件名稱(chēng)”欄所覆蓋的行中,對(duì)轉(zhuǎn)換條件附加的條件數(shù)據(jù)被輸入到由“數(shù)據(jù)名稱(chēng)”和“數(shù)據(jù)范圍”欄所覆蓋的行中。
因此,如圖14的狀態(tài)轉(zhuǎn)換表80所示,它示出NODE100轉(zhuǎn)換到其它節(jié)點(diǎn)的條件,即當(dāng)給出“BALL(機(jī)器人已經(jīng)檢測(cè)到球)”的識(shí)別結(jié)果,并且與該識(shí)別結(jié)果共同給出的“SIZE(球的大小)”是“0,1000(0至1000)”時(shí)。此外,當(dāng)“OBSTACLE(機(jī)器人1已經(jīng)檢測(cè)到障礙物)”作為識(shí)別結(jié)果給出,以及與該識(shí)別結(jié)果一同給出的“DISTANCE(障礙物與機(jī)器人之間的距離)”是“0,100(0至100)”時(shí),節(jié)點(diǎn)NODE100可以轉(zhuǎn)換到另一個(gè)節(jié)點(diǎn)。
此外,當(dāng)分別涉及動(dòng)作模型701至70n的情緒模型73和本能模型74中所保存的情緒和欲望的、在情緒模型73中保存的這些運(yùn)動(dòng)“JOY”、“SURPRISE”和“SADNESS”的參數(shù)值循環(huán)地取“50,100(50至100)”值時(shí),即使沒(méi)有識(shí)別結(jié)果的輸入,節(jié)點(diǎn)NODE100也轉(zhuǎn)換到另一個(gè)節(jié)點(diǎn)。
在狀態(tài)轉(zhuǎn)換表80中,節(jié)點(diǎn)NODE0至NODEn的每一個(gè)可以轉(zhuǎn)換到的節(jié)點(diǎn)的名稱(chēng)被列在由“轉(zhuǎn)換到其它節(jié)點(diǎn)(Di)的概率”欄所覆蓋的“轉(zhuǎn)換目的地節(jié)點(diǎn)”行中,當(dāng)“輸入事件名稱(chēng)”、“數(shù)據(jù)名稱(chēng)”和“數(shù)據(jù)范圍”欄中給出的所有要求分別被滿(mǎn)足時(shí)將可能出現(xiàn)的轉(zhuǎn)換到其它節(jié)點(diǎn)NODE0至NODEn的概率被列在“轉(zhuǎn)換到其它節(jié)點(diǎn)(Di)的概率”欄的相應(yīng)位置上,以及當(dāng)狀態(tài)轉(zhuǎn)換到節(jié)點(diǎn)NODE0至NODEn時(shí)輸出的動(dòng)作被列在由“轉(zhuǎn)換到其它節(jié)點(diǎn)(Di)的概率”欄覆蓋的“輸出動(dòng)作”行中。需要說(shuō)明是由“轉(zhuǎn)換到其它節(jié)點(diǎn)(Di)的概率”欄所覆蓋的行中的轉(zhuǎn)換概率的總和是100(%)。
因此,當(dāng)“BALL(已經(jīng)檢測(cè)到球)”作為識(shí)別結(jié)果給出和與該識(shí)別結(jié)果一同給出的“SIZE(球的大小)”是“0,1000(0至1000)”時(shí),圖14所示的狀態(tài)轉(zhuǎn)換表80中的節(jié)點(diǎn)NODE100可以轉(zhuǎn)換到節(jié)點(diǎn)NODE120(節(jié)點(diǎn)120)的轉(zhuǎn)換概率是30%。此時(shí),機(jī)器人1將進(jìn)行動(dòng)作“ACTION1”。
配置每個(gè)動(dòng)作模型,以便按狀態(tài)轉(zhuǎn)換表80給出的許多模型701至70n彼此鏈接。例如,當(dāng)從輸入語(yǔ)義轉(zhuǎn)換器模塊59供應(yīng)識(shí)別結(jié)果時(shí),相應(yīng)節(jié)點(diǎn)NODE0至NODEn的狀態(tài)轉(zhuǎn)換表被用來(lái)推測(cè)地決定后續(xù)動(dòng)作,并且將決定結(jié)果輸出到動(dòng)作切換模塊71。
圖11所示的動(dòng)作切換模塊71選擇動(dòng)作模型庫(kù)70中動(dòng)作模型701至70n輸出的多條動(dòng)作中預(yù)定的高優(yōu)先級(jí)動(dòng)作,并且把執(zhí)行該動(dòng)作的命令(下面將稱(chēng)作“動(dòng)作命令”)發(fā)送給中間件層40的輸出語(yǔ)義轉(zhuǎn)換器模塊68。需要說(shuō)明的是,在該實(shí)施例中,從圖12的動(dòng)作模型701至70n中較低的一個(gè)輸出的動(dòng)作被設(shè)置為具有較高的優(yōu)先級(jí),其優(yōu)先級(jí)高于從較高動(dòng)作模型輸出的那些動(dòng)作的優(yōu)先級(jí)。
當(dāng)動(dòng)作被完成時(shí),動(dòng)作切換模塊71根據(jù)輸出語(yǔ)義轉(zhuǎn)換器模塊68供給的動(dòng)作完成信息,通知學(xué)習(xí)模塊72、情緒模塊73和本能模塊74動(dòng)作完成。
另一方面,學(xué)習(xí)模塊72被供應(yīng)有輸入語(yǔ)義轉(zhuǎn)換器59所供應(yīng)的識(shí)別結(jié)果之中的,由用戶(hù)按諸如“擊打”、“輕拍”等的動(dòng)作教導(dǎo)機(jī)器人的識(shí)別結(jié)果。
學(xué)習(xí)模塊72改變動(dòng)作模型庫(kù)70的動(dòng)作模型701至70n中相應(yīng)模型的轉(zhuǎn)換概率。根據(jù)識(shí)別結(jié)果和來(lái)自動(dòng)作切換模塊71的信息,當(dāng)機(jī)器人1例如被擊打時(shí)(=訓(xùn)斥),學(xué)習(xí)模塊72減少動(dòng)作的表現(xiàn)(express)概率,而當(dāng)機(jī)器人1例如被輕拍(=贊揚(yáng))時(shí)提升該表現(xiàn)概率。
另一方面,情緒模型73保存有指示總共六個(gè)情緒“愉快”、“悲傷”、“生氣”、“驚喜”、“厭惡”、“恐懼”的每一個(gè)的強(qiáng)度的參數(shù)。情緒模型73根據(jù)輸出語(yǔ)義轉(zhuǎn)換器模塊59所供應(yīng)的諸如“擊打”、“輕拍”等特定的識(shí)別結(jié)果、逝去的時(shí)間和動(dòng)作切換模塊71的信息,周期性地更新這些情緒的參數(shù)值。
更具體地說(shuō),情緒模塊73使用預(yù)定的計(jì)算式,依據(jù)輸入語(yǔ)義轉(zhuǎn)換器模塊59所供應(yīng)的識(shí)別結(jié)果、此時(shí)機(jī)器人1的舉止和自先前更新起逝去的時(shí)間,每次計(jì)算情緒的變化。然后,通過(guò)取該情緒變化為ΔE[t],該情緒的當(dāng)前參數(shù)值為E[t]以及指示對(duì)該情緒的靈敏度的因數(shù)為ke,情緒模塊73通過(guò)計(jì)算式(4)確定在下一個(gè)周期中情緒的參數(shù)值E[t+1],并且用情緒參數(shù)值E[t+1]替代情緒的當(dāng)前參數(shù)值E[t],由此更新情緒的參數(shù)值。情緒模型73還以相同方式更新所有剩余情緒中的參數(shù)值。
E[t+1]=E[t]+ke×ΔE[t]……………………(4)需要說(shuō)明的是,識(shí)別結(jié)果和來(lái)自輸出語(yǔ)義轉(zhuǎn)換器模塊68的信息的每一個(gè)對(duì)每個(gè)情緒的參數(shù)值的變化ΔE[t]的影響有多大是預(yù)先確定的。該確定是,使例如“擊打”的識(shí)別結(jié)果將對(duì)“生氣”情緒的參數(shù)值的變化ΔE[t]具有很大的影響,而“輕拍”的識(shí)別結(jié)果將對(duì)“愉快”情緒的參數(shù)值的變化ΔE[t]有很大的影響。
來(lái)自輸出語(yǔ)義轉(zhuǎn)換器模塊68的信息是所謂的對(duì)動(dòng)作的反饋信息(動(dòng)作完成信息)。即,它是關(guān)于動(dòng)作表現(xiàn)結(jié)果的信息。情緒模塊73將用這種信息改變?cè)撉榫w。例如,“吠叫”動(dòng)作降低“生氣”情緒的等級(jí)。需要說(shuō)明的是,來(lái)自輸出語(yǔ)義轉(zhuǎn)換器模塊68的信息還被供應(yīng)給上述的學(xué)習(xí)模塊72,該學(xué)習(xí)模塊72根據(jù)來(lái)自輸出語(yǔ)義轉(zhuǎn)換器模塊68的信息為動(dòng)作模型701至70n中適當(dāng)?shù)囊粋€(gè)更新轉(zhuǎn)換概率。
需要說(shuō)明的是,動(dòng)作的結(jié)果可以由動(dòng)作切換模塊71的輸出(具有加在其上的感覺(jué)的動(dòng)作)反饋。
另一方面,本能模型74擁有指示總共四個(gè)獨(dú)立欲望“鍛煉”、“友情”、“食欲”和“好奇心”的每一個(gè)的強(qiáng)度的參數(shù)。本能模型74根據(jù)從輸入語(yǔ)義轉(zhuǎn)換器模塊59供應(yīng)的識(shí)別結(jié)果、逝去時(shí)間和來(lái)自動(dòng)作切換模塊71的信息,周期性地更新這些欲望的參數(shù)值。
具體地說(shuō),本能模塊74使用預(yù)定的計(jì)算式,依據(jù)輸出語(yǔ)義轉(zhuǎn)換器68供應(yīng)的識(shí)別結(jié)果、逝去時(shí)間和來(lái)自輸出語(yǔ)義轉(zhuǎn)換器模塊68的信息,每次計(jì)算欲望“鍛煉”、“友情”、和“好奇心”每一個(gè)的變化。然后,通過(guò)取欲望變化為ΔI[k],取欲望的當(dāng)前參數(shù)值為I[k],以及取指示對(duì)欲望的靈敏度的因數(shù)為ki,本能模塊74通過(guò)周期性地計(jì)算式(5)確定下一個(gè)周期中的欲望參數(shù)值I[k+1],并且用參數(shù)值I[k+1]替代欲望的當(dāng)前參數(shù)值I[k],由此更新欲望的參數(shù)值。本能模塊74還以相同方式更新除“食欲”之外的所有剩余欲望的參數(shù)值。
I[k+1]=I[k]+ki×ΔI[k] ………………(5)需要說(shuō)明的是,識(shí)別結(jié)果和來(lái)自輸出語(yǔ)義轉(zhuǎn)換器模塊68的信息中每一個(gè)對(duì)每個(gè)欲望的參數(shù)值的變化ΔI[k]有多大影響是預(yù)先確定的。該確定是,使例如來(lái)自輸出語(yǔ)義轉(zhuǎn)換器模塊68的信息將對(duì)“疲勞”狀態(tài)的參數(shù)值的變化ΔI[k]具有很大的影響。
需要說(shuō)明的是,情緒和欲望(本能)的每一個(gè)具有其限制范圍為0至100的可變參數(shù)值范圍,并且還使因數(shù)ke和ki的每一個(gè)具有為情緒和欲望中的每一個(gè)所設(shè)置的值。
另一方面,如圖10所示,中間件層40的輸出語(yǔ)義轉(zhuǎn)換器模塊68向輸出系統(tǒng)69的信號(hào)處理模塊61至67中適當(dāng)?shù)囊粋€(gè)供應(yīng)抽象動(dòng)作命令,類(lèi)似于上述的應(yīng)用層41的動(dòng)作切換模塊71所供應(yīng)的“向前運(yùn)動(dòng)”、“愉快”、“吠叫”或“跟蹤(球)”。
根據(jù)所供應(yīng)的動(dòng)作命令,信號(hào)處理模塊61至67生成供應(yīng)給傳動(dòng)器251至25n中適當(dāng)?shù)囊粋€(gè)的伺服指令、將從揚(yáng)聲器24(參見(jiàn)圖8)輸出的語(yǔ)音的語(yǔ)音數(shù)據(jù)、或者供應(yīng)給作為機(jī)器人“眼睛”的LED的驅(qū)動(dòng)數(shù)據(jù),以執(zhí)行動(dòng)作,并且按照該命令經(jīng)過(guò)機(jī)器人服務(wù)器對(duì)象32中的虛擬機(jī)器人33和信號(hào)處理電路14(參見(jiàn)圖8)向251至25n中適當(dāng)?shù)囊粋€(gè)和揚(yáng)聲器24或LED發(fā)送數(shù)據(jù)。
如上所述,機(jī)器人1適合根據(jù)控制程序,相應(yīng)于機(jī)器人內(nèi)部狀態(tài)和環(huán)境(外部)狀態(tài)或用戶(hù)的指令或動(dòng)作自主地動(dòng)作。
(3)相應(yīng)于環(huán)境改變本能和情緒機(jī)器人1還適于例如在明亮環(huán)境中興奮,而在黑暗環(huán)境中平靜。即,機(jī)器人1適合于具有相應(yīng)于機(jī)器人1周?chē)h(huán)境中的三個(gè)因素“噪聲”、“溫度”和“亮度”中的每一個(gè)因素(下面將稱(chēng)作“環(huán)境因素”)的范圍而改變的情緒和本能。
具體地說(shuō),機(jī)器人1具有檢測(cè)周?chē)h(huán)境的外部傳感器,除了設(shè)置在各自適當(dāng)位置的上述CCD攝像機(jī)20、距離傳感器22、觸摸傳感器21和麥克風(fēng)23之外,還包括溫度傳感器或熱傳感器(未示出),以檢測(cè)環(huán)境溫度。中間件層40的識(shí)別系統(tǒng)60包括分別對(duì)應(yīng)于上述傳感器的用于噪聲檢測(cè)、溫度檢測(cè)和亮度檢測(cè)的信號(hào)處理模塊50至52。
噪聲檢測(cè)信號(hào)處理模塊50根據(jù)經(jīng)過(guò)機(jī)器人服務(wù)器對(duì)象32中的虛擬機(jī)器人33、麥克風(fēng)23(參見(jiàn)圖8)給出的語(yǔ)音數(shù)據(jù)檢測(cè)周?chē)h(huán)境噪聲水平,并且將檢測(cè)結(jié)果輸出給輸入語(yǔ)義轉(zhuǎn)換器模塊59。
溫度檢測(cè)信號(hào)處理模塊5 1根據(jù)經(jīng)過(guò)虛擬機(jī)器人33、熱傳感器供給的傳感器數(shù)據(jù)檢測(cè)周?chē)h(huán)境溫度,并且將檢測(cè)結(jié)果輸出給輸入語(yǔ)義轉(zhuǎn)換器模塊59。
亮度檢測(cè)信號(hào)處理模塊52根據(jù)經(jīng)過(guò)虛擬機(jī)器人33、CCD攝像機(jī)20(參見(jiàn)圖8)供給的圖像數(shù)據(jù)檢測(cè)周?chē)h(huán)境亮度,并且將檢測(cè)結(jié)果輸出給輸入語(yǔ)義轉(zhuǎn)換器模塊59。
輸入語(yǔ)義轉(zhuǎn)換器模塊59根據(jù)信號(hào)處理模塊50至52的輸出,識(shí)別周?chē)h(huán)境“噪聲”、“溫度”和“亮度”中每一個(gè)的程度,并把識(shí)別結(jié)果輸出給應(yīng)用模塊41的內(nèi)部狀態(tài)模塊(參見(jiàn)圖11)。
具體地說(shuō),輸入語(yǔ)義轉(zhuǎn)換器模塊59根據(jù)噪聲檢測(cè)信號(hào)處理模塊50的輸出,識(shí)別周?chē)h(huán)境“噪聲”的程度,并把類(lèi)似“嘈雜”或“平靜”的識(shí)別結(jié)果輸出給情緒模型73、本能模型74等。
此外,輸入語(yǔ)義轉(zhuǎn)換器模塊59根據(jù)溫度檢測(cè)信號(hào)處理模塊51的輸出,識(shí)別周?chē)h(huán)境“溫度”的程度,并把類(lèi)似“熱”或“冷”的識(shí)別結(jié)果輸出給情緒模型73、本能模型74等。
此外,輸入語(yǔ)義轉(zhuǎn)換器模塊59根據(jù)亮度檢測(cè)信號(hào)處理模塊52的輸出,識(shí)別周?chē)h(huán)境“亮度”的程度,并把類(lèi)似“明亮”或“黑暗”的識(shí)別結(jié)果輸出給情緒模型73、本能模型74等。
情緒模型73根據(jù)輸入語(yǔ)義轉(zhuǎn)換器模塊59所供應(yīng)的上述各種識(shí)別結(jié)果,通過(guò)計(jì)算式(4)改變每個(gè)情緒的參數(shù)值。
然后,情緒模型73根據(jù)從輸入語(yǔ)義轉(zhuǎn)換器模塊59供應(yīng)的關(guān)于“噪聲”、“溫度”和“亮度”的識(shí)別結(jié)果,為一個(gè)預(yù)定的適當(dāng)情緒增加或減小式(4)中的因數(shù)ke的值。
具體地說(shuō),例如,當(dāng)識(shí)別結(jié)果“嘈雜”被供應(yīng)時(shí),情緒模型73將“生氣”情緒的因數(shù)ke的值增加一個(gè)預(yù)定數(shù)。另一方面,當(dāng)所供應(yīng)的識(shí)別結(jié)果是“平靜”時(shí),情緒模型74將“生氣”情緒的因數(shù)ke的值減少一個(gè)預(yù)定數(shù)。由此,“生氣”情緒的參數(shù)值將在周?chē)h(huán)境“噪聲”的影響下改變。
此外,當(dāng)供應(yīng)識(shí)別結(jié)果“熱”時(shí),情緒模型73將“愉快”情緒的因數(shù)ke的值減少一個(gè)預(yù)定數(shù)。另一方面,當(dāng)所供應(yīng)的識(shí)別結(jié)果是“冷”時(shí),情緒模型73將“悲傷”情緒的因數(shù)ke的值增加一個(gè)預(yù)定數(shù)。由此,“悲傷”情緒的參數(shù)值將在周?chē)h(huán)境“溫度”的影響下改變。
此外,當(dāng)供應(yīng)識(shí)別結(jié)果“明亮”時(shí),情緒模型73將“恐懼”情緒的因數(shù)ke的值減少一個(gè)預(yù)定數(shù)。另一方面,當(dāng)所供應(yīng)的識(shí)別結(jié)果是“黑暗”時(shí),情緒模型73將“恐懼”情緒的因數(shù)ke的值增加一個(gè)預(yù)定數(shù)。由此,“恐懼”情緒的參數(shù)值將在周?chē)h(huán)境“亮度”的影響下改變。
類(lèi)似地,本能模型74根據(jù)輸入語(yǔ)義轉(zhuǎn)換器模塊59供應(yīng)的上述各種識(shí)別結(jié)果,通過(guò)計(jì)算式(5)來(lái)改變每一個(gè)欲望的參數(shù)值。
此外,本能模型74根據(jù)從輸入語(yǔ)義轉(zhuǎn)換器模塊59供應(yīng)的關(guān)于“噪聲”、“溫度”和“亮度”的識(shí)別結(jié)果,為一個(gè)預(yù)定的適當(dāng)欲望增加或減少式(5)中的因數(shù)ki的值。
此外,例如當(dāng)供應(yīng)識(shí)別結(jié)果“嘈雜”和“明亮”時(shí),本能模型74將“疲勞”狀態(tài)的因數(shù)ki的值減少一個(gè)預(yù)定數(shù)。另一方面,當(dāng)所供應(yīng)的識(shí)別結(jié)果是“平靜”和“黑暗”時(shí),本能模型74將“疲勞”狀態(tài)的因數(shù)ki的值增加一個(gè)預(yù)定數(shù)。此外,例如當(dāng)識(shí)別結(jié)果是“熱”或“冷”時(shí),本能模型74將“疲勞”的因數(shù)ki的值增加一個(gè)預(yù)定數(shù)。
因而,當(dāng)機(jī)器人1例如處于“嘈雜”環(huán)境中時(shí),“生氣”情緒的參數(shù)值容易增加,而“疲勞”狀態(tài)的參數(shù)值容易減少,所以機(jī)器人1通常將進(jìn)行“被激怒”動(dòng)作。另一方面,當(dāng)機(jī)器人1的周?chē)h(huán)境是“平靜”時(shí),“生氣”情緒的參數(shù)值容易減少,而“疲勞”狀態(tài)的參數(shù)值容易增加,所以機(jī)器人1通常將“輕輕地”動(dòng)作。
另外,當(dāng)機(jī)器人1處于“熱”環(huán)境中時(shí),“愉快”情緒的參數(shù)值容易減少,而“疲勞”狀態(tài)的參數(shù)值容易增加,所以機(jī)器人1通常將顯示“懶惰”動(dòng)作。另一方面,當(dāng)機(jī)器人1處于“冷的”周?chē)h(huán)境中時(shí),“悲傷”情緒的參數(shù)值容易增加,“疲勞”狀態(tài)的參數(shù)值也容易增加,所以機(jī)器人1通常將“以抱怨冷”的方式動(dòng)作。
當(dāng)機(jī)器人1處于“明亮”環(huán)境中時(shí),“愉快”情緒的參數(shù)值容易增加,而“疲勞”狀態(tài)的參數(shù)值容易減少,所以機(jī)器人1通常將顯示“興奮”動(dòng)作。另一方面,當(dāng)機(jī)器人1處于“黑暗”周?chē)h(huán)境中時(shí),“愉快”情緒的參數(shù)值容易增加,“疲勞”狀態(tài)的參數(shù)值也容易增加,所以機(jī)器人1通常將“輕輕地”動(dòng)作。
機(jī)器人1以上述方式構(gòu)成,并且可以具有相應(yīng)于周?chē)h(huán)境變化的情緒和本能,并且根據(jù)其情緒和本能的狀態(tài)自主地動(dòng)作。
(4)本發(fā)明的應(yīng)用(4-1)一般說(shuō)明適用于本發(fā)明的機(jī)器人1的基本部分將在下面說(shuō)明。機(jī)器人1被構(gòu)成學(xué)習(xí)與圖像信號(hào)和語(yǔ)音信號(hào)(聲音信號(hào))相關(guān)聯(lián)的動(dòng)作,并且在學(xué)習(xí)后,用關(guān)聯(lián)該動(dòng)作的圖像信號(hào)和語(yǔ)音信號(hào)啟動(dòng)動(dòng)作。在下面的說(shuō)明中,主要說(shuō)明使機(jī)器人1學(xué)習(xí)與語(yǔ)音或聲音相關(guān)聯(lián)的動(dòng)作的一個(gè)例子。然而,當(dāng)然,也可以使機(jī)器人1學(xué)習(xí)與圖像關(guān)聯(lián)的動(dòng)作。具體地說(shuō),根據(jù)本發(fā)明,機(jī)器人1按以下方式構(gòu)成如圖15所示,機(jī)器人1包括語(yǔ)音識(shí)別單元101,傳感器數(shù)據(jù)處理器102,本能/情緒存儲(chǔ)單元103,關(guān)聯(lián)存儲(chǔ)器/檢索存儲(chǔ)器104和動(dòng)作生成器105。
語(yǔ)音識(shí)別單元101起到一個(gè)輸入信息檢測(cè)器的作用,檢測(cè)與檢測(cè)觸摸機(jī)器人1的觸摸傳感器(例如,圖8中的觸摸傳感器21)的觸摸檢測(cè)同時(shí)或者剛好之前或之后供應(yīng)的信息。關(guān)聯(lián)存儲(chǔ)器/檢索存儲(chǔ)器104彼此關(guān)聯(lián)地存儲(chǔ)響應(yīng)觸摸所作出的動(dòng)作和由語(yǔ)音識(shí)別單元101檢測(cè)的輸入信息(語(yǔ)音信號(hào))。動(dòng)作生成器105作為動(dòng)作控制器來(lái)工作,提供存儲(chǔ)在關(guān)聯(lián)存儲(chǔ)器/檢索存儲(chǔ)器104中的并且與新近獲取的輸入信息(語(yǔ)音信號(hào))相關(guān)的動(dòng)作。此外,傳感器數(shù)據(jù)處理器102響應(yīng)例如觸摸傳感器(未示出)的觸摸檢測(cè)工作,以使機(jī)器人1進(jìn)行動(dòng)作。下面將具體說(shuō)明這些機(jī)器人部件所起的作用。
語(yǔ)音識(shí)別單元101處理從外部(麥克風(fēng)23)供應(yīng)的語(yǔ)音信號(hào),把它們識(shí)別為預(yù)定的語(yǔ)言。具體地說(shuō),語(yǔ)音識(shí)別單元101采用HMM,通過(guò)基于HMM的多個(gè)識(shí)別類(lèi)別將輸入語(yǔ)音識(shí)別為音素序列。
語(yǔ)音識(shí)別單元101還能夠經(jīng)過(guò)學(xué)習(xí)基于現(xiàn)存類(lèi)別生成增加數(shù)量的類(lèi)別。例如,當(dāng)給定一個(gè)未識(shí)別的語(yǔ)音時(shí),語(yǔ)音識(shí)別單元101將劃分現(xiàn)存類(lèi)別,以生成圖6B所示的新類(lèi)別。具體地說(shuō),語(yǔ)音識(shí)別單元101為一個(gè)輸入語(yǔ)音劃分具有特定因數(shù)(歸屬估價(jià))的現(xiàn)存類(lèi)別,以生成新類(lèi)別。例如,劃分具有較少特征的類(lèi)別的部分,以提供新類(lèi)別。由此,語(yǔ)音識(shí)別單元101可以識(shí)別預(yù)注冊(cè)的語(yǔ)言以及新語(yǔ)言。
傳感器數(shù)據(jù)處理器102根據(jù)傳感器數(shù)據(jù)的變化生成教導(dǎo)機(jī)器人的運(yùn)動(dòng)(動(dòng)作)的信號(hào)。也就是,傳感器數(shù)據(jù)處理器102識(shí)別輸入動(dòng)作信息。
將教導(dǎo)給機(jī)器人的運(yùn)動(dòng)可以是例如預(yù)置的運(yùn)動(dòng),也可以是用戶(hù)設(shè)置的新運(yùn)動(dòng)。此外,可以選擇性地生成已經(jīng)設(shè)置的任何運(yùn)動(dòng)。
對(duì)機(jī)器人預(yù)置運(yùn)動(dòng)的教導(dǎo)是,例如通過(guò)輸入觸摸傳感器的傳感器數(shù)據(jù)觸發(fā)機(jī)器人的預(yù)置運(yùn)動(dòng)。例如,機(jī)器人被預(yù)置為,當(dāng)機(jī)器人背部設(shè)置的預(yù)定觸摸傳感器被推動(dòng)時(shí),時(shí)機(jī)器人從“站立”位置轉(zhuǎn)換到“坐”位置。即,當(dāng)處于“站立位置”的機(jī)器人的背部上的觸摸傳感器被推動(dòng)時(shí),教導(dǎo)機(jī)器人實(shí)際轉(zhuǎn)換到“坐”位置。
需要說(shuō)明的是,這種用于對(duì)機(jī)器人運(yùn)動(dòng)的教導(dǎo)的傳感器可以設(shè)置在頭部或腿部邊緣。通過(guò)在任意位置設(shè)置這種傳感器,能夠教導(dǎo)機(jī)器人各種運(yùn)動(dòng)。
此外,對(duì)機(jī)器人進(jìn)行新設(shè)置的運(yùn)動(dòng)的教導(dǎo)可以例如通過(guò)改變運(yùn)動(dòng)部件(關(guān)節(jié))的控制信號(hào)來(lái)進(jìn)行。運(yùn)動(dòng)部件包括例如設(shè)置在腿部單元3A至3D的關(guān)節(jié)上的傳動(dòng)器(伺服電動(dòng)機(jī))251至25n,腿部單元3A至3D與身體單元2之間的鉸鏈軸,頭部單元4與身體單元2之間的鉸鏈軸,尾部單元5與尾巴5A之間的鉸鏈軸等。
例如,當(dāng)機(jī)器人1的運(yùn)動(dòng)部件被用戶(hù)強(qiáng)制運(yùn)動(dòng)時(shí),將出現(xiàn)對(duì)運(yùn)動(dòng)部件的負(fù)載。對(duì)運(yùn)動(dòng)部件的負(fù)載將產(chǎn)生一個(gè)信號(hào),它不同于在運(yùn)動(dòng)部件正常運(yùn)動(dòng)期間(沒(méi)有外部負(fù)載)時(shí)出現(xiàn)的信號(hào),例如對(duì)運(yùn)動(dòng)部件的伺服信號(hào)。機(jī)器人1姿態(tài)的改變,即機(jī)器人1的運(yùn)動(dòng)可以依據(jù)該信號(hào)得知。由此,通過(guò)存儲(chǔ)該信號(hào),用戶(hù)推動(dòng)的運(yùn)動(dòng)可以被教導(dǎo)為對(duì)機(jī)器人1的新運(yùn)動(dòng)。下面將進(jìn)一步說(shuō)明這種新運(yùn)動(dòng)的教導(dǎo)。此外,根據(jù)本發(fā)明,機(jī)器人1適合于從這種信號(hào)變化中檢測(cè)外力(外部負(fù)載),從而如下面將進(jìn)一步說(shuō)明的那樣學(xué)習(xí)該外力。
此外,傳感器數(shù)據(jù)處理器102可以識(shí)別機(jī)器人1必須學(xué)習(xí)的動(dòng)作的類(lèi)別。例如,機(jī)器人1可以根據(jù)動(dòng)作特征空間中的特征識(shí)別其類(lèi)別,來(lái)學(xué)習(xí)輸入動(dòng)作信息。
本能/情緒存儲(chǔ)單元103存儲(chǔ)與上述的語(yǔ)音和動(dòng)作關(guān)聯(lián)的情緒的信息。也就是,本能/情緒存儲(chǔ)單元103使用來(lái)自上述本能模型或情緒模型的輸入傳感器信號(hào)等改變本能或情緒。
關(guān)聯(lián)存儲(chǔ)器/檢索存儲(chǔ)器104根據(jù)來(lái)自上述的語(yǔ)音識(shí)別單元101、傳感器數(shù)據(jù)處理器102和本能/情緒存儲(chǔ)單元103的信息進(jìn)行學(xué)習(xí),然后根據(jù)該學(xué)習(xí)生成相應(yīng)于輸入語(yǔ)音和圖像的動(dòng)作信息。關(guān)聯(lián)存儲(chǔ)器/檢索存儲(chǔ)器104利用在上文中已經(jīng)結(jié)合式(1)和(2)進(jìn)行了說(shuō)明的、基于圖像和語(yǔ)音類(lèi)別彼此相關(guān)的關(guān)聯(lián)存儲(chǔ)器的傳統(tǒng)原理,并且相關(guān)聯(lián)地存儲(chǔ)每個(gè)信息。
例如,當(dāng)傳感器數(shù)據(jù)處理器102從傳感器數(shù)據(jù)中檢測(cè)從“站立”位置轉(zhuǎn)換到“坐”位置的運(yùn)動(dòng)教導(dǎo),并且在傳感器數(shù)據(jù)處理器102檢測(cè)教導(dǎo)的同時(shí)或者剛好之前或之后,語(yǔ)音識(shí)別單元101識(shí)別發(fā)出的語(yǔ)言“向后”時(shí),關(guān)聯(lián)存儲(chǔ)器/檢索存儲(chǔ)器104將彼此關(guān)聯(lián)地存儲(chǔ)(學(xué)習(xí))從“站立”轉(zhuǎn)換到“坐”位置的運(yùn)動(dòng)和發(fā)出的語(yǔ)言“向后”。一般來(lái)說(shuō)這與教導(dǎo)一條真狗“坐下”相同。
此外,只有當(dāng)輸入運(yùn)動(dòng)和語(yǔ)言被成對(duì)預(yù)置時(shí),關(guān)聯(lián)存儲(chǔ)器/檢索存儲(chǔ)器104才適合于通過(guò)將輸入運(yùn)動(dòng)和輸入語(yǔ)言相互關(guān)聯(lián)(觸發(fā))來(lái)學(xué)習(xí)輸入運(yùn)動(dòng)。例如,如果發(fā)出的語(yǔ)言“向后”與上述的所謂“坐下”運(yùn)動(dòng)的教導(dǎo)同時(shí)或剛好之前或之后給出,關(guān)聯(lián)存儲(chǔ)器/檢索存儲(chǔ)器104將學(xué)習(xí)(存儲(chǔ))與發(fā)出的語(yǔ)言“向后”相關(guān)聯(lián)(聯(lián)系)的運(yùn)動(dòng)。然而,如果輸入語(yǔ)言是不同于“向后”的任何語(yǔ)言,則將不能學(xué)習(xí)該運(yùn)動(dòng)。
此外,關(guān)聯(lián)存儲(chǔ)器/檢索存儲(chǔ)器104可以通過(guò)將識(shí)別的運(yùn)動(dòng)或語(yǔ)言與本能/情緒存儲(chǔ)單元103輸出的本能和情緒相關(guān)聯(lián)來(lái)學(xué)習(xí)運(yùn)動(dòng)。例如,如果關(guān)聯(lián)存儲(chǔ)器/檢索存儲(chǔ)器104在按語(yǔ)音(發(fā)出的語(yǔ)言)輸入的運(yùn)動(dòng)學(xué)習(xí)中感到恐懼(害怕),則它可以學(xué)習(xí)(存儲(chǔ))這種與“害怕”情緒相關(guān)聯(lián)的這種語(yǔ)音。
如上所述,關(guān)聯(lián)存儲(chǔ)器/檢索存儲(chǔ)器104學(xué)習(xí)(存儲(chǔ))彼此關(guān)聯(lián)(聯(lián)系)的語(yǔ)音、運(yùn)動(dòng)或情緒,并且在學(xué)習(xí)之后,它將根據(jù)學(xué)習(xí)結(jié)果生成相應(yīng)于輸入圖像、語(yǔ)音等的動(dòng)作信息。
動(dòng)作生成器105基于上述關(guān)聯(lián)存儲(chǔ)器/檢索存儲(chǔ)器104輸出的動(dòng)作信息生成動(dòng)作。例如,當(dāng)學(xué)習(xí)上述的“向后”的教導(dǎo)之后,所發(fā)出的語(yǔ)言“向后”被送給關(guān)聯(lián)存儲(chǔ)器/檢索存儲(chǔ)器104時(shí),動(dòng)作生成器105將產(chǎn)生從“站立”位置到“坐下”位置的轉(zhuǎn)換。
如上所述,機(jī)器人1將能夠?qū)W習(xí)與語(yǔ)音信息和傳感器信號(hào)(數(shù)據(jù))的變化相關(guān)聯(lián)的動(dòng)作,根據(jù)輸入語(yǔ)音執(zhí)行作為學(xué)習(xí)結(jié)果的動(dòng)作(運(yùn)動(dòng))。
下面將說(shuō)明機(jī)器人1例如依據(jù)“坐下”運(yùn)動(dòng)的學(xué)習(xí)進(jìn)行一系列操作直至輸出該運(yùn)動(dòng)的過(guò)程。
在學(xué)習(xí)期間,觸摸機(jī)器人1,與此同時(shí)或剛好之前或之后,給機(jī)器人1語(yǔ)音(聲音信號(hào)),如圖16A所示。語(yǔ)音信號(hào)是例如“向后”。所供應(yīng)的觸摸信號(hào)等于從“站立”位置轉(zhuǎn)換到“坐下”位置的運(yùn)動(dòng)的教導(dǎo),以改變來(lái)自與該運(yùn)動(dòng)有關(guān)的運(yùn)動(dòng)部件的傳感器信號(hào)。需要說(shuō)明的是,觸摸傳感器或者按鈕(例如,“坐下”的教導(dǎo)按鈕)可以按上述方式設(shè)置在一個(gè)預(yù)定位置,以便通過(guò)操作(推動(dòng))觸摸傳感器或按鈕來(lái)教導(dǎo)機(jī)器人運(yùn)動(dòng)。在此情況下,供應(yīng)觸摸信號(hào)是指通過(guò)操作這種觸摸傳感器生成信號(hào)。
使用上述的教導(dǎo)操作,將教導(dǎo)機(jī)器人1進(jìn)行圖16A中的從(A-1)轉(zhuǎn)換到(A-2)的運(yùn)動(dòng)。
在如此教導(dǎo)之后,機(jī)器人1將轉(zhuǎn)換到如圖16A中(A-2)所示的“坐下”位置。當(dāng)學(xué)習(xí)期間給出教導(dǎo)機(jī)器人1的發(fā)音(聲音信號(hào))、例如圖16B的(B-1)中的“向后”時(shí),機(jī)器人移動(dòng)到學(xué)習(xí)期間教導(dǎo)的、如圖16B中(B-2)所示的位置。
將教導(dǎo)給機(jī)器人的運(yùn)動(dòng)不限于上述的方式。也就是,在給出語(yǔ)音(說(shuō)話(huà))的同時(shí)或者前后,可以從機(jī)器人背部向前推動(dòng)機(jī)器人1,使機(jī)器人頸部上抬或下壓、或者抬高前腿,以便教導(dǎo)機(jī)器人1這些運(yùn)動(dòng)。通過(guò)將運(yùn)動(dòng)的這種教導(dǎo)與相應(yīng)的發(fā)音相關(guān)聯(lián),可以教導(dǎo)機(jī)器人1例如“伏臥”、“站立”或“搖擺”的運(yùn)動(dòng)。
此外,機(jī)器人1可以按下述方式學(xué)習(xí)。
首先,機(jī)器人1將在學(xué)習(xí)運(yùn)動(dòng)中學(xué)習(xí)“踢”。具體地說(shuō),用戶(hù)(訓(xùn)練者)將操作前腿,并教導(dǎo)機(jī)器人1“踢”東西。機(jī)器人1待學(xué)習(xí)的運(yùn)動(dòng)可以是預(yù)置的或者是新的。另一方面,經(jīng)語(yǔ)言識(shí)別學(xué)習(xí)的發(fā)音“紅色”和根據(jù)圖像識(shí)別的紅顏色被彼此關(guān)聯(lián)地存儲(chǔ)。
作為這種學(xué)習(xí)的結(jié)果,機(jī)器人1將識(shí)別發(fā)出的語(yǔ)言“踢紅色的東西”,然后將踢“紅色”的東西作為生成的動(dòng)作。例如,紅色對(duì)象通過(guò)輸入圖像的分段和識(shí)別圖像的紅色部分來(lái)識(shí)別。也就是,機(jī)器人1將識(shí)別包括諸多紅色段的東西,以作為去踢的對(duì)象。
在上述實(shí)施例中,語(yǔ)音信息與動(dòng)作相關(guān)聯(lián),但本發(fā)明不局限于這種聯(lián)系。例如,圖像信息可以與動(dòng)作信息相關(guān)聯(lián)。在此情況下,機(jī)器人1裝備有圖像識(shí)別單元,用于從諸如(例如)CCD攝像機(jī)20的攝像單元供應(yīng)的圖像信號(hào)中識(shí)別特定的圖像。
此外,已經(jīng)描述了關(guān)于本能/情緒存儲(chǔ)單元103輸出的本能或情緒與學(xué)習(xí)的動(dòng)作或發(fā)出的語(yǔ)言相聯(lián)系的上述實(shí)施例。然而,本發(fā)明不局限于這種聯(lián)系。例如,后面發(fā)生的本能或情緒可以鏈接目前的動(dòng)作和發(fā)出的語(yǔ)言。
此外,在機(jī)器人1中,輸出(真實(shí)動(dòng)作)所產(chǎn)生的情緒、作為該情緒的動(dòng)機(jī)的輸入(例如,發(fā)出的語(yǔ)言或圖像)以及輸出本身(真實(shí)動(dòng)作)可以被存儲(chǔ)(學(xué)習(xí))。由此,在學(xué)習(xí)后的真實(shí)現(xiàn)場(chǎng)中,機(jī)器人1可以從輸入語(yǔ)言等中檢索相應(yīng)存儲(chǔ)的情緒,以進(jìn)行預(yù)定的動(dòng)作,而不提供應(yīng)當(dāng)相應(yīng)于輸入語(yǔ)言?xún)?nèi)在地提供的任何輸出(動(dòng)作)。
通過(guò)存儲(chǔ)(學(xué)習(xí))觸摸(動(dòng)作)一個(gè)紅色東西(輸入)時(shí)產(chǎn)生的情緒,例如,檢測(cè)到高溫時(shí)的恐懼感覺(jué)(害怕),機(jī)器人1可以在以后看見(jiàn)紅色東西(輸入)時(shí)檢索害怕,從而作出表現(xiàn)害怕的動(dòng)作(作出預(yù)定動(dòng)作)。也就是,機(jī)器人1可以進(jìn)行任何適當(dāng)動(dòng)作,而不重復(fù)過(guò)去的諸如觸摸紅色東西的動(dòng)作。
在此情況下,關(guān)聯(lián)存儲(chǔ)器/檢索存儲(chǔ)器104將以相互關(guān)聯(lián)的方式存儲(chǔ)表現(xiàn)為相應(yīng)于由語(yǔ)音識(shí)別單元101檢測(cè)的語(yǔ)音信號(hào)而作出的動(dòng)作結(jié)果的動(dòng)作結(jié)果信息和語(yǔ)音信號(hào),并且動(dòng)作生成器105根據(jù)關(guān)聯(lián)存儲(chǔ)器/檢索存儲(chǔ)器104基于新語(yǔ)音信號(hào)識(shí)別的動(dòng)作結(jié)果控制動(dòng)作。
此外,機(jī)器人1可以影響輸入的其它空間,影響輸入信號(hào)的特征空間中的情緒和動(dòng)作以影響該輸入信號(hào)的分類(lèi)。也就是,如圖6A、圖6B和圖6C所示,當(dāng)類(lèi)別在圖像和語(yǔ)音的特征空間中彼此接近時(shí),參考第三特征空間(例如,動(dòng)作特征空間)分類(lèi)該圖像和語(yǔ)音。
具體地說(shuō),在響應(yīng)由圖像信號(hào)表征的第一輸入對(duì)象(圖像)進(jìn)行第一動(dòng)作的情況下,給予機(jī)器人1獎(jiǎng)賞(例如,輕拍),而當(dāng)機(jī)器人響應(yīng)非常相似于該圖像特征空間中的第一對(duì)象的第二對(duì)象,還進(jìn)行作為分類(lèi)結(jié)果(第一和第二對(duì)象在該圖像特征空間中彼此接近)的第一動(dòng)作時(shí),則給予機(jī)器人懲罰(例如“擊打”);該機(jī)器人1適合于響應(yīng)第二和該第二對(duì)象的后續(xù)輸入進(jìn)行不同于第一動(dòng)作的任何動(dòng)作。也就是,另一個(gè)特征空間中的分類(lèi)結(jié)果(此情況下的動(dòng)作結(jié)果)被用來(lái)影響另一個(gè)分類(lèi)或分類(lèi)策略。
在此情況中,語(yǔ)音識(shí)別單元101具有作為以下部件的功能輸入信息檢測(cè)器;特征檢測(cè)器,檢測(cè)由輸入信息檢測(cè)器檢測(cè)的語(yǔ)音信號(hào)的特征;信息分類(lèi)單元,根據(jù)特征分類(lèi)語(yǔ)音信號(hào)。需要提醒的是,基于特征的語(yǔ)音信號(hào)分類(lèi)相當(dāng)于HMM的分類(lèi)。需要說(shuō)明的是,特征提取器122(將結(jié)合圖33進(jìn)行詳細(xì)說(shuō)明)執(zhí)行特征檢測(cè)器的功能,而圖33所示的HMM單元123執(zhí)行信息分類(lèi)單元的功能。
此外,語(yǔ)音識(shí)別單元101具有作為分類(lèi)改變器的功能,該分類(lèi)改變器在動(dòng)作生成器105的控制下,根據(jù)表現(xiàn)為機(jī)器人1進(jìn)行的動(dòng)作結(jié)果的動(dòng)作結(jié)果信息改變已經(jīng)引發(fā)動(dòng)作的語(yǔ)音信號(hào)的分類(lèi)(識(shí)別類(lèi)別)。需要說(shuō)明的是,通過(guò)關(guān)聯(lián)進(jìn)行的學(xué)習(xí)可以是通過(guò)將機(jī)器人1被獎(jiǎng)賞時(shí)所作出的動(dòng)作與刺激(語(yǔ)音、圖像、動(dòng)作或類(lèi)似物)相關(guān)聯(lián)進(jìn)行的學(xué)習(xí)。
本發(fā)明的機(jī)器人1的所有部件已經(jīng)在前面說(shuō)明。下面將進(jìn)一步說(shuō)明每個(gè)部件。
(4-2)任意動(dòng)作的學(xué)習(xí)(傳感器數(shù)據(jù)處理器的詳細(xì)說(shuō)明)如上所述,機(jī)器人1學(xué)習(xí)是預(yù)置運(yùn)動(dòng)或任意運(yùn)動(dòng)的運(yùn)動(dòng)(動(dòng)作)。下面將說(shuō)明機(jī)器人1如何學(xué)習(xí)任意運(yùn)動(dòng),即,新運(yùn)動(dòng)。
機(jī)器人1的關(guān)節(jié)由相應(yīng)的如上所述的伺服電動(dòng)機(jī)控制。在機(jī)器人1中,基于來(lái)自CPU 10的角度指定(角度指定信息)生成按時(shí)間系列的角度,并且作為結(jié)果,機(jī)器人1將表現(xiàn)一個(gè)運(yùn)動(dòng)。
此外,伺服控制器提供諸多信號(hào),包括從設(shè)置在每個(gè)關(guān)節(jié)中的電位計(jì)供應(yīng)的實(shí)際關(guān)節(jié)角度,和供應(yīng)給每個(gè)伺服電動(dòng)機(jī)的脈沖信號(hào)。使用該脈沖信號(hào),而不是用于教導(dǎo)機(jī)器人1上述預(yù)置運(yùn)動(dòng)的來(lái)自觸摸傳感器的傳感器信號(hào)(傳感器數(shù)據(jù)),教導(dǎo)機(jī)器人1任意運(yùn)動(dòng)。
為了學(xué)習(xí)該任意運(yùn)動(dòng),機(jī)器人1包括圖17A所示的辨別單元111。該辨別單元111相當(dāng)于圖15中的傳感器數(shù)據(jù)處理器102,它為機(jī)器人1學(xué)習(xí)任意運(yùn)動(dòng)而構(gòu)造。辨別單元111專(zhuān)用于機(jī)器人1根據(jù)供應(yīng)給每個(gè)關(guān)節(jié)伺服電動(dòng)機(jī)的控制信號(hào)的脈寬學(xué)習(xí)運(yùn)動(dòng)。
需要注意的是,機(jī)器人1適合于變換各種姿態(tài),因而當(dāng)學(xué)習(xí)一種運(yùn)動(dòng)時(shí)它將不保持任何一種恒定的姿態(tài)。因此,機(jī)器人1必須被教導(dǎo)“站立”和“坐下”位置中的相似運(yùn)動(dòng)。即,必須與機(jī)器人1的每種姿態(tài)相關(guān)聯(lián),通過(guò)使用控制運(yùn)動(dòng)部件(關(guān)節(jié))的運(yùn)動(dòng)的脈寬來(lái)教導(dǎo)機(jī)器人1進(jìn)行運(yùn)動(dòng)。
為此,辨別單元111包括如圖17B所示的多個(gè)辨別器1111、1112,…,其每一個(gè)用于一種姿態(tài)。例如,第一辨別器1111被提供用來(lái)學(xué)習(xí)“坐下”位置的運(yùn)動(dòng),第二辨別器1112被提供用來(lái)學(xué)習(xí)“站立”位置的運(yùn)動(dòng)。
根據(jù)機(jī)器人1當(dāng)前姿態(tài)的信息,辨別單元111選擇多個(gè)辨別器1111、1112,…中預(yù)期的一個(gè),用于機(jī)器人1學(xué)習(xí)任意姿態(tài)的運(yùn)動(dòng)。
需要說(shuō)明的是,表示當(dāng)前姿態(tài)的姿態(tài)信息可以從例如電位計(jì)261至26n、角速度傳感器18或加速度傳感器19所供應(yīng)的重力信息中檢測(cè)。此外,可以根據(jù)來(lái)自動(dòng)作生成器105的作為運(yùn)動(dòng)部件控制信號(hào)輸出的命令,獲取當(dāng)前姿態(tài)信息。
通過(guò)將沒(méi)有給機(jī)器人1施加外力時(shí)出現(xiàn)的脈寬與施加外力時(shí)出現(xiàn)的脈寬進(jìn)行比較,實(shí)現(xiàn)教導(dǎo)(學(xué)習(xí))。也就是,供應(yīng)給處于正常狀態(tài)下(沒(méi)有施加的外力)的每個(gè)關(guān)節(jié)(伺服電動(dòng)機(jī))的脈沖信號(hào)的寬度取固定在一定限度內(nèi)的圖案,而在機(jī)器人1被施加外力時(shí),供應(yīng)給該關(guān)節(jié)的脈沖信號(hào)的寬度將具有不同于正常狀態(tài)下的關(guān)節(jié)所顯示的圖案。為了通過(guò)向機(jī)器人施加外力教導(dǎo)機(jī)器人1運(yùn)動(dòng),上述關(guān)系(脈寬圖案之間的差別)被用來(lái)獲取關(guān)于運(yùn)動(dòng)的信息。具體地說(shuō),按照下面將說(shuō)明的方式實(shí)現(xiàn)運(yùn)動(dòng)學(xué)習(xí)。
例如,當(dāng)根據(jù)處于站立位置的姿態(tài)信息識(shí)別機(jī)器人1時(shí),在施加給機(jī)器人1用于教導(dǎo)運(yùn)動(dòng)的外力時(shí)出現(xiàn)的脈沖寬度將供應(yīng)給第一辨別器1111,在同一時(shí)間還供應(yīng)指定給該運(yùn)動(dòng)的信息給該辨別器。例如,用于運(yùn)動(dòng)教導(dǎo)的脈沖寬度是用于如下式(6)所示的所謂的PID控制的信號(hào)的脈沖寬度。更具體地說(shuō),將PWM控制的脈沖用于此目的。P=Pg×en+Ig×Σi=0neiΔt+Dg×en-en-1ΔT-----(6)]]>其中,ei是時(shí)間i的誤差(電位計(jì)中目標(biāo)角度與當(dāng)前角度(實(shí)際角度)之間的差值),Pg、Ig和Dg是常數(shù)。用于運(yùn)動(dòng)學(xué)習(xí)的脈寬是通過(guò)計(jì)算式(6)獲得的P值。
例如,矢量被用作脈寬的信息,當(dāng)分別為運(yùn)動(dòng)學(xué)習(xí)和要被教導(dǎo)的運(yùn)動(dòng)的目的將外力施加給機(jī)器人1時(shí)出現(xiàn)該脈寬。五維矢量[V0,V1,V2,V3,V4]被用作指定給要被教導(dǎo)的運(yùn)動(dòng)的信息。有了該矢量的五個(gè)元素V0、V1、V2、V3和V4,就能夠識(shí)別五個(gè)類(lèi)型的刺激。下面將詳細(xì)說(shuō)明教導(dǎo)。
當(dāng)從背部向后推動(dòng)機(jī)器人1時(shí),提供從此時(shí)產(chǎn)生的脈寬中獲得的矢量P1和打算運(yùn)動(dòng)的信息O1=
。例如,如圖18所示,辨別器1111提供有脈寬矢量(向后)P1和
。
矢量元素V0、V1、V2、V3和V4的每一個(gè)被學(xué)習(xí)為0與1之間的實(shí)數(shù)(具有浮點(diǎn))。(要學(xué)習(xí)的)刺激部分越大,矢量元素就越接近1。例如,一個(gè)矢量被獲取為如
的實(shí)數(shù),以作為具有信息O1=
的運(yùn)動(dòng)學(xué)習(xí)的結(jié)果。
此外,當(dāng)從背部向前推動(dòng)機(jī)器人1時(shí),提供從此時(shí)產(chǎn)生的脈寬中獲得的矢量P2和打算運(yùn)動(dòng)的信息O2=
。當(dāng)機(jī)器人1頸部被下推時(shí),提供從此時(shí)產(chǎn)生的脈寬中獲得的矢量P3和打算運(yùn)動(dòng)的信息O3=
。當(dāng)機(jī)器人1頸部被上推時(shí),提供從此時(shí)產(chǎn)生的脈寬中獲得的矢量P4和打算運(yùn)動(dòng)的信息O4=
。此外,例如,還提供從不施加外力時(shí)出現(xiàn)的脈寬中獲得的矢量P0和打算運(yùn)動(dòng)的信息O0=[1,0,0,0,0]。將矢量P0和信息O0與上述矢量和信息進(jìn)行比較,以學(xué)習(xí)打算的運(yùn)動(dòng)。
圖19至圖25示出脈寬的例子,其中水平軸顯示關(guān)節(jié)的位置,而垂直軸顯示由所謂的PWM脈沖獲得的值。
圖19顯示當(dāng)機(jī)器人1處于站立位置時(shí)的脈寬(脈沖信號(hào)的值)。在圖中,“FR1”指示前右腿的第一關(guān)節(jié)(肩關(guān)節(jié))的位置,“FR2”指示前右腿的第二關(guān)節(jié)(膝關(guān)節(jié))的位置,“FR3”指示前右腿的第三關(guān)節(jié)(踝關(guān)節(jié))的位置?!癋L1”指示前左腿的第一關(guān)節(jié)(肩關(guān)節(jié))的位置,“FL2”指示前左腿的第二關(guān)節(jié)(膝關(guān)節(jié))的位置,“FL3”指示前左腿的第三關(guān)節(jié)(踝關(guān)節(jié))的位置?!癏R1”指示后右腿的第一關(guān)節(jié)(肩關(guān)節(jié))的位置,“HR2”指示后右腿的第二關(guān)節(jié)(膝關(guān)節(jié))的位置,“HR3”指示后右腿的第三關(guān)節(jié)(踝關(guān)節(jié))的位置。“HL1”指示后左腿的第一關(guān)節(jié)(肩關(guān)節(jié))的位置,“HL2”指示后左腿的第二關(guān)節(jié)(膝關(guān)節(jié))的位置,“HL3”指示后左腿的第三關(guān)節(jié)(踝關(guān)節(jié))的位置。“Head 1”、“Head 2”和“Head 3”分別指示頸關(guān)節(jié)的位置。上述情況還適用于圖20至圖25。因而,當(dāng)機(jī)器人1處于一個(gè)狀態(tài)(姿態(tài)或運(yùn)動(dòng))時(shí),可以獲得總共15個(gè)脈寬。也就是,可以獲得如包括15維元素的矢量那樣的用于上述學(xué)習(xí)的矢量P。
當(dāng)從背部向前推處于站立位置的機(jī)器人1時(shí),產(chǎn)生具有如圖20所示寬度的脈沖。當(dāng)從背部向后推處于站立位置的機(jī)器人1時(shí),如此產(chǎn)生的脈沖寬度將是如圖21所示的那樣。當(dāng)從頭部向上推處于站立位置的機(jī)器人1時(shí),產(chǎn)生具有如圖22所示寬度的脈沖。當(dāng)從頭部下壓處于站立位置的機(jī)器人1時(shí),將產(chǎn)生具有圖23所示寬度的脈沖。當(dāng)右腿支持處于站立位置的機(jī)器人1時(shí),將產(chǎn)生具有如圖24所示寬度的脈沖。當(dāng)左腿支持處于站立位置的機(jī)器人1時(shí),產(chǎn)生具有如圖25所示寬度的脈沖。根據(jù)這些脈沖寬度,辨別器111檢測(cè)機(jī)器人1的相應(yīng)姿態(tài),用于學(xué)習(xí)運(yùn)動(dòng)。
此外,機(jī)器人1包括如圖26所示的愉快/不愉快判斷單元112,以便象真實(shí)動(dòng)物那樣進(jìn)行運(yùn)動(dòng)學(xué)習(xí)。
從傳感器數(shù)據(jù)處理器102接收輸出時(shí),愉快/不愉快判斷單元112判斷該數(shù)據(jù)是定義愉快的情緒值、還是定義不愉快的情緒值,并輸出相應(yīng)的動(dòng)作信息。例如,當(dāng)情緒模型73中定義不愉快的情緒具有較大數(shù)值時(shí),愉快/不愉快判斷單元112輸出將使動(dòng)作避免不愉快的動(dòng)作信息,當(dāng)從背部向后推動(dòng)機(jī)器人1時(shí),愉快/不愉快判斷單元112將傳感器數(shù)據(jù)處理器102的輸出判斷為定義不愉快的情緒值,并且輸出轉(zhuǎn)換到“坐下”位置的動(dòng)作信息。此外,當(dāng)從背部向前推動(dòng)或者從頸部下壓機(jī)器人1時(shí),愉快/不愉快判斷單元112將來(lái)自傳感器數(shù)據(jù)處理器102的數(shù)據(jù)判斷為定義不愉快的情緒值,并輸出轉(zhuǎn)換到“伏臥”位置的動(dòng)作信息。當(dāng)向上提處于伏臥位置的機(jī)器人1的頸部時(shí),愉快/不愉快判斷單元112將來(lái)自傳感器數(shù)據(jù)處理器102的數(shù)據(jù)判斷為定義不愉快的情緒值,并且輸出轉(zhuǎn)換到“坐下”位置的動(dòng)作信息。當(dāng)向上提處于坐下位置的機(jī)器人1的頸部時(shí),愉快/不愉快判斷單元112將來(lái)自傳感器數(shù)據(jù)處理器102的數(shù)據(jù)判斷為定義不愉快的情緒值,并且輸出轉(zhuǎn)換到“站立”位置的動(dòng)作信息。也就是說(shuō),當(dāng)作用于機(jī)器人1的外力如此之大以致感覺(jué)不愉快時(shí),機(jī)器人1將進(jìn)行上述運(yùn)動(dòng)。動(dòng)作生成器105根據(jù)上述動(dòng)作信息生成動(dòng)作。
像教導(dǎo)一條真狗或類(lèi)似物一個(gè)姿態(tài)那樣,被施加動(dòng)作或外力的機(jī)器人1將學(xué)習(xí)從它感覺(jué)到對(duì)這樣一種處理不愉快的當(dāng)前位置轉(zhuǎn)換到任何其它位置。
需要說(shuō)明的是,教導(dǎo)機(jī)器人1一個(gè)動(dòng)作需要多次重復(fù)外力或動(dòng)作的應(yīng)用。此外,重復(fù)該教導(dǎo)或教導(dǎo)可以用于其它姿態(tài)(其它辨別器)。每一個(gè)辨別器被構(gòu)成具有例如分層的神經(jīng)網(wǎng)絡(luò),用于一種學(xué)習(xí)。如圖27所示,例如一個(gè)三層神經(jīng)網(wǎng)絡(luò)包括輸入層、隱藏層和輸出層。在此情況下,學(xué)習(xí)或教導(dǎo)的過(guò)程將概述如下。
在輸入層,相應(yīng)于輸入層形成傳感器信號(hào)或類(lèi)似物被供應(yīng)給每個(gè)神經(jīng)元。在隱藏層,提取經(jīng)輸入層的每一個(gè)神經(jīng)元發(fā)送的數(shù)據(jù)特征。具體地說(shuō),隱藏層中的每個(gè)神經(jīng)元備注輸入數(shù)據(jù)的某些特征,并提取用于估價(jià)。在輸出層,將來(lái)自隱藏層的神經(jīng)元的諸多特征組合在一起,以作出最終決定。
在上述三層神經(jīng)網(wǎng)絡(luò)中,建立基于反向傳播的學(xué)習(xí),它適合于構(gòu)建例如辨別器。由此,通過(guò)在背部向后推動(dòng)機(jī)器人1,向辨別器供應(yīng)O1=
,后者將輸出一個(gè)接近
的數(shù)值(實(shí)數(shù))。
如上所述,機(jī)器人1可以經(jīng)過(guò)辨別單元111學(xué)習(xí)任意運(yùn)動(dòng)。因而通過(guò)學(xué)習(xí)彼此關(guān)聯(lián)的圖像和語(yǔ)音信號(hào),機(jī)器人1可以響應(yīng)給予的預(yù)定發(fā)音(語(yǔ)音信號(hào)),作出一個(gè)機(jī)器人相應(yīng)于該預(yù)定發(fā)音已經(jīng)學(xué)習(xí)的動(dòng)作。
(4-3)學(xué)習(xí)施加給機(jī)器人1的外力在上面的說(shuō)明中,已經(jīng)說(shuō)明了任意運(yùn)動(dòng)的學(xué)習(xí)。在任意運(yùn)動(dòng)的學(xué)習(xí)中,機(jī)器人1學(xué)習(xí)由所施加的外力推動(dòng)機(jī)器人1的運(yùn)動(dòng)(姿態(tài)),并且響應(yīng)給予的預(yù)定發(fā)音(語(yǔ)音信號(hào))作出運(yùn)動(dòng)。下面將說(shuō)明這種外力類(lèi)型的學(xué)習(xí)。在學(xué)習(xí)被施加的外力的類(lèi)型之后,當(dāng)施加機(jī)器人1已經(jīng)學(xué)習(xí)的外力時(shí),機(jī)器人1可以進(jìn)行預(yù)定運(yùn)動(dòng)。具體地說(shuō),在機(jī)器人1已經(jīng)學(xué)習(xí)了用于轉(zhuǎn)換到坐下位置的施加到腰部的外力時(shí),當(dāng)用相當(dāng)于該外力的外力作用于該機(jī)器人1的腰部時(shí),該機(jī)器人將識(shí)別該外力輸入并且進(jìn)行作為預(yù)定運(yùn)動(dòng)的例如坐下運(yùn)動(dòng)。下面將進(jìn)一步說(shuō)明外力的學(xué)習(xí)。
如圖28所示,為了學(xué)習(xí)外力,機(jī)器人1含有運(yùn)動(dòng)部件151;移動(dòng)運(yùn)動(dòng)部件的關(guān)節(jié)單元152;檢測(cè)器153,檢測(cè)具有經(jīng)運(yùn)動(dòng)部件151施加的外力的關(guān)節(jié)單元152的狀態(tài);和學(xué)習(xí)單元160,彼此關(guān)聯(lián)的學(xué)習(xí)由檢測(cè)器153檢測(cè)的關(guān)節(jié)單元152的狀態(tài)和外力。在學(xué)習(xí)了關(guān)節(jié)單元152的狀態(tài)和外力之后,當(dāng)施加外力時(shí),機(jī)器人1可以根據(jù)關(guān)節(jié)單元152的狀態(tài)識(shí)別外力的類(lèi)型。如圖6和圖8所示,運(yùn)動(dòng)部件151包括腿部單元3A至3D;頭部單元4和尾部單元5,這些部件與身體單元2結(jié)合并且由傳動(dòng)器251至25n驅(qū)動(dòng)。關(guān)節(jié)單元152包括諸多傳動(dòng)器,具體地說(shuō)是構(gòu)成諸多傳動(dòng)器的諸多電動(dòng)機(jī)。
由于上述結(jié)構(gòu),機(jī)器人1通過(guò)使用供應(yīng)給電動(dòng)機(jī)(傳動(dòng)器)的PWM脈沖,可以學(xué)習(xí)外力。如上所述,在機(jī)器人1中,腿部單元3A至3D、頭部單元4和尾部單元5的每一個(gè)部件都用關(guān)節(jié)與身體單元2聯(lián)結(jié),它們是運(yùn)動(dòng)部件。腿部單元3A至3D的每一個(gè)包括與多個(gè)關(guān)節(jié)(肩關(guān)節(jié),膝關(guān)節(jié)和踝關(guān)節(jié))彼此聯(lián)結(jié)的多個(gè)運(yùn)動(dòng)部件;腿部單元3A至3D用諸多關(guān)節(jié)分別聯(lián)結(jié)到身體單元2的前左部、前右部、后左部和后右部;頭部單元4和尾部單元5分別用諸多關(guān)節(jié)聯(lián)結(jié)到身體單元2的前端和后端。能夠使運(yùn)動(dòng)部件運(yùn)動(dòng)的關(guān)節(jié)由傳動(dòng)器251至25n組成。PWM脈沖信號(hào)被供應(yīng)給電動(dòng)機(jī)(被聯(lián)結(jié)的傳動(dòng)器251至25n)。
PWM脈沖信號(hào)的寬度依賴(lài)于經(jīng)運(yùn)動(dòng)部件151(上述的每個(gè)單元)向其施加有外力的關(guān)節(jié)(電動(dòng)機(jī))152的狀態(tài)。即,它被計(jì)算為誤差或每個(gè)關(guān)節(jié)(電動(dòng)機(jī))的目標(biāo)角度與實(shí)際角度之間的差值。由此,當(dāng)外力被施加給機(jī)器人1時(shí),誤差將是很大的,脈寬也是很大的。也就是說(shuō),當(dāng)較大的外力施加于機(jī)器人1時(shí),PWM脈沖信號(hào)的寬度將是很大的。因而,機(jī)器人1通過(guò)使用這種PWM脈沖信號(hào)來(lái)學(xué)習(xí)外力。檢測(cè)器153檢測(cè)PWM脈沖信號(hào)的寬度,作為經(jīng)運(yùn)動(dòng)部件151外力作用于其上的關(guān)節(jié)單元152的狀態(tài)。需要說(shuō)明的是,由于PWM脈沖信號(hào)的寬度被計(jì)算為上述的每個(gè)關(guān)節(jié)(電動(dòng)機(jī))的目標(biāo)角度和實(shí)際角度之間的誤差或差值,因此由檢測(cè)器153檢測(cè)的關(guān)節(jié)單元152的狀態(tài)可以說(shuō)成是每個(gè)關(guān)節(jié)(電動(dòng)機(jī))的目標(biāo)角度和實(shí)際角度之間的誤差或差值。還需要說(shuō)明的是,可以作為圖8所示的信號(hào)處理電路14的一個(gè)功能和其它功能、或者通過(guò)軟件或目標(biāo)程序?qū)嵤z測(cè)器153。
在該實(shí)施例中,施加給腿部單元3A至3D中的電動(dòng)機(jī)(關(guān)節(jié))的PWM脈沖信號(hào)和施加給身體單元2和頭部單元4中的電動(dòng)機(jī)(關(guān)節(jié))的PWM脈沖信號(hào)被用作在學(xué)習(xí)外力時(shí)的PWM脈沖信號(hào),下面將要進(jìn)一步說(shuō)明。圖19至圖25示出施加給關(guān)節(jié)(電動(dòng)機(jī))的這種PWM脈沖信號(hào)的變化,用于學(xué)習(xí)施加給機(jī)器人的外力。正如通過(guò)比較圖20所示的當(dāng)從背部向前推動(dòng)機(jī)器人1時(shí)出現(xiàn)的脈沖寬度圖案和圖21所示的當(dāng)從背部向后推動(dòng)機(jī)器人1時(shí)出現(xiàn)的脈沖寬度圖案所看到的那樣,PWM脈沖的寬度通常是關(guān)于“0”(x軸)對(duì)稱(chēng)的。
在外力學(xué)習(xí)中,當(dāng)各種外力施加于機(jī)器人1時(shí)出現(xiàn)的PWM脈沖寬度的圖案(具體地說(shuō)是矢量)被用作學(xué)習(xí)單元160中的學(xué)習(xí)數(shù)據(jù),其中神經(jīng)網(wǎng)絡(luò)被用于外力學(xué)習(xí)。該學(xué)習(xí)單元160由例如軟件或目標(biāo)程序來(lái)實(shí)現(xiàn)。
對(duì)于神經(jīng)網(wǎng)絡(luò),層連接型網(wǎng)絡(luò)的反向傳播神經(jīng)網(wǎng)絡(luò)被用于外力學(xué)習(xí)。反向傳播神經(jīng)網(wǎng)絡(luò)對(duì)圖案識(shí)別是高度自適應(yīng)的。該實(shí)施例使用三層反向傳播神經(jīng)網(wǎng)絡(luò),包括輸入層161、隱藏層(中間層)162和輸出層163,如圖29和圖30所示。
在三層反向傳播神經(jīng)網(wǎng)絡(luò)中,當(dāng)學(xué)習(xí)外力后,信息(脈寬)Din從觸摸傳感器供應(yīng)到輸入層161時(shí),輸出層163將輸出與觸摸傳感器所供應(yīng)的信息Din相對(duì)應(yīng)的有關(guān)已經(jīng)學(xué)習(xí)的外力的類(lèi)型的信息Dout。
三層反向傳播神經(jīng)網(wǎng)絡(luò)中的輸入層161、隱藏層162和輸出層163按下面將要說(shuō)明的方式構(gòu)成。
輸入層161具有多個(gè)神經(jīng)元(該實(shí)施例中是18個(gè)神經(jīng)元)。也就是輸入層161被供應(yīng)用于外力學(xué)習(xí)的18個(gè)數(shù)據(jù)。機(jī)器人1具有三種類(lèi)型的當(dāng)前姿態(tài),例如“站立”、“坐下”和“睡覺(jué)”。施加給每個(gè)關(guān)節(jié)(關(guān)節(jié)中的電動(dòng)機(jī))PWM脈沖信號(hào)的寬度有15種類(lèi)型(12種類(lèi)型(=3種類(lèi)型×4)供4個(gè)腿單元使用,3種類(lèi)型供頭部單元使用)。因此,總共18種類(lèi)型的PWM脈沖寬度作為數(shù)據(jù)供給輸入層161。
用于關(guān)節(jié)狀態(tài)的外力學(xué)習(xí)的當(dāng)前姿態(tài)依賴(lài)于機(jī)器人1的姿態(tài),也就是說(shuō),由于脈沖寬度依賴(lài)于機(jī)器人1的姿態(tài)。
輸入層161供應(yīng)有一個(gè)圖案,它是包括如來(lái)自觸摸傳感器的信息DIn的各種脈沖寬度的矢量。需要說(shuō)明的是,在該實(shí)施例中,由于輸入脈沖寬度在[-512,512]的范圍內(nèi)取值,因此它被下式(7)歸一化Input=(P+|Pmin|)/(Pmax+|Pmin|)………(7)其中,P是測(cè)量的脈沖寬度,Pmax最大脈沖寬度(512),Pmin是最小脈沖寬度(-512)。由于關(guān)于姿態(tài)的輸入數(shù)據(jù)取值為
(0或者1),因此脈中寬度不必歸一化。
隱藏層162具有多個(gè)神經(jīng)元(在該實(shí)施例中是17個(gè)神經(jīng)元)。神經(jīng)元的數(shù)量通過(guò)所謂的拇指(thumb)規(guī)則確定。也就是說(shuō),輸入層161中的神經(jīng)元數(shù)量和輸出層163中的神經(jīng)元數(shù)量被平均,然后平滑平均的結(jié)果,以確定神經(jīng)元數(shù)量。通過(guò)拇指規(guī)則確定的隱藏層162中的神經(jīng)元數(shù)量“numOfHidden”,由下式(8)給出numOFHidden=(numOfInput+numOfOuput)/2+2=14+α…(8)其中,“numOfInput”是輸入層161中的神經(jīng)元數(shù)量,“numOfOuput”是輸出層163中的神經(jīng)元的數(shù)量,α是通過(guò)平滑增加或較少的值。在式(8)中通過(guò)把“18”設(shè)置為輸入層161中的神經(jīng)元數(shù)量“numOfInput”和把“10”設(shè)置為輸出層153中的神經(jīng)元數(shù)量“numOfOuput”,將提供隱藏層162中“numOFHidden”17個(gè)神經(jīng)元。
輸出層163具有多個(gè)神經(jīng)元(該實(shí)施例中有10個(gè))。由于輸出層163中有10個(gè)神經(jīng)元,機(jī)器人1通過(guò)學(xué)習(xí)可以識(shí)別10種類(lèi)型的外力。也就是說(shuō),機(jī)器人1可以識(shí)別10種類(lèi)型的外力,包括例如“ForceForward”(在背部向前推機(jī)器人1的外力,如圖20所示)“ForceBackward”(在背部向后推機(jī)器人1的外力,如圖21所示),“RightHandUp”(抬高右手的外力,如圖24所示),“LeftHandUp”(抬高左手的外力,如圖25所示),“BothHandUp”(抬高雙手的外力,未示出),“HeadUp”(抬高頭部的外力,如圖22所示),“HeadDown”(下推頭部的外力,如圖23所示),“HeadRight”(向右推頭部的外力,未示出),“HeadLeft”(向左推頭部的外力,未示出)和“Noforce”(未施加外力,如圖9所示)。
輸入層161、隱藏層162和輸出層163被構(gòu)成上述結(jié)構(gòu)。各種輸入/輸出函數(shù)可以在隱藏層162和輸出層163中使用,但是在該實(shí)施例中,使用所謂的S形函數(shù)。與所謂的閾(threhold)函數(shù)不同,S形函數(shù)具有如圖31所示的提供對(duì)輸入總和進(jìn)行平滑改變的輸出的特征。
三層反向傳播神經(jīng)元網(wǎng)絡(luò)用來(lái)學(xué)習(xí)各種外力,如下所述。
外力學(xué)習(xí)是通過(guò)向網(wǎng)絡(luò)(學(xué)習(xí)單元160)提供一對(duì)如圖30所示的輸入矢量數(shù)據(jù)和教導(dǎo)信號(hào)矢量數(shù)據(jù)進(jìn)行的。供應(yīng)訓(xùn)練者矢量數(shù)據(jù),使某些神經(jīng)元輸出“1”,而其它神經(jīng)元輸出“0”。也就是,“1”被供應(yīng)給要被識(shí)別的類(lèi)型的外力,而“0”被供應(yīng)給所有其它類(lèi)型的外力。
中間層或隱藏層162提供輸出yi(1),作為通過(guò)計(jì)算由下式(9)給出的S形函數(shù)“sigmoid()”得到的輸入和的結(jié)果,輸出層163提供輸出yj(2),作為通過(guò)計(jì)算由下式(10)給出的S形函數(shù)“sigmoid()”得到的輸入和的結(jié)果。下式(11)用來(lái)更新加權(quán),也就是,學(xué)習(xí)加權(quán)。S形函數(shù)“sigmoid()”是由下式(12)給出的函數(shù)。yj(1)=sigmoid(Σi=0numOfInputWijai)--(9)]]>yj(2)=sigmoid(Σi=0numOfHiddenWij(2)ai(1))--(10)]]>Wij(m+1)(t)=Wij(m+1)(t-1)-ϵyi(m)(t)Zi(m+1)+βwij(m+1)(t-1)(m=0,1)---(11)]]>
sigmoid(x)=1/(1+exp(-x))………………(12)其中,ai是每個(gè)輸入脈沖信號(hào)的寬度,zi是誤差反向傳播輸出,ε是學(xué)習(xí)函數(shù),β是運(yùn)動(dòng)系數(shù)。學(xué)習(xí)函數(shù)(ε)和運(yùn)動(dòng)系數(shù)(β)是對(duì)學(xué)習(xí)速度影響很大的因數(shù)。例如,在如該實(shí)施例構(gòu)成的機(jī)器人1中,學(xué)習(xí)速度可以被定為具有ε=0.2和β=0.4的最佳值。
輸入矢量數(shù)據(jù)的輸入和訓(xùn)練者矢量數(shù)據(jù)的輸入被重復(fù)多次,直至供應(yīng)給神經(jīng)網(wǎng)絡(luò)的輸入矢量數(shù)據(jù)與訓(xùn)練者矢量數(shù)據(jù)之間的差值或誤差小于閾值。然后,結(jié)束學(xué)習(xí)。例如,當(dāng)下式(13)給出的平均誤差小于閾值時(shí),結(jié)束該學(xué)習(xí)誤差=(∑|te-a|2)/numOfOutput………………(13)其中a是輸入矢量數(shù)據(jù),te是訓(xùn)練者矢量數(shù)據(jù)。
例如,機(jī)器人1被設(shè)計(jì)成在在線學(xué)習(xí)(連續(xù)學(xué)習(xí))中重復(fù)10次學(xué)習(xí)同樣的數(shù)據(jù)。另外,將機(jī)器人1設(shè)計(jì)成連續(xù)學(xué)習(xí)大約20次相同圖案的數(shù)據(jù)。這樣,機(jī)器人1將學(xué)習(xí)總共大約800個(gè)樣本。
圖32示出學(xué)習(xí)次數(shù)和平均誤差之間的關(guān)系示例。如圖32所示,當(dāng)學(xué)習(xí)已經(jīng)進(jìn)行了約50次時(shí)平均誤差最小,這意味著進(jìn)行50次嘗試后結(jié)束學(xué)習(xí)。需要說(shuō)明的是,通常隨機(jī)地給出加權(quán)因數(shù)的初始值,它依賴(lài)于學(xué)習(xí)應(yīng)當(dāng)重復(fù)多少次的初始值。也就是說(shuō),根據(jù)該初始值,該學(xué)習(xí)在上述情況中將嘗試約50次結(jié)束,但在其它情況中學(xué)習(xí)約嘗試150次。
三層反向傳播神經(jīng)網(wǎng)絡(luò)按上述方式學(xué)習(xí)外力。因而,機(jī)器人1可以接收多種類(lèi)型的輸入外力(多次供應(yīng)一個(gè)外力)并且學(xué)習(xí)與關(guān)節(jié)單元152的狀態(tài)(例如PWM脈寬)關(guān)聯(lián)的多個(gè)輸入外力,以識(shí)別(分類(lèi))外力。需要注意的是,例如機(jī)器人1通過(guò)所謂的通用性檢驗(yàn)證實(shí)外力是否已經(jīng)被成功地分類(lèi)。
具體地說(shuō),例如,當(dāng)用外力在機(jī)器人1腰部作用于機(jī)器人1時(shí),通過(guò)上述學(xué)習(xí)識(shí)別施加到腰部的外力被包含在曾經(jīng)學(xué)習(xí)過(guò)的多種外力之中。具體地說(shuō),由施加在腰部的外力產(chǎn)生的脈寬(圖案)對(duì)應(yīng)于供應(yīng)給每一個(gè)關(guān)節(jié)單元152的任何一個(gè)PWM脈寬(圖案),從而按對(duì)應(yīng)的坐下運(yùn)動(dòng)坐下。由此用戶(hù)通過(guò)觸摸(外力)發(fā)出的指令自由度可以保證機(jī)器人1進(jìn)行許多類(lèi)型的運(yùn)動(dòng)。
需要注意的是,在上述說(shuō)明中已經(jīng)說(shuō)明了使用三層反向傳播神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí),但是學(xué)習(xí)單元當(dāng)然還可以使用任何其它的學(xué)習(xí)方法。例如,學(xué)習(xí)單元可以使用SVM(support vector machine,支持矢量機(jī))分類(lèi)施加給機(jī)器人1的外力。SVM是如在感知器中用于線性分類(lèi)外力的一種方法。具體地說(shuō),SVM在非線性空間中映射一次數(shù)據(jù),并且在該空間確定超平面分離,因而可以解決實(shí)際的非線性問(wèn)題。
典型地,在圖案識(shí)別中,當(dāng)試驗(yàn)樣本x=(x1,x2,x3,…,xn)時(shí),可以確定式(14)給定的識(shí)別函數(shù)f(x)f(x)=Σj=1nvjxj+b------(14)]]>假定檢查(supervise)標(biāo)記是y=(y1,y2,y3,…,yn),將在下式(15)給出的約束條件下解決使‖v‖2最小的問(wèn)題約束yj(vTxi+b)≥1 ……(15)這樣一種約束問(wèn)題可以用拉格朗日的待定因子方法解決。通過(guò)引入拉格朗日因子,該問(wèn)題可以被表示為下式(16)L(w,b,a)=12||v||2-Σi=1tai((xiTv+b)-1)------(16)]]>通過(guò)在下式(17)中對(duì)b和v求偏微分,可以解決下式(18)給出的二次規(guī)劃問(wèn)題。該約束由下式(19)給出。
L/b=L/v=0 ………(17)maxΣai-1/2ΣαiαjyiyjxiTxj---(18)]]>約束αi≥0,∑αiyi=0 ………(19)當(dāng)特征空間中的維數(shù)小于訓(xùn)練樣本數(shù)目時(shí),引入一個(gè)松弛變量ξ≥0,將約束改變到由下式(20)給出的那樣約束yi(vTxi+b)≥1-ξi…………(20)為了最優(yōu),將式(21)給出的目標(biāo)函數(shù)最優(yōu)化1/2‖v‖2+C∑ξi…………(21)其中C是指定放松約束的范圍的系數(shù)。用于C的數(shù)值必須通過(guò)試驗(yàn)來(lái)確定。涉及拉格朗日因子α的問(wèn)題被轉(zhuǎn)變?yōu)橄率?22)。約束由下式(23)給出。maxΣai-1/2αiαjyiyjxiTxj------(22)]]>約束0≤αi≤C,∑αiyi=0 ………(23)然而,對(duì)于上述操作,不能解決非線性問(wèn)題。所以,引入是非線性映射函數(shù)的核函數(shù)K(x,x’),數(shù)據(jù)在高維空間中被映射一次并且在該空間中線性分離。因而,數(shù)據(jù)可以被處理為按原維數(shù)線性地分離。使用映射Φ,可以通過(guò)下式(24)給出核函數(shù),并且由下式(25)給出判別函數(shù)。
K(x,x’)=Φ(x)TΦ(x’) …………(24)f(Φ(x))=vTΦ(x)+b=∑αiyiK(x,xi)+b…………(25)外部函數(shù)是通過(guò)計(jì)算由下式(26)給出的函數(shù)學(xué)習(xí)的,其約束由下式(27)給出max∑ai-1/2∑αiαjyiyjK(xi,xj) ……(26)約束0≤αi≤C,∑αiyi=0 ……(27)該核函數(shù)可以是由下式(28)給出的高斯核函數(shù)K(x,x′)=exp(-|x-x′|2σ2)-------(28)]]>動(dòng)作可以根據(jù)上述原理通過(guò)SVM來(lái)分類(lèi)。
在上述說(shuō)明中,已經(jīng)描述了機(jī)器人1根據(jù)關(guān)節(jié)單元的狀態(tài)學(xué)習(xí)外力的情況。然而,也可以?xún)H根據(jù)關(guān)節(jié)的狀態(tài)通過(guò)檢測(cè)作用于機(jī)器人1上的外力來(lái)進(jìn)行學(xué)習(xí)。為此,機(jī)器人1包括檢測(cè)移動(dòng)運(yùn)動(dòng)部件的關(guān)節(jié)的狀態(tài)的檢測(cè)器,和根據(jù)關(guān)節(jié)狀態(tài)檢測(cè)器檢測(cè)的關(guān)節(jié)狀態(tài)檢測(cè)作用于運(yùn)動(dòng)部件上的外力的檢測(cè)器。這些檢測(cè)器可以是圖28所示的檢測(cè)器153。
按上述方式構(gòu)成的機(jī)器人1可以根據(jù)關(guān)節(jié)的狀態(tài)檢測(cè)已經(jīng)施加給關(guān)節(jié)的外力。關(guān)節(jié)狀態(tài)檢測(cè)器和外力檢測(cè)器可以通過(guò)例如軟件或目標(biāo)程序來(lái)實(shí)施。因此,機(jī)器人1可以不用專(zhuān)用檢測(cè)器(硬件)檢測(cè)施加給它的外力。也可以說(shuō)成是機(jī)器人1不使用任何特定元件就可以學(xué)習(xí)外力。
需要注意的是,上述機(jī)器人1中的外力檢測(cè)系統(tǒng)是所謂的外力檢測(cè)器。該外力檢測(cè)系統(tǒng)當(dāng)然可以被應(yīng)用于除機(jī)器人1之外的其它裝置。
在該實(shí)施例中,供應(yīng)給形成腿部單元3A至3D的關(guān)節(jié)的電動(dòng)機(jī)的PWM脈沖信號(hào)和供應(yīng)給形成身體單元2和頭部單元4的關(guān)節(jié)的電動(dòng)機(jī)的PWM脈沖信號(hào)被用于學(xué)習(xí)外力。然而,本發(fā)明不局限于這些PWM脈沖信號(hào),供應(yīng)給形成任何其他關(guān)節(jié)的電動(dòng)機(jī)的PWM脈沖信號(hào)也可以被使用。
此外,在上述說(shuō)明中,已經(jīng)描述了用于學(xué)習(xí)外力的PWM脈沖信號(hào)。然而,本發(fā)明不局限于任何PWM脈沖信號(hào),也可以將依據(jù)外力變化的信號(hào)用于學(xué)習(xí)該外力。
(4-4)識(shí)別語(yǔ)音信號(hào)(語(yǔ)音識(shí)別單元的詳細(xì)說(shuō)明)下面,將詳細(xì)說(shuō)明語(yǔ)音信號(hào)的識(shí)別。為了識(shí)別語(yǔ)音信號(hào),如圖33所示,機(jī)器人1包括語(yǔ)音(聲音)信號(hào)輸入單元121;特征提取器122和HMM單元123。特征提取器122和HMM單元123被包含在語(yǔ)音識(shí)別單元101中,如圖15所示。
聲音信號(hào)輸入單元121被供應(yīng)機(jī)器人1周?chē)穆曇?。即,例如,該單元是上述的麥克風(fēng)23。來(lái)自聲音信號(hào)輸入單元121的聲音信號(hào)(語(yǔ)音信號(hào))被輸出給特征提取器122。
特征提取器122檢測(cè)聲音信號(hào)的特征,并將檢測(cè)的特征輸出給下游HMM單元123。
HMM單元123采用根據(jù)檢測(cè)的特征分類(lèi)輸入的聲音信號(hào)的隱含馬爾可夫模型。例如,它根據(jù)多個(gè)類(lèi)別識(shí)別聲音信號(hào)。然后,HMM單元123輸出根據(jù)每一個(gè)類(lèi)別識(shí)別的結(jié)果為相應(yīng)于每個(gè)字類(lèi)別的概率,例如作為矢量值。
使用上述部件,機(jī)器人1識(shí)別來(lái)自麥克風(fēng)23或類(lèi)似物的輸入語(yǔ)音為音素序列。
然后將語(yǔ)音識(shí)別單元101的HMM單元識(shí)別的語(yǔ)言信息[S0,S1,S2]和已經(jīng)由傳感器數(shù)據(jù)處理器102獲取的關(guān)于運(yùn)動(dòng)的信息[V0,V1,V2,V3,V4]一起供應(yīng)給圖34所示的關(guān)聯(lián)存儲(chǔ)器/檢索存儲(chǔ)器104。
在學(xué)習(xí)中,關(guān)聯(lián)存儲(chǔ)器檢/索存儲(chǔ)器104相互關(guān)聯(lián)地存儲(chǔ)上述信息。學(xué)習(xí)之后,關(guān)聯(lián)存儲(chǔ)器/檢索存儲(chǔ)器104將根據(jù)輸入信息輸出動(dòng)作信息,例如,矢量值形式的動(dòng)作信息[B0,B1,B2,B3]。
如圖35所示,例如,在作為語(yǔ)音識(shí)別結(jié)果的語(yǔ)言“向后”和作為動(dòng)作獲取結(jié)果的矢量
已經(jīng)被供應(yīng)給關(guān)聯(lián)存儲(chǔ)器/檢索存儲(chǔ)器104用于學(xué)習(xí)的情況下,如果在學(xué)習(xí)之后將發(fā)出的語(yǔ)言“向后”供應(yīng)給關(guān)聯(lián)存儲(chǔ)器/檢索存儲(chǔ)器104,則關(guān)聯(lián)存儲(chǔ)器/檢索存儲(chǔ)器104將輸出用于“向后”運(yùn)動(dòng)的動(dòng)作信息
。
在上述說(shuō)明中,已經(jīng)說(shuō)明了機(jī)器人1通過(guò)關(guān)聯(lián)檢索進(jìn)行的學(xué)習(xí)。下面將描述通過(guò)便于識(shí)別目標(biāo)對(duì)象的共享關(guān)注來(lái)進(jìn)行的學(xué)習(xí)。
(5)共享關(guān)注學(xué)習(xí)語(yǔ)音或圖像的機(jī)器人1被設(shè)計(jì)用來(lái)根據(jù)背景噪聲識(shí)別特定語(yǔ)音或圖像,并取作目標(biāo)對(duì)象。共享關(guān)注便于識(shí)別這樣的目標(biāo)對(duì)象。例如,通過(guò)生成受訓(xùn)者(機(jī)器人1)可以根據(jù)其指定目標(biāo)對(duì)象的刺激,比如震動(dòng)或搖擺目標(biāo)對(duì)象(視覺(jué)刺激)或發(fā)音(聲音刺激),能夠形成共享關(guān)注。
對(duì)于共享關(guān)注,如圖36所示,機(jī)器人1包括圖像信號(hào)輸入單元131;分段單元132和目標(biāo)對(duì)象檢測(cè)器133。分段單元132和目標(biāo)對(duì)象檢測(cè)器133的功能是識(shí)別目標(biāo)對(duì)象。上述的動(dòng)作生成器105根據(jù)如此識(shí)別并存儲(chǔ)在關(guān)聯(lián)存儲(chǔ)器/檢索存儲(chǔ)器104中的目標(biāo)對(duì)象信息和新對(duì)象的信息提供動(dòng)作。
圖像信號(hào)輸入單元131拍攝機(jī)器人1的周?chē)h(huán)境。具體地說(shuō),該單元是如圖8所示的CCD攝像機(jī)20。來(lái)自圖像信號(hào)輸入單元131的圖像信號(hào)被供應(yīng)給分段單元132。
分段單元132對(duì)圖像信號(hào)進(jìn)行分段,例如,根據(jù)顏色分段?!胺侄巍笔怯糜谧R(shí)別圖像中的區(qū)域和檢查該區(qū)域的特征或者映射特征空間中的特征。分段能夠辨別目標(biāo)對(duì)象和拾取的圖像中的背景。由分段單元132如此分段的圖像信號(hào)被供應(yīng)給下游的目標(biāo)對(duì)象檢測(cè)器133。
目標(biāo)對(duì)象檢測(cè)器133從上述分段的圖像信息中檢測(cè)(識(shí)別)顯著的部分(目標(biāo)對(duì)象)。檢測(cè)器133檢測(cè)例如運(yùn)動(dòng)部分,也就是隨時(shí)間改變的部分,作為當(dāng)該部分滿(mǎn)足一定需求時(shí)的來(lái)自分段圖像的目標(biāo)對(duì)象。下面將進(jìn)一步說(shuō)明目標(biāo)對(duì)象的檢測(cè)。
首先,為分段圖像中的特定區(qū)域的運(yùn)動(dòng)部分(隨時(shí)間變化部分)設(shè)置注意量級(jí)?!白⒁饬考?jí)”是目標(biāo)對(duì)象識(shí)別的索引。當(dāng)根據(jù)運(yùn)動(dòng)識(shí)別目標(biāo)對(duì)象時(shí),該注意量級(jí)將隨該運(yùn)動(dòng)而變化。
該特定區(qū)域被跟蹤,以便根據(jù)其注意量級(jí)判斷它是否是目標(biāo)對(duì)象。當(dāng)注意量級(jí)滿(mǎn)足一定需求時(shí),機(jī)器人1將該特定區(qū)域識(shí)別為目標(biāo)對(duì)象,即,使機(jī)器人1“注意”它。
為了識(shí)別與其運(yùn)動(dòng)相一致的目標(biāo)對(duì)象,當(dāng)使一條狗注意該目標(biāo)對(duì)象時(shí),該真狗或類(lèi)似物的訓(xùn)練者將搖動(dòng)或擺動(dòng)該目標(biāo)對(duì)象吸引狗的注意。例如,當(dāng)教導(dǎo)受訓(xùn)者“玻璃杯”時(shí),訓(xùn)練者將搖動(dòng)它,同時(shí)向受訓(xùn)者發(fā)出“玻璃杯”的聲音。
目標(biāo)對(duì)象檢測(cè)器133跟蹤特定區(qū)域,當(dāng)其注意量級(jí)像預(yù)定的那樣,即,當(dāng)運(yùn)動(dòng)改變預(yù)定量時(shí),目標(biāo)對(duì)象檢測(cè)器133將特定區(qū)域識(shí)別為目標(biāo)對(duì)象,使機(jī)器人1關(guān)注該特定區(qū)域。具體地說(shuō),當(dāng)注意量級(jí)等于或超過(guò)閾值時(shí),機(jī)器人1將關(guān)注該特定區(qū)域。
如上所述,目標(biāo)對(duì)象檢測(cè)器133借助分段單元132設(shè)置用于特定區(qū)域的注意量級(jí),以檢測(cè)(識(shí)別)目標(biāo)對(duì)象。
圖像信號(hào)輸入單元131包括能夠使機(jī)器人1進(jìn)行共享關(guān)注的分段單元132和目標(biāo)對(duì)象檢測(cè)器133。
因此,如上所述,機(jī)器人1能夠恰當(dāng)?shù)刈R(shí)別目標(biāo)對(duì)象,以恰當(dāng)?shù)嘏c圖像信息或動(dòng)作相關(guān)聯(lián)地學(xué)習(xí)它。
在上述實(shí)施例中,目標(biāo)對(duì)象是根據(jù)由機(jī)器人1共享關(guān)注中的目標(biāo)對(duì)象的運(yùn)動(dòng)來(lái)識(shí)別的。然而,本發(fā)明不局限于該識(shí)別方式。例如,可以根據(jù)語(yǔ)音識(shí)別目標(biāo)對(duì)象。在此情況下,當(dāng)語(yǔ)音出現(xiàn)時(shí),機(jī)器人1將注意力集中到該語(yǔ)音的起源,并將該語(yǔ)音識(shí)別為目標(biāo)對(duì)象。例如,設(shè)置用于語(yǔ)音,即,該語(yǔ)音的方向和該語(yǔ)音的音量的注意量級(jí),并且當(dāng)該方向和音量滿(mǎn)足一定要求時(shí)將該語(yǔ)音識(shí)別為目標(biāo)對(duì)象。
此外,對(duì)目標(biāo)對(duì)象的關(guān)注可以隨時(shí)間消逝而減弱。作為選擇,也可以設(shè)置為,當(dāng)與目標(biāo)對(duì)象的關(guān)聯(lián)變得平穩(wěn)時(shí)減弱對(duì)該目標(biāo)對(duì)象的關(guān)注。由此能夠關(guān)注新的刺激(圖像輸入和語(yǔ)音輸入)并且觸發(fā)(開(kāi)始)學(xué)習(xí)。
另外,可以將較大的數(shù)值設(shè)置為當(dāng)在一定條件下、例如隨著時(shí)間消逝對(duì)目標(biāo)對(duì)象的注意較弱時(shí)的閾值。此外,可以在同一時(shí)間為兩個(gè)或多個(gè)目標(biāo)對(duì)象設(shè)置注意量級(jí)。該注意量級(jí)可以被設(shè)置給對(duì)象的運(yùn)動(dòng)或語(yǔ)音。例如,可以為一個(gè)對(duì)象設(shè)置運(yùn)動(dòng)的注意量級(jí),同時(shí)為另一個(gè)對(duì)象設(shè)置語(yǔ)音的注意量級(jí)。
因而,當(dāng)一個(gè)被注意的對(duì)象(特定區(qū)域)正在被檢查(例如,正在檢查諸如顏色、形狀等的特征)的時(shí)候,可以通過(guò)另一個(gè)刺激(例如語(yǔ)音或圖像)為任何其它對(duì)象設(shè)置注意量級(jí)。應(yīng)當(dāng)注意的是,由于當(dāng)前正在注意的對(duì)象具有如上所述的較高的注意量級(jí),因此即使在通過(guò)另一個(gè)刺激為另一個(gè)對(duì)象設(shè)置注意量級(jí)時(shí),也可以連續(xù)檢查事先選擇的對(duì)象片刻。
當(dāng)目前正在注意的對(duì)象的注意度已經(jīng)減弱時(shí),機(jī)器人1的關(guān)注可以轉(zhuǎn)到具有另一個(gè)刺激的對(duì)象,即,其注意度已經(jīng)增加的對(duì)象。
此外,可以用目標(biāo)對(duì)象的運(yùn)動(dòng)作為刺激、以及用用戶(hù)或訓(xùn)練者的手指作為刺激來(lái)實(shí)施共享關(guān)注。也就是說(shuō),手指指點(diǎn)的對(duì)象可以被識(shí)別為目標(biāo)對(duì)象。
上述的共享關(guān)注是按照人與人之間的正常交互提出的。在此情況下,例如經(jīng)過(guò)分段檢測(cè)的皮膚顏色區(qū)域被取作特定區(qū)域,并且關(guān)注該區(qū)域。下面結(jié)合圖37進(jìn)行說(shuō)明。
如圖37所示,假定已經(jīng)在一種環(huán)境中拾取了其中一個(gè)人用手142指向錐形物141的圖像。需要說(shuō)明的是,在下面將要說(shuō)明的處理中,一個(gè)對(duì)象可以經(jīng)歷一次圖像處理,例如,考慮到計(jì)算速度等,為圖像處理提供一個(gè)低通濾波器。
皮膚顏色部分從圖像中提取。在此情況下,顏色特征空間被用來(lái)檢測(cè)皮膚顏色部分的特征,并且從該圖像中提取皮膚顏色部分。因而,如圖37B所示,手142被提取。
然后,如圖37C所示,確定手142的縱向方向,因?yàn)橹赶驅(qū)ο蟮氖值男螤钔ǔJ情L(zhǎng)方形的。例如,縱向方向被確定為如圖37C的直線143所指示的那樣。
此外,如此確定的縱向方向在如圖37D所示的原始圖像中被設(shè)置,以識(shí)別如圖37E所示的對(duì)象。也就是,手指所指的錐形物141被識(shí)別。例如,手指端部的圖像被取下作為一個(gè)樣本,在顏色特征空間中識(shí)別圖像的顏色,從而識(shí)別具有該顏色的區(qū)域。由此,能夠識(shí)別具有相同顏色,例如黃色的錐形物141。
此外,共享關(guān)注不局限于上述的情況,也可以是關(guān)注例如訓(xùn)練者或用戶(hù)的視線所達(dá)到的對(duì)象。
此外,可以提供用于檢查機(jī)器人1是否進(jìn)行共享關(guān)注的裝置。也就是,當(dāng)目標(biāo)對(duì)象被共享關(guān)注識(shí)別時(shí),機(jī)器人1作出預(yù)定動(dòng)作。例如,當(dāng)機(jī)器人1已經(jīng)識(shí)別(跟蹤)為教導(dǎo)機(jī)器人1而搖動(dòng)的對(duì)象時(shí),可以使機(jī)器人1作出諸如搖動(dòng)或點(diǎn)頭的動(dòng)作,從而通知用戶(hù)或訓(xùn)練者機(jī)器人1已經(jīng)識(shí)別了該對(duì)象。因此,訓(xùn)練者或用戶(hù)能夠確認(rèn)機(jī)器人1是否已經(jīng)成功跟蹤或者識(shí)別訓(xùn)練者為了教導(dǎo)而向機(jī)器人1顯示的對(duì)象。
如上所述,機(jī)器人1可以通過(guò)這樣的與用戶(hù)或訓(xùn)練者的交互作用估價(jià)它自己的動(dòng)作,并且自己學(xué)習(xí)最適當(dāng)?shù)膭?dòng)作。
此外,機(jī)器人1可以相互關(guān)聯(lián)地存儲(chǔ)動(dòng)作和其它任何刺激,比如對(duì)于傳感器的語(yǔ)音,以便僅響應(yīng)該語(yǔ)音進(jìn)行動(dòng)作。
下面將結(jié)合圖38詳細(xì)說(shuō)明關(guān)聯(lián)存儲(chǔ)器系統(tǒng)。圖38所示的關(guān)聯(lián)存儲(chǔ)器系統(tǒng)被設(shè)計(jì)來(lái)存儲(chǔ)和檢索四個(gè)感覺(jué)通道輸入圖案(pattern)(顏色、形狀,語(yǔ)音和本能)。正如將從圖38所看到的那樣,某些圖案和原型被事先準(zhǔn)備,用于進(jìn)入包括顏色識(shí)別單元201、形狀識(shí)別單元202和語(yǔ)音識(shí)別單元203的每一個(gè)通道,并且例如將二進(jìn)制ID(識(shí)別信息)附加在每個(gè)原型上。識(shí)別單元201至203的每一個(gè)識(shí)別輸入圖案對(duì)應(yīng)哪一個(gè)原型,并且向關(guān)聯(lián)存儲(chǔ)器210的短期存儲(chǔ)器211輸出輸入圖案,即,顏色原型、形狀原型和語(yǔ)音原型的ID。來(lái)自語(yǔ)音識(shí)別單元203的語(yǔ)音原型ID經(jīng)過(guò)語(yǔ)義轉(zhuǎn)換器(SC)204到達(dá)短期存儲(chǔ)器211,與此同時(shí)音素信號(hào)也送入該短期存儲(chǔ)器211。語(yǔ)義變換器(SC)204作出語(yǔ)義和語(yǔ)法標(biāo)記。至于本能,本能狀態(tài)模型(ISM)單元205提供本能(例如,好奇心)的變化(δ值),作為輸入給關(guān)聯(lián)存儲(chǔ)器210的短期存儲(chǔ)器211的模擬值。
關(guān)聯(lián)存儲(chǔ)器210包括短期存儲(chǔ)器211,長(zhǎng)期存儲(chǔ)器212和關(guān)注存儲(chǔ)器213。此外,在關(guān)聯(lián)存儲(chǔ)器系統(tǒng)中,提供了與短期存儲(chǔ)器211關(guān)聯(lián)的釋放機(jī)構(gòu)(RM)221和舉止網(wǎng)絡(luò)(BeNet)222。RM(釋放機(jī)構(gòu))221和BeNet(舉止網(wǎng)絡(luò))222也被稱(chēng)作“動(dòng)作生成器”。
在圖38所示的關(guān)聯(lián)存儲(chǔ)器系統(tǒng)中,顏色識(shí)別單元201將顏色原型ID附加到由顏色分段模塊分段的每一個(gè)對(duì)象上,并且將數(shù)據(jù)供應(yīng)給關(guān)聯(lián)存儲(chǔ)器210。語(yǔ)音識(shí)別單元203輸出由用戶(hù)或訓(xùn)練者發(fā)音的字的原型ID,并將它與發(fā)音的音素序列一同發(fā)送給關(guān)聯(lián)存儲(chǔ)器210。因而,該存儲(chǔ)和關(guān)聯(lián)能夠使機(jī)器人1發(fā)出字音。來(lái)自每個(gè)通道的輸入信息被存儲(chǔ)在關(guān)聯(lián)存儲(chǔ)器210中的短期存儲(chǔ)器211中,并且保持預(yù)定時(shí)間,例如保持相當(dāng)于一百個(gè)對(duì)象的時(shí)間。
關(guān)聯(lián)存儲(chǔ)器210檢索過(guò)去是否已經(jīng)存儲(chǔ)了輸入圖案。如果關(guān)聯(lián)存儲(chǔ)器210可以檢索它,則將該輸入圖案按照原樣發(fā)送給RM 221和BeNet 222。當(dāng)關(guān)聯(lián)存儲(chǔ)器221可以檢索該輸入圖案時(shí),將一個(gè)檢索方向附加到輸入圖案上,并且將數(shù)據(jù)發(fā)送給RM 221和BeNet 222。
BeNet 222檢查來(lái)自顏色識(shí)別單元201的顏色分段模塊的標(biāo)志(共享關(guān)注標(biāo)志),轉(zhuǎn)換成鎖存命令,而不論是否存在用戶(hù)按上述方式用手指作出的共享關(guān)注,并且將該鎖存命令發(fā)送給關(guān)聯(lián)存儲(chǔ)器210。由于從BeNet 222供應(yīng)了鎖存命令,因此關(guān)聯(lián)存儲(chǔ)器210基于幀數(shù)搜索與該幀數(shù)匹配的對(duì)象,并且將該對(duì)象存儲(chǔ)到關(guān)注存儲(chǔ)器中。如果本能的δ值足夠大,則將它從關(guān)注存儲(chǔ)器213存儲(chǔ)到長(zhǎng)期存儲(chǔ)器212。本能的δ值可以取模擬值,例如0至100。通過(guò)存儲(chǔ)80的δ值,可以檢索數(shù)值80。
下面將結(jié)合圖39詳細(xì)說(shuō)明關(guān)聯(lián)存儲(chǔ)器,圖39示出兩層分層神經(jīng)網(wǎng)絡(luò)的一個(gè)實(shí)例。圖39所示的實(shí)例是競(jìng)爭(zhēng)學(xué)習(xí)網(wǎng)絡(luò),包括作為第一層的輸入層231和作為第二層的競(jìng)爭(zhēng)層232,其中輸入層231的第i單元(神經(jīng)元)與競(jìng)爭(zhēng)層232的第j單元之間的相關(guān)加權(quán)是Wji。該競(jìng)爭(zhēng)學(xué)習(xí)網(wǎng)絡(luò)以?xún)煞N模式工作存儲(chǔ)和檢索。在存儲(chǔ)模式中,競(jìng)爭(zhēng)地存儲(chǔ)輸入圖案;在檢索模式中,從部分輸入圖案中檢索過(guò)去存儲(chǔ)的圖案。在輸入側(cè)提供有與顏色、形狀、語(yǔ)音和本能的輸入x1,x2,…,xm相對(duì)應(yīng)的m個(gè)神經(jīng)元。例如,當(dāng)提供20個(gè)神經(jīng)元用于顏色原型ID、形狀原型ID和語(yǔ)音原型ID的每一種以及提供6個(gè)神經(jīng)元用于本能類(lèi)型時(shí),該神經(jīng)元總計(jì)為66個(gè)(20+20+20+6)。競(jìng)爭(zhēng)層232中的每個(gè)神經(jīng)元描述一個(gè)符號(hào),競(jìng)爭(zhēng)層232中的神經(jīng)元的數(shù)量等于可以被存儲(chǔ)的神經(jīng)元或圖案的數(shù)量。在競(jìng)爭(zhēng)學(xué)習(xí)網(wǎng)絡(luò)中,原型ID和本能類(lèi)型可以被組合成48,000個(gè)圖案(=20×20×20×6)。例如,事實(shí)上在競(jìng)爭(zhēng)學(xué)習(xí)網(wǎng)絡(luò)中應(yīng)當(dāng)提供約300個(gè)神經(jīng)元。
下面解釋存儲(chǔ)模式。假定輸入層231與競(jìng)爭(zhēng)層232之間的加權(quán)Wji取0至1之間的值。最初的關(guān)聯(lián)加權(quán)是隨機(jī)確定的。存儲(chǔ)(儲(chǔ)存)是通過(guò)選擇在競(jìng)爭(zhēng)層中競(jìng)爭(zhēng)獲勝的神經(jīng)元并且通過(guò)增加所選神經(jīng)元與輸入神經(jīng)元之間的關(guān)聯(lián)的強(qiáng)度(force)(關(guān)聯(lián)加權(quán)Wji)完成的。當(dāng)為輸入圖案矢量[x1,x2,…xn]識(shí)別相應(yīng)于例如神經(jīng)元x1的原型ID(第一顏色原型ID)時(shí),該神經(jīng)元x1被觸發(fā),然后將順序觸發(fā)為形狀和語(yǔ)音按上述相同方式識(shí)別的神經(jīng)元。觸發(fā)的神經(jīng)元取值“+1”,而未被觸發(fā)的神經(jīng)元取值為“-1”。
通過(guò)計(jì)算下式(29)在輸入側(cè)為神經(jīng)元x1確定輸出(競(jìng)爭(zhēng))神經(jīng)元yj的值yi=Σi=0numOfInputWjiXi-------(29)]]>此外,依據(jù)下式確定將贏得競(jìng)爭(zhēng)的神經(jīng)元max{yi}獲勝神經(jīng)元與輸入神經(jīng)元之間的關(guān)聯(lián)根據(jù)下列Kohonen更新規(guī)則進(jìn)行更新ΔWji=α(x1-Wji)其中α學(xué)習(xí)系數(shù)Wji(new)=ΔWji+Wji(old)用L2Norm歸一化結(jié)果,以提供下式(30)Wji(new)=Wji(new)Σi=0numOfInputWji2--------(30)]]>關(guān)聯(lián)加權(quán)指示所謂的學(xué)習(xí)本能,并且是一個(gè)“存儲(chǔ)(memory)”。
在該競(jìng)爭(zhēng)學(xué)習(xí)網(wǎng)絡(luò)中,學(xué)習(xí)系數(shù)是α=0.5。當(dāng)相似的圖案順序地出現(xiàn)在網(wǎng)絡(luò)上時(shí),可以檢索曾經(jīng)存儲(chǔ)過(guò)的圖案,并且?guī)缀鯖](méi)有失敗。
需要說(shuō)明的是,關(guān)聯(lián)存儲(chǔ)應(yīng)當(dāng)是在連續(xù)學(xué)習(xí)的處理中,頻繁存儲(chǔ)的圖案的存儲(chǔ)將更強(qiáng),而不頻繁存儲(chǔ)的圖案的存儲(chǔ)將更弱。在本實(shí)施例中采用這樣的關(guān)聯(lián)存儲(chǔ)。也就是,通過(guò)調(diào)整學(xué)習(xí)系數(shù)和關(guān)聯(lián)存儲(chǔ)可以調(diào)整該存儲(chǔ)。例如,當(dāng)為圖案設(shè)置小系數(shù)時(shí),需要一個(gè)用于相對(duì)強(qiáng)存儲(chǔ)的出現(xiàn)時(shí)間(epoch)。此外,能夠相應(yīng)于出現(xiàn)時(shí)間降低學(xué)習(xí)系數(shù),例如,降低當(dāng)出現(xiàn)時(shí)間較大時(shí)為圖案初始設(shè)置的大學(xué)習(xí)系數(shù)。因而,未經(jīng)常出現(xiàn)的圖案的存儲(chǔ)不需要更新許多次,對(duì)于存儲(chǔ)將成為待定的結(jié)果,將檢索不同于已經(jīng)存儲(chǔ)的圖案的圖案,或者不能達(dá)到用于檢索的檢索閾值。然而,由于不能夠獲得新符號(hào)或圖案,因此靈活的關(guān)聯(lián)存儲(chǔ)系統(tǒng)可以被實(shí)施,即使其容量受到限制。
下面將解釋檢索模式。
假定某些輸入圖案矢量[x1,x2,…xn]出現(xiàn)在關(guān)聯(lián)存儲(chǔ)系統(tǒng)。輸入矢量可以是原型ID或原型ID的似然或概率。輸出(競(jìng)爭(zhēng))神經(jīng)元yj的值通過(guò)計(jì)算關(guān)于輸入側(cè)的神經(jīng)元xi的上式(29)來(lái)確定。根據(jù)每個(gè)通道的似然,競(jìng)爭(zhēng)神經(jīng)元的觸發(fā)值也描述似然。重要的是,來(lái)自多個(gè)通道的似然輸入可以連結(jié)在一起,以確定一般似然。在該實(shí)施例中,只檢索一個(gè)圖案,并且通過(guò)計(jì)算下式確定獲勝神經(jīng)元max{yj}如此確定的神經(jīng)元的編號(hào)對(duì)應(yīng)于符號(hào)的編號(hào),并且通過(guò)逆矩陣的計(jì)算檢索輸入圖案,也就是Y=W·XX=W-1·Y=WT·Y下面將說(shuō)明輸入圖案出現(xiàn)和耦合系數(shù)的編號(hào)。
在該實(shí)施例中,將學(xué)習(xí)系數(shù)設(shè)置高數(shù)值,然后立刻著手存儲(chǔ)已出現(xiàn)的圖案。學(xué)習(xí)嘗試的次數(shù)和此刻的耦合系數(shù)之間的關(guān)系被檢查。還可以通過(guò)計(jì)算上式(29)確定輸入圖案與競(jìng)爭(zhēng)層中符號(hào)神經(jīng)元之間的耦合系數(shù)。
圖40示出被輸入圖案激活的神經(jīng)元與已經(jīng)獲得符號(hào)的競(jìng)爭(zhēng)層中的神經(jīng)元之間的關(guān)系(激活輸入,active input),和未被激活的神經(jīng)元與關(guān)聯(lián)層中的神經(jīng)元之間的關(guān)系(未激活輸入)。在圖40中,水平軸指示出現(xiàn)時(shí)間,而垂直軸指示激活。正如從圖40看到的那樣,在激活輸入的情況下,出現(xiàn)時(shí)間越大,輸入圖案與符號(hào)神經(jīng)元之間的關(guān)聯(lián)就變得越強(qiáng)。這是因?yàn)?,在第一出現(xiàn)時(shí)間,較大地更新了該存儲(chǔ),以便在第二出現(xiàn)時(shí)間,突然增強(qiáng)該關(guān)聯(lián)。通過(guò)設(shè)置較低的學(xué)習(xí)系數(shù)將得到平穩(wěn)的激活輸入的曲線。然而,在未激活輸入的情況下,與未被新圖案激活的神經(jīng)元的關(guān)聯(lián)較弱。
需要說(shuō)明的是,建立關(guān)聯(lián)存儲(chǔ)系統(tǒng)應(yīng)當(dāng)考慮出現(xiàn)時(shí)間以及頻繁出現(xiàn)的圖案的出現(xiàn)頻度,該頻繁出現(xiàn)的圖案最好根據(jù)優(yōu)先原理被存儲(chǔ),因?yàn)榇鎯?chǔ)容量是固定的(有限的)。關(guān)于這一點(diǎn),最好引入遺忘函數(shù)。例如,因諸如來(lái)自識(shí)別單元的噪聲之類(lèi)的非線性因素而造成已經(jīng)錯(cuò)誤存儲(chǔ)的圖案僅出現(xiàn)一次,但也許不能被存儲(chǔ),并且更優(yōu)先地存儲(chǔ)新近出現(xiàn)的重要圖案,同時(shí)遺忘出現(xiàn)時(shí)間短和出現(xiàn)頻度低的圖案。
應(yīng)當(dāng)注意的是,在該實(shí)施例中,學(xué)習(xí)系數(shù)被固定,并且根據(jù)閾值檢驗(yàn)輸入圖案是否是新的,但是可以改變?cè)搶W(xué)習(xí)系數(shù)并且將它公式化以確定閾值。
下面將說(shuō)明對(duì)許多輸入圖案的響應(yīng)。
表1中示出當(dāng)各種圖案被供應(yīng)給關(guān)聯(lián)存儲(chǔ)系統(tǒng)時(shí),對(duì)其操作進(jìn)行檢驗(yàn)的結(jié)果。
表1
在表1中,顏色、形狀、語(yǔ)音和本能中每一個(gè)的原型ID用如1,2,…的數(shù)字指示,而被檢索的原型ID則用加括號(hào)的數(shù)字如(1),(2),…指示。
正如將從表2中可以看到的那樣,在最初存儲(chǔ)輸入圖案[1,1,1,1]之后,當(dāng)顏色“1”和形狀“3”被第五出現(xiàn)供應(yīng)時(shí),只根據(jù)顏色1檢索圖案[1,3,(1),(1)]。然而,對(duì)于圖案[1,3,3,1]被第六出現(xiàn)存儲(chǔ)之后的第七出現(xiàn)來(lái)說(shuō),則響應(yīng)顏色“1”和形狀“3”的輸入檢索圖案[1,3(3),(1)]。
當(dāng)存儲(chǔ)容量是20個(gè)符號(hào)時(shí),正常地存儲(chǔ)如表2所示的20種輸入圖案,但是當(dāng)出現(xiàn)如表3所示的多于20種輸入圖案(總共400種圖案)時(shí),將改寫(xiě)早期存儲(chǔ)的如[1,1,1,1]的符號(hào),同時(shí)將作為一個(gè)存儲(chǔ)保持后來(lái)學(xué)習(xí)的圖案。
表2
表3
如表3所示,只能獲得(保持)在最后學(xué)習(xí)的符號(hào)之前學(xué)習(xí)的20個(gè)符號(hào)。
假定一個(gè)符號(hào)是否是新符號(hào)是根據(jù)條件“一個(gè)輸入圖案,其中兩個(gè)或多個(gè)神經(jīng)元在激活方面是不同的”來(lái)進(jìn)行判斷的,對(duì)例如顏色和形狀的任何一個(gè)彼此不同的多個(gè)事物不能彼此一致地命名。然而,在這些事物其顏色和形狀都互不相同的情況下,它們可以被彼此一致地命名。也就是說(shuō),圖案[1,1,1,1]和[2,1,1,1]不能被同時(shí)存儲(chǔ),而圖案[1,1,1,1]和[2,2,1,1]可以被同時(shí)存儲(chǔ)。在此情況下,可以存儲(chǔ)如表4的輸入圖案。
表4
在上面已經(jīng)描述的關(guān)聯(lián)存儲(chǔ)系統(tǒng)中,由于存儲(chǔ)容量被限制,因此應(yīng)該有效利用。為此目的,頻繁出現(xiàn)或使用的圖案最好應(yīng)當(dāng)優(yōu)先存儲(chǔ)。
此外,最好是,出于存儲(chǔ)容量的考慮,它應(yīng)當(dāng)做到能夠遺忘未被存儲(chǔ)的圖案,而存儲(chǔ)重要的新輸入圖案。為此,應(yīng)當(dāng)使用下面的耦合系數(shù)遺忘函數(shù)fWnew=f(Wold)其中Wnew是新的耦合系數(shù),Wold是舊耦合系數(shù)。最簡(jiǎn)單的遺忘函數(shù)是每當(dāng)出現(xiàn)一個(gè)圖案時(shí),減少與競(jìng)爭(zhēng)層中失敗神經(jīng)元的耦合系數(shù)。例如,新耦合系數(shù)Wnew可以按使用舊耦合系數(shù)Wold和遺忘耦合系數(shù)Wforget的下式來(lái)確定Wnew=f(Wold)=Wold-Wforget由此,可以減弱與未出現(xiàn)的圖案的耦合,并且能夠遺忘不頻繁使用的不重要的圖案。對(duì)于具有人類(lèi)特點(diǎn)的機(jī)器人,它是自然的,并且最好根據(jù)人類(lèi)大腦生理學(xué)領(lǐng)域的研究結(jié)果設(shè)置遺忘函數(shù)f。
該實(shí)施例已經(jīng)對(duì)字(名詞)的存儲(chǔ)作了說(shuō)明。然而,它最好考慮存儲(chǔ)意圖和一段情節(jié)以及獲得動(dòng)詞。例如,通過(guò)獲取“踢”的動(dòng)作來(lái)獲得字“踢”。
為了判斷輸入圖案是否是新的,將為競(jìng)爭(zhēng)層中獲勝神經(jīng)元的激活設(shè)置閾值。然而,由于它必需重新調(diào)整該激活,作為輸入通道增加的數(shù)量,因此最好在例如執(zhí)行程序的進(jìn)程中自動(dòng)計(jì)算激活。
此外,在輸入通道數(shù)已經(jīng)增加到多模態(tài)的情況下,最好考慮每個(gè)通道的歸一化。
下面將說(shuō)明本發(fā)明的機(jī)器人的舉止,涉及38中的ISM(內(nèi)部狀態(tài)模型)單元205。也就是,在應(yīng)用行為學(xué)方法決定舉止的機(jī)器人中,根據(jù)下面將要詳細(xì)說(shuō)明的外因因素和內(nèi)因因素實(shí)現(xiàn)用于檢查動(dòng)作創(chuàng)建的操作檢驗(yàn)。
在該實(shí)施例中,分別使用了八種用于內(nèi)部狀態(tài)的樣板(gauge)和對(duì)應(yīng)于這八種樣板的八種本能。這八種樣板包括Nourishment(食物),Movement(運(yùn)動(dòng)),Urine(尿),Tiredness(疲倦),Affection(友愛(ài)),Curiosity(好奇心)和Sleepy(困倦),八種本能包括Hunger(饑餓),Defecation(通便),Thirst(口渴),Urination(撒尿),Exercise(鍛煉),Affection(友愛(ài)),Curiosity(好奇心)和Sleepy(困倦)。
本能狀態(tài)隨著例如由生物周期性通知的時(shí)間消逝而變化,或者隨著檢測(cè)器輸入和成功/失敗而變化。變化的范圍是0至100,變化的程度依賴(lài)于例如personality_gauge.cfg和personality_perception.cfg中的系數(shù)。
此外,當(dāng)即使用已經(jīng)達(dá)到最大值的愿望也不能進(jìn)行動(dòng)作時(shí),建立挫折(Frustration);當(dāng)樣板如期變化時(shí),則清除該挫折。
在操作檢驗(yàn)中,依據(jù)圖41所示的多個(gè)片段的分層結(jié)構(gòu)(樹(shù)結(jié)構(gòu))形成的內(nèi)容樹(shù)被用作采用行為學(xué)方法的動(dòng)作選擇/決定系統(tǒng)。內(nèi)容樹(shù)包括,從頂部到底部的,一個(gè)系統(tǒng)、子系統(tǒng)、模式和模塊。較高層中的動(dòng)作的多個(gè)部分是諸如愿望的抽象動(dòng)作,而較低層中動(dòng)作的多個(gè)部分是實(shí)現(xiàn)這些愿望的具體動(dòng)作。圖41所示的樹(shù)是為基于行為模型的最小動(dòng)作和用于學(xué)習(xí)的檢驗(yàn)設(shè)計(jì)的,該模型使用語(yǔ)音識(shí)別和操作檢驗(yàn)轉(zhuǎn)換到樹(shù)。操作檢驗(yàn)用圖41中的樹(shù)支持的本能和相應(yīng)的樣板進(jìn)行的,即,該本能包括Hunger(饑餓)、Affction(友愛(ài))、Curiosity(好奇心)和Sleepy(困倦),相應(yīng)樣板包括Nourishment(食物)、Affection(友愛(ài))、Curiosity(好奇心)和Sleepy(困倦)。需要說(shuō)明的是,在實(shí)際的操作檢驗(yàn)中,代碼被用來(lái)指示模塊執(zhí)行中的成功或失敗的標(biāo)志(標(biāo)準(zhǔn)),并且樣板與本能之間使用線性對(duì)應(yīng),但是本發(fā)明不限于這些方式。
在該實(shí)施例中,沿多個(gè)軸線表達(dá)情緒。具體地說(shuō),刺激(Activation)和愉快(Pleasantness)被用作軸線,此外還使用了Certainty(可信度)。即,一個(gè)情緒沿著三個(gè)軸線(即,三維)來(lái)表達(dá)。刺激是生物被激活或困倦的程度,依賴(lài)于主要在生物中發(fā)現(xiàn)的生物周期;愉快是指示本能有多少被實(shí)現(xiàn)或未實(shí)現(xiàn)的程度;可信度是機(jī)器人當(dāng)前關(guān)注的事物確實(shí)性如何的程度。為了確定愉快,使用了上述八種樣板和八種本能(然而,在操作檢驗(yàn)中至多使用四種樣本或四種本能)。刺激、愉快和可信度的每一個(gè)取落入-100至100范圍內(nèi)的值,并且愉快和可信度隨著時(shí)間消逝而變化,以便總是取值“0”。另外,包括在本能中的刺激取值“0”,并且生物周期取實(shí)際上的初始值。
愉快反映本能的實(shí)現(xiàn)。當(dāng)存在機(jī)器人正在關(guān)注的事物時(shí),使用關(guān)于可視對(duì)象的實(shí)際可信度,刺激基本上依賴(lài)于生物周期的值,但是當(dāng)困倦已經(jīng)變化時(shí),刺激隨困倦變化的結(jié)果而變化。
在該實(shí)施例中,上述操作被限制,使生物周期僅靠刺激來(lái)反映,在此情況下可信度在0至100的范圍內(nèi)變化。當(dāng)然,本發(fā)明不限于這些方式。
下面將結(jié)合圖42至44說(shuō)明關(guān)于睡覺(jué)和吃飯的操作檢驗(yàn)的第一實(shí)例。在該第一實(shí)例中,用本能而不是固定的饑餓和睡覺(jué)來(lái)檢查由圖41的內(nèi)容樹(shù)中的模塊作出的尋找./吃飯和睡覺(jué)的變化。圖42示出包含在本能中的饑餓和困倦的時(shí)間變化,圖43示出情緒中包含的刺激、愉快和可信度的時(shí)間變化,以及圖44示出作為動(dòng)機(jī)的睡覺(jué)和吃飯的時(shí)間變化。
如將從圖42至44看到的那樣,輕拍允許將機(jī)器人轉(zhuǎn)換到睡覺(jué)樹(shù),擊打允許讓機(jī)器人離開(kāi)睡覺(jué)樹(shù)(未示出)。當(dāng)饑餓增加時(shí),機(jī)器人可以前進(jìn)到吃飯樹(shù)。當(dāng)饑餓緩和時(shí),機(jī)器人可以轉(zhuǎn)換到睡覺(jué)樹(shù)。即使機(jī)器人被擊打時(shí)刺激也將不能變化的原因是,本能未變化到睡覺(jué)時(shí)的最小值,即等于-100。當(dāng)饑餓變?yōu)樽畲笾禃r(shí),也就是變成100時(shí),受挫將具有一個(gè)增加的值(未示出),所以愉快將略微增加。
下面將說(shuō)明操作檢驗(yàn)的第二實(shí)例,其中使用了包括Nourishment(食物)、Affection(友愛(ài))、Curiosity(好奇心)和Sleepy(困倦)的四種樣板。圖45至圖47示出機(jī)器人舉止的變化和圖41所示的內(nèi)容樹(shù)中本能值的變化。圖46示出情緒隨時(shí)間的變化,圖47示出釋放機(jī)構(gòu)的時(shí)間變化。
如圖45至47所示,通過(guò)輕拍轉(zhuǎn)換到睡覺(jué)樹(shù)、由于饑餓轉(zhuǎn)換到吃飯樹(shù)、以及由于好奇心轉(zhuǎn)換到信息獲取被分別作出。當(dāng)甚至包含在本能中的好奇心是最大值時(shí)也不能作出動(dòng)作時(shí),愉快已經(jīng)被變化到不愉快。此外,當(dāng)輕拍機(jī)器人增加困倦時(shí),愉快被增強(qiáng),由此搜索舒適(Comfort)。
操作檢驗(yàn)的結(jié)果表明行為動(dòng)作選擇/決定系統(tǒng)有效地操作,其中行為學(xué)方法基于圖41所示的內(nèi)容樹(shù)。
工業(yè)應(yīng)用性如上文已經(jīng)說(shuō)明的那樣,在本發(fā)明的機(jī)器人中,恰好在觸摸傳感器檢測(cè)觸摸之前或之后供應(yīng)的信息被信息檢測(cè)器檢測(cè);相應(yīng)于觸摸傳感器的觸摸檢測(cè)作出的動(dòng)作與輸入信息檢測(cè)器檢測(cè)的輸入信息相互關(guān)聯(lián)地存儲(chǔ)到存儲(chǔ)單元中;動(dòng)作控制器根據(jù)新近獲取的輸入信息從存儲(chǔ)單元中的信息中檢索動(dòng)作;作出動(dòng)作,以相互關(guān)聯(lián)地存儲(chǔ)輸入信息和檢測(cè)輸入信息時(shí)得到的動(dòng)作;并且相同的輸入信息被再次供應(yīng)時(shí)作出相應(yīng)的動(dòng)作。
在本發(fā)明的機(jī)器人中采用的動(dòng)作控制方法包括以下步驟檢測(cè)對(duì)機(jī)器人作出的觸摸;檢測(cè)恰好在觸摸檢測(cè)步驟中的觸摸檢測(cè)之前或之后供應(yīng)的信息;將相應(yīng)于觸摸檢測(cè)步驟中的觸摸檢測(cè)所作出的動(dòng)作和輸入信息檢測(cè)步驟中檢測(cè)的輸入信息相互關(guān)聯(lián)地存儲(chǔ)到存儲(chǔ)單元中;以及根據(jù)新近獲取的輸入信息從存儲(chǔ)單元的信息中檢索動(dòng)作以控制機(jī)器人作出動(dòng)作。
在本發(fā)明的機(jī)器人中,輸入信息和輸入信息被檢測(cè)時(shí)作出的動(dòng)作被相互關(guān)聯(lián)地存儲(chǔ),并且當(dāng)與該輸入信息相同的信息被再次供應(yīng)時(shí),作出相應(yīng)動(dòng)作。
此外,在本發(fā)明的機(jī)器人中,表現(xiàn)為相應(yīng)于由輸入信息檢測(cè)器檢測(cè)的輸入信息作出的動(dòng)作結(jié)果的動(dòng)作結(jié)果信息和輸入信息相互關(guān)聯(lián)地被存儲(chǔ)到存儲(chǔ)單元中;動(dòng)作控制器根據(jù)新輸入信息識(shí)別存儲(chǔ)單元中的動(dòng)作結(jié)果信息,動(dòng)作根據(jù)動(dòng)作結(jié)果信息作出;輸入信息和表現(xiàn)為相應(yīng)于輸入信息作出的動(dòng)作結(jié)果的動(dòng)作結(jié)果信息被相互關(guān)聯(lián)地存儲(chǔ);并且當(dāng)相同的輸入信息再次供應(yīng)時(shí),可以根據(jù)相應(yīng)的動(dòng)作結(jié)果信息檢索過(guò)去的動(dòng)作,作出適當(dāng)?shù)膭?dòng)作。
在本發(fā)明的機(jī)器人中采用的動(dòng)作控制方法包括以下步驟將表現(xiàn)為相應(yīng)于由輸入信息檢測(cè)器檢測(cè)的輸入信息作出的動(dòng)作結(jié)果的動(dòng)作結(jié)果信息和輸入信息相互關(guān)聯(lián)地存儲(chǔ)到存儲(chǔ)單元中;根據(jù)新輸入信息識(shí)別存儲(chǔ)單元中的動(dòng)作結(jié)果信息,以控制機(jī)器人根據(jù)動(dòng)作結(jié)果信息作出動(dòng)作。
在本發(fā)明的機(jī)器人中,輸入信息和表現(xiàn)為相應(yīng)于輸入信息作出的動(dòng)作結(jié)果的動(dòng)作結(jié)果信息被相互關(guān)聯(lián)地存儲(chǔ);并且當(dāng)相同的輸入信息再次供應(yīng)時(shí),可以根據(jù)相應(yīng)的動(dòng)作結(jié)果信息檢索過(guò)去的動(dòng)作,作出適當(dāng)?shù)膭?dòng)作。
此外,在本發(fā)明的機(jī)器人中,輸入信息檢測(cè)器檢測(cè)的輸入信息的特征被特征檢測(cè)器檢測(cè);信息分類(lèi)單元根據(jù)該特征對(duì)輸入信息進(jìn)行分類(lèi);動(dòng)作控制器根據(jù)輸入信息的分類(lèi)使機(jī)器人進(jìn)行動(dòng)作;分類(lèi)改變器根據(jù)表現(xiàn)為機(jī)器人在動(dòng)作控制器控制下作出的動(dòng)作的結(jié)果的動(dòng)作結(jié)果信息,改變已經(jīng)使機(jī)器人動(dòng)作的輸入信息的分類(lèi);機(jī)器人相應(yīng)于輸入信息的分類(lèi)進(jìn)行動(dòng)作,從而允許根據(jù)機(jī)器人動(dòng)作的結(jié)果改變輸入信息的分類(lèi)。
本發(fā)明的機(jī)器人中采用的動(dòng)作控制方法包括以下步驟檢測(cè)由輸入信息檢測(cè)器檢測(cè)的輸入信息的特征;根據(jù)特征檢測(cè)步驟中檢測(cè)的特征對(duì)輸入信息進(jìn)行分類(lèi);根據(jù)信息分類(lèi)步驟作出的輸入信息的分類(lèi)控制機(jī)器人進(jìn)行動(dòng)作;根據(jù)表現(xiàn)為由動(dòng)作控制步驟中控制的機(jī)器人作出的動(dòng)作的結(jié)果的動(dòng)作結(jié)果信息,改變已經(jīng)使機(jī)器人動(dòng)作的輸入信息的分類(lèi)。
本發(fā)明的機(jī)器人可以相應(yīng)于輸入信息的分類(lèi)進(jìn)行動(dòng)作,并且根據(jù)機(jī)器人動(dòng)作的結(jié)果改變輸入信息的分類(lèi)。
此外,本發(fā)明的機(jī)器人將目標(biāo)對(duì)象識(shí)別單元識(shí)別的目標(biāo)對(duì)象的信息存儲(chǔ)到存儲(chǔ)單元中;根據(jù)新近檢測(cè)的對(duì)象和存儲(chǔ)目標(biāo)對(duì)象的存儲(chǔ)單元中存儲(chǔ)的目標(biāo)對(duì)象的信息,進(jìn)行動(dòng)作;因而,當(dāng)相同對(duì)象被再次供應(yīng)時(shí)以預(yù)定方式進(jìn)行動(dòng)作。
此外,本發(fā)明的機(jī)器人中采用的動(dòng)作控制方法包括以下步驟識(shí)別目標(biāo)對(duì)象;將目標(biāo)對(duì)象識(shí)別步驟中識(shí)別的目標(biāo)對(duì)象的信息存儲(chǔ)到存儲(chǔ)單元中;根據(jù)新近檢測(cè)的信息和該存儲(chǔ)單元中存儲(chǔ)的目標(biāo)對(duì)象的信息,控制機(jī)器人進(jìn)行動(dòng)作。
本發(fā)明的機(jī)器人存儲(chǔ)目標(biāo)對(duì)象,并且當(dāng)識(shí)別目標(biāo)被再次供應(yīng)時(shí),以預(yù)定方式進(jìn)行動(dòng)作。
此外,本發(fā)明的機(jī)器人包括多個(gè)運(yùn)動(dòng)部件;移動(dòng)運(yùn)動(dòng)部件的多個(gè)關(guān)節(jié),多個(gè)檢測(cè)器,其每一個(gè)檢測(cè)經(jīng)運(yùn)動(dòng)部件被施加了外力的關(guān)節(jié)的狀態(tài);和學(xué)習(xí)單元,相互關(guān)聯(lián)地學(xué)習(xí)檢測(cè)器檢測(cè)的關(guān)節(jié)狀態(tài)和外力,以便經(jīng)運(yùn)動(dòng)部件被施加了外力的關(guān)節(jié)的狀態(tài)可以被檢測(cè)器檢測(cè),并且學(xué)習(xí)單元可以相互關(guān)聯(lián)地學(xué)習(xí)檢測(cè)器檢測(cè)的關(guān)節(jié)狀態(tài)和外力。也就是,機(jī)器人可以相關(guān)聯(lián)地學(xué)習(xí)外力與相應(yīng)于作用于運(yùn)動(dòng)部件的外力而變化的關(guān)節(jié)狀態(tài)。
此外,本發(fā)明的外力檢測(cè)器包括關(guān)節(jié)狀態(tài)檢測(cè)器,檢測(cè)移動(dòng)運(yùn)動(dòng)部件的關(guān)節(jié)的狀態(tài);和外力檢測(cè)器,根據(jù)關(guān)節(jié)狀態(tài)檢測(cè)器檢測(cè)的關(guān)節(jié)狀態(tài)檢測(cè)作用于運(yùn)動(dòng)部件的外力,以便移動(dòng)該運(yùn)動(dòng)部件的關(guān)節(jié)狀態(tài)可以被關(guān)節(jié)狀態(tài)檢測(cè)器檢測(cè),以及作用于運(yùn)動(dòng)部件的外力可以根據(jù)關(guān)節(jié)狀態(tài)檢測(cè)器檢測(cè)的關(guān)節(jié)狀態(tài)進(jìn)行檢測(cè)。即,外力檢測(cè)器可以根據(jù)移動(dòng)運(yùn)動(dòng)部件的關(guān)節(jié)的狀態(tài)檢測(cè)作用于運(yùn)動(dòng)部件的外力。
此外,本發(fā)明的外力檢測(cè)方法包括以下步驟檢測(cè)移動(dòng)運(yùn)動(dòng)部件的關(guān)節(jié)的狀態(tài);根據(jù)所檢測(cè)的關(guān)節(jié)狀態(tài)檢測(cè)作用于運(yùn)動(dòng)部件的外力;和根據(jù)移動(dòng)該運(yùn)動(dòng)部件的關(guān)節(jié)的狀態(tài)檢測(cè)作用于運(yùn)動(dòng)部件外力。
需要說(shuō)明的是,本發(fā)明不局限于上文中已經(jīng)說(shuō)明的實(shí)施例,非限制性和說(shuō)明性的關(guān)聯(lián)存儲(chǔ)系統(tǒng)的實(shí)例和用于操作檢驗(yàn)的內(nèi)容樹(shù)可以以各種方式修改。在不背離所附權(quán)利要求范圍和精神的條件下,可以對(duì)本發(fā)明進(jìn)行各種修改。
權(quán)利要求
1.一種機(jī)器人設(shè)備,包括用于檢測(cè)觸摸的裝置;用于檢測(cè)恰好在觸摸檢測(cè)裝置的觸摸檢測(cè)的同時(shí)或之前或之后供應(yīng)的信息的裝置;存儲(chǔ)裝置,用于相關(guān)聯(lián)地存儲(chǔ)相應(yīng)于觸摸檢測(cè)所作出的動(dòng)作和輸入信息檢測(cè)裝置所檢測(cè)的輸入信息;和檢索動(dòng)作的裝置,用于根據(jù)新近獲取的信息從存儲(chǔ)裝置的信息中檢索動(dòng)作,以控制機(jī)器人設(shè)備進(jìn)行動(dòng)作。
2.根據(jù)權(quán)利要求1所述的機(jī)器人設(shè)備,其中相應(yīng)于觸摸檢測(cè)裝置的觸摸檢測(cè)所作出的動(dòng)作是觸摸的外部負(fù)載造成的運(yùn)動(dòng)部件的位移的結(jié)果;和觸摸檢測(cè)裝置依據(jù)外部負(fù)載造成的對(duì)運(yùn)動(dòng)部件的控制信號(hào)的變化檢測(cè)觸摸。
3.根據(jù)權(quán)利要求1所述的機(jī)器人設(shè)備,還包括用于使機(jī)器人設(shè)備相應(yīng)于觸摸檢測(cè)裝置的觸摸檢測(cè)進(jìn)行動(dòng)作的裝置;存儲(chǔ)裝置,相互關(guān)聯(lián)地存儲(chǔ)相應(yīng)于觸摸檢測(cè)裝置的觸摸檢測(cè)所作出的動(dòng)作和輸入信息檢測(cè)裝置所檢測(cè)的輸入信息。
4.根據(jù)權(quán)利要求1所述的機(jī)器人設(shè)備,其中輸入信息檢測(cè)裝置至少檢測(cè)圖像信息或者語(yǔ)音信息。
5.一種控制機(jī)器人設(shè)備動(dòng)作的方法,該方法包括以下步驟檢測(cè)對(duì)機(jī)器人設(shè)備所作的觸摸;檢測(cè)恰好在觸摸檢測(cè)步驟的觸摸檢測(cè)的同時(shí)或之前或之后供應(yīng)的信息;將響應(yīng)觸摸檢測(cè)步驟中的觸摸檢測(cè)所作出的動(dòng)作和輸入信息檢測(cè)步驟中檢測(cè)的輸入信息相互關(guān)聯(lián)地存入存儲(chǔ)裝置中;和根據(jù)新近獲取的信息從存儲(chǔ)裝置的信息中檢索動(dòng)作,以控制機(jī)器人進(jìn)行動(dòng)作。
6.一種機(jī)器人設(shè)備,包括用于檢測(cè)輸入信息的裝置;存儲(chǔ)裝置,用于存儲(chǔ)由輸入信息檢測(cè)裝置檢測(cè)的輸入信息和動(dòng)作結(jié)果信息,該動(dòng)作結(jié)果信息表現(xiàn)出相應(yīng)于輸入信息檢測(cè)裝置檢測(cè)的輸入信息所作出的動(dòng)作結(jié)果;和識(shí)別動(dòng)作結(jié)果信息的裝置,用于根據(jù)新近供應(yīng)的輸入信息識(shí)別存儲(chǔ)裝置中的動(dòng)作結(jié)果信息,以控制機(jī)器人設(shè)備根據(jù)動(dòng)作結(jié)果信息進(jìn)行動(dòng)作。
7.根據(jù)權(quán)利要求6所述的機(jī)器人設(shè)備,其中情緒相應(yīng)于外部因素和/或內(nèi)部因素而變化,并且根據(jù)該情緒的狀態(tài)作出動(dòng)作;存儲(chǔ)裝置相互關(guān)聯(lián)地存儲(chǔ)作為動(dòng)作結(jié)果信息的、根據(jù)輸入信息作出的動(dòng)作得到的情緒狀態(tài)和輸入信息;和動(dòng)作控制裝置根據(jù)輸入信息從存儲(chǔ)裝置中檢索相應(yīng)的情緒狀態(tài),以根據(jù)該情緒狀態(tài)控制機(jī)器人設(shè)備進(jìn)行動(dòng)作。
8.根據(jù)權(quán)利要求6所述的機(jī)器人設(shè)備,其中輸入信息檢測(cè)裝置至少檢測(cè)圖像信息或語(yǔ)音信息。
9.一種控制機(jī)器人設(shè)備動(dòng)作的方法,該方法包括以下步驟將動(dòng)作結(jié)果信息和輸入信息相互關(guān)聯(lián)地存儲(chǔ)到存儲(chǔ)裝置中,該動(dòng)作結(jié)果信息表現(xiàn)出相應(yīng)于輸入信息檢測(cè)裝置檢測(cè)的輸入信息而作出的動(dòng)作的結(jié)果;和根據(jù)新近供應(yīng)的輸入信息識(shí)別存儲(chǔ)裝置中的動(dòng)作結(jié)果信息,以根據(jù)動(dòng)作結(jié)果信息控制機(jī)器人設(shè)備進(jìn)行動(dòng)作。
10.一種機(jī)器人設(shè)備,包括用于檢測(cè)輸入信息的裝置;檢測(cè)輸入信息特征的裝置,用于檢測(cè)由輸入信息檢測(cè)裝置檢測(cè)的輸入信息的特征;根據(jù)所檢測(cè)的特征對(duì)輸入信息進(jìn)行分類(lèi)的裝置;根據(jù)輸入信息控制機(jī)器人設(shè)備做動(dòng)作的裝置;和改變分類(lèi)的裝置,用于根據(jù)動(dòng)作結(jié)果信息改變已經(jīng)使機(jī)器人設(shè)備作出動(dòng)作的輸入信息的分類(lèi),該動(dòng)作結(jié)果信息表現(xiàn)出機(jī)器人設(shè)備在動(dòng)作控制裝置的控制下作出的動(dòng)作結(jié)果。
11.根據(jù)權(quán)利要求10所述的機(jī)器人設(shè)備,其中輸入信息是圖像信息或者語(yǔ)音信息。
12.根據(jù)權(quán)利要求10所述的機(jī)器人設(shè)備,其中分類(lèi)改變裝置在動(dòng)作結(jié)果信息指示動(dòng)作結(jié)果不合意時(shí),改變輸入信息的分類(lèi)。
13.一種控制機(jī)器人設(shè)備動(dòng)作的方法,該方法包括以下步驟檢測(cè)由輸入信息檢測(cè)裝置檢測(cè)的輸入信息的特征;根據(jù)特征檢測(cè)步驟中檢測(cè)的特征對(duì)輸入信息分類(lèi);根據(jù)信息分類(lèi)步驟中作出的輸入信息的分類(lèi),控制機(jī)器人設(shè)備進(jìn)行動(dòng)作;和根據(jù)動(dòng)作結(jié)果信息改變已經(jīng)使機(jī)器人設(shè)備作出動(dòng)作的輸入信息的分類(lèi),該動(dòng)作結(jié)果信息表現(xiàn)出在動(dòng)作控制步驟控制下機(jī)器人設(shè)備作出的動(dòng)作結(jié)果。
14.一種機(jī)器人設(shè)備,包括用于識(shí)別目標(biāo)對(duì)象的裝置;用于存儲(chǔ)由目標(biāo)對(duì)象識(shí)別裝置識(shí)別的目標(biāo)對(duì)象的信息的裝置;和控制裝置,用于根據(jù)新近檢測(cè)的對(duì)象的信息和存儲(chǔ)在存儲(chǔ)裝置中的目標(biāo)對(duì)象的信息控制機(jī)器人設(shè)備進(jìn)行動(dòng)作。
15.根據(jù)權(quán)利要求14所述的機(jī)器人設(shè)備,其中目標(biāo)對(duì)象識(shí)別裝置將輸入圖像信息分段,以檢測(cè)分段區(qū)域的時(shí)間變化,并識(shí)別與時(shí)間變化已經(jīng)達(dá)到預(yù)定值的區(qū)域相對(duì)應(yīng)的對(duì)象。
16.根據(jù)權(quán)利要求14所述的機(jī)器人設(shè)備,其中目標(biāo)對(duì)象識(shí)別裝置根據(jù)輸入語(yǔ)音信息識(shí)別目標(biāo)對(duì)象。
17.根據(jù)權(quán)利要求16所示的機(jī)器人設(shè)備,其中目標(biāo)對(duì)象識(shí)別裝置至少依據(jù)輸入語(yǔ)音信息的音量或者方向信息識(shí)別目標(biāo)對(duì)象。
18.根據(jù)權(quán)利要求14所述的機(jī)器人設(shè)備,其中目標(biāo)對(duì)象識(shí)別裝置檢測(cè)教導(dǎo)目標(biāo)對(duì)象的訓(xùn)練者的視線,以便依據(jù)該視線識(shí)別目標(biāo)對(duì)象。
19.一種控制機(jī)器人設(shè)備動(dòng)作的方法,該方法包括以下步驟識(shí)別目標(biāo)對(duì)象;將目標(biāo)對(duì)象識(shí)別步驟中識(shí)別的該目標(biāo)對(duì)象的信息存儲(chǔ)到存儲(chǔ)裝置中;和根據(jù)新近檢測(cè)的對(duì)象的信息和存儲(chǔ)在存儲(chǔ)裝置中的目標(biāo)對(duì)象的信息,控制機(jī)器人設(shè)備進(jìn)行動(dòng)作。
20.一種機(jī)器人設(shè)備,包括諸多運(yùn)動(dòng)部件;移動(dòng)諸多運(yùn)動(dòng)部件的諸多關(guān)節(jié);檢測(cè)裝置,用于檢測(cè)經(jīng)運(yùn)動(dòng)部件被施加了外力的關(guān)節(jié)的狀態(tài);和學(xué)習(xí)裝置,相互關(guān)聯(lián)的學(xué)習(xí)由檢測(cè)裝置檢測(cè)的關(guān)節(jié)狀態(tài)和外力。
21.根據(jù)權(quán)利要求20所述的機(jī)器人設(shè)備,其中檢測(cè)裝置檢測(cè)經(jīng)運(yùn)動(dòng)部件作用于關(guān)節(jié)上的外力,作為關(guān)節(jié)的狀態(tài);和學(xué)習(xí)裝置相互關(guān)聯(lián)地學(xué)習(xí)由檢測(cè)裝置檢測(cè)的外力和對(duì)運(yùn)動(dòng)部件的外力。
22.根據(jù)權(quán)利要求20所述的機(jī)器人設(shè)備,其中檢測(cè)裝置檢測(cè)關(guān)節(jié)狀態(tài)的目標(biāo)值與測(cè)量值之間的差值;和學(xué)習(xí)裝置相互關(guān)聯(lián)地學(xué)習(xí)由檢測(cè)裝置檢測(cè)的測(cè)量值與目標(biāo)值之間的差值和外力。
23.根據(jù)權(quán)利要求22所述的機(jī)器人設(shè)備,其中檢測(cè)裝置檢測(cè)外力造成的對(duì)關(guān)節(jié)的控制信號(hào)的變化;和學(xué)習(xí)裝置學(xué)習(xí)檢測(cè)裝置檢測(cè)的已變化的控制信號(hào)和外力。
24.根據(jù)權(quán)利要求20所述的機(jī)器人設(shè)備,還包括動(dòng)作控制裝置,用于使機(jī)器人設(shè)備根據(jù)學(xué)習(xí)裝置的學(xué)習(xí)結(jié)果和學(xué)習(xí)之后的關(guān)節(jié)狀態(tài)進(jìn)行動(dòng)作。
25.根據(jù)權(quán)利要求20所述的機(jī)器人設(shè)備,其中學(xué)習(xí)裝置通過(guò)包含輸入層、隱藏層和輸出層的神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)。
26.一種外力檢測(cè)器,包括關(guān)節(jié)狀態(tài)檢測(cè)裝置,用于檢測(cè)移動(dòng)運(yùn)動(dòng)部件的關(guān)節(jié)的狀態(tài);和外力檢測(cè)裝置,用于根據(jù)關(guān)節(jié)狀態(tài)檢測(cè)裝置檢測(cè)的關(guān)節(jié)狀態(tài),檢測(cè)作用于運(yùn)動(dòng)部件上的外力。
27.根據(jù)權(quán)利要求26所述的檢測(cè)器,其中檢測(cè)裝置檢測(cè)關(guān)節(jié)狀態(tài)的目標(biāo)值與測(cè)量值之間的差值;和外力檢測(cè)裝置根據(jù)該檢測(cè)裝置檢測(cè)的測(cè)量值與目標(biāo)值之間的差值檢測(cè)外力。
28.根據(jù)權(quán)利要求27所述的檢測(cè)器,其中檢測(cè)裝置檢測(cè)經(jīng)運(yùn)動(dòng)部件施加的外力所造成的對(duì)關(guān)節(jié)的控制信號(hào)的變化;和外力檢測(cè)裝置根據(jù)檢測(cè)裝置檢測(cè)的已變化的控制信號(hào)檢測(cè)外力。
29.一種檢測(cè)外力的方法,該方法包括以下步驟檢測(cè)移動(dòng)運(yùn)動(dòng)部件的關(guān)節(jié)的狀態(tài);根據(jù)所檢測(cè)的關(guān)節(jié)狀態(tài)檢測(cè)作用于該運(yùn)動(dòng)部件的外力;和根據(jù)移動(dòng)該運(yùn)動(dòng)部件的關(guān)節(jié)的狀態(tài)檢測(cè)作用于運(yùn)動(dòng)部件的外力。
全文摘要
本發(fā)明提出的機(jī)器人(1)包括:語(yǔ)音識(shí)別單元(101),檢測(cè)在觸摸傳感器的觸摸檢測(cè)的同時(shí)或者之前或之后供應(yīng)的信息;關(guān)聯(lián)存儲(chǔ)器/檢索存儲(chǔ)器(104),相互關(guān)聯(lián)地存儲(chǔ)相應(yīng)于觸摸所作出的動(dòng)作和語(yǔ)音識(shí)別單元(101)檢測(cè)的輸入信息(語(yǔ)音信號(hào));和動(dòng)作生成器(105),根據(jù)新近獲得的輸入信息(語(yǔ)音信號(hào))控制機(jī)器人(1)作出由關(guān)聯(lián)存儲(chǔ)器/檢索存儲(chǔ)器(104)所檢索的動(dòng)作。該機(jī)器人(1)還包括傳感器數(shù)據(jù)處理器(102),允許機(jī)器人(1)相應(yīng)于觸摸傳感器的觸摸檢測(cè)進(jìn)行動(dòng)作。因而,機(jī)器人(1)可以學(xué)習(xí)與諸如語(yǔ)音信號(hào)的輸入信號(hào)相關(guān)聯(lián)的動(dòng)作。
文檔編號(hào)G10L15/26GK1380846SQ01801273
公開(kāi)日2002年11月20日 申請(qǐng)日期2001年4月2日 優(yōu)先權(quán)日2000年3月31日
發(fā)明者藤田雅博, 高木剛, 長(zhǎng)谷川里香, 花形理, 橫野順, 加布里爾·科斯塔, 下村秀樹(shù) 申請(qǐng)人:索尼公司