本發(fā)明涉及智能機(jī)器人領(lǐng)域,尤其涉及一種用于智能機(jī)器人的語(yǔ)音輸出方法和裝置。
背景技術(shù):
隨著科學(xué)技術(shù)的不斷發(fā)展,信息技術(shù)、計(jì)算機(jī)技術(shù)以及人工智能技術(shù)的引入,機(jī)器人的研究已經(jīng)逐步走出工業(yè)領(lǐng)域,逐漸擴(kuò)展到了醫(yī)療、保健、家庭、娛樂(lè)以及服務(wù)行業(yè)等領(lǐng)域。而人們對(duì)于機(jī)器人的要求也從簡(jiǎn)單重復(fù)的機(jī)械動(dòng)作提升為具有擬人問(wèn)答、自主性及與其他機(jī)器人進(jìn)行交互的智能機(jī)器人,人機(jī)交互也就成為決定智能機(jī)器人發(fā)展的重要因素。
在機(jī)器人與用戶進(jìn)行語(yǔ)音交互時(shí),表示機(jī)器人嘴部的輸出設(shè)備通常是保持一定狀態(tài)不變的,這樣會(huì)導(dǎo)致給用戶帶來(lái)不好的交互體驗(yàn),降低用戶與機(jī)器人進(jìn)行交互的意愿。而且,機(jī)器人的這種狀態(tài)與其發(fā)展趨勢(shì)——高度擬人存在較大差別,且智能性較差。
綜上,需要提供一種能夠提高機(jī)器人類人性和智能性的、使機(jī)器人在與用戶進(jìn)行語(yǔ)音交互時(shí)會(huì)帶來(lái)更好的用戶體驗(yàn)的方法。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問(wèn)題之一是需要提供一種能夠提高機(jī)器人類人性和智能性的、使機(jī)器人在與用戶進(jìn)行語(yǔ)音交互時(shí)會(huì)帶來(lái)更好的用戶體驗(yàn)的解決方案。
為了解決上述技術(shù)問(wèn)題,本申請(qǐng)的實(shí)施例首先提供了一種用于智能機(jī)器人的語(yǔ)音輸出方法,該方法包括:獲取待輸出的語(yǔ)音信息對(duì)應(yīng)的文本信息;對(duì)所述文本信息進(jìn)行分詞;根據(jù)分詞結(jié)果生成嘴部的張合次數(shù)與每次張合的時(shí)長(zhǎng),結(jié)合所述張合次數(shù)和所述時(shí)長(zhǎng)控制執(zhí)行語(yǔ)音輸出。
優(yōu)選地,在根據(jù)分詞結(jié)果生成嘴部的張合次數(shù)與每次張合的時(shí)長(zhǎng)的步驟中,進(jìn)一步包括:根據(jù)所述分詞結(jié)果中的詞的數(shù)量確定所述嘴部的張合次數(shù);基于所述文本信息計(jì)算進(jìn)行語(yǔ)音信息輸出所需的總時(shí)長(zhǎng),根據(jù)所述分詞結(jié)果和總時(shí)長(zhǎng)確定所述嘴部每次張合的時(shí)長(zhǎng)。
優(yōu)選地,在根據(jù)所述分詞結(jié)果和總時(shí)長(zhǎng)確定所述嘴部每次張合的時(shí)長(zhǎng)的步驟中,進(jìn)一步包括:根據(jù)所述分詞結(jié)果中不同詞在文本信息中所代表的成分結(jié)構(gòu),賦予各個(gè)詞對(duì)應(yīng)的權(quán)重;通過(guò)計(jì)算所述總時(shí)長(zhǎng)與每個(gè)詞對(duì)應(yīng)權(quán)重的乘積值確定所述嘴部每次張合的時(shí)長(zhǎng)。
優(yōu)選地,該方法進(jìn)一步還包括:對(duì)所述文本信息進(jìn)行情緒分析,根據(jù)情緒分析結(jié)果控制進(jìn)行語(yǔ)音輸出時(shí)的嘴型狀態(tài)。
優(yōu)選地,在結(jié)合所述張合次數(shù)和所述時(shí)長(zhǎng)控制執(zhí)行語(yǔ)音輸出的步驟中,進(jìn)一步包括:上位機(jī)結(jié)合所述張合次數(shù)和所述時(shí)長(zhǎng),生成相應(yīng)的下位機(jī)嘴部控制指令并發(fā)送給下位機(jī);下位機(jī)結(jié)合所述嘴部控制指令控制嘴部動(dòng)畫(huà),或者嘴部機(jī)械設(shè)備配合語(yǔ)音輸出進(jìn)行張合。
根據(jù)另一方面,本發(fā)明實(shí)施例還提供了一種用于智能機(jī)器人的語(yǔ)音輸出裝置,該裝置包括:文本信息獲取模塊,其獲取待輸出的語(yǔ)音信息對(duì)應(yīng)的文本信息;分詞模塊,其對(duì)所述文本信息進(jìn)行分詞;語(yǔ)音輸出模塊,其根據(jù)分詞結(jié)果生成嘴部的張合次數(shù)與每次張合的時(shí)長(zhǎng),結(jié)合所述張合次數(shù)和所述時(shí)長(zhǎng)控制執(zhí)行語(yǔ)音輸出。
優(yōu)選地,所述語(yǔ)音輸出模塊進(jìn)一步包括:張合次數(shù)確定子模塊,其根據(jù)所述分詞結(jié)果中的詞的數(shù)量確定所述嘴部的張合次數(shù);張合時(shí)長(zhǎng)確定子模塊,其基于所述文本信息計(jì)算進(jìn)行語(yǔ)音信息輸出所需的總時(shí)長(zhǎng),根據(jù)所述分詞結(jié)果和總時(shí)長(zhǎng)確定所述嘴部每次張合的時(shí)長(zhǎng)。
優(yōu)選地,所述張合時(shí)長(zhǎng)確定子模塊,其進(jìn)一步根據(jù)所述分詞結(jié)果中不同詞在文本信息中所代表的成分結(jié)構(gòu),賦予各個(gè)詞對(duì)應(yīng)的權(quán)重,通過(guò)計(jì)算所述總時(shí)長(zhǎng)與每個(gè)詞對(duì)應(yīng)權(quán)重的乘積值確定所述嘴部每次張合的時(shí)長(zhǎng)。
優(yōu)選地,該裝置進(jìn)一步還包括:嘴型狀態(tài)控制模塊,其對(duì)所述文本信息進(jìn)行情緒分析,根據(jù)情緒分析結(jié)果控制進(jìn)行語(yǔ)音輸出時(shí)的嘴型狀態(tài)。
優(yōu)選地,所述語(yǔ)音輸出模塊進(jìn)一步包括:控制指令發(fā)出子模塊,其根據(jù)所述張合次數(shù)和所述時(shí)長(zhǎng),生成并發(fā)送相應(yīng)的嘴部控制指令;嘴部控制子模塊,其根據(jù)所述嘴部控制指令控制嘴部動(dòng)畫(huà),或者嘴部機(jī)械設(shè)備配合語(yǔ)音輸出進(jìn)行張合。
與現(xiàn)有技術(shù)相比,上述方案中的一個(gè)或多個(gè)實(shí)施例可以具有如下優(yōu)點(diǎn)或有益效果:
在智能機(jī)器人進(jìn)行語(yǔ)音輸出時(shí),通過(guò)先獲取待輸出的語(yǔ)音信息對(duì)應(yīng)的文本信息,然后對(duì)文本信息進(jìn)行分詞,根據(jù)分詞結(jié)果生成嘴部的張合次數(shù)與每次張合的時(shí)長(zhǎng),能夠結(jié)合張合次數(shù)和時(shí)長(zhǎng)控制執(zhí)行語(yǔ)音輸出。因此,在機(jī)器人與用戶進(jìn)行交互時(shí),機(jī)器人嘴部能夠模仿人類在進(jìn)行語(yǔ)音輸出時(shí)嘴部的動(dòng)作,提高機(jī)器人的智能性和類人性。
本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說(shuō)明書(shū)中闡述,并且,部分地從說(shuō)明書(shū)中變得顯而易見(jiàn),或者通過(guò)實(shí)施本發(fā)明的技術(shù)方案而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過(guò)在說(shuō)明書(shū)、權(quán)利要求書(shū)以及附圖中所特別指出的結(jié)構(gòu)和/或流程來(lái)實(shí)現(xiàn)和獲得。
附圖說(shuō)明
附圖用來(lái)提供對(duì)本申請(qǐng)的技術(shù)方案或現(xiàn)有技術(shù)的進(jìn)一步理解,并且構(gòu)成說(shuō)明書(shū)的一部分。其中,表達(dá)本申請(qǐng)實(shí)施例的附圖與本申請(qǐng)的實(shí)施例一起用于解釋本申請(qǐng)的技術(shù)方案,但并不構(gòu)成對(duì)本申請(qǐng)技術(shù)方案的限制。
圖1為根據(jù)本發(fā)明第一實(shí)施例的用于智能機(jī)器人的語(yǔ)音輸出方法的流程示意圖。
圖2為根據(jù)本發(fā)明第一實(shí)施例的用于智能機(jī)器人的語(yǔ)音輸出方法的步驟S130的具體流程示意圖。
圖3為根據(jù)本發(fā)明第二實(shí)施例的用于智能機(jī)器人的語(yǔ)音輸出方法的流程示意圖。
圖4為根據(jù)本發(fā)明第三實(shí)施例的用于智能機(jī)器人的語(yǔ)音輸出裝置300的結(jié)構(gòu)示意圖。
圖5為根據(jù)本發(fā)明第四實(shí)施例的用于智能機(jī)器人的語(yǔ)音輸出裝置3000的結(jié)構(gòu)示意圖。
具體實(shí)施方式
以下將結(jié)合附圖及實(shí)施例來(lái)詳細(xì)說(shuō)明本發(fā)明的實(shí)施方式,借此對(duì)本發(fā)明如何應(yīng)用技術(shù)手段來(lái)解決技術(shù)問(wèn)題,并達(dá)成相應(yīng)技術(shù)效果的實(shí)現(xiàn)過(guò)程能充分理解并據(jù)以實(shí)施。本申請(qǐng)實(shí)施例以及實(shí)施例中的各個(gè)特征,在不相沖突前提下可以相互結(jié)合,所形成的技術(shù)方案均在本發(fā)明的保護(hù)范圍之內(nèi)。
另外,附圖的流程圖示出的步驟可以在諸如一組計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)系統(tǒng)中執(zhí)行。并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。
隨著智能機(jī)器人產(chǎn)品的普及,越來(lái)越多的家庭和商家都需要機(jī)器人為其服務(wù)。然而,現(xiàn)有技術(shù)中,仿真機(jī)器人與用戶進(jìn)行語(yǔ)音交互時(shí),機(jī)器人嘴部要么保持不動(dòng)僅輸出語(yǔ)音信息,要么嘴部執(zhí)行預(yù)先設(shè)定的、與發(fā)出的語(yǔ)音信息毫不匹配的嘴部動(dòng)作,例如,在輸出語(yǔ)音時(shí),嘴部總是保持一定頻率的一張一合的狀態(tài),這多少會(huì)給用戶帶來(lái)不好的體驗(yàn),降低用戶與機(jī)器人交互的興趣。因此,亟需一種解決方案來(lái)解決上述問(wèn)題。
本發(fā)明實(shí)施例的用于智能機(jī)器人的語(yǔ)音輸出方法提高了機(jī)器人的智能性和類人性,使機(jī)器人在與用戶進(jìn)行語(yǔ)音交流的過(guò)程中,嘴部能夠根據(jù)發(fā)出的語(yǔ)音信息來(lái)做出相應(yīng)的張合動(dòng)作,提高用戶的體驗(yàn)感。具體來(lái)說(shuō),機(jī)器人在輸出語(yǔ)音信息之前,對(duì)待輸出語(yǔ)音信息的文本信息進(jìn)行分詞處理,然后根據(jù)分詞結(jié)果生成嘴部的張合次數(shù)和每次張合的時(shí)長(zhǎng),并結(jié)合張合次數(shù)和時(shí)長(zhǎng)控制執(zhí)行語(yǔ)音輸出,通過(guò)上面的方法能夠使機(jī)器人在發(fā)出語(yǔ)音信息的同時(shí)保持嘴部的動(dòng)作與語(yǔ)音信息匹配,使用戶感受到機(jī)器人的趣味性和類人性。
另外,在本發(fā)明實(shí)施例中,機(jī)器人除了能夠根據(jù)待輸出語(yǔ)音信息的文本信息計(jì)算得到張合次數(shù)和每次張合的時(shí)長(zhǎng),還能夠?qū)ξ谋拘畔⑦M(jìn)行情緒分析,并根據(jù)情緒分析結(jié)果控制進(jìn)行語(yǔ)音輸出時(shí)的嘴型狀態(tài),例如,在情緒分析結(jié)果為積極情緒時(shí),則控制嘴部表現(xiàn)出嘴角上揚(yáng)的狀態(tài),在情緒分析結(jié)果為消極情緒時(shí),則控制嘴部表現(xiàn)出嘴角下垂的狀態(tài)。這樣能夠進(jìn)一步使機(jī)器人在語(yǔ)音輸出的過(guò)程中,呈現(xiàn)出類人態(tài)的表現(xiàn),提高用戶體驗(yàn)。
在本發(fā)明實(shí)施例中,在計(jì)算嘴部的張合次數(shù)時(shí),可以根據(jù)分詞結(jié)果中的詞的數(shù)量來(lái)確定;在計(jì)算每次張合的時(shí)長(zhǎng)時(shí),可以基于文本信息計(jì)算進(jìn)行語(yǔ)音信息輸出所需的總時(shí)長(zhǎng),然后根據(jù)分詞結(jié)果和總時(shí)長(zhǎng)來(lái)確定,更具體地,根據(jù)分詞結(jié)果中不同詞在文本信息中所代表的成分結(jié)構(gòu),賦予各個(gè)詞對(duì)應(yīng)的權(quán)重,通過(guò)計(jì)算總時(shí)長(zhǎng)與每個(gè)詞對(duì)應(yīng)權(quán)重的乘積值確定所述嘴部每次張合的時(shí)長(zhǎng)。由于根據(jù)詞語(yǔ)的成分結(jié)構(gòu)所對(duì)應(yīng)的權(quán)重來(lái)計(jì)算每次張合的時(shí)長(zhǎng),因此機(jī)器人在對(duì)不同成分的詞進(jìn)行發(fā)音時(shí)會(huì)突出所要表達(dá)的重點(diǎn)內(nèi)容,能夠提高機(jī)器人的類人性以及用戶與機(jī)器人的交互體驗(yàn)。
另外,需要說(shuō)明的是,在機(jī)器人內(nèi)部設(shè)置有上位機(jī)和下位機(jī),在控制執(zhí)行語(yǔ)音輸出時(shí),上位機(jī)結(jié)合張合次數(shù)和時(shí)長(zhǎng),生成相應(yīng)的下位機(jī)嘴部控制指令并發(fā)送給下位機(jī),下位機(jī)結(jié)合嘴部控制指令控制嘴部動(dòng)畫(huà),或者嘴部機(jī)械設(shè)備配合語(yǔ)音輸出進(jìn)行張合。這樣設(shè)置能夠更好地分工操作,減輕上位機(jī)和下位機(jī)的數(shù)據(jù)處理負(fù)擔(dān)。
如上段內(nèi)容所述,在本發(fā)明實(shí)施例中,機(jī)器人的“嘴部”可以是以動(dòng)畫(huà)方式表示的虛擬嘴部,還可以是以機(jī)械結(jié)構(gòu)的形式形成的真實(shí)的嘴部。
第一實(shí)施例
圖1為根據(jù)本發(fā)明第一實(shí)施例的用于智能機(jī)器人的語(yǔ)音輸出方法的流程示意圖,該實(shí)施例的方法主要包括以下步驟。
首先,在步驟S110中,獲取待輸出的語(yǔ)音信息對(duì)應(yīng)的文本信息。
需要說(shuō)明的是,機(jī)器人可以自發(fā)地向用戶發(fā)出語(yǔ)音信息,也可以通過(guò)與用戶進(jìn)行語(yǔ)音交互,并解析用戶輸入的語(yǔ)音信息來(lái)生成待輸出的語(yǔ)音信息對(duì)應(yīng)的文本信息。以語(yǔ)音交互為例,用戶與機(jī)器人進(jìn)行語(yǔ)音交互的過(guò)程中,用戶向機(jī)器人發(fā)出語(yǔ)音信息,未知語(yǔ)音信號(hào)經(jīng)麥克風(fēng)、話筒之類的語(yǔ)音信號(hào)采集設(shè)備變換成電信號(hào)后輸入到識(shí)別系統(tǒng)的輸入端再進(jìn)行處理。在接收到多模態(tài)輸入信息后,響應(yīng)該多模態(tài)輸入數(shù)據(jù)生成對(duì)應(yīng)的文本信息,然后根據(jù)該文本信息生成待輸出給用戶的語(yǔ)音信息對(duì)應(yīng)的文本信息。
在對(duì)語(yǔ)音信息進(jìn)行解析時(shí),先進(jìn)行例如去噪之類的預(yù)處理,然后將預(yù)處理后的語(yǔ)音信息進(jìn)行語(yǔ)音識(shí)別的綜合分析,生成與語(yǔ)音信息對(duì)應(yīng)的文本信息。
例如,在對(duì)文本信息進(jìn)行解析后得到用戶輸入的語(yǔ)音信息是“你今天過(guò)的怎么樣啊”,生成的待輸出的語(yǔ)音信息對(duì)應(yīng)的文本信息可以為“我今天過(guò)的很好,你今天過(guò)的怎么樣啊”。
接著,在步驟S120中,對(duì)文本信息進(jìn)行分詞。
“分詞”是指以詞為基本單位,將文本信息中的詞逐個(gè)切分出來(lái)。以對(duì)中文語(yǔ)句進(jìn)行分詞為例,可以采用基于字符串匹配的分詞方法、基于統(tǒng)計(jì)的分詞方法和基于理解的分詞方法。其中基于字符串匹配的分詞方法分為最大匹配法、最小匹配法和全切分法。最大匹配法可以分為正向最大匹配法(由左到右的方向)、逆向最大匹配法(由右到左的方向)。
另外,在對(duì)文本信息進(jìn)行分詞的過(guò)程中,根據(jù)語(yǔ)法信息庫(kù)對(duì)每個(gè)詞在句子中的成分結(jié)構(gòu)或詞性(例如,主、謂、賓、名詞、動(dòng)詞、形容詞)進(jìn)行確定。例如,文本信息“你今天過(guò)的怎么樣啊”進(jìn)行分詞后的結(jié)果是:你(主)/今天(狀)/過(guò)(謂)/的/怎么樣(賓)/啊。
然后,在步驟S130中,根據(jù)分詞結(jié)果生成嘴部的張合次數(shù)與每次張合的時(shí)長(zhǎng),結(jié)合張合次數(shù)和時(shí)長(zhǎng)控制執(zhí)行語(yǔ)音輸出。圖2是根據(jù)本發(fā)明第一實(shí)施例的步驟S130的具體流程示意圖,下面參考圖2詳細(xì)說(shuō)明步驟S130的各個(gè)子步驟。
在子步驟S1310中,根據(jù)分詞結(jié)果中的詞的數(shù)量確定嘴部的張合次數(shù)。
簡(jiǎn)而言之,在一個(gè)實(shí)施例中,可以認(rèn)為機(jī)器人嘴部的張合次數(shù)與文本信息中所包含的詞的數(shù)量一致,以上面例子來(lái)說(shuō),機(jī)器人輸出“你今天過(guò)的怎么樣啊”的語(yǔ)音信息時(shí),由于該文本信息中包含的詞的數(shù)量為6個(gè),則機(jī)器人嘴部的張合次數(shù)為6次。當(dāng)然,為了避免機(jī)器人嘴部張合次數(shù)過(guò)多,在其他實(shí)施例中,也可以設(shè)定機(jī)器人嘴部張合的次數(shù)等于分詞結(jié)果中某些重要成分詞的數(shù)量值,且對(duì)應(yīng)輸出這些重要成分詞時(shí)嘴部進(jìn)行張合操作。
在子步驟S1320中,基于文本信息計(jì)算進(jìn)行語(yǔ)音信息輸出所需的總時(shí)長(zhǎng),根據(jù)分詞結(jié)果和總時(shí)長(zhǎng)確定嘴部每次張合的時(shí)長(zhǎng),結(jié)合張合次數(shù)和時(shí)長(zhǎng)控制執(zhí)行語(yǔ)音輸出。在子步驟S1320中,進(jìn)一步優(yōu)選地,還包括子步驟S1321、S1322和S1323。
在子步驟S1321中,根據(jù)分詞結(jié)果中不同詞在文本信息中所代表的成分結(jié)構(gòu),賦予各個(gè)詞對(duì)應(yīng)的權(quán)重。
在步驟S120中通過(guò)對(duì)文本信息進(jìn)行分詞處理,能夠獲取每個(gè)詞在文本中表示的成分結(jié)構(gòu),預(yù)先給不同成分結(jié)構(gòu)賦予一定的權(quán)重比例(例如,百分比),設(shè)定所有詞的總和為百分之百。例如,主語(yǔ)成分的詞的權(quán)重為20%、謂語(yǔ)成分的詞的權(quán)重為10%......,則上面例子中,各分詞所占比例為:你(20%)/今天(20%)/過(guò)(10%)/的(10%)/怎么樣(30%)/啊(10%)。或者,還可以根據(jù)分詞結(jié)果中不同詞在文本信息中的詞性(例如,名詞、動(dòng)詞、形容詞)來(lái)賦予各個(gè)詞對(duì)應(yīng)的權(quán)重。
在子步驟S1322中,通過(guò)計(jì)算總時(shí)長(zhǎng)與每個(gè)詞對(duì)應(yīng)權(quán)重的乘積值確定嘴部每次張合的時(shí)長(zhǎng)。
具體地,可以通過(guò)如下表達(dá)式來(lái)得到嘴部每次張合的時(shí)長(zhǎng):總時(shí)長(zhǎng)*每個(gè)詞的權(quán)重。例如,“你今天過(guò)的怎么樣啊”的TTS合成的音頻總時(shí)長(zhǎng)是4秒,通過(guò)利用上面表達(dá)式計(jì)算得到對(duì)應(yīng)“你”字輸出時(shí),嘴部張合的時(shí)長(zhǎng)是0.8秒、“今天”是0.8秒、“過(guò)”是0.4秒、“的”是0.4秒、“怎么樣”是1.2秒、“啊”是0.4秒,總共4秒。
在子步驟S1323中,結(jié)合張合次數(shù)和時(shí)長(zhǎng)控制執(zhí)行語(yǔ)音輸出。
具體地,機(jī)器人內(nèi)部設(shè)置有上位機(jī)和下位機(jī),為了更好地分工操作,減輕上位機(jī)和下位機(jī)的數(shù)據(jù)處理負(fù)擔(dān),上位機(jī)結(jié)合張合次數(shù)和時(shí)長(zhǎng),生成相應(yīng)的下位機(jī)嘴部控制指令并發(fā)送給下位機(jī),下位機(jī)結(jié)合嘴部控制指令控制嘴部動(dòng)畫(huà),或者嘴部機(jī)械設(shè)備配合語(yǔ)音輸出進(jìn)行張合。具體來(lái)說(shuō),上位機(jī)發(fā)出的下位機(jī)嘴部控制指令中包括完成進(jìn)行語(yǔ)音輸出時(shí)嘴部張合次數(shù),以及每次張合的時(shí)長(zhǎng)。下位機(jī)在接收到嘴部控制指令后,控制嘴部配合語(yǔ)音輸出進(jìn)行張合。
本發(fā)明實(shí)施例在智能機(jī)器人進(jìn)行語(yǔ)音輸出時(shí),使機(jī)器人通過(guò)先獲取待輸出的語(yǔ)音信息對(duì)應(yīng)的文本信息,然后對(duì)文本信息進(jìn)行分詞,根據(jù)分詞結(jié)果生成嘴部的張合次數(shù)與每次張合的時(shí)長(zhǎng),能夠結(jié)合張合次數(shù)和時(shí)長(zhǎng)控制執(zhí)行語(yǔ)音輸出。因此,在機(jī)器人與用戶進(jìn)行交互時(shí),機(jī)器人嘴部能夠模仿人類在進(jìn)行語(yǔ)音輸出時(shí)嘴部的動(dòng)作,提高機(jī)器人的智能性和類人性。
第二實(shí)施例
圖3為根據(jù)本發(fā)明第二實(shí)施例的用于智能機(jī)器人的語(yǔ)音輸出方法的流程示意圖,該實(shí)施例的方法主要包括以下步驟,其中,將與第一實(shí)施例相似的步驟以相同的標(biāo)號(hào)標(biāo)注,且不再贅述其具體內(nèi)容,僅對(duì)區(qū)別步驟進(jìn)行具體描述。
在步驟S110中,獲取待輸出的語(yǔ)音信息對(duì)應(yīng)的文本信息。
在步驟S120中,對(duì)文本信息進(jìn)行分詞。
在步驟S130中,根據(jù)分詞結(jié)果生成嘴部的張合次數(shù)與每次張合的時(shí)長(zhǎng),結(jié)合張合次數(shù)和時(shí)長(zhǎng)控制執(zhí)行語(yǔ)音輸出。
在步驟S140中,對(duì)文本信息進(jìn)行情緒分析,根據(jù)情緒分析結(jié)果控制進(jìn)行語(yǔ)音輸出時(shí)的嘴型狀態(tài)。
除了獲取嘴部的張合次數(shù)和每次張合的時(shí)長(zhǎng)以外,為了更好地提高機(jī)器人的類人性,還需要對(duì)待輸出語(yǔ)音信息對(duì)應(yīng)的文本信息進(jìn)行情緒分析。例如,可以根據(jù)情感詞典來(lái)解析文本信息中每個(gè)詞的情緒屬性信息,若一句話中包含的某一類情感屬性的詞較多,則對(duì)應(yīng)該情感屬性輸出用于控制機(jī)器人嘴型狀態(tài)的控制指令。例如,若文本信息所呈現(xiàn)的情緒為高興,則輸出控制機(jī)器人嘴部的嘴角上揚(yáng)的控制指令,若文本信息所呈現(xiàn)的情緒為悲傷,則輸出控制機(jī)器人嘴部的嘴角下垂的控制指令。上位機(jī)發(fā)出嘴型狀態(tài)的控制指令給下位機(jī),下位機(jī)根據(jù)控制指令驅(qū)動(dòng)控制構(gòu)成嘴部的機(jī)械結(jié)構(gòu)使嘴部呈現(xiàn)出相應(yīng)的形態(tài),或者在嘴部為虛擬圖像時(shí),下位機(jī)控制生成對(duì)應(yīng)形態(tài)的虛擬嘴部圖像顯示在機(jī)器人的顯示設(shè)備上。
需要說(shuō)明的是,該步驟可以與步驟S130同時(shí)執(zhí)行,也可以在步驟S130后執(zhí)行,例如,在機(jī)器人輸出語(yǔ)音信息后進(jìn)行嘴部形態(tài)的控制,此處不做限定。
第三實(shí)施例
圖4為根據(jù)本發(fā)明第三實(shí)施例的用于智能機(jī)器人的語(yǔ)音輸出裝置300的結(jié)構(gòu)示意圖。如圖4所示,本實(shí)施例的語(yǔ)音輸出裝置300主要包括:文本信息獲取模塊310、分詞模塊320和語(yǔ)音輸出模塊330。
文本信息獲取模塊310,其獲取待輸出的語(yǔ)音信息對(duì)應(yīng)的文本信息。
分詞模塊320,其與文本信息獲取模塊310連接,分詞模塊320對(duì)所述文本信息進(jìn)行分詞。
語(yǔ)音輸出模塊330,與分詞模塊320連接,語(yǔ)音輸出模塊330根據(jù)分詞結(jié)果生成嘴部的張合次數(shù)與每次張合的時(shí)長(zhǎng),結(jié)合所述張合次數(shù)和所述時(shí)長(zhǎng)控制執(zhí)行語(yǔ)音輸出。語(yǔ)音輸出模塊330進(jìn)一步包括:張合次數(shù)確定子模塊3310、張合時(shí)長(zhǎng)確定子模塊3320、控制指令發(fā)出子模塊3330和嘴部控制子模塊3340。
張合次數(shù)確定子模塊3310,其根據(jù)所述分詞結(jié)果中的詞的數(shù)量確定所述嘴部的張合次數(shù)。張合時(shí)長(zhǎng)確定子模塊3320,其基于所述文本信息計(jì)算進(jìn)行語(yǔ)音信息輸出所需的總時(shí)長(zhǎng),根據(jù)所述分詞結(jié)果和總時(shí)長(zhǎng)確定所述嘴部每次張合的時(shí)長(zhǎng)。張合時(shí)長(zhǎng)確定子模塊3320,其進(jìn)一步根據(jù)所述分詞結(jié)果中不同詞在文本信息中所代表的成分結(jié)構(gòu),賦予各個(gè)詞對(duì)應(yīng)的權(quán)重,通過(guò)計(jì)算所述總時(shí)長(zhǎng)與每個(gè)詞對(duì)應(yīng)權(quán)重的乘積值確定所述嘴部每次張合的時(shí)長(zhǎng)。控制指令發(fā)出子模塊3330,其根據(jù)所述張合次數(shù)和所述時(shí)長(zhǎng),生成并發(fā)送相應(yīng)的嘴部控制指令。嘴部控制子模塊3340,其根據(jù)所述嘴部控制指令控制嘴部動(dòng)畫(huà),或者嘴部機(jī)械設(shè)備配合語(yǔ)音輸出進(jìn)行張合。
通過(guò)合理設(shè)置,本實(shí)施例的語(yǔ)音輸出裝置300可以執(zhí)行第一實(shí)施例中涉及的語(yǔ)音輸出方法的各個(gè)步驟,此處不再贅述。
第四實(shí)施例
圖5為根據(jù)本發(fā)明第四實(shí)施例的用于智能機(jī)器人的語(yǔ)音輸出裝置3000的結(jié)構(gòu)示意圖。其中,將與第三實(shí)施例功能相似的模塊以相同的標(biāo)號(hào)標(biāo)注,且不再贅述其具體內(nèi)容,僅對(duì)區(qū)別模塊進(jìn)行具體描述。
如圖5所示,本實(shí)施例的語(yǔ)音輸出裝置3000除了包括第三實(shí)施例中涉及的文本信息獲取模塊310、分詞模塊320和語(yǔ)音輸出模塊330以外,還包括嘴型狀態(tài)控制模塊340。嘴型狀態(tài)控制模塊330,其對(duì)所述文本信息進(jìn)行情緒分析,根據(jù)情緒分析結(jié)果控制進(jìn)行語(yǔ)音輸出時(shí)的嘴型狀態(tài)。
通過(guò)合理設(shè)置,本實(shí)施例的語(yǔ)音輸出裝置3000可以執(zhí)行第二實(shí)施例中涉及的語(yǔ)音輸出方法的各個(gè)步驟,此處不再贅述。
由于本發(fā)明的方法描述的是在計(jì)算機(jī)系統(tǒng)中實(shí)現(xiàn)的。該計(jì)算機(jī)系統(tǒng)例如可以設(shè)置在機(jī)器人的控制核心處理器中。例如,本文所述的方法可以實(shí)現(xiàn)為能以控制邏輯來(lái)執(zhí)行的軟件,其由機(jī)器人操作系統(tǒng)中的CPU來(lái)執(zhí)行。本文所述的功能可以實(shí)現(xiàn)為存儲(chǔ)在非暫時(shí)性有形計(jì)算機(jī)可讀介質(zhì)中的程序指令集合。當(dāng)以這種方式實(shí)現(xiàn)時(shí),該計(jì)算機(jī)程序包括一組指令,當(dāng)該組指令由計(jì)算機(jī)運(yùn)行時(shí)其促使計(jì)算機(jī)執(zhí)行能實(shí)施上述功能的方法??删幊踢壿嬁梢詴簳r(shí)或永久地安裝在非暫時(shí)性有形計(jì)算機(jī)可讀介質(zhì)中,例如只讀存儲(chǔ)器芯片、計(jì)算機(jī)存儲(chǔ)器、磁盤(pán)或其他存儲(chǔ)介質(zhì)。除了以軟件來(lái)實(shí)現(xiàn)之外,本文所述的邏輯可利用分立部件、集成電路、與可編程邏輯設(shè)備(諸如,現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)或微處理器)結(jié)合使用的可編程邏輯,或者包括它們?nèi)我饨M合的任何其他設(shè)備來(lái)體現(xiàn)。所有此類實(shí)施例旨在落入本發(fā)明的范圍之內(nèi)。
應(yīng)該理解的是,本發(fā)明所公開(kāi)的實(shí)施例不限于這里所公開(kāi)的特定結(jié)構(gòu)、處理步驟或材料,而應(yīng)當(dāng)延伸到相關(guān)領(lǐng)域的普通技術(shù)人員所理解的這些特征的等同替代。還應(yīng)當(dāng)理解的是,在此使用的術(shù)語(yǔ)僅用于描述特定實(shí)施例的目的,而并不意味著限制。
說(shuō)明書(shū)中提到的“一個(gè)實(shí)施例”或“實(shí)施例”意指結(jié)合實(shí)施例描述的特定特征、結(jié)構(gòu)或特性包括在本發(fā)明的至少一個(gè)實(shí)施例中。因此,說(shuō)明書(shū)通篇各個(gè)地方出現(xiàn)的短語(yǔ)“一個(gè)實(shí)施例”或“實(shí)施例”并不一定均指同一個(gè)實(shí)施例。
雖然本發(fā)明所公開(kāi)的實(shí)施方式如上,但所述的內(nèi)容只是為了便于理解本發(fā)明而采用的實(shí)施方式,并非用以限定本發(fā)明。任何本發(fā)明所屬技術(shù)領(lǐng)域內(nèi)的技術(shù)人員,在不脫離本發(fā)明所公開(kāi)的精神和范圍的前提下,可以在實(shí)施的形式上及細(xì)節(jié)上作任何的修改與變化,但本發(fā)明的專利保護(hù)范圍,仍須以所附的權(quán)利要求書(shū)所界定的范圍為準(zhǔn)。