專利名稱:提供個(gè)性化服務(wù)的音頻/視頻裝置和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種通過話音和說話者識(shí)別提供個(gè)性化服務(wù)的音頻/視頻(A/V)裝置和方法,更具體地說,涉及這樣一種通過話音和說話者識(shí)別提供個(gè)性化服務(wù)的A/V裝置和方法,其中,當(dāng)輸入用戶話音時(shí),同時(shí)執(zhí)行話音識(shí)別和說話者識(shí)別以提供根據(jù)說話者識(shí)別的個(gè)性化服務(wù)。
背景技術(shù):
在相關(guān)技術(shù)中,為了接收個(gè)性化服務(wù),用戶應(yīng)該選擇說話者識(shí)別模式,然后說出已經(jīng)登記的密碼(輸入字)用于用戶識(shí)別,最終說出相應(yīng)的命令用于想要得到的服務(wù)。
這可能是不方便的,由于用戶可能通過執(zhí)行兩個(gè)處理僅僅接收個(gè)性化服務(wù),這兩個(gè)處理包括輸入用于說話者識(shí)別的密碼處理;以及輸入用于話音識(shí)別的命令處理。另外,由于分別應(yīng)用用于說話者識(shí)別的輸入字(密碼)和用于話音識(shí)別的輸入字(命令),用戶應(yīng)該記憶分別的輸入字,這也是不方便的。
此外,如果另一個(gè)用戶想要享受個(gè)性化服務(wù),則應(yīng)該輸入“改變用戶”命令,然后再次執(zhí)行說話者和話音識(shí)別,這引起用戶的不方便。
發(fā)明內(nèi)容
本發(fā)明的目的在于解決前述的不方便之處。本發(fā)明的一方面提供一種通過話音和說話者識(shí)別提供個(gè)性化服務(wù)的A/V裝置和方法,其中,依照用戶的話音輸入,同時(shí)執(zhí)行話音和說話者識(shí)別而不需要分離的用戶識(shí)別處理。
本發(fā)明的另一方面是提供一種通過話音和說話者識(shí)別提供個(gè)性化服務(wù)的A/V裝置和方法,其中,通過均等地將輸入字(命令)應(yīng)用于話音識(shí)別和說話者識(shí)別來迅速提供想要得到的服務(wù)。
根據(jù)本發(fā)明的示例性實(shí)施例,提供了一種通過話音和說話者識(shí)別向用戶提供個(gè)性化服務(wù)的音頻/視頻裝置,其中,當(dāng)用戶通過遙控裝置的無線麥克風(fēng)輸入他的/她的話音時(shí),執(zhí)行對(duì)輸入話音的話音識(shí)別和說話者識(shí)別,并且確定對(duì)應(yīng)于輸入話音的命令,從而將用戶的個(gè)性化服務(wù)提供給用戶。
此外,A/V裝置可包括話音識(shí)別單元,用于識(shí)別通過話音輸入單元輸入的話音;說話者識(shí)別單元,用于基于通過話音輸入單元輸入的話音識(shí)別用戶;確定單元,用于確定哪個(gè)命令對(duì)應(yīng)于通過話音識(shí)別單元識(shí)別的話音;數(shù)據(jù)庫,用于存儲(chǔ)用戶信息、話音信息、關(guān)于用戶的個(gè)性化服務(wù)的信息、以及命令;和服務(wù)搜索單元,用于在數(shù)據(jù)庫中搜索對(duì)應(yīng)于已識(shí)別命令的服務(wù)和關(guān)于用戶的個(gè)性化服務(wù)的信息。
此外,根據(jù)本發(fā)明的另一個(gè)示例性實(shí)施例,提供了一種通過話音和說話者識(shí)別提供個(gè)性化服務(wù)的方法,包括下述步驟由用戶通過遙控裝置中的無線麥克風(fēng)輸入他的/她的話音;如果輸入了話音,則識(shí)別輸入話音和輸入話音的說話者;基于輸入話音確定命令;和根據(jù)確定結(jié)果提供服務(wù)。
通過下面結(jié)合附圖對(duì)給出的優(yōu)選實(shí)施例進(jìn)行的描述,本發(fā)明的上述和其他目的、特點(diǎn)、和優(yōu)點(diǎn)將會(huì)變得清楚,其中圖1是示意性地表示根據(jù)本發(fā)明的示例性實(shí)施例的通過話音和說話者識(shí)別提供個(gè)性化服務(wù)的A/V裝置的方框圖;圖2是示意性地表示根據(jù)本發(fā)明的另一個(gè)示例性實(shí)施例通過話音和說話者識(shí)別提供個(gè)性化服務(wù)的方法的流程圖;圖3A和3B表示根據(jù)本發(fā)明實(shí)施例的命令表;圖4表示根據(jù)本發(fā)明的示例性實(shí)施例的通過話音和說話者識(shí)別提供個(gè)性化服務(wù)的方法;和圖5表示根據(jù)本發(fā)明的另一個(gè)示例性實(shí)施例的通過話音和說話者識(shí)別提供個(gè)性化服務(wù)的方法。
具體實(shí)施例方式
以下,參照附圖來詳細(xì)描述本發(fā)明的示例性實(shí)施例。
圖1是示意性地表示根據(jù)本發(fā)明的示例性實(shí)施例的通過話音和說話者識(shí)別提供個(gè)性化服務(wù)的A/V裝置的方框圖。A/V裝置200包括話音識(shí)別單元210、說話者識(shí)別單元220、控制單元230、確定單元240,服務(wù)搜索單元250、和數(shù)據(jù)庫260。
當(dāng)通過遙控裝置100中的無線麥克風(fēng)輸入用戶話音時(shí),A/V裝置200執(zhí)行對(duì)輸入話音的話音和說話者識(shí)別,確定對(duì)應(yīng)于輸入話音的命令,然后向用戶提供個(gè)性化服務(wù)。
話音識(shí)別單元210用于識(shí)別通過在遙控裝置100中提供的話音輸入單元110輸入的話音,即,用于識(shí)別由用戶輸入的命令。
說話者識(shí)別單元220用于基于通過話音輸入單元110輸入的話音識(shí)別說話者,即,基于存儲(chǔ)于數(shù)據(jù)庫260中的關(guān)于用戶的話音的信息,識(shí)別輸入他的/她的話音的用戶。
確定單元240用于確定哪個(gè)命令對(duì)應(yīng)于話音識(shí)別單元210識(shí)別的話音,即,用于分析由話音識(shí)別單元210識(shí)別的命令,并且確定該命令是否需要用戶信息。
數(shù)據(jù)庫260用于存儲(chǔ)關(guān)于用戶,話音、以及用戶的個(gè)性化服務(wù)的信息,以及可獲得的命令。換句話說,當(dāng)話音識(shí)別單元210和說話者識(shí)別單元220執(zhí)行鑒別處理時(shí),數(shù)據(jù)庫提供存儲(chǔ)在其中的命令和關(guān)于相關(guān)用戶的信息。可獲得的命令是指可由用戶輸入的所有命令,例如,包括“搜索頻道”命令、“登記頻道”命令、“刪除頻道”命令等。
此外,命令分類為需要用戶鑒別的命令和不需要用戶鑒別的命令。將在以后參考圖3更詳細(xì)地描述存儲(chǔ)在數(shù)據(jù)庫260中的命令。
服務(wù)搜索單元250用于根據(jù)確定單元240的確定結(jié)果在數(shù)據(jù)庫260種搜索設(shè)計(jì)命令的信息和關(guān)于用于用戶的個(gè)性化服務(wù)的信息,即,根據(jù)確定單元240的確定結(jié)果搜索相關(guān)的服務(wù)。
控制單元230用于提供由服務(wù)搜索單元250搜索的服務(wù),即,提供與由用戶輸入的命令相對(duì)應(yīng)的服務(wù)。這里,服務(wù)可被認(rèn)為是從最喜歡的頻道得到的廣播節(jié)目的顯示、關(guān)于推薦節(jié)目信息的顯示、最喜歡的音樂的重放,選擇的音樂流派的顯示,或諸如此類。
其間,通過在遙控裝置100中提供的話音輸入單元110輸入用戶的話音。此時(shí),無線麥克風(fēng)用于用戶話音的輸入。
圖2是示意性地表示根據(jù)本發(fā)明的另一示例性實(shí)施例的通過話音和說話者識(shí)別提供個(gè)性化服務(wù)的方法的流程圖。首先,如果用戶通過安裝在遙控裝置中的無線麥克風(fēng)輸入他的/她的話音(S100),則話音輸入單元110將通過無線麥克風(fēng)輸入的用戶的話音(命令)發(fā)送到話音識(shí)別單元210。
然后,話音識(shí)別單元210識(shí)別從話音輸入單元110發(fā)送的命令,說話者識(shí)別單元220同時(shí)基于輸入話音執(zhí)行說話者識(shí)別(S110)。換句話說,話音識(shí)別單元210識(shí)別由用戶輸入的命令,同時(shí),說話者識(shí)別單元220基于輸入話音執(zhí)行對(duì)用戶的說話者識(shí)別。明確地說,話音識(shí)別單元210將輸入命令轉(zhuǎn)換為文本,并且將該文本發(fā)送給確定單元240,說話者識(shí)別單元220從輸入話音中提取特點(diǎn),分析該提取的特點(diǎn),然后在存儲(chǔ)于數(shù)據(jù)庫260中的用戶話音之中搜索具有與輸入話音的話音信號(hào)最接近的用戶話音,從而識(shí)別出輸入命令的用戶。這里,用戶應(yīng)提前執(zhí)行用戶登記處理以為說話者識(shí)別做準(zhǔn)備。通過用戶登記處理,關(guān)于用戶的具體信息在數(shù)據(jù)庫260中登記。結(jié)果,基于話音的說話者識(shí)別被執(zhí)行。此外,已經(jīng)登記在數(shù)據(jù)庫260中的登記字包括請(qǐng)求個(gè)性化服務(wù)的命令。因此,登記字和命令被平等的應(yīng)用,以便話音和說話者識(shí)別可被同時(shí)執(zhí)行。
此后,由話音識(shí)別單元210識(shí)別的命令被發(fā)送到輪流分析由話音識(shí)別單元210識(shí)別的命令的確定單元240(S120)。換句話說,確定單元240基于輸入命令分析將執(zhí)行哪個(gè)操作,并且確定分析的命令是否是用于用戶的需要用戶信息的個(gè)性化命令或者是不需要用戶信息的普通命令。這里,用于用戶的個(gè)性化命令是由用戶根據(jù)他的/她的個(gè)人偏愛和品味頻繁輸入的命令,并且可以被認(rèn)為是“最喜歡的頻道”、“通知預(yù)訂”、“通知列表”、“記錄預(yù)訂”、“預(yù)訂列表”、“記錄列表”、“推薦節(jié)目”、“按次付費(fèi)頻道”、“購物頻道”、或諸如此類。普通命令是不會(huì)受到用戶偏愛和品味影響的命令,并且可被認(rèn)為是新聞、戲劇、運(yùn)動(dòng)、或諸如此類。
隨后,如果確定單元240確定輸入命令是請(qǐng)求個(gè)性化服務(wù)的命令(S130),則服務(wù)搜索單元250確定輸入他的/她的話音的用戶是否是登記在數(shù)據(jù)庫260中的用戶并且被說話者識(shí)別單元220通過說話者識(shí)別而識(shí)別(S140)。
如果確定輸入他的/她的話音的用戶是登記在數(shù)據(jù)庫260中的用戶(S140),則搜索關(guān)于由說話者識(shí)別單元220鑒別的用戶的信息并從在用戶基礎(chǔ)上登記信息的數(shù)據(jù)庫260中提取該信息(S150)。此后,在包含于提取的用戶信息中的服務(wù)列表中搜索對(duì)應(yīng)于用戶輸入的命令的個(gè)性化服務(wù)(S160)。
然后,控制單元230向用戶提供由服務(wù)搜索單元250搜索的個(gè)性化服務(wù)(S170)。
另一方面,如果確定輸入他的/她的話音的用戶不是在數(shù)據(jù)庫260中登記的用戶(S140),則服務(wù)搜索單元250向用戶提供基本上在A/V裝置內(nèi)配置的基本服務(wù)(S190,S200),或者通知用戶沒有用于該用戶的登記的個(gè)性化服務(wù)并且請(qǐng)求用戶執(zhí)行用戶登記處理(S210)。這里,基本服務(wù)是在A/V裝置中默認(rèn)配置的服務(wù),并且如果輸入他的/她的話音的用戶尚未通過用于個(gè)性化服務(wù)的用戶登記,則因此沒有個(gè)性化服務(wù)提供給用戶。換句話說,基本服務(wù)是臨時(shí)提供給尚未在數(shù)據(jù)庫260中登記的用戶的服務(wù)。例如,如果用戶輸入“推薦節(jié)目”命令,則確定單元240分析輸入命令?;诜治鼋Y(jié)果,確定結(jié)果,即用戶輸入命令是請(qǐng)求個(gè)性化服務(wù)命令,被發(fā)送到輪流確定輸入他的/她的話音的用戶是否是在數(shù)據(jù)庫260中登記的用戶的服務(wù)搜索單元250。
然后,如果確定已經(jīng)輸入命令(“推薦節(jié)目”)的用戶是還未在數(shù)據(jù)庫260中登記的用戶,則給用戶提供在A/V裝置中默認(rèn)配置的基本服務(wù)(例如,“MBC9點(diǎn)新聞”節(jié)目),因?yàn)闆]有提供給用戶的個(gè)性化服務(wù)。
另一方面,如果由確定單元240確定輸入命令是請(qǐng)求普通服務(wù)的命令(S130),則服務(wù)搜索單元250搜索數(shù)據(jù)庫260以找到對(duì)應(yīng)輸入命令的普通服務(wù)(S180)。然后,控制單元230給用戶提供由服務(wù)搜索單元250搜索的普通服務(wù)(S170)。
其間,如果另一個(gè)用戶通過安裝在遙控裝置中的無線麥克風(fēng)輸入命令,則執(zhí)行用于用戶的話音和說話者識(shí)別,并將根據(jù)搜索到的關(guān)于用戶的信息的個(gè)性化服務(wù)提供給用戶。
圖3A和3B表示本發(fā)明的個(gè)性化命令表。圖3A表示當(dāng)應(yīng)用視頻器件(數(shù)字TV)時(shí)可輸入的個(gè)性化命令表,圖3B表示應(yīng)用音頻器件(音頻部件,MP3播放器,多媒體播放器,或諸如此類)時(shí)可輸入的個(gè)性化命令表。
首先,參考圖3A,將描述當(dāng)應(yīng)用視頻器件時(shí)可輸入的個(gè)性化命令表。
“最喜歡的頻道”由用戶配置,以提供在數(shù)據(jù)庫260中登記的頻道之一作為他的/她的最喜歡的頻道。即,如果用戶說“最喜歡的頻道”作為命令,則來自存儲(chǔ)在數(shù)據(jù)庫260中的最喜歡的頻道之一的圖片顯示在屏幕上。
“通知預(yù)訂”被配置,以便在節(jié)目廣播開始之前(或之后)向用戶通知該用戶想要接收關(guān)于其通知的任意節(jié)目廣播的開始。即,如果用戶預(yù)訂/輸入關(guān)于具體節(jié)目的信息(廣播時(shí)間、頻道信息、節(jié)目標(biāo)題,等等),則用戶被通知具體節(jié)目的開始。
“通知列表”是用于在數(shù)據(jù)庫260中登記和保持用戶預(yù)訂以被通知其開始的節(jié)目列表的列表。即,如果用戶說“通知列表”作為命令,則登記的“通知列表”顯示在屏幕上。這里,根據(jù)用戶需要可以進(jìn)行列表的操作和處理。
“記錄預(yù)訂”被配置,以便用戶預(yù)訂他/她想要觀看的節(jié)目的記錄。即,如果用戶輸入關(guān)于節(jié)目的信息(廣播時(shí)間、頻道信息、節(jié)目題目,等等),則從設(shè)定的時(shí)間記錄節(jié)目廣播。
“預(yù)訂列表”,是用于在數(shù)據(jù)庫260中登記和保持,用戶預(yù)訂以被記錄和通知的節(jié)目列表的列表。即,如果用戶說“預(yù)訂列表”作為命令,則登記的“預(yù)訂列表”顯示在屏幕上。這里,根據(jù)用戶需要可以進(jìn)行列表的操作和處理。
“記錄列表”,是用于登記和保持記錄在數(shù)據(jù)庫260中的節(jié)目列表的列表。即,如果用戶說“記錄列表”作為命令,則登記的“記錄列表”顯示在屏幕上。這里,根據(jù)用戶需要可以進(jìn)行重放或刪除節(jié)目。
“推薦節(jié)目”是以這種方式配置的,以便用戶接收關(guān)于被該用戶和其他與該用戶具有相似品味的用戶從內(nèi)容提供者或廣播站推薦的節(jié)目的信息,并且登記該信息。即,如果用戶說“推薦節(jié)目”作為命令,則提供給用戶推薦節(jié)目以及它上面的信息。
“按次付費(fèi)頻道”被配置,以當(dāng)搜索或觀看按次付費(fèi)頻道時(shí)根據(jù)通過用戶鑒定(說話者識(shí)別)的用戶個(gè)人信息來確定該用戶是否已經(jīng)被授權(quán)觀看按次付費(fèi)頻道,并向該用戶提供允許的信息。
“成人頻道”被配置,以當(dāng)搜索或觀看有年齡限制的頻道時(shí)根據(jù)通過用戶鑒定(說話者識(shí)別)的用戶個(gè)人信息來確定該用戶是否已經(jīng)被授權(quán)觀看由年齡限制的頻道,并僅當(dāng)該用戶是授權(quán)用戶時(shí)向該用戶提供相關(guān)的信息。
“購物頻道”被配置,以當(dāng)進(jìn)行TV交易時(shí)根據(jù)通過用戶鑒別(說話者識(shí)別)的用戶個(gè)人信息來確定該用戶是否已經(jīng)被授權(quán)進(jìn)行TV交易,并僅當(dāng)該用戶是授權(quán)用戶時(shí)向該用戶提供相關(guān)的信息。
其次,參考圖3B,將描述當(dāng)應(yīng)用音頻器件時(shí)可輸入的個(gè)性化命令表。
“播放”被配置,已通過根據(jù)說出命令用戶的特征信息用戶鑒定(說話者識(shí)別)重放個(gè)性化歌曲列表中的歌曲。換句話說,如果用戶說“播放”作為命令,重放登記在列表中的歌曲。
“依據(jù)流派選擇”被配置,以依據(jù)流派例如韓國流行音樂,爵士樂,古典音樂和外國流行音樂提供個(gè)性化服務(wù)。具體地說,如果用戶說出多個(gè)流派中的一種(例如,“韓國流行音樂”)作為命令,則重放該流派(韓國流行音樂)音樂。
“最喜歡的歌曲列表”,是一系列登記在數(shù)據(jù)庫260中的用戶最喜歡的歌曲。即,如果用戶說“最喜歡的歌曲列表”作為命令,則重放登記的最喜歡的歌曲。
其間,用戶能夠輸入并登記除前述命令之外的其它命令。
圖4表示根據(jù)本發(fā)明的示例性實(shí)施例的通過話音和說話者識(shí)別提供個(gè)性化服務(wù)的方法。首先,當(dāng)觀看體育新聞?lì)l道時(shí),如果用戶對(duì)著安裝在遙控裝置中的無線麥克風(fēng)說“最喜歡的頻道”,話音輸入單元110將由用戶輸入的“最喜歡的頻道”命令發(fā)送給話音識(shí)別單元210。
然后,話音識(shí)別單元210識(shí)別輸入命令,即“最喜歡的頻道”,同時(shí),說話者識(shí)別單元220基于輸入話音執(zhí)行說話者識(shí)別。
隨后,話音識(shí)別單元210轉(zhuǎn)發(fā)該輸入命令(“最喜歡的頻道”)給確定單元240,確定單元240輪流分析該轉(zhuǎn)發(fā)的命令。這里,確定單元240分析該命令,并且通知服務(wù)搜索單元250轉(zhuǎn)發(fā)的命令是對(duì)應(yīng)于“最喜歡的頻道”的命令并且已分析過的命令,即“最喜歡的頻道”,是要求用戶信息的個(gè)性化命令的事實(shí)。
相應(yīng)地,服務(wù)搜索單元250從數(shù)據(jù)庫260中提取說話者識(shí)別單元220識(shí)別的用戶的信息,并且在包含于提取的用戶信息中的服務(wù)列表之中搜索“最喜歡的頻道”列表。
然后,控制單元230給用戶提供其中一個(gè)搜索的最喜歡的頻道(例如,“鄉(xiāng)村時(shí)代”)。
其間,當(dāng)觀看“鄉(xiāng)村時(shí)代”時(shí),如果用戶再一次說“最喜歡的頻道”作為命令,頻道變成在最喜歡的頻道列表中的具有最靠近“鄉(xiāng)村時(shí)代”的標(biāo)號(hào)“午夜TV娛樂”(見圖4中所示的表)。
此外,當(dāng)觀看“鄉(xiāng)村時(shí)代”時(shí),如果用戶說“向下”(或“向上”)作為命令,則頻道變?yōu)榈怯浽谒旅娴摹拔缫筎V娛樂”。
圖5表示根據(jù)本發(fā)明的另一示例性實(shí)施例的通過話音和說話者識(shí)別提供個(gè)性化服務(wù)的方法,其中,通過話音輸入提供給多個(gè)用戶想要得到的頻道服務(wù)。
首先,當(dāng)用戶看TV時(shí),如果用戶對(duì)安裝在遙控裝置中的無線麥克風(fēng)說“最喜歡的頻道”,則話音識(shí)別單元210和說話者識(shí)別單元220執(zhí)行對(duì)應(yīng)于輸入命令“最喜歡的頻道”的話音識(shí)別和說話者識(shí)別。
然后,確定單元240分析輸入命令以確定用戶想得到什么服務(wù),并且將輸入命令是請(qǐng)求個(gè)性化服務(wù)的“最喜歡的頻道”確定結(jié)果通知給服務(wù)搜索單元250。
相應(yīng)地,服務(wù)搜索單元250在存儲(chǔ)在數(shù)據(jù)庫260中的用戶服務(wù)列表之中搜索“最喜歡的頻道”的列表,并且向用戶提供其中一個(gè)最喜歡的頻道(例如,“滑稽音樂會(huì)”)。
其后,如果另一個(gè)用戶對(duì)安裝在遙控裝置中的無線麥克風(fēng)說“最喜歡的頻道”則話音識(shí)別單元210和說話者識(shí)別單元220基于輸入命令“最喜歡的頻道”執(zhí)行話音識(shí)別和說話者識(shí)別。此時(shí),通過說話者識(shí)別確定已經(jīng)輸入命令的用戶不是同一用戶。
然后,確定單元240分析的用戶輸入的命令并且發(fā)送分析結(jié)果給服務(wù)搜索單元250,并且服務(wù)搜索單元250在存儲(chǔ)在數(shù)據(jù)庫260中的用戶服務(wù)列表之中搜索“最喜歡的頻道”的列表并且向用戶提供其中一個(gè)最喜歡的頻道(例如,“夏日氣味”)。
作為本發(fā)明的另一示例性實(shí)施例,以下將描述用戶通過音頻部件收聽音樂的情形。首先,如果該用戶對(duì)安裝在遙控裝置中的無線麥克風(fēng)說“爵士樂”作為命令,則話音輸入單元110發(fā)送由用戶輸入的命令“爵士樂”給話音識(shí)別單元210。
然后,話音識(shí)別單元210識(shí)別該輸入命令“爵士樂”,同時(shí),說話者識(shí)別單元220基于輸入話音執(zhí)行用于用戶的說話者識(shí)別。
隨后,話音識(shí)別單元210轉(zhuǎn)發(fā)輸入命令(“爵士樂”)給輪流分析該轉(zhuǎn)發(fā)命令的確定單元240。此時(shí),確定單元240分析該命令(“爵士樂”)并且轉(zhuǎn)發(fā)分析結(jié)果給服務(wù)搜索單元250。
相應(yīng)地,服務(wù)搜索單元250從數(shù)據(jù)庫260中提取由說話者識(shí)別單元220識(shí)別的關(guān)于用戶的信息,并且在包含于提取的用戶信息中的音樂流派之中搜索和重放爵士樂。
根據(jù)以上描述的本發(fā)明優(yōu)選實(shí)施例,存在一個(gè)優(yōu)點(diǎn),即由于當(dāng)用戶通過無線麥克風(fēng)輸入他的/她的話音時(shí),話音和說話者識(shí)別被同時(shí)執(zhí)行,從而不用執(zhí)行分離的用戶鑒定處理而搜索個(gè)性化服務(wù),并且迅速向用戶提供想要得到的服務(wù)。
此外,存在另一個(gè)優(yōu)點(diǎn),即由于輸入字(命令)可能被平等的應(yīng)用到話音和說話者識(shí)別中,所以用戶不需要記憶用于用戶鑒別的輸入字,并且不必分離地提供用于話音和說話者識(shí)別的器件。
盡管本發(fā)明是結(jié)合優(yōu)選實(shí)施例來描述的,但是很明顯對(duì)于本領(lǐng)域的技術(shù)人員,在不脫離由所附權(quán)利要求限定的本發(fā)明的精神和范圍的情況下,可以對(duì)其進(jìn)行各種修改和變換。因此,對(duì)本發(fā)明實(shí)施例的簡(jiǎn)單變換落于本發(fā)明的范圍內(nèi)。
權(quán)利要求
1.一種通過話音和說話者識(shí)別向用戶提供個(gè)性化服務(wù)的音頻/視頻裝置,包括話音識(shí)別單元,用于識(shí)別話音命令;說話者識(shí)別單元,用于基于話音命令識(shí)別用戶;其中,當(dāng)用戶輸入話音命令時(shí),執(zhí)行對(duì)話音命令的話音識(shí)別和說話者識(shí)別。
2.如權(quán)利要求1所述的裝置,其中,所說的話音命令被輸入到具有用于接收話音命令的話音輸入單元的遙控裝置中。
3.如權(quán)利要求1所述的裝置,還包括確定單元,確定哪個(gè)動(dòng)作與話音識(shí)別單元識(shí)別的話音命令相對(duì)應(yīng)。
4.如權(quán)利要求1所述的裝置,還包括數(shù)據(jù)庫,用于存儲(chǔ)用戶信息、話音信息、關(guān)于用戶的個(gè)性化服務(wù)的信息、和動(dòng)作;和服務(wù)搜索單元,用于在數(shù)據(jù)庫中搜索與識(shí)別的話音命令相對(duì)應(yīng)的服務(wù)和關(guān)于用戶的個(gè)性化服務(wù)的信息。
5.如權(quán)利要求1所述的裝置,其中,同時(shí)執(zhí)行用戶的話音和說話者識(shí)別。
6.一種用于通過話音和說話者識(shí)別提供個(gè)性化服務(wù)的方法,包括由用戶輸入話音命令;識(shí)別話音命令和已輸入話音命令的用戶;基于話音命令確定將執(zhí)行的動(dòng)作;和根據(jù)確定的動(dòng)作執(zhí)行服務(wù)。
7.如權(quán)利要求6所述的方法,其中,基于話音命令確定動(dòng)作的步驟,包括確定哪個(gè)動(dòng)作與話音命令相對(duì)應(yīng);如果確定該動(dòng)作請(qǐng)求個(gè)性化服務(wù),則使用存儲(chǔ)在數(shù)據(jù)庫中的用戶服務(wù)信息搜索相關(guān)的服務(wù);和如果確定該動(dòng)作不請(qǐng)求個(gè)性化服務(wù),則根據(jù)話音命令搜索服務(wù)。
8.如權(quán)利要求6所述的方法,其中,動(dòng)作被均等地應(yīng)用在話音和說話者識(shí)別。
9.如權(quán)利要求6所述的方法,其中,所說的話音命令被輸入到遙控裝置中的無線麥克風(fēng)。
10.如權(quán)利要求6所述的方法,其中,同時(shí)執(zhí)行識(shí)別話音命令和用戶。
11.如權(quán)利要求6所述的方法,其中,使用同一話音命令識(shí)別話音命令和用戶。
12.如權(quán)利要求1所述的裝置,其中,話音識(shí)別單元和說話者識(shí)別單元使用同一話音命令。
全文摘要
一種通過話音和說話者識(shí)別提供個(gè)性化服務(wù)的音頻/視頻裝置,其中,當(dāng)用戶通過遙控裝置中的無線麥克風(fēng)輸入他的/她的話音時(shí),執(zhí)行對(duì)輸入話音的話音識(shí)別和說話者識(shí)別,并且確定與輸入話音相對(duì)應(yīng)的命令,從而,給用戶提供用戶的個(gè)性化服務(wù)。此外,一種通過話音和說話者識(shí)別提供個(gè)性化服務(wù)的方法,包括以下步驟由用戶通過遙控裝置中的麥克風(fēng)輸入他的/她的話音;如果輸入話音,則識(shí)別輸入話音和輸入該話音的說話者;基于輸入話音確定命令;以及根據(jù)確定結(jié)果提供服務(wù)。
文檔編號(hào)G10L15/22GK1591571SQ20041007406
公開日2005年3月9日 申請(qǐng)日期2004年9月2日 優(yōu)先權(quán)日2003年9月3日
發(fā)明者崔承億, 鄭善化, 明寅植, 李貞奉 申請(qǐng)人:三星電子株式會(huì)社