圖像處理設備及其控制方法和圖像處理系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供一種圖像處理設備及其控制方法和圖像處理系統(tǒng)。所述圖像處理設備包括:語音輸入單元,接收用戶話語;語音處理器,處理與用戶話語相應的語音命令以確定語音命令的預設操作;控制器,如果輸入到語音輸入單元的用戶話語與由語音處理器確定的預設操作不匹配,則控制器調(diào)整語音命令的預設操作,并根據(jù)調(diào)整結(jié)果執(zhí)行調(diào)整后的與用戶話語匹配的預設操作。
【專利說明】圖像處理設備及其控制方法和圖像處理系統(tǒng)
【技術(shù)領域】
[0001]與示例性實施例一致的設備和方法涉及一種處理從外部提供的圖像信號(諸如廣播信號)以基于處理的圖像信號顯示圖像的圖像處理設備及其控制方法和圖像處理系統(tǒng),更具體地講,涉及一種識別用戶的語音命令以執(zhí)行與語音命令相應的功能或操作的圖像處理設備及其控制方法和圖像處理系統(tǒng)。
【背景技術(shù)】
[0002]圖像處理設備根據(jù)各種圖像處理操作來處理從外部源提供的圖像信號/圖像數(shù)據(jù)。圖像處理設備可基于處理的圖像信號在其顯示面板上顯示圖像,或者將處理的圖像信號輸出到具有面板的另一顯示設備以基于處理的圖像信號在面板上顯示圖像。也就是說,只要圖像處理設備可處理圖像信號,其可包括或不包括用于顯示圖像的面板。前一種情況可被實現(xiàn)為TV,后一種情況可被實現(xiàn)為機頂盒。
[0003]圖像處理設備隨著技術(shù)的發(fā)展不斷地添加功能或擴展其功能。在這種趨勢下,提供了各種配置和方法來將用戶期望的命令輸入到圖像處理設備。例如,在圖像處理設備中,如果用戶從遙控器按下鍵/按鈕,則控制信號被發(fā)送到圖像處理設備以執(zhí)行用戶期望的操作。然而,需要一種更加快速地識別用戶的輸入命令和意圖并且更加容易地接受各種類型的輸入命令的圖像處理設備。
【發(fā)明內(nèi)容】
[0004]因此,一個或多個示例性實施例提供一種將用于識別用戶命令并執(zhí)行操作的時間最小化的電子裝置、服務器及其控制方法。
[0005]可通過提供一種圖像處理設備來實現(xiàn)上述和/或其它方面,所述圖像處理設備包括:圖像處理器,處理圖像信號以基于處理的圖像信號顯示圖像;語音輸入單元,接收用戶話語;語音處理器,處理與用戶話語相應的語音命令以確定語音命令的預設操作;控制器,如果輸入到語音輸入單元的用戶話語與由語音處理器確定的預設操作不匹配,則控制器調(diào)整語音命令的預設操作,并根據(jù)調(diào)整結(jié)果執(zhí)行調(diào)整后的與用戶話語匹配的預設操作。
[0006]控制器可提供用于調(diào)整針對語音命令的預設操作的指定狀態(tài)的用戶界面(UI),如果為預定話語的語音命令指定的預設操作通過所述Π從第一操作被調(diào)整到第二操作,則當接收到用戶話語的輸入時,控制器可執(zhí)行第二操作。
[0007]所述Π可引導或指示用戶講話,如果用戶話語根據(jù)對講話的指示被輸入到語音輸入單元,則控制器可將多個預設操作中的一個預設操作選擇為與用戶話語的語音命令相應的第二操作。
[0008]所述Π可引導或指示用戶操縱安裝在用戶輸入單元中的多個輸入按鈕,控制器可將為根據(jù)用于操縱安裝在用戶輸入單元中的所述多個輸入按鈕的指示所操縱的輸入按鈕預先指定的操作選擇為所述多個預設操作中的第二操作。
[0009]所述Π可包括多個預設操作的列表,控制器可將從所述多個預設操作的列表選擇的操作選擇為第二操作。
[0010]所述UI可被提供以用于設置宏指令,其中,所述宏指令用于通過輸入單個話語來順序執(zhí)行與多個話語相應的多個操作。
[0011]當與包括在宏指令中的所述多個預設操作中的第一操作相應的用戶的單個話語被輸入到語音輸入單元時,控制器可執(zhí)行宏指令。
[0012]所述圖像處理設備還可包括連接到通信服務器的通信組件,其中,當用戶話語被輸入到語音輸入單元時,控制器控制語音處理器和服務器之一處理與用戶話語相應的語音命令。
[0013]所述通信組件可與語音至文本(STT)服務器通信,其中,STT服務器將用戶話語轉(zhuǎn)換為包括文本的語音命令,并且,如果用戶話語被輸入到語音輸入單元,則控制器可將用戶話語的語音信號發(fā)送到STT服務器,并可從STT服務器接收與用戶話語相應的語音命令。
[0014]如果語音命令是包括少于預定數(shù)量的詞語的若干詞語的短句,則控制器可控制語音處理器處理語音命令,如果語音命令是包括多于或等于預定數(shù)量的詞語的若干詞語的會話語句,則控制器可控制服務器處理語音命令。
[0015]所述圖像處理設備還可包括顯示器,其基于由圖像處理器處理的圖像信號在顯示器上顯示圖像。
[0016]根據(jù)示例性實施例的另一方面,提供一種圖像處理設備的控制方法,所述控制方法包括:接收用戶話語;處理與用戶話語相應的語音命令以確定語音命令的預設操作;如果預設操作與用戶話語不匹配,則調(diào)整語音命令的預設操作,并根據(jù)調(diào)整結(jié)果設置圖像處理設備以執(zhí)行調(diào)整后的與用戶話語匹配的預設操作。
[0017]調(diào)整語音命令的預設操作并根據(jù)調(diào)整結(jié)果設置圖像處理設備以執(zhí)行調(diào)整后的與用戶話語匹配的預設操作的步驟可包括:提供用于調(diào)整針對語音命令的預設操作的指定狀態(tài)的用戶界面(UI);當為預定用戶話語的語音命令指定的預設操作通過所述Π從第一操作被調(diào)整到第二操作時,在接收到用戶話語時設置圖像處理設備以執(zhí)行第二操作。
[0018]所述Π可引導或指示用戶講話,并且,調(diào)整的步驟可包括:如果根據(jù)對講話的指示而輸入了用戶話語,則通過Π將多個預設操作中的一個操作選擇為與用戶話語的語音命令相應的第二操作。
[0019]所述Π可引導或指示用戶操縱安裝在圖像處理設備的用戶輸入單元中的多個輸入按鈕,并且,調(diào)整的步驟可包括:將為根據(jù)用于操縱安裝在用戶輸入單元中的所述多個輸入按鈕的指示所操縱的輸入按鈕預先指定的操作選擇為第二操作。
[0020]所述Π可包括多個預設操作的列表,并且,調(diào)整的步驟可包括:將來自所述多個預設操作的列表的操作選擇為第二操作。
[0021 ] 所述UI可被提供以用于設置宏指令,其中,所述宏指令用于通過輸入用戶的單個話語來順序執(zhí)行與多個話語相應的多個操作。
[0022]所述控制方法還可包括:如果與包括在宏指令中的所述多個預設操作中的第一操作相應的用戶話語被輸入到語音輸入單元,則執(zhí)行宏指令。
[0023]所述圖像處理設備可與服務器通信,并且,執(zhí)行預設操作的步驟可包括:通過所述圖像處理設備和服務器之一處理與用戶話語相應的語音命令。
[0024]所述圖像處理設備可與STT服務器通信,其中,所述STT服務器將用戶話語轉(zhuǎn)換為包括文本的語音命令,并且,輸入用戶話語的步驟可包括:將用戶話語的語音信號發(fā)送到STT服務器;從STT服務器接收與用戶話語相應的語音命令。
[0025]所述控制方法可包括:如果語音命令是包括少于預定數(shù)量的詞語的若干詞語的短句,則控制所述圖像處理設備處理語音命令,如果語音命令是包括多于或等于預定數(shù)量的詞語的若干詞語的會話語句,則控制服務器處理語音命令。
[0026]根據(jù)示例性實施例的另一方面,提供一種圖像處理系統(tǒng),包括:圖像處理設備,處理圖像信號以基于處理的圖像信號顯示圖像;服務器,與圖像處理設備通信,其中,所述圖像處理設備包括:語音輸入單元,接收用戶話語;語音處理器,處理與用戶話語相應的語音命令以確定語音命令的預設操作;控制器,如果通過語音輸入單元輸入了話語,則控制器控制語音處理器和服務器之一處理與話語相應的語音命令,其中,如果語音處理器的預設操作與輸入到語音輸入單元的話語不匹配,則控制器調(diào)整語音命令的預設操作,并根據(jù)調(diào)整結(jié)果執(zhí)行調(diào)整后的與話語匹配的預設操作。
[0027]根據(jù)示例性實施例的另一方面,提供一種圖像處理設備,包括:語音輸入單元,接收用戶的語音命令;語音處理器,確定圖像處理設備的與用戶的語音命令相應的預設操作;控制器,當由語音處理器確定的預設操作與由用戶的語音命令指示的操作不匹配時,控制器指示用戶調(diào)整與用戶的語音命令相應的預設操作,并根據(jù)調(diào)整結(jié)果執(zhí)行調(diào)整后的與用戶的語音命令匹配的預設操作。
[0028]控制器可提供用于調(diào)整預設操作以與由用戶的語音命令指示的操作匹配的用戶界面(UI),并且當接收到用戶的語音命令的后續(xù)輸入時執(zhí)行調(diào)整后的操作。
[0029]控制器還可提供用于設置宏指令的第二 UI,其中,所述宏指令用于順序執(zhí)行圖像處理設備的與用戶的單個語音命令相應的多個操作。
[0030]如果用戶的單個語音命令被輸入到語音輸入單元,則控制器可執(zhí)行宏指令。
【專利附圖】
【附圖說明】
[0031]通過下面結(jié)合附圖進行的示例性實施例的描述,以上和/或其它方面將變得清楚和更加容易理解,附圖中:
[0032]圖1是根據(jù)示例性實施例的顯示設備的框圖;
[0033]圖2是示出圖1中的顯示設備和服務器的交互結(jié)構(gòu)的框圖;
[0034]圖3示出如存儲在圖2中的顯示設備或會話服務器中的用于與語音命令相應的操作的數(shù)據(jù)庫的示例;
[0035]圖4至圖6示出用于在圖2中的顯示設備中設置語音命令的用戶界面(UI)的示例;
[0036]圖7示出根據(jù)示例性實施例的可在顯示設備中設置的宏指令中的序列的示例;
[0037]圖8至圖12示出用于設置圖7中的宏指令的UI的示例。
【具體實施方式】
[0038]以下,將參照附圖來詳細描述示例性實施例,以便本領域中的普通技術(shù)人員容易地理解示例性實施例。示例性實施例可按照各種形式來實現(xiàn),而不限于在此闡述的示例性實施例。為了清楚,省略對公知部件的描述,相同的標號始終表示相同的元件。[0039]圖1是根據(jù)示例性實施例的圖像處理設備100的框圖。
[0040]以下的示例性實施例解釋了可在其自身上顯示圖像的圖像處理設備100,但是本發(fā)明構(gòu)思可應用于不在其自身上顯示圖像而將圖像信號/控制信號輸出到另一顯示設備的其它裝置。因此,本發(fā)明構(gòu)思不限于以下的示例性實施例。示例性實施例解釋了被實現(xiàn)為TV的圖像處理設備100。
[0041]如圖1中所示,根據(jù)示例性實施例的圖像處理設備100或者顯示設備100從圖像供應源(未示出)接收圖像信號??杀伙@示設備100接收的圖像信號在類型或?qū)傩陨喜皇芟拗疲?,顯示設備100可接收由廣播站的發(fā)送設備(未示出)發(fā)送的廣播信號,對廣播信號調(diào)諧,并顯示廣播圖像。
[0042]顯示設備100包括:圖像接收器110,從圖像供應源(未示出)接收圖像信號;圖像處理器120,根據(jù)預設圖像處理操作處理由圖像接收器110接收的圖像信號;顯示單元130,基于由圖像處理器120處理的圖像信號在其上顯示圖像;通信單元140,與外部裝置(諸如服務器10)通信;由用戶操縱的用戶輸入單元150 ;語音輸入單元160,從外部接收語音或聲音;語音處理器170,闡釋并處理輸入到語音輸入單元160的語音/聲音;存儲單元180,在其中存儲數(shù)據(jù)/信息;控制器190,控制顯示設備100的整體操作。
[0043]圖像接收器110以有線或無線方式接收圖像信號/圖像數(shù)據(jù),并將圖像信號/圖像數(shù)據(jù)發(fā)送到圖像處理器120。圖像接收器110可根據(jù)接收的圖像信號的標準和顯示設備100的類型而變化。例如,圖像接收器110可根據(jù)諸如復合視頻、分量視頻、超視頻、SCART、高清晰度多媒體接口(HDMI)、顯示端口(DisplayPort)、統(tǒng)一顯示接口(UDI)或無線HD標準的標準來接收射頻(RF)信號或圖像信號。如果圖像信號是廣播信號,則圖像接收器110包括用于對每個頻道的廣播信號進行調(diào)諧的調(diào)諧器。
[0044]圖像處理器120根據(jù)各種圖像處理操作處理由圖像接收器110接收的圖像信號。圖像處理器120將處理的圖像信號輸出到顯示單元130,其中,在顯示單元130上基于處理的圖像信號來顯示圖像。例如,如果廣播信號被圖像接收器110調(diào)諧到特定頻道,則圖像處理器120從與該頻道相應的廣播信號提取圖像、語音和附加數(shù)據(jù),將圖像信號調(diào)整到預設分辨率,并在顯示單元130上顯示圖像。
[0045]圖像處理器120的圖像處理操作可包括(但不限于)與圖像數(shù)據(jù)的圖像格式相應的解碼操作、用于將隔行圖像數(shù)據(jù)轉(zhuǎn)換為逐行圖像數(shù)據(jù)的去隔行操作、用于將圖像數(shù)據(jù)調(diào)整到預設分辨率的縮放操作、用于改善圖像質(zhì)量的降噪操作、細節(jié)增強操作、幀刷新率轉(zhuǎn)換
坐寸ο
[0046]圖像處理器120被實現(xiàn)為集成上述功能的片上系統(tǒng)(SOC),或者被實現(xiàn)為通過將各個元件安裝到印刷電路板(PCB)(未示出)上以執(zhí)行上述圖像處理操作所形成的且被安裝到顯示設備100中的圖像處理板(未示出)。
[0047]顯示單元130基于由圖像處理器120輸出的圖像信號在其上顯示圖像。顯示單元130可被實現(xiàn)為各種類型的顯示面板,包括液晶、等離子體、發(fā)光二極管(LED)、有機發(fā)光二極管(OLED)、表面?zhèn)鲗щ娮影l(fā)射器、碳納米管和納米晶體,但不限于此。
[0048]顯示單元130還可根據(jù)其類型而包括另外的元件。例如,作為IXD的顯示單元130可包括LCD面板(未示出)、用于向LCD面板發(fā)射光的背光單元(未示出)以及用于驅(qū)動LCD面板(未不出)的面板驅(qū)動基板(未不出)。[0049]通信單元140發(fā)送和接收數(shù)據(jù),以在顯示設備100和服務器10之間進行交互通信。通信單元140根據(jù)服務器10的通信協(xié)議通過有線/無線廣域網(wǎng)/局域網(wǎng)或本地連接被連接到服務器10。
[0050]用戶輸入單元150通過用戶的操縱和輸入將預設的各種控制命令或信息發(fā)送到控制器190。用戶輸入單元150被實現(xiàn)為安裝在顯示設備100的外圍部分的菜單鍵或輸入面板,或者被實現(xiàn)為與顯示設備100分離/分開的遙控器。另外,用戶輸入單元150可被以集成方式形成在顯示單元130中。如果顯示單元130是觸摸屏,則用戶可觸摸顯示在顯示單元130上的輸入菜單(未示出)以將預設命令發(fā)送到控制器190。
[0051]語音輸入單元160可被實現(xiàn)為麥克風或其它聲音接收裝置,檢測從顯示設備100的外部環(huán)境產(chǎn)生的各種聲音。由語音輸入單元160檢測的聲音包括用戶話語和由除了用戶之外的各種因素產(chǎn)生的其它聲音。
[0052]語音處理器170在由顯示設備100執(zhí)行的各種預設處理中處理輸入到語音輸入單元160的語音/聲音。由語音處理器170處理的“語音”表示輸入到語音輸入單元160的語音。由圖像處理器120處理的圖像信號可包括由圖像處理器120處理的語音數(shù)據(jù)。
[0053]如果語音/聲音被輸入到語音輸入單元160,則語音處理器170確定輸入的語音/聲音是由用戶話語引起的還是由其它因素產(chǎn)生的。該確定可使用包括如下方法的各種配置:確定輸入的語音/聲音是否具有與人類語音相應的波長/頻帶的方法、或者確定輸入的語音/聲音是否落在預先指定的用戶語音配置(voice profile)之下的方法。
[0054]如果確定已經(jīng)輸入了用戶話語,則語音處理器170處理與該話語相應的語音命令以確定與語音命令相應的預設操作。語音命令表示由用戶說出的內(nèi)容。稍后將對此進行詳細描述。
[0055]在示例性實施例中,分開設置語音處理器170和圖像處理器120。然而,這僅是為了便于清楚地解釋示例性實施例的目的而進行的功能性分類,不表示在實現(xiàn)示例性實施例的構(gòu)思的顯示設備100中圖像處理器120和語音處理器170必定彼此分開。S卩,顯示設備100可包括集成圖像處理器120和語音處理器170的信號處理器(未示出)。
[0056]存儲單元180根據(jù)控制器190的控制在其中存儲數(shù)據(jù)。存儲單元180被實現(xiàn)為非易失性存儲器(諸如閃存或硬盤驅(qū)動器)。存儲單元180被控制器190、圖像處理器120或語音處理器170訪問,存儲在存儲單元180中的數(shù)據(jù)可被控制器190、圖像處理器120或語音處理器170讀取/寫入/修改/刪除/更新。
[0057]當通過語音輸入單元160接收到用戶話語時,控制器190控制語音處理器170處理輸入的話語??刂破?90確定與該話語相應的語音命令是短句還是會話語句,并根據(jù)確定結(jié)果控制語音處理器170或服務器10處理語音命令。更具體地講,如果語音命令是短句,則控制器190控制語音處理器170處理語音命令。如果語音命令是會話語句,則控制器190通過通信單元140將語音命令發(fā)送到服務器10,以由服務器10處理語音命令。
[0058]圖2是示出顯示設備100與服務器20和30的交互結(jié)構(gòu)的框圖。
[0059]如圖2中所示,顯示設備100包括通信單元140、語音輸入單元160、語音處理器170和控制器190。該配置與圖1中解釋的配置相同。通信單元140連接到語音至文本(STT)服務器20和會話服務器30,其中,STT服務器20將用戶話語轉(zhuǎn)換為語音命令,會話服務器30分析語音命令以確定語音命令的相應操作。[0060]當接收到語音信號時,STT服務器20分析語音信號的波形,將語音信號的內(nèi)容轉(zhuǎn)換為文本。當從顯示設備100接收到用戶話語的語音信號時,STT服務器20將語音信號轉(zhuǎn)換為語音命令。
[0061]會話服務器30包括用于顯示設備100的與語音命令相應的各種操作的數(shù)據(jù)庫。會話服務器30分析由顯示設備100發(fā)送的語音命令,將控制信號發(fā)送到顯示設備100以執(zhí)行與語音命令相應的操作。
[0062]如果用戶話語被輸入到語音輸入單元160,則控制器190將話語的語音信號發(fā)送到STT服務器20,并從STT服務器20接收與話語相應的語音命令。
[0063]控制器190確定由STT服務器20發(fā)送的語音命令是短句還是會話語句。如果語音命令是短句,則控制器190控制語音處理器170處理語音命令。如果語音命令是會話語句,則控制器190控制會話服務器30處理語音命令。
[0064]如果語音命令是短句,則語音處理器170根據(jù)控制器190的控制來搜索存儲在存儲單元180中的數(shù)據(jù)庫,以指定顯示設備100的與所述語音命令相應的功能或操作。控制器190控制指定的操作被執(zhí)行。
[0065]如果語音命令是會話語句,則控制器190將語音命令發(fā)送到會話服務器30。會話服務器30分析由顯示設備100發(fā)送的語音命令,以指定顯示設備100的操作。會話服務器30將用于指示指定的操作的控制信號發(fā)送到顯示設備100,其中,顯示設備100根據(jù)控制信號執(zhí)行操作。
[0066]然后,根據(jù)用戶話語來執(zhí)行顯示設備100的預設的相應操作。
[0067]根據(jù)語音命令是短句還是會話語句來選擇語音命令的處理主體的處理可取決于顯示設備100的系統(tǒng)負載和處理能力。由于會話語句是自然語言,因此對根據(jù)會話語句的語音命令內(nèi)的期望的相應操作進行機器提取相對不易。由于通過使用顯示設備100的有限資源無法容易地分析根據(jù)會話語句的語音命令,因此根據(jù)會話語句的語音命令可被會話服務器30處理,從而處理各種話語。
[0068]這樣的配置可在設計上變化,并且,可由顯示設備100執(zhí)行STT服務器20和會話服務器30中的至少一個的處理。例如,顯示設備100 (不是服務器20和30)可將用戶話語轉(zhuǎn)換為語音命令,或者分析根據(jù)會話語句的語音命令。
[0069]使用上述配置,控制器190控制語音處理器170或會話服務器30執(zhí)行指定與用戶話語的語音命令相應的操作的處理。下文中,將描述由控制器190控制語音處理器170指定顯示設備100的與語音命令相應的操作的配置。由會話服務器30指定與語音命令相應的顯示設備100的操作的配置可采用下文中將描述的示例性實施例。
[0070]圖3示出存儲在顯示設備100或會話服務器30中的關于與語音命令相應的操作的數(shù)據(jù)庫210的示例。
[0071]如圖3中所示,存儲單元180在其中存儲與相應于用戶話語的語音命令匹配的數(shù)據(jù)庫210以及由顯示設備100執(zhí)行的各種功能或操作?!安僮鳌北硎居娠@示設備100執(zhí)行且支持的任何類型的操作和功能。
[0072]控制器190 (例如,控制語音處理器170)基于預定的語音命令搜索數(shù)據(jù)庫210,并可確定哪個操作相應于語音命令。
[0073]數(shù)據(jù)庫210僅表示數(shù)據(jù)建立原則或方法之一,不限制示例性實施例。如附圖中示出的數(shù)據(jù)庫210指示一個命令相應于一個操作,但這僅為了便利的目的。數(shù)據(jù)庫210可指示多個命令相應于一個操作。僅為了便利的目的來指定數(shù)據(jù)庫210的標號。
[0074]例如,如果與用戶話語相應的語音命令是“開啟”,則控制器190可(例如,控制語音處理器170)基于語音命令“開啟”搜索數(shù)據(jù)庫210,并確定與語音命令“開啟”相應的操作是“開啟系統(tǒng)”。
[0075]然后,控制器190可考慮顯示設備100的當前狀態(tài)選擇性地執(zhí)行操作。如果顯示設備100已經(jīng)被開啟,則控制器190可不執(zhí)行操作“開啟系統(tǒng)”。如果顯示設備100當前被關閉,則控制器190控制顯示設備100開啟系統(tǒng)。
[0076]作為另一示例,如果用戶在顯示設備100顯示圖像時說“太吵了”,則控制器190可(例如,控制語音處理器170)從數(shù)據(jù)庫210指定與語音命令“太吵了”相應的操作是“靜音”。控制器190將顯示的圖像的音量調(diào)節(jié)至零,以執(zhí)行“靜音”操作。
[0077]作為另一示例,如果用戶在顯示設備100顯示圖像時說“我什么都聽不到”,則控制器190可(例如,控制語音處理器170)從數(shù)據(jù)庫210確定與命令“我什么都聽不到”相應的操作是“將音量提高5級”。然后,控制器190將顯示的圖像的音量提高5級。
[0078]通過上述方法,控制器190可執(zhí)行與用戶話語相應的操作。
[0079]然而,由于用戶具有不同的講話習慣和結(jié)構(gòu),因此在通過使用STT服務器20或語音處理器170的語音識別邏輯來闡釋用戶講出的所有詞語方面,上述用于識別用戶話語命令的配置可能不總是產(chǎn)生準確結(jié)果。
[0080]例如,如果用戶說“開啟”,則STT服務器20會將話語的語音信號轉(zhuǎn)換為另一語音命令,而非語音命令“開啟”。如果數(shù)據(jù)庫210不具有轉(zhuǎn)換的語音命令,則控制器190不會執(zhí)行與該語音命令相應的任何操作。
[0081]另外,轉(zhuǎn)換的語音命令會存在于數(shù)據(jù)庫210中,但會不同于用戶的語音命令。例如,如果用戶已講出“開啟”而轉(zhuǎn)換的語音命令是“關閉”,則控制器190可確定與該語音命令相應的操作是“關閉系統(tǒng)”。關于用戶話語“開啟”,不同于用戶的意圖,上述情況導致關閉顯示設備100的系統(tǒng)。
[0082]考慮上述來提供以下根據(jù)示例性實施例的方法:
[0083]如果輸入到語音輸入單元160的用戶話語與相應操作不匹配,則控制器190允許用戶調(diào)整關于用戶語音命令的相應操作。如果相同的話語稍后被輸入,則控制器190根據(jù)調(diào)整結(jié)果執(zhí)行與所述話語匹配的相應操作。
[0084]更具體地講,當發(fā)生預設事件時,控制器190提供用于在數(shù)據(jù)庫210中調(diào)整用戶語音命令和相應操作之間的互連或?qū)P系的設置狀態(tài)的用戶界面(Π)。預設事件可包括由用戶對用戶輸入單元150的操縱或用戶語音導致的請求UI的命令的產(chǎn)生。
[0085]在第一操作被指定用于預定的第一命令的初始狀態(tài),如果與第一命令相應的操作通過UI被調(diào)整為不同于第一操作的第二操作,則控制器190根據(jù)所述調(diào)整來更新數(shù)據(jù)庫210。如果與用戶話語相應的語音命令是第一命令,則控制器190基于更新的數(shù)據(jù)庫210執(zhí)行第二操作,而非第一操作。
[0086]在第一操作被指定用于第一命令的初始狀態(tài),如果作為新的語音命令的第二命令被指定用于第一操作,則控制器190根據(jù)所述指定更新數(shù)據(jù)庫210。如果與用戶話語相應的語音命令是第一命令或第二命令,則控制器190基于更新的數(shù)據(jù)庫執(zhí)行第一操作。[0087]結(jié)果,語音識別操作可被調(diào)整為與用戶意圖一致。
[0088]下文中,將描述通過Π改變語音命令的設置的方法。
[0089]圖4至圖6示出用于設置語音命令的UI220、230和240的示例。
[0090]如圖4中所示,用戶通過用戶輸入單元150請求控制器190顯示用于改變與話語相應的語音命令的設置的Π220??刂破?90顯示Π220。
[0091]UI220包括引導用戶講話的信息,從而指定反映了用戶設置的語音命令和話語。用戶在顯示Π220時講出語音命令。
[0092]如果在顯示Π220時通過語音輸入單元160輸入用戶話語,則控制器190控制語音處理器170或STT服務器20將用戶話語轉(zhuǎn)換為語音命令。
[0093]如圖5中所示,控制器190顯示Π230,其中,UI230引導用戶指定期望的操作以指定存儲在數(shù)據(jù)庫210 (參照圖3)中的顯示設備100的各種操作中的與輸入的語音命令相應的操作。
[0094]在先前Π220(參照圖4)被顯示時提供Π230,以使用戶選擇與用戶話語的語音命令相應的操作。
[0095]例如,將考慮在顯示Π220(參照圖4)時用戶說“開啟”的情況。用戶根據(jù)Π230的引導按下被實現(xiàn)為遙控器的用戶輸入單元150的電源按鈕151??刂破?90將用戶話語所轉(zhuǎn)換成的語音命令與由用戶操縱的電源按鈕151進行匹配,并更新數(shù)據(jù)庫210(參照圖3)。
[0096]由于電源按鈕151是觸發(fā)類型(toggle type),因此,如果用戶按下電源按鈕151,則執(zhí)行兩種類型的結(jié)果,即,開啟和關閉。在這種情況下,UI230可另外提供用于選擇開啟或關閉的選項。
[0097]作為另一示例,將考慮在顯示Π220(參照圖4)時用戶講出語音命令“降低音量”的情況。用戶根據(jù)UI230的引導按下用戶輸入單元150的音量降低按鈕152。然后,控制器190進行調(diào)節(jié)以執(zhí)行與語音命令“降低音量”相應的音量降低按鈕152的操作。
[0098]也就是說,即使用戶話語被轉(zhuǎn)換為與實際內(nèi)容不同的語音命令,用戶也可指定或調(diào)節(jié)與語音命令相應的操作,結(jié)果,可執(zhí)行與用戶意圖匹配的操作。
[0099]如圖6中所示,在示例性實施例的另一方面,如果在顯示Π220(參照圖4)時輸入用戶話語,則控制器190可顯示Π240以選擇與關于話語的語音命令相應的操作,其中,UI240包括多個預設操作的列表。
[0100]在UI240中顯示列表的方法可變化,包括通過滾動型列表、或彈出列表或菜單或包括子項的樹形菜單按預設順序顯示多個操作,使得用戶可選擇若干代表項之一。
[0101]在上述方法中,當在數(shù)據(jù)庫210中特定語音命令被設置用于第一操作時,控制器190可將該語音命令的指定狀態(tài)從第一操作調(diào)整為第二操作,或者添加與第一操作相應的新的語音命令。
[0102]然而,第一操作和第二操作可以是用于調(diào)整相同功能的數(shù)值等級(figurelevel)的操作,但是等級數(shù)可以不同。
[0103]例如,將考慮用戶話語的語音命令“降低音量”以及相應操作是用于將當前音量降低7級的操作的情況。如果7級如以上解釋的通過Π被調(diào)整為5級,則控制器190以調(diào)整的內(nèi)容來更新數(shù)據(jù)庫210。[0104]如果稍后輸入“降低音量”的用戶話語,則控制器190將音量降低5級。
[0105]如以上,通過Π更新數(shù)據(jù)庫210可反映用戶的各種意圖。
[0106]控制器190可設置宏指令,在宏指令中,通過用戶的單個語音命令、講出的詞語或講出的句子來順序執(zhí)行與用戶講出的多個語句相應的多個操作。
[0107]圖7示出根據(jù)示例性實施例的宏指令中的序列的示例。
[0108]如圖7中所示,控制器190可提供用于宏指令的設置以順序執(zhí)行多個操作,這可由用戶通過Π來設置。
[0109]UI的實現(xiàn)方法可變化,例如,UI可被提供以從各種現(xiàn)有操作的列表順序選擇操作。
[0110]將考慮用戶設置用于自動執(zhí)行睡眠預定和報警設置的宏指令的情況。在這種情況下,操作的序列包括睡眠預定功能310的選擇、關閉顯示設備100的系統(tǒng)電源的時間320、報警設置功能330的選擇、報警時間340 (例如,響鈴、通知用戶)以及序列完成的設置350。
[0111]當接收到通過經(jīng)用戶輸入單元150的用戶操縱或經(jīng)語音輸入單元160的用戶話語進行的用于設置宏指令的請求時,控制器190顯示用于設置宏指令的UI。
[0112]圖8至圖12示出用于設置宏指令的UI410、420、430、440和450的示例。
[0113]如圖8中所示,控制器190顯示Π410,Π410,用于選擇宏指令的第一操作。UI410被提供,以選擇多個操作之一,用戶可操縱用戶輸入單元150或者講出與用于選擇宏指令的第一操作的操作相應的語音命令。在圖8中示出的示例性實施例中,用戶通過UI410選擇“睡眠預定”操作。
[0114]如圖9中所示,如果用戶選擇“睡眠預定”,則控制器190顯示Π420,用于指定其后關閉顯示設備100的時間。
[0115]UI420被提供,以選擇多個預設時間示例。否則,UI420可被提供,以使用戶通過他/她的話語輸入時間或通過用戶輸入單元150輸入時間。
[0116]如圖10中所示,控制器190顯示Π430,使用戶選擇是完成了包括如以上解釋的操作序列的宏指令的設置還是通過添加操作繼續(xù)設置宏指令。
[0117]用戶可選擇“完成”以完成宏指令的設置或者選擇“繼續(xù)”。
[0118]如圖11中所示,如果用戶從Π430(參照圖10)選擇“繼續(xù)”,則控制器190向用戶顯示Π440,以選擇宏指令的下一操作。UI440的類型與圖8中的情況基本相似。
[0119]用戶通過Π440選擇“報警設置”操作。
[0120]如圖12中所示,控制器190顯示Π450,使用戶根據(jù)先前選擇的“報警設置”操作的選擇來指定報警時間。
[0121]用戶可在顯示UI450時通過用戶輸入單元150輸入數(shù)字或者講出數(shù)字,從而設置報警時間。
[0122]如果完成了設置操作,則控制器190如圖10中所示顯示Π430。如果用戶選擇“完成”,則控制器190將用于設置圖7中的序列中的操作的宏指令存儲在存儲單元180的數(shù)據(jù)庫中。
[0123]如果用戶講出與宏指令中的第一操作相應的語音命令,S卩,講出屬于“睡眠預定”的語音命令,則控制器190順序執(zhí)行如宏指令中設置的多個操作。否則,在設置宏指令的過程中,新的語音命令可被設置用于執(zhí)行宏指令。[0124]如以上,可通過用戶的簡單語音命令順序執(zhí)行所述多個操作。
[0125]雖然已經(jīng)示出和描述了一些示例性實施例,但是本領域的技術(shù)人員將理解,在不脫離本發(fā)明構(gòu)思的原理和精神的情況下,可在這些示例性實施例中進行改變,其中,本發(fā)明構(gòu)思的范圍由權(quán)利要求及其等同物限定。
【權(quán)利要求】
1.一種圖像處理設備,包括: 圖像處理器,處理圖像信號以基于處理的圖像信號顯示圖像; 語音輸入單元,接收用戶話語; 語音處理器,處理與用戶話語相應的語音命令以確定語音命令的預設操作; 控制器,如果輸入到語音輸入單元的用戶話語與由語音處理器確定的預設操作不匹配,則控制器調(diào)整語音命令的預設操作,并根據(jù)調(diào)整結(jié)果執(zhí)行與用戶話語匹配的預設操作。
2.根據(jù)權(quán)利要求1所述的圖像處理設備,其中,控制器提供用于調(diào)整語音命令的預設操作的指定狀態(tài)的用戶界面(Π),如果為預定的用戶話語的語音命令指定的預設操作通過所述Π從第一操作被調(diào)整到第二操作,則當接收到用戶話語的輸入時,控制器執(zhí)行第二操作。
3.根據(jù)權(quán)利要求2所述的圖像處理設備,其中,所述Π引導用戶講話,如果用戶話語通過所述Π的引導被輸入到語音輸入單元,則控制器將多個預設操作中的一個預設操作選擇為與用戶話語的語音命令相應的第二操作。
4.根據(jù)權(quán)利要求3所述的圖像處理設備,其中,所述Π引導用戶操縱安裝在用戶輸入單元中的多個輸入按鈕,控制器將為通過引導所操縱的輸入按鈕預先指定的操作選擇為所述多個預設操作中的第二操作。
5.根據(jù)權(quán)利要求3所述的圖像處理設備,其中,所述UI包括多個預設操作的列表,控制器將從列表選擇的操作選擇為第二操作。
6.根據(jù)權(quán)利要求2所述的圖像處理設備,其中,所述UI被提供用于設置宏指令,其中,所述宏指令用于通過單個話語順序執(zhí)行與多個話語相應的多個預設操作。`
7.根據(jù)權(quán)利要求6所述的圖像處理設備,其中,如果與包括在宏指令中的多個預設操作中的第一操作相應的用戶話語被輸入,則控制器執(zhí)行宏指令。
8.根據(jù)權(quán)利要求1所述的圖像處理設備,還包括連接到服務器以進行通信的通信單元,其中,如果用戶話語被輸入,則控制器控制語音處理器和服務器之一處理與用戶話語相應的語首命令。
9.根據(jù)權(quán)利要求8所述的圖像處理設備,其中,通信單元與語音至文本(STT)服務器通信,其中,STT服務器將用戶話語轉(zhuǎn)換為文本的語音命令,并且,如果用戶話語被輸入到語音輸入單元,則控制器將用戶話語的語音信號發(fā)送到STT服務器,并從STT服務器接收與用戶話語相應的語音命令。
10.根據(jù)權(quán)利要求8所述的圖像處理設備,其中,如果語音命令是短句,則控制器控制語音處理器處理語音命令,如果語音命令是會話語句,則控制器控制服務器處理語音命令。
11.根據(jù)權(quán)利要求1所述的圖像處理設備,還包括顯示單元,其中,所述顯示單元基于由圖像處理器處理的圖像信號在顯示單元上顯示圖像。
12.—種圖像處理設備的控制方法,包括: 接收用戶話語; 處理與用戶話語相應的語音命令以確定語音命令的預設操作; 如果預設操作與用戶話語不匹配,則調(diào)整語音命令的預設操作,并根據(jù)調(diào)整結(jié)果進行設置以執(zhí)行與用戶話語匹配的預設操作。
13.根據(jù)權(quán)利要求12所述的控制方法,其中,調(diào)整語音命令的預設操作并根據(jù)調(diào)整結(jié)果進行設置以執(zhí)行與用戶話語匹配的預設操作的步驟包括:提供用于調(diào)整關于語音命令的預設操作的指定狀態(tài)的UI;如果為預定的用戶話語的語音命令指定的預設操作通過所述Π從第一操作被調(diào)整到第二操作,則當接收到用戶話語時進行設置以執(zhí)行第二操作。
14.根據(jù)權(quán)利要求13所述的控制方法,其中,所述UI被提供用于設置宏指令,其中,所述宏指令用于 通過用戶的單個話語順序執(zhí)行與多個話語相應的多個預設操作。
【文檔編號】H04N21/472GK103796053SQ201310020547
【公開日】2014年5月14日 申請日期:2013年1月21日 優(yōu)先權(quán)日:2012年10月26日
【發(fā)明者】李周瑛, 潘錫浩, 樸相信 申請人:三星電子株式會社