校正語音識別錯誤的方法和應(yīng)用該方法的廣播接收設(shè)備的制作方法
【專利摘要】本發(fā)明提供了一種用于校正語音識別錯誤的方法和一種應(yīng)用該方法的廣播接收設(shè)備。所述用于校正語音識別錯誤的方法包括:接收用戶口語命令;識別用戶口語命令;并且確定與用戶口語命令相對應(yīng)的文本,如果輸入用于校正所確定文本的用戶命令,則顯示文本校正用戶界面,在該文本校正用戶界面中,所確定文本的語素與指示符彼此相關(guān)聯(lián),并且通過選擇文本校正UI的關(guān)聯(lián)指示符來校正所確定文本的語素。相應(yīng)地,廣播接收設(shè)備可以利用用戶期望的詞語正確地校正誤識別的詞語。
【專利說明】校正語音識別錯誤的方法和應(yīng)用該方法的廣播接收設(shè)備
[0001]相關(guān)申請的交叉參考
[0002]本申請要求2012年7月12日在韓國知識產(chǎn)權(quán)局遞交的韓國專利申請N0.10-2012-0076129的優(yōu)先權(quán),其全部公開內(nèi)容通過引用合并于此。
【技術(shù)領(lǐng)域】
[0003]根據(jù)示例實施例的方法和設(shè)備涉及用于校正語音識別錯誤的方法以及應(yīng)用該方法的廣播接收設(shè)備,更具體地涉及用于校正語音識別錯誤的方法,對交互式語音識別系統(tǒng)中誤識別的語音進(jìn)行校正,并且涉及應(yīng)用該方法的廣播接收設(shè)備。
【背景技術(shù)】
[0004]隨著近年來廣播接收設(shè)備已經(jīng)變得多功能性并且已經(jīng)得到發(fā)展,已經(jīng)開發(fā)了用于控制廣播接收設(shè)備的各種輸入方法。例如,已經(jīng)開發(fā)了使用鼠標(biāo)的輸入方法、使用觸摸pad的輸入方法、以及使用運(yùn)動感測遙控器的輸入方法。
[0005]具體地,在各種輸入方法之中,如下的一種語音識別方法變得更普遍:識別用戶的語音和口語(spoken)命令并控制顯示設(shè)備,使得用戶可以更容易地控制廣播接收設(shè)備。
[0006]然而,識別用戶發(fā)出的語音或口語命令并控制廣播接收設(shè)備的方法不能獲得令人滿意的結(jié)果,這是因為不同用戶的口腔結(jié)構(gòu)和發(fā)音不同。
[0007]S卩,如果廣播接收設(shè)備誤識別了用戶發(fā)出的語音或口語命令,則不能根據(jù)用戶的期望控制廣播接收設(shè)備,或者不能搜索到期望的內(nèi)容。此外,如果廣播接收設(shè)備誤識別了用戶發(fā)出的特定詞語,則廣播接收設(shè)備在用戶再次發(fā)出該特定詞語時會一如既往地誤識別該特定詞語。
[0008]因此,需要一種通過校正廣播接收設(shè)備誤識別的語音識別結(jié)果來有效率地校正語音識別錯誤的方法。
【發(fā)明內(nèi)容】
[0009]一個或更多個示例實施例可以克服以上缺點以及以上未描述的其他缺點。然而,應(yīng)當(dāng)理解,一個或更多個實施例不需要克服上述缺點,并且可以不克服任何上述問題。
[0010]一個或更多個示例實施例提供了用于校正語音識別誤差的方法,可以根據(jù)用戶需要校正被廣播接收設(shè)備誤識別的語音識別結(jié)果,并且提供了應(yīng)用該方法的廣播接收設(shè)備。
[0011]根據(jù)示例實施例的一個方面,提供了一種校正廣播接收設(shè)備的語音識別錯誤的方法,該方法包括:接收用戶口語命令;識別用戶口語命令;并且確定與用戶口語命令相對應(yīng)的文本,如果輸入用于校正所確定文本的第二用戶命令,則顯示文本校正用戶界面(Π),在該文本校正用戶界面(UI)中,所確定文本的語素與指示符彼此相關(guān)聯(lián),并且通過選擇文本校正Π的關(guān)聯(lián)指示符來校正所確定文本的語素。
[0012]校正可以包括:如果使用關(guān)聯(lián)指示符選擇語素,則顯示與該語素相對應(yīng)的候選語素,并且如果選擇候選語素,則通過使用所選候選語素替代該語素,來校正該語素。[0013]顯示候選語素可以包括:在候選語素的一側(cè)顯示與該候選語素相對應(yīng)的第二指示符。
[0014]校正目標(biāo)語素可以包括:如果選擇與候選語素相對應(yīng)的第二指示符,則通過使用與所選指示符相對應(yīng)的候選語素來替代要替代的語素,來校正要替代的語素。
[0015]指示符可以是數(shù)字和字符之一。
[0016]確定可以包括:如果輸入用戶口語命令,則將用戶口語命令從模擬信號轉(zhuǎn)換成數(shù)字信號,向外部服務(wù)器發(fā)送經(jīng)轉(zhuǎn)換的數(shù)字信號,并且從服務(wù)器接收與數(shù)字信號相對應(yīng)的文本信息。
[0017]該方法還可以包括:向服務(wù)器發(fā)送校正結(jié)果,以更新服務(wù)器中存儲的語言模型和
聲音模型。
[0018]根據(jù)另一示例實施例的一個方面,提供了一種廣播接收設(shè)備,該廣播接收設(shè)備包括:語音輸入端,接收用戶口語命令;顯示單元;以及控制器,如果通過語音輸入端輸入用戶口語命令,則識別用戶口語命令并確定與用戶口語命令相對應(yīng)的文本;如果輸入用于校正所確定文本的第二用戶命令,則顯示文本校正用戶界面(Π),在該文本校正用戶界面(UI)中,所確定文本的語素與指示符彼此相關(guān)聯(lián),并且通過選擇文本校正Π的關(guān)聯(lián)指示符來校正所確定文本的語素。
[0019]如果使用關(guān)聯(lián)指示符選擇語素,則控制器可以顯示與該語素相對應(yīng)的候選語素,并且如果選擇候選語素,則控制器可以控制顯示單元通過使用所選擇的候選語素替代目標(biāo)語素,來校正目標(biāo)語素。
[0020]控制器可以控制顯示單元在候選語素的一側(cè)顯示顯示與候選語素相對應(yīng)的第二指示符。
[0021]如果選擇與候選語素相對應(yīng)的第二指示符,則控制器可以控制顯示單元通過使用與所選指示符相對應(yīng)的候選語素替代要替代的語素,來校正該語素。
[0022]指示符可以是數(shù)字和字符之一。
[0023]廣播接收設(shè)備還可以包括與外部服務(wù)器通信的通信單元,并且如果通過語音輸入端輸入用戶口語命令,則控制器可以將用戶口語命令從模擬信號轉(zhuǎn)換成數(shù)字信號,向外部服務(wù)器發(fā)送經(jīng)轉(zhuǎn)換的數(shù)字信號,從服務(wù)器接收與數(shù)字信號相對應(yīng)的文本信息,并且可以確定文本信息。
[0024]控制器可以控制通信單元向服務(wù)器發(fā)送校正結(jié)果,以更新服務(wù)器中存儲的語言模型和聲音模型。
[0025]根據(jù)另一示例實施例的一個方面,提供了一種校正廣播接收設(shè)備的語音識別錯誤的方法,該方法包括:識別用戶口語命令;確定與用戶口語命令相對應(yīng)的文本;顯示與所確定文本的語素相對應(yīng)的指示符;并且響應(yīng)于接收與指示符相對應(yīng)的用戶校正命令,校正所確定文本的語素。
[0026]校正語素可以包括:響應(yīng)于接收與指示符相對應(yīng)的用戶校正命令,顯示與所確定文本的語素相對應(yīng)的候選語素;選擇候選語素,并且通過使用所選擇的候選語素替代所確定文本的語素,來校正所確定文本的語素。
[0027]該方法還可以包括:向服務(wù)器發(fā)送校正結(jié)果,以更新服務(wù)器中存儲的語言模型和
聲音模型?!緦@綀D】
【附圖說明】
[0028]參照附圖,通過詳細(xì)描述示例實施例以上和/或其他方面更顯而易見,在附圖中:
[0029]圖1是示出了根據(jù)示例實施例的交互式語音識別系統(tǒng)的視圖;
[0030]圖2是示意性示出了根據(jù)示例實施例的廣播接收設(shè)備的框圖;
[0031]圖3是詳細(xì)示出了根據(jù)示例實施例的廣播接收設(shè)備的框圖;
[0032]圖4至6是示出了根據(jù)示例實施例的使用文本校正用戶界面(UI)校正誤識別的詞語的過程的視圖;以及
[0033]圖7是示出了根據(jù)示例實施例的用于校正語音識別錯誤的方法的流程圖。
【具體實施方式】
[0034]在下文中,參照附圖更詳細(xì)地描述示例實施例。
[0035]在以下描述中,在不同的附圖中,相同附圖標(biāo)記用于表示相同部件。提供在描述中定義的內(nèi)容(例如具體結(jié)構(gòu)和部件)以幫助全面理解本公開。相應(yīng)地,應(yīng)該清楚在沒有那些具體限定的內(nèi)容時也能夠?qū)嵤┦纠詫嵤├?。同樣,因為公知的功能或結(jié)構(gòu)可能以不必要的細(xì)節(jié)混淆本發(fā)明,所以省略對這些公知功能或結(jié)構(gòu)的詳細(xì)描述。
[0036]圖1是示出了根據(jù)示例實施例的交互式語音識別系統(tǒng)10的視圖。如圖1所示,交互式語音識別系統(tǒng)10包括廣播接收設(shè)備100和第一服務(wù)器以及第二服務(wù)器300,以識別用戶口語命令(即,用戶語音命令)。廣播接收設(shè)備100可以是諸如智能電視等設(shè)備,但是這僅是示例。廣播接收設(shè)備100可以由各種電子設(shè)備來實現(xiàn),例如,包括智能電話的移動電話、臺式PC、機(jī)頂盒、筆記本計算機(jī)和導(dǎo)航系統(tǒng)。
[0037]如果通過語音輸入設(shè)備輸入用戶口語命令,則廣播接收設(shè)備100將輸入的用戶口語命令轉(zhuǎn)換成數(shù)字信號,從數(shù)字信號中去除噪聲,并且向第一服務(wù)器200發(fā)送數(shù)字信號。如果從廣播接收設(shè)備100接收到數(shù)字信號,則第一服務(wù)器200使用語言模型、聲音模型和發(fā)音字典將與用戶口語命令相對應(yīng)的數(shù)字信號轉(zhuǎn)換成文本信息,并且向廣播接收設(shè)備100發(fā)送文本信息。
[0038]廣播接收設(shè)備100向第二服務(wù)器300發(fā)送從第一服務(wù)器200接收到的文本信息。如果從廣播接收設(shè)備100接收到文本信息,則第二服務(wù)器300產(chǎn)生與接收到的文本信息相對應(yīng)的響應(yīng)信息,并且向廣播接收設(shè)備100發(fā)送響應(yīng)信息。響應(yīng)信息可以包括與用戶口語命令相對應(yīng)的響應(yīng)消息、控制信號和搜索內(nèi)容的結(jié)果中的至少一個。響應(yīng)消息是對用戶口語命令做出響應(yīng)的文本信息,就好像與用戶對話一樣。例如,如果用戶口語命令是“請搜索000”,響應(yīng)消息可以是對用戶口語命令做出響應(yīng)的文本信息,例如,“我將搜索000”??刂菩盘柺琼憫?yīng)于用戶口語命令控制廣播接收設(shè)備100的信號。例如,如果用戶口語命令是“請將頻道改變到000 (頻道名稱)”,則控制信號是控制廣播接收設(shè)備100的調(diào)諧器調(diào)節(jié)到與用戶口語命令相對應(yīng)的頻道的信號。搜索內(nèi)容的結(jié)果是對用戶的內(nèi)容搜索請求做出響應(yīng)的信息。例如,如果用戶口語命令是“電影000(電影名稱)中誰擔(dān)任主角?”,則搜索內(nèi)容的結(jié)果是與搜索對應(yīng)于用戶口語命令的電影影星的結(jié)果有關(guān)的信息。
[0039]廣播接收設(shè)備100可以基于響應(yīng)信息執(zhí)行與用戶口語命令相對應(yīng)的各種功能。例如,如果輸入改變頻道的用戶口語命令,則廣播接收設(shè)備100調(diào)諧至對應(yīng)頻道并顯示該頻道。在這種情況下,廣播接收設(shè)備100可以提供與用戶請求的功能相對應(yīng)的響應(yīng)消息。在以上示例中,廣播接收設(shè)備100可以以聲音或文本的形式輸出與改變到的頻道有關(guān)的信息或者對頻道已經(jīng)改變加以指示的消息。
[0040]具體地,廣播接收設(shè)備100可以以聲音或文本的形式輸出與用戶口語命令相對應(yīng)的響應(yīng)消息,并且可以輸出與搜索到的內(nèi)容有關(guān)的內(nèi)容數(shù)據(jù)。例如,如果輸入請求諸如“請讓我知道最新的電影”等內(nèi)容信息的用戶口語命令,則廣播接收設(shè)備100可以將諸如“將讓你知道最新電影”等響應(yīng)消息輸出為聲音,并且可以顯示與搜索到的最新電影有關(guān)的內(nèi)容數(shù)據(jù)。
[0041]具體地,廣播接收設(shè)備100可以使用文本校正用戶界面(Π),校正與通過第一服務(wù)器200和第二服務(wù)器300識別的用戶口語命令相對應(yīng)的文本。
[0042]具體地,如果輸入用戶口語命令,則廣播接收設(shè)備100使用第一服務(wù)器200確定文本信息,如上所述。同時,如果所確定文本的一部分是用戶不期望的文本,并且輸入了校正文本的用戶命令(例如,語音命令或遙控器上的特定按鈕),則廣播接收設(shè)備100顯示文本校正Π。此時,文本校正Π將用戶發(fā)出的文本信息劃分成語素,向每個語素分配指示符,并且顯示彼此匹配的語素和指示符。指示符用于區(qū)分文本信息的語素,并且可以是數(shù)字或字符。然而,這僅是示例,指示符可以是用戶指定的詞語或符號。
[0043]如果根據(jù)用戶命令從文本校正UI選擇指示符之一,則廣播接收設(shè)備100指定與所選指示符相對應(yīng)的語素作為要替代的目標(biāo)語素。如果重新輸入了包括要改變到的正確語素在內(nèi)的用戶口語命令,則廣播接收設(shè)備100識別重新輸入的用戶口語命令,并且通過使用重新輸入的語素替代目標(biāo)語素,來校正目標(biāo)語素。
[0044]同樣,廣播接收設(shè)備100可以使用語言模型和聲音模型,在目標(biāo)語素的一側(cè)顯示要替代的目標(biāo)語素的候選語素。此時,可以向目標(biāo)語素的候選語素分配指示符。如果重新輸入了包括與要改變到的正確語素相對應(yīng)的指示符在內(nèi)的用戶口語命令,則廣播接收設(shè)備100可以通過使用候選語素之中與用戶重新輸入的指示符相對應(yīng)的候選語素替代目標(biāo)語素,來校正目標(biāo)語素。
[0045]廣播接收設(shè)備100顯示經(jīng)校正的文本,并且根據(jù)經(jīng)校正的文本來執(zhí)行功能。廣播接收設(shè)備可以向第一服務(wù)器200發(fā)送與校正結(jié)果有關(guān)的信息,以根據(jù)校正結(jié)果更新聲音模型和語目模型。
[0046]如上所述,交互式語音識別系統(tǒng)10通過選擇文本校正UI的指示符來校正誤識別的文本,因此用戶可以用期望的詞語正確地校正被廣播接收設(shè)備100誤識別的詞語。
[0047]在下文中,參照圖2至6詳細(xì)說明根據(jù)示例實施例的廣播接收設(shè)備100。圖2是示意性示出了根據(jù)示例實施例的廣播接收設(shè)備100的框圖。如圖2所示,廣播接收設(shè)備100包括語音輸入單元110 (例如,語音輸入等)、控制器120和顯示單元130 (例如,顯示器等)。
[0048]語音輸入單元110通過諸如麥克風(fēng)等語音輸入設(shè)備接收用戶口語命令,并且執(zhí)行信號處理,從而能夠識別語音或口語命令。具體地,語音輸入單元110接收模擬形式的用戶口語命令,將用戶口語命令轉(zhuǎn)換成數(shù)字信號,并且從數(shù)字信號中去除噪聲。
[0049]顯示單元130在控制器120的控制下輸出不同視頻數(shù)據(jù)。具體地,如果輸入校正文本的用戶命令,則顯示單元130顯示文本校正UI。
[0050]如果通過語音輸入單元110輸入用戶口語命令,則控制器120識別用戶口語命令,并且確定與用戶口語命令相對應(yīng)的文本。如果輸入校正所確定文本的用戶命令,則控制器120顯示其中構(gòu)成文本的語素與指示符彼此匹配的文本校正H。此時,文本校正Π將用戶發(fā)出的文本信息劃分成語素,向每個語素分配指示符,并且顯示彼此匹配的語素和指示符。指示符用于區(qū)分文本信息的語素,并且可以是數(shù)字或字符。
[0051]控制器120控制顯示單元130通過選擇文本校正UI的指示符,來校正所確定文本的至少一個語素。具體地,如果使用文本校正Π的指示符選擇要替代的目標(biāo)語素,則控制器120可以顯示要替代的目標(biāo)語素的候選語素。如果選擇候選語素之一,則控制器120可以控制顯示單元130通過使用所選候選語素替代目標(biāo)語素,來校正目標(biāo)語素。
[0052]此時,控制器可以控制顯示單元130在候選語素的一側(cè)顯示與候選語素相對應(yīng)的指示符。如果選擇候選語素的指示符之一,則控制器120可以控制顯示單元130通過使用與所選指示符相對應(yīng)的候選語素替代目標(biāo)語素來校正目標(biāo)語素。
[0053]控制器120可以控制顯示單元130顯示反映了校正結(jié)果的文本信息。同樣,控制器120可以更新內(nèi)部或外部服務(wù)器中存儲的聲音模型和語言模型,以更新校正結(jié)果。
[0054]如上所述,廣播接收設(shè)備100通過選擇文本校正Π的指示符來校正誤識別的文本,使得用戶可以用期望的詞語來校正廣播接收設(shè)備100誤識別的詞語。
[0055]圖3是詳細(xì)示出了根據(jù)示例實施例的廣播接收設(shè)備100的框圖。如圖3所示,廣播接收設(shè)備100包括語音輸入單元110、控制器120、顯示單元130、廣播接收單元140 (例如,廣播接收機(jī)等)、用戶輸入單元150 (例如,用戶輸入端等)、存儲單元160 (例如,存儲裝置等)、通信單元170 (例如,通信器等)以及音頻輸出單元180 (例如,音頻輸出等)。
[0056]語音輸入單元110接收用戶口語命令,并對用戶口語命令進(jìn)行信號處理,使得可以識別用戶口語命令。具體地,語音輸入單元110將模擬形式的用戶口語命令轉(zhuǎn)換成數(shù)字信號。語音輸入單元110計算經(jīng)轉(zhuǎn)換的數(shù)字信號的能量,并且確定數(shù)字信號的能量是否大于或等于預(yù)定值。如果數(shù)字信號的能量小于預(yù)定值,則語音輸入單元110確定輸入的數(shù)字信號不是用戶口語命令,并等待另一用戶口語命令。如果數(shù)字信號的能量大于或等于預(yù)定值,則語音輸入單元110從輸入的數(shù)字信號中去除噪聲。具體地,語音輸入單元110從數(shù)字信號中去除通常家庭中產(chǎn)生的不期望噪聲(例如,空調(diào)的聲音、真空吸塵器的聲音和音樂聲)。語音輸入單元110向通信單元17輸出去除了噪聲的數(shù)字信號。
[0057]語音輸入單元110可以由諸如麥克風(fēng)等語音輸入設(shè)備來實現(xiàn),并且語音輸入設(shè)備可以嵌入在廣播接收設(shè)備100中作為一體機(jī)型設(shè)備,或者可以實現(xiàn)為與廣播接收設(shè)備100分離的獨立型設(shè)備。如果語音輸入單元115實現(xiàn)為獨立型,則語音輸入設(shè)備可以以由用戶手握持形式或以放置在桌上的形式來實現(xiàn),并且可以以有線或無線方式連接至廣播接收設(shè)備 100。
[0058]廣播接收單元140從廣播站或外部設(shè)備(例如,機(jī)頂盒)接收包括多個頻道的廣播信號。廣播接收單元140調(diào)諧至用戶選擇的頻道的廣播信號,并且對廣播信號進(jìn)行信號處理。
[0059]用戶輸入單元150接收用戶命令,來控制廣播接收設(shè)備100。用戶輸入單元150可以由諸如遙控器、鼠標(biāo)和鍵盤等各種輸入設(shè)備來實現(xiàn)。
[0060]存儲單元160存儲用于驅(qū)動廣播接收設(shè)備100的各種程序和數(shù)據(jù)。具體地,存儲單元160可以存儲用于識別語音或口語命令的語言模型、聲音模型和發(fā)音字典。[0061]通信單元170與外部服務(wù)器200和300通信。具體地,通信單元170可以向第一服務(wù)器200發(fā)送與從語音輸入單元110接收到的用戶口語命令相對應(yīng)的數(shù)字信號,并且可以從第一服務(wù)器200接收與用戶口語命令相對應(yīng)的文本信息。同樣,通信單元170可以向第二服務(wù)器300發(fā)送與用戶口語命令相對應(yīng)的文本信息,并且可以從第二服務(wù)器300接收與文本信息相對應(yīng)的響應(yīng)信息。響應(yīng)信息可以包括響應(yīng)消息、控制信號和用戶請求搜索的內(nèi)容的內(nèi)容數(shù)據(jù)。
[0062]通信單元170可以通過根據(jù)無線通信協(xié)議(例如,W1-Fi和IEEE)與外部網(wǎng)絡(luò)相連的無線通信模塊來實現(xiàn)。除此之外,無線通信模塊還可以包括移動通信模塊,移動通信模塊訪問移動網(wǎng)絡(luò)并且根據(jù)各種移動通信標(biāo)準(zhǔn)(例如,第三代(3G)、第三代合作伙伴(3GPP)和長期演進(jìn)(LTE))與移動網(wǎng)絡(luò)通信.[0063]在以上示例實施例中,集成的通信單元與第一服務(wù)器200和第二服務(wù)器300通信。然而,這僅是示例,并且通信單元可以劃分成與第一服務(wù)器200通信的第一通信單元以及與第二服務(wù)器300通信的第二通信單元。
[0064]顯示單元130在控制器120的控制下顯示視頻數(shù)據(jù)。具體地,如果輸入校正文本的用戶命令,則顯示單元130顯示文本校正UI,如圖4所示。以下更詳細(xì)地說明文本校正UI400。
[0065]顯示單元130可以使用液晶顯示器(IXD)、有機(jī)發(fā)光二極管(OLED)顯示器、或等離子顯示面板(rop)來實現(xiàn)。
[0066]音頻輸出單元180輸出音頻數(shù)據(jù)。音頻輸出單元180可以輸出從內(nèi)容數(shù)據(jù)轉(zhuǎn)換的音頻數(shù)據(jù)。同時,音頻輸出單元180可以由諸如揚(yáng)聲器或插孔等輸出端口來實現(xiàn)。
[0067]控制器120根據(jù)通過語音輸入單元110和用戶輸入單元150輸入的用戶命令,控制廣播接收設(shè)備100的總體操作。
[0068]具體地,如果通過語音輸入單元110輸入用戶口語命令,則控制器120執(zhí)行語音識另|J。具體地,控制器120控制語音輸入單元110將通過語音輸入單元110輸入的模擬形式用戶口語命令轉(zhuǎn)換成數(shù)字信號,并且從數(shù)字信號中去除噪聲。控制器120通過通信單元170向第一服務(wù)器200發(fā)送與用戶口語命令相對應(yīng)的數(shù)字信號。如果第一服務(wù)器200使用聲音模型、語言模型和發(fā)音字典將與用戶口語命令相對應(yīng)的數(shù)字信號轉(zhuǎn)換成文本信息,并且向廣播接收設(shè)備100發(fā)送文本信息,則控制器120通過通信單元170接收文本信息。
[0069]控制器120可以在顯示單元130上顯示接收到的文本信息,或者可以向第二外部服務(wù)器300發(fā)送文本信息。
[0070]如上所述,廣播接收設(shè)備100使用第一外部服務(wù)器200確定與用戶口語命令相對應(yīng)的文本。然而,這僅是示例,并且廣播接收設(shè)備100可以使用其中包括的聲音模型、語言模型和發(fā)音字典來確定與用戶口語命令相對應(yīng)的文本。
[0071]如果確定了與用戶口語命令相對應(yīng)的文本,則用戶識別顯示單元130上顯示的文本信息,使得用戶可以識別是否正確識別出用戶發(fā)出的文本。同樣,用戶識別從第二服務(wù)器200接收到的響應(yīng)信息,使得用戶可以識別是否正確識別出用戶發(fā)出的文本。例如,如果用戶發(fā)出的語音或口語命令是“請讓我知道今天MBN上播出什么”,但是控制器120確定與用戶口語命令相對應(yīng)的文本信息是“請讓我知道今天MBC上播出什么”并在顯示單元130上顯示該文本,則用戶識別到廣播接收設(shè)備100誤識別了用戶口語命令。[0072]如果誤識別了用戶發(fā)出的語音或口語命令并且用戶輸入了校正文本的用戶命令(例如,遙控器上的特定按鈕或用戶語音命令),則控制器120控制顯示單元130顯示文本校正Π400,以校正廣播接收設(shè)備100識別的文本,如圖4所示。
[0073]文本校正UI400將文本信息劃分成多個語素,向每個語素分配指示符(例如,數(shù)字、字符、符號等),并且將語素與指示符彼此匹配。例如,如果識別到的文本信息是“請讓我知道今天MBC上播出什么”,則文本校正UI400將文本信息劃分成語素,“今天”420-1、“MBC” 420-2、“上” 420-3、“播出什么” 420-4以及“請讓我知道” 420-5,并且顯示語素。文本校正UI400將“今天”420-1與“I”410-1匹配,將“MBC”420-2與“2” 410-2匹配,將“上”420-3與“3” 410-3匹配,將“播出什么” 420-4與“4” 410-4匹配,并且將“請讓我知道”420-5 與 “5” 410-5 匹配。
[0074]如果用戶口語命令包括文本校正Π400中包括的指示符之一,則控制器120可以選擇與所選指示符相對應(yīng)的語素作為要替代的目標(biāo)語素。例如,如果用戶口語命令包括指示符“2” 410-2,則控制器120可以選擇與指示符“2” 410-2相對應(yīng)的語素“MBC” 420-2作為要替代的目標(biāo)語素。
[0075]如果用戶口語命令包括要校正目標(biāo)語素的語素以及指示符,則控制器120可以通過使用正確的語素替代目標(biāo)語素來校正目標(biāo)語素。例如,如果通過語音輸入單元110輸入用戶口語命令“請將數(shù)字2改變到MBN”,則控制器120向第一服務(wù)器200發(fā)送與用戶口語命令相對應(yīng)的數(shù)字信號,并且第一服務(wù)器200確定與輸入的用戶口語命令相對應(yīng)的文本信息。第一服務(wù)器200通過廣播接收設(shè)備100向第二服務(wù)器300發(fā)送文本信息。第二服務(wù)器300基于輸入的用戶口語命令的“2”,確定要替代的目標(biāo)語素,基于“MBN”確定正確的語素,并且基于“請改變”確定校正命令。第二服務(wù)器300向廣播接收設(shè)備100發(fā)送控制信號“請將要替代的目標(biāo)語素改變到正確語素“MBN””。如果通過通信單元170接收到控制信號,則控制器120通過使用正確語素“MBN”替代要替代的目標(biāo)語素“MBC”420-2,來校正目標(biāo)語素。
[0076]根據(jù)另一示例實施例,如果用戶口語命令包括文本校正UI400中包括的指示符之一,則控制器120可以控制顯示單元130顯示要替代的目標(biāo)語素的候選語素??梢曰趶V播接收設(shè)備100或第一服務(wù)器200中存儲的聲音模型、語言模型和發(fā)音字典,確定要替代的目標(biāo)語素的候選語素,并且候選語素可以是除了目標(biāo)語素以外與用戶口語命令最可能一致的語素。例如,如果用戶口語命令中包括“數(shù)字”2,則控制器120可以顯示如圖5和6所示的候選語素430。候選語素可以是“MBN”、“NBC”和“ABC”。
[0077]如圖5所示,可以向每個候選語素分配指示符。例如,可以向“MBN”分配指示符“ 1”,可以向“NBC”分配指示符“2”,并且可以向“ABC”分配指示符“3”。
[0078]如果在顯示候選語素的同時選擇與候選語素相對應(yīng)的指示符之一,則控制器120可以使用與所選指示符相對應(yīng)的候選語素來替代目標(biāo)語素。例如,如果通過語音輸入單元110輸入用戶口語命令“請改變到數(shù)字1”,則廣播接收設(shè)備100向第一服務(wù)器200發(fā)送與用戶口語命令相對應(yīng)的數(shù)字信號,并且第一服務(wù)器200確定與輸入的用戶口語命令相對應(yīng)的文本信息。第一服務(wù)器200通過廣播接收設(shè)備100向第二服務(wù)器300發(fā)送文本信息。第二服務(wù)器300可以基于輸入的用戶口語命令確定正確語素,并且可以基于“請改變”確定校正命令。第二服務(wù)器300可以向廣播接收設(shè)備100發(fā)送控制信號“請將要替代的目標(biāo)語素“MBC”改變到正確語素“MBN””。如果通過通信單元170接收到控制信號,則控制器120可以通過使用正確語素“MBN”替代目標(biāo)語素“MBC” 420-2,來校正該目標(biāo)語素。
[0079]如果通過由正確語素替代來校正目標(biāo)語素,則控制器120可以向第一服務(wù)器200發(fā)送校正結(jié)果,以更新第一服務(wù)器200中存儲的語言模型和聲音模型。例如,如果初始識別的“MBC”由“MBN”替代,則控制器120可以向第一服務(wù)器200發(fā)送校正結(jié)果,以更新語言模型和聲音模型,并且增加用戶發(fā)出的語音或口語命令的數(shù)字信號與文本“MBN”一致的概率。相應(yīng)地,如果隨后用戶發(fā)出“MBN”,則廣播接收設(shè)備100識別出“MBN”而不是“MBC”的概率增大,并因此能夠更精確地識別語音或口語命令。
[0080]如上所述,用戶可以使用廣播接收設(shè)備100更容易地校正誤識別的語音命令。
[0081]在下文中,參照圖7詳細(xì)說明用于校正語音識別錯誤的方法。
[0082]首先,廣播接收設(shè)備100接收用戶口語命令(S710)。廣播接收設(shè)備100可以使用諸如麥克風(fēng)等語音輸入設(shè)備接收用戶口語命令。
[0083]廣播接收設(shè)備100識別用戶口語命令,并且確定與用戶口語命令相對應(yīng)的文本(S720)。具體地,廣播接收設(shè)備100可以將輸入的用戶口語命令轉(zhuǎn)換成數(shù)字信號,并且可以向第一外部服務(wù)器200發(fā)送數(shù)字信號。第一服務(wù)器200使用聲音模型、語言模型、發(fā)音字典,確定與數(shù)字信號相對應(yīng)的文本信息,并且向廣播接收設(shè)備100發(fā)送文本信息。然后,廣播接收設(shè)備100確定與用戶口語命令相對應(yīng)的文本。
[0084]廣播接收設(shè)備100確定是否輸入校正文本的用戶命令(S730)。
[0085]如果輸入了校正文本的用戶命令(S730-Y),則廣播接收設(shè)備100顯示文本校正UI (S470)。此時,文本校正Π將文本劃分成語素,向語素分配指示符(例如,數(shù)字或字符),并且顯示彼此匹配的語素和指示符。
[0086]廣播接收設(shè)備100通過選擇文本校正UI的指示符來校正文本(S750)。具體地,如果使用文本校正Π的指示符來選擇要替代的目標(biāo)語素,則廣播接收設(shè)備100可以顯示目標(biāo)語素的候選語素,如圖5所示。如果選擇候選語素之一,則廣播接收設(shè)備100可以通過使用所選擇的候選語素替代目標(biāo)語素,來校正目標(biāo)語素。同時,廣播接收設(shè)備100可以在候選語素一側(cè)上顯示與候選語素相對應(yīng)的指示符。其后,如果選擇候選語素的指示符之一,則廣播接收設(shè)備100可以通過使用與所選指示符相對應(yīng)的候選語素替代目標(biāo)語素,來校正目標(biāo)語素。
[0087]廣播接收設(shè)備100顯示反映了校正結(jié)果的文本信息,并且向第一服務(wù)器200發(fā)送校正結(jié)果,以更新第一服務(wù)器200中的聲音模型和語言模型。
[0088]如上所述,使用指示符來校正誤識別的文本,使得用戶可以在校正語言識別錯誤時防止再次發(fā)生誤識別。
[0089]用于執(zhí)行根據(jù)所述各個示例實施例的校正語言誤識別錯誤的方法的程序代碼可以存儲在非暫時性計算機(jī)可讀介質(zhì)中。非暫時性計算機(jī)可讀介質(zhì)是指半永久地存儲數(shù)據(jù)而不是極短時間內(nèi)存儲數(shù)據(jù)的介質(zhì),例如寄存器、緩存和存儲器,并由設(shè)備可讀。具體地,上述各個應(yīng)用或程序可以存儲在非暫時性計算機(jī)可讀介質(zhì)中,例如CD、DVD、硬盤、藍(lán)光盤、USB、記憶卡、和ROM存儲器以及CD-ROM,并且可以在非暫時性計算機(jī)可讀介質(zhì)中提供。
[0090]上述示例實施例和優(yōu)點僅是示例性的,不應(yīng)視為為限制本發(fā)明構(gòu)思。示例實施例可以容易地應(yīng)用在其他類型的設(shè)備。此外,示例實施例的描述是為了示意目的,并不是要限制權(quán)利要求的范圍,對于所屬領(lǐng)域技術(shù)人員而言,許多備選方式、修改和改變都是顯而易見的。
【權(quán)利要求】
1.一種校正廣播接收設(shè)備的語音識別錯誤的方法,所述方法包括: 如果輸入用戶語音,則識別用戶語音并確定與用戶語音相對應(yīng)的文本; 如果輸入用于校正所確定文本的用戶命令,則顯示文本校正用戶界面UI,在所述文本校正用戶界面Π中,構(gòu)成文本的語素與指示符彼此匹配;并且 通過選擇文本校正UI的指示符來校正所確定文本的至少一個語素。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述校正包括: 如果使用指示符選擇要替代的目標(biāo)語素,則顯示要替代的目標(biāo)語素的候選語素;并且如果選擇候選語素之一,則通過使用所選擇的候選語素替代要替代的目標(biāo)語素,來校正目標(biāo)語素。
3.根據(jù)權(quán)利要求2所述的方法,其中,顯示候選語素包括:在候選語素的一側(cè)顯示與該候選語素相對應(yīng)的指示符。
4.根據(jù)權(quán)利要求3所述的方法,其中,校正目標(biāo)語素包括:如果選擇候選語素的指示符之一,則通過使用與所選擇指示符相對應(yīng)的候選語素替代要替代的目標(biāo)語素,來校正目標(biāo)語素。
5.根據(jù)權(quán)利要求1所述的方法,其中,指示符是數(shù)字和字符之一。
6.根據(jù)權(quán)利要求1所述的方法,其中,確定包括: 如果輸入用戶語音,則將用戶語音從模擬信號轉(zhuǎn)換成數(shù)字信號; 向外部服務(wù)器發(fā)送經(jīng)轉(zhuǎn)換的數(shù)字信號;并且 從服務(wù)器接收與數(shù)字信號相對應(yīng)的文本信息。
7.根據(jù)權(quán)利要求6所述的方法,還包括:向服務(wù)器發(fā)送校正結(jié)果,以更新服務(wù)器中存儲的語言模型和聲音模型。
8.一種廣播接收設(shè)備,包括: 語音輸入單元,接收用戶語音; 顯示單元;以及 控制器,如果通過語音輸入單元輸入用戶語音,則識別用戶語音并確定與用戶語音相對應(yīng)的文本;如果輸入用于校正所確定文本的用戶命令,則顯示文本校正用戶界面UI,在該文本校正用戶界面Π中,構(gòu)成文本的語素與指示符彼此匹配;并且控制顯示單元通過選擇文本校正UI的指示符,來校正所確定文本的至少一個語素。
9.根據(jù)權(quán)利要求8所述的廣播接收設(shè)備,其中,如果使用所述指示符選擇要替代的目標(biāo)語素,則控制器顯示要替代的目標(biāo)語素的候選語素,并且如果選擇候選語素之一,則控制器控制顯示單元通過使用所選擇的候選語素替代要替代的目標(biāo)語素,來校正目標(biāo)語素。
10.根據(jù)權(quán)利要求9所述的廣播接收設(shè)備,其中,控制器控制顯示單元在候選語素的一側(cè)顯示與候選語素相對應(yīng)的指示符。
11.根據(jù)權(quán)利要求10所述的廣播接收設(shè)備,其中,如果選擇候選語素的指示符之一,則控制器控制顯示單元通過使用與所選擇的指示符相對應(yīng)的候選語素替代要替代的目標(biāo)語素,來校正目標(biāo)語素。
12.根據(jù)權(quán)利要求8所述的廣播接收設(shè)備,其中,指示符是數(shù)字和字符之一。
13.根據(jù)權(quán)利要求8所述的廣播接收設(shè)備,還包括:與外部服務(wù)器通信的通信單元, 其中,如果通過語音輸入單元輸入用戶語音,則控制器將用戶語音從模擬信號轉(zhuǎn)換成數(shù)字信號,通過通信單元向外部服務(wù)器發(fā)送經(jīng)轉(zhuǎn)換的數(shù)字信號,并且從服務(wù)器接收與數(shù)字信號相對應(yīng)的文本信息,并且確定文本信息。
14.根據(jù)權(quán)利要求13所述的廣播接收設(shè)備,其中,控制器控制通信單元向服務(wù)器發(fā)送校正結(jié)果,以更新 服務(wù)器中存儲的語言模型和聲音模型。
【文檔編號】H04N21/472GK103546787SQ201310292411
【公開日】2014年1月29日 申請日期:2013年7月12日 優(yōu)先權(quán)日:2012年7月12日
【發(fā)明者】樸城佑, 金裁徹, 鄭宰旭 申請人:三星電子株式會社