国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      用戶可配置的話音命令的制作方法

      文檔序號(hào):10579014閱讀:192來源:國知局
      用戶可配置的話音命令的制作方法【專利摘要】話音識(shí)別方法和系統(tǒng)使能用戶可配置的話音命令。針對(duì)給定話音命令,話音識(shí)別引擎提供了供終端用戶選擇要在替代給定話音命令時(shí)使用的話音命令詞語的機(jī)制。該話音識(shí)別引擎或者其模塊從用戶選擇的話音命令詞語針對(duì)該給定話音命令形成替換命令。該話音識(shí)別引擎隨后如同用戶發(fā)出/講出相關(guān)聯(lián)配對(duì)的給定話音命令一樣針對(duì)該替換命令的用戶的講話作出同義響應(yīng)?!緦@f明】用戶可配置的話音命令
      技術(shù)領(lǐng)域
      [00011本申請(qǐng)要求于2013年12月26日提交的美國臨時(shí)申請(qǐng)No.61/920,926的權(quán)益,其全部教導(dǎo)通過引用結(jié)合于此。【
      背景技術(shù)
      】[0002]諸如膝上計(jì)算機(jī)或筆記本PC、智能電話以及平板計(jì)算設(shè)備的移動(dòng)計(jì)算設(shè)備是目前用于在商務(wù)和個(gè)人生活中產(chǎn)生、分析、通信和消費(fèi)數(shù)據(jù)的常用工具。隨著高速無線通信技術(shù)變得無所不在,用戶由于訪問數(shù)字信息的便利性提高而持續(xù)擁抱移動(dòng)數(shù)字生活方式。移動(dòng)計(jì)算設(shè)備的流行使用包括顯示大量的高分辨率計(jì)算機(jī)圖形信息和視頻內(nèi)容,它們經(jīng)常無線地流傳輸至設(shè)備。雖然這些設(shè)備通常包括顯示屏,但是優(yōu)選的高分辨率、大格式顯示的視覺體驗(yàn)無法輕易地在這樣的移動(dòng)設(shè)備中復(fù)制,因?yàn)檫@樣的設(shè)備的物理尺寸受到限制以促進(jìn)其移動(dòng)性。以上提到的設(shè)備類型的另一缺陷在于,用戶接口是依賴于手的,這通常要求用戶使用鍵盤(物理或虛擬的)或觸摸屏顯示器來輸入數(shù)據(jù)或進(jìn)行選擇。作為結(jié)果,消費(fèi)者目前正在尋找免提、高質(zhì)量、便攜式的彩色顯示器解決方案以增強(qiáng)或替代他們的手部依賴的移動(dòng)設(shè)備?!?br/>發(fā)明內(nèi)容】[0003]近期研發(fā)的微型顯示器可以以非常小的形狀系數(shù)提供大格式、高分辨率的彩色圖片和流視頻。針對(duì)這樣的顯示器的一種應(yīng)用可以被集成到佩戴于用戶頭上的無線頭戴式耳機(jī)計(jì)算機(jī)中,其具有處于用戶視場(chǎng)內(nèi)的顯示器,形式類似于眼鏡、頭戴式音頻耳機(jī)或視頻眼罩。[0004]在這里也被稱作頭戴式耳機(jī)計(jì)算機(jī)(HSC)或頭部安裝顯示器(HMD)的"無線計(jì)算頭戴式耳機(jī)"設(shè)備包括一個(gè)或多個(gè)小的、高分辨率的微型顯示器以及用于放大圖像的相關(guān)聯(lián)的光學(xué)器件。高分辨率的微型顯示器可以提供超視頻圖形陣列(SVGA)(800X600)分辨率或擴(kuò)展圖形陣列(XGA)(1024X768)分辨率,或者本領(lǐng)域已知的更高分辨率。[0005]無線計(jì)算頭戴式耳機(jī)包含使能數(shù)據(jù)和流視頻能力的一個(gè)或多個(gè)無線計(jì)算和通信接口,并且提供相比手部依賴的設(shè)備的更大的便利性和移動(dòng)性。[0006]關(guān)于這樣的設(shè)備的更多信息參見于2009年1月5日提交的題為"MobileWirelessDisplaySoftwarePlatformforControllingOtherSystemsandDevices"的共同未決專利申請(qǐng)一美國申請(qǐng)No.12/348,648,于2009年3月27日提交的題為"HandheldWirelessDisplayDevicesHavingHighResolutionDisplaySuitableForUseasaMobileInternetDevice"的PCT國際申請(qǐng)No·PCT/US09/38601,以及于2012年4月25日提交的題為"ImprovedHeadsetComputer"的美國申請(qǐng)No·61/638,419,它們均通過引用全文結(jié)合于此。[0007]如這里使用的,"HSC"頭戴式耳機(jī)計(jì)算機(jī)、"HMD"頭部安裝顯示設(shè)備和"無線計(jì)算頭戴式耳機(jī)"設(shè)備可以被互換使用。[0008]在一個(gè)方面,本發(fā)明是一種頭戴式耳機(jī)計(jì)算機(jī),其包括耦合至處理器的微型顯示器,耦合至該處理器的麥克風(fēng)以及話音識(shí)別引擎。該話音識(shí)別引擎對(duì)用戶向該麥克風(fēng)中的講話作出響應(yīng)。該話音識(shí)別引擎被配置為使得動(dòng)作在識(shí)別出預(yù)設(shè)話音命令時(shí)被執(zhí)行,并且支持用戶可配置的話音命令。[0009]在一個(gè)實(shí)施例中,該話音識(shí)別引擎進(jìn)一步被配置為向該頭戴式耳機(jī)計(jì)算機(jī)的用戶呈現(xiàn)該預(yù)設(shè)話音命令以及相關(guān)聯(lián)字段。該相關(guān)聯(lián)字段被呈現(xiàn)給該用戶從而允許該用戶輸入替代話音命令。該替代話音命令可以被解釋為導(dǎo)致與識(shí)別出該預(yù)設(shè)話音命令時(shí)執(zhí)行的相同動(dòng)作。該話音識(shí)別引擎可以在識(shí)別出該預(yù)設(shè)話音命令或該替代話音命令時(shí)執(zhí)行該動(dòng)作,或者其可以僅在識(shí)別出該預(yù)設(shè)話音命令或該替代話音命令中的一個(gè)或另一個(gè)時(shí)執(zhí)行該動(dòng)作。該特定動(dòng)作可以通過用戶輸入進(jìn)行選擇。[0010]在另一個(gè)實(shí)施例中,該話音識(shí)別引擎在識(shí)別出該替代話音命令時(shí)使得第一動(dòng)作被執(zhí)行。該第一動(dòng)作對(duì)應(yīng)于該預(yù)設(shè)話音命令。在另一個(gè)實(shí)施例中,該第一動(dòng)作僅在該話音識(shí)別引擎識(shí)別出該替代話音命令時(shí)被執(zhí)行。在一個(gè)實(shí)施例中,該第一動(dòng)作在該話音識(shí)別引擎識(shí)別出該替代話音命令時(shí)或者該話音識(shí)別引擎識(shí)別出該預(yù)設(shè)話音命令時(shí)被執(zhí)行。[0011]在另一個(gè)實(shí)施例中,在該相關(guān)聯(lián)字段中輸入的替代話音命令在預(yù)定時(shí)間間隔內(nèi)有效,而在該預(yù)定時(shí)間間隔之后僅該預(yù)設(shè)話音命令有效。在另一個(gè)實(shí)施例中,在該相關(guān)聯(lián)字段中輸入的替代話音命令僅針對(duì)提交該替代命令的用戶有效。[0012]-個(gè)實(shí)施例進(jìn)一步包括話音命令配置模塊,其操作地耦合至該話音識(shí)別引擎。該話音命令配置模塊可以使得終端用戶能夠選擇話音命令詞語以在針對(duì)給定話音命令的替代中使用。用戶選擇的話音命令詞語可以形成針對(duì)給定話音命令的替代命令。[0013]另一個(gè)實(shí)施例進(jìn)一步包括話音命令配置模塊,其被配置為接收來自用戶的替代話音命令,其中該替代話音命令對(duì)應(yīng)于該預(yù)設(shè)話音命令。該話音命令配置模塊進(jìn)一步被配置為將該替代話音命令與要在識(shí)別出預(yù)設(shè)話音命令時(shí)執(zhí)行的動(dòng)作相關(guān)聯(lián)。該話音命令配置模塊被配置為在識(shí)別出該替代話音命令時(shí)執(zhí)行該動(dòng)作。在一個(gè)實(shí)施例中,該話音命令配置模塊進(jìn)一步被配置為在識(shí)別出該預(yù)設(shè)話音命令時(shí)執(zhí)行該動(dòng)作。[0014]在另一個(gè)方面,本發(fā)明是一種話音識(shí)別方法,其包括識(shí)別用戶的講話,使得動(dòng)作在該講話被識(shí)別為預(yù)設(shè)話音命令時(shí)被執(zhí)行,并且支持用戶可配置的話音命令。[0015]-個(gè)實(shí)施例進(jìn)一步包括向頭戴式耳機(jī)計(jì)算機(jī)的用戶呈現(xiàn)該預(yù)設(shè)話音命令以及相關(guān)聯(lián)字段,并且接收輸入至該相關(guān)聯(lián)字段中的替代話音命令。[0016]另一個(gè)實(shí)施例進(jìn)一步包括在識(shí)別出該替代話音命令時(shí)使得第一動(dòng)作被執(zhí)行。該第一動(dòng)作對(duì)應(yīng)于該預(yù)設(shè)話音命令。另一個(gè)實(shí)施例進(jìn)一步包括僅在該話音識(shí)別引擎識(shí)別出該替代話音命令時(shí)執(zhí)行該第一動(dòng)作。再一個(gè)實(shí)施例進(jìn)一步包括在該話音識(shí)別引擎識(shí)別出該替代話音命令時(shí)或者該話音識(shí)別引擎識(shí)別出該預(yù)設(shè)話音命令時(shí)執(zhí)行該第一動(dòng)作。[0017]在一個(gè)實(shí)施例中,在該相關(guān)聯(lián)字段中輸入的替代話音命令在預(yù)定時(shí)間間隔內(nèi)有效,而在該預(yù)定時(shí)間間隔之后僅該預(yù)設(shè)話音命令有效。[0018]在另一個(gè)實(shí)施例中,在該相關(guān)聯(lián)字段中輸入的替代話音命令僅針對(duì)提交該替代命令的用戶有效。[0019]在另一個(gè)方面,本發(fā)明是一種用于識(shí)別話音的非瞬態(tài)計(jì)算機(jī)可讀介質(zhì)。該非瞬態(tài)計(jì)算機(jī)可讀介質(zhì)包括存儲(chǔ)于其上的計(jì)算機(jī)軟件指令。該計(jì)算機(jī)軟件指令在被至少一個(gè)處理器執(zhí)行時(shí)使得計(jì)算機(jī)系統(tǒng)識(shí)別用戶的講話。該計(jì)算機(jī)軟件指令進(jìn)一步使得動(dòng)作在該講話被識(shí)別為預(yù)設(shè)話音命令時(shí)被執(zhí)行。該計(jì)算機(jī)軟件指令進(jìn)一步使得支持用戶可配置的話音命令?!靖綀D說明】[0020]根據(jù)以下對(duì)如附圖中圖示的本發(fā)明的示例實(shí)施例進(jìn)行的更為具體的描述以上內(nèi)容將是顯而易見的,附圖中同樣的附圖標(biāo)記貫穿不同視圖而指代相同的部分。附圖并非必然依比例繪制,而是強(qiáng)調(diào)對(duì)本發(fā)明的實(shí)施例進(jìn)行圖示。[0021]圖1A-1B是根據(jù)本發(fā)明原理的與主機(jī)計(jì)算機(jī)(例如,智能電話、膝上計(jì)算機(jī)等)協(xié)同操作的頭戴式耳機(jī)計(jì)算機(jī)的示意性圖示。[0022]圖2是圖1A-1B的實(shí)施例中的數(shù)據(jù)和控制流程的框圖。[0023]圖3是實(shí)施例中的ASR(自動(dòng)話音識(shí)別)子系統(tǒng)的框圖。[0024]圖4圖示了根據(jù)本發(fā)明的話音識(shí)別方法的一個(gè)實(shí)施例?!揪唧w實(shí)施方式】[0025]對(duì)本發(fā)明的示例實(shí)施的描述如下。[0026]對(duì)這里引用的所有專利、公開申請(qǐng)和參考文獻(xiàn)的教導(dǎo)都通過引用全文結(jié)合于此。[0027]圖IA和IB示出了無線計(jì)算頭戴式耳機(jī)設(shè)備100(其在這里也被稱作頭戴式耳機(jī)計(jì)算機(jī)(HSC)或頭部安裝顯示器(HMD))的示例實(shí)施例,其整合有高分辨率(VGA或更好的)微型顯示器部件1010以及以下描述的其它特征。[0028]HSC100可以包括音頻輸入和/或輸出設(shè)備,包括一個(gè)或多個(gè)麥克風(fēng)、輸入和輸出揚(yáng)聲器、地理定位傳感器(GPS)、三至九軸自由度的方位傳感器、大氣傳感器、健康狀況傳感器、數(shù)字羅盤、壓力傳感器、環(huán)境傳感器、能量傳感器、加速傳感器、位置、姿態(tài)、運(yùn)動(dòng)、速度和/或光學(xué)傳感器、相機(jī)(可見光、紅外等)、多個(gè)無線電裝置、輔助照明、或測(cè)距儀等,和/或嵌入和/或集成到頭戴式耳機(jī)中和/或經(jīng)由一個(gè)或多個(gè)外部端口1020(圖1B)附接至該設(shè)備的傳感器陣列。[0029]通常位于頭戴式耳機(jī)計(jì)算設(shè)備100的外殼內(nèi)的是各種電子電路,包括微型計(jì)算機(jī)(單核或多核處理器)、一個(gè)或多個(gè)有線和/或無線通信接口、存儲(chǔ)器或存儲(chǔ)設(shè)備、各種傳感器以及諸如"熱靴"的外部配件或配件。[0030]HSC100的示例實(shí)施例可以通過感測(cè)語音命令、頭部移動(dòng)110、111、112以及手部手勢(shì)113或者它們的任意組合而接收用戶輸入。操作地耦合至HSC100或者集成于HSC100中的麥克風(fēng)(或多個(gè)麥克風(fēng))可以被用來捕捉話音命令,話音命令隨后使用自動(dòng)話音識(shí)別技術(shù)而被數(shù)字化和處理。陀螺儀、加速計(jì)和其它微型電機(jī)械系統(tǒng)傳感器可以被集成到HSC100中并且被用來跟蹤用戶的頭部移動(dòng)11〇、111、112以提供用戶輸入命令。相機(jī)和運(yùn)動(dòng)跟蹤傳感器可以被用來監(jiān)視針對(duì)用戶輸入命令的用戶的手部手勢(shì)113。這樣的用戶接口可以克服其它移動(dòng)設(shè)備中存在的手部依賴形式的缺陷。[0031]HSC100可以以各種方式使用。其可以被用作用于顯示由遠(yuǎn)程主機(jī)計(jì)算設(shè)備200(圖IA所示)接收和處理的視頻信號(hào)的外部顯示器。主機(jī)200例如可以是筆記本PC、智能電話、平板設(shè)備,或者具有比無線計(jì)算頭戴式耳機(jī)設(shè)備100更小或更大計(jì)算復(fù)雜度的其它計(jì)算設(shè)備,諸如基于云的網(wǎng)絡(luò)資源。頭戴式耳機(jī)計(jì)算設(shè)備100和主機(jī)200可以經(jīng)由一種或多種無線協(xié)議進(jìn)行無線通信,上述無線協(xié)議諸如藍(lán)牙?、WiFi、WiMAX、4GLTE或者其它無線的無線電鏈路150。(藍(lán)牙是華盛頓州98033,Kirkland,5209LakeWashingtonBoulevard的BluetoothSig公司的注冊(cè)商標(biāo))。[0032]在示例實(shí)施例中,主機(jī)200可以進(jìn)一步連接至其它網(wǎng)絡(luò),諸如通過無線連接而連接至互聯(lián)網(wǎng)或其它基于云的網(wǎng)絡(luò)資源,使得主機(jī)200可以充當(dāng)HSC100和網(wǎng)絡(luò)210之間的無線中繼??商鎿Q地,HSC100的一些實(shí)施例可以在不使用主機(jī)無線中繼的情況下直接建立到互聯(lián)網(wǎng)(或者其它基于云的網(wǎng)絡(luò)資源)的無線連接。在這樣的實(shí)施例中,HSC100和主機(jī)200的組件可以被組合到單個(gè)設(shè)備中。[0033]圖IB是示出頭戴式耳機(jī)計(jì)算機(jī)100的示例實(shí)施例的一些細(xì)節(jié)的透視圖。示例實(shí)施例中的HSC100通常包括框架1000、頭帶(strap)1002、后部殼體1004、揚(yáng)聲器1006、具有內(nèi)建式麥克風(fēng)的懸臂或者可替換地被稱作臂或吊桿1008,以及微型顯示器配件1010。[0034]頭部佩戴的框架1000和頭帶1002通常被配置為使得用戶可以將頭戴式耳機(jī)計(jì)算機(jī)設(shè)備100佩戴于用戶的頭上。殼體1004通常是容納電子器件的低位(profile)單元,上述電子器件諸如微處理器、存儲(chǔ)器或其它存儲(chǔ)設(shè)備以及其它相關(guān)聯(lián)的電路。揚(yáng)聲器1006向用戶提供音頻輸出,使得用戶可以聽到信息。微型顯示器配件1010被用來向用戶呈現(xiàn)視覺信息。其耦合至臂1008。臂1008通常提供物理支持,使得微型顯示器配件能夠位于用戶的視場(chǎng)300內(nèi)(圖1A),優(yōu)選地處于用戶眼睛的前面或者優(yōu)選地稍低于或高于眼睛而位于其外部視野內(nèi)。臂1008還提供微型顯示器配件1010和容納于殼體單元1004內(nèi)的控制電路之間的電氣或光學(xué)連接。[0035]根據(jù)以下將更為詳細(xì)地進(jìn)行解釋的多個(gè)方面,HSC顯示設(shè)備100允許用戶在由虛擬顯示器400定義的明顯更大的區(qū)域內(nèi)選擇視場(chǎng)300。用戶通??梢钥刂埔晥?chǎng)300的位置、程度(例如,X-Y或3D范圍)和/或放大率。[0036]雖然圖IA和IB中示出的是呈現(xiàn)利用懸臂吊桿支撐在用戶臉上的單個(gè)固定顯示部件的單眼式微型顯示器,但是應(yīng)當(dāng)理解的是,用于遠(yuǎn)程控制顯示設(shè)備100的其它機(jī)械配置是可能的,諸如具有兩個(gè)分開的微型顯示器(例如,每只眼睛一個(gè))的雙眼式顯示器或者被布置為由雙眼可觀看的單個(gè)微型顯示器。[0037]圖2是示出HSC或HMD設(shè)備100、主機(jī)200以及它們之間傳輸?shù)臄?shù)據(jù)的實(shí)施例的更多細(xì)節(jié)的框圖。HSC或HMD設(shè)備100經(jīng)由麥克風(fēng)接收來自用戶的語音輸入,經(jīng)由位置或方位傳感器、相機(jī)或(多個(gè))光學(xué)傳感器接收手部移動(dòng)或身體姿態(tài),并且經(jīng)由諸如3軸至9軸自由度方位感測(cè)的頭部跟蹤電路接收頭部移動(dòng)輸入。這些被HSC或HMD設(shè)備100中的軟件(處理器)轉(zhuǎn)換為鍵盤和/或鼠標(biāo)命令,鍵盤和/或鼠標(biāo)命令隨后通過藍(lán)牙或其它無線接口150而被發(fā)送至主機(jī)200。主機(jī)200隨后根據(jù)其自己的操作系統(tǒng)/應(yīng)用軟件對(duì)這些轉(zhuǎn)換的命令進(jìn)行解釋以執(zhí)行各種功能。命令中有用于在虛擬顯示器內(nèi)選擇視場(chǎng)300并且將該選擇的屏幕數(shù)據(jù)返回至HSC或HMD設(shè)備100的命令。因此,應(yīng)當(dāng)理解的是,非常大格式的虛擬顯示區(qū)域可能與主機(jī)200上運(yùn)行的應(yīng)用軟件或操作系統(tǒng)相關(guān)聯(lián)。然而,僅該大的虛擬顯示區(qū)域400中處于視場(chǎng)300內(nèi)的部分被返回并且實(shí)際被HSC或HMD設(shè)備100的微型顯示器1010顯示。[0038]在一個(gè)實(shí)施例中,HSC100可以采用共同未決的美國專利公開號(hào)2011/0187640中描述的設(shè)備的形式,其因此通過引用全文結(jié)合于此。[0039]在另一個(gè)實(shí)施例中,本發(fā)明涉及結(jié)合外部"智能"設(shè)備200(諸如智能電話或平板計(jì)算機(jī))使用頭部安裝顯示器(HMD)IOlO從而以免提方式向用戶提供信息和控制的構(gòu)思。本發(fā)明要求少量數(shù)據(jù)的傳輸,提供了實(shí)時(shí)運(yùn)行的更為可靠的數(shù)據(jù)傳輸方法。[0040]因此,在該意義上,要通過連接150進(jìn)行傳送的數(shù)據(jù)的數(shù)量是有關(guān)如何布局屏幕、顯示哪些文本,以及諸如繪制箭頭的其它樣式信息或者背景顏色、要包括的圖像等等的小型簡(jiǎn)單指令。[0041]另外的數(shù)據(jù)可以通過前述連接150或另一連接進(jìn)行流傳輸并且在屏幕1010上進(jìn)行顯示,諸如在主機(jī)200要求的情況下的視頻流。[0042]話音識(shí)別(ASR)系統(tǒng)被用來控制設(shè)備。針對(duì)大部分部件,ASR系統(tǒng)工作良好并且允許用戶以高準(zhǔn)確度對(duì)系統(tǒng)進(jìn)行導(dǎo)航和控制。[0043]系統(tǒng)設(shè)計(jì)人員將大量時(shí)間和工作花費(fèi)在選擇命令或關(guān)鍵字上,其對(duì)即將進(jìn)行的任務(wù)加以描述并且也是"話音識(shí)別友好"的命令。例如,由于ASR系統(tǒng)工作的方式,與動(dòng)詞處于主語之前的格式"關(guān)閉窗口"相比,典型的英語講話者在使用主謂命令"窗口關(guān)閉"時(shí)將實(shí)現(xiàn)明顯更大的識(shí)別準(zhǔn)確度。[0044]然而,即使當(dāng)命令集已經(jīng)針對(duì)最優(yōu)識(shí)別率進(jìn)行了高度調(diào)諧時(shí),仍然將會(huì)存在該命令集無法針對(duì)其使用的用戶。例如,一些講方言的人或者具有講話障礙的用戶可能發(fā)現(xiàn)某些命令難以正確發(fā)音,并且這將會(huì)導(dǎo)致無法使用的ASR系統(tǒng)。[0045]本發(fā)明的實(shí)施例(例如,HSC100的軟件系統(tǒng))使得系統(tǒng)的終端用戶能夠利用更適用于用戶講話模式的命令來覆蓋或以其它方式替代ASR命令。該任務(wù)例如可以在一些實(shí)施例中經(jīng)由圖形用戶界面(GUI)控制面板來實(shí)施,GUI控制面板列出了所有當(dāng)前的系統(tǒng)ASR命令(或者其任意子集)。每個(gè)系統(tǒng)命令可以被選擇并且被如由用戶指定的任意命令替代。以這種方式,HSC系統(tǒng)100針對(duì)用戶被定制以實(shí)現(xiàn)最優(yōu)識(shí)別率。[0046]在一些實(shí)施例中,用戶可以針對(duì)當(dāng)前的ASR命令提供可選項(xiàng)(alternative)而不是替代。例如,參考以上闡述的示例,針對(duì)當(dāng)前的ASR命令"窗口關(guān)閉",用戶可以引入命令"關(guān)閉窗口",使得講出"窗口關(guān)閉"或"關(guān)閉窗口"都將會(huì)導(dǎo)致窗口關(guān)閉。[0047]在一些實(shí)施例中,當(dāng)用戶引入替代或可選命令時(shí),該改變將會(huì)是持久的(即,將保持有效直至被用戶或其它維護(hù)動(dòng)作明確改變)。在其它實(shí)施例中,該改變可以僅在預(yù)定時(shí)間間隔內(nèi)保持有效(例如,在一天、一周、一月的剩余時(shí)間內(nèi),或者在諸如60分鐘、24小時(shí)或5天的明確時(shí)間段內(nèi))。[0048]在一些實(shí)施例中,該替代或可選命令可以僅針對(duì)作出該改變的用戶有效。在其它實(shí)施例中,該改變可以針對(duì)系統(tǒng)的所有用戶有效。[0049]圖3示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的處在語音命令下的無線免提視頻計(jì)算頭戴式耳機(jī)100的示例實(shí)施例??梢栽谖⑿惋@示器9010上向用戶呈現(xiàn)例如由以上提到的主機(jī)計(jì)算機(jī)200的應(yīng)用輸出的圖像。HMD100的用戶可以采用本地或者來自遠(yuǎn)程主機(jī)200的聯(lián)合的頭部跟蹤和語音命令文本選擇軟件模塊9036,其中用戶在微型顯示器9010上被呈現(xiàn)以實(shí)施免提文本選擇的屏幕視圖的序列并且通過頭戴式耳機(jī)計(jì)算機(jī)100的揚(yáng)聲器9006而被呈現(xiàn)以其音頻。由于頭戴式耳機(jī)計(jì)算機(jī)100還配備有麥克風(fēng)9020,所以用戶可以如接下來關(guān)于本發(fā)明的實(shí)施例闡述的那樣講出語音命令(例如,以便作出命令選擇)。[0050]圖3示出了圖示頭戴式耳機(jī)計(jì)算機(jī)100的模塊的示意圖。圖3包括頭戴式耳機(jī)計(jì)算機(jī)100的操作模塊的示意圖。[0051]針對(duì)話音驅(qū)動(dòng)的應(yīng)用中的話音命令替換的情形,控制器9100訪問用戶命令配置模塊9036,用戶命令配置模塊9036可以位于每個(gè)HMD100本地或者遠(yuǎn)程位于主機(jī)200(圖IA-1Β)〇[0052]用戶可配置話音命令或話音命令替換軟件模塊9036包含向用戶顯示相關(guān)請(qǐng)求對(duì)話框等的圖像的指令。圖形轉(zhuǎn)換器模塊9040將經(jīng)由總線9103從話音命令模塊9036接收的圖像指令進(jìn)行轉(zhuǎn)換并且將該指令轉(zhuǎn)換為圖形以在單眼式顯示器9010上進(jìn)行顯示。[0053]文本至話音模塊9035b可以與以上描述的圖形顯示同時(shí)將來自文本選擇軟件模塊9036的指令轉(zhuǎn)換為對(duì)應(yīng)于要顯示的屏幕視圖410的內(nèi)容的數(shù)字聲音表示。文本至話音模塊9035b將該數(shù)字聲音表示饋送至數(shù)模轉(zhuǎn)換器9021b,數(shù)模轉(zhuǎn)換器9021b進(jìn)而對(duì)揚(yáng)聲器9006進(jìn)行饋送以向用戶呈現(xiàn)音頻輸出。[0054]話音命令替換/用戶重新配置軟件模塊9036可以被本地存儲(chǔ)在存儲(chǔ)器9120或者遠(yuǎn)程存儲(chǔ)在主機(jī)200(圖1A)。用戶可以說出/講出根據(jù)圖像的替換命令選擇并且用戶的話音9090在麥克風(fēng)9020被接收。接收的話音隨后在模數(shù)轉(zhuǎn)換器9021a從模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)。一旦話音從模擬轉(zhuǎn)換為數(shù)字信號(hào),話音識(shí)別模塊9035a就將該話音處理為識(shí)別話音。[0055]識(shí)別話音與已知話音(存儲(chǔ)在存儲(chǔ)器9120中)進(jìn)行比較并且被用來根據(jù)模塊9036的指令選擇并替代話音命令替換。模塊9036可以執(zhí)行替代的2步驟確認(rèn)(用戶選擇的話音命令替換詞語)。模塊9036還可以將用戶選擇的替換命令與原始話音命令(即,被替換命令)進(jìn)行交叉引用或以其它方式進(jìn)行關(guān)聯(lián),使得未來講出的替換命令詞語被話音識(shí)別模塊9035a識(shí)別,這可以使得與原始命令相關(guān)聯(lián)的動(dòng)作被執(zhí)行。[0056]如這里提到的,用戶選擇的命令可以是針對(duì)現(xiàn)有命令的替換或可選項(xiàng)。在與可替換命令的情形相關(guān)聯(lián)的實(shí)施例中,話音識(shí)別模塊9035a可以識(shí)別原始命令或可選命令,并且在任一種情況下可以導(dǎo)致與原始命令相關(guān)聯(lián)的動(dòng)作被執(zhí)行。[0057]圖4圖示了話音識(shí)別方法的一個(gè)實(shí)施例,其包括識(shí)別402用戶的講話,使得404動(dòng)作在該講話被識(shí)別為預(yù)設(shè)話音命令時(shí)被執(zhí)行,支持406-個(gè)或多個(gè)用戶可配置的話音命令,并且向頭戴式耳機(jī)計(jì)算機(jī)的用戶呈現(xiàn)408預(yù)設(shè)話音命令和相關(guān)聯(lián)字段,并且接收輸入至該相關(guān)聯(lián)字段中的替代話音命令。[0058]將要意識(shí)到的是,這里描述的一個(gè)或多個(gè)實(shí)施例可以以許多不同形式的軟件和硬件來實(shí)施。被用來實(shí)施這里描述的實(shí)施例的軟件代碼和/或?qū)S糜布⒉粚?duì)這里描述的發(fā)明的實(shí)施例進(jìn)行限制。因此,實(shí)施例的操作和行為在并不參考具體軟件代碼和/或?qū)S糜布那闆r下被描述一所理解的是,將能夠設(shè)計(jì)軟件和/或硬件以實(shí)施基于這里的描述的實(shí)施例。[0059]另外,這里描述的示例實(shí)施例中的某些實(shí)施例可以被實(shí)施為執(zhí)行一種或多種功能的邏輯。該邏輯可以是基于硬件的、基于軟件的,或者是基于硬件和基于軟件的組合。該邏輯中的一些或全部可以被存儲(chǔ)在一個(gè)或多個(gè)有形的非瞬態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上,并且可以包括可以由控制器或處理器執(zhí)行的計(jì)算機(jī)可執(zhí)行指令。該計(jì)算機(jī)可執(zhí)行指令可以包括實(shí)施本發(fā)明的一個(gè)或多個(gè)實(shí)施例的指令。該有形的非瞬態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是易失性的或非易失性的,并且例如可以包括閃存、動(dòng)態(tài)存儲(chǔ)器、可移除盤和非可移除盤。[0060]雖然已經(jīng)參考其示例實(shí)施例特別示出并描述了本發(fā)明,但是本領(lǐng)域技術(shù)人員將會(huì)理解的是,可以對(duì)其形式和細(xì)節(jié)進(jìn)行各種變化而并不背離如所附權(quán)利要求涵蓋的本發(fā)明的范圍?!局鳈?quán)項(xiàng)】1.一種頭戴式耳機(jī)計(jì)算機(jī),包括:耦合至處理器的微型顯示器;耦合至所述處理器的麥克風(fēng);以及話音識(shí)別引擎,其由所述處理器執(zhí)行并且對(duì)用戶向所述麥克風(fēng)中的講話作出響應(yīng),所述話音識(shí)別引擎被配置為(i)使得動(dòng)作在識(shí)別出預(yù)設(shè)話音命令時(shí)被執(zhí)行,并且(ii)支持用戶可配置的話音命令。2.根據(jù)權(quán)利要求1所述的頭戴式耳機(jī)計(jì)算機(jī),其中所述話音識(shí)別引擎進(jìn)一步被配置為向所述頭戴式耳機(jī)計(jì)算機(jī)的用戶呈現(xiàn)所述預(yù)設(shè)話音命令以及相關(guān)聯(lián)字段,所述相關(guān)聯(lián)字段被呈現(xiàn)以用于輸入替代話音命令。3.根據(jù)權(quán)利要求2所述的頭戴式耳機(jī)計(jì)算機(jī),其中所述話音識(shí)別引擎在識(shí)別出所述替代話音命令時(shí)使得第一動(dòng)作被執(zhí)行,其中所述第一動(dòng)作對(duì)應(yīng)于所述預(yù)設(shè)話音命令。4.根據(jù)權(quán)利要求3所述的頭戴式耳機(jī)計(jì)算機(jī),其中所述第一動(dòng)作僅在所述話音識(shí)別引擎識(shí)別出所述替代話音命令時(shí)被執(zhí)行。5.根據(jù)權(quán)利要求3所述的頭戴式耳機(jī)計(jì)算機(jī),其中所述第一動(dòng)作在所述話音識(shí)別引擎識(shí)別出所述替代話音命令時(shí)或者所述話音識(shí)別引擎識(shí)別出所述預(yù)設(shè)話音命令時(shí)被執(zhí)行。6.根據(jù)權(quán)利要求2所述的頭戴式耳機(jī)計(jì)算機(jī),其中在所述相關(guān)聯(lián)字段中輸入的替代話音命令在預(yù)定時(shí)間間隔內(nèi)有效,而在所述預(yù)定時(shí)間間隔之后僅所述預(yù)設(shè)話音命令有效。7.根據(jù)權(quán)利要求2所述的頭戴式耳機(jī)計(jì)算機(jī),其中在所述相關(guān)聯(lián)字段中輸入的替代話音命令僅針對(duì)提交所述替代命令的用戶有效。8.根據(jù)權(quán)利要求1所述的頭戴式耳機(jī)計(jì)算機(jī),進(jìn)一步包括話音命令配置模塊,其操作地耦合至所述話音識(shí)別引擎,所述話音命令配置模塊使能終端用戶選擇話音命令詞語以在針對(duì)給定話音命令的替代中使用,所述用戶選擇的話音命令詞語形成針對(duì)所述給定話音命令的替代命令。9.根據(jù)權(quán)利要求1所述的頭戴式耳機(jī)計(jì)算機(jī),進(jìn)一步包括話音命令配置模塊,其被配置為:(i)接收來自所述用戶的替代話音命令,所述替代命令對(duì)應(yīng)于所述預(yù)設(shè)話音命令;(ii)將所述替代話音命令與要在識(shí)別出預(yù)設(shè)話音命令時(shí)被執(zhí)行的動(dòng)作相關(guān)聯(lián);(iii)在識(shí)別出所述替代話音命令時(shí)執(zhí)行所述動(dòng)作。10.根據(jù)權(quán)利要求9所述的頭戴式耳機(jī)計(jì)算機(jī),其中所述話音命令配置模塊進(jìn)一步被配置為在識(shí)別出所述預(yù)設(shè)話音命令時(shí)執(zhí)行所述動(dòng)作。11.一種話音識(shí)別方法,包括:在數(shù)字處理設(shè)備中:(i)識(shí)別用戶的講話;(ii)使得動(dòng)作在所述講話被識(shí)別為預(yù)設(shè)話音命令時(shí)被執(zhí)行;以及(iii)支持用戶可配置的話音命令。12.根據(jù)權(quán)利要求11所述的方法,進(jìn)一步包括向頭戴式耳機(jī)計(jì)算機(jī)的用戶呈現(xiàn)所述預(yù)設(shè)話音命令以及相關(guān)聯(lián)字段,并且接收輸入至所述相關(guān)聯(lián)字段中的替代話音命令。13.根據(jù)權(quán)利要求12所述的方法,進(jìn)一步包括在識(shí)別出所述替代話音命令時(shí)使得第一動(dòng)作被執(zhí)行,其中所述第一動(dòng)作對(duì)應(yīng)于所述預(yù)設(shè)話音命令。14.根據(jù)權(quán)利要求13所述的方法,進(jìn)一步包括僅在所述話音識(shí)別引擎識(shí)別出所述替代話音命令時(shí)執(zhí)行所述第一動(dòng)作。15.根據(jù)權(quán)利要求13所述的方法,進(jìn)一步包括在所述話音識(shí)別引擎識(shí)別出所述替代話音命令時(shí)或者所述話音識(shí)別引擎識(shí)別出所述預(yù)設(shè)話音命令時(shí)執(zhí)行所述第一動(dòng)作。16.根據(jù)權(quán)利要求12所述的方法,其中在所述相關(guān)聯(lián)字段中輸入的替代話音命令在預(yù)定時(shí)間間隔內(nèi)有效,而在所述預(yù)定時(shí)間間隔之后僅所述預(yù)設(shè)話音命令有效。17.根據(jù)權(quán)利要求12所述的方法,其中在所述相關(guān)聯(lián)字段中輸入的替代話音命令僅針對(duì)提交所述替代命令的用戶有效。18.-種用于識(shí)別話音的非瞬態(tài)計(jì)算機(jī)可讀介質(zhì),所述非瞬態(tài)計(jì)算機(jī)可讀介質(zhì)包括存儲(chǔ)于其上的計(jì)算機(jī)軟件指令,所述計(jì)算機(jī)軟件指令在被至少一個(gè)處理器執(zhí)行時(shí)使得計(jì)算機(jī)系統(tǒng):(i)識(shí)別用戶的講話;(ii)使得動(dòng)作在所述講話被識(shí)別為預(yù)設(shè)話音命令時(shí)被執(zhí)行;以及(iii)支持用戶可配置的話音命令。19.根據(jù)權(quán)利要求18所述的非瞬態(tài)計(jì)算機(jī)可讀介質(zhì),所述計(jì)算機(jī)軟件指令在被至少一個(gè)處理器執(zhí)行時(shí)進(jìn)一步使得計(jì)算機(jī)系統(tǒng)向頭戴式耳機(jī)計(jì)算機(jī)的用戶呈現(xiàn)所述預(yù)設(shè)話音命令以及相關(guān)聯(lián)字段,并且接收輸入至所述相關(guān)聯(lián)字段中的替代話音命令。20.根據(jù)權(quán)利要求18所述的非瞬態(tài)計(jì)算機(jī)可讀介質(zhì),所述計(jì)算機(jī)軟件指令在被至少一個(gè)處理器執(zhí)行時(shí)進(jìn)一步使得所述計(jì)算機(jī)系統(tǒng)在識(shí)別出所述替代話音命令時(shí)使得第一動(dòng)作被執(zhí)行,其中所述第一動(dòng)作對(duì)應(yīng)于所述預(yù)設(shè)話音命令?!疚臋n編號(hào)】G10L15/22GK105940371SQ201480073190【公開日】2016年9月14日【申請(qǐng)日】2014年12月17日【發(fā)明人】C·帕金森【申請(qǐng)人】寇平公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1