国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      聲音啟動(dòng)的網(wǎng)絡(luò)操作的制作方法

      文檔序號(hào):6570122閱讀:132來源:國(guó)知局
      專利名稱:聲音啟動(dòng)的網(wǎng)絡(luò)操作的制作方法
      聲音啟動(dòng)的網(wǎng)絡(luò)操作
      祖旦 冃眾
      便攜式電子設(shè)備諸如膝上型計(jì)算機(jī)、無線電話、個(gè)人數(shù)字助理、無線設(shè)備、 游戲系統(tǒng)和音頻播放機(jī)已經(jīng)變得日益普及。用戶可使用一或多個(gè)這些設(shè)備進(jìn)行 各種活動(dòng),諸如通過使用電子郵件、即時(shí)消息收發(fā)等相互通信。而且,用戶可 使用一或多個(gè)這些設(shè)備通過網(wǎng)絡(luò)訪問各種各樣的內(nèi)容。然而,便攜式電子設(shè)備 的緊湊尺寸會(huì)妨礙用戶活動(dòng)。
      例如,緊湊的便攜式電子設(shè)備不太適于文本輸入。另外,當(dāng)"忙碌"時(shí), 諸如在駕駛或旅行時(shí),將信息輸入到便攜式電子設(shè)備中是困難的、不安全的和 /或不方便的。
      概述
      描述操作的聲音啟動(dòng),它可用于協(xié)助用戶在諸如其它輸入機(jī)制不合乎需 要、不方便或者不能用的時(shí)候執(zhí)行操作。用戶向客戶機(jī)設(shè)備提供語音。語音被 轉(zhuǎn)換成文本。文本用于執(zhí)行操作和獲得結(jié)果。形成響應(yīng)以將操作的結(jié)果傳輸至 客戶機(jī)設(shè)備??捎酶鞣N方法格式化響應(yīng),諸如包括文本以及非文本部分(例如 圖形、音頻等等)。例如,用戶語音可啟動(dòng)由搜索引擎執(zhí)行的搜索操作。將搜 索結(jié)果提供給用戶。用戶隨后使用該搜索結(jié)果通過附加的語音來啟動(dòng)進(jìn)一步的 操作。
      提供本概述以簡(jiǎn)化形式介紹下面在詳細(xì)描述中進(jìn)一步描述的一些概念。本 概述不是要標(biāo)識(shí)要求保護(hù)主題的關(guān)鍵特征或本質(zhì)特征,也不應(yīng)當(dāng)用于幫助確定 要求保護(hù)主題的范圍。
      附圖簡(jiǎn)述


      圖1是在示例性實(shí)現(xiàn)中可用于使用聲音啟動(dòng)的操作的技術(shù)的環(huán)境的示圖。
      圖2是在示例性實(shí)現(xiàn)中更詳細(xì)地示出圖1的示例性客戶機(jī)和服務(wù)的系統(tǒng)的示圖。
      圖3是描繪在示例性實(shí)現(xiàn)中執(zhí)行聲音啟動(dòng)的操作并且生成響應(yīng)的過程的 流程圖。
      圖4是描繪在示例性實(shí)現(xiàn)中由語音啟動(dòng)web搜索的過程的流程圖。 圖5是描繪在另一示例性實(shí)現(xiàn)中執(zhí)行聲音啟動(dòng)的操作并生成響應(yīng)的過程 的流程圖。
      圖6是描繪在示例性實(shí)現(xiàn)中使用無線一鍵通(PoC)會(huì)話用于聲音啟動(dòng)的 操作的過程的流程圖。
      圖7是描繪在示例性實(shí)現(xiàn)中利用聲音啟動(dòng)的搜索的結(jié)果用于其他聲音啟 動(dòng)的操作的過程的流程圖。
      在討論中,在實(shí)例中使用相同的標(biāo)號(hào)來引用相同的結(jié)構(gòu)與組件。
      詳細(xì)描述 概觀
      在一些情形中,對(duì)計(jì)算設(shè)備、手持或移動(dòng)設(shè)備進(jìn)行人工輸入(例如用手) 是不方便的、不安全的或者是不可能的。在各種實(shí)現(xiàn)中,描述了可用于通過語 音諸如口頭命令或詞語來啟動(dòng)操作的技術(shù)。
      例如,用戶可向客戶機(jī)設(shè)備諸如移動(dòng)電話、計(jì)算設(shè)備、便攜式數(shù)字助理 (PDA)等提供語音。隨后將語音轉(zhuǎn)換成文本。轉(zhuǎn)換得到的文本隨后可由服務(wù) 使用來基于轉(zhuǎn)換得到的文本執(zhí)行一或多個(gè)操作。構(gòu)想了各種各樣的操作。
      例如,可將文本用作搜索項(xiàng)提供給因特網(wǎng)搜索引擎以執(zhí)行搜索。獲得這些 操作的結(jié)果。形成包含這些結(jié)果的響應(yīng),隨后將它提供給用戶的客戶機(jī)設(shè)備。 可用各種方法提供響應(yīng),諸如通過電子郵件、超文本標(biāo)記語言(HTML)、即 時(shí)消息、聲音等等來提供。例如,響應(yīng)于對(duì)最近的餐廳的口頭請(qǐng)求,可向用戶 提供具有地圖和餐廳列表的HTML文檔。在一實(shí)現(xiàn)中,可按照客戶機(jī)設(shè)備的 位置自動(dòng)提煉操作。因而,對(duì)餐廳的搜索可基于客戶機(jī)設(shè)備的位置自動(dòng)返回五 個(gè)最近的餐廳。
      在下面的討論中,首先描述了可用于使用各種技術(shù)來提供語音啟動(dòng)的操作 的示例性環(huán)境,然后描述可用于示例性環(huán)境中以提供語音啟動(dòng)的操作技術(shù)以及
      其它環(huán)境中的示例性過程和用戶界面。 示例性環(huán)境
      圖1是在示例性實(shí)現(xiàn)中可用于使用聲音啟動(dòng)的操作技術(shù)的環(huán)境100的示
      圖。環(huán)境100例示為包括多個(gè)以通信方式耦合至網(wǎng)絡(luò)104的客戶機(jī)102(1)、 102(2)、 102(3)...102(N)。在下面討論中的多個(gè)客戶機(jī)102(1)至102(N)也可被稱 為客戶機(jī)102(n)(其中"n"可以是從一到"N"的任何整數(shù))。這多個(gè)客戶機(jī) 102(n)可用各種方式來配置。例如, 一或多個(gè)客戶機(jī)102(n)可配置為能夠通過 網(wǎng)絡(luò)104通信的計(jì)算機(jī),諸如臺(tái)式計(jì)算機(jī)、移動(dòng)站、游戲控制臺(tái)、娛樂裝置、 以通信方式耦合至顯示設(shè)備的機(jī)頂盒、無線電話等等。客戶機(jī)102(n)也可以是 便攜式電子設(shè)備,諸如膝上型計(jì)算機(jī)、移動(dòng)電話102(2)、個(gè)人數(shù)字助理(PDA) 102(3)、音頻播放器等等??蛻魴C(jī)102(n)可配置為通過無線連接、有線連接等 訪問網(wǎng)絡(luò)104。客戶機(jī)102(n)的范圍從具有大量存儲(chǔ)器和處理器資源的完全資 源設(shè)備(例如,個(gè)人計(jì)算機(jī)、配有硬盤的電視錄像機(jī)、游戲控制臺(tái))到具有有 限存儲(chǔ)器和/或處理資源的低資源設(shè)備(例如,傳統(tǒng)的機(jī)頂盒)。在下面的討論 中,客戶機(jī)102(n)還可與操作該客戶機(jī)的人和/或?qū)嶓w相關(guān)。換言之,客戶機(jī) 102(n)可描述包括用戶/機(jī)器的邏輯客戶機(jī)。
      另外,盡管網(wǎng)絡(luò)104被例示為因特網(wǎng),但網(wǎng)絡(luò)可采取多種多樣的配置。例 如,網(wǎng)絡(luò)104可包括廣域網(wǎng)(WAN)、局域網(wǎng)(LAN)、無線網(wǎng)絡(luò)、公共電 話網(wǎng)絡(luò)、內(nèi)聯(lián)網(wǎng)等等。而且,盡管示出單個(gè)網(wǎng)絡(luò)104,但網(wǎng)絡(luò)104可配置為包 括多個(gè)網(wǎng)絡(luò)。例如,多個(gè)客戶機(jī)102(n)可通過無線網(wǎng)絡(luò)耦合以相互通信。這些 客戶機(jī)中的每一個(gè)也可通過因特網(wǎng)以通信方式耦合至圖1所示的多個(gè)服務(wù) 106(s)中的一或多個(gè)(其中"s"可以是從一至"S"的任何整數(shù))。也構(gòu)想了 各種其它示例。
      如圖1所示,客戶機(jī)102(n)能夠通過網(wǎng)絡(luò)104訪問多個(gè)服務(wù)106(s)。服務(wù) 106(s)可用各種方式來配置。服務(wù)106(s)通常通過網(wǎng)絡(luò)104向客戶機(jī)102(n)提供 資源(例如,服務(wù)和內(nèi)容)。資源可配置為各種內(nèi)容,諸如網(wǎng)頁、音樂、視頻、 圖象、用戶論壇、模板、插件、網(wǎng)絡(luò)日志(博客)等等。而且,服務(wù)106(s)可 提供作為諸如即時(shí)消息收發(fā)服務(wù)、電子郵件服務(wù)、搜索服務(wù)、在線購(gòu)物、金融 服務(wù)等服務(wù)的資源??蛻魴C(jī)可訪問服務(wù)106(s)以啟動(dòng)各種活動(dòng),諸如通信、搜
      索、帳戶訪問、文件管理、消費(fèi)者活動(dòng)等等。
      多個(gè)客戶機(jī)102(n)中的每一個(gè)例示為包括多個(gè)通信模塊108(n)中的相應(yīng)之 一。在例示的實(shí)現(xiàn)中,多個(gè)通信模塊108(n)中的每一個(gè)能在多個(gè)客戶機(jī)102(n) 中的相應(yīng)之一上執(zhí)行以提供多個(gè)客戶機(jī)102(n)之間、客戶機(jī)102與一或多個(gè)服 務(wù)106(s)之間以及諸如此類的通信模式。因而,通信模塊108(n)表示提供給客 戶機(jī)102(n)用于通過網(wǎng)絡(luò)104發(fā)送與接收信息、聲音數(shù)據(jù)、消息等等的功能。
      例如, 一或多個(gè)通信模塊108(n)可配置為發(fā)送與接收電子郵件。電子郵件 使用用于尋址與路由的標(biāo)準(zhǔn)與約定,使得電子郵件可跨網(wǎng)絡(luò)104使用多個(gè)設(shè)備 諸如路由器、其它計(jì)算設(shè)備(例如電子郵件服務(wù)器)等來傳遞。如此,電子郵 件可在公司內(nèi)通過內(nèi)聯(lián)網(wǎng)傳送,使用因特網(wǎng)在全世界傳送,等等。例如,電子 郵件可包括首部和用戶指定的有效載荷諸如文本與附件,例如文檔、計(jì)算機(jī)可 執(zhí)行文件等等。首部包含有關(guān)源的技術(shù)信息并且經(jīng)常描述消息從發(fā)送方到接收 方所采取的路線。
      通信模塊108(n)也可配置為提供蜂窩網(wǎng)絡(luò)或無線聲音服務(wù)。無線聲音服務(wù) 提供在多個(gè)客戶機(jī)102(n)和/或客戶機(jī)102(n)與服務(wù)106(s)之間傳輸聲音數(shù)據(jù)的 機(jī)制。例如,客戶機(jī)102(n)可實(shí)時(shí)或接近實(shí)時(shí)地將聲音數(shù)據(jù)傳輸至另一客戶機(jī)。 因而,多個(gè)客戶機(jī)102(n)可通過無線網(wǎng)絡(luò)參與對(duì)話。客戶機(jī)102(n)也可將聲音 數(shù)據(jù)傳輸至一或多個(gè)服務(wù)106(s)。
      而且,通信模塊108(n)可配置為提供無線一鍵通(PoC) (PoC)功能。 PoC是允許在一或多個(gè)客戶機(jī)102(n)和/或服務(wù)106之間進(jìn)行接近立即的通信的 雙向通信形式。通信模塊108(n)可提供PoC聯(lián)系人或組的列表,從中選擇以啟 動(dòng)PoC會(huì)話??蛻魴C(jī)102(n)可配備有PoC按鈕,在PoC會(huì)話期間可壓下該按 鈕以進(jìn)行交談。在整個(gè)PoC會(huì)話中,進(jìn)行接收的聯(lián)系人或組可聽到發(fā)送者的聲 音而無需其做任何動(dòng)作。因而,PoC與使用"步話機(jī)"或內(nèi)部通話設(shè)備相似。 PoC可通過無線聲音網(wǎng)絡(luò)、對(duì)等網(wǎng)絡(luò)、因特網(wǎng)等來實(shí)現(xiàn)。盡管PoC的名字表示 "蜂窩網(wǎng)絡(luò)(cellular)",但PoC可在以各種方式配置的客戶機(jī)102(n)上使用, 包括移動(dòng)電話、膝上型計(jì)算機(jī)、手持設(shè)備、臺(tái)式計(jì)算設(shè)備等等。例如,PoC會(huì) 話可通過因特網(wǎng)在臺(tái)式計(jì)算設(shè)備與服務(wù)106(n)之間建立。
      在另一示例中, 一或多個(gè)通信模塊108(n)可配置為發(fā)送與接收即時(shí)消息。
      即時(shí)消息收發(fā)提供這樣一種機(jī)制在參加即時(shí)消息收發(fā)會(huì)話時(shí),每一客戶機(jī) 102(n)可相互發(fā)送文本消息。即時(shí)消息收發(fā)也可提供聲音即時(shí)消息收發(fā)功能, 使得聲音數(shù)據(jù)可通過即時(shí)消息收發(fā)會(huì)話來交換。即時(shí)消息一般是實(shí)時(shí)通信的,
      盡管也可使用延遲的傳遞,諸如通過在客戶機(jī)102(n)之一不可用例如離線時(shí)將 文本消息記入日志。因而,即時(shí)消息收發(fā)可視為電子郵件與因特網(wǎng)聊天的組合, 因?yàn)榧磿r(shí)消息收發(fā)支持消息交換并且被設(shè)計(jì)為用于雙向?qū)崨r聊天。因此,即時(shí) 消息收發(fā)可用于同步通信。例如,像聲音電話呼叫一樣,即時(shí)消息收發(fā)會(huì)話可 實(shí)時(shí)執(zhí)行,使得每一用戶可在收到即時(shí)消息時(shí)向每一其他用戶響應(yīng)。
      盡管描述了PoC、無線聲音服務(wù)、即時(shí)消息和電子郵件,但通信模式可采 取各種其它配置而不脫離其本質(zhì)與范圍。而且,單獨(dú)的客戶機(jī)102(n)(更具體 地是客戶機(jī)102(n)的通信模塊)可配置為提供通信模式的各種不同組合,諸如 提供即時(shí)消息收發(fā)與無線聲音兩者。
      通信模塊108(n)還可提供接收口頭命令和與服務(wù)106(s)通信的功能。圖1 描繪代表使用多個(gè)客戶機(jī)102(n)中的一或多個(gè)的各個(gè)用戶的用戶110。用戶110 被示為向客戶機(jī)102(1)提供語音112。語音112表示用戶說出的詞語,諸如用 戶IIO可指定要由服務(wù)106(s)執(zhí)行的操作。語音112由客戶機(jī)102(1)接收,并 且可由通信模塊108(1)通過網(wǎng)絡(luò)104傳輸至服務(wù)106(s)。如在下面詳細(xì)描述的, 可將語音112作為聲音數(shù)據(jù)或者作為經(jīng)過轉(zhuǎn)換的聲音數(shù)據(jù)(例如文本)傳輸至 服務(wù)106。
      每一服務(wù)106(s)各自包括一或多個(gè)操作模塊114(s)。操作模塊114(s)表示 可用于執(zhí)行由用戶110的語音112指定的一或多個(gè)操作的功能。因而,語音112 可用于啟動(dòng)由操作模塊114(s)執(zhí)行的操作。操作模塊114(s)還表示格式化響應(yīng) 116(p)的功能,響應(yīng)116(p)包含語音112指定的操作的結(jié)果。操作模塊114(s) 可配置為提供各種操作??捎刹僮髂K114(s)執(zhí)行的操作包括但不限于搜索、 購(gòu)買物品、預(yù)訂服務(wù)(例如,餐廳、沙龍、汽車保養(yǎng)等等)、預(yù)訂旅程、訪問 帳戶、訪問內(nèi)容、檢索存儲(chǔ)的內(nèi)容、下載項(xiàng)目等等。
      在一實(shí)現(xiàn)中,操作模塊114(s)可配置為向客戶機(jī)102(n)提供響應(yīng)116(p), 它包括操作模塊114(s)執(zhí)行的操作的結(jié)果。響應(yīng)116(p)可用各種方式配置,諸 如包括各種文本和/或非文本部分(例如,圖形消息、音頻消息等等)。在有關(guān)
      圖2的說明中可找到對(duì)各種響應(yīng)116(p)的進(jìn)一步討論。
      在一實(shí)現(xiàn)中,服務(wù)106(s)可接收語音112作為聲音數(shù)據(jù)。然而,在一些實(shí) 例中,操作模塊114(s)可能不理解聲音數(shù)據(jù)以執(zhí)行指定操作。因此,可執(zhí)行轉(zhuǎn) 化。例如,每一服務(wù)106(s)被示為具有相應(yīng)的轉(zhuǎn)化模塊118(s)。轉(zhuǎn)化模塊118(s) 表示在聲音數(shù)據(jù)與文本命令之間進(jìn)行轉(zhuǎn)化以便由配置為執(zhí)行所需操作的模塊 (諸如服務(wù)106(s)的操作模塊114(s))理解的功能。例如,作為聲音數(shù)據(jù)接收 的語音112可由轉(zhuǎn)化模塊118(s)轉(zhuǎn)換成操作模塊114(s)能理解的文本。操作模 塊114(s)隨后使用經(jīng)過轉(zhuǎn)換的語音(例如文本)來執(zhí)行由語音112指定的操作。 在一實(shí)現(xiàn)中,轉(zhuǎn)化模塊118(s)也可配置為將響應(yīng)116(p)轉(zhuǎn)換成聲音數(shù)據(jù)以便傳 輸至客戶機(jī)102(n)。
      盡管描述了服務(wù)106(s)上轉(zhuǎn)化模塊118(s)的執(zhí)行,但客戶機(jī)102(n)也可使 用相似的功能。例如,圖1將每一客戶機(jī)102(1)-102(N)示為具有相應(yīng)的轉(zhuǎn)化模 塊118(1)-118(N)。在一實(shí)現(xiàn)中,由客戶機(jī)102(n)接收的語音112可在客戶機(jī)處 轉(zhuǎn)化成文本。服務(wù)106(s),具體是操作模塊114(s),隨后接收操作模塊114(s) 能理解的文本,它指定要執(zhí)行的操作。而且,提供給客戶機(jī)102(n)的非聽得見 的響應(yīng)116(p)或其部分可由客戶機(jī)102(n)轉(zhuǎn)化成語音。在有關(guān)圖2的說明中可 找到通過轉(zhuǎn)化模塊118進(jìn)行的聲音數(shù)據(jù)轉(zhuǎn)化的進(jìn)一步討論。
      在一實(shí)現(xiàn)中,單個(gè)服務(wù)106(s)可執(zhí)行眾多操作。例如,用戶110可提供語 音112,它使得服務(wù)106(s)執(zhí)行對(duì)可用內(nèi)容諸如網(wǎng)頁、視頻、音頻等的搜索。 用戶110可能在先前己經(jīng)訂閱或購(gòu)買了該內(nèi)容,或者可能希望購(gòu)買該內(nèi)容。內(nèi) 容也可以是由用戶維護(hù)的項(xiàng)目,諸如保存在客戶機(jī)102(n)可通過網(wǎng)絡(luò)104訪問 的存儲(chǔ)中。搜索生成被提供給客戶機(jī)102(n)的列出可用內(nèi)容的搜索結(jié)果。用戶 110隨后可査看可用內(nèi)容并且提供附加的語音112以啟動(dòng)附加的操作,諸如將 包含在搜索結(jié)果中的內(nèi)容項(xiàng)目通過流傳送至客戶機(jī)、下載內(nèi)容、購(gòu)買內(nèi)容等等。
      或者,可組合地使用多個(gè)服務(wù)106(s)來執(zhí)行眾多操作。因而,可由相同的 服務(wù)106或另一服務(wù)106(s)來執(zhí)行附加的操作。在另一示例中,用戶UO可使 用語音112來啟動(dòng)使用多個(gè)服務(wù)106(s)之一對(duì)旅行選項(xiàng)諸如可用航班的搜索。 然后,在收到搜索結(jié)果之后,用戶110可使用附加的語音來通過多個(gè)服務(wù)106(s) 中的另一個(gè)服務(wù)啟動(dòng)預(yù)定搜索結(jié)果中指示的一個(gè)特定航班的操作。在關(guān)于圖
      3-7的說明中可找到響應(yīng)于語音的操作執(zhí)行的進(jìn)一步討論。
      一般而言,在此描述的任何功能可使用軟件、固件(例如,固化的邏輯電 路)、人工處理或這些實(shí)現(xiàn)的組合來實(shí)現(xiàn)。本文使用的術(shù)語"模塊"和"邏輯" 一般表示軟件、固件或軟固件的組合。在軟件實(shí)現(xiàn)的情形中,模塊、功能或邏
      輯表示程序代碼,它在處理器(一或多個(gè)CPU)上執(zhí)行時(shí)完成指定的任務(wù)。程 序代碼可被存儲(chǔ)在一或多個(gè)計(jì)算機(jī)可讀存儲(chǔ)器設(shè)備中,在關(guān)于圖2的說明中可 找到有關(guān)其的進(jìn)一步的描述。下面描述的語音技術(shù)的特征是平臺(tái)無關(guān)的,意味 著這些技術(shù)可以在具有各種處理器的各種商用計(jì)算平臺(tái)上實(shí)現(xiàn)。
      圖2是在示例性實(shí)現(xiàn)中更詳細(xì)示出圖1的示例性客戶機(jī)102(n)與服務(wù) 106(s)的系統(tǒng)200的示圖。服務(wù)106(s)被例示為由多個(gè)服務(wù)器202(a)(其中"a" 可以是從一至"A"的任何整數(shù))實(shí)現(xiàn),而客戶機(jī)102(n)被例示為客戶機(jī)設(shè)備。 服務(wù)器202(a)和客戶機(jī)102(n)各自被例示為具有相應(yīng)的處理器204(a)、 206(n) 和相應(yīng)的存儲(chǔ)器208(a)、 210(n)。
      處理器不受限于形成它們的材料或者其中使用的處理機(jī)制。例如,處理器 可由半導(dǎo)體和/或晶體管(例如,電子集成電路(IC))組成。在這樣一種上下 文中,處理器可執(zhí)行指令可以是能以電子方式執(zhí)行的指令?;蛘撸幚砥骰蛴?于處理器的機(jī)制,以及計(jì)算設(shè)備或用于計(jì)算設(shè)備的機(jī)制,可包括但不限于,量 子計(jì)算、光計(jì)算、機(jī)械計(jì)算(例如使用納米技術(shù))等等。另外,盡管分別為服 務(wù)器202(a)和客戶機(jī)102(n)示出單個(gè)存儲(chǔ)器208(a)、 210(n),但可使用多種多 樣的存儲(chǔ)器類型和組合,諸如隨機(jī)存取存儲(chǔ)器(RAM)、硬盤存儲(chǔ)器、可移動(dòng) 介質(zhì)存儲(chǔ)器等等。
      操作模塊114(a)和轉(zhuǎn)化模塊118(a)被示為在服務(wù)器202(a)的處理器204(a) 上執(zhí)行。自然地,操作模塊114(a)和轉(zhuǎn)化模塊118(a)也可在同一服務(wù)106(s)內(nèi) 的不同的相應(yīng)服務(wù)器202上提供,或者在圖1所示的多個(gè)服務(wù)106中的不同服 務(wù)內(nèi)提供。注意,關(guān)聯(lián)于在此描述的各種模塊的功能可進(jìn)一步組合或劃分而不 脫離其精神與范圍。例如,盡管操作模塊114(a)和轉(zhuǎn)化模塊118(a)被示為分開 的,但其各自的功能可在單個(gè)模塊中提供。
      轉(zhuǎn)化模塊118(a)還示為具有語音轉(zhuǎn)文本模塊212和文本轉(zhuǎn)語音模塊214。 語音轉(zhuǎn)文本模塊212表示將由客戶機(jī)102(2M乍為語音數(shù)據(jù)提供的語音112轉(zhuǎn)化
      成操作模塊114(a)可使用以執(zhí)行操作的文本的功能。文本轉(zhuǎn)語音模塊214表示 將操作的結(jié)果(例如響應(yīng)116(p)或其部分)轉(zhuǎn)化成聲音數(shù)據(jù)(例如可聽見的聲 音)的功能。文本轉(zhuǎn)語音模塊214可配置為將實(shí)時(shí)可聽見的結(jié)果傳輸至客戶機(jī) 102(n)?;蛘?,文本轉(zhuǎn)語音模塊214可生成要保存為能讓客戶機(jī)102(n)訪問的 音頻記錄諸如聲音郵件、音頻文件等的可聽見的結(jié)果。
      在一實(shí)現(xiàn)中, 一或多個(gè)服務(wù)102(s)可提供聲音啟動(dòng)的搜索操作。圖2所示 的操作模塊114(a)配置為提供搜索操作。搜索引擎216被示為在操作模塊114(a) 內(nèi)的處理器204(a)上執(zhí)行,并且可存儲(chǔ)在存儲(chǔ)器208(a)中。搜索引擎216可用 于執(zhí)行各種搜索。這些包括但不限于一般的web或因特網(wǎng)、個(gè)人桌面、視頻、 音頻、企業(yè)、照片和/或本地搜索。這些搜索可基于作為用戶IIO提供給客戶機(jī) 102(n)的語音的關(guān)鍵詞。或者,用戶110的語音112可標(biāo)識(shí)向搜索引擎216提 供搜索項(xiàng)的已存儲(chǔ)的搜索。自然地,搜索操作可與單個(gè)操作模塊114(a)內(nèi)的其 它操作組合。換言之,配置為提供搜索的操作模塊114(a)不限于提供搜索。
      在一實(shí)現(xiàn)中,操作模塊114(a)包括響應(yīng)模塊218。響應(yīng)模塊218表示形成 包含由服務(wù)106(s)執(zhí)行的操作的結(jié)果的響應(yīng)116(p)的功能。響應(yīng)116(p)配置為 通過網(wǎng)絡(luò)104被傳輸至客戶機(jī)102(n)。或者,可遠(yuǎn)程存儲(chǔ)結(jié)果并且可由客戶機(jī) 102(n)訪問,或者用戶IIO可通過客戶機(jī)102(n)或其它設(shè)備訪問。當(dāng)然,響應(yīng) 116(p)中的結(jié)果可以來自單個(gè)操作模塊114(a)、單個(gè)服務(wù)106(s)的多個(gè)操作、 由多個(gè)服務(wù)106(s)組合執(zhí)行的眾多操作的聚合等等。
      響應(yīng)116(p)可用各種方式配置。各種響應(yīng)116(p)被示為在服務(wù)器202(a)的 存儲(chǔ)器208(a)內(nèi)的存儲(chǔ)220中。響應(yīng)116(p)可以是組合文本與圖形的圖形響應(yīng)。 因而,響應(yīng)于可聽見的輸入(例如語音112),用戶IIO經(jīng)由客戶機(jī)102(n)可 接收其它格式的響應(yīng)116(p),例如非可聽見的響應(yīng)?;蛘?,用戶110可接收組 合了可聽見部分和文本與圖形部分的響應(yīng)。因而,響應(yīng)116(p)可包括文本、圖 形、視頻、音頻等的組合。
      例如,如圖2所示,可將響應(yīng)116(p)配置為電子郵件116(1),以及HTML 文檔116(2)、即時(shí)消息116(3)、視頻響應(yīng)116(4)、計(jì)算機(jī)可讀文件116(5)等等。 而且,各種響應(yīng)116(p)可單獨(dú)使用,或者相互組合使用。例如,電子郵件和即 時(shí)消息116(3)可被同時(shí)返回給客戶機(jī)102(2)。而且,可形成具有附連的文字處理文件或其它計(jì)算機(jī)可讀文件116(5)的即時(shí)消息116(3)。也構(gòu)想了各種其它組 合。
      同樣,可聽見的響應(yīng)116(6)也在圖2中示出,它可單獨(dú)使用,或者結(jié)合其 它響應(yīng)116(p)使用。可聽見的響應(yīng)116(6)表示將被提供給客戶機(jī)102(n)的要由 客戶機(jī)"收聽"的響應(yīng)或部分響應(yīng),例如語音。例如,可響應(yīng)于由語音112啟 動(dòng)的搜索生成HTML文檔116(2)。 HTML響應(yīng)116(2)被發(fā)送至客戶機(jī)102(n)。 另外,文本轉(zhuǎn)語音模塊214可將HTML 116(2)或其部分轉(zhuǎn)換成可聽見的語音并 且返回可聽見的響應(yīng)116(6)??蓪?shí)時(shí)或接近實(shí)時(shí)地返回可聽見的響應(yīng),例如在 文本轉(zhuǎn)語音模塊214轉(zhuǎn)換HTML文檔的時(shí)候。因而,響應(yīng)于可聽見的輸入(例 如語音112),用戶IIO通過客戶機(jī)102(n)可接收全部或部分是可聽見的響應(yīng) 116(6)的響應(yīng)116(p)。注意,轉(zhuǎn)化或者可在客戶機(jī)102(n)處進(jìn)行。因而,客戶 機(jī)102(n)示為具有相應(yīng)的轉(zhuǎn)化模塊118(n),它可被配置為執(zhí)行文本轉(zhuǎn)語音與語 音轉(zhuǎn)文本轉(zhuǎn)換兩者。
      在由搜索引擎216執(zhí)行搜索的情形中,響應(yīng)116可包括搜索結(jié)果222。多 個(gè)搜索結(jié)果222(m)被示為在服務(wù)器202(a)的存儲(chǔ)器208(a)內(nèi)的存儲(chǔ)224中。搜 索結(jié)果222(m)可通過搜索引擎216的執(zhí)行來獲得。
      操作模塊114(a)可配置為以各種方式提煉搜索結(jié)果222(m)。操作模塊 114(a)可使用有關(guān)客戶機(jī)102(n)或用戶110的信息來自動(dòng)提煉搜索。信息可包 括客戶機(jī)102(n)的位置、用戶IIO的概況、關(guān)聯(lián)于用戶IIO的搜索歷史、用戶 IIO的偏好或愛好等等。信息可由客戶機(jī)設(shè)備102(n)提供給操作模塊。或者, 服務(wù)106(s)可維護(hù)該信息或者諸如從客戶機(jī)102(n)、從服務(wù)106(s)的多個(gè)服務(wù) 器202(a)之一或從其它服務(wù)檢索該信息。
      例如,搜索結(jié)果222(m)可基于進(jìn)行請(qǐng)求的客戶機(jī)102(n)的位置進(jìn)行過濾。 相應(yīng)地,操作模塊114(a)可配置為確定請(qǐng)求搜索的客戶機(jī)102(n)的位置。例如, 客戶機(jī)位置可由客戶機(jī)102(n)與服務(wù)106(s)之間的通信中提供的標(biāo)識(shí)符來確 定。標(biāo)識(shí)符可以是關(guān)聯(lián)于客戶機(jī)設(shè)備102(n)的標(biāo)識(shí)符,與路由該通信的設(shè)備相 關(guān)聯(lián)的標(biāo)識(shí)符,等等。在一示例中,操作模塊114(a)可使用標(biāo)識(shí)符來確定客戶 機(jī)102(n)位于"芝加哥"。因而,響應(yīng)于對(duì)餐廳、旅館、方向等的搜索的搜索 結(jié)果222(m)可自動(dòng)限制于"芝加哥"。也可使用用于確定位置的各種其它技術(shù)。
      示例性過程
      下面的討論描述可使用先前描述的系統(tǒng)和設(shè)備來實(shí)現(xiàn)的聲音啟動(dòng)的操作。 每一過程的各方面可用硬件、固件或軟件或其組合來實(shí)現(xiàn)。這些過程被示為一 組框,這些框指定由一或多個(gè)設(shè)備執(zhí)行的操作,并且不必受限于所示的執(zhí)行相 應(yīng)框的操作的順序。在下面討論的各部分中,將參考圖1的環(huán)境100和圖2的
      系統(tǒng)200。
      圖3描繪其中服務(wù)基于來自客戶機(jī)的語音數(shù)據(jù)執(zhí)行操作并且生成響應(yīng)的 過程300。服務(wù)通過網(wǎng)絡(luò)從客戶機(jī)接收語音數(shù)據(jù)(框302)。例如,圖l所示 的服務(wù)106(s)可接收作為語音112輸入至客戶機(jī)102(1)的聲音數(shù)據(jù)??蛻魴C(jī) 102(1)可被配置為連接到網(wǎng)絡(luò)104的移動(dòng)計(jì)算設(shè)備,諸如啟用無線的膝上型計(jì) 算機(jī)。可執(zhí)行客戶機(jī)102(2)的相應(yīng)通信模塊108(1)以提供客戶機(jī)102(2)與服務(wù) 106(1)之間的聲音即時(shí)消息收發(fā)會(huì)話。因而,語音112可由客戶機(jī)102(2)通過 網(wǎng)絡(luò)104經(jīng)由聲音即時(shí)消息收發(fā)會(huì)話來發(fā)送,而服務(wù)106(s)可接收(例如,"收 聽")語音112。
      執(zhí)行轉(zhuǎn)化模塊118(s)以將語音數(shù)據(jù)轉(zhuǎn)化成文本串(框304)。例如,在上 例中收到的語音112可被轉(zhuǎn)化成文本306??蓤?zhí)行圖1所示的轉(zhuǎn)化模塊118(s) 以轉(zhuǎn)換語音112。語音112可指定簡(jiǎn)單的命令諸如"1"、"食物"、"運(yùn)行"、 "買"等等,或者語音112可以是短語或語句,例如"找意大利餐廳"。因而, 轉(zhuǎn)化模塊118(s)將語音112轉(zhuǎn)化成指令、命令、項(xiàng)等形式的文本306,它可由 服務(wù)106(s)用于啟動(dòng)一或多個(gè)操作。
      文本被提供給操作模塊,后者使用該文本來執(zhí)行操作并獲得結(jié)果(框 308)。繼續(xù)該示例,現(xiàn)在假設(shè)文本306是命令,例如"買項(xiàng)目2"。圖1的操 作模塊114(s)接收文本306。操作模塊114(s)可配置為使用文本306來執(zhí)行購(gòu) 買操作。例如,服務(wù)106(s)可能先前已經(jīng)在聲音即時(shí)消息收發(fā)會(huì)話期間、通過 電子郵件、因特網(wǎng)等向用戶IIO提供了銷售項(xiàng)目的列表。用戶IIO在審閱列表 之后決定買列表中的項(xiàng)目2。用戶IIO通過客戶機(jī)102(1)(例如無線膝上型計(jì) 算機(jī))將短語"買項(xiàng)目2"作為語音提供給客戶機(jī)102(1)以啟動(dòng)對(duì)所需項(xiàng)目的 購(gòu)買。
      操作模塊114(s)接收作為文本306的經(jīng)過轉(zhuǎn)化的命令并且啟動(dòng)購(gòu)買操作。
      獲得操作310的結(jié)果。例如,此例的結(jié)果可以是完成的交易、收據(jù)、購(gòu)買信息 的提示等等。應(yīng)當(dāng)注意,操作模塊可啟動(dòng)由服務(wù)106(S)或圖1所示的任何一或
      多個(gè)服務(wù)106(s)執(zhí)行的購(gòu)買序列。因而,服務(wù)106(s)可配置為處理整個(gè)操作, 或配置為啟動(dòng)可遠(yuǎn)程(例如不在特定的服務(wù)106(s)內(nèi))執(zhí)行的操作并獲得結(jié)果。 自然地,可響應(yīng)于語音U2執(zhí)行如前所述的各種操作。
      操作模塊生成用于傳輸至客戶機(jī)的包含結(jié)果的響應(yīng)(框312)。在上面的 示例中,操作模塊114(s)形成響應(yīng)116(p),它包含購(gòu)買操作的命令例如"買項(xiàng) 目2"的結(jié)果310。結(jié)果310例如可以是購(gòu)買確認(rèn)??尚纬砂_認(rèn)的文本即 時(shí)消息。包含確認(rèn)的即時(shí)消息可通過客戶機(jī)102(1)與服務(wù)106(s)之間的即時(shí)消 息收發(fā)會(huì)話來傳輸。因而,響應(yīng)于聲音購(gòu)買命令,用戶IIO接收確認(rèn)購(gòu)買所需 項(xiàng)目的文本即時(shí)消息響應(yīng)。具有不同的輸入與響應(yīng)模式的能力在這樣一些的情 形中是合乎需要的難以在某些客戶機(jī)設(shè)備上形成文本或圖形請(qǐng)求,或者在一 些時(shí)候要閱讀文本或圖形響應(yīng)。因而,通過口頭輸入請(qǐng)求并以不同或多種模式 (例如,文本、圖形、音頻等)來接收響應(yīng)的能力在某些情形中對(duì)于某些用戶 是有利的。
      在另一示例中,操作模塊可形成可聽見的響應(yīng)。例如,帶有購(gòu)買確認(rèn)的文 本即時(shí)消息可通過轉(zhuǎn)化模塊118(s)從文本轉(zhuǎn)換成語音??蓪?shí)時(shí)傳輸經(jīng)過轉(zhuǎn)化的 確認(rèn),例如通過聲音即時(shí)消息收發(fā)會(huì)話,使得向用戶IIO提供對(duì)購(gòu)買的可聽見 的確認(rèn)。經(jīng)過轉(zhuǎn)化的響應(yīng)可以是合成的語音、錄制的語音等等??稍谄渌憫?yīng) 之外或代替其它響應(yīng)提供該可聽見的響應(yīng)。如前所述,在某些時(shí)候,可聽見的 響應(yīng)對(duì)于用戶而言可能更方便或更安全,諸如在"忙碌"、駕駛等同時(shí)。
      在另一情形中,可連同簡(jiǎn)單的可聽見的響應(yīng)一起提供圖形響應(yīng),諸如帶有 購(gòu)買確認(rèn)的文本即時(shí)消息。例如,可提供簡(jiǎn)短的可聽見的響應(yīng),諸如"已完成"、 "成功"、"結(jié)果已發(fā)送"或"再試"。轉(zhuǎn)化模塊118(s)可配置為形成簡(jiǎn)短的 可聽見的響應(yīng)。在此情形中,向用戶IIO提供對(duì)所需購(gòu)買的可聽見確認(rèn)與文本 確認(rèn)兩者。也構(gòu)想了響應(yīng)模式的各種其它組合,包括電子郵件、即時(shí)消息、圖 像、視頻、音頻、文件、HTML文檔等中的一或多個(gè)。
      圖4描繪其中使用語音在服務(wù)處啟動(dòng)搜索的示例性過程400。作為語音接 收的搜索項(xiàng)被傳輸至服務(wù)以啟動(dòng)web搜索(框402)。例如,圖2所示的用戶
      110可通過配置為移動(dòng)電話的客戶機(jī)設(shè)備102(n)啟動(dòng)搜索。相應(yīng)地,通信模塊 108(n)可配置為通過網(wǎng)絡(luò)104提供無線聲音服務(wù),且因而客戶機(jī)102(n)可將聲 音數(shù)據(jù)傳輸至一或多個(gè)服務(wù)106(s)。在此例中,配置為移動(dòng)電話的客戶機(jī)設(shè)備 102(n)的用戶IIO正在伊利諾伊州芝加哥市旅行,并且想要吃意大利菜。用戶 110可使用移動(dòng)電話呼叫圖2的服務(wù)106(s),例如該服務(wù)被配置為提供搜索服 務(wù)。用戶IIO啟動(dòng)與該服務(wù)的交互,諸如通過撥打號(hào)碼、從聯(lián)系人列表選擇服 務(wù)106(s)等等(例如聲音激活的撥號(hào))。
      因而在服務(wù)106(s)與客戶機(jī)設(shè)備102(n)之間啟動(dòng)無線聲音呼叫。用戶110 向客戶機(jī)設(shè)備102(n)(移動(dòng)電話)提供語音112以啟動(dòng)搜索。語音112可包括 搜索項(xiàng)諸如"意大利餐廳芝加哥"。客戶機(jī)設(shè)備102(n)將搜索項(xiàng)(例如語音112) 傳輸至服務(wù)106(s)??蓪⒄Z音112轉(zhuǎn)化成文本。服務(wù)106(s)隨后可將文本項(xiàng)提 供給搜索引擎216以啟動(dòng)web搜索。
      從服務(wù)接收包含web搜索的結(jié)果的響應(yīng)(框404)。在上一示例中,例如, 服務(wù)106(s)可獲得作為由口頭項(xiàng)"意大利餐廳芝加哥"啟動(dòng)的web搜索的結(jié)果 的意大利餐廳的列表。服務(wù)106(s),更具體的是響應(yīng)模塊218形成響應(yīng)116(p), 它包括意大利餐廳列表。響應(yīng)可以是一個(gè)簡(jiǎn)單列表,諸如餐廳的電子郵件列表。 響應(yīng)也可具有文本與圖形的組合(例如圖形響應(yīng)),諸如具有餐廳列表、芝加 哥地圖以及所列餐廳在地圖上所在位置指示的HTML文檔??蛻魴C(jī)102(2)從服 務(wù)106(s)接收隨后可由用戶IIO使用的響應(yīng)。也構(gòu)想了組合文本、圖形、音頻 等的各種其它響應(yīng)116(p)。
      在一實(shí)現(xiàn)中,服務(wù)106(s)可配置為以各種方式提煉搜索或搜索結(jié)果。上例 中的服務(wù)106(s)可使用由服務(wù)106(s)確定的客戶機(jī)102(n)的位置來自動(dòng)提煉搜 索。例如,服務(wù)106(s)可確定無線聲音呼叫源自芝加哥,或者客戶機(jī)設(shè)備102(n) 當(dāng)前在芝加哥。在此情形中,可簡(jiǎn)化用于啟動(dòng)搜索的語音112。用戶110不用 說"意大利餐廳芝加哥",而是說"意大利餐廳"?;谟煞?wù)106(s)確定的 客戶機(jī)位置,自動(dòng)提煉該搜索。因而,響應(yīng)于作為語音輸入至客戶機(jī)設(shè)備102(n) 的搜索項(xiàng)"意大利餐廳",用戶可接收在其當(dāng)前位置或靠近該位置(在此例中 為芝加哥)的意大利餐廳的搜索結(jié)果。
      圖5描繪形成包含由聲音啟動(dòng)的操作的結(jié)果的響應(yīng)的示例性過程500。執(zhí)
      行由在客戶機(jī)處作為語音接收的聲音數(shù)據(jù)指定的操作(框502)?,F(xiàn)在假設(shè)圖
      1所示的用戶UO想要使用手持計(jì)算設(shè)備諸如圖1所示的個(gè)人數(shù)字助理(PDA) 102(3)來傳送文件。文件可以是任何計(jì)算機(jī)可讀文件,諸如演示、文本文檔、 音頻記錄等等。在此情形中,用戶想要與一或多個(gè)伙伴共享文件"file.txt"。 該文件可實(shí)際位于PDA102(3)上,或在用戶IIO能通過網(wǎng)絡(luò)104、對(duì)等網(wǎng)絡(luò)等 訪問的遠(yuǎn)程存儲(chǔ)中。在此例中,用戶110可使用聲音來啟動(dòng)從PDA102(3)或從 遠(yuǎn)程位置至另一位置,諸如至該一或多個(gè)伙伴能訪問的網(wǎng)絡(luò)存儲(chǔ)的文件傳送。 用戶110使用PDA 102(3)通過網(wǎng)絡(luò)104將語音112傳輸至服務(wù)106(s)。例如, 用戶IIO可說出命令或者短語諸如"傳送,file.txt",這由PDA作為語音112 接收。語音112指定的操作被傳輸至服務(wù)106(s)。在一實(shí)現(xiàn)中,語音112是作 為聲音數(shù)據(jù)來傳輸?shù)?。語音112可被轉(zhuǎn)化成操作模塊114(s)能理解的指令,后 者隨后執(zhí)行指定的操作。例如,轉(zhuǎn)化模塊118(s)可將語音112從語音轉(zhuǎn)化成文 本指令?;蛘撸蛻魴C(jī)102諸如PDA102(3)可配置為將聲音數(shù)據(jù)轉(zhuǎn)換成文本以 便傳輸至服務(wù)106(s)。包括在PDA 102(3)上的轉(zhuǎn)化模塊U8(n)執(zhí)行將語音112 從語音至文本的轉(zhuǎn)化,且隨后將文本指令發(fā)送至服務(wù)106(s)。
      服務(wù)106(s)執(zhí)行由語音112指定的操作。例如,可執(zhí)行操作模塊114(s)以 在PDA102(3)與網(wǎng)絡(luò)存儲(chǔ)位置之間傳送文件"file.txt"。如此,用戶110可將 文件移動(dòng)至其他人(例如, 一或多個(gè)伙伴)可訪問該文件的位置。當(dāng)然,也可 按另一方向傳送文件,例如,從服務(wù)102(s)或其它網(wǎng)絡(luò)存儲(chǔ)至PDA 102(3)。
      形成響應(yīng)以便至客戶機(jī),響應(yīng)包括操作的結(jié)果(框504)。在上例中,結(jié) 果可指示文件傳送是否成功。例如,可形成可聽見的響應(yīng)116(p),它說"已完 成"。響應(yīng)116(p)也可以是文本消息、HTML消息等,它提供傳送位置中的文 件的列表。也可形成響應(yīng)116(p)的組合,諸如確認(rèn)該傳送的即時(shí)消息連同諸如 "成功"的可聽見的響應(yīng)。可執(zhí)行轉(zhuǎn)化模塊118(s)以向PDA 102(3)提供實(shí)時(shí)語 音響應(yīng)。
      自然地,可使用該過程來執(zhí)行各種其它操作,諸如檢索文件、發(fā)送消息、 訪問帳戶、購(gòu)買項(xiàng)目、將文件通過電子郵件發(fā)送至一或多個(gè)接收者、在遠(yuǎn)程計(jì) 算設(shè)備上啟動(dòng)可執(zhí)行指令等等。
      圖6描繪其中使用無線一鍵通(PoC)來執(zhí)行聲音啟動(dòng)的操作的示例性過
      程600。建立無線一鍵通(PoC)會(huì)話(框602)。例如,圖2所示的客戶機(jī)設(shè) 備102(n)可配置為啟用PoC的移動(dòng)電話。移動(dòng)電話客戶機(jī)102(n)可維護(hù)PoC 聯(lián)系人的列表。 一或多個(gè)服務(wù)106(s)可以是PoC聯(lián)系人。假設(shè)用戶IIO想要來 自服務(wù)106(s)的內(nèi)容。服務(wù)106(s)可配置為通過網(wǎng)絡(luò)104提供各種內(nèi)容,諸如 音頻、視頻、網(wǎng)頁等等。在此情形中,用戶110從服務(wù)106(s)搜尋音頻內(nèi)容。 用戶選擇PoC聯(lián)系人并啟動(dòng)PoC會(huì)話。例如,用戶可從聯(lián)系人中選擇服務(wù)106(s) 并且擊打PoC按鈕以啟動(dòng)會(huì)話。在移動(dòng)電話客戶機(jī)102(n)與服務(wù)106(s)之間建 立PoC會(huì)話。服務(wù)106(s)可通過PoC會(huì)話立即"收聽"到來自移動(dòng)電話客戶機(jī) 102(n)的語音。
      通過PoC會(huì)話從客戶機(jī)接收語音數(shù)據(jù)(框604)。例如,圖2的用戶110 向移動(dòng)電話客戶機(jī)102(n)提供語音112,它通過PoC會(huì)話在服務(wù)106(s)處可被 即時(shí)(或接近即時(shí))聽到。語音112可以是對(duì)所需音頻內(nèi)容的請(qǐng)求。例如,用 戶語音112可包括歌曲標(biāo)題、藝術(shù)家、播放列表、位置等。
      將語音數(shù)據(jù)轉(zhuǎn)換成文本(框606)。繼續(xù)上例,對(duì)所需音頻內(nèi)容的請(qǐng)求可 能不能直接被服務(wù)106(s)理解,具體是不能被將啟動(dòng)所需操作的操作模塊114(a) 理解。因此,可將請(qǐng)求從語音轉(zhuǎn)換成文本,例如,轉(zhuǎn)換成操作模塊114(a)能理 解的指令。如圖2所示,轉(zhuǎn)化模塊118(a)可在服務(wù)106(s)的處理器204(a)上執(zhí) 行以將收到的語音112轉(zhuǎn)換成文本。在此例中,可生成提供用于啟動(dòng)檢索語音 112中指定的音頻內(nèi)容的指令的文本。
      使用該文本執(zhí)行操作(框608)。例如,可將由轉(zhuǎn)化模塊118(a)生成的文 本(例如,指令)提供給操作模塊114(a),后者使用該文本來執(zhí)行操作,在此 情形中為檢索音頻內(nèi)容??蓮母鞣N位置檢索所需的音頻內(nèi)容,包括從服務(wù)器 202(a)、從服務(wù)106(s)的多個(gè)服務(wù)器202之一或者從另一服務(wù)106或能通過網(wǎng) 絡(luò)104訪問的遠(yuǎn)程位置來檢索所需的音頻內(nèi)容。
      形成包含操作的結(jié)果的響應(yīng)以便傳輸至客戶機(jī)(框610)。例如,可形成 配置為HTML文檔的響應(yīng)116(p),它提供至所選音頻內(nèi)容的超鏈接。在收到響 應(yīng)116(p)時(shí),用戶IIO可使用該超鏈接來訪問內(nèi)容??赏ㄟ^流傳送或非流傳送 的方式提供內(nèi)容。響應(yīng)116(p)也可包括返回所需內(nèi)容本身。例如,響應(yīng)116(p) 可用非流傳送方式將音頻文件單獨(dú)地或者連同諸如即時(shí)消息收發(fā)、電子郵件等
      的圖形響應(yīng)一起提供給移動(dòng)電話客戶機(jī)102(n)。
      在一實(shí)現(xiàn)中,可使用已建立的PoC會(huì)話將可聽見的響應(yīng)傳輸至客戶機(jī)。
      例如,可聽見的響應(yīng)可指示所需內(nèi)容可用或不可用、指示發(fā)送了圖形響應(yīng)、內(nèi)
      容可用的位置等等。因而,圖2的響應(yīng)模塊218可用于形成響應(yīng)116(p)。響應(yīng) 可通過轉(zhuǎn)化模塊118(a)從文本轉(zhuǎn)化成語音。轉(zhuǎn)化的結(jié)果可通過PoC會(huì)話實(shí)時(shí)發(fā) 送至移動(dòng)電話客戶機(jī)102(n)。在另一實(shí)現(xiàn)中,可通過該P(yáng)oC會(huì)話或另一 PoC 會(huì)話將所需音頻內(nèi)容流傳送至客戶機(jī)。通過PoC的可聽見的響應(yīng)可以是除其它 響應(yīng)模式之外,或者代替其它響應(yīng)模式的響應(yīng)。例如,可用如前所述的各種組 合形成即時(shí)消息、HTML、文本、電子郵件和可聽見的響應(yīng)。
      圖7描繪其中利用聲音啟動(dòng)的搜索的結(jié)果來執(zhí)行附加的聲音啟動(dòng)的操作 的過程700。使用在客戶機(jī)處作為語音輸入的項(xiàng)來執(zhí)行搜索(框702)。例如, 用戶110可能希望進(jìn)行預(yù)定,諸如預(yù)定航班。用戶110可使用圖l所示的客戶 機(jī)設(shè)備102(n)之一通過網(wǎng)絡(luò)104與配置為提供預(yù)定的服務(wù)106(s)通信。用戶110 可提供語音U2以啟動(dòng)對(duì)可用航班的搜索。例如,如果用戶希望找出四月1日 在俄勒岡州波特蘭市與伊利諾伊州芝加哥市之間的航班,則用戶iio可提供具 有搜索項(xiàng)諸如"航班,PDX至ORD,四月1日"的語音112。可在服務(wù)106(s) 上執(zhí)行搜索引擎216以執(zhí)行由語音112指定的搜索。可向搜索引擎216提供由 轉(zhuǎn)化模塊118(a)從對(duì)語音112的轉(zhuǎn)化所生成的文本搜索項(xiàng)。盡管轉(zhuǎn)化模塊118(a) 被示為在與搜索引擎216相同的服務(wù)器上,但轉(zhuǎn)化也可在不同的服務(wù)器202上 執(zhí)行、由客戶機(jī)102的轉(zhuǎn)化模塊118執(zhí)行等等。
      將搜索的結(jié)果傳輸至客戶機(jī)(框704)。響應(yīng)于上面的航班搜索示例,用 戶110可接收響應(yīng)116(p),它包括四月l在俄勒岡州波特蘭市與伊利諾伊州芝 加哥市之間的五個(gè)航班的列表。響應(yīng)可用先前描述的任何各種方法來格式化, 諸如HTML文檔、即時(shí)消息、電子郵件等等。
      基于與搜索結(jié)果和作為語音對(duì)客戶機(jī)的輸入相關(guān)聯(lián)的指令執(zhí)行附加的操 作(框706)。上例的用戶IIO接收并查看搜索的結(jié)果,其中例如包括五個(gè)可 能的航班。用戶IIO現(xiàn)在可能希望預(yù)定這些航班之一。因而,用戶可提供與搜 索結(jié)果相關(guān)的附加的語音112。例如,附加的用戶語音112可指示"預(yù)定航班 99",它對(duì)應(yīng)于在搜索結(jié)果中列出的航班中的一個(gè)。在一實(shí)現(xiàn)中,還可向用戶 提示如何使用搜索結(jié)果來啟動(dòng)進(jìn)一步的操作。例如,在搜索結(jié)果中的項(xiàng)目l可 指示"要預(yù)定該航班就說預(yù)定1"。由附加的語音112指定的操作被傳輸至 服務(wù)102(S)。該服務(wù)可以是與執(zhí)行搜索相同的服務(wù)102(S),或者是不同的服務(wù)
      102。服務(wù)隨后執(zhí)行與先前提供的搜索結(jié)果相關(guān)的附加操作。
      因而,可利用由語音啟動(dòng)的搜索的結(jié)果來執(zhí)行由語音啟動(dòng)的附加操作。自 然地,可使用利用語音啟動(dòng)的搜索結(jié)果來執(zhí)行各種操作,諸如文件傳送、文件 檢索、購(gòu)買交易、行程預(yù)定、旅館和餐廳預(yù)定等等。附加操作也可以是進(jìn)一步 的搜索或者對(duì)搜索結(jié)果的提煉。
      總結(jié)
      盡管已經(jīng)用專用于結(jié)構(gòu)特征和/或方法動(dòng)作的語言描述了本發(fā)明,但要理 解,所附權(quán)利要求書定義的本發(fā)明不必受限于所述的這些特定特征或動(dòng)作。相 反,這些特定特征和動(dòng)作是作為實(shí)現(xiàn)要求保護(hù)的本發(fā)明的示例性形式而被公開 的。
      權(quán)利要求
      1.一種方法,包括轉(zhuǎn)化通過網(wǎng)絡(luò)接收的聲音命令;執(zhí)行所述經(jīng)過轉(zhuǎn)化的命令以形成圖形響應(yīng);以及形成包含所述圖形響應(yīng)的通信以便通過所述網(wǎng)絡(luò)傳輸至所述聲音命令的發(fā)送者。
      2. 如權(quán)利要求1所述的方法,其特征在于,所述圖形響應(yīng)是電子郵件。
      3. 如權(quán)利要求1所述的方法,其特征在于,所述圖形響應(yīng)是超文本標(biāo)記語 言(HTML)文檔。
      4. 如權(quán)利要求1所述的方法,其特征在于,所述圖形響應(yīng)是即時(shí)消息。
      5. 如權(quán)利要求1所述的方法,其特征在于,所述聲音命令是通過無線一鍵 通(PoC)會(huì)話接收的。
      6. 如權(quán)利要求1所述的方法,其特征在于,所述聲音命令是從手持客戶機(jī) 設(shè)備接收的。
      7. 如權(quán)利要求1所述的方法,其特征在于,所述聲音命令是通過聲音即時(shí) 消息收發(fā)會(huì)話接收的。
      8. 如權(quán)利要求1所述的方法,其特征在于,所述聲音命令指定要執(zhí)行的選 自以下的至少一個(gè)操作搜索;金融交易;購(gòu)買交易;文件傳送;預(yù)定;以及下載。
      9. 一種方法,包括執(zhí)行由在客戶機(jī)處作為語音接收的聲音數(shù)據(jù)指定的搜索;以及 形成包括搜索結(jié)果的響應(yīng),以便通過網(wǎng)絡(luò)傳輸至發(fā)起所述聲音數(shù)據(jù)的客戶機(jī)。
      10. 如權(quán)利要求9所述的方法,其特征在于,還包括將所述聲音數(shù)據(jù)轉(zhuǎn)換 成文本搜索項(xiàng)。
      11. 如權(quán)利要求9所述的方法,其特征在于,所述經(jīng)過轉(zhuǎn)換的聲音數(shù)據(jù)是執(zhí)行所述搜索的模塊能理解的,而所述聲音數(shù)據(jù)是所述模塊不能理解的。
      12. 如權(quán)利要求9所述的方法,其特征在于,所述響應(yīng)包含選自以下的一 或多項(xiàng)電子郵件;文本;html文檔;即時(shí)消息;圖像;以及可聽見的聲音。
      13. 如權(quán)利要求9所述的方法,其特征在于,基于所述客戶機(jī)的位置自動(dòng) 提煉所述搜索結(jié)果。
      14. 如權(quán)利要求9所述的方法,其特征在于,還包括將所述搜索結(jié)果從文 本轉(zhuǎn)換成可聽見的響應(yīng)。
      15. 如權(quán)利要求9所述的方法,其特征在于,所述響應(yīng)是實(shí)時(shí)可聽見的響應(yīng)。
      16. 如權(quán)利要求9所述的方法,其特征在于,還包括基于與所述搜索結(jié)果 和作為語音對(duì)客戶機(jī)的輸入相關(guān)聯(lián)的附加聲音數(shù)據(jù)執(zhí)行操作。
      17. —或多個(gè)包括計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)可讀介質(zhì),在計(jì)算機(jī)上執(zhí)行 所述計(jì)算機(jī)可執(zhí)行指令時(shí),指示所述計(jì)算機(jī)將通過移動(dòng)設(shè)備輸入的聲音數(shù)據(jù)轉(zhuǎn) 換成文本搜索串以輸入到因特網(wǎng)搜索引擎。
      18. 如權(quán)利要求17所述的一或多個(gè)介質(zhì),其特征在于,所述聲音數(shù)據(jù)是通 過無線一鍵通(PoC)會(huì)話傳輸至所述因特網(wǎng)搜索引擎的。
      19. 如權(quán)利要求17所述的一或多個(gè)介質(zhì),其特征在于,還包括向所述聲音 數(shù)據(jù)的發(fā)送者提供搜索結(jié)果的指令。
      20. 如權(quán)利要求18所述的一或多個(gè)介質(zhì),其特征在于,提供給所述發(fā)送者 的所述搜索結(jié)果是不可聽見的。
      全文摘要
      本文提供聲音啟動(dòng)的網(wǎng)絡(luò)操作的實(shí)施例。
      文檔編號(hào)G06F17/00GK101341482SQ200680048127
      公開日2009年1月7日 申請(qǐng)日期2006年11月17日 優(yōu)先權(quán)日2005年12月22日
      發(fā)明者A·拉瑪克里什納, J·J·奧斯特倫德, Q·米勒 申請(qǐng)人:微軟公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1