国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      生成輸入建議的制作方法

      文檔序號(hào):6596645閱讀:469來源:國(guó)知局
      專利名稱:生成輸入建議的制作方法
      生成輸入建議
      背景技術(shù)
      本說明書涉及數(shù)字?jǐn)?shù)據(jù)處理 ,并且尤其涉及計(jì)算機(jī)實(shí)施的搜索服務(wù)。傳統(tǒng)的搜索服務(wù)提供搜索查詢?cè)~(search query)建議作為所輸入的搜索查詢?cè)~的替換。例如,傳統(tǒng)的搜索引擎可以包括接收文本輸入的查詢?cè)~輸入?yún)^(qū)域。傳統(tǒng)的搜索服務(wù)可以響應(yīng)于接收到該文本輸入提供針對(duì)該文本輸入的搜索查詢?cè)~建議。用戶可以選擇一個(gè)搜索查詢?cè)~建議作為搜索查詢?cè)~。在一些情況中,用戶可以提供以不同的輸入形式表達(dá)的文本輸入。例如,該文本輸入可以包括第一文字(script)的詞素(例如,漢字字符)、第二文字的詞條(例如,英文單詞)以及表達(dá)第一文字的詞素的語音表達(dá)的第二文字的字母(例如,拼音音節(jié)或者拼音縮寫)的混合體。

      發(fā)明內(nèi)容
      本說明書描述與生成搜索查詢?cè)~建議有關(guān)的技術(shù)。本說明書中描述的主題的一方面通??梢杂梅椒▉眢w現(xiàn),該方法包括以下動(dòng)作接收由用戶輸入到輸入?yún)^(qū)域中的文本輸入,該文本輸入包括表達(dá)第一語言的第一形式的第一 n元語法和下列中的至少一個(gè)表達(dá)第一語言的第二形式的第二 n元語法和第二語言的第三n元語法;生成文本輸入的一個(gè)或多個(gè)替換表達(dá),其中替換表達(dá)是表達(dá)與文本輸入不直接匹配的一個(gè)或多個(gè)輸入建議的不確定形式;將替換表達(dá)發(fā)送到建議服務(wù)并且從建議服務(wù)接收一個(gè)或多個(gè)輸入建議;以及比較一個(gè)或多個(gè)輸入建議與文本輸入以將一組一個(gè)或多個(gè)輸入建議識(shí)別為文本輸入的可選替換,用于顯示在用戶界面中。該方面的其它實(shí)施例包括對(duì)應(yīng)的系統(tǒng)、設(shè)備和計(jì)算機(jī)程序產(chǎn)品。這些和其它實(shí)施例可以可選地包括以下特征中的一個(gè)或多個(gè)。以不確定形式生成文本輸入的一個(gè)或多個(gè)替換表達(dá)包括將文本輸入分段為一個(gè)或多個(gè)相接的字符序列,其中每個(gè)序列表達(dá)單詞或查詢?cè)~;識(shí)別每段的一個(gè)或多個(gè)表達(dá),其中每個(gè)表達(dá)是替換形式;并且用替換形式的相關(guān)表達(dá)代替文本輸入中的一個(gè)或多個(gè)段,以產(chǎn)生文本輸入的替換表達(dá)。文本輸入包括表達(dá)第一語言的第二形式的第二 n元語法,并且以不確定形式生成文本輸入的一個(gè)或多個(gè)替換表達(dá)包括從文本輸入生成第四n元語法,其中第四n元語法是文本輸入的替換表達(dá)并且包括第二形式的一個(gè)或多個(gè)文本序列。第四n元語法包括第一形式的一個(gè)或多個(gè)文本序列。表達(dá)第一語言的第二形式包括使用完整語音表達(dá)或部分語音表達(dá)來表達(dá)第一語言。第一語言是中文,并且表達(dá)中文的第一形式包括使用漢字字符表達(dá)中文。完整語音表達(dá)是拼音音節(jié),并且部分語音表達(dá)是拼音縮寫。文本輸入包括第二語言的第三n元語法,并且第二語言是英文??蛇x替換包括使用漢字字符表達(dá)的一個(gè)或多個(gè)輸入建議。在用戶在搜索請(qǐng)求中提交文本輸入之前并且在接收該文本輸入的每個(gè)語言符號(hào)后等待預(yù)定時(shí)間量之后接收該文本輸入。
      可以實(shí)施本說明書中描述的主題的特定實(shí)施例來實(shí)現(xiàn)以下優(yōu)點(diǎn)中的一個(gè)或多個(gè)。從以不同輸入形式表達(dá)的文本輸入自動(dòng)生成輸入建議減少了獲得搜索建議所需的用戶交互。另外,獲得以不同形式表達(dá)的文本輸入的搜索建議可以通過捕獲用戶可能不方便提供的搜索查詢?cè)~建議增加搜索覆蓋率,例如,用戶可能不擁有輸入方法編輯器(input methodeditor, ME),或者可能不知道如何以特定的腳本語言提供文本輸入。以不確定形式生成在確定輸入建議中使用的文本輸入的替換表達(dá)減少了存儲(chǔ)文本輸入的可能表達(dá)所需的存儲(chǔ)器。除了減少存儲(chǔ)器使用,以不確定形式生成替換表達(dá)通過增加搜索覆蓋率并且減少被處理的輸入建議的數(shù)目增加了識(shí)別輸入建議(例如,音譯)的 精確度、查全率(recall)和效率。附圖及以下描述中給出本說明書中描述的主題的一個(gè)或多個(gè)實(shí)施例的細(xì)節(jié)。該主題的其它特征、方面和優(yōu)點(diǎn)將從以下描述、附圖和權(quán)利要求中變得清楚。


      圖I是示出用于生成不同形式的文本輸入的可選替換的系統(tǒng)的一些實(shí)施例中的數(shù)據(jù)流的例子的框圖。圖2是示出示例性的輸入建議聚合器的框圖。圖3是示出示例文本輸入和該文本輸入的示例可選擇的替換的圖。圖4是示出數(shù)據(jù)流的例子的框圖,該數(shù)據(jù)流的例子示出如何從特定的文本輸入生成輸入建議。圖5是示出用于自動(dòng)生成不同形式的文本輸入的可選替換的示例處理的流程圖。各圖中相同的參考標(biāo)號(hào)和名稱表不相同的兀件。
      具體實(shí)施例方式圖I是示出生成不同形式的文本輸入的可選替換的系統(tǒng)的一些實(shí)施中的數(shù)據(jù)流的例子的框圖。用戶110向由客戶端130呈現(xiàn)的搜索引擎查詢?cè)~輸入?yún)^(qū)域提供輸入120。輸入120包括不同形式的n元語法(n-gram)。n元語法是n個(gè)相連的語言符號(hào)(token)例如字符或單詞的序列。n元語法具有階數(shù),該階數(shù)是該n元語法中語言符號(hào)的數(shù)目。例如,I元語法(或unigram)包括一個(gè)語言符號(hào);2兀語法(或bi-gram)包括兩個(gè)語言符號(hào)。輸入120可以包括表達(dá)第一語言的第一形式的第一 n元語法。輸入120還可以包括表達(dá)第一語言的第二形式的第二 n元語法或者第二語目的第二 n兀語法。作為例子,“我”(例如,英文中的“me”并且發(fā)音為“w6”)可以是表達(dá)第一語言的第一形式的第一 n元語法,例如表達(dá)中文的漢字字符。另外,“wo”可以是表達(dá)第一語言的第二形式的第二 n元語法。特別地,“wo”是2元語法,是“我”的完整語音表達(dá)(例如,拼音音節(jié))。此外,是表達(dá)第一語言的第二形式的第二 n元語法的另一個(gè)例子。特別地,“w”是I元語法,是多個(gè)漢字字符的部分語音表達(dá),例如發(fā)音為、6”的“我”、發(fā)音為、6”的“臥”和發(fā)音為的“為”的拼音縮寫。羅馬字符被稱為部分語音表達(dá),因?yàn)樗瞧匆粢艄?jié)的字符序列中的第一個(gè)字符。客戶端130向搜索服務(wù)140發(fā)送輸入120的可選替換請(qǐng)求。該請(qǐng)求包括輸入120。在一些實(shí)施中,客戶端130在搜索引擎查詢?cè)~輸入?yún)^(qū)域接收到文本輸入的每個(gè)語言符號(hào)之后,例如在接收到第一搜索查詢?cè)~的每個(gè)字符或者第一搜索查詢?cè)~的每個(gè)單詞之后立即發(fā)送該請(qǐng)求。結(jié)果,當(dāng)用戶鍵入該文本輸入的每個(gè)語言符號(hào)時(shí),可以將可選替換提供給用戶。在一些替選實(shí)施中,客戶端130實(shí)施延遲,在向搜索服務(wù)140自動(dòng)進(jìn)行請(qǐng)求之前等待預(yù)定的時(shí)間量。安裝在搜索服務(wù)140上的模塊142,例如,軟件腳本,接收輸入120。模塊142處理輸入120以將輸入120轉(zhuǎn)換為不確定形式(ambiguous form)。特別地,如下面進(jìn)一步詳細(xì)描述的,模塊142生成輸入120的一個(gè)或多個(gè)替換表達(dá),每一個(gè)都是不確定形式。模塊142向安裝在搜索服務(wù)140上的建議服務(wù)144發(fā)送替換表達(dá)。在一些替選實(shí)施中,搜索服務(wù)140安裝在中間服務(wù)器上,并且建議服務(wù)144安裝在用于從搜索服務(wù)140接收替換表達(dá)的接收服務(wù)器上。 建議服務(wù)144返回針對(duì)輸入120的一個(gè)或多個(gè)輸入建議。該輸入建議是輸入120的替換,例如,完全的表達(dá)、音譯。模塊142對(duì)一個(gè)或多個(gè)輸入建議與輸入120進(jìn)行比較,以將一組所述一個(gè)或多個(gè)輸入建議識(shí)別為輸入120的可選替換。模塊142實(shí)時(shí)地,即當(dāng)用戶122在搜索引擎查詢?cè)~輸入?yún)^(qū)域中鍵入字符時(shí),將可選替換返回給客戶端130,顯示在用戶界面中。圖2是示出示例輸入建議聚合器200的框圖。輸入建議聚合器200包括轉(zhuǎn)換子模塊210和比較子模塊220。輸入建議聚合器200接收文本輸入。轉(zhuǎn)換子模塊210以不確定形式生成該文本輸入的一個(gè)或多個(gè)替換表達(dá)。比較子模塊220接收該輸入建議,并且對(duì)該輸入建議與該文本輸入進(jìn)行比較,以將一組所述一個(gè)或多個(gè)輸入建議識(shí)別為第一文本輸入的可選替換。圖3是示出示例文本輸入和該文本輸入的示例可選替換的圖。該文本輸入包括字符序列“北jingfd office hour”,其表達(dá)不同形式的多個(gè)n元語法。具體地,該文本輸入包括表達(dá)第一語言的第一形式的I兀語法,即漢字字符“北”。該文本輸入還包括表達(dá)第一語言的第二形式的4元語法,即完整語音表達(dá)“ jlng” (拼音音節(jié))。另外,該文本輸入包括兩個(gè)表達(dá)第一語言的第三形式的I元語法,即拼音縮寫“f”和拼音縮寫“d”。該文本輸入還包括不同的第二語言的6元語法和4元語法,即英文單詞“office”和“hour”??蛇x替換包括漢字字符“北”、“京”、“飯”、“店”。該可選替換還包括英文單詞“office”和“hour”。漢字字符“北”由該文本輸入中的相同字符表達(dá)。漢字字符“京”(例如,英文中的“capital ”并且發(fā)音為“jlng”)由該文本輸入中的拼音音節(jié)“jlng”表達(dá)。漢字字符“飯”(例如,英文中的“food”并且發(fā)音為“fdm”)由該文本輸入中的拼音縮寫“f”表達(dá),并且漢字字符“店”(例如,英文中的“store”并且發(fā)音為“didm”)由拼音縮寫“d”表達(dá)。英文單詞“office”和“hour”由該文本輸入中的相同單詞表達(dá)。該可選替換的示例性的翻譯包括“Beijing restaurant office hours” 和 “Beijing hotel office hours”,其中“北京”被翻譯為“Beijing”并且“飯店”被翻譯為“restaurant”或“hotel ”。圖4是示出數(shù)據(jù)流的例子的框圖,該數(shù)據(jù)流的例子示出如何從特定的文本輸入生成輸入提示。在該例子中,文本輸入包括字符序列“中g(shù)gug”,其中漢字字符“中”可以單獨(dú)被翻譯為英文中的“middle”并且發(fā)音為“zh6ng”,或者翻譯為英文中的“hit”并且發(fā)音為“zh6ng”。該文本輸入包括第一 I元語法“中”,第二 I元語法“g”,第三I元語法“gu”和第四i元語法“g”。以不確定形式生成替換表達(dá)包括將該文本輸入分段為一個(gè)或多個(gè)相接的字符序列。在一些實(shí)施中,使用前綴匹配進(jìn)行分段。從作為來自用戶的輸入接收到的第一字符開始將該文本輸入分段為相接的序列。從位于序列被分段的順序的開端的第一序列開始到位于該順序的末端的最后序列結(jié)束的每個(gè)字符序列由表達(dá)一個(gè)單詞或一個(gè)查詢?cè)~的最長(zhǎng)字符序列組成。作為例子,用戶提供第一字符I1 ”,接著第二字符“X2”,接著第三字符“X3”,接 著第四字符“x4”,作為文本輸入。該文本輸入從左到右以接收每個(gè)字符的順序包括字符I1X2X3X4”。如果I1X2X3X/表達(dá)一個(gè)單詞,則不分段該文本輸入并且只識(shí)別該相接序列I1X2X3X4'如果I1X2X3X4”不表達(dá)一個(gè)單詞,則轉(zhuǎn)換子模塊210確定“XiX2X3”是否表達(dá)一個(gè)單詞。如果I1X2X/表達(dá)一個(gè)單詞,則該文本輸入被分段為兩個(gè)相接序列“x:x2x3”和“x4”。如果“X:X2X3”不表達(dá)一個(gè)單詞,則轉(zhuǎn)換子模塊210確定“X:X2”是否表達(dá)一個(gè)單詞。如果I1X2”表達(dá)一個(gè)單詞,則將I1X2”識(shí)別為第一相接序列。然后,轉(zhuǎn)換子模塊210確定“X3X4”是否表達(dá)一個(gè)單詞。如果序列“X3X4”表達(dá)一個(gè)單詞,則將該文本輸入分段為兩個(gè)相接序列I1X2 ”和“X3X4 ”。如果I1X2”不表達(dá)一個(gè)單詞,則將“X/’識(shí)別為第一相接序列。使用類似的處理識(shí)別“x2x3x4”中的第二相接序列。特別地,如果“x2x3x4”表達(dá)一個(gè)單詞,則將文本輸入分段為兩個(gè)相接序列“X/’和“X2X3X4”。如果“X2X3X4”不表達(dá)一個(gè)單詞,則轉(zhuǎn)換子模塊210確定“X2X3”是否表達(dá)一個(gè)單詞。如果“X2X3”表達(dá)一個(gè)單詞,則將該文本輸入分段為三個(gè)相接序列“X/’、“X2X3”和“x4”。如果“X2X3”不表達(dá)一個(gè)單詞,則將該文本輸入分段為四個(gè)相接序列
      u Y ,, “v ,, “ V ,,“ V ,,
      人 I 、人 2 、人!B人 4 o在一些可替選實(shí)施中,使用中綴匹配或后綴匹配進(jìn)行分段。在圖4中,字符序列“中g(shù)gug”被分段為四個(gè)相接序列?!爸術(shù)gug”、“中g(shù)gu”、“中g(shù)g”和“中g(shù)”每個(gè)都不表達(dá)一個(gè)單詞,所以“中”被識(shí)別為第一個(gè)相接序列?!癵gug”、“ggu”和“gg”每個(gè)都不表達(dá)一個(gè)單詞,所以“g”被識(shí)別為第二相接序列。特別地,“g”可以是英文單詞(例如,“g00d”、“grain”)的前綴,或者是拼音縮寫(例如,拼音音節(jié)“gu”、“ga”、“gai,,)。“gug”不表達(dá)一個(gè)單詞,但是“gu”可以表達(dá)一個(gè)單詞,所以“gu”被識(shí)別為第三相接序列。特別地,“gu”可以表達(dá)一個(gè)拼音音節(jié)?!癵u”可以表達(dá)的示例拼音音節(jié)包括“gti” (例如,英文中的意思是“Share”的“股”的語音表達(dá))、“gti” (例如,英文中的意思是“strong”的“固”的語音表達(dá))以及“gQ” (例如,英文中的意思是“l(fā)one”的“孤”的語音表達(dá))。因此,“gu”被識(shí)別為第三相接序列,并且“g”(即,在“中g(shù)gug”中接收到的最后字符)被識(shí)別為第四相接序列。結(jié)果,文本輸入“中g(shù)gug”被分段為四個(gè)相接序列“中”、“g”、“gu” 和 “g”。使用識(shí)別出的段生成文本輸入的通用形式的替換表達(dá)。特別地,識(shí)別出每一段的替換形式的表達(dá)。在一些實(shí)施中,每一段可以由完整語音表達(dá)或部分語音表達(dá)來表不。在圖4的例子中,“中”的替換形式的表達(dá)包括“zhong” (即,拼音音節(jié))和“z” (即,拼音縮寫)?!癵u”的替換形式的表達(dá)包括“g”(S卩,拼音縮寫)。在一些實(shí)施中,不識(shí)別由單個(gè)字符組成的識(shí)別出的段的替換形式的表達(dá)?;氐皆摾?,不識(shí)別該文本輸入中第二個(gè)“g”和第三個(gè)“g”的替換形式的表達(dá)。從識(shí)別出的段和該段的替換形式的表達(dá)生成不確定形式的文本輸入的替換表達(dá)。特別地,可以用不同的組合代替該文本輸入中的段,以生成替換表達(dá)。在圖4中,替換表達(dá)的例子包括“ zhongggug”,其中“中”用“ zhong”代替;“ zhongggg”,其中“中”用“ zhong”代替并且“gu”用“g”代替;“zggug”,其中“中”用“z”代替;“zggg”,其中“中”用“z”代替并且“gu”用“g”代替;以及“中g(shù)gg”,其中“gu”用“g”代替。圖4沒有示出實(shí)際處理的通用形式的所有可能的替換表達(dá)。這些替換表達(dá)可以被稱為處于不確定形式,因?yàn)檫@些替換表達(dá)每個(gè)可以表達(dá)一個(gè)或多個(gè)輸入建議。所述一個(gè)或多個(gè)輸入建議中的一些不直接匹配文本輸入。另外,所述一個(gè)或多個(gè)輸入建議中的一些不同于直接從文本輸入生成的輸入建議。作為例子,替換表達(dá)“Zggg”包括拼音縮寫“Z”、“g”、“g”和“g”?!癦ggg”中的第一個(gè)拼音縮寫可以表達(dá)不對(duì)應(yīng)于文本輸入中的“中”的拼音音節(jié)和漢字字符。作為例子,“Z”可以表達(dá)對(duì)應(yīng)于漢字字符“自”和“字”的拼音音節(jié)“Zi”。另外,“Zggg”中的第二個(gè)“g”可以表達(dá)與文本輸入中的“gu”不匹配的拼音音節(jié)和漢字字符。作為例子,“g”可以表達(dá)對(duì)應(yīng)于漢字字符“港”和“剛”的拼音音節(jié) “gang”。這些替換表達(dá)被發(fā)送到建議服務(wù)。在一些實(shí)施中,文本輸入還被發(fā)送到建議服務(wù)。該建議服務(wù)使用這些替換表達(dá)識(shí)別一個(gè)或多個(gè)輸入建議,并且將該一個(gè)或多個(gè)輸入建議返回到建議服務(wù)。在圖4中,輸入建議的例子包括“中國(guó)谷歌”(例如,英文中的“GoogleChina”并且發(fā)音為“Zhdng gu6Gtigg”)、“中國(guó)國(guó)歌”(例如,英文中的“Chinese nationalanthem”并且發(fā)音為“Zh6ng gu6gu6gg”)以及“做廣告工”(例如,英文中的“advertisingindustry”并且發(fā)音為“zu6guQng gao g6ng”)。圖4沒有示出實(shí)際中處理的所有可能的輸入建議。比較模塊220比較這些輸入建議與文本輸入,以將一組一個(gè)或多個(gè)輸入建議識(shí)別為第一文本輸入的可選替換。特別地,比較模塊220從被識(shí)別為第一文本輸入的可選替換的一組一個(gè)或多個(gè)輸入建議中識(shí)別不可能由該文本輸入表達(dá)的輸入建議進(jìn)行排除?!爸袊?guó)谷歌”的語音表達(dá)是“zhong guo gu ge”, “中國(guó)國(guó)歌”的語音表達(dá)是“zhong guo guo ge”,并且“做廣告工”的語音表達(dá)是“zuo guang gao gong”,其中讀音符號(hào)已經(jīng)被去除。比較“做廣告工”與“中g(shù)gug”,該文本輸入中的第一段“中”(“zhong”)表示“做”(“zuo”)的可能性比表示“中”(“zhong”)的可能性低。另外,比較“中國(guó)國(guó)歌”與“中g(shù)gug”,第三段“gu”表示“國(guó)” (“guo”)的可能性比表示“谷” (“gu”)(即,同樣的匹配)的可能性低,。在一些實(shí)施中,只有直接匹配被識(shí)別為文本輸入的可選替換。在前一例子中,只有“中國(guó)谷歌”(“zhong guo gu ge”)是直接匹配,因?yàn)闈h字字符“中”匹配漢字字符“中”,拼音音節(jié)“guo”匹配拼音縮寫“g”,拼音音節(jié)“gu”匹配拼音音節(jié)“gu”,并且拼音音節(jié)“ge”匹配拼音縮寫“g”。在“中國(guó)國(guó)歌” (“zhong guo guo ge”)中,拼音音節(jié)“guo”不匹配拼音 音節(jié)“gu”。另外,在“做廣告工”(“zuo guang gao gong”)中,漢字字符“做”不匹配漢字字符“中”,并且拼音音節(jié)“gao”不匹配拼音音節(jié)“gu”。將這些可選替換返回給客戶端130用于呈現(xiàn)給 用戶110。在一些實(shí)施中,根據(jù)單個(gè)用戶已經(jīng)輸入作為用于搜索的查詢?cè)~的每個(gè)可選替換的頻率將這些可選替換排序。在一些實(shí)施中,使用編輯距離修正該排序。作為例子,可選替換"women clothing”和“我們”(例如,英文中的“we”并且發(fā)音為“wdmen”)二者都可以匹配文本輸入“women”??梢栽黾印皐omen clothing”的排序以表明它更可能由該文本輸入表達(dá),因?yàn)椤皐omen clothing”包括與該文本輸入相同的n元語法“women”,并且需要一個(gè)或多個(gè)操作以將例如音譯“我們”轉(zhuǎn)換為“women”。圖5是示出用于自動(dòng)生成不同形式的文本輸入的可選替換的示例處理500的流程圖。處理500包括510 :接收由用戶輸入到輸入?yún)^(qū)域中的第一文本輸入。第一文本輸入包括表達(dá)第一語言的第一形式的第一 n元語法和以下中的至少一個(gè)表達(dá)第一語言的第二形式的第二 n元語法和第二語言的第三n元語法。處理500還包括520 :生成第一文本輸入的一個(gè)或多個(gè)替換表達(dá),其中該替換表達(dá)是表達(dá)不直接匹配該文本輸入的一個(gè)或多個(gè)輸入建議的不確定形式。處理500還包括530 :將該替換表達(dá)發(fā)送到建議服務(wù)并且從該建議服務(wù)接收一個(gè)或多個(gè)輸入建議。處理500還包括540 比較該一個(gè)或多個(gè)輸入建議與第一文本輸入,以將一組一個(gè)或多個(gè)輸入建議識(shí)別為第一文本輸入的可選替換,用于顯示在用戶界面中。本說明書中描述的主題和功能操作的實(shí)施例可以由數(shù)字電子電路或者計(jì)算機(jī)軟件、固件或硬件來實(shí)施,包括本說明書中公開的結(jié)構(gòu)和它們的結(jié)構(gòu)等效物或者它們中的一個(gè)或多個(gè)的組合。本說明書中描述的主題的實(shí)施例可以實(shí)施為一個(gè)或多個(gè)計(jì)算機(jī)程序產(chǎn)品,即,在有形程序載體上編碼以用于由數(shù)字處理設(shè)備執(zhí)行或者控制數(shù)字處理設(shè)備的操作的一個(gè)或多個(gè)計(jì)算機(jī)程序指令模塊。該有形程序載體可以是計(jì)算機(jī)可讀介質(zhì)。該計(jì)算機(jī)可讀介質(zhì)可以是機(jī)器可讀存儲(chǔ)裝置、機(jī)器可讀存儲(chǔ)基板、存儲(chǔ)器裝置或者它們中的一個(gè)或多個(gè)的組合。術(shù)語“數(shù)據(jù)處理設(shè)備”包含用于處理數(shù)據(jù)的所有設(shè)備、裝置和機(jī)器,作為示例包括可編程處理器、計(jì)算機(jī)或者多處理器或計(jì)算機(jī)。除了硬件以外,設(shè)備還包括用于創(chuàng)建所討論的計(jì)算機(jī)程序的執(zhí)行環(huán)境的代碼,例如,構(gòu)成處理器固件、協(xié)議棧、數(shù)據(jù)庫(kù)管理系統(tǒng)、操作系統(tǒng)或者它們中的一個(gè)或多個(gè)的組合的代碼。也稱為程序、軟件、軟件應(yīng)用程序、腳本或代碼的計(jì)算機(jī)程序可以用任意形式的編程語言來編寫,包括編譯語言或解釋語言,或者說明性語言或過程語言,并且可以用任何形式部署該計(jì)算機(jī)程序,包括作為單機(jī)程序或者作為適合于在計(jì)算環(huán)境中使用的模塊、組件、子例程或者其它單元。計(jì)算機(jī)程序不一定對(duì)應(yīng)于文件系統(tǒng)中的文件。可以將程序存儲(chǔ)在保持其它程序或數(shù)據(jù)的文件的一部分中,例如,存儲(chǔ)在標(biāo)記語言文檔中,在專用于所討論的程序的單個(gè)文件中,或者在多個(gè)協(xié)同文件,例如存儲(chǔ)一個(gè)或多個(gè)模塊、子程序或代碼部分的文件中存儲(chǔ)的一個(gè)或多個(gè)腳本??梢詫⒂?jì)算機(jī)程序部署成在一個(gè)計(jì)算機(jī)上或者在位于一個(gè)地點(diǎn)的或者分布在多個(gè)地點(diǎn)并且通過通信網(wǎng)絡(luò)互聯(lián)的多個(gè)計(jì)算機(jī)上執(zhí)行??梢杂蓤?zhí)行一個(gè)或多個(gè)計(jì)算機(jī)程序以通過操縱輸入數(shù)據(jù)并生成輸出來執(zhí)行功能的一個(gè)或多個(gè)可編程處理器來執(zhí)行本說明書中描述的處理和邏輯流。還可以由專用邏輯電路,例如FPGA (現(xiàn)場(chǎng)可編程門陣列)或ASIC (專用集成電路),執(zhí)行該處理和邏輯流,并且還可以將設(shè)備實(shí)施為該專用邏輯電路。適合于執(zhí)行計(jì)算機(jī)程序的處理器作為示例包括通用和專用的微處理器,以及任何一種數(shù)字計(jì)算機(jī)的一個(gè)或多個(gè)處理器。一般來說,處理器從只讀存儲(chǔ)器或隨機(jī)訪問存儲(chǔ)器或此二者接收指令和數(shù)據(jù)。計(jì)算機(jī)的基本元件是用于執(zhí)行指令的處理器和用于存儲(chǔ)指令和數(shù)據(jù)的一個(gè)或多個(gè)存儲(chǔ)器裝置。一般來說,計(jì)算機(jī)還包括或者可操作地耦合到一個(gè)或多個(gè)用于存儲(chǔ)數(shù)據(jù)的大容量存儲(chǔ)裝置,例如磁盤、磁光盤或者光盤,以從其接收數(shù)據(jù)或者向其發(fā)送數(shù)據(jù)或者既從其接收數(shù)據(jù)又向其發(fā)送數(shù)據(jù)。然而,計(jì)算機(jī)不需要具有這種裝置。此外,計(jì)算機(jī)可以嵌入在另一個(gè)裝置中,例如,移動(dòng)電話、個(gè)人數(shù)字助理(PDA)、移動(dòng)音頻或視頻播放器、游戲機(jī)、全球定位系統(tǒng)(GPS)接收器等等。適合于存儲(chǔ)計(jì)算機(jī)程序指令和數(shù)據(jù)的計(jì)算機(jī)可讀介質(zhì)包括所有形式的非易失性存儲(chǔ)器、介質(zhì)和存儲(chǔ)器裝置,作為示例包括半導(dǎo)體存儲(chǔ)器裝置,如EPROM、EEPROM和閃速存儲(chǔ)器裝置;磁盤,如內(nèi)部硬盤或者可移動(dòng)盤;磁光盤;以及CD-ROM盤和DVD-ROM盤。該處理器和存儲(chǔ)器可以輔以專用邏輯電路或者包含在專用邏輯電路中。 為了提供與用戶的交互,可以在具有用于向用戶顯示信息的顯示裝置,如CRT(陰極射線管)或LCD (液晶顯示器)監(jiān)視器,以及用戶可以用來向計(jì)算機(jī)提供輸入的鍵盤和定點(diǎn)裝置,如鼠標(biāo)或跟蹤球,的計(jì)算機(jī)上實(shí)施本說明書中描述的主題的實(shí)施例。其它類型的裝置也可被用于提供與用戶的交互;例如,向用戶提供的反饋可以是任何形式的感知反饋,如視覺反饋、聽覺反饋或者觸覺反饋;并且可以接收任何形式的用戶輸入,包括聲音輸入、語音輸入或者觸覺輸入??梢栽谟?jì)算系統(tǒng)中實(shí)施本說明書中描述的主題的實(shí)施例,該計(jì)算系統(tǒng)包括后端組件,如數(shù)據(jù)服務(wù)器,或者包括中間件組件,如應(yīng)用服務(wù)器,或者包括前端組件,如具有用戶可用來與本說明書中描述的主題的實(shí)施交互的圖形用戶界面或者Web瀏覽器的客戶計(jì)算機(jī),或者包括一個(gè)或多個(gè)這種后端、中間件或前端組件的任何組合。系統(tǒng)的這些組件可以通過數(shù)字?jǐn)?shù)據(jù)通信的任何形式或介質(zhì)相互連接,例如,通信網(wǎng)絡(luò)。通信網(wǎng)絡(luò)的例子包括局域網(wǎng)(“LAN”)和廣域網(wǎng)(“WAN”),例如,因特網(wǎng)。計(jì)算系統(tǒng)可以包括客戶端和服務(wù)器??蛻舳撕头?wù)器通常彼此遠(yuǎn)離并且典型地通過通信網(wǎng)絡(luò)相互作用??蛻舳撕头?wù)器通過運(yùn)行在各自的計(jì)算機(jī)上并且彼此具有客戶端-服務(wù)器關(guān)系的計(jì)算機(jī)程序產(chǎn)生關(guān)聯(lián)。盡管本說明書包含許多特定的實(shí)施細(xì)節(jié),但是不應(yīng)當(dāng)將這些細(xì)節(jié)理解為對(duì)任何實(shí)施范圍或者所要求保護(hù)的范圍的限制,而是應(yīng)當(dāng)將這些細(xì)節(jié)理解為可能是具體實(shí)施的具體實(shí)施例所特有的特征的說明。在本說明書中在不同的實(shí)施例的上下文中描述的某些特征還可以組合在單獨(dú)的實(shí)施例中實(shí)施。反過來,在單獨(dú)的實(shí)施例的上下文中描述的各種特征也可以在多個(gè)實(shí)施例中分開地或者以任何適當(dāng)?shù)淖咏M合實(shí)施。此外,盡管上面可以將特征描述為以某些組合起作用,并且最初也是這樣要求保護(hù)的,但是在一些情況下可以從所要求保護(hù)的組合中去除一個(gè)或多個(gè)特征,并且所要求保護(hù)的組合可以涉及子組合或子組合的變體。類似地,盡管在圖中以特定順序描述操作,但是不應(yīng)當(dāng)理解為需要以該特定順序或者順序地執(zhí)行這些操作,也不應(yīng)當(dāng)理解為需要執(zhí)行示出的所有操作以實(shí)現(xiàn)期望的結(jié)果。在某些情況下,多任務(wù)和并行處理可能是有利的。此外,不應(yīng)當(dāng)將上述實(shí)施例中的各種系統(tǒng)組件的分離理解為在所有實(shí)施例中都需要這種分離,并且應(yīng)當(dāng)理解,所描述的程序組件和系統(tǒng)一般可以一起集成在單個(gè)軟件產(chǎn)品中或者打包成多個(gè)軟件產(chǎn)品。
      已經(jīng)描述了本說明書中描述的主題的特定實(shí)施例。其它實(shí)施例在所附權(quán)利要求的范圍內(nèi)。例如,權(quán)利要求中所述的動(dòng)作可以按不同的順序來執(zhí)行并且仍實(shí)現(xiàn)期望的結(jié)果。作為一個(gè)例子,附圖中所示出 的處理不一定需要按照所示出的特定順序或順序地執(zhí)行以實(shí)現(xiàn)期望的結(jié)果。在某些實(shí)施例中,多任務(wù)和并行處理可能是有利的。
      權(quán)利要求
      1.一種方法,包括 接收由用戶輸入到輸入?yún)^(qū)域中的文本輸入,所述文本輸入包括表達(dá)第一語言的第一形式的第一 η元語法和下列中的至少一個(gè) 表達(dá)所述第一語言的第二形式的第二 η元語法;以及 第二語目的第二 η兀語法; 生成所述文本輸入的一個(gè)或多個(gè)替換表達(dá),其中所述替換表達(dá)是表達(dá)與所述文本輸入不直接匹配的一個(gè)或多個(gè)輸入建議的不確定形式; 將所述替換表達(dá)發(fā)送到建議服務(wù)并且從所述建議服務(wù)接收一個(gè)或多個(gè)輸入建議;以及比較所述一個(gè)或多個(gè)輸入建議與所述文本輸入以將一組所述一個(gè)或多個(gè)輸入建議識(shí)別為所述文本輸入的可選替換,用于顯示在用戶界面中。
      2.根據(jù)權(quán)利要求I所述的方法,其中以不確定形式生成所述文本輸入的一個(gè)或多個(gè)替換表達(dá)包括 將所述文本輸入分段為一個(gè)或多個(gè)相接的字符序列,其中每個(gè)序列表達(dá)單詞或查詢?cè)~; 識(shí)別每段的一個(gè)或多個(gè)表達(dá),其中每個(gè)表達(dá)是替換形式;以及用替換形式的相關(guān)表達(dá)代替所述文本輸入中的一個(gè)或多個(gè)段,以產(chǎn)生所述文本輸入的替換表達(dá)。
      3.根據(jù)權(quán)利要求I所述方法,其中所述文本輸入包括表達(dá)所述第一語言的第二形式的第二 η元語法,并且以不確定形式生成所述文本輸入的一個(gè)或多個(gè)替換表達(dá)包括 從所述文本輸入生成第四η元語法,其中所述第四η元語法是所述文本輸入的替換表達(dá)并且包括第二形式的一個(gè)或多個(gè)文本序列。
      4.根據(jù)權(quán)利要求3所述的方法,其中所述第四η元語法包括所述第一形式的一個(gè)或多個(gè)文本序列。
      5.根據(jù)權(quán)利要求4所述的方法,其中表達(dá)所述第一語言的第二形式包括使用完整語音表達(dá)或部分語音表達(dá)來表達(dá)所述第一語言。
      6.根據(jù)權(quán)利要求5所述的方法,其中所述第一語言是中文,并且表達(dá)中文的第一形式包括使用漢字字符表達(dá)中文。
      7.根據(jù)權(quán)利要求6所述的方法,其中 完整語音表達(dá)是拼音音節(jié);并且 部分語音表達(dá)是拼音縮寫。
      8.根據(jù)權(quán)利要求7所述的方法,其中所述文本輸入包括第二語言的第三η元語法,并且所述第二語目是英文。
      9.根據(jù)權(quán)利要求8所述的方法,其中所述可選替換包括使用漢字字符表達(dá)的一個(gè)或多個(gè)輸入建議。
      10.根據(jù)權(quán)利要求I所述的方法,其中所述文本輸入在用戶在搜索請(qǐng)求中提交所述文本輸入之前并且在接收所述文本輸入的每個(gè)語言符號(hào)后等待預(yù)定時(shí)間量之后接收。
      11.一種系統(tǒng),包括 服務(wù)器,所述服務(wù)器包括計(jì)算機(jī); 其中所述服務(wù)器可操作以進(jìn)行以下動(dòng)作接收由用戶輸入到輸入?yún)^(qū)域中的文本輸入,所述文本輸入包括表達(dá)第一語言的第一形式的第一 η元語法和下列中的至少一個(gè) 表達(dá)所述第一語言的第二形式的第二 η元語法;以及 第二語目的第二 η兀語法; 生成所述文本輸入的一個(gè)或多個(gè)替換表達(dá),其中所述替換表達(dá)是表達(dá)與所述文本輸入不直接匹配的一個(gè)或多個(gè)輸入建議的不確定形式; 將所述替換表達(dá)發(fā)送到建議服務(wù)并且從所述建議服務(wù)接收一個(gè)或多個(gè)輸入建議;以及比較所述一個(gè)或多個(gè)輸入建議與所述文本輸入以將一組所述一個(gè)或多個(gè)輸入建議識(shí)別為所述文本輸入的可選替換,用于顯示在用戶界面中。
      12.根據(jù)權(quán)利要求11所述的系統(tǒng),其中以不確定形式生成所述文本輸入的一個(gè)或多個(gè)替換表達(dá)包括 將所述文本輸入分段為一個(gè)或多個(gè)相接的字符序列,其中每個(gè)序列表達(dá)單詞或查詢?cè)~; 識(shí)別每段的一個(gè)或多個(gè)表達(dá),其中每個(gè)表達(dá)是替換形式;以及用替換形式的相關(guān)表達(dá)代替所述文本輸入中的一個(gè)或多個(gè)段,以產(chǎn)生所述文本輸入的替換表達(dá)。
      13.根據(jù)權(quán)利要求11所述的系統(tǒng),其中所述文本輸入包括表達(dá)所述第一語言的第二形式的第二 η元語法,并且以不確定形式生成所述文本輸入的一個(gè)或多個(gè)替換表達(dá)包括 從所述文本輸入生成第四η元語法,其中所述第四η元語法是所述文本輸入的替換表達(dá)并且包括第二形式的一個(gè)或多個(gè)文本序列。
      14.根據(jù)權(quán)利要求13所述的系統(tǒng),其中所述第四η元語法包括所述第一形式的一個(gè)或多個(gè)文本序列。
      15.根據(jù)權(quán)利要求14所述的系統(tǒng),其中表達(dá)所述第一語言的第二形式包括使用完整語音表達(dá)或部分語音表達(dá)來表達(dá)所述第一語言。
      16.根據(jù)權(quán)利要求15所述的系統(tǒng),其中所述第一語言是中文,并且表達(dá)中文的第一形式包括使用漢字字符表達(dá)中文。
      17.根據(jù)權(quán)利要求16所述的系統(tǒng),其中 完整語音表達(dá)是拼音音節(jié);并且 部分語音表達(dá)是拼音縮寫。
      18.根據(jù)權(quán)利要求17所述的系統(tǒng),其中所述文本輸入包括第二語言的第三η元語法,并且所述第二語言是英文。
      19.根據(jù)權(quán)利要求18所述的系統(tǒng),其中所述可選替換包括使用漢字字符表達(dá)的一個(gè)或多個(gè)輸入建議。
      20.根據(jù)權(quán)利要求11所述的系統(tǒng),其中所述文本輸入在用戶在搜索請(qǐng)求中提交所述文本輸入之前并且在接收所述文本輸入的每個(gè)語言符號(hào)后等待預(yù)定時(shí)間量之后接收。
      21.一種存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上的包括指令的計(jì)算機(jī)程序產(chǎn)品,當(dāng)該指令在服務(wù)器上執(zhí)行時(shí)使所述服務(wù)器執(zhí)行包括以下步驟的操作 接收由用戶輸入到輸入?yún)^(qū)域中的文本輸入,所述文本輸入包括表達(dá)第一語言的第一形式的第一 η元語法和下列中的至少一個(gè)表達(dá)所述第一語言的第二形式的第二 η元語法;以及 第二語目的第二 η兀語法; 生成所述文本輸入的一個(gè)或多個(gè)替換表達(dá),其中所述替換表達(dá)是表達(dá)與所述文本輸入不直接匹配的一個(gè)或多個(gè)輸入建議的不確定形式; 將所述替換表達(dá)發(fā)送到建議服務(wù)并且從所述建議服務(wù)接收一個(gè)或多個(gè)輸入建議;以及比較所述一個(gè)或多個(gè)輸入建議與所述文本輸入以將一組所述一個(gè)或多個(gè)輸入建議識(shí)別為所述文本輸入的可選替換,用于顯示在用戶界面中。
      全文摘要
      用于例如從以不同輸入形式表達(dá)的文本輸入生成輸入建議的方法、系統(tǒng)和設(shè)備,包括計(jì)算機(jī)程序產(chǎn)品。方法包括接收由用戶輸入到輸入?yún)^(qū)域中的文本輸入,該文本輸入包括表達(dá)第一語言的第一形式的第一n元語法和下列中的至少一個(gè)表達(dá)第一語言的第二形式的第二n元語法和第二語言的第三n元語法;以不確定形式生成文本輸入的一個(gè)或多個(gè)替換表達(dá);將替換表達(dá)發(fā)送到建議服務(wù)并且從建議服務(wù)接收一個(gè)或多個(gè)輸入建議;以及比較一個(gè)或多個(gè)輸入建議與文本輸入以將一組一個(gè)或多個(gè)輸入建議識(shí)別為文本輸入的可選替換,用于顯示在用戶界面中。
      文檔編號(hào)G06F17/30GK102640140SQ200980162247
      公開日2012年8月15日 申請(qǐng)日期2009年11月25日 優(yōu)先權(quán)日2009年10月29日
      發(fā)明者馮正柱, 劉珣, 張光強(qiáng), 朱玉凡 申請(qǐng)人:谷歌公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1