国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      用于用戶輸入識(shí)別的基于機(jī)器學(xué)習(xí)的上下文感知校正的制作方法

      文檔序號(hào):40388592發(fā)布日期:2024-12-20 12:11閱讀:5來源:國知局
      用于用戶輸入識(shí)別的基于機(jī)器學(xué)習(xí)的上下文感知校正的制作方法


      背景技術(shù):

      1、包括移動(dòng)電話、個(gè)人計(jì)算機(jī)和平板計(jì)算機(jī)在內(nèi)的許多現(xiàn)代計(jì)算裝置包括裝置上輸入識(shí)別能力。這些裝置可捕獲和識(shí)別文本或語音輸入,并且向一個(gè)或多個(gè)下游應(yīng)用提供所識(shí)別的文本或語音。

      2、移動(dòng)電話應(yīng)用的可用計(jì)算資源的量有限。因此,使得用戶能夠在利用低計(jì)算資源的同時(shí)訪問有效的輸入識(shí)別工具是重大的技術(shù)改進(jìn)。


      技術(shù)實(shí)現(xiàn)思路

      1、當(dāng)輸入包括未被識(shí)別為常見術(shù)語的術(shù)語時(shí),對(duì)用戶輸入的裝置上識(shí)別的準(zhǔn)確度可能具有挑戰(zhàn)性。例如,當(dāng)輸入是語音形式時(shí),一個(gè)或多個(gè)短語的發(fā)音方式可能在很大程度上取決于說話者。在一些情況下,短語的語音變化、或術(shù)語的拼寫錯(cuò)誤、語法偏好等可能是用戶的個(gè)人習(xí)慣(例如,由用戶輸入的姓名、位置、專有名詞)。在其他情況下,某些術(shù)語的使用可能帶來隱私方面的挑戰(zhàn),在生成用戶特定模型時(shí)尤為如此。例如,諸如“hernia”(疝氣)或“hemangioma”(血管瘤)的醫(yī)學(xué)術(shù)語可能難以使用聚合語音識(shí)別模型在語音中識(shí)別,并且此類醫(yī)學(xué)術(shù)語也可被認(rèn)為是高度個(gè)性化的內(nèi)容。

      2、改進(jìn)輸入識(shí)別的一些現(xiàn)有技術(shù)涉及用戶反饋。例如,可提示用戶提供這些術(shù)語作為搜索術(shù)語,并且可基于這種用戶反饋來執(zhí)行個(gè)性化。然而,這種個(gè)性化并不能在語音被識(shí)別時(shí)實(shí)時(shí)地實(shí)現(xiàn)。其他技術(shù)可依賴于用戶生成的字詞或短語的重寫來識(shí)別正確轉(zhuǎn)錄的術(shù)語。然而,對(duì)于不常出現(xiàn)的術(shù)語和/或特定領(lǐng)域?qū)S玫男g(shù)語,這種用戶生成的重寫可能不夠充分。另外,例如,用戶可能用不同的口音、方言等說出術(shù)語,并且可能難以區(qū)分特定術(shù)語的不同語音表達(dá)。因此,需要一種裝置上輸入識(shí)別工具,該裝置上輸入識(shí)別工具包括用于在裝置處執(zhí)行輸入識(shí)別時(shí)進(jìn)行自動(dòng)輸入識(shí)別的上下文感知校正模塊。

      3、在一個(gè)方面,提供了一種計(jì)算機(jī)實(shí)現(xiàn)的方法。該方法包括由在計(jì)算裝置上運(yùn)行的裝置上系統(tǒng)接收用戶在與計(jì)算裝置交互期間的輸入。該方法進(jìn)一步包括從輸入識(shí)別模型接收該輸入的轉(zhuǎn)錄。該方法另外包括由裝置上系統(tǒng)標(biāo)識(shí)用于在輸入的轉(zhuǎn)錄中替換的候選術(shù)語,其中該候選術(shù)語可能已經(jīng)被錯(cuò)誤轉(zhuǎn)錄。該方法還包括由裝置上系統(tǒng)并且基于候選術(shù)語來訪問多個(gè)對(duì)的錯(cuò)誤轉(zhuǎn)錄的術(shù)語和非常見術(shù)語,其中非常見術(shù)語可能被錯(cuò)誤轉(zhuǎn)錄,并且其中錯(cuò)誤轉(zhuǎn)錄的術(shù)語是非常見術(shù)語的不正確版本,這些錯(cuò)誤轉(zhuǎn)錄的術(shù)語已經(jīng)由機(jī)器學(xué)習(xí)模型生成。該方法進(jìn)一步包括由裝置上系統(tǒng)并且基于多個(gè)對(duì)的錯(cuò)誤轉(zhuǎn)錄的術(shù)語和非常見術(shù)語,在輸入的轉(zhuǎn)錄中用非常見術(shù)語替換候選術(shù)語。

      4、在另一方面,提供了一種計(jì)算裝置。該計(jì)算裝置包括一個(gè)或多個(gè)處理器和數(shù)據(jù)存儲(chǔ)裝置。該數(shù)據(jù)存儲(chǔ)裝置上存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令,這些計(jì)算機(jī)可執(zhí)行指令在由一個(gè)或多個(gè)處理器執(zhí)行時(shí)致使計(jì)算裝置執(zhí)行功能。這些功能包括由在計(jì)算裝置上運(yùn)行的裝置上系統(tǒng)接收用戶在與計(jì)算裝置交互期間的輸入。這些功能進(jìn)一步包括從輸入識(shí)別模型接收輸入的轉(zhuǎn)錄。這些功能另外包括由裝置上系統(tǒng)標(biāo)識(shí)用于在輸入的轉(zhuǎn)錄中替換的候選術(shù)語,其中該候選術(shù)語可能已經(jīng)被錯(cuò)誤轉(zhuǎn)錄。這些功能還包括由裝置上系統(tǒng)并且基于候選術(shù)語來訪問多個(gè)對(duì)的錯(cuò)誤轉(zhuǎn)錄的術(shù)語和非常見術(shù)語,其中非常見術(shù)語可能被錯(cuò)誤轉(zhuǎn)錄,并且其中錯(cuò)誤轉(zhuǎn)錄的術(shù)語是非常見術(shù)語的不正確版本,這些錯(cuò)誤轉(zhuǎn)錄的術(shù)語已經(jīng)由機(jī)器學(xué)習(xí)模型生成。這些功能進(jìn)一步包括由裝置上系統(tǒng)并且基于多個(gè)對(duì)的錯(cuò)誤轉(zhuǎn)錄的術(shù)語和非常見術(shù)語,在輸入的轉(zhuǎn)錄中用非常見術(shù)語替換候選術(shù)語。

      5、在另一方面,提供了一種制品。該制品包括一個(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì),該一個(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)上存儲(chǔ)有計(jì)算機(jī)可讀指令,這些計(jì)算機(jī)可讀指令在由計(jì)算裝置的一個(gè)或多個(gè)處理器執(zhí)行時(shí)致使計(jì)算裝置執(zhí)行功能。這些功能包括由在計(jì)算裝置上運(yùn)行的裝置上系統(tǒng)接收用戶在與計(jì)算裝置交互期間的輸入。這些功能進(jìn)一步包括從輸入識(shí)別模型接收輸入的轉(zhuǎn)錄。這些功能另外包括由裝置上系統(tǒng)標(biāo)識(shí)用于在輸入的轉(zhuǎn)錄中替換的候選術(shù)語,其中該候選術(shù)語可能已經(jīng)被錯(cuò)誤轉(zhuǎn)錄。這些功能還包括由裝置上系統(tǒng)并且基于候選術(shù)語來訪問多個(gè)對(duì)的錯(cuò)誤轉(zhuǎn)錄的術(shù)語和非常見術(shù)語,其中非常見術(shù)語可能被錯(cuò)誤轉(zhuǎn)錄,并且其中錯(cuò)誤轉(zhuǎn)錄的術(shù)語是非常見術(shù)語的不正確版本,這些錯(cuò)誤轉(zhuǎn)錄的術(shù)語已經(jīng)由機(jī)器學(xué)習(xí)模型生成。這些功能進(jìn)一步包括由裝置上系統(tǒng)并且基于多個(gè)對(duì)的錯(cuò)誤轉(zhuǎn)錄的術(shù)語和非常見術(shù)語,在輸入的轉(zhuǎn)錄中用非常見術(shù)語替換候選術(shù)語。

      6、在另一方面,提供了一種系統(tǒng)。該系統(tǒng)包括:用于由在計(jì)算裝置上運(yùn)行的裝置上系統(tǒng)接收用戶在與計(jì)算裝置交互期間的輸入的裝置;用于從輸入識(shí)別模型接收輸入的轉(zhuǎn)錄的裝置;用于由裝置上系統(tǒng)標(biāo)識(shí)用于在輸入的轉(zhuǎn)錄中替換的候選術(shù)語的裝置,其中該候選術(shù)語可能已經(jīng)被錯(cuò)誤轉(zhuǎn)錄;用于由裝置上系統(tǒng)并且基于候選術(shù)語來訪問多個(gè)對(duì)的錯(cuò)誤轉(zhuǎn)錄的術(shù)語和非常見術(shù)語的裝置,其中非常見術(shù)語可能被錯(cuò)誤轉(zhuǎn)錄,并且其中錯(cuò)誤轉(zhuǎn)錄的術(shù)語是非常見術(shù)語的不正確版本,這些錯(cuò)誤轉(zhuǎn)錄的術(shù)語已經(jīng)由機(jī)器學(xué)習(xí)模型生成;以及用于由裝置上系統(tǒng)并且基于多個(gè)對(duì)的錯(cuò)誤轉(zhuǎn)錄的術(shù)語和非常見術(shù)語,在輸入的轉(zhuǎn)錄中用非常見術(shù)語替換候選術(shù)語的裝置。

      7、前述
      技術(shù)實(shí)現(xiàn)要素:
      僅是說明性的,并且無意以任何方式進(jìn)行限制。除上文所述的說明性方面、實(shí)施例和特征之外,通過參考示圖以及以下詳細(xì)描述和附圖將明白另外的方面、實(shí)施例和特征。



      技術(shù)特征:

      1.一種計(jì)算機(jī)實(shí)現(xiàn)的方法,包括:

      2.如權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中替換所述候選術(shù)語進(jìn)一步包括:

      3.如權(quán)利要求2所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,進(jìn)一步包括:

      4.如權(quán)利要求2所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中替換所述候選術(shù)語進(jìn)一步包括:

      5.如權(quán)利要求4所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中替換所述候選術(shù)語進(jìn)一步包括:

      6.如權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,進(jìn)一步包括:

      7.如權(quán)利要求6所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,進(jìn)一步包括:

      8.如權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,進(jìn)一步包括:

      9.如權(quán)利要求8所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中訓(xùn)練所述機(jī)器學(xué)習(xí)模型進(jìn)一步包括:

      10.如權(quán)利要求8所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中訓(xùn)練所述機(jī)器學(xué)習(xí)模型進(jìn)一步包括:

      11.如權(quán)利要求10所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述一個(gè)或多個(gè)錯(cuò)誤的所述綜合模擬基于利用噪聲通道模擬器的文本到語音模型。

      12.如權(quán)利要求10所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述一個(gè)或多個(gè)錯(cuò)誤的所述綜合模擬基于字素到音素的轉(zhuǎn)換模型,所述字素到音素的轉(zhuǎn)換模型被配置為基于字詞的文本版本生成所述字詞的發(fā)音。

      13.如權(quán)利要求10所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述一個(gè)或多個(gè)錯(cuò)誤的所述綜合模擬基于統(tǒng)計(jì)音素模型。

      14.如權(quán)利要求8所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,進(jìn)一步包括:

      15.如權(quán)利要求14所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述經(jīng)訓(xùn)練的機(jī)器學(xué)習(xí)模型的所述調(diào)整包括基于與所述應(yīng)用程序相關(guān)聯(lián)的一個(gè)或多個(gè)錯(cuò)誤生成所述多個(gè)對(duì)中的所述錯(cuò)誤轉(zhuǎn)錄的術(shù)語。

      16.如權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,進(jìn)一步包括:

      17.如權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,進(jìn)一步包括綜合模擬所述多個(gè)對(duì)中的所述非常見術(shù)語。

      18.如權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述多個(gè)對(duì)中的所述非常見術(shù)語是由所述裝置上系統(tǒng)在所述用戶與所述計(jì)算裝置的一個(gè)或多個(gè)過去交互中觀察到的。

      19.如權(quán)利要求18所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述用戶與所述計(jì)算裝置的所述一個(gè)或多個(gè)過去交互包括與所述計(jì)算裝置的應(yīng)用程序的交互。

      20.如權(quán)利要求18所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述用戶與所述計(jì)算裝置的所述一個(gè)或多個(gè)過去交互包括話音交互,并且其中所述多個(gè)對(duì)中的所述非常見術(shù)語基于對(duì)基于所述話音交互的轉(zhuǎn)錄的術(shù)語的用戶確認(rèn)。

      21.如權(quán)利要求18所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述用戶與所述計(jì)算裝置的所述一個(gè)或多個(gè)過去交互包括與文本編輯器的交互,并且其中所述多個(gè)對(duì)中的所述非常見術(shù)語基于對(duì)所述文本編輯器中的文本術(shù)語的用戶確認(rèn)。

      22.如權(quán)利要求18所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述計(jì)算裝置包括查看器界面,并且其中所述用戶與所述計(jì)算裝置的所述一個(gè)或多個(gè)過去交互包括由所述查看器界面提供的文本內(nèi)容,并且其中所述多個(gè)對(duì)中的所述非常見術(shù)語出現(xiàn)在所述文本內(nèi)容中。

      23.一種計(jì)算裝置,包括:

      24.一種制品,包括:一個(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì),所述一個(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)上存儲(chǔ)有計(jì)算機(jī)可讀指令,所述計(jì)算機(jī)可讀指令在由計(jì)算裝置的一個(gè)或多個(gè)處理器執(zhí)行時(shí)使所述計(jì)算裝置執(zhí)行功能,所述功能包括:


      技術(shù)總結(jié)
      提供了與輸入識(shí)別相關(guān)的設(shè)備和方法。方法包括接收用戶在與計(jì)算裝置交互期間的輸入。該方法進(jìn)一步包括從輸入識(shí)別模型接收該輸入的轉(zhuǎn)錄。該方法進(jìn)一步包括標(biāo)識(shí)用于在該轉(zhuǎn)錄中替換的候選術(shù)語。該候選術(shù)語可能已經(jīng)被錯(cuò)誤轉(zhuǎn)錄。該方法另外包括基于該候選術(shù)語訪問多個(gè)對(duì)的錯(cuò)誤轉(zhuǎn)錄的術(shù)語和非常見術(shù)語。這些非常見術(shù)語可能被錯(cuò)誤轉(zhuǎn)錄,并且這些錯(cuò)誤轉(zhuǎn)錄的術(shù)語是這些非常見術(shù)語的不正確版本,這些錯(cuò)誤轉(zhuǎn)錄的術(shù)語已經(jīng)由機(jī)器學(xué)習(xí)模型生成。該方法進(jìn)一步包括基于該多個(gè)對(duì)的錯(cuò)誤轉(zhuǎn)錄的術(shù)語和非常見術(shù)語,在該轉(zhuǎn)錄中用非常見術(shù)語替換該候選術(shù)語。

      技術(shù)研發(fā)人員:V·阿加瓦爾,S·S·索迪,A·杰什,A·古普塔,A·拉格維爾,P·古普塔,A·R·巴帕特
      受保護(hù)的技術(shù)使用者:谷歌有限責(zé)任公司
      技術(shù)研發(fā)日:
      技術(shù)公布日:2024/12/19
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1