專利名稱:將數(shù)據(jù)輸入計算系統(tǒng)的系統(tǒng)和方法
技術領域:
本公開一般涉及數(shù)據(jù)輸入設備的領域。更具體地,本公開涉及有助于 多種語言的數(shù)據(jù)輸入的方法,并涉及利用該多種語言的數(shù)據(jù)輸入的方法的 系統(tǒng)。
背景技術:
使用具有按鍵的數(shù)據(jù)輸入設備,例如字母數(shù)字鍵盤、觸摸板或觸摸屏,
在本文被統(tǒng)稱為"鍵盤",將信息輸入電子系統(tǒng)比如個人電腦(PC)、移動電 話、掌上電腦、飛機計算機等等,自從發(fā)明PC以來其沒有發(fā)生過重大的改變。
由于鍵盤被設計用來輸入比如文本和其他類型的字符(在下文中統(tǒng)稱為 "符號"或"按鍵標簽")的數(shù)據(jù),以及還用來控制計算機的操作,幾乎每 個計算機都配備鍵盤作為用戶與計算機之間交互的主要形式。物理上,計 算機鍵盤是矩形的或近似矩形的多個按鈕(或稱為"按鍵")的排列。鍵盤通
常在每個按鍵上具有一個或多個雕刻的、印刷的或用別的方法標記的符號; 在多數(shù)情形下,按鍵的每次按下對應于單個符號被輸入到計算機中,并且 在許多情形下,顯示在計算機的顯示屏上。但是, 一些符號的生成要求同 時或依次按下并按住數(shù)個按鍵。其他的按鍵當被按下的時可以產生動作, 并且通過同時按下多于一個的動作按鍵,其他的動作將是可用的。
存在大量不同的鍵盤布局(按鍵的安排和按鍵上的符號的分配)。不同的 鍵盤布局的需求的出現(xiàn),是由于不同的人們可能需要使用不同的符號集合; 通常,這是因為他們使用不同的語言來書寫/讀。取決于應用的情況,鍵盤 上的按鍵的數(shù)目一般變化范圍從標準的101個按鍵至104個windows按鍵的 鍵盤一直到130個具有一些可編程按鍵的按鍵。還有少于90個按鍵的小型的 變型;它們通常出現(xiàn)在膝上型電腦或具有空間限制的臺式計算機中。在大 多數(shù)英語語言計算機和打字機鍵盤上的大多數(shù)普通的當今鍵盤布局的按鍵布局被稱作QWERTY設計,其來自出現(xiàn)在鍵盤頂行字母的前六個字母。
大多數(shù)信息或數(shù)據(jù)通常使用具有固定按鍵功能的鍵盤被打入或鍵入。 特別是對于PC,雙語鍵盤通常具有與英語字母表一起標記在鍵盤的按鍵上 的第二語言字母表符號,或允許改變語言的可替代的布局,其一般采用通 過軟件指令來實現(xiàn)在每個按鍵的雙語功能之間的切換。在標準的鍵盤中, 用戶通常可以看到在每個可按壓的按鍵上多達三個的符號,定義由不同的 軟件和系統(tǒng)操作方法提供的不同的語言和選項。計算機鼠標也可以獨立地 用于選擇選單類選項和圖形命令輸入。
標準的鍵盤受到許多缺陷和限制。例如,標準的鍵盤通常包含功能鍵, 例如其具有F1至F12的符號,其隱藏了用不同的指令定義的功能。經常, 用戶不得不學習并記住這些隱藏的功能,或從査找表格、"幫助"目錄或者 從其他的來源得到他們的含義。但是,這種鍵盤按鍵的數(shù)量是受限的,因 此功能鍵的數(shù)量也是受限的。通常,非專業(yè)打字員不得不通過在放在桌子 上的鍵盤與通常放在桌子前面且更高處的PC監(jiān)視屏之間頻繁轉移他的視 線來跟隨打字活動。特別是對于雙語鍵盤,視線頻繁轉移并且"Alt + Shift" 和"大寫鎖定"功能的頻繁的無反饋使用將導致打字時出現(xiàn)錯誤。隨著因 特網廣泛使用的到來,要求PC用戶使用傳統(tǒng)的鍵盤,用于越來越復雜的輸 入命令,或記住每個按鍵更多"隱藏的"功能。
與本公開相同的發(fā)明人的美國專利號6,611,253描述了虛擬輸入環(huán)境和 創(chuàng)建具有可改變的按鍵顯示的輸入單元的方法和系統(tǒng)。然而,美國6,611,253 沒有教導使用手勢控制虛擬鍵盤的布局,它也沒有教導虛擬手的出現(xiàn)可以取 決于所使用的虛擬鍵盤的布局。此外,美國專利序列號6,611,253沒有評估 先前的命令來預測當前或未來的命令或用戶的請求。
對于一些語言,如上所述,例如俄語和希伯來語,硬件鍵盤一般具有
與英語字母表一起蝕刻在鍵盤按鍵上的第二語言字母表符號。在一些所使 用語言具有大的字母表和/或許多字符(例如超過50個字符)的國家,鍵盤一
般只包括英語字母,因為在物理鍵盤上無法顯示其他語言的所有字母。該 情形給這類語言的用戶執(zhí)行這類語言的數(shù)據(jù)錄入任務造成巨大的問題。
該問題嚴重的國家的一個實例是印度,其是個具有22種憲法性語言和 IO種不同的文字的使用多語言國家。下面給出18種憲法性印度語言并在括
7號中給出他們的文字印地語(天誠文)、孔卡尼語(天誠文)、馬拉地語(天誠 文)、尼泊爾語(天誠文)、梵語(天誠文)、信德語(天誠文/烏爾都語)、克什米 爾語(天誠文/烏爾都語)、阿薩姆語(阿薩姆語)、曼尼普爾語(曼尼普爾語)、 孟加拉語(孟加拉語)、奧利亞語(奧利亞語)、古吉拉特語(古吉拉特語)、旁 遮普語(果魯穆奇語)、泰盧固語(泰盧固語)、卡納達語(卡納達語)、泰米爾 語(泰米爾語)、馬拉雅拉姆語(馬拉雅拉姆語)和烏爾都語(烏爾都語)。印度
文字通常具有12-15個元音、35-40個輔音和一些注音標記。除此之外,對于 每個元音,存在對應的修飾符,以及對于每個輔音,存在對應的純輔音形 式(叫做半形字母)。這使得被需要來輸入這類語言的全部符號集大于正常鍵 盤能夠容納的符號。在印度,例如,為了試圖為鍵盤的不足提供解決方案, 不同的印度語言的文字處理軟件與硬拷貝的"映射圖"來一起分發(fā),其指 示隱藏在每個英語字母后面的印度語字母。在不同的印度語的文字處理軟 件分發(fā)者之中大約50個硬拷貝映射圖可用,但是硬件制造商一般并不提供 具有印度語言布局的鍵盤。超過95%的印度人口通常被剝奪了基于英語的信 息技術的益處。
發(fā)明內容
下面的實施例及其情況與系統(tǒng)、工具和方法一同描述并說明,其表示 示例性和說明性的含義,而不是限制范圍。在各種實施例中, 一個或多個 上面所述的問題得到了緩解或消除,而其他實施例則產生了其他的益處或 改進。
根據(jù)本公開的一些實施例,給出了將數(shù)據(jù)輸入到計算機系統(tǒng)的系統(tǒng)和 方法。本文公開的系統(tǒng)可以包括用于基于與獲得的圖像相關聯(lián)的信號來設 置和顯示輸入按鍵的圖或鍵盤的全部(或部分)布局的控制器;以及在功能上 耦合至該控制器并用于為該控制器提供涉及或關于所獲取圖像的信號的圖 像獲取設備。系統(tǒng)可以捕捉并識別、辨認或解釋一個或多個姿勢,例如, 通過用戶手部、手指或身體的其他部位生成或完成的姿勢,以及依照這些 姿勢來執(zhí)行命令。相應地,"識別、辨認或解釋"表示將給定的姿勢或姿勢 的組合(由控制器)關聯(lián)到特定的命令。系統(tǒng)可以包括監(jiān)視器或顯示屏,用來 優(yōu)選地實時顯示虛擬鍵盤以及模擬用戶物理的手的位置和/或移動的虛擬手。
在一些實施例中,按鍵或按鍵標簽的含義在虛擬鍵盤上可以根據(jù)用戶 的命令被動態(tài)地更新(改變)??商鎿Q地,全部或僅僅部分虛擬鍵盤的布局可 以根據(jù)用戶的命令被動態(tài)地更新(改變)。例如,虛擬鍵盤可以根據(jù)用戶手部 的位置和/或移動動態(tài)地更新(改變)。
在一些實施例中,系統(tǒng)可以包括評估和可預測性軟件應用(控制器可以 用于)來基于用戶先前的命令,評估、預測或另外地確定所預見的隨后在虛 擬鍵盤上所要求的按鍵和/或所預見的隨后在虛擬鍵盤上所要求的布局。在 一些實施例中,手的移動或其他的姿勢可以實現(xiàn)鼠標類型的導航
(navigation)。
作為本公開的一部分,提供了一種方法來將數(shù)據(jù)輸入到計算機系統(tǒng)。 在一些實施例中,此方法可以包括獲取部分的用戶身體和物理鍵盤的圖像, 以及基于所獲得的圖像設置并顯示按鍵的映射。該方法還可以包括處理和 解釋涉及或關于所獲得的圖像的信號,使得能夠根據(jù)該信號輸入所選擇的 命令和/或符號。此方法還包括使用鍵盤識別功能來識別置于圖像獲取設備 的視場(FOV)內的物理鍵盤的按鍵;處理至少一個用戶手部的圖像來確定相 對于物理鍵盤的手的位置和/或手的移動;以及在相應的顯示屏上,例如在 計算機顯示器或在計算機顯示對象上,顯示在虛擬鍵盤上的至少一個手的 位置移動。
在一些實施例中,此方法可以包括在虛擬鍵盤上動態(tài)地更新按鍵標簽 來作為對于所處理圖像的響應,和/或動態(tài)地更新虛擬鍵盤全部或部分的鍵 盤布局來作為對于所處理圖像的響應。
在一些實施例中,此方法可以包括手的移動,其期望來使用虛擬鼠標 來實現(xiàn)鼠標類型的導航,和/或其他的身體移動,其可以被解釋為用戶的輸 入命令和/或數(shù)據(jù)。術語"其他的身體移動"可以表示,例如,手的移動、 頭的移動、眼睛的移動、嘴巴的移動或可以指示用戶命令和/或數(shù)據(jù)錄入的 其他類型的移動。
除了上述示例性的情況和實施例,進一步的情況和實施例將通過參照 附圖以及研究下面的詳細說明而變得明顯。
簡略的示例性實施例在參考的附圖中說明。本文所公開的實施例和附 圖是要被考慮為說明性而非限制性的。然而,本發(fā)明的組織和操作方法, 以及與其對象、特征和益處一起可以通過閱讀附圖時參考下面的詳細說明 而獲得最佳的理解,其中
圖1A和1B是根據(jù)本公開的一些實施例的虛擬鍵盤的圖形示例;
圖1C是根據(jù)一些實施例的具有有限數(shù)目的印地語字符的鍵盤的圖形 實例,其可以被利用作為物理的和/或虛擬的鍵盤;
圖1D示出根據(jù)一些實施例的可以用于指示輸入的命令和/或數(shù)據(jù)的各 種基于手指的信號或姿勢的一組示例性圖形視圖1E和1F示出根據(jù)本公開的一些實施例,基于與所獲取的圖像相關 聯(lián)的信號對輸入按鍵進行映射的實例,以及基于與所獲取的圖像相關的信 號的輸入按鍵的圖的實例;
圖2A示出根據(jù)本公開的一些實施例操作數(shù)據(jù)錄入系統(tǒng)的示例性流程
圖2B示意性地說明根據(jù)本公開的一些實施例的數(shù)據(jù)錄入系統(tǒng)的一般 布局和功能;以及
圖3示意性地說明根據(jù)本公開的其他實施例的數(shù)據(jù)錄入系統(tǒng)的一般布 局和功能。
將會理解,為了說明的簡明和清楚,圖中示出的元件并不一定依據(jù)比 例而繪出。例如,為了清楚, 一些元件的尺寸相對于其他元件可能被放大 了。此外,當被認為是適當時,參考數(shù)字在附圖之間可以被重復,來在整 個視圖系列中表示相應的或類似的元件。
具體實施例方式
雖然上面討論了多個示例性的情況和實施例,本領域技術人員將認識 到特定的修改、排列、增加及其子組合。因此下面所附的權利要求以及今 后提出的權利要求是要被解釋為將所有這種修改、排列、增加及其子組合 包括在它們真正的實質和范圍內。
除非另有明文敘述,從下述討論中明顯可見,整個說明書敘述中使用
10的例如"處理"、"計算(computing)"、"計算(calculating)"、"確定"等表示 計算機、計算機系統(tǒng)或者類似的電子計算設備的動作和/或過程,其將在計 算系統(tǒng)的寄存器和/或存儲器中的表示為物理量(例如電的量)的數(shù)據(jù)進行操 作和/或轉換成其他的在計算系統(tǒng)的存儲器、寄存器或其他這樣的信息存儲 裝置、傳輸或顯示設備中類似地表示為物理量的數(shù)據(jù)。
本文給出的平臺、過程和顯示器并不固有地與任何特定的計算機或其 他裝置相關。各種通用計算平臺和網絡設備可以與根據(jù)本文教導的程序一 同使用,或者構建更為專用的裝置來執(zhí)行需要的方法可能被證明是方便的。 各種這些系統(tǒng)想要的結構將從下面描述中可見。此外,實施例并不涉及任 何特定的編程語言來描述。將會理解各種程序設計語言可以用于實現(xiàn)本文 所描述本公開的教導。
在下面的詳細說明中,給出了許多特定的細節(jié),以提供對于各個實施 例的全面理解。然而,本領域技術人員將會理解所描述的實施例可以不需 要這些特定細節(jié)來實施。
本文所使用的術語"姿勢"可以至少包括由人的身體部分操作鍵盤而 引起的移動和/或信號和/或指示和/或手勢和/或指令和/或請求等等。"命令" 在本文意思是使用姿勢、姿勢的系列或姿勢的組合,來指示、請求或命令 計算機改變所選擇的按鍵的含義或解釋(分配或再分配符號),根據(jù)該姿勢、 姿勢的系列或姿勢的組合來改變整個鍵盤布局的含義或解釋。此處,按鍵 的含義或解釋(計算機解釋按鍵被按下時的方式),在給定的時刻,可以是物 理上標記在按鍵上的符號(開頭或默認的符號),或是由計算機根據(jù)特定的命 令分配(或再分配)給按鍵的不同符號。
本文所述實施例可以有助于人機交互問題中的改善,該人機交互問題 特別地但不僅僅地與具有許多符號的語言相關。這些實施例提高了數(shù)據(jù)輸 入的速度,提供了語言數(shù)據(jù)錄入的任務的完整的解決方案,充分減少了打 字錯誤的數(shù)量,并且通過提供對用戶友好的數(shù)據(jù)輸入環(huán)境,改進了語言的 文字處理軟件的可用性。
參照圖1A,根據(jù)本公開的一些實施例的示例性數(shù)據(jù)輸入系統(tǒng)部分地被 描述。數(shù)據(jù)輸入系統(tǒng)100可以包括至少一個圖像獲取或捕捉設備,比如圖 像獲取設備110,其可以是,例如數(shù)碼相機、攝相機、個人計算機攝像頭、網絡攝像頭等等,其可以被設置在例如計算機顯示監(jiān)視器120上。當然, 圖像獲取設備110可以位于不同的位置,只要用戶手部或用于該目的的用 戶身體的其他部分的位置、地點、移動和姿勢是清晰可見的;即,他們出 現(xiàn)在圖像獲取設備110的視場內。數(shù)據(jù)輸入系統(tǒng)100可以進一步包括與圖 像獲取設備100相關聯(lián)或功能上耦合到圖像獲取設備110的控制器(未示 出),并且該控制器用于基于由圖像獲取設備110生成并輸出到該控制器的 信號來設置按鍵的映射或整個鍵盤布局的映射,該信號表示圖像獲取設備 110視場內的關于并包括姿勢或移動的圖像。"設置映射"在本文中一般表 示取決于姿勢將特定的符號分配給特定的按鍵(或者將一組特定的符號分配 給相應的特定按鍵)。更具體地,按鍵的映射可以包括根據(jù)用戶(比如僅示出 其(真實的)手放在物理鍵盤130上131和132處的用戶)所作出的或與其相 關聯(lián)的移動或姿勢來改變分配給該按鍵的符號的含義??刂破骺梢允菢嫵?計算機的組成部分,或者被嵌入、被并入或附屬于計算機(PC、膝上型電腦 等等),該計算機從鍵盤(比如鍵盤130)獲得輸入信號,并且操作顯示屏(比 如顯示屏120)。
當由圖像獲取設備110獲取的與手131和132的圖像相關的信號被不 斷地或間歇地轉發(fā)給數(shù)據(jù)輸入系統(tǒng)100以用于處理和解釋時,用戶(未示出) 可以參照或相對于物理鍵盤130將他的手131和/或132從一個位置移動到 另一個位置。數(shù)據(jù)輸入系統(tǒng)100可以處理和解釋與所獲取的圖像相關的信 號,來識別由用戶通過他的手或身體的其他部分作出的姿勢和/或移動,以 及根據(jù)姿勢和/或移動來執(zhí)行命令,或者執(zhí)行與姿勢和/或移動有關的命令。 物理鍵盤130可以是標準鍵盤(其上具有所標記的符號)、空白鍵盤(按鍵上 沒有標記的鍵盤)、紙質鍵盤(例如具有任何數(shù)目按鍵的鍵盤的圖)、觸摸板、 小鍵盤(keypad)、假想鍵盤(平坦無遮蓋的表面,比如桌子或板)等等。數(shù)據(jù) 輸入系統(tǒng)100也可以利用適用于所處理的語言(例如英語、印地語和德語) 的文字應用程序。
在一些實施例中,數(shù)據(jù)輸入系統(tǒng)100的控制器可以利用數(shù)字信號處理 ("DSP")技術來處理由圖像獲取設備110所捕獲的圖像,以及利用模擬技 術將相應的虛擬鍵盤(比如虛擬鍵盤140)顯示在計算機屏幕(比如計算機屏 幕120)上。在這些實施例的一些方面中,虛擬鍵盤140上的按鍵的數(shù)目、大小和間距可以充分模仿物理鍵盤130的相應特征以便于用戶的定位。根 據(jù)其他的方面,虛擬鍵盤140上的按鍵的數(shù)目、大小或間距可以與物理鍵 盤130的相應特征有所不同。數(shù)據(jù)輸入系統(tǒng)100的控制器可以使分配給按 鍵的符號或含義和/或分配給虛擬鍵盤140的整個布局的符號或含義,依照 對應的用戶的姿勢或移動來進行改變,所述姿勢或移動可以由數(shù)據(jù)輸入系 統(tǒng)100的控制器根據(jù)所獲取或捕獲的圖像來識別、辨認或解釋。
在本公開的一些實施例中,數(shù)據(jù)輸入系統(tǒng)100的控制器可以利用模擬 技術來創(chuàng)建并處理虛擬手,并使虛擬手根據(jù)用戶的(真實的、物理的)手的位 置、地點和移動在顯示屏上出現(xiàn)并移動。例如,圖1A中所示的虛擬手121 和122分別表現(xiàn)用戶的手131和132。虛擬鍵盤140和/或虛擬手121和/或 122可以被相同或不同地縮放以助于容易的數(shù)據(jù)輸入。
為了通過利用數(shù)據(jù)輸入系統(tǒng)100來輸入所請求語言的數(shù)據(jù),用戶可以 在圖像獲取設備110的視場內放置他的手,如131和132所示出,并且作 出與所請求的語言相關聯(lián)的姿勢、姿勢的系列或組合。姿勢、姿勢系列或 姿勢組合然后可以被數(shù)據(jù)輸入系統(tǒng)100的控制器辨認或解釋為與所請求的 語言相關聯(lián)。響應于對姿勢、姿勢系列或組合的辨認或解釋,數(shù)據(jù)輸入系 統(tǒng)100的控制器可以將組成所請求的語言的符號分配給虛擬鍵盤140上選 定的按鍵,并且采用當前被請求所分配到的符號來顯示虛擬鍵盤的布局。 可以說,數(shù)據(jù)輸入系統(tǒng)100的控制器已經設置了鍵盤布局的映射,其對應 與所請求的語言。 一旦所請求的語言響應于用戶的命令,己經被數(shù)據(jù)輸入 系統(tǒng)100的控制器設置,用戶可以通過觀察虛擬鍵盤140上的按鍵,并在 物理鍵盤130上移動他的手(131或132)或其某些手指,來將數(shù)據(jù)輸入到數(shù) 據(jù)輸入系統(tǒng)100中。
用戶可以移動他的手或其某些手指,直到相應的虛擬手(121或122)或 其相對應的虛擬手指到達虛擬鍵140上將被按下的下一個按鍵的附近并且 虛擬手121或122的手指與該按鍵疊加。然后用戶可以按下在物理鍵盤上 130位于與同虛擬鍵盤140上所請求的按鍵疊加的虛擬手指相對應或者相關 聯(lián)的手指下方的按鍵。上述步驟可以依照輸入另外的符號所要求的被重復 那樣多次。用戶要是希望改變?yōu)榛蛟O置成不同的語言,用戶可以擺出對應 于不同的語言的姿勢、姿勢系列或組合。每次數(shù)據(jù)輸入系統(tǒng)100的控制器
13被請求來設置不同的按鍵的映射以設置不同的語言,控制器可以啟用對應 的文字應用程序/處理程序。例如,如果數(shù)據(jù)輸入系統(tǒng)100的控制器被請求 從法語改變?yōu)橛⒄Z,那么控制器可以禁用法語文字應用程序/處理程序,并
啟用英語應用程序/處理程序。物理鍵盤130在功能上耦合島數(shù)據(jù)輸入系統(tǒng) 100的控制器,或耦合到數(shù)據(jù)輸入系統(tǒng)100的控制器所駐留在其中的計算機, 用于將表示與物理鍵盤130中的按鍵相關聯(lián)的默認符號或功能的信號轉發(fā) 給控制器。盡管如此,數(shù)據(jù)輸入系統(tǒng)100的控制器被用于或被設定來根據(jù) 當前的映射設置來解釋被從物理鍵盤130轉發(fā)至其的信號。
數(shù)據(jù)輸入系統(tǒng)100具有數(shù)個較現(xiàn)有技術解決方案的益處。例如,將數(shù) 據(jù)輸入該系統(tǒng)的用戶不必在物理鍵盤(例如鍵盤130)和顯示打字結果的屏幕 (例如顯示屏120)之間來回地轉移視線。相反,用戶可以只盯著虛擬鍵盤(例 如虛擬鍵盤140),并觀看相對于他的(真實的)手(例如手131和132)的位置 和移動而定位和移動的虛擬手(例如虛擬手121和122)。
一般來說,符號和功能可以取決于用戶請求(通過執(zhí)行相應的移動或姿 勢)的語言、模式或功能而分配給按鍵,使得給定的按鍵在它已經被分配給 新的語言、模式或功能之后被用戶按下時,將被數(shù)據(jù)輸入系統(tǒng)100的控制 器以不同的方式來解釋。響應于用戶發(fā)出或擺出的命令,數(shù)據(jù)輸入系統(tǒng)ioo 的控制器可以改變虛擬布局(比如虛擬布局140)的外觀。例如,控制器可以 改變鍵盤的結構或按鍵的排列,例如,取決于需要的的應用程序,通過改 變虛擬鍵盤上的按鍵的數(shù)目、大小、間距和/或按鍵的放置。根據(jù)一些實施 例,虛擬鍵盤的布局可以根據(jù)用戶手部的實時模擬和用戶手部在物理鍵盤 上的放置和移動來改變,無論鍵盤是真實的(其具有實際的標記在相應的按 鍵上的標簽)、空白的或紙質的鍵盤。數(shù)據(jù)輸入系統(tǒng)100的另一個優(yōu)勢是, 同一個的物理鍵盤(例如物理鍵盤130)可以用來輸入與可用的文字應用程序 /處理程序的數(shù)目一樣多組的符號(每一組屬于不同的語言)。
在一些實施例中,通過一起捕獲用戶手部的位置(如以上所述)與鍵盤按 鍵塊(可按下的按鈕)的圖像,數(shù)據(jù)輸入系統(tǒng)100的控制器可以在任何給定的 時刻并且實時地,確定用戶手部和手指的位置和/或移動,然后通過在虛擬 鍵盤140的按鍵上的適合的位置顯示虛擬手指來模擬它們。這允許用戶在 監(jiān)視器120上查看他的/她的手的放置和移動,因此,在用戶按下按鍵且不
14必向下看物理鍵盤(例如鍵盤130)之前,無論選定了何種語言,在任何給定
的時刻,給予了用戶對于他的/她的手指在物理鍵盤130的任何按鍵上面的 放置位置的確信。當真實的手指(例如手131的手指)在物理鍵盤上移動并在 物理鍵盤(比如物理鍵盤130)上按下按鍵或接觸其上的區(qū)域時,控制器可以 使虛擬手(例如手121和122)來模擬有關虛擬鍵盤的手指的移動和形狀。
在其他的實施例中,數(shù)據(jù)輸入系統(tǒng)100可以使得能夠進行處理單手或 雙手以及其他的身體移動的圖像。例如,在一些實施例中,數(shù)據(jù)輸入系統(tǒng) IOO可以捕獲和處理頭部移動、眼部移動、嘴部移動或其它的移動來指示用 戶命令、信號和/或數(shù)據(jù)錄入。如果需要,另外的圖像獲取設備比如圖像獲 取設備110,可以在用戶身體的不同部分無法置于單個圖像獲取設備的視場 內的情形下被使用。這樣的情形下,每個圖像獲取設備可以在空間上放置, 來獲取與不同的身體部分相關的圖像。
參照圖1B,根據(jù)本公開的一些實施例示出了示例性虛擬鍵盤和虛擬手。 所示顯示在計算機屏幕155上的虛擬鍵盤150,可以被數(shù)據(jù)輸入系統(tǒng)的控制 器調整、調適或修改來成為所要求或所需要的一樣大小。控制器也可以改 變相對于屏幕155的虛擬鍵盤150的位置。所示虛擬鍵盤150顯示了當前 的印度語言鍵盤設置或布局,其可能由所采用的語言/文字組(例如50種選 項中的)所定義,或者由為功能鍵或所配置的鍵盤而定義的宏所定義。當物 理手指在物理鍵盤(比如圖1A的物理鍵盤130)上從一個按鍵被移動到另一 個按鍵以及后面的按鍵被按下時,可以發(fā)生對于虛擬鍵盤150的對應的圖 形變化,其導致手(如在圖1B中所示的160)在虛擬鍵盤150上從一個位置 到另一個位置的移動,該移動模擬或者反映用戶手部移動到適合的(所期望 的)物理按鍵。在一些實施例中,數(shù)據(jù)輸入系統(tǒng)的控制器可以根據(jù)用戶發(fā)出 的直接的命令或根據(jù)這一命令的結果,改變用戶手部160的外觀。"根據(jù) 用戶發(fā)出的直接的命令"的意思是(就后面的實施例而言)按下物理鍵盤上其 作用為改變虛擬手的外觀的按鍵,而"根據(jù)這一命令的結果"的意思是(就 后來的實施例而言)向控制器發(fā)出命令來改變語言(如以上所述,通過擺出姿 勢或移動)并且同時根據(jù)正在使用的語言(由控制器)改變虛擬手的外觀。改 變虛擬手的外觀可以包括,例如,使虛擬手變得透明或部分變得透明,從 而允許用戶充分地查看虛擬鍵盤150的全部區(qū)域。在圖1B中所示的透明的虛擬手160疊加在虛擬鍵盤150上。根據(jù)當前分配給虛擬鍵盤布局150的 印地語,所示文本151由印地語的符號組成。
參照圖1C,根據(jù)本公開的一些實施例,疊加在不同的虛擬鍵盤上的虛 擬手的三個實例被示出。數(shù)據(jù)輸入系統(tǒng),比如圖1A的數(shù)據(jù)輸入系統(tǒng)100, 可以允許用戶改變虛擬鍵盤(比如虛擬鍵盤150)的標簽和/或布局。如果用戶 想要使用印度語言(具有在圖1C所表示的情形下的天誠文文字的印地語言) 寫文檔,通過使用"KA" + "HALANT"組合(Windows中的"K" + "D" 按鍵),他/她可以從第一布局切換至第二布局(例如從鍵盤布局170切換至 鍵盤布局170),虛擬鍵盤上的某些或所有按鍵的外觀,可以相應地改變有 關的按鍵和/或語言和/或模式和/或將使用的文字的布局或映射(例如,在圖 1C所表示情形下的"HALANT形式的KA")。
在其他的實施例中,用戶可以改變鍵盤的模式或功能,例如,通過采 用他/她的手/手指的適合的姿勢來指示,她/他可以在虛擬鍵盤上的按鍵的語 言、字符、字母、圖形等等之間進行改變。另外,虛擬手的外觀和/或透明 程度可以根據(jù)所使用的實際鍵盤來改變。例如,所示的虛擬手172比虛擬 手173的透明程度低,因為他們各自與不同的鍵盤布局有關(分別涉及鍵盤 170和171)。所示虛擬鍵盤175只具有6個選定的符號(共同地指定為174)。 虛擬鍵盤175可以被示為半透明的。
參照圖1D,其描述了信號或姿勢的實例,用戶可能向圖像獲取設備(比 如圖像獲取設備110)擺出該姿勢,命令數(shù)據(jù)輸入系統(tǒng)(比如數(shù)據(jù)輸入系統(tǒng)100) 改變語言、模式,錄入數(shù)據(jù),改變功能等等。例如,用戶可以使用對象和/ 或他/她的左手來創(chuàng)建所選定的可由圖像獲取設備捕獲的信號/姿勢,使得虛 擬鍵盤的按鍵按需要地被映射。例如,圖1D描繪了 IO個示例性手勢,例 如,每個手勢分配到唯一的手勢號碼。每個手勢號碼可以與由數(shù)據(jù)輸入系 統(tǒng)的控制器來執(zhí)行或采取的特定的命令或動作相關聯(lián)。例如,在182處所 示的與手勢描述181相關聯(lián)的5號手勢可以指示來命令或發(fā)信號給數(shù)據(jù)輸 入系統(tǒng)的控制器,使其例如從一種語言到另一種語言改變虛擬鍵盤的布局 或映射(例如圖1B的虛擬鍵盤150的布局)。此后,用戶可以使用改變后的 虛擬布局在物理鍵盤上移動他的手/手指來錄入(打入)其他語言的字符或符 號,來創(chuàng)建相應的與改變后的虛擬鍵盤相關而移動的虛擬手。因而,通過數(shù)據(jù)輸入系統(tǒng)(比如數(shù)據(jù)輸入系統(tǒng)ioo)對信號、命令、指令等等的識別,可
以首先通過識別或辨認手勢或信號(由圖像獲取設備進行,比如圖1A的圖 像獲取設備110),然后通過將手勢解釋成對應的手勢號碼以及如上文所述 使用手勢來實現(xiàn)。
圖1A的數(shù)據(jù)輸入系統(tǒng)100可以被用戶指示(通過將對應的姿勢或移動 顯示給圖像獲取設備110)來手動地、自動地或在選定的命令之后,例如在 物理鍵盤上按下"重置"按鈕之后,接收信號。由身體的部分和/或對象等 等作出的任何號碼和類型的手勢、信號和/或移動和/或其他適合的信號和/ 或姿勢和/或移動,可以用作對于數(shù)據(jù)輸入系統(tǒng)的控制器的命令。例如,左 手和/或右手的位置和/或移動可以被捕獲,如同用戶可以用來指示命令的面 部移動、頭部移動、手指移動、肩部移動或其它適合的移動一樣可以被捕 獲。這樣,數(shù)據(jù)輸入系統(tǒng)可以允許用戶以最小數(shù)目的擊鍵或其他動作,改 變虛擬鍵盤(比如圖1B的虛擬鍵盤150)中按鍵的布局、模式、功能等等。
在一個實例中,用戶可以作出與所選擇的布局相關聯(lián)的姿勢,以及然 后后續(xù)地敲入一個或多個按鍵來錄入所需的數(shù)據(jù)。這樣的其通常會要求數(shù) 個按鍵錄入來改變布局、按鍵等等并且在所需的布局處到達的數(shù)據(jù)錄入, 可以通過采用姿勢的組合并敲入選定的按鍵來完成。例如,當用戶期望錄 入印地語字符時,其存在比物理鍵盤上的按鍵更多的字符,用戶可以使用 姿勢或信號來錄入命令,例如,在虛擬鍵盤上改變鍵盤按鍵的標簽和/或布 局。在虛擬鍵盤上的這個改變可以使所需的字符被顯示在虛擬鍵盤上,使 得最小數(shù)目的擊鍵被要求來錄入選定的按鍵。因此,可以只要求一次擊鍵 來錄入從一組具有許多截然不同的字符的語言的字符集中任何選定的字 符。其他的動作和/或動作的組合也可以被實現(xiàn)。
根據(jù)一些實施例,數(shù)據(jù)輸入系統(tǒng)可以包括評估和可預測性應用程序, 用于幫助數(shù)據(jù)輸入系統(tǒng)的控制器確定可能隨后為用戶所要求或所需要的預 見的按鍵和/或鍵盤布局(映射)??深A測性可以基于對用戶的先前的命令的 評估,例如,先前通過使用手勢、移動、鼠標移動、按鍵錄入等等發(fā)出的 命令。例如,如果當前具有許多字符的語言在被使用,該當前被使用的語 言的文字應用程序可以將兩個或多個特定的按鍵的組合解釋為等同于選定 的字符的錄入。可預測性應用程序可以,例如在敲擊組合按鍵的第一個按鍵之后,自動更新其他相關的按鍵,來完成由第一個按鍵和各種其他按鍵
的組合而產生的可能的功能。例如,如果敲擊"A"然后各種其他的按鍵將 錄入命令的選擇,那么"A"便起各種各樣的功能鍵的作用。當用戶錄入"A" 時,虛擬鍵盤可以被立即改變?yōu)轱@示可以與"A"相結合來被錄入的所有相 關的命令或按鍵。這樣,用戶不需要記住或使用物理的表格來發(fā)現(xiàn)按鍵的 組合;相反地,相關的組合可以實時在虛擬鍵盤上被動態(tài)地更新。
現(xiàn)在參照圖1E,根據(jù)本公開的一些實施例舉例說明了兩種比較方法的 表。表格190描述了一些印度語言符號和需要被輸入來獲得印度語言符號 的相應的英語字母。根據(jù)示例性表格190,印度語言字符可以使用常規(guī)的方 法來被表示、使用和獲得,根據(jù)該方法單個或兩個、三個、四個或五個英 語字母或標記的組合需要被打入(錄入或鍵入)。例如,通過錄入字母"s" (194) 可得到字符193,以及通過錄入字母的組合"s/t/r" (196)可得到字符195。 因而,獲得字母195需要5此擊鍵。
表格191描述了通過結合相應的手勢只錄入一個英語字符(單次敲擊實 現(xiàn))來獲得相同的印度語言字符(在197示出)的方法。例如,字符193如以 前(194)一樣通過錄入字符"s" (198)獲得,而不使用任何手勢,因為使用一 個字符(194或198)便已足夠簡單。但是,不同于使用5次擊鍵(196)來獲得 字符195,只需要結合手勢199 (在這個實例中為手勢3)錄入一個字符(例如 字符"s")便可獲得字符195。
現(xiàn)在參照圖1F,數(shù)個映射的實例被示意地說明和描述,其對應于圖1E 中示出的印度語言字符。圖1F將結合圖1E被描述。在實例中,初始或默 認的英語字符"S"被示意性地示出(在184)已分配了印度語言字符183,因 為根據(jù)這個實例,字符"S"未采用任何手勢(在兩個圖的185處"手勢"為 "無")而被錄入。在另一個實例中,初始或默認英語字符"S"被示意性地 示出(在186)已分配了印度語言字符187,因為根據(jù)這個實例,字符"S"采 用了手勢(在兩個圖的188,"手勢"為"沒有")而被錄入。
參照圖2A,示意地說明了一系列操作或過程,其可以被實現(xiàn)來操作數(shù) 據(jù)錄入系統(tǒng)。在方框200,用戶可以在他/她的計算機上設定或初始化數(shù)據(jù) 輸入系統(tǒng)的軟件。 一旦軟件被執(zhí)行并工作,標定屏可以被示出,指示系統(tǒng) 正在開始或已經開始操作。在方框205,用戶可以在攝像儀的視界內放置真
18實的(物理的)鍵盤。在方框210,數(shù)據(jù)輸入系統(tǒng)可以使用鍵盤識別功能來識 別例如鍵盤的位置和按鍵,以及隨后可以通知用戶鍵盤已經被識別以及數(shù) 據(jù)輸入系統(tǒng)做好了操作準備。
在方框215,用戶可以將他的/她的手放在圖像獲取設備的視覺范圍內。 在方框220數(shù)據(jù)輸入系統(tǒng)可以捕獲并
在方框215,用戶可以將他的/她的手放在圖像獲取設備的視覺范圍內。 在方框220數(shù)據(jù)輸入系統(tǒng)可以捕獲并處理手的圖像,之后數(shù)據(jù)輸入系統(tǒng)可 以通知用戶手的識別已經完成。在方框225,用戶可以根據(jù)實際所使用的語 言來操作文字處理應用程序。在方框230,數(shù)據(jù)輸入系統(tǒng)可以在數(shù)據(jù)輸入系 統(tǒng)的顯示器上根據(jù)所選擇的文字處理應用程序以一組默認的按鍵來顯示虛 擬鍵盤。用戶可以在觀看虛擬鍵盤上他的/她的手具有相互關系的移動的同 時,在真實的鍵盤上鍵入命令,按要求采用被選擇的語言來錄入數(shù)據(jù)。虛 擬鍵盤可以描繪出虛擬的手指主動地移動來按下所選擇的按鍵,從而指示 實際錄入的命令。
在方框235,如果用戶希望改變鍵盤的模式、語言、輸入命令等等,用 戶可以通過使用單手或雙手(或身體的其他部分)來產生被選擇的信號。信號 可以從一組預先設置的信號或動作中選擇。在方框240,數(shù)據(jù)輸入系統(tǒng)可以 捕獲并處理手的信號,并錄入所要求的用戶命令或數(shù)據(jù)。在方框245,按鍵 和/或虛擬鍵盤的布局可以根據(jù)用戶的命令來改變,例如通過錄入功能鍵、 按鍵的組合、鼠標動作或命令、按鍵錄入和鼠標動作的組合等等??梢詫?現(xiàn)上述步驟的任何組合。此外,代替前面所述步驟和/或除此之外,可以使 用其他步驟或步驟的系列。
在其他實施例中,該方法可以使得能夠處理單手或雙手的移動,以及 同樣地身體的其他移動。例如,在一些實施例中,該方法可以捕獲并處理 頭部移動、眼部移動、嘴巴移動或其他指示用戶命令、信號和/或數(shù)據(jù)錄入 的移動。
參見圖2B,根據(jù)一些實施例示意地示出并描述了數(shù)據(jù)輸入系統(tǒng)的一般 布局和功能。在方框260,圖像獲取設備290可以捕獲由用戶(未示出)的手 292產生或擺出的姿勢。在方框265,捕獲的姿勢可以被識別為,例如圖1D 中的3號姿勢。在方框270,虛擬鍵盤(291)可以被改變?yōu)轱@示(例如)3號布局,其對應于3號姿勢。相應地,在方框275,文字處理軟件可以改變?yōu)榈?3操作模式(改變語言)。在方框280,用戶可以按下物理鍵盤293上的按鍵。 在方框285,數(shù)據(jù)輸入系統(tǒng)201的控制器(未示出)在其使虛擬手294的位置 和移動與使用數(shù)據(jù)輸入系統(tǒng)201的用戶的物理的手292的位置和移動充分 地相互關聯(lián)的同時,可以模擬并顯示用戶的手指(在294處示出)在虛擬鍵盤 291上敲擊相應的按鍵。其他的步驟或步驟的系列也可以使用。計算機286 可以在功能上耦合到物理鍵盤293,從物理鍵盤293計算機286可以接收表 示被按下的按鍵的信號,以及在功能上耦合到顯示屏295,從顯示屏295計 算機286可以轉發(fā)虛擬手和虛擬鍵盤的圖像及其他。
參見圖3,根據(jù)本公開的一些實施例示出并描述了類似于鼠標的實現(xiàn)。 作為本公開的一部分,虛擬手可以模擬或者模仿類似于鼠標的導航;用戶 可以將數(shù)據(jù)錄入計算機(304)并/或通過使用虛擬鼠標來操作圖形應用程序。 計算機304包括數(shù)據(jù)306的控制器(未示出)。在方框300,圖像獲取設備301 可以捕獲用戶的移動或身體的部分,例如手(在302處示出),其可以移動以 便實現(xiàn)鼠標類型的導航。在方框305,手的移動的方向,在例如X-Y平面 上被觀測并被轉發(fā)給計算機304。另外地或可替換地,在方框310,用戶的 姿勢或移動可以被圖像獲取設備301捕獲。在方框315,捕獲的姿勢的圖像 可以被處理以錄入用戶的命令和/或數(shù)據(jù)。在方框320,命令和/或數(shù)據(jù)等可 以被錄入到計算機304中,在那里它們可以被相應地執(zhí)行,例如通過在顯 示器303上導航、改變模式和/或功能、錄入特定的命令等等。
計算機的屏幕(例如圖2B的顯示屏295或圖3的顯示屏303)、物理鍵 盤(例如圖2B的物理鍵盤293)和圖像獲取設備(例如圖2B的圖像獲取設備 290或圖3的圖像獲取設備301),可以是任何適合的傳統(tǒng)顯示屏、物理鍵盤 或圖像獲取設備。圖2B的計算機286或圖3的計算機304可以是任何適合 的傳統(tǒng)的計算機,其要求是它除了通常的硬件和軟件組件之外,還包括所 要求的用于分析所獲取的圖像來確定用戶產生或擺出的移動和姿勢以及用 于生成以及一般地處理虛擬鍵盤和虛擬手的支持虛擬現(xiàn)實的硬件和軟件應 用程序。
前面對各種實施例的描述是基于說明和描述的目的而給出的。其不是 要將本公開窮舉或將其限制在所公開的明確的形式上。本領域技術人員將會理解,許多修改、變型、替換、改變和等同就上述教導而言是可能的。 因此所附權利要求是要被解釋為包括所有處于權利要求真正的實質和范圍 內的修改、排列、增加和子組合。
權利要求
1、一種數(shù)據(jù)輸入系統(tǒng),包括圖像獲取設備,用于生成與所獲取的部分的用戶身體和物理鍵盤的圖像相關聯(lián)的輸出信號;以及控制器,用于接收所述輸出信號,以及基于所獲取圖像來設置并顯示輸入按鍵的映射。
2、 根據(jù)權利要求1所述的系統(tǒng),其中所述輸入按鍵的映射是虛擬鍵盤的一部分。
3、 根據(jù)權利要求2所述的系統(tǒng),其中所述部分的用戶身體是用戶手部, 并且所述控制器還顯示模擬相對于所述物理鍵盤放置或移動的所述用戶手 部的虛擬手。
4、 根據(jù)權利要求1所述的系統(tǒng),其中所述控制器還用于將所獲取的關于用戶姿勢的圖像解釋為單獨的命令。
5、 根據(jù)權利要求4所述的系統(tǒng), 勢改變所述虛擬鍵盤上的按鍵。
6、 根據(jù)權利要求4所述的系統(tǒng), 勢改變所述虛擬鍵盤的布局。
7、 根據(jù)權利要求3所述的系統(tǒng), 擬手的外觀。其中所述控制器還用于根據(jù)用戶姿 其中所述控制器還用于根據(jù)用戶姿 其中所述控制器還用于改變所述虛
8、根據(jù)權利要求1所述的系統(tǒng),其中所述物理鍵盤選自于由空白鍵盤、 紙鍵盤、觸摸板、小鍵盤、假想鍵盤以及平坦無遮蓋的表面所組成的鍵盤 組。
9、 根據(jù)權利要求4所述的系統(tǒng),其中所述控制器還用于基于用戶先 前的命令,確定并顯示所預見的所述虛擬鍵盤上后續(xù)所要求的按鍵。
10、 根據(jù)權利要求4所述的系統(tǒng),其中所述控制器還用于基于用戶 先前的命令,確定并顯示所預見的所述虛擬鍵盤上后續(xù)所要求的鍵盤布局。
11、 根據(jù)權利要求4所述的系統(tǒng),其中所述姿勢由用戶手部作出。
12、 根據(jù)權利要求4所述的系統(tǒng),其中所述姿勢是從由用于實現(xiàn)鼠標 類型的導航的移動和用于實現(xiàn)命令的移動所組成的組中選出的一個或多個 用戶移動。
13、 根據(jù)權利要求4所述的系統(tǒng),其中所述姿勢由用戶身體的一個或 多個部分來作出,所述姿勢是從包括手的移動、頭部移動、眼部移動、嘴 部移動或其他指示用戶命令的移動的組中選出的。
14、 根據(jù)權利要求3所述的系統(tǒng),其中所述虛擬手透明地疊加顯示在 所述虛擬鍵盤上。
15、 根據(jù)權利要求3所述的系統(tǒng),其中所述虛擬手的外觀取決于所使 用的虛擬鍵盤布局。
16、 根據(jù)權利要求4所述的系統(tǒng),其中所述控制器還用于通過評估 先前的命令來預測后面的按鍵標簽和后面的虛擬鍵盤布局。
17、 根據(jù)權利要求4所述的系統(tǒng),其中所述姿勢與所述物理鍵盤中按 下的按鍵組合來使用,用于設置并顯示相應的映射。
18、 一種將數(shù)據(jù)輸入到計算系統(tǒng)中的方法,包括獲取部分的用戶身體和物理鍵盤的圖像;以及 基于所獲取的圖像,設置并顯示虛擬鍵盤上輸入按鍵的映射。
19、 根據(jù)權利要求18所述的方法,其中所述圖像與由所述用戶作出的、 將被解釋為命令的姿勢有關。
20、 根據(jù)權利要求19所述的方法,其中所述姿勢與從由手部移動、頭 部移動、眼部移動和嘴部移動所組成的組中選出的移動有關。
21、 根據(jù)權利要求19所述的方法,其中響應于所述姿勢,所述虛擬鍵 盤上的按鍵標簽發(fā)生變化。
22、 根據(jù)權利要求19所述的方法,其中響應于所述姿勢,所述虛擬鍵 盤的布局發(fā)生變化。
23、 根據(jù)權利要求18所述的方法,還包括獲取所述用戶手部并顯示模 擬相對于所述物理鍵盤放置或移動的所述用戶手部的虛擬手。
24、 根據(jù)權利要求23所述的方法,其中使用所述物理鍵盤的單次擊鍵 來將字符錄入到所述計算系統(tǒng)中。
25、 根據(jù)權利要求21所述的方法,其中手的移動模擬虛擬鼠標,來實 現(xiàn)鼠標類型的導航。
26、 根據(jù)權利要求23所述的方法,其中所述虛擬手透明地疊加顯示在 所述虛擬鍵盤上。
27、 根據(jù)權利要求23所述的方法,其中所述虛擬手的外觀取決于所使 用的虛擬鍵盤布局。
28、 根據(jù)權利要求19所述的方法,還包括評估先前的命令來預測后面 的按鍵標簽和后面的虛擬鍵盤布局。
29、 根據(jù)權利要求19所述的方法,其中所述姿勢與所述物理鍵盤中按 下的按鍵組合來使用,用于設置并顯示相應的映射。
30、 一種將數(shù)據(jù)輸入到計算系統(tǒng)中的方法,包括顯示虛擬手,所述虛擬手與真實的用戶手部相關并且疊加在表示物理 鍵盤的虛擬鍵盤上;以及響應于用戶手部作出的姿勢,設置所述虛擬鍵盤上按鍵的映射。
31、 根據(jù)權利要求30所述的方法,其中響應于用戶真實的手作出的姿 勢,所述虛擬鍵盤的布局發(fā)生改變。
32、 根據(jù)權利要求30所述的方法,其中所述虛擬手透明地疊加顯示在 所述虛擬鍵盤上。
33、 根據(jù)權利要求30所述的方法,其中所述虛擬手的外觀取決于所使 用的虛擬鍵盤布局。
34、 根據(jù)權利要求30所述的方法,其中所述姿勢與所述物理鍵盤中按 下的按鍵組合來使用。
全文摘要
提供了一種使數(shù)據(jù)能夠錄入到計算系統(tǒng)中的系統(tǒng)和方法。該系統(tǒng)包括控制器,其在功能上耦合到圖像獲取設備,并用于基于所獲取的由所述圖像獲取設備捕獲的圖像,設置輸入按鍵或整個鍵盤布局的映射。所述系統(tǒng)可以捕獲所選擇的視場內的用戶的移動和/或姿勢的圖像,并且可以處理這些圖像以根據(jù)所述移動來識別并執(zhí)行命令。
文檔編號G06F3/02GK101589425SQ200780013631
公開日2009年11月25日 申請日期2007年2月8日 優(yōu)先權日2006年2月16日
發(fā)明者G·巴爾-薩凱, H·科亨 申請人:Ftk技術有限公司