一種基于正則表達式的語義分析方法
【專利摘要】本發(fā)明公開了一種基于正則表達式的語義分析方法,包括步驟:建立正則表達式組合數(shù)據(jù)庫,并將各組合和服務建立映射關系;獲取用戶語音輸入所對應的文本信息,對文本信息進行組合的匹配;執(zhí)行匹配的組合所關聯(lián)的服務。本發(fā)明處理手段非常透明,利于開發(fā)者根據(jù)需求做進一步優(yōu)化,并且語義分析精確、靈活、執(zhí)行效率高。
【專利說明】一種基于正則表達式的語義分析方法
[【技術領域】]
[0001]本發(fā)明涉及語義分析領域,尤其涉及一種基于正則表達式的語義分析方法。
[【背景技術】]
[0002]語義分析技術被廣泛地用于現(xiàn)實生活中,如iphone的siri服務,以及訊飛語音服務、百度語音服務等,均能為用戶提供基于語音命令的搜索服務及其他服務,其主要做法是:先將語音數(shù)據(jù)轉換為文本信息,然后利用文本匹配方式搜索關鍵字,根據(jù)關鍵字輸出相應的項目,即單純通過關鍵詞進行語義分析,但是我們知道,這些服務中的語義分析方式不可避免地具有以下幾種缺陷:一是由于識別的內容過于寬泛,需要大量的第三方通用語義識別開發(fā)包,導致程序體積臃腫,識別效率低;二是根據(jù)識別語義輸出的項目無針對性,執(zhí)行效率低;三是采用非常復雜并且不透明的處理過程,使得不便于對軟件做出精細調整。因此,對識別、執(zhí)行效率等擁有更高要求的汽車行駛環(huán)境,有必要提供一套新的語義分析方案。
[
【發(fā)明內容】
]
[0003]針對上述問題,本發(fā)明提供了一種基于正則表達式的語義分析方法,其不僅具有識別效率高、執(zhí)行效率高的優(yōu)勢,還能根據(jù)需求做出精細調整。
[0004]具體技術方案如下:
[0005]一種基于正則表達式的語義分析方法,包括步驟:
[0006]根據(jù)關鍵字組建正則表達式組合,并將組建的組合預先存于數(shù)據(jù)庫中,每個組合關聯(lián)一項或多項服務;
[0007]獲取用戶語音輸入所對應的文本信息,對所述文本信息進行組合的匹配;
[0008]執(zhí)行匹配的組合所關聯(lián)的服務。
[0009]人們可以根據(jù)所需的服務,預先設置與之對應的組合;當用戶的語音轉換為文本信息后,自動檢測文本信息中是否含有匹配的組合,然后根據(jù)匹配的組合,執(zhí)行相應的服務:首先,本發(fā)明訂制化程度非常高,按正則表達式對關鍵字進行組合,并按正則表達式進行匹配,由于正則表達式是國際通用的文本處理規(guī)則,因此處理手段非常透明,開發(fā)者可以根據(jù)需要進行微調,而規(guī)避了深奧的語義識別理論;其次,本發(fā)明精確了識別范圍,簡化了識別流程,精簡了程序運算資源;最后,本發(fā)明采用了關鍵字或組合與具體執(zhí)行的服務相關聯(lián)的方式,執(zhí)行效率得到有效提聞。
[【專利附圖】
【附圖說明】]
[0010]圖1是本發(fā)明的方法流程圖。
[【具體實施方式】]
[0011]為了使本發(fā)明的目的、技術方案和優(yōu)點更加清晰,下面結合附圖和實施方式作進一步地詳細描述。
[0012]本發(fā)明所述的基于正則表達式的語義分析方法,可以是基于ios、Android、WP等操作系統(tǒng)上的APP軟件,其載體主要為移動終端,其可以廣泛的用于語義分析領域,但需要說明的是,本方法尤其適合應用在車輛中,如在應用在車輛導航儀上,顯而易見,在車輛導航儀上植入本方法對應的軟體,將能夠使其在語義分析效率、及執(zhí)行效率上得到大幅提升。下面通過一較優(yōu)實施例對本發(fā)明的方案做具體的介紹。
[0013]另外,正則表達式是國際通用的文本處理規(guī)則,但并不排除各大廠商進行規(guī)則的微調,其具體使用方法可以參考互聯(lián)網上公開的文檔,本文不予詳述,當然,為了幫助本領域技術人員能夠更好的理解,會在下文中簡介本申請文件中多次使用到的符號,并會在下文中以舉例的方式穿插闡述。
[0014]本發(fā)明所述的基于正則表達式的語義分析方法,包括步驟:
[0015]S1、根據(jù)關鍵字組建正則表達式組合,并將組建的組合預先存于數(shù)據(jù)庫中,每個組合關聯(lián)一項或多項服務;
[0016]當開發(fā)者打算一項服務時,首先要尋找人們在要求這一服務時,會說的慣常用語,找出多個慣用用語中的共性,即關鍵字,然后根據(jù)這些關鍵字,按正則表達式的規(guī)則,組建含這些關鍵字的正則表達式組合,然后將這一組合和其對應的服務進行關聯(lián);當開發(fā)者需要開發(fā)一整套服務時,則需要為一整套服務中的各種不同的服務分別關聯(lián)不同的組合,這些組合預先存于數(shù)據(jù)庫中,供需要的時候調用;
[0017]需要說明是,當僅使用一個關鍵字或一個關鍵詞就可以精確定位服務的時候,可以建立該關鍵字或關鍵詞和相應的服務進行關聯(lián),該關鍵字或關鍵詞可存于數(shù)據(jù)庫中,當然,為了統(tǒng)一性,也可以將單個關鍵字或單個關鍵詞轉換成正則表達式組合的形式存于數(shù)據(jù)庫中;
[0018]本實施例優(yōu)選為每個組合只關聯(lián)一項服務,這樣做的好處是,當文本信息中的內容成功匹配到相應的組合后,就可以立即執(zhí)行組合所關聯(lián)的服務,因此擁有更加高效的執(zhí)行效率,尤其適用于對時間要求的高速行駛的車輛中;
[0019]需要說明的是,關聯(lián)方式并非是一一對應的關系,即“組合-服務”之間的映射關系,可以是一一對應關系,可以是多對一的映射關系,當然也可以是一對多的映射關系,下文具體的實施例中即是建立多對一的映射關系;
[0020]S2、獲取用戶語音輸入所對應的文本信息,對所述文本信息進行組合的匹配;
[0021]即根據(jù)正則式匹配規(guī)則,將文本信息中的內容和數(shù)據(jù)庫中的組合進行匹配,檢測文本信息中是否有匹配的組合存在;
[0022]需要說明的是,各個組合在對文本信息進行遍歷式的匹配時,是具有順序性的逐個匹配,具體可采用正序或倒序,但為了高效性,本發(fā)明并不排斥其他的高效的檢索或匹配方式;
[0023]S3、執(zhí)行匹配的組合所關聯(lián)的服務;
[0024]即當在文本信息中檢測到有匹配的組合存在時,則執(zhí)行該組合所關聯(lián)的服務。
[0025]在一優(yōu)選實施例中,還有部分組合對應的設有功能參數(shù),若文本信息和某組合匹配,而該組合對應的設有功能參數(shù),則需要在文本信息相應的位置處提取出所述功能參數(shù),若提取不到,則發(fā)出提示用戶輸入功能參數(shù)的請求。[0026]例如用戶語音輸入“上深圳寶安機場去”,該語音信息轉換為文本信息后,文本信息與“(上.+)”的組合匹配,而該組合就設有一個表征地址信息的功能參數(shù),因此匹配后,就會在“上”后面的文本信息中提取一個地址信息“深圳寶安機場”,并最終輸出到“深圳寶安機場”的導航線路。
[0027]另外,至少部分組合還對應有附加參數(shù),如在“(上.+)”的組合除了關聯(lián)信息外,還具有附加信息,該附加信息是要排查“上?!?、“上虞”等以“上”為開頭的地址,可以看出,附加參數(shù)可以理解為是一種對有效信息的補充或對無效信息的排除。
[0028]在步驟S3中,在執(zhí)行相應的服務之前,還包括確認或進一步選擇性確認的步驟:所謂確認,即執(zhí)行前的“是與否”的確認,如“(上.+)”的組合與“上深圳寶安機場去”匹配成功后,應該輸出到“深圳寶安機場”的導航線路,但在執(zhí)行該服務前,會有一確認如“請確認是否導航到深圳寶安機場”,若得到用戶的確認后,立即執(zhí)行該服務,輸出到“深圳寶安機場”的導航線路;所謂進一步選擇性的確認,如輸出“到深圳寶安機場東,到深圳寶安機場西,請確認”,待用戶確認后,然后輸出相應的導航線路。
[0029]下面采用一具體的實施例,加以說明。
[0030]在該實施例中,關聯(lián)有一項服務的關鍵字或組合與功能參數(shù)、服務之間的映射關系如下:
[0031]
【權利要求】
1.一種基于正則表達式的語義分析方法,其特征在于,包括步驟: 根據(jù)關鍵字組建正則表達式組合,并將組建的組合預先存于數(shù)據(jù)庫中,每個組合關聯(lián)一項或多項服務; 獲取用戶語音輸入所對應的文本信息,對所述文本信息進行組合的匹配; 執(zhí)行匹配的組合所關聯(lián)的服務。
2.根據(jù)權利要求1所述的語義分析方法,其特征在于,至少部分組合對應的設有功能參數(shù),根據(jù)該功能參數(shù)所處的位置從文本信息進行參數(shù)提取或者發(fā)出提示用戶輸入所述功能參數(shù)的請求。
3.根據(jù)權利要求2所述的語義分析方法,其特征在于,至少部分組合還對應有附加參數(shù)。
4.根據(jù)權利要求1所述的語義分析方法,其特征在于,所述組合按設定的順序對所述文本信息進行匹配。
5.根據(jù)權利要求1、2、3或4所述的語義分析方法,其特征在于,在執(zhí)行相應的服務之前,還包括確認或進一步選擇性確認的步驟。
6.根據(jù)權利要求1所述的語義分析方法,其特征在于,所述關聯(lián)有一項或多項服務的關鍵字或組合包括以下表格中的任意一項或多項,它們與服務之間的映射關系如下:
7.根據(jù)權利要求6所述的語義分析方法,其特征在于,所述設有功能參數(shù)的組合,其功能參數(shù)在組合中的位置如下:
【文檔編號】G06F17/30GK103838713SQ201410120061
【公開日】2014年6月4日 申請日期:2014年3月27日 優(yōu)先權日:2014年3月27日
【發(fā)明者】王崢嶸 申請人:王崢嶸