本發(fā)明涉及車輛控制,尤其是一種基于機器視覺的語音識別分區(qū)管理方法、系統(tǒng)及介質(zhì)。
背景技術(shù):
1、隨著汽車智能網(wǎng)聯(lián)化的發(fā)展,車輛監(jiān)測及控制技術(shù)也越來越智能化,給駕乘人員帶來越來越豐富的行車體驗。目前汽車大多具備語音識別功能,通過特定的喚醒詞或者按壓開關(guān),可以激活語音識別功能,通過語音對車輛進行空調(diào)溫度調(diào)節(jié)、各個執(zhí)行器開閉以及導航等功能。然而,現(xiàn)有技術(shù)存在以下問題:兒童在乘車時可能會發(fā)出語音指令使車輛執(zhí)行不同操作,對駕駛員造成影響,從而影響了行車安全性;即使在有兒童乘員時對語音識別功能進行禁用,也需要駕駛員主觀判斷并進行語音識別功能的禁用和啟動操作,增加了駕駛員的負擔,且會影響其他乘員正常使用語音識別功能,從而影響了用戶的駕乘體驗。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于至少一定程度上解決現(xiàn)有技術(shù)中存在的技術(shù)問題之一。
2、為此,本發(fā)明實施例的一個目的在于提供一種基于機器視覺的語音識別分區(qū)管理方法,該方法提高了行車安全性和用戶的駕乘體驗。
3、本發(fā)明實施例的另一個目的在于提供一種基于機器視覺的語音識別分區(qū)管理系統(tǒng)。
4、為了達到上述技術(shù)目的,本發(fā)明實施例所采取的技術(shù)方案包括:
5、第一方面,本發(fā)明實施例提供了一種基于機器視覺的語音識別分區(qū)管理方法,包括以下步驟:
6、獲取目標車輛的乘員艙的第一圖像信息,并根據(jù)所述第一圖像信息確定所述乘員艙是否存在兒童乘員;
7、當所述乘員艙存在兒童乘員,確定所述兒童乘員所在的座艙區(qū)域為語音指令屏蔽區(qū)域;
8、響應于所述目標車輛的語音控制指令,對所述語音控制指令進行聲源定位確定所述語音控制指令的語音發(fā)出位置,并判斷所述語音發(fā)出位置是否位于所述語音指令屏蔽區(qū)域內(nèi);
9、當所述語音發(fā)出位置不位于所述語音指令屏蔽區(qū)域內(nèi),對所述語音控制指令進行識別和響應。
10、進一步地,在本發(fā)明的一個實施例中,所述根據(jù)所述第一圖像信息確定所述乘員艙是否存在兒童乘員,其具體包括:
11、對所述第一圖像信息進行人臉檢測,得到若干個人臉圖像信息;
12、將所述人臉圖像信息輸入到預先訓練好的兒童人臉識別模型,得到兒童人臉識別結(jié)果;
13、根據(jù)所述兒童人臉識別結(jié)果確定所述乘員艙是否存在兒童乘員,若存在兒童乘員,根據(jù)所述兒童人臉識別結(jié)果和所述第一圖像信息確定所述兒童乘員所在的所述座艙區(qū)域。
14、進一步地,在本發(fā)明的一個實施例中,所述根據(jù)所述第一圖像信息確定所述乘員艙是否存在兒童乘員,其具體包括:
15、對所述第一圖像信息進行人體檢測,得到若干個人體圖像信息;
16、將所述人體圖像信息輸入到預先訓練好的人體年齡識別模型,得到人體年齡識別結(jié)果;
17、根據(jù)所述人體年齡識別結(jié)果確定所述乘員艙是否存在兒童乘員,若存在兒童乘員,根據(jù)所述人體年齡識別結(jié)果和所述第一圖像信息確定所述兒童乘員所在的所述座艙區(qū)域。
18、進一步地,在本發(fā)明的一個實施例中,所述目標車輛內(nèi)設(shè)置有麥克風陣列,所述麥克風陣列包括多個麥克風,各所述麥克風分別設(shè)置在所述目標車輛的各個分區(qū)內(nèi)。
19、進一步地,在本發(fā)明的一個實施例中,所述響應于所述目標車輛的語音控制指令,對所述語音控制指令進行聲源定位確定所述語音控制指令的語音發(fā)出位置,其具體包括:
20、當所述麥克風陣列監(jiān)測到所述語音控制指令,確定各所述麥克風接收到所述語音控制指令的信號接收時間和/或信號強度;
21、確定所述信號接收時間最早和/或所述信號強度最強的所述麥克風所在的分區(qū)為所述語音發(fā)出位置。
22、進一步地,在本發(fā)明的一個實施例中,所述語音識別分區(qū)管理方法還包括以下步驟:
23、當所述語音發(fā)出位置位于所述語音指令屏蔽區(qū)域內(nèi),將所述語音控制指令輸入到預先訓練好的語音年齡識別模型,得到語音年齡識別結(jié)果;
24、根據(jù)所述語音年齡識別結(jié)果確定所述語音控制指令是否為所述兒童乘員發(fā)出;
25、當所述語音控制指令不為所述兒童乘員發(fā)出,對所述語音控制指令進行識別和響應;
26、當所述語音控制指令為所述兒童乘員發(fā)出,生成誤操作提醒信息并進行播報。
27、進一步地,在本發(fā)明的一個實施例中,所述語音識別分區(qū)管理方法還包括以下步驟:
28、當所述乘員艙不存在兒童乘員,且所述目標車輛當前存在語音指令屏蔽區(qū)域,將所述語音指令屏蔽區(qū)域重置為正常區(qū)域
29、第二方面,本發(fā)明實施例提供了一種基于機器視覺的語音識別分區(qū)管理系統(tǒng),包括:
30、乘員檢測模塊,用于獲取目標車輛的乘員艙的第一圖像信息,并根據(jù)所述第一圖像信息確定所述乘員艙是否存在兒童乘員;
31、屏蔽區(qū)域確定模塊,用于當所述乘員艙存在兒童乘員,確定所述兒童乘員所在的座艙區(qū)域為語音指令屏蔽區(qū)域;
32、語音發(fā)出位置判斷模塊,用于響應于所述目標車輛的語音控制指令,對所述語音控制指令進行聲源定位確定所述語音控制指令的語音發(fā)出位置,并判斷所述語音發(fā)出位置是否位于所述語音指令屏蔽區(qū)域內(nèi);
33、語音指令響應模塊,用于當所述語音發(fā)出位置不位于所述語音指令屏蔽區(qū)域內(nèi),對所述語音控制指令進行識別和響應。
34、第三方面,本發(fā)明實施例提供了一種基于機器視覺的語音識別分區(qū)管理裝置,包括:
35、至少一個處理器;
36、至少一個存儲器,用于存儲至少一個程序;
37、當所述至少一個程序被所述至少一個處理器執(zhí)行時,使得所述至少一個處理器實現(xiàn)上述的一種基于機器視覺的語音識別分區(qū)管理方法。
38、第四方面,本發(fā)明實施例還提供了一種計算機可讀存儲介質(zhì),其中存儲有處理器可執(zhí)行的程序,所述處理器可執(zhí)行的程序在由處理器執(zhí)行時用于執(zhí)行上述的一種基于機器視覺的語音識別分區(qū)管理方法。
39、本發(fā)明的優(yōu)點和有益效果將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實踐了解到:
40、本發(fā)明實施例獲取目標車輛的乘員艙的第一圖像信息,并根據(jù)第一圖像信息確定乘員艙是否存在兒童乘員,當乘員艙存在兒童乘員,確定兒童乘員所在的座艙區(qū)域為語音指令屏蔽區(qū)域,響應于目標車輛的語音控制指令,對語音控制指令進行聲源定位確定語音控制指令的語音發(fā)出位置,并判斷語音發(fā)出位置是否位于語音指令屏蔽區(qū)域內(nèi),當語音發(fā)出位置不位于語音指令屏蔽區(qū)域內(nèi),對語音控制指令進行識別和響應。本發(fā)明實施例在車輛啟動時或行駛過程中實時識別乘員艙是否有兒童乘員,從而對車輛的語音識別功能進行智能化的分區(qū)管理,避免對有兒童乘員的座艙區(qū)域的語音控制指令直接進行響應,防止兒童乘員發(fā)出不當?shù)恼Z音控制指令對駕駛員造成影響,提高了行車安全性;無需駕駛員主觀判斷并進行語音識別功能的禁用和啟動操作,減輕了駕駛員的負擔,也不會影響其他乘員正常使用語音識別功能,提高了用戶的駕乘體驗。
1.一種基于機器視覺的語音識別分區(qū)管理方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于機器視覺的語音識別分區(qū)管理方法,其特征在于,所述根據(jù)所述第一圖像信息確定所述乘員艙是否存在兒童乘員,其具體包括:
3.根據(jù)權(quán)利要求1所述的一種基于機器視覺的語音識別分區(qū)管理方法,其特征在于,所述根據(jù)所述第一圖像信息確定所述乘員艙是否存在兒童乘員,其具體包括:
4.根據(jù)權(quán)利要求1所述的一種基于機器視覺的語音識別分區(qū)管理方法,其特征在于:所述目標車輛內(nèi)設(shè)置有麥克風陣列,所述麥克風陣列包括多個麥克風,各所述麥克風分別設(shè)置在所述目標車輛的各個分區(qū)內(nèi)。
5.根據(jù)權(quán)利要求4所述的一種基于機器視覺的語音識別分區(qū)管理方法,其特征在于,所述響應于所述目標車輛的語音控制指令,對所述語音控制指令進行聲源定位確定所述語音控制指令的語音發(fā)出位置,其具體包括:
6.根據(jù)權(quán)利要求1所述的一種基于機器視覺的語音識別分區(qū)管理方法,其特征在于,所述語音識別分區(qū)管理方法還包括以下步驟:
7.根據(jù)權(quán)利要求1至6中任一項所述的一種基于機器視覺的語音識別分區(qū)管理方法,其特征在于,所述語音識別分區(qū)管理方法還包括以下步驟:
8.一種基于機器視覺的語音識別分區(qū)管理系統(tǒng),其特征在于,包括:
9.一種基于機器視覺的語音識別分區(qū)管理裝置,其特征在于,包括:
10.一種計算機可讀存儲介質(zhì),其中存儲有處理器可執(zhí)行的程序,其特征在于,所述處理器可執(zhí)行的程序在由處理器執(zhí)行時用于執(zhí)行如權(quán)利要求1至7中任一項所述的一種基于機器視覺的語音識別分區(qū)管理方法。