專利名稱::一種語音分析識(shí)別方法、系統(tǒng)與裝置的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及一種語音識(shí)別技術(shù),尤其涉及網(wǎng)絡(luò)中識(shí)別語音和處理的相關(guān)技術(shù)。
背景技術(shù):
:目前語音識(shí)別技術(shù)逐漸成熟,在很多手機(jī)上都集成了相關(guān)的識(shí)別模塊,能夠識(shí)別出用戶需要呼叫的用戶,并自動(dòng)撥號(hào)到被叫。但這種方式用戶終端需要集成復(fù)雜的識(shí)別模塊,而識(shí)別模塊的算法更新很快,這種方式不易更新,同時(shí)也增加了用戶終端的復(fù)雜度和成本。業(yè)界還有一種技術(shù),通過綁定電話號(hào)碼和中文名字,讓用戶只需記住企業(yè)、產(chǎn)品、行業(yè)或個(gè)人名,就可以通過一個(gè)服務(wù)號(hào)碼與目標(biāo)電話即時(shí)通話。但該業(yè)務(wù)不能根據(jù)識(shí)別用戶,不能支持用戶資料的保密。
發(fā)明內(nèi)容本發(fā)明的實(shí)施例的目的是提供一種大容量,靈活的,保護(hù)個(gè)人關(guān)系信息隱秘性的語音識(shí)別系統(tǒng)與方法和相關(guān)的裝置。為達(dá)到上述目的,本發(fā)明的實(shí)施例的技術(shù)方案是這樣實(shí)現(xiàn)的本發(fā)明的實(shí)施例提供了一種語音設(shè)備網(wǎng)絡(luò),包括語音識(shí)別分析單元,該單元能夠識(shí)別用戶的語音信息;用戶信息存儲(chǔ)單元,該單元能夠存儲(chǔ)用戶的個(gè)人信息,包括用戶的聯(lián)系人,用戶的個(gè)人信息,用戶的語音信息等用戶需要存儲(chǔ)使用的信息;用戶識(shí)別單元,該單元能夠識(shí)別用戶,以判斷該用戶是否為合法用戶,是否具備訪問相關(guān)的用戶信息,相關(guān)的用戶信息,可以是該合法用戶本人的信息,或該合法用戶可以訪問的信息,或其他用戶允許其訪問的信息。本發(fā)明的實(shí)施例還提供了一種語音識(shí)別控制方法,該方法包括用戶將個(gè)人的信息輸入到網(wǎng)絡(luò)的用戶信息中;用戶使用網(wǎng)絡(luò),網(wǎng)絡(luò)中的語音識(shí)別分析單元分析用戶語言的內(nèi)容;網(wǎng)絡(luò)根據(jù)分析出的語言內(nèi)容,執(zhí)行相關(guān)的操作,如連接用戶的呼叫,根據(jù)用戶信息錄制相關(guān)信息。上述方法中,用戶個(gè)人信息的輸入方法有多種,包括登錄網(wǎng)站錄入,用戶終端上傳本終端的地址簿,等等方法,還可以是識(shí)別主叫用戶打出的被叫號(hào)碼,如果為新號(hào)碼,解析通話過程中被叫的名稱,并將其與撥出號(hào)碼或地址信息關(guān)聯(lián),后續(xù)用戶直接呼叫被叫名稱,即可;識(shí)別打入的主叫號(hào)碼,如果為新號(hào)碼,解析通話過程中主叫的名稱,并將其與號(hào)碼或地址信息關(guān)聯(lián),后續(xù)用戶直接呼叫名稱,即可聯(lián)通。上述方法中,還包括了用戶識(shí)別單元,用戶識(shí)別單元可以建立用戶終端的號(hào)碼或地址信息與用戶信息之間的關(guān)聯(lián),以識(shí)別該用戶終端是否具備訪問相關(guān)數(shù)據(jù)的權(quán)利。上述的識(shí)別方法還可以是,用戶識(shí)別單元,才艮據(jù)用戶的聲音特征,自動(dòng)識(shí)別出用戶的身份,來判定該用戶是否具備使用該用戶信息的權(quán)利。本發(fā)明的實(shí)施例還提供了一種語音識(shí)別方法,該方法包括根據(jù)用戶信息,選擇語音分析算法和分析參數(shù)。語音識(shí)別分析單元,根據(jù)用戶的個(gè)人信息,調(diào)用對(duì)應(yīng)該用戶的相關(guān)語音分析軟件或設(shè)定相關(guān)的分析參數(shù)。本發(fā)明與現(xiàn)有的技術(shù)相比,網(wǎng)絡(luò)設(shè)備能夠?yàn)椴煌脩艚ⅹ?dú)立的個(gè)人信息區(qū)域,并保證用戶的個(gè)人信息,同時(shí)因?yàn)槊總€(gè)人的日常聯(lián)系人員相對(duì)有限,因此識(shí)別率會(huì)大幅提高。同時(shí)根據(jù)個(gè)人建立相關(guān)的用戶數(shù)據(jù),能開展各種業(yè)務(wù),具有纟及大的靈活性。圖1為本發(fā)明實(shí)施例的原理框圖2為本發(fā)明實(shí)施例應(yīng)用到基于數(shù)字用戶線路的寬帶接入網(wǎng)絡(luò)的框圖3為本發(fā)明實(shí)施例應(yīng)用到以太網(wǎng)系統(tǒng)的框圖4為本發(fā)明實(shí)施例應(yīng)用到基于交換機(jī)的網(wǎng)絡(luò)系統(tǒng)的框圖5為本發(fā)明實(shí)施例應(yīng)用到分布式網(wǎng)絡(luò)的框圖。具體實(shí)施例方式本發(fā)明的核心是,在網(wǎng)絡(luò)中建立對(duì)應(yīng)個(gè)人的網(wǎng)絡(luò)虛擬實(shí)體,該虛擬實(shí)體中,保存用戶的個(gè)人特征信息,和用戶的關(guān)聯(lián)信息,當(dāng)用戶接入網(wǎng)絡(luò)后,網(wǎng)絡(luò)識(shí)別出用戶的身份,同時(shí)分析用戶的語音,識(shí)別出用戶的指令信息和非指令信息,并根據(jù)指令信息或非指令信息,執(zhí)行相關(guān)的網(wǎng)絡(luò)操作,如替用戶接通呼叫連接,執(zhí)行用戶的錄音指令,或其他相關(guān)操作。為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合具體的實(shí)施例和附圖對(duì)本發(fā)明作進(jìn)一步地詳細(xì)描述。如圖1所示,終端1接入到網(wǎng)絡(luò)后,向網(wǎng)絡(luò)發(fā)出"連接終端2"的語音指示,網(wǎng)絡(luò)中的語音識(shí)別分析單元,分析出語音的信息,解析出"連接終端2"的含義,并在用戶信息中,查詢"終端2"的號(hào)碼信息,并連通終端2和終端1。終端l接入網(wǎng)絡(luò)后,語音識(shí)別分析單元,可以解析用戶終端的指令信息,并執(zhí)行,如"錄音",語音識(shí)別分析單元,將用戶的語言錄制下來,并且可以進(jìn)一步的解析,形成文本信息存儲(chǔ),供用戶調(diào)用。語音識(shí)別分析單元,還可以識(shí)別出用戶的屬性,如用戶是廣東人,那么語音識(shí)別分析單元使用廣東話解析分析^t版進(jìn)行解析用戶的語言,語音識(shí)別分析單元還包括其他各種語言或方言的解析^f莫式。進(jìn)一步,語音識(shí)別分析單元,包括自適應(yīng)算法,根據(jù)用戶的發(fā)音屬性,自動(dòng)匹配相關(guān)的語音解析參數(shù)。用戶識(shí)別單元,可以保存用戶的終端的號(hào)碼信息或地址信息(VOIP電話),或終端的屬性(終端的設(shè)備標(biāo)識(shí)),來鑒定該用戶是否具備訪問用戶信息的權(quán)限。用戶識(shí)別單元,還可以保存用戶的聲音個(gè)人屬性(音質(zhì)特征,或聲纟丈信息)來鑒別該用戶是否具有訪問數(shù)據(jù)的權(quán)限,或者用于索引、匹配應(yīng)該訪問的哪個(gè)用戶信息。用戶的聲纟丈信息,可以在用戶注冊(cè)的時(shí)候錄入系統(tǒng),如表l,是用戶的姓名與電話號(hào)碼(還可以是地址信息(VOIP電話),或終端的屬性(如終端的設(shè)備標(biāo)識(shí)),或網(wǎng)絡(luò)接入鏈路信息,如虛擬局域網(wǎng)VLAN,端口號(hào)等等)和用戶的聲紋特征數(shù)據(jù)進(jìn)行關(guān)聯(lián),用戶使用網(wǎng)絡(luò)時(shí),對(duì)用戶的聲音進(jìn)行鑒定,判斷該用戶是否可以接入網(wǎng)絡(luò)或使用該業(yè)務(wù),或訪問該用戶的個(gè)人數(shù)據(jù)。表l<table>tableseeoriginaldocumentpage7</column></row><table>語音識(shí)別分析單元,還可以根據(jù)下列關(guān)系,建立快速檢索匹配,記錄用戶歷史的特征波形數(shù)據(jù),并與本次輸入信息進(jìn)行比較,如表2中所示,用戶呼叫王一奎的時(shí)候,首先將輸入的波形數(shù)據(jù)與存儲(chǔ)的歷史呼叫波形"李建","張峰""王一奎"進(jìn)行比較,因檢索數(shù)據(jù)量小,可以很快檢索出對(duì)應(yīng)波形,利用該方法還可以建立其他數(shù)據(jù)的識(shí)別??梢岳斫猓?的對(duì)應(yīng)形式和相關(guān)波形4叉為示例,并不標(biāo)識(shí)實(shí)際語音波形,和限制實(shí)際實(shí)現(xiàn)具體方式。表2<table>tableseeoriginaldocumentpage7</column></row><table><table>tableseeoriginaldocumentpage8</column></row><table>為了方便用戶數(shù)據(jù)的錄入,可以采用多種方式,如一次性將原用戶終端中的通訊簿導(dǎo)入,或用戶登錄服務(wù)網(wǎng)站上錄入通訊簿,還可以采用自動(dòng)釆集的方式進(jìn)行。當(dāng)主叫呼叫被叫的時(shí)候識(shí)別主叫用戶打出的被叫號(hào)碼,如果為新號(hào)碼,解析通話過程中被叫的名稱,并與撥出號(hào)碼或地址信息關(guān)聯(lián),后續(xù)用戶直接呼叫被叫名稱即可;識(shí)別主叫打入的主叫號(hào)碼,如果為新號(hào)碼,解析通話過程中主叫的名稱,并與號(hào)碼或地址信息關(guān)聯(lián),后續(xù)用戶直接呼叫名稱,即可聯(lián)通。圖2為本發(fā)明應(yīng)用到基于數(shù)字用戶線路XDSL的寬帶接入網(wǎng)絡(luò)的實(shí)施例,控制中心中包括了用戶的信息,用戶的信息中,包括了用戶的個(gè)人通訊簿等信息,在數(shù)字用戶線接入復(fù)用器DSLAM設(shè)備上,或接入設(shè)備的寬帶接入服務(wù)器BAS上,包括了用戶識(shí)別單元和語音識(shí)別分析單元,語音識(shí)別分析單元轉(zhuǎn)換用戶的語音信號(hào)并提取特征數(shù)據(jù),進(jìn)行本地識(shí)別,或傳送到控制中心進(jìn)行識(shí)別,用戶識(shí)別單元對(duì)用戶的權(quán)限進(jìn)行認(rèn)證和進(jìn)行鑒權(quán)。控制中心完成相關(guān)的處理,并控制軟交換中心進(jìn)行相關(guān)的連接。圖3為本發(fā)明應(yīng)用到以太網(wǎng)絡(luò)系統(tǒng)的實(shí)施例,控制中心中包括了用戶的信息,用戶的信息中,包括了用戶的個(gè)人通訊簿等信息,和網(wǎng)關(guān)設(shè)備連接的包括用戶識(shí)別單元和語音識(shí)別分析單元,語音識(shí)別分析單元轉(zhuǎn)換用戶的語音信號(hào)并提取特征數(shù)據(jù),進(jìn)行本地識(shí)別,或傳送到控制中心進(jìn)行識(shí)別,用戶識(shí)別單元對(duì)用戶的權(quán)限進(jìn)行認(rèn)證和進(jìn)行鑒權(quán)。圖4是本發(fā)明的實(shí)施例基于交換機(jī)的實(shí)現(xiàn)方式,語音識(shí)別分析單元和用戶識(shí)別單元耦合在交換機(jī)上。在上述的示例中,語音識(shí)別分析單元和用戶識(shí)別單元與控制中心分離,分別耦合在靠近用戶終端的網(wǎng)絡(luò)設(shè)備上,語音識(shí)別分析單元和用戶識(shí)別單元還可以與控制中心集成,集中到服務(wù)器中心。在通訊網(wǎng)絡(luò)和計(jì)算機(jī)網(wǎng)絡(luò),或通訊網(wǎng)絡(luò)與計(jì)算機(jī)的集成網(wǎng)絡(luò)中,集成語音識(shí)別模塊,并根據(jù)識(shí)別出的用戶指令在用戶個(gè)人的地址簿中,查詢用戶需要聯(lián)系的電話,并替用戶聯(lián)通需要撥通的電話,或執(zhí)行用戶的指令,關(guān)鍵建立了用戶的個(gè)人特征信息和個(gè)人的地址簿的關(guān)聯(lián),極大提高了識(shí)別率和執(zhí)行的效率。大規(guī)模的開展用戶的語音識(shí)別,并執(zhí)行用戶的指令信息,需要非常大的計(jì)算量,集中式的語音識(shí)別,需要巨大的服務(wù)器資源和網(wǎng)絡(luò)帶寬資源??梢栽诜?wù)器中心建立集中的識(shí)別模塊陣或識(shí)別模塊群,來進(jìn)行集中語音識(shí)別處理。圖5為本發(fā)明的實(shí)施例的分布式的語音識(shí)別框圖,原始的語音或語音數(shù)據(jù),被采樣并提取特征,采樣功能一般可以集成在終端中,特征提取功能可以集成在語音識(shí)別分析單元,端點(diǎn)檢測(cè)模塊檢測(cè)特定的端點(diǎn)用戶識(shí)別,識(shí)別模塊可以采用各種算法,根據(jù)不同的應(yīng)用要求,識(shí)別模塊可以分為多級(jí),對(duì)于簡(jiǎn)單和對(duì)安全性要求不高的執(zhí)行功能可以做一級(jí)識(shí)別后,可以由執(zhí)行單元進(jìn)行執(zhí)行,對(duì)于復(fù)雜和對(duì)安全性要求高的命令或功能,可以多級(jí)識(shí)別和鑒定認(rèn)證,還可以根據(jù)結(jié)合個(gè)人的特性數(shù)據(jù)來進(jìn)行認(rèn)證,然后執(zhí)行相關(guān)操作。雖然通過參照本發(fā)明的某些優(yōu)選實(shí)施例,已經(jīng)對(duì)本發(fā)明進(jìn)行了圖示和描述,但本領(lǐng)域的普通技術(shù)人員應(yīng)該明白,可以在形式上和細(xì)節(jié)上對(duì)其作各種各樣的改變,而不偏離所附權(quán)利要求書所限定的本發(fā)明的精神和范圍。權(quán)利要求1、一種語音識(shí)別網(wǎng)絡(luò),其特征在于,包括語音識(shí)別分析單元,該單元能夠識(shí)別用戶的語音信息;用戶信息存儲(chǔ)單元,該單元能夠存儲(chǔ)用戶的個(gè)人信息,包括用戶的聯(lián)系人,用戶的個(gè)人信息,用戶的語音信息等用戶需要存儲(chǔ)使用的信息;用戶識(shí)別單元,該單元能夠識(shí)別用戶,以判斷該用戶是否為合法用戶,是否具備訪問相關(guān)的用戶信息,所述相關(guān)的用戶信息,可以是該合法用戶本人的信息,或該合法用戶可以訪問的信息,或其他用戶允許其訪問的信息。2、一種語音識(shí)別控制方法,其特征在于,包括用戶將個(gè)人的信息輸入到網(wǎng)絡(luò)的用戶信息中;用戶使用網(wǎng)絡(luò),網(wǎng)絡(luò)中的語音識(shí)別分析單元分析用戶語言的內(nèi)容;網(wǎng)絡(luò)根據(jù)分析出的語言內(nèi)容,執(zhí)行相關(guān)的操作,如連接用戶的呼叫,根據(jù)用戶信息錄制相關(guān)信息。3、根據(jù)權(quán)利要求2所述的方法,其特征在于,包括通過登錄網(wǎng)站錄入個(gè)人信息,或用戶終端上傳本終端的地址簿。4、根據(jù)權(quán)利要求2所述的方法,其特征在于,包括識(shí)別主叫用戶打出的被叫號(hào)碼,如果為新號(hào)碼,解析通話過程中被叫的名稱,并將其與撥出號(hào)碼或地址信息關(guān)聯(lián);或識(shí)別打入的主叫號(hào)碼,如果為新號(hào)碼,解析通話過程中主叫的名稱,并將其與號(hào)碼或地址信息關(guān)聯(lián)。5、根據(jù)權(quán)利要求2所述的方法,其特征在于,包括建立用戶終端的號(hào)碼或地址信息與用戶信息之間的關(guān)聯(lián),以識(shí)別該用戶終端是否具備訪問相關(guān)數(shù)據(jù)的權(quán)利。6、根據(jù)權(quán)利要求5所述的方法,其特征在于,包括根據(jù)用戶的聲音特征,自動(dòng)識(shí)別出用戶的身份,判定該用戶是否具備使用該用戶信息的權(quán)利。7、一種語音識(shí)別方法,其特征在于,包括根據(jù)用戶信息,選擇語音分析算法和分析參數(shù)。8、根據(jù)權(quán)利要求7所述的方法,其特征在于,包括根據(jù)用戶的個(gè)人信息,調(diào)用對(duì)應(yīng)該用戶的相關(guān)語音分析軟件或設(shè)定相關(guān)的分析參數(shù)。全文摘要本發(fā)明公開了利用網(wǎng)絡(luò)設(shè)備進(jìn)行用戶語音識(shí)別的方法和系統(tǒng)與裝置,利用該方法,網(wǎng)絡(luò)識(shí)別用戶信息,分析解析用戶語音,并與用戶信息關(guān)聯(lián),進(jìn)行相關(guān)的處理,如識(shí)別用戶的呼叫,自動(dòng)分析出被叫的號(hào)碼,并自動(dòng)接通被叫,識(shí)別出用戶的語音指示,錄下用戶的談話,轉(zhuǎn)換為文字存儲(chǔ)供后續(xù)使用等功能,本發(fā)明同時(shí)公開了這種方法的系統(tǒng)和相關(guān)裝置,本發(fā)明簡(jiǎn)化了用戶終端設(shè)備的復(fù)雜度,方便了人們的使用,適合大規(guī)模應(yīng)用。文檔編號(hào)G10L15/28GK101308654SQ200710074460公開日2008年11月19日申請(qǐng)日期2007年5月14日優(yōu)先權(quán)日2007年5月14日發(fā)明者良梁申請(qǐng)人:華為技術(shù)有限公司