基于人工智能的聲紋認(rèn)證方法以及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及登錄認(rèn)證技術(shù)領(lǐng)域,尤其設(shè)及一種基于人工智能(Adif icial Intelligence,簡稱為AI)的聲紋認(rèn)證方法W及裝置。
【背景技術(shù)】
[0002] 目前的網(wǎng)站(或設(shè)備)登錄系統(tǒng)主要是通過用戶輸入賬戶和密碼(或手勢動作)進(jìn) 行身份驗證,驗證通過之后進(jìn)行登錄。然而,基于密碼及手勢輸入的登錄方式,一旦密碼或 手勢被他人得知,同樣可W完成登錄操作,導(dǎo)致存在安全隱患,并且,為了增加安全性,用戶 通常需要為不同的對象設(shè)置不同的且?guī)в刑厥庾址拿艽a,但運無疑給用戶帶來較大的記 憶負(fù)擔(dān)。
[0003] 因此,如何在保證登錄密碼正確的情況下確保登錄用戶是用戶本人的同時,又能 簡化用戶登錄操作已經(jīng)成為亟待解決的問題。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的旨在至少在一定程度上解決上述的技術(shù)問題之一。
[0005] 為此,本發(fā)明的第一個目的在于提出一種基于人工智能的聲紋認(rèn)證方法。該方法 在注冊的過程中,通過先獲取該用戶的性別標(biāo)簽,之后根據(jù)該性別標(biāo)簽使用不同的模型W 生成對應(yīng)的注冊聲紋模型,使得在登錄時提高了聲紋密碼作為認(rèn)證手段的可用性,提高了 聲紋匹配的性能,并使得用戶通過語音即可完成注冊,簡化了用戶的操作步驟。
[0006] 本發(fā)明的第二個目的在于提出一種基于人工智能的聲紋認(rèn)證裝置。
[0007] 為達(dá)上述目的,本發(fā)明第一方面實施例的基于人工智能的聲紋認(rèn)證方法,包括:接 收用戶的注冊請求,并將注冊字符串提供至所述用戶;接收所述用戶閱讀所述注冊字符串 的語音信息,并根據(jù)所述語音信息生成N段語音,其中,N為正整數(shù);根據(jù)性別分類模型和所 述N段語音確定所述用戶的性別標(biāo)簽;W及根據(jù)所述性別標(biāo)簽和所述N段語音生成所述用戶 的注冊聲紋模型。
[000引本發(fā)明實施例的基于人工智能的聲紋認(rèn)證方法,可先接收用戶的注冊請求,并將 注冊字符串提供至用戶,之后,可接收用戶閱讀注冊字符串的語音信息,并根據(jù)語音信息生 成N段語音,然后,根據(jù)性別分類模型和N段語音確定用戶的性別標(biāo)簽,最后,根據(jù)性別標(biāo)簽 和N段語音生成用戶的注冊聲紋模型。實現(xiàn)了用戶可W通過語音即可完成注冊,簡化了用戶 的操作步驟,并且,在注冊的過程中,通過先獲取該用戶的性別標(biāo)簽,之后根據(jù)該性別標(biāo)簽 使用不同的模型W生成對應(yīng)的注冊聲紋模型,使得在登錄時提高了聲紋密碼作為認(rèn)證手段 的可用性,提高了聲紋匹配的性能。
[0009]為達(dá)上述目的,本發(fā)明第二方面實施例的基于人工智能的聲紋認(rèn)證裝置,包括:第 一接收模塊,用于接收用戶的注冊請求;第一提供模塊,用于將注冊字符串提供至所述用 戶;第二接收模塊,用于接收所述用戶閱讀所述注冊字符串的語音信息;第一生成模塊,用 于根據(jù)所述語音信息生成N段語音,其中,N為正整數(shù);確定模塊,用于根據(jù)性別分類模型和 所述N段語音確定所述用戶的性別標(biāo)簽;W及第二生成模塊,用于根據(jù)所述性別標(biāo)簽和所述 N段語音生成所述用戶的注冊聲紋模型。
[0010] 本發(fā)明實施例的基于人工智能的聲紋認(rèn)證裝置,通過第一接收模塊接收用戶的注 冊請求,第一提供模塊將注冊字符串提供至用戶,第二接收模塊接收用戶閱讀注冊字符串 的語音信息,第一生成模塊根據(jù)語音信息生成N段語音,確定模塊根據(jù)性別分類模型和N段 語音確定用戶的性別標(biāo)簽,第二生成模塊根據(jù)性別標(biāo)簽和N段語音生成用戶的注冊聲紋模 型。實現(xiàn)了用戶可W通過語音即可完成注冊,簡化了用戶的操作步驟,并且,在注冊的過程 中,通過先獲取該用戶的性別標(biāo)簽,之后根據(jù)該性別標(biāo)簽使用不同的模型W生成對應(yīng)的注 冊聲紋模型,使得在登錄時提高了聲紋密碼作為認(rèn)證手段的可用性,提高了聲紋匹配的性 能。
[0011] 本發(fā)明附加的方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變 得明顯,或通過本發(fā)明的實踐了解到。
【附圖說明】
[0012] 本發(fā)明上述的和/或附加的方面和優(yōu)點從下面結(jié)合附圖對實施例的描述中將變得 明顯和容易理解,其中,
[0013] 圖1是根據(jù)本發(fā)明一個實施例的基于人工智能的聲紋認(rèn)證方法的流程圖;
[0014] 圖2是根據(jù)本發(fā)明一個具體實施例的基于人工智能的聲紋認(rèn)證方法的流程圖;
[0015] 圖3是根據(jù)本發(fā)明一個實施例的基于人工智能的聲紋認(rèn)證裝置的結(jié)構(gòu)框圖;
[0016] 圖4是根據(jù)本發(fā)明一個實施例的第二生成模塊的結(jié)構(gòu)框圖;
[0017] 圖5是根據(jù)本發(fā)明另一個實施例的基于人工智能的聲紋認(rèn)證裝置的結(jié)構(gòu)框圖;W 及
[0018] 圖6是根據(jù)本發(fā)明一個實施例的驗證模塊的結(jié)構(gòu)框圖。
【具體實施方式】
[0019] 下面詳細(xì)描述本發(fā)明的實施例,所述實施例的示例在附圖中示出,其中自始至終 相同或類似的標(biāo)號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附 圖描述的實施例是示例性的,旨在用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。
[0020] 下面參考附圖描述根據(jù)本發(fā)明實施例的基于人工智能的聲紋認(rèn)證方法W及裝置。
[0021] 圖1是根據(jù)本發(fā)明一個實施例的基于人工智能的聲紋認(rèn)證方法的流程圖。如圖1所 示,該基于人工智能的聲紋認(rèn)證方法可W包括:
[0022] S101,接收用戶的注冊請求,并將注冊字符串提供至用戶。
[0023] 舉例而言,假設(shè)本發(fā)明實施例的基于人工智能的聲紋認(rèn)證方法應(yīng)用于網(wǎng)站登錄系 統(tǒng)中,當(dāng)用戶打開網(wǎng)站準(zhǔn)備注冊時,用戶可通過客戶端向登錄系統(tǒng)發(fā)送注冊請求,登錄系統(tǒng) 在接收到用戶通過客戶端發(fā)送的注冊請求之后,可隨機(jī)生成一個注冊字符串,并將該注冊 字符串提供給用戶。
[0024] 可W理解,該注冊字符串的形式可W有很多種:
[0025] 作為一種示例,該注冊字符串可為隨機(jī)生成的數(shù)字串。此外,為了能夠覆蓋更大的 樣本空間,注冊字符串中的數(shù)字只出現(xiàn)一次。
[0026] 作為另一種示例,該注冊字符串可為隨機(jī)生成的漢字字符串。
[0027] S102,接收用戶閱讀注冊字符串的語音信息,并根據(jù)語音信息生成N段語音,其中, N為正整數(shù)。
[0028] 具體地,在將該注冊字符串提供給用戶之后,用戶可按照提供的注冊字符串進(jìn)行 朗讀W進(jìn)行注冊。在用戶閱讀該注冊字符串的過程中,或者在用戶完成閱讀該注冊字符串 時,可接收用戶按照提供的注冊字符串進(jìn)行朗讀而生成的語音信息,并對該語音信息進(jìn)行 分段,W得到N段語音。
[0029] S103,根據(jù)性別分類模型和N段語音確定用戶的性別標(biāo)簽。
[0030] 具體而言,在本發(fā)明的實施例中,可根據(jù)性別分類模型對該N段語音中的第一段語 音進(jìn)行性別分類,得到該用戶的性別標(biāo)簽。
[0031] 例如,假設(shè)本發(fā)明實施例的基于人工智能的聲紋認(rèn)證方法應(yīng)用于網(wǎng)站登錄系統(tǒng) 中,該登錄系統(tǒng)中具有語音識別模塊和性別分類模型,可通過性別分類模型對該N段語音中 的第一段語音進(jìn)行性別分類,得到該用戶的性別標(biāo)簽,其中,該性別標(biāo)簽包括男性或女性。
[0032] 舉例而言,W性別分類模型為高斯混合模型為例,可先對該N段語音中的第一段語 音提取基頻特征W及梅爾頻率倒譜系數(shù)MFCC特征,之后,可基于高斯混合模型對基頻特征 W及MFCC特征進(jìn)行后驗概率值計算,根據(jù)計算結(jié)果確定該用戶的性別,例如,假設(shè)該高斯混 合模型為男性高斯混合模型,則當(dāng)計算結(jié)果為后驗概率值很高,如大于一定闊值時,可確定 該用戶的性別為男性,當(dāng)計算結(jié)果為后驗概率值很小,如小于一定闊值時,可確定該用戶的 性別為女性。
[0033] S104,根據(jù)性別標(biāo)簽和N段語音生成用戶的注冊聲紋模型。
[0034] 具體而言,在本發(fā)明的實施例中,可根據(jù)性別標(biāo)簽確定對應(yīng)的目標(biāo)普通背景模型 UBM,之后,可將N段語音的聲紋特征在目標(biāo)普通背景模型UBM條件下進(jìn)行Baum-Welch統(tǒng)計, 并提取N段語音的N個ivector,最后,根據(jù)N段語音的N個ivector生成用戶的注冊聲紋模型。
[0035] 更具體地,可根據(jù)性別標(biāo)簽確定與該性別標(biāo)簽對應(yīng)的目標(biāo)普通背景模型UBM,之 后,可將每段語音的聲學(xué)特征(例如MFCC)在該目標(biāo)普通背景模型UBM條件下進(jìn)行Baum- Welch統(tǒng)計