本發(fā)明涉及語音識別,具體涉及基于語音分析的企業(yè)數(shù)據(jù)智能管理方法。
背景技術(shù):
1、為了記錄企業(yè)每次會議的內(nèi)容,需要對企業(yè)每次會議的內(nèi)容進行錄音,然后將會議音頻傳輸?shù)狡髽I(yè)數(shù)據(jù)庫中進行保存。
2、現(xiàn)有方法中采用無損壓縮算法將會議音頻傳輸?shù)狡髽I(yè)數(shù)據(jù)庫中,以確保音頻質(zhì)量。但在大型企業(yè)中,企業(yè)會議頻繁且每次會議音頻較長,通過無損壓縮算法將會議音頻傳輸?shù)狡髽I(yè)數(shù)據(jù)庫會消耗大量資源和時間,無法將企業(yè)會議音頻進行高效的存儲。
技術(shù)實現(xiàn)思路
1、為了解決通過無損壓縮算法將會議音頻傳輸?shù)狡髽I(yè)數(shù)據(jù)庫會消耗大量資源和時間,無法將企業(yè)會議音頻進行高效存儲的技術(shù)問題,本發(fā)明的目的在于提供一種基于語音分析的企業(yè)數(shù)據(jù)智能管理方法,所采用的技術(shù)方案具體如下:
2、本發(fā)明實施例提供了一種基于語音分析的企業(yè)數(shù)據(jù)智能管理方法,該方法包括以下步驟:
3、獲取企業(yè)會議音頻,將企業(yè)會議音頻劃分為預(yù)設(shè)時長的局部音頻段;
4、根據(jù)每個局部音頻段內(nèi)會議關(guān)鍵詞的分布情況,獲取每個局部音頻段的關(guān)鍵程度;
5、根據(jù)每次企業(yè)會議內(nèi)每個發(fā)言人對應(yīng)音頻段中的會議連接詞和會議關(guān)鍵詞的分布情況,獲取每次企業(yè)會議內(nèi)每個發(fā)言人的音頻重要程度;
6、根據(jù)每個局部音頻段內(nèi)每個發(fā)言人的音頻時長和音頻重要程度,對每個局部音頻段的關(guān)鍵程度進行修正,獲取每個局部音頻段的實際關(guān)鍵程度;
7、基于實際關(guān)鍵程度確定關(guān)鍵局部音頻段和非關(guān)鍵局部音頻段,對關(guān)鍵局部音頻段和非關(guān)鍵局部音頻段分別進行壓縮傳輸管理。
8、進一步地,所述關(guān)鍵程度的獲取方法為:
9、對于任一個局部音頻段,將該局部音頻段內(nèi)所出現(xiàn)的會議關(guān)鍵詞的數(shù)量與該局部音頻段內(nèi)所有構(gòu)成詞的數(shù)量的比值,作為該局部音頻段的關(guān)鍵詞概率;
10、將該局部音頻段內(nèi)所出現(xiàn)的會議關(guān)鍵詞種類的數(shù)量與所有會議關(guān)鍵詞種類的數(shù)量的比值,作為該局部音頻段的關(guān)鍵詞相關(guān)值;
11、根據(jù)該局部音頻段的關(guān)鍵詞概率和關(guān)鍵詞相關(guān)值,獲取該局部音頻段的關(guān)鍵程度;其中,關(guān)鍵詞概率和關(guān)鍵詞相關(guān)值均與關(guān)鍵程度為正相關(guān)關(guān)系。
12、進一步地,所述音頻重要程度的獲取方法為:
13、對于任一次企業(yè)會議的任一個發(fā)言人,根據(jù)該發(fā)言人對應(yīng)音頻段的關(guān)鍵詞相關(guān)值和該發(fā)言人對應(yīng)音頻段中會議連接詞的出現(xiàn)次數(shù),獲取該發(fā)言人的音頻重要程度;其中,該發(fā)言人對應(yīng)音頻段的關(guān)鍵詞相關(guān)值和會議連接詞的出現(xiàn)次數(shù)均與音頻重要程度為正相關(guān)關(guān)系。
14、進一步地,所述實際關(guān)鍵程度的獲取方法為:
15、對于任一個局部音頻段,將該局部音頻段內(nèi)每個發(fā)言人的音頻時長在該局部音頻段內(nèi)的占比,作為每個發(fā)言人的第一特征值;
16、根據(jù)該局部音頻段內(nèi)每個發(fā)言人的第一特征值和音頻重要程度,獲取該局部音頻段內(nèi)每個發(fā)言人的重要權(quán)重;其中,第一特征值和音頻重要程度均與重要權(quán)重為正相關(guān)關(guān)系;
17、根據(jù)該局部音頻段內(nèi)每個發(fā)言人的重要權(quán)重和該局部音頻段的關(guān)鍵程度,獲取該局部音頻段的實際關(guān)鍵程度;其中,重要權(quán)重和關(guān)鍵程度均與實際關(guān)鍵程度為正相關(guān)關(guān)系。
18、進一步地,所述關(guān)鍵局部音頻段和非關(guān)鍵局部音頻段的獲取方法為:
19、當(dāng)實際關(guān)鍵程度滿足預(yù)設(shè)的關(guān)鍵程度范圍時,將對應(yīng)局部音頻段作為關(guān)鍵局部音頻段;
20、當(dāng)實際關(guān)鍵程度不滿足預(yù)設(shè)的關(guān)鍵程度范圍時,將對應(yīng)局部音頻段作為非關(guān)鍵局部音頻段。
21、進一步地,所述基于語音分析的企業(yè)數(shù)據(jù)智能管理方法還包括:
22、對于任一個關(guān)鍵局部音頻段,當(dāng)該關(guān)鍵局部音頻段相鄰的局部音頻段為非關(guān)鍵局部音頻段時,將該關(guān)鍵局部音頻段相鄰的任一個非關(guān)鍵局部音頻段作為參考音頻段;
23、獲取在該關(guān)鍵局部音頻段和參考音頻段中均存在音頻的發(fā)言人,作為參考發(fā)言人;
24、根據(jù)每個參考發(fā)言人在該關(guān)鍵局部音頻段和參考音頻段中的音頻時長,獲取每個參考發(fā)言人的第二特征值;
25、根據(jù)每個參考發(fā)言人的第二特征值、該關(guān)鍵局部音頻段和參考音頻段之間的實際關(guān)鍵程度差異,獲取該關(guān)鍵局部音頻段和參考音頻段的連貫程度;其中,第二特征值與連貫程度為正相關(guān)關(guān)系,實際關(guān)鍵程度差異與連貫程度為負(fù)相關(guān)關(guān)系;
26、當(dāng)連貫程度滿足預(yù)設(shè)的連貫程度范圍時,將參考音頻段修改為關(guān)鍵局部音頻段。
27、進一步地,所述第二特征值的獲取方法為:
28、對于任一個參考發(fā)言人,獲取該參考發(fā)言人在該關(guān)鍵局部音頻段和參考音頻段中的所有音頻時長的累加時長,作為第一時長;
29、將該關(guān)鍵局部音頻段和參考音頻段對應(yīng)時長的累加結(jié)果,作為第二時長;
30、將第一時長與第二時長的比值,作為該參考發(fā)言人的第二特征值。
31、進一步地,所述對關(guān)鍵局部音頻段和非關(guān)鍵局部音頻段分別進行壓縮傳輸管理的方法為:
32、將關(guān)鍵局部音頻段采用無損壓縮算法進行傳輸;
33、將非關(guān)鍵局部音頻段采用有損壓縮算法進行傳輸。
34、進一步地,所述會議關(guān)鍵詞和會議連接詞的獲取方法為:
35、通過人為設(shè)定每次企業(yè)會議音頻的會議關(guān)鍵詞和會議連接詞;其中,會議連接詞包括總結(jié)詞和緊急詞。
36、進一步地,通過stanford?corenlp自然語音處理工具獲取企業(yè)會議音頻中的構(gòu)成詞。
37、本發(fā)明具有如下有益效果:
38、將企業(yè)會議音頻劃分為預(yù)設(shè)時長的局部音頻段,有利于將企業(yè)會議音頻中重要的語音信息進行更完整的傳輸與保持;進而根據(jù)每個局部音頻段內(nèi)會議關(guān)鍵詞的分布情況,獲取每個局部音頻段的關(guān)鍵程度,初步判斷每個局部音頻段的重要程度,預(yù)測每個局部音頻段在傳輸過程中的壓縮情況;為了更準(zhǔn)確分析每個局部音頻段的重要程度,進一步根據(jù)每次企業(yè)會議內(nèi)每個發(fā)言人對應(yīng)音頻段中的會議連接詞和會議關(guān)鍵詞的分布情況,獲取每次企業(yè)會議內(nèi)每個發(fā)言人的音頻重要程度,確定每個發(fā)言人在企業(yè)會議中講話的重要程度,有利于后續(xù)對每個局部音頻段的關(guān)鍵程度進行準(zhǔn)確修改,準(zhǔn)確分析出每個局部音頻段內(nèi)的語音信息重要程度;進而根據(jù)每個局部音頻段內(nèi)每個發(fā)言人的音頻時長和音頻重要程度,對每個局部音頻段的關(guān)鍵程度進行修正,獲取每個局部音頻段的實際關(guān)鍵程度,準(zhǔn)確確定每個局部音頻段內(nèi)的語音信息重要程度,進而基于實際關(guān)鍵程度準(zhǔn)確確定出關(guān)鍵局部音頻段和非關(guān)鍵局部音頻段,對關(guān)鍵局部音頻段和非關(guān)鍵局部音頻段分別進行壓縮傳輸管理,將關(guān)鍵局部音頻段進行無損壓縮傳輸,將非關(guān)鍵局部音頻段進行有損壓縮傳輸,提高企業(yè)會議音頻傳輸?shù)男省⒐?jié)約傳輸企業(yè)會議音頻的資源,同時確保企業(yè)會議音頻中重要語音信息的完整性和準(zhǔn)確性。
1.一種基于語音分析的企業(yè)數(shù)據(jù)智能管理方法,其特征在于,該方法包括以下步驟:
2.如權(quán)利要求1所述的一種基于語音分析的企業(yè)數(shù)據(jù)智能管理方法,其特征在于,所述關(guān)鍵程度的獲取方法為:
3.如權(quán)利要求2所述的一種基于語音分析的企業(yè)數(shù)據(jù)智能管理方法,其特征在于,所述音頻重要程度的獲取方法為:
4.如權(quán)利要求1所述的一種基于語音分析的企業(yè)數(shù)據(jù)智能管理方法,其特征在于,所述實際關(guān)鍵程度的獲取方法為:
5.如權(quán)利要求1所述的一種基于語音分析的企業(yè)數(shù)據(jù)智能管理方法,其特征在于,所述關(guān)鍵局部音頻段和非關(guān)鍵局部音頻段的獲取方法為:
6.如權(quán)利要求1所述的一種基于語音分析的企業(yè)數(shù)據(jù)智能管理方法,其特征在于,所述基于語音分析的企業(yè)數(shù)據(jù)智能管理方法還包括:
7.如權(quán)利要求6所述的一種基于語音分析的企業(yè)數(shù)據(jù)智能管理方法,其特征在于,所述第二特征值的獲取方法為:
8.如權(quán)利要求6所述的一種基于語音分析的企業(yè)數(shù)據(jù)智能管理方法,其特征在于,所述對關(guān)鍵局部音頻段和非關(guān)鍵局部音頻段分別進行壓縮傳輸管理的方法為:
9.如權(quán)利要求1所述的一種基于語音分析的企業(yè)數(shù)據(jù)智能管理方法,其特征在于,所述會議關(guān)鍵詞和會議連接詞的獲取方法為:
10.如權(quán)利要求2所述的一種基于語音分析的企業(yè)數(shù)據(jù)智能管理方法,其特征在于,通過stanford?corenlp自然語音處理工具獲取企業(yè)會議音頻中的構(gòu)成詞。