1.一種基于語音交互的數(shù)據(jù)分析系統(tǒng),包括語音識別特征提取模塊、語音匹配文本轉(zhuǎn)換模塊、文本錯誤組合檢測模塊,其特征在于:所述語音識別特征提取模塊用于基于視頻文件中的語音交互進(jìn)行語音識別特征的提??;所述語音匹配文本轉(zhuǎn)換模塊用于進(jìn)行語音匹配文本的轉(zhuǎn)換;所述文本錯誤組合檢測模塊用于對轉(zhuǎn)換匹配的領(lǐng)域文本進(jìn)行錯誤組合檢測。
2.根據(jù)權(quán)利要求1所述的一種基于語音交互的數(shù)據(jù)分析系統(tǒng),其特征在于:所述語音識別特征提取模塊包括:語音流過濾切分模塊、特征向量模塊、語音幀分類模塊、特征序列生成模塊,所述語音流過濾切分模塊用于從視頻文件對應(yīng)的語音流中過濾切分出語音交互片段和靜音片段;所述特征向量模塊用于利用特征向量表示每一幀的語音信號;所述語音幀分類模塊用于將語音交互片段按分段的時間進(jìn)行幀分類;所述特征序列生成模塊用于利用語音交互序列與歷史輸出字符進(jìn)行特征序列的迭代。
3.根據(jù)權(quán)利要求2所述的一種基于語音交互的數(shù)據(jù)分析系統(tǒng),其特征在于:所述語音匹配文本轉(zhuǎn)換模塊包括:文本序列轉(zhuǎn)化模塊、補充特征添加模塊、表征向量提取模塊、字符特征轉(zhuǎn)換模塊,所述文本序列轉(zhuǎn)化模塊用于利用語言模型將單元序列轉(zhuǎn)化為文本序列;所述補充特征添加模塊用于在聲學(xué)特征序列中加入補充特征;所述表征向量提取模塊用于對轉(zhuǎn)換后的待處理的文本進(jìn)行包含原信息的表征向量的提??;所述字符特征轉(zhuǎn)換模塊用于對輸出的向量進(jìn)行音字特征轉(zhuǎn)換并生成轉(zhuǎn)換結(jié)果。
4.根據(jù)權(quán)利要求3所述的一種基于語音交互的數(shù)據(jù)分析系統(tǒng),其特征在于:所述文本錯誤組合檢測模塊包括:文本特征轉(zhuǎn)換模型模塊、文本錯誤點檢測模塊、匹配文本比較模塊、正確文本替換輸出模塊,所述文本特征轉(zhuǎn)換模型模塊用于采用深度上下文信息的文本特征轉(zhuǎn)換模型;所述文本錯誤點檢測模塊用于根據(jù)輸出的錯誤點候選集利用領(lǐng)域語料訓(xùn)練模型對每個錯誤點進(jìn)行檢查;所述匹配文本比較模塊用于依次比較候選語段匹配文本與期望語段匹配文本長度的關(guān)聯(lián)度;所述正確文本替換輸出模塊用于利用權(quán)重最高的字詞替代當(dāng)前待糾錯文本中錯誤字詞,并輸出替換的正確文本。
5.根據(jù)權(quán)利要求4所述的一種基于語音交互的數(shù)據(jù)分析系統(tǒng),其特征在于:所述系統(tǒng)的運行方法包括以下步驟:
6.根據(jù)權(quán)利要求5所述的一種基于語音交互的數(shù)據(jù)分析系統(tǒng),其特征在于:所述基于視頻文件中的語音交互進(jìn)行語音識別特征的提取的方法包括:
7.根據(jù)權(quán)利要求6所述的一種基于語音交互的數(shù)據(jù)分析系統(tǒng),其特征在于:所述進(jìn)行語音匹配文本的轉(zhuǎn)換的方法包括以下流程:
8.根據(jù)權(quán)利要求7所述的一種基于語音交互的數(shù)據(jù)分析系統(tǒng),其特征在于:所述根據(jù)提取的語音識別特征轉(zhuǎn)換后的文本匹配領(lǐng)域庫的方法流程包括:
9.根據(jù)權(quán)利要求8所述的一種基于語音交互的數(shù)據(jù)分析系統(tǒng),其特征在于:所述對轉(zhuǎn)換匹配的領(lǐng)域文本進(jìn)行錯誤組合檢測的方法包括:
10.根據(jù)權(quán)利要求9所述的一種基于語音交互的數(shù)據(jù)分析系統(tǒng),其特征在于:所述根據(jù)錯誤組合檢測篩選出正確匹配的文本包括:將待糾錯文本中經(jīng)過錯誤判斷機制判定的疑似錯字輸入到模型中,通過模型推理預(yù)測該錯字或錯詞在語音轉(zhuǎn)換匹配錯誤前的正確字或詞,將所有的正確字詞組合起來構(gòu)成語音匹配轉(zhuǎn)換領(lǐng)域文本糾錯的候選字列表;