1.一種基于llm模型的語音處理方法,其特征在于,包括:
2.如權(quán)利要求1所述的方法,其特征在于,所述將該發(fā)聲訴求文本數(shù)據(jù)與語言識別學(xué)習(xí)模型訴求標(biāo)簽庫中的訴求標(biāo)簽進(jìn)行比對分析預(yù)測,各語言識別學(xué)習(xí)模型輸出各自的預(yù)測結(jié)果的具體方法包括:
3.如權(quán)利要求2所述的方法,其特征在于:所述對特征向量進(jìn)行聚類并得到初步的聚類結(jié)果,確定聚類中心標(biāo)簽,調(diào)整聚類邊界,然后迭代更新聚類中心和邊界包括:
4.如權(quán)利要求3所述的方法,其特征在于,所述采用貪婪算法逐步調(diào)整聚類邊界,以優(yōu)化聚類結(jié)果的方法包括:
5.如權(quán)利要求3所述的方法,其特征在于:所述通過k-means算法對預(yù)處理后的標(biāo)簽特征向量進(jìn)行聚類以確定最優(yōu)的聚類數(shù)量k的方法包括:對于不同的k值運(yùn)行k-means算法,計(jì)算每個(gè)k值對應(yīng)的總平方誤差,獲取總平方誤差與k的關(guān)系圖,選擇總平均誤差下降幅度開始減小的點(diǎn)作為k值或?qū)τ诓煌膋值,獲取每個(gè)樣本的輪廓系數(shù),選擇輪廓系數(shù)平均值最高的值作為k值,或?qū)τ诿總€(gè)k值,計(jì)算k-means聚類的總平均誤差和一個(gè)參照數(shù)據(jù)集的總平均誤差,參照數(shù)據(jù)集是通過在原數(shù)據(jù)集上添加隨機(jī)噪聲生成的,然后計(jì)算兩者的差值,并選擇差值最大的作為k值。
6.如權(quán)利要求1所述的方法,其特征在于:輸入至各語言識別學(xué)習(xí)模型時(shí)需要將所述發(fā)聲訴求文本數(shù)據(jù)的格式統(tǒng)一。
7.如權(quán)利要求1所述的方法,其特征在于,根據(jù)權(quán)重信息對各語言識別學(xué)習(xí)模型輸出的預(yù)測結(jié)果進(jìn)行統(tǒng)計(jì)評分,根據(jù)評分的高低獲取最匹配的發(fā)聲訴求文本數(shù)據(jù)識別結(jié)果的具體方法包括:
8.一種基于llm模型的語音處理系統(tǒng),其特征在于,包括:
9.一種計(jì)算機(jī)存儲(chǔ)介質(zhì),其特征在于:所述計(jì)算機(jī)存儲(chǔ)介質(zhì)存儲(chǔ)有多條指令,所述指令適于由處理器加載并執(zhí)行如權(quán)利要求1-5任一項(xiàng)所述的方法步驟。
10.一種電子設(shè)備,其特征在于:包括處理器和存儲(chǔ)器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序適于由所述處理器加載并執(zhí)行如權(quán)利要求1-5任一項(xiàng)所述的方法步驟。