1.一種基于c-adapter適配器的多模型語音識別方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的一種基于c-adapter適配器的多模型語音識別方法,其特征在于,所述步驟:通過聲學(xué)編碼器對所述原始語音信號進(jìn)行特征提取,獲取語音特征信息;包括:
3.根據(jù)權(quán)利要求2所述的一種基于c-adapter適配器的多模型語音識別方法,其特征在于,所述步驟:通過聲學(xué)編碼器對所述原始語音信號進(jìn)行特征提取,獲取語音特征信息;包括:
4.根據(jù)權(quán)利要求1所述的一種基于c-adapter適配器的多模型語音識別方法,其特征在于,所述步驟:c-adapter適配器根據(jù)所述語音特征信息進(jìn)行下采樣和一維卷積處理,獲取低維特征信息,并通過多頭注意力層對所述低維特征信息進(jìn)行注意力機(jī)制調(diào)整,獲取加權(quán)特征信息,進(jìn)行歸一化處理和特征增強(qiáng),生成模態(tài)適應(yīng)特征信息映射到語音識別空間中;包括:
5.根據(jù)權(quán)利要求4所述的一種c-adapter適配器的多模型語音識別方法,其特征在于,所述步驟:c-adapter適配器根據(jù)所述語音特征信息進(jìn)行下采樣和一維卷積處理,獲取低維特征信息,并通過多頭注意力層對所述低維特征信息進(jìn)行注意力機(jī)制調(diào)整,獲取加權(quán)特征信息,進(jìn)行歸一化處理和特征增強(qiáng),生成模態(tài)適應(yīng)特征信息映射到語音識別空間中;包括:
6.根據(jù)權(quán)利要求5所述的一種c-adapter適配器的多模型語音識別方法,其特征在于,所述步驟:基于一維卷積神經(jīng)網(wǎng)絡(luò),對所述語音特征采樣信號進(jìn)行特征壓縮,獲取低維特征信息;包括:
7.根據(jù)權(quán)利要求1所述的一種c-adapter適配器的多模型語音識別方法,其特征在于,所述步驟:設(shè)置語音識別任務(wù)字符,通過文本向量模型將所述語音識別任務(wù)字符映射到語音識別空間,構(gòu)建文本任務(wù)表征信息;包括:
8.根據(jù)權(quán)利要求1所述的一種c-adapter適配器的多模型語音識別方法,其特征在于,所述步驟:通過大語言模型對所述語音待識別信息進(jìn)行識別,獲取語音識別結(jié)果;包括: