本發(fā)明涉及人工智能,尤其涉及一種基于ai智能生成技術(shù)的語音交互體驗(yàn)測(cè)評(píng)方法。
背景技術(shù):
1、隨著人工智能技術(shù)的發(fā)展,自然語音交互已經(jīng)成為人機(jī)交互的重要方式,自然語音交互系統(tǒng)通過語音識(shí)別、語義理解、對(duì)話管理、文本生成等技術(shù),實(shí)現(xiàn)了用戶與計(jì)算機(jī)之間的自然語言交流。然而,在自然語音交互系統(tǒng)的發(fā)展過程中,用戶體驗(yàn)成為了制約其進(jìn)一步推廣和應(yīng)用的關(guān)鍵因素。在實(shí)際應(yīng)用中,自然語音交互系統(tǒng)的用戶體驗(yàn)受到諸多因素的影響,如識(shí)別準(zhǔn)確性、響應(yīng)速度、語境理解能力、表達(dá)自然度、用戶滿意度等?,F(xiàn)有的測(cè)評(píng)方法往往僅關(guān)注某一方面的性能指標(biāo),無法全面、準(zhǔn)確地評(píng)估自然語音交互系統(tǒng)的用戶體驗(yàn),并且由于大部分使用人工測(cè)評(píng)的方式,使得測(cè)評(píng)工作的效率較低,操作過程較難統(tǒng)一規(guī)范。因此,如何構(gòu)建一個(gè)高效的、準(zhǔn)確的、規(guī)范的語音交互體驗(yàn)測(cè)評(píng)方法,成為了一個(gè)亟待解決的技術(shù)問題。
2、現(xiàn)有技術(shù)中,關(guān)于交互用戶體驗(yàn)測(cè)評(píng)的方法主要有以下兩種:第一種是基于主觀評(píng)價(jià)的方法:這種方法通常邀請(qǐng)用戶對(duì)自然語言交互系統(tǒng)的性能進(jìn)行主觀評(píng)分,雖然這種方法能夠反映用戶的真實(shí)感受,但受主觀因素影響較大,結(jié)果可能存在較大偏差。第二種是基于客觀性能指標(biāo)的方法:這種方法通過測(cè)試自然語言交互系統(tǒng)的各項(xiàng)性能指標(biāo),如識(shí)別準(zhǔn)確性、響應(yīng)速度等,來評(píng)估用戶體驗(yàn)。然而,這種方法無法充分反映用戶在實(shí)際使用過程中的感受。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供一種基于ai智能生成技術(shù)的語音交互體驗(yàn)測(cè)評(píng)方法,通過人工智能的方式生成文字語料并轉(zhuǎn)化為語音任務(wù),減少了準(zhǔn)備測(cè)評(píng)材料的人工成本和時(shí)間,自動(dòng)化的測(cè)評(píng)流程可以快速執(zhí)行,顯著提高了測(cè)評(píng)效率;通過智能技術(shù)對(duì)語音交互過程文件分析和測(cè)評(píng),可以客觀地、準(zhǔn)確地評(píng)估用戶體驗(yàn),從而有助于改善用戶體驗(yàn)。
2、為達(dá)到上述目的,本發(fā)明采用如下技術(shù)方案:
3、本發(fā)明提供一種基于ai智能生成技術(shù)的語音交互體驗(yàn)測(cè)評(píng)方法,包括:
4、根據(jù)測(cè)試目標(biāo)與體驗(yàn)任務(wù),生成多個(gè)文字語料。
5、將各所述文字語料轉(zhuǎn)化為語音任務(wù)。
6、將各所述語音任務(wù)發(fā)送給被測(cè)對(duì)象,獲取所述被測(cè)對(duì)象的語音應(yīng)答,并錄制語音交互過程。
7、對(duì)所述語音交互過程文件進(jìn)行分析和測(cè)評(píng)。
8、進(jìn)一步的,所述的基于ai智能生成技術(shù)的語音交互體驗(yàn)測(cè)評(píng)方法,根據(jù)測(cè)試目標(biāo)與體驗(yàn)任務(wù),生成多個(gè)文字語料,包括:
9、根據(jù)測(cè)試目標(biāo)與體驗(yàn)任務(wù),利用ai大模型或aigc技術(shù)生成多個(gè)文字語料。
10、進(jìn)一步的,所述的基于ai智能生成技術(shù)的語音交互體驗(yàn)測(cè)評(píng)方法,將各所述文字語料轉(zhuǎn)化為語音任務(wù),包括:
11、使用tts技術(shù)將各所述文字語料轉(zhuǎn)化為語音任務(wù)。
12、進(jìn)一步的,所述的基于ai智能生成技術(shù)的語音交互體驗(yàn)測(cè)評(píng)方法,所述tts技術(shù)包括:
13、所述tts技術(shù)為google?tts或amazon?polly或microsoft?azure?tts。
14、進(jìn)一步的,所述的基于ai智能生成技術(shù)的語音交互體驗(yàn)測(cè)評(píng)方法,使用tts技術(shù)將各所述文字語料轉(zhuǎn)化為語音任務(wù),包括:
15、對(duì)所述文字語料進(jìn)行預(yù)處理。
16、將預(yù)處理后所述文字語料轉(zhuǎn)化為所述語音任務(wù)。
17、調(diào)整所述語音任務(wù)的聲音參數(shù)。
18、進(jìn)一步的,所述的基于ai智能生成技術(shù)的語音交互體驗(yàn)測(cè)評(píng)方法,所述測(cè)試目標(biāo)包括:
19、所述測(cè)試目標(biāo)包含但不限于評(píng)估語音識(shí)別的準(zhǔn)確性、驗(yàn)證多輪對(duì)話的處理能力、檢查在嘈雜環(huán)境下的性能、確定對(duì)不同方言或口音的適應(yīng)性和測(cè)試對(duì)特定領(lǐng)域知識(shí)的理解能力。
20、進(jìn)一步的,所述的基于ai智能生成技術(shù)的語音交互體驗(yàn)測(cè)評(píng)方法,所述體驗(yàn)任務(wù)包括:
21、所述體驗(yàn)任務(wù)包含但不限于模擬用戶交互、用戶滿意度、用戶交互流暢度、系統(tǒng)穩(wěn)定性和系統(tǒng)可靠性。
22、進(jìn)一步的,所述的基于ai智能生成技術(shù)的語音交互體驗(yàn)測(cè)評(píng)方法,所述被測(cè)對(duì)象包括:
23、所述被測(cè)對(duì)象為語音助手或聊天機(jī)器人或語音識(shí)別系統(tǒng)。
24、進(jìn)一步的,所述的基于ai智能生成技術(shù)的語音交互體驗(yàn)測(cè)評(píng)方法,對(duì)所述語音交互過程文件進(jìn)行分析和測(cè)評(píng),包括:
25、對(duì)所述語音交互過程文件的音頻和語義進(jìn)行分析和測(cè)評(píng)。
26、本發(fā)明提供一種基于ai智能生成技術(shù)的語音交互體驗(yàn)測(cè)評(píng)方法,包括:根據(jù)測(cè)試目標(biāo)與體驗(yàn)任務(wù),生成多個(gè)文字語料;將各文字語料轉(zhuǎn)化為語音任務(wù);將各語音任務(wù)發(fā)送給被測(cè)對(duì)象,獲取被測(cè)對(duì)象的語音應(yīng)答,并錄制語音交互過程;對(duì)語音交互過程文件進(jìn)行分析和測(cè)評(píng),相比于現(xiàn)有技術(shù),本發(fā)明通過人工智能的方式生成文字語料并轉(zhuǎn)化為語音任務(wù),減少了準(zhǔn)備測(cè)評(píng)材料的人工成本和時(shí)間,自動(dòng)化的測(cè)評(píng)流程可以快速執(zhí)行,顯著提高了測(cè)評(píng)效率;通過對(duì)語音交互過程文件分析和測(cè)評(píng),可以客觀地、準(zhǔn)確地評(píng)估用戶體驗(yàn),從而有助于改善用戶體驗(yàn)。
1.一種基于ai智能生成技術(shù)的語音交互體驗(yàn)測(cè)評(píng)方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的基于ai智能生成技術(shù)的語音交互體驗(yàn)測(cè)評(píng)方法,其特征在于,根據(jù)測(cè)試目標(biāo)與體驗(yàn)任務(wù),生成多個(gè)文字語料,包括:
3.根據(jù)權(quán)利要求1所述的基于ai智能生成技術(shù)的語音交互體驗(yàn)測(cè)評(píng)方法,其特征在于,將各所述文字語料轉(zhuǎn)化為語音任務(wù),包括:
4.根據(jù)權(quán)利要求3所述的基于ai智能生成技術(shù)的語音交互體驗(yàn)測(cè)評(píng)方法,其特征在于,所述tts技術(shù)包括:
5.根據(jù)權(quán)利要求3所述的基于ai智能生成技術(shù)的語音交互體驗(yàn)測(cè)評(píng)方法,其特征在于,使用tts技術(shù)將各所述文字語料轉(zhuǎn)化為語音任務(wù),包括:
6.根據(jù)權(quán)利要求1所述的基于ai智能生成技術(shù)的語音交互體驗(yàn)測(cè)評(píng)方法,其特征在于,所述測(cè)試目標(biāo)包括:
7.根據(jù)權(quán)利要求1所述的基于ai智能生成技術(shù)的語音交互體驗(yàn)測(cè)評(píng)方法,其特征在于,所述體驗(yàn)任務(wù)包括:
8.根據(jù)權(quán)利要求1所述的基于ai智能生成技術(shù)的語音交互體驗(yàn)測(cè)評(píng)方法,其特征在于,所述被測(cè)對(duì)象包括:
9.根據(jù)權(quán)利要求1所述的基于ai智能生成技術(shù)的語音交互體驗(yàn)測(cè)評(píng)方法,其特征在于,對(duì)所述語音交互過程文件進(jìn)行分析和測(cè)評(píng),包括: