本發(fā)明涉及問題分類,尤其是涉及一種營銷行業(yè)基于大模型的問題分類方法及裝置、介質(zhì)、設(shè)備。
背景技術(shù):
1、在傳統(tǒng)的營銷行業(yè)中,識(shí)別和總結(jié)用戶的問題訴求,以及對(duì)用戶的問題進(jìn)行統(tǒng)計(jì)和分類都需要通過人工的方式實(shí)現(xiàn),這是一項(xiàng)重要且繁瑣的任務(wù)。通過統(tǒng)計(jì)出用戶排名靠前的一些問題,有針對(duì)性地反饋給用戶,對(duì)于改善產(chǎn)品和提高用戶體驗(yàn)有很大幫助。
技術(shù)實(shí)現(xiàn)思路
1、針對(duì)以上至少一個(gè)技術(shù)問題,本發(fā)明實(shí)施例提供一種營銷行業(yè)基于大模型的問題分類方法及裝置、介質(zhì)、設(shè)備。
2、根據(jù)第一方面,本發(fā)明實(shí)施例提供的營銷行業(yè)基于大模型的問題分類方法包括:
3、收集營銷行業(yè)的用戶反饋文檔;
4、將所述用戶反饋文檔切分為多個(gè)條目,并將所述多個(gè)條目形成條目列表;
5、將所述條目列表中的每一個(gè)條目和提示信息拼接為模型輸入內(nèi)容,將所述模型輸入內(nèi)容輸入到問題識(shí)別大模型中,得到模型識(shí)別結(jié)果;根據(jù)所述模型識(shí)別結(jié)果,確定該條目是否為問題條目,若是,則保留該條目;否則,舍棄該條目;將保留下來的各個(gè)問題條目形成問題條目列表;
6、將所述問題條目列表中的各個(gè)問題條目進(jìn)行聚類處理,得到多個(gè)問題條目組;
7、按照各個(gè)問題條目組各自包括的問題條目的數(shù)量從大到小的順序,將各個(gè)問題條目組進(jìn)行排序,得到排列后的問題條目組,并根據(jù)排序后的問題條目組,形成問題分類的有序數(shù)組。
8、在一個(gè)實(shí)施例中,所述收集營銷行業(yè)的用戶反饋文檔,包括:采集營銷行業(yè)的用戶留言、來信和客服對(duì)話,并將采集到的信息形成所述用戶反饋文檔。
9、在一個(gè)實(shí)施例中,所述將所述用戶反饋文檔切分為多個(gè)條目,包括:
10、獲取分割符列表;其中,所述分割符列表中包括多個(gè)分割符;
11、識(shí)別出所述用戶反饋文檔中存在的分割符;
12、將不連續(xù)且相距最近的每兩個(gè)分隔符之間的內(nèi)容作為一個(gè)條目從所述用戶反饋文檔中分割出來,得到多個(gè)條目;
13、從分割得到的多個(gè)條目中剔除長度小于第一長度和大于第二長度的條目;其中,所述第一長度小于所述第二長度,所述第二長度由所述問題識(shí)別大模型的輸入內(nèi)容長度閾值決定。
14、在一個(gè)實(shí)施例中,所述提示信息中包括問題識(shí)別大模型進(jìn)行問題識(shí)別的規(guī)則以及問題識(shí)別大模型進(jìn)行問題識(shí)別的示例;對(duì)應(yīng)的,所述根據(jù)所述模型識(shí)別結(jié)果,確定該條目是否為問題條目,包括:若所述問題識(shí)別大模型針對(duì)一個(gè)條目而輸出的模型識(shí)別結(jié)果為是,則該條目為問題條目。
15、在一個(gè)實(shí)施例中,所述方法還包括:將所述問題條目列表上傳至向量知識(shí)庫。
16、在一個(gè)實(shí)施例中,所述將所述問題條目列表中的各個(gè)問題條目進(jìn)行聚類處理,得到多個(gè)問題條目組,包括:
17、創(chuàng)建第一數(shù)組;其中,所述第一數(shù)組用來存儲(chǔ)排列后的最終問題條目組;
18、創(chuàng)建哈希表;
19、將每一個(gè)問題條目在所述問題條目列表中的下標(biāo)作為該問題條目的鍵,查詢所述哈希表中是否存在該問題條目的鍵;若存在,則跳過該問題條目;若不存在,則在所述向量知識(shí)庫檢索與該問題條目之間的相似度高于預(yù)設(shè)閾值的問題條目;將檢索得到的各個(gè)問題條目聚類為一個(gè)初始問題條目組;創(chuàng)建該初始問題條目組對(duì)應(yīng)的第二數(shù)組;遍歷該初始問題條目組中的每一個(gè)問題條目,將該問題條目在所述問題條目列表中的下標(biāo)作為該問題條目的鍵,查詢所述哈希表中是否存在該問題條目的鍵;若存在,則跳過該問題條目;若不存在,則將該問題條目放置在該初始問題條目組對(duì)應(yīng)的第二數(shù)組中,并將該問題條目在所述問題條目列表中的下標(biāo)放置在所述哈希表中;在遍歷完所述初始問題條目組中的所有問題條目后,將該初始問題條目組對(duì)應(yīng)的第二數(shù)組作為最終問題條目組,并每一個(gè)最終問題條目組作為一個(gè)元素添加到所述第一數(shù)組中。
20、在一個(gè)實(shí)施例中,所述按照各個(gè)問題條目組各自包括的問題條目的數(shù)量從大到小的順序,將各個(gè)問題條目組進(jìn)行排序,得到排列后的問題條目組,并根據(jù)排序后的問題條目組,形成問題分類的有序數(shù)組,包括:
21、定義所述有序數(shù)組的json格式,在所述json格式中涉及到多個(gè)字段,所述多個(gè)字段包括問題條目總數(shù)量字段、分類總數(shù)量字段以及每一個(gè)最終問題條目組的字段以及該最終問題條目組的排序位置字段和該最終問題條目組的問題條目數(shù)量字段;
22、將所述問題條目列表中的問題條目的數(shù)量賦值給所述問題條目總數(shù)量字段;將所述第一數(shù)組中元素的數(shù)量賦值為所述分類總數(shù)量字段;
23、確定所述第一數(shù)組中每一個(gè)最終問題條目組中問題條目的數(shù)量,按照各個(gè)最終問題條目組各自包括的問題條目的數(shù)量從大到小的順序,將各個(gè)最終問題條目組進(jìn)行排序;按照排列順序,將每一個(gè)最終問題條目組逐個(gè)賦值給對(duì)應(yīng)的最終問題條目組的字段,將每一個(gè)最終問題條目組的排列順序編號(hào)賦值給對(duì)應(yīng)的排序位置字段,將每一個(gè)最終問題條目組中問題條目的數(shù)量賦值給對(duì)應(yīng)的問題條目數(shù)量字段;
24、在賦值完成后,得到j(luò)son格式的有序數(shù)組。
25、根據(jù)第二方面,本發(fā)明實(shí)施例提供的營銷行業(yè)基于大模型的問題分類裝置包括:
26、文檔收集模塊,用于收集營銷行業(yè)的用戶反饋文檔;
27、文檔切分模塊,用于將所述用戶反饋文檔切分為多個(gè)條目,并將所述多個(gè)條目形成條目列表;
28、問題識(shí)別模塊,用于將所述條目列表中的每一個(gè)條目和提示信息拼接為模型輸入內(nèi)容,將所述模型輸入內(nèi)容輸入到問題識(shí)別大模型中,得到模型識(shí)別結(jié)果;根據(jù)所述模型識(shí)別結(jié)果,確定該條目是否為問題條目,若是,則保留該條目;否則,舍棄該條目;將保留下來的各個(gè)問題條目形成問題條目列表;
29、問題聚類模塊,用于將所述問題條目列表中的各個(gè)問題條目進(jìn)行聚類處理,得到多個(gè)問題條目組;
30、分類排序模塊,用于按照各個(gè)問題條目組各自包括的問題條目的數(shù)量從大到小的順序,將各個(gè)問題條目組進(jìn)行排序,得到排列后的問題條目組;并根據(jù)排序后的問題條目組,形成問題分類的有序數(shù)組。
31、根據(jù)第三方面,本發(fā)明實(shí)施例提供計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,當(dāng)所述計(jì)算機(jī)程序在計(jì)算機(jī)中執(zhí)行時(shí),令計(jì)算機(jī)執(zhí)行實(shí)現(xiàn)第一方面提供的方法。
32、根據(jù)第四方面,本發(fā)明實(shí)施例提供的計(jì)算設(shè)備,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器中存儲(chǔ)有可執(zhí)行代碼,所述處理器執(zhí)行所述可執(zhí)行代碼時(shí),實(shí)現(xiàn)第一方面提供的方法。
33、本發(fā)明實(shí)施例提供的營銷行業(yè)基于大模型的問題分類方法及裝置、介質(zhì)、設(shè)備,營銷行業(yè)的用戶反饋文檔,利用大模型識(shí)別出文檔中的用戶問題,然后對(duì)識(shí)別出的用戶問題進(jìn)行分類,按每類問題的數(shù)量排序,提供給負(fù)責(zé)營銷的相關(guān)人員,幫助改善用戶最多的問題和訴求。這種基于大模型自動(dòng)實(shí)現(xiàn)問題分類的方式,可以克服現(xiàn)有技術(shù)中人工分類的局限性和基于規(guī)則分類方法的不足,實(shí)現(xiàn)高效、準(zhǔn)確且自動(dòng)化的營銷問題識(shí)別和分類統(tǒng)計(jì)。
1.一種營銷行業(yè)基于大模型的問題分類方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述收集營銷行業(yè)的用戶反饋文檔,包括:采集營銷行業(yè)的用戶留言、來信和客服對(duì)話,并將采集到的信息形成所述用戶反饋文檔。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將所述用戶反饋文檔切分為多個(gè)條目,包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述提示信息中包括問題識(shí)別大模型進(jìn)行問題識(shí)別的規(guī)則以及問題識(shí)別大模型進(jìn)行問題識(shí)別的示例;
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將所述問題條目列表中的各個(gè)問題條目進(jìn)行聚類處理,得到多個(gè)問題條目組,包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述按照各個(gè)問題條目組各自包括的問題條目的數(shù)量從大到小的順序,將各個(gè)問題條目組進(jìn)行排序,得到排列后的問題條目組,并根據(jù)排序后的問題條目組,形成問題分類的有序數(shù)組,包括:
8.一種營銷行業(yè)基于大模型的問題分類裝置,其特征在于,包括:
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,其上存儲(chǔ)有計(jì)算機(jī)程序,當(dāng)所述計(jì)算機(jī)程序在計(jì)算機(jī)中執(zhí)行時(shí),令計(jì)算機(jī)執(zhí)行實(shí)現(xiàn)權(quán)利要求1~7中的任一項(xiàng)所述的方法。
10.一種計(jì)算設(shè)備,其特征在于,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器中存儲(chǔ)有可執(zhí)行代碼,所述處理器執(zhí)行所述可執(zhí)行代碼時(shí),實(shí)現(xiàn)權(quán)利要求1~7中的任一項(xiàng)所述的方法。