本技術(shù)涉及數(shù)據(jù)處理,特別是指一種基于大模型的半導(dǎo)體數(shù)據(jù)分析與可視化方法和裝置。
背景技術(shù):
::1、在半導(dǎo)體行業(yè)中,數(shù)據(jù)來(lái)源多樣,包括市場(chǎng)動(dòng)態(tài)、制造能力、資本支出等方面。現(xiàn)有技術(shù)通常依賴(lài)手動(dòng)數(shù)據(jù)分析和靜態(tài)報(bào)告生成,這不僅耗時(shí)且容易出錯(cuò)。傳統(tǒng)方案主要包括使用電子表格手動(dòng)分析數(shù)據(jù)和使用基本的圖表工具生成靜態(tài)圖表。這些方法缺乏自動(dòng)化和智能化,無(wú)法有效應(yīng)對(duì)快速變化的市場(chǎng)需求。2、現(xiàn)有技術(shù)采用電子表格軟件(如excel)的方法,無(wú)法處理大量數(shù)據(jù),手動(dòng)操作繁瑣,缺乏動(dòng)態(tài)分析能力;現(xiàn)有技術(shù)采用商業(yè)智能工具(如tableau、power?bi)的方法,學(xué)習(xí)曲線(xiàn)陡峭,初始設(shè)置復(fù)雜,實(shí)時(shí)數(shù)據(jù)處理能力有限;現(xiàn)有技術(shù)采用編程語(yǔ)言與數(shù)據(jù)分析庫(kù)的方法,需要編程技能,開(kāi)發(fā)時(shí)間長(zhǎng),圖表生成需要手動(dòng)編;現(xiàn)有技術(shù)采用專(zhuān)用半導(dǎo)體數(shù)據(jù)分析軟件,價(jià)格昂貴,適用范圍有限,缺乏通用性。3、可見(jiàn),在半導(dǎo)體行業(yè)中,現(xiàn)有技術(shù)中生成圖表的方法,自動(dòng)化程度低,大多數(shù)方案依賴(lài)手動(dòng)操作,效率低且易出錯(cuò);智能化不足,缺乏利用人工智能進(jìn)行深度數(shù)據(jù)挖掘和分析的能力。技術(shù)實(shí)現(xiàn)思路1、在本技術(shù)的目的是提供一種基于大模型的半導(dǎo)體數(shù)據(jù)分析與可視化方法和裝置,以解決現(xiàn)有技術(shù)中針對(duì)半導(dǎo)體負(fù)責(zé)的可研報(bào)告的自動(dòng)化生成程度低和智能化不足的問(wèn)題。2、為達(dá)到上述目的,本技術(shù)的實(shí)施例提供一種基于大模型的半導(dǎo)體數(shù)據(jù)分析與可視化方法,包括:3、利用大語(yǔ)言模型解析用戶(hù)輸入的需求信息,獲取所述需求信息所對(duì)應(yīng)的關(guān)鍵信息;所述關(guān)鍵信息包括時(shí)間信息、行業(yè)信息、指標(biāo)信息和地理信息;4、利用數(shù)據(jù)集自動(dòng)選擇算法,從預(yù)設(shè)數(shù)據(jù)庫(kù)中,確定與所述關(guān)鍵信息最相關(guān)的目標(biāo)數(shù)據(jù)集;5、根據(jù)所述需求信息和所述目標(biāo)數(shù)據(jù)集,確定所述需求信息的可視化策略;6、根據(jù)所述可視化策略和所述大語(yǔ)言模型,生成與所述可視化策略對(duì)應(yīng)的可視化代碼,并執(zhí)行所述可視化代碼自動(dòng)生成可視化圖表。7、可選地,利用數(shù)據(jù)集自動(dòng)選擇算法,從預(yù)設(shè)數(shù)據(jù)庫(kù)中,確定與所述關(guān)鍵信息最相關(guān)的目標(biāo)數(shù)據(jù)集,包括:8、初始化所述預(yù)設(shè)數(shù)據(jù)庫(kù)中的每個(gè)數(shù)據(jù)集;每個(gè)所述數(shù)據(jù)集包括多個(gè)特征信息,所述特征信息包括時(shí)間特征、行業(yè)特征、指標(biāo)類(lèi)型、地理范圍和數(shù)據(jù)可靠度;9、利用數(shù)據(jù)集自動(dòng)選擇算法,解析所述關(guān)鍵信息,確定在每個(gè)所述數(shù)據(jù)集中與所述關(guān)鍵信息對(duì)應(yīng)的所述特征信息的匹配得分和每個(gè)所述數(shù)據(jù)集的可靠性得分;10、根據(jù)每個(gè)所述特征信息的匹配得分和所述可靠性得分,進(jìn)行權(quán)重加和,計(jì)算每個(gè)所述數(shù)據(jù)集的總匹配得分;11、從所有所述數(shù)據(jù)集中選擇所述總匹配得分最高的確定為所述目標(biāo)數(shù)據(jù)集。12、可選地,根據(jù)所述需求信息和所述目標(biāo)數(shù)據(jù)集,確定所述需求信息的可視化策略前,所述方法還包括:13、提取所述目標(biāo)數(shù)據(jù)集中的目標(biāo)數(shù)據(jù);14、利用所述大語(yǔ)言模型,驗(yàn)證所述目標(biāo)數(shù)據(jù)與所述需求信息是否對(duì)應(yīng)一致;15、若所述對(duì)應(yīng)不一致,則重新獲取所述目標(biāo)數(shù)據(jù)集或者在所述目標(biāo)數(shù)據(jù)集中補(bǔ)充缺失對(duì)應(yīng)的特征,并重新執(zhí)行提取所述目標(biāo)數(shù)據(jù)集中的目標(biāo)數(shù)據(jù)的步驟;16、若所述對(duì)應(yīng)一致,則執(zhí)行根據(jù)所述需求信息和所述目標(biāo)數(shù)據(jù)集,確定所述需求信息的可視化策略的步驟。17、可選地,根據(jù)所述需求信息和所述目標(biāo)數(shù)據(jù)集,確定所述需求信息的可視化策略,包括:18、利用所述大語(yǔ)言模型,解析所述需求信息,確定所述需求信息對(duì)應(yīng)的用戶(hù)意圖;19、利用所述大語(yǔ)言模型,提取所述目標(biāo)數(shù)據(jù)集中的可視化參數(shù);20、根據(jù)所述用戶(hù)意圖和所述可視化參數(shù),利用所述大語(yǔ)言模型,選擇可視化圖表類(lèi)型和顏色方案;21、根據(jù)所述可視化圖表類(lèi)型和顏色方案,確定所述需求信息的可視化策略。22、可選地,根據(jù)所述可視化策略和所述大語(yǔ)言模型,生成與所述可視化策略對(duì)應(yīng)的可視化代碼,并執(zhí)行所述可視化代碼自動(dòng)生成可視化圖表,包括:23、對(duì)所述可視化策略進(jìn)行語(yǔ)義意圖理解,獲取需要生成的可視化圖表的多個(gè)圖表屬性和多個(gè)指標(biāo);24、根據(jù)多個(gè)所述圖表屬性、多個(gè)所述指標(biāo)和所述大語(yǔ)言模型進(jìn)行代碼生成處理,動(dòng)態(tài)生成與所述可視化策略對(duì)應(yīng)的可視化代碼;25、執(zhí)行所述可視化代碼,以繪制所述可視化策略所對(duì)應(yīng)的可視化圖表。26、可選地,生成與所述可視化策略對(duì)應(yīng)的可視化代碼后,所述方法還包括:27、對(duì)所述可視化代碼進(jìn)行測(cè)試,在測(cè)試結(jié)果不通過(guò)時(shí),對(duì)用戶(hù)展示測(cè)試失敗原因;28、若所述測(cè)試失敗原因?yàn)榇a原因,利用所述大語(yǔ)言模型,結(jié)合失敗代碼的上下文,對(duì)失敗代碼重新生成目標(biāo)代碼;29、重新對(duì)全文的可視化代碼進(jìn)行測(cè)試,在測(cè)試結(jié)果仍不通過(guò)時(shí),響應(yīng)于用戶(hù)輸入的代碼請(qǐng)求,生成新的可視化代碼并重新驗(yàn)證。30、可選地,所述方法還包括:31、將所述可視化圖表顯示給所述用戶(hù);32、按照預(yù)設(shè)周期,獲取所述用戶(hù)與所述可視化圖表之間的交互數(shù)據(jù);33、根據(jù)所述交互數(shù)據(jù),對(duì)所述可視化策略進(jìn)行調(diào)整;34、根據(jù)調(diào)整后的可視化策略,獲取優(yōu)化后的可視化圖表,并將優(yōu)化后的可視化圖表顯示給所述用戶(hù)。35、為達(dá)上述目的,本技術(shù)實(shí)施例還提供一種基于大模型的半導(dǎo)體數(shù)據(jù)分析與可視化裝置,包括:36、第一處理模塊,用于利用大語(yǔ)言模型解析用戶(hù)輸入的需求信息,獲取所述需求信息所對(duì)應(yīng)的關(guān)鍵信息;所述關(guān)鍵信息包括時(shí)間信息、行業(yè)信息、指標(biāo)信息和地理信息;37、第一確定模塊,用于利用數(shù)據(jù)集自動(dòng)選擇算法,從預(yù)設(shè)數(shù)據(jù)庫(kù)中,確定與所述關(guān)鍵信息最相關(guān)的目標(biāo)數(shù)據(jù)集;38、第二確定模塊,用于根據(jù)所述需求信息和所述目標(biāo)數(shù)據(jù)集,確定所述需求信息的可視化策略;39、第二處理模塊,用于根據(jù)所述可視化策略和所述大語(yǔ)言模型,生成與所述可視化策略對(duì)應(yīng)的可視化代碼,并執(zhí)行所述可視化代碼自動(dòng)生成可視化圖表。40、為達(dá)上述目的,本技術(shù)實(shí)施例還提供一種可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有程序或指令,所述程序或指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上所述的方法中的步驟。41、為達(dá)上述目的,本技術(shù)實(shí)施例還提供一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)指令,所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上所述的方法的步驟。42、本技術(shù)的上述技術(shù)方案的有益效果如下:43、本技術(shù)實(shí)施例中,利用大語(yǔ)言模型解析用戶(hù)輸入的需求信息,獲取所述需求信息所對(duì)應(yīng)的關(guān)鍵信息;所述關(guān)鍵信息包括時(shí)間信息、行業(yè)信息、指標(biāo)信息和地理信息;利用數(shù)據(jù)集自動(dòng)選擇算法,從預(yù)設(shè)數(shù)據(jù)庫(kù)中,確定與所述關(guān)鍵信息最相關(guān)的目標(biāo)數(shù)據(jù)集;根據(jù)所述需求信息和所述目標(biāo)數(shù)據(jù)集,確定所述需求信息的可視化策略;根據(jù)所述可視化策略和所述大語(yǔ)言模型,生成與所述可視化策略對(duì)應(yīng)的可視化代碼,并執(zhí)行所述可視化代碼自動(dòng)生成可視化圖表。本技術(shù)的方案,解決了半導(dǎo)體可研報(bào)告中復(fù)雜數(shù)據(jù)的自動(dòng)化分析與可視化難題,支持動(dòng)態(tài)數(shù)據(jù)展示,提升數(shù)據(jù)可視化效果。當(dāng)前第1頁(yè)12當(dāng)前第1頁(yè)12