本發(fā)明涉及數(shù)據(jù)處理。更具體地,本發(fā)明涉及一種基于人工智能的自助購(gòu)票人機(jī)交互方法及系統(tǒng)。
背景技術(shù):
1、人工智能在自助購(gòu)票人機(jī)交互中依托自然語(yǔ)言處理、機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺(jué)、智能對(duì)話系統(tǒng)和動(dòng)態(tài)定價(jià)等技術(shù),使系統(tǒng)能夠理解用戶的語(yǔ)音和文本輸入,分析用戶行為,提供個(gè)性化推薦和實(shí)時(shí)定價(jià),同時(shí)通過(guò)身份驗(yàn)證和情感分析提升安全性和用戶體驗(yàn)。這些技術(shù)共同優(yōu)化了購(gòu)票流程的智能化和效率。在自助購(gòu)票系統(tǒng)中,用戶購(gòu)票風(fēng)險(xiǎn)評(píng)估利用人工智能算法,如局部離群因子(lof)算法、孤立森林(isolation?forest)算法等分析購(gòu)票行為,識(shí)別潛在的欺詐、違規(guī)或其他異常行為。這一功能的實(shí)現(xiàn)不僅依賴于先進(jìn)的算法和技術(shù),還需要綜合考慮用戶體驗(yàn)和業(yè)務(wù)需求。系統(tǒng)需要在準(zhǔn)確檢測(cè)異常行為的同時(shí),盡量減少誤報(bào)率,以避免對(duì)正常用戶的購(gòu)票體驗(yàn)造成干擾。這要求系統(tǒng)在設(shè)計(jì)和實(shí)現(xiàn)過(guò)程中,既要具備強(qiáng)大的數(shù)據(jù)處理和分析能力,又要能夠靈活適應(yīng)不同場(chǎng)景和需求。
2、如,使用局部離群因子算法評(píng)估用戶購(gòu)票風(fēng)險(xiǎn)度時(shí),由于局部離群因子算法是一種無(wú)監(jiān)督的離群檢測(cè)方法,屬于基于密度的離群點(diǎn)檢測(cè)方法,其在進(jìn)行異常檢測(cè)時(shí),往往需要設(shè)置k值,因此對(duì)各用戶購(gòu)票數(shù)據(jù)進(jìn)行異常檢測(cè)時(shí)受k值影響大,當(dāng)k值選取過(guò)大時(shí),局部離群因子算法敏感度低,會(huì)導(dǎo)致風(fēng)險(xiǎn)數(shù)據(jù)被誤判為正常數(shù)據(jù);當(dāng)k值選取過(guò)小時(shí),局部離群因子算法敏感度高,會(huì)導(dǎo)致正常數(shù)據(jù)虛警,從而造成用戶購(gòu)票風(fēng)險(xiǎn)度評(píng)估結(jié)果不準(zhǔn)確的問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、為解決上述背景技術(shù)中提出的造成用戶購(gòu)票風(fēng)險(xiǎn)度評(píng)估結(jié)果不準(zhǔn)確的問(wèn)題,本發(fā)明在如下的多個(gè)方面中提供方案。
2、在第一方面中,本發(fā)明提供了一種基于人工智能的自助購(gòu)票人機(jī)交互方法,包括:
3、獲取當(dāng)前時(shí)間段內(nèi)不同用戶的購(gòu)票數(shù)據(jù);采用局部離群因子算法對(duì)各用戶的購(gòu)票數(shù)據(jù)進(jìn)行異常檢測(cè),得到各購(gòu)票數(shù)據(jù)的疑似異常數(shù)據(jù)和疑似正常數(shù)據(jù);其中,局部離群因子算法中的k近鄰值為初始k值;
4、計(jì)算疑似正常數(shù)據(jù)的評(píng)價(jià)指標(biāo),所述評(píng)價(jià)指標(biāo)與分類有效度、數(shù)據(jù)相似度呈正相關(guān);所述分類有效度表征當(dāng)前疑似異常數(shù)據(jù)與歷史時(shí)間段異常數(shù)據(jù)的差異變化;響應(yīng)于評(píng)價(jià)指標(biāo)低于設(shè)定閾值時(shí),對(duì)所述初始值進(jìn)行更新,直至更新后的評(píng)價(jià)指標(biāo)高于設(shè)定閾值,停止更新,并得到更新后的最優(yōu)值;其中,更新規(guī)則為:當(dāng)疑似異常數(shù)據(jù)占比低于歷史時(shí)間段異常數(shù)據(jù)占比時(shí),將上一次k值與分類有效度的乘積作為當(dāng)前次更新后的k值;當(dāng)疑似異常數(shù)據(jù)占比高于或等于歷史時(shí)間段異常數(shù)據(jù)占比時(shí),將上一次的k值與分類有效度的比值作為當(dāng)前次更新后的k值;
5、基于最優(yōu)值,對(duì)各用戶的購(gòu)票數(shù)據(jù)進(jìn)行異常檢測(cè),得到各購(gòu)票數(shù)據(jù)的最終異常數(shù)據(jù),并及時(shí)阻止最終異常數(shù)據(jù)對(duì)應(yīng)用戶的異常購(gòu)票行為。
6、上述方案通過(guò)優(yōu)化局部離群因子算法中的k值,實(shí)現(xiàn)了精準(zhǔn)的異常數(shù)據(jù)檢測(cè),使其在不同時(shí)間段內(nèi)能夠自適應(yīng)調(diào)整,從而提高了用戶購(gòu)票風(fēng)險(xiǎn)度評(píng)估結(jié)果不準(zhǔn)確的問(wèn)題。
7、進(jìn)一步地,所述初始k值為:
8、
9、式中,a′表示當(dāng)前時(shí)間段購(gòu)票數(shù)據(jù)總數(shù),a表示歷史時(shí)間段購(gòu)票數(shù)據(jù)總數(shù),b表示歷史時(shí)間段異常數(shù)據(jù)總數(shù),表示歷史時(shí)間段異常數(shù)據(jù)占比。
10、上述方案通過(guò)將歷史時(shí)間段異常數(shù)據(jù)占比與當(dāng)前時(shí)間段購(gòu)票數(shù)據(jù)總數(shù)相乘,通過(guò)歷史經(jīng)驗(yàn)得到k值的初始值,使得檢測(cè)算法能夠適應(yīng)不同時(shí)間段的數(shù)據(jù)波動(dòng),確保異常檢測(cè)算法在數(shù)據(jù)規(guī)模變化時(shí)仍然有效,提高了異常檢測(cè)的靈敏度和精確性。
11、進(jìn)一步地,所述數(shù)據(jù)相似度為:
12、sn,n+1=α×dn,n+1+(1-α)×yn,n+1;
13、式中,sn,n+1表示疑似正常數(shù)據(jù)中第n個(gè)數(shù)據(jù)與第n+1個(gè)數(shù)據(jù)的數(shù)據(jù)相似度,dn,n+1表示疑似正常數(shù)據(jù)中第n個(gè)數(shù)據(jù)與第n+1個(gè)數(shù)據(jù)的曼哈頓距離,yn,n+1表示疑似正常數(shù)據(jù)中第n個(gè)數(shù)據(jù)與第n+1個(gè)數(shù)據(jù)的余弦相似度,α表示距離度量權(quán)重。
14、上述技術(shù)方案通過(guò)結(jié)合曼哈頓距離和余弦相似度,根據(jù)數(shù)據(jù)分布的稀疏程度動(dòng)態(tài)調(diào)整兩者的權(quán)重,使得在稀疏數(shù)據(jù)分布時(shí),更多依賴余弦相似度,從而提高相似度計(jì)算的準(zhǔn)確性和魯棒性,有效應(yīng)對(duì)不同數(shù)據(jù)分布下的異常檢測(cè)需求。
15、進(jìn)一步地,距離度量權(quán)重α的計(jì)算公式為:
16、
17、式中,c表示疑似正常數(shù)據(jù)的總數(shù),r表示購(gòu)票數(shù)據(jù)中特征參數(shù)的總數(shù),dn,n+1表示疑似正常數(shù)據(jù)中第n個(gè)數(shù)據(jù)與第n+1個(gè)數(shù)據(jù)的曼哈頓距離,gi,j表示疑似正常數(shù)據(jù)中第i個(gè)數(shù)據(jù)的第j個(gè)特征參數(shù),gi+1,j表示疑似正常數(shù)據(jù)中第i+1個(gè)數(shù)據(jù)的第,個(gè)特征參數(shù)。
18、上述技術(shù)方案通過(guò)綜合考慮疑似正常數(shù)據(jù)的整體分布特征和各特征參數(shù)的差異,動(dòng)態(tài)計(jì)算距離度量權(quán)重α,從而準(zhǔn)確地反映數(shù)據(jù)之間的實(shí)際相似性。這一方法能夠有效適應(yīng)數(shù)據(jù)特征的復(fù)雜性。
19、進(jìn)一步地,所述分類有效度為:
20、
21、式中,h表示分類有效度,a′表示當(dāng)前時(shí)間段購(gòu)票數(shù)據(jù)總數(shù);b′表示當(dāng)前時(shí)間段疑似異常數(shù)據(jù)總數(shù),a表示歷史時(shí)間段購(gòu)票數(shù)據(jù)總數(shù),b表示歷史時(shí)間段異常數(shù)據(jù)總數(shù),e為自然對(duì)數(shù)函數(shù)的底數(shù)。
22、上述技術(shù)方案通過(guò)分類有效度的計(jì)算,量化當(dāng)前時(shí)間段與歷史時(shí)間段異常數(shù)據(jù)占比的差異。通過(guò)指數(shù)函數(shù)控制差異的影響,確保分類有效度在異常占比變化不大時(shí)接近1,從而在動(dòng)態(tài)調(diào)整時(shí)提供穩(wěn)定性,并在顯著差異時(shí)敏感地反映出異常,提升檢測(cè)算法的適應(yīng)性和準(zhǔn)確性。
23、進(jìn)一步地,所述評(píng)價(jià)指標(biāo)為:
24、
25、式中,u表示評(píng)價(jià)指標(biāo),h表示分類有效度,sn,n+1表示疑似正常數(shù)據(jù)中第n個(gè)數(shù)據(jù)與第n+1個(gè)數(shù)據(jù)的數(shù)據(jù)相似度,c表示疑似正常數(shù)據(jù)的總數(shù)。
26、上述方法有效結(jié)合了歷史異常數(shù)據(jù)的影響和當(dāng)前數(shù)據(jù)的相似性,提供了一個(gè)平衡的評(píng)價(jià)標(biāo)準(zhǔn),有助于在優(yōu)化過(guò)程中確保檢測(cè)的分類準(zhǔn)確性和穩(wěn)定性。
27、進(jìn)一步地,所述購(gòu)票數(shù)據(jù)包括多個(gè)特征參數(shù),所述特征參數(shù)為:購(gòu)票時(shí)間、購(gòu)票頻率、購(gòu)票總價(jià)、賬戶登錄頻率、機(jī)票飛行平均間隔時(shí)間。
28、進(jìn)一步地,還包括:對(duì)購(gòu)票數(shù)據(jù)進(jìn)行預(yù)處理,預(yù)處理過(guò)程為:數(shù)據(jù)歸一化、缺失值填充和數(shù)據(jù)平滑。
29、在第二方面中,本發(fā)明提供了一種基于人工智能的自助購(gòu)票人機(jī)交互系統(tǒng),包括存儲(chǔ)器和處理器,所述存儲(chǔ)器內(nèi)存儲(chǔ)有計(jì)算機(jī)程序指令,當(dāng)所述計(jì)算機(jī)程序指令被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)以上任意一項(xiàng)所述的基于人工智能的自助購(gòu)票人機(jī)交互方法。
30、本發(fā)明的有益效果在于:
31、本發(fā)明通過(guò)動(dòng)態(tài)調(diào)整局部離群因子算法中的k值,結(jié)合歷史與當(dāng)前異常數(shù)據(jù)占比和數(shù)據(jù)相似度,優(yōu)化異常檢測(cè)過(guò)程,提高了檢測(cè)算法的靈敏度和準(zhǔn)確性。通過(guò)連續(xù)更新和優(yōu)化k值,確保評(píng)價(jià)指標(biāo)達(dá)到最優(yōu),從而實(shí)現(xiàn)了對(duì)用戶購(gòu)票行為的精準(zhǔn)異常檢測(cè)和實(shí)時(shí)風(fēng)險(xiǎn)控制,解決了用戶購(gòu)票風(fēng)險(xiǎn)度評(píng)估結(jié)果不準(zhǔn)確的問(wèn)題,有效阻止了潛在的異常購(gòu)票行為。
1.一種基于人工智能的自助購(gòu)票人機(jī)交互方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的一種基于人工智能的自助購(gòu)票人機(jī)交互方法,其特征在于,所述初始k值為:
3.根據(jù)權(quán)利要求1所述的一種基于人工智能的自助購(gòu)票人機(jī)交互方法,其特征在于,所述數(shù)據(jù)相似度為:
4.根據(jù)權(quán)利要求3所述的一種基于人工智能的自助購(gòu)票人機(jī)交互方法,其特征在于,距離度量權(quán)重α的計(jì)算公式為:
5.根據(jù)權(quán)利要求1所述的一種基于人工智能的自助購(gòu)票人機(jī)交互方法,其特征在于,所述分類有效度為:
6.根據(jù)權(quán)利要求1所述的一種基于人工智能的自助購(gòu)票人機(jī)交互方法,其特征在于,所述評(píng)價(jià)指標(biāo)的計(jì)算公式為:
7.根據(jù)權(quán)利要求1所述的一種基于人工智能的自助購(gòu)票人機(jī)交互方法,其特征在于,所述購(gòu)票數(shù)據(jù)包括多個(gè)特征參數(shù),所述特征參數(shù)為:購(gòu)票時(shí)間、購(gòu)票頻率、購(gòu)票總價(jià)、賬戶登錄頻率、機(jī)票飛行平均間隔時(shí)間。
8.根據(jù)權(quán)利要求1所述的一種基于人工智能的自助購(gòu)票人機(jī)交互方法,其特征在于,還包括:對(duì)購(gòu)票數(shù)據(jù)進(jìn)行預(yù)處理,預(yù)處理過(guò)程為:數(shù)據(jù)歸一化、缺失值填充和數(shù)據(jù)平滑。
9.一種基于人工智能的自助購(gòu)票人機(jī)交互系統(tǒng),其特征在于,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器內(nèi)存儲(chǔ)有計(jì)算機(jī)程序指令,當(dāng)所述計(jì)算機(jī)程序指令被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1~8任意一項(xiàng)所述的一種基于人工智能的自助購(gòu)票人機(jī)交互方法。