數(shù)據(jù)校驗(yàn)方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,特別涉及一種數(shù)據(jù)校驗(yàn)方法和裝置。
【背景技術(shù)】
[0002]在一些數(shù)據(jù)處理系統(tǒng)中需要對(duì)用戶(hù)輸入的數(shù)據(jù)進(jìn)行校驗(yàn),以避免因用戶(hù)輸入錯(cuò)誤的數(shù)據(jù)影響后續(xù)數(shù)據(jù)處理。例如,對(duì)于大數(shù)據(jù)應(yīng)用來(lái)說(shuō),數(shù)據(jù)的采集是系統(tǒng)不可缺少的組成部分。例如,在大數(shù)據(jù)分析系統(tǒng)中,數(shù)據(jù)的采集位于系統(tǒng)的最前端,也是后續(xù)分析和展示的基礎(chǔ)。因此,數(shù)據(jù)的有效性直接關(guān)系到后續(xù)的分析和處理。
[0003]然而,對(duì)于數(shù)據(jù)采集系統(tǒng)來(lái)說(shuō),如何確定用戶(hù)的輸入數(shù)據(jù)或者采集數(shù)據(jù)是否正確,十分困難。目前大多系統(tǒng)只是對(duì)采集數(shù)據(jù)做一個(gè)非常粗范的有效性檢查,例如,對(duì)數(shù)據(jù)格式(如只能輸入數(shù)字或者小數(shù)格式),或者對(duì)數(shù)據(jù)取值范圍進(jìn)行限定。但是,對(duì)于一些采集指標(biāo),比如:經(jīng)濟(jì)指標(biāo)等,由于季節(jié)因素或者其他因素等,指標(biāo)取值波動(dòng)變化較大。如果對(duì)指標(biāo)的取值范圍定義過(guò)小,會(huì)引起誤報(bào),如果取值范圍定義過(guò)大,又會(huì)因范圍過(guò)大導(dǎo)致無(wú)法準(zhǔn)確檢測(cè)到用戶(hù)輸入的錯(cuò)誤數(shù)據(jù)。
[0004]特別是在指標(biāo)多、需要用戶(hù)手動(dòng)輸入數(shù)據(jù)的情況,輸入數(shù)據(jù)的準(zhǔn)確性更加難以保證。因此,如何對(duì)用戶(hù)輸入的數(shù)據(jù)進(jìn)行一個(gè)有效性的校驗(yàn),是一個(gè)有待解決的難題。
【發(fā)明內(nèi)容】
[0005]本發(fā)明旨在至少在一定程度上解決上述技術(shù)問(wèn)題。
[0006]為此,本發(fā)明的第一個(gè)目的在于提出一種數(shù)據(jù)校驗(yàn)方法,能夠提高數(shù)據(jù)校驗(yàn)的精度,提高輸入數(shù)據(jù)的可靠性。
[0007]本發(fā)明的第二個(gè)目的在于提出一種數(shù)據(jù)校驗(yàn)裝置。
[0008]為達(dá)上述目的,根據(jù)本發(fā)明第一方面實(shí)施例提出了一種數(shù)據(jù)校驗(yàn)方法,包括以下步驟:接收用戶(hù)輸入的數(shù)據(jù),并獲取所述用戶(hù)輸入的數(shù)據(jù)的業(yè)務(wù)類(lèi)型;根據(jù)所述業(yè)務(wù)類(lèi)型選擇對(duì)應(yīng)的預(yù)測(cè)算法,其中,所述預(yù)測(cè)算法是根據(jù)所述業(yè)務(wù)類(lèi)型的歷史輸入數(shù)據(jù)訓(xùn)練得到的;根據(jù)所述預(yù)測(cè)算法預(yù)測(cè)所述業(yè)務(wù)類(lèi)型對(duì)應(yīng)的輸入?yún)^(qū)間;判斷所述用戶(hù)輸入的數(shù)據(jù)是否在所述輸入?yún)^(qū)間之中;如果不在所述輸入?yún)^(qū)間之中,則確定所述用戶(hù)輸入的數(shù)據(jù)異常。
[0009]本發(fā)明實(shí)施例的數(shù)據(jù)校驗(yàn)方法,在接收到用戶(hù)輸入的數(shù)據(jù)之后,可獲取該數(shù)據(jù)的業(yè)務(wù)類(lèi)型,并根據(jù)業(yè)務(wù)類(lèi)型選擇對(duì)應(yīng)的預(yù)測(cè)算法預(yù)測(cè)輸入?yún)^(qū)間,如果用戶(hù)輸入的數(shù)據(jù)不在該輸入?yún)^(qū)間之中,則確定該數(shù)據(jù)異常,,由此,能夠加強(qiáng)不同應(yīng)用場(chǎng)景下對(duì)用戶(hù)輸入的數(shù)據(jù)的合法性的檢查,減少因?yàn)檩斎脒^(guò)程中誤操作導(dǎo)致的一些錯(cuò)誤,提高數(shù)據(jù)校驗(yàn)的精度,提高輸入數(shù)據(jù)的可靠性,減少較少通過(guò)人工進(jìn)行異常數(shù)據(jù)檢查的工作量。
[0010]本發(fā)明第二方面實(shí)施例提出了一種數(shù)據(jù)校驗(yàn)裝置,包括:接收模塊,用于接收用戶(hù)輸入的數(shù)據(jù),并獲取所述用戶(hù)輸入的數(shù)據(jù)的業(yè)務(wù)類(lèi)型;選擇模塊,用于根據(jù)所述業(yè)務(wù)類(lèi)型選擇對(duì)應(yīng)的預(yù)測(cè)算法,其中,所述預(yù)測(cè)算法是根據(jù)所述業(yè)務(wù)類(lèi)型的歷史輸入數(shù)據(jù)訓(xùn)練得到的;預(yù)測(cè)模塊,用于根據(jù)所述預(yù)測(cè)算法預(yù)測(cè)所述業(yè)務(wù)類(lèi)型對(duì)應(yīng)的輸入?yún)^(qū)間;判斷模塊,用于判斷所述用戶(hù)輸入的數(shù)據(jù)是否在所述輸入?yún)^(qū)間之中;確定模塊,用于當(dāng)所述用戶(hù)輸入的數(shù)據(jù)不在所述輸入?yún)^(qū)間之中時(shí),確定所述用戶(hù)輸入的數(shù)據(jù)異常。
[0011]本發(fā)明實(shí)施例的數(shù)據(jù)校驗(yàn)裝置,在接收到用戶(hù)輸入的數(shù)據(jù)之后,可獲取該數(shù)據(jù)的業(yè)務(wù)類(lèi)型,并根據(jù)業(yè)務(wù)類(lèi)型選擇對(duì)應(yīng)的預(yù)測(cè)算法預(yù)測(cè)輸入?yún)^(qū)間,如果用戶(hù)輸入的數(shù)據(jù)不在該輸入?yún)^(qū)間之中,則確定該數(shù)據(jù)異常,,由此,能夠加強(qiáng)不同應(yīng)用場(chǎng)景下對(duì)用戶(hù)輸入的數(shù)據(jù)的合法性的檢查,減少因?yàn)檩斎脒^(guò)程中誤操作導(dǎo)致的一些錯(cuò)誤,提高數(shù)據(jù)校驗(yàn)的精度,提高輸入數(shù)據(jù)的可靠性,減少較少通過(guò)人工進(jìn)行異常數(shù)據(jù)檢查的工作量。
[0012]本發(fā)明的附加方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過(guò)本發(fā)明的實(shí)踐了解到。
【附圖說(shuō)明】
[0013]本發(fā)明的上述和/或附加的方面和優(yōu)點(diǎn)從結(jié)合下面附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中:
[0014]圖1為根據(jù)本發(fā)明一個(gè)實(shí)施例的數(shù)據(jù)校驗(yàn)方法的流程圖;
[0015]圖2為根據(jù)本發(fā)明一個(gè)實(shí)施例中訓(xùn)練預(yù)測(cè)算法的示意圖;
[0016]圖3為根據(jù)本發(fā)明一個(gè)具體實(shí)施例的數(shù)據(jù)校驗(yàn)方法的流程圖;
[0017]圖4為根據(jù)本發(fā)明另一個(gè)實(shí)施例的數(shù)據(jù)校驗(yàn)方法的流程圖;
[0018]圖5為根據(jù)本發(fā)明一個(gè)實(shí)施例的數(shù)據(jù)校驗(yàn)裝置的結(jié)構(gòu)示意圖;
[0019]圖6為根據(jù)本發(fā)明另一個(gè)實(shí)施例的數(shù)據(jù)校驗(yàn)裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0020]下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類(lèi)似的標(biāo)號(hào)表示相同或類(lèi)似的元件或具有相同或類(lèi)似功能的元件。下面通過(guò)參考附圖描述的實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對(duì)本發(fā)明的限制。
[0021]在本發(fā)明的描述中,需要理解的是,術(shù)語(yǔ)“多個(gè)”指兩個(gè)或兩個(gè)以上;術(shù)語(yǔ)“第一”、“第二”僅用于描述目的,而不能理解為指示或暗示相對(duì)重要性。
[0022]下面參考附圖描述根據(jù)本發(fā)明實(shí)施例的數(shù)據(jù)校驗(yàn)方法和裝置。
[0023]圖1為根據(jù)本發(fā)明一個(gè)實(shí)施例的數(shù)據(jù)校驗(yàn)方法的流程圖。
[0024]如圖1所示,根據(jù)本發(fā)明實(shí)施例的數(shù)據(jù)校驗(yàn)方法,包括:
[0025]SlOl,接收用戶(hù)輸入的數(shù)據(jù),并獲取用戶(hù)輸入的數(shù)據(jù)的業(yè)務(wù)類(lèi)型。
[0026]數(shù)據(jù)錄入系統(tǒng)可提供輸入界面,輸入界面中可包括與不同業(yè)務(wù)對(duì)應(yīng)的輸入框。當(dāng)用戶(hù)在輸入框中輸入數(shù)據(jù)時(shí),可根據(jù)輸入框?qū)?yīng)的業(yè)務(wù)類(lèi)型確定用戶(hù)輸入的數(shù)據(jù)的業(yè)務(wù)類(lèi)型。
[0027]S102,根據(jù)業(yè)務(wù)類(lèi)型選擇對(duì)應(yīng)的預(yù)測(cè)算法,其中,預(yù)測(cè)算法是根據(jù)業(yè)務(wù)類(lèi)型的歷史輸入數(shù)據(jù)訓(xùn)練得到的。
[0028]具體地,可根據(jù)業(yè)務(wù)類(lèi)型在預(yù)先建立的算法庫(kù)中查找對(duì)應(yīng)的預(yù)測(cè)算法。
[0029]其中,算法庫(kù)中存儲(chǔ)了預(yù)先分別針對(duì)各個(gè)業(yè)務(wù)類(lèi)型訓(xùn)練的預(yù)測(cè)算法。因此,可根據(jù)用戶(hù)輸入的數(shù)據(jù)的業(yè)務(wù)類(lèi)型從算法庫(kù)中選擇對(duì)應(yīng)的預(yù)測(cè)算法。
[0030]在本發(fā)明的實(shí)施例中,還可包括訓(xùn)練上述預(yù)測(cè)算法的過(guò)程。圖2為根據(jù)本發(fā)明一個(gè)實(shí)施例中訓(xùn)練預(yù)測(cè)算法的示意圖。
[0031]具體地,首先可分別獲取各個(gè)業(yè)務(wù)類(lèi)型對(duì)應(yīng)的歷史輸入數(shù)據(jù)。由于各個(gè)業(yè)務(wù)類(lèi)型對(duì)應(yīng)的歷史輸入數(shù)據(jù)具有不同的取值特征,因此,可根據(jù)各個(gè)業(yè)務(wù)類(lèi)型對(duì)應(yīng)的的數(shù)據(jù)特征選擇相應(yīng)的預(yù)測(cè)算法。對(duì)于一種業(yè)務(wù)類(lèi)型,可根據(jù)該業(yè)務(wù)類(lèi)型對(duì)應(yīng)的歷史輸入數(shù)據(jù)分析出該業(yè)務(wù)類(lèi)型的輸入數(shù)據(jù)的數(shù)據(jù)特征,即輸入數(shù)據(jù)的取值隨時(shí)間的變換規(guī)律。例如,隨時(shí)間變化不大、取值較穩(wěn)定的特征,或者周期性變化特征,或者季節(jié)性變換特征等。
[0032]進(jìn)而,可根據(jù)各個(gè)業(yè)務(wù)類(lèi)型對(duì)應(yīng)的數(shù)據(jù)特征,分別選擇適合該數(shù)據(jù)特征的時(shí)間序列算法。舉例來(lái)說(shuō),對(duì)于輸入數(shù)據(jù)變化不大、取值區(qū)間較穩(wěn)定的業(yè)務(wù)類(lèi)型,可選擇簡(jiǎn)單序時(shí)平均數(shù)法;而對(duì)于具有周期性變換或季節(jié)性變化特征的業(yè)務(wù)類(lèi)型,則可選擇季節(jié)趨勢(shì)預(yù)測(cè)法。
[0033]然后,對(duì)于各個(gè)業(yè)務(wù)類(lèi)型,可從各自的歷史輸入數(shù)據(jù)中選擇一部分?jǐn)?shù)據(jù)作為訓(xùn)練數(shù)據(jù),并根據(jù)各個(gè)業(yè)務(wù)類(lèi)型的訓(xùn)練數(shù)據(jù)分別進(jìn)行訓(xùn)練,以得到各個(gè)業(yè)務(wù)類(lèi)型對(duì)應(yīng)的時(shí)間序列算法的算法參數(shù)。
[0034]最后,對(duì)于各個(gè)業(yè)務(wù)類(lèi)型,從各自的歷史輸入數(shù)據(jù)中選擇一部分?jǐn)?shù)據(jù)作為驗(yàn)證數(shù)據(jù),并根據(jù)各個(gè)業(yè)務(wù)類(lèi)型的驗(yàn)證數(shù)據(jù)驗(yàn)證各自對(duì)應(yīng)的時(shí)間序列