數(shù)據(jù)進(jìn)行量化,在稅務(wù)數(shù)據(jù)中稅收金 額、稅率、稅收日期、寬限天數(shù)等都是關(guān)鍵數(shù)據(jù),還要根據(jù)不同的稅務(wù)系統(tǒng)的側(cè)重不同選擇 重點(diǎn)測(cè)試的業(yè)務(wù)邏輯,詳細(xì)選擇這些業(yè)務(wù)邏輯的相關(guān)的數(shù)據(jù)并且進(jìn)行量化,量化后的數(shù)據(jù) 應(yīng)該以向量的形式呈現(xiàn):
[0052] X - [X。x2, X3,· · ·,xm]。
[0053] 確定了輸入數(shù)據(jù)的維度后就應(yīng)開始初始化神經(jīng)元突觸,其中神經(jīng)元j的突觸權(quán)值 向量記為:
[0054] Wj= [w wj2, wj3, ..., wjm, ] , j = 1, 2, 3. . . 1 〇
[0055] 網(wǎng)絡(luò)中每個(gè)神經(jīng)元的突觸權(quán)值向量和各個(gè)輸入空間維數(shù)相同,其中1是網(wǎng)絡(luò)中神 經(jīng)元的總數(shù)。
[0056] 所述步驟S3具體包括:
[0057] 選擇最大內(nèi)積的神經(jīng)元作為激活神經(jīng)元,基于內(nèi)積最大化的匹配準(zhǔn)則在 數(shù)學(xué)上等價(jià)于向量x和¥]的歐幾里得距離最小化,如果用索引i(x)標(biāo)識(shí)最優(yōu)匹配輸入向 量X的神經(jīng)元,則可以通過下列條件決定i (X):
[0058] i (X) = arg mirij | | χ-Wj | |,j = A〇
[0059] 設(shè)hu表示以獲勝神經(jīng)元i為中心的拓?fù)溧徲蚯野唤M合作神經(jīng)元,其中一個(gè) 神經(jīng)元為j,一般選擇高斯函數(shù):
[0061] 其中山,i是整數(shù)且等于| j-i |。在二維情況下私可以定義為:
[0062] dij) II2 ,
[0063] 而SOM寬度的〇隨著時(shí)間下降,可以定義為:
[0065] 使用離散向量形式,假定在時(shí)間η神經(jīng)元j的權(quán)值向量為Wj (η),更新權(quán)值向量 w.j(n+l)在時(shí)間n+1被定義為:
[0066] w.j (n+1) = w.j (η) + η (n) hu (χ) (η) (x (n) -w (η))。
[0067] 訓(xùn)練網(wǎng)絡(luò)直至穩(wěn)定,獲得輸出神經(jīng)元,計(jì)算與這些神經(jīng)元?dú)W幾里得距離最小的樣 本點(diǎn),這些樣本點(diǎn)就是要獲得的測(cè)試用例。
[0068] 上述提取稅務(wù)系統(tǒng)典型測(cè)試用例的方法具有以下優(yōu)點(diǎn):1)本發(fā)明所選取的測(cè)試 樣本是最具有代表性的真實(shí)數(shù)據(jù),避免了人為編造數(shù)據(jù)有可能與現(xiàn)實(shí)偏差較大的問題,增 加了測(cè)試的可信性。2)本發(fā)明有效的從歷史數(shù)據(jù)中壓縮大量重復(fù)數(shù)據(jù)樣本,在保證測(cè)試質(zhì) 量的同時(shí)極大地降低了測(cè)試人員的工作強(qiáng)度,提高測(cè)試人員的工作效率。3)本發(fā)明巧妙的 利用S0M算法保序映射的特性,有效的保存了真實(shí)數(shù)據(jù)中的錯(cuò)誤樣本和邊界樣本,提高了 測(cè)試的可靠性。
[0069] 請(qǐng)參考圖2所示,為本發(fā)明一種提取稅務(wù)系統(tǒng)典型測(cè)試用例的系統(tǒng)的較佳實(shí)施方 式的方框圖。所述提取稅務(wù)系統(tǒng)典型測(cè)試用例的系統(tǒng)的較佳實(shí)施方式包括關(guān)鍵信息獲取單 元1、數(shù)據(jù)歸一化處理單元2、神經(jīng)元突觸初始化單元3、迭代計(jì)算單元5及歐幾里得距離計(jì) 算單元6。
[0070] 其中所述關(guān)鍵信息獲取單元用于獲取原始數(shù)據(jù)中稅務(wù)金額、滯納金、發(fā)生日期、稅 務(wù)發(fā)生日期及報(bào)稅日期差值等關(guān)鍵信息,以確定輸入數(shù)據(jù)的維度m。
[0071] 所述數(shù)據(jù)歸一化處理單元用于將上述獲取的關(guān)鍵信息進(jìn)行歸一化處理,處理之后 的結(jié)果記為:X = [Xi, X2, X3, · · ·,Xm]T。
[0072] 所述神經(jīng)元突觸初始化單元用于初始化神經(jīng)元突觸,記為:w_j = [w_n, w_j2, w_j3, . . .,w_jm, ]T,j = 1,2, 3. . . 1,其中網(wǎng)絡(luò)中每個(gè)神經(jīng)元的突觸權(quán)值向量和各個(gè)輸 入空間維數(shù)相同,1是網(wǎng)絡(luò)中神經(jīng)元的總數(shù)。
[0073] 所述迭代計(jì)算單元設(shè)置S0M學(xué)習(xí)參數(shù),并初始化利用S0M算法進(jìn)行反復(fù)迭代計(jì)算, 直到穩(wěn)定,以獲取穩(wěn)定后的神經(jīng)元。具體來說,所述迭代計(jì)算單元選擇最大內(nèi)積W^X..的神經(jīng) 元作為激活神經(jīng)元,并利用索引i(x)來標(biāo)識(shí)最優(yōu)匹配輸入向量X的神經(jīng)元,其中i(x)可通 過下列公式得以確定:i (X) = arg minj | |x-w_j | |,j = A,設(shè)表示以獲勝神經(jīng)元i為中心 的拓?fù)溧徲蚯野唤M合作神經(jīng)元,其中一個(gè)神經(jīng)元為j,一般選擇高斯函數(shù):
[0074] ,其中t是整數(shù)且等于|j-i|,在二維情況下f可以定義 i.j 為:%"=11~-5 11,而5(11寬度的0隨著時(shí)間下降,可以定義為:
[0075] 使用離散向量形式,假定在時(shí)間η神經(jīng)元j的權(quán)值 y 向量為Wj(n),更新權(quán)值向量Wj(n+1)在時(shí)間n+1被定義為:w_j(n+l) =w_j(n) + n (n)huw(n) (x (n)-w (η)),如此訓(xùn)練網(wǎng)絡(luò)直至穩(wěn)定,即可獲得穩(wěn)定的輸出神經(jīng)元。
[0076] 所述歐幾里得距離計(jì)算單元用于計(jì)算與上述獲得的神經(jīng)元之間的歐幾里得距離 最小的樣本點(diǎn),這些樣本點(diǎn)就是要獲得的測(cè)試用例。
[0077] 上述提取稅務(wù)系統(tǒng)典型測(cè)試用例的系統(tǒng)及方法使用自組織映射算法從歷史數(shù)據(jù) 中壓縮大量重復(fù)數(shù)據(jù)樣本,保證了測(cè)試樣本簡(jiǎn)潔有效;且利用S0M算法保序映射的特性,有 效的保存了真實(shí)數(shù)據(jù)中的錯(cuò)誤樣本和邊界樣本,提高了測(cè)試的可靠性。
[0078] 以上僅為本發(fā)明的實(shí)施方式,并非因此限制本發(fā)明的專利范圍,凡是利用本發(fā)明 說明書及附圖內(nèi)容所作的等效結(jié)構(gòu)或等效流程變換,或直接或間接運(yùn)用在其他相關(guān)的技術(shù) 領(lǐng)域,均同理包括在本發(fā)明的專利保護(hù)范圍內(nèi)。
【主權(quán)項(xiàng)】
1. 一種提取稅務(wù)系統(tǒng)典型測(cè)試用例的方法,包括: 確定測(cè)試樣本最終的數(shù)量; 獲得原始數(shù)據(jù)中的關(guān)鍵信息,W確定輸入數(shù)據(jù)的維度,并將運(yùn)些關(guān)鍵信息進(jìn)行歸一化 處理;化及 設(shè)置SOM學(xué)習(xí)參數(shù),初始化利用SOM算法進(jìn)行反復(fù)迭代計(jì)算,直到穩(wěn)定,W獲得穩(wěn)定后 的神經(jīng)元,并選取與各個(gè)神經(jīng)元?dú)W幾里得距離最小的樣本點(diǎn)作為最終的測(cè)試樣本。2. 如權(quán)利要求1所述的提取稅務(wù)系統(tǒng)典型測(cè)試用例的方法,其特征在于:所述步驟"歸 一化處理"中,所述原始數(shù)據(jù)中的關(guān)鍵信息包括稅務(wù)金額、滯納金、發(fā)生日期、稅務(wù)發(fā)生日期 與報(bào)稅日期差值,其中歸一化處理后的數(shù)據(jù)記為:x= [Xi,X2,X3,''',Xm]T,m表示數(shù)據(jù)的維 度。3. 如權(quán)利要求2所述的提取稅務(wù)系統(tǒng)典型測(cè)試用例的方法,其特征在于:所述步驟"歸 一化處理"還包括:開始初始化神經(jīng)元突觸:Wj= [W jl,Wj2, Wj3,…,Wjm,]Τ,j = 1,2, 3. . . 1, 網(wǎng)絡(luò)中每個(gè)神經(jīng)元的突觸權(quán)值向量和各個(gè)輸入空間維數(shù)相同,其中1是網(wǎng)絡(luò)中神經(jīng)元的總 數(shù)。4. 如權(quán)利要求1所述的提取稅務(wù)系統(tǒng)典型測(cè)試用例的方法,其特征在于:所述步驟"初 始化利用SOM算法進(jìn)行反復(fù)迭代計(jì)算"包括: 選擇最大內(nèi)積w>的神經(jīng)元作為激活神經(jīng)元,利用索引i(X)標(biāo)識(shí)最優(yōu)匹配輸入向量X 的神經(jīng)元,其中 i (X) = arg min.j I I x-Wj I I, j = A, 設(shè)K ,表示W(wǎng)獲勝神經(jīng)元i為中屯、的拓?fù)溧徲蚯野唤M合作神經(jīng)元,其中一個(gè)神經(jīng) 元為j,選擇高斯函數(shù):其中di, ,是整數(shù)且等于|j-i|。在二維情況下dfj可W定義為:而SOM寬度的σ隨著時(shí)間下降,可W定義為:,使用離散向量形式,假定在時(shí)間η神經(jīng)元j的權(quán)值向量為 w^n),更新權(quán)值向量Wj (n+1)在時(shí)間n+1被定義為: Wj (n+1) = w.j (n) +η (n)hj,iw (η) (x(n)-w(n)),如此訓(xùn)練網(wǎng)絡(luò)直至穩(wěn)定,W獲得輸出神 經(jīng)元。5. -種提取稅務(wù)系統(tǒng)典型測(cè)試用例的系統(tǒng),包括: 關(guān)鍵信息獲取單元,用于獲取原始數(shù)據(jù)的關(guān)鍵信息,W確定輸入數(shù)據(jù)的維度; 數(shù)據(jù)歸一化處理單元,用于將上述獲取的關(guān)鍵信息進(jìn)行歸一化處理; 神經(jīng)元突觸初始化單元,用于初始化神經(jīng)元突觸; 迭代計(jì)算單元,用于設(shè)置SOM學(xué)習(xí)參數(shù),并初始化利用SOM算法進(jìn)行反復(fù)迭代計(jì)算,直 到穩(wěn)定,W獲取穩(wěn)定后的神經(jīng)元;W及 歐幾里得距離計(jì)算單元,用于計(jì)算與上述獲得的神經(jīng)元之間的歐幾里得距離最小的樣 本點(diǎn),運(yùn)些樣本點(diǎn)就是要獲得的測(cè)試用例。6. 如權(quán)利要求5所述的提取稅務(wù)系統(tǒng)典型測(cè)試用例的系統(tǒng),其特征在于:所述原始數(shù) 據(jù)中的關(guān)鍵信息包括稅務(wù)金額、滯納金、發(fā)生日期、稅務(wù)發(fā)生日期與報(bào)稅日期差值,其中歸 一化處理后的數(shù)據(jù)記為:x = [Xl,而,X3,…,Xm]T,m表示數(shù)據(jù)的維度。7. 如權(quán)利要求6所述的提取稅務(wù)系統(tǒng)典型測(cè)試用例的系統(tǒng),其特征在于:神經(jīng)元j的 突觸權(quán)值向量記為:Wj= [W jl,Wj2, Wj3,…,Wjm,]Τ,j = 1,2, 3. . . 1,其中1是網(wǎng)絡(luò)中神經(jīng)元的 總數(shù)。8. 如權(quán)利要求6所述的提取稅務(wù)系統(tǒng)典型測(cè)試用例的系統(tǒng),其特征在于:所述迭代計(jì) 算單元選擇最大內(nèi)積w[x的神經(jīng)元作為激活神經(jīng)元,并利用索引i(x)標(biāo)識(shí)最優(yōu)匹配輸入向 量X的神經(jīng)元,其中i (X)通過下列公式得W確定:i (X) = arg minj I I x-Wj I I, j = A,設(shè)hij 表示W(wǎng)獲勝神經(jīng)元i為中屯、的拓?fù)溧徲蚯野唤M合作神經(jīng)元,其中一個(gè)神經(jīng)元為j,選擇 高斯函數(shù):其中di,,是整數(shù)且等于I j-i I,在二維情況下接.定義為:而SOM寬度的σ隨著時(shí)間下降,定義為:,使用離散向量形式,假定在時(shí)間η神經(jīng)元j的權(quán)值向量 為 Wj (η),更新權(quán)值向量 Wj (n+1)在時(shí)間 n+1 被定義為:Wj (n+1) = Wj (η) + η (η) h j, i W (η) (X (η)-w (η)),如此訓(xùn)練網(wǎng)絡(luò)直至穩(wěn)定,W獲得穩(wěn)定的輸出神經(jīng)元。
【專利摘要】本發(fā)明公開一種提取稅務(wù)系統(tǒng)典型測(cè)試用例的方法,包括:確定測(cè)試樣本最終的數(shù)量;獲得原始數(shù)據(jù)中的關(guān)鍵信息,以確定輸入數(shù)據(jù)的維度,并將這些信息進(jìn)行歸一化處理;以及設(shè)置SOM學(xué)習(xí)參數(shù),初始化利用SOM算法進(jìn)行反復(fù)迭代計(jì)算,直到穩(wěn)定,以獲得穩(wěn)定后的神經(jīng)元,并選取與各個(gè)神經(jīng)元?dú)W幾里得距離最小的樣本點(diǎn)作為最終的測(cè)試樣本。本發(fā)明還提供了一種提取稅務(wù)系統(tǒng)典型測(cè)試用例的系統(tǒng)。所述提取稅務(wù)系統(tǒng)典型測(cè)試用例的方法及系統(tǒng)可覆蓋廣泛且真實(shí)。
【IPC分類】G06F11/36
【公開號(hào)】CN105701007
【申請(qǐng)?zhí)枴緾N201410714228
【發(fā)明人】任欽正, 靳宏彪, 張瑩, 果然, 謝宇
【申請(qǐng)人】航天信息股份有限公司
【公開日】2016年6月22日
【申請(qǐng)日】2014年11月28日