一種電子商務(wù)稅源管理分析方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及大數(shù)據(jù)挖掘分析技術(shù)領(lǐng)域,具體涉及一種電子商務(wù)稅源管理分析方法。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)應(yīng)用的普及,我國電子商務(wù)快速發(fā)展,網(wǎng)上購物作為一種經(jīng)濟、高效、低碳的購物方式已經(jīng)逐漸成為主流消費方式。企業(yè)紛紛通過建立門戶網(wǎng)站、自主B2C網(wǎng)站、加盟B2C/B2B平臺、微博推廣等各種方式開展企業(yè)推廣和電子商務(wù)經(jīng)營。網(wǎng)上交易生成了大量的稅源數(shù)據(jù),可以通過電子商務(wù)稅源管理云采集系統(tǒng)將這些結(jié)構(gòu)化、半結(jié)構(gòu)化以及非結(jié)構(gòu)化的數(shù)據(jù)采集下來。這些數(shù)據(jù),經(jīng)過ETL,與稅局組織內(nèi)數(shù)據(jù)進行整合,挖掘出不同類別的非正常繳稅納稅人,以及網(wǎng)店的關(guān)聯(lián)關(guān)系、納稅人關(guān)聯(lián)關(guān)系等。并進一步利用數(shù)據(jù)可視化技術(shù)呈現(xiàn)給稅務(wù)人員,為稅收精細化管理、精確決策提供數(shù)據(jù)分析平臺,提高稅收評估能力,完善稅收管理決策模式,提高稅收,推進信息管稅、科學征稅、依法征稅。
[0003]ETL,是英文Extract-Transform-Load的縮寫,用來描述將數(shù)據(jù)從來源端經(jīng)過萃取(extract)、轉(zhuǎn)置(transform)、加載(load)至目的端的過程。ETL —詞較常用在數(shù)據(jù)倉庫,但其對象并不限于數(shù)據(jù)倉庫。ETL負責將分布的、異構(gòu)數(shù)據(jù)源中的數(shù)據(jù)如關(guān)系數(shù)據(jù)、平面數(shù)據(jù)文件等抽取到臨時中間層后進行清洗、轉(zhuǎn)換、集成,最后加載到數(shù)據(jù)倉庫或數(shù)據(jù)集市中,成為聯(lián)機分析處理、數(shù)據(jù)挖掘的基礎(chǔ)。
【發(fā)明內(nèi)容】
[0004]本發(fā)明要解決的技術(shù)問題是:提供一種電子商務(wù)稅源管理分析方法,為稅收精細化管理、精確決策提供數(shù)據(jù)分析平臺。
[0005]本發(fā)明所采用的技術(shù)方案為:
一種電子商務(wù)稅源管理分析方法,所述方法通過電子商務(wù)稅源管理云采集系統(tǒng)爬取解析的多個電子商務(wù)網(wǎng)站數(shù)據(jù)并保存到數(shù)據(jù)庫中,進行采集數(shù)據(jù)的清洗;將稅務(wù)局提供的組織內(nèi)數(shù)據(jù)進行ETL抽取轉(zhuǎn)換,保存到系統(tǒng)數(shù)據(jù)庫中;將采集數(shù)據(jù)與稅務(wù)局提供的組織數(shù)據(jù)進行整合分析,挖掘出不同類別的非正常繳稅納稅人,以及網(wǎng)店的關(guān)聯(lián)關(guān)系、納稅人關(guān)聯(lián)關(guān)系O
[0006]對采集數(shù)據(jù)進行清洗流程如下:
將電子商務(wù)稅源管理云采集系統(tǒng)提供的網(wǎng)店基本信息表和銷售信息表導(dǎo)入數(shù)據(jù)庫;將新的網(wǎng)店基本信息與原網(wǎng)店基本信息進行合并,更新網(wǎng)店基本信息:加入新開網(wǎng)店,并為新網(wǎng)店生成網(wǎng)店id,修改網(wǎng)店狀態(tài)與實際狀態(tài)一致,更新網(wǎng)店所屬公司名稱;
將多個電商的網(wǎng)店基本信息進行合并,將不同電商中網(wǎng)店屬于同一公司的銷售信息歸一化,并取得公司名稱列表,獲得互聯(lián)網(wǎng)電商信息。
[0007]對稅局組織內(nèi)數(shù)據(jù)進行ETL的流程如下:
參照產(chǎn)生的公司名稱列表,從稅局組織內(nèi)數(shù)據(jù)中進行查找匹配,獲取有效納稅人基本信息;
根據(jù)有效納稅人基本信息關(guān)聯(lián)出稅種認定信息;
根據(jù)有效納稅人基本信息關(guān)聯(lián)納稅人資格信息;
根據(jù)有效納稅人基本信息關(guān)聯(lián)增值稅認定信息;
根據(jù)上述信息關(guān)聯(lián)納稅申報信息和增值稅發(fā)票開具信息,獲得稅務(wù)信息。
[0008]數(shù)據(jù)整合分析流程:將清洗過的互聯(lián)網(wǎng)電商信息與通過ETL獲得的稅務(wù)信息進行關(guān)聯(lián)規(guī)則分析、數(shù)據(jù)挖掘分析以及統(tǒng)計比對,獲得非正常繳稅納稅人列表,以及網(wǎng)店的關(guān)聯(lián)關(guān)系、納稅人關(guān)聯(lián)關(guān)系、電商關(guān)聯(lián)關(guān)系、電商銷售發(fā)展趨勢、稅收預(yù)警。
[0009]所述方法業(yè)務(wù)流程如下:
O電子商務(wù)稅源管理系統(tǒng)云采集系統(tǒng)采集信息;
2)所采集的電子商務(wù)網(wǎng)站的有效數(shù)據(jù)結(jié)構(gòu)化,并導(dǎo)入數(shù)據(jù)庫并初始化,對數(shù)據(jù)根據(jù)應(yīng)用需求進行缺失值填充、去重、合并以及抽取轉(zhuǎn)換;
3)網(wǎng)點基本信息更新;
4)多電商基本信息及銷售信息合并,獲得網(wǎng)店所屬公司名稱列表;
5)將稅務(wù)局管理系統(tǒng)提供的組織內(nèi)數(shù)據(jù)進行ETL抽取轉(zhuǎn)換,保存到本系統(tǒng)數(shù)據(jù)庫中,并結(jié)合網(wǎng)店所屬公司名稱列表匹配有效納稅人;
6)關(guān)聯(lián)稅種、納稅人資格和增值稅認定情況;
7)關(guān)聯(lián)納稅申報和增值稅開票信息;
8)對步驟4)獲得的電商基本信息、銷售信息和步驟7)獲得的稅務(wù)信息進行數(shù)據(jù)挖掘分析、對比統(tǒng)計。
[0010]本發(fā)明的有益效果為:采用本發(fā)明方法,可以挖掘出不同類別的非正常繳稅納稅人,以及網(wǎng)店的關(guān)聯(lián)關(guān)系、納稅人關(guān)聯(lián)關(guān)系等,并進一步利用數(shù)據(jù)可視化技術(shù)呈現(xiàn)給稅務(wù)人員,為稅收精細化管理、精確決策提供數(shù)據(jù)分析平臺,提高稅收評估能力,完善稅收管理決策模式,提高稅收,推進信息管稅、科學征稅、依法征稅。
【附圖說明】
[0011]圖1為本發(fā)明業(yè)務(wù)流程圖。
【具體實施方式】
[0012]下面參照附圖所示,通過【具體實施方式】對本發(fā)明進一步說明:
一種電子商務(wù)稅源管理分析方法,所述方法通過電子商務(wù)稅源管理云采集系統(tǒng)爬取解析的多個電子商務(wù)網(wǎng)站數(shù)據(jù)并保存到數(shù)據(jù)庫中,進行采集數(shù)據(jù)的清洗;將稅務(wù)局提供的組織內(nèi)數(shù)據(jù)進行ETL抽取轉(zhuǎn)換,保存到系統(tǒng)數(shù)據(jù)庫中;將采集數(shù)據(jù)與稅務(wù)局提供的組織數(shù)據(jù)進行整合分析,挖掘出不同類別的非正常繳稅納稅人,以及網(wǎng)店的關(guān)聯(lián)關(guān)系、納稅人關(guān)聯(lián)關(guān)系O
[0013]對采集數(shù)據(jù)進行清洗流程如下:
將電子商務(wù)稅源管理云采集系統(tǒng)提供的網(wǎng)店基本信息表和銷售信息表導(dǎo)入數(shù)據(jù)庫;將新的網(wǎng)店基本信息與原網(wǎng)店基本信息進行合并,更新網(wǎng)店基本信息:加入新開網(wǎng)店,并為新網(wǎng)店生成網(wǎng)店id,修改網(wǎng)店狀態(tài)與實際狀態(tài)一致,更新網(wǎng)店所屬公司名稱; 將多個電商的網(wǎng)店基本信息進行合并,將不同電商中網(wǎng)店屬于同一公司的銷售信息歸一化,并取得公司名稱列表,獲得互聯(lián)網(wǎng)電商信息。
[0014]對稅局組織內(nèi)數(shù)據(jù)進行ETL的流程如下:
參照產(chǎn)生的公司名稱列表,從稅局組織內(nèi)數(shù)據(jù)中進行查找匹配,獲取有效納稅人基本信息;
根據(jù)有效納稅人基本信息關(guān)聯(lián)出稅種認定信息;
根據(jù)有效納稅人基本信息關(guān)聯(lián)納稅人資格信息;
根據(jù)有效納稅人基本信息關(guān)聯(lián)增值稅認定信息;
根據(jù)上述信息關(guān)聯(lián)納稅申報信息和增值稅發(fā)票開具信息,獲得稅務(wù)信息。
[0015]數(shù)據(jù)整合分析流程:將清洗過的互聯(lián)網(wǎng)電商信息與通過ETL獲得的稅務(wù)信息進行關(guān)聯(lián)規(guī)則分析、數(shù)據(jù)挖掘分析以及統(tǒng)計比對,獲得非正常繳稅納稅人列表,以及網(wǎng)店的關(guān)聯(lián)關(guān)系、納稅人關(guān)聯(lián)關(guān)系、電商關(guān)聯(lián)關(guān)系、電商銷售發(fā)展趨勢、稅收預(yù)警。
[0016]所述方法業(yè)務(wù)流程如下:
O電子商務(wù)稅源管理系統(tǒng)云采集系統(tǒng)采集信息;
2)所采集的電子商務(wù)網(wǎng)站的有效數(shù)據(jù)結(jié)構(gòu)化,并導(dǎo)入數(shù)據(jù)庫并初始化,對數(shù)據(jù)根據(jù)應(yīng)用需求進行缺失值填充、去重、合并以及抽取轉(zhuǎn)換;
3)網(wǎng)點基本信息更新;
4)多電商基本信息及銷售信息合并,獲得網(wǎng)店所屬公司名稱列表;
5)將稅務(wù)局管理系統(tǒng)提供的組織內(nèi)數(shù)據(jù)進行ETL抽取轉(zhuǎn)換,保存到本系統(tǒng)數(shù)據(jù)庫中,并結(jié)合網(wǎng)店所屬公司名稱列表匹配有效納稅人;
6)關(guān)聯(lián)稅種、納稅人資格和增值稅認定情況;
7)關(guān)聯(lián)納稅申報和增值稅開票信息;
8)對步驟4)獲得的電商基本信息、銷售信息和步驟7)獲得的稅務(wù)信息進行數(shù)據(jù)挖掘分析、對比統(tǒng)計。
[0017]以上實施方式僅用于說明本發(fā)明,而并非對本發(fā)明的限制,有關(guān)技術(shù)領(lǐng)域的普通技術(shù)人員,在不脫離本發(fā)明的精神和范圍的情況下,還可以做出各種變化和變型,因此所有等同的技術(shù)方案也屬于本發(fā)明的范疇,本發(fā)明的專利保護范圍應(yīng)由權(quán)利要求限定。
【主權(quán)項】
1.一種電子商務(wù)稅源管理分析方法,其特征在于:所述方法通過電子商務(wù)稅源管理云采集系統(tǒng)爬取解析的多個電子商務(wù)網(wǎng)站數(shù)據(jù)并保存到數(shù)據(jù)庫中,進行采集數(shù)據(jù)的清洗;將稅務(wù)局提供的組織內(nèi)數(shù)據(jù)進行ETL抽取轉(zhuǎn)換,保存到系統(tǒng)數(shù)據(jù)庫中;將采集數(shù)據(jù)與稅務(wù)局提供的組織數(shù)據(jù)進行整合分析,挖掘出不同類別的非正常繳稅納稅人,以及網(wǎng)店的關(guān)聯(lián)關(guān)系、納稅人關(guān)聯(lián)關(guān)系。
2.根據(jù)權(quán)利要求1所述的一種電子商務(wù)稅源管理分析方法,其特征在于,對采集數(shù)據(jù)進行清洗流程如下: 將電子商務(wù)稅源管理云采集系統(tǒng)提供的網(wǎng)店基本信息表和銷售信息表導(dǎo)入數(shù)據(jù)庫; 將新的網(wǎng)店基本信息與原網(wǎng)店基本信息進行合并,更新網(wǎng)店基本信息:加入新開網(wǎng)店,并為新網(wǎng)店生成網(wǎng)店id,修改網(wǎng)店狀態(tài)與實際狀態(tài)一致,更新網(wǎng)店所屬公司名稱; 將多個電商的網(wǎng)店基本信息進行合并,將不同電商中網(wǎng)店屬于同一公司的銷售信息歸一化,并取得公司名稱列表,獲得互聯(lián)網(wǎng)電商信息。
3.根據(jù)權(quán)利要求2所述的一種電子商務(wù)稅源管理分析方法,其特征在于,對稅局組織內(nèi)數(shù)據(jù)進行ETL的流程如下: 參照產(chǎn)生的公司名稱列表,從稅局組織內(nèi)數(shù)據(jù)中進行查找匹配,獲取有效納稅人基本信息; 根據(jù)有效納稅人基本信息關(guān)聯(lián)出稅種認定信息; 根據(jù)有效納稅人基本信息關(guān)聯(lián)納稅人資格信息; 根據(jù)有效納稅人基本信息關(guān)聯(lián)增值稅認定信息; 根據(jù)上述信息關(guān)聯(lián)納稅申報信息和增值稅發(fā)票開具信息,獲得稅務(wù)信息。
4.根據(jù)權(quán)利要求2或3所述的一種電子商務(wù)稅源管理分析方法,其特征在于數(shù)據(jù)整合分析流程:將清洗過的互聯(lián)網(wǎng)電商信息與通過ETL獲得的稅務(wù)信息進行關(guān)聯(lián)規(guī)則分析、數(shù)據(jù)挖掘分析以及統(tǒng)計比對,獲得非正常繳稅納稅人列表,以及網(wǎng)店的關(guān)聯(lián)關(guān)系、納稅人關(guān)聯(lián)關(guān)系、電商關(guān)聯(lián)關(guān)系、電商銷售發(fā)展趨勢、稅收預(yù)警。
5.根據(jù)權(quán)利要求4所述的一種電子商務(wù)稅源管理分析方法,其特征在于,所述方法業(yè)務(wù)流程如下: O電子商務(wù)稅源管理系統(tǒng)云采集系統(tǒng)采集信息; 2)所采集的電子商務(wù)網(wǎng)站的有效數(shù)據(jù)結(jié)構(gòu)化,并導(dǎo)入數(shù)據(jù)庫并初始化,對數(shù)據(jù)根據(jù)應(yīng)用需求進行缺失值填充、去重、合并以及抽取轉(zhuǎn)換; 3)網(wǎng)點基本信息更新; 4)多電商基本信息及銷售信息合并,獲得網(wǎng)店所屬公司名稱列表; 5)將稅務(wù)局管理系統(tǒng)提供的組織內(nèi)數(shù)據(jù)進行ETL抽取轉(zhuǎn)換,保存到本系統(tǒng)數(shù)據(jù)庫中,并結(jié)合網(wǎng)店所屬公司名稱列表匹配有效納稅人; 6)關(guān)聯(lián)稅種、納稅人資格和增值稅認定情況; 7)關(guān)聯(lián)納稅申報和增值稅開票信息; 8)對步驟4)獲得的電商基本信息、銷售信息和步驟7)獲得的稅務(wù)信息進行數(shù)據(jù)挖掘分析、對比統(tǒng)計。
【專利摘要】本發(fā)明公開了一種電子商務(wù)稅源管理分析方法,所述方法通過電子商務(wù)稅源管理云采集系統(tǒng)爬取解析的多個電子商務(wù)網(wǎng)站數(shù)據(jù)并保存到數(shù)據(jù)庫中,進行采集數(shù)據(jù)的清洗;將稅務(wù)局提供的組織內(nèi)數(shù)據(jù)進行ETL抽取轉(zhuǎn)換,保存到系統(tǒng)數(shù)據(jù)庫中;將采集數(shù)據(jù)與稅務(wù)局提供的組織數(shù)據(jù)進行整合分析,挖掘出不同類別的非正常繳稅納稅人,以及網(wǎng)店的關(guān)聯(lián)關(guān)系、納稅人關(guān)聯(lián)關(guān)系。采用本發(fā)明方法,可以挖掘出不同類別的非正常繳稅納稅人,以及網(wǎng)店的關(guān)聯(lián)關(guān)系、納稅人關(guān)聯(lián)關(guān)系等,并進一步利用數(shù)據(jù)可視化技術(shù)呈現(xiàn)給稅務(wù)人員,為稅收精細化管理、精確決策提供數(shù)據(jù)分析平臺,提高稅收評估能力,完善稅收管理決策模式,提高稅收,推進信息管稅、科學征稅、依法征稅。
【IPC分類】G06Q40-00, G06F17-30
【公開號】CN104598634
【申請?zhí)枴緾N201510062792
【發(fā)明人】范瑩, 于治樓
【申請人】浪潮集團有限公司
【公開日】2015年5月6日
【申請日】2015年2月6日